제주어 번역 LLM, 88M 초경량 오픈소스로 공개
피씨엔이 제주어와 표준어를 양방향으로 번역하는 AI 번역 거대언어모델을 개발해 허깅페이스에 공개했다. 8800만 파라미터, 178MB 크기의 디코더 전용 모델이며, Apache 2.0 라이선스로 누구나 사용할 수 있게 풀렸다.
- 1
제주어·표준어 양방향 번역 LLM이 허깅페이스에 무료 공개됨
- 2
모델은 약 8800만 파라미터, 전체 용량 178MB의 초경량 구조
- 3
데이터 전처리부터 모델 레이어 설계, 사전학습까지 프롬 스크래치 방식으로 구축
- 4
Apache 2.0 라이선스로 공개돼 연구·서비스 활용 가능성이 열려 있음
대부분의 언어 AI가 영어와 대형 언어권 중심으로 굴러가는 상황에서, 제주어 같은 로우 리소스 언어를 위한 모델이 오픈소스로 나온 건 꽤 의미 있음. 모델 크기도 작아서 ‘보존’뿐 아니라 실제 배포 가능성을 염두에 둔 선택으로 보임.
관련 기사
차세대 데이터 파일 포맷 F3, 디코더를 Wasm으로 파일 안에 넣자는 실험
F3는 Parquet, ORC 같은 기존 컬럼형 파일 포맷의 한계를 줄이기 위해 제안된 오픈소스 연구 프로토타입이다. 핵심 아이디어는 데이터와 메타데이터뿐 아니라 WebAssembly(Wasm) 디코더까지 파일에 함께 넣어, 새 인코딩 방식이 나와도 플랫폼 호환성을 유지하자는 것이다.
에코백스, 1,134만원짜리 오픈소스 가정용 로봇 ‘빠졔’ 판매 시작
중국 청소 로봇 기업 에코백스가 첫 오픈소스 로봇 ‘빠졔’를 정식 판매하기 시작했음. 가정용 로봇을 개발자가 직접 조율하고 프로그래밍하고 2차 개발할 수 있게 만든 플랫폼이고, 가격은 4만9990위안, 약 1,134만원 수준임.
BMW·폭스바겐·스텔란티스, 자동차 소프트웨어 오픈소스 동맹 키운다
BMW, 폭스바겐그룹, 스텔란티스 등 유럽 완성차 업체들이 소프트웨어 정의 자동차(SDV) 경쟁력 강화를 위해 오픈소스 공동 개발에 나서고 있다. 독일자동차산업협회 주도 프로젝트에는 완성차, 부품사, 반도체 기업 등 30개 이상 기업이 참여하며 차량 OS, 미들웨어, 통신 소프트웨어 같은 공통 영역을 함께 만든다. 기대 효과는 개발·유지 비용 최대 40% 절감, 차량 개발 기간 최대 30% 단축이다.
AI 시대 오픈소스, ‘공개됐으니 막 써도 됨’은 진짜 위험한 착각
생성형 AI 서비스가 오픈소스 코드, 모델, 데이터셋, 외부 API를 섞어 쓰면서 라이선스와 이용 조건 관리가 훨씬 복잡해졌다는 내용이다. 공개된 기술이라도 저작권과 사용 조건은 남아 있고, 기업은 제품 안에 무엇이 들어갔는지 지속적으로 추적해야 한다.
에코백스, 1,134만원짜리 오픈소스 가정용 로봇 ‘빠졔’ 출시
중국 청소 로봇 기업 에코백스가 첫 오픈소스 로봇 ‘빠졔’를 판매하기 시작했다. 개발자가 로봇의 동작, 조작, 환경 인식 기능을 기반으로 임바디드 인텔리전스 애플리케이션을 만들고 상용화할 수 있게 하겠다는 전략이다.
댓글
댓글
댓글을 불러오는 중...