알리바바 Qwen 3.6 공개 — 35B 모델인데 추론은 3B만 쓴다
알리바바가 오픈소스 AI 모델 Qwen 3.6-35B-A3B를 공개. MoE 구조로 총 350억 파라미터 중 연산에는 30억만 사용해 효율 중심 설계의 정점을 찍었고, 코딩·멀티모달·preserve_thinking 기능까지 붙여서 에이전트 시장까지 겨냥함.
- 1
총 35B / 활성 3B MoE 구조로 추론 비용 최소화
- 2
코딩 벤치마크에서 밀집형 Qwen3.5-27B 뛰어넘음, Gemma 31B와 비교 가능 수준
- 3
시각-언어 벤치마크에서 Claude Sonnet과 유사 수준, 일부 초과
- 4
preserve_thinking 기능으로 멀티턴 추론 맥락 유지 — 에이전트 작업 최적화
- 5
OpenAI·Anthropic API 규격과 호환, 허깅페이스·모델스코프 배포
'규모 키우기' 대신 '효율+에이전트+호환성'이라는 세 축으로 움직이는 알리바바의 오픈소스 전략. 엔드포인트만 바꿔도 이식 가능한 API 호환성은 생태계 전환 비용을 제로에 가깝게 만드는 무기임.
관련 기사
구글 클라우드, 한국 3각 편대 공개 — 카뱅 전사 AI · CJ ENM · 메가존 파트너십
구글 클라우드가 넥스트 2026 직전 한국 협력 사례를 공개. 카카오뱅크는 전 임직원 1,800명 대상 제미나이 엔터프라이즈 전사 도입, CJ ENM은 Veo/Imagen으로 영상 제작 R&D, 메가존소프트는 전략적 파트너십(SPA) 체결. 금융·콘텐츠·파트너 3축으로 국내 에이전틱 AI 전환 본격화.
칭화대 교수가 만든 '즈푸AI' — 세계 최초 LLM 상장, GLM-4.7로 GPT에 도전
칭화대 교수 탕제가 창업한 중국 AI 스타트업 즈푸AI가 2026년 1월 홍콩 증시에 1,159대 1 경쟁률로 상장 — 세계 최초 LLM 순수 스타트업 상장 사례. GLM-4.7은 LiveCodeBench 84.9%, SWE-bench 73.8% 기록하며 Claude API 대비 10분의 1 가격으로 시장 재편을 시도 중.
리벨리온 '리벨100' 성능 공개 — H200급 연산, 전력은 3분의 1
한국 AI 반도체 스타트업 리벨리온이 차세대 NPU 리벨100의 성능을 공개했다. FP16 1페타플롭스로 엔비디아 H200과 사실상 동급이면서 전력은 1/3 수준. 삼성 144GB HBM3E와 UCIe 칩렛 구조를 채택했고 하반기 양산에 들어간다.
이커머스 출신이 만든 AI 마케팅 에이전트 '라이트하우스'…도메인 지식을 어떻게 LLM에 붙였나
마켓컬리·오늘의집 출신 강성주 대표의 라이트에이아이가 퍼포먼스 마케팅 데이터 해석과 크리에이티브 제안까지 원스톱으로 자동화하는 B2B AI 에이전트 '라이트하우스'를 공개했다. 이커머스 현장 지식을 범용 AI와 결합해 중소·중견 소비재 업체를 타겟으로 한다.
의료 AI가 쓴 퇴원 요약에 서명한 의사 — '정보 세탁' 구조와 거버넌스 설문조사
AI가 잘못된 의료 정보를 생성하고 의사가 서명해 공식 기록으로 세탁되는 구조를 서울아산병원 유소영 교수가 설문 108명 분석과 함께 해부했다. 직군별로 원인 진단·책임 귀속·대응 방향이 완전히 달랐고, 5개 집단이 각자 다른 해법을 우선순위로 꼽았다. 조율 없는 병렬 거버넌스가 제도적 공백을 만든다는 경고.
댓글
댓글
댓글을 불러오는 중...