알리바바 Qwen 3.6 공개 — 35B 모델인데 추론은 3B만 쓴다
알리바바가 오픈소스 AI 모델 Qwen 3.6-35B-A3B를 공개. MoE 구조로 총 350억 파라미터 중 연산에는 30억만 사용해 효율 중심 설계의 정점을 찍었고, 코딩·멀티모달·preserve_thinking 기능까지 붙여서 에이전트 시장까지 겨냥함.
- 1
총 35B / 활성 3B MoE 구조로 추론 비용 최소화
- 2
코딩 벤치마크에서 밀집형 Qwen3.5-27B 뛰어넘음, Gemma 31B와 비교 가능 수준
- 3
시각-언어 벤치마크에서 Claude Sonnet과 유사 수준, 일부 초과
- 4
preserve_thinking 기능으로 멀티턴 추론 맥락 유지 — 에이전트 작업 최적화
- 5
OpenAI·Anthropic API 규격과 호환, 허깅페이스·모델스코프 배포
'규모 키우기' 대신 '효율+에이전트+호환성'이라는 세 축으로 움직이는 알리바바의 오픈소스 전략. 엔드포인트만 바꿔도 이식 가능한 API 호환성은 생태계 전환 비용을 제로에 가깝게 만드는 무기임.
관련 기사
테드 창이 말하는 'AI는 의식이 없다'는 꽤 센 반박
테드 창은 Anthropic이 Claude를 의식이나 도덕적 주체처럼 다루는 방식이 기술적으로도, 윤리적으로도 잘못됐다고 비판한다. LLM은 대화하는 존재가 아니라 문장을 이어 쓰는 기계이며, 여기에 의식·감정·도덕 판단을 붙이면 책임 소재가 기업과 사용자에게서 엉뚱한 곳으로 흘러간다는 주장이다.
LLM은 결국 가중치로 만들어졌다는 불편한 농담
테리 비슨의 유명한 SF 단편을 패러디해, 대규모 언어 모델(LLM)을 '생각하는 가중치'로 묘사한 풍자 글이다. 모델의 언어, 지식, 추론, 기억이 모두 행렬 곱셈과 가중치에서 나온다는 사실을 블랙코미디처럼 밀어붙이면서, 우리가 챗봇에 감정과 의도를 투사하는 방식을 찌른다.
동아대와 메가존클라우드, 양자컴퓨팅·양자 머신러닝 단기 특강 연다
동아대 G-LAMP 연구소가 메가존클라우드와 함께 6월 29일부터 30일까지 양자컴퓨팅 단기 특강을 연다. 큐비트와 게이트 기초부터 AWS 브래킷 실습, 그로버·쇼어 알고리즘, 양자 머신러닝까지 이틀 안에 다루는 집중 과정이다.
기업 AI 에이전트가 너무 많아질 때, 답은 ‘오케스트레이션 레이어’라는 주장
엠클라우드브리지는 기업 내 AI 도구가 부서별로 따로 도입되며 생기는 ‘AI 사일로’를 문제로 짚고, 이를 묶는 중간 오케스트레이션 레이어를 제안한다. Ai 365는 MS 365·애저·패브릭 위에서 지식·데이터·업무·보안 에이전트를 통합 운영하는 엔터프라이즈 AI 플랫폼이다.
요기요, 제미나이 엔터프라이즈로 사내 AI 해커톤 열고 실제 서비스 적용 추진
메가존소프트와 구글클라우드가 요기요의 첫 사내 AI 해커톤을 기술 지원했다. 43개 팀이 57개 아이디어를 냈고, 대상은 메뉴 개선과 이미지 최적화를 제안한 ‘AI 메뉴 비서’가 받았다.
댓글
댓글
댓글을 불러오는 중...