LLM은 결국 가중치로 만들어졌다는 불편한 농담
테리 비슨의 유명한 SF 단편을 패러디해, 대규모 언어 모델(LLM)을 '생각하는 가중치'로 묘사한 풍자 글이다. 모델의 언어, 지식, 추론, 기억이 모두 행렬 곱셈과 가중치에서 나온다는 사실을 블랙코미디처럼 밀어붙이면서, 우리가 챗봇에 감정과 의도를 투사하는 방식을 찌른다.
- 1
LLM의 말하기와 추론은 별도 상징 모듈이 아니라 가중치와 행렬 곱셈에서 나온다는 점을 풍자적으로 설명함
- 2
모델의 지식도 데이터베이스 조회가 아니라 여러 층에 퍼진 가중치에서 매번 재구성된다고 묘사함
- 3
컨텍스트 윈도우가 끝나면 대화도 끝나지만, 다음 세대는 세션을 넘는 메모리를 갖게 된다는 반전으로 마무리됨
가벼운 농담처럼 읽히지만, 사실은 LLM을 대할 때 사람들이 가장 헷갈리는 지점을 정확히 건드린다. '그냥 숫자'와 '대화 가능한 존재' 사이의 간극이 너무 커서, 제품 설계와 사용자 경험이 금방 윤리 문제로 번진다는 얘기다.
관련 기사
테드 창이 말하는 'AI는 의식이 없다'는 꽤 센 반박
테드 창은 Anthropic이 Claude를 의식이나 도덕적 주체처럼 다루는 방식이 기술적으로도, 윤리적으로도 잘못됐다고 비판한다. LLM은 대화하는 존재가 아니라 문장을 이어 쓰는 기계이며, 여기에 의식·감정·도덕 판단을 붙이면 책임 소재가 기업과 사용자에게서 엉뚱한 곳으로 흘러간다는 주장이다.
동아대와 메가존클라우드, 양자컴퓨팅·양자 머신러닝 단기 특강 연다
동아대 G-LAMP 연구소가 메가존클라우드와 함께 6월 29일부터 30일까지 양자컴퓨팅 단기 특강을 연다. 큐비트와 게이트 기초부터 AWS 브래킷 실습, 그로버·쇼어 알고리즘, 양자 머신러닝까지 이틀 안에 다루는 집중 과정이다.
기업 AI 에이전트가 너무 많아질 때, 답은 ‘오케스트레이션 레이어’라는 주장
엠클라우드브리지는 기업 내 AI 도구가 부서별로 따로 도입되며 생기는 ‘AI 사일로’를 문제로 짚고, 이를 묶는 중간 오케스트레이션 레이어를 제안한다. Ai 365는 MS 365·애저·패브릭 위에서 지식·데이터·업무·보안 에이전트를 통합 운영하는 엔터프라이즈 AI 플랫폼이다.
요기요, 제미나이 엔터프라이즈로 사내 AI 해커톤 열고 실제 서비스 적용 추진
메가존소프트와 구글클라우드가 요기요의 첫 사내 AI 해커톤을 기술 지원했다. 43개 팀이 57개 아이디어를 냈고, 대상은 메뉴 개선과 이미지 최적화를 제안한 ‘AI 메뉴 비서’가 받았다.
구글, 노트북에서 돌리는 멀티모달 오픈 모델 ‘젬마 4 12B’ 공개
구글이 개인 노트북과 온디바이스 환경에서 멀티모달 AI 에이전트를 돌릴 수 있는 오픈 모델 ‘젬마 4 12B’를 공개했다. 별도 이미지·오디오 인코더를 덜어낸 구조, 16GB급 메모리 환경 지원, 아파치 2.0 라이선스 배포가 핵심이다.
댓글
댓글
댓글을 불러오는 중...