빅테크, 인공지능 무제한 사용 끝내고 토큰 비용 통제에 들어감
우버, 마이크로소프트, 세일즈포스, 메타 같은 빅테크가 거대 언어 모델 사용 비용을 통제하기 시작했다는 보도임. 토큰 사용량이 폭증하면서 연간 예산이 석 달 만에 바닥나는 사례까지 나오고, 인공지능 투자가 성능 과시에서 단위 비용당 생산성 검증으로 넘어가는 분위기임.
- 1
우버는 자율형 인공지능 에이전트 도입 과정에서 올해 연간 예산을 3월에 이미 소진
- 2
마이크로소프트는 직원들의 클로드 사용 권한을 제한하고 내부 코딩 도구로 대체
- 3
고급 인공지능 코딩 도구 비용 중 실제 상용 제품으로 이어진 비율이 20% 미만이라는 조사 언급
- 4
빅테크 설비투자 조절은 엔비디아 그래픽처리장치와 한국 고대역폭 메모리 수요에도 영향을 줄 수 있음
인공지능 도입의 다음 병목은 모델 성능이 아니라 비용 회계임. 개발팀 입장에서도 “얼마나 똑똑한가”보다 “이 작업에 이 모델을 쓰는 게 돈값을 하는가”를 증명해야 하는 단계로 가고 있음.
관련 기사
앤트로픽, 미국 증권거래위원회에 기업공개 초안 비공개 제출
클로드를 만드는 앤트로픽이 미국 증권거래위원회에 기업공개를 위한 S-1 등록신고서 초안을 비공개로 냈다. 아직 상장 시점, 공모 주식 수, 가격은 정해지지 않았고, 시장 상황과 심사 결과에 따라 실제 기업공개 여부가 갈릴 수 있다.
비트코인 채굴업체 아이렌, GPU 확보에 36억5000만달러 조달
비트코인 채굴업체 아이렌이 AI 클라우드 사업 확대를 위해 36억5000만달러 규모의 GPU 도입 자금을 마련했다. 이 자금은 마이크로소프트 AI 클라우드 계약을 뒷받침하는 데 쓰일 예정이며, 채굴 인프라를 AI 컴퓨팅 인프라로 전환하려는 흐름을 보여준다.
네이버클라우드, 젠슨 황 방한 맞춰 엔비디아 협력안 공개 예고
김유원 네이버클라우드 대표가 엔비디아와의 구체적 협력안이 6월 8일쯤 3개 정도 발표될 것 같다고 밝혔다. 젠슨 황 엔비디아 최고경영자의 방한과 네이버 사옥 방문 가능성이 거론되며, 인공지능·클라우드·로보틱스 협력 기대가 커지고 있다.
젠슨 황 방한, 한국 인공지능 동맹이 반도체에서 로봇으로 넓어질까
젠슨 황 엔비디아 최고경영자가 컴퓨텍스 이후 한국을 찾아 네이버, 엘지, 현대차, 두산 등과 피지컬 인공지능 협력을 논의할 가능성이 커졌다는 내용임. 지난해 협력이 고대역폭 메모리와 인공지능 팩토리 중심이었다면, 이번에는 가정용 로봇·산업용 휴머노이드·스마트팩토리 같은 실제 물리 세계 애플리케이션으로 전선이 이동하는 분위기임.
수술로봇 10년, 다빈치 독주 속 피지컬 인공지능 경쟁이 본격화됨
수술로봇 개발자의 시각에서 2016년 알파고 이후 10년 동안 수술로봇과 의료 인공지능이 어떻게 바뀌었는지 짚은 글임. 다빈치 5는 이전 모델보다 1만 배 이상의 컴퓨팅 파워와 포스 피드백을 앞세웠고, 메드트로닉·존슨앤존슨·중국·인도 업체까지 경쟁 구도가 넓어지고 있음.
댓글
댓글
댓글을 불러오는 중...