프렌들리AI, 코딩 에이전트 추론 속도 3배·비용 절반 내세운 서버리스 솔루션 공개
프렌들리AI가 국제인공지능대전에서 코딩 에이전트에 최적화된 추론 엔진과 서버리스 엔드포인트를 선보인다. Claude Code 같은 도구에서 환경 변수만 바꿔 오픈소스 모델로 연결하고, 기존 클로즈드 API 대비 50% 이상 비용 절감과 vLLM 대비 최대 3배 빠른 처리 속도를 강조한다.
- 1
프렌들리AI는 5월 6일부터 8일까지 서울 코엑스에서 열리는 AI EXPO KOREA 2026에 참가
- 2
GLM-5.1, MiniMax, Kimi 등 오픈소스 모델을 별도 인프라 없이 API로 연결하는 서버리스 엔드포인트를 시연
- 3
Claude Code, Kilo Code, OpenCode 같은 코딩 에이전트와의 연동 솔루션을 공개
- 4
Claude Code는 ANTHROPIC_BASE_URL과 ANTHROPIC_MODEL 환경 변수 변경만으로 MiniMax-M2.5, GLM-5.1 등으로 전환 가능
- 5
기존 클로즈드 API 대비 50% 이상 비용 절감, vLLM 대비 최대 3배 빠른 처리 속도를 내세움
코딩 에이전트가 실무 도구가 되려면 모델 성능만큼 중요한 게 추론 지연과 비용이다. 프렌들리AI의 메시지는 개발자가 쓰던 에이전트 도구는 유지하되, 뒤쪽 모델과 추론 엔진만 바꿔 더 싸고 빠르게 돌리자는 쪽이다.
관련 기사
네이버클라우드, K-AI 파트너십 공동의장사로 산·학·연 AI 연합 이끈다
네이버클라우드가 K-AI 파트너십 공동의장사로 선임됐고, 김유원 대표가 조준희 KOSA 회장과 함께 공동의장을 맡는다. 이 협력체는 과기부 지원 아래 산·학·연을 묶어 국내 AX 역량을 모으고, 실제 사업 매칭과 수출 성과까지 연결하는 실행형 AI 민관 협력체를 지향한다.
세일즈포스와 구글 클라우드, 슬랙·워크스페이스에 AI 에이전트 바로 꽂는다
세일즈포스와 구글 클라우드가 에이전트포스와 제미나이 엔터프라이즈 연동을 확대해 슬랙과 구글 워크스페이스 안에서 AI 에이전트를 바로 배포할 수 있게 했다. 핵심은 데이터 이동 없이 여러 시스템의 정보를 실시간으로 쓰는 제로 카피 구조와, 영업·문서·회의·고객 응대 흐름을 한 화면에서 이어가게 만드는 통합이다.
아이티센클로잇, 구글 클라우드 기반 기업용 AI 전환 플랫폼 시연
아이티센클로잇이 AI EXPO KOREA 2026에서 구글 클라우드 기반의 기업 맞춤형 AI 전환 전략을 공개한다. 제미나이 엔터프라이즈, 버텍스 AI, 자체 멀티 에이전트 관리 플랫폼, AI 영상 제작 솔루션을 묶어 엔드투엔드 기업 AI 도입 시나리오를 보여줄 예정이다.
중국 AI 업계, 모델과 국산 칩을 한 몸처럼 묶기 시작함
샤오미가 오픈소스 대규모 언어 모델(LLM) ‘미모 V2.5 프로’를 공개했고, 중국 GPU 업체들이 출시 당일 호환을 발표했다. 딥시크, 스텝펀, 즈푸, 알리바바, 바이두까지 중국산 AI 모델과 중국산 연산 칩의 결합이 빠르게 늘고 있다.
머스크와 오픈AI, ‘안전한 AI’ 정체성 두고 법정 정면충돌
일론 머스크가 오픈AI 경영진을 상대로 낸 소송 첫 변론에서 오픈AI의 영리화가 초기 비영리 목적을 훼손했다고 주장했다. 오픈AI는 머스크가 경쟁사 xAI를 운영하는 이해관계자라며, 이번 소송을 경쟁사의 공격으로 보고 있다.
댓글
댓글
댓글을 불러오는 중...