본문으로 건너뛰기
피드

이미지·비디오 모델 200개 넘게 묶은 오픈소스 생성형 인공지능 스튜디오

open-source 약 5분

오픈소스 프로젝트 Open-Generative-AI가 200개 이상의 생성형 인공지능 모델을 한 인터페이스에서 쓸 수 있는 통합 창작 플랫폼으로 소개됐다. 이미지, 비디오, 립싱크, 워크플로우 스튜디오를 제공하고 MIT 라이선스로 자체 호스팅과 커스터마이징이 가능하다는 점을 내세운다.

  • 1

    Open-Generative-AI는 200개 이상의 생성형 인공지능 모델을 지원하는 통합 스튜디오임

  • 2

    이미지 스튜디오는 텍스트-이미지 50개 이상, 이미지-이미지 55개 이상 모델을 지원함

  • 3

    비디오 스튜디오는 텍스트-비디오 40개 이상, 이미지-비디오 60개 이상 모델을 포함함

  • 4

    립싱크 스튜디오는 오디오 기반 애니메이션용 전용 모델 9개를 제공함

  • 5

    MIT 라이선스 기반 오픈소스로 자체 서버 설치와 커스터마이징이 가능함

  • Open-Generative-AI라는 오픈소스 생성형 인공지능 스튜디오가 소개됨

    • 핵심 메시지는 “구독료 없이, 200개 이상의 생성형 인공지능 모델을 한곳에서 쓴다”임
    • 상용 인공지능 플랫폼의 폐쇄적인 생태계에서 벗어나 자체적으로 창작 환경을 꾸릴 수 있다는 점을 강조함
  • 플랫폼은 4개의 스튜디오로 구성됨

    • 이미지 스튜디오는 텍스트-이미지 모델 50개 이상, 이미지-이미지 모델 55개 이상을 지원함
    • 비디오 스튜디오는 텍스트-비디오 모델 40개 이상, 이미지-비디오 모델 60개 이상을 포함함
    • 립싱크 스튜디오는 오디오 기반 애니메이션을 위한 전용 모델 9개를 제공함
    • 워크플로우 스튜디오는 여러 단계의 생성 파이프라인을 시각적으로 편집하는 기능을 담당함

중요

> 숫자만 보면 이미지·비디오·립싱크 모델을 합쳐 200개 이상을 한 인터페이스에서 비교하고 사용할 수 있다는 게 핵심임. 생성형 인공지능 툴이 너무 많아진 지금, 모델 통합과 워크플로우 관리 자체가 경쟁력이 되고 있음.

  • 지원 모델 목록에는 최신 생성형 인공지능 이름들이 여럿 들어감

    • Flux, Midjourney, Kling, Sora, Veo 등이 언급됨
    • 기사에서 강조하는 장점은 개별 모델의 성능보다, 서로 다른 모델을 하나의 통합 인터페이스에서 비교하고 쓸 수 있다는 점임
  • 오픈소스라는 점도 꽤 큼

    • MIT 라이선스로 공개돼 누구나 자신의 서버에 설치해 사용할 수 있음
    • 상용 플랫폼 구독료나 사용량 제한에 덜 묶일 수 있음
    • 기업 입장에서는 기능 커스터마이징과 내부 워크플로우 통합 가능성이 생김
  • 개인 창작자부터 기업까지 타깃을 넓게 잡은 플랫폼임

    • 개인은 여러 생성 모델을 실험하는 창작 도구로 쓸 수 있고
    • 기업은 내부 서버에 올려 비용과 데이터 통제를 챙기는 방식으로 접근할 수 있음
    • 다만 실제 운영에서는 모델별 라이선스, 리소스 요구량, 외부 API 의존성을 따로 확인해야 함

기술 맥락

  • 이 프로젝트의 선택은 “최고의 모델 하나”를 고르는 게 아니라 여러 생성형 인공지능 모델을 한 작업 공간에 묶는 쪽이에요. 이미지와 비디오 생성은 모델마다 강점이 달라서, 실제 작업에서는 비교와 반복이 계속 필요하거든요.

  • 자체 호스팅이 중요한 이유는 비용과 통제 때문이에요. 상용 플랫폼은 편하지만 구독료, 사용량 제한, 데이터 반출 이슈가 따라오니 기업이나 팀 단위 작업에서는 내부 서버에 올리는 선택지가 꽤 매력적이에요.

  • 워크플로우 스튜디오가 들어간 것도 단순 편의 기능이 아니에요. 텍스트로 이미지를 만들고, 그 이미지를 다시 비디오로 바꾸고, 오디오에 맞춰 립싱크를 붙이는 식의 다단계 작업은 사람이 매번 손으로 넘기면 금방 병목이 생겨요.

  • 다만 기사에서 말한 200개 이상 모델 지원은 운영 난이도도 같이 뜻해요. 모델마다 필요한 그래픽처리장치 메모리, 라이선스, 입력 형식이 다를 수 있어서 실제 도입 전에는 지원 방식과 실행 환경을 확인해야 해요.

생성형 인공지능 툴이 많아질수록 문제는 ‘어떤 모델이 좋냐’보다 ‘한 작업 흐름 안에서 어떻게 비교하고 갈아끼우냐’로 이동한다. 자체 호스팅 가능한 통합 스튜디오는 비용, 데이터 통제, 워크플로우 자동화 쪽에서 한국 팀들도 꽤 관심 가질 만함.

댓글

댓글

댓글을 불러오는 중...

open-source

뱀부랩, 오픈소스 슬라이서 개발자에게 법적 압박 걸었다가 역풍 맞음

3D 프린터 제조사 뱀부랩이 OrcaSlicer-BambuLab 개발자에게 중단 요구서를 보내면서 오픈소스와 수리권 커뮤니티의 반발을 샀다. GamersNexus와 Louis Rossmann은 개발자의 허락을 받아 소프트웨어를 다시 호스팅하고, 소송이 걸리면 각각 1만 달러씩 법률 지원을 하겠다고 나섰다.

open-source

OrcaSlicer 포크, Bambu Lab 프린터의 인터넷 연결 기능 되살림

FULU Foundation의 OrcaSlicer-bambulab 포크가 Bambu Lab 프린터에서 LAN 전용 제한 없이 BambuNetwork 기반 인터넷 연결을 다시 지원한다고 밝힘. Windows에서는 WSL 2 설정이 필요하고, Linux에서는 일반 설치만으로 충분하다고 안내함.

open-source

코넬대가 공개한 정확히 2,000줄짜리 교육용 운영체제

코넬대 기반 프로젝트인 egos-2000은 학생이 교육용 운영체제 전체 코드를 직접 읽을 수 있게 만드는 걸 목표로 한다. C, 헤더, 어셈블리, make 파일을 합쳐 정확히 2,000줄이며, QEMU와 RISC-V 보드에서 동작하고 9개 코스 프로젝트가 붙어 있다. 운영체제 수업에서 ‘작지만 전체 구조가 보이는 코드베이스’가 필요했던 사람에게 꽤 반가운 자료다.

open-source

이맥스가 Git 대신 Bazaar를 붙잡았던 6년짜리 오픈소스 드라마

이맥스는 2008년 CVS에서 벗어나면서 Git 대신 GNU 프로젝트인 Bazaar를 선택했고, 이 결정은 성능 벤치마크와 개발자 반발을 압도한 정치적 판단에 가까웠다. Bazaar는 느리고 유지보수도 흔들렸지만, GNU 패키지는 GNU 도구를 써야 한다는 원칙 때문에 전환은 2014년까지 미뤄졌다. 결국 ELPA 브랜치 문제와 Bazaar 개발 중단, 변환 스크립트 준비 끝에 이맥스는 Git으로 옮겨갔다.

open-source

현대차·기아, 오픈소스 특허 방어망 넓혀 소프트웨어 중심 차량 전환 준비

현대차·기아가 오픈소스 소프트웨어 특허 분쟁을 줄이기 위해 글로벌 특허 네트워크 OIN 2.0에 가입했다. 소프트웨어 중심 차량, 클라우드, 커넥티드 서비스처럼 오픈소스 의존도가 큰 영역에서 법적 리스크를 미리 관리하려는 움직임이다.