본문으로 건너뛰기
피드

크레아, 2초 만에 2K 이미지 뽑는 오픈웨이트 모델 ‘크레아 2’ 공개

ai-ml 약 6분
vote
0
댓글
북마크

크레아가 120억 매개변수 기반 이미지 생성 모델 ‘크레아 2’를 오픈웨이트로 공개했다. 핵심은 커스터마이징용 로우 모델과 초고속 생성용 터보 모델을 나눠 제공하고, 로우에서 학습한 스타일을 터보에서 빠르게 쓰게 만든 워크플로우다.

  • 1

    크레아 2는 로우와 터보 두 가지 모델로 공개됐고, 터보는 8단계 추론으로 최대 2K 이미지를 약 2초 만에 생성한다

  • 2

    로우 모델은 인간 피드백 기반 강화학습이나 미적 최적화를 거치지 않아 기업별 스타일 학습에 유리하다

  • 3

    LoRA와 스타일 전송, 대형 언어 모델 기반 프롬프트 확장기를 지원해 디자인 워크플로우 쪽을 겨냥했다

  • 4

    50석 이하 개인 개발자·창작자·중소기업은 로열티 없이 상업 활용할 수 있지만, 안전 필터링 구현 의무가 붙는다

  • 크레아가 새 이미지 생성 모델 ‘크레아 2’를 오픈웨이트로 공개함

    • 버전은 ‘크레아 2 로우’와 ‘크레아 2 터보’ 두 가지
    • 폐쇄형 이미지 생성 모델이 장악한 시장에서, 기업과 창작자가 직접 커스터마이징할 수 있는 쪽을 전면에 내세움
  • 모델 구조는 120억 매개변수짜리 자체 확산 트랜스포머(Diffusion Transformer) 기반임

    • 요즘 이미지 생성 모델에서 흔한 “하나로 다 해보자” 방식이 아니라, 학습용과 생성용을 분리한 게 포인트
    • 크레아가 제안한 흐름은 “로우로 학습하고, 터보로 생성한다”는 식임
  • ‘크레아 2 로우’는 일부러 덜 정렬된 모델에 가까움

    • 인간 피드백 기반 강화학습(RLHF)이나 미적 최적화를 적용하지 않은 비정렬(Unaligned) 모델
    • 그래서 특정한 예쁜 스타일로 쏠리지 않고, 브랜드 이미지·건축 설계·제품 디자인 같은 용도에 맞춰 다시 학습시키기 좋다는 설명
  • ‘크레아 2 터보’는 속도에 몰빵한 상용 생성 모델임

    • 지식 증류(Knowledge Distillation)로 생성 과정을 줄였고, 8단계 추론만으로 최대 2K 이미지를 약 2초 만에 생성한다고 밝힘
    • 공개 오픈소스 모델과 상용 이미지 모델을 통틀어도 가장 빠른 축에 든다는 평가가 붙음

중요

> 핵심은 “커스터마이징은 로우에서, 실제 대량 생성은 터보에서”라는 분리 전략임. 디자인 조직 입장에선 품질보다 워크플로우가 더 크게 체감될 수 있음.

  • 로우에서 학습한 스타일을 터보에서 그대로 쓰는 구조도 준비돼 있음

    • 사용자가 로우 모델에서 학습한 LoRA(Low-Rank Adaptation)나 맞춤형 스타일을 터보 모델에 적용할 수 있음
    • 기업 입장에선 브랜드 톤을 학습시킨 뒤 빠른 생성 모델로 결과물을 대량 생산하는 그림이 가능해짐
  • 스타일 전송도 텍스트 프롬프트만 보는 방식이 아님

    • 여러 장의 참조 이미지를 넣고, 무드보드나 디자인 레퍼런스를 조합할 수 있음
    • 특정 스타일 요소만 뽑거나 스타일 강도를 조절할 수 있어, 대규모 디자인 작업에서 일관성 유지가 쉬워진다는 주장
  • 프롬프트 입력 쪽도 대형 언어 모델(LLM)을 붙여 보강함

    • ‘프롬프트 확장기(Prompt Expander)’가 짧은 입력을 더 자세한 프롬프트로 자동 확장함
    • 복잡한 프롬프트 엔지니어링 없이 원하는 이미지를 만들게 하려는 장치임
  • 학습 데이터 품질 관리도 꽤 강조함

    • 공개 데이터, 라이선스 이미지, 자체 구축 데이터셋을 섞어 사용했다고 밝힘
    • AI가 만든 합성 이미지는 사전 학습 데이터에서 완전히 제외했다고 함
    • DINOv3와 SigLIP-2 기반 필터링으로 중복 이미지, 저해상도 콘텐츠, 유해 콘텐츠를 제거했다고 설명
  • 라이선스는 “열어주되, 기업 규모와 안전 책임은 챙긴다” 쪽임

    • 개인 개발자, 독립 창작자, 중소기업은 별도 로열티 없이 상업 활용 가능
    • 생성 콘텐츠 저작권도 사용자에게 귀속
    • 다만 50석을 넘는 대기업 고객은 별도 엔터프라이즈 라이선스가 필요함

⚠️주의

> 모델 배포자는 불법 콘텐츠, 비동의 음란물(NCII), 아동 성착취물(CSAM), 명예훼손 콘텐츠 생성을 막는 필터링 시스템을 의무적으로 구현해야 함. 위반하면 모델 접근 권한 박탈이나 가중치 업데이트 중단까지 갈 수 있음.


기술 맥락

  • 크레아 2의 선택은 모델 하나로 모든 걸 해결하려는 접근이 아니라, 학습용 모델과 생성용 모델을 나누는 쪽이에요. 기업은 보통 “우리 브랜드 스타일을 얼마나 잘 먹이느냐”와 “실제 결과물을 얼마나 빨리 뽑느냐”를 동시에 원하거든요.

  • 로우 모델이 비정렬 상태로 제공되는 이유도 여기에 있어요. 이미 특정 미감으로 강하게 정렬된 모델은 보기엔 예뻐도, 브랜드나 제품 디자인처럼 고유한 스타일을 입히기엔 오히려 방해가 될 수 있어요.

  • 터보 모델은 지식 증류로 추론 단계를 8단계까지 줄인 게 핵심이에요. 이미지 생성은 품질만큼 대기 시간이 중요해서, 2K 이미지를 약 2초에 뽑는 성능은 광고 시안, 커머스 이미지, 게임 리소스 초안 같은 반복 작업에서 꽤 큰 차이를 만들 수 있어요.

  • 안전 필터링 의무가 붙은 것도 오픈웨이트 모델의 현실적인 숙제예요. 가중치를 열면 활용 범위는 넓어지지만, 배포자에게 불법 콘텐츠 방지 책임을 넘기지 않으면 기업 고객이 쓰기 어려운 모델이 되거든요.

이미지 생성 모델 경쟁이 단순 품질 싸움에서 ‘기업이 자기 스타일로 얼마나 빨리 튜닝하고 배포하느냐’로 넘어가는 흐름이 보인다. 오픈웨이트지만 안전 필터와 엔터프라이즈 라이선스 조건을 같이 건 점도 현실적인 균형점이다.

댓글

댓글

댓글을 불러오는 중...

ai-ml

메가존소프트·구글 클라우드, AI 에이전트 업무 전환 세미나 열어

메가존소프트와 구글 클라우드가 국내 주요 기업 C레벨 60여명을 대상으로 에이전틱 워크스페이스 전환 세미나를 열었다. 핵심 메시지는 AI 에이전트 도입이 단순 신기술 적용이 아니라 조직의 업무 방식, 거버넌스, 변화관리까지 바꾸는 일이라는 점이다.

ai-ml

네이버클라우드, 공공 AI 시장에 모델부터 데이터센터까지 풀스택으로 들어간다

네이버클라우드가 공공 AI 시장을 겨냥해 AI 모델, 플랫폼, GPU, 데이터센터를 묶은 풀스택 전략을 내세웠다. 클로바 스튜디오 for 거브는 이미 40개 이상 부처·기관에 확산됐고, 세종 데이터센터 ‘각’에는 정부 전용 리전까지 준비 중이다.

ai-ml

네이버클라우드·지멘스, 국내 제조 현장 AI 전환 같이 민다

네이버클라우드와 한국지멘스가 제조 산업의 AI 전환을 위해 업무협약을 맺었다. 지멘스의 자동화·디지털 트윈·산업용 AI 역량과 네이버클라우드의 국내 클라우드 인프라를 묶어 제조 현장용 AI·DX 솔루션을 공동 발굴하겠다는 그림이다.

ai-ml

네이버클라우드와 지멘스, 제조 AI 전환 위해 산업용 솔루션 공동 개발한다

네이버클라우드가 한국지멘스와 제조 산업의 AI 전환을 위한 업무협약을 맺었다. 지멘스는 제조 데이터, 자동화, 디지털 트윈, OT·IT 융합 역량을 제공하고 네이버클라우드는 클라우드 인프라와 데이터센터 운영 역량을 결합해 현장형 AI 솔루션을 만들 계획이다.

ai-ml

웹·API 다음은 에이전틱 AI 경제…클라우드도 분산형으로 바뀐다

NIA 김은주 본부장이 에이전틱 AI 시대에는 사람이 화면을 조작하는 흐름을 넘어 AI 에이전트가 판단하고 API를 호출하는 경제가 열린다고 진단했다. 인프라 중심도 학습에서 추론으로 이동하고, 2030년에는 추론 비중이 60%까지 커지며 엣지와 엔드포인트의 역할도 커질 전망이다.