---
title: "TRELLIS.2: Microsoft의 최신 40억 파라미터 3D 생성 모델"
published: 2025-12-16T22:09:53.000Z
canonical: https://jeff.news/article/932
---
# TRELLIS.2: Microsoft의 최신 40억 파라미터 3D 생성 모델

Microsoft가 이미지 한 장으로 고품질 텍스처 3D 에셋을 생성하는 40억 파라미터 모델 TRELLIS.2를 MIT 라이선스로 공개함. O-Voxel이라는 새로운 희소 복셀 표현을 도입해 열린 표면, 비다양체 등 복잡한 토폴로지를 처리하며, H100에서 512³ 해상도 기준 약 3초 만에 PBR 재질이 포함된 3D 에셋을 생성함.

- Microsoft가 이미지 한 장으로 고품질 3D 에셋을 생성하는 40억 파라미터 모델 TRELLIS.2를 MIT 라이선스로 공개함
- 핵심 혁신은 O-Voxel이라는 "필드 프리" 희소 복셀 구조로, 기존 iso-surface 방식의 한계를 깨고 열린 표면(옷, 나뭇잎 등), 비다양체 기하, 내부 폐쇄 구조 등 복잡한 토폴로지를 손실 없이 처리함
- H100 GPU 기준 생성 속도가 인상적임: 512³ 해상도 약 3초, 1024³ 약 17초, 1536³ 약 60초
- Sparse 3D VAE로 16배 공간 다운샘플링을 적용해 컴팩트한 잠재 공간으로 인코딩하며, vanilla DiT 아키텍처를 사용함
- 단순 컬러를 넘어 Base Color, Roughness, Metallic, Opacity 등 PBR 재질 속성을 모델링해 포토리얼리스틱 렌더링과 투명도를 지원함
- 데이터 처리도 극도로 효율적임: 텍스처 메시에서 O-Voxel 변환이 CPU 단일 코어로 10초 이내, O-Voxel에서 텍스처 메시 변환은 CUDA로 100ms 이내에 완료됨
- 최소 24GB VRAM GPU가 필요하며 A100, H100에서 검증됨. 학습 코드까지 전부 공개되어 커스텀 데이터셋 파인튜닝도 가능함
- FlexGEMM(Triton 기반 희소 컨볼루션), CuMesh(CUDA 메시 유틸리티), O-Voxel 등 자체 고성능 패키지 생태계 위에 구축됨

## 핵심 포인트

- 40억 파라미터 모델로 H100 기준 512³ ~3초, 1024³ ~17초, 1536³ ~60초의 생성 속도
- O-Voxel 표현으로 열린 표면, 비다양체 기하, 내부 폐쇄 구조 등 임의의 토폴로지 처리
- Base Color, Roughness, Metallic, Opacity 등 PBR 재질 모델링 지원
- 학습 코드까지 MIT 라이선스로 전부 공개

## 인사이트

텍스트-to-3D가 아닌 이미지-to-3D에 집중하면서 PBR 재질과 복잡한 토폴로지를 동시에 해결한 점이 실용적임. 학습 코드까지 MIT로 공개해 게임/VFX 산업에서의 파인튜닝 활용이 기대됨.
