본문 바로가기

AI 소식/오픈소스 AI 모델

[오픈 소스 AI] 로블록스가 만든 "텍스트 to 3D 모델", Cube 3D를 소개합니다.

안녕하세요,

최근 로블록스는 텍스트 프롬프트만으로 다양한 3D 객체를 생성할 수 있는 생성형 AI 모델을 공개하였습니다. 별도의 3D 모델링 지식 없이도, 단순한 문장 입력만으로 실시간 3D 모델을 만들어낼 수 있다는 점에서 모두에게 매우 유용한 도구가 될 것으로 기대됩니다. 이번 포스팅에서는 이 AI 모델인 Cube 3D에 대해 소개하고, 직접 설치하고 사용하는 방법까지 단계별로 알아보겠습니다.


반응형

Cube 3D

2025년 3월 17일, 로블록스(Roblox)는 생성형 AI 기술을 활용한 3D 모델 생성 도구인 'Cube 3D'를 오픈소스로 공개했습니다. 이 모델은 텍스트 프롬프트만으로도 직접 3D 모델과 환경을 생성할 수 있으며, 기존의 2D 이미지 기반 방식과 달리 네이티브 3D 데이터를 학습해 보다 기능적이고 몰입감 있는 결과물을 제공합니다. 향후에는 이미지와 비디오 입력도 지원할 예정입니다.

 

 

Introducing Roblox Cube: Our Core Generative AI System for 3D and 4D

Open-sourcing a version of our Cube 3D foundational model for generative AI

corp.roblox.com

 

아래 허깅페이스 스페이스에서 Cube 3D 데모를 사용해보실 수 있습니다.

출처: Cube 3D 허깅페이스 (클릭시 페이지 이동)

 

 

주요 특징

  • 텍스트 기반 3D 생성
    간단한 텍스트 프롬프트를 입력하면 원하는 3D 객체를 빠르게 생성할 수 있습니다.
    예를 들어, "오토바이 생성" 또는 *"주황색 라바콘 생성"*과 같은 명령어를 통해 해당 객체의 3D 모델을 몇 초 만에 만들어낼 수 있습니다.

  • 오픈소스 제공
    Cube 3D는 오픈소스로 공개되어, 개발자와 연구자들이 자유롭게 활용하고 개선할 수 있습니다.
    특히 기존의 이미지 기반 3D 생성 기술과 달리, 로블록스 플랫폼의 네이티브 3D 데이터를 활용해 모델을 학습시킴으로써 생성된 객체는 게임 엔진과의 완벽한 호환성과 높은 확장성을 자랑합니다.
    이를 통해 AI 커뮤니티 내 혁신과 기술 발전을 더욱 촉진하고자 합니다.

  • 다중 모달 지원 예정
    현재는 텍스트 입력을 기반으로 동작하지만, 향후 이미지나 비디오 등 다양한 입력 형식을 지원하는 멀티모달 모델로 확장될 예정입니다.
    이를 통해 더 다양한 방식으로 3D 콘텐츠를 생성할 수 있을 것으로 기대됩니다.

 

 

라이선스

Cube 3D는 OpenRAIL 라이선스 하에 제공되며, MIT 라이선스와 마찬가지로 상업적 사용이 가능합니다. 단, 아래의 조건을 반드시 준수해야 합니다.

 

[사용 조건 必]

  • 상업적 사용 가능
  • AI 모델 사용 시 책임 있는 활용 필수
  • 허용되지 않는 사용 사례(예: 인권 침해, 불법 활동 등)에 사용 금지
  • 파생물에도 동일한 제한 조건 적용 필수
  • 저작권 고지 및 라이선스 텍스트 반드시 포함

 

※ MIT vs OpenRAIL 라이선스 비교표

항목 MIT 라이선스 OpenRAIL 라이선스
상업적 사용 가능 가능
사용 제한 없음 특정 제한 존재 (책임 기반 사용)
파생물 조건 자유롭게 사용 가능, 고지만 유지하면 됨 파생물에도 동일한 제한 조건 유지 필수
적용 대상 일반 소프트웨어 AI 모델, 데이터, 애플리케이션 등 AI 특화
윤리적 고려 없음 인권, 안전, 책임 등 윤리적 고려 포함
라이선스 성격 매우 자유로움 자유 + 제한 (책임 있는 사용 유도)

 

목차
1. 실행 환경
2. Cube 3D 설치
3. EXAONE-Deep-32B 실행 (Ollama 실행)

1. 실행 환경

  • 운영체제 : Windows 11
  • python : 3.10.0
  • torch : 2.6.0+cu124
  • GPU : NVIDIA GeForce RTX 4060 Ti

 

 

2. Cube 3D 설치

로컬 환경에서 Cube 3D를 실행하기 위해서는, 아래 명령어를 통해 필요한 패키지와 모델 파일을 설치해야 합니다.

 

[Cube 3D 코드 파일 다운로드]

출처: Cube 3D 깃허브 (클릭시 페이지 이동)

 

 

[Cube 3D 모델 다운로드]

출처: Cube 3D 허깅페이스 (클릭시 페이지 이동)

 

 

[필요 패키지 설치 ]

# Windows PowerShell
cd C:/path/to/cube  # 깃허브에서 다운받은 파일 경로
pip install -e .[meshlab]  # 필요 패키지 설치
pip install ipython  # 필요 패키지 설치
pip install torch --index-url https://download.pytorch.org/whl/cu124 --force-reinstall  # torch 설치

 

참고: GitHub에서 받은 파일은 사용자의 환경에 따라 경로를 설정해야 합니다. 예를 들어, C드라이브의 cube 폴더에 압축을 푼 경우 "cd C:/cube/"로 입력하시면 됩니다.

 

 

[Python 코드 작성]

Cube 3D 모델이 설치된 경로는 반드시 사용자의 환경에 맞게 수정해야 합니다. "input_prompt" 항목에는 생성하고자 하는 3D 객체에 대한 텍스트 프롬프트를 입력하시면 됩니다.

# Python
import torch
import trimesh
from cube3d.inference.engine import Engine, EngineFast

# load ckpt
config_path = "E:/ai_model/Roblox/cube/cube3d/configs/open_model.yaml"  # 깃허브에서 다운받은 파일
gpt_ckpt_path = "E:/ai_model/Roblox/cube3d_v0.1/shape_gpt.safetensors"  # 허깅페이스에 다운받은 모델
shape_ckpt_path = "E:/ai_model/Roblox/cube3d_v0.1/shape_tokenizer.safetensors"  # 허깅페이스에 다운받은 모델
engine_fast = EngineFast( # only supported on CUDA devices, replace with Engine otherwise
    config_path, 
    gpt_ckpt_path, 
    shape_ckpt_path, 
    device=torch.device("cuda"),
)

# inference
input_prompt = "A pair of noise-canceling headphones"
mesh_v_f = engine_fast.t2s([input_prompt], use_kv_cache=True, resolution_base=8.0, top_p=0.9)

# save output
vertices, faces = mesh_v_f[0][0], mesh_v_f[0][1]
_ = trimesh.Trimesh(vertices=vertices, faces=faces).export("output.obj")

 

 

3. Cube 3D 실행

위에서 생성한 Python 코드를 실행시켜줍니다.

  • 입력 프롬프트 : "A pair of noise-canceling headphones"

 

실행 결과, 3D 모델 파일(.obj 파일)이 성공적으로 생성되었습니다. (위 이미지 참고) 이때 사용된 VRAM은 약 24.4GB, 생성 시간은 10분 이상 소요되었습니다. Cube 3D의 공식 데모에서는 30초 이내로 모델 파일이 생성되었지만, 낮은 사양의 환경에서는 예상보다 시간이 더 걸릴 수 있습니다.

 

비록 아주 정밀한 디테일을 표현하진 못하지만, 기초적인 형태를 빠르게 잡아주는 점에서 의미 있는 성과라 할 수 있습니다. 기본적인 3D 모델링 작업이 가능한 사용자라면, Cube 3D를 활용해 기초 형태를 빠르게 생성하고 이후 수작업으로 디테일을 다듬는 방식으로 효율적인 워크플로우를 구축할 수 있을 것으로 기대됩니다.

 


 

Cube 3D는 3D 모델링의 진입 장벽을 크게 낮춰주는 혁신적인 생성형 AI 도구입니다. 간단한 텍스트 입력만으로 3D 객체의 기본 형태를 빠르게 만들어낼 수 있기 때문에, 디자이너뿐만 아니라 개발자, 기획자 등 다양한 분야에서 유용하게 활용될 수 있을 것으로 보입니다. 아직은 생성 속도나 세부 디테일 면에서 아쉬운 부분이 있지만, 기초 구조를 자동으로 생성해주는 점만으로도 작업 시간을 단축하고 창작의 폭을 넓힐 수 있는 강력한 도구임은 분명합니다.

 

앞으로 이미지, 영상 등 다양한 입력을 지원하는 멀티모달 기능이 추가된다면 Cube 3D는 3D 콘텐츠 제작 방식에 큰 변화를 가져올 것으로 기대됩니다.

 

 

감사합니다. 😊

 

반응형