'AI 대모'로 불리는 페이페이 리 스탠포드대학교 교수가 설립한 '월드랩스(WorldLabs)'가 세계 최초의 상용 '월드 모델(World Model)'을 공식 출시했습니다. '마블(Marble)'이라는 이름의 이 모델은 텍스트, 사진, 동영상, 3D 설계도 등 다양한 입력을 기반으로 편집 가능한 3D 환경을 생성하는 혁신적인 기술입니다.
이번 출시는 구글, 메타 등 거대 기업들이 월드 모델 연구를 진행 중인 가운데, 월드랩스가 경쟁사들을 제치고 상용화에 첫발을 내디뎠다는 점에서 큰 의미가 있습니다. 본 블로그에서는 월드 모델의 핵심 개념과 '마블'의 주요 특징, 그리고 이 기술이 가져올 미래에 대해 자세히 살펴보겠습니다.
반응형
(adsbygoogle = window.adsbygoogle || []).push({});
월드 모델과 공간 지능이란 무엇인가?
'월드 모델'의 핵심은 '공간 지능(Spatial Intelligence)' 기술에 기반합니다. 공간 지능이란 AI가 현실 세계를 관찰하고, 이해하며, 나아가 구축할 수 있는 능력을 의미합니다.
즉, 월드 모델은 AI가 환경을 내부적으로 이해하고 예측할 수 있도록 **세계의 디지털 표현체(Digital Representation)**를 생성하는 시스템입니다. 이는 단순히 이미지를 생성하는 것을 넘어, AI가 미래의 행동을 계획하거나 다양한 시뮬레이션을 수행하는 데 활용될 수 있습니다.
기존의 월드 모델 연구는 AI가 탐색 과정에서 실시간으로 세계를 생성하는 방식이 주를 이루었습니다. 하지만 이 방식은 생성된 세계의 일관성이 떨어지는 문제를 안고 있었습니다. 월드랩스의 '마블'은 바로 이 지점에서 차별점을 가집니다.
세계 최초의 상용 월드 모델, '마블(Marble)'의 특징
'마블'은 기존 모델의 한계를 극복하고 세계 최초로 상용화된 월드 모델로서 몇 가지 독보적인 특징을 가지고 있습니다.
1. 지속적이고 다운로드 가능한 3D 환경 구축 마블의 가장 큰 차별점은 '지속적이고 다운로드 가능한 3D 환경'을 구축할 수 있다는 것입니다. 이는 실시간 생성 방식에서 발생하는 변형이나 불일치를 최소화합니다. 사용자는 완성된 3D 환경을 메쉬(Mesh), 비디오, 가우시안 스플랫(Gaussian Splat) 등 다양한 표준 형식으로 출력하여 실제 제작 환경에 바로 적용할 수 있습니다.
2. 세계 최초의 AI 편집 기능과 하이브리드 3D 에디터 마블은 월드 모델 중 최초로 AI 편집 기능과 하이브리드 3D 에디터를 제공합니다. 이는 AI가 일방적으로 결과를 생성하는 것이 아니라, 사용자가 창의적인 통제권을 유지할 수 있도록 설계되었습니다.
저스틴 존슨 월드랩스 공동 창립자는 이 과정을 "HTML로 구조를 만들고 CSS로 스타일을 입히는 과정과 유사하다"라고 설명했습니다.
3. 확장 및 결합이 가능한 '컴포저 모드(Composer Mode)' 사용자는 생성된 세계의 일부를 확장하거나, 여러 개의 세계를 하나로 합쳐 거대한 공간을 구축할 수 있습니다. 이 '컴포저 모드'를 통해 더욱 복잡하고 광범위한 3D 환경 제작이 가능해집니다.
'마블'은 어떻게 작동하는가? (간단한 사용 예시)
'마블'의 작업 방식은 사용자의 창의적 통제권을 보장하는 방향으로 설계되었습니다.
구조 배치 (HTML처럼): 사용자가 먼저 벽, 상자, 평면 등 기본적인 공간 구조를 블록 형태로 배치하여 3D 환경의 뼈대를 만듭니다.
스타일 지정 (CSS처럼): 그 후, 텍스트 프롬프트를 통해 원하는 시각적 스타일(예: '고대 유적 스타일', '미래지향적 도시 스타일')을 지정합니다.
환경 생성 및 편집: 마블은 이 입력을 바탕으로 3D 환경을 생성하며, 사용자는 하이브리드 에디터를 통해 AI가 생성한 결과를 세밀하게 편집하고 수정할 수 있습니다.
마블의 주요 활용 분야 및 상용화 모델
마블은 4단계의 요금제(무료, 스탠다드, 프로, 맥스)로 출시되었으며, 초기 주요 활용처는 다음과 같습니다.
게임 개발: 개발자들은 마블로 생성한 배경이나 비활성 공간을 유니티(Unit