알리바바, 영상 생성·편집 위한 ‘Wan2.1-VACE’ 오픈소스 모델 공개

[더테크 이지영 기자] 알리바바가 영상 생성 및 편집을 위한 최신 오픈소스 AI 모델 ‘Wan2.1-VACE(Video All-in-one Creation and Editing)’를 16일 공식 발표했다.

이번 모델은 다양한 영상 처리 기능을 하나로 통합해 영상 제작 과정을 간소화하고, 크리에이터의 효율성과 생산성을 극대화하는 데 중점을 두었다. Wan2.1-VACE는 알리바바의 영상 생성 특화 대규모 모델 시리즈인 ‘Wan2.1’에 속하며, 영상 생성 및 편집 기능을 아우르는 업계 최초의 오픈소스 통합 모델이다.

해당 모델은 텍스트, 이미지, 영상 등 다양한 멀티모달 입력을 기반으로 영상 생성이 가능하며, 이미지나 특정 프레임을 참조해 편집하거나, 영상 내 선택 영역을 수정·재구성하고, 시공간 확장까지 지원하는 고급 편집 기능을 제공한다. 이를 통해 사용자는 여러 작업을 유연하게 결합해 더욱 창의적인 결과물을 만들 수 있다.

Wan2.1-VACE는 이미지 샘플을 바탕으로 상호작용하는 객체가 포함된 영상을 생성하거나, 정적인 이미지를 자연스럽게 움직이게 하여 생동감을 부여할 수 있다. 포즈 전환, 움직임 제어, 깊이 조절, 색상 재처리 등의 기능도 포함돼 고도화된 영상 리페인팅을 지원한다.

또한, 영상 내 특정 영역을 주변에 영향을 주지 않고 수정하거나 삭제·추가할 수 있으며, 영상 경계를 확장하고 자동으로 자연스러운 콘텐츠를 생성해 시각적 풍부함을 더한다.

사용자는 정적인 이미지를 영상으로 변환하는 동시에 객체의 이동 경로를 지정해 움직임을 제어하거나, 특정 인물·사물을 참조해 치환 및 애니메이션 처리도 가능하다. 수직 이미지를 가로 영상으로 확장하면서 새로운 요소를 추가하는 작업 역시 손쉽게 수행할 수 있다.

Wan2.1-VACE는 다양한 영상 편집 작업의 니즈를 고려한 첨단 기술을 다수 적용했다. 멀티모달 입력(텍스트, 이미지, 영상, 마스크 등)을 일괄 처리하는 통합 인터페이스 ‘VCU’를 도입했으며, 시간적·공간적 요소를 정형화된 방식으로 표현하는 구조를 통해 각 작업 개념을 효율적으로 모델에 주입할 수 있도록 설계됐다.

영상 기반 AI 모델을 훈련하려면 막대한 연산 자원과 고품질 학습 데이터가 필요하다. Wan2.1-VACE는 오픈소스를 통해 이러한 장벽을 낮추고, 더 많은 기업이 빠르고 경제적인 방식으로 자사 니즈에 맞춘 고품질 영상 콘텐츠를 제작할 수 있도록 지원한다.

CATEGORY

알리바바, 영상 생성·편집 위한 ‘Wan2.1-VACE’ 오픈소스 모델 공개

영상 제작 전 과정을 하나의 모델로 통합

많이 본 뉴스

IOT기반 산업단지 대기질 개선 본격화... 소규모 사업장까지 대기오염 관리 확대

델 테크놀로지스, 맥라렌 레이싱과 협력 확대… AI 인프라로 F1 경쟁력 강화

LG CNS, OpenAI 리셀러 파트너 계약… ‘ChatGPT 엔터프라이즈’ 국내 확산 본격화

“AI 안전성도 문화 맞춤 시대” 셀렉트스타, 레드티밍 자동 생성 프레임워크 공개

[속보] 네이버 페이, 결제 예약 오류... "복구 진행 중"

AI 기본법 대응 본격화… 산업별 맞춤형 실행 가이드 필요성 부각

지난해 유럽 스마트폰 1억3420만대…삼성 1위 유지, 애플 27% 최고치 기록

개인정보 수집 및 이용