틱톡 모회사 바이트댄스가 AI 영상 생성 모델 ‘시댄스 2.0(Seedance 2.0)’을 출시했다. 네이티브 2K 해상도에 5초 영상을 60초 만에 생성하는 기술력으로 ‘소라 킬러’라는 평가를 받지만, 톰 크루즈와 브래드 피트의 AI 격투 영상이 바이럴되면서 할리우드 5대 메이저 스튜디오가 일제히 저작권 침해를 규탄하고 있다.
시댄스 2.0, 소라2를 넘어서다
바이트댄스(ByteDance)가 2월 12일 정식 출시한 시댄스 2.0은 AI 영상 생성 분야의 판도를 바꿀 기술적 완성도를 보여준다. 네이티브 2K(1440p) 해상도를 지원하며 최대 4K(2160p)까지 업스케일이 가능하다. 오픈AI의 소라2(Sora2)가 1080p에 머무는 것과 비교하면 뚜렷한 해상도 우위이다.
속도 면에서도 차별화에 성공했다. 5초 분량의 영상을 약 60초 만에 생성하며, 이는 소라2의 2~5분 대비 크게 빠른 수치이다. 같은 중국 AI 영상 모델인 클링(Kling) 3.0과 비교해도 30% 빠르다. 최대 15초 길이의 영상 클립을 24fps로 출력한다.
| 항목 | 시댄스 2.0 | 소라2(Sora2) |
|---|---|---|
| 해상도 | 네이티브 2K, 최대 4K | 1080p |
| 5초 영상 생성 속도 | 약 60초 | 2~5분 |
| 최대 클립 길이 | 15초 | 20초 |
| 멀티모달 입력 | 12개 파일(텍스트·이미지·비디오·오디오) | 텍스트·이미지 |
| 립싱크 | 8개 이상 언어, 음소 수준 | 제한적 |
| 프레임레이트 | 24fps | 24fps |
특히 12개 파일까지 동시에 입력할 수 있는 멀티모달 아키텍처가 주목할 만하다. 텍스트, 이미지, 비디오, 오디오를 한꺼번에 입력해 영상을 생성할 수 있다. 8개 이상의 언어에 대해 음소(phoneme) 수준의 립싱크 동기화를 지원하는 점도 경쟁 모델과 차별화되는 기능이다.
톰 크루즈 vs 브래드 피트, 바이럴의 그림자
기술적 완성도만큼 논란도 뜨겁다. 시댄스 2.0으로 생성된 톰 크루즈와 브래드 피트의 AI 격투 영상이 X(구 트위터)에서 100만 뷰 이상을 기록하며 바이럴되었다. 일론 머스크는 이 영상에 대해 “(AI 영상 기술의 발전이) 빠르게 진행되고 있다(It’s happening fast)”고 반응했다.
문제는 이 영상이 두 배우의 동의 없이 생성되었다는 점이다. 미국영화협회(MPA)는 즉각 성명을 내고 “이 중국 AI 서비스는 미국 저작물을 대규모로 무단 사용했다”고 규탄했다. 디즈니, 워너브라더스, 파라마운트, 넷플릭스, 소니 등 할리우드 5대 메이저 스튜디오가 바이트댄스에 저작권 침해 중단 통보서(cease-and-desist)를 발송했다.
미국배우조합(SAG-AFTRA)도 강경한 입장을 밝혔다. “이는 용납할 수 없으며 인간 배우의 생계 능력을 약화시킨다. 법률, 윤리, 업계 기준, 동의의 기본 원칙을 무시한 것이다”라고 비판했다. 데드풀 각본가 렛 리스(Rhett Reese)는 “한 사람이 컴퓨터 앞에 앉아 할리우드가 현재 내놓는 것과 구별할 수 없는 영화를 만들 수 있게 될 것이다”라고 경고했다.
흥미로운 사례도 등장했다. 중국 거장 감독 자쯔커(贾樟柯)가 시댄스 2.0을 활용해 AI 단편영화 ‘자쯔커의 춤(Jia Zhangke’s Dance)’을 제작한 것이다. 이 작품에서는 두 명의 ‘자쯔커’가 화면에 동시에 등장한다. AI가 생성한 자쯔커와 실제 자쯔커처럼 보이는 AI가 저작권, 기술, 예술적 통제에 대해 메타적 대화를 나눈다.
AI가 낙관적인 대사를 삽입하자 자쯔커가 반발하고, AI는 “작품이 관객에게 도달하면 해석은 더 이상 창작자만의 것이 아니다”라고 반론하는 구성이다. AI 영상 생성 기술의 가능성과 한계를 동시에 보여주는 사례로 평가받는다.
© 2026 TechMore. All rights reserved. 무단 전재 및 재배포 금지.
