가짜가 진짜를 위협하는 시대, 영상 AI의 끝없는 발전(feat. Kling 3.0, Seedance 2.0)

가짜가 진짜를 위협하는 시대, 영상 AI의 끝없는 발전(feat. Kling 3.0, Seedance 2.0)

부루퉁의AI

안녕하세요, 부루퉁입니다.

매주 쏟아지는 소식들 사이에서 "이번엔 진짜다" 싶은 걸 골라내는 게 제 일이지만, 이번 주도 역시 놀라운 AI에 대한 이야기입니다. 단순히 화질이 좋아진 수준이 아니라, 이제는 AI가 만든 영상이 연출과 액션까지 가능해 졌거든요. 오늘은 영상 생성 AI의 양대 산맥으로 떠오른 클링(Kling) 3.0시댄스(Seedance) 2.0이 가져온 변화들을 짚어보겠습니다.

클링 3.0: "AI 페이크 다큐 영상"의 등장

0:00
/2:10

클링 3.0 사이먼 마이어 제작

최근 클링 3.0과 함께 공개된 AI 영상입니다. 내용은 '달 착륙이 사실은 사기극이었다'라는 내용입니다. 나오는 인물들의 대화 음성, 자연스러운 움직임 등 너무 리얼해서 저도 어안이벙벙했습니다. 물론 편집과 수정이 들어갔겠지만, 이젠 진짜 마음먹고 속이려면 누구든 속일 수 있겠다는 생각이 들었습니다.

  • 진짜보다 더 진짜 같은 이유 (Native Audio): 기존 AI 영상이 무성 영화에 소리를 입힌 느낌이었다면, 클링 3.0은 '시청각 동시 생성' 모델을 채택했습니다. 영상이 생성되는 순간, 그 공간의 소음과 인물의 숨소리가 함께 계산됩니다. 빗소리에 맞춰 물웅덩이가 튀고, 입 모양뿐만 아니라 목 근육의 움직임까지 소리와 일치하게 생성됩니다. 심지어 클링 3.0 omni 모델은 캐릭터 일관성까지 강화했다고 하네요.
  • 15초의 서사: 단순한 5초짜리 영상이 아닙니다. 클링 3.0은 최장 15초까지 일관성을 유지하며 긴 호흡의 영상을 만듭니다. 덕분에 이제 짧은 다큐멘터리 한 편 정도는 프롬프트 몇 줄로 뚝딱 나오는 수준에 도달했습니다.

시댄스 2.0: "액션과 연출도 생성하는 AI"

0:00
/0:25

드래곤볼 실사화

0:00
/0:10

클링이 '현장감'에 집중한다면, 바이트댄스의 시댄스 2.0은 '정밀한 연출'과 '뛰어난 액션'에 목숨을 걸었습니다. 제작자 입장에서 가장 골칫거리였던 '속도 빠른 액션 동작과 카메라 무빙' 문제를 기술적으로 압도해버렸습니다.

  • 멀티-참조 어텐션(Multi-reference Attention): 전문가용 툴답게 최대 12개의 참조 데이터를 넣을 수 있습니다. 주인공의 앞모습, 옆모습, 특정 의상 아이템을 따로 학습시키지 않고도 입력만 하면, 영상 내내 그 캐릭터가 붕괴되지 않고 유지됩니다. (이미지, 비디오, 오디오 등 총 12개)
  • 디렉터스 컷의 대중화: "카메라를 왼쪽에서 오른쪽으로 훑으며 조명은 역광으로 해줘"라는 지시가 먹힌다고 합니다. 이건 더 이상 AI에게 '운'을 맡기는 게 아니라, 감독이 AI를 '디지털 퍼펫(Puppet)'처럼 조종하기 시작했다는 뜻입니다.

점점 완성되는 기술, 관건은 기획과 아이디어

이제 우리는 "AI가 이 정도까지 하네?"라는 감탄의 단계를 지났습니다. 더이상 새로운 기술에 마냥 놀기만 할 수 없으니까요. 클링 3.0과 시댄스 2.0이 보여준 결과물은, 이미 상업 광고나 단편 영화 현장에서 바로 투입해도 손색없는 수준입니다.

하지만 기술이 상향 평준화될수록 역설적으로 '사람의 눈'이 더 중요해 지는 것 같습니다. 어떤 내용의 영상이 사람들의 심금을 울릴지, 어떤 캐릭터가 대중의 사랑을 받을지를 결정하는 건 결국 기획자의 몫입니다. AI 도구는 시간이 지날수록 점점 완벽하게 준비되고 있습니다. 에코멤버님들은 이 강력한 툴로 어떤 그림을 그리실 건가요?

부루퉁의AI 네이버 블로그: https://blog.naver.com/ldlquddnr

Comments