이제 AI로 만들어진 영상이 하나도 신기하지 않은 세상이 됐다. 강아지가 오토바이를 타던, 고양이가 셀카를 찍던 대충 AI로 만들었겠거니 하면서 지나간다. 지난 9월 OpenAI는 영상 생성 모델인 Sora2를 공개했다. AI로 만들어지는 콘텐츠에서 그동안의 한계는 물리적 현실이 잘 반영 안된다는 점이었다. 이번에 공개된 새로운 모델은 물리 법칙을 강하게 학습시켰다고 한다. 이를테면 스케이트를 탈 때 가속되는 부분, 물건이 떨어질 때의 잔상, 넘어질 때의 탄성, 동물의 걸음걸이 등이 훨씬 현실에 가깝게 자연스러워진 것. 하지만 사실 일반인으로서 크게 달라진 점은 없다. ‘좀 더 현실적인’ 영상이 됐을 뿐.

AI Slop이라는 말이 있다. Slop이 원래 돼지 먹이나 물에 불린 쓰레기 같은 것을 뜻 했는데, 말 그대로 무의미하고 과잉 생산된, 쓰레기 콘텐츠라는 의미다. 맥락은 없고, 어딘가 기괴하고 공허하다. 딱히 누가 보고 싶어 하는 것도 아닌데 자꾸 우리들의 피드를 채운다. 하지만 이 콘텐츠들이 신기하니까, 어딘가 중독적이니까 인기를 끌었겠지. AI 영상만 보고 만들고 즐길 수 있는 2개의 앱이 출시 됐다. Meta의 Vibes와 OpenAI의 Sora다. 기존과 차이점은 그동안은 뭔가를 만드는 AI 도구이고 모델이었는데 인스타그램 같은 ‘소셜 앱’이라는 점이다.

Vibes는 메타가 올해 9월에 공개한 AI 영상 피드 앱이다. 틱톡처럼 무한 피드로 영상이 재생된다. 겉보기엔 익숙한 쇼츠, 릴스 같지만 모든 영상이 전부 AI로 생성된 점이 다르다. 공식 기사에 따르면 AI로 새로운 비디오를 만들고 리믹스하며 공유할 수 있는 공간을 의도한다고. 이미 GPT로 익숙하겠지만 이 앱 또한 간단한 텍스트만 입력하면 영상이 만들어지고, 다른 사람들이 만든 영상을 ‘리믹스’하여 내가 살짝 다르게 만들거나 저장할 수 있다.

Sora는 조금 색다른 기능을 넣었다. 사용자의 얼굴을 몇 초간 스캔하면 자신의 얼굴을 학습한 AI 모델이 생성된다. 이걸로 자신이 주인공인 영상을 만들 수 있다. 여기에 ‘카메오’라는 기능을 더해 다른 사람들에게 동의를 구하고 나의 영상에 등장시킬 수 있다. 덕분에 자신의 초상권을 열어둔 사람들만을 활용되어 다소 안전한 영상들이 생산되고 있다. 공식 안내를 보면 딥페이크 악용을 방지하기 위한 노력이 드러난다. 피드를 관리하거나 카메오 요청을 거절하는 등 사용자 보호 장치도 마련되어 있으니까.

하지만 그렇다고 샘 알트먼이 변기에서 랩 하는 영상을 보고 싶었다는 뜻은 아니었다.. 유튜브나 인스타그램에서 AI 영상을 가끔 볼 땐 신기해서 보지만, AI 영상만 온통 깔려버리니 피곤하게 느껴졌다. 물 위를 달리는 예수라던가, 트월킹하는 불곰이라던가, 말이 트램펄린을 뛰거나, 모나리자가 노래를 부르고, 집에서 갑자기 하늘로 순간이동을 한다. 이런 영상을 계속 보자니 허망함도 든다. 카메오 기능 또한 처음엔 재미있고 놀랍다. 친구들과 아이돌이 되어 무대에서 노래하는 영상이라거나, 친구와 싸우는 것 같은 상황극을 한다거나. 하지만 그 신선함은 빠르게 소진되고 정서적으로 남는 것이 없다.

영상은 많아졌지만 그 안에 담긴 의도, 감정, 이야기는 점점 흐려진다. 물론 창작자에게 완전히 새로운 지평이 열린 것은 맞다. 훌륭한 콘텐츠가 생겨나는 반면, AI Slop도 과도하게 많아졌을 뿐. 창작자들은 AI를 사용하더라도 ‘도구’로 사용한다. 핵심 기획과 연출은 사람이 하고, AI는 비용과 시간을 아껴주는 보조 역할인 것. 그리고 여전히 직접 인간이 촬영하고 편집한 영상의 영향력이 존재한다. 결국 나중엔 ‘AI로 만들어진 영상’이라는 표기가 아닌 ‘인간이 만든 영상’이라는 표기가 강력해질지도 모른다.

기술이 너무 발전해서 피로해지는 시대까지 와버렸다. 이미 기술은 충분히 멋지다. 이 기술로 무슨 이야기를 왜 하고 있느냐가 중요해진다. OpenAI나 Meta가 책임감, 피드 관리, 커뮤니티 강화를 말하지만 정작 이 말들이 왜 필요한지도 생각해보게 된다. 이 앱들이 만들어내는 건 콘텐츠가 아니라 감각 자극이고, 의미 없이 생성되는 상태인 건 아닐지.


