몇마디만 입력하면 빵빵 터지는 60초짜리 영상이 생성된다! 미국 OpenAI연구소가 내놓은 동영상 생성모델 Sora는 최근 전세계를 놀라게 했다.
OpenAI가 ChatGPT를 출시한지 1년만에 또 하나의 메가톤급 폭탄을 내던졌다. ‘텍스트로 동영상을 생성’하는 AI모델 Sora의 놀라운 점은 무엇일가? 업계에 어떤 영향을 미칠가? 이런 문제에 대한 해답을 알아보자.
Sora는 어떤 재주가 있는가Sora가 생성한 여러개의 짧은 동영상 ‘블록버스터’는 사실적이고 부드러운 장면과 풍부한 디테일로 전체 온라인을 도배되였다.
OpenAI가 AI 동영상 생성분야에 진출한 것은 이번이 처음이다. 회사의 소개에 따르면 Sora는 Transformer구조를 사용하여 텍스트명령에 따라 현실적이고 상상력 있는 장면을 만들고 다양한 스타일, 다양한 화폭, 최대 1분의 고화질 동영상을 생성할 수 있다고 한다.
즉 Sora에게 제시어를 주면 고품질의 짧은 동영상을 만들 수 있다는 것이다.
OpenAI 공식 웹사이트에 게시된 Sora가 생성한 영상이미지에서는 SUV가 산악도로를 달리는 것을 보여준다.
Sora는 또한 정적 이미지를 기반으로 동영상을 생성하여 기존 동영상을 확장하거나 부족한 프레임을 채울 수 있다.
OpenAI는 Sora는 언어를 깊이 리해하고 사용자의 텍스트제시뿐만 아니라 물리적 세계의 사물존재방식을 리해할 수 있다고 말했다. "우리는 인공지능이 스포츠 속 물리 세계를 리해하고 시뮬레이션하도록 가르치고 있는데 목표는 실제 세계와 상호작용해야 하는 문제를 해결할 수 있도록 모델을 훈련시키는 것이다”라고 했다.
그런데 OpenAI 홈페지에 올라온 영상은 Sora가 만든 평균수준일가 아니면 최고수준일가?
OpenAI는 현재 Sora가 생성한 영상에 비론리적 이미지가 포함될 수 있고 좌우 등 공간디테일을 혼동하고 복잡한 장면의 물리적 원리와 인과관계의 실제사례를 정확하게 시뮬레이션하기 어려운 등 문제가 존재한다고 인정했다. 례를 들어 한사람이 쿠키를 한입 물었을 때 쿠키에 물린 자국이 없는 것과 같은 것이다. 하지만 계산능력이 향상되고 모델이 개선됨에 따라 사람들은 단기간에 보다 완전하고 선진적인 영상 생성기능을 얻을 수 있을 것이다.
누구의 밥그릇을 깨뜨릴 수 있는가OpenAI가 출시한 Sora는 프리뷰버전에 가까운데 대중은 모델의 장단점을 깊이 리해하기 어렵다. OpenAI는 현재 모델개선에 대한 피드백을 얻기 위해 일부 디자이너 및 영화 제작자와 같은 특정그룹에만 Sora 접근 권한을 제공하고 있다고 밝혔다. 회사는 훈련된 Sora 모델의 데터와 같은 기본 세부사항을 공개하지 않았을 뿐만 아니라 대중에게 언제 공개할지도 결정하지 않았다.
일부 분석가들은 Sora가 인공지능기술의 발전이 실생활과 전통업계에 미치는 심원한 영향을 다시 한번 드러냈다고 인정했다.
Sora가 출시된지 하루만에 그래픽처리, 동영상 제작 소프트웨어를 전문으로 하는 어도비의 주가는 7% 넘게 떨어졌다.
할리우드는 지난 해 63년만에 처음으로 작가와 배우 전 업종 파업을 맞았는데 이 업계의 일자리 일부가 인공지능으로 대체될 수 있기 때문이였다. Sora의 출시는 위 위협을 더욱 가깝고 절실하게 만들었다.
AI 폭풍, 통제할 수 있는가과학기술분야에서 파괴적인 혁신이 계속 등장하고 있으며 기술진보를 포용하고 사회안전을 보장하는 균형을 달성하는 방법에 대해 각계의 관심이 높아지고 있다.
OpenAI는 전세계의 정책 제정자, 교육자, 예술가들과 협력하여 그들의 우려를 료해하고 Sora의 적극적인 사용사례를 확인하며 현실세계의 사용으로부터 배우는 것이 점점 더 안전한 인공지능시스템을 만들고 출시하는 핵심적인 요소라고 인정했다.
업계내 인사는 현재 정돈구조와 통제조치가 뒤따르지 않는 상황에서 기업만으로는 사회가 요구하는 인공지능의 안전성과 신뢰를 제공할 수 없을 것이라고 지적했다.