오픈AI의 인공지능(AI) '소라'가 생성한 영상캡쳐. 명령어에 명시하지 않은 장면이 우주비행사라는 맥락에 맞게 생성됐다. (오픈AI 공식 블로그 갈무리) 2024.02.16 /뉴스1
오픈AI의 인공지능(AI) '소라'가 생성한 영상캡쳐. 명령어에 명시하지 않은 장면이 우주비행사라는 맥락에 맞게 생성됐다. (오픈AI 공식 블로그 갈무리) 2024.02.16 /뉴스1

"빨간색 울 니트 오토바이 헬멧을 쓴 30세 우주비행사의 모험을 담은 영화 예고편, 푸른 하늘, 소금 사막, 영화 스타일, 35㎜ 필름으로 촬영, 선명한 색상"

이렇게 입력하자 인공지능(AI)이 17초가량의 영상을 만들었다. 만들어진 영상에는 단순히 푸른 하늘이나 소금 사막 같이 명령어에 들어간 배경뿐 아니라 우주선 내부에서 밖을 바라보는 모습까지 중간에 들어갔다.

오픈AI는 16일 텍스트-비디오 생성 AI '소라'(Sora)를 공개하며 인공지능 기술의 또 다른 가능성을 보여주었다.

소라는 텍스트 설명을 기반으로 영상을 자동으로 생성하는 AI 모델이다. 이 모델은 단순히 텍스트를 시각적으로 재현하는 것이 아니라, 상황에 맞는 창의적인 요소를 더해 영화 같은 영상을 만들어낸다.

소라는 확산(Diffusion)이라는 AI 기술을 사용한다. 확산 모델은 원본 이미지의 질을 단계적으로 떨어뜨린 뒤, 다시 원본에 가까운 이미지를 복원하는 과정을 학습하는 모델이다. 쉽게 말하면, 이미지를 점점 흐리게 만들다가 다시 선명하게 만드는 과정을 통해 이미지 생성을 학습하는 것이다.

소라는 이 기술을 이용하여 텍스트 설명에 맞는 이미지를 하나하나 만들어 나가며, 이를 연결하여 영상을 완성한다.

소라는 여러 캐릭터, 특정 유형의 동작, 피사체와 배경의 정확한 세부 정보로 복잡한 장면을 생성할 수 있다. 또한 명령에서 요청된 내용뿐 아니라 맥락에 맞는 배경이나 등장인물, 각종 요소를 알아서 채운다.

오픈AI의 인공지능(AI) '소라'가 생성한 영상의 일부.
오픈AI의 인공지능(AI) '소라'가 생성한 영상의 일부.

예를 들어 "골드러시 당시 캘리포니아의 역사 기록 영상"이라는 명령어만 있어도 사람들이 말을 타고 다녔던 당시 상황이 영상에 반영된다.

오픈AI에 따르면 현재 소라는 최대 1분 길이의 비디오를 생성할 수 있으며, 생성된 비디오를 확장해 더 길게 만들 수도 있다. 

다만 물리적으로 불가능하거나 인과관계에 어긋나는 영상이 만들어지는 경우도 있다는 한계가 있다. 예를 들어 앞 장면에서는 쿠키를 베어 물었지만 나중에 쿠키가 멀쩡한 식의 영상이 나올 수도 있다.

소라는 현재 대중에게 공개된 상태는 아니다.

오픈AI는 "창작자에게 도움이 되는 모델이 되도록 다수의 시각 예술가, 디자이너, 영화 제작자에게 접속 권한을 부여하고 피드백을 받고 있다"며 "오픈AI 제품에서 소라를 사용할 수 있게 되기 전에 몇 가지 안전 조치를 취할 것"이라고 설명했다.

생성AI로 인한 허위 정보 생산, 초상권·저작권 도용 등의 문제를 막으려는 조치로 풀이된다.

오픈AI는 AI 생성 비디오 감지 기술을 구축하고 있으며 각 분야 전문가와 잘못된 정보, 증오 콘텐츠, 차별·편견 방지 테스트를 진행할 예정이다.

또 현재 챗GPT에 적용된 극단적인 폭력, 성적인 콘텐츠, 혐오스러운 이미지, 유명인 초상 관련 명령어 거부 기능도 도입된다.

저작권자 © AI라이프경제 무단전재 및 재배포 금지