안녕하세요,
지난 포스팅에 이어 이번에도 OpenAI의 소식을 전해드리게 되었습니다. 이번 연말, OpenAI는 굉장이 많은 흥미로운 발표를 했습니다. 그중에서도 가장 기대하던 소식은 바로 Sora가 아닐까 싶습니다. 출시 전부터 영상 생성 AI로서 놀라운 결과물을 선보이며 큰 기대를 모았던 Sora AI입니다. 이번 정식으로 출시한 Sora AI에 대해 한번 살펴보겠습니다.
Sora AI
Sora AI는 OpenAI에서 개발한 영상 생성 AI로, 2024년 2월 처음 공개되었습니다. 당시 공개된 고퀄리티 영상은 많은 사람들의 주목을 받으며 큰 화제 큰 관심을 받았습니다. 다만, 당시에는 일부 사용자만 이용할 수 있었고, 정식 출시는 예고된 상태였습니다. 그런 Sora AI가 마침내 이번 12월, 정식 출시되었습니다.
- OpenAI Sora 소개페이지 : https://openai.com/sora/
Sora는 OpenAI에서 개발한 영상 생성 AI로, 텍스트 입력만으로도 고품질 영상을 생성할 수 있는 혁신적인 기술입니다. 기존의 이미지 생성 AI를 한 단계 뛰어넘어, 이전 AI 기반 비디오 기술보다 더욱 매력적이고 영화 같은 품질의 영상을 만들어냅니다. Sora는 여러 캐릭터, 특정 동작, 정교한 배경 디테일 등 복잡한 장면도 생성할 수 있으며, 연속적인 장면을 통해 사실감 넘치는 움직임과 디테일을 구현하는 것이 특징입니다.
주요 특징
- 텍스트 기반 영상 생성 : 입력한 텍스트를 기반으로 영상 생성
- 다양한 스타일 지원 : 실사와 애니메이션, 아트 스타일 등 다양한 방식으로 영상 제작 가능
- 뛰어난 언어 이해력 : 사용자 프롬프트를 정확히 이해하고 이를 영상으로 구현
- 긴 영상 생성 : 최대 1분 길이의 영상을 생성 가능
- 시간적 일관성과 세부 장면 구현 : 캐릭터, 객체, 배경 등이 영상 전체에 걸쳐 일관성을 유지하며, 복잡한 장면과 다양한 캐릭터, 특정 동작, 세부적인 배경까지 정확히 구현 가능
Sora 요금제
Sora는 현재 유료 사용자만 이용할 수 있으며, GPT 요금제에 따라 다음과 같이 사용 가능합니다.
플랜 | 가격 | 주요 특징 |
ChatGPT Plus | $20/월 | - 최대 50개의 우선 동영상 생성 (1,000 크레딧) - 최대 720p 해상도 및 5초 길이 영상 - ChatGPT Plus의 모든 기능 포함 |
ChatGPT Pro | $200/월 | - 최대 500개의 우선 동영상 생성 (10,000 크레딧) - 무제한 릴렉스 영상 생성 - 최대 1080p 해상도, 20초 길이, 동시 5개 생성 가능 - 워터마크 없는 다운로드 가능 |
Sora 사용 방법
Sora AI는 아래 공식 페이지에서 로그인 후 이용할 수 있습니다.
- Sora 공식페이지: https://sora.com/library
Sora는 현재 세 가지 방식으로 영상을 생성할 수 있습니다.
- 텍스트 to 비디오 : 텍스트를 입력하면 AI가 해당 설명에 맞는 동영상을 생성합니다. 간단한 텍스트 설명만으로도 창의적이고 고퀄리티의 영상을 제작할 수 있습니다.
- 이미지 to 비디오 : 사용자가 입력한 이미지를 기반으로 동영상을 생성합니다. 이미지를 확장해 애니메이션이나 영상 형태로 표현할 수 있습니다.
- 비디오 to 비디오 : 기존 비디오를 입력하면 Sora AI가 이를 기반으로 새로운 영상을 생성합니다. 원본 비디오의 스타일이나 내용을 확장하고 변형해 독창적인 결과물을 만들어냅니다.
프롬프트 입력창(아래 이미지 참고)을 통해 텍스트를 입력하거나, 이미지나 영상을 추가하여 영상을 생성할 수 있습니다.
영상 생성
프롬프트 입력창에 생성하길 원하는 상황을 입력해주면 됩니다. 아래는 예시로 생성된 영상입니다.
[생성 영상1]
- prompt : A highly realistic depiction of a cat walking confidently through the bustling streets of New York City. The cat has sleek fur and a curious expression as it navigates the urban environment. Surrounding the cat are iconic New York elements: tall skyscrapers, yellow taxis, and busy pedestrians. The scene is illuminated by bright daylight, with detailed reflections on glass windows and subtle shadow
[생성 영상2]
- prompt : 뉴욕의 번화한 거리를 자신있게 걷는 고양이의 모습을 매우 사실적으로 묘사합니다. 고양이는 도시 환경을 탐색할 때 매끄러운 털과 호기심 많은 표정을 가지고 있습니다. 고양이 주변에는 높은 빌딩, 노란색 택시, 분주한 보행자 등 뉴욕의 상징적인 요소가 있습니다. 장면은 밝은 일광으로 조명되고 유리창에 세밀한 반사와 미묘한 그림자가 나타납니다.
[생성 영상3]
- prompt : A cat wearing a spacesuit in outer space and the Earth behind it
Sora는 한글과 영어를 모두 정확히 인식하며, 사용자의 프롬프트를 세밀하게 이해하고 반영합니다. 이는 Sora가 다른 최신 LLM 모델과 연동되어 작동하기 때문으로, 프롬프트를 더욱 효과적으로 처리할 수 있는 점이 강점입니다.
그러나 특정 키워드나 표본 데이터가 부족한 경우에는 원하는 수준의 고퀄리티 영상을 생성하지 못하는 것으로 보입니다. 위에서 생성한 영상들 중 뉴욕 시내나 고양이와 같은 키워드는 매우 세부적이고 사실적으로 표현되었지만, "우주 공간"과 같은 키워드에서는 품질이 떨어지는 영상이 생성되었습니다.
추가 기능
Sora가 다른 영상 생성 AI와 차별화되는 점은 바로 제공되는 다양한 추가 기능에 있습니다. Sora를 통해 영상을 생성할 때, 단순히 장면을 만드는 것을 넘어 스토리 라인을 설정하거나, 생성된 영상을 기반으로 다시 재구성하는 기능, 특정 부분의 영상을 자연스럽게 영상 반복하는 기능도 활용할 수 있습니다.
1) View Story (스토리 라인 설정)
스토리 라인 설정 기능은 사용자가 원하는 스토리 전개를 텍스트로 입력하면, Sora가 이를 바탕으로 자연스러운 흐름을 가진 영상을 제작할 수 있도록 돕습니다.
View Story를 통해 오른쪽 이미지와 같은 화면으로 이동할 수 있습니다. 이 기능은 생성될 영상의 프롬프트와 스토리 전개의 순서를 시각적으로 보여줍니다. 좌측 하단에서는 스토리의 순서를 설정할 수 있으며, 상단에서는 각 부분에 대한 세부적인 상황을 설명할 수 있습니다.
이번에는 스토리 라인의 마지막에 "고양이가 점프한다"는 프롬프트를 추가하여 영상을 재생성해보겠습니다.
- 추가 prompt : The cat jumps high.
2) Remix (다시 재구성)
이 기능은 생성한 영상에서 수정하길 원하는 부분을 텍스트로 입력하면, Sora가 그 부분만을 적용해서 영상을 새롭게 생성해줍니다.
위 영상에서 인도 위의 택시가 오점인거 같아 인도 위 택시를 제거하도록 영상을 Remix 해보겠습니다.
- Remix prompt : 인도 위의 차량을 제거한다.
3) Loop (영상 반복)
이 기능은 영상의 특정 구간을 선택하여 시작과 끝이 자연스럽게 이어지도록 반복되는 영상으로 만들어 줍니다.
위 영상의 마지막 부분을 Loop 기능을 통해 생성해보겠습니다.
영상이 앞뒤로 최대한 자연스럽게 이어지도록 생성되었습니다. 2초 분량의 영상을 Loop 기능으로 연결하여 고양이 뒤 배경이 다소 부자연스러운 모습으로 포착되나, 고양이의 움직임은 매우 자연스럽게 표현되었습니다.
Sora는 굉장히 수준 높은 영상을 생성해줍니다. 실제 영상과 구분이 불가능할 정도로 사실적인 영상을 생성해서 굉장히 놀라웠습니다. 하지만 아쉬운 모습도 있었습니다. 일부 경우에는 영상 속 디테일이 부자연스럽거나 표현이 어색하게 생성되는 경우도 종종 나타났습니다. 이는 앞으로 업데이트를 통해 더욱 나아질 것으로 기대됩니다.
이제는 AI 하나로 영화를 제작하는 시대도 머지않아 보입니다. 누구나 아이디어만 가지고 있다면, 높은 수준의 영상을 제작하고 많은 사람들에게 공유할 수 있게 되었습니다. 만약 "이런 영화가 있다면 어떨까?"라는 생각을 해본 적이 있다면, Sora를 통해 직접 영상을 만들어보는 건 어떨까요?
감사합니다.
'AI 소식 > 유용한 AI 도구' 카테고리의 다른 글
[LLM AI] [이미지 생성 AI] 빅테크 기업 아마존에서 제공하는 AI, Nova를 소개합니다. (1) | 2024.12.18 |
---|---|
[오픈 소스 AI] [영상 생성 AI] 중국 텐센트 기업에서 공개한 비디오 생성 AI, Hunyuan Video를 소개합니다. (0) | 2024.12.16 |
구글이 출시한 음악 생성 AI 도구, MusicFX를 소개합니다. (0) | 2024.12.03 |
SK텔레콤(SKT)의 자체 개발 LLM 모델, "A.X (에이닷엑스)"를 소개합니다. (4) | 2024.11.10 |
AI가 검색을 바꾸다: Perplexity AI에 대해 소개합니다. (3) | 2024.10.29 |