OpenAI、ついに動画生成AI「Sora」を発表

OpenAI、テキストから最長1分の動画生成するAIモデル「Sora」を発表

OpenAIは、テキストから最長1分の動画を生成できるAIモデル「Sora」を発表しました。

このAIニュースのポイント

  • OpenAI、動画生成AI「Sora」を発表。テキストから最長1分の動画生成を実現
  • 複雑なシーンを再現し、現実的で想像力豊かな映像を生成可能に
  • 現行モデルには弱点があるとし、一般公開されていない。安全措置を講じる予定

米OpenAIは2月15日、テキストプロンプトから最長1分の動画生成を可能にするAIモデル「Sora」を発表しました。現時点では一般公開はせず、ビジュアルアーティストやデザイナー、映画製作者など一部ユーザーからのフィードバックに基づいて改良を進めていく予定です。

Soraは、テキストの指示に基づいて現実的で想像力豊かな映像を生成することができます。複数のキャラクターの生成や、特定のモーションなどを含む複雑なシーンの生成が可能で、動画の内容に関する指示だけでなく、物理法則に基づいた世界観や、生き生きとした感情表現も再現します。

現在、「Sora」が生成した多数のサンプル動画が公開されており、どのようなプロンプトで生成されたか記載されています。

例えば、「20 代の若い男性が空の雲の上に座って本を読んでいます」といったものや「美しい雪の東京の街は賑わっています。カメラはにぎやかな街路を移動し、美しい雪の天気を楽しんだり、近くの屋台で買い物をしたりする数人の人々を追っています。華やかな桜の花びらが雪の結晶とともに風に乗って舞います」などの複雑な内容も再現されています。

一方、現段階では複雑なシーンの物理シミュレーションに課題があり、例えば人物が食べ物をかじっても跡が残らないなどの不自然な部分も見られます。

こうした課題に加え、誤情報や悪意のあるコンテンツの拡散を防ぐための「重要な安全措置」を講じる必要があるとして、現時点では一般公開を見送っています。今後はレッドチームと呼ばれる専門家チームと協力して安全装置を模索し、動画がSoraによって生成されたことを検出できる分類子などツールも開発予定です。

OpenAIは「Soraは、人工知能の究極的な目標であるAGIを達成するための重要なマイルストーンになると考えています」とコメントしています。

PDF50枚以上の「すぐに使えるChatGPT活用ノウハウ3点セット」を無料で配布しています!
ChatGPTの利用面でのリスクや、便利なプロンプトテンプレートなど、様々な特典があるのでぜひダウンロードしてご活用ください!

出典:Open AI