Openai 提示しました ソラ2、人工知能を備えたビデオ生成モデルの改善されたバージョン。同社はツールの新しい機能に取り組んでいます。このツールには、オーディオやより現実的で正確なビデオが含まれていること、およびソーシャルメディアアプリケーションを実現し、合成ソーシャルネットワークの時代を開設する新しいエクスペリエンスに取り組んでいます。
SORAの元のモデルは2024年2月に発表され、昨年12月に正式に発売され、最初のバージョンでは、制限にもかかわらず市場に感銘を受けました。現在、モデルは提供する訓練を受けています 現実の世界に似た作品。 同社は、SORA 2がGPT-3.5がチャットボットに想定しているものの生成である可能性があると考えています。
これはOpenaiから説明されています:「SORA 2は、以前のビデオ生成モデルでは非常に困難なことを行うことができます。「彼らは声明でコメントします。」以前のビデオモデルは楽観的すぎます。オブジェクトを変換し、現実を変形させてテキスト命令を正常に実行します。まだ不完全ですが、以前のシステムと比較して物理法則に従う方が良い」
例で説明します。ソラを使用すると、バスケットボール選手がショットに失敗するビデオが作成された場合、ボールはフープに自発的にテレポートできます。代わりに、ソラ2では、バスケットボール選手がショットに失敗した場合、ボードで跳ね返ります。この意味で、同社は、すべてのシミュレーターに有用な能力を完成させたことを示しています。
ソラの新しいバージョンはビデオを提供するだけでなく、洗練されたものを作成できるようになりました 背景の音の風景、対話、効果音 高度なリアリズムで。さらに、許可します 現実の世界の要素を統合しますL、動物、オブジェクト、さらには人など、外観と声の正確な表現でシミュレーションを達成するため。
ディープフェイクのソーシャルネットワーク
会社は、ソラ2のプレゼンテーションに伴います 新しいソーシャルアプリケーション、 「SORA」と呼ばれ、米国とカナダで招待されているiOSシステムで利用できます。それを使用すると、ユーザーはカスタマイズ可能なフィードで新しいビデオを作成したり、発見したり、ビデオに自分自身や友人を含めることができます。 Openaiは、ユーザーがどんなソラシーンにも直接表示できると説明しています。 カメオ、 「アプリで簡単なビデオとオーディオ録音の後、アイデンティティを確認し、画像をキャプチャします」
アプリケーション 彼はティクトクに似ています、Apple Storeで見ることができるように。 「For You」ページと、垂直変位を備えたインターフェイスがあります。 「Cameos」と呼ばれる関数が含まれています。これにより、ユーザーはアプリに許可を与えて、画像でビデオを生成できます。また、テキスト命令で目的のビデオとオーディオを説明する画像(他の人の画像と対話する場合でも)を覚えておくことができます。
これはすべて、新しいシナリオを提起します シミュレーションとディープフェイクの生成。 しかし、Openaiは、エンターテイメントと創造性の観点からそれを提示します。 「私たちは、人々が私たちが構築しているモデルをとても楽しくすることができると信じています」、彼らは声明の中で言います。」私たちは数ヶ月前にソラのチームでこの「オーバー」機能を経験し始めましたが、私たちは皆、とても楽しかったです。それはコミュニケーションの自然な進化のようでした:テキストメッセージから絵文字、音声ノート、そしてこれまで「
回避するために開発されました DOUMSCROLLING
Openaiは、のリスクに応じてアプリケーションを開発したことを保証します DOUMSCROLLING、中毒、または隔離。この点で、彼はユーザーがフィードに表示されるものを制御するためのツールとオプションを提供し、それが定期的にユーザーの井戸について調査することを指摘しています。
また、デフォルトでは、フォローされている人や相互作用する人々に対する強いバイアスを持つコンテンツを表示し、モデルがユーザーが自分の作品のインスピレーションとして使用する可能性が高いとモデルが考慮しているビデオを示していることを説明しています。 「私たちはあなたがフィードに費やす時間を最適化しません、そして、私たちは消費ではなく作成を最大化するためにアプリケーションを明示的に設計します」、彼らはOpenaiから言います。
一方、彼は、世代の数の所定の限界を確立していると言います ティーンエイジャー 1日にフィードを見ることができ、カメオのより厳格な権限を実装できます。また、人間のモデレーターチームを拡大して、彼らが発生した場合に嫌がらせのケースを迅速に確認し、親のコントロールを確立していると主張しています。
カメオに関して、Openaiはユーザーが持っていると指摘しています 画像の完全な制御。 この意味で、ユーザーのみが誰がカメオを使用できるかを決定し、アクセスを取り消すか、いつでもそれを含むビデオを排除することができます。また、他の人によって作成されたドラフトを含むカメオを含むビデオをいつでも見ることができます。
さらに、それに応じて バージ、SORAで作成された各ビデオには、 AIによって生成されることを示します、 メタデータまたは透かしとして。同社はまた、特定のビデオまたはオーディオがSORAで作成されたかどうかを評価するのに役立つ内部検出ツールがあると述べています。アプリケーションでは、画面記録も許可されていません。
ディープフェイクに関して、前述の媒体によって報告されているように、オープンは説明しています。 公人のイメージを生成することはできません 彼らがカメオをアップロードし、彼らの使用に同意を与えない限り、ソラで。また、プラットフォームを介して大人向けのコンテンツや「極端」を生成することもできません。
ただし、SORA 2によって達成された精度と洗練度は、現実のものとそうでないものを区別することの難しさを高め、Openaiのソーシャルメディアの分野への侵入はAllanaへの道を侵入します。 合成現実。それにもかかわらず、同社はその提案が既存のものを改善すると考えています。 「これは、協力的な経験のためのまったく新しい時代の始まりと考えています。私たちは楽観的であり、これは現在利用可能なものと比較して、エンターテイメントと創造性のためのより健康的なプラットフォームになると信じています」彼らはコメントします。
彼らはまた1つを予測します 創造性と文化的発展の新しい時代。 「一般的な世界目的のシミュレータとロボットエージェントは、社会を根本的に変え、人間の進歩を加速します。 SORA 2は、その目標に向けた大きな進歩を表しています」、彼らは会社から指摘している。」私たちは、ソラが世界に多くの喜び、創造性、つながりをもたらすと信じています」