Google は、プロンプトの代わりに画像を使用する Whisk で AI の提案を拡大し続けています

グーグル に基づいたツールの提案を開発および拡張し続けています。 生成人工知能 そして提示した 泡立てる、実験領域からの新たなイノベーション Google Labs。 これは、プロンプトやテキストによる指示の代わりに、他の画像から画像を生成できるソリューションです。

同社の説明によれば、Whisk は、他の画像をドラッグするだけで簡単にコンポジションを生成できるため、高速かつ創造的で楽しいプロセスによって差別化されています。画像を含めることができます。 主題、彼にもう一つ現場へ そしてもう一つは彼に スタイル。 これらを混合し、カスタマイズして独自の画像を作成できます。
ただし、テキストを使用して詳細を定義することもできます。

このシステムは、Google の人工知能モデルに基づいています。それで、 ジェミニ Whisk で作成された画像に詳細なタイトルを自動的に書き込み、そのタイトルを会社の最新の画像生成モデルに供給するために使用されます。 画像3。 Googleは、本質は捉えられているが、正確なレプリカではないため、後で画像を生成し続けることが容易になると指摘しています。

Googleは、Whiskはユーザーがアップロードした画像からいくつかの主要な特徴のみを抽出するため、結果が 期待とは異なります。これらの機能がプロジェクトにとって重要である場合もあれば、Whisk が最適ではない可能性があることも理解しています。そのため、基礎となるプロンプトをいつでも表示および編集できるようにしています。」とその技術を解説する。

Googleは声明の中で、次のことを強調したいと考えた。 泡立て器の差別化。彼は、アーティストやクリエイターとの最初のテストで、彼らは新しい開発を従来の画像エディターではなく、クリエイティブなツールとして説明したとコメントしています。 「これは、完璧な編集を目的としたものではなく、迅速な視覚的探索のために作成されました。これは、新しく創造的な方法でアイデアを探求することであり、数十のオプションを使用して、最も気に入ったものをダウンロードできるようになります。」と同社はコメントしている。

現時点では、Whisk は米国の Google Labs を通じてのみ利用可能です。