Openaiは、テーブルの購入や予約などのタスクを自動化するAIエージェントであるオペレーターを提示します

今年の初めに、2025年の反省で、のSam Altman、CEOのCEO Openai、 彼は、人工知能エージェントが短期的に労働力に追加され、企業のパフォーマンスを大幅に変えることを指摘しました。現在、会社は提示しています オペレーター、 インターネットブラウザを使用し、ユーザーのタスクを実行する能力を備えた最初のエージェント開発。

現時点でのオペレーターは利用可能です 米国のプロユーザー そして、それは会社が指摘しているように、実験または研究の以前の見解です。これは、それが制限を提示することを前提としており、OpenAIがユーザーから収集するフィードバックに従って進化します。

新しいツールには、の開発における会社の最初の素晴らしい試みが含まれます 人工知能エージェント、ユーザー向けのタスクを独立して実行できます。彼らが会社から指摘しているように、彼がそれを実行するためにオペレーターにタスクを割り当てるだけで十分でしょう。

オペレーター:毎日のタスクの支援

ユーザーは、旅行の宿泊施設を探したり、レストランでテーブルを予約したり、購入したりするなど、ブラウザで実行するための一連のアクションをエージェントに尋ねることができます。 毎日のタスクで時間を節約できます。 さらに、購入、配達、夕食、旅行など、ユーザーが選択できるタスクには、さまざまな種類の自動化を可能にするタスクには、いくつかのカテゴリがあります。

ユーザーは、オペレーターにしたいタスクの指示を導入する必要があり、これにはそれが必要です。ただし、ユーザーはいつでもアクションを制御でき、オペレーターは 介入を要求するように訓練されています ユーザーの 必要に応じて、支払いを行うためのセッションまたは情報として。
さらに、課題を見つけたりエラーを犯したりすると、オペレーターは自己排除できます。ブロックして助けが必要な場合は、単にコントロールをユーザーに返します。これにより、流動的で共同体験が保証されます。

Openaiが説明するように、ユーザーはできます ワークフローをカスタマイズします Booking.comで検索設定の構成など、パーソナライズされた指示を追加するオペレーターで。また、ホームページにクイックアクセスを保存することもできます。これは、Instacartの食品の補充などの繰り返しタスクに最適です。また、ブラウザ内の複数のタブで起こるように、ユーザーはオペレーターを作ることができます さまざまなタスクを同時に実行します さまざまな会話を作成します。

同社は、オペレーターがaと連携していることを示しています コンピューター使用エージェント(CUA)と呼ばれる新しい人工知能モデル。 GPT-4Oのビジョン機能と高度な推論を組み合わせているため、グラフィックユーザーインターフェイス(GUI)、ボタン、メニュー、および人々が通常画面に表示されるような形式のテキストフィールドと対話するように訓練されています。
この意味で、オペレーターはスクリーンショットを介して「見る」ことができ、マウスとキーボードを許可するすべてのアクションを使用してブラウザと「対話」できます。

オペレーター⁠パッシブツールのAIをデジタルエコシステムのアクティブな参加者に変換します」、Openaiから説明してください。 「それはユーザーのタスクをスピードアップし、革新的なクライアントエクスペリエンスとより大きな変換率を希望する企業にエージェントの利点をもたらします

オペレーターのセキュリティと制限

会社は、それが Dororash、インスタント、オープン可能、プライスライン、StubHub、Thumbtack、Uber、 プラットフォームとサービスを統合し、エージェントがユーザーの安全性とプライバシーを尊重する現実世界のニーズ、およびこれらのブランドのポリシー、利用規約、および経験を確保することを確認します。

セキュリティの観点から、Openaiは、オペレーターがユーザーが重要なポイントで制御するように設計されていると説明しています。 重要なタスクを完了する前に、確認を要求します 機密タスクを拒否します。さらに、ユーザーはオペレーターのトレーニングから自発的に除外し、ナビゲーションデータを排除できます。彼はまた、サイトが疑わしいと思われる場合、タスクを一時停止するように訓練されています 有害な要求を拒否します ブロックコンテンツは許可されていません。

Openaiから、彼らはすでにそのオペレーターに警告しています 制限を見つけます 特にスライドプレゼンテーションの作成やカレンダーの管理など、複雑なインターフェイスを使用して、特定のタスクを実行する際に。したがって、彼は、研究テスト段階でユーザーのコメントの助けを借りてこれらの制限を解決できることを望んでいます。

ただし、Openaiは、人工知能エージェントを市場に提示した最初の会社ではありません。昨年末に GoogleはProject Marineを発表しましたR.、彼自身のエージェント、彼のジェミニモデルスイートに裏付けられたR.は、Webでアクションを実行する機能を備えています。そしてその前に、 人類はクロードの新しいバージョンを提示しました、 また、コンピューターと対話する機能もあります。