
Image generated with OpenAI
意見:なぜAIエージェントが日常のAIの未来なのか
2025年はエージェント型AIの年と言われています。OpenAI、Microsoft、Anthropicなどの大手テクノロジー企業がこれまでにない最先端のAIモデルを発表し、昨年までは不可能だった複雑なタスクをこなすことが可能になりました。しかし、AIエージェントとは具体的に何なのでしょうか?そして、この技術は現実的なものとハイプのどちらなのでしょうか?
近年のAIのトレンドについていくのは疲れることがあります。基本的なAIから生成型AI、推論型AIへと進化し、そして今や、AIエージェントが話題を席巻しています。過去数ヶ月間に、複数のテクノロジー企業が新たなAIエージェントを導入し、それらを連結するワークフローがますます魅力的になっていることを強調しています。
1月には、OpenAIが初のAIエージェントであるOperatorを発表しました。これは、ウェブの閲覧、レストランの予約、あなたの好みや基準に基づいてコンサートチケットを確保するなど、自動的にタスクを実行する能力を持っています。
その2ヶ月後、中国のAIスタートアップ、ZhipuはAutoGLM Ruminationという無料のAIエージェントをリリースしました。これは、ユーザーの旅行を計画するために独立して作動することができます。そして、つい数日前には、MicrosoftがCopilot Studioに向けた「Computer Use」を導入し、AIエージェントに更なる自律性を追加しました。これには、ユーザーのデスクトップを制御する能力も含まれています。
しかし、このトレンドは企業がクールな新製品を発売するだけでなく、AIの様々な形態と人間とのインタラクションを組み合わせた、複雑で進化し続ける分野についてのものです。テクノロジー愛好家や専門家たちは、エージェンティックAIに強い楽観的な見方を示しています。
「AIエージェントのワークフローにも私はとても興奮しています」と、AI専門家でCourseraとDeepLearningの共同創設者のアンドリュー・ング氏が去年11月のスノーフレイクのBUILD 2024カンファレンスで発言しました。「もし、最も注目すべきAI技術は何かと問われれば、私はそれはエージェンティックAIだと答えるでしょう。」
それでは、AIエージェントとは具体的に何なのでしょうか?専門家たちが主張するように、彼らは本当に優れたパフォーマンスを発揮するのでしょうか?ここでは、この新興技術の最も重要な側面と最新の開発について簡単に概説します。
AIエージェントとは何か?
OpenAIやMicrosoftなどの企業が示しているように、AIエージェントとは、自律的に様々なアプリケーションやソフトウェアを組み合わせて複雑なタスクを実行する能力を持つ技術です。
基本的に、彼らは「伝統的な」AIチャットボットですが、より高度に進化しており、過去2年間に慣れ親しんだものを超えたタスクをこなすことができます。これには、計画作成、ウェブの閲覧、あなたの興味を覚えておくこと、さらには段階的な指導なしにあなたの食料品の買い物までを行うことが含まれます。彼らは自分自身で物事を把握します。
Google CloudはAIエージェントを「ユーザーの代わりに目標を追求し、タスクを完了するためのAIを使用したソフトウェアシステム」と定義しています。
これらのAIモデルが本当に特別なのは、高度な推理能力によって、オーディオ、テキスト、ビデオ、コード、画像といった複数の情報を同時に処理できることです。彼らは人間が行うように複雑な状況を理解し、行動を起こし、ソフトウェアやプラットフォームと対話することができます。
多くのテック企業が現在、AIモデルをこの次のレベルに押し上げています。
数日前、OpenAIはAIモデルo3とo4-miniが画像を“思考”することができ、それを操作することができると発表しました―例えば、画像のトリミングや変形を行うことができます。一方、Microsoftの新機能「Computer Use」は、AIエージェントがグラフィカルユーザーインターフェースを認識することを可能にします。
「人がアプリを使えるなら、エージェントも使えます」と、Microsoftのビジネス&インダストリーコパイロット部門の副社長であるチャールズ・ラマナ氏は発表の中で述べました。
次なるステップ:エージェンティックAIテクノロジー
多くのテック企業が超スマートなAIチャットボットを開発している一方で、エージェンティックAIはさらに一歩進んでいます。この技術は、複数のAIエージェントが互いに交流し、異なるタスクを実行するシステムを構築することに焦点を当てており、より正確で完全な結果を提供します。
最近参加したeDreamsが主催するTech Talkイベントでの「AIエージェントの力」についての彼女の講演で、AI専門家のパトリシア・グティエレス・ファクサスは、これらのシステムはさまざまな構造を取ることができると説明しました。マルチエージェントシステムは、複雑なタスクをより単純なものに分割し、それらを専門のエージェントに割り当て、さまざまなタイプのネットワークを形成することができます。
AIエージェントは、「スーパーバイザー」の役割を担い、より専門的な他のエージェントに小さなタスクを委託することができます。また、複数のエージェントがそれぞれ別のタスクに同時に取り組み、最終的な成果物を提供するために調整することも可能です。これらのシステムの利点には、精度の向上、プライバシーの強化、エラーの減少があります。
アンドリュー・ング氏もこのアプローチに同意しています。BUILD 2024での彼の講演では、複雑なタスクをより良い結果で処理するためのエージェンティックAIワークフローの重要性を強調しました。GPT-3.5からGPT-4へのパフォーマンスの飛躍、そしてコーディングベンチマークでの強力な結果は、大部分がエージェンティックワークフローとエージェンティックリーズニングによるものです。
AIエージェントは私たちの生活にどのような影響を与えるのでしょうか?
テクノロジー企業は、エージェント型AIに対して様々なアプローチを取っています。OpenAIは日常的なユーザー向けのアイデアに注力しています。Operatorをローンチする際、チームはビデオで説明していますが、人々は単に作りたい料理を思いつくだけで、ChatGPTに最高のレシピを見つけるよう依頼し、さらには必要な食材をオンラインスーパーマーケットから購入することさえできます。
AIモデルは、ユーザーのクレジットカードを使って購入を完了するなどの重要なタスクを実行する前に、フォローアップの質問をしたり、一時停止することができます。ユーザーは支出限度額を設定したり、何かを買う前にアシスタントに確認を求めるように設定することができます。
普通の人々がAIエージェントをどのように利用できるかの可能性は無限大ですが、これまでに最も人気のある使用例は、旅行代理店、個人ショッパー、そして秘書業務のようなものです。何故なら、誰もがメールを送信し、重要な誕生日を覚えておく、税金の手続きをしてくれるようなパーソナライズされたテクノロジーを望むはずだからです。
マイクロソフトはより企業向けの手法を取っています。同社は、マーケティングエージェンシーがAIエージェントを使って市場データの収集を自動化し、洞察に基づいた分析を生成する方法、または大企業がシステム内での請求書処理にそれらを使用する方法を示しています。
しかし、これらのユースケースすべてが革命的に聞こえる一方で、専門家たちはまだ長い道のりが待っていると一致しています。多くの人々はまだAIエージェントを使って日常生活を改善することができません。なぜなら、Operatorのような多くの機能は、月額200ドルのProユーザー専用でしか利用できないからです。
では、エージェンティックAIはそのハイプに見合っているのでしょうか?
数々のメディアの見出しは、Agentic AIによって引き起こされる新たなAI革命を約束しています。業界では確かに大いに期待が寄せられており、現実もそれに遠くないかもしれません。IBMが公開した最近のレポートによれば、多くの開発者が積極的にこの技術を探求し、開発していることが明らかにされました。
「IBMとMorning Consultは、エンタープライズ向けのAIアプリケーションを開発している1000人の開発者を対象に調査を行い、そのうちの99%がAIエージェントの探求または開発を行っていると述べました」と、IBM watsonx.aiの製品管理部門のディレクターであるPhDのMaryam Ashoori氏は説明しています。「ですから、答えは2025年がエージェントの年になるということです。」
しかし、専門家たちはAIエージェントが本当に何であり、どのように機能すべきかについては、複数の解釈があると指摘しています。結果として、現在のAIエージェントの進展と性能は、技術を評価する人の視点と基準によってしばしば左右されます。
確かなことは、多くの専門家や意思決定者がこの技術を深く信じており、その開発に大きな投資をしているということです。最近の研究では、ITリーダーの84%が人間と同じくらいAIエージェントを信頼していることが明らかになりました。また、OpenAIは2029年までに約1250億ドルの収益を見込んでいます。
Agentic AIテクノロジーはまだ完全に開発されておらず、その採用は主に高コストが原因でチャットボットほど広く普及していませんが、このトレンドに対する圧倒的な楽観主義と熱意は、今後数ヶ月間で大きな変化を引き起こすのに十分な力を持っていることは明らかです。