エージェントの管理には、雰囲気やフィーリングだけではない要件が必要

スポーツエージェントのジェリーがクライアントのロッドに何が必要かと尋ねるシーンは、90年代のヒット映画『ザ・エージェント』の象徴的なシーンです。ロッドは、ただ一つの言葉が聞きたいと答えます。音楽をかけながらロッドは「『俺のために大金を稼いでこい』だ、ジェリー!俺が要求するのはそれだけだ」と叫びます。ジェリーが「君のために大金を稼いでくる」と言うと、ロッドが「いや、『俺のために大金を稼いでこい』だ」と訂正します。
これが今回の教訓です。インセンティブが一致すれば、誰もが成功します。ハリウッド映画で描かれているように簡単にはいきませんが、不可能でもありません。
これからは誰もがエージェントを利用する
エージェント型AIの台頭により、エージェントの使用は選手や俳優だけのものではありません。私たちはすでにAIアシスタントを導入しているのです。ソフトウェア開発者はバイブコーディングを行い、自分のやりたいことのアイデアやフィーリングをアシスタントに説明して、アシスタントが代わりにコードを作成するようになりました。この用語は瞬く間に広まり、今年の3月には「バイブコーディング」がMeriam-Webster Dictionaryに掲載されました。このトレンドは、バイブマーケティングを採用するマーケター、バイブアナリティクスを使用するビジネスアナリスト、そしてAIを使用して日常タスクを迅速に実施するすべての人に浸透しています。
時間の経過とともに、こうしたAIアシスタントの多くはエージェント化し、作成するソフトウェアやキャンペーンの生成だけでなく、実行も担当するようになります。これらのAIエージェントにはタスクが割り当てられ、自律的に機能し、複雑なワークフローでコラボレーションできるように設計されています。最近の調査によると、大企業の10%が(何らかの形で)AIエージェントを現在使用しており、半数以上が1年以内に、82%が3年以内に使用する予定だと回答しています。企業の経営幹部は、この変化によってワークフローの自動化が71%増加し、カスタマーサービスが64%改善すると予測しています。つまり、大きな期待が寄せられているのです。
エージェントを提供する必要あり
私たちのAIアシスタントは、すでにその能力を証明しています。Snowflakeの2025年の調査では、アーリーアダプターに対して、生成AIは次のようなメリットをもたらすことが明らかになっています。92%が、生成AIプロジェクトですでにROIを達成していると回答しています。そして、バイブコーディング担当者に幸運な展開として、回答者の62%がコード品質の目に見える改善を報告し、56%がバグの検出解決が減少したと報告しています。また、アーリーアダプターは、AIによって生成され、パーソナライズされたオファーやレコメンデーションによって、顧客やオーディエンスのエンゲージメントが向上し(63%)、コンバージョン率とクリックスルー率が向上した(55%)と報告しています。これは、私たちのバイブマーケティングの担当者にとって朗報です。
しかし、AIエージェントはさらなる課題を提起するかもしれません。人間のようなAI行動がすべて望ましいわけではありません。ニュースでは、社会の基準から逸脱した、欺瞞的なAI行動のストーリーが数多く報道されています。たとえば、シミュレーション演習では、利益を最大化するように指示されたエージェント型ブローカーが、違法であることを知りながらインサイダー取引を行い、人間と同様にノルマが倫理に勝ることを実証しました。AIには、幼少期の電話ゲームのように、メッセージが送信を繰り返すことで劣化する、進歩的な認知的変化も見られます。期待した通りではありますが、意図は良くても悪い結果を生むこともあることを踏まえて、人間の知性を再現することが目的です。
こうした既知の行動リスクにもかかわらず、大企業の経営幹部の57%は、生産性がリスクを上回る可能性があると考えています。この新たな、そしておそらく予測不可能な「アシスタント」をどう管理するかを理解している自信があるようです。
プリンシパルが管理する必要あり
AIが業務にもたらす影響については、これまで多くの議論が交わされてきました。しかし、「AI自体が人間に取って代わるのではなく、AIを使用している人間や企業が取って代わるのだ」という意見もあります。たとえば、エージェント型アシスタントや労働力をより広範に活用し、管理する方法を知っている必要があります。エージェント時代のマネジメントに求められるのは、単なる雰囲気やフィーリングではありません。強力な「原則」が必要なのです。
エージェント時代のマネジメントに求められるのは、単なる雰囲気やフィーリングではありません。
長年にわたり、社会科学者はプリンシパルエージェント理論を通じてタスク委任を研究してきました。プリンシパルは、タスクをエージェントに委任します。しかし、情報の不統一、インセンティブの不整合、利益相反などにより、エージェントが本来の意図どおりに行動しない可能性があります。実践的な管理では、こうした連携の課題に対処します。幸いなことに、人間のエージェントを管理するベストプラクティスの多くはエージェント型AIにも適用でき、プロセスをガイドする新しいツールもいくつか提供されています。これらのベストプラクティスは、責任あるAIの実現に不可欠な要素です。
AIエージェントのマネージャーは、プリンシパルとしての役割を受け入れ、エージェント型AIを適宜採用し、管理する必要があります。マネージャーは次のようなタスクを実施する必要があります。
具体的な「職務内容」によって役割を定義する。顧客とのチャット、長文ドキュメントの解釈、データ分析、異常フラグ付け、コンテンツ作成、イベントトリガー、拡張チームとのコラボレーションなどを行っていますか?その役割にどの程度の自律性が求められますか?どの程度の「組織内でのランク」が与えられますか?
購入または構築する適切なAIモデルの「候補」を特定する。AIツールと生成AIツールでは、機能が異なります。Snowflake のAIオブザーバビリティは、人間の見込み客へのインタビューのように、代替LLMの評価から始めて、潜在的な適合性についての理解を深めます。
適切なトレーニングデータを使用してエージェントを「オンボーディング」する。要件が矛盾する場合は、厳密な優先順位付けなど、モデルに固有の機能を実行できるように準備します。Snowflakeでは、データアクセスと共有が容易になるため、トレーニングに使用できるデータアセットの範囲が広がります。RAGアーキテクチャは、エージェントがコンテキストデータに常にアクセスできるようにします。
アウトプットと成果のパフォーマンスメトリクスを確立する。「業務」を定義したら、その業務の適切な結果はどのようなもので、それをどのように測定するかを定義します。SnowflakeのAIオブザーバビリティにより、エージェントを判断する具体的なメトリクスを含む評価フレームワークを設定できます。たとえば、RAGエージェントの評価メトリクスには、一貫性、取得されたコンテンツのコンテキスト関連性、ソースのグラウンディング、回答の関連性などがあります。
パフォーマンスの監視、緩和戦略の策定、ルールの適用が可能になります。定められた基準、期待、倫理規範に照らしてパフォーマンスを継続的に評価し、異常を特定して修正します。トレーニングデータの拡張など、信頼性のしきい値と緩和戦略を確立します。
エージェントが自分自身とアシスタントを監視するよう指示し、権限を付与する。AIエージェント自体をガバナンスに含めることができます。構成的フィードバックループにより、エージェントは作業を見直し、改良できます。AIエージェントは、独学で問題を解決するか、必要に応じてエージェント型または人間型の上司にエスカレーションします。
(人間の)経営科学は1世紀以上も前から存在しており、私たちの助けにはなりますが、新しいエージェント型の世界に合わせてスキルを更新する時期に来ているでしょう。生成AI入門ガイドでエージェント管理スキルをレベルアップしてから、Snowflakeデータクラウドアカデミーの生成AI&MLスクールでハンズオントレーニングを受けましょう。
ジェリーのようにプロスポーツの世界でエージェントの採用を考えている方は、SnowflakeのGame ChangerHow Gen AI is Revolutionizing SportsのeBookをダウンロードしてご覧ください。