AIエージェントによる業務自動化の新たな展開
最近、アカウント発行・変更の自動化セミナーを開催しました。弊社の製品やPythonプログラムによって作成コマンドの自動投入やブラウザ画面の自動操作について解説したわけですが、このような方法論は近い将来、大きく変わるのではと考えています。最近はAIエージェントの展開が活発になっているためです。
「AIエージェント」という用語の厳密な定義は無いものの、従来の自動化ツールを超えた柔軟性と自律性を持ち、IT業界における業務効率化の重要な役割を果たすことが期待されています。
最近、話題になったのはOpenAI社の”Operator”や中国の”Manus”などが挙げられます。 OpenAI Operatorは、GPTベースのAIエージェントで、ウェブブラウザを人間のように操作し、外部APIやプログラムを実行することができます。Computer-Using Agent(CUA)モデルを採用しており、視覚情報を解析しながらマウスやキーボード操作を行います。
Manusは、中国発のAIエージェントで、”Operator”と同様に複雑なタスクを自律的に計画・実行する能力を持っています。 Manusのコンセプトをまねたオープンソース版として「Open Manus」も公開され、この界隈の競争が激化していることがうかがえます。
https://github.com/mannaandpoem/OpenManus
これまでのAIの主流であったLLMは主にテキスト生成に特化していますが、AIエージェントは「推論 → 行動 → 観察」のサイクルを通じて指定されたタスクを完了します。学習済の内容からテキストを生成するだけでなく、必要に応じて外部ツールやAPIを実行することができます。
「AIエージェント」の今後の発展のコンセプトもいくつか提示されています。2つほどご紹介します。
マルチエージェントシステム(MAS):異なる役割を持つ複数の専門AIエージェントが協力してタスクを処理する仕組みです。このアプローチにより、複雑な業務を効率的に自動化することが可能になります。各エージェントが専門性を持つことで、全体的なタスクの品質が向上します。
アンビエントエージェント:アンビエント=環境からシグナルを自動で取得し、人間の指示なしで行動する次世代型のAIエージェントです。例えば、メールの受信から記載の依頼内容を自動で処理するなど、人間の介入を最小限に抑えることで業務効率を大幅に向上させることが期待されます
いわゆる「AI活用」のPoCなども、RAGによるコンテキスト情報の取り込みや、ファインチューニングなどが話題になっていましたが、すでに次の段階に移りつつあると思います。RPAなどのルールベースでの自動化実装も今後大きくトレンドが変わっていくことでしょう。 これらの技術が進化することで、業務自動化はさらに高度化し、企業の競争力を向上させる基盤となることが期待されます。