エージェントは画面ではなくアプリを操作すべき
今日のエージェントは、画面スクレイピング(脆弱で OS が見えない)か、不透明な CLI への丸投げのどちらかです。第三の道があります。アプリ自身が何ができるかを宣言し、エージェントが一つのオープンなプロトコルを通じて、透明にそれを操作するのです。
透明なエージェントとアプリの制御に関する App Use チームからの記事です。プロトコルの背後にある考え方、なぜ監査と人間の同意が重要なのか、そして自分のアプリをエージェント対応にするための実践的なガイドをお届けします。Atom で購読する。
今日のエージェントは、画面スクレイピング(脆弱で OS が見えない)か、不透明な CLI への丸投げのどちらかです。第三の道があります。アプリ自身が何ができるかを宣言し、エージェントが一つのオープンなプロトコルを通じて、透明にそれを操作するのです。
エージェントがあなたのソフトウェア内で操作するとき、「信じてくれ」では答えになりません。App Use はすべての操作を可観測にし、改ざん検知が可能なチェーンに記録し、危険なステップは人間の承認のために停止します。
実践的なウォークスルー:画面と要素を宣言し、一つのインターフェースを実装し、ホストすれば、SDK がトランスポート・同意・監査を担う中で、エージェントがあなたのアプリを説明し操作する様子を見られます。
記事は随時追加されます。代わりに実際の活用レポートを寄稿しませんか?フィールドノートをご覧ください。
エージェントとアプリの制御、プロトコル、導入について書いてほしい観点があれば、お知らせください。