エージェントを特別なものにするものは何ですか?

標準的なAIからAIエージェントへのジャンプは、半自律的に機能するための4つの主要な柱を含みます:

知覚:テキストプロンプト、アップロードしたファイル、またはウェブからのライブデータなどのデータを「読み取る」ことで、環境を理解します。

推論と計画:次の単語を予測するだけでなく、複雑な目標(例:「この会社を調査し、要約を書く」)をより小さく論理的なステップに分解します。

ツールの使用:これがゲームチェンジャーです。エージェントは、ウェブブラウザ、計算機、コード実行者、または外部ソフトウェア(SlackやJiraなど)へのAPI接続のような「ツール」を使用できます。

記憶:彼らは、最終的な出力が元の目標に一致することを確実にするために、マルチステージプロセスの前のステップを記憶できます。