Anthropicは、実際に機能するAIアプリを構築するための秘密を明らかにしました。
ソロAIエージェント: 20分、$9 - 壊れた結果。3エージェントハーネス: 6時間、$200 - 完全に機能するアプリ
そのアーキテクチャは?GANからインスパイアを受けています:
- ジェネレーターが作成
- 評価者が評価 (異なるエージェント)
- 品質基準が満たされるまで反復します
なぜエージェントを分けるのか?AIは自分の仕事を正直に評価できないからです。平均的な出力を称賛します。毎回です
デザインの洞察は驚くべきもので、クロードはデフォルトで技術的には正しいが視覚的に死んだインターフェースを作成します。彼らはそれを「AIスロップ」と呼んでいます。修正は?プロンプト内の「博物館品質」のような特定の言語が全体の美学をシフトさせます
しかし、評価者の「味」は人間が選んだ例に対するパターンマッチングに過ぎません。それは底を大きく引き上げますが、天井を引き上げることはありません
主なポイント: AI開発の未来は、すべてを行う1つのエージェントではありません。最適化ターゲットが分離された専門エージェントです
ジェネレーターは「完了」を最適化します
評価者は「良好に完了」を最適化します
その分離がすべてです
#Aİ #Claude #SoftwareEngineering #AIDesign #BuildInPublic