Anthropic vient de révéler leur secret pour créer des applications IA qui fonctionnent réellement.
Agent IA solo : 20 min, 9 $ - résultat défectueux. Harnais de 3 agents : 6 heures, 200 $ - application pleinement fonctionnelle
L'architecture ? Inspirée par les GAN :
- Le générateur crée
- L'évaluateur juge (un agent DIFFÉRENT)
- Ils itèrent jusqu'à ce que les critères de qualité soient atteints
Pourquoi des agents séparés ? Parce que l'IA ne peut pas évaluer honnêtement son propre travail. Elle loue des résultats médiocres. Chaque fois
L'insight de conception est fou - Claude crée par défaut des interfaces techniquement correctes mais visuellement mortes. Ils appellent cela "le gâchis de l'IA". La solution ? Un langage spécifique comme "qualité musée" dans les invites change toute l'esthétique
Mais le "goût" de l'évaluateur n'est que la correspondance de modèles par rapport à des exemples choisis par des humains. Cela élève considérablement le niveau, mais ne relève pas le plafond
Le point clé : l'avenir du développement de l'IA n'est pas un agent faisant tout. Ce sont des agents spécialisés avec des cibles d'optimisation séparées
Le générateur s'optimise pour "fait
"L'évaluateur s'optimise pour "fait BIEN"
Cette séparation est tout
#Aİ #Claude #SoftwareEngineering #AIDesign #BuildInPublic