Informations sur la communauté et sentiment du marché #aidesign

Anthropic vient de révéler leur secret pour créer des applications IA qui fonctionnent réellement.

Agent IA solo : 20 min, 9 $ - résultat défectueux. Harnais de 3 agents : 6 heures, 200 $ - application pleinement fonctionnelle

L'architecture ? Inspirée par les GAN :
- Le générateur crée
- L'évaluateur juge (un agent DIFFÉRENT)
- Ils itèrent jusqu'à ce que les critères de qualité soient atteints

Pourquoi des agents séparés ? Parce que l'IA ne peut pas évaluer honnêtement son propre travail. Elle loue des résultats médiocres. Chaque fois

L'insight de conception est fou - Claude crée par défaut des interfaces techniquement correctes mais visuellement mortes. Ils appellent cela "le gâchis de l'IA". La solution ? Un langage spécifique comme "qualité musée" dans les invites change toute l'esthétique

Mais le "goût" de l'évaluateur n'est que la correspondance de modèles par rapport à des exemples choisis par des humains. Cela élève considérablement le niveau, mais ne relève pas le plafond

Le point clé : l'avenir du développement de l'IA n'est pas un agent faisant tout. Ce sont des agents spécialisés avec des cibles d'optimisation séparées

Le générateur s'optimise pour "fait
"L'évaluateur s'optimise pour "fait BIEN"

Cette séparation est tout

#Aİ #Claude #SoftwareEngineering #AIDesign #BuildInPublic

aidesign

Sujets d’actualité