Anthropic ha appena rivelato il loro segreto per costruire app AI che funzionano davvero.
Agente AI solo: 20 min, $9 - risultato rotto.3-agente harness: 6 ore, $200 - app completamente funzionale
L'architettura? Ispirata dai GAN:
- Il Generatore crea
- L'Evaluatore giudica (un AGENTE DIVERSO)
- Iterano fino a quando i criteri di qualità non sono soddisfatti
Perché agenti separati? Perché l'AI non può valutare onestamente il proprio lavoro. Elogia output mediocre. Ogni volta
L'intuizione di design è folle - Claude crea interfacce tecnicamente corrette ma visivamente morte per impostazione predefinita. Lo chiamano "AI slop." La soluzione? Linguaggio specifico come "qualità museo" nei prompt sposta l'intera estetica
Ma il "gusto" dell'Evaluatore è solo un abbinamento di modelli rispetto a esempi scelti dagli esseri umani. Aumenta enormemente il pavimento, ma non alza il soffitto
Punto chiave: il futuro dello sviluppo dell'AI non è un agente che fa tutto. Sono agenti specializzati con obiettivi di ottimizzazione separati
Il Generatore ottimizza per "fatto
"L'Evaluatore ottimizza per "fatto BENE"
Quella separazione è tutto
#Aİ #Claude #SoftwareEngineering #AIDesign #BuildInPublic