Anthropic tocmai a dezvăluit secretul lor pentru construirea aplicațiilor AI care funcționează cu adevărat.
Agentul AI Solo: 20 min, 9 $ - rezultat rupt. 3-agent harness: 6 ore, 200 $ - aplicație complet funcțională
Arhitectura? Inspirată de GAN-uri:
- Generatorul crează
- Evaluatorul judecă (un agent DIFERIT)
- Ei iterează până când criteriile de calitate sunt îndeplinite
De ce agenți separați? Pentru că AI nu poate evalua onest propria muncă. Laudează rezultatul mediocru. De fiecare dată
Perspectiva de design este sălbatică - Claude face interfețe tehnic corecte, dar vizual moarte, în mod implicit. Ei o numesc "AI slop." Soluția? Limbaj specific precum "calitate de muzeu" în prompturi schimbă întreaga estetică
Dar "gustul" Evaluatorului este doar o potrivire de tipare față de exemple alese de oameni. Ridică minimul masiv, dar nu ridică maximul
Cea mai importantă concluzie: viitorul dezvoltării AI nu este un agent care face totul. Este agenți specializați cu obiective de optimizare separate
Generatorul optimizează pentru "finalizat
"Evaluatorul optimizează pentru "finalizat BINE"
Acea separare este totul
#Aİ #Claude #SoftwareEngineering #AIDesign #BuildInPublic