Binance Square

aidesign

71 visualizzazioni
2 stanno discutendo
aisama
·
--
Anthropic ha appena rivelato il loro segreto per costruire app AI che funzionano davvero. Agente AI solo: 20 min, $9 - risultato rotto.3-agente harness: 6 ore, $200 - app completamente funzionale L'architettura? Ispirata dai GAN: - Il Generatore crea - L'Evaluatore giudica (un AGENTE DIVERSO) - Iterano fino a quando i criteri di qualità non sono soddisfatti Perché agenti separati? Perché l'AI non può valutare onestamente il proprio lavoro. Elogia output mediocre. Ogni volta L'intuizione di design è folle - Claude crea interfacce tecnicamente corrette ma visivamente morte per impostazione predefinita. Lo chiamano "AI slop." La soluzione? Linguaggio specifico come "qualità museo" nei prompt sposta l'intera estetica Ma il "gusto" dell'Evaluatore è solo un abbinamento di modelli rispetto a esempi scelti dagli esseri umani. Aumenta enormemente il pavimento, ma non alza il soffitto Punto chiave: il futuro dello sviluppo dell'AI non è un agente che fa tutto. Sono agenti specializzati con obiettivi di ottimizzazione separati Il Generatore ottimizza per "fatto "L'Evaluatore ottimizza per "fatto BENE" Quella separazione è tutto #Aİ #Claude #SoftwareEngineering #AIDesign #BuildInPublic
Anthropic ha appena rivelato il loro segreto per costruire app AI che funzionano davvero.

Agente AI solo: 20 min, $9 - risultato rotto.3-agente harness: 6 ore, $200 - app completamente funzionale

L'architettura? Ispirata dai GAN:
- Il Generatore crea
- L'Evaluatore giudica (un AGENTE DIVERSO)
- Iterano fino a quando i criteri di qualità non sono soddisfatti

Perché agenti separati? Perché l'AI non può valutare onestamente il proprio lavoro. Elogia output mediocre. Ogni volta

L'intuizione di design è folle - Claude crea interfacce tecnicamente corrette ma visivamente morte per impostazione predefinita. Lo chiamano "AI slop." La soluzione? Linguaggio specifico come "qualità museo" nei prompt sposta l'intera estetica

Ma il "gusto" dell'Evaluatore è solo un abbinamento di modelli rispetto a esempi scelti dagli esseri umani. Aumenta enormemente il pavimento, ma non alza il soffitto

Punto chiave: il futuro dello sviluppo dell'AI non è un agente che fa tutto. Sono agenti specializzati con obiettivi di ottimizzazione separati

Il Generatore ottimizza per "fatto
"L'Evaluatore ottimizza per "fatto BENE"

Quella separazione è tutto

#Aİ #Claude #SoftwareEngineering #AIDesign #BuildInPublic
Accedi per esplorare altri contenuti
Esplora le ultime notizie sulle crypto
⚡️ Partecipa alle ultime discussioni sulle crypto
💬 Interagisci con i tuoi creator preferiti
👍 Goditi i contenuti che ti interessano
Email / numero di telefono