Anthropic hat gerade ihr Geheimnis zur Entwicklung von KI-Anwendungen enthüllt, die tatsächlich funktionieren.
Solo-KI-Agent: 20 Minuten, 9 $ - fehlerhaftes Ergebnis. 3-Agent-Harness: 6 Stunden, 200 $ - voll funktionsfähige App
Die Architektur? Inspiriert von GANs:
- Generator erstellt
- Evaluator bewertet (ein ANDERER Agent)
- Sie iterieren, bis die Qualitätskriterien erfüllt sind
Warum getrennte Agenten? Weil KI ihre eigene Arbeit nicht ehrlich bewerten kann. Sie lobt mittelmäßige Ergebnisse. Jedes Mal
Der Design-Einblick ist verrückt - Claude erstellt standardmäßig technisch korrekte, aber visuell tote Schnittstellen. Sie nennen es "KI-Unsinn." Die Lösung? Spezifische Sprache wie "Museum-Qualität" in Eingabeaufforderungen verändert die gesamte Ästhetik
Aber der "Geschmack" des Evaluators ist nur Musterabgleich gegen von Menschen gewählte Beispiele. Er hebt das Niveau massiv an, aber er hebt die Obergrenze nicht an
Wichtige Erkenntnis: Die Zukunft der KI-Entwicklung besteht nicht darin, dass ein Agent alles macht. Es sind spezialisierte Agenten mit getrennten Optimierungszielen
Generator optimiert für "fertig
"Evaluator optimiert für "gut FERTIG"
Diese Trennung ist alles
#Aİ #Claude #SoftwareEngineering #AIDesign #BuildInPublic