A Anthropic acabou de revelar seu segredo para construir aplicativos de IA que realmente funcionam.
Agente de IA Solo: 20 min, $9 - resultado quebrado.3-agente harness: 6 horas, $200 - aplicativo totalmente funcional
A arquitetura? Inspirada por GANs:
- O Gerador cria
- O Avaliador julga (um AGENTE DIFERENTE)
- Eles iteram até que os critérios de qualidade sejam atendidos
Por que agentes separados? Porque a IA não pode avaliar honestamente seu próprio trabalho. Ela elogia resultados medíocres. Toda vez
A percepção de design é selvagem - Claude cria interfaces tecnicamente corretas, mas visualmente mortas por padrão. Eles chamam isso de "lixo de IA." A solução? Linguagem específica como "qualidade de museu" em prompts muda toda a estética
Mas o "gosto" do Avaliador é apenas correspondência de padrões com exemplos escolhidos por humanos. Ele eleva o padrão drasticamente, mas não eleva o teto
Ponto chave: o futuro do desenvolvimento de IA não é um agente fazendo tudo. São agentes especializados com alvos de otimização separados
Gerador otimiza para "feito
"Avaliador otimiza para "feito BEM"
Essa separação é tudo
#Aİ #Claude #SoftwareEngineering #AIDesign #BuildInPublic