Pasé demasiado tiempo hoy persiguiendo un minúsculo error que al final resultó ser un solo carácter que faltaba 😅. Nada inusual. Lo que sí llamó mi atención fue lo diferente que me comporté cuando cambié a Claude Fable 5 dentro de OpenGradient Chat.
Normalmente, cuando estoy depurando algo que realmente pertenece a un proyecto, empiezo borrando partes del código antes de pegarlo en un chat con IA. Los nombres de variables, los comentarios, las rutas de la API… Termino pasando casi el mismo tiempo “sanitizando” el prompt que resolviendo el problema.
Hoy no lo hice.
Ya sabía que Fable 5 había estado publicando resultados de codificación sólidos—95.0 en SWE-bench Verified, 80 en SWE-bench Pro, 84.3 en Terminal-Bench—así que esperaba respuestas buenas. La sorpresa no fue el benchmark. Fue darme cuenta de que por fin dejé de pensar en lo que tenía que ocultar antes de pedir ayuda.
Las respuestas no eran mágicamente perfectas. Aun así tuve que rechazar un par de sugerencias y probarlo todo yo mismo. Así es como funciona la programación.
Lo que se sintió distinto fue el flujo de trabajo. Mi atención se mantuvo en el error en lugar de estar todo el tiempo preguntándome: “¿Debería quitar este fragmento primero?”
Es gracioso cómo la gente compara los modelos de IA casi por completo según las puntuaciones de los benchmarks. Después de hoy, empiezo a pensar que la ganancia de productividad más grande proviene de no romper tu propio ritmo cada cinco minutos solo porque te preocupa dónde va a terminar tu código.
@OpenGradient #opg $OPG
Normalmente, cuando estoy depurando algo que realmente pertenece a un proyecto, empiezo borrando partes del código antes de pegarlo en un chat con IA. Los nombres de variables, los comentarios, las rutas de la API… Termino pasando casi el mismo tiempo “sanitizando” el prompt que resolviendo el problema.
Hoy no lo hice.
Ya sabía que Fable 5 había estado publicando resultados de codificación sólidos—95.0 en SWE-bench Verified, 80 en SWE-bench Pro, 84.3 en Terminal-Bench—así que esperaba respuestas buenas. La sorpresa no fue el benchmark. Fue darme cuenta de que por fin dejé de pensar en lo que tenía que ocultar antes de pedir ayuda.
Las respuestas no eran mágicamente perfectas. Aun así tuve que rechazar un par de sugerencias y probarlo todo yo mismo. Así es como funciona la programación.
Lo que se sintió distinto fue el flujo de trabajo. Mi atención se mantuvo en el error en lugar de estar todo el tiempo preguntándome: “¿Debería quitar este fragmento primero?”
Es gracioso cómo la gente compara los modelos de IA casi por completo según las puntuaciones de los benchmarks. Después de hoy, empiezo a pensar que la ganancia de productividad más grande proviene de no romper tu propio ritmo cada cinco minutos solo porque te preocupa dónde va a terminar tu código.
@OpenGradient #opg $OPG
