Según Odaily, OpenAI ha introducido un conjunto de desafíos de codificación mejorados destinados a evaluar las capacidades de programación de los modelos de inteligencia artificial. Estos desafíos se derivan de una colección de problemas de programación del mundo real conocidos como SWE-bench, que significa Software Engineering Benchmark. La complejidad de estos problemas presenta un desafío significativo para los sistemas de IA.