Secondo Odaily, OpenAI ha introdotto una serie di sfide di codifica migliorate volte a valutare le capacità di programmazione dei modelli di intelligenza artificiale. Queste sfide derivano da una raccolta di problemi di programmazione del mondo reale noti come SWE-bench, che sta per Software Engineering Benchmark. La complessità di questi problemi rappresenta una sfida significativa per i sistemi di intelligenza artificiale.