По данным Odaily, OpenAI представила набор улучшенных задач кодирования, направленных на оценку возможностей программирования моделей искусственного интеллекта. Эти задачи получены из набора реальных задач программирования, известных как SWE-bench, что означает Software Engineering Benchmark. Сложность этих задач представляет собой значительную проблему для систем ИИ.