根据 Odaily 报导,OpenAI 推出了一系列改进的编码挑战,旨在评估人工智慧模型的程式设计能力。这些挑战源自于一系列现实世界的程式设计问题,称为 SWE-bench,它代表软体工程基准。这些问题的复杂性对人工智慧系统提出了重大挑战。