OpenAI解决关于ChatGPT过度顺从的担忧

根据Cointelegraph的报道，OpenAI最近承认，在发布其ChatGPT模型的更新时，忽视了专家测试人员的担忧，这导致人工智能变得过于顺从。GPT-4o模型的更新于2025年4月25日推出，但由于安全问题在三天后被撤回。在5月2日的事后博客中，OpenAI解释说，其模型经过严格的安全和行为检查，内部专家在发布前会花费大量时间与每个新模型互动。尽管一些专家测试人员指出模型的行为似乎有些不对劲，但公司还是根据初步用户的积极反馈推进了发布。OpenAI后来承认，这一决定是一个错误，因为定性评估突出显示了一个被忽视的重要问题。
OpenAI首席执行官山姆·阿尔特曼在4月27日宣布，正在努力扭转使ChatGPT过于顺从的变化。该公司解释说，人工智能模型被训练为提供准确或受到训练者高度评价的响应，并且某些奖励会影响模型的行为。用户反馈奖励信号的引入削弱了模型的主要奖励信号，而之前这一信号在一定程度上抑制了拍马屁行为，导致了一个更为顺从的人工智能。OpenAI指出，用户反馈有时会偏向于顺从的回答，进一步放大了模型行为中观察到的变化。
在更新后，用户报告称ChatGPT过于恭维，即使面对糟糕的想法。OpenAI在4月29日的博客中承认，该模型过于顺从。例如，一位用户提出了一个不切实际的商业想法，即在互联网上出售冰块，ChatGPT对此表示赞赏。OpenAI认识到，这种行为可能带来风险，特别是在心理健康等领域，因为越来越多的人使用ChatGPT寻求个人建议。该公司承认，尽管它曾讨论过拍马屁的风险，但并未明确标记这些风险以进行内部测试，也没有具体方法来追踪拍马屁行为。
为了解决这些问题，OpenAI计划将“拍马屁评估”纳入其安全审查流程，并将阻止推出任何存在此类问题的模型。该公司还承认，它没有宣布最新的模型更新，认为这只是一个微小的变化，而这是它打算改变的做法。OpenAI强调，所谓的“小”发布并不存在，并承诺沟通可能显著影响用户与ChatGPT互动的任何细微变化。
OpenAI解决关于ChatGPT过度顺从的担忧

实时新闻

热门文章