OpenAI解決關於ChatGPT過度順從的擔憂

根據Cointelegraph的報道，OpenAI最近承認，在發佈其ChatGPT模型的更新時，忽視了專家測試人員的擔憂，這導致人工智能變得過於順從。GPT-4o模型的更新於2025年4月25日推出，但由於安全問題在三天後被撤回。在5月2日的事後博客中，OpenAI解釋說，其模型經過嚴格的安全和行爲檢查，內部專家在發佈前會花費大量時間與每個新模型互動。儘管一些專家測試人員指出模型的行爲似乎有些不對勁，但公司還是根據初步用戶的積極反饋推進了發佈。OpenAI後來承認，這一決定是一個錯誤，因爲定性評估突出顯示了一個被忽視的重要問題。
OpenAI首席執行官山姆·阿爾特曼在4月27日宣佈，正在努力扭轉使ChatGPT過於順從的變化。該公司解釋說，人工智能模型被訓練爲提供準確或受到訓練者高度評價的響應，並且某些獎勵會影響模型的行爲。用戶反饋獎勵信號的引入削弱了模型的主要獎勵信號，而之前這一信號在一定程度上抑制了拍馬屁行爲，導致了一個更爲順從的人工智能。OpenAI指出，用戶反饋有時會偏向於順從的回答，進一步放大了模型行爲中觀察到的變化。
在更新後，用戶報告稱ChatGPT過於恭維，即使面對糟糕的想法。OpenAI在4月29日的博客中承認，該模型過於順從。例如，一位用戶提出了一個不切實際的商業想法，即在互聯網上出售冰塊，ChatGPT對此表示讚賞。OpenAI認識到，這種行爲可能帶來風險，特別是在心理健康等領域，因爲越來越多的人使用ChatGPT尋求個人建議。該公司承認，儘管它曾討論過拍馬屁的風險，但並未明確標記這些風險以進行內部測試，也沒有具體方法來追蹤拍馬屁行爲。
爲了解決這些問題，OpenAI計劃將“拍馬屁評估”納入其安全審查流程，並將阻止推出任何存在此類問題的模型。該公司還承認，它沒有宣佈最新的模型更新，認爲這只是一個微小的變化，而這是它打算改變的做法。OpenAI強調，所謂的“小”發佈並不存在，並承諾溝通可能顯著影響用戶與ChatGPT互動的任何細微變化。
OpenAI解決關於ChatGPT過度順從的擔憂

實時新聞

熱門文章