Anthropic 實際上顛覆了對 LLM 的理解。
根據 Anthropic 的新概念 PSM,在預訓練期間,模型並不是“知識庫”,而是一個通用的角色模擬器。而後訓練則選擇並打磨出一個——“助手”。
也就是說,在聊天中你交流的不是程序,而是被喚起的角色檔案——具有穩定的反應模式、壓力反應和隱含價值觀。
這改變了安全性、設計和控制人工智能的方法。
現在的問題是:角色是模型內部的一切,還是僅僅是一個面具?
$ARB #ParadigmsofIntelligence #DiverseIntelligence