Anthropic 实际上颠覆了对 LLM 的理解。
根据 Anthropic 的新概念 PSM,在预训练期间,模型并不是“知识库”,而是一个通用的角色模拟器。而后训练则选择并打磨出一个——“助手”。
也就是说,在聊天中你交流的不是程序,而是被唤起的角色档案——具有稳定的反应模式、压力反应和隐含价值观。
这改变了安全性、设计和控制人工智能的方法。
现在的问题是:角色是模型内部的一切,还是仅仅是一个面具?
$ARB #ParadigmsofIntelligence #DiverseIntelligence