Meta 引入了一种名为思维偏好优化 (TPO) 的新人工智慧训练技术,以增强机器处理资讯和回应查询的方式。 TPO 鼓励语言模型在提供答案之前进行内部反思,从而产生更细致、更接近人类的回应。与传统方法不同,TPO让人工智慧一步独立思考,从而产生更具创造性的解决问题的能力。透过从认知科学中汲取灵感,Meta 旨在开发能够理解复杂推理过程的人工智慧。 TPO 方法经过行业基准测试,在提高人工智慧在挑战性任务中的效能方面取得了可喜的成果。此外,Meta 对系统 2 蒸馏的研究旨在将快速、直观的系统 1 处理与人工智慧模型中缓慢、分析的系统 2 思维相结合。这种创新方法可能会导致开发更智慧、更有效率的开源人工智慧模型,而无需大量新数据。阅读更多人工智慧产生的新闻:https://app.chaingpt.org/news