DeepSeek团队论文登上《自然》封面

(北京综合讯)中国人工智能(AI)企业深度求索(DeepSeek)团队撰写的论文,星期三(9月17日)登上国际学术期刊《自然》(Nature)封面。

综合《科技日报》和第一财经网报道,这篇由DeepSeek团队共同完成、创始人梁文锋担任通讯作者的论文,介绍了开源AI模型DeepSeek-R1采用的大规模推理模型训练方法。

论文指出,大语言模型的推理能力可通过纯强化学习而非人类示例来提升,减少了训练成本和复杂性。DeepSeek-R1被展示优质的问题解决案例后,会获得一个模板来产生推理过程,模型通过解决问题获得奖励,从而强化学习效果。

与今年1月发布的DeepSeek-R1初版论文相比,这篇论文披露了更多模型训练细节,并正面回应了模型发布之初的蒸馏质疑。

《自然》评价称,目前几乎没有主流大语言模型在学术期刊中经历过独立同行评审,这篇论文打破了这一空白。

您查看的内容可能不完整,部分内容和推荐被拦截!请对本站关闭广告拦截和阅读模式,或使用自带浏览器后恢复正常。