世界论坛网 > 时事新闻 > 正文
梁文锋DeepSeek论文登上《自然》封面
wforum.com  2025-09-17 22:10  联合早报

中国人工智能公司深度求索(DeepSeek)创始人梁文锋有关DeepSeek-R1大语言模型的论文,登上了学术期刊《自然》(Nature)的封面。

据《科技日报》报道,梁文锋及DeepSeek团队星期三(9月17日)在《自然》封面发表了开源人工智能(AI)模型DeepSeek-R1所采用的大规模推理模型训练方法。

梁文锋团队报告称,模型使用了强化学习而非人类示例来开发推理步骤,减少了训练成本和复杂性。DeepSeek-R1在被展示优质的问题解决案例后,会获得一个模板来产生推理过程,这一模型通过解决问题获得奖励,从而强化学习效果。

团队总结说,未来研究可以聚焦优化奖励过程,以确保推理和任务结果更可靠。

《自然》在社论中称,目前没有任何一种主流大型语言模型在学术期刊中经历过独立的同行评审,这一状况随着《自然》杂志发表有关R1模型的详细信息而发生变化。

社论称,R1模型已经过八名专家评审,评估了原创性、方法论和稳健性,并呼吁其他公司效仿DeepSeek的做法。“在一个未经证实的言论和炒作屡见不鲜的行业中,所有这些都是朝着透明度和可重复性迈出的可喜一步。”

图片

0%(0)
全部评论
暂无评论
当前新闻共有0条评论微信扫一扫
分享朋友圈
48小时新闻:
伊朗押注歼-10 或将重塑中东空中力量平衡
俄罗斯:美国为中国准备了25个秘密武器
印度第4代坦克太奇葩:竟然搭载4个乘员
于朦胧案牵扯两高官 传一人是蔡奇私生子
该来的终要来!菲律宾海军迎来新舰