Meta工程师正争分夺秒分析复制DeepSeek-时事新闻-世界论坛网（手机版）


即时	热点	图片	时事	军情	国际	评论
兵器	史海	体育	户外	论坛	博客	文学

世界论坛网 > 时事新闻 > 正文

Meta工程师正争分夺秒分析复制DeepSeek

wforum.com 2025-01-25 21:53 联合报

总部位于杭州的中国AI新创公司“深度求索”（DeepSeek），去年底、1月20日先后发布了“DeepSeek-V3”和“DeepSeek-R1”两款大模型，由于成本低廉，性能与OpenAI相当，陆媒指此举引发硅谷震惊，甚至引发Meta内部焦虑，工程师开始连夜尝试复制DeepSeek的成果。

陆媒“每日经济新闻”26日报道，在美国总统川普宣布5000亿美元的“星际之门”（Stargate）发展人工智能基础建设计划之际，DeepSeek以极低的价格建立了突破性的AI模型，且未使用尖端芯片，让人们质疑，AI行业数千亿美元资本的巨额投入，是否真为最有效的方法？

报道回顾，去年12月27日，DeepSeek推出开源模型“DeepSeek-V3”。 AI系统排名网站“聊天机器人竞技场”（Chatbot Arena）显示，“DeepSeek-V3”在所有模型中排名第7，在开源模型排第1。且“DeepSeek-V3”是全球前十中，性价比最高的模型。

不到1个月，今年1月20日，DeepSeek再推出“DeepSeek-R1”，24日，“DeepSeek-R1”在聊天机器人竞技场综合榜单上排名第3，与顶尖推理模型、OpenAI推出的o1并列。同时，测评机构“Artificial-Analysis”对“DeepSeek-R1”的初始基准测试结果也显示，“DeepSeek-R1”在AI分析质量指数中取得第2高分，价格则是o1的约30之1。

“每日经济新闻”称，24日，一篇发布在匿名平台teamblind上的文章疯传，一位自称是Meta员工称，Meta内部因为DeepSeek模型进入恐慌模式，该文员工写道，“DeepSeek-V3”在基准测试中，已经让（Meta推出的）Llama 4相形见绌，而更让人难堪的是，一家“仅用550万美元训练预算的中国公司”就做到了这一点。

该匿名文指，工程师正争分夺秒分析DeepSeek，试图复制其中的一切可能技术。另外，“DeepSeek-R1”的出现，也让情况更加严峻。

《金融时报》25日称，中国的小型AI新创公司DeepSeek震惊硅谷，加州大学柏克莱分校AI政策研究员古普塔（Ritwik Gupta）表示，DeepSeek最近发布的模型，表明“AI能力没有护城河”。古普塔也提到，中国的系统工程师人才库比美国大得多，懂得如何充分利用计算资源，来更便宜地训练、运行模型。

0%(0)

全部评论

暂无评论

当前新闻共有0条评论		微信扫一扫
		分享朋友圈

48小时新闻：
	中国运20预警机亮相中美差距进一步拉大
	中国机器狗搭载微型导弹或改写作战规则
	从苏-27油耗数据看战斗机真实面目
	美国迟迟造不出六代机或与人才流失有关
	川普今晚大开杀戒 17大政府机构哀鸿遍野

广告：webads@creaders.net

电话：604-438-6008,604-438-6080

投稿：webeditor@creaders.net