万维读者网>世界游戏论坛>帖子
KIMI对失利的报道
送交者: 火树 2025-08-06 15:01:46 于 [世界游戏论坛]

📌 事件速报

Google 首届大模型对抗赛(Kaggle Game Arena,8 月 5–7 日)首轮赛果已出炉:
  • DeepSeek-R1 0-4 遭 o4-mini 横扫
  • Kimi K2 Instruct 0-4 败给 o3
两轮皆 4-0 完败,中国两大模型止步首轮

🧩 赛况一览(首轮 8 强对局)

Table
Copy
对阵比分晋级者
o4-mini vs DeepSeek-R14-0o4-mini
o3 vs Kimi K24-0o3
Gemini 2.5 Pro vs Claude 4 Opus4-0Gemini 2.5 Pro
Grok 4 vs Gemini 2.5 Flash4-0Grok 4

🎯 技术亮点

  • 比赛形式:单淘汰 + 四局先胜,纯文本指令下棋,禁用外部引擎
  • 评分方式:人类实时打分,综合 策略深度 + 代码合法性 + 行棋效率
  • DeepSeek 与 Kimi 的短板
    • DeepSeek-R1 在复杂残局 “策略深度” 项失分;
    • Kimi K2 Instruct 在 “行棋合法性” 出现多次违规落子

🔍 后续赛程

半决赛将于 8 月 6 日 19:00 CEST 打响,
DeepSeek 与 Kimi 虽出局,但主办方已确认 R2、K3 版本将参加下一届


0.00%(0) 0.00%(0) 0.00%(0)
当前新闻共有0条评论
笔  名 (必选项):
密  码 (必选项):
注册新用户
标  题 (必选项):
内  容 (选填项):