第1个获得数学奥赛金牌的开源模型!DeepSeek新模型获网友盛赞:公开技术文件,了不起!

DeepSeek最新发布的开源数学模型,正将其推向与OpenAI和谷歌等科技巨头同场竞技的舞台DeepSeekMath-V2的模型,在被誉为全球最难的高中数学竞赛中达到了金牌水...

DeepSeek最新发布的开源数学模型,正将其推向与OpenAI和谷歌等科技巨头同场竞技的舞台DeepSeekMath-V2的模型 ,在被誉为全球最难的高中数学竞赛中达到了金牌水平,成为首个实现这一成就的开源模型,标志着开源人工智能在复杂推理能力上的一次重大突破。

昨日DeepSeek宣布推出其最新的数学推理模型DeepSeekMath-V2 ,该模型在模拟的2025年国际数学奥林匹克竞赛(IMO)中解决了6个问题中的5个 ,达到了金牌水平 。

这一成就使其成为第一个在IMO级别竞赛中获得金牌的开源模型,引发了AI研究和开发者社区的高度关注。

这一表现直接对标了行业巨头。就在今年7月,谷歌DeepMind的Gemini高级版本和一个来自OpenAI的实验性推理模型也达到了IMO 2025的金牌标准 ,同样解决了5个问题,它们是首批达到该水平的人工智能模型 。

然而,与谷歌和OpenAI的闭源实验模型不同 ,DeepSeekMath-V2的模型权重根据Apache 2.0许可证公开发布,可供公众下载 。

值得一提的是,DeepSeekMath-V2采用了一种创新的自我验证训练框架。该方法的核心是训练一个专门的“验证器 ”(verifier) ,其任务是评估证明过程的质量,而不是最终答案的对错。

而且为了防止模型过度拟合其自身的检查机制,DeepSeek通过增加计算量和自动标记难以验证的证明 ,来不断提升验证过程的难度,确保验证器与生成器同步进化 。

此举被视为人工智能民主化的重要一步。该模型的发布不仅证明了开源社区有能力在尖端AI研究领域追赶甚至比肩顶级闭源实验室,也可能再次引发了市场对于开源模型是否会侵蚀闭源产品商业护城河的讨论——这一话题曾一度动摇投资者对英伟达等AI巨头的信心。

第1个获得数学奥赛金牌的开源模型!DeepSeek新模型获网友盛赞:公开技术文件	,了不起!

跻身顶尖行列:与OpenAI和谷歌同台竞技

DeepSeekMath-V2的卓越表现 ,标志着其在复杂的数学推理领域,与全球领先的AI实验室站在了同一起跑线上 。国际数学奥林匹克竞赛(IMO)通常被认为是全球难度最高的高中生数学竞赛,在2025年的竞赛中 ,630名人类参赛者中仅有72人获得金牌。

除了在IMO 2025取得的成就,该模型还在其他高难度数学竞赛中展现了顶级水平。据DeepSeek称,它在中国最顶尖的全国性竞赛——中国数学奥林匹克(CMO)中也达到了金牌水平 。

在面向大学本科生的普特南数学竞赛(Putnam 2024)中 ,该模型在12道题中完全解决了11道,另一道题也仅有微小错误,最终得分118/120 ,超过了人类参赛者90分的最高分记录。

第1个获得数学奥赛金牌的开源模型!DeepSeek新模型获网友盛赞:公开技术文件,了不起!

开源的里程碑:社区盛赞“了不起的发布”

与谷歌和OpenAI尚未公开的实验模型相比,DeepSeekMath-V2的核心吸引力在于其彻底的开放性。该模型的权重已在开源社区Hugging Face上发布 ,允许研究人员和开发者自由下载 。

Hugging Face的联合创始人兼首席执行官Clement Delangue在社交平台X上盛赞道:“想象一下,你可以免费拥有世界上最优秀数学家之一的大脑。”

他补充说,“据我所知 ,此前没有任何聊天机器人或API能让你接触到一个IMO 2025金牌水平的模型。 ”他强调 ,用户可以不受限制地探索 、微调、优化模型,并运行在自己的硬件上,“没有任何公司或政府可以收回它 。这是人工智能和知识民主化的最佳体现 。 ”

第1个获得数学奥赛金牌的开源模型!DeepSeek新模型获网友盛赞:公开技术文件	,了不起!

另一位网友elie也评论称:“DeepSeek Math V2是第一个在IMO上达到金牌水平的开源模型吗?而且我们还得到了技术报告,这真是一次了不起的发布。”

第1个获得数学奥赛金牌的开源模型!DeepSeek新模型获网友盛赞:公开技术文件,了不起!

还有网友评论称 ,他们喜欢 5-7 个想法,每个想法都相对简单,不断堆叠 ,结果出乎意料地越来越好,看起来更像工程而不是研究。

第1个获得数学奥赛金牌的开源模型!DeepSeek新模型获网友盛赞:公开技术文件,了不起!第1个获得数学奥赛金牌的开源模型!DeepSeek新模型获网友盛赞:公开技术文件	,了不起!

自我验证框架:超越答案,关注推理过程

DeepSeek在技术报告中指出,近期的人工智能模型虽然擅长在数学基准测试中获得正确答案 ,但往往缺乏严谨的推理过程 。报告写道:“许多像定理证明这样的数学任务 ,需要严谨的逐步推导,而非仅仅一个数值答案。”

为了解决这一问题,DeepSeekMath-V2采用了一种创新的自我验证训练框架。该方法的核心是训练一个专门的“验证器 ”(verifier) ,其任务是评估证明过程的质量,而不是最终答案的对错 。随后,这个验证器被用作奖励模型 ,来引导一个独立的“证明生成器”(proof-generator)。只有当生成器成功识别并修复自身证明中的错误时,它才会获得奖励。

这种机制激励模型在最终确定答案之前,尽可能多地发现和解决自身推理链条中的问题 。DeepSeek强调 ,“对于没有已知解决方案的开放性问题,自我验证在扩展测试时计算(test-time compute)方面尤为重要。”测试时计算指的是在推理阶段分配大量计算资源,让模型有更长时间进行推理、探索多种解决方案并完善答案。

第1个获得数学奥赛金牌的开源模型!DeepSeek新模型获网友盛赞:公开技术文件	,了不起!

动态进化系统:破解“自我过度拟合 ”难题

为了防止模型过度拟合其自身的检查机制——即只学会欺骗自己的验证器——DeepSeek采用了一种动态进化的策略 。该团队通过增加计算量和自动标记难以验证的证明,来不断提升验证过程的难度,确保验证器与生成器同步进化。

DeepSeek在技术文件中解释 ,这种方法允许他们“扩展验证计算 ,以自动标记新的 、难以验证的证明,从而创造新的训练数据来进一步改进验证器。”通过这种验证-生成闭环和元验证机制,模型能够实现全自动化的数据标注和持续的性能优化 ,验证了自驱动学习系统在解决复杂数学推理任务上的可行性 。

⭐星标华尔街见闻,好内容不错过本文不构成个人投资建议,不代表观点 ,市场有风险,投资需谨慎,请独立判断和决策 。

第1个获得数学奥赛金牌的开源模型!DeepSeek新模型获网友盛赞:公开技术文件	,了不起!

本文来自作者[华发囚徒]投稿,不代表视听号立场,如若转载,请注明出处:https://cn.stddy.com/cskp/202511-60768.html

(27)

文章推荐

  • 陕西新增2例本土确诊病例(陕西新增2例本土确诊病例详情)

    陕西新增2例本土确诊,这些病例遍布在了哪儿?〖壹〗、最近,疫情逐渐的严重,陕西也新增了2例本土病例。在病例确诊之后,当地也对密切接触者进行了逐一排查,逐一核酸检测。据了解,这2名病例的活动轨迹如下所示。确诊病例1李某某,是之前确诊病例2的儿子,他前后去了张掖、甘肃嘉峪关,之后又乘坐列车去了兰州。在

    2025年07月02日
    121
  • 微乐斗地主有猫腻吗(揭秘微信里胡牌神器).微乐斗地主有挂么??

    微乐斗地主那个祈福,有没有用?〖壹〗、微乐斗地主的祈福功能确实存在,但它的实际效果常常受到玩家个人体验和游戏本身随机性的影响,因此很难一概而论。在微乐斗地主游戏中,存在一种被称为“必赢神器”的工具,它声称能够透视对手的牌。然而,这种工具的真实性和合法性值得怀疑,因为它可能违反了游戏的公平性原则。〖

    2025年07月15日
    118
  • 玩家必看攻略“手机微乐麻将防作弊检测器最新款(助赢神器通用版)

    这软件超厉害啦!决战十三水如何提高拿好牌几率(小程序怎么才会赢)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”决战十三水如何提高拿好牌几率是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅

    2025年09月02日
    83
  • 玩家必备教程“手机扑克牌报牌神器(专用辅牌神器免安装)

    这软件超神无敌!微乐四川麻将插件安装(为什么老是输)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”微乐四川麻将插件安装是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户

    2025年09月07日
    71
  • 玩家必备教程“微乐山西斗地主助赢神器(专用辅牌神器免安装)

    软件神器超猛!蜀山四川麻将输赢规律(如何让系统发好牌)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”蜀山四川麻将输赢规律是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用

    2025年09月14日
    68
  • 玩家实测“打哈儿辅助器免费版(助赢神器通用版)

    这软件太神了!来趣广西麻将十三张确实有辅助挂插件(助攻神器)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”来趣广西麻将十三张确实有辅助挂插件是一款可以让一直输的玩家,快速成为一个“必胜”的ai

    2025年09月17日
    67
  • 必看教程“微乐山西麻将怎样能赢(专用辅牌神器免安装)

    软件神器超神!小程序雀神麻将怎么设置才能赢(要怎么样拿到好牌)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”小程序雀神麻将怎么设置才能赢是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助

    2025年09月22日
    67
  • 3分钟学会“微乐三打一可以开挂吗(助赢神器通用版)

    软件神器超厉害!中至上饶打炸规律(AI辅助胡牌规则)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”中至上饶打炸规律是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以

    2025年09月23日
    64
  • 千年古刹塔影婆娑,迎候泰王国拉玛十世亲临。

    11月15日正在我国进行访问的泰国国王拉玛十世和王后苏提达一同来到了北京千年古寺-灵光寺。灵光寺内供奉着著名的"水晶佛牙舍利",曾两次被我国借给泰国用于重大庆典。而此次泰王和王后访寺是回访与致敬的延续,进一步深化双边关系。现年47岁的苏提达当天穿了一件黑灰色的连衣裙,这种颜色让她原本就白皙的皮肤更加

    2025年11月20日
    33
  • 西安新增4个中风险地区.西安新增4个中风险地区是哪里?

    西安今天晚上十二点封城吗〖壹〗、不封。近来西安并没有封城,不过新增了4个高风险区、2个中风险区。进出西安最新政策:1。〖贰〗、不封。通过查询相关资料显示,截止到2022年9月17日,西安为我国低风险地区,对居民实施不封闭,正常有序的管理方式,西安不封城,但是出行需要出示行程码和健康码,需要三天进行

    2025年06月24日
    124

发表回复

本站作者后才能评论

评论列表(4条)

  • 华发囚徒
    华发囚徒 2025年11月29日

    我是视听号的签约作者“华发囚徒”!

  • 华发囚徒
    华发囚徒 2025年11月29日

    希望本篇文章《第1个获得数学奥赛金牌的开源模型!DeepSeek新模型获网友盛赞:公开技术文件,了不起!》能对你有所帮助!

  • 华发囚徒
    华发囚徒 2025年11月29日

    本站[视听号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 华发囚徒
    华发囚徒 2025年11月29日

    本文概览:DeepSeek最新发布的开源数学模型,正将其推向与OpenAI和谷歌等科技巨头同场竞技的舞台DeepSeekMath-V2的模型,在被誉为全球最难的高中数学竞赛中达到了金牌水...

    联系我们

    邮件:视听号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们