全世界在等的Gemini 3终于来了，强到断崖领先，连马斯克OpenAI都夸好

幼琴 • 2025年11月19日 10:59 • 新闻资讯 • 阅读 2

智东西11月19日报道，今天凌晨，谷歌最强推理模型Gemini 3终于亮相，一个模型囊括了原生多模态、推理、Agent多种能力。谷歌DeepMind研究团队称，这是全球最先进的...

智东西11月19日报道，今天凌晨，谷歌最强推理模型Gemini 3终于亮相，一个模型囊括了原生多模态、推理、Agent多种能力 。

谷歌DeepMind研究团队称，这是全球最先进的多模态理解模型、谷歌最强大的Agent编程和氛围编程模型，能呈现更丰富的可视化效果和更深度的交互体验，且完全构建于最先进的推理技术基础之上。

该模型基于谷歌TPU进行训练，支持100万个token的上下文窗口，适用于需要以下功能的应用：Agent 、高级编程、长上下文、多模态理解、算法开发。

刚一发布，Gemini 3就几乎屠榜所有评测集，以1501 Elo得分位列LMArena大模型竞技场第一 。

OpenAI联合创始人、CEO萨姆·阿尔特曼（Sam Altman）和xAI创始人、CEO埃隆·马斯克（Elon Musk）纷纷向谷歌发来“贺信 ”。阿尔特曼发推评价“Gemini 3看起来很不错”，谷歌CEO桑达尔·皮查伊（Sundar Pichai）用了个表情包回复。

马斯克转发了谷歌DeepMind CEO戴密斯·哈萨比斯（Demis Hassabis）的推文称“干得不错” 。

今天起，谷歌将在以下平台部署Gemini 3：

适用于Gemini应用的所有用户，以及在搜索的AI模式中使用Google AI Pro和Ultra订阅服务的用户；适用于Gemini API中的开发者、谷歌全新Agent开发平台Antigravity的开发者，以及Gemini CLI的开发者；适用于Vertex AI平台与Gemini企业版的企业用户。

此外，谷歌将在未来几周向Google AI Ultra订阅者开放Gemini 3的深度思考模式，目前其还在进行安全评估。

对于Gemini 3的发布，皮查伊认为，这一模型可以让用户的任何想法变为现实。

01. 分分钟造出交互游戏、App

还能帮你学新知识

先来看下Gemini 3 Pro能做什么。

Gemini 3能编写托卡马克装置中等离子体流的可视化代码，并创作捕捉核聚变物理原理的诗歌。

如果用户想学习家族传统烹饪，Gemini 3可以解读并翻译不同语言的手写食谱，制作成可共享的家庭食谱。

如果用户想学习一个新话题，可以给Gemini 3输入学术论文、长视频讲座或教程，它还能生成交互式抽认卡、可视化或其他格式的代码，帮助用户掌握这些内容。

Gemini 3可以分析用户的匹克球比赛视频，找出可以改进的地方，并生成整体动作提升的训练计划。

AI搜索模式下，Gemini 3能学习复杂主题内容，如借助搜索功能中AI模式的生成式用户界面，学习像RNA聚合酶作用机制这类复杂知识点。值得一提的是，这也是谷歌首次在模型发布首日，就将新模型直接集成至AI搜索功能中。

Gemini 3可以编写拥有丰富可视化界面和互动性的复古3D飞船游戏。

该模型通过代码构建、解构和重新创作精细的3D体素艺术，能让用户的想象变为现实。

Gemini 3能使用着色器创建可玩的科幻世界。

其还可以生成更具实用性、元素丰富的互动性网页和App。

02. 屠榜评测集

刷新大模型能力天花板

再来看下Gemini 3 Pro的基准测试结果。

谷歌博客提到，Gemini 3 Pro在一系列基准测试中进行了评估，包括推理、多模态能力、Agent工具使用、多语言性能和长上下文，其在主要的AI基准测试中都远远优于Gemini 2.5 Pro，并以1501 Elo得分位列LMArena大模型竞技场第一 。

该模型展现出博士级推理能力，在“人类终极测试 ”（不使用任何工具情况下得分37.5%）和GPQA钻石级测试中均斩获最高分，在MathArena Apex测试中取得23.4%的最新顶尖成绩。

除了文本，Gemini 3 Pro在MMMU-Pro上获得了81%，在Video-MMMU上获得了87.6%的多模推理，在SimpleQA Verify上也获得了最高的72.1%。

这意味着Gemini 3 Pro能够以高度可靠性解决涵盖科学和数学等广泛主题的复杂问题。

Gemini 3的深度思考和多模态理解能力更新，可以帮助用户解决更复杂的问题。测试中，Gemini 3 Deep Think在“人类终极测试”（未使用工具时为41.0%）和GPQA Diamond（93.8%）中表现优于Gemini 3 Pro。它在ARC-AGI-2（代码执行，ARC奖项认证）上取得了45.1%的成绩，均超过谷歌自家前代模型，以及OpenAI、Anthropic的模型。

编程能力中，Gemini 3是谷歌迄今为止构建过的最佳氛围编程和Agent编程模型。

该模型以1487 Elo得分登顶WebDev竞技场排行榜。它在Terminal-Bench 2.0测试模型工具使用能力上，得分为54.2%，在衡量编程Agent能力的基准测试SWE-bench Verified上表现远超2.5 Pro。

开发者可以在Google AI Studio 、Vertex AI、Gemini CLI以及谷歌全新的代理开发平台Google Antigravity中使用Gemini 3进行构建。它还支持第三方平台，如Cursor、GitHub 、JetBrains、Manus、Replit等。

自Gemini 2以来，谷歌Gemini模型已经在Agent方面取得诸多进展，此次Gemini 3还登顶了Vending-Bench 2排行榜。该基准测试通过模拟自动售货机业务运营来考核模型的长期规划能力，其结果显示，Gemini 3 Pro在一整年的模拟运营中，始终保持稳定的工具使用和决策连贯性，既未偏离任务目标，又实现了更高收益 。

这意味着Gemini 3能帮助用户完成日常生活中的事务，如预约本地服务或整理收件箱等。

03. 全新Agent开发平台亮相

实现端到端软件开发自动化

今天谷歌还发布了全新的Agent开发平台Google Antigravity。

借助Gemini 3的高级推理、工具使用及Agent编程能力，谷歌Antigravity将AI辅助功能从开发者工具包里的一个工具，转变为积极主动的合作伙伴。

尽管谷歌Antigravity的核心仍是AI集成开发环境（AI IDE）体验，但其Agent已升级至专属界面，并能直接访问编辑器、终端和浏览器。如今，这些Agent可以自主规划并同步为开发者执行复杂的端到端软件任务，同时还能对自身代码进行验证。

除了Gemini 3 Pro ，Google Antigravity还将结合谷歌最新的Gemini 2.5 Computer Use模型，以及图像编辑模型Nano Banana。

谷歌Antigravity借助Gemini 3，为航班追踪应用打造了端到端的Agent工作流。该Agent能够自主规划、编写应用代码，并通过基于浏览器的计算机操作来验证其执行效果。

最后谷歌还提到，Gemini 3是其迄今为止最安全的模型，并且经历了谷歌AI模型中最全面的安全评估。模型评测结果显示，其谄媚行为减少，对即时注射的抵抗力增强，并提升了对网络攻击滥用的防护。

从2023年12月Gemini模型发布至今已近两年：Gemini 1在原生多模态和长上下文窗口上的突破，扩展了可处理信息的种类以及处理量；Gemini 2可帮助用户处理更复杂的任务和想法，使Gemini 2.5 Pro的排名在LMArena中领先超过六个月。

如今，谷歌基于Gemini模型的搜索功能AI Overviews月活用户达到20亿，Gemini应用月活用户超过6.5亿，超过70%的云端客户使用谷歌AI功能，1300万开发者用其生成模型构建了作品。

04. 结语：免费开放+性能飙升！

Gemini 3搅动大模型竞争格局

谷歌Gemini 3相比前几代模型性能大幅提升，可以感知用户提示词中的细微线索及复杂问题，还能理解用户请求的背景和背后意图，让用户用更少的提示获得所需信息。谷歌博客提到，在Gemini 3发布的下一个新篇章中，他们将继续突破智能、Agent和个性化的前沿，让AI真正惠及所有人。

随着Gemini 3正式亮相，加之谷歌此次免费开放其使用权限，一场围绕大模型的新一轮行业竞争已全面打响。

本文来自微信公众号“智东西”（ID：zhidxcom），作者：程茜，编辑：心缘，36氪经授权发布。

本文来自作者[幼琴]投稿，不代表视听号立场，如若转载，请注明出处：https://cn.stddy.com/xinwen/202511-58816.html

2 4

本文作者

幼琴签约作者

318 文章

3450620 评论

1 粉丝

我是视听号的签约作者[幼琴],本篇文章《全世界在等的Gemini 3终于来了，强到断崖领先，连马斯克OpenAI都夸好》主要讲述了:智东西11月19日报道，今天凌晨，谷歌最强推理模型Gemini 3终于亮相，一个模型囊括了原生多模态、推理、Agent多种能力。谷歌DeepMind研究团队称，这是全球最先进的...

知识分享

特朗普急了，10国防长齐聚中国，印巴俄伊都派人来，有要事商量

得道多助，失道寡助。放在当下国际形势中真是再贴切不过。特朗普如今应该是如坐针毡吧，眼看着上海合作组织防长会议在中国青岛召开。来自印度、巴基斯坦、俄罗斯、伊朗等十个国家的防长或高级代表到场，与中国展开多边安全对话。就在几天前，美国主导的北约峰会刚刚结束，场面冷清，反响平淡。中国主办的这场会议却座无虚席

香天
2025年06月27日
105
游戏攻略

乐胡麻将摆叫是否有挂(其实是有挂确实有挂)/下载乐胡摆叫麻将

四川麻将最后手里有4张牌,是一个暗杠,没牌了,算不算有叫根据常规的四川麻将规则，如果您手里有4张牌并且没有能够组成牌型的其他牌，同时也没有玩家需要胡牌，那么您的手牌算是“没叫”，也就是不能胡牌的状态。而如果您在摸牌后，发现自己手里已经有4张牌，那么此时您可以开暗杠，将第5张牌摸起来后放在自己面前的

怜阳来了
2025年08月16日
77
游戏攻略

全民如意麻将到底能不能开挂(真的有挂).全民如意跑胡子？

求滕州地区过年的习俗资料,越详细越好〖壹〗、真正过年的前一夜叫团圆夜，离家在外的游子都要不远千里万里赶回家来，全家人要围坐在一起包饺子过年，饺子的作法是先和面做成饺子皮，再用皮包上馅，馅的内容是五花八门，各种肉、蛋、海鲜、时令蔬菜等都可入馅，正统的饺子吃法，是清水煮熟，捞起后以调有醋、蒜末、香油的

梧桐十一
2025年09月07日
66
知识分享

实测教程“手机微乐麻将助攻神器（专用辅牌神器免安装）

软件神器超灵!星悦云南麻将让系统发好牌(插件开挂免费AI)“我们专注于各类软件定制开发，已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”星悦云南麻将让系统发好牌是一款可以让一直输的玩家，快速成为一个“必胜”的ai辅助神器，有

沛槐
2025年09月12日
51
综合

分享辅助“诚信红包尾数控制器”（详细透视教程）-今日头条

超牛软件工具!小程序雀神麻将输赢规律(怎么能让牌好一点)“我们专注于各类软件定制开发，已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”小程序雀神麻将输赢规律是一款可以让一直输的玩家，快速成为一个“必胜”的ai辅助神器，有需要

苏浅晴
2025年09月26日
43
百科栏目

分享辅助“微乐吉林麻将老是输怎么搞提高胜率（专用辅牌神器免安装）

软件神器登场!微信金花挂怎么弄(开挂辅助插件)“我们专注于各类软件定制开发，已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”微信金花挂怎么弄是一款可以让一直输的玩家，快速成为一个“必胜”的ai辅助神器，有需要的用户可以加微下

雨真
2025年11月06日
19
作者专栏

一个问题会无意识暴露自己性格！快来看看说的准不准

也许你也好奇过：为什么大家喜欢的音乐会不太一样呢？或许有些人会认为，这只是个人欣赏品位的不同。然而，心理学研究表明，“音乐偏好”和人格特质之间存在着千丝万缕的联系——也就是说，一个人喜欢的音乐类型，可能正是Ta性格的一面镜子。图库版权图片，转载使用可能引发版权纠纷你的性格特征，就藏在你喜欢的音乐里！

神都未醒
2025年11月09日
11
生活经验

中国疫情什么稳定（中国疫情平稳时间）

国内疫情什么时候能稳定控制下来被问及接下来的疫情形势，中国工程院院士钟南山表示：“接下来中国还会再度出现疫情病例新增的情况，新冠疫情在国内大都维持在一个月左右。中国能够凭借抗疫期间累积的经验，针对反复的疫情局势进行有效的控制。虽说疫情无法得到控制，但是可以对

傲柏
2025年04月24日
249
生活经验

奇迹麻将其实确实有挂(真的有挂确实有挂)/奇迹麻将买个挂多少钱

四川地区人去世后,有亲属打麻将的风俗吗?〖壹〗、在四川地区，确实存在逝者去世后亲属在旁边打麻将的风俗。这种风俗可能源于对生死的另一种看法，即生死轮回，应坦然面对。在丧事期间，亲属们会停灵三天供人吊孝，晚上则需守孝，而打麻将则成为了一种消磨时间的方式。成都地区无论喜事还是丧事都讲究热闹，打麻将

章欢
2025年08月10日
151
作者专栏

不到24小时，人民日报两次点名马龙，原来樊振东一个字都没说错

三十七岁了，谁能想到还在赛场上的马龙，训练馆照常点灯，汗水一滴不落地下。生日蛋糕没时间切，队服早已湿透。运动员，副主席，双重身份一天换着来。他站在全运会参赛名单里，还说要再为北京队拼一场。“别人觉得他早应该退了，他偏偏又选择出发。”马龙的名字，这些年其实没怎么从新闻里消失过。一年到头，多少孩子学乒乓

孤风
2025年10月24日
32

发表回复

本站作者后才能评论

评论列表（4条）

幼琴 2025年11月19日

我是视听号的签约作者“幼琴”！

回复
幼琴 2025年11月19日

希望本篇文章《全世界在等的Gemini 3终于来了，强到断崖领先，连马斯克OpenAI都夸好》能对你有所帮助！

回复
幼琴 2025年11月19日

本站[视听号]内容主要涵盖：国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

回复
幼琴 2025年11月19日

本文概览：智东西11月19日报道，今天凌晨，谷歌最强推理模型Gemini 3终于亮相，一个模型囊括了原生多模态、推理、Agent多种能力。谷歌DeepMind研究团队称，这是全球最先进的...

回复

全世界在等的Gemini 3终于来了，强到断崖领先，连马斯克OpenAI都夸好

01.

分分钟造出交互游戏 、App

还能帮你学新知识

02.

屠榜评测集

刷新大模型能力天花板

03.

全新Agent开发平台亮相

实现端到端软件开发自动化

04.

结语：免费开放+性能飙升！

Gemini 3搅动大模型竞争格局

本文作者

文章推荐

发表回复

评论列表（4条）

联系我们

分分钟造出交互游戏、App