OpenAI的幕后大神!全球最强GPU程序员,扎克伯格亲自挖墙角!

在阅读此文之前,辛苦您点击一下“关注”,既方便您进行讨论和分享,又能给您带来不一样的参与感,感谢您的支持!编辑:欣阅在人工智能的叙事中,无数算法和模型的名字如雷贯耳,但一个神秘...

在阅读此文之前,辛苦您点击一下“关注” ,既方便您进行讨论和分享 ,又能给您带来不一样的参与感,感谢您的支持!

编辑:欣阅

在人工智能的叙事中,无数算法和模型的名字如雷贯耳 ,但一个神秘的代号“Bob ”,最近却在科技圈中,揭示了这场竞赛的另一个维度 。

据说这位“Bob ”是仅凭一己之力编写出支撑OpenAI每日数万亿次计算量核心代码的神秘人物 。

OpenAI的幕后大神!全球最强GPU程序员	,扎克伯格亲自挖墙角!

他写的训练内核,对精度的要求达到了令人发指的地步,因为一个微小的bug就可能让价值连城的算力付诸东流 ,导致整个训练任务回滚到上一个检查点。

当外界还在猜测“Bob”究竟是谁时,OpenAI的内部早已给出了答案。员工们创造了一个名为“Bobmagic”的Slack专属表情包,用来表达对技术难题被瞬间化解的崇敬 。

种种线索 ,最终都指向了一个名字:ScottGray。那为什么一个专注于底层代码、默默无闻的工程师,会被推上神坛,甚至成为科技巨头之间秘而不宣的“战略武器 ”?

OpenAI的幕后大神!全球最强GPU程序员	,扎克伯格亲自挖墙角!

和芯片讲悄悄话

ScottGray的价值 ,源于他一套近乎偏执的反传统哲学。在大多数开发者还在使用英伟达提供的官方工具链,依赖层层封装好的软件抽象时,他却早已看穿了这套体系的“性能天花板” 。

这个行业标准流程 ,就像一套多重翻译系统。开发者用高级语言CUDAC++写下指令,这些指令先被翻译成中间语言PTX,再由官方汇编器ptxas翻译成GPU能直接执行的底层机器码SASS。每一层翻译 ,都意味着性能的损耗和对硬件控制力的丧失 。

OpenAI的幕后大神!全球最强GPU程序员,扎克伯格亲自挖墙角!

ScottGray认为,官方的汇编器ptxas在寄存器分配和指令调度这些关键环节上 ,做得并不够好,甚至可以说是低效的。他无法忍受这种隔靴搔痒的沟通方式,他要做的 ,是绕过所有“官方语言”,直接与那块硅基芯片的灵魂对话。

为此,他亲手打造了一件“神器 ”——一个名为maxas的汇编器 。通过maxas ,他对GPU的掌控达到了匪夷所思的程度:寄存器的每一次分配 、内存延迟的精确计算 、指令流水线的完美衔接 ,全部实现了绝对的手动控制。

OpenAI的幕后大神!全球最强GPU程序员,扎克伯格亲自挖墙角!

这听起来像天方夜谭,但他用一个无可辩驳的实验证明了自己。他使用maxas手写了一个SGEMM(单精度通用矩阵乘法)内核 ,在当时的GM204GPU上,这个内核跑出了硬件理论峰值98%的计算效率 。更惊人的是,这个成绩比英伟达自家专家团队呕心沥血优化的官方cuBLAS库 ,还要快上4.8% 。

他用代码证明了一个事实:硬件厂商制定的“黄金标准”,并非不可逾越的物理定律。在NervanaSystems工作的这段时间,他将这套方法论进一步推广 ,开发出名为maxDNN的卷积库。它采用了128位纹理加载、激进双缓冲等一系列汇编级的“黑魔法”,在AlexNet等经典模型上,效率稳定在93-95%的恐怖区间 。

OpenAI的幕后大神!全球最强GPU程序员	,扎克伯格亲自挖墙角!

作为对比,当时官方的cuDNN效率则像过山车一样,在32%到57%之间剧烈波动。在某个特定卷积层上 ,maxDNN的效率峰值甚至摸到了96.3%的极限。

正是这些无可辩驳的数据 ,为他赢得了前CEO口中“全球最强GPU程序员 ”的赞誉 。他向业界证明,真正的极致性能,隐藏在被大多数人忽略的硬件底层深处。

OpenAI的幕后大神!全球最强GPU程序员	,扎克伯格亲自挖墙角!

从拧螺丝到画蓝图

2016年加入OpenAI后,ScottGray的角色完成了一次战略性的升维。他不再仅仅是那个追求极致性能的“工匠”,而是成为了公司宏大技术蓝图的“使能者” 。

OpenAI的“ScalingLaws ”理论横空出世 ,它用无可辩驳的数据指出,模型规模的扩张是通往更强人工智能的关键路径。整个行业都为之疯狂,但一个现实的物理墙很快挡在了所有人面前:稠密模型的无限扩张 ,意味着计算量和成本的指数级爆炸。

OpenAI的幕后大神!全球最强GPU程序员,扎克伯格亲自挖墙角!

就在大家觉得这条路快要走到尽头时,ScottGray的工作为OpenAI开辟了一条全新的航道 。他的工作重心 ,从单纯压榨现有算法的极限,转变为创造一种全新的计算范式,让“更大”成为可能。

2017年 ,他作为第一作者 ,发表了一篇关于块稀疏GPU内核的论文。这篇论文的核心思想简单粗暴:既然模型中有很多权重接近于零,与其一个个跳过这些零值,不如直接将整块整块的权重矩阵置零 ,然后在计算时“无视”这些零值块 。

这种方法带来的效率提升是数量级的 。他亲手编写的高性能内核,在处理这类稀疏模型时,比处理稠密矩阵的cuBLAS或通用稀疏矩阵的cuSPARSE要快上几个数量级。

OpenAI的幕后大神!全球最强GPU程序员	,扎克伯格亲自挖墙角!

这意味着,在同等算力预算下,OpenAI可以构建出参数量远超竞争对手的庞大模型 ,比如一个宽度达到传统模型5倍的LSTM。这不再是简单的性能优化,而是直接将ScalingLaws的理论发现,稳稳地转化为了工程上的巨大优势 。

也正因如此 ,他的名字开始频繁出现在OpenAI那些里程碑式的论文中,从GPT-3到GPT-4的技术报告,无一例外。他不再是那个只追求“更快 ”的工程师 ,而是通过底层的革命性创新 ,为顶层的算法研究者们开辟了“更大 ”、“更高效”的新大陆,重新定义了什么在工程上是“可能的”。

OpenAI的幕后大神!全球最强GPU程序员,扎克伯格亲自挖墙角!

小扎的秘密愿望单

ScottGray的存在 ,已经超越了技术本身,成为硅谷AI人才战争进入白热化的一个生动缩影 。他的价值,由他个人的极端稀缺性和对公司的极端重要性共同定义。

编写高性能训练内核 ,这项技能的门槛高得吓人。它要求一个人必须同时是并行计算专家 、GPU硬件架构大师和深度学习算法的行家 。能够将这三大领域的知识融会贯通,并做到世界顶尖水平的人,据业内估算 ,全球可能不超过一百个。

OpenAI的幕后大神!全球最强GPU程序员,扎克伯格亲自挖墙角!

在OpenAI内部,一位前同事曾感叹 ,自己耗费整整一周都无法解决的性能瓶颈,ScottGray只用了几分钟就定位并解决了。这种降维打击般的能力,让“Bobmagic ”的表情包在公司内部广为流传 ,成为一种图腾 。

这种内部的崇拜 ,不可避免地会外溢,成为外部世界觊觎的目标。一个广为流传的段子是,当“Bob”的故事在网上发酵后 ,Meta的CEO马克·扎克伯格已经将他列入了“暗挖名单”。

OpenAI的幕后大神!全球最强GPU程序员,扎克伯格亲自挖墙角!

这并非空穴来风 。在此之前,Meta已经成功从OpenAI挖走了多位核心研究员 ,这场围绕顶尖人才的战争早已硝烟弥漫 。像ScottGray这样的人物,被硅谷的AI公司视为核心机密资产,他们通常不会公开承认自己的具体身份和贡献 ,以避免被对手盯上。

这揭示了当前AI竞赛的本质:囤积再多的GPU显卡,也只是打赢战争的物质基础。真正决定胜负的,是那些能够将这些硬件潜能100%压榨出来的顶尖人才 。一个不可复制的ScottGray ,其战略价值,甚至超过了成百上千块物理显卡。

OpenAI的幕后大神!全球最强GPU程序员,扎克伯格亲自挖墙角!

结语

在AI时代的聚光灯下 ,我们习惯于为那些发布颠覆性模型的科学家和侃侃而谈的CEO们欢呼。但真正的英雄 ,或许也包括像ScottGray这样的人 。

他们在沉默中,用一行行汇编代码,为摩尔定律“续命 ” ,为人工智能这座摩天大楼,打下了最坚实、最深入地核的地基。

OpenAI的幕后大神!全球最强GPU程序员,扎克伯格亲自挖墙角!

他代表了AI发展中一个容易被忽视 ,却至关重要的维度——工程的深度,最终决定了理论所能企及的高度。

奥特曼和他的公司能否守住自己的“Bob”,或许将是这场漫长AI长跑中 ,一个值得持续关注的关键变量 。

本文来自作者[怀儿小公主]投稿,不代表视听号立场,如若转载,请注明出处:https://cn.stddy.com/zlan/202510-48776.html

(4)

文章推荐

发表回复

本站作者后才能评论

评论列表(4条)

  • 怀儿小公主
    怀儿小公主 2025年10月04日

    我是视听号的签约作者“怀儿小公主”!

  • 怀儿小公主
    怀儿小公主 2025年10月04日

    希望本篇文章《OpenAI的幕后大神!全球最强GPU程序员,扎克伯格亲自挖墙角!》能对你有所帮助!

  • 怀儿小公主
    怀儿小公主 2025年10月04日

    本站[视听号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 怀儿小公主
    怀儿小公主 2025年10月04日

    本文概览:在阅读此文之前,辛苦您点击一下“关注”,既方便您进行讨论和分享,又能给您带来不一样的参与感,感谢您的支持!编辑:欣阅在人工智能的叙事中,无数算法和模型的名字如雷贯耳,但一个神秘...

    联系我们

    邮件:视听号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们