来源:硬AI
10 月 6 日,在纽约 Casa Cipriani 举行的 Citadel Securities Future of Global Markets 2025 会议上,英伟达创始人兼首席执行官黄仁勋 (Jensen Huang) 与红杉资本合伙人 Konstantine Buhler 就人工智能和下一个增长前沿进行了交谈。
黄仁勋表示,在1993年创立时,英伟达预见到通用计算(CPU)的局限性与摩尔定律的终结,从而确定了“加速计算”的战略方向。英伟达同时发明新技术和现代 3D 游戏这一巨大市场,解决了“鸡生蛋还是蛋生鸡”的困境。
进入 AI 时代,英伟达通过 “CUDA Everywhere” 策略,将 CUDA 推广至科研界。2011-2012 年,随着与 Geoffrey Hinton、吴恩达等研究人员的合作,并提供 cuDNN 等使能技术,英伟达加速了 ImageNet 等竞赛的突破。基于深度学习是“通用函数逼近器”的洞察,英伟达做出了彻底重塑计算堆栈,将 AI 集成到所有芯片、系统和软件中的重大战略决策,奠定了其 AI 革命核心地位。
2016 年,英伟达推出首台 AI 工厂 DGX-1(首个客户为 OpenAI),进入超大规模计算领域。其成功的核心秘诀在于**“全栈协同设计”:同时设计和集成整个基础设施(网络、CPU、GPU),并运行统一软件栈。这种高度集成使其突破摩尔定律限制**,实现代际间约 10 倍的性能飞跃,为客户提供极高能效,并大幅增加 AI 工厂的收入产出。
黄仁勋反驳 AI 泡沫论,强调 AI 已在超大规模数据中心(如搜索、推荐系统)实现数千亿美元的实际 ROI。他预测,AI 将开创两个万亿级新市场:
数字劳动力(Agentic AI): 创造 AI 软件工程师、AI 律师等 “数字人”。
物理 AI(机器人技术): 通用 AI 驱动的多 “具身”机器人(如自动驾驶、人形机器人)。
他总结,未来计算的本质是 100% 生成式,一切内容都将被实时智能生成。要支持机器人(需要训练、模拟、运行三类计算机)和生成式范式,AI 工厂是不可或缺的基础设施,其市场需求正处于数万亿美元的爆发初期。
以下为要点总结:
“我们相信,我们能解决的计算问题规模几乎是无限的,因此,总有一天,一种新型的计算方法会出现。我们公司专注于用一种叫做“加速计算”的技术来增强和补充通用计算。这就是我们最初的观察。”
“我认为 CUDA 的发明,部分是技术上的发明,即我们观察到如何将 GPU 通用化;但很大程度上也关乎新产品的发明,如何将其推向市场;新战略的发明,如何让市场接受它;以及最终发明了能够创造飞轮效应的生态系统,从而促成一个计算平台的诞生。”
“我们得出的结论是,这是一个通用的函数逼近器(universal function approximator)。... 那么问题就变成了:它能解决什么问题?现在你反过来问这个问题,我们得出的结论是,我们想解决的大多数问题都可以包含一个深度学习的组件。所以我们决定去思考,深度学习在 10 年、20 年后会发展到什么程度。”
“我们不是在设计一个芯片,我们是在一次性设计一整套基础设施。我们是当今世界上唯一一家公司,你可以给它一栋楼、一些电力和一张白纸,我们就能创造出其中的一切。所有的网络、交换机、CPU、GPU,那整个工厂里的所有技术,我们都能建造。而且它们都运行着来自英伟达的同一个软件栈。”
“这就是像 Harvey、Open Evidence、Cursor 这类 AI 原生公司出现的原因。它们将连接到 AI 模型,并将有史以来第一次,去开拓一个以前从未被技术触及的行业——劳动力行业。”
“你未来的计算机就像你面前的一位 CEO,或者是一位艺术家、一位诗人、一位故事讲述者,你与它协作,为自己创造独特的内容。所以,未来的计算是 100% 生成式的。其背后需要一个 AI 工厂,这就是为什么我 100% 肯定我们正处于这段旅程的开端。”
以下为访谈原文:
Konstantine Buhler:
大家早上好。我的名字是 Konstantine Buhler,是红杉资本(Sequoia Capital)专注于人工智能投资的合伙人。英伟达和 Citadel Securities 其实有很多共同点,它们都是卓越的企业。
黄仁勋:
运营得非常好,非常出色。
Konstantine Buhler:
是的,它们都运营得非常出色,都由计算革命驱动,并且都是各自行业内以技术领先的领导者。它们还有一个不太为人所知的事实:两家公司的第一个外部投资者都是红杉资本。
黄仁勋:
在 1993 年,他们冒着风险向英伟达投资了 100 万美元。
Konstantine Buhler:
你值得这笔投资。
黄仁勋:
整整 100 万美元,先生,他们可是担了极大的风险。
Konstantine Buhler:
所以,当我们被邀请在这次会议上谈论人工智能时,谁是世界上最合适的人选,答案是显而易见的。他为人工智能革命构建了整个基础设施,所有的人工智能都建立于此;他缔造了世界上最有价值的公司。请和我一起欢迎黄仁勋(Jensen Huang)先生。
黄仁勋:
欢迎。
英伟达起源:1993 年洞见
Konstantine Buhler:
Jensen,这个房间里坐满了世界上最优秀的机构投资者。他们管理着数万亿的资产,并且不断在寻找优势。你就是一个总能拥有优势的人。在我们每一次的交谈中,你都对未来有令人信服的见解。在接下来的 60 分钟里,我们有一个宏大的议程:涵盖从英伟达创立之初到其崛起成为人工智能革命中心的故事,然后我们将把大部分时间花在探讨英伟达和人工智能的未来上。好的,让我们从头开始吧。时间回到 1993 年,你 30 岁。是什么样的洞察力让你拥有了创办英伟达的优势?
黄仁勋:
我们当时正在经历个人电脑(PC)革命和中央处理器(CPU)的革命,那是摩尔定律的时代。当时的热点是集成微处理器、英特尔、摩尔定律以及晶体管的微缩定律,硅谷在计算机行业的几乎所有投资都集中于此。而我们观察到了一些不同的东西。我们认为,CPU 的一个好处是它的通用性,但通用技术的根本问题在于,它们在处理非常困难的问题时,往往表现得不够出色。
因此,我们推断了两件事:第一,我们观察到有些问题可以用一种更针对特定领域、目标更明确的加速器来解决,这些问题可能很有解决价值。第二,我们观察到通用技术,即晶体管的不断缩小,最终会达到极限。那种认为可以利用所谓的“丹纳德微缩定律”(Dennard Scaling)不断缩小晶体管尺寸并进行扩展的想法……实际上,摩尔定律背后的基本原理是由米德(Mead)和康威(Conway)提出的。如果你回溯这些原理,你会发现晶体管的微缩程度将会有个极限,总有一天你会得到递减的回报。
我们相信,我们能解决的计算问题规模几乎是无限的,因此,总有一天,一种新型的计算方法会出现。我们公司专注于用一种叫做“加速计算”的技术来增强和补充通用计算。这就是我们最初的观察。你刚才提到英伟达如何总是领先一步,这通常是因为如果你从第一性原理出发进行推理,思考今天运行得非常好的东西,问自己:我们的第一性原理建立在什么基础上?这个基础又将如何随时间变化?这就有希望让你洞见未来。
从图形加速器到 CUDA:市场与技术发明
Konstantine Buhler:
所以,当你制造出图形加速器时,你入场很早,但随后涌现了数百个竞争对手。最终你在那个市场中胜出。在 2000 年代初期,你意识到这项技术或许可以通用化。你刚才谈到 CPU 的通用性,或许 GPU 也可以被通用化以进行更多的处理。我们来谈谈 CUDA。这个想法是怎么来的?你是从哪里获得这个洞察的?有传言说是来自研究人员,你是如何通过阅读他们的研究,得出 GPU 可以成为通用计算机的结论的?
黄仁勋:
首先,创建英伟达的困难之处在于,我们必须发明一种新技术,同时创造一个新市场。在 1993 年,要创建一个新的计算平台,你需要一个巨大的市场。当时正在做 3D 图形的硅谷图形公司(Silicon Graphics),其市场太小,不足以支撑一个新的计算平台。因此,如果我们想创造一种新的计算架构,就需要一个巨大的市场,但这个市场因为架构不存在而尚未存在,这就陷入了“鸡生蛋还是蛋生鸡”的问题。英伟达擅长的,以及我们为现代 3D 游戏市场做出的巨大贡献正在于此。
当时红杉资本对投资英伟达的主要顾虑是,我们必须同时发明技术和市场,而这两件事同时发生的概率大约是 0%。我至今仍记得,当我向唐·瓦伦丁(Don Valentine)推介时,他问:“Jensen,你的杀手级应用在哪里?”我说:“有一家叫艺电(Electronic Arts)的公司。”我当时并不知道唐刚刚投资了艺电。我接着说:“我们将帮助他们制作 3D 图形游戏,并创造这个市场。”他回答说:“Jensen,我想让你知道,我们投资了艺电,他们的首席技术官才 14 岁,每天由人开车送去上班。你却告诉我这是你的杀手级应用?”总而言之,我们最终创造了现代 3D 图形游戏生态系统,如今它已成为世界上最大的娱乐产业之一。
3D 图形的根本问题是模拟现实。如果你回归第一性原理,它所做的就是试图重现现实。而再现逼真图像和动态世界的数学基础,本质上是物理模拟。因此,线性代数显然至关重要,我们认识到了这一点。
问题是,如何将通用的东西引入到非常专业化的领域?这正是我们公司的伟大发明。我们发明了技术,创造了市场,还开辟了路径,使我们能够系统地从一个非常垂直的行业,成长为越来越通用的平台。这种情况很少发生。这条路很难走,但我不想占用剩下的时间来解释。我认为 CUDA 的发明,部分是技术上的发明,即我们观察到如何将 GPU 通用化;但很大程度上也关乎新产品的发明,如何将其推向市场;新战略的发明,如何让市场接受它;以及最终发明了能够创造飞轮效应的生态系统,从而促成一个计算平台的诞生。
我们发明了所有这些东西,它们都是全新的。如果你退后一步问自己,除了 ARM 和 x86,世界上还有哪一个几乎人人都在使用的计算平台?答案是不存在。所以,发明一个新的计算平台是极其罕见的。对我们而言,这花费了将近 30 年的时间。
AI 革命起点:2012 年 ImageNet 突破
Konstantine Buhler:
所以你成功地将这个非常专业化、性能极高的加速设备通用化了,使得世界各地的研究人员和学者能够更快地运行他们的处理任务。他们之前面临的摩尔定律限制突然之间被极大地放宽了。现在让我们快进到 2010 年代初。当时,深度学习还是一个学术界的冷门领域,神经网络的概念经历了一个“寒冬期”。然后在 2012 年,AlexNet 在计算机视觉领域取得了突破,而这一切都是在英伟达的 GPU 上加速完成的。那是不是你意识到人工智能革命正在成为现实的时刻?如果是,你是如何抓住这个机遇的?让英伟达成为这场革命中心的关键优势是什么?
黄仁勋:
有两个偶然的时刻,以及一个关于深度学习的、源于第一性原理的伟大观察。我当时正试图解决计算机视觉问题。我们想解决计算机视觉问题有很多不同的原因。当时的计算机视觉技术非常脆弱,难以泛化,只是一系列技巧的集合。我非常讨厌这个行业的发展方式,我们对进展感到相当沮丧。
与此同时,我们普及架构的一项主要策略是,让高等教育领域的科学家使用我们的平台——CUDA。我从地震处理、分子动力学、粒子物理学、量子化学等领域开始推广。我把英伟达 CUDA带到了世界各地。公司当时确实有一个叫做“CUDA Everywhere”的战略,意思就是我(Jensen)在全世界到处奔走。我去了世界各地的大学与研究人员会面。这项将CUDA引入高等教育和科研领域的举措,促使一些研究人员在2011、2012年左右联系我们。
当时,Geoffrey Hinton、吴恩达(Andrew Ng)和杨立昆(Yann LeCun)都试图解决计算机视觉问题,因为一个由李飞飞(Fei-Fei Li)负责的名为ImageNet的竞赛即将举行。而我也在试图解决计算机视觉问题。所以当你自然而然地试图解决一个问题时,所有这些有趣的人也在解决类似的问题,他们就会吸引你的注意。这就是机缘巧合。
而那个伟大的观察是,我们可以为他们创造一种新型的求解器,叫做cuDNN。这就像我们为网络计算(in-network computing)发明的技术,可以类比于存储计算(in-storage computing)的后续发展。这种计算方式,这个名为cuDNN的库,使得他们所有人都能成功地使用CUDA。
我看到了和大家一样的结果,所有人都看到了计算机视觉效率的巨大飞跃。但我们更进一步,去思考:这项技术为什么在计算机视觉方面如此出色?它还能在哪些方面表现出色?深度神经网络之所以能够做到非常“深”,是因为每一层都独立于其他层进行训练,并且可以从一个损失函数一直反向传播到其输入端。你可以用它来学习几乎任何函数。
我们得出的结论是,这是一个通用的函数逼近器(universal function approximator)。如果我们能再增加一个状态——卷积神经网络(CNN)是一种二维、多维的模式识别器,循环神经网络(RNN)在其中提供了一个状态机,长短期记忆网络(LSTM)提供了更好的状态机,而Transformer则提供了终极的状态机。因此,我们有了一个可以学习几乎任何函数的通用函数逼近器。那么问题就变成了:它能解决什么问题?现在你反过来问这个问题,我们得出的结论是,我们想解决的大多数问题都可以包含一个深度学习的组件。所以我们决定去思考,深度学习在10年、20年后会发展到什么程度。
我们将计算问题分解开来,得出的结论是,每一个芯片、每一个系统、每一款软件、计算堆栈的每一层,都可以被彻底重塑。而我们决定去实现这一点的决策,可能是历史上最好的决策之一。
AI 工厂:从 DGX1 到全栈平台
Konstantine Buhler:
我当时正在斯坦福大学做人工智能研究,主要的限制始终是计算能力。我们只有有限的集群来运行这些算法。而英伟达的出现,不仅放宽了计算能力的限制,还通过CUDA基础设施使其成为可能。这在很大程度上就是你的历史:让越来越多的计算成为可能。2016年,你非常有名地创造了世界上第一座人工智能工厂——DGX-1。你还亲手把它交付给了在OpenAI的埃隆·马斯克(Elon Musk)。
黄仁勋:
我制造了这台全新的计算机,它的外观和工作方式都是前所未见的。我记得在GTC上宣布它时,观众完全不知道我在说什么,得到的掌声就像在讲一个笑话一样稀稀拉拉。
就在那次GTC上,我邀请了埃隆来谈论我们俩都在做的自动驾驶汽车。他上台后说:“Jensen,那台计算机是什么?”我说:“是DGX-1,我为这个目的而建造的。”他说:“我可以用一台。”我心想,哦,终于拿到一张采购订单(PO)了。然后他说:“我有一个非营利组织……”
当你创造出一个全新产品时,最不想听到的就是你的第一个客户是一个非营利组织。但不管怎样,我还是交付了。我当时就像是送电脑的“Doordash”小哥,把这台电脑“外卖”到了旧金山,那家公司就是OpenAI。
Konstantine Buhler:
它现在是一个盈利能力很强的非营利组织了。
黄仁勋:
我们已经合作了很长时间。从那以后,他们的每一个模型都是在英伟达的平台上构建的。
Konstantine Buhler:
而且这个东西的实体非常巨大。当Jensen谈论一台计算机时,我们说的是一个巨大的设备。
黄仁勋:
当人们听到我们的GPU时,他们可能会想象一个很小的GPU。但我们的一个GPU现在是机架规模的,重达两吨,功率12万瓦,价值约300万美元。那才是一个GPU。我们当然也卖小一些的GPU,就是Geoffrey Hinton用的那种,大概500到1000美元,可以插在你的PC上,用来玩电子游戏或搞AI。但我们也有更大的GPU,一个1千兆瓦的人工智能工厂GPU大约价值500亿美元。
Konstantine Buhler:
跟我们讲讲这些人工智能工厂吧。你可能有小型的“AI搅拌机”,但你也有这些真正巨大的“AI工厂”。你在2016年就全力投入,并断言世界将需要人工智能工厂。你是如何获得这种洞察力和信念的?
黄仁勋:
你只需要对此进行推理。我们建造了第一台DGX-1,它是当时世界上最昂贵的计算机,每个节点30万美元,但它并不算成功。所以我得出结论:我们把它造得还不够大。于是我们造了一个更大的,第二个就变得超级成功。
现在的问题就变成了,你应该把它造多大,以及你应该把计算能力推向多高的极限?事情发展如此之快的原因在于英伟达的产品周期和我们的创新、设计方式。我们不是在设计一个芯片,我们是在一次性设计一整套基础设施。我们是当今世界上唯一一家公司,你可以给它一栋楼、一些电力和一张白纸,我们就能创造出其中的一切。所有的网络、交换机、CPU、GPU,那整个工厂里的所有技术,我们都能建造。而且它们都运行着来自英伟达的同一个软件栈。因为我们能做到这样的集成,我们也能以极快的速度前进。
所以我可以重新设计下一年的产品,再重新设计下下一年的,并且每一年发布的产品都保持软件兼容。软件兼容性的好处就是速度。PC之所以能够发展得那么快,就是因为它们都与Windows兼容。因此,只要你遵循这个技术栈的标准,你就可以随心所欲地快速制造芯片。所以我们现在正以物理上可能的极限速度,随心所欲地建造人工智能工厂。
因为我们正在以令人难以置信的规模进行创新和协同设计——我们同时改变算法、软件、网络、CPU和GPU——我们突破了正在放缓的摩尔定律的限制。因此,我们每一代产品都将性能水平提升约10倍。这是我们每年带给市场的令人难以置信的性能水平。我们这么做的原因是,我们相信在地平线之外,总有一个问题是如此巨大,以至于你需要一台更大、更快的计算机。
另一方面,当我们在相同功耗下提升性能时,我们实际上是在降低你的成本。我们正在以极快的速度降低成本,这让客户能做更大的事,也让他们能用同一个工厂创造更多收入。英伟达如今能被广泛采用,是因为我们同时拥有最高的性能和最大的规模。所以如果你想要巨型系统,你可以做到。同时我们也是成本最低的,因为我们的性能非常高。
举个例子,如果你的数据中心是1千兆瓦,你就无法获得比这更多的电力了。如果我们的每瓦性能,即每单位能源消耗的性能,是别人的三倍,你的公司就能用那个工厂产生三倍的收入。这就是我称之为“工厂”而不是“数据中心”的原因,它们在用它赚钱。这些人工智能工厂希望不断扩大规模,不断增加收入,不断提高吞吐量。这就是我们创新如此之快的原因。要跟上我们是很难的。这也解释了我们为什么会成功。
AI 投资与 ROI:已见实效
Konstantine Buhler:
Jensen,您已经从一个组件供应商转变为一个完整的平台供应商,这就是面向投资者所说的“AI工厂”概念。您能详细解释一下这个平台包含了什么吗?另外,这个平台的下一步发展会是什么样子?
黄仁勋:
平台包括CPU、GPU和网络处理器。交换机有三种类型:一种是纵向扩展(scale-up)交换机,它可以将一个机架变成一台完整的计算机,我们开创了机架级计算,这被称为纵向扩展。横向扩展(scale-out)则是通过将许多这样的机架连接在一起实现的。这些交换机和网络设备上运行着大量软件,软件位于所有这些硬件之上。然后,您就可以创建一个像这栋建筑一样大小的巨型系统,这栋建筑的功耗大概是100兆瓦。一个千兆瓦的数据中心则需要几千英亩的土地。接下来,您通过更广阔的网络将所有这些数据中心连接起来,让它们能够共同“思考”。这就是我们今天构建的东西。
基础设施建设如此之快有几个原因,现在也存在一些关于泡沫并将其与2000年相比较的问题。在2000年的时候,互联网公司如hospital.com、pets.com大多没有盈利,整个互联网产业的规模大约在200到300亿美元之间。
今天,首先需要看到的是,AI并不仅仅关乎OpenAI、Anthropic等新兴公司。AI正在改变超大规模数据中心(hyperscalers)的运作方式。例如,搜索现在由AI驱动;推荐系统决定了您看到的广告、新闻和故事,电影也是由AI推荐的;用户生成的内容也同样如此。所以,谷歌、亚马逊、Meta的业务——这些数百上千亿美元的收入,都由AI驱动。即使没有OpenAI和Anthropic,整个超大规模数据中心行业也已由AI驱动。因此,首先要认识到,整个行业需要从使用经典机器学习的传统CPU,转向使用AI的深度学习。仅这一项转型就价值数千亿美元。
其次,我们现在有了一个名为“AI”的新市场,它催生了一个生产AI的新产业。因此,OpenAI、Anthropic、xAI、谷歌的Gemini,当然还有Meta,都将成为AI的生产者。这整个AI模型制造商层级也正在建设AI工厂。这些AI将为下一代的新机遇提供动力。
这就是像Harvey、Open Evidence、Cursor这类AI原生公司出现的原因。它们将连接到AI模型,并将有史以来第一次,去开拓一个以前从未被技术触及的行业——劳动力行业。
数字劳动力,即所谓的“代理式AI”(Agentic AI),将补充和增强企业市场。例如,在英伟达,我们100%的软件工程师和芯片设计师都由AI辅助。今天,我们每一位工程师都通过Cursor获得增强,我们在公司内部大量使用Cursor。我们为所有工程师配备了AI,生产力得到了提升,我们的工作质量也变得好得多。
您还会看到另一个新兴行业正在出现,叫做“物理AI”(Physical AI)。因此,我们有企业AI和物理AI来增强劳动力。例如,自动驾驶出租车本质上就是一个数字司机。我们未来将拥有能够嵌入到任何移动物体中的AI。在自动驾驶出租车的例子中,AI嵌入的是方向盘和轮子;但未来,你还会看到拾取和放置的机械臂,可能有一只手臂、两只手臂,甚至三条腿——各种不同的实体形态。这两个行业(企业AI和物理AI)所对应的市场规模,占到了全球100万亿美元经济总量的很大一部分。我们第一次拥有了能够增强这部分经济的技术。这就是为什么人们对下一波AI浪潮如此兴奋。
Konstantine Buhler:
让我们来谈谈前一波浪潮,因为您提到AI已经带来了投资回报。对于投资者来说,Meta是一个很好的案例。2022年第四季度,苹果移除了Meta的归因数据,导致其市值蒸发了数千亿美元。Meta团队当时在想:“我们该如何解决这个问题?” 他们用英伟达GPU驱动的AI解决了这个问题,并将他们的归因能力恢复到了原有水平。这为他们挽回了数千亿美元的市值,使其总市值比低点时高出超过一万亿美元。这完全是由您的GPU所驱动的投资回报。
黄仁勋:
推荐系统是过去最复杂的软件系统之一,不仅Meta在使用。它有几项基础技术:一项是协同过滤,它基于我的行为并观察其他所有人的行为,如果我们有相似的模式,它就会向我推荐同一部电影、您购物清单里的下一个商品、一本书或一个视频。另一项是内容过滤,它仅基于我的身份、偏好以及那本书的具体内容来向我推荐。推荐系统是世界上最大的软件生态系统,而这个生态系统正在非常迅速地转向AI。因此,您将需要大量的GPU。
Konstantine Buhler:
这些系统因几十年前的“Netflix挑战赛”而闻名。现在,Netflix的推荐完全由AI驱动。正如您所说,在亚马逊,当您去购买商品时,有相当大比例的购买行为是由推荐系统促成的。
黄仁勋:
从搜索到AI。
Konstantine Buhler:
从搜索转向AI。现在所有这些——比如TikTok——都是由AI驱动的。
黄仁勋:
是的,转向AI。Google Shorts完全是AI。现在,所有的个性化广告也将转向AI。所以,AI的应用数量真是令人难以置信。请注意,我刚才描述的这些都是传统的用例。量化交易将转向AI,过去由人工设计的特征提取,也将转向AI。
Konstantine Buhler:
这正是Citadel Securities在过去二十多年里一直开拓的领域。这就是传统的AI。
黄仁勋:
Citadel一直是一位非常好的客户。谢谢。
Konstantine Buhler:
那是一个经典的例子。对于在场的投资者来说,谈论AI的投资回报率,它已经以万亿美元市值的形式存在了。接下来我们谈谈未来的支出。到2025年,AI领域的投资总额预计将高达5000亿美元。未来将何去何从?这个领域会成为每年数万亿美元的投资类别吗?
黄仁勋:
是的。可以这么说,AI的制造部分,也就是“代工厂”,是模型制造者。他们就像芯片制造商。有一种理解AI的方式是,大型语言模型就是现代计算机的操作系统。你可以在这些AI模型之上构建应用程序,而且不仅仅是基于一个AI模型,而是基于一个由多个AI模型组成的系统。因此,一个应用程序将连接并使用一组不同的AI。
那么,上层的应用空间是什么?除了我们一直在讨论的、用AI改进所有现有应用之外,一个最合理的比喻就是“数字人”。例如数字软件工程师(即AI编程),这可能是一个数万亿美元的市场机会。还有AI数字护士、AI会计师、AI律师、AI营销人员。我们把所有这些统称为“智能体AI”(Agentic AI)。这项技术正在朝着非常好的方向发展。
因此,技术将首次不再仅仅是会计师使用的工具,或软件工程师使用的工具。我们将创造出数字软件工程师。我不会感到惊讶,未来你会授权使用一些数字人,也会雇佣一些数字人。这取决于它们的质量和专业深度。因此,企业未来的劳动力将是人类和数字人的结合。其中一些将基于OpenAI,一些可能基于Harvey、Cursor或Replit等第三方,还有一些将由你们自己内部培养。我们内部培养了很多自己的AI,因为我们有大量需要保护的专有知识和数据,并且我们具备开发这些AI的技能。随着时间的推移,越来越多的人将能够培养自己的数字AI,因为这样做会变得越来越容易。因此,企业和智能体AI,通过增强劳动力,带来了数万亿美元的机遇。
与以前的软件相比,AI的独特之处在于它需要持续地处理信息。你不能像过去那样预先编译它,把它放进一个二进制文件里,下载然后使用。它必须一直处于处理状态。之所以如此,是因为它需要获取你的上下文,思考你想让它做什么,然后生成一个输出。所以它在不断地思考和生成。这需要机器,需要计算机来完成。这就是“AI工厂”存在的原因。这些AI工厂将部署在云端,也可能在本地(on-prem),遍布世界各地。这可以看作是AI基础设施的一部分,将会有大量的“思考”来产生我们称之为“token”的东西,但其本质是智能。这就是所谓的认知AI,也就是数字劳动力。
第二点是机器人技术。让我给你们做一个思想实验,解释为什么机器人技术离我们如此之近。你现在可以给AI一个提示,比如“让黄仁勋拿起一个瓶子,打开它,然后喝一口”,它就能生成我做这个动作的视频。那么,如果它能生成这一切,为什么不能操纵一个机器人来完成同样的动作呢?这个思想实验表明,这在现在看来是非常有可能的。如果你能设计一个可以驾驶汽车的数字司机,为什么不能让一个实体机器人来驾驶汽车呢?如果一个实体机器人可以被赋予驾驶汽车的能力,为什么不能赋予它操作一个拾取和放置机械臂或任何类型机器人的能力呢?
我们人类有能力“具象化”(embody)几乎任何东西。我们可以拿起刀叉,它们就成为我们身体的延伸;我们可以拿起棒球棒,并将其用作我们身体的延伸。我们能够“具象化”这些物理延伸。未来的AI将能够“具象化”并操纵一辆汽车、机械臂、人形机器人、外科手术机器人等等。因此,我认为这两个市场(数字人和机器人)都在AI的能力范围之内。
最后,举一个例子。当你观察到一个事物实现的可能性时,剩下的就只是工程问题了。我们现在已经看到了一个绝佳的实例,那就是AI软件编码器,这也是我们大量使用它的原因。既然你有了AI软件编码器,为什么不能让它也编写一个营销活动的软件,或者编写软件来帮你解决任何会计问题,或任何你想做的事情呢?所以,这个实例的存在本身就说明了,将其推广到其他领域只是一个工程问题。
同样,我们现在有了自动驾驶出租车。它是一个“具象化”的机器人,控制着方向盘和车轮。既然它存在,为什么不能将其推广开来呢?剩下的也只是工程问题。所以,这是从第一性原理出发,推断这项技术在各行业和社会中普及可能性的一个好方法。接下来你需要思考的是,如何扩大规模?如何将这种智能交付给所有这些不同的应用?答案就是,你需要“AI工厂”。
未来 AI 机会:代理与物理 AI(万亿市场)
Konstantine Buhler:
我们再多谈谈机器人技术。您拥有一支出色的机器人团队,您负责机器人业务的一位高管今天也在这里。在之前的一次谈话中,您分享了关于机器人技术未来发展的一些见解。它会是一个单一的人形机器人项目吗?会是多个开源项目吗?这些开源项目将如何整合?您认为机器人技术将如何真正在物理世界中体现出来,以及时间规划是怎样的?
黄仁勋:
机器人出租车已经出现了,它们在不同城市间进行泛化的能力正快速提升。原因是这背后是相同的基础技术,我们都经历了同样的发展历程。对于在座各位从事量化交易和算法交易的人来说,你们也经历了从人工设计特征、机器学习,到越来越多地使用深度学习、嵌入特定模态和多模态模型,再到如今基本实现端到端的过程。并且,它是多模态的。
在这个过程中,模型的泛化能力越来越强。用于自动驾驶汽车的AI模型和用于人形机器人或普通机器人的AI模型高度相似,只是体现在两种不同的“具身”(embodiment)中。我之所以能肯定这一点,是因为我可以用同一种智能来驾驶汽车和操控我自己的身体。我可以用刀叉,假装自己是外科医生,在牛排上动手术。你会发现,这是同一种AI在不同“具身”中的体现。
这就是AI未来的发展方向。机器人技术正朝着越来越通用的AI发展,这些AI是多“具身”、多模态的。要创造这样的未来,需要三样东西。首先,是我之前提到的AI工厂,用于训练模型。其次,需要一个能让AI在进入现实世界前进行学习的地方,这样它就可以在虚拟世界中进行数万亿次的迭代。这个虚拟世界就像一个电子游戏,AI在其中扮演一个游戏角色,并遵守物理定律。当它学会如何成为一个出色的游戏玩家后——由于我们的模拟器非常出色, simulation-to-real(虚拟到现实)的差距极小——我们称之为Omniverse,也就是Omniverse计算机。然后,机器人就可以走出虚拟世界,物理世界就成了它玩过的虚拟世界的又一个版本。当它进入物理世界时,同样需要一台计算机。
所以,你需要三台计算机:用于训练的AI计算机,用于模拟的虚拟世界计算机(即实验室),以及作为机器人大脑、在物理世界中实际运作的计算机。英伟达提供所有这三种计算机,我们与几乎所有的机器人公司、自动驾驶公司以及各种不同“具身”形态的机器人公司都有合作。这很可能会成为有史以来最大的市场之一。
Konstantine Buhler:
所以,英伟达现在几乎触及了科技的方方面面。正如您过去所说,你们从零开始进入一个市场,并帮助它成长为万亿级别的市场。机器人技术是下一个前沿市场之一。您对还有哪些其他的前沿市场感到特别兴奋?您刚才提到了医疗健康,这是您充满热情的领域吗?还有没有其他领域值得在座的投资者关注?
黄仁勋:
医疗健康所需的技术非常复杂,但我们正在取得飞速进展。如果你能理解单词和字符序列的含义,你或许也能理解像虚拟世界这样有“结构”的东西的含义。我们之所以能生成视频,是因为我们理解了现实世界,从而能生成它的图像化表示。所以,如果你能生成视频,那一定是因为你理解了世界。如果你能理解世界,那么是否有可能理解同样具有结构的蛋白质和化学物质呢?答案是肯定的。
我们正越来越接近理解蛋白质的意义,这得益于AlphaFold等技术。我们也能够理解细胞的意义。我们最近与ARC合作,Evo-2是首批用于细胞表征的大语言基础模型之一。现在你可以对它说:“我希望你生成具有这些特性的其他细胞。”或者你可以直接问细胞:“你有什么特性?你能与什么结合?你的新陈代谢是怎样的?什么可以激活你?”你可以像与聊天机器人对话一样与细胞对话。因此,理解蛋白质的意义……总之,这方面有很多进展,例子不胜枚举。
另外,我为我们将AI引入电信领域的工作感到兴奋,5G和6G将因AI而发生革命性变化。我也为我们与量子计算机的合作感到兴奋,通过创建量子-GPU混合计算系统,我们可以将量子计算的进程提前大约十年。在这些系统中,我们负责纠错、控制量子计算机以及后处理。我们推出了一种名为CUDA-Q的新架构,它将CUDA扩展到了量子领域,并获得了广泛的采用。现在,我们能解决许多以前难以解决的问题。
AI 安全与生成计算
Konstantine Buhler:
Jensen,您最近在我们办公室参加了一场AI会议,并就AI安全的未来及其重要性提出了一些非常精彩的见解。这和刚才的话题有些关联。有些国家行为体可能会干预AI,也有些个人用户可能会不当使用AI。您认为AI安全的未来会是怎样的?
黄仁勋:
未来的AI安全将与网络安全有些相似。它将需要我们整个社区共同努力。您可能知道,所有的网络安全和首席安全官们,我们都是一个庞大的社区。当有人发现入侵时,我们会与所有人共享。当我们发现漏洞时,我们也会与所有人共享。因此,未来的AI安全很可能会像网络安全一样。
其次,如果智能的边际成本,即AI的边际成本趋近于零,那么专注于安全的AI的边际成本为什么不会也趋近于零呢?这一点非常明确。很可能每个AI都会被一大群监视着它的网络安全AI所包围。我们将拥有大量的AI保护者,数千、数百万,遍布公司内外。这就是未来的图景。
“AI本身必须是好的”这个想法很好,但我们不应该依赖于此。就像我们希望一个软件能正常运行,但我们必须假设它可能存在漏洞、病毒或被入侵。我们将尽可能安全地推动AI发展,同时也会在AI周围部署大量的安全AI。
Konstantine Buhler:
您分享过,物理世界的动态与数字世界是脱钩的。在物理世界,可能是一个安保人员对应100个普通人;而在AI世界,这个比例可能会被反转。
黄仁勋:
是的,就像网络安全一样。我们拥有的网络安全代理数量,比公司里从事网络安全工作的人员要多得多。
Konstantine Buhler:
您还分享了一个观点,未来我们不仅有渲染计算,一切都将是生成式的。您能详细解释一下这个预测以及它对英伟达意味着什么吗?
黄仁勋:
最好的例子之一是Perplexity。当你在Perplexity上提问时,你看到的一切都是完全生成的,100%都是。而在Perplexity出现之前,你输入一些内容,它会给你一个列表,你再去点击。所有这些内容都是由某人事先编写或创建的。所以,搜索是基于存储的计算,是基于检索的计算,它检索信息供你自行消费。而Perplexity或AI则是生成式的,它去研究、阅读所有内容,然后为你生成答案。
所以,Perplexity是从传统计算机方法(我们去检索一个文件并阅读它)到生成式方法(基于AI的Perplexity)的一个绝佳范例。另一个例子是,看看我们今天看到的视频,比如Sora、nano banana,所有这些像素都是生成出来的。它由你来设定条件和提示词。你可能会给它一个初始种子,然后说:“我希望你生成一个Constantine和Jensen进行炉边谈话的视频。”然后你再提示说,这次炉边谈话他们会聊一些疯狂的东西。
Konstantine Buhler:
(对线上观众说)顺便一提,我们这个是真的。
黄仁勋:
然后Sora就会生成它。所以,每一个像素,每一个动作,每一个词都是生成的。未来计算的方式很可能就是生成式的。
最后再举一个例子。我们俩刚才的整个交流过程100%是生成式的。你问我的每个问题,我都没有跑回办公室检索某些东西拿给你,然后问“Constantine,这是你要的吗?”,再让你读给大家听。那是过去的计算机。今天的计算机就是我们这样直接互动。我们正在根据此时此地的上下文、根据观众、根据世界正在发生的事情,实时地生成一切。这就是未来的计算机。
你未来的计算机就像你面前的一位CEO,或者是一位艺术家、一位诗人、一位故事讲述者,你与它协作,为自己创造独特的内容。所以,未来的计算是100%生成式的。其背后需要一个AI工厂,这就是为什么我100%肯定我们正处于这段旅程的开端。我们现在为这个每年可能需要数万亿美元基础设施的市场,只建造了区区几千亿美元的基础设施。这是最容易理解其前景的方式。
Konstantine Buhler:
而这种计算范式更像人类的思维。
黄仁勋:
是的,它在思考。
英伟达的投资洞见
Konstantine Buhler:
如果你准备好了,我们来回答几个闪电战式的问题吧?在最后几分钟里。我不知道那个答案对应的是什么问题,所以我们直接开始吧。哪一个华尔街最不看重的关键绩效指标(KPI)?
黄仁勋:
在未来的人工智能工厂中,你每单位能源的吞吐量决定了你客户的收入。这不仅仅是选择一个更好的芯片,而是决定你的收入会是多少。事实上,如果你回顾一下所有的云服务提供商(CSP),那些做出正确选择的公司收入实现了增长,而那些行动迟缓的公司随后也做出了正确的选择。所以你可以看到这种情况正在发生,人们也开始理解这一点。你的吞吐量——也就是工厂每单位能源的令牌生成率——就是你的收入。
Konstantine Buhler:
英伟达平台中最被低估的部分是什么?
黄仁勋:
大多数人都在谈论CUDA,CUDA非常重要。但在CUDA之上,还有一套库。我今天早些时候提到了一个,叫做cuDNN。它可能是有史以来创造的最重要的库之一。上一个具有同等重要性的是SQL,而这一个就是cuDNN。还有其他一些,比如cuDF,以及将用于半导体制造光刻技术的cuLitho。我们大约有350个这样的库。这些库,就是英伟达的宝库。
Konstantine Buhler:
您认为哪一项技术被严重低估,哪一项又可能被高估了?
黄仁勋:
被低估的,我认为是虚拟世界。我们称之为Omniverse,它是一个供实体AI学习如何成为一个优秀的实体AI的虚拟世界。这很难理解,但它被严重低估了。这并非因为人们用或不用它,而是因为他们还不知道自己需要它。但现在,Omniverse正席卷机器人行业,每个人都开始明白了。一旦你开始制造机器人,你就会意识到这是多么有远见。我们差不多十年前就开始研发Omniverse了。所以,Omniverse非常重要。
Konstantine Buhler:
哪本书对您的商业和领导力哲学影响最大?
黄仁勋:
我最喜欢的书之一是大家的第一本微积分教材,那时你意识到数学是一种情感。那是一本好书。克莱·克里斯坦森(Clay Christensen)的所有书都很棒,他已经去世了,但曾是一位好友。阿尔·里斯(Al Ries)的《定位》(Positioning)是一本非常好的书。如果你还没读过,杰弗里·摩尔(Geoffrey Moore)的《跨越鸿沟》(Crossing the Chasm)也是一本好书。但基本上,克里斯坦森的所有书都应该读一读。
Konstantine Buhler:
最喜欢的慰藉食物是什么?
黄仁勋:
炸鸡。
Konstantine Buhler:
好的,我们得到答案了。最后一个问题:如果您是现场的一位首席信息官(CIO),未来几年有100亿美元的预算用于人工智能,您会投资什么?
黄仁勋:
我会立刻尝试构建自己的人工智能。我们为如何引导员工入职而自豪——我们采用的方法,我们将他们融入公司理念的文化,使公司之所以成为公司的运营方法和实践,以及我们长期积累并让他们可以访问的数据和知识集合。这些是过去定义一家公司的东西。
未来的公司当然也包括这些,但你需要为人工智能做同样的事情。你需要引导AI员工入职。我们有一套引导AI员工的方法,我们称之为“微调”,这基本上是在教它们文化、知识、技能和评估方法。因此,你需要去学习如何打造你的“智能体员工”的整个飞轮。
我告诉我的CIO,我们公司的IT部门未来将成为智能体AI的人力资源部,成为未来数字员工的人力资源部。这些数字员工将与我们的生物员工一起工作。这就是我们公司未来的形态。所以,如果你有机会这样做,我建议立刻着手。
Konstantine Buhler:
谢谢你,Jensen。我们听到了一个不可思议的故事。英伟达的故事是一个卓越的泛化故事:从一个加速图形处理器,发展到今天驱动全世界所有人工智能的技术;从一个组件和世界上第一块GPU,发展到构成世界AI工厂平台的所有组件。我们谈到了服务如何成为这场新革命的基石,以及机器人技术如何融入我们所有人的未来。我们谈了外交政策,甚至还提到了炸鸡。你面面俱到,Jensen。非常感谢。
黄仁勋:
谢谢你,做得很好。
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。