OpenAI有几分胜算

小小MT4 来源:新财富 °C 栏目:MT4电脑版下载

OpenAI的十年,是从理想主义的乌托邦,跌入商业现实的修罗场,再奋力攀登技术与商业双重巅峰的传奇历程。它不仅仅是一家公司的故事,更是这个时代技术狂热、资本博弈、伦理困境和未来憧憬的集中表现,进而可预见的未来,OpenAI最有可能走向三种截然不同的命运:

1)AGI的先行者与AI大模型的垄断者:最乐观的路径。OpenAI率先实现可控的AGI,其智能体平台成为AI产业界的操作系统,OpenAI成长为堪比甚至超越当今所有科技巨头总和的实体,深度参与并塑造人类文明的未来形态。

2)顶尖的AI产品与平台公司:最可能的路径。OpenAI未能垄断AGI,但凭借其在模型性能、产品体验和生态建设上的优势,成为像苹果或微软那样的顶级科技公司,通过ChatGPT等核心产品获得稳定、巨大的收入和利润。

3)被稀释的领先者:最悲观的路径。开源生态持续冲击,竞争对手在关键领域(如垂直行业、成本控制)实现超越,监管压力增大,内部治理问题频发。OpenAI虽然仍是一流玩家,但领先优势被不断蚕食,最终成为多极世界中的一极,而非主宰者。

01

风暴的前夜

2010年代中期的硅谷,AI人才争夺战已进入白热化阶段。谷歌在2014年以6.5亿美元收购DeepMind,此举震撼了整个行业。与此同时,Facebook(现Meta)也在不遗余力地网罗AI专家。谷歌与DeepMind的联盟在强化学习等领域展现出强大统治力,而Facebook则深耕于计算机视觉和社交网络AI应用。

这种“双寡头”格局引起了硅谷其他力量的不安。埃隆·马斯克多次公开表达对人工智能失控风险的担忧。在他看来,将关乎人类命运的技术集中于少数几家以利润为导向的商业公司手中,是极其危险的。与此同时,时任著名创业孵化器Y Combinator(YC)总裁的山姆·奥特曼正凭借对技术趋势的敏锐嗅觉和强大的资源整合能力,在硅谷精英网络中建立起独特的影响力——他既看到了AI的巨大潜力,也洞悉了现有格局的弊端。

一场旨在打破垄断、以更安全方式引领AI发展的计划,在Rosewood酒店的晚宴上酝酿成熟。

OpenAI于2015年成立,获得了马斯克、彼得·蒂尔、里德·霍夫曼等人承诺的10亿美元资助。这笔巨额资金在当时看来足以支撑一个非营利研究机构的长期运营。然而,这背后也反映了当时资本对AI前沿领域既充满渴望又谨慎试探的矛盾心态——风险投资尚未大规模涌入基础模型研发,因为其商业化路径模糊且烧钱速度惊人。OpenAI以非营利形式起步,巧妙地规避了早期商业化的压力,得以专注于其“确保通用人工智能(AGI)造福全人类”的使命。

这一定位使其在起步阶段就拥有了与众不同的道德光环和人才吸引力。对于众多企业而言,人才聚集之处形成的企业文化,很可能将决定了通用人工智能(AGI)会首先在哪个地方开花结果。

OpenAI成立初期的研究路径是发散而充满野心的。他们开发了OpenAI Gym(强化学习工具包)和Universe(虚拟环境平台),旨在为AI提供一个通用的训练场。最具公众影响力的项目之一是OpenAI Five,它在Dota 2游戏中击败了人类世界冠军团队,展示了多智能体协作的复杂能力。另一个项目Dactyl则让机械手学会了灵活操控积木。这些项目看似方向各异,但共同目标是探索不同场景下AI能力的边界,进而为OpenAI最终的突破积累行业经验。

如果AGI的突破需要一次颠覆性的、非共识的思想跃迁,OpenAI的文化环境可能更易孕育这种突破,它的整个组织就是为这一刻而生的。如果AGI是一项需要海量资源、长期工程和系统性整合的超级工程,那么拥有全栈能力、庞大场景和深厚技术储备的Google最有可能最终完成并实现稳定部署。

OpenAI更像一个顶尖的研究实验室,而非传统的产品公司——其核心驱动力是前沿技术的突破。OpenAI的模型团队拥有极高的话语权,产品团队若想为特定功能(如搜索)去修改底层模型数据,很可能遭到拒绝,因为维护模型的通用性和能力优先级更高。这种企业文化使其能心无旁骛地冲击技术巅峰,进而有利于快速决策和深度聚焦,但也意味着其在技术转化为多样化、精细化产品方面,将不如那些拥有庞大产品生态的公司。

Google倾向于通过系统性的工程和渐进式创新来解决问题。Google AI团队曾因企业文化和对失败的顾虑而发展步伐相对谨慎,并经历了人才流失,其决策流程来得更长,对失败的容忍度在核心业务压力之下也显著降低。如果AGI的实现是一条需要逐步攀登、不断积累的漫长阶梯,Google的体系化能力将极具优势。

02

从理想主义到AI智能体

对于OpenAI而言,Transformer架构的出现,无异于在技术迷雾中点亮了一座灯塔。首席科学家伊尔亚·苏茨克韦尔敏锐地捕捉到了其颠覆性潜力,OpenAI随之迅速转向,将资源全力押注于基于Transformer的大语言模型研发。2018年,GPT-1问世。尽管其1.17亿的参数规模在今天看来微不足道,效果也相当有限,但它成功验证了“生成式预训练+下游任务微调”这一技术路径的可行性,标志着OpenAI技术路线的一次关键收敛。

这成为了OpenAI历史上最具争议、也最具决定性的转折点。随着GPT-2、GPT-3的演进,OpenAI发现了一个简单却极其昂贵的规律:Scaling Law的规模化定律。模型性能随着参数规模、数据量和计算量的增加而可预测地提升。但要训练千亿、万亿参数的模型,所需的算力成本呈指数级飙升,最初承诺的10亿美元很快便显得杯水车薪。

理想主义在物理定律和天文数字般的账单面前,不得不做出妥协。2019年,OpenAI宣布重组,成立了一个采用“封顶盈利”模式的有限合伙企业(OpenAI LP)。其非营利母公司(OpenAI Inc)仍保有完全控制权,但允许外部投资者投资该OpenAI LP并获得有上限的回报。微软随即注入10亿美元,开启了双方深度绑定的序幕。这一根本性的转变直接导致了联合创始人埃隆·马斯克的离开,也引发了关于OpenAI是否“背叛初衷”的广泛争论。然而,从结果来看,这次转型为其注入了生存与发展所必需的巨额资本,使其得以投身并引领接下来的AI算力竞赛。

这也就意味着,董事会可以为了初衷使命而做出违背股东短期经济利益的决定。2023年奥特曼被短暂解职又复职的风波,正是OpenAI公司治理的核心特色的一次表现,也是其争议之源。

根据奥特曼的回忆,OpenAI虽预见到AI能力终将迎来引爆点,但没料到它会以ChatGPT这样一个简单的对话界面形式到来。2022年11月30日,ChatGPT发布。这个看似简单的聊天机器人,在短短五天内用户数突破百万,两个月后月活跃用户便超过一亿,创造了人类历史上最快的用户增长纪录。它的横空出世,彻底改写了OpenAI的命运与全球科技产业的走向。微软迅速加码,在2023年初宣布了一项总投资高达130亿美元、长达数年的深度合作,并将OpenAI的技术全面集成到Bing、Office、Windows乃至Azure云服务中。

2024年起,当“更大规模、更多数据、更多算力”的规模化定律,遭遇边际效益递减和成本压力后,OpenAI开始探索新的性能提升路径,进而其核心方向转向了 “推理” 。2024年发布的o1系列模型,标志着这一方向的正式落地。o1模型并非单纯追求规模扩张,而是从"单步生成"向"多步推理"的根本性转变,让模型学会“慢思考”——在内部进行多步骤的推理链推演,验证并修正自己的思维过程,从而输出更准确、更可靠的结果。这在解决复杂数学、编程和逻辑问题上展现出了显著优势。

OpenAI将AI能力的发展划分为五个层级,清晰地展现出其技术愿景:

1)聊天机器人:如当前的ChatGPT,擅长对话与信息整合。

2)推理机:如o1模型,具备复杂逻辑推理和分步思考能力。

3)智能体:能够理解复杂指令、调用工具、自主执行多步骤任务。

4)创新者:具备自主创造和发现新知识的能力。

5)AI组织:多个AI智能体协同工作,自主管理复杂项目。

目前,OpenAI正全力推动从第2阶段向第3阶段的跨越。奥特曼公开表示,相信在2025年,首批真正意义上的AI智能体将“加入劳动力大军”,实质性改变企业的生产模式与产出。

03

真正的决心

OpenAI的商业模式正面临严峻挑战。目前,其近80%的营收依赖ChatGPT,但2025年亏损已高达百亿美元。挑战主要来自两方面:一是高昂的边际成本,每次API调用或对话都产生真实的算力和电力成本,与传统软件近乎零的边际成本形成天壤之别;二是在开源模型和竞争对手挤压下,模型API价格战不可避免,单纯售卖“模型能力”的利润空间将持续被压缩。

因此,OpenAI早已不满足于只做API供应商。其真正的决心是将ChatGPT打造成一个通用智能体平台。早期的插件系统尝试未成大气候,主要因为当时基础设施不成熟,许多服务缺乏开放的API和必要的集成机制。但后续推出的“Operator”功能展示了新的思路:对有API的服务直接调用,对没有API的网页,则通过模拟人类操作(如点击、输入)来完成任务。这标志着其战略重心从“卖模型”转向“做应用”。

OpenAI的突围方向非常明确:将重心从API转向应用产品,甚至可以不惜与拥有高护城河的应用企业进行强绑定,以此形成用户黏性和数据闭环,构建自己在应用层的护城河。其目标是到2029年,依靠应用驱动实现年收入1000亿美元并首次开始盈亏平衡。如果成功,OpenAI将占据数字生态的枢纽位置,其价值将远超一个单纯的模型提供商。

为了控制成本、确保供应链安全和优化性能,OpenAI正大力向产业链上下延伸:

1)向上整合(应用层):大力开发ChatGPT企业版(如2025年与德国电信达成全公司范围部署合作)、定制化解决方案(如为美国政府提供ChatGPT Gov),进而直接面向终端客户获取更高利润。

2)向下整合(基础设施层):这是关键战场。与微软合作建设投资超千亿美元的“星际之门”AI超算数据中心只是第一步。OpenAI正在探索自研AI芯片,以摆脱对英伟达GPU的绝对依赖并优化能效比。其在能源领域的投资(包括奥特曼也以个人名义进行的数亿美元投资)也显示出对能源这一AI终极瓶颈的长远布局。

谷歌能实现对OpenAI的反超,核心在于其全栈技术能力与生态系统的碾压优势。与依赖英伟达GPU的OpenAI不同,谷歌凭借自研TPU芯片,牢牢掌控了从硬件、基础设施到应用的整个技术栈。这种控制力直接转化为性能与成本优势,谷歌的崛起标志着AI基础设施领域“垂直整合”模式对“水平分工”模式的强力挑战。对OpenAI而言,其挑战不仅是谷歌Gemini模型性能的追赶,更是其依赖外部算力的重资产模式,表现为对微软的重度依赖,在面临谷歌TPU低TCO优势时的根本性成本危机。

也基于此,OpenAI的商业模式存在一个致命弱点:对微软的重度依赖和巨额成本。OpenAI通过API向企业销售AI模型时,需向微软支付营收的20%作为分成。同时,其业务主要运行在微软Azure云上,产生了天价的计算成本。尽管营收高速增长,但这些支出严重侵蚀了利润,成为其难以持续盈利的核心障碍。

虽然双方近期协议有所放宽,允许OpenAI寻求其他云服务商以控制成本,但微软仍享有“优先供应权”等特殊权利。这种复杂的营收分成和知识产权安排,在提供支持的同时,也持续制约着OpenAI的战略自主性和财务灵活性。相较之下,谷歌云已成为AI初创企业的首选平台,超过70%的生成式AI独角兽是其客户,包括Cohere、Jasper、Typeface等。这种强大的生态为谷歌提供了OpenAI难以企及的分布式优势和网络效应。

对于微软等战略投资者,投资OpenAI不仅是为了财务回报,更是为了确保自身在AI时代的竞争地位和生态控制权。2025年,OpenAI以超过3000亿美元的估值完成了新一轮融资,以2025年预计120亿美元营收计算,3000亿美元估值对应的市销率约为25倍。对于一家仍在亏损但占据AI赛道制高点、增长飞快的公司而言,市场还是给予了极高的增长溢价和信仰溢价。毕竟,科技行业遵循幂律分布,绝大部分价值只会集中于少数玩家。

04

没有终点的马拉松

但是OpenAI的先发优势正在被快速侵蚀,市场竞争最直接的后果就是模型能力的快速趋同和价格的快速下降。

1)巨头的全面反击:谷歌和Meta在算力、数据和研发体系上毫不逊色,甚至更强。谷歌的Gemini系列在多模态上表现强劲,并通过Android、Google搜索、Workspace等产品拥有无与伦比的触达和商业化渠道,是OpenAI在基础设施、模型到应用的全栈竞争者。另一边,xAI凭借其独特的社交媒体数据、特斯拉的实时世界数据以及潜在的超级计算资源(如Dojo)迅速崛起,其Grok模型风格鲜明,并与X平台深度集成。

2)垂直领域的深耕:在医疗、法律、金融等行业,专业的AI初创公司凭借领域知识和数据,能提供比通用模型更精准、合规的解决方案。它们基于基础模型进行深度微调和产品化,解决特定行业痛点,往往能提供比通用平台更专业的体验。如在编程领域,GitHub Copilot(基于OpenAI技术)正面临来自Tabnine、Codeium等众多对手的挑战。

3)后起之秀的切割:以Anthropic和xAI为代表的新锐玩家正在分割市场。Anthropic由OpenAI前高管创立,其Claude系列在长上下文、推理和安全性上备受好评,是OpenAI最直接的竞争对手。财务上,Anthropic增长迅猛,2025年营收预计接近10亿美元,估值达600亿美元量级。与OpenAI相比,其收入结构也不同,约80%来自API业务。

4)开源力量的颠覆:Meta选择了截然不同的道路。其Llama系列的开源极大地降低了行业门槛,催生了繁荣的开发者生态和微调创新。虽然直接收入不高,但Meta通过开源构建生态影响力,旨在将AI融入其社交和广告业务。同时,像DeepSeek这样的模型,以其极高的性价比震撼市场,证明了通过算法和工程优化,可以用更经济的代价达到顶尖性能,这对OpenAI的商业模式构成了直接威胁。

更重要的是,闭源模型的每一次突破,都会在开源社区引发一轮改进和适配的浪潮,进而赋能开源社区在垂直领域打磨出最佳实践(如长上下文优化、特定工具链)。这就意味着,闭源和开源不再是替代关系,而是共生关系——闭源模型:定义性能上限,探索AGI前沿,其最新技术会持续为开源社区提供方向和灵感(如MoE架构、强化学习框架);开源模型:提供多元价值,实现规模化落地,将前沿技术工程化、场景化、成本优化。

2025年,开源模型的市场份额已攀升至35%,彻底打破了闭源模型的垄断地位。市场格局在短短一年内完成了从高度集中到充分竞争的急速转变。在中国市场,形成了以豆包(25%份额)、DeepSeek(20%份额)、文心一言和Kimi(各15%份额)为代表的梯队格局。到2025年底,已无任何单一开源模型能持续占据超过25%的开源市场份额。同时,智能体推理能力超越文本生成成为核心价值,编程应用占比飙升至超50%。这表明中国模型的价值落点更偏向于代码生成、技术推理等生产力提升领域,进而为企业级市场开辟了差异化的竞争优势。

用户也不再执着于寻找一个“最佳模型”,而是转向在5-7个顶尖模型间进行灵活组合与切换。这种“多模型策略”已成为行业新常态,标志着开源生态正式进入“群雄割据”的充分竞争阶段。竞争的核心,也从过去排行榜上的微小分数优势,转向了真实世界的使用留存率与具体工作负载的匹配能力。

市场从垄断走向多元,技术从生成走向推理,应用从娱乐走向生产,价值从底层走向场景。中国开源AI的崛起,绝非昙花一现,而是技术积累、市场体量、政策环境与产业需求共同作用下的必然结果。它标志着全球AI创新中心从单极向多极的扩散,也为世界提供了不同于硅谷的另一种发展路径和可能性。