中信建投:国产芯片今年将迎来发展大年

小小MT4 来源:市场资讯 °C 栏目:MT4电脑版下载

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

  中信建投证券研究

  国产算力板块迎来密集催化,腾讯业绩会表示推理芯片的供应渠道侧具备多种选择,国际供应链波动背景下国产推理算力芯片有望提供助力。DeepSeek更新模型,明确支持FP8精度与将发布的下一代国产芯片,头部国产开源模型对国产芯片的支持有望推动国产算力生态加速落地。华为昇腾芯片近期陆续参与到政府、金融、运营商等行业客户招投标产品中,印证国产芯片竞争力持续提升。

  一方面来自于美国BIS政策的持续收紧,中期维度看,国产芯片占比提升是必然趋势。考虑到国产芯片逐渐进入量产交付阶段,预期市场集中度将看到显著提升。另一方面随着国内算力消耗快速增长(典型如字节跳动,每三个月token消耗接近翻一倍,5月底为16.4万亿token),我们预计国内各家大型云厂商在日均token消耗达到30万亿token时会感受到算力紧张,在达到60万亿token时会开始出现一定算力缺口。我们认为国内增速斜率更陡峭,国产芯片今年将迎来发展大年。

  中信建投证券通信、计算机、人工智能、电子行业研究团队推出【国产算力产业链投资前景】:

  01DeepSeek-V3.1发布,建议关注国产算力板块

  国产算力板块迎来密集催化,腾讯业绩会表示推理芯片的供应渠道侧具备多种选择,国际供应链波动背景下国产推理算力芯片有望提供助力。DeepSeek更新模型,明确支持FP8精度与将发布的下一代国产芯片,头部国产开源模型对国产芯片的支持有望推动国产算力生态加速落地。华为昇腾芯片近期陆续参与到政府、金融、运营商等行业客户招投标产品中,印证国产芯片竞争力持续提升。

  事件

  8月13日,腾讯业绩会表示公司推理芯片供应渠道侧具备多种选择。8月21日,DeepSeek更新模型版本至DeepSeek-V3.1,预计将支持FP8精度以及国产芯片。

  简评

  腾讯业绩会表示未来推理芯片供给有望多元化,利好国产算力芯片厂商。8月13日,腾讯控股发布2025Q2业绩并举办说明会,会上腾讯总裁刘炽平表示当前公司AI芯片储备足以支持现有模型的训练及迭代升级;元宝、AI搜索等多个应用场景的用户数提升带来推理负载占比提升,公司一方面通过模型轻量化和软件优化来控制推理成本,另一方面公司在推理芯片的供应渠道侧也具备多种选择。当前海外高端芯片贸易政策仍存较大不确定性,腾讯有望依托华为、寒武纪、海光等国产厂商的推理芯片满足相关算力需求。

  DeepSeek V3.1发布,预计支持FP8精度以及国产芯片。据官方公众号,DeepSeek今日正式发布DeepSeek-V3.1。目前官网与网页端模型已升级至最新版本,且新模型已在Huggingface开源。新版本模型主要升级体现在以下维度:(1)一个模型同时支持思考模式与非思考模式;(2)相比前代模型,新模型思考模式下能在更短时间内给出答案;(3)通过Post-Training优化,新模型具备更强的Agent能力。除去功能升级,新版本模型使用了UE8M0 FP8 Scale参数精度,该参数代表模型支持转为矩阵乘法等AI核心运算优化设计的FP8精度格式。相比FP16格式,FP8在同等芯片面积下能够实现翻倍性能,且功耗和带宽需求更低。此外,DeepSeek表示新精度格式针对即将发布的下一代国产芯片设计,表明未来基于DeepSeek模型的训练与推理有望更多应用国产AI芯片,助力国产算力生态加速建设。

  华为昇腾芯片加速突围,国产芯片市场竞争力逐步提升。近期,基于华为昇腾芯片的服务器产品陆续在政府、金融、运营商等行业落地大单。上海浦发银行大模型算力扩容项目招标中,包含176台鲲鹏+昇腾配置的智算服务器;新疆疆算万卡枢纽型智算中心项目招标中,包含4500台昇腾910C-2服务器集群;中国移动2025-2026推理AI计算设备招标中,包含5000套CANN生态设备,即基于昇腾异构计算架构和昇腾芯片的服务器产品。由于海外供应链风险持续,国产芯片厂商产品性价比持续提升,更多算力需求有望由国产芯片支持,国产芯片市场竞争力持续提升。

  投资建议:国产算力板块迎来密集催化,腾讯业绩会表示推理芯片的供应渠道侧具备多种选择,国际供应链波动背景下国产推理算力芯片有望提供助力。DeepSeek更新模型,明确支持FP8精度与将发布的下一代国产芯片,头部国产开源模型对国产芯片的支持有望推动国产算力生态加速落地。华为昇腾芯片近期陆续参与到政府、金融、运营商等行业客户招投标产品中,印证国产芯片竞争力持续提升。

  02AI新纪元:砥砺开疆・智火燎原

  一方面来自于美国BIS政策的持续收紧,中期维度看,国产芯片占比提升是必然趋势。考虑到国产芯片逐渐进入量产交付阶段,预期市场集中度将看到显著提升。另一方面随着国内算力消耗快速增长(典型如字节跳动,每三个月token消耗接近翻一倍,5月底为16.4万亿token),我们预计国内各家大型云厂商在日均token消耗达到30万亿token时会感受到算力紧张,在达到60万亿token时会开始出现一定算力缺口。我们认为国内增速斜率更陡峭,国产芯片今年将迎来发展大年。

  国产人工智能芯片发展趋势及展望

  海外龙头占据垄断地位,AI加速芯片市场呈现“一超多强”态势。数据中心CPU市场上,英特尔份额有所下降但仍保持较大领先优势,AMD持续抢占份额势头正盛。AI加速计算芯片市场上,英伟达凭借硬件优势和软件生态一家独大,在训练、推理端均占据领先地位。根据IDC数据,2024年国内AI加速计算芯片市场中,英伟达出货份额达70%,华为昇腾出货份额23%,其余厂商合计占比7%。国内厂商起步较晚,正逐步发力,部分加速芯片领域已经涌现出一批破局企业,虽然在高端AI加速计算芯片领域与海外厂商存在较大差距,但在国内市场上已经开始取得部分份额,根据IDC数据,2024年国内AI芯片市场中,华为昇腾出货64万片,寒武纪出货2.6万片,燧原出货1.3万片。未来,随着美国持续加大对中国高端芯片的出口限制,AI芯片国产化进程有望继续加快。

  GPU市场方面,海外龙头占据垄断地位,国产厂商加速追赶。当前英伟达、AMD、英特尔三巨头占据全球GPU芯片市场的主导地位。集成GPU芯片一般在台式机和笔记本电脑中使用,性能和功耗较低,主要厂商包括英特尔和AMD。独立显卡常用于服务器中,性能更高、功耗更大,主要厂商包括英伟达和AMD。分应用场景来看,应用在人工智能、科学计算、视频编解码等场景的服务器GPU市场中,英伟达和AMD占据主要份额。根据JPR预测,2025年Q1英伟达的独立显卡(包括AIB 合作伙伴显卡)的市场份额达92%, AMD和英特尔则分别占比8%、0%。

  图形渲染GPU:英伟达引领行业数十年,持续技术迭代和生态构建实现长期领先。2006年起,英伟达GPU架构保持约每两年更新一次的节奏,各代际产品性能提升显著,生态构建完整,GeForce系列产品市占率长期保持市场首位,最新代际GeForce RTX 40系列代表了目前显卡的性能巅峰,采用全新的Ada Lovelace架构,台积电5nm级别工艺,拥有760亿晶体管和18000个CUDA核心,与Ampere相比架构核心数量增加约70%,能耗比提升近两倍,可驱动DLSS 3.0技术。性能远超上代产品。AMD独立GPU在RDNA架构迭代路径清晰,RDNA 3架构采用5nm工艺和Chiplet设计,比RDNA 2架构有54%每瓦性能提升。目前国内厂商在图形渲染GPU方面与国外龙头厂商差距不断缩小。芯动科技的“风华2号”GPU像素填充率48GPixel/s,FP32单精度浮点性能1.5TFLOPS,AI运算(INT8)性能12.5TOPS,实测功耗4~15W,支持OpenGL4.3、DX11、Vulkan等API,实现国产图形渲染GPU突破。景嘉微在工艺制程、核心频率、浮点性能等方面虽落后于英伟达同代产品,但差距正逐渐缩小。2023年顺利发布JM9系列图形处理芯片,支持OpenGL 4.0、HDMI 2.0等接口,以及H.265/4K 60-fps视频解码,核心频率至少为1.5GHz,配备8GB显存,浮点性能约1.5TFlops,与英伟达GeForce GTX1050性能相近,有望对标GeForce GTX1080。

  GPGPU:英伟达和AMD是目前全球GPGPU的领军企业。英伟达的通用计算芯片具备优秀的硬件设计,通过CUDA架构等全栈式软件布局,实现了GPU并行计算的通用化,深度挖掘芯片硬件的性能极限,在各类下游应用领域中,均推出了高性能的软硬件组合,逐步成为全球AI芯片领域的主导者。AMD于2018年发布用于数据中心的Radeon Instinct GPU加速芯片,Instinct系列基于CDNA架构,如MI250X采用CDNA2架构,在通用计算领域实现计算能力和互联能力的显著提升,此外还推出了对标英伟达CUDA生态的AMD ROCm开源软件开发平台。

  国内GPGPU厂商正逐步缩小与英伟达、AMD的差距。英伟达凭借其硬件产品性能的先进性和生态构建的完善性处于市场领导地位,国内厂商虽然在硬件产品性能和产业链生态架构方面与前者有所差距,但正在逐步完善产品布局和生态构建,不断缩小与行业龙头厂商的差距。

  ASIC市场方面,由于其一定的定制化属性,市场格局较为分散。在人工智能领域,ASIC也占据一席之地。其中谷歌处于相对前沿的技术地位,自2016年以来,就推出了专为机器学习定制的ASIC,即张量处理器(Tensor Processing Unit,TPU)。2025年谷歌推出了第七代张量处理单元(TPU)Ironwood,可扩展至9216个液冷芯片,并通过突破性的芯片间互联,功率接近10兆瓦。据nextplatform介绍,TPU v7p芯片是谷歌首款在其张量核心和矩阵数学单元中支持FP8计算的TPU。之前的TPU支持INT8格式和推理处理,以及BF16格式和训练处理。Ironwood芯片还配备了第三代SparseCore加速器,该加速器首次亮相于TPU v5p,并在去年的Trillium芯片中得到了增强。

  国产厂商快速发展,寒武纪等异军突起。通过产品对比发现,目前寒武纪、海思昇腾、遂原科技等国产厂商正通过技术创新和设计优化,持续提升产品的性能、能效和易用性,推动产品竞争力不断提升,未来国产厂商有望在ASIC领域持续发力,突破国外厂商在AI芯片的垄断格局。

  生态体系决定用户体验,是算力芯片厂商最深的护城河。虽然英伟达GPU本身硬件平台的算力卓越,但其强大的CUDA软件生态才是推升其GPU计算生态普及的关键力量。从技术角度来讲,GPU硬件的性能门槛并不高,通过产品迭代可以接近龙头领先水平,但下游客户更在意能不能用、好不好用的生态问题。CUDA推出之前GPU编程需要用机器码深入到显卡内核才能完成任务,而推出之后相当于把复杂的显卡编程包装成为一个简单的接口,造福开发人员,迄今为止已成为最发达、最广泛的生态系统,是目前最适合深度学习、AI训练的GPU架构。英伟达在2007年推出后不断改善更新,衍生出各种工具包、软件环境,构筑了完整的生态,并与众多客户合作构建细分领域加速库与AI训练模型,已经积累300个加速库和400个AI模型。尤其在深度学习成为主流之后,英伟达通过有针对性地优化来实现最佳的效率提升性能,例如支持混合精度训练和推理,在GPU中加入Tensor Core来提升卷积计算能力,以及最新的在H100 GPU中加入Transformer Engine来提升相关模型的性能。这些投入包括了软件和芯片架构上的协同设计,使得英伟达能使用最小的代价来保持性能的领先。而即便是英伟达最大的竞争对手AMD的ROCm平台在用户生态和性能优化上还存在差距。CUDA作为完整的GPU解决方案,提供了硬件的直接访问接口,开发门槛大幅降低,而这套易用且能充分调动芯片架构潜力的软件生态让英伟达在大模型社区拥有巨大的影响力。正因CUDA拥有成熟且性能良好的底层软件架构,几乎所有的深度学习训练和推理框架都把对于英伟达GPU的支持和优化作为必备的目标,帮助英伟达持续处于领先地位。

  美国对华供应AI芯片管制强度持续升级,H20被纳入管制范围。2022年,美国BIS实施出口管制,英伟达和AMD的高端GPU产品出口受到限制。为满足合规要求,英伟达随后推出了面向中国市场的H800与A800,互联带宽被下调。2023年,BIS公布的先进计算芯片出口管制新规进一步扩大限制范围,以“性能密度”与“总处理性能(TPP)”成为新的标准,使得A100、A800、H100、H800、L40、L40S等多款产品遭到限制。虽然英伟达又推出了性能大幅下调,符合新规的H20,但H20也在今年4月被美国纳入出口管制。

  国产算力芯片迎来国产替代窗口期。考虑到英伟达新品迎来大幅性能升级,并面向中国市场禁售,国产算力芯片发展刻不容缓。当前已经涌现出一大批国产算力芯片厂商,昇腾、寒武纪相继推出自研AI芯片,海光信息的DCU也逐渐打出知名度,其他配套环节的国产化进程也正在加速推进。

  03Grok4性能表现优异,国产算力公司业绩逐步兑现

  7月10日,xAI正式发布Grok 4,在GBQA(博士级问题集)、AMC 25(美国数学邀请赛)、Live Coding Benchmark(编程能力测试)、HMMT(哈佛-MIT数学竞赛)、USAMO(美国数学奥林匹克)等测试中均表现出色。马斯克表示,“现在在学术问题上,Grok 4比博士水平在每个学科都要强,没有例外。”定价方面,Grok 4基础版本为30美金一个月;Grok 4Heavy为300美金/月。后续产品路线规划方面,xAI 8月将发布专门编程模型;9月发布多模态智能体;10月发布视频生成模型。

  Grok4 在性能上的强势提升与模型版本的快速迭代,这背后离不开强大的算力支撑,xAI在美国田纳西州孟菲斯建立了超级计算中心“Colossus”,2024年7月启动时配备了10万块英伟达H100 GPU,到2025年2月,GPU数量已翻倍至20万块。Grok4用于RL的计算资源几乎与预训练时使用的相同。

  当前位置,我们认为AI大模型的竞争与迭代仍在持续,意味着算力投资大概率依然维持较高强度,因此继续推荐算力板块:一是业绩持续高增长且估值仍处于历史较低水平的北美算力链核心标的;二是有望享受外溢需求、取得客户或份额突破的公司;三是上游紧缺的环节;四是随着GB300的批量出货,建议重点关注 1.6T光模块及 CPO 产业链。

  04持续推荐国产算力产业链

  近期,“全球首款通用型 AI 智能体Manus”推出,引发市场关注。Manus具备独立思考、任务规划和跨工具协作能力,可直接交付完整成果,发布后内测邀请码炒至高价。Manus爆火,能感受到AI应用正处在快速发展的起点。Manus完成单次任务所需的token数远大于目前chatbot单次回复产生的token。阿里推出全新推理模型通义千问 QwQ-32B,其参数规模仅为32B,但在性能上已经能比肩6710亿参数的DeepSeek R1。基于Qwen2.5-32B模型,采用强化学习RL显著提升模型性能。阿里表示,通过持续扩展强化学习训练的规模,中型模型也可以实现与巨型混合专家模型(MoE)相媲美的性能。RL等post-training是当下大模型发展的重要方面,在reasoning过程中将产生大量token,对算力需求将有大幅提升。我们认为,随着模型与应用不断出现新变化,算力需求仍将增长,持续看好GPU、IDC、CPO等算力产业链。

  DeepSeek带来大模型部署热潮,电信运营商算力及云业务随之受益,具有重估空间。此外,2025年作为十四五的收官之年,以及十五五的规划布局之年,近期国防军工需求回暖,建议关注。

  05阿里资本开支超预期、央企开启“AI+”行动,关注国产算力产业链

  阿里巴巴CEO吴泳铭表示,未来三年在云和AI的基础设施投入预计将超越过去十年的总和,2015-2024年(自然年),公司资本开支(购买设备与无形资产,不含土地)为3272亿元,意味着未来三年年均用于购买设备的资本开支有望超过1100亿元。阿里将在AI基础设施、基础模型平台及AI原生应用、现有业务的AI转型等三方面加大投入。

  国务院召开中央企业“AI+”专项行动深化部署会,将AI作为企业十五五规划的重点。我们建议关注一是国产算力产业链,包括GPU、IDC、光模块、交换机、服务器等环节;二是以电信运营商为代表的具备较强IT能力的央企,在加大自身AI投入的同时还能向其他央企赋能。

  阿里巴巴发布截至 2024年12月31日止季度业绩,收入为2801.54亿元,同比增长8%;非公认会计准则净利润为510.66亿元,同比增长6%。其中,云业务收入317.42 亿元,重回 13%的双位数增长,其中 AI 相关产品收入连续六个季度实现三位数增长。阿里巴巴集团首席执行官吴泳铭表示,展望未来,由 AI 推动的云智能集团收入增速还会持续提升。公司季度资本开支为313.69亿元(Purchase of property and equipment),同比增长331%,环比增长85%,且吴泳铭表示未来三年在云和AI的基础设施投入预计将超越过去十年的总和,2015-2024年(自然年),公司资本开支(Purchase of property、equipment、intangible assets,不含土地)为3272亿元,意味着未来三年年均用于购买设备的资本开支有望超过1100亿元,甚至更多。未来三年,阿里将围绕AI这个战略核心,在AI基础设施、基础模型平台及AI原生应用、现有业务的AI转型等三方面加大投入。目前看阿里巴巴已经形成资本开支增加,云业务收入增长、AI相关收入增加的正向循环。

  2月19日,国务院国资委召开中央企业“AI+”专项行动深化部署会,总结国资央企发展人工智能进展成效,研究部署下一步重点工作。会议要求,要着力强化中央企业推进人工智能发展的要素支撑,在编制企业“十五五”规划中将发展人工智能作为重点,打造更多科技领军企业,孵化培育一批初创企业。要加大资金投入,坚持产投结合、以投促产,持续壮大发展人工智能的长期资本、战略资本、耐心资本。2023年AI浪潮以来,先是海外CSP厂商持续高强度的资本开支,紧接着是2025年国内互联网大厂陆续上调AI基础设施的投资,“十五五”期间预计以大型央企为代表的国企也将持续加大AI相关的投入。我们建议关注一是国产算力产业链,包括GPU、IDC、光模块、交换机、服务器等环节;二是以电信运营商为代表的具备较强IT能力的央企,在加大自身AI投入的同时还能向其他央企赋能。此外,下周起年报将陆续披露,建议关注年报业绩超预期及对未来展望积极的企业。

  06看好AI应用落地,关注国产算力产业链

  近日,美国BIS正式发布了一项全球AI管控新规,涉及GPU等硬件以及将AI模型权重纳入监管范围。虽然尚不清楚接下来的特朗普政府对于这一禁令会如何处理,但美国在科技领域对于中国的封锁持续已久,国产芯片在设计、制造等关键领域也在持续突破。在美国制裁持续升级的背景下,国产算力自立自强大势所趋,建议关注GPU、交换芯片、光芯片等关键环节。

  此外,展望2025年,我们看好AI应用的落地,随着智能眼镜、机器人以及各种可穿戴设备的涌现,新的应用与新的硬件终端结合有望打造出更多的爆款场景,也将进一步拉动基础设施的需求,持续看好AI板块,包括基础设施产业链和端侧AI应用相关产业链。

  2025年1月13日,美国商务部工业与安全局(BIS)正式发布了一项全球AI管控新规,涉及GPU等硬件以及将AI模型权重纳入监管范围。BIS将出口目的地分为三个层级,其中第一层级为美国的18个核心盟友,这些国家可以自由进行AI芯片采购;第二层级覆盖全球大部分国家和地区,在2025-2027年间能获得大约相当于5万块英伟达H100 GPU的算力,这些国家的企业可以申请NVEU(国家验证最终用户)资格,获批后可将算力上限提升至约32万块GPU的水平;第三层级中的国家和地区将面临全面禁止。这项规定的另一个重要部分是将AI模型权重纳入出口管制范围,训练计算量超过10^26次运算的模型在出口时将需要授权。开源模型被豁免出管制范围;还有超过计算量阈值的闭源模型,如果其性能不及最先进的开源模型,也将获得豁免。虽然尚不清楚接下来的特朗普政府对于这一禁令会如何处理,但美国在科技领域对于中国的封锁持续已久,国产芯片在设计、制造等关键领域也在持续突破。算力作为AI产业发展的基础,在美国制裁持续升级的背景下,国产算力自立自强大势所趋,建议关注GPU、交换芯片、光芯片等关键环节。

  此外,展望2025年,我们看好AI应用的落地,随着智能眼镜、机器人以及各种可穿戴设备的涌现,新的应用与新的硬件终端结合有望打造出更多的爆款场景,也将进一步拉动基础设施的需求,持续看好AI板块,包括基础设施产业链和端侧AI应用相关产业链。

  风险提示

  (1)宏观经济下行风险:计算机行业下游涉及千行百业,宏观经济下行压力下,行业 IT 支出不及预期将直接 影响计算机行业需求;(2)应收账款坏账风险:计算机多数公司业务以项目制签单为主,需要通过验收后能够 收到回款,下游客户付款周期拉长可能导致应收账款坏账增加,并可能进一步导致资产减值损失;(3)行业竞争加剧:计算机行业需求较为确定,但供给端竞争加剧或将导致行业格局发生变化;(4)国际环境变化影响: 国际贸易摩擦加剧,美国不断对中国科技施压,对于海外收入占比较高公司可能形成影响。

  北美经济衰退预期逐步增强,国际地缘变局冲击全球供应链韧性,企业海外拓展承压;芯片结构性短缺可能制约产能释放与交付节奏;行业竞争加剧触发价格战隐忧,中低端产品毛利率可能跌破盈亏平衡点;原材料成本高企叠加汇率宽幅波动持续侵蚀外向型企业利润空间;技术端则面临大模型迭代周期拉长的风险),影响AI产业化进程;汽车智能化渗透率及工业AI质检等场景落地进度不及预期,或将延缓第二增长曲线兑现。

  国际环境变化对供应链的安全和稳定产生影响,对相关公司向海外拓展的进度产生影响;关税影响超预期;人工智能行业发展不及预期,影响云计算产业链相关公司的需求;市场竞争加剧,导致毛利率快速下滑;汇率波动影响外向型企业的汇兑收益与毛利率,包括ICT设备、光模块/光器件板块的企业;数字经济和数字中国建设发展不及预期;电信运营商的云计算业务发展不及预期;运营商资本开支不及预期;云厂商资本开支不及预期;通信模组、智能控制器行业需求不及预期。

  国际环境变化对供应链的安全和稳定产生影响,对相关公司向海外拓展的进度产生影响;人工智能行业发展不及预期,影响云计算产业链相关公司的需求;市场竞争加剧,导致毛利率快速下滑;汇率波动影响外向型企业的汇兑收益与毛利率,包括ICT设备、光模块/光器件等板块的企业;数字经济和数字中国建设发展不及预期等;电信运营商的云计算业务发展不及预期;运营商资本开支不及预期;云厂商资本开支不及预期;通信模组、智能控制器行业需求不及预期。

  国际环境变化对供应链的安全和稳定产生影响,对相关公司向海外拓展的进度产生影响;人工智能行业发展不及预期,影响云计算产业链相关公司的需求;市场竞争加剧,导致毛利率快速下滑;汇率波动影响外向型企业的汇兑收益与毛利率,包括ICT设备、光模块/光器件板块的企业;数字经济和数字中国建设发展不及预期;电信运营商的云计算业务发展不及预期;运营商资本开支不及预期;云厂商资本开支不及预期;通信模组、智能控制器行业需求不及预期。