DeepSeek-V3.1发布!“FP8 精度”如何赋能国产AI?

小小MT4 来源:新浪基金 °C 栏目:MT4苹果版下载

  近期,DeepSeek正式发布DeepSeek-V3.1,官方称其为“迈向Agent(智能体)时代的第一步”。DeepSeek新模型的升级亮点有哪些?备受关注的“FP8精度”意味着什么?对我国AI产业链将产生怎样的影响?(资料参考:澎湃新闻《国产算力芯片打开千亿市场:“FP8精度”意味着什么?产业链底气何在?》,2025.8.26)

  DeepSeek-V3.1的三大核心升级

  本次升级主要有三大亮点,包括混合推理架构、更高的思考效率,以及更强的Agent能力。

  1、混合推理架构
不同于传统模型需维护多个专家模型,DeepSeek-V3.1在单一架构内可同时支持思考模式与非思考模式,用户可通过“深度思考”按钮实现无缝切换,在复杂任务中启用链式推理,在简单任务中快速响应。

  (资料参考:IT时报《涨价了!DeepSeek发布V3.1》,2025.8.21)

  2、思考效率提升

  在思考效率层面,DeepSeek-V3.1 较前代模型(DeepSeek-R1-0528)取得显著提升。通过“思维链压缩训练技术”,新模型在输出Token(词元)数量减少20%至50%的前提下,核心任务表现仍与前代持平。

  (资料参考:金融界《DeepSeek发布V3.1版本,专为国产芯片优化,支持双模式推理架构》,2025.8.21)

  DeepSeek-V3.1与前代模型对比

  注:在各项评测指标得分基本持平的情况下(AIME 2025: 87.5/88.4, GPQA: 81/80.1,liveCodeBench: 73.3/74.8),R1-0528与V3.1-Think的token消耗量对比图;资料参考:深度求索《DeepSeek-V3.1发布,迈向Agent时代的第一步》,2025.8.21

  3、Agent能力增强

  通过后训练优化,DeepSeek-V3.1的智能体(Agent)能力实现跨越式提升,尤其在工具使用、编程任务以及复杂搜索等智能体相关任务中表现出色。在代码修复测评SWE与命令行终端环境测试中,该模型展现出更强的处理能力。(资料参考:金融界《DeepSeek发布V3.1版本,专为国产芯片优化,支持双模式推理架构》,2025.8.21)

  从技术到算力:国产AI迎来新动能!

  DeepSeek-V3.1的发布不仅是单个模型的升级,更从“技术性能”与“算力适配” 两大维度,为我国AI行业发展注入新动能。

  1、性能突破:保持开源领先优势

  一方面,DeepSeek-V3.1虽然是增量更新,却在关键指标上实现了突破。这次升级使DeepSeek在中国AI企业的开源热潮中重新获得领先优势。(资料参考:虎嗅APP《DeepSeek V3到V3.1,走向国产算力自由》,2025.8.24 )

  DeepSeek V3.1在多领域性能领先

编程领域

在Aider编程基准测试中,模型以71.6%的高分“霸榜”开源模型阵营,超越Claude Opus 4,且推理与响应速度更快。

多模态任务

在SVGBench测评中,性能仅次于 GPT-4.1-mini,远超前代模型 DeepSeek R1。

语言理解

多任务语言理解(MMLU)得分达88.5%,与GPT-5 的表现不相上下。

  资料参考:中邮证券《DeepSeek V3.1提振国产算力和应用》,2025.8.26

  2、算力适配:赋能国产芯片生态

  DeepSeek-V3.1的另一大关键突破,是该模型支持FP8 精度格式,专业分析称其具有三大核心优势:

  • 降本降耗,性能翻倍:相比FP16格式,FP8在同等芯片面积下能够实现翻倍性能,且功耗和带宽需求更低。
  • 国产适配:新精度格式针对即将发布的下一代国产芯片设计,意味着未来基于DeepSeek模型的训练与推理有望更多应用国产AI芯片,助力国产算力生态加速建设。

  (资料参考:澎湃新闻《国产算力芯片打开千亿市场:“FP8精度”意味着什么?产业链底气何在?》,2025.8.26)

  从行业背景来看,截至今年6月底,我国日均Token(词元)日均Token消耗量已经突破30万亿,1年半时间增长了300多倍。而据机构预测,随着国内算力消耗快速增长,预计国内各家大型云厂商在日均token消耗达到30万亿token时会感受到算力紧张,在达到60万亿token时会开始出现一定算力缺口。基于此,今年国产芯片有望将迎来发展大年。(资料参考:澎湃新闻《国产算力芯片打开千亿市场:“FP8精度”意味着什么?产业链底气何在?》,2025.8.26)

  随着国产算力芯片与开源大模型的深度融合,中国人工智能产业或正在迎来拐点。投资者不妨关注银华旗下港股科技30ETF(513160)及其联接基金(A类:024037,C类:024038,I类:024039)科创板人工智能ETF(588930)及其联接基金(A类:023550,C类:023551,I类:023552),通过指数化投资方式,力争把握AI行业的长期增长红利。