(来源:北京商报)
北京商报讯(记者 陶凤 王天逸)12月24日,字节跳动 Seed 团队宣布,近日推出新一代形式化数学推理专用模型 Seed Prover 1.5 ,通过大规模的 Agentic RL 训练,其推理能力和推理效率取得显著进步。
相比上一代模型,Seed Prover 1.5 在 16.5 小时内,针对 IMO 2025 的前 5 道题目生成了完整可编译验证的 Lean 证明代码,换算成绩为 35/42,达到此前 IMO 评分标准的金牌分数线。
本文标题: 字节跳动推出新一代形式化数学推理专用模型 Seed Prover 1.5