新浪科技讯 9月22日下午消息,据动态实时LLM智能体未来预测基准FutureX最新评测结果,慈善家陈天桥创立的AI公司MiroMind团队搭载GPT-5的MiroFlow智能体框架,已在9月第1周和第2周连续夺得榜首,超越众多国际顶尖机构和闭源商业模型。
据悉,与专注文本输出的生成式模型不同,MiroMind采用记忆驱动机制,专为预测与决策设计,旨在打造全球最好的预测大模型。在测试中,MiroMind成功预测了2025年9月9日ATP男子单打排名第4-6位的选手,同时还成功预测了2025年9月11日数字加密货币Solana将突破的一系列关键价格档位,体现了模型在处理价格波动类问题上的系统建模能力与风险控制水平。
MiroMind的登顶并非偶然,而是基于AI预测未来的几项核心能力:第一,信息洞察力:能快速抓取、理解和整合海量数据;第二,逻辑推理与趋势感知:能发现模式、识别因果、判断趋势。第三,概率与不确定性管理:能量化可能性、权衡风险,在不确定环境下做出最优判断。第四,跨领域整合能力:能把金融、政治、科技、社会等多领域信息融会贯通。
在GAIA-Validation上,MiroFlow框架也取得了82.4%的出色成绩,并在HLE、BrowseComp以及xBench-DeepSearch等基准测试中领先众多国际对手。目前,MiroFlow已对外提供了完全开源、可复现的框架和配置。
FutureX由字节跳动SEED团队联合斯坦福大学、复旦大学等推出,是全球首个动态实时LLM智能体未来预测基准。它从全球200多个高质量网站精选只有下周才会有明确结果的问题,让AI直面真正的未来事件:股票价格的涨跌、体育比赛的胜负、政治选举的结果、科技公司的战略走向等。(文猛)