AI预言家诞生？Prophet Arena揭秘：o3-mini狂赚9倍，DeepSeek成最强异类 | AIGC.bar

type

status

date

slug

summary

Prophet Arena是一个由芝加哥大学SIGMA Lab开发的动态基准测试平台。它彻底颠覆了传统AI评测的模式，其独特之处在于：

为“人机协作”而生：平台不仅评估AI的预测结果，还要求AI提供详细的推理过程。用户可以提供线索观察AI的反应，AI也能解释其决策逻辑，为未来的人机协作决策奠定了基础。

简而言之，Prophet Arena迫使AI从一个语言生成器，进化为一个需要理解世界、分析赔率、并做出决策的“思考者”。

在Prophet Arena的竞技场中，所有大模型都遵循一套严谨的比赛流程，以确保公平和可比性：

情报收集：针对一个特定的未来事件，AI模型首先会利用搜索引擎，像侦探一样搜集相关的新闻报道、数据分析和背景信息，并将其整理成一份精炼的“情报简报”。同时，它们也会获取当前预测市场的价格，这代表了“群众的集体智慧”。

提交预测：基于相同的情报，每个AI模型都需要提交一份详尽的“预测报告”。报告不仅包含对所有可能结果的概率分布（例如，A队获胜概率60%，B队获胜概率40%），还必须附上长篇的文字解释，阐述其做出该判断的完整推理链。

结果揭晓与评分：当真实事件的结果揭晓后，平台会使用一套专业的指标来评估所有AI的预测。主要评分标准有两个：Brier分数，用于衡量预测的准确度和校准度；模拟投注的平均回报，用于衡量AI发现市场价值并实现盈利的能力。

通过这套机制，我们得以一窥不同AI在面对不确定性时的“智慧”与“胆识”。

当排行榜数据出炉后，Prophet Arena揭示了几个颠覆传统认知的秘密。

其中最令人惊讶的是：最赚钱的预测，往往不是最准确的预测。

在数据中，研究人员发现了一个奇特的“反转区域”：在Brier分数（准确度）中等的区间，反而诞生了许多回报率惊人的预测。深究其原因，发现这些预测大多来自爆冷的体育比赛。

例如，在一场网球赛中，市场普遍认为A选手有高达84%的胜率。但某个AI模型经过分析，认为其胜率只有80%。正是这4%的微小差异，让模型判断押注对手B选手获胜的“性价比”极高。结果，B选手爆冷获胜，这笔投注带来了近6倍的惊人回报。

这个案例说明，成为一个准确的“预言家”（追求高Brier分数）和成为一个赚钱的“投资者”（追求高回报率），是两种截然不同的能力。后者更侧重于发现市场共识的定价偏差，而非仅仅预测最可能发生的结果。这对于探索AI变现路径具有重要启发意义。

在众多参赛模型中，OpenAI的o3-mini模型在“平均回报”这一项上独占鳌头，成为了名副其实的“AI版华尔街之狼”。

它的成功并非偶然，其胜利秘诀在于 “赢得大，而非赢得多”。

o3-mini在很多预测中，敢于和市场主流观点正面交锋，虽然输多赢少，但它一旦赢了，就赢得盆满钵满。它总能敏锐地捕捉到市场未充分定价的机会，并下出“神之押注”。

最经典的案例是在一场美国职业足球大联盟比赛中。当时市场认为多伦多队获胜的概率仅为11%，但o3-mini在分析了所有情报后，给出了30%的概率。它识别出其中巨大的期望值差距，果断押注不被看好的多伦多队。最终，多伦多队爆冷获胜，这一笔投注为o3-mini带来了高达9倍的回报。

o3-mini的策略证明，在预测的世界里，成功的关键不在于追求百分之百的胜率，而在于当你正确时，能获得多大的收益。

除了盈利能力，Prophet Arena还揭示了不同LLM之间有趣的“性格”差异。通过分析模型间预测分布的差异，一张“AI性格图谱”跃然纸上。

在这张图谱中，一个模型显得格外突出——DeepSeek R1。

数据显示，DeepSeek R1的预测结果常常与其他所有模型大相径庭，它就像一个“特立独行的异议者”。而像Grok-4和GPT系列的模型，则倾向于形成“群体共识”，它们的预测结果更为接近。

这表明，AI的预测并非随机输出，而是其内部结构化推理和独特决策机制的外在体现。有些模型更倾向于跟随主流信息，而有些则可能采用了完全不同的校准方式或风险评估模型，从而得出了与众不同的结论。这种多样性正是未来人工智能生态健康发展的关键。

Prophet Arena的出现，仅仅是一个开始。它为我们打开了一扇观察和理解AI高级智能的窗户。

其终极目标是建立一个平台，让AI驱动的洞见来增强人类理解和预测世界的方式。设想未来，当你面对一个高风险决策时，你可以直接询问AI，它不仅会给出一个概率，还会清晰地解释背后的逻辑。你可以提供新的提示词（Prompt）或信息，与AI共同推演，最终形成更可靠的判断。

从预测下一个词，到预测下一个世界事件，人工智能正在向着更深邃、更强大的能力迈进。一个由人类直觉与AI强大分析能力相结合的“预言家联盟”正在悄然形成，它将提升整个社会的集体远见。想要获取最新的AI新闻与深度分析，敬请持续关注 https://www.aigc.bar。