Claude Mythos神话与Opus 4.6降智：Anthropic的真面目

type

status

date

slug

summary

引言：当AI“狼来了”遇上模型“降智”

近期，人工智能领域巨头Anthropic的一系列动作，无疑在全球科技界和金融市场投下了一颗重磅炸弹。先是其新模型Claude Mythos（预览版）被高调宣传能自主挖掘海量0day漏洞，甚至引发华尔街对AI驱动网络攻击的恐慌。然而，这股“狼来了”的论调很快被独立研究机构和专家证伪，指出其“战果”存在严重夸大。与此同时，Anthropic的另一款明星产品Claude Opus 4.6却被用户普遍抱怨出现“降智”现象，性能不升反降。这种冰火两重天的局面，不仅让Anthropic的公信力受到质疑，也促使我们深入思考：当前AI大模型的真实能力边界在哪里？其商业化宣传与实际表现之间，又存在着怎样的落差？本文将基于最新研究和用户反馈，深入解读Claude Mythos的神话破灭以及Opus 4.6的“降智”之谜，揭示Anthropic的真实面貌。

Mythos漏洞神话的破灭：夸大与虚假繁荣

Anthropic在发布Claude Mythos时，宣称该模型自主发现了成千上万个0day漏洞，包括潜伏长达27年的OpenBSD漏洞。这一消息一出，立刻引起了金融监管机构的紧张，担忧AI可能引发系统性网络攻击。然而，来自AISLE实验室的研究复测和Tom'sHardware的深度报道，却无情地撕下了Mythos的华丽外衣。

首先，Mythos发现的“数千个漏洞”中，绝大多数存在于早已停止维护的旧软件中，或在实际环境中根本无法被触发和利用。这使得其所谓的“严重威胁”变得站不住脚。其次，报告中“高危”的0day漏洞，竟然仅依赖于198次人工复核，这种极小规模的样本推导出的“改变世界的威胁”，在学术界和安全界都缺乏说服力。

更具颠覆性的是，AISLE团队的测试表明，AI的安全能力并非线性跃升，而是呈现“锯齿形”分布。他们使用仅36亿激活参数的GPT-OSS-20b等8个开源小模型，成功复现了Mythos发现的FreeBSD旗舰级漏洞，甚至在识别虚假SQL注入漏洞方面，DeepSeek R1等小模型表现优于GPT-5.4、Claude Sonnet 4.5等顶尖闭源模型。这强有力地证明，网络安全领域并不存在“永远最强”的单体模型，且开源、小巧的模型也能在特定任务上展现出卓越能力。这对于寻求Claude官方等大模型解决方案的用户来说，无疑提供了更多选择和思考。

Opus 4.6的“降智”危机：用户体验的滑铁卢

正当Mythos的“狼来了”之声喧嚣尘上时，另一边，Claude国内使用的用户却正经历着一场体验危机——Claude Opus 4.6被普遍抱怨出现“降智”现象。大量用户反馈，Opus 4.6在解决问题、推理深度和思考长度上，甚至不如其前代Opus 4.5，被戏称为“植物人”。

AMD主管通过对Claude会话日志的分析发现，Claude的“中位思考长度”从2200字符骤降至600字符，这直接导致其深度推理能力大幅受损。由于模型表现不佳，用户不得不频繁重试，导致API请求量暴涨80倍，不仅消耗了更多Token，也直线拉高了使用成本。

资深订阅用户更是直言，Anthropic可能正深陷算力困局，通过收紧使用限制、强迫用户减少Token消耗来应对。然而，在核心模型不稳、Bug频出的情况下，公司却将宝贵的算力投入到开发类似“/buddy”终端宠物等花哨功能上，这种“不务正业”的产品策略，无疑加剧了用户的失望情绪。对于依赖Claude镜像站或claude国内如何使用的用户而言，这种性能下降直接影响了工作效率和体验。

Anthropic的“薛定谔的超级AI”：市场策略与公信力

Anthropic在发布Mythos时的“恐慌营销”和Opus 4.6的“降智”表现，共同塑造了一个“薛定谔的超级AI”形象：实验室里的Claude Mythos正毁灭世界，而网页端的Opus 4.6却智商直线下降。这种巨大的反差，不禁让人质疑Anthropic的市场策略及其公信力。

网络安全专家George Hotz直言，AI双巨头夸大了网络安全风险，软件漏洞并非那么难找，只是合法性问题阻碍了人们的探索。而气候与清洁能源投资人Ramez Naam也指出，Mythos的进步并非突破性，在Epoch能力指数（ECI）上，它只比GPT 5.4强一点，并没有加速ECI的迹象。这一切都指向Anthropic可能在利用“勒索研究”和“恐慌营销”来博取关注，引导舆论，并最终保护其利润底线。

Anthropic在系统卡中承认，Mythos等模型的ECI得分不确定性更大，且其进展源于人类研究，并未出现显著的递归式自我改进。这进一步印证了其在AI能力宣传上的审慎不足。对于希望通过Claude官方中文版或Claude教程深入了解和使用该模型的用户来说，了解这些背景信息至关重要。

结论：回归AI大模型的真实价值与理性发展

Anthropic的案例，为整个AI大模型行业敲响了警钟。它提醒我们，在追逐技术突破和市场关注的同时，不能忽视产品的真实性能、用户体验和诚实的沟通。

AI技术无疑拥有巨大潜力，但其发展需要回归理性。我们应区分技术进步与市场炒作，警惕“狼来了”式的恐慌营销，更要关注模型在实际应用中的稳定性和可靠性。对于用户而言，选择AI工具时，应多方考察，不盲目追逐所谓“最强”模型，而是根据实际需求，结合多方评测和体验，选择真正适合自己的解决方案。同时，也期待包括Claude使用指南在内的更多透明、客观的信息，能帮助用户更好地理解和利用这些前沿技术。

探索更多AI资讯，请访问：https://claude.aigc.bar