Claude Mythos神话与Opus 4.6降智:Anthropic的真面目
type
status
date
slug
summary
tags
category
icon
password
网址

引言:当AI“狼来了”遇上模型“降智”
近期,人工智能领域巨头Anthropic的一系列动作,无疑在全球科技界和金融市场投下了一颗重磅炸弹。先是其新模型Claude Mythos(预览版)被高调宣传能自主挖掘海量0day漏洞,甚至引发华尔街对AI驱动网络攻击的恐慌。然而,这股“狼来了”的论调很快被独立研究机构和专家证伪,指出其“战果”存在严重夸大。与此同时,Anthropic的另一款明星产品Claude Opus 4.6却被用户普遍抱怨出现“降智”现象,性能不升反降。这种冰火两重天的局面,不仅让Anthropic的公信力受到质疑,也促使我们深入思考:当前AI大模型的真实能力边界在哪里?其商业化宣传与实际表现之间,又存在着怎样的落差?本文将基于最新研究和用户反馈,深入解读Claude Mythos的神话破灭以及Opus 4.6的“降智”之谜,揭示Anthropic的真实面貌。
Mythos漏洞神话的破灭:夸大与虚假繁荣
Anthropic在发布Claude Mythos时,宣称该模型自主发现了成千上万个0day漏洞,包括潜伏长达27年的OpenBSD漏洞。这一消息一出,立刻引起了金融监管机构的紧张,担忧AI可能引发系统性网络攻击。然而,来自AISLE实验室的研究复测和Tom'sHardware的深度报道,却无情地撕下了Mythos的华丽外衣。
首先,Mythos发现的“数千个漏洞”中,绝大多数存在于早已停止维护的旧软件中,或在实际环境中根本无法被触发和利用。这使得其所谓的“严重威胁”变得站不住脚。其次,报告中“高危”的0day漏洞,竟然仅依赖于198次人工复核,这种极小规模的样本推导出的“改变世界的威胁”,在学术界和安全界都缺乏说服力。
更具颠覆性的是,AISLE团队的测试表明,AI的安全能力并非线性跃升,而是呈现“锯齿形”分布。他们使用仅36亿激活参数的GPT-OSS-20b等8个开源小模型,成功复现了Mythos发现的FreeBSD旗舰级漏洞,甚至在识别虚假SQL注入漏洞方面,DeepSeek R1等小模型表现优于GPT-5.4、Claude Sonnet 4.5等顶尖闭源模型。这强有力地证明,网络安全领域并不存在“永远最强”的单体模型,且开源、小巧的模型也能在特定任务上展现出卓越能力。这对于寻求Claude官方等大模型解决方案的用户来说,无疑提供了更多选择和思考。
Opus 4.6的“降智”危机:用户体验的滑铁卢
正当Mythos的“狼来了”之声喧嚣尘上时,另一边,Claude国内使用的用户却正经历着一场体验危机——Claude Opus 4.6被普遍抱怨出现“降智”现象。大量用户反馈,Opus 4.6在解决问题、推理深度和思考长度上,甚至不如其前代Opus 4.5,被戏称为“植物人”。
AMD主管通过对Claude会话日志的分析发现,Claude的“中位思考长度”从2200字符骤降至600字符,这直接导致其深度推理能力大幅受损。由于模型表现不佳,用户不得不频繁重试,导致API请求量暴涨80倍,不仅消耗了更多Token,也直线拉高了使用成本。
资深订阅用户更是直言,Anthropic可能正深陷算力困局,通过收紧使用限制、强迫用户减少Token消耗来应对。然而,在核心模型不稳、Bug频出的情况下,公司却将宝贵的算力投入到开发类似“/buddy”终端宠物等花哨功能上,这种“不务正业”的产品策略,无疑加剧了用户的失望情绪。对于依赖Claude镜像站或claude国内如何使用的用户而言,这种性能下降直接影响了工作效率和体验。
Anthropic的“薛定谔的超级AI”:市场策略与公信力
Anthropic在发布Mythos时的“恐慌营销”和Opus 4.6的“降智”表现,共同塑造了一个“薛定谔的超级AI”形象:实验室里的Claude Mythos正毁灭世界,而网页端的Opus 4.6却智商直线下降。这种巨大的反差,不禁让人质疑Anthropic的市场策略及其公信力。
网络安全专家George Hotz直言,AI双巨头夸大了网络安全风险,软件漏洞并非那么难找,只是合法性问题阻碍了人们的探索。而气候与清洁能源投资人Ramez Naam也指出,Mythos的进步并非突破性,在Epoch能力指数(ECI)上,它只比GPT 5.4强一点,并没有加速ECI的迹象。这一切都指向Anthropic可能在利用“勒索研究”和“恐慌营销”来博取关注,引导舆论,并最终保护其利润底线。
Anthropic在系统卡中承认,Mythos等模型的ECI得分不确定性更大,且其进展源于人类研究,并未出现显著的递归式自我改进。这进一步印证了其在AI能力宣传上的审慎不足。对于希望通过Claude官方中文版或Claude教程深入了解和使用该模型的用户来说,了解这些背景信息至关重要。
结论:回归AI大模型的真实价值与理性发展
Anthropic的案例,为整个AI大模型行业敲响了警钟。它提醒我们,在追逐技术突破和市场关注的同时,不能忽视产品的真实性能、用户体验和诚实的沟通。
AI技术无疑拥有巨大潜力,但其发展需要回归理性。我们应区分技术进步与市场炒作,警惕“狼来了”式的恐慌营销,更要关注模型在实际应用中的稳定性和可靠性。对于用户而言,选择AI工具时,应多方考察,不盲目追逐所谓“最强”模型,而是根据实际需求,结合多方评测和体验,选择真正适合自己的解决方案。同时,也期待包括Claude使用指南在内的更多透明、客观的信息,能帮助用户更好地理解和利用这些前沿技术。
探索更多AI资讯,请访问:https://claude.aigc.bar
Loading...
.png?table=collection&id=cbe6506e-1263-8358-a4d7-07ce62fcbb3f&t=cbe6506e-1263-8358-a4d7-07ce62fcbb3f)