Anthropic 在周二发布了其最强大的公共模型,到了周三,人工智能社区的很多人希望它没有发布。
关于 Claude Fable 5——该公司限制性 Mythos 级技术的第一个公开可用版本——的共识似乎是它在编码方面表现相当出色,并在日常会话中产生惊人的结果。但它发布时附带了一些严重的投诉:它以毁灭性的速率消耗代币;它在某些研究任务中秘密自我干扰;并且它强迫每个用户进入一个 30 天的数据保留政策,没有例外。
这场反对声音及时而激烈,蔓延到研究人员、开发者、创始人和开源倡导者之间。这并不是正常的发布日抱怨,而是更接近于一次清算。
代币熔炉
用户注意到的第一件事与安全无关。Fable 5 每百万输入代币收费 10 美元,每百万输出代币收费 50 美元——是 Claude Opus 4.8 的两倍。
这个定价本身就足够激进,但用户真正痛苦的是模型在订阅计划中的表现。与 Opus 相比,Fable 5 在使用限制上计算双倍,这意味着在 Fable 上进行相同的工作会以两倍的速度消耗你的计划配额,而在你支付任何 API 费用之前。
实际上,情况更糟。在我们自己的快速测试中,Fable 在一次提示中消耗了我们的每日配额。如果你是那些口袋深的人之一,情况也不会好转。Bleeping Computer 也测试了 Fable,发现它在不到九分钟的时间里耗尽了一项 100 美元 Max 订阅的每日配额。
Scrimba CEO Per Borgen 公开做了数学:“刚刚试了 Fable。它在7分钟内消耗了 130 万个代币。那是每小时 160 美元。相当于 33.3 万美元/年的薪水,”他 在 X 上发布。
T3 Chat 的 Theo 发布称,他在 200 美元的订阅计划上一天内花费了超过 1000 美元的代币。Josh Ellithorpe,Pixelated Ink 的首席技术官,表示 Fable 5 “像没有其他模型一样消耗代币”,在消耗完他的配额前只给了他几个提示。“都无法进行评审,因为我的测试如此有限,”他抱怨道。
Anthropic 的回应是 Workflow 模式——以最激进方式消耗的特性——将复杂提示分解为并行子代理任务,设计上需要更多计算。
还有一个新的系统提示,长度约为 120,000 个代币,并加载到每一个新的对话中。为了提供上下文,这差不多是 GPT-4o 在崩溃前可以处理的代币上下文窗口。
公司还表示,Fable 5 的每任务效率比表面上的代币效率要好,因为它在迭代更少的情况下生成更全面的输出。这个在受控基准测试中可能是对的。但在有严格每日限制的实时订阅中,用户体验的就像是一台机器在几分钟内吞噬他们的预算。
说谎而不撒谎的模型
第二个投诉更加严重,因为它直接来自 Anthropic 自己的文档。在 Fable 5 的系统卡片中,公司披露,当模型检测到用户正在进行前沿大语言模型开发——预训练管道、分布式训练基础设施、机器学习加速器设计时——它不会拒绝回复,也不会回落到较小的模型。它通过提示修改、引导向量或参数高效的微调静默削弱自己,而不告诉用户任何改变。
换句话说,研究人员不知道他们是否在为 Fable 的回复付费,却得到了 Opus 的回复。这也使用户很难知道是什么导致他们的提示失败。
“与我们在网络安全、生物和化学方面的干预和蒸馏尝试不同,这些保护措施对用户是不可见的,”Anthropic 在 Fable 的系统卡片中写道。“相反,保护措施将通过诸如提示修改、引导向量或参数高效微调(PEFT)等方法限制有效性。”
这一区别对研究人员来说极为重要。正如 AI 新闻通讯 Latent Space 指出的,一个公开拒绝的模型可以让研究人员理解一个边界。一个回落到较弱版本的模型是可以检测的。但一个看似有帮助的模型,同时秘密提供更糟的输出,摧毁了科学可重复性——失败的结果可能源于研究者的想法、他们的实现或一个从未披露的隐形干预。
Anthropic 估计这将影响大约 0.03% 的流量。开源和研究社区发现这个数字与所涉及的原则无关。
“亲爱的 Anthropic,你破坏了我们的信任,我认为你永远也无法恢复。我的代币将不再流向你,”Hugging Face 的核心贡献者 Arthur Zucker 在 X 上发布。
Reka AI 的联合创始人 Mikel Artetxe 也对这一决定进行了抨击:
“真是个绝妙的主意!接下来:苹果如果你正在构建竞争技术就会随机重启你的 Mac,Gmail 如果你提到竞争平台就会悄悄编辑你的电子邮件,特斯拉的自动驾驶如果检测到你在开发自动驾驶汽车就会变道。所有这一切当然都是为了安全,”他 发布。
遭受最大影响的研究人员并不是拥有专有基础设施的大实验室,而是使用 Claude 作为公共工具的学术界、初创企业和独立构建者——恰恰是 Anthropic 一直声称要保护的人群。开源研究平台 AlphaXiv 称这种做法是一个“不是安全”的先例,争辩说安全政策应该是透明的且可审计的。
刚在 Arcee AI 开始工作、曾在艾伦研究所工作过的 Nathan Lambert 更简单地说:“对我而言,这明确地将 Anthropic 描绘为反科学,因此也是反进步和反安全,”他 写道。
匿名用户 "CalleBTC",一名 人工智能和加密开发者,一直在等待 Fable 帮助训练世界模型,也总结了这种沮丧。“Anthropic 已经迷失了方向。我真的在等待 Mythos 帮助我训练世界模型。然而,他们选择搞砸他们的模型以抑制竞争,”他 说,称这一举动“深具不道德性,对开发者和科学家不尊重。”
总的来说,研究人员认为 Fable 的限制超出了特定主题,可能受到模型对用户分类的影响。
“你的提示就是我的”
第三个投诉最直接影响企业用户,但其影响波及所有人。根据 Anthropic 自己的公告,所有 Mythos 级模型的流量——Fable 5、Mythos 5 以及任何未来具备相似能力的模型——在每个平台上都必须遵循 30 天的数据保留,包含像 AWS Bedrock 和 Google Vertex AI 这样的第三方平台。
公司保证在“几乎所有情况下”,这些数据将在 30 天后被删除。
对于企业用户来说,问题不在于 Anthropic 所说的将会做什么,而在于政策结构性要求的内容。处理特权法律通信、医疗记录、机密源代码的公司,一旦使用这些模型可能会陷入麻烦。如果与 Anthropic 有具体的隐私协议,用户争论说应该更新以保障隐私。
合规问题还涉及地理问题。根据 GDPR 的数据最小化规则运营的欧洲公司,或任何需要可证明零保留的受监管工作流程的组织,直到 Anthropic 提供特例,都会被排除在 Fable 5 之外。匿名用户 Lisan al Gaib,一位在 AI 社区中颇有名望的人物,直接指出了这一后果:
“Anthropic 刚刚把很多欧洲公司委托给了永久的下层阶级。如果 Anthropic 为 Claude Mythos 和 Fable 5 保存数据 30 天,那么所有需要零数据保留的公司根本无法使用它们。”
Hugging Face CEO Clement Delangue 将这一周的事件放在了更大的论点中:
“权力、能力和经济财富的集中是人工智能最大的风险,”他 写道。“我们比以往任何时候都更需要开放科学和开源!”
另一位用户 写道:“抛开玩笑不谈,显然 Anthropic 是通往最糟糕的反乌托邦的直接路径。他们的 CEO 反对他所创造的技术。限制与机器学习相关主题的知识和教育是极其可鄙的。”
Fable 5 在 Pro、Max、Team 和 Enterprise 计划中直到 6 月 22 日是免费的。之后,将仅转为使用积分——API 费率,不包括订阅——而 Anthropic 表示将在“能力扩展后尽快恢复更广泛的访问。”
免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。