Anthropic 揭露中国三家 AI 实验室涉嫌非法蒸馏 Claude 能力

近日,人工智能领域知名企业 Anthropic 发布了一份调查报告,揭露三家中国 AI 实验室涉嫌通过大规模“蒸馏攻击”,非法提取其 Claude 模型的能力。这三家公司分别是 DeepSeek、月之暗面(Moonshot/Kimi)和 MiniMax。据报告显示,它们共计创建了约 2.4 万个虚假账户,与 Claude 平台执行超过 1600 万次对话交互。

什么是“蒸馏攻击”?

“蒸馏”是一种合法的模型训练技巧,最初用于通过强模型的输出指导弱模型的学习。企业通常利用这一技术来制作自家模型的轻量化或高效版本。然而,未经授权的蒸馏行为却违背了模型服务条款,被视为具有攻击性质。

具体来说,这三家公司利用强大的 Claude 模型生成高质量的数据集,再将其数据回流到自家模型中,以提升模型性能。这种操作看似“借力打力”,但在竞品间未经许可展开训练,已经引发了行业内的道德和法律争议。

三家公司的操作详解

1. MiniMax:规模最大

在报告中,MiniMax 的操作规模被认为是三家公司中最大的。其伪造大量账户,与 Claude 进行了超过 1300 万次交互。MiniMax 的主要目标是提取与编程能力和工具使用相关的高质量训练数据。

2. 月之暗面:聚焦智能体推理

月之暗面的对话次数超过 340 万次,重点在于挖掘模型的智能体推理能力以及计算机视觉相关特点。在复杂任务上,它力图让 Claude 模型展现出关键的智能推理路径,为其模型构建提供重要支持。

3. DeepSeek:训练思维链数据

尽管 DeepSeek 的访问次数最少,仅约 15 万次,但其操作手法颇为值得关注。据调查,其主要通过诱导 Claude 模型反向“复述”自身的思维推理过程,获得极具价值的思维链训练数据。此外,他们还针对政治敏感问题生成“安全答复”,疑似用于突破审查的模型训练。

复杂操作细节暴露行业竞争

这三家公司均采取了高复杂度的绕行策略。例如,借助代理服务规避 Anthropic 对部分地区的访问限制,利用大量分散流量的虚假账户隐匿攻击行为。这一系列复杂操作表明,中国 AI 企业在竞争中表现出的高超技术能力,同时也引发了行业对其行为合规性的反思。

行业的伦理与法律争议

根据报告,Anthropic 已利用 IP 地址和相关的请求元数据,将此次攻击行为溯源至具体实验室甚至部分研究人员。这也为监管与行业规范化敲响了警钟。不少观点认为,中国 AI 公司快速崛起背后固然有大量自主创新,但或多或少仍然存在对国外先进技术的依赖问题,这种依赖不应建立在不正当行为的基础上。

未来如何规范 AI 技术发展?

整起事件无疑为全球人工智能行业的发展提供了新的反思。AI 技术的进步和竞争应以合法、合规为前提,而非偷步前行。未来,行业需要建立更全面的安全规范和法律制度,以保护技术原创者的知识产权,并营造公平的竞争环境。

综上所述,此次 Anthropic 披露事件不仅反映了中国 AI 领域的快速发展,也突显行业在竞争中需面对的重要伦理问题。如何实现技术突破同时维护行业公平,是全球 AI 行业未来必须解决的关键议题。

文章评论

登录后才能发布评论哦
立即登录/注册
消息提醒
Hello, world! This is a toast message.