揭秘 Claude Code 缓存策略:隐私与性能如何平衡?

近日,一位开发者 Can Vardar 发现,在 Claude Code 关闭遥测(Telemetry 即向 Anthropic 回传使用数据)后,缓存时间从 1 小时骤降至 5 分钟。这个发现迅速引发热议,将关注点聚焦在性能与隐私保护的权衡上。

发现:关闭遥测对缓存的影响

根据 Can Vardar 的实测,关闭遥测后,提示缓存时间大幅缩短,性能仿佛被削弱。他将此解读为“隐私换性能”,并对 Anthropic 这一措施提出质疑,甚至称其为“邪恶公司”。他还指出,这样的调整相当于性能降低约 12 倍,引发了更多开发者的讨论。

工程师回应:背后不仅是隐私影响

面对汹涌质疑,Anthropic 工程师 Boris Cherny 出面澄清,详细解析了 Claude Code 的缓存策略。他指出:

  • 1 小时缓存并非总是更好:缓存时间越长,缓存写入成本越高。如果仅进行一次查询,长缓存反而不划算,因为占用了更大的资源但未被频繁读取。
  • 缓存调整需基于场景:例如,子任务(subagent)查询极少恢复,因此仅保留 5 分钟缓存更为经济。当前对于 API 用户,1 小时长缓存仍在测试阶段。
  • 遥测关联的技术耦合问题:关闭遥测功能后,客户端实验开关也随之失效,导致系统恢复默认设置,即 5 分钟缓存。这实质上是技术耦合问题,而非刻意惩罚用户。

后续优化方案正在路上

Boris 还透露,Anthropic 正在优化其缓存策略的灵活性和透明度,具体计划包括:

  • 为部分查询默认缓存时间改为 1 小时,并提供环境变量让用户选择性启用更长缓存。
  • 持续评估不同场景下的缓存成本与性能收益,将资源用在更高效的地方。

对于被质疑的“12 倍性能差距”,Boris 表示实际影响有限,关闭遥测后,能节省的 Token 实际上并没有用户直观感受到的夸张。

开发者如何看待这一争议?

这一讨论让更多人关注到缓存策略与系统性能的精细化平衡。缓存长度不仅影响操作成本,还涉及功能体验。在注重隐私保护的同时,如何以用户需求为导向调整策略,是技术服务提供商面临的重要课题。

随着后续优化调整的推出,相信开发者能够拥有更多自主权和更优的使用体验,也期待 Claude Code 在隐私与性能上的平衡能不断优化。

文章评论

登录后才能发布评论哦
立即登录/注册
消息提醒
Hello, world! This is a toast message.