CVPR 2026｜Stable Diffusion 记忆化根源：CLIP Embedding 的隐藏缺陷

CVPR 2026 Findings 录用，来自韩国研究团队。核心问题是：Stable Diffusion 为什么会记住训练数据中的特定图片？

不是数据泄露，而是一个隐藏在 CLIPTokenizer 里的结构性缺陷——且修复方法简单到难以置信。

研究团队将输入 token 分为四类：<startoftext>、<prompt>、<endoftext>、<pad>，对应嵌入向量 v^sot、v^pr、v^eot、v^pad。

关键发现：

换句话说：SD 的记忆化问题，本质上是 <pad> token 的嵌入与 <eot> 嵌入长得太像，而训练时只有 <eot> 被优化，最终模型把 <pad> 的影响当成了 <eot> 的信号来用。

两种方法均可在不降低生成质量的前提下抑制记忆化，且无需事先检测，可直接部署。

重要意义

这篇论文的价值不止于修复 SD。它揭示了一个更普遍的问题：当代模型的记忆化风险，可能并不来自模型本身，而来自数据处理流程中那些看似无害的工程选择。分词器设计、嵌入初始化——这些底层细节，正在以我们未预期的方式影响模型行为。

论文：Memorization In Stable Diffusion Is Unexpectedly Driven by CLIP Embeddings

arXiv：https://arxiv.org/abs/2605.02908

代码：https://github.com/quasar529/sd-clip-mem

推荐好物