AI生成图像正在渗透科学期刊，检测军备竞赛已处于下风

2026年4月，《新英格兰医学杂志》，世界上最负盛名的医学期刊之一，撤回了一篇病例报告。该文章刊登在期刊的”临床医学图像”栏目中，描述了一位87岁男性在接触森林火灾后咳出支气管管型。图像显示，黑色分支状气道管型旁边放着一把卷尺。

问题就出在卷尺上。PubPeer上的一位匿名评论者注意到，卷尺上30厘米到40厘米之间的刻度读数为”1, 3, ?, 4, ?”，这是典型的AI生成伪影。作者承认他们使用AI将尺子移到了图像顶部，并表示他们不知道期刊关于图像处理的政策。

这是自2020年Surgisphere丑闻以来，《新英格兰医学杂志》的首次撤稿。

据威斯康星大学麦迪逊分校科学传播学副教授Nan Li称，《新英格兰医学杂志》的案例是一个更大问题的高调症状。在为The Conversation撰写的、由Live Science转载的文章中，Li认为，AI生成和AI处理的图像正在跨越各个领域进入同行评审文献，而旨在捕捉这些图像的系统已经落后。

问题的深度

最明显的案例是一目了然的，那些人类审稿人会觉得可笑的图像。2024年，《细胞与发育生物学前沿》撤回了包含一张看似由Midjourney生成的老鼠图片的论文，这只老鼠的生殖器极其不成比例，还带有”iollotte sserotgomar cell”和”dck”等毫无意义的标签。一位审稿人在发表前曾对该图像提出质疑，但他们的担忧被驳回了。

但大多数案例更为隐蔽。越来越多的证据表明，AI生成和修改的图像正以不太明显的方式溜过审稿过程。这个问题从材料科学到医学等多个领域都有涉及。苏黎世联邦理工学院的研究人员在arXiv上发表了一篇题为”The Unwinnable Arms Race of AI Image Detection”的论文（arXiv:2509.21135），正式证明随着生成器能力的提升，检测准确率呈现U形曲线，先变得容易一段时间，然后随着两个系统的趋同而再次变得困难。

“旨在检测虚假图像的系统几乎总是落后于旨在创建这些图像的系统，”Li写道。

检测差距

目前最先进的AI图像检测器在已知生成器上的准确率可达70%到90%。而在下一代模型上，这一数字下降到50%到60%，基本上相当于随机猜测。

这一差距之所以重要，是因为检测只是解决方案的一半。一个更广泛的应对方案正在围绕来源认证展开，即从图像创建之时起就伴随图像的加密签名元数据。领先的标准是C2PA（内容来源与真实性联盟），得到了Adobe、Microsoft、Google、OpenAI以及包括Leica、Nikon和Canon在内的相机制造商的支持。OpenAI现在为ChatGPT生成的图像附加了C2PA元数据和Google的SynthID隐形水印。

但C2PA有一个根本性的弱点：通过截图、重新上传或格式转换去除元数据，会完全切断来源链。该标准可以证明数字文件未被篡改，但无法证明所描绘的场景是真实的。

出版商回应

各大期刊已开始更新其政策以应对这一挑战。施普林格·自然已禁止在出版物中使用生成式AI图像（少数例外情况除外），并要求披露手稿中任何AI的使用情况。爱思唯尔于2026年6月发布的最新政策禁止AI创建或更改初级研究图像，包括显微镜、组织学、Western印迹和放射学扫描，并要求详细披露所使用的任何AI工具。

科学系列期刊在主编Holden Thorp的领导下采取了最强硬的立场，将AI违规行为归类为科学不端行为。在2026年1月题为”抵制AI垃圾”的社论中，Thorp写道，审稿人不得将手稿上传到AI工具，任何AI使用都必须在投稿信、方法部分和致谢中披露。

预印本库arXiv于2026年5月宣布，将对提交存在”无可辩驳证据”表明存在未经审核的AI生成内容的论文的作者实施一年禁令，例如虚构的参考文献或LLM留下的元评论。

问题的规模

这些数字令人警醒。根据2026年1月的一项预印本研究，大约每八篇生物医学论文中就有一篇包含AI生成的文本。一项对《组织科学》期刊6,957篇投稿的调查发现，自ChatGPT发布以来，投稿量激增了42%，到2026年初，超过50%的手稿显示出AI参与的痕迹。

NIST GenAI挑战赛，一项正式的评估项目，让团队作为生成器、提示者和判别者进行竞争，反映了军备竞赛的动态。NIST于2024年4月发布的AI 100-4框架涵盖了数字水印、元数据来源和合成内容检测，但该机构承认该领域的发展速度快于标准制定的速度。

这场危机的意义

AI生成图像的渗透威胁着科学出版物的一个基本前提：即已发表的图像是对所观察内容的诚实呈现。没有这一前提，期刊必须像筛查文本一样筛查图像，这是一项大多数出版商尚未准备好应对的巨大工程。

“没有标准，”Li写道，”科学就有可能进入一个每张图像都值得怀疑、没有图像具有固有可信度的世界。”

问题不在于AI生成的图像是否会继续进入科学文献。这场战争已经输了。问题在于，科学界能否在区分真实图像和生成图像本身变得不可能之前，建立起一个能够区分二者的系统。

来源： Live Science 和 The Conversation，Nan Li（威斯康星大学麦迪逊分校）。来自Retraction Watch、Nature Communications和arXiv的补充报道。

婷翻译