
2026年4月,《新英格兰医学杂志》,世界上最负盛名的医学期刊之一,撤回了一篇病例报告。该文章刊登在期刊的”临床医学图像”栏目中,描述了一位87岁男性在接触森林火灾后咳出支气管管型。图像显示,黑色分支状气道管型旁边放着一把卷尺。
问题就出在卷尺上。PubPeer上的一位匿名评论者注意到,卷尺上30厘米到40厘米之间的刻度读数为”1, 3, ?, 4, ?”,这是典型的AI生成伪影。作者承认他们使用AI将尺子移到了图像顶部,并表示他们不知道期刊关于图像处理的政策。
这是自2020年Surgisphere丑闻以来,《新英格兰医学杂志》的首次撤稿。
据威斯康星大学麦迪逊分校科学传播学副教授Nan Li称,《新英格兰医学杂志》的案例是一个更大问题的高调症状。在为The Conversation撰写的、由Live Science转载的文章中,Li认为,AI生成和AI处理的图像正在跨越各个领域进入同行评审文献,而旨在捕捉这些图像的系统已经落后。
问题的深度
最明显的案例是一目了然的,那些人类审稿人会觉得可笑的图像。2024年,《细胞与发育生物学前沿》撤回了包含一张看似由Midjourney生成的老鼠图片的论文,这只老鼠的生殖器极其不成比例,还带有”iollotte sserotgomar cell”和”dck”等毫无意义的标签。一位审稿人在发表前曾对该图像提出质疑,但他们的担忧被驳回了。
但大多数案例更为隐蔽。越来越多的证据表明,AI生成和修改的图像正以不太明显的方式溜过审稿过程。这个问题从材料科学到医学等多个领域都有涉及。苏黎世联邦理工学院的研究人员在arXiv上发表了一篇题为”The Unwinnable Arms Race of AI Image Detection”的论文(arXiv:2509.21135),正式证明随着生成器能力的提升,检测准确率呈现U形曲线,先变得容易一段时间,然后随着两个系统的趋同而再次变得困难。
“旨在检测虚假图像的系统几乎总是落后于旨在创建这些图像的系统,”Li写道。
检测差距
目前最先进的AI图像检测器在已知生成器上的准确率可达70%到90%。而在下一代模型上,这一数字下降到50%到60%,基本上相当于随机猜测。
这一差距之所以重要,是因为检测只是解决方案的一半。一个更广泛的应对方案正在围绕来源认证展开,即从图像创建之时起就伴随图像的加密签名元数据。领先的标准是C2PA(内容来源与真实性联盟),得到了Adobe、Microsoft、Google、OpenAI以及包括Leica、Nikon和Canon在内的相机制造商的支持。OpenAI现在为ChatGPT生成的图像附加了C2PA元数据和Google的SynthID隐形水印。
但C2PA有一个根本性的弱点:通过截图、重新上传或格式转换去除元数据,会完全切断来源链。该标准可以证明数字文件未被篡改,但无法证明所描绘的场景是真实的。
出版商回应
各大期刊已开始更新其政策以应对这一挑战。施普林格·自然已禁止在出版物中使用生成式AI图像(少数例外情况除外),并要求披露手稿中任何AI的使用情况。爱思唯尔于2026年6月发布的最新政策禁止AI创建或更改初级研究图像,包括显微镜、组织学、Western印迹和放射学扫描,并要求详细披露所使用的任何AI工具。
科学系列期刊在主编Holden Thorp的领导下采取了最强硬的立场,将AI违规行为归类为科学不端行为。在2026年1月题为”抵制AI垃圾”的社论中,Thorp写道,审稿人不得将手稿上传到AI工具,任何AI使用都必须在投稿信、方法部分和致谢中披露。
预印本库arXiv于2026年5月宣布,将对提交存在”无可辩驳证据”表明存在未经审核的AI生成内容的论文的作者实施一年禁令,例如虚构的参考文献或LLM留下的元评论。
问题的规模
这些数字令人警醒。根据2026年1月的一项预印本研究,大约每八篇生物医学论文中就有一篇包含AI生成的文本。一项对《组织科学》期刊6,957篇投稿的调查发现,自ChatGPT发布以来,投稿量激增了42%,到2026年初,超过50%的手稿显示出AI参与的痕迹。
NIST GenAI挑战赛,一项正式的评估项目,让团队作为生成器、提示者和判别者进行竞争,反映了军备竞赛的动态。NIST于2024年4月发布的AI 100-4框架涵盖了数字水印、元数据来源和合成内容检测,但该机构承认该领域的发展速度快于标准制定的速度。
这场危机的意义
AI生成图像的渗透威胁着科学出版物的一个基本前提:即已发表的图像是对所观察内容的诚实呈现。没有这一前提,期刊必须像筛查文本一样筛查图像,这是一项大多数出版商尚未准备好应对的巨大工程。
“没有标准,”Li写道,”科学就有可能进入一个每张图像都值得怀疑、没有图像具有固有可信度的世界。”
问题不在于AI生成的图像是否会继续进入科学文献。这场战争已经输了。问题在于,科学界能否在区分真实图像和生成图像本身变得不可能之前,建立起一个能够区分二者的系统。
来源: Live Science 和 The Conversation,Nan Li(威斯康星大学麦迪逊分校)。来自Retraction Watch、Nature Communications和arXiv的补充报道。
婷 翻译

