AI生成画像が科学誌に浸透——検出競争はすでに敗色濃厚

2026年4月、New England Journal of Medicine（ニューイングランド医学ジャーナル）,,世界で最も権威ある医学誌の一つ,,が症例報告を撤回した。同学誌の「Images in Clinical Medicine」セクションに掲載されたこの論文は、森林火災に曝露した後に気管支鋳型を咳き出した87歳の男性について記述していた。画像には、メジャーの隣に黒く枝分かれした気道鋳型が写っていた。

問題はメジャーだった。PubPeerの匿名コメンテーターが、30センチと40センチの間の定規の目盛りが「1, 3, ?, 4, ?」と読めることに気づいた,,典型的なAI生成アーティファクトである。著者らは、定規を画像の上部に移動させるためにAIを使用したことを認め、画像操作に関するジャーナルのポリシーを知らなかったと述べている。

これは、2020年のSurgisphereスキャンダル以来、NEJMにとって初めての撤回だった。

NEJMの事例は、はるかに大きな問題の注目度の高い症状だと、ウィスコンシン大学マディソン校の科学コミュニケーション准教授であるNan Li氏は指摘する。The Conversationに掲載され、Live Scienceによって転載された記事で、Li氏は、AI生成およびAI操作された画像が分野を超えて査読付き文献に入り込んでおり、それらを捕捉するために設計されたシステムはすでに遅れを取っていると論じている。

深刻な問題

最も目に見えるケースは明らかで、人間の査読者には笑ってしまうような画像である。2024年、Frontiers in Cell and Developmental Biologyは、Midjourneyで生成されたと思われる、不釣り合いに巨大な性器と「iollotte sserotgomar cell」や「dck」といった無意味なラベルが付されたラットを含む論文を撤回した。一人の査読者が出版前に画像にフラグを立てていたが、彼らの懸念は却下された。

しかし、ほとんどのケースはより微妙である。増え続ける証拠は、AI生成・改変画像がより目立たない方法で査読プロセスをすり抜けていることを示している。問題は材料科学から医学まで多岐にわたる。ETHチューリッヒの研究者らは、arXivに「The Unwinnable Arms Race of AI Image Detection」（arXiv:2509.21135）と題する論文を発表し、生成器の能力が向上するにつれて検出精度がU字型の曲線を描き、一時的に容易になり、その後両システムが収束するにつれて再び困難になることを正式に実証した。

「偽画像を検出するために設計されたシステムは、それらを作成するために設計されたシステムにほとんど常に遅れをとる」とLi氏は書いている。

検出のギャップ

現在の最先端AI画像検出器は、既知の生成器に対して70〜90%の精度を達成している。次世代モデルでは、その精度は50〜60%に低下し、本質的にランダムとなる。

このギャップが重要なのは、検出が解決策の半分に過ぎないからだ。より広範な対応として、画像の作成時点から付随する暗号署名付きメタデータであるプロvenance（来歴）を中心とした取り組みが浮上している。主要な標準はC2PA（Coalition for Content Provenance and Authenticity）で、Adobe、Microsoft、Google、OpenAI、そしてLeica、Nikon、Canonなどのカメラメーカーが支持している。OpenAIは現在、ChatGPTが生成した画像にC2PAメタデータとGoogleのSynthID不可視透かしの両方を添付している。

しかし、C2PAには根本的な弱点がある。スクリーンショット、再アップロード、形式変換によるメタデータの除去は、来歴の連鎖を完全に断ち切ってしまう。この標準はデジタルファイルが改ざんされていないことを証明するが、描写されたシーンが本物であることを証明することはできない。

出版社の対応

主要ジャーナルは対応としてポリシーの更新を始めている。Springer Natureは、狭い例外を除き、出版物からの生成AI画像を禁止し、原稿でのAI使用の開示を義務付けている。Elsevierの更新されたポリシー（2026年6月公開）は、顕微鏡検査、組織学、ウェスタンブロット、放射線スキャンを含む一次研究画像のAIによる作成または改変を禁止し、使用されたAIツールの詳細な開示を要求している。

Scienceファミリーのジャーナルは、編集長Holden Thorpのもとで最も積極的な姿勢を取り、AI違反を科学的不正行為として分類している。2026年1月の「Resisting AI slop」と題された社説で、Thorpは査読者が原稿をAIツールにアップロードしてはならず、AI使用はカバーレター、方法、謝辞で開示されなければならないと書いた。

プレプリントリポジトリarXivは、2026年5月、制御されていないAI生成の「反駁不能な証拠」,,幻覚の参考文献や、LLMからのメタコメントが残されたままなど,,がある論文を提出した著者に対し、1年間の投稿禁止措置を課すと発表した。

問題の規模

数字は深刻である。2026年1月のプレプリント研究によると、現在、生物医学論文の約8件に1件にAI生成テキストが含まれている。ジャーナルOrganization Scienceへの6,957件の投稿を調査したところ、ChatGPTのリリース以降42%の急増が見られ、2026年初頭までに50%以上の原稿がAIの関与を示している。

NIST GenAI Challenges,,正式な評価プログラム,,では、チームが生成器、プロンプター、識別子として競い合い、軍拡競争のダイナミクスを反映している。2024年4月に公開されたNISTのAI 100-4フレームワークは、デジタル透かし、メタデータの来歴、合成コンテンツ検出をカバーしているが、同機関はこの分野が標準の開発よりも速く進んでいると認めている。

危機の意味するところ

AI生成画像の浸透は、科学出版の根本的なものを脅かしている：出版された画像は観察されたものの正直な表現であるという前提である。その前提がなければ、ジャーナルはテキストをスクリーニングするのと同じように画像をスクリーニングしなければならない,,ほとんどの出版社が備えていない膨大な作業である。

「基準がなければ、科学はすべての画像が疑問視され、どの画像も内在的な信頼性を持たない世界に突入するリスクがある」とLi氏は書いている。

問題は、AI生成画像が科学文献に入り続けるかどうかではない。その戦いはすでに失われている。問題は、科学コミュニティが、本物の画像と生成された画像の違いを見分けることを可能にするシステムを、その区別自体が不可能になる前に構築できるかどうかである。

ソース： Live Science および The Conversation、Nan Li著（ウィスコンシン大学マディソン校）。Retraction Watch、Nature Communications、arXivからの追加取材。

雅子訳