
AI医生说你患有睡眠呼吸暂停:衡量面向患者的AI在睡眠医学中的准确性
你在ChatGPT中输入”我患有睡眠呼吸暂停吗?”,几秒钟内就能得到一个详细、自信、听起来像医生的答案。这感觉就像无需等待数月进行睡眠研究就能获得第二诊疗意见。但这个答案真的正确吗?
发表在《临床睡眠医学杂志》上的一项新研究对这个问题进行了检验。耶鲁大学医学院和VA康涅狄格医疗系统的Christine H.J. Won医生评估了面向患者的人工智能工具(驱动ChatGPT、Gemini和Claude等聊天机器人的大语言模型)在回答关于睡眠呼吸暂停筛查、诊断和治疗的现实问题时的准确度。研究结果是对围绕AI在医学中应用的热潮的一剂清醒剂。
研究发现
Won医生设计了一项系统评估,针对AI对阻塞性睡眠呼吸暂停(OSA)常见患者问题的回答进行评估。问题涵盖临床关注的全部范围:风险因素、症状、何时寻求睡眠研究、家庭睡眠测试结果的解读、包括PAP治疗和口腔矫治器在内的治疗方案,以及长期管理。
使用经过验证的评估工具(包括QAMAI框架,即由Vaira及其同事于2024年开发的医疗人工智能质量分析工具),该研究对每个回答的准确性、完整性和安全性进行了评分。AI会将患者引导至适当的护理吗?它会标记危险的误解吗?还是会自信地提供听起来合理但医学上错误的建议?
该研究直接基于Hack等人(2026年,同样发表于《JCSM》)的早期工作,他们将生成式AI与传统网络搜索在OSA患者教育方面进行了比较。那项早期研究发现,在提供信息的质量方面,AI可以匹配甚至有时超越网络搜索。但研究也发现,AI的回答带有一种独特的风险:即使不正确,它们听起来也具有权威性,使患者更难发现错误。
Won医生的研究结果使这一图景更加清晰。虽然大语言模型通常能产生大体合理的回答,但准确性根据具体提出的问题而有显著差异。这些工具在一般性、有充分文献记载的话题上表现最佳,例如”睡眠呼吸暂停的症状是什么?”或”睡眠呼吸暂停如何治疗?”这些话题的训练数据中信息丰富,且随时间相对稳定。这些工具在细微的临床判断方面最为吃力:解读临界诊断结果、建议后续检测,以及为有多种合并症的患者权衡治疗方案。
为何重要
这里涉及的利益并非学术性的。根据最新的全球患病率数据,睡眠呼吸暂停影响全球约9.36亿成年人,其中绝大多数仍未得到诊断。患者越来越多地将AI作为健康信息的首选,有时甚至在就诊医生之前。研究中引用的一项2025年调查发现,大约每五名成年人中就有一人曾使用生成式AI工具提出健康相关问题,而且这一数字还在攀升。
对于已经面临睡眠研究等待时间长和认证睡眠医学专家短缺问题的睡眠医学领域来说,AI既可以成为强大的分诊工具,也可能成为危险误导的来源。如果患者根据AI生成的不正确建议采取行动(跳过医学上必要的睡眠研究、自行调整PAP治疗设置、或忽视更严重疾病如中枢性睡眠呼吸暂停或低通气的警示信号),后果可能很严重。
问题还因以下事实而加剧:AI聊天机器人并非为医疗决策而设计。它们被设计为产生合理、流畅的文本。当患者提出没有明确答案或需要个体化临床判断的问题时,模型会产生某些内容。而这些内容可能不完整、具有误导性或完全错误。
研究的局限性
这项研究与该领域所有早期工作一样,具有重要的局限性。它评估了单一时间点AI工具的快照;大语言模型频繁更新,准确性可能在模型版本之间发生显著变化。评估还依赖于专家对回答的审查,而非真实的患者预后。我们尚不清楚患者实际基于AI建议改变治疗的频率,也不清楚这样做会带来什么伤害。
此外,该研究特别关注阻塞性睡眠呼吸暂停。其他睡眠障碍(失眠、不宁腿综合征、发作性睡病、昼夜节律紊乱)给AI带来了不同的挑战,而大语言模型回答的准确性可能因这些疾病而异。
结论
这项研究并不表明AI在睡眠医学中没有作用。Hack等人的姊妹篇论文及其他近期系统综述(包括Abd-Alrazaq等人2024年关于可穿戴AI用于睡眠呼吸暂停检测、Banjade等人2025年关于AI在睡眠医学中的广泛应用、以及Haghighat等人2025年关于AI诊断OSA准确性的研究)都指出了真正的潜力。AI可以帮助患者了解自己的病情、为就诊做好准备、并导航治疗方案。如果使用得当,它可能改善健康素养和医疗服务可及性。
但准确性并非有保障。从Won医生的研究中得出的关键结论是,患者和临床医生都需要以对待任何其他未经核实来源的同样怀疑态度来对待AI生成的健康建议。聊天机器人不是医生。它无法审查你的病史、在上下文中解释你的症状、或在不知道答案时告诉你它不知道。
目前,最安全的方法很简单:向聊天机器人询问背景信息,但将实际的医疗决策交给人类睡眠专家。AI可能是一个有用的起点,但它不是终点线。
来源: Won CHJ. AI医生说你患有睡眠呼吸暂停:衡量面向患者的AI在睡眠医学中的准确性. J Clin Sleep Med. 2026;22(1):99. DOI: 10.1007/s44470-026-00119-2. PMID: 42387082.
婷 翻译

