2026-02-28 16:17
人工智能(AI)正迈入核医学领域,且有望长期扎根发展。欧洲核医学协会(EANM)作为行业学会,能够且必须在核医学人工智能的应用中发挥核心作用。本立场文件阐释了人工智能在核医学领域落地应用的前提条件,并明确协会的立场主张。
关键词:人工智能;核医学;欧洲核医学协会
本文阐述了欧洲核医学协会对于人工智能引入核医学临床领域的官方立场,是对欧洲核医学协会人工智能工作组发表综述文章的补充 —— 维斯维基斯等人在该综述中界定了人工智能的定义,阐述了其在影像重建、数据校正、处理与分析等方面的诸多应用,以及在核医学所有临床领域的潜在价值。
人工智能虽刚进入核医学领域,却已在相邻的放射学专业中成为现实。2020年9月,美国医疗保险和医疗补助服务中心(CMS)首次正式批准为放射学人工智能算法提供报销,为人工智能影像软件在临床的更广泛应用打开了大门。总体而言,放射学界对于人工智能的影响历来存在两种观点:一种较为乐观,认为人工智能将助力强化放射科医生在医疗体系中的核心作用;另一种则认为,人工智能将取代放射科医生的部分工作,成为与其竞争的对手而非辅助工具。
近期一项调查显示,放射医学界对人工智能持温和乐观态度,62%的从业者认为诊断放射科医生的工作不会因人工智能面临威胁;随着人工智能被愈发视为解决当前放射科医生短缺、提升医疗服务质量、降低整体医疗成本的潜在方案,行业对其接受度也在不断提高。
核医学界对这类问题的探索才刚刚起步,或许部分从业者认为这些问题会在未来自然解决,无需主动干预。人工智能在核医学与放射学(及其他学科)的应用存在诸多共性,尤其是在混合成像所采用的断层扫描技术方面。尽管人工智能在核医学领域的应用滞后于其他学科,但没有理由认为其他学科中人工智能的优势、发展成果、解决方案和面临的挑战不适用于核医学。
此外,人工智能的发展影响的不仅是核医学医生,还包括医学物理学家、放射化学家与放射药剂师。核医学的一些独特特点——如短寿命同位素对放射性药物制备和患者检查排期的影响、个体化剂量测定在治疗中的应用日益广泛——或将进一步提升人工智能对核医学日常实践的潜在影响。
人工智能的首批常规临床应用或将出现在影像重建与处理领域(如去噪、分割)。尽管乍看之下这类应用似乎完全由医学物理学家主导,但它们并非对患者完全无风险,因此也需要医生进行严格监督。基于深度学习的影像重建技术可能产生误差,引发伪影和影像畸变,进而对临床诊断造成潜在影响。
诚然,当前最先进的迭代重建技术及相关数据校正算法也可能产生特定伪影,但这类伪影已为业界熟知,且易于识别。与之相反,机器学习算法——即便是最先进的算法——也可能因输入数据的微小变化出现判断失误,对数据处理完全失当,从而产生难以预测的伪影。人工智能的物理学应用与临床应用之间存在紧密的关联性,这种相互关联以及误差传导的潜在风险,意味着必须强调对人工智能技术的每个应用阶段进行严格验证。
欧盟已认可这一通用原则,其出台的《欧洲人工智能条例》采用基于风险的监管思路,旨在让高风险医疗人工智能解决方案对医疗专业人员和患者而言更安全、可靠且值得信赖。
举一例说明:在氟代脱氧葡萄糖(¹⁸F-FDG)正电子发射断层扫描 / 计算机断层扫描(PET/CT)成像中,病灶的识别、定位与分割过程通常被整合为一个步骤。即算法从示踪剂的整体分布容积(三维PET影像)出发,最终得到多个感兴趣区,并将每个区域判定为病变组织。
例如,西比尔等人开发的一款结合PET和CT数据的深度学习算法,在肺癌患者分类中达到87.1%的灵敏度和99%的特异性,对该人群病灶的定位准确率达88.6%;在弥漫性大B细胞淋巴瘤患者中,该方法被证实可预测患者的总生存期(OS)和无进展生存期(PFS)。
但在该研究中,针对分割任务的索伦森-狄克逊系数(用于衡量医生与深度学习算法所确定病灶容积的相似度)在研究队列中仅为0.65,在常规临床队列中更是低至0.48。这一结果表明,与直观印象相反,当前版本的该深度学习算法在该类患者群体中,难以精准复刻医生识别和勾画病变组织的操作,尽管其仍能有效预测患者的总生存期和无进展生存期。
这一现象显然与该深度学习算法的训练目标相关 —— 其并非为精准分割三维功能容积而设计,而是用于表征感兴趣区。此外,目前存在多种采用不同架构的深度学习算法,因此需明确的是,单一算法几乎不可能高精度完成多项任务。
以影像分割为例,U型网络(U-NET)已被证实能在不同影像尺度、类型和分辨率下实现高精度分割,这一优势在PET功能影像中同样成立,其性能与过去十年开发的最优半自动分割算法相当甚至更优。
需注意的是,影像分割任务并不存在绝对的"真实标注",因此任何深度学习算法的结果都高度依赖人类专家的标注。目前的"金标准"为人工测定的代谢肿瘤容积,该标准既未考虑观察者间和观察者内的可重复性,也未通过其他成像技术或病理检查进一步验证。
因此,在算法与人工标注存在差异的案例中,我们无法判定孰对孰错——是人工"金标准"存在偏差,还是深度学习算法出现错误?最终仍需医生决定保留、修正或舍弃哪些结果,这意味着我们仍需接受人类判断中固有的缺陷。
另一方面,若该算法被用于放疗计划中的靶区勾画,判定算法与人工标注孰对孰错的问题将变得尤为关键,因为其结果会直接改变计划靶区的范围;而若算法的应用目标是预后评估或治疗反应评价,则客观缓解率、生存期等临床终点指标将成为核心评判标准。
因此必须强调,基于特定深度学习算法架构的单一解决方案,其应用范围应限定在初始训练目标和相关训练数据集的范围内,未经充分验证,其结果不得推广至其他场景。
维斯维基斯等人提出了可解释性和可归因性的概念,显然,这两个概念是临床实践中信任人工智能应用的基础。但我们认为,仅靠这两点还不够。
当前的人工智能模型大多为静态模型:模型在特定时间点完成训练,训练样本对应特定人群,且模型构建时的验证环境经过严格设计。验证过程需使用来自模型开发机构以外多个中心的数据集,以测试模型在异构数据集(如不同采集和重建协议下的数据集)中的鲁棒性;此外,在广泛应用经验证的人工智能模型前,还应考虑采用影像标准化和同质化技术。
这类静态算法还可能出现概念漂移现象——即算法最初能高效、可靠地完成任务,但当患者群体、相关治疗方案发生变化,或成像技术更新后,其性能可能大幅下降。因此,算法不应停止学习,而应根据待分析数据的变化进行自适应调整,这一理念被称为持续学习或连续人工智能。
在该模式下,算法具备自主学习能力,能逐步适应输入数据中的新特征,持续更新特征选择方式,以更好地适配不断变化的应用环境。直观来看,这一过程具备显著优势,但同时也需配合前文所述的持续重新验证流程。
事实上,当极端异常值出现时,自主学习的算法可能发生灾难性推理或灾难性遗忘,导致算法性能骤降。简言之,即便是在上市和临床落地时经过充分验证、值得信赖的人工智能算法,也需要持续接受严苛的质量控制,其要求堪比药物研发中的IV期上市后监测。
对此,《欧洲人工智能法案》制定了完善的上市后合规与执法体系,包括市场监督、开发者开展的上市后监测、不良事件报告制度,以及人工智能系统发生重大变更时的重新评估机制,进一步强化了上市前的符合性评估。欧盟提出的这一监管体系,旨在保障人工智能系统在全生命周期内的可信度。
人工智能在提升影像质量、实现剂量个体化(诊断和诊疗一体化均适用)、辅助影像解读及后续分析方面展现出巨大潜力,为充分挖掘核医学的发展潜力开辟了新路径。
核医学领域近期涌现出全身PET等新技术,其产生的海量数据也能借助人工智能实现高效分析;核医学一直致力于通过PET和SPECT量化分子过程,而人工智能也能为这一过程提供助力。
由此可见,人工智能有望优化临床工作流程,提升整体诊疗效率,同时推动个性化医疗发展,为患者带来切实获益。但要让人工智能在核医学领域的潜力得到医疗专业人员和患者的认可并实现落地,仍有很长的路要走。欧洲核医学协会能够且必将在这一过程中发挥关键作用。
2019年的一项系统综述显示,肿瘤学是目前核医学人工智能应用相关文献发表最多的领域,具体而言,人工智能和放射组学领域86%的文献均围绕肿瘤学展开。尽管如此,心脏病学(近期一份立场文件已对此进行阐述)、神经病学、炎症与感染性疾病领域,以及核医学治疗领域,均能从人工智能的发展中获益。
这就需要欧洲核医学协会各委员会与其他学会的对应机构牵头开展相关工作。
其次,我们需要确定人工智能解决方案的评估和 "校准" 方法,并制定相关行业标准。这包括明确算法开发、评估和验证各阶段所使用的方法学细节(深度学习算法架构)、统计学方法、样本量,以及包含真实标注在内的终点指标等。
目前的相关文献在上述大部分方面均存在显著异质性,更重要的是,需清晰界定不同应用场景下衡量模型性能的核心指标等基础概念。对于每一种人工智能解决方案,都需提前明确其不同阶段的验证流程。同质化、透明度和可推广性是人工智能在临床中可靠应用的关键。
在放射组学领域开展类似"影像生物标志物标准化倡议"的工作,将是推动核医学人工智能发展的重要一步;欧洲核医学协会的 "欧洲核医学影像质量和结果标准化倡议(EARL)"因具备丰富的标准化工作经验,未来也有望成为该领域的重要推动力量。
深度学习算法的一大难点,不仅在于需要优化的参数繁多,还在于网络类型多样,且其实现细节(如层数、相关连接方式、优化器、损失函数等)各有不同,每个参数均能调整。因此,在受控条件下对比不同算法实现方案的性能至关重要。
由于参数存在多种潜在组合,仅通过重新实现文献中提出的算法,几乎无法复现其研究结果。因此,需采用软件挑战赛等替代方法——主办方提供统一数据集,开发者在受控环境中评估其算法性能。
多年来,业界已举办多场软件挑战赛,主要聚焦影像分割领域,也涵盖其他研究方向,且越来越多的挑战赛将临床终点作为评估指标。
软件挑战赛应基于潜在应用场景的预设分类体系开展,分类依据包括临床影响、潜在应用价值和临床落地可能性等。挑战赛需围绕以下一个或多个要点展开:
明确数据需求及相关要求(数据量、标注、质量控制),界定训练集和验证集;
明确特定任务所需的数据集规模,同时需制定多中心数据集的标准化和 / 或同质化方案;
明确算法相关要素,如参数数量、参数优化方法、鲁棒性、不确定性水平,以及算法在不同设备或人体部位数据集上的可迁移性;
解决模型的可解释性问题(采用白盒 / 灰盒理念,而非黑盒模式),提升医疗专业人员(医学物理学家、医生)和公众(患者及家属)对算法的接受度;
将成熟的领域知识(如生理药代动力学模型)融入人工智能算法或训练流程,减少数据量需求,提升算法鲁棒性;
考虑算法临床落地后的相关培训问题。
欧洲核医学协会作为欧洲级平台,其各委员会拥有丰富的专业知识,非常适合监督这类挑战赛的开展;同时,这也为协会通过推动欧洲范围内的合作,参与全球开放科学建设提供了独特机遇。
我们需要全面提升核医学领域从业人员在人工智能相关各领域的知识和能力水平,这意味着需修订核医学医学物理学家和医生的培训课程,以适应人工智能的发展趋势,尤其需将计算科学进一步融入教育和培训体系。
尽管培训工作由欧洲各国根据本国要求自主负责,但欧洲核医学协会等学会可助力提升行业对这场持续变革的认知,并推动欧洲范围内的培训标准化。例如,欧洲医学专科协会联合会(UEMS)核医学分会发布的《欧洲培训要求》下次更新时,应纳入人工智能相关内容,明确培训课程中人工智能相关知识的最低要求,同时制定培训师和培训基地的质量标准。
欧洲核医学协会将在继续医学教育领域发挥主导作用,确保其旗舰年度大会和欧洲核医学与分子影像教育学院(ESMIT)开设的教育项目,能为人工智能在核医学领域的合理、科学应用传递相关知识。
这些教育项目可覆盖人工智能的多个相关方面,包括科学、临床和伦理层面,且需符合《欧洲人工智能法案》对高风险系统的要求——即若未向用户说明人工智能的能力、局限性及使用方法,相关人工智能系统不得获批应用。
如今,是时候将人工智能纳入核医学的合作学科体系了。修订核医学医生的培训体系,不仅意味着加强医学物理学家、工程师与各临床应用领域专家之间现有的合作,还需与专注于医学影像计算和分析的其他科学学会建立更紧密的合作。
欧洲核医学协会还可在助力产业界确定核医学领域人工智能的研发方向和相关临床应用方面发挥关键作用;同时,协会也可参与欧盟在推动可信人工智能落地方面的各项协调举措,包括《人工智能条例》《数据法》《数字治理法》和《欧洲健康数据空间》等。
最后但同样重要的是,欧洲核医学协会需为人工智能在核医学领域的应用及相关临床实践制定伦理标准。柯里等人近期提出了核医学人工智能评估和开发过程中应遵循的一系列伦理标准(见表 1),欧洲核医学协会完全认可这些原则。
这些原则适用于未来将人工智能纳入临床实践的所有医学专业,我们认为,它们为人工智能融入核医学领域构建了坚实且必要的框架。
表 1核医学人工智能评估与开发的伦理标准(改编自柯里等人的研究)
这些原则中,许多看似不证自明,但在全球不同地区的落实程度存在差异,且部分原则说易行难。例如,在诊断决策中采用 "人在环中" 的流程、明确人工智能解决方案落地过程中各利益相关方的共同责任,这些问题在常规临床实践中仍存在诸多争议。
"人在环中" 的理念固然合理,但如果人工智能系统被证实更值得信赖,该如何处理?计算机辅助诊断(与机器学习分属不同技术)的过往应用经验显示,曾出现放射科医生普遍忽视计算机正确提示的问题,这一现象令人担忧。
目前,这些问题仍停留在理论层面,但在核医学临床实践中引入人工智能技术时,必须将其纳入考量范围。
人工智能已迈入核医学领域并将长期扎根,在可预见的未来,核医学或将借助人工智能实现蓬勃发展。但人工智能的应用并非无本之木,要充分发挥其潜力,需满足多项前提条件。
2026-02-28
2026-02-28
2026-02-24
2026-02-10
2026-02-05
2026-02-05
2026-02-04
2026-02-04
