European Journal of Cancer:罕见皮肤肿瘤诊断挑战,DL-CNN能否提升皮肤科医生的诊断准确性
时间:2025-09-28 12:13:16 热度:37.1℃ 作者:网络
在皮肤科临床实践中,罕见皮肤肿瘤(RST)的诊断一直是一项具有挑战性的任务,这类肿瘤包括螺旋腺瘤、毛母细胞瘤、默克尔细胞癌、卡波西肉瘤以及皮肤转移瘤等多种类型,其临床表现和病史往往缺乏特异性,使得即使经验丰富的医生也容易误诊或漏诊。皮肤镜检查作为辅助诊断工具,在色素性病变中已显示出较高价值,但对于非色素性或罕见肿瘤,其诊断标准尚不明确,血管模式等特征虽被描述但常与其他良性病变重叠,导致诊断不确定性较高。近年来,深度学习卷积神经网络(DL-CNN)在皮肤癌诊断领域展现出巨大潜力,尤其在区分黑色素瘤与良性痣等常见病变方面已达到甚至超越皮肤科医生的水平,然而,这些系统大多基于常见肿瘤训练,其在RST诊断中的实际效能仍缺乏系统评估。本研究旨在填补这一空白,通过比较市场批准的二元DL-CNN系统与国际皮肤科医生团队在RST图像诊断中的表现,探讨人工智能在复杂临床场景中的辅助价值。
研究方法设计为一项横断面读者研究,共纳入200张经组织学确认的RST皮肤镜图像,这些图像来自200名患者,采集时间跨度为2000年至2022年,来源于海德堡大学等六个学术中心的档案库,图像质量均经过标准化处理以确保一致性。测试集中良性病变占55%(110例),恶性病变占45%(90例),患者中位年龄为61岁,病变分布涵盖头皮、面部、躯干、四肢等多个部位,皮肤类型以Fitzpatrick II型和III型为主。研究使用的DL-CNN系统为市场批准的Moleanalyzer-Pro,其通过softmax模块输出恶性评分,阈值大于0.5判定为恶性。同时,作为对比,还引入了ISIC-2020开源多类分类模型,该模型整合了年龄、性别和病变部位等元数据。参与评估的27名皮肤科医生来自6个国家,其中15名被认定为皮肤镜专家(经验超过5年),10名为非专家,2名未公开经验水平。每位医生在三个层次上对每张图像进行评分和管理决策:第一级仅基于皮肤镜图像,第二级增加临床近照和元数据(如年龄、性别、病变位置),第三级在第二级基础上进一步提供DL-CNN的恶性预测结果。主要结局指标包括DL-CNN与医生在第二级评估中的敏感性、特异性及ROC曲线下面积(AUC),次要结局涉及管理决策的变化以及不同评估级别间的性能差异。统计分析采用Wilcoxon符号秩检验、配对t检验和McNemar检验等方法,使用SPSS软件完成,显著性水平设定为p<0.05。
结果显示,DL-CNN在RST诊断中的整体表现中等偏下,其敏感性为66.7%(95%CI:56.4%-75.6%),特异性为56.4%(47.0%-65.3%),ROC-AUC为0.634(0.557-0.711)。与之相比,皮肤科医生在仅使用皮肤镜图像(第一级)时的平均敏感性、特异性和AUC分别为67.2%(61.9%-72.5%)、64.8%(60.0%-69.6%)和0.730(0.660-0.800),专家与非专家之间的差异未达统计学显著性。
当提供临床信息和近照(第二级)后,医生的诊断性能显著提升,敏感性升至80.3%(77.3%-83.4%),AUC增至0.839(0.783-0.894),特异性保持稳定(65.1%),表明临床背景信息对诊断准确性具有重要影响。在第三级评估中,引入DL-CNN预测后,医生的敏感性微增至81.3%(p=0.032),但特异性下降至64.0%(p=0.036),AUC未发生显著变化(0.835),说明AI辅助并未带来整体诊断效能的实质性改善。
图:DL-CNN(黑色曲线)与皮肤科医生在第一级(虚线绿色曲线)、第二级( dashed绿色曲线)和第三级(红色曲线)在良恶性二元分类中的ROC曲线
进一步分析表明,DL-CNN在某些特定类型病变中表现较好,如对非典型痣和肉瘤的识别敏感性较高,但对卡波西肉瘤、皮肤淋巴瘤和黑色素瘤转移等病变的判断一致性较低,其恶性评分分布广泛且波动大。医生在误判病例中未能因DL-CNN的介入而显著提高正确率,尤其在良性纤维母细胞瘤和恶性淋巴瘤等类型上,AI系统的辅助作用有限。此外,医生在所有级别中均表现出更高的切除决策倾向,导致管理决策的特异性低于诊断分类,反映出临床实践中对不确定病变的保守态度。
总之,当前市场批准的DL-CNN系统在罕见皮肤肿瘤诊断中尚未达到理想水平,其性能远低于在常见病变研究中的报告值,且无法有效提升皮肤科医生的综合诊断准确性。这一差距部分源于训练数据的局限性,即现有模型主要基于常见肿瘤构建,对RST的特征学习不足。尽管DL-CNN在部分亚型(如黑色素瘤和肉瘤)中显示出辅助潜力,但其整体可靠性仍受限于病变形态的多样性和缺乏明确的皮肤镜标准。未来需要通过增加多样化训练样本、应用迁移学习等技术优化模型泛化能力,并开发能够整合临床元数据的更先进AI架构。在当前阶段,罕见皮肤肿瘤的诊断艺术仍高度依赖医生的临床经验和上下文信息,人工智能系统仅能作为辅助工具而非替代方案。研究还强调,在疑难病例中,组织病理学检查仍是确诊的金标准,而AI系统的不确定性量化与透明化对于其安全融入临床流程至关重要。
原始出处:
Vollmer, A. S., Winkler, J. K., Kommoss, K., Blum, A., Tschandl, P., Kränke, T., Hofmann-Wellenhof, E., Hofmann-Wellenhof, R., Stolz, W., Enk, A., & Haenssle, H. A. (2025). The art of diagnosing rare skin tumors: Can DL-CNNs enhance dermatologists’ diagnostic accuracy? European Journal of Cancer, 228, 115751. https://doi.org/10.1016/j.ejca.2025.115751
本文相关学术信息由梅斯医学提供,基于自主研发的人工智能学术机器人完成翻译后邀请临床医师进行再次校对。如有内容上的不准确请留言给我们。