新模型充当大型病理图像数据库的搜索引擎,具有识别罕见疾病和疗法的潜力。
罕见病往往难以诊断,预测最佳治疗方案对临床医生来说具有挑战性。为了帮助应对这些挑战,哈佛医学院Mahmood实验室和布莱根妇女医院的研究人员开发了一种深度学习算法,该算法可以自学学习特征,然后用于在大型病理图像存储库中查找相似病例。
SISH(组织学自监督图像搜索)是一种新工具,其作用类似于病理图像的搜索引擎。它有许多潜在的应用,包括识别罕见疾病和帮助临床医生确定哪些患者可能对类似疗法有反应。描述自学习算法的论文发表在《自然生物医学工程》上。
“我们表明,我们的系统可以协助诊断罕见疾病并找到具有相似形态模式的病例,而无需手动注释和用于监督训练的大型数据集,”资深作者FaisalMahmood说,他是Brigham和HMS的病理学助理教授。女性的。“该系统有可能改善病理学培训、疾病分型、肿瘤鉴定和罕见形态学鉴定。”
现代电子数据库可以使用整张幻灯片图像(WSI)存储大量数字记录和参考图像,尤其是在病理学方面。然而,每个WSI的十亿像素大小和大型存储库中不断增加的图像数量意味着WSI的搜索和检索可能既缓慢又复杂。因此,可伸缩性仍然是有效使用的相关障碍。
为了解决这个问题,研究团队开发了SISH,它可以自学学习特征表示,无论数据库大小如何,这些特征表示都可以用于以恒定的速度查找病理学中具有类似特征的病例。
在他们的研究中,研究人员测试了SISH检索常见和罕见癌症的可解释疾病亚型信息的速度和能力。该算法成功地从包含22,000多个患者病例、50多种不同疾病类型和十几个解剖部位的数万个WSI的数据库中快速准确地检索图像。在许多情况下,检索速度优于其他方法,包括疾病亚型检索,尤其是当图像数据库规模扩展到数千张图像时。即使存储库规模扩大,SISH仍然能够保持恒定的搜索速度。
然而,该算法有一些局限性,包括大内存需求、大型组织幻灯片中有限的上下文感知以及它仅限于单一成像模式的事实。
总体而言,该算法展示了独立于存储库大小和在不同数据集中检索图像的能力。它还展示了对罕见疾病类型诊断的熟练程度,以及作为搜索引擎识别可能与诊断相关的图像的某些区域的能力。这项工作可能会极大地为未来的疾病诊断、预后和分析方法提供信息。
“随着图像数据库的规模持续增长,我们希望SISH能够有助于更轻松地识别疾病,”Mahmood说。“我们相信这一领域未来的一个重要方向是多模式病例检索,它涉及联合使用病理学、放射学、基因组和电子病历数据来寻找相似的患者病例。”