人工智能医学影像解决方案

基于英特尔® 架构实现软硬协同加速,显著提升新冠肺炎、乳腺癌等疾病的检测和筛查效率,并帮助医疗科研平台预防 “维度灾难” 问题。

引言:

  • “利用 AI 技术加快医学影像分析速度,支持医疗机构完成从信息化向智能化的转型,让更多病患从智慧医疗技术的发展中获益,是汇医慧影一直以来的目标和愿景。通过引入第二代英特尔® 至强® 可扩展处理器、OpenVINO™ 工具套件以及面向英特尔® 架构优化的 Python 等领先软硬件产品和技术,组成我们医学影像解决方案的各个平台的处理效率都获得了显著提升。”

  • 柴象飞 CEO & 创始人 汇医慧影

从 2019 年年底开始迅速扩散的新型冠状病毒肺炎 (COVID-19,以下简称 “新冠肺炎”)疫情,对医疗机构的快速诊断能力提出了突如其来且非常严峻的挑战,利用人工智能 (Artificial Intelligence,以下简称 AI) 方法开展医学影像智能分析及辅助诊断,是应对这一挑战的有效方案。一直致力于计算机视觉和深度学习技术应用开发的汇医慧影,就通过其自主研发的 Dr. Turing AI 平台、Radcloud 大数据智能分析云平台以及 Novacloud 智慧影像云等产品,为众多医疗机构提供了一套全周期、高性能的 AI 医学影像解决方案,并将其成功应用于包括新冠肺炎在内的数十种疾病的诊疗。

作为该方案中专攻医学影像辅助诊断的前端先锋,Dr. Turing AI 平台可为医院和患者提供 10 余种常见疾病的医学影像 AI 分析能力,并提供结构化的报告;Novacloud 智慧影像云可通过基于云服务的端到端 AI 互动能力,为医、患和医院的管理者提供更为便捷的服务;Radcloud 大数据智能分析云平台作为医疗机构推进科研的重要助手,则能提供多样化的影像大数据科学分析能力,可大大加快放射组学等新技术在医疗行业的研发与落地进程。

为帮助汇医慧影优化这一全周期 AI 医学影像解决方案的性能,英特尔不仅提供了集成有英特尔® 深度学习加速 (英特尔® DL Boost) 技术的第二代英特尔® 至强® 可扩展处理器,用作方案的核心计算引擎,还提供了 OpenVINO™ 工具套件以及面向英特尔® 架构优化的 Python 等软件优化工具。得益于这些软硬件相互搭配、协作优化带来的整体加速优势,汇医慧影 Dr. Turing AI 平台在新冠肺炎筛查、乳腺癌检测等影像分析场景中的推理速度获得了显著提升。同时,放射组学分析方案在优化后的 Radcloud 大数据智能分析云平台的支持下,在处理效率上也收获了明显的加速效果。

汇医慧影全周期 AI 医学影像解决方案实现的应用优势:

·  在与新冠肺炎筛查相关的肺部 CT 影像分析场景中,第二代英特尔® 至强® 可扩展处理器带来的算力与 OpenVINO™ 工具套件带来的优化相配合,可令 Dr. Turing AI 平台的平均推理耗时缩短至原先的 35%1
·  在乳腺癌影像分析场景中,基于第二代英特尔® 至强® 可扩展处理器,及其集成的英特尔® 深度学习加速技术提供的 INT8 推理加速,在 Dr. Turing AI 平台上构建的检测模型在采用 OpenVINO™ 工具套件进行转换和优化后,其推理速度较原始方案提升高达 8.24 倍,且精确度损失不到 0.17%2
·  通过使用面向英特尔® 架构优化的 Python,并结合第二代英特尔® 至强® 可扩展处理器提供的算力支持,放射组学分析方案在基于 Radcloud 大数据智能分析云平台的医疗科研平台上的推理速度,实现了多达 2.08 倍至 2.12 倍不等的提升3

新冠肺炎的突然爆发和大规模流行,对于中国及全球医疗机构而言,是一个在速度和烈度上都堪称严峻的挑战。

控制新冠疫情的原则,和预防及控制其他传染病基本一致,即遵循 “三早原则” — —早发现、早诊断、早治疗。其中,“早发现” 或者说 “早诊断” 是将被感染者从疑似人群中及时辨识出来,并尽早进行后续隔离治疗的关键步骤。如图一所示,在实践中,中国医疗机构普遍以核酸试剂检测 (图左) 为主要诊断方式,以肺部 CT 影像检查 (图右) 为辅助方式,来对新冠肺炎进行筛查诊断。

新冠肺炎筛查诊断方法图示

核酸检测虽有便捷的优势,但其会受样本病毒含量、病毒是否变异、病毒核酸是否有效提取,以及样本是否合理保存等因素的影响,存在一定概率的检测结果误判,即呈 “假阴性”。肺部 CT 影像检查是通过分析肺部真实影像来判别患者肺部是否出现病变,因此在对早期新冠肺炎症状的检测敏感度上,要优于核酸检测。一项数据表明,在 51 例患者的检测结果中,肺部 CT 影像检测对于新冠肺炎的灵敏度为 98%,远高于核酸检测 (反转录-聚合酶链反应方法) 71% 的灵敏度4

不过,肺部 CT 影像检查这一方法的应用 “门槛”,要远高于核酸检测,它不仅需要医生具有专业的 CT 影像分析能力,也需要对新冠肺炎征象有敏锐的临床判断力。例如,新冠肺炎的典型征象之一——肺部磨玻璃影,同时也是多种肺炎、病原体感染的重要征象。因此,医生在分析传统二维的 CT 影像时,往往需要反复比对判读。遇到更复杂的情况时,可能还需进行多科室会诊。在疫情出现爆发的情况下,这种应对方式显然会造成疫情防控上的延误。

为破解这一难题,让肺部 CT 影像检查在疫情防控中发挥更及时、更重要的作用,作为全球医学影像 AI 应用研发领跑者的汇医慧影,开始出动 Dr. Turing AI 平台作为抗疫先锋,来推动新冠肺炎的快速筛查。

软硬协同优化提升新冠肺炎筛查速度

作为汇医慧影全周期 AI 医学影像解决方案中专攻 AI 医学影像辅助诊断的平台,Dr. Turing AI 平台可为医院和患者提供 “多病种 AI 辅助应用” 及 “结构化报告” 两大主要功能。它不仅可提供 10 余种常见疾病的 AI 辅助诊疗能力,也能实现自动化病灶分割、检测和测量,并输出带有**-RADS 分级等信息的 AI 结构化报告,在帮助医院提升诊疗效率之余,也能助患者获得更精准的诊疗方案。

虽然 Dr. Turing AI 平台已久经考验,但在面对新冠肺炎的筛查任务时,还是需要进行一些有针对性的优化升级。这些优化升级如图二所示,包括:一方面,平台需要通过收集大量新冠肺炎数据,由专业医生进行标注后,再结合平台内置的深度学习算法,实现对肺炎病灶区的精准分割和测量;另一方面,平台也需要结合 Inception V4、Inception ResNet V2 等深度学习算法模型,将原本二维的 CT 切片进行一系列的 “三维” 重构,更加清晰直观地反映出病灶的位置、尺寸、面积变化以危重程度等量化数据,为医生提供更全面的病理图像分析,从而帮助他们更快、更准确地进行综合研判。

基于汇医慧影 Dr. Turing AI 平台的新冠肺炎筛查

上述调整虽然更适用于新冠肺炎的 CT 筛查,但也会让 Dr. Turing AI 平台执行推理等过程的计算量和复杂度急剧增加。为了在这种情况下确保令人满意的推理性能,汇医慧影与英特尔一起,在借助第二代英特尔® 至强® 可扩展处理器实现更强算力支持的同时,还引入了 OpenVINO™ 工具套件,使用其内置的优化工具,将已有的、通过 Pytorch 深度学习框架构建的 Nested U-Net 和 HRNet 网络模型转换为可利用 OpenVINO™ 工具套件加速的模型,并使用该工具套件提供的推理引擎对整个管道 (pipeline) 进行了更新。后续进行的基准测试如图三所示,相比优化前用时长达 140.3 秒,调优后的每数据样本的推理时长仅为 48.47 秒,平均推理耗时缩短至原先的 35%,或者说,其平均推理性能提升高达 2.89 倍1

使用 OpenVINO™ 工具套件对新冠肺炎 CT 检测模型进行优化前后的效果对比

这样的性能提升成果,可令新冠肺炎 CT 影像的筛查速度实现大幅提升。而事实上,这已经不是 Dr. Turing AI 平台首次从英特尔这一软一硬、协同优化的组合中获取如此强劲的 AI 加速支持了。此前汇医慧影在该平台上构建以 ResNet50 卷积网络模型作为基础网络 (Backbone) 的 RetinaNet 目标检测模型,来对乳腺癌影像实施模型训练及推理时,就曾使用过这对构成英特尔® 至强® 平台 AI 加速技术核心的组合。

由于 OpenVINO™ 工具套件内置有多种优化工具和预训练模型,且能对已训练好的模型进行压缩和加速等优化,来提升模型推理速度,因而汇医慧影当时的优化手段,如图四所示,是先使用它优化用于乳腺癌检测的 FP32 模型,优化后的模型在推理速度上达到了原始模型的 3.02 倍;继而,汇医慧影又借助 OpenVINO™ 工具套件, 将上述 FP32 模型转换成 INT8 模型,在确保模型精确度只受轻微影响的情况下,启用第二代英特尔® 至强® 可扩展处理器集成的英特尔® 深度学习加速技术对于 INT8 提供的特定加速支持,将其推理速度进一步提升达初始模型的 8.24 倍,且精度损失还不到 0.17%2

使用 OpenVINO™ 工具对乳腺癌检测模型进化优化前后的效果对比

不论是对新冠肺炎 CT 影像筛查的加速,还是对乳腺癌 AI 检测模型的性能优化,它们的成功都足以证明:第二代英特尔® 至强® 可扩展处理器与 OpenVINO™ 工具套件的引入和搭配,可以在医学影像分析场景中发挥出 “1+1>2” 的功效。它们也表明,在众多医疗机构既有的、基于 CPU 的 IT 基础设施上部署和运行医学影像类的 AI 应用,不仅可行,而且高效。

打造全周期 AI 医学影像解决方案

Dr. Turing AI 平台在新冠肺炎等疾病检测,或者说辅助诊断上的优异表现,是汇医慧影与英特尔等合作伙伴一起,通过协作创新助力医疗机构从信息化向智能化转型的又一抹亮色。

这一转型,也确实至关重要。虽说医疗信息化的全面铺开,让各类医疗设备和医用信息系统,尤其是医学影像设备的应用越来越普及,使之成为了各医疗机构、医学科研部门的重要助手,甚至造就了 “临床上有超过 70% 的诊断有赖于医学影像提供支持” 的重要成果5,但仅有信息化策略推动的硬件设施普及,对提升医疗机构诊疗水平来说还是远远不够的。在大众真实的就医体验中,常会发现在肺结节、乳腺癌、前列腺癌、骨折等一些医疗资源相对紧张的病种诊断上,长时间排队等候、影像分析误判的情况仍是屡见不鲜。

究其原因,是因为医学影像分析不仅需要设备就位,更需要使用这些设备的医生能够熟练掌握临床医学、放射学、医学影像学等方面的专业知识和技能,也需要他们能够充分运用各种影像分析技术,对疾病进行辅助诊断。而有以上综合能力的医生,即便在大医院也是相对缺乏的。

多场景化部署的汇医慧影 AI 医学影像解决方案

而这也正是众多医疗机构在完成初步的信息化建设之后,就希望进一步借助 AI、大数据、云计算等新兴技术手段来完成智能化转型的目的所在。如图五所示,这也是汇医慧影以旗下 Dr. Turing AI 平台、Novacloud 智慧影像云及 Radcloud 大数据智能分析云平台等领先产品为抓手,通过公有云、私有云或 AI 一体机等多场景部署方式,为医疗机构提供全周期、高性能和智能化 AI 医学影像解决方案的初衷。

如果说 Dr. Turing AI 平台提供的是高效、便捷的前端医学影像 AI 分析和辅助诊断能力,那么 Novacloud 智慧影像云担当的角色,就是为医疗机构和患者提供基于云服务的端到端 AI 互动能力。如图六所示,在医生侧,结合 Dr. Turing AI 平台,影像云可提供多终端 AI 阅片、远程会诊、转诊等功能;在患者侧,影像云能够提供基于自然语言处理 (Natural Language Processing,NLP) 技术的智能报告解读、远程专家咨询及多终端影像阅览等功能;而对医疗机构来说,影像云不仅能对 Radcloud 大数据智能分析云平台提供支持,也可让管理者以管理驾驶舱的模式,对诊疗、科研进度获得更直观的了解,并支持其对相关策略和计划进行调整。

打通全周期 AI 医疗影像解决方案的 Novacloud 智慧影像云

优化版 Python 改善医疗科研工作效率

如前文所述,与 Dr. Turing AI 平台、Novacloud 智慧影像云并列为汇医慧影全周期 AI 医学影像解决方案支柱的,还有 Radcloud 大数据智能分析云平台,它的主要任务是承载医疗机构的科研工作。

目前众多医疗机构都在利用 CT、MRI、PET 等医学影像,通过放射组学等新技术开展癌症等恶性疾病的早期发现和防治。作为开发放射组学解决方案的领先企业,汇医慧影就正以 Radcloud 大数据智能分析云平台等产品为基础,为医疗机构提供 “全周期”、“一键式” 的影像大数据科学分析能力,以加速放射组学等新技术在医疗行业的科研和应用进程。

要进一步了解 Radcloud 大数据智能分析云平台在放射组学科研项目中发挥的作用,就要先了解什么是放射组学。简而言之,它就是通过将医学影像转换为可挖掘的高通量影像特征数据,并使用特定方法,筛选出最有价值的影像组学特征,进而再通过 AI 模型训练,建立起具有诊断、预后或预测价值的模型,最终为精准化、个体化诊疗提供有效支持。

放射组学基本分析流程

如图七所示,放射组学的基本流程可分为数据收集、VOI 分割、特征提取、特征选择、模型训练以及模型评价及预测等步骤。为了更好地辨识医学影像中的细节,平台在特征提取步骤中会尽可能地提取更多数据特征,因此平台可能会面对 “维度灾难” 等问题,即指在样本量一定的情况下,随着输入维度的增加,空间数据会变得更为稀疏,这会严重影响模型的预测效果,并大幅增加平台计算量,带来推理效率的下降。

为应对这一问题,汇医慧影与英特尔一起,选择 LASSOCV、PCA 等特征选择算法,来有效预防科研平台可能面临的维度灾难,并帮助平台在压缩数据的同时保持信息损失最小化。为提升这些特征选择算法的效率,科研平台不仅引入了第二代英特尔® 至强® 可扩展处理器作为算力基石,还加持以面向英特尔® 架构优化的 Python,来全面调优其运行效率。

与原生版的 Python 相比,面向英特尔® 架构优化的 Python 内置最新的矢量化指令,支持更多元化的英特尔® 性能库 (如英特尔® MKL),同时也对重要的第三方 AI 知识库 sklearn 库有着良好的支持,使平台特征选择的执行效率获得了显著提升。

算法优化后的效果如图八所示,其左图反映了勾选全部放射组学特征,采用 K-Fold 10 交叉验证的 LASSOCV 算法工作负载,采用面向英特尔® 架构优化的 Python 后,其执行速度是采用原生 Python 时的 2.12 倍;其右图则反映了勾选全部放射组学特征,采用 K-Fold 10 交叉验证的 LASSOCV+PCA 算法工作负载,采用面向英特尔® 架构优化的 Python 后,其执行速度是采用原生 Python 时的 2.08倍6

使用面向英特尔架构优化的 Python 与使用原生 Python 时的性能对比

基于英特尔® 至强® 平台上述软硬件融合输出的 AI 加速能力,汇医慧影 Radcloud 大数据智能分析云平台已被引入 20 余种疾病的研究,并成功申报 20 余项基金课题9  7。更值得一提的是,平台基于放射组学的 AI 方案也被用于新冠肺炎的精准鉴别和诊断,并在实践中获得了用户的良好反馈。

未来展望

随着 AI、大数据等新技术的落地与持续创新,整个医疗行业正在它们的驱动下迎来巨变,尤其是通过引入创新的 AI 医学影像解决方案,很多传统意义上的疑难杂症,乃至绝症正在被一一攻克,以往会带来巨大灾难的传染病,也开始在新技术、新平台的帮助下实现更为高效的防控。

面向未来,英特尔还将与汇医慧影等合作伙伴一起,推动更多领先产品技术、尤其是与 AI 和数据分析相关的产品技术与医疗行业应用需求的深度融合,从而进一步加速医疗机构从信息化到智能化的转型,进而打造出更多样化、也更有价值的智慧医疗解决方案,造福全民健康事业。

汇医慧影是慧影医疗科技(北京)有限公司旗下品牌,该公司是英特尔® AI Builders 计划的成员,该计划是由行业领先独立软件厂商 (ISV)、系统集成商 (SI)、原始设备制造商 (OEM)和企业最终用户组成的生态系统,共同愿景是加速人工智能在英特尔® 平台中的部署。