概述
医学影像不仅是临床诊断的重要依据、医学决策的重要指导,同时也有助于帮助患者消除不确定性,提升护理质量。近年来,基于人工智能 (AI)、三维可视化等技术的智慧医学影像系统得到了快速发展,相较于传统医学影像系统,其能够显著提升医学影像的质量,运用智能技术优化预约、候诊、检查、结果发放等流程,从而辅助医生提高医生工作效率、降低患者的等待时间并提升患者体验。
东软推出了基于英特尔® 架构的智慧医学影像信息系统 PACS/RIS,该系统提供了覆盖检查预约、到诊排队、用药管理、检查管理、影像诊断等在内的一体融合全医学影像管理能力,可辅助医生更好地开展工作。在新一代的 PACS/RIS 产品中,东软扩展了 AI 与可视化等高级能力,并利用第五代英特尔® 至强® 可扩展处理器支持三维可视化应用,利用英特尔® 高级矩阵扩展(英特尔® AMX)及英特尔® 发行版 OpenVINO™ 工具套件加速 AI 推理,助力医院构建高性能、高可扩展的影像系统。
背景:医学影像系统的三维可视化、智能化转型
通过医学影像的三维可视化处理,并融合影像分析、影像重建等技术,医务人员可以通过图像增强、分割、量化、放大缩小、旋转观察等方式,从多角度清晰了解到医学影像中各结构之间的空间位置关系,在疾病诊断的可视化、术前评估、手术规划、手术实时指导等方面发挥重要价值。
融入 AI 技术的 PACS/RIS 系统能够为医学影像提供智能诊断、质量控制、结构化报告等能力的支撑,可帮助降低对于智能医学影像检查设备的依赖,不仅能够为医务人员提供智能诊断建议,而且还有助于提供结构化的知识库,用于质控、科研和教学工作等环节中。
基于三维可视化和智能化的新一代 PACS/RIS 系统为智慧医院的构建提供了有力支撑,但同时也在算力、成本等层面带来相应挑战。
- 三维可视化、AI 推理等工作负载会带来巨大的性能开销,未经过专门优化的算力平台很难满足上述负载在吞吐、时延等方面的要求,因此采用更高性能,且面向 AI 优化的新一代算力平台势在必行。
- 在 CPU 与 GPU 的选择方面,GPU 在性能方面通常具备一定的优势,但是会带来额外的成本。因此,在成本敏感的场景,部署面向 AI 推理进行优化的新一代 CPU 有助于降低成本;同时,部分 PACS/RIS 场景的 AI 推理具备批处理特性,对 AI 推理时延性能不敏感,适合采用 CPU 进行推理。
在此背景下,东软智慧医学影像信息系统 PACS/RIS 希望采用基于 CPU 的方案,运行三维可视化、AI 推理等工作负载,并通过指令集、软件等方式进行性能优化,在满足性能需求的同时,提升系统整体的灵活性并降低总体拥有成本 (TCO)。
采用英特尔® 技术加速 PACS/RIS 新型工作负载运行
东软智慧医学影像信息系统 PACS/RIS 推荐采用基于第五代英特尔® 至强® 可扩展处理器的基础设施。除了支持数据管理、数据分析等负载之外,东软还利用第五代英特尔® 至强® 可扩展处理器的指令集、英特尔® AMX,以及 OpenVINO™ 工具套件加速三维可视化、AI 推理等新型负载。
第五代英特尔® 至强® 可扩展处理器拥有更可靠的性能,更出色的能效。它在运行各种工作负载时均可实现显著的每瓦性能增益,在 AI、数据中心、网络和科学计算的性能和总体拥有成本 (TCO) 方面亦有更出色的表现。相较上一代产品,第五代英特尔® 至强® 可扩展处理器可在相同功耗范围内提供更高的算力和更快的内存。此外,它与上一代产品的软件和平台兼容,因此部署新系统时可大大减少测试和验证工作。
- 整体性能提升1 21 %
- 推理性能提升2 42 %
- 内存速度提升3 16 %
- 三级缓存提升4 2.7 倍
- 每瓦性能提升5 10 倍
三维可视化效率提升 2.45 倍6
东软智慧医学影像信息系统 PACS/RIS 的三维可视化模块主要采用了体渲染 (Volume Rendering) 技术,并采用 OpenMP 与 Streaming SIMD Extensions 4 (SSE4) 指令集支持光线合成的实现。SSE4 指令集除扩展 Intel® 64 指令集架构外,还加入有关图形、视频编码及处理、三维成像及游戏应用等指令,令涉及音频、图像和数据压缩算法的应用程序大幅受益。在执行三维可视化任务时,东软发现其产品在部分应用中的性能明显不足。为了化解瓶颈,东软基于 Intel® VTune™ Profiler,确定了瓶颈函数 SafeGradz,该函数主要利用 SSE4 指令集进行三线性插值从而实现光线上点的梯度计算,通过对于该函数的代码进行优化,东软提升了三维可视化应用的性能。
东软测试了在不同英特尔® 至强® 可扩展处理器上,PACS/RIS 系统的三维重建应用的运行效率。测试数据如图 2 所示,在处理器开通 4 并发 8 线程时,英特尔® 至强® 铂金 8592+ 处理器(第五代)的性能相较于英特尔® 至强® 金牌 6430 处理器(第四代)和英特尔® 至强® 银牌 4210R 处理器(第二代)均有明显提升,其中相比第二代的提升幅度高达 2.45 倍6。
AI 推理性能提升高达 8.49 倍7
东软智慧医学影像信息系统 PACS/RIS 融合了广泛的 AI 算法,以提供 AI 辅助诊断支持与合理化建议,从而辅助提升诊断效率。
为了加速英特尔® 至强® 可扩展处理器执行 AI 推理的效率,东软智慧医学影像信息系统 PACS/RIS 采用了处理器内置的英特尔® AMX 加速器以及 OpenVINO™ 工具套件。
英特尔® AMX 针对广泛的硬件和软件优化,它进一步增强了前代技术 — 矢量神经网络指令 (VNNI) 和 BF16,从一维向量发展为二维矩阵,以便最大限度地利用计算资源,提高高速缓存利用率,以及避免潜在的带宽瓶颈。OpenVINO™ 工具套件基于最新一代的人工神经网络,包括卷积神经网络 (CNN)、递归网络和基于注意力的网络,可跨英特尔® 硬件扩展计算机视觉和非视觉工作负载,从而大幅提高性能。
东软在第二代/第四代/第五代英特尔® 至强® 可扩展处理器上测试了两个参数大小不同的模型在同步和异步下的性能表现(测试时 3 种配置 CPU 均锁定 8 核心的内核),其中第四代和第五代处理器均启用了英特尔® AMX。测试数据如图 3 所示,在使用参数量为 342,978 的较小模型时,以 BF16 精度在异步模式下执行推理为例,英特尔® 至强® 铂金 8592+ 处理器(第五代)的性能相较于英特尔® 至强® 银牌 4210R 处理器(第二代),推理性能提升高达 2.55 倍;在使用参数量为 31,185,568 的较大模型时,以 BF16 精度在异步模式下执行推理为例,英特尔® 至强® 铂金 8592+ 处理器(第五代)的性能相较于英特尔® 至强® 银牌 4210R 处理器(第二代),推理性能提升高达 8.49 倍。
收益
基于英特尔® 架构的东软智慧医学影像信息系统 PACS/RIS 能够为用户带来如下价值:
- 通过融合三维可视化、AI 辅助诊断等高级能力,能够助力医生提高工作效率,改善患者体验。
- 系统提供全面的业务、质量、绩效和教科研管理功能,有助于医院切实加强影像质量安全管控,实现多维度绩效考核,支撑影像教科研发展。
- 系统采用了英特尔® 至强® 可扩展处理器,在满足更高性能需求的同时,具备更高的部署与应用灵活性,可以承担更广泛的负载、更有效地控制系统的总体拥有成本 (TCO)。
展望
基于英特尔® 架构的东软智慧医学影像信息系统 PACS/RIS 具备高性能、高安全、高可靠等特征,支持高效地运行三维可视化、AI 辅助诊断等应用。英特尔、东软将持续深化合作,从新一代算力平台构建和 AI 应用性能优化等方面进行深度合作,加速医学影像数据的挖掘和应用,释放医学影像数据的巨大价值。
关于东软
东软集团是行业领先的全球化信息技术、产品和解决方案公司,是产业创新变革的推动者和数字化转型的赋能者。东软成立于 1991 年,是中国第一家上市的软件公司。东软始终洞察时代发展趋势,探索软件技术的创新与应用,赋能全球数万家大中型客户实现信息化、数字化、智能化发展,在智慧城市、医疗健康、智能汽车互联、企业数字化转型、国际软件服务等众多领域处于领先地位。
关于英特尔
英特尔 (NASDAQ: INTC) 作为行业引领者,创造改变世界的技术,推动全球进步并让生活丰富多彩。在摩尔定律的启迪下,我们不断致力于推进半导体设计与制造,帮助我们的客户应对最重大的挑战。通过将智能融入云、网络、边缘和各种计算设备,我们释放数据潜能,助力商业和社会变得更美好。如需了解英特尔创新的更多信息,请访问英特尔中国新闻中心 newsroom.intel.cn 以及官方网站 intel.cn。