第五代英特尔® 至强® 处理器内置英特尔® 加速引擎,助力实现性能提升

第五代英特尔® 至强® 处理器内置英特尔® 加速引擎,助力实现性能提升

什么是内置加速器?为何要使用这些加速器?

如果每次需要创建新功能时都可以利用已经内置于 CPU 的技术,而无需构建专门的工作负载解决方案,那将会是怎样一番情景?有英特尔® 至强® 可扩展处理器,您就可以做到这一点。

这些值得信赖且承担着运行您所有工作负载之责的 CPU 凭借可为多种要求严苛的工作负载带来更高的性能和每瓦性能的内置英特尔® 加速引擎,将全力满足数据中心不断增长的需求。

在本指南中,我们将探讨这些专用的内置加速器如何为 AI、安全、科学计算、网络、数据分析和存储等工作负载提供有力支持。

英特尔® 加速引擎在实际应用中的优势

无论是将英特尔® 至强® 可扩展处理器用于处理本地工作负载,还是处理云端或边缘工作负载,英特尔® 加速引擎都能够助力您的业务达到新高度。这些内置加速器可提供多种优势,包括提高应用性能、降低成本和提升能效:

 

  • 提高性能:英特尔® 加速引擎旨在帮助提高目标工作负载的性能。
  • 降低成本:英特尔® 加速引擎可让您无需另行购买专用硬件,即可实现性能优化。
  • 提升能效:英特尔® 加速引擎可以通过卸载 CPU 内核的常见任务帮助优化能效,即在提升应用整体性能的同时降低能耗,助力您达成可持续发展目标。

哪些英特尔® 加速引擎能够满足您的业务需求?

第五代英特尔® 至强® 可扩展处理器内置众多加速器,旨在提高性能,助力保护当今快速增长的工作负载中的数据。为了帮助您确定哪些英特尔® 加速引擎更适合您的业务,我们来看看英特尔覆盖 AI、安全、科学计算、网络、数据分析和存储这六大类别的拳头产品。

英特尔® AI 引擎

 

  • 英特尔® 高级矩阵扩展(Intel® Advanced Matrix Extensions,英特尔® AMX)
  • 英特尔® 高级矢量扩展 512(Intel® Advanced Vector Extensions 512,英特尔® AVX-512)

 

英特尔® 安全引擎

 

  • 英特尔® 软件防护扩展(Intel® Software Guard Extensions,英特尔® SGX)
  • 英特尔® Trust Domain Extension(英特尔® TDX)
  • 英特尔® 密码操作硬件加速 (Intel® Crypto Acceleration)

 

英特尔® 科学计算引擎

 

  • 英特尔® 高级矢量扩展 512(英特尔® AVX-512)
  • 英特尔® 高级矩阵扩展(英特尔® AMX)
  • 英特尔® 数据流加速器(Intel® Data Streaming Accelerator,英特尔® DSA)

 

英特尔® 网络引擎

 

  • 英特尔® 数据保护与压缩加速技术(Intel® QuickAssist Technology,英特尔® QAT)
  • 英特尔® 动态负载均衡器(Intel® Dynamic Load Balancer,英特尔® DLB)

 

英特尔® 数据分析引擎

 

  • 英特尔® 存内分析加速器(Intel® In-Memory Analytics Accelerator,英特尔® IAA)
  • 英特尔® 数据流加速器(英特尔® DSA)
  • 英特尔® 数据保护与压缩加速技术(英特尔® QAT)

 

英特尔® 存储引擎

 

  • 英特尔® 数据流加速器(英特尔® DSA)
  • 英特尔® 数据保护与压缩加速技术(英特尔® QAT)
  • 英特尔® 卷管理设备(Intel® Volume Management Device,英特尔® VMD)

英特尔® AI 引擎

英特尔® 高级矩阵扩展(英特尔® AMX

英特尔® AMX 是英特尔基于第五代英特尔® 至强® 可扩展处理器实现深度学习训练和推理的解决方案。这一技术特性扩展了上一代英特尔® 至强® 可扩展处理器的内置 AI 加速功能,非常适合自然语言处理、推荐系统、图像识别、GenAI 和 LLM 等 AI 管线中的工作负载。

 

  • 高达15 倍 SSD-ResNet34 实时对象检测推理性能提升
  • 高达15 倍每瓦性能提升(内置 AMX INT8 的第五代英特尔® 至强® 处理器与第三代英特尔® 至强® 处理器的比较1

 

英特尔® 高级矢量扩展 512(英特尔® AVX-512

英特尔® AVX-512 是英特尔® 至强® 可扩展处理器沿用至今的技术特性之一,作为能够增强性能的通用加速技术,其用途非常广泛。在 AI 方面,英特尔® AVX-512 可以加速经典机器学习训练和推理工作负载。内置英特尔® AVX-512 的第五代英特尔® 至强® 可扩展处理器还可加速数据预处理,并可提供性能、可持续发展以及总体拥有成本 (TCO) 方面的优势。

英特尔® 安全引擎

英特尔® 软件防护扩展(英特尔® SGX

英特尔® SGX 提供应用隔离,旨在加大对使用中的数据的保护力度。这一英特尔® 至强® 可扩展处理器沿用至今的技术特性为跨边缘和多云基础设施的机密计算解决方案奠定了基础。

英特尔® SGX 是目前市场上经过深入研究、多次更新和广泛部署的数据中心级机密计算技术。对于那些需要使用极少代码来访问机密数据的客户来说,英特尔® SGX 提供的数据中心机密计算技术可实现数据中心极小的信任边界。

 

英特尔® Trust Domain Extension(英特尔® TDX

英特尔® TDX 提供虚拟机 (VM) 层面的隔离和保密性。在基于英特尔® TDX 的机密虚拟机中,客户机操作系统和虚拟机应用被隔离开来,无法被云端主机、虚拟机管理程序和平台的其他虚拟机访问。英特尔® TDX 为现有应用采用机密计算和向可信执行环境 (TEE) 迁移提供了一条更简便的路径。

第五代英特尔® 至强® 可扩展处理器配备英特尔® TDX,可在很小的(约 3%)的性能开销下,为关键工作负载提供更强的虚拟机级安全性2

 

英特尔® 密码操作硬件加速

英特尔® 密码操作硬件加速采用单指令多数据流 (SIMD) 技术,能够在每个时钟周期内处理更多加密操作。这有助于为需要进行可靠数据加密的应用提高总吞吐量,并尽可能降低对性能和用户体验的影响。

英特尔® 科学计算引擎

英特尔® 高级矢量扩展 512(英特尔® AVX-512

英特尔® AVX-512 有超宽 512 位矢量运算能力,特别适合处理科学计算应用中常见的严苛计算任务,已在教育、金融、工程和医疗等行业中得以广泛应用。英特尔® AVX-512 支持用户在现有硬件上运行复杂的工作负载,可为金融分析、3D 建模和科学仿真等任务加速。

 

英特尔® 高级矩阵扩展(英特尔® AMX

英特尔® AMX 还能提升主流科学计算工作负载的性能。这一内置加速器将大型矩阵数学计算转换为单个运算,并使用二维寄存器文件来存储大的数据块。

 

英特尔® 数据流加速器(英特尔® DSA

英特尔® DSA 这一技术特性旨在优化并加速网络、数据处理密集型应用和高性能存储中常见的流数据传输和转换操作。英特尔® DSA 能够卸载数据中心级部署中会产生 CPU 开销的常见数据传输任务,藉此加速科学计算工作负载。

高达 1.31 倍 LAMMPS 性能提升(第五代英特尔® 至强® 可扩展处理器与上一代产品的比较3

英特尔® 网络引擎

英特尔® 数据保护与压缩加速技术(英特尔® QAT

英特尔® QAT 可提升性能,从而满足当今网络工作负载的需求,使系统能够服务更多客户端。它可以大大提高密码操作(包括对称和非对称加解密)工作负载的速度,帮助用户提高现有硬件上数据压缩工作负载的速度,并提升电源管理效率。

与在没有加速功能的 CPU 内核上运行软件相比,使用 RSA4K 的英特尔® QAT 可以提高开源的 NGINX Web 服务器上的客户端密度。

 

英特尔® 动态负载均衡器(英特尔® DLB

英特尔® DLB 这项技术特性可在多个 CPU 内核之间高效分配网络处理任务。它还可以复位同时在 CPU 内核上处理的多个网络数据包的顺序。

与在未使用加速技术的内核上运行软件进行队列管理相比,启用内置的英特尔® DLB 后,客户可以获得更高的数据包转发性能。此外,与使用上一代产品相比,应用可以实现更高的数据包处理性能。

高达 1.73 倍 NGINX TLS 握手操作性能提升(第五代英特尔® 至强® 处理器与第三代英特尔® 至强® 处理器的比较4

英特尔® 数据分析引擎

英特尔® 存内分析加速器(英特尔® IAA

英特尔® IAA 旨在提升数据库和数据分析性能,同时提高能效。它可以提高内存数据库和高级分析工作负载的查询吞吐量并降低其占用的内存空间,进而加速数据传输;可以减少对 CPU 内核的依赖,从而提高 CPU 内核利用率。

英特尔® IAA 适用于内存数据库、开源数据库和数据存储(如 RocksDB、Redis、Cassandra、ClickHouse 和 MySQL)。与在没有加速功能的 CPU 内核上使用软件进行压缩相比,借助英特尔® IAA,客户在运行开源的 RocksDB 数据库引擎时可以获得更高的数据解压缩吞吐量。与使用 Zstd 的英特尔® 至强® 铂金 8380 处理器相比,启用内置英特尔® IAA 的英特尔® 至强® 铂金 8592+ 处理器可将 RocksDB 性能提升高达 3.7 倍5。与使用 Zstd 的第三代英特尔® 至强® 处理器相比,启用内置的英特尔® IAA 还可使 ClickHouse 性能提升高达 2.49 倍6

 

英特尔® 数据流加速器(英特尔® DSA

英特尔® DSA 旨在优化并加速数据处理密集型应用中常见的流数据传输和转换操作,助力用户取得更好业绩。英特尔® DSA 通过卸载数据传输、数据复制和错误检查等任务,使 CPU 能够专注于业务关键型数据库功能或其他数据分析工作负载。这降低了查询时延、提高了吞吐量,使数据处理速度得到提升。

与第三代英特尔® 至强® 处理器相比,启用内置英特尔® DSA 的英特尔® 至强® 铂金 8592+ 处理器可将大数据包顺序读任务的 IOPS 提升高达 2.85 倍,时延降低高达 65%7

 

英特尔® 数据保护与压缩加速技术(英特尔® QAT

英特尔® QAT 是一项成熟技术(原应用于片上网络系统),现集成于英特尔® 至强® 可扩展处理器芯片组中,作为独立加速器设备和 PCIe 适配器卡提供。英特尔® QAT 可帮助多个数据库加速备份。启用英特尔® QAT 运行 Microsoft SQL 可显著加速备份并提升效率。与使用默认压缩的英特尔® 至强® 铂金 8380 处理器相比,启用内置英特尔® QAT 的英特尔® 至强® 铂金 8592+ 处理器可将 MS SQL+Backup 性能提升高达 2.56 倍8

英特尔® QAT 带来的优势不止于性能增益。例如,企业可以减少内核数,从而提高处理器利用率。英特尔® QAT 还能帮助企业提高效率和可扩展性,特别是在云环境、数据中心、大型数据湖和各存储层等大规模操作方面。

英特尔® 存储引擎

英特尔® 数据流加速器(英特尔® DSA

英特尔® 数据流加速器是英特尔的新一代直接内存访问 (DMA) 引擎。它可以加速易失性内存和持久内存之间的数据传输,支持虚拟化内存和 I/O。

英特尔® DSA 介于 DRAM、高速缓存和处理器内核之间,它在 CPU 上运行,并跨 I/O 扩展到附加内存和存储,以及网络资源。

与英特尔® 至强® 铂金 8380 处理器相比,启用内置英特尔® DSA 的英特尔® 至强® 铂金 8592+ 处理器可将小数据包随机读任务的 IOPS 提升高达 2.45 倍,时延降低高达 59%7

 

英特尔® 数据保护与压缩加速技术(英特尔® QAT

英特尔® QAT 可加速内联加密操作和数据压缩/解压缩,使存储工作负载和应用的性能得到提升。例如,与在没有加速功能的 CPU 内核上运行相同的压缩算法相比,将英特尔® QAT 作为卸载引擎可以大幅提高压缩吞吐量。

与 OOB 软件相比,启用内置英特尔® QAT 的英特尔® 至强® 铂金 8592+ 处理器可将 NGINX TLS 握手操作的每核性能提升高达 2.17 倍4

 

英特尔® 卷管理设备(英特尔® VMD

英特尔® VMD 这一功能特性支持从 PCIe 总线直接控制和管理 NVMe 固态盘,而无需额外的硬件适配器。它支持以更低的成本更顺畅地向高速 NVMe 存储设备过渡,同时限制关键基础设施的停机时间。此外,英特尔® VMD 具有可启动 RAID、强大的意外热插拔以及 LED 闪烁指示等优势。它提高了可维护性,让您能够放心地部署下一代存储。

英特尔® VMD 还支持英特尔® Virtual RAID on CPU(英特尔® VROC),这一虚拟化 RAID 解决方案无需使用固态盘和 CPU 之间的传统硬件 RAID 主机总线适配器 (HBA) 卡,从而消除其产生的复杂性、成本和功耗。英特尔® VROC 需要额外的软件。

若要详细了解英特尔® 至强® 可扩展处理器内置的英特尔® 加速引擎的作用,请访问英特尔® 产品页面

结论

针对众多工作负载打造的英特尔® 加速引擎将为客户创造更大的商业价值。无论您是希望提高性能,支持可持续发展计划,还是希望能够保护敏感数据,内置英特尔® 加速引擎的英特尔® 至强® 处理器都能提供相应的解决方案,而无需增设硬件配置。

凭借全新英特尔® 至强® 可扩展处理器,英特尔重新定义了客户对 CPU 的期待,众多内置加速器,让性能更进一步。此外,您可通过英特尔® On Demand 对加速器进行升级。英特尔® On Demand 是由英特尔 API 支持的业务产品,可提供更为灵活的消费和配置。

进一步了解英特尔® 至强® 可扩展处理器

进一步了解英特尔® 开发人员专区,基于英特尔® 硬件和软件实施开发的官方资源中心。

进一步了解第五代英特尔® 至强® 处理器和英特尔® 加速引擎为关键工作负载提供的支持