两名 IT 专业人员在手持设备上进行协作,同时俯瞰广阔的数据中心

采用 P-core(性能核)的英特尔® 至强® 6 处理器

采用 P-core(性能核)的英特尔® 至强® 6 处理器可胜任从计算密集型人工智能到通用数据服务等各种工作负载。

深入了解采用 P-core(性能核)的英特尔® 至强® 6:专为 AI 和分析工作负载而构建

采用 P-core(性能核)的英特尔® 至强® 6700 系列处理器现已推出,进一步完善了采用 P-core(性能核)的英特尔® 至强® 6 产品系列。从计算密集型人工智能和高性能计算用例到关键任务关系数据库和分析应用程序,对数据中心性能的需求从未如此之强烈。英特尔® 至强® 6 处理器旨在为 IT 团队提供面向各种工作负载的有针对性的增强功能,它主要借助于两种产品线:P-core(性能核)和 E-core(能效核)

P-core(性能核)采用超线程内核,内置矩阵引擎可加速计算密集型人工智能、高性能计算和数据服务工作负载,而 E-core(能效核)则省去了矩阵引擎,以支持更高的单线程内核密度。

图中展示英特尔® 至强® 处理器用于人工智能、高性能计算工和存储等用例的 P-core(性能核),以及用于分析、网络和云计算的 E-core(能效核);边缘用例介于两种处理器选项之间

采用 P-core(性能核)的英特尔® 至强® 6 处理器具有内置矩阵引擎,可加速计算密集型 AI 和高性能计算工作负载。

所有英特尔® 至强® 6 处理器,无论是 P-core(性能核)还是 E-core(能效核),都采用相同的指令集、BIOS 和内置 I/O 加速器,包括英特尔® 数据保护与压缩加速技术(英特尔® QAT)英特尔® Data Streaming Accelerator(英特尔® DSA)英特尔® In-Memory Analytics Accelerator(英特尔® IAA)英特尔® Dynamic Load Balancer(英特尔® DLB)

它们还支持相同的驱动程序、操作系统和应用程序,以及数据中心所依赖的相同可靠性、可用性和可维护性 (RAS) 功能。

探索具有 P-core(性能核)优势的英特尔® 至强® 6 处理器

企业希望在部署用于语言、视觉和图像识别以及推荐系统的最先进人工智能模型时节省资金和时间,并从高性能计算驱动的模拟和高级分析中获得更深入的见解。采用 P-core(性能核)的英特尔® 至强® 6 处理器通过提供大量具有创新矩阵和向量引擎以及超高内存和 I/O 带宽的高性能内核,使企业能够抓住这些机遇。

为广泛的工作负载实现高性能

采用 P-core(性能核)的英特尔® 至强® 6 处理器,每个插槽可灵活扩展至 128 个内核、12 个内存通道和 96 个 PCIe 通道,帮助企业满足不同的应用需求。对于希望缓解内存带宽瓶颈的 IT 团队来说,创新的多路合并阵列 (MRDIMM) 可提供高达每秒 8,800 兆 (MT/s) 的传输速度,同时通过快速完成工作来降低总体拥有成本。内置加速器为目标工作负载提供额外的提升,实现更高的性能和效率。

采用 P-core(性能核)的英特尔® 至强® 6700/6500 系列专为扩展而设计,支持 4S/8S 配置,并提供 1 路插槽 SKU 套餐。单插槽平台通过增加 PCIe 通道数量,为外设和存储设备提供显著增强的 I/O 性能——每个单插槽提供 136 条 PCIe 通道,而多路插槽平台的每个插槽仅提供 88 条。单插槽 I/O 性能提升有助于减少功耗与延迟损耗,并优化平台成本。如果单插槽平台能够满足客户的 I/O 需求,则可有效降低 TCO——减少 CPU 数量可降低服务器成本,提高性能功耗比,并降低每个 CPU 的许可成本。

利用 CPU 的强大 AI 性能

采用 P-core(性能核)的英特尔® 至强® 6 处理器旨在支持许多要求严苛的 AI 用例。P-core(性能核)通过 英特尔® Advanced Matrix Extensions(英特尔® AMX)等加速功能,扩大了英特尔第四代产品在内置人工智能领域的领先优势,目前支持 int8、BF16 和 FP16(新)数据类型。因此,P-core(性能核)可帮助满足从目标检测到中型 GenAI 等多种人工智能模型的服务级别协议 (SLA),同时提供开放标准、高性能、RAS 功能,并根据需要支持其他加速器。

采用 P-core(性能核)的英特尔® 至强® 6 还可与人工智能加速器搭配使用,成为人工智能加速系统中的最佳主机 CPU 选件。主机 CPU 应提供卓越的 I/O 性能、高单线程性能以及高内存带宽和容量。进一步了解为何采用 P-core(性能核)的英特尔® 至强® 6 是最佳主机 CPU 选件的 5 大原因。

优化通用工作负载的性能

采用 P-core(性能核)的英特尔® 至强® 6 处理器在全范围工作负载上表现出色,其主流系列产品拥有 8-86 个内核,在基于双 CPU 的系统中,网络和存储外接卡拥有多达 176 个 PCIe 5.0 通道,而基于单 CPU 的系统中,单插槽产品则拥有 136 个 PCIe 通道。所有英特尔® 至强® 6 处理器都能随着服务器利用率的增加而提供可扩展的每瓦性能,在整个负载线路上提供近乎线性的功耗-性能消耗,这凸显了所有英特尔® 至强® 6 处理器的高效性。对于性能要求苛刻的工作负载,这意味着平台在高负载下有效地利用能耗,以帮助快速完成工作。

Performance-core(性能核)工作负载性能优势:

与第五代英特尔® 至强® 处理器相比:

  • 各类工作负载平均性能提升 40%。1
  • 借助英特尔® AMX,Llama2 性能至高可提升 3 倍2
  • HammerDB MySQL 性能至高可提升 2 倍3
  • 在典型的 40% 服务器利用率下,性能功耗比可提升高达 1.58 倍。4
  • 高达 1.45 倍的数据库分析性能提升5
  • NGINX 边缘工作负载的性能和性能功耗比均提升 1.5 倍。6
  • 利用 MRDIMM,HPCG 基准测试的性能至高可提升 2.5 倍7

与第二代英特尔® 至强® 处理器相比:

  • 采用 INT8 的 ResNet – 50 BSX 的性能至高可提升 17 倍8
  • 通用计算性能平均提升 3.9 倍1
  • 在性能不变的情况下,相比第二代英特尔至强系列,英特尔至强 6900 系列的服务器整合率高达 17:1。9
  • 在性能不变的情况下,相比第二代英特尔至强处理器,英特尔至强 6700 系列服务器的平均整合率高达 5:1,平均 TCO 提升 40%。10

与竞争对手相比:

  • 与 AMD EPYC 9755 相比,人工智能平均性能提升高达 2 倍11
  • 与 AMD EPYC 9655 相比,HPCG 性能提升高达 1.52 倍。12

利用增强的安全功能跟上业务增长的步伐

在本地、边缘和云服务器上追求新的业务模式和数据共享,即使在处理敏感数据或受监管数据时也是如此。基于可信执行环境 (TEE) 的机密计算能够帮助在使用过程中保护数据和 AI 模型。采用 P-core(性能核)的英特尔® 至强® 6 处理器允许客户选择最符合其业务和监管要求的机密计算技术。

采用 P-core(性能核)的英特尔® 至强® 6 产品均支持英特尔® TDX Connect。英特尔® Trust Domain Extensions(英特尔® TDX)是我们的机密计算技术,可保护虚拟机 (VM) 级别的工作负载。英特尔 TDX Connect 在 2023 年初的开放式机密计算大会 (OC3) 上首次公布,可在机密虚拟机与支持 PCI Express 的设备之间实现无缝加密通信。此功能对于实现保密使用模式至关重要,这种模式可从 CPU 扩展到 GPU、智能网卡或存储驱动器等连接设备。英特尔 TDX Connect 是该架构的一项轻量级扩展,旨在增强机密计算基础设施,同时提升 I/O 虚拟化性能。

英特尔正积极与合作伙伴协作,在整个合作伙伴生态系统中推广部署英特尔 TDX Connect 功能。微软已承诺在 Microsoft Azure 实例中支持英特尔 TDX Connect。

“微软很高兴能将英特尔 TDX Connect 集成到未来几代 Azure 机密虚拟机中,目前我们的硬件和软件开发人员正在进行早期开发。英特尔 TDX Connect 是我们在提升机密计算性能和可扩展性方面的重要里程碑。它支持现有工作负载和全新工作负载,可保持成本效益和性能优势,同时保障机密计算的隐私性。”

-微软 Azure 机密计算产品主管 Vikas Bhatia

此外,英特尔正积极与其他设备和加速器供应商协作,确保他们支持英特尔 TDX Connect 所依赖的 PCIe 协议,从而成功扩展基于英特尔 TDX 的机密计算功能,以满足各种客户的需求。

  • 应用程序隔离: 英特尔® 软件防护扩展(英特尔® SGX) 提供旨在保护使用中数据的应用程序隔离。英特尔® SGX 是目前市场上经过深入研究和多次更新的数据中心级机密计算技术。
  • 虚拟机 (VM) 级隔离: 英特尔® 信任域扩展(英特尔® TDX) 在虚拟机级别提供隔离和机密性。在基于英特尔® TDX 的机密虚拟机中,客户机操作系统和虚拟机应用程序被隔离开来,无法被云端主机、虚拟机管理程序和平台的其他虚拟机访问。

增强针对 P-core(性能核)优化的目标工作负载

为 AI 、高性能计算和关系数据库等用例管理计算密集型工作负载的 IT 决策者,将从部署采用 P-core(性能核)的英特尔® 至强® 6 处理器中获得最大收益。增加对 MRDIMM 内存的支持,还有助于缓解超大内存占用的内存数据库或大型语言模型 (LLM) 等用例的内存访问限制。

加速 AI 工作流程,以保持竞争力

采用 P-core(性能核)的英特尔® 至强® 6 处理器由于配备了增强的内核、更大的内存带宽和强大的矩阵引擎,可提供充足的算力,以支持中小规模生成式人工智能模型的推理、微调和检索增强生成 (RAG) 用例。此外,针对英特尔® 至强® 处理器的优化已集成到 TensorFlow 和 PyTorch 等在内的流行深度学习框架的主流发行版。

管理日益复杂的高性能计算和模拟

除内置矩阵引擎外,采用 P-core(性能核)的英特尔® 至强® 6 处理器还具有英特尔® Advanced Vector Extensions 512(英特尔® AVX-512),可加速科学模拟中常见的基于矢量的数学运算。由该平台提供支持的集群可帮助释放 3D 渲染、科学研究、金融模拟和计算机辅助工程的威力,以加快取得成果。

将基础架构和存储优化提升到新的水平

由于 P-core(性能核)和 E-core(能效核)共享相同的硬件平台,企业可以混合使用具有每种类型内核的系统来管理其基础设施中的各种工作负载,同时不超出功率预算,并遵守数据隐私和主权法规。计算密集型 P-core(性能核)可以支持 SAS 等高强度业务分析软件,而 E-core(能效核)可用于运行系统备份和软件更新等低强度、高空闲时间的工作负载。

提高工作效率,帮助消除边缘的延迟

通过将高性能计算资源置于更靠近终端用户和设备的位置,从而提高边缘生产力和延迟。采用 P-core(性能核)的英特尔® 至强® 6 处理器能够在边缘服务器中部署先进的人工智能模型,并提供所需的算力,以便从数千个物联网设备中快速获得洞察力。具有 136 个 PCIe 通道的单插槽选件还允许每个处理器使用更多的扩展卡,从而有助于在空间有限的部署中整合基础设施。

在保持快速、响应式分析的同时发展关系型数据库

P-core(性能核)处理器中的高级矢量引擎允许有效运行高级数据库和分析用例中常见的基于单指令、多数据 (SIMD) 的工作负载。英特尔® 至强® 6 处理器还能利用高水平的超低延迟缓存,帮助避免与资源争夺有关的延迟。利用该平台和英特尔® QAT 等加速器的多功能配置,可以在分析和存储复杂数据类型时快速得出结果。

详细了解英特尔® 至强® 6 处理器

部署采用 E-core(能效核)和 P-core(性能核)的英特尔® 至强® 6 处理器有很多优点。要更好地了解两者的技术和竞争优势,请下载并阅读 Prowess Consulting 的分析,并联系您的英特尔代表以开始使用。