本研究报告由英特尔赞助、Prowess Consulting 编撰,分析表明英特尔® 至强® 6 处理器家族可为广泛工作负载需求提供灵活、可扩展的基础设施解决方案。
执行摘要
为了在当今日新月异的市场环境中保持竞争力,企业的数据中心需要具备敏捷、灵活且可扩展的基础设施,以支持性能和能效要求各不相同的广泛工作负载和应用。在这项由英特尔赞助的研究中,Prowess Consulting 对英特尔® 至强® 6 处理器家族进行了研究。其模块化 x86 架构使 IT 人员能够配置和部署专用基础设施,以满足特定业务的性能和能效要求。研究报告还进一步展示了如何利用英特尔® 至强® 6 处理器家族,推进数据中心基础设施现代化升级,并解决与当今计算环境相关的诸多挑战。
这一处理器家族支持两种内核微架构:英特尔® 至强® 6 性能核处理器和英特尔® 至强® 6 能效核处理器。这两种内核使用通用软件堆栈、高速输入/输出 (I/O) 和内存接口,可实现无缝集成,具有出色的灵活性,可满足广泛用例需求。英特尔® 至强® 6 性能核处理器经过精心优化,可更好地支持高性能部署,而英特尔® 至强® 6 能效核处理器则专为高能效和横向扩展部署而设计。性能核可提供高级矩阵、多个计算引擎和更大的缓存容量,有利于支持 AI、科学计算、关系型数据库和数据分析等要求严苛的工作负载。能效核则可提供出色的能效和每瓦性能,有利于微服务、应用开发运维和云原生应用等横向扩展工作负载。本文探讨了这两类处理器的用例,旨在帮助企业和机构确定更适合其需求的解决方案。
亮点
与前代英特尔® 至强® 可扩展处理器相比,英特尔® 至强® 6 处理器可提供更高的能效和性能:
与第二代英特尔® 至强® 可扩展处理器相比,英特尔® 至强® 6 能效核处理器可提供
高达
3倍
机架密度提升1
高达
3倍
机架密度提升1
英特尔® 至强® 6 能效核处理器可提供
高达
2.7倍
每瓦性能提升1
高达
2.7倍
每瓦性能提升1
与第五代英特尔® 至强® 可扩展处理器相比,英特尔® 至强® 6 性能核处理器可提供
高达
2倍
GenAI 工作负载性能提升2
高达
2倍
GenAI 工作负载性能提升2
当今市场趋势
如今,数据中心必须具备可扩展性和灵活性,随时准备应对瞬息万变的市场环境以及各类常见的市场需求,具体涵盖以下方面:
- 拥抱 AI 技术:随着 AI 逐渐成为主要工作负载或传统工作负载中新的组成部分,其重要性日益突出。为此,IT 人员需要相应的解决方案,以帮助他们在构建针对 AI 优化的基础设施时,无论是否使用图形处理器 (GPU) 都能实现目标。
- 满足各种数据中心工作负载的性能服务级别协议 (SLA):除了处理 AI 等新兴工作负载外,数据中心还须持续高效支持传统工作负载。Web 托管、数据库管理、虚拟化和云基础设施以及电子邮件服务仍是关键工作负载。IT 基础设施需确保 AI 和传统工作负载可以相辅相成。
- 降低总体拥有成本 (TCO),推动可持续发展:随着 AI 采用率的激增,尤其是基础模型和数千亿参数大语言模型 (LLM) 的广泛应用,数据中心的功耗也急剧上升。企业和机构必须设法提高通用计算密度,降低功耗,同时通过整合老旧的服务器基础设施来释放空间并降低功耗预算,从而获得 AI 应用所需的性能。
- 保护重要数据:网络安全问题不能靠事后补救,必须将其作为战略和运营优先事项。为采取积极主动的安全措施,可以购买配备先进安全功能的基础设施解决方案。
在整合基础设施的同时,确保数据中心灵活性
英特尔® 至强® 6 处理器家族引入了创新的模块化 x86 架构,使企业和机构能够配置和部署专为其特定需求和工作负载而构建的基础设施。该处理器家族支持通用软件堆栈,使工程师能够在开放生态系统中进行开发。这种解决方案具备出色的模块化特性,在性能、能效、可持续性和可扩展性方面提供了更灵活的选择。
该处理器家族的两种微架构可以在不牺牲安全性或软件互操作性的情况下,从性能、能效和成本方面调整和优化基础设施投资。英特尔® 至强® 6 性能核处理器针对计算密集型部署进行了优化,非常适合 AI、科学计算和关系型数据库等各种要求严苛的用例。英特尔® 至强® 6 能效核处理器专为高能效和横向扩展部署而设计,是处理高流量、低强度任务(如云原生微服务、横向扩展分析和网络工作负载)的理想选择。所有英特尔® 至强® 6 处理器均配备相同的内置 I/O 加速器,可通过卸载前几代处理器支持的通用网络和安全功能,提高目标工作负载的整体计算效率。这有助于提高性能和每瓦性能,降低总体成本。
由于性能核和能效核共享相同的底层硬件平台,IT 部门可以混合使用两种类型的系统,进而提升硬件优化水平。数据中心需要管理各种工作负载、兼顾性能和能效、确保符合最大功率限制并遵守数据隐私和主权法规,而模块化架构可为数据中心节省大量成本。得益于性能核和能效核架构的平台通用性和 x86 指令集架构 (ISA),两种处理器可支持相同的软件和硬件,而无需重写代码。底层平台提供相同的高性能 I/O 和内存插槽,这意味着数据中心可以对两种内核微架构的处理器使用相同的网络、内存和存储设备,而无需更新驱动程序。这种灵活性有助于简化开发运维周期。
英特尔® 至强® 6 处理器家族可使数据中心将多台老旧服务器替换为数量更少、功能更强大、能效更高的服务器,从而大幅整合基础设施,减少设备占用空间并降低运营成本。这种整合对各类数据中心都非常有益,特别是对基础设施即服务 (IaaS) 提供商而言,他们可以通过优化资源分配和系统接口通用性来提供更出色的虚拟化服务,从而提高客户满意度。此外,在统一架构上支持不同工作负载,可助力在客户需求发生变化时简化工作负载的迁移和扩展。
更简单易用的产品组合
英特尔® 至强® 6 处理器产品组合的 x86 架构还有一项重要优势,即除了传统的云和企业级应用外,还支持广泛的框架、开源应用、库和容器技术。英特尔与开源开发人员和独立软件供应商 (ISV) 紧密合作,以确保英特尔的硬件与他们的软件协同工作时能够展现出色性能。英特尔® 至强® 平台是当今云和企业基础设施中的主流架构,这表明其性能和兼容性得到了 IT 专业人士的广泛认可和信任。
英特尔® 至强® 6 性能核处理器和英特尔® 至强® 6 能效核处理器可提供数据中心专业人士所需的可靠性、可用性和可维护性 (RAS)。英特尔® 至强® 6 处理器提供先进的 RAS 功能,包括实时诊断功能和基于策略的自动响应,可预先管理系统健康状况并防止意外停机。
此外,英特尔® 至强® 6 处理器家族还能让 IT 部门继续利用其花费数十年时间实施的软件优化。得益于英特尔® 至强® 6 处理器的出色性能和易用性,IT 人员可以专注于 CPU 问题之外的其他挑战。例如,IT 人员可以采用 AI 等快速发展的新兴工作负载,以实现更快、更好的业务成果。
如何构建更好的数据中心
在本节中,将使用英特尔® 至强® 6 处理器家族配置专用服务器基础设施。前两个小节将探讨性能核和能效核针对两种不同工作负载场景的独特优势。随后的两个小节将重点介绍性能核和能效核如何根据客户的工作负载目标,为其提供灵活性和丰富选择。最后两个场景包括 IaaS 和机密计算。本节将展示英特尔® 至强® 6 处理器家族如何凭借其通用软件堆栈的灵活性,满足不同的运营要求并优化技术投资。
满足 AI 和科学计算的高计算需求
如今,许多企业和机构在其业务应用中采用 AI 驱动的功能。Gartner 预测,到 2026 年,80% 的企业将在生产环境中部署支持生成式 AI (GenAI) 的应用3。GenAI 有望提高内部业务流程的效率,缩短上市时间,并在面向客户的应用中优化用户体验。
一些 AI 工作负载(如检索增强生成 (RAG) 实施方案中的 GenAI)需要出色的计算能力和高内存带宽。英特尔® 至强® 6 处理器兼具这两个特性,相较于目前许多 AI 解决方案所采用的第五代英特尔® 至强® 可扩展处理器,可将 GenAI 工作负载性能提升高达 2 倍2。英特尔® 至强® 6 性能核处理器配备强大的计算引擎和内置的英特尔® 高级矩阵扩展(Intel® Advanced Matrix Extensions,英特尔® AMX),适用于 GenAI 的计算密集型预填充阶段。此外,英特尔® 至强® 6 性能核处理器还采用了 Multiplexed Rank DIMM (MRDIMM),其内存带宽比传统 DDR 高出多达 37%,有助于缓解与 AI 解码阶段相关的内存访问限制。强大的计算引擎与 MRDIMM 相结合,可为使用 RAG 的中小型 GenAI 模型提供充足的动力。
设想一下,一家消费电子公司希望使用 GenAI 和 RAG 来开发新的智能家居设备系列。该公司的团队考虑采用一个约 70 亿参数的 GenAI 模型,针对智能家居设备的功能、规格和目标市场来训练模型,从而生成与预期客户产生共鸣的产品描述和营销内容。通过引入 RAG 基础设施,该团队可以结合其内部知识库,帮助优化 AI 生成的回复,确保技术细节正确无误并符合品牌规范。英特尔® 至强® 6 处理器正是这一解决方案的理想选择,不仅能够满足 70 亿参数 GenAI 模型的响应时间 SLA,还能为 RAG 矢量数据库提供足够的性能。
另一种需要大量算力的工作负载是科学计算。英特尔® 至强® 6 性能核处理器利用英特尔® 高级矢量扩展 512(Intel® Advanced Vector Extensions 512,英特尔® AVX-512)这一内置功能,可以加速科学仿真等基于矢量运算的用例。为了展现英特尔® AVX-512 的应用场景,不妨设想一家专注于开发创新疗法的生物技术公司。GROMACS 是该公司的一种重要工具,它是一款用于进行分子动力学仿真的高效开源软件包。该公司的团队可以借助英特尔® 至强® 6 性能核处理器的系统集群,充分利用 GROMACS 的强大功能,深入了解拟议化合物的结构动力学、结合亲和力以及药物相互作用。与对 AI 性能的预期结果类似,相较于第五代英特尔® 至强® 可扩展处理器,英特尔® 至强® 6 性能核处理器可将科学计算性能提升 2 倍以上4。
提高云原生微服务性能,同时降低基础设施成本
微服务是一种变革性的软件开发方法,其特点是将复杂的应用分解成可独立部署的小型服务。这种架构风格之所以广受欢迎,主要是因为它能够提高现代软件系统的敏捷性、可扩展性和可维护性。在云计算需求、开发运维实践和更快创新周期需求的推动下,微服务高速发展,现已成为许多公司和机构数字化战略的基石。
在流媒体服务等场景中,微服务可用于独立处理内容交付、用户身份验证和推荐引擎等任务。英特尔® 至强® 6 能效核处理器是这些微服务解决方案的理想选择。这些处理器在处理大量服务请求方面表现出色,其设计针对单线程性能进行了优化,从而有效地避开了与超线程相关的复杂管理和资源分配难题。这种精简的设计可以大幅减少开销并提高效率。此外,这些处理器拥有更多内核,擅长处理大量线程同步任务,并能迅速适应服务需求的变化。
通用计算的补充性方案
英特尔® 至强® 6 处理器家族为支持通用工作负载提供了丰富选择。可以设想这样一个场景,在边缘位置的小型数据中心进行物联网 (IoT) 数据处理,由于该地的环境条件限制,使得每瓦性能至关重要。与当今许多数据中心一样,该数据中心目前采用基于第二代英特尔® 至强® 处理器的服务器。升级后,服务器基础设施的配置将支持更高的密度,并将功耗控制在更低的范围内。英特尔® 至强® 6 能效核处理器可提供足够的算力,与第二代英特尔® 至强® 可扩展处理器相比,可将机架密度提升高达 3 倍1。同时,这些处理器经过精心优化,运行时能耗更低,有助于降低功耗和散热成本,可将每瓦性能提升高达 2.7 倍1。
对于一些通用场景,例如需要结合协作软件与计算密集型业务分析软件(如 SAS® 解决方案)等应用时,单核性能非常关键。在这种场景下,英特尔® 至强® 6 性能核处理器是理想选择。这些处理器在各种工作负载中都表现出色,其主流系列产品配备 8 至 86 个内核,在基于双 CPU 的系统中,提供多达 176 条 PCIe Gen 5 通道,可支持网络和存储扩展卡;而在基于单 CPU 的系统中,单路产品则提供多达 136 条 PCIe 通道。
另外,数据中心管理员也可针对需要兼顾性能和能效的场景配置英特尔® 至强® 6 处理器家族。英特尔® 至强® 6 性能核处理器可以运行要求严苛的推理和数据分析工作负载。采用相同的芯片组,可以在英特尔® 至强® 6 能效核处理器上运行低强度、高空闲时间的工作负载,如系统备份、软件更新或非关系型数据库。英特尔® 至强® 6 性能核处理器和英特尔® 至强® 6 能效核处理器均可支持数据库和企业应用等工作负载,具体取决于不同情况下哪种处理器更适合特定工作负载需求。英特尔® 至强® 6 性能核处理器拥有高级矢量引擎和大量流水线阶段,因此更适合偏向于单指令多数据流 (SIMD) 的工作负载。另一方面,英特尔® 至强® 6 能效核处理器采用标量、吞吐量优化设计,因而更适合偏向于单指令单数据流 (SISD) 的工作负载。英特尔® 至强® 6 处理器家族的通用特性使 IT 人员能够在通用软件堆栈上开发和部署应用,并添加网络、存储和其他 I/O 外围设备,包括支持 Type 3 CXL 内存设备的 Compute Express Link (CXL) 2.0 功能,从而可以利用交错内存和 ”Flat” 内存模式等新功能。
促进商家线上销售并简化运营
线上商家日益倚重先进的推荐系统来准确预测和贴合客户的偏好,从而提供更加个性化和更有吸引力的购物体验。这些系统对于面向消费者的企业和机构而言至关重要,因为这些企业和机构需要确保可扩展性并有效管理客户需求波动。除了这些外部压力,内部运营挑战也持续存在。企业和机构内部迫切需要简化开发运维流程、尽可能降低电力和散热成本,并动态扩展系统以适应企业和机构客户群不断变化的需求。
为了同时应对外部和内部挑战,就需要具备强大的、适应性强且可扩展的基础设施,该基础设施需要兼容各种软件,并支持高速 I/O 连接。对于线上商家来说,理想的解决方案是将英特尔® 至强® 6 性能核处理器和英特尔® 至强® 6 能效核处理器相结合。前者专为机器学习 (ML) 推理等计算密集型任务而设计,是推荐系统的核心所在;后者则可用于处理客户互动并需要横向扩展能力的云原生 Web 服务。英特尔® AMX 和 MRDIMM 等先进技术可为这些推荐系统提供出色性能。针对销售中的可扩展性问题,英特尔® 至强® 6 能效核处理器提供的高密度内核有助于在高峰时段加快响应速度。这些处理器还擅长管理高性能的非关系型数据库,可以高效处理典型商家工作负载中计算密集度较低的后端操作。得益于 PCIe 5.0 和 CXL 2.0 总线,所有系统均可实现出色的 I/O 响应速度。英特尔® 至强® 6 处理器提供的英特尔® 数据保护与压缩加速技术(Intel® QuickAssist Technology,英特尔® QAT)和英特尔® 数据流加速器(Intel® Data Streaming Accelerator,英特尔® DSA)等 I/O 加速器可以进一步提升 I/O 响应速度。
这种基础设施采用模块化设计,结合通用软件堆栈,可以大大减轻 IT 人员的工作量。例如,可以大幅减少为新部署进行编码等重复性的开发运维任务。无论硬件配置如何,选择英特尔® 至强® 6 性能核处理器或英特尔® 至强® 6 能效核处理器,都可以实现更高的效率。这种方法不仅能够简化运营,还有助于确保资源能够适应未来的市场需求和技术进步。
扩展资源并整合硬件以支持 IaaS
IaaS 作为一种重要的服务,对于提供该服务的云服务提供商 (CSP) 和企业来说都非常关键。企业可以利用 IaaS 来灵活地按需扩展计算资源,同时尽可能减少物理硬件投资。英特尔® 至强® 6 处理器家族非常适合为 IaaS 平台提供支持,可为各种虚拟化环境提供所需的性能和能效。
通过 IaaS,企业和机构可以快速部署虚拟机 (VM)、存储和网络服务,并且只需为所消耗的资源付费。这种模式与英特尔® 至强® 6 处理器家族的功能高度契合,因为它提供了可扩展的解决方案,可以通过混合使用英特尔® 至强® 6 性能核处理器和英特尔® 至强® 6 能效核处理器,高效处理不同的工作负载。
为了具体阐述英特尔® 至强® 6 处理器家族在 IaaS 环境中的实际应用,可以设想一个场景:一家 IaaS 提供商为计算需求各不相同的客户提供服务。对于运行计算密集型 AI 模型或进行实时数据处理的客户,该提供商可以将虚拟机分配给基于英特尔® 至强® 6 性能核处理器的服务器,以确保高吞吐量和快速响应。与之相反,对于工作负载计算强度较低的客户,如静态 Web 托管或轻量级数据库服务,该提供商可以使用基于英特尔® 至强® 6 能效核处理器的服务器,在性能和功耗之间实现更优的平衡。这种战略部署不仅能够提升该提供商的定制化服务水平,还可降低运营成本,从而减少 TCO,提供更具竞争力的服务。得益于英特尔® 至强® 6 处理器家族性能和能效的提升,以及其模块化架构和通用软件堆栈的支持,用户不仅可以有效整合硬件,实现更精简的管理体验,还能通过内置的路径来轻松扩展资源,以应对不断变化的需求。
利用 GenAI 保护数据隐私
最后这个应用场景中,话题再次回到 AI。我们来设想一家咨询公司,它希望使用 GenAI 向员工快速提供高度准确的搜索结果。要实现这一点,该公司的 AI 基础模型的训练需要使用包含高度机密信息的海量数据集。因此,IT 人员面临的挑战是如何利用 AI 为员工提供更好的搜索结果,同时还要保护数据隐私。
无论是否配备基于 GPU 的加速器,英特尔® 至强® 6 处理器都是应对这一挑战的理想解决方案。它还可以用作机头 CPU,提供出色的系统级算力和内存带宽。英特尔® 至强® 6 处理器配备英特尔® AMX、英特尔® AVX-512 和 MRDIMM,可提供强大的的性能增强功能,能够很好地胜任这一任务。此外,英特尔® 至强® 6 处理器还让企业和机构能够构建机密计算环境,借助英特尔® 软件防护扩展(Intel® Software Guard Extensions,英特尔® SGX)实现应用层面的隔离,或通过英特尔® Trust Domain Extensions(英特尔® TDX)实现虚拟机层面的保密性,从而保护信息安全。这些内置的英特尔® 安全引擎有助于将工作负载隔离在可信执行环境 (TEE) 内,从而使企业能够在不泄露隐私的情况下进行多方共享分析。
了解英特尔® 至强® 6 处理器,探索其灵活性如何优化工作负载
本报告着重阐述了英特尔® 至强® 6 处理器家族在推动数据中心基础设施现代化升级中展现出的巨大潜力和变革力量。该处理器家族采用模块化 x86 架构,拥有出色的灵活性,可让 IT 人员定制解决方案,更精准地满足各种性能和能效要求。性能核和能效核两种微架构结合的方法可支持从 AI、科学计算到云原生应用等广泛的工作负载,并实现更出色的能效。面对当今企业中复杂多变的 IT 基础设施需求,英特尔® 至强® 6 处理器家族可以提供至关重要的解决方案,助力企业和机构拥抱 AI,满足严格的性能 SLA 要求,并推进可持续发展目标的实现。
了解详情
了解英特尔® AI 引擎如何在不添加独立加速器的情况下提升 AI 推理和训练性能。
了解面向科学计算的英特尔® 加速器如何在不进行 CPU 以外的额外硬件投资的情况下,提供企业和机构所需的出色性能和速度。
了解英特尔® 安全引擎如何让企业和机构在不影响安全性的情况下从数据中获取更多价值。
了解英特尔® 存储引擎如何助力降低功耗并提供增强功能,例如大规模即时压缩和加密、快速数据传输以及集成 NVM Express® (NVMe®) 设备控制。