基于单路服务器提升 CDN 容量和能效

导语

 

专为单路系统打造的 (Rich 1 Socket, R1S) 英特尔® 至强® 6 处理器可提供更强大的 I/O 能力,支持多达 136 条 PCIe 5.0 通道,从而更好地支持内容分发网络 (CDN) 部署,使其能够使用单路服务器访问更大的存储容量。借助可提升内存访问和传输层安全 (TLS) 加密能效的优化软件,基于单路英特尔® 至强® 6 处理器的解决方案能够降低功耗、解决方案复杂性和总体拥有成本 (TCO)。

正文

随着消费者对流媒体视频和游戏等在线媒体和娱乐的需求不断攀升,CDN 运营商面临着越来越大的压力,使得他们不仅要提高内容分发能力,还要提高财务效率。为了提供优质体验以吸引并留住客户,可靠且高质量的高带宽内容分发能力是必不可少的。这就对低时延提出了更高的要求,促使 CDN 需不断缩短其与所服务客户之间的距离。

未来几年内,CDN 市场的复合年增长率 (CAGR) 预计将超过 11%1。因此,运营商需要满足这些不断变化的需求,同时确保基础设施成本和运营支出维持在更加合理的水平。英特尔® 平台创新,为支持运营商应对这一增长趋势带来了重要的战略优势。

CDN 细分市场前景1

面向 CDN 的单路 CPU 架构

单路英特尔® 至强® 6 处理器提供了基于英特尔® 架构的全新高密度单路服务器,可以满足对存储和网络密度有较高要求的用例。而若采用前几代产品,则需要使用双路系统才能满足这些需求。与上一代单路英特尔® 至强® CPU 相比,R1S 英特尔® 至强® 6 处理器显著增加了 PCIe 通道数,从而实现了与存储设备、网络设备或 GPU 之间更高的原生连接性。为了优化单路性能和 I/O 密度,这一专为单路系统而设计的架构 (Rich 1 Architecture) 额外提供了 48 个 PCIe 通道,以取代英特尔® 超级通道互联(Intel® Ultra Path Interconnect,英特尔® UPI)接口。后者通常需要使用双路配置来处理处理器之间的通信。这一变革使得该款处理器支持多达 136 条 PCIe 5.0 通道,提升了与存储设备、网络设备、GPU 或其他 PCIe 设备的连接能力。

使用单路服务器可通过减少构建 CDN 服务器设备群所需的材料来降低成本,并通过减少需供电的组件来降低能耗。单路系统还可以省去双路平台所需的额外计算和内存带宽,避免处理器间通信可能导致的时延开销,从而降低软件复杂性。英特尔® 至强® 6 处理器带来了多项平台升级,有助于打造可同时兼顾计算、内存和 I/O 需求的均衡平台,从而更好地处理 CDN 工作负载:

 

  • 高吞吐量执行资源基于全新的英特尔 3 技术,实现了更高的单核性能,单路 SKU 提供多达 80 个性能核,并优化了指令和内置加速器。(常规 SKU 可提供更多的内核数。)

 

  • 更强大的内存子系统:DDR5 内存速度提升高达 14%,MR DDR5 内存速度提升高达 42%,能够更好地访问靠近处理器内核的用户平面温数据。

 

  • I/O 能力显著增强:这款处理器支持多达 136 条 PCIe 5.0 连接通道,这一特性对于支持单路 CDN 服务器并实现相关成本优势至关重要。

 

随着 CDN 不断向终端客户靠近,这些硬件资源使其能够在数千条并行 HTTPS 请求路径上保持更稳定可靠的运行和更高速率的数据传输。针对加密及其他关键工作负载的硬件加速技术有助于实现更优的用户体验和更理想的解决方案 TCO。

高达 2.45 倍吞吐量提升2

在内容缓存容量受限(即,吞吐量受应用缓存限制)的场景中,R1S 英特尔® 至强® 6 处理器为 CDN 提供了更高的 PCIe 扇出。与前代产品相比,可将每个 800 Gbps 节点的原生 NVMe 存储容量提升高达 2 倍。多达 136 条 PCIe 通道数使得单路 2U 服务器可配备 2 个 Gen5 x16 网卡和 24 个 Gen5 x4 NVMe 硬盘,同时还能为 GPU 或其他设备预留 PCIe 容量。另外,融合边缘节点设计还可在单个共享系统上承载多个工作负载,例如,除了核心 CDN 工作负载外,还可承载用于预测性内容缓存的 AI 推理。


R1S 英特尔® 至强® 6 处理器,让面向 CDN 的单路服务器成为现实
R1S 英特尔® 至强® 6 处理器通过额外增加 PCIe 通道,取代了英特尔® 超级通道互联接口,可支持单路服务器配置,为 CDN 部署提供了更理想的选择。

 

  • 存储和网络密度等同或优于前代双路系统。

 

  • 多达 136 条 PCIe 5.0 通道,(其中北向通道多达 88 条,南向通道多达 48 条),可以支持存储、网络或 GPU。

 

  • 降低服务器和能源方面的成本,每个系统部署一个处理器,而非两个,从而实现更高能效。

 

转向单路系统可以降低软硬件复杂性,可让 CDN 环境的部署、管理和维护更便捷和更具成本效益。更简洁的服务器设计可以提高能源和空间效率,更高的 I/O 密度可在空间和散热受限的情况下更好地支持边缘部署。在按照内核数收取软件许可费的情况下,将工作负载整合至单路服务器可进一步提升成本效益。

面向 CDN 解决方案生态系统的工作负载优化

英特尔长期以来,始终致力于构建 CDN 生态系统,通过提供开源和商用软件支持,助力用户更充分地利用英特尔® 硬件平台的特性和功能。本节介绍的优化技术,可助力企业和机构在达成持续性能提升目标的同时,提高能效、降低运营成本。

加速 AI 推理,更好地引导 CDN 运营

在 CDN 运营软件中,AI 的重要作用日益凸显,可为各种任务提供支持,例如学习网络行为以防止流量拥塞,以及在合适的时间和合适的服务器上更高效地加载内容。对于现代网络安全工作负载而言,AI 推理也具有重要作用,可以支持异常检测等功能。英特尔® 至强® 6 性能核处理器利用英特尔® 深度学习加速技术(Intel® Deep Learning Boost,英特尔® DL Boost)为 AI 工作负载提供硬件加速,从而在 CPU 上实现更高的推理性能。PyTorch 和 TensorFlow 等主流 AI 框架也内置了英特尔® DL Boost 加速技术。

英特尔® DL Boost 包含了一些英特尔® 高级矢量扩展 512(Intel® Advanced Vector Extensions 512,英特尔® AVX-512)指令以及英特尔® 高级矩阵扩展(Intel® Advanced Matrix Extensions,英特尔® AMX)。这些技术可将矩阵乘法这一 AI 的核心任务矢量化,提高每时钟周期的数据处理量,从而提高吞吐量、实现更高性能。英特尔® 至强® 6 性能核处理器新增对 FP16 数据类型的支持,可以提升用 GPU 训练的模型的推理速度。在英特尔® CPU 上部署 AI 可在无需添加硬件的前提下,为推理提供更加经济高效的资源。同时,R1S 英特尔® 至强® 6 处理器还提供更充足的 PCIe 连接通道,更利于用户按需添加 GPU 或其他加速器。

 

优化内存和缓存数据处理

CDN 服务器上高效的数据传输对于充分发挥硬件性能和价值至关重要。内存访问通常会造成带宽争用,并增加通过网络向终端客户分发内容的时延。TLS 批量加密会导致从内存读取数据并将其写回的时延增加;而当数据是从存储设备而非内存中读取时,还会进一步增加时延。英特尔与 CDN 解决方案提供商密切合作,利用缓存调优等技术对他们的软件进行优化,以避免不必要的内存访问,进而助力用户更充分地利用英特尔® 至强® 6 处理器内置的多项内存子系统优化。

 

经优化的复制转发操作

CDN 服务器的 CPU 通过复制转发操作,不断响应来自网络接口的内容请求。其常见流程如下:处理器从存储设备中获取内容,然后写入内存,并对其加密,再复制回内存,最后传至输出网络接口。通过优化复制转发操作来提高内存和 CPU 利用率,可以增加 CDN 节点的容量和降低能耗,从而帮助优化解决方案的 TCO。这些措施还能提高 CPU 的吞吐量,避免卸载至外部硬件,从而降低解决方案的复杂性和成本。

 

降低加密操作的性能开销

大规模内容加密的能力是通过 HTTPS 分发高带宽内容的基本要求,而以出色性能执行 TLS 操作则是提供更优用户观看体验的必要条件。英特尔与生态系统合作伙伴通力合作,以降低与普遍加密相关的性能开销。英特尔® 至强® 6 处理器采用了英特尔® 密码操作硬件加速 (Intel® Crypto Acceleration)。该技术利用英特尔® AVX-512 和英特尔® 高级加密标准新指令(Intel® AES New Instructions,英特尔® AES-NI)等技术来加速批量加密和公钥加密。经过更新的加密库还提供经联邦信息处理标准 (FIPS) 认证的 OpenSSL 引擎。这些加密优化有助于提高 CDN服务器的吞吐量和容量,从而显著提升价值。

我们通过与英特尔密切合作,在多代英特尔® 至强® 平台上优化了内容交付性能和能效。R1S 英特尔® 至强® 6 平台通过增加 PCIe 通道数,进一步提升了性能和能效,与前代单路处理器相比,提高了 NVMe 硬盘扇出。这能够提高单路服务器的存储和网络密度,使运营商能够降低系统和运营成本,实现比双路配置更优的能效。

——Espen Braasad,Varnish 首席架构师

CDN 软件和英特尔® Industry Solution Builders 计划

英特尔® Industry Solution Builders 计划是面向通信服务提供商 (CoSP) 和企业的出色解决方案生态系统,提供了先进的并且已在 R1S 英特尔® 至强® 6 处理器上经过优化、测试和验证的 CDN 软件。除了提高 CDN 工作负载的性能和能效外,该计划还可助力边缘计算和内容交付提供商加快投产并降低风险。

结论

R1S 英特尔® 至强® 6 处理器支持单路 CDN 服务器部署,支持多达 136 条 PCIe 5.0 通道,可在单路服务器中实现更高的存储和网络密度。与类似配置的双路系统相比,这一优化有助于精简 CPU 和内存的材料清单,并降低能耗,从而降低系统和运营成本。与前代产品相比,这款处理器在 I/O 资源、每核性能、每瓦性能以及内存子系统方面均有显著提升,且各方面性能都更加均衡出色。英特尔通过这款硬件为 CDN 解决方案提供了更强支持,可帮助运营商推出新功能、提高性能和能效,助力长期保持竞争优势。

 

查看最新性能数据,请访问
www.intel.cn/PerformanceIndex
 

了解更多信息
www.intel.cn/xeon
networkbuilders.intel.com