使用全新第三代英特尔® 至强® 可扩展处理器和英特尔® 以太网 800 系列网络适配器,测试中整机性能最高达到 462 Gbps。
在持续发展的数字世界中,具有颠覆性的新兴技术趋势越来越多地影响着各种用例和体验。这也不断催生用户对于计算、网络和存储灵活性的需求。数据生成量和使用量呈指数级增长、云规模计算和 5G 网络快速扩张、高性能计算 (HPC) 与人工智能 (AI) 趋于融合,无不要求如今的数据中心和网络做到与时俱进。为满足这些需求,网络基础设施必须能够迅速且伸缩自如地发展。
英特尔® 至强® 可扩展处理器提供了运营商所需的敏捷性和可扩展性。第三代英特尔® 至强® 可扩展处理器支持各类网络环境,其广泛的内核、频率、功能和功率选择,会使众多工作负载得到优化,性能级别得到提升。企业、云和通信服务提供商如今可以借助一个功能丰富、高度灵活的平台,加速实施与部署更强大的数字解决方案。
本文阐述了中兴通讯以全新第三代英特尔® 至强® 可扩展处理器及拥有动态设备个性化 (DDP) 功能的英特尔® 以太网 800 系列网络适配器为基础打造的 5G 核心网 UPF 解决方案。测试结果显示在某运营商标准话务测试模型下以 690 字节包长,不带任何额外硬件加速器件的情况下,最高整机性能在英特尔® 至强® 金牌 6330N 处理器上可以达到 287 Gbps,在英特尔® 至强® 铂金 8380 处理器上可以达到 462 Gbps。
此测试由中兴通讯于 2021 年 3 月 30 日完成。具体测试配置参见 “系统测试环境” 部分。
1. 中兴通讯 5G 虚拟化和云原生 UPF 解决方案
1.1. 中兴通讯 5G Common Core 介绍
5G 强大的能力有助于实现网络连续广域覆盖、低功耗及低时延高可靠大连接,满足 eMBB、mMTC、uRLLC 等应用场景下多样化的业务需求。
5G 技术可以助力打造一个全业务、多技术融合的网络,满足未来包括众多数据和连接用例在内的各种业务的快速发展需要。运用信息通信技术 (ICT) 创新将有助于满足以用户为中心的网络需求。中兴通讯 5G Common Core 利用了其中多项创新,并且引入了四个方面的全新架构设计:服务化架构、网络切片、控制/转发分离、无状态设计。
服务化架构
功能组件化、服务/微服务之间相互解耦、每个服务/微服务可独立升级和部署,这些均有利于快速实现业务创新。
网络切片
根据不同网络的需要进行自动化网络切片,满足多样化商业需求。
控制/转发分离
控制面集中部署与转发面分布式部署能够实现集中控制,就近转发,从而避免用户面路由迂回,同时缩短传输路径,并满足用户面出口按需灵活部署的要求。
无状态设计
用户数据独立存储,应用和数据分离。
中兴通讯打造的 5G Common Core,不仅为个人消费者带来了升级的 5G 业务体验,还可以充分满足行业客户的差异化场景需求,为各行各业的数字化转型提供强有力的支持。
对于个人、家庭和一般行业应用场景而言,采用中兴通讯的全融合 5G 核心网 (Common Core) 和融合边缘计算 (Common Edge) 解决方案,可以实现资源重用,因此能够极大减少网络升级和建设的投入。基于该方案,对于一般行业应用场景来说,可以利用切片技术实现按需组网、公网私用。边缘侧则采用多接入边缘计算 (MEC) 一体机,满足网络边缘、用户边缘差异化部署需求。
对于特定的行业应用,特别是高安全保障和网络资源独享等场景,网络切片可能需要额外的安全措施。从加密数据到加密计算,集成英特尔® 软件防护扩展(英特尔® SGX)功能的第三代英特尔® 至强® 可扩展处理器可为用户提供强大保护,防范安全威胁,实施数据保护。
采用 5G 融合核心网络解决方案的网络运营商可根据行业需求随时增减功能和组件。此外,Common Core 解决方案还支持灵活按需定制,其对接复杂度和运维难度更低,适合行业自服务快速建网。
1.2. 中兴通讯 5G UPF 介绍
中兴通讯 5G 融合用户面功能包含 5G 核心网的 UPF 功能及 2/3/4G 网络中 GGSN SAE-GW 的用户面功能。中兴通讯 5G 融合用户面功能基于全虚拟化云原生架构,支持依据切片需求进行跨数据中心部署。
云原生、微服务架构从蓝图设计、资源调度编排和生命周期管理、应用状态监控、控制策略更新等多个环节实现高度自动化,各个环节之间有效衔接实现闭环反馈机制,可以实现业务的一键部署安装、全面自治和高效管理。
相对于虚拟化,容器技术具备快速弹缩、轻量级、高性能等优势,在 IT 界发展迅速并且得到广泛应用。云原生应用和底层虚拟化技术实现解耦,可以在容器技术中进行部署,实现资源利用率的提升和业务的快速交付、敏捷维护。中兴通讯 5G 融合核心网支持基于虚拟机和基于容器两种部署方式。
- 基于虚拟机和容器的优化方案,可满足 5G 核心网部署资源的需求。
- 基于开源虚拟交换机的性能优化方案,架构和接口具开放性。
- 采用多种优化手段提升转发面性能,满足运营商级网络性能需求。
2. 第三代英特尔® 至强® 可扩展处理器
第三代英特尔® 至强® 可扩展处理器基于英特尔 10nm 制程技术,专为现代数据中心而设计,通过推动操作效率来提升性能、降低总体拥有成本 (TCO)、提高用户生产力。
基于第三代英特尔® 至强® 可扩展处理器构建的系统可凭借更强的性能和突破性的功能实现业务的敏捷性。全新英特尔® 至强® 可扩展处理器支持 8-40 个不同频率的强大处理器内核,可在吞吐量提升与能效之间达成平衡。它具有支持 8 通道 DDR4-3200 MT/s DIMM、多达 6 个可提高平台可扩展性的英特尔® 超级通道互联(英特尔® UPI)通道,以及适合 I/O 密集型工作负载的更大路间带宽等特性。在处理广泛部署的网络和 5G 工作负载时,它的性能与上一代平台相比平均提高 62%。此外,第三代英特尔® 至强® 可扩展处理器针对主流数据中心、多云计算、网络和存储应用进行了优化,可以支持广泛的 XaaS 环境。
第三代英特尔® 至强® 可扩展处理器具有充分的灵活性,可在与现有工作负载相同的硬件上运行复杂的人工智能工作负载。其集成的英特尔® 深度学习加速技术除原有的矢量神经网络指令 (VNNI) 外,还首次支持脑浮点 16 位(blfoat16)数字格式,进一步提升了人工智能推理和训练性能。与上一代产品相比,人工智能训练提升高达 1.93 倍,图像分类性能提升高达 1.87 倍。第三代英特尔® 至强® 可扩展处理器有助于在整个数据中心到边缘之间实现充分的人工智能支持。
第三代英特尔® 至强® 可扩展处理器拥有多项增强型硬件安全功能,可以帮助阻止恶意攻击,同时保持工作负载完整性。
英特尔® 软件防护扩展(英特尔® SGX)可以在从边缘到数据中心,再到多租户环境的使用过程中保护数据和应用代码,在不损害隐私的情况下增强协作。英特尔® Platform Firmware Resilience(英特尔® PFR)是基于英特尔® FPGA 的解决方案,可以保护平台固件、检测固件损坏情况并将其恢复到正常状态。此外,集成加密加速可降低普适加密的性能影响。
第三代英特尔® 至强® 可扩展处理器支持的英特尔® Speed Select 技术(英特尔® SST)可以对处理器性能进行更多更精细的控制,从而优化总体拥有成本。其中,英特尔® SST-CP 技术可以在一个处理器内核子集上保持较高的基本频率,在其余处理器内核上保持较低的基本频率。英特尔® SST-TF 可以在一个处理器内核子集上保持较高的睿频频率,在其余处理器内核上保持较低的睿频频率。
3. 英特尔® 以太网 800 系列网络适配器
英特尔® 以太网 800 系列网络适配器是新一代英特尔® 以太网网络适配器,通过创新性地提高应用效率和网络性能,优化高性能服务器工作负载。
英特尔® 以太网 800 系列网络适配器支持 PCIe Gen4.0 和 3.0x16 主机接口,以及高达 100Gb/s 的吞吐量。单端口支持 100/50/25/10/1 GbE/100 M 多种速率,并且可以通过 EPCT 工具直接灵活配置和修改。更多可用端口与速度组合简化了验证和部署,更好地满足用户的工作负载需求。
英特尔® 以太网 800 系列网络适配器有着丰富的动态设备个性化(Dynamic Device Personalization,DDP)功能。适配器的增强型 DDP 配置文件在驱动程序初始化阶段即完成加载,再加上有许多用于特定工作负载的协议,灵活性更高。默认的通用 DDP 配置文件支持常用的协议,既包括 TCP/UDP/IP/VLAN/MAC/ETYPE/SCTP/ICMP,也包括 GRE/GENEVE/VXLAN/ARP/MPLS/NVGRE/LLDP。而专为电信领域设计的 Comms DDP 配置文件除了支持通用 DDP 包含的协议之外,还增加了对 GTP/PPPoE/IPSEC/L2TPv3/PFCP/MPLS 等协议的支持。随着网络新业务的发展以及新协议的出现,产生的变化都可以通过升级 DDP 配置文件轻松更新到英特尔® 以太网 800 系列网络适配器的处理流程中,达到减少时延、提高报文处理效率、降低处理器负载的效果。
英特尔® 以太网 800 系列网络适配器支持通过远程直接内存访问 (RDMA) 提高吞吐量和降低时延。RDMA 通过消除 TCP/IP 堆栈进程、内存拷贝以及应用程序上下文切换等三个主要网络资源开销,为现代高速以太网提供高吞吐量和低时延性能。英特尔® 以太网 800 系列网络适配器支持所有主流存储传输协议,包括 iWARP、RoCE v2 和 NVMe over TCP。客户可以根据自己的需求灵活选择,也可以采用不同的应用组合,轻松进行组网和部署。
英特尔® 以太网 800 系列网络适配器引入了全新的应用设备队列(Application Device Queues,ADQ)功能。ADQ 采用已优化的应用程序线程到设备数据路径来实现针对特定应用程序的数据控制、传输和速率限制。这种专用队列和调整网络流量的能力不仅提高了应用性能,还降低了时延,提升了吞吐量。随着现代数据中心的横向扩展,提供弹性并可预测的应用程序级性能成为关键挑战之一。ADQ 技术通过为关键工作负载建立专用队列,大幅减少了性能抖动,显著提高了应用的可扩展性和可预测性。
英特尔® 以太网 800 系列网络适配器支持 IEEE 1588 PTP v1 和 v2 两个版本,提供纳秒级时间精度,能够准确报告每个数据包的接收时间。这种级别的时间精度有助于确保从 5G RAN 到金融服务、工业自动化和能源监控等领域网络部署的精确同步。
英特尔® 以太网 800 系列网络适配器系列通过保护、检测和恢复三种安全机制以及硬件信任根 (Hardware Root of Trust) 为平台提供弹性保护。通过这种设计,其集成的故障检测功能可保护固件和关键设备设置,并进行自动设备恢复,以确保设备能够回到最初的编程状态。
4. 系统测试环境
4.1. 某运营商话务测试模型
4.2. 测试仪表 (Ixia)
中兴通讯 2021 年 3 月 30 日进行的测试使用了 Ixia 测试仪 IxNetworks-XGS2 模拟 5G 移动用户通过运营商基站接入时的控制面和数据面业务。
4.3. 硬件配置
图 1. 中兴通讯 UPF 测试仪表
服务器采用的是中兴通讯自研的 5300-G4X,其由双路第三代英特尔® 至强® 可扩展处理器提供支持,每路连接 2 到 3 个英特尔® 以太网适配器 E810-CQDA2。
4.4. 软件配置
图 2. 基于英特尔® 至强® 金牌 6330N 处理器的服务器的测试拓扑
图 3. 基于英特尔® 至强® 铂金 8380 处理器的服务器的测试拓扑
4.5. 网络拓扑
测试使用了中兴通讯的 TECS OpenStack 作为云管理平台。所用的 2 台基于英特尔® 处理器的服务器,一台作为控制节点,另外一台作为计算节点。UPF 部署在计算节点上,UPF 网元通过 5960-4M 交换机连接 Ixia 测试仪。基于英特尔® 至强® 金牌 6330N 处理器的服务器和基于英特尔® 至强® 铂金 8380 处理器的服务器的测试拓扑见图 2 和图 3。
4.6. 计算节点 BIOS 配置
计算节点服务器上 BIOS 配置见下表。
菜单 |
BIOS 设置路径 |
BIOS 设置 |
所需设置 |
---|---|---|---|
CPU CONFIGURATION |
ADVANCED -> PROCESSOR CONFIGURATION |
INTEL® HYPER THREADING TECHNOLOGY |
ENABLED |
INTEL® VIRTUALIZATION TECHNOLOGY |
ENABLED |
||
|
|
|
|
POWER CONFIGURATION |
ADVANCED -> POWER & PERFORMANCE |
CPU POWER & PERFORMANCE POLCY |
PERFORMANCE |
ADVANCED -> POWER & PERFORMANCE -> CPU P STATE CONTROL |
ENHANCED INTEL SPEEDSTEP TECH |
ENABLED |
|
INTEL® TURBO BOOST TECHNOLOGY |
ENABLED |
||
ADVANCED -> POWER & PERFORMANCE -> HARDWARE P STATES |
HARDWARE P-STATES |
DISABLED |
|
ADVANCED -> POWER & PERFORMANCE -> CPU C STATE CONTROL |
PACKAGE C-STATE |
C0/C1 STATE |
|
CIE |
DISABLED |
||
PROCESSOR C6 |
DISABLED |
||
|
|
|
|
IO CONFIGURATION |
ADVANCED -> INTEGRATED IO CONFIGURATION |
INTEL VT FOR DIRECTED I/O |
ENABLED |
4.7. UPF 虚拟机配置
基于英特尔® 至强® 金牌 6330N 处理器的服务器每路部署 1 个 OMU 虚拟机、2 个 PFU 虚拟机。OMU 占用 4 个 vCPU,每个 PFU 占用 24 个 vCPU(16 个 vCPU 运行 worker 转发线程)。
图 4. 基于英特尔® 至强® 金牌 6330N 处理器的中兴通讯 UPF 虚拟机部署情况
基于英特尔® 至强® 铂金 8380 处理器的服务器每路部署 1 个 OMU 虚拟机、3 个 PFU 虚拟机。OMU 占用 4 个 vCPU,每个 PFU 占用 24 个 vCPU(16 个 vCPU 运行 worker 转发线程)。
图 5. 基于英特尔® 至强® 铂金 8380 处理器的中兴通讯 UPF 虚拟机部署情况
5. 性能测试结果
5.1. 整机转发性能
刀片服务器(双路处理器)性能测试验证了 UPF 解决方案的基本转发功能和具有业务处理能力的 UPF 解决方案的转发性能,包括计费和深度包检测 (DPI)。
基于双路英特尔® 至强® 金牌 6330N 处理器的 UPF 解决方案的基本转发性能:
- 禁用离线计费和 DPI 时,转发性能达到 287 Gbps (51.3 Mpps),worker 转发线程的 CPU 平均利用率为 84%。
- 启用离线计费和 DPI 时,转发性能达到 177 Gbps (31.6 Mpps),worker 转发线程的 CPU 平均利用率为 85%。
基于双路英特尔® 至强® 铂金 8380 处理器的 UPF 解决方案的基本整机转发性能:
- 禁用离线计费和 DPI 时,转发性能达到 462 Gbps (81.4 Mpps),worker 转发线程的 CPU 平均利用率为 83%。
- 启用离线计费和 DPI 时,转发性能达到 280 Gbps (49.4 Mpps),worker 转发线程的 CPU 平均利用率为 84%。
测试中,与英特尔® 至强® 金牌 6230N 和至强® 铂金 8280 处理器相比,UPF 解决方案的转发性能有了大幅提升。
图 6. 基于英特尔® 至强® 金牌 6330N 处理器的中兴通讯 UPF 性能测试结果
图 7. 基于英特尔® 至强® 铂金 8380 处理器的中兴通讯 UPF 性能测试结果
图 8. 6230N 和 6330N 两者间中兴通讯 UPF 性能的比较
图 9. 8280 和 8380 两者间中兴通讯 UPF 性能的比较
5.2. 平均转发时延
应用动态设备个性化 (DDP) 加速技术后,报文不需要通过软件进行核间分发,因此大大减少了转发时延。测试结果显示,UPF 报文单向平均转发时延从 150 us 下降到了 74 us。
图 10. 中兴通讯 UPF UDP 数据包平均时延
5.3. 系统总体拥有成本 (TCO) 分析
英特尔® SST 和 DDP 技术为 UPF 带来的不仅仅是性能提升和时延降低。图 11 估算了三种性能各异的解决方案的设备成本和 10 年电费支出情况。在处理要求相同的情况下,基于英特尔® 至强® 金牌 6330N 处理器和英特尔® 至强® 铂金 8380HL 处理器(这两种处理器都配备英特尔® SST 和 DDP 技术)的 UPF 解决方案可大大降低总体拥有成本。而基于不配备英特尔® SST 和 DDP 技术的英特尔® 至强® 金牌 6138 处理器的 UPF 解决方案总体拥有成本则有所增加。随着时间的推移,中兴通讯发现基于英特尔® 技术的 UPF 解决方案其总体拥有成本优势越来越明显3。
图 11. 设备成本和 10 年电费支出
电信运营商在 UPF 网元方面另一个总体拥有成本考虑因素是能够满足其性能要求的服务器数量。如果整体系统性能得到改进,则可减少服务器数量(不包括 N+1 冗余服务器和控制面服务器)。这一点见基于英特尔® SST 和 DDP 技术的 UPF 解决方案。
6. 总结
在电信运营商的真实话务测试模型中,中兴通讯基于全新第三代英特尔® 至强® 可扩展处理器和英特尔® 以太网 800 系列的 5G 核心网 UPF 解决方案实现了超过 400 Gbps 的转发能力。其出色的性能完全能够满足电信运营商 5G UPF 布署的需求。该解决方案在提升性能的同时,也极大降低了系统转发时延,可满足众多 5G 业务场景下端到端低时延要求4。此外,解决方案在系统的总体拥有成本方面也极具优势。
此次测试还表明,在不使用任何额外硬件加速器件的情况下,利用全新英特尔® 通用处理器、低功耗英特尔® 以太网 800 系列网络适配器和数据平面开发套件 (DPDK) 等相关技术,能够发挥英特尔® 技术平台的强大性能优势。这些技术共同发挥作用,可提升 VNF 的处理能力,有助于满足电信运营商和设备厂商在网络功能虚拟化场景下的性能诉求。
7. 缩略语
eNB NodeB
FDIR 故障检测、隔离和恢复
GPRS 通用分组无线服务
GTP GPRC 隧道协议
IMIX 互联网混合流量
IP 互联网协议
L2TP 第二层隧道协议
OEM 原始设备制造商
OMU 运营经理 (Unix)
PDN 分组数据网络
PFU 分组转发单元
PPPOE 以太网点对点协议
RSS 接收方调整
SR-IOV 单根 I/O 虚拟化
TCP 传输控制协议
UE 用户设备