Agilex™ 7 FPGA 和 SoC FPGA M 系列
M 系列设备针对计算和内存密集型应用进行了优化。该系列利用英特尔 7 制程技术,以 I 系列设备功能为基础而构建,提供了丰富的内存层次结构,包括集成数字信号处理 (DSP) 的高带宽内存 (HBM),以及采用强化内存片上网络 (NoC) 的 DDR5 内存高效接口,可最大限度提高内存带宽。
Agilex™ 7 FPGA 和 SoC FPGA M 系列
最高内存带宽1
高达
1TBps
号称业界内存带宽最大的 FPGA1
业界最高
DSP
计算密度,在支持 HBM 的 FPGA 中2
业界首款支持
DDR5
的高端 FPGA
高达
1TBps
号称业界内存带宽最大的 FPGA1
业界最高
DSP
计算密度,在支持 HBM 的 FPGA 中2
业界首款支持
DDR5
的高端 FPGA
优势
专为快速高带宽内存应用而构建
M 系列 FPGA 采用丰富而灵活的内存层次结构,配有两个专用强化内存控制器和强化内存片上网络 (NoC),便于设计人员实现最高 HBM2E 和 DDR5 内存带宽,并在架构附近运行内存计算,从而显著减少内存瓶颈和延迟。
高计算能力
实现 FPGA 多合一功能。高达 37 个 TFLOPS FP16 性能 3,高达116 Gbps 收发率,最高 390 万逻辑元素 (LE) 在 FPGA 中提供极高的密度。
支持与英特尔处理器的高带宽和一致性连接
通过 PCIe 5.0 总线将 M 系列 FPGA 直接连接到英特尔® 至强® 可扩展处理器,或通过新型 Compute Express Link (CXL) 协议在 CPU 与 FPGA 之间转移计算工作负载,实现优异的 I/O 性能。
使用案例和应用程序
通过数据高速公路为下一代应用提供支持
M 系列设备支持业界速度最高的收发器 (116G PAM4)、PCIe 5.0、Compute Express Link、400G 以太网以及最高 DSP 计算密度2,可满足从数据中心到边缘的要求最严苛应用的吞吐量要求。
主要功能
精度可调 DSP
高达 38个 TFLOP 的 FP16 性能 3,高达 116 Gbps 收发率,最高 390 万逻辑元素 (LE) 在 FPGA 中提供极高的密度。
强化内存片上网络
通过使用硬化的内存 NOC,使用内封装 HBM2E(最高 32GB 容量)释放行业最高内存带宽,最高 1Tbps,并使用硬化的 DDR5/LPDDR5 存储器控制器(支持 5,600 Mbps)。
第二代英特尔® Hyperflex™ FPGA 架构
此核心架构提供了多项关键优势,不仅能够实现重要的设计优化,而且可以提高性能、降低总功耗、增强设计功能并提高设计人员的工作效率。
可配置 116 GB/秒收发器
M 系列配有业界速度最快的收发器(58G/116 GB/秒 PAM4 和 32 GB/秒 NRZ),支持部署 800G 以太网和单通道 100 GB/秒。
PCIe 5.0
PCI Express (PCIe) 协议是一种高性能、可扩展且功能丰富的串行协议,数据传输速率高达 2.5 GT/秒至 32.0 GT/秒。
计算快速链接 (CXL)
M 系列可利用 CXL 连接到英特尔® 至强® 可扩展处理器,从而在 CPU 与 FPGA 之间转移计算工作负载时实现优异的 I/O 性能。
产品和性能信息
在 2 个使用 ECC 作为数据的 HBM2e 堆栈以及 8 个 DDR5 DIMM 的加持下,Agilex™ 7 FPGA M 系列的理论最大带宽为 1.099 TBps,相比之下,Xilinx Versal HBM 内存的带宽为 1.056 TBps(截止于 2021 年 10 月 14 日),Achronix Speedster 7t 的内存带宽为 0.5 TBps(截止于 2021 年 10 月 14 日)。
Agilex™ 7 FPGA M 系列 DSP 的计算密度预计为 88.6 INT8 TOP 和 18.45 FP32 TFLOP,相比之下,Xilinx Versal HBM 的计算密度为 74.9 INT8 TOP 和 17.5 FP32 TFLOP(截止于 2021 年 10 月 14 日),Achronix Speedster 7t 的计算密度为 61.4 INT8 TFLOP 并且不支持 FP32(截止于 2021 年 10 月 14 日)。
每个 Agilex™ FPGA DSP 模块可以在每个时钟周期执行两次 FP16 浮点运算 (FLOP)。FP16 配置的总 FLOP 是通过将单个 Agilex™ FPGA 中提供的 DSP 模块最大数量的 2 倍乘以将为该模块指定的最大时钟频率得出的。