英特尔® 数据中心 GPU Flex 系列

英特尔® 数据中心 GPU Flex 系列是面向智能视觉云的灵活、强大且开放的 GPU 解决方案。

概述:

  • 基于英特尔® Xe HPG 微架构打造,内置视觉处理和 AI 加速技术;开创性地配置了开源 AV1 编码器,可在相同质量下将带宽提高 30% 和节约 $2,300 万成本,或在相同带宽下提高流媒体质量;支持基于硬件的 SR-IOV 虚拟化,以及开放、灵活、基于标准的软件堆栈和 oneAPI 跨架构编程,赋能开发人员开发高性能、跨架构的媒体应用和解决方案,满足广泛的用例需求。

越来越多的媒体处理和交付、AI 视觉推理、云游戏和桌面虚拟化任务在数据中心进行。 但是这种迅速增长的势头因行业依赖专有的许可编码模型(如面向 GPU 编程的 CUDA) 而大大受到限制。基于 CUDA 的软件也仅限用于专有 GPU,无法移植到其他加速器架构或 CPU 上。由此产生的总体拥有成本 (TCO) 上升压力使专有 GPU 编程无法大规模进行。

英特尔® 数据中心 GPU Flex 系列克服了上述限制,同时还为视觉云工作负载提供了出色的计算密度和能效。该系列产品基于英特尔® Xe HPG(高性能显卡)微架构打造,内置视觉处理和 AI 加速技术。其提供的功能和优势包括:
 

  • 支持开放、灵活、基于标准的软件堆栈以及 oneAPI 统一编程,其中包括用于构建高性能、跨架构媒体应用和解决方案的开源组件与库、工具及框架。这种开放的方法有助于生态系统摆脱使用专有编程模型带来的技术和经济负担。 
  • 开创性地在 GPU 内配置了基于硬件的开源 AV1 编码器,在相同质量下将带宽提高 30%, 从而每年每十万名观众节省 2,300 万美元,或者在相同带宽下提高流媒体质量1

硬件规格

该系列将以两种 SKU 形式提供:英特尔® 数据中心 GPU Flex 系列 170(峰值性能更高)和英特尔® 数据中心 GPU Flex 系列 140(密度更高)。图形处理器拥有多达 32 个英特尔® Xe 内核及光线追踪单元、多达 4 个英特尔® Xe 媒体引擎,具备用于 AI 加速的英特尔® Xe Matrix Extensions(英特尔® XMX),并且支持基于硬件的 SR-IOV 虚拟化。每卡配备两个图形处理单元 (GPU) 的 Flex 系列 140 利用英特尔® oneVPL Deep Link Hyper Encode 功能可满足业内的 “一秒时延” 要求,同时提供 8K60 实时转码能力。此功能适用于 AV1 和 HEVC HDR 格式。

按用例划分的软件堆栈

Flex 系列 GPU 支持开放、灵活、基于标准的软件堆栈和 oneAPI 跨架构编程。堆栈包括开源的组件与库、工具及框架。开发人员可以利用它们开发高性能、跨架构媒体应用和解决方案,满足广泛的用例需求。这种开放的方法消除了专有模型形成的障碍——使用专有模型,代码可移植性和采用跨多供应商的新架构的能力会受到限制。

通用软件功能集可集成到主流中间件和框架中,而堆栈能以经过验证的产品化容器或参考堆栈形式交付。开发人员可以在裸机上利用 Kubernetes 对这些容器进行编排,或者利用 SR-IOV 虚拟化技术及相关工具在虚拟机中进行编排,实现工作负载分配和管理。此工具集旨在加快上市速度,并支持在同一 GPU 上灵活部署多个工作负载。

英特尔通过开展行业合作、参与和资助多项计划以及参加各种标准组织为软件生态系统赋能,并为开源社区提供持续的领导力、投资和技术贡献。

英特尔® 数据中心 GPU Flex 系列软件堆栈

注:oneDNN 指 oneAPI 深度神经网络库。oneDAL 指 oneAPI 数据分析库。oneVPL 指 oneAPI 视频处理库。oneVPL、oneDNN、oneDAL 和英特尔® VTune™ Profiler 包含在英特尔® oneAPI 基础工具套件内(各个工具可单独下载)。面向英特尔® 架构优化的 TensorFlow 和 PyTorch 包含在英特尔® AI 分析工具套件内。