仅对英特尔可见 — GUID: hnj1476724450050
Ixiasoft
产品终止通知
1. Intel® FPGA SDK for OpenCL™ Pro Edition最佳实践指南介绍
2. 查看您Kernel的report.html文件
3. OpenCL内核设计概念
4. OpenCL内核设计最佳实践
5. 分析(Profiling)您的内核来识别性能瓶颈
6. 提高单个Work-Item内核性能的策略
7. 提高NDRange内核数据处理效率的策略
8. 提高存储器访问效率的策略
9. 优化FPGA面积使用的策略
10. 优化英特尔 Stratix 10 OpenCL设计的策略
11. 提高主机应用程序性能的策略
12. Intel® FPGA SDK for OpenCL™ Pro版最佳实践指南存档
A. Intel® FPGA SDK for OpenCL™ Pro版最佳实践指南修订历史
仅对英特尔可见 — GUID: hnj1476724450050
Ixiasoft
3.2. 全局存储互连
最大化读和写访问的存储器带宽的能力对于高性能计算至关重要。 OpenCL™系统中允许存在从全局存储器读取和对全局存储器写入的各种类型的模块。这些模块被称为load-store units (LSUs)。
不同于GPU,FPGA可以构建任意定制LSU,以便最适合于编译器针对您的应用程序推断出的存储器访问模式。因此,在为您的应用程序选择理想的LSU类型时,编写OpenCL代码的能力可能有助于显著提高您的设计性能。
查看您设计的HTML区域报告时,系统级Global interconnect条目中的值表示全局存储器互连的大小。
图 36. 显示OpenCL设计中全局存储互连的大小的HTML Area Report

在HTML报告中,System Viewer的系统视图将全局存储互连描述为加载(LD),储存(ST)和连接(灰色线)。
图 37. OpenCL设计中全局存储互连的System Viewer(系统视图)结果

Intel® FPGA SDK for OpenCL Offline Compiler基于您设计的存储访问模式为您的OpenCL系统选择合适的LSU类型。LSU类型示例包括连续访问(contiguous access或者consecutive access)和突发交错(burst-interleaved)访问。Contiguous Memory Access(连续存储访问)和Global Memory Partitions(全局存储分区)分别说明了连续和突发交错存储访问之间的访问模式差异。