仅对英特尔可见 — GUID: mwh1391807499506
Ixiasoft
产品终止通知
1. Intel® FPGA SDK for OpenCL™ Pro Edition最佳实践指南介绍
2. 查看您Kernel的report.html文件
3. OpenCL内核设计概念
4. OpenCL内核设计最佳实践
5. 分析(Profiling)您的内核来识别性能瓶颈
6. 提高单个Work-Item内核性能的策略
7. 提高NDRange内核数据处理效率的策略
8. 提高存储器访问效率的策略
9. 优化FPGA面积使用的策略
10. 优化英特尔 Stratix 10 OpenCL设计的策略
11. 提高主机应用程序性能的策略
12. Intel® FPGA SDK for OpenCL™ Pro版最佳实践指南存档
A. Intel® FPGA SDK for OpenCL™ Pro版最佳实践指南修订历史
仅对英特尔可见 — GUID: mwh1391807499506
Ixiasoft
4.9. 避免Work-Item ID依赖的向后分支
Intel® FPGA SDK for OpenCL™ Offline Compiler将条件声明折叠成单个位,以指示特定函数单元成为有效状态。离线编译器完全消除不涉及循环结构的简单控制流程,从而实现了扁平化的控制结构和更高效的硬件使用。离线编译器可以高效地编译包含向前分支(forward branch)(如条件语句)的内核。
避免内核中包含任何与work-item ID相关的向后分支(即,循环中发生的分支,因为它会降低性能。
例如,以下代码片段说明涉及work-item ID,如get_global_id或get_local_id的分支:
for (size_t i = 0; i < get_global_id(0); i++) { // statements }