面向 FPGA 推理的量化神经网络
通过在相同占用空间下提供更大的吞吐量或减少资源使用,神经网络的低精度量化可支持 AI 应用规范。块浮点 (BFP) 在这种情况下特别有用,因为它具有高动态范围,在较低精度下仍可保持准确性。如果准确性有任何下降,可以使用我们的开源软件进行重新训练来弥补。
通过在相同占用空间下提供更大的吞吐量或减少资源使用,神经网络的低精度量化可支持 AI 应用规范。块浮点 (BFP) 在这种情况下特别有用,因为它具有高动态范围,在较低精度下仍可保持准确性。如果准确性有任何下降,可以使用我们的开源软件进行重新训练来弥补。