仅对英特尔可见 — GUID: bzq1549852093242
Ixiasoft
1. 英特尔® Agilex™ 7可变精度DSP模块概述
2. 英特尔® Agilex™ 7可变精度DSP模块架构
3. 英特尔® Agilex™ 7可变精度DSP模块操作模式
4. 英特尔® Agilex™ 7可变精度DSP块设计考量
5. Native Fixed Point DSP 英特尔® Agilex™ FPGA IP核参考
6. Multiply Adder Intel FPGA IP核参考
7. ALTMULT_COMPLEX Intel FPGA IP核参考
8. LPM_MULT Intel FPGA IP核参考
9. LPM_DIVIDE英特尔FPGA IP核
10. Native Floating Point DSP 英特尔® Agilex™ FPGA IP参考
11. 英特尔® Agilex™ 7可变精度DSP模块用户指南存档
12. 英特尔® Agilex可变精度DSP模块用户指南文档修订历史
仅对英特尔可见 — GUID: bzq1549852093242
Ixiasoft
3.2.2.1. FP16支持的精度格式
FP16半精度浮点算术运算函数支持以下格式:
- Flushed - IEEE-754半精度格式(binary16)用于乘法器输入和 FP16乘法/加法/减法运算。
- Extended - IEEE-754半精度格式(binary16)用于乘法器输入。使用扩展格式进行FP16乘法/加法/减法运算。
- Bfloat16 - 可以配置乘法器输入来接受16位bfloat16格式或19位扩展 bfloat16+格式。使用扩展格式进行FP16乘法/加法/减法运算。
下表显示各个格式之间的差异:
特性 | Flushed | Extended | Bfloat16/Bfloat 16+ |
---|---|---|---|
输入格式(符号.指数.尾数) | 1.5.10 | 1.5.10 | 1.8.7或1.8.10 (Bfloat16+) |
FP16运算格式(符号.指数.尾数) | 1.5.10 | 1.8.10 | 1.8.10 |
输入宽度 | 16位 | 16位 | 16或19位 (Bfloat16+) |
最小可表示指数(exponent) | 5'h01 - 5'h0f = -14 | 8'h01 - 8'h7f = -126 | 8'h01 - 8'h7f = -126 |
FP16非规约 | 不支持非规约。非规约结果被刷新为零。 | 非规约结果可以表示为正常数字 | 不支持非规约。非规约结果被刷新为零。 |
异常标志 | 上溢、下溢、不准确和无效 | 无限、零、不精确和无效 | 上溢、下溢、不准确和无效 |
无效标志行为 | 当存在不明确的操作时被置位 | 当存在不明确定义的操作或qNaN输入时被置位 | 当存在不明确定义的操作时置位 |
四舍五入(Rounding) | 四舍五入到最近的偶数 (RNE) |
RNE:
四舍五入到零(RZ)
|
RZ |