Function dynamic_fix_point_i8
Defined in File quantize.h
Function Documentation
-
void dynamic_fix_point_i8(int8_t *out_ptr, float value, int fl)
使用动态定点(Dynamic Fixed Point)方式将 float 值量化为 int8
将输入浮点数
value乘以 2^fl 进行定点缩放,并剪裁到 int8 表示范围 [-128, 127], 最终结果写入out_ptr- 参数:
out_ptr -- [OUT] 存放量化结果的 int8 指针
value -- [IN] 原始 float32 值
fl -- [IN] 定点位置(fixed point position),即 2^fl 缩放因子