CN114416021A - 一种用于存算融合式处理器架构的定点数据动态截位方法 - Google Patents

一种用于存算融合式处理器架构的定点数据动态截位方法 Download PDF

Info

Publication number
CN114416021A
CN114416021A CN202210062334.6A CN202210062334A CN114416021A CN 114416021 A CN114416021 A CN 114416021A CN 202210062334 A CN202210062334 A CN 202210062334A CN 114416021 A CN114416021 A CN 114416021A
Authority
CN
China
Prior art keywords
value
bit
point data
cut
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210062334.6A
Other languages
English (en)
Inventor
肖贞杰
刘玉
胡孔阳
韩琼磊
刘金良
周洁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Core Century Technology Co ltd
Original Assignee
Anhui Core Century Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Core Century Technology Co ltd filed Critical Anhui Core Century Technology Co ltd
Priority to CN202210062334.6A priority Critical patent/CN114416021A/zh
Publication of CN114416021A publication Critical patent/CN114416021A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/38Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
    • G06F7/48Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
    • G06F7/499Denomination or exception handling, e.g. rounding or overflow
    • G06F7/49942Significance control
    • G06F7/49947Rounding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/38Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
    • G06F7/48Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
    • G06F7/4824Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices using signed-digit representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/38Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
    • G06F7/48Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
    • G06F7/50Adding; Subtracting

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Complex Calculations (AREA)

Abstract

本发明公开了一种用于存算融合式处理器架构的定点数据动态截位方法,将输入的定点数据d_in中的截位数据d_cut,根据舍入模式向定点数据d_in高位的有效数据d_valid进行舍入进位处理,再对舍入进位处理后的精确值d_precise的低out_w位进行饱和处理后输出,得到定点数据d_in截位后的输出值d_out;舍入进位处理由定点数据d_in的二进制整数部分加上进位值完成,进位值由二进制小数部分与特殊值相加形成,不同舍入模式对应不同特殊值。本发明兼容IEEE 754中的五种标准舍入模式,解决了现有定点数据截位方法定点舍入模式单一的问题。

Description

一种用于存算融合式处理器架构的定点数据动态截位方法
技术领域
本发明涉及定点数据截位处理技术领域,尤其是一种用于存算融合式处理器架构的定点数据动态截位方法。
背景技术
数字信号处理(DSP)技术的不断发展,具有高速的数据处理能力和强大的指令系统,能够快速、实时地实现各种数字信号处理运算,在各个领域得到应用。定点DSP芯片相较于浮点DSP芯片,还具有价格较低、运算速度较快、占用内存单元较少等特点,应用更为广泛。
定点DSP芯片的处理器架构内部采用二进制补码表示数据,若不经过特殊处理,数据就是定点形式。在数字信号处理过程中,大量乘、加运算会导致数据位宽的增加,从而需要增加硬件逻辑单元数量,需要对数据进行截位。
目前,在定点数据截位电路中,为提高有效数据的精度,还需对截掉的尾数进一步进行舍入处理,而现有定点数据截位电路存在定点舍入模式单一的缺点。此外,现有的定点数据截位采用截取位宽固定的静态截位方式,当截取位宽需要根据需求变化时,便无法满足需求,存在不具有可扩展性、通用性低的缺点。
发明内容
针对现有定点数据截位处理方式存在的上述问题,本发明提供了一种用于存算融合式处理器架构的定点数据动态截位方法。
一种用于存算融合式处理器架构的定点数据动态截位方法,将输入的定点数据d_in中的截位数据d_cut,根据舍入模式向定点数据d_in高位的有效数据d_valid进行舍入进位处理,再对舍入进位处理后的精确值d_precise的低out_w位进行饱和处理后输出,得到定点数据d_in截位后的输出值d_out。
进一步的,舍入进位处理由定点数据d_in的二进制整数部分加上进位值完成,进位值由二进制小数部分与特殊值相加形成,不同舍入模式对应不同特殊值。
进一步的,舍入进位处理具体包括以下步骤:
步骤A1,将定点数据d_in算术右移cut_n位,并在高位补上定点数据d_in的符号位,得到有效数移位值d_arsht,其中cut_n为截取位宽;
步骤A2,将定点数据d_in的低cut_max位逻辑左移cut_max-cut_n位,低位补0,得到的截位值d_llsht,其中cut_max=in_w-out_w为最大截取位宽,in_w为输入位宽,out_w为输出位宽;
步骤A3,对截位值d_llsht进行数据压缩,将其从cut_max位压缩至2位,得到截位压缩值d_cut_zip,压缩算法为d_cut_zip[1]=d_llsht[cut_max-1],d_cut_zip[0]等于d_llsht低cut_max-1位数据进行位或运算的结果值;
步骤A4,将截位压缩值与特殊值相加,得到进位值(0或1);
步骤A5,将有效数移位值d_arsht与进位值相加,得到精确值d_precise。
进一步的,饱和处理方式为:
当精确值d_precise为正数且其值超出out_w位所能表示的正数范围时,则发生上溢,输出值d_out等于out_w位的011…1;
当精确值d_precise为负数且其值超出out_w位所能表示的负数范围时,则发生下溢,输出值d_out等于out_w位的100…0;
当精确值d_precise的值未超出out_w位所能表示的数据范围时,输出值d_out等于d_precise[out_w-1:0]。
本发明的有益效果:1、兼容IEEE 754中的五种标准舍入模式,解决了现有定点数据截位方法定点舍入模式单一的问题;2、实现定点数据截取位宽变化地动态截位需求,极大地提高了定点数据截位电路的通用性,具有良好的可扩展性;3、通过对截位数据进行压缩,以及采用超前进位加法器中的进位算法,降低了路径时延,减少了硬件逻辑单元数量。
附图说明
图1为实施例1所述的定点输入数据结构图;
图2为实施例1所述的定点输入数据算术右移后结果;
图3为实施例1所述的定点输入数据逻辑左移后结果;
图4为实施例1所述的定点数据动态截位方法流程图。
具体实施方式
下面结合附图和具体实施方式对本发明作进一步详细的说明。本发明的实施例是为了示例和描述起见而给出的,而并不是无遗漏的或者将本发明限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显而易见的。选择和描述实施例是为了更好说明本发明的原理和实际应用,并且使本领域的普通技术人员能够理解本发明从而设计适于特定用途的带有各种修改的各种实施例。
实施例1
一种用于存算融合式处理器架构的定点数据动态截位方法,将输入的定点数据d_in中的截位数据d_cut,根据舍入模式向定点数据d_in高位的有效数据d_valid进行舍入进位处理,再将舍入进位处理后的精确值d_precise的低out_w位进行饱和处理后输出,得到定点数据d_in截位后的输出值d_out。
下面结合表1对不同舍入模式对应不同的舍入进位处理进行说明。表1中的输入数据分别通过十进制数和二进制数表示。二进制数总位宽为7位,整数部分4位,小数部分3位,整数和小数之间以下划线分隔,数据带有符号,以补码的形式显示;十进制数为该行二进制数据对应的十进制表示,若二进制整数部分为I(X),小数部分为F(X),则定点数据为X=I(X)+F(X)。例如,7位二进制正数0001_111,整数部分I(X)=0001,对应十进制为+1,小数部分F(X)=111,对应十进制为+0.875(0.5+0.25+0.125),因而X=I(X)+F(X)=1+0.875=+1.875;7位二进制负数1110_111,整数部分I(X)=1110,对应十进制为-2;小数部分F(X)=111,对应十进制为+0.875,因而X=I(X)+F(X)=-2+0.875=-1.125。
Figure BDA0003478702370000031
表1
表1中包含IEEE 754中五种标准舍入模式:
(1)向负无穷舍入,即将十进制数取其不大于该数的最大整数;
(2)向正无穷舍入,即将十进制数取其不小于该数的最小整数;
(3)向零舍入,即当为正数时,十进制数取不大于该数的最大整数;当为负数时,十进制数取不小于该数的最小整数;
(4)就近向远离零舍入,即当十进制数小数不等于0.5时,进行四舍五入操作;当十进制数小数等于0.5时,若为正数,则向整数舍入进1,若为负数,则向整数舍入进-1;
(5)就近向偶数舍入,即当十进制数小数不等于0.5时,进行四舍五入操作;当十进制数小数等于0.5时,则向整数舍入使其等于其最接近的偶数。
通过十进制数的舍入计算可以得到,其对应二进制数据的进位值。通过表1中二进制数的规律可知,若引入一个与舍入模式相关的特殊值,且使其位宽与二进制小数部分位宽相同,再将该特殊值与二进制小数部分F(X)相加,则得到一个向整数部分的进位值(0或1),最后将二进制整数部分I(X)加上该进位值,即可完成舍入进位运算,从而能够兼容IEEE754中的五种标准舍入模式,解决了现有定点数据截位方法定点舍入模式单一的问题。
为实现定点数据截取位宽变化地动态截位需求,本实施例通过对定点数据d_in进行移位处理,以消除截取位宽变化对数据索引的影响。下面结合舍入进位处理流程进行阐述。
1、定点数据d_in的结构图如图1所示,将定点数据d_in算术右移cut_n位,并在高位补上定点数据d_in的符号位,得到有效数移位值d_arsht,如图2所示,其中cut_n为截取位宽,cut_n位的sign_ext是有效数据符号位的扩展,值为d_in[in_w-1]。
通过算数右移使得有效数据d_valid的低位对应d_arsht的低位,消除变量cut_n对数据索引的影响。d_arsht的最高位符号sign=d_arsht[in_w-1]和最低位尾数tail=d_arsht[0],在后续舍入进位中用到。
2、将定点数据d_in的低cut_max位逻辑左移cut_max-cut_n位,低位补0,得到的截位值d_llsht,如图3所示,其中cut_max=in_w-out_w为最大截取位宽,in_w为输入位宽,out_w为输出位宽。
通过逻辑左移使得截位数据d_cut处于d_llsht高位的固定位置,过滤掉除截位数据外的其他部分,消除变量cut_n对数据索引的影响。
步骤2与步骤1可并行执行,使得电路时延更短。
3、由于舍入进位处理的硬件开销随着数据位宽的增大而增大,为了降低硬件开销且不改变最终舍入结果,本实施例采用数据压缩的方式将截位值压缩至2bit,同时将引入的特殊值也对应为2bit位宽,从而极大减少硬件单元数和路径时延,降低了硬件开销,提高电路性能。
压缩的具体操作为:对截位值d_llsht进行数据压缩,将其从cut_max位压缩至2位,得到截位压缩值d_cut_zip,压缩算法为d_cut_zip[1]=d_llsht[cut_max-1],d_cut_zip[0]等于d_llsht低cut_max-1位数据进行位或运算的结果值。
五种标准舍入模式对应的特殊值分别为:
(1)向负无穷舍入,特殊值round=2’b00;
(2)向正无穷舍入,特殊值round=2’b11;
(3)向零舍入,若符号位sign=0(正数),则特殊值round=2’b00;若符号位sign=1(负数),则特殊值round=2’b11;
(4)就近向远离零舍入,若符号位sign=0(正数),则特殊值round=2’b10;若符号位sign=1(负数),则特殊值round=2’b01;
(5)就近向偶数舍入,若尾数位tail=0(偶数),则特殊值round=2’b01;若尾数位tail=1(奇数),则特殊值round=2’b10。
4、将截位压缩值d_cut_zip与特殊值round相加,得到进位值carry(0或1)。为减少逻辑单元数量和时序,本实施例采用超前进位加法器中的进位算法,具体计算过程如下:
生成信号:Gi=d_cut_zip[i]&round[i];
传播信号:Pi=d_cut_zip[i]|round[i];
进位信号:Ci+1=Gi|Pi&Ci,其中C0=0;
进位值carry=C2=G1|P1&G0|P1&P0&C0=G1|P1&G0。
5、将有效数移位值d_arsht与进位值相加,得到精确值d_precise。由于此处精确值d_precise的位宽与d_arsht位宽相同,不用考虑加法后向更高位进位的问题,因为当d_arsht为正数时,其最高位为0,加1bit数据后不会向更高位进位;当d_arsht为负数时,加1bit数据后也在数据所能表示范围内。
对精确值d_precise的低out_w位进行饱和处理后输出定点数据d_in截位后的输出值d_out,具体饱和处理方式为:
当精确值d_precise为正数且其值超出out_w位所能表示的正数范围时,则发生上溢,输出值d_out等于out_w位的011…1;
当精确值d_precise为负数且其值超出out_w位所能表示的负数范围时,则发生下溢,输出值d_out等于out_w位的100…0;
当精确值d_precise的值未超出out_w位所能表示的数据范围时,输出值d_out等于d_precise[out_w-1:0]。
综合本实施例中提及的方法步骤,其定点数据动态截位方法流程图如图4所示。经过图4所示的定点数据动态截位方法,即可完整实现高精度、低时延、少逻辑的定点数据动态截位方案。
显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域及相关领域的普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。

Claims (4)

1.一种用于存算融合式处理器架构的定点数据动态截位方法,其特征在于,将输入的定点数据d_in中的截位数据d_cut,根据舍入模式向定点数据d_in高位的有效数据d_valid进行舍入进位处理,再对舍入进位处理后的精确值d_precise的低out_w位进行饱和处理后输出,得到定点数据d_in截位后的输出值d_out。
2.根据权利要求1所述的用于存算融合式处理器架构的定点数据动态截位方法,其特征在于,舍入进位处理由定点数据d_in的二进制整数部分加上进位值完成,进位值由二进制小数部分与特殊值相加形成,不同舍入模式对应不同特殊值。
3.根据权利要求2所述的用于存算融合式处理器架构的定点数据动态截位方法,其特征在于,舍入进位处理具体包括以下步骤:
步骤1,将定点数据d_in算术右移cut_n位,并在高位补上定点数据d_in的符号位,得到有效数移位值d_arsht,其中cut_n为截取位宽;
步骤2,将定点数据d_in的低cut_max位逻辑左移cut_max-cut_n位,低位补0,得到的截位值d_llsht,其中cut_max=in_w-out_w为最大截取位宽,in_w为输入位宽,out_w为输出位宽;
步骤3,对截位值d_llsht进行数据压缩,将其从cut_max位压缩至2位,得到截位压缩值d_cut_zip,压缩算法为d_cut_zip[1]=d_llsht[cut_max-1],d_cut_zip[0]等于d_llsht低cut_max-1位数据进行位或运算的结果值;
步骤4,将截位压缩值与特殊值相加,得到进位值(0或1);
步骤5,将有效数移位值d_arsht与进位值相加,得到精确值d_precise。
4.根据权利要求1-3任意一项所述的用于存算融合式处理器架构的定点数据动态截位方法,其特征在于,饱和处理方式为:
当精确值d_precise为正数且其值超出out_w位所能表示的正数范围时,则发生上溢,输出值d_out等于out_w位的011…1;
当精确值d_precise为负数且其值超出out_w位所能表示的负数范围时,则发生下溢,输出值d_out等于out_w位的100…0;
当精确值d_precise的值未超出out_w位所能表示的数据范围时,输出值d_out等于d_precise[out_w-1:0]。
CN202210062334.6A 2022-01-19 2022-01-19 一种用于存算融合式处理器架构的定点数据动态截位方法 Pending CN114416021A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210062334.6A CN114416021A (zh) 2022-01-19 2022-01-19 一种用于存算融合式处理器架构的定点数据动态截位方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210062334.6A CN114416021A (zh) 2022-01-19 2022-01-19 一种用于存算融合式处理器架构的定点数据动态截位方法

Publications (1)

Publication Number Publication Date
CN114416021A true CN114416021A (zh) 2022-04-29

Family

ID=81274979

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210062334.6A Pending CN114416021A (zh) 2022-01-19 2022-01-19 一种用于存算融合式处理器架构的定点数据动态截位方法

Country Status (1)

Country Link
CN (1) CN114416021A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116257207A (zh) * 2022-09-08 2023-06-13 重庆位图信息技术有限公司 一种数据截位方法、模块、计算机设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116257207A (zh) * 2022-09-08 2023-06-13 重庆位图信息技术有限公司 一种数据截位方法、模块、计算机设备及存储介质
CN116257207B (zh) * 2022-09-08 2023-10-03 重庆位图信息技术有限公司 一种数据截位方法、模块、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
US9639326B2 (en) Floating-point adder circuitry
US10073676B2 (en) Reduced floating-point precision arithmetic circuitry
CA1041212A (en) Fast fourier transform stage using floating point numbers
US9552189B1 (en) Embedded floating-point operator circuitry
US7188133B2 (en) Floating point number storage method and floating point arithmetic device
JP2884057B2 (ja) 数値フォーマット変換装置
CN115407965B (zh) 一种基于泰勒展开的高性能近似除法器及误差补偿方法
CN114416021A (zh) 一种用于存算融合式处理器架构的定点数据动态截位方法
CN114546330B (zh) 函数实现方法、逼近区间分段方法、芯片、设备及介质
US5337266A (en) Method and apparatus for fast logarithmic addition and subtraction
CN113625989B (zh) 数据运算装置、方法、电子设备及存储介质
US5177703A (en) Division circuit using higher radices
CN113837365A (zh) 实现sigmoid函数逼近的模型、FPGA电路及工作方法
Arnold Improved cotransformation for LNS subtraction
US10230376B2 (en) Apparatus and method for performing division
US9400635B1 (en) Methods and apparatus for performing dynamic data alignment for floating-point operations
US4785412A (en) Double precision approximate quotient network
EP0366155A2 (en) Logarithmic function arithmetic unit including means for separately processing pseudo division and multiplication
JPH07234778A (ja) 演算回路
CN114860193A (zh) 一种用于计算Power函数的硬件运算电路及数据处理方法
Sun et al. A high-performance 8-tap FIR filter using logarithmic number system
CN110069240B (zh) 定点与浮点数据计算方法及装置
US5801974A (en) Calculation method and circuit for obtaining a logarithmic approximation value
US5357457A (en) Adder with carry look ahead circuit
US9575725B1 (en) Specialized processing block with embedded pipelined accumulator circuitry

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination