CN105224283A - 一种浮点数处理方法及装置 - Google Patents

一种浮点数处理方法及装置 Download PDF

Info

Publication number
CN105224283A
CN105224283A CN201510629933.1A CN201510629933A CN105224283A CN 105224283 A CN105224283 A CN 105224283A CN 201510629933 A CN201510629933 A CN 201510629933A CN 105224283 A CN105224283 A CN 105224283A
Authority
CN
China
Prior art keywords
mantissa
floating number
module
result
floating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510629933.1A
Other languages
English (en)
Other versions
CN105224283B (zh
Inventor
潘昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201510629933.1A priority Critical patent/CN105224283B/zh
Publication of CN105224283A publication Critical patent/CN105224283A/zh
Application granted granted Critical
Publication of CN105224283B publication Critical patent/CN105224283B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Complex Calculations (AREA)

Abstract

本发明实施例公开了一种浮点数处理方法及装置,方法包括:获得第一目标浮点数X和第二目标浮点数Y;获得X与Y的运算法则;判断X和Y是否均不为零;如果X和Y均不为零且X和Y的阶码不相等,则对阶X和Y;将对阶后的X和Y的尾数分别进行分段,并将每段数据转换成单精度浮点数;分别计算X和Y的尾数相应段数据的结果;根据计算得到的每段数据的结果,生成最终的尾数;进而生成计算结果;并对计算结果规格化处理。应用本发明实施例,将高精度的浮点数的尾数进行分段,将每段尾数转化为单精度浮点数进行计算,使得不具备双精度浮点数计算能力的中低端GPU产品具备高精度浮点数的计算能力,提高了中低端GPU产品对高精度浮点数的计算能力。

Description

一种浮点数处理方法及装置
技术领域
本发明涉及计算机技术领域,特别涉及一种浮点数处理方法及装置。
背景技术
GPU(GraphicsProcessingUnit,图形处理单元),又称图形处理器、显示核心、视觉处理器、显示芯片,是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上图像运算工作的微处理器。
目前,GPU的浮点数计算性能比CPU的浮点数计算性能高很多,因此,GPU也被主要应用于浮点数计算。
但是,GPU制造商处于成本和市场划分的考虑,在高端GPU产品上会保留双精度浮点数的硬件计算单元,在中低端GPU产品上会缩减双精度浮点数的硬件计算单元,这就导致中低端GPU产品的双精度浮点数计算能力较差,甚至不具备双精度浮点数计算能力。
发明内容
本发明实施例的目的在于提供一种浮点数处理方法及装置,以使中低端GPU产品具备高精度浮点数的计算能力或提高中低端GPU产品对高精度浮点数的计算能力。
为达到上述目的,本发明实施例公开了一种浮点数处理方法,包括:
获得第一目标浮点数X和第二目标浮点数Y,其中,X=2Ex*MX,Y=2Ey*MY
获得X与Y的运算法则,所述运算法则为加法或减法;
判断X和Y是否均不为零;
如果X和Y均不为零,则对阶所述第一目标浮点数X和所述第二目标浮点数Y,以使所述第一目标浮点数X和所述第二目标浮点数Y的阶码相同,其中,若Ex≥Ey,则对阶后Y=2Ex*MY′,若Ex<Ey,则对阶后X=2Ey*MX′;
将对阶后的X和Y的尾数分别进行分段,并将每段数据转换成单精度浮点数;
根据获得的运算法则,分别计算X和Y的尾数相应段数据的结果;
根据计算得到的每段数据的结果,生成最终的尾数;
根据生成的最终的尾数和对阶后的阶码,生成计算结果;
对生成的计算结果规格化处理,得到最终计算结果。
可选的,所述第一目标浮点数和/或所述第二目标浮点数,包括:
双精度浮点数;
或单精度扩展浮点数;
或双精度扩展浮点数;
或满足预设表达式的浮点数。
可选的,所述预设表达式,包括:
(-1)S*M*2E,其中,
(-1)S为符号位;M为有效数字,且1≤M<2;E为阶码。
可选的,尾数分段的位数不大于22。
可选的,若Ex≥Ey,所述将对阶后的X和Y的尾数分别进行分段,并将每段数据转换成单精度浮点数,包括:
X的尾数
MX=Mxn*(M)n+Mxn-1*(M)n-1+…+Mxn-i*(M)n-i+…+Mx0*(M)0
Y的尾数
MY′=My′n*(M)n+My′n-1*(M)n-1+…+My′n-i*(M)n-i+…+My′0*(M)0;其中,
n≥i≥0;M=2m;m≤22;
若Ex<Ey,所述将对阶后的X和Y的尾数分别进行分段,并将每段数据转换成单精度浮点数,包括:
X的尾数
MX′=Mx′n*(M)n+Mx′n-1*(M)n-1+…+Mx′n-j*(M)n-j+…+Mx′0*(M)0
Y的尾数
MY=Myn*(M)n+Myn-1*(M)n-1+…+Myn-j*(M)n-j+…+My0*(M)0;其中,
n≥j≥0;M=2m;m≤22。
为达到上述目的,本发明实施例公开了一种浮点数处理装置,包括:浮点数获得模块、运算法则获得模块、判断模块、对阶模块、分段转换模块、计算模块、尾数生成模块、计算结果生成模块和规格化模块,其中,
所述浮点数获得模块,用于获得第一目标浮点数X和第二目标浮点数Y,其中,X=2Ex*MX,Y=2Ey*MY
所述运算法则获得模块,用于获得X与Y的运算法则,所述运算法则为加法或减法;
所述判断模块,用于判断X和Y是否均不为零;
所述对阶模块,用于在所述判断模块判断X和Y均不为零的情况下,对阶所述第一目标浮点数X和所述第二目标浮点数Y,以使所述第一目标浮点数X和所述第二目标浮点数Y的阶码相同,其中,若Ex≥Ey,则对阶后Y=2Ex*MY′,若Ex<Ey,则对阶后X=2Ey*MX′;
所述分段转换模块,用于将对阶后的X和Y的尾数分别进行分段,并将每段数据转换成单精度浮点数;
所述计算模块,用于根据所述运算法则获得模块获得的运算法则,分别计算X和Y的尾数相应段数据的结果;
所述尾数生成模块,用于根据所述计算模块计算得到的每段数据的结果,生成最终的尾数;
所述计算结果生成模块,用于根据所述尾数生成模块生成的最终的尾数和所述对阶模块对阶后的阶码,生成计算结果;
所述规格化模块,用于对所述计算结果生成模块生成的计算结果规格化处理,得到最终计算结果。
可选的,所述第一目标浮点数和/或所述第二目标浮点数,包括:
双精度浮点数;
或单精度扩展浮点数;
或双精度扩展浮点数;
或满足预设表达式的浮点数。
可选的,所述预设表达式,包括:
(-1)S*M*2E,其中,
(-1)S为符号位;M为有效数字,且1≤M<2;E为阶码。
可选的,尾数分段的位数不大于22。
可选的,若Ex≥Ey,所述分段转换模块,具体用于:
X的尾数
MX=Mxn*(M)n+Mxn-1*(M)n-1+…+Mxn-i*(M)n-i+…+Mx0*(M)0
Y的尾数
MY′=My′n*(M)n+My′n-1*(M)n-1+…+My′n-i*(M)n-i+…+My′0*(M)0;其中,
n≥i≥0;M=2m;m≤22;
若Ex<Ey,所述分段转换模块,具体用于:
X的尾数
MX′=Mx′n*(M)n+Mx′n-1*(M)n-1+…+Mx′n-j*(M)n-j+…+Mx′0*(M)0
Y的尾数
MY=Myn*(M)n+Myn-1*(M)n-1+…+Myn-j*(M)n-j+…+My0*(M)0;其中,
n≥j≥0;M=2m;m≤22。
由上述的技术方案可见,本发明实施例提供了一种浮点数处理方法及装置,方法包括:获得第一目标浮点数X和第二目标浮点数Y,其中,X=2Ex*MX,Y=2Ey*MY;获得X与Y的运算法则,所述运算法则为加法或减法;判断X和Y是否均不为零;如果X和Y均不为零,则判断X的阶码Ex和Y的阶码Ey是否相等,如果不相等,则对阶所述第一目标浮点数X和所述第二目标浮点数Y,以使所述第一目标浮点数X和所述第二目标浮点数Y的阶码相同,其中,若Ex≥Ey,则对阶后Y=2Ex*MY′,若Ex<Ey,则对阶后X=2Ey*MX′;将对阶后的X和Y的尾数分别进行分段,并将每段数据转换成单精度浮点数;根据获得的运算法则,分别计算X和Y的尾数相应段数据的结果;根据计算得到的每段数据的结果,生成最终的尾数;根据生成的最终的尾数和对阶后的阶码,生成计算结果;对生成的计算结果规格化处理,得到最终计算结果。
应用本发明实施例提供的技术方案,将高精度的浮点数的尾数进行分段,将每段尾数转化为单精度浮点数进行计算,使得不具备双精度浮点数计算能力的中低端GPU产品具备高精度浮点数的计算能力,提高了中低端GPU产品对高精度浮点数的计算能力。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种浮点数处理方法的流程示意图;
图2为本发明实施例提供的一种浮点数处理装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了解决现有技术问题,本发明实施例提供了一种浮点数处理方法及装置。下面首先对本发明实施例所提供的一种浮点数处理方法进行介绍。
图1为本发明实施例提供的一种浮点数处理方法的流程示意图,可以包括:
S101:获得第一目标浮点数X和第二目标浮点数Y,其中,X=2Ex*MX,Y=2Ey*MY
具体的,在实际应用中,第一目标浮点数和/或所述第二目标浮点数,可以包括:
双精度浮点数;或单精度扩展浮点数;或双精度扩展浮点数;或满足预设表达式的浮点数。
其中,上述预设表达式,可以包括:
(-1)S*M*2E,其中,
(-1)S为符号位;M为有效数字,且1≤M<2;E为阶码。
S102:获得X与Y的运算法则,所述运算法则为加法或减法;
S103:判断X和Y是否均不为零,如果X和Y均不为零,执行S104;
如果X和Y中有一个数为零,在所获得的运算法则为加法的情况下,则将另一个浮点数确定为计算结果;
如果X和Y中有一个数为零,在所获得的运算法则为减法的情况下,判断被减数是零还是减数是零;如果减数是零,则将被减数对应的浮点数确定为计算结果;如果被减数是零,则将减数的相反数对应的浮点数确定为计算结果;
S104:对阶所述第一目标浮点数X和所述第二目标浮点数Y,以使所述第一目标浮点数X和所述第二目标浮点数Y的阶码相同,其中,若Ex≥Ey,则对阶后Y=2Ex*MY′,若Ex<Ey,则对阶后X=2Ey*MX′;
S105:将对阶后的X和Y的尾数分别进行分段,并将每段数据转换成单精度浮点数;
具体的,在实际应用中,尾数分段的位数不大于22。在尾数分段不大于22的情况下,使得计算结果未超出单精度浮点数的表示范围。
具体的,若Ex≥Ey,
X的尾数
MX=Mxn*(M)n+Mxn-1*(M)n-1+…+Mxn-i*(M)n-i+…+Mx0*(M)0
Y的尾数
MY′=My′n*(M)n+My′n-1*(M)n-1+…+My′n-i*(M)n-i+…+My′0*(M)0;其中,
n≥i≥0;M=2m;m≤22;
若Ex<Ey,
X的尾数
MX′=Mx′n*(M)n+Mx′n-1*(M)n-1+…+Mx′n-j*(M)n-j+…+Mx′0*(M)0
Y的尾数
MY=Myn*(M)n+Myn-1*(M)n-1+…+Myn-j*(M)n-j+…+My0*(M)0;其中,
n≥j≥0;M=2m;m≤22。
S106:根据获得的运算法则,分别计算X和Y的尾数相应段数据的结果;
S107:根据计算得到的每段数据的结果,生成最终的尾数;
S108:根据生成的最终的尾数和对阶后的阶码,生成计算结果;
S109:对生成的计算结果规格化处理,得到最终计算结果。
示例性的,下面以第一目标浮点数X和第二目标浮点数Y均为双精度浮点数,获得的第一目标浮点数X为:211*1.213,第二目标浮点数Y为:232*1.421,运算法则为加法,即X+Y为例进行说明,
X=0100000010100011011010000111001010110000001000001100010010011100;
Y=0100000111110110101111000110101001111110111110011101101100100011;
对阶所述第一目标浮点数X和所述第二目标浮点数Y,Y的阶码大于X的阶码,对阶后Y不变,对阶后
X=0100000111110000000000000000000000011011010000111001010110000001;
以22位为一段对尾数进行分段,并进行转化
对阶后X的尾数Mx
=0000000000000000000000011011010000111001010110000001
=100000000000000000000002*00000000
+100000000000000000000001*0000000000000001101101
+100000000000000000000000*0000111001010110000001
对阶后Y的尾数My
=0110101111000110101001111110111110011101101100100011
=100000000000000000000002*01101011
+100000000000000000000001*1100011010100111111011
+100000000000000000000000*1110011101101100100011
计算结果尾数M=Mx+My
=100000000000000000000002*00000000
+100000000000000000000001*0000000000000001101101
+100000000000000000000000*0000111001010110000001
+100000000000000000000002*01101011
+100000000000000000000001*1100011010100111111011
+100000000000000000000000*1110011101101100100011
=100000000000000000000002*(00000000+01101011)
+100000000000000000000001*
(0000000000000001101101+1100011010100111111011)
+100000000000000000000000*
(0000111001010110000001+1110011101101100100011)
=100000000000000000000002*01101011
+100000000000000000000001*1100011010101001101000
+100000000000000000000000*1111010111000010100100
=0110101111000110101010011010001111010111000010100100
X+Y的计算结果
=232*0110101111000110101010011010001111010111000010100100;
对X+Y的计算结果进行规格化处理得到最终的计算结果
=0100000111110110101111000110101010011010001111010111000010100100;
X和Y的阶码经过对位后是一致的,对位后主要是尾数的加减法运算,双精度浮点数的加法被分解为三个单精度浮点数的加法,使得中低端GPU产品可以利用自身具备的单精度浮点数的计算能力,来计算高精度浮点数的加减法。
需要说明的是,上述以两个双精度浮点数的加法运算以及以22位为一段对尾数进行分段,仅为本发明的一具体实例,并不够成对本发明的限定。
应用本发明图1所示实施例,将高精度的浮点数的尾数进行分段,将每段尾数转化为单精度浮点数进行计算,使得不具备双精度浮点数计算能力的中低端GPU产品具备高精度浮点数的计算能力,提高了中低端GPU产品对高精度浮点数的计算能力。
与上述的方法实施例相对应,本发明实施例还提供一种浮点数处理装置。
图2为本发明实施例提供的一种浮点数处理装置的结构示意图,可以包括:浮点数获得模块201、运算法则获得模块202、判断模块203、对阶模块204、分段转换模块205、计算模块206、尾数生成模块207、计算结果生成模块208和规格化模块209,其中,
浮点数获得模块201,用于获得第一目标浮点数X和第二目标浮点数Y,其中,X=2Ex*MX,Y=2Ey*MY
具体的,在实际应用中,第一目标浮点数和/或所述第二目标浮点数,可以包括:
双精度浮点数;或单精度扩展浮点数;或双精度扩展浮点数;或满足预设表达式的浮点数。
其中,上述预设表达式,可以包括:
(-1)S*M*2E,其中,
(-1)S为符号位;M为有效数字,且1≤M<2;E为阶码。
运算法则获得模块202,用于获得X与Y的运算法则,所述运算法则为加法或减法;
判断模块203,用于判断X和Y是否均不为零;
对阶模块204,用于在判断模块203判断X和Y均不为零的情况下,对阶所述第一目标浮点数X和所述第二目标浮点数Y,以使所述第一目标浮点数X和所述第二目标浮点数Y的阶码相同,其中,若Ex≥Ey,则对阶后Y=2Ex*MY′,若Ex<Ey,则对阶后X=2Ey*MX′;
分段转换模块205,用于将对阶后的X和Y的尾数分别进行分段,并将每段数据转换成单精度浮点数;
具体的,在实际应用中,尾数分段的位数不大于22。
具体的,若Ex≥Ey,本发明所示实施例的分段转换模块205,具体可以用于:
X的尾数
MX=Mxn*(M)n+Mxn-1*(M)n-1+…+Mxn-i*(M)n-i+…+Mx0*(M)0
Y的尾数
MY′=My′n*(M)n+My′n-1*(M)n-1+…+My′n-i*(M)n-i+…+My′0*(M)0;其中,
n≥i≥0;M=2m;m≤22;
具体的,若Ex<Ey,本发明所示实施例的分段转换模块205,具体可以用于:
X的尾数
MX′=Mx′n*(M)n+Mx′n-1*(M)n-1+…+Mx′n-j*(M)n-j+…+Mx′0*(M)0
Y的尾数
MY=Myn*(M)n+Myn-1*(M)n-1+…+Myn-j*(M)n-j+…+My0*(M)0;其中,
n≥j≥0;M=2m;m≤22。
计算模块206,用于根据所述运算法则获得模块获得的运算法则,分别计算X和Y的尾数相应段数据的结果;
尾数生成模块207,用于根据计算模块206计算得到的每段数据的结果,生成最终的尾数;
计算结果生成模块208,用于根据尾数生成模块207生成的最终的尾数和对阶模块204对阶后的阶码,生成计算结果;
规格化模块209,用于对计算结果生成模块208生成的计算结果规格化处理,得到最终计算结果。
应用本发明图2所示实施例,将高精度的浮点数的尾数进行分段,将每段尾数转化为单精度浮点数进行计算,使得不具备双精度浮点数计算能力的中低端GPU产品具备高精度浮点数的计算能力,提高了中低端GPU产品对高精度浮点数的计算能力。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域普通技术人员可以理解实现上述方法实施方式中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于计算机可读取存储介质中,这里所称得的存储介质,如:ROM/RAM、磁碟、光盘等。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种浮点数处理方法,其特征在于,包括:
获得第一目标浮点数X和第二目标浮点数Y,其中,X=2Ex*MX,Y=2Ey*MY
获得X与Y的运算法则,所述运算法则为加法或减法;
判断X和Y是否均不为零;
如果X和Y均不为零,则对阶所述第一目标浮点数X和所述第二目标浮点数Y,以使所述第一目标浮点数X和所述第二目标浮点数Y的阶码相同,其中,若Ex≥Ey,则对阶后Y=2Ex*MY′,若Ex<Ey,则对阶后X=2Ey*MX′;
将对阶后的X和Y的尾数分别进行分段,并将每段数据转换成单精度浮点数;
根据获得的运算法则,分别计算X和Y的尾数相应段数据的结果;
根据计算得到的每段数据的结果,生成最终的尾数;
根据生成的最终的尾数和对阶后的阶码,生成计算结果;
对生成的计算结果规格化处理,得到最终计算结果。
2.根据权利要求1所述的方法,其特征在于,所述第一目标浮点数和/或所述第二目标浮点数,包括:
双精度浮点数;或单精度扩展浮点数;或双精度扩展浮点数;或满足预设表达式的浮点数。
3.根据权利要求2所述的方法,其特征在于,所述预设表达式,包括:
(-1)S*M*2E,其中,
(-1)S为符号位;M为有效数字,且1≤M<2;E为阶码。
4.根据权利要求1所述的方法,其特征在于,
尾数分段的位数不大于22。
5.根据权利要求1所述的方法,其特征在于,
若Ex≥Ey,所述将对阶后的X和Y的尾数分别进行分段,并将每段数据转换成单精度浮点数,包括:
X的尾数
MX=Mxn*(M)n+Mxn-1*(M)n-1+…+Mxn-i*(M)n-i+…+Mx0*(M)0
Y的尾数
MY′=My′n*(M)n+My′n-1*(M)n-1+…+My′n-i*(M)n-i+…+My′0*(M)0;其中,
n≥i≥0;M=2m;m≤22;
若Ex<Ey,所述将对阶后的X和Y的尾数分别进行分段,并将每段数据转换成单精度浮点数,包括:
X的尾数
MX′=Mx′n*(M)n+Mx′n-1*(M)n-1+…+Mx′n-j*(M)n-j+…+Mx′0*(M)0
Y的尾数
MY=Myn*(M)n+Myn-1*(M)n-1+…+Myn-j*(M)n-j+…+My0*(M)0;其中,
n≥j≥0;M=2m;m≤22。
6.一种浮点数处理装置,其特征在于,包括:浮点数获得模块、运算法则获得模块、判断模块、对阶模块、分段转换模块、计算模块、尾数生成模块、计算结果生成模块和规格化模块,其中,
所述浮点数获得模块,用于获得第一目标浮点数X和第二目标浮点数Y,其中,X=2Ex*MX,Y=2Ey*MY
所述运算法则获得模块,用于获得X与Y的运算法则,所述运算法则为加法或减法;
所述判断模块,用于判断X和Y是否均不为零;
所述对阶模块,用于在所述判断模块判断X和Y均不为零的情况下,对阶所述第一目标浮点数X和所述第二目标浮点数Y,以使所述第一目标浮点数X和所述第二目标浮点数Y的阶码相同,其中,若Ex≥Ey,则对阶后Y=2Ex*MY′,若Ex<Ey,则对阶后X=2Ey*MX′;
所述分段转换模块,用于将对阶后的X和Y的尾数分别进行分段,并将每段数据转换成单精度浮点数;
所述计算模块,用于根据所述运算法则获得模块获得的运算法则,分别计算X和Y的尾数相应段数据的结果;
所述尾数生成模块,用于根据所述计算模块计算得到的每段数据的结果,生成最终的尾数;
所述计算结果生成模块,用于根据所述尾数生成模块生成的最终的尾数和所述对阶模块对阶后的阶码,生成计算结果;
所述规格化模块,用于对所述计算结果生成模块生成的计算结果规格化处理,得到最终计算结果。
7.根据权利要求6所述的装置,其特征在于,所述第一目标浮点数和/或所述第二目标浮点数,包括:
双精度浮点数;或单精度扩展浮点数;或双精度扩展浮点数;或满足预设表达式的浮点数。
8.根据权利要求7所述的装置,其特征在于,所述预设表达式,包括:
(-1)S*M*2E,其中,
(-1)S为符号位;M为有效数字,且1≤M<2;E为阶码。
9.根据权利要求6所述的装置,其特征在于,
尾数分段的位数不大于22。
10.根据权利要求6所述的装置,其特征在于,若Ex≥Ey,所述分段转换模块,具体用于:
X的尾数
MX=Mxn*(M)n+Mxn-1*(M)n-1+…+Mxn-i*(M)n-i+…+Mx0*(M)0
Y的尾数
MY′=My′n*(M)n+My′n-1*(M)n-1+…+My′n-i*(M)n-i+…+My′0*(M)0;其中,
n≥i≥0;M=2m;m≤22;
若Ex<Ey,所述分段转换模块,具体用于:
X的尾数
MX′=Mx′n*(M)n+Mx′n-1*(M)n-1+…+Mx′n-j*(M)n-j+…+Mx′0*(M)0
Y的尾数
MY=Myn*(M)n+Myn-1*(M)n-1+…+Myn-j*(M)n-j+…+My0*(M)0;其中,
n≥j≥0;M=2m;m≤22。
CN201510629933.1A 2015-09-29 2015-09-29 一种浮点数处理方法及装置 Active CN105224283B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510629933.1A CN105224283B (zh) 2015-09-29 2015-09-29 一种浮点数处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510629933.1A CN105224283B (zh) 2015-09-29 2015-09-29 一种浮点数处理方法及装置

Publications (2)

Publication Number Publication Date
CN105224283A true CN105224283A (zh) 2016-01-06
CN105224283B CN105224283B (zh) 2017-12-08

Family

ID=54993286

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510629933.1A Active CN105224283B (zh) 2015-09-29 2015-09-29 一种浮点数处理方法及装置

Country Status (1)

Country Link
CN (1) CN105224283B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109408028A (zh) * 2018-09-21 2019-03-01 东软集团股份有限公司 浮点数运算方法、装置及存储介质
CN112099759A (zh) * 2020-08-19 2020-12-18 武汉虚咖科技有限公司 数值处理方法、装置、处理设备及计算机可读存储介质
WO2021136259A1 (zh) * 2019-12-31 2021-07-08 华为技术有限公司 浮点数乘法计算的方法、装置和算术逻辑单元
CN114186186A (zh) * 2020-09-15 2022-03-15 华为技术有限公司 矩阵计算方法及相关设备
WO2022068327A1 (zh) * 2020-09-29 2022-04-07 华为技术有限公司 运算单元、浮点数计算的方法、装置、芯片和计算设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090037504A1 (en) * 2007-08-02 2009-02-05 Via Technologies, Inc. Exponent Processing Systems and Methods
CN201311633Y (zh) * 2008-11-07 2009-09-16 中国北车股份有限公司大连电力牵引研发中心 基于fpga的浮点数值除法器实现的功能模块
CN101685383A (zh) * 2008-09-28 2010-03-31 杨高祥 计算器、基于直接对阶的自由精度浮点数的运算电路

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090037504A1 (en) * 2007-08-02 2009-02-05 Via Technologies, Inc. Exponent Processing Systems and Methods
CN101685383A (zh) * 2008-09-28 2010-03-31 杨高祥 计算器、基于直接对阶的自由精度浮点数的运算电路
CN201311633Y (zh) * 2008-11-07 2009-09-16 中国北车股份有限公司大连电力牵引研发中心 基于fpga的浮点数值除法器实现的功能模块

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109408028A (zh) * 2018-09-21 2019-03-01 东软集团股份有限公司 浮点数运算方法、装置及存储介质
CN109408028B (zh) * 2018-09-21 2021-03-05 东软集团股份有限公司 浮点数运算方法、装置及存储介质
WO2021136259A1 (zh) * 2019-12-31 2021-07-08 华为技术有限公司 浮点数乘法计算的方法、装置和算术逻辑单元
CN113126954A (zh) * 2019-12-31 2021-07-16 华为技术有限公司 浮点数乘法计算的方法、装置和算术逻辑单元
CN116594589A (zh) * 2019-12-31 2023-08-15 华为技术有限公司 浮点数乘法计算的方法、装置和算术逻辑单元
CN116594589B (zh) * 2019-12-31 2024-03-26 华为技术有限公司 浮点数乘法计算的方法、装置和算术逻辑单元
CN113126954B (zh) * 2019-12-31 2024-04-09 华为技术有限公司 浮点数乘法计算的方法、装置和算术逻辑单元
CN112099759A (zh) * 2020-08-19 2020-12-18 武汉虚咖科技有限公司 数值处理方法、装置、处理设备及计算机可读存储介质
CN114186186A (zh) * 2020-09-15 2022-03-15 华为技术有限公司 矩阵计算方法及相关设备
CN114186186B (zh) * 2020-09-15 2023-08-04 华为技术有限公司 矩阵计算方法及相关设备
WO2022068327A1 (zh) * 2020-09-29 2022-04-07 华为技术有限公司 运算单元、浮点数计算的方法、装置、芯片和计算设备

Also Published As

Publication number Publication date
CN105224283B (zh) 2017-12-08

Similar Documents

Publication Publication Date Title
CN105224284A (zh) 一种浮点数处理方法及装置
CN105224283A (zh) 一种浮点数处理方法及装置
US9829956B2 (en) Approach to power reduction in floating-point operations
WO2017124645A1 (zh) 一种浮点数处理装置
US9146901B2 (en) Vector floating point argument reduction
CA3083043C (en) System and method of floating point multiply operation processing
EP3447634B1 (en) Non-linear function computing device and method
CN106951211B (zh) 一种可重构定浮点通用乘法器
JP4635087B2 (ja) 拡張関数のための向上した浮動小数点演算部
CN106575214B (zh) 融合乘加运算的模拟
CN102629189B (zh) 基于fpga的流水浮点乘累加方法
CN1928809A (zh) 用于执行浮点运算的系统、设备和方法
US20140195581A1 (en) Fixed point division circuit utilizing floating point architecture
JP2021525403A (ja) 改良された低精度の2進浮動小数点形式設定
JP7368939B2 (ja) ルックアップテーブルを利用して加速化されたコンピューティングの方法及びシステム
US10747501B2 (en) Providing efficient floating-point operations using matrix processors in processor-based systems
JPWO2007096982A1 (ja) 演算処理装置および演算処理方法
CN105045560A (zh) 一种定点乘加运算方法和装置
CN103135960A (zh) 一种基于fpga的集成浮点运算器的设计方法
CN107220025A (zh) 处理乘加运算的装置和处理乘加运算的方法
CN205540690U (zh) 一种高速多模式模加运算的电路
CN104572018A (zh) 一种用于浮点常数生成的装置及方法
CN111313905A (zh) 一种浮点数转换方法及装置
TW200534164A (en) Static floating point processing unit suitable for embedded digital signal processing and shift control method thereof
Peng et al. An efficient O (1) contrast enhancement algorithm using parallel column histograms

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant