CN105224283A

CN105224283A - 一种浮点数处理方法及装置

Info

Publication number: CN105224283A
Application number: CN201510629933.1A
Authority: CN
Inventors: 潘昊
Original assignee: Beijing QIYI Century Science and Technology Co Ltd
Current assignee: Beijing QIYI Century Science and Technology Co Ltd
Priority date: 2015-09-29
Filing date: 2015-09-29
Publication date: 2016-01-06
Anticipated expiration: 2035-09-29
Also published as: CN105224283B

Abstract

本发明实施例公开了一种浮点数处理方法及装置，方法包括：获得第一目标浮点数X和第二目标浮点数Y；获得X与Y的运算法则；判断X和Y是否均不为零；如果X和Y均不为零且X和Y的阶码不相等，则对阶X和Y；将对阶后的X和Y的尾数分别进行分段，并将每段数据转换成单精度浮点数；分别计算X和Y的尾数相应段数据的结果；根据计算得到的每段数据的结果，生成最终的尾数；进而生成计算结果；并对计算结果规格化处理。应用本发明实施例，将高精度的浮点数的尾数进行分段，将每段尾数转化为单精度浮点数进行计算，使得不具备双精度浮点数计算能力的中低端GPU产品具备高精度浮点数的计算能力，提高了中低端GPU产品对高精度浮点数的计算能力。

Description

一种浮点数处理方法及装置

技术领域

本发明涉及计算机技术领域，特别涉及一种浮点数处理方法及装置。

背景技术

GPU(GraphicsProcessingUnit，图形处理单元)，又称图形处理器、显示核心、视觉处理器、显示芯片，是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上图像运算工作的微处理器。

目前，GPU的浮点数计算性能比CPU的浮点数计算性能高很多，因此，GPU也被主要应用于浮点数计算。

但是，GPU制造商处于成本和市场划分的考虑，在高端GPU产品上会保留双精度浮点数的硬件计算单元，在中低端GPU产品上会缩减双精度浮点数的硬件计算单元，这就导致中低端GPU产品的双精度浮点数计算能力较差，甚至不具备双精度浮点数计算能力。

发明内容

本发明实施例的目的在于提供一种浮点数处理方法及装置，以使中低端GPU产品具备高精度浮点数的计算能力或提高中低端GPU产品对高精度浮点数的计算能力。

为达到上述目的，本发明实施例公开了一种浮点数处理方法，包括：

获得第一目标浮点数X和第二目标浮点数Y，其中，X＝2^Ex*M_X，Y＝2^Ey*M_Y；

获得X与Y的运算法则，所述运算法则为加法或减法；

判断X和Y是否均不为零；

如果X和Y均不为零，则对阶所述第一目标浮点数X和所述第二目标浮点数Y，以使所述第一目标浮点数X和所述第二目标浮点数Y的阶码相同，其中，若Ex≥Ey，则对阶后Y＝2^Ex*M_Y′，若Ex<Ey，则对阶后X＝2^Ey*M_X′；

将对阶后的X和Y的尾数分别进行分段，并将每段数据转换成单精度浮点数；

根据获得的运算法则，分别计算X和Y的尾数相应段数据的结果；

根据计算得到的每段数据的结果，生成最终的尾数；

根据生成的最终的尾数和对阶后的阶码，生成计算结果；

对生成的计算结果规格化处理，得到最终计算结果。

可选的，所述第一目标浮点数和/或所述第二目标浮点数，包括：

双精度浮点数；

或单精度扩展浮点数；

或双精度扩展浮点数；

或满足预设表达式的浮点数。

可选的，所述预设表达式，包括：

(-1)^S*M*2^E，其中，

(-1)^S为符号位；M为有效数字，且1≤M＜2；E为阶码。

可选的，尾数分段的位数不大于22。

可选的，若Ex≥Ey，所述将对阶后的X和Y的尾数分别进行分段，并将每段数据转换成单精度浮点数，包括：

X的尾数

M_X＝M_xn*(M_△)ⁿ+M_xn-1*(M_△)^n-1+…+M_xn-i*(M_△)^n-i+…+M_x0*(M_△)⁰；

Y的尾数

M_Y′＝M_y′n*(M_△)ⁿ+M_y′n-1*(M_△)^n-1+…+M_y′n-i*(M_△)^n-i+…+M_y′0*(M_△)⁰；其中，

n≥i≥0；M_△＝2^m；m≤22；

若Ex<Ey，所述将对阶后的X和Y的尾数分别进行分段，并将每段数据转换成单精度浮点数，包括：

X的尾数

M_X′＝M_x′n*(M_△)ⁿ+M_x′n-1*(M_△)^n-1+…+M_x′n-j*(M_△)^n-j+…+M_x′0*(M_△)⁰；

Y的尾数

M_Y＝M_yn*(M_△)ⁿ+M_yn-1*(M_△)^n-1+…+M_yn-j*(M_△)^n-j+…+M_y0*(M_△)⁰；其中，

n≥j≥0；M_△＝2^m；m≤22。

为达到上述目的，本发明实施例公开了一种浮点数处理装置，包括：浮点数获得模块、运算法则获得模块、判断模块、对阶模块、分段转换模块、计算模块、尾数生成模块、计算结果生成模块和规格化模块，其中，

所述浮点数获得模块，用于获得第一目标浮点数X和第二目标浮点数Y，其中，X＝2^Ex*M_X，Y＝2^Ey*M_Y；

所述运算法则获得模块，用于获得X与Y的运算法则，所述运算法则为加法或减法；

所述判断模块，用于判断X和Y是否均不为零；

所述对阶模块，用于在所述判断模块判断X和Y均不为零的情况下，对阶所述第一目标浮点数X和所述第二目标浮点数Y，以使所述第一目标浮点数X和所述第二目标浮点数Y的阶码相同，其中，若Ex≥Ey，则对阶后Y＝2^Ex*M_Y′，若Ex<Ey，则对阶后X＝2^Ey*M_X′；

所述分段转换模块，用于将对阶后的X和Y的尾数分别进行分段，并将每段数据转换成单精度浮点数；

所述计算模块，用于根据所述运算法则获得模块获得的运算法则，分别计算X和Y的尾数相应段数据的结果；

所述尾数生成模块，用于根据所述计算模块计算得到的每段数据的结果，生成最终的尾数；

所述计算结果生成模块，用于根据所述尾数生成模块生成的最终的尾数和所述对阶模块对阶后的阶码，生成计算结果；

所述规格化模块，用于对所述计算结果生成模块生成的计算结果规格化处理，得到最终计算结果。

双精度浮点数；

或单精度扩展浮点数；

或双精度扩展浮点数；

或满足预设表达式的浮点数。

可选的，所述预设表达式，包括：

(-1)^S*M*2^E，其中，

(-1)^S为符号位；M为有效数字，且1≤M＜2；E为阶码。

可选的，尾数分段的位数不大于22。

可选的，若Ex≥Ey，所述分段转换模块，具体用于：

X的尾数

Y的尾数

n≥i≥0；M_△＝2^m；m≤22；

若Ex<Ey，所述分段转换模块，具体用于：

X的尾数

Y的尾数

n≥j≥0；M_△＝2^m；m≤22。

由上述的技术方案可见，本发明实施例提供了一种浮点数处理方法及装置，方法包括：获得第一目标浮点数X和第二目标浮点数Y，其中，X＝2^Ex*M_X，Y＝2^Ey*M_Y；获得X与Y的运算法则，所述运算法则为加法或减法；判断X和Y是否均不为零；如果X和Y均不为零，则判断X的阶码Ex和Y的阶码Ey是否相等，如果不相等，则对阶所述第一目标浮点数X和所述第二目标浮点数Y，以使所述第一目标浮点数X和所述第二目标浮点数Y的阶码相同，其中，若Ex≥Ey，则对阶后Y＝2^Ex*M_Y′，若Ex<Ey，则对阶后X＝2^Ey*M_X′；将对阶后的X和Y的尾数分别进行分段，并将每段数据转换成单精度浮点数；根据获得的运算法则，分别计算X和Y的尾数相应段数据的结果；根据计算得到的每段数据的结果，生成最终的尾数；根据生成的最终的尾数和对阶后的阶码，生成计算结果；对生成的计算结果规格化处理，得到最终计算结果。

应用本发明实施例提供的技术方案，将高精度的浮点数的尾数进行分段，将每段尾数转化为单精度浮点数进行计算，使得不具备双精度浮点数计算能力的中低端GPU产品具备高精度浮点数的计算能力，提高了中低端GPU产品对高精度浮点数的计算能力。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种浮点数处理方法的流程示意图；

图2为本发明实施例提供的一种浮点数处理装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为了解决现有技术问题，本发明实施例提供了一种浮点数处理方法及装置。下面首先对本发明实施例所提供的一种浮点数处理方法进行介绍。

图1为本发明实施例提供的一种浮点数处理方法的流程示意图，可以包括：

S101：获得第一目标浮点数X和第二目标浮点数Y，其中，X＝2^Ex*M_X，Y＝2^Ey*M_Y；

具体的，在实际应用中，第一目标浮点数和/或所述第二目标浮点数，可以包括：

双精度浮点数；或单精度扩展浮点数；或双精度扩展浮点数；或满足预设表达式的浮点数。

其中，上述预设表达式，可以包括：

(-1)^S*M*2^E，其中，

(-1)^S为符号位；M为有效数字，且1≤M＜2；E为阶码。

S102：获得X与Y的运算法则，所述运算法则为加法或减法；

S103：判断X和Y是否均不为零，如果X和Y均不为零，执行S104；

如果X和Y中有一个数为零，在所获得的运算法则为加法的情况下，则将另一个浮点数确定为计算结果；

如果X和Y中有一个数为零，在所获得的运算法则为减法的情况下，判断被减数是零还是减数是零；如果减数是零，则将被减数对应的浮点数确定为计算结果；如果被减数是零，则将减数的相反数对应的浮点数确定为计算结果；

S104：对阶所述第一目标浮点数X和所述第二目标浮点数Y，以使所述第一目标浮点数X和所述第二目标浮点数Y的阶码相同，其中，若Ex≥Ey，则对阶后Y＝2^Ex*M_Y′，若Ex<Ey，则对阶后X＝2^Ey*M_X′；

S105：将对阶后的X和Y的尾数分别进行分段，并将每段数据转换成单精度浮点数；

具体的，在实际应用中，尾数分段的位数不大于22。在尾数分段不大于22的情况下，使得计算结果未超出单精度浮点数的表示范围。

具体的，若Ex≥Ey，

X的尾数

Y的尾数

n≥i≥0；M_△＝2^m；m≤22；

若Ex<Ey，

X的尾数

Y的尾数

n≥j≥0；M_△＝2^m；m≤22。

S106：根据获得的运算法则，分别计算X和Y的尾数相应段数据的结果；

S107：根据计算得到的每段数据的结果，生成最终的尾数；

S108：根据生成的最终的尾数和对阶后的阶码，生成计算结果；

S109：对生成的计算结果规格化处理，得到最终计算结果。

示例性的，下面以第一目标浮点数X和第二目标浮点数Y均为双精度浮点数，获得的第一目标浮点数X为：2¹¹*1.213，第二目标浮点数Y为：2³²*1.421，运算法则为加法，即X+Y为例进行说明，

X＝0100000010100011011010000111001010110000001000001100010010011100；

Y＝0100000111110110101111000110101001111110111110011101101100100011；

对阶所述第一目标浮点数X和所述第二目标浮点数Y，Y的阶码大于X的阶码，对阶后Y不变，对阶后

X＝0100000111110000000000000000000000011011010000111001010110000001；

以22位为一段对尾数进行分段，并进行转化

对阶后X的尾数Mx

＝0000000000000000000000011011010000111001010110000001

＝10000000000000000000000²*00000000

+10000000000000000000000¹*0000000000000001101101

+10000000000000000000000⁰*0000111001010110000001

对阶后Y的尾数My

＝0110101111000110101001111110111110011101101100100011

＝10000000000000000000000²*01101011

+10000000000000000000000¹*1100011010100111111011

+10000000000000000000000⁰*1110011101101100100011

计算结果尾数M＝Mx+My

＝10000000000000000000000²*00000000

+10000000000000000000000¹*0000000000000001101101

+10000000000000000000000⁰*0000111001010110000001

+10000000000000000000000²*01101011

+10000000000000000000000¹*1100011010100111111011

+10000000000000000000000⁰*1110011101101100100011

＝10000000000000000000000²*(00000000+01101011)

+10000000000000000000000¹*

(0000000000000001101101+1100011010100111111011)

+10000000000000000000000⁰*

(0000111001010110000001+1110011101101100100011)

＝10000000000000000000000²*01101011

+10000000000000000000000¹*1100011010101001101000

+10000000000000000000000⁰*1111010111000010100100

＝0110101111000110101010011010001111010111000010100100

X+Y的计算结果

＝2³²*0110101111000110101010011010001111010111000010100100；

对X+Y的计算结果进行规格化处理得到最终的计算结果

＝0100000111110110101111000110101010011010001111010111000010100100；

X和Y的阶码经过对位后是一致的，对位后主要是尾数的加减法运算，双精度浮点数的加法被分解为三个单精度浮点数的加法，使得中低端GPU产品可以利用自身具备的单精度浮点数的计算能力，来计算高精度浮点数的加减法。

需要说明的是，上述以两个双精度浮点数的加法运算以及以22位为一段对尾数进行分段，仅为本发明的一具体实例，并不够成对本发明的限定。

应用本发明图1所示实施例，将高精度的浮点数的尾数进行分段，将每段尾数转化为单精度浮点数进行计算，使得不具备双精度浮点数计算能力的中低端GPU产品具备高精度浮点数的计算能力，提高了中低端GPU产品对高精度浮点数的计算能力。

与上述的方法实施例相对应，本发明实施例还提供一种浮点数处理装置。

图2为本发明实施例提供的一种浮点数处理装置的结构示意图，可以包括：浮点数获得模块201、运算法则获得模块202、判断模块203、对阶模块204、分段转换模块205、计算模块206、尾数生成模块207、计算结果生成模块208和规格化模块209，其中，

浮点数获得模块201，用于获得第一目标浮点数X和第二目标浮点数Y，其中，X＝2^Ex*M_X，Y＝2^Ey*M_Y；

其中，上述预设表达式，可以包括：

(-1)^S*M*2^E，其中，

(-1)^S为符号位；M为有效数字，且1≤M＜2；E为阶码。

运算法则获得模块202，用于获得X与Y的运算法则，所述运算法则为加法或减法；

判断模块203，用于判断X和Y是否均不为零；

对阶模块204，用于在判断模块203判断X和Y均不为零的情况下，对阶所述第一目标浮点数X和所述第二目标浮点数Y，以使所述第一目标浮点数X和所述第二目标浮点数Y的阶码相同，其中，若Ex≥Ey，则对阶后Y＝2^Ex*M_Y′，若Ex<Ey，则对阶后X＝2^Ey*M_X′；

分段转换模块205，用于将对阶后的X和Y的尾数分别进行分段，并将每段数据转换成单精度浮点数；

具体的，在实际应用中，尾数分段的位数不大于22。

具体的，若Ex≥Ey，本发明所示实施例的分段转换模块205，具体可以用于：

X的尾数

Y的尾数

n≥i≥0；M_△＝2^m；m≤22；

具体的，若Ex<Ey，本发明所示实施例的分段转换模块205，具体可以用于：

X的尾数

Y的尾数

n≥j≥0；M_△＝2^m；m≤22。

计算模块206，用于根据所述运算法则获得模块获得的运算法则，分别计算X和Y的尾数相应段数据的结果；

尾数生成模块207，用于根据计算模块206计算得到的每段数据的结果，生成最终的尾数；

计算结果生成模块208，用于根据尾数生成模块207生成的最终的尾数和对阶模块204对阶后的阶码，生成计算结果；

规格化模块209，用于对计算结果生成模块208生成的计算结果规格化处理，得到最终计算结果。

应用本发明图2所示实施例，将高精度的浮点数的尾数进行分段，将每段尾数转化为单精度浮点数进行计算，使得不具备双精度浮点数计算能力的中低端GPU产品具备高精度浮点数的计算能力，提高了中低端GPU产品对高精度浮点数的计算能力。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本领域普通技术人员可以理解实现上述方法实施方式中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，所述的程序可以存储于计算机可读取存储介质中，这里所称得的存储介质，如：ROM/RAM、磁碟、光盘等。

以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

Claims

1.一种浮点数处理方法，其特征在于，包括：

获得X与Y的运算法则，所述运算法则为加法或减法；

判断X和Y是否均不为零；

根据计算得到的每段数据的结果，生成最终的尾数；

根据生成的最终的尾数和对阶后的阶码，生成计算结果；

对生成的计算结果规格化处理，得到最终计算结果。

2.根据权利要求1所述的方法，其特征在于，所述第一目标浮点数和/或所述第二目标浮点数，包括：

3.根据权利要求2所述的方法，其特征在于，所述预设表达式，包括：

(-1)^S*M*2^E，其中，

(-1)^S为符号位；M为有效数字，且1≤M＜2；E为阶码。

4.根据权利要求1所述的方法，其特征在于，

尾数分段的位数不大于22。

5.根据权利要求1所述的方法，其特征在于，

若Ex≥Ey，所述将对阶后的X和Y的尾数分别进行分段，并将每段数据转换成单精度浮点数，包括：

X的尾数

Y的尾数

n≥i≥0；M_△＝2^m；m≤22；

X的尾数

Y的尾数

n≥j≥0；M_△＝2^m；m≤22。

6.一种浮点数处理装置，其特征在于，包括：浮点数获得模块、运算法则获得模块、判断模块、对阶模块、分段转换模块、计算模块、尾数生成模块、计算结果生成模块和规格化模块，其中，

所述判断模块，用于判断X和Y是否均不为零；

7.根据权利要求6所述的装置，其特征在于，所述第一目标浮点数和/或所述第二目标浮点数，包括：

8.根据权利要求7所述的装置，其特征在于，所述预设表达式，包括：

(-1)^S*M*2^E，其中，

(-1)^S为符号位；M为有效数字，且1≤M＜2；E为阶码。

9.根据权利要求6所述的装置，其特征在于，

尾数分段的位数不大于22。

10.根据权利要求6所述的装置，其特征在于，若Ex≥Ey，所述分段转换模块，具体用于：

X的尾数

Y的尾数

n≥i≥0；M_△＝2^m；m≤22；

若Ex<Ey，所述分段转换模块，具体用于：

X的尾数

Y的尾数

n≥j≥0；M_△＝2^m；m≤22。