CN113721884A - 运算方法、装置、芯片、电子装置及存储介质 - Google Patents
运算方法、装置、芯片、电子装置及存储介质 Download PDFInfo
- Publication number
- CN113721884A CN113721884A CN202111022511.XA CN202111022511A CN113721884A CN 113721884 A CN113721884 A CN 113721884A CN 202111022511 A CN202111022511 A CN 202111022511A CN 113721884 A CN113721884 A CN 113721884A
- Authority
- CN
- China
- Prior art keywords
- value
- target
- exponent
- preset
- point number
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/483—Computations with numbers represented by a non-linear combination of denominational numbers, e.g. rational numbers, logarithmic number system or floating-point numbers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/544—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices for evaluating functions by calculation
- G06F7/556—Logarithmic or exponential functions
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Mathematical Optimization (AREA)
- General Engineering & Computer Science (AREA)
- Nonlinear Science (AREA)
- Complex Calculations (AREA)
Abstract
本公开提供了一种运算方法、装置、芯片、电子设备及介质,涉及计算机技术领域,尤其涉及芯片技术。方案包括:获取目标浮点数相应的整数部分和小数部分;对二进制表示的小数部分进行划分,得到最高位的预设数量的高位子部分;通过查表获得高位子部分的查表值,查表值为以高位子部分为指数进行以目标值为底的指数运算所得到的结果;基于查表值,利用硬件确定以小数部分为指数进行以目标值为底的指数运算所得到的结果;以及基于以整数部分为指数进行以目标值为底的指数运算所得到的结果,以及以小数部分为指数进行以目标值为底的指数运算所得到的结果,利用硬件确定以目标浮点数为指数进行指数运算所得到的结果。
Description
技术领域
本公开涉及计算机技术领域,尤其涉及芯片技术领域,具体涉及一种运算方法、装置、芯片、电子设备、计算机可读存储介质和计算机程序产品。
背景技术
人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术:人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。用于实现人工智能处理的芯片往往涉及大量的神经网络运算。随着人工智能技术的迭代,需要芯片能够具有处理复杂神经网络运算的能力。
当前的浮点数指数运算和对数运算通常采用软件实现。通过软件的方法,通常需要400个周期以上才能实现对一个元素的浮点数的指数运算和对数运算。这样的计算效率已经无法满足当前人工智能网络对芯片运算能力的需求。
在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明,否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地,除非另有指明,否则此部分中提及的问题不应认为在任何现有技术中已被公认。
发明内容
本公开提供了一种运算方法、装置、芯片、电子设备、计算机可读存储介质和计算机程序产品。
根据本公开的一方面,提供了一种运算方法,包括:获取目标浮点数相应的整数部分和小数部分;对二进制表示的所述小数部分进行划分,得到最高位的预设数量的高位子部分;通过查表获得所述高位子部分的查表值,所述查表值为以所述高位子部分为指数进行以目标值为底的指数运算所得到的结果;基于所述查表值,利用硬件确定以所述小数部分为指数进行以所述目标值为底的指数运算所得到的结果;以及基于以所述整数部分为指数进行以所述目标值为底的指数运算所得到的结果,以及以所述小数部分为指数进行以所述目标值为底的指数运算所得到的结果,利用硬件确定以所述目标浮点数为指数进行指数运算所得到的结果。
根据本公开的另一方面,提供了一种运算装置,包括:获取单元,被配置用于获取目标浮点数相应的整数部分和小数部分;划分单元,被配置用于对二进制表示的所述小数部分进行划分,得到最高位的预设数量的高位子部分;查表单元,被配置用于通过查表获得所述高位子部分的查表值,所述查表值为以所述高位子部分为指数进行以目标值为底的指数运算所得到的结果;第一确定单元,被配置用于基于所述查表值,利用硬件确定以所述小数部分为指数进行以所述目标值为底的指数运算所得到的结果;以及第二确定单元,被配置用于基于以所述整数部分为指数进行以所述目标值为底的指数所得到的结果,以及以所述小数部分为指数进行以所述目标值为底的指数运算所得到的结果,利用硬件确定以所述目标浮点数为指数进行指数运算所得到的结果。
根据本公开的另一方面,提供了一种运算方法,包括:将目标浮点数表示为A*2B,其中,A为尾数,B为指数;对于目标浮点数,对二进制表示的尾数进行划分,得到最高位的预设数量的目标子部分;通过查表获得目标子部分的查表值,查表值为对目标子部分进行以预设值为底的预设对数运算所得到的结果;基于查表值,确定对尾数部分进行预设对数运算所得到的结果;以及以对2B进行预设对数运算所得到的结果,以及对尾数部分进行预设对数运算所得到的结果作为输入,利用加法器获得对目标浮点数进行预设对数运算所得到的结果。
根据本公开的另一方面,提供了一种运算装置,包括:表示单元,被配置用于将目标浮点数表示为A*2B,其中,A为尾数,B为指数;划分单元,被配置用于对于目标浮点数,对二进制表示的尾数进行划分,得到最高位的预设数量的目标子部分;第一查表单元,被配置用于通过查表获得目标子部分的查表值,查表值为对目标子部分进行以预设值为底的预设对数运算所得到的结果;确定单元,被配置用于基于查表值,确定对尾数部分进行预设对数运算所得到的结果;以及加法器,被配置用于接收所输入的对2B进行预设对数运算所得到的结果,以及对尾数部分进行预设对数运算所得到的结果,并输出对目标浮点数进行预设对数运算所得到的结果。
根据本公开的另一方面,提供了一种芯片,包括以下装置中的至少其中之一:上述对浮点数进行指数运算的装置,以及上述对浮点数进行对数运算的装置。
根据本公开的另一方面,提供了一种电子设备,包括上述的芯片。
根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述对浮点数进行指数运算的方法或上述对浮点数进行对数运算的方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行上述对浮点数进行指数运算的方法或上述对浮点数进行对数运算的方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,其中,计算机程序在被处理器执行时实现上述对浮点数进行指数运算的方法或上述对浮点数进行对数运算的方法。
根据本公开的一个或多个实施例,能够将浮点数的指数和对数运算转换为能够基于乘法器、加法器和查表来实现的硬件层面的运算,能够在保证计算精度的情况下,有效提升运算效率。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图示例性地示出了实施例并且构成说明书的一部分,与说明书的文字描述一起用于讲解实施例的示例性实施方式。所示出的实施例仅出于例示的目的,并不限制权利要求的范围。在所有附图中,相同的附图标记指代类似但不一定相同的要素。
图1示出了根据本公开的实施例的运算方法的流程图;
图2示出了根据本公开的实施例的运算装置的结构框图;
图3示出了根据本公开的实施例的另一种运算方法的流程图;
图4示出了根据本公开的实施例的另一种运算装置的结构框图;
图5示出了能够用于实现本公开的实施例的示例性电子设备的结构框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
在本公开中,除非另有说明,否则使用术语“第一”、“第二”等来描述各种要素不意图限定这些要素的位置关系、时序关系或重要性关系,这种术语只是用于将一个元件与另一元件区分开。在一些示例中,第一要素和第二要素可以指向该要素的同一实例,而在某些情况下,基于上下文的描述,它们也可以指代不同实例。
在本公开中对各种示例的描述中所使用的术语只是为了描述特定示例的目的,而并非旨在进行限制。除非上下文另外明确地表明,如果不特意限定要素的数量,则该要素可以是一个也可以是多个。此外,本公开中所使用的术语“和/或”涵盖所列出的项目中的任何一个以及全部可能的组合方式。
下面将结合附图详细描述本公开的实施例。
相关技术中,浮点数指数运算和对数运算通常采用软件实现。通过软件的方法,通常需要400个周期以上才能实现对一个元素的浮点数的指数运算和对数运算。这样的计算效率已经无法满足当前人工智能网络对芯片运算能力的需求。
基于此,本公开提供一种对浮点数进行指数运算的方法及一种对浮点数进行对数运算的方法,以实现纯硬件层面的浮点数指数运算和对数运算。一方面,对于浮点数的指数运算,获取目标浮点数的整数部分和小数部分,确定以整数部分为指数进行以目标值为底的指数运算所得到的结果,以及基于对小数部分的分解,得到最高位的预设数量的高位子部分,并基于高位子部分的查表值,确定以小数部分为指数进行以目标值为底的指数运算所得到的结果,并由此得到最终的对目标浮点数进行指数运算的运算结果。
另一方面,对于浮点数的对数运算,以A*2B来表示的目标浮点数,其中,A为尾数,B为指数,对二进制表示的尾数进行划分,得到最高位的预设数量的目标子部分,通过查表获取目标子部分的查表值,最终通过对2B进行预设对数运算所得到的结果,以及对尾数部分进行上述预设对数运算所得到的结果,来获得最终的对目标浮点数进行预设对数运算所得到的结果。
基于本公开的上述对浮点数的指数运算和对数运算方法,能够将浮点数的复杂运算转换为能够基于乘法器、加法器和查表中的一个或多个来实现的硬件层面的运算,能够在保证计算精度的情况下,有效提升运算效率。
图1示出了根据本公开实施例的一种运算方法,包括:步骤S101、获取目标浮点数相应的整数部分和小数部分;步骤S102、对二进制表示的所述小数部分进行划分,得到最高位的预设数量的高位子部分;步骤S103、通过查表获得所述高位子部分的查表值,所述查表值为以所述高位子部分为指数进行以目标值为底的指数运算所得到的结果;步骤S104、基于所述查表值,利用硬件确定以所述小数部分为指数进行以所述目标值为底的指数运算所得到的结果;以及步骤S105、基于以所述整数部分为指数进行以所述目标值为底的指数运算所得到的结果,以及以所述小数部分为指数进行以所述目标值为底的指数运算所得到的结果,利用硬件确定以所述目标浮点数为指数进行指数运算所得到的结果。
由此,能够将浮点数的复杂指数运算转换为硬件层面的运算,能够在保证计算精度的情况下,有效提升运算效率。同时,针对二进制表示的小数部分的高位子部分进行查表,能够有效减少所需存储的表项数量,降低芯片中的存储资源的占用,减小芯片面积。
除此以外,基于硬件层面的上述指数运算操作,能够允许对连续输入的多个元素的流水处理,例如,对一个元素的上述指数运算操作需要3个周期完成,对于连续输入的多个元素中的任意两个相邻的元素,当其中在先的一个元素处理至第二周期时,可以开始对其中在后的一个元素的第一周期的处理,由此,能够有效地提升数据处理的效率。
针对步骤S101,根据一些实施例,获取目标浮点数相应的整数部分和小数部分可以包括:计算用于将以第一预设值为底的预设指数运算转换为以所述目标值为底的指数运算的第二预设值;以及将以目标浮点数为指数的预设指数运算转换为对相应的转换指数的以所述目标值为底的指数运算,其中,所述转换指数为将所述目标浮点数和所述第二预设值输入第一乘法器而由所述第一乘法器来计算得到的,其中,所述目标浮点数相应的所述整数部分为所述转换指数的整数部分,所述目标浮点数相应的所述小数部分为所述转换指数的小数部分。
特别地,目标值可以但不限于为2。
其中,上述方法中所使用的第一乘法器为实现两个输入信号相乘处理的电子器件。
为了便于理解和描述,下面内容中以所述目标值为2为例来对本公开实施例中的运算方法进行展开描述。可以理解的,所述目标值并不局限于为2,例如也可以为e等其它数值。
其中,在第一预设值为P的情况下,计算得到的第二预设值可以为log2P。基于此,可以将以第一预设值P为底的预设指数运算Pa转换为:
根据一些实施例,目标浮点数可以为单精度浮点数。
单精度浮点数为计算机中一种数字格式,用来表示带有小数部分的实数。一个单精度浮点数占用4个字节(32位)存储空间,包括符号位1位,阶码8位,尾数23位。具体地,对于一个目标浮点数a表示为单精度浮点数的具体形式为:
a=A*2B,
其中,A为尾数,1<A<2,在对尾数A执行存储时,不存储整数部分的“1”,仅将尾数A的23位小数存储在23位的尾数存储空间内;B为指数,将指数B存储在8位的阶码存储空间内。
可以将以目标浮点数a为指数的预设指数运算Pa转换为对相应的转换指数log2p×a的以2为底的指数运算。其中,转换指数log2p×a为将目标浮点数a和第二预设值log2p输入第一乘法器而利用第一乘法器来计算得到的。
本领域人员可以理解,该方法不仅限于单精度浮点数,也适用于包括双精度浮点数在内的其它浮点数类型。
根据一些实施例,第一预设值为e,其中,在目标值为2的情况下,目标浮点数相应的转换指数为通过以下步骤获得:以目标定点数和1/ln2作为输入,利用第一乘法器获得转换指数。
即在P=e时,第二预设值log2P=1/ln2≈1.44269。
基于计算得到的第二预设值1.44269,可以执行将对以目标浮点数a为指数的预设指数运算ea转换为对相应的转换指数1.44269×a的以2为底的指数运算,该转换具体可以表示为:
ea=2(1.44269×a),
其中,a为目标浮点数,1.44269×a为转换指数。
根据一些实施例,上述方法还包括:利用第一移位器将目标浮点数转换为目标定点数,其中,将以目标浮点数为指数的预设指数运算转换为对相应的转换指数的以目标值为底的指数运算包括:将以目标定点数为指数的预设指数运算转换为对相应的转换指数的以目标值为底的指数运算。由此,能够将基于浮点数的乘法运算转换为对定点数的乘法运算,有效地降低了计算复杂度,减少芯片中逻辑资源的占用,缩减芯片面积,提升运算效率。根据一些实施例,利用移位器将目标浮点数转换为目标定点数可以进一步表示为:
ai=int(a×(1<<N)),
其中,a为目标浮点数,ai为目标定点数,int()表示取整运算,N表示移位值。
即利用移位器对目标浮点数a向左移位N位,再对经过移位后的结果取整数值,得到目标定点数ai。由此,可以将对目标浮点数a的乘法计算转换为对目标定点整数ai的乘法计算,进一步降低了计算的复杂度。
对于单精度浮点数,由于单精度浮点数的尾数有23位,因此,特别地,N可以为23。
基于此,可以以目标定点数为指数的预设指数运算转换为对相应的转换指数的以2为底的指数运算,即
特别地,在P=e时,以目标定点数为指数的以e为底的指数运算转换为对相应的转换指数bi的以2为底的指数运算,其中,bi=1,44269×ai。根据一些实施例,第二预设值可以用定点数表示,并且目标定点数的小数位的数量和第二预设值的小数位的数量相同。由此,能够简化计算复杂度。
例如,在针对bi=1,44269×ai的计算过程中,也可以先利用移位器对第二预设值1.44269左移N位后,以经过左移后的定点数执行对bi的计算。对第二预设值1.44269左移N位后得到的定点数的小数位的数量和目标定点数ai的小数位的数量相同。由此,可以将用于计算转换指数的浮点数计算转换为对定点数的计算,有效降低了计算的复杂度。
在一种实施方式中,对bi的计算过程可以进一步表示为:
bi=(1.44269×(1<<N)×ai)×(1>>N)
通过对乘法计算的结果右移N位(即1>>N),能够实现对乘法计算的结果的小数位的截取,避免在乘法计算中,计算的结果的小数位数随乘法操作的翻倍增长,降低后续处理的复杂度。
在另一种实施方式中,还可以通过饱和的方式控制乘法计算的结果的小数位数,其中,可以采用的饱和方式包括舍入至最接近小数位、朝正无穷方向舍入、朝负无穷方向舍入和朝0方向舍入等。
根据一些实施例,当转换指数用定点数表示时,转换指数的小数位的数量和目标定点数的小数位的数量相同。由此,能够简化计算复杂度。
转换指数bi可以表示为:
bi=biint+ci,
其中,biint表示转换指数bi的整数部分,ci表示转换指数bi的小数部分,其中,小数部分ci以二进制表示。
基于此,可以将2bi的计算转换为:
针对步骤S102,在ci的小数位位数较多的情况下,需要存储大量的表项以支持该查表操作。例如,在ci的小数位位数为23时,需要预先存储表项项数为223项的指数计算结果以包含对2ci的各种可能的计算结果,即对在223个表项中的每一项分别存储2ci的一种可能的计算结果。为了节省芯片内的存储资源,可以将小数部分ci进行划分,得到最高位的预设数量的高位子部分。
例如,可以进一步对小数部分ci进行划分,例如,将小数部分划分为高位子部分和低位子部分两部分,将对小数部分ci的划分表示为:
ci=ci0+ci1,
其中,ci0为小数部分的高位子部分,ci1为小数部分的低位子部分,ci0和ci1分别保留ci在不同小数位处的取值。
例如,ci=0.11000100101010011100101,共具有23位小数,可以令ci0保留ci的高8位的连续小数位处的取值,ci1保留ci的低15位的连续小数位处的取值,即
ci0=0.11000100000000000000000,
ci1=0.00000000101010011100101。
基于对二进制表示的小数部分ci进行的上述划分,可以将2ci的计算表示为:
2ci=2ci0+ci1
针对步骤S103,针对高位子部分,可以通过查表获得该子部分的查表值。例如,在2ci=2ci0+ci1的情况下,可以针对ci0执行查表以确定其所对应的2ci0的值。其中,在ci0保留ci的高8位的连续小数位处的取值的情况下,ci0所需的表项数量为28,极大地缩减了所需的存储空间。
根据一些实施例,转换指数和高位子部分的查表值均可以用定点数表示,并且转换指数的小数位的数量和查表值的小数位的数量相同。由此,能够将浮点数计算转换为定点数计算,进而简化运算复杂度。
针对步骤S104,根据一些实施例,二进制表示的所述小数部分被划分为所述高位子部分和低位子部分两部分,并且其中,基于所述查表值,利用硬件确定以所述小数部分为指数进行以所述目标值为底的指数运算所得到的结果包括:利用第二乘法器计算所述低位子部分和以e为底对所述目标值进行指数运算的结果之间的第一乘积值;基于所述查表值和所述第一乘积值,利用泰勒级数计算以所述小数部分为指数进行以所述目标值为底的指数运算所得到的结果。
其中,对小数部分为指数进行以目标值为底的指数运算在高位子部分处进行泰勒展开可以表示为:
其中,x表示小数部分,f()表示小数部分为指数以目标值为底的指数运算,x0表示小数部分的高位子部分。
例如,在2ci=2ci0+ci1的情况下,对2ci在ci0处执行泰勒展开,保留泰勒展开的前三项可以得到:
其中,2ci0的值可以通过查表确定,ci1和ln 2为常数,在此基础上通过多个子乘法器和多个子加法器实现上述运算。
根据一些实施例,可以通过多个子乘法器和多个子加法器实现上述运算,其中一个子乘法器被配置用于计算第一乘积值的平方;另一个子乘法器被配置用于计算所述查表值和所述第一乘积值相应的乘积,得到第二乘积值;另一个乘法器被配置用于计算所述第一乘积值的平方和所述查表值相应的乘积,得到第三乘积值;所述多个子加法器被配置用于对所述查表值、所述第二乘积值和所述第三乘积值进行求和,并且所得到的求和值为以所述小数部分为指数进行以所述目标值为底的指数运算所得到的结果。
例如,针对于的计算,可以通一个子乘法器被配置用于计算ci1×ln 2(即上述第一乘积值)的平方;另一个子乘法器被配置用于计算2ci0(ci1×ln 2)(即查表值和第一乘积值相乘得到的第二乘积值;另一个乘法器被配置用于计算2ci0(ci1×ln 2)2(即第一乘积值的平方和查表值相乘得到第三乘积值;所述多个子加法器被配置用于对基于所述查表值、所述第二乘积值和所述第三乘积值所构成的泰勒展开项进行求和,并且所得到的求和值为以所述小数部分为指数进行以所述目标值为底的指数运算所得到的结果。
根据一些实施例,还可以通过移位器进一步对得到的乘积进行移位处理以得到目标泰勒展开项。
针对步骤S105,基于以整数部分为指数进行以2为底的指数运算所得到的结果以及通过上述方式计算得到的以小数部分为指数进行以2为底的指数运算所得到的结果2ci,可以确定以目标浮点数为指数进行指数运算所得到的结果2bi。
根据一些实施例,在所述目标值为2的情况下,基于以整数部分为指数进行以2为底的指数运算所得到的结果,以及以小数部分为指数进行以2为底的指数运算所得到的结果,利用硬件确定以目标浮点数为指数进行指数运算所得到的结果包括:利用与门将以小数部分为指数进行以2为底的指数运算所得到的结果与0X7FFFFF进行与操作,得到第一中间值;利用第二移位器将以二进制表示的整数部分左移预设位,得到第二中间值,其中,预设位与转换指数的小数位的数量相同;以及对第一中间值和第二中间值进行连接,获得以目标浮点数为指数进行指数运算所得到的结果。由此,能够方便地获取以单精度浮点数表示的最终计算结果。
针对其中小数部分,由于单精度浮点数在存储尾数部分时,不存储整数部分的“1”,仅存储其小数位,因此,将以小数部分为指数进行以2为底的指数运算所得到的结果与0X7FFFFF进行与操作,可以抹去该结果的整数部分的1,而得到要存储至尾数部分的仅包含小数位的第一中间值。
其中,0X7FFFFF为采用16进制表示的7FFFFF,其采用2进制表示为24位的二进制数011111111111111111111111。
对于其中整数部分,将以二进制表示的整数部分左移预设位,可以将其作为采用单精度浮点数表示的最终计算结果的指数部分,存储在8位的阶码部分。
由此,对第一中间值和第二中间值进行连接,可以获得对目标浮点数进行预设指数运算所得到的结果D,具体可以表示为:
D=(biint<<23)|(2ci&0X7FFFFF)
根据一些实施例,目标浮点数可以但不限于为神经网络中分类器的输入。
由于在神经网络的分类器中,例如,softmax层中大量采用指数的操作执行计算,因此,可以将上述针对目标浮点数的指数操作应用于神经网络中的分类器,以支持对浮点数的指数运算处理。该神经网络可以应用于语音处理、图像处理等技术领域。
根据本公开的另一方面,还提供一种运算装置200,如图2所示,该装置200包括:获取单元201,被配置用于获取目标浮点数相应的整数部分和小数部分;划分单元202,被配置用于对二进制表示的所述小数部分进行划分,得到最高位的预设数量的高位子部分;查表单元203,被配置用于通过查表获得所述高位子部分的查表值,所述查表值为以所述高位子部分为指数进行以目标值为底的指数运算所得到的结果;第一确定单元204,被配置用于基于所述查表值,利用硬件确定以所述小数部分为指数进行以所述目标值为底的指数运算所得到的结果;以及第二确定单元205,被配置用于基于以所述整数部分为指数进行以所述目标值为底的指数所得到的结果,以及以所述小数部分为指数进行以所述目标值为底的指数运算所得到的结果,利用硬件确定以所述目标浮点数为指数进行指数运算所得到的结果。
根据一些实施例,所述获取单元包括:第一计算单元,被配置用于计算用于将以第一预设值为底的预设指数运算转换为以所述目标值为底的指数运算的第二预设值;第一乘法器,被配置用于接收所输入的所述目标浮点数和所述第二预设值,并输出所述目标浮点数相应的转换指数;以及转换单元,被配置用于将以目标浮点数为指数的预设指数运算转换为对相应的所述转换指数的以所述目标值为底的指数运算,其中,所述目标浮点数相应的所述整数部分为所述转换指数的整数部分,所述目标浮点数相应的所述小数部分为所述转换指数的小数部分。
根据一些实施例,该装置还包括:第一移位器,被配置用于接收所输入的目标浮点数,并输出目标定点数,其中,转换单元被配置用于以目标定点数为指数的预设指数运算转换为对相应的转换指数的以目标值为底的指数运算。
根据一些实施例,二进制表示的所述小数部分被划分为所述高位子部分和低位子部分两部分,并且其中,所述第一确定单元包括:第二乘法器,被配置用于接收所输入的所述低位子部分和以e为底对所述目标值进行指数运算的结果,并输出第一乘积值;以及第二计算单元,被配置用于基于所述查表值和所述第一乘积值,利用泰勒级数计算以所述小数部分为指数进行以所述目标值为底的指数运算所得到的结果。
根据一些实施例,其中,所述第二计算单元包括多个子乘法器和多个子加法器;其中一个子乘法器被配置用于计算所述第一乘积值的平方;另一个子乘法器被配置用于计算所述查表值和所述第一乘积值相应的乘积,得到第二乘积值;另一个乘法器被配置用于计算所述第一乘积值的平方和所述查表值相应的乘积,得到第三乘积值;所述多个子加法器被配置用于对所述查表值、所述第二乘积值和所述第三乘积值进行求和,并且所得到的求和值为以所述小数部分为指数进行以所述目标值为底的指数运算所得到的结果。
根据一些实施例,其中,所述转换指数和所述多个子部分各自的查表值均用定点数表示,并且所述转换指数的小数位的数量和各查表值的小数位的数量相同,在所述目标值为2的情况下,第二确定单元包括:与门,被配置用于将以小数部分为指数进行以2为底的指数运算所得到的结果与0X7FFFFF进行与操作,得到第一中间值;第二移位器,被配置用于将以二进制表示的整数部分左移预设位,得到第二中间值,其中,预设位与转换指数的小数位的数量相同;以及连接单元,被配置用于对第一中间值和第二中间值进行连接,获得以目标浮点数为指数进行指数运算所得到的结果。
图3示出了根据本公开实施例的一种运算的方法,包括:步骤S301、将目标浮点数表示为A*2B,其中,A为尾数,B为指数;步骤S302、对于所述目标浮点数,对二进制表示的所述尾数进行划分,得到最高位的预设数量的目标子部分;步骤S303、通过查表获得所述目标子部分的查表值,所述查表值为对所述目标子部分进行以预设值为底的预设对数运算所得到的结果;步骤S304、基于所述查表值,确定对所述尾数部分进行预设对数运算所得到的结果;以及步骤S305、以对2B进行预设对数运算所得到的结果,以及对所述尾数部分进行预设对数运算所得到的结果作为输入,利用加法器获得对所述目标浮点数进行预设对数运算所得到的结果。
由此,能够将浮点数的复杂对数运算转换为能够基于加法器和查表来实现的硬件层面的运算,能够在保证计算精度的情况下,有效提升运算效率。同时,基于在目标子部分处的泰勒展开所执行的拟合计算,确定最终的对数运算结果,能够有效减少所需存储的表项数量,降低对芯片中的存储资源的占用,减小芯片面积。
除此以外,基于硬件层面的上述对数运算操作,能够允许对连续输入的多个元素的流水处理,例如,对一个元素的上述对数运算操作需要3个周期完成,对于连续输入的多个元素中的任意两个相邻的元素,当其中在先的一个元素处理至第二周期时,可以开始对其中在后的一个元素的第一周期的处理,由此,能够有效地提升数据处理的效率。
针对步骤S301,根据一些实施例,目标浮点数为单精度浮点数。
单精度浮点数为计算机中一种数字格式,用来表示带有小数部分的实数。一个单精度浮点数占用4个字节(32位)存储空间,包括符号位1位,阶码8位,尾数23位。具体地一个目标浮点数a表示为单精度浮点数的具体形式为:
a=A*2B,
其中,A为尾数,1<A<2,在对尾数A执行存储时,不存储整数部分的“1”,仅将尾数A的23位小数存储在23位的尾数存储空间内;B为指数,将指数B存储在8位的阶码存储空间内。
基于此,可以将对目标浮点数为的预设对数运算表示为:
logya=logy(A*2B)=logyA+Blogy2,
其中,logy()表示预设对数运算。
本领域人员可以理解,该方法不仅限于单精度浮点数,也适用于包括双精度浮点数在内的其它浮点数类型。根据一些实施例,logy2可以表示为定点数。
针对步骤S302,针对目标浮点数的尾数部分的预设对数运算,为了降低计算复杂度,可以采用查表的方式确定其计算结果。然而,在尾数的小数位位数较多的情况下,需要存储大量的表项以支持该查表操作。例如,在尾数的小数位位数为23时,需要的表项项数为223,用以预先存储对尾数的预设对数运算的各种可能的计算结果。为了节省芯片内的存储资源,可以将对二进制表示的尾数进行划分,得到最高位的预设数量的目标子部分,并针对目标子部分执行查表,以此来减少需要存储的表项的数量。其中,目标子部分的最高位的预设数量的位数越多,则计算结果越精确;目标子部分的最高位的预设数量的位数越少,则计算复杂度越低,所需的表项数量越小。
根据一些实施例,预设数量可以为4-8,由此,可以在满足计算精度要求的情况下,简化对目标浮点数的尾数的预设对数运算,降低对需要存储的表项的数量的要求。
优选地,预设数量可以为7。
针对步骤S303~S304,根据一些实施例,基于所述查表值,确定对所述尾数部分进行预设对数运算所得到的结果包括:通过查表获取以所述预设值为底的预设对数函数的至少一部分阶数中的各阶导数各自对应所述目标子部分的导数值;以及基于所述查表值,以及以所述预设值为底的预设对数函数的至少一部分阶数中的各阶导数各自对应所述目标子部分的导数值,利用泰勒级数计算对所述尾数部分进行预设对数运算所得到的结果。
其中,对目标浮点数的尾数的预设对数运算在目标子部分处进行泰勒展开可以表示为:
其中,x表示目标浮点数的尾数,f()表示预设对数函数,x0表示尾数的目标子部分。
基于对尾数的预设对数运算的精度要求,可以通过查表获取预设对数运算的至少一部分阶数中的各阶导数各自对应目标子部分的值,以此来确定对尾数的预设对数运算在目标子部分处进行泰勒展开所得到的相应的至少一部分泰勒展开项的值,并以此拟合尾数进行预设对数运算所得到的结果。
根据一些实施例,通过查表获取以预设值为底的预设对数函数的至少一部分阶数中的各阶导数各自对应目标子部分的导数值包括:通过查表获得预设对数函数的一阶导数对应目标子部分的一阶导数值;基于一阶导数值,计算预设对数函数的至少一部分阶数中的其它阶导数各自对应目标子部分的导数值。由此,可以至少通过泰勒展开式中的前两项的值拟合对目标浮点数的尾数部分进行预设对数运算的结果。
根据一些实施例,可以采用泰勒展开式中的前三项拟合对目标浮点数的尾数的预设对数运算。即通过查表确定f(x0)、f′(x0)和f″(x0)的值,由此拟合得到的尾数的预设对数运算结果E为:
根据一些实施例,基于一阶导数值,计算预设对数函数的至少一部分阶数中的其它阶导数各自对应目标子部分的导数值包括:利用乘法器计算一阶导数值的平方,以及基于一阶导数值的平方和预设对数函数的二阶导数的符号位,计算预设对数函数的二阶导数对应目标子部分的二阶导数值。
根据一些实施例,查表值所得到的结果均为定点数,并且查表值和对2进行预设对数运算所得到的结果的小数位的数量相同。由此,能够有效地简化运算。
针对步骤S305,以对2B进行预设对数运算所得到的结果Blogy2,以及对尾数部分进行预设对数运算所得到的结果作为输入,利用加法器可以获得对目标浮点数进行预设对数运算所得到的最终结果。
根据一些实施例,目标浮点数可以但不限于为模型波束的复数转实数层的输入。由于在模型波束的复数转实数层中大量地采用对数的操作执行计算,因此,可以将上述针对目标浮点数的对数操作应用于模型波束的复数转实数层,以支持对浮点数的对数运算处理。
根据本公开的另一方面,还提供一种运算装置400,如图4所示,该装置400包括:表示单元401,被配置用于将目标浮点数表示为A*2B,其中,A为尾数,B为指数;划分单元402,被配置用于对于目标浮点数,对二进制表示的所述尾数进行划分,得到最高位的预设数量的目标子部分;第一查表单元403,被配置用于通过查表获得所述目标子部分的查表值,所述查表值为对所述目标子部分进行以预设值为底的预设对数运算所得到的结果;确定单元404,被配置用于基于所述查表值,确定对所述尾数部分进行预设对数运算所得到的结果;以及加法器405,被配置用于接收所输入的对2B进行预设对数运算所得到的结果,以及对所述尾数部分进行预设对数运算所得到的结果,并输出对所述目标浮点数进行预设对数运算所得到的结果。
根据一些实施例,所述确定单元包括:获取单元,被配置用于通过查表获取以所述预设值为底的预设对数函数的各阶导数各自对应所述目标子部分的导数值;以及第一计算单元,被配置用于基于所述查表值,以及以所述预设值为底的预设对数函数的至少一部分阶数中的各阶导数各自对应所述目标子部分的导数值,利用泰勒级数计算对所述尾数部分进行预设对数运算所得到的结果。
根据一些实施例,获取单元包括:第二查表单元,被配置用于通过查表获得预设对数函数的一阶导数对应目标子部分的一阶导数值;以及第二计算单元,被配置用于基于一阶导数值,计算预设对数函数的至少一部分阶数中的其它阶导数各自对应目标子部分的导数值。
根据一些实施例,第二计算单元包括:乘法器,被配置用于计算一阶导数值的平方;计算子单元,被配置用于基于一阶导数值的平方和预设对数函数的二阶导数的符号位,计算预设对数函数的二阶导数对应目标子部分的二阶导数值。
根据一些实施例,第一计算单元包括多个子乘法器和多个子加法器,每一子乘法器具有两个输入,每一子加法器具有两个输入;其中一个乘法器被配置用于计算目标浮点数的小数部分和目标子部分之间的目标差值的平方;另一个乘法器被配置用于计算一阶导数值和目标差值的乘积,得到第一乘积值;另一个乘法器被配置用于计算二阶导数值和目标差值的平方的乘积,得到第二乘积值;多个子加法器被配置用于对查表值、第一乘积值和第二乘积值进行求和,并且所得到的求和值为对尾数部分进行预设对数运算所得到的结果。
根据本公开的另一方面,还提供一种芯片,包括以下装置中的至少其中之一:上述任一项的对浮点数进行指数运算的装置,以及上述任一项的对浮点数进行对数运算的装置。
根据本公开的另一方面,还提供一种电子设备,包括上述芯片。
根据本公开的另一方面,还提供一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述任意一种对浮点数进行指数运算的方法或上述任意一种对浮点数进行对数运算的方法。
根据本公开的另一方面,还提供一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行上述任意一种对浮点数进行指数运算的方法或上述任意一种对浮点数进行对数运算的方法。
根据本公开的另一方面,还提供一种计算机程序产品,包括计算机程序,其中,计算机程序在被处理器执行上述任意一种对浮点数进行指数运算的方法或上述任意一种对浮点数进行对数运算的方法。
参考图5,现将描述可以作为本公开的服务器或客户端的电子设备500的结构框图,其是可以应用于本公开的各方面的硬件设备的示例。电子设备旨在表示各种形式的数字电子的计算机设备,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图5所示,设备500包括计算单元501、ROM 502以及RAM 503,其通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
设备500中的多个部件连接至I/O接口505,包括:输入单元506、输出单元507、存储单元508以及通信单元509。输入单元506可以是能向设备500输入信息的任何类型的设备,输入单元506可以接收输入的数字或字符信息,以及产生与电子设备的用户设置和/或功能控制有关的键信号输入,并且可以包括但不限于鼠标、键盘、触摸屏、轨迹板、轨迹球、操作杆、麦克风和/或遥控器。输出单元507可以是能呈现信息的任何类型的设备,并且可以包括但不限于显示器、扬声器、视频/音频输出终端、振动器和/或打印机。存储单元508可以包括但不限于磁盘、光盘。通信单元509允许设备500通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据,并且可以包括但不限于调制解调器、网卡、红外通信设备、无线通信收发机和/或芯片组,例如蓝牙TM设备、1302.11设备、WiFi设备、WiMax设备、蜂窝通信设备和/或类似物。
计算单元501是各种具有处理和计算能力的通用和/或专用处理组件。计算单元501的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元501执行上文所描述的各个方法和处理,例如对浮点数的指数和对数计算方法。例如,在一些实施例中,对浮点数的指数和对数计算方法其被有形地包含于机器可读介质,例如存储单元508。在一些实施例中,计算机程序的部分或者全部可以经由ROM 502和/或通信单元509而被载入和/或安装到设备500上。计算单元801可以通过借助于固件,例如,芯片而被配置为执行对浮点数的指数和对数计算方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行、也可以顺序地或以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
虽然已经参照附图描述了本公开的实施例或示例,但应理解,上述的方法、系统和设备仅仅是示例性的实施例或示例,本发明的范围并不由这些实施例或示例限制,而是仅由授权后的权利要求书及其等同范围来限定。实施例或示例中的各种要素可以被省略或者可由其等同要素替代。此外,可以通过不同于本公开中描述的次序来执行各步骤。进一步地,可以以各种方式组合实施例或示例中的各种要素。重要的是随着技术的演进,在此描述的很多要素可以由本公开之后出现的等同要素进行替换。
Claims (37)
1.一种运算方法,包括:
获取目标浮点数相应的整数部分和小数部分;
对二进制表示的所述小数部分进行划分,得到最高位的预设数量的高位子部分;
通过查表获得所述高位子部分的查表值,所述查表值为以所述高位子部分为指数进行以目标值为底的指数运算所得到的结果;
基于所述查表值,利用硬件确定以所述小数部分为指数进行以所述目标值为底的指数运算所得到的结果;以及
基于以所述整数部分为指数进行以所述目标值为底的指数运算所得到的结果,以及以所述小数部分为指数进行以所述目标值为底的指数运算所得到的结果,利用硬件确定以所述目标浮点数为指数进行指数运算所得到的结果。
2.根据权利要求1所述的方法,其中,获取目标浮点数相应的整数部分和小数部分包括:
计算用于将以第一预设值为底的预设指数运算转换为以所述目标值为底的指数运算的第二预设值;以及
将以目标浮点数为指数的预设指数运算转换为对相应的转换指数的以所述目标值为底的指数运算,其中,所述转换指数为将所述目标浮点数和所述第二预设值输入第一乘法器而所述第一乘法器来计算得到的,
其中,所述目标浮点数相应的所述整数部分为所述转换指数的整数部分,所述目标浮点数相应的所述小数部分为所述转换指数的小数部分。
3.根据权利要求2所述的方法,其中,所述目标值为2。
4.根据权利要求2所述的方法,其中,所述转换指数和所述高位子部分的查表值均用定点数表示,并且所述转换指数的小数位的数量和所述查表值的小数位的数量相同。
5.根据权利要求1所述的方法,其中,二进制表示的所述小数部分被划分为所述高位子部分和低位子部分两部分,
并且其中,基于所述查表值,利用硬件确定以所述小数部分为指数进行以所述目标值为底的指数运算所得到的结果包括:
利用第二乘法器计算所述低位子部分和以e为底对所述目标值进行指数运算的结果之间的第一乘积值;
基于所述查表值和所述第一乘积值,利用泰勒级数计算以所述小数部分为指数进行以所述目标值为底的指数运算所得到的结果。
6.根据权利要求2-5中任一项所述的方法,还包括:
利用第一移位器将目标浮点数转换为目标定点数,
其中,将以目标浮点数为指数的预设指数运算转换为对相应的转换指数的以所述目标值为底的指数运算包括:
将以所述目标定点数为指数的预设指数运算转换为对相应的转换指数的以目标值为底的指数运算。
7.根据权利要求6所述的方法,其中,所述第二预设值用定点数表示,并且所述目标定点数的小数位的数量和所述第二预设值的小数位的数量相同。
8.根据权利要求6所述的方法,其中,所述第一预设值为e,
其中,在所述目标值为2的情况下,所述目标浮点数相应的转换指数为通过以下步骤获得:
以所述目标定点数和1/ln2作为输入,利用第一乘法器获得所述转换指数。
9.根据权利要求6-8中任一项所述的方法,其中,当所述转换指数用定点数表示时,所述转换指数的小数位的数量和所述目标定点数的小数位的数量相同。
10.根据权利要求5-9中任一项所述的方法,其中,在所述目标值为2的情况下,基于以所述整数部分为指数进行以2为底的指数运算所得到的结果,以及以所述小数部分为指数进行以2为底的指数运算所得到的结果,利用硬件确定以所述目标浮点数为指数进行指数运算所得到的结果包括:
利用与门将以所述小数部分为指数进行以2为底的指数运算所得到的结果与0X7FFFFF进行与操作,得到第一中间值;
利用第二移位器将以二进制表示的所述整数部分左移预设位,得到第二中间值,其中,所述预设位与所述转换指数的小数位的数量相同;以及
对所述第一中间值和第二中间值进行连接,获得以所述目标浮点数为指数进行指数运算所得到的结果。
11.根据权利要求1-10中任一项所述的方法,所述目标浮点数为单精度浮点数。
12.根据权利要求1-10中任一项所述的方法,其中,所述目标浮点数为神经网络中分类器的输入。
13.一种运算装置,包括:
获取单元,被配置用于获取目标浮点数相应的整数部分和小数部分;
划分单元,被配置用于对二进制表示的所述小数部分进行划分,得到最高位的预设数量的高位子部分;
查表单元,被配置用于通过查表获得所述高位子部分的查表值,所述查表值为以所述高位子部分为指数进行以目标值为底的指数运算所得到的结果;
第一确定单元,被配置用于基于所述查表值,利用硬件确定以所述小数部分为指数进行以所述目标值为底的指数运算所得到的结果;以及
第二确定单元,被配置用于基于以所述整数部分为指数进行以所述目标值为底的指数所得到的结果,以及以所述小数部分为指数进行以所述目标值为底的指数运算所得到的结果,利用硬件确定以所述目标浮点数为指数进行指数运算所得到的结果。
14.根据权利要求13所述的装置,其中,所述获取单元包括:
第一计算单元,被配置用于计算用于将以第一预设值为底的预设指数运算转换为以所述目标值为底的指数运算的第二预设值;
第一乘法器,被配置用于接收所输入的所述目标浮点数和所述第二预设值,并输出所述目标浮点数相应的转换指数;以及
转换单元,被配置用于将以目标浮点数为指数的预设指数运算转换为对相应的所述转换指数的以所述目标值为底的指数运算,
其中,所述目标浮点数相应的所述整数部分为所述转换指数的整数部分,所述目标浮点数相应的所述小数部分为所述转换指数的小数部分。
15.根据权利要求13所述的装置,还包括:
第一移位器,被配置用于接收所输入的目标浮点数,并输出目标定点数,
其中,所述转换单元被配置用于将以所述目标定点数为指数的预设指数运算转换为对相应的转换指数的以所述目标值为底的指数运算。
16.根据权利要求13所述的装置,其中,二进制表示的所述小数部分被划分为所述高位子部分和低位子部分两部分,
并且其中,所述第一确定单元包括:
第二乘法器,被配置用于接收所输入的所述低位子部分和以e为底对所述目标值进行指数运算的结果,并输出第一乘积值;以及
第二计算单元,被配置用于基于所述查表值和所述第一乘积值,利用泰勒级数计算以所述小数部分为指数进行以所述目标值为底的指数运算所得到的结果。
17.根据权利要求16所述的装置,其中,所述第二计算单元包括多个子乘法器和多个子加法器;
其中一个子乘法器被配置用于计算所述第一乘积值的平方;
另一个子乘法器被配置用于计算所述查表值和所述第一乘积值相应的乘积,得到第二乘积值;
另一个乘法器被配置用于计算所述第一乘积值的平方和所述查表值相应的乘积,得到第三乘积值;
所述多个子加法器被配置用于对所述查表值、所述第二乘积值和所述第三乘积值进行求和,并且所得到的求和值为以所述小数部分为指数进行以所述目标值为底的指数运算所得到的结果。
18.根据权利要求13-16中任一项所述的装置,其中,所述转换指数和所述多个子部分各自的查表值均用定点数表示,并且所述转换指数的小数位的数量和各查表值的小数位的数量相同,
其中,在所述目标值为2的情况下,所述第二确定单元包括:
与门,被配置用于将以所述小数部分为指数进行以2为底的指数运算所得到的结果与0X7FFFFF进行与操作,得到第一中间值;
第二移位器,被配置用于将以二进制表示的所述整数部分左移预设位,得到第二中间值,其中,所述预设位与所述转换指数的小数位的数量相同;以及
连接单元,被配置用于对所述第一中间值和第二中间值进行连接,获得以所述目标浮点数为指数进行指数运算所得到的结果。
19.一种运算方法,包括:
将目标浮点数表示为A*2B,其中,A为尾数,B为指数;
对于所述目标浮点数,对二进制表示的所述尾数进行划分,得到最高位的预设数量的目标子部分;
通过查表获得所述目标子部分的查表值,所述查表值为对所述目标子部分进行以预设值为底的预设对数运算所得到的结果;
基于所述查表值,确定对所述尾数部分进行预设对数运算所得到的结果;以及
以对2B进行预设对数运算所得到的结果,以及对所述尾数部分进行预设对数运算所得到的结果作为输入,利用加法器获得对所述目标浮点数进行预设对数运算所得到的结果。
20.根据权利要求19所述的方法,其中,基于所述查表值,确定对所述尾数部分进行预设对数运算所得到的结果包括:
通过查表获取以所述预设值为底的预设对数函数的至少一部分阶数中的各阶导数各自对应所述目标子部分的导数值;以及
基于所述查表值,以及以所述预设值为底的预设对数函数的至少一部分阶数中的各阶导数各自对应所述目标子部分的导数值,利用泰勒级数计算对所述尾数部分进行预设对数运算所得到的结果。
21.根据权利要求19所述的方法,其中,通过查表获取以所述预设值为底的预设对数函数的至少一部分阶数中的各阶导数各自对应所述目标子部分的导数值包括:
通过查表获得预设对数函数的一阶导数对应所述目标子部分的一阶导数值;
基于所述一阶导数值,计算所述预设对数函数的所述至少一部分阶数中的其它阶导数各自对应所述目标子部分的导数值。
22.根据权利要求20所述的方法,其中,基于所述一阶导数值,计算所述预设对数函数的所述至少一部分阶数中的其它阶导数各自对应所述目标子部分的导数值包括:
利用乘法器计算所述一阶导数值的平方,以及
基于所述一阶导数值的平方和所述预设对数函数的二阶导数的符号位,计算所述预设对数函数的二阶导数对应所述目标子部分的二阶导数值。
23.根据权利要求19-22中任一项所述的方法,其中,所述预设数量为4-8。
24.根据权利要求23所述的方法,其中,所述预设数量为7。
25.根据权利要求19-22所述的方法,其中,所述查表值和对2进行预设对数运算所得到的结果均为定点数,并且两者的小数位的数量相同。
26.根据权利要求19-22中任一项所述的方法,其中,所述目标浮点数为单精度浮点数。
27.根据权利要求19-22所述的方法,其中,所述目标浮点数为模型波束的复数转实数层的输入。
28.一种运算装置,包括:
表示单元,被配置用于将目标浮点数表示为A*2B,其中,A为尾数,B为指数;
划分单元,被配置用于对于目标浮点数,对二进制表示的所述尾数进行划分,得到最高位的预设数量的目标子部分;
第一查表单元,被配置用于通过查表获得所述目标子部分的查表值,所述查表值为对所述目标子部分进行以预设值为底的预设对数运算所得到的结果;
确定单元,被配置用于基于所述查表值,确定对所述尾数部分进行预设对数运算所得到的结果;以及
加法器,被配置用于接收所输入的对2B进行预设对数运算所得到的结果,以及对所述尾数部分进行预设对数运算所得到的结果,并输出对所述目标浮点数进行预设对数运算所得到的结果。
29.根据权利要求28所述的装置,其中,所述确定单元包括:
获取单元,被配置用于通过查表获取以所述预设值为底的预设对数函数的各阶导数各自对应所述目标子部分的导数值;以及
第一计算单元,被配置用于基于所述查表值,以及以所述预设值为底的预设对数函数的至少一部分阶数中的各阶导数各自对应所述目标子部分的导数值,利用泰勒级数计算对所述尾数部分进行预设对数运算所得到的结果。
30.根据权利要求29所述的装置,其中,所述获取单元包括:
第二查表单元,被配置用于通过查表获得预设对数函数的一阶导数对应所述目标子部分的一阶导数值;以及
第二计算单元,被配置用于基于所述一阶导数值,计算所述预设对数函数的所述至少一部分阶数中的其它阶导数各自对应所述目标子部分的导数值。
31.根据权利要求30所述的装置,其中,所述第二计算单元包括:
乘法器,被配置用于计算所述一阶导数值的平方;
计算子单元,被配置用于基于所述一阶导数值的平方和所述预设对数函数的二阶导数的符号位,计算所述预设对数函数的二阶导数对应所述目标子部分的二阶导数值。
32.根据权利要求31所述的装置,其中,所述第一计算单元包括多个子乘法器和多个子加法器,每一子乘法器具有两个输入,每一子加法器具有两个输入;
其中一个子乘法器被配置用于计算所述目标浮点数的小数部分和所述目标子部分之间的目标差值的平方;
另一个子乘法器被配置用于计算所述一阶导数值和所述目标差值相应的乘积,得到第一乘积值;
另一个子乘法器被配置用于计算所述二阶导数值和所述目标差值的平方相应的乘积,得到第二乘积值;
所述多个子加法器被配置用于对所述查表值、所述第一乘积值和所述第二乘积值进行求和,并且所得到的求和值为对所述尾数部分进行预设对数运算所得到的结果。
33.一种芯片,包括以下装置中的至少其中之一:
权利要求13-18中任一项所述的装置,以及
权利要求28-32中任一项所述的装置。
34.一种电子设备,包括权利要求33所述的芯片。
35.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-12中任一项所述的方法或权利要求19-27中任一项所述的方法。
36.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-12中任一项所述的方法或权利要求19-27中任一项所述的方法。
37.一种计算机程序产品,包括计算机程序,其中,所述计算机程序在被处理器执行时实现权利要求1-12中任一项所述的方法或权利要求19-27中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111022511.XA CN113721884B (zh) | 2021-09-01 | 2021-09-01 | 运算方法、装置、芯片、电子装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111022511.XA CN113721884B (zh) | 2021-09-01 | 2021-09-01 | 运算方法、装置、芯片、电子装置及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113721884A true CN113721884A (zh) | 2021-11-30 |
CN113721884B CN113721884B (zh) | 2022-04-19 |
Family
ID=78680778
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111022511.XA Active CN113721884B (zh) | 2021-09-01 | 2021-09-01 | 运算方法、装置、芯片、电子装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113721884B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115469829A (zh) * | 2022-10-28 | 2022-12-13 | 摩尔线程智能科技(北京)有限责任公司 | 运算装置和基于运算电路的指数运算方法 |
CN115511047A (zh) * | 2022-06-09 | 2022-12-23 | 上海燧原科技有限公司 | Softmax模型的量化方法、装置、设备及介质 |
CN116543771A (zh) * | 2023-07-06 | 2023-08-04 | 深圳市友杰智新科技有限公司 | 语音识别方法、装置、存储介质及电子设备 |
WO2023178860A1 (zh) * | 2022-03-22 | 2023-09-28 | 奥比中光科技集团股份有限公司 | 一种基于指数函数和softmax函数的优化方法、硬件系统及芯片 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040010531A1 (en) * | 2002-07-09 | 2004-01-15 | Silicon Integrated Systems Corp. | Apparatus and method for calculating an exponential calculating result of a floating-point number |
CN1472635A (zh) * | 2002-07-29 | 2004-02-04 | 矽统科技股份有限公司 | 浮点数的指数运算方法和装置 |
US20040267853A1 (en) * | 2003-06-26 | 2004-12-30 | International Business Machines Corporation, Armonk, New York | Method and apparatus for implementing power of two floating point estimation |
US20140129601A1 (en) * | 2012-05-19 | 2014-05-08 | Eric B. Olsen | Conversion apparatus for a residue number arithmetic logic unit |
CN105573712A (zh) * | 2014-10-31 | 2016-05-11 | Arm有限公司 | 用于计算重复迭代和的结果的装置、方法和程序 |
CN109871197A (zh) * | 2018-12-29 | 2019-06-11 | 航天信息股份有限公司 | 数据存储装置及数据确定装置 |
US20200293278A1 (en) * | 2019-03-11 | 2020-09-17 | Graphcore Limited | Execution unit |
CN111767025A (zh) * | 2020-08-04 | 2020-10-13 | 腾讯科技(深圳)有限公司 | 包括乘累加器的芯片、终端及浮点运算的控制方法 |
CN112189184A (zh) * | 2019-09-29 | 2021-01-05 | 深圳市大疆创新科技有限公司 | 浮点数处理方法、设备和可移动平台 |
CN112506935A (zh) * | 2020-12-21 | 2021-03-16 | 北京百度网讯科技有限公司 | 数据处理方法、装置、电子设备、存储介质及程序产品 |
-
2021
- 2021-09-01 CN CN202111022511.XA patent/CN113721884B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040010531A1 (en) * | 2002-07-09 | 2004-01-15 | Silicon Integrated Systems Corp. | Apparatus and method for calculating an exponential calculating result of a floating-point number |
CN1472635A (zh) * | 2002-07-29 | 2004-02-04 | 矽统科技股份有限公司 | 浮点数的指数运算方法和装置 |
US20040267853A1 (en) * | 2003-06-26 | 2004-12-30 | International Business Machines Corporation, Armonk, New York | Method and apparatus for implementing power of two floating point estimation |
US20140129601A1 (en) * | 2012-05-19 | 2014-05-08 | Eric B. Olsen | Conversion apparatus for a residue number arithmetic logic unit |
CN105573712A (zh) * | 2014-10-31 | 2016-05-11 | Arm有限公司 | 用于计算重复迭代和的结果的装置、方法和程序 |
CN109871197A (zh) * | 2018-12-29 | 2019-06-11 | 航天信息股份有限公司 | 数据存储装置及数据确定装置 |
US20200293278A1 (en) * | 2019-03-11 | 2020-09-17 | Graphcore Limited | Execution unit |
CN112189184A (zh) * | 2019-09-29 | 2021-01-05 | 深圳市大疆创新科技有限公司 | 浮点数处理方法、设备和可移动平台 |
CN111767025A (zh) * | 2020-08-04 | 2020-10-13 | 腾讯科技(深圳)有限公司 | 包括乘累加器的芯片、终端及浮点运算的控制方法 |
CN112506935A (zh) * | 2020-12-21 | 2021-03-16 | 北京百度网讯科技有限公司 | 数据处理方法、装置、电子设备、存储介质及程序产品 |
Non-Patent Citations (1)
Title |
---|
胡广垠等: "基于高效约束解决算法的浮点数生成器设计", 《微电子学与计算机》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023178860A1 (zh) * | 2022-03-22 | 2023-09-28 | 奥比中光科技集团股份有限公司 | 一种基于指数函数和softmax函数的优化方法、硬件系统及芯片 |
CN115511047A (zh) * | 2022-06-09 | 2022-12-23 | 上海燧原科技有限公司 | Softmax模型的量化方法、装置、设备及介质 |
CN115511047B (zh) * | 2022-06-09 | 2024-03-08 | 上海燧原科技股份有限公司 | Softmax模型的量化方法、装置、设备及介质 |
CN115469829A (zh) * | 2022-10-28 | 2022-12-13 | 摩尔线程智能科技(北京)有限责任公司 | 运算装置和基于运算电路的指数运算方法 |
CN116543771A (zh) * | 2023-07-06 | 2023-08-04 | 深圳市友杰智新科技有限公司 | 语音识别方法、装置、存储介质及电子设备 |
CN116543771B (zh) * | 2023-07-06 | 2023-10-13 | 深圳市友杰智新科技有限公司 | 语音识别方法、装置、存储介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN113721884B (zh) | 2022-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113721884B (zh) | 运算方法、装置、芯片、电子装置及存储介质 | |
US10691413B2 (en) | Block floating point computations using reduced bit-width vectors | |
CN111738448B (zh) | 量子线路模拟方法、装置、设备及存储介质 | |
CN108229648B (zh) | 匹配存储器中数据位宽的卷积计算方法和装置、设备、介质 | |
CN112506935B (zh) | 数据处理方法、装置、电子设备、存储介质及程序产品 | |
EP3676698B1 (en) | Providing efficient floating-point operations using matrix processors in processor-based systems | |
CN112241291A (zh) | 用于指数函数实施的浮点单元 | |
CN110705696A (zh) | 神经网络的量化与定点化融合方法及装置 | |
CN117215646A (zh) | 一种浮点运算方法、处理器、电子设备及存储介质 | |
CN112148249B (zh) | 点积运算实现方法、装置、电子设备及存储介质 | |
KR100847934B1 (ko) | 스케일링된 정수를 사용하는 부동 소수점 연산 | |
US9519459B2 (en) | High efficiency computer floating point multiplier unit | |
CN111079813B (zh) | 基于模型并行的分类模型计算方法和装置 | |
JP6646350B2 (ja) | 様々な数値フォーマットのデータを用いてデータに基づく関数モデルを計算するためのモデル計算ユニット、および制御装置 | |
CN115480731A (zh) | 运算方法、装置、芯片、设备和介质 | |
JP2022024080A (ja) | ニューラルネットワークの積和演算方法及び装置 | |
CN115237372A (zh) | 一种乘法电路、机器学习运算电路、芯片及数据处理方法 | |
CN110782029B (zh) | 神经网络预测方法、装置、电子设备和自动驾驶系统 | |
CN114691082A (zh) | 乘法器电路、芯片、电子设备及计算机可读存储介质 | |
CN108229668B (zh) | 基于深度学习的运算实现方法、装置和电子设备 | |
US9141586B2 (en) | Method, apparatus, system for single-path floating-point rounding flow that supports generation of normals/denormals and associated status flags | |
CN112074806B (zh) | 用于块浮点计算的系统、方法和计算机存储介质 | |
CN115310035A (zh) | 数据处理方法、装置、电子设备、介质和芯片 | |
CN115238236A (zh) | 数据处理方法、装置、电子设备、介质和芯片 | |
KR20230078963A (ko) | 연산 방법, 장치, 칩, 전자 기기 및 저장 매체 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |