CN113064841A - 一种数据存储方法、处理方法、计算设备及可读存储介质 - Google Patents

一种数据存储方法、处理方法、计算设备及可读存储介质 Download PDF

Info

Publication number
CN113064841A
CN113064841A CN202110367882.5A CN202110367882A CN113064841A CN 113064841 A CN113064841 A CN 113064841A CN 202110367882 A CN202110367882 A CN 202110367882A CN 113064841 A CN113064841 A CN 113064841A
Authority
CN
China
Prior art keywords
data object
data
absolute value
stored
bit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110367882.5A
Other languages
English (en)
Other versions
CN113064841B (zh
Inventor
杨堃
刘昌辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Uniontech Software Technology Co Ltd
Original Assignee
Uniontech Software Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Uniontech Software Technology Co Ltd filed Critical Uniontech Software Technology Co Ltd
Priority to CN202110367882.5A priority Critical patent/CN113064841B/zh
Publication of CN113064841A publication Critical patent/CN113064841A/zh
Application granted granted Critical
Publication of CN113064841B publication Critical patent/CN113064841B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/08Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
    • G06F12/0802Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
    • G06F12/0806Multiuser, multiprocessor or multiprocessing cache systems
    • G06F12/0811Multiuser, multiprocessor or multiprocessing cache systems with multilevel cache hierarchies
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5011Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
    • G06F9/5016Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals the resource being the memory
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Executing Machine-Instructions (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种数据存储方法,适于在计算设备中执行,该方法包括:接收待存储数据对象,获取待存储数据对象的数据位宽和数据符号;根据待存储数据对象的数据位宽,将待存储数据对象的绝对值存入内存,并获取待存储数据对象的数据起始地址,数据起始地址为待存储数据对象的绝对值在内存中的起始地址;将待存储数据对象的结构信息存入内存,并记录存储结构信息的起始地址,以便根据结构信息获取数据对象进行运算,且在运算过程中以N位数字为一组进行运算,其中,结构信息包括待存储数据对象的数据起始地址、数据位宽和数据符号,N为计算设备的处理器中向量寄存器的位宽。本发明一并公开了相应的数据处理方法、计算设备及可读存储介质。

Description

一种数据存储方法、处理方法、计算设备及可读存储介质
本发明是2021年01月04日申请的发明专利202110000639.X的分案申请。
技术领域
本发明涉及计算机领域,尤其涉及一种数据存储方法、处理方法、计算设备及可读存储介质。
背景技术
在实际应用中对数据进行处理时,我们经常会遇到参与运算的数值很大或者是对运算精度要求非常高的情况。例如,在天文学中计算一些星球的体积和面积时,为了减小误差,需要圆周率π值的精度达到几百万位甚至更高。在这种情况下,我们就涉及到了大数运算。大数运算是指参与运算的数值很大,或者对运算结果的精度要求很高的一种数据运算。
目前,大数运算已广泛应用于密码学、科学计算、天文学、天气预测等各个领域,其在每个领域的科学研究中发挥着重要的作用。但是,目前大数运算的效率较低。因此,如何提高大数运算的效率变得尤为重要。
发明内容
为此,本发明提供了一种数据存储方法、处理方法、计算设备及可读存储介质,以力图解决或者至少缓解上面存在的问题。
根据本发明的一个方面,提供一种数据处理方法,适于在计算设备中执行,计算设备的内存中按照预定存储结构存储有数值型的数据对象,预定存储结构的结构信息包括数据对象的数据起始地址、数据位宽和数据符号,数据起始地址为数据对象的绝对值在内存中的起始地址,数据对象包括待处理的第一数据对象和第二数据对象,该方法包括:获取存储第一数据对象的结构信息的第一起始地址和存储第二数据对象的结构信息的第二起始地址;根据第一起始地址获取第一数据对象的数据符号,根据第二起始地址获取第二数据对象的数据符号;至少基于第一数据对象和第二数据对象的数据符号,使用SIMD指令对第一数据对象和第二数据对象进行运算,运算包括比较运算、加法运算、减法运算和乘法运算中至少之一,其中,在进行加法运算、减法运算或乘法运算时,以N位数字为一组进行运算,N为计算设备的处理器中向量寄存器的位宽。
可选地,在根据本发明的数据处理方法中,对第一数据对象和第二数据对象进行比较运算的步骤,包括:判断第一数据对象和第二数据对象的数据符号是否相同;如果第一数据对象和第二数据对象的数据符号相同,根据第一起始地址,获取第一数据对象的数据位宽,根据第二起始地址,获取第二数据对象的数据位宽;如果第一数据对象和第二数据对象的数据位宽相同,根据第一起始地址,获取第一数据对象的数据起始地址,根据第二起始地址,获取第二数据对象的数据起始地址;根据第一数据对象和第二数据对象的数据起始地址,以N位数字为一组,从高位到低位分别依次提取第一数据对象的绝对值和第二数据对象的绝对值中的数据,每从第一数据对象的绝对值和第二数据对象的绝对值中提取一组数据,使用SIMD指令进行比较运算,直至获得第一数据对象的绝对值和第二数据对象的绝对值的比较结果。
可选地,在根据本发明的数据处理方法中,对第一数据对象和第二数据对象进行比较运算的步骤,还包括:如果第一数据对象和第二数据对象的数据符号相异,确定第一数据对象和第二数据对象的大小。
可选地,在根据本发明的数据处理方法中,对第一数据对象和第二数据对象进行比较运算的步骤,还包括:如果第一数据对象和第二数据对象的数据位宽不同,结合第一数据对象和第二数据对象的数据符号,确定第一数据对象和第二数据对象的大小。
可选地,在根据本发明的数据处理方法中,对第一数据对象和第二数据对象进行加法运算的步骤,包括:判断第一数据对象和第二数据对象的数据符号是否相同;如果第一数据对象和第二数据对象的数据符号相同,取第一数据对象的数据符号作为第一数据对象和第二数据对象的和的数据符号;根据第一起始地址,获取第一数据对象的数据起始地址,根据第二起始地址,获取第二数据对象的数据起始地址;根据第一数据对象和第二数据对象的数据起始地址,以N位数字为一组,从低位到高位分别依次提取第一数据对象的绝对值和第二数据对象的绝对值中的数据,每从第一数据对象的绝对值和第二数据对象的绝对值中提取一组数据,使用SIMD指令进行加法运算,直至将第一数据对象的绝对值和第二数据对象的绝对值相加完成,获得第一数据对象的绝对值和第二数据对象的绝对值的和。按照预定存储结构将第一数据对象和第二数据对象的求和结果存储到内存。
可选地,在根据本发明的数据处理方法中,对第一数据对象和第二数据对象进行加法运算的步骤,还包括:如果第一数据对象和第二数据对象的数据符号不同,比较第一数据对象的绝对值和第二数据对象的绝对值的大小,并取第一数据对象和第二数据对象中绝对值大的数据对象的数据符号,作为第一数据对象和第二数据对象的和的数据符号;将第一数据对象和第二数据对象的加法运算转换为第一数据对象绝对值和第二数据对象的绝对值的减法运算,其中将第一数据对象的绝对值和第二数据对象的绝对值中的较大者作为被减数;根据第一起始地址,获取第一数据对象的数据起始地址,根据第二起始地址,获取第二数据对象的数据起始地址;根据第一数据对象和第二数据对象的数据起始地址,以N位数字为一组,从低位到高位分别依次提取第一数据对象的绝对值和第二数据对象的绝对值中的数据,每从第一数据对象的绝对值和第二数据对象的绝对值中提取一组数据,使用SIMD指令进行减法运算,直至将第一数据对象的绝对值和第二数据对象的绝对值相减完成,获得第一数据对象的绝对值和第二数据对象的绝对值的差;按照预定存储结构将第一数据对象和第二数据对象的求和结果存储到内存。
可选地,在根据本发明的数据处理方法中,对第一数据对象和第二数据对象进行减法运算的步骤,包括:判断第一数据对象和第二数据对象的数据符号是否相同;如果第一数据对象和第二数据对象的数据符号相异,将第一数据对象和第二数据对象的减法运算转换为第一数据对象绝对值和第二数据对象的绝对值的加法运算,并取被减数的符号作为第一数据对象和第二数据对象的差的数据符号;根据第一起始地址,获取第一数据对象的数据起始地址,根据第二起始地址,获取第二数据对象的数据起始地址;根据第一数据对象和第二数据对象的数据起始地址,以N位数字为一组,从低位到高位分别依次提取第一数据对象的绝对值和第二数据对象的绝对值中的数据,每从第一数据对象的绝对值和第二数据对象的绝对值中提取一组数据,使用SIMD指令进行加法运算,直至将第一数据对象的绝对值和第二数据对象的绝对值相加完成,获得第一数据对象的绝对值和第二数据对象的绝对值的和;按照预定存储结构将第一数据对象和第二数据对象的求差结果存储到内存。
可选地,在根据本发明的数据处理方法中,对第一数据对象和第二数据对象进行减法运算的步骤,还包括:如果第一数据对象和第二数据对象的数据符号相同,比较第一数据对象和第二数据对象的大小,确定第一数据对象和第二数据对象的差的数据符号;将述第一数据对象和第二数据对象的减法运算转换为第一数据对象的绝对值和第二数据对象的绝对值的减法运算,其中将第一数据对象的绝对值和第二数据对象的绝对值中的较大者作为被减数;根据第一起始地址,获取第一数据对象的数据起始地址,根据第二起始地址,获取第二数据对象的数据起始地址;根据第一数据对象和第二数据对象的数据起始地址,以N位数字为一组,从低位到高位分别依次提取第一数据对象的绝对值和第二数据对象的绝对值中的数据,每从第一数据对象的绝对值和第二数据对象的绝对值中提取一组数据,使用SIMD指令进行减法运算,直至将第一数据对象的绝对值和第二数据对象的绝对值相减完成,获得第一数据对象的绝对值和第二数据对象的绝对值的差;按照预定存储结构将第一数据对象和第二数据对象的求差结果存储到内存。
可选地,在根据本发明的数据处理方法中,对第一数据对象和第二数据对象进行乘法运算的步骤,包括:根据第一数据对象和第二数据对象的数据符号,确定第一数据对象和第二数据对象的乘积的数据符号;根据第一起始地址,获取第一数据对象的数据起始地址,根据第二起始地址,获取第二数据对象的数据起始地址;根据第一数据对象的数据起始地址,从低位到高位依次提取第一数据对象的绝对值中的每位数值,直至将第一数据对象的绝对值中的数值全部提取完;每从第一数据对象的绝对值中提取一位数值i,根据第二数据对象的数据起始地址,以N位数字为一组,从低位到高位依次提取第二数据对象的绝对值中的数据,每从第二数据对象的绝对值中提取一组数据,使用SIMD指令将该组数据与数值i进行乘法运算,直至将第二数据对象的绝对值与数值i相乘完成,获得第二数据对象的绝对值和数值i的乘积;使用SIMD指令,将第一数据对象的绝对值中的每位数值与第二数据对象的绝对值的乘积进行对位相加,获得第一数据对象的绝对值和第二数据对象的绝对值的乘积;按照预定存储结构将第一数据对象和第二数据对象的乘积结果存储到内存。
根据本发明的又一个方面,提供一种数据存储方法,适于在计算设备中执行,该方法包括:接收待存储数据对象,获取待存储数据对象的数据位宽和数据符号;根据待存储数据对象的数据位宽,将待存储数据对象的绝对值存入内存,并获取待存储数据对象的数据起始地址,数据起始地址为待存储数据对象的绝对值在内存中的起始地址;将待存储数据对象的结构信息存入内存,并记录存储结构信息的起始地址,以便根据结构信息获取数据对象进行运算,且在运算过程中以N位数字为一组进行运算,其中,结构信息包括待存储数据对象的数据起始地址、数据位宽和数据符号,N为计算设备的处理器中向量寄存器的位宽。
可选地,在根据本发明的数据存储方法中,将待存储数据对象的结构信息存入内存的步骤,包括:确定存储待存储数据对象的数据起始地址、数据位宽和数据符号各需占用的字节数,以及存储待存储数据对象的数据起始地址、数据位宽和数据符号的顺序;根据确定好的存储待存储数据对象的数据起始地址、数据位宽和数据符号各占用的字节数以及顺序,将待存储数据对象的结构信息存入内存。
可选地,在根据本发明的数据存储方法中,待存储数据对象包括大数,大数是指超过计算设备的CPU架构中单个寄存器所能表示的最大数值的数。
根据本发明的又一个方面,提供一种计算设备,包括:至少一个处理器;以及存储器,存储有程序指令,其中,程序指令被配置为适于由至少一个处理器执行,程序指令包括用于执行如上方法中的任一方法的指令。
根据本发明的又一个方面,提供一种存储有程序指令的可读存储介质,当程序指令被计算设备读取并执行时,使得计算设备执行如上方法中的任一方法。
根据本发明的数据存储方法,接收待存储数据后,首先获取该数据的数据位宽和数据符号。然后,将待存储数据的数值存储在内存中。最后,将待存储数据的数值在内存中的起始地址、待存储数据的数据位宽和数据符号存储在内存的另一段存储空间中。当对基于这种方法存储的数据进行处理时,可以直接从内存中提取数据的符号、位宽以及实际数值,不再需要对数据进行解析处理,从而能够提高数据的处理效率。
附图说明
为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。
图1示出了根据本发明一个实施例的计算设备100的结构框图;
图2示出了根据本发明一个实施例的数据存储方法200的流程图;
图3示出了根据本发明一个实施例的数据存储结构的示意图;
图4示出了根据本发明一个实施例的数据处理方法400的流程图;
图5示出了根据本发明一个实施例的数据比较运算的示意图;
图6示出了根据本发明一个实施例的数据的绝对值相加的示意图;
图7示出了根据本发明一个实施例的数据的绝对值相减的示意图;
图8示出了根据本发明一个实施例的数据相乘的示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的计算设备100的结构框图。需要说明的是,图1所示的计算设备100仅为一个示例,在实践中,用于实施本发明的数据存储和处理方法的计算设备可以是任意型号的设备,其硬件配置情况可以与图1所示的计算设备100相同,也可以与图1所示的计算设备100不同。实践中用于实施本发明的数据存储和处理方法的计算设备可以对图1所示的计算设备100的硬件组件进行增加或删减,本发明对计算设备的具体硬件配置情况不做限制。
如图1所示,在基本的配置102中,计算设备100典型地包括系统存储器106和一个或者多个处理器104。存储器总线108可以用于在处理器104和系统存储器106之间的通信。
取决于期望的配置,处理器104可以是任何类型的处理,包括但不限于:微处理器(μP)、微控制器(μC)、数字信息处理器(DSP)或者它们的任何组合。处理器104可以包括诸如一级高速缓存110和二级高速缓存112之类的一个或者多个级别的高速缓存、处理器核心114和寄存器116。示例的处理器核心114可以包括运算逻辑单元(ALU)、浮点数单元(FPU)、数字信号处理核心(DSP核心)或者它们的任何组合。示例的存储器控制器118可以与处理器104一起使用,或者在一些实现中,存储器控制器118可以是处理器104的一个内部部分。
取决于期望的配置,系统存储器106可以是任意类型的存储器,包括但不限于:易失性存储器(诸如RAM)、非易失性存储器(诸如ROM、闪存等)或者它们的任何组合。计算设备中的物理内存通常指的是易失性存储器RAM,磁盘中的数据需要加载至物理内存中才能够被处理器104读取。系统存储器106可以包括操作系统120、一个或者多个应用122以及程序数据124。在一些实施方式中,应用122可以布置为在操作系统上由一个或多个处理器104利用程序数据124执行指令。操作系统120例如可以是Linux、Windows等,其包括用于处理基本系统服务以及执行依赖于硬件的任务的程序指令。应用122包括用于实现各种用户期望的功能的程序指令,应用122例如可以是浏览器、即时通讯软件、软件开发工具(例如集成开发环境IDE、编译器等)等,但不限于此。当应用122被安装到计算设备100中时,可以向操作系统120添加驱动模块。
在计算设备100启动运行时,处理器104会从存储器106中读取操作系统120的程序指令并执行。应用122运行在操作系统120之上,利用操作系统120以及底层硬件提供的接口来实现各种用户期望的功能。当用户启动应用122时,应用122会加载至存储器106中,处理器104从存储器106中读取并执行应用122的程序指令。
计算设备100还包括储存设备132,储存设备132包括可移除储存器136和不可移除储存器138,可移除储存器136和不可移除储存器138均与储存接口总线134连接。
计算设备100还可以包括有助于从各种接口设备(例如,输出设备142、外设接口144和通信设备146)到基本配置102经由总线/接口控制器130的通信的接口总线140。示例的输出设备142包括图形处理单元148和音频处理单元150。它们可以被配置为有助于经由一个或者多个A/V端口152与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外设接口144可以包括串行接口控制器154和并行接口控制器156,它们可以被配置为有助于经由一个或者多个I/O端口158和诸如输入设备(例如,键盘、鼠标、笔、语音输入设备、触摸输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备146可以包括网络控制器160,其可以被布置为便于经由一个或者多个通信端口164与一个或者多个其他计算设备162通过网络通信链路的通信。
网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块,并且可以包括任何信息递送介质。“调制数据信号”可以这样的信号,它的数据集中的一个或者多个或者它的改变可以在信号中编码信息的方式进行。作为非限制性的示例,通信介质可以包括诸如有线网络或者专线网络之类的有线介质,以及诸如声音、射频(RF)、微波、红外(IR)或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。
在根据本发明的计算设备100中,应用122包括用于执行本发明的数据存储方法200和处理方法400的指令,该指令可以指示处理器104执行本发明的数据存储方法和处理方法。本领域技术人员可以理解,除了用于执行数据存储方法200和处理方法400的指令之外,应用122还可以包括用于实现其他功能的其他应用126。
当一个数据非常大,超出计算机中所有基本数据类型能表示的范围时(例如一个100位的10进制数),将这个数据称之为大数。对这种大数进行的运算,称之为大数运算。
大数超过了计算机中基本数据类型所能表示的范围,因此在计算机中无法将其直接存储。针对于此,现有技术多采用字符串的方式对大数进行存储。但是,当采用字符串的方式存储大数时,如果对大数进行运算,需要首先对大数进行解析以确定大数的符号、位数和实际数值,然后再对大数进行相应的运算处理。显然,当采用字符串的方式对大数进行存储时,每次进行大数运算都需要预先解析大数,从会而降低运算效率。
为了解决上述问题,本发明提出了一种数据存储方法。接收到一个待存储大数后,首先获取其位宽和符号。然后,将大数的数值存储在内存的一段连续的存储空间中。最后,将存储大数数值的内存的起始地址、大数的位宽和符号存储在内存的另一段连续的存储空间中。这样,对大数进行运算时,不再需要对大数进行解析处理,从而提高了大数运算的效率。
图2示出了根据本发明一个实施例的数据存储方法200的流程图,方法200适于在计算设备(例如图1所示的计算设备100)中执行。如图2所示,该方法200始于步骤S210。
在步骤S210中,接收待存储数据对象,获取待存储数据对象的数据位宽和数据符号。其中,待存储数据对象包括大数,大数是指超过所述计算设备的CPU架构中单个寄存器所能表示的最大数值的数。当接收到待存储的数据(即待存储数据对象)时,计算设备先判断待存储数据是否超过了计算设备的CPU架构中单个寄存器所能表示的最大数值。如果超过,计算设备将这个待存储数据认定为大数,并读取这个大数的数据位宽和数据符号。根据本发明的一个实施例,设定数值0表示数据的符号是正数,数值1表示数据的符号是负数。在具体的实施例中,本领域的技术人员可以根据实际需要对数据的符号表示方式进行设定,在此不做具体限定。
随后进入步骤S220,根据待存储数据对象的数据位宽,将待存储数据对象的绝对值存入内存,并获取待存储数据对象的数据起始地址,数据起始地址为待存储数据对象的绝对值在内存中的起始地址。具体地,根据待存储数据的位宽(即数据位宽),确定存储该数据所需占用的存储空间的大小。然后,在内存中为其分配一段连续的存储空间,并将待存储数据的绝对值存储到这段内存(即,这段内存只存储待存储数据的数值)。同时,获取存储有待存储数据的绝对值的这段内存的起始地址。其中,将待存储数据的绝对值存入内存时,可以按照由高位到低位的顺序依次存入内存,也可以按照由低位到高位的顺序依次存入内存。对于存储一个数据的绝对值的具体方式,在此不做限定。在具体的实施例中,本领域的技术人员可以根据实际需要进行设定。
随后进入步骤S230,将待存储数据对象的结构信息存入内存,并记录存储结构信息的起始地址,以便根据结构信息获取数据对象进行运算,且在运算过程中以N位数字为一组进行运算,其中,结构信息包括待存储数据对象的数据起始地址、数据位宽和数据符号,N为计算设备的处理器中向量寄存器的位宽。
根据本发明的一个实施例,将待存储数据对象的结构信息存入内存包括:首先,确定存储待存储数据对象的数据起始地址、数据位宽和数据符号各需占用的字节数,以及存储待存储数据对象的数据起始地址、数据位宽和数据符号的顺序。然后,根据确定好的存储待存储数据对象的数据起始地址、数据位宽和数据符号各占用的字节数以及顺序,将待存储数据对象的结构信息存入内存。
作为一个示例,存储待存储数据对象的数据起始地址、数据位宽、数据符号各需w个字节,且存储在内存中的先后顺序为待存储数据对象的数据起始地址、数据位宽和数据符号。当获取到待存储数据对象的数据起始地址、数据位宽和数据符号后,计算设备在内存中为其分配连续的3w个字节的存储空间,并将待存储数据对象的数据起始地址、数据位宽和数据符号依次存入这3w个字节中。同时,记录这3w个字节中第一个字节的起始地址,即结构信息在内存中的起始地址,具体的存储结构可参见图3。这样,当对此数据进行处理时,可以通过这3w个字节的起始地址先获取该数据对象的数据起始地址、数据位宽和数据符号。然后,再根据数据对象的数据起始地址获取该数据对象的绝对值。
根据本发明的数据存储方法对大数进行存储,当对大数进行处理时,可以根据存储待存储数据的结构信息的起始地址直接提取大数的位宽、符号和数值。不需要先对大数进行解析处理,再取用大数的符号、位数和实际数值。因此,利用本发明的数据存储方法对大数进行存储,能够提高大数的处理效率。
当对大数进行运算处理时,为了进一步地提高效率,本发明提出在利用上述方法对大数进行存储的基础上,再使用单指令多数据流指令(Single Instruction MultipleData,SIMD)对大数进行运算。
SIMD是能够复制多个操作数,并把它们打包在大型寄存器的一组指令集。简单来讲,就是多个同样的指令同时执行。以加法为例,单指令单数据的CPU对加法指令进行译码后,执行部件先访问内存取得第一个操作数,之后再一次访问内存取得第二个操作数,随后才进行求和运算。而在SIMD型的CPU中,指令译码后几个执行部件同时访问内存,一次性获得所有操作数进行运算。即,用单条SIMD指令能够完成之前多条单指令单数据流指令的执行内容,从而可以提高程序运行的效率。其中,SIMD指令的操作源和目标是向量寄存器。
目前在使用SIMD指令对数据进行运算时,数据长度一般选取为32*4=128位,即一个SIMD指令并行处理4个长度为32位的数据。同样以加法为例进行说明,使用SIMD指令对数据d和数据f进行相加。指令译码后,一次性获得数据d和数据f的低128位,并通过并行相加4组长度为32位的数据,来完成数据d和数据f的低128位的相加。具体地,假设d1和f1分别为数据d和f的第1至32位,d2和f2分别为数据d和f的第33至64位,d3和f3分别为数据d和f的第65至96位,d4和f4分别为数据d和f的第97至128位。在获得数据d和数据f的低128位后,d1和f1、d2和f2、d3和f3、d4和f4这4组数据同时相加,从而获得数据d和数据f的低128位相加的结果。接着再从数据d和数据f中提取下一组数据(128位)进行相加,直至数据d和数据f相加完成。
图4示出了根据本发明一个实施例的数据处理方法400的流程图,方法400适于在计算设备(例如图1所示的计算设备100)中执行。计算设备的内存中按照预定存储结构存储有数值型的数据对象,预定存储结构的结构信息包括数据对象的数据起始地址、数据位宽和数据符号,数据起始地址为数据对象的绝对值在内存中的起始地址,数据对象包括待处理的第一数据对象和第二数据对象。其中,第一数据对象和第二数据对象可以为密码学领域中的数据,例如密码数据;可以为天气预测领域中的数据,例如温度数据;还可以为天文学领域中的数据,例如体积数据、面积数据等。如图4所示,该方法400始于步骤S410。
在步骤S410中,获取存储第一数据对象的结构信息的第一起始地址和存储第二数据对象的结构信息的第二起始地址。在该实施例中,第一数据对象和第二数据对象基于本发明的数据存储方法200进行存储,因此可以获取到存储有第一数据对象的结构信息的内存的第一起始地址,以及存储有第二数据对象的结构信息的内存的起始地址。其中,第一数据对象的结构信息包括第一数据对象的数据起始地址、数据位宽和数据符号。第二数据对象的结构信息包括第二数据对象的数据起始地址、数据位宽和数据符号。
随后进入步骤S420,根据第一起始地址获取第一数据对象的数据符号,根据第二起始地址获取第二数据对象的数据符号。具体地,获取到第一起始地址之后,再根据内存中存储第一数据对象的数据起始地址、数据位宽和数据符号的先后顺序,以及存储第一数据对象的数据起始地址、数据位宽和数据符号各占用的字节数,获取第一数据对象的数据符号。基于同样的方法获取第二数据对象的符号,在此不再赘述。
随后进入步骤S430,至少基于第一数据对象和第二数据对象的数据符号,使用SIMD指令对第一数据对象和第二数据对象进行运算,运算包括比较运算、加法运算、减法运算和乘法运算中至少之一,其中,在进行加法运算、减法运算或乘法运算时,以N位数字为一组进行运算,N为计算设备的处理器中向量寄存器的位宽。
根据本发明的一个实施例,对第一数据对象和第二数据对象进行比较运算,具体可参见图5。其中,a和b为两个待比较的数据,即第一数据对象和第二数据对象。a(0)代表第一数据对象a的第1位,b(0)代表第二数据对象b的第1位。a(n-1)代表第一数据对象a的第n位,b(n-1)代表第二数据对象b的第n位。H代表高位,L代表低位。在该实施例中使用比较指令SIMD:VEQ对第一数据对象a和第二数据对象b进行比较。具体包括如下步骤:
判断第一数据对象和第二数据对象的数据符号是否相同。如果第一数据对象和第二数据对象的数据符号相异,则第一数据对象和第二数据对象中一个为正数,一个为负数。显然,正数大于负数,得出第一数据对象和第二数据对象的比较结果。
如果第一数据对象和第二数据对象的数据符号相同,根据第一起始地址,获取第一数据对象的数据位宽,根据第二起始地址,获取第二数据对象的数据位宽。判断第一数据对象和第二数据对象的数据位宽是否相同。
如果第一数据对象和第二数据对象的数据位宽不同,结合第一数据对象和第二数据对象的数据符号,对第一数据对象和第二数据对象进行比较。若第一数据对象和第二数据对象的数据符号为正号,第一数据对象和第二数据对象中位宽大者,其数据大。若第一数据对象和第二数据对象的数据符号为负号,第一数据对象和第二数据对象中位宽小者,其数据大。例如,第一数据对象和第二数据对象的数据符号为负号,第一数据对象的数据位宽小于第二数据对象的数据位宽,则第一数据对象大于第二数据对象。
如果第一数据对象和第二数据对象的数据位宽相同,根据第一起始地址,获取第一数据对象的数据起始地址,根据第二起始地址,获取第二数据对象的数据起始地址。
根据第一数据对象的数据起始地址和第二数据对象的数据起始地址,以N位数字为一组,从高位到低位分别依次提取第一数据对象的绝对值和第二数据对象的绝对值中的数据,每从第一数据对象的绝对值和第二数据对象的绝对值中提取一组数据,使用SIMD指令进行比较运算,直至获得第一数据对象的绝对值和第二数据对象的绝对值的比较结果。
在该实施例中,首先,根据第一数据对象的数据起始地址,从最高位开始提取第一数据对象的绝对值中的第一组数据a(0)…a(n-1),并存入CPU中的向量寄存器。根据第二数据对象的数据起始地址,从最高位开始提取第二数据对象的绝对值中的第一组数据b(0)…b(n-1),并存入CPU中的向量寄存器。其中,第一组数据a(0)…a(n-1)和第一组数据b(0)…b(n-1)的位宽与CPU中的向量寄存器的位宽相同,例如可以是128位。需要说明的是,对于从第一数据对象的绝对值和第二数据对象的绝对值中提取出的第一组数据的位宽,在此不做具体限定。在具体的实施例中,本领域的技术人员可以根据实际需要进行设定。
然后,将从第一数据对象的绝对值中提取出的第一组数据a(0)…a(n-1)和从第二数据对象的绝对值中提取出的第一组数据b(0)…b(n-1)进行比较。如果第一组数据a(0)…a(n-1)中的第m位和第一组数据b(0)…b(n-1)中的第m位相等,用数字0表示,如果不相等,用数字1表示。这样,通过对第一组数据a(0)…a(n-1)和第一组数据b(0)…b(n-1)进行比较,得到了第一组向量结果。
最后,由高位到低位检查第一组向量结果中的每一位数值。只要第一组向量结果中出现一个非零数值,代表第一组数据a(0)…a(n-1)和第一组数据b(0)…b(n-1)不相等,结束检查。如果第一组数据a(0)…a(n-1)大于第一组数据b(0)…b(n-1),第一数据对象的绝对值大于第二数据对象的绝对值,如果第一组数据a(0)…a(n-1)小于第一组数据b(0)…b(n-1),第一数据对象的绝对值小于第二数据对象的绝对值。
如果第一组向量结果中的每一位数值全部为零,代表第一组数据a(0)…a(n-1)和第一组数据b(0)…b(n-1)相等,则继续从第一数据对象的绝对值和第二数据对象的绝对值中提取下一组数据,并进行比较(比较的方法与第一组数据a(0)…a(n-1)和第一组数据b(0)…b(n-1)的比较方法相同),直至获得第一数据对象的绝对值和第二数据对象的绝对值的比较结果。如果直至遍历完第一数据对象的绝对值和第二数据对象的绝对值中的全部数值,依然未出现一个非零向量结果,则代表第一数据对象的绝对值和第二数据对象的绝对值相等。
获得第一数据对象的绝对值和第二数据对象的绝对值的比较结果之后,结合第一数据对象和第二数据对象的数据符号,确定第一数据对象和第二数据对象比较结果。若第一数据对象和第二数据对象的数据符号为正号,第一数据对象和第二数据对象中绝对值大者对应的数据大。若第一数据对象和第二数据对象的数据符号为负号,第一数据对象和第二数据对象中绝对值小者对应的数据大。将第一数据对象和第二数据对象的比较结果进行存储。
综上,基于本发明的数据存储方法200对大数进行存储,当对大数进行比较处理时,先通过存储大数的结构信息的起始地址获取大数的符号,判断符号是否相同。如果符号不同,直接获得结果。如果符号相同,通过存储大数的结构信息的起始地址获取大数的位宽,对位宽进行比较。如果位宽不同,直接获得结果。如果位宽相同,使用SIMD指令对大数的绝对值进行比较,进而获得大数的比较结果。显然,本发明在对大数进行比较处理时,不再需要对大数进行解析处理,从而提高了大数比较运算的效率。
根据本发明的一个实施例,对第一数据对象和第二数据对象进行加法运算,具体包括如下步骤:
判断第一数据对象和第二数据对象的数据符号是否相同。如果第一数据对象和第二数据对象的数据符号相同,取第一数据对象的数据符号作为第一数据对象和第二数据对象的和的数据符号。由于第一数据对象和第二数据对象的数据符号相同,因此可以选取其中任意一个数据对象的符号作为第一数据对象和第二数据对象的和的符号。
在确定好第一数据对象和第二数据对象的和的数据符号之后,对第一数据对象的绝对值和第二数据对象的绝对值进行相加。
根据第一起始地址,获取第一数据对象的数据起始地址,根据第二起始地址,获取第二数据对象的数据起始地址。
根据第一数据对象的数据起始地址和第二数据对象的数据起始地址,以N位数字为一组,从低位到高位分别依次提取第一数据对象的绝对值和第二数据对象的绝对值中的数据,每从第一数据对象的绝对值和第二数据对象的绝对值中提取一组数据,使用SIMD指令进行加法运算,直至将第一数据对象的绝对值和第二数据对象的绝对值相加完成,获得第一数据对象的绝对值和第二数据对象的绝对值的和。
将第一数据对象的数据符号、第一数据对象的绝对值和第二数据对象的绝对值的和,作为第一数据对象和第二数据对象相加的结果。利用本发明中的数据存储方法200,将第一数据对象和第二数据对象相加的结果进行存储,即按照预定存储结构将第一数据对象和第二数据对象的求和结果存储到内存。
图6示出了根据本发明一个实施例的数据的绝对值相加的示意图。其中,a和b为两个待相加的数据,即第一数据对象和第二数据对象。a(0)代表第一数据对象a的第1位,b(0)代表第二数据对象b的第1位。a(n-1)代表第一数据对象a的第n位,b(n-1)代表第二数据对象b的第n位。H代表高位,L代表低位。在该实施例中使用加法指令SIMD:VADD对第一数据对象a的绝对值和第二数据对象b的绝对值进行相加。具体包括如下步骤:
根据第一起始地址,获取第一数据对象的数据位宽,根据第二起始地址,获取第二数据对象的数据位宽。比较第一数据对象的数据位宽和第二数据对象的数据位宽,并将其中较大的位宽作为基准位宽。例如,如果第一数据对象的数据位宽大于第二数据对象的数据位宽,将第一数据对象的位宽作为基准位宽。
根据第一数据对象的数据起始地址,从最低位开始提取第一数据对象的绝对值中的第一组数据a(0)…a(n-1),并存入CPU中的向量寄存器。根据第二数据对象的数据起始地址,从最低位开始提取第二数据对象的绝对值中的第一组数据b(0)…b(n-1),并存入CPU中的向量寄存器。
将从第一数据对象的绝对值中提取出的第一组数据a(0)…a(n-1)和第二数据对象的绝对值中提取出的第一组数据b(0)…b(n-1)进行相加,将相加的结果保存为和向量。如果第一组数据a(0)…a(n-1)中的第m位和第一组数据b(0)…b(n-1)中的第m位相加时产生了进位(即加法溢出位),用数字1表示,如果第一组数据a(0)…a(n-1)中的第m位和第一组数据b(0)…b(n-1)中的第m位相加时未产生进位,用数字0表示。这样,对数据a(0)…a(n-1)和数据b(0)…b(n-1)进行相加时,还得到一组溢出向量。
检查溢出向量中的每一位数值。只要溢出向量中存在一个非零数值,使用SIMD指令将和向量和溢出向量进行相加,得到一个新的和向量和一个新的溢出向量。重复该步骤,直至最后得到的溢出向量中的每一位数值全部为0。
继续从第一数据对象的绝对值和第二数据对象的绝对值中提取下一组数据,并进行相加,直至从第一数据对象的绝对值中提取出的所有数据的位数达到基准位宽。由于每从第一数据对象的绝对值中提取一组数据,相应地也会从第二数据对象的绝对值中提取一组数据,因此遍历的终止条件还可以设定为从第二数据对象的绝对值中提取出的所有数据的位数达到基准位宽。
当进行最后一次相加时。如果最高位的溢出位为0,将第一数据对象的符号、第一数据对象的绝对值与第二数据对象的绝对值相加的和,作为第一数据对象与第二数据对象相加的结果。其中,第一数据对象与第二数据对象的和的位宽仍为基准位宽。如果最高位的溢出位为1,在第一数据对象的绝对值与第二数据对象的绝对值的和的最高位之前补充一位数值1,并将获得的数据和第一数据对象的符号,作为第一数据对象与第二数据对象相加的结果。这种情况下,第一数据对象与第二数据对象的和的位宽需在基准位宽的基础上加一。按照预定存储结构将第一数据对象和第二数据对象的求和结果存储到内存。
如果第一数据对象和第二数据对象的数据符号不同,比较第一数据对象的绝对值和第二数据对象的绝对值的大小,并取第一数据对象和第二数据对象中绝对值大的数据对象的数据符号,作为第一数据对象和第二数据对象的和的数据符号。其中,使用SIMD指令对第一数据对象的绝对值和第二数据对象的绝对值进行比较,具体的比较方法在上述比较运算的实施例中已经详细公开,在此不再赘述。
将第一数据对象和第二数据对象的加法运算转换为第一数据对象绝对值和第二数据对象的绝对值的减法运算,其中将第一数据对象的绝对值和第二数据对象的绝对值中的较大者作为被减数。
根据第一起始地址,获取第一数据对象的数据起始地址,根据第二起始地址,获取第二数据对象的数据起始地址。
根据第一数据对象的数据起始地址和第二数据对象的数据起始地址,以N位数字为一组,从低位到高位分别依次提取第一数据对象的绝对值和第二数据对象的绝对值中的数据,每从第一数据对象的绝对值和第二数据对象的绝对值中提取一组数据,使用SIMD指令进行减法运算,直至将第一数据对象的绝对值和第二数据对象的绝对值相减完成,获得第一数据对象的绝对值和第二数据对象的绝对值的差。
将获得的第一数据对象和第二数据对象的和的符号、第一数据对象的绝对值和第二数据对象的绝对值的差,作为第一数据对象与第二数据对象的相加的结果。按照预定存储结构将第一数据对象和第二数据对象的求和结果存储到内存。
作为一个示例,第一数据对象为正数,第二数据对象为负数,且第一数据对象的绝对值大于第二数据对象的绝对值。由于第一数据对象的绝对值大于第二数据对象的绝对值,则将第一数据对象的数据符号作为第一数据对象和第二数据对象的和的符号,即第一数据对象和第二数据对象的和的符号为正号。并且,将第一数据对象与第二数据对象的加法运算转换为第一数据对象的绝对值与第二数据对象的绝对值的减法运算,其中第一数据对象的绝对值作为被减数,即第一数据对象的绝对值减去第二数据对象的绝对值。
第一数据对象的绝对值减去第二数据对象的绝对值的步骤可参见图7。其中,a和b为两个待处理的数据,即第一数据对象和第二数据对象。a(0)代表第一数据对象a的第1位,b(0)代表第二数据对象b的第1位。a(n-1)代表第一数据对象a的第n位,b(n-1)代表第二数据对象b的第n位。H代表高位,L代表低位。具体地,使用减法指令SIMD:VSUB对第一数据对象a的绝对值和第二数据对象b的绝对值进行相减,步骤如下:
根据第一起始地址,获取第一数据对象的数据位宽,并将第一数据对象的数据位宽作为基准位宽。
根据第一数据对象的数据起始地址,从最低位开始提取第一数据对象的绝对值中的第一组数据a(0)…a(n-1),并存入CPU中的向量寄存器。根据第二数据对象的数据起始地址,从最低位开始提取第二数据对象的绝对值中的第一组数据b(0)…b(n-1),并存入CPU中的向量寄存器。
将从第一数据对象的绝对值中提取出的第一组数据a(0)…a(n-1)和第二数据对象的绝对值中提取出的第一组数据b(0)…b(n-1)进行相减,将相减的结果保存为差向量。如果第一组数据a(0)…a(n-1)中的第m位和第一组数据b(0)…b(n-1)中的第m位相减时产生了借位(即减法溢出位),用数字1表示,如果第一组数据a(0)…a(n-1)中的第m位和第一组数据b(0)…b(n-1)中的第m位相减时未产生借位,用数字0表示。这样,对第一组数据a(0)…a(n-1)和第一组数据b(0)…b(n-1)进行相减时,还得到一组溢出向量。
检查溢出向量中的每一位数值。只要溢出向量中存在一个非零数值,使用SIMD指令将差向量和溢出向量进行相减(差向量减去溢出向量),得到一个新的差向量和一个新的溢出向量。重复该步骤,直至最后得到的溢出向量中的每一位数值全部为0。
继续从第一数据对象的绝对值和第二数据对象的绝对值中提取下一组数据,并进行相减,直至从第一数据对象的绝对值中提取出的所有数据的位数达到基准位宽。最后,得到第一数据对象的绝对值与第二数据对象的绝对值的差,并计算第一数据对象的绝对值与第二数据对象的绝对值的差的位宽。
将第一数据对象的符号、第一数据对象的绝对值与第二数据对象的绝对值的差,作为第一数据对象和第二数据对象相加的结果。并利用本发明中的数据存储方法200将第一数据对象和第二数据对象相加的结果进行存储。
根据本发明的一个实施例,对第一数据对象和第二数据对象进行减法运算,具体包括如下步骤:
判断第一数据对象和第二数据对象的数据符号是否相同。
如果第一数据对象和第二数据对象的数据符号相异,将第一数据对象和第二数据对象的减法运算转换为第一数据对象绝对值和第二数据对象的绝对值的加法运算,并取被减数的符号作为第一数据对象和第二数据对象的差的数据符号。例如,第一数据对象为正数,第二数据对象为负数,且第一数据对象为被减数。将第一数据对象与第二数据对象的减法运算转换为第一数据对象的绝对值与第二数据对象的绝对值的加法运算,并将第一数据对象的数据符号(正号)作为第一数据对象与第二数据对象的差的符号。
根据第一起始地址,获取第一数据对象的数据起始地址,根据第二起始地址,获取第二数据对象的数据起始地址。
根据第一数据对象的数据起始地址和第二数据对象的数据起始地址,以N位数字为一组,从低位到高位分别依次提取第一数据对象的绝对值和第二数据对象的绝对值中的数据,每从第一数据对象的绝对值和第二数据对象的绝对值中提取一组数据,使用SIMD指令进行加法运算,直至将第一数据对象的绝对值和第二数据对象的绝对值相加完成,获得第一数据对象的绝对值和第二数据对象的绝对值的和。其中,第一数据对象的绝对值和第二数据对象的绝对值进行相加的具体方法,在上述第一数据对象和第二数据对象进行加法运算的实施例中已经详细公开,在此不再赘述。
将获得的第一数据对象和第二数据对象的差的符号、第一数据对象的绝对值和第二数据对象的绝对值的和,作为第一数据对象与第二数据对象相减的差。按照预定存储结构将第一数据对象和第二数据对象的求差结果存储到内存。
如果第一数据对象和第二数据对象的数据符号相同,比较第一数据对象和第二数据对象的大小,确定第一数据对象和第二数据对象的差的数据符号。如果被减数大于减数,第一数据对象和第二数据对象的差的符号为正号。如果被减数小于减数,第一数据对象和第二数据对象的差的符号为负号。其中,使用SIMD指令对第一数据对象和第二数据对象进行比较,具体的比较方法在上述比较运算的实施例中已经详细公开,在此不再赘述。
将第一数据对象和第二数据对象的减法运算转换为第一数据对象的绝对值和第二数据对象的绝对值的减法运算,其中将第一数据对象的绝对值和第二数据对象的绝对值中的较大者作为被减数。例如,第一数据对象的绝对值小于第二数据对象的绝对值,将第一数据对象与第二数据对象的减法运算转换为第一数据对象的绝对值与第二数据对象的绝对值的减法运算,其中第二数据对象的绝对值作为被减数,即第二数据对象的绝对值减去第一数据对象的绝对值。
根据第一起始地址,获取第一数据对象的数据起始地址,根据第二起始地址,获取第二数据对象的数据起始地址。
根据第一数据对象的数据起始地址和第二数据对象的数据起始地址,以N位数字为一组,从低位到高位分别依次提取第一数据对象的绝对值和第二数据对象的绝对值中的数据,每从第一数据对象的绝对值和第二数据对象的绝对值中提取一组数据,使用SIMD指令进行减法运算,直至将第一数据对象的绝对值和第二数据对象的绝对值相减完成,获得第一数据对象的绝对值和第二数据对象的绝对值的差。其中,第一数据对象的绝对值和第二数据对象的绝对值进行相减的具体方法,在上述第一数据对象和第二数据对象进行加法运算的实施例中已经详细公开,在此不再赘述。
将获得的第一数据对象和第二数据对象的差的符号、第一数据对象的绝对值和第二数据对象的绝对值的差,作为第一数据对象与第二数据对象相减的差。利用本发明中的数据存储方法200将第一数据对象与第二数据对象的差进行存储。
显然,当同号大数进行相加或异号大数进行相减时,先通过存储大数的结构信息的起始地址获取大数的符号。然后,根据参与运算的大数的符号和运算符,确定运算结果的符号。最后,将同号大数进行相加或异号大数进行相减的运算转换为大数的绝对值的加法运算,并使用SIMD指令对大数的绝对值进行相加,获得运算结果。当异号大数进行相加或同号大数进行相减时,先通过存储大数的结构信息的起始地址获取大数的符号和大数的数据起始地址,并使用SIMD指令对大数的绝对值进行比较。然后根据比较结果、参与运算的大数的符号以及运算符,确定运算结果的符号。最后,将异号大数进行相加或同号大数进行相减的运算转换为大数的绝对值的减法运算(被减数的绝对值大于减数的绝对值),并使用SIMD指令对大数的绝对值进行相减,获得运算结果。
综上,基于本发明的数据存储方法200对大数进行存储,当对大数进行加法或减法运算时,先根据大数的符号和运算符确定运算结果的符号。然后,将大数的加法或减法运算转换为大数的绝对值的加法或减法运算。最后,再使用SIMD指令对大数的绝对值进行加法或减法运算,获得运算结果。因此,本发明在对大数进行加法和减法处理时,未对大数进行解析处理,并使用了SIMD指令对大数进行加法和减法运算,从而提高了运算效率。
根据本发明的一个实施例,对第一数据对象和第二数据对象进行乘运算,具体包括如下步骤:
根据第一数据对象和第二数据对象的数据符号,确定第一数据对象和第二数据对象的乘积的数据符号。如果第一数据对象和第二数据对象的数据符号相同,第一数据对象和第二数据对象的乘积的符号为正号。如果第一数据对象和第二数据对象的数据符号相异,第一数据对象和第二数据对象的乘积的符号为负号。
在确定好第一数据对象和第二数据对象的乘积的符号之后,对第一数据对象的绝对值和第二数据对象的绝对值进行相乘。
根据第一起始地址,获取第一数据对象的数据起始地址,根据第二起始地址,获取第二数据对象的数据起始地址。
根据第一数据对象的数据起始地址,从低位到高位依次提取第一数据对象的绝对值中的每位数值,直至将第一数据对象的绝对值中的数值全部提取完。
每从第一数据对象的绝对值中提取一位数值i,根据第二数据对象的数据起始地址,以N位数字为一组,从低位到高位依次提取第二数据对象的绝对值中的数据,每从第二数据对象的绝对值中提取一组数据,使用SIMD指令将该组数据与数值i进行乘法运算,直至将第二数据对象的绝对值与数值i相乘完成,获得第二数据对象的绝对值和数值i的乘积。
使用SIMD指令,将第一数据对象的绝对值中的每位数值与第二数据对象的绝对值的乘积进行对位相加,获得第一数据对象的绝对值和第二数据对象的绝对值的乘积。其中,将第一数据对象的绝对值中的每位数值与第二数据对象的绝对值的乘积进行对位相加是指,将第一数据对象的绝对值中的每位数值与第二数据对象的绝对值的乘积的相同数位上的数值进行相加。也就是说,先将各乘积的相同数位的数值对齐,然后再对各乘积进行相加。
例如,第一数据对象的绝对值中最低位数值(即个位)与第二数据对象的绝对值的乘积的最低位为个位。第一数据对象的绝对值中次低位数值(即十位)与第二数据对象的绝对值的乘积的最低位为十位。因此,在将第一数据对象的绝对值中最低位数值与第二数据对象的绝对值的乘积、第一数据对象的绝对值中次低位数值与第二数据对象的绝对值的乘积进行相加时,首先将第一数据对象的绝对值中次低位数值与第二数据对象的绝对值的乘积的最低位,和第一数据对象的绝对值中最低位数值与第二数据对象的绝对值的乘积的十位对齐,然后再进行相加。
将获得的第一数据对象和第二数据对象的乘积的符号、第一数据对象的绝对值和第二数据对象的绝对值的乘积,作为第一数据对象与第二数据对象相乘的结果。利用本发明中的数据存储方法200将第一数据对象与第二数据对象相乘的结果进行存储。
图8示出了根据本发明一个实施例的数据相乘的示意图。其中,a和b为两个待相乘的数据,即第一数据对象和第二数据对象。a(0)代表第一数据对象a的第1位,b(0)代表第二数据对象b的第1位。a(n-1)代表第一数据对象a的第n位,b(n-1)代表第二数据对象b的第n位。H代表高位,L代表低位。在该实施例中使用乘法指令SIMD:VMUL对第一数据对象a和第二数据对象b进行相乘,具体包括如下步骤:
根据第一数据对象和第二数据对象的符号,确定二者乘积的符号。
根据第一起始地址,获取第一数据对象的数据起始地址。根据第一数据对象的数据起始地址,从最低位开始提取第一数据对象的绝对值中的第一位数值a(0),并将数值a(0)存入CPU中的一个临时向量寄存器。
根据第二起始地址,获取第二数据对象的数据起始地址。根据第二数据对象的数据起始地址,从最低位开始提取第二数据对象的绝对值中的第一组数据b(0)…b(n-1),并将第一组数据b(0)…b(n-1)存入CPU中的一个临时向量寄存器。
使用SIMD指令,将从第二数据对象的绝对值中提取出的第一组数据b(0)…b(n-1)与数值a(0)进行相乘。
继续从第二数据对象的绝对值中提取下一组数据,并与数值a(0)进行相乘,直至从第二数据对象的绝对值中提取出的所有数据的位数达到第二数据对象的位宽,得到第二数据对象的绝对值与数值a(0)的乘积,即第二数据对象的绝对值与第一数据对象的绝对值中最低位数值的乘积。将第二数据对象的绝对值与数值a(0)的乘积存入CPU中的一个临时向量寄存器。
继续从第一数据对象的绝对值中提取下一位数据,并与第二数据对象的绝对值进行相乘,直至从第一数据对象的绝对值中提取出的所有数据的位数达到第一数据对象的位宽,得到第二数据对象的绝对值与第一数据对象的绝对值中的每一位数值的乘积。将第二数据对象的绝对值与第一数据对象的绝对值中的每一位数值的乘积都存入CPU中的一个临时向量寄存器。其中,该步骤中的第一数据对象的绝对值中的每一位数值与第二数据对象的绝对值相乘的方法,与数值a(0)和第二数据对象的绝对值相乘的方法相同,在此不再赘述。
使用SIMD指令,将第一数据对象的绝对值中的每一位数值与第二数据对象的绝对值的乘积进行对位相加(参见图8中向量积0、向量积1相加的示意图),获得第一数据对象的绝对值和第二数据对象的绝对值的乘积,并计算第一数据对象的绝对值和第二数据对象的绝对值的乘积的位宽。其中,使用SIMD指令,将第一数据对象的绝对值中的每一位数值与第二数据对象的绝对值的乘积进行对位相加的方法,在上述加法运算的实施例中已经详细公开,在此不再赘述。
将获得的第一数据对象和第二数据对象的乘积的符号、第一数据对象的绝对值和第二数据对象的绝对值的乘积,作为第一数据对象与第二数据对象的乘积。利用本发明中的数据存储方法200将第一数据对象与第二数据对象相乘的结果进行存储。
根据本发明的一个实施例,大数乘法运算的示例性代码如下:
//按照预定存储结构存储大数
Figure BDA0003008018910000241
Figure BDA0003008018910000251
Figure BDA0003008018910000261
综上,基于本发明的数据存储方法200对大数进行存储,当对大数进行乘法运算时,先根据大数的符号确定运算结果的符号。然后,使用SIMD指令对大数的绝对值进行相乘,获得运算结果。因此,本发明在对大数进行乘法运算时,未对大数进行解析处理,并使用SIMD指令对大数进行乘法运算,从而提高了乘法运算的效率。
根据本发明的数据存储方法,接收到一个待存储大数,首先获取其位宽和符号。然后,将大数的数值存储在内存的一段连续的存储空间中。最后,将存储大数数值的内存的起始地址、大数的位宽和符号存储在内存的另一段连续的存储空间中。这样,在对大数进行处理时,可以直接从内存中提取大数的符号、位宽以及实际数值,不再需要对大数进行解析处理,从而提高了处理大数的效率。在此基础上,本发明使用SIMD指令对大数进行处理,进一步提高了处理大数的效率。
这里描述的各种技术可结合硬件或软件,或者它们的组合一起实现。从而,本发明的方法和设备,或者本发明的方法和设备的某些方面或部分可采取嵌入有形媒介,例如可移动硬盘、U盘、软盘、CD-ROM或者其它任意机器可读的存储介质中的程序代码(即指令)的形式,其中当程序被载入诸如计算机之类的机器,并被所述机器执行时,所述机器变成实践本发明的设备。
在程序代码在可编程计算机上执行的情况下,计算设备一般包括处理器、处理器可读的存储介质(包括易失性和非易失性存储器和/或存储元件),至少一个输入装置,和至少一个输出装置。其中,存储器被配置用于存储程序代码;处理器被配置用于根据该存储器中存储的所述程序代码中的指令,执行本发明的文档加载方法。
以示例而非限制的方式,可读介质包括可读存储介质和通信介质。可读存储介质存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息。通信介质一般以诸如载波或其它传输机制等已调制数据信号来体现计算机可读指令、数据结构、程序模块或其它数据,并且包括任何信息传递介质。以上的任一种的组合也包括在可读介质的范围之内。
在此处所提供的说明书中,算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与本发明的示例一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
此外,所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。
如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。

Claims (10)

1.一种数据存储方法,适于在计算设备中执行,所述方法包括:
接收待存储数据对象,获取所述待存储数据对象的数据位宽和数据符号;
根据所述待存储数据对象的数据位宽,将所述待存储数据对象的绝对值存入内存,并获取所述待存储数据对象的数据起始地址,所述数据起始地址为所述待存储数据对象的绝对值在内存中的起始地址;
将所述待存储数据对象的结构信息存入内存,并记录存储所述结构信息的起始地址,以便根据所述结构信息获取数据对象进行运算,且在运算过程中以N位数字为一组进行运算,其中,所述结构信息包括所述待存储数据对象的数据起始地址、数据位宽和数据符号,所述N为计算设备的处理器中向量寄存器的位宽。
2.如权利要求1所述的方法,其中,所述将所述待存储数据对象的结构信息存入内存的步骤,包括:
确定存储所述待存储数据对象的数据起始地址、数据位宽和数据符号各需占用的字节数,以及存储所述待存储数据对象的数据起始地址、数据位宽和数据符号的顺序;
根据确定好的存储所述待存储数据对象的数据起始地址、数据位宽和数据符号各占用的字节数以及顺序,将所述待存储数据对象的结构信息存入内存。
3.如权利要求1或2所述的方法,其中,所述待存储数据对象包括大数,所述大数是指超过所述计算设备的CPU架构中单个寄存器所能表示的最大数值的数。
4.一种数据处理方法,适于在计算设备中执行,所述计算设备的内存中按照如权利要求1-3中任一项所述方法存储有数值型的数据对象,所述数据对象包括待处理的第一数据对象和第二数据对象,所述方法包括:
获取存储第一数据对象的结构信息的第一起始地址和存储第二数据对象的结构信息的第二起始地址;
根据所述第一起始地址获取所述第一数据对象的数据符号,根据所述第二起始地址获取所述第二数据对象的数据符号;
至少基于所述第一数据对象和所述第二数据对象的数据符号,使用SIMD指令对所述第一数据对象和所述第二数据对象进行运算,所述运算包括比较运算、加法运算、减法运算和乘法运算中至少之一,其中,在进行加法运算、减法运算或乘法运算时,以N位数字为一组进行运算,所述N为计算设备的处理器中向量寄存器的位宽。
5.如权利要求4所述的方法,其中,对第一数据对象和第二数据对象进行比较运算的步骤,包括:
判断所述第一数据对象和所述第二数据对象的数据符号是否相同;
如果所述第一数据对象和所述第二数据对象的数据符号相同,根据所述第一起始地址,获取所述第一数据对象的数据位宽,根据所述第二起始地址,获取所述第二数据对象的数据位宽;
如果所述第一数据对象和所述第二数据对象的数据位宽相同,根据所述第一起始地址,获取所述第一数据对象的数据起始地址,根据所述第二起始地址,获取所述第二数据对象的数据起始地址;
根据所述第一数据对象和所述第二数据对象的数据起始地址,以N位数字为一组,从高位到低位分别依次提取所述第一数据对象的绝对值和所述第二数据对象的绝对值中的数据,每从所述第一数据对象的绝对值和所述第二数据对象的绝对值中提取一组数据,使用SIMD指令进行比较运算,直至获得所述第一数据对象的绝对值和所述第二数据对象的绝对值的比较结果。
6.如权利要求5所述的方法,其中,所述对第一数据对象和第二数据对象进行比较运算的步骤,还包括:
如果所述第一数据对象和所述第二数据对象的数据符号相异,确定所述第一数据对象和所述第二数据对象的大小;
如果所述第一数据对象和所述第二数据对象的数据位宽不同,结合所述第一数据对象和所述第二数据对象的数据符号,确定所述第一数据对象和所述第二数据对象的大小。
7.如权利要求4所述的方法,其中,对第一数据对象和第二数据对象进行加法运算的步骤,包括:
判断所述第一数据对象和所述第二数据对象的数据符号是否相同;
如果所述第一数据对象和所述第二数据对象的数据符号相同,取所述第一数据对象的数据符号作为所述第一数据对象和所述第二数据对象的和的数据符号;
根据所述第一起始地址,获取所述第一数据对象的数据起始地址,根据所述第二起始地址,获取所述第二数据对象的数据起始地址;
根据所述第一数据对象和所述第二数据对象的数据起始地址,以N位数字为一组,从低位到高位分别依次提取所述第一数据对象的绝对值和所述第二数据对象的绝对值中的数据,每从所述第一数据对象的绝对值和所述第二数据对象的绝对值中提取一组数据,使用SIMD指令进行加法运算,直至将所述第一数据对象的绝对值和所述第二数据对象的绝对值相加完成,获得所述第一数据对象的绝对值和所述第二数据对象的绝对值的和;
按照所述预定存储结构将所述第一数据对象和所述第二数据对象的求和结果存储到内存。
8.如权利要求7所述的方法,其中,所述对第一数据对象和第二数据对象进行加法运算的步骤,还包括:
如果所述第一数据对象和所述第二数据对象的数据符号不同,比较所述第一数据对象的绝对值和所述第二数据对象的绝对值的大小,并取所述第一数据对象和所述第二数据对象中绝对值大的数据对象的数据符号,作为所述第一数据对象和所述第二数据对象的和的数据符号;
将所述第一数据对象和所述第二数据对象的加法运算转换为所述第一数据对象绝对值和所述第二数据对象的绝对值的减法运算,其中将所述第一数据对象的绝对值和所述第二数据对象的绝对值中的较大者作为被减数;
根据所述第一起始地址,获取所述第一数据对象的数据起始地址,根据所述第二起始地址,获取所述第二数据对象的数据起始地址;
根据所述第一数据对象和所述第二数据对象的数据起始地址,以N位数字为一组,从低位到高位分别依次提取所述第一数据对象的绝对值和所述第二数据对象的绝对值中的数据,每从所述第一数据对象的绝对值和所述第二数据对象的绝对值中提取一组数据,使用SIMD指令进行减法运算,直至将所述第一数据对象的绝对值和所述第二数据对象的绝对值相减完成,获得所述第一数据对象的绝对值和所述第二数据对象的绝对值的差;
按照所述预定存储结构将所述第一数据对象和所述第二数据对象的求和结果存储到内存。
9.一种计算设备,包括:
至少一个处理器;以及
存储器,存储有程序指令,其中,所述程序指令被配置为适于由所述至少一个处理器执行,所述程序指令包括用于执行如权利要求1-8中任一项所述方法的指令。
10.一种存储有程序指令的可读存储介质,当所述程序指令被计算设备读取并执行时,使得所述计算设备执行如权利要求1-8中任一项所述方法。
CN202110367882.5A 2021-01-04 2021-01-04 一种数据存储方法、处理方法、计算设备及可读存储介质 Active CN113064841B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110367882.5A CN113064841B (zh) 2021-01-04 2021-01-04 一种数据存储方法、处理方法、计算设备及可读存储介质

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202110367882.5A CN113064841B (zh) 2021-01-04 2021-01-04 一种数据存储方法、处理方法、计算设备及可读存储介质
CN202110000639.XA CN112328511B (zh) 2021-01-04 2021-01-04 一种数据处理方法、计算设备及可读存储介质

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN202110000639.XA Division CN112328511B (zh) 2021-01-04 2021-01-04 一种数据处理方法、计算设备及可读存储介质

Publications (2)

Publication Number Publication Date
CN113064841A true CN113064841A (zh) 2021-07-02
CN113064841B CN113064841B (zh) 2023-06-06

Family

ID=74302394

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202110367882.5A Active CN113064841B (zh) 2021-01-04 2021-01-04 一种数据存储方法、处理方法、计算设备及可读存储介质
CN202110000639.XA Active CN112328511B (zh) 2021-01-04 2021-01-04 一种数据处理方法、计算设备及可读存储介质

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202110000639.XA Active CN112328511B (zh) 2021-01-04 2021-01-04 一种数据处理方法、计算设备及可读存储介质

Country Status (1)

Country Link
CN (2) CN113064841B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1174353A (zh) * 1996-08-19 1998-02-25 三星电子株式会社 采用多个向量寄存器组的单指令多数据处理方法及其装置
EP1267256A2 (en) * 2001-06-11 2002-12-18 Broadcom Corporation Conditional execution of instructions with multiple destinations
CN103577153A (zh) * 2012-07-28 2014-02-12 王妍丹 一种快速的适用于嵌入式系统的大数求模方法
CN103593159A (zh) * 2012-08-14 2014-02-19 重庆重邮信科通信技术有限公司 一种高效率高精度除法实现方法及装置
CN105701200A (zh) * 2016-01-12 2016-06-22 中国人民大学 一种内存云计算平台上的数据仓库安全olap方法
CN109600795A (zh) * 2017-09-30 2019-04-09 智邦科技股份有限公司 A-msdu子帧的处理方法及无线网络存取装置
CN111752955A (zh) * 2020-06-29 2020-10-09 深圳前海微众银行股份有限公司 数据处理方法、装置、设备及计算机可读存储介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7275148B2 (en) * 2003-09-08 2007-09-25 Freescale Semiconductor, Inc. Data processing system using multiple addressing modes for SIMD operations and method thereof
CN101493760A (zh) * 2008-12-24 2009-07-29 京信通信系统(中国)有限公司 一种高速除法器及其实现高速除法运算的方法
US9424034B2 (en) * 2013-06-28 2016-08-23 Intel Corporation Multiple register memory access instructions, processors, methods, and systems
CN104598197B (zh) * 2015-01-26 2017-05-31 中国科学院自动化研究所 一种浮点倒数和/或平方根倒数运算方法及其装置
CN105808206B (zh) * 2016-03-04 2019-01-08 广州海格通信集团股份有限公司 基于ram实现乘法运算的方法及其系统
CN108874445A (zh) * 2017-10-30 2018-11-23 上海寒武纪信息科技有限公司 神经网络处理器及使用处理器执行向量点积指令的方法
CN108365849B (zh) * 2018-01-10 2021-03-09 东南大学 基于simd指令集的多码率多码长ldpc码解码方法
CN109582231B (zh) * 2018-11-21 2022-03-15 金色熊猫有限公司 数据存储方法、装置、电子设备及存储介质
CN110880038B (zh) * 2019-11-29 2022-07-01 中国科学院自动化研究所 基于fpga的加速卷积计算的系统、卷积神经网络

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1174353A (zh) * 1996-08-19 1998-02-25 三星电子株式会社 采用多个向量寄存器组的单指令多数据处理方法及其装置
EP1267256A2 (en) * 2001-06-11 2002-12-18 Broadcom Corporation Conditional execution of instructions with multiple destinations
CN103577153A (zh) * 2012-07-28 2014-02-12 王妍丹 一种快速的适用于嵌入式系统的大数求模方法
CN103593159A (zh) * 2012-08-14 2014-02-19 重庆重邮信科通信技术有限公司 一种高效率高精度除法实现方法及装置
CN105701200A (zh) * 2016-01-12 2016-06-22 中国人民大学 一种内存云计算平台上的数据仓库安全olap方法
CN109600795A (zh) * 2017-09-30 2019-04-09 智邦科技股份有限公司 A-msdu子帧的处理方法及无线网络存取装置
CN111752955A (zh) * 2020-06-29 2020-10-09 深圳前海微众银行股份有限公司 数据处理方法、装置、设备及计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
谭振江等: ""大数运算的算法描述"", 《吉林师范大学学报(自然科学版)》 *

Also Published As

Publication number Publication date
CN112328511B (zh) 2021-05-04
CN112328511A (zh) 2021-02-05
CN113064841B (zh) 2023-06-06

Similar Documents

Publication Publication Date Title
EP3651017B1 (en) Systems and methods for performing 16-bit floating-point matrix dot product instructions
CN110036368B (zh) 用于执行算术运算以累加浮点数的装置及方法
CN113762490B (zh) 使用列折叠和挤压的稀疏矩阵的矩阵乘法加速
RU2263947C2 (ru) Целочисленное умножение высокого порядка с округлением и сдвигом в архитектуре с одним потоком команд и множеством потоков данных
JP4750157B2 (ja) データを右方向平行シフトマージする方法及び装置
EP3866001B1 (en) Systems and methods for performing 16-bit floating-point vector dot product instructions
EP3719639B1 (en) Systems and methods to perform floating-point addition with selected rounding
US7430578B2 (en) Method and apparatus for performing multiply-add operations on packed byte data
EP3529695B1 (en) Systems, apparatuses, and methods for fused multiply add
JP2024038122A (ja) 行列演算アクセラレータの命令のための装置、方法、およびシステム
EP3623941A2 (en) Systems and methods for performing instructions specifying ternary tile logic operations
WO2004061705A2 (en) Efficient multiplication of small matrices using simd registers
EP3314407B1 (en) Methods, apparatus, instructions and logic to provide vector packed histogram functionality
JP2019197531A (ja) 連鎖タイル演算を実施するためのシステムおよび方法
JP2006107463A (ja) パック・データの乗加算演算を実行する装置
US20210389948A1 (en) Mixed-element-size instruction
US9766886B2 (en) Instruction and logic to provide vector linear interpolation functionality
EP4020169A1 (en) Apparatuses, methods, and systems for 8-bit floating-point matrix dot product instructions
US7644115B2 (en) System and methods for large-radix computer processing
US20050149701A1 (en) Method, apparatus and system for pair-wise minimum and minimum mask instructions
CN112328511B (zh) 一种数据处理方法、计算设备及可读存储介质
EP3716050B1 (en) Using fuzzy-jbit location of floating-point multiply-accumulate results
US20050154773A1 (en) Data processing apparatus and method for performing data processing operations on floating point data elements
CN113724127B (zh) 一种图像矩阵卷积的实现方法、计算设备及储存介质
TW202333041A (zh) 執行浮點運算的系統及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant