CN117931706B - 一种dma传输数据预处理方法、计算子系统及智能计算平台 - Google Patents

一种dma传输数据预处理方法、计算子系统及智能计算平台 Download PDF

Info

Publication number
CN117931706B
CN117931706B CN202410341487.3A CN202410341487A CN117931706B CN 117931706 B CN117931706 B CN 117931706B CN 202410341487 A CN202410341487 A CN 202410341487A CN 117931706 B CN117931706 B CN 117931706B
Authority
CN
China
Prior art keywords
data
target
sparse
target data
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410341487.3A
Other languages
English (en)
Other versions
CN117931706A (zh
Inventor
邓练兵
巩志国
官全龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Qinzhi Technology Research Institute Co ltd
Original Assignee
Guangdong Qinzhi Technology Research Institute Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Qinzhi Technology Research Institute Co ltd filed Critical Guangdong Qinzhi Technology Research Institute Co ltd
Priority to CN202410341487.3A priority Critical patent/CN117931706B/zh
Publication of CN117931706A publication Critical patent/CN117931706A/zh
Application granted granted Critical
Publication of CN117931706B publication Critical patent/CN117931706B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本申请提供了一种DMA传输数据预处理方法、计算子系统及智能计算平台,方法应用于智能计算平台的DMA引擎,智能计算平台还包括存储器和终端设备,包括:在接到终端设备发送的对存储器的数据访问请求时,对数据访问请求对应的第一目标数据进行稀疏性检测。根据稀疏性检测结果将所述第一目标数据分为稀疏数据和非稀疏数据。确定稀疏数据对应的目标压缩算法和非稀疏数据对应的目标编码算法以分别完成对稀疏数据和非稀疏数据的压缩与编码,获取压缩数据和编码数据输入至预设的神经网络模型,用于对压缩数据和编码数据进行排序和合并,输出第二目标数据并发送至终端设备中。进而确保了智能计算平台运行的稳定性,提升DMA引擎与存储器的数据传输的效率。

Description

一种DMA传输数据预处理方法、计算子系统及智能计算平台
技术领域
本申请属于数据处理领域,尤其涉及一种DMA传输数据预处理方法、计算子系统及智能计算平台。
背景技术
当下随着人工智能的飞速发展,功能各异的智能计算平台不断涌现。对智能计算平台内用于运算的中央处理器(Central Processing Unit,CPU)的计算和运行能力的要求也日益增大。智能计算平台的CPU主要用于运行各类深度学习模型。而各类模型的权重张量十分庞大,当深度学习模型大小大于CPU的外部的存储器容量时,绕过CPU的存储限制的一种方式是将模型划分成多个部分并在多个CPU中运行。然而,此类解决方案在成本和各CPU的通信问题上都导致模型运行效果受到影响,导致模型运行存在较长的延迟和较低的吞吐量。
虽然CPU运行深度学习模型使用的权重张量可能很大,但由于许多权重张量是稀疏的,因为许多权重值是零。当下具有在线解压缩单元的直接存储器访问(Direct MemoryAccess,DMA)引擎可以即时地处理、解压缩权重张量。但由于智能计算平台内处理的数据量过于庞大,导致DMA引擎随着数据内容、类型的变化,基于DMA引擎的处理效率不断下降,影响智能计算平台的运行效率。
因此,亟需一种对DMA传输数据预处理方法,以提升DMA引擎与存储器的数据传输的效率。
发明内容
本申请实施例提供了一种DMA传输数据预处理方法、计算子系统及智能计算平台,可以解决传统的通过在DMA引擎中根据预设的解压缩策略和传输参数执行解压缩和数据传输过程中,当智能计算平台内处理的数据量过于庞大时,会导致DMA引擎随着数据内容、类型的变化,基于DMA引擎的处理效率不断下降,影响DMA引擎与存储器的数据传输的效率的问题。
第一方面,本申请实施例提供了一种DMA传输数据预处理方法,应用于智能计算平台的DMA引擎,所述智能计算平台还包括存储器和终端设备;所述方法包括:
在接收到所述终端设备发送的对所述存储器的数据访问请求时,获取所述数据访问请求对应的第一目标数据,对所述第一目标数据进行稀疏性检测,获取所述第一目标数据对应的稀疏性检测结果;
根据所述稀疏性检测结果将所述第一目标数据分为稀疏数据和非稀疏数据,解析所述非稀疏数据获取所述非稀疏数据对应的数据类型;
根据所述稀疏性检测结果确定所述稀疏数据对应的目标压缩算法,根据所述数据类型确定所述非稀疏数据对应的目标编码算法;
根据所述目标压缩算法对所述稀疏数据进行压缩,获取压缩数据;
根据所述目标编码算法对所述非稀疏数据进行编码,获取编码数据;
将所述压缩数据和所述编码数据输入至预设的神经网络模型,所述神经网络模型用于对所述压缩数据和编码数据进行排序和合并,输出第二目标数据;
将所述第二目标数据发送至所述终端设备中。
在一些实施例中,所述对所述第一目标数据进行稀疏性检测,获取所述第一目标数据对应的稀疏性检测结果,包括:将所述第一目标数据输入预设的稀疏性检测模型,所述稀疏性检测模型用于输出所述第一目标数据对应的零元素信息和无用元素信息,根据所述零元素信息和无用元素信息计算所述稀疏性检测结果。
示例性的,所述稀疏性检测模型包括零元素提取网络、无用元素提取网络和结果计算网络;所述将所述第一目标数据输入预设的稀疏性检测模型,包括:将所述第一目标数据输入至所述零元素提取网络,所述零元素提取网络用于获取所述第一目标数据中的零元素和空白元素,以根据所述零元素和空白元素输出所述零元素信息;将所述第一目标数据输入至所述无用元素提取网络,所述无用元素提取网络用于运行所述第一目标数据,将所述第一目标数据在预设时长内未变化的元素确认为无用元素,以根据所述无用元素输出所述无用元素信息;将所述零元素信息和所述无用元素信息输入至所述结果计算网络,所述结果计算网络用于根据所述零元素信息和所述无用元素信息计算所述稀疏性检测结果。
需要说明的是,在一些实施例中,所述将所述零元素信息和所述无用元素信息输入至所述结果计算网络,包括:将所述零元素信息和所述无用元素信息输入至所述结果计算网络,所述结果计算网络采用预设的稀疏性检测公式计算所述零元素信息和所述无用元素信息对应的所述稀疏性检测结果,所述稀疏性检测公式包括:
式中Y为所述稀疏性检测结果对应的值,Z为所述零元素信息对应的数据大小,N为所述无用元素信息的数据大小,A为所述目标数据的数据大小,以根据所述稀疏性检测结果的值将所述第一目标数据分为稀疏数据和非稀疏数据。
在一些实施例中,所述根据所述稀疏性检测结果确定所述稀疏数据对应的目标压缩算法,包括:当根据所述稀疏性检测结果确定所述稀疏数据中存在噪声信息时,采用最小绝对值选择与收缩算法作为所述目标压缩算法;当根据所述稀疏性检测结果确定所述稀疏数据中不存在噪声信息时,采用基于弹性网正则化的稀疏编码算法作为所述目标压缩算法。
在一些实施例中,在所述根据所述目标压缩算法对所述稀疏数据进行压缩,获取压缩数据之前,还包括:将所述稀疏数据输入至预设的数据重构模型,所述数据重构模型对所述稀疏数据进行数据重构,输出所述稀疏数据对应的重构数据,以根据所述目标压缩算法对所述重构数据进行压缩。
在一些实施例中,所述神经网络模型包括特征提取网络、生成网络和合并网络;所述将所述压缩数据和所述编码数据输入至预设的神经网络模型,包括:将所述压缩数据和所述编码数据分别输入至所述特征提取网络,以获取所述压缩数据对应的第一内容信息和所述编码数据对应的第二内容信息;将所述第一内容信息和所述第二内容信息输入至所述生成网络,所述生成网络用于根据所述第一内容信息和第二内容信息生成排序信息;将所述压缩数据、所述编码数据和所述排序信息输入至所述合并网络,所述合并网络用于根据所述排序信息合并所述压缩数据和所述编码数据,以输出所述第二目标数据。
在一些实施例中,其特征在于,在所述将所述第二目标数据发送至所述终端设备中之前,还包括:将所述第二目标数据输入至预设的特征提取模型,输出所述第二目标数据对应的特征信息;根据所述特征信息确定所述第二目标数据对应的第一目标格式;将所述第二目标数据的数据格式转换为所述第一目标格式,用于将转换后的所述第二目标数据发送至所述终端设备;或,获取所述终端设备的终端数据格式,将所述终端数据格式确认为第二目标格式;将所述第二目标数据的数据格式转换为所述第二目标格式,用于将转换后的所述第二目标数据发送至所述终端设备。
第二方面,本申请实施例提供了一种计算子系统,应用于智能计算平台的DMA引擎,所述智能计算平台还包括存储器和终端设备;所述计算子系统包括:
获取模块,用于在接收到所述终端设备发送的对所述存储器的数据访问请求时,获取所述数据访问请求对应的第一目标数据,对所述第一目标数据进行稀疏性检测,获取所述第一目标数据对应的稀疏性检测结果;
解析模块,用于根据所述稀疏性检测结果将所述第一目标数据分为稀疏数据和非稀疏数据,解析所述非稀疏数据获取所述非稀疏数据对应的数据类型;
确定模块,用于根据所述稀疏性检测结果确定所述稀疏数据对应的目标压缩算法,根据所述数据类型确定所述非稀疏数据对应的目标编码算法;
压缩模块,用于根据所述目标压缩算法对所述稀疏数据进行压缩,获取第一压缩数据;
编码模块,用于根据所述目标编码算法对所述非稀疏数据进行编码,获取编码数据;
合并模块,用于将所述压缩数据和所述编码数据输入至预设的神经网络模型,所述神经网络模型用于对所述压缩数据和编码数据进行排序和合并,输出第二目标数据;
发送模块,用于将所述第二目标数据发送至所述终端设备中。
第三方面,本申请实施例提供了一种智能计算平台,包括DMA引擎、存储器和终端设备;
其中,所述DMA引擎包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如本申请任一实施例所提供的DMA传输数据预处理方法。
本申请实施例与现有技术相比存在的有益效果是:
本申请实施例提供的技术方案中,首先,在接收到所述终端设备发送的对所述存储器的数据访问请求时,获取所述数据访问请求对应的第一目标数据,对所述第一目标数据进行稀疏性检测,获取所述第一目标数据对应的稀疏性检测结果;然后,根据所述稀疏性检测结果将所述第一目标数据分为稀疏数据和非稀疏数据,解析所述非稀疏数据获取所述非稀疏数据对应的数据类型;同时,根据所述稀疏性检测结果确定所述稀疏数据对应的目标压缩算法,根据所述数据类型确定所述非稀疏数据对应的目标编码算法;再然后,根据所述目标压缩算法对所述稀疏数据进行压缩,获取压缩数据并根据所述目标编码算法对所述非稀疏数据进行编码,获取编码数据;进一步的,将所述压缩数据和所述编码数据输入至预设的神经网络模型,所述神经网络模型用于对所述压缩数据和编码数据进行排序和合并,输出第二目标数据;最后,将所述第二目标数据发送至所述终端设备中。
本申请实施例中,所提供的方法能够在智能计算平台内的任意终端设备需要对任意存储器的数据进行访问时,DMA引擎能够通过对数据访问请求对应的第一目标数据进行稀疏性检测,以将第一目标数据分为稀疏数据和非稀疏数据,进而确定稀疏数据对应的目标压缩算法和非稀疏数据对应的目标编码算法,将对稀疏数据的压缩后获得的压缩数据和非稀疏数据编码后获得的编码数据输入至预设的神经网络模型,以对压缩数据和编码数据进行排序和合并,输出第二目标数据并输入至终端设备中。进而确保了智能计算平台运行的稳定性,提升DMA引擎与存储器的数据传输的效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的DMA传输数据预处理方法的示意性流程图;
图2是本申请实施例提供的智能计算平台的结构示意图;
图3是本申请实施例提供的计算子系统的结构示意图;
图4是本申请实施例提供的DMA引擎的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
下面对本申请实施例的技术方案进行介绍。
当下随着人工智能的飞速发展,功能各异的智能计算平台不断涌现。对智能计算平台内用于运算的中央处理器(Central Processing Unit,CPU)的计算和运行能力的要求也日益增大。智能计算平台的CPU主要用于运行各类深度学习模型。而各类模型的权重张量十分庞大,当深度学习模型大小大于CPU的外部的存储器容量时,绕过CPU的存储限制的一种方式是将模型划分成多个部分并在多个CPU中运行。然而,此类解决方案在成本和各CPU的通信问题上都导致模型运行效果受到影响,导致模型运行存在较长的延迟和较低的吞吐量。
虽然CPU运行深度学习模型使用的权重张量可能很大,但由于许多权重张量是稀疏的,因为许多权重值是零。当下具有在线解压缩单元的直接存储器访问(Direct MemoryAccess,DMA)引擎可以即时地处理、解压缩权重张量。在计算机科学领域,DMA,即直接存储器访问,是一种计算机系统中用于实现高速数据传输的技术,其主要作用是在CPU和I/O设备之间直接传输数据,无需CPU的干预,从而提高数据传输的效率和性能。
传统的DMA中,数据传输通常是由DMA引擎实现的,其工作原理如下:
设置DMA引擎:CPU首先设置DMA引擎,包括传输的起始地址、目的地址、传输的数据量等信息。
启动DMA传输:一旦DMA引擎接收到传输任务,它就可以直接和内存进行数据传输,无需CPU的干预。
数据传输:DMA引擎通过总线直接从内存读取数据或写入数据到设备,以完成数据传输的任务。
传输完成:一旦数据传输完成,DMA引擎会向CPU发送中断请求,通知CPU数据传输已完成。
传统的DMA技术在处理大数据量的数据传输时具有显著的优势,可以提高数据传输的速度和效率,减轻CPU的负担,提高系统的整体性能。DMA技术被广泛运用在各种需要高速数据传输的场景中,如网络数据传输、磁盘读写等领域。
但由于智能计算平台内处理的数据量过于庞大,导致DMA引擎随着数据内容、类型的变化,基于DMA引擎的处理效率不断下降,影响智能计算平台的运行效率。
因此,亟需一种对DMA传输数据预处理方法,以提升DMA引擎与存储器的数据传输的效率。
为解决上述问题,请参见图1,图1是本申请实施例提供的DMA传输数据预处理方法的示意性流程图,作为示例而非限定,该方法可以应用于如图2所示的智能计算平台10的DMA引擎11,智能计算平台10还包括终端设备12和存储器13。该方法包括以下步骤:
S101、在接收到终端设备发送的对存储器的数据访问请求时,获取数据访问请求对应的第一目标数据,对第一目标数据进行稀疏性检测,获取第一目标数据对应的稀疏性检测结果。
具体地,当智能计算平台运行过程中任意终端设备,例如I/O(I nput/Output)设备,需要获取智能计算平台内的存储器所存储的数据时,终端设备需要向DMA引擎发送对存储器的数据访问请求。DMA引擎在接收到该数据访问请求时,能够快速获取该数据访问请求对应的第一目标数据,为提高数据的传输效率并减小数据的大小,DMA引擎通过对第一目标数据进行稀疏性检测,获取第一目标数据对应的稀疏性检测结果,能够确定第一目标数据中存在的稀疏数据,进而确定对应的压缩策略已实现对第一目标数据的优化,以便更高效地进行存储器访问。
在一些实施例中,在获取数据访问请求对应的第一目标数据之前,还包括:获取所述存储器存储的存储数据信息,对所述存储数据信息进行排序后返回至所述存储器进行存储。
通过DMA引擎对存储器的存储数据信息的重新组织排序,例如根据历史访问模式来重新组织数据将近期访问数据放置在相邻位置或存储数据信息中的头部,进而能提高缓存的命中率。
S102、根据稀疏性检测结果将第一目标数据分为稀疏数据和非稀疏数据,解析非稀疏数据获取非稀疏数据对应的数据类型。
具体地,DMA引擎在获取到第一目标数据对应的稀疏性检测结果时,能够根据稀疏性检测结果将第一目标数据分为稀疏数据和非稀疏数据,即确定第一目标数据中需要压缩的稀疏数据和需要编码的非稀疏数据的内容,同时通过对非稀疏数据的内容进行解析能够获取其对应的数据类型。进而DMA引擎能针对性对稀疏数据和非稀疏数据采用对应的压缩和编码策略,已提升对第一目标数据预处理的效率。
S103、根据稀疏性检测结果确定稀疏数据对应的目标压缩算法,根据数据类型确定非稀疏数据对应的目标编码算法。
具体地,DMA引擎根据对第一目标数据的稀疏性检测结果能够快速确认稀疏数据对应的目标压缩算法,并根据数据类型确认非稀疏数据对应的目标编码算法,已快速、准确确定对第一目标数据的压缩和编码策略。
在一些实施例中,所述根据所述稀疏性检测结果确定所述稀疏数据对应的目标压缩算法,包括:当根据所述稀疏性检测结果确定所述稀疏数据中存在噪声信息时,采用最小绝对值选择与收缩算法作为所述目标压缩算法;当根据所述稀疏性检测结果确定所述稀疏数据中不存在噪声信息时,采用基于弹性网正则化的稀疏编码算法作为所述目标压缩算法。
由于不同数据其稀疏的类型和程度不同,本申请为提升对稀疏数据压缩的准确性,DMA引擎需要先根据稀疏性检测结果确定稀疏数据中是否存在对应的噪声信息,例如对稀疏数据进行噪声检测确定,进而在稀疏数据中存在噪声时通过采用最小绝对值选择与收缩(Least abso l ute shr i nkage and se l ect i on operator,Lasso)算法,Lasso算法是一种基于L1正则化的稀疏编码算法,它通过最小化目标函数来找到最稀疏的表示。
而当DMA引擎根据稀疏性检测结果确定稀疏数据中不存在噪声信息时,采用基于弹性网正则化的稀疏编码(SparseNet)算法能自动选择最有的稀疏化参数,进而在稀疏数据高维度或高复杂度时能取得较好的压缩效果。
需要说明的是,在一些实施例中,目标压缩算法也可以是最小绝对值选择与收缩算法、正则化的稀疏编码算法、Lempe l-Z i v压缩、gz ip、K-SVD算法和OMP算法的一项或多项,目标压缩算法的选取需要综合考虑数据的特点、算法性能、参数调节和应用需求等因素。在实际应用中,可以根据具体情况进行尝试和比较,选择最适合需求的算法。故本申请实施例对目标压缩算法的类型不作限制。
在一些实施例中,在所述根据所述目标压缩算法对所述稀疏数据进行压缩,获取压缩数据之前,还包括:将所述稀疏数据输入至预设的数据重构模型,所述数据重构模型对所述稀疏数据进行数据重构,输出所述稀疏数据对应的重构数据,以根据所述目标压缩算法对所述重构数据进行压缩。
DMA引擎通过对稀疏数据进行数据重构,能够更大程度对第一目标数据原本的数据空白内容进行预测和填充,已确保第一目标数据内容的完整性。
S104、根据目标压缩算法对稀疏数据进行压缩,获取压缩数据。
具体地,DMA引擎通过根据目标压缩算法对稀疏数据进行压缩,能够有效减少第一目标数据的数据大小,提升最终传输至终端设备的速度,并降低终端设备对最终传输的数据的解析难度。
示例性的,目标编码算法可以是差分编码、霍夫曼编码等任意编码算法,具体编码算法的类型根据第一目标数据和终端设备的传输格式进行确定,故本申请实施例对目标编码算法的类型不作限制。
示例性的,当采用最小绝对值选择与收缩算法作为所述目标压缩算法时,所述根据目标压缩算法对稀疏数据进行压缩,获取压缩数据包括:根据目标压缩公式对所述稀疏数据进行计算,获取所述最小绝对值选择与收缩算法对应的压缩参数,以根据所述目标压缩算法和压缩参数对稀疏数据进行压缩,获取压缩数据。所述目标压缩公式包括:
其中,为稀疏数据的向量形式,其维度为n,θ1至θn分别为稀疏数据θ的第1至n个维度的值,k为迭代次数,/>为对稀疏数据迭代k轮后的使取得最小值的所述压缩参数。其中,压缩参数为目标压缩算法对应的参数(例如阈值、压缩比例或者正则化参数)。通过对压缩参数的计算能够提升压缩的准确率。
S105、根据目标编码算法对非稀疏数据进行编码,获取编码数据。
具体地,DMA引擎通过根据目标编码算法对非稀疏数据进行编码,能够确保传输至终端设备的数据能够被终端设备准确解析,避免因格式或类型不同等问题导致终端设备无法解析非稀疏数据的内容,降低终端设备对最终传输的数据的解析难度。
S106、将压缩数据和编码数据输入至预设的神经网络模型,神经网络模型用于对压缩数据和编码数据进行排序和合并,输出第二目标数据。
具体地,DMA引擎在完成对第一目标数据的划分、压缩和编码后,将最终获取的压缩数据和编码数据输入至预设的神经网络模型,该神经网络模型用于对压缩数据和编码数据进行排序和合并,通过预测性的算法对数据进行重新排序,已确保数据内容的连贯性和可读性。
在一些实施例中,所述神经网络模型包括特征提取网络、生成网络和合并网络;所述将所述压缩数据和所述编码数据输入至预设的神经网络模型,包括:将所述压缩数据和所述编码数据分别输入至所述特征提取网络,以获取所述压缩数据对应的第一内容信息和所述编码数据对应的第二内容信息;将所述第一内容信息和所述第二内容信息输入至所述生成网络,所述生成网络用于根据所述第一内容信息和第二内容信息生成排序信息;将所述压缩数据、所述编码数据和所述排序信息输入至所述合并网络,所述合并网络用于根据所述排序信息合并所述压缩数据和所述编码数据,以输出所述第二目标数据。
DMA引擎通过将压缩数据和编码数据分别输入至所述特征提取网络,能够对压缩数据和编码数据进行特征提取以获取对应的第一内容信息和第二内容信息。进而生成网络能根据第一内容信息和第二内容信息确定各数据中的内容对应的位置即排序信息,进而合并网络能将第一内容信息和第二内容信息进行排序和合并,以确保第二目标数据的连贯性和可读性。
S107、将第二目标数据发送至终端设备中。
具体地,DMA引擎在获取到神经网络模型输出的第二目标数据后,直接将其发送至终端设备,完成对终端设备的数据传输,进而确保了智能计算平台运行的稳定性,提升DMA引擎与存储器的数据传输的效率。
在一些实施例中,其特征在于,在所述将所述第二目标数据发送至所述终端设备中之前,还包括:将所述第二目标数据输入至预设的特征提取模型,输出所述第二目标数据对应的特征信息;根据所述特征信息确定所述第二目标数据对应的第一目标格式;将所述第二目标数据的数据格式转换为所述第一目标格式,用于将转换后的所述第二目标数据发送至所述终端设备。
在DMA引擎将第二目标数据传输至终端设备之前,为确保终端设备能够成功解析第二目标数据。DMA引擎通过将第二目标数据的数据个数转换为其特征信息最适配的第一目标格式,进而能降低第二目标数据的解读难度,使得终端设备能快速解析对应的数据。
在一些实施例中,其特征在于,在所述将所述第二目标数据发送至所述终端设备中之前,还包括:获取所述终端设备的终端数据格式,将所述终端数据格式确认为第二目标格式;将所述第二目标数据的数据格式转换为所述第二目标格式,用于将转换后的所述第二目标数据发送至所述终端设备。
由于终端设备支持的数据格式与存储器的数据格式不一定相同,为确保终端设备能够成功解析第二目标数据。DMA引擎通过将第二目标数据的数据格式转换为终端设备所搭载的终端数据格式,进而智能计算平台无需对终端设备的数据格式进行限制,降低了智能计算平台的搭建和通信成本。
在一些实施例中,所述对所述第一目标数据进行稀疏性检测,获取所述第一目标数据对应的稀疏性检测结果,包括:将所述第一目标数据输入预设的稀疏性检测模型,所述稀疏性检测模型用于输出所述第一目标数据对应的零元素信息和无用元素信息,根据所述零元素信息和无用元素信息计算所述稀疏性检测结果。
DMA引擎通过预设有对应的稀疏性检测模型,例如分类与回归树(CART树)模型或LSTM(Long Short-Term Memory,长短期记忆网络)模型,能够根据第一目标数据的内容提取出对应的零元素信息和无用元素信息,进而能够确定第一目标数据中包含的空白或无用的数据的具体位置、大小等信息。已确定对第一目标数据进行压缩的范围。
示例性的,所述稀疏性检测模型包括零元素提取网络、无用元素提取网络和结果计算网络;所述将所述第一目标数据输入预设的稀疏性检测模型,包括:将所述第一目标数据输入至所述零元素提取网络,所述零元素提取网络用于获取所述第一目标数据中的零元素和空白元素,以根据所述零元素和空白元素输出所述零元素信息;将所述第一目标数据输入至所述无用元素提取网络,所述无用元素提取网络用于运行所述第一目标数据,将所述第一目标数据在预设时长内未变化的元素确认为无用元素,以根据所述无用元素输出所述无用元素信息;将所述零元素信息和所述无用元素信息输入至所述结果计算网络,所述结果计算网络用于根据所述零元素信息和所述无用元素信息计算所述稀疏性检测结果。
本申请所提供的方法通过采用零元素提取网络、无用元素提取网络和结果计算网络三个串级网络组成稀疏性检测模型,能够先对第一目标数据分别进行零元素提取、空白元素提取和无用元素提取。其中无用元素指的是在智能计算平台运行过程中,第一目标数据内在预设时长,例如10分钟,都不会被调用到的元素。最终DMA引擎根据零元素信息和无用元素信息能够确定第一目标数据中需要压缩的稀疏数据的范围和大小,以输出对应的稀疏性检测结果。
需要说明的是,在一些实施例中,所述将所述零元素信息和所述无用元素信息输入至所述结果计算网络,包括:将所述零元素信息和所述无用元素信息输入至所述结果计算网络,所述结果计算网络采用预设的稀疏性检测公式计算所述零元素信息和所述无用元素信息对应的所述稀疏性检测结果,所述稀疏性检测公式包括:
式中Y为所述稀疏性检测结果对应的值,Z为所述零元素信息对应的数据大小,N为所述无用元素信息的数据大小,A为所述目标数据的数据大小,以根据所述稀疏性检测结果的值将所述第一目标数据分为稀疏数据和非稀疏数据。通过获取稀疏性检测结果的值,DMA引擎能够很便捷判断第一目标数据的稀疏性,进而提升压缩和编码策略的准确性。
在一些实施例中,所提供的智能计算平台包括多个终端设备和多个存储器,所述数据访问请求包括终端设备的第一标识信息和存储器的第二标识信息。所述获取所述数据访问请求对应的第一目标数据,包括:根据第二标识信息获取所述数据访问请求对应的存储器中的第一目标数据。所述将所述第二目标数据发送至所述终端设备中,包括:根据所述第一标识信息将所述第二目标数据发送至所述终端设备中。进而本申请所提供的方法能够同时实现多个终端设备和多个存储器间的数据传输。
本申请实施例中,通过在智能计算平台内的任意终端设备需要对任意存储器的数据进行访问时,DMA引擎能够通过对数据访问请求对应的第一目标数据进行稀疏性检测,以将第一目标数据分为稀疏数据和非稀疏数据,进而确定稀疏数据对应的目标压缩算法和非稀疏数据对应的目标编码算法,将对稀疏数据的压缩后获得的压缩数据和非稀疏数据编码后获得的编码数据输入至预设的神经网络模型,以对压缩数据和编码数据进行排序和合并,输出第二目标数据并输入至终端设备中。进而确保了智能计算平台运行的稳定性,提升DMA引擎与存储器的数据传输的效率。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
对应于上文实施例所述的DMA传输数据预处理方法,图3示出了本申请实施例提供的计算子系统的结构框图,该装置可以应用于如图3所示的智能计算平台的DMA引擎,智能计算平台还包括存储器和终端设备。为了便于说明,仅示出了与本申请实施例相关的部分。参照图3,该装置包括:
获取模块201,用于在接收到所述终端设备发送的对所述存储器的数据访问请求时,获取所述数据访问请求对应的第一目标数据,对所述第一目标数据进行稀疏性检测,获取所述第一目标数据对应的稀疏性检测结果。
解析模块202,用于根据所述稀疏性检测结果将所述第一目标数据分为稀疏数据和非稀疏数据,解析所述非稀疏数据获取所述非稀疏数据对应的数据类型。
确定模块203,用于根据所述稀疏性检测结果确定所述稀疏数据对应的目标压缩算法,根据所述数据类型确定所述非稀疏数据对应的目标编码算法。
压缩模块204,用于根据所述目标压缩算法对所述稀疏数据进行压缩,获取第一压缩数据。
编码模块205,用于根据所述目标编码算法对所述非稀疏数据进行编码,获取编码数据。
合并模块206,用于将所述压缩数据和所述编码数据输入至预设的神经网络模型,所述神经网络模型用于对所述压缩数据和编码数据进行排序和合并,输出第二目标数据。
发送模块207,用于将所述第二目标数据发送至所述终端设备中。
需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
在本申请所提供的智能计算平台中,包括DMA引擎11和存储器,DMA引擎11搭载有策略模拟模块。
请同时参照图3和图4,图4为本申请实施例提供的DMA引擎的结构示意图。图3所提供的智能计算平台10包括DMA引擎11、终端设备12和存储器13。
图4所对应的实施例提供的DMA引擎11包括:至少一个处理器111、存储器112以及存储在所述存储器112中并可在所述至少一个处理器111上运行的计算机程序113,所述处理器111执行所述计算机程序113时实现上述任意各个方法实施例中的步骤。
所述DMA引擎可以安装于是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。该DMA引擎所安装的计算机设备可包括,但不仅限于,处理器111、存储器112。本领域技术人员可以理解,图4仅仅是DMA引擎11的举例,并不构成对DMA引擎11的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如还可以包括输入输出设备、网络接入设备等。
所称处理器111可以是中央处理单元(Centra l Process i ng Un it,CPU),该处理器111还可以是其他通用处理器、数字信号处理器(D igita l S igna lProcessor,DSP)、专用集成电路(App l icat i on Speci fi c I ntegrated Ci rcu it,ASI C)、现成可编程门阵列(Fie l d-Programmab l e Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器112在一些实施例中可以是所述DMA引擎11的内部存储单元,例如DMA引擎11的硬盘或内存。所述存储器112在另一些实施例中也可以是所述DMA引擎11的外部存储设备,例如所述DMA引擎11上配备的插接式硬盘,智能存储卡(Smart Medi a Card,SMC),安全数字(Secure D igita l,SD)卡,闪存卡(F l ash Card)等。进一步地,所述存储器112还可以既包括所述DMA引擎11的内部存储单元也包括外部存储设备。所述存储器112用于存储操作系统、应用程序、引导装载程序(BootLoader)、数据以及其他程序等,例如所述计算机程序的程序代码等。所述存储器112还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到DMA引擎的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM,Read-On ly Memory)、随机存取存储器(RAM,Random AccessMemory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/网络设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/网络设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (7)

1.一种DMA传输数据预处理方法,其特征在于,应用于智能计算平台的DMA引擎,所述智能计算平台还包括存储器和终端设备;所述方法包括:
在接收到所述终端设备发送的对所述存储器的数据访问请求时,获取所述数据访问请求对应的第一目标数据,对所述第一目标数据进行稀疏性检测,获取所述第一目标数据对应的稀疏性检测结果;
根据所述稀疏性检测结果将所述第一目标数据分为稀疏数据和非稀疏数据,解析所述非稀疏数据获取所述非稀疏数据对应的数据类型;
根据所述稀疏性检测结果确定所述稀疏数据对应的目标压缩算法,根据所述数据类型确定所述非稀疏数据对应的目标编码算法;
根据所述目标压缩算法对所述稀疏数据进行压缩,获取压缩数据;
根据所述目标编码算法对所述非稀疏数据进行编码,获取编码数据;
将所述压缩数据和所述编码数据输入至预设的神经网络模型,所述神经网络模型用于对所述压缩数据和编码数据进行排序和合并,输出第二目标数据;
将所述第二目标数据发送至所述终端设备中;
所述对所述第一目标数据进行稀疏性检测,获取所述第一目标数据对应的稀疏性检测结果,包括:
将所述第一目标数据输入预设的稀疏性检测模型,所述稀疏性检测模型用于输出所述第一目标数据对应的零元素信息和无用元素信息,根据所述零元素信息和无用元素信息计算所述稀疏性检测结果;
所述稀疏性检测模型包括零元素提取网络、无用元素提取网络和结果计算网络;所述将所述第一目标数据输入预设的稀疏性检测模型,包括:
将所述第一目标数据输入至所述零元素提取网络,所述零元素提取网络用于获取所述第一目标数据中的零元素和空白元素,以根据所述零元素和空白元素输出所述零元素信息;
将所述第一目标数据输入至所述无用元素提取网络,所述无用元素提取网络用于运行所述第一目标数据,将所述第一目标数据在预设时长内未变化的元素确认为无用元素,以根据所述无用元素输出所述无用元素信息;
将所述零元素信息和所述无用元素信息输入至所述结果计算网络,所述结果计算网络用于根据所述零元素信息和所述无用元素信息计算所述稀疏性检测结果;
所述根据所述稀疏性检测结果确定所述稀疏数据对应的目标压缩算法,包括:
当根据所述稀疏性检测结果确定所述稀疏数据中存在噪声信息时,采用最小绝对值选择与收缩算法作为所述目标压缩算法;
当根据所述稀疏性检测结果确定所述稀疏数据中不存在噪声信息时,采用基于弹性网正则化的稀疏编码算法作为所述目标压缩算法;
目标编码算法为差分编码算法或者霍夫曼编码算法。
2.根据权利要求1所述的方法,其特征在于,所述将所述零元素信息和所述无用元素信息输入至所述结果计算网络,包括:
将所述零元素信息和所述无用元素信息输入至所述结果计算网络,所述结果计算网络采用预设的稀疏性检测公式计算所述零元素信息和所述无用元素信息对应的所述稀疏性检测结果,所述稀疏性检测公式包括:
式中Y为所述稀疏性检测结果对应的值,Z为所述零元素信息对应的数据大小,N为所述无用元素信息的数据大小,A为所述目标数据的数据大小,以根据所述稀疏性检测结果的值将所述第一目标数据分为稀疏数据和非稀疏数据。
3.根据权利要求1所述的方法,其特征在于,在所述根据所述目标压缩算法对所述稀疏数据进行压缩,获取压缩数据之前,还包括:
将所述稀疏数据输入至预设的数据重构模型,所述数据重构模型对所述稀疏数据进行数据重构,输出所述稀疏数据对应的重构数据,以根据所述目标压缩算法对所述重构数据进行压缩。
4.根据权利要求1所述的方法,其特征在于,所述神经网络模型包括特征提取网络、生成网络和合并网络;所述将所述压缩数据和所述编码数据输入至预设的神经网络模型,包括:
将所述压缩数据和所述编码数据分别输入至所述特征提取网络,以获取所述压缩数据对应的第一内容信息和所述编码数据对应的第二内容信息;
将所述第一内容信息和所述第二内容信息输入至所述生成网络,所述生成网络用于根据所述第一内容信息和第二内容信息生成排序信息;
将所述压缩数据、所述编码数据和所述排序信息输入至所述合并网络,所述合并网络用于根据所述排序信息合并所述压缩数据和所述编码数据,以输出所述第二目标数据。
5.根据权利要求1所述的方法,其特征在于,在所述将所述第二目标数据发送至所述终端设备中之前,还包括:
将所述第二目标数据输入至预设的特征提取模型,输出所述第二目标数据对应的特征信息;
根据所述特征信息确定所述第二目标数据对应的第一目标格式;
将所述第二目标数据的数据格式转换为所述第一目标格式,用于将转换后的所述第二目标数据发送至所述终端设备;
或,
获取所述终端设备的终端数据格式,将所述终端数据格式确认为第二目标格式;
将所述第二目标数据的数据格式转换为所述第二目标格式,用于将转换后的所述第二目标数据发送至所述终端设备。
6.一种计算子系统,其特征在于,应用于智能计算平台的DMA引擎,所述智能计算平台还包括存储器和终端设备;所述计算子系统包括:
获取模块,用于在接收到所述终端设备发送的对所述存储器的数据访问请求时,获取所述数据访问请求对应的第一目标数据,对所述第一目标数据进行稀疏性检测,获取所述第一目标数据对应的稀疏性检测结果;
解析模块,用于根据所述稀疏性检测结果将所述第一目标数据分为稀疏数据和非稀疏数据,解析所述非稀疏数据获取所述非稀疏数据对应的数据类型;
确定模块,用于根据所述稀疏性检测结果确定所述稀疏数据对应的目标压缩算法,根据所述数据类型确定所述非稀疏数据对应的目标编码算法;
压缩模块,用于根据所述目标压缩算法对所述稀疏数据进行压缩,获取第一压缩数据;
编码模块,用于根据所述目标编码算法对所述非稀疏数据进行编码,获取编码数据;
合并模块,用于将所述压缩数据和所述编码数据输入至预设的神经网络模型,所述神经网络模型用于对所述压缩数据和编码数据进行排序和合并,输出第二目标数据;
发送模块,用于将所述第二目标数据发送至所述终端设备中;
所述对所述第一目标数据进行稀疏性检测,获取所述第一目标数据对应的稀疏性检测结果,包括:
将所述第一目标数据输入预设的稀疏性检测模型,所述稀疏性检测模型用于输出所述第一目标数据对应的零元素信息和无用元素信息,根据所述零元素信息和无用元素信息计算所述稀疏性检测结果;
所述稀疏性检测模型包括零元素提取网络、无用元素提取网络和结果计算网络;所述将所述第一目标数据输入预设的稀疏性检测模型,包括:
将所述第一目标数据输入至所述零元素提取网络,所述零元素提取网络用于获取所述第一目标数据中的零元素和空白元素,以根据所述零元素和空白元素输出所述零元素信息;
将所述第一目标数据输入至所述无用元素提取网络,所述无用元素提取网络用于运行所述第一目标数据,将所述第一目标数据在预设时长内未变化的元素确认为无用元素,以根据所述无用元素输出所述无用元素信息;
将所述零元素信息和所述无用元素信息输入至所述结果计算网络,所述结果计算网络用于根据所述零元素信息和所述无用元素信息计算所述稀疏性检测结果;
所述根据所述稀疏性检测结果确定所述稀疏数据对应的目标压缩算法,包括:
当根据所述稀疏性检测结果确定所述稀疏数据中存在噪声信息时,采用最小绝对值选择与收缩算法作为所述目标压缩算法;
当根据所述稀疏性检测结果确定所述稀疏数据中不存在噪声信息时,采用基于弹性网正则化的稀疏编码算法作为所述目标压缩算法;
目标编码算法为差分编码算法或者霍夫曼编码算法。
7.一种智能计算平台,其特征在于,包括DMA引擎、存储器和终端设备;
其中,所述DMA引擎包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述的方法。
CN202410341487.3A 2024-03-25 2024-03-25 一种dma传输数据预处理方法、计算子系统及智能计算平台 Active CN117931706B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410341487.3A CN117931706B (zh) 2024-03-25 2024-03-25 一种dma传输数据预处理方法、计算子系统及智能计算平台

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410341487.3A CN117931706B (zh) 2024-03-25 2024-03-25 一种dma传输数据预处理方法、计算子系统及智能计算平台

Publications (2)

Publication Number Publication Date
CN117931706A CN117931706A (zh) 2024-04-26
CN117931706B true CN117931706B (zh) 2024-05-28

Family

ID=90761431

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410341487.3A Active CN117931706B (zh) 2024-03-25 2024-03-25 一种dma传输数据预处理方法、计算子系统及智能计算平台

Country Status (1)

Country Link
CN (1) CN117931706B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111061997A (zh) * 2019-12-19 2020-04-24 中国人民解放军国防科技大学 面向稀疏矩阵向量乘的数据传输方法及dma传输装置
CN113762493A (zh) * 2020-06-01 2021-12-07 阿里巴巴集团控股有限公司 神经网络模型的压缩方法、装置、加速单元和计算系统
CN116997909A (zh) * 2021-03-30 2023-11-03 亚马逊技术股份有限公司 稀疏机器学习加速

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210090328A1 (en) * 2020-12-07 2021-03-25 Intel Corporation Tile-based sparsity aware dataflow optimization for sparse data

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111061997A (zh) * 2019-12-19 2020-04-24 中国人民解放军国防科技大学 面向稀疏矩阵向量乘的数据传输方法及dma传输装置
CN113762493A (zh) * 2020-06-01 2021-12-07 阿里巴巴集团控股有限公司 神经网络模型的压缩方法、装置、加速单元和计算系统
CN116997909A (zh) * 2021-03-30 2023-11-03 亚马逊技术股份有限公司 稀疏机器学习加速

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于稀疏信号重构的无线传感网络目标定位;王勇 等;仪器仪表学报;20120229;第33卷(第2期);第362-367页 *

Also Published As

Publication number Publication date
CN117931706A (zh) 2024-04-26

Similar Documents

Publication Publication Date Title
CN109886388B (zh) 一种基于变分自编码器的训练样本数据扩充方法和装置
CN110175641B (zh) 图像识别方法、装置、设备和存储介质
CN113132723B (zh) 一种图像压缩方法及装置
CN112529767B (zh) 图像数据处理方法、装置、计算机设备和存储介质
CN116821646A (zh) 数据处理链构建方法、数据缩减方法、装置、设备及介质
CN111340638A (zh) 异常医保单据识别方法、装置、计算机设备及存储介质
CN113392732A (zh) 一种局部放电超声信号抗干扰方法及系统
CN111913648B (zh) 一种固态硬盘的数据处理方法及装置
CN117523593B (zh) 患者病历数据处理方法及系统
CN117931706B (zh) 一种dma传输数据预处理方法、计算子系统及智能计算平台
Underwood et al. Understanding the effects of modern compressors on the community earth science model
CN114239949A (zh) 一种基于双阶段注意力机制的网站访问量预测方法及系统
CN116705250B (zh) 一种医疗影像大数据的低耗优化和智能存储方法及系统
CN116012066A (zh) 广告转化率的预测方法、装置、可读存储介质
CN112052916B (zh) 基于神经网络的数据处理方法、装置以及可读存储介质
CN113160987B (zh) 健康状态预测方法、装置、计算机设备及存储介质
CN114974554A (zh) 融合图谱知识强化病历特征的方法、装置及存储介质
CN115565115A (zh) 一种舾装件智能识别方法、计算机设备
CN113609445A (zh) 多源异构监测数据处理方法、终端设备及可读存储介质
CN117891760B (zh) 一种dma稀疏化访存方法、智能计算子系统及智能计算平台
CN107122287B (zh) 一种系统的性能分析方法及装置
TWI795787B (zh) 自編碼器的訓練方法、細胞數量檢測方法及相關設備
CN117915114B (zh) 一种点云属性压缩方法、装置、终端及介质
CN110400313B (zh) 一种核磁共振影像的软组织分离方法和分离系统
CN111045687B (zh) 一种人工智能应用的部署方法及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant