CN116342366A - 稀疏参数的获取方法、装置、电子设备及存储介质 - Google Patents
稀疏参数的获取方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN116342366A CN116342366A CN202211591744.6A CN202211591744A CN116342366A CN 116342366 A CN116342366 A CN 116342366A CN 202211591744 A CN202211591744 A CN 202211591744A CN 116342366 A CN116342366 A CN 116342366A
- Authority
- CN
- China
- Prior art keywords
- sparse
- parameters
- processed
- initial
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 69
- 238000012545 processing Methods 0.000 claims abstract description 44
- 230000000875 corresponding effect Effects 0.000 description 94
- 238000004590 computer program Methods 0.000 description 8
- 238000012549 training Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 5
- 238000013136 deep learning model Methods 0.000 description 4
- 238000003491 array Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/20—Processor architectures; Processor configuration, e.g. pipelining
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Complex Calculations (AREA)
Abstract
本公开提出一种稀疏参数的获取方法、装置、电子设备及存储介质。被电子设备执行,电子设备包括:中央处理器CPU以及图形处理器GPU,图形处理器GPU包括:多个初始稀疏参数,方法包括:获取待处理稀疏特征的待处理存储编号,其中,待处理存储编号表示待处理稀疏特征在中央处理器CPU中的存储位置,根据待处理存储编号,从多个初始稀疏参数中确定目标稀疏参数,由此,能够基于待处理稀疏特征在中央处理器CPU中的待处理存储编号,实现从图形处理器GPU快速调用与待处理稀疏特征对应的目标稀疏参数,在不引入其他资源消耗的情况下,有效地提升稀疏参数的获取效率。
Description
技术领域
本公开涉及计算机技术领域,尤其涉及一种稀疏参数的获取方法、装置、电子设备及存储介质。
背景技术
稀疏特征,是指对模型训练过程中的数据进行ID化处理(ID化处理,例如,采用哈希算法对数据进行映射),并ID化处理结果映射为整型后所得字符串特征,而稀疏参数,是指采用Embedding技术将稀疏特征转化为多维稠密实数向量特征,在深度学习模型的训练场景中(例如,点击率预估模型(Click Through Rate,CTR)),需要从图形处理器(GraphicsProcessing Unit,GPU)获取大量的稀疏参数去支持模型的训练过程。
相关技术中,稀疏参数和稀疏特征关联存储在中央处理器(Central ProcessingUnit,CPU)中,从而在获取稀疏参数时,需要根据稀疏特征去CPU中查询稀疏参数,再将查询所得稀疏参数复制至GPU,以支持模型训练过程中的稀疏参数调用需求。
这种方式下,稀疏参数的复制过程,会引入较大的资源消耗,并且稀疏参数的获取效率较低。
发明内容
本公开旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本公开的目的在于提出一种稀疏参数的获取方法、装置、电子设备及存储介质,能够基于待处理稀疏特征在中央处理器CPU中的待处理存储编号,实现从图形处理器GPU快速调用与所述待处理稀疏特征对应的目标稀疏参数,在不引入其他资源消耗的情况下,有效地提升稀疏参数的获取效率。
本公开第一方面实施例提出的稀疏参数的获取方法,被电子设备执行,所述电子设备包括:中央处理器CPU以及图形处理器GPU,所述图形处理器GPU包括:多个初始稀疏参数,所述方法包括:获取待处理稀疏特征的待处理存储编号,其中,所述待处理存储编号表示所述待处理稀疏特征在所述中央处理器CPU中的存储位置;根据所述待处理存储编号,从所述多个初始稀疏参数中确定目标稀疏参数。
本公开第一方面实施例提出的稀疏参数的获取方法,通过获取待处理稀疏特征的待处理存储编号,其中,所述待处理存储编号表示所述待处理稀疏特征在所述中央处理器CPU中的存储位置,根据所述待处理存储编号,从所述多个初始稀疏参数中确定目标稀疏参数,由此,能够基于待处理稀疏特征在中央处理器CPU中的待处理存储编号,实现从图形处理器GPU快速调用与所述待处理稀疏特征对应的目标稀疏参数,在不引入其他资源消耗的情况下,有效地提升稀疏参数的获取效率。
本公开第二方面实施例提出的稀疏参数的获取装置,包括:第一获取模块,用于获取待处理稀疏特征的待处理存储编号,其中,所述待处理存储编号表示所述待处理稀疏特征在所述中央处理器CPU中的存储位置;确定模块,用于根据所述待处理存储编号,从所述多个初始稀疏参数中确定目标稀疏参数。
本公开第二方面实施例提出的稀疏参数的获取装置,通过获取待处理稀疏特征的待处理存储编号,其中,所述待处理存储编号表示所述待处理稀疏特征在所述中央处理器CPU中的存储位置,根据所述待处理存储编号,从所述多个初始稀疏参数中确定目标稀疏参数,由此,能够基于待处理稀疏特征在中央处理器CPU中的待处理存储编号,实现从图形处理器GPU快速调用与所述待处理稀疏特征对应的目标稀疏参数,在不引入其他资源消耗的情况下,有效地提升稀疏参数的获取效率。
本公开第三方面实施例提出了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时,实现如本公开第一方面实施例提出的稀疏参数的获取方法。
本公开第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本公开第一方面实施例提出的稀疏参数的获取方法。
本公开第五方面实施例提出了一种计算机程序产品,当计算机程序产品中的指令处理器执行时,执行如本公开第一方面实施例提出的稀疏参数的获取方法。
本公开附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本公开的实践了解到。
附图说明
本公开上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1是本公开一实施例提出的稀疏参数的获取方法的流程示意图;
图2是本公开另一实施例提出的稀疏参数的获取方法的流程示意图;
图3是本公开另一实施例提出的稀疏参数的获取方法的流程示意图;
图4是本公开一实施例提出的稀疏参数的获取装置的结构示意图;
图5是本公开另一实施例提出的稀疏参数的获取装置的结构示意图;
图6示出了适于用来实现本公开实施方式的示例性电子设备的框图。
具体实施方式
下面详细描述本公开的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本公开,而不能理解为对本公开的限制。相反,本公开的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
需要说明的是,本公开技术方案中对信息的获取、采集、存储、使用、处理等,其过程均符合相关法律、法规的规定,且不违背公序良俗。
图1是本公开一实施例提出的稀疏参数的获取方法的流程示意图。
其中,需要说明的是,本实施例的稀疏参数的获取方法的执行主体为稀疏参数的获取装置,该装置可以由软件和/或硬件的方式实现,该装置可以配置在电子设备中,电子设备可以包括但不限于终端、服务器端等。
如图1所示,该稀疏参数的获取方法,被电子设备执行,电子设备包括:中央处理器CPU以及图形处理器GPU,图形处理器GPU包括:多个初始稀疏参数,包括:
也即是说,本公开实施例描述的稀疏参数获取方法可以被电子设备执行,该电子设备可以包括图形处理器(Graphics Processing Unit,GPU)和中央处理器(CentralProcessing Unit,CPU),电子设备可以包括但不限于终端、服务器端等,对此不做限制。
其中,稀疏特征,是指对模型训练过程中的数据进行ID化处理(ID化处理,例如,采用哈希算法对数据进行映射),并ID化处理结果映射为整型后所得字符串特征,而稀疏参数,是指采用Embedding技术将稀疏特征转化为多维稠密实数向量特征。
其中,图形处理器GPU包括:多个初始稀疏参数,也即是说,本公开实施例中,为了满足深度学习模型的训练场景中(例如,点击率预估模型(Click Through Rate,CTR))的参数需求,可以预先将多个稀疏参数作为一个整体存储在图形处理器GPU,该预先存储至图形处理器GPU的稀疏参数,即可以被称为初始稀疏参数。
S101:获取待处理稀疏特征的待处理存储编号,其中,待处理存储编号表示待处理稀疏特征在中央处理器CPU中的存储位置。
其中,在深度学习模型的训练场景中,稀疏特征具有对应的稀疏参数,由此,获取稀疏参数可以是根据待处理稀疏特征去图形处理器GPU中查询与其所对应的稀疏参数。
其中,稀疏特征可以是预先存储在中央处理器CPU中,用于对待处理稀疏特征在中央处理器CPU中的存储位置进行描述的编号,即可以被称为待处理存储编号。
也即是说,本公开实施例中,可以是预先将多个稀疏特征存按照一定的存储次序存储在中央处理器CPU中,并对前述按照次序存储的多个稀疏特征进行编号处理,以确定与每个稀疏特征对应的存储编号,而后,可以是在获取待处理稀疏特征后,将中央处理器CPU中与待处理稀疏特征相同的稀疏特征所关联的存储编号作为待处理存储编号,对此不做限制。
S102:根据待处理存储编号,从多个初始稀疏参数中确定目标稀疏参数。
本公开实施例中,在获取待处理稀疏特征的待处理存储编号之后,可以根据待处理存储编号,从多个初始稀疏参数中确定与待处理稀疏特征所对应的初始稀疏参数,并将与待处理稀疏特征所对应的初始稀疏参数作为目标模型参数。
可以理解的是,本公开实施例中,对于每一个稀疏特征均存在与其所对应的初始稀疏参数,本公开实施例所描述的稀疏参数的获取方法是将稀疏特征存储在CPU中,将多个初始稀疏参数作为一个整体存储在GPU中,又由于稀疏特征与初始稀疏参数是关联对应的,从而可以基于确定的待处理稀疏特征的待处理存储编号定位目标稀疏参数在GPU中的存储位置,从而实现在不需要额外操作的情况下,从GPU中的相应存储位置直接调用与待处理稀疏特征对应的目标稀疏参数。
本公开实施例中,获取待处理稀疏特征的待处理存储编号,其中,待处理存储编号表示待处理稀疏特征在中央处理器CPU中的存储位置,根据待处理存储编号,从多个初始稀疏参数中确定目标稀疏参数,由此,能够基于待处理稀疏特征在中央处理器CPU中的待处理存储编号,实现从图形处理器GPU快速调用与待处理稀疏特征对应的目标稀疏参数,在不引入其他资源消耗的情况下,有效地提升稀疏参数的获取效率。
图2是本公开另一实施例提出的稀疏参数的获取方法的流程示意图。
如图2所示,该稀疏参数的获取方法,包括:
S201:获取多个初始稀疏参数,其中,不同初始稀疏参数具有对应的第一排列次序。
本公开实施例中,多个初始系数参数可以具有与其所对应的排列次序,该排列次序即可以被称为第一排列次序。
也即是说,本公开实施例中,可以是预先获取多个以第一排列次序排列的初始稀疏参数,并将前述多个以第一排列次序排列的初始稀疏参数作为一个整体触发后续处理步骤。
S202:根据第一排列次序,生成与相应初始稀疏参数对应的第一存储编号。
本公开实施例中,在获取多个初始稀疏参数后,可以根据与不同稀疏参数对应的第一排列次序,生成与相应初始稀疏参数对应的存储编号,该存储编号即可以被称为第一存储编号,而后,可以基于第一存储编号将相应初始稀疏参数存储在图形处理器GPU中。
举例而言,假设稀疏参数为a1、a2、a3、b1、b2、b3,与前述不同稀疏参数分别对应的第一排列次序依次为:0、1、2、3、4、5,而后根据第一排列次序,生成与相应初始稀疏参数对应的第一存储编号,可以是将与每个初始稀疏参数对应的第一排列次序,作为相应初始稀疏参数对应的第一存储编号。
S203:将多个初始稀疏参数和分别与其对应的多个第一存储编号,关联存储至图形处理器GPU。
也即是说,本公开实施例中,在根据第一排列次序,生成与相应初始稀疏参数对应的第一存储编号后,可以将多个初始稀疏参数和分别与其对应的多个第一存储编号,关联存储至图形处理器GPU中,具体地,可以是将多个初始稀疏参数和分别与其对应的多个第一存储编号,关联存储至图形处理器GPU中的哈希表中,将第一存储编号作为键,将初始稀疏参数作为与相应第一存储编号对应的键值,而后可以在后续稀疏参数的获取过程中,基于第一存储编号去图形处理器GPU中调用相应的初始稀疏参数。
本公开实施例中,在获取多个初始稀疏参数,并根据第一排列次序,生成与相应初始稀疏参数对应的第一存储编号,再将多个初始稀疏参数和分别与其对应的多个第一存储编号,关联存储至图形处理器GPU,由于第一存储编号是根据与不同稀疏参数对应的第一排列次序生成的,由此,在将多个初始稀疏参数和分别与其对应的多个第一存储编号,关联存储至图形处理器GPU时,可以基于第一存储编号去图形处理器GPU中调用相应的初始稀疏参数,从而有效的便利初始稀疏的调用过程。
S204:获取多个初始稀疏特征,其中,不同初始稀疏特征具有对应的第二排列次序。
本公开实施例中,为了满足深度学习模型的训练场景中(例如,点击率预估模型(Click Through Rate,CTR))的参数需求,可以预先获取与多个初始稀疏参数对应的稀疏特征,该稀疏特征即可以被称为初始稀疏特征,该初始稀疏特征可以具有对应的排列次序,该排列次序即可以被称为第二排列次序。
S205:根据第二排列次序,生成与初始稀疏特征对应的第二存储编号。
本公开实施例中,在获取多个初始稀疏特征后,可以根据与不同稀疏特征对应的第二排列次序,生成与相应初始稀疏特征对应的存储编号,该存储编号即可以被称为第二存储编号,而后,可以基于第二存储编号将相应初始稀疏特征存储在中央处理器CPU中。
举例而言,假设稀疏特征为A、B、C、D,与前述不同稀疏特征分别对应的第二排列次序依次为:0、1、2、3,而后根据第二排列次序,生成与相应初始稀疏特征对应的第二存储编号,可以是将与每个初始稀疏特征对应的第二排列次序,作为相应初始稀疏特征对应的第二存储编号。
S206:将多个初始稀疏特征和分别与其对应的多个第二存储编号,关联存储至中央处理器CPU。
也即是说,本公开实施例中,在根据第二排列次序,生成与相应初始稀疏特征对应的第二存储编号后,可以将多个初始稀疏特征和分别与其对应的多个第二存储编号,关联存储至中央处理器CPU中,具体地,可以是将多个初始稀疏特征和分别与其对应的多个第二存储编号,关联存储至中央处理器CPU中的哈希表中,将第二存储编号作为键,将初始稀疏特征作为与相应第二存储编号对应的键值,而后可以在后续稀疏特征的获取过程中,基于第二存储编号去中央处理器CPU中调用相应的初始稀疏特征。
本公开实施例中,在获取多个初始稀疏特征,并根据第二排列次序,生成与相应初始稀疏特征对应的第二存储编号,再将多个初始稀疏特征和分别与其对应的多个第二存储编号,关联存储至中央处理器CPU,由于第二存储编号是根据与不同稀疏特征对应的第二排列次序生成的,由于稀疏特征与初始稀疏参数是关联对应的,从而使得初始稀疏参数的第一存储编号可以和初始稀疏特征的第二存储编号相对应,从而可以基于确定的初始稀疏特征的第二存储编号定位目标稀疏参数在GPU中的存储编号,从而实现在不需要额外操作的情况下,有效地便利稀疏参数的获取过程。
S207:获取待处理稀疏特征的待处理存储编号,其中,待处理存储编号表示待处理稀疏特征在中央处理器CPU中的存储位置。
S208:根据待处理存储编号,从多个初始稀疏参数中确定目标稀疏参数。
S207-S208的描述说明具体可以参见上述实施例,在此不再赘述。
本公开实施例中,通过获取多个初始稀疏参数,并根据第一排列次序,生成与相应初始稀疏参数对应的第一存储编号,再将多个初始稀疏参数和分别与其对应的多个第一存储编号,关联存储至图形处理器GPU,由于第一存储编号是根据与不同稀疏参数对应的第一排列次序生成的,由此,在将多个初始稀疏参数和分别与其对应的多个第一存储编号,关联存储至图形处理器GPU时,可以基于第一存储编号去图形处理器GPU中调用相应的初始稀疏参数,从而有效的便利初始稀疏的调用过程,并获取多个初始稀疏特征,并根据第二排列次序,生成与相应初始稀疏特征对应的第二存储编号,再将多个初始稀疏特征和分别与其对应的多个第二存储编号,关联存储至中央处理器CPU,由于第二存储编号是根据与不同稀疏特征对应的第二排列次序生成的,由于稀疏特征与初始稀疏参数是关联对应的,从而使得初始稀疏参数的第一存储编号可以和初始稀疏特征的第二存储编号相对应,从而可以基于确定的初始稀疏特征的第二存储编号定位目标稀疏参数在GPU中的存储编号,从而实现在不需要额外操作的情况下,有效地便利稀疏参数的获取过程,再获取待处理稀疏特征的待处理存储编号,其中,待处理存储编号表示待处理稀疏特征在中央处理器CPU中的存储位置,根据待处理存储编号,从多个初始稀疏参数中确定目标稀疏参数,由此,能够基于待处理稀疏特征在中央处理器CPU中的待处理存储编号,实现从图形处理器GPU快速调用与待处理稀疏特征对应的目标稀疏参数,在不引入其他资源消耗的情况下,有效地提升稀疏参数的获取效率。
图3是本公开另一实施例提出的稀疏参数的获取方法的流程示意图。
如图3所示,该稀疏参数的获取方法,包括:
S301:将中央处理器CPU中与待处理稀疏特征关联的第二存储编号确定为待处理存储编号。
本公开实施例中,可以是将中央处理器CPU中存储的与待处理稀疏特征相同的初始稀疏特征关联的第二存储编号确定为待处理存储编号,而后,可以基于待处理存储编号,触发执行后续的稀疏参数的获取方法,对此不做限制。
S302:确定一个初始稀疏特征所对应的初始稀疏参数的参数数量。
本公开实施例中,不同初始稀疏特征所对应的初始稀疏参数的参数数量相同。
也即是说,本公开实施例中,每个初始稀疏特征存在与其所对应的相同参数数量的初始稀疏参数,例如,对于初始稀疏特征A存在与其对应的初始稀疏参数a1、a2、a3,对于初始稀疏特征B存在与其对应的初始稀疏参数b1、b2、b3,对此不做限制。
S303:根据待处理存储编号和参数数量,从多个初始稀疏参数中确定目标稀疏参数。
本公开实施例在将中央处理器CPU中与待处理稀疏特征关联的第二存储编号确定为待处理存储编号,并确定一个初始稀疏特征所对应的初始稀疏参数的参数数量之后,可以根据待处理存储编号和参数数量,从多个初始稀疏参数中确定目标稀疏参数。
也即是说,本公开实施例中,可以是根据待处理存储编号和参数数量,对目标稀疏参数在中央处理器CPU中的位置进行定位,以实现从多个初始稀疏参数中确定目标稀疏参数。
可选地,一些实施例中,根据待处理存储编号和参数数量,从多个初始稀疏参数中确定目标稀疏参数,可以是根据参数数量和待处理存储编号,确定目标存储编号,并根据目标存储编号和参数数量,从多个初始稀疏参数中确定目标稀疏参数。
也即是说,本公开实施例中,可以是根据参数数量和待处理存储编号,确定目标存储编号,由于一个初始稀疏特征可以对应多个初始稀疏参数,从而目标存储编号可以用于表征目标稀疏参数调用的初始调用位置,而后,基于目标存储编号从图形处理器GPU中获取目标稀疏参数。
可选地,一些实施例中,根据参数数量和待处理存储编号,确定目标存储编号,可以是将参数数量和待处理存储编号的乘积作为目标存储编号。
也即是说,本公开实施例中,可以是在确定一个初始稀疏特征所对应的初始稀疏参数的参数数量,并确定待处理存储编号后,将参数数量和待处理存储编号的乘积作为目标存储编号。
本公开实施例中在确定目标存储编号后,可以根据目标存储编号和参数数量,从多个初始稀疏参数中确定目标稀疏参数。
举例而言,初始稀疏参数为a1、a2、a3、b1、b2、b3,与前述不同初始稀疏参数分别对应的第一存储编号依次为:0、1、2、3、4、5,参数数量为3,目标存储编号为3,由此,根据目标存储编号和参数数量,从多个初始稀疏参数中确定目标稀疏参数,可以是从第一存储编号为3开始调用3个初始稀疏参数为目标稀疏参数,即将与第一存储编号3、4、5相应的初始稀疏参数确定为目标稀疏参数,对此不做限制。
可选地,一些实施例中,根据目标存储编号和参数数量,从多个初始稀疏参数中确定目标稀疏参数,可以是根据目标存储编号和参数数量,确定目标调用编号,并将图形处理器GPU中与目标调用编号关联的初始稀疏参数确定为目标稀疏参数。
其中,目标调用编号表示目标稀疏参数在图形处理器GPU的存储位置。
举例而言,初始稀疏参数为a1、a2、a3、b1、b2、b3,与前述不同初始稀疏参数分别对应的第一存储编号依次为:0、1、2、3、4、5,参数数量为3,目标存储编号为3,由此可以根据参数数量3和目标存储编号为3确定目标调用编号为3、4、5,而后,可以将图形处理器GPU中与目标调用编号3、4、5关联的初始稀疏参数确定为目标稀疏参数,对此不做限制。
本公开实施例中,通过将中央处理器CPU中与待处理稀疏特征关联的第二存储编号确定为待处理存储编号,并确定一个初始稀疏特征所对应的初始稀疏参数的参数数量,再根据待处理存储编号和参数数量,从多个初始稀疏参数中确定目标稀疏参数,能够基于待处理稀疏特征在中央处理器CPU中的待处理存储编号,实现从图形处理器GPU快速调用与待处理稀疏特征对应的目标稀疏参数,在不引入其他资源消耗的情况下,有效地提升稀疏参数的获取效率。
图4是本公开一实施例提出的稀疏参数的获取装置的结构示意图。
如图4所示,该稀疏参数的获取装置40,包括:
第一获取模块401,用于获取待处理稀疏特征的待处理存储编号,其中,待处理存储编号表示待处理稀疏特征在中央处理器CPU中的存储位置;
确定模块402,用于根据待处理存储编号,从多个初始稀疏参数中确定目标稀疏参数。
在本公开的一些实施例中,如图5所示,图5是本公开另一实施例提出的稀疏参数的获取装置的结构示意图,稀疏参数的获取装置40,还包括:
第二获取模块403,用于在获取待处理稀疏特征的待处理存储编号之前,获取多个初始稀疏参数,其中,不同初始稀疏参数具有对应的第一排列次序;
第一生成模块404,用于根据第一排列次序,生成与相应初始稀疏参数对应的第一存储编号;
第一处理模块405,用于将多个初始稀疏参数和分别与其对应的多个第一存储编号,关联存储至图形处理器GPU。
在本公开的一些实施例中,稀疏参数的获取装置40,还包括:
第三获取模块406,用于在获取待处理稀疏特征的待处理存储编号之前,获取多个初始稀疏特征,其中,不同初始稀疏特征具有对应的第二排列次序;
第二生成模块407,用于根据第二排列次序,生成与初始稀疏特征对应的第二存储编号;
第二处理模块408,用于将多个初始稀疏特征和分别与其对应的多个第二存储编号,关联存储至中央处理器CPU。
在本公开的一些实施例中,第一获取模块401,还用于:
将中央处理器CPU中与待处理稀疏特征关联的第二存储编号确定为待处理存储编号。
在本公开的一些实施例中,不同初始稀疏特征所对应的初始稀疏参数的参数数量相同;
其中,确定模块402,还用于:
确定一个初始稀疏特征所对应的初始稀疏参数的参数数量;
根据待处理存储编号和参数数量,从多个初始稀疏参数中确定目标稀疏参数。
在本公开的一些实施例中,确定模块402,还用于:
根据参数数量和待处理存储编号,确定目标存储编号;
根据目标存储编号和参数数量,从多个初始稀疏参数中确定目标稀疏参数。
在本公开的一些实施例中,确定模块402,还用于:
将参数数量和待处理存储编号的乘积作为目标存储编号。
在本公开的一些实施例中,确定模块402,还用于:
根据目标存储编号和参数数量,确定目标调用编号,其中,目标调用编号表示目标稀疏参数在图形处理器GPU的存储位置;
将图形处理器GPU中与目标调用编号关联的初始稀疏参数确定为目标稀疏参数。
与上述图1至图3实施例提供的稀疏参数的获取方法相对应,本公开还提供一种稀疏参数的获取装置,由于本公开实施例提供的稀疏参数的获取装置与上述图1至图3实施例提供的稀疏参数的获取方法相对应,因此在稀疏参数的获取方法的实施方式也适用于本公开实施例提供的稀疏参数的获取装置,在本公开实施例中不再详细描述。
本实施例中,通过获取待处理稀疏特征的待处理存储编号,其中,待处理存储编号表示待处理稀疏特征在中央处理器CPU中的存储位置,根据待处理存储编号,从多个初始稀疏参数中确定目标稀疏参数,由此,能够基于待处理稀疏特征在中央处理器CPU中的待处理存储编号,实现从图形处理器GPU快速调用与待处理稀疏特征对应的目标稀疏参数,在不引入其他资源消耗的情况下,有效地提升稀疏参数的获取效率。
为了实现上述实施例,本公开还提出一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时,实现如本公开前述实施例提出的稀疏参数的获取方法。
为了实现上述实施例,本公开还提出一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本公开前述实施例提出的稀疏参数的获取方法。
为了实现上述实施例,本公开还提出一种计算机程序产品,当计算机程序产品中的指令处理器执行时,执行如本公开前述实施例提出的稀疏参数的获取方法。
图6示出了适于用来实现本公开实施方式的示例性电子设备的框图。图6显示的电子设备12仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图6所示,电子设备12以通用计算设备的形式表现。电子设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture;以下简称:ISA)总线,微通道体系结构(Micro Channel Architecture;以下简称:MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics StandardsAssociation;以下简称:VESA)局域总线以及外围组件互连(Peripheral ComponentInterconnection;以下简称:PCI)总线。
电子设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory;以下简称:RAM)30和/或高速缓存存储器32。电子设备12可以进一步包括其他可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图6未显示,通常称为“硬盘驱动器”)。
尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如:光盘只读存储器(Compact Disc Read OnlyMemory;以下简称:CD-ROM)、数字多功能只读光盘(Digital Video Disc Read OnlyMemory;以下简称:DVD-ROM)或者其他光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本公开各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其他程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本公开所描述的实施例中的功能和/或方法。
电子设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该电子设备12交互的设备通信,和/或与使得该电子设备12能与一个或多个其他计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,电子设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(Local Area Network;以下简称:LAN),广域网(Wide Area Network;以下简称:WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与电子设备12的其他模块通信。应当明白,尽管图中未示出,可以结合电子设备12使用其他硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现前述实施例中提及的稀疏参数的获取方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
需要说明的是,在本公开的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本公开的描述中,除非另有说明,“多个”的含义是两个或两个以上。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本公开的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本公开的实施例所属技术领域的技术人员所理解。
应当理解,本公开的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本公开各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本公开的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本公开的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本公开的限制,本领域的普通技术人员在本公开的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (18)
1.一种稀疏参数的获取方法,其特征在于,被电子设备执行,所述电子设备包括:中央处理器CPU以及图形处理器GPU,所述图形处理器GPU包括:多个初始稀疏参数,所述方法包括:
获取待处理稀疏特征的待处理存储编号,其中,所述待处理存储编号表示所述待处理稀疏特征在所述中央处理器CPU中的存储位置;
根据所述待处理存储编号,从所述多个初始稀疏参数中确定目标稀疏参数。
2.如权利要求1所述的方法,其特征在于,在所述获取待处理稀疏特征的待处理存储编号之前,所述方法还包括:
获取所述多个初始稀疏参数,其中,不同所述初始稀疏参数具有对应的第一排列次序;
根据所述第一排列次序,生成与相应所述初始稀疏参数对应的第一存储编号;
将所述多个初始稀疏参数和分别与其对应的多个第一存储编号,关联存储至所述图形处理器GPU。
3.如权利要求2所述的方法,其特征在于,在所述获取待处理稀疏特征的待处理存储编号之前,所述方法还包括:
获取多个所述初始稀疏特征,其中,不同所述初始稀疏特征具有对应的第二排列次序;
根据所述第二排列次序,生成与所述初始稀疏特征对应的第二存储编号;
将所述多个初始稀疏特征和分别与其对应的多个第二存储编号,关联存储至所述中央处理器CPU。
4.如权利要求3所述的方法,其特征在于,所述获取待处理稀疏特征的待处理存储编号,包括:
将所述中央处理器CPU中与所述待处理稀疏特征关联的所述第二存储编号确定为所述待处理存储编号。
5.如权利要求3所述的方法,其特征在于,不同所述初始稀疏特征所对应的所述初始稀疏参数的参数数量相同;
其中,所述根据所述待处理存储编号,从所述多个初始稀疏参数中确定目标稀疏参数,包括:
确定一个所述初始稀疏特征所对应的所述初始稀疏参数的参数数量;
根据所述待处理存储编号和所述参数数量,从所述多个初始稀疏参数中确定所述目标稀疏参数。
6.如权利要求5所述的方法,其特征在于,所述根据所述待处理存储编号和所述参数数量,从所述多个初始稀疏参数中确定所述目标稀疏参数,包括:
根据所述参数数量和所述待处理存储编号,确定目标存储编号;
根据所述目标存储编号和所述参数数量,从所述多个初始稀疏参数中确定所述目标稀疏参数。
7.如权利要求6所述的方法,其特征在于,所述根据所述参数数量和所述待处理存储编号,确定目标存储编号,包括:
将所述参数数量和所述待处理存储编号的乘积作为所述目标存储编号。
8.如权利要求6所述的方法,其特征在于,所述根据所述目标存储编号和所述参数数量,从所述多个初始稀疏参数中确定所述目标稀疏参数,包括:
根据所述目标存储编号和所述参数数量,确定目标调用编号,其中,所述目标调用编号表示所述目标稀疏参数在所述图形处理器GPU的存储位置;
将所述图形处理器GPU中与所述目标调用编号关联的所述初始稀疏参数确定为所述目标稀疏参数。
9.一种稀疏参数的获取装置,其特征在于,所述装置包括:
第一获取模块,用于获取待处理稀疏特征的待处理存储编号,其中,所述待处理存储编号表示所述待处理稀疏特征在所述中央处理器CPU中的存储位置;
确定模块,用于根据所述待处理存储编号,从所述多个初始稀疏参数中确定目标稀疏参数。
10.如权利要求9所述的装置,其特征在于,所述装置还包括:
第二获取模块,用于在所述获取待处理稀疏特征的待处理存储编号之前,获取所述多个初始稀疏参数,其中,不同所述初始稀疏参数具有对应的第一排列次序;
第一生成模块,用于根据所述第一排列次序,生成与相应所述初始稀疏参数对应的第一存储编号;
第一处理模块,用于将所述多个初始稀疏参数和分别与其对应的多个第一存储编号,关联存储至所述图形处理器GPU。
11.如权利要求10所述的装置,其特征在于,所述装置还包括:
第三获取模块,用于在所述获取待处理稀疏特征的待处理存储编号之前,获取多个所述初始稀疏特征,其中,不同所述初始稀疏特征具有对应的第二排列次序;
第二生成模块,用于根据所述第二排列次序,生成与所述初始稀疏特征对应的第二存储编号;
第二处理模块,用于将所述多个初始稀疏特征和分别与其对应的多个第二存储编号,关联存储至所述中央处理器CPU。
12.如权利要求11所述的装置,其特征在于,所述获第一获取模块,还用于:
将所述中央处理器CPU中与所述待处理稀疏特征关联的所述第二存储编号确定为所述待处理存储编号。
13.如权利要求11所述的装置,其特征在于,不同所述初始稀疏特征所对应的所述初始稀疏参数的参数数量相同;
其中,所述确定模块,还用于:
确定一个所述初始稀疏特征所对应的所述初始稀疏参数的参数数量;
根据所述待处理存储编号和所述参数数量,从所述多个初始稀疏参数中确定所述目标稀疏参数。
14.如权利要求13所述的装置,其特征在于,所述确定模块,还用于:
根据所述参数数量和所述待处理存储编号,确定目标存储编号;
根据所述目标存储编号和所述参数数量,从所述多个初始稀疏参数中确定所述目标稀疏参数。
15.如权利要求14所述的装置,其特征在于,所述确定模块,还用于:
将所述参数数量和所述待处理存储编号的乘积作为所述目标存储编号。
16.如权利要求14所述的装置,其特征在于,所述确定模块,还用于:
根据所述目标存储编号和所述参数数量,确定目标调用编号,其中,所述目标调用编号表示所述目标稀疏参数在所述图形处理器GPU的存储位置;
将所述图形处理器GPU中与所述目标调用编号关联的所述初始稀疏参数确定为所述目标稀疏参数。
17.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-8中任一项所述的方法。
18.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行权利要求1-8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211591744.6A CN116342366A (zh) | 2022-12-12 | 2022-12-12 | 稀疏参数的获取方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211591744.6A CN116342366A (zh) | 2022-12-12 | 2022-12-12 | 稀疏参数的获取方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116342366A true CN116342366A (zh) | 2023-06-27 |
Family
ID=86884639
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211591744.6A Pending CN116342366A (zh) | 2022-12-12 | 2022-12-12 | 稀疏参数的获取方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116342366A (zh) |
-
2022
- 2022-12-12 CN CN202211591744.6A patent/CN116342366A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111090628B (zh) | 一种数据处理方法、装置、存储介质及电子设备 | |
CN110008045A (zh) | 微服务的聚合方法、装置、设备及存储介质 | |
CN109376256B (zh) | 图像搜索方法及装置 | |
KR20160031328A (ko) | 렌더링 방법 및 장치 | |
CN111291882A (zh) | 一种模型转换的方法、装置、设备和计算机存储介质 | |
KR102546631B1 (ko) | 영상 데이터 증식 장치 및 방법 | |
CN110232969A (zh) | 医学影像上传至云服务器的方法、装置、终端和存储介质 | |
CN111930317A (zh) | 基于ceph数据分布方法、装置、服务器及存储介质 | |
JP2024511018A (ja) | 空間関係の決定方法、装置、コンピュータ装置及び記憶媒体 | |
CN109697083B (zh) | 数据的定点化加速方法、装置、电子设备及存储介质 | |
CN108520532B (zh) | 识别视频中物体运动方向的方法及装置 | |
CN113516697A (zh) | 图像配准的方法、装置、电子设备及计算机可读存储介质 | |
CN114723652A (zh) | 细胞密度确定方法、装置、电子设备及存储介质 | |
CN111382643B (zh) | 一种手势检测方法、装置、设备及存储介质 | |
CN111246214B (zh) | 一种视频解码方法、装置 | |
CN116342366A (zh) | 稀疏参数的获取方法、装置、电子设备及存储介质 | |
CN108897872B (zh) | 对话处理方法、装置、计算机设备和存储介质 | |
CN109271538A (zh) | 一种图片存储方法及相关设备 | |
CN109816536B (zh) | 清单去重方法、装置和计算机设备 | |
JP2014099848A (ja) | イメージ分割システム及びその方法 | |
CN109408028B (zh) | 浮点数运算方法、装置及存储介质 | |
CN114155567A (zh) | 目标检测方法及装置、存储介质及电子设备 | |
CN101594480B (zh) | 一种字幕数据处理的方法 | |
CN113297054A (zh) | 测试流量集的获取方法、装置和存储介质 | |
CN118381936B (zh) | 一种视频数据处理方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |