CN117742977B - 芯片内存数据拷贝方法、电子设备和介质 - Google Patents
芯片内存数据拷贝方法、电子设备和介质 Download PDFInfo
- Publication number
- CN117742977B CN117742977B CN202410186738.5A CN202410186738A CN117742977B CN 117742977 B CN117742977 B CN 117742977B CN 202410186738 A CN202410186738 A CN 202410186738A CN 117742977 B CN117742977 B CN 117742977B
- Authority
- CN
- China
- Prior art keywords
- copy
- thread
- allocated
- task
- thread group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 239000000758 substrate Substances 0.000 claims 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 241000272814 Anser sp. Species 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Landscapes
- Memory System Of A Hierarchy Structure (AREA)
Abstract
本发明涉及芯片技术领域,尤其涉及一种芯片内存数据拷贝方法、电子设备和介质,方法包括步骤S1、将芯片中的拷贝线程划分为M个拷贝线程组,每一拷贝线程组包括N个拷贝线程;步骤S2、基于芯片可执行单元中的缓存行总数P、拷贝线程组总数M、缓存行长度L、每个拷贝线程组中的拷贝线程总数N确定每个拷贝线程的操作数据长度Q;步骤S3、拷贝线程组接收拷贝任务,基于每个拷贝线程的操作数据长度Q将当前接收的拷贝任务划分为Xm个子任务,由拷贝线程组中的线程并行执行当前接收的拷贝任务,当完成时,执行步骤S4;步骤S4、将下一个拷贝任务发送给拷贝线程组Gm,返回执行步骤S3。本发明提高了芯片内存数据的拷贝效率。
Description
技术领域
本发明涉及芯片技术领域,尤其涉及一种芯片内存数据拷贝方法、电子设备和介质。
背景技术
在芯片运行过程中,通常需要从芯片内存的一个地址中的数据拷贝至芯片内存中另外一个地址,拷贝过程由芯片上并行运行的线程来实现。拷贝数据需要先存储在芯片缓存(cache)中,线程从芯片缓存中获取拷贝数据,存储至目标地址。现有技术中,通常将每一数据拷贝任务分别分配至一个对应的线程,将任务和线程严格绑定,每一线程执行一个拷贝任务,多个拷贝任务并行执行,无论线程绑定拷贝任务对应的拷贝数据的大小,每一线程至少占用一个缓存行(cacheline)。但是,缓存行数量有限,因此可能导致一些线程无法分配到对应的缓存行,导致一些拷贝任务无法在缓存中命中拷贝数据,需要长时间等待,从而降低了内存数据拷贝速度,导致内存数据拷贝效率低。由此可知,如何提高芯片内存数据的拷贝效率成为亟待解决的技术问题。
发明内容
本发明目的在于,提供一种芯片内存数据拷贝方法、电子设备和介质,提高了芯片内存数据的拷贝效率。
根据本发明第一方面,提供了一种芯片内存数据拷贝方法,包括:
步骤S1、将芯片中的拷贝线程划分为M个拷贝线程组{G1,G2,…,Gm,…,GM},Gm为第m个拷贝线程组,m的取值范围为1到M,M为拷贝线程组总数,Gm={T1 m,T2 m,…,Tn m,…,TN m},Tn m为Gm中第n个拷贝线程,n的取值范围为1到N,N为每个拷贝线程组中的拷贝线程总数;
步骤S2、基于芯片可执行单元中的缓存行总数P、拷贝线程组总数M、缓存行长度L、每个拷贝线程组中的拷贝线程总数N确定每个拷贝线程的操作数据长度Q;
步骤S3、拷贝线程组Gm接收拷贝任务,基于每个拷贝线程的操作数据长度Q将当前接收的拷贝任务划分为Xm个子任务,由拷贝线程组Gm中的线程并行执行当前接收的拷贝任务,当拷贝线程组Gm完成当前拷贝任务时,执行步骤S4;
步骤S4、将下一个拷贝任务发送给拷贝线程组Gm,返回执行步骤S3。
根据本发明第二方面,提供一种电子设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被设置为用于执行本发明第一方面所述的方法。
根据本发明第三方面,提供一种计算机可读存储介质,存储有计算机可执行指令,所述计算机指令用于执行本发明第一方面所述的方法。
本发明与现有技术相比具有明显的优点和有益效果。借由上述技术方案,本发明提供的一种芯片内存数据拷贝方法、电子设备和介质可达到相当的技术进步性及实用性,并具有产业上的广泛利用价值,其至少具有以下有益效果:
本发明将芯片中的拷贝线程进行分组,还将每一个任务进行切分,采用线程组中的多个拷贝线程并行执行同一个任务,减少了缓存行的使用频率,提高了拷贝数据在缓存中的命中率,从而提高了芯片内存数据的拷贝效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的芯片内存数据拷贝方法流程图;
图2为拷贝线程基于现有技术的拷贝执行情况示意图;
图3为拷贝线程基于本发明的拷贝执行情况示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种芯片内存数据拷贝方法,如图1所示,包括:
步骤S1、将芯片中的拷贝线程划分为M个拷贝线程组{G1,G2,…,Gm,…,GM},Gm为第m个拷贝线程组,m的取值范围为1到M,M为拷贝线程组总数,Gm={T1 m,T2 m,…,Tn m,…,TN m},Tn m为Gm中第n个拷贝线程,n的取值范围为1到N,N为每个拷贝线程组中的拷贝线程总数。
步骤S2、基于芯片可执行单元(AP)中的缓存行总数P、拷贝线程组总数M、缓存行长度L、每个拷贝线程组中的拷贝线程总数N确定每个拷贝线程的操作数据长度Q。
步骤S3、拷贝线程组Gm接收拷贝任务,基于每个拷贝线程的操作数据长度Q将当前接收的拷贝任务划分为Xm个子任务,由拷贝线程组Gm中的线程并行执行当前接收的拷贝任务,当拷贝线程组Gm完成当前拷贝任务时,执行步骤S4。
其中,每一拷贝线程在执行拷贝操作时,运行一个对应的拷贝函数。
步骤S4、将下一个拷贝任务发送给拷贝线程组Gm,返回执行步骤S3。
可以理解的是,当拷贝线程组执行完当前拷贝任务之后,可以继续处理下一个拷贝任务,直至所有拷贝线程组把所有需要执行的拷贝任务执行完毕。采用拷贝线程组并行执行一个拷贝任务的方式相较于现有技术中为每一拷贝线程分配一个拷贝任务并行执行的方式,能够大大减少整体总的拷贝时间,提高数据拷贝效率。
作为一种实施例,所述步骤S2包括:
步骤S21、缓存行总数P和拷贝线程组总数M确定每一线程组能够使用的缓存行数量C:
C=P/M。
步骤S22、基于每一线程组能够使用的缓存行数量C、缓存行长度L和每个拷贝线程组中的拷贝线程总数N确定每个拷贝线程的操作数据长度Q:
Q=(C×L)/N。
优选的,每个拷贝线程组中的拷贝线程总数相同,M和N通常设置为2的整数次方,作为一种示例,芯片中共存在2048个拷贝线程,拷贝线程指的是能够执行数据拷贝操作的线程,N设置为8,那么M等于2048/8=256。缓存行总数P设置为256,则每一线程组能够使用的缓存行数量C=P/M=256/256=1。缓存行长度L设置为128bytes,每个拷贝线程的操作数据长度Q=(C×L)/N=(1×128)/8=16bytes。基于此,当为一个拷贝线程分配一个缓存行时,将缓存行也切分为8个缓存区域,每个缓存区域内的地址连续,每一拷贝线程对应一个缓存区域。
作为一种实施例,所述步骤S3包括:
步骤S31、拷贝线程组Gm接收拷贝任务,解析获取当前拷贝任务对应的源地址、目标地址和拷贝数据长度K。
需要说明的是,拷贝任务对应的源地址和目标地址均为芯片内存中的地址,源地址读取数据操作的起始地址,目标地址为写入操作的起始地址,结合拷贝数据长度即可执行对应的读取操作和写入操作,从而实现芯片内存数据拷贝。
步骤S32、基于拷贝数据长度K和每个拷贝线程的操作数据长度Q确定当前拷贝任务所需拷贝线程数E:
,
其中,表示向上取整。
步骤S33、将当前拷贝任务划分为E个子任务{Y1,Y2,…,Ye,…,YE},并基于当前拷贝任务对应的源地址、目标地址、每个拷贝线程的操作数据长度Q确定每一子任务对应的子源地址和子目标地址,Ye为当前拷贝任务的第e个子任务,e的取值范围为1到E。
步骤S34、拷贝线程组Gm中的线程基于每一子任务对应的子源地址和子目标地址并行执行{Y1,Y2,…,Ye,…,YE}。
作为一种实施例,所述步骤S34包括:
步骤S341、基于当前拷贝任务所需拷贝线程数E和拷贝线程组中的拷贝线程总数N确定当前拷贝任务的拷贝轮次总数H:
。
需要说明的是,每一拷贝线程在在执行拷贝任务时,分配一个缓存行,因此,当拷贝任务对应的数据长度小于等于缓存行长度时,仅需一轮即可执行完,当拷贝任务对应的数据长度大于缓存行长度时,需要多轮才可执行完毕,因此,先通过当前拷贝任务所需拷贝线程数E和拷贝线程组中的拷贝线程总数N确定当前拷贝任务的拷贝轮次总数H。
步骤S342、设置h=1,执行步骤S343。
步骤S343、为拷贝线程组Gm分配一个缓存行,将所分配的缓存行划分为N个缓存区域,并为拷贝线程组Gm中每一拷贝线程Tn m设置一个对应的拷贝区域,若h<H,则执行步骤S344,h=H,执行步骤S345。
需要说明的是,若h<H,则说明拷贝任务需要执行多轮,且当前执行轮次不是最后一轮,则当前轮次需要使用拷贝线程组Gm中所有的拷贝线程,需要使用当前分配的缓存行中的N个缓存区域。而当h=H时,一种可能是拷贝任务仅需要执行1轮,还有一种可能是拷贝任务需要执行多轮,当前已执行到最后一轮,这两种情况,可能需要使用拷贝线程组Gm中所有的拷贝线程,也可能使用拷贝线程组Gm中的部分拷贝线程,因此,需要基于h<H、h=H两种情况执行不同的操作。
步骤S344、从当前未分配的子任务中选择N个待分配子任务,为每一待分配子任务分配一个拷贝线程组Gm中对应的拷贝线程,每一分配子任务的拷贝线程基于所分配子任务对应的子源地址和子目标地址,以及对应的拷贝区域执行对应的拷贝操作,拷贝线程组Gm中所有拷贝线程执行完对应的拷贝操作后,设置h=h+1,返回执行步骤S343。
步骤S345、将当前未分配的所有子任务全部确定为待分配子任务,从拷贝线程组Gm中为每一待分配子任务分配一个拷贝线程,每一分配子任务的拷贝线程基于所分配子任务对应的子源地址和子目标地址,以及对应的拷贝区域执行对应的拷贝操作,未分配子任务的拷贝线程不执行拷贝操作,拷贝线程组Gm中所有分配子任务的拷贝线程执行完对应的拷贝操作后,执行步骤S4。
需要说明的是,由于拷贝线程组Gm中多个拷贝线程并行执行同一拷贝任务,因此对于步骤S345中存在未分配子任务的拷贝线程的情况,由于整体值性效率高,会在短时间内完成执行任务,因此,整体上也不会造成线程资源的浪费。
作为一种实施例,所述步骤S344和步骤S345中,每一分配子任务的拷贝线程基于所分配子任务对应的子源地址和子目标地址,以及对应的拷贝区域执行对应的拷贝操作,包括:
步骤S3441、每一分配子任务的拷贝线程查询对应的拷贝区域是否存在所分配子任务对应的拷贝数据,若存在,则执行步骤S3443,否则,执行步骤S3442。
步骤S3442、基于所分配子任务对应的子源地址从芯片内存中获取对应的拷贝数据,存储至缓存行对应的拷贝区域中。
可以理解的是,在内存中,每一分配子任务的拷贝线程以所分配子任务对应的子源地址为起点,读取每个拷贝线程的操作数据长度Q的数据,再将所读取的数据拷贝至缓存行对应的拷贝区域中,缓存行对应的拷贝区域的大小和每个拷贝线程的操作数据长度Q相等。
步骤S3443、基于所分配子任务对应的子目标地址将缓存行对应的拷贝区域中对应的拷贝数据拷贝至芯片内存。
可以理解的是,拷贝线程将缓存行对应的拷贝区域中对应的拷贝数据拷贝至芯片内存中,以子目标地址为起点,长度为每个拷贝线程的操作数据长度Q的区域中。
为了更清晰表述本发明实施例所达到的缩短芯片内存数据拷贝时间的效果,以下通过一个具体示例,分别基于现有技术和本发明实施例所对应的拷贝执行情况来进一步对比说明:
假设一个拷贝线程组包括8个拷贝线程,分别为T0、T1、T2、T3、T4、T5、T6和T7。现在需要将8个任务分发给该拷贝线程组来执行。任务1的数据长度为7,任务2的数据长度为10,任务3的数据长度为3,任务4的数据长度为25,任务5的数据长度为31,任务6的数据长度为11,任务7的数据长度为15,任务8的数据长度为2。
若采用现有技术,任务分配的执行情况如图2所示,为每一线程绑定一个任务来执行,图2中,每一列对应一个拷贝任务,每一格代表一个单位长度,数据长度和需要花费的拷贝时间成正比。每一线程对应的竖列中的数据是该线程需要执行拷贝操作的数据。通过图1可知,8个拷贝线程需要等到T4_30对应的数据拷贝完,才执行完8个任务,才能执行下一批任务。
若采用本发明实施例进行执行,任务分配情况如图3所示,每一任务均由8个线程并行执行,8个任务串行执行,即8个线程并行执行完一个任务后再执行下一个任务。每一线程对应的竖列中的数据,是该线程所分配的需要执行拷贝操作的数据。通过对比图2和图3可知,本发明相较于现有技术的处理方式,极大提高了线程资源的利用率,减少了缓存行的占用数量,缩短了数据拷贝所需时间,提高了芯片内存数据拷贝效率。
以上实施例针对的默认所有拷贝线程全部开启的应用场景。实际使用场景中,还存在一些拷贝线程仅需使用一次的情况,或者仅适用某几次,其他时候不使用的情况,这样的场景下,芯片中会设置掩码序列,控制拷贝线程在需要使用的时候打开,不需要使用的时候关闭,这样会使得部分线程长期关闭,造成线程资源的浪费,基于此场景,本发明实施例也做出进一步赶紧,作为一种实施例,所述步骤S343包括:
步骤S3431、获取当前拷贝线程组Gm对应的掩码序列(U1 m,U2 m,…,Un m,…,UN m)作为原始掩码序列,Un m为Tn m对应的掩码值,Un m等于0或1;若Un m等于0,表示Tn m处于开启状态,若Un m等于1,表示Tn m处于关闭状态。
步骤S3432、将(U1 m,U2 m,…,Un m,…,UN m)中的所有Un m全部设置为1。
所述步骤S345中,在拷贝线程组Gm中所有分配子任务的拷贝线程执行完对应的拷贝操作后,执行:
步骤S3451、将(U1 m,U2 m,…,Un m,…,UN m)恢复为原始掩码序列。
需要说明的是,本发明实施例通过步骤S3431、步骤S3432和步骤S3451,既能实现线程组Gm在并行处理拷贝任务时,使得所有拷贝线程均处于开启状态,又能保证在拷贝任务处理完成时,及时将掩码序列回复为原始掩码序列,从而关闭需要关闭的拷贝线程,避免拷贝线程误执行其他操作,提高了需要关闭烤鹅比线程场景下的数据拷贝效率。
需要说明的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时处理可以被终止,但是还可以具有未包括在附图中的附加步骤。处理可以对应于方法、函数、规程、子例程、子程序等等。
本发明实施例还提供一种电子设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被设置为用于执行本发明实施例所述的方法。
本发明实施例还提供一种计算机可读存储介质,存储有计算机可执行指令,所述计算机指令用于执行本发明实施例所述的方法。
本发明实施例将芯片中的拷贝线程进行分组,还将每一个任务进行切分,采用线程组中的多个拷贝线程并行执行同一个任务,减少了缓存行的使用频率,提高了拷贝数据在缓存中的命中率,从而提高了芯片内存数据的拷贝效率。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容作出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。
Claims (7)
1.一种芯片内存数据拷贝方法,其特征在于,包括:
步骤S1、将芯片中的拷贝线程划分为M个拷贝线程组{G1,G2,…,Gm,…,GM},Gm为第m个拷贝线程组,m的取值范围为1到M,M为拷贝线程组总数,Gm={T1 m,T2 m,…,Tn m,…,TN m},Tn m为Gm中第n个拷贝线程,n的取值范围为1到N,N为每个拷贝线程组中的拷贝线程总数;
步骤S2、基于芯片可执行单元中的缓存行总数P、拷贝线程组总数M、缓存行长度L、每个拷贝线程组中的拷贝线程总数N确定每个拷贝线程的操作数据长度Q;
步骤S3、拷贝线程组Gm接收拷贝任务,基于每个拷贝线程的操作数据长度Q将当前接收的拷贝任务划分为Xm个子任务,由拷贝线程组Gm中的线程并行执行当前接收的拷贝任务,当拷贝线程组Gm完成当前拷贝任务时,执行步骤S4;
步骤S4、将下一个拷贝任务发送给拷贝线程组Gm,返回执行步骤S3;
所述步骤S2包括:
步骤S21、缓存行总数P和拷贝线程组总数M确定每一线程组能够使用的缓存行数量C:
C=P/M;
步骤S22、基于每一线程组能够使用的缓存行数量C、缓存行长度L和每个拷贝线程组中的拷贝线程总数N确定每个拷贝线程的操作数据长度Q:
Q=(C×L)/N。
2.根据权利要求1所述的方法,其特征在于,
所述步骤S3包括:
步骤S31、拷贝线程组Gm接收拷贝任务,解析获取当前拷贝任务对应的源地址、目标地址和拷贝数据长度K;
步骤S32、基于拷贝数据长度K和每个拷贝线程的操作数据长度Q确定当前拷贝任务所需拷贝线程数E:
其中,表示向上取整;
步骤S33、将当前拷贝任务划分为E个子任务{Y1,Y2,…,Ye,…,YE},并基于当前拷贝任务对应的源地址、目标地址、每个拷贝线程的操作数据长度Q确定每一子任务对应的子源地址和子目标地址,Ye为当前拷贝任务的第e个子任务,e的取值范围为1到E;
步骤S34、拷贝线程组Gm中的线程基于每一子任务对应的子源地址和子目标地址并行执行{Y1,Y2,…,Ye,…,YE}。
3.根据权利要求2所述的方法,其特征在于,
所述步骤S34包括:
步骤S341、基于当前拷贝任务所需拷贝线程数E和拷贝线程组中的拷贝线程总数N确定当前拷贝任务的拷贝轮次总数H:
;
步骤S342、设置h=1,执行步骤S343;
步骤S343、为拷贝线程组Gm分配一个缓存行,将所分配的缓存行划分为N个缓存区域,并为拷贝线程组Gm中每一拷贝线程Tn m设置一个对应的拷贝区域,若h<H,则执行步骤S344,h=H,执行步骤S345;
步骤S344、从当前未分配的子任务中选择N个待分配子任务,为每一待分配子任务分配一个拷贝线程组Gm中对应的拷贝线程,每一分配子任务的拷贝线程基于所分配子任务对应的子源地址和子目标地址,以及对应的拷贝区域执行对应的拷贝操作,拷贝线程组Gm中所有拷贝线程执行完对应的拷贝操作后,设置h=h+1,返回执行步骤S343;
步骤S345、将当前未分配的所有子任务全部确定为待分配子任务,从拷贝线程组Gm中为每一待分配子任务分配一个拷贝线程,每一分配子任务的拷贝线程基于所分配子任务对应的子源地址和子目标地址,以及对应的拷贝区域执行对应的拷贝操作,未分配子任务的拷贝线程不执行拷贝操作,拷贝线程组Gm中所有分配子任务的拷贝线程执行完对应的拷贝操作后,执行步骤S4。
4.根据权利要求3所述的方法,其特征在于,
所述步骤S344和步骤S345中,每一分配子任务的拷贝线程基于所分配子任务对应的子源地址和子目标地址,以及对应的拷贝区域执行对应的拷贝操作,包括:
步骤S3441、每一分配子任务的拷贝线程查询对应的拷贝区域是否存在所分配子任务对应的拷贝数据,若存在,则执行步骤S3443,否则,执行步骤S3442;
步骤S3442、基于所分配子任务对应的子源地址从芯片内存中获取对应的拷贝数据,存储至缓存行对应的拷贝区域中;
步骤S3443、基于所分配子任务对应的子目标地址将缓存行对应的拷贝区域中对应的拷贝数据拷贝至芯片内存。
5.根据权利要求3所述的方法,其特征在于,
所述步骤S343包括:
步骤S3431、获取当前拷贝线程组Gm对应的掩码序列(U1 m,U2 m,…,Un m,…,UN m)作为原始掩码序列,Un m为Tn m对应的掩码值,Un m等于0或1;若Un m等于0,表示Tn m处于开启状态,若Un m等于1,表示Tn m处于关闭状态;
步骤S3432、将(U1 m,U2 m,…,Un m,…,UN m)中的所有Un m全部设置为1;
所述步骤S345中,在拷贝线程组Gm中所有分配子任务的拷贝线程执行完对应的拷贝操作后,执行:
步骤S3451、将(U1 m,U2 m,…,Un m,…,UN m)恢复为原始掩码序列。
6.一种电子设备,其特征在于,包括:
至少一个处理器;
以及,与所述至少一个处理器通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被设置为用于执行前述权利要求1-5任一项所述的方法。
7.一种计算机可读存储介质,其特征在于,存储有计算机可执行指令,所述计算机可执行指令用于执行前述权利要求1-5中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410186738.5A CN117742977B (zh) | 2024-02-20 | 2024-02-20 | 芯片内存数据拷贝方法、电子设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410186738.5A CN117742977B (zh) | 2024-02-20 | 2024-02-20 | 芯片内存数据拷贝方法、电子设备和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117742977A CN117742977A (zh) | 2024-03-22 |
CN117742977B true CN117742977B (zh) | 2024-04-26 |
Family
ID=90261273
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410186738.5A Active CN117742977B (zh) | 2024-02-20 | 2024-02-20 | 芯片内存数据拷贝方法、电子设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117742977B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103019655A (zh) * | 2012-11-28 | 2013-04-03 | 中国人民解放军国防科学技术大学 | 面向多核微处理器的内存拷贝加速方法及装置 |
CN103645996A (zh) * | 2013-12-09 | 2014-03-19 | 龙芯中科技术有限公司 | 内存拷贝的方法、装置和片上系统 |
CN108694080A (zh) * | 2017-04-09 | 2018-10-23 | 英特尔公司 | 高效线程组调度 |
CN112486410A (zh) * | 2020-11-23 | 2021-03-12 | 华南师范大学 | 一种持久性内存文件读写方法、系统、装置及存储介质 |
CN116400622A (zh) * | 2023-04-03 | 2023-07-07 | 天津电气科学研究院有限公司 | 一种可组网高精度数据采集监控系统及方法 |
CN117291126A (zh) * | 2022-06-15 | 2023-12-26 | 沐曦科技(成都)有限公司 | 基于配置文件的soc芯片设计方法、电子设备和介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9563425B2 (en) * | 2012-11-28 | 2017-02-07 | Intel Corporation | Instruction and logic to provide pushing buffer copy and store functionality |
US9715452B2 (en) * | 2015-10-07 | 2017-07-25 | Oracle International Corporation | Methods to reduce memory foot-print of NUMA aware structures and data variables |
-
2024
- 2024-02-20 CN CN202410186738.5A patent/CN117742977B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103019655A (zh) * | 2012-11-28 | 2013-04-03 | 中国人民解放军国防科学技术大学 | 面向多核微处理器的内存拷贝加速方法及装置 |
CN103645996A (zh) * | 2013-12-09 | 2014-03-19 | 龙芯中科技术有限公司 | 内存拷贝的方法、装置和片上系统 |
CN108694080A (zh) * | 2017-04-09 | 2018-10-23 | 英特尔公司 | 高效线程组调度 |
CN112486410A (zh) * | 2020-11-23 | 2021-03-12 | 华南师范大学 | 一种持久性内存文件读写方法、系统、装置及存储介质 |
CN117291126A (zh) * | 2022-06-15 | 2023-12-26 | 沐曦科技(成都)有限公司 | 基于配置文件的soc芯片设计方法、电子设备和介质 |
CN116400622A (zh) * | 2023-04-03 | 2023-07-07 | 天津电气科学研究院有限公司 | 一种可组网高精度数据采集监控系统及方法 |
Non-Patent Citations (3)
Title |
---|
A memory access model for highly-threaded many-core architectures;panelLin Ma等;《Future Generation Computer Systems》;20130715;第30卷;第202-215页 * |
GPU 的资源与性能优化策略研究;杨伟光;《中国优秀硕士学位论文全文数据库 信息科技辑》;20190215(第2期);I138-1472 * |
基于可编程网卡的高性能数据中心系统;李博杰;《中国博士学位论文全文数据库 信息科技辑》;20190815(第8期);I137-4 * |
Also Published As
Publication number | Publication date |
---|---|
CN117742977A (zh) | 2024-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12039371B2 (en) | Memory allocation method and apparatus for neural network | |
US6725448B1 (en) | System to optimally create parallel processes and recording medium | |
KR100289627B1 (ko) | 멀티태스킹 기능을 가지는 정보처리시스템을 위한 자원관리방법 및 그 장치 | |
US8032884B2 (en) | Thread hand off | |
EP3462324B1 (en) | Pointers in a memory managed system | |
WO2022062833A1 (zh) | 内存分配方法及相关设备 | |
KR102594657B1 (ko) | 비순차적 리소스 할당을 구현하는 방법 및 장치 | |
CN113504984A (zh) | 一种任务处理方法以及网络设备 | |
CN106776395A (zh) | 一种共享集群的任务调度方法及装置 | |
US8775767B2 (en) | Method and system for allocating memory to a pipeline | |
CN106775975B (zh) | 进程调度方法及装置 | |
US20060069897A1 (en) | Information processing device and information processing method | |
CN116382880A (zh) | 任务执行方法、装置、处理器、电子设备及存储介质 | |
CN117742977B (zh) | 芯片内存数据拷贝方法、电子设备和介质 | |
JP5818824B2 (ja) | デュアル・モード・リーダ・ライタ・ロック | |
CN116502225B (zh) | 自适应分组冗余编排的病毒扫描方法、装置及电子设备 | |
CN117271136A (zh) | 数据处理方法、装置、设备和存储介质 | |
CN105378652A (zh) | 线程共享资源分配方法及装置 | |
CN116467065A (zh) | 算法模型训练方法、装置、电子设备及存储介质 | |
JP7217341B2 (ja) | プロセッサおよびレジスタの継承方法 | |
CN112395063B (zh) | 一种动态多线程调度方法及系统 | |
CN114741166A (zh) | 一种分布式任务的处理方法、分布式系统及第一设备 | |
US11500632B2 (en) | Processor device for executing SIMD instructions | |
JP2021115764A (ja) | 画像処理装置、画像処理方法 | |
CN118409871B (zh) | 一种数据处理方法、产品、服务器及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |