CN110647357B - 同步多线程处理器 - Google Patents

同步多线程处理器 Download PDF

Info

Publication number
CN110647357B
CN110647357B CN201810678760.6A CN201810678760A CN110647357B CN 110647357 B CN110647357 B CN 110647357B CN 201810678760 A CN201810678760 A CN 201810678760A CN 110647357 B CN110647357 B CN 110647357B
Authority
CN
China
Prior art keywords
pipeline
interruptible
pipelines
data
instruction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810678760.6A
Other languages
English (en)
Other versions
CN110647357A (zh
Inventor
纪忠良
刘培军
叶正国
安武牧
叶超
华少雄
刘新潮
曹效伦
杨柳西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Spreadtrum Communications Shanghai Co Ltd
Original Assignee
Spreadtrum Communications Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Spreadtrum Communications Shanghai Co Ltd filed Critical Spreadtrum Communications Shanghai Co Ltd
Priority to CN201810678760.6A priority Critical patent/CN110647357B/zh
Publication of CN110647357A publication Critical patent/CN110647357A/zh
Application granted granted Critical
Publication of CN110647357B publication Critical patent/CN110647357B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline or look ahead
    • G06F9/3867Concurrent instruction execution, e.g. pipeline or look ahead using instruction pipelines

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Memory System Of A Hierarchy Structure (AREA)
  • Advance Control (AREA)

Abstract

一种同步多线程处理器,包括:索引RAM、存储缓存器、数据高速缓存器以及至少两条流水线,其中:所述至少两条流水线,分别与所述索引RAM、所述存储缓存器以及所述数据高速缓存器均连接,适于访问所述数据高速缓存器;每一条流水线对应一个独立的线程,且至少一条流水线为可中断流水线,至少一条流水线为非可中断流水线,其中:所述可中断流水线适于在接收到数据存储指令时停止当前所执行的非数据存储指令,并执行所述数据存储指令。上述方案能够实现实时地进行数据存储操作。

Description

同步多线程处理器
技术领域
本发明涉及处理器领域,尤其涉及一种同步多线程处理器。
背景技术
高速缓存器是内存子系统中的一个组成部分。高速缓存器可以临时存储内存数据,从而为处理器提供快速访问。高速缓存器的缓存结构可以是多层的,例如一级高速缓存和二级高速缓存。在现有技术中,高速缓存器根据存储的数据不同,又可以分为数据高速缓存器和指令高速缓存器。
同步多线程(Simultaneous Multi-Threading,SMT)是一种优化片上资源利用效率的技术。在SMT处理器中,存储资源可以被不同的硬件线程复用,例如浮点单元、算术逻辑单元和高速缓存等的计算资源被多个线程共享。
在现有技术中,处理器在进行流水线操作时,若此时并发有数据存储操作,则通常需要在流水线上的操作指令完成之后再进行数据存储操作,无法在流水线繁忙时实现实时的数据存储。
发明内容
本发明实施例解决的是如何实现实时地进行数据存储操作。
为解决上述技术问题,本发明实施例提供一种同步多线程处理器,包括:索引RAM、存储缓存器、数据高速缓存器以及至少两条流水线,其中:所述至少两条流水线,分别与所述索引RAM、所述存储缓存器以及所述数据高速缓存器均连接,适于访问所述数据高速缓存器;每一条流水线对应一个独立的线程,且至少一条流水线为可中断流水线,至少一条流水线为非可中断流水线,其中:所述可中断流水线适于在接收到数据存储指令时停止当前所执行的非数据存储指令,并执行所述数据存储指令。
可选的,所述同步多线程处理器还包括:与每一条流水线一一对应设置的分级缓存器组,其中:第i条流水线对应的分级缓存器组中的每一个分级缓存器,适于缓存所述第i条流水线执行相应指令时所对应的中间数据,1<i≤N,N为流水线总数。
可选的,所述可中断流水线对应的分级缓存器组,还适于存储所述非可中断流水线执行相应指令时所对应的中间数据。
可选的,所述非可中断流水线在执行相应指令时对应的输出结果为:所述非可中断流水线在执行相应指令时对应的中间数据,与所述可中断流水线所存储的所述非可中断流水线执行相应指令时所对应的中间数据的合并结果。
可选的,所述可中断流水线对应的分级缓存器组包括:定时清除单元,适于在定时时长达到预设时长时,清除所述可中断流水线上的非加载指令。
可选的,所述可中断流水线,还适于在未执行操作指令且不存在缓存冲突时,监听外部请求。
可选的,所述同步多线程处理器还包括:仲裁单元,与所有流水线均耦接,适于当检测到任意两条流水线上的访问指令冲突时,对发生冲突的流水线上的访问指令进行排序,以使得所述发生冲突的流水线上的访问指令按顺序访问。
可选的,所述索引RAM与每一条流水线一一对应。
可选的,所述存储缓存器与每一条流水线一一对应。
可选的,所有流水线均为支持同步多线程的流水线。
与现有技术相比,本发明实施例的技术方案具有以下有益效果:
在同步多线程处理器中设置有至少两条流水线,且其中至少一条流水线为可中断流水线。可中断流水线在接收到数据存储指令时停止当前所执行的非数据存储指令,转而执行接收到的数据存储指令。因此,当接收到数据存储指令时,存在至少一条流水线可以执行接收到的数据存储指令,从而实现实时地进行数据存储操作。
进一步,通过仲裁单元检查不同流水线上的访问指令是否发生冲突。当仲裁单元检测到任意两条流水线上的的访问指令冲突时,对发生访问冲突的流水线上的访问指令进行排序,使得发生冲突的流水线上的访问指令按顺序进行访问。
附图说明
图1是现有的一种处理器的结构示意图;
图2是本发明实施例中的一种同步多线程处理器的结构示意图;
图3是本发明实施例中的一种流水线的简化示意图。
具体实施方式
参照图1,给出了现有的一种处理器的结构示意图。图1中,流水线(Pipeline)101分别与索引RAM(Tag RAM)102、存储缓存器(Store Buffer)103、数据高速RAM(Data RAM)104以及指令管理单元(Request Management)105连接。索引RAM 102、存储缓存器103以及数据高速RAM 104均为存储单元。
数据加载指令可以通过指令管理单元105输出至流水线101。当图1中的处理器进行数据加载处理时,所有的加载指令都会经过流水线101。当流水线101上有数据加载指令时,先检查索引RAM 102中是否存在与数据加载指令对应的地址,也即判断数据加载指令是否在索引RAM 102中命中。当索引RAM 102中存在数据加载指令对应的地址时,可以直接从数据高速RAM 104中读取数据加载指令对应的数据,并将读取到的数据返回至流水线101。
当图1中的处理器进行数据存储时,待存储的数据直接被存储到存储缓存器103中。当流水线101处于空闲阶段时,存储缓存器103中存储的数据经由流水线101发送至数据高速RAM 104。
由上可见,现有技术中的处理器,当流水线处于繁忙状态时,无法实现实时的数据存储。
在本发明实施例中,在同步多线程处理器中设置有至少两条流水线,且其中至少一条流水线为可中断流水线。可中断流水线在接收到数据存储指令时停止当前所执行的非数据存储指令,转而执行接收到的数据存储指令。因此,当接收到数据存储指令时,存在至少一条流水线可以执行接收到的数据存储指令,从而实现实时地进行数据存储操作。
为使本发明的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
本发明实施例提供了一种同步多线程处理器,包括:索引RAM、存储缓存器、数据高速缓存器以及至少两条流水线。在本发明实施例中,同步多线程处理器中的流水线均可以为支持同步多线程的流水线。
在实际应用中可知,索引RAM可以用于存储高速缓存数据索引地址,其主要功能是辅助高速缓存、CPU的通信与存取寻址数据。
在具体实施中,所有的流水线均分别与索引RAM、存储缓存器以及数据高速缓存器连接。所有的流水线均能够访问数据高速缓存器,且每一条流水线均可以对应一个独立的线程。
在本发明实施例中,在所有的流水线中,存在至少一条流水线为可中断流水线,至少一条流水线为非可中断流水线,其中,可中断流水线可以为实现如下功能的流水线:在接收到数据存储指令时停止执行当前所执行的非数据存储指令,并执行接收到的数据存储指令;非可中断流水线可以为实现如下功能的流水线:在接收到数据存储指令时,先继续执行当前所执行的操作指令,并在完成当前所执行的操作指令后,执行接收到的数据存储指令。
在本发明实施例中,同步多线程处理器所包括的流水线的个数可以为2个,也可以为更多个。当同步多线程处理器所包括的流水线的个数为2个时,其中一个流水线为非可中断流水线,另一个为可中断流水线。当同步多线程处理器所包括的流水线的个数为3个以上时,可中断流水线的个数可以仍为一个,其他的流水线均为非可中断流水线;或者,非可中断流水线的个数为一个,其他的流水线均为可中断流水线;或者,非可中断流水线的个数与可中断流水线的个数均为多个。
在具体实施中,同步多线程处理器中还可以设置有分级存储器组。针对每一个流水线,可以设置与之一一对应的分级存储器组。例如,对于第i条流水线,可以设置与之一一对应的第i分级缓存器组。
每一条分级缓存器组可以包括多级缓存器。当第i条流水线在执行相应指令时,分级缓存器组中的缓存器可以缓存第i条流水线在执行相应指令时对应的中间数据。
例如,针对第1条流水线,对应设置有第1分级缓存器组。假设第1条流水线上的操作指令经过a、b、c三个步骤,则在第1分级缓存器组中,第1个缓存器可以存储步骤a对应的中间数据,第2个缓存器可以存储步骤b对应的中间数据,第3个缓存器可以存储步骤c对应的中间数据。
在具体实施中,不同的流水线可以共用同一个索引RAM以及共用同一个存储缓存器,不同的流水线也可以存在一一对应的索引RAM以及一一对应的存储缓存器。在本发明一实施例中,针对不同的流水线,存在与之一一对应的索引RAM以及一一对应的存储缓存器。
下面以同步多线程处理器包括2个流水线为例,对本发明上述实施例中提供的同步多线程处理器进行详细说明。
参照图2,给出了本发明实施例中的一种同步多线程处理器的结构示意图。图2中,同步多线程处理器包括两条流水线:第一流水线201、第二流水线207,第一流水线201为非可中断流水线,第二流水线207为可中断流水线。
针对第一流水线201,设置有与之对应的第一索引RAM 202、第一存储缓存器203以及第一分级缓存寄存器组209;相应地,针对第二流水线207,设置有与之对应的第二索引RAM 205、第二存储缓存器206以及第二分级缓存寄存器组210。
第一流水线201可以与第一索引RAM 202、第一存储缓存器203以及第一分级缓存寄存器组209进行通信。第二流水线207可以与第二索引RAM205、第二存储缓存器206以及第二分级缓存寄存器组210进行通信。
下面对本发明上述实施例中提供的同步多线程处理器的工作过程进行说明。
当第一流水线201上有数据加载指令时,先检查第一索引RAM 202中是否存在与数据加载指令对应的地址,也即判断数据加载指令是否在第一索引RAM 202中命中。当检测到第一索引RAM 202中存在数据加载指令对应的地址时,可以直接从数据高速RAM 204中读取数据加载指令对应的数据,并将读取到的数据返回至第一流水线201。
当检测到第一索引RAM 202中不存在数据加载指令对应的地址时,则从数据高速RAM 204中找到数据加载指令对应的数据并读取,经由第一流水线201输出,并将读取出的数据存储到第一索引RAM 202中。
若第一流水线201处于繁忙状态的同时检测到数据存储指令,则可以获取第二流水线207的当前状态。当第二流水线207处于空闲状态时,则可以直接将数据存储指令输出至第二流水线207。第二流水线207在接收到数据存储指令后,可以将需要存储的数据存储至第二存储缓存器206,或者将需要存储的数据存储至数据高速RAM 204中。
当第二流水线207处于繁忙状态时,则可以先判断第二流水线207上当前执行的操作指令是否为数据存储指令。若第二流水线207上当前执行的操作指令是数据存储指令,则当前接收到的数据存储指令可以在之前的数据存储指令执行完成后执行;若第二流水线207上当前执行的操作指令不是数据存储指令,则可以将第二流水线207上当前执行的操作指令停止,并执行接收到的数据存储指令。在将接收到的数据存储指令执行完成后,可以继续执行之前没有执行完成的操作指令。由于之前执行的操作指令对应中间数据仍存储在第二分级缓存寄存器组210中,因此无需从头开始执行之前没有执行完成的操作指令,而是可以从中断执行的步骤开始继续执行。
例如,第二流水线207在接收到数据存储指令之前,执行数据加载指令,且执行到第三个步骤。当第二流水线207在接收到数据存储指令时,停止执行数据加载指令,并执行数据存储指令。当完成数据存储指令的执行后,从第三个步骤开始继续执行数据加载指令。
由此可见,在本发明实施例中,在同步多线程处理器中设置有至少两条流水线,且其中至少一条流水线为可中断流水线。可中断流水线在接收到数据存储指令时停止当前所执行的非数据存储指令,转而执行接收到的数据存储指令。因此,当接收到数据存储指令时,存在至少一条流水线可以执行接收到的数据存储指令,从而实现实时地进行数据存储操作。
在具体实施中,可中断流水线对应的分级缓存器组,还可以存储非可中断流水线执行相应指令时对应的中间数据。此时,非可中断流水线在执行相应指令时对应的输出结果包括:非可中断流水线在执行相应指令时对应的中间数据,以及可中断流水线所存储的非可中断流水线执行相应指令时所对应的中间数据。
换而言之,非可中断流水线在执行相应指令时对应的输出结果是由:非可中断流水线在执行相应指令时对应的中间数据,与可中断流水线所存储的非可中断流水线执行相应指令时所对应的中间数据的合并结果。
例如,同步多线程处理器包括两个流水线:流水线1,流水线2,流水线1为非可中断流水线,流水线2为可中断流水线,流水线1对应第1分级缓存器组,流水线2对应第2分级缓存器组。当流水线1在执行相应的操作指令时,生成的中间数据除了存放在第1分级缓存器组中之外,还可以存放在第2分级缓存器组中,且第1分级缓存器组中存储的中间数据与第2分级缓存器组中存储的中间数据相同。
在输出流水线1上的操作指令对应的结果时,输出结果为:第1分级缓存器组中存储的中间数据与第2分级缓存器组中存储的中间数据的合并。通过数据合并,可以保障流水线1上的输出结果的正确性。
在具体实施中,当可中断流水线上没有执行相应的操作指令,且与其他非可中断流水线不存在缓存冲突时,可中断流水线可以实时监听外部请求。可中断流水线监听到的外部请求可以是数据访问指令,也可以为数据存储指令或其他指令。
在本发明实施例中,同步多线程处理器还可以包括仲裁单元,仲裁单元可以与所有的流水线均耦接。当仲裁单元检测到任意两条流水线上的访问指令冲突时,可以对发生冲突的流水线上的访问指令进行排序并依次访问,以使得发生冲突的流水线上的访问指令按顺序访问。
参照图2,同步多线程处理器包括两条流水线:第一流水线201和第二流水线207。当仲裁单元208检测到第一流水线201上的访问指令1与第二流水线207上的访问指令2发生冲突时,则可以随机对访问指令1和访问指令2进行排序,以使得访问指令1与访问指令2先后依次执行,从而避免冲突。
在实际应用中,任意两条流水线上的访问指令发生冲突可以是指:两条流水线上的访问指令对应的访问地址相同,也可以是指被访问地址不能够被同时访问。可以理解的是,访问指令发生冲突还可以为其他的场景,此处不做赘述。
在具体实施中,在可中断流水线对应的分级缓存器组中,还可以包括定时清除单元。定时清除单元可以在定时时长达到预设时长时,清除相应可中断流水线上的非加载指令。
在实际应用中,定时时长可以根据具体的应用场景自行设定,本发明实施例对此不做赘述。
参照图3,给出了本发明实施例中的一种流水线的简化示意图。图3中,第一流水线301执行的操作命令以S1、S2、S3三个步骤为一个周期,且步骤S1对应的分级缓存器为R1,步骤S2对应的分级缓存器为R2,步骤S3对应的分级缓存器为R3。R1、R2、R3分别存储步骤S1、S2、S3对应的中间数据。
第二流水线302执行的操作命令以S1’、S2’、S3’、S4’四个步骤为一个周期,且步骤S1’对应的分级缓存器为R1’,步骤S2’对应的分级缓存器为R2’,步骤S3’对应的分级缓存器为R3’,步骤S4’对应的分级缓存器为R4’。
当第一流水线执行操作命令时,步骤S1对应的中间数据存储在对应的中间数据分别存储至分级缓存器R1和分级缓存器R1’中,步骤S2对应的中间数据存储在对应的中间数据分别存储至分级缓存器R2和分级缓存器R2’中,步骤S3对应的中间数据存储在对应的中间数据分别存储至分级缓存器R3和分级缓存器R3’中。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。

Claims (10)

1.一种同步多线程处理器,其特征在于,包括:索引RAM、存储缓存器、数据高速缓存器以及至少两条流水线,其中:
所述至少两条流水线,分别与所述索引RAM、所述存储缓存器以及所述数据高速缓存器均连接,适于访问所述数据高速缓存器;每一条流水线对应一个独立的线程,且至少一条流水线为可中断流水线,至少一条流水线为非可中断流水线,其中:当所述非可中断流水线处于繁忙状态且同时检测到数据存储指令时,将所述数据存储指令发送至所述可中断流水线;所述可中断流水线适于在接收到数据存储指令时处于繁忙状态,则停止当前所执行的非数据存储指令,并执行所述数据存储指令。
2.如权利要求1所述的同步多线程处理器,其特征在于,还包括:与每一条流水线一一对应设置的分级缓存器组,其中:第i条流水线对应的分级缓存器组中的每一个分级缓存器,适于缓存所述第i条流水线执行相应指令时所对应的中间数据,1<i≤N,N为流水线总数。
3.如权利要求2所述的同步多线程处理器,其特征在于,所述可中断流水线对应的分级缓存器组,还适于存储所述非可中断流水线执行相应指令时所对应的中间数据。
4.如权利要求3所述的同步多线程处理器,其特征在于,所述非可中断流水线在执行相应指令时对应的输出结果包括:所述非可中断流水线在执行相应指令时对应的中间数据,以及所述可中断流水线所存储的所述非可中断流水线执行相应指令时所对应的中间数据的合并结果。
5.如权利要求2所述的同步多线程处理器,其特征在于,所述可中断流水线对应的分级缓存器组包括:定时清除单元,适于在定时时长达到预设时长时,清除所述可中断流水线上的非加载指令。
6.如权利要求1所述的同步多线程处理器,其特征在于,所述可中断流水线,还适于在未执行操作指令且不存在缓存冲突时,监听外部请求。
7.如权利要求1所述的同步多线程处理器,其特征在于,还包括:仲裁单元,与所有流水线均耦接,适于当检测到任意两条流水线上的访问指令冲突时,对发生冲突的流水线上的访问指令进行排序,以使得所述发生冲突的流水线上的访问指令按顺序访问。
8.如权利要求1所述的同步多线程处理器,其特征在于,所述索引RAM与每一条流水线一一对应。
9.如权利要求1所述的同步多线程处理器,其特征在于,所述存储缓存器与每一条流水线一一对应。
10.如权利要求1~9任一项所述的同步多线程处理器,其特征在于,所有流水线均为支持同步多线程的流水线。
CN201810678760.6A 2018-06-27 2018-06-27 同步多线程处理器 Active CN110647357B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810678760.6A CN110647357B (zh) 2018-06-27 2018-06-27 同步多线程处理器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810678760.6A CN110647357B (zh) 2018-06-27 2018-06-27 同步多线程处理器

Publications (2)

Publication Number Publication Date
CN110647357A CN110647357A (zh) 2020-01-03
CN110647357B true CN110647357B (zh) 2021-12-03

Family

ID=69009187

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810678760.6A Active CN110647357B (zh) 2018-06-27 2018-06-27 同步多线程处理器

Country Status (1)

Country Link
CN (1) CN110647357B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115408153B (zh) * 2022-08-26 2023-06-30 海光信息技术股份有限公司 多线程处理器的指令分发方法、装置和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1276887A (zh) * 1997-10-23 2000-12-13 国际商业机器公司 多线程处理器系统中的线程切换控制
CN1540498A (zh) * 2003-04-21 2004-10-27 �Ҵ���˾ 用于在同步多线程处理器中改变流水线长度的方法和电路
CN102144225A (zh) * 2008-05-29 2011-08-03 阿克西斯半导体有限公司 实时数据处理方法和装置
CN107590085A (zh) * 2017-08-18 2018-01-16 浙江大学 一种具有多级缓存的动态可重构阵列数据通路及其控制方法
CN107992376A (zh) * 2017-11-24 2018-05-04 西安微电子技术研究所 Dsp处理器数据存储器主动容错方法和装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101526896B (zh) * 2009-01-22 2011-11-23 杭州中天微系统有限公司 嵌入式处理器的加载/存储单元
CN101957744B (zh) * 2010-10-13 2013-07-24 北京科技大学 一种用于微处理器的硬件多线程控制方法及其装置
US9164912B2 (en) * 2012-06-13 2015-10-20 International Business Machines Corporation Conflict resolution of cache store and fetch requests
JP6017260B2 (ja) * 2012-10-17 2016-10-26 ルネサスエレクトロニクス株式会社 マルチスレッドプロセッサ

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1276887A (zh) * 1997-10-23 2000-12-13 国际商业机器公司 多线程处理器系统中的线程切换控制
CN1540498A (zh) * 2003-04-21 2004-10-27 �Ҵ���˾ 用于在同步多线程处理器中改变流水线长度的方法和电路
CN102144225A (zh) * 2008-05-29 2011-08-03 阿克西斯半导体有限公司 实时数据处理方法和装置
CN107590085A (zh) * 2017-08-18 2018-01-16 浙江大学 一种具有多级缓存的动态可重构阵列数据通路及其控制方法
CN107992376A (zh) * 2017-11-24 2018-05-04 西安微电子技术研究所 Dsp处理器数据存储器主动容错方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
媒体多处理器系统芯片的设计研究;陈科明;《中国博士学位论文全文数据库 信息科技辑》;20070615;第1-4节,图3-16 *
陈科明.媒体多处理器系统芯片的设计研究.《中国博士学位论文全文数据库 信息科技辑》.2007, *

Also Published As

Publication number Publication date
CN110647357A (zh) 2020-01-03

Similar Documents

Publication Publication Date Title
US11334262B2 (en) On-chip atomic transaction engine
KR100936601B1 (ko) 멀티 프로세서 시스템
US20160103715A1 (en) Issue control for multithreaded processing
US9304920B2 (en) System and method for providing cache-aware lightweight producer consumer queues
US8527708B2 (en) Detecting address conflicts in a cache memory system
JP2007529833A (ja) アウト・オブ・オーダーのdmaコマンドキューにおけるコマンド順序の設定に関する技術
EP2808783A1 (en) Smart cache and smart terminal
WO2017127180A1 (en) Random-access disjoint concurrent sparse writes to heterogeneous buffers
CN102681890B (zh) 一种应用于线程级推测并行的限制性值传递方法和装置
EP3662376B1 (en) Reconfigurable cache architecture and methods for cache coherency
CN102495726B (zh) 机会多线程方法及处理器
CN112527729A (zh) 一种紧耦合异构多核处理器架构及其处理方法
CN110647358B (zh) 同步多线程处理器
US11748099B2 (en) Method for executing instructions, device, and computer readable storage medium
CN110647357B (zh) 同步多线程处理器
Kopser et al. Overview of the next generation Cray XMT
KR20240004361A (ko) 프로세싱-인-메모리 동시적 프로세싱 시스템 및 방법
CN102193828B (zh) 从处理器中的并发物理线程的数目中去耦合逻辑线程的数目
CN113867801A (zh) 指令缓存、指令缓存组及其请求合并方法
Zhao et al. Selectively GPU cache bypassing for un-coalesced loads
CN112559403B (zh) 一种处理器及其中的中断控制器
CN105378652A (zh) 线程共享资源分配方法及装置
JP5382113B2 (ja) 記憶制御装置及びその制御方法
CN115757204A (zh) 一种应用于自动驾驶的nuca架构硬件性能优化方法、系统及介质
CN112817639B (zh) Gpu读写单元通过操作数收集器访问寄存器文件的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant