CN114138341A - 微指令缓存资源的调度方法、装置、程序产品以及芯片 - Google Patents

微指令缓存资源的调度方法、装置、程序产品以及芯片 Download PDF

Info

Publication number
CN114138341A
CN114138341A CN202111450622.0A CN202111450622A CN114138341A CN 114138341 A CN114138341 A CN 114138341A CN 202111450622 A CN202111450622 A CN 202111450622A CN 114138341 A CN114138341 A CN 114138341A
Authority
CN
China
Prior art keywords
instruction
threads
thread
micro
cache resource
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111450622.0A
Other languages
English (en)
Other versions
CN114138341B (zh
Inventor
张克松
时兴
崔泽汉
李桥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Haiguang Information Technology Co Ltd
Original Assignee
Haiguang Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Haiguang Information Technology Co Ltd filed Critical Haiguang Information Technology Co Ltd
Priority to CN202111450622.0A priority Critical patent/CN114138341B/zh
Publication of CN114138341A publication Critical patent/CN114138341A/zh
Application granted granted Critical
Publication of CN114138341B publication Critical patent/CN114138341B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline, look ahead
    • G06F9/3802Instruction prefetching
    • G06F9/3808Instruction prefetching for instruction reuse, e.g. trace cache, branch target cache
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

公开了一种微指令缓存资源的调度方法、装置、程序产品以及芯片,所述微指令缓存资源由多个线程共享,所述调度方法包括:对于所述多个线程中的每个线程,获取所述线程对微指令缓存资源的使用参数和所述线程的指令特性中的至少一个;根据获取到的每个线程的所述使用参数和所述指令特性中的至少一个,动态地配置每个所述线程对所述微指令缓存资源的使用,其中,所述使用参数指示所述线程对微指令缓存资源的使用性能。

Description

微指令缓存资源的调度方法、装置、程序产品以及芯片
技术领域
本发明涉及集成电路领域,更具体地涉及一种微指令缓存资源的调度方法、装置、计算机程序产品以及芯片。
背景技术
中央处理器(CPU)架构主要分为两类,分别是精简指令集系统和复杂指令集系统。X86架构、ARM架构、MIPS架构、IA64架构是目前较为常见的处理器架构。
微指令缓存(Miro Operation Cache,OC)作为一种重要部件,被广泛应用在现有的处理器架构中。OC用来缓存指令译码后的微指令信息,通过取指地址索引并命中OC中存放的微指令时,会从OC中读取该微指令。同时,当OC未命中时,有相应的训练方法,将微指令训练到OC中。
同步多线程技术(Simultaneous Multi-Threading,SMT)是一种在一个CPU的时钟周期内能够执行来自多个线程的指令的硬件多线程技术。随着SMT技术的发展,其对OC容量的要求越来越高,主要原因在于每个线程的指令是不同的,例如当多个线程中都包含循环指令段时,多个线程之间的指令会不断抢占对方的OC容量资源,这样就会导致OC的命令率降低。但是,受到处理器的面积、主频等因素的限制,OC的容量不能一直呈线性增长。因此,在SMT中,如何在有限的OC容量下充分提高OC的命中率,成为了一个亟待解决的技术问题。
发明内容
针对以上问题,本公开提供了一种微指令缓存资源的调度方法、装置、计算机程序产品以及芯片。利用本公开提供微指令缓存资源的调度方法可以在OC容量相对有限的前提下,保证SMT中的各个线程有效地利用OC资源,提高SMT中各个线程的OC命中率,同时,在SMT情况下,兼顾IC取指通道和OC取指通路的平衡性,提高了取指效率。
根据本公开的第一方面,提出了一种微指令缓存资源的调度方法,所述微指令缓存资源由多个线程共享,所述调度方法包括:对于所述多个线程中的每个线程,获取所述线程对微指令缓存资源的使用参数和所述线程的指令特性中的至少一个;根据获取到的每个线程的所述使用参数和所述指令特性中的至少一个,动态地配置每个所述线程对所述微指令缓存资源的使用,其中,所述使用参数指示所述线程对微指令缓存资源的使用性能。
在一些实施例中,其中所述使用参数包括以下至少一项:每个所述线程的指令缓存资源的取指次数,其中所述指令缓存资源的取指次数为在对微指令缓存资源进行训练的情况下,通过指令缓存资源的取指的微指令个数;每个所述线程的微指令缓存资源的取指次数,其中所述微指令缓存资源的取指次数为进入为微指令缓存资源取指模式时,通过微指令缓存资源进行取指的微指令个数;每个所述线程的微指令缓存资源的停止训练取指次数,其中所述微指令缓存资源的停止训练取指次数为在停止对微指令缓存资源进行训练的情况下,通过指令缓存资源进行取指的微指令的个数;根据所述指令缓存资源的取指次数、所述微指令缓存资源的取指次数、所述停止训练取指次数中的至少两项确定的参数。
在一些实施例中,其中所述指令特性包括以下至少一项:每个所述线程是否存在循环指令;每个所述线程中循环指令的循环体大小及循环次数。
在一些实施例中,其中配置所述线程对微指令缓存资源的使用包括以下中的至少一项:重新分配所述线程的微指令缓存资源训练次数阈值;向所述线程发送退出指令,所述退出指令用于指示停止对微指令缓存资源进行训练、并通过指令缓存资源进行取指停止;向所述线程发送等待退出指令,所述等待退出指令用于指示继续对微指令缓存资源进行训练、并等待用于停止对微指令缓存资源进行训练并对指令缓存资源进行取指的退出指令。
在一些实施例中,还包括:响应于满足预设条件,向每个所述线程发送再平衡命令,其中所述再平衡命令用于将每个所述线程的微指令缓存资源的训练次数阈值恢复至默认值。
在一些实施例中,其中所述使用性能的等级包括高性能、中性能、低性能,所述指令特性的等级包括高循环特性、中循环特性、低循环特性,以及所述根据获取到的所述使用性能和所述指令特性,动态地配置每个所述线程对微指令缓存资源的使用,包括:根据所述使用性能的等级和所述指令特性的等级,采用预设的仲裁算法,对所述线程对微指令缓存资源的使用进行配置。
在一些实施例中,其中所述多个线程为四个线程,所述预设的仲裁算法包括:若所述四个线程中至少两个线程的所述使用性能为高性能,则保持所述四个线程的微指令缓存资源的训练次数阈值。
在一些实施例中,其中所述预设的仲裁算法还包括:若所述四个线程中只有一个线程的所述使用性能为高性能,则根据具有非高性能的另外三个线程的指令特性重新分配所述三个线程的微指令缓存资源训练次数阈值,同时保持具有高性能的所述线程的微指令缓存资源训练次数阈值;或者,若所述四个线程中只有一个线程的所述使用性能为高性能且无法确定另外三个线程的指令特性,将所述另外三个线程中的两个线程确定为通过指令缓存资源读取微指令以及将所述另外三个线程中的另一个线程确定为通过微指令缓存资源读取微指令。
在一些实施例中,其中所述预设的仲裁算法还包括:若所述四个线程中所有线程的使用性能均为非高性能,则根据四个所述线程的指令特性重新分配所述四个线程的微指令缓存资源训练次数阈值或者,平均分配所述四个线程对微指令缓存资源和指令缓存资源的使用;或者若所述四个线程中所有线程的使用性能均为非高性能且无法确定所述四个线程中的指令特性,将所述四个线程中的两个线程确定为通过指令缓存资源读取微指令以及将所述四个线程中的另外两个线程确定为通过微指令缓存资源读取微指令。
在一些实施例中,其中所述使用参数为所述微指令缓存资源的取指次数和/或根据所述指令缓存资源取指次数、所述微指令缓存资源取指次数、所述停止训练取指次数中的至少两项确定的,所述获取所述线程对微指令缓存资源的使用参数包括:响应于当某一线程的所述微指令缓存资源训练次数大于最小训练次数阈值时,获取所有线程的所述使用参数;或者,在固定时间间隔,获取所有线程的所述使用参数。
根据本公开的第二方面,提出了一种线程监测方法,所述线程为共享微指令缓存资源的多个线程中的任一线程,所述线程具有对应的训练次数计数器、指令缓存资源取指次数计数器、微指令缓存资源取指次数和停止训练后取指次数计数器,所述训练次数计数器用于记录所述线程的微指令缓存资源的训练次数,所述指令缓存资源取指个数计数器用于记录所述线程在对微指令缓存资源进行训练的情况下,通过指令缓存资源读取的微指令个数,所述微指令缓存资源取指次数计数器用于记录所述线程在微指令缓存资源取指模式下,通过微指令缓存资源读取的微指令个数,所述停止训练后取指次数计数器用于记录停止训练微指令缓存资源后从指令缓存资源中读取的微指令个数,所述线程监测方法包括:监测所述线程的微指令缓存资源的训练次数、指令缓存资源的取指次数、微指令缓存资源的取指次数和微指令缓存资源停止训练后的取指次数;根据用于所述线程的指令缓存资源的取指次数、微指令缓存资源的取指次数和微指令缓存资源停止训练后的取指次数,确定所述线程的微指令缓存资源的使用参数;以及向调度中心提供所述线程的使用参数,以供所述调度中心动态地配置每个所述线程对所述微指令缓存资源的使用。而,微指令缓存资源的训练次数用来保证上述使用性能参数的有效性。
在一些实施例中,还包括:检测所述线程的指令特性;以及向调度中心提供所述线程的指令特性,以供所述调度中心基于所述使用性能参数和指令特性动态地配置每个所述线程对所述微指令缓存资源的使用。
在一些实施例中,其中,所述检测所述线程的指令特性包括:监测所述线程是否具有循环指令、计算所述循环指令的循环体大小及循环次数、统计所述循环体的循环次数是否高于设定阈值。
在一些实施例中,还包括:在所述线程的微指令缓存资源的训练次数超出所述线程的微指令缓存资源训练次数阈值的情况下,响应于接收到退出指令,停止对微指令缓存资源进行训练、并通过指令缓存资源进行取指。
在一些实施例中,还包括:响应于接收到等待退出指令,继续对微指令缓存资源进行训练、并等待用于停止对微指令缓存资源进行训练并对指令缓存资源进行取指的退出指令。
根据本公开的第三方面,提出了一种微指令缓存资源的调度装置,所述微指令缓存资源由多个线程共享,所述调度装置包括:获取模块,其被配置为对于所述多个线程中的每个线程,获取所述线程对微指令缓存资源的使用参数和所述线程的指令特性中的至少一个;配置模块,其被配置为根据获取到的每个线程的所述使用参数和所述指令特性中的至少一个,动态地配置每个所述线程对所述微指令缓存资源的使用,其中,所述使用参数指示所述线程对微指令缓存资源的使用性能。
在一些实施例中,其中所述使用参数包括以下至少一项:每个所述线程的指令缓存资源的取指次数,其中所述指令缓存资源取指次数为在对微指令缓存资源进行训练的情况下,通过指令缓存资源进行取指的微指令个数;每个所述线程的微操作微指令缓存资源的取指次数,其中所述微指令缓存资源的取指次数为进入为微指令缓存资源取指模式时,通过微指令缓存资源进行取指的微指令个数;每个所述线程的微指令缓存资源的停止训练取指次数,其中所述微指令缓存资源的停止训练取指次数为在停止对微指令缓存资源进行训练的情况下,通过指令缓存资源进行取指的微指令个数;根据所述指令缓存资源的取指次数、所述微指令缓存资源的取指次数、所述停止训练取指次数中的至少两项确定的性能指标。
在一些实施例中,其中所述指令特征包括以下至少一项:每个所述线程是否存在循环指令;每个所述线程中循环指令的循环体大小及循环次数。
在一些实施例中,其中配置所述线程对微指令缓存资源的使用包括以下中的至少一项:重新分配所述线程的微指令缓存资源训练次数阈值;向所述线程发送退出指令,所述退出指令用于指示停止对微指令缓存资源进行训练、并通过指令缓存资源进行取指;向所述线程发送等待退出指令,所述等待退出指令用于指示继续对微指令缓存资源进行训练、并等待用于停止对微指令缓存资源进行训练并对指令缓存资源进行取指的退出指令。
在一些实施例中,还包括:再平衡模块,其被配置为响应于满足预设条件,向每个所述线程发送再平衡命令,其中所述再平衡命令用于将每个所述线程的微指令缓存资源的训练次数阈值恢复至默认值。
在一些实施例中,其中所述使用性能的等级包括高性能、中性能、低性能,所述指令特性的等级包括高循环特性、中循环特性、低循环特性,以及所述配置模块进一步配置为:根据所述使用性能的等级和所述指令特征的等级,采用预设的仲裁算法,对所述线程对微指令缓存资源的使用进行配置。
在一些实施例中,其中所述多线程为四个线程,所述预设的仲裁算法包括:若所述四个线程中至少两个线程的所述使用性能为高性能,则保持所述四个线程的微指令缓存资源的训练次数阈值。
在一些实施例中,其中所述预设的仲裁算法还包括:若所述四个线程中只有一个线程的所述使用性能为高性能,则根据具有非高性能的另外三个线程的指令特性重新分配所述三个线程的微指令缓存资源训练次数阈值,同时保持具有高性能的所述线程的微指令缓存资源训练次数阈值;或者,若所述四个线程中只有一个线程的所述使用性能为高性能且无法确定另外三个线程的指令特性,将所述另外三个线程中的两个线程确定为通过指令缓存资源读取微指令以及将所述另外三个线程中的另一个线程确定为通过微指令缓存资源读取微指令。
在一些实施例中,其中所述预设的仲裁算法还包括:若所述四个线程中所有线程的使用性能均为非高性能,则根据四个所述线程的指令特性重新分配所述四个线程的微指令缓存资源训练次数阈值或者,平均分配所述四个线程的微指令缓存资源训练次数阈值;或者若所述四个线程中所有线程的使用性能均为非高性能且无法确定所述四个线程中的指令特性,将所述四个线程中的两个线程确定为通过指令缓存资源读取微指令以及将所述四个线程中的另外两个线程确定为通过微指令缓存资源读取微指令。
在一些实施例中,其中所述使用参数为所述微指令缓存资源的取指次数和/或根据所述指令缓存资源的取指次数、所述微指令缓存资源的取指次数、所述停止训练取指次数中的至少两项确定的,所述获取模块进一步被配置为:响应于当某一个线程的所述微指令缓存资源训练次数大于最小训练次数阈值时,获取所有线程的所述使用参数;或者,在固定时间间隔,获取所有线程的所述使用参数。
根据本公开的第四方面,提供了一种计算机程序产品,其特征在于,所述程序包括程序代码指令,用于在所述程序由处理器执行时实现根据本公开第一方面中任一项所述的微指令缓存资源的调度方法以及/或者根据本公开第二方面中任一项所述的线程监测方法。
根据本公开的第五方面,提供了一种芯片,包括处理器、存储器和总线,其中所述处理器包括根据本公开第三方面中任一项所述的调度装置。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员而言,在没有做出创造性劳动的前提下,还可以根据这些附图获得其他的附图。以下附图并未刻意按实际尺寸等比例缩放绘制,重点在于示出本发明的主旨。
图1-1示出了处理器中针对指令的取指过程示意图;
图1-2示出了应用根据本公开实施例的微指令缓存资源的调度方法的系统架构图;
图2示出了根据本公开实施例的一种微指令缓存资源的调度方法的流程示意图;
图3示出了根据本公开实施例的另一种微指令缓存资源的调度方法的流程示意图;
图4示出了根据本公开实施例的一种线程监测方法的流程示意图;
图5-1示出了根据本公开实施例的另一种线程监测方法的流程示意图;
图5-2示出了根据本公开实施例的又一种线程监测方法的流程示意图;以及
图6示出了根据本公开实施例的一种微指令缓存资源的调度装置的功能结构图。
具体实施方式
下面将结合附图对本发明实施例中的技术方案进行清楚、完整地描述,显而易见地,所描述的实施例仅仅是本发明的部分实施例,而不是全部的实施例。基于本发明实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,也属于本发明保护的范围。
如本申请和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其他的步骤或元素。
虽然本申请对根据本申请的实施例的系统中的某些模块做出了各种引用,然而,任何数量的不同模块可以被使用并运行在用户终端和/或服务器上。所述模块仅是说明性的,并且所述系统和方法的不同方面可以使用不同模块。
本申请中使用了流程图用来说明根据本申请的实施例的系统所执行的操作。应当理解的是,前面或下面操作不一定按照顺序来精确地执行。相反,根据需要,可以按照倒序或同时处理各种步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
图1-1示出了处理器中针对指令的取指过程示意图。如图1-1所示,首先获取待取指的物理地址(即图1-1中的“取指的物理地址”),然后将该物理地址输入至取指路径选择器1,由取指路径选择器1选中一个通路进行取指操作。取指路径选择器1具有两个输出通路,分别为图1-1中“IC取指”和“OC取指”。其中,“IC取指”是指从指令缓存(InstructionsCache,IC)中取出指令数据(未经过译码之前的指令),“OC取指”是指从微指令缓存(MiroOperation Cache,OC)中取出微指令(经过译码之后的指令)。示例性地,取指路径选择器1可以根据是否命中OC微标签(Micro-tags)来选择是进入“OC取指”通路还是“IC取指”通路进行取指操作。具体地,若命中OC微标签,则进入“OC取指”通路;若没有微标签,则进入“IC取指”通路。
若进入“IC取指”通路,则首先根据该物理地址在指令缓存(Instructions Cache,IC)中查找指令数据,当命中IC或者从L2、L3或者Memory中取回数据后,从指令缓存中取出指令数据。在复杂指令集的处理器架构下,首先需要对指令的长度进行译码,然后,对指令信息进行译码。在对指令进行译码后,可以将译码后的指令信息(例如微指令)存放在OC中(图1-1中未示出)。在对该指令进行译码后,同时,将译码后的指令信息输入至取指路径选择器2,从而分配到相应的执行部件。
若进入“OC取指”通路,则首先根据该物理地址从微指令缓存中查找译码后的指令信息,查找到译码后的指令信息后可以从微指令缓存中取出该译码后的指令信息并将其输入至取指路径选择器2,从而分配到相应的执行部件。
取指路径选择器2从“IC取指”通路和“OC取指”通路中选通一路,按照微指令的顺序,将选通的一路的微指令输入至微指令队列。最后,将微指令分配到对应的执行部件。
图1-2示出了应用根据本公开实施例的微指令缓存资源的调度方法的系统架构图。如图1-2所示,线程1、线程2、线程3、线程4都有属于自己的用于记录OC训练次数的计数器。在本文中,对于线程上的一个指令,若采用IC取指并同时将该指令的译码信息(例如微指令)存放在OC的过程记为该线程对OC进行了一次训练操作。当OC训练一些次数后,线程在OC中的取指效果仍不理想,该线程对OC的训练次数将会被缩减,甚至,阶段性的保持该线程在IC取指模式。当OC训练一些次数后,线程在OC中的取指效果比较好时,将线程保持在OC取指模式,同时,适当提高该线程对OC的训练次数。因此,调度管理可以通过调节线程的记录OC训练次数的训练次数计数器的阈值来对线程的OC使用进行调度和配置。
线程1、线程2、线程3、线程4会有属于自己的OC使用性能监测机制。根据这四个线程的OC使用性能、各个线程中执行指令特性(包括是否存在循环体、循环体大小及循环次数)(将在下文中予以详细描述)、各个线程中训练次数计数器的数值,当一定事件(例如线程的OC使用性能高过设定的最高阈值,或者线程的OC使用性能低于设定的最低阈值)发生时或者每隔固定的时间段,动态地调整若干或全部线程的OC训练次数阈值(将在下文中予以详细描述)。图2示出了根据本公开实施例的一种微指令缓存资源的调度方法的流程示意图。该调度方法200包括:
步骤S201:对于多个线程中的每个线程,获取线程对微指令缓存资源的使用参数和线程的指令特性中的至少一个。
本实施例中,微指令缓存资源指的是上文中描述的OC资源或OC容量资源。这里的多个线程可以是SMT技术中的多个线程。在SMT技术中,对每个线程上的指令的取指过程可以是图1-1示出的针对指令的取指过程。换句话说,针对每个线程上的指令可以进行IC取指或者OC取指。由上文的描述可知,若针对线程上的指令采用IC取指,则在IC中取出指令后,需要将该指令进行译码并将译码后的指令信息(例如微指令)存放在OC中。
本实施例中,线程对微指令缓存资源的使用参数指示所述线程对微指令缓存资源的使用性能,可以通过线程指令缓存资源取指次数和微指令缓存资源取指次数来获得。可选地,使用参数包括每个线程的微指令缓存资源的取指次数,微指令缓存资源的取指次数为进入微指令缓存资源取指模式时,通过微指令缓存资源进行取指的微指令个数。例如,某个线程上共读取10条微指令,其中有6条微指令通过OC路径读取,4条微指令通过IC路径读取,那么这里的6条通过OC路径读取的微指令个数可以作为该线程的使用参数。除了可以将线程上OC取指个数作为使用参数之外,还可以将线程上OC读取微指令个数占所有读取微指令个数的比例作为使用参数。仍以前述的某个线程上共读取10条微指令为例,可以将6次OC路径读取的微指令数目/10次读取的微指令总数作为该线程的使用参数。
可选地,使用参数还可以包括每个线程的指令缓存资源的取指次数,其中指令缓存资源的取指次数为在对微指令缓存资源进行训练的情况下,通过指令缓存资源取指的微指令个数。例如,某个线程上共读取10条微指令,其中有6条微指令通过OC路径读取,4条微指令通过IC路径读取,那么这里的4条通过IC读取的微指令个数可以作为该线程的使用参数。除了可以将线程上的IC取指个数作为使用参数之外,还可以将线程上IC读取微指令个数占所有读取微指令个数的比例作为使用参数。仍以前述的某个线程上共读取10条微指令为例,可以将4条IC读取的微指令数目/10条读取的微指令总数作为该线程的使用参数。
可选地,使用参数还可以包括每个线程的微指令缓存资源的停止训练取指次数,其中微指令缓存资源的停止训练取指次数为在停止对微指令缓存资源进行训练的情况下,通过指令缓存资源取指的微指令个数。下面结合图1对这里的停止训练取指次数进行说明,在一些针对线程上的指令进行IC取指的场景中,由于该线程上的OC资源的使用性能差(例如较低的OC命令率)或者无法对OC资源进行使用(例如OC容量已填满),此时在线程上进行IC取指时,若仍要将译码后的指令信息(例如微指令)存放在OC中,则会进一步降低OC资源的利用率,此时可以强制停止对OC的训练操作(即停止在IC取指的路径中将译码后的指令信息存放在OC中)。每个线程上的OC资源的停止训练取指次数也可以作为使用参数。例如,某个线程上共读取10条微指令,其中有6条微指令通过OC路径读取,4条微指令为停止对OC资源进行训练的IC路径读取,那么这里的4条停止OC训练后通过IC路径读取的微指令数目可以作为该线程的使用参数。除了可以将线程上的OC资源的停止训练取指次数作为使用参数之外,还可以将线程上的OC资源的停止训练取指次数占所有取指次数的比例作为使用参数。在前述的4条微指令为停止对OC资源进行训练后通过IC路径读取例子中,可以将4条停止对OC资源进行训练的IC读取的微指令数目/10次读取的微指令总数作为该线程的使用参数。
在一些可选的实施例中,考虑到复杂指令系统计算机(Complex Instruction SetComputer,CISC)架构处理器下,指令长度的不确定情况,在该示例中,可以统一在译码和OC取指之后,填入微指令队列时,统计上文描述的线程的微指令缓存资源的取指次数、线程的指令缓存资源的取指次数、线程的微指令缓存资源的停止训练取指次数这三项使用参数。
仍可选地,使用参数可以包括根据前述IC取指次数、OC取指次数、OC停止训练取指次数中的至少两项确定的参数。示例性,若IC取指次数为x,OC取指次数为y,那么可以将f=f(x,y)作为使用参数,例如f=y/(x+y)。同理,若IC取指个数为x、OC取指次数为y、OC停止训练取指次数为z,那么可以将f=f(x,y,z)作为使用参数,例如f=y/(x+y+z)。
在本实施例中,线程上的指令特性可以包括线程上是否存在循环指令和/或该循环指令的循环体大小和循环次数。循环指令的格式为:“Loop标号”,并且在cx(计数寄存器)中存放Loop指令的循环次数。处理器执行Loop指令时分两步走,第一步:(cx)=(cx-1),第二步:判断cx中的值,若不为0转至标号处执行程序,为0则向下执行。例如,若检测到线程上存在循环指令(例如检测到“Loop”),则可以用一位比特值“1”指示;若没有检测到线程上存在循环指令(例如没有检测到“Loop”),则可以用一位比特值“0”指示。在本实施例中,可以采用现有技术中的分支预测技术来预测循环指令的循环体大小和循环次数。分支预测的方法包括静态预测和动态预测,静态预测方法包括预测永不转移、预测永远转移、预测后向转移等,动态预测方法可以根据同一条转移指令过去的转移情况来预测未来的转移情况。
步骤S202:根据获取到的每个线程的使用参数和指令特性中的至少一个,动态地配置每个线程对微指令缓存资源的使用。
如上所述,每个线程的使用参数指示该线程对OC资源的使用性能,例如使用参数可以指示高的OC资源的使用性能、低的OC资源的使用性能等。另外,当线程中的指令具有多次循环的循环指令时,也会对OC资源的使用产生影响,例如若线程中具有热循环指令段(Hot Loop),则其可能会抢占其他线程的OC容量资源,进而影响其他线程对OC资源的使用性能。因此,本文描述的使用参数和/或指令特性可以作为为每个线程分配OC资源的基础。例如,若某个线程的OC资源的使用性能是高的,则可以为该线程配置更多的OC资源的使用时间。
可选地,配置线程对微指令缓存资源的使用包括重新分配线程的微指令缓存资源训练次数阈值。如上文描述的,针对线程中的指令的每次取指操作包括IC取指和OC取指,在未存在强制停止OC训练的情况下,当该线程通过IC取指并通过译码电路时,对OC进行一次写操作,则认为进行了一次OC训练,对应的OC训练计数器加1。在线程运行之前,可以为每个线程分配初始OC训练次数阈值,然后根据线程运行过程中获取到的使用参数和指令特性中的至少一个,对初始OC训练次数阈值进行调整(例如,增加OC次数训练阈值、减少OC训练次数阈值、保持OC训练次数阈值等)。这里的OC训练次数阈值是用来分配OC资源的使用时间的参数,例如若线程的当前OC训练次数小于等于OC训练次数阈值,需要比较该线程的OC使用性能和其他线程的OC使用性能,从而选择继续保持该线程对OC资源的使用或者减小该线程对OC资源的使用;若线程的当前OC训练次数大于OC训练次数阈值,则需要减少该线程对OC的使用次数,甚至,中断该线程对OC资源的使用。中断OC资源的使用,该线程的训练计数器将被置位到最小阈值,并且,因为OC不被训练,该训练技术将不会再累加,直到收到再平衡指令。
可选地,配置线程对微指令缓存资源的使用包括向线程发送退出指令。在本实施例中,这里的退出指令用于指示停止对微指令缓存资源进行训练、并通过指令缓存资源进行取指。如上文结合图1-1所描述的,对于IC取指,在对指令进行译码后,需要将译码后的指令信息(例如微指令)存放在OC中。在本实施例中,可以向线程发送退出指令,其中,在译码阶段,该退出指令可以强制停止将译码后的指令信息(例如微指令)存放在OC中的操作。也就是说,在IC取指中应用退出指令后的取指路径(结合图1-1描述)为:首先根据指令的物理地址在IC中查找指令数据,查找到指令之后可以从IC中取出指令;在复杂指令集架构下,需要对该指令的长度进行译码,然后将该指令进行译码;在对该指令进行译码后,直接将译码后的指令信息(例如微指令)输入至取指路径选择器2,而无需将译码后的指令信息(例如微指令)存放在OC中。
仍可选地,配置线程对微指令缓存资源的使用包括向线程发送等待退出指令。在本实施例中,等待退出指令用于指示继续对微指令缓存资源进行训练、并等待用于停止对微指令缓存资源进行训练并对指令缓存资源进行取指的退出指令。如上文结合图1-1所描述的,对于IC取指,在对指令进行译码后,需要将译码后的指令信息(例如微指令)存放在OC中。也就是说,在未强制停止OC训练的情况下,对于IC取指,一次对OC的写操作即对应完成了一次OC训练。在本实施例中,可以向线程发送等待退出指令,其中,该等待退出指令用于指示线程循环地等待(例如检测)上文描述的退出指令。在一次循环中,若等待到退出指令,则执行退出指令;若未等待到退出指令,则进行取指操作(例如IC取指或OC取指),并进行下一次循环。在未等待到退出指令时,若该线程进入了IC取指,则继续将译码后的指令信息(例如微指令)存放在OC中。
可选地,配置线程对微指令缓存资源的使用包括以下三种方式的任意组合:(一)重新分配线程的微指令缓存资源训练次数阈值;(二)向线程发送退出指令;(三)向线程发送等待退出指令。
利用本公开实施例提供的微指令缓存资源的调度方法可以在OC容量相对有限的前提下,保证SMT中的各个线程有效地利用OC资源,提高SMT中各个线程的OC命中率,同时,阶段性的强制某些线程进入IC取指,既能保证其他线程充分利用OC资源,又能有效平衡IC取指路径和OC取指路径,从而提高取指效率。
图3示出了根据本公开实施例的另一种微指令缓存资源的调度方法的流程示意图。该调度方法300包括:
步骤S301:对于多个线程中的每个线程,获取线程对微指令缓存资源的使用参数和线程的指令特性中的至少一个。
步骤S302:根据获取到的每个线程的使用参数和指令特性中的至少一个,动态地配置每个线程对微指令缓存资源的使用。
步骤S301和S302与步骤S201和S202基本相同,在此不再赘述。
步骤S303:响应于满足预设条件,向每个线程发送再平衡命令。
在本实施例中,再平衡命令用于将每个线程的微指令缓存资源的训练次数阈值恢复至默认值,同时,每个线程的微指令缓存资源训练计数器、指令缓存资源取指计数器、微指令缓存资源取指计数器、停止训练取指计数器都将初始化为默认值(不同线程的默认值是相同的)。如上文所描述的,在线程运行之前,可以为每个线程分配初始OC训练次数阈值,然后根据线程运行过程中获取到的使用参数和指令特性中的至少一个,对初始OC训练次数阈值进行调整。微指令缓存资源的训练次数阈值(即OC训练次数阈值)的默认值可以是初始OC训练次数阈值。这里的预设条件可以是预设时间段,即经过预设时间段后,可以向每个线程发送再平衡命令以将每个线程的OC训练次数阈值恢复至初始OC训练次数阈值。
本实施例中,通过在预设条件下将每个线程的OC训练次数阈值恢复至默认值,可以缓解对线程的OC使用时间的不当分配,增加对现有OC使用仲裁算法的修正能力,消除调度中心阶段性仲裁的消极效果,最终,提高OC资源的利用率。
在一些可选的实施例中,线程对微指令缓存资源的使用性能的等级包括高性能、中性能、低性能,线程上的指令特性的等级包括高循环特性、中循环特性、低循环特性,上述步骤S202包括:根据使用性能的等级和指令特性的等级,采用预设的仲裁算法,对线程对微指令缓存资源的使用进行配置。以四线程的SMT技术(以下简称“SMT 4”)例,根据每个线程的使用性能的等级,可以将SMT 4的OC使用性能组合如下表1:
Figure BDA0003385775980000141
表1
在上述表中,“H”表示“高性能”,“M”表示“中性能”,“L”表示“低性能”。同理,根据每个线程上的指令特性,可以将SMT 4的指令特性组合成N个情形(N为大于等于1的整数)。在本实施例中,可以针对OC使用性能的不同情形(例如情形1-情形14)和指令特性的不同情形设置相应的仲裁规则,并根据该仲裁规则对OC资源的使用进行配置。例如,针对OC使用性能为情形1而指令特性为任一情形,设置其对应的仲裁规则为保持各个线程的当前OC训练次数阈值。在本实施例中,OC的使用性能的等级划分的标准根据所划分的对象而有所不同。例如若对由OC训练次数和OC取指次数确定的使用参数进行等级划分,可以为该使用参数值设定不同的区间,每个取值区间分别对应高性能、中性能、低性能中的一个。示例性,若使用参数为
Figure BDA0003385775980000153
则可以按照如下表2的方式进行等级划分:
Figure BDA0003385775980000152
表2
在本实施例中,线程上的指令特性的等级划分标准可以多样的。具体而言,指令特定的等级可以根据循环指令的循环体大小来确定,而循环指令的循环体大小可以通过多种方式进行比对。例如可以将循环体大小与循环体尺寸的第一阈值和第二阈值进行比较(其中,第一阈值大于第二阈值),若循环体大小大于第一阈值,并且循环体的循环次数大于设定阈值,则指令特性为高循环特性;若循环体大小介于第一阈值和第二阈值之间,并且循环体的循环次数大于设定阈值,则指令特性为中循环特性;若循环体小于第二阈值,或者,循环体的循环次数小于设定阈值,则指令特性为低循环体。本公开实施例还提供了一种如下表3的方式对指令特性进行等级划分的标准:
Figure BDA0003385775980000151
Figure BDA0003385775980000161
表3
在一些可选的实施例中,其中多个线程为四个线程,预设的仲裁算法包括:若四个线程中至少两个线程的使用性能为高性能,则保持四个线程的微指令缓存资源的训练次数阈值。以表1为例,若SMT 4的OC使用性能为情形1、情形2、情形3、情形4、情形5,则不管SMT 4的指令特征如何,均保持各个线程的当前OC训练次数阈值。
在一些可选的实施例中,其中预设的仲裁算法还包括:若四个线程中只有一个线程的使用性能为高性能,则根据具有非高性能的另外三个线程的指令特性重新分配三个线程的微指令缓存资源训练次数阈值,同时保持具有高性能的线程的微指令缓存资源训练次数阈值。以表1为例,若SMT 4的OC使用性能为情形6、情形7、情形8、情形9,则根据线程2、线程3、线程4的指令特性重复分配这三个线程的当前OC训练次数阈值。示例性地,针对情形6,如果3个M对应的线程中,包含指令循环特性为高和指令循环特性为中或者低的线程,那么,将指令循环特性为非高的线程的当前OC训练次数阈值减少并将减少值增加到指令循环特性为高的线程上,具体的增减比例参照循环体的大小;如果3个M对应的线程,指令的循环特性均为高,此时,则选择固定的线程(例如线程2),减少该线程的当前OC训练次数阈值给额外的两个线程,具体的增减比例参照循环体的大小。或者,将该固定线程(例如线程2)的当前OC训练次数阈值减少为0,强制其进入IC取指;其他情况,将放弃本次仲裁机会,继续按照上一次配置的OC训练次数阈值进行设定。在另一些示例中,预设的仲裁算法还包括:若所述四个线程中只有一个线程的所述使用性能为高性能且无法确定另外三个线程的指令特性,将所述另外三个线程中的两个线程确定为通过指令缓存资源读取微指令以及将所述另外三个线程中的另一个线程确定为通过微指令缓存资源读取微指令。在该示例中,当另外三个线程的指令特性不明显时,可以阶段性地固定其中的两个线程通过IC取指,其中的另一个线程通过OC取指。由此,可以保证两条取指路径的平衡,提高取指效率。
针对情形7,如果L线程指令循环特性为高,并且2个M对应的线程指令循环特性为非高,则挑选M对应的两个线程之一,减少其当前OC训练次数阈值到L对应的线程上,增减比例参照L对应线程的循环体大小;如果2个M线程包含指令循环性能为高的线程,则减少L对应的线程的当前OC训练次数阈值到相应的线程上,具体增减参照循环体大小;其他情况,将放弃本次仲裁机会。
针对情形8,如果M对应的线程指令循环特性为高,L对应的两个线程分为指令循环特性为高和指令循环特性为非高,那么,则从固定的指令循环特性为非高的线程(例如,线程4)上减少当前OC训练次数阈值到M对应的线程和指令循环特性为高的L对应的线程上(例如线程2);如果M对应的线程指令循环特性为低,并且,L对应的两个线程中分为指令循环特性为高和指令循环特性为非高的,那么则从L对应的其指令循环特性为非高的线程中减少当前OC训练次数阈值到L对应的且指令循环特性为高的线程上,具体减少比例依据循环体大小;如果M对应的线程指令循环特性为低,L对应的两个线程的指令循环特性均为高,那么,此时减少M对应的线程的当前OC训练次数阈值给两个L对应的线程;其他情况,将放弃本次仲裁机会。
针对情形9,如果3个L对应的线程中存在指令循环特性为高和指令循环特性为非高的情况,那么,则固定一个指令循环特性为高的线程(例如线程3),从固定指令循环特性为非高的线程(例如线程4)中减少当前OC训练次数阈值到指令循环特性为高的线程上,具体增减参照循环体的大小,或者,强制该线程(例如线程4)从进行IC取指;如果3个L对应的线程指令循环特性均为非高,那么尝试减少两个L线程的当前OC训练次数阈值给另外一个L对应的线程,这样,让这2个L对应的线程尽快走IC取指路径,保证IC取指与OC取指路径的平衡;其他情况,放弃本次仲裁机会。
在一些可选的实施例中,其中多个线程为四个线程,预设的仲裁算法包括:若四个线程中所有线程的使用性能均为非高性能,则根据四个线程的指令特性重新分配四个线程的微指令缓存资源训练次数阈值或者,平均分配四个线程对微指令缓存资源和指令缓存资源的使用。以表1为例,若SMT4的OC使用性能为情形10、情形11、情形12、情形13、情形14,则根据线程1、线程2、线程3、线程4的指令特性重复分配这四个线程的当前OC训练次数阈值。示例性地,其中平均分配四个线程对微指令缓存资源和指令缓存资源的使用包括强制某两个线程经过IC通道取指(停止对应线程对OC的训练),剩余两个线程经过OC通道取指,从而保证两条取指通道的平衡。
示例性地,针对情形10,包含指令循环特性为高的线程数目大于或者等于2,并且,存在指令循环特性为非高的线程,则从指令循环特性为非高的线程上减少当前OC训练次数阈值到指令循环特性为高的线程上;如果4个线程指令循环特性为高,则以“循环体的大小”来确定需要提升的2个或者3个线程,从循环体最小的线程上减少当前OC训练次数阈值到选定的待提高线程上;其他情况,放弃本次仲裁机会。
针对情形11,3个M对应的线程存在指令循环特性为高,并且L对应的线程对应的指令循环特性为非高,则减少L对应线程的当前OC训练次数阈值到3个M中对应的包含循环体的线程,或者,L对应的线程将强制进入IC取指路径;3个M对应的线程指令循环特性均为非高,并且L对应的线程指令循环特性为高,则选定3个M中选定一个线程,减少其当前OC训练次数阈值到L对应的线程上;4个线程指令循环特性均为非高,则尝试减少L线程的当前OC训练次数阈值到三个M线程,同时,L强制进入IC取指模式;其他情况,放弃本次仲裁机会。
针对情形12,两个L对应的线程指令循环特性均为低,并且M中存在指令循环特性为非低的线程,则从两个L对应的线程上均匀的减少当前OC训练次数阈值到两个M上面;其他情况,放弃本轮的仲裁机会。
针对情形13,M对应的线程指令循环特性为非低,并且3个L线程中存在指令循环特性为低的线程,此时,减少该线程当前OC训练次数阈值到M对应的线程上;4个线程的指令循环特性均为低,则挑选两个OC性能为L的两个线程,并且强制其进入IC取指模式(停止对应线程对OC的训练);M线程的指令循环特性为低,3个L线程中存在指令循环特性为高的线程(例如线程4),则首先从L对应的指令循环特性为非高的线程上减少当前OC训练次数阈值到该线程(例如线程4);其他的情况,将放弃本次仲裁。
针对情形14,如果4个线程中存在指令循环特性为非低的线程数据大于0,并且存在指令循环特性为低的线程,减少为指令循环特性为低的线程的当前OC训练次数阈值到指令循环特性为非低的线程上;如果未存在指令循环特性为非低的线程,则放弃本轮仲裁。
在另一些可选的实施例中,其中多个线程为四个线程,预设的仲裁算法包括:若所述四个线程中所有线程的使用性能均为非高性能且无法确定所述四个线程中的指令特性,将所述四个线程中的两个线程确定为通过指令缓存资源读取微指令以及将所述四个线程中的另外两个线程确定为通过微指令缓存资源读取微指令。在该示例中,当四个线程的指令特性不明显时,可以阶段性地固定其中的两个线程通过IC取指,另外的两个线程通过OC取指。由此,可以保证两条取指路径的平衡,提高取指效率。
在一些可选的实施例中,使用参数为微指令缓存资源取指次数和/或根据指令缓存资源取指次数、微指令缓存资源取指次数、停止训练取指次数中的至少两项确定的,获取线程对微指令缓存资源的使用参数包括:响应于当某一线程的微指令缓存资源训练次数大于最小训练次数阈值,获取所有线程的使用参数,或者,在固定时间间隔,获取所有线程的所述使用参数。在本实施例中,可以为使用参数设置OC最小训练次数阈值,当线程的当前OC训练次数大于该最小训练次数阈值时,可以认为获取的使用参数是有效的。例如,使用参数为(OC取指次数/(IC取指次数+OC取指次数))。考虑到OC的效果需要一定的训练时间,因此可以针对该使用参数设置OC最小训练次数阈值,当OC训练次数大于OC最小训练次数阈值时,获取该使用参数。
在本实施例中,通过对使用参数设置阈值,可以增加使用参数的有效性,进而为线程对OC资源的使用做出更为准确地配置。
图4出了根据本公开实施例的一种线程监测方法的流程示意图。
在步骤S401:监测线程的微指令缓存资源的训练次数、微指令缓存资源的取指次数、指令缓存资源的取指次数和微指令缓存资源停止训练后的取指次数。
本实施例中,线程为共享微指令缓存资源的多个线程中的任一线程,线程具有对应的训练次数计数器、微指令缓存资源取指次数计数器、指令缓存资源取指计数器和停止训练后取指次数计数器,训练次数计数器用于记录线程的微指令缓存资源的训练次数,微指令缓存资源取指次数计数器用于记录线程进入微指令缓存资源取指模式时,通过微指令缓存资源进行取指的微指令个数,指令缓存资源取指次数计数器用于记录线程在对微指令缓存资源进行训练的情况下,通过指令缓存资源取指的微指令个数,停止训练后取指次数计数器用于记录停止训练微指令缓存资源后通过指令缓存资源取指的微指令个数。微指令缓存资源指的是上文中描述的OC资源或OC容量资源。这里的共享微指令缓存资源的多个线程可以是SMT技术中的多个线程。在SMT技术中,对每个线程上的指令的取指过程可以是图1-1示出的针对指令的取指过程。换句话说,针对每个线程上的指令可以进行IC取指或者OC取指。由上文的描述可知,若针对线程上的指令采用IC取指,则在IC中取出带有指令信息的原始数据后,需要将该指令进行译码并将译码后的指令信息(例如微指令)存放在OC中。在本文中,对于线程上的一个指令,若采用IC取指并同时将该指令的译码信息(例如微指令)存放在OC的过程记为该线程对OC进行了一次训练操作。这里的微指令缓存资源停止训练后的取指次数可以是上文描述的每个线程上的OC资源的停止训练取指次数。
可选地,训练次数计数器、微指令缓存资源取指次数计数器、指令缓存资源取指次数计数器和停止训练后取指次数计数器可以采用递增的方式增加数值。例如,若监测到线程上的指令的取指过程为IC取指,当针对OC的每次写操作,则训练次数计数器的数值加1;在写入微指令队列时,若监测到线程上的一个指令的取指过程为OC取指,则微指令缓存资源取指次数计数器加1;在写入微指令队列时,若监测到线程上的一个指令的取指过程为IC取指,则指令缓存资源取指计数器加1;在写入微指令队列时,若监测到线程上的一个指令的取指过程为停止对OC资源进行训练下通过IC取指,则停止训练后取指次数计数器加1。
步骤S402:根据用于线程的指令缓存资源的取指次数、微指令缓存资源的取指次数和微指令缓存资源停止训练后的取指次数,确定线程的微指令缓存资源的使用参数。
在本实施例中,可以将指令缓存资源的取指次数计数器的数值作为IC取指次数,将微指令缓存资源的取指次数计数器的数值作为OC取指次数,将停止训练后取指次数计数器的数值作为OC资源的停止训练取指次数,并根据IC取指次数、OC取指次数和OC资源的停止训练取指次数确定线程的OC使用参数。示例性,若IC的取指次数为x,OC取指次数为y,OC停止训练取指次数为z,那么可以将f=f(x,y,z)作为使用参数,例如f=y/(x+y+z)。
步骤S403:向调度中心提供线程的使用参数,以供调度中心动态地配置每个线程对微指令缓存资源的使用。
在本实施例中,可以向多线程的调度中心(例如SMT技术的调度中心)发送根据步骤S402确定的使用参数。调度中心根据接收到的该使用参数动态地配置每个线程对微指令缓存资源的使用。调度中心配置对OC的使用的方法和步骤已在本文上述的步骤S202予以详细描述,这里不再赘述。
利用本公开实施例提供的线程监测方法可以在OC容量相对有限的前提下,保证SMT中的各个线程有效地利用OC资源,提高SMT中各个线程的OC命中率。
在一些可选的实施例中,该线程监测方法400还包括:检测线程的指令特性;以及向调度中心提供线程的指令特性,以供调度中心基于使用性能和指令特性动态地配置每个线程对微指令缓存资源的使用。本实施例中的线程的指令特性以及对其的检测方法已在本文上述的步骤201予以详细描述,这里不再赘述。在本实施例中,可以向多线程的调度中心(例如SMT技术的调度中心)发送线程的指令特性。调度中心根据接收到的该线程的指令特性动态地配置每个线程对微指令缓存资源的使用。调度中心配置对OC的使用的方法和步骤已在本文上述的步骤S202予以详细描述,这里不再赘述。
在一些可选的实施例中,检测线程的指令特性包括:监测线程是否具有循环指令、计算循环指令的循环体大小、统计循环体的循环次数是否高于设定阈值。此处的步骤已在本文上述的步骤201予以详细描述,这里不再赘述。
在一些可选的实施例中,在线程的微指令缓存资源的训练次数超出线程的微指令缓存资源训练次数阈值的情况下,响应于接收到退出指令,停止对微指令缓存资源进行训练、并通过指令缓存资源进行取指。此处的步骤已在本文上述的步骤202以详细描述,这里不再赘述。
在一些可选的实施例中,响应于接收到等待退出指令,继续对微指令缓存资源进行训练、并等待用于停止对微指令缓存资源进行训练并对指令缓存资源进行取指的退出指令。此处的步骤已在本文上述的步骤202以详细描述,这里不再赘述。
图5-1示出了根据本公开实施例的另一种线程监测方法的流程示意图。本实施例中,线程为共享微指令缓存资源的多个线程中的任一线程,线程具有对应的训练次数计数器、指令缓存资源取指次数计数器和微指令资源取指次数计数器,训练次数计数器用于记录线程的微指令缓存资源的训练次数,指令缓存资源取指次数计数器用于记录线程通过指令缓存资源读取的微指令个数,微指令缓存资源取指次数计数器用于记录线程通过微指令缓存资源读取的微指令个数。如图5-1所示:
步骤S510:判断所述线程的微指令缓存资源的训练次数是否小于OC训练次数阈值,若是则进入步骤S520,若否则进入步骤S560;
步骤S520:判断是否接收到用于指示停止对微指令缓存资源进行训练、并通过指令缓存资源进行取指的退出指令,若是则进入步骤S560,若否则同时进入步骤S530和步骤S540;
步骤S530:在译码阶段,判断是否进行OC训练,如果是,则在填写OC时后,将训练次数计数器加1。在通过译码或者OC取指之后,填入微指令队列时,统计每条指令的来源,如果微指令来自于OC,则微指令缓存资源计数器加1并进入步骤S550;如果微指令来自于IC,则指令缓存资源计数器加1并进入步骤S550;
步骤S540:监测所述线程是否存循环指令并计算所述循环指令的循环体大小,并将监测结果上报;
步骤S550:响应于所述训练次数计数器的数值大于最小训练次数阈值,根据所述指令缓存资源取指次数计数器的数值和所述微指令缓存资源取指次数计数器的数值,确定所述线程的微指令缓存资源的使用参数,并将所述使用参数上报;
步骤S560:判断是否接收到用于指示继续对微指令缓存资源进行训练、并等待用于停止对微指令缓存资源进行训练并对指令缓存资源进行取指的退出指令的等待退出指令,若否则强制停止对微指令缓存资源进行训练,并上报本次事件,若是则进入步骤S570;
步骤S570:判断是否接收到强制停止对微指令缓存资源进行训练的退出指令,若是则强制停止对微指令缓存资源进行训练,并上报本次事件,若否则继续执行步骤S570。
图5-2示出了根据本公开实施例的又一种线程监测方法的流程示意图。
图5-2示出的具体操作流程如下:
(1)开始后,线程将自身的OC训练次数计数器初始化为0,将OC训练次数与控制中心设定的OC训练次数阈值进行比较;
(2)如果OC训练次数<=OC训练次数阈值,则跳入步骤(3);
(3)判断是否接收到从线程调度控制中心发送的退出指令,如果未接收到退出指令,则监测两部分信息,进行第一部分的分支循环体监测和信息上报,进入步骤(5),并且进行第二部分的使用参数收集和信息上报,进入步骤(6);如果接收到退出指令则停止OC训练,并强制进入到IC取指模式;
(4)如果OC训练次数>OC训练次数阈值,则进入步骤(9);
(5)在本步骤进行分支循环体监测,目前,在分支预测部件,现有技术已经有方法监测是否存在循环体以及循环体的大小,在本步骤中,收集从分支预测部件发送来的是否存在循环体及循环体的大小,并将以上信息上报给线程调度控制中心,为线程调度控制中心对OC资源的配置提供依据;
(6)在本步骤及步骤(7)(8)将进行OC使用参数收集和信息上报,监测本线程是否进入OC取指模式,在译码阶段,针对每次写到OC容器的操作,OC训练次数计数器加1,在IC或者OC取指之后,写入微指令队列时,统计微指令的来源,如果微指令来自于OC取指路径,则微指令缓存资源取指次数计数器加1,如果否,则指令缓存资源取指次数计数器加1;
(7)为OC使用参数设置阈值(该阈值认为是OC能够达到效果的最小训练次数阈值),当OC训练次数>最小训练次数阈值时,这时候认为从OC统计拿到的使用参数是有效的;
(8)将上述的OC使用参数发送给线程调度控制中心;控制中心能够总览所有线程的性能结果,并结合线程上报的分支循环体信息进行配置;
(9)判断本线程是否存在从线程调度控制中心发送的等待退出指令,如果有,则不会停止OC训练,直到接收到线程调度中心发送的退出指令,才会停止OC训练并且强制本线程进入到IC取指模式。
如图6所示,本公开实施例还提供了一种微指令缓存资源的调度装置600,所述微指令缓存资源由多个线程共享,所述调度装置600包括:获取模块601,其被配置为对于所述多个线程中的每个线程,获取所述线程对微指令缓存资源的使用参数和所述线程的指令特性中的至少一个;配置模块602,其被配置为根据获取到的每个线程的所述使用参数和所述指令特性中的至少一个,动态地配置每个所述线程对所述微指令缓存资源的使用,其中,所述使用参数指示所述线程对微指令缓存资源的使用性能。本实施例中的微指令缓存资源的调度装置600是本文上述实施例提供的微指令缓存资源的调度方法对应的装置实施例,在此不再赘述(下同)。
在一些实施例中,其中所述使用参数包括以下至少一项:每个所述线程的指令缓存资源的取指次数,其中所述指令缓存资源的取指次数为在对微指令缓存资源进行训练的情况下,通过指令缓存资源取指的微指令个数;每个所述线程的微指令缓存资源的取指次数,其中所述微指令缓存资源的取指次数为进入为微指令缓存资源取指模式时,通过微指令缓存资源取指的微指令个数;每个所述线程的微指令缓存资源的停止训练取指次数,其中所述微指令缓存资源的停止训练取指次数为在停止对微指令缓存资源进行训练的情况下,通过指令缓存资源取指的微指令个数;根据所述指令缓存资源取指次数、所述微指令缓存资源取指次数、所述停止训练取指次数中的至少两项确定的性能指标。
在一些实施例中,其中所述指令特征包括以下至少一项:每个所述线程是否存在循环指令;每个所述线程中循环指令的循环体大小及循环次数。
在一些实施例中,其中配置所述线程对微指令缓存资源的使用包括以下中的至少一项:重新分配所述线程的微指令缓存资源训练次数阈值;向所述线程发送退出指令,所述退出指令用于指示停止对微指令缓存资源进行训练、并通过指令缓存资源进行取指;向所述线程发送等待退出指令,所述等待退出指令用于指示继续对微指令缓存资源进行训练、并等待用于停止对微指令缓存资源进行训练并对指令缓存资源进行取指的退出指令。
在一些实施例中,还包括:再平衡模块,其被配置为响应于满足预设条件,向每个所述线程发送再平衡命令,其中所述再平衡命令用于将每个所述线程的微指令缓存资源的训练次数阈值恢复至默认值,另外,计数器恢复至默认值,例如,微指令缓存取指计数器等。
在一些实施例中,其中所述使用性能的等级包括高性能、中性能、低性能,所述指令特性的等级包括高循环特性、中循环特性、低循环特性,以及所述配置模块进一步配置为:根据所述使用性能的等级和所述指令特征的等级,采用预设的仲裁算法,对所述线程对微指令缓存资源的使用进行配置。
在一些实施例中,其中所述多线程为四个线程,所述预设的仲裁算法包括:若所述四个线程中至少两个线程的所述使用性能为高性能,则保持所述四个线程的微指令缓存资源的训练次数阈值。
在一些实施例中,其中所述预设的仲裁算法还包括:若所述四个线程中只有一个线程的所述使用性能为高性能,则根据具有非高性能的另外三个线程的指令特性重新分配所述三个线程的微指令缓存资源训练次数阈值,同时保持具有高性能的所述线程的微指令缓存资源训练次数阈值。
在一些实施例中,其中所述预设的仲裁算法还包括:若所述四个线程中所有线程的使用性能均为非高性能,则根据四个所述线程的指令特性重新分配所述四个线程的微指令缓存资源训练次数阈值或者,平均分配所述四个线程对微指令缓存资源和指令缓存资源的使用。
在一些实施例中,其中所述使用参数为所述微指令缓存资源的取指次数和/或根据所述微指令缓存资源的取指次数、所述指令缓存资源的取指次数、所述停止训练取指次数中的至少两项确定的,所述获取模块进一步被配置为:响应于当某一线程的所述微指令缓存资源训练次数大于最小训练次数阈值时,获取所有线程的所述使用参数,或者,在固定时间间隔,获取所有线程的所述使用参数。
本公开实施例还提供了一种计算机程序产品,其特征在于,所述程序包括程序代码指令,用于在所述程序由处理器执行时实现根据本公开中任一项所述的微指令缓存资源的调度方法以及/或者根据本公开中任一项所述的线程监测方法。
本公开实施例还提供了一种芯片,包括处理器、存储器和总线,其中所述处理器包括根据本公开中任一项所述的调度装置。
本申请使用了特定词语来描述本申请的实施例。如“第一/第二实施例”、“一实施例”、和/或“一些实施例”意指与本申请至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一替代性实施例”并不一定是指同一实施例。此外,本申请的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
此外,本领域技术人员可以理解,本申请的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们的任何新的和有用的改进。相应地,本申请的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外,本申请的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。
除非另有定义,这里使用的所有术语(包括技术和科学术语)具有与本发明所属领域的普通技术人员共同理解的相同含义。还应当理解,诸如在通常字典里定义的那些术语应当被解释为具有与它们在相关技术的上下文中的含义相一致的含义,而不应用理想化或极度形式化的意义来解释,除非这里明确地这样定义。
上面是对本发明的说明,而不应被认为是对其的限制。尽管描述了本发明的若干示例性实施例,但本领域技术人员将容易地理解,在不背离本发明的新颖教学和优点的前提下可以对示例性实施例进行许多修改。因此,所有这些修改都意图包含在权利要求书所限定的本发明范围内。应当理解,上面是对本发明的说明,而不应被认为是限于所公开的特定实施例,并且对所公开的实施例以及其他实施例的修改意图包含在所附权利要求书的范围内。本发明由权利要求书及其等效物限定。

Claims (27)

1.一种微指令缓存资源的调度方法,所述微指令缓存资源由多个线程共享,所述调度方法包括:
对于所述多个线程中的每个线程,获取所述线程对微指令缓存资源的使用参数和所述线程的指令特性中的至少一个;
根据获取到的每个线程的所述使用参数和所述指令特性中的至少一个,动态地配置每个所述线程对所述微指令缓存资源的使用,
其中,所述使用参数指示所述线程对微指令缓存资源的使用性能。
2.根据权利要求1所述的调度方法,其中所述使用参数包括以下至少两项:
每个所述线程的指令缓存资源的取指次数,其中所述指令缓存资源的取指次数为在对微指令缓存资源进行训练的情况下,通过指令缓存资源读取的微指令个数;
每个所述线程的微指令缓存资源的取指次数,其中所述微指令缓存资源的取指次数为进入为微指令缓存资源取指模式时,通过微指令缓存资源读取的微指令个数;
每个所述线程的微指令缓存资源的停止训练取指次数,其中所述微指令缓存资源的停止训练取指次数为在停止对微指令缓存资源进行训练的情况下,通过指令缓存资源读取的微指令个数;
根据所述指令缓存资源取指次数、所述微指令缓存资源取指次数、所述停止训练取指次数中的至少两项确定的参数。
3.根据权利要求1或2所述的调度方法,其中所述指令特性包括以下至少一项:
每个所述线程是否存在循环指令;
每个所述线程中循环指令的循环体大小及循环次数。
4.根据权利要求3所述的调度方法,其中配置所述线程对微指令缓存资源的使用包括以下中的至少一项:
重新分配所述线程的微指令缓存资源训练次数阈值;
向所述线程发送退出指令,所述退出指令用于指示停止对微指令缓存资源进行训练、并通过指令缓存资源进行取指;
向所述线程发送等待退出指令,所述等待退出指令用于指示继续对微指令缓存资源进行训练、并等待用于停止对微指令缓存资源进行训练并通过指令缓存资源进行取指的退出指令。
5.根据权利要求1所述的调度方法,还包括:
响应于满足预设条件,向每个所述线程发送再平衡命令,其中所述再平衡命令用于将每个所述线程的微指令缓存资源的训练次数阈值恢复至默认值。
6.根据权利要求1所述的调度方法,其中
所述使用性能的等级包括高性能、中性能、低性能,
所述指令特性的等级包括高循环特性、中循环特性、低循环特性,以及
所述根据获取到的所述使用性能和所述指令特性,动态地配置每个所述线程对微指令缓存资源的使用包括:
根据所述使用性能的等级和所述指令特性的等级,采用预设的仲裁算法,对所述线程对微指令缓存资源的使用进行配置。
7.根据权利要求6所述的调度方法,其中所述多个线程为四个线程,所述预设的仲裁算法包括:
若所述四个线程中至少两个线程的所述使用性能为高性能,则保持所述四个线程的微指令缓存资源的训练次数阈值。
8.根据权利要求7所述的调度方法,其中所述预设的仲裁算法还包括:
若所述四个线程中只有一个线程的所述使用性能为高性能,则根据具有非高性能的另外三个线程的指令特性重新分配所述三个线程的微指令缓存资源训练次数阈值,同时保持具有高性能的所述线程的微指令缓存资源训练次数阈值;或者,若所述四个线程中只有一个线程的所述使用性能为高性能且无法确定另外三个线程的指令特性,将所述另外三个线程中的两个线程确定为通过指令缓存资源读取微指令以及将所述另外三个线程中的另一个线程确定为通过微指令缓存资源读取微指令。
9.根据权利要求7所述的调度方法,其中所述预设的仲裁算法还包括:
若所述四个线程中所有线程的使用性能均为非高性能,则根据四个所述线程的指令特性重新分配所述四个线程的微指令缓存资源训练次数阈值或者,平均分配所述四个线程对微指令缓存资源和指令缓存资源的使用;或者若所述四个线程中所有线程的使用性能均为非高性能且无法确定所述四个线程中的指令特性,将所述四个线程中的两个线程确定为通过指令缓存资源读取微指令以及将所述四个线程中的另外两个线程确定为通过微指令缓存资源读取微指令。
10.根据权利要求2所述的调度方法,其中所述使用参数为所述微指令缓存资源取指次数和/或根据所述指令缓存资源取指次数、所述微指令缓存资源取指次数、所述停止训练取指次数中的至少两项确定的,所述获取所述线程对微指令缓存资源的使用参数包括:
响应于某一线程的所述微指令缓存资源训练次数大于最小训练次数阈值,获取所有线程的所述使用参数;或者,
在固定时间间隔,获取所有线程的所述使用参数。
11.一种线程监测方法,所述线程为共享微指令缓存资源的多个线程中的任一线程,所述线程具有对应的训练次数计数器、指令缓存资源取指次数计数器、微指令缓存资源取指次数计数器和停止训练后取指次数计数器,所述训练次数计数器用于记录所述线程的微指令缓存资源的训练次数,所述指令缓存资源取指次数计数器用于记录在对微指令缓存资源进行训练情况下,所述线程通过指令缓存资源读取微指令的个数,所述微指令缓存资源取指次数计数器用于记录在进入微指令缓存资源取指的情况下,所述线程通过微指令缓存资源读取指令的个数,所述停止训练后取指次数计数器用于记录停止训练微指令缓存资源后从指令缓存资源中读取的微指令个数,所述线程监测方法包括:
监测所述线程的微指令缓存资源的训练次数、指令缓存资源的取指次数、微指令缓存资源的取指次数和微指令缓存资源停止训练后的取指次数;
根据用于所述线程的指令缓存资源的取指次数、微指令缓存资源的取指次数、微指令缓存资源停止训练后取指次数,确定所述线程的微指令缓存资源的使用参数;以及
向调度中心提供所述线程的使用参数,以供所述调度中心动态地配置每个所述线程对所述微指令缓存资源的使用。
12.根据权利要求11所述的方法,还包括:
检测所述线程的指令特性;以及
向调度中心提供所述线程的指令特性,以供所述调度中心基于所述使用性能和指令特性动态地配置每个所述线程对所述微指令缓存资源的使用。
13.根据权利要求12所述的方法,其中,所述检测所述线程的指令特性包括:
监测所述线程是否具有循环指令、计算所述循环指令的循环体大小、统计所述循环体的循环次数是否高于设定阈值。
14.根据权利要求11所述的方法,还包括:
在所述线程的微指令缓存资源的训练次数超出所述线程的微指令缓存资源训练次数阈值的情况下,响应于接收到退出指令,停止对微指令缓存资源进行训练、并通过指令缓存资源进行取指。
15.根据权利要求14所述的方法,还包括:
响应于接收到等待退出指令,继续对微指令缓存资源进行训练、并等待用于停止对微指令缓存资源进行训练并对指令缓存资源进行取指的退出指令。
16.一种微指令缓存资源的调度装置,所述微指令缓存资源由多个线程共享,所述调度装置包括:
获取模块,其被配置为对于所述多个线程中的每个线程,获取所述线程对微指令缓存资源的使用参数和所述线程的指令特性中的至少一个;
配置模块,其被配置为根据获取到的每个线程的所述使用参数和所述指令特性中的至少一个,动态地配置每个所述线程对所述微指令缓存资源的使用,其中,所述使用参数指示所述线程对微指令缓存资源的使用性能。
17.根据权利要求16所述的调度装置,其中所述使用参数包括以下至少一项:
每个所述线程的指令缓存资源的取指次数,其中所述指令缓存资源的取指次数为在对微指令缓存资源进行训练的情况下,通过指令缓存资源进行取指的微指令个数;
每个所述线程的微指令缓存资源的取指次数,其中所述微指令缓存资源的取指次数为进入为微指令缓存资源取指模式时,通过微指令缓存资源进行取指的微指令个数;
每个所述线程的微指令缓存资源的停止训练取指次数,其中所述微指令缓存资源的停止训练取指次数为在停止对微指令缓存资源进行训练的情况下,通过指令缓存资源进行取指的微指令个数;
根据所述指令缓存资源的取指次数、所述微指令缓存资源的取指次数、所述停止训练取指次数中的至少两项确定的性能指标。
18.根据权利要求16或17所述的调度装置,其中所述指令特征包括以下至少一项:
每个所述线程是否存在循环指令;
每个所述线程中循环指令的循环体大小及循环次数。
19.根据权利要求18的调度装置,其中配置所述线程对微指令缓存资源的使用包括以下中的至少一项:
重新分配所述线程的微指令缓存资源训练次数阈值;
向所述线程发送退出指令,所述退出指令用于指示停止对微指令缓存资源进行训练、并通过指令缓存资源进行取指;
向所述线程发送等待退出指令,所述等待退出指令用于指示继续对微指令缓存资源进行训练、并等待用于停止对微指令缓存资源进行训练并对指令缓存资源进行取指的退出指令。
20.根据权利要求16所述的调度装置,还包括:
再平衡模块,其被配置为响应于满足预设条件,向每个所述线程发送再平衡命令,其中所述再平衡命令用于将每个所述线程的微指令缓存资源的训练次数阈值恢复至默认值。
21.根据权利要求18所述的调度装置,其中
所述使用性能的等级包括高性能、中性能、低性能,
所述指令特性的等级包括高循环特性、中循环特性、低循环特性,以及所述配置模块进一步配置为:
根据所述使用性能的等级和所述指令特征的等级,采用预设的仲裁算法,对所述线程对微指令缓存资源的使用进行配置。
22.根据权利要求21所述的调度装置,其中所述多线程为四个线程,所述预设的仲裁算法包括:
若所述四个线程中至少两个线程的所述使用性能为高性能,则保持所述四个线程的微指令缓存资源的训练次数阈值。
23.根据权利要求22所述的调度装置,其中所述预设的仲裁算法还包括:
若所述四个线程中只有一个线程的所述使用性能为高性能,则根据具有非高性能的另外三个线程的指令特性重新分配所述三个线程的微指令缓存资源训练次数阈值,同时保持具有高性能的所述线程的微指令缓存资源训练次数阈值;或者,若所述四个线程中只有一个线程的所述使用性能为高性能且无法确定另外三个线程的指令特性,将所述另外三个线程中的两个线程确定为通过指令缓存资源读取微指令以及将所述另外三个线程中的另一个线程确定为通过微指令缓存资源读取微指令。
24.根据权利要求22所述的调度装置,其中所述预设的仲裁算法还包括:
若所述四个线程中所有线程的使用性能均为非高性能,则根据四个所述线程的指令特性重新分配所述四个线程的微指令缓存资源训练次数阈值或者,平均分配所述四个线程对微指令缓存资源和指令缓存资源的使用;或者若所述四个线程中所有线程的使用性能均为非高性能且无法确定所述四个线程中的指令特性,将所述四个线程中的两个线程确定为通过指令缓存资源读取微指令以及将所述四个线程中的另外两个线程确定为通过微指令缓存资源读取微指令。
25.根据权利要求17的调度装置,其中所述使用参数为所述微指令缓存资源的取指次数和/或根据所述指令缓存资源的取指次数、所述微指令缓存资源的取指次数、所述停止训练取指次数中的至少两项确定的,所述获取模块进一步被配置为:
响应于某一线程的所述微指令缓存资源训练次数大于最小训练次数阈值时,获取所有线程的所述使用参数;或者,在固定时间间隔,获取所有线程的所述使用参数。
26.一种计算机程序产品,其特征在于,所述程序包括程序代码指令,用于在所述程序由处理器执行时实现根据权利要求1-10中任一项所述的微指令缓存资源的调度方法以及/或者根据权利要求11-15所述的线程监测方法。
27.一种芯片,包括处理器、存储器和总线,其中所述处理器包括根据权利要求16-25所述的调度装置。
CN202111450622.0A 2021-12-01 2021-12-01 微指令缓存资源的调度方法、装置、程序产品以及芯片 Active CN114138341B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111450622.0A CN114138341B (zh) 2021-12-01 2021-12-01 微指令缓存资源的调度方法、装置、程序产品以及芯片

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111450622.0A CN114138341B (zh) 2021-12-01 2021-12-01 微指令缓存资源的调度方法、装置、程序产品以及芯片

Publications (2)

Publication Number Publication Date
CN114138341A true CN114138341A (zh) 2022-03-04
CN114138341B CN114138341B (zh) 2023-06-02

Family

ID=80386791

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111450622.0A Active CN114138341B (zh) 2021-12-01 2021-12-01 微指令缓存资源的调度方法、装置、程序产品以及芯片

Country Status (1)

Country Link
CN (1) CN114138341B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115525344A (zh) * 2022-10-31 2022-12-27 海光信息技术股份有限公司 一种译码方法、处理器、芯片及电子设备

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030115553A1 (en) * 2001-12-13 2003-06-19 Quicksilver Technology, Inc. Computer processor architecture selectively using finite-state-machine for control code execution
CN101984403A (zh) * 2009-06-01 2011-03-09 威盛电子股份有限公司 微处理器及其执行的方法
CN102156627A (zh) * 2010-01-22 2011-08-17 威盛电子股份有限公司 执行快速重复载入数据串操作的微处理器
CN102566974A (zh) * 2012-01-14 2012-07-11 哈尔滨工程大学 基于同时多线程的取指控制方法
EP2508983A1 (en) * 2011-04-07 2012-10-10 VIA Technologies, Inc. Conditional non-branch instruction prediction
CN103778013A (zh) * 2014-01-24 2014-05-07 中国科学院空间应用工程与技术中心 一种多通道Nand Flash控制器及其控制方法
CN104298488A (zh) * 2014-09-29 2015-01-21 上海兆芯集成电路有限公司 循环预测器指导的循环缓冲器
CN105279016A (zh) * 2014-07-21 2016-01-27 英特尔公司 线程暂停处理器、方法、系统及指令
CN105408860A (zh) * 2013-09-06 2016-03-16 华为技术有限公司 多线程异步处理器系统和方法
CN105511841A (zh) * 2014-12-14 2016-04-20 上海兆芯集成电路有限公司 用以改善在处理器中重新执行加载的装置与方法
CN108279927A (zh) * 2017-12-26 2018-07-13 芯原微电子(上海)有限公司 可调整指令优先级的多通道指令控制方法及系统、控制器
CN112000370A (zh) * 2020-08-27 2020-11-27 北京百度网讯科技有限公司 循环指令的处理方法、装置、设备和存储介质
CN112445619A (zh) * 2020-11-30 2021-03-05 海光信息技术股份有限公司 在多线程系统中动态共享有序资源的管理系统和方法

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030115553A1 (en) * 2001-12-13 2003-06-19 Quicksilver Technology, Inc. Computer processor architecture selectively using finite-state-machine for control code execution
CN101984403A (zh) * 2009-06-01 2011-03-09 威盛电子股份有限公司 微处理器及其执行的方法
CN102156627A (zh) * 2010-01-22 2011-08-17 威盛电子股份有限公司 执行快速重复载入数据串操作的微处理器
EP2508983A1 (en) * 2011-04-07 2012-10-10 VIA Technologies, Inc. Conditional non-branch instruction prediction
CN102566974A (zh) * 2012-01-14 2012-07-11 哈尔滨工程大学 基于同时多线程的取指控制方法
CN105408860A (zh) * 2013-09-06 2016-03-16 华为技术有限公司 多线程异步处理器系统和方法
CN103778013A (zh) * 2014-01-24 2014-05-07 中国科学院空间应用工程与技术中心 一种多通道Nand Flash控制器及其控制方法
CN105279016A (zh) * 2014-07-21 2016-01-27 英特尔公司 线程暂停处理器、方法、系统及指令
CN104298488A (zh) * 2014-09-29 2015-01-21 上海兆芯集成电路有限公司 循环预测器指导的循环缓冲器
CN105511841A (zh) * 2014-12-14 2016-04-20 上海兆芯集成电路有限公司 用以改善在处理器中重新执行加载的装置与方法
CN108279927A (zh) * 2017-12-26 2018-07-13 芯原微电子(上海)有限公司 可调整指令优先级的多通道指令控制方法及系统、控制器
CN112000370A (zh) * 2020-08-27 2020-11-27 北京百度网讯科技有限公司 循环指令的处理方法、装置、设备和存储介质
CN112445619A (zh) * 2020-11-30 2021-03-05 海光信息技术股份有限公司 在多线程系统中动态共享有序资源的管理系统和方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115525344A (zh) * 2022-10-31 2022-12-27 海光信息技术股份有限公司 一种译码方法、处理器、芯片及电子设备

Also Published As

Publication number Publication date
CN114138341B (zh) 2023-06-02

Similar Documents

Publication Publication Date Title
US9952905B2 (en) Methods and systems to identify and migrate threads among system nodes based on system performance metrics
US9626295B2 (en) Systems and methods for scheduling tasks in a heterogeneous processor cluster architecture using cache demand monitoring
US10209998B2 (en) Multi-threading processor and a scheduling method thereof
US8397236B2 (en) Credit based performance managment of computer systems
US8886918B2 (en) Dynamic instruction execution based on transaction priority tagging
US8677361B2 (en) Scheduling threads based on an actual power consumption and a predicted new power consumption
US8898434B2 (en) Optimizing system throughput by automatically altering thread co-execution based on operating system directives
US7418576B1 (en) Prioritized issuing of operation dedicated execution unit tagged instructions from multiple different type threads performing different set of operations
CN102341790B (zh) 数据处理系统及其使用的方法
US9632836B2 (en) Scheduling applications in a clustered computer system
KR101519891B1 (ko) 멀티스레드 프로세서를 위한 스레드 디엠퍼시스 명령
US10176014B2 (en) System and method for multithreaded processing
CN109308220B (zh) 共享资源分配方法及装置
CN111045814A (zh) 资源调度方法和终端设备
US8332850B2 (en) Thread starvation profiler by utilizing a set of counters
CN101561778B (zh) 一种检测多任务操作系统任务死循环的方法
CN114138341B (zh) 微指令缓存资源的调度方法、装置、程序产品以及芯片
CN114651235A (zh) 多线程微处理器中的共享资源分配
KR101725408B1 (ko) 실시간 운영체제의 태스크 스케줄링 방법
JP5243822B2 (ja) 仮想化されたデータ処理環境におけるワークロード管理
Ide et al. A Learning-based Fetch Thread Gating Mechanism for A Simultaneous Multithreading Processor
CN115145591B (zh) 一种基于多中心的医疗etl任务调度方法、系统及装置
CN113515359A (zh) 基于m2微处理器的线程调度方法、系统及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant