CN101526895A - 基于指令双发射的高性能低功耗嵌入式处理器 - Google Patents

基于指令双发射的高性能低功耗嵌入式处理器 Download PDF

Info

Publication number
CN101526895A
CN101526895A CN200910095583A CN200910095583A CN101526895A CN 101526895 A CN101526895 A CN 101526895A CN 200910095583 A CN200910095583 A CN 200910095583A CN 200910095583 A CN200910095583 A CN 200910095583A CN 101526895 A CN101526895 A CN 101526895A
Authority
CN
China
Prior art keywords
instruction
unit
performance
power
sheet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200910095583A
Other languages
English (en)
Other versions
CN101526895B (zh
Inventor
严晓浪
孟建熠
葛海通
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou C Sky Microsystems Co Ltd
Original Assignee
Hangzhou C Sky Microsystems Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou C Sky Microsystems Co Ltd filed Critical Hangzhou C Sky Microsystems Co Ltd
Priority to CN200910095583XA priority Critical patent/CN101526895B/zh
Publication of CN101526895A publication Critical patent/CN101526895A/zh
Application granted granted Critical
Publication of CN101526895B publication Critical patent/CN101526895B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Power Sources (AREA)
  • Microcomputers (AREA)

Abstract

一种基于指令双发射的高性能低功耗嵌入式处理器,包括取指单元,用于在单时钟周期内预取两条指令,并送入流水线;双路译码单元,用于在单时钟周期内并行译码两条指令;发射单元,用于单时钟周期并行发射两条指令;指令分发执行控制单元,用于根据运算负荷动态调整指令分发,依照乱序执行机制控制执行;指令执行单元,用于进行指令的结果的运算;载入/存储单元,用于在当指令发生缺失时,后续指令成功占用流水线并顺利访问片上数据存储器和片外数据存储器。本发明在低功耗的前提下提高嵌入式处理器的性能、降低成本。

Description

基于指令双发射的高性能低功耗嵌入式处理器
技术领域
本发明涉及一种嵌入式处理器,尤其是一种高性能低功耗嵌入式处理器。
背景技术
嵌入式系统指面向特定应用领域和执行特定任务的计算机系统,通常由嵌入式处理器、外围硬件设备、嵌入式操作系统以及用户的应用程序等四个部分组成。嵌入式系统无所不在,并已经渗透到国名经济的各个角落:在消费类电子产品中,如数码相机、DVD播放器和打印机等;在医疗设备中,如强心剂无节律监视器和强心剂心律调整器等;在汽车设计中,如燃料加注系统和自动刹闸系统等。嵌入式系统将在国家信息化战略中起到至关重要的作用。
嵌入式处理器是嵌入式系统的核心部件。嵌入式处理器负责运行操作系统以及用户的应用程序,调度和管理外围硬件设备,是系统正常高效运行的硬件基础。按照数据位的宽度,嵌入式处理器可分为8位,16位和32位微处理器。目前,8位嵌入式处理器以8051为代表,主要应用于低端嵌入式应用领域;16位和32位嵌入式处理器应用于对性能有较高要求的高端嵌入式系统中,包括信息安全、消费类电子、通信等领域。高端32位嵌入式处理器是未来高性能嵌入式系统发展的必然要求,并逐渐代替8位、16位嵌入式处理器成为嵌入式领域的主流处理器。
过去嵌入式处理器性能提高主要依赖运行频率的提升,流水线技术是处理器频率提升的核心技术。流水线技术通过将指令运行划分成若干的步骤,并将这些步骤分别分配到不同的时钟周期,这样每个时钟周期仅需完成总工作量的若干分支一,使得硬件电路的时钟频率有极大的提升。流水线每个执行节拍将当前完成的指令送入下个执行节拍,每个节拍均有指令完成,从而提升了处理器整体吞吐量。过去10多年,嵌入式处理器的频率从几兆赫兹提升到几百兆赫兹,总体处理能力有了突飞猛进。但是频率的提升意味着增加硬件成本和系统功耗,这对于成本功耗敏感的嵌入式系统往往是不可接受的。因此,仅通过提升处理器频率来提高性能无法满足高端嵌入式应用对于处理器性能、功耗和成本等多方面的需求。
发明内容
为了克服已有的嵌入式处理器不能兼顾性能和功耗、成本高的不足,本发明提供一种在低功耗的前提下提高性能、成本低的基于指令双发射的高性能低功耗嵌入式处理器。
本发明解决其技术问题所采用的技术方案是:
一种基于指令双发射的高性能低功耗嵌入式处理器,包括:
取指单元,用于在单时钟周期内从所述片上指令存储器或片外指令存储器中预取两条指令,并送入流水线;
双路译码单元,用于在流水线中设置两个相同的译码单元,在单时钟周期内并行译码两条指令;
发射单元,用于将译码后的两条指令存放到流水线寄存器,单时钟周期并行发射两条指令,如参与运算的操作数准备完毕,在下一时钟周期将其送入执行单元开始执行;如参与运算的操作数未准备完毕,将操作数未就绪的指令暂时保存至保留站寄存器中并释放发射窗口,下一个时钟周期,后续指令通过发射窗口进行正常发射;
指令分发执行控制单元,用于根据运算负荷动态调整指令分发,指令分配逻辑实时监测各执行单元的工作情况,并根据各指令执行单元返回的信息将当前发射的指令动态分配至空闲的执行单元中;
指令执行单元,用于进行指令的结果的运算;
载入/存储单元,用于当指令发生载入/存储操作缺失时,当前载入/存储指令临时释放流水线,在专用的回填缓冲区中等待结果从片外载入,后续载入/存储指令成功占用流水线并顺利访问片上数据存储器和片外数据存储器。
作为优选的一种方案:在所述指令发射单元中,当前序指令由于操作数未就绪而暂停执行时,后续发射的指令若操作数准备就绪,先于前续指令进入执行单元并开始执行。
作为优选的另一种方案:所述嵌入式处理器还包括:通用协处理器接口,用于支持面向各种应用领域的扩展;所述通用协处理器器接口连接协处理器总线。
进一步,所述片上指令存储器包括:指令高速缓存器,用于实现对指令读取的片上高速缓冲;指令高速暂存器,用于提供软件可配置的指令缓冲区;片上数据存储器包括:数据高速缓存器,用于实现对数据读取的片上高速缓冲;数据高速暂存器,用于提供软件可配置的片上数据临时保存空间。
更进一步,所述嵌入式处理器还包括:功耗管理单元,用于实现从正常模式到待机、关机和休眠三种低功耗模式转换。
再进一步,在所述指令执行单元中,根据处理器性能的需求的高低,增加或减少相应的执行单元个数。执行单元的接口实现标准化。
本发明的技术构思为:提升处理器性能的另一个重要途径是在保持频率不变的情况下,提升处理器并行处理能力,增加处理器每个时钟周期能够处理指令的数目。通过对处理器流水线的改进,允许每个时钟周期并行发射多条指令,提高指令级的并行性提升处理器的综合处理能力。挖掘处理器并行性提升处理器性能是目前嵌入式处理器创新的主流思想。流水线的多发射机制是提高处理器性能,同时降低处理器功耗的重要途径,也是未来面向高性能嵌入式计算的嵌入式处理器发展的主要方向。
本发明提出了单周期并行发射和执行两条指令的嵌入式处理器硬件架构,创新了流水线多种工作机制,极大的提升了嵌入式处理器的并行处理能力,实现了嵌入式处理器在性能上的跨越式发展。
本发明的有益效果主要表现在:1、在低功耗的前提下提高性能:通过各种高效流水线执行机制的有机组合,基于指令双发射的高性能低功耗嵌入式处理器与相同指令集系统的单发射处理器相比,极限性能提升100%,平均性能提升60%左右,可满足高性能嵌入式计算的基本需求。通过有效的功耗管理机制,功耗控制在0.4mW/MHz以内;2、降低了成本。
附图说明
图1是指令双发射嵌入式处理器总体结构框图。
图2是取指单元从片上或片外存储器取指逻辑框图。
图3是非阻塞的发射机制的示意图。
图4是指令动态分配策略的示意图。
图5是处理器工作模式转换的示意图。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1~图5,一种基于指令双发射的高性能低功耗嵌入式处理器,包括:
取指单元,用于在单时钟周期内从所述片上指令存储器或片外指令存储器中预取两条指令,并送入流水线;
双路译码单元,用于在流水线中设置两个相同的译码单元,在单时钟周期内并行译码两条指令;
发射单元,用于将译码后的两条指令存放到流水线寄存器,单时钟周期并行发射两条指令,如参与运算的操作数准备完毕,在下一时钟周期将其送入执行单元开始执行;如参与运算的操作数未准备完毕,将操作数未就绪的指令暂时保存至保留站寄存器中并释放发射窗口,下一个时钟周期,后续指令通过发射窗口进行正常发射;
指令分发执行控制单元,用于根据运算负荷动态调整指令分发,指令分配逻辑实时监测各执行单元的工作情况,并根据各指令执行单元返回的信息将当前发射的指令动态分配至空闲的执行单元中;
指令执行单元,用于进行指令的结果的运算,执行单元的接口实现标准化,可根据处理器性能的需求的高低,增加或减少相应的执行单元个数;
载入/存储单元,用于当指令发生载入/存储操作缺失时,当前载入/存储指令临时释放流水线,在专用的回填缓冲区中等待结果从片外载入,后续载入/存储指令成功占用流水线并顺利访问片上数据存储器和片外数据存储器。
在所述指令发射单元中,当前序指令由于操作数未就绪而暂停执行时,后续发射的指令若操作数准备就绪,先于前续指令进入执行单元并开始执行。
本实施例的嵌入式处理器的总体逻辑框图如附图1所示,其具体需实施主要包括以下步骤:
1)取指单元实现单时钟周期预取两条指令,送入流水线;
2)采用双路译码单元,单时钟周期并行译码两条指令;
3)采用非阻塞发射机制,单时钟周期并行发射两条指令
4)指令动态分配机制可根据执行单元运算负荷动态调整指令分发;
5)采用乱序执行机制,完成发射的指令只要操作数准备完毕即可进入指令执行单元执行,其执行顺序与程序顺序无关;
6)采用非阻塞载入/存储机制,在前续指令出现高速缓存缺失情况下,后续指令可以继续进入载入/存储单元,并访问高速缓存器或高速暂存器;
7)通用协处理器接口实现嵌入式处理器面向特定应用领域的扩展;
8)高速缓存器与高速暂存器共同构成丰富的片上存储资源;
9)功耗管理单元实现处理器从正常模式到待机、关机和休眠三种低功耗模式转换。
其中,取指单元实现单时钟周期预取两条指令,送入流水线。双发射嵌入式处理器的取指单元处于流水线的最前级,其主要工作任务是每个时钟周期取两条指令,并送入流水线。指令通常保存在片上高速缓存器或高速暂存器,或者片外存储器中。片上存储器或者片外存储器按照两条指令宽度组织存储结构(区块1存储指令1,区块0存储指令0),保证每个时钟周期能够提供两条指令,如图2所示。当目标取指地址命中片上高速缓存器或高速暂存器时,每个时钟周期可以从这些片上存储器中取到两条指令。当目标取指地址出现片上高速缓存器或高速暂存器缺失时,需通过系统总线接口从片外存储器获得指令。
采用双路译码单元,单时钟周期并行译码两条指令。支持指令双发射的高性能流水线每个时钟周期需并行处理两条指令,因此需要设计两个功能相同的译码单元分别对两条指令进行独立译码。当前级流水线仅送一条指令进入译码单元时,其中一个译码单元会进入休眠状态,实现译码过程的低功耗。
在发射单元中,采用非阻塞发射机制,单时钟周期并行发射两条指令。指令经过译码后进入发射阶段,根据译码获得的操作数相关信息首先查找操作数是否就绪。若操作数准备就绪,指令可送入执行单元开始执行;若操作数暂时未就绪,则当前指令暂时不能送入执行单元,需要等待操作数就绪后方能发射。采用传统发射机制,由于当前指令需要等待操作数就绪后方能实施反射,后续指令由于不能占用反射窗口而被阻塞在前级流水线。本发明提出的非阻塞发射机制如图3所示,当指令出现操作数未就绪时,将当前指令发射至专用的保留站寄存器中,由保留站负责操作数的等待。此时发射窗口被释放,后续指令可以继续占用发射窗口,实施发射。这种机制通过将需要进行操作数等待的指令暂时移出主流水线,将发射窗口资源释放给后续指令的方法,解决了发射窗口的阻塞问题,提升处理器发射效率。
指令分发执行控制单元实现指令动态分配机制,可根据执行单元运算负荷动态调整指令分发。为了提升流水线的并行执行能力,双发射嵌入式处理器的执行单元的资源比较丰富,相同类型的指令配备两个相同的执行单元,从而实现两条相同类型指令的并行执行。而相对丰富的执行单元硬件资源对指令分配提出了更高了要求。固定的指令分配策略在很大程度上不能发挥执行单元资源的优势。双发射流水线采用动态分配策略,结合执行单元反馈的信息实施分配指令。对于同种类型的指令通常对应两个相同的执行单元,在默认情况下,出现指令0上的指令被发送到执行单元0,出现在指令1上的指令被发送至执行单元1。若执行单元0正忙而执行单元1空闲,则指令0可发送至执行单元1进行执行,如图4所示。这种可动态调整的分配策略虽然逻辑设计相对复杂,但可有效提升执行单元的利用效率,从而提高处理器的综合性能。
采用乱序执行机制,完成发射的指令只要操作数准备完毕即可进入执行单元执行,其执行顺序与程序顺序无关。指令进入执行单元执行的前提是参与运算的操作数准备完毕,若操作数由于数据相关性暂时还没有准备就绪,此时指令需要等待操作数。若按照程序的顺序执行指令,则后续的指令会由于当前指令的等待而无法执行,从而导致流水线的整体停顿。在支持乱序执行的流水线中,操作数未准备完毕的指令会被发射至保留站中临时保存,如图3所示,后续指令仍可继续发射至执行单元中。后续指令,特别是多周期才能执行完毕的指令,由于执行时间提前,因此其完成运算的时间也被提前,从而提高了处理器的整体处理能力。通过保留站技术,使后续指令提前进入流水线乱序执行的机制是提升处理器运算能力的关键技术。
在存储/载入单元中,采用非阻塞载入/存储机制,在前续存储/载入指令出现高速缓存缺失情况下,后续存储/载入指令仍可以继续进入载入/存储单元,访问存储器。载入/存储单元主要负责数据从片上或者片外存储器中载入。由于在流水线中设计了片上存储器和片上暂存器,通常数据从片上获得,从而提高数据载入速度。若出现片上存储器访问缺失时,数据需要从片外存储器中载入。传统处理器会堵塞流水线,直到当前数据重新载入为止。本发明公布的非阻塞载入/存储机制,在出现数据片上缓存器访问缺失时,将引起缺失的指令及其重新载入请求保存至流水线以外的专用回填缓冲区中等待数据结果从片外载入,释放流水线资源,这样后续指令仍然可以成功占用流水线并顺利访问高速存储器或高速暂存器资源,提高载入/存储单元的访问效率。由于后续指令仍可按照正常的方式提前进入载入/存储单元,所以处理器综合性能有一定的提升。
通用协处理器接口实现嵌入式处理器面向各种应用的扩展。嵌入式处理器通常面向特定的应用领域,不同的应用领域对于数据处理的形式和性能需求差异较大。因此提供一个有效的处理器扩展机制,面向不同应用设计不同的加速单元是目前解决应用复杂性的重要方法。本发明通过在处理器流水线中,设计一个协处理器接口单元,如图1所示,支持用户通过协处理器的方式实现功能扩展。通用协处理器接口定义了标准的数据的读写操作协议,实现了扩展运算单元与处理器内核的高速通信。
高速缓存器与高速暂存器共同构成丰富的片上存储资源。与处理器运行速度相比,片外存储器的运行速度相对较慢,处理器访问外部存储器的造成很大的性能损失。为了降低访问片外存储器而引起的性能损失,高性能嵌入式处理器通常设置对于软件透明的高速缓存器。本发明设计采用哈佛结构的指令高速缓存和数据高速缓存,取指单元从指令高速缓存中预取指令,载入/存储单元从数据高速缓冲中载入数据。高速缓存对于软件完全透明,无需软件干预,硬件控制逻辑通过重新载入机制自动从片外载入。对于一些特殊的嵌入式应用,软件往往需要控制数据在片上的保存与替换,仅设计片上高速缓存无法满足应用的多种需求。在这样的背景下,设计了片上高速暂存器作为片上缓存的重要补充。片上高速暂存器分为指令片上暂存器和数据片上暂存器,构成哈佛结构的片上存储器。片上暂存器需要软件显式的进行管理,从而适应特定应用对于片上存储器的需求。片上高速缓存和高速暂存作为片上一级缓存资源供用户结合具体的应用进行选择与配置。
功耗管理单元实现处理器从正常模式到待机、关机和休眠三种低功耗模式转换。为双发射嵌入式处理设置四种工作模式,分别为正常、待机、关机和休眠。正常工作模式为处理器全速运行的模式,处理器所有功能。待机、关机和休眠三种模式均为低功耗模式。在待机模式下,处理器的工作时钟被关闭,处理器流水线处于非活跃状态,所有寄存器信息不再更新,从而降低功耗。处理器的状态信息在待机模式下全部保存,仅需恢复时钟便可使处理器从新开始执行。关机模式下,处理器的电源被关闭,流水线和片上存储器信息完全丢失。休眠模式下,处理器内核电源被关闭,流水线信息丢失,但片上存储器的电源仍然保持。因此休眠模式下,仅有存储器的现场被保存。用户可以根据应用的不同需求,选择不同的模式进入低功耗状态。功耗管理单元同时负责从各个低功耗状态恢复,外设可通过中断激活处理器回到正常工作状态。低功耗状态转换关系如图5所示。通过WAIT指令,STOP指令和DOZE指令分别进入待机、关机和休眠三种模式;通过中断从低功耗模式中唤醒。

Claims (9)

1、一种基于指令双发射的高性能低功耗嵌入式处理器,其特征在于:所述嵌入式处理器包括:
取指单元,用于在单时钟周期内从所述片上指令存储器或片外指令存储器中预取两条指令,并送入流水线;
双路译码单元,用于在流水线中设置两个相同的译码单元,在单时钟周期内并行译码两条指令;
发射单元,用于将译码后的两条指令存放到流水线寄存器,单时钟周期并行发射两条指令,如参与运算的操作数准备完毕,在下一时钟周期将其送入执行单元开始执行;如参与运算的操作数未准备完毕,将操作数未就绪的指令暂时保存至保留站寄存器中并释放发射窗口,下一个时钟周期,后续指令通过发射窗口进行正常发射;
指令分发执行控制单元,用于根据运算负荷动态调整指令分发,指令分配逻辑实时监测各执行单元的工作情况,并根据各指令执行单元返回的信息将当前发射的指令动态分配至空闲的执行单元中;
指令执行单元,用于进行指令的结果的运算;
载入/存储单元,用于当指令发生载入/存储操作缺失时,当前载入/存储指令临时释放流水线,在专用的回填缓冲区中等待结果从片外载入,后续载入/存储指令成功占用流水线并顺利访问片上数据存储器和片外数据存储器。
2、如权利要求1所述的基于指令双发射的高性能低功耗嵌入式处理器,其特征在于:在所述指令发射单元中,当前序指令由于操作数未就绪而暂停执行时,后续发射的指令若操作数准备就绪,先于前续指令进入执行单元并开始执行。
3、如权利要求1或2所述的基于指令双发射的高性能低功耗嵌入式处理器,其特征在于:所述嵌入式处理器还包括:
通用协处理器接口,用于支持面向各种应用领域的扩展;
所述通用协处理器接口连接协处理器总线。
4、如权利要求1或2所述的基于指令双发射的高性能低功耗嵌入式处理器,其特征在于:所述片上指令存储器包括:
指令高速缓存器,用于实现对指令读取的片上高速缓冲;
指令高速暂存器,用于提供软件可配置的指令缓冲区;
片上数据存储器包括:
数据高速缓存器,用于实现对数据读取的片上高速缓冲;
数据高速暂存器,用于提供软件可配置的片上数据临时保存空间。
5、如权利要求3所述的基于指令双发射的高性能低功耗嵌入式处理器,其特征在于:所述片上指令存储器包括:
指令高速缓存器,用于实现对指令读取的片上高速缓冲;
指令高速暂存器,用于提供软件可配置的指令缓冲区;
片上数据存储器包括:
数据高速缓存器,用于实现对数据读取的片上高速缓冲;
数据高速暂存器,用于提供软件可配置的片上数据临时保存空间。
6、如权利要求1或2所述的基于指令双发射的高性能低功耗嵌入式处理器,其特征在于:所述嵌入式处理器还包括:
功耗管理单元,用于实现从正常模式到待机、关机和休眠三种低功耗模式转换。
7、如权利要求5所述的基于指令双发射的高性能低功耗嵌入式处理器,其特征在于:所述嵌入式处理器还包括:
功耗管理单元,用于实现从正常模式到待机、关机和休眠三种低功耗模式转换。
8、如权利要求1或2所述的基于指令双发射的高性能低功耗嵌入式处理器,其特征在于:在所述指令执行单元中,根据处理器性能的需求的高低,增加或减少相应的执行单元个数。
9、如权利要求5所述的基于指令双发射的高性能低功耗嵌入式处理器,其特征在于:在所述指令执行单元中,根据处理器性能的需求的高低,增加或减少相应的执行单元个数。
CN200910095583XA 2009-01-22 2009-01-22 基于指令双发射的高性能低功耗嵌入式处理器 Active CN101526895B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200910095583XA CN101526895B (zh) 2009-01-22 2009-01-22 基于指令双发射的高性能低功耗嵌入式处理器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910095583XA CN101526895B (zh) 2009-01-22 2009-01-22 基于指令双发射的高性能低功耗嵌入式处理器

Publications (2)

Publication Number Publication Date
CN101526895A true CN101526895A (zh) 2009-09-09
CN101526895B CN101526895B (zh) 2011-01-05

Family

ID=41094766

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910095583XA Active CN101526895B (zh) 2009-01-22 2009-01-22 基于指令双发射的高性能低功耗嵌入式处理器

Country Status (1)

Country Link
CN (1) CN101526895B (zh)

Cited By (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101989193A (zh) * 2010-11-05 2011-03-23 青岛海信信芯科技有限公司 微控制器及其指令执行方法
CN102360344A (zh) * 2011-10-10 2012-02-22 西安交通大学 矩阵处理器及其指令集和嵌入式系统
CN102662634A (zh) * 2012-03-21 2012-09-12 杭州中天微系统有限公司 非阻塞发射和执行的存储器访问执行装置
WO2013071874A1 (zh) * 2011-11-15 2013-05-23 无锡德思普科技有限公司 机会多线程方法及处理器
CN105117202A (zh) * 2015-09-25 2015-12-02 上海兆芯集成电路有限公司 具有融合保留站结构的微处理器
CN105511916A (zh) * 2014-12-14 2016-04-20 上海兆芯集成电路有限公司 用以改善在处理器中重新执行加载的装置与方法
CN105573786A (zh) * 2014-12-14 2016-05-11 上海兆芯集成电路有限公司 用以改善在处理器中重新执行加载的装置与方法
WO2016097802A1 (en) * 2014-12-14 2016-06-23 Via Alliance Semiconductor Co., Ltd. Mechanism to preclude load replays dependent on long load cycles in an out-order processor
TWI559223B (zh) * 2014-12-14 2016-11-21 上海兆芯集成電路有限公司 用以改善在處理器中重新執行載入之裝置與方法
CN106933533A (zh) * 2015-12-31 2017-07-07 北京国睿中数科技股份有限公司 访存部件及访存部件中访存指令读取数据的方法
US9703359B2 (en) 2014-12-14 2017-07-11 Via Alliance Semiconductor Co., Ltd. Power saving mechanism to reduce load replays in out-of-order processor
US9740271B2 (en) 2014-12-14 2017-08-22 Via Alliance Semiconductor Co., Ltd. Apparatus and method to preclude X86 special bus cycle load replays in an out-of-order processor
US9804845B2 (en) 2014-12-14 2017-10-31 Via Alliance Semiconductor Co., Ltd. Apparatus and method to preclude X86 special bus cycle load replays in an out-of-order processor
CN107633862A (zh) * 2016-07-19 2018-01-26 爱思开海力士有限公司 存储器系统及其操作方法
US10083038B2 (en) 2014-12-14 2018-09-25 Via Alliance Semiconductor Co., Ltd Mechanism to preclude load replays dependent on page walks in an out-of-order processor
US10088881B2 (en) 2014-12-14 2018-10-02 Via Alliance Semiconductor Co., Ltd Mechanism to preclude I/O-dependent load replays in an out-of-order processor
US10089112B2 (en) 2014-12-14 2018-10-02 Via Alliance Semiconductor Co., Ltd Mechanism to preclude load replays dependent on fuse array access in an out-of-order processor
US10095514B2 (en) 2014-12-14 2018-10-09 Via Alliance Semiconductor Co., Ltd Mechanism to preclude I/O-dependent load replays in an out-of-order processor
US10108420B2 (en) 2014-12-14 2018-10-23 Via Alliance Semiconductor Co., Ltd Mechanism to preclude load replays dependent on long load cycles in an out-of-order processor
US10108421B2 (en) 2014-12-14 2018-10-23 Via Alliance Semiconductor Co., Ltd Mechanism to preclude shared ram-dependent load replays in an out-of-order processor
US10108427B2 (en) 2014-12-14 2018-10-23 Via Alliance Semiconductor Co., Ltd Mechanism to preclude load replays dependent on fuse array access in an out-of-order processor
US10108430B2 (en) 2014-12-14 2018-10-23 Via Alliance Semiconductor Co., Ltd Mechanism to preclude load replays dependent on off-die control element access in an out-of-order processor
US10108429B2 (en) 2014-12-14 2018-10-23 Via Alliance Semiconductor Co., Ltd Mechanism to preclude shared RAM-dependent load replays in an out-of-order processor
US10114646B2 (en) 2014-12-14 2018-10-30 Via Alliance Semiconductor Co., Ltd Programmable load replay precluding mechanism
US10114794B2 (en) 2014-12-14 2018-10-30 Via Alliance Semiconductor Co., Ltd Programmable load replay precluding mechanism
US10120689B2 (en) 2014-12-14 2018-11-06 Via Alliance Semiconductor Co., Ltd Mechanism to preclude load replays dependent on off-die control element access in an out-of-order processor
US10127046B2 (en) 2014-12-14 2018-11-13 Via Alliance Semiconductor Co., Ltd. Mechanism to preclude uncacheable-dependent load replays in out-of-order processor
US10133580B2 (en) 2014-12-14 2018-11-20 Via Alliance Semiconductor Co., Ltd Apparatus and method to preclude load replays dependent on write combining memory space access in an out-of-order processor
US10146546B2 (en) 2014-12-14 2018-12-04 Via Alliance Semiconductor Co., Ltd Load replay precluding mechanism
US10146539B2 (en) 2014-12-14 2018-12-04 Via Alliance Semiconductor Co., Ltd. Load replay precluding mechanism
US10146547B2 (en) 2014-12-14 2018-12-04 Via Alliance Semiconductor Co., Ltd. Apparatus and method to preclude non-core cache-dependent load replays in an out-of-order processor
US10146540B2 (en) 2014-12-14 2018-12-04 Via Alliance Semiconductor Co., Ltd Apparatus and method to preclude load replays dependent on write combining memory space access in an out-of-order processor
US10175984B2 (en) 2014-12-14 2019-01-08 Via Alliance Semiconductor Co., Ltd Apparatus and method to preclude non-core cache-dependent load replays in an out-of-order processor
US10228944B2 (en) 2014-12-14 2019-03-12 Via Alliance Semiconductor Co., Ltd. Apparatus and method for programmable load replay preclusion
CN110809799A (zh) * 2017-08-31 2020-02-18 美光科技公司 用于频率模式检测和实施的系统和方法
CN111026445A (zh) * 2019-12-17 2020-04-17 湖南长城银河科技有限公司 一种智能识别方法及芯片
CN111475203A (zh) * 2020-04-03 2020-07-31 华大半导体有限公司 一种用于处理器的指令读取方法以及相应的处理器
CN111552366A (zh) * 2020-04-07 2020-08-18 江南大学 一种动态延迟唤醒电路及乱序指令发射架构
CN111913746A (zh) * 2020-08-31 2020-11-10 中国人民解放军国防科技大学 一种低开销嵌入式处理器设计方法
CN111930427A (zh) * 2020-08-17 2020-11-13 北京百度网讯科技有限公司 指令发射方法、装置、电子设备以及存储介质
CN114047956A (zh) * 2022-01-17 2022-02-15 北京智芯微电子科技有限公司 处理器指令多发射方法、双发射方法、装置及处理器
CN117478089A (zh) * 2023-12-28 2024-01-30 北京微核芯科技有限公司 存数指令执行方法、装置及电子设备
CN117707625A (zh) * 2024-02-05 2024-03-15 上海登临科技有限公司 支持指令多发的计算单元、方法及相应图形处理器

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100910432B1 (ko) * 2001-03-16 2009-08-04 콸콤 인코포레이티드 무선 통신 장치용 보안 처리 및 데이터 저장을 제공하는 방법 및 장치
CN100353346C (zh) * 2002-09-20 2007-12-05 联发科技股份有限公司 嵌入式系统及其指令预取装置和方法
CN1216327C (zh) * 2003-05-15 2005-08-24 复旦大学 采用双指令集的32位嵌入式微处理器
CN100492315C (zh) * 2004-12-15 2009-05-27 浙江大学 嵌入式信号处理器模拟器

Cited By (63)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101989193B (zh) * 2010-11-05 2013-05-15 青岛海信信芯科技有限公司 微控制器及其指令执行方法
CN101989193A (zh) * 2010-11-05 2011-03-23 青岛海信信芯科技有限公司 微控制器及其指令执行方法
CN102360344A (zh) * 2011-10-10 2012-02-22 西安交通大学 矩阵处理器及其指令集和嵌入式系统
CN102360344B (zh) * 2011-10-10 2014-03-12 西安交通大学 矩阵处理器及其指令集和嵌入式系统
US9740498B2 (en) 2011-11-15 2017-08-22 Wuxi Dsp Technologies Inc. Opportunistic multi-thread method and processor
WO2013071874A1 (zh) * 2011-11-15 2013-05-23 无锡德思普科技有限公司 机会多线程方法及处理器
CN102662634A (zh) * 2012-03-21 2012-09-12 杭州中天微系统有限公司 非阻塞发射和执行的存储器访问执行装置
US10108429B2 (en) 2014-12-14 2018-10-23 Via Alliance Semiconductor Co., Ltd Mechanism to preclude shared RAM-dependent load replays in an out-of-order processor
US10127046B2 (en) 2014-12-14 2018-11-13 Via Alliance Semiconductor Co., Ltd. Mechanism to preclude uncacheable-dependent load replays in out-of-order processor
WO2016097803A1 (en) * 2014-12-14 2016-06-23 Via Alliance Semiconductor Co., Ltd. Mechanism to preclude uncacheable-dependent load replays in out-of-order processor
WO2016097802A1 (en) * 2014-12-14 2016-06-23 Via Alliance Semiconductor Co., Ltd. Mechanism to preclude load replays dependent on long load cycles in an out-order processor
TWI559223B (zh) * 2014-12-14 2016-11-21 上海兆芯集成電路有限公司 用以改善在處理器中重新執行載入之裝置與方法
CN105573786B (zh) * 2014-12-14 2020-06-09 上海兆芯集成电路有限公司 用以改善在处理器中重新执行加载的装置与方法
US9645827B2 (en) 2014-12-14 2017-05-09 Via Alliance Semiconductor Co., Ltd. Mechanism to preclude load replays dependent on page walks in an out-of-order processor
CN105511916B (zh) * 2014-12-14 2019-06-04 上海兆芯集成电路有限公司 用以改善在处理器中重新执行加载的装置与方法
US9703359B2 (en) 2014-12-14 2017-07-11 Via Alliance Semiconductor Co., Ltd. Power saving mechanism to reduce load replays in out-of-order processor
US9740271B2 (en) 2014-12-14 2017-08-22 Via Alliance Semiconductor Co., Ltd. Apparatus and method to preclude X86 special bus cycle load replays in an out-of-order processor
CN105511916A (zh) * 2014-12-14 2016-04-20 上海兆芯集成电路有限公司 用以改善在处理器中重新执行加载的装置与方法
US9804845B2 (en) 2014-12-14 2017-10-31 Via Alliance Semiconductor Co., Ltd. Apparatus and method to preclude X86 special bus cycle load replays in an out-of-order processor
US10228944B2 (en) 2014-12-14 2019-03-12 Via Alliance Semiconductor Co., Ltd. Apparatus and method for programmable load replay preclusion
US9915998B2 (en) 2014-12-14 2018-03-13 Via Alliance Semiconductor Co., Ltd Power saving mechanism to reduce load replays in out-of-order processor
US10083038B2 (en) 2014-12-14 2018-09-25 Via Alliance Semiconductor Co., Ltd Mechanism to preclude load replays dependent on page walks in an out-of-order processor
US10088881B2 (en) 2014-12-14 2018-10-02 Via Alliance Semiconductor Co., Ltd Mechanism to preclude I/O-dependent load replays in an out-of-order processor
US10089112B2 (en) 2014-12-14 2018-10-02 Via Alliance Semiconductor Co., Ltd Mechanism to preclude load replays dependent on fuse array access in an out-of-order processor
US10095514B2 (en) 2014-12-14 2018-10-09 Via Alliance Semiconductor Co., Ltd Mechanism to preclude I/O-dependent load replays in an out-of-order processor
US10108420B2 (en) 2014-12-14 2018-10-23 Via Alliance Semiconductor Co., Ltd Mechanism to preclude load replays dependent on long load cycles in an out-of-order processor
US10108421B2 (en) 2014-12-14 2018-10-23 Via Alliance Semiconductor Co., Ltd Mechanism to preclude shared ram-dependent load replays in an out-of-order processor
US10108428B2 (en) 2014-12-14 2018-10-23 Via Alliance Semiconductor Co., Ltd Mechanism to preclude load replays dependent on long load cycles in an out-of-order processor
US10108427B2 (en) 2014-12-14 2018-10-23 Via Alliance Semiconductor Co., Ltd Mechanism to preclude load replays dependent on fuse array access in an out-of-order processor
US10108430B2 (en) 2014-12-14 2018-10-23 Via Alliance Semiconductor Co., Ltd Mechanism to preclude load replays dependent on off-die control element access in an out-of-order processor
US10209996B2 (en) 2014-12-14 2019-02-19 Via Alliance Semiconductor Co., Ltd. Apparatus and method for programmable load replay preclusion
US10114646B2 (en) 2014-12-14 2018-10-30 Via Alliance Semiconductor Co., Ltd Programmable load replay precluding mechanism
US10114794B2 (en) 2014-12-14 2018-10-30 Via Alliance Semiconductor Co., Ltd Programmable load replay precluding mechanism
US10120689B2 (en) 2014-12-14 2018-11-06 Via Alliance Semiconductor Co., Ltd Mechanism to preclude load replays dependent on off-die control element access in an out-of-order processor
CN105573786A (zh) * 2014-12-14 2016-05-11 上海兆芯集成电路有限公司 用以改善在处理器中重新执行加载的装置与方法
US10133580B2 (en) 2014-12-14 2018-11-20 Via Alliance Semiconductor Co., Ltd Apparatus and method to preclude load replays dependent on write combining memory space access in an out-of-order processor
US10133579B2 (en) 2014-12-14 2018-11-20 Via Alliance Semiconductor Co., Ltd. Mechanism to preclude uncacheable-dependent load replays in out-of-order processor
US10146546B2 (en) 2014-12-14 2018-12-04 Via Alliance Semiconductor Co., Ltd Load replay precluding mechanism
US10146539B2 (en) 2014-12-14 2018-12-04 Via Alliance Semiconductor Co., Ltd. Load replay precluding mechanism
US10146547B2 (en) 2014-12-14 2018-12-04 Via Alliance Semiconductor Co., Ltd. Apparatus and method to preclude non-core cache-dependent load replays in an out-of-order processor
US10146540B2 (en) 2014-12-14 2018-12-04 Via Alliance Semiconductor Co., Ltd Apparatus and method to preclude load replays dependent on write combining memory space access in an out-of-order processor
US10175984B2 (en) 2014-12-14 2019-01-08 Via Alliance Semiconductor Co., Ltd Apparatus and method to preclude non-core cache-dependent load replays in an out-of-order processor
CN106557301A (zh) * 2015-09-25 2017-04-05 上海兆芯集成电路有限公司 经由多级保留站结构的发射指令分派方法
CN105117202A (zh) * 2015-09-25 2015-12-02 上海兆芯集成电路有限公司 具有融合保留站结构的微处理器
CN106933533A (zh) * 2015-12-31 2017-07-07 北京国睿中数科技股份有限公司 访存部件及访存部件中访存指令读取数据的方法
CN106933533B (zh) * 2015-12-31 2019-04-16 北京国睿中数科技股份有限公司 访存部件及访存部件中访存指令读取数据的方法
CN107633862B (zh) * 2016-07-19 2021-06-18 爱思开海力士有限公司 存储器系统及其操作方法
CN107633862A (zh) * 2016-07-19 2018-01-26 爱思开海力士有限公司 存储器系统及其操作方法
CN110809799A (zh) * 2017-08-31 2020-02-18 美光科技公司 用于频率模式检测和实施的系统和方法
CN110809799B (zh) * 2017-08-31 2021-03-02 美光科技公司 用于频率模式检测和实施的系统和方法
US11003240B2 (en) 2017-08-31 2021-05-11 Micron Technology, Inc. Systems and methods for frequency mode detection and implementation
CN111026445A (zh) * 2019-12-17 2020-04-17 湖南长城银河科技有限公司 一种智能识别方法及芯片
CN111475203A (zh) * 2020-04-03 2020-07-31 华大半导体有限公司 一种用于处理器的指令读取方法以及相应的处理器
CN111475203B (zh) * 2020-04-03 2023-03-14 小华半导体有限公司 一种用于处理器的指令读取方法以及相应的处理器
CN111552366A (zh) * 2020-04-07 2020-08-18 江南大学 一种动态延迟唤醒电路及乱序指令发射架构
CN111930427A (zh) * 2020-08-17 2020-11-13 北京百度网讯科技有限公司 指令发射方法、装置、电子设备以及存储介质
CN111913746A (zh) * 2020-08-31 2020-11-10 中国人民解放军国防科技大学 一种低开销嵌入式处理器设计方法
CN114047956A (zh) * 2022-01-17 2022-02-15 北京智芯微电子科技有限公司 处理器指令多发射方法、双发射方法、装置及处理器
CN114047956B (zh) * 2022-01-17 2022-04-19 北京智芯微电子科技有限公司 处理器指令多发射方法、双发射方法、装置及处理器
CN117478089A (zh) * 2023-12-28 2024-01-30 北京微核芯科技有限公司 存数指令执行方法、装置及电子设备
CN117478089B (zh) * 2023-12-28 2024-03-29 北京微核芯科技有限公司 存数指令执行方法、装置及电子设备
CN117707625A (zh) * 2024-02-05 2024-03-15 上海登临科技有限公司 支持指令多发的计算单元、方法及相应图形处理器
CN117707625B (zh) * 2024-02-05 2024-05-10 上海登临科技有限公司 支持指令多发的计算单元、方法及相应图形处理器

Also Published As

Publication number Publication date
CN101526895B (zh) 2011-01-05

Similar Documents

Publication Publication Date Title
CN101526895B (zh) 基于指令双发射的高性能低功耗嵌入式处理器
US10664039B2 (en) Power efficient processor architecture
US11467740B2 (en) Method, apparatus, and system for energy efficiency and energy conservation including autonomous hardware-based deep power down in devices
US7761720B2 (en) Mechanism for processor power state aware distribution of lowest priority interrupts
US9158355B2 (en) Dynamic core switching
CN101763285B (zh) 零开销切换多线程处理器及其线程切换方法
RU2520411C2 (ru) Устройство обработки данных и способ переключения рабочей нагрузки между первой и второй компоновкой схем обработки
CN110574014B (zh) 节能的高速缓存存储器使用
CN101403982A (zh) 一种多核处理器的任务分配方法、系统及设备
CN102495756A (zh) 操作系统在不同的中央处理器之间切换的方法及系统
CN101346701A (zh) 降低正在被供电的存储体的数量
CN112486312A (zh) 一种低功耗的处理器
US20040153678A1 (en) Microprocessor idle mode management system
CN107003710A (zh) 包括多个相异的处理器核心的处理器
US7634672B2 (en) Power saving method of central processing unit
GB2536825A (en) Power efficient processor architecture

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant