CN103631566A - 一种用于处理器中的指令取得装置及其处理器 - Google Patents
一种用于处理器中的指令取得装置及其处理器 Download PDFInfo
- Publication number
- CN103631566A CN103631566A CN201310619745.1A CN201310619745A CN103631566A CN 103631566 A CN103631566 A CN 103631566A CN 201310619745 A CN201310619745 A CN 201310619745A CN 103631566 A CN103631566 A CN 103631566A
- Authority
- CN
- China
- Prior art keywords
- instruction
- buffer unit
- described instruction
- window
- processor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Advance Control (AREA)
Abstract
本发明涉及一种用于处理器中的指令取得装置,包括指令缓存单元、指令缓冲单元、指令窗口和指令实现逻辑单元;所述指令缓存单元用于存储指令并将其存储的指令按顺序传输到所述指令缓冲单元;所述指令缓冲单元将当前需要执行的、所述指令实现逻辑单元一次取指取得数量的指令传输到所述指令窗口中存储;所述指令实现逻辑单元由所述指令窗口中取得指令并处理,使其得到输出和执行;所述指令实现逻辑单元还将当前执行指令的读指针和写指针返回到所述指令缓冲单元。本发明还涉及一种使用上述指令取得装置的处理器。实施本发明的用于处理器中的指令取得装置及其处理器,具有以下有益效果:从总体上减少了指令输出的时间。
Description
技术领域
本发明涉及处理器,更具体地说,涉及一种用于处理器中的指令取得装置及其处理器。
背景技术
一个典型的指令执行流水线包括一个指令流出阶段(instruction issue stage),在该阶段中,需要在得知一个指令是否可以输出之前检查其是否存在数据冲突(data hazard)。这种检查通常使时序变得复杂并可能带来时间上的临界性。在超标量(super-scalar)设计中,一个能够取得多条指令并存储的指令缓冲单元可以在一定程度上减少上述问题。但是,在这种情况下,需要再次由该指令缓冲单元中读出其不久之前得到并存储的指令,这需要花费一定的时间,特别是在寻址上。因此,这种加入一个指令缓冲单元的结构虽然使得时序较为简单且不会带来时间上的临界性,但是其实现指令的时间较长。
发明内容
本发明要解决的技术问题在于,针对现有技术的上述实现指令的时间较长的缺陷,提供一种实现指令的时间较短的用于处理器中的指令取得装置及其处理器。
本发明解决其技术问题所采用的技术方案是:构造一种用于处理器中的指令取得装置,包括指令缓存单元、指令缓冲单元、指令窗口和指令实现逻辑单元;所述指令缓存单元用于存储指令并将其存储的指令按顺序传输到所述指令缓冲单元;所述指令缓冲单元将当前需要执行的、所述指令实现逻辑单元一次取指取得数量的指令传输到所述指令窗口中存储;所述指令实现逻辑单元由所述指令窗口中取得指令并处理,使其得到输出和执行;所述指令实现逻辑单元还将当前执行指令的读指针和写指针返回到所述指令缓冲单元。
更进一步地,所述指令缓存单元还与所述指令窗口连接,所述指令缓冲单元未存储指令时,所述指令缓存单元直接输出指令到所述指令窗口。
更进一步地,所述指令缓存单元通过读取所述指令实现逻辑单元输出到所述指令缓冲单元的读指针的值来判断所述指令缓冲单元是否存储有指令。
更进一步地,所述指令窗口为缓冲存储单元,所述缓冲存储单元的存储量为两条指令的长度。
更进一步地,所述指令实现逻辑单元每次由所述指令窗口按照指令排列的顺序依次读取两条指令。
更进一步地,所述指令缓冲单元依据所述指令实现逻辑单元在上一个取指周期产生的读指针指向位置开始存储的两条指令输出到所述指令窗口,等待所述指令实现逻辑单元读取。
更进一步地,所述读指针为零时,所述指令缓存单元将排列在最前面的两条指令直接输送到所述指令窗口中。
本发明还涉及一种处理器,包括取得指令装置,所述取得指令装置为上述任意一项所述的指令取得装置。
更进一步地,所述处理器包括CPU或GPU。
更进一步地,所述处理器包括具有多个内核的并行处理器或具有多个内核的、并行的流处理器。
实施本发明的用于处理器中的指令取得装置及其处理器,具有以下有益效果:由于在指令缓冲单元和指令实现逻辑单元之间加入了指令窗口,由指令缓冲单元或指令缓存单元将一次取指数量的指令输送到指令窗口,指令实现逻辑单元直接由上述指令窗口取得指令,不需要再由上述指令缓冲单元取得指令;由于该指令窗口中的指令就是一次取指所需要的指令,因此,上述指令实现逻辑单元由该指令窗口取得指令时,不需要进行寻址;所以节省了在指令缓冲单元中寻址的时间或者将该时间与数据传输或指令处理的时间重叠了,从总体上减少了指令输出的时间。
附图说明
图1是本发明用于处理器中的指令取得装置及其处理器实施例中指令取得装置的结构示意图。
具体实施方式
下面将结合附图对本发明实施例作进一步说明。
如图1所示,在本发明的一种用于处理器中的指令取得装置及其处理器实施例中,该用于处理器中的指令取得装置包括指令缓存单元1、指令缓冲单元2、指令窗口3和指令实现逻辑单元4;基本上而言,上述指令缓存单元1和指令缓冲单元2构成一个二级的cache(高速缓冲存储器);这个二级的cache并不是直接连接在指令实现逻辑单元4上,而是通过指令窗口3与指令实现逻辑单元4连接;也就是说,虽然其间存在其他的连接或信号交互等,但是,指令实现逻辑单元4并不会直接访问上述cache并得到指令内容;相反,上述指令实现逻辑单元4只能直接地由上述指令窗口得到指令,并将得到的指令处理后执行或输出执行。具体来讲,指令缓存单元1用于存储指令并将其存储的指令按执行或排列的顺序传输到指令缓冲单元2;指令缓冲单元2将当前需要执行的、指令实现逻辑单元一次取指取得数量的指令传输到指令窗口3中存储;指令实现逻辑单元4由指令窗口3中取得指令并处理,使其得到输出和执行;在本实施例中,上述指令实现逻辑单元4还将其产生的读指针信号(Read-pointer)和写指针信号(Write-pointer)返回到指令缓冲单元2的相应端口,以便于该指令缓冲单元2产生正确的读指针和写指针。
在本实施例中,指令缓冲单元2依据指令实现逻辑单元4在上一个取指周期产生的读指针信号使得其读指针指向位置开始存储的、一次取指所能够得到的指令输出到指令窗口3,等待指令实现逻辑单元4由上述指令窗口3读取这些指令或者说指令窗口3将这些指令输送到上述指令实现逻辑单元4。普遍而言,上述指令窗口3中的指令都是按照上述方法,经过指令缓存单元1、指令缓冲单元2而得到的。但是,在一些特殊的情况下,上述方法可能带来时间上的滞后,例如,在上述指令窗口3和指令缓冲单元2均为空时(即在指令窗口3和指令缓冲单元2中均没有存储指令,例如,在系统上电时),如果仍然按照上面的方法,则指令实现逻辑单元4需要等待较长的时间才能得到指令。为了减少这些情况下指令实现逻辑单元4的等待时间,进一步减少整个系统指令输出及实现的时间,在本实施例中,当出现上述情况时,并不按照上述流程进行指令传输,而是直接将指令缓存单元1中本来要输出到指令缓冲单元2的指令(即本来在当前取指周期中输出到指令缓冲单元2的、一次取指能够得到的最大指令数量的指令),跳过上述指令缓冲单元2,直接输出到上述指令窗口中。为此,在本实施例中,指令缓存单元1的指令输出端口还与指令窗口3的指令输入端口连接,请参见图1,该指令窗口3的指令输入端口还与上述指令缓冲单元2的指令输出端口连接;也就是说,在本实施例中,上述指令窗口3的指令输入端口同时连接在上述指令缓冲单元2的指令输出端和指令缓存单元1的指令输出端。这样,在指令缓冲单元3未存储指令时,指令缓存单元1直接输出指令到指令窗口3或者说指令窗口3直接由上述指令缓存单元1取得指令。在本实施例中,通过读取指令实现逻辑单元4输出到指令缓冲单元2的读指针信号所确定的读指针的值来判断指令缓冲单元2是否存储有指令。一般来讲,当上述读指针的值为零或为一个事先设定的表示其存储的指令为空的值的时候,指令缓存单元1将排列在最前面的、一次取指所能得到的最大数量指令直接输送到指令窗口3中。
在本实施例中,一个具体的例子是,由于每次取指能够取得两条指令,所以,上述指令实现逻辑单元4每次由指令窗口3读取两条指令,而指令窗口3在每个取指周期中由上述指令缓冲单元2或指令缓存单元1中得到的指令也是两条;而在本实施例中,指令窗口3为缓冲存储单元,该缓冲存储单元的存储量为两条指令的长度;也就是说,该指令窗口能够且只能够容纳两条指令。故当指令实现逻辑单元4由指令窗口读取指令时并不需要寻址,直接读取即可。在其他的例子中,上述每次取指的指令条数可能不同,在这种情况下,上述指令窗口3的长度也就不同。例如,另一个例子中如果每次只能取得一条指令,则其对应的指令窗口3的长度就只能是一条指令的长度。总之,该指令窗口3的长度与该系统每次取指的最大指令数的长度相同。
从一个方面来讲,在本实施例中,为了消除由于数据冲突检测逻辑导致时间临界而带来的在指令缓冲单元2中的时间延迟,设置了一个可以容纳两条指令的指令窗口3在上述指令缓冲单元的指令输出端,并使其与指令实现逻辑单元4连接,指令逻辑单元4由该指令窗口3取得指令。数据冲突检测逻辑总是考虑这两条在数据窗口3中的指令的实现或输出条件,以此来替代由指令缓冲单元本身中取得指令。在每个取值周期中,1条或两条指令被输出并实现后,更多的指令被由指令缓冲单元2中读入上述指令窗口3。这消除了指令缓冲单元指令读取加上数据冲突检测路径都带来的、耗时的访问时间,由于通过复杂的数据冲突检测逻辑被由指令直接由指令缓冲单元2中进入指令窗口3代替,当上述指令窗口3和指令缓冲单元2均为空(未存储指令)时,指令直接由指令缓存单元1跳过指令缓冲单元2而直接传输到指令窗口3。这避免了由于指令缓冲单元2的空闲而导致流水线空闲的情况,进一步节省了时间。
在本实施例中,还涉及一种处理器,该处理器包括取得指令装置,该取得指令装置为上述的指令取得装置。在本实施例中,这种处理器包括了所有具有这种取指装置的处理器。例如,这些处理器可以是CPU或GPU,也可以是具有多个内核的并行处理器或具有多个内核的、并行的流处理器。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种用于处理器中的指令取得装置,其特征在于,包括指令缓存单元、指令缓冲单元、指令窗口和指令实现逻辑单元;所述指令缓存单元用于存储指令并将其存储的指令按顺序传输到所述指令缓冲单元;所述指令缓冲单元将当前需要执行的、所述指令实现逻辑单元一次取指取得数量的指令传输到所述指令窗口中存储;所述指令实现逻辑单元由所述指令窗口中取得指令并处理,使其得到输出和执行;所述指令实现逻辑单元还将当前执行指令的读指针和写指针返回到所述指令缓冲单元。
2.根据权利要求1所述的用于处理器中的指令取得装置,其特征在于,所述指令缓存单元还与所述指令窗口连接,所述指令缓冲单元未存储指令时,所述指令缓存单元直接输出指令到所述指令窗口。
3.根据权利要求2所述的用于处理器中的指令取得装置,其特征在于,所述指令缓存单元通过读取所述指令实现逻辑单元输出到所述指令缓冲单元的读指针的值来判断所述指令缓冲单元是否存储有指令。
4.根据权利要求3所述的用于处理器中的指令取得装置,其特征在于,所述指令窗口为缓冲存储单元,所述缓冲存储单元的存储量为两条指令的长度。
5.根据权利要求4所述的用于处理器中的指令取得装置,其特征在于,所述指令实现逻辑单元每次由所述指令窗口按照指令排列的顺序依次读取两条指令。
6.根据权利要求5所述的用于处理器中的指令取得装置,其特征在于,所述指令缓冲单元依据所述指令实现逻辑单元在上一个取指周期产生的读指针指向位置开始存储的两条指令输出到所述指令窗口,等待所述指令实现逻辑单元读取。
7.根据权利要求6所述的用于处理器中的指令取得装置,其特征在于,所述读指针为零时,所述指令缓存单元将排列在最前面的两条指令直接输送到所述指令窗口中。
8.一种处理器,包括取得指令装置,其特征在于,所述取得指令装置为权利要1-7任意一项所述的指令取得装置。
9.根据权利要求8所述的处理器,其特征在于,所述处理器包括CPU或GPU。
10.根据权利要求8所述的处理器,其特征在于,所述处理器包括具有多个内核的并行处理器或具有多个内核的、并行的流处理器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310619745.1A CN103631566A (zh) | 2013-11-29 | 2013-11-29 | 一种用于处理器中的指令取得装置及其处理器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310619745.1A CN103631566A (zh) | 2013-11-29 | 2013-11-29 | 一种用于处理器中的指令取得装置及其处理器 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103631566A true CN103631566A (zh) | 2014-03-12 |
Family
ID=50212668
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310619745.1A Pending CN103631566A (zh) | 2013-11-29 | 2013-11-29 | 一种用于处理器中的指令取得装置及其处理器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103631566A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107885530A (zh) * | 2016-11-14 | 2018-04-06 | 上海兆芯集成电路有限公司 | 提交高速缓存行的方法和指令高速缓存 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5754811A (en) * | 1996-10-08 | 1998-05-19 | Putrino; Michael | Instruction dispatch queue for improved instruction cache to queue timing |
CN101180611A (zh) * | 2005-05-24 | 2008-05-14 | 德克萨斯仪器股份有限公司 | 依赖于指令类型的可配置高速缓存系统 |
CN101189574A (zh) * | 2005-04-11 | 2008-05-28 | 高通股份有限公司 | 指令存储器单元和操作方法 |
WO2012106717A1 (en) * | 2011-02-04 | 2012-08-09 | Qualcomm Incorporated | Processor with a hybrid instruction queue |
-
2013
- 2013-11-29 CN CN201310619745.1A patent/CN103631566A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5754811A (en) * | 1996-10-08 | 1998-05-19 | Putrino; Michael | Instruction dispatch queue for improved instruction cache to queue timing |
CN101189574A (zh) * | 2005-04-11 | 2008-05-28 | 高通股份有限公司 | 指令存储器单元和操作方法 |
CN101180611A (zh) * | 2005-05-24 | 2008-05-14 | 德克萨斯仪器股份有限公司 | 依赖于指令类型的可配置高速缓存系统 |
WO2012106717A1 (en) * | 2011-02-04 | 2012-08-09 | Qualcomm Incorporated | Processor with a hybrid instruction queue |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107885530A (zh) * | 2016-11-14 | 2018-04-06 | 上海兆芯集成电路有限公司 | 提交高速缓存行的方法和指令高速缓存 |
CN107885530B (zh) * | 2016-11-14 | 2020-06-23 | 上海兆芯集成电路有限公司 | 提交高速缓存行的方法和指令高速缓存 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10860326B2 (en) | Multi-threaded instruction buffer design | |
US9251117B2 (en) | Reconfigurable circuit with suspension control circuit | |
US9665466B2 (en) | Debug architecture for multithreaded processors | |
US20130254592A1 (en) | Semiconductor integrated circuit device and system using the same | |
US8977835B2 (en) | Reversing processing order in half-pumped SIMD execution units to achieve K cycle issue-to-issue latency | |
CN110688160B (zh) | 一种指令流水线处理方法、系统、设备及计算机存储介质 | |
US20210089306A1 (en) | Instruction processing method and apparatus | |
US9477594B2 (en) | Semiconductor device and control method for reading instructions | |
US11449344B1 (en) | Regular expression processor and parallel processing architecture | |
TW201342226A (zh) | 在命令串流器之指令執行中的可程式化述語邏輯 | |
US20090198970A1 (en) | Method and structure for asynchronous skip-ahead in synchronous pipelines | |
US20210342149A1 (en) | Method for executing instructions, device, and computer readable storage medium | |
US9501282B2 (en) | Arithmetic processing device | |
CN116501389B (zh) | 指令缓冲单元、处理器及计算机系统 | |
US20070180155A1 (en) | Method and apparatus for implementing transfer ordering using hardware linked list | |
US9311225B2 (en) | DMA channels | |
CN103631566A (zh) | 一种用于处理器中的指令取得装置及其处理器 | |
US9417882B2 (en) | Load synchronization with streaming thread cohorts | |
US20130138924A1 (en) | Efficient microcode instruction dispatch | |
EP0415351A2 (en) | Data processor for processing instruction after conditional branch instruction at high speed | |
CN101615114B (zh) | 完成两次乘法两次加法两次位移的微处理器实现方法 | |
US9645936B1 (en) | System and method for informing hardware to limit writing in a memory hierarchy | |
CN117713799B (zh) | 一种流水线反压逻辑电路及电子设备 | |
US20230195517A1 (en) | Multi-Cycle Scheduler with Speculative Picking of Micro-Operations | |
US20150277998A1 (en) | Prioritising Events to Which a Processor is to Respond |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
EXSB | Decision made by sipo to initiate substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20140312 |