CN106683032A - 一种gpu染色阵列空闲单元查询电路 - Google Patents
一种gpu染色阵列空闲单元查询电路 Download PDFInfo
- Publication number
- CN106683032A CN106683032A CN201611140136.8A CN201611140136A CN106683032A CN 106683032 A CN106683032 A CN 106683032A CN 201611140136 A CN201611140136 A CN 201611140136A CN 106683032 A CN106683032 A CN 106683032A
- Authority
- CN
- China
- Prior art keywords
- unit
- inquiry
- query
- idle
- array
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/20—Processor architectures; Processor configuration, e.g. pipelining
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
- G06F9/5044—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering hardware capabilities
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Coloring (AREA)
Abstract
本发明属于计算机图形领域,尤其涉及一种GPU染色阵列空闲单元查询电路。本电路包括查询模式控制单元(1)、M个一级查询单元(2)、二级查询单元(6)、译码单元(7)。本电路通过将广度查询和深度查询模式进行统一编码,实现了多种查询模式下GPU染色阵列空闲单元的快速查询。有利于GPU染色任务的实时调度和染色阵列单元高效分配和管理。
Description
技术领域
本发明属于计算机软件领域,尤其涉及一种GPU染色阵列空闲单元查询电路。
背景技术
统一染色阵列在分配染色任务时,需要对染色器阵列中的空闲单元进行查询,查询电路的简单、高效决定了染色任务调度和分配的效率。目前公开研究都是针对染色器测试、染色器编程的研究,未发现有染色阵列空闲单元查询电路的研究。
发明内容
本发明的目的是:
本发明主要提供一种GPU染色阵列空闲单元查询电路,有利于GPU染色任务的实时调度和染色阵列单元高效分配和管理。
本发明的解决方案是:
一种GPU染色阵列空闲单元查询电路,其特征在于,包括:
查询模式控制单元(1)、M个一级查询单元(2)、二级查询单元(6)、译码单元(7);其中,M为处理阵列簇的个数;
查询模式控制单元(1)根据查询模式对染色器阵列单元的状态进行重新排列作为查询请求按位置号分成M组,每组发送给一个一级查询单元(2),其中染色阵列单元组织方式为MxN,M为处理阵列簇的个数,N为每簇中处理器单元的个数,MxN个处理器阵列中每个处理器的空闲标志用1bit来表示,其中空闲标志为1,表示该处理器空闲;空闲标志为0,表示该处理器非空闲。当配置为深度查询时,将染色阵列的空闲标志排列为{S11,S12,..,S1N,S21,S22,…,S2N,…SM1,SM2,…,SMN};当配置为广度查询,将染色阵列的空闲标志排列为{S11,S21,..,SM1,S12,S22,…,SM2,…SN1,SN2,…,SNM};将重新排列的染色阵列单元的空闲标志每N位进行逻辑“或”操作产生查询状态标志,如果“或”操作后的逻辑值为1,查询状态标志有效;如果“或”操作后的逻辑值为0,查询状态标志无效;
一级查询单元(2)接收外部查询请求,如果外部查询请求有效,并且查询模式控制单元(1)产生的对应的查询状态标志有效,则以N位为一组,在染色阵列空闲状态表中按照位置号从小到大的顺序查询第一位有效位,如果查询到有效位,则将本一级查询单元(2)的空闲有效标志置为1,并将其位置号锁存在本一级查询单元(2)的锁存器中,否则将空闲有效标志置为0;
二级查询单元(6),依次查询M个一级查询单元(2)的空闲有效标志,查找到第一位有效的标志,并将对应的位置号锁存器锁存到REG中;
译码单元(7),根据二级查询单元(6)获取的位置号,按照与查询模式控制单元(1)对应的深度查询或广度查询模式,对REG中染色器阵列单元对应的位置号进行译码,从而获取空闲染色单元的行列号。
本发明的优点是:本发明提供的一种染色器阵列空闲单元查询电路。通过将深度查询和广度查询进行统一映射,可解决两种查询模式统一查询问题,通过将阵列查询过程分为组内查询和组间查询两个步骤,可提高电路运行频率,同时在组内查询时,多个组的查询可并行进行,提高了查询效率。最后,通过对查询到的状态位进行译码,可以得到两种模式下的空闲单元行列位置。该方法解决了多种查询模式下的染色器阵列空闲单元的高速查询问题。有利于GPU染色任务的实时调度和高效分配和管理。
附图说明
图1为本发明的模块图。
图2为本发明实施例的模块图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
一种GPU染色阵列空闲单元查询电路,如图1所示,包括:
查询模式控制单元(1)、M个一级查询单元(2)、二级查询单元(6)、译码单元(7);其中,M为处理阵列簇的个数;
查询模式控制单元(1)根据查询模式对染色器阵列单元的状态进行重新排列作为查询请求按位置号分成M组,每组发送给一个一级查询单元(2),其中染色阵列单元组织方式为MxN,M为处理阵列簇的个数,N为每簇中处理器单元的个数,MxN个处理器阵列中每个处理器的空闲标志用1bit来表示,其中空闲标志为1,表示该处理器空闲;空闲标志为0,表示该处理器非空闲。当配置为深度查询时,将染色阵列的空闲标志排列为{S11,S12,..,S1N,S21,S22,…,S2N,…SM1,SM2,…,SMN};当配置为广度查询,将染色阵列的空闲标志排列为{S11,S21,..,SM1,S12,S22,…,SM2,…SN1,SN2,…,SNM};将重新排列的染色阵列单元的空闲标志每N位进行逻辑“或”操作产生查询状态标志,如果“或”操作后的逻辑值为1,查询状态标志有效;如果“或”操作后的逻辑值为0,查询状态标志无效;
一级查询单元(2)接收外部查询请求,如果外部查询请求有效,并且查询状态标志有效,则以N位为一组,在染色阵列空闲状态表中按照位置号从小到大的顺序查询第一位有效位,如果查询到有效位,则将本一级查询单元(2)的空闲有效标志置为1,并将其位置号锁存在本一级查询单元(2)的锁存器中,否则将空闲有效标志置为0;
二级查询单元(6),依次查询M个一级查询单元(2)的空闲有效标志,查找到第一位有效的标志,并将对应的位置号锁存器锁存到REG中;
译码单元(7),根据二级查询单元(6)获取的位置号,按照与查询模式控制单元(1)对应的深度查询或广度查询模式,对REG中染色器阵列单元对应的位置号进行译码,从而获取空闲染色单元的行列号。
实施例
下面结合附图和具体实施例对本发明的技术方案做进一步详细描述。
如图2所示,本发明实施例的一种GPU染色阵列空闲单元查询电路,包括查询模式控制单元(1)、一级查询单元一(21)、一级查询单元二(22)、一级查询单元三(23)、一级查询单元M(24)、二级查询单元(6)、译码单元(7)。
查询模式控制单元(1),根据查询模式对染色器阵列单元的状态进行重新排列,并将排列好的送到一级查询单元一(21)、一级查询单元二(22)、一级查询单元三(23)、一级查询单元M(24)。将重新排列的染色阵列单元的空闲标志每N位进行逻辑“或”操作产生查询状态标志,如果“或”操作后的逻辑值为1,查询状态标志有效;如果“或”操作后的逻辑值为0,查询状态标志无效;
一级查询单元一(21),其特征在于,如果查询请求有效且查询状态标志有效,在染色阵列状态表中的1~N位中查询第一位有效位,如果查询到有效位,则将VALID_1标志置为1,并将其位置号锁存在锁存器REG_1中,否则将VALID_2标志置为0,之后将结果送(6)二级查询单元。
一级查询单元二(22),其特征在于,如果查询请求有效且查询状态标志有效,在染色阵列状态表中的(N+1)~2N位中查询第一位空闲位,如果查询到有效位,则将VALID_2标志置为1,并将其位置号锁存在锁存器REG_2中,否则将VALID_2标志置为0,之后将结果送二级查询单元(6)。
一级查询单元三(23),其特征在于,如果查询请求有效且查询状态标志有效,在染色阵列状态表中的(2N+1)~3N位中查询第一位空闲位,如果查询到有效位,则将VALID_3标志置为1,并将其位置号锁存在锁存器REG_3中,否则将VALID_3标志置为0,之后将结果送二级查询单元(6)。
一级查询单元M(24),其特征在于,如果查询请求有效且查询状态标志有效,在染色阵列状态表中的(MN-N+1)~MN位中查询第一位空闲位,如果查询到有效位,则将VALID_M标志置为1,并将其位置号锁存在锁存器REG_M中,否则将VALID_M标志置为0,之后将结果送二级查询单元(6)。
二级查询单元(6),其特征在于,依次查询{VALID_1,VALID_2,VALID_3,…,VALID_M},查找到第一位有效的标志,并将对应的位置号寄存器锁存到位置寄存器中,将结果送译码单元中(7)。
译码单元(7),其特征在于,根据二级查询单元(6)位置寄存器中获取的位置号,按照深度查询和广度查询模式,对其对应的行列号进行译码,从而获取空闲单元的行列号。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细地说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (1)
1.一种GPU染色阵列空闲单元查询电路,其特征在于,包括:
查询模式控制单元(1)、M个一级查询单元(2)、二级查询单元(6)、译码单元(7);其中,M为处理阵列簇的个数;
查询模式控制单元(1)根据查询模式对染色器阵列单元的状态进行重新排列作为查询请求按位置号分成M组,每组发送给一个一级查询单元(2),其中染色阵列单元组织方式为MxN,M为处理阵列簇的个数,N为每簇中处理器单元的个数,MxN个处理器阵列中每个处理器的空闲标志用1bit来表示,其中空闲标志为1,表示该处理器空闲;空闲标志为0,表示该处理器非空闲;当配置为深度查询时,将染色阵列的空闲标志排列为{S11,S12,..,S1N,S21,S22,…,S2N,…SM1,SM2,…,SMN};当配置为广度查询,将染色阵列的空闲标志排列为{S11,S21,..,SM1,S12,S22,…,SM2,…SN1,SN2,…,SNM};将重新排列的染色阵列单元的空闲标志每N位进行逻辑“或”操作产生查询状态标志,如果“或”操作后的逻辑值为1,查询状态标志有效;如果“或”操作后的逻辑值为0,查询状态标志无效;
一级查询单元(2)接收外部查询请求,如果外部查询请求有效,并且查询模式控制单元(1)产生的对应的查询状态标志有效,则以N位为一组,在染色阵列空闲状态表中按照位置号从小到大的顺序查询第一位有效位,如果查询到有效位,则将本一级查询单元(2)的空闲有效标志置为1,并将其位置号锁存在本一级查询单元(2)的锁存器中,否则将空闲有效标志置为0;
二级查询单元(6),依次查询M个一级查询单元(2)的空闲有效标志,查找到第一位有效的标志,并将对应的位置号锁存器锁存到REG中;
译码单元(7),根据二级查询单元(6)获取的位置号,按照与查询模式控制单元(1)对应的深度查询或广度查询模式,对REG中染色器阵列单元对应的位置号进行译码,从而获取空闲染色单元的行列号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611140136.8A CN106683032B (zh) | 2016-12-12 | 2016-12-12 | 一种gpu染色阵列空闲单元查询电路 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611140136.8A CN106683032B (zh) | 2016-12-12 | 2016-12-12 | 一种gpu染色阵列空闲单元查询电路 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106683032A true CN106683032A (zh) | 2017-05-17 |
CN106683032B CN106683032B (zh) | 2020-04-07 |
Family
ID=58868876
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611140136.8A Active CN106683032B (zh) | 2016-12-12 | 2016-12-12 | 一种gpu染色阵列空闲单元查询电路 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106683032B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108109103A (zh) * | 2017-12-06 | 2018-06-01 | 中国航空工业集团公司西安航空计算技术研究所 | 一种高性能gpu染色任务与统一染色阵列任务现场映射结构 |
CN111026528A (zh) * | 2019-11-18 | 2020-04-17 | 中国航空工业集团公司西安航空计算技术研究所 | 一种高性能大规模染色阵列程序调度分发系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040189650A1 (en) * | 2003-03-31 | 2004-09-30 | Deering Michael F. | Accelerator control unit configured to manage multiple hardware contexts |
CN105550978A (zh) * | 2015-12-11 | 2016-05-04 | 中国航空工业集团公司西安航空计算技术研究所 | 一种面向统一染色架构的gpu3d引擎片上存储层次结构 |
CN105630441A (zh) * | 2015-12-11 | 2016-06-01 | 中国航空工业集团公司西安航空计算技术研究所 | 一种基于统一染色技术的gpu体系架构 |
-
2016
- 2016-12-12 CN CN201611140136.8A patent/CN106683032B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040189650A1 (en) * | 2003-03-31 | 2004-09-30 | Deering Michael F. | Accelerator control unit configured to manage multiple hardware contexts |
CN105550978A (zh) * | 2015-12-11 | 2016-05-04 | 中国航空工业集团公司西安航空计算技术研究所 | 一种面向统一染色架构的gpu3d引擎片上存储层次结构 |
CN105630441A (zh) * | 2015-12-11 | 2016-06-01 | 中国航空工业集团公司西安航空计算技术研究所 | 一种基于统一染色技术的gpu体系架构 |
Non-Patent Citations (2)
Title |
---|
卢俊等: "《一种高效GPU存储系统体系架构设计》", 《计算机技术与发展》 * |
田泽等: "《图形处理器低功耗设计技术研究》", 《计算机科学》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108109103A (zh) * | 2017-12-06 | 2018-06-01 | 中国航空工业集团公司西安航空计算技术研究所 | 一种高性能gpu染色任务与统一染色阵列任务现场映射结构 |
CN111026528A (zh) * | 2019-11-18 | 2020-04-17 | 中国航空工业集团公司西安航空计算技术研究所 | 一种高性能大规模染色阵列程序调度分发系统 |
CN111026528B (zh) * | 2019-11-18 | 2023-06-30 | 中国航空工业集团公司西安航空计算技术研究所 | 一种高性能大规模染色阵列程序调度分发系统 |
Also Published As
Publication number | Publication date |
---|---|
CN106683032B (zh) | 2020-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11055287B2 (en) | Eigenvalue-based data query | |
EP3254191B1 (en) | Apparatus and method for using parameterized intermediate representation for just-in-time compilation in database query execution engine | |
CN106528773A (zh) | 一种基于Spark平台支持空间数据管理的图计算系统及方法 | |
CN105005675B (zh) | 基于多目标遗传算法的复合绝缘子电场优化方法 | |
CN112364024B (zh) | 一种表数据批量自动比对的控制方法及装置 | |
CN106683032A (zh) | 一种gpu染色阵列空闲单元查询电路 | |
CN104750727A (zh) | 一种列式内存存储查询装置及列式内存存储查询方法 | |
CN106484815B (zh) | 一种基于海量数据类sql检索场景的自动识别优化方法 | |
CN110866029A (zh) | sql语句构建方法、装置、服务器及可读存储介质 | |
CN115271023A (zh) | 基于改进多元宇宙优化算法的工程优化方法及相关设备 | |
CN105335624B (zh) | 一种基于位图的基因序列片段快速定位方法 | |
CN100576178C (zh) | 一种在制造网格环境中实现应用程序共享的方法 | |
CN102024067A (zh) | 一种模拟电路工艺移植的方法 | |
CN105335482A (zh) | 面向海量分布式数据库的批量插入方法 | |
CN114238379A (zh) | 基于sql生成器的报表查询方法和系统 | |
CN1889486A (zh) | 无线传感器网络中的动态能量管理方法与装置 | |
CN102855278B (zh) | 一种仿真方法和系统 | |
CN108804580A (zh) | 一种在联邦型rdf数据库中查询关键字的方法 | |
CN109033184A (zh) | 数据处理方法及装置 | |
CN106779150A (zh) | 一种大规模知识图谱复杂路径查询的视图物化方法 | |
CN104361090A (zh) | 数据查询方法及装置 | |
Werner et al. | Automated composition and execution of hardware-accelerated operator graphs | |
CN116561095A (zh) | 数据迁移方法、装置、电子设备及存储介质 | |
CN101436131A (zh) | 一种交互操作软件中实现重复操作的方法及系统 | |
CN112463818B (zh) | 一种存储底层信息查询方法、介质、设备及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |