CN101604181B - 计算机系统与其流处理器时钟的管理工具与方法 - Google Patents
计算机系统与其流处理器时钟的管理工具与方法 Download PDFInfo
- Publication number
- CN101604181B CN101604181B CN 200810109430 CN200810109430A CN101604181B CN 101604181 B CN101604181 B CN 101604181B CN 200810109430 CN200810109430 CN 200810109430 CN 200810109430 A CN200810109430 A CN 200810109430A CN 101604181 B CN101604181 B CN 101604181B
- Authority
- CN
- China
- Prior art keywords
- mentioned
- stream handle
- handle clock
- frequency
- clock
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Executing Machine-Instructions (AREA)
Abstract
一种计算机系统与其流处理器时钟的管理工具与方法。流处理器时钟的管理方法包括在一操作系统的环境下提供管理界面,以接收使用者的输入。当接收到使用者输入所要设定的流处理器时钟的频率值时,本发明的管理方法可以依据使用者的输入而获得多个参数值,并且这些参数值可以被分别写入对应的流处理器时钟寄存器中,以动态设定流处理器时钟的频率。
Description
技术领域
本发明涉及一种时钟的管理技术,特别是涉及一种流处理器时钟(Shader Clock)的管理技术。
背景技术
图形处理器(Graphics Processing Unit,以下简称GPU)就是显示卡的心脏,也就相当于中央处理器(CPU)在计算机中的作用。GPU可以从硬件上执行T&L(Transform and Lighting,多边形转换与光源处理)处理。所谓的T&L处理是3D渲染中的一个重要部分,其作用是计算多边形的3D位置和处理动态光线效果,也可以称为“几何处理”。
在过去的个人计算机中,T&L处理的大部分运算是交由个人计算机中的CPU来进行处理,这也就是所谓的软T&L处理。然而,由于CPU的任务繁多,除了T&L之外,还要做内存管理、输入响应等非3D图形处理工作。因此,在实际进行T&L处理运算的时候,显示卡的效能会大打折扣,因而导致有显示卡等待CPU资料的情况。因此,若是利用CPU来进行T&L处理,其运算速度远跟不上今天复杂3D游戏的要求。
因此,在现今的显示卡上,通常都会配置GPU,以分担CPU进行T&L处理。GPU所使用的时钟,包括工作时钟和流处理器时钟,其中流处理器时钟的频率值的高低,对于GPU的执行效率有非常大的影响。因此,要如何修改流处理器时钟的频率,就成了许多厂商所关切的技术。
已知更改流处理器时钟的频率的技术,大都是使用双VGA基本输入输出系统(以下简称VBIOS)来选择不同的频率值。然而这种技术,在需要切换不同的频率值时,需要将计算机系统重新开机,非常的不方便。况且,以已知的技术来说,也只有有限的选择来决定流处理器时钟的频率值,对于使用者来说并不足够。
发明内容
因此,本发明提供一种流处理器时钟的管理工具和方法,可以在一操作系统环境下,动态修改图形处理器的流处理器时钟的频率。
本发明也提供一种计算机系统,可以允许使用者在操作系统的环境下直接修改图形处理器中的流处理器时钟的频率。
本发明提供一种流处理器时钟的管理工具,包括界面单元、运算单元和写入单元。界面单元可以接收输入的流处理器时钟值,运算单元可以依据输入的流处理器时钟的频率值而计算出多个参数值。另外,这些参数值可以经由写入单元分别写入图形处理器中多个流处理器时钟寄存器内,以动态修改流处理器时钟的频率。其中,运算单元依据计算公式来计算出这些参数值或依据查找表来获得这些参数值,上述这些参数值包括P、N和M,且P、N和M都为整数,而三者的关系为:
流处理器时钟值的频率值=基频值×(N/M)×(1/2P)。
从另一观点来看,本发明也提供一种计算机系统包括图形处理器和管理工具。图形处理器具有多个流处理器时钟寄存器,用以决定图形处理界面中的流处理器时钟的频率。管理工具可以修改流处理器时钟值。当管理工具被启动时,管理工具可以依据使用者所输入的流处理器时钟的频率值而获得多个参数值。这些参数值则可以被分别写入至图形处理器中的流处理器时钟寄存器内,以设定流处理器时钟的频率。其中,运算单元依据计算公式来计算出这些参数值或依据查找表来获得这些参数值,上述这些参数值包括P、N和M,且P、N和M都为整数,而三者的关系为:
流处理器时钟值的频率值=基频值×(N/M)×(1/2P)。
从另一观点来看,本发明还提供一种流处理器时钟的管理方法,包括在一操作系统的环境下提供管理界面,以接收使用者的输入。当使用者输入所要设定的流处理器时钟的频率值时,则本发明的管理方法可以依据使用者的输入而获得多个参数值,并且这些参数值可以被分别写入对应的流处理器时钟寄存器中,以动态设定流处理器时钟的频率。其中,上述这些参数值包括P、N和M,且P、N和M都为整数,而三者的关系为:
流处理器时钟值的频率值=基频值×(N/M)×(1/2P)。
本发明的有益效果为,本发明是利用写入流处理器时钟寄存器数值的方式来调整流处理器时钟的频率,因此本发明在不需计算机系统重新开机的情况下,就可以动态设定流处理器时钟值的频率。另外,本发明是依据使用者的输入来产生参数值,因此本发明可以允许使用者自由设定流处理器时钟的频率。
为使本发明的上述特征和优点能更明显易懂,下文特举较佳实施例,并结合附图详细说明如下。
附图说明
图1所示为依照本发明的一较佳实施例的一种计算机系统的系统方块图。
图2所示依照本发明的一较佳实施例的一种流处理器时钟的管理工具的方块图。
图3所示依照本发明的一较佳实施例的一种获得参数值的步骤流程图。
具体实施方式
图1所示为依照本发明的一较佳实施例的一种计算机系统的系统方块图。请参照图1,本实施例中所提供的计算机系统100,包括操作系统(OS)单元102、显示驱动单元104和显示器106。OS单元102具有一操作系统,在计算机系统100完成开机后,OS单元102中的操作系统可以被载入,以使得计算机系统100可以提供使用者预设的操作系统环境。
OS单元102可以耦接显示驱动单元104。在本实施例中,显示驱动单元104可以是一显示卡,例如:视讯图像阵列(VGA)显示卡。显示驱动单元104最核心的部分就是图像处理器(GPU)110。GPU 110可以从显示驱动单元104上,进行T&L处理,以加快3D图像的运算时间。显示驱动单元104用来驱动显示器106。当显示驱动单元104将要显示给使用者的图像运算完毕后,可以传送至显示器106,以输出给使用者观看。显示器106可以是液晶显示器或是阴极射线管显示器。
一般来说,GPU 110可以依据多个时钟讯号来进行运作,例如工作时钟讯号和流处理器时钟讯号。然而,影响GPU 110的效能最显著的,就是流处理器时钟讯号。所谓的流处理器时钟,就是当GPU 110进行渲染处理时所需的时钟讯号。当GPU 110在进行渲染处理时,会出现大量的资料量。由此可知,流处理器时钟的频率的高低,就影响了GPU 110在进行渲染处理时的效率。因此,本发明还在OS单元102中,提供了流处理器时钟的管理工具,以管理显示驱动单元104中的流处理器时钟。
图2所示依照本发明的一较佳实施例的一种流处理器时钟的管理工具的方块图。请参照图2,本实施例所提供的管理工具200,包括界面单元202、运算单元204和写入单元206。管理工具200耦接显示驱动单元104。界面单元202可以在例如图1的显示器106上显示一管理界面,其可以是一图形界面。藉由此管理界面,使用者可以输入流处理器时钟的频率值,以在预设的操作系统环境下,动态地调整流处理器时钟的频率。
当界面单元202接收了使用者的输入后,可以送至运算单元204进行运算,以获得多个参数值。在一些实施例中,运算单元204可以利用查询查找表的查表方式,或是利用计算公式来获得这些参数值(以下会有详细的说明)。这些参数值可以被运算单元204送到写入单元206。当写入单元206接收到这些参数值时,可以将其写入显示驱动单元104中的GPU 110中。
在GPU 110中,配置了一流处理器时钟寄存器组220,其具有多个流处理器时钟寄存器,例如R0、R1、R2、R3、R4、R5、R6和R7。其中,寄存器R0可以是最低位,而寄存器R7则可以是最高位。在一些实施例中,这些流处理器时钟寄存器R0、R1、R2、R3、R4、R5、R6和R7的内含值,就决定了流处理器时钟的频率。因此,运算单元204只要获得符合使用者所输入的流处理器时钟的频率值对应的参数值,就可以动态地调整流处理器时钟的频率。以下本发明的实施例中,本发明提出其中一获得参数值的流程。然而本领域技术人员应当知道,本发明并不以此为限。
图3所示依照本发明的一较佳实施例的一种获得参数值的步骤流程图。请合并参照图2和图3,在本实施例中,运算单元204可以如步骤S302所述,提供一计算公式,例如:
其中,Clk为流处理器时钟的频率值,而N、M和P都是要写到GPU 110中流处理器时钟寄存器R0、R1、R2、R3、R4、R5、R6和R7,三者都可以是整数。在一些实施例中,参数值N可以大于M。另外,在第(1)式中的的基频值可以是27MHz。
接着,运算单元204可以如步骤S304所述,从界面单元202接收使用者的输入,并且进行步骤S306,就是判断使用者所输入的频率值是否大于一第一条件值。例如,判断使用者所输入的频率值是否大于800MHz。若是使用者输入的频率值大于第一条件值时(就是步骤S306所标示的“是”),则运算单元204就可以将参数值M设为一第一预设值,例如是3,也就是步骤S308的内容。相对地,当使用者的输入值小于或等于第一条件值时(就是步骤S306所标示的“否”),则运算单元204就可以如步骤S310所述,将参数值M设为一第二预设值,例如是2。
由于在第(1)式中有M、N和P等未知数的参数值,因此当参数值M被求出后,还需要获得另一参数值,才可以获得所有的参数值。因此,当运算单元204进行完步骤S308或是S310后,还可以进行步骤S312,就是判断使用者所输入的频率值是否大于一第二条件值。类似地,若是使用者输入的频率值大于第二条件值时(就是步骤S312所标示的“是”),则运算单元204就可以如步骤S314所述,将另一参数值P设为一第三预设值。另外,当使用者的输入值小于或等于第二条件值时(就是步骤S312所标示的“否”),则运算单元204就可以如步骤S316所述,将参数值P设为一第四预设值。而当进行完步骤S314或S316后,运算单元204就可以如步骤S318所述,从已知的参数值而获得其余的参数值,例如是参数N。
当运算单元204获得了所有的参数值后,写入单元206就可以分别将这些参数值写入多个渲染频率缓存器内,亦即多个对应的流处理器时钟寄存器内。在一些实施例中,参数值M可以被写入寄存器R0和R1中,而参数值N则可以被写入至寄存器R2和R3中。另外,参数值P则可以被填入寄存器R4中。藉此,本发明所提供的管理工具就可以有效地管理流处理器时钟的频率。
综上所述,由于本发明较佳实施例可以依据使用者的输入而获得流处理器时钟寄存器的内含值,并且以更改流处理器时钟寄存器的内含值的方式来调整流处理器时钟的频率。因此,本发明并不需要计算机系统重开机,而是可以允许使用者在预设操作系统的环境下进行动态调整,因而增加了使用者的便利性。
虽然本发明已以较佳实施例揭示如上,然其并非用以限定本发明,本领域的技术人员在不脱离本发明的精神和范围的前提下可作若干的更动与润饰,因此本发明的保护范围以本领域的权利要求为准。
Claims (9)
1.一种流处理器时钟的管理工具,在操作系统环境下动态修改图形处理器的流处理器时钟,其特征在于,上述管理工具包括:
界面单元,接收输入的流处理器时钟的频率值;
运算单元,耦接上述界面单元,以依据上述输入的流处理器时钟的频率值而计算出多个参数值;以及
写入单元,耦接上述运算单元,用以将上述这些参数值分别写入上述图形处理器中多个流处理器时钟寄存器内,以动态修改上述流处理器时钟的频率;
其中,上述运算单元依据计算公式来计算出上述这些参数值或依据查找表来获得上述这些参数值,上述这些参数值包括P、N和M,且P、N和M都为整数,而三者的关系为:
流处理器时钟值的频率值=基频值×(N/M)×(1/2P)。
2.根据权利要求1所述的管理工具,其特征在于,上述界面单元提供图形界面,以输入所要修改的流处理器时钟的频率值。
3.一种计算机系统,其特征在于,包括:
显示驱动单元,具有图形处理器,上述图形处理器具有多个流处理器时钟寄存器,用以决定上述显示驱动单元中的流处理器时钟的频率;以及
管理工具,耦接上述显示驱动单元,当上述管理工具被启动时,上述管理工具依据输入的流处理器时钟的频率值而获得多个参数值,上述这些参数值则分别被写入至上述这些流处理器时钟寄存器内,以设定上述流处理器时钟的频率;
其中,上述管理工具依据计算公式来获得上述这些参数值或依据查找表来获得上述这些参数值,上述这些参数值包括P、N和M,且P、N和M都为整数,而三者的关系为:
流处理器时钟值的频率值=基频值×(N/M)×(1/2P)。
4.根据权利要求3所述的计算机系统,其特征在于,上述管理工具提供图形界面以接收上述输入的流处理器时钟的频率值。
5.根据权利要求3所述的计算机系统,其特征在于,上述计算机系统还包括显示器,是由上述显示驱动单元所驱动。
6.一种流处理器时钟的管理方法,适用于图形处理器,其具有多个流处理器时钟寄存器,其特征在于,上述管理方法包括:
在操作系统的环境下提供管理界面,以接收输入的流处理器时钟的频率值;
依据上述输入的流处理器时钟的频率值而获得多个参数值;以及
分别将上述这些参数值写入对应的上述这些流处理器时钟寄存器中,以动态设定上述图形处理器的流处理器时钟的频率;
其中,上述这些参数值包括P、N和M,且P、N和M都为整数,而三者的关系为:
流处理器时钟值的频率值=基频值×(N/M)×(1/2P)。
7.根据权利要求6所述的管理方法,其特征在于,上述N大于M。
8.根据权利要求6所述的管理方法,其特征在于,上述管理方法还包括下列步骤:
判断上述输入的频率值是否大于第一条件值;以及
当上述输入的频率值大于上述第一条件值时,则参数M设为第一预设值,当上述输入的频率值不大于上述第一条件值时,则参数M设为第二预设值。
9.根据权利要求6所述的管理方法,其特征在于,上述管理方法还包括下列步骤:
判断上述输入的流处理器时钟的频率值是否大于第二条件值;以及
当上述输入的频率值大于上述第二条件值时,则参数P设为第三预设值,当上述输入的频率值不大于上述第二条件值时,则参数P设为第四预设值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200810109430 CN101604181B (zh) | 2008-06-12 | 2008-06-12 | 计算机系统与其流处理器时钟的管理工具与方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200810109430 CN101604181B (zh) | 2008-06-12 | 2008-06-12 | 计算机系统与其流处理器时钟的管理工具与方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101604181A CN101604181A (zh) | 2009-12-16 |
CN101604181B true CN101604181B (zh) | 2012-12-05 |
Family
ID=41469938
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 200810109430 Active CN101604181B (zh) | 2008-06-12 | 2008-06-12 | 计算机系统与其流处理器时钟的管理工具与方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101604181B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101788847B (zh) * | 2010-02-11 | 2012-07-04 | 华硕电脑股份有限公司 | 系统内存性能调整方法与装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1762102A1 (en) * | 2004-06-28 | 2007-03-14 | Intel Corporation | Power management apparatus, systems, and methods |
CN1972168A (zh) * | 2005-11-25 | 2007-05-30 | 杭州中天微系统有限公司 | 可编程变长比特流处理器 |
-
2008
- 2008-06-12 CN CN 200810109430 patent/CN101604181B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1762102A1 (en) * | 2004-06-28 | 2007-03-14 | Intel Corporation | Power management apparatus, systems, and methods |
CN1972168A (zh) * | 2005-11-25 | 2007-05-30 | 杭州中天微系统有限公司 | 可编程变长比特流处理器 |
Also Published As
Publication number | Publication date |
---|---|
CN101604181A (zh) | 2009-12-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7721118B1 (en) | Optimizing power and performance for multi-processor graphics processing | |
EP3259676B1 (en) | Backward compatibility through use of spoof clock and fine grain frequency control | |
JP6615837B2 (ja) | DisplayPortに準拠したインターフェースにおけるプロトコル拡張 | |
US8086828B2 (en) | Multiprocessor computing systems with heterogeneous processors | |
US9442780B2 (en) | Synchronization of shader operation | |
US20240037183A1 (en) | Performing matrix multiplication in a streaming processor | |
US20180203812A1 (en) | Application processor and integrated circuit including interrupt controller | |
CN115039075A (zh) | 促进基于瓦片的gpu机器学习加速的方法和装置 | |
WO2019195774A1 (en) | Shader binding management in ray tracing | |
WO2024051122A1 (zh) | 一种PCIe中断处理方法、装置、设备及非易失性可读存储介质 | |
US20230290034A1 (en) | Fast incremental shared constants | |
US20120215996A1 (en) | Write data mask method and system | |
CN101604181B (zh) | 计算机系统与其流处理器时钟的管理工具与方法 | |
US11763419B2 (en) | GPR optimization in a GPU based on a GPR release mechanism | |
CN116414744A (zh) | 信息处理方法、装置及电子设备 | |
US20090228612A1 (en) | Flexible Bus Interface and Method for Operating the Same | |
US7352372B2 (en) | Indirect addressing mode for display controller | |
CN112306558A (zh) | 处理单元、处理器、处理系统、电子设备和处理方法 | |
US11954758B2 (en) | Dynamic wave pairing | |
US20220318137A1 (en) | Method and system for sharing memory | |
JP3482255B2 (ja) | 画像データ処理装置およびそれを用いた情報システム | |
US20130113792A1 (en) | Three Dimensional Computer Graphics System | |
US8856499B1 (en) | Reducing instruction execution passes of data groups through a data operation unit | |
US20090309883A1 (en) | Computer system and tool and method for managing shader clock | |
CN117291788A (zh) | 图形处理方法、系统、装置及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |