CN112363609A - 一种降低片上网络功耗的方法、装置、cpu芯片及服务器 - Google Patents

一种降低片上网络功耗的方法、装置、cpu芯片及服务器 Download PDF

Info

Publication number
CN112363609A
CN112363609A CN202011135266.9A CN202011135266A CN112363609A CN 112363609 A CN112363609 A CN 112363609A CN 202011135266 A CN202011135266 A CN 202011135266A CN 112363609 A CN112363609 A CN 112363609A
Authority
CN
China
Prior art keywords
noc
representing
niu
requests
class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011135266.9A
Other languages
English (en)
Other versions
CN112363609B (zh
Inventor
徐祥俊
黄维
韩胜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Haiguang Information Technology Co Ltd
Original Assignee
Haiguang Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Haiguang Information Technology Co Ltd filed Critical Haiguang Information Technology Co Ltd
Priority to CN202011135266.9A priority Critical patent/CN112363609B/zh
Publication of CN112363609A publication Critical patent/CN112363609A/zh
Application granted granted Critical
Publication of CN112363609B publication Critical patent/CN112363609B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/324Power saving characterised by the action undertaken by lowering clock frequency
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/163Interprocessor communication
    • G06F15/173Interprocessor communication using an interconnection network, e.g. matrix, shuffle, pyramid, star, snowflake
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/78Architectures of general purpose stored program computers comprising a single central processing unit
    • G06F15/7807System on chip, i.e. computer system on a single chip; System in package, i.e. computer system on one or more chips in a single package
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明的实施例公开了一种降低片上网络功耗的方法、装置、CPU芯片及服务器,涉及计算机技术领域,能够有效降低片上网络的功耗。所述方法包括:获取片上网络NoC的工作状态数据,所述工作状态数据包括在一段时间窗口内NIU中从设备发起的未响应请求数目、在一段时间窗口内RU中缓存的请求和响应数目、NoC历史带宽统计数据中的一种或多种;根据所述工作状态数据,计算NoC的预期工作频率;根据所述预期工作频率,调整NoC的工作频率。本发明适用于降低片上网络功耗的场合。

Description

一种降低片上网络功耗的方法、装置、CPU芯片及服务器
技术领域
本发明涉及计算机技术领域,尤其涉及一种降低片上网络功耗的方法、装置、CPU芯片及服务器。
背景技术
随着集成电路的发展和工艺的提升,芯片的集成度在不断提升,大规模SOC(System on Chip,系统级芯片)设计已成为主流。NoC(Network on Chip,片上网络)用于实现SOC中各个设备的片上互联,主要包括多个网络接口单元(Network Interface Unit,NIU)和路由单元(Router Unit,RU),如图1所示,NIU在NoC的边界,每个NIU用于连接一个挂载设备,并负责管理该设备发出的所有请求和发送给该设备的所有请求。对于设备发送的每个请求,NIU均会记录相关信息并转发给RU,在收到RU转发的响应后,NIU将响应转发给设备并清除相关记录。对于从RU发送给设备的每个请求,NIU均会记录相关信息并转发给设备,在收到设备的响应之后,NIU将响应转发给RU并清除相关记录。RU在NoC的内部,实现NIU之间的互联,负责将NIU转发的每一笔请求或响应按照预设的路由规则转发给指定的NIU,RU的拓扑结构可根据设计需求制定,包括网状拓扑、环状拓扑等,RU会暂存收到的每笔请求或响应,在转发之后删除相关记录。
考虑到NoC的性能决定了整个SOC片上通信的效率,与SOC的性能息息相关,NoC一般都具有高带宽低延时的特性,而且NoC分布在SOC各处,占SOC设计比重大,因此NoC消耗了SOC相当大比例的功耗,降低NoC设计的功耗显得尤为重要。
现有的SOC设计中,NoC通常分为固定频率和可变频率两种。固定频率类型NoC多用于早期嵌入式SOC设计,NoC工作频率在系统正常运行之后不再改变,这类设计能效比一般较差,目前已不多见。可变频率类型NoC目前已广泛应用于当前各类SOC设计中,设计人员预先确定系统的典型应用场景,根据应用场景对NoC带宽和延时的要求,确定各应用场景下NoC的工作频率并记录。系统运行时,根据当前的工作场景为NoC选择预设的工作频率,只有当工作场景发生改变时,才更新NoC的工作频率。此类变频技术能够在一定程度上优化SOC的能耗比,但是由于不能动态对NoC工作频率进行精确调整,还有很大的改善和提升空间。
发明内容
有鉴于此,本发明实施例提供一种降低片上网络功耗的方法、装置、CPU芯片及服务器,能够有效降低片上网络的功耗。
第一方面,本发明实施例提供一种降低片上网络功耗的方法,包括:
获取片上网络NoC的工作状态数据,所述工作状态数据包括在一段时间窗口内NIU中从设备发起的未响应请求数目、在一段时间窗口内RU中缓存的请求和响应数目、NoC历史带宽统计数据中的一种或多种;
根据所述工作状态数据,计算NoC的预期工作频率;
根据所述预期工作频率,调整NoC的工作频率。
结合第一方面,在第一方面的一种实施方式中,所述NoC的预期工作频率的计算公式为:
Figure BDA0002736294730000021
其中,fe表示预测的NoC工作频率,N表示NoC中NIU的数目,R表示NoC支持的请求种类数目,T表示NoC历史带宽统计数据的时间窗数目,Qn,r表示第n个NIU中第r类请求的未响应请求数目,An,r表示第n个NIU中第r类请求的权值,Pn,r,t表示第n个NIU中第r类请求在时间窗t中的带宽统计,Bn,r,t表示第n个NIU中第r类请求在时间窗t中的带宽统计的权值,C、D表示幅度系数,E表示偏置参数。
结合第一方面,在第一方面的另一种实施方式中,所述公式一中参数An,r、Bn,r,t和C、D、E根据NoC性能测试数据进行拟合得到;
其中,进行NoC性能测试时需要保证NoC处于稳定工作状态,并使NoC带宽达到当前工作频率下最大带宽;一组NoC性能测试数据包括:a)NoC当前工作频率fk;b)每个NIU中每类未响应请求个数,即N*R个测试数据RQn,r,k;c)每个NIU中每个时间窗内每类完成的请求个数,即N*R*Y个测试数据RPn,r,t,k;NoC性能测试数据在NoC全工作频率范围内随机分布,且测试数据组数K远大于待拟合参数数目。
结合第一方面,在第一方面的再一种实施方式中,所述公式一中参数An,r、Bn,r,t和C、D、E根据NoC性能测试数据进行拟合得到,包括:
根据公式二定义的残差函数J,通过使用最速梯度下降法求得使残差函数J最小的一组参数An,r、Bn,r,t和C、D、E,即得所述公式一中参数An,r、Bn,r,t和C、D、E;
其中,
J=∑(fk-fe,k)2 公式二
Figure BDA0002736294730000031
结合第一方面,在第一方面的又一种实施方式中,所述根据所述预期工作频率,调整NoC的工作频率进一步为:
将NoC的工作频率调整为所述预期工作频率的m倍,1<m<1.3。
第二方面,本发明实施例提供一种降低片上网络功耗的装置,包括:
获取模块,用于获取片上网络NoC的工作状态数据,所述工作状态数据包括在一段时间窗口内NIU中从设备发起的未响应请求数目、在一段时间窗口内RU中缓存的请求和响应数目、NoC历史带宽统计数据中的一种或多种;
计算模块,用于根据所述工作状态数据,计算NoC的预期工作频率;
调整模块,用于根据所述预期工作频率,调整NoC的工作频率。
结合第二方面,在第二方面的一种实施方式中,所述NoC的预期工作频率的计算公式为:
Figure BDA0002736294730000032
其中,fe表示预测的NoC工作频率,N表示NoC中NIU的数目,R表示NoC支持的请求种类数目,T表示NoC历史带宽统计数据的时间窗数目,Qn,r表示第n个NIU中第r类请求的未响应请求数目,An,r表示第n个NIU中第r类请求的权值,Pn,r,t表示第n个NIU中第r类请求在时间窗t中的带宽统计,Bn,r,t表示第n个NIU中第r类请求在时间窗t中的带宽统计的权值,C、D表示幅度系数,E表示偏置参数。
结合第二方面,在第二方面的另一种实施方式中,所述公式一中参数An,r、Bn,r,t和C、D、E根据NoC性能测试数据进行拟合得到;
其中,进行NoC性能测试时需要保证NoC处于稳定工作状态,并使NoC带宽达到当前工作频率下最大带宽;一组NoC性能测试数据包括:a)NoC当前工作频率fk;b)每个NIU中每类未响应请求个数,即N*R个测试数据RQn,r,k;c)每个NIU中每个时间窗内每类完成的请求个数,即N*R*T个测试数据RPn,r,t,k;NoC性能测试数据在NoC全工作频率范围内随机分布,且测试数据组数K远大于待拟合参数数目。
结合第二方面,在第二方面的再一种实施方式中,所述公式一中参数An,r、Bn,r,t和C、D、E根据NoC性能测试数据进行拟合得到,包括:
根据公式二定义的残差函数J,通过使用最速梯度下降法求得使残差函数J最小的一组参数An,r、Bn,r,t和C、D、E,即得所述公式一中参数An,r、Bn,r,t和C、D、E;
其中,
J=∑(fk-fe,k)2 公式二
Figure BDA0002736294730000041
结合第二方面,在第二方面的又一种实施方式中,所述调整模块,进一步用于将NoC的工作频率调整为所述预期工作频率的m倍,1<m<1.3。
第三方面,本发明实施例提供一种CPU芯片,包括:处理器核心;
所述处理器核心,用于获取片上网络NoC的工作状态数据,所述工作状态数据包括在一段时间窗口内NIU中从设备发起的未响应请求数目、在一段时间窗口内RU中缓存的请求和响应数目、NoC历史带宽统计数据中的一种或多种;根据所述工作状态数据,计算NoC的预期工作频率;根据所述预期工作频率,调整NoC的工作频率。
结合第三方面,在第三方面的一种实施方式中,所述NoC的预期工作频率的计算公式为:
Figure BDA0002736294730000051
其中,fe表示预测的NoC工作频率,N表示NoC中NIU的数目,R表示NoC支持的请求种类数目,T表示NoC历史带宽统计数据的时间窗数目,Qn,r表示第n个NIU中第r类请求的未响应请求数目,An,r表示第n个NIU中第r类请求的权值,Pn,r,t表示第n个NIU中第r类请求在时间窗t中的带宽统计,Bn,r,t表示第n个NIU中第r类请求在时间窗t中的带宽统计的权值,C、D表示幅度系数,E表示偏置参数。
结合第三方面,在第三方面的另一种实施方式中,所述公式一中参数An,r、Bn,r,t和C、D、E根据NoC性能测试数据进行拟合得到;
其中,进行NoC性能测试时需要保证NoC处于稳定工作状态,并使NoC带宽达到当前工作频率下最大带宽;一组NoC性能测试数据包括:a)NoC当前工作频率fk;b)每个NIU中每类未响应请求个数,即N*R个测试数据RQn,r,k;c)每个NIU中每个时间窗内每类完成的请求个数,即N*R*T个测试数据RPn,r,t,k;NoC性能测试数据在NoC全工作频率范围内随机分布,且测试数据组数K远大于待拟合参数数目。
结合第三方面,在第三方面的再一种实施方式中,所述公式一中参数An,r、Bn,r,t和C、D、E根据NoC性能测试数据进行拟合得到,包括:
根据公式二定义的残差函数J,通过使用最速梯度下降法求得使残差函数J最小的一组参数An,r、Bn,r,t和C、D、E,即得所述公式一中参数An,r、Bn,r,t和C、D、E;
其中,
J=∑(fk-fe,k)2 公式二
Figure BDA0002736294730000061
结合第三方面,在第三方面的又一种实施方式中,所述根据所述预期工作频率,调整NoC的工作频率进一步为:
将NoC的工作频率调整为所述预期工作频率的m倍,1<m<1.3。
第四方面,本发明实施例提供一种服务器,包括:壳体、处理器、存储器、电路板和电源电路,其中,电路板安置在壳体围成的空间内部,处理器和存储器设置在电路板上;电源电路,用于为上述服务器的各个电路或器件供电;存储器用于存储可执行程序代码;处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,用于执行前述任一所述的方法。
第五方面,本发明实施例还提供一种CPU芯片,包括片上网络NoC、为所述NoC提供工作时钟的时钟模块、以及用于控制所述时钟模块的系统控制单元SCU,所述NoC包括若干网络接口单元NIU,每个NIU均包括未响应请求统计模块、带宽监控模块和初级运算模块;所述SCU包括二级运算模块和时钟控制模块,其中:
所述未响应请求统计模块用于统计当前时间窗口内未响应的读请求和写请求数目,所述带宽监控模块用于记录最近预设数量个时间窗口内完成的读请求和写请求数目,所述未响应请求统计模块和带宽监控模块的输出端连接至所述初级运算模块的输入端,所述初级运算模块用于实现公式五的运算;
每个NIU的初级运算模块的输出端连接至所述二级运算模块的输入端,所述二级运算模块的输出端连接所述时钟控制模块,所述时钟控制模块的输出端控制连接所述时钟模块,所述二级运算模块用于实现公式四的运算;
Figure BDA0002736294730000062
Figure BDA0002736294730000063
其中,fe表示预测的NoC工作频率,N表示NoC中NIU的数目,R表示NoC支持的请求种类数目,T表示NoC历史带宽统计数据的时间窗数目,Qn,r表示第n个NIU中第r类请求的未响应请求数目,An,r表示第n个NIU中第r类请求的权值,Pn,r,t表示第n个NIU中第r类请求在时间窗t中的带宽统计,Bn,r,t表示第n个NIU中第r类请求在时间窗t中的带宽统计的权值,C、D表示幅度系数,E表示偏置参数。
本发明实施例提供的降低片上网络功耗的方法、装置、CPU芯片及服务器,首先获取片上网络NoC的工作状态数据,所述工作状态数据包括在一段时间窗口内NIU中从设备发起的未响应请求数目、在一段时间窗口内RU中缓存的请求和响应数目、NoC历史带宽统计数据中的一种或多种,然后根据所述工作状态数据,计算NoC的预期工作频率,最后根据所述预期工作频率,调整NoC的工作频率。这样,通过实现对NoC工作频率的动态调整,保证NoC的工作频率匹配NoC的工作负荷,在NoC工作负荷高时提高工作频率以保证SOC性能,在NoC工作负荷低时降低工作频率以减少无效功耗,能够实现在提升NoC性能的同时降低NoC的无效功耗,优化NoC的能效比,有效降低片上网络的功耗。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为现有技术中片上网络的连接结构原理图;
图2为本发明的降低片上网络功耗的方法一个实施例的流程示意图;
图3为本发明中片上网络的架构示例图;
图4为本发明的降低片上网络功耗的装置一个实施例的结构示意图;
图5为本发明的服务器一个实施例的结构示意图;
图6为本发明的CPU芯片中网络接口单元NIU的结构示意图;
图7为本发明的CPU芯片的结构示意图。
具体实施方式
下面结合附图对本发明实施例进行详细描述。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
一方面,本发明实施例提供一种降低片上网络功耗的方法,如图2所示,本实施例的方法可以包括:
步骤101:获取片上网络NoC的工作状态数据,所述工作状态数据包括在一段时间窗口内NIU中从设备发起的未响应请求数目、在一段时间窗口内RU中缓存的请求和响应数目、NoC历史带宽统计数据中的一种或多种(前两者用于体现NoC当前工作负荷,最后一个用于体现NoC历史工作负荷);
如前所述,NIU和RU均会记录NoC中的请求和响应信息,通过统计并分析NIU和RU中的记录信息、NoC拓扑结构以及NIU/RU设计参数,建立分析模型,我们能够对当前NoC网络的工作负荷进行评估,在此基础上进一步结合NoC工作负荷的历史信息以及NoC工作负荷与工作频率的对应关系,可以计算得出当前NoC的合理工作频率。
本步骤中,可以通过使用NIU中记录的未完成请求数目和NIU中记录的历史带宽记录(即NoC历史带宽统计数据)对NoC工作负荷进行评估,也可以通过使用RU中未转发(即缓存的)请求/响应数目和NIU中记录的历史带宽记录对NoC工作负荷进行评估,也可以仅利用NIU中记录的未完成请求数目、NIU中记录的历史带宽记录或RU中未转发请求/响应数目中的一项对NoC带宽进行评估。
每个NIU会记录由所连接设备发起并转发至RU的每一笔请求直到收到对应响应,因此,统计所有NIU中由设备发起的未响应请求即可推断当前NoC的工作负荷。每个RU均会记录已接收但还未转发的请求和响应,因此,统计所有RU中缓存的请求和响应也可推断当前NoC的工作负荷。从系统实现的角度考虑,当NIU数目小于RU数目或者和RU数目相当时,应选择采用NIU的未响应请求统计数据推断当前NoC的工作负荷,反之则应采用RU的缓存请求和响应统计数据推断当前NoC的工作负荷。
在每个NIU中,可以分别统计在一段时间窗口内转发并收到响应的各类请求的数目,时间窗口可根据系统配置进行调整(例如设置为10毫秒),统计数据可以反映过去一段时间窗口内NoC的带宽。通过记录过去多个时间窗口的统计数据,可以推断出NoC历史带宽(即NoC历史工作负荷)的变化情况。
以图3所示NoC设计为例,NoC中一共有6个NIU和9个RU,可以选择通过NIU中由设备发起的未响应请求记录和NIU中历史带宽记录(即NoC历史带宽统计数据)对NoC工作频率进行估算,综合考虑模型精度和运算成本,该实例仅对请求按读请求和写请求两类进行统计,仅记录每个NIU前10毫秒以及前10毫秒之前20毫秒两个时间窗口的历史带宽。
步骤102:根据所述工作状态数据,计算NoC的预期工作频率;
在NoC拓扑和配置不变的情况下,NoC能够提供的带宽与工作频率成正比,NIU中从设备发送的未响应请求数目(或者RU中缓存请求和响应数目)与NoC工作负荷(即NoC所需提供的带宽)成正比。但是,不同类型的请求,不同NIU转发的请求(或者不同RU缓存的请求和响应)对NoC工作负荷的贡献度是不同的,因此需要结合NoC拓扑和配置对NoC工作负荷进行建模。为了避免系统临时突发请求导致模型计算的NoC工作频率频繁大幅度变化,需要在模型中引入NoC历史带宽统计数据。
作为一种可选的实施例,综合考虑模型精度与模型复杂度,本步骤中以模型参数选择NIU中未响应请求统计数据和NIU中历史带宽统计数据为例,采用一阶模型对NoC预期工作频率进行建模(如需更精确的模型精度,可采用更高阶模型或其它类型模型进行建模),如公式一所示。
Figure BDA0002736294730000091
其中,fe表示预测的NoC工作频率,N表示NoC中NIU的数目,R表示NoC支持的请求种类数目,T表示NoC历史带宽统计数据(具体可由NIU记录得到)的时间窗数目,Qn,r表示第n个NIU中第r类请求的未响应请求数目,An,r表示第n个NIU中第r类请求的权值,Pn,r,t表示第n个NIU中第r类请求在时间窗t中的带宽统计,Bn,r,t表示第n个NIU中第r类请求在时间窗t中的带宽统计的权值,C、D表示幅度系数,E表示偏置参数。C和D用于调整单个高负荷NIU对模型预测频率的影响,此处可以令C+D=1,简单举例比如C=0.3,D=0.7。需要说明的是,公式中仅涉及数值上的计算和建模,不考虑单位的影响。
公式一中Qn,r和Pn,r,t可以由NIU进行统计,An,r、Bn,r,t和C、D、E与NoC拓扑和配置相关,需要根据NoC性能测试结果进行拟合。
进一步的,公式一中An,r、Bn,r,t和C、D、E参数可以根据NoC性能测试数据进行拟合。进行NoC性能测试时需要保证NoC处于稳定工作状态,并使NoC带宽达到当前工作频率下最大带宽。一组NoC性能测试数据包括:a)NoC当前工作频率fk;b)每个NIU中每类未响应请求个数,即N*R个测试数据RQn,r,k;c)每个NIU中每个时间窗内每类完成的请求个数,即N*R*T个测试数据RPn,r,t,k;由于An,r、Bn,r,t和C、D、E一共有N*R+N*R*T+3个参数,为了保证拟合结果的正确性和鲁棒性,需要保证NoC性能测试数据在NoC全工作频率范围内随机分布,且测试数据组数K远大于待拟合参数数目。
J=∑(fk-fe,k)2 公式二
Figure BDA0002736294730000101
为提高计算效率和准确度,具体计算时优选的,根据公式二定义的残差函数J,通过使用最速梯度下降法求得使残差函数J最小的一组参数An,r、Bn,r,t和C、D、E,即得所述公式一中参数An,r、Bn,r,t和C、D、E。
继续以图3所示NoC设计为例,由于只统计读写两类请求,NoC中一共有6个NIU,且只记录2个历史时间窗的带宽,因此总共有2*6+2*6*2+3=39个参数。在NoC的工作频率范围内随机选择200个频率点,在每个频率点,不断加大NoC的工作负荷直到NoC达到该工作频率下的最大工作负荷,等待100毫秒后,读取各个NIU的Qn,1、Qn,2、Pn,1,t和Pn,2,t,共36个数据记为一组测试数据。基于200组测试数据,根据公式二,采用最速梯度下降法计算得到39个参数。
步骤103:根据所述预期工作频率,调整NoC的工作频率。
时钟模块负责向NoC提供工作时钟,一般可以通过修改配置改变输出时钟频率。SOC设计中通常由系统控制单元(SCU)(或其它控制逻辑)负责配置时钟模块输出预期频率的时钟。SCU通过实时监控并计算当前NoC的合理工作频率,动态修改时钟模块配置,可以实现NoC的动态变频,保证NoC工作频率与工作负荷的自适应。
本步骤中,在系统运行时,每经过一个时间窗口的时长,可以根据公式一实时对NoC最优工作频率进行一次预测。具体实施时,可将NoC的工作频率调整为预期工作频率fe的m倍,1<m<1.3(此处m的范围是一个较为通用的范围,根据系统设计不同,该范围也可适当调整),例如m可以为1.1,以增加10%频率裕量,增加系统鲁棒性,具体增加裕量幅度与系统设计有关,可根据系统调试经验调整。
现有NoC设计通常预先设定多个频率点,实际工作时,由软件根据系统配置在预设频点中进行选择。然而在系统实际运行过程中,工作负荷是在不断变化的,与预设的频率点之间不可避免地存在失配问题,采用这种方式并不能很好的满足系统的性能需求,同时也并不能有效地利用系统能源。
本发明实施例通过实现对NoC工作频率的动态调整,保证NoC的工作频率匹配NoC的工作负荷,在NoC工作负荷高时提高工作频率以保证SOC性能,在NoC工作负荷低时降低工作频率以减少无效功耗,能够实现在提升NoC性能的同时降低NoC的无效功耗,优化NoC的能效比,有效降低片上网络的功耗。
另一方面,本发明实施例提供一种降低片上网络功耗的装置,如图4所示,该装置可以包括:
获取模块11,用于获取片上网络NoC的工作状态数据,所述工作状态数据包括在一段时间窗口内NIU中从设备发起的未响应请求数目、在一段时间窗口内RU中缓存的请求和响应数目、NoC历史带宽统计数据中的一种或多种;
计算模块12,用于根据所述工作状态数据,计算NoC的预期工作频率;
调整模块13,用于根据所述预期工作频率,调整NoC的工作频率。
本实施例的装置,可以用于执行图2所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
优选的,NoC的预期工作频率的计算公式为:
Figure BDA0002736294730000121
其中,fe表示预测的NoC工作频率,N表示NoC中NIU的数目,R表示NoC支持的请求种类数目,T表示NoC历史带宽统计数据的时间窗数目,Qn,r表示第n个NIU中第r类请求的未响应请求数目,An,r表示第n个NIU中第r类请求的权值,Pn,r,t表示第n个NIU中第r类请求在时间窗t中的带宽统计,Bn,r,t表示第n个NIU中第r类请求在时间窗t中的带宽统计的权值,C、D表示幅度系数,E表示偏置参数。
优选的,公式一中参数An,r、Bn,r,t和C、D、E根据NoC性能测试数据进行拟合得到;
其中,进行NoC性能测试时需要保证NoC处于稳定工作状态,并使NoC带宽达到当前工作频率下最大带宽;一组NoC性能测试数据包括:a)NoC当前工作频率fk;b)每个NIU中每类未响应请求个数,即N*R个测试数据RQn,r,k;c)每个NIU中每个时间窗内每类完成的请求个数,即N*R*T个测试数据RPn,r,t,k;NoC性能测试数据在NoC全工作频率范围内随机分布,且测试数据组数K远大于待拟合参数数目。
优选的,根据公式二定义的残差函数J,通过使用最速梯度下降法求得使残差函数J最小的一组参数An,r、Bn,r,t和C、D、E,即得所述公式一中参数An,r、Bn,r,t和C、D、E;
其中,
J=∑(fk-fe,k)2 公式二
Figure BDA0002736294730000122
优选的,所述调整模块13,进一步用于将NoC的工作频率调整为所述预期工作频率的m倍,1<m<1.3。
再一方面,本发明实施例提供一种CPU芯片,包括:处理器核心;
所述处理器核心,用于获取片上网络NoC的工作状态数据,所述工作状态数据包括在一段时间窗口内NIU中从设备发起的未响应请求数目、在一段时间窗口内RU中缓存的请求和响应数目、NoC历史带宽统计数据中的一种或多种;根据所述工作状态数据,计算NoC的预期工作频率;根据所述预期工作频率,调整NoC的工作频率。
本实施例的CPU芯片,可以用于执行图2所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
优选的,所述NoC的预期工作频率的计算公式为:
Figure BDA0002736294730000131
其中,fe表示预测的NoC工作频率,N表示NoC中NIU的数目,R表示NoC支持的请求种类数目,T表示NoC历史带宽统计数据的时间窗数目,Qn,r表示第n个NIU中第r类请求的未响应请求数目,An,r表示第n个NIU中第r类请求的权值,Pn,r,t表示第n个NIU中第r类请求在时间窗t中的带宽统计,Bn,r,t表示第n个NIU中第r类请求在时间窗t中的带宽统计的权值,C、D表示幅度系数,E表示偏置参数。
优选的,所述公式一中参数An,r、Bn,r,t和C、D、E根据NoC性能测试数据进行拟合得到;
其中,进行NoC性能测试时需要保证NoC处于稳定工作状态,并使NoC带宽达到当前工作频率下最大带宽;一组NoC性能测试数据包括:a)NoC当前工作频率fk;b)每个NIU中每类未响应请求个数,即N*R个测试数据RQn,r,k;c)每个NIU中每个时间窗内每类完成的请求个数,即N*R*T个测试数据RPn,r,t,k;NoC性能测试数据在NoC全工作频率范围内随机分布,且测试数据组数K远大于待拟合参数数目。
优选的,所述公式一中参数An,r、Bn,r,t和C、D、E根据NoC性能测试数据进行拟合得到,包括:
根据公式二定义的残差函数J,通过使用最速梯度下降法求得使残差函数J最小的一组参数An,r、Bn,r,t和C、D、E,即得所述公式一中参数An,r、Bn,r,t和C、D、E;
其中,
J=∑(fk-fe,k)2 公式二
Figure BDA0002736294730000141
优选的,所述根据所述预期工作频率,调整NoC的工作频率进一步为:
将NoC的工作频率调整为所述预期工作频率的m倍,1<m<1.3。
又一方面,本发明实施例还提供一种服务器,图5为本发明服务器一个实施例的结构示意图,可以实现本发明图2所示实施例的流程,如图5所示,上述服务器可以包括:壳体41、处理器42、存储器43、电路板44和电源电路45,其中,电路板44安置在壳体41围成的空间内部,处理器42和存储器43设置在电路板44上;电源电路45,用于为上述服务器的各个电路或器件供电;存储器43用于存储可执行程序代码;处理器42通过读取存储器43中存储的可执行程序代码来运行与可执行程序代码对应的程序,用于执行前述任一方法实施例所述的方法。
处理器42对上述步骤的具体执行过程以及处理器42通过运行可执行程序代码来进一步执行的步骤,可以参见本发明图2所示实施例的描述,在此不再赘述。
再一方面,为较好的实施前述降低片上网络功耗的方法,本发明实施例提供一种对硬件实体结构进行改进后的CPU芯片,如图6-7所示,该CPU芯片包括片上网络NoC、为所述NoC提供工作时钟的时钟模块、以及用于控制所述时钟模块的系统控制单元SCU,所述NoC包括若干网络接口单元NIU,每个NIU均包括未响应请求统计模块、带宽监控模块和初级运算模块;所述SCU包括二级运算模块和时钟控制模块,其中:
所述未响应请求统计模块用于统计当前时间窗口内未响应的读请求和写请求数目,具体的,统计值可记为Qn,1和Qn,2,其中n为NIU序号,n=1,2,…,6;
所述带宽监控模块用于记录最近预设数量个时间窗口内完成的读请求和写请求数目,具体的,预设数量可以为2个,时间窗口可以为10毫秒,即带宽监控模块可以分别记录之前10毫秒时间窗口内完成的读请求和写请求数目,同时保留之前一个时间窗口的记录值,分别记为Pn,1,t和Pn,2,t,其中n为NIU序号,n=1,2,…,6,t为时间窗口序号,t=1,2;
所述未响应请求统计模块和带宽监控模块的输出端连接至所述初级运算模块的输入端,所述初级运算模块用于实现公式五的运算;
NIU中实现了所述未响应请求统计模块、带宽监控模块和初级运算模块,以获取NoC的工作状态数据;通过对公式一变换,可以将部分运算工作分配给各个NIU进行,如公式四和公式五所示,初级运算模块用于计算公式五中的fniun,并将运算结果送给SCU进行下一步运算;
每个NIU的初级运算模块的输出端(即图7中所示的初级计算结果1至初级计算结果N)连接至所述二级运算模块的输入端,所述二级运算模块的输出端连接所述时钟控制模块,所述时钟控制模块的输出端控制连接所述时钟模块,所述二级运算模块用于实现公式四的运算;
Figure BDA0002736294730000151
Figure BDA0002736294730000152
其中,fe表示预测的NoC工作频率,N表示NoC中NIU的数目,R表示NoC支持的请求种类数目,T表示NoC历史带宽统计数据的时间窗数目,Qn,r表示第n个NIU中第r类请求的未响应请求数目,An,r表示第n个NIU中第r类请求的权值,Pn,r,t表示第n个NIU中第r类请求在时间窗t中的带宽统计,Bn,r,t表示第n个NIU中第r类请求在时间窗t中的带宽统计的权值,C、D表示幅度系数,E表示偏置参数。
此处,相关参数的计算、基于该结构的CPU芯片所执行的方法流程,前面已详细介绍,此处不再赘述。在图6中,请求缓存模块、路由模块、仲裁模块和响应缓存模块为NIU原有功能模块,未做改动,此处不再赘述。所述未响应请求统计模块和带宽监控模块的输入端可连接至所述请求缓存模块,以便于进行数据统计。
如图7所示,SCU中实现了二级运算模块和时钟控制模块,二级运算模块根据公式四计算NoC预期工作频率fe,时钟控制模块根据计算结果调整时钟模块输出的NoC工作时钟频率,例如调整至1.1倍的fe,实现NoC工作频率的动态调整。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。为了描述的方便,描述以上装置是以功能分为各种单元/模块分别描述。当然,在实施本发明时可以把各单元/模块的功能在同一个或多个软件和/或硬件中实现。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (17)

1.一种降低片上网络功耗的方法,其特征在于,包括:
获取片上网络NoC的工作状态数据,所述工作状态数据包括在一段时间窗口内NIU中从设备发起的未响应请求数目、在一段时间窗口内RU中缓存的请求和响应数目、NoC历史带宽统计数据中的一种或多种;
根据所述工作状态数据,计算NoC的预期工作频率;
根据所述预期工作频率,调整NoC的工作频率。
2.根据权利要求1所述的方法,其特征在于,所述NoC的预期工作频率的计算公式为:
Figure FDA0002736294720000011
其中,fe表示预测的NoC工作频率,N表示NoC中NIU的数目,R表示NoC支持的请求种类数目,T表示NoC历史带宽统计数据的时间窗数目,Qn,r表示第n个NIU中第r类请求的未响应请求数目,An,r表示第n个NIU中第r类请求的权值,Pn,r,t表示第n个NIU中第r类请求在时间窗t中的带宽统计,Bn,r,t表示第n个NIU中第r类请求在时间窗t中的带宽统计的权值,C、D表示幅度系数,E表示偏置参数。
3.根据权利要求2所述的方法,其特征在于,所述公式一中参数An,r、Bn,r,t和C、D、E根据NoC性能测试数据进行拟合得到;
其中,进行NoC性能测试时需要保证NoC处于稳定工作状态,并使NoC带宽达到当前工作频率下最大带宽;一组NoC性能测试数据包括:a)NoC当前工作频率fk;b)每个NIU中每类未响应请求个数,即N*R个测试数据RQn,r,k;c)每个NIU中每个时间窗内每类完成的请求个数,即N*R*T个测试数据RPn,r,t,k;NoC性能测试数据在NoC全工作频率范围内随机分布,且测试数据组数K远大于待拟合参数数目。
4.根据权利要求3所述的方法,其特征在于,所述公式一中参数An,r、Bn,r,t和C、D、E根据NoC性能测试数据进行拟合得到,包括:
根据公式二定义的残差函数J,通过使用最速梯度下降法求得使残差函数J最小的一组参数An,r、Bn,r,t和C、D、E,即得所述公式一中参数An,r、Bn,r,t和C、D、E;
其中,
J=∑(fk-fe,k)2 公式二
Figure FDA0002736294720000021
5.根据权利要求1-4中任一所述的方法,其特征在于,所述根据所述预期工作频率,调整NoC的工作频率进一步为:
将NoC的工作频率调整为所述预期工作频率的m倍,1<m<1.3。
6.一种降低片上网络功耗的装置,其特征在于,包括:
获取模块,用于获取片上网络NoC的工作状态数据,所述工作状态数据包括在一段时间窗口内NIU中从设备发起的未响应请求数目、在一段时间窗口内RU中缓存的请求和响应数目、NoC历史带宽统计数据中的一种或多种;
计算模块,用于根据所述工作状态数据,计算NoC的预期工作频率;
调整模块,用于根据所述预期工作频率,调整NoC的工作频率。
7.根据权利要求6所述的装置,其特征在于,所述NoC的预期工作频率的计算公式为:
Figure FDA0002736294720000022
其中,fe表示预测的NoC工作频率,N表示NoC中NIU的数目,R表示NoC支持的请求种类数目,T表示NoC历史带宽统计数据的时间窗数目,Qn,r表示第n个NIU中第r类请求的未响应请求数目,An,r表示第n个NIU中第r类请求的权值,Pn,r,t表示第n个NIU中第r类请求在时间窗t中的带宽统计,Bn,r,t表示第n个NIU中第r类请求在时间窗t中的带宽统计的权值,C、D表示幅度系数,E表示偏置参数。
8.根据权利要求7所述的装置,其特征在于,所述公式一中参数An,r、Bn,r,t和C、D、E根据NoC性能测试数据进行拟合得到;
其中,进行NoC性能测试时需要保证NoC处于稳定工作状态,并使NoC带宽达到当前工作频率下最大带宽;一组NoC性能测试数据包括:a)NoC当前工作频率fk;b)每个NIU中每类未响应请求个数,即N*R个测试数据RQn,r,k;c)每个NIU中每个时间窗内每类完成的请求个数,即N*R*T个测试数据RPn,r,t,k;NoC性能测试数据在NoC全工作频率范围内随机分布,且测试数据组数K远大于待拟合参数数目。
9.根据权利要求8所述的装置,其特征在于,所述公式一中参数An,r、Bn,r,t和C、D、E根据NoC性能测试数据进行拟合得到,包括:
根据公式二定义的残差函数J,通过使用最速梯度下降法求得使残差函数J最小的一组参数An,r、Bn,r,t和C、D、E,即得所述公式一中参数An,r、Bn,r,t和C、D、E;
其中,
J=∑(fk-fe,k)2 公式二
Figure FDA0002736294720000031
10.根据权利要求6-9中任一所述的装置,其特征在于,所述调整模块,进一步用于将NoC的工作频率调整为所述预期工作频率的m倍,1<m<1.3。
11.一种CPU芯片,其特征在于,包括:处理器核心;
所述处理器核心,用于获取片上网络NoC的工作状态数据,所述工作状态数据包括在一段时间窗口内NIU中从设备发起的未响应请求数目、在一段时间窗口内RU中缓存的请求和响应数目、NoC历史带宽统计数据中的一种或多种;根据所述工作状态数据,计算NoC的预期工作频率;根据所述预期工作频率,调整NoC的工作频率。
12.根据权利要求11所述的CPU芯片,其特征在于,所述NoC的预期工作频率的计算公式为:
Figure FDA0002736294720000032
其中,fe表示预测的NoC工作频率,N表示NoC中NIU的数目,R表示NoC支持的请求种类数目,T表示NoC历史带宽统计数据的时间窗数目,Qn,r表示第n个NIU中第r类请求的未响应请求数目,An,r表示第n个NIU中第r类请求的权值,Pn,r,t表示第n个NIU中第r类请求在时间窗t中的带宽统计,Bn,r,t表示第n个NIU中第r类请求在时间窗t中的带宽统计的权值,C、D表示幅度系数,E表示偏置参数。
13.根据权利要求12所述的CPU芯片,其特征在于,所述公式一中参数An,r、Bn,r,t和C、D、E根据NoC性能测试数据进行拟合得到;
其中,进行NoC性能测试时需要保证NoC处于稳定工作状态,并使NoC带宽达到当前工作频率下最大带宽;一组NoC性能测试数据包括:a)NoC当前工作频率fk;b)每个NIU中每类未响应请求个数,即N*R个测试数据RQn,r,k;c)每个NIU中每个时间窗内每类完成的请求个数,即N*R*T个测试数据RPn,r,t,k;NoC性能测试数据在NoC全工作频率范围内随机分布,且测试数据组数K远大于待拟合参数数目。
14.根据权利要求13所述的CPU芯片,其特征在于,所述公式一中参数An,r、Bn,r,t和C、D、E根据NoC性能测试数据进行拟合得到,包括:
根据公式二定义的残差函数J,通过使用最速梯度下降法求得使残差函数J最小的一组参数An,r、Bn,r,t和C、D、E,即得所述公式一中参数An,r、Bn,r,t和C、D、E;
其中,
J=∑(fk-fe,k)2 公式二
Figure FDA0002736294720000041
15.根据权利要求11-14中任一所述的CPU芯片,其特征在于,所述根据所述预期工作频率,调整NoC的工作频率进一步为:
将NoC的工作频率调整为所述预期工作频率的m倍,1<m<1.3。
16.一种服务器,其特征在于,包括:壳体、处理器、存储器、电路板和电源电路,其中,电路板安置在壳体围成的空间内部,处理器和存储器设置在电路板上;电源电路,用于为上述服务器的各个电路或器件供电;存储器用于存储可执行程序代码;处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,用于执行前述权利要求1-5任一所述的方法。
17.一种CPU芯片,包括片上网络NoC、为所述NoC提供工作时钟的时钟模块、以及用于控制所述时钟模块的系统控制单元SCU,所述NoC包括若干网络接口单元NIU,其特征在于,每个NIU均包括未响应请求统计模块、带宽监控模块和初级运算模块;所述SCU包括二级运算模块和时钟控制模块,其中:
所述未响应请求统计模块用于统计当前时间窗口内未响应的读请求和写请求数目,所述带宽监控模块用于记录最近预设数量个时间窗口内完成的读请求和写请求数目,所述未响应请求统计模块和带宽监控模块的输出端连接至所述初级运算模块的输入端,所述初级运算模块用于实现公式五的运算;
每个NIU的初级运算模块的输出端连接至所述二级运算模块的输入端,所述二级运算模块的输出端连接所述时钟控制模块,所述时钟控制模块的输出端控制连接所述时钟模块,所述二级运算模块用于实现公式四的运算;
Figure FDA0002736294720000051
Figure FDA0002736294720000052
其中,fe表示预测的NoC工作频率,N表示NoC中NIU的数目,R表示NoC支持的请求种类数目,T表示NoC历史带宽统计数据的时间窗数目,Qn,r表示第n个NIU中第r类请求的未响应请求数目,An,r表示第n个NIU中第r类请求的权值,Pn,r,t表示第n个NIU中第r类请求在时间窗t中的带宽统计,Bn,r,t表示第n个NIU中第r类请求在时间窗t中的带宽统计的权值,C、D表示幅度系数,E表示偏置参数。
CN202011135266.9A 2020-10-21 2020-10-21 一种降低片上网络功耗的方法、装置、cpu芯片及服务器 Active CN112363609B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011135266.9A CN112363609B (zh) 2020-10-21 2020-10-21 一种降低片上网络功耗的方法、装置、cpu芯片及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011135266.9A CN112363609B (zh) 2020-10-21 2020-10-21 一种降低片上网络功耗的方法、装置、cpu芯片及服务器

Publications (2)

Publication Number Publication Date
CN112363609A true CN112363609A (zh) 2021-02-12
CN112363609B CN112363609B (zh) 2023-03-24

Family

ID=74511507

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011135266.9A Active CN112363609B (zh) 2020-10-21 2020-10-21 一种降低片上网络功耗的方法、装置、cpu芯片及服务器

Country Status (1)

Country Link
CN (1) CN112363609B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113885691A (zh) * 2021-09-30 2022-01-04 上海商汤阡誓科技有限公司 芯片功耗调整、神经网络训练方法、装置以及芯片系统
CN114879832A (zh) * 2022-05-20 2022-08-09 昆仑芯(北京)科技有限公司 用于运算装置的功耗控制方法、装置、芯片、设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103813218A (zh) * 2012-11-15 2014-05-21 中国电信股份有限公司 动态调整光线路终端设备工作状态的方法与装置
CN105550159A (zh) * 2015-12-16 2016-05-04 广州中国科学院先进技术研究所 多核处理器片上网络的功率分配方法
CN106649192A (zh) * 2016-11-11 2017-05-10 中国人民解放军国防科学技术大学 基于预测的三维片上网络动态频率调整方法
CN110209501A (zh) * 2019-06-03 2019-09-06 Oppo广东移动通信有限公司 图形处理器的频率调整方法、装置、终端及存储介质
CN111026603A (zh) * 2019-10-25 2020-04-17 南京大学 片上网络温度预测方法及装置、设备、存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103813218A (zh) * 2012-11-15 2014-05-21 中国电信股份有限公司 动态调整光线路终端设备工作状态的方法与装置
CN105550159A (zh) * 2015-12-16 2016-05-04 广州中国科学院先进技术研究所 多核处理器片上网络的功率分配方法
CN106649192A (zh) * 2016-11-11 2017-05-10 中国人民解放军国防科学技术大学 基于预测的三维片上网络动态频率调整方法
CN110209501A (zh) * 2019-06-03 2019-09-06 Oppo广东移动通信有限公司 图形处理器的频率调整方法、装置、终端及存储介质
CN111026603A (zh) * 2019-10-25 2020-04-17 南京大学 片上网络温度预测方法及装置、设备、存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113885691A (zh) * 2021-09-30 2022-01-04 上海商汤阡誓科技有限公司 芯片功耗调整、神经网络训练方法、装置以及芯片系统
CN113885691B (zh) * 2021-09-30 2024-06-11 上海阡视科技有限公司 芯片功耗调整、神经网络训练方法、装置以及芯片系统
CN114879832A (zh) * 2022-05-20 2022-08-09 昆仑芯(北京)科技有限公司 用于运算装置的功耗控制方法、装置、芯片、设备及介质

Also Published As

Publication number Publication date
CN112363609B (zh) 2023-03-24

Similar Documents

Publication Publication Date Title
JP7234370B2 (ja) ニューラルネットワークを使用した集積回路フロアプランの生成
US7167821B2 (en) Evaluating hardware models having resource contention
CN112363609B (zh) 一种降低片上网络功耗的方法、装置、cpu芯片及服务器
WO2020062734A1 (zh) 一种存储控制方法、存储控制器、存储设备及存储系统
US20080267065A1 (en) Structure for a multi-scale network traffic generator
WO2021253817A1 (zh) 一种互联通道的调整方法、装置、系统、设备和介质
WO2010116047A1 (fr) Procédé d'optimisation du fonctionnement d'un circuit intégré multiprocesseurs, et circuit intégré correspondant
US20230112534A1 (en) Artificial intelligence planning method and real-time radio access network intelligence controller
CN112394807A (zh) 一种降低片上网络功耗的方法、装置、cpu芯片及服务器
CN110196863B (zh) 数据处理方法、装置、计算设备及存储介质
CN112306628B (zh) 一种基于多核服务器的虚拟网络功能资源管理系统
CN111723907B (zh) 一种模型训练设备、方法、系统及计算机可读存储介质
CN112363610B (zh) 一种降低片上网络功耗的方法、装置、cpu芯片及服务器
CN117155791A (zh) 基于集群拓扑结构的模型部署方法、系统、设备及介质
CN110069565A (zh) 一种分布式数据库数据批量处理的方法及装置
CN114202070B (zh) 电力数据处理方法、装置、非易失性存储介质及处理器
US10235486B2 (en) Method, apparatus and system for automatically deriving parameters for an interconnect
CN112363612B (zh) 一种降低片上网络功耗的方法、装置、cpu芯片及服务器
KR20220061835A (ko) 하드웨어 가속 장치 및 방법
CN115345100A (zh) 片上网络仿真模型及动态路径规划方法、装置、多核芯片
CN110968291B (zh) 一种基于最优树调整应用程序功能菜单的方法及装置
CN109031041B (zh) 配电网电压监测装置布点方法与系统
US11811862B1 (en) System and method for management of workload distribution
US12074769B2 (en) Transmission of telegrams by a network distributor in an automation network
CN112818561B (zh) 热管理环境模型优化方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant