CN113535386B - 一种应用于电力仪器设备的板间多运算芯片资源监控系统 - Google Patents
一种应用于电力仪器设备的板间多运算芯片资源监控系统 Download PDFInfo
- Publication number
- CN113535386B CN113535386B CN202110698558.1A CN202110698558A CN113535386B CN 113535386 B CN113535386 B CN 113535386B CN 202110698558 A CN202110698558 A CN 202110698558A CN 113535386 B CN113535386 B CN 113535386B
- Authority
- CN
- China
- Prior art keywords
- module
- chip
- board
- computing power
- single board
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/50—Indexing scheme relating to G06F9/50
- G06F2209/508—Monitor
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Power Sources (AREA)
Abstract
本发明公开的一种应用于电力仪器设备的板间多运算芯片资源监控系统,包括数据采集层、通信层和控制层,其中:所述数据采集层包括单板算力监测模块和单板芯片权重模块;所述通信层包括通信模块和数据整合模块;所述控制层包括主控模块。本发明主要用于电力仪器设备的系统上存在多个运算电路板且各个运算电路板的运算任务内容相差较大,算力需求相差较大的应用场景下。本发明为统筹调配任务内容,将各运算芯片中执行的运算内容进行平衡,以达到平衡各运算电路板算力,提高系统整体运行效率的作用。同时,还可将系统架构所需要的高性能运算芯片替换为一系列低性能运算芯片,大大降低系统成本。
Description
技术领域
本发明涉及电力仪器设备技术领域,特别涉及一种应用于电力仪器设备的板间多运算芯片资源监控系统。
背景技术
现有电力仪器设备大多采用裸机系统或简易OS系统进行运行,缺少板间系统OS,对于运行过程中的板间资源占有情况一无所知,会造成运行过程中堵塞、宕机等情况,需要一种资源监控系统来实时得知板间资源占有率情况,以得知当前系统运行状况。另外现有的情况下,在开发过程中对于板间的资源使用情况大多依靠经验进行,模块化进行,不考虑其他电路板运算芯片的算力利用问题,因此,会出现资源浪费的情况,或出现资源不足,算法无法运行的情况,需要一种资源监控系统来提高开发效率。
发明内容
本发明所要解决的技术问题在于针对现有电力仪器设备所存在的上述不足之处而提供一种应用于电力仪器设备的板间多运算芯片资源监控系统。
为了实现上述发明目的,本发明所要解决的技术问题可以通过以下技术方案来实现:
一种应用于电力仪器设备的板间多运算芯片资源监控系统,包括数据采集层、通信层和控制层,其中:
所述数据采集层包括单板算力监测模块和单板芯片权重模块,所述单板算力监测模块对于单板上的运算芯片、存储芯片进行算力资源监控,提供当前单板上各运算芯片的冗余算力信息、冗余存储资源信息和冗余IO资源信息;所述单板芯片权重模块通过所述控制层进行初始化设置,通过对于单板上各芯片所运行的计算任务进行权重处理;
所述通信层包括通信模块和数据整合模块,所述数据整合模块将所述数据采集层所采集的单板算力资源信息整合并标记时间戳,存储于单板算力资源数据库中;所述通信模块负责系统中各模块的通信工作;
所述控制层包括主控模块,所述主控模块负责向平行电力仪器设备、上下级电力仪器设备以及用户端提供本电力仪器设备各电路板的算力监控情况。
在本发明的一个优选实施例中,所述单板芯片权重模块的权重设置方式为:芯片所运行的任务占主业务逻辑任务比重越大,芯片所运行的任务越重要,其权重越高,即其需要冗余资源对该芯片的运算任务进行保护。
在本发明的一个优选实施例中,单板所消耗的总资源,最终的监控结果如下述公式所示:
S=ΣScur*l1
其中S位最终资源使用情况,Scur为各芯片的当前资源使用情况,l1为单板芯片权重模块中各芯片的权重值。
在本发明的一个优选实施例中,在所述主板需要获取相应板间算力数据的时候,将距离目前时刻最近的时间戳所对应的整合完成的单板资源信息传递给主控模块。
在本发明的一个优选实施例中,所述数据整合模块包括单板算力资源数据库和时域信号处理模块,所述时域信号处理模块通过时域信号处理方法,对于单板算力资源数据库中的前置单板算力资源信息进行时域信号分析及预测,获取各单板当前预估算力情况;将所获取各单板当前预估算力情况进行整合后传递进入所述主控模块中,并在任务池中添加一个延时任务,对于无法及时采集的数据进行重新获取采集,并及时更新至所述主控模块。
在本发明的一个优选实施例中,所述板间多运算芯片资源监控系统存在以下两种算力监控模式,第一种为定时算力监控模式,在该定时算力监控模式下,所述主控模块定时将所述数据整合模块发送算力情况信息获取请求,所述数据整合模块将距离目前最近的时间戳所对应的单板资源信息传递给主控模块;第二种为突发算力监控模式,在所述主控模块接收到来自于平行或上下级电力仪器设备的算力信息获取请求,或来自于用户的实时算力信息获取请求后所述主控模块将向数据整合模块发送实时算力情况信息获取请求;所述数据整合模块在收到该请求后,向数据采集层下发数据采集命令并获取相应信息,整合完成后上传给所述主控模块。
由于采用了如上的技术方案,本发明主要对于位于电力仪器设备中的大量数字电路板进行整体性能监控,主要包含了算力监控和存储资源监控,其中,存储资源监控主要对于电路板的数据存储资源和其IO资源监控。
本发明主要用于电力仪器设备的系统上存在多个运算电路板且各个运算电路板的运算任务内容相差较大,算力需求相差较大的应用场景下。本发明为统筹调配任务内容,将各运算芯片中执行的运算内容进行平衡,以达到平衡各运算电路板算力,提高系统整体运行效率的作用。同时,还可将系统架构所需要的高性能运算芯片替换为一系列低性能运算芯片,大大降低系统成本。
附图说明
图1为本发明应用于电力仪器设备的板间多运算芯片资源监控系统的架构示意图。
图2为本发明的数据整合模块的结构示意图。
具体实施方式
以下结合附图和具体实施方式来进一步描述本发明。
一套电力仪器系统包含了多个模拟电路板和数字电路板。位于数字电路板上还有为数众多的数字芯片,数字芯片中最重要的是运算芯片。本发明主要对于位于电力仪器系统中的大量数字电路板进行整体性能监控,主要包含了算力监控和存储资源监控。其中,存储资源监控主要对于电路板的数据存储资源和其IO资源进行监控。
本发明应用于电力仪器设备的板间多运算芯片资源监控系统运行于系统中所有数字电路板之上。
本发明应用于电力仪器设备的板间多运算芯片资源监控系统架构图如图1所示。
本发明应用于电力仪器设备的板间多运算芯片资源监控系统与电路板中正常运行的软件之间为并行运行关系,微观为时分复用关系。在本发明应用于电力仪器设备的板间多运算芯片资源监控系统的运算电路板中运行的操作系统上,本发明应用于电力仪器设备的板间多运算芯片资源监控系统与业务程序之间的关系为互不干扰的多个平行进程。且本发明应用于电力仪器设备的板间多运算芯片资源监控系统自该电路板上电初始化完成之时启动,持续运行至该电路板结束工作为止。
本发明的应用于电力仪器设备的板间多运算芯片资源监控系统,包括数据采集层10、通信层20和控制层30,其中:
数据采集层10包括单板算力监测模块11和单板芯片权重模块12,单板算力监控模块11主要负责对于单板上的运算芯片,存储芯片进行算力资源监控工作。主要提供当前单板上各运算芯片的冗余算力信息,冗余存储资源信息,冗余IO资源信息等。
单板芯片权重模块12主要通过主控模块31进行初始化设置,主要通过对于单板上各芯片所运行的计算任务进行权重处理。该权重设置方式为,芯片所运行的任务占主业务逻辑任务比重越大,芯片所运行的任务越重要,其权重越高——即其需要冗余资源对该芯片的运算任务进行保护。该单板芯片权重模块12主要作用是直观的表现芯片对于资源的需求(包含冗余资源),而非单纯的运算任务所本身所包含的资源。反映了在工程应用运行的背景下,芯片所需要的安全运行资源。
在本系统中,单板所消耗的总资源,最终的监控结果如下述公式所示:
S=ΣScur*l1
其中S为最终资源使用情况,Scur为各芯片的当前资源使用情况,l1为单板芯片权重模块12中各芯片的权重值,通过ΣSavailable*l1计算,获取单板的资源使用情况。
通信层20包括通信模块21和数据整合模块22,参见图2,数据整合模块22包括单板算力资源数据库22a和时域信号处理模块22b。
数据整合模块22主要将数据采集层10所采集的单板算力资源信息整合并标记时间戳,存储于单板算力资源数据库22a中。在主控模块31需要获取相应板间算力数据的时候,将距离目前时刻最近的时间戳所对应的整合完成的单板资源信息传递给主控模块31。
在系统运行过程中,可能存在包括但不限于通信模块阻塞,通信误码乱码,数据采集层阻塞,等意外情况导致数据采集层无法及时传递当下数据给数据整合模块22的情况。数据整合模块22中存在一个时域信号处理模块22b。该时域信号处理模块22b通过时域信号处理方法,对于单板算力资源数据库中的前置单板算力资源信息进行时域信号分析及预测,获取各单板当前预估算力情况。将上述信息进行整合后传递进入主控模块31中。并在任务池中添加一个延时任务,对于该次无法及时采集的数据进行重新获取采集,并及时更新至主控模块中。
通信模块21主要负责系统内各模块的通信工作。
控制层30包括主控模块31,主控模块31主要负责向其他平行电力仪器设备,上下级电力仪器设备,以及用户端,提供本仪器各电路板的算力监控情况。
本发明应用于电力仪器设备的板间多运算芯片资源监控系统主要存在两种算力监控模式。第一种为定时算力监控模式,在该模式下,主控模块31定时向数据整合模块22发送算力情况信息获取请求。数据整合模块22将距离目前时刻最近的时间戳所对应的单板资源信息传递给主控模块31。第二种为突发算力监控模式,在主控模块31接收到来自于平行,或上下级电力仪器设备的算力信息获取请求,或来自于用户的实时算力信息获取请求后,主控模块31将向数据请求模块22发送实时算力情况信息获取请求。数据整合模块22在收到该请求后,向数据采集层10下发数据采集命令并获取相应信息,整合完成后上传给主控模块31。
Claims (2)
1.一种应用于电力仪器设备的板间多运算芯片资源监控系统,其特征在于,包括数据采集层、通信层和控制层,其中:
所述数据采集层包括单板算力监测模块和单板芯片权重模块,所述单板算力监测模块对于单板上的运算芯片、存储芯片进行算力资源监控,提供当前单板上各运算芯片的冗余算力信息、冗余存储资源信息和冗余IO资源信息;所述单板芯片权重模块通过所述控制层进行初始化设置,通过对于单板上各芯片所运行的计算任务进行权重处理;
所述通信层包括通信模块和数据整合模块,所述数据整合模块将所述数据采集层所采集的单板算力资源信息整合并标记时间戳,存储于单板算力资源数据库中;所述通信模块负责系统中各模块的通信工作;
所述控制层包括主控模块,所述主控模块负责向平行电力仪器设备、上下级电力仪器设备以及用户端提供本电力仪器设备各电路板的算力监控情况;
所述单板芯片权重模块的权重设置方式为:芯片所运行的任务占主业务逻辑任务比重越大,芯片所运行的任务越重要,其权重越高,即其需要冗余资源对该芯片的运算任务进行保护;
单板所消耗的总资源,最终的监控结果如下述公式所示:
S=ΣScur*l1
其中S位最终资源使用情况,Scur为各芯片的当前资源使用情况,l1为单板芯片权重模块中各芯片的权重值;
在主板需要获取相应板间算力数据的时候,将距离目前时刻最近的时间戳所对应的整合完成的单板资源信息传递给主控模块;
所述数据整合模块包括单板算力资源数据库和时域信号处理模块,所述时域信号处理模块通过时域信号处理方法,对于单板算力资源数据库中的前置单板算力资源信息进行时域信号分析及预测,获取各单板当前预估算力情况;将所获取各单板当前预估算力情况进行整合后传递进入所述主控模块中,并在任务池中添加一个延时任务,对于无法及时采集的数据进行重新获取采集,并及时更新至所述主控模块。
2.根据权利要求1所述的一种应用于电力仪器设备的板间多运算芯片资源监控系统,其特征在于,所述板间多运算芯片资源监控系统存在以下两种算力监控模式,第一种为定时算力监控模式,在该定时算力监控模式下,所述主控模块定时将所述数据整合模块发送算力情况信息获取请求,所述数据整合模块将距离目前最近的时间戳所对应的单板资源信息传递给主控模块;第二种为突发算力监控模式,在所述主控模块接收到来自于平行或上下级电力仪器设备的算力信息获取请求,或来自于用户的实时算力信息获取请求后所述主控模块将向数据整合模块发送实时算力情况信息获取请求;所述数据整合模块在收到该请求后,向数据采集层下发数据采集命令并获取相应信息,整合完成后上传给所述主控模块。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110698558.1A CN113535386B (zh) | 2021-06-23 | 2021-06-23 | 一种应用于电力仪器设备的板间多运算芯片资源监控系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110698558.1A CN113535386B (zh) | 2021-06-23 | 2021-06-23 | 一种应用于电力仪器设备的板间多运算芯片资源监控系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113535386A CN113535386A (zh) | 2021-10-22 |
CN113535386B true CN113535386B (zh) | 2022-09-02 |
Family
ID=78096510
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110698558.1A Active CN113535386B (zh) | 2021-06-23 | 2021-06-23 | 一种应用于电力仪器设备的板间多运算芯片资源监控系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113535386B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115190127A (zh) * | 2022-07-08 | 2022-10-14 | 中国联合网络通信集团有限公司 | 一种算力服务的存证方法、装置及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103957413A (zh) * | 2014-01-13 | 2014-07-30 | 南京达鹏信息技术有限公司 | 一种针对移动网络视频通信应用的实时误码掩盖方法和装置 |
CN106851747A (zh) * | 2015-12-03 | 2017-06-13 | 中兴通讯股份有限公司 | 一种移动通信系统内动态资源分配方法和装置 |
CN208001290U (zh) * | 2018-02-01 | 2018-10-23 | 国网湖北省电力公司信息通信公司 | 一种多维电力通信网流量预测系统 |
CN110764904A (zh) * | 2019-09-23 | 2020-02-07 | 合肥中科类脑智能技术有限公司 | 一种基于fpga芯片的资源调度方法及系统 |
CN112162518A (zh) * | 2020-10-14 | 2021-01-01 | 河北中兴冀能电力发展有限公司 | 一种应用于电力仪器设备的单板多运算芯片算力监控系统 |
WO2021108680A1 (en) * | 2019-11-25 | 2021-06-03 | Strong Force Iot Portfolio 2016, Llc | Intelligent vibration digital twin systems and methods for industrial environments |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100342244C (zh) * | 2005-05-13 | 2007-10-10 | 武汉大学 | 一种高频地波雷达系统的远程监控系统 |
CN109857542B (zh) * | 2018-12-14 | 2021-01-29 | 贵州华芯通半导体技术有限公司 | 算力资源调节方法、系统及装置 |
CN111464336B (zh) * | 2020-03-13 | 2022-10-04 | 南京南瑞信息通信科技有限公司 | 一种基于电力通信机房高并发数据处理方法及系统 |
-
2021
- 2021-06-23 CN CN202110698558.1A patent/CN113535386B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103957413A (zh) * | 2014-01-13 | 2014-07-30 | 南京达鹏信息技术有限公司 | 一种针对移动网络视频通信应用的实时误码掩盖方法和装置 |
CN106851747A (zh) * | 2015-12-03 | 2017-06-13 | 中兴通讯股份有限公司 | 一种移动通信系统内动态资源分配方法和装置 |
CN208001290U (zh) * | 2018-02-01 | 2018-10-23 | 国网湖北省电力公司信息通信公司 | 一种多维电力通信网流量预测系统 |
CN110764904A (zh) * | 2019-09-23 | 2020-02-07 | 合肥中科类脑智能技术有限公司 | 一种基于fpga芯片的资源调度方法及系统 |
WO2021108680A1 (en) * | 2019-11-25 | 2021-06-03 | Strong Force Iot Portfolio 2016, Llc | Intelligent vibration digital twin systems and methods for industrial environments |
CN112162518A (zh) * | 2020-10-14 | 2021-01-01 | 河北中兴冀能电力发展有限公司 | 一种应用于电力仪器设备的单板多运算芯片算力监控系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113535386A (zh) | 2021-10-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101984714B1 (ko) | 가상화 자원 모니터링 시스템 | |
US7568028B2 (en) | Bottleneck detection system, measurement object server, bottleneck detection method and program | |
CN112115031B (zh) | 集群状态监控方法及装置 | |
CN102314391A (zh) | 一种基于硬件基础工具监视虚拟化系统性能的架构及方法 | |
CN113535386B (zh) | 一种应用于电力仪器设备的板间多运算芯片资源监控系统 | |
CN116244159B (zh) | 一种训练时长预测方法、装置、多元异构计算设备及介质 | |
CN114816721A (zh) | 一种基于边缘计算的多任务优化调度方法及系统 | |
CN115115030A (zh) | 系统监控方法、装置、电子设备及存储介质 | |
CN111985831A (zh) | 云计算资源的调度方法、装置、计算机设备及存储介质 | |
CN116893900B (zh) | 集群计算压力负载均衡方法、系统、设备及ic设计平台 | |
CN1286429A (zh) | 一种嵌入处理机内存的检测和监控方法 | |
CN114064261A (zh) | 基于工业边缘计算系统的多维异构资源量化方法及装置 | |
CN115495231A (zh) | 一种高并发任务复杂场景下的动态资源调度方法及系统 | |
CN116723198A (zh) | 一种多节点服务器主机控制方法、装置、设备、存储介质 | |
CN112948353B (zh) | 一种应用于DAstudio的数据分析方法、系统及存储介质 | |
Thaler et al. | Hybrid approach to hpc cluster telemetry and hardware log analytics | |
CN117499413A (zh) | 一种基于云原生架构的ai算力共享调度系统 | |
CN112162518A (zh) | 一种应用于电力仪器设备的单板多运算芯片算力监控系统 | |
CN113688125B (zh) | 基于人工智能的异常值检测方法、装置、电子设备及介质 | |
US20100011257A1 (en) | Information processing apparatus and fault processing method | |
Kim et al. | Optimizing Logging and Monitoring in Heterogeneous Cloud Environments for IoT and Edge Applications | |
CN106844021B (zh) | 计算环境资源管理系统及其管理方法 | |
CN111209102A (zh) | 一种分布式任务分发方法与系统 | |
CN118012719B (zh) | 容器运行状态监测方法、智能计算云操作系统及计算平台 | |
CN117234711B (zh) | Flink系统资源动态分配方法、系统、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |