CN111190758B - 基于fpga计算规则和rpc监控结合实现设备状态自恢复方法 - Google Patents

基于fpga计算规则和rpc监控结合实现设备状态自恢复方法 Download PDF

Info

Publication number
CN111190758B
CN111190758B CN201911315209.6A CN201911315209A CN111190758B CN 111190758 B CN111190758 B CN 111190758B CN 201911315209 A CN201911315209 A CN 201911315209A CN 111190758 B CN111190758 B CN 111190758B
Authority
CN
China
Prior art keywords
rpc
software
fpga
monitoring
monitored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911315209.6A
Other languages
English (en)
Other versions
CN111190758A (zh
Inventor
汪海洋
郏晖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Xinzhi Information Technology Co ltd
Original Assignee
Jiangsu Xinzhi Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Xinzhi Information Technology Co ltd filed Critical Jiangsu Xinzhi Information Technology Co ltd
Priority to CN201911315209.6A priority Critical patent/CN111190758B/zh
Publication of CN111190758A publication Critical patent/CN111190758A/zh
Application granted granted Critical
Publication of CN111190758B publication Critical patent/CN111190758B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • G06F11/0757Error or fault detection not based on redundancy by exceeding limits by exceeding a time limit, i.e. time-out, e.g. watchdogs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3024Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a central processing unit [CPU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/546Message passing systems or structures, e.g. queues
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/547Remote procedure calls [RPC]; Web services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/54Indexing scheme relating to G06F9/54
    • G06F2209/548Queue

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种基于FPGA计算规则和RPC监控结合实现设备状态自恢复方法。监控软件监控被监控软件,获取RPC调用信息,RPC调用使用的协议中包含有调用ID、时间信息;在被监控软件业务处理繁忙时,监控软件根据RPC调用信息计算出被监控软件的运行状况,根据RPC调用信息得到业务处理时延,即具体业务的响应时间;在被监控软件业务处理空闲时,监控软件与被监控软件之间通过空业务RPC调用来反应当前被监控软件的运行状态;监控软件通过查询FPGA中的各种流量统计数据根据FPGA计算规则得出FPGA的运行状况,达到监控FPGA运行状态。本发明避免了业务繁忙时心跳包占用业务资源的情况,监控被监控软件、FPGA的运行状态。

Description

基于FPGA计算规则和RPC监控结合实现设备状态自恢复方法
技术领域:
本发明属于FPGA与软件结合的系统的监控技术领域,特别涉及一种基于FPGA计算规则和RPC监控结合实现设备状态自恢复方法。
背景技术:
软件与FPGA相结合的系统在运行过程中难免会遇到未知错误导致业务中断,且该种类的错误中有大部分仅通过重启该软件或重新加载FPGA信息即可恢复业务的正常运行。针对软件问题,传统的软件监控方式有两种:第一种方式为被监控软件主动向监控软件发送心跳包,但该监控方式在业务繁忙状态会浪费一定的资源在心跳包的通讯上;第二种方式为监控软件主动发信息查询被监控软件是否正常工作,该监控方式同样在业务繁忙状态会造成资源的浪费。而且,上述两种方式均只能发现软件是否运行,但对软件运行状况以及业务处理时延无法进行有效的监控。针对硬件问题,目前仍未有有效的软件监控方案。
公开于该背景技术部分的信息仅仅旨在增加对本发明的总体背景的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。
发明内容:
本发明的目的在于提供一种基于FPGA计算规则和RPC监控结合实现设备状态自恢复方法,从而克服上述现有技术中的缺陷。
为实现上述目的,本发明提供了一种基于FPGA计算规则和RPC监控结合实现设备状态自恢复方法,其步骤为:
(1)监控软件监控被监控软件,获取RPC调用信息,RPC调用使用的协议中包含有调用ID、时间信息:
(2)在被监控软件业务处理繁忙时,监控软件根据RPC调用信息计算出被监控软件的运行状况,根据RPC调用信息得到业务处理时延,即具体业务的响应时间:
(3)在被监控软件业务处理空闲时,监控软件与被监控软件之间通过空业务RPC调用来反应当前被监控软件的运行状态:
(4)监控软件通过查询FPGA中的各种流量统计数据根据FPGA计算规则得出FPGA的运行状况,达到监控FPGA运行状态。
优选地,技术方案中,监控软件在进行RPC调用、FPGA检测过程中,通过线程1、线程2……线程n组成工作队列。
优选地,技术方案中,RPC调用信息包括RPC响应信息、RPC请求信息;RPC响应信息经过响应命令缓存,通过RPC计算规则得到数据记录,用于被监控软件运行状态检测;RPC请求信息经过请求命令缓存、超时检测,得到被监控软件业务响应时间。
与现有技术相比,本发明具有如下有益效果:
以监控程序与被监控软件间的RPC通信方式完成对被监控软件状态的监控,避免了业务繁忙时心跳包占用业务资源的情况。通过RPC调用信息计算得到业务处理时延,用以反应被监控软件运行状态。通过查询FPGA中数据流量信息达到监控FPGA运行状态的目的。
附图说明:
图1为本发明一种基于FPGA计算规则和RPC监控结合实现设备状态自恢复方法的工作原理示意图。
具体实施方式:
下面对本发明的具体实施方式进行详细描述,但应当理解本发明的保护范围并不受具体实施方式的限制。
除非另有其它明确表示,否则在整个说明书和权利要求书中,术语“包括”或其变换如“包含”或“包括有”等等将被理解为包括所陈述的元件或组成部分,而并未排除其它元件或其它组成部分。
实施例1
如图1所示,一种基于FPGA计算规则和RPC监控结合实现设备状态自恢复方法,其步骤为:(1)监控软件监控被监控软件,获取RPC调用信息,RPC调用使用的协议中包含有调用ID、时间信息:
(2)在被监控软件业务处理繁忙时,监控软件根据RPC调用信息计算出被监控软件的运行状况,根据RPC调用信息得到业务处理时延,即具体业务的响应时间:
(3)在被监控软件业务处理空闲时,监控软件与被监控软件之间通过空业务RPC调用来反应当前被监控软件的运行状态:
(4)监控软件通过查询FPGA中的各种流量统计数据根据FPGA计算规则得出FPGA的运行状况,达到监控FPGA运行状态。
监控软件在进行RPC调用、FPGA检测过程中,通过线程1、线程2……线程n组成工作队列。
RPC调用信息包括RPC响应信息、RPC请求信息;RPC响应信息经过响应命令缓存,通过RPC计算规则得到数据记录,用于被监控软件运行状态检测;RPC请求信息经过请求命令缓存、超时检测,得到被监控软件业务响应时间。
以监控程序与被监控软件间的RPC通信方式完成对被监控软件状态的监控,避免了业务繁忙时心跳包占用业务资源的情况。通过RPC调用信息计算得到业务处理时延,用以反应被监控软件运行状态。通过查询FPGA中数据流量信息达到监控FPGA运行状态的目的。
前述对本发明的具体示例性实施方案的描述是为了说明和例证的目的。这些描述并非想将本发明限定为所公开的精确形式,并且很显然,根据上述教导,可以进行很多改变和变化。对示例性实施例进行选择和描述的目的在于解释本发明的特定原理及其实际应用,从而使得本领域的技术人员能够实现并利用本发明的各种不同的示例性实施方案以及各种不同的选择和改变。本发明的范围意在由权利要求书及其等同形式所限定。

Claims (3)

1.一种基于FPGA计算规则和RPC监控结合实现设备状态自恢复的方法,其步骤为:(1)监控软件监控被监控软件,获取RPC调用信息,RPC调用使用的协议中包含有调用ID、时间信息;
(2)在被监控软件业务处理繁忙时,监控软件根据RPC调用信息计算出被监控软件的运行状况,根据RPC调用信息得到业务处理时延,即具体业务的响应时间;
(3)在被监控软件业务处理空闲时,监控软件与被监控软件之间通过空业务RPC调用来反应当前被监控软件的运行状态;
(4)监控软件根据FPGA中的流量统计数据判断FPGA的运行状态。
2.根据权利要求1所述的基于FPGA计算规则和RPC监控结合实现设备状态自恢复的方法,其特征在于:监控软件在进行RPC调用、FPGA检测过程中,通过线程1、线程2……线程n组成工作队列。
3.根据权利要求2所述的基于FPGA计算规则和RPC监控结合实现设备状态自恢复的方法,其特征在于:RPC调用信息包括RPC响应信息、RPC请求信息;RPC响应信息经过响应命令缓存,通过RPC计算规则得到数据记录,用于被监控软件运行状态检测;RPC请求信息经过请求命令缓存、超时检测,得到被监控软件业务响应时间。
CN201911315209.6A 2019-12-19 2019-12-19 基于fpga计算规则和rpc监控结合实现设备状态自恢复方法 Active CN111190758B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911315209.6A CN111190758B (zh) 2019-12-19 2019-12-19 基于fpga计算规则和rpc监控结合实现设备状态自恢复方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911315209.6A CN111190758B (zh) 2019-12-19 2019-12-19 基于fpga计算规则和rpc监控结合实现设备状态自恢复方法

Publications (2)

Publication Number Publication Date
CN111190758A CN111190758A (zh) 2020-05-22
CN111190758B true CN111190758B (zh) 2022-01-14

Family

ID=70707467

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911315209.6A Active CN111190758B (zh) 2019-12-19 2019-12-19 基于fpga计算规则和rpc监控结合实现设备状态自恢复方法

Country Status (1)

Country Link
CN (1) CN111190758B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111679981B (zh) * 2020-06-05 2023-08-29 广州探途网络技术有限公司 应用软件发布方法、系统及电子设备
CN112737952B (zh) * 2020-12-28 2022-08-26 Gotcex 有限公司 一种fpga业务应用层信息路由模型及其监控平台
CN116302851B (zh) * 2023-05-24 2023-08-22 北京中科网威信息技术有限公司 Fpga逻辑异常监测与恢复方法、装置、设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101668301A (zh) * 2008-09-03 2010-03-10 中兴通讯股份有限公司 一种监控短信中心内节点运行状态的方法和装置
JP2011034319A (ja) * 2009-07-31 2011-02-17 Nec Corp 端末動作状態監視システム、端末動作状態監視方法、端末動作状態監視プログラム
CN107608285A (zh) * 2017-09-01 2018-01-19 北京南凯自动化系统工程有限公司 一种综合监控系统
CN109240887A (zh) * 2018-09-04 2019-01-18 北京世纪东方通讯设备有限公司 应用程序运行状态的远程监控方法、监控端及监控服务器
CN109558366A (zh) * 2018-11-15 2019-04-02 浙江国利网安科技有限公司 一种基于多处理器架构的防火墙

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101668301A (zh) * 2008-09-03 2010-03-10 中兴通讯股份有限公司 一种监控短信中心内节点运行状态的方法和装置
JP2011034319A (ja) * 2009-07-31 2011-02-17 Nec Corp 端末動作状態監視システム、端末動作状態監視方法、端末動作状態監視プログラム
CN107608285A (zh) * 2017-09-01 2018-01-19 北京南凯自动化系统工程有限公司 一种综合监控系统
CN109240887A (zh) * 2018-09-04 2019-01-18 北京世纪东方通讯设备有限公司 应用程序运行状态的远程监控方法、监控端及监控服务器
CN109558366A (zh) * 2018-11-15 2019-04-02 浙江国利网安科技有限公司 一种基于多处理器架构的防火墙

Also Published As

Publication number Publication date
CN111190758A (zh) 2020-05-22

Similar Documents

Publication Publication Date Title
CN111190758B (zh) 基于fpga计算规则和rpc监控结合实现设备状态自恢复方法
EP3952423B1 (en) Method and device for determining terminal behavior analysis
US9634915B2 (en) Methods and computer program products for generating a model of network application health
US10404556B2 (en) Methods and computer program products for correlation analysis of network traffic in a network device
CN110858843B (zh) 业务请求处理方法、装置及计算机可读存储介质
CN106533805B (zh) 一种微服务请求处理方法、微服务控制器及微服务架构
JPS61500751A (ja) 多重プロセシングシステムのプログラムプロセスを停止するための方法
CN107864063A (zh) 一种异常监控方法、装置及电子设备
CN107360239A (zh) 一种客户端连接状态检测方法及系统
CA2706579A1 (en) Method for enabling faster recovery of client applications in the event of server failure
JP7037066B2 (ja) 評価装置、評価方法および評価プログラム
EP3531676A1 (en) Task processing apparatus, intelligent device, task processing method, and baseband processor
CN110825505B (zh) 任务调度方法、装置、计算机设备及存储介质
US20120072258A1 (en) Methods and computer program products for identifying and monitoring related business application processes
CN108306815A (zh) 一种获取消息的方法、装置、设备及计算机可读存储介质
WO2017165999A1 (zh) 网络服务实现方法、服务控制器及通信系统
CN115865734B (zh) 一种故障检测方法、数据生成方法、装置、设备及介质
CN112000544A (zh) 一种物联网设备大屏实时监控方法
CN112596924B (zh) 物联网中台服务端应用程序远程过程调用方法和系统
CN111224811A (zh) 一种snmp请求监听系统、方法、装置及计算机可读存储介质
CN108234658B (zh) 一种感知服务器集群健康状况的方法、装置和服务器
CN116132327A (zh) 一种面向dubbo调用全链路的深度监管系统及方法
CN109089281A (zh) 一种集群通信方法、终端设备及存储介质
US20160192110A1 (en) Method and Apparatus for Processing Operation on Endpoint Peripheral
CN114553944A (zh) 预警消息推送方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant