WO2021008031A1 - 基于微服务实现监控智能化的处理方法及电子装置 - Google Patents

基于微服务实现监控智能化的处理方法及电子装置 Download PDF

Info

Publication number
WO2021008031A1
WO2021008031A1 PCT/CN2019/117559 CN2019117559W WO2021008031A1 WO 2021008031 A1 WO2021008031 A1 WO 2021008031A1 CN 2019117559 W CN2019117559 W CN 2019117559W WO 2021008031 A1 WO2021008031 A1 WO 2021008031A1
Authority
WO
WIPO (PCT)
Prior art keywords
microservice
module
monitoring
modules
micro
Prior art date
Application number
PCT/CN2019/117559
Other languages
English (en)
French (fr)
Inventor
苏渊博
Original Assignee
平安普惠企业管理有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 平安普惠企业管理有限公司 filed Critical 平安普惠企业管理有限公司
Publication of WO2021008031A1 publication Critical patent/WO2021008031A1/zh

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/51Discovery or management thereof, e.g. service location protocol [SLP] or web services

Definitions

  • This application relates to the technical field of microservice architecture, and in particular to a processing method, electronic device, computer equipment, and storage medium for realizing monitoring intelligence based on microservices.
  • this application proposes a processing method based on microservices to realize monitoring intelligence, which allows monitoring information to be managed more effectively, and can also provide more convenient and effective services to the business based on this, and improve positioning efficiency.
  • the function quickly solves the health problem of the microservice module.
  • this application proposes a processing method based on microservices to realize monitoring intelligence, which is applied to an electronic device.
  • the method includes the steps of: sending a request; receiving and real-time monitoring of multiple microservice modules returned according to the request The micro-service module communication information; monitor the micro-service module health status of the multiple micro-service modules, and determine the micro-service module health status of the micro-service module according to the micro-service module communication information; when the multiple micro-service modules At least one of the first microservice modules sends an email notification when an abnormal state occurs; executes a preset emergency response mechanism according to the abnormal state of the first microservice module; and visually monitors and visually analyzes the first microservice module Communication information.
  • this application also proposes an electronic device, including an information monitoring and collection module, a health status monitoring module, an exception handling module, and a visualization monitoring module.
  • Information monitoring and collection module for receiving and real-time monitoring of micro-service module communication information of multiple micro-service modules returned according to the request
  • the health status monitoring module is used to monitor the health status of the micro service modules of the multiple micro service modules, determine the health status of the micro service modules of the micro service modules according to the communication information of the micro service modules, and act as Send an email notification when at least one of the microservice modules in an abnormal state occurs;
  • the exception handling module is used to execute a preset emergency handling mechanism according to the abnormal state of the microservice module.
  • the visual monitoring module is used to visually monitor and visually analyze the communication information of the microservice module.
  • this application also provides a computer device, including a memory, a processor, and computer-readable instructions stored in the memory and running on the processor, and the processor executes the computer-readable instructions
  • a computer device including a memory, a processor, and computer-readable instructions stored in the memory and running on the processor, and the processor executes the computer-readable instructions
  • the present application also provides a non-volatile computer-readable storage medium on which computer-readable instructions are stored.
  • the computer-readable instructions are executed by a processor, the following steps are implemented based on the microservice implementation described above:
  • the processing method of this application based on the microservices to realize the intelligent monitoring of the monitoring information can be more effective management of the monitoring information, and it can also provide more convenient and effective services to the business based on this, improve the positioning efficiency, and the intelligent functions can quickly solve the microservices Module health issues.
  • the intelligent processing of business exceptions is added.
  • the business components are independent and do not affect each other. When the obstruction or abnormality of related business processes is monitored , Will activate the resolution mechanism according to the situation, and quickly locate and resolve the business disconnection to ensure smooth business processes.
  • FIG. 1 is a schematic diagram of the hardware architecture of an electronic device according to an embodiment of the present application.
  • FIG. 2 is a functional block diagram of an electronic device according to an embodiment of the present application.
  • FIG. 3 is a flow chart of the steps of a processing method for implementing intelligent monitoring based on microservices in an embodiment of the present application
  • FIG. 4 is a detailed flowchart of step 301 in an embodiment of the present application.
  • FIG. 5 is a detailed flowchart of step 302 in an embodiment of the present application.
  • Fig. 6 is a detailed flowchart of step 303 in an embodiment of the present application.
  • FIG. 1 is a schematic diagram of the hardware architecture of an electronic device according to an embodiment of the present application.
  • the electronic device 10 includes, but is not limited to, a memory 110, a processor 120, and a processing system 130 that can realize intelligent monitoring based on microservices through a system bus.
  • FIG. 1 only shows the electronic device 10 with the components 110-130, but it should be understood that it is not required to implement all the illustrated components, and more or fewer components may be implemented instead.
  • the memory 110 includes at least one type of readable storage medium, the readable storage medium includes flash memory, hard disk, multimedia card, card type memory (for example, SD or DX memory, etc.), random access memory (RAM), static Random access memory (SRAM), read only memory (ROM), electrically erasable programmable read only memory (EEPROM), programmable read only memory (PROM), magnetic memory, magnetic disks, optical disks, etc.
  • the memory 110 may be an internal storage unit of the electronic device 10, such as a hard disk or a memory of the electronic device 10.
  • the memory may also be an external storage device of the electronic device 10, such as a plug-in hard disk equipped on the electronic device 10, a smart media card (SMC), a secure digital ( Secure Digital, SD card, Flash Card, etc.
  • the memory 110 may also include both an internal storage unit of the electronic device 100 and an external storage device thereof.
  • the memory 110 is generally used to store the operating system and various application software installed in the electronic device 10, such as the program code of the processing system 130 that implements monitoring intelligence based on microservices.
  • the memory 110 may also be used to temporarily store various types of data that have been output or will be output.
  • the processor 120 may be a central processing unit (Central Processing Unit, CPU), a controller, a microcontroller, a microprocessor, or other data processing chips.
  • the processor 120 is generally used to control the overall operation of the electronic device 10.
  • the processor 120 is configured to run the program code or process data stored in the memory 110, for example, to run the microservice-based processing system 130 for intelligent monitoring and the like.
  • Fig. 2 is a functional block diagram of an electronic device according to an embodiment of the present application.
  • the electronic device 10 (for example, the main server) in the embodiment of the present application includes an information monitoring and collection module 210, a health status monitoring module 220, an exception handling module 230, and a visualization monitoring module 240.
  • the information monitoring and collection module 210 monitors and collects the microservice module communication information of the microservice module in real time; the health status monitoring module 220 monitors the health status of the microservice module of the microservice module, and automatically sends an email notification when an abnormal state occurs; When the abnormal state occurs in the microservice module, the abnormality processing module 230 executes an intelligent emergency handling mechanism; and the visualization monitoring module 240 visually monitors the communication information of the microservice module, and performs Heuristics Analysis.
  • Skywalking is a domestic open source application performance monitoring tool that supports monitoring, tracking and diagnosis of distributed systems.
  • Skywalking can be divided into four parts as a whole: 1.
  • Skywalking Agent Use Javaagent for bytecode implantation, non-intrusive collection, and send data to Skywalking Collector through HTTP or gRPC.
  • Skywalking Collector Link data collector, which integrates, analyzes and processes the data passed by the agent and stores it in related data storage.
  • Storage Skywalking storage uses ElasticSearch, Mysql, TiDB, H2 as storage media for data storage.
  • UI Web visualization platform, used to display the landing data.
  • Information gathering tasks can be performed by Mixer and Sidecar tools.
  • Sidecar will collect relevant information from each request, such as the requested path, time, source IP, destination service, tracing header, log, etc., and request these attributes to be reported to Mixer.
  • Mixer and the back-end service are connected through an adapter, and Mixer sends the content reported by Sidecar to the back-end service through the adapter.
  • the intelligent emergency handling mechanism at least includes, but is not limited to: fuse mechanism, load balancing...
  • microservice In the microservice architecture, the microservice is to complete a single business function. The advantage of this is that it can be decoupled and each microservice can evolve independently.
  • an application may consist of multiple microservices, and the data interaction between the microservices is completed through remote procedure calls. This brings about a problem.
  • microservice A calls microservice B and microservice C, and microservice B and microservice C call other microservices. This is called "fan-out”. If the call response time of a microservice on the fan-out link is too long or unavailable, the call to microservice A will occupy more and more system resources, which will cause the system to crash, the so-called "avalanche effect.”
  • the fuse mechanism is a microservice link protection mechanism to deal with the avalanche effect. In a high-voltage circuit, if the voltage in a certain place is too high, the fuse will blow out to protect the circuit. In stock trading, if the stock index is too high, a circuit breaker mechanism will be used to suspend stock trading. Similarly, in the microservice architecture, the fuse mechanism also plays a similar role. When a certain microservice of the fan-out link is unavailable or the response time is too long, the service will be degraded, and the call of the microservice of the node will be fuse, and the wrong response information will be returned quickly. When it is detected that the microservice call response of the node is normal, the call link is restored.
  • Random algorithm randomly select one from the node list for access, and the access of each node is roughly equal. Reference implementation code.
  • Polling algorithm According to a fixed order, the available service nodes are visited one by one. A circular array is used to achieve this, the node with sequence number 0 is visited this time, the node with sequence number 1 is visited next time, and so on.
  • Weighted round-robin algorithm The round-robin algorithm guarantees that all nodes have the same probability of being visited. Based on this, the weighted round-robin algorithm gives each node a weight, so that each node has a different probability of being visited, and the node with a higher weight is visited The probability is high.
  • the number of occurrences of each node in the sequence is its weight value. For example, there are three nodes: a, b, c, and the weights are 3, 2, and 1, respectively. Then the generated sequence is ⁇ a, a, b, c, b, a ⁇ . It is necessary to make the generated sequence as uniform as possible. If the above sequence is a for the first three times, it will cause the nodes visited for the first three times to be a.
  • the least active link algorithm each visit selects the node with the least number of connections. Different nodes have different processing speeds. It can be considered that the node with the largest number of nodes has the slowest access speed.
  • Consistent hash algorithm Through a hash function, all requests from the same source are mapped to the same node. Only when this node is unavailable can it be allocated to other nodes.
  • the information monitoring and collection module 210 sends requests to the microservice modules of the second server (for example, other servers, not shown) in real time, for example, microservices, not shown, in which one management center can manage many microservices.
  • the above requests refer to HTTP requests, including GET, HEAD, POST, PUT, DELETE, etc.
  • the information monitoring and collection module 210 collects the micro-service module communication information between the first system and the micro-service module obtained through HTTP requests, and displays it on the monitoring interface of the first system (management center).
  • the microservice module communication information refers to an information header (Server Header) containing an HTTP status code to respond to a request from a browser.
  • the HTTP status code is composed of three decimal numbers. The first decimal number defines the type of the status code, and the latter two numbers have no classification function. There are 5 types of HTTP status codes, as shown in Table 1:
  • the microservice module communication information also includes the connection status between the first system (management center) and the microservice module (microservice), including: connected, disconnected, blocked, and down. Connected means that the request arrives normally; Disconnected means that the request can be received but an error is returned; Blocked means that the call is timed out; Down means that the call returns the "Bad Gateway” error message.
  • the health status monitoring module 220 monitors the health status of the microservice module (microservice) of the second server via a monitoring interface, and determines whether the microservice module has an abnormal state.
  • Monitoring methods include: (2) Monitoring of hosts includes infrastructure layer monitoring and system layer monitoring; (2) Microservice monitoring includes application layer monitoring, business monitoring, and partial end user experience monitoring; (3) End user experience monitoring Need to bury the point method to collect information to supplement and improve.
  • the abnormal state is the aforementioned disconnection, blocking and downtime.
  • the health status monitoring module 220 sends an HTTP request to the microservice module (microservice) to determine the health status (whether it is still alive) of the microservice module (microservice):
  • microservice module returns the microservice module communication information within 60 seconds and it is still alive, the return value is 200 or OK.
  • microservice module returns the communication information of the microservice module after 60 seconds, it means that the network may be blocked.
  • microservice module does not receive any response, it means that the microservice module (microservice) may be down, network congestion or system downtime.
  • the second server When an abnormal state is found (for example, the host is abnormal or the microservice module is abnormal), the second server automatically sends an email notification to the configured email address.
  • the system will default to an abnormal mail group.
  • an abnormal state When an abnormal state is found, it will automatically send a warning email to this abnormal mail group.
  • the exception handling module 230 determines the connection status between the first system (management center) and the microservice module (microservice); if a disconnection occurs, the exception handling module 230 makes the first system (management center) automatically Reconnect with the microservice module (microservice); and if there is a blocking state, send alarm information to the manager.
  • the abnormal processing module 230 automatically sends a restart command to the first server via the monitoring interface; if the aforementioned automatic processing fails, it will perform manual processing, and After the manual processing is completed, the operation instruction is recorded on the first server; and the processing strategy is dynamically adjusted according to the processing frequency. The higher the number of manual processes for the same problem, the machine will give priority to the problem next time. Each downtime information will be recorded, and the downtime, timeout, etc. caused by any reason will be displayed in a unified report.
  • Fig. 3 is a flow chart of the steps of a processing method for implementing intelligent monitoring based on microservices in an embodiment of the present application.
  • the processing method for implementing intelligent monitoring based on microservices in the embodiments of the present application includes the following four main processing steps: step 301, real-time monitoring and collecting microservice module communication information of the microservice module; step 302, monitoring the microservice module The health status of the micro-service module automatically sends an email notification when an abnormal state occurs; step 303, executes a preset intelligent emergency response mechanism according to the abnormal state of the micro-service module; and step 304, visually monitors and visually analyzes the Microservice module communication information.
  • FIG. 4 is a detailed flowchart of step 301 in an embodiment of the present application.
  • Step 401 the first system (for example, the management center, not shown) of the first server (for example, the main server, not shown) sends a request in real time to the microservice module (for example, other servers, not shown) of the second server (for example, other servers, not shown) , Microservices, not shown), where one management center can manage many microservices.
  • the first system for example, the management center, not shown
  • the microservice module for example, other servers, not shown
  • the second server for example, other servers, not shown
  • Microservices not shown
  • HTTP requests including GET, HEAD, POST, PUT, DELETE, etc.
  • Step 402 The first system (such as the management center) obtains the microservice module communication information between the first system and the microservice module (such as microservice) through HTTP request, and displays it in the first system ( Management center) monitoring interface.
  • the first system such as the management center
  • the microservice module communication information refers to an information header (Server Header) containing an HTTP status code to respond to a request from a browser.
  • the HTTP status code is composed of three decimal numbers. The first decimal number defines the type of the status code, and the latter two numbers have no classification function. There are 5 types of HTTP status codes, as shown in Table 1:
  • the micro-service module communication information also includes the connection status between the first system (management center) and the micro-service module, including: connected, disconnected, blocked, and down. Connected means that the request arrives normally; Disconnected means that the request can be received but an error is returned; Blocked means that the call is timed out; Down means that the call returns the "Bad Gateway” error message.
  • FIG. 5 is a detailed flowchart of step 302 in an embodiment of the present application.
  • Step 501 The manager monitors the health status of the microservice module (microservice) of the second server via a monitoring interface.
  • Step 502 Determine whether the microservice module has an abnormal state.
  • the abnormal state is the aforementioned disconnection, blocking and downtime.
  • the first system sends an HTTP request to the microservice module (microservice) to determine the health status (whether it is still alive) of the microservice module (microservice):
  • microservice module returns microservice module communication information within 60 seconds, indicating that it is still alive, the return value is 200 or OK.
  • microservice module returns the communication information of the microservice module after 60 seconds, it means that the network may be blocked.
  • microservice module does not receive any response, it means that the microservice module (microservice) may be down, network congestion or system downtime.
  • Step 503 When an abnormal state is found (such as a host abnormality or a microservice module abnormality), the second server automatically sends an email notification to the configured email address.
  • the system will default to an abnormal mail group.
  • a warning email When an abnormal state occurs, a warning email will be automatically sent to this abnormal mail group.
  • Fig. 6 is a detailed flowchart of step 303 in an embodiment of the present application.
  • Step 601 Determine the connection state between the first system (management center) and the microservice module (microservice).
  • Step 602 if a disconnected state occurs, the first system (management center) will automatically reconnect with the microservice module (microservice).
  • step 603 if a blocking state occurs, an alarm message is sent to the manager.
  • Step 604 If the first system (management center) is down, automatically send a restart command to the first server via the monitoring interface.
  • the aforementioned automatic processing fails, manual processing is performed, and the operation instruction is recorded on the first server after the manual processing is completed.
  • Step 605 The first system (management center) dynamically adjusts the processing strategy according to the processing frequency. The higher the number of manual processes for the same problem, the machine will give priority to the problem next time. Each downtime information will be recorded, and the downtime, timeout, etc. caused by any reason will be displayed in a unified report.
  • the intelligent processing solution for monitoring based on microservices in this application provides more effective management of monitoring information, and can also provide more convenient and effective services to the business based on this, improve positioning efficiency, and intelligent functions to quickly solve the health of microservice modules problem.
  • the intelligent processing of business exceptions is added.
  • the business components are independent and do not affect each other.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Debugging And Monitoring (AREA)
  • Computer And Data Communications (AREA)

Abstract

本申请公开了一种基于微服务实现监控智能化的处理方法,该方法包括步骤:实时监控并收集多个微服务模块的微服务模块通信信息;监控所述多个微服务模块的微服务模块健康状态,并当所述多个微服务模块中至少其中一个第一微服务模块发生异常状态时自动发送邮件通知;根据所述第一微服务模块发生的异常状态执行预设的智能应急处理机制;及视图化监控并直观分析所述第一微服务模块通信信息。本申请提供的基于微服务实现监控智能化的处理方法与电子装置让监控信息得到了更加有效的管理,也能基于此给业务提供更加方便有效的服务,提高了定位效率,智能化的功能快速解决微服务模块健康问题。

Description

基于微服务实现监控智能化的处理方法及电子装置
本申请要求于2019年7月16日提交中国专利局,专利名称为“基于微服务实现监控智能化的处理方法及电子装置”,申请号为201910639556.8的发明专利的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本申请涉及微服务架构的技术领域,尤其涉及一种基于微服务实现监控智能化的处理方法、电子装置、计算机设备及存储介质。
背景技术
现在系统一旦宕机,需要运维立马开电脑进行支持,无法达到快速响应,且很多问题都是之前处理过的,所以需要智能监控和处理。还有一些关键系统,出现任何小错就需要进行邮件通知。发明人发现,如果能在监控程序的数据分析及程序健康检查的基础上加入了业务异常智能处理,可在系统发生异常时快速回复正常状态。
发明内容
有鉴于此,本申请提出一种基于微服务实现监控智能化的处理方法让监控信息得到了更加有效的管理,也能基于此给业务提供更加方便有效的服务,提高了定位效率,智能化的功能快速解决微服务模块健康问题。
为实现上述目的,本申请提出一种基于微服务实现监控智能化的处理方法,应用于电子装置中,该方法包括步骤:发送请求;接收并实时监控根据所述请求返回的多个微服务模块的微服务模块通信信息;监控所述多个微服务模块的微服务模块健康状态,根据所述微服务模块通信信息判断微服务模块的微服务模块健康状态;当所述多个微服务模块中至少其中一个第一微服务模块发生异常状态时发送邮件通知;根据所述第一微服务模块发生的异常状态执行预 设的应急处理机制;及视图化监控并直观分析所述第一微服务模块通信信息。
为实现上述目的,本申请还提出一种电子装置,包括信息监控与收集模块、健康状态监控模块、异常处理模块与视图化监控模块。
信息监控与收集模块,用于接收并实时监控根据请求返回的多个微服务模块的微服务模块通信信息;
健康状态监控模块,用于监控所述多个微服务模块的微服务模块健康状态,根据所述微服务模块通信信息判断微服务模块的微服务模块健康状态,并当所述多个微服务模块中至少其中一个微服务模块发生异常状态时发送邮件通知;
异常处理模块,用于根据所述微服务模块发生的异常状态执行预设的应急处理机制;及
视图化监控模块,用于视图化监控并直观分析所述微服务模块通信信息。
为实现上述目的,本申请还提供一种计算机设备,包括存储器、处理器以及存储在存储器上并可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现上述基于微服务实现如下步骤:
发送请求;
接收并实时监控根据所述请求返回的多个微服务模块的微服务模块通信信息;
监控所述多个微服务模块的微服务模块健康状态,根据所述微服务模块通信信息判断微服务模块的微服务模块健康状态;
当所述多个微服务模块中至少其中一个第一微服务模块发生异常状态时发送邮件通知;
根据所述第一微服务模块发生的异常状态执行预设的应急处理机制;及
视图化监控并直观分析所述第一微服务模块通信信息。
为实现上述目的,本申请还提供非易失性计算机可读存储介质,其上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现上述基于微服务实现如下步骤:
发送请求;
接收并实时监控根据所述请求返回的多个微服务模块的微服务模块通信信息;
监控所述多个微服务模块的微服务模块健康状态,根据所述微服务模块通信信息判断微服务模块的微服务模块健康状态;
当所述多个微服务模块中至少其中一个第一微服务模块发生异常状态时发送邮件通知;
根据所述第一微服务模块发生的异常状态执行预设的应急处理机制;及
视图化监控并直观分析所述第一微服务模块通信信息。
本申请之基于微服务实现监控智能化的处理方法,对监控信息施以更加有效的管理,也能基于此给业务提供更加方便有效的服务,提高了定位效率,智能化的功能快速解决微服务模块健康问题。在监控微服务模块的数据分析及微服务模块健康检查的基础上,加入了业务异常智能处理,在微服务架构下业务组件皆为独立互不影响的,当监控到相关业务流程的阻塞或异常,会根据状况启动解决机制,业务断链快速定位及解决,保证业务流程畅通。
附图说明
图1是本申请实施例之电子装置的硬件架构示意图;
图2是本申请实施例之电子装置的功能方块图;
图3是本申请实施例之基于微服务实现监控智能化的处理方法的步骤流程图;
图4是本申请实施例之步骤301的详细流程图;
图5是本申请实施例之步骤302的详细流程图;
图6是本申请实施例之步骤303的详细流程图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实 施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,在本申请中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本申请要求的保护范围之内。
图1是本申请实施例之电子装置的硬件架构示意图。电子装置10,包括但不仅限于,可通过系统总线相互通信连接存储器110、处理器120以及基于微服务实现监控智能化的处理系统130。图1仅示出了具有组件110-130的电子装置10,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
所述存储器110至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器110可以是所述电子装置10的内部存储单元,例如该电子装置10的硬盘或内存。在另一些实施例中,所述存储器也可以是所述电子装置10的外部存储设备,例如该电子装置10上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,所述存储器110还可以既包括所述电子装置100的内部存储单元也包括其外部存储设备。本实施例中,所述存储器110通常用于存储安装于所述电子装置10的操作系统和各类应用软件,例如基于微服务实现监控智能化的处理系统130的程序代码等。此外, 所述存储器110还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器120在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器120通常用于控制所述电子装置10的总体操作。本实施例中,所述处理器120用于运行所述存储器110中存储的程序代码或者处理数据,例如,运行所述基于微服务实现监控智能化的处理系统130等。
图2是本申请实施例之电子装置的功能方块图。本申请实施例之电子装置10(例如,主服务器)包括信息监控与收集模块210、健康状态监控模块220、异常处理模块230与视图化监控模块240。
信息监控与收集模块210实时监控并收集微服务模块的微服务模块通信信息;健康状态监控模块220监控所述微服务模块的微服务模块健康状态,当发生异常状态时自动发送邮件通知;当所述微服务模块发生所述异常状态,异常处理模块230执行智能应急处理机制;及视图化监控模块240视图化监控所述微服务模块通信信息,并执行直观分析(Heuristics Analysis)。
信息监控任务可以通过Skywalking工具来执行。Skywalking是一款国内开源的应用性能监控工具,支持对分布式系统的监控、跟踪和诊断。Skywalking总体可以分为四部分:1.Skywalking Agent:使用Javaagent做字节码植入,无侵入式的收集,并通过HTTP或者gRPC方式发送数据到Skywalking Collector。2.Skywalking Collector:链路数据收集器,对agent传过来的数据进行整合分析处理并落入相关的数据存储中。3.Storage:Skywalking的存储以ElasticSearch、Mysql、TiDB、H2、作为存储介质进行数据存储。4.UI:Web可视化平台,用来展示落地的数据。
信息收集任务可以通过Mixer与Sidecar工具来执行。Sidecar会从每一次请求中收集相关信息,如请求的路径,时间,源IP,目地服务,tracing头,日志等,并请这些属性上报给Mixer。Mixer和后端服务之间是通过适配器进行连接的,Mixer将Sidecar上报的内容通过适配器发送给后端服务。
智能应急处理机制至少包括,但不限于:熔断机制、负载均衡...。
熔断机制
在微服务架构中,微服务是完成一个单一的业务功能,这样做的好处是可以做到解耦,每个微服务可以独立演进。但是,一个应用可能会有多个微服务组成,微服务之间的数据交互通过远程过程调用完成。这就带来一个问题,假设微服务A调用微服务B和微服务C,微服务B和微服务C又调用其它的微服务,这就是所谓的“扇出”。如果扇出的链路上某个微服务的调用响应时间过长或者不可用,对微服务A的调用就会占用越来越多的系统资源,进而引起系统崩溃,所谓的“雪崩效应”。
熔断机制是应对雪崩效应的一种微服务链路保护机制。高压电路中,如果某个地方的电压过高,熔断器就会熔断,对电路进行保护。股票交易中,如果股票指数过高,也会采用熔断机制,暂停股票的交易。同样,在微服务架构中,熔断机制也是起着类似的作用。当扇出链路的某个微服务不可用或者响应时间太长时,会进行服务的降级,进而熔断该节点微服务的调用,快速返回错误的响应信息。当检测到该节点微服务调用响应正常后,恢复调用链路。
负载均衡算法
随机算法:随机从节点列表中选一个进行访问,各节点访问改了大体相等。参考实现代码。
轮询算法:按照固定的顺序,把可用的服务节点,挨个访问一次。采用一个循环数组的额方式实现,本次访问序号为0的节点,下次访问序号为1的节点,依次类推。
加权轮询算法:轮询算法保证所有节点被访问的概率相同,加权轮询算法在此基础上,给每个节点一个权重,从而使每个节点被访问的概率不同,权重大的节点被访问概率大。在序列中每个节点出现的次数,就是它的权重值。比如三个节点:a、b、c,权重分别是3、2、1,那么生成的序列就是{a、a、b、c、b、a}。需要让生成的序列尽可能均与,如果上面的序列前三次都是a,就会导致前面三次访问的节点都是a。
最少活跃链接算法:每一次访问都选择连接数最少的节点,不同节点的处理请求速度不同,可以认为节点连接数最大的节点,其访问速度最慢。
一致性hash算法:通过某个hash函数,把同一个来源的请求都映射到同一个节点上。只有当这个节点不可用的时候,才可以分配到其他节点。
信息监控与收集模块210实时发送请求给第二服务器(例如,其它服务器,未显示)之微服务模块例如,微服务,未显示),其中,一个管理中心可以管理很多微服务。上述请求指的是HTTP请求,包括GET、HEAD、POST、PUT、DELETE等等。信息监控与收集模块210收集通过HTTP请求获取第一系统与所述微服务模块间的微服务模块通信信息,并显示在所述第一系统(管理中心)的监控界面。
所述微服务模块通信信息是指一个包含HTTP状态码的信息头(Server Header)用以响应浏览器的请求。所述HTTP状态码由三个十进制数字组成,第一个十进制数字定义了状态码的类型,后两个数字没有分类的作用。HTTP状态码共分为5种类型,如表1所示:
表1
Figure PCTCN2019117559-appb-000001
HTTP状态码列表如表2所示:
表2
Figure PCTCN2019117559-appb-000002
Figure PCTCN2019117559-appb-000003
所述微服务模块通信信息还包括所述第一系统(管理中心)与所述微服务模块(微服务)间的连接状态,包括:已连接、已断开、阻塞与宕机。已连接表示正常请求到;已断开表示可以请求到但是返回错误;阻塞表示调用超时;宕机表示调用返回「Bad Gateway」错误信息。
健康状态监控模块220经由监控界面监控所述第二服务器之所述微服务模块(微服务)的健康状态,并判断所述微服务模块是否发生异常状态。
监控方式包括:(2)对主机的监控包括基础设施层监控、系统层监控;(2)对微服务监控包括应用层监控、业务监控,以及部分端用户体验监控;(3)端用户体验监控需要埋点方式搜集信息补充完善。
异常状态即为前述之已断开、阻塞与宕机。健康状态监控模块220发HTTP请求给所述微服务模块(微服务),判断所述微服务模块(微服务)的健康状态(是否还存活):
1.若所述微服务模块(微服务)60秒内返回微服务模块通信信息其还活着,则返回值是200或OK。
2.若所述微服务模块(微服务)60秒后返回微服务模块通信信息,表示可能网络阻塞。
3.若所述微服务模块(微服务)没有任何回复,表示所述微服务模块(微服务)可能挂了、网络阻塞或系统宕机。
当发现异常状态时(如主机异常或微服务模块异常),所述第二服务器自动发送邮件通知给已经配置好的邮件地址邮件。系统会默认一个异常邮件组,当发现发生异常状态时,会自动发出警告邮件给这个异常邮件组。
异常处理模块230判断所述第一系统(管理中心)与所述微服务模块(微服务)间的连接状态;若出现断开状态,异常处理模块230令所述第一系统(管理中心)自动进行与所述微服务模块(微服务)重连;及若出现阻塞状态,则发送告警信息给管理人员。
例如,当发现所有的请求阻塞,且系统无法使用重启脚本进行重启的时候,查询是否是主机运行的CPU占有率过高。如果是,则查询是哪个微服务模块 (微服务)导致占有率过高,找到并停用即可。如果不是,则查询是否是线程池阻塞,如果是,则进行线程清理。
异常处理模块230于所述第一系统(管理中心)出现宕机状态时,则经由监控界面自动发送重启命令给所述第一服务器;若当前述的自动处理失败,则进行人工处理,并在人工处理完之后将操作指令纪录在所述第一服务器上;及根据处理频次进行动态调整处理策略。人工用同一个处理同一个问题的次数越高,则机器下次会优先用该方式处理问题。每次的宕机信息都会记录下来,因为什么原因导致的宕机,超时等,统一会产生一个报表展示。
图3是本申请实施例之基于微服务实现监控智能化的处理方法的步骤流程图。
本申请实施例之基于微服务实现监控智能化的处理方法包括以下4个主要处理步骤:步骤301,实时监控并收集微服务模块的微服务模块通信信息;步骤302,监控所述微服务模块的微服务模块健康状态,当发生异常状态时自动发送邮件通知;步骤303,根据所述微服务模块发生的异常状态执行预设的智能应急处理机制;及步骤304,视图化监控并直观分析所述微服务模块通信信息。
图4是本申请实施例之步骤301的详细流程图。
步骤401,第一服务器(例如,主服务器,未显示)之第一系统(例如,管理中心,未显示)实时发送请求给第二服务器(例如,其它服务器,未显示)之微服务模块(例如,微服务,未显示),其中,一个管理中心可以管理很多微服务。
上述请求指的是HTTP请求,包括GET、HEAD、POST、PUT、DELETE等等。
步骤402,所述第一系统(如管理中心)通过HTTP请求获取所述第一系统与所述微服务模块(如微服务)间的微服务模块通信信息,并显示在所述第一系统(管理中心)的监控界面。
所述微服务模块通信信息是指一个包含HTTP状态码的信息头(Server  Header)用以响应浏览器的请求。所述HTTP状态码由三个十进制数字组成,第一个十进制数字定义了状态码的类型,后两个数字没有分类的作用。HTTP状态码共分为5种类型,如表1所示:
表1
Figure PCTCN2019117559-appb-000004
HTTP状态码列表如表2所示:
表2
Figure PCTCN2019117559-appb-000005
Figure PCTCN2019117559-appb-000006
所述微服务模块通信信息还包括所述第一系统(管理中心)与所述微服务模块间的连接状态,包括:已连接、已断开、阻塞与宕机。已连接表示正常请求到;已断开表示可以请求到但是返回错误;阻塞表示调用超时;宕机表示调用返回「Bad Gateway」错误信息。
图5是本申请实施例之步骤302的详细流程图。
步骤501,管理者经由监控界面监控所述第二服务器之所述微服务模块(微服务)的健康状态。
步骤502,判断所述微服务模块是否发生异常状态。异常状态即为前述之已断开、阻塞与宕机。
所述第一系统(管理中心)发HTTP请求给所述微服务模块(微服务),判断所述微服务模块(微服务)的健康状态(是否还存活):
1.若所述微服务模块(微服务)60秒内返回微服务模块通信信息,表示其还活着,则返回值是200或OK。
2.若所述微服务模块(微服务)60秒后返回微服务模块通信信息,表示可能网络阻塞。
3.若所述微服务模块(微服务)没有任何回复,表示所述微服务模块(微服务)可能挂了、网络阻塞或系统宕机。
步骤503,当发现异常状态时(如主机异常或微服务模块异常),所述第二服务器自动发送邮件通知给已经配置好的邮件地址邮件。系统会默认一个异常邮件组,当发生异常状态时,会自动发出警告邮件给这个异常邮件组。
图6是本申请实施例之步骤303的详细流程图。
步骤601,判断所述第一系统(管理中心)与所述微服务模块(微服务)间的连接状态。
步骤602,若出现断开状态,所述第一系统(管理中心)会自动进行与所述微服务模块(微服务)重连。
步骤603,若出现阻塞状态,则发送告警信息给管理人员。
例如,当发现所有的请求阻塞,且系统无法使用重启脚本进行重启的时候,查询是否是主机运行的CPU占有率过高。如果是,则查询是哪个微服务模块(微服务)导致占有率过高,找到并停用即可。如果不是,则查询是否是线程池阻塞,如果是,则进行线程清理。
步骤604,若所述第一系统(管理中心)出现宕机状态,则经由监控界面自动发送重启命令给所述第一服务器。当前述的自动处理失败,则进行人工处理,并在人工处理完之后将操作指令纪录在所述第一服务器上。
步骤605,所述第一系统(管理中心)根据处理频次进行动态调整处理策略。人工用同一个处理同一个问题的次数越高,则机器下次会优先用该方式处理问题。每次的宕机信息都会记录下来,因为什么原因导致的宕机,超时等,统一会产生一个报表展示。
本申请之基于微服务实现监控智能化处理方案对监控信息施以更加有效 的管理,也能基于此给业务提供更加方便有效的服务,提高了定位效率,智能化的功能快速解决微服务模块健康问题。在监控微服务模块的数据分析及微服务模块健康检查的基础上,加入了业务异常智能处理,在微服务架构下业务组件皆为独立互不影响的,当监控到相关业务流程的阻塞或异常,会根据状况启动解决机制,业务断链快速定位及解决,保证业务流程畅通。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁盘、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (20)

  1. 一种基于微服务实现监控智能化的处理方法,应用于电子装置中,所述方法包括步骤:
    发送请求;
    接收并实时监控根据所述请求返回的多个微服务模块的微服务模块通信信息;
    监控所述多个微服务模块的微服务模块健康状态,根据所述微服务模块通信信息判断微服务模块的微服务模块健康状态;
    当所述多个微服务模块中至少其中一个第一微服务模块发生异常状态时发送邮件通知;
    根据所述第一微服务模块发生的异常状态执行预设的应急处理机制;及
    视图化监控并直观分析所述第一微服务模块通信信息。
  2. 如权利要求1所述的基于微服务实现监控智能化的处理方法,所述方法还包括步骤:
    自第一服务器之第一系统实时发送请求给第二服务器之第二微服务模块;及
    通过所述请求获取所述第一系统与所述第二微服务模块间的第二微服务模块通信信息,并显示在所述第一系统的监控界面。
  3. 如权利要求1所述的基于微服务实现监控智能化的处理方法,所述应急处理机包括制熔断机制,还包括步骤:
    当扇出链路的微服务不可用或者响应时间太长时,进行服务的降级,进而熔断该节点微服务的调用,快速返回错误的响应信息;及
    当检测到该节点微服务调用响应正常后,恢复调用链路。
  4. 如权利要求2所述的基于微服务实现监控智能化的处理方法,所述方法还包括步骤:
    经由所述监控界面监控所述第二服务器之所述第二微服务模块的健康状态;
    判断所述第二微服务模块是否发生异常状态;及
    当所述第二微服务模块是否发生异常状态,通过所述第二服务器自动发送警告邮件给已经配置好的邮件地址邮件。
  5. 如权利要求4所述的基于微服务实现监控智能化的处理方法,所述方法还包括步骤:
    发送所述请求给所述第二微服务模块,判断所述第二微服务模块的健康状态;
    若所述第二微服务模块在预设时间内返回微服务模块通信信息,表示所述第二微服务模块状态正常,则返回预设值或预设信息;
    若所述第二微服务模块在预设时间后返回所述第二微服务模块通信信息,表示发生网络阻塞;及
    若所述第二微服务模块没有任何回复,表示所述第二微服务模块已断开、网络阻塞或系统宕机。
  6. 如权利要求4所述的基于微服务实现监控智能化的处理方法,所述方法还包括步骤:
    判断所述第一系统与所述第二微服务模块间的连接状态;
    若出现断开状态,自动进行所述第一系统与所述微服务模块;
    若出现阻塞状态,发送告警信息给管理人员;及
    若所述第一系统出现宕机状态,则经由所述监控界面自动发送重启命令给所述第一服务器。
  7. 一种电子装置,包括:
    信息监控与收集模块,用于接收并实时监控根据请求返回的多个微服务模块的微服务模块通信信息;
    健康状态监控模块,用于监控所述多个微服务模块的微服务模块健康状态,根据所述微服务模块通信信息判断微服务模块的微服务模块健康状态,并当所述多个微服务模块中至少其中一个微服务模块发生异常状态时发送邮件通知;
    异常处理模块,用于根据所述微服务模块发生的异常状态执行预设的应急处理机制;及
    视图化监控模块,用于视图化监控并直观分析所述微服务模块通信信息。
  8. 如权利要求7所述的电子装置,应急所述处理机包括制熔断机制,所述应急处理机包括制熔断机制,还包括步骤:
    当扇出链路的微服务不可用或者响应时间太长时,进行服务的降级,进而熔断该节点微服务的调用,快速返回错误的响应信息;及
    当检测到该节点微服务调用响应正常后,恢复调用链路。
  9. 一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现如下步骤:
    发送请求;
    接收并实时监控根据所述请求返回的多个微服务模块的微服务模块通信信息;
    监控所述多个微服务模块的微服务模块健康状态,根据所述微服务模块通信信息判断微服务模块的微服务模块健康状态;
    当所述多个微服务模块中至少其中一个第一微服务模块发生异常状态时发送邮件通知;
    根据所述第一微服务模块发生的异常状态执行预设的应急处理机制;及
    视图化监控并直观分析所述第一微服务模块通信信息。
  10. 如权利要求9所述的计算机设备,所述计算机可读指令被所述处理器执行时还实现以下步骤:
    自第一服务器之第一系统实时发送请求给第二服务器之第二微服务模块;及
    通过所述请求获取所述第一系统与所述第二微服务模块间的第二微服务模块通信信息,并显示在所述第一系统的监控界面。
  11. 如权利要求9所述的计算机设备,所述计算机可读指令被所述处理器 执行时还实现以下步骤:
    当扇出链路的微服务不可用或者响应时间太长时,进行服务的降级,进而熔断该节点微服务的调用,快速返回错误的响应信息;及
    当检测到该节点微服务调用响应正常后,恢复调用链路。
  12. 如权利要求10所述的计算机设备,所述计算机可读指令被所述处理器执行时还实现以下步骤:
    经由所述监控界面监控所述第二服务器之所述第二微服务模块的健康状态;
    判断所述第二微服务模块是否发生异常状态;及
    当所述第二微服务模块是否发生异常状态,通过所述第二服务器自动发送警告邮件给已经配置好的邮件地址邮件。
  13. 如权利要求12所述的计算机设备,所述计算机可读指令被所述处理器执行时还实现以下步骤:
    发送所述请求给所述第二微服务模块,判断所述第二微服务模块的健康状态;
    若所述第二微服务模块在预设时间内返回微服务模块通信信息,表示所述第二微服务模块状态正常,则返回预设值或预设信息;
    若所述第二微服务模块在预设时间后返回所述第二微服务模块通信信息,表示发生网络阻塞;及
    若所述第二微服务模块没有任何回复,表示所述第二微服务模块已断开、网络阻塞或系统宕机。
  14. 如权利要求12所述的计算机设备,所述计算机可读指令被所述处理器执行时还实现以下步骤:
    判断所述第一系统与所述第二微服务模块间的连接状态;
    若出现断开状态,自动进行所述第一系统与所述微服务模块;
    若出现阻塞状态,发送告警信息给管理人员;及
    若所述第一系统出现宕机状态,则经由所述监控界面自动发送重启命令给 所述第一服务器。
  15. 一种非易失性计算机可读存储介质,其上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如下步骤:
    发送请求;
    接收并实时监控根据所述请求返回的多个微服务模块的微服务模块通信信息;
    监控所述多个微服务模块的微服务模块健康状态,根据所述微服务模块通信信息判断微服务模块的微服务模块健康状态;
    当所述多个微服务模块中至少其中一个第一微服务模块发生异常状态时发送邮件通知;
    根据所述第一微服务模块发生的异常状态执行预设的应急处理机制;及
    视图化监控并直观分析所述第一微服务模块通信信息。
  16. 如权利要求15所述的非易失性计算机可读存储介质,所述计算机可读指令被所述处理器执行时还实现以下步骤:
    自第一服务器之第一系统实时发送请求给第二服务器之第二微服务模块;及
    通过所述请求获取所述第一系统与所述第二微服务模块间的第二微服务模块通信信息,并显示在所述第一系统的监控界面。
  17. 如权利要求15所述的非易失性计算机可读存储介质,所述计算机可读指令被所述处理器执行时还实现以下步骤:
    当扇出链路的微服务不可用或者响应时间太长时,进行服务的降级,进而熔断该节点微服务的调用,快速返回错误的响应信息;及
    当检测到该节点微服务调用响应正常后,恢复调用链路。
  18. 如权利要求16所述的非易失性计算机可读存储介质,所述计算机可读指令被所述处理器执行时还实现以下步骤:
    经由所述监控界面监控所述第二服务器之所述第二微服务模块的健康状态;
    判断所述第二微服务模块是否发生异常状态;及
    当所述第二微服务模块是否发生异常状态,通过所述第二服务器自动发送警告邮件给已经配置好的邮件地址邮件。
  19. 如权利要求18所述的非易失性计算机可读存储介质,所述计算机可读指令被所述处理器执行时还实现以下步骤:
    发送所述请求给所述第二微服务模块,判断所述第二微服务模块的健康状态;
    若所述第二微服务模块在预设时间内返回微服务模块通信信息,表示所述第二微服务模块状态正常,则返回预设值或预设信息;
    若所述第二微服务模块在预设时间后返回所述第二微服务模块通信信息,表示发生网络阻塞;及
    若所述第二微服务模块没有任何回复,表示所述第二微服务模块已断开、网络阻塞或系统宕机。
  20. 如权利要求18所述的非易失性计算机可读存储介质,所述计算机可读指令被所述处理器执行时还实现以下步骤:
    判断所述第一系统与所述第二微服务模块间的连接状态;
    若出现断开状态,自动进行所述第一系统与所述微服务模块;
    若出现阻塞状态,发送告警信息给管理人员;及
    若所述第一系统出现宕机状态,则经由所述监控界面自动发送重启命令给所述第一服务器。
PCT/CN2019/117559 2019-07-16 2019-11-12 基于微服务实现监控智能化的处理方法及电子装置 WO2021008031A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201910639556.8A CN110535902A (zh) 2019-07-16 2019-07-16 基于微服务实现监控智能化的处理方法及电子装置
CN201910639556.8 2019-07-16

Publications (1)

Publication Number Publication Date
WO2021008031A1 true WO2021008031A1 (zh) 2021-01-21

Family

ID=68660261

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2019/117559 WO2021008031A1 (zh) 2019-07-16 2019-11-12 基于微服务实现监控智能化的处理方法及电子装置

Country Status (2)

Country Link
CN (1) CN110535902A (zh)
WO (1) WO2021008031A1 (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112817727A (zh) * 2021-02-08 2021-05-18 上海百胜软件股份有限公司 基于微服务架构的任务管理方法、系统、设备和存储介质
CN113162799A (zh) * 2021-03-09 2021-07-23 北京字跳网络技术有限公司 故障定位方法、装置、电子设备、定位系统及存储介质
CN113419852A (zh) * 2021-06-22 2021-09-21 康键信息技术(深圳)有限公司 微服务的请求响应方法、装置、设备及存储介质
CN113810379A (zh) * 2021-08-23 2021-12-17 深圳价值在线信息科技股份有限公司 一种异常处理方法及多服务系统
CN113938374A (zh) * 2021-12-20 2022-01-14 飞狐信息技术(天津)有限公司 一种监控仪表盘的处理方法及装置
CN114205422A (zh) * 2021-12-13 2022-03-18 平安养老保险股份有限公司 一种无侵入式业务处理方法、装置、设备及存储介质
CN114697192A (zh) * 2022-03-16 2022-07-01 浪潮云信息技术股份公司 一种基于Skywalking的应用性能指标告警系统
CN114706733A (zh) * 2022-05-30 2022-07-05 支付宝(杭州)信息技术有限公司 切面程序异常的监控方法和装置
CN114745295A (zh) * 2022-04-19 2022-07-12 京东科技控股股份有限公司 数据采集方法、装置、设备和可读存储介质
CN114866606A (zh) * 2022-04-21 2022-08-05 彩讯科技股份有限公司 一种微服务管理系统
CN115037653A (zh) * 2022-06-28 2022-09-09 北京奇艺世纪科技有限公司 业务流量监控方法、装置、电子设备和存储介质
CN115277475A (zh) * 2022-07-05 2022-11-01 浪潮云信息技术股份公司 一种api网关实现链路跟踪的方法及系统
CN115296980A (zh) * 2022-08-02 2022-11-04 国家电网有限公司客户服务中心 基于Skywalking的告警方法及相关设备
CN115314559A (zh) * 2022-08-03 2022-11-08 苏州创意云网络科技有限公司 网络服务系统及其异常响应方法
CN115766786A (zh) * 2022-11-11 2023-03-07 四川启睿克科技有限公司 一种智能家电终端业务异常的排查系统及方法
CN116302862A (zh) * 2023-05-18 2023-06-23 浙江华东工程数字技术有限公司 一种微服务架构下监控告警方法和系统
WO2023125773A1 (zh) * 2021-12-30 2023-07-06 网络通信与安全紫金山实验室 大规模微服务集群场景下的全局异常处理方法和平台
CN116611749A (zh) * 2023-02-13 2023-08-18 国家电投集团数字科技有限公司 一种基于微服务架构的电力数据智能录入方法及系统
CN116737515A (zh) * 2023-05-10 2023-09-12 珠海妙存科技有限公司 闪存参数可视化方法、系统及存储介质
US11870858B2 (en) 2022-02-01 2024-01-09 International Business Machines Corporation Intelligent, fast-forwarded health checks within service mesh

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111262898B (zh) * 2018-12-01 2022-06-14 阿里巴巴集团控股有限公司 服务降级处理方法、装置及电子设备
CN111045648B (zh) * 2019-12-11 2024-03-15 盈佳云创科技(深圳)有限公司 一种微服务开发装置
CN111181777B (zh) * 2019-12-17 2022-09-20 深圳前海环融联易信息科技服务有限公司 一种服务降级的方法、装置、计算机设备及存储介质
CN111130939B (zh) * 2019-12-26 2021-09-10 深圳前海环融联易信息科技服务有限公司 一种流量控制方法、装置、计算机设备及存储介质
CN111158987B (zh) * 2019-12-31 2023-09-19 中国银行股份有限公司 微服务架构的健康检查方法及装置
CN111176955A (zh) * 2020-01-07 2020-05-19 深圳壹账通智能科技有限公司 微服务的监控方法、装置、设备及计算机可读存储介质
CN111427557A (zh) * 2020-04-06 2020-07-17 中信银行股份有限公司 应用微服务化方法、装置、电子设备及可读存储介质
CN111581576B (zh) * 2020-05-08 2024-04-02 湖南蚁坊软件股份有限公司 基于微服务的开发处理方法、装置及存储介质
CN111756601B (zh) * 2020-06-24 2023-02-03 中国平安财产保险股份有限公司 微服务架构监控方法、装置、计算机设备及可读存储介质
CN111541590B (zh) * 2020-07-08 2020-11-06 广州市玄武无线科技股份有限公司 链路监控方法、告警方法、系统、终端及存储介质
CN114915647B (zh) * 2021-01-28 2023-08-29 复旦大学 基于微服务的前沿装备远程互动体验系统
CN113704052B (zh) * 2021-07-21 2023-09-22 郑州云海信息技术有限公司 一种微服务架构的运维系统、方法、设备及介质
CN114363091B (zh) * 2022-03-02 2022-11-15 工业互联网创新中心(上海)有限公司 一种基于apisix实现平台应用统一登录的方法及系统
CN115174422A (zh) * 2022-06-29 2022-10-11 深圳市华宇讯科技有限公司 微服务治理方法及装置
CN117251337B (zh) * 2023-09-07 2024-05-28 广州宇中网络科技有限公司 微服务健康拨测方法、装置、设备及存储介质
CN116980480B (zh) * 2023-09-25 2024-02-27 上海伊邦医药信息科技股份有限公司 基于微服务网络模型的熔断信息的处理方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108512689A (zh) * 2017-12-15 2018-09-07 中国平安财产保险股份有限公司 微服务业务监控方法及服务器
CN108712309A (zh) * 2018-06-11 2018-10-26 郑州云海信息技术有限公司 一种微服务架构下的微服务节点防护方法和系统
CN108845910A (zh) * 2018-05-31 2018-11-20 康键信息技术(深圳)有限公司 大规模微服务系统的监控方法、装置及存储介质
CN109818776A (zh) * 2018-12-17 2019-05-28 视联动力信息技术股份有限公司 微服务模块异常定位方法和装置
US20190207954A1 (en) * 2018-01-02 2019-07-04 ShieldX Networks, Inc. Systems and methods for evaluating encrypted data packets in a networked environment

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10484410B2 (en) * 2017-07-19 2019-11-19 Cisco Technology, Inc. Anomaly detection for micro-service communications
CN109976935B (zh) * 2019-03-14 2020-09-04 北京三快在线科技有限公司 微服务架构、微服务节点及其熔断恢复方法、装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108512689A (zh) * 2017-12-15 2018-09-07 中国平安财产保险股份有限公司 微服务业务监控方法及服务器
US20190207954A1 (en) * 2018-01-02 2019-07-04 ShieldX Networks, Inc. Systems and methods for evaluating encrypted data packets in a networked environment
CN108845910A (zh) * 2018-05-31 2018-11-20 康键信息技术(深圳)有限公司 大规模微服务系统的监控方法、装置及存储介质
CN108712309A (zh) * 2018-06-11 2018-10-26 郑州云海信息技术有限公司 一种微服务架构下的微服务节点防护方法和系统
CN109818776A (zh) * 2018-12-17 2019-05-28 视联动力信息技术股份有限公司 微服务模块异常定位方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
DING XUE-YING, LIU DI, QIU ZHEN: "Design and Implementation of Application Monitoring System Based on Micro Service Architecture", ELECTRIC POWER INFORMATION AND COMMUNICATION TECHNOLOGY, vol. 16, no. 7, 15 July 2018 (2018-07-15), pages 75 - 79, XP055773352, ISSN: 2095-641X, DOI: 10.16543/j.2095-641x.electric.power.ict.2018.07.013 *
MAYER BENJAMIN; WEINREICH RAINER: "A Dashboard for Microservice Monitoring and Management", 2017 IEEE INTERNATIONAL CONFERENCE ON SOFTWARE ARCHITECTURE WORKSHOPS (ICSAW), 5 April 2017 (2017-04-05), pages 66 - 69, XP033107990, DOI: 10.1109/ICSAW.2017.44 *

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112817727A (zh) * 2021-02-08 2021-05-18 上海百胜软件股份有限公司 基于微服务架构的任务管理方法、系统、设备和存储介质
CN113162799A (zh) * 2021-03-09 2021-07-23 北京字跳网络技术有限公司 故障定位方法、装置、电子设备、定位系统及存储介质
CN113162799B (zh) * 2021-03-09 2023-01-24 北京字跳网络技术有限公司 故障定位方法、装置、电子设备、定位系统及存储介质
CN113419852B (zh) * 2021-06-22 2023-10-20 康键信息技术(深圳)有限公司 微服务的请求响应方法、装置、设备及存储介质
CN113419852A (zh) * 2021-06-22 2021-09-21 康键信息技术(深圳)有限公司 微服务的请求响应方法、装置、设备及存储介质
CN113810379A (zh) * 2021-08-23 2021-12-17 深圳价值在线信息科技股份有限公司 一种异常处理方法及多服务系统
CN114205422A (zh) * 2021-12-13 2022-03-18 平安养老保险股份有限公司 一种无侵入式业务处理方法、装置、设备及存储介质
CN114205422B (zh) * 2021-12-13 2023-07-25 平安养老保险股份有限公司 一种无侵入式业务处理方法、装置、设备及存储介质
CN113938374A (zh) * 2021-12-20 2022-01-14 飞狐信息技术(天津)有限公司 一种监控仪表盘的处理方法及装置
WO2023125773A1 (zh) * 2021-12-30 2023-07-06 网络通信与安全紫金山实验室 大规模微服务集群场景下的全局异常处理方法和平台
US11870858B2 (en) 2022-02-01 2024-01-09 International Business Machines Corporation Intelligent, fast-forwarded health checks within service mesh
CN114697192A (zh) * 2022-03-16 2022-07-01 浪潮云信息技术股份公司 一种基于Skywalking的应用性能指标告警系统
CN114745295A (zh) * 2022-04-19 2022-07-12 京东科技控股股份有限公司 数据采集方法、装置、设备和可读存储介质
CN114866606A (zh) * 2022-04-21 2022-08-05 彩讯科技股份有限公司 一种微服务管理系统
CN114706733A (zh) * 2022-05-30 2022-07-05 支付宝(杭州)信息技术有限公司 切面程序异常的监控方法和装置
CN115037653B (zh) * 2022-06-28 2023-10-13 北京奇艺世纪科技有限公司 业务流量监控方法、装置、电子设备和存储介质
CN115037653A (zh) * 2022-06-28 2022-09-09 北京奇艺世纪科技有限公司 业务流量监控方法、装置、电子设备和存储介质
CN115277475A (zh) * 2022-07-05 2022-11-01 浪潮云信息技术股份公司 一种api网关实现链路跟踪的方法及系统
CN115296980A (zh) * 2022-08-02 2022-11-04 国家电网有限公司客户服务中心 基于Skywalking的告警方法及相关设备
CN115314559B (zh) * 2022-08-03 2023-09-29 苏州创意云网络科技有限公司 网络服务系统及其异常响应方法、服务单元、调度处理单元、电子设备及计算机存储介质
CN115314559A (zh) * 2022-08-03 2022-11-08 苏州创意云网络科技有限公司 网络服务系统及其异常响应方法
CN115766786A (zh) * 2022-11-11 2023-03-07 四川启睿克科技有限公司 一种智能家电终端业务异常的排查系统及方法
CN115766786B (zh) * 2022-11-11 2024-05-14 四川启睿克科技有限公司 一种智能家电终端业务异常的排查系统及方法
CN116611749A (zh) * 2023-02-13 2023-08-18 国家电投集团数字科技有限公司 一种基于微服务架构的电力数据智能录入方法及系统
CN116611749B (zh) * 2023-02-13 2023-10-20 国家电投集团数字科技有限公司 一种基于微服务架构的电力数据智能录入方法及系统
CN116737515A (zh) * 2023-05-10 2023-09-12 珠海妙存科技有限公司 闪存参数可视化方法、系统及存储介质
CN116737515B (zh) * 2023-05-10 2024-02-23 珠海妙存科技有限公司 闪存参数可视化方法、系统及存储介质
CN116302862B (zh) * 2023-05-18 2023-08-11 浙江华东工程数字技术有限公司 一种微服务架构下监控告警方法和系统
CN116302862A (zh) * 2023-05-18 2023-06-23 浙江华东工程数字技术有限公司 一种微服务架构下监控告警方法和系统

Also Published As

Publication number Publication date
CN110535902A (zh) 2019-12-03

Similar Documents

Publication Publication Date Title
WO2021008031A1 (zh) 基于微服务实现监控智能化的处理方法及电子装置
US10348809B2 (en) Naming of distributed business transactions
CN108039964B (zh) 基于网络功能虚拟化的故障处理方法及装置、系统
US7685269B1 (en) Service-level monitoring for storage applications
US9413597B2 (en) Method and system for providing aggregated network alarms
US10868709B2 (en) Determining the health of other nodes in a same cluster based on physical link information
US8443078B2 (en) Method of determining equivalent subsets of agents to gather information for a fabric
CN109039787A (zh) 日志处理方法、装置及大数据集群
CN112596975A (zh) 对网络设备进行监控处理的方法、系统、设备和存储介质
CN113067875A (zh) 基于微服务网关动态流控的访问方法和装置以及设备
JP2013222313A (ja) 障害連絡効率化システム
CN112910733A (zh) 一种基于大数据的全链路监控系统及方法
CN110569238B (zh) 一种基于大数据的数据治理方法、系统、存储介质和服务端
US20060053021A1 (en) Method for monitoring and managing an information system
CN117370053A (zh) 一种面向信息系统业务运行全景监测方法及系统
CN113760634A (zh) 一种数据处理方法和装置
CN110569178A (zh) 基于大数据平台的接口预警方法和系统
CN112214437B (zh) 一种存储设备及通信方法、装置、计算机可读存储介质
KR20230055575A (ko) 사설망과 공용망을 위한 범용 대규모 멀티 클라우드 환경 모니터링 시스템 및 방법
CN114090293A (zh) 一种服务提供方法及电子设备
JP2018169643A (ja) セキュリティ運用システム、セキュリティ運用管理装置およびセキュリティ運用方法
CN115987827B (zh) 一种设备监测方法、装置、电子设备及可读介质
CN113722142B (zh) 内存不足的原因分析方法、装置、电子设备及存储介质
CN110752939A (zh) 一种业务进程故障处理方法、通知方法和装置
EP4270183A1 (en) Public cloud tenant service management method and device

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19937717

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19937717

Country of ref document: EP

Kind code of ref document: A1

122 Ep: pct application non-entry in european phase

Ref document number: 19937717

Country of ref document: EP

Kind code of ref document: A1

32PN Ep: public notification in the ep bulletin as address of the adressee cannot be established

Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205A DATED 21/09/2022)

122 Ep: pct application non-entry in european phase

Ref document number: 19937717

Country of ref document: EP

Kind code of ref document: A1