WO2012119388A1 - 通信系统中节点设备上配置的服务故障的处理方法及装置 - Google Patents

通信系统中节点设备上配置的服务故障的处理方法及装置 Download PDF

Info

Publication number
WO2012119388A1
WO2012119388A1 PCT/CN2011/078372 CN2011078372W WO2012119388A1 WO 2012119388 A1 WO2012119388 A1 WO 2012119388A1 CN 2011078372 W CN2011078372 W CN 2011078372W WO 2012119388 A1 WO2012119388 A1 WO 2012119388A1
Authority
WO
WIPO (PCT)
Prior art keywords
service
node device
primary
backup
standby
Prior art date
Application number
PCT/CN2011/078372
Other languages
English (en)
French (fr)
Inventor
陆学锋
张烽
Original Assignee
华为技术有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 华为技术有限公司 filed Critical 华为技术有限公司
Priority to PCT/CN2011/078372 priority Critical patent/WO2012119388A1/zh
Priority to CN201180001567.5A priority patent/CN102349266B/zh
Publication of WO2012119388A1 publication Critical patent/WO2012119388A1/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0668Management of faults, events, alarms or notifications using network fault recovery by dynamic selection of recovery network elements, e.g. replacement by the most appropriate element after failure

Definitions

  • the embodiments of the present invention relate to information processing technologies, and in particular, to a method and an apparatus for processing service faults configured on a node device in a communication system. Background technique
  • a service configured on a plurality of node devices adopts a 1+1 primary backup mode, and configures a service's primary service and backup service separately.
  • the primary service runs to perform the service processing, and backs up the service data of the primary service to the standby server.
  • node device For example: node device
  • the service data of the primary service is backed up to the backup service configured on the node device B.
  • the backup service is upgraded as the primary service, because the upgrade is the original backup of the primary service.
  • the service backup has business data, so the upgraded primary service can continue to process the business.
  • the embodiments of the present invention provide a method and a device for processing a service fault configured on a node device in a communication system, so as to improve CPU utilization of the node device.
  • An aspect of the present invention provides a method for processing a service fault configured on a node device in a communication system, where the communication system includes a first node device, a second node device, and a third node device;
  • the primary service of the first service and the first backup service of the second service Configuring a primary service of the second service and a first standby service of the first service on the second node device, where the second standby service of the first service and the second standby service of the second service are configured on the third node device;
  • the primary service of the first service backs up the service data of the first service to the first backup service of the first service, and the primary service of the second service backs up the service data of the second service.
  • a first backup service to the second service the method includes:
  • the primary service of the first service configured on the third node device obtains the service data of the backup first service from the first backup service of the first service configured on the second node device, and performs service deal with.
  • Another aspect of the present invention provides a processing device for a service failure configured on a node device in a communication system, where the communication system includes a first node device, a second node device, and a third node device; Configuring a primary service of the first service and a first standby service of the second service, where the primary service of the second service and the first standby service of the first service are configured on the second node device Configuring a second standby service of the first service and a second standby service of the second service; wherein, the primary service of the first service backs up the service data of the first service to the first standby service of the first service The primary service of the second service backs up the service data of the second service to the first backup service of the second service; the device includes:
  • a monitoring unit configured to detect an active status of the primary service of the first service and the primary service of the second service, where the working status includes a normal and a fault
  • An arbitration unit configured to: when the monitoring unit detects that the primary service of the first service is faulty, configure the first service configured on the second node device according to remaining CPU processing capability of the second node device
  • the first standby service is configured as a primary service, so that the primary service of the first service configured on the second node device performs service processing; or
  • the primary service of the first service configured on the third node device obtains the service data of the backup first service from the first backup service of the first service configured on the second node device, and performs service deal with.
  • an embodiment of the present invention can configure one primary service and two backup services by using each service, where the primary service of the first service and one standby service of the second service are configured on the first node device.
  • the primary service of the first service and the primary service of the second service are configured to the second node device, the other backup service of the first service and the other backup service of the second service are configured to the third node device, and
  • the active service backs up the corresponding service data to the backup service on the cross-configuration node device (ie, the first node device or the second node device), so that the primary service of the first service configured on the first node device
  • the backup service of the service configured on one of the other two node devices ie, the second node device and the third node device
  • the service processing can be continued, which can be avoided.
  • FIG. 1 is a schematic flowchart of a method for processing a service fault configured on a node device in a communication system according to an embodiment of the present invention
  • FIG. 2 is a schematic diagram of process configuration on a node device in the embodiment corresponding to FIG. 1;
  • FIG. 3 is a schematic flowchart of a method for processing a fault of a process A (A) of the process A of the process A configured on the node device 1 shown in FIG. 2;
  • FIG. 4 is another schematic flowchart of a method for processing a fault of a process A (A) of the process A of the process A configured on the node device 1 shown in FIG. 2;
  • FIG. 5 is another schematic flowchart of a method for processing a fault of the main process Process A(A) of the process A configured on the node device 1 shown in FIG. 2;
  • FIG. 6 is a schematic structural diagram of a device for processing a service fault configured on a node device in a communication system according to another embodiment of the present invention. detailed description
  • GSM Global System for Mobile Communications
  • GPRS General Packet Radio Service
  • code division multiple access Code Division Multiple Access, CDMA for short
  • WCDMA Wi-band Code Division Multiple Access
  • TD-SCDMA Time Division-Synchronous Code Division Multiple Access
  • LTE Long Term Evolution
  • the node device may be a Base Transceiver Station (BTS), a Base Station (NodeB), an Evolutionary Node B (eNB or eNodeB), a Base Station Controller (BSC), and a wireless network control.
  • BTS Base Transceiver Station
  • NodeB Base Station
  • eNB or eNodeB Evolutionary Node B
  • BSC Base Station Controller
  • RNC Rad io Network Controller
  • GPRS General Packet Radio Service
  • Server GPRS Support Node Serving GPRS Support Node, SGSN for short
  • MSC Mobile Switching Center
  • Network elements such as a Mobility Management Entity (MME), a Gateway GPRS Supporting Node (GGSN), and a Packet Data Network Gateway (P-GW).
  • MME Mobility Management Entity
  • GGSN Gateway GPRS Supporting Node
  • P-GW Packet Data Network Gateway
  • the service involved in the embodiment of the present invention can be run on a node device, which can be understood as a functional unit for completing a specified service.
  • services can include, but are not limited to, threads, processes, process groups, or virtual machines.
  • the bill management process running on the MSC is used to format the obtained bill data, form a bill file, and send the bill file to the billing center.
  • the primary service indicates that the service can process the service, and the standby service indicates that the process cannot temporarily handle the service. When the primary process fails, the standby process can be configured as the primary process to process the service.
  • the communication system involved in the embodiments of the present invention may include a first node device, a second node device, and a third node device.
  • the first node device configures the primary service of the first service and the first standby service of the second service
  • the second node device configures the primary service of the second service and the first standby service of the first service
  • the third A second standby service of the first service and a second standby service of the second service are configured on the node device.
  • the foregoing node device may be configured by using an Operation and Maintenance System (OMS).
  • OMS Operation and Maintenance System
  • the primary service of the first service backs up the service data of the first service to the first backup service of the first service, and the primary service of the second service serves the second service.
  • the business data is backed up to the first alternate service of the second service. It should be noted that: because the primary service of the first service only backs up the service data of the first service to the first backup service of the first service, the primary service of the second service only serves the service data of the second service.
  • the state of the first standby service in the embodiment of the present invention is the standby state (the service data of the corresponding service is backed up), and the state of the second standby service is the mutual assistance state. (The business data of the corresponding service is not backed up).
  • FIG. 1 is a schematic flowchart of a method for processing a service fault configured on a node device in a communication system according to an embodiment of the present invention.
  • a method for processing a service fault configured on a node device in a communication system according to this embodiment Can include:
  • the working status of the active service involved in the embodiment of the present invention is normal, and it can be understood that the primary service can operate normally, or the service can be processed normally; the working state of the primary service is faulty, and it can be understood that the primary service cannot be normal. Run, or can't handle business normally.
  • the first backup service of the first service configured on the second node device is configured as a main service according to the remaining CPU processing capability of the second node device, so that the primary service of the first service configured on the second node device is performed.
  • the primary service of the configured first service obtains the service data of the backed first service from the first backup service of the first service configured on the second node device, and performs service processing.
  • the execution body of 101 and 102 may be an entity, for example: monitoring the arbitration unit, or may also be several entities, for example: one part is completed by the monitoring unit, and the other part is completed by the arbitration unit, and the two complete the entire processing flow through interaction,
  • entity for example: monitoring the arbitration unit, or may also be several entities, for example: one part is completed by the monitoring unit, and the other part is completed by the arbitration unit, and the two complete the entire processing flow through interaction, The embodiment of the invention does not limit this.
  • the second node device has a CPU processing capability corresponding to the primary service of the first service, and if yes, the first backup service of the first service configured on the second node device is configured.
  • Set as the primary service if not, continue to determine whether the third node device has the CPU processing capability corresponding to the primary service of the first service, and if so, the second standby of the first service configured on the third node device
  • the service is configured as a service for the primary service, so that the primary service of the first service configured on the third node device obtains the service data of the first service of the backup service from the first backup service of the first service configured on the second node device, and Perform business processing.
  • the remaining CPU processing capability of the second node device may be determined according to the obtained CPU usage of the second node device, and then it is determined whether the remaining CPU processing capability of the second node device is greater than the primary service corresponding to the first service. If the CPU processing capability is greater than, the first standby service of the first service configured on the second node device is configured as a primary service; if not, the CPU may continue to be determined according to the obtained CPU usage of the third node device.
  • the remaining CPU processing capability of the third node device and then determining whether the remaining CPU processing capability of the third node device is greater than the CPU processing capability of the primary service of the first service, and if greater, configuring the third node device
  • the second alternate service of the first service is configured as a primary service.
  • the user may not do any Processing, waiting for the first service of the fault or the first node of the fault to be restored to normal (for example, by restarting); if it is determined that the third node device has the CPU processing capability corresponding to the primary service of the first service, and the third node device If the backup service of the other service is not configured as the primary service, the second backup service of the first service configured on the third node device is configured as the primary service, so that the first service configured on the third node device is configured.
  • the primary service obtains the service data of the backed first service from the first backup service of the first service configured on the second node device, and performs service processing.
  • the corresponding second backup service configured on the third node device may not start. , the first service that can effectively save service resources and then be configured on the third node device
  • the second backup service is configured as the primary service
  • the service data of the first service backed up is obtained from the first backup service configured on the second node device, and the service is processed.
  • the corresponding second backup service configured on the third node device may be started first, but does not perform any The operation can effectively improve the efficiency of the configuration.
  • the second standby service of the first service configured on the third node device is configured as the primary service
  • the backup is obtained from the first standby service configured on the second node device.
  • Business data of the first service and business processing.
  • the corresponding second backup service configured on the third node device may not be started.
  • the utility model can effectively save the service resources, and then restart when the second standby service of the second service configured on the third node device is configured as the primary service, and obtain the backup from the first standby service configured on the first node device.
  • the corresponding second standby service configured on the third node device may be started first, but does not perform any The operation can effectively improve the efficiency of the configuration, and then when the second standby service of the second service configured on the third node device is configured as the primary service, the backup is obtained from the first standby service configured on the first node device.
  • the second node device may not reserve corresponding CPU processing capability for the first standby service of the first service. If the primary service of the second service configured on the second node device is running at a full load, when the primary service of the first service configured on the first node device fails, the second node device has no first The first standby service of the service or the CPU processing capability corresponding to the first node device. At this time, the first backup service of any first service configured on the second node device is not configured as the primary service.
  • the second node device may further reserve a corresponding CPU processing capability for the first backup service of the at least one first service. If the primary service of the second service configured on the second node device is running at a full load, then the primary service of the first service configured on the first node device At the time of the failure, the second node device reserves the CPU processing capability corresponding to the first standby service of the at least one first service, and at this time, the at least one first service configured on the second node device
  • the backup service can be configured as a primary service, and can ensure that the backup service of the at least one first service configured on the second node device is configured as the primary service without determining the remaining CPU processing capability of the second node device, without further To determine the remaining CPU processing power of the third node device, thereby improving the efficiency and reliability of the configuration.
  • the primary service of the first service that is restored to normal may be configured as the first service of the first service. Reserving the backup service, and notifying the second node device, so that the primary service of the first service configured on the second node device backs up the service data of the first service to the first service configured on the first node device.
  • the backup service then configuring the first backup service of the first service configured on the first node device as the primary service, and configuring the primary service of the first service configured on the second node device as the first standby service; or
  • the primary service of the first service that is restored to normal may be configured as the first backup service of the first service, and notified to the third node device, so that the primary service of the first service configured on the third node device
  • the service data of the first service is backed up to the first backup service of the first service configured on the first node device, and the first service configured on the first node device
  • the first service configured on the first node device may include, but is not limited to, one; correspondingly, the primary service failure of the first service may be understood as: the primary service of one of the first services is faulty, The main service failure of all the first services may be caused by the failure of the first node device, which is not limited by the embodiment of the present invention.
  • one primary service and two standby services may be configured by using each service, where the primary service of the first service and one standby service of the second service are configured on the first node device, where the first service is An alternate service and a primary service of the second service are configured to the second node device, Another backup service of one service and another backup service of the second service are configured to the third node device, and the primary service is backed up to the cross-configuration node device (ie, the first node device or On the backup service on the second node device, when the primary service of the first service configured on the first node device fails, the other two node devices (ie, the second node device and the third node device) may be
  • the backup service of the service configured on a node device is configured as a primary service, and the service processing is continued, which can avoid another configuration in the prior art when the primary service configured on one node device is normal, and the corresponding backup service is configured.
  • the CPU of the node device the problem that the CPU on the other node device is not fully
  • the third node device may be not limited to one, and may also be multiple. Accordingly, the second backup service may not be limited to one, and may be multiple, which is not limited in the embodiment of the present invention.
  • the node device 1 is configured with the main process Process A (A) of process A, the main process Process B (A) of process B, and the main process Process C (A) of process C and process D.
  • FIG. 3 is a schematic flowchart of a method for processing a fault of the main process Process A(A) of the process A configured on the node device 1 shown in FIG.
  • the communication system to which the embodiment is applied may further include a monitoring unit and an arbitration unit.
  • the fault processing method of this embodiment may include:
  • the monitoring unit detects an working state of a main process of a process configured on the node device, where the working state includes normal and fault;
  • the monitoring unit detects that the process A of the process A configured on the node device 1 is faulty, and notifies the master process of the process A configured on the node device 1 of the arbitration unit.
  • the arbitration unit determines whether the node device 2 has the CPU processing capability corresponding to the process A (A) of the process A, and if so, executes 304; otherwise, executes 305;
  • the arbitration unit configures the standby process Process A'(S1) of the process A configured on the node device 2 as the primary process Process A (A);
  • the arbitration unit determines whether the node device 3 has the active process of process A.
  • Process A (A) corresponds to the CPU processing capability, and if so, executes 306, 307, and 308; otherwise, ends the process;
  • the arbitration unit configures the standby process Process A'(S2) of the process A configured on the node device 3 as the primary process Process A (A);
  • Process A requests the process A of the process A configured on the node device 2 (S1) to obtain the service data of the process A;
  • each process can be configured with one active process Process X (A) and two standby processes Process X' (S1) and Process X' (S2), the primary process of each two processes and one of them.
  • the alternate process Process X' ( S1 ) is cross-configured to two node devices, and another standby process Process X' ( S2 ) is configured on another node device, and the primary process Process X ( A ) is running at the same time Back up the corresponding service data to the standby process Process X' ( S1 ) on the cross-configuration node device, so that when the process of process X ( A ) of one process fails, one node of the other two node devices can be
  • the standby process Process X' ( S1 ) or Process X' ( S2 ) of the process configured on the device is configured as the active process, and the service processing is continued, which can avoid the normal process of the primary process configured on one node device in the prior art.
  • the CPU of another node device is directly in an idle
  • FIG. 4 is another schematic flowchart of a method for processing a fault of the main process Process A(A) of the process A configured on the node device 1 shown in FIG.
  • the processing method for the fault of the embodiment may further include:
  • the arbitration unit configures the normalized process configured on the node device 1 as the standby process of the process A.
  • the arbitration unit notifies the main process of process A configured on the node device 2 that Process A (A) is to be configured (recovered) as the standby process Process A' (S1);
  • the primary process Process A (A) of the process A configured on the node device 2 backs up the service data of the process A to the standby process of the process A configured on the node device 1.
  • the arbitration unit configures (restores) the standby process Process A' (S1) of the process A on the node device 1 (configured after the restart is restored to normal), the process A (A);
  • the arbitration unit configures (restores) the active process Process A (A) of the process A configured on the node device 2 into the standby process Process A' (S1).
  • the arbitration unit may configure (restore) the process after the node device 1 is restarted and restored to the normal state.
  • the process Process A ( A ), the process A ( A ) of the process A configured on the node device 2 is configured (recovered) as the standby process Process A' ( S1 ), and the fault process can be restarted and restored to normal after being on the node device.
  • the normal operation is configured (restore) the process after the node device 1 is restarted and restored to the normal state.
  • FIG. 5 is another schematic flowchart of a method for processing a fault of the main process Process A(A) of the process A configured on the node device 1 shown in FIG. As shown in FIG. 5, on the basis of the embodiment corresponding to FIG. 3, if the arbitration unit does not execute 304, but performs 305, 306, 307, and 308, the processing method of the fault in this embodiment may further include:
  • the arbitration unit notifies the standby process Process A' (S1) of the process A configured on the node device 2 to restart;
  • the arbitration unit configures the normalized process configured on the node device 1 as the standby process of the process A.
  • the arbitration unit notifies the main process of process A configured on the node device 3. Process A
  • the primary process Process A (A) of the process A configured on the node device 3 backs up the service data of the process A to the standby process of the process A configured on the node device 1 (S1);
  • the arbitration unit configures (restores) the standby process of the process A of the node A configured on the node device 1 (configured after being restored to normal) Process A' (S1) as the primary process Process A (A);
  • the arbitration unit configures (restores) the process after the restart on the node device 2 into the standby process of the process A.
  • the arbitration unit configures (restores) the active process Process A (A) of the process A configured on the node device 3 into the standby process Process A' (S2).
  • the arbitration unit may configure (restore) the process after the node device 1 is restarted and restored to the normal state.
  • the process Process A (A), the process A of the process A configured on the node device 3, is configured (restored) as the standby process Process A' (S2), and the faulty process can be restarted and restored to normal on the node device.
  • S2 standby process Process A'
  • the node device in the communication system involved in the embodiment of the present invention needs to expand the node device with the same CPU processing capability
  • the node device that needs to be expanded by the active process and the first standby process needs to be expanded in pairs
  • FIG. 6 is a schematic structural diagram of a device for processing a service fault configured on a node device in a communication system according to another embodiment of the present invention.
  • the device may include a monitoring unit 61 and an arbitration unit 62.
  • the monitoring unit 61 is configured to detect the working status of the primary service of the first service and the primary service of the second service, where the working status includes normal and fault;
  • the arbitration unit 62 is configured to detect the first service when the monitoring unit 61 detects When the primary service fails,
  • the second backup service of the first service configured on the third node device as a primary service, so that the foregoing
  • the primary service of the first service configured on the three-node device obtains the service data of the first service that is backed up from the first backup service of the first service configured on the second node device, and performs service processing.
  • the functions of the monitoring unit and the arbitration unit in the embodiment corresponding to the method in FIG. 1 and the embodiment corresponding to FIG. 3, FIG. 4 and FIG. 5 can be used in the processing device for the service failure configured on the node device in the communication system provided by the embodiment.
  • the relevant functional unit is implemented.
  • the arbitration unit 62 in this embodiment may specifically determine whether the second node device has the CPU processing capability corresponding to the primary service of the first service, and if yes, configure the second node device.
  • the first alternate service of a service is configured as a primary service.
  • the arbitrating unit 62 in this embodiment may further determine whether the second node device has the CPU processing capability corresponding to the primary service of the first service, and if not, determine whether the third node device has the foregoing The CPU processing capability corresponding to the primary service of the first service, if yes, configuring the second standby service of the first service configured on the third node device as a primary service, so that the third node device is configured on the third node device
  • the primary service of the first service obtains the service data of the backup first service from the first backup service of the first service configured on the second node device, and performs service processing.
  • the corresponding second backup service configured on the third node device may not be started. And then restarting when the second backup service of the first service configured on the third node device is configured as the primary service, and obtaining the service data of the backup first service from the first standby service configured on the second node device, And conduct business processing.
  • the corresponding second backup service configured on the third node device may be started first, but does not perform any Operation, and then, when the second backup service of the first service configured on the third node device is configured as the primary service, obtaining the service data of the backup first service from the first backup service configured on the second node device, And conduct business processing.
  • the corresponding second backup service configured on the third node device may not be started. And obtaining, by the first standby service configured on the first node device, the service data of the second service that is backed up, and performing service processing, and then the second standby service of the second service configured on the third node device is configured as the primary service. Start again when the service is available.
  • the corresponding second standby service configured on the third node device may be started first, but does not perform any Operation, and then, when the second backup service of the second service configured on the third node device is configured as the primary service, obtaining the service data of the second service backed up from the first standby service configured on the first node device, And conduct business processing.
  • the first standby device that is not the first service may be on the second node device. Reserve the corresponding CPU processing capability. If the primary service of the second service configured on the second node device is running at a full load, when the monitoring unit 61 detects that the primary service of the first service configured on the first node device is faulty, At this time, the second node device does not have the first standby service of the first service or the CPU processing capability corresponding to the first node device. Therefore, at this time, the first standby service of any first service configured on the second node device is Will not be configured as a primary service.
  • the second node device may further reserve a corresponding CPU processing capability for the first standby service of the at least one first service. If the primary service of the second service configured on the second node device is running at a full load, when the monitoring unit 61 detects that the primary service of the first service configured on the first node device is faulty, At this time, the second node device reserves the CPU processing capability corresponding to the first standby service of the at least one first service. Therefore, at this time, the backup service of the at least one first service configured on the second node device may be configured as the primary service. Use the service.
  • the arbitration unit is further configured to: when the monitoring unit 61 detects that the primary service of the first service that is faulty on the first node device returns to normal, the primary service that restores the normal first service may be restored.
  • the configuration is the first standby service; or the primary service of the first service that is restored to normal is configured as the first standby service of the first service, and is notified to the third node device, so that the third node device is configured.
  • the primary service of the service backs up the service data of the first service to the first backup service of the first service configured on the first node device, and sets the first node
  • the first standby service of the first service configured on the third service is configured as a primary service
  • the primary service of the first service configured on the third node device is configured as a second standby service, thereby implementing a fault service or a faulty node device restart. Normal operation on the node device after returning to normal.
  • one primary service and two backup services may be configured by using each service, where the primary service of the first service and one backup service of the second service are configured on the first node device.
  • One backup service of the first service and the primary service of the second service are configured to the second node device, another backup service of the first service and another backup service of the second service are configured to the third node device, and the main Backing up the corresponding service data to the backup service on the cross-configuration node device (ie, the first node device or the second node device) while the service is running, so that when the monitoring unit detects the first configuration on the first node device
  • the arbitration unit may configure the backup service of the service configured on one of the other two node devices (ie, the second node device and the third node device) as the primary service, and continue.
  • the service processing can avoid the CPU on the other node device caused by the CPU of another node device configuring the corresponding backup service in the prior art, because the primary service configured on one node device is normal. The problem is not fully utilized, thereby increasing the CPU utilization of the node device.
  • the disclosed apparatus and method may be implemented in other manners.
  • the device embodiments described above are merely illustrative.
  • the division of the unit is only a logical function division.
  • there may be another division manner for example, multiple units or components may be combined or Can be integrated into another system, or some features can be ignored, or not executed.
  • the mutual coupling or direct coupling or communication connection shown or discussed may be an indirect coupling or communication connection through some interface, device or unit, and may be electrical, mechanical or otherwise.
  • the units described as separate components may or may not be physically separated, and the components displayed as units may or may not be physical units, that is, may be located in one place, or may be distributed to multiple network units. Some or all of the units may be selected according to actual needs to achieve the objectives of the solution of the embodiment.
  • each functional unit in each embodiment of the present invention may be integrated into one processing unit, or each unit may exist physically separately, or two or more units may be integrated into one single unit. Yuanzhong.
  • the above integrated unit can be implemented in the form of hardware or in the form of hardware plus software functional units.
  • the above-described integrated unit implemented in the form of a software functional unit can be stored in a computer readable storage medium.
  • the above software functional units are stored in a storage medium and include a number of instructions for causing a computer device (which may be a personal computer, server, or network device, etc.) to perform some of the steps of the methods described in various embodiments of the present invention.
  • the foregoing storage medium includes: a USB flash drive, a removable hard disk, a read-only memory (ROM), a random access memory (RAM), a magnetic disk, or an optical disk, and the like, which can store program codes. Medium.

Description

通信系统中节点设备上配置的服务故障的处理方法及装置 技术领域
本发明实施例涉及信息处理技术, 尤其涉及一种通信系统中节点设备上 配置的服务故障的处理方法及装置。 背景技术
在通信系统中, 许多节点设备上配置的服务, 例如: 线程、 进程、 进程 组或虚拟机等, 都采用 1 +1主备备份方式, 将一个服务的主用服务和备用服 务分别配置在两个节点设备上, 正常情况下, 主用服务运行以进行该服务业 务处理, 并将该主用服务的业务数据备份到备用服务器上。 例如: 节点设备
A上配置的主用服务运行以进行业务处理时, 将该主用服务的业务数据备份 到节点设备 B上配置的备用服务上。当节点设备 A上配置的主用服务故障(例 如: 主用服务自身故障或者由于节点故障而导致的主用服务故障) 时, 备用 服务升级作为主用服务, 由于升级作为主用服务的原备用服务上备份有业务 数据, 因此该升级的主用服务能够继续进行业务处理。
然而, 由于节点设备 A上配置的主用服务正常时, 节点设备 B的 CPU 一直处于空闲状态, 使得节点设备 B上的 CPU没有被充分利用, 从而导致 了节点设备的 CPU利用率的降低。 发明内容
本发明实施例提供一种通信系统中节点设备上配置的服务故障的处理方 法及装置, 用以提高节点设备的 CPU利用率。
本发明一方面提供了一种通信系统中节点设备上配置的服务故障的处理 方法, 所述通信系统包括第一节点设备、 第二节点设备和第三节点设备; 所 述第一节点设备上配置第一服务的主用服务和第二服务的第一备用服务, 所 述第二节点设备上配置第二服务的主用服务和第一服务的第一备用服务, 所 述第三节点设备上配置第一服务的第二备用服务和第二服务的第二备用服 务; 其中, 所述第一服务的主用服务将该第一服务的业务数据备份到所述第 一服务的第一备用服务, 所述第二服务的主用服务将该第二服务的业务数据 备份到所述第二服务的第一备用服务; 所述方法包括:
检测所述第一服务的主用服务和所述第二服务的主用服务的工作状态, 所述工作状态包括正常和故障;
当检测到所述第一服务的主用服务故障时,
根据所述第二节点设备的剩余 CPU处理能力,将所述第二节点设备上配 置的第一服务的第一备用服务配置为主用服务, 以使得所述第二节点设备上 配置的第一服务的主用服务进行业务处理; 或者
根据所述第二节点设备的剩余 CPU 处理能力和所述第三节点设备的剩 余 CPU处理能力,将所述第三节点设备上配置的第一服务的第二备用服务配 置为主用服务, 以使得所述第三节点设备上配置的第一服务的主用服务从所 述第二节点设备上配置的第一服务的第一备用服务获得所述备份的第一服务 的业务数据, 并进行业务处理。
本发明另一方面提供了一种通信系统中节点设备上配置的服务故障的处 理装置, 所述通信系统包括第一节点设备、 第二节点设备和第三节点设备; 所述第一节点设备上配置第一服务的主用服务和第二服务的第一备用服务, 所述第二节点设备上配置第二服务的主用服务和第一服务的第一备用服务, 所述第三节点设备上配置第一服务的第二备用服务和第二服务的第二备用服 务; 其中, 所述第一服务的主用服务将该第一服务的业务数据备份到所述第 一服务的第一备用服务, 所述第二服务的主用服务将该第二服务的业务数据 备份到所述第二服务的第一备用服务; 所述装置包括:
监控单元, 用于检测所述第一服务的主用服务和所述第二服务的主用服 务的工作状态, 所述工作状态包括正常和故障; 仲裁单元,用于当所述监控单元检测到所述第一服务的主用服务故障时, 根据所述第二节点设备的剩余 CPU处理能力,将所述第二节点设备上配 置的第一服务的第一备用服务配置为主用服务, 以使得所述第二节点设备上 配置的第一服务的主用服务进行业务处理; 或者
根据所述第二节点设备的剩余 CPU 处理能力和所述第三节点设备的剩 余 CPU处理能力,将所述第三节点设备上配置的第一服务的第二备用服务配 置为主用服务, 以使得所述第三节点设备上配置的第一服务的主用服务从所 述第二节点设备上配置的第一服务的第一备用服务获得所述备份的第一服务 的业务数据, 并进行业务处理。
由上述技术方案可知, 本发明实施例通过每个服务可以配置一个主用服 务和两个备用服务, 其中, 第一服务的主用服务和第二服务的一个备用服务 配置到第一节点设备上, 第一服务的一个备用服务和第二服务的主用服务配 置到第二节点设备上, 第一服务的另一个备用服务和第二服务的另一个备用 服务配置到第三节点设备上, 并且主用服务在运行的同时将对应的业务数据 备份到交叉配置节点设备 (即第一节点设备或第二节点设备)上的备用服务 上, 使得当第一节点设备上配置的第一服务的主用服务故障时, 可以将另两 个节点设备(即第二节点设备和第三节点设备) 中的一个节点设备上配置的 该服务的备用服务配置为主用服务, 继续进行业务处理, 能够避免现有技术 中由于一个节点设备上配置的主用服务正常时, 配置对应的备用服务的另一 节点设备的 CPU—直处于空闲状态而导致的另一节点设备上的 CPU没有被 充分利用的问题, 从而提高了节点设备的 CPU利用率。 附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案, 下面将对实 施例或现有技术描述中所需要使用的附图作一简单地介绍, 显而易见地, 下 面描述中的附图是本发明的一些实施例, 对于本领域普通技术人员来讲, 在 不付出创造性劳动的前提下, 还可以根据这些附图获得其他的附图。
图 1 为本发明一实施例提供的通信系统中节点设备上配置的服务故障的 处理方法的流程示意图;
图 2为图 1对应的实施例中节点设备上的进程配置示意图;
图 3为图 2所示的节点设备 1上配置的进程 A的主用进程 Process A( A ) 故障的处理方法的一流程示意图;
图 4为图 2所示的节点设备 1上配置的进程 A的主用进程 Process A( A ) 故障的处理方法的另一流程示意图;
图 5为图 2所示的节点设备 1上配置的进程 A的主用进程 Process A( A ) 故障的处理方法的另一流程示意图;
图 6为本发明另一实施例提供的通信系统中节点设备上配置的服务故障 的处理装置的结构示意图。 具体实施方式
为使本发明实施例的目的、 技术方案和优点更加清楚, 下面将结合本发 明实施例中的附图, 对本发明实施例中的技术方案进行清楚、 完整地描述, 显然, 所描述的实施例是本发明一部分实施例, 而不是全部的实施例。 基于 本发明中的实施例, 本领域普通技术人员在没有作出创造性劳动前提下所获 得的所有其他实施例, 都属于本发明保护的范围。
本发明的技术方案, 可以应用于各种通信系统, 例如: 全球移动通信系 统 ( Global System for Mobile Communications, 简称 GSM )、 通用分组 无线业务(General Packet Radio Service, 简称 GPRS ) 系统、 码分多址 ( Code Division Multiple Access, 简称 CDMA ) 系统、 宽带码分多址 ( Wi deband Code Division Multiple Access, 简称 WCDMA ) 系统、 时分同步 码分多址 ( Time Division-Synchronous Code Division Multiple Access, 简称 TD-SCDMA ) 系统、 长期演进(Long Term Evolution, 简称 LTE ) 系 统等。
其中的节点设备可以是基站(Base Transceiver Station, 简称 BTS )、 基站(NodeB )、 演进型基站( Evolutional Node B, 简称 eNB或 eNodeB )、 基站控制器(Base Station Controller, 简称 BSC )、 无线网络控制器( Rad io Network Controller, 简称 RNC )、 服务通用分组无线服务( General Pac ket Radio Service, 简称 GPRS )支持节点设备 ( Serving GPRS Supporti ng Node, 简称 SGSN ) 、 移动交换中心(Mobile Switching Center, 简称 MSC ) 、 移动性管理实体(Mobility Management Entity, 简称 MME ) 、 网 关 GPRS支持节点设备( Gateway GPRS Supporting Node,简称 GGSN )、 分组数据网络网关( Packet Data Network Gateway, 简称 P-GW )等网元。
本发明实施例中所涉及的服务可以运行在节点设备上, 可以理解为用于 完成指定业务的功能单元。 其中, 服务可以包括但不限于线程、 进程、 进程 组或虚拟机。 例如: 运行在 MSC上的话单管理进程, 用于对获得的话单数 据进行格式转换, 形成话单文件, 并将该话单文件发送给计费中心。 其中, 主用服务则表示该服务能够处理业务, 备用服务则表示该进程暂时不能处理 业务, 当主用进程故障时, 备用进程才能被配置为主用进程以处理业务。
本发明实施例中所涉及的通信系统可以包括第一节点设备、 第二节点设 备和第三节点设备。 其中, 第一节点设备上配置第一服务的主用服务和第二 服务的第一备用服务, 第二节点设备上配置第二服务的主用服务和第一服务 的第一备用服务, 第三节点设备上配置第一服务的第二备用服务和第二服务 的第二备用服务。 具体地, 可以通过操作维护系统 ( Operations and Maintenance System, 简称 OMS )对上述节点设备进行服务的配置。
其中, 在主用服务运行的过程中, 第一服务的主用服务将该第一服务的 业务数据备份到第一服务的第一备用服务, 第二服务的主用服务将该第二服 务的业务数据备份到第二服务的第一备用服务。 需要说明的是: 由于第一服务的主用服务只将该第一服务的业务数据备 份到第一服务的第一备用服务, 第二服务的主用服务也只将该第二服务的业 务数据备份到第二服务的第一备用服务, 可以理解的是: 本发明实施例中的 第一备用服务的状态为备用状态(备份有对应服务的业务数据), 第二备用服 务的状态为互助状态 (没有备份对应服务的业务数据)。
图 1 为本发明一实施例提供的通信系统中节点设备上配置的服务故障的 处理方法的流程示意图, 如图 1所示, 本实施例的通信系统中节点设备上配 置的服务故障的处理方法可以包括:
101、检测第一服务的主用服务和第二服务的主用服务的工作状态,上述 工作状态包括正常和故障;
本发明实施例中所涉及的主用服务的工作状态为正常, 可以理解为主用 服务能正常运行, 或能正常处理业务; 主用服务的工作状态为故障, 可以理 解为主用服务不能正常运行, 或不能正常处理业务。
102、 当检测到第一服务的主用服务故障时,
根据第二节点设备的剩余 CPU处理能力,将第二节点设备上配置的第一 服务的第一备用服务配置为主用服务, 以使得第二节点设备上配置的第一服 务的主用服务进行业务处理; 或者
根据第二节点设备的剩余 CPU处理能力和第三节点设备的剩余 CPU处 理能力,将第三节点设备上配置的第一服务的第二备用服务配置为主用服务, 以使得第三节点设备上配置的第一服务的主用服务从第二节点设备上配置的 第一服务的第一备用服务获得备份的第一服务的业务数据,并进行业务处理。
101和 102的执行主体可以为一个实体, 例如: 监控仲裁单元, 或者还 可以为几个实体, 例如: 一部分由监控单元完成, 另一部分由仲裁单元完成, 两者通过交互完成整个处理流程, 本发明实施例对此不进行限制。
可选地, 可以判断第二节点设备是否有第一服务的主用服务对应的 CPU 处理能力, 如果有, 则将第二节点设备上配置的第一服务的第一备用服务配 置为主用服务; 如果没有, 则继续判断第三节点设备是否有第一服务的主用 服务对应的 CPU处理能力,如果有, 则将第三节点设备上配置的第一服务的 第二备用服务配置为主用服务, 以使得第三节点设备上配置的第一服务的主 用服务从第二节点设备上配置的第一服务的第一备用服务获得备份的第一服 务的业务数据, 并进行业务处理, 如果没有, 那么则可以不做任何处理, 等 待故障的第一服务或故障的第一节点设备恢复正常(例如: 通过重启)。 具体 地, 可以根据获得的第二节点设备的 CPU占用率,确定第二节点设备的剩余 CPU处理能力, 然后再判断该第二节点设备的剩余 CPU处理能力是否大于 第一服务的主用服务对应的 CPU处理能力,如果大于, 则将第二节点设备上 配置的第一服务的第一备用服务配置为主用服务; 如果没有, 则可以继续根 据获得的第三节点设备的 CPU占用率, 确定第三节点设备的剩余 CPU处理 能力,然后再判断该第三节点设备的剩余 CPU处理能力是否大于第一服务的 主用服务对应的 CPU处理能力,如果大于, 则将第三节点设备上配置的第一 服务的第二备用服务配置为主用服务。
可选地,如果判断第三节点设备有第一服务的主用服务对应的 CPU处理 能力, 但是该第三节点设备当前已经配置了其他服务的备用服务作为主用服 务, 那么则可以不做任何处理, 等待故障的第一服务或故障的第一节点设备 恢复正常(例如: 通过重启); 如果判断第三节点设备有第一服务的主用服务 对应的 CPU处理能力,而且该第三节点设备当前没有配置其他服务的备用服 务作为主用服务, 那么则将第三节点设备上配置的第一服务的第二备用服务 配置为主用服务, 以使得第三节点设备上配置的第一服务的主用服务从第二 节点设备上配置的第一服务的第一备用服务获得备份的第一服务的业务数 据, 并进行业务处理。
可选地, 如果第一节点设备上配置第一服务的类型 /个数较多, 或者第一 服务的启动时间较短, 那么, 第三节点设备上配置的对应的第二备用服务可 以不启动, 能够有效节省服务资源, 然后在第三节点设备上配置的第一服务 的第二备用服务被配置为主用服务时再启动, 并从第二节点设备上配置的第 一备用服务获得备份的第一服务的业务数据, 并进行业务处理。 如果第一节 点设备上配置第一服务的类型 /个数较少或者第一服务的启动时间较长, 那 么, 第三节点设备上配置的对应的第二备用服务可以先启动, 但是不进行任 何操作, 能够有效提高配置的效率, 然后在第三节点设备上配置的第一服务 的第二备用服务被配置为主用服务时, 再从第二节点设备上配置的第一备用 服务获得备份的第一服务的业务数据, 并进行业务处理。
可选地, 如果第二节点设备上配置第二服务的类型 /个数较多或者第二服 务的启动时间较短, 那么, 第三节点设备上配置的对应的第二备用服务可以 不启动, 能够有效节省服务资源, 然后在第三节点设备上配置的第二服务的 第二备用服务被配置为主用服务时再启动, 并从第一节点设备上配置的第一 备用服务获得备份的第二服务的业务数据, 并进行业务处理。 如果第二节点 设备上配置第二服务的类型 /个数较少或者第二服务的启动时间较长, 那么, 第三节点设备上配置的对应的第二备用服务可以先启动, 但是不进行任何操 作, 能够有效提高配置的效率, 然后在第三节点设备上配置的第二服务的第 二备用服务被配置为主用服务时, 再从第一节点设备上配置的第一备用服务 获得备份的第二服务的业务数据, 并进行业务处理。
可选地, 本实施例中, 第二节点设备上可以不为第一服务的第一备用服 务预留对应的 CPU处理能力。如果第二节点设备上配置的第二服务的主用服 务满负荷运行, 那么, 当第一节点设备上配置的第一服务的主用服务故障时, 由于此时第二节点设备已经没有第一服务的第一备用服务或第一节点设备对 应的 CPU处理能力, 此时, 第二节点设备上配置的任一第一服务的第一备用 服务均不会被配置为主用服务。
可选地, 本实施例中, 第二节点设备上还可以为至少一个第一服务的第 一备用服务预留对应的 CPU处理能力。如果第二节点设备上配置的第二服务 的主用服务满负荷运行, 那么, 当第一节点设备上配置的第一服务的主用服 务故障时, 由于第一节点设备上此时第二节点设备预留了至少一个第一服务 的第一备用服务对应的 CPU处理能力, 此时, 第二节点设备上配置的至少一 个第一服务的备用服务可以被配置为主用服务, 能够确保第二节点设备上配 置的至少一个第一服务的备用服务被配置为主用服务, 而无需判断第二节点 设备的剩余 CPU处理能力, 无需再去判断第三节点设备的剩余 CPU处理能 力, 从而提高了配置的效率和可靠性。
进一步地, 本实施例中, 当检测到第一节点设备上故障的第一服务的主 用服务恢复正常时, 则可以将恢复正常的第一服务的主用服务配置为第一服 务的第一备用服务, 并通知给第二节点设备, 以使第二节点设备上配置的第 一服务的主用服务将该第一服务的业务数据备份到第一节点设备上配置的第 一服务的第一备用服务, 然后将第一节点设备上配置的第一服务的第一备用 服务配置为主用服务, 并将第二节点设备上配置的第一服务的主用服务配置 为第一备用服务; 或者还可以将恢复正常的第一服务的主用服务配置为第一 服务的第一备用服务, 并通知给第三节点设备, 以使第三节点设备上配置的 第一服务的主用服务将该第一服务的业务数据备份到第一节点设备上配置的 第一服务的第一备用服务, 以及将第一节点设备上配置的第一服务的第一备 用服务配置为主用服务, 并将第三节点设备上配置的第一服务的主用服务配 置为第二备用服务, 从而实现了故障服务或故障节点设备重启恢复正常之后 在节点设备上的正常运行。
可以理解的是:第一节点设备上配置的第一服务可以包括但不限于一个; 相应地, 第一服务的主用服务故障则可以理解为: 其中的一个第一服务的主 用服务故障, 或者还可以是由于第一节点设备故障而导致的全部第一服务的 主用服务故障, 本发明实施例对此不进行限定。
本实施例中, 通过每个服务可以配置一个主用服务和两个备用服务, 其 中,第一服务的主用服务和第二服务的一个备用服务配置到第一节点设备上, 第一服务的一个备用服务和第二服务的主用服务配置到第二节点设备上, 第 一服务的另一个备用服务和第二服务的另一个备用服务配置到第三节点设备 上, 并且主用服务在运行的同时将对应的业务数据备份到交叉配置节点设备 (即第一节点设备或第二节点设备)上的备用服务上, 使得当第一节点设备 上配置的第一服务的主用服务故障时, 可以将另两个节点设备(即第二节点 设备和第三节点设备) 中的一个节点设备上配置的该服务的备用服务配置为 主用服务, 继续进行业务处理, 能够避免现有技术中由于一个节点设备上配 置的主用服务正常时,配置对应的备用服务的另一节点设备的 CPU—直处于 空闲状态而导致的另一节点设备上的 CPU没有被充分利用的问题,从而提高 了节点设备的 CPU利用率。
可以理解的是: 第三节点设备可以不限于一个, 还可以为多个; 相应地, 第二备份服务也可以不限于一个, 还可以为多个, 本发明实施例对此不进行 限定。
为使得本发明实施例提供的方法更加清楚, 下面将以一个节点设备上配 置的进程的主用进程故障作为举例。 如图 2所示, 节点设备 1上配置进程 A 的主用进程 Process A ( A )、 进程 B的主用进程 Process B ( A )、 进程 C的 主用进程 Process C ( A )和进程 D的主用进程 Process D ( A ), 以及进程 E 的一备用进程 Process E' ( S1 )、 进程 F的一备用进程 Process F' ( S1 )、 进 程 G的一备用进程 Process G'( S1 )和进程 H的一备用进程 Process H'( S1 ); 节点设备 2上配置进程 A的一备用进程 Process A' ( S1 )、 进程 B的一备用 进程 Process B' ( S1 )、 进程 C的一备用进程 Process C ( S1 )和进程 D的 一备用进程 Process D' ( S1 ) , 以及进程 E的主用进程 Process E ( A )、 进 程 F的主用进程 Process F ( A )、 进程 G的主用进程 Process G ( A )和进 程 H的主用进程 Process H ( A ); 节点设备 3上配置进程 A的另一备用进程 Process A' ( S2 )、 进程 B的另一备用进程 Process B' ( S2 )、 进程 C的另一 备用进程 Process C ( S2 )和进程 D的另一备用进程 Process D' ( S2 ), 以 及进程 E的另一备用进程 Process E'( S2 )、进程 F的另一备用进程 Process F' ( S2 )、 进程 G的另一备用进程 Process G' ( S2 )和进程 H的另一备用进 程 Process H' ( S2 ); 其中, 节点设备 1上配置的进程 A的主用进程 Process A ( A )将该进程 A的业务数据备份到节点设备 2上配置进程 A的备用进程 Process A' ( S1 ); 节点设备 1上配置的进程 B的主用进程 Process B ( A ) 将该进程 B的业务数据备份到节点设备 2上配置进程 B的备用进程 Process B' ( S1 ); 节点设备 1上配置的进程 C的主用进程 Process C ( A )将该进程 C的业务数据备份到节点设备 2上配置进程 C的备用进程 Process C'( S1 ); 节点设备 1上配置的进程 D的主用进程 Process D ( A )将该进程 D的业务 数据备份到节点设备 2上配置进程 D的备用进程 Process D' ( S1 ); 节点设 备 2上配置的进程 E的主用进程 Process E ( A )将该进程 E的业务数据备 份到节点设备 1上配置进程 E的备用进程 Process E' ( S1 ); 节点设备 2上 配置的进程 F的主用进程 Process F ( A )将该进程 F的业务数据备份到节点 设备 1上配置进程 F的备用进程 Process F' ( S1 ); 节点设备 2上配置的进 程 G的主用进程 Process G ( A )将该进程 G的业务数据备份到节点设备 1 上配置进程 G的备用进程 Process G' ( S1 ); 节点设备 2上配置的进程 H的 主用进程 Process H ( A )将该进程 H的业务数据备份到节点设备 1上配置 进程 H的备用进程 Process H' ( S1 )。
图 3为图 2所示的节点设备 1上配置的进程 A的主用进程 Process A( A ) 故障的处理方法的一流程示意图。 本实施例适用的通信系统中还可以进一步 包括监控单元和仲裁单元。 如图 3所示, 本实施例的故障的处理方法可以包 括:
301、监控单元检测节点设备上配置的进程的主用进程的工作状态,上述 工作状态包括正常和故障;
302、监控单元检测到节点设备 1上配置的进程 A的主用进程 Process A ( A )故障,并通知仲裁单元节点设备 1上配置的进程 A的主用进程 Process
A ( A )故障; 303、仲裁单元判断节点设备 2是否有进程 A的主用进程 Process A ( A ) 对应的 CPU处理能力, 如果有, 则执行 304; 否则, 则执行 305;
304、仲裁单元将节点设备 2上配置的进程 A的备用进程 Process A'( S1 ) 配置为主用进程 Process A ( A );
305、仲裁单元判断节点设备 3是否有进程 A的主用进程 Process A ( A ) 对应的 CPU处理能力, 如果有, 则执行 306、 307和 308; 否则, 结束流程;
306、仲裁单元将节点设备 3上配置的进程 A的备用进程 Process A'( S2 ) 配置为主用进程 Process A ( A );
307、 节点设备 3上配置的进程 A的主用进程 Process A ( A )向节点设 备 2上配置的进程 A的备用进程 Process A' ( S1 )请求获得进程 A的业务数 据;
308、 节点设备 2上配置的进程 A的备用进程 Process A' ( S1 )将进程 A的业务数据备份到节点设备 3上配置的进程 A的主用进程 Process A( A )。
本实施例中, 每个进程可以配置一个主用进程 Process X ( A )和两个备 用进程 Process X' ( S1 )和 Process X' ( S2 ), 每两个进程的主用进程和其 中的一个备用进程 Process X' ( S1 ) 交叉配置到两个节点设备上, 其中的另 一个备用进程 Process X' ( S2 ) 配置在另一个节点设备上, 并且主用进程 Process X ( A )在运行的同时将对应的业务数据备份到交叉配置节点设备上 的备用进程 Process X' ( S1 )上,使得当一个进程的主用进程 Process X ( A ) 故障时, 可以将另两个节点设备中的一个节点设备上配置的该进程的备用进 程 Process X' ( S1 )或 Process X' ( S2 )配置为主用进程, 继续进行业务处 理, 能够避免现有技术中由于一个节点设备上配置的主用进程正常时, 另一 节点设备的 CPU—直处于空闲状态而导致的另一节点设备上的 CPU没有被 充分利用的问题, 从而提高了节点设备的 CPU利用率。
图 4为图 2所示的节点设备 1上配置的进程 A的主用进程 Process A( A ) 故障的处理方法的另一流程示意图。 如图 4所示, 在图 3对应的实施例的基 础之上, 如果仲裁单元执行 304, 本实施例的故障的处理方法还可以进一步 包括:
401、 节点设备 1上配置的故障的进程 A的主用进程 Process A ( A )重 启之后, 恢复正常, 向仲裁单元请求分配进程状态;
402、 仲裁单元将节点设备 1上配置的恢复正常的进程配置为进程 A的 备用进程 Process A' ( S1 );
403、 仲裁单元通知节点设备 2上配置的进程 A的主用进程 Process A ( A ) 即将配置(恢复) 为备用进程 Process A' ( S1 );
404、基于上述通知, 节点设备 2上配置的进程 A的主用进程 Process A ( A )将进程 A的业务数据备份到节点设备 1 上配置的进程 A的备用进程
Process A' ( S1 );
405、 仲裁单元将节点设备 1 上配置(重启恢复正常之后配置的) 的进 程 A的备用进程 Process A' ( S1 )配置(恢复)为主用进程 Process A ( A );
406、仲裁单元将节点设备 2上配置的进程 A的主用进程 Process A ( A ) 配置(恢复) 为备用进程 Process A' ( S1 )。
本实施例中, 节点设备 1上配置的故障的进程 A的主用进程 Process A ( A ) 重启恢复正常之后, 仲裁单元可以将节点设备 1 上重启恢复正常之后 的进程配置(恢复 ) 为主用进程 Process A ( A ), 节点设备 2上配置的进程 A的主用进程 Process A ( A ) 配置(恢复) 为备用进程 Process A' ( S1 ), 能够实现故障进程重启恢复正常之后在节点设备上的正常运行。
图 5为图 2所示的节点设备 1上配置的进程 A的主用进程 Process A( A ) 故障的处理方法的另一流程示意图。 如图 5所示, 在图 3对应的实施例的基 础之上, 如果仲裁单元没有执行 304, 而是执行 305、 306、 307和 308, 本 实施例的故障的处理方法还可以进一步包括:
501、 节点设备 1上配置的故障的进程 A的主用进程 Process A ( A )重 启之后, 恢复正常, 向仲裁单元请求分配进程状态; 502、 仲裁单元通知节点设备 2上配置的进程 A的备用进程 Process A' ( S1 )重启;
503、 仲裁单元将节点设备 1上配置的恢复正常的进程配置为进程 A的 备用进程 Process A' ( S1 );
504、 仲裁单元通知节点设备 3上配置的进程 A的主用进程 Process A
( A ) 即将配置(恢复) 为备用进程 Process A' ( S1 );
505、基于上述通知, 节点设备 3上配置的进程 A的主用进程 Process A ( A )将进程 A的业务数据备份到节点设备 1 上配置的进程 A的备用进程 Process A' ( S1 );
506、 仲裁单元将节点设备 1 上配置(恢复正常之后配置的) 的进程 A 的备用进程 Process A' ( S1 ) 配置(恢复) 为主用进程 Process A ( A );
507、 仲裁单元将节点设备 2上重启之后的进程配置(恢复) 为进程 A 的备用进程 Process A' ( S1 );
508、仲裁单元将节点设备 3上配置的进程 A的主用进程 Process A ( A ) 配置(恢复) 为备用进程 Process A' ( S2 )。
本实施例中, 节点设备 1上配置的故障的进程 A的主用进程 Process A ( A ) 重启恢复正常之后, 仲裁单元可以将节点设备 1 上重启恢复正常之后 的进程配置(恢复) 为主用进程 Process A ( A ), 节点设备 3上配置的进程 A的主用进程 Process A ( A ) 配置(恢复) 为备用进程 Process A' ( S2 ), 能够实现故障进程重启恢复正常之后在节点设备上的正常运行。
可以理解的是: 本发明实施例中涉及的通信系统中的节点设备, 需要扩 容同等 CPU处理能力的节点设备时,需要成对扩容主用进程和第一备用进程 所运行的节点设备; 需要扩容更强 CPU处理能力的节点设备时, 需要成对扩 容主用进程和第一备用进程所运行的节点设备之外, 还需要个成对扩容的节 点设备增加对应的第二备份进程所在的节点设备。
需要说明的是: 对于前述的各方法实施例, 为了简单描述, 故将其都表 述为一系列的动作组合, 但是本领域技术人员应该知悉, 本发明并不受所描 述的动作顺序的限制, 因为依据本发明, 某些步骤可以采用其他顺序或者同 时进行。 其次, 本领域技术人员也应该知悉, 说明书中所描述的实施例均属 于优选实施例, 所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中, 对各个实施例的描述都各有侧重, 某个实施例中没有 详述的部分, 可以参见其他实施例的相关描述。
图 6为本发明另一实施例提供的通信系统中节点设备上配置的服务故障 的处理装置的结构示意图, 如图 6所示, 本实施例的通信系统中节点设备上 配置的服务故障的处理装置可以包括监控单元 61和仲裁单元 62。 其中, 监 控单元 61用于检测第一服务的主用服务和第二服务的主用服务的工作状态, 上述工作状态包括正常和故障; 仲裁单元 62用于当监控单元 61检测到上述 第一服务的主用服务故障时,
根据上述第二节点设备的剩余 CPU处理能力,将上述第二节点设备上配 置的第一服务的第一备用服务配置为主用服务, 以使得上述第二节点设备上 配置的第一服务的主用服务进行业务处理; 或者
根据上述第二节点设备的剩余 CPU 处理能力和上述第三节点设备的剩 余 CPU处理能力,将上述第三节点设备上配置的第一服务的第二备用服务配 置为主用服务, 以使得上述第三节点设备上配置的第一服务的主用服务从上 述第二节点设备上配置的第一服务的第一备用服务获得上述备份的第一服务 的业务数据, 并进行业务处理。
上述图 1对应的实施例中方法、 图 3、 4和 5对应的实施例中的监控单 元和仲裁单元的功能均可以由本实施例提供的通信系统中节点设备上配置的 服务故障的处理装置中的相关功能单元实现。
可选地,本实施例中的仲裁单元 62具体可以判断上述第二节点设备是否 有上述第一服务的主用服务对应的 CPU处理能力,如果有, 则将上述第二节 点设备上配置的第一服务的第一备用服务配置为主用服务。 可选地,本实施例中的仲裁单元 62具体还可以判断上述第二节点设备是 否有上述第一服务的主用服务对应的 CPU处理能力,如果没有, 则判断上述 第三节点设备是否有上述第一服务的主用服务对应的 CPU 处理能力, 如果 有, 则将上述第三节点设备上配置的第一服务的第二备用服务配置为主用服 务, 以使得上述第三节点设备上配置的第一服务的主用服务从上述第二节点 设备上配置的第一服务的第一备用服务获得上述备份的第一服务的业务数 据, 并进行业务处理。
可选地, 如果第一节点设备上配置第一服务的类型 /个数较多或者第一服 务的启动时间较短, 那么, 第三节点设备上配置的对应的第二备用服务可以 不启动, 然后在第三节点设备上配置的第一服务的第二备用服务被配置为主 用服务时再启动, 并从第二节点设备上配置的第一备用服务获得备份的第一 服务的业务数据, 并进行业务处理。 如果第一节点设备上配置第一服务的类 型 /个数较少或者第一服务的启动时间较长, 那么, 第三节点设备上配置的对 应的第二备用服务可以先启动, 但是不进行任何操作, 然后在第三节点设备 上配置的第一服务的第二备用服务被配置为主用服务时, 再从第二节点设备 上配置的第一备用服务获得备份的第一服务的业务数据, 并进行业务处理。
可选地, 如果第二节点设备上配置第二服务的类型 /个数较多或者第二服 务的启动时间较短, 那么, 第三节点设备上配置的对应的第二备用服务可以 不启动, 并从第一节点设备上配置的第一备用服务获得备份的第二服务的业 务数据, 并进行业务处理, 然后在第三节点设备上配置的第二服务的第二备 用服务被配置为主用服务时再启动。 如果第二节点设备上配置第二服务的类 型 /个数较少或者第二服务的启动时间较长, 那么, 第三节点设备上配置的对 应的第二备用服务可以先启动, 但是不进行任何操作, 然后在第三节点设备 上配置的第二服务的第二备用服务被配置为主用服务时, 再从第一节点设备 上配置的第一备用服务获得备份的第二服务的业务数据, 并进行业务处理。
可选地, 本实施例中, 第二节点设备上可以不为第一服务的第一备用服 务预留对应的 CPU处理能力。如果第二节点设备上配置的第二服务的主用服 务满负荷运行, 那么, 当监控单元 61检测到第一节点设备上配置的第一服务 的主用服务故障时, 由于第一节点设备上此时第二节点设备已经没有第一服 务的第一备用服务或第一节点设备对应的 CPU处理能力, 所以, 此时, 第二 节点设备上配置的任一第一服务的第一备用服务均不会被配置为主用服务。
可选地, 本实施例中, 第二节点设备上还可以为至少一个第一服务的第 一备用服务预留对应的 CPU处理能力。如果第二节点设备上配置的第二服务 的主用服务满负荷运行,那么, 当监控单元 61检测到第一节点设备上配置的 第一服务的主用服务故障时, 由于第一节点设备上此时第二节点设备预留了 至少一个第一服务的第一备用服务对应的 CPU处理能力, 所以, 此时, 第二 节点设备上配置的至少一个第一服务的备用服务可以被配置为主用服务。
进一步地, 本实施例中,仲裁单元还用于当监控单元 61检测到第一节点 设备上故障的第一服务的主用服务恢复正常时, 则可以将恢复正常的第一服 务的主用服务配置为第一服务的第一备用服务, 并通知给第二节点设备, 以 使第二节点设备上配置的第一服务的主用服务将该第一服务的业务数据备份 到第一节点设备上配置的第一服务的第一备用服务, 以及将第一节点设备上 配置的第一服务的第一备用服务配置为主用服务, 并将第二节点设备上配置 的第一服务的主用服务配置为第一备用服务; 或者还可以将恢复正常的第一 服务的主用服务配置为第一服务的第一备用服务, 并通知给第三节点设备, 以使第三节点设备上配置的第一服务的主用服务将该第一服务的业务数据备 份到第一节点设备上配置的第一服务的第一备用服务, 以及将第一节点设备 上配置的第一服务的第一备用服务配置为主用服务, 并将第三节点设备上配 置的第一服务的主用服务配置为第二备用服务, 从而实现了故障服务或故障 节点设备重启恢复正常之后在节点设备上的正常运行。
本实施例中, 通过每个服务可以配置一个主用服务和两个备用服务, 其 中,第一服务的主用服务和第二服务的一个备用服务配置到第一节点设备上, 第一服务的一个备用服务和第二服务的主用服务配置到第二节点设备上, 第 一服务的另一个备用服务和第二服务的另一个备用服务配置到第三节点设备 上, 并且主用服务在运行的同时将对应的业务数据备份到交叉配置节点设备 (即第一节点设备或第二节点设备)上的备用服务上, 使得当监控单元检测 到第一节点设备上配置的第一服务的主用服务故障时, 仲裁单元则可以将另 两个节点设备(即第二节点设备和第三节点设备) 中的一个节点设备上配置 的该服务的备用服务配置为主用服务, 继续进行业务处理, 能够避免现有技 术中由于一个节点设备上配置的主用服务正常时, 配置对应的备用服务的另 一节点设备的 CPU—直处于空闲状态而导致的另一节点设备上的 CPU没有 被充分利用的问题, 从而提高了节点设备的 CPU利用率。
所属领域的技术人员可以清楚地了解到, 为描述的方便和简洁, 上述描 述的装置和单元的具体工作过程, 可以参考前述方法实施例中的对应过程, 在此不再赘述。
在本申请所提供的几个实施例中, 应该理解到, 所揭露的装置和方法, 可以通过其它的方式实现。 例如, 以上所描述的装置实施例仅仅是示意性的, 例如, 所述单元的划分, 仅仅为一种逻辑功能划分, 实际实现时可以有另外 的划分方式, 例如多个单元或组件可以结合或者可以集成到另一个系统, 或 一些特征可以忽略, 或不执行。 另一点, 所显示或讨论的相互之间的耦合或 直接耦合或通信连接可以是通过一些接口, 装置或单元的间接耦合或通信连 接, 可以是电性, 机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的, 作 为单元显示的部件可以是或者也可以不是物理单元, 即可以位于一个地方, 或者也可以分布到多个网络单元上。 可以根据实际的需要选择其中的部分或 者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中, 也可以是各个单元单独物理存在, 也可以两个或两个以上单元集成在一个单 元中。 上述集成的单元既可以采用硬件的形式实现, 也可以采用硬件加软件 功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元, 可以存储在一个计算机 可读取存储介质中。 上述软件功能单元存储在一个存储介质中, 包括若干指 令用以使得一台计算机设备(可以是个人计算机, 服务器, 或者网络设备等) 执行本发明各个实施例所述方法的部分步骤。 而前述的存储介质包括: U盘、 移动硬盘、 只读存储器(Read-Only Memory, 简称 ROM )、 随机存取存储 器( Random Access Memory, 简称 RAM )、 磁碟或者光盘等各种可以存储 程序代码的介质。
最后应说明的是: 以上实施例仅用以说明本发明的技术方案, 而非对其 限制; 尽管参照前述实施例对本发明进行了详细的说明, 本领域的普通技术 人员应当理解: 其依然可以对前述各实施例所记载的技术方案进行修改, 或 者对其中部分技术特征进行等同替换; 而这些修改或者替换, 并不使相应技 术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

权 利 要求
1、一种通信系统中节点设备上配置的服务故障的处理方法 ,其特征在于 , 所述通信系统包括第一节点设备、 第二节点设备和第三节点设备; 所述第一 节点设备上配置第一服务的主用服务和第二服务的第一备用服务, 所述第二 节点设备上配置所述第二服务的主用服务和所述第一服务的第一备用服务, 所述第三节点设备上配置所述第一服务的第二备用服务和所述第二服务的第 二备用服务; 其中, 所述第一服务的主用服务将该第一服务的业务数据备份 到所述第一服务的第一备用服务, 所述第二服务的主用服务将该第二服务的 业务数据备份到所述第二服务的第一备用服务; 所述方法包括:
检测所述第一服务的主用服务和所述第二服务的主用服务的工作状态, 所述工作状态包括正常和故障;
当检测到所述第一服务的主用服务故障时,
根据所述第二节点设备的剩余 CPU处理能力,将所述第二节点设备上配 置的第一服务的第一备用服务配置为主用服务, 以使得所述第二节点设备上 配置的第一服务的主用服务进行业务处理; 或者
根据所述第二节点设备的剩余 CPU 处理能力和所述第三节点设备的剩 余 CPU处理能力,将所述第三节点设备上配置的第一服务的第二备用服务配 置为主用服务, 以使得所述第三节点设备上配置的第一服务的主用服务从所 述第二节点设备上配置的第一服务的第一备用服务获得所述备份的第一服务 的业务数据, 并进行业务处理。
2、 根据权利要求 1所述的方法, 其特征在于, 所述根据所述第二节点设 备的剩余 CPU处理能力,将所述第二节点设备上配置的第一服务的第一备用 服务配置为主用服务, 包括:
判断所述第二节点设备是否有所述第一服务的主用服务对应的 CPU 处 理能力, 如果有, 则将所述第二节点设备上配置的第一服务的第一备用服务 配置为主用服务。
3、 根据权利要求 1所述的方法, 其特征在于, 所述根据所述第二节点设 备的剩余 CPU处理能力和所述第三节点设备的剩余 CPU处理能力, 将所述 第三节点设备上配置的第一服务的第二备用服务配置为主用服务, 包括: 判断所述第二节点设备是否有所述第一服务的主用服务对应的 CPU 处 理能力, 如果没有, 则判断所述第三节点设备是否有所述第一服务的主用服 务对应的 CPU处理能力,如果有, 则将所述第三节点设备上配置的第一服务 的第二备用服务配置为主用服务, 以使得所述第三节点设备上配置的第一服 务的主用服务从所述第二节点设备上配置的第一服务的第一备用服务获得所 述备份的第一服务的业务数据, 并进行业务处理。
4、根据权利要求 1至 3任一权利要求所述的方法, 其特征在于, 所述第 三节点设备上配置的第一服务的第二备用服务和第二服务的第二备用服务启 动或者不启动。
5、 根据权利要求 1至 4任一权利要求所述的方法, 其特征在于, 所述第二节点设备上不预留所述第一服务的第一备用服务对应的 CPU 处理能力; 或者
所述第二节点设备上预留至少一个第一服务的第一备用服务对应的
CPU处理能力。
6、根据权利要求 1至 5任一权利要求所述的方法, 其特征在于, 所述方 法还包括:
当检测到所述第一节点设备上故障的第一服务的主用服务恢复正常时, 将所述恢复正常的第一服务的主用服务配置为所述第一服务的第一备用 服务, 并通知给所述第二节点设备, 以使所述第二节点设备上配置的第一服 务的主用服务将该第一服务的业务数据备份到所述第一节点设备上配置的第 一服务的第一备用服务, 以及将所述第一节点设备上配置的第一服务的第一 备用服务配置为主用服务, 并将所述第二节点设备上配置的第一服务的主用 服务配置为第一备用服务; 或者 将所述恢复正常的第一服务的主用服务配置为所述第一服务的第一备用 服务, 并通知给所述第三节点设备, 以使所述第三节点设备上配置的第一服 务的主用服务将该第一服务的业务数据备份到所述第一节点设备上配置的第 一服务的第一备用服务, 以及将所述第一节点设备上配置的第一服务的第一 备用服务配置为主用服务, 并将所述第三节点设备上配置的第一服务的主用 服务配置为第二备用服务。
7、一种通信系统中节点设备上配置的服务故障的处理装置,其特征在于, 所述通信系统包括第一节点设备、 第二节点设备和第三节点设备; 所述第一 节点设备上配置第一服务的主用服务和第二服务的第一备用服务, 所述第二 节点设备上配置第二服务的主用服务和第一服务的第一备用服务, 所述第三 节点设备上配置第一服务的第二备用服务和第二服务的第二备用服务;其中, 所述第一服务的主用服务将该第一服务的业务数据备份到所述第一服务的第 一备用服务, 所述第二服务的主用服务将该第二服务的业务数据备份到所述 第二服务的第一备用服务; 所述装置包括:
监控单元, 用于检测所述第一服务的主用服务和所述第二服务的主用服 务的工作状态, 所述工作状态包括正常和故障;
仲裁单元,用于当所述监控单元检测到所述第一服务的主用服务故障时, 根据所述第二节点设备的剩余 CPU处理能力,将所述第二节点设备上配 置的第一服务的第一备用服务配置为主用服务, 以使得所述第二节点设备上 配置的第一服务的主用服务进行业务处理; 或者
根据所述第二节点设备的剩余 CPU 处理能力和所述第三节点设备的剩 余 CPU处理能力,将所述第三节点设备上配置的第一服务的第二备用服务配 置为主用服务, 以使得所述第三节点设备上配置的第一服务的主用服务从所 述第二节点设备上配置的第一服务的第一备用服务获得所述备份的第一服务 的业务数据, 并进行业务处理。
8、 根据权利要求 7所述的装置, 其特征在于, 所述仲裁单元具体用于 判断所述第二节点设备是否有所述第一服务的主用服务对应的 CPU 处 理能力, 如果有, 则将所述第二节点设备上配置的第一服务的第一备用服务 配置为主用服务。
9、 根据权利要求 7所述的装置, 其特征在于, 所述仲裁单元具体用于 判断所述第二节点设备是否有所述第一服务的主用服务对应的 CPU 处 理能力, 如果没有, 则判断所述第三节点设备是否有所述第一服务的主用服 务对应的 CPU处理能力,如果有, 则将所述第三节点设备上配置的第一服务 的第二备用服务配置为主用服务, 以使得所述第三节点设备上配置的第一服 务的主用服务从所述第二节点设备上配置的第一服务的第一备用服务获得所 述备份的第一服务的业务数据, 并进行业务处理。
10、 根据权利要求 7至 9任一权利要求所述的装置, 其特征在于, 所述 第三节点设备上配置的第一服务的第二备用服务和第二服务的第二备用服务 启动或者不启动。
11、 根据权利要求 7至 10任一权利要求所述的装置, 其特征在于, 所述第二节点设备上不预留所述第一服务的第一备用服务对应的 CPU 处理能力; 或者
所述第二节点设备上预留至少一个第一服务的第一备用服务对应的
CPU处理能力。
12、 根据权利要求 7至 11任一权利要求所述的装置, 其特征在于, 所 述仲裁单元还用于
当所述监控单元检测到所述第一节点设备上故障的第一服务的主用服务 恢复正常时,
将所述恢复正常的第一服务的主用服务配置为所述第一服务的第一备用 服务, 并通知给所述第二节点设备, 以使所述第二节点设备上配置的第一服 务的主用服务将该第一服务的业务数据备份到所述第一节点设备上配置的第 一服务的第一备用服务, 以及将所述第一节点设备上配置的第一服务的第一 备用服务配置为主用服务, 并将所述第二节点设备上配置的第一服务的主用 服务配置为第一备用服务; 或者
将所述恢复正常的第一服务的主用服务配置为所述第一服务的第一备用 服务, 并通知给所述第三节点设备, 以使所述第三节点设备上配置的第一服 务的主用服务将该第一服务的业务数据备份到所述第一节点设备上配置的第 一服务的第一备用服务, 以及将所述第一节点设备上配置的第一服务的第一 备用服务配置为主用服务, 并将所述第三节点设备上配置的第一服务的主用 服务配置为第二备用服务。
PCT/CN2011/078372 2011-08-12 2011-08-12 通信系统中节点设备上配置的服务故障的处理方法及装置 WO2012119388A1 (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
PCT/CN2011/078372 WO2012119388A1 (zh) 2011-08-12 2011-08-12 通信系统中节点设备上配置的服务故障的处理方法及装置
CN201180001567.5A CN102349266B (zh) 2011-08-12 2011-08-12 通信系统中节点设备上配置的服务故障的处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2011/078372 WO2012119388A1 (zh) 2011-08-12 2011-08-12 通信系统中节点设备上配置的服务故障的处理方法及装置

Publications (1)

Publication Number Publication Date
WO2012119388A1 true WO2012119388A1 (zh) 2012-09-13

Family

ID=45546531

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2011/078372 WO2012119388A1 (zh) 2011-08-12 2011-08-12 通信系统中节点设备上配置的服务故障的处理方法及装置

Country Status (2)

Country Link
CN (1) CN102349266B (zh)
WO (1) WO2012119388A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5537600B2 (ja) * 2012-05-15 2014-07-02 株式会社Nttドコモ 制御ノード及び通信制御方法
CN104182300B (zh) * 2014-08-19 2017-04-12 北京京东尚科信息技术有限公司 一种集群中虚拟机的备份方法及系统
CN108471364B (zh) * 2018-06-28 2021-05-28 新华三技术有限公司 一种异常处理方法及装置
CN115208822B (zh) * 2022-09-15 2023-01-24 苏州浪潮智能科技有限公司 一种报文转发方法、装置、设备及计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1863110A (zh) * 2005-05-13 2006-11-15 中兴通讯股份有限公司 一种家庭网络中多个服务器设备协同工作的方法
CN101060391A (zh) * 2007-05-16 2007-10-24 华为技术有限公司 主备服务器切换方法及系统及主用服务器、备用服务器
CN101094102A (zh) * 2007-07-18 2007-12-26 杭州华三通信技术有限公司 路由设备的主备切换方法和路由备份系统
US20100030789A1 (en) * 2008-07-30 2010-02-04 Fujitsu Limited Information management system

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100512292C (zh) * 2005-09-01 2009-07-08 华为技术有限公司 一种实时恢复业务的装置及方法
CN1866804B (zh) * 2005-10-19 2011-04-20 华为技术有限公司 对无源光网络的主干光纤进行故障保护倒换的方法
CN100370761C (zh) * 2005-10-26 2008-02-20 华为技术有限公司 一种智能网业务控制设备容灾系统
TWI416901B (zh) * 2005-11-30 2013-11-21 Ibm 故障容忍之異動處理系統

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1863110A (zh) * 2005-05-13 2006-11-15 中兴通讯股份有限公司 一种家庭网络中多个服务器设备协同工作的方法
CN101060391A (zh) * 2007-05-16 2007-10-24 华为技术有限公司 主备服务器切换方法及系统及主用服务器、备用服务器
CN101094102A (zh) * 2007-07-18 2007-12-26 杭州华三通信技术有限公司 路由设备的主备切换方法和路由备份系统
US20100030789A1 (en) * 2008-07-30 2010-02-04 Fujitsu Limited Information management system

Also Published As

Publication number Publication date
CN102349266A (zh) 2012-02-08
CN102349266B (zh) 2013-11-06

Similar Documents

Publication Publication Date Title
US10601657B2 (en) Instance node management method and management device
US10628273B2 (en) Node system, server apparatus, scaling control method, and program
CN107526659B (zh) 用于失效备援的方法和设备
US20210349777A1 (en) Fault processing method, related device, and computer storage medium
US9367340B2 (en) Resource management method and apparatus for virtual machine system, and virtual machine system
US8074222B2 (en) Job management device, cluster system, and computer-readable medium storing job management program
WO2016058307A1 (zh) 资源的故障处理方法及装置
JPWO2016121728A1 (ja) ネットワーク機能仮想化管理およびオーケストレーション装置とシステムと管理方法とプログラム
WO2015154246A1 (zh) 基于网络功能虚拟化的故障处理方法及装置、系统
WO2015157897A1 (zh) 一种云计算架构下的容灾数据中心配置方法及装置
WO2016202051A1 (zh) 一种通信系统中管理主备节点的方法和装置及高可用集群
WO2016078529A1 (zh) 业务处理方法、装置及系统
WO2016045439A1 (zh) 一种vnfm容灾保护的方法、装置和nfvo、存储介质
WO2017143537A1 (zh) 一种光线路终端及其主、从设备升级的方法
WO2012119388A1 (zh) 通信系统中节点设备上配置的服务故障的处理方法及装置
WO2016065552A1 (zh) 一种心跳周期的设置方法及终端
US20130238787A1 (en) Cluster system
WO2017101446A1 (zh) 无线制式的处理方法、装置及基站
CN104572241A (zh) 应用程序的切换方法及装置、系统
WO2019113969A1 (zh) 一种寻呼用户设备的方法、第一网络设备及用户设备
CN100488129C (zh) 处理批配置的方法和网管设备及网络系统
CN114610538A (zh) 一种快速备份、还原系统盘的方法及装置
JP7000797B2 (ja) 起動管理装置、起動管理システム、起動管理方法、および、起動管理プログラム
CN108476036A (zh) 通信设备、通信处理方法、通信处理装置及通信系统
CN115499296B (zh) 一种云桌面热备管理方法、装置及系统

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 201180001567.5

Country of ref document: CN

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 11860560

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 11860560

Country of ref document: EP

Kind code of ref document: A1