WO2012009936A1 - 集群管理系统及方法 - Google Patents

集群管理系统及方法 Download PDF

Info

Publication number
WO2012009936A1
WO2012009936A1 PCT/CN2010/080402 CN2010080402W WO2012009936A1 WO 2012009936 A1 WO2012009936 A1 WO 2012009936A1 CN 2010080402 W CN2010080402 W CN 2010080402W WO 2012009936 A1 WO2012009936 A1 WO 2012009936A1
Authority
WO
WIPO (PCT)
Prior art keywords
cluster management
processes
module
service
management module
Prior art date
Application number
PCT/CN2010/080402
Other languages
English (en)
French (fr)
Inventor
胡良俊
全锐
Original Assignee
中兴通讯股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 中兴通讯股份有限公司 filed Critical 中兴通讯股份有限公司
Priority to US13/811,371 priority Critical patent/US20130139178A1/en
Priority to EP10854966.8A priority patent/EP2597818A4/en
Publication of WO2012009936A1 publication Critical patent/WO2012009936A1/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/04Network management architectures or arrangements
    • H04L41/042Network management architectures or arrangements comprising distributed management centres cooperatively managing the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/02Standardisation; Integration
    • H04L41/024Standardisation; Integration using relational databases for representation of network management data, e.g. managing via structured query language [SQL]

Definitions

  • a cluster management system can be divided into multiple subsystems: a performance management subsystem, an alarm management subsystem, and a security management subsystem. The same subsystem can be divided into multiple functional modules: a southbound module, a northbound module, and a server processing module, wherein each module can be called a service.
  • a cluster management system is a system composed of numerous monthly services. With the continuous development of communication technologies, management networks are becoming larger and larger, and their types are various. Each type of network has its own network management system.
  • the distributed technology is usually used in the related art, that is, the network management service is distributed in multiple hosts, and the hardware resources of multiple machines are used to improve the management capability of the network management.
  • 1 is a schematic diagram of a deployment structure of a cluster management system according to the related art, including a management process and a plurality of slave processes, wherein the state of all slave processes in the system is controlled by the management process to improve the management capability of the network management.
  • this management process manages the structure of multiple slave processes, and the reliability of the management process is very high, because once the management process fails, the entire cluster management system will not work.
  • the present invention has been made in view of the problem that a cluster management system uses a management process and a plurality of slave processes in the related art, and once the management process fails, the entire cluster management system will not work, and the main object of the present invention is to provide A cluster management system and method to solve the above problems.
  • a cluster management system is provided.
  • the cluster management system includes: a storage module, configured to store a process identifier of a plurality of processes and a communication address of a plurality of processes; and a plurality of cluster management modules corresponding to the plurality of processes, Each of the plurality of cluster management modules is configured to acquire, from the storage module, a communication address of a process other than the corresponding process in the plurality of processes, and use other communication addresses of the process to acquire other processes.
  • the plurality of service management modules are respectively corresponding to the plurality of cluster management modules, wherein each of the plurality of service management modules is configured to acquire services included in other processes from the corresponding cluster management module. And used to call the services contained in other processes.
  • the cluster management system further includes: a plurality of listening modules, corresponding to the plurality of service management modules, configured to record available information of services included in other processes acquired by the corresponding service management module, wherein the available information is used Indicates that the services included in other processes are available or unavailable; each of the multiple service management modules is further configured to receive available information from its corresponding listening module, and to invoke services included in other processes according to available information. .
  • the cluster management system further includes: a plurality of timers corresponding to the plurality of cluster management modules; each of the plurality of cluster management modules is further configured to: when the corresponding timer expires, The cluster management module of the plurality of cluster management modules sends a detection message, where the detection message is used to detect a connection relationship between itself and other cluster management modules; and each cluster management module of the plurality of cluster management modules further For deleting a response message of one or more cluster management modules when it is detected that no response message is received from one or more cluster management modules in other cluster management modules. Further, each of the plurality of cluster management modules is further configured to write the communication address of the process corresponding to the storage module to the storage module.
  • the cluster management system further includes: a determining module, configured to determine whether the storage module has saved a process identifier of one or more processes in the plurality of processes; and an update module, configured to update one when the determination result is yes Or a communication address of a plurality of processes, wherein the communication address includes at least one of the following: an internet protocol IP address, and a listening port information.
  • a cluster management module communicate through UDP.
  • each of the plurality of cluster management modules is further configured to manage the tasks included in the process corresponding to the cluster management module corresponding to the cluster management module.
  • the cluster management method includes: the cluster management module acquires, from the storage module, a communication address of a process other than the corresponding process among the plurality of processes; the cluster management module uses the communication address of the other process to acquire the service included in the other process, And sent to its corresponding service management module; the service management module calls the services included in other processes. Further, before the service management module calls the service included in the other process, the method further includes: the monitoring module records the available information of the service included in the other process acquired by the service management module corresponding to the service module, where the available information is used to indicate the service included by the other process.
  • the cluster management module further includes: when the timer corresponding to the cluster management module arrives, The cluster management module sends a detection message to the cluster management module, where the detection message is used to detect the connection relationship between the cluster management module and the other cluster management module. When the cluster management module detects that it is not received from other cluster management modules, When one or more cluster management modules respond to a message, the process corresponding to one or more cluster management modules is deleted.
  • the method further includes: the cluster management module writing the communication address of the process corresponding to the storage module .
  • the distributed design of the cluster is used to solve the problem that the cluster management system uses one management process and multiple slave processes in the related technology. Once the management process fails, the entire cluster management system will not work, and the service is guaranteed. The normal use of the network management has improved.
  • FIG. 1 is a schematic diagram of a deployment structure of a cluster management system according to the related art
  • FIG. 2 is a structural block diagram of a cluster management system according to an embodiment of the present invention
  • FIG. 3 is a cluster management system according to a preferred embodiment of the present invention
  • Schematic diagram of the deployment structure 4 is a flowchart of a cluster management method in accordance with an embodiment of the present invention
  • FIG. 1 is a schematic diagram of a deployment structure of a cluster management system according to the related art
  • FIG. 2 is a structural block diagram of a cluster management system according to an embodiment of the present invention
  • FIG. 3 is a cluster management system according to a preferred embodiment of the present invention
  • 4 is a flowchart of a cluster management method in accordance with an embodiment of the present invention
  • FIG. 5 is an interaction flowchart of a cluster management method in a preferred embodiment of the present invention.
  • DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS It should be noted that the embodiments in the present application and the features in the embodiments may be combined with each other without conflict. The invention will be described in detail below with reference to the drawings in conjunction with the embodiments.
  • a cluster management system is provided. 2 is a structural block diagram of a cluster management system including a storage module 22, a cluster management module 24, and a service management module 26, in accordance with an embodiment of the present invention. The structure is described in detail below.
  • the storage module 22 is configured to save a process identifier of multiple processes and a communication address of multiple processes.
  • a plurality of cluster management modules 24 are connected to the storage module 22 and correspond to a plurality of processes, wherein each of the plurality of cluster management modules 24 is configured to acquire multiple processes from the storage module 22 The communication address of other processes other than the corresponding process, and the service address of other processes is used to obtain the services included in other processes.
  • the plurality of service management modules 26 correspond to the plurality of cluster management modules 24 and are respectively connected to their corresponding cluster management modules 24, wherein each of the plurality of service management modules 26 uses The service included in the process corresponding to the cluster management module 24 corresponding to the host management module 24 is used to acquire services included in other processes from the cluster management module 24 corresponding thereto, and is used to invoke services included in other processes.
  • the cluster management system uses one management process and multiple slave processes, so that once the management process fails, the entire cluster management system will not work.
  • the distributed design of the cluster is used, and each process can obtain the monthly tasks included in other processes through the cluster management module 24, so that when a process fails, other processes that have the monthly service can be selected. Then, by calling the service in the other process, the normal use of the service can be guaranteed.
  • the foregoing storage module 22 may be a database.
  • the management manner of the service management module 26 may refer to the management process of the related art and the management mode of multiple slave processes.
  • the service management module determines which process to send to.
  • the cluster management system further includes: a plurality of listening modules 28 corresponding to the plurality of service management modules 26, configured to record available information of services included in other processes acquired by the corresponding service management module 26, wherein The available information is used to indicate that the services included in other processes are available or unavailable; each of the plurality of service management modules 26 is further configured to receive available information from its corresponding listening module 28 and to use the available information. , call the services contained in other processes.
  • the listening module 28 records the available information of the services included in other processes, and can provide support for the operations invoked by the service management module 26, so that the service management module 26 selects other processes in which a certain service exists, and then, by calling The service in the other process guarantees the normal use of the service.
  • the cluster management system further includes: a plurality of timers corresponding to the plurality of cluster management modules 24; each of the plurality of cluster management modules 24 is further configured to use its own corresponding timer to Sending a detection message to the cluster management module 24 other than itself in the plurality of cluster management modules 24, wherein the detection message is used to detect the connection relationship between itself and other cluster management modules 24; and the plurality of cluster management modules 24
  • Each cluster management module 24 is further configured to delete one or more processes corresponding to the cluster management module 24 when it detects that a response message from one or more of the other cluster management modules 24 has not been received.
  • the cluster management module 24 performs mutual communication detection by detecting messages to accurately delete processes corresponding to one or more cluster management modules 24 having communication problems.
  • each cluster management module 24 of the plurality of cluster management modules is further configured to write the communication address of the process corresponding to the storage module 22 to itself.
  • each cluster management module 24 of the plurality of cluster management modules 24 writes the communication address of the corresponding process to the storage module 22 for other cluster management modules 24 to obtain, which is beneficial to each cluster management module 24. Communicate the services contained in the corresponding process to achieve two-to-two disaster tolerance.
  • the cluster management system further includes a determining module, configured to determine whether the storage module has saved a process identifier of one or more processes in the plurality of processes, and an update module, configured to update when the determination result is yes.
  • IP Internet Protocol
  • the plurality of cluster management modules communicate through a User Data Protocol (UDP).
  • UDP User Data Protocol
  • the connectionless UDP communication protocol is used to reduce resource usage.
  • each of the plurality of cluster management modules is further configured to manage a service included in a process corresponding to the cluster management module corresponding to the cluster management module.
  • FIG. 3 is a schematic diagram of a deployment structure of a cluster management system according to a preferred embodiment of the present invention.
  • network management processes A, B, and C are all connected to the same database, and each network management process includes a cluster management module. , service management module, and thousands of services. Each process listens on a UDP port and writes it to the same database. After the cluster management module obtains the IP and port of the other two processes from the database, A, B, and C communicate with each other to obtain all the service information and transmit it to the service management module.
  • the service management module notifies the listening module that there are now al, a2, bl, b2 services available.
  • a service is to be invoked, taking process A as an example, assuming that service bl is to be called, since bl is provided in both processes B and C, the service management module invokes one of B or C according to a certain policy. If there is a call to service b2, then only process B can be called. Process A, B, and C also periodically send timing checks through the cluster management module. If a process quits unexpectedly, the service management module removes the services contained in the process and notifies the listening module that some services are unavailable.
  • FIG. 4 is a flowchart of a cluster management method according to an embodiment of the present invention, including the following steps S402 to S406.
  • the cluster management module 24 acquires the communication addresses of the processes other than the processes corresponding to the processes in the plurality of processes from the storage module 22.
  • step S404 the cluster management module 24 uses the communication address of the other process to acquire the service included in the other process, and sends the service to the corresponding service management module 26.
  • step S406 the service management module 26 invokes services included in other processes.
  • the cluster management system uses one management process and multiple slave processes, so that once the management process fails, the entire cluster management system will not work.
  • the distributed design of the cluster is used, and each process can obtain the monthly tasks included in other processes through the cluster management module 24, so that when a process fails, other processes that have the monthly service can be selected. Then, by calling the service in the other process, the normal use of the service can be guaranteed.
  • the foregoing storage module 22 may be a database.
  • the management manner of the service management module 26 may refer to the management process of the related art and the management mode of multiple slave processes. It should be noted that the monthly service management module 26 can also manage the services included in the process corresponding to the corresponding cluster management module.
  • the listening module 28 records the available information of the services included in the other processes acquired by the corresponding service management module 26, wherein the available information is used to indicate the services included in the other processes.
  • the listening module 28 sends the available information to the service management module 26; the service management module 26 performs an operation to invoke the services contained by other processes based on the available information.
  • the listening module 28 records the available information of the services included in other processes, and can provide support for the operations invoked by the service management module 26, so that the service management module 26 selects other processes in which a certain service exists, and then, by calling The service in the other process guarantees the normal use of the service.
  • the cluster management module 24 manages the plurality of clusters when the corresponding timer expires.
  • the cluster management module 24 in the module 24 except itself sends a detection message, wherein the detection message is used to detect its own connection with other cluster management modules 24. Relationships; The cluster management module 24 deletes the processes corresponding to one or more of the cluster management modules 24 when it detects that no response messages from one or more of the other cluster management modules 24 have been received. In the preferred embodiment, the cluster management module 24 performs mutual communication detection by detecting messages to accurately delete processes corresponding to one or more cluster management modules 24 having communication problems. At the same time, the timer can be used to control the frequency at which the cluster management module 24 sends the detection message, thereby avoiding the excessively frequent detection of the impact of the message on the communication network.
  • the cluster management module 24 Before the cluster management module 24 acquires the communication addresses of the processes other than the processes corresponding to the processes in the plurality of processes from the storage module 22, the cluster management module 24 writes the communication addresses of the processes corresponding to the processes to the storage module 22.
  • each cluster management module 24 of the plurality of cluster management modules 24 writes the communication address of the corresponding process to the storage module 22 for other cluster management modules 24 to obtain, which is beneficial to each cluster management module 24.
  • the cluster identifier is generated when the installation is performed, and multiple processes belonging to the same cluster jointly provide a set of external services of the network management, and their cluster identifiers are the same.
  • the process identifier is generated during installation, and the identifier of each process is different.
  • the process may be restarted.
  • the information of the process already exists in the storage module.
  • the process identifier is used to determine whether the process information already exists. If it exists, the IP and port information of the process is updated.
  • FIG. 5 is an interaction flowchart of a cluster management method according to a preferred embodiment of the present invention, including the following steps 4 to S 4 to S516. Step S502: After the A process starts, query the database, and use the cluster identifier and the process identifier to determine whether the A process information exists.
  • the process ID and the cluster ID are generated during the installation.
  • the process ID is different for each process.
  • the cluster ID is the same in the same cluster. If yes, update the communication IP address of the process and the listening port information of the process. If not, write the cluster ID of the process A, the process ID, the communication IP of the process, and the listening port information of the process to the database, and obtain other processes of the cluster. Information.
  • the database table can be designed in accordance with Table 1 below for the writing of the A process. Table 1 Schematic diagram of the database used to write the cluster ID, process ID, process IP address, and process listen port
  • Step S504 the A process sends a request message to other processes in the cluster. It should be noted that, in the preferred embodiment, it is assumed that the A process sends a UDP request message to the B process. If you use TCP connection, the process establishes a connection between two and two, the total number of connections is n*(nl). In the case of a large number of processes, the total number of connections is too large, which consumes a lot of system resources. Therefore, there is no connection UDP mode to transmit commands. The problem with UDP is that the message may be lost in the transmission. The solution is to retransmit the packet, that is, after sending a packet, waiting for the other party to confirm before sending the next packet.
  • Step S506 if the B process is normal, the B process sends a response message, and the content of the response message is the service information included in the B process.
  • Step S508 the A process sends the monthly service information included in the process to the B process.
  • Step S510 the A process notifies the monitoring module that the services in the B process are available.
  • Step S512 the B process notifies the monitoring module that the services in the A process are available.
  • Step S514 the A process sends a timing check command to the B process.
  • the B process also appears that several consecutive transmission timing check commands do not receive the timing check response from the A process, and the B process also determines that the A process is unavailable.
  • both the A process and the B process actually exist, and some of the service functions may be provided separately, but they are isolated from each other and cannot be called each other.
  • the preferred embodiment only describes the interaction between two processes. In actual applications, the interaction between multiple processes can refer to the interaction between the two processes, so that multiple processes can complete the management of the entire cluster. Therefore, the preferred embodiment can achieve the following technical effects:
  • a cluster management system and method which utilizes a distributed design of a cluster, and solves a related management process in which a cluster management system uses one management process and multiple slave processes. Once the management process fails, the entire cluster management system will not work, ensuring the normal use of the service and improving the management capabilities of the network management.
  • the above modules or steps of the present invention can be implemented by a general-purpose computing device, which can be concentrated on a single computing device or distributed over a network composed of multiple computing devices.
  • the invention is not limited to any specific combination of hardware and software.
  • the above is only the preferred embodiment of the present invention, and is not intended to limit the present invention, and various modifications and changes can be made to the present invention. Any modifications, equivalent substitutions, improvements, etc. made within the scope of the present invention are intended to be included within the scope of the present invention.

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Description

集群管理系统及方法 技术领域 本发明涉及通信领域, 具体而言, 涉及一种集群管理系统及方法。 背景技术 集群管理系统按可划分为多个子系统: 性能管理子系统、 告警管理子系 统和安全管理子系统等。 同一个子系统内又可分为多个功能模块: 南向模块、 北向模块和服务器处理模块等, 其中, 每个模块可称之为一个服务。 集群管 理系统就是由众多的月艮务组成的一个系统。 随着通讯技术的不断发展, 管理网络的规模越来越大, 并且其类型各种 各样, 各种类型的网络都有各自的网管系统。 为了管理上的方便, 对多种网 络施行统一管理非常必要, 这就对网管系统的管理能力和本身的性能提出了 很高要求。 为解决这个问题, 相关技术中通常釆用分布式设计, 即将网管的服务分 布式运行在多台主机中, 利用多台机器的硬件资源来提高网管的管理能力。 图 1是根据相关技术的集群管理系统的部署结构的示意图, 包括一个管理进 程以及多个从进程, 其中, 由管理进程控制系统中所有从进程的状态, 以提 高网管的管理能力。 但是, 这种由管理进程管理多个从进程的结构, 对管理进程可靠性的要 求非常高, 因为一旦该管理进程失效, 整个集群管理系统将都不能工作。 发明内容 针对相关技术中集群管理系统釆用一个管理进程和多个从进程, 一旦管 理进程失效, 整个集群管理系统将都不能工作的问题而提出本发明, 为此, 本发明的主要目的在于提供一种集群管理系统及方法, 以解决上述问题。 为了实现上述目的,根据本发明的一个方面,提供了一种集群管理系统。 才艮据本发明的集群管理系统包括: 存储模块, 用于保存多个进程的进程 标识和多个进程的通讯地址; 多个集群管理模块, 与多个进程——对应, 其 中, 多个集群管理模块中的每个集群管理模块均用于从存储模块获取多个进 程中除自身对应的进程之外的其它进程的通讯地址, 并使用其它进程的通讯 地址获取其它进程包含的服务; 多个服务管理模块, 与多个集群管理模块一 一对应, 其中, 多个服务管理模块中的每个服务管理模块均用于从自身对应 的集群管理模块获取其它进程包含的服务,并用于调用其它进程包含的服务。 进一步地, 上述集群管理系统还包括: 多个监听模块, 与多个服务管理 模块——对应, 用于记录自身对应的服务管理模块获取的其它进程包含的服 务的可用信息, 其中, 可用信息用于指示其它进程包含的服务可用或者不可 用; 多个服务管理模块中的每个服务管理模块还用于接收来自 自身对应的监 听模块的可用信息, 并用于根据可用信息, 调用其它进程包含的服务。 进一步地, 上述集群管理系统还包括: 多个定时器, 与多个集群管理模 块——对应; 多个集群管理模块中的每个集群管理模块还用于当自身对应的 定时器到时, 向多个集群管理模块中除自身之外的其它集群管理模块发送检 测消息, 其中, 检测消息用于检测自身与其它集群管理模块的连接关系; 以 及多个集群管理模块中的每个集群管理模块还用于当检测到没有接收到来自 其它集群管理模块中的一个或多个集群管理模块的响应消息时, 删除一个或 多个集群管理模块对应的进程。 进一步地, 多个集群管理模块中的每个集群管理模块还用于向存储模块 写入自身对应的进程的通讯地址。 进一步地, 上述集群管理系统还包括: 判断模块, 用于判断存储模块是 否已经保存有多个进程中的一个或多个进程的进程标识; 更新模块, 用于在 判断结果为是时, 更新一个或多个进程的通讯地址, 其中, 通讯地址包括以 下至少之一: 互联网协议 IP地址、 监听端口信息。 进一步地, 多个集群管理模块之间通过 UDP进行通讯。 进一步地, 多个集群管理模块中的每个集群管理模块还用于管理自身对 应的集群管理模块对应的进程包含的 艮务。 为了实现上述目的, 居本发明的另一个方面, 提供了一种集群管理方 法。 根据本发明的集群管理方法包括: 集群管理模块从存储模块获取多个进 程中除自身对应的进程之外的其它进程的通讯地址; 集群管理模块使用其它 进程的通讯地址获取其它进程包含的服务, 并发送给自身对应的服务管理模 块; 服务管理模块调用其它进程包含的服务。 进一步地, 在服务管理模块调用其它进程包含的服务之前, 还包括: 监 听模块记录自身对应的服务管理模块获取的其它进程包含的服务的可用信 息, 其中, 可用信息用于指示其它进程包含的服务可用或者不可用; 监听模 块向服务管理模块发送可用信息; 服务管理模块根据可用信息, 执行调用其 它进程包含的服务的操作。 进一步地, 在集群管理模块从存储模块获取多个进程中除自身对应的进 程之外的其它进程的通讯地址之前, 上述方法还包括: 集群管理模块当自身 对应的定时器到时, 向多个集群管理模块中除自身之外的其它集群管理模块 发送检测消息, 其中, 检测消息用于检测自身与其它集群管理模块的连接关 系; 集群管理模块当检测到没有接收到来自其它集群管理模块中的一个或多 个集群管理模块的响应消息时, 删除一个或多个集群管理模块对应的进程。 进一步地, 在集群管理模块从存储模块获取多个进程中除自身对应的进 程之外的其它进程的通讯地址之前, 上述方法还包括: 集群管理模块向存储 模块写入自身对应的进程的通讯地址。 通过本发明, 釆用集群的分布式设计, 解决了相关技术中集群管理系统 釆用一个管理进程和多个从进程, 一旦管理进程失效, 整个集群管理系统将 都不能工作的问题, 保证了服务的正常使用, 提高了网管的管理能力。 附图说明 此处所说明的附图用来提供对本发明的进一步理解, 构成本申请的一部 分, 本发明的示意性实施例及其说明用于解释本发明, 并不构成对本发明的 不当限定。 在附图中: 图 1是根据相关技术的集群管理系统的部署结构的示意图; 图 2是 居本发明实施例的集群管理系统的结构框图; 图 3是 居本发明优选实施例的集群管理系统的部署结构的示意图; 图 4是 居本发明实施例的集群管理方法的流程图; 图 5是 居本发明优选实施例的集群管理方法的交互流程图。 具体实施方式 需要说明的是, 在不冲突的情况下, 本申请中的实施例及实施例中的特 征可以相互组合。 下面将参考附图并结合实施例来详细说明本发明。 根据本发明的实施例, 提供了一种集群管理系统。 图 2是根据本发明实 施例的集群管理系统的结构框图, 包括存储模块 22 , 集群管理模块 24和服 务管理模块 26。 下面对其结构进行详细描述。 存储模块 22 , 用于保存多个进程的进程标识和多个进程的通讯地址。 多个集群管理模块 24 , 连接至存储模块 22 , 与多个进程——对应, 其 中, 多个集群管理模块 24中的每个集群管理模块 24均用于从存储模块 22 获取多个进程中除自身对应的进程之外的其它进程的通讯地址, 并使用其它 进程的通讯地址获取其它进程包含的服务。 多个月艮务管理模块 26 , 与多个集群管理模块 24——对应, 并分别连接 至其对应的集群管理模块 24 , 其中, 多个服务管理模块 26中的每个服务管 理模块 26均用于管理自身对应的集群管理模块 24对应的进程包含的服务, 并用于从自身对应的集群管理模块 24获取其它进程包含的服务, 并用于调 用其它进程包含的服务。 相关技术中, 集群管理系统釆用一个管理进程和多个从进程, 这样, 一 旦管理进程失效, 整个集群管理系统将都不能工作。 本发明实施例中, 釆用 集群的分布式设计, 每个进程可以通过集群管理模块 24获取其它进程包含 的月艮务, 从而当某个进程失效时, 可以选择存在该月艮务的其它进程, 然后, 通过调用该其它进程中的该服务, 可以保证该服务的正常使用。 需要说明的是, 上述存储模块 22可以为数据库。 需要说明的是, 对于上述服务管理模块 26用于管理自身对应的集群管 理模块 24对应的进程包含的服务, 其管理方式可以参考相关技术中管理进 程和多个从进程的管理方式。 需要说明的是, 为提高负荷, 同一个服务在不同进程可能都存在, 当有 命令发到服务时, 由服务管理模块决定发给哪个进程处理。 优选地, 上述集群管理系统还包括: 多个监听模块 28 , 与多个服务管理 模块 26——对应, 用于记录自身对应的 艮务管理模块 26获取的其它进程包 含的服务的可用信息, 其中, 可用信息用于指示其它进程包含的服务可用或 者不可用; 多个服务管理模块 26中的每个服务管理模块 26还用于接收来自 自身对应的监听模块 28的可用信息, 并用于根据可用信息, 调用其它进程 包含的服务。 本优选实施例中, 监听模块 28记录了其它进程包含的服务的可用信息, 可以为服务管理模块 26调用的操作提供支持, 以便服务管理模块 26选择存 在某一服务的其它进程, 然后, 通过调用该其它进程中的该服务, 保证该服 务的正常使用。 优选地, 上述集群管理系统还包括: 多个定时器, 与多个集群管理模块 24——对应; 多个集群管理模块 24中的每个集群管理模块 24还用于当自身 对应的定时器到时, 向多个集群管理模块 24中除自身之外的其它集群管理 模块 24发送检测消息, 其中, 检测消息用于检测自身与其它集群管理模块 24的连接关系; 以及多个集群管理模块 24中的每个集群管理模块 24还用于 当检测到没有接收到来自其它集群管理模块 24中的一个或多个集群管理模 块 24的响应消息时, 删除一个或多个集群管理模块 24对应的进程。 本优选实施例中, 集群管理模块 24之间通过检测消息进行相互的通讯 检测, 以便准确删除通讯存在问题的一个或多个集群管理模块 24对应的进 程。 同时, 定时器可以用于控制集群管理模块 24发送检测消息的频率, 从 而避免过度频繁的检测消息给通讯网络的冲击。 优选地, 多个集群管理模块中的每个集群管理模块 24还用于向存储模 块 22写入自身对应的进程的通讯地址。 本优选实施例中, 多个集群管理模块 24中的每个集群管理模块 24将自 身对应的进程的通讯地址写入存储模块 22 , 以便其它集群管理模块 24进行 获取, 有利于各个集群管理模块 24对其对应的进程包含的服务进行通讯, 实现两两容灾。 优选地, 上述集群管理系统还包括判断模块, 用于判断所述存储模块是 否已经保存有多个进程中的一个或多个进程的进程标识; 更新模块, 用于在 判断结果为是时, 更新一个或多个进程的通讯地址, 其中, 通讯地址包括以 下至少之一: 互联网协议 (Internet Protocol, 简称为 IP ) 地址、 监听端口信 息。 优选地, 多个集群管理模块之间通过用户数据协议( User Date Protocol , 简称为 UDP ) 进行通讯。 本优选实施例中, 釆用无连接的 UDP通讯协议, 可以减少资源占用。 优选地, 多个集群管理模块中的每个集群管理模块还用于管理自身对应 的集群管理模块对应的进程包含的服务。 本发明还提供了一个优选实施例, 结合了上述多个优选实施例的技术方 案, 下面结合图 3来详细描述。 图 3是 居本发明优选实施例的集群管理系统的部署结构的示意图, 如 图 3所示, 网管进程 A, B , C都连接到同一个数据库, 每个网管进程中都 包含有集群管理模块, 服务管理模块, 以及若千服务。 每个进程都会监听一 个 UDP端口, 并写入到同一个数据库中。 集群管理模块从数据库中获取另 外两个进程的 IP和端口后, A, B, C相互通讯, 获取所有的服务信息, 并 传给服务管理模块。 服务管理模块通知监听模块, 现在有 al , a2, bl , b2 这些服务可用。 当要调用某个服务时, 以进程 A为例, 假定要调用服务 bl , 由于 bl在进程 B和 C中都提供, 服务管理模块按照一定策略调用 B或者 C 中的一个。 如有是调用服务 b2, 那么只能调用到进程 B。 进程 A, B , C之间还通过集群管理模块定时发送定时检查, 如果某个 进程意外退出, 由服务管理模块将这个进程包含的服务去掉, 并通知监听模 块某些服务不可用。 假定 B意外退出, 那么要通知监听模块 b2不可用, 但 是 bl仍然可用, 因为 bl在 C进程中还存在, 对 bl的调用可以到 C进程。 根据本发明的实施例, 还提供了一种集群管理方法, 该集群管理方法可 以基于上述集群管理系统而实现。 图 4是才艮据本发明实施例的集群管理方法 的流程图, 包括如下的步骤 S402至步骤 S406。 步骤 S402,集群管理模块 24从存储模块 22获取多个进程中除自身对应 的进程之外的其它进程的通讯地址。 步骤 S404, 集群管理模块 24使用其它进程的通讯地址获取其它进程包 含的服务, 并发送给自身对应的服务管理模块 26。 步骤 S406, 服务管理模块 26调用其它进程包含的服务。 相关技术中, 集群管理系统釆用一个管理进程和多个从进程, 这样, 一 旦管理进程失效, 整个集群管理系统将都不能工作。 本发明实施例中, 釆用 集群的分布式设计, 每个进程可以通过集群管理模块 24获取其它进程包含 的月艮务, 从而当某个进程失效时, 可以选择存在该月艮务的其它进程, 然后, 通过调用该其它进程中的该服务, 可以保证该服务的正常使用。 需要说明的是, 上述存储模块 22可以为数据库。 需要说明的是, 对于上述服务管理模块 26用于管理自身对应的集群管 理模块 24对应的进程包含的服务, 其管理方式可以参考相关技术中管理进 程和多个从进程的管理方式。 需要说明的是, 上述月艮务管理模块 26还可以管理自身对应的集群管理 模块对应的进程包含的服务。 优选地, 在服务管理模块 26调用其它进程包含的服务之前, 监听模块 28记录自身对应的服务管理模块 26获取的其它进程包含的服务的可用信息, 其中, 可用信息用于指示其它进程包含的服务可用或者不可用; 监听模块 28 向服务管理模块 26发送可用信息; 服务管理模块 26根据可用信息, 执行调 用其它进程包含的服务的操作。 本优选实施例中, 监听模块 28记录了其它进程包含的服务的可用信息, 可以为服务管理模块 26调用的操作提供支持, 以便服务管理模块 26选择存 在某一服务的其它进程, 然后, 通过调用该其它进程中的该服务, 保证该服 务的正常使用。 优选地, 在集群管理模块 24从存储模块 22获取多个进程中除自身对应 的进程之外的其它进程的通讯地址之前, 集群管理模块 24当自身对应的定 时器到时, 向多个集群管理模块 24中除自身之外的其它集群管理模块 24发 送检测消息, 其中, 检测消息用于检测自身与其它集群管理模块 24的连接 关系; 集群管理模块 24当检测到没有接收到来自其它集群管理模块 24中的 一个或多个集群管理模块 24的响应消息时, 删除一个或多个集群管理模块 24对应的进程。 本优选实施例中, 集群管理模块 24之间通过检测消息进行相互的通讯 检测, 以便准确删除通讯存在问题的一个或多个集群管理模块 24对应的进 程。 同时, 定时器可以用于控制集群管理模块 24发送检测消息的频率, 从 而避免过度频繁的检测消息给通讯网络的冲击。 优选地, 在集群管理模块 24从存储模块 22获取多个进程中除自身对应 的进程之外的其它进程的通讯地址之前, 集群管理模块 24向存储模块 22写 入自身对应的进程的通讯地址。 本优选实施例中, 多个集群管理模块 24中的每个集群管理模块 24将自 身对应的进程的通讯地址写入存储模块 22 , 以便其它集群管理模块 24进行 获取, 有利于各个集群管理模块 24对其对应的进程包含的服务进行通讯, 实现两两容灾。 优选地, 集群标识是安装的时候生成, 属于同一个集群的多个进程共同 提供一套网管对外的服务, 它们的集群标识相同。 优选地, 进程标识是安装时候生成, 每个进程的标识都不一样。 进程可 能是重启, 本进程的信息已经存在存储模块用, 用进程标识判断本进程信息 是否已经存在, 如果存在则更新一下本进程的 IP , 端口信息。 本发明还提供了一个优选实施例, 结合了上述多个优选实施例的技术方 案, 下面结合图 5来详细描述。 图 5是 居本发明优选实施例的集群管理方法的交互流程图, 包括如下 的步 4聚 S502至步 4聚 S516。 步骤 S502 , A进程启动后查询数据库, 用集群标识和进程标识判断 A 进程信息是否存在。 其中, 进程标识, 集群标识都是在安装的时候生成, 进程标识对于每个 进程都不同, 集群标识在同一个集群内相同。 如果存在则更新进程的通讯 IP和进程的监听端口信息,如果不存在则将 A进程的集群标识、 进程标识、 进程的通讯 IP和进程的监听端口信息写入数 据库, 并获取本集群的其它进程的信息。 具体地, 数据库表可按照下表 1进行设计, 以便 A进程的写入。 表 1 用于写入集群标识、 进程标识、 进程的通讯 IP和进程的监听端口 的数据库的示意表
Figure imgf000011_0001
步骤 S504 , A进程向本集群内其它进程发送请求消息。 需要说明的是, 本优选实施例中假定是 A进程向 B进程发送 UDP请求 消息。 如果釆用 TCP连接, 进程两两建立连接, 连接总数为 n*(n-l), 在进程 数比较多的情况下连接总数太多, 会消耗很多系统资源, 所以这里无连接的 UDP方式传送命令。 UDP带来的问题是消息可能在传送中丢失, 解决方式 是重传数据包, 即发送一个包后等待对方确认才发送下一包, 若到一定时间 仍然未收到确认, 重传这一包数据, 若重传几次仍然没有收到确认, 认为对 方不通, 放弃发送。 下面的命令都是假定 UDP传送, 其处理方式相同, 不 再重述。 步骤 S506, 如果 B进程正常, 那么 B进程会发送一个响应消息, 该响 应消息的内容为 B进程包含的服务信息。 步骤 S508, A进程向 B进程发送自身包含的月艮务信息。 步骤 S510, A进程通知监听模块, B进程中的这些服务可用。 步骤 S512, B进程通知监听模块, A进程中的这些服务可用。 步骤 S514, A进程向 B进程发送定时检查命令。 步骤 S516, B进程向 A进程返回定时检查响应。 如果 A进程连续几次发送定时检查命令都没有收到定时检查响应, 则 A 进程先判定 B进程已经意外退出,然后从服务管理模块将 B进程包含的服务 删除, 并通知监听模块这些 B进程包含的服务不可用。 需要说明的是, 在上述 A进程连续几次发送定时检查命令都没有收到定 时检查响应的情况下, 还可能是 A进程和 B进程之间的网络断开。 对于这种 情况, B进程也会出现连续几次发送定时检查命令都没有收到来自 A进程的 定时检查响应的情况, 则 B进程也判定 A进程不可用。 此时, A进程和 B 进程事实上都存在, 都可能单独提供部分服务功能, 但彼此之间孤立, 不能 互相调用。 需要说明的是, 本优选实施例仅仅描述了两个进程之间的交互情况。 实 际应用中, 多个进程之间的交互情况都可以参照上述两个进程之间的交互情 况, 从而实现多个进程共同完成整个集群的管理。 因此, 本优选实施例可以实现如下的技术效果:
1 ) 进程间两两互相通讯, 任一进程出现问题, 其它进程还可以正常工 作, 集群中的其它月艮务还可以使用。
2 ) 可以在运行期间, 加入新进程, 故到动态扩容。 可以增加新的服务 功能, 也可以增加与现有相同的服务, 对现有服务分担负荷。
3 ) 服务变为可用和不可用, 上层应用都能得到通知, 因此上层应用可 以故处理, 如重传月艮务不可用期间数据, 以保证数据完整性。 4 ) 集群内进程间通讯釆用 UDP通讯, 与另外一种釆用广播消息通讯的 集群技术相比, 广播消息要求各个机器在一个子网内, 而本方案不受限制。 需要说明的是, 在附图的流程图示出的步骤可以在诸如一组计算机可执 行指令的计算机系统中执行, 并且, 虽然在流程图中示出了逻辑顺序, 但是 在某些情况下, 可以以不同于此处的顺序执行所示出或描述的步骤。 综上所述,根据本发明的上述实施例,提供了一种集群管理系统及方法, 釆用集群的分布式设计, 解决了相关技术中集群管理系统釆用一个管理进程 和多个从进程, 一旦管理进程失效,整个集群管理系统将都不能工作的问题, 保证了服务的正常使用, 提高了网管的管理能力。 显然, 本领域的技术人员应该明白, 上述的本发明的各模块或各步骤可 以用通用的计算装置来实现, 它们可以集中在单个的计算装置上, 或者分布 在多个计算装置所组成的网络上, 可选地, 它们可以用计算装置可执行的程 序代码来实现, 从而, 可以将它们存储在存储装置中由计算装置来执行, 或 者将它们分别制作成各个集成电路模块, 或者将它们中的多个模块或步骤制 作成单个集成电路模块来实现。 这样, 本发明不限制于任何特定的硬件和软 件结合。 以上所述仅为本发明的优选实施例而已, 并不用于限制本发明, 对于本 领域的技术人员来说, 本发明可以有各种更改和变化。 凡在本发明的^"神和 原则之内, 所作的任何修改、 等同替换、 改进等, 均应包含在本发明的保护 范围之内。

Claims

权 利 要 求 书
1. 一种集群管理系统, 其特征在于, 包括:
存储模块, 用于保存多个进程的进程标识和所述多个进程的通讯 地址; 多个集群管理模块, 与所述多个进程——对应, 其中, 所述多个 集群管理模块中的每个集群管理模块均用于从所述存储模块获取所述 多个进程中除自身对应的进程之外的其它进程的通讯地址, 并使用所 述其它进程的通讯地址获取所述其它进程包含的服务;
多个服务管理模块, 与所述多个集群管理模块——对应, 其中, 所述多个服务管理模块中的每个服务管理模块均用于从自身对应的集 群管理模块获取所述其它进程包含的服务, 并用于调用所述其它进程 包含的所述艮务。
2. 根据权利要求 1所述的系统, 其特征在于, 还包括:
多个监听模块, 与所述多个服务管理模块——对应, 用于记录自 身对应的服务管理模块获取的所述其它进程包含的服务的可用信息, 其中, 所述可用信息用于指示所述其它进程包含的服务可用或者不可 用;
所述多个服务管理模块中的每个服务管理模块还用于接收来自 自 身对应的监听模块的可用信息, 并用于根据所述可用信息, 调用所述 其它进程包含的所述服务。
3. 根据权利要求 1所述的系统, 其特征在于, 还包括:
多个定时器, 与所述多个集群管理模块——对应;
所述多个集群管理模块中的每个集群管理模块还用于当自身对应 的定时器到时, 向所述多个集群管理模块中除自身之外的其它集群管 理模块发送检测消息, 其中, 所述检测消息用于检测自身与所述其它 集群管理模块的连接关系; 以及 所述多个集群管理模块中的每个集群管理模块还用于当检测到没 有接收到来自所述其它集群管理模块中的一个或多个集群管理模块的 响应消息时, 删除所述一个或多个集群管理模块对应的进程。 根据权利要求 1所述的系统, 其特征在于, 所述多个集群管理模块中 的每个集群管理模块还用于向所述存储模块写入自身对应的进程的通 讯地址。 根据权利要求 1所述的系统, 其特征在于, 还包括:
判断模块, 用于判断所述存储模块是否已经保存有所述多个进程 中的一个或多个进程的进程标识;
更新模块, 用于在判断结果为是时, 更新所述一个或多个进程的 所述通讯地址, 其中, 所述通讯地址包括以下至少之一: 互联网协议
IP地址、 监听端口信息。 根据权利要求 1所述的系统, 其特征在于, 所述多个集群管理模块之 间通过用户数据协议 UDP进行通讯。 根据权利要求 1所述的系统, 其特征在于, 所述多个集群管理模块中 的每个集群管理模块还用于管理自身对应的集群管理模块对应的进程 包含的服务。 一种集群管理方法, 其特征在于, 包括:
集群管理模块从存储模块获取多个进程中除自身对应的进程之外 的其它进程的通讯地址;
所述集群管理模块使用所述其它进程的通讯地址获取所述其它进 程包含的服务, 并发送给自身对应的服务管理模块;
所述服务管理模块调用所述其它进程包含的所述服务。 根据权利要求 8所述的方法, 其特征在于, 在所述服务管理模块调用 所述其它进程包含的所述服务之前, 还包括:
监听模块记录自身对应的服务管理模块获取的所述其它进程包含 的服务的可用信息, 其中, 所述可用信息用于指示所述其它进程包含 的服务可用或者不可用; 所述监听模块向所述服务管理模块发送所述可用信息; 所述服务管理模块根据所述可用信息, 执行调用所述其它进程包 含的所述艮务的操作。
10. 根据权利要求 8所述的方法, 其特征在于, 在所述集群管理模块从所 述存储模块获取所述多个进程中除自身对应的进程之外的其它进程的 通讯地址之前, 还包括: 所述集群管理模块当自身对应的定时器到时, 向所述多个集群管 理模块中除自身之外的其它集群管理模块发送检测消息, 其中, 所述 检测消息用于检测自身与所述其它集群管理模块的连接关系;
所述集群管理模块当检测到没有接收到来自所述其它集群管理模 块中的一个或多个集群管理模块的响应消息时, 删除所述一个或多个 集群管理模块对应的进程。
11. 根据权利要求 8所述的方法, 其特征在于, 在所述集群管理模块从所 述存储模块获取所述多个进程中除自身对应的进程之外的其它进程的 通讯地址之前, 还包括:
所述集群管理模块向所述存储模块写入自身对应的进程的通讯地 址。
PCT/CN2010/080402 2010-07-21 2010-12-28 集群管理系统及方法 WO2012009936A1 (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
US13/811,371 US20130139178A1 (en) 2010-07-21 2010-12-28 Cluster management system and method
EP10854966.8A EP2597818A4 (en) 2010-07-21 2010-12-28 SYSTEM AND METHOD FOR MANAGING CLUSTERS

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201010236219.3 2010-07-21
CN201010236219.3A CN102340410B (zh) 2010-07-21 2010-07-21 集群管理系统及方法

Publications (1)

Publication Number Publication Date
WO2012009936A1 true WO2012009936A1 (zh) 2012-01-26

Family

ID=45496471

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2010/080402 WO2012009936A1 (zh) 2010-07-21 2010-12-28 集群管理系统及方法

Country Status (4)

Country Link
US (1) US20130139178A1 (zh)
EP (1) EP2597818A4 (zh)
CN (1) CN102340410B (zh)
WO (1) WO2012009936A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110347694A (zh) * 2019-07-12 2019-10-18 中国工商银行股份有限公司 一种基于物联网的设备监控方法、装置及系统

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102710452B (zh) * 2012-06-26 2014-12-17 深圳市华力特电气股份有限公司 一种管理多客户端访问的方法和装置
CN102891904A (zh) * 2012-09-07 2013-01-23 佳都新太科技股份有限公司 一种在集群系统里实现快速FailOver的方法
CN104753689B (zh) * 2013-12-30 2018-05-11 成都鼎桥通信技术有限公司 一种宽带集群通信系统的用户管理方法
CN107547215A (zh) * 2016-06-23 2018-01-05 中兴通讯股份有限公司 一种网络管理方法及子网管理器
CN106354870B (zh) * 2016-09-18 2019-07-12 中国科学院计算技术研究所 一种数据加载的方法和设备
CN106547634B (zh) * 2016-11-28 2020-07-31 武汉斗鱼网络科技有限公司 一种跨进程通信的方法及装置
US11221906B2 (en) * 2020-01-10 2022-01-11 International Business Machines Corporation Detection of shared memory faults in a computing job
JP7498731B2 (ja) * 2022-01-17 2024-06-12 株式会社日立製作所 クラスタシステム、復旧方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7185076B1 (en) * 2000-05-31 2007-02-27 International Business Machines Corporation Method, system and program products for managing a clustered computing environment
CN101349974A (zh) * 2007-07-16 2009-01-21 中兴通讯股份有限公司 一种分布式系统中提高多核cpu处理能力的方法
CN101482829A (zh) * 2009-01-22 2009-07-15 华为技术有限公司 集群系统、处理装置及集群系统冗余方法
WO2009122791A1 (ja) * 2008-03-31 2009-10-08 日本電気株式会社 分散リソース管理システム、分散リソース管理方法、および分散リソース管理プログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0511925A3 (en) * 1991-04-30 1994-10-19 Ibm Dynamic backup and recovery of focal points in a computer network
WO2001031848A2 (en) * 1999-10-27 2001-05-03 Nortel Networks Limited Managed network node including multiple managed resources
US7590985B1 (en) * 2002-07-12 2009-09-15 3Par, Inc. Cluster inter-process communication transport
US7801857B2 (en) * 2003-12-19 2010-09-21 Solace Systems, Inc. Implicit routing in content based networks
CN100452797C (zh) * 2005-07-15 2009-01-14 清华大学 基于集群路由器结构的高可用分布式边界网关协议系统
US8533808B2 (en) * 2006-02-02 2013-09-10 Check Point Software Technologies Ltd. Network security smart load balancing using a multiple processor device
CN101605089B (zh) * 2008-06-11 2012-02-22 华为技术有限公司 Bgp动态迁移方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7185076B1 (en) * 2000-05-31 2007-02-27 International Business Machines Corporation Method, system and program products for managing a clustered computing environment
CN101349974A (zh) * 2007-07-16 2009-01-21 中兴通讯股份有限公司 一种分布式系统中提高多核cpu处理能力的方法
WO2009122791A1 (ja) * 2008-03-31 2009-10-08 日本電気株式会社 分散リソース管理システム、分散リソース管理方法、および分散リソース管理プログラム
CN101482829A (zh) * 2009-01-22 2009-07-15 华为技术有限公司 集群系统、处理装置及集群系统冗余方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP2597818A4 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110347694A (zh) * 2019-07-12 2019-10-18 中国工商银行股份有限公司 一种基于物联网的设备监控方法、装置及系统

Also Published As

Publication number Publication date
EP2597818A1 (en) 2013-05-29
US20130139178A1 (en) 2013-05-30
CN102340410B (zh) 2014-09-10
EP2597818A4 (en) 2015-01-07
CN102340410A (zh) 2012-02-01

Similar Documents

Publication Publication Date Title
WO2012009936A1 (zh) 集群管理系统及方法
US7526549B2 (en) Cluster data port services for clustered computer system
JP3932994B2 (ja) サーバ引継システムおよびその方法
JP4515800B2 (ja) メッセージ交換システムにおける可用性および拡張性をアプリケーションに透過的に向上させる方法
CN106330475B (zh) 一种通信系统中管理主备节点的方法和装置及高可用集群
CN1881944B (zh) 改进型分布式核心操作系统
WO2009023996A1 (fr) Procédé de mise en œuvre d'une interconnexion de réseau par l'intermédiaire d'une agrégation de liaisons
EP2079024A1 (en) Proxy server, communication system, communication method, and program
EP1987657A1 (en) Scalable wireless messaging system
WO2023046088A1 (zh) 一种应用于音视频数据传输的端到端系统解决方法
JP2010183450A (ja) ネットワークインターフェース装置
WO2017000832A1 (zh) Mac地址的同步方法、装置及系统
WO2009121689A1 (en) Method for enabling faster recovery of client applications in the event of server failure
EP3352415B1 (en) Smb service failure handling method, and storage device
JP2008503116A (ja) ネットワークにおけるデバイス同士のデータ伝送方法
CN115640169A (zh) 保障主集群停止提供服务的方法、系统、设备和存储介质
JP2005531856A (ja) ウインドウズ管理計測同期レポジトリプロバイダ
JP3608905B2 (ja) データ通信システム及びデータ通信方法
US7240088B2 (en) Node self-start in a decentralized cluster
JP2004266610A (ja) 通信システム、リモートアクセスサーバ装置とリソース管理方法およびプログラム
US9246754B2 (en) Automatic failover of nodes of a middle-tier layer
JP2007249659A (ja) システム切替方法、その計算機システム及びプログラム
CN110716827A (zh) 适用于分布式系统的热备份方法及分布式系统
CN113259404A (zh) 基于tcp/ip协议的工业通信中间件及其使用方法
WO2012071860A1 (zh) 多住户单元的单板间同步通信的方法及多住户单元

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 10854966

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 13811371

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 2010854966

Country of ref document: EP