WO2016015266A1 - 通信系统和通信方法 - Google Patents

通信系统和通信方法 Download PDF

Info

Publication number
WO2016015266A1
WO2016015266A1 PCT/CN2014/083378 CN2014083378W WO2016015266A1 WO 2016015266 A1 WO2016015266 A1 WO 2016015266A1 CN 2014083378 W CN2014083378 W CN 2014083378W WO 2016015266 A1 WO2016015266 A1 WO 2016015266A1
Authority
WO
WIPO (PCT)
Prior art keywords
computing node
communication mode
information
communication
node
Prior art date
Application number
PCT/CN2014/083378
Other languages
English (en)
French (fr)
Inventor
唐继元
黄彬
王伟
Original Assignee
华为技术有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 华为技术有限公司 filed Critical 华为技术有限公司
Priority to CN201480036947.6A priority Critical patent/CN105474194B/zh
Priority to PCT/CN2014/083378 priority patent/WO2016015266A1/zh
Priority to EP14898397.6A priority patent/EP3163461B1/en
Publication of WO2016015266A1 publication Critical patent/WO2016015266A1/zh
Priority to US15/417,964 priority patent/US10547668B2/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/541Interprogram communication via adapters, e.g. between incompatible applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies

Definitions

  • Embodiments of the present invention relate to the field of computers and, more particularly, to a communication system and a communication method. Background technique
  • the various components of the server are decoupled, from complex component design to simple and efficient design.
  • the decoupled components are connected to each other by a high speed interconnecting channel.
  • the server includes multiple processors, each of which is connected to each other through an internetwork. In this way, the tasks of the central processing unit are distributed to multiple processors for processing, thereby realizing the coordination among the processors of different functions, and sharing the peripherals and software of the server system.
  • Embodiments of the present invention provide a communication system and a communication method, which can improve communication efficiency.
  • a communication method which is applied to a communication system having multiple operating systems OS, where the communication system includes a management node, a first computing node, and a second computing node, and the first computing node and the first Each of the two computing nodes runs an OS, and the communication method includes: the first computing node sends a communication mode resolution request to the management node, where the communication mode resolution request includes an identifier of the first computing node and an identifier of the second computing node; The communication mode parsing request and the communication mode reference information determine the physical communication mode information between the first computing node and the second computing node, and the communication mode reference information includes system topology information and system physical resource allocation result; the management node performs physical communication mode Information is sent to the first computing node; the first computing node is based on physical communication The signaling mode information is in communication with the second computing node.
  • the communications method before the first computing node sends the communication mode parsing request to the management node, the communications method further includes: determining, by the first computing node, whether the set history information is included The first computing node sends the communication mode parsing request to the management node, where the first computing node sends the communication mode parsing request to the management node, where: when determining that the historical information does not include the physical communication mode information, the first computing node sends the information to the management node The communication method resolves the request.
  • the communication method further includes: the first computing node is to perform physical communication
  • the mode information is recorded in the history information.
  • the physical communication mode information includes one of a shared local memory communication mode information, a shared external memory communication mode information, and a high-speed interconnect communication mode information.
  • the communication mode reference information further includes a system physical resource usage state.
  • the communication mode resolution request further includes a data packet type and a data packet size.
  • the system topology information includes: architecture information of the central processing unit CPU, local memory information, external shared memory information, and decoupling architecture high-speed interconnection information. And one or more of the network interconnection information.
  • an embodiment of the present invention provides a communication system, where the communication system includes a management node, a first computing node, and a second computing node, where the first computing node and the second computing node respectively run an os, where a computing node, configured to send a communication mode parsing request to the management node, where the communication mode parsing request includes an identifier of the first computing node and an identifier of the second computing node; the management node is configured to parse the request and the communication mode reference information according to the communication manner, Determining physical communication mode information between the first computing node and the second computing node, the communication mode reference information includes system topology information and system physical resource allocation result; the management node is further configured to send the physical communication mode information to the first calculation a node; the first computing node, further configured to communicate with the second computing node based on the physical communication mode information.
  • the first computing node is further configured to determine whether the set historical information includes the physical connection between the first computing node and the second computing node.
  • the first computing node is configured to send a communication mode parsing request to the management node when determining that the historical information does not include the physical communication mode information.
  • the first computing node is further configured to record the physical communication mode information in the history information.
  • the physical communication mode information includes one of a shared local memory communication mode information, a shared external memory communication mode information, and a high-speed interconnect communication mode information.
  • the communication mode reference information further includes a system physical resource usage state.
  • the communication mode parsing request further includes a data packet type and a data packet size.
  • the system topology information includes architecture information of the central processing unit CPU, local memory information, external shared memory information, and decoupling architecture high-speed interconnection information. And one or more of the network interconnection information.
  • the management node determines physical communication mode information between the two computing nodes according to the topology information of the communication system.
  • the computing nodes can communicate according to the aforementioned physical communication mode information, thereby improving communication efficiency.
  • FIG. 1 is a schematic hardware architecture diagram of a communication system to which an embodiment of the present invention is applicable.
  • FIG. 2 is a schematic flow chart of a communication method according to an embodiment of the present invention.
  • FIG. 3 is a schematic flowchart of a communication method according to another embodiment of the present invention.
  • FIG. 4 is a schematic block diagram of a communication system in accordance with an embodiment of the present invention. detailed description
  • FIG. 1 is a schematic hardware architecture diagram of a communication system to which an embodiment of the present invention is applicable.
  • the communication system shown in Figure 1 includes controllers (101a, 101b, 101c, 101d), processors
  • the processor (102a, 102b) can include one or more Central Processing Unit (CPU) nodes.
  • CPU Central Processing Unit
  • Each CPU node can be a Uniform Memory Access (UMA) architecture or a Non-Uniform Memory Access (NUMA) architecture.
  • UMA Uniform Memory Access
  • NUMA Non-Uniform Memory Access
  • multiple logical CPUs on each CPU node share local memory.
  • different CPU nodes do not share local memory, they are connected through a fabric high-speed interconnect channel, which shares an external memory pool and a network interface pool. In other words, in addition to the traditional Ethernet method, they can communicate by sharing external memory and high-speed interconnect channels.
  • the memory 103a is coupled to the processor 102a.
  • memory 103a is a local memory.
  • the memory (103b, 103e) not connected to the processor 102a is an external memory.
  • memory 103b is coupled to processor 102b.
  • memory 103b is a local memory.
  • the memory (103a, 103e) not connected to the processor 102b is an external memory.
  • server hardware architecture diagram shown in FIG. 1 is only one example of a computer hardware architecture diagram applicable to the embodiment of the present invention, and the protection scope of the embodiment of the present invention is not limited thereto.
  • the communication method can be applied to a communication system having a plurality of operating systems (OSs), for example, the communication system can have the hardware architecture shown in FIG.
  • the communication system includes a management node, a first computing node, and a second computing node, and an OS is respectively run on the first computing node and the second computing node.
  • the physical resources specifically occupied by the management node, the first computing node, and the second computing node in the communication system shown in FIG. 1 are not limited.
  • one CPU node shown in Figure 1 may include one or more logical CPUs.
  • the first computing node, the second computing node, and the management node may be divided into Do not include at least one logical CPU.
  • the management node, the first computing node, and the second computing node may be logical partitions or partitions on physical entities.
  • the first computing node sends a communication mode parsing request to the management node, where the communication mode parsing request includes an identifier of the first computing node and an identifier of the second computing node.
  • the management node determines the physical communication mode information between the first computing node and the second computing node according to the communication mode resolution request and the communication mode reference information, where the communication mode reference information includes the system topology information and the system physical resource allocation result.
  • the management node allocates corresponding physical resources to the computing node according to the requirements of the computing node, and records the physical resource information used by each computing node. (ie physical resource allocation results).
  • the management node can determine the physical communication mode available between the computing nodes based on the recorded physical resource information used by each computing node and the system topology information of the communication system.
  • the computing node can apply for physical resources to it through interaction with the management node.
  • the first computing node is taken as an example for description.
  • the management node may assign an identifier to the first computing node and return the identifier to the first computing node.
  • the first computing node is allocated a physical resource according to the requirement of the first computing node, and the correspondence between the identifier of the first computing node and the physical resource is recorded.
  • the physical resource may also be applied to the management node according to the foregoing method.
  • other computing nodes may also apply for physical resources to the management node according to the foregoing method. To avoid repetition, we will not repeat them here.
  • the management node updates the physical resource allocation result. For example, when the first computing node adds a physical resource to the management node, or when the management node releases part of the physical resources used by the first computing node, the management node needs to update the physical resource allocation result.
  • the management node when the second computing node additionally applies for physical resources to the management node, or when the management node releases part of the physical resources used by the first computing node, the management node also needs to update the physical resource allocation result.
  • the management node may parse the request according to the communication mode.
  • the identifier of the first computing node and the identifier of the second computing node, and the correspondence between the identifier of the first computing node and the physical resource in the physical resource allocation result The physical communication mode information between the first computing node and the second computing node is determined by the correspondence between the identifier of the second computing node and the physical resource, and the system topology information of the communication system.
  • the management node may determine the physical resource used by the first computing node and the physical resource used by the second computing node according to the corresponding relationship between the identifier of the stored computing section and the physical resource.
  • the management node in conjunction with system topology information of the communication system, can determine physical communication mode information between the first computing node and the second computing node.
  • the system topology information of the communication system includes a hardware connection relationship between the physical resource used by the first computing node and the physical resource used by the second computing node,
  • the management node sends the physical communication mode information to the first computing node.
  • the first computing node communicates with the second computing node based on the physical communication mode information.
  • the management node may send physical communication mode information to the first computing node, and the first computing node initiates a communication connection to the second computing node.
  • the management node is requested to assist in completing the communication connection.
  • the management node can simultaneously send physical communication mode information to the first computing node and the second computing node.
  • the first computing node and the second computing node complete the communication connection in the manner indicated in the physical communication mode information.
  • the management node determines physical communication mode information between the two computing nodes according to the topology information of the communication system.
  • the computing nodes can communicate according to the aforementioned physical communication mode information, thereby improving communication efficiency.
  • the computing node can communicate based on the Ethernet communication protocol.
  • Ethernet communication physical communication has higher transmission efficiency and flexibility.
  • the physical resources can be flexibly allocated according to the attributes of the data packets transmitted between the computing nodes, thereby obtaining different transmission speeds.
  • the physical communication mode information may include all information required for establishing a physical communication connection between the first computing node and the second computing node, such as a physical resource identifier and a communication mode identifier occupied by the current physical communication connection.
  • the physical communication mode information may include only the identity of the physical communication mode.
  • the first computing node may apply to the management node for physical resource information used for the current communication when establishing a physical communication connection with the second computing node.
  • the first computing node, the second computing node, and the management node may be located in the same processor or different processors in the processor (102a, 102b) shown in FIG. .
  • the first computing node determines whether the set historical information includes the physical communication manner of the first computing node and the second computing node. information.
  • the communication mode analysis request may be sent to the management node when the determination history information does not include the physical communication mode information.
  • the first computing node determines physical communication mode information from the history information.
  • the first calculation node transmits a communication mode resolution request to the management node, and then receives the physical communication mode information from the management node. In this way, the first computing node does not have to request the management node to parse the physical communication mode information every time communication is performed, thereby reducing system overhead.
  • the first computing node when the first computing node supports asynchronous processing, other preparations for the communication connection can be performed while transmitting the communication mode analysis request to the management node.
  • the first computing node after the management node sends the physical communication mode information to the first computing node, the first computing node records the physical communication mode information in the history information.
  • the first computing node can directly obtain the physical communication mode information from the history information in the next communication without requesting the management node to parse the physical communication mode information, thereby reducing the system overhead.
  • the first computing node may clear the history information or set the history information to be invalid. In this way, the first computing node can communicate according to the latest physical communication mode information, thereby maximizing communication efficiency.
  • the physical communication mode information includes one of shared local memory communication mode information, shared external memory communication mode information, and high-speed interconnect communication mode information.
  • the shared local memory communication mode information may include a shared local memory communication mode identifier and a start and end address of the local memory allocated for the communication.
  • the shared external memory communication mode information may include an identifier of the shared external memory communication mode and a start and end address of the external memory allocated for the communication.
  • the high-speed interconnect communication mode information may include the identification of the high-speed interconnect communication mode and the address of the high-speed interconnect channel used in this communication.
  • shared local memory communication means that two virtual machines enter through shared local memory.
  • Line communication means that shared external memory.
  • Shared external memory communication means that two virtual machines communicate through shared external memory.
  • High-speed interconnect communication means that two virtual machines communicate through a high-speed interconnect channel.
  • the communication mode reference information further includes a system physical resource usage status.
  • the management node determines all physical communication modes between the first computing node and the second computing node according to the physical resource allocation result and the system topology information. Then, the management node combines the physical resource usage status, analyzes all of the foregoing physical communication methods, and finally determines the physical communication mode information.
  • the shared memory in the local memory communication mode has the highest priority, and the management node can determine whether the remaining space of the local memory is greater than a preset threshold.
  • the identifier of the shared local memory communication mode and the communication address information allocated for the current communication may be determined as the physical communication mode information.
  • the management node can determine whether the communication mode with the second highest priority is available according to the usage state of the physical resource.
  • the method of judging is similar to the method described in the foregoing. To avoid repetition, it will not be repeated here.
  • the communication mode resolution request further includes a data packet type and a data packet size.
  • the management node can determine the physical communication mode information for the first computing node in combination with the packet type and the packet size in the communication method. For example, when the packet is small, you can select the high-speed interconnect communication method. When the data packet is large, the shared local memory communication method is the fastest. In addition, in combination with the packet type, that is, the immediacy requirement of the data packet, the management node can select a more suitable communication method for the first computing node.
  • the system topology information includes one or more of architecture information of the central processing unit CPU, local memory information, external shared memory information, decoupling architecture high-speed interconnect information, and network interconnection information. .
  • FIG. 3 is a schematic flowchart of a communication method according to another embodiment of the present invention.
  • the management node After the management node allocates physical resources to the first computing node, returns to the first computing node. Assign results.
  • the allocation result includes a correspondence between the identifier of the first computing node and the physical resource.
  • the management node After the management node allocates physical resources to the second computing node, the management node returns an allocation result to the second computing node.
  • the allocation result includes a correspondence between the identifier of the second computing node and the physical resource.
  • the first computing node When the first computing node is ready to communicate with the second computing node, query the set history information. If the historical information includes physical communication mode information between the first computing node and the second computing node, the first computing node may directly determine the physical communication mode information from the historical information.
  • step 306 is performed.
  • the first computing node sends a communication mode parsing request to the management node.
  • the management node determines, according to the communication mode parsing request, the physical communication mode information between the first computing node and the second computing node.
  • the management node may determine the physical communication mode available between the computing nodes according to the recorded physical resource information used by each computing node and the system topology information of the communication system, thereby determining the physical communication mode information.
  • the management node sends physical communication mode information to the first computing node.
  • the first computing node establishes a communication connection with the second computing node according to the physical communication mode information to perform communication.
  • the management node determines physical communication mode information between the two computing nodes according to the topology information of the communication system.
  • the computing nodes can communicate according to the aforementioned physical communication mode information, thereby improving communication efficiency.
  • Communication system 40 includes a management node 401, a first computing node 402, and a second computing node 403.
  • the communication system 40 can have the hardware architecture shown in FIG.
  • the physical resources occupied by the management node 401, the first computing node 402, and the second computing node 403 are not limited.
  • one CPU node shown in Figure 1 may include one or more logical CPUs.
  • the first compute node, the second compute node, and the management node may each include at least one logical CPU.
  • An OS is run on the first computing node 402 and the second computing node 403, respectively.
  • the management node 401, the first computing node 402, and the second computing node 403 may be logical partitions or partitions on physical entities.
  • a first computing node 402 configured to send a communication mode resolution request to the management node 401, and the communication
  • the mode resolution request includes an identification of the first computing node 402 and an identification of the second computing node 403.
  • the management node 401 is configured to determine physical communication mode information between the first computing node 402 and the second computing node 403 according to the communication mode resolution request and the communication mode reference information, where the communication mode reference information includes system topology information and system physical resources. Assign results.
  • the management node 401 allocates corresponding physical resources for use by the computing node according to the requirements of the computing node, and records the use of each computing node. Physical resource information (that is, physical resource allocation results). In this case, the management node 401 can determine the physical communication modes available between the computing nodes based on the recorded physical resource information and system topology information used by the respective computing nodes.
  • the computing node when the computing node is started, the computing node can apply for physical resources to it through interaction with the management node 401.
  • the first computing node 402 is taken as an example for description.
  • the management node can assign an identity to the first compute node 402 and return the identity to the first compute node 402.
  • the first computing node 402 is allocated a physical resource according to the requirement of the first computing node 402, and the correspondence between the identifier of the first computing node 402 and the physical resource is recorded.
  • the physical resource may also be applied to the management node according to the foregoing method.
  • other computing nodes may also apply for physical resources to the management node according to the foregoing method. To avoid repetition, we will not repeat them here.
  • the management node 401 updates the physical resource allocation result. For example, when the first computing node 402 adds a physical resource to the management node 401, or when the management node 401 releases a part of the physical resources used by the first computing node 402, the management node 401 needs to update the physical resource allocation result.
  • the management node 401 when the second computing node 403 additionally requests the physical resource to the management node 401, or when the management node releases part of the physical resources used by the first computing node 402, the management node 401 also needs to update the physical resource allocation result.
  • the management node 401 when the management node 401 determines the physical communication mode information between the first computing node 402 and the second computing node 403 according to the physical resource allocation result and the system topology information of the communication system, the management node 401 can perform communication according to the communication.
  • the identifier of the first computing node 402 and the identifier of the second computing node 403 in the mode resolution request, the correspondence between the identifier of the first computing node 402 and the physical resource in the physical resource allocation result, and the identifier and physicality of the second computing node 403 Corresponding relationship of resources, and system topology information of the communication system, determining the first computing node 402 and the second computing section Physical communication mode information between points 403.
  • the management node 401 can determine the physical resource used by the first computing node 402 and the physical resource used by the second computing node 403 according to the corresponding relationship between the identifier of the stored computing node and the physical resource.
  • the management node may determine the first computing node 402 and the first Second, the physical communication mode information between the nodes 403 is calculated.
  • the management node 401 is further configured to send the physical communication mode information to the first computing node 402.
  • the first computing node 402 is further configured to communicate with the second computing node 403 based on the physical communication mode information.
  • the management node 401 can send physical communication mode information to the first computing node 402, and the first computing node 402 initiates a communication connection to the second computing node 403.
  • the first computing node 402 obtains the physical communication mode information, it requests the management node 401 to assist in completing the communication connection.
  • the management node 401 can simultaneously send physical communication mode information to the first computing node 402 and the second computing node 403.
  • the first computing node 402 and the second computing node 403 complete the communication connection in the manner indicated in the physical communication mode information.
  • the management node determines physical communication mode information between the two computing nodes according to the topology information of the communication system.
  • the computing nodes can communicate according to the aforementioned physical communication mode information, thereby improving communication efficiency.
  • the computing node can communicate based on the Ethernet communication protocol.
  • Ethernet communication physical communication has higher transmission efficiency and flexibility.
  • the physical resources can be flexibly allocated according to the attributes of the data packets transmitted between the computing nodes, thereby obtaining different transmission speeds.
  • the physical communication mode information may include all information required for establishing a physical communication connection between the first computing node and the second computing node, such as a physical resource identifier and a communication mode identifier occupied by the current physical communication connection.
  • the physical communication mode information may include only the identity of the physical communication mode.
  • the first computing node may apply to the management node for physical resource information used for the current communication when establishing a physical communication connection with the second computing node.
  • first computing node, the second computing node, and the management node may be located in the same processor or different processors in the processor (102a, 102b) shown in FIG. .
  • the first computing node 402 is further configured to determine whether the set historical information includes physical communication mode information of the first computing node and the second computing node.
  • the first computing node 402 is specifically configured to send a communication mode parsing request to the management node when determining that the historical information does not include the physical communication mode information.
  • the first computing node 402 determines physical communication mode information from the history information. When the history information does not include the physical communication mode information, the first computing node 402 transmits a communication mode resolution request to the management node 401, and then receives the physical communication mode information from the management node 401. In this way, the first computing node 402 does not have to request the management node 401 to resolve the physical communication mode information every time communication is performed, thereby reducing the system overhead.
  • the first computing node 402 supports asynchronous processing, other preparations for the communication connection can be performed while transmitting the communication mode resolution request to the management node 401.
  • the first computing node 402 is further configured to record physical communication mode information in the history information.
  • the first computing node can directly obtain the physical communication mode information from the history information in the next communication without requesting the management node to parse the physical communication mode information, thereby reducing the system overhead. In this way, the first computing node can communicate according to the latest physical communication mode information, thereby maximizing communication efficiency.
  • the first computing node may clear the history information or set the history information to be invalid.
  • the physical communication mode information includes one of shared local memory communication mode information, shared external memory communication mode information, and high-speed interconnect communication mode information.
  • the shared local memory communication mode information may include a shared local memory communication mode identifier and a start and end address of the local memory allocated for the communication.
  • the shared external memory communication mode information may include an identifier of the shared external memory communication mode and a start and end address of the external memory allocated for the communication.
  • the high-speed interconnect communication mode information may include the identification of the high-speed interconnect communication mode and the address of the high-speed interconnect channel used in this communication.
  • shared local memory communication means that two virtual machines enter through shared local memory.
  • Line communication means that shared external memory.
  • Shared external memory communication means that two virtual machines communicate through shared external memory.
  • High-speed interconnect communication means that two virtual machines communicate through a high-speed interconnect channel.
  • the communication mode reference information further includes a system physical resource usage status.
  • the management node 401 determines all physical communication modes between the first computing node 402 and the second computing node 403 based on the physical resource allocation result and the system topology information. Then, the management node 401 combines the physical resource usage status, analyzes all of the foregoing physical communication methods, and finally determines the physical communication mode information.
  • the H does not share the local memory communication mode with the highest priority, and the management node 401 can determine whether the local memory free space is greater than a preset threshold.
  • the identifier of the shared local memory communication mode and the communication address information allocated for the current communication may be determined as the physical communication mode information.
  • the management node 401 can determine whether the communication mode with the second highest priority is available according to the usage state of the physical resource.
  • the method of judging is similar to the method described in the foregoing. To avoid repetition, it will not be repeated here.
  • the communication mode resolution request further includes a data packet type and a data packet size.
  • the management node 401 can determine the physical communication mode information for the first computing node 402 in conjunction with the packet type and packet size in the communication mode resolution request. For example, when the packet is small, you can select the high-speed interconnect communication method. Shared local memory communication is the fastest when packets are large. In addition, in conjunction with the packet type, i.e., the immediacy requirements of the data packet, the management node 401 can select a more appropriate communication mode for the first computing node 402.
  • the system topology information includes one or more of architecture information of the central processing unit CPU, local memory information, external shared memory information, decoupling architecture high-speed interconnect information, and network interconnection information. .
  • the size of the sequence numbers of the above processes does not mean the order of execution, and the order of execution of each process should be determined by its function and internal logic, and should not be taken to the embodiments of the present invention.
  • the implementation process constitutes any limitation.
  • the disclosed systems, devices, and methods may be implemented in other ways.
  • the device embodiments described above are merely illustrative.
  • the division of the unit is only a logical function division.
  • there may be another division manner for example, multiple units or components may be combined or Can be integrated into another system, or some features can be ignored, or not executed.
  • the mutual coupling or direct connection or communication connection shown or discussed may be an indirect connection or communication connection through some interface, device or unit, or may be an electrical, mechanical or other form. connection.
  • the components displayed for the unit may or may not be physical units, ie may be located in one place, or may be distributed over multiple network units. Some or all of the units may be selected according to actual needs to achieve the objectives of the embodiments of the present invention.
  • each functional unit in each embodiment of the present invention may be integrated into one processing unit, or each unit may exist physically separately, or two or more units may be integrated into one unit.
  • the above integrated unit can be implemented in the form of hardware or in the form of a software functional unit.
  • the integrated unit if implemented in the form of a software functional unit and sold or used as a standalone product, may be stored in a computer readable storage medium.
  • the technical solution of the present invention contributes in essence or to the prior art, or all or part of the technical solution may be embodied in the form of a software product stored in a storage medium.
  • a number of instructions are included to cause a computer device (which may be a personal computer, server, or network device, etc.) to perform all or part of the steps of the methods described in various embodiments of the present invention.
  • the foregoing storage medium includes: a USB flash drive, a removable hard disk, a read-only memory (ROM), a random access memory (RAM), a magnetic disk or an optical disk, and the like. .

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开了一种通信系统和通信方法。该通信方法包括:第一计算节点向管理节点发送通信方式解析请求,通信方式解析请求包括第一计算节点的标识和第二计算节点的标识;管理节点根据通信方式解析请求和通信方式参考信息,确定第一计算节点和第二计算节点之间的物理通信方式信息,通信方式参考信息包括系统拓扑信息和系统物理资源分配结果;管理节点将物理通信方式信息发送给第一计算节点;第一计算节点基于物理通信方式信息与第二计算节点通信。本发明实施例能够提高通信效率。

Description

通信系统和通信方法 技术领域
本发明实施例涉及计算机领域, 并且更具体地, 涉及一种通信系统和通 信方法。 背景技术
随着人们对服务器性能需求的不断提高,依靠增加主频来提高计算性能 的时代已经成为过去。解耦硬件架构和分布式计算机架构成为了服务器架构 的发展方向。
在解耦硬件架构下, 将服务器的各个组件解耦, 由复杂的组件设计改为 简单高效的设计。 解耦的各个组件之间通过高速互联通道相互连接。 在分布 式计算机架构下, 服务器包括多个处理器, 各个处理器通过互联网络相互连 接。 这样, 将中央处理器的任务分给多个处理器处理, 进而实现不同功能的 各个处理器之间相互协调, 并共享服务器系统的外设与软件。
目前, 在全虚拟化模式下, 工作在上述服务器系统(也即通信系统) 中 的多个操作系统之间基于以太网通信协议进行通信。 例如, 基于传输控制协 进行通信。 然而, 硬件有互联关系的多个操作系统之间的通信效率有进一步 提升的空间。 发明内容
本发明实施例提供了一种通信系统和通信方法, 能够提高通信效率。 第一方面, 本发明实施例提供了一种通信方法, 应用于具有多个操作系 统 OS的通信系统中, 通信系统包括管理节点、 第一计算节点和第二计算节 点, 第一计算节点和第二计算节点上分别运行有一个 OS, 该通信方法包括: 第一计算节点向管理节点发送通信方式解析请求,通信方式解析请求包括第 一计算节点的标识和第二计算节点的标识; 管理节点根据通信方式解析请求 和通信方式参考信息,确定第一计算节点和第二计算节点之间的物理通信方 式信息, 通信方式参考信息包括系统拓朴信息和系统物理资源分配结果; 管 理节点将物理通信方式信息发送给第一计算节点; 第一计算节点基于物理通 信方式信息与第二计算节点通信。
结合第一方面, 在第一方面的第一种实现方式中, 在第一计算节点向管 理节点发送通信方式解析请求之前, 该通信方法还包括: 第一计算节点判断 设置的历史信息中是否包括第一计算节点与第二计算节点的物理通信方式 信息; 第一计算节点向管理节点发送通信方式解析请求, 包括: 在确定历史 信息不包括物理通信方式信息时, 第一计算节点向管理节点发送通信方式解 析请求。
结合第一方面及其上述实现方式, 在第一方面的第二种实现方式中, 在 管理节点将物理通信方式信息发送给第一计算节点之后, 通信方法还包括: 第一计算节点将物理通信方式信息记录于历史信息中。
结合第一方面及其上述实现方式, 在第一方面的第三种实现方式中, 物 理通信方式信息包括共享本地内存通信方式信息、共享外部内存通信方式信 息和高速互联通信方式信息中的一种。
结合第一方面及其上述实现方式, 在第一方面的第四种实现方式中, 通 信方式参考信息还包括系统物理资源使用状态。
结合第一方面及其上述实现方式, 在第一方面的第五种实现方式中, 通 信方式解析请求还包括数据包类型和数据包大小。
结合第一方面及其上述实现方式, 在第一方面的第六种实现方式中, 系 统拓朴信息包括中央处理器 CPU的架构信息、 本地内存信息、 外部共享内 存信息、 解耦架构高速互联信息和网络互连信息中的一种或多种。
第二方面,本发明实施例提供了一种通信系统,通信系统包括管理节点、 第一计算节点和第二计算节点, 第一计算节点和第二计算节点上分别运行有 一个 os, 其中, 第一计算节点, 用于向管理节点发送通信方式解析请求, 通信方式解析请求包括第一计算节点的标识和第二计算节点的标识; 管理节 点, 用于根据通信方式解析请求和通信方式参考信息, 确定第一计算节点和 第二计算节点之间的物理通信方式信息,通信方式参考信息包括系统拓朴信 息和系统物理资源分配结果; 管理节点, 还用于将物理通信方式信息发送给 第一计算节点; 第一计算节点, 还用于基于物理通信方式信息与第二计算节 点通信。
结合第二方面, 在第二方面的第一种实现方式中, 第一计算节点, 还用 于判断设置的历史信息中是否包括第一计算节点与第二计算节点的物理通 信方式信息; 第一计算节点, 具体用于在确定历史信息不包括物理通信方式 信息时, 向管理节点发送通信方式解析请求。
结合第二方面及其上述实现方式, 在第二方面的第二种实现方式中, 第 一计算节点, 还用于将物理通信方式信息记录于历史信息中。
结合第二方面及其上述实现方式, 在第二方面的第三种实现方式中, 物 理通信方式信息包括共享本地内存通信方式信息、共享外部内存通信方式信 息和高速互联通信方式信息中的一种。
结合第二方面及其上述实现方式, 在第二方面的第四种实现方式中, 通 信方式参考信息还包括系统物理资源使用状态。
结合第二方面及其上述实现方式, 在第二方面的第五种实现方式中, 通 信方式解析请求还包括数据包类型和数据包大小。
结合第二方面及其上述实现方式, 在第二方面的第六种实现方式中, 系 统拓朴信息包括中央处理器 CPU的架构信息、 本地内存信息、 外部共享内 存信息、 解耦架构高速互联信息和网络互连信息中的一种或多种。
基于上述技术方案, 在本发明实施例中, 管理节点根据通信系统的拓朴 信息确定两个计算节点之间的物理通信方式信息。 这样, 在计算节点之间存 在硬件连接的情况下,计算节点之间可以根据前述的物理通信方式信息进行 通信, 进而提高了通信效率。 附图说明
为了更清楚地说明本发明实施例的技术方案, 下面将对本发明实施例中 所需要使用的附图作简单地介绍, 显而易见地, 下面描述中的附图仅仅是本 发明的一些实施例, 对于本领域普通技术人员来讲, 在不付出创造性劳动的 前提下, 还可以根据这些附图获得其他的附图。
图 1是本发明实施例可应用的通信系统的示意性硬件架构图。
图 2是本发明一个实施例的通信方法的示意性流程图。
图 3是本发明另一实施例的通信方法的示意性流程图。
图 4是本发明实施例的通信系统的示意性框图。 具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行 清楚、 完整地描述, 显然, 所描述的实施例是本发明的一部分实施例, 而不 是全部实施例。 基于本发明中的实施例, 本领域普通技术人员在没有作出创 造性劳动的前提下所获得的所有其他实施例, 都应属于本发明保护的范围。
图 1是本发明实施例可应用的通信系统的示意性硬件架构图。
图 1 所示的通信系统包括控制器 (101a, 101b, 101c, 101d )、 处理器
( 102a, 102b )、 存储器( 103a, 103b, 103d ), 接口池 103c。 其中, 各个控 制器(101a, 101b, 101c, lOld )之间通过高速互联通道相连。 接口池 103c 为服务器各个组件之间的通信提供通信接口。 处理器(102a, 102b )可以包 括一个或多个中央处理器(Central Processing unit, CPU ) 节点。
每个 CPU节点上可以有多个逻辑 CPU。每个 CPU节点可以是一致性内 存访问 (Uniform Memory Access, UMA ) 架构, 也可以是非一致性内存访 问 (Non-Uniform Memory Access, NUMA ) 架构。 总的来说, 每个 CPU节 点上的多个逻辑 CPU共享本地内存。 不同 CPU节点虽然不共享本地内存, 但是它们通过结构高速互联通道相连, 它们共享外部内存池和网络接口池。 也就是说, 除了传统以太网方式, 它们还可以通过共享外部内存和高速互联 通道方式进行通信。
例如, 存储器 103a与处理器 102a连接。 对于处理器 102a中的 CPU板 而言, 存储器 103a为本地存储器。 相对地, 对于处理器 102a中的 CPU板 而言, 不与处理器 102a连接的存储器( 103b, 103e ) 为外部存储器。
相似地, 存储器 103b与处理器 102b连接。 对于处理器 102b中的 CPU 板而言, 存储器 103b为本地存储器。 相对地, 对于处理器 102b中的 CPU 板而言, 不与处理器 102b连接的存储器(103a, 103e ) 为外部存储器。
应理解, 图 1所示的服务器硬件架构图仅仅是本发明实施例可应用的计 算机硬件架构图的一个示例, 本发明实施例的保护范围并不限于此。
图 2是本发明一个实施例的通信方法的示意性流程图。该通信方法可以 应用于具有多个操作系统( Operation System, OS ) 的通信系统中, 例如该 通信系统可以具有图 1所示的硬件架构。 该通信系统包括管理节点、 第一计 算节点和第二计算节点, 第一计算节点和第二计算节点上分别运行有一个 OS。 其中, 管理节点、 第一计算节点和第二计算节点在图 1所示的通信系统 中具体占用的物理资源不作限定。 例如, 图 1 中示出的一个 CPU节点可以 包括一个或多个逻辑 CPU。 第一计算节点、第二计算节点和管理节点可以分 别包括至少一个逻辑 CPU。 进一步地, 管理节点、 第一计算节点和第二计算 节点可以是逻辑上的划分, 也可以是物理实体上的划分。
201 , 第一计算节点向管理节点发送通信方式解析请求, 通信方式解析 请求包括第一计算节点的标识和第二计算节点的标识。
202, 管理节点根据通信方式解析请求和通信方式参考信息, 确定第一 计算节点和第二计算节点之间的物理通信方式信息,通信方式参考信息包括 系统拓朴信息和系统物理资源分配结果。
例如, 在第一计算节点或第二计算节点向管理节点申请物理资源时, 管 理节点根据计算节点的需求为其分配相应的物理资源以供计算节点使用, 并 记录各个计算节点使用的物理资源信息 (即物理资源分配结果)。 这种情况 下, 管理节点可以根据记录的各个计算节点使用的物理资源信息和通信系统 的系统拓朴信息, 确定计算节点之间可用的物理通信方式。
具体地, 在计算节点启动时, 计算节点可以通过与管理节点之间的信息 交互向其申请物理资源。 这里以第一计算节点为例进行描述。 第一计算节点 启动时, 管理节点可以为第一计算节点分配标识, 并将该标识返回给第一计 算节点。 同时, 根据第一计算节点的需求为第一计算节点分配物理资源, 并 记录第一计算节点的标识和物理资源的对应关系。
类似地, 第二计算节点启动时也可以按照前述方法向管理节点申请物理 资源。 另外, 在通信系统包括其它计算节点时, 其它计算节点启动时也可以 按照前述方法向管理节点申请物理资源。 为避免重复, 在此不再赘述。
另外, 为第一计算节点或第二计算节点分配的物理资源发生变化时, 管 理节点更新物理资源分配结果。 例如, 在第一计算节点向管理节点追加申请 物理资源时, 或者管理节点释放了第一计算节点使用的部分物理资源时, 管 理节点需要更新物理资源分配结果。
相似地, 在第二计算节点向管理节点追加申请物理资源时, 或者管理节 点释放了第一计算节点使用的部分物理资源时, 管理节点也需要更新物理资 源分配结果。
这种情况下,在管理节点根据物理资源分配结果和通信系统的系统拓朴 信息, 确定第一计算节点与第二计算节点之间的物理通信方式信息时, 管理 节点可以根据通信方式解析请求中的第一计算节点的标识和第二计算节点 的标识, 物理资源分配结果中的第一计算节点的标识与物理资源的对应关系 和第二计算节点的标识与物理资源的对应关系, 以及通信系统的系统拓朴信 息, 确定第一计算节点与第二计算节点之间的物理通信方式信息。
例如, 管理节点可以根据存储的计算节,、的标识与物理资源的对应关 系, 确定第一计算节点使用的物理资源和第二计算节点使用的物理资源。 这 样, 结合通信系统的系统拓朴信息, 管理节点可以确定第一计算节点与第二 计算节点之间的物理通信方式信息。 其中, 在通信系统的系统拓朴信息中包 含有第一计算节点使用的物理资源与第二计算节点使用的物理资源之间的 硬件连接关系,
203 , 管理节点将物理通信方式信息发送给第一计算节点。
204, 第一计算节点基于物理通信方式信息与第二计算节点通信。
例如, 管理节点可以向第一计算节点发送物理通信方式信息, 由第一计 算节点向第二计算节点发起通信连接。 或者, 在第一计算节点获取了物理通 信方式信息后, 向管理节点请求协助完成通信连接。
又如, 管理节点可以同时向第一计算节点和第二计算节点发送物理通信 方式信息。 这样, 第一计算节点和第二计算节点根据物理通信方式信息中指 示的方式完成通信连接。
基于上述技术方案, 在本发明实施例中, 管理节点根据通信系统的拓朴 信息确定两个计算节点之间的物理通信方式信息。 这样, 在计算节点之间存 在硬件连接的情况下,计算节点之间可以根据前述的物理通信方式信息进行 通信, 进而提高了通信效率。
进一步地, 在计算节点之间的物理通信方式不可用, 或者计算节点之间 不存在硬件连接时, 计算节点可以基于以太网通信协议进行通信。 相较以太 网通信方式而言, 物理通信方式有着较高的传输效率和灵活性。 具体地, 可 以根据计算节点之间传输的数据包的属性灵活分配物理资源,进而得到不同 的传输速度。
应理解,物理通信方式信息可以包括第一计算节点与第二计算节点之间 建立物理通信连接所需要的所有信息,如本次物理通信连接占用的物理资源 标识和通信方式标识等。 或者, 物理通信方式信息可以只包括物理通信方式 的标识。 这种情况下, 第一计算节点可以在建立与第二计算节点之间的物理 通信连接时, 再向管理节点申请本次通信使用的物理资源信息。 这些变化实 施例都应该落在本发明实施例的保护范围内。 也应理解, 第一计算节点、 第二计算节点和管理节点可以位于图 1中示 出的处理器(102a, 102b ) 中的同一个处理器或不同的处理器中, 本发明实 施例不作限定。
可选地, 作为另一实施例, 在第一计算节点向管理节点发送通信方式解 析请求之前, 第一计算节点判断设置的历史信息中是否包括第一计算节点与 第二计算节点的物理通信方式信息。 这种情况下, 第一计算节点向管理节点 发送通信方式解析请求时, 可以在确定历史信息不包括物理通信方式信息 时, 再向管理节点发送通信方式解析请求。
例如, 当历史信息包括物理通信方式信息时, 第一计算节点从历史信息 中确定物理通信方式信息。 当历史信息不包括物理通信方式信息时, 第一计 算节点向管理节点发送通信方式解析请求, 然后从管理节点接收物理通信方 式信息。 这样, 第一计算节点不必在每次通信时, 都请求管理节点解析物理 通信方式信息, 进而降低了系统开销。
另外, 在第一计算节点支持异步处理时, 在向管理节点发送通信方式解 析请求的同时, 可以进行通信连接的其它准备工作。
可选地, 作为一个实施例, 在管理节点将物理通信方式信息发送给第一 计算节点之后, 第一计算节点将物理通信方式信息记录于历史信息中。
这样, 第一计算节点在下次通信时可以直接从历史信息中获取物理通信 方式信息, 而不必请求管理节点解析物理通信方式信息, 因而降低了系统开 销。
另外, 在管理节点更新了物理资源分配结果时, 第一计算节点可以清除 历史信息, 或者设置历史信息失效。 这样, 第一计算节点可以根据最新的物 理通信方式信息进行通信, 能够最大程度上提高通信效率。
可选地, 作为另一实施例, 物理通信方式信息包括共享本地内存通信方 式信息、 共享外部内存通信方式信息和高速互联通信方式信息中的一种。
例如,共享本地内存通信方式信息可以包括共享本地内存通信方式的标 识和为本次通信分配的本地内存的起止地址。共享外部内存通信方式信息可 以包括共享外部内存通信方式的标识和为本次通信分配的外部内存的起止 地址。 高速互联通信方式信息可以包括高速互联通信方式的标识和为本次通 信中使用的高速互联通道的地址。
应理解,共享本地内存通信方式是指两个虚拟机通过共享的本地内存进 行通信。共享外部内存通信方式是指两个虚拟机通过共享的外部内存进行通 信。 高速互联通信方式是指两个虚拟机通过高速互联通道进行通信。
可选地, 作为另一实施例, 通信方式参考信息还包括系统物理资源使用 状态。
例如, 管理节点根据物理资源分配结果和系统拓朴信息, 确定第一计算 节点与第二计算节点之间的所有物理通信方式。 然后, 管理节点结合物理资 源使用状态, 分析前述所有的物理通信方式, 并最终确定的物理通信方式信 息。
具体地, H没共享本地内存通信方式的优先级最高, 管理节点可以判断 本地内存剩余空间是否大于预设的阔值。 当内存剩余空间大于预设的阔值 时, 可以将共享本地内存通信方式的标识及为本次通信分配的通信地址信息 确定为物理通信方式信息。
相反地, 当内存剩余空间小于预设的阔值时, 管理节点可以根据物理资 源的使用状态判断优先级次高的通信方式是否可用。 其中, 判断方法与前文 描述的方法类似, 为避免重复, 在此不再赘述。
可选地, 作为另一实施例, 通信方式解析请求还包括数据包类型和数据 包大小。
这种情况下, 管理节点可以结合通信方式解析请求中的数据包类型和数 据包大小为第一计算节点确定物理通信方式信息。 例如, 在数据包较小时, 可以选择高速互联通信方式。在数据包较大时,共享本地内存通信方式最快。 另外, 结合数据包类型, 也即数据包的即时性要求, 管理节点可以为第一计 算节点选择一个更为合适的通信方式。
可选地, 作为另一实施例, 系统拓朴信息包括中央处理器 CPU的架构 信息、 本地内存信息、 外部共享内存信息、 解耦架构高速互联信息和网络互 连信息中的一种或多种。
下面将结合具体的例子详细描述本发明实施例。 应注意, 这些例子只是 为了帮助本领域技术人员更好地理解本发明实施例, 而非限制本发明实施例 的范围。
图 3是本发明另一实施例的通信方法的示意性流程图。
301, 在第一计算节点启动时, 向管理节点申请物理资源。
302, 管理节点为第一计算节点分配物理资源后, 向第一计算节点返回 分配结果。 该分配结果包括第一计算节点的标识与物理资源的对应关系。
303, 在第二计算节点启动时, 向管理节点申请物理资源。
304, 管理节点为第二计算节点分配物理资源后, 向第二计算节点返回 分配结果。 该分配结果包括第二计算节点的标识与物理资源的对应关系。
305 , 在第一计算节点准备与第二计算节点进行通信时, 先查询设置的 历史信息。若历史信息中包括第一计算节点与第二计算节点之间的物理通信 方式信息, 第一计算节点可以直接从历史信息中确定该物理通信方式信息。
若历史信息中不包括第一计算节点与第二计算节点的物理通信方式信 息, 执行步骤 306。
306, 第一计算节点向管理节点发送通信方式解析请求。
307, 管理节点根据通信方式解析请求为第一计算节点确定与第二计算 节点之间的物理通信方式信息。
例如, 管理节点可以根据记录的各个计算节点使用的物理资源信息和通 信系统的系统拓朴信息, 确定计算节点之间可用的物理通信方式, 进而确定 物理通信方式信息。
308, 管理节点向第一计算节点发送物理通信方式信息。
309, 第一计算节点根据物理通信方式信息建立与第二计算节点之间的 通信连接, 以进行通信。
基于上述技术方案, 在本发明实施例中, 管理节点根据通信系统的拓朴 信息确定两个计算节点之间的物理通信方式信息。 这样, 在计算节点之间存 在硬件连接的情况下,计算节点之间可以根据前述的物理通信方式信息进行 通信, 进而提高了通信效率。
图 4是本发明实施例的通信系统的示意性框图。 通信系统 40包括管理 节点 401、 第一计算节点 402和第二计算节点 403。 例如, 该通信系统 40可 以具有图 1所示的硬件架构。 其中, 管理节点 401、 第一计算节点 402和第 二计算节点 403 占用的物理资源不作限定。 例如, 图 1 中示出的一个 CPU 节点可以包括一个或多个逻辑 CPU。 第一计算节点、第二计算节点和管理节 点可以分别包括至少一个逻辑 CPU。 第一计算节点 402和第二计算节点 403 上分别运行有一个 OS。 进一步地, 管理节点 401、 第一计算节点 402和第二 计算节点 403可以是逻辑上的划分, 也可以是物理实体上的划分。
第一计算节点 402, 用于向管理节点 401发送通信方式解析请求, 通信 方式解析请求包括第一计算节点 402的标识和第二计算节点 403的标识。 管理节点 401, 用于根据通信方式解析请求和通信方式参考信息, 确定 第一计算节点 402和第二计算节点 403之间的物理通信方式信息,通信方式 参考信息包括系统拓朴信息和系统物理资源分配结果。
例如,在第一计算节点 402或第二计算节点 403向管理节点 401申请物 理资源时, 管理节点 401根据计算节点的需求为其分配相应的物理资源以供 计算节点使用, 并记录各个计算节点使用的物理资源信息(即物理资源分配 结果)。 这种情况下, 管理节点 401 可以根据记录的各个计算节点使用的物 理资源信息和系统拓朴信息, 确定计算节点之间可用的物理通信方式。
具体地, 在计算节点启动时, 计算节点可以通过与管理节点 401之间的 信息交互向其申请物理资源。 这里以第一计算节点 402为例进行描述。 第一 计算节点 402启动时, 管理节点可以为第一计算节点 402分配标识, 并将该 标识返回给第一计算节点 402。 同时, 根据第一计算节点 402的需求为第一 计算节点 402分配物理资源, 并记录第一计算节点 402的标识和物理资源的 对应关系。
类似地, 第二计算节点 403启动时也可以按照前述方法向管理节点申请 物理资源。 另外, 在通信系统包括其它计算节点时, 其它计算节点启动时也 可以按照前述方法向管理节点申请物理资源。 为避免重复, 在此不再赘述。
另外, 为第一计算节点 402或第二计算节点 403分配的物理资源发生变 化时, 管理节点 401更新物理资源分配结果。 例如, 在第一计算节点 402向 管理节点 401追加申请物理资源时, 或者管理节点 401释放了第一计算节点 402使用的部分物理资源时, 管理节点 401需要更新物理资源分配结果。
相似地, 在第二计算节点 403向管理节点 401追加申请物理资源时, 或 者管理节点释放了第一计算节点 402使用的部分物理资源时, 管理节点 401 也需要更新物理资源分配结果。
这种情况下,在管理节点 401根据物理资源分配结果和通信系统的系统 拓朴信息,确定第一计算节点 402与第二计算节点 403之间的物理通信方式 信息时, 管理节点 401可以根据通信方式解析请求中的第一计算节点 402的 标识和第二计算节点 403的标识, 物理资源分配结果中的第一计算节点 402 的标识与物理资源的对应关系和第二计算节点 403的标识与物理资源的对应 关系, 以及通信系统的系统拓朴信息, 确定第一计算节点 402与第二计算节 点 403之间的物理通信方式信息。
例如, 管理节点 401可以根据存储的计算节点的标识与物理资源的对应 关系,确定第一计算节点 402使用的物理资源和第二计算节点 403使用的物 理资源。 这样, 结合通信系统的系统拓朴信息, 也即第一计算节点 402使用 的物理资源与第二计算节点 403使用的物理资源之间的硬件连接关系, 管理 节点可以确定第一计算节点 402与第二计算节点 403之间的物理通信方式信 息。
管理节点 401, 还用于将物理通信方式信息发送给第一计算节点 402。 第一计算节点 402, 还用于基于物理通信方式信息与第二计算节点 403 通信。
例如, 管理节点 401可以向第一计算节点 402发送物理通信方式信息, 由第一计算节点 402向第二计算节点 403发起通信连接。 或者, 在第一计算 节点 402获取了物理通信方式信息后, 向管理节点 401请求协助完成通信连 接。
又如, 管理节点 401可以同时向第一计算节点 402和第二计算节点 403 发送物理通信方式信息。 这样, 第一计算节点 402和第二计算节点 403根据 物理通信方式信息中指示的方式完成通信连接。
基于上述技术方案, 在本发明实施例中, 管理节点根据通信系统的拓朴 信息确定两个计算节点之间的物理通信方式信息。 这样, 在计算节点之间存 在硬件连接的情况下,计算节点之间可以根据前述的物理通信方式信息进行 通信, 进而提高了通信效率。
进一步地, 在计算节点之间的物理通信方式不可用, 或者计算节点之间 不存在硬件连接时, 计算节点可以基于以太网通信协议进行通信。 相较以太 网通信方式而言, 物理通信方式有着较高的传输效率和灵活性。 具体地, 可 以根据计算节点之间传输的数据包的属性灵活分配物理资源,进而得到不同 的传输速度。
应理解,物理通信方式信息可以包括第一计算节点与第二计算节点之间 建立物理通信连接所需要的所有信息,如本次物理通信连接占用的物理资源 标识和通信方式标识等。 或者, 物理通信方式信息可以只包括物理通信方式 的标识。 这种情况下, 第一计算节点可以在建立与第二计算节点之间的物理 通信连接时, 再向管理节点申请本次通信使用的物理资源信息。 这些变化实 施例都应该落在本发明实施例的保护范围内。
也应理解, 第一计算节点、 第二计算节点和管理节点可以位于图 1中示 出的处理器(102a, 102b ) 中的同一个处理器或不同的处理器中, 本发明实 施例不作限定。
可选地, 作为另一实施例, 第一计算节点 402, 还用于判断设置的历史 信息中是否包括第一计算节点与第二计算节点的物理通信方式信息。这种情 况下, 第一计算节点 402, 具体用于在确定历史信息不包括物理通信方式信 息时, 向管理节点发送通信方式解析请求。
例如, 当历史信息包括物理通信方式信息时, 第一计算节点 402从历史 信息中确定物理通信方式信息。 当历史信息不包括物理通信方式信息时, 第 一计算节点 402向管理节点 401发送通信方式解析请求,然后从管理节点 401 接收物理通信方式信息。 这样, 第一计算节点 402不必在每次通信时, 都请 求管理节点 401解析物理通信方式信息, 进而降低了系统开销。
另外, 在第一计算节点 402支持异步处理时, 在向管理节点 401发送通 信方式解析请求的同时, 可以进行通信连接的其它准备工作。
可选地, 作为一个实施例, 第一计算节点 402, 还用于将物理通信方式 信息记录于历史信息中。
这样, 第一计算节点在下次通信时可以直接从历史信息中获取物理通信 方式信息, 而不必请求管理节点解析物理通信方式信息, 因而降低了系统开 销。 这样, 第一计算节点可以根据最新的物理通信方式信息进行通信, 能够 最大程度上提高通信效率。
另外, 在管理节点更新了物理资源分配结果时, 第一计算节点可以清除 历史信息, 或者设置历史信息失效。
可选地, 作为另一实施例, 物理通信方式信息包括共享本地内存通信方 式信息、 共享外部内存通信方式信息和高速互联通信方式信息中的一种。
例如,共享本地内存通信方式信息可以包括共享本地内存通信方式的标 识和为本次通信分配的本地内存的起止地址。共享外部内存通信方式信息可 以包括共享外部内存通信方式的标识和为本次通信分配的外部内存的起止 地址。 高速互联通信方式信息可以包括高速互联通信方式的标识和为本次通 信中使用的高速互联通道的地址。
应理解,共享本地内存通信方式是指两个虚拟机通过共享的本地内存进 行通信。共享外部内存通信方式是指两个虚拟机通过共享的外部内存进行通 信。 高速互联通信方式是指两个虚拟机通过高速互联通道进行通信。
可选地, 作为另一实施例, 通信方式参考信息还包括系统物理资源使用 状态。
例如, 管理节点 401根据物理资源分配结果和系统拓朴信息, 确定第一 计算节点 402与第二计算节点 403之间的所有物理通信方式。 然后, 管理节 点 401结合物理资源使用状态, 分析前述所有的物理通信方式, 并最终确定 的物理通信方式信息。
具体地, H没共享本地内存通信方式的优先级最高, 管理节点 401可以 判断本地内存剩余空间是否大于预设的阔值。 当内存剩余空间大于预设的阔 值时, 可以将共享本地内存通信方式的标识及为本次通信分配的通信地址信 息确定为物理通信方式信息。
相反地, 当内存剩余空间小于预设的阔值时, 管理节点 401可以根据物 理资源的使用状态判断优先级次高的通信方式是否可用。 其中, 判断方法与 前文描述的方法类似, 为避免重复, 在此不再赘述。
可选地, 作为另一实施例, 通信方式解析请求还包括数据包类型和数据 包大小。
这种情况下, 管理节点 401可以结合通信方式解析请求中的数据包类型 和数据包大小为第一计算节点 402确定物理通信方式信息。 例如, 在数据包 较小时, 可以选择高速互联通信方式。 在数据包较大时, 共享本地内存通信 方式最快。另夕卜,结合数据包类型,也即数据包的即时性要求,管理节点 401 可以为第一计算节点 402选择一个更为合适的通信方式。
可选地, 作为另一实施例, 系统拓朴信息包括中央处理器 CPU的架构 信息、 本地内存信息、 外部共享内存信息、 解耦架构高速互联信息和网络互 连信息中的一种或多种。
应理解, 在本发明的各种实施例中, 上述各过程的序号的大小并不意味 着执行顺序的先后, 各过程的执行顺序应以其功能和内在逻辑确定, 而不应 对本发明实施例的实施过程构成任何限定。
本领域普通技术人员可以意识到, 结合本文中所公开的实施例描述的各 示例的单元及算法步骤, 能够以电子硬件、 计算机软件或者二者的结合来实 现, 为了清楚地说明硬件和软件的可互换性, 在上述说明中已经按照功能一 般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执 行, 取决于技术方案的特定应用和设计约束条件。 专业技术人员可以对每个 特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超 出本发明的范围。
所属领域的技术人员可以清楚地了解到, 为了描述的方便和简洁, 上述 描述的系统、 装置和单元的具体工作过程, 可以参考前述方法实施例中的对 应过程, 在此不再赘述。
在本申请所提供的几个实施例中, 应该理解到, 所揭露的系统、 装置和 方法, 可以通过其它的方式实现。 例如, 以上所描述的装置实施例仅仅是示 意性的, 例如, 所述单元的划分, 仅仅为一种逻辑功能划分, 实际实现时可 以有另外的划分方式, 例如多个单元或组件可以结合或者可以集成到另一个 系统, 或一些特征可以忽略, 或不执行。 另夕卜, 所显示或讨论的相互之间的 耦合或直接辆合或通信连接可以是通过一些接口、装置或单元的间接辆合或 通信连接, 也可以是电的, 机械的或其它的形式连接。 为单元显示的部件可以是或者也可以不是物理单元, 即可以位于一个地方, 或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或 者全部单元来实现本发明实施例方案的目的。
另外, 在本发明各个实施例中的各功能单元可以集成在一个处理单元 中, 也可以是各个单元单独物理存在, 也可以是两个或两个以上单元集成在 一个单元中。 上述集成的单元既可以釆用硬件的形式实现, 也可以釆用软件 功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销 售或使用时, 可以存储在一个计算机可读取存储介质中。 基于这样的理解, 本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方 案的全部或部分可以以软件产品的形式体现出来, 该计算机软件产品存储在 一个存储介质中, 包括若干指令用以使得一台计算机设备(可以是个人计算 机, 服务器, 或者网络设备等)执行本发明各个实施例所述方法的全部或部 分步骤。 而前述的存储介质包括: U盘、 移动硬盘、 只读存储器 (ROM, Read-Only Memory ). 随机存取存储器(RAM, Random Access Memory )、 磁碟或者光盘等各种可以存储程序代码的介质。 以上所述, 仅为本发明的具体实施方式, 但本发明的保护范围并不局限 于此, 任何熟悉本技术领域的技术人员在本发明揭露的技术范围内, 可轻易 想到各种等效的修改或替换, 这些修改或替换都应涵盖在本发明的保护范围 之内。 因此, 本发明的保护范围应以权利要求的保护范围为准。

Claims

权利要求
1、一种通信方法, 应用于具有多个操作系统 OS的通信系统中, 所述通 信系统包括管理节点、 第一计算节点和第二计算节点, 所述第一计算节点和 所述第二计算节点上分别运行有一个 os, 其特征在于, 所述通信方法包括: 所述第一计算节点向所述管理节点发送通信方式解析请求, 所述通信方 式解析请求包括所述第一计算节点的标识和所述第二计算节点的标识;
所述管理节点根据所述通信方式解析请求和通信方式参考信息,确定所 述第一计算节点和所述第二计算节点之间的物理通信方式信息, 所述通信方 式参考信息包括系统拓朴信息和系统物理资源分配结果;
所述管理节点将所述物理通信方式信息发送给所述第一计算节点; 所述第一计算节点基于所述物理通信方式信息与所述第二计算节点通 信。
2、 根据权利要求 1 所述的通信方法, 其特征在于, 在所述第一计算节 点向所述管理节点发送通信方式解析请求之前, 所述通信方法还包括:
所述第一计算节点判断设置的历史信息中是否包括所述第一计算节点 与所述第二计算节点的物理通信方式信息;
所述第一计算节点向所述管理节点发送通信方式解析请求, 包括: 在确定所述历史信息不包括所述物理通信方式信息时, 所述第一计算节 点向所述管理节点发送所述通信方式解析请求。
3、 根据权利要求 1或 2所述的通信方法, 其特征在于, 在所述管理节 点将所述物理通信方式信息发送给所述第一计算节点之后, 所述通信方法还 包括:
所述第一计算节点将所述物理通信方式信息记录于所述历史信息中。
4、 根据权利要求 1至 3中任一项所述的通信方法, 其特征在于, 所述 物理通信方式信息包括共享本地内存通信方式信息、共享外部内存通信方式 信息和高速互联通信方式信息中的一种。
5、 根据权利要求 1至 4中任一项所述的通信方法, 其特征在于, 所述 通信方式参考信息还包括系统物理资源使用状态。
6、 根据权利要求 1至 5中任一项所述的通信方法, 其特征在于, 所述 通信方式解析请求还包括数据包类型和数据包大小。
7、 根据权利要求 1至 6中任一项所述的通信方法, 其特征在于, 所述 系统拓朴信息包括中央处理器 CPU的架构信息、 本地内存信息、 外部共享 内存信息、 解耦架构高速互联信息和网络互连信息中的一种或多种。
8、 一种通信系统, 其特征在于, 所述通信系统包括管理节点、 第一计 算节点和第二计算节点, 所述第一计算节点和所述第二计算节点上分别运行 有一个 OS, 其中,
所述第一计算节点, 用于向所述管理节点发送通信方式解析请求, 所述 通信方式解析请求包括所述第一计算节点的标识和所述第二计算节点的标 识;
所述管理节点, 用于根据所述通信方式解析请求和通信方式参考信息, 确定所述第一计算节点和所述第二计算节点之间的物理通信方式信息, 所述 通信方式参考信息包括系统拓朴信息和系统物理资源分配结果;
所述管理节点,还用于将所述物理通信方式信息发送给所述第一计算节 点;
所述第一计算节点,还用于基于所述物理通信方式信息与所述第二计算 节点通信。
9、 根据权利要求 8所述的通信系统, 其特征在于,
所述第一计算节点,还用于判断设置的历史信息中是否包括所述第一计 算节点与所述第二计算节点的物理通信方式信息;
所述第一计算节点, 具体用于在确定所述历史信息不包括所述物理通信 方式信息时, 向所述管理节点发送所述通信方式解析请求。
10、 根据权利要求 8或 9所述的通信系统, 其特征在于, 所述第一计算 节点, 还用于将所述物理通信方式信息记录于所述历史信息中。
11、 根据权利要求 8至 10中任一项所述的通信系统, 其特征在于, 所 述物理通信方式信息包括共享本地内存通信方式信息、共享外部内存通信方 式信息和高速互联通信方式信息中的一种。
12、 根据权利要求 8至 11中任一项所述的通信系统, 其特征在于, 所 述通信方式参考信息还包括系统物理资源使用状态。
13、 根据权利要求 8至 12中任一项所述的通信系统, 其特征在于, 所 述通信方式解析请求还包括数据包类型和数据包大小。
14、 根据权利要求 8至 13中任一项所述的通信系统, 其特征在于, 所 述系统拓朴信息包括中央处理器 CPU的架构信息、 本地内存信息、 外部共 享内存信息、 解耦架构高速互联信息和网络互连信息中的一种或多种。
PCT/CN2014/083378 2014-07-31 2014-07-31 通信系统和通信方法 WO2016015266A1 (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201480036947.6A CN105474194B (zh) 2014-07-31 2014-07-31 通信系统和通信方法
PCT/CN2014/083378 WO2016015266A1 (zh) 2014-07-31 2014-07-31 通信系统和通信方法
EP14898397.6A EP3163461B1 (en) 2014-07-31 2014-07-31 Communication system and communication method
US15/417,964 US10547668B2 (en) 2014-07-31 2017-01-27 Communications system and communication method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2014/083378 WO2016015266A1 (zh) 2014-07-31 2014-07-31 通信系统和通信方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US15/417,964 Continuation US10547668B2 (en) 2014-07-31 2017-01-27 Communications system and communication method

Publications (1)

Publication Number Publication Date
WO2016015266A1 true WO2016015266A1 (zh) 2016-02-04

Family

ID=55216626

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2014/083378 WO2016015266A1 (zh) 2014-07-31 2014-07-31 通信系统和通信方法

Country Status (4)

Country Link
US (1) US10547668B2 (zh)
EP (1) EP3163461B1 (zh)
CN (1) CN105474194B (zh)
WO (1) WO2016015266A1 (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101477511A (zh) * 2008-12-31 2009-07-08 杭州华三通信技术有限公司 一种实现多操作系统共享存储介质的方法和装置
CN101667144A (zh) * 2009-09-29 2010-03-10 北京航空航天大学 一种基于共享内存的虚拟机通信方法
US20100217916A1 (en) * 2009-02-26 2010-08-26 International Business Machines Corporation Method and apparatus for facilitating communication between virtual machines
WO2010114715A1 (en) * 2009-03-30 2010-10-07 Amazon Technologies, Inc. Providing logical networking functionality for managed computer networks
CN102110071A (zh) * 2011-03-04 2011-06-29 浪潮(北京)电子信息产业有限公司 一种虚拟机集群系统及其实现方法
CN102752802A (zh) * 2012-07-19 2012-10-24 上海中科高等研究院 基于等待时间的mac资源管理方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6999998B2 (en) * 2001-10-04 2006-02-14 Hewlett-Packard Development Company, L.P. Shared memory coupling of network infrastructure devices
US8521966B2 (en) * 2007-11-16 2013-08-27 Vmware, Inc. VM inter-process communications
JP5520929B2 (ja) * 2008-03-31 2014-06-11 アマゾン テクノロジーズ インコーポレイテッド コンピューティングノード間の通信の構成
US8103809B1 (en) * 2009-01-16 2012-01-24 F5 Networks, Inc. Network devices with multiple direct memory access channels and methods thereof
US9507617B1 (en) * 2013-12-02 2016-11-29 Trend Micro Incorporated Inter-virtual machine communication using pseudo devices

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101477511A (zh) * 2008-12-31 2009-07-08 杭州华三通信技术有限公司 一种实现多操作系统共享存储介质的方法和装置
US20100217916A1 (en) * 2009-02-26 2010-08-26 International Business Machines Corporation Method and apparatus for facilitating communication between virtual machines
WO2010114715A1 (en) * 2009-03-30 2010-10-07 Amazon Technologies, Inc. Providing logical networking functionality for managed computer networks
CN101667144A (zh) * 2009-09-29 2010-03-10 北京航空航天大学 一种基于共享内存的虚拟机通信方法
CN102110071A (zh) * 2011-03-04 2011-06-29 浪潮(北京)电子信息产业有限公司 一种虚拟机集群系统及其实现方法
CN102752802A (zh) * 2012-07-19 2012-10-24 上海中科高等研究院 基于等待时间的mac资源管理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP3163461A4 *

Also Published As

Publication number Publication date
EP3163461A4 (en) 2017-05-10
US20170142193A1 (en) 2017-05-18
CN105474194A (zh) 2016-04-06
CN105474194B (zh) 2018-06-08
US10547668B2 (en) 2020-01-28
EP3163461A1 (en) 2017-05-03
EP3163461B1 (en) 2022-05-11

Similar Documents

Publication Publication Date Title
US10698717B2 (en) Accelerator virtualization method and apparatus, and centralized resource manager
US10305823B2 (en) Network interface card configuration method and resource management center
JP6751780B2 (ja) アクセラレーション・リソース処理方法及び装置
CN107612840B (zh) 一种四层负载均衡设备的数据处理方法及装置
US9996371B2 (en) Virtual switching method, related apparatus, and computer system
Carvalho et al. Heuristics for dynamic task mapping in NoC-based heterogeneous MPSoCs
US20100287262A1 (en) Method and system for guaranteed end-to-end data flows in a local networking domain
US9031081B2 (en) Method and system for switching in a virtualized platform
KR102074468B1 (ko) 계산 작업을 처리하기 위한 컴퓨터 클러스터 장치 및 이를 작동시키기 위한 방법
EP3327994B1 (en) Virtual network management
US20190286488A1 (en) Resource management method, host, and endpoint
JP2014522036A (ja) クラウド環境内で仮想リソースを割り当てるための方法および装置
KR20160087706A (ko) 가상화 플랫폼을 고려한 분산 데이터 처리 시스템의 자원 할당 장치 및 할당 방법
CN110063045B (zh) 云计算系统中的报文处理方法及设备
EP3506575B1 (en) Method and device for data transmission
WO2014201623A1 (zh) 用于数据传输的方法、装置和系统以及物理网卡
WO2013086861A1 (zh) 一种多路径访问i/o设备的方法、i/o多路径管理器及系统
CN107113193A (zh) 一种确定vnf的处理策略的方法、装置及系统
WO2017185992A1 (zh) 一种请求消息传输方法及装置
CN108028806A (zh) 网络功能虚拟化nfv网络中分配虚拟资源的方法和装置
CN104104736A (zh) 一种云服务器及其使用方法
WO2014101502A1 (zh) 基于内存芯片互连的内存访问处理方法、内存芯片及系统
US10275283B2 (en) Low latency distributed counters for quotas
WO2016015266A1 (zh) 通信系统和通信方法
TWI454932B (zh) 管理多處理器互連體中潛伏期的技術

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 201480036947.6

Country of ref document: CN

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 14898397

Country of ref document: EP

Kind code of ref document: A1

REEP Request for entry into the european phase

Ref document number: 2014898397

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 2014898397

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE