WO2022151083A1 - 分布式任务的节点确定方法、装置、设备及介质 - Google Patents

分布式任务的节点确定方法、装置、设备及介质 Download PDF

Info

Publication number
WO2022151083A1
WO2022151083A1 PCT/CN2021/071570 CN2021071570W WO2022151083A1 WO 2022151083 A1 WO2022151083 A1 WO 2022151083A1 CN 2021071570 W CN2021071570 W CN 2021071570W WO 2022151083 A1 WO2022151083 A1 WO 2022151083A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
correspondence
capability
available resource
node
Prior art date
Application number
PCT/CN2021/071570
Other languages
English (en)
French (fr)
Inventor
田文强
沈嘉
Original Assignee
Oppo广东移动通信有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oppo广东移动通信有限公司 filed Critical Oppo广东移动通信有限公司
Priority to PCT/CN2021/071570 priority Critical patent/WO2022151083A1/zh
Priority to CN202180089647.4A priority patent/CN116711286A/zh
Priority to EP21918298.7A priority patent/EP4274178A4/en
Publication of WO2022151083A1 publication Critical patent/WO2022151083A1/zh
Priority to US18/350,710 priority patent/US20230350724A1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/5044Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering hardware capabilities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/5038Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the execution order of a plurality of tasks, e.g. taking priority or time dependency constraints into consideration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5072Grid computing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5094Allocation of resources, e.g. of the central processing unit [CPU] where the allocation takes into account power or heat criteria
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/098Distributed learning, e.g. federated learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/501Performance criteria
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/503Resource availability
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Definitions

  • the present application relates to the field of mobile communications, and in particular, to a method, apparatus, device and medium for determining a node for a distributed task.
  • the training process of distributed tasks involves the joint participation of multiple nodes in the training of the model, including the collection of data sets and the adjustment of weights.
  • the embodiments of the present application provide a node determination method, apparatus, device, and medium, in which a master node can determine a node participating in a distributed task among multiple subnodes based on available resource information.
  • a method for determining a node is provided, which is applied to a sub-node of multiple nodes in a mobile communication system, the method comprising:
  • the child node sends available resource information to the master node in the mobile communication system, where the available resource information is used to determine the target child node participating in the distributed task.
  • a method for determining a node which is applied to a master node among multiple nodes in a mobile communication system, and the method includes:
  • the master node determines the target child nodes participating in the distributed task based on the available resource information of the multiple child nodes.
  • an apparatus for determining a node comprising:
  • a sending module configured to send available resource information to the master node in the mobile communication system, where the available resource information is used to determine target child nodes participating in the distributed task.
  • an apparatus for determining a node comprising:
  • a receiving module configured to receive available resource information sent by a child node in the mobile communication system
  • the processing module is configured to determine the target child nodes participating in the distributed task based on the available resource information of the plurality of child nodes.
  • a network device comprising: a processor; a transceiver connected to the processor; a memory for storing executable instructions of the processor; wherein the The processor is configured to load and execute the executable instructions to implement the node determination method as described in the above aspects.
  • a computer-readable storage medium is provided, and executable instructions are stored in the computer-readable storage medium, and the executable instructions are loaded and executed by a processor to implement the above-mentioned aspects. Node determination method.
  • a computer program product or computer program comprising computer instructions, the computer instructions being stored in a computer-readable storage medium, the processor of the computer device being readable from the computer
  • the storage medium reads the computer instructions, and the processor executes the computer instructions, so that the computer device executes the node determination method described in the above aspects.
  • a chip is provided, the chip includes a programmable logic circuit or a program, and the chip is configured to implement the node determination method described in the above aspect.
  • the master node determines the target set of child nodes participating in the distributed task based on the available resource information of multiple child nodes, so that the master node can participate in the distributed task according to the needs of the distributed task. From the multiple nodes of the distributed task, the best or better node set is selected for the training and reasoning of the distributed neural network, so as to use multiple better sub-nodes to improve the computing efficiency of the distributed task as a whole.
  • FIG. 1 is a schematic diagram of a federated learning scenario provided by an exemplary embodiment of the present application
  • FIG. 2 is a schematic diagram of a mobile communication system provided by an exemplary embodiment of the present application.
  • FIG. 3 is a flowchart of a node determination method provided by an exemplary embodiment of the present application.
  • FIG. 4 is a flowchart of a node determination method provided by an exemplary embodiment of the present application.
  • FIG. 5 is a flowchart of a node determination method provided by an exemplary embodiment of the present application.
  • FIG. 6 is a block diagram of an apparatus for determining a node according to an exemplary embodiment of the present application.
  • FIG. 7 is a block diagram of an apparatus for determining a node according to an exemplary embodiment of the present application.
  • FIG. 8 is a block diagram of a communication device shown in an exemplary embodiment of the present application.
  • Distributed tasks tasks that involve the participation of multiple nodes.
  • Distributed tasks include but are not limited to at least one of the following tasks: distributed data collection tasks, distributed data computing tasks, distributed data storage tasks, distributed stream data processing tasks, distributed model training tasks, distributed model reasoning tasks At least one of tasks, distributed machine learning, and federated learning.
  • Federated Learning A Typical Distributed Task Scheme.
  • the training set is distributed on each child node 12 .
  • each sub-node 12 trains a local local neural network based on the local training set, and uploads the local local neural network to the master node 14 .
  • the master node 14 merges the obtained local local neural networks to obtain a global neural network, and transmits the global neural network to each sub-node 12; each sub-node 12 continues to use the new global neural network for the next training iteration.
  • the training of the neural network is completed with the cooperation of multiple sub-nodes.
  • FIG. 2 shows a block diagram of a distributed task system provided by an exemplary embodiment of the present application.
  • the system includes a plurality of child nodes 12 , a master node 14 and a third node 16 .
  • the third node 16 is an optional node.
  • the sub-node 12 is a node for participating in distributed tasks, and the sub-node 12 is a user equipment (User Equipment, UE), an access network device, a core network element or other network device in the mobile communication system.
  • the access network equipment includes base stations
  • the core network network elements include user plane function (User Plane Function, UPF), unified data management (Unified Data Management, UDM), network exposure function (Network Exposure Function, NEF), access and At least one of a mobility management function (Access and Mobility Management Function, AMF) entity, a session management function (Session Management Function, SMF), and a policy control function (Policy Control Function, PCF).
  • UPF User Plane Function
  • UDM unified data management
  • NEF Network Exposure Function
  • AMF Access and Mobility Management Function
  • SMF Session Management Function
  • PCF Policy Control Function
  • the master node 14 is a node for task assignment, task distribution, and participation in distributed tasks.
  • the master node 14 is a user equipment (User Equipment, UE) in the mobile communication system, an access network device, a core network network element or other network devices.
  • the access network equipment includes a base station
  • the core network network element includes at least one of UPF, UDM, NEF, AMF entity, SMF, and PCF.
  • the master node 14 may be an independent network node in the mobile communication system, or may be a specific sub-node in the sub-nodes 12 participating in the distributed task, or may be a control node participating in the distributed task.
  • the third node 16 is a node different from the child node 12 and the master node 14 in the mobile communication system.
  • Fig. 3 shows a flowchart of a node determination method for a distributed task provided by an exemplary embodiment of the present application.
  • the method can be performed by a master node and a child node in a plurality of nodes in a mobile communication system, and the method includes:
  • Step 302 the child node sends available resource information to the master node in the mobile communication system, and the available resource information is used to determine the target child node information participating in the distributed task;
  • the child node reports its own available resource information to the master node. Available resource information includes at least one of the following information:
  • the computing capability information is used to indicate information related to computing capability in a child node.
  • the computing capability information is used to represent at least one capability of fixed-point computing, floating-point computing, and computing cache.
  • the storage capability information is used to indicate information related to storage capability in a child node.
  • the storage capability information is used to represent at least one capability among available memory, available cache, and available storage.
  • the transmission capability information is used to indicate the information related to the data transmission capability in the child node.
  • the transmission capability information is used to characterize at least one capability of rate, delay, signal strength, bit error rate, and block error rate.
  • the energy capability information is used to indicate the information related to the electric energy capability in the child node.
  • the energy capability information is used to characterize at least one capability among remaining power, available power, and endurance prediction.
  • the child node periodically reports available resource information to the master node; in another embodiment, the master node sends a reporting instruction to the child node, and the child node reports the available resource information to the master node after receiving the reporting instruction .
  • Step 304 the master node receives available resource information sent by multiple sub-nodes in the mobile communication system
  • Step 306 The master node determines a set of target child nodes participating in the distributed task based on the available resource information of the multiple child nodes.
  • the master node Based on the available resource information of the multiple child nodes, the master node selects the child node with better available resources among the multiple child nodes as the target child node participating in the distributed task, and adds it to the target child node set.
  • the master node determines the set of target child nodes participating in the distributed task based on the available resource information of multiple child nodes, so that the master node can According to the requirements of distributed tasks, the nodes select the best or better node set among multiple nodes that can participate in distributed tasks for training and reasoning of distributed neural networks, so as to use multiple better sub-nodes. nodes to improve the computing efficiency of distributed tasks as a whole.
  • the available resource information includes at least one of the following four types of information:
  • Computing capability information including at least one of the following information:
  • graphics processors Graphics Processing Unit, GPU
  • neural network processors Neurological network Processing Unit, NPU
  • the size of the cache of the neural network processor is the size of the cache of the neural network processor
  • CPU Central Processing Unit
  • the computing capability information may be represented by one or more of the floating-point number computing capability per unit time, the number of GPUs, the size of the GPU cache, and the like.
  • the computing capability information may be represented by computing capability level information.
  • different computing power level information represents different floating-point computing capabilities per unit time, or represents different GPU numbers, or represents different GPU cache sizes, or represents different GPU numbers and GPU cache sizes, or It represents different GPU numbers and GPU cache sizes, or represents the processing capabilities of different neural network processors, or the cache size, or the number of processors, or a combination of one or more of the above.
  • GPU cache sizes can be corresponding to 4 different types of computing capability level information, as shown in Table 1.
  • processor cache sizes and different numbers of processors may be corresponding to 4 types of different computing capability level information, as shown in Table 2.
  • the master node or the third node is a network device, and the child node is a UE.
  • the network device uses broadcast messages, System Information Block (SIB), Radio Resource Control (RRC) messages, RRC reconfiguration signaling , Downlink Control Information (Downlink Control Information, DCI), Medium Access Control Control Element (Medium Access Control Control Element, MAC CE), Physical Downlink Control Channel (Physical Downlink Control Channel, PDCCH) command (order), data information and other methods
  • SIB System Information Block
  • RRC Radio Resource Control
  • RRC Radio Resource Control
  • RRC Radio Resource Control
  • RRC reconfiguration signaling Downlink Control Information (Downlink Control Information, DCI), Medium Access Control Control Element (Medium Access Control Control Element, MAC CE), Physical Downlink Control Channel (Physical Downlink Control Channel, PDCCH) command (order), data information and other methods
  • the SIB is a possible implementation form of the broadcast message
  • the RRC reconfiguration signaling is a possible implementation form of the RRC message. That is, the first indication signaling includes at least one of the following: broadcast message, RRC message, DCI, MAC CE, PDCCH order, and data information; the broadcast message includes SIB, and the RRC message includes RRC reconfiguration signaling.
  • Storage capability information including at least one of the following information:
  • storage capability information may be represented by one or more of available memory size, available cache size, available storage size, and the like. "Available” in this application means “available for use by distributed tasks.”
  • the storage capability information may be represented by storage capability level information, where different storage capability level information represents different available memory sizes, or different available cache sizes, or different available storage sizes.
  • different memory sizes can be corresponding to 4 types of different computing capability level information, as shown in Table 3.
  • Level memory size 128G 2 256G 3 512G 4 1024G
  • the correspondence between the storage capability level information and the above-mentioned memory size, cache size, storage size, etc., is pre-agreed in the protocol, or configured by the master node to the child nodes, or configured by the third node to the child nodes.
  • the master node or the third node is a network device, and the child node is a UE.
  • the network device transmits the above correspondence to the UE through one or more of broadcast, SIB, RRC message, MAC CE, PDCCH, DCI and other methods.
  • Transmission capability information including at least one of the following information:
  • RSRP Reference Signal Received Power
  • RSRQ Reference Signal Received Quality
  • SINR Signal-to-Interference-and-Noise Ratio
  • the transmission capability information can be represented by one or more of the supported transmission rate, transmission delay, communication signal strength, channel quality status information, transmission bit error rate, transmission error block rate, and spectral efficiency information.
  • Transmission capability can be represented by transmission capability level information.
  • Different transmission capability level information represents different transmission rates, transmission delays, communication signal strengths, or different channel quality status information, or different transmission bit error rates. , or represent different transmission error block rates, or represent different spectral efficiencies.
  • the agreement is either configured by the master node to the child nodes, or configured by the third node to the child nodes.
  • the master node or the third node is a network device, and the child node is a UE.
  • the network device transmits the above correspondence to the UE through one or more of broadcast, SIB, RRC message, MAC CE, PDCCH, DCI and other methods.
  • Energy capability information including at least one of the following information:
  • the energy capability information may be represented by one or more of the remaining power of the sub-nodes, the power of the sub-nodes available for distributed tasks, the predicted value of the endurance time, and the like.
  • the energy capability may be represented by energy capability level information.
  • Different energy capability level information represents different remaining power, or represents different power information that can be used for distributed tasks, or represents different predicted values of endurance time.
  • the corresponding relationship between the energy capability level information and the above-mentioned electric quantity information is pre-agreed in the protocol, or is configured by the master node to the sub-nodes, or is configured by the third node to the sub-nodes.
  • the master node or the third node is a network device, and the child node is a UE.
  • the network device transmits the above correspondence to the UE through one or more of broadcast, SIB, RRC message, MAC CE, PDCCH, DCI and other methods.
  • FIG. 4 shows a flowchart of a node determination method provided by an exemplary embodiment of the present application.
  • the method can be performed by a master node and a child node in a plurality of nodes in a mobile communication system, and the method includes:
  • Step 402 the child node sends available resource information to the master node in the mobile communication system, and the available resource information is used to determine the target child node information participating in the distributed task;
  • the child node reports its own available resource information to the master node. Available resource information includes at least one of the following information:
  • the child node periodically reports available resource information to the master node; in another embodiment, the master node sends a reporting instruction to the child node, and the child node reports the available resource information to the master node after receiving the reporting instruction .
  • the child node may feed back any one of the above computing capability information, storage capability information, transmission capability information, and energy capability information to the third node independently.
  • the child node may also feed back at least two kinds of information among computing capability information, storage capability information, transmission capability information, and energy capability information to the third node at the same time.
  • the manner in which the child node feeds back multiple pieces of the foregoing information may be by feeding back multiple items of the foregoing computing capability information, storage capability information, transmission capability information, and energy capability information by feeding back the capability level information of the child node.
  • An example is shown in Table 4:
  • Child node ability level Computing Ability Level storage capacity class Transmission capability class Energy consumption capability level 1 1 1 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 4 3 3 4 4 5 4 4 1 1 6 4 4 2 2 7 4 4 3 3 8 4 4 4 4 4
  • the available resource information is carried in at least one of the following signaling: RRC message, UCI, information carried on PUCCH, and carried on PUSCH. Information.
  • the available resource information is carried in at least one of the following signaling: system information, SIB, RRC message, MACCE, DCI, information carried on PDCCH, Information carried on PDSCH.
  • the existence of at least one available resource information is represented by data, and the child node sends the available resource information in the form of data to the master node.
  • the existence of at least one available resource information is represented by a capability level, and the child node sends the available resource information in the form of the capability level to the master node.
  • the child node determines the capability level corresponding to the available resource information according to the correspondence information; the correspondence information includes: the correspondence between available resource information of different values and different capability levels; the child node sends the available resource information to the master node. the corresponding ability level.
  • the available resource information includes computing capability information; the child node determines the computing capability level corresponding to the computing capability information according to the correspondence information; the correspondence information includes: the computing capability information of different values and the correspondence between different computing capability levels ; The child node sends the computing power level to the master node.
  • the available resource information includes storage capability information; the child node determines the storage capability level corresponding to the storage capability information according to the correspondence information; the correspondence information includes: the storage capability information of different values and the correspondence between different storage capability levels ; The child node sends the storage capability level to the master node.
  • the available resource information includes transmission capability information; the child node determines the transmission capability level corresponding to the transmission capability information according to the correspondence information; the correspondence information includes: the transmission capability information of different values and the correspondence between different transmission capability levels ; The child node sends the transmission capability level to the master node.
  • the available resource information includes energy capability information; the child node determines the energy capability level corresponding to the energy capability information according to the correspondence information; the correspondence information includes: the energy capability information of different values and the correspondence between different energy capability levels ; The child node sends the energy capability level to the master node.
  • the correspondence information is predefined by a communication protocol. In one embodiment, the correspondence information is pre-configured by the master node to the child nodes. In one embodiment, the correspondence information is pre-configured by the third node to the child node, and the third node is a node in the mobile communication system that is different from the master node and the child node.
  • Step 404 the master node receives available resource information sent by multiple sub-nodes in the mobile communication system
  • the master node when the child node is a UE and the master node is an access network device, the master node receives the available resource information sent by the child node in at least one of the following signaling: RRC message, UCI, bearer on PUCCH information, information carried on the PUSCH.
  • the available resource information is carried in at least one of the following signaling to receive the available resource information sent by the child node: system information, SIB, RRC message, MACCE, Information carried on DCI, PDCCH, and information carried on PDSCH.
  • Step 406 The master node determines the target child nodes participating in the distributed task based on the available resource information of the multiple child nodes.
  • the master node Based on the available resource information of the multiple child nodes, the master node selects the child node with better available resources among the multiple child nodes as the target child node participating in the distributed task, and adds it to the target child node set.
  • the available resource information includes computing capability information
  • the master node selects n child nodes with the best computing capability among the multiple child nodes based on the computing capability information of multiple child nodes as target child nodes participating in the distributed task, and adds to the set of target child nodes.
  • n is a positive integer
  • n is the number of child nodes required by the distributed task.
  • the available resource information includes storage capability information
  • the master node selects n child nodes with the best storage capability among the multiple child nodes based on the storage capability information of multiple child nodes as target child nodes participating in the distributed task, and adds to the set of target child nodes.
  • the available resource information includes transmission capability information. Based on the transmission capability information of multiple subnodes, the master node selects n subnodes with the best transmission capability among the multiple subnodes as target subnodes participating in the distributed task, and adds to the set of target child nodes.
  • the available resource information includes energy capability information
  • the master node selects n sub-nodes with the best energy capability among the multiple sub-nodes as target sub-nodes participating in the distributed task based on the energy capability information of multiple sub-nodes, and adds to the set of target child nodes.
  • the available resource information includes at least two types of information, each type of available resource information is converted into a score according to actual data, and the available resource information of each sub-node can be converted into a total score, and the main node is among the multiple sub-nodes The n child nodes with the best total scores are selected as the target child nodes participating in the distributed task and added to the target child node set.
  • the master node In the case that the distributed task has a preference for resource capabilities, the master node also sets the corresponding weight for each available resource information when calculating the score of each available resource information. For example, when the distributed task has a high demand for floating-point computing power, the master node sets a higher weight for the floating-point computing power; for another example, when the distributed task has a high demand for power, the master node sets a higher weight for the available power higher weight.
  • the master node sets a set of participation threshold conditions based on available resource information, selects multiple candidate child nodes whose available resource information meets the participation threshold conditions from multiple child nodes, and randomly selects multiple candidate child nodes among the multiple candidate child nodes. Determine n sub-nodes as target sub-nodes participating in the distributed task, or determine n sub-nodes with the earliest sending time among the multiple candidate sub-nodes as target sub-nodes participating in the distributed task, and add them to the target sub-node set.
  • Step 408 The master node sends indication information to the child nodes belonging to the target child node set, where the indication information is used to indicate that the child node is the target child node participating in the distributed task;
  • the master node when the child node is a UE and the master node is an access network device, the master node sends indication information in at least one of the following signaling: system information, SIB, RRC message, MACCE, DCI, PDCCH information carried on the PDSCH, and information carried on the PDSCH.
  • the master node sends indication information in at least one of the following signaling: RRC message, UCI, information carried on PUCCH, and information carried on PUSCH.
  • Step 410 The child node receives the indication information sent by the master node.
  • the sub-node when the sub-node is a UE and the master node is an access network device, the sub-node receives indication information in at least one of the following signaling: system information, SIB, RRC message, MAC CE, DCI, PDCCH information carried on the PDSCH, and information carried on the PDSCH.
  • the child node receives indication information in at least one of the following signaling: RRC message, UCI, information carried on PUCCH, and information carried on PUSCH.
  • the whole process can be simply summarized as: 1. Multiple child nodes report available resource information to the master node; 2. The master node determines the set of target child nodes based on the available resource information; 3. The master node notifies the target child nodes so that the target Child nodes participate in distributed tasks.
  • the master node sends the distributed task to the target child node, and the target child node completes the collection, calculation, training and/or reasoning of the distributed task.
  • Distributed tasks include but are not limited to at least one of the following tasks: distributed data collection tasks, distributed data computing tasks, distributed data storage tasks, distributed stream data processing tasks, distributed model training tasks, distributed model reasoning tasks At least one of tasks, distributed machine learning, and federated learning.
  • the distributed task is a federated learning task.
  • the distributed task is a machine learning task related to at least one of encoding, decoding, modulation, demodulation, transmission scheduling, transmission feedback, channel information feedback, and system broadcasting of the mobile communication system.
  • the master node determines the set of target child nodes participating in the distributed task based on the available resource information of multiple child nodes, so that the master node can According to the requirements of distributed tasks, the nodes select the best or better node set among multiple nodes that can participate in distributed tasks for training and reasoning of distributed neural networks, so as to use multiple better sub-nodes. nodes to improve the computing efficiency of distributed tasks as a whole.
  • FIG. 6 shows a block diagram of an apparatus for determining a node provided by an exemplary embodiment of the present application.
  • the device includes:
  • the sending module 620 is configured to send available resource information to the master node in the mobile communication system, where the available resource information is used to determine the target child nodes participating in the distributed task.
  • the available resource information includes at least one of the following information:
  • Computing capability information Storage capability information; Transmission capability information; Energy capability information.
  • the computing capability information includes at least one of the following information:
  • Floating-point computing capability per unit time the number of graphics processor GPUs; the cache size of the GPU; the number of neural network processors; the cache size of the neural network processors; the number of processor CPUs.
  • the storage capability information includes at least one of the following information:
  • Available memory size Available cache size; Available storage size.
  • the transmission capability information includes at least one of the following information:
  • Transmission rate transmission delay; communication signal strength; channel quality status information; transmission bit error rate; transmission error block rate; spectral efficiency information.
  • the energy capability information includes at least one of the following information:
  • the device further includes:
  • a processing module 640 configured to determine the capability level corresponding to the available resource information according to the correspondence information; the correspondence information includes: correspondence between different available resource information and different capability levels;
  • the sending module is configured to send the capability level corresponding to the available resource information to the master node.
  • the processing module 640 is configured to:
  • the computing capability level corresponding to the computing capability information is determined according to first correspondence information, where the first correspondence information includes different computing capability information and different computing capability levels. Correspondence between;
  • the storage capability level corresponding to the storage capability information is determined according to second correspondence information, where the second correspondence information includes the difference between different storage capability information and different storage capability levels Correspondence between;
  • a transmission capability level corresponding to the transmission capability information is determined according to third correspondence information, where the third correspondence information includes the difference between different transmission capability information and different transmission capability levels Correspondence between;
  • the energy capability level corresponding to the energy capability information is determined according to fourth correspondence information, where the fourth correspondence information includes the difference between the different energy capability information and the different energy capability levels Correspondence between.
  • the correspondence information is predefined by a communication protocol; or, the correspondence information is configured by the master node; or, the correspondence information is configured by a third node
  • the third node is a node other than the main node and the sub-node in the mobile communication system.
  • the available resource information is carried in at least one of the following signaling: radio resource control RRC message, uplink control information UCI, and information carried on the physical uplink control channel PUCCH , information carried on the physical uplink shared channel PUSCH; or, the available resource information is carried in at least one of the following signaling: system information, system information block SIB, radio resource control RRC message, medium access control Control unit MACCE, downlink control information DCI, information carried on the physical downlink control channel PDCCH, and information carried on the physical downlink shared channel PDSCH.
  • the device further includes:
  • the receiving module 660 is configured to receive indication information sent by the master node, where the indication information is used to indicate that the child node is a target child node participating in the distributed task.
  • FIG. 7 shows a block diagram of an apparatus for determining a node provided by an exemplary embodiment of the present application.
  • the device includes:
  • a receiving module 720 configured to receive the available resource information sent by the child node in the mobile communication system
  • the processing module 740 is configured to determine a target child node participating in the distributed task based on the available resource information of the multiple child nodes.
  • the available resource information includes at least one of the following information:
  • Computing capability information Storage capability information; Transmission capability information; Energy capability information.
  • the computing capability information includes at least one of the following information:
  • Floating-point computing capability per unit time the number of graphics processor GPUs; the cache size of the GPU; the number of neural network processors; the cache size of the neural network processors; the number of processor CPUs.
  • the storage capability information includes at least one of the following information:
  • Available memory size Available cache size; Available storage size.
  • the transmission capability information includes at least one of the following information:
  • Transmission rate transmission delay; communication signal strength; channel quality status information; transmission bit error rate; transmission error block rate; spectral efficiency information.
  • the energy capability information includes at least one of the following information:
  • the device further includes:
  • the sending module 760 is configured to configure correspondence information to the child node, where the correspondence information includes: correspondence between different available resource information and different capability levels.
  • the correspondence information includes at least one of the following four types of correspondence information:
  • first correspondence information where the first correspondence information includes correspondence between different computing capability information and different computing capability levels
  • second correspondence information where the second correspondence information includes correspondence between different storage capability information and different storage capability levels
  • third correspondence information where the third correspondence information includes correspondence between different transmission capability information and different transmission capability levels
  • Fourth correspondence information where the fourth correspondence information includes correspondence between different energy capability information and different energy capability levels.
  • the available resource information is carried in at least one of the following signaling: radio resource control RRC message, uplink control information UCI, and information carried on the physical uplink control channel PUCCH , the information carried on the physical uplink shared channel PUSCH;
  • the available resource information is carried in at least one of the following signaling: system information, system information block SIB, radio resource control RRC message, medium access control control element MACCE, downlink control information DCI, physical downlink The information carried on the control channel PDCCH and the information carried on the physical downlink shared channel PDSCH.
  • the device further includes:
  • the sending module 760 is configured to send indication information to the child node, where the indication information is used to indicate that the child node is a target child node participating in the distributed task.
  • the sub-nodes mentioned in the above embodiments may include various handheld devices, vehicle-mounted devices, wearable devices, computing devices or other processing devices connected to wireless modems with wireless communication capabilities, as well as various forms of user equipment, mobile Station (Mobile Station, MS), terminal (terminal device) and so on.
  • mobile Station Mobile Station, MS
  • terminal terminal device
  • the devices mentioned above are collectively referred to as terminals.
  • the sub-node mentioned in the above embodiment may also be a base station, and the base station is a device deployed in an access network to provide a wireless communication function for a terminal.
  • the base station may include various forms of macro base station, micro base station, relay station, access point and so on.
  • the names of devices with base station functions may vary. For example, in LTE systems, they are called eNodeBs or eNBs; in NR systems, they are called gNodeBs or gNBs.
  • the description of "base station” may change.
  • the above-mentioned apparatuses for providing a wireless communication function for a terminal are collectively referred to as network equipment.
  • FIG. 8 shows a schematic structural diagram of a communication device (terminal or network device) provided by an exemplary embodiment of the present application.
  • the communication device includes: a processor 101 , a receiver 102 , a transmitter 103 , a memory 104 and a bus 105 .
  • the processor 101 includes one or more processing cores, and the processor 101 executes various functional applications and information processing by running software programs and modules.
  • the receiver 102 and the transmitter 103 may be implemented as a communication component, which may be a communication chip.
  • the memory 104 is connected to the processor 101 through the bus 105 .
  • the memory 104 may be configured to store at least one instruction, and the processor 101 is configured to execute the at least one instruction, so as to implement each step of the node determination method for a distributed task mentioned in the foregoing method embodiments.
  • the operation performed by the sending module in FIG. 6 or FIG. 7 may be performed by the transmitter 103 in this embodiment; the operation performed by the receiving module in FIG. 6 or FIG. 7 may be performed by the receiver 104 in this embodiment.
  • the operations performed except for the sending module and the receiving module in FIG. 6 or FIG. 7 may be performed by the processor 101 in this embodiment.
  • memory 104 may be implemented by any type or combination of volatile or non-volatile storage devices including, but not limited to, magnetic or optical disks, electrically erasable programmable Read Only Memory (Electrically-Erasable Programmable Read Only Memory, EEPROM), Erasable Programmable Read Only Memory (EPROM), Static Random Access Memory (SRAM), Read Only Memory (Read-Only Memory, ROM), magnetic memory, flash memory, programmable read-only memory (Programmable Read-Only Memory, PROM).
  • volatile or non-volatile storage devices including, but not limited to, magnetic or optical disks, electrically erasable programmable Read Only Memory (Electrically-Erasable Programmable Read Only Memory, EEPROM), Erasable Programmable Read Only Memory (EPROM), Static Random Access Memory (SRAM), Read Only Memory (Read-Only Memory, ROM), magnetic memory, flash memory, programmable read-only memory (Programmable Read-Only Memory, PROM).
  • a computer-readable storage medium stores at least one instruction, at least one piece of program, code set or instruction set, the at least one instruction, the At least one section of program, the code set or the instruction set is loaded and executed by the processor to implement the node determination method for the distributed task performed by the communication device provided by each of the above method embodiments.
  • a computer program product or computer program comprising computer instructions stored in a computer readable storage medium from which a processor of a communication device is readable by a computer
  • the computer instruction is read from the storage medium, and the processor executes the computer instruction, so that the communication device performs the node determination method for the distributed task described in the above aspects.

Abstract

本申请公开了一种节点确定方法、装置、设备及介质,涉及移动通信领域。所述方法包括:移动通信系统中的子节点向主节点发送可用资源信息,主节点接收所述移动通信系统中的子节点发送的可用资源信息;基于多个所述子节点的可用资源信息,确定出参与分布式任务的目标子节点。其中,可用资源信息包括如下信息中的至少一种:计算能力信息;存储能力信息;传输能力信息;能量能力信息。

Description

分布式任务的节点确定方法、装置、设备及介质 技术领域
本申请涉及移动通信领域,特别涉及一种分布式任务的节点确定方法、装置、设备及介质。
背景技术
初期的神经网络研究大多是针对单机训练和推理的假设来构建的。近年来,研究者们的关注点开始逐渐向分布式任务的方向过渡。
分布式任务的训练过程涉及多个节点共同参与模型的训练,包括:数据集的采集、权重的调整等工作。
在分布式任务过程中,如何确定参与分布式任务的节点是亟待解决的技术问题。
发明内容
本申请实施例提供了一种节点确定方法、装置、设备及介质,能够由主节点基于可用资源信息在多个子节点中,确定出参与分布式任务的节点。
根据本申请的一个方面,提供了一种节点确定方法,应用于移动通信系统中的多个节点中的子节点,所述方法包括:
所述子节点向所述移动通信系统中的主节点发送可用资源信息,所述可用资源信息用于确定参与分布式任务的目标子节点。
根据本申请的一个方面,提供了一种节点确定方法,应用于移动通信系统中的多个节点中的主节点,所述方法包括:
所述主节点接收所述移动通信系统中的子节点发送的可用资源信息;
所述主节点基于多个所述子节点的可用资源信息,确定出参与分布式任务的目标子节点。
根据本申请的一个方面,提供了一种节点确定装置,所述装置包括:
发送模块,用于向所述移动通信系统中的主节点发送可用资源信息,所述可用资源信息用于确定参与分布式任务的目标子节点。
根据本申请的一个方面,提供了一种节点确定装置,所述装置包括:
接收模块,用于接收所述移动通信系统中的子节点发送的可用资源信息;
处理模块,用于基于多个所述子节点的可用资源信息,确定出参与分布式任务的目标子节点。
根据本申请的一个方面,提供了一种网络设备,所述网络设备包括:处理器;与所述处理器相连的收发器;用于存储所述处理器的可执行指令的存储器;其中,所述处理器被配置为加载并执行所述可执行指令以实现如上述方面所述的节点确定方法。
根据本申请的一个方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有可执行指令,所述可执行指令由处理器加载并执行以实现 如上述方面所述的节点确定方法。
根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中,计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述方面所述的节点确定方法。
根据本申请的一个方面,提供了一种芯片,所述芯片包括可编程逻辑电路或程序,所述芯片用于实现如上述方面所述的节点确定方法。
本申请实施例提供的技术方案至少包括如下有益效果:
通过由子节点向主节点上报可用资源信息,由主节点基于多个子节点的可用资源信息,确定出参与分布式任务的目标子节点集合,能够使得主节点根据分布式任务的需求,在可参与分布式任务的多个节点中,选取出最佳或较佳的节点集合来用于分布式神经网络的训练和推理,从而利用多个较优的子节点来整体上提高分布式任务的计算效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一个示例性实施例提供的联邦学习场景的示意图;
图2是本申请一个示例性实施例提供的移动通信系统的示意图;
图3是本申请一个示例性实施例提供的节点确定方法的流程图;
图4是本申请一个示例性实施例提供的节点确定方法的流程图;
图5是本申请一个示例性实施例提供的节点确定方法的流程图;
图6是本申请一个示例性实施例示出的节点确定装置的框图;
图7是本申请一个示例性实施例示出的节点确定装置的框图;
图8是本申请一个示例性实施例示出的通信设备的框图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
在对本申请实施例提供的方法进行详细介绍之前,先对本申请实施例涉及的相关术语和实施环境进行简单介绍。
分布式任务:涉及多个节点共同参与的任务。分布式任务包括但不限于如下任务中的至少一种:分布式数据收集任务、分布式数据计算任务、分布式数据存储任务、分布式流数据处理任务、分布式模型训练任务、分布式模型推理任务、分布式机器学习、联邦学习中的至少一种。
联邦学习:一种典型的分布式任务方案。如图1所示,在联邦学习的训练过程中,训练集分布在各个子节点12上。首先,各个子节点12基于本地的训练集训练得到本地局部神经网络,将本地局部神经网络上传至主节点14。主节 点14根据获得的各个本地局部神经网络合并得到全局神经网络,并将全局神经网络传输至各个子节点12;各个子节点12继续使用新的全局神经网络做下一次训练迭代。最终,在多个子节点的协作下完成神经网络的训练。
图2示出了本申请一个示例性实施例提供的分布式任务系统的框图。该系统包括:多个子节点12、主节点14和第三节点16。其中,第三节点16是可选节点。
子节点12是用于参与分布式任务的节点,子节点12为移动通信系统中的用户设备(User Equipment,UE),接入网设备、核心网网元或其他网络设备。比如,接入网设备包括基站,核心网网元包括用户面功能(User Plane Function,UPF),统一数据管理(Unified Data Management,UDM),网络开放功能(Network Exposure Function,NEF),接入和移动性管理功能(Access and Mobility Management Function,AMF)实体,会话管理功能(Session Management Function,SMF),策略控制功能(Policy Control Function,PCF)中的至少一种。
主节点14是用于任务分配、任务分发以及参与分布式任务的节点。主节点14为移动通信系统中的用户设备(User Equipment,UE),接入网设备、核心网网元或其他网络设备。比如,接入网设备包括基站,核心网网元包括UPF,UDM,NEF,AMF实体、SMF,PCF中的至少一种。主节点14可以是移动通信系统中独立的网络节点,也可以是参与分布式任务的子节点12中的一个特定子节点,也可以是参与分布式任务的控制节点。
第三节点16是移动通信系统中不同于子节点12和主节点14的节点。
图3示出了本申请一个示例性实施例提供的分布式任务的节点确定方法的流程图。该方法可以由移动通信系统中的多个节点中的主节点和子节点执行,该方法包括:
步骤302:子节点向移动通信系统中的主节点发送可用资源信息,可用资源信息用于确定参与分布式任务的目标子节点信息;
由于可充当子节点的设备类型众多,不同设备的计算能力、存储能力、传输能力和能量能力均存在很大不同。子节点向主节点上报自身的可用资源信息。可用资源信息包括如下信息中的至少一种:
·计算能力信息;
计算能力信息是用于指示子节点中与计算能力方面相关的信息。计算能力信息用于表征定点计算、浮点计算、计算缓存中的至少一种能力。
·存储能力信息;
存储能力信息是用于指示子节点中与存储能力方面相关的信息。存储能力信息用于表征可用内存、可用缓存、可用存储中的至少一种能力。
·传输能力信息;
传输能力信息是用于指示子节点中与数据传输能力相关的信息。传输能力信息用于表征速率、时延、信号强度、误码率、误块率中的至少一种能力。
·能量能力信息。
能量能力信息是用于指示子节点中与电量能力相关的信息。能量能力信息 用于表征剩余电量、可用电量、续航预测中的至少一种能力。
在一个实施例中,子节点向主节点周期性上报可用资源信息;在另一个实施例中,主节点向子节点发送上报指示,子节点在接收到上报指示后,向主节点上报可用资源信息。
步骤304:主节点接收移动通信系统中的多个子节点发送的可用资源信息;
步骤306:主节点基于多个子节点的可用资源信息,确定出参与分布式任务的目标子节点集合。
主节点基于多个子节点的可用资源信息,在多个子节点中挑选可用资源较优的子节点作为参与分布式任务的目标子节点,添加至目标子节点集合。
综上所述,本实施例提供的方法,通过由子节点向主节点上报可用资源信息,由主节点基于多个子节点的可用资源信息,确定出参与分布式任务的目标子节点集合,能够使得主节点根据分布式任务的需求,在可参与分布式任务的多个节点中,选取出最佳或较佳的节点集合来用于分布式神经网络的训练和推理,从而利用多个较优的子节点来整体上提高分布式任务的计算效率。
本实施例中,可用资源信息包括如下四种信息中的至少一项:
(一)计算能力信息;
计算能力信息,包括如下信息中的至少一种:
·单位时间内的浮点数计算能力;
·图形处理器(Graphics Processing Unit,GPU)的数量;
·GPU的缓存大小;
·神经网络处理器(Neural network Processing Unit,NPU)的数量;
·神经网络处理器的缓存大小;
·处理器(Central Processing Unit,CPU)的数量。
在一个实施例中,计算能力信息可通过单位时间内的浮点数计算能力,GPU数量,GPU缓存大小等方式中的一种或多种表示。
在另一个实施例中,计算能力信息可通过计算能力等级信息表示。例如不同的计算能力等级信息代表了不同的单位时间内的浮点数计算能力,或者代表了不同的GPU数量,或者代表了不同的GPU缓存大小,或者代表了不同的GPU数量以及GPU缓存大小,或者代表了不同的GPU数量以及GPU缓存大小,或者代表了不同的神经网络处理器的处理能力、或者缓存大小、或者处理器数量、或者上述一项或者多项的组合。
例如,可以将不同的GPU缓存大小对应为4类不同的计算能力等级信息,如表一所示。
表一
计算能力等级 GPU缓存大小
1 4G
2 8G
3 16G
4 32G
再例如,可以将不同的处理器缓存大小及不同的处理器个数对应为4类不同的计算能力等级信息,如表二所示。
表二
计算能力等级 处理器缓存大小 处理器个数
1 4G 1
2 4G 2
2 8G 1
3 8G 2
3 16G 1
4 16G 2
4 32G 1
计算能力等级信息与上述单位时间内的浮点数计算能力、或者GPU数量、或者GPU缓存大小、或者神经网络处理器的处理能力、处理器数量、缓存大小等一项或者多项之间的对应关系是协议预先约定的,或者是主节点向子节点配置的,或者是第三节点向子节点配置的。
例如主节点或第三节点是网络设备,子节点是UE,网络设备通过广播消息、系统信息块(System Information Block,SIB)、无线资源控制(Radio Resource Control,RRC)消息、RRC重配置信令、下行控制信息(Downlink Control Information,DCI)、媒体接入控制控制信元(Medium Access Control ControlElement,MAC CE)、物理下行控制信道(Physical Downlink Control Channel,PDCCH)命令(order)、数据信息等方式中的一种或多种方式传输上述对应关系给UE。
可以理解的是,SIB是广播消息一种可能的实现形式,RRC重配置信令是RRC消息一种可能的实现形式。也即,第一指示信令包括如下中的至少一种:广播消息、RRC消息、DCI、MAC CE、PDCCH order、数据信息;广播消息包括SIB,RRC消息包括RRC重配置信令。
(二)存储能力信息;
存储能力信息,包括如下信息中的至少一种:
·可用内存大小;
·可用缓存大小;
·可用存储大小。
在一些实施例中,存储能力信息可通过可用内存大小、可用缓存大小、可用存储大小等方式中的一种或多种表示。本申请中的“可用”是指“可分配给分布式任务所使用的”。
在一些实施例中,存储能力信息可通过存储能力等级信息表示,不同的存储能力等级信息代表了不同的可用内存大小,或者代表了不同的可用缓存大小,或者代表了不同的可用存储大小。
例如,可以将不同的内存大小对应为4类不同的计算能力等级信息,如表三所示。
表三
计算能力等级 内存大小
1 128G
2 256G
3 512G
4 1024G
存储能力等级信息与上述内存大小、缓存大小、存储大小等一项或之间的对应关系是协议预先约定的,或者是主节点向子节点配置的,或者是第三节点向子节点配置的。
例如主节点或第三节点是网络设备,子节点是UE,网络设备通过广播、SIB、RRC消息、MAC CE、PDCCH、DCI等方式中的一种或多种方式传输上述对应关系给UE。
(三)传输能力信息;
传输能力信息,包括如下信息中的至少一种:
·传输速率;
·传输时延;
·通信信号强度。
例如:参考信号接收功率(Reference Signal Received Power,RSRP)、参考信号接收质量(ReferenceSignal Received Quality,RSRQ)、信干噪比(Signal-to-Interference-and-Noise Ratio,SINR)。
·信道质量状态信息;
·传输误码率;
·传输误信息块率;
·频谱效率信息。
传输能力信息可通过可支持的传输速率、传输时延、通信信号强度、信道质量状态信息、传输误码率、传输误信息块率、频谱效率信等方式中的一种或多种表示。
传输能力可通过传输能力等级信息表示,不同的传输能力等级信息代表了不同的传输速率、传输时延、通信信号强度,或者代表了不同的信道质量状态信息,或者代表了不同的传输误码率,或者代表了不同的传输误信息块率,或者代表了不同的频谱效率。
传输能力等级信息与上述传输速率、传输时延、通信信号强度、信道质量状态信息、传输误码率、传输误信息块率、频谱效率信等一项或多项之间的对应关系是协议预先约定的,或者是主节点向子节点配置的,或者是第三节点向子节点配置的。
例如主节点或第三节点是网络设备,子节点是UE,网络设备通过广播、SIB、RRC消息、MAC CE、PDCCH、DCI等方式中的一种或多种方式传输上述对应关系给UE。
(四)能量能力信息。
能量能力信息,包括如下信息中的至少一种:
·剩余电量;
·针对分布式任务的可用电量;
·续航时间的预测值。
在一个实施例中,能量能力信息可通过子节点的剩余电量、子节点可用于分布式任务的电量、续航时间的预测值等方式中的一种或多种表示。
在另一个实施例中,能量能力可通过能量能力等级信息表示。不同的能量能力等级信息代表了不同的剩余电量,或者代表了不同的可用于分布式任务的电量信息,或者,代表了不同的续航时间的预测值。
能量能力等级信息与上述电量信息之间的对应关系是协议预先约定的,或者是主节点向子节点配置的,或者是第三节点向子节点配置的。
例如主节点或第三节点是网络设备,子节点是UE,网络设备通过广播、SIB、RRC消息、MAC CE、PDCCH、DCI等方式中的一种或多种方式传输上述对应关系给UE。
图4示出了本申请一个示例性实施例提供的节点确定方法的流程图。该方法可以由移动通信系统中的多个节点中的主节点和子节点执行,该方法包括:
步骤402:子节点向移动通信系统中的主节点发送可用资源信息,可用资源信息用于确定参与分布式任务的目标子节点信息;
由于可充当子节点的设备类型众多,不同设备的计算能力、存储能力、传输能力和能量能力均存在很大不同。子节点向主节点上报自身的可用资源信息。可用资源信息包括如下信息中的至少一种:
·计算能力信息;
·存储能力信息;
·传输能力信息;
·能量能力信息。
在一个实施例中,子节点向主节点周期性上报可用资源信息;在另一个实施例中,主节点向子节点发送上报指示,子节点在接收到上报指示后,向主节点上报可用资源信息。
由于可用资源信息的种类可以为很多种,在一个实施例中,存在至少两种可用资源信息携带在同一信令中;和/或,存在至少两种可用资源信息携带在不同信令中。
子节点可以单独反馈上述计算能力信息、存储能力信息、传输能力信息、能量能力信息中的任意一种信息至第三节点。子节点也可以同时反馈计算能力信息、存储能力信息、传输能力信息、能量能力信息中的至少两种信息至第三节点。
可选地,子节点反馈多项上述信息的方式可以是通过反馈子节点能力等级信息的方式,反馈上述计算能力信息、存储能力信息、传输能力信息、能量能力信息中的多项。示例性的如表四所示:
表四
子节点能力等级 计算能力等级 存储能力等级 传输能力等级 能耗能力等级
1 1 1 1 1
2 2 2 2 2
3 3 3 3 3
4 3 3 4 4
5 4 4 1 1
6 4 4 2 2
7 4 4 3 3
8 4 4 4 4
需要说明的是,本申请中的表格均为示例性说明,并不限定可用资源信息的具体表现形式。
示例性的,在子节点是UE且主节点是接入网设备时,可用资源信息携带在如下信令中的至少一种信令中:RRC消息、UCI、PUCCH上承载的信息、PUSCH上承载的信息。在子节点是接入网设备且主节点是UE时,可用资源信息携带在如下信令中的至少一种信令中:系统信息、SIB、RRC消息、MACCE、DCI、PDCCH上承载的信息、PDSCH上承载的信息。
在一个实施例中,存在至少一种可用资源信息采用数据来表示,子节点向主节点发送数据形式的可用资源信息。在另一个实施例中,存在至少一种可用资源信息采用能力等级来表示,子节点向主节点发送能力等级形式的可用资源信息。
示例性的,子节点根据对应关系信息,确定可用资源信息对应的能力等级;对应关系信息包括:不同数值的可用资源信息和不同能力等级之间的对应关系;子节点向主节点发送可用资源信息对应的能力等级。
示意性的,可用资源信息包括计算能力信息;子节点根据对应关系信息,确定计算能力信息对应的计算能力等级;对应关系信息包括:不同数值的计算能力信息和不同计算能力等级之间的对应关系;子节点向主节点发送计算能力等级。
示意性的,可用资源信息包括存储能力信息;子节点根据对应关系信息,确定存储能力信息对应的存储能力等级;对应关系信息包括:不同数值的存储能力信息和不同存储能力等级之间的对应关系;子节点向主节点发送存储能力等级。
示意性的,可用资源信息包括传输能力信息;子节点根据对应关系信息,确定传输能力信息对应的传输能力等级;对应关系信息包括:不同数值的传输能力信息和不同传输能力等级之间的对应关系;子节点向主节点发送传输能力等级。
示意性的,可用资源信息包括能量能力信息;子节点根据对应关系信息,确定能量能力信息对应的能量能力等级;对应关系信息包括:不同数值的能量能力信息和不同能量能力等级之间的对应关系;子节点向主节点发送能量能力等级。
在一个实施例中,该对应关系信息是通信协议预定义的。在一个实施例中,该对应关系信息是主节点预先向子节点配置的。在一个实施例中,该对应关系信息是第三节点预先向子节点配置的,第三节点是移动通信系统中与主节点和子节点均不相同的一个节点。
步骤404:主节点接收移动通信系统中的多个子节点发送的可用资源信息;
示意性的,在子节点是UE且主节点是接入网设备时,主节点在如下信令中的至少一种信令中接收子节点发送的可用资源信息:RRC消息、UCI、PUCCH上承载的信息、PUSCH上承载的信息。在子节点是接入网设备且主节点是UE时,可用资源信息携带在如下信令中的至少一种信令中接收子节点发送的可用资源信息:系统信息、SIB、RRC消息、MACCE、DCI、PDCCH上承载的信息、PDSCH上承载的信息。
步骤406:主节点基于多个子节点的可用资源信息,确定出参与分布式任务的目标子节点。
主节点基于多个子节点的可用资源信息,在多个子节点中挑选可用资源较优的子节点作为参与分布式任务的目标子节点,添加至目标子节点集合。
在一个实施例中,可用资源信息包括计算能力信息,主节点基于多个子节点的计算能力信息,在多个子节点中挑选计算能力最好的n个子节点作为参与分布式任务的目标子节点,添加至目标子节点集合。n为正整数,n是分布式任务所需要的子节点数量。
在一个实施例中,可用资源信息包括存储能力信息,主节点基于多个子节点的存储能力信息,在多个子节点中挑选存储能力最好的n个子节点作为参与分布式任务的目标子节点,添加至目标子节点集合。
在一个实施例中,可用资源信息包括传输能力信息,主节点基于多个子节点的传输能力信息,在多个子节点中挑选传输能力最好的n个子节点作为参与分布式任务的目标子节点,添加至目标子节点集合。
在一个实施例中,可用资源信息包括能量能力信息,主节点基于多个子节点的能量能力信息,在多个子节点中挑选能量能力最好的n个子节点作为参与分布式任务的目标子节点,添加至目标子节点集合。
在一个实施例中,可用资源信息包括至少两种信息,每种可用资源信息按照实际数据被折算为分数,每个子节点的可用资源信息能够被折算为一个总分数,主节点在多个子节点中挑选总分数最好的n个子节点作为参与分布式任务的目标子节点,添加至目标子节点集合。
在分布式任务对资源能力有所偏好的情况下,主节点还在计算每种可用资源信息的分数时,为每种可用资源信息设置相应的权重。比如,在分布式任务对浮点计算能力的需求较高时,主节点为浮点计算能力设置较高的权重;又比如,在分布式任务对电量要求较高时,主节点为可用电量设置较高的权重。
在一个实施例中,主节点设置基于可用资源信息设置出一组参与门限条件,在多个子节点中选择出可用资源信息符合参与门限条件的多个候选子节点,在多个候选子节点中随机确定出n个子节点作为参与分布式任务的目标子节点, 或者,在多个候选子节点中确定出发送时间最早的n个子节点作为参与分布式任务的目标子节点,添加至目标子节点集合。
步骤408:主节点向属于目标子节点集合的子节点发送指示信息,指示信息用于指示该子节点是参与分布式任务的目标子节点;
示意性的,在子节点是UE且主节点是接入网设备时,主节点在如下信令中的至少一种信令中发送指示信息:系统信息、SIB、RRC消息、MACCE、DCI、PDCCH上承载的信息、PDSCH上承载的信息。在子节点是接入网设备且主节点是UE时,主节点在如下信令中的至少一种信令中发送指示信息:RRC消息、UCI、PUCCH上承载的信息、PUSCH上承载的信息。
步骤410:子节点接收主节点发送的指示信息。
示意性的,在子节点是UE且主节点是接入网设备时,子节点在如下信令中的至少一种信令中接收指示信息:系统信息、SIB、RRC消息、MACCE、DCI、PDCCH上承载的信息、PDSCH上承载的信息。在子节点是接入网设备且主节点是UE时,子节点在如下信令中的至少一种信令中接收指示信息:RRC消息、UCI、PUCCH上承载的信息、PUSCH上承载的信息。
结合参考图5,整个流程可简单概括为:1、多个子节点向主节点上报可用资源信息;2、主节点基于可用资源信息确定目标子节点集合;3、主节点通知目标子节点,以便目标子节点参与分布式任务。
在后续过程中,主节点向目标子节点发送分布式任务,由目标子节点完成分布式任务的收集、计算、训练和/或推理。
分布式任务包括但不限于如下任务中的至少一种:分布式数据收集任务、分布式数据计算任务、分布式数据存储任务、分布式流数据处理任务、分布式模型训练任务、分布式模型推理任务、分布式机器学习、联邦学习中的至少一种。示例性的,分布式任务是联邦学习任务。
在一个可能的示例中,分布式任务是与移动通信系统的编码、解码、调制、解调、传输调度、传输反馈、信道信息反馈、系统广播中的至少一项相关的机器学习任务。
综上所述,本实施例提供的方法,通过由子节点向主节点上报可用资源信息,由主节点基于多个子节点的可用资源信息,确定出参与分布式任务的目标子节点集合,能够使得主节点根据分布式任务的需求,在可参与分布式任务的多个节点中,选取出最佳或较佳的节点集合来用于分布式神经网络的训练和推理,从而利用多个较优的子节点来整体上提高分布式任务的计算效率。
图6示出了本申请一个示例性实施例提供的节点确定装置的框图。所述装置包括:
发送模块620,用于向所述移动通信系统中的主节点发送可用资源信息,所述可用资源信息用于确定参与分布式任务的目标子节点。
在本实施例的一个可选设计中,所述可用资源信息包括如下信息中的至少一种:
计算能力信息;存储能力信息;传输能力信息;能量能力信息。
在本实施例的一个可选设计中,所述计算能力信息,包括如下信息中的至少一种:
单位时间内的浮点数计算能力;图形处理器GPU的数量;所述GPU的缓存大小;神经网络处理器的数量;所述神经网络处理器的缓存大小;处理器CPU的数量。
在本实施例的一个可选设计中,所述存储能力信息,包括如下信息中的至少一种:
可用内存大小;可用缓存大小;可用存储大小。
在本实施例的一个可选设计中,所述传输能力信息,包括如下信息中的至少一种:
传输速率;传输时延;通信信号强度;信道质量状态信息;传输误码率;传输误信息块率;频谱效率信息。
在本实施例的一个可选设计中,所述能量能力信息,包括如下信息中的至少一种:
剩余电量;针对所述分布式任务的可用电量;续航时间的预测值。
在本实施例的一个可选设计中,所述装置还包括:
处理模块640,用于根据对应关系信息,确定所述可用资源信息对应的能力等级;所述对应关系信息包括:不同可用资源信息和不同能力等级之间的对应关系;
所述发送模块,用于向所述主节点发送所述可用资源信息对应的能力等级。
在本实施例的一个可选设计中,所述处理模块640,用于:
在所述可用资源信息包括计算能力信息的情况下,根据第一对应关系信息确定所述计算能力信息对应的计算能力等级,所述第一对应关系信息包括不同计算能力信息和不同计算能力等级之间的对应关系;
在所述可用资源信息包括存储能力信息的情况下,根据第二对应关系信息确定所述存储能力信息对应的存储能力等级,所述第二对应关系信息包括不同存储能力信息和不同存储能力等级之间的对应关系;
在所述可用资源信息包括传输能力信息的情况下,根据第三对应关系信息确定所述传输能力信息对应的传输能力等级,所述第三对应关系信息包括不同传输能力信息和不同传输能力等级之间的对应关系;
在所述可用资源信息包括能量能力信息的情况下,根据第四对应关系信息确定所述能量能力信息对应的能量能力等级,所述第四对应关系信息包括不同能量能力信息和不同能量能力等级之间的对应关系。
在本实施例的一个可选设计中,所述对应关系信息是通信协议预定义的;或,所述对应关系信息是所述主节点配置的;或,所述对应关系信息是第三节点配置的,所述第三节点是所述移动通信系统中除所述主节点和所述子节点之外的一个节点。
在本实施例的一个可选设计中,存在至少两种所述可用资源信息携带在同 一信令中;和/或,存在至少两种所述可用资源信息携带在不同信令中;
在本实施例的一个可选设计中,所述可用资源信息携带在如下信令中的至少一种信令中:无线资源控制RRC消息、上行控制信息UCI、物理上行控制信道PUCCH上承载的信息、物理上行共享信道PUSCH上承载的信息;或者,所述可用资源信息携带在如下信令中的至少一种信令中:系统信息、系统信息块SIB、无线资源控制RRC消息、媒体接入控制控制单元MACCE、下行控制信息DCI、物理下行控制信道PDCCH上承载的信息、物理下行共享信道PDSCH上承载的信息。
在本实施例的一个可选设计中,所述装置还包括:
接收模块660,用于接收所述主节点发送的指示信息,所述指示信息用于指示所述子节点是参与所述分布式任务的目标子节点。
图7示出了本申请一个示例性实施例提供的节点确定装置的框图。所述装置包括:
接收模块720,用于接收所述移动通信系统中的子节点发送的可用资源信息;
处理模块740,用于基于多个所述子节点的可用资源信息,确定出参与分布式任务的目标子节点。
在本实施例的一个可选设计中,所述可用资源信息包括如下信息中的至少一种:
计算能力信息;存储能力信息;传输能力信息;能量能力信息。
在本实施例的一个可选设计中,所述计算能力信息,包括如下信息中的至少一种:
单位时间内的浮点数计算能力;图形处理器GPU的数量;所述GPU的缓存大小;神经网络处理器的数量;所述神经网络处理器的缓存大小;处理器CPU的数量。
在本实施例的一个可选设计中,所述存储能力信息,包括如下信息中的至少一种:
可用内存大小;可用缓存大小;可用存储大小。
在本实施例的一个可选设计中,所述传输能力信息,包括如下信息中的至少一种:
传输速率;传输时延;通信信号强度;信道质量状态信息;传输误码率;传输误信息块率;频谱效率信息。
在本实施例的一个可选设计中,所述能量能力信息,包括如下信息中的至少一种:
剩余电量;针对所述分布式任务的可用电量;续航时间的预测值。
在本实施例的一个可选设计中,所述装置还包括:
发送模块760,用于向所述子节点配置对应关系信息,所述对应关系信息包括:不同可用资源信息和不同能力等级之间的对应关系。
在本实施例的一个可选设计中,所述对应关系信息包括如下四种对应关系信息中的至少一种:
第一对应关系信息,所述第一对应关系信息包括不同计算能力信息和不同计算能力等级之间的对应关系;
第二对应关系信息,所述第二对应关系信息包括不同存储能力信息和不同存储能力等级之间的对应关系;
第三对应关系信息,所述第三对应关系信息包括不同传输能力信息和不同传输能力等级之间的对应关系;
第四对应关系信息,所述第四对应关系信息包括不同能量能力信息和不同能量能力等级之间的对应关系。
在本实施例的一个可选设计中,存在至少两种所述可用资源信息携带在同一信令中;和/或,存在至少两种所述可用资源信息携带在不同信令中;
在本实施例的一个可选设计中,所述可用资源信息携带在如下信令中的至少一种信令中:无线资源控制RRC消息、上行控制信息UCI、物理上行控制信道PUCCH上承载的信息、物理上行共享信道PUSCH上承载的信息;
或者,所述可用资源信息携带在如下信令中的至少一种信令中:系统信息、系统信息块SIB、无线资源控制RRC消息、媒体接入控制控制单元MACCE、下行控制信息DCI、物理下行控制信道PDCCH上承载的信息、物理下行共享信道PDSCH上承载的信息。
在本实施例的一个可选设计中,所述装置还包括:
发送模块760,用于向所述子节点发送指示信息,所述指示信息用于指示所述子节点是参与所述分布式任务的目标子节点。
在上述实施例中提及的子节点可以包括各种具有无线通信功能的手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其他处理设备,以及各种形式的用户设备,移动台(Mobile Station,MS),终端(terminal device)等等。为方便描述,上面提到的设备统称为终端。
在上述实施例中提及的子节点还可以是基站,所述基站是一种部署在接入网中用以为终端提供无线通信功能的装置。基站可以包括各种形式的宏基站,微基站,中继站,接入点等等。在采用不同的无线接入技术的系统中,具备基站功能的设备的名称可能会有所不同,例如在LTE系统中,称为eNodeB或者eNB;在NR系统中,称为gNodeB或者gNB。随着通信技术的演进,“基站”这一描述可能会变化。为方便本申请实施例中,上述为终端提供无线通信功能的装置统称为网络设备。
图8示出了本申请一个示例性实施例提供的通信设备(终端或网络设备)的结构示意图,该通信设备包括:处理器101、接收器102、发射器103、存储器104和总线105。
处理器101包括一个或者一个以上处理核心,处理器101通过运行软件程序以及模块,从而执行各种功能应用以及信息处理。
接收器102和发射器103可以实现为一个通信组件,该通信组件可以是一块通信芯片。
存储器104通过总线105与处理器101相连。
存储器104可用于存储至少一个指令,处理器101用于执行该至少一个指令,以实现上述方法实施例中提到的分布式任务的节点确定方法的各个步骤。
在图6或图7中由发送模块执行的操作,可以由本实施例中的发射器103来执行;在图6或图7中由接收模块执行的操作,可以由本实施例中的接收器104来执行,在图6或图7中除发送模块和接收模块之外执行的操作,均可以由本实施例中的处理器101来执行。
此外,存储器104可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,易失性或非易失性存储设备包括但不限于:磁盘或光盘,电可擦除可编程只读存储器(Electrically-Erasable Programmable Read Only Memory,EEPROM),可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM),静态随时存取存储器(Static Random Access Memory,SRAM),只读存储器(Read-Only Memory,ROM),磁存储器,快闪存储器,可编程只读存储器(Programmable Read-Only Memory,PROM)。
在示例性实施例中,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现上述各个方法实施例提供的由通信设备执行的分布式任务的节点确定方法。
在示例性实施例中,还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中,通信设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该通信设备执行上述方面所述的分布式任务的节点确定方法。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (48)

  1. 一种分布式任务的节点确定方法,其特征在于,应用于移动通信系统中的多个节点中的子节点,所述方法包括:
    所述子节点向所述移动通信系统中的主节点发送可用资源信息,所述可用资源信息用于确定参与所述分布式任务的目标子节点。
  2. 根据权利要求1所述的方法,其特征在于,所述可用资源信息包括如下信息中的至少一种:
    计算能力信息;
    存储能力信息;
    传输能力信息;
    能量能力信息。
  3. 根据权利要求2所述的方法,其特征在于,所述计算能力信息,包括如下信息中的至少一种:
    单位时间内的浮点数计算能力;
    图形处理器GPU的数量;
    所述GPU的缓存大小;
    神经网络处理器的数量;
    所述神经网络处理器的缓存大小;
    处理器CPU的数量。
  4. 根据权利要求2所述的方法,其特征在于,所述存储能力信息,包括如下信息中的至少一种:
    可用内存容量;
    可用缓存容量;
    可用存储容量。
  5. 根据权利要求2所述的方法,其特征在于,所述传输能力信息,包括如下信息中的至少一种:
    传输速率;
    传输时延;
    通信信号强度;
    信道质量状态信息;
    传输误码率;
    传输误信息块率;
    频谱效率信息。
  6. 根据权利要求2所述的方法,其特征在于,所述能量能力信息,包括如下信息中的至少一种:
    剩余电量;
    针对所述分布式任务的可用电量;
    续航时间的预测值。
  7. 根据权利要求1至6任一所述的方法,其特征在于,所述子节点向主节点发送可用资源信息,包括:
    所述子节点根据对应关系信息,确定所述可用资源信息对应的能力等级;所述对应关系信息包括:不同可用资源信息和不同能力等级之间的对应关系;
    所述子节点向主节点发送所述可用资源信息对应的能力等级。
  8. 根据权利要求7所述的方法,其特征在于,所述根据对应关系信息,确定所述可用资源信息对应的能力等级,包括:
    在所述可用资源信息包括计算能力信息的情况下,根据第一对应关系信息确定所述计算能力信息对应的计算能力等级,所述第一对应关系信息包括不同计算能力信息和不同计算能力等级之间的对应关系;
    在所述可用资源信息包括存储能力信息的情况下,根据第二对应关系信息确定所述存储能力信息对应的存储能力等级,所述第二对应关系信息包括不同存储能力信息和不同存储能力等级之间的对应关系;
    在所述可用资源信息包括传输能力信息的情况下,根据第三对应关系信息确定所述传输能力信息对应的传输能力等级,所述第三对应关系信息包括不同传输能力信息和不同传输能力等级之间的对应关系;
    在所述可用资源信息包括能量能力信息的情况下,根据第四对应关系信息确定所述能量能力信息对应的能量能力等级,所述第四对应关系信息包括不同能量能力信息和不同能量能力等级之间的对应关系。
  9. 根据权利要求7所述的方法,其特征在于,
    所述对应关系信息是通信协议预定义的;
    或,所述对应关系信息是所述主节点配置的;
    或,所述对应关系信息是第三节点配置的,所述第三节点是所述移动通信系统中除所述主节点和所述子节点之外的一个节点。
  10. 根据权利要求2至6任一所述的方法,其特征在于,
    存在至少两种所述可用资源信息携带在同一信令中;
    和/或,
    存在至少两种所述可用资源信息携带在不同信令中。
  11. 根据权利要求1至6任一所述的方法,其特征在于,
    所述可用资源信息携带在如下信令中的至少一种信令中:无线资源控制RRC消息、上行控制信息UCI、物理上行控制信道PUCCH上承载的信息、物理上行共享信道PUSCH上承载的信息;
    或者,
    所述可用资源信息携带在如下信令中的至少一种信令中:系统信息、系统信息块SIB、无线资源控制RRC消息、媒体接入控制控制单元MACCE、下行控制信息DCI、物理下行控制信道PDCCH上承载的信息、物理下行共享信道PDSCH上承载的信息。
  12. 根据权利要求1至6任一所述的方法,其特征在于,所述方法还包括:
    所述子节点接收所述主节点发送的指示信息,所述指示信息用于指示所述 子节点是参与所述分布式任务的目标子节点。
  13. 一种分布式任务的节点确定方法,其特征在于,应用于移动通信系统中的多个节点中的主节点,所述方法包括:
    所述主节点接收所述移动通信系统中的子节点发送的可用资源信息;
    所述主节点基于多个所述子节点的可用资源信息,确定出参与所述分布式任务的目标子节点。
  14. 根据权利要求13所述的方法,其特征在于,所述可用资源信息包括如下信息中的至少一种:
    计算能力信息;
    存储能力信息;
    传输能力信息;
    能量能力信息。
  15. 根据权利要求14所述的方法,其特征在于,所述计算能力信息,包括如下信息中的至少一种:
    单位时间内的浮点数计算能力;
    图形处理器GPU的数量;
    所述GPU的缓存大小;
    神经网络处理器的数量;
    所述神经网络处理器的缓存大小;
    处理器CPU的数量。
  16. 根据权利要求14所述的方法,其特征在于,所述存储能力信息,包括如下信息中的至少一种:
    可用内存大小;
    可用缓存大小;
    可用存储大小。
  17. 根据权利要求14所述的方法,其特征在于,所述传输能力信息,包括如下信息中的至少一种:
    传输速率;
    传输时延;
    通信信号强度;
    信道质量状态信息;
    传输误码率;
    传输误信息块率;
    频谱效率信息。
  18. 根据权利要求14所述的方法,其特征在于,所述能量能力信息,包括如下信息中的至少一种:
    剩余电量;
    针对所述分布式任务的可用电量;
    续航时间的预测值。
  19. 根据权利要求13至18任一所述的方法,其特征在于,所述方法还包括:
    所述主节点向所述子节点配置对应关系信息,所述对应关系信息包括:不同可用资源信息和不同能力等级之间的对应关系。
  20. 根据权利要求19所述的方法,其特征在于,所述对应关系信息包括如下四种对应关系信息中的至少一种:
    第一对应关系信息,所述第一对应关系信息包括不同计算能力信息和不同计算能力等级之间的对应关系;
    第二对应关系信息,所述第二对应关系信息包括不同存储能力信息和不同存储能力等级之间的对应关系;
    第三对应关系信息,所述第三对应关系信息包括不同传输能力信息和不同传输能力等级之间的对应关系;
    第四对应关系信息,所述第四对应关系信息包括不同能量能力信息和不同能量能力等级之间的对应关系。
  21. 根据权利要求14至18任一所述的方法,其特征在于,
    存在至少两种所述可用资源信息携带在同一信令中;和/或,存在至少两种所述可用资源信息携带在不同信令中。
  22. 根据权利要求13至18任一所述的方法,其特征在于,
    所述可用资源信息携带在如下信令中的至少一种信令中:无线资源控制RRC消息、上行控制信息UCI、物理上行控制信道PUCCH上承载的信息、物理上行共享信道PUSCH上承载的信息;
    或者,所述可用资源信息携带在如下信令中的至少一种信令中:系统信息、系统信息块SIB、无线资源控制RRC消息、媒体接入控制控制单元MACCE、下行控制信息DCI、物理下行控制信道PDCCH上承载的信息、物理下行共享信道PDSCH上承载的信息。
  23. 根据权利要求13至18任一所述的方法,其特征在于,所述方法还包括:
    所述主节点向所述子节点发送指示信息,所述指示信息用于指示所述子节点是参与所述分布式任务的目标子节点。
  24. 一种分布式任务的节点确定装置,其特征在于,所述装置包括:
    发送模块,用于向所述移动通信系统中的主节点发送可用资源信息,所述可用资源信息用于确定参与分布式任务的目标子节点。
  25. 根据权利要求24所述的装置,其特征在于,所述可用资源信息包括如下信息中的至少一种:
    计算能力信息;
    存储能力信息;
    传输能力信息;
    能量能力信息。
  26. 根据权利要求25所述的装置,其特征在于,所述计算能力信息,包括 如下信息中的至少一种:
    单位时间内的浮点数计算能力;
    图形处理器GPU的数量;
    所述GPU的缓存大小;
    神经网络处理器的数量;
    所述神经网络处理器的缓存大小;
    处理器CPU的数量。
  27. 根据权利要求25所述的装置,其特征在于,所述存储能力信息,包括如下信息中的至少一种:
    可用内存大小;
    可用缓存大小;
    可用存储大小。
  28. 根据权利要求25所述的装置,其特征在于,所述传输能力信息,包括如下信息中的至少一种:
    传输速率;
    传输时延;
    通信信号强度;
    信道质量状态信息;
    传输误码率;
    传输误信息块率;
    频谱效率信息。
  29. 根据权利要求25所述的装置,其特征在于,所述能量能力信息,包括如下信息中的至少一种:
    剩余电量;
    针对所述分布式任务的可用电量;
    续航时间的预测值。
  30. 根据权利要求24至29任一所述的装置,其特征在于,所述装置还包括:
    处理模块,用于根据对应关系信息,确定所述可用资源信息对应的能力等级;所述对应关系信息包括:不同可用资源信息和不同能力等级之间的对应关系;
    所述发送模块,用于向所述主节点发送所述可用资源信息对应的能力等级。
  31. 根据权利要求30所述的装置,其特征在于,所述处理模块,用于:
    在所述可用资源信息包括计算能力信息的情况下,根据第一对应关系信息确定所述计算能力信息对应的计算能力等级,所述第一对应关系信息包括不同计算能力信息和不同计算能力等级之间的对应关系;
    在所述可用资源信息包括存储能力信息的情况下,根据第二对应关系信息确定所述存储能力信息对应的存储能力等级,所述第二对应关系信息包括不同存储能力信息和不同存储能力等级之间的对应关系;
    在所述可用资源信息包括传输能力信息的情况下,根据第三对应关系信息确定所述传输能力信息对应的传输能力等级,所述第三对应关系信息包括不同传输能力信息和不同传输能力等级之间的对应关系;
    在所述可用资源信息包括能量能力信息的情况下,根据第四对应关系信息确定所述能量能力信息对应的能量能力等级,所述第四对应关系信息包括不同能量能力信息和不同能量能力等级之间的对应关系。
  32. 根据权利要求30所述的装置,其特征在于,
    所述对应关系信息是通信协议预定义的;
    或,所述对应关系信息是所述主节点配置的;
    或,所述对应关系信息是第三节点配置的,所述第三节点是所述移动通信系统中除所述主节点和所述子节点之外的一个节点。
  33. 根据权利要求25至29任一所述的装置,其特征在于,
    存在至少两种所述可用资源信息携带在同一信令中;
    和/或,存在至少两种所述可用资源信息携带在不同信令中。
  34. 根据权利要求24至29任一所述的装置,其特征在于,
    所述可用资源信息携带在如下信令中的至少一种信令中:无线资源控制RRC消息、上行控制信息UCI、物理上行控制信道PUCCH上承载的信息、物理上行共享信道PUSCH上承载的信息;
    或者,所述可用资源信息携带在如下信令中的至少一种信令中:系统信息、系统信息块SIB、无线资源控制RRC消息、媒体接入控制控制单元MACCE、下行控制信息DCI、物理下行控制信道PDCCH上承载的信息、物理下行共享信道PDSCH上承载的信息。
  35. 根据权利要求24至29任一所述的装置,其特征在于,所述装置还包括:
    接收模块,用于接收所述主节点发送的指示信息,所述指示信息用于指示所述子节点是参与所述分布式任务的目标子节点。
  36. 一种分布式任务的节点确定装置,其特征在于,所述装置包括:
    接收模块,用于接收所述移动通信系统中的子节点发送的可用资源信息;
    处理模块,用于基于多个所述子节点的可用资源信息,确定出参与所述分布式任务的目标子节点。
  37. 根据权利要求36所述的装置,其特征在于,所述可用资源信息包括如下信息中的至少一种:
    计算能力信息;
    存储能力信息;
    传输能力信息;
    能量能力信息。
  38. 根据权利要求37所述的装置,其特征在于,所述计算能力信息,包括如下信息中的至少一种:
    单位时间内的浮点数计算能力;
    图形处理器GPU的数量;
    所述GPU的缓存大小;
    神经网络处理器的数量;
    所述神经网络处理器的缓存大小;
    处理器CPU的数量。
  39. 根据权利要求37所述的装置,其特征在于,所述存储能力信息,包括如下信息中的至少一种:
    可用内存大小;
    可用缓存大小;
    可用存储大小。
  40. 根据权利要求37所述的装置,其特征在于,所述传输能力信息,包括如下信息中的至少一种:
    传输速率;
    传输时延;
    通信信号强度;
    信道质量状态信息;
    传输误码率;
    传输误信息块率;
    频谱效率信息。
  41. 根据权利要求37所述的装置,其特征在于,所述能量能力信息,包括如下信息中的至少一种:
    剩余电量;
    针对所述分布式任务的可用电量;
    续航时间的预测值。
  42. 根据权利要求36至41任一所述的装置,其特征在于,所述装置还包括:
    发送模块,用于向所述子节点配置对应关系信息,所述对应关系信息包括:不同可用资源信息和不同能力等级之间的对应关系。
  43. 根据权利要求42所述的装置,其特征在于,所述对应关系信息包括如下四种对应关系信息中的至少一种:
    第一对应关系信息,所述第一对应关系信息包括不同计算能力信息和不同计算能力等级之间的对应关系;
    第二对应关系信息,所述第二对应关系信息包括不同存储能力信息和不同存储能力等级之间的对应关系;
    第三对应关系信息,所述第三对应关系信息包括不同传输能力信息和不同传输能力等级之间的对应关系;
    第四对应关系信息,所述第四对应关系信息包括不同能量能力信息和不同能量能力等级之间的对应关系。
  44. 根据权利要求37至41任一所述的装置,其特征在于,
    存在至少两种所述可用资源信息携带在同一信令中;
    和/或,存在至少两种所述可用资源信息携带在不同信令中。
  45. 根据权利要求36至41任一所述的装置,其特征在于,
    所述可用资源信息携带在如下信令中的至少一种信令中:无线资源控制RRC消息、上行控制信息UCI、物理上行控制信道PUCCH上承载的信息、物理上行共享信道PUSCH上承载的信息;
    或者,所述可用资源信息携带在如下信令中的至少一种信令中:系统信息、系统信息块SIB、无线资源控制RRC消息、媒体接入控制控制单元MACCE、下行控制信息DCI、物理下行控制信道PDCCH上承载的信息、物理下行共享信道PDSCH上承载的信息。
  46. 根据权利要求36至41任一所述的装置,其特征在于,所述装置还包括:
    发送模块,用于向所述子节点发送指示信息,所述指示信息用于指示所述子节点是参与所述分布式任务的目标子节点。
  47. 一种通信设备,其特征在于,所述通信设备包括:
    处理器;
    与所述处理器相连的收发器;
    用于存储所述处理器的可执行指令的存储器;
    其中,所述处理器被配置为加载并执行所述可执行指令以实现如权利要求1至23中任一所述的分布式任务的节点确定方法。
  48. 一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有可执行指令,所述可执行指令由处理器加载并执行以实现如权利要求1至23中任一所述的分布式任务的节点确定方法。
PCT/CN2021/071570 2021-01-13 2021-01-13 分布式任务的节点确定方法、装置、设备及介质 WO2022151083A1 (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
PCT/CN2021/071570 WO2022151083A1 (zh) 2021-01-13 2021-01-13 分布式任务的节点确定方法、装置、设备及介质
CN202180089647.4A CN116711286A (zh) 2021-01-13 2021-01-13 分布式任务的节点确定方法、装置、设备及介质
EP21918298.7A EP4274178A4 (en) 2021-01-13 2021-01-13 METHOD AND APPARATUS FOR DETERMINING NODE FOR DISTRIBUTED TASK, AND DEVICE AND MEDIUM
US18/350,710 US20230350724A1 (en) 2021-01-13 2023-07-11 Node determination method for distributed task and communication device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2021/071570 WO2022151083A1 (zh) 2021-01-13 2021-01-13 分布式任务的节点确定方法、装置、设备及介质

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US18/350,710 Continuation US20230350724A1 (en) 2021-01-13 2023-07-11 Node determination method for distributed task and communication device

Publications (1)

Publication Number Publication Date
WO2022151083A1 true WO2022151083A1 (zh) 2022-07-21

Family

ID=82446709

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2021/071570 WO2022151083A1 (zh) 2021-01-13 2021-01-13 分布式任务的节点确定方法、装置、设备及介质

Country Status (4)

Country Link
US (1) US20230350724A1 (zh)
EP (1) EP4274178A4 (zh)
CN (1) CN116711286A (zh)
WO (1) WO2022151083A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115829053A (zh) * 2022-11-25 2023-03-21 北京百度网讯科技有限公司 模型运行策略确定方法、装置、电子设备以及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101753461A (zh) * 2010-01-14 2010-06-23 中国建设银行股份有限公司 实现负载均衡的方法、负载均衡服务器以及集群系统
CN104320495A (zh) * 2014-11-13 2015-01-28 许继电气股份有限公司 一种用电信息采集系统的海量数据存储方法及系统
US20160270068A1 (en) * 2015-03-09 2016-09-15 Texas Instruments Incorporated System and method for distributed scheduling of transmission resources
CN109672731A (zh) * 2018-12-17 2019-04-23 航天恒星科技有限公司 一种分布式节点信息监测方法、系统及应用
CN111737003A (zh) * 2020-06-24 2020-10-02 重庆紫光华山智安科技有限公司 Pod均衡调度方法、装置、主节点及存储介质
CN111770162A (zh) * 2020-06-24 2020-10-13 重庆紫光华山智安科技有限公司 网络带宽限制方法、装置、主节点及存储介质
CN111880936A (zh) * 2020-07-31 2020-11-03 广州华多网络科技有限公司 资源调度方法、装置、容器集群、计算机设备和存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11423254B2 (en) * 2019-03-28 2022-08-23 Intel Corporation Technologies for distributing iterative computations in heterogeneous computing environments
US11283635B2 (en) * 2019-09-28 2022-03-22 Intel Corporation Dynamic sharing in secure memory environments using edge service sidecars

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101753461A (zh) * 2010-01-14 2010-06-23 中国建设银行股份有限公司 实现负载均衡的方法、负载均衡服务器以及集群系统
CN104320495A (zh) * 2014-11-13 2015-01-28 许继电气股份有限公司 一种用电信息采集系统的海量数据存储方法及系统
US20160270068A1 (en) * 2015-03-09 2016-09-15 Texas Instruments Incorporated System and method for distributed scheduling of transmission resources
CN109672731A (zh) * 2018-12-17 2019-04-23 航天恒星科技有限公司 一种分布式节点信息监测方法、系统及应用
CN111737003A (zh) * 2020-06-24 2020-10-02 重庆紫光华山智安科技有限公司 Pod均衡调度方法、装置、主节点及存储介质
CN111770162A (zh) * 2020-06-24 2020-10-13 重庆紫光华山智安科技有限公司 网络带宽限制方法、装置、主节点及存储介质
CN111880936A (zh) * 2020-07-31 2020-11-03 广州华多网络科技有限公司 资源调度方法、装置、容器集群、计算机设备和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP4274178A4 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115829053A (zh) * 2022-11-25 2023-03-21 北京百度网讯科技有限公司 模型运行策略确定方法、装置、电子设备以及存储介质
CN115829053B (zh) * 2022-11-25 2023-09-19 北京百度网讯科技有限公司 模型运行策略确定方法、装置、电子设备以及存储介质

Also Published As

Publication number Publication date
US20230350724A1 (en) 2023-11-02
CN116711286A (zh) 2023-09-05
EP4274178A1 (en) 2023-11-08
EP4274178A4 (en) 2024-03-13

Similar Documents

Publication Publication Date Title
JP6336596B2 (ja) 集中仮想スケジューラ、リアルスケジューラ、スケジューリングシステム、方法、及びプログラム
TWI451779B (zh) 在複數個字典間做選擇之方法及裝置
US8918111B2 (en) Device to-device group communication method and device using the same
US9344159B2 (en) Dynamic multi-cell clustering for downlink comp in a wireless communication network
JP7190585B2 (ja) 通信方法及び装置
WO2022121804A1 (zh) 半异步联邦学习的方法和通信装置
US20160105894A1 (en) eMBMS Management Method, Multimedia Broadcast Multicast Service Coordination Entity, and Base Station
US20230350724A1 (en) Node determination method for distributed task and communication device
US9967010B2 (en) Data transmission method and apparatus
US20170188259A1 (en) Distributing l2 buffer status information in 5g multi-connectivity for efficient radio scheduling
WO2018127100A1 (zh) 上行功率控制的方法和通信设备
JP2022552161A (ja) ユーザ装置及びスケジューリングノード
CN112333826A (zh) 一种业务接纳方法及装置
Li et al. Context-aware decoupled multiple association in ultra-dense networks
Elhattab et al. Distributed device association for multiservice heterogeneous cellular networks with QoS provisioning
US20210376968A1 (en) Feedback method and apparatus
WO2022151071A1 (zh) 分布式任务的节点确定方法、装置、设备及介质
WO2021159841A1 (zh) 一种控制信息传输方法及装置
CN106465473A (zh) 基站装置及其通信控制方法、移动台装置及其通信控制方法、无线通信系统
WO2021017893A1 (zh) 波束测量方法及装置
KR20230038223A (ko) 멀티캐스트 및 브로드캐스트 서비스 상태 보고
TW202131733A (zh) 控制資訊傳輸方法、基地台、終端及電腦可讀存儲介質
US20220312432A1 (en) Scheduling Weight Calculation for MU MIMO
Jian et al. Enabling efficient device to device multicast communication by clustering and resource sharing
JP2016139889A (ja) 基地局、無線通信システム、および通信制御方法

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 202180089647.4

Country of ref document: CN

ENP Entry into the national phase

Ref document number: 2021918298

Country of ref document: EP

Effective date: 20230804

NENP Non-entry into the national phase

Ref country code: DE