WO2024093483A1 - 管理模型的方法、装置及设备 - Google Patents
管理模型的方法、装置及设备 Download PDFInfo
- Publication number
- WO2024093483A1 WO2024093483A1 PCT/CN2023/115787 CN2023115787W WO2024093483A1 WO 2024093483 A1 WO2024093483 A1 WO 2024093483A1 CN 2023115787 W CN2023115787 W CN 2023115787W WO 2024093483 A1 WO2024093483 A1 WO 2024093483A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- model
- information
- training data
- data set
- performance
- Prior art date
Links
- 238000007726 management method Methods 0.000 title abstract description 129
- 238000000034 method Methods 0.000 claims abstract description 145
- 238000012549 training Methods 0.000 claims description 445
- 230000006870 function Effects 0.000 claims description 139
- 230000008859 change Effects 0.000 claims description 108
- 238000013139 quantization Methods 0.000 claims description 94
- 230000006835 compression Effects 0.000 claims description 72
- 238000007906 compression Methods 0.000 claims description 72
- 238000010606 normalization Methods 0.000 claims description 56
- 238000004891 communication Methods 0.000 claims description 53
- 238000004590 computer program Methods 0.000 claims description 42
- 238000012545 processing Methods 0.000 claims description 28
- 230000009849 deactivation Effects 0.000 claims description 24
- 238000012544 monitoring process Methods 0.000 claims description 24
- 230000004913 activation Effects 0.000 claims description 23
- 238000013480 data collection Methods 0.000 claims description 16
- 230000000737 periodic effect Effects 0.000 claims 1
- 238000011002 quantification Methods 0.000 claims 1
- 230000008569 process Effects 0.000 description 32
- 230000002146 bilateral effect Effects 0.000 description 18
- 238000010586 diagram Methods 0.000 description 16
- 238000010801 machine learning Methods 0.000 description 14
- 238000013473 artificial intelligence Methods 0.000 description 13
- 230000005540 biological transmission Effects 0.000 description 12
- 230000009286 beneficial effect Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 101001121408 Homo sapiens L-amino-acid oxidase Proteins 0.000 description 4
- 102100026388 L-amino-acid oxidase Human genes 0.000 description 4
- 101000827703 Homo sapiens Polyphosphoinositide phosphatase Proteins 0.000 description 3
- 102100023591 Polyphosphoinositide phosphatase Human genes 0.000 description 3
- 101100012902 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) FIG2 gene Proteins 0.000 description 3
- 101100233916 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) KAR5 gene Proteins 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000003213 activating effect Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/16—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using machine learning or artificial intelligence
Definitions
- the present disclosure relates to the field of communication technology, and in particular to a method, device and equipment for managing a model.
- AI Artificial Intelligence
- ML Machine Learning
- the AI/ML model may be a unilateral model, that is, the model is deployed on only one side, such as the network device side or the first device side, and the first device may be a terminal or a server; the AI/ML model may also be a bilateral model, that is, the model is deployed on the network device side and the first device side, and collaboration between the network device and the first device is required to perform correct model inference operations.
- the unilateral model deployed on the first device side, or the part of the bilateral model belonging to the first device side may be trained in a private manner by the terminal, chip manufacturer or third-party service provider, and is called the private model of the first device. It is unknown to the network device, resulting in the network device being unable to perform lifecycle management of the private model of the first device.
- the present disclosure provides a method, apparatus and device for managing a model, so as to implement lifecycle management of a private model of a first device by a network device.
- the present disclosure provides a method for managing a model, which is applied to a first device, where the first device is a terminal or a server, and the method includes:
- model-related information Sending model-related information to a network device, where the model-related information is used to register or identify a first model
- the model-related information includes at least one of the following:
- the information related to the training data set corresponding to the first model includes at least one of the following:
- the property or source information of the training data set is used to indicate at least one of the following:
- the training data set is a training data set indicated by the network device
- the training data set is a predefined training data set
- the training data set is a training data set used by the terminal
- the training data set is a training data set used by the server
- the attribute information of the training data set includes at least one of the following:
- the relevant information collected by the training data set includes at least one of the following:
- the training data set includes information related to the collection scenario.
- the performance-related information includes the performance of the model and/or the source of the performance-related information, wherein:
- the performance of the model includes at least one of the following:
- the source of the performance-related information is used to indicate that the performance-related information is at least one of the following:
- the first performance indicator is any one of the following:
- the first performance indicator includes the similarity between the channel compressed and restored by the first model and the first channel;
- the first performance indicator includes a degree of similarity between a channel predicted by the first model and the first channel;
- the first performance indicator includes: a probability that the beam predicted by the first model is a target beam, and/or a difference between a reference signal received power RSRP of the beam predicted by the first model and an RSRP of the target beam;
- the first performance indicator includes: the difference between the intermediate variable inferred by the first model and the actual intermediate variable, and/or the accuracy of the direct path and/or the indirect path inferred by the first model;
- the second performance indicator is any one of the following:
- the second performance indicator includes: a change in system throughput after CSI compression feedback is performed using the first model, and/or a change in a required signal to interference plus noise ratio SINR at the same bit error rate after CSI compression feedback is performed using the first model;
- the second performance indicator includes: using the first a change in system throughput after CSI prediction using the model, and/or a change in SINR required at the same bit error rate after CSI prediction using the first model;
- the second performance indicator includes: a change in system throughput after beam management is performed using the first model, and/or a change in SINR required at the same bit error rate after beam management is performed using the first model;
- the second performance indicator is a deviation value between the position inferred by the first model and the actual position
- the third performance indicator includes at least one of the following:
- An information value of the first model wherein the information value is used to indicate a performance of the first model.
- the quantitative information includes at least one of the following:
- Quantization type information including quantization metric related information and/or quantization method information
- Normalization related information the normalization related information is used to indicate whether to perform normalization processing on the input and/or output of the first model
- the coexistence capability related information includes at least one of the following:
- first coexistence capability related information where the first coexistence capability related information is used to indicate a model that is allowed to be activated simultaneously with the first model, or a model that is not allowed to be activated simultaneously with the first model;
- the second coexistence capability related information is used to indicate a non-model function that is allowed to be used simultaneously with the first model, or a non-model function that is not allowed to be used simultaneously with the first model.
- the first coexistence capability related information includes at least one of the following:
- each bit in the first bitmap being used to indicate whether a corresponding model is allowed to be activated simultaneously with the first model
- first indication information where the first indication information is used to indicate whether there is a model that is not allowed to be activated simultaneously with the first model
- the second coexistence capability related information includes at least one of the following:
- each bit in the second bitmap being used to indicate whether a corresponding non-model function is allowed to be used simultaneously with the first model
- Second indication information where the second indication information is used to indicate whether there is a non-model function that is not allowed to be used simultaneously with the first model.
- the relevant information of the second model includes at least one of the following:
- the second model satisfies at least one of the following:
- the second model is trained by the first device and sent to the network device;
- the second model is trained by the network device, the first model is trained by the first device, and the training data set of the first model is sent by the network device to the first device;
- the second model is a predefined model
- the second model is a model indicated by the network device.
- the lifecycle management control information includes at least one of the following:
- sending the model-related information to the network device includes at least one of the following:
- Receive model registration indication information or model identification indication information sent by the network device and send the model-related information to the network device according to the model registration indication information or the model identification indication information.
- the method further includes:
- the present disclosure provides a method for managing a model, applied to a network device, the method comprising:
- model-related information sent by a first device, where the model-related information is used to register or identify a first model, and the first device is a terminal or a server;
- lifecycle management control information is sent to the first device, where the lifecycle management control information is used to manage the first model.
- the model-related information includes at least one of the following:
- the information related to the training data set corresponding to the first model includes at least one of the following:
- the property or source information of the training data set is used to indicate at least one of the following:
- the training data set is a training data set indicated by the network device
- the training data set is a predefined training data set
- the training data set is a training data set used by the terminal
- the training data set is a training data set used by the server
- the attribute information of the training data set includes at least one of the following:
- the relevant information collected by the training data set includes at least one of the following:
- the training data set includes information related to the collection scenario.
- the performance-related information includes the performance of the model and/or the source of the performance-related information, wherein:
- the performance of the model includes at least one of the following:
- the source of the performance-related information is used to indicate that the performance-related information is at least one of the following:
- the first performance indicator is any one of the following:
- the first performance indicator includes a degree of similarity between a channel compressed and restored by the first model and the first channel;
- the first performance indicator includes a degree of similarity between a channel predicted by the first model and the first channel;
- the first performance indicator includes: a probability that the beam predicted by the first model is a target beam, and/or a difference between an RSRP of the beam predicted by the first model and an RSRP of the target beam;
- the first performance indicator includes: the difference between the intermediate variable inferred by the first model and the actual intermediate variable, and/or the accuracy of the direct path and/or the indirect path inferred by the first model;
- the second performance indicator is any one of the following:
- the second performance indicator includes: a change in system throughput after using the first model for CSI compression feedback, and/or a change in SINR required under the same bit error rate after using the first model for CSI compression feedback;
- the second performance indicator includes: a change in system throughput after CSI prediction is performed using the first model, and/or a change in SINR required under the same bit error rate after CSI prediction is performed using the first model;
- the second performance indicator includes: a change in system throughput after beam management is performed using the first model, and/or a change in SINR required at the same bit error rate after beam management is performed using the first model;
- the second performance indicator is a deviation value between the position inferred by the first model and the actual position
- the third performance indicator includes at least one of the following:
- An information value of the first model wherein the information value is used to indicate a performance of the first model.
- the quantitative information includes at least one of the following:
- Quantization type information including quantization metric related information and/or quantization method information
- Normalization related information the normalization related information is used to indicate whether to perform normalization processing on the input and/or output of the first model
- the coexistence capability related information includes at least one of the following:
- first coexistence capability related information where the first coexistence capability related information is used to indicate a model that is allowed to be activated simultaneously with the first model, or a model that is not allowed to be activated simultaneously with the first model;
- the second coexistence capability related information is used to indicate a non-model function that is allowed to be used simultaneously with the first model, or a non-model function that is not allowed to be used simultaneously with the first model.
- the first coexistence capability related information includes at least one of the following:
- first bitmap where the first bitmap is used to indicate whether a corresponding model is allowed to be activated simultaneously with the first model
- first indication information where the first indication information is used to indicate whether there is a model that is not allowed to be activated simultaneously with the first model
- the second coexistence capability related information includes at least one of the following:
- bitmap being used to indicate whether a corresponding non-model function is allowed to be used simultaneously with the first model
- Second indication information where the second indication information is used to indicate whether there is a non-model function that is not allowed to be used simultaneously with the first model.
- the relevant information of the second model includes at least one of the following:
- the second model satisfies at least one of the following:
- the second model is trained by the first device and sent to the network device;
- the second model is trained by the network device, the first model is trained by the first device, and the training data set of the first model is sent by the network device to the first device;
- the second model is a predefined model
- the second model is a model indicated by the network device.
- the lifecycle management control information includes at least one of the following:
- the receiving of model-related information sent by the first device includes: Include at least one of the following:
- the method further includes:
- the present disclosure provides a first device, including a memory, a transceiver, and a processor;
- a memory for storing a computer program; a transceiver for transmitting and receiving data under the control of the processor; and a processor for reading the computer program in the memory and performing the following operations:
- model-related information Sending model-related information to a network device, where the model-related information is used to register or identify a first model
- the model-related information includes at least one of the following:
- the information related to the training data set corresponding to the first model includes at least one of the following:
- the property or source information of the training data set is used to indicate at least one of the following:
- the training data set is a training data set indicated by the network device
- the training data set is a predefined training data set
- the training data set is a training data set used by the terminal
- the training data set is a training data set used by the server
- the attribute information of the training data set includes at least one of the following:
- the relevant information collected by the training data set includes at least one of the following:
- the training data set includes information related to the collection scenario.
- the performance-related information includes the performance of the model and/or the source of the performance-related information, wherein:
- the performance of the model includes at least one of the following:
- the source of the performance-related information is used to indicate that the performance-related information is at least one of the following:
- the first performance indicator is any one of the following:
- the first performance indicator includes a degree of similarity between a channel compressed and restored by the first model and the first channel;
- the first performance indicator includes a degree of similarity between a channel predicted by the first model and the first channel;
- the first performance indicator includes: a probability that the beam predicted by the first model is a target beam, and/or a difference between an RSRP of the beam predicted by the first model and an RSRP of the target beam;
- the first performance indicator includes: the difference between the intermediate variable inferred by the first model and the actual intermediate variable, and/or the accuracy of the direct path and/or the indirect path inferred by the first model;
- the second performance indicator is any one of the following:
- the second performance indicator includes: a change in system throughput after using the first model for CSI compression feedback, and/or a change in SINR required under the same bit error rate after using the first model for CSI compression feedback;
- the second performance indicator includes: a change in system throughput after CSI prediction is performed using the first model, and/or a change in SINR required under the same bit error rate after CSI prediction is performed using the first model;
- the second performance indicator includes: a change in system throughput after beam management is performed using the first model, and/or a change in SINR required at the same bit error rate after beam management is performed using the first model;
- the second performance indicator is a deviation value between the position inferred by the first model and the actual position
- the third performance indicator includes at least one of the following:
- An information value of the first model wherein the information value is used to indicate a performance of the first model.
- the quantitative information includes at least one of the following:
- Quantization type information including quantization metric related information and/or quantization method information
- Normalization related information the normalization related information is used to indicate whether to perform normalization processing on the input and/or output of the first model
- the coexistence capability related information includes at least one of the following:
- first coexistence capability related information where the first coexistence capability related information is used to indicate a model that is allowed to be activated simultaneously with the first model, or a model that is not allowed to be activated simultaneously with the first model;
- the second coexistence capability related information is used to indicate a non-model function that is allowed to be used simultaneously with the first model, or a non-model function that is not allowed to be used simultaneously with the first model.
- the first coexistence capability related information includes at least one of the following:
- each bit in the first bitmap being used to indicate whether a corresponding model is allowed to be activated simultaneously with the first model
- first indication information where the first indication information is used to indicate whether there is a model that is not allowed to be activated simultaneously with the first model
- the second coexistence capability related information includes at least one of the following:
- each bit in the second bitmap being used to indicate whether a corresponding non-model function is allowed to be used simultaneously with the first model
- Second indication information where the second indication information is used to indicate whether there is a non-model function that is not allowed to be used simultaneously with the first model.
- the relevant information of the second model includes at least one of the following: item:
- the second model satisfies at least one of the following:
- the second model is trained by the first device and sent to the network device;
- the second model is trained by the network device, the first model is trained by the first device, and the training data set of the first model is sent by the network device to the first device;
- the second model is a predefined model
- the second model is a model indicated by the network device.
- the lifecycle management control information includes at least one of the following:
- sending the model-related information to the network device includes at least one of the following:
- Receive model registration indication information or model identification indication information sent by the network device and send the model-related information to the network device according to the model registration indication information or the model identification indication information.
- the processor is further configured to read the computer program in the memory and perform the following operations:
- the present disclosure provides a network device, including a memory, a transceiver, and a processor;
- a memory for storing a computer program; a transceiver for transmitting and receiving data under the control of the processor; and a processor for reading the computer program in the memory and performing the following operations:
- model-related information sent by a first device, where the model-related information is used to register or identify a first model, and the first device is a terminal or a server;
- lifecycle management control information is sent to the first device, where the lifecycle management control information is used to manage the first model.
- the model-related information includes at least one of the following:
- the information related to the training data set corresponding to the first model includes at least one of the following:
- the property or source information of the training data set is used to indicate at least one of the following:
- the training data set is a training data set indicated by the network device
- the training data set is a predefined training data set
- the training data set is a training data set used by the terminal
- the training data set is a training data set used by the server
- the attribute information of the training data set includes at least one of the following:
- the relevant information collected by the training data set includes at least one of the following:
- the training data set includes information related to the collection scenario.
- the performance-related information includes the performance of the model and/or the source of the performance-related information, wherein:
- the performance of the model includes at least one of the following:
- the source of the performance-related information is used to indicate that the performance-related information is at least one of the following:
- the first performance indicator is any one of the following:
- the first performance indicator includes a degree of similarity between a channel compressed and restored by the first model and the first channel;
- the first performance indicator includes a degree of similarity between a channel predicted by the first model and the first channel;
- the first performance indicator includes: the first model The probability that the inference-predicted beam is the target beam, and/or the difference between the RSRP of the inference-predicted beam and the RSRP of the target beam;
- the first performance indicator includes: the difference between the intermediate variable inferred by the first model and the actual intermediate variable, and/or the accuracy of the direct path and/or the indirect path inferred by the first model;
- the second performance indicator is any one of the following:
- the second performance indicator includes: a change in system throughput after using the first model for CSI compression feedback, and/or a change in SINR required under the same bit error rate after using the first model for CSI compression feedback;
- the second performance indicator includes: a change in system throughput after CSI prediction is performed using the first model, and/or a change in SINR required under the same bit error rate after CSI prediction is performed using the first model;
- the second performance indicator includes: a change in system throughput after beam management is performed using the first model, and/or a change in SINR required at the same bit error rate after beam management is performed using the first model;
- the second performance indicator is a deviation value between the position inferred by the first model and the actual position
- the third performance indicator includes at least one of the following:
- An information value of the first model wherein the information value is used to indicate a performance of the first model.
- the quantitative information includes at least one of the following:
- Quantization type information including quantization metric related information and/or quantization method information
- Normalization related information the normalization related information is used to indicate whether to perform normalization processing on the input and/or output of the first model
- the coexistence capability related information includes at least one of the following:
- first coexistence capability related information where the first coexistence capability related information is used to indicate a model that is allowed to be activated simultaneously with the first model, or a model that is not allowed to be activated simultaneously with the first model;
- the second coexistence capability related information is used to indicate a non-model function that is allowed to be used simultaneously with the first model, or a non-model function that is not allowed to be used simultaneously with the first model.
- the first coexistence capability related information includes at least one of the following:
- first bitmap where the first bitmap is used to indicate whether a corresponding model is allowed to be activated simultaneously with the first model
- first indication information where the first indication information is used to indicate whether there is a model that is not allowed to be activated simultaneously with the first model
- the second coexistence capability related information includes at least one of the following:
- bitmap being used to indicate whether a corresponding non-model function is allowed to be used simultaneously with the first model
- Second indication information where the second indication information is used to indicate whether there is a non-model function that is not allowed to be used simultaneously with the first model.
- the relevant information of the second model includes at least one of the following:
- the second model satisfies at least one of the following:
- the second model is trained by the first device and sent to the network device;
- the second model is trained by the network device, the first model is trained by the first device, and the training data set of the first model is sent by the network device to the first device;
- the second model is a predefined model
- the second model is a model indicated by the network device.
- the lifecycle management control information includes at least one of the following:
- the receiving the model-related information sent by the first device includes at least one of the following:
- the processor is further configured to read the computer program in the memory and perform the following operations:
- the present disclosure provides a device for managing a model, the device comprising:
- a first sending module used for sending model related information to a network device, where the model related information is used for registering or identifying a first model
- the first receiving module is used to receive lifecycle management control information sent by the network device, and the lifecycle management control information is used to manage the first model.
- the model-related information includes at least one of the following:
- the information related to the training data set corresponding to the first model includes at least one of the following:
- the property or source information of the training data set is used to indicate at least one of the following:
- the training data set is a training data set indicated by the network device
- the training data set is a predefined training data set
- the training data set is a training data set used by the terminal
- the training data set is a training data set used by the server
- the attribute information of the training data set includes at least one of the following:
- the relevant information collected by the training data set includes at least one of the following:
- the training data set includes information related to the collection scenario.
- the performance-related information includes the performance of the model and/or the source of the performance-related information, wherein:
- the performance of the model includes at least one of the following:
- the source of the performance-related information is used to indicate that the performance-related information is at least one of the following:
- the first performance indicator is any one of the following:
- the first performance indicator includes a degree of similarity between a channel compressed and restored by the first model and the first channel;
- the first performance indicator includes a degree of similarity between a channel predicted by the first model and the first channel;
- the first performance indicator includes: a probability that the beam predicted by the first model is a target beam, and/or a difference between an RSRP of the beam predicted by the first model and an RSRP of the target beam;
- the first performance indicator includes: the difference between the intermediate variable inferred by the first model and the actual intermediate variable, and/or the accuracy of the direct path and/or the indirect path inferred by the first model;
- the second performance indicator is any one of the following:
- the second performance indicator includes: a change in system throughput after using the first model for CSI compression feedback, and/or a change in SINR required under the same bit error rate after using the first model for CSI compression feedback;
- the second performance indicator includes: a change in system throughput after CSI prediction using the first model, and/or a change in system throughput after CSI prediction using the first model.
- the second performance indicator includes: a change in system throughput after beam management is performed using the first model, and/or a change in SINR required at the same bit error rate after beam management is performed using the first model;
- the second performance indicator is a deviation value between the position inferred by the first model and the actual position
- the third performance indicator includes at least one of the following:
- An information value of the first model wherein the information value is used to indicate a performance of the first model.
- the quantitative information includes at least one of the following:
- Quantization type information including quantization metric related information and/or quantization method information
- Normalization related information the normalization related information is used to indicate whether to perform normalization processing on the input and/or output of the first model
- the coexistence capability related information includes at least one of the following:
- first coexistence capability related information where the first coexistence capability related information is used to indicate a model that is allowed to be activated simultaneously with the first model, or a model that is not allowed to be activated simultaneously with the first model;
- the second coexistence capability related information is used to indicate a non-model function that is allowed to be used simultaneously with the first model, or a non-model function that is not allowed to be used simultaneously with the first model.
- the first coexistence capability related information includes at least one of the following:
- each bit in the first bitmap being used to indicate whether a corresponding model is allowed to be activated simultaneously with the first model
- first indication information where the first indication information is used to indicate whether there is a model that is not allowed to be activated simultaneously with the first model
- the second coexistence capability related information includes at least one of the following:
- each bit in the second bitmap being used to indicate whether a corresponding non-model function is allowed to be used simultaneously with the first model
- Second indication information where the second indication information is used to indicate whether there is a non-model function that is not allowed to be used simultaneously with the first model.
- the relevant information of the second model includes at least one of the following:
- the second model satisfies at least one of the following:
- the second model is trained by the first device and sent to the network device;
- the second model is trained by the network device, the first model is trained by the first device, and the training data set of the first model is sent by the network device to the first device;
- the second model is a predefined model
- the second model is a model indicated by the network device.
- the lifecycle management control information includes at least one of the following:
- the first sending module is specifically used for at least one of the following:
- Receive model registration indication information or model identification indication information sent by the network device and send the model-related information to the network device according to the model registration indication information or the model identification indication information.
- the first sending module is further configured to:
- the present disclosure provides a device for managing a model, the device comprising:
- a second receiving module is used to receive model-related information sent by a first device, where the model-related information is used to register or identify the first model, and the first device is a terminal or a server;
- a second sending module is configured to send lifecycle management control information to the first device according to the model related information, wherein the lifecycle management control information is used to manage the first model.
- the model-related information includes at least one of the following:
- the information related to the training data set corresponding to the first model includes at least one of the following:
- the property or source information of the training data set is used to indicate at least one of the following:
- the training data set is a training data set indicated by the network device
- the training data set is a predefined training data set
- the training data set is a training data set used by the terminal
- the training data set is a training data set used by the server
- the attribute information of the training data set includes at least one of the following:
- the relevant information collected by the training data set includes at least one of the following:
- the training data set includes information related to the collection scenario.
- the performance-related information includes the performance of the model and/or the source of the performance-related information, wherein:
- the performance of the model includes at least one of the following:
- the source of the performance-related information is used to indicate that the performance-related information is at least one of the following:
- the first performance indicator is any one of the following:
- the first performance indicator includes a degree of similarity between a channel compressed and restored by the first model and the first channel;
- the first performance indicator includes a degree of similarity between a channel predicted by the first model and the first channel;
- the first performance indicator includes: a probability that the beam predicted by the first model is a target beam, and/or a difference between an RSRP of the beam predicted by the first model and an RSRP of the target beam;
- the first performance indicator includes: the difference between the intermediate variable inferred by the first model and the actual intermediate variable, and/or the accuracy of the direct path and/or the indirect path inferred by the first model;
- the second performance indicator is any one of the following:
- the second performance indicator includes: a change in system throughput after using the first model for CSI compression feedback, and/or a change in SINR required under the same bit error rate after using the first model for CSI compression feedback;
- the second performance indicator includes: a change in system throughput after CSI prediction is performed using the first model, and/or a change in SINR required under the same bit error rate after CSI prediction is performed using the first model;
- the second performance indicator includes: a change in system throughput after beam management is performed using the first model, and/or a change in SINR required at the same bit error rate after beam management is performed using the first model;
- the second performance indicator is a deviation value between the position inferred by the first model and the actual position
- the third performance indicator includes at least one of the following:
- An information value of the first model wherein the information value is used to indicate a performance of the first model.
- the quantitative information includes at least one of the following:
- Quantization type information including quantization metric related information and/or quantization method information
- Normalization related information the normalization related information is used to indicate whether to perform normalization processing on the input and/or output of the first model
- the coexistence capability related information includes at least one of the following:
- first coexistence capability related information where the first coexistence capability related information is used to indicate a model that is allowed to be activated simultaneously with the first model, or a model that is not allowed to be activated simultaneously with the first model;
- the second coexistence capability related information is used to indicate a non-model function that is allowed to be used simultaneously with the first model, or a non-model function that is not allowed to be used simultaneously with the first model.
- the first coexistence capability related information includes at least one of the following:
- first bitmap where the first bitmap is used to indicate whether a corresponding model is allowed to be activated simultaneously with the first model
- first indication information where the first indication information is used to indicate whether there is a model that is not allowed to be activated simultaneously with the first model
- the second coexistence capability related information includes at least one of the following:
- bitmap being used to indicate whether a corresponding non-model function is allowed to be used simultaneously with the first model
- Second indication information where the second indication information is used to indicate whether there is a non-model function that is not allowed to be used simultaneously with the first model.
- the relevant information of the second model includes at least one of the following:
- the second model satisfies at least one of the following:
- the second model is trained by the first device and sent to the network device;
- the second model is trained by the network device, the first model is trained by the first device, and the training data set of the first model is sent by the network device to the first device;
- the second model is a predefined model
- the second model is a model indicated by the network device.
- the lifecycle management control information includes at least one of the following:
- the second receiving module is specifically used for at least one of the following:
- the second receiving module is further configured to:
- the present disclosure provides a computer-readable storage medium storing a computer program, wherein the computer program is used to enable a computer to execute the management model method described in any one of the first aspect, or the computer program is used to enable a computer to execute the management model method described in any one of the second aspect.
- an embodiment of the present disclosure further provides a processor-readable storage medium, wherein the processor-readable storage medium stores a computer program, wherein the computer program is used to cause the processor to execute the first aspect.
- the method for managing a model as described in any one of the above aspects, or the computer program is used to cause a processor to execute the method for managing a model as described in any one of the second aspects.
- an embodiment of the present disclosure further provides a communication device readable storage medium, wherein the communication device readable storage medium stores a computer program, wherein the computer program is used to enable the communication device to execute the management model method described in any one of the first aspect, or the computer program is used to enable the communication device to execute the management model method described in any one of the second aspect.
- an embodiment of the present disclosure further provides a chip product readable storage medium, wherein the chip product readable storage medium stores a computer program, wherein the computer program is used to enable the chip product to execute the management model method described in any one of the first aspect, or the computer program is used to enable the chip product to execute the management model method described in any one of the second aspect.
- the present disclosure provides a computer program product, including a computer program, which, when executed by a processor, implements the method for managing a model as described in any one of the first to second aspects.
- the first device is a terminal or a server, the first device sends model-related information to a network device, and the model-related information is used to register or identify the first model; after receiving the model-related information, the network device sends lifecycle management control information to the first device according to the model-related information, and the first device can manage the first model according to the lifecycle management control information.
- the first device reports the model-related information to the network device, so that the network device performs reasonable lifecycle management on the first model of the first device after obtaining the model-related information, and also promotes the collaboration between the first device and the network device on the first model, thereby improving system performance.
- FIG1 is a schematic diagram of an application scenario provided by an embodiment of the present disclosure.
- FIG2 is a flow chart of a method for managing a model provided by an embodiment of the present disclosure
- FIG3 is a schematic structural diagram of a first device provided in an embodiment of the present disclosure.
- FIG4 is a schematic diagram of the structure of a network device provided by an embodiment of the present disclosure.
- FIG5 is a first structural diagram of a device for managing a model provided in an embodiment of the present disclosure
- FIG. 6 is a second structural diagram of the device for managing the model provided in an embodiment of the present disclosure.
- AI models or ML models may include unilateral models or bilateral models.
- a unilateral model refers to a model that is deployed only on one side, such as a model deployed only on the network device side, or a model deployed only on the terminal side, or a model deployed only on the server side;
- a bilateral model refers to a model deployed on both sides, such as a model deployed on both the network device side and the terminal side.
- the network device and the terminal need to collaborate to achieve the correct model reasoning operation of the bilateral model.
- a model deployed on both the network device side and the server side requires the network device and the server to collaborate to achieve the correct model reasoning operation of the bilateral model.
- FIG1 is a schematic diagram of an application scenario provided by an embodiment of the present disclosure.
- a network device 10 and a first device are included, wherein the first device can be a terminal 11 or a server 12 .
- the network device 10 may be deployed with a unilateral model of the network device 10, or with a portion of the bilateral model belonging to the network device 10.
- the terminal 11 may be deployed with a unilateral model of the terminal 11, or with a portion of the bilateral model belonging to the terminal 11;
- the server 12 may be deployed with a unilateral model of the server 12, or with a portion of the bilateral model belonging to the server 12.
- the unilateral model deployed on the first device side, or the part of the bilateral model belonging to the first device side may be trained in a private manner by the terminal, chip manufacturer or third-party service provider, and is called the private model of the first device. It is unknown to the network device, resulting in the network device being unable to perform lifecycle management of the private model of the first device.
- an embodiment of the present disclosure provides a method for managing a model, which implements lifecycle management of a model by a network device by reporting model-related information to the network device.
- FIG2 is a flow chart of a method for managing a model provided by an embodiment of the present disclosure. As shown in FIG2 , the method may include:
- the first device sends model-related information to the network device, where the model-related information is used to register or identify the first model.
- the first device in the embodiment of the present disclosure may be a terminal, such as the terminal 11 in the example of FIG. 1 ; the first device may also be a server of a third party, such as the server 12 in the example of FIG. 1 .
- the first device may send model-related information to the network device.
- Model-related information may be referred to as meta-information of the model or model description information.
- the act of sending model-related information may also be referred to as model registration, that is, the model-related information is used to register the first model.
- the act of sending model-related information may also be referred to as model identification, that is, the model-related information is used to identify the first model.
- the first model is a unilateral model of the first device, or the part of the bilateral model that belongs to the first device.
- the model-related information may include one or more information related to the first model, for example, information related to the training data set corresponding to the first model, for example, performance-related information of the first model, for example, pairing information of the first device and the network device about the bilateral model, for example, functional information of the first model, and so on.
- the first model can be an AI model, or an ML model, or other possible types of models, which is not limited in this embodiment.
- the network device sends lifecycle management control information to the first device according to the model related information,
- the lifecycle management control information is used to manage the first model.
- the network device After receiving the model-related information, the network device realizes the registration or identification of the first model.
- the network device sends lifecycle management control information to the terminal according to the model-related information to perform lifecycle management on the first model in the first device.
- Lifecycle management includes one or more of the following: model activation, model deactivation, model selection, model switching, fallback to non-AI or non-ML methods, model monitoring, model reasoning, etc.
- the activated first model can be used for model reasoning; if the first model is deactivated, the deactivated first model cannot be used for model reasoning; if the first model is switched to other models, the process of currently using the first model to process the task is replaced with other models to process the task; if the first model is rolled back to non-AI or non-ML, the process of currently using the first model to process the task is replaced with a non-model (i.e., non-AI or non-ML) to process the task; if the first model is model monitored, the first model can be used for model monitoring; if the first model is model reasoned, the first model can be used for model reasoning, and so on.
- non-model i.e., non-AI or non-ML
- the management of the first model by the network device includes sending the control information or indication information corresponding to the above management to the first device.
- model activation the network device can send model activation indication information to the first device to instruct the first device to activate the first model, and the lifecycle management control information includes the model activation indication information;
- model deactivation the network device can send model deactivation indication information to the first device to instruct the first device to deactivate the first model, and the lifecycle management control information includes the model deactivation indication information;
- taking model monitoring as an example the network device can send monitoring indication information of the first model to the first device to instruct the first device to measure relevant signals and feedback relevant measurement or reasoning results to monitor the first model, and the lifecycle management control information includes the monitoring indication information of the first model; taking model reasoning as an example, the network device can send reasoning indication information of the first model to the first device to instruct the first device to measure relevant signals and feedback relevant reasoning results to reason the first model, and the lifecycle management control information includes the reasoning indication information of the first model.
- the method for managing a model is applied to a first device, the first device being a terminal or a server, the first device sending model-related information to a network device, the model-related information being used to register or identify the first model; after receiving the model-related information, the network device registers or identifies the first model according to the model-related information.
- the first device sends lifecycle management control information to the first device, and the first device can manage the first model according to the lifecycle management control information.
- the first device reports model-related information to the network device, so that the network device can perform reasonable lifecycle management on the first model of the first device after obtaining the model-related information, which also promotes the collaboration between the first device and the network device on the first model and improves system performance.
- the first device sends model-related information to the network device, and the network device implements lifecycle management of the first model according to the model-related information.
- the first device may send model-related information to the network device after sending the first capability reporting information to the network device.
- the network device may receive model-related information sent by the first device after receiving the first capability reporting information.
- the first device may send the first capability reporting information and the model related information to the network device, that is, the first device reports the first capability reporting information and the model related information at the same time.
- the network device may receive the first capability reporting information and the model related information at the same time.
- the first device may send second capability reporting information to the network device, where the second capability reporting information includes model related information.
- the network device After receiving the second capability reporting information, acquires the model related information according to the second capability reporting information.
- the network device may send model registration indication information to the first device, where the model registration indication information is used to instruct the first device to register the model, that is, to instruct the first device to send model related information.
- the first device After receiving the model registration indication information, the first device sends the model related information to the network device according to the model registration indication information.
- the network device may send model identification indication information to the first device, where the model identification indication information is used to instruct the first device to perform model identification, that is, to instruct the first device to send model related information.
- the first device After receiving the model identification indication information, the first device sends the model related information to the network device according to the model identification indication information.
- the timing of sending the model-related information by the first device is introduced.
- the specific content of the model-related information will be introduced below.
- the first device can be a terminal or a third-party server.
- the server and the network device in the embodiment of the present disclosure are different devices.
- the first model can be, for example, an AI model, or an ML model, or other possible models.
- the model-related information sent by the first device to the network device includes information related to a training data set corresponding to the first model, where the training data set is a data set used in a training process of the first model.
- the information related to the training data set corresponding to the first model may include at least one of the following (1.1)-(1.4):
- the nature or source information of the training data set is information related to the nature of the training data set or the source of the training data set.
- the nature or source information of the training data set may be used to indicate that the training data set is a training data set indicated by the network device.
- the training data set may be a training data set broadcast by the network device or a training data set unicast by the network device.
- the nature or source information of the training data set may be used to indicate that the training data set is a predefined training data set.
- the training data set is a training data set available on some server (such as a public server), wherein the server may be the server 12 in the example of FIG. 1 or another server.
- the nature or source information of the training data set may be used to indicate that the training data set is a training data set used by a terminal.
- the source of the training data set is the terminal.
- the nature or source information of the training data set may be used to indicate that the training data set is a training data set used by a server.
- the source of the training data set is the server.
- the training data set can be a training data set used by the terminal or a training data set used by the server; when the first device is a server, the training data set can be a training data set used by the terminal or a training data set used by the server.
- the identifier of the training data set is used to indicate the training data set, and different training data sets have different identifiers. According to the identifier of the training data set corresponding to the first model, the training data set corresponding to the first model can be determined. Training data set.
- the attribute information of the training data set is used to characterize the attribute of the training data set.
- the attribute information of the training data set may include the number of the training data sets or the size of the training data sets.
- the number of the training data sets may be one or more.
- the attribute information of the training data set may also include the size of the training data set.
- the relevant information collected by the training data set may include information related to the collection location of the training data set, information related to the collection configuration, and information related to the collection scenario.
- the information related to the collection location of the training data set is used to indicate the location where the training data set is collected. For example, if the training data set is collected at a certain location or in a certain network device, the information related to the collection location may include the location, or the identifier of the network device, etc.
- the information related to the collection configuration of the training data set is used to indicate the configuration for collecting the training data set.
- the information related to the collection configuration indicates that the training data set is collected under a certain terminal antenna configuration, or the information related to the collection configuration indicates that the training data set is collected under a certain network device antenna configuration, and so on.
- the information related to the collection scene of the training data set is used to indicate the scene in which the training data set is collected.
- the information related to the collection scene indicates that the training data set is collected in an indoor scene, or the information related to the collection scene indicates that the training data set is collected in an urban scene, or the information related to the collection scene indicates that the training data set is collected in a rural scene, and so on.
- the network device After the network device receives the information related to the training data set sent by the first device, it can determine the applicable scenario of the first model based on the information related to the training data set, so that when the data of the current scenario is compatible with the training data set of the first model, the network device sends lifecycle management control information to the first device to activate the first model; when the data collected in the current scenario is not compatible with the training data set of the first model, the network device sends lifecycle management control information to the first device to switch the first model to other models to process the task, or fall back to the non-model method to process the task.
- the network device can determine the training data set used by the first model in the first device, and then determine one or more of the function of the first model, the input format of the first model, the output format of the first model, the applicable scenario of the first model, etc.
- the network device can perform reasonable life cycle management on the first model according to one or more of the function of the first model, the input format of the first model, the output format of the first model, the applicable scenario of the first model, etc., and improve the system performance through the first model when appropriate, and avoid the degradation of system performance due to incorrect use of the first model when it is not appropriate.
- the model-related information sent by the first device to the network device includes performance-related information of the first model.
- the performance-related information of the first model includes at least one of the following (2.1)-(2.2):
- the performance of the model can be reflected by corresponding performance indicators.
- the performance of the model can include at least one of a first performance indicator related to the reasoning output of the first model, a second performance indicator related to the communication performance of applying the first model in the communication system, and a third performance indicator of the first model itself.
- the first performance indicator since the first performance indicator represents the performance indicator related to the reasoning output of the first model, and the corresponding reasoning outputs of models with different functions are also different, the first performance indicators corresponding to the first models used for different reasoning processes are also different.
- the reasoning process applied by the first model may include, for example, channel state information (CSI) compression feedback, CSI prediction, beam management, positioning, etc.
- CSI channel state information
- CSI is a channel property of a communication link, and is used to describe the attenuation factor of a signal on a channel, such as signal scattering, distance attenuation, etc.
- CSI compression feedback refers to compressing and restoring a channel based on CSI, and this process can be completed through the first model, other models, or a non-model method.
- the CSI can be input into the first model, and the first model processes the CSI to obtain the channel compressed and restored by the first model.
- the first performance indicator can include the similarity between the channel compressed and restored by the first model and the first channel.
- the first channel may be an ideal channel or a high-precision channel.
- the similarity between the channel compressed and restored by the first model and the first channel may be, for example, the squared generalized cosine similarity (SGCS) between the channel compressed and restored by the first model and the first channel, or other parameters that may characterize the similarity between the channel compressed and restored by the first model and the first channel, which is not limited in the embodiments of the present disclosure.
- SGCS squared generalized cosine similarity
- CSI prediction refers to the process of predicting a channel based on CSI to obtain a predicted channel. This process can be completed by the first model, or by other models, or by a non-model method.
- the CSI can be input into the first model, and the first model processes the CSI to obtain the channel predicted by the first model.
- the first performance indicator may include the degree of similarity between the channel predicted by the first model and the first channel.
- the first channel can be an ideal channel or a high-precision channel.
- the degree of similarity between the channel predicted by the first model and the first channel can be the SGCS between the channel predicted by the first model and the first channel, or other parameters that may characterize the degree of similarity between the channel predicted by the first model and the first channel, which is not limited in the embodiments of the present disclosure.
- Beam management refers to the process of managing beams in a communication system. For example, in a communication system, multiple beams are included. By inferring and predicting these multiple beams, a suitable beam is selected for communication between a terminal and a network device. This process can be completed by the first model, by other models, or by a non-model method.
- relevant parameters of each beam can be input into the first model, and the first model processes the relevant parameters of each beam and outputs the beam inferred and predicted by the first model.
- the first performance indicator may include the probability that the beam predicted by the first model inference is the target beam, and may also include the difference between the reference signal receiving power (RSRP) of the beam predicted by the first model inference and the RSRP of the target beam.
- the target beam may be, for example, the actual best beam, and the beam predicted by the first model inference is the best beam predicted by inference.
- Positioning is mainly the process of positioning the terminal in the communication system between the terminal and the network device. For example, in the communication system, the current position of the terminal is determined, or the position of the terminal after a period of time is determined, etc. This process can be completed by the first model, or by other models, or by non-model methods.
- the first performance indicator may include the difference between the intermediate variable inferred by the first model and the actual intermediate variable, where the intermediate variable is a variable in the process of obtaining the location of the terminal, and the intermediate variable may be, for example, the time of arrival (ToA).
- the first performance indicator may also include the accuracy of the Line of Sight (LoS) and/or Non-Line of Sight (NLoS) inferred by the first model.
- the second performance indicator since the second performance indicator represents a performance indicator related to the communication performance of the first model applied in the communication system, and for models with different functions, the corresponding reasoning outputs are also different, and the changes in communication performance are also different, so for the first models used for different reasoning processes, the corresponding second performance indicators are also different.
- the reasoning process of the first model application can include, for example, CSI compression feedback, CSI prediction, beam management, positioning, etc.
- the second performance indicator may include a change in the system throughput after using the first model for CSI compression feedback, wherein the change in the system throughput may include the degree of increase or decrease in the system throughput, or the proportion of increase or decrease in the system throughput, and so on.
- the second performance indicator may also include a change in the signal to interference plus noise ratio (SINR) required at the same bit error rate after using the first model for CSI compression feedback, wherein the change in SINR may include a degree of improvement or reduction in SINR, etc.
- SINR signal to interference plus noise ratio
- the second performance indicator may include a change in the system throughput after CSI prediction is performed using the first model, wherein the change in the system throughput may include the degree of increase or decrease in the system throughput, or the increase ratio or decrease ratio of the system throughput, and so on.
- the second performance indicator may also include a change in SINR required under the same bit error rate after CSI prediction using the first model, wherein the change in SINR may include an improvement or reduction in SINR, and the like.
- the second performance indicator may include the change in system throughput after using the first model for beam management, wherein the change in system throughput may include the degree of increase or decrease in system throughput, or the proportion of increase or decrease in system throughput, and so on.
- the second performance indicator may also include the change in SINR required under the same bit error rate after beam management is performed using the first model, wherein the change in SINR may include the degree of improvement or reduction in SINR, etc.
- the second performance indicator is the deviation between the position inferred by the first model and the actual position.
- the first model outputs the inferred terminal position. If the deviation between the inferred terminal position and the actual position of the terminal is smaller, the positioning of the first model is more accurate. If the deviation between the inferred terminal position and the actual position of the terminal is larger, the positioning of the first model is less accurate.
- the third performance indicator is a performance indicator of the first model itself, which is used to characterize the performance of the first model itself.
- the third performance indicator includes at least one of the reference time required for the first model to perform one inference, the complexity of the first model, the generalization performance of the first model, and the information value of the first model.
- the reference time required for the first model to perform an inference may be the time consumed for a single inference by the first model, or the average time consumed for a single inference obtained by performing inference by the first model multiple times, or the time consumed for a single inference by the first model under specific operating conditions, wherein the specific operating conditions may, for example, be a scenario in which only the first model is activated, or a scenario in which all other models are deactivated, and so on.
- the complexity of the first model can be characterized by the size of the first model. The larger the first model is, the higher the complexity of the first model is, and the smaller the first model is, the lower the complexity of the first model is.
- the complexity of the model can also be characterized by the amount of calculation required to perform an inference on the first model. The greater the amount of calculation, the higher the complexity of the first model, and the smaller the amount of calculation, the lower the complexity of the first model.
- the generalization performance of the first model mainly indicates the influence of the application of the first model in different scenarios, different configurations or different locations on the performance of the first model.
- the generalization performance of the first model can be characterized by information about the effectiveness of the first model in different scenarios, by information about the effectiveness of the first model in different configurations, by information about the effectiveness of the first model in different locations, and so on.
- the information value of the first model is used to indicate the performance of the first model, and the information value may include a hard information value and a soft information value. Taking the value range of the information value as [0,1] as an example, 0 and 1 are hard information values, and other values between 0 and 1 are soft information values. The larger the information value, the better the performance of the first model, and vice versa, if the information value is smaller, the worse the performance of the first model.
- the source of the performance-related information is used to indicate that the performance-related information is at least one of the following:
- the source of the performance-related information is used to indicate that the performance-related information is performance-related information estimated by the first device.
- the source of the performance-related information is used to indicate that the performance-related information is performance-related information tested on the first device, such as performance-related information obtained after verifying the first model through a verification data set or a test data set.
- the source of the performance-related information is used to indicate that the performance-related information is the performance-related information detected by the network device, wherein the network device that detects the performance-related information may be a network device that receives the model-related information of the first model, or may be other network devices. Taking FIG. 1 as an example, the network device that detects the performance-related information may be the network device 10, or may be other possible network devices other than the network device 10. After the network device obtains the performance-related information using the first model, it may feed back to the first device, so that the first device obtains the performance-related information of the first model.
- the source of the performance-related information is used to indicate that the performance-related information is pre-evaluated performance-related information, such as performance-related information evaluated by a third-party organization, wherein the third-party organization is an evaluation organization independent of the first device and the network device.
- the network device After receiving the performance related information of the first model sent by the first device, the network device determines the first The gain of the first model of the device is used to determine whether the first model of the first device is worth activating and using. When the network device determines that the gain brought by the first model is large, the lifecycle management control information can be sent to instruct the first device to activate the first model; when the network device determines that the gain of the first model is not large, the lifecycle management control information can be sent to instruct the first device to deactivate the first model and/or fall back to a non-model function.
- the network device can know the performance of the registered or identified first model in advance, which is conducive to the network device to determine the scheduling and use of the first model, so as to perform appropriate life cycle management.
- the network device can instruct the first device to activate the first model to improve system performance, otherwise the network device can instruct the first device to deactivate the first model to reduce the power consumption overhead, computing overhead and storage overhead of running the first model.
- the model-related information sent by the first device to the network device includes quantified information of the first model input and/or output.
- the quantified information of the first model input and/or output includes at least one of the following (3.1)-(3.4):
- the quantization type information is used to characterize the type of quantization information input and/or output by the first model. If quantization is performed, the quantization type information may include information related to the quantization metric, wherein the quantization may be scalar quantization or vector quantization. If scalar quantization is performed, the quantization type information may be used to indicate whether it is uniform quantization or non-uniform quantization. If vector quantization is performed, the quantization type information may include information about the vector used for quantization.
- the quantization type information may also include quantization method information.
- the quantization method information may include, for example, a quantization interval, a quantization bit number, and the like.
- the normalization related information is used to indicate whether to perform normalization processing on the input and/or output of the first model.
- the normalization-related information may include a normalization method to indicate how to normalize the input and/or output of the first model.
- the normalization method may include, for example, linear normalization, quadratic normalization, and the like.
- the input unit of the first model is mainly used to limit the input format of the first model.
- the input unit may include a logarithmic value, a linear value, etc.
- the unit of the output of the first model is mainly used to define the format of the output of the first model.
- the unit of the output may include a logarithmic value, a linear value, etc.
- the network device After the network device receives the quantization information of the first model input and/or output sent by the first device, it determines the required input and/or output quantization method of the first model of the first device, thereby providing a suitable input data format for the first device, and also dequantizing the output of the first model of the first device in a suitable manner.
- the first device does not report the quantization information
- the first model on the first device side can only use the predefined quantization method, and its design flexibility is limited.
- the first device does not have to use the predefined quantization method, but can select a suitable quantization method according to its own computing power, thereby improving the performance of the first model, and can also enable the network device to know the quantization of the input/output of the first model on the first device side, and perform appropriate processing on the output result of the first model, for example, a suitable input data format can be provided for the first device, and the output of the first model can be dequantized in an appropriate manner to maximize the performance of the first model.
- the quantization scales of the first device side and the network device side can be better aligned through quantization information to avoid causing a decrease in the performance of the first model.
- the model-related information sent by the first device to the network device includes information related to the coexistence capability of the first model.
- the information related to the coexistence capability of the first model includes at least one of the following (4.1)-(4.2):
- the first coexistence capability related information is used to indicate a model that is allowed to be activated simultaneously with the first model, or a model that is not allowed to be activated simultaneously with the first model.
- the first coexistence capability related information includes a list of models that are allowed to be activated simultaneously with the first model, the list of models that are allowed to be activated simultaneously with the first model includes one or more models, and the one or more models in the model list are allowed to be activated simultaneously with the first model, that is, the one or more models The first model is not affected by the second model.
- the first coexistence capability related information includes a list of models that are not allowed to be activated simultaneously with the first model, and the list of models that are not allowed to be activated simultaneously with the first model includes one or more models.
- One or more models in the model list are not allowed to be activated simultaneously with the first model, that is, these one or more models will be affected by the first model.
- the first coexistence capability related information includes a first bitmap, and each bit in the first bitmap is used to indicate whether the corresponding model is allowed to be activated simultaneously with the first model.
- the model includes a corresponding bit, and the value of the bit is 0 or 1, 0 represents that the model is allowed to be activated simultaneously with the first model, that is, the model is not affected by the first model; 1 represents that the model is not allowed to be activated simultaneously with the first model, that is, the model will be affected by the first model.
- the first coexistence capability related information includes first indication information
- the first indication information is used to indicate whether there is a model that is not allowed to be activated simultaneously with the first model. For example, it is possible to determine whether there is a model that is not allowed to be activated simultaneously with the first model, that is, whether there is a model affected by the first model, by taking a value of the first indication information. If there is at least one model that is not allowed to be activated simultaneously with the first model, the value of the first indication information is 0; if there is no model that is not allowed to be activated simultaneously with the first model, the value of the first indication information is 1.
- the second coexistence capability related information is used to indicate a non-model function that is allowed to be used simultaneously with the first model, or a non-model function that is not allowed to be used simultaneously with the first model.
- the second coexistence capability-related information includes a list of non-model functions allowed to be used simultaneously with the first model, the list of non-model functions allowed to be used simultaneously with the first model includes one or more non-model functions, and one or more non-model functions in the model list are allowed to be activated simultaneously with the first model, that is, the one or more non-model functions are not affected by the first model.
- the second coexistence capability related information includes a list of non-model functions that are not allowed to be used simultaneously with the first model, and the list of non-model functions that are not allowed to be used simultaneously with the first model includes one or more non-model functions.
- One or more non-model functions in the model list are not allowed to be activated simultaneously with the first model, that is, these one or more non-model functions will be affected by the first model.
- the second coexistence capability related information includes a second bitmap, the second bitmap Each bit in the figure is used to indicate whether the corresponding non-model function is allowed to be activated simultaneously with the first model.
- the non-model function includes a corresponding bit, and the value of the bit is 0 or 1, 0 represents that the non-model function is allowed to be activated simultaneously with the first model, that is, the non-model function is not affected by the first model; 1 represents that the non-model function is not allowed to be activated simultaneously with the first model, that is, the non-model function will be affected by the first model.
- the second coexistence capability related information includes second indication information
- the second indication information is used to indicate whether there is a non-model function that is not allowed to be activated simultaneously with the first model.
- the value of the second indication information can be used to determine whether there is a non-model function that is not allowed to be activated simultaneously with the first model, that is, whether there is a non-model function affected by the first model. If there is at least one non-model function that is not allowed to be activated simultaneously with the first model, the value of the second indication information is 0, and if there is no non-model function that is not allowed to be activated simultaneously with the first model, the value of the first indication information is 1.
- the network device After the network device receives information related to the coexistence capability, it can determine the model or non-model function that cannot be used together with the first model of the first device. Therefore, when the network device instructs the first device to activate the first model, or before activating the first model, it can first instruct the deactivation of the model that cannot be used together with the first model, or it can avoid configuring or instructing the first device to use the non-model function that cannot be used together with the first model, thereby avoiding the network device erroneously requiring the first device to simultaneously run the first model and other models or non-model functions that cannot be used together.
- the scheme of the embodiment of the present disclosure through the first device reporting information related to the coexistence capability, can allow the network device to determine the model that can be activated simultaneously with the first model, the model that cannot be activated simultaneously with the first model, the non-model function that can be used simultaneously with the first model, the non-model function that cannot be used simultaneously with the first model, etc., so that the network device can more appropriately perform life cycle management, control the activation, deactivation, and fallback to non-model functions of the first model, etc., to avoid the problem of unpredictable behavior of the first device and damage to the performance of the first device and the network device due to instructing the first device to activate a model that cannot be activated together with the first model, or run a non-model function that cannot be used together with the first model.
- the model-related information sent by the first device to the network device includes relevant information of one or more second models corresponding to the first model, and the second model is a model of the network device.
- the second model is a model related to the first model.
- the first model is the part of the bilateral model deployed on the first device side
- the second model is the part of the bilateral model deployed on the network device side.
- the relevant information of the second model includes at least one of the following (5.1)-(5.5):
- the index of the second model is used to identify the second model. After the first device reports the index of the second model, the network device can determine the second model according to the index of the second model.
- the usage scenario corresponding to the second model is used to characterize the scenario to which the second model is applicable. After the first device reports the usage scenario corresponding to the second model, the network device can determine the second model according to the usage scenario corresponding to the second model.
- the usage configuration corresponding to the second model is used to characterize the configuration applicable to the second model. After the first device reports the usage configuration corresponding to the second model, the network device can determine the second model according to the usage configuration corresponding to the second model.
- the network device may determine the second model according to the address corresponding to the second model.
- the performance-related information of the second model is used to characterize the performance of the second model, and can also be used to characterize the performance of the first model and the second model when used in collaboration.
- the performance of the second model can be characterized by corresponding performance indicators.
- the performance indicators corresponding to the performance of the second model can refer to the relevant introduction of the performance indicators corresponding to the performance of the first model in the above embodiment, which will not be repeated here.
- the second model is trained by the first device and sent to the network device, so the first device can also determine the second model and then send relevant information of the second model to the network device.
- the second model is trained by the network device, the first model is trained by the first device, and the training data set of the first model is sent by the network device to the first device, each training data set corresponds to a second model on the network device side, so the first device can determine the second model, Then, relevant information of the second model is sent to the network device.
- the second model is a predefined model or a model indicated by the network device.
- the reference model is determined in a predefined manner or in a manner indicated by the network device, and the first device determines a second model matching the first model in the reference model according to the performance matching degree between the first model and each reference model, and then sends relevant information of the second model to the network device.
- the network device After the network device receives the relevant information of the second model sent by the first device, it determines the second model on the network device side that matches the first model on the first device side in the bilateral model, so as to select and use the second model that optimizes the joint performance of the first device and the network device in the use of the bilateral model. Therefore, the scheme of the embodiment of the present disclosure can assist the network device in determining to use the appropriate second model on the network device side to match the first model on the first device side, avoid blindly using the model on the network device side, or use multiple models on the network device side at the same time to try to match the first model, resulting in unnecessary computing power and power consumption overhead, and improve system performance.
- the network device After the network device receives the model-related information, it can send lifecycle management control information to the first device according to the model-related information, so as to perform lifecycle management on the first model.
- the lifecycle management control information may include at least one of activation indication information of the first model, deactivation indication information of the first model, model selection indication information, model switching indication information, indication information for falling back to non-model functions, monitoring indication information of the first model, and reasoning indication information of the first model.
- Activation indication information of the first model used to activate the first model
- deactivation indication information of the first model used to deactivate the first model
- model selection indication information used to indicate the selection of a certain model for task processing
- model switching indication information used to perform model switching
- indication information for falling back to non-model functions used to indicate falling back to non-model functions, such as falling back to non-AI or non-ML methods
- monitoring indication information of the first model used to indicate monitoring of the first model
- reasoning indication information of the first model used to reason the first model, etc.
- the specific content included in the lifecycle management control information can be determined by the network device according to the model-related information, and this embodiment does not limit this.
- the method for managing models provided by the embodiment of the present disclosure sends model related information to the network device through the first device, so that the network device can obtain the related information of the first model on the first device side, thereby performing reasonable life cycle management according to the related information of the first model, and assisting the network device to ... and
- the collaboration between the device and the first device on the first model improves system performance.
- FIG3 is a schematic diagram of the structure of a first device provided by an embodiment of the present disclosure.
- the first device includes a memory 320, a transceiver 300, and a processor 310, wherein:
- the memory 320 is used to store computer programs; the transceiver 300 is used to send and receive data under the control of the processor 310; the processor 310 is used to read the computer program in the memory 320 and perform the following operations:
- model-related information Sending model-related information to a network device, where the model-related information is used to register or identify a first model
- the bus architecture may include any number of interconnected buses and bridges, specifically one or more processors represented by processor 310 and various circuits of memory represented by memory 320 are linked together.
- the bus architecture can also link various other circuits such as peripherals, regulators, and power management circuits together, which are all well known in the art and are therefore not further described herein.
- the bus interface provides an interface.
- the transceiver 300 may be a plurality of components, namely, a transmitter and a receiver, providing a unit for communicating with various other devices on a transmission medium, and these transmission media include transmission media such as wireless channels, wired channels, and optical cables.
- the user interface 330 may also be an interface that can be connected to external and internal devices, and the connected devices include but are not limited to keypads, displays, speakers, microphones, joysticks, etc.
- the processor 310 is responsible for managing the bus architecture and general processing, and the memory 320 can store data used by the processor 310 when performing operations.
- processor 310 can be a central processing unit (CPU), an application specific integrated circuit (ASIC), a field programmable gate array (FPGA) or a complex programmable logic device (CPLD), and the processor can also adopt a multi-core architecture.
- CPU central processing unit
- ASIC application specific integrated circuit
- FPGA field programmable gate array
- CPLD complex programmable logic device
- the processor calls the computer program stored in the memory to execute any of the methods provided by the embodiments of the present disclosure according to the obtained executable instructions.
- the processor and the memory can also be arranged physically separately.
- the model-related information includes at least one of the following:
- the information related to the training data set corresponding to the first model includes at least one of the following:
- the property or source information of the training data set is used to indicate at least one of the following:
- the training data set is a training data set indicated by the network device
- the training data set is a predefined training data set
- the training data set is a training data set used by the terminal
- the training data set is a training data set used by the server
- the attribute information of the training data set includes at least one of the following:
- the relevant information collected by the training data set includes at least one of the following:
- the training data set includes information related to the collection scenario.
- the performance-related information includes the performance of the model and/or the source of the performance-related information, wherein:
- the performance of the model includes at least one of the following:
- the source of the performance-related information is used to indicate that the performance-related information is at least one of the following:
- the first performance indicator is any one of the following:
- the first performance indicator includes a degree of similarity between a channel compressed and restored by the first model and the first channel;
- the first performance indicator includes a degree of similarity between a channel predicted by the first model and the first channel;
- the first performance indicator includes: a probability that the beam predicted by the first model is a target beam, and/or a difference between an RSRP of the beam predicted by the first model and an RSRP of the target beam;
- the first performance indicator includes: the difference between the intermediate variable inferred by the first model and the actual intermediate variable, and/or the accuracy of the direct path and/or the indirect path inferred by the first model;
- the second performance indicator is any one of the following:
- the second performance indicator includes: a change in system throughput after using the first model for CSI compression feedback, and/or a change in SINR required under the same bit error rate after using the first model for CSI compression feedback;
- the second performance indicator includes: a change in system throughput after CSI prediction is performed using the first model, and/or a change in SINR required under the same bit error rate after CSI prediction is performed using the first model;
- the second performance indicator includes: using the first a change in system throughput after beam management using the model, and/or a change in SINR required at the same bit error rate after beam management using the first model;
- the second performance indicator is a deviation value between the position inferred by the first model and the actual position
- the third performance indicator includes at least one of the following:
- An information value of the first model wherein the information value is used to indicate a performance of the first model.
- the quantitative information includes at least one of the following:
- Quantization type information including quantization metric related information and/or quantization method information
- Normalization related information the normalization related information is used to indicate whether to perform normalization processing on the input and/or output of the first model
- the coexistence capability related information includes at least one of the following:
- first coexistence capability related information where the first coexistence capability related information is used to indicate a model that is allowed to be activated simultaneously with the first model, or a model that is not allowed to be activated simultaneously with the first model;
- the second coexistence capability related information is used to indicate a non-model function that is allowed to be used simultaneously with the first model, or a non-model function that is not allowed to be used simultaneously with the first model.
- the first coexistence capability related information includes at least one of the following:
- each bit in the first bitmap being used to indicate whether a corresponding model is allowed to be activated simultaneously with the first model
- first indication information where the first indication information is used to indicate whether there is a model that is not allowed to be activated simultaneously with the first model
- the second coexistence capability related information includes at least one of the following:
- each bit in the second bitmap being used to indicate whether a corresponding non-model function is allowed to be used simultaneously with the first model
- Second indication information where the second indication information is used to indicate whether there is a non-model function that is not allowed to be used simultaneously with the first model.
- the relevant information of the second model includes at least one of the following:
- the second model satisfies at least one of the following:
- the second model is trained by the first device and sent to the network device;
- the second model is trained by the network device, the first model is trained by the first device, and the training data set of the first model is sent by the network device to the first device;
- the second model is a predefined model
- the second model is a model indicated by the network device.
- the lifecycle management control information includes at least one of the following:
- sending the model-related information to the network device includes at least one of the following:
- Receive model registration indication information or model identification indication information sent by the network device and send the model-related information to the network device according to the model registration indication information or the model identification indication information.
- the processor is further configured to read the computer program in the memory and perform the following operations:
- first device provided in the embodiment of the present disclosure can implement all the method steps implemented by the method embodiment in which the execution subject is the first device, and can achieve the same technical effect.
- the parts and beneficial effects of this embodiment that are the same as those of the method embodiment will not be described in detail here.
- FIG4 is a schematic diagram of the structure of a network device provided in an embodiment of the present disclosure.
- the network device includes a memory 420, a transceiver 400, and a processor 410, wherein:
- the memory 420 is used to store computer programs; the transceiver 400 is used to send and receive data under the control of the processor 410; the processor 410 is used to read the computer program in the memory 420 and perform the following operations:
- model-related information sent by a first device, where the model-related information is used to register or identify a first model, and the first device is a terminal or a server;
- the lifecycle management control information is used to manage the first model.
- the transceiver 400 is used to receive and send data under the control of the processor 410 .
- the bus architecture can include any number of interconnected buses and bridges, specifically one or more processors represented by processor 410 and various circuits of memory represented by memory 420 are linked together.
- the bus architecture can also link various other circuits such as peripherals, regulators, and power management circuits together, which are all well known in the art, so they are not further described herein.
- the bus interface provides an interface.
- the transceiver 400 can be a plurality of components, that is, including a transmitter and a receiver, providing a unit for communicating with various other devices on a transmission medium, and these transmission media include transmission media such as wireless channels, wired channels, and optical cables.
- the processor 410 is responsible for managing the bus architecture and general processing, and the memory 420 can store data used by the processor 410 when performing operations.
- the processor 410 may be a CPU, an ASIC, an FPGA or a CPLD, and the processor may also adopt a multi-core architecture.
- the processor calls the computer program stored in the memory to execute any of the methods provided by the embodiments of the present disclosure according to the obtained executable instructions.
- the processor and the memory can also be arranged physically separately.
- the model-related information includes at least one of the following:
- the information related to the training data set corresponding to the first model includes at least one of the following:
- the property or source information of the training data set is used to indicate at least one of the following:
- the training data set is a training data set indicated by the network device
- the training data set is a predefined training data set
- the training data set is a training data set used by the terminal
- the training data set is a training data set used by the server
- the attribute information of the training data set includes at least one of the following:
- the relevant information collected by the training data set includes at least one of the following:
- the training data set includes information related to the collection scenario.
- the performance-related information includes the performance of the model and/or the source of the performance-related information, wherein:
- the performance of the model includes at least one of the following:
- the source of the performance-related information is used to indicate that the performance-related information is at least one of the following:
- the first performance indicator is any one of the following:
- the first performance indicator includes a degree of similarity between a channel compressed and restored by the first model and the first channel;
- the first performance indicator includes a degree of similarity between a channel predicted by the first model and the first channel;
- the first performance indicator includes: a probability that the beam predicted by the first model is a target beam, and/or a difference between an RSRP of the beam predicted by the first model and an RSRP of the target beam;
- the first performance indicator includes: the difference between the intermediate variable inferred by the first model and the actual intermediate variable, and/or the accuracy of the direct path and/or the indirect path inferred by the first model;
- the second performance indicator is any one of the following:
- the second performance indicator includes: a change in system throughput after using the first model for CSI compression feedback, and/or a change in SINR required under the same bit error rate after using the first model for CSI compression feedback;
- the second performance indicator includes: a change in system throughput after CSI prediction is performed using the first model, and/or a change in SINR required under the same bit error rate after CSI prediction is performed using the first model;
- the second performance indicator includes: a change in system throughput after beam management is performed using the first model, and/or a change in SINR required at the same bit error rate after beam management is performed using the first model;
- the second performance indicator is a deviation value between the position inferred by the first model and the actual position
- the third performance indicator includes at least one of the following:
- An information value of the first model wherein the information value is used to indicate a performance of the first model.
- the quantitative information includes at least one of the following:
- Quantization type information including quantization metric related information and/or quantization method information
- Normalization related information the normalization related information is used to indicate whether to perform normalization processing on the input and/or output of the first model
- the coexistence capability related information includes at least one of the following:
- first coexistence capability related information where the first coexistence capability related information is used to indicate a model that is allowed to be activated simultaneously with the first model, or a model that is not allowed to be activated simultaneously with the first model;
- the second coexistence capability related information is used to indicate a non-model function that is allowed to be used simultaneously with the first model, or a non-model function that is not allowed to be used simultaneously with the first model.
- the first coexistence capability related information includes at least one of the following:
- first bitmap where the first bitmap is used to indicate whether a corresponding model is allowed to be activated simultaneously with the first model
- first indication information where the first indication information is used to indicate whether there is a model that is not allowed to be activated simultaneously with the first model
- the second coexistence capability related information includes at least one of the following:
- bitmap being used to indicate whether a corresponding non-model function is allowed to be used simultaneously with the first model
- Second indication information where the second indication information is used to indicate whether there is a non-model function that is not allowed to be used simultaneously with the first model.
- the relevant information of the second model includes at least one of the following:
- the second model satisfies at least one of the following:
- the second model is trained by the first device and sent to the network device;
- the second model is trained by the network device, the first model is trained by the first device, and the training data set of the first model is sent by the network device to the first device;
- the second model is a predefined model
- the second model is a model indicated by the network device.
- the lifecycle management control information includes at least one of the following:
- the receiving the model-related information sent by the first device includes at least one of the following:
- Model related information Sending model registration indication information or model identification indication information to the first device, and receiving the model registration indication information or the model identification indication information sent by the first device according to the model registration indication information or the model identification indication information.
- Model related information Sending model registration indication information or model identification indication information to the first device, and receiving the model registration indication information or the model identification indication information sent by the first device according to the model registration indication information or the model identification indication information.
- Model related information Sending model registration indication information or model identification indication information to the first device, and receiving the model registration indication information or the model identification indication information sent by the first device according to the model registration indication information or the model identification indication information.
- the processor is further configured to read the computer program in the memory and perform the following operations:
- FIG5 is a structural diagram 1 of a device for managing a model provided in an embodiment of the present disclosure.
- the device 50 for managing a model includes:
- a first sending module 51 configured to send model related information to a network device, wherein the model related information is used to register or identify a first model
- the first receiving module 52 is used to receive lifecycle management control information sent by the network device, and the lifecycle management control information is used to manage the first model.
- the model-related information includes at least one of the following:
- the information related to the training data set corresponding to the first model includes at least one of the following:
- the nature or source information of the training data set is used to indicate At least one of the following:
- the training data set is a training data set indicated by the network device
- the training data set is a predefined training data set
- the training data set is a training data set used by the terminal
- the training data set is a training data set used by the server
- the attribute information of the training data set includes at least one of the following:
- the relevant information collected by the training data set includes at least one of the following:
- the training data set includes information related to the collection scenario.
- the performance-related information includes the performance of the model and/or the source of the performance-related information, wherein:
- the performance of the model includes at least one of the following:
- the source of the performance-related information is used to indicate that the performance-related information is at least one of the following:
- the first performance indicator is any one of the following:
- the first performance indicator includes a degree of similarity between a channel compressed and restored by the first model and the first channel;
- the first performance indicator includes a degree of similarity between a channel predicted by the first model and the first channel;
- the first performance indicator includes: a probability that the beam predicted by the first model is a target beam, and/or a difference between an RSRP of the beam predicted by the first model and an RSRP of the target beam;
- the first performance indicator includes: the difference between the intermediate variable inferred by the first model and the actual intermediate variable, and/or the accuracy of the direct path and/or the indirect path inferred by the first model;
- the second performance indicator is any one of the following:
- the second performance indicator includes: a change in system throughput after using the first model for CSI compression feedback, and/or a change in SINR required under the same bit error rate after using the first model for CSI compression feedback;
- the second performance indicator includes: a change in system throughput after CSI prediction is performed using the first model, and/or a change in SINR required under the same bit error rate after CSI prediction is performed using the first model;
- the second performance indicator includes: a change in system throughput after beam management is performed using the first model, and/or a change in SINR required at the same bit error rate after beam management is performed using the first model;
- the second performance indicator is a deviation value between the position inferred by the first model and the actual position
- the third performance indicator includes at least one of the following:
- An information value of the first model wherein the information value is used to indicate a performance of the first model.
- the quantitative information includes at least one of the following:
- Quantization type information including quantization metric related information and/or quantization method information
- Normalization related information the normalization related information is used to indicate whether to perform normalization processing on the input and/or output of the first model
- the coexistence capability related information includes at least one of the following:
- first coexistence capability related information where the first coexistence capability related information is used to indicate a model that is allowed to be activated simultaneously with the first model, or a model that is not allowed to be activated simultaneously with the first model;
- the second coexistence capability related information is used to indicate a non-model function that is allowed to be used simultaneously with the first model, or a non-model function that is not allowed to be used simultaneously with the first model.
- the first coexistence capability related information includes at least one of the following:
- each bit in the first bitmap being used to indicate whether a corresponding model is allowed to be activated simultaneously with the first model
- first indication information where the first indication information is used to indicate whether there is a model that is not allowed to be activated simultaneously with the first model
- the second coexistence capability related information includes at least one of the following:
- each bit in the second bitmap being used to indicate whether a corresponding non-model function is allowed to be used simultaneously with the first model
- Second indication information where the second indication information is used to indicate whether there is a non-model function that is not allowed to be used simultaneously with the first model.
- the relevant information of the second model includes at least one of the following:
- the second model satisfies at least one of the following:
- the second model is trained by the first device and sent to the network device;
- the second model is trained by the network device, the first model is trained by the first device, and the training data set of the first model is sent by the network device to the first device;
- the second model is a predefined model
- the second model is a model indicated by the network device.
- the lifecycle management control information includes at least one of the following:
- the first sending module 51 is specifically used for at least one of the following:
- Receive model registration indication information or model identification indication information sent by the network device and send the model-related information to the network device according to the model registration indication information or the model identification indication information.
- the first sending module 51 is further configured to:
- the device of the above-mentioned management module provided in the embodiment of the present disclosure can implement all the method steps implemented by the method embodiment in which the execution subject is the first device, and can achieve the same technical effect.
- the parts and beneficial effects of this embodiment that are the same as those of the method embodiment will not be described in detail here.
- FIG6 is a second structural diagram of a device for managing a model provided in an embodiment of the present disclosure.
- the device 60 for managing a model includes:
- a second receiving module 61 is used to receive model-related information sent by a first device, where the model-related information is used to register or identify a first model, and the first device is a terminal or a server;
- the second sending module 62 is used to send lifecycle management control information to the first device according to the model related information, and the lifecycle management control information is used to manage the first model.
- the model-related information includes at least one of the following:
Landscapes
- Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本公开提供一种管理模型的方法、装置及设备,该方法应用于第一设备,第一设备为终端或服务器,该方法包括:向网络设备发送模型相关信息,所述模型相关信息用于注册或识别第一模型;接收所述网络设备发送的生命周期管理控制信息,所述生命周期管理控制信息用于对所述第一模型进行管理。
Description
相关申请的交叉引用
本申请要求于2022年11月4日提交的申请号为202211380043.8,发明名称为“管理模型的方法、装置及设备”的中国专利申请的优先权,其通过引用方式全部并入本文。
本公开涉及通信技术领域,尤其涉及一种管理模型的方法、装置及设备。
随着人工智能(Artificial Intelligence,AI)和机器学习(Machine Learning,ML)的发展,使用AI/ML模型来提升通信系统性能的工作方式被提出。
AI/ML模型可能是单边模型,也即模型仅部署在单侧,如网络设备侧或第一设备侧,第一设备可以为终端或服务器;AI/ML模型也可能是双边模型,也即模型部署在网络设备侧和第一设备侧,需要网络设备和第一设备两边协作才能进行正确的模型推理操作。
部署在第一设备侧的单边模型,或者是双边模型中属于第一设备侧的部分,可能是由终端、芯片厂商或第三方服务商以私有方式训练的,称为第一设备的私有模型,并不为网络设备所知,导致网络设备无法对第一设备的私有模型进行生命周期管理。
发明内容
本公开提供一种管理模型的方法、装置及设备,实现网络设备对第一设备的私有模型的生命周期管理。
第一方面,本公开提供一种管理模型的方法,应用于第一设备,所述第一设备为终端或服务器,所述方法包括:
向网络设备发送模型相关信息,所述模型相关信息用于注册或识别第一模型;
接收所述网络设备发送的生命周期管理控制信息,所述生命周期管理控制信息用于对所述第一模型进行管理。
在一种可能的实施方式中,所述模型相关信息包括以下至少一项:
所述第一模型对应的训练数据集相关的信息;
所述第一模型的性能相关信息;
所述第一模型输入和/或输出的量化信息;
所述第一模型的共存能力相关信息;
所述第一模型对应的一个或多个第二模型的相关信息,所述第二模型为所述网络设备的模型。
在一种可能的实施方式中,所述第一模型对应的训练数据集相关的信息,包括以下至少一项:
所述训练数据集的性质或来源信息;
所述训练数据集的标识;
所述训练数据集的属性信息;
所述训练数据集的数据收集的相关信息。
在一种可能的实施方式中,所述训练数据集的性质或来源信息用于指示以下至少一项:
所述训练数据集为所述网络设备指示的训练数据集;
所述训练数据集为预定义的训练数据集;
所述训练数据集为所述终端使用的训练数据集;
所述训练数据集为所述服务器使用的训练数据集;
所述训练数据集的属性信息,包括以下至少一项:
所述训练数据集的数量;
所述训练数据集的大小;
所述训练数据集收集的相关信息,包括以下至少一项:
所述训练数据集的收集地点相关的信息;
所述训练数据集的收集配置相关的信息;
所述训练数据集的收集场景相关的信息。
在一种可能的实施方式中,所述性能相关信息包括模型的性能,和/或,所述性能相关信息的来源,其中:
所述模型的性能包括以下至少一项:
所述第一模型的推理输出相关的第一性能指标;
在通信系统中应用所述第一模型的通信性能相关的第二性能指标;
所述第一模型自身的第三性能指标;
所述性能相关信息的来源用于指示所述性能相关信息为以下至少一项:
所述第一设备预估的性能相关信息;
所述第一设备测试的性能相关信息;
通过网络设备检测的性能相关信息;
预评测的性能相关信息。
在一种可能的实施方式中,所述第一性能指标为以下任意一项:
若所述第一模型用于信道状态信息CSI压缩反馈,所述第一性能指标包括所述第一模型压缩恢复的信道与第一信道之间的相似程度;
若所述第一模型用于CSI预测,所述第一性能指标包括所述第一模型预测的信道与所述第一信道之间的相似程度;
若所述第一模型用于波束管理,所述第一性能指标包括:所述第一模型推理预测的波束为目标波束的概率,和/或,所述推理预测的波束的参考信号接收功率RSRP与所述目标波束的RSRP的差值;
若所述第一模型用于定位,所述第一性能指标包括:所述第一模型推理的中间变量与实际中间变量之间的差值,和/或,所述第一模型推理的直射径和/或非直射径的准确率;
所述第二性能指标为以下任意一项:
若所述第一模型用于CSI压缩反馈,所述第二性能指标包括:使用所述第一模型进行CSI压缩反馈后系统吞吐率的变化,和/或,使用所述第一模型进行CSI压缩反馈后在相同误码率下所要求的信号与干扰加噪声比SINR的变化;
若所述第一模型用于CSI预测,所述第二性能指标包括:使用所述第一
模型进行CSI预测后系统吞吐率的变化,和/或,使用所述第一模型进行CSI预测后在相同误码率下所要求的SINR的变化;
若所述第一模型用于波束管理,所述第二性能指标包括:使用所述第一模型进行波束管理后系统吞吐率的变化,和/或,使用所述第一模型进行波束管理后在相同误码率下所要求的SINR的变化;
若所述第一模型用于定位,所述第二性能指标为所述第一模型推理的位置与实际位置之间的偏差值;
所述第三性能指标包括以下至少一项:
所述第一模型进行一次推理所需要的参考时间;
所述第一模型的复杂度;
所述第一模型的泛化性能;
所述第一模型的信息值,所述信息值用于指示所述第一模型的性能。
在一种可能的实施方式中,所述量化信息,包括以下至少一项:
量化类型信息,所述量化类型信息包括量化度量相关信息,和/或,量化方法信息;
归一化相关信息,所述归一化相关信息用于指示是否对所述第一模型的输入和/或输出进行归一化处理;
所述第一模型的输入的单位;
所述第一模型的输出的单位。
在一种可能的实施方式中,所述共存能力相关信息,包括以下至少一项:
第一共存能力相关信息,所述第一共存能力相关信息用于指示允许与所述第一模型同时激活的模型,或者不允许与所述第一模型同时激活的模型;
第二共存能力相关信息,第二共存能力相关信息用于指示允许与所述第一模型同时使用的非模型功能,或者不允许与所述第一模型同时使用的非模型功能。
在一种可能的实施方式中,所述第一共存能力相关信息,包括以下至少一项:
允许与所述第一模型同时激活的模型列表;
不允许与所述第一模型同时激活的模型列表;
第一比特图,所述第一比特图中的每个比特用于指示对应的模型是否允许与所述第一模型同时激活;
第一指示信息,所述第一指示信息用于指示是否存在不允许与所述第一模型同时激活的模型;
所述第二共存能力相关信息,包括以下至少一项:
允许与所述第一模型同时使用的非模型功能列表;
不允许与所述第一模型同时使用的非模型功能列表;
第二比特图,所述第二比特图中的每个比特用于指示对应的非模型功能是否允许与所述第一模型同时使用;
第二指示信息,所述第二指示信息用于指示是否存在不允许与所述第一模型同时使用的非模型功能。
在一种可能的实施方式中,所述第二模型的相关信息,包括以下至少一项:
所述第二模型的索引;
所述第二模型的对应的使用场景;
所述第二模型的对应的配置;
所述第二模型的对应的地址;
所述第二模型的性能相关信息。
在一种可能的实施方式中,所述第二模型满足以下至少一项:
所述第二模型是所述第一设备进行训练并发送给所述网络设备的;
所述第二模型是所述网络设备训练的,所述第一模型是所述第一设备训练的,且所述第一模型的训练数据集是所述网络设备发送给所述第一设备的;
所述第二模型是预定义的模型;
所述第二模型是所述网络设备指示的模型。
在一种可能的实施方式中,所述生命周期管理控制信息包括以下至少一项:
所述第一模型的激活指示信息;
所述第一模型的去激活指示信息;
模型选择指示信息;
模型切换指示信息;
回退至非模型功能的指示信息;
所述第一模型的监控指示信息;
所述第一模型的推理指示信息。
在一种可能的实施方式中,所述向网络设备发送模型相关信息,包括以下至少一项:
在向所述网络设备发送第一能力上报信息后,向所述网络设备发送所述模型相关信息;
向所述网络设备发送所述第一能力上报信息和所述模型相关信息;
向所述网络设备发送第二能力上报信息,所述第二能力上报信息中包括所述模型相关信息;
接收所述网络设备发送的模型注册指示信息或模型识别指示信息,根据所述模型注册指示信息或所述模型识别指示信息向所述网络设备发送所述模型相关信息。
在一种可能的实施方式中,所述方法还包括:
向所述网络设备上报所述第一模型的推理结果。
第二方面,本公开提供一种管理模型的方法,应用于网络设备,所述方法包括:
接收第一设备发送的模型相关信息,所述模型相关信息用于注册或识别第一模型,所述第一设备为终端或服务器;
根据所述模型相关信息,向所述第一设备发送生命周期管理控制信息,所述生命周期管理控制信息用于对所述第一模型进行管理。
在一种可能的实施方式中,所述模型相关信息包括以下至少一项:
所述第一模型对应的训练数据集相关的信息;
所述第一模型的性能相关信息;
所述第一模型输入和/或输出的量化信息;
所述第一模型的共存能力相关信息;
所述第一模型对应的一个或多个第二模型的相关信息,所述第二模型为所述网络设备的模型。
在一种可能的实施方式中,所述第一模型对应的训练数据集相关的信息,包括以下至少一项:
所述训练数据集的性质或来源信息;
所述训练数据集的标识;
所述训练数据集的属性信息;
所述训练数据集的数据收集的相关信息。
在一种可能的实施方式中,所述训练数据集的性质或来源信息用于指示以下至少一项:
所述训练数据集为所述网络设备指示的训练数据集;
所述训练数据集为预定义的训练数据集;
所述训练数据集为所述终端使用的训练数据集;
所述训练数据集为所述服务器使用的训练数据集;
所述训练数据集的属性信息,包括以下至少一项:
所述训练数据集的数量;
所述训练数据集的大小;
所述训练数据集收集的相关信息,包括以下至少一项:
所述训练数据集的收集地点相关的信息;
所述训练数据集的收集配置相关的信息;
所述训练数据集的收集场景相关的信息。
在一种可能的实施方式中,所述性能相关信息包括所述模型的性能,和/或,所述性能相关信息的来源,其中:
所述模型的性能包括以下至少一项:
所述第一模型的推理输出相关的第一性能指标;
在通信系统中应用所述第一模型的通信性能相关的第二性能指标;
所述第一模型自身的第三性能指标;
所述性能相关信息的来源用于指示所述性能相关信息为以下至少一项:
所述第一设备预估的性能相关信息;
所述第一设备测试的性能相关信息;
通过网络设备检测的性能相关信息;
预评测的性能相关信息。
在一种可能的实施方式中,所述第一性能指标为以下任意一项:
若所述第一模型用于CSI压缩反馈,所述第一性能指标包括所述第一模型压缩恢复的信道与第一信道之间的相似程度;
若所述第一模型用于CSI预测,所述第一性能指标包括所述第一模型预测的信道与所述第一信道之间的相似程度;
若所述第一模型用于波束管理,所述第一性能指标包括:所述第一模型推理预测的波束为目标波束的概率,和/或,所述推理预测的波束的RSRP与所述目标波束的RSRP的差值;
若所述第一模型用于定位,所述第一性能指标包括:所述第一模型推理的中间变量与实际中间变量之间的差值,和/或,所述第一模型推理的直射径和/或非直射径的准确率;
所述第二性能指标为以下任意一项:
若所述第一模型用于CSI压缩反馈,所述第二性能指标包括:使用所述第一模型进行CSI压缩反馈后系统吞吐率的变化,和/或,使用所述第一模型进行CSI压缩反馈后在相同误码率下所要求的SINR的变化;
若所述第一模型用于CSI预测,所述第二性能指标包括:使用所述第一模型进行CSI预测后系统吞吐率的变化,和/或,使用所述第一模型进行CSI预测后在相同误码率下所要求的SINR的变化;
若所述第一模型用于波束管理,所述第二性能指标包括:使用所述第一模型进行波束管理后系统吞吐率的变化,和/或,使用所述第一模型进行波束管理后在相同误码率下所要求的SINR的变化;
若所述第一模型用于定位,所述第二性能指标为所述第一模型推理的位置与实际位置之间的偏差值;
所述第三性能指标包括以下至少一项:
所述第一模型进行一次推理所需要的参考时间;
所述第一模型的复杂度;
所述第一模型的泛化性能;
所述第一模型的信息值,所述信息值用于指示所述第一模型的性能。
在一种可能的实施方式中,所述量化信息,包括以下至少一项:
量化类型信息,所述量化类型信息包括量化度量相关信息,和/或,量化方法信息;
归一化相关信息,所述归一化相关信息用于指示是否对所述第一模型的输入和/或输出进行归一化处理;
所述第一模型的输入的单位;
所述第一模型的输出的单位。
在一种可能的实施方式中,所述共存能力相关信息,包括以下至少一项:
第一共存能力相关信息,所述第一共存能力相关信息用于指示允许与所述第一模型同时激活的模型,或者不允许与所述第一模型同时激活的模型;
第二共存能力相关信息,第二共存能力相关信息用于指示允许与所述第一模型同时使用的非模型功能,或者不允许与所述第一模型同时使用的非模型功能。
在一种可能的实施方式中,所述第一共存能力相关信息,包括以下至少一项:
允许与所述第一模型同时激活的模型列表;
不允许与所述第一模型同时激活的模型列表;
第一比特图,所述第一比特图用于指示对应的模型是否允许与所述第一模型同时激活;
第一指示信息,所述第一指示信息用于指示是否存在不允许与所述第一模型同时激活的模型;
所述第二共存能力相关信息,包括以下至少一项:
允许与所述第一模型同时使用的非模型功能列表;
不允许与所述第一模型同时使用的非模型功能列表;
第二比特图,所述第二比特图用于指示对应的非模型功能是否允许与所述第一模型同时使用;
第二指示信息,所述第二指示信息用于指示是否存在不允许与所述第一模型同时使用的非模型功能。
在一种可能的实施方式中,所述第二模型的相关信息,包括以下至少一项:
所述第二模型的索引;
所述第二模型的对应的使用场景;
所述第二模型的对应的配置;
所述第二模型的对应的地址;
所述第二模型的性能相关信息。
在一种可能的实施方式中,所述第二模型满足以下至少一项:
所述第二模型是所述第一设备进行训练并发送给所述网络设备的;
所述第二模型是所述网络设备训练的,所述第一模型是所述第一设备训练的,且所述第一模型的训练数据集是所述网络设备发送给所述第一设备的;
所述第二模型是预定义的模型;
所述第二模型是所述网络设备指示的模型。
在一种可能的实施方式中,所述生命周期管理控制信息包括以下至少一项:
所述第一模型的激活指示信息;
所述第一模型的去激活指示信息;
模型选择指示信息;
模型切换指示信息;
回退至非模型功能的指示信息;
所述第一模型的监控指示信息;
所述第一模型的推理指示信息。
在一种可能的实施方式中,所述接收第一设备发送的模型相关信息,包
括以下至少一项:
在接收所述第一设备发送的第一能力上报信息后,接收所述第一设备发送的所述模型相关信息;
接收所述第一设备发送的所述第一能力上报信息和所述模型相关信息;
接收所述第一设备发送的第二能力上报信息,所述第二能力上报信息中包括所述模型相关信息;
向所述第一设备发送模型注册指示信息或模型识别指示信息,根据所述模型注册指示信息或所述模型识别指示信息接收所述第一设备发送的所述模型相关信息。
在一种可能的实施方式中,所述方法还包括:
接收所述第一设备上报的所述第一模型的推理结果。
第三方面,本公开提供一种第一设备,包括存储器,收发机,处理器;
存储器,用于存储计算机程序;收发机,用于在所述处理器的控制下收发数据;处理器,用于读取所述存储器中的计算机程序并执行以下操作:
向网络设备发送模型相关信息,所述模型相关信息用于注册或识别第一模型;
接收所述网络设备发送的生命周期管理控制信息,所述生命周期管理控制信息用于对所述第一模型进行管理。
在一种可能的实施方式中,所述模型相关信息包括以下至少一项:
所述第一模型对应的训练数据集相关的信息;
所述第一模型的性能相关信息;
所述第一模型输入和/或输出的量化信息;
所述第一模型的共存能力相关信息;
所述第一模型对应的一个或多个第二模型的相关信息,所述第二模型为所述网络设备的模型。
在一种可能的实施方式中,所述第一模型对应的训练数据集相关的信息,包括以下至少一项:
所述训练数据集的性质或来源信息;
所述训练数据集的标识;
所述训练数据集的属性信息;
所述训练数据集的数据收集的相关信息。
在一种可能的实施方式中,所述训练数据集的性质或来源信息用于指示以下至少一项:
所述训练数据集为所述网络设备指示的训练数据集;
所述训练数据集为预定义的训练数据集;
所述训练数据集为所述终端使用的训练数据集;
所述训练数据集为所述服务器使用的训练数据集;
所述训练数据集的属性信息,包括以下至少一项:
所述训练数据集的数量;
所述训练数据集的大小;
所述训练数据集收集的相关信息,包括以下至少一项:
所述训练数据集的收集地点相关的信息;
所述训练数据集的收集配置相关的信息;
所述训练数据集的收集场景相关的信息。
在一种可能的实施方式中,所述性能相关信息包括模型的性能,和/或,所述性能相关信息的来源,其中:
所述模型的性能包括以下至少一项:
所述第一模型的推理输出相关的第一性能指标;
在通信系统中应用所述第一模型的通信性能相关的第二性能指标;
所述第一模型自身的第三性能指标;
所述性能相关信息的来源用于指示所述性能相关信息为以下至少一项:
所述第一设备预估的性能相关信息;
所述第一设备测试的性能相关信息;
通过网络设备检测的性能相关信息;
预评测的性能相关信息。
在一种可能的实施方式中,所述第一性能指标为以下任意一项:
若所述第一模型用于CSI压缩反馈,所述第一性能指标包括所述第一模型压缩恢复的信道与第一信道之间的相似程度;
若所述第一模型用于CSI预测,所述第一性能指标包括所述第一模型预测的信道与所述第一信道之间的相似程度;
若所述第一模型用于波束管理,所述第一性能指标包括:所述第一模型推理预测的波束为目标波束的概率,和/或,所述推理预测的波束的RSRP与所述目标波束的RSRP的差值;
若所述第一模型用于定位,所述第一性能指标包括:所述第一模型推理的中间变量与实际中间变量之间的差值,和/或,所述第一模型推理的直射径和/或非直射径的准确率;
所述第二性能指标为以下任意一项:
若所述第一模型用于CSI压缩反馈,所述第二性能指标包括:使用所述第一模型进行CSI压缩反馈后系统吞吐率的变化,和/或,使用所述第一模型进行CSI压缩反馈后在相同误码率下所要求的SINR的变化;
若所述第一模型用于CSI预测,所述第二性能指标包括:使用所述第一模型进行CSI预测后系统吞吐率的变化,和/或,使用所述第一模型进行CSI预测后在相同误码率下所要求的SINR的变化;
若所述第一模型用于波束管理,所述第二性能指标包括:使用所述第一模型进行波束管理后系统吞吐率的变化,和/或,使用所述第一模型进行波束管理后在相同误码率下所要求的SINR的变化;
若所述第一模型用于定位,所述第二性能指标为所述第一模型推理的位置与实际位置之间的偏差值;
所述第三性能指标包括以下至少一项:
所述第一模型进行一次推理所需要的参考时间;
所述第一模型的复杂度;
所述第一模型的泛化性能;
所述第一模型的信息值,所述信息值用于指示所述第一模型的性能。
在一种可能的实施方式中,所述量化信息,包括以下至少一项:
量化类型信息,所述量化类型信息包括量化度量相关信息,和/或,量化方法信息;
归一化相关信息,所述归一化相关信息用于指示是否对所述第一模型的输入和/或输出进行归一化处理;
所述第一模型的输入的单位;
所述第一模型的输出的单位。
在一种可能的实施方式中,所述共存能力相关信息,包括以下至少一项:
第一共存能力相关信息,所述第一共存能力相关信息用于指示允许与所述第一模型同时激活的模型,或者不允许与所述第一模型同时激活的模型;
第二共存能力相关信息,第二共存能力相关信息用于指示允许与所述第一模型同时使用的非模型功能,或者不允许与所述第一模型同时使用的非模型功能。
在一种可能的实施方式中,所述第一共存能力相关信息,包括以下至少一项:
允许与所述第一模型同时激活的模型列表;
不允许与所述第一模型同时激活的模型列表;
第一比特图,所述第一比特图中的每个比特用于指示对应的模型是否允许与所述第一模型同时激活;
第一指示信息,所述第一指示信息用于指示是否存在不允许与所述第一模型同时激活的模型;
所述第二共存能力相关信息,包括以下至少一项:
允许与所述第一模型同时使用的非模型功能列表;
不允许与所述第一模型同时使用的非模型功能列表;
第二比特图,所述第二比特图中的每个比特用于指示对应的非模型功能是否允许与所述第一模型同时使用;
第二指示信息,所述第二指示信息用于指示是否存在不允许与所述第一模型同时使用的非模型功能。
在一种可能的实施方式中,所述第二模型的相关信息,包括以下至少一
项:
所述第二模型的索引;
所述第二模型的对应的使用场景;
所述第二模型的对应的配置;
所述第二模型的对应的地址;
所述第二模型的性能相关信息。
在一种可能的实施方式中,所述第二模型满足以下至少一项:
所述第二模型是所述第一设备进行训练并发送给所述网络设备的;
所述第二模型是所述网络设备训练的,所述第一模型是所述第一设备训练的,且所述第一模型的训练数据集是所述网络设备发送给所述第一设备的;
所述第二模型是预定义的模型;
所述第二模型是所述网络设备指示的模型。
在一种可能的实施方式中,所述生命周期管理控制信息包括以下至少一项:
所述第一模型的激活指示信息;
所述第一模型的去激活指示信息;
模型选择指示信息;
模型切换指示信息;
回退至非模型功能的指示信息;
所述第一模型的监控指示信息;
所述第一模型的推理指示信息。
在一种可能的实施方式中,所述向网络设备发送模型相关信息,包括以下至少一项:
在向所述网络设备发送第一能力上报信息后,向所述网络设备发送所述模型相关信息;
向所述网络设备发送所述第一能力上报信息和所述模型相关信息;
向所述网络设备发送第二能力上报信息,所述第二能力上报信息中包括所述模型相关信息;
接收所述网络设备发送的模型注册指示信息或模型识别指示信息,根据所述模型注册指示信息或所述模型识别指示信息向所述网络设备发送所述模型相关信息。
在一种可能的实施方式中,所述处理器还用于读取所述存储器中的计算机程序并执行以下操作:
向所述网络设备上报所述第一模型的推理结果。
第四方面,本公开提供一种网络设备,包括存储器,收发机,处理器;
存储器,用于存储计算机程序;收发机,用于在所述处理器的控制下收发数据;处理器,用于读取所述存储器中的计算机程序并执行以下操作:
接收第一设备发送的模型相关信息,所述模型相关信息用于注册或识别第一模型,所述第一设备为终端或服务器;
根据所述模型相关信息,向所述第一设备发送生命周期管理控制信息,所述生命周期管理控制信息用于对所述第一模型进行管理。
在一种可能的实施方式中,所述模型相关信息包括以下至少一项:
所述第一模型对应的训练数据集相关的信息;
所述第一模型的性能相关信息;
所述第一模型输入和/或输出的量化信息;
所述第一模型的共存能力相关信息;
所述第一模型对应的一个或多个第二模型的相关信息,所述第二模型为所述网络设备的模型。
在一种可能的实施方式中,所述第一模型对应的训练数据集相关的信息,包括以下至少一项:
所述训练数据集的性质或来源信息;
所述训练数据集的标识;
所述训练数据集的属性信息;
所述训练数据集的数据收集的相关信息。
在一种可能的实施方式中,所述训练数据集的性质或来源信息用于指示以下至少一项:
所述训练数据集为所述网络设备指示的训练数据集;
所述训练数据集为预定义的训练数据集;
所述训练数据集为所述终端使用的训练数据集;
所述训练数据集为所述服务器使用的训练数据集;
所述训练数据集的属性信息,包括以下至少一项:
所述训练数据集的数量;
所述训练数据集的大小;
所述训练数据集收集的相关信息,包括以下至少一项:
所述训练数据集的收集地点相关的信息;
所述训练数据集的收集配置相关的信息;
所述训练数据集的收集场景相关的信息。
在一种可能的实施方式中,所述性能相关信息包括所述模型的性能,和/或,所述性能相关信息的来源,其中:
所述模型的性能包括以下至少一项:
所述第一模型的推理输出相关的第一性能指标;
在通信系统中应用所述第一模型的通信性能相关的第二性能指标;
所述第一模型自身的第三性能指标;
所述性能相关信息的来源用于指示所述性能相关信息为以下至少一项:
所述第一设备预估的性能相关信息;
所述第一设备测试的性能相关信息;
通过网络设备检测的性能相关信息;
预评测的性能相关信息。
在一种可能的实施方式中,所述第一性能指标为以下任意一项:
若所述第一模型用于CSI压缩反馈,所述第一性能指标包括所述第一模型压缩恢复的信道与第一信道之间的相似程度;
若所述第一模型用于CSI预测,所述第一性能指标包括所述第一模型预测的信道与所述第一信道之间的相似程度;
若所述第一模型用于波束管理,所述第一性能指标包括:所述第一模型
推理预测的波束为目标波束的概率,和/或,所述推理预测的波束的RSRP与所述目标波束的RSRP的差值;
若所述第一模型用于定位,所述第一性能指标包括:所述第一模型推理的中间变量与实际中间变量之间的差值,和/或,所述第一模型推理的直射径和/或非直射径的准确率;
所述第二性能指标为以下任意一项:
若所述第一模型用于CSI压缩反馈,所述第二性能指标包括:使用所述第一模型进行CSI压缩反馈后系统吞吐率的变化,和/或,使用所述第一模型进行CSI压缩反馈后在相同误码率下所要求的SINR的变化;
若所述第一模型用于CSI预测,所述第二性能指标包括:使用所述第一模型进行CSI预测后系统吞吐率的变化,和/或,使用所述第一模型进行CSI预测后在相同误码率下所要求的SINR的变化;
若所述第一模型用于波束管理,所述第二性能指标包括:使用所述第一模型进行波束管理后系统吞吐率的变化,和/或,使用所述第一模型进行波束管理后在相同误码率下所要求的SINR的变化;
若所述第一模型用于定位,所述第二性能指标为所述第一模型推理的位置与实际位置之间的偏差值;
所述第三性能指标包括以下至少一项:
所述第一模型进行一次推理所需要的参考时间;
所述第一模型的复杂度;
所述第一模型的泛化性能;
所述第一模型的信息值,所述信息值用于指示所述第一模型的性能。
在一种可能的实施方式中,所述量化信息,包括以下至少一项:
量化类型信息,所述量化类型信息包括量化度量相关信息,和/或,量化方法信息;
归一化相关信息,所述归一化相关信息用于指示是否对所述第一模型的输入和/或输出进行归一化处理;
所述第一模型的输入的单位;
所述第一模型的输出的单位。
在一种可能的实施方式中,所述共存能力相关信息,包括以下至少一项:
第一共存能力相关信息,所述第一共存能力相关信息用于指示允许与所述第一模型同时激活的模型,或者不允许与所述第一模型同时激活的模型;
第二共存能力相关信息,第二共存能力相关信息用于指示允许与所述第一模型同时使用的非模型功能,或者不允许与所述第一模型同时使用的非模型功能。
在一种可能的实施方式中,所述第一共存能力相关信息,包括以下至少一项:
允许与所述第一模型同时激活的模型列表;
不允许与所述第一模型同时激活的模型列表;
第一比特图,所述第一比特图用于指示对应的模型是否允许与所述第一模型同时激活;
第一指示信息,所述第一指示信息用于指示是否存在不允许与所述第一模型同时激活的模型;
所述第二共存能力相关信息,包括以下至少一项:
允许与所述第一模型同时使用的非模型功能列表;
不允许与所述第一模型同时使用的非模型功能列表;
第二比特图,所述第二比特图用于指示对应的非模型功能是否允许与所述第一模型同时使用;
第二指示信息,所述第二指示信息用于指示是否存在不允许与所述第一模型同时使用的非模型功能。
在一种可能的实施方式中,所述第二模型的相关信息,包括以下至少一项:
所述第二模型的索引;
所述第二模型的对应的使用场景;
所述第二模型的对应的配置;
所述第二模型的对应的地址;
所述第二模型的性能相关信息。
在一种可能的实施方式中,所述第二模型满足以下至少一项:
所述第二模型是所述第一设备进行训练并发送给所述网络设备的;
所述第二模型是所述网络设备训练的,所述第一模型是所述第一设备训练的,且所述第一模型的训练数据集是所述网络设备发送给所述第一设备的;
所述第二模型是预定义的模型;
所述第二模型是所述网络设备指示的模型。
在一种可能的实施方式中,所述生命周期管理控制信息包括以下至少一项:
所述第一模型的激活指示信息;
所述第一模型的去激活指示信息;
模型选择指示信息;
模型切换指示信息;
回退至非模型功能的指示信息;
所述第一模型的监控指示信息;
所述第一模型的推理指示信息。
在一种可能的实施方式中,所述接收第一设备发送的模型相关信息,包括以下至少一项:
在接收所述第一设备发送的第一能力上报信息后,接收所述第一设备发送的所述模型相关信息;
接收所述第一设备发送的所述第一能力上报信息和所述模型相关信息;
接收所述第一设备发送的第二能力上报信息,所述第二能力上报信息中包括所述模型相关信息;
向所述第一设备发送模型注册指示信息或模型识别指示信息,根据所述模型注册指示信息或所述模型识别指示信息接收所述第一设备发送的所述模型相关信息。
在一种可能的实施方式中,所述处理器还用于读取所述存储器中的计算机程序并执行以下操作:
接收所述第一设备上报的所述第一模型的推理结果。
第五方面,本公开提供一种管理模型的装置,所述装置包括:
第一发送模块,用于向网络设备发送模型相关信息,所述模型相关信息用于注册或识别第一模型;
第一接收模块,用于接收所述网络设备发送的生命周期管理控制信息,所述生命周期管理控制信息用于对所述第一模型进行管理。
在一种可能的实施方式中,所述模型相关信息包括以下至少一项:
所述第一模型对应的训练数据集相关的信息;
所述第一模型的性能相关信息;
所述第一模型输入和/或输出的量化信息;
所述第一模型的共存能力相关信息;
所述第一模型对应的一个或多个第二模型的相关信息,所述第二模型为所述网络设备的模型。
在一种可能的实施方式中,所述第一模型对应的训练数据集相关的信息,包括以下至少一项:
所述训练数据集的性质或来源信息;
所述训练数据集的标识;
所述训练数据集的属性信息;
所述训练数据集的数据收集的相关信息。
在一种可能的实施方式中,所述训练数据集的性质或来源信息用于指示以下至少一项:
所述训练数据集为所述网络设备指示的训练数据集;
所述训练数据集为预定义的训练数据集;
所述训练数据集为所述终端使用的训练数据集;
所述训练数据集为所述服务器使用的训练数据集;
所述训练数据集的属性信息,包括以下至少一项:
所述训练数据集的数量;
所述训练数据集的大小;
所述训练数据集收集的相关信息,包括以下至少一项:
所述训练数据集的收集地点相关的信息;
所述训练数据集的收集配置相关的信息;
所述训练数据集的收集场景相关的信息。
在一种可能的实施方式中,所述性能相关信息包括模型的性能,和/或,所述性能相关信息的来源,其中:
所述模型的性能包括以下至少一项:
所述第一模型的推理输出相关的第一性能指标;
在通信系统中应用所述第一模型的通信性能相关的第二性能指标;
所述第一模型自身的第三性能指标;
所述性能相关信息的来源用于指示所述性能相关信息为以下至少一项:
所述第一设备预估的性能相关信息;
所述第一设备测试的性能相关信息;
通过网络设备检测的性能相关信息;
预评测的性能相关信息。
在一种可能的实施方式中,所述第一性能指标为以下任意一项:
若所述第一模型用于CSI压缩反馈,所述第一性能指标包括所述第一模型压缩恢复的信道与第一信道之间的相似程度;
若所述第一模型用于CSI预测,所述第一性能指标包括所述第一模型预测的信道与所述第一信道之间的相似程度;
若所述第一模型用于波束管理,所述第一性能指标包括:所述第一模型推理预测的波束为目标波束的概率,和/或,所述推理预测的波束的RSRP与所述目标波束的RSRP的差值;
若所述第一模型用于定位,所述第一性能指标包括:所述第一模型推理的中间变量与实际中间变量之间的差值,和/或,所述第一模型推理的直射径和/或非直射径的准确率;
所述第二性能指标为以下任意一项:
若所述第一模型用于CSI压缩反馈,所述第二性能指标包括:使用所述第一模型进行CSI压缩反馈后系统吞吐率的变化,和/或,使用所述第一模型进行CSI压缩反馈后在相同误码率下所要求的SINR的变化;
若所述第一模型用于CSI预测,所述第二性能指标包括:使用所述第一模型进行CSI预测后系统吞吐率的变化,和/或,使用所述第一模型进行CSI
预测后在相同误码率下所要求的SINR的变化;
若所述第一模型用于波束管理,所述第二性能指标包括:使用所述第一模型进行波束管理后系统吞吐率的变化,和/或,使用所述第一模型进行波束管理后在相同误码率下所要求的SINR的变化;
若所述第一模型用于定位,所述第二性能指标为所述第一模型推理的位置与实际位置之间的偏差值;
所述第三性能指标包括以下至少一项:
所述第一模型进行一次推理所需要的参考时间;
所述第一模型的复杂度;
所述第一模型的泛化性能;
所述第一模型的信息值,所述信息值用于指示所述第一模型的性能。
在一种可能的实施方式中,所述量化信息,包括以下至少一项:
量化类型信息,所述量化类型信息包括量化度量相关信息,和/或,量化方法信息;
归一化相关信息,所述归一化相关信息用于指示是否对所述第一模型的输入和/或输出进行归一化处理;
所述第一模型的输入的单位;
所述第一模型的输出的单位。
在一种可能的实施方式中,所述共存能力相关信息,包括以下至少一项:
第一共存能力相关信息,所述第一共存能力相关信息用于指示允许与所述第一模型同时激活的模型,或者不允许与所述第一模型同时激活的模型;
第二共存能力相关信息,第二共存能力相关信息用于指示允许与所述第一模型同时使用的非模型功能,或者不允许与所述第一模型同时使用的非模型功能。
在一种可能的实施方式中,所述第一共存能力相关信息,包括以下至少一项:
允许与所述第一模型同时激活的模型列表;
不允许与所述第一模型同时激活的模型列表;
第一比特图,所述第一比特图中的每个比特用于指示对应的模型是否允许与所述第一模型同时激活;
第一指示信息,所述第一指示信息用于指示是否存在不允许与所述第一模型同时激活的模型;
所述第二共存能力相关信息,包括以下至少一项:
允许与所述第一模型同时使用的非模型功能列表;
不允许与所述第一模型同时使用的非模型功能列表;
第二比特图,所述第二比特图中的每个比特用于指示对应的非模型功能是否允许与所述第一模型同时使用;
第二指示信息,所述第二指示信息用于指示是否存在不允许与所述第一模型同时使用的非模型功能。
在一种可能的实施方式中,所述第二模型的相关信息,包括以下至少一项:
所述第二模型的索引;
所述第二模型的对应的使用场景;
所述第二模型的对应的配置;
所述第二模型的对应的地址;
所述第二模型的性能相关信息。
在一种可能的实施方式中,所述第二模型满足以下至少一项:
所述第二模型是所述第一设备进行训练并发送给所述网络设备的;
所述第二模型是所述网络设备训练的,所述第一模型是所述第一设备训练的,且所述第一模型的训练数据集是所述网络设备发送给所述第一设备的;
所述第二模型是预定义的模型;
所述第二模型是所述网络设备指示的模型。
在一种可能的实施方式中,所述生命周期管理控制信息包括以下至少一项:
所述第一模型的激活指示信息;
所述第一模型的去激活指示信息;
模型选择指示信息;
模型切换指示信息;
回退至非模型功能的指示信息;
所述第一模型的监控指示信息;
所述第一模型的推理指示信息。
在一种可能的实施方式中,所述第一发送模块具体用于以下至少一项:
在向所述网络设备发送第一能力上报信息后,向所述网络设备发送所述模型相关信息;
向所述网络设备发送所述第一能力上报信息和所述模型相关信息;
向所述网络设备发送第二能力上报信息,所述第二能力上报信息中包括所述模型相关信息;
接收所述网络设备发送的模型注册指示信息或模型识别指示信息,根据所述模型注册指示信息或所述模型识别指示信息向所述网络设备发送所述模型相关信息。
在一种可能的实施方式中,所述第一发送模块还用于:
向所述网络设备上报所述第一模型的推理结果。
第六方面,本公开提供一种管理模型的装置,所述装置包括:
第二接收模块,用于接收第一设备发送的模型相关信息,所述模型相关信息用于注册或识别第一模型,所述第一设备为终端或服务器;
第二发送模块,用于根据所述模型相关信息,向所述第一设备发送生命周期管理控制信息,所述生命周期管理控制信息用于对所述第一模型进行管理。
在一种可能的实施方式中,所述模型相关信息包括以下至少一项:
所述第一模型对应的训练数据集相关的信息;
所述第一模型的性能相关信息;
所述第一模型输入和/或输出的量化信息;
所述第一模型的共存能力相关信息;
所述第一模型对应的一个或多个第二模型的相关信息,所述第二模型为所述网络设备的模型。
在一种可能的实施方式中,所述第一模型对应的训练数据集相关的信息,包括以下至少一项:
所述训练数据集的性质或来源信息;
所述训练数据集的标识;
所述训练数据集的属性信息;
所述训练数据集的数据收集的相关信息。
在一种可能的实施方式中,所述训练数据集的性质或来源信息用于指示以下至少一项:
所述训练数据集为所述网络设备指示的训练数据集;
所述训练数据集为预定义的训练数据集;
所述训练数据集为所述终端使用的训练数据集;
所述训练数据集为所述服务器使用的训练数据集;
所述训练数据集的属性信息,包括以下至少一项:
所述训练数据集的数量;
所述训练数据集的大小;
所述训练数据集收集的相关信息,包括以下至少一项:
所述训练数据集的收集地点相关的信息;
所述训练数据集的收集配置相关的信息;
所述训练数据集的收集场景相关的信息。
在一种可能的实施方式中,所述性能相关信息包括所述模型的性能,和/或,所述性能相关信息的来源,其中:
所述模型的性能包括以下至少一项:
所述第一模型的推理输出相关的第一性能指标;
在通信系统中应用所述第一模型的通信性能相关的第二性能指标;
所述第一模型自身的第三性能指标;
所述性能相关信息的来源用于指示所述性能相关信息为以下至少一项:
所述第一设备预估的性能相关信息;
所述第一设备测试的性能相关信息;
通过网络设备检测的性能相关信息;
预评测的性能相关信息。
在一种可能的实施方式中,所述第一性能指标为以下任意一项:
若所述第一模型用于CSI压缩反馈,所述第一性能指标包括所述第一模型压缩恢复的信道与第一信道之间的相似程度;
若所述第一模型用于CSI预测,所述第一性能指标包括所述第一模型预测的信道与所述第一信道之间的相似程度;
若所述第一模型用于波束管理,所述第一性能指标包括:所述第一模型推理预测的波束为目标波束的概率,和/或,所述推理预测的波束的RSRP与所述目标波束的RSRP的差值;
若所述第一模型用于定位,所述第一性能指标包括:所述第一模型推理的中间变量与实际中间变量之间的差值,和/或,所述第一模型推理的直射径和/或非直射径的准确率;
所述第二性能指标为以下任意一项:
若所述第一模型用于CSI压缩反馈,所述第二性能指标包括:使用所述第一模型进行CSI压缩反馈后系统吞吐率的变化,和/或,使用所述第一模型进行CSI压缩反馈后在相同误码率下所要求的SINR的变化;
若所述第一模型用于CSI预测,所述第二性能指标包括:使用所述第一模型进行CSI预测后系统吞吐率的变化,和/或,使用所述第一模型进行CSI预测后在相同误码率下所要求的SINR的变化;
若所述第一模型用于波束管理,所述第二性能指标包括:使用所述第一模型进行波束管理后系统吞吐率的变化,和/或,使用所述第一模型进行波束管理后在相同误码率下所要求的SINR的变化;
若所述第一模型用于定位,所述第二性能指标为所述第一模型推理的位置与实际位置之间的偏差值;
所述第三性能指标包括以下至少一项:
所述第一模型进行一次推理所需要的参考时间;
所述第一模型的复杂度;
所述第一模型的泛化性能;
所述第一模型的信息值,所述信息值用于指示所述第一模型的性能。
在一种可能的实施方式中,所述量化信息,包括以下至少一项:
量化类型信息,所述量化类型信息包括量化度量相关信息,和/或,量化方法信息;
归一化相关信息,所述归一化相关信息用于指示是否对所述第一模型的输入和/或输出进行归一化处理;
所述第一模型的输入的单位;
所述第一模型的输出的单位。
在一种可能的实施方式中,所述共存能力相关信息,包括以下至少一项:
第一共存能力相关信息,所述第一共存能力相关信息用于指示允许与所述第一模型同时激活的模型,或者不允许与所述第一模型同时激活的模型;
第二共存能力相关信息,第二共存能力相关信息用于指示允许与所述第一模型同时使用的非模型功能,或者不允许与所述第一模型同时使用的非模型功能。
在一种可能的实施方式中,所述第一共存能力相关信息,包括以下至少一项:
允许与所述第一模型同时激活的模型列表;
不允许与所述第一模型同时激活的模型列表;
第一比特图,所述第一比特图用于指示对应的模型是否允许与所述第一模型同时激活;
第一指示信息,所述第一指示信息用于指示是否存在不允许与所述第一模型同时激活的模型;
所述第二共存能力相关信息,包括以下至少一项:
允许与所述第一模型同时使用的非模型功能列表;
不允许与所述第一模型同时使用的非模型功能列表;
第二比特图,所述第二比特图用于指示对应的非模型功能是否允许与所述第一模型同时使用;
第二指示信息,所述第二指示信息用于指示是否存在不允许与所述第一模型同时使用的非模型功能。
在一种可能的实施方式中,所述第二模型的相关信息,包括以下至少一项:
所述第二模型的索引;
所述第二模型的对应的使用场景;
所述第二模型的对应的配置;
所述第二模型的对应的地址;
所述第二模型的性能相关信息。
在一种可能的实施方式中,所述第二模型满足以下至少一项:
所述第二模型是所述第一设备进行训练并发送给所述网络设备的;
所述第二模型是所述网络设备训练的,所述第一模型是所述第一设备训练的,且所述第一模型的训练数据集是所述网络设备发送给所述第一设备的;
所述第二模型是预定义的模型;
所述第二模型是所述网络设备指示的模型。
在一种可能的实施方式中,所述生命周期管理控制信息包括以下至少一项:
所述第一模型的激活指示信息;
所述第一模型的去激活指示信息;
模型选择指示信息;
模型切换指示信息;
回退至非模型功能的指示信息;
所述第一模型的监控指示信息;
所述第一模型的推理指示信息。
在一种可能的实施方式中,所述第二接收模块具体用于以下至少一项:
在接收所述第一设备发送的第一能力上报信息后,接收所述第一设备发送的所述模型相关信息;
接收所述第一设备发送的所述第一能力上报信息和所述模型相关信息;
接收所述第一设备发送的第二能力上报信息,所述第二能力上报信息中包括所述模型相关信息;
向所述第一设备发送模型注册指示信息或模型识别指示信息,根据所述模型注册指示信息或所述模型识别指示信息接收所述第一设备发送的所述模型相关信息。
在一种可能的实施方式中,所述第二接收模块还用于:
接收所述第一设备上报的所述第一模型的推理结果。
第七方面,本公开提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序用于使计算机执行第一方面中的任一项所述的管理模型的方法,或者,所述计算机程序用于使计算机执行第二方面中的任一项所述的管理模型的方法。
第八方面,本公开实施例还提供一种处理器可读存储介质,所述处理器可读存储介质存储有计算机程序,所述计算机程序用于使处理器执行第一方
面中的任一项所述的管理模型的方法,或者,所述计算机程序用于使处理器执行第二方面中的任一项所述的管理模型的方法。
第九方面,本公开实施例还提供一种通信设备可读存储介质,所述通信设备可读存储介质存储有计算机程序,所述计算机程序用于使通信设备执行第一方面中的任一项所述的管理模型的方法,或者,所述计算机程序用于使通信设备执行第二方面中的任一项所述的管理模型的方法。
第十方面,本公开实施例还提供一种芯片产品可读存储介质,所述芯片产品可读存储介质存储有计算机程序,所述计算机程序用于使芯片产品执行第一方面中的任一项所述的管理模型的方法,或者,所述计算机程序用于使芯片产品执行第二方面中的任一项所述的管理模型的方法。
第十一方面,本公开提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如第一方面至第二方面任一项所述的管理模型的方法。
本公开实施例提供的管理模型的方法、装置及设备,第一设备为终端或服务器,第一设备向网络设备发送模型相关信息,模型相关信息用于注册或识别第一模型;网络设备在接收到模型相关信息后,根据模型相关信息向第一设备发送生命周期管理控制信息,第一设备可以根据生命周期管理控制信息对第一模型进行管理。第一设备通过向网络设备上报模型相关信息,使得网络设备在获取模型相关信息后,对第一设备的第一模型进行合理的生命周期管理,也促进了第一设备和网络设备之间对第一模型的协作,提升了系统性能。
为了更清楚地说明本公开或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本公开实施例提供的应用场景示意图;
图2为本公开实施例提供的管理模型的方法的流程示意图;
图3为本公开实施例提供的一种第一设备的结构示意图;
图4为本公开实施例提供的一种网络设备的结构示意图;
图5为本公开实施例提供的管理模型的装置的结构示意图一;
图6为本公开实施例提供的管理模型的装置的结构示意图二。
为使本公开的目的、技术方案和优点更加清楚,下面将结合本公开中的附图,对本公开中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
随着AI和ML的发展,在通信系统中使用AI模型或ML模型,以提升通信系统的性能的方案被提出。针对AI模型或ML模型而言,可能包括单边模型或者双边模型。单边模型指的是仅部署在单侧的模型,例如仅部署在网络设备侧的模型,或者仅部署在终端侧的模型,或者仅部署在服务器侧的模型;双边模型指的是部署在双侧的模型,例如同时部署在网络设备侧和终端侧的模型,需要网络设备和终端进行协作才能实现双边模型的正确的模型推理操作,同时部署在网络设备侧和服务器侧的模型,需要网络设备和服务器进行协作才能实现双边模型的正确的模型推理操作。
例如可以结合图1进行理解。图1为本公开实施例提供的应用场景示意图,如图1所示,包括网络设备10和第一设备,其中,第一设备可以为终端11,也可以为服务器12。
在网络设备10中可能部署了网络设备10的单边模型,也可能部署了双边模型中属于网络设备10的部分。类似的,在终端11中可能部署了终端11的单边模型,也可能部署了双边模型中属于终端11的部分;在服务器12中可能部署了服务器12的单边模型,也可能部署了双边模型中属于服务器12的部分。
部署在第一设备侧的单边模型,或者是双边模型中属于第一设备侧的部分,可能是由终端、芯片厂商或第三方服务商以私有方式训练的,称为第一设备的私有模型,并不为网络设备所知,导致网络设备无法对第一设备的私有模型进行生命周期管理。
基于此,本公开实施例提供一种管理模型的方法,通过向网络设备上报模型相关信息实现网络设备对模型的生命周期管理。下面将结合附图对本公开的方案进行介绍。
图2为本公开实施例提供的管理模型的方法的流程示意图,如图2所示,该方法可以包括:
S21,第一设备向网络设备发送模型相关信息,模型相关信息用于注册或识别第一模型。
本公开实施例中的第一设备可以为终端,例如图1示例中的终端11;第一设备也可以为第三方的服务器,例如图1示例中的服务器12。
为了使能第一设备与网络设备之间对模型进行协作、使得网络设备可以对第一设备的单边模型,或者双边模型中属于第一设备的部分进行生命周期管理,第一设备可以向网络设备发送模型相关信息。模型相关信息可以被称为模型的元信息(meta information),或者模型描述信息(model description information)。发送模型相关信息的行为也可以称为模型注册(model registration),即模型相关信息用于注册第一模型。发送模型相关信息的行为也可以称为模型识别(model identification),即模型相关信息用于识别第一模型。
第一模型为第一设备的单边模型,或者双边模型中属于第一设备的部分。模型相关信息中可以包括一项或多项与第一模型相关的信息,例如可以包括第一模型对应的训练数据集相关的信息,例如可以包括第一模型的性能相关信息,例如可以包括第一设备和网络设备关于双边模型的配对信息,例如可以包括第一模型的功能信息,等等。其中,第一模型可以为AI模型,也可以为ML模型,或者其他可能的类型的模型,本实施例对此不做限定。
S22,网络设备根据模型相关信息向第一设备发送生命周期管理控制信息,
生命周期管理控制信息用于对第一模型进行管理。
网络设备在接收到模型相关信息后,即实现了第一模型的注册或识别。网络设备根据模型相关信息向终端发送生命周期管理控制信息,以对第一设备中的第一模型进行生命周期管理。
生命周期管理包括如下一种或多种:模型激活,模型去激活,模型选择,模型切换,回退至非AI或非ML方法,模型监控,模型推理等等。以第一模型为例,若对第一模型进行模型激活,则激活后的第一模型可以用于模型推理;若对第一模型进行去激活,则去激活后的第一模型不可用于模型推理;若对第一模型进行切换,切换至其他模型,则将当前使用第一模型处理任务的过程更换为其他模型处理该任务;若对第一模型进行回退至非AI或非ML,则将当前使用第一模型处理任务的过程更换为非模型(即非AI或非ML)处理该任务;若对第一模型进行模型监控,则该第一模型可以用于模型监控;若对第一模型进行模型推理,则该第一模型可以用于模型推理等等。
网络设备对第一模型的管理,包括向第一设备发送上述管理相应的控制信息或指示信息。以模型激活为例,网络设备可以向第一设备发送模型激活指示信息,指示第一设备激活第一模型,此时生命周期管理控制信息中包括该模型激活指示信息;以模型去激活为例,网络设备可以向第一设备发送模型去激活指示信息,指示第一设备去激活第一模型,此时生命周期管理控制信息中包括该模型去激活指示信息;以模型监控为例,网络设备可以向第一设备发送第一模型的监控指示信息,指示第一设备测量相关信号以及反馈相关测量或推理结果,对第一模型进行监控,此时生命周期管理控制信息中包括该第一模型的监控指示信息;以模型推理为例,网络设备可以向第一设备发送第一模型的推理指示信息,指示第一设备测量相关信号以及反馈相关推理结果,对第一模型进行推理,此时生命周期管理控制信息中包括该第一模型的推理指示信息。
本公开实施例提供的管理模型的方法,应用于第一设备,第一设备为终端或服务器,第一设备向网络设备发送模型相关信息,模型相关信息用于注册或者识别第一模型;网络设备在接收到模型相关信息后,根据模型相关信
息向第一设备发送生命周期管理控制信息,第一设备可以根据生命周期管理控制信息对第一模型进行管理。第一设备通过向网络设备上报模型相关信息,使得网络设备在获取模型相关信息后,对第一设备的第一模型进行合理的生命周期管理,也促进了第一设备和网络设备之间对第一模型的协作,提升了系统性能。
在上述任一实施例的基础上,下面对本公开实施例的方案进行详细介绍。
第一设备向网络设备发送模型相关信息,网络设备根据模型相关信息实现对第一模型的生命周期管理。
可选的,第一设备可以在向网络设备发送第一能力上报信息后,向网络设备发送模型相关信息。网络设备可以在接收第一能力上报信息后,接收第一设备发送的模型相关信息。
可选的,第一设备可以向网络设备发送第一能力上报信息和模型相关信息,即第一设备同时上报第一能力上报信息和模型相关信息。网络设备可以同时接收第一能力上报信息和模型相关信息。
可选的,第一设备可以向网络设备发送第二能力上报信息,第二能力上报信息中包括模型相关信息。网络设备在接收到第二能力上报信息后,根据第二能力上报信息获取该模型相关信息。
可选的,网络设备可以向第一设备发送模型注册指示信息,模型注册指示信息用于指示第一设备进行模型注册,即指示第一设备发送模型相关信息。第一设备在接收到模型注册指示信息后,根据模型注册指示信息向网络设备发送模型相关信息。
可选的,网络设备可以向第一设备发送模型识别指示信息,模型识别指示信息用于指示第一设备进行模型识别,即指示第一设备发送模型相关信息。第一设备在接收到模型识别指示信息后,根据模型识别指示信息向网络设备发送模型相关信息。
在上述实施例中,介绍了第一设备发送模型相关信息的时机,下面将介绍模型相关信息中的具体内容。需要说明的是,在本公开各实施例中,第一设备均可以为终端,也可以为第三方的服务器,第一设备和网络设备之间可
以交互,且服务器与本公开实施例中的网络设备为不同的设备。第一模型例如可以为AI模型,也可以为ML模型,或者其他可能的模型。
在一种可能的实施方式中,第一设备向网络设备发送的模型相关信息中包括第一模型对应的训练数据集相关的信息,训练数据集为在第一模型训练过程中所使用的数据集。
第一模型对应的训练数据集相关的信息,可以包括以下(1.1)-(1.4)中的至少一项:
(1.1)训练数据集的性质或来源信息。
训练数据集的性质或来源信息,即为与训练数据集的性质或训练数据集的来源相关的信息。
训练数据集的性质或来源信息,可用于指示该训练数据集为网络设备指示的训练数据集。例如,该训练数据集可以为网络设备广播的训练数据集,也可以为网络设备单播的训练数据集。
训练数据集的性质或来源信息,可用于指示该训练数据集为预定义的训练数据集。例如,该训练数据集为在一些服务器(例如公开的服务器)上可获得的训练数据集,其中,该服务器可以是图1示例中的服务器12,也可以是其他的服务器。
训练数据集的性质或来源信息,可用于指示该训练数据集为终端使用的训练数据集,此时该训练数据集的来源为该终端。
训练数据集的性质或来源信息,可用于指示该训练数据集为服务器使用的训练数据集,此时该训练数据集的来源为该服务器。
需要说明的是,当第一设备为终端时,该训练数据集可以为终端使用的训练数据集,也可以为服务器使用的训练数据集;当第一设备为服务器时,该训练数据集可以为终端使用的训练数据集,也可以为服务器使用的训练数据集。
(1.2)训练数据集的标识。
训练数据集的标识用于指示该训练数据集,不同的训练数据集的标识也不同。根据第一模型对应的训练数据集的标识,即可确定第一模型对应的训
练数据集。
(1.3)训练数据集的属性信息。
训练数据集的属性信息,用于表征训练数据集的属性。本公开实施例中,训练数据集的属性信息,可以包括训练数据集的数量,也可以包括训练数据集的大小。
训练数据集的数量可以是一个,也可以是多个。针对第一任意一个训练数据集而言,训练数据集的属性信息中还可以包括该训练数据集的大小。
(1.4)训练数据集收集的相关信息。
训练数据集收集的相关信息,可以包括训练数据集的收集地点相关的信息、收集配置相关的信息和收集场景相关的信息。
训练数据集的收集地点相关的信息,用于指示收集该训练数据集的地点。例如,在某个地点、某个网络设备中收集的该训练数据集,则收集地点相关的信息中可以包括该地点,或该网络设备的标识,等等。
训练数据集的收集配置相关的信息,用于指示收集该训练数据集的配置。例如,收集配置相关的信息指示在某个终端天线配置下收集的该训练数据集,或收集配置相关的信息指示在某个网络设备天线配置下收集的该训练数据集,等等。
训练数据集的收集场景相关的信息,用于指示收集该训练数据集的场景。例如,收集场景相关的信息指示在室内场景下收集的该训练数据集,或收集场景相关的信息指示在城区场景下收集的该训练数据集,或收集场景相关的信息指示在乡村场景下收集的该训练数据集,等等。
网络设备接收到第一设备发送的训练数据集相关的信息后,根据训练数据集相关的信息可以确定第一模型的适用场景,使得网络设备在当前场景的数据与第一模型的训练数据集适配时,向第一设备发送生命周期管理控制信息给第一设备,激活该第一模型;而在当前场景所收集到的数据与第一模型的训练数据集不适配时,网络设备发送生命周期管理控制信息给第一设备,将第一模型切换到其他模型来处理任务,或回退到非模型方法来处理任务。
在通过训练数据集对第一模型训练的过程中,第一模型所学习的是训练
数据集的输入数据和输出标签之间的内在关系。本公开实施例中,通过第一设备上报的第一模型对应的训练数据集相关的信息,网络设备可以确定第一设备中第一模型使用的训练数据集,进而可以确定第一模型的功能、第一模型的输入格式、第一模型的输出格式、第一模型的适用场景等中的一项或多项。网络设备根据第一模型的功能、第一模型的输入格式、第一模型的输出格式、第一模型的适用场景等中的一项或多项,可以对该第一模型进行合理的生命周期管理,当合适时通过第一模型提升系统性能,当不合适时,避免由于错误使用第一模型造成系统性能下降。
在一种可能的实施方式中,第一设备向网络设备发送的模型相关信息中包括第一模型的性能相关信息。其中,第一模型的性能相关信息,包括以下(2.1)-(2.2)中的至少一项:
(2.1)模型的性能
模型的性能,可以通过相应的性能指标来体现。本公开实施例中,模型的性能可以包括第一模型的推理输出相关的第一性能指标、在通信系统中应用第一模型的通信性能相关的第二性能指标和第一模型自身的第三性能指标中的至少一项。
针对第一性能指标而言,由于第一性能指标表征的是第一模型的推理输出相关的性能指标,而针对功能不同的模型,其对应的推理输出也相应不同,因此针对用于不同的推理过程的第一模型,对应的第一性能指标也相应的不同。其中,第一模型应用的推理过程例如可以包括信道状态信息(Channel State Information,CSI)压缩反馈、CSI预测、波束管理、定位等等。
CSI为通信链路的信道属性,用于描述信号在信道上的衰弱因子,例如信号散射、距离衰减等信息。其中,CSI压缩反馈指的是基于CSI对信道进行压缩恢复,该过程可以通过第一模型完成,也可以通过其他模型完成,也可以通过非模型方法来完成。
若第一模型用于CSI压缩反馈,则可以将CSI输入至第一模型,由第一模型对CSI进行处理,得到该第一模型压缩恢复的信道。在该场景下,第一性能指标可以包括第一模型压缩恢复的信道与第一信道之间的相似程度。
其中,第一信道可以为理想信道,也可以为高精度信道。第一模型压缩恢复的信道与第一信道之间的相似程度,例如可以为第一模型压缩恢复的信道与第一信道之间的平方广义余弦相似度(Squared Generalized Cosine Similarity,SGCS),或者其他可能表征第一模型压缩恢复的信道与第一信道之间的相似程度的参数,本公开实施例对此不做限定。
CSI预测指的是基于CSI进行信道的预测,得到预测的信道的过程。该过程可以通过第一模型完成,也可以通过其他模型完成,也可以通过非模型方法来完成。
若第一模型用于CSI预测,则可以将CSI输入第一模型,由第一模型对CSI进行处理,得到第一模型预测的信道。在该场景下,第一性能指标可以包括第一模型预测的信道与第一信道之间的相似程度。其中,第一信道可以为理想信道,也可以为高精度信道。第一模型预测的信道与第一信道之间的相似程度,可以为第一模型预测的信道与第一信道之间的SGCS,或者其他可能表征第一模型预测的信道与第一信道之间的相似程度的参数,本公开实施例对此不做限定。
波束管理指的是在通信系统中对波束进行管理的过程,例如在通信系统中,包括多个波束,通过对这多个波束进行推理预测,选择合适的波束进行终端和网络设备之间的通信。该过程可以通过第一模型完成,也可以通过其他模型完成,也可以通过非模型方法来完成。
若第一模型用于波束管理,则可以将各个波束的相关参数输入至第一模型,由第一模型对各个波束的相关参数进行处理,输出第一模型推理预测的波束。
在该场景下,第一性能指标可以包括第一模型推理预测的波束为目标波束的概率,也可以包括第一模型推理预测的波束的参考信号接收功率(Reference Signal Receiving Power,RSRP)与目标波束的RSRP的差值。其中,目标波束例如可以为实际的最佳波束,第一模型推理预测的波束为推理预测的最佳波束。
第一模型推理预测的波束为目标波束的概率越大,则表示第一模型推理
预测的准确率越高,第一性能指标越好;第一模型推理预测的波束为目标波束的概率越小,则表示第一模型推理预测的准确率越低,第一性能指标越差。
类似的,第一模型推理预测的波束的RSRP与目标波束的RSRP的差值越小,则表示第一模型推理预测的准确率越高,第一性能指标越好;第一模型推理预测的波束的RSRP与目标波束的RSRP的差值越大,则表示第一模型推理预测的准确率越低,第一性能指标越差。
定位主要是针对终端和网络设备的通信系统中,对终端进行定位的过程。例如在通信系统中,确定终端在当前的位置,或者确定终端在一段时间后的位置等等。该过程可以通过第一模型完成,也可以通过其他模型完成,也可以通过非模型方法来完成。
若第一模型用于定位,则第一性能指标可以包括第一模型推理的中间变量与实际中间变量之间的差值,中间变量为用于得到终端的位置的过程中的变量,中间变量例如可以为到达时间(Time of Arrival,ToA)。第一性能指标也可以包括第一模型推理的直射径(Line of Sight,LoS)和/或非直射径(Non-Line of Sight,NLoS)的准确率。
针对第二性能指标而言,由于第二性能指标表征的是在通信系统中应用第一模型的通信性能相关的性能指标,而针对功能不同的模型,其对应的推理输出也相应不同,带来的通信性能的变化也不同,因此针对用于不同的推理过程的第一模型,对应的第二性能指标也相应的不同。其中,第一模型应用的推理过程例如可以包括CSI压缩反馈、CSI预测、波束管理、定位等等。
若第一模型用于CSI压缩反馈,则第二性能指标可以包括使用第一模型进行CSI压缩反馈后系统吞吐率的变化,其中,系统吞吐率的变化可以包括系统吞吐率的提升程度或降低程度,也可以包括系统吞吐率的提升比例或降低比例等等。
若第一模型用于CSI压缩反馈,则第二性能指标也可以包括使用第一模型进行CSI压缩反馈后在相同误码率下所要求的信号与干扰加噪声比(Signal to Interference plus Noise Ratio,SINR)的变化,其中,SINR的变化可以包括SINR的提升程度或降低程度等等。
若第一模型用于CSI预测,则第二性能指标可以包括使用第一模型进行CSI预测后系统吞吐率的变化,其中,系统吞吐率的变化可以包括系统吞吐率的提升程度或降低程度,也可以包括系统吞吐率的提升比例或降低比例等等。
若第一模型用于CSI预测,则第二性能指标也可以包括使用第一模型进行CSI预测后在相同误码率下所要求的SINR的变化,其中,SINR的变化可以包括SINR的提升程度或降低程度等等。
若第一模型用于波束管理,则第二性能指标可以包括使用第一模型进行波束管理后系统吞吐率的变化,其中,系统吞吐率的变化可以包括系统吞吐率的提升程度或降低程度,也可以包括系统吞吐率的提升比例或降低比例等等。
若第一模型用于波束管理,则第二性能指标也可以包括使用第一模型进行波束管理后在相同误码率下所要求的SINR的变化,其中,SINR的变化可以包括SINR的提升程度或降低程度等等。
若第一模型用于定位,则第二性能指标为第一模型推理的位置与实际位置之间的偏差值。以终端的定位为例,第一模型输出的是推理的终端的位置,若其与终端的实际位置的偏差值越小,则表示第一模型定位越准确,若其与终端的实际位置的偏差值越大,则表示第一模型定位越不准确。
第三性能指标为第一模型自身的性能指标,用于表征第一模型自身的性能。第三性能指标包括第一模型进行一次推理所需要的参考时间、第一模型的复杂度、第一模型的泛化性能和第一模型的信息值中的至少一项。
第一模型进行一次推理所需要的参考时间,可以是某一次通过第一模型进行一次推理所耗费的时间,也可以是多次通过第一模型进行推理得到的一次推理所耗费的平均时间,也可以是在特定的运行条件下第一模型进行一次推理所耗费的时间,其中,特定的运行条件例如可以是仅激活该第一模型的场景,例如也可以是去激活其他所有的模型的场景,等等。
第一模型的复杂度可以通过第一模型的大小来表征,第一模型越大,则第一模型的复杂度越高,第一模型越小,则第一模型的复杂度越低。第一模
型的复杂度还可以通过进行一次第一模型的推理所需的计算量来表征,计算量越大,则第一模型的复杂度越高,计算量越小,则第一模型的复杂度越低。
第一模型的泛化性能主要表示第一模型应用在不同的场景、不同的配置或不同的地点下对第一模型性能的影响。第一模型的泛化性能可以通过第一模型在不同场景中的有效性的信息来表征,也可以通过第一模型在不同配置中的有效性的信息来表征,也可以通过第一模型在不同地点中的有效性的信息来表征,等等。
第一模型的信息值用于指示第一模型的性能,信息值可以包括硬信息值和软信息值。以信息值的取值范围为[0,1]之间为例,其中0和1为硬信息值,0至1之间的其他取值为软信息值。信息值越大,则表示第一模型的性能越好,反之若信息值越小,则表示第一模型的性能越差。
(2.2)性能相关信息的来源
性能相关信息的来源用于指示性能相关信息为以下至少一项:
性能相关信息的来源用于指示性能相关信息为第一设备预估的性能相关信息。
性能相关信息的来源用于指示性能相关信息为第一设备测试的性能相关信息,例如通过验证数据集或测试数据集对第一模型进行验证后得到的性能相关信息。
性能相关信息的来源用于指示性能相关信息为通过网络设备检测的性能相关信息,其中,检测性能相关信息的网络设备,可以是接收第一模型的模型相关信息的网络设备,也可以是其他网络设备。以图1为例,检测性能相关信息的网络设备,可以是网络设备10,或者是除网络设备10外其他可能的网络设备。网络设备使用第一模型得到性能相关信息后,可以反馈给第一设备,使得第一设备获取到第一模型的性能相关信息。
性能相关信息的来源用于指示性能相关信息为预评测的性能相关信息,例如第三方机构评测的性能相关信息。其中,第三方机构为独立于第一设备和网络设备的评测机构。
网络设备接收到第一设备发送的第一模型的性能相关信息后,确定第一
设备的第一模型的增益,判断第一设备的第一模型是否值得激活使用。当网络设备判断第一模型带来的增益较大时,可以发送生命周期管理控制信息,以指示第一设备激活第一模型;当网络设备判断第一模型的增益不大时,可以发送生命周期管理控制信息,以指示第一设备去激活该第一模型,和/或,回退到非模型功能。
因此,本公开实施例的方案,通过第一设备上报第一模型的性能相关信息,网络设备可以预先知道注册或识别的第一模型的性能,有利于网络设备判断第一模型的调度和使用与否,从而进行合适的生命周期管理。当第一模型的增益较大时,网络设备可以指示第一设备激活该第一模型以提升系统性能,反之网络设备可以指示第一设备去激活该第一模型,以减少运行第一模型的功耗开销、计算开销和存储开销。
在一种可能的实施方式中,第一设备向网络设备发送的模型相关信息中包括第一模型输入和/或输出的量化信息。其中,第一模型输入和/或输出的量化信息,包括以下(3.1)-(3.4)中的至少一项:
(3.1)量化类型信息
量化类型信息用于表征第一模型输入和/或输出的量化信息的类型。若进行量化,则量化类型信息包括可以包括量化度量相关信息,其中,量化可以为标量量化,也可以为矢量量化。若为标量量化,量化类型信息可用于指示为均匀量化还是非均匀量化。若为矢量量化,量化类型信息可包括量化用的矢量的信息。
量化类型信息还可以包括量化方法信息,量化方法信息例如可以包括量化的区间、量化的比特数,等等。
(3.2)归一化相关信息
归一化相关信息用于指示是否对第一模型的输入和/或输出进行归一化处理。
针对第一模型的输入和/或输出而言,若确定对其进行归一化处理,则归一化相关信息中可以包括归一化方法,以指示如何对第一模型的输入和/或输出进行归一化。归一化方法例如可以包括一次方归一化、二次方归一化等等。
(3.3)第一模型的输入的单位。
第一模型的输入的单位,主要是用于限定第一模型的输入的格式,输入的单位例如可以包括对数值、线性值等等。
(3.4)第一模型的输出的单位。
第一模型的输出的单位,主要是用于限定第一模型的输出的格式,输出的单位例如可以包括对数值、线性值等等。
网络设备接收到第一设备发送的第一模型输入和/或输出的量化信息后,确定第一设备的第一模型的所要求的输入和/或输出的量化方式,从而可以为第一设备提供合适的输入数据格式,也可以通过合适的方式对第一设备的第一模型的输出进行解量化。
若第一设备不上报量化信息,则第一设备侧的第一模型仅能使用预定义的量化方法,其设计的灵活性受限。而本公开实施例的方案,通过模型注册或识别时向网络设备上报量化信息,则第一设备可以不必使用预定义的量化方法,而是可以根据自身的计算能力选择合适的量化方法,从而提升第一模型的性能,也可以使得网络设备获知第一设备侧的第一模型的输入/输出的量化情况,并对第一模型的输出结果进行合适的处理,例如可以为第一设备提供合适的输入数据格式,可以通过合适的方式对第一模型的输出进行反量化,最大化第一模型的性能。对于双边模型,通过量化信息更能对齐第一设备侧和网络设备侧的量化尺度,避免造成第一模型性能的下降。
在一种可能的实施方式中,第一设备向网络设备发送的模型相关信息中包括第一模型的共存能力相关信息。其中,第一模型的共存能力相关信息,包括以下(4.1)-(4.2)中的至少一项:
(4.1)第一共存能力相关信息
第一共存能力相关信息用于指示允许与第一模型同时激活的模型,或者不允许与第一模型同时激活的模型。
在一种实现方式中,第一共存能力相关信息包括允许与第一模型同时激活的模型列表,该允许与第一模型同时激活的模型列表中包括一个或多个模型,模型列表中的一个或多个模型允许与第一模型同时激活,即这一个或多
个模型不受第一模型的影响。
在一种实现方式中,第一共存能力相关信息包括不允许与第一模型同时激活的模型列表,该不允许与第一模型同时激活的模型列表中包括一个或多个模型,模型列表中的一个或多个模型不允许与第一模型同时激活,即这一个或多个模型会受第一模型的影响。
在一种实现方式中,第一共存能力相关信息包括第一比特图,第一比特图中的每个比特用于指示对应的模型是否允许与第一模型同时激活。例如,针对任意模型而言,该模型包括一个对应的比特,比特的取值为0或1,0代表该模型允许与第一模型同时激活,即该模型不受第一模型的影响;1代表该模型不允许与第一模型同时激活,即该模型会受第一模型的影响。
在一种实现方式中,第一共存能力相关信息包括第一指示信息,第一指示信息用于指示是否存在不允许与第一模型同时激活的模型。例如可以通过第一指示信息的取值来确定是否存在不允许与第一模型同时激活的模型,即是否存在受第一模型影响的模型。若存在至少一个不允许与第一模型同时激活的模型,则第一指示信息的取值为0,若不存在不允许与第一模型同时激活的模型,则第一指示信息的取值为1。
(4.2)第二共存能力相关信息
第二共存能力相关信息,用于指示允许与第一模型同时使用的非模型功能,或者不允许与第一模型同时使用的非模型功能。
在一种实现方式中,第二共存能力相关信息包括允许与第一模型同时使用的非模型功能列表,该允许与第一模型同时使用的非模型功能列表中包括一个或多个非模型功能,模型列表中的一个或多个非模型功能允许与第一模型同时激活,即这一个或多个非模型功能不受第一模型的影响。
在一种实现方式中,第二共存能力相关信息包括不允许与第一模型同时使用的非模型功能列表,该不允许与第一模型同时使用的非模型功能列表中包括一个或多个非模型功能,模型列表中的一个或多个非模型功能不允许与第一模型同时激活,即这一个或多个非模型功能会受第一模型的影响。
在一种实现方式中,第二共存能力相关信息包括第二比特图,第二比特
图中的每个比特用于指示对应的非模型功能是否允许与第一模型同时激活。例如,针对任意非模型功能而言,该非模型功能包括一个对应的比特,比特的取值为0或1,0代表该非模型功能允许与第一模型同时激活,即该非模型功能不受第一模型的影响;1代表该非模型功能不允许与第一模型同时激活,即该非模型功能会受第一模型的影响。
在一种实现方式中,第二共存能力相关信息包括第二指示信息,第二指示信息用于指示是否存在不允许与第一模型同时激活的非模型功能。例如可以通过第二指示信息的取值来确定是否存在不允许与第一模型同时激活的非模型功能,即是否存在受第一模型影响的非模型功能。若存在至少一个不允许与第一模型同时激活的非模型功能,则第二指示信息的取值为0,若不存在不允许与第一模型同时激活的非模型功能,则第一指示信息的取值为1。
网络设备接收到共存能力相关信息后,可以确定不能与第一设备的第一模型共同使用的模型或非模型功能,因此网络设备在指示第一设备激活该第一模型时,或者激活该第一模型之前,可以先指示去激活不能与第一模型共同使用的模型,也可以避免配置或指示第一设备使用不能与第一模型共同使用的非模型功能,从而避免网络设备错误地要求第一设备同时运行该第一模型以及其他不能共同使用的模型或非模型功能。
因此,本公开实施例的方案,通过第一设备上报共存能力相关信息,可以让网络设备确定可以与第一模型同时激活的模型、不可以与第一模型同时激活的模型、可以与第一模型同时使用的非模型功能、不可以与第一模型同时使用的非模型功能,等等,使得网络设备可以更合适的进行生命周期管理,控制第一模型的激活、去激活、回退至非模型功能等等,避免因为指示第一设备激活了不能与第一模型共同激活的模型,或者运行了不能与第一模型共同使用的非模型功能导致第一设备行为不可预知,损害第一设备和网络设备的性能的问题。
在一种可能的实施方式中,第一设备向网络设备发送的模型相关信息中包括第一模型对应的一个或多个第二模型的相关信息,第二模型为网络设备的模型。本公开实施例中,第二模型为与第一模型相关的模型,针对双边模
型场景而言,第一模型为双边模型中部署在第一设备侧的部分,第二模型为双边模型中部署在网络设备侧的部分。第二模型的相关信息,包括以下(5.1)-(5.5)中的至少一项:
(5.1)第二模型的索引。
第二模型的索引用于标识该第二模型。第一设备上报第二模型的索引后,网络设备可以根据第二模型的索引,确定第二模型。
(5.2)第二模型的对应的使用场景。
第二模型对应的使用场景用于表征第二模型适用的场景,第一设备上报第二模型对应的使用场景后,网络设备可以根据第二模型对应的使用场景,确定第二模型。
(5.3)第二模型的对应的配置。
第二模型对应的使用配置用于表征第二模型适用的配置,第一设备上报第二模型对应的使用配置后,网络设备可以根据第二模型对应的使用配置,确定第二模型。
(5.4)第二模型的对应的地址。
第一设备上报第二模型对应的地址后,网络设备可以根据第二模型对应的地址,确定第二模型。
(5.5)第二模型的性能相关信息。
第二模型的性能相关信息,用于表征第二模型的性能,也可以用于表征第一模型和第二模型协作使用时的性能。其中,第二模型的性能,可以通过相应的性能指标来表征。第二模型的性能对应的性能指标,可以参见上述实施例中第一模型的性能对应的性能指标的相关介绍,此处不再赘述。
在一种实现方式中,第二模型是第一设备进行训练并发送给网络设备的,因此第一设备也可以确定第二模型,然后向网络设备发送第二模型的相关信息。
在一种实现方式中,第二模型是网络设备训练的,第一模型是第一设备训练的,且第一模型的训练数据集是网络设备发送给第一设备的,每个训练数据集对应一个网络设备侧的第二模型,因此第一设备可以确定第二模型,
然后向网络设备发送第二模型的相关信息。
在一种实现方式中,第二模型是预定义的模型或网络设备指示的模型。具体的,通过预定义的方式或者网络设备指示的方式确定了参考模型,第一设备根据第一模型与各个参考模型之间的性能匹配程度,在参考模型中确定与第一模型匹配的第二模型,然后向网络设备发送第二模型的相关信息。
网络设备接收到第一设备发送的第二模型的相关信息后,确定双边模型中与第一设备侧的第一模型所匹配的网络设备侧的第二模型,以在双边模型的使用中选择使用使第一设备和网络设备联合性能最佳的第二模型。因此,本公开实施例的方案,能够辅助网络设备判断使用合适的网络设备侧的第二模型与第一设备侧的第一模型进行匹配工作,避免盲目使用网络设备侧的模型,或者同时使用多个网络设备侧的模型去尝试匹配第一模型,导致不必要的计算能力和功耗开销,提升系统性能。
在网络设备接收到模型相关信息后,可以根据模型相关信息向第一设备发送生命周期管理控制信息,从而对第一模型进行生命周期管理。生命周期管理控制信息中可以包括第一模型的激活指示信息、第一模型的去激活指示信息、模型选择指示信息、模型切换指示信息、回退至非模型功能的指示信息、第一模型的监控指示信息和第一模型的推理指示信息中的至少一项。
第一模型的激活指示信息,用于对第一模型进行激活;第一模型的去激活指示信息,用于对第一模型进行去激活;模型选择指示信息,用于指示选择某个模型进行任务处理;模型切换指示信息,用于进行模型切换;回退至非模型功能的指示信息,用于指示回退至非模型功能,例如回退至非AI或非ML方法;第一模型的监控指示信息,用于指示对第一模型进行监控;第一模型的推理指示信息,用于对第一模型进行推理,等等。生命周期管理控制信息中包括的具体内容,可以由网络设备根据模型相关信息确定,本实施例对此不作限定。
综上所述,本公开实施例提供的管理模型的方法,通过第一设备向网络设备发送模型相关信息,使得网络设备可以获知第一设备侧的第一模型的相关信息,从而根据第一模型的相关信息进行合理的生命周期管理,辅助网络
设备和第一设备之间对第一模型的协作,提升系统性能。
图3为本公开实施例提供的一种第一设备的结构示意图,如图3所示,所述第一设备包括存储器320,收发机300,处理器310,其中:
存储器320,用于存储计算机程序;收发机300,用于在所述处理器310的控制下收发数据;处理器310,用于读取所述存储器320中的计算机程序并执行以下操作:
向网络设备发送模型相关信息,所述模型相关信息用于注册或识别第一模型;
接收所述网络设备发送的生命周期管理控制信息,所述生命周期管理控制信息用于对所述第一模型进行管理。
其中,在图3中,总线架构可以包括任意数量的互联的总线和桥,具体由处理器310代表的一个或多个处理器和存储器320代表的存储器的各种电路链接在一起。总线架构还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口提供接口。收发机300可以是多个元件,即包括发送机和接收机,提供用于在传输介质上与各种其他装置通信的单元,这些传输介质包括无线信道、有线信道、光缆等传输介质。针对不同的用户设备,用户接口330还可以是能够外接内接需要设备的接口,连接的设备包括但不限于小键盘、显示器、扬声器、麦克风、操纵杆等。
处理器310负责管理总线架构和通常的处理,存储器320可以存储处理器310在执行操作时所使用的数据。
在一些实施例中,处理器310可以是中央处理器(CPU)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或复杂可编程逻辑器件(Complex Programmable Logic Device,CPLD),处理器也可以采用多核架构。
处理器通过调用存储器存储的计算机程序,用于按照获得的可执行指令执行本公开实施例提供的任一所述方法。处理器与存储器也可以物理上分开布置。
在一种可能的实施方式中,所述模型相关信息包括以下至少一项:
所述第一模型对应的训练数据集相关的信息;
所述第一模型的性能相关信息;
所述第一模型输入和/或输出的量化信息;
所述第一模型的共存能力相关信息;
所述第一模型对应的一个或多个第二模型的相关信息,所述第二模型为所述网络设备的模型。
在一种可能的实施方式中,所述第一模型对应的训练数据集相关的信息,包括以下至少一项:
所述训练数据集的性质或来源信息;
所述训练数据集的标识;
所述训练数据集的属性信息;
所述训练数据集的数据收集的相关信息。
在一种可能的实施方式中,所述训练数据集的性质或来源信息用于指示以下至少一项:
所述训练数据集为所述网络设备指示的训练数据集;
所述训练数据集为预定义的训练数据集;
所述训练数据集为所述终端使用的训练数据集;
所述训练数据集为所述服务器使用的训练数据集;
所述训练数据集的属性信息,包括以下至少一项:
所述训练数据集的数量;
所述训练数据集的大小;
所述训练数据集收集的相关信息,包括以下至少一项:
所述训练数据集的收集地点相关的信息;
所述训练数据集的收集配置相关的信息;
所述训练数据集的收集场景相关的信息。
在一种可能的实施方式中,所述性能相关信息包括模型的性能,和/或,所述性能相关信息的来源,其中:
所述模型的性能包括以下至少一项:
所述第一模型的推理输出相关的第一性能指标;
在通信系统中应用所述第一模型的通信性能相关的第二性能指标;
所述第一模型自身的第三性能指标;
所述性能相关信息的来源用于指示所述性能相关信息为以下至少一项:
所述第一设备预估的性能相关信息;
所述第一设备测试的性能相关信息;
通过网络设备检测的性能相关信息;
预评测的性能相关信息。
在一种可能的实施方式中,所述第一性能指标为以下任意一项:
若所述第一模型用于CSI压缩反馈,所述第一性能指标包括所述第一模型压缩恢复的信道与第一信道之间的相似程度;
若所述第一模型用于CSI预测,所述第一性能指标包括所述第一模型预测的信道与所述第一信道之间的相似程度;
若所述第一模型用于波束管理,所述第一性能指标包括:所述第一模型推理预测的波束为目标波束的概率,和/或,所述推理预测的波束的RSRP与所述目标波束的RSRP的差值;
若所述第一模型用于定位,所述第一性能指标包括:所述第一模型推理的中间变量与实际中间变量之间的差值,和/或,所述第一模型推理的直射径和/或非直射径的准确率;
所述第二性能指标为以下任意一项:
若所述第一模型用于CSI压缩反馈,所述第二性能指标包括:使用所述第一模型进行CSI压缩反馈后系统吞吐率的变化,和/或,使用所述第一模型进行CSI压缩反馈后在相同误码率下所要求的SINR的变化;
若所述第一模型用于CSI预测,所述第二性能指标包括:使用所述第一模型进行CSI预测后系统吞吐率的变化,和/或,使用所述第一模型进行CSI预测后在相同误码率下所要求的SINR的变化;
若所述第一模型用于波束管理,所述第二性能指标包括:使用所述第一
模型进行波束管理后系统吞吐率的变化,和/或,使用所述第一模型进行波束管理后在相同误码率下所要求的SINR的变化;
若所述第一模型用于定位,所述第二性能指标为所述第一模型推理的位置与实际位置之间的偏差值;
所述第三性能指标包括以下至少一项:
所述第一模型进行一次推理所需要的参考时间;
所述第一模型的复杂度;
所述第一模型的泛化性能;
所述第一模型的信息值,所述信息值用于指示所述第一模型的性能。
在一种可能的实施方式中,所述量化信息,包括以下至少一项:
量化类型信息,所述量化类型信息包括量化度量相关信息,和/或,量化方法信息;
归一化相关信息,所述归一化相关信息用于指示是否对所述第一模型的输入和/或输出进行归一化处理;
所述第一模型的输入的单位;
所述第一模型的输出的单位。
在一种可能的实施方式中,所述共存能力相关信息,包括以下至少一项:
第一共存能力相关信息,所述第一共存能力相关信息用于指示允许与所述第一模型同时激活的模型,或者不允许与所述第一模型同时激活的模型;
第二共存能力相关信息,第二共存能力相关信息用于指示允许与所述第一模型同时使用的非模型功能,或者不允许与所述第一模型同时使用的非模型功能。
在一种可能的实施方式中,所述第一共存能力相关信息,包括以下至少一项:
允许与所述第一模型同时激活的模型列表;
不允许与所述第一模型同时激活的模型列表;
第一比特图,所述第一比特图中的每个比特用于指示对应的模型是否允许与所述第一模型同时激活;
第一指示信息,所述第一指示信息用于指示是否存在不允许与所述第一模型同时激活的模型;
所述第二共存能力相关信息,包括以下至少一项:
允许与所述第一模型同时使用的非模型功能列表;
不允许与所述第一模型同时使用的非模型功能列表;
第二比特图,所述第二比特图中的每个比特用于指示对应的非模型功能是否允许与所述第一模型同时使用;
第二指示信息,所述第二指示信息用于指示是否存在不允许与所述第一模型同时使用的非模型功能。
在一种可能的实施方式中,所述第二模型的相关信息,包括以下至少一项:
所述第二模型的索引;
所述第二模型的对应的使用场景;
所述第二模型的对应的配置;
所述第二模型的对应的地址;
所述第二模型的性能相关信息。
在一种可能的实施方式中,所述第二模型满足以下至少一项:
所述第二模型是所述第一设备进行训练并发送给所述网络设备的;
所述第二模型是所述网络设备训练的,所述第一模型是所述第一设备训练的,且所述第一模型的训练数据集是所述网络设备发送给所述第一设备的;
所述第二模型是预定义的模型;
所述第二模型是所述网络设备指示的模型。
在一种可能的实施方式中,所述生命周期管理控制信息包括以下至少一项:
所述第一模型的激活指示信息;
所述第一模型的去激活指示信息;
模型选择指示信息;
模型切换指示信息;
回退至非模型功能的指示信息;
所述第一模型的监控指示信息;
所述第一模型的推理指示信息。
在一种可能的实施方式中,所述向网络设备发送模型相关信息,包括以下至少一项:
在向所述网络设备发送第一能力上报信息后,向所述网络设备发送所述模型相关信息;
向所述网络设备发送所述第一能力上报信息和所述模型相关信息;
向所述网络设备发送第二能力上报信息,所述第二能力上报信息中包括所述模型相关信息;
接收所述网络设备发送的模型注册指示信息或模型识别指示信息,根据所述模型注册指示信息或所述模型识别指示信息向所述网络设备发送所述模型相关信息。
在一种可能的实施方式中,所述处理器还用于读取所述存储器中的计算机程序并执行以下操作:
向所述网络设备上报所述第一模型的推理结果。
在此需要说明的是,本公开实施例提供的上述第一设备,能够实现上述执行主体为第一设备的方法实施例所实现的所有方法步骤,且能够达到相同的技术效果,在此不再对本实施例中与方法实施例相同的部分及有益效果进行具体赘述。
图4为本公开实施例提供的一种网络设备的结构示意图,如图4所示,所述网络设备包括存储器420,收发机400,处理器410,其中:
存储器420,用于存储计算机程序;收发机400,用于在所述处理器410的控制下收发数据;处理器410,用于读取所述存储器420中的计算机程序并执行以下操作:
接收第一设备发送的模型相关信息,所述模型相关信息用于注册或识别第一模型,所述第一设备为终端或服务器;
根据所述模型相关信息,向所述第一设备发送生命周期管理控制信息,
所述生命周期管理控制信息用于对所述第一模型进行管理。
具体地,收发机400,用于在处理器410的控制下接收和发送数据。
其中,在图4中,总线架构可以包括任意数量的互联的总线和桥,具体由处理器410代表的一个或多个处理器和存储器420代表的存储器的各种电路链接在一起。总线架构还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口提供接口。收发机400可以是多个元件,即包括发送机和接收机,提供用于在传输介质上与各种其他装置通信的单元,这些传输介质包括,这些传输介质包括无线信道、有线信道、光缆等传输介质。处理器410负责管理总线架构和通常的处理,存储器420可以存储处理器410在执行操作时所使用的数据。
可选的,处理器410可以是CPU、ASIC、FPGA或CPLD,处理器也可以采用多核架构。
处理器通过调用存储器存储的计算机程序,用于按照获得的可执行指令执行本公开实施例提供的任一所述方法。处理器与存储器也可以物理上分开布置。
在一种可能的实施方式中,所述模型相关信息包括以下至少一项:
所述第一模型对应的训练数据集相关的信息;
所述第一模型的性能相关信息;
所述第一模型输入和/或输出的量化信息;
所述第一模型的共存能力相关信息;
所述第一模型对应的一个或多个第二模型的相关信息,所述第二模型为所述网络设备的模型。
在一种可能的实施方式中,所述第一模型对应的训练数据集相关的信息,包括以下至少一项:
所述训练数据集的性质或来源信息;
所述训练数据集的标识;
所述训练数据集的属性信息;
所述训练数据集的数据收集的相关信息。
在一种可能的实施方式中,所述训练数据集的性质或来源信息用于指示以下至少一项:
所述训练数据集为所述网络设备指示的训练数据集;
所述训练数据集为预定义的训练数据集;
所述训练数据集为所述终端使用的训练数据集;
所述训练数据集为所述服务器使用的训练数据集;
所述训练数据集的属性信息,包括以下至少一项:
所述训练数据集的数量;
所述训练数据集的大小;
所述训练数据集收集的相关信息,包括以下至少一项:
所述训练数据集的收集地点相关的信息;
所述训练数据集的收集配置相关的信息;
所述训练数据集的收集场景相关的信息。
在一种可能的实施方式中,所述性能相关信息包括所述模型的性能,和/或,所述性能相关信息的来源,其中:
所述模型的性能包括以下至少一项:
所述第一模型的推理输出相关的第一性能指标;
在通信系统中应用所述第一模型的通信性能相关的第二性能指标;
所述第一模型自身的第三性能指标;
所述性能相关信息的来源用于指示所述性能相关信息为以下至少一项:
所述第一设备预估的性能相关信息;
所述第一设备测试的性能相关信息;
通过网络设备检测的性能相关信息;
预评测的性能相关信息。
在一种可能的实施方式中,所述第一性能指标为以下任意一项:
若所述第一模型用于CSI压缩反馈,所述第一性能指标包括所述第一模型压缩恢复的信道与第一信道之间的相似程度;
若所述第一模型用于CSI预测,所述第一性能指标包括所述第一模型预测的信道与所述第一信道之间的相似程度;
若所述第一模型用于波束管理,所述第一性能指标包括:所述第一模型推理预测的波束为目标波束的概率,和/或,所述推理预测的波束的RSRP与所述目标波束的RSRP的差值;
若所述第一模型用于定位,所述第一性能指标包括:所述第一模型推理的中间变量与实际中间变量之间的差值,和/或,所述第一模型推理的直射径和/或非直射径的准确率;
所述第二性能指标为以下任意一项:
若所述第一模型用于CSI压缩反馈,所述第二性能指标包括:使用所述第一模型进行CSI压缩反馈后系统吞吐率的变化,和/或,使用所述第一模型进行CSI压缩反馈后在相同误码率下所要求的SINR的变化;
若所述第一模型用于CSI预测,所述第二性能指标包括:使用所述第一模型进行CSI预测后系统吞吐率的变化,和/或,使用所述第一模型进行CSI预测后在相同误码率下所要求的SINR的变化;
若所述第一模型用于波束管理,所述第二性能指标包括:使用所述第一模型进行波束管理后系统吞吐率的变化,和/或,使用所述第一模型进行波束管理后在相同误码率下所要求的SINR的变化;
若所述第一模型用于定位,所述第二性能指标为所述第一模型推理的位置与实际位置之间的偏差值;
所述第三性能指标包括以下至少一项:
所述第一模型进行一次推理所需要的参考时间;
所述第一模型的复杂度;
所述第一模型的泛化性能;
所述第一模型的信息值,所述信息值用于指示所述第一模型的性能。
在一种可能的实施方式中,所述量化信息,包括以下至少一项:
量化类型信息,所述量化类型信息包括量化度量相关信息,和/或,量化方法信息;
归一化相关信息,所述归一化相关信息用于指示是否对所述第一模型的输入和/或输出进行归一化处理;
所述第一模型的输入的单位;
所述第一模型的输出的单位。
在一种可能的实施方式中,所述共存能力相关信息,包括以下至少一项:
第一共存能力相关信息,所述第一共存能力相关信息用于指示允许与所述第一模型同时激活的模型,或者不允许与所述第一模型同时激活的模型;
第二共存能力相关信息,第二共存能力相关信息用于指示允许与所述第一模型同时使用的非模型功能,或者不允许与所述第一模型同时使用的非模型功能。
在一种可能的实施方式中,所述第一共存能力相关信息,包括以下至少一项:
允许与所述第一模型同时激活的模型列表;
不允许与所述第一模型同时激活的模型列表;
第一比特图,所述第一比特图用于指示对应的模型是否允许与所述第一模型同时激活;
第一指示信息,所述第一指示信息用于指示是否存在不允许与所述第一模型同时激活的模型;
所述第二共存能力相关信息,包括以下至少一项:
允许与所述第一模型同时使用的非模型功能列表;
不允许与所述第一模型同时使用的非模型功能列表;
第二比特图,所述第二比特图用于指示对应的非模型功能是否允许与所述第一模型同时使用;
第二指示信息,所述第二指示信息用于指示是否存在不允许与所述第一模型同时使用的非模型功能。
在一种可能的实施方式中,所述第二模型的相关信息,包括以下至少一项:
所述第二模型的索引;
所述第二模型的对应的使用场景;
所述第二模型的对应的配置;
所述第二模型的对应的地址;
所述第二模型的性能相关信息。
在一种可能的实施方式中,所述第二模型满足以下至少一项:
所述第二模型是所述第一设备进行训练并发送给所述网络设备的;
所述第二模型是所述网络设备训练的,所述第一模型是所述第一设备训练的,且所述第一模型的训练数据集是所述网络设备发送给所述第一设备的;
所述第二模型是预定义的模型;
所述第二模型是所述网络设备指示的模型。
在一种可能的实施方式中,所述生命周期管理控制信息包括以下至少一项:
所述第一模型的激活指示信息;
所述第一模型的去激活指示信息;
模型选择指示信息;
模型切换指示信息;
回退至非模型功能的指示信息;
所述第一模型的监控指示信息;
所述第一模型的推理指示信息。
在一种可能的实施方式中,所述接收第一设备发送的模型相关信息,包括以下至少一项:
在接收所述第一设备发送的第一能力上报信息后,接收所述第一设备发送的所述模型相关信息;
接收所述第一设备发送的所述第一能力上报信息和所述模型相关信息;
接收所述第一设备发送的第二能力上报信息,所述第二能力上报信息中包括所述模型相关信息;
向所述第一设备发送模型注册指示信息或模型识别指示信息,根据所述模型注册指示信息或所述模型识别指示信息接收所述第一设备发送的所述模
型相关信息。
在一种可能的实施方式中,所述处理器还用于读取所述存储器中的计算机程序并执行以下操作:
接收所述第一设备上报的所述第一模型的推理结果。
在此需要说明的是,本公开实施例提供的上述网络设备,能够实现上述执行主体为网络设备的方法实施例所实现的所有方法步骤,且能够达到相同的技术效果,在此不再对本实施例中与方法实施例相同的部分及有益效果进行具体赘述。
图5为本公开实施例提供的管理模型的装置的结构示意图一,如图5所示,该管理模型的装置50包括:
第一发送模块51,用于向网络设备发送模型相关信息,所述模型相关信息用于注册或识别第一模型;
第一接收模块52,用于接收所述网络设备发送的生命周期管理控制信息,所述生命周期管理控制信息用于对所述第一模型进行管理。
在一种可能的实施方式中,所述模型相关信息包括以下至少一项:
所述第一模型对应的训练数据集相关的信息;
所述第一模型的性能相关信息;
所述第一模型输入和/或输出的量化信息;
所述第一模型的共存能力相关信息;
所述第一模型对应的一个或多个第二模型的相关信息,所述第二模型为所述网络设备的模型。
在一种可能的实施方式中,所述第一模型对应的训练数据集相关的信息,包括以下至少一项:
所述训练数据集的性质或来源信息;
所述训练数据集的标识;
所述训练数据集的属性信息;
所述训练数据集的数据收集的相关信息。
在一种可能的实施方式中,所述训练数据集的性质或来源信息用于指示
以下至少一项:
所述训练数据集为所述网络设备指示的训练数据集;
所述训练数据集为预定义的训练数据集;
所述训练数据集为所述终端使用的训练数据集;
所述训练数据集为所述服务器使用的训练数据集;
所述训练数据集的属性信息,包括以下至少一项:
所述训练数据集的数量;
所述训练数据集的大小;
所述训练数据集收集的相关信息,包括以下至少一项:
所述训练数据集的收集地点相关的信息;
所述训练数据集的收集配置相关的信息;
所述训练数据集的收集场景相关的信息。
在一种可能的实施方式中,所述性能相关信息包括模型的性能,和/或,所述性能相关信息的来源,其中:
所述模型的性能包括以下至少一项:
所述第一模型的推理输出相关的第一性能指标;
在通信系统中应用所述第一模型的通信性能相关的第二性能指标;
所述第一模型自身的第三性能指标;
所述性能相关信息的来源用于指示所述性能相关信息为以下至少一项:
所述第一设备预估的性能相关信息;
所述第一设备测试的性能相关信息;
通过网络设备检测的性能相关信息;
预评测的性能相关信息。
在一种可能的实施方式中,所述第一性能指标为以下任意一项:
若所述第一模型用于CSI压缩反馈,所述第一性能指标包括所述第一模型压缩恢复的信道与第一信道之间的相似程度;
若所述第一模型用于CSI预测,所述第一性能指标包括所述第一模型预测的信道与所述第一信道之间的相似程度;
若所述第一模型用于波束管理,所述第一性能指标包括:所述第一模型推理预测的波束为目标波束的概率,和/或,所述推理预测的波束的RSRP与所述目标波束的RSRP的差值;
若所述第一模型用于定位,所述第一性能指标包括:所述第一模型推理的中间变量与实际中间变量之间的差值,和/或,所述第一模型推理的直射径和/或非直射径的准确率;
所述第二性能指标为以下任意一项:
若所述第一模型用于CSI压缩反馈,所述第二性能指标包括:使用所述第一模型进行CSI压缩反馈后系统吞吐率的变化,和/或,使用所述第一模型进行CSI压缩反馈后在相同误码率下所要求的SINR的变化;
若所述第一模型用于CSI预测,所述第二性能指标包括:使用所述第一模型进行CSI预测后系统吞吐率的变化,和/或,使用所述第一模型进行CSI预测后在相同误码率下所要求的SINR的变化;
若所述第一模型用于波束管理,所述第二性能指标包括:使用所述第一模型进行波束管理后系统吞吐率的变化,和/或,使用所述第一模型进行波束管理后在相同误码率下所要求的SINR的变化;
若所述第一模型用于定位,所述第二性能指标为所述第一模型推理的位置与实际位置之间的偏差值;
所述第三性能指标包括以下至少一项:
所述第一模型进行一次推理所需要的参考时间;
所述第一模型的复杂度;
所述第一模型的泛化性能;
所述第一模型的信息值,所述信息值用于指示所述第一模型的性能。
在一种可能的实施方式中,所述量化信息,包括以下至少一项:
量化类型信息,所述量化类型信息包括量化度量相关信息,和/或,量化方法信息;
归一化相关信息,所述归一化相关信息用于指示是否对所述第一模型的输入和/或输出进行归一化处理;
所述第一模型的输入的单位;
所述第一模型的输出的单位。
在一种可能的实施方式中,所述共存能力相关信息,包括以下至少一项:
第一共存能力相关信息,所述第一共存能力相关信息用于指示允许与所述第一模型同时激活的模型,或者不允许与所述第一模型同时激活的模型;
第二共存能力相关信息,第二共存能力相关信息用于指示允许与所述第一模型同时使用的非模型功能,或者不允许与所述第一模型同时使用的非模型功能。
在一种可能的实施方式中,所述第一共存能力相关信息,包括以下至少一项:
允许与所述第一模型同时激活的模型列表;
不允许与所述第一模型同时激活的模型列表;
第一比特图,所述第一比特图中的每个比特用于指示对应的模型是否允许与所述第一模型同时激活;
第一指示信息,所述第一指示信息用于指示是否存在不允许与所述第一模型同时激活的模型;
所述第二共存能力相关信息,包括以下至少一项:
允许与所述第一模型同时使用的非模型功能列表;
不允许与所述第一模型同时使用的非模型功能列表;
第二比特图,所述第二比特图中的每个比特用于指示对应的非模型功能是否允许与所述第一模型同时使用;
第二指示信息,所述第二指示信息用于指示是否存在不允许与所述第一模型同时使用的非模型功能。
在一种可能的实施方式中,所述第二模型的相关信息,包括以下至少一项:
所述第二模型的索引;
所述第二模型的对应的使用场景;
所述第二模型的对应的配置;
所述第二模型的对应的地址;
所述第二模型的性能相关信息。
在一种可能的实施方式中,所述第二模型满足以下至少一项:
所述第二模型是所述第一设备进行训练并发送给所述网络设备的;
所述第二模型是所述网络设备训练的,所述第一模型是所述第一设备训练的,且所述第一模型的训练数据集是所述网络设备发送给所述第一设备的;
所述第二模型是预定义的模型;
所述第二模型是所述网络设备指示的模型。
在一种可能的实施方式中,所述生命周期管理控制信息包括以下至少一项:
所述第一模型的激活指示信息;
所述第一模型的去激活指示信息;
模型选择指示信息;
模型切换指示信息;
回退至非模型功能的指示信息;
所述第一模型的监控指示信息;
所述第一模型的推理指示信息。
在一种可能的实施方式中,所述第一发送模块51具体用于以下至少一项:
在向所述网络设备发送第一能力上报信息后,向所述网络设备发送所述模型相关信息;
向所述网络设备发送所述第一能力上报信息和所述模型相关信息;
向所述网络设备发送第二能力上报信息,所述第二能力上报信息中包括所述模型相关信息;
接收所述网络设备发送的模型注册指示信息或模型识别指示信息,根据所述模型注册指示信息或所述模型识别指示信息向所述网络设备发送所述模型相关信息。
在一种可能的实施方式中,所述第一发送模块51还用于:
向所述网络设备上报所述第一模型的推理结果。
具体地,本公开实施例提供的上述管理模块的装置,能够实现上述执行主体为第一设备的方法实施例所实现的所有方法步骤,且能够达到相同的技术效果,在此不再对本实施例中与方法实施例相同的部分及有益效果进行具体赘述。
图6为本公开实施例提供的管理模型的装置的结构示意图二,如图6所示,该管理模型的装置60包括:
第二接收模块61,用于接收第一设备发送的模型相关信息,所述模型相关信息用于注册或识别第一模型,所述第一设备为终端或服务器;
第二发送模块62,用于根据所述模型相关信息,向所述第一设备发送生命周期管理控制信息,所述生命周期管理控制信息用于对所述第一模型进行管理。
在一种可能的实施方式中,所述模型相关信息包括以下至少一项:
所述第一模型对应的训练数据集相关的信息;
所述第一模型的性能相关信息;
所述第一模型输入和/或输出的量化信息;
所述第一模型的共存能力相关信息;
所述第一模型对应的一个或多个第二模型的相关信息,所述第二模型为所述网络设备的模型。
在一种可能的实施方式中,所述第一模型对应的训练数据集相关的信息,包括以下至少一项:
所述训练数据集的性质或来源信息;
所述训练数据集的标识;
所述训练数据集的属性信息;
所述训练数据集的数据收集的相关信息。
在一种可能的实施方式中,所述训练数据集的性质或来源信息用于指示以下至少一项:
所述训练数据集为所述网络设备指示的训练数据集;
所述训练数据集为预定义的训练数据集;
所述训练数据集为所述终端使用的训练数据集;
所述训练数据集为所述服务器使用的训练数据集;
所述训练数据集的属性信息,包括以下至少一项:
所述训练数据集的数量;
所述训练数据集的大小;
所述训练数据集收集的相关信息,包括以下至少一项:
所述训练数据集的收集地点相关的信息;
所述训练数据集的收集配置相关的信息;
所述训练数据集的收集场景相关的信息。
在一种可能的实施方式中,所述性能相关信息包括所述模型的性能,和/或,所述性能相关信息的来源,其中:
所述模型的性能包括以下至少一项:
所述第一模型的推理输出相关的第一性能指标;
在通信系统中应用所述第一模型的通信性能相关的第二性能指标;
所述第一模型自身的第三性能指标;
所述性能相关信息的来源用于指示所述性能相关信息为以下至少一项:
所述第一设备预估的性能相关信息;
所述第一设备测试的性能相关信息;
通过网络设备检测的性能相关信息;
预评测的性能相关信息。
在一种可能的实施方式中,所述第一性能指标为以下任意一项:
若所述第一模型用于CSI压缩反馈,所述第一性能指标包括所述第一模型压缩恢复的信道与第一信道之间的相似程度;
若所述第一模型用于CSI预测,所述第一性能指标包括所述第一模型预测的信道与所述第一信道之间的相似程度;
若所述第一模型用于波束管理,所述第一性能指标包括:所述第一模型推理预测的波束为目标波束的概率,和/或,所述推理预测的波束的RSRP与所述目标波束的RSRP的差值;
若所述第一模型用于定位,所述第一性能指标包括:所述第一模型推理的中间变量与实际中间变量之间的差值,和/或,所述第一模型推理的直射径和/或非直射径的准确率;
所述第二性能指标为以下任意一项:
若所述第一模型用于CSI压缩反馈,所述第二性能指标包括:使用所述第一模型进行CSI压缩反馈后系统吞吐率的变化,和/或,使用所述第一模型进行CSI压缩反馈后在相同误码率下所要求的SINR的变化;
若所述第一模型用于CSI预测,所述第二性能指标包括:使用所述第一模型进行CSI预测后系统吞吐率的变化,和/或,使用所述第一模型进行CSI预测后在相同误码率下所要求的SINR的变化;
若所述第一模型用于波束管理,所述第二性能指标包括:使用所述第一模型进行波束管理后系统吞吐率的变化,和/或,使用所述第一模型进行波束管理后在相同误码率下所要求的SINR的变化;
若所述第一模型用于定位,所述第二性能指标为所述第一模型推理的位置与实际位置之间的偏差值;
所述第三性能指标包括以下至少一项:
所述第一模型进行一次推理所需要的参考时间;
所述第一模型的复杂度;
所述第一模型的泛化性能;
所述第一模型的信息值,所述信息值用于指示所述第一模型的性能。
在一种可能的实施方式中,所述量化信息,包括以下至少一项:
量化类型信息,所述量化类型信息包括量化度量相关信息,和/或,量化方法信息;
归一化相关信息,所述归一化相关信息用于指示是否对所述第一模型的输入和/或输出进行归一化处理;
所述第一模型的输入的单位;
所述第一模型的输出的单位。
在一种可能的实施方式中,所述共存能力相关信息,包括以下至少一项:
第一共存能力相关信息,所述第一共存能力相关信息用于指示允许与所述第一模型同时激活的模型,或者不允许与所述第一模型同时激活的模型;
第二共存能力相关信息,第二共存能力相关信息用于指示允许与所述第一模型同时使用的非模型功能,或者不允许与所述第一模型同时使用的非模型功能。
在一种可能的实施方式中,所述第一共存能力相关信息,包括以下至少一项:
允许与所述第一模型同时激活的模型列表;
不允许与所述第一模型同时激活的模型列表;
第一比特图,所述第一比特图用于指示对应的模型是否允许与所述第一模型同时激活;
第一指示信息,所述第一指示信息用于指示是否存在不允许与所述第一模型同时激活的模型;
所述第二共存能力相关信息,包括以下至少一项:
允许与所述第一模型同时使用的非模型功能列表;
不允许与所述第一模型同时使用的非模型功能列表;
第二比特图,所述第二比特图用于指示对应的非模型功能是否允许与所述第一模型同时使用;
第二指示信息,所述第二指示信息用于指示是否存在不允许与所述第一模型同时使用的非模型功能。
在一种可能的实施方式中,所述第二模型的相关信息,包括以下至少一项:
所述第二模型的索引;
所述第二模型的对应的使用场景;
所述第二模型的对应的配置;
所述第二模型的对应的地址;
所述第二模型的性能相关信息。
在一种可能的实施方式中,所述第二模型满足以下至少一项:
所述第二模型是所述第一设备进行训练并发送给所述网络设备的;
所述第二模型是所述网络设备训练的,所述第一模型是所述第一设备训练的,且所述第一模型的训练数据集是所述网络设备发送给所述第一设备的;
所述第二模型是预定义的模型;
所述第二模型是所述网络设备指示的模型。
在一种可能的实施方式中,所述生命周期管理控制信息包括以下至少一项:
所述第一模型的激活指示信息;
所述第一模型的去激活指示信息;
模型选择指示信息;
模型切换指示信息;
回退至非模型功能的指示信息;
所述第一模型的监控指示信息;
所述第一模型的推理指示信息。
在一种可能的实施方式中,所述第二接收模块62具体用于以下至少一项:
在接收所述第一设备发送的第一能力上报信息后,接收所述第一设备发送的所述模型相关信息;
接收所述第一设备发送的所述第一能力上报信息和所述模型相关信息;
接收所述第一设备发送的第二能力上报信息,所述第二能力上报信息中包括所述模型相关信息;
向所述第一设备发送模型注册指示信息或模型识别指示信息,根据所述模型注册指示信息或所述模型识别指示信息接收所述第一设备发送的所述模型相关信息。
在一种可能的实施方式中,所述第二接收模块62还用于:
接收所述第一设备上报的所述第一模型的推理结果。
具体地,本公开实施例提供的上述管理模块的装置,能够实现上述执行主体为网络设备的方法实施例所实现的所有方法步骤,且能够达到相同的技术效果,在此不再对本实施例中与方法实施例相同的部分及有益效果进行具
体赘述。
需要说明的是,本公开上述各实施例中对单元/模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
在一些实施例中,还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序用于使计算机执行上述各方法实施例提供的管理模型的方法。
具体地,本公开实施例提供的上述计算机可读存储介质,能够实现上述各方法实施例所实现的所有方法步骤,且能够达到相同的技术效果,在此不再对本实施例中与方法实施例相同的部分及有益效果进行具体赘述。
需要说明的是:所述计算机可读存储介质可以是处理器能够存取的任何可用介质或数据存储设备,包括但不限于磁性存储器(例如软盘、硬盘、磁带、磁光盘(MO)等)、光学存储器(例如CD、DVD、BD、HVD等)、以及半导体存储器(例如ROM、EPROM、EEPROM、非易失性存储器(NAND FLASH)、固态硬盘(SSD))等。
另外需要说明的是:本公开实施例中术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用
的术语在适当情况下可以互换,以便本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”所区别的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。
本公开实施例中术语“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
本公开实施例中术语“多个”是指两个或两个以上,其它量词与之类似。
本公开实施例提供的技术方案可以适用于多种系统,尤其是5G系统。例如适用的系统可以是全球移动通讯(global system of mobile communication,GSM)系统、码分多址(code division multiple access,CDMA)系统、宽带码分多址(Wideband Code Division Multiple Access,WCDMA)通用分组无线业务(general packet radio service,GPRS)系统、长期演进(long term evolution,LTE)系统、LTE频分双工(frequency division duplex,FDD)系统、LTE时分双工(time division duplex,TDD)系统、高级长期演进(long term evolution advanced,LTE-A)系统、通用移动系统(universal mobile telecommunication system,UMTS)、全球互联微波接入(worldwide interoperability for microwave access,WiMAX)系统、5G新空口(New Radio,NR)系统等。这多种系统中均包括终端设备和网络设备。系统中还可以包括核心网部分,例如演进的分组系统(Evloved Packet System,EPS)、5G系统(5GS)等。
本公开实施例涉及的终端设备,可以是指向用户提供语音和/或数据连通性的设备,具有无线连接功能的手持式设备、或连接到无线调制解调器的其他处理设备等。在不同的系统中,终端设备的名称可能也不相同,例如在5G系统中,终端设备可以称为用户设备(User Equipment,UE)。无线终端设备可以经无线接入网(Radio Access Network,RAN)与一个或多个核心网(Core Network,CN)进行通信,无线终端设备可以是移动终端设备,如移动电话(或称为“蜂窝”电话)和具有移动终端设备的计算机,例如,可以是便携式、袖珍式、手持式、计算机内置的或者车载的移动装置,它们与无线
接入网交换语言和/或数据。例如,个人通信业务(Personal Communication Service,PCS)电话、无绳电话、会话发起协议(Session Initiated Protocol,SIP)话机、无线本地环路(Wireless Local Loop,WLL)站、个人数字助理(Personal Digital Assistant,PDA)等设备。无线终端设备也可以称为系统、订户单元(subscriberunit)、订户站(subscriber station),移动站(mobile station)、移动台(mobile)、远程站(remote station)、接入点(access point)、远程终端设备(remote terminal)、接入终端设备(access terminal)、用户终端设备(user terminal)、用户代理(user agent)、用户装置(user device),本公开实施例中并不限定。
本公开实施例涉及的网络设备,可以是基站,该基站可以包括多个为终端提供服务的小区。根据具体应用场合不同,基站又可以称为接入点,或者可以是接入网中在空中接口上通过一个或多个扇区与无线终端设备通信的设备,或者其它名称。网络设备可用于将收到的空中帧与网际协议(Internet Protocol,IP)分组进行相互更换,作为无线终端设备与接入网的其余部分之间的路由器,其中接入网的其余部分可包括网际协议(IP)通信网络。网络设备还可协调对空中接口的属性管理。例如,本公开实施例涉及的网络设备可以是全球移动通信系统(Global System for Mobile communications,GSM)或码分多址接入(Code Division Multiple Access,CDMA)中的网络设备(Base Transceiver Station,BTS),也可以是带宽码分多址接入(Wide-band Code Division Multiple Access,WCDMA)中的网络设备(NodeB),还可以是长期演进(long term evolution,LTE)系统中的演进型网络设备(evolutional Node B,eNB或e-NodeB)、5G网络架构(next generation system)中的5G基站(gNB),也可以是家庭演进基站(Home evolved Node B,HeNB)、中继节点(relay node)、家庭基站(femto)、微微基站(pico)等,本公开实施例中并不限定。在一些网络结构中,网络设备可以包括集中单元(centralized unit,CU)节点和分布单元(distributed unit,DU)节点,集中单元和分布单元也可以地理上分开布置。
网络设备与终端设备之间可以各自使用一或多根天线进行多输入多输出
(Multi Input Multi Output,MIMO)传输,MIMO传输可以是单用户MIMO(Single User MIMO,SU-MIMO)或多用户MIMO(Multiple User MIMO,MU-MIMO)。根据根天线组合的形态和数量,MIMO传输可以是2D-MIMO、3D-MIMO、FD-MIMO或massive-MIMO,也可以是分集传输或预编码传输或波束赋形传输等。
本领域内的技术人员应明白,本公开的实施例可提供为方法、系统、或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机可执行指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机可执行指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些处理器可执行指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的处理器可读存储器中,使得存储在该处理器可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些处理器可执行指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本公开进行各种改动和变型而不脱离本公开的精神和范围。这样,倘若本公开的这些修改和变型属于本公开权利要
求及其等同技术的范围之内,则本公开也意图包含这些改动和变型在内。
Claims (85)
- 一种管理模型的方法,应用于第一设备,所述第一设备为终端或服务器,所述方法包括:向网络设备发送模型相关信息,所述模型相关信息用于注册或识别第一模型;接收所述网络设备发送的生命周期管理控制信息,所述生命周期管理控制信息用于对所述第一模型进行管理。
- 根据权利要求1所述的管理模型的方法,其中,所述模型相关信息包括以下至少一项:所述第一模型对应的训练数据集相关的信息;所述第一模型的性能相关信息;所述第一模型输入和/或输出的量化信息;所述第一模型的共存能力相关信息;所述第一模型对应的一个或多个第二模型的相关信息,所述第二模型为所述网络设备的模型。
- 根据权利要求2所述的管理模型的方法,其中,所述第一模型对应的训练数据集相关的信息,包括以下至少一项:所述训练数据集的性质或来源信息;所述训练数据集的标识;所述训练数据集的属性信息;所述训练数据集的数据收集的相关信息。
- 根据权利要求3所述的管理模型的方法,其中,所述训练数据集的性质或来源信息用于指示以下至少一项:所述训练数据集为所述网络设备指示的训练数据集;所述训练数据集为预定义的训练数据集;所述训练数据集为所述终端使用的训练数据集;所述训练数据集为所述服务器使用的训练数据集;所述训练数据集的属性信息,包括以下至少一项:所述训练数据集的数量;所述训练数据集的大小;所述训练数据集收集的相关信息,包括以下至少一项:所述训练数据集的收集地点相关的信息;所述训练数据集的收集配置相关的信息;所述训练数据集的收集场景相关的信息。
- 根据权利要求2所述的管理模型的方法,其中,所述性能相关信息包括模型的性能,和/或,所述性能相关信息的来源,其中:所述模型的性能包括以下至少一项:所述第一模型的推理输出相关的第一性能指标;在通信系统中应用所述第一模型的通信性能相关的第二性能指标;所述第一模型自身的第三性能指标;所述性能相关信息的来源用于指示所述性能相关信息为以下至少一项:所述第一设备预估的性能相关信息;所述第一设备测试的性能相关信息;通过网络设备检测的性能相关信息;预评测的性能相关信息。
- 根据权利要求5所述的管理模型的方法,其中,所述第一性能指标为以下任意一项:若所述第一模型用于信道状态信息CSI压缩反馈,所述第一性能指标包括所述第一模型压缩恢复的信道与第一信道之间的相似程度;若所述第一模型用于CSI预测,所述第一性能指标包括所述第一模型预测的信道与所述第一信道之间的相似程度;若所述第一模型用于波束管理,所述第一性能指标包括:所述第一模型推理预测的波束为目标波束的概率,和/或,所述推理预测的波束的参考信号接收功率RSRP与所述目标波束的RSRP的差值;若所述第一模型用于定位,所述第一性能指标包括:所述第一模型推理的中间变量与实际中间变量之间的差值,和/或,所述第一模型推理的直射径和/或非直射径的准确率;所述第二性能指标为以下任意一项:若所述第一模型用于CSI压缩反馈,所述第二性能指标包括:使用所述第一模型进行CSI压缩反馈后系统吞吐率的变化,和/或,使用所述第一模型 进行CSI压缩反馈后在相同误码率下所要求的信号与干扰加噪声比SINR的变化;若所述第一模型用于CSI预测,所述第二性能指标包括:使用所述第一模型进行CSI预测后系统吞吐率的变化,和/或,使用所述第一模型进行CSI预测后在相同误码率下所要求的SINR的变化;若所述第一模型用于波束管理,所述第二性能指标包括:使用所述第一模型进行波束管理后系统吞吐率的变化,和/或,使用所述第一模型进行波束管理后在相同误码率下所要求的SINR的变化;若所述第一模型用于定位,所述第二性能指标为所述第一模型推理的位置与实际位置之间的偏差值;所述第三性能指标包括以下至少一项:所述第一模型进行一次推理所需要的参考时间;所述第一模型的复杂度;所述第一模型的泛化性能;所述第一模型的信息值,所述信息值用于指示所述第一模型的性能。
- 根据权利要求2所述的管理模型的方法,其中,所述量化信息,包括以下至少一项:量化类型信息,所述量化类型信息包括量化度量相关信息,和/或,量化方法信息;归一化相关信息,所述归一化相关信息用于指示是否对所述第一模型的输入和/或输出进行归一化处理;所述第一模型的输入的单位;所述第一模型的输出的单位。
- 根据权利要求2所述的管理模型的方法,其中,所述共存能力相关信息,包括以下至少一项:第一共存能力相关信息,所述第一共存能力相关信息用于指示允许与所述第一模型同时激活的模型,或者不允许与所述第一模型同时激活的模型;第二共存能力相关信息,第二共存能力相关信息用于指示允许与所述第一模型同时使用的非模型功能,或者不允许与所述第一模型同时使用的非模型功能。
- 根据权利要求8所述的管理模型的方法,其中,所述第一共存能力相关信息,包括以下至少一项:允许与所述第一模型同时激活的模型列表;不允许与所述第一模型同时激活的模型列表;第一比特图,所述第一比特图中的每个比特用于指示对应的模型是否允许与所述第一模型同时激活;第一指示信息,所述第一指示信息用于指示是否存在不允许与所述第一模型同时激活的模型;所述第二共存能力相关信息,包括以下至少一项:允许与所述第一模型同时使用的非模型功能列表;不允许与所述第一模型同时使用的非模型功能列表;第二比特图,所述第二比特图中的每个比特用于指示对应的非模型功能是否允许与所述第一模型同时使用;第二指示信息,所述第二指示信息用于指示是否存在不允许与所述第一模型同时使用的非模型功能。
- 根据权利要求2所述的管理模型的方法,其中,所述第二模型的相关信息,包括以下至少一项:所述第二模型的索引;所述第二模型的对应的使用场景;所述第二模型的对应的配置;所述第二模型的对应的地址;所述第二模型的性能相关信息。
- 根据权利要求10所述的管理模型的方法,其中,所述第二模型满足以下至少一项:所述第二模型是所述第一设备进行训练并发送给所述网络设备的;所述第二模型是所述网络设备训练的,所述第一模型是所述第一设备训练的,且所述第一模型的训练数据集是所述网络设备发送给所述第一设备的;所述第二模型是预定义的模型;所述第二模型是所述网络设备指示的模型。
- 根据权利要求1-11任一项所述的管理模型的方法,其中,所述生命 周期管理控制信息包括以下至少一项:所述第一模型的激活指示信息;所述第一模型的去激活指示信息;模型选择指示信息;模型切换指示信息;回退至非模型功能的指示信息;所述第一模型的监控指示信息;所述第一模型的推理指示信息。
- 根据权利要求1-11任一项所述的管理模型的方法,其中,所述向网络设备发送模型相关信息,包括以下至少一项:在向所述网络设备发送第一能力上报信息后,向所述网络设备发送所述模型相关信息;向所述网络设备发送所述第一能力上报信息和所述模型相关信息;向所述网络设备发送第二能力上报信息,所述第二能力上报信息中包括所述模型相关信息;接收所述网络设备发送的模型注册指示信息或模型识别指示信息,根据所述模型注册指示信息或所述模型识别指示信息向所述网络设备发送所述模型相关信息。
- 根据权利要求1-11任一项所述的管理模型的方法,其中,所述方法还包括:向所述网络设备上报所述第一模型的推理结果。
- 一种管理模型的方法,应用于网络设备,所述方法包括:接收第一设备发送的模型相关信息,所述模型相关信息用于注册或识别第一模型,所述第一设备为终端或服务器;根据所述模型相关信息,向所述第一设备发送生命周期管理控制信息,所述生命周期管理控制信息用于对所述第一模型进行管理。
- 根据权利要求15所述的管理模型的方法,其中,所述模型相关信息包括以下至少一项:所述第一模型对应的训练数据集相关的信息;所述第一模型的性能相关信息;所述第一模型输入和/或输出的量化信息;所述第一模型的共存能力相关信息;所述第一模型对应的一个或多个第二模型的相关信息,所述第二模型为所述网络设备的模型。
- 根据权利要求16所述的管理模型的方法,其中,所述第一模型对应的训练数据集相关的信息,包括以下至少一项:所述训练数据集的性质或来源信息;所述训练数据集的标识;所述训练数据集的属性信息;所述训练数据集的数据收集的相关信息。
- 根据权利要求17所述的管理模型的方法,其中,所述训练数据集的性质或来源信息用于指示以下至少一项:所述训练数据集为所述网络设备指示的训练数据集;所述训练数据集为预定义的训练数据集;所述训练数据集为所述终端使用的训练数据集;所述训练数据集为所述服务器使用的训练数据集;所述训练数据集的属性信息,包括以下至少一项:所述训练数据集的数量;所述训练数据集的大小;所述训练数据集收集的相关信息,包括以下至少一项:所述训练数据集的收集地点相关的信息;所述训练数据集的收集配置相关的信息;所述训练数据集的收集场景相关的信息。
- 根据权利要求16所述的管理模型的方法,其中,所述性能相关信息包括所述模型的性能,和/或,所述性能相关信息的来源,其中:所述模型的性能包括以下至少一项:所述第一模型的推理输出相关的第一性能指标;在通信系统中应用所述第一模型的通信性能相关的第二性能指标;所述第一模型自身的第三性能指标;所述性能相关信息的来源用于指示所述性能相关信息为以下至少一项:所述第一设备预估的性能相关信息;所述第一设备测试的性能相关信息;通过网络设备检测的性能相关信息;预评测的性能相关信息。
- 根据权利要求19所述的管理模型的方法,其中,所述第一性能指标为以下任意一项:若所述第一模型用于CSI压缩反馈,所述第一性能指标包括所述第一模型压缩恢复的信道与第一信道之间的相似程度;若所述第一模型用于CSI预测,所述第一性能指标包括所述第一模型预测的信道与所述第一信道之间的相似程度;若所述第一模型用于波束管理,所述第一性能指标包括:所述第一模型推理预测的波束为目标波束的概率,和/或,所述推理预测的波束的RSRP与所述目标波束的RSRP的差值;若所述第一模型用于定位,所述第一性能指标包括:所述第一模型推理的中间变量与实际中间变量之间的差值,和/或,所述第一模型推理的直射径和/或非直射径的准确率;所述第二性能指标为以下任意一项:若所述第一模型用于CSI压缩反馈,所述第二性能指标包括:使用所述第一模型进行CSI压缩反馈后系统吞吐率的变化,和/或,使用所述第一模型进行CSI压缩反馈后在相同误码率下所要求的SINR的变化;若所述第一模型用于CSI预测,所述第二性能指标包括:使用所述第一模型进行CSI预测后系统吞吐率的变化,和/或,使用所述第一模型进行CSI预测后在相同误码率下所要求的SINR的变化;若所述第一模型用于波束管理,所述第二性能指标包括:使用所述第一模型进行波束管理后系统吞吐率的变化,和/或,使用所述第一模型进行波束管理后在相同误码率下所要求的SINR的变化;若所述第一模型用于定位,所述第二性能指标为所述第一模型推理的位置与实际位置之间的偏差值;所述第三性能指标包括以下至少一项:所述第一模型进行一次推理所需要的参考时间;所述第一模型的复杂度;所述第一模型的泛化性能;所述第一模型的信息值,所述信息值用于指示所述第一模型的性能。
- 根据权利要求16所述的管理模型的方法,其中,所述量化信息,包括以下至少一项:量化类型信息,所述量化类型信息包括量化度量相关信息,和/或,量化方法信息;归一化相关信息,所述归一化相关信息用于指示是否对所述第一模型的输入和/或输出进行归一化处理;所述第一模型的输入的单位;所述第一模型的输出的单位。
- 根据权利要求16所述的管理模型的方法,其中,所述共存能力相关信息,包括以下至少一项:第一共存能力相关信息,所述第一共存能力相关信息用于指示允许与所述第一模型同时激活的模型,或者不允许与所述第一模型同时激活的模型;第二共存能力相关信息,第二共存能力相关信息用于指示允许与所述第一模型同时使用的非模型功能,或者不允许与所述第一模型同时使用的非模型功能。
- 根据权利要求22所述的管理模型的方法,其中,所述第一共存能力相关信息,包括以下至少一项:允许与所述第一模型同时激活的模型列表;不允许与所述第一模型同时激活的模型列表;第一比特图,所述第一比特图用于指示对应的模型是否允许与所述第一模型同时激活;第一指示信息,所述第一指示信息用于指示是否存在不允许与所述第一模型同时激活的模型;所述第二共存能力相关信息,包括以下至少一项:允许与所述第一模型同时使用的非模型功能列表;不允许与所述第一模型同时使用的非模型功能列表;第二比特图,所述第二比特图用于指示对应的非模型功能是否允许与所 述第一模型同时使用;第二指示信息,所述第二指示信息用于指示是否存在不允许与所述第一模型同时使用的非模型功能。
- 根据权利要求16所述的管理模型的方法,其中,所述第二模型的相关信息,包括以下至少一项:所述第二模型的索引;所述第二模型的对应的使用场景;所述第二模型的对应的配置;所述第二模型的对应的地址;所述第二模型的性能相关信息。
- 根据权利要求24所述的管理模型的方法,其中,所述第二模型满足以下至少一项:所述第二模型是所述第一设备进行训练并发送给所述网络设备的;所述第二模型是所述网络设备训练的,所述第一模型是所述第一设备训练的,且所述第一模型的训练数据集是所述网络设备发送给所述第一设备的;所述第二模型是预定义的模型;所述第二模型是所述网络设备指示的模型。
- 根据权利要求15-25任一项所述的管理模型的方法,其中,所述生命周期管理控制信息包括以下至少一项:所述第一模型的激活指示信息;所述第一模型的去激活指示信息;模型选择指示信息;模型切换指示信息;回退至非模型功能的指示信息;所述第一模型的监控指示信息;所述第一模型的推理指示信息。
- 根据权利要求15-25任一项所述的管理模型的方法,其中,所述接收第一设备发送的模型相关信息,包括以下至少一项:在接收所述第一设备发送的第一能力上报信息后,接收所述第一设备发送的所述模型相关信息;接收所述第一设备发送的所述第一能力上报信息和所述模型相关信息;接收所述第一设备发送的第二能力上报信息,所述第二能力上报信息中包括所述模型相关信息;向所述第一设备发送模型注册指示信息或模型识别指示信息,根据所述模型注册指示信息或所述模型识别指示信息接收所述第一设备发送的所述模型相关信息。
- 根据权利要求15-25任一项所述的管理模型的方法,其中,所述方法还包括:接收所述第一设备上报的所述第一模型的推理结果。
- 一种第一设备,包括存储器,收发机,处理器;存储器,用于存储计算机程序;收发机,用于在所述处理器的控制下收发数据;处理器,用于读取所述存储器中的计算机程序并执行以下操作:向网络设备发送模型相关信息,所述模型相关信息用于注册或识别第一模型;接收所述网络设备发送的生命周期管理控制信息,所述生命周期管理控制信息用于对所述第一模型进行管理。
- 根据权利要求29所述的第一设备,其中,所述模型相关信息包括以下至少一项:所述第一模型对应的训练数据集相关的信息;所述第一模型的性能相关信息;所述第一模型输入和/或输出的量化信息;所述第一模型的共存能力相关信息;所述第一模型对应的一个或多个第二模型的相关信息,所述第二模型为所述网络设备的模型。
- 根据权利要求30所述的第一设备,其中,所述第一模型对应的训练数据集相关的信息,包括以下至少一项:所述训练数据集的性质或来源信息;所述训练数据集的标识;所述训练数据集的属性信息;所述训练数据集的数据收集的相关信息。
- 根据权利要求31所述的第一设备,其中,所述训练数据集的性质或来源信息用于指示以下至少一项:所述训练数据集为所述网络设备指示的训练数据集;所述训练数据集为预定义的训练数据集;所述训练数据集为所述终端使用的训练数据集;所述训练数据集为所述服务器使用的训练数据集;所述训练数据集的属性信息,包括以下至少一项:所述训练数据集的数量;所述训练数据集的大小;所述训练数据集收集的相关信息,包括以下至少一项:所述训练数据集的收集地点相关的信息;所述训练数据集的收集配置相关的信息;所述训练数据集的收集场景相关的信息。
- 根据权利要求30所述的第一设备,其中,所述性能相关信息包括模型的性能,和/或,所述性能相关信息的来源,其中:所述模型的性能包括以下至少一项:所述第一模型的推理输出相关的第一性能指标;在通信系统中应用所述第一模型的通信性能相关的第二性能指标;所述第一模型自身的第三性能指标;所述性能相关信息的来源用于指示所述性能相关信息为以下至少一项:所述第一设备预估的性能相关信息;所述第一设备测试的性能相关信息;通过网络设备检测的性能相关信息;预评测的性能相关信息。
- 根据权利要求33所述的第一设备,其中,所述第一性能指标为以下任意一项:若所述第一模型用于CSI压缩反馈,所述第一性能指标包括所述第一模型压缩恢复的信道与第一信道之间的相似程度;若所述第一模型用于CSI预测,所述第一性能指标包括所述第一模型预测的信道与所述第一信道之间的相似程度;若所述第一模型用于波束管理,所述第一性能指标包括:所述第一模型推理预测的波束为目标波束的概率,和/或,所述推理预测的波束的RSRP与所述目标波束的RSRP的差值;若所述第一模型用于定位,所述第一性能指标包括:所述第一模型推理的中间变量与实际中间变量之间的差值,和/或,所述第一模型推理的直射径和/或非直射径的准确率;所述第二性能指标为以下任意一项:若所述第一模型用于CSI压缩反馈,所述第二性能指标包括:使用所述第一模型进行CSI压缩反馈后系统吞吐率的变化,和/或,使用所述第一模型进行CSI压缩反馈后在相同误码率下所要求的SINR的变化;若所述第一模型用于CSI预测,所述第二性能指标包括:使用所述第一模型进行CSI预测后系统吞吐率的变化,和/或,使用所述第一模型进行CSI预测后在相同误码率下所要求的SINR的变化;若所述第一模型用于波束管理,所述第二性能指标包括:使用所述第一模型进行波束管理后系统吞吐率的变化,和/或,使用所述第一模型进行波束管理后在相同误码率下所要求的SINR的变化;若所述第一模型用于定位,所述第二性能指标为所述第一模型推理的位置与实际位置之间的偏差值;所述第三性能指标包括以下至少一项:所述第一模型进行一次推理所需要的参考时间;所述第一模型的复杂度;所述第一模型的泛化性能;所述第一模型的信息值,所述信息值用于指示所述第一模型的性能。
- 根据权利要求30所述的第一设备,其中,所述量化信息,包括以下至少一项:量化类型信息,所述量化类型信息包括量化度量相关信息,和/或,量化方法信息;归一化相关信息,所述归一化相关信息用于指示是否对所述第一模型的输入和/或输出进行归一化处理;所述第一模型的输入的单位;所述第一模型的输出的单位。
- 根据权利要求30所述的第一设备,其中,所述共存能力相关信息,包括以下至少一项:第一共存能力相关信息,所述第一共存能力相关信息用于指示允许与所述第一模型同时激活的模型,或者不允许与所述第一模型同时激活的模型;第二共存能力相关信息,第二共存能力相关信息用于指示允许与所述第一模型同时使用的非模型功能,或者不允许与所述第一模型同时使用的非模型功能。
- 根据权利要求36所述的第一设备,其中,所述第一共存能力相关信息,包括以下至少一项:允许与所述第一模型同时激活的模型列表;不允许与所述第一模型同时激活的模型列表;第一比特图,所述第一比特图中的每个比特用于指示对应的模型是否允许与所述第一模型同时激活;第一指示信息,所述第一指示信息用于指示是否存在不允许与所述第一模型同时激活的模型;所述第二共存能力相关信息,包括以下至少一项:允许与所述第一模型同时使用的非模型功能列表;不允许与所述第一模型同时使用的非模型功能列表;第二比特图,所述第二比特图中的每个比特用于指示对应的非模型功能是否允许与所述第一模型同时使用;第二指示信息,所述第二指示信息用于指示是否存在不允许与所述第一模型同时使用的非模型功能。
- 根据权利要求30所述的第一设备,其中,所述第二模型的相关信息,包括以下至少一项:所述第二模型的索引;所述第二模型的对应的使用场景;所述第二模型的对应的配置;所述第二模型的对应的地址;所述第二模型的性能相关信息。
- 根据权利要求38所述的第一设备,其中,所述第二模型满足以下至少一项:所述第二模型是所述第一设备进行训练并发送给所述网络设备的;所述第二模型是所述网络设备训练的,所述第一模型是所述第一设备训练的,且所述第一模型的训练数据集是所述网络设备发送给所述第一设备的;所述第二模型是预定义的模型;所述第二模型是所述网络设备指示的模型。
- 根据权利要求29-39任一项所述的第一设备,其中,所述生命周期管理控制信息包括以下至少一项:所述第一模型的激活指示信息;所述第一模型的去激活指示信息;模型选择指示信息;模型切换指示信息;回退至非模型功能的指示信息;所述第一模型的监控指示信息;所述第一模型的推理指示信息。
- 根据权利要求29-39任一项所述的第一设备,其中,所述向网络设备发送模型相关信息,包括以下至少一项:在向所述网络设备发送第一能力上报信息后,向所述网络设备发送所述模型相关信息;向所述网络设备发送所述第一能力上报信息和所述模型相关信息;向所述网络设备发送第二能力上报信息,所述第二能力上报信息中包括所述模型相关信息;接收所述网络设备发送的模型注册指示信息或模型识别指示信息,根据所述模型注册指示信息或所述模型识别指示信息向所述网络设备发送所述模型相关信息。
- 根据权利要求29-39任一项所述的第一设备,其中,所述处理器还用于读取所述存储器中的计算机程序并执行以下操作:向所述网络设备上报所述第一模型的推理结果。
- 一种网络设备,包括存储器,收发机,处理器;存储器,用于存储计算机程序;收发机,用于在所述处理器的控制下收发数据;处理器,用于读取所述存储器中的计算机程序并执行以下操作:接收第一设备发送的模型相关信息,所述模型相关信息用于注册或识别第一模型,所述第一设备为终端或服务器;根据所述模型相关信息,向所述第一设备发送生命周期管理控制信息,所述生命周期管理控制信息用于对所述第一模型进行管理。
- 根据权利要求43所述的网络设备,其中,所述模型相关信息包括以下至少一项:所述第一模型对应的训练数据集相关的信息;所述第一模型的性能相关信息;所述第一模型输入和/或输出的量化信息;所述第一模型的共存能力相关信息;所述第一模型对应的一个或多个第二模型的相关信息,所述第二模型为所述网络设备的模型。
- 根据权利要求44所述的网络设备,其中,所述第一模型对应的训练数据集相关的信息,包括以下至少一项:所述训练数据集的性质或来源信息;所述训练数据集的标识;所述训练数据集的属性信息;所述训练数据集的数据收集的相关信息。
- 根据权利要求45所述的网络设备,其中,所述训练数据集的性质或来源信息用于指示以下至少一项:所述训练数据集为所述网络设备指示的训练数据集;所述训练数据集为预定义的训练数据集;所述训练数据集为所述终端使用的训练数据集;所述训练数据集为所述服务器使用的训练数据集;所述训练数据集的属性信息,包括以下至少一项:所述训练数据集的数量;所述训练数据集的大小;所述训练数据集收集的相关信息,包括以下至少一项:所述训练数据集的收集地点相关的信息;所述训练数据集的收集配置相关的信息;所述训练数据集的收集场景相关的信息。
- 根据权利要求44所述的网络设备,其中,所述性能相关信息包括所述模型的性能,和/或,所述性能相关信息的来源,其中:所述模型的性能包括以下至少一项:所述第一模型的推理输出相关的第一性能指标;在通信系统中应用所述第一模型的通信性能相关的第二性能指标;所述第一模型自身的第三性能指标;所述性能相关信息的来源用于指示所述性能相关信息为以下至少一项:所述第一设备预估的性能相关信息;所述第一设备测试的性能相关信息;通过网络设备检测的性能相关信息;预评测的性能相关信息。
- 根据权利要求47所述的网络设备,其中,所述第一性能指标为以下任意一项:若所述第一模型用于CSI压缩反馈,所述第一性能指标包括所述第一模型压缩恢复的信道与第一信道之间的相似程度;若所述第一模型用于CSI预测,所述第一性能指标包括所述第一模型预测的信道与所述第一信道之间的相似程度;若所述第一模型用于波束管理,所述第一性能指标包括:所述第一模型推理预测的波束为目标波束的概率,和/或,所述推理预测的波束的RSRP与所述目标波束的RSRP的差值;若所述第一模型用于定位,所述第一性能指标包括:所述第一模型推理的中间变量与实际中间变量之间的差值,和/或,所述第一模型推理的直射径和/或非直射径的准确率;所述第二性能指标为以下任意一项:若所述第一模型用于CSI压缩反馈,所述第二性能指标包括:使用所述第一模型进行CSI压缩反馈后系统吞吐率的变化,和/或,使用所述第一模型进行CSI压缩反馈后在相同误码率下所要求的SINR的变化;若所述第一模型用于CSI预测,所述第二性能指标包括:使用所述第一模型进行CSI预测后系统吞吐率的变化,和/或,使用所述第一模型进行CSI预测后在相同误码率下所要求的SINR的变化;若所述第一模型用于波束管理,所述第二性能指标包括:使用所述第一模型进行波束管理后系统吞吐率的变化,和/或,使用所述第一模型进行波束管理后在相同误码率下所要求的SINR的变化;若所述第一模型用于定位,所述第二性能指标为所述第一模型推理的位置与实际位置之间的偏差值;所述第三性能指标包括以下至少一项:所述第一模型进行一次推理所需要的参考时间;所述第一模型的复杂度;所述第一模型的泛化性能;所述第一模型的信息值,所述信息值用于指示所述第一模型的性能。
- 根据权利要求44所述的网络设备,其中,所述量化信息,包括以下至少一项:量化类型信息,所述量化类型信息包括量化度量相关信息,和/或,量化方法信息;归一化相关信息,所述归一化相关信息用于指示是否对所述第一模型的输入和/或输出进行归一化处理;所述第一模型的输入的单位;所述第一模型的输出的单位。
- 根据权利要求44所述的网络设备,其中,所述共存能力相关信息,包括以下至少一项:第一共存能力相关信息,所述第一共存能力相关信息用于指示允许与所述第一模型同时激活的模型,或者不允许与所述第一模型同时激活的模型;第二共存能力相关信息,第二共存能力相关信息用于指示允许与所述第一模型同时使用的非模型功能,或者不允许与所述第一模型同时使用的非模型功能。
- 根据权利要求50所述的网络设备,其中,所述第一共存能力相关信息,包括以下至少一项:允许与所述第一模型同时激活的模型列表;不允许与所述第一模型同时激活的模型列表;第一比特图,所述第一比特图用于指示对应的模型是否允许与所述第一模型同时激活;第一指示信息,所述第一指示信息用于指示是否存在不允许与所述第一模型同时激活的模型;所述第二共存能力相关信息,包括以下至少一项:允许与所述第一模型同时使用的非模型功能列表;不允许与所述第一模型同时使用的非模型功能列表;第二比特图,所述第二比特图用于指示对应的非模型功能是否允许与所述第一模型同时使用;第二指示信息,所述第二指示信息用于指示是否存在不允许与所述第一模型同时使用的非模型功能。
- 根据权利要求44所述的网络设备,其中,所述第二模型的相关信息,包括以下至少一项:所述第二模型的索引;所述第二模型的对应的使用场景;所述第二模型的对应的配置;所述第二模型的对应的地址;所述第二模型的性能相关信息。
- 根据权利要求52所述的网络设备,其中,所述第二模型满足以下至少一项:所述第二模型是所述第一设备进行训练并发送给所述网络设备的;所述第二模型是所述网络设备训练的,所述第一模型是所述第一设备训练的,且所述第一模型的训练数据集是所述网络设备发送给所述第一设备的;所述第二模型是预定义的模型;所述第二模型是所述网络设备指示的模型。
- 根据权利要求43-53任一项所述的网络设备,其中,所述生命周期管理控制信息包括以下至少一项:所述第一模型的激活指示信息;所述第一模型的去激活指示信息;模型选择指示信息;模型切换指示信息;回退至非模型功能的指示信息;所述第一模型的监控指示信息;所述第一模型的推理指示信息。
- 根据权利要求43-53任一项所述的网络设备,其中,所述接收第一设备发送的模型相关信息,包括以下至少一项:在接收所述第一设备发送的第一能力上报信息后,接收所述第一设备发送的所述模型相关信息;接收所述第一设备发送的所述第一能力上报信息和所述模型相关信息;接收所述第一设备发送的第二能力上报信息,所述第二能力上报信息中包括所述模型相关信息;向所述第一设备发送模型注册指示信息或模型识别指示信息,根据所述模型注册指示信息或所述模型识别指示信息接收所述第一设备发送的所述模型相关信息。
- 根据权利要求43-53任一项所述的网络设备,其中,所述处理器还用于读取所述存储器中的计算机程序并执行以下操作:接收所述第一设备上报的所述第一模型的推理结果。
- 一种管理模型的装置,所述装置包括:第一发送模块,用于向网络设备发送模型相关信息,所述模型相关信息用于注册或识别第一模型;第一接收模块,用于接收所述网络设备发送的生命周期管理控制信息,所述生命周期管理控制信息用于对所述第一模型进行管理。
- 根据权利要求57所述的管理模型的装置,其中,所述模型相关信息包括以下至少一项:所述第一模型对应的训练数据集相关的信息;所述第一模型的性能相关信息;所述第一模型输入和/或输出的量化信息;所述第一模型的共存能力相关信息;所述第一模型对应的一个或多个第二模型的相关信息,所述第二模型为所述网络设备的模型。
- 根据权利要求58所述的管理模型的装置,其中,所述第一模型对应的训练数据集相关的信息,包括以下至少一项:所述训练数据集的性质或来源信息;所述训练数据集的标识;所述训练数据集的属性信息;所述训练数据集的数据收集的相关信息。
- 根据权利要求59所述的管理模型的装置,其中,所述训练数据集的性质或来源信息用于指示以下至少一项:所述训练数据集为所述网络设备指示的训练数据集;所述训练数据集为预定义的训练数据集;所述训练数据集为所述终端使用的训练数据集;所述训练数据集为所述服务器使用的训练数据集;所述训练数据集的属性信息,包括以下至少一项:所述训练数据集的数量;所述训练数据集的大小;所述训练数据集收集的相关信息,包括以下至少一项:所述训练数据集的收集地点相关的信息;所述训练数据集的收集配置相关的信息;所述训练数据集的收集场景相关的信息。
- 根据权利要求58所述的管理模型的装置,其中,所述性能相关信息包括模型的性能,和/或,所述性能相关信息的来源,其中:所述模型的性能包括以下至少一项:所述第一模型的推理输出相关的第一性能指标;在通信系统中应用所述第一模型的通信性能相关的第二性能指标;所述第一模型自身的第三性能指标;所述性能相关信息的来源用于指示所述性能相关信息为以下至少一项:所述第一设备预估的性能相关信息;所述第一设备测试的性能相关信息;通过网络设备检测的性能相关信息;预评测的性能相关信息。
- 根据权利要求61所述的管理模型的装置,其中,所述第一性能指标为以下任意一项:若所述第一模型用于CSI压缩反馈,所述第一性能指标包括所述第一模型压缩恢复的信道与第一信道之间的相似程度;若所述第一模型用于CSI预测,所述第一性能指标包括所述第一模型预测的信道与所述第一信道之间的相似程度;若所述第一模型用于波束管理,所述第一性能指标包括:所述第一模型推理预测的波束为目标波束的概率,和/或,所述推理预测的波束的RSRP与所述目标波束的RSRP的差值;若所述第一模型用于定位,所述第一性能指标包括:所述第一模型推理的中间变量与实际中间变量之间的差值,和/或,所述第一模型推理的直射径和/或非直射径的准确率;所述第二性能指标为以下任意一项:若所述第一模型用于CSI压缩反馈,所述第二性能指标包括:使用所述第一模型进行CSI压缩反馈后系统吞吐率的变化,和/或,使用所述第一模型进行CSI压缩反馈后在相同误码率下所要求的SINR的变化;若所述第一模型用于CSI预测,所述第二性能指标包括:使用所述第一模型进行CSI预测后系统吞吐率的变化,和/或,使用所述第一模型进行CSI预测后在相同误码率下所要求的SINR的变化;若所述第一模型用于波束管理,所述第二性能指标包括:使用所述第一模型进行波束管理后系统吞吐率的变化,和/或,使用所述第一模型进行波束管理后在相同误码率下所要求的SINR的变化;若所述第一模型用于定位,所述第二性能指标为所述第一模型推理的位置与实际位置之间的偏差值;所述第三性能指标包括以下至少一项:所述第一模型进行一次推理所需要的参考时间;所述第一模型的复杂度;所述第一模型的泛化性能;所述第一模型的信息值,所述信息值用于指示所述第一模型的性能。
- 根据权利要求58所述的管理模型的装置,其中,所述量化信息,包括以下至少一项:量化类型信息,所述量化类型信息包括量化度量相关信息,和/或,量化方法信息;归一化相关信息,所述归一化相关信息用于指示是否对所述第一模型的输入和/或输出进行归一化处理;所述第一模型的输入的单位;所述第一模型的输出的单位。
- 根据权利要求58所述的管理模型的装置,其中,所述共存能力相关信息,包括以下至少一项:第一共存能力相关信息,所述第一共存能力相关信息用于指示允许与所述第一模型同时激活的模型,或者不允许与所述第一模型同时激活的模型;第二共存能力相关信息,第二共存能力相关信息用于指示允许与所述第一模型同时使用的非模型功能,或者不允许与所述第一模型同时使用的非模型功能。
- 根据权利要求64所述的管理模型的装置,其中,所述第一共存能力相关信息,包括以下至少一项:允许与所述第一模型同时激活的模型列表;不允许与所述第一模型同时激活的模型列表;第一比特图,所述第一比特图中的每个比特用于指示对应的模型是否允许与所述第一模型同时激活;第一指示信息,所述第一指示信息用于指示是否存在不允许与所述第一模型同时激活的模型;所述第二共存能力相关信息,包括以下至少一项:允许与所述第一模型同时使用的非模型功能列表;不允许与所述第一模型同时使用的非模型功能列表;第二比特图,所述第二比特图中的每个比特用于指示对应的非模型功能是否允许与所述第一模型同时使用;第二指示信息,所述第二指示信息用于指示是否存在不允许与所述第一 模型同时使用的非模型功能。
- 根据权利要求58所述的管理模型的装置,其中,所述第二模型的相关信息,包括以下至少一项:所述第二模型的索引;所述第二模型的对应的使用场景;所述第二模型的对应的配置;所述第二模型的对应的地址;所述第二模型的性能相关信息。
- 根据权利要求66所述的管理模型的装置,其中,所述第二模型满足以下至少一项:所述第二模型是所述第一设备进行训练并发送给所述网络设备的;所述第二模型是所述网络设备训练的,所述第一模型是所述第一设备训练的,且所述第一模型的训练数据集是所述网络设备发送给所述第一设备的;所述第二模型是预定义的模型;所述第二模型是所述网络设备指示的模型。
- 根据权利要求57-67任一项所述的管理模型的装置,其中,所述生命周期管理控制信息包括以下至少一项:所述第一模型的激活指示信息;所述第一模型的去激活指示信息;模型选择指示信息;模型切换指示信息;回退至非模型功能的指示信息;所述第一模型的监控指示信息;所述第一模型的推理指示信息。
- 根据权利要求57-67任一项所述的管理模型的装置,其中,所述第一发送模块具体用于以下至少一项:在向所述网络设备发送第一能力上报信息后,向所述网络设备发送所述模型相关信息;向所述网络设备发送所述第一能力上报信息和所述模型相关信息;向所述网络设备发送第二能力上报信息,所述第二能力上报信息中包括 所述模型相关信息;接收所述网络设备发送的模型注册指示信息或模型识别指示信息,根据所述模型注册指示信息或所述模型识别指示信息向所述网络设备发送所述模型相关信息。
- 根据权利要求57-67任一项所述的管理模型的装置,其中,所述第一发送模块还用于:向所述网络设备上报所述第一模型的推理结果。
- 一种管理模型的装置,所述装置包括:第二接收模块,用于接收第一设备发送的模型相关信息,所述模型相关信息用于注册或识别第一模型,所述第一设备为终端或服务器;第二发送模块,用于根据所述模型相关信息,向所述第一设备发送生命周期管理控制信息,所述生命周期管理控制信息用于对所述第一模型进行管理。
- 根据权利要求71所述的管理模型的装置,其中,所述模型相关信息包括以下至少一项:所述第一模型对应的训练数据集相关的信息;所述第一模型的性能相关信息;所述第一模型输入和/或输出的量化信息;所述第一模型的共存能力相关信息;所述第一模型对应的一个或多个第二模型的相关信息,所述第二模型为所述网络设备的模型。
- 根据权利要求72所述的管理模型的装置,其中,所述第一模型对应的训练数据集相关的信息,包括以下至少一项:所述训练数据集的性质或来源信息;所述训练数据集的标识;所述训练数据集的属性信息;所述训练数据集的数据收集的相关信息。
- 根据权利要求73所述的管理模型的装置,其中,所述训练数据集的性质或来源信息用于指示以下至少一项:所述训练数据集为所述网络设备指示的训练数据集;所述训练数据集为预定义的训练数据集;所述训练数据集为所述终端使用的训练数据集;所述训练数据集为所述服务器使用的训练数据集;所述训练数据集的属性信息,包括以下至少一项:所述训练数据集的数量;所述训练数据集的大小;所述训练数据集收集的相关信息,包括以下至少一项:所述训练数据集的收集地点相关的信息;所述训练数据集的收集配置相关的信息;所述训练数据集的收集场景相关的信息。
- 根据权利要求72所述的管理模型的装置,其中,所述性能相关信息包括所述模型的性能,和/或,所述性能相关信息的来源,其中:所述模型的性能包括以下至少一项:所述第一模型的推理输出相关的第一性能指标;在通信系统中应用所述第一模型的通信性能相关的第二性能指标;所述第一模型自身的第三性能指标;所述性能相关信息的来源用于指示所述性能相关信息为以下至少一项:所述第一设备预估的性能相关信息;所述第一设备测试的性能相关信息;通过网络设备检测的性能相关信息;预评测的性能相关信息。
- 根据权利要求75所述的管理模型的装置,其中,所述第一性能指标为以下任意一项:若所述第一模型用于CSI压缩反馈,所述第一性能指标包括所述第一模型压缩恢复的信道与第一信道之间的相似程度;若所述第一模型用于CSI预测,所述第一性能指标包括所述第一模型预测的信道与所述第一信道之间的相似程度;若所述第一模型用于波束管理,所述第一性能指标包括:所述第一模型推理预测的波束为目标波束的概率,和/或,所述推理预测的波束的RSRP与所述目标波束的RSRP的差值;若所述第一模型用于定位,所述第一性能指标包括:所述第一模型推理的中间变量与实际中间变量之间的差值,和/或,所述第一模型推理的直射径和/或非直射径的准确率;所述第二性能指标为以下任意一项:若所述第一模型用于CSI压缩反馈,所述第二性能指标包括:使用所述第一模型进行CSI压缩反馈后系统吞吐率的变化,和/或,使用所述第一模型进行CSI压缩反馈后在相同误码率下所要求的SINR的变化;若所述第一模型用于CSI预测,所述第二性能指标包括:使用所述第一模型进行CSI预测后系统吞吐率的变化,和/或,使用所述第一模型进行CSI预测后在相同误码率下所要求的SINR的变化;若所述第一模型用于波束管理,所述第二性能指标包括:使用所述第一模型进行波束管理后系统吞吐率的变化,和/或,使用所述第一模型进行波束管理后在相同误码率下所要求的SINR的变化;若所述第一模型用于定位,所述第二性能指标为所述第一模型推理的位置与实际位置之间的偏差值;所述第三性能指标包括以下至少一项:所述第一模型进行一次推理所需要的参考时间;所述第一模型的复杂度;所述第一模型的泛化性能;所述第一模型的信息值,所述信息值用于指示所述第一模型的性能。
- 根据权利要求72所述的管理模型的装置,其中,所述量化信息,包括以下至少一项:量化类型信息,所述量化类型信息包括量化度量相关信息,和/或,量化方法信息;归一化相关信息,所述归一化相关信息用于指示是否对所述第一模型的输入和/或输出进行归一化处理;所述第一模型的输入的单位;所述第一模型的输出的单位。
- 根据权利要求72所述的管理模型的装置,其中,所述共存能力相关信息,包括以下至少一项:第一共存能力相关信息,所述第一共存能力相关信息用于指示允许与所述第一模型同时激活的模型,或者不允许与所述第一模型同时激活的模型;第二共存能力相关信息,第二共存能力相关信息用于指示允许与所述第一模型同时使用的非模型功能,或者不允许与所述第一模型同时使用的非模型功能。
- 根据权利要求78所述的管理模型的装置,其中,所述第一共存能力相关信息,包括以下至少一项:允许与所述第一模型同时激活的模型列表;不允许与所述第一模型同时激活的模型列表;第一比特图,所述第一比特图用于指示对应的模型是否允许与所述第一模型同时激活;第一指示信息,所述第一指示信息用于指示是否存在不允许与所述第一模型同时激活的模型;所述第二共存能力相关信息,包括以下至少一项:允许与所述第一模型同时使用的非模型功能列表;不允许与所述第一模型同时使用的非模型功能列表;第二比特图,所述第二比特图用于指示对应的非模型功能是否允许与所述第一模型同时使用;第二指示信息,所述第二指示信息用于指示是否存在不允许与所述第一模型同时使用的非模型功能。
- 根据权利要求72所述的管理模型的装置,其中,所述第二模型的相关信息,包括以下至少一项:所述第二模型的索引;所述第二模型的对应的使用场景;所述第二模型的对应的配置;所述第二模型的对应的地址;所述第二模型的性能相关信息。
- 根据权利要求80所述的管理模型的装置,其中,所述第二模型满足以下至少一项:所述第二模型是所述第一设备进行训练并发送给所述网络设备的;所述第二模型是所述网络设备训练的,所述第一模型是所述第一设备训练的,且所述第一模型的训练数据集是所述网络设备发送给所述第一设备的;所述第二模型是预定义的模型;所述第二模型是所述网络设备指示的模型。
- 根据权利要求71-81任一项所述的管理模型的装置,其中,所述生命周期管理控制信息包括以下至少一项:所述第一模型的激活指示信息;所述第一模型的去激活指示信息;模型选择指示信息;模型切换指示信息;回退至非模型功能的指示信息;所述第一模型的监控指示信息;所述第一模型的推理指示信息。
- 根据权利要求71-81任一项所述的管理模型的装置,其中,所述第二接收模块具体用于以下至少一项:在接收所述第一设备发送的第一能力上报信息后,接收所述第一设备发送的所述模型相关信息;接收所述第一设备发送的所述第一能力上报信息和所述模型相关信息;接收所述第一设备发送的第二能力上报信息,所述第二能力上报信息中包括所述模型相关信息;向所述第一设备发送模型注册指示信息或模型识别指示信息,根据所述模型注册指示信息或所述模型识别指示信息接收所述第一设备发送的所述模型相关信息。
- 根据权利要求71-81任一项所述的管理模型的装置,其中,所述第二接收模块还用于:接收所述第一设备上报的所述第一模型的推理结果。
- 一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序用于使计算机执行权利要求1至14中的任一项所述的管理模型的方法,或者,所述计算机程序用于使计算机执行权利要求15至28中的任一项所述的管理模型的方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211380043.8A CN117997770A (zh) | 2022-11-04 | 2022-11-04 | 管理模型的方法、装置及设备 |
CN202211380043.8 | 2022-11-04 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2024093483A1 true WO2024093483A1 (zh) | 2024-05-10 |
Family
ID=90891696
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/CN2023/115787 WO2024093483A1 (zh) | 2022-11-04 | 2023-08-30 | 管理模型的方法、装置及设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN117997770A (zh) |
WO (1) | WO2024093483A1 (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112423382A (zh) * | 2020-11-09 | 2021-02-26 | 江苏第二师范学院(江苏省教育科学研究院) | 基于5g网络的模型管理方法及使用nrf的注册和更新方法 |
US20220180248A1 (en) * | 2017-08-18 | 2022-06-09 | Groupon, Inc. | Method, apparatus, and computer program product for machine learning model lifecycle management |
CN114745712A (zh) * | 2021-01-07 | 2022-07-12 | 中国移动通信有限公司研究院 | 基于终端能力的处理方法、装置、终端及网络设备 |
CN114788317A (zh) * | 2022-03-14 | 2022-07-22 | 北京小米移动软件有限公司 | 信息处理方法及装置、通信设备及存储介质 |
CN114930945A (zh) * | 2020-01-14 | 2022-08-19 | Oppo广东移动通信有限公司 | 信息上报方法、装置、设备和存储介质 |
-
2022
- 2022-11-04 CN CN202211380043.8A patent/CN117997770A/zh active Pending
-
2023
- 2023-08-30 WO PCT/CN2023/115787 patent/WO2024093483A1/zh unknown
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220180248A1 (en) * | 2017-08-18 | 2022-06-09 | Groupon, Inc. | Method, apparatus, and computer program product for machine learning model lifecycle management |
CN114930945A (zh) * | 2020-01-14 | 2022-08-19 | Oppo广东移动通信有限公司 | 信息上报方法、装置、设备和存储介质 |
CN112423382A (zh) * | 2020-11-09 | 2021-02-26 | 江苏第二师范学院(江苏省教育科学研究院) | 基于5g网络的模型管理方法及使用nrf的注册和更新方法 |
CN114745712A (zh) * | 2021-01-07 | 2022-07-12 | 中国移动通信有限公司研究院 | 基于终端能力的处理方法、装置、终端及网络设备 |
CN114788317A (zh) * | 2022-03-14 | 2022-07-22 | 北京小米移动软件有限公司 | 信息处理方法及装置、通信设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN117997770A (zh) | 2024-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11451452B2 (en) | Model update method and apparatus, and system | |
EP4057559A1 (en) | Method for determining channel information, network device and terminal device | |
WO2020143657A1 (zh) | 信道和干扰测量方法和设备 | |
US20230328566A1 (en) | Csi measurement reporting method, terminal, and network-side device | |
US20230276529A1 (en) | Service processing method, information indication method, terminal and network device | |
EP4412098A1 (en) | Beam measurement method, measurement configuration method, and apparatus, terminal and network device | |
US20240031973A1 (en) | Positioning method and apparatus, and terminal and device | |
JP7484008B2 (ja) | ビーム指示方法、ネットワークデバイス、端末、装置及び記憶媒体 | |
WO2024093483A1 (zh) | 管理模型的方法、装置及设备 | |
WO2022022565A1 (zh) | 测量结果上报方法、接收方法、终端和网络设备 | |
WO2024099243A1 (zh) | 模型监测方法、装置、终端及网络侧设备 | |
WO2024169620A1 (zh) | 一种信息处理方法、相关设备和存储介质 | |
WO2024164799A1 (zh) | 定位数据的搜集方法及装置 | |
WO2024152826A1 (zh) | 波束失败检测方法、装置、终端、第一节点及网络设备 | |
WO2024169462A1 (zh) | 模型监控方法、装置、终端及网络侧设备 | |
WO2024067098A1 (zh) | 模型信息上报方法、设备、装置及存储介质 | |
WO2024032764A1 (zh) | 信息处理方法、装置、节点设备及介质 | |
WO2024067067A1 (zh) | 下行波束预测方法、设备、装置及存储介质 | |
WO2019095158A1 (zh) | 无线通信方法和设备 | |
WO2024140078A1 (zh) | 连续条件小区接入方法、装置及存储介质 | |
WO2024066620A1 (zh) | 波束指示方法、装置及存储介质 | |
WO2024164893A1 (zh) | 一种信息处理方法、设备及可读存储介质 | |
WO2024139264A1 (zh) | 波束指示方法、装置及设备 | |
WO2024168904A1 (zh) | Ai模型的性能监测方法、装置、设备及存储介质 | |
WO2024169693A1 (zh) | 信号传输方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 23884420 Country of ref document: EP Kind code of ref document: A1 |