WO2023098585A1 - 信息传输方法、装置及通信设备 - Google Patents
信息传输方法、装置及通信设备 Download PDFInfo
- Publication number
- WO2023098585A1 WO2023098585A1 PCT/CN2022/134307 CN2022134307W WO2023098585A1 WO 2023098585 A1 WO2023098585 A1 WO 2023098585A1 CN 2022134307 W CN2022134307 W CN 2022134307W WO 2023098585 A1 WO2023098585 A1 WO 2023098585A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- computing
- time
- model
- communication device
- complexity
- Prior art date
Links
- 238000004891 communication Methods 0.000 title claims abstract description 159
- 238000000034 method Methods 0.000 title claims abstract description 82
- 230000005540 biological transmission Effects 0.000 title claims abstract description 46
- 238000013473 artificial intelligence Methods 0.000 claims abstract description 230
- 230000006870 function Effects 0.000 claims description 44
- 238000004364 calculation method Methods 0.000 claims description 28
- 238000007792 addition Methods 0.000 claims description 21
- 238000012546 transfer Methods 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 10
- 238000012545 processing Methods 0.000 description 9
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000004590 computer program Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000001360 synchronised effect Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 230000003190 augmentative effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000013140 knowledge distillation Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000013138 pruning Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0803—Configuration setting
- H04L41/0823—Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/16—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using machine learning or artificial intelligence
Definitions
- the first communication device sends the first information of the artificial intelligence AI model to the second communication device; wherein the first information includes at least one of the following:
- FIG. 3 shows a schematic structural diagram of an information transmission device provided in an embodiment of the present application
- FIG. 4 shows a schematic structural diagram of a communication device provided by an embodiment of the present application
- LTE Long Term Evolution
- LTE-Advanced LTE-Advanced
- LTE-A Long Term Evolution-Advanced
- CDMA Code Division Multiple Access
- TDMA Time Division Multiple Access
- FDMA Frequency Division Multiple Access
- OFDMA Orthogonal Frequency Division Multiple Access
- SC-FDMA Single-carrier Frequency Division Multiple Access
- the first communication device may be a network side device or a terminal
- the second communication device may also be a network side device or a terminal.
- the first communication device is a network side device
- the second communication device is a terminal
- the first communication device is a terminal
- the second communication device is a network side device.
- the computing time of the AI model includes at least one of the following:
- the first communication device may include one AI model, or may include multiple AI models. If the first communication device includes an AI model, and the AI model has a calculation time or a complexity, then the calculation time or complexity of the AI model in the first information sent by the first communication device is an operation corresponding to the AI model time or a complexity.
- the first communication device includes multiple AI models belonging to different functions, and the multiple AI models have multiple complexities.
- K1, K2, K3, K4, K5, K6, K7, K8 and K9 are all integers greater than or equal to 1.
- the complexity information of the AI model in the first information includes any of the following:
- the joint calculation time when the joint calculation of the multiple AI models includes a non-AI calculation unit, the joint calculation time also includes:
- the tenth time when the fourth module reads data from the input interface of the fourth module is the tenth time when the fourth module reads data from the input interface of the fourth module.
- the method also includes:
- FIG. 3 is a schematic structural diagram of an information transmission device 300 provided in an embodiment of the present application.
- the information transmission device 300 is applied to a first communication device and includes:
- L1, L2, L3, L4, L5, L6, L7, L8 and L9 are all integers greater than or equal to 1.
- the running time of the non-AI computing unit includes at least one of the following:
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Telephonic Communication Services (AREA)
- Computer And Data Communications (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本申请公开了一种信息传输方法、装置及通信设备,属于通信技术领域,本申请实施例的信息传输方法包括:第一通信设备向第二通信设备发送人工智能AI模型的第一信息;其中,所述第一信息包括以下至少一项:AI模型的运算时间信息;AI模型的运算时间是否满足预设要求;AI模型的复杂度信息;满足时间轴要求的前提下允许的AI模型的最大复杂度。
Description
相关申请的交叉引用
本申请主张在2021年11月30日在中国提交的中国专利申请No.202111447089.2的优先权,其全部内容通过引用包含于此。
本申请属于通信技术领域,具体涉及一种信息传输方法、装置及通信设备。
人工智能(Artificial Intelligence,AI)目前在各个领域获得了广泛的应用。AI模型有多种实现方式,例如神经神经网络、决策树、支持向量机、贝叶斯分类器等。
以神经网络为例(但是并不限定AI模型的具体类型)。其中,神经网络由神经元组成。神经网络的参数通过优化算法进行优化。优化算法就是一种最小化或者最大化目标函数(或者称为损失函数)的一类算法。而目标函数是模型参数和数据的数学组合。例如给定数据X和其对应的标签Y,构建一个神经网络模型f(.),有了模型后,根据输入x就可以得到预测输出f(x),并且可以计算出预测值和真实值之间的差距(f(x)-Y),这个就是损失函数。优化算法的目的是找到合适的参数使上述的损失函数的值达到最小,损失值越小,则说明模型越接近于真实情况。
目前常见的优化算法,基本都是基于误差反向传播(error Back Propagation,BP)算法。BP算法的基本思想是,学习过程由信号的正向传播与误差的反向传播两个过程组成。正向传播时,输入样本从输入层传入,经各隐层逐层处理后,传向输出层。若输出层的实际输出与期望的输出不符,则转入误差的反向传播阶段。误差反传是将输出误差以某种形式通过隐层向输入层逐层反传,并将误差分摊给各层的所有单元,从而获得各层单元的误差信号,此误差信号即作为修正各单元权值的依据。这种信号正向传播与误 差反向传播的各层权值调整过程,是周而复始地进行的。权值不断调整的过程,也就是网络的学习训练过程。此过程一直进行到网络输出的误差减少到可接受的程度,或进行到预先设定的学习次数为止。
但由于不同终端算力不同、不同AI模型的复杂度不同,容易导致终端或网络侧设备使用的AI模型的复杂度不合适的问题,从而影响通信系统性能。
发明内容
本申请实施例提供一种信息传输方法、装置及通信设备,能够解决相关技术中终端或网络侧设备使用的AI模型的复杂度不合适的问题。
第一方面,提供了一种信息传输方法,包括:
第一通信设备向第二通信设备发送人工智能AI模型的第一信息;其中,所述第一信息包括以下至少一项:
AI模型的运算时间信息;
AI模型的运算时间是否满足预设要求;
AI模型的复杂度信息;
满足时间轴要求的前提下允许的AI模型的最大复杂度。
第二方面,提供了一种信息传输装置,应用于第一通信设备,包括:
发送模块,用于向第二通信设备发送人工智能AI模型的第一信息;其中,所述第一信息包括以下至少一项:
AI模型的运算时间信息;
AI模型的运算时间是否满足预设要求;
AI模型的复杂度信息;
满足时间轴要求的前提下允许的AI模型的最大复杂度。
第三方面,提供了一种通信设备,该通信设备包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。
第四方面,提供了一种通信设备,包括处理器及通信接口,其中,所述处理器用于确定AI模型的第一信息,所述通信接口用于向第二通信设备发送人工智能AI模型的第一信息;其中,所述第一信息包括以下至少一项:
AI模型的运算时间信息;
AI模型的运算时间是否满足预设要求;
AI模型的复杂度信息;
满足时间轴要求的前提下允许的AI模型的最大复杂度。
第五方面,提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。
第六方面,提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法。
第七方面,提供了一种计算机程序/程序产品,所述计算机程序/程序产品被存储在存储介质中,所述计算机程序/程序产品被至少一个处理器执行以实现如第一方面所述的方法的步骤。
在本申请实施例中,第一通信设备向第二通信设备发送AI模型的运算时间相关信息和/或复杂度相关信息,使得第一通信设备和第二通信设备能够对齐运算时间和复杂度,来确定合适的AI模型,从而改善通信系统中AI模型的性能,进一步提升系统性能。
图1表示本申请实施例可应用的一种无线通信系统的框图;
图2表示本申请实施例提供的信息传输方法的步骤示意图;
图3表示本申请实施例提供的信息传输装置的结构示意图;
图4表示本申请实施例提供的通信设备的结构示意图;
图5表示本申请实施例提供的终端的结构示意图;
图6表示本申请实施例提供的网络侧设备的结构示意图。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员所获得的所有其他实施 例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”所区别的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”一般表示前后关联对象是一种“或”的关系。
值得指出的是,本申请实施例所描述的技术不限于长期演进型(Long Term Evolution,LTE)/LTE的演进(LTE-Advanced,LTE-A)系统,还可用于其他无线通信系统,诸如码分多址(Code Division Multiple Access,CDMA)、时分多址(Time Division Multiple Access,TDMA)、频分多址(Frequency Division Multiple Access,FDMA)、正交频分多址(Orthogonal Frequency Division Multiple Access,OFDMA)、单载波频分多址(Single-carrier Frequency Division Multiple Access,SC-FDMA)和其他系统。本申请实施例中的术语“系统”和“网络”常被可互换地使用,所描述的技术既可用于以上提及的系统和无线电技术,也可用于其他系统和无线电技术。以下描述出于示例目的描述了新空口(New Radio,NR)系统,并且在以下大部分描述中使用NR术语,但是这些技术也可应用于NR系统应用以外的应用,如第6代(6
th Generation,6G)通信系统。
图1示出本申请实施例可应用的一种无线通信系统的框图。无线通信系统包括终端11和网络侧设备12。其中,终端11可以是手机、平板电脑(Tablet Personal Computer)、膝上型电脑(Laptop Computer)或称为笔记本电脑、个人数字助理(Personal Digital Assistant,PDA)、掌上电脑、上网本、超级移动个人计算机(ultra-mobile personal computer,UMPC)、移动上网装置(Mobile Internet Device,MID)、增强现实(augmented reality,AR)/虚拟现实(virtual reality,VR)设备、机器人、可穿戴式设备(Wearable Device)、车载设备(Vehicle User Equipment,VUE)、行人终端(Pedestrian User Equipment,PUE)、智能家居(具有无线通信功能的家居设备,如冰箱、电视、洗衣机或者家具等)、 游戏机、个人计算机(personal computer,PC)、柜员机或者自助机等终端侧设备,可穿戴式设备包括:智能手表、智能手环、智能耳机、智能眼镜、智能首饰(智能手镯、智能手链、智能戒指、智能项链、智能脚镯、智能脚链等)、智能腕带、智能服装等。需要说明的是,在本申请实施例并不限定终端11的具体类型。网络侧设备12可以包括接入网设备或核心网设备,其中,接入网设备12也可以称为无线接入网设备、无线接入网(Radio Access Network,RAN)、无线接入网功能或无线接入网单元。接入网设备12可以包括基站、无线局域网(Wireless Local Area Network,WLAN)接入点或WiFi节点等,基站可被称为节点B、演进节点B(Evolved Node B,eNB)、接入点、基收发机站(Base Transceiver Station,BTS)、无线电基站、无线电收发机、基本服务集(Basic Service Set,BSS)、扩展服务集(Extended Service Set,ESS)、家用B节点、家用演进型B节点、发送接收点(Transmitting Receiving Point,TRP)或所述领域中其他某个合适的术语,只要达到相同的技术效果,所述基站不限于特定技术词汇,需要说明的是,在本申请实施例中仅以NR系统中的基站为例进行介绍,并不限定基站的具体类型。
下面结合附图,通过一些实施例及其应用场景对本申请实施例提供的信息传输方法、装置及通信设备进行详细地说明。
请参见图2,图2为本申请实施例提供的信息传输方法的步骤示意图,该信息传输方法包括:
步骤201,第一通信设备向第二通信设备发送人工智能AI模型的第一信息;其中,所述第一信息包括以下至少一项:
AI模型的运算时间信息;
AI模型的运算时间是否满足预设要求;可选地,在AI模型的运算时间满足预设要求的情况下发送指示,或者,在AI模型的运算时间不满足预设要求的情况下发送指示,或者,无论AI模型是否满足预设要求均发送指示;
AI模型的复杂度信息;
满足时间轴(timeline)要求的前提下允许的AI模型的最大复杂度。
作为一个可选实施例,第一通信设备可以为网络侧设备或终端,第二通信设备也可以为网络侧设备或终端。例如,第一通信设备为网络侧设备,第 二通信设备为终端;再例如,第一通信设备为终端,第二通信设备为网络侧设备。
可选地,上述AI模型可以是第一通信设备使用过的AI模型或第一通信设备目前使用的AI模型。
在本申请的至少一个实施例中,所述AI模型的运算时间包括以下至少之一:
AI模型在AI运算单元的第一运算时间,也可以称为AI模型本身运算时间;以及,
数据传输时间,即AI模型处理的相关数据的数据传输时间。
需要说明的是,上述AI运算单元用于AI模型的运算或推理或运行或计算,可以是一种单元、模块、芯片或硬件,在此不做具体限定。
作为一个可选实施例,所述数据传输时间包括以下至少之一:
输入数据从第一模块到AI运算单元输入接口的第一时间;
AI运算单元从输入接口读取数据的第二时间;
AI运算单元将数据输出到输出接口的第三时间;
输出数据从输出接口到第二模块的第四时间;
第二模块从所述第二模块的输入接口读取数据的第五时间。
其中,上述第一模块为输入数据的来源模块,而上述第二模块为输出数据的目的模块。该第一模块可以是AI运算单元,也可以是非AI元素单元,或者,第二模块可以是AI运算单元,也可以是非AI运算单元;在此不做具体限定。
可选地,非AI运算单元为用于非AI功能的单元、模块、芯片、硬件。
在本申请的至少一个可选实施例中,所述AI模型的复杂度包括以下任意一项:
AI模型的总运算次数;
AI模型的总计算次数;
AI模型的总操作(Operation,OP)次数。
在第一通信设备确定AI模型的复杂度的情况下,所述方法还包括以下至少一项:
以OP为基础,将AI模型的所有运算折算为OP次数;
以乘法或加法为基础,将AI模型的所有运算折算为乘法次数或加法次数;
将AI模型的非线性函数折算为OP次数;例如,常见激活函数ReLU,折算为3个OP;
将AI模型的非线性函数折算为乘法次数或加法次数。
其中,“以OP为基础,将AI模型的所有运算折算为OP次数”可以理解为:一般将一次乘法或一次加法记为一次OP。当然,也可以约定一次乘法或加法为多个OP。目前,一般网络处理器(Network Processing Unit,NPU)使用每秒浮点运算次数(floating-point operations per second,FLOPS,即每秒所执行的浮点运算次数)来表示网络处理器NPU或图形处理器(Graphics Processing Unit,GPU)计算能力。浮点运算包括了所有涉及小数的运算,比整数运算更费时间。一般常用TFLOPS(Tops)作为衡量NPU/GPU性能/算力的指标,比如海思3519AV100芯片的算力为1.7Tops,TFLOPS表征每秒万亿次浮点运算(teraFLOPS)。
上述“以乘法或加法为基础,将AI模型的所有运算折算为乘法次数或加法次数”可以理解为:虽然当前衡量AI模型复杂度、NPU/GPU能力时,认为一次乘法和一次加法的复杂度相同,但实际由于芯片实现等因素,乘法和加法的复杂度可能不同。例如,记一次加法为1个OP,而乘法为M个OP(M为正实数,如M=1.2)。
可选地,不同非线性函数,折算的OP次数或乘法次数或加法次数可以不同。如,ReLU折算的OP次数小于Sigmiod折算的OP次数。
可选地,不同硬件,对于同一非线性函数,折算的OP或乘法次数或加法次数可以不同。
在本申请的至少一个实施例中,第一通信设备可以包含一个AI模型,也可以包含多个AI模型。若第一通信设备包含一个AI模型,且该AI模型具有一个运算时间或一个复杂度,则第一通信设备发送的第一信息中AI模型的运算时间或复杂度为该AI模型对应的一个运算时间或一个复杂度。
在本申请的另一个可选实施例中第一通信设备可能包括多个运算时间或多个复杂度,第一通信设备包括多个运算时间或多个复杂度的场景包括:
场景1,所述第一通信设备包括单个AI模型,该单个AI模型具有多个运算时间;例如,第一通信设备具有多个AI运算单元时,则单个AI模型具有多个运算时间;再例如,第一通信设备需要对AI模型进行简化时,则单个AI模型具有多个运算时间。其中,对AI模型进行简化可以理解为:使用知识蒸馏、剪枝、低秩近似、量化等方式,在保证性能基本相同的情况下,对AI模型进行简化、瘦身;当然,也可以使AI模型更加复杂,来提升性能;
场景2,所述第一通信设备包括属于相同功能的多个AI模型,该多个AI模型具有多个运算时间;例如,对于某个功能或通信模块,第二通信设备下发多个AI模型,或者协议约定多个AI模型,或者第一通信设备端自有多个AI模型,或者第二通信设备下发+协议约定+第一通信设备自有的AI模型的数量多于1;
场景3,所述第一通信设备包括单个AI模型,该单个AI模型具有多个复杂度;例如,第一通信设备具有多个AI运算单元时,则单个AI模型具有多个复杂度;再例如,第一通信设备需要对AI模型进行简化时,则单个AI模型具有多个复杂度。其中,对AI模型进行简化可以理解为:使用知识蒸馏、剪枝、低秩近似、量化等方式,在保证性能基本相同的情况下,对AI模型进行简化、瘦身;当然,也可以使AI模型更加复杂,来提升性能;
场景4,所述第一通信设备包括属于相同功能的多个AI模型,该多个AI模型具有多个复杂度;例如,对于某个功能或通信模块,第二通信设备下发多个AI模型,或者协议约定多个AI模型,或者第一通信设备端自有多个AI模型,或者第二通信设备下发+协议约定+第一通信设备自有的AI模型的数量多于1;
场景5,所述第一通信设备包括属于不同功能的多个AI模型,该多个AI模型具有多个运算时间;
场景6,所述第一通信设备包括属于不同功能的多个AI模型,该多个AI模型具有多个复杂度。
作为一个可选实施例,针对场景1和场景2,所述第一信息中AI模型的运算时间信息包括以下任意一项:
所有运算时间;
多个运算时间中最长的K1个运算时间;
多个运算时间中最短的K2个运算时间;
多个运算时间中最长的K3个运算时间和最短的K4个运算时间;
所有运算时间的平均值;
多个运算时间中最长的K5个运算时间的平均值;
多个运算时间中最短的K6个运算时间的平均值;
多个运算时间中最长的K7个运算时间和最短的K8个运算时间的平均值;
所述第一通信设备选择的K9个运算时间;
其中,K1,K2,K3,K4,K5,K6,K7,K8以及K9均为大于或者等于1的整数。
作为另一个可选实施例,针对场景3和场景4,所述第一信息中AI模型的复杂度信息包括以下任意一项:
所有复杂度;
多个复杂度中复杂度最高的L1个复杂度;
多个复杂度中复杂度最低的L2个复杂度;
多个复杂度中复杂度最高的L3个复杂度和复杂度最低的L4个复杂度;
所有复杂度的平均值;
多个复杂度中复杂度最高的L5个复杂度的平均值;
多个复杂度中复杂度最低的L6个复杂度的平均值;
多个复杂度中复杂度最高的L7个复杂度和复杂度最低的L8个复杂度的平均值;
所述第一通信设备选的L9个复杂度;
其中,L1,L2,L3,L4,L5,L6,L7,L8以及L9均为大于或者等于1的整数。
作为另一个可选实施例,针对场景5和场景6,在所述第一通信设备包括属于不同功能的多个AI模型的情况下,
所述第一信息中AI模型的运算时间信息包括:多个AI模型的联合运算时间,所述联合运算时间包括:多个AI模型的运算时间之和;其中,一个AI模型的运算时间可以理解为该AI模型的单独运算时间;
所述第一信息中AI模型的复杂度信息包括:多个AI模型的联合复杂度,所述联合复杂度包括:多个AI模型的复杂度之和。
在本申请的至少一个实施例中,在所述多个AI模型的联合运算包含非AI运算单元的情况下,所述联合运算时间还包括:
非AI运算单元的运行时间。
其中,所述非AI运算单元的运行时间包括以下至少之一:
输入数据从第三模块到非AI运算单元输入接口的第六时间;
非AI运算单元从输入接口读取到数据的第七时间;
非AI运算单元将数据输出到输出接口的第八时间;
输出数据从输出接口道第四模块的第九时间;
第四模块从所述第四模块的输入接口读取数据的第十时间。
在本申请的至少一个可选实施例中,当多个AI模型对应的AI运算单元的数量小于AI模型的数量,所述联合运算时间为:所述多个AI模型的运算时间之和减去至少一个AI模型的数据传输时间。
可选地,“多个AI模型的运算时间之和”可以理解为各个AI模型的单独运算时间之和。
例如,当N1个AI模型对应N2个AI运算单元,当N1>N2时,总体数据传输时间可以减少,则联合运算时间可以减少,如减少(N1-N2)个单AI模型的数据传输时间。
在本申请的一个可选实施例中,所述方法还包括:
第一通信设备根据第二通信设备发送的AI模型指示信息,确定AI模型;
或者,
第一通信设备根据协议约定,确定AI模型;
或者,
第一通信设备根据所述第一通信设备的自定义,确定AI模型。
在本申请的另一个可选实施例中,所述方法还包括:
第一通信设备根据第二通信设备发送的时间轴指示信息,确定所述时间轴(timeline);
或者,
第一通信设备根据协议约定,确定所述时间轴;
或者,
第一通信设备根据所述第一通信设备的自定义,确定所述时间轴。
换言之,第一通信设备侧的AI模型或timeline来自:第二通信设备发送,或协议默认,或第一通信设备自有或自定义。
综上,在本申请实施例中,第一通信设备向第二通信设备发送AI模型的运算时间相关信息和/或复杂度相关信息,使得第一通信设备和第二通信设备能够对齐运算时间和复杂度,来确定合适的AI模型,从而改善通信系统中AI模型的性能,进一步提升系统性能。
本申请实施例提供的信息传输方法,执行主体可以为信息传输装置。本申请实施例中以信息传输装置执行信息传输方法为例,说明本申请实施例提供的信息传输装置。
请参见图3,图3为本申请实施例提供的信息传输装置300的结构示意图,该信息传输装置300,应用于第一通信设备,包括:
发送模块301,用于向第二通信设备发送人工智能AI模型的第一信息;其中,所述第一信息包括以下至少一项:
AI模型的运算时间信息;
AI模型的运算时间是否满足预设要求;
AI模型的复杂度信息;
满足时间轴要求的前提下允许的AI模型的最大复杂度。
作为一个可选实施例,所述AI模型的运算时间包括以下至少之一:
AI模型在AI运算单元的第一运算时间;以及,
数据传输时间。
作为一个可选实施例,所述数据传输时间包括以下至少之一:
输入数据从第一模块到AI运算单元输入接口的第一时间;
AI运算单元从输入接口读取数据的第二时间;
AI运算单元将数据输出到输出接口的第三时间;
输出数据从输出接口到第二模块的第四时间;
第二模块从所述第二模块的输入接口读取数据的第五时间。
作为一个可选实施例,所述AI模型的复杂度包括以下任意一项:
AI模型的总运算次数;
AI模型的总计算次数;
AI模型的总操作OP次数。
作为一个可选实施例,所述装置还包括:
折算模块,用于执行以下至少一项:
以OP为基础,将AI模型的所有运算折算为OP次数;
以乘法或加法为基础,将AI模型的所有运算折算为乘法次数或加法次数;
将AI模型的非线性函数折算为OP次数;
将AI模型的非线性函数折算为乘法次数或加法次数。
作为一个可选实施例,在所述第一通信设备包括单个AI模型,该单个AI模型具有多个运算时间的情况下,或者在所述第一通信设备包括属于相同功能的多个AI模型,该多个AI模型具有多个运算时间的情况下,所述第一信息中AI模型的运算时间信息包括以下任意一项:
所有运算时间;
多个运算时间中最长的K1个运算时间;
多个运算时间中最短的K2个运算时间;
多个运算时间中最长的K3个运算时间和最短的K4个运算时间;
所有运算时间的平均值;
多个运算时间中最长的K5个运算时间的平均值;
多个运算时间中最短的K6个运算时间的平均值;
多个运算时间中最长的K7个运算时间和最短的K8个运算时间的平均值;
所述第一通信设备选择的K9个运算时间;
其中,K1,K2,K3,K4,K5,K6,K7,K8以及K9均为大于或者等于1的整数。
作为一个可选实施例,在所述第一通信设备包括单个AI模型,该单个AI模型具有多个复杂度的情况下,或者在所述第一通信设备包括属于相同功能的多个AI模型,该多个AI模型具有多个复杂度的情况下,所述第一信息中AI模型的复杂度信息包括以下任意一项:
所有复杂度;
多个复杂度中复杂度最高的L1个复杂度;
多个复杂度中复杂度最低的L2个复杂度;
多个复杂度中复杂度最高的L3个复杂度和复杂度最低的L4个复杂度;
所有复杂度的平均值;
多个复杂度中复杂度最高的L5个复杂度的平均值;
多个复杂度中复杂度最低的L6个复杂度的平均值;
多个复杂度中复杂度最高的L7个复杂度和复杂度最低的L8个复杂度的平均值;
所述第一通信设备选的L9个复杂度;
其中,L1,L2,L3,L4,L5,L6,L7,L8以及L9均为大于或者等于1的整数。
作为一个可选实施例,在所述第一通信设备包括属于不同功能的多个AI模型的情况下,
所述第一信息中AI模型的运算时间信息包括:多个AI模型的联合运算时间,所述联合运算时间包括:多个AI模型的运算时间之和;
所述第一信息中AI模型的复杂度信息包括:多个AI模型的联合复杂度,所述联合复杂度包括:多个AI模型的复杂度之和。
作为一个可选实施例,在所述多个AI模型的联合运算包含非AI运算单元的情况下,所述联合运算时间还包括:
非AI运算单元的运行时间。
作为一个可选实施例,所述非AI运算单元的运行时间包括以下至少之一:
输入数据从第三模块到非AI运算单元输入接口的第六时间;
非AI运算单元从输入接口读取到数据的第七时间;
非AI运算单元将数据输出到输出接口的第八时间;
输出数据从输出接口道第四模块的第九时间;
第四模块从所述第四模块的输入接口读取数据的第十时间。
作为一个可选实施例,当多个AI模型对应的AI运算单元的数量小于AI模型的数量,所述联合运算时间为:所述多个AI模型的运算时间之和减去至 少一个AI模型的数据传输时间。
作为一个可选实施例,所述装置还包括:
第一确定模块,用于根据第二通信设备发送的AI模型指示信息,确定AI模型;
或者,用于根据协议约定,确定AI模型;
或者,用于根据所述第一通信设备的自定义,确定AI模型。
作为一个可选实施例,所述装置还包括:
第二确定模块,用于根据第二通信设备发送的时间轴指示信息,确定所述时间轴;
或者,用于根据协议约定,确定所述时间轴;
或者,用于根据所述第一通信设备的自定义,确定所述时间轴。
在本申请实施例中,第一通信设备向第二通信设备发送AI模型的运算时间相关信息和/或复杂度相关信息,使得第一通信设备和第二通信设备能够对齐运算时间和复杂度,来确定合适的AI模型,从而改善通信系统中AI模型的性能,进一步提升系统性能。
需要说明的是,本申请实施例提供的信息传输装置是能够执行上述信息传输方法的装置,则上述信息传输方法的所有实施例均适用于该装置,且均能达到相同或相似的有益效果。
本申请实施例中的信息传输装置可以是电子设备,例如具有操作系统的电子设备,也可以是电子设备中的部件,例如集成电路或芯片。该电子设备可以是终端,也可以为除终端之外的其他设备。示例性的,终端可以包括但不限于上述所列举的终端11的类型,其他设备可以为服务器、网络附属存储器(Network Attached Storage,NAS)等,本申请实施例不作具体限定。
本申请实施例提供的信息传输装置能够实现图1至2的方法实施例实现的各个过程,并达到相同的技术效果,为避免重复,这里不再赘述。
可选地,如图4所示,本申请实施例还提供一种通信设备400,该通信设备为第一通信设备,包括处理器401和存储器402,存储器402上存储有可在所述处理器401上运行的程序或指令,例如,该通信设备400为终端时,该程序或指令被处理器401执行时实现上述信息传输方法实施例的各个步骤, 且能达到相同的技术效果。该通信设备400为网络侧设备时,该程序或指令被处理器401执行时实现上述信息传输方法实施例的各个步骤,且能达到相同的技术效果,为避免重复,这里不再赘述。
本申请实施例还提供一种终端,包括处理器和通信接口,通信接口用于向第二通信设备发送人工智能AI模型的第一信息;其中,所述第一信息包括以下至少一项:AI模型的运算时间信息;AI模型的运算时间是否满足预设要求;AI模型的复杂度信息;满足时间轴要求的前提下允许的AI模型的最大复杂度。该终端实施例与上述终端侧方法实施例对应,上述方法实施例的各个实施过程和实现方式均可适用于该终端实施例中,且能达到相同的技术效果。具体地,图5为实现本申请实施例的一种终端的硬件结构示意图。
该终端500包括但不限于:射频单元501、网络模块502、音频输出单元503、输入单元504、传感器505、显示单元506、用户输入单元507、接口单元508、存储器509以及处理器510等中的至少部分部件。
本领域技术人员可以理解,终端500还可以包括给各个部件供电的电源(比如电池),电源可以通过电源管理系统与处理器510逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图5中示出的终端结构并不构成对终端的限定,终端可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,在此不再赘述。
应理解的是,本申请实施例中,输入单元504可以包括图形处理单元(Graphics Processing Unit,GPU)5041和麦克风5042,图形处理器5041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元506可包括显示面板5061,可以采用液晶显示器、有机发光二极管等形式来配置显示面板5061。用户输入单元507包括触控面板5071以及其他输入设备5072中的至少一种。触控面板5071,也称为触摸屏。触控面板5071可包括触摸检测装置和触摸控制器两个部分。其他输入设备5072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
本申请实施例中,射频单元501接收来自网络侧设备的下行数据后,可以传输给处理器510进行处理;另外,射频单元501可以向网络侧设备发送 上行数据。通常,射频单元501包括但不限于天线、放大器、收发信机、耦合器、低噪声放大器、双工器等。
存储器509可用于存储软件程序或指令以及各种数据。存储器509可主要包括存储程序或指令的第一存储区和存储数据的第二存储区,其中,第一存储区可存储操作系统、至少一个功能所需的应用程序或指令(比如声音播放功能、图像播放功能等)等。此外,存储器509可以包括易失性存储器或非易失性存储器,或者,存储器509可以包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synch link DRAM,SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM,DRRAM)。本申请实施例中的存储器509包括但不限于这些和任意其它适合类型的存储器。
处理器510可包括一个或多个处理单元;可选地,处理器510集成应用处理器和调制解调处理器,其中,应用处理器主要处理涉及操作系统、用户界面和应用程序等的操作,调制解调处理器主要处理无线通信信号,如基带处理器。可以理解的是,上述调制解调处理器也可以不集成到处理器510中。
其中,射频单元501,用于向第二通信设备发送人工智能AI模型的第一信息;其中,所述第一信息包括以下至少一项:
AI模型的运算时间信息;
AI模型的运算时间是否满足预设要求;
AI模型的复杂度信息;
满足时间轴要求的前提下允许的AI模型的最大复杂度。
在本申请实施例中,终端向第二通信设备发送AI模型的运算时间相关信 息和/或复杂度相关信息,使得终端和第二通信设备能够对齐运算时间和复杂度,来确定合适的AI模型,从而改善通信系统中AI模型的性能,进一步提升系统性能。
需要说明的是,本申请实施例提供的信息传输装置是能够执行上述信息传输方法的装置,则上述信息传输方法的所有实施例均适用于该装置,且均能达到相同或相似的有益效果。
本申请实施例还提供一种网络侧设备,包括处理器和通信接口,通信接口用于向第二通信设备发送人工智能AI模型的第一信息;其中,所述第一信息包括以下至少一项:AI模型的运算时间信息;AI模型的运算时间是否满足预设要求;AI模型的复杂度信息;满足时间轴要求的前提下允许的AI模型的最大复杂度。该网络侧设备实施例与上述网络侧设备方法实施例对应,上述方法实施例的各个实施过程和实现方式均可适用于该网络侧设备实施例中,且能达到相同的技术效果。
具体地,本申请实施例还提供了一种网络侧设备。如图6所示,该网络侧设备600包括:天线61、射频装置62、基带装置63、处理器64和存储器65。天线61与射频装置62连接。在上行方向上,射频装置62通过天线61接收信息,将接收的信息发送给基带装置63进行处理。在下行方向上,基带装置63对要发送的信息进行处理,并发送给射频装置62,射频装置62对收到的信息进行处理后经过天线61发送出去。
以上实施例中网络侧设备执行的方法可以在基带装置63中实现,该基带装置63包括基带处理器。
基带装置63例如可以包括至少一个基带板,该基带板上设置有多个芯片,如图6所示,其中一个芯片例如为基带处理器,通过总线接口与存储器65连接,以调用存储器65中的程序,执行以上方法实施例中所示的网络设备操作。
该网络侧设备还可以包括网络接口66,该接口例如为通用公共无线接口(common public radio interface,CPRI)。
具体地,本公开实施例的网络侧设备600还包括:存储在存储器65上并可在处理器64上运行的指令或程序,处理器64调用存储器65中的指令或程序执行图3所示各模块执行的方法,并达到相同的技术效果,为避免重复, 故不在此赘述。
本申请实施例还提供一种可读存储介质,所述可读存储介质可以是非易失的,也可以是易失的,所述可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述信息传输方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,所述处理器为上述实施例中所述的终端中的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器ROM、随机存取存储器RAM、磁碟或者光盘等。
本申请实施例另提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现上述信息传输方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为系统级芯片,系统芯片,芯片系统或片上系统芯片等。
本申请实施例另提供了一种计算机程序/程序产品,所述计算机程序/程序产品被存储在存储介质中,所述计算机程序/程序产品被至少一个处理器执行以实现上述信息传输方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对相关技术做出贡献的部分可以以计算机软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。
Claims (28)
- 一种信息传输方法,包括:第一通信设备向第二通信设备发送人工智能AI模型的第一信息;其中,所述第一信息包括以下至少一项:AI模型的运算时间信息;AI模型的运算时间是否满足预设要求;AI模型的复杂度信息;满足时间轴要求的前提下允许的AI模型的最大复杂度。
- 根据权利要求1所述的方法,其中,所述AI模型的运算时间包括以下至少之一:AI模型在AI运算单元的第一运算时间;以及,数据传输时间。
- 根据权利要求2所述的方法,其中,所述数据传输时间包括以下至少之一:输入数据从第一模块到AI运算单元输入接口的第一时间;AI运算单元从输入接口读取数据的第二时间;AI运算单元将数据输出到输出接口的第三时间;输出数据从输出接口到第二模块的第四时间;第二模块从所述第二模块的输入接口读取数据的第五时间。
- 根据权利要求1所述的方法,其中,所述AI模型的复杂度包括以下任意一项:AI模型的总运算次数;AI模型的总计算次数;AI模型的总操作OP次数。
- 根据权利要求4所述的方法,其中,所述方法还包括以下至少一项:以OP为基础,将AI模型的所有运算折算为OP次数;以乘法或加法为基础,将AI模型的所有运算折算为乘法次数或加法次数;将AI模型的非线性函数折算为OP次数;将AI模型的非线性函数折算为乘法次数或加法次数。
- 根据权利要求1所述的方法,其中,在所述第一通信设备包括单个AI模型,该单个AI模型具有多个运算时间的情况下,或者在所述第一通信设备包括属于相同功能的多个AI模型,该多个AI模型具有多个运算时间的情况下,所述第一信息中AI模型的运算时间信息包括以下任意一项:所有运算时间;多个运算时间中最长的K1个运算时间;多个运算时间中最短的K2个运算时间;多个运算时间中最长的K3个运算时间和最短的K4个运算时间;所有运算时间的平均值;多个运算时间中最长的K5个运算时间的平均值;多个运算时间中最短的K6个运算时间的平均值;多个运算时间中最长的K7个运算时间和最短的K8个运算时间的平均值;所述第一通信设备选择的K9个运算时间;其中,K1,K2,K3,K4,K5,K6,K7,K8以及K9均为大于或者等于1的整数。
- 根据权利要求1所述的方法,其中,在所述第一通信设备包括单个AI模型,该单个AI模型具有多个复杂度的情况下,或者在所述第一通信设备包括属于相同功能的多个AI模型,该多个AI模型具有多个复杂度的情况下,所述第一信息中AI模型的复杂度信息包括以下任意一项:所有复杂度;多个复杂度中复杂度最高的L1个复杂度;多个复杂度中复杂度最低的L2个复杂度;多个复杂度中复杂度最高的L3个复杂度和复杂度最低的L4个复杂度;所有复杂度的平均值;多个复杂度中复杂度最高的L5个复杂度的平均值;多个复杂度中复杂度最低的L6个复杂度的平均值;多个复杂度中复杂度最高的L7个复杂度和复杂度最低的L8个复杂度的平均值;所述第一通信设备选的L9个复杂度;其中,L1,L2,L3,L4,L5,L6,L7,L8以及L9均为大于或者等于1的整数。
- 根据权利要求1所述的方法,其中,在所述第一通信设备包括属于不同功能的多个AI模型的情况下,所述第一信息中AI模型的运算时间信息包括:多个AI模型的联合运算时间,所述联合运算时间包括:多个AI模型的运算时间之和;所述第一信息中AI模型的复杂度信息包括:多个AI模型的联合复杂度,所述联合复杂度包括:多个AI模型的复杂度之和。
- 根据权利要求8所述的方法,其中,在所述多个AI模型的联合运算包含非AI运算单元的情况下,所述联合运算时间还包括:非AI运算单元的运行时间。
- 根据权利要求9所述的方法,其中,所述非AI运算单元的运行时间包括以下至少之一:输入数据从第三模块到非AI运算单元输入接口的第六时间;非AI运算单元从输入接口读取到数据的第七时间;非AI运算单元将数据输出到输出接口的第八时间;输出数据从输出接口道第四模块的第九时间;第四模块从所述第四模块的输入接口读取数据的第十时间。
- 根据权利要求8所述的方法,其中,当多个AI模型对应的AI运算单元的数量小于AI模型的数量,所述联合运算时间为:所述多个AI模型的运算时间之和减去至少一个AI模型的数据传输时间。
- 根据权利要求1所述的方法,其中,所述方法还包括:第一通信设备根据第二通信设备发送的AI模型指示信息,确定AI模型;或者,第一通信设备根据协议约定,确定AI模型;或者,第一通信设备根据所述第一通信设备的自定义,确定AI模型。
- 根据权利要求1所述的方法,其中,所述方法还包括:第一通信设备根据第二通信设备发送的时间轴指示信息,确定所述时间轴;或者,第一通信设备根据协议约定,确定所述时间轴;或者,第一通信设备根据所述第一通信设备的自定义,确定所述时间轴。
- 一种信息传输装置,应用于第一通信设备,所述装置包括:发送模块,用于向第二通信设备发送人工智能AI模型的第一信息;其中,所述第一信息包括以下至少一项:AI模型的运算时间信息;AI模型的运算时间是否满足预设要求;AI模型的复杂度信息;满足时间轴要求的前提下允许的AI模型的最大复杂度。
- 根据权利要求14所述的装置,其中,所述AI模型的运算时间包括以下至少之一:AI模型在AI运算单元的第一运算时间;以及,数据传输时间。
- 根据权利要求15所述的装置,其中,所述数据传输时间包括以下至少之一:输入数据从第一模块到AI运算单元输入接口的第一时间;AI运算单元从输入接口读取数据的第二时间;AI运算单元将数据输出到输出接口的第三时间;输出数据从输出接口到第二模块的第四时间;第二模块从所述第二模块的输入接口读取数据的第五时间。
- 根据权利要求14所述的装置,其中,所述AI模型的复杂度包括以下任意一项:AI模型的总运算次数;AI模型的总计算次数;AI模型的总操作OP次数。
- 根据权利要求17所述的装置,其中,所述装置还包括:折算模块,用于执行以下至少一项:以OP为基础,将AI模型的所有运算折算为OP次数;以乘法或加法为基础,将AI模型的所有运算折算为乘法次数或加法次数;将AI模型的非线性函数折算为OP次数;将AI模型的非线性函数折算为乘法次数或加法次数。
- 根据权利要求14所述的装置,其中,在所述第一通信设备包括单个AI模型,该单个AI模型具有多个运算时间的情况下,或者在所述第一通信设备包括属于相同功能的多个AI模型,该多个AI模型具有多个运算时间的情况下,所述第一信息中AI模型的运算时间信息包括以下任意一项:所有运算时间;多个运算时间中最长的K1个运算时间;多个运算时间中最短的K2个运算时间;多个运算时间中最长的K3个运算时间和最短的K4个运算时间;所有运算时间的平均值;多个运算时间中最长的K5个运算时间的平均值;多个运算时间中最短的K6个运算时间的平均值;多个运算时间中最长的K7个运算时间和最短的K8个运算时间的平均值;所述第一通信设备选择的K9个运算时间;其中,K1,K2,K3,K4,K5,K6,K7,K8以及K9均为大于或者等于1的整数。
- 根据权利要求14所述的装置,其中,在所述第一通信设备包括单个AI模型,该单个AI模型具有多个复杂度的情况下,或者在所述第一通信设备包括属于相同功能的多个AI模型,该多个AI模型具有多个复杂度的情况下,所述第一信息中AI模型的复杂度信息包括以下任意一项:所有复杂度;多个复杂度中复杂度最高的L1个复杂度;多个复杂度中复杂度最低的L2个复杂度;多个复杂度中复杂度最高的L3个复杂度和复杂度最低的L4个复杂度;所有复杂度的平均值;多个复杂度中复杂度最高的L5个复杂度的平均值;多个复杂度中复杂度最低的L6个复杂度的平均值;多个复杂度中复杂度最高的L7个复杂度和复杂度最低的L8个复杂度的平均值;所述第一通信设备选的L9个复杂度;其中,L1,L2,L3,L4,L5,L6,L7,L8以及L9均为大于或者等于1的整数。
- 根据权利要求14所述的装置,其中,在所述第一通信设备包括属于不同功能的多个AI模型的情况下,所述第一信息中AI模型的运算时间信息包括:多个AI模型的联合运算时间,所述联合运算时间包括:多个AI模型的运算时间之和;所述第一信息中AI模型的复杂度信息包括:多个AI模型的联合复杂度,所述联合复杂度包括:多个AI模型的复杂度之和。
- 根据权利要求21所述的装置,其中,在所述多个AI模型的联合运算包含非AI运算单元的情况下,所述联合运算时间还包括:非AI运算单元的运行时间。
- 根据权利要求22所述的装置,其中,所述非AI运算单元的运行时间包括以下至少之一:输入数据从第三模块到非AI运算单元输入接口的第六时间;非AI运算单元从输入接口读取到数据的第七时间;非AI运算单元将数据输出到输出接口的第八时间;输出数据从输出接口道第四模块的第九时间;第四模块从所述第四模块的输入接口读取数据的第十时间。
- 根据权利要求21所述的装置,其中,当多个AI模型对应的AI运算单元的数量小于AI模型的数量,所述联合运算时间为:所述多个AI模型的运算时间之和减去至少一个AI模型的数据传输时间。
- 根据权利要求14所述的装置,所述装置还包括:第一确定模块,用于根据第二通信设备发送的AI模型指示信息,确定 AI模型;或者,用于根据协议约定,确定AI模型;或者,用于根据所述第一通信设备的自定义,确定AI模型。
- 根据权利要求14所述的装置,所述装置还包括:第二确定模块,用于根据第二通信设备发送的时间轴指示信息,确定所述时间轴;或者,用于根据协议约定,确定所述时间轴;或者,用于根据所述第一通信设备的自定义,确定所述时间轴。
- 一种通信设备,包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1至13任一项所述的信息传输方法的步骤。
- 一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1-13任一项所述的信息传输方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP22900389.2A EP4443832A1 (en) | 2021-11-30 | 2022-11-25 | Information transmission method and apparatus, and communication device |
US18/669,932 US20240305537A1 (en) | 2021-11-30 | 2024-05-21 | Information transmission method and apparatus, and communication device |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111447089.2 | 2021-11-30 | ||
CN202111447089.2A CN116208493A (zh) | 2021-11-30 | 2021-11-30 | 信息传输方法、装置及通信设备 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
US18/669,932 Continuation US20240305537A1 (en) | 2021-11-30 | 2024-05-21 | Information transmission method and apparatus, and communication device |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2023098585A1 true WO2023098585A1 (zh) | 2023-06-08 |
Family
ID=86509999
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/CN2022/134307 WO2023098585A1 (zh) | 2021-11-30 | 2022-11-25 | 信息传输方法、装置及通信设备 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20240305537A1 (zh) |
EP (1) | EP4443832A1 (zh) |
CN (1) | CN116208493A (zh) |
WO (1) | WO2023098585A1 (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109313586A (zh) * | 2016-06-10 | 2019-02-05 | 苹果公司 | 使用基于云端的度量迭代训练人工智能的系统 |
CN111865644A (zh) * | 2019-12-04 | 2020-10-30 | 北京小桔科技有限公司 | 一种计算资源的推荐方法、装置、电子设备及存储介质 |
US20210117856A1 (en) * | 2019-10-22 | 2021-04-22 | Dell Products L.P. | System and Method for Configuration and Resource Aware Machine Learning Model Switching |
CN112836792A (zh) * | 2017-12-29 | 2021-05-25 | 华为技术有限公司 | 一种神经网络模型的训练方法及装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110163333B (zh) * | 2018-01-10 | 2020-06-09 | 成都信息工程大学 | 卷积神经网络的并行优化方法 |
US11769075B2 (en) * | 2019-08-22 | 2023-09-26 | Cisco Technology, Inc. | Dynamic machine learning on premise model selection based on entity clustering and feedback |
US11360822B2 (en) * | 2019-09-12 | 2022-06-14 | Bank Of America Corporation | Intelligent resource allocation agent for cluster computing |
CN113128677A (zh) * | 2020-01-10 | 2021-07-16 | 北京百度网讯科技有限公司 | 模型生成方法和装置 |
CN113543158B (zh) * | 2020-04-14 | 2023-06-02 | 维沃移动通信有限公司 | 确定数据传输层数的方法及装置、通信设备 |
CN111814978A (zh) * | 2020-09-11 | 2020-10-23 | 鹏城实验室 | 神经网络模型的训练计算量计算方法、设备及介质 |
CN112287982A (zh) * | 2020-10-14 | 2021-01-29 | 深圳大学 | 一种数据预测方法、装置及终端设备 |
-
2021
- 2021-11-30 CN CN202111447089.2A patent/CN116208493A/zh active Pending
-
2022
- 2022-11-25 WO PCT/CN2022/134307 patent/WO2023098585A1/zh unknown
- 2022-11-25 EP EP22900389.2A patent/EP4443832A1/en active Pending
-
2024
- 2024-05-21 US US18/669,932 patent/US20240305537A1/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109313586A (zh) * | 2016-06-10 | 2019-02-05 | 苹果公司 | 使用基于云端的度量迭代训练人工智能的系统 |
CN112836792A (zh) * | 2017-12-29 | 2021-05-25 | 华为技术有限公司 | 一种神经网络模型的训练方法及装置 |
US20210117856A1 (en) * | 2019-10-22 | 2021-04-22 | Dell Products L.P. | System and Method for Configuration and Resource Aware Machine Learning Model Switching |
CN111865644A (zh) * | 2019-12-04 | 2020-10-30 | 北京小桔科技有限公司 | 一种计算资源的推荐方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
US20240305537A1 (en) | 2024-09-12 |
CN116208493A (zh) | 2023-06-02 |
EP4443832A1 (en) | 2024-10-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2023098585A1 (zh) | 信息传输方法、装置及通信设备 | |
CN117726003A (zh) | 基于大模型推理的应答防御方法、装置、设备及存储介质 | |
WO2023098534A1 (zh) | Ai模型切换的处理方法、装置及通信设备 | |
WO2024120358A1 (zh) | 信息传输方法、信息传输装置和通信设备 | |
WO2023213270A1 (zh) | 模型训练处理方法、装置、终端及网络侧设备 | |
WO2024120445A1 (zh) | 模型输入信息的确定方法、装置、设备、系统及存储介质 | |
WO2023098535A1 (zh) | 信息交互方法、装置及通信设备 | |
WO2024067665A1 (zh) | Csi预测处理方法、装置、通信设备及可读存储介质 | |
WO2024153039A1 (zh) | Ai模型的处理方法、终端及网络侧设备 | |
WO2024083004A1 (zh) | Ai模型配置方法、终端及网络侧设备 | |
WO2024120409A1 (zh) | Ai网络模型的确定方法、信息传输方法、装置和通信设备 | |
WO2024140512A1 (zh) | 数据集确定方法、信息传输方法、装置和通信设备 | |
WO2023098586A1 (zh) | 信息交互方法、装置及通信设备 | |
WO2024169797A1 (zh) | Ai模型指示方法及通信设备 | |
WO2024027683A1 (zh) | 模型匹配方法、装置、通信设备及可读存储介质 | |
WO2023134628A1 (zh) | 传输方法、装置和设备 | |
WO2024041421A1 (zh) | 测量反馈处理方法、装置、终端及网络侧设备 | |
WO2024067280A1 (zh) | 更新ai模型参数的方法、装置及通信设备 | |
WO2024078615A1 (zh) | 模型选择方法、终端及网络侧设备 | |
WO2024088119A1 (zh) | 数据处理方法、装置、终端及网络侧设备 | |
WO2024120444A1 (zh) | 模型监督方法、装置、终端、网络侧设备及可读存储介质 | |
WO2024067281A1 (zh) | Ai模型的处理方法、装置及通信设备 | |
CN117875380A (zh) | 数据处理方法、装置及电子设备 | |
CN117639862A (zh) | Csi预测处理方法、装置、通信设备及可读存储介质 | |
CN116450808A (zh) | 一种数据的处理方法、装置以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 22900389 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
ENP | Entry into the national phase |
Ref document number: 2022900389 Country of ref document: EP Effective date: 20240701 |