CN116208492A - 信息交互方法、装置及通信设备 - Google Patents
信息交互方法、装置及通信设备 Download PDFInfo
- Publication number
- CN116208492A CN116208492A CN202111443949.5A CN202111443949A CN116208492A CN 116208492 A CN116208492 A CN 116208492A CN 202111443949 A CN202111443949 A CN 202111443949A CN 116208492 A CN116208492 A CN 116208492A
- Authority
- CN
- China
- Prior art keywords
- target
- communication device
- information
- algorithm
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004891 communication Methods 0.000 title claims abstract description 591
- 230000003993 interaction Effects 0.000 title claims abstract description 179
- 238000000034 method Methods 0.000 title claims abstract description 131
- 238000012545 processing Methods 0.000 claims abstract description 195
- 238000013528 artificial neural network Methods 0.000 claims abstract description 63
- 238000013473 artificial intelligence Methods 0.000 claims abstract description 16
- 238000010801 machine learning Methods 0.000 claims abstract description 14
- 238000003062 neural network model Methods 0.000 claims description 130
- 230000006870 function Effects 0.000 claims description 63
- 210000002569 neuron Anatomy 0.000 claims description 33
- 230000008569 process Effects 0.000 claims description 31
- 230000004913 activation Effects 0.000 claims description 16
- 238000010200 validation analysis Methods 0.000 claims description 16
- 238000007781 pre-processing Methods 0.000 claims description 9
- 230000008859 change Effects 0.000 claims description 8
- 238000013139 quantization Methods 0.000 claims description 8
- 230000003213 activating effect Effects 0.000 claims description 7
- 238000012549 training Methods 0.000 claims description 5
- 230000000694 effects Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 9
- 238000007726 management method Methods 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000004590 computer program Methods 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 3
- 230000003190 augmentative effect Effects 0.000 description 2
- 238000013523 data management Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000012517 data analytics Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 235000019580 granularity Nutrition 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 210000000707 wrist Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0803—Configuration setting
- H04L41/0823—Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/16—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using machine learning or artificial intelligence
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本申请公开了一种信息交互方法、装置及通信设备,属于通信技术领域,本申请实施例的信息交互方法包括:第一通信设备发送第一处理资源信息;所述第一通信设备根据所述第一处理资源信息与至少一个目标通信设备进行信息交互;其中,所述第一处理资源信息用于指示以下至少一项:所述第一通信设备运行目标算法的可用资源信息,所述目标算法包括神经网络算法、人工智能算法和机器学习算法中的至少一项;所述第一通信设备支持的目标算法集合。
Description
技术领域
本申请属于通信技术领域,具体涉及一种信息交互方法、装置及通信设备。
背景技术
人工智能(Artificial Intelligence,AI)应用于无线通信系统中时,需要在终端上运行相应的神经网络,但网络侧节点并不了解终端的神经网络算力、终端运行神经网络的时间等,从而难以为终端配置与终端的运行资源匹配的神经网络,使得终端使用的神经网络模型难以与其运行资源相匹配。
发明内容
本申请实施例提供一种信息交互方法、装置及通信设备,能够解决如何保证终端使用的神经网络模型与其运行资源相适配的问题。
第一方面,提供了一种信息交互方法,包括:
第一通信设备发送第一处理资源信息;
所述第一通信设备根据所述第一处理资源信息与至少一个目标通信设备进行信息交互;
其中,所述第一处理资源信息用于指示以下至少一项:
所述第一通信设备运行目标算法的可用资源信息,所述目标算法包括神经网络算法、人工智能算法和机器学习算法中的至少一项;
所述第一通信设备支持的目标算法集合。
第二方面,提供了一种信息交互方法,包括:
第二通信设备获取第一通信设备发送的第一处理资源信息;
所述第二通信设备根据所述第一处理资源信息与目标通信设备进行交互,所述目标通信设备包括第一通信设备和第三通信设备中的至少一项;
其中,所述第一处理资源信息用于指示以下至少一项:
所述第一通信设备运行目标算法的可用资源信息,所述目标算法包括神经网络算法、人工智能算法和机器学习算法中的至少一项;
所述第一通信设备支持的目标算法集合。
第三方面,提供了一种信息交互方法,包括:
第三通信设备获取目标通信设备发送的第一交互信息,所述第一交互信息包括第二处理资源信息和目标算法推荐信息中的至少一项,所述第二处理资源信息用于指示所述第一通信设备运行目标算法中的资源信息,所述目标通信设备包括第二通信设备和第一通信设备中的至少一项;
所述第三通信设备根据所述第一交互信息与目标通信设备进行信息交互。
第四方面,提供了一种信息交互的装置,包括:
第一收发模块,用于发送第一处理资源信息;
第一交互模块,用于根据所述第一处理资源信息与至少一个目标通信设备进行信息交互;
其中,所述第一处理资源信息用于指示以下至少一项:
所述第一通信设备运行目标算法的可用资源信息,所述目标算法包括神经网络算法、人工智能算法和机器学习算法中的至少一项;
所述第一通信设备支持的目标算法集合。
第五方方面,提供了一种信息交互装置,包括:
第一获取模块,用于获取第一通信设备发送的第一处理资源信息;
第二交互模块,用于根据所述第一处理资源信息与目标通信设备进行交互,所述目标通信设备包括第一通信设备和第三通信设备中的至少一项;
其中,所述第一处理资源信息用于指示以下至少一项:
所述第一通信设备运行目标算法的可用资源信息,所述目标算法包括神经网络算法、人工智能算法和机器学习算法中的至少一项;
所述第一通信设备支持的目标算法集合。
第六方面,提供了一种信息交互装置,包括:
第二获取模块,用于获取目标通信设备发送的第一交互信息,所述第一交互信息包括第二处理资源信息和目标算法推荐信息中的至少一项,所述第二处理资源信息用于指示所述第一通信设备运行目标算法中的资源信息,所述目标通信设备包括第二通信设备和第一通信设备中的至少一项;
第三交互模块,用于根据所述第一交互信息与目标通信设备进行信息交互。
第七方面,提供了一种通信设备,该通信设备包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面、第二方面或第三方面所述的方法的步骤。
第八方面,提供了一种通信设备,包括处理器及通信接口,其中,所述通信接口用于发送第一处理资源信息;根据所述第一处理资源信息与至少一个目标通信设备进行信息交互;或者,用于获取第一处理资源信息;根据所述第一处理资源信息与目标通信设备进行交互,所述目标通信设备包括第一通信设备和第三通信设备中的至少一项;或者,获取目标通信设备发送的第一交互信息,所述第一交互信息包括第二处理资源信息和目标算法推荐信息中的至少一项,所述第二处理资源信息用于指示所述第一通信设备运行目标算法中的资源信息,所述目标通信设备包括第二通信设备和第一通信设备中的至少一项;根据所述第一交互信息与目标通信设备进行信息交互;其中,所述第一处理资源信息用于指示以下至少一项:所述第一通信设备运行目标算法的可用资源信息,所述目标算法包括神经网络算法、人工智能算法和机器学习算法中的至少一项;所述第一通信设备支持的目标算法集合。
第九方面,提供了一种通信系统,包括:第一通信设备、第二通信设备及第三通信设备,所述第一通信设备可用于执行如第一方面所述的信息交互方法的步骤,所述第二通信设备可用于执行如第二方面所述的信息交互方法的步骤,所述第三通信设备可用于执行如第三方面所述的信息交互方法的步骤。
第十方面,提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面、第二方面或第三方面所述的方法的步骤。
第十一方面,提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面、第二方面或第三方面所述的方法的步骤。
第十二方面,提供了一种计算机程序/程序产品,所述计算机程序/程序产品被存储在存储介质中,所述计算机程序/程序产品被至少一个处理器执行以实现如第一方面、第二方面或第三方面所述的方法的步骤。
在本申请实施例中,第一通信设备发送第一处理资源信息后,其他通信设备能够基于该第一处理资源信息确定该第一通信设备的可用资源信息和/或支持的目标算法集合(如支持的神经网络集合)等,从而后续基于该第一处理资源信息进行交互能够确定该第一通信设备使用的目标算法,如该第一通信设备使用的目标神经网络模型,进而实现了第一通信设备使用的神经网络模型为与其资源能力相适配的神经网络模型的目的。
附图说明
图1表示本申请实施例可应用的一种通信系统的结构图;
图2表示本申请实施例的信息交互方法的流程示意图之一;
图3表示本申请实施例的信息交互方法的流程示意图之二;
图4表示本申请实施例的信息交互方法的流程示意图之三;
图5表示本申请实施例的信息交互装置的模块示意图之一;
图6表示本申请实施例的通信设备的结构框图之一;
图7表示本申请实施例的通信设备的结构框图之二;
图8表示本申请实施例的信息交互装置的模块示意图之二;
图9表示本申请实施例的信息交互装置的模块示意图之三;
图10表示本申请实施例的网络侧设备的结构框图之一;
图11表示本申请实施例的网络侧设备的结构框图之二。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”所区别的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”一般表示前后关联对象是一种“或”的关系。
值得指出的是,本申请实施例所描述的技术不限于长期演进型(Long TermEvolution,LTE)/LTE的演进(LTE-Advanced,LTE-A)系统,还可用于其他无线通信系统,诸如码分多址(Code Division Multiple Access,CDMA)、时分多址(Time DivisionMultiple Access,TDMA)、频分多址(Frequency Division Multiple Access,FDMA)、正交频分多址(Orthogonal Frequency Division Multiple Access,OFDMA)、单载波频分多址(Single-carrier Frequency Division Multiple Access,SC-FDMA)和其他系统。本申请实施例中的术语“系统”和“网络”常被可互换地使用,所描述的技术既可用于以上提及的系统和无线电技术,也可用于其他系统和无线电技术。以下描述出于示例目的描述了新空口(New Radio,NR)系统,并且在以下大部分描述中使用NR术语,但是这些技术也可应用于NR系统应用以外的应用,如第6代(6th Generation,6G)通信系统。
图1示出本申请实施例可应用的一种无线通信系统的框图。无线通信系统包括终端11和网络侧设备12。其中,终端11可以是手机、平板电脑(Tablet Personal Computer)、膝上型电脑(Laptop Computer)或称为笔记本电脑、个人数字助理(Personal DigitalAssistant,PDA)、掌上电脑、上网本、超级移动个人计算机(ultra-mobile personalcomputer,UMPC)、移动上网装置(Mobile Internet Device,MID)、增强现实(augmentedreality,AR)/虚拟现实(virtual reality,VR)设备、机器人、可穿戴式设备(WearableDevice)、车载设备(VUE)、行人终端(PUE)、智能家居(具有无线通信功能的家居设备,如冰箱、电视、洗衣机或者家具等)、游戏机、个人计算机(personal computer,PC)、柜员机或者自助机等终端侧设备,可穿戴式设备包括:智能手表、智能手环、智能耳机、智能眼镜、智能首饰(智能手镯、智能手链、智能戒指、智能项链、智能脚镯、智能脚链等)、智能腕带、智能服装等。需要说明的是,在本申请实施例并不限定终端11的具体类型。网络侧设备12可以包括接入网设备或核心网设备,其中,接入网设备12也可以称为无线接入网设备、无线接入网(Radio Access Network,RAN)、无线接入网功能或无线接入网单元。接入网设备12可以包括基站、WLAN接入点或WiFi节点等,基站可被称为节点B、演进节点B(eNB)、接入点、基收发机站(Base Transceiver Station,BTS)、无线电基站、无线电收发机、基本服务集(BasicService Set,BSS)、扩展服务集(Extended Service Set,ESS)、家用B节点、家用演进型B节点、发送接收点(Transmitting Receiving Point,TRP)或所述领域中其他某个合适的术语,只要达到相同的技术效果,所述基站不限于特定技术词汇,需要说明的是,在本申请实施例中仅以NR系统中的基站为例进行介绍,并不限定基站的具体类型。核心网设备可以包含但不限于如下至少一项:核心网节点、核心网功能、移动管理实体(Mobility ManagementEntity,MME)、接入移动管理功能(Access and Mobility Management Function,AMF)、会话管理功能(Session Management Function,SMF)、用户平面功能(User Plane Function,UPF)、策略控制功能(Policy Control Function,PCF)、策略与计费规则功能单元(Policyand Charging Rules Function,PCRF)、边缘应用服务发现功能(Edge ApplicationServer Discovery Function,EASDF)、统一数据管理(Unified Data Management,UDM),统一数据仓储(Unified Data Repository,UDR)、归属用户服务器(Home SubscriberServer,HSS)、集中式网络配置(Centralized network configuration,CNC)、网络存储功能(Network Repository Function,NRF),网络开放功能(Network Exposure Function,NEF)、本地NEF(Local NEF,或L-NEF)、绑定支持功能(Binding Support Function,BSF)、应用功能(Application Function,AF)等。需要说明的是,在本申请实施例中仅以NR系统中的核心网设备为例进行介绍,并不限定核心网设备的具体类型。
下面结合附图,通过一些实施例及其应用场景对本申请实施例提供的信息交互方法进行详细地说明。
如图2所示,本申请实施例提供了一种信息交互方法,包括:
步骤201:第一通信设备发送第一处理资源信息。
其中,所述第一处理资源信息用于指示以下至少一项:
所述第一通信设备运行目标算法的可用资源信息,所述目标算法包括神经网络算法、人工智能算法和机器学习算法中的至少一项;该目标算法可具体包括训练算法、推理算法等。
所述第一通信设备支持的目标算法集合,可选地,所述目标算法集合包括以下至少一项:
神经网络模型的集合;
基于特定神经网络进行推理的算法集合;
基于特定神经网络进行训练的集合。
本步骤中,第一通信设备可向至少一个通信设备发送第一处理资源信息。
本申请实施例中可通过第一处理资源信息包括的至少一项信息来指示所述第一通信设备运行目标算法的可用资源信息和/或所述第一通信设备支持的目标算法集合。
步骤202:所述第一通信设备根据所述第一处理资源信息与至少一个目标通信设备进行信息交互。
本申请实施例中进行信息交互可以包括接收信息和/或发送信息。
本申请实施例中,第一通信设备发送第一处理资源信息后,其他通信设备能够基于该第一处理资源信息确定该第一通信设备的可用资源信息和/或支持的目标算法集合(如支持的神经网络集合)等,从而后续基于该第一处理资源信息进行交互能够确定该第一通信设备使用的目标算法,如该第一通信设备使用的目标神经网络模型,进而实现了第一通信设备使用的神经网络模型为与其资源能力相适配的神经网络模型的目的。
可选地,所述第一通信设备根据所述第一处理资源信息与至少一个目标通信设备进行信息交互,包括:
所述第一通信设备从至少一个目标通信设备接收所述目标算法的配置信息,其中,所述神经网络算法的配置信息包括神经网络模型的配置信息。
本申请实施例中,第一通信设备可在发送上述第一处理资源之前,获取所述目标算法的配置信息,并基于该配置信息发送上述第一处理资源信息。
本申请实施例中,第一通信设备获取目标算法的配置信息后,可根据该配置信息选择第一通信设备使用的目标算法并通知给其他通信设备,以便于其他通信设备后续为该第一通信设备配置目标算法时进行参考。
可选地,所述配置信息包括以下至少一项:
运行目标算法的至少一个预期时间;
目标算法的输入类型;
目标算法的输入信息对应的预处理信息;
同一目标算法类型的神经网络模型对应的不同目标参数;
神经网络模型库。该神经网络模型库可包括至少一个神经网络模型。
可选地,所述第一通信设备根据所述第一处理资源信息与至少一个目标通信设备进行信息交互,还包括:
所述第一通信设备根据所述目标算法的配置信息,向至少一个目标通信设备发送第一交互信息,所述第一交互信息包括第二处理资源信息和目标算法推荐信息中的至少一项,所述第二处理资源信息用于指示所述第一通信设备运行所述目标算法的资源信息。
在本申请的一实施例中,第一通信设备向第二通信设备发送第一处理资源信息之后,第二通信设备根据该第一处理资源信息确定上述配置信息并发送给第一通信设备,第一通信设备基于该配置信息向第二通信设备发送上述第一交互信息,第二通信设备进一步基于该第一交互信息,确定第一通信设备使用的神经网络模型,这样,通过第一通信设备与第二通信设备之间的多轮交互,实现了为第一通信设备配置与其神经网络运行能力相适配的神经网络模型的目的。
可选地,所述第一处理资源信息包括以下至少一项:
所述第一通信设备支持的激活函数类型,该激活函数类型包括但不限于S型生长曲线(Sigmoid)函数、双曲正切(Tanh)函数、线性整流函数(Rectified Linear Unit,ReLU)、泄露线性整流(Leaky-ReLU,LReLU)函数、ELU函数、高斯误差线性单元(GaussianError Linerar Units,GELU)函数,归一化指数(Softmax)函数中的至少一项;
所述第一通信设备支持的运算类型;
所述第一通信设备支持的不同运算之间使用的可用资源的换算关系;
所述第一通信设备是否在同一时间单元内支持不同的特定运算或超运算;
所述第一通信设备支持的不同的特定运算之间的组合关系;
所述第一通信设备在第一目标时间内支持的运算次数,所述第一目标时间包括至少一个时间单元;可选地,所述时间单元的单位是时间单位、子载波间隔、时隙和帧中的至少一项。上述时间单位可以是毫秒ms或秒s等。例如,上报1ms或10ms或预设时间集合内支持的运算次数;
所述第一目标时间内支持的运算次数与第二目标时间内支持的运算次数之间的关系,所述第二目标时间包括至少一个时间单元,且所述第二目标时间包含的时间单元与第一目标时间包含的时间单元不同,例如所述第一目标时间内支持的运算次数为第二目标时间内支持的元素次数的N倍,N是根据第一目标时间与第二目标时间的时间长度关系进行换算得到的;如果N包括多个数值(假设第一目标时间包括多个时间粒度对应的时间单元),则可按照预定义规则,根据多个数值确定一个值,如选择最小值、最大值或平均值;
所述第一通信设备完成特定目标的特定运算所需的时间,该特定目标包含目标次数,该目标次数可以是协议约定或网络配置的,该特定运算可以是一种运算,在进行上报时,可上报完整特定目标的至少一种运算所需的时间,可以仅上报完成特定目标的至少一种运算所需的时间,也可以分别上报完成特定目标的不同种运算所需的时间;该特定运算还可以是多种运算的组合,在进行上报时,可以上报完成特定目标的至少一种运算组合所需的时间,也可以分别上报完成特定目标的每种算法组合所需的时间;另外,所述第一通信设备完成特定目标的特定运算所需的时间也可以是根据预设折算规则确定的,例如,按照运算次数进行折算,假设,第一通信设备完成特定目标的预设运算所需要的时间为T0,完成特定运算A所需要的时间为M1倍的T0,则第一通信设备可以上报完成特定运算A所需要的时间为M1倍的T0;又例如,上述特定运算为运算组合,第一通信设备完成特定目标的特定运算组合(包括运算A1和运算A2)所需要的时间为T1,完成特定运算A1所需要的时间为M2倍的T0,完成特定运算A2所需要的时间为M3倍的T0,则可根据M2和M3中较小或较大的值,将所述T1转换为T0,例如,M2小于M3,则将T1转换为M2被的T0;又例如,上述特定运算包括多种运算组合,假设包括运算组合1和运算组合2,其中,完成运算组合1所需要的时间为M4倍的T0,完成运算组合2所需要的时间为M5倍的T0,则可选取M4和M5中较小或较大的值,将完成多种运算组合所需的时间转换为预设倍数的T0;
所述第一通信设备支持的超运算信息,该超运算信息包括超运算类型及超运算类型对应的参数,例如,该超运算类型是一类特定的运算组合,如卷积运算,其对应的参数为核大小和超运算对应的运算能力,该运算能力包括完成特定超运算所需要的时间,或者单位时间完成的超运算次数;
所述第一通信设备支持的神经网络模型信息,该神经网络模型信息包括神经网络类型及神经网络类型对应的参数,该神经网络类型可以是卷积神经网络(ConvolutionalNeural Networks,CNN),transformer,MLP-Mixer等,神经网络类型对应的参数包括但不限于支持的层数、每一层最多的神经元数量、单位时间内完成特定神经网络推理的次数等;
模型大小,所述模型大小用于指示神经网络模型的规模,例如可以用模型参数量进行指示,模型参数量越大表示神经网络模型的规模越大;
目标算法模型的量化比特数,例如模型参数的量化比特数;
模型层数;
模型每一层最大的神经元数量;
每种神经网络算法的运行时间;
多个神经网络算法组合的运行时间;
所述第一通信设备对所述目标算法的目标参数的推荐信息;
所述第一通信设备对预先约定目标算法的支持信息。
其中,上述运算次数可以是指第一目标运算的运算次数,该第一目标运算包括以下至少一项:
乘法运算;
加法运算;
非线性激活函数对应的运算。
上述非线性激活函数对应的运算可以归为一类运算,第一通信设备向第二通信设备上报该类运算对应的总运算次数;上述非线性激活函数对应的运算也可以归为多类运算,例如,针对每种非线性激活函数分别上报其对应的运算次数;上述非线性激活函数对应的运算也可进一步分为若干个子类,上报每个子类对应的运算次数。
可选地,上述第一通信设备在第一目标时间内支持的运算次数包括以下至少一项:
每种算法在第一目标时间内执行时的运算次数,例如,多种非线性激活函数运算的每种算法对应的运算次数;
至少两种运算在第一目标时间内同时执行时的运算次数,这里至少两种运算的组合可以由第一通信设备进行指示,也可以由第二通信设备配置,还可以预先约定;终端可针对每种算法组合上报对应的运算次数,也可以同时上报多种运算组合对应的运算次数,终端还可以单独上报运算组合中每种算法的运算次数,或者,将运算组合中每种算法的运算次数相加后进行上报,或者,将运算组合中至少两组运算对应的运算次数转换成预设运算对应的运算次数进行上报。例如,运算组合包括运算A和运算B,运算A在第一目标时间内执行时能够完成的运算次数为N1,运算B在第一目标时间内执行时能够完成的运算次数为N2,假设预设运算在第一目标时间内执行时能够完成的运算次数为N0,则根据转换比例,将N1和N2均转换成目标倍数的N0,然后基于转换后的次数进行上报。当然,可以将N1转换成一定倍数的N2,或者,将N2转换为一定倍数的N1;
第一目标时间内总的运算次数,该总的运算次数可以将第一目标时间内各种运算对应的运算次数相加,也可以根据各种运算对应的运算次数与预设运算对应的预设次数之间的转换信息,对各种运算对应的运算次数进行转换后相加得到总的运算次数,具体转换方式已在上述内容中进行描述,此处不再赘述。该总的运算次数对应的运算可以是任意运算的组合或预先定义的运算集合内的任意运算组合。
可选地,所述第二处理资源信息包括以下至少一项:
所述第一通信设备支持或不支持的目标算法;
所述第一通信设备按照预定义的时间是否支持所述目标算法;
所述第一通信设备运行所述目标算法所需的时间;
所述第一通信设备运行所述目标算法对应的预期时间;
所述第一通信设备支持的目标算法的目标参数。
具体的,上述第一通信设备运行所述目标算法对应的预期时间包括第一通信设备运行神经网络模型对应的预期时间。除第一通信设备之外的其他通信设备可以按照每个神经网络模型配置其执行的预期时间,第一通信设备指示是否支持该预期时间,或者,其他通信设备向第一通信设备配置神经网络执行的多个预期时间,第一通信设备指示支持哪个预期时间。
另外,其他通信设备还配置神经网络的输入类型,以及输入信息所需要进行的预处理。
上述预期时间可以包含预处理所需的时间,也可以不包含预处理所需要的时间。本申请实施例中,可提前约定或通过交互指示预期时间是否包含预处理所需的时间。
可选地,所述目标算法推荐信息包括以下至少一项:
所述第一通信设备对所述目标算法的目标参数的推荐信息;
所述第一通信设备对所述目标算法的目标参数的修订信息;
所述第一通信设备是否支持所述目标算法的信息。
可选地,所述第一处理资源信息还包括以下至少一项:
所述第一通信设备对所述目标算法的目标参数的推荐信息;
所述第一通信设备对预先约定目标算法的支持信息。
可选地,所述目标参数包括以下至少一项:
激活函数;
层数;
神经元数目;
每层神经元数目;
神经元的连接关系;
目标算法的运行时间,如神经网络模型的运行时间。
本申请实施例中,其他通信设备可向第一通信设备配置同一神经网络类型的多个不同选项(该选项也可描述为上述目标参数),例如,配置对应不同激活函数的同一类型的神经网络模型,或配置对应不同处理能力要求的同一类型的神经网络模型,或配置对应不同层数的同一类型的神经网络模型,或配置对应不同神经元数目的同一类型的神经网络模型,或配置对应不同神经元连接关系的同一类型的神经网络模型。第一通信设备向第二通信设备指示该同一类型的神经网络模型中第一通信设备支持的激活函数、层数、神经元数目、每层神经元数目、神经元连接关系等。另外,上述第一神经网络模型推荐信息中还包括对神经网络模型的运行时间的建议以及是否支持相应的运行时间。
可选地,可通过约定或信息交互的方式确定上述目标参数允许的修订信息。例如,上述层数允许修改为C1或C2。
本申请的一具体实施例中,第一通信设备向第二通信设备发送第一处理资源信息,第二通信设备基于该第一处理资源信息配置神经网络模型信息,第一通信设备进一步向第二通信设备指示是否支持神经网络模型或反馈相应的推荐信息,第二通信设备进一步配置神经网络模型,第一通信设备可以进一步进行指示,这样,通过多轮交互,确定最终使用的神经网络模型。
可选地,所述第一通信设备发送第一处理资源信息,包括:
在满足预先配置的触发条件的情况下,所述第一通信设备发送所述第一处理资源信息。
可选地,所述发送第一交互信息,包括:
在满足预先配置的触发条件的情况下,发送第二处理资源信息和目标算法推荐信息中的至少一项。
可选地,本申请实施例的方法,还包括:
在满足预先配置的触发条件的情况下,所述第一通信设备发送第二交互信息和第三处理资源信息中的至少一项,所述第二交互信息用于指示多个目标算法对嵌入式神经网络处理器NPU的共享能力,所述第三处理资源信息用于指示可用的计算资源。
可选地,所述触发条件包括以下至少一项:
所述第一通信设备的可用资源量小于预设资源量;
第一通信设备的可用资源无法支持指示的目标算法的运行。
第一通信设备无法按照第一处理信息或第二交互信息中的方式进行处理;
第一通信设备的可用资源发生了变化,或者可用资源变化的范围超过一定的阈值;
第一通信设备需要同时运行多个目标算法;
可选地,所述第一处理资源信息或所述第二交互信息还包括以下至少一项:
至少两个目标算法是否能够同时运行,例如第二通信设备向第一通信设备指示预期同时执行的神经网络模型,第二通信设备指示至少第二通信设备指示的预期同时执行的神经网络模型是否能够同时运行;该至少两个目标算法可以属于同一算法类型,也可以属于不同的算法类型;
能够同时运行的目标算法的组合;
不能同时运行的目标算法的组合;
同时运行的目标算法组合中各个目标算法的运行时间;
所述第一通信设备并行运行至少两个目标算法对应的运行时间;
所述目标算法的优先级。
可选地,所述第一通信设备根据所述第一处理资源信息与至少一个目标通信设备进行信息交互,包括:
从至少一个目标通信设备获取第一指示信息;
根据所述第一指示信息,确定第一通信设备使用的目标算法;
所述第一指示信息包括以下至少一项:
目标算法的运行优先级指示信息;
神经网络模型从配置到生效的时间;
至少两个神经网络模型之间进行切换所需要的时间;
至少两个神经网络模型之间进行切换的过程中是否可以运行相应的运算。
可选地,所述第一处理资源信息还包括以下至少一项:
目标算法的运行优先级指示信息,该目标算法的运行优先级可以预先约定或由第一通信设备指示或其他通信设备配置,例如,如果存在多个不同的神经网络模型,在资源有效的情况下,如何进行优先处理;
神经网络模型从配置到生效的时间;
至少两个神经网络模型之间进行切换所需要的时间;
至少两个神经网络模型之间进行切换的过程中是否可以运行相应的运算。
可选地,本申请实施例的方法,还包括:
从至少一个目标通信设备获取更新指示信息,所述更新指示信息用于指示对所述配置信息进行更新;
根据所述更新指示信息,对所述目标算法的配置信息进行更新。
例如,根据上述更新指示信息,对神经网络模型的配置信息进行更新。
可选地,所述第一通信设备根据所述第一处理资源信息与至少一个目标通信设备进行信息交互,包括:
从至少一个目标通信设备获取第二指示信息,所述第二指示信息用于指示所述第一通信设备使用的目标算法。
作为一种可选地的实现方式,该第二指示信息用于指示第一通信设备使用的神经网络模型。
这里,第一通信设备获取该第二指示信息后,基于该第二指示信息确定第一通信设备使用的目标算法,如确定该第一通信设备使用的神经网络模型。
本申请实施例中,第一通信设备可以与其他通信设备交互多种不同的处理资源信息组合,该处理资源信息组合也可描述为能力信息组合。例如,一种处理资源信息组合适用于高性能场景,另一种处理资源信息组合适用于低功耗场景,第一通信设备可以根据自身状态确定当前的处理资源信息组合,上述处于资源信息组合可以包括上述第一处理资源信息和第一交互信息中的至少一项。
另外,本申请实施例中的第一处理资源信息、目标算法的配置信息、第一交互信息、第二处理资源信息、第二交互信息、第三处理资源信息、第一指示信息、第二指示信息或更新指示信息可通过无线资源控制RRC消息、媒体接入控制单元MAC CE消息、上行控制信息UCI和非接入层NAS消息中的至少一项进行发送。
本申请实施例中,上述第一通信设备可以是终端,也可以是网络节点,除第一通信设备之外的其他通信设备可以是核心网节点,如网络数据分析功能(Network DataAnalytics Function,NWDAF)节点或神经网络处理节点。该其他通信设备也可以是基站或新定义的神经网络处理节点。该其他通信设备还可以是多个网络节点的组合。例如,配置信息来自第一网络节点,第一通信设备基于配置信息向第一网络节点或第二网络节点上报第一交互信息,第三网络节点对第一通信设备进行第二轮配置,第一通信设备向第三网络节点或第四网络节点指示最终的模型支持信息。
如图3所示,本申请实施例还提供了一种信息交互方法,包括:
步骤301:第二通信设备获取第一通信设备发送的第一处理资源信息。
其中,所述第一处理资源信息用于指示以下至少一项:
所述第一通信设备运行目标算法的可用资源信息,所述目标算法包括神经网络算法、人工智能算法和机器学习算法中的至少一项;该目标算法可具体包括训练算法、推理算法等。
所述第一通信设备支持的目标算法集合。
步骤302:所述第二通信设备根据所述第一处理资源信息与目标通信设备进行交互,所述目标通信设备包括第一通信设备和第三通信设备中的至少一项。
本申请实施例中,第二通信设备获取第一处理资源信息,基于该第一处理资源信息能够确定该第一通信设备的可用资源信息和/或支持的目标算法集合(如支持的神经网络集合)等,从而后续基于该第一处理资源信息进行交互能够确定该第一通信设备使用的目标算法,如该第一通信设备使用的目标神经网络模型,进而实现了第一通信设备使用的神经网络模型为与其资源能力相适配的神经网络模型的目的。
可选地,所述第二通信设备根据所述第一处理资源信息与目标通信设备进行交互,包括:
所述第二通信设备发送所述目标算法的配置信息,其中,所述神经网络算法的配置信息包括神经网络模型的配置信息。
可选地,所述第二通信设备根据所述第一处理资源信息与目标通信设备进行交互,包括:
所述第二通信设备获取目标通信设备发送的第一交互信息,所述第一交互信息包括第二处理资源信息和目标算法推荐信息中的至少一项,所述第二处理资源信息用于指示所述第一通信设备运行所述目标算法的资源信息。
可选地,所述第二通信设备根据所述第一处理资源信息与目标通信设备进行交互,包括:
发送第一指示信息;
所述第一指示信息包括以下至少一项:
目标算法的运行优先级指示信息;
神经网络模型从配置到生效的时间;
至少两个神经网络模型之间进行切换所需要的时间;
至少两个神经网络模型之间进行切换的过程中是否可以运行相应的运算。
可选地,本申请实施例的方法还包括:
发送第二指示信息,所述第二指示信息用于指示第一通信设备使用的目标算法。
可选地,本申请实施例的方法还包括:
发送更新指示信息,所述更新指示信息用于指示对所述配置信息进行更新。
可选地,所述配置信息包括以下至少一项:
运行目标算法的至少一个预期时间;
目标算法的输入类型;
目标算法的输入信息对应的预处理信息;
同一目标算法类型的神经网络模型对应的不同目标参数;
神经网络模型库。
可选地,所述第一处理资源信息包括以下至少一项:
所述第一通信设备支持的激活函数类型;
所述第一通信设备支持的运算类型;
所述第一通信设备支持的不同运算之间使用的可用资源的换算关系;
所述第一通信设备是否在同一时间单元内支持不同的特定运算或超运算;
所述第一通信设备支持的不同的特定运算之间的组合关系;
所述第一通信设备在第一目标时间内支持的运算次数,所述第一目标时间包括至少一个时间单元;
所述第一目标时间内支持的运算次数与第二目标时间内支持的运算次数之间的关系,所述第二目标时间包括至少一个时间单元,且所述第二目标时间包含的时间单元与第一目标时间包含的时间单元不同;
所述第一通信设备完成特定目标的特定运算所需的时间;
所述第一通信设备支持的超运算信息;
所述第一通信设备支持的神经网络模型信息;
模型大小;
目标算法模型的量化比特数;
模型层数;
模型每一层最大的神经元数量;
每种神经网络算法的运行时间;
多个神经网络算法组合的运行时间。
可选地,所述第二处理资源信息包括以下至少一项:
所述第一通信设备支持或不支持的目标算法;
所述第一通信设备按照预定义的时间是否支持所述目标算法;
所述第一通信设备运行所述目标算法所需的时间;
所述第一通信设备运行所述目标算法对应的预期时间;
所述第一通信设备支持的目标算法的目标参数。
可选地,所述目标算法推荐信息包括以下至少一项:
所述第一通信设备对所述目标算法的目标参数的推荐信息;
所述第一通信设备对所述目标算法的目标参数的修订信息;
所述第一通信设备是否支持所述目标算法的信息。
可选地,所述目标参数包括以下至少一项:
激活函数;
层数;
神经元数目;
每层神经元数目;
神经元的连接关系;
目标算法的运行时间。
可选地,所述第一处理资源信息或所述第二处理资源信息还包括以下至少一项:
至少两个目标算法是否能够同时运行;
能够同时运行的目标算法的组合;
不能同时运行的目标算法的组合;
同时运行的目标算法组合中各个目标算法的运行时间;
所述第一通信设备并行运行至少两个目标算法对应的运行时间;
所述目标算法的优先级。
本申请实施例中,第二通信设备获取第一处理资源信息,基于该第一处理资源信息能够确定该第一通信设备的可用资源信息和/或支持的目标算法集合(如支持的神经网络集合)等,从而后续基于该第一处理资源信息进行交互能够确定该第一通信设备使用的目标算法,如该第一通信设备使用的目标神经网络模型,进而实现了第一通信设备使用的神经网络模型为与其资源能力相适配的神经网络模型的目的。
如图4所示,本申请实施例还提供了一种信息交互方法,包括:
步骤401:第三通信设备获取目标通信设备发送的第一交互信息,所述第一交互信息包括第二处理资源信息和目标算法推荐信息中的至少一项,所述第二处理资源信息用于指示所述第一通信设备运行目标算法的资源信息,所述目标通信设备包括第二通信设备和第一通信设备中的至少一项。
该第一交互信息已在上述方法实施例中进行详细描述,此处不再赘述。
步骤402:所述第三通信设备根据所述第一交互信息与目标通信设备进行信息交互。
可选地,所述第三通信设备与目标通信设备交互的信息包括以下至少一项:
目标算法的运行优先级指示信息;
神经网络模型从配置到生效的时间;
至少两个神经网络模型之间进行切换所需要的时间;
至少两个神经网络模型之间进行切换的过程中是否可以运行相应的运算;
更新指示信息,所述更新指示信息用于指示对目标算法的配置信息进行更新;
所述第一通信设备使用的目标算法。
本申请实施例的方法,第三通信设备获取第一交互信息后,向第一通信设备反馈第一通信设备使用的目标算法、目标标算法的运行优先级指示信息;神经网络模型从配置到生效的时间;至少两个神经网络模型之间进行切换所需要的时间等,使得第一通信设备能够使用预其运行资源相适配的目标算法。
在本申请的一具体实施例中,第一通信设备向第二通信设备发送第一处理资源信息,第二通信设备向第一通信设备发送目标算法的配置信息,第一通信设备向第二通信设备发送第一交互信息,第二通信设备向第一通信设备指示第一通信设备使用的目标神经网络模型。或者,在本申请的另一实施例中,第一通信设备向第二通信设备发送第一处理资源信息,第二通信设备向第一通信设备发送目标算法的配置信息,第一通信设备向第三通信设备发送第一交互信息,第三通信设备指示第一通信设备使用的目标神经网络模型。
本申请实施例提供的信息交互方法,执行主体可以为信息交互装置。本申请实施例中以信息交互装置执行信息交互的方法为例,说明本申请实施例提供的信息交互装置。
如图5所示,本申请实施例还提供了一种信息交互装置500,包括:
第一收发模块501,用于发送第一处理资源信息;
第一交互模块502,用于根据所述第一处理资源信息与至少一个目标通信设备进行信息交互;
其中,所述第一处理资源信息用于指示以下至少一项:
所述第一通信设备运行目标算法的可用资源信息,所述目标算法包括神经网络算法、人工智能算法和机器学习算法中的至少一项;
所述第一通信设备支持的目标算法集合。
可选地,所述第一交互模块用于从至少一个目标通信设备接收所述目标算法的配置信息,其中,所述神经网络算法的配置信息包括神经网络模型的配置信息。
可选地,所述目标算法集合包括以下至少一项:
神经网络模型的集合;
基于特定神经网络进行推理的算法集合;
基于特定神经网络进行训练的集合。
可选地,所述配置信息包括以下至少一项:
运行目标算法的至少一个预期时间;
目标算法的输入类型;
目标算法的输入信息对应的预处理信息;
同一目标算法类型的神经网络模型对应的不同目标参数;
神经网络模型库。
可选地,所述第一交互模块用于根据所述目标算法的配置信息,向至少一个目标通信设备发送第一交互信息,所述第一交互信息包括第二处理资源信息和目标算法推荐信息中的至少一项,所述第二处理资源信息用于指示所述第一通信设备运行所述目标算法的资源信息。
可选地,所述第一处理资源信息包括以下至少一项:
所述第一通信设备支持的激活函数类型;
所述第一通信设备支持的运算类型;
所述第一通信设备支持的不同运算之间使用的可用资源的换算关系;
所述第一通信设备是否在同一时间单元内支持不同的特定运算或超运算;
所述第一通信设备支持的不同的特定运算之间的组合关系;
所述第一通信设备在第一目标时间内支持的运算次数,所述第一目标时间包括至少一个时间单元;
所述第一目标时间内支持的运算次数与第二目标时间内支持的运算次数之间的关系,所述第二目标时间包括至少一个时间单元,且所述第二目标时间包含的时间单元与第一目标时间包含的时间单元不同;
所述第一通信设备完成特定目标的特定运算所需的时间;
所述第一通信设备支持的超运算信息;
所述第一通信设备支持的神经网络模型信息;
模型大小;
目标算法模型的量化比特数;
模型层数;
模型每一层最大的神经元数量;
每种神经网络算法的运行时间;
多个神经网络算法组合的运行时间。
可选地,所述第一通信设备在第一目标时间内支持的运算次数包括以下至少一项:
每种算法在第一目标时间内执行时的运算次数;
至少两种运算在第一目标时间内同时执行时的运算次数;
第一目标时间内总的运算次数。
可选地,所述时间单元的单位是时间单位、子载波间隔、时隙或帧。
可选地,所述第二处理资源信息包括以下至少一项:
所述第一通信设备支持或不支持的目标算法;
所述第一通信设备按照预定义的时间是否支持所述目标算法;
所述第一通信设备运行所述目标算法所需的时间;
所述第一通信设备运行所述目标算法对应的预期时间;
所述第一通信设备支持的目标算法的目标参数。
可选地,所述目标算法推荐信息包括以下至少一项:
所述第一通信设备对所述目标算法的目标参数的推荐信息;
所述第一通信设备对所述目标算法的目标参数的修订信息;
所述第一通信设备是否支持所述目标算法的信息。
可选地,所述第一处理资源信息还包括以下至少一项:
所述第一通信设备对所述目标算法的目标参数的推荐信息;
所述第一通信设备对预先约定目标算法的支持信息。
可选地,所述目标参数包括以下至少一项:
激活函数;
层数;
神经元数目;
每层神经元数目;
神经元的连接关系;
目标算法的运行时间。
可选地,所述第一收发模块用于在满足预先配置的触发条件的情况下,所述第一通信设备发送所述第一处理资源信息。
可选地,本申请实施例的装置,还包括:
第二收发模块,用于在满足预先配置的触发条件的情况下,所述第一通信设备发送第二交互信息和第三处理资源信息中的至少一项,所述第二交互信息用于指示多个目标算法对NPU的共享能力,所述第三处理资源信息用于指示可用的计算资源。
可选地,所述触发条件包括以下至少一项:
所述第一通信设备的可用资源量小于预设资源量;
第一通信设备的可用资源无法支持指示的目标算法的运行。
第一通信设备无法按照第一处理信息或第二交互信息中的方式进行处理;
第一通信设备的可用资源发生了变化,或者可用资源变化的范围超过一定的阈值;
第一通信设备需要同时运行多个目标算法;
可选地,所述第一处理资源信息或所述第二交互信息还包括以下至少一项:
至少两个目标算法是否能够同时运行;
能够同时运行的目标算法的组合;
不能同时运行的目标算法的组合;
同时运行的目标算法组合中各个目标算法的运行时间;
所述第一通信设备并行运行至少两个目标算法对应的运行时间;
所述目标算法的优先级。
可选地,所述第一交互模块包括:
第一获取子模块,用于获取从至少一个目标通信设备第一指示信息;
第一确定子模块,用于根据所述第一指示信息,确定第一通信设备使用的目标算法;
所述第一指示信息包括以下至少一项:
目标算法的运行优先级指示信息;
神经网络模型从配置到生效的时间;
至少两个神经网络模型之间进行切换所需要的时间;
至少两个神经网络模型之间进行切换的过程中是否可以运行相应的运算。
可选地,所述第一处理资源信息还包括以下至少一项:
目标算法的运行优先级指示信息;
神经网络模型从配置到生效的时间;
至少两个神经网络模型之间进行切换所需要的时间;
至少两个神经网络模型之间进行切换的过程中是否可以运行相应的运算。
可选地,本申请实施例的装置还包括:
第三获取模块,用于从至少一个目标通信设备获取更新指示信息,所述更新指示信息用于指示对所述配置信息进行更新;
更新模块,用于根据所述更新指示信息,对所述目标算法的配置信息进行更新。
可选地,所述第一交互模块用于获取从至少一个目标通信设备第二指示信息,所述第二指示信息用于指示所述第一通信设备使用的目标算法。
本申请实施例的装置,发送第一处理资源信息后,其他通信设备能够基于该第一处理资源信息确定该第一通信设备的可用资源信息和/或支持的目标算法集合(如支持的神经网络集合)等,从而后续基于该第一处理资源信息进行交互能够确定第一通信设备使用的目标算法,如该第一通信设备使用的目标神经网络模型,进而实现了第一通信设备使用的神经网络模型为与其资源能力相适配的神经网络模型的目的。
本申请实施例中的信息交互装置可以是电子设备,例如具有操作系统的电子设备,也可以是电子设备中的部件,例如集成电路或芯片。该电子设备可以是终端,也可以为除终端之外的其他设备。示例性的,终端可以包括但不限于上述所列举的终端11的类型,其他设备可以为服务器、网络附属存储器(Network Attached Storage,NAS)等,本申请实施例不作具体限定。
本申请实施例提供的信息交互装置能够实现图2的方法实施例实现的各个过程,并达到相同的技术效果,为避免重复,这里不再赘述。
可选的,如图6所示,本申请实施例还提供一种通信设备600,包括处理器601和存储器602,存储器602上存储有可在所述处理器601上运行的程序或指令,例如,该通信设备600为终端时,该程序或指令被处理器601执行时实现上述第一通信设备侧的信息交互方法实施例的各个步骤,且能达到相同的技术效果。该通信设备600为网络侧设备时,该程序或指令被处理器601执行时实现上述第二通信设备侧或第三通信设备侧的方法实施例的各个步骤,且能达到相同的技术效果,为避免重复,这里不再赘述。
本申请实施例还提供一种第一通信设备,该通信设备为终端,包括处理器和通信接口,通信接口用于发送第一处理资源信息;处理器用于根据所述第一处理资源信息与至少一个通信设备进行信息交互。该实施例与上述第一通信设备侧方法实施例对应,上述方法实施例的各个实施过程和实现方式均可适用于该实施例中,且能达到相同的技术效果。具体地,图7为实现本申请实施例的一种终端的硬件结构示意图。
该终端700包括但不限于:射频单元701、网络模块702、音频输出单元703、输入单元704、传感器705、显示单元706、用户输入单元707、接口单元708、存储器709以及处理器710等中的至少部分部件。
本领域技术人员可以理解,终端700还可以包括给各个部件供电的电源(比如电池),电源可以通过电源管理系统与处理器710逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图7中示出的终端结构并不构成对终端的限定,终端可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,在此不再赘述。
应理解的是,本申请实施例中,输入单元704可以包括图形处理单元(GraphicsProcessing Unit,GPU)7041和麦克风7042,图形处理器7041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元706可包括显示面板7061,可以采用液晶显示器、有机发光二极管等形式来配置显示面板7061。用户输入单元707包括触控面板7071以及其他输入设备7072中的至少一种。触控面板7071,也称为触摸屏。触控面板7071可包括触摸检测装置和触摸控制器两个部分。其他输入设备7072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
本申请实施例中,射频单元701接收来自网络侧设备的下行数据后,可以传输给处理器710进行处理;另外,射频单元701可以向网络侧设备发送上行数据。通常,射频单元701包括但不限于天线、放大器、收发信机、耦合器、低噪声放大器、双工器等。
存储器709可用于存储软件程序或指令以及各种数据。存储器709可主要包括存储程序或指令的第一存储区和存储数据的第二存储区,其中,第一存储区可存储操作系统、至少一个功能所需的应用程序或指令(比如声音播放功能、图像播放功能等)等。此外,存储器709可以包括易失性存储器或非易失性存储器,或者,存储器709可以包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(SynchronousDRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synch link DRAM,SLDRAM)和直接内存总线随机存取存储器(DirectRambus RAM,DRRAM)。本申请实施例中的存储器709包括但不限于这些和任意其它适合类型的存储器。
处理器710可包括一个或多个处理单元;可选的,处理器710集成应用处理器和调制解调处理器,其中,应用处理器主要处理涉及操作系统、用户界面和应用程序等的操作,调制解调处理器主要处理无线通信信号,如基带处理器。可以理解的是,上述调制解调处理器也可以不集成到处理器710中。
所述射频单元701用于发送第一处理资源信息;根据所述第一处理资源信息与至少一个通信设备进行信息交互。
可选地,所述射频单元701用于获取所述目标算法的配置信息,其中,所述神经网络算法的配置信息包括神经网络模型的配置信息。
可选地,所述配置信息包括以下至少一项:
运行目标算法的至少一个预期时间;
目标算法的输入类型;
目标算法的输入信息对应的预处理信息;
同一目标算法类型的神经网络模型对应的不同目标参数;
神经网络模型库。
可选地,所述射频单元701用于根据所述目标算法的配置信息,发送第一交互信息,所述第一交互信息包括第二处理资源信息和目标算法推荐信息中的至少一项,所述第二处理资源信息用于指示所述第一通信设备运行所述目标算法的资源信息。
可选地,所述第一处理资源信息包括以下至少一项:
所述第一通信设备支持的激活函数类型;
所述第一通信设备支持的运算类型;
所述第一通信设备支持的不同运算之间使用的可用资源的换算关系;
所述第一通信设备是否在同一时间单元内支持不同的特定运算或超运算;
所述第一通信设备支持的不同的特定运算之间的组合关系;
所述第一通信设备在第一目标时间内支持的运算次数,所述第一目标时间包括至少一个时间单元;
所述第一目标时间内支持的运算次数与第二目标时间内支持的运算次数之间的关系,所述第二目标时间包括至少一个时间单元,且所述第二目标时间包含的时间单元与第一目标时间包含的时间单元不同;
所述第一通信设备完成特定目标的特定运算所需的时间;
所述第一通信设备支持的超运算信息;
所述第一通信设备支持的神经网络模型信息;
模型大小;
目标算法模型的量化比特数;
模型层数;
模型每一层最大的神经元数量;
每种神经网络算法的运行时间;
多个神经网络算法组合的运行时间。
可选地,所述第一通信设备在第一目标时间内支持的运算次数包括以下至少一项:
每种算法在第一目标时间内执行时的运算次数;
至少两种运算在第一目标时间内同时执行时的运算次数;
第一目标时间内总的运算次数。
可选地,所述时间单元的单位是时间单位、子载波间隔、时隙或帧。
可选地,所述第二处理资源信息包括以下至少一项:
所述第一通信设备支持或不支持的目标算法;
所述第一通信设备按照预定义的时间是否支持所述目标算法;
所述第一通信设备运行所述目标算法所需的时间;
所述第一通信设备运行所述目标算法对应的预期时间;
所述第一通信设备支持的目标算法的目标参数。
可选地,所述目标算法推荐信息包括以下至少一项:
所述第一通信设备对所述目标算法的目标参数的推荐信息;
所述第一通信设备对所述目标算法的目标参数的修订信息;
所述第一通信设备是否支持所述目标算法的信息。
可选地,所述第一处理资源信息还包括以下至少一项:
所述第一通信设备对所述目标算法的目标参数的推荐信息;
所述第一通信设备对预先约定目标算法的支持信息。
可选地,所述目标参数包括以下至少一项:
激活函数;
层数;
神经元数目;
每层神经元数目;
神经元的连接关系;
目标算法的运行时间。
可选地,所述射频单元701用于在满足预先配置的触发条件的情况下,所述第一通信设备发送所述第一处理资源信息、第二处理资源信息和目标算法推荐信息中的至少一项。
可选地,所述射频单元701用于在满足预先配置的触发条件的情况下,发送第二交互信息和第三处理资源信息中的至少一项,所述第二交互信息用于指示多个目标算法对NPU的共享能力,所述第三处理资源信息用于指示可用的计算资源。
可选地,所述触发条件包括以下至少一项:
所述第一通信设备的可用资源量小于预设资源量;
第一通信设备的可用资源无法支持指示的目标算法的运行。
第一通信设备无法按照第一处理信息或第二交互信息中的方式进行处理;
第一通信设备的可用资源发生了变化,或者可用资源变化的范围超过一定的阈值;
第一通信设备需要同时运行多个目标算法;
可选地,所述第一处理资源信息或所述第二交互信息还包括以下至少一项:
至少两个目标算法是否能够同时运行;
能够同时运行的目标算法的组合;
不能同时运行的目标算法的组合;
同时运行的目标算法组合中各个目标算法的运行时间;
所述第一通信设备并行运行至少两个目标算法对应的运行时间;
所述目标算法的优先级。
可选地,所述射频单元701用于获取从至少一个目标通信设备第一指示信息;根据所述第一指示信息,确定第一通信设备使用的目标算法;
所述第一指示信息包括以下至少一项:
目标算法的运行优先级指示信息;
神经网络模型从配置到生效的时间;
至少两个神经网络模型之间进行切换所需要的时间;
至少两个神经网络模型之间进行切换的过程中是否可以运行相应的运算。
可选地,所述第一处理资源信息还包括以下至少一项:
目标算法的运行优先级指示信息;
神经网络模型从配置到生效的时间;
至少两个神经网络模型之间进行切换所需要的时间;
至少两个神经网络模型之间进行切换的过程中是否可以运行相应的运算。
可选地,所述射频单元701用于从至少一个目标通信设备获取更新指示信息,所述更新指示信息用于指示对所述配置信息进行更新;所述处理器710用于根据所述更新指示信息,对所述目标算法的配置信息进行更新。
可选地,所述射频单元701用于从至少一个目标通信设备获取第二指示信息,所述第二指示信息用于指示所述第一通信设备使用的目标算法。
本申请实施例中,终端发送第一处理资源信息后,其他通信设备能够基于该第一处理资源信息确定该终端的可用资源信息和/或支持的目标算法集合(如支持的神经网络集合)等,从而后续基于该第一处理资源信息进行交互能够确定该终端使用的目标算法,如该终端使用的目标神经网络模型,进而实现了终端使用的神经网络模型为与其资源能力相适配的神经网络模型的目的。
如图8所述,本申请实施例还提供了一种信息交互装置800,包括:
第一获取模块801,用于获取第一通信设备发送的第一处理资源信息;
第二交互模块802,用于根据所述第一处理资源信息与目标通信设备进行交互,所述目标通信设备包括第一通信设备和第三通信设备中的至少一项;
其中,所述第一处理资源信息用于指示以下至少一项:
所述第一通信设备运行目标算法的可用资源信息,所述目标算法包括神经网络算法、人工智能算法和机器学习算法中的至少一项;
所述第一通信设备支持的目标算法集合。
可选地,所述第二交互模块用于发送所述目标算法的配置信息,其中,所述神经网络算法的配置信息包括神经网络模型的配置信息。
可选地,所述第二交互模块用于获取目标通信设备发送的第一交互信息,所述第一交互信息包括第二处理资源信息和目标算法推荐信息中的至少一项,所述第二处理资源信息用于指示所述第一通信设备运行所述目标算法的资源信息。
可选地,所述第二交互模块用于发送第一指示信息;
所述第一指示信息包括以下至少一项:
目标算法的运行优先级指示信息;
神经网络模型从配置到生效的时间;
至少两个神经网络模型之间进行切换所需要的时间;
至少两个神经网络模型之间进行切换的过程中是否可以运行相应的运算。
可选地,本申请实施例的装置,还包括:
第三收发模块,用于发送第二指示信息,所述第二指示信息用于指示第一通信设备使用的目标算法。
可选地,本申请实施例的装置,还包括:
第四收发模块,用于发送更新指示信息,所述更新指示信息用于指示对所述配置信息进行更新。
可选地,所述配置信息包括以下至少一项:
运行目标算法的至少一个预期时间;
目标算法的输入类型;
目标算法的输入信息对应的预处理信息;
同一目标算法类型的神经网络模型对应的不同目标参数;
神经网络模型库。
可选地,所述第一处理资源信息包括以下至少一项:
所述第一通信设备支持的激活函数类型;
所述第一通信设备支持的运算类型;
所述第一通信设备支持的不同运算之间使用的可用资源的换算关系;
所述第一通信设备是否在同一时间单元内支持不同的特定运算或超运算;
所述第一通信设备支持的不同的特定运算之间的组合关系;
所述第一通信设备在第一目标时间内支持的运算次数,所述第一目标时间包括至少一个时间单元;
所述第一目标时间内支持的运算次数与第二目标时间内支持的运算次数之间的关系,所述第二目标时间包括至少一个时间单元,且所述第二目标时间包含的时间单元与第一目标时间包含的时间单元不同;
所述第一通信设备完成特定目标的特定运算所需的时间;
所述第一通信设备支持的超运算信息;
所述第一通信设备支持的神经网络模型信息;
模型大小;
目标算法模型的量化比特数;
模型层数;
模型每一层最大的神经元数量;
每种神经网络算法的运行时间;
多个神经网络算法组合的运行时间。
可选地,所述第二处理资源信息包括以下至少一项:
所述第一通信设备支持或不支持的目标算法;
所述第一通信设备按照预定义的时间是否支持所述目标算法;
所述第一通信设备运行所述目标算法所需的时间;
所述第一通信设备运行所述目标算法对应的预期时间;
所述第一通信设备支持的目标算法的目标参数。
可选地,所述目标算法推荐信息包括以下至少一项:
所述第一通信设备对所述目标算法的目标参数的推荐信息;
所述第一通信设备对所述目标算法的目标参数的修订信息;
所述第一通信设备是否支持所述目标算法的信息。
可选地,所述目标参数包括以下至少一项:
激活函数;
层数;
神经元数目;
每层神经元数目;
神经元的连接关系;
目标算法的运行时间。
可选地,所述第一处理资源信息或所述第二处理资源信息还包括以下至少一项:
至少两个目标算法是否能够同时运行;
能够同时运行的目标算法的组合;
不能同时运行的目标算法的组合;
同时运行的目标算法组合中各个目标算法的运行时间;
所述第一通信设备并行运行至少两个目标算法对应的运行时间;
所述目标算法的优先级。
本申请实施例的装置,获取第一处理资源信息,基于该第一处理资源信息能够确定第一通信设备的可用资源信息和/或支持的目标算法集合(如支持的神经网络集合)等,从而后续基于该第一处理资源信息进行交互能够确定该第一通信设备使用的目标算法,如该第一通信设备使用的目标神经网络模型,进而实现了第一通信设备使用的神经网络模型为与其资源能力相适配的神经网络模型的目的。
如图9所述,本申请实施例还提供了一种信息交互装置900,包括:
第二获取模块901,用于获取目标通信设备发送的第一交互信息,所述第一交互信息包括第二处理资源信息和目标算法推荐信息中的至少一项,所述第二处理资源信息用于指示所述第一通信设备运行目标算法中的资源信息,所述目标通信设备包括第二通信设备和第一通信设备中的至少一项;
第三交互模块902,用于根据所述第一交互信息与目标通信设备进行信息交互。
可选地,交互的信息包括以下至少一项:
目标算法的运行优先级指示信息;
神经网络模型从配置到生效的时间;
至少两个神经网络模型之间进行切换所需要的时间;
至少两个神经网络模型之间进行切换的过程中是否可以运行相应的运算;
更新指示信息,所述更新指示信息用于指示对目标算法的配置信息进行更新;
所述第一通信设备使用的目标算法。
本申请实施例的信息交互装置,获取第一交互信息后,向第一通信设备或其他通信设备反馈第一通信设备使用的目标算法、标算法的运行优先级指示信息;神经网络模型从配置到生效的时间;至少两个神经网络模型之间进行切换所需要的时间等,使得第一通信设备能够使用预其运行资源相适配的目标算法。
本申请实施例还提供一种第二通信设备,该第二通信设备具体为网络侧设备,包括处理器和通信接口,通信接口用于获取第一处理资源信息,根据所述第一处理资源信息与目标通信设备进行交互,所述目标通信设备包括第一通信设备和第三通信设备中的至少一项。该网络侧设备实施例与上述第二通信设备侧方法实施例对应,上述第二通信设备侧的方法实施例的各个实施过程和实现方式均可适用于该网络侧设备实施例中,且能达到相同的技术效果。
本申请实施例还提供一种第三通信设备,该第二通信设备具体为网络侧设备,包括处理器和通信接口,通信接口用于获取目标通信设备发送的第一交互信息,所述第一交互信息包括第二处理资源信息和目标算法推荐信息中的至少一项,所述第二处理资源信息用于指示所述第一通信设备运行目标算法中的资源信息,所述目标通信设备包括第二通信设备和第一通信设备中的至少一项;根据所述第一交互信息与目标通信设备进行信息交互。该网络侧设备实施例与上述第三通信设备侧方法实施例对应,上述第三通信设备侧的方法实施例的各个实施过程和实现方式均可适用于该网络侧设备实施例中,且能达到相同的技术效果。
具体地,本申请实施例还提供了一种网络侧设备,该网络侧设备具体为第二通信设备或第三通信设备。如图10所示,该网络侧设备1000包括:天线101、射频装置102、基带装置103、处理器104和存储器105。天线101与射频装置102连接。在上行方向上,射频装置102通过天线101接收信息,将接收的信息发送给基带装置103进行处理。在下行方向上,基带装置103对要发送的信息进行处理,并发送给射频装置102,射频装置102对收到的信息进行处理后经过天线101发送出去。
以上实施例中第二通信设备或第三通信设备执行的方法可以在基带装置103中实现,该基带装置103包括基带处理器。
基带装置103例如可以包括至少一个基带板,该基带板上设置有多个芯片,如图10所示,其中一个芯片例如为基带处理器,通过总线接口与存储器105连接,以调用存储器105中的程序,执行以上方法实施例中所示的第二通信设备或第三通信设备的操作。
该网络侧设备还可以包括网络接口106,该接口例如为通用公共无线接口(commonpublic radio interface,CPRI)。
具体地,本发明实施例的网络侧设备1000还包括:存储在存储器105上并可在处理器104上运行的指令或程序,处理器104调用存储器105中的指令或程序执行图8或图9所示各模块执行的方法,并达到相同的技术效果,为避免重复,故不在此赘述。
具体地,本申请实施例还提供了一种网络侧设备,该网络侧设备具体为第二通信设备或第三通信设备。如图11所示,该网络侧设备1100包括:处理器1101、网络接口1102和存储器1103。其中,网络接口1102例如为通用公共无线接口(common public radiointerface,CPRI)。
具体地,本发明实施例的网络侧设备1100还包括:存储在存储器1103上并可在处理器1101上运行的指令或程序,处理器1101调用存储器1103中的指令或程序执行图8或图9所示各模块执行的方法,并达到相同的技术效果,为避免重复,故不在此赘述。
本申请实施例还提供一种可读存储介质,所述可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述信息交互法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,所述处理器为上述实施例中所述的终端中的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器ROM、随机存取存储器RAM、磁碟或者光盘等。
本申请实施例另提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现上述信息交互方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为系统级芯片,系统芯片,芯片系统或片上系统芯片等。
本申请实施例另提供了一种计算机程序/程序产品,所述计算机程序/程序产品被存储在存储介质中,所述计算机程序/程序产品被至少一个处理器执行以实现上述信息交互方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本申请实施例还提供了一种信息交互系统,包括:终端及网络侧设备,所述终端可用于执行如上所述的第一通信设备执行的信息交互方法的步骤,所述网络侧设备可用于执行如上所述的第二通信设备执行的信息交互方法的步骤。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。
Claims (37)
1.一种信息交互方法,其特征在于,包括:
第一通信设备发送第一处理资源信息;
所述第一通信设备根据所述第一处理资源信息与至少一个目标通信设备进行信息交互;
其中,所述第一处理资源信息用于指示以下至少一项:
所述第一通信设备运行目标算法的可用资源信息,所述目标算法包括神经网络算法、人工智能算法和机器学习算法中的至少一项;
所述第一通信设备支持的目标算法集合。
2.根据权利要求1所述的方法,其特征在于,所述第一通信设备根据所述第一处理资源信息与至少一个目标通信设备进行信息交互,包括:
所述第一通信设备从至少一个目标通信设备接收所述目标算法的配置信息,其中,所述神经网络算法的配置信息包括神经网络模型的配置信息。
3.根据权利要求2所述的方法,其特征在于,所述配置信息包括以下至少一项:
运行目标算法的至少一个预期时间;
目标算法的输入类型;
目标算法的输入信息对应的预处理信息;
同一目标算法类型的神经网络模型对应的不同目标参数;
神经网络模型库。
4.根据权利要求2所述的方法,其特征在于,还包括:
从至少一个目标通信设备获取更新指示信息,所述更新指示信息用于指示对所述配置信息进行更新;
根据所述更新指示信息,对所述目标算法的配置信息进行更新。
5.根据权利要求1或2所述的方法,其特征在于,所述第一通信设备根据所述第一处理资源信息与至少一个目标通信设备进行信息交互,还包括:
所述第一通信设备根据所述目标算法的配置信息,向至少一个目标通信设备发送第一交互信息,所述第一交互信息包括第二处理资源信息和目标算法推荐信息中的至少一项,所述第二处理资源信息用于指示所述第一通信设备运行所述目标算法的资源信息。
6.根据权利要求5所述的方法,其特征在于,所述发送第一交互信息,包括:
在满足预先配置的触发条件的情况下,发送第二处理资源信息和目标算法推荐信息中的至少一项。
7.根据权利要求5或6所述的方法,其特征在于,所述第二处理资源信息包括以下至少一项:
所述第一通信设备支持或不支持的目标算法;
所述第一通信设备按照预定义的时间是否支持所述目标算法;
所述第一通信设备运行所述目标算法所需的时间;
所述第一通信设备运行所述目标算法对应的预期时间;
所述第一通信设备支持的目标算法的目标参数。
8.根据权利要求5或6所述的方法,其特征在于,所述目标算法推荐信息包括以下至少一项:
所述第一通信设备对所述目标算法的目标参数的推荐信息;
所述第一通信设备对所述目标算法的目标参数的修订信息;
所述第一通信设备是否支持所述目标算法的信息。
9.根据权利要求1所述的方法,其特征在于,所述第一处理资源信息包括以下至少一项:
所述第一通信设备支持的激活函数类型;
所述第一通信设备支持的运算类型;
所述第一通信设备支持的不同运算之间使用的可用资源的换算关系;
所述第一通信设备是否在同一时间单元内支持不同的特定运算或超运算;
所述第一通信设备支持的不同的特定运算之间的组合关系;
所述第一通信设备在第一目标时间内支持的运算次数,所述第一目标时间包括至少一个时间单元;
所述第一目标时间内支持的运算次数与第二目标时间内支持的运算次数之间的关系,所述第二目标时间包括至少一个时间单元,且所述第二目标时间包含的时间单元与第一目标时间包含的时间单元不同;
所述第一通信设备完成特定目标的特定运算所需的时间;
所述第一通信设备支持的超运算信息;
所述第一通信设备支持的神经网络模型信息;
模型大小;
目标算法模型的量化比特数;
模型层数;
模型每一层最大的神经元数量;
每种神经网络算法的运行时间;
多个神经网络算法组合的运行时间;
所述第一通信设备对所述目标算法的目标参数的推荐信息;
所述第一通信设备对预先约定目标算法的支持信息;
目标算法的运行优先级指示信息;
神经网络模型从配置到生效的时间;
至少两个神经网络模型之间进行切换所需要的时间;
至少两个神经网络模型之间进行切换的过程中是否可以运行相应的运算。
10.根据权利要求9所述的方法,其特征在于,所述第一通信设备在第一目标时间内支持的运算次数包括以下至少一项:
每种算法在第一目标时间内执行时的运算次数;
至少两种运算在第一目标时间内同时执行时的运算次数;
第一目标时间内总的运算次数。
11.根据权利要求1所述的方法,其特征在于,所述第一通信设备发送第一处理资源信息,包括:
在满足预先配置的触发条件的情况下,所述第一通信设备发送所述第一处理资源信息。
12.根据权利要求3、7、8或9所述的方法,其特征在于,所述目标参数包括以下至少一项:
激活函数;
层数;
神经元数目;
每层神经元数目;
神经元的连接关系;
目标算法的运行时间。
13.根据权利要求1或2或5所述的方法,其特征在于,还包括:
在满足预先配置的触发条件的情况下,所述第一通信设备发送第二交互信息和第三处理资源信息中的至少一项,所述第二交互信息用于指示多个目标算法对NPU的共享能力,所述第三处理资源信息用于指示可用的计算资源。
14.根据权利要求6、11或13所述的方法,其特征在于,所述触发条件包括以下至少一项:
所述第一通信设备的可用资源量小于预设资源量;
第一通信设备的可用资源无法支持指示的目标算法的运行。
第一通信设备无法按照第一处理信息或第二交互信息中的方式进行处理;
第一通信设备的可用资源发生了变化,或者可用资源变化的范围超过一定的阈值;
第一通信设备需要同时运行多个目标算法。
15.根据权利要求13所述的方法,其特征在于,所述第一处理资源信息或所述第二交互信息还包括以下至少一项:
至少两个目标算法是否能够同时运行;
能够同时运行的目标算法的组合;
不能同时运行的目标算法的组合;
同时运行的目标算法组合中各个目标算法的运行时间;
所述第一通信设备并行运行至少两个目标算法对应的运行时间;
所述目标算法的优先级。
16.根据权利要求1所述的方法,其特征在于,所述第一通信设备根据所述第一处理资源信息与至少一个目标通信设备进行信息交互,包括:
从至少一个目标通信设备获取第一指示信息;
根据所述第一指示信息,确定第一通信设备使用的目标算法;
所述第一指示信息包括以下至少一项:
目标算法的运行优先级指示信息;
神经网络模型从配置到生效的时间;
至少两个神经网络模型之间进行切换所需要的时间;
至少两个神经网络模型之间进行切换的过程中是否可以运行相应的运算。
17.根据权利要求1或2所述的方法,其特征在于,所述第一通信设备根据所述第一处理资源信息与至少一个目标通信设备进行信息交互,包括:
从至少一个目标通信设备获取第二指示信息,所述第二指示信息用于指示所述第一通信设备使用的目标算法。
18.根据权利要求1所述的方法,其特征在于,所述目标算法集合包括以下至少一项:
神经网络模型的集合;
基于特定神经网络进行推理的算法集合;
基于特定神经网络进行训练的集合。
19.一种信息交互方法,其特征在于,包括:
第二通信设备获取第一通信设备发送的第一处理资源信息;
所述第二通信设备根据所述第一处理资源信息与目标通信设备进行交互,所述目标通信设备包括第一通信设备和第三通信设备中的至少一项;
其中,所述第一处理资源信息用于指示以下至少一项:
所述第一通信设备运行目标算法的可用资源信息,所述目标算法包括神经网络算法、人工智能算法和机器学习算法中的至少一项;
所述第一通信设备支持的目标算法集合。
20.根据权利要求19所述的方法,其特征在于,所述第二通信设备根据所述第一处理资源信息与目标通信设备进行交互,包括:
所述第二通信设备发送所述目标算法的配置信息,其中,所述神经网络算法的配置信息包括神经网络模型的配置信息。
21.根据权利要求20所述的方法,其特征在于,所述第二通信设备根据所述第一处理资源信息与目标通信设备进行交互,包括:
所述第二通信设备获取目标通信设备发送的第一交互信息,所述第一交互信息包括第二处理资源信息和目标算法推荐信息中的至少一项,所述第二处理资源信息用于指示所述第一通信设备运行所述目标算法的资源信息。
22.根据权利要求19或21所述的方法,其特征在于,所述第二通信设备根据所述第一处理资源信息与目标通信设备进行交互,包括:
发送第一指示信息;
所述第一指示信息包括以下至少一项:
目标算法的运行优先级指示信息;
神经网络模型从配置到生效的时间;
至少两个神经网络模型之间进行切换所需要的时间;
至少两个神经网络模型之间进行切换的过程中是否可以运行相应的运算。
23.根据权利要求19或21所述的方法,其特征在于,还包括:
发送第二指示信息,所述第二指示信息用于指示第一通信设备使用的目标算法。
24.根据权利要求20所述的方法,其特征在于,还包括:
发送更新指示信息,所述更新指示信息用于指示对所述配置信息进行更新。
25.根据权利要求20所述的方法,其特征在于,所述配置信息包括以下至少一项:
运行目标算法的至少一个预期时间;
目标算法的输入类型;
目标算法的输入信息对应的预处理信息;
同一目标算法类型的神经网络模型对应的不同目标参数;
神经网络模型库。
26.根据权利要求19所述的方法,其特征在于,所述第一处理资源信息包括以下至少一项:
所述第一通信设备支持的激活函数类型;
所述第一通信设备支持的运算类型;
所述第一通信设备支持的不同运算之间使用的可用资源的换算关系;
所述第一通信设备是否在同一时间单元内支持不同的特定运算或超运算;
所述第一通信设备支持的不同的特定运算之间的组合关系;
所述第一通信设备在第一目标时间内支持的运算次数,所述第一目标时间包括至少一个时间单元;
所述第一目标时间内支持的运算次数与第二目标时间内支持的运算次数之间的关系,所述第二目标时间包括至少一个时间单元,且所述第二目标时间包含的时间单元与第一目标时间包含的时间单元不同;
所述第一通信设备完成特定目标的特定运算所需的时间;
所述第一通信设备支持的超运算信息;
所述第一通信设备支持的神经网络模型信息;
模型大小;
目标算法模型的量化比特数;
模型层数;
模型每一层最大的神经元数量;
每种神经网络算法的运行时间;
多个神经网络算法组合的运行时间。
27.根据权利要求21所述的方法,其特征在于,所述第二处理资源信息包括以下至少一项:
所述第一通信设备支持或不支持的目标算法;
所述第一通信设备按照预定义的时间是否支持所述目标算法;
所述第一通信设备运行所述目标算法所需的时间;
所述第一通信设备运行所述目标算法对应的预期时间;
所述第一通信设备支持的目标算法的目标参数。
28.根据权利要求21所述的方法,其特征在于,所述目标算法推荐信息包括以下至少一项:
所述第一通信设备对所述目标算法的目标参数的推荐信息;
所述第一通信设备对所述目标算法的目标参数的修订信息;
所述第一通信设备是否支持所述目标算法的信息。
29.根据权利要求25、27或28所述的方法,其特征在于,所述目标参数包括以下至少一项:
激活函数;
层数;
神经元数目;
每层神经元数目;
神经元的连接关系;
目标算法的运行时间。
30.根据权利要求21所述的方法,其特征在于,所述第一处理资源信息或所述第二处理资源信息还包括以下至少一项:
至少两个目标算法是否能够同时运行;
能够同时运行的目标算法的组合;
不能同时运行的目标算法的组合;
同时运行的目标算法组合中各个目标算法的运行时间;
所述第一通信设备并行运行至少两个目标算法对应的运行时间;
所述目标算法的优先级。
31.一种信息交互方法,其特征在于,包括:
第三通信设备获取目标通信设备发送的第一交互信息,所述第一交互信息包括第二处理资源信息和目标算法推荐信息中的至少一项,所述第二处理资源信息用于指示所述第一通信设备运行目标算法中的资源信息,所述目标通信设备包括第二通信设备和第一通信设备中的至少一项;
所述第三通信设备根据所述第一交互信息与目标通信设备进行信息交互。
32.根据权利要求31所述的方法,其特征在于,所述第三通信设备与目标通信设备交互的信息包括以下至少一项:
目标算法的运行优先级指示信息;
神经网络模型从配置到生效的时间;
至少两个神经网络模型之间进行切换所需要的时间;
至少两个神经网络模型之间进行切换的过程中是否可以运行相应的运算;
更新指示信息,所述更新指示信息用于指示对目标算法的配置信息进行更新;
所述第一通信设备使用的目标算法。
33.一种信息交互的装置,其特征在于,包括:
第一收发模块,用于发送第一处理资源信息;
第一交互模块,用于根据所述第一处理资源信息与至少一个目标通信设备进行信息交互;
其中,所述第一处理资源信息用于指示以下至少一项:
所述第一通信设备运行目标算法的可用资源信息,所述目标算法包括神经网络算法、人工智能算法和机器学习算法中的至少一项;
所述第一通信设备支持的目标算法集合。
34.一种信息交互装置,其特征在于,包括:
第一获取模块,用于获取第一通信设备发送的第一处理资源信息;
第二交互模块,用于根据所述第一处理资源信息与目标通信设备进行交互,所述目标通信设备包括第一通信设备和第三通信设备中的至少一项;
其中,所述第一处理资源信息用于指示以下至少一项:
所述第一通信设备运行目标算法的可用资源信息,所述目标算法包括神经网络算法、人工智能算法和机器学习算法中的至少一项;
所述第一通信设备支持的目标算法集合。
35.一种信息交互装置,其特征在于,包括:
第二获取模块,用于获取目标通信设备发送的第一交互信息,所述第一交互信息包括第二处理资源信息和目标算法推荐信息中的至少一项,所述第二处理资源信息用于指示所述第一通信设备运行目标算法中的资源信息,所述目标通信设备包括第二通信设备和第一通信设备中的至少一项;
第三交互模块,用于根据所述第一交互信息与目标通信设备进行信息交互。
36.一种通信设备,其特征在于,包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1至18任一项所述的信息交互方法的步骤,或者,实现如权利要求19至30任一项所述的信息交互方法的步骤,或者,实现如权利要求31至32任一项所述的信息交互方法的步骤。
37.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1至18任一项所述的信息交互方法的步骤,或者,实现如权利要求19至30任一项所述的信息交互方法的步骤,或者,实现如权利要求31至32任一项所述的信息交互方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111443949.5A CN116208492A (zh) | 2021-11-30 | 2021-11-30 | 信息交互方法、装置及通信设备 |
PCT/CN2022/133713 WO2023098535A1 (zh) | 2021-11-30 | 2022-11-23 | 信息交互方法、装置及通信设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111443949.5A CN116208492A (zh) | 2021-11-30 | 2021-11-30 | 信息交互方法、装置及通信设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116208492A true CN116208492A (zh) | 2023-06-02 |
Family
ID=86506417
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111443949.5A Pending CN116208492A (zh) | 2021-11-30 | 2021-11-30 | 信息交互方法、装置及通信设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN116208492A (zh) |
WO (1) | WO2023098535A1 (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180241810A1 (en) * | 2017-02-06 | 2018-08-23 | Audi Ag | Method for Operating a Motor Vehicle and Motor Vehicle |
CN109246232A (zh) * | 2018-09-30 | 2019-01-18 | 西安万像电子科技有限公司 | 数据传输方法、系统及装置 |
CN110750342A (zh) * | 2019-05-23 | 2020-02-04 | 北京嘀嘀无限科技发展有限公司 | 调度方法、装置、电子设备及可读存储介质 |
CN111869303A (zh) * | 2020-06-03 | 2020-10-30 | 北京小米移动软件有限公司 | 一种资源调度的方法、装置、通信设备及存储介质 |
CN113656150A (zh) * | 2021-08-20 | 2021-11-16 | 上海熠知电子科技有限公司 | 深度学习算力虚拟化系统 |
WO2021227069A1 (zh) * | 2020-05-15 | 2021-11-18 | Oppo广东移动通信有限公司 | 一种模型更新方法及装置、通信设备 |
CN114885308A (zh) * | 2021-02-05 | 2022-08-09 | 维沃移动通信有限公司 | 算力服务方法和设备 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109714422A (zh) * | 2018-12-28 | 2019-05-03 | 深圳市易成自动驾驶技术有限公司 | 基于自动驾驶的计算资源共享方法、系统及可读存储介质 |
EP3786781A1 (fr) * | 2019-08-30 | 2021-03-03 | Bull Sas | Systeme d'aide a la conception d'application d'intelligence artificielle, executable sur des plateformes informatiques distribuees |
CN111443917B (zh) * | 2020-03-26 | 2023-12-22 | 上海寒武纪信息科技有限公司 | 神经网络运行优化方法、装置及相关产品 |
CN112199385B (zh) * | 2020-09-30 | 2024-05-10 | 北京百度网讯科技有限公司 | 用于人工智能ai的处理方法、装置、电子设备和存储介质 |
-
2021
- 2021-11-30 CN CN202111443949.5A patent/CN116208492A/zh active Pending
-
2022
- 2022-11-23 WO PCT/CN2022/133713 patent/WO2023098535A1/zh unknown
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180241810A1 (en) * | 2017-02-06 | 2018-08-23 | Audi Ag | Method for Operating a Motor Vehicle and Motor Vehicle |
CN109246232A (zh) * | 2018-09-30 | 2019-01-18 | 西安万像电子科技有限公司 | 数据传输方法、系统及装置 |
CN110750342A (zh) * | 2019-05-23 | 2020-02-04 | 北京嘀嘀无限科技发展有限公司 | 调度方法、装置、电子设备及可读存储介质 |
WO2021227069A1 (zh) * | 2020-05-15 | 2021-11-18 | Oppo广东移动通信有限公司 | 一种模型更新方法及装置、通信设备 |
CN111869303A (zh) * | 2020-06-03 | 2020-10-30 | 北京小米移动软件有限公司 | 一种资源调度的方法、装置、通信设备及存储介质 |
CN114885308A (zh) * | 2021-02-05 | 2022-08-09 | 维沃移动通信有限公司 | 算力服务方法和设备 |
CN113656150A (zh) * | 2021-08-20 | 2021-11-16 | 上海熠知电子科技有限公司 | 深度学习算力虚拟化系统 |
Non-Patent Citations (3)
Title |
---|
""R1-2104541 Discussion on Type A PUSCH repetitions for Msg3-final"", 3GPP TSG_RAN\\WG1_RL1, 12 May 2021 (2021-05-12) * |
XIONG YU: "The Correlation of Network Topology and Power System Resilience by Using Neural Network Analysis", 《2020 IEEE 11TH INTERNATIONAL SYMPOSIUM ON POWER ELECTRONICS FOR DISTRIBUTED GENERATION SYSTEMS (PEDG)》, 9 November 2020 (2020-11-09) * |
邓晓衡;关培源;万志文;刘恩陆;罗杰;赵智慧;刘亚军;张洪刚;: "基于综合信任的边缘计算资源协同研究", 计算机研究与发展, no. 03, 15 March 2018 (2018-03-15) * |
Also Published As
Publication number | Publication date |
---|---|
WO2023098535A1 (zh) | 2023-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116266216A (zh) | 客户端筛选方法及装置、客户端及中心设备 | |
CN116208492A (zh) | 信息交互方法、装置及通信设备 | |
CN116208484A (zh) | 信息交互方法、装置及通信设备 | |
CN117641433A (zh) | Csi预测处理方法、装置、通信设备及可读存储介质 | |
CN116933873A (zh) | 样本确定方法、装置及设备 | |
CN116488689A (zh) | 波束信息交互方法、装置、设备及存储介质 | |
CN116137596A (zh) | Ai信息的传输方法和设备 | |
CN117639862A (zh) | Csi预测处理方法、装置、通信设备及可读存储介质 | |
CN116208494A (zh) | Ai模型切换的处理方法、装置及通信设备 | |
CN117938214A (zh) | 传输方法、装置、通信设备及可读存储介质 | |
CN118055421A (zh) | 波束预测方法、装置、终端、网络侧设备及存储介质 | |
CN116418797A (zh) | Ai网络信息传输方法、装置及通信设备 | |
CN117875380A (zh) | 数据处理方法、装置及电子设备 | |
CN116744374A (zh) | 能力信息上报方法、接收方法、终端、设备和存储介质 | |
CN116939713A (zh) | 信息反馈方法、装置及设备 | |
CN116744451A (zh) | 传输方法、装置、终端和存储介质 | |
CN117835262A (zh) | Ai模型的处理方法、装置及通信设备 | |
CN117579201A (zh) | 模型匹配方法、装置、通信设备及可读存储介质 | |
CN116233906A (zh) | 测量方法、装置、设备及存储介质 | |
CN117440449A (zh) | Ai模型信息传输方法、装置及设备 | |
CN117294405A (zh) | 信道状态信息csi上报配置方法、终端及网络侧设备 | |
CN117692954A (zh) | 测量反馈处理方法、装置、终端及网络侧设备 | |
CN116419209A (zh) | 数据处理的方法、装置及通信设备 | |
CN117835405A (zh) | 人工智能ai模型传输方法、装置、终端及介质 | |
CN116743328A (zh) | 切换行为确定方法、参数信息配置方法、终端和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |