CN117896714A - 模型选择方法、终端及网络侧设备 - Google Patents
模型选择方法、终端及网络侧设备 Download PDFInfo
- Publication number
- CN117896714A CN117896714A CN202211261960.4A CN202211261960A CN117896714A CN 117896714 A CN117896714 A CN 117896714A CN 202211261960 A CN202211261960 A CN 202211261960A CN 117896714 A CN117896714 A CN 117896714A
- Authority
- CN
- China
- Prior art keywords
- model
- terminal
- data
- network side
- force information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010187 selection method Methods 0.000 title abstract description 28
- 238000012545 processing Methods 0.000 claims abstract description 114
- 238000004364 calculation method Methods 0.000 claims abstract description 106
- 238000000034 method Methods 0.000 claims description 112
- 238000000638 solvent extraction Methods 0.000 claims 1
- 239000000758 substrate Substances 0.000 claims 1
- 238000004891 communication Methods 0.000 abstract description 25
- 230000006870 function Effects 0.000 description 72
- 230000011218 segmentation Effects 0.000 description 14
- 230000000694 effects Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 11
- 230000009286 beneficial effect Effects 0.000 description 7
- 230000000875 corresponding effect Effects 0.000 description 6
- RYAUSSKQMZRMAI-YESZJQIVSA-N (S)-fenpropimorph Chemical compound C([C@@H](C)CC=1C=CC(=CC=1)C(C)(C)C)N1C[C@H](C)O[C@H](C)C1 RYAUSSKQMZRMAI-YESZJQIVSA-N 0.000 description 5
- 238000004590 computer program Methods 0.000 description 5
- 238000009877 rendering Methods 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000003190 augmentative effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 210000000707 wrist Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/02—Arrangements for optimising operational condition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W8/00—Network data management
- H04W8/22—Processing or transfer of terminal data, e.g. status or physical capabilities
- H04W8/24—Transfer of terminal data
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Computer And Data Communications (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本申请实施例公开了一种模型选择方法、终端及网络侧设备,属于通信技术领域,本申请实施例的模型选择方法包括:终端发送第一算力信息,所述第一算力信息与所述终端处理算力任务的能力相关,所述第一算力信息用于确定所述终端使用的第一AI模型;所述终端接收所述第一AI模型的参数,所述第一AI模型用于所述终端执行目标任务。
Description
技术领域
本申请属于通信技术领域,具体涉及一种模型选择方法、终端及网络侧设备。
背景技术
在进行图像处理等复杂任务(如图像识别)时,通常需要将一些推理部分从终端侧卸载到网络侧(如边缘或云数据中心),这就造成了用于图像处理的人工智能(ArtificialIntelligence,AI)模型分布在多个端点(如终端和网络侧设备)之间。
相关技术中,终端侧使用的AI模型通常是网络侧设备选择后交付给终端的。然而,由于网络侧设备在为终端选择AI模型时考虑的因素较少,容易为终端选择到不合理的AI模型,使得终端使用AI模型处理目标任务(如图像识别)时,得到的处理结果的质量较低。
发明内容
本申请实施例提供一种模型选择方法、终端及网络侧设备,能够解决因终端使用的AI模型不合理,终端得到的处理结果的质量较低问题。
第一方面,提供了一种模型选择方法,包括:终端发送第一算力信息,所述第一算力信息与所述终端处理算力任务的能力相关,所述第一算力信息用于确定所述终端使用的第一AI模型;所述终端接收所述第一AI模型的参数,所述第一AI模型用于所述终端执行目标任务。
第二方面,提供了一种模型选择方法,包括:网络侧设备基于终端的第一算力信息确定所述终端使用的第一AI模型,所述第一算力信息与所述终端处理算力任务的能力相关;所述网络侧设备发送所述第一AI模型的参数,所述第一AI模型用于所述终端执行目标任务。
第三方面,提供了一种模型选择装置,包括:能力交付模块,用于发送第一算力信息,所述第一算力信息与所述装置处理算力任务的能力相关,所述第一算力信息用于确定所述装置使用的第一AI模型;接收模块,用于接收所述第一AI模型的参数,所述第一AI模型用于所述装置执行目标任务。
第四方面,提供了一种模型选择装置,包括:模型选择模块,用于基于终端的第一算力信息确定所述终端使用的第一AI模型,所述第一算力信息与所述终端处理算力任务的能力相关;发送模块,用于发送所述第一AI模型的参数,所述第一AI模型用于所述终端执行目标任务。
第五方面,提供了一种终端,该终端包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。
第六方面,提供了一种终端,包括处理器及通信接口,所述通信接口用于发送第一算力信息,所述第一算力信息与所述终端处理算力任务的能力相关,所述第一算力信息用于确定所述终端使用的第一AI模型;接收所述第一AI模型的参数,所述第一AI模型用于所述终端执行目标任务。
第七方面,提供了一种网络侧设备,该网络侧设备包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第二方面所述的方法的步骤。
第八方面,提供了一种网络侧设备,包括处理器及通信接口,其中,所述处理器用于基于终端的第一算力信息确定所述终端使用的第一AI模型,所述第一算力信息与所述终端处理算力任务的能力相关,所述通信接口用于发送所述第一AI模型的参数,所述第一AI模型用于所述终端执行目标任务。
第九方面,提供了一种模型选择系统,包括:终端及网络侧设备,所述终端可用于执行如第一方面所述的方法的步骤,所述网络侧设备可用于执行如第二方面所述的方法的步骤。
第十方面,提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤,或者实现如第二方面所述的方法的步骤。
第十一方面,提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法的步骤,或实现如第二方面所述的方法的步骤。
第十二方面,提供了一种计算机程序/程序产品,所述计算机程序/程序产品被存储在存储介质中,所述计算机程序/程序产品被至少一个处理器执行以实现如第一方面所述的方法的步骤,或者实现如第二方面所述的方法的步骤。
在本申请实施例中,终端发送第一算力信息,第一算力信息与终端处理算力任务的能力相关,第一算力信息用于确定所述终端使用的第一AI模型;终端接收所述第一AI模型的参数。该实施例有利于为终端选择出与终端的第一算力信息相匹配的第一AI模型,终端可以使用合理的AI模型执行目标任务,有利于提升得到的处理结果的质量。
附图说明
图1是根据本申请实施例的无线通信系统的示意图;
图2是根据本申请实施例的模型选择方法的示意性流程图;
图3是根据本申请实施例的模型选择方法的系统架构示意图;
图4是根据本申请实施例的模型选择方法的系统架构示意图;
图5是根据本申请实施例的模型选择方法的系统架构示意图;
图6是根据本申请实施例的模型选择方法的示意性流程图;
图7是根据本申请实施例的模型选择装置的结构示意图;
图8是根据本申请实施例的模型选择装置的结构示意图;
图9是根据本申请实施例的通信设备的结构示意图;
图10是根据本申请实施例的终端的结构示意图;
图11是根据本申请实施例的网络侧设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”所区别的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”一般表示前后关联对象是一种“或”的关系。
值得指出的是,本申请实施例所描述的技术不限于长期演进型(Long TermEvolution,LTE)/LTE的演进(LTE-Advanced,LTE-A)系统,还可用于其他无线通信系统,诸如码分多址(Code Division Multiple Access,CDMA)、时分多址(Time DivisionMultiple Access,TDMA)、频分多址(Frequency Division Multiple Access,FDMA)、正交频分多址(Orthogonal Frequency Division Multiple Access,OFDMA)、单载波频分多址(Single-carrier Frequency Division Multiple Access,SC-FDMA)和其他系统。本申请实施例中的术语“系统”和“网络”常被可互换地使用,所描述的技术既可用于以上提及的系统和无线电技术,也可用于其他系统和无线电技术。以下描述出于示例目的描述了新空口(NewRadio,NR)系统,并且在以下大部分描述中使用NR术语,但是这些技术也可应用于NR系统应用以外的应用,如第6代(6thGeneration,6G)通信系统。
图1示出本申请实施例可应用的一种无线通信系统的框图。无线通信系统包括终端11和网络侧设备12。其中,终端11可以是手机、平板电脑(Tablet Personal Computer)、膝上型电脑(Laptop Computer)或称为笔记本电脑、个人数字助理(Personal DigitalAssistant,PDA)、掌上电脑、上网本、超级移动个人计算机(ultra-mobile personalcomputer,UMPC)、移动上网装置(Mobile Internet Device,MID)、增强现实(augmentedreality,AR)/虚拟现实(virtual reality,VR)设备、机器人、可穿戴式设备(WearableDevice)、车载设备(VUE)、行人终端(PUE)、智能家居(具有无线通信功能的家居设备,如冰箱、电视、洗衣机或者家具等)、游戏机、个人计算机(personal computer,PC)、柜员机或者自助机等终端侧设备,可穿戴式设备包括:智能手表、智能手环、智能耳机、智能眼镜、智能首饰(智能手镯、智能手链、智能戒指、智能项链、智能脚镯、智能脚链等)、智能腕带、智能服装等。需要说明的是,在本申请实施例并不限定终端11的具体类型。网络侧设备12可以包括接入网设备,核心网设备,服务器等,该服务器可以包括网络侧边缘计算服务器或云服务器等,其中,接入网设备也可以称为无线接入网设备、无线接入网(Radio Access Network,RAN)、无线接入网功能或无线接入网单元。接入网设备可以包括基站、WLAN接入点或WiFi节点等,基站可被称为节点B、演进节点B(eNB)、接入点、基收发机站(Base TransceiverStation,BTS)、无线电基站、无线电收发机、基本服务集(Basic Service Set,BSS)、扩展服务集(Extended Service Set,ESS)、家用B节点、家用演进型B节点、发送接收点(TransmittingReceivingPoint,TRP)或所述领域中其他某个合适的术语,只要达到相同的技术效果,所述基站不限于特定技术词汇,需要说明的是,在本申请实施例中仅以NR系统中的基站为例进行介绍,并不限定基站的具体类型。
下面结合附图,通过一些实施例及其应用场景对本申请实施例提供的模型选择方法进行详细地说明。
在进行图像识别或其他媒体任务时,由于终端能力有限,可能涉及终端侧和网络侧的交互,对AI处理的AI模型进行选择或分割,将一部分的AI处理任务交由网络侧的边缘计算服务器或者集中服务器进行处理。
在进行AI模型的选择或分割时,为了更进一步的适配终端的处理能力,本申请实施例引入了一种基于算力信息的模型选择或分割处理方法,具体如下:终端侧具备算力能力收集功能,负责收集终端处理算力任务的相关第一算力信息并通过5GS传递给网络侧;网络侧根据终端的第一算力信息等选择终端对应的第一AI模型。在模型分割的场景下,网络侧根据终端的第一算力信息和网络侧设备的第二算力信息(如网络侧边缘计算服务器或云服务器的算力能力)决策模型分割点,以选取终端侧对应的第一AI模型等。
如图2所示,本申请实施例提供一种模型选择方法200,该方法可以由终端执行,换言之,该方法可以由安装在终端的软件或硬件来执行,该方法包括如下步骤。
S202:终端发送第一算力信息,所述第一算力信息与所述终端处理算力任务的能力相关,所述第一算力信息用于确定所述终端使用的第一AI模型。
该实施例中,终端处理算力任务的能力可以是:图像处理等任务中终端处理AI模型的能力。可选地,S202之前,终端还可以收集第一算力信息。
本申请各个实施例中提到的第一算力信息可以与所述终端的如下至少之一相关:内存大小(如剩余内存大小,总内存大小),中央处理器(CPU)能力,硬盘数据大小,计算能力以及(当前)负载大小,该计算能力例如包括每秒浮点运算次数(Flops)。
可选地,所述第一AI模型是网络侧设备基于所述第一算力信息为终端选择的,所述第一算力信息与所述第一AI模型相匹配。例如,选择出的第一AI模型满足:使用第一AI模型时所需的算力能力与终端侧处理算力任务的能力正相关,即终端侧处理算力任务的能力越强,则选择出的第一AI模型满足:使用第一AI模型时所需的算力能力越大,反之,终端侧处理算力任务的能力越弱,则选择出的第一AI模型满足:使用第一AI模型时所需的算力能力越小。
该实施例有利于为终端选择出与终端的第一算力信息相匹配的第一AI模型,终端可以使用合理的AI模型执行目标任务,有利于提升终端得到的处理结果的质量。
可选地,所述第一AI模型是基于所述第一算力信息和/或网络侧设备的第二算力信息对第二AI模型进行分割得到的。
例如,网络侧设备根据第二AI模型的模型层数、每个模型层处理任务的任务量或复杂度等参数,同时结合第一算力信息和/或第二算力信息,将第二AI模型分割为第一AI模型和第三AI模型,其中,第一AI模型是终端侧使用的AI模型,第二AI模型是网络侧(如边缘或云数据中心)使用的AI模型。
S204:所述终端接收所述第一AI模型的参数,所述第一AI模型用于所述终端执行目标任务。
该实施例中,终端可以接收来自于网络侧设备的第一AI模型的参数,第一AI模型的参数可以构成第一AI模型。所述第一AI模型用于所述终端执行目标任务,如用于终端执行图像识别任务等等。
本申请实施例提供的模型选择方法,终端发送第一算力信息,第一算力信息与终端处理算力任务的能力相关,第一算力信息用于确定所述终端使用的第一AI模型;终端接收所述第一AI模型的参数,进而根据第一AI模型的参数得到第一AI模型。该实施例有利于为终端选择出与终端的第一算力信息相匹配的第一AI模型,终端可以使用合理的AI模型执行目标任务,有利于提升得到的处理结果的质量。
可选地,在一个实施例中,所述终端接收所述第一AI模型的参数之后,所述方法还包括:所述终端获取第一数据,所述第一数据与所述目标任务相关;所述终端基于所述第一AI模型处理所述第一数据。
该实施例例如,第一AI模型用于人脸识别任务,终端本地采集人脸图像数据;终端基于第一AI模型处理人脸图像数据得到人脸识别结果。
可选地,在一个实施例中,所述终端接收所述第一AI模型的参数之后,所述方法还包括:所述终端接收第二数据;其中,所述第二数据与所述目标任务相关,所述第二数据是基于第三AI模型处理得到的结果,所述第三AI模型是基于所述第一算力信息和/或网络侧设备的第二算力信息对第二AI模型进行分割得到的;所述终端基于所述第一AI模型处理所述第二数据。
该实施例例如,第一AI模型和第二AI模型用于图像识别任务,网络侧本地采集图像数据;网络侧基于第二AI模型处理图像数据得到图像识别的中间结果数据,即第二数据;网络侧向终端发送中间结果数据,终端基于第一AI模型处理中间结果数据得到图像识别的最终结果数据。
可选地,在一个实施例中,所述终端接收所述第一AI模型的参数之后,所述方法还包括:所述终端获取第三数据,所述第三数据与所述目标任务相关;所述终端基于所述第一AI模型处理所述第三数据,得到第四数据;所述终端发送所述第四数据;所述终端接收第五数据,所述第五数据是基于第三AI模型处理得到的结果,所述第三AI模型是基于所述第一算力信息和/或网络侧设备的第二算力信息对第二AI模型进行分割得到的。
该实施例例如,第一AI模型和第二AI模型用于图像识别任务,终端本地采集图像数据,即第三数据;终端基于第一AI模型处理图像数据得到图像识别的中间结果数据即第四数据;终端向网络侧发送中间结果数据,网络侧基于第二AI模型处理中间结果数据得到图像识别的最终结果数据,即第五数据;最后网络侧设备向终端发送图像识别的最终结果数据。
为详细说明本申请实施例提供的模型选择方法,以下将结合几个具体的实施例进行说明。
实施例一
该实施例主要介绍基于算力信息的基本模型分发流程,该实施例中,终端侧以及网络侧包括的模块如图3所示。
网络侧:
AI模型能力收集功能(AIModel Capability Collection):负责收集执行AI处理的终端的能力(即第一算力信息),例如终端的内存、CPU、硬盘数据、计算能力,如Flops、当前负载情况等。
AI模型选择功能(AIModelSelection):根据处理AI服务器的相关信息(例如处理任务属性图像渲染或图像识别)以及由AI模型能力收集功能收集的终端能力(包含终端的算力信息)选择合适的AI模型。
AI模型能力收集功能、AI模型选择功能为逻辑功能,可能单独存在,也可能分别或全部与其他功能合设,例如,与网络应用(NetworkApplication)或AI模型仓库(AIModelRepository)合设。
网络应用可以为AI媒体服务等选择AI模型仓库(AIModelRepository)中的某一类AI模型,如图像识别模型,处理其他任务的模型等;AI模型选择功能可以进一步从网络应用选择出的模型中,基于终端的能力为终端选择模型。
AI模型交付功能(AIModelDeliveryFunction)通过5GS(5G系统)将AI模型数据发送给终端。该AI模型交付功能还可能包含与服务质量(Quality of Service,QoS)请求和监控相关的功能,以及与AI模型数据的优化或压缩相关的功能。
终端侧:
终端应用(UEApplication)使用AI模型推理引擎(AIModelInference engine)和AI模型访问功能(AIModelAccessFunction,或称作AI模型访问功能)提供AI媒体服务。
AI模型访问功能通过5G系统接收AI模型数据,并将其发送到AI模型推理引擎,可以包括用于AI模型数据的接收端优化或解压缩技术。
AI模型推理引擎通过使用来自数据源(DataSource,例如相机或其他媒体源)的输入数据作为AI模型的输入来执行推理。推理输出数据被发送到数据目的地(DataDestination,例如媒体播放器)。
终端能力交付功能(UECapabilityDeliveryFunction)负责收集终端能力,例如终端的内存、CPU、硬盘数据、计算能力,如Flops、当前负载情况等,并通过5GS传给网络,供网络进行基于算力信息的模型选择,以及后续在Split(分割)场景下,根据终端和网络不同的算力能力进行模型分割的处理。
实施例二
该实施例主要介绍终端和网络协作的分布式推理流程,其中,数据源在网络,该实施例中,终端侧以及网络侧包括的模块如图4所示。
网络侧:
AI模型能力收集功能(AIModel Capability Collection):负责收集执行AI处理的终端的能力(即第一算力信息),例如终端的内存、CPU、硬盘数据、计算能力,如Flops、当前负载情况等。
在分割场景下,AI模型能力收集功能也会通过网络应用或其他方式获取网络侧的相关处理能力,例如处理服务器的内存、CPU、硬盘数据、计算能力,如Flops、当前的负载情况(例如可以获取边缘计算服务器或中心云服务器的处理能力)。
AI模型选择功能(AIModelSelection):根据处理AI服务器的相关信息(例如处理任务属性图像渲染或图像识别)以及由AI模型能力收集功能收集的终端能力(包含终端的算力信息)选择合适的AI模型。
在分割场景下,AI模型选择功能需要根据收集到的终端处理能力和网络服务器处理能力决策模型分割的方案,并确定终端和网络进行处理的AI模型,即决策分割点(SplitPoints)。
AI模型能力收集功能、AI模型选择功能为逻辑功能,可能单独存在,也可能分别或全部与其他功能合设,例如,与网络应用(NetworkApplication)或AI模型仓库(AIModelRepository)合设。
AI模型推理引擎(AIModelInferenceEngine),它接收网络人工智能模型子集(包含终端执行的AI模型和网络执行的AI模型)和数据源(DataSource,如媒体仓库)的输入数据以进行网络推理。
中间数据传递功能(IntermediateDataDeliveryFunction)从AI模型推理引擎接收部分推理输出(中间数据),并通过5GS将其发送给终端。该中间数据传递功能还可能包含与QoS请求和监控相关的功能。
该实施例中,AI模型仓库,AI模型交付功能等模块的作用可以参见图3的介绍。
终端侧:
中间数据接入功能(IntermediateDataAccessFunction)通过5GS接收来自网络的中间数据,并将其发送给终端的AI模型推理引擎(AIModelInferenceEngine)进行终端推理。最终推理输出数据被发送到数据目的地(例如媒体播放器)。
终端能力交付功能(UECapabilityDeliveryFunction)负责收集终端能力,例如终端的内存、CPU、硬盘数据、计算能力,如Flops、当前负载情况等,并通过5GS传给网络,供网络进行基于算力信息的模型选择,以及后续在Split(分割)场景下,根据终端和网络不同的算力能力进行模型分割的处理。
该实施例中,AI模型接入功能等模块的作用可以参见图3的介绍。
实施例三
该实施例主要介绍终端和网络协作的分布式推理流程,其中,数据源在终端,该实施例中,终端侧以及网络侧包括的模块如图5所示。
网络侧:
AI模型能力收集功能(AIModel Capability Collection):负责收集执行AI处理的终端的能力(即第一算力信息),例如终端的内存、CPU、硬盘数据、计算能力,如Flops、当前负载情况等。
在分割场景下,AI模型能力收集功能也会通过网络应用或其他方式获取网络侧的相关处理能力,例如处理服务器的内存、CPU、硬盘数据、计算能力,如Flops、当前的负载情况(例如可以获取边缘计算服务器或中心云服务器的处理能力)。
AI模型选择功能(AIModelSelection):根据处理AI服务器的相关信息(例如处理任务属性图像渲染或图像识别)以及由AI模型能力收集功能收集的终端能力(包含终端的算力信息)选择合适的AI模型。
在分割场景下,AI模型选择功能需要根据收集到的终端处理能力和网络服务器处理能力决策模型分割的方案,并确定终端和网络进行处理的AI模型,即决策分割点(SplitPoints)。
AI模型能力收集功能、AI模型选择功能为逻辑功能,可能单独存在,也可能分别或全部与其他功能合设,例如,与网络应用(NetworkApplication)或AI模型仓库(AIModelRepository)合设。
中间数据访问功能(IntermediateData Access Function)通过5GS接收来自终端的中间数据,并将其发送到AI模型推理引擎进行网络推理。
最终AI模型推理引擎的推理输出数据通过推理输出传递功能(InferenceOutputDelivery Function)通过5GS发送到终端。
该实施例中,AI模型仓库,AI模型交付功能等模块的作用可以参见图3的介绍。
终端侧:
AI模型推理引擎(AIModelInferenceEngine)它接收网络AI模型子集和输入数据(来自UE数据源),用于UE推理。
中间数据传递功能(IntermediateDataDeliveryFunction)接收来自AI模型推理引擎的部分推理输出(中间数据),并通过5GS将其发送到网络。该中间数据传递功能还可能包含与QoS请求和监控相关的功能。
推理输出接入功能(InferenceOutputAccessFunction)通过5GS接收来自网络的推理输出数据,并根据AI媒体服务将其发送到相关数据目的地。
该实施例中,AI模型接入功能,终端能力交付功能等模块的作用可以参见图3的介绍。
需要说明的是,本申请各个实施例不仅可以适用于5GMedia系统,还可以适用于其他的分割渲染等场景。
以上结合图2至图5详细描述了根据本申请实施例的模型选择方法。下面将结合图6详细描述根据本申请另一实施例的模型选择方法。可以理解的是,从网络侧设备描述的网络侧设备与终端的交互与图2所示的方法中的终端侧的描述相同或相对应,为避免重复,适当省略相关描述。
图6是本申请实施例的模型选择方法实现流程示意图,可以应用在网络侧设备。如图6所示,该方法600包括如下步骤。
S602:网络侧设备基于终端的第一算力信息确定所述终端使用的第一AI模型,所述第一算力信息与所述终端处理算力任务的能力相关。
S604:所述网络侧设备发送所述第一AI模型的参数,所述第一AI模型用于所述终端执行目标任务。
本申请实施例提供的模型选择方法,网络侧设备基于终端的第一算力信息确定所述终端使用的第一AI模型,所述第一算力信息与所述终端处理算力任务的能力相关。该实施例有利于为终端选择出与终端的第一算力信息相匹配的第一AI模型,终端可以使用合理的AI模型执行目标任务,有利于提升得到的处理结果的质量。
可选地,作为一个实施例,所述方法还包括如下至少之一:1)所述网络侧设备获取所述第一算力信息;2)所述网络侧设备获取所述网络侧设备的第二算力信息。
可选地,作为一个实施例,所述网络侧设备基于终端的第一算力信息确定所述终端使用的第一AI模型包括:所述网络侧设备基于终端的第一算力信息以及所述网络侧设备的第二算力信息对第二AI模型进行分割,得到所述终端使用的第一AI模型以及所述网络侧设备使用的第三AI模型。
可选地,作为一个实施例,所述第一算力信息与所述终端的如下至少之一相关:内存大小,中央处理器能力,硬盘数据大小,计算能力以及负载大小;所述第二算力信息与所述网络侧设备的如下至少之一相关:内存大小,中央处理器能力,硬盘数据大小,计算能力以及负载大小。
可选地,作为一个实施例,所述网络侧设备发送所述第一AI模型的参数之后,所述方法还包括:所述网络侧设备发送第二数据;其中,所述第二数据与所述目标任务相关,所述第二数据是基于所述第三AI模型处理得到的结果。
可选地,作为一个实施例,所述网络侧设备发送所述第一AI模型的参数之后,所述方法还包括:所述网络侧设备接收第四数据,所述第四数据是所述终端基于所述第一AI模型处理第三数据得到的;所述网络侧设备基于所述第三AI模型处理所述第四数据,得到第五数据;所述网络侧设备发送所述第五数据。
本申请实施例提供的模型选择方法,执行主体可以为模型选择装置。本申请实施例中以模型选择装置执行模型选择方法为例,说明本申请实施例提供的模型选择装置。
图7是根据本申请实施例的模型选择装置的结构示意图,该装置可以对应于其他实施例中的终端。如图7所示,装置700包括如下模块。
能力交付模块702,用于发送第一算力信息,所述第一算力信息与所述装置处理算力任务的能力相关,所述第一算力信息用于确定所述装置使用的第一AI模型。
接收模块704,用于接收所述第一AI模型的参数,所述第一AI模型用于所述装置执行目标任务。
本申请实施例提供的模型选择装置发送第一算力信息,第一算力信息与装置处理算力任务的能力相关,第一算力信息用于确定所述装置使用的第一AI模型;所述装置接收所述第一AI模型的参数。该实施例有利于为装置选择出与装置的第一算力信息相匹配的第一AI模型,装置可以使用合理的AI模型执行目标任务,有利于提升得到的处理结果的质量。
可选地,作为一个实施例,所述第一AI模型是基于所述第一算力信息和/或网络侧设备的第二算力信息对第二AI模型进行分割得到的。
可选地,作为一个实施例,所述第一算力信息与所述装置的如下至少之一相关:内存大小,中央处理器能力,硬盘数据大小,计算能力以及负载大小。
可选地,作为一个实施例,所述装置还包括:获取模块,用于获取第一数据,所述第一数据与所述目标任务相关;处理模块,用于基于所述第一AI模型处理所述第一数据。
可选地,作为一个实施例,所述接收模块704,还用于接收第二数据;其中,所述第二数据与所述目标任务相关,所述第二数据是基于第三AI模型处理得到的结果,所述第三AI模型是基于所述第一算力信息和/或网络侧设备的第二算力信息对第二AI模型进行分割得到的;所述装置还包括处理模块,用于基于所述第一AI模型处理所述第二数据。
可选地,作为一个实施例,所述装置还包括获取模块,用于获取第三数据,所述第三数据与所述目标任务相关;所述装置还包括处理模块,用于基于所述第一AI模型处理所述第三数据,得到第四数据;所述装置还包括发送模块,用于发送所述第四数据;所述接收模块704,还用于接收第五数据,所述第五数据是基于第三AI模型处理得到的结果,所述第三AI模型是基于所述第一算力信息和/或网络侧设备的第二算力信息对第二AI模型进行分割得到的。
根据本申请实施例的装置700可以参照对应本申请实施例的方法200的流程,并且,该装置700中的各个单元/模块和上述其他操作和/或功能分别为了实现方法200中的相应流程,并且能够达到相同或等同的技术效果,为了简洁,在此不再赘述。
本申请实施例中的模型选择装置可以是电子设备,例如具有操作系统的电子设备,也可以是电子设备中的部件,例如集成电路或芯片。该电子设备可以是终端,也可以为除终端之外的其他设备。示例性的,终端可以包括但不限于上述所列举的终端11的类型,其他设备可以为服务器、网络附属存储器(Network Attached Storage,NAS)等,本申请实施例不作具体限定。
图8是根据本申请实施例的模型选择装置的结构示意图,该装置可以对应于其他实施例中的网络侧设备。如图8所示,装置800包括如下模块。
模型选择模块802,用于基于终端的第一算力信息确定所述终端使用的第一AI模型,所述第一算力信息与所述终端处理算力任务的能力相关。
发送模块804,用于发送所述第一AI模型的参数,所述第一AI模型用于所述终端执行目标任务。
本申请实施例提供的模型选择装置,基于终端的第一算力信息确定所述终端使用的第一AI模型,所述第一算力信息与所述终端处理算力任务的能力相关。该实施例有利于为终端选择出与终端的第一算力信息相匹配的第一AI模型,终端可以使用合理的AI模型执行目标任务,有利于提升得到的处理结果的质量。
可选地,作为一个实施例,所述装置还包括获取模块,用于如下至少之一:获取所述第一算力信息;获取所述装置的第二算力信息。
可选地,作为一个实施例,所述模型选择模块802,用于基于终端的第一算力信息以及所述装置的第二算力信息对第二AI模型进行分割,得到所述终端使用的第一AI模型以及所述装置使用的第三AI模型。
可选地,作为一个实施例,所述第一算力信息与所述终端的如下至少之一相关:内存大小,中央处理器能力,硬盘数据大小,计算能力以及负载大小;所述第二算力信息与所述装置的如下至少之一相关:内存大小,中央处理器能力,硬盘数据大小,计算能力以及负载大小。
可选地,作为一个实施例,所述发送模块804,还用于发送第二数据;其中,所述第二数据与所述目标任务相关,所述第二数据是基于所述第三AI模型处理得到的结果。
可选地,作为一个实施例,所述装置还包括接收模块,用于接收第四数据,所述第四数据是所述终端基于所述第一AI模型处理第三数据得到的;所述装置还包括处理模块,用于基于所述第三AI模型处理所述第四数据,得到第五数据;所述发送模块804,还用于发送所述第五数据。
根据本申请实施例的装置800可以参照对应本申请实施例的方法600的流程,并且,该装置800中的各个单元/模块和上述其他操作和/或功能分别为了实现方法600中的相应流程,并且能够达到相同或等同的技术效果,为了简洁,在此不再赘述。
本申请实施例提供的模型选择装置能够实现图2至图6的方法实施例实现的各个过程,并达到相同的技术效果,为避免重复,这里不再赘述。
可选的,如图9所示,本申请实施例还提供一种通信设备900,包括处理器901和存储器902,存储器902上存储有可在所述处理器901上运行的程序或指令,例如,该通信设备900为终端时,该程序或指令被处理器901执行时实现上述模型选择方法实施例的各个步骤,且能达到相同的技术效果。该通信设备900为网络侧设备时,该程序或指令被处理器901执行时实现上述模型选择方法实施例的各个步骤,且能达到相同的技术效果,为避免重复,这里不再赘述。
本申请实施例还提供一种终端,包括处理器和通信接口,通信接口用于发送第一算力信息,所述第一算力信息与所述终端处理算力任务的能力相关,所述第一算力信息用于确定所述终端使用的第一AI模型;接收所述第一AI模型的参数,所述第一AI模型用于所述终端执行目标任务。该终端实施例与上述终端侧方法实施例对应,上述方法实施例的各个实施过程和实现方式均可适用于该终端实施例中,且能达到相同的技术效果。具体地,图10为实现本申请实施例的一种终端的硬件结构示意图。
该终端1000包括但不限于:射频单元1001、网络模块1002、音频输出单元1003、输入单元1004、传感器1005、显示单元1006、用户输入单元1007、接口单元1008、存储器1009以及处理器1010等中的至少部分部件。
本领域技术人员可以理解,终端1000还可以包括给各个部件供电的电源(比如电池),电源可以通过电源管理系统与处理器1010逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图10中示出的终端结构并不构成对终端的限定,终端可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,在此不再赘述。
应理解的是,本申请实施例中,输入单元1004可以包括图形处理单元(GraphicsProcessing Unit,GPU)10041和麦克风10042,图形处理器10041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元1006可包括显示面板10061,可以采用液晶显示器、有机发光二极管等形式来配置显示面板10061。用户输入单元1007包括触控面板10071以及其他输入设备10072中的至少一种。触控面板10071,也称为触摸屏。触控面板10071可包括触摸检测装置和触摸控制器两个部分。其他输入设备10072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
本申请实施例中,射频单元1001接收来自网络侧设备的下行数据后,可以传输给处理器1010进行处理;另外,射频单元1001可以向网络侧设备发送上行数据。通常,射频单元1001包括但不限于天线、放大器、收发信机、耦合器、低噪声放大器、双工器等。
存储器1009可用于存储软件程序或指令以及各种数据。存储器1009可主要包括存储程序或指令的第一存储区和存储数据的第二存储区,其中,第一存储区可存储操作系统、至少一个功能所需的应用程序或指令(比如声音播放功能、图像播放功能等)等。此外,存储器1009可以包括易失性存储器或非易失性存储器,或者,存储器1009可以包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-OnlyMemory,ROM)、可编程只读存储器(ProgrammableROM,PROM)、可擦除可编程只读存储器(ErasablePROM,EPROM)、电可擦除可编程只读存储器(ElectricallyEPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(SynchronousDRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(Direct RambusRAM,DRRAM)。本申请实施例中的存储器1009包括但不限于这些和任意其它适合类型的存储器。
处理器1010可包括一个或多个处理单元;可选的,处理器1010集成应用处理器和调制解调处理器,其中,应用处理器主要处理涉及操作系统、用户界面和应用程序等的操作,调制解调处理器主要处理无线通信信号,如基带处理器。可以理解的是,上述调制解调处理器也可以不集成到处理器1010中。
其中,射频单元1001,可以用于发送第一算力信息,所述第一算力信息与所述终端处理算力任务的能力相关,所述第一算力信息用于确定所述终端使用的第一AI模型;接收所述第一AI模型的参数,所述第一AI模型用于所述终端执行目标任务。
在本申请实施例中,终端发送第一算力信息,第一算力信息与终端处理算力任务的能力相关,第一算力信息用于确定所述终端使用的第一AI模型;终端接收所述第一AI模型的参数。该实施例有利于为终端选择出与终端的第一算力信息相匹配的第一AI模型,终端可以使用合理的AI模型执行目标任务,有利于提升得到的处理结果的质量。
本申请实施例提供的终端1000还可以实现上述模型选择方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本申请实施例还提供一种网络侧设备,包括处理器和通信接口,所述处理器用于基于终端的第一算力信息确定所述终端使用的第一AI模型,所述第一算力信息与所述终端处理算力任务的能力相关,所述通信接口用于发送所述第一AI模型的参数,所述第一AI模型用于所述终端执行目标任务。该网络侧设备实施例与上述网络侧设备方法实施例对应,上述方法实施例的各个实施过程和实现方式均可适用于该网络侧设备实施例中,且能达到相同的技术效果。
具体地,本申请实施例还提供了一种网络侧设备。如图11所示,该网络侧设备1100包括:天线111、射频装置112、基带装置113、处理器114和存储器115。天线111与射频装置112连接。在上行方向上,射频装置112通过天线111接收信息,将接收的信息发送给基带装置113进行处理。在下行方向上,基带装置113对要发送的信息进行处理,并发送给射频装置112,射频装置112对收到的信息进行处理后经过天线111发送出去。
以上实施例中网络侧设备执行的方法可以在基带装置113中实现,该基带装置113包括基带处理器。
基带装置113例如可以包括至少一个基带板,该基带板上设置有多个芯片,如图11所示,其中一个芯片例如为基带处理器,通过总线接口与存储器115连接,以调用存储器115中的程序,执行以上方法实施例中所示的网络设备操作。
该网络侧设备还可以包括网络接口116,该接口例如为通用公共无线接口(commonpublic radio interface,CPRI)。
具体地,本发明实施例的网络侧设备1100还包括:存储在存储器115上并可在处理器114上运行的指令或程序,处理器114调用存储器115中的指令或程序执行图8所示各模块执行的方法,并达到相同的技术效果,为避免重复,故不在此赘述。
本申请实施例还提供一种可读存储介质,所述可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述模型选择方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,所述处理器为上述实施例中所述的终端中的处理器。所述可读存储介质,可以是非易失性的,也可以是非瞬态的。可读存储介质,包括计算机可读存储介质,如计算机只读存储器ROM、随机存取存储器RAM、磁碟或者光盘等。
本申请实施例另提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现上述模型选择方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为系统级芯片,系统芯片,芯片系统或片上系统芯片等。
本申请实施例另提供了一种计算机程序/程序产品,所述计算机程序/程序产品被存储在存储介质中,所述计算机程序/程序产品被至少一个处理器执行以实现上述模型选择方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本申请实施例还提供了一种模型选择系统,包括:终端及网络侧设备,所述终端可用于执行如上所述的模型选择方法的步骤,所述网络侧设备可用于执行如上所述的模型选择方法的步骤。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。
Claims (27)
1.一种模型选择方法,其特征在于,包括:
终端发送第一算力信息,所述第一算力信息与所述终端处理算力任务的能力相关,所述第一算力信息用于确定所述终端使用的第一AI模型;
所述终端接收所述第一AI模型的参数,所述第一AI模型用于所述终端执行目标任务。
2.根据权利要求1所述的方法,其特征在于,所述第一AI模型是基于所述第一算力信息和/或网络侧设备的第二算力信息对第二AI模型进行分割得到的。
3.根据权利要求1或2所述的方法,其特征在于,所述第一算力信息与所述终端的如下至少之一相关:内存大小,中央处理器能力,硬盘数据大小,计算能力以及负载大小。
4.根据权利要求3所述的方法,其特征在于,所述终端接收所述第一AI模型的参数之后,所述方法还包括:
所述终端获取第一数据,所述第一数据与所述目标任务相关;
所述终端基于所述第一AI模型处理所述第一数据。
5.根据权利要求3所述的方法,其特征在于,所述终端接收所述第一AI模型的参数之后,所述方法还包括:
所述终端接收第二数据;其中,所述第二数据与所述目标任务相关,所述第二数据是基于第三AI模型处理得到的结果,所述第三AI模型是基于所述第一算力信息和/或网络侧设备的第二算力信息对第二AI模型进行分割得到的;
所述终端基于所述第一AI模型处理所述第二数据。
6.根据权利要求3所述的方法,其特征在于,所述终端接收所述第一AI模型的参数之后,所述方法还包括:
所述终端获取第三数据,所述第三数据与所述目标任务相关;
所述终端基于所述第一AI模型处理所述第三数据,得到第四数据;
所述终端发送所述第四数据;
所述终端接收第五数据,所述第五数据是基于第三AI模型处理得到的结果,所述第三AI模型是基于所述第一算力信息和/或网络侧设备的第二算力信息对第二AI模型进行分割得到的。
7.一种模型选择方法,其特征在于,包括:
网络侧设备基于终端的第一算力信息确定所述终端使用的第一AI模型,所述第一算力信息与所述终端处理算力任务的能力相关;
所述网络侧设备发送所述第一AI模型的参数,所述第一AI模型用于所述终端执行目标任务。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括如下至少之一:
所述网络侧设备获取所述第一算力信息;
所述网络侧设备获取所述网络侧设备的第二算力信息。
9.根据权利要求7或8所述的方法,其特征在于,所述网络侧设备基于终端的第一算力信息确定所述终端使用的第一AI模型包括:
所述网络侧设备基于终端的第一算力信息以及所述网络侧设备的第二算力信息对第二AI模型进行分割,得到所述终端使用的第一AI模型以及所述网络侧设备使用的第三AI模型。
10.根据权利要求9所述的方法,其特征在于,
所述第一算力信息与所述终端的如下至少之一相关:内存大小,中央处理器能力,硬盘数据大小,计算能力以及负载大小;
所述第二算力信息与所述网络侧设备的如下至少之一相关:内存大小,中央处理器能力,硬盘数据大小,计算能力以及负载大小。
11.根据权利要求9所述的方法,其特征在于,所述网络侧设备发送所述第一AI模型的参数之后,所述方法还包括:
所述网络侧设备发送第二数据;其中,所述第二数据与所述目标任务相关,所述第二数据是基于所述第三AI模型处理得到的结果。
12.根据权利要求9所述的方法,其特征在于,所述网络侧设备发送所述第一AI模型的参数之后,所述方法还包括:
所述网络侧设备接收第四数据,所述第四数据是所述终端基于所述第一AI模型处理第三数据得到的;
所述网络侧设备基于所述第三AI模型处理所述第四数据,得到第五数据;
所述网络侧设备发送所述第五数据。
13.一种模型选择装置,其特征在于,包括:
能力交付模块,用于发送第一算力信息,所述第一算力信息与所述装置处理算力任务的能力相关,所述第一算力信息用于确定所述装置使用的第一AI模型;
接收模块,用于接收所述第一AI模型的参数,所述第一AI模型用于所述装置执行目标任务。
14.根据权利要求13所述的装置,其特征在于,所述第一AI模型是基于所述第一算力信息和/或网络侧设备的第二算力信息对第二AI模型进行分割得到的。
15.根据权利要求13或14所述的装置,其特征在于,所述第一算力信息与所述装置的如下至少之一相关:内存大小,中央处理器能力,硬盘数据大小,计算能力以及负载大小。
16.根据权利要求15所述的装置,其特征在于,所述装置还包括:
获取模块,用于获取第一数据,所述第一数据与所述目标任务相关;
处理模块,用于基于所述第一AI模型处理所述第一数据。
17.根据权利要求15所述的装置,其特征在于,
所述接收模块,还用于接收第二数据;其中,所述第二数据与所述目标任务相关,所述第二数据是基于第三AI模型处理得到的结果,所述第三AI模型是基于所述第一算力信息和/或网络侧设备的第二算力信息对第二AI模型进行分割得到的;
所述装置还包括处理模块,用于基于所述第一AI模型处理所述第二数据。
18.根据权利要求15所述的装置,其特征在于,
所述装置还包括获取模块,用于获取第三数据,所述第三数据与所述目标任务相关;
所述装置还包括处理模块,用于基于所述第一AI模型处理所述第三数据,得到第四数据;
所述装置还包括发送模块,用于发送所述第四数据;
所述接收模块,还用于接收第五数据,所述第五数据是基于第三AI模型处理得到的结果,所述第三AI模型是基于所述第一算力信息和/或网络侧设备的第二算力信息对第二AI模型进行分割得到的。
19.一种模型选择装置,其特征在于,包括:
模型选择模块,用于基于终端的第一算力信息确定所述终端使用的第一AI模型,所述第一算力信息与所述终端处理算力任务的能力相关;
发送模块,用于发送所述第一AI模型的参数,所述第一AI模型用于所述终端执行目标任务。
20.根据权利要求19所述的装置,其特征在于,所述装置还包括获取模块,用于如下至少之一:
获取所述第一算力信息;
获取所述装置的第二算力信息。
21.根据权利要求19或20所述的装置,其特征在于,所述模型选择模块,用于基于终端的第一算力信息以及所述装置的第二算力信息对第二AI模型进行分割,得到所述终端使用的第一AI模型以及所述装置使用的第三AI模型。
22.根据权利要求21所述的装置,其特征在于,
所述第一算力信息与所述终端的如下至少之一相关:内存大小,中央处理器能力,硬盘数据大小,计算能力以及负载大小;
所述第二算力信息与所述装置的如下至少之一相关:内存大小,中央处理器能力,硬盘数据大小,计算能力以及负载大小。
23.根据权利要求21所述的装置,其特征在于,所述发送模块,还用于发送第二数据;其中,所述第二数据与所述目标任务相关,所述第二数据是基于所述第三AI模型处理得到的结果。
24.根据权利要求21所述的装置,其特征在于,
所述装置还包括接收模块,用于接收第四数据,所述第四数据是所述终端基于所述第一AI模型处理第三数据得到的;
所述装置还包括处理模块,用于基于所述第三AI模型处理所述第四数据,得到第五数据;
所述发送模块,还用于发送所述第五数据。
25.一种终端,其特征在于,包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1至6任一项所述的方法的步骤。
26.一种网络侧设备,其特征在于,包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求7至12任一项所述的方法的步骤。
27.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1至12任一项所述的方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211261960.4A CN117896714A (zh) | 2022-10-14 | 2022-10-14 | 模型选择方法、终端及网络侧设备 |
PCT/CN2023/124503 WO2024078615A1 (zh) | 2022-10-14 | 2023-10-13 | 模型选择方法、终端及网络侧设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211261960.4A CN117896714A (zh) | 2022-10-14 | 2022-10-14 | 模型选择方法、终端及网络侧设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117896714A true CN117896714A (zh) | 2024-04-16 |
Family
ID=90640089
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211261960.4A Pending CN117896714A (zh) | 2022-10-14 | 2022-10-14 | 模型选择方法、终端及网络侧设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN117896714A (zh) |
WO (1) | WO2024078615A1 (zh) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112005565B (zh) * | 2020-06-29 | 2022-08-26 | 北京小米移动软件有限公司 | 用户设备辅助信息的上报方法及装置、用户设备、存储介质 |
CN114091679A (zh) * | 2020-08-24 | 2022-02-25 | 华为技术有限公司 | 一种更新机器学习模型的方法及通信装置 |
CN114501131B (zh) * | 2021-12-22 | 2023-08-08 | 天翼云科技有限公司 | 一种视频分析方法、装置、存储介质及电子设备 |
CN114700957B (zh) * | 2022-05-26 | 2022-08-26 | 北京云迹科技股份有限公司 | 模型低算力需求的机器人控制方法及装置 |
-
2022
- 2022-10-14 CN CN202211261960.4A patent/CN117896714A/zh active Pending
-
2023
- 2023-10-13 WO PCT/CN2023/124503 patent/WO2024078615A1/zh unknown
Also Published As
Publication number | Publication date |
---|---|
WO2024078615A1 (zh) | 2024-04-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116266216A (zh) | 客户端筛选方法及装置、客户端及中心设备 | |
CN112270238A (zh) | 一种视频内容识别方法和相关装置 | |
CN117319388A (zh) | 算力服务方法、装置及终端 | |
CN117896714A (zh) | 模型选择方法、终端及网络侧设备 | |
CN115714785A (zh) | 算力资源的确定方法和设备 | |
WO2024088119A1 (zh) | 数据处理方法、装置、终端及网络侧设备 | |
CN116450808B (zh) | 一种数据的处理方法、装置以及存储介质 | |
WO2023213270A1 (zh) | 模型训练处理方法、装置、终端及网络侧设备 | |
CN110047076B (zh) | 一种图像信息的处理方法、装置及存储介质 | |
CN116963092A (zh) | 模型确定方法、信息传输方法、装置及相关设备 | |
CN116419402A (zh) | 资源选择方法、装置及终端 | |
CN116567766A (zh) | 路径偏好确定方法、终端及网络侧设备 | |
CN117319387A (zh) | 算力服务方法、装置、终端及核心网设备 | |
CN116208493A (zh) | 信息传输方法、装置及通信设备 | |
CN117528712A (zh) | 选网方法及终端 | |
CN117499972A (zh) | 测量间隔冲突的处理方法、装置、终端及网络侧设备 | |
CN116866996A (zh) | 多路径通信方法、装置、终端及可读存储介质 | |
CN116419209A (zh) | 数据处理的方法、装置及通信设备 | |
CN117835372A (zh) | 网络选择方法及终端 | |
CN116489720A (zh) | 切换配置指示方法、终端及网络侧设备 | |
CN115915083A (zh) | 紧急业务处理方法、设备及可读存储介质 | |
CN116208494A (zh) | Ai模型切换的处理方法、装置及通信设备 | |
CN116980992A (zh) | 条件切换的配置方法、终端及网络侧设备 | |
CN117528721A (zh) | 处理方法、设备及可读存储介质 | |
CN118338304A (zh) | Ai模型分发、接收方法、终端及网络侧设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |