CN117998295A - 数据标注方法、装置、终端设备及网络侧设备 - Google Patents
数据标注方法、装置、终端设备及网络侧设备 Download PDFInfo
- Publication number
- CN117998295A CN117998295A CN202211350294.1A CN202211350294A CN117998295A CN 117998295 A CN117998295 A CN 117998295A CN 202211350294 A CN202211350294 A CN 202211350294A CN 117998295 A CN117998295 A CN 117998295A
- Authority
- CN
- China
- Prior art keywords
- data
- information
- terminal equipment
- position data
- tag
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000002372 labelling Methods 0.000 title claims abstract description 119
- 238000010801 machine learning Methods 0.000 claims abstract description 61
- 238000012549 training Methods 0.000 claims abstract description 35
- 238000000034 method Methods 0.000 claims description 175
- 238000012545 processing Methods 0.000 claims description 141
- 238000007781 pre-processing Methods 0.000 claims description 126
- 238000013139 quantization Methods 0.000 claims description 95
- 238000010606 normalization Methods 0.000 claims description 61
- 238000009499 grossing Methods 0.000 claims description 55
- 230000004044 response Effects 0.000 claims description 49
- 238000012216 screening Methods 0.000 claims description 38
- 230000033001 locomotion Effects 0.000 claims description 34
- 230000015654 memory Effects 0.000 claims description 29
- 230000002159 abnormal effect Effects 0.000 claims description 9
- 238000004891 communication Methods 0.000 abstract description 20
- 230000006870 function Effects 0.000 description 46
- 230000008569 process Effects 0.000 description 30
- 238000010586 diagram Methods 0.000 description 14
- 238000007726 management method Methods 0.000 description 13
- 230000000694 effects Effects 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 8
- 238000013528 artificial neural network Methods 0.000 description 7
- 238000005259 measurement Methods 0.000 description 7
- 238000005457 optimization Methods 0.000 description 7
- 238000001914 filtration Methods 0.000 description 6
- 238000004590 computer program Methods 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 4
- 230000013016 learning Effects 0.000 description 4
- 238000003062 neural network model Methods 0.000 description 4
- 210000002569 neuron Anatomy 0.000 description 4
- 230000001360 synchronised effect Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 2
- 238000012517 data analytics Methods 0.000 description 2
- 238000013523 data management Methods 0.000 description 2
- 238000007667 floating Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 210000000707 wrist Anatomy 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/029—Location-based management or tracking services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W64/00—Locating users or terminals or network equipment for network management purposes, e.g. mobility management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本申请公开了一种数据标注方法、装置、终端设备及网络侧设备,属于通信技术领域,本申请实施例的数据标注方法包括:终端设备接收网络侧设备发送的第一信息,并根据所述第一信息对位置数据进行标注,得到数据标签;其中,所述第一信息用于指示所述终端设备对位置数据进行标注;所述数据标签用于对机器学习模型进行迭代训练,所述机器学习模型用于预测所述终端设备的位置信息。本申请实施例中,各个终端设备均基于网络侧设备发送的第一信息的指示,对获取的位置数据进行标注,从而各个终端设备得到的数据标签的质量接近,有利于提升基于数据标签训练得到的机器学习模型的准确性和鲁棒性。
Description
技术领域
本申请属于通信技术领域,具体涉及一种数据标注方法、装置、终端设备及网络侧设备。
背景技术
目前,人工智能(Artificial Intelligence,AI)技术在各领域得到了广泛应用,并起到了较好作用。由此可见,将AI技术融入到无线通信网络中,显著提升吞吐量、时延以及用户容量等技术指标,是未来的无线通信网络的重要任务。
其中,AI技术是一种数据驱动技术,可以利用有标签的训练数据对人工智能模型进行训练,然后将训练得到的人工智能模型应用到实际场景中,进行相应业务的处理。由此可见,在基于AI的应用中,AI模型的准确性很大程度上依赖于数据标签的质量。
然而,对于AI定位技术,数据标签只能由终端设备采集,由于终端能力和标签获取方法等方面存在差异,导致不同终端设备获取的数据标签的质量并不相同,网络侧设备基于多个终端设备上报的数据标签对AI模型进行训练时,AI模型的准确性存在浮动,AI模型的鲁棒性较差。
发明内容
本申请实施例提供一种数据标注方法、装置、终端设备及网络侧设备,能够解决终端设备获取的数据标签的质量不相同导致的AI模型的准确性浮动、鲁棒性差的问题。
第一方面,提供了一种数据标注方法,包括:
终端设备接收网络侧设备发送的第一信息,所述第一信息用于指示所述终端设备对位置数据进行标注;
所述终端设备根据所述第一信息对位置数据进行标注,得到数据标签;所述数据标签用于对机器学习模型进行迭代训练,所述机器学习模型用于预测所述终端设备的位置信息。
第二方面,提供了另一种数据标注方法,包括:
网络侧设备向终端设备发送第一信息,所述第一信息用于对位置数据进行标注得到数据标签;所述数据标签用于对机器学习模型进行迭代训练,所述机器学习模型用于预测所述终端设备的位置信息。
第三方面,提供了一种数据标注装置,应用于终端设备,包括:
第一信息接收模块,用于接收网络侧设备发送的第一信息,所述第一信息用于指示所述终端设备对位置数据进行标注;
数据标注模块,用于根据所述第一信息对位置数据进行标注,得到数据标签;所述数据标签用于对机器学习模型进行迭代训练,所述机器学习模型用于预测所述终端设备的位置信息。
第四方面,提供了另一种数据标注装置,应用于网络侧设备,包括:
第一信息发送模块,用于向终端设备发送第一信息,所述第一信息用于对位置数据进行标注得到数据标签;所述数据标签用于对机器学习模型进行迭代训练,所述机器学习模型用于预测所述终端设备的位置信息。
第五方面,提供了一种终端设备,该终端包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。
第六方面,提供了一种网络侧设备,包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第二方面所述的方法的步骤。
第七方面,提供了一种数据标注系统,包括:终端设备和网络侧设备,所述终端设备可用于执行如上述第一方面所述的数据标注方法的步骤,所述网络侧设备可用于执行如上述第二方面所述的数据标注方法的步骤。
第八方面,提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的数据标注方法的步骤,或者实现如第二方面所述的数据标注方法的步骤。
第九方面,提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的数据标注方法,或实现如第二方面所述的数据标注方法。
第十方面,提供了一种计算机程序/程序产品,所述计算机程序/程序产品被存储在存储介质中,所述计算机程序/程序产品被至少一个处理器执行以实现如第一方面或者第二方面所述的数据标注方法的步骤。
在本申请实施例中,终端设备接收网络侧设备发送的第一信息,并根据所述第一信息对位置数据进行标注,得到数据标签;其中,所述第一信息用于指示所述终端设备对位置数据进行标注;所述数据标签用于对机器学习模型进行迭代训练,所述机器学习模型用于预测所述终端设备的位置信息。本申请实施例中,网络侧设备通过第一信息对终端设备的数据标注过程进行统一管理和控制,各个终端设备均基于网络侧设备发送的第一信息的指示,对获取的位置数据进行标注,从而各个终端设备得到的数据标签的质量接近,有利于提升基于数据标签训练得到的机器学习模型的准确性和鲁棒性。
附图说明
图1是本申请实施例可应用的一种无线通信系统的框图;
图2是本申请实施例中的一种数据标注方法的流程图;
图3是本申请实施例中神经网络的示意图;
图4是本申请实施例中神经网络的神经元的示意图;
图5是本申请实施例中的另一种数据标注方法的流程图;
图6是本申请实施例中的一种数据标注装置的结构框图;
图7是本申请实施例中的另一种数据标注装置的结构框图;
图8是本申请实施例中的一种通信设备的结构框图;
图9是本申请实施例中的一种终端设备的结构框图;
图10是本申请实施例中的一种网络侧设备的结构框图;
图11是本申请实施例中另一种网络侧设备的结构框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”所区别的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”一般表示前后关联对象是一种“或”的关系。
值得指出的是,本申请实施例所描述的技术不限于长期演进型(Long TermEvolution,LTE)/LTE的演进(LTE-Advanced,LTE-A)系统,还可用于其他无线通信系统,诸如码分多址(Code Division Multiple Access,CDMA)、时分多址(Time DivisionMultiple Access,TDMA)、频分多址(Frequency Division Multiple Access,FDMA)、正交频分多址(Orthogonal Frequency Division Multiple Access,OFDMA)、单载波频分多址(Single-carrier Frequency Division Multiple Access,SC-FDMA)和其他系统。本申请实施例中的术语“系统”和“网络”常被可互换地使用,所描述的技术既可用于以上提及的系统和无线电技术,也可用于其他系统和无线电技术。以下描述出于示例目的描述了新空口(New Radio,NR)系统,并且在以下大部分描述中使用NR术语,但是这些技术也可应用于NR系统应用以外的应用,如第6代(6th Generation,6G)通信系统。
图1示出本申请实施例可应用的一种无线通信系统的框图。无线通信系统包括终端设备11和网络侧设备12。其中,终端设备11可以是手机、平板电脑(Tablet PersonalComputer)、膝上型电脑(Laptop Computer)或称为笔记本电脑、个人数字助理(PersonalDigital Assistant,PDA)、掌上电脑、上网本、超级移动个人计算机(ultra-mobilepersonal computer,UMPC)、移动上网装置(Mobile Internet Device,MID)、增强现实(augmented reality,AR)/虚拟现实(virtual reality,VR)设备、机器人、可穿戴式设备(Wearable Device)、车载设备(VUE)、行人终端(PUE)、智能家居(具有无线通信功能的家居设备,如冰箱、电视、洗衣机或者家具等)、游戏机、个人计算机(personal computer,PC)、柜员机或者自助机等终端侧设备,可穿戴式设备包括:智能手表、智能手环、智能耳机、智能眼镜、智能首饰(智能手镯、智能手链、智能戒指、智能项链、智能脚镯、智能脚链等)、智能腕带、智能服装等。需要说明的是,在本申请实施例并不限定终端设备11的具体类型。网络侧设备12可以包括接入网设备或核心网设备,其中,接入网设备12也可以称为无线接入网设备、无线接入网(Radio Access Network,RAN)、无线接入网功能或无线接入网单元。接入网设备12可以包括基站、WLAN接入点或WiFi节点等,基站可被称为节点B、演进节点B(eNB)、接入点、基收发机站(Base Transceiver Station,BTS)、无线电基站、无线电收发机、基本服务集(Basic Service Set,BSS)、扩展服务集(Extended Service Set,ESS)、家用B节点、家用演进型B节点、发送接收点(Transmitting Receiving Point,TRP)或所述领域中其他某个合适的术语,只要达到相同的技术效果,所述基站不限于特定技术词汇,需要说明的是,在本申请实施例中仅以NR系统中的基站为例进行介绍,并不限定基站的具体类型。核心网设备可以包含但不限于如下至少一项:核心网节点、核心网功能、移动管理实体(MobilityManagement Entity,MME)、接入移动管理功能(Access and Mobility ManagementFunction,AMF)、会话管理功能(Session Management Function,SMF)、用户平面功能(UserPlane Function,UPF)、策略控制功能(Policy Control Function,PCF)、策略与计费规则功能单元(Policy and Charging Rules Function,PCRF)、边缘应用服务发现功能(EdgeApplication Server Discovery Function,EASDF)、统一数据管理(Unified DataManagement,UDM),统一数据仓储(Unified Data Repository,UDR)、归属用户服务器(HomeSubscriber Server,HSS)、集中式网络配置(Centralized network configuration,CNC)、网络存储功能(Network Repository Function,NRF),网络开放功能(Network ExposureFunction,NEF)、本地NEF(Local NEF,或L-NEF)、绑定支持功能(Binding SupportFunction,BSF)、应用功能(Application Function,AF)等。需要说明的是,在本申请实施例中仅以NR系统中的核心网设备为例进行介绍,并不限定核心网设备的具体类型。
下面结合附图,通过一些实施例及其应用场景对本申请实施例提供的数据标注方法进行详细地说明。
第一方面,本申请实施例提供了一种数据标注方法。参照图2,示出了本申请实施例提供的一种数据标注方法的流程图。该方法应用于终端设备,如图2所示,该方法具体可以包括:
步骤201、终端设备接收网络侧设备发送的第一信息,所述第一信息用于指示所述终端设备对位置数据进行标注。
步骤202、所述终端设备根据所述第一信息对位置数据进行标注,得到数据标签;所述数据标签用于对机器学习模型进行迭代训练,所述机器学习模型用于预测所述终端设备的位置信息。
需要说明的是,在本申请实施例中,所述终端设备包括常规终端设备和/或定位参考单元。其中,所述常规终端设备可以是图1中的终端设备11。所述定位参考单元(Positioning Reference Unit,PRU)可以执行定位测量,例如RSTD、RSRP、UE Rx-Tx时间差测量等,并将这些测量结果报告给定位服务器。此外,PRU可以向TRP发送定位参考信号(Positioning reference signal,PRS),使得TRP能够测量和报告来自已知位置的PRU的UL定位测量值,例如RTOA、UL-AoA、gNB Rx-Tx时间差等。位置服务器可以将PRU测量值与已知PRU位置处的预期测量值进行比较,以确定附近其他目标设备的校正项,然后基于该校正项来校正其他目标设备的DL和/或UL位置测量值。
所述网络侧设备可以是图1中的接入网设备,如基站或接入网侧新定义的人工智能处理节点,还可以是图1中的核心网设备,如网络数据分析功能(Network DataAnalytics Function,NWDAF)、定位管理功能(Location Management Function,LMF)、或者核心网侧新定义的处理节点,还可以是上述多个节点的组合。
在本申请实施例中,网络侧设备向终端设备发送第一信息,所述第一信息用于指示所述终端设备对位置数据进行标注。可以理解的是,所述网络侧设备可以向多个终端设备发送第一信息,指示多个终端设备对各自的位置数据进行标注。
终端设备接收到网络侧设备发送的第一信息后,根据第一信息对位置数据进行标注,得到数据标签。其中,所述数据标签用于对机器学习模型进行迭代训练,所述机器学习模型用于预测所述终端设备的位置信息。
在本申请的一种可能的应用场景中,具有定位功能的终端设备在移动过程中,可以不断获取位置数据,并在接收到网络侧设备发送的第一信息的情况下,按照第一信息的指示对位置数据进行标注,得到数据标签。终端设备将数据标签上报给网络侧设备,网络侧设备即可根据获得的数据标签对机器学习模型进行迭代训练,从而利用训练好的机器学习模型执行目标业务,如定位业务、信息推送业务等等。或者,网络侧设备完成对机器学习模型的训练之后,将训练好的机器学习模型发送至终端设备,由终端设备利用训练好的机器学习模型执行目标业务。
在本申请的另一种可能的应用场景中,终端设备按照第一信息指示对位置数据进行标注得到数据标签之后,利用数据标签在本地对机器学习模型进行迭代训练,并利用训练好的机器学习模型执行目标业务。或者,终端设备将训练好的机器学习模型发送给网络侧设备,由网络侧设备利用训练好的机器学习模型执行目标业务。
由上述步骤201至202可知,在本申请实施例中,各个终端设备均基于网络侧设备发送的第一信息的指示,对获取的位置数据进行标注,从而各个终端设备得到的数据标签的质量接近,有利于提升基于数据标签训练得到的机器学习模型的准确性和鲁棒性。
需要说的是,本申请实施例中的机器学习模型可以为人工智能模型,例如全连接神经网络、卷积神经网络、决策树、支持向量机、贝叶斯分类器中的任意一种。以神经网络模型为例,其示意图可如图3所示。如图3所示,神经网络可以包括一个或多个输入层、一个或多个隐层和一个输出层。待处理数据[X1,X2…Xn]分别从对应的输入层输入至神经网络中,经过输入层、隐层和输出层的处理,得到输出结果Y。另外,神经网络由神经元组成,神经元的示意图如图4所示。其中在图4中,a1,a2,…aK表示输入,w表示权值(即乘性系数),b表示偏置(即加性系数),σ(.)表示激活函数。常见的激活函数包括Sigmoid(将变量映射到0、1之间)、tanh(对Sigmoid的平移和收缩)、线性整流函数/修正线性单元(Rectified LinearUnit,ReLU)等。
此外,以神经网络模型为例,对模型训练的过程进行如下介绍:
其中,神经网络的参数可以通过梯度优化算法进行优化。梯度优化算法是一类最小化或者最大化目标函数(有时候也称为损失函数)的算法,而目标函数往往是模型参数和数据的数学组合。例如给定数据X和其对应的标签Y,可以构建一个神经网络模型f(.),则根据输入x就可以得到预测输出f(x),并且可以计算出预测值和真实值之间的差距(f(x)-Y),这个就是损失函数。其中,梯度优化算法的优化目标是找到合适的w(即权值)和b(即偏置)使上述的损失函数的值达到最小,而损失值越小,则说明模型越接近于真实情况。
目前常见的优化算法,基本都是基于误差反向传播(error Back Propagation,BP)算法。BP算法的基本思想是,学习过程由信号的正向传播与误差的反向传播两个过程组成。正向传播时,输入样本从输入层传入,经各隐层逐层处理后,传向输出层。若输出层的实际输出与期望的输出不符,则转入误差的反向传播阶段。误差反传则是将输出误差以某种形式通过隐层向输入层逐层反传,并将误差分摊给各层的所有单元,从而获得各层单元的误差信号,此误差信号即作为修正各单元权值的依据。这种信号正向传播与误差反向传播的各层权值调整过程,是周而复始地进行的。其中,权值不断调整的过程,也就是网络的学习训练过程。此过程一直进行到网络输出的误差减少到可接受的程度,或进行到预先设定的学习次数为止。
另外,常见的优化算法有梯度下降(Gradient Descent)、随机梯度下降(Stochastic Gradient Descent,SGD)、小批量梯度下降(mini-batch gradientdescent)、动量法(Momentum)、Nesterov(发明者的名字,具体为带动量的随机梯度下降)自适应梯度下降(ADAptive GRADient descent,Adagrad)、Adagrad的扩展算法(Adadelta)、均方根误差降速(root mean square prop,RMSprop)、自适应动量估计(Adaptive MomentEstimation,Adam)等。
这些优化算法在误差反向传播时,都是根据损失函数得到的误差/损失,对当前神经元求导数/偏导,加上学习速率、之前的梯度/导数/偏导等影响,得到梯度,将梯度传给上一层。
在本申请实施例中,将上述模型训练方法应用于无线通信领域,由终端设备和网络侧设备进行交互来实现对机器学习模型的训练。
可选地,所述第一信息包括数据筛选条件和标签内容;所述终端设备根据所述第一信息对位置数据进行标注,得到数据标签,包括:
所述终端设备根据所述数据筛选条件对位置数据进行筛选,得到第一位置数据;
所述终端设备按照所述标签内容对所述第一位置数据进行标注,得到数据标签。
在本申请实施例中,网络侧设备可以通过第一信息中携带的数据筛选条件和标签内容,指示终端设备对不符合数据筛选条件的位置数据进行筛选,并按照标签内容对位置数据进行标注。具体地,终端设备接收到网络侧设备发送的第一信息后,根据数据筛选条件对位置数据进行筛选,得到第一位置数据。可以理解的是,所述第一位置数据为符合数据筛选条件的位置数据。然后,终端设备再按照标签内容对第一位置数据进行标注,得到数据标签。所述数据标签为标注后的符合数据筛选条件的位置数据。相比于直接对未筛选的位置数据进行标注,本申请实施例中,各个终端设备按照网络侧设备指示的数据筛选条件对位置数据进行筛选后再标注,提升了最终得到的数据标签的质量,且各个终端设备得到的数据标签均符合数据筛选条件,数据质量相近,有利于提升基于数据标签训练得到的机器学习模型的准确性和鲁棒性。
可选地,所述标签内容包括以下至少一项:
A1、位置标签,所述位置标签用于反映所述终端设备的位置坐标,所述位置坐标包括绝对位置坐标或相对位置坐标;
A2、区域标签,所述区域标签用于反映所述位置数据对应的区域;
A3、时间戳标签,所述时间戳标签用于反映所述位置数据的获取时间;
A4、位置标注误差标签,所述位置标识误差标签用于反映所述位置标签与所述终端设备的真实位置之间的误差;
A5、终端标签,所述终端标签包括所述终端设备的设备类型标签或身份标签;
A6、数据获取标签,所述数据获取标签用于指示所述位置数据的获取方式;
A7、运动状态标签,所述运动状态标签用于指示所述终端设备在获取所述位置数据时的运动速度及方向;
A8、数据质量等级标签,所述数据质量等级标签用于指示所述位置数据的数据质量。
在本申请实施例中,第一信息中携带的标签内容可以包含A1至A8中的至少一项。其中,对于A1项,位置标签可以是用于反映终端位置的位置坐标;该位置坐标可以是绝对位置坐标,例如用经纬度表示的位置坐标,也可以是相对位置坐标,例如以网络侧设备为参照点,终端设备相对于该网络侧设备的相对位置坐标。
对于A2项,区域标签可以是终端设备获取位置数据时所处区域的行政区划代码,也可以是终端设备获取位置数据时所处区域的编码信息,该编码信息可以是根据区域编码算法或空间索引算法得到的区域编码或空间索引。示例性地,可以预先选定一个目标区域作为用于采集位置数据的区域,该目标区域可以是全国、省、市、区(县)等任一级别的区域,也可以根据需要利用机器学习模型执行的目标业务确定目标区域。接下来,对目标区域进行区域划分并编码,得到划分的各个单位区域的编码信息。终端设备可以将获取位置数据时所处的单位区域的编码信息作为位置数据的位置标签。需要说明的是,区域标签的类型及区域标签的确定方法,可以由网络侧设备预先设定,也可以由协议规定,本申请实施例对此不做具体限定。
对于A3项,时间戳标签可以是位置数据的获取时间对应的时间戳。
对于A4项,位置标注误差标签用于反映位置标签与终端设备的真实位置之间的误差。所述位置标注误差标签可以是实际误差值,如位置标签反映的终端设备的位置坐标,与终端设备的真实位置坐标的差值;所述位置标注误差标签也可以是位置标签反映的终端设备的位置坐标与终端设备的真实位置坐标的差值对应的误差等级,等等。
对于A5项,终端标签可以是终端设备的设备类型标签,例如,若终端设备的设备类型为常规终端设备,则该终端设备的设备类型标签为“UE”,若终端设备的设备类型为定位参考单元,则该终端设备的设备类型标签为“PRU”,等等。终端标签还可以是终端设备的身份标签,如终端标识,该终端标识可以是网络侧设备分配的,用于区分网络中的各个终端设备。
对于A6项,数据获取标签用于指示位置数据的获取方式,可以对位置数据的获取方式进行编码,得到数据获取标签。其中,位置数据的获取方式可以包括基于终端设备自身的定位系统采集的定位数据获取、基于定位参考信号(Positioning reference signal,PRS)获取,等等。
对于A7项,运动状态标签可以包括终端设备在获取位置数据时对应的运动速度标签和方向标签,其中,所述运动速度标签可以是运动速度的具体数值,也可以是运动速度对应的编码信息;所述方向标签可以是终端设备在获取位置数据时对应的运动方向或速度方向的编码信息。
对于A8项,数据质量等级标签用于反映位置数据的数据质量,可以根据位置数据的字段缺失情况、位置标注误差标签等确定位置数据的数据质量等级。其中,可以根据位置数据是否包含A1至A7中各项对应的信息来确定位置数据的字段缺失情况,位置数据中包含的信息对应A1至A7的项数越大,说明位置数据的字段越完整。可以理解的是,位置数据的字段越完整、位置标注误差越小,位置数据的数据质量等级越高。
可选地,所述方法还包括:所述终端设备向所述网络侧设备发送标注响应信息,所述标注响应信息用于反映所述终端设备是否支持对位置数据进行标注,或者,所述标注响应信息用于反映所述终端设备支持的标签内容。
在本申请实施例中,终端设备在接收到网络侧设备发送的第一信息之后,可以向网络侧设备发送标注响应信息,以反映是否支持对位置数据进行标注。作为一种示例,标注响应信息可以包括第一响应信息或第二响应信息,其中,第一响应信息用于指示终端设备支持对位置数据进行标注,所述第一响应信息可以为“1”;第二响应信息用于指示终端设备不支持对位置数据进行标注,所述第二响应信息可以为“0”。
如果第一信息中携带标签内容,用于指示A1至A8中的至少一项,则终端设备向网络侧设备发送的标注响应信息还可以用于反映终端设备支持的标签内容。作为一种示例,标注响应信息中可以携带8个标注响应标签,分别对应A1至A8,如果终端设备支持A1至A8中某一项,则该项对应的标注响应标签为第一标签,第一标签用于指示终端设备支持对相应的标签内容进行标注,该第一标签可以为“1”;如果终端设备不支持A1至A8中某一项,则该项对应的标注响应标签为第二标签,第二标签用于指示终端设备不支持对相应的标签内容进行标注,该第二标签可以为“0”。
可选地,所述数据筛选条件包括以下至少一项:
B1、位置数据的位置标注误差小于预设阈值;
B2、位置数据对应的区域属于预设区域;
B3、位置数据对应的区域标签为预设区域标签;
B4、位置数据的获取方式为预设获取方式;
B5、位置数据的获取时间属于预设时间范围;
B6、位置数据的数据质量等级大于预设质量等级;
B7、位置数据不存在字段缺失;
B8、位置数据不属于异常数据;
B9、所述终端设备的终端标签为预设终端标签;
B10、所述终端设备的终端能力等级大于预设能力等级;
B11、所述终端设备的运动速度小于预设速度。
其中,预设阈值、预设区域、预设区域标签、预设获取方式、预设时间范围、预设质量等级、预设终端标签、预设能力等级、预设速度可以由网络侧设备设定,也可以由协议规定。
位置数据是否存在字段缺失可以根据前述A1至A8项确定。若位置数据中包含A1至A8各项对应的信息,则说明位置数据不存在字段缺失;反之,若位置数据中不包含A1至A8中任一项对应的信息,则说明位置数据存在字段缺失。
位置数据是否属于异常数据可以位置数据在终端设备采集的所有位置数据中的分布情况进行判断。例如,如果根据该位置数据对应的样本点在终端设备采集的所有位置数据对应的样本点中属于离群点,则说明该位置数据为异常数据。
在本申请实施例中,终端设备在接收到第一信息之后,可以按照上述B1至B11中至少一项对应的数据筛选条件对位置数据进行筛选,再对筛选后的位置数据进行标注,可以提升最终得到的数据标签的质量,进而有利于提升基于数据标签训练得到的机器学习模型的准确性和鲁棒性。或者,终端设备在接收到第一信息之后,也可以先对位置数据进行标注,再按照上述B1至B11中至少一项对应的数据筛选条件对标注后的位置数据进行筛选,得到最终的数据标签。需要说明的是,本申请实施例对数据筛选和数据标注的先后顺序不做具体限定。
可选地,步骤202所述终端设备根据所述第一信息对位置数据进行标注,得到数据标签,包括:
步骤S11、所述终端设备根据预先设定或协议规定的数据预处理方式对位置数据进行预处理,得到预处理后的位置数据;
步骤S12、所述终端设备根据所述第一信息对预处理后的位置数据进行标注,得到数据标签。
在本申请实施例中,终端设备在接收到第一信息之后,可以先根据数据预处理方式对位置数据进行预处理,然后再对预处理后的位置数据进行标注。其中,所述数据预处理方式可以由终端设备本地预先设定,也可以由协议规定。所述数据预处理方式包括以下至少一项:插值处理、平滑处理、量化处理、归一化处理。
可选地,所述第一信息还包括数据预处理方式,所述终端设备按照所述标签内容对所述第一位置数据进行标注,得到数据标签之前,所述方法还包括:
步骤S21、所述终端设备按照所述数据预处理方式对所述第一位置数据进行预处理,得到第二位置数据;
步骤202所述终端设备按照所述标签内容对所述第一位置数据进行标注,得到数据标签,包括:
步骤S22、所述终端设备按照所述标签内容对所述第二位置数据进行标注,得到数据标签。
在本申请实施例中,所述数据预处理方式可以由网络侧设备指定,且该数据预处理方式被携带在第一信息中。终端设备在接收到第一信息之后,可以先根据第一信息中携带的数据筛选条件对位置数据进行筛选,得到符合数据筛选条件的第一位置数据;然后,按照数据预处理方式对第一位置数据进行预处理,得到第二位置数据;最后,按照第一信息中的标签内容对第二位置数据进行标注,得到数据标签。其中,所述数据筛选条件包括前述B1至B11中的至少一项;所述标签内容包括前述A1至A8中的至少一项;所述数据预处理方式包括以下至少一项:插值处理、平滑处理、量化处理、归一化处理。
可选地,所述数据预处理方式包括插值处理,步骤S21所述终端设备按照所述数据预处理方式对所述第一位置数据进行预处理,得到第二位置数据之前,所述方法还包括:
步骤S31、所述终端设备接收所述网络侧设备发送的第二信息,所述第二信息中携带标签密度指示,所述标签密度指示用于指示所述数据标签的标签密度;
步骤S21所述终端设备按照所述数据预处理方式对所述第一位置数据进行预处理,得到第二位置数据,包括:
步骤S32、所述终端设备根据所述标签密度指示对所述第一位置数据进行插值处理,得到第二位置数据。
在本申请实施例中,如果第一信息中携带的数据预处理方式包括插值处理,则网络侧设备可以向终端设备发送携带标签密度指示的第二信息,其中,标签密度指示用于指示数据标签的标签密度。
可选地,所述标签密度指示包括以下任一项:
C1、第一时间范围内,数据标签的标签数目为N1;
C2、第一距离范围内,数据标签的标签数目为N2;
C3、数据标签的标签密度为N3/时间单位,或者,N4/距离单位。
其中,N1、N2、N3和N4均为正整数。
可选地,所述时间单位包括以下任一项:小时、分钟、秒、毫秒、微秒、帧、子帧、时隙、正交频分复用(Orthogonal frequency-division multiplexing,OFDM)符号。所述距离单位可以包括以下任一项:千米、米、分米、厘米。
终端设备在接收到网络侧设备发送的第二信息之后,根据所述标签密度指示对所述第一位置数据进行插值处理,得到第二位置数据,所述第二位置数据的数据密度符合标签密度指示,也即C1至C3中的某一项。其中,所述插值处理可以包括但不限于线性插值、二次插值。
作为一种示例,假设终端设备获取的第一位置数据为:t1(x1,y1),t3(x3,y3),t5(x5,y5)....,采用不同的插值处理,可以得到不同的第二位置数据。以利用插值处理得到t2时刻的位置数据为例:
对于线性插值,获取的t2时刻的位置数据为:
对于二次插值,也即以相邻三个样本点做插值,获取的t2时刻的位置数据为:
按照上述公式(1)或公式(2)所示的插值方式对第一位置数据进行插值处理,即可得到符合标签密度指示的第二位置数据。
可选地,所述数据预处理方式包括插值处理,步骤S21所述终端设备按照所述数据预处理方式对所述第一位置数据进行预处理,得到第二位置数据之前,所述方法还包括:
步骤S41、所述终端设备接收所述网络侧设备发送的第三信息,所述第三信息中携带插值指示;
步骤S21所述终端设备按照所述数据预处理方式对所述第一位置数据进行预处理,得到第二位置数据,包括:
步骤S42、所述终端设备按照所述插值指示对应的目标插值方法对所述第一位置数据进行插值处理,得到第二位置数据。
在本申请实施例中,当第一信息中携带的数据预处理方式包括插值处理时,网络侧设备可以通过第三信息向终端设备发送插值指示,以指示插值处理所需采用的目标插值方法。终端设备接收到第三信息之后,按照插值指示对应的目标插值方法对第一位置数据进行插值处理。其中,所述目标插值方法可以包括但不限于线性插值、二次插值。
可选地,所述数据预处理方式包括平滑处理,步骤S21所述终端设备按照所述数据预处理方式对所述第一位置数据进行预处理,得到第二位置数据之前,所述方法还包括:
步骤S51、所述终端设备接收所述网络侧设备发送的第四信息,所述第四信息中携带平滑指示;
步骤S21所述终端设备按照所述数据预处理方式对所述第一位置数据进行预处理,得到第二位置数据,包括:
步骤S52、所述终端设备按照所述平滑指示对应的目标平滑方法对所述第一位置数据进行平滑处理,得到第二位置数据。
在本申请实施例中,当第一信息中携带的数据预处理方式包括平滑处理时,网络侧设备可以通过第四信息向终端设备发送平滑指示,以指示平滑处理所需采用的目标平滑方法。终端设备接收到第四信息之后,按照平滑指示对应的目标平滑方法对第一位置数据进行平滑处理。其中,所述目标平滑方法可以包括但不限于S-G(Savitzky-Golay)滤波平滑方法、滑动平均(moving average)方法、滑动平均滤波方法。
以滑动平均滤波方法为例,假设滑动窗内包含2N+1个第一位置数据,对t时刻的第一位置数据(x,y)做平滑处理,则t时刻平滑后的第二位置数据为:
通过平滑处理,可以去除位置数据中的噪声,进而提升对平滑后的位置数据进行标注得到的数据标签的质量。
可选地,所述数据预处理方式包括量化处理,步骤S21所述终端设备按照所述数据预处理方式对所述第一位置数据进行预处理,得到第二位置数据之前,所述方法还包括:
步骤S61、所述终端设备接收所述网络侧设备发送的第五信息,所述第五信息中携带数据量化辅助信息;
步骤S21所述终端设备按照所述数据预处理方式对所述第一位置数据进行预处理,得到第二位置数据,包括:
步骤S62、所述终端设备根据所述数据量化辅助信息对所述第一位置数据进行量化处理,得到第二位置数据。
其中,所述数据量化辅助信息包括以下至少一项:
D1、量化参考点的标识和位置;
D2、量化方式,所述量化方式包括均匀量化或非均匀量化。
对于D1项,量化参考点的标识用于指示量化参考点的身份,每一个量化参考点均对应一个身份标识和一个位置坐标。例如,量化参考点1的位置为(0,0)。
对于D2项,均匀量化是指对输入信号的取值域等间隔分割的量化,又称为线性编码,起特点是歌量化区间的宽度(即宽阶)相同。均匀量化主要指示量化间隔,比如量化间隔为10。非均匀量化是指一种在输入信号的动态范围内量化间隔不相等的量化,在非均匀量化中,对于信号取值小的区间,其量化间隔也小,反之,信号取值越大,其量化间隔就大。非均匀量化可以指示量化码本(codebook),比如x维度的量化码本为{0,10,30,40,45},y维度的量化码本为{0,5,20,40}。同时,量化码本可以反映量化间隔,如对应地,x维度的量化码本为{10,20,10,5},y维度的量化码本为{5,15,20},假设终端设备1的位置为(8,12),则映射到量化码本中,x维度的量化间隔为10,y维度的量化间隔为10。
在本申请实施例中,当第一信息中携带的数据预处理方式包括量化处理时,网络侧设备可以通过第五信息向终端设备发送数据量化辅助信息。终端设备接收到第五信息之后,按照数据量化辅助信息对第一位置数据进行量化处理。
可选地,所述数据预处理方式包括归一化处理,步骤S21所述终端设备按照所述数据预处理方式对所述第一位置数据进行预处理,得到第二位置数据之前,所述方法还包括:
步骤S71、所述终端设备接收所述网络侧设备发送的第六信息,所述第六信息中携带归一化指示;
步骤S21所述终端设备按照所述数据预处理方式对所述第一位置数据进行预处理,得到第二位置数据,包括:
步骤S72、所述终端设备按照所述归一化指示对应的目标归一化方法对所述第一位置数据进行归一化处理,得到第二位置数据。
在本申请实施例中,当第一信息中携带的数据预处理方式包括归一化处理时,网络侧设备可以通过第六信息向终端设备发送归一化指示,以指示归一化处理所需采用的目标归一化方法。终端设备接收到第六信息之后,按照归一化指示对应的目标归一化方法对第一位置数据进行归一化处理。其中,所述目标归一化方法可以包括但不限于最大最小归一化(X-Min/(Max-Min))方法、0均值归一化(X-Mean/(Standard deviation))方法。
第二方面,本申请实施例提供了另一种数据标注方法。参照图5,示出了本申请实施例提供的另一种数据标注方法的流程图。该方法应用于网络侧设备,如图5所示,该方法具体可以包括:
步骤501、网络侧设备向终端设备发送第一信息,所述第一信息用于指示终端设备对位置数据进行标注得到数据标签。
步骤502、所述网络侧设备接收所述终端设备发送的数据标签;
步骤503、所述网络侧设备根据所述数据标签对机器学习模型进行迭代训练,所述机器学习模型用于预测所述终端设备的位置信息。
需要说明的是,在本申请实施例中,所述终端设备包括常规终端设备和/或定位参考单元。其中,所述常规终端设备可以是图1中的终端设备11。所述网络侧设备可以是图1中的接入网设备,如基站或接入网侧新定义的人工智能处理节点,还可以是图1中的核心网设备,如网络数据分析功能(Network Data Analytics Function,NWDAF)、定位管理功能(Location Management Function,LMF)、或者核心网侧新定义的处理节点,还可以是上述多个节点的组合。
在本申请实施例中,网络侧设备向终端设备发送第一信息,所述第一信息用于指示所述终端设备对位置数据进行标注。可以理解的是,所述网络侧设备可以向多个终端设备发送第一信息,指示多个终端设备对各自的位置数据进行标注。
终端设备接收到网络侧设备发送的第一信息后,根据第一信息对位置数据进行标注,得到数据标签。其中,所述数据标签用于对机器学习模型进行迭代训练,所述机器学习模型用于预测所述终端设备的位置信息。
在本申请的一种可能的应用场景中,具有定位功能的终端设备在移动过程中,可以不断获取位置数据,并在接收到网络侧设备发送的第一信息的情况下,按照第一信息的指示对位置数据进行标注,得到数据标签。终端设备将数据标签上报给网络侧设备,网络侧设备即可根据获得的数据标签对机器学习模型进行迭代训练,从而利用训练好的机器学习模型执行目标业务,如定位业务、信息推送业务等等。或者,网络侧设备完成对机器学习模型的训练之后,将训练好的机器学习模型发送至终端设备,由终端设备利用训练好的机器学习模型执行目标业务。
在本申请的另一种可能的应用场景中,终端设备按照第一信息指示对位置数据进行标注得到数据标签之后,利用数据标签在本地对机器学习模型进行迭代训练,并利用训练好的机器学习模型执行目标业务。或者,终端设备将训练好的机器学习模型发送给网络侧设备,由网络侧设备利用训练好的机器学习模型执行目标业务。
可选地,所述第一信息包括数据筛选条件和标签内容;其中,所述数据筛选条件用于筛选所述位置数据,以滤除不符合所述数据筛选条件的位置数据;所述标签内容用于按照所述标签内容对位置数据进行标注。
可选地,所述标签内容包括以下至少一项:
A1、位置标签,所述位置标签用于反映所述终端设备的位置坐标,所述位置坐标包括绝对位置坐标或相对位置坐标;
A2、区域标签,所述区域标签用于反映所述位置数据对应的区域;
A3、时间戳标签,所述时间戳标签用于反映所述位置数据的获取时间;
A4、位置标注误差标签,所述位置标识误差标签用于反映所述位置标签与所述终端设备的真实位置之间的误差;
A5、终端标签,所述终端标签包括所述终端设备的设备类型标签或身份标签;
A6、数据获取标签,所述数据获取标签用于指示所述位置数据的获取方式;
A7、运动状态标签,所述运动状态标签用于指示所述终端设备在获取所述位置数据时的运动速度及方向;
A8、数据质量等级标签,所述数据质量等级标签用于指示所述位置数据的数据质量。
对于A1项至A8项,可以参照前述第一方面中关于A1至A8项的相关描述,本申请实施例在此不做进一步赘述。
可选地,所述方法还包括:所述网络侧设备接收所述终端设备发送的标注响应信息,所述标注响应信息用于反映所述终端设备是否支持对位置数据进行标注,或者,所述标注响应信息用于反映所述终端设备支持的标签内容。
在本申请实施例中,终端设备在接收到网络侧设备发送的第一信息之后,可以向网络侧设备发送标注响应信息,以反映是否支持对位置数据进行标注。作为一种示例,标注响应信息可以包括第一响应信息或第二响应信息,其中,第一响应信息用于指示终端设备支持对位置数据进行标注,所述第一响应信息可以为“1”;第二响应信息用于指示终端设备不支持对位置数据进行标注,所述第二响应信息可以为“0”。
如果第一信息中携带标签内容,用于指示A1至A8中的至少一项,则终端设备向网络侧设备发送的标注响应信息还可以用于反映终端设备支持的标签内容。作为一种示例,标注响应信息中可以携带8个标注响应标签,分别对应A1至A8,如果终端设备支持A1至A8中某一项,则该项对应的标注响应标签为第一标签,第一标签用于指示终端设备支持对相应的标签内容进行标注,该第一标签可以为“1”;如果终端设备不支持A1至A8中某一项,则该项对应的标注响应标签为第二标签,第二标签用于指示终端设备不支持对相应的标签内容进行标注,该第二标签可以为“0”。
可选地,所述数据筛选条件包括以下至少一项:
B1、位置数据的位置标注误差小于预设阈值;
B2、位置数据对应的区域属于预设区域;
B3、位置数据对应的区域标签为预设区域标签;
B4、位置数据的获取方式为预设获取方式;
B5、位置数据的获取时间属于预设时间范围;
B6、位置数据的数据质量等级大于预设质量等级;
B7、位置数据不存在字段缺失;
B8、位置数据不属于异常数据;
B9、所述终端设备的终端标签为预设终端标签;
B10、所述终端设备的终端能力等级大于预设能力等级;
B11、所述终端设备的运动速度小于预设速度。
对于B1项至B11项,可以参照前述第一方面中关于B1至B11项的相关描述,本申请实施例在此不做进一步赘述。
可选地,所述方法还包括:所述网络侧设备接收所述终端设备发送的数据标签;所述网络侧设备按照预先设定的数据预处理方式对所述数据标签进行预处理,得到目标数据标签。
在本申请实施例中,可以由网络侧设备执行数据预处理操作。具体地,网络侧设备接收终端设备发送的数据标签,所述数据标签是终端设备根据第一信息的指示进行标注得到;网络侧设备按照预先设定的数据预处理方式对接收的数据标签进行预处理,得到目标数据标签。其中,所述数据预处理方式包括以下至少一项:插值处理、平滑处理、量化处理、归一化处理。
可选地,所述第一信息还包括数据预处理方式,所述数据预处理方式用于对位置数据进行预处理。
在本申请的一种实施例中,网络侧设备可以在第一信息中携带数据预处理方式,指示终端设备按照数据预处理方式对位置数据进行预处理。可选地,所述数据预处理方式包括以下至少一项:插值处理、平滑处理、量化处理、归一化处理。
可选地,所述数据预处理方式包括插值处理,所述方法还包括:所述网络侧设备向所述终端设备发送第二信息,所述第二信息中携带标签密度指示,所述标签密度指示用于指示所述数据标签的标签密度。
在本申请实施例中,如果第一信息中携带的数据预处理方式包括插值处理,则网络侧设备可以向终端设备发送携带标签密度指示的第二信息,其中,标签密度指示用于指示数据标签的标签密度。
可选地,所述标签密度指示包括以下任一项:
C1、第一时间范围内,数据标签的标签数目为N1;
C2、第一距离范围内,数据标签的标签数目为N2;
C3、数据标签的标签密度为N3/时间单位,或者,N4/距离单位。
其中,N1、N2、N3和N4均为正整数。
可选地,所述时间单位包括以下任一项:小时、分钟、秒、毫秒、微秒、帧、子帧、时隙、正交频分复用符号。所述距离单位可以包括以下任一项:千米、米、分米、厘米。
可选地,所述数据预处理方式包括插值处理,所述方法还包括:所述网络侧设备向所述终端设备发送第三信息,所述第三信息中携带插值指示,所述插值指示用于位置数据的插值处理。
在本申请实施例中,当第一信息中携带的数据预处理方式包括插值处理时,网络侧设备可以通过第三信息向终端设备发送插值指示,以指示插值处理所需采用的目标插值方法。终端设备接收到第三信息之后,按照插值指示对应的目标插值方法对第一位置数据进行插值处理。其中,所述目标插值方法可以包括但不限于线性插值、二次插值。
可选地,所述数据预处理方式包括平滑处理,所述方法还包括:所述网络侧设备向所述终端设备发送第四信息,所述第四信息中携带平滑指示,所述平滑指示用于位置数据的平滑处理。
在本申请实施例中,当第一信息中携带的数据预处理方式包括平滑处理时,网络侧设备可以通过第四信息向终端设备发送平滑指示,以指示平滑处理所需采用的目标平滑方法。终端设备接收到第四信息之后,按照平滑指示对应的目标平滑方法对第一位置数据进行平滑处理。其中,所述目标平滑方法可以包括但不限于S-G(Savitzky-Golay)滤波平滑方法、滑动平均(moving average)方法、滑动平均滤波方法。
可选地,所述数据预处理方式包括量化处理,所述方法还包括:所述网络侧设备向所述终端设备发送第五信息,所述第五信息中携带数据量化辅助信息,所述数据量化辅助信息包括以下至少一项:
D1、量化参考点的标识和位置;
D2、量化方式,所述量化方式包括均匀量化或非均匀量化。
对于D1项和D2项,可以参照前述第一方面中对于D1和D2项的相关描述,本申请实施例在此不做进一步赘述。
在本申请实施例中,当第一信息中携带的数据预处理方式包括量化处理时,网络侧设备可以通过第五信息向终端设备发送数据量化辅助信息。终端设备接收到第五信息之后,按照数据量化辅助信息对第一位置数据进行量化处理。
可选地,所述数据预处理方式包括归一化处理,所述方法还包括:所述网络侧设备向所述终端设备发送第六信息,所述第六信息中携带归一化指示,所述归一化指示用于位置数据的归一化处理。
在本申请实施例中,当第一信息中携带的数据预处理方式包括归一化处理时,网络侧设备可以通过第六信息向终端设备发送归一化指示,以指示归一化处理所需采用的目标归一化方法。终端设备接收到第六信息之后,按照归一化指示对应的目标归一化方法对第一位置数据进行归一化处理。其中,所述目标归一化方法可以包括但不限于最大最小归一化(X-Min/(Max-Min))方法、0均值归一化(X-Mean/(Standard deviation))方法。
在本申请实施例提供的数据标注方法中,各个终端设备均基于网络侧设备发送的第一信息的指示,对获取的位置数据进行标注,从而各个终端设备得到的数据标签的质量接近,有利于提升基于数据标签训练得到的机器学习模型的准确性和鲁棒性。
本申请实施例提供的数据标注方法,执行主体可以为数据标注装置。本申请实施例中以数据标注装置执行数据标注方法为例,说明本申请实施例提供的数据标注装置。
第三方面,本申请实施例提供了一种数据标注装置。参照图6,示出了本申请实施例提供的一种数据标注装置的结构框图,该装置可以应用于终端设备。如图6所示,该装置具体可以包括:
第一信息接收模块601,用于接收网络侧设备发送的第一信息,所述第一信息用于指示所述终端设备对位置数据进行标注;
数据标注模块602,用于根据所述第一信息对位置数据进行标注,得到数据标签;所述数据标签用于对机器学习模型进行迭代训练,所述机器学习模型用于预测所述终端设备的位置信息。
可选地,所述第一信息包括数据筛选条件和标签内容;所述数据标注模块,包括:
数据筛选子模块,用于根据所述数据筛选条件对位置数据进行筛选,得到第一位置数据;
第一标注子模块,用于按照所述标签内容对所述第一位置数据进行标注,得到数据标签。
可选地,所述标签内容包括以下至少一项:
位置标签,所述位置标签用于反映所述终端设备的位置坐标,所述位置坐标包括绝对位置坐标或相对位置坐标;
区域标签,所述区域标签用于反映所述位置数据对应的区域;
时间戳标签,所述时间戳标签用于反映所述位置数据的获取时间;
位置标注误差标签,所述位置标识误差标签用于反映所述位置标签与所述终端设备的真实位置之间的误差;
终端标签,所述终端标签包括所述终端设备的设备类型标签或身份标签;
数据获取标签,所述数据获取标签用于指示所述位置数据的获取方式;
运动状态标签,所述运动状态标签用于指示所述终端设备在获取所述位置数据时的运动速度及方向;
数据质量等级标签,所述数据质量等级标签用于指示所述位置数据的数据质量。
可选地,所述装置还包括:
标注响应信息发送模块,用于向所述网络侧设备发送标注响应信息,所述标注响应信息用于反映所述终端设备是否支持对位置数据进行标注,或者,所述标注响应信息用于反映所述终端设备支持的标签内容。
可选地,所述数据筛选条件包括以下至少一项:
位置数据的位置标注误差小于预设阈值;
位置数据对应的区域属于预设区域;
位置数据对应的区域标签为预设区域标签;
位置数据的获取方式为预设获取方式;
位置数据的获取时间属于预设时间范围;
位置数据的数据质量等级大于预设质量等级;
位置数据不存在字段缺失;
位置数据不属于异常数据;
所述终端设备的终端标签为预设终端标签;
所述终端设备的终端能力等级大于预设能力等级;
所述终端设备的运动速度小于预设速度。
可选地,所述数据标注模块,包括:
第一预处理子模块,用于根据预先设定或协议规定的数据预处理方式对位置数据进行预处理,得到预处理后的位置数据;
第二标注子模块,用于根据所述第一信息对预处理后的位置数据进行标注,得到数据标签。
可选地,所述第一信息还包括数据预处理方式,所述数据标注模块还包括:
第二预处理子模块,用于所述终端设备按照所述数据预处理方式对所述第一位置数据进行预处理,得到第二位置数据;
所述第一标注子模块,包括:
数据标注单元,用于按照所述标签内容对所述第二位置数据进行标注,得到数据标签。
可选地,所述数据预处理方式包括以下至少一项:插值处理、平滑处理、量化处理、归一化处理。
可选地,所述数据预处理方式包括插值处理,所述装置还包括:
第二信息接收模块,用于接收所述网络侧设备发送的第二信息,所述第二信息中携带标签密度指示,所述标签密度指示用于指示所述数据标签的标签密度;
所述第二预处理子模块,包括:
第一插值处理单元,用于根据所述标签密度指示对所述第一位置数据进行插值处理,得到第二位置数据。
可选地,所述标签密度指示包括以下任一项:
第一时间范围内,数据标签的标签数目为N1;
第一距离范围内,数据标签的标签数目为N2;
数据标签的标签密度为N3/时间单位,或者,N4/距离单位;
其中,N1、N2、N3和N4均为正整数。
可选地,所述时间单位包括以下任一项:小时、分钟、秒、毫秒、微秒、帧、子帧、时隙、正交频分复用符号。
可选地,所述数据预处理方式包括插值处理,所述装置还包括:
第三信息接收模块,用于接收所述网络侧设备发送的第三信息,所述第三信息中携带插值指示;
所述第二预处理子模块,包括:
第二插值处理单元,用于按照所述插值指示对应的目标插值方法对所述第一位置数据进行插值处理,得到第二位置数据。
可选地,所述数据预处理方式包括平滑处理,所述装置还包括:
第四信息接收模块,用于接收所述网络侧设备发送的第四信息,所述第四信息中携带平滑指示;
所述第二预处理子模块,包括:
平滑处理单元,用于按照所述平滑指示对应的目标平滑方法对所述第一位置数据进行平滑处理,得到第二位置数据。
可选地,所述数据预处理方式包括量化处理,所述装置还包括:
第五信息接收模块,用于接收所述网络侧设备发送的第五信息,所述第五信息中携带数据量化辅助信息,所述数据量化辅助信息包括以下至少一项:
量化参考点的标识和位置;
量化方式,所述量化方式包括均匀量化或非均匀量化;
所述第二预处理子模块,包括:
量化处理单元,用于根据所述数据量化辅助信息对所述第一位置数据进行量化处理,得到第二位置数据。
可选地,所述数据预处理方式包括归一化处理,所述装置还包括:
第六信息接收模块,用于接收所述网络侧设备发送的第六信息,所述第六信息中携带归一化指示;
所述第二预处理子模块,包括:
归一化处理单元,用于按照所述归一化指示对应的目标归一化方法对所述第一位置数据进行归一化处理,得到第二位置数据。
可选地,所述终端设备包括常规终端设备和/或定位参考单元。
第四方面,本申请实施例提供了另一种数据标注装置。参照图7,示出了本申请实施例提供的一种数据标注装置的结构框图,该装置可以应用于网络侧设备。如图7所示,该装置具体可以包括:
第一信息发送模块701,用于向终端设备发送第一信息,所述第一信息用于对位置数据进行标注得到数据标签;所述数据标签用于对机器学习模型进行迭代训练,所述机器学习模型用于预测所述终端设备的位置信息。
可选地,所述第一信息包括数据筛选条件和标签内容;其中,所述数据筛选条件用于筛选所述位置数据,以滤除不符合所述数据筛选条件的位置数据;所述标签内容用于按照所述标签内容对位置数据进行标注。
可选地,所述标签内容包括以下至少一项:
位置标签,所述位置标签用于反映所述终端设备的位置坐标,所述位置坐标包括绝对位置坐标或相对位置坐标;
区域标签,所述区域标签用于反映所述位置数据对应的区域;
时间戳标签,所述时间戳标签用于反映所述位置数据的获取时间;
位置标注误差标签,所述位置标识误差标签用于反映所述位置标签与所述终端设备的真实位置之间的误差;
终端标签,所述终端标签包括所述终端设备的设备类型标签或身份标签;
数据获取标签,所述数据获取标签用于指示所述位置数据的获取方式;
运动状态标签,所述运动状态标签用于指示所述终端设备在获取所述位置数据时的运动速度及方向;
数据质量等级标签,所述数据质量等级标签用于指示所述位置数据的数据质量。
可选地,所述装置还包括:
标注响应信息接收模块,用于接收所述终端设备发送的标注响应信息,所述标注响应信息用于反映所述终端设备是否支持对位置数据进行标注,或者,所述标注响应信息用于反映所述终端设备支持的标签内容。
可选地,所述数据筛选条件包括以下至少一项:
位置数据的位置标注误差小于预设阈值;
位置数据对应的区域属于预设区域;
位置数据对应的区域标签为预设区域标签;
位置数据的获取方式为预设获取方式;
位置数据的获取时间属于预设时间范围;
位置数据的数据质量等级大于预设质量等级;
位置数据不存在字段缺失;
位置数据不属于异常数据;
所述终端设备的终端标签为预设终端标签;
所述终端设备的终端能力等级大于预设能力等级;
所述终端设备的运动速度小于预设速度。
可选地,所述装置还包括:
数据标签接收模块,用于接收所述终端设备发送的数据标签;
数据预处理模块,用于按照预先设定的数据预处理方式对所述数据标签进行预处理,得到目标数据标签。
可选地,所述第一信息还包括数据预处理方式,所述数据预处理方式用于对位置数据进行预处理。
可选地,所述数据预处理方式包括以下至少一项:插值处理、平滑处理、量化处理、归一化处理。
可选地,所述数据预处理方式包括插值处理,所述装置还包括:
第二信息发送模块,用于向所述终端设备发送第二信息,所述第二信息中携带标签密度指示,所述标签密度指示用于指示所述数据标签的标签密度。
可选地,所述标签密度指示包括以下任一项:
第一时间范围内,数据标签的标签数目为N1;
第一距离范围内,数据标签的标签数目为N2;
数据标签的标签密度为N3/时间单位,或者,N4/距离单位;
其中,N1、N2、N3和N4均为正整数。
可选地,所述时间单位包括以下任一项:小时、分钟、秒、毫秒、微秒、帧、子帧、时隙、正交频分复用符号。
可选地,所述数据预处理方式包括插值处理,所述装置还包括:
第三信息发送模块,用于向所述终端设备发送第三信息,所述第三信息中携带插值指示,所述插值指示用于位置数据的插值处理。
可选地,所述数据预处理方式包括平滑处理,所述装置还包括:
第四信息发送模块,用于向所述终端设备发送第四信息,所述第四信息中携带平滑指示,所述平滑指示用于位置数据的平滑处理。
可选地,所述数据预处理方式包括量化处理,所述装置还包括:
第五信息发送模块,用于向所述终端设备发送第五信息,所述第五信息中携带数据量化辅助信息,所述数据量化辅助信息包括以下至少一项:
量化参考点的标识和位置;
量化方式,所述量化方式包括均匀量化或非均匀量化。
可选地,所述数据预处理方式包括归一化处理,所述装置还包括:
第六信息发送模块,用于向所述终端设备发送第六信息,所述第六信息中携带归一化指示,所述归一化指示用于位置数据的归一化处理。
可选地,所述终端设备包括常规终端设备和/或定位参考单元。
本申请实施例中的数据标注装置可以是电子设备,例如具有操作系统的电子设备,也可以是电子设备中的部件,例如集成电路或芯片。该电子设备可以是终端设备。示例性的,终端设备可以包括但不限于上述所列举的终端设备11的类型。
本申请实施例提供的数据标注装置能够实现图2或图5的方法实施例实现的各个过程,并达到相同的技术效果,为避免重复,这里不再赘述。
可选地,如图8所示,本申请实施例还提供一种通信设备800,包括处理器801和存储器802,存储器802上存储有可在所述处理器801上运行的程序或指令,例如,该通信设备800为网络侧设备时,该程序或指令被处理器801执行时实现上述第一方面所述的数据标注方法实施例的各个步骤,且能达到相同的技术效果。该通信设备800为终端设备时,该程序或指令被处理器801执行时实现上述第二方面所述的数据标注方法实施例的各个步骤,且能达到相同的技术效果,为避免重复,这里不再赘述。
如图9所示,为实现本申请实施例的一种终端设备的硬件结构示意图。
该终端设备900包括但不限于:射频单元901、网络模块902、音频输出单元903、输入单元904、传感器905、显示单元906、用户输入单元907、接口单元908、存储器909以及处理器910等中的至少部分部件。
本领域技术人员可以理解,终端设备900还可以包括给各个部件供电的电源(比如电池),电源可以通过电源管理系统与处理器910逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图9中示出的终端设备结构并不构成对终端设备的限定,终端设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,在此不再赘述。
应理解的是,本申请实施例中,输入单元904可以包括图形处理单元(GraphicsProcessing Unit,GPU)9041和麦克风9042,图形处理器9041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元906可包括显示面板9061,可以采用液晶显示器、有机发光二极管等形式来配置显示面板9061。用户输入单元907包括触控面板9071以及其他输入设备9072中的至少一种。触控面板9071,也称为触摸屏。触控面板9071可包括触摸检测装置和触摸控制器两个部分。其他输入设备9072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
本申请实施例中,射频单元901接收来自网络侧设备的下行数据后,可以传输给处理器910进行处理;另外,射频单元901可以向网络侧设备发送上行数据。通常,射频单元901包括但不限于天线、放大器、收发信机、耦合器、低噪声放大器、双工器等。
存储器909可用于存储软件程序或指令以及各种数据。存储器909可主要包括存储程序或指令的第一存储区和存储数据的第二存储区,其中,第一存储区可存储操作系统、至少一个功能所需的应用程序或指令(比如声音播放功能、图像播放功能等)等。此外,存储器909可以包括易失性存储器或非易失性存储器,或者,存储器909可以包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(SynchronousDRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synch link DRAM,SLDRAM)和直接内存总线随机存取存储器(DirectRambus RAM,DRRAM)。本申请实施例中的存储器909包括但不限于这些和任意其它适合类型的存储器。
处理器910可包括一个或多个处理单元;可选的,处理器910集成应用处理器和调制解调处理器,其中,应用处理器主要处理涉及操作系统、用户界面和应用程序等的操作,调制解调处理器主要处理无线通信信号,如基带处理器。可以理解的是,上述调制解调处理器也可以不集成到处理器910中。
其中,射频单元901用于接收网络侧设备发送的第一信息,所述第一信息用于指示所述终端设备对位置数据进行标注;
处理器910用于根据所述第一信息对位置数据进行标注,得到数据标签;所述数据标签用于对机器学习模型进行迭代训练,所述机器学习模型用于预测所述终端设备的位置信息。
可选地,所述第一信息包括数据筛选条件和标签内容;所述处理器910具体用于:
根据所述数据筛选条件对位置数据进行筛选,得到第一位置数据;
按照所述标签内容对所述第一位置数据进行标注,得到数据标签。
可选地,所述标签内容包括以下至少一项:
位置标签,所述位置标签用于反映所述终端设备的位置坐标,所述位置坐标包括绝对位置坐标或相对位置坐标;
区域标签,所述区域标签用于反映所述位置数据对应的区域;
时间戳标签,所述时间戳标签用于反映所述位置数据的获取时间;
位置标注误差标签,所述位置标识误差标签用于反映所述位置标签与所述终端设备的真实位置之间的误差;
终端标签,所述终端标签包括所述终端设备的设备类型标签或身份标签;
数据获取标签,所述数据获取标签用于指示所述位置数据的获取方式;
运动状态标签,所述运动状态标签用于指示所述终端设备在获取所述位置数据时的运动速度及方向;
数据质量等级标签,所述数据质量等级标签用于指示所述位置数据的数据质量。
可选地,射频单元901还用于:向所述网络侧设备发送标注响应信息,所述标注响应信息用于反映所述终端设备是否支持对位置数据进行标注,或者,所述标注响应信息用于反映所述终端设备支持的标签内容。
可选地,所述数据筛选条件包括以下至少一项:
位置数据的位置标注误差小于预设阈值;
位置数据对应的区域属于预设区域;
位置数据对应的区域标签为预设区域标签;
位置数据的获取方式为预设获取方式;
位置数据的获取时间属于预设时间范围;
位置数据的数据质量等级大于预设质量等级;
位置数据不存在字段缺失;
位置数据不属于异常数据;
所述终端设备的终端标签为预设终端标签;
所述终端设备的终端能力等级大于预设能力等级;
所述终端设备的运动速度小于预设速度。
可选地,所述处理器910具体用于:
根据预先设定或协议规定的数据预处理方式对位置数据进行预处理,得到预处理后的位置数据;
根据所述第一信息对预处理后的位置数据进行标注,得到数据标签。
可选地,所述第一信息还包括数据预处理方式,按照所述标签内容对所述第一位置数据进行标注,得到数据标签之前,所述处理器910还用于:按照所述数据预处理方式对所述第一位置数据进行预处理,得到第二位置数据;
所述处理器910具体用于:按照所述标签内容对所述第二位置数据进行标注,得到数据标签。
可选地,所述数据预处理方式包括以下至少一项:插值处理、平滑处理、量化处理、归一化处理。
可选地,所述数据预处理方式包括插值处理,射频单元901还用于接收所述网络侧设备发送的第二信息,所述第二信息中携带标签密度指示,所述标签密度指示用于指示所述数据标签的标签密度;
处理器910具体用于根据所述标签密度指示对所述第一位置数据进行插值处理,得到第二位置数据。
可选地,所述标签密度指示包括以下任一项:
第一时间范围内,数据标签的标签数目为N1;
第一距离范围内,数据标签的标签数目为N2;
数据标签的标签密度为N3/时间单位,或者,N4/距离单位;
其中,N1、N2、N3和N4均为正整数。
可选地,所述时间单位包括以下任一项:小时、分钟、秒、毫秒、微秒、帧、子帧、时隙、正交频分复用符号。
可选地,所述数据预处理方式包括插值处理,射频单元901还用于接收所述网络侧设备发送的第三信息,所述第三信息中携带插值指示;
处理器910用于按照所述插值指示对应的目标插值方法对所述第一位置数据进行插值处理,得到第二位置数据。
可选地,所述数据预处理方式包括平滑处理,射频单元901还用于接收所述网络侧设备发送的第四信息,所述第四信息中携带平滑指示;
处理器910用于按照所述平滑指示对应的目标平滑方法对所述第一位置数据进行平滑处理,得到第二位置数据。
可选地,所述数据预处理方式包括量化处理,射频单元901还用于接收所述网络侧设备发送的第五信息,所述第五信息中携带数据量化辅助信息,所述数据量化辅助信息包括以下至少一项:
量化参考点的标识和位置;
量化方式,所述量化方式包括均匀量化或非均匀量化;
处理器910用于根据所述数据量化辅助信息对所述第一位置数据进行量化处理,得到第二位置数据。
可选地,所述数据预处理方式包括归一化处理,射频单元901还用于接收所述网络侧设备发送的第六信息,所述第六信息中携带归一化指示;
处理器910用于按照所述归一化指示对应的目标归一化方法对所述第一位置数据进行归一化处理,得到第二位置数据。
可选地,所述终端设备包括常规终端设备和/或定位参考单元。
本申请实施例还提供一种网络侧设备,如图10所示,该网络侧设备1000包括:天线101、射频装置102、基带装置103、处理器104和存储器105。天线101与射频装置102连接。在上行方向上,射频装置102通过天线101接收信息,将接收的信息发送给基带装置103进行处理。在下行方向上,基带装置103对要发送的信息进行处理,并发送给射频装置102,射频装置102对收到的信息进行处理后经过天线101发送出去。
以上实施例中网络侧设备执行的方法可以在基带装置103中实现,该基带装置103包括基带处理器。
基带装置103例如可以包括至少一个基带板,该基带板上设置有多个芯片,如图10所示,其中一个芯片例如为基带处理器,通过总线接口与存储器105连接,以调用存储器105中的程序,执行以上方法实施例中所示的网络设备操作。
该网络侧设备还可以包括网络接口106,该接口例如为通用公共无线接口(commonpublic radio interface,CPRI)。
具体地,本发明实施例的网络侧设备1000还包括:存储在存储器105上并可在处理器104上运行的指令或程序,处理器104调用存储器105中的指令或程序执行前述第二方面方法,并达到相同的技术效果,为避免重复,故不在此赘述。
本申请实施例还提供了一种网络侧设备。如图11所示,该网络侧设备1100包括:处理器1101、网络接口1102和存储器1103。其中,网络接口1102例如为通用公共无线接口(common public radio interface,CPRI)。
具体地,本发明实施例的网络侧设备1100还包括:存储在存储器1103上并可在处理器1101上运行的指令或程序,处理器1101调用存储器1103中的指令或程序执行前述第二方面的方法,并达到相同的技术效果,为避免重复,故不在此赘述。
本申请实施例还提供一种可读存储介质,所述可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述数据标注方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,所述处理器为上述实施例中所述的终端设备中的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器ROM、随机存取存储器RAM、磁碟或者光盘等。
本申请实施例另提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现上述数据标注方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为系统级芯片,系统芯片,芯片系统或片上系统芯片等。
本申请实施例另提供了一种计算机程序/程序产品,所述计算机程序/程序产品被存储在存储介质中,所述计算机程序/程序产品被至少一个处理器执行以实现上述数据标注方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本申请实施例还提供了一种数据标注系统,包括:终端设备及网络侧设备,所述终端可用于执行如上第二方面所述的数据标注方法的步骤,所述网络侧设备可用于执行如上第一方面所述的数据标注方法的步骤。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。
Claims (37)
1.一种数据标注方法,其特征在于,所述方法包括:
终端设备接收网络侧设备发送的第一信息,所述第一信息用于指示所述终端设备对位置数据进行标注;
所述终端设备根据所述第一信息对位置数据进行标注,得到数据标签;所述数据标签用于对机器学习模型进行迭代训练,所述机器学习模型用于预测所述终端设备的位置信息。
2.根据权利要求1所述的方法,其特征在于,所述第一信息包括数据筛选条件和标签内容;所述终端设备根据所述第一信息对位置数据进行标注,得到数据标签,包括:
所述终端设备根据所述数据筛选条件对位置数据进行筛选,得到第一位置数据;
所述终端设备按照所述标签内容对所述第一位置数据进行标注,得到数据标签。
3.根据权利要求2所述的方法,其特征在于,所述标签内容包括以下至少一项:
位置标签,所述位置标签用于反映所述终端设备的位置坐标,所述位置坐标包括绝对位置坐标或相对位置坐标;
区域标签,所述区域标签用于反映所述位置数据对应的区域;
时间戳标签,所述时间戳标签用于反映所述位置数据的获取时间;
位置标注误差标签,所述位置标识误差标签用于反映所述位置标签与所述终端设备的真实位置之间的误差;
终端标签,所述终端标签包括所述终端设备的设备类型标签或身份标签;
数据获取标签,所述数据获取标签用于指示所述位置数据的获取方式;
运动状态标签,所述运动状态标签用于指示所述终端设备在获取所述位置数据时的运动速度及方向;
数据质量等级标签,所述数据质量等级标签用于指示所述位置数据的数据质量。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
所述终端设备向所述网络侧设备发送标注响应信息,所述标注响应信息用于反映所述终端设备是否支持对位置数据进行标注,或者,所述标注响应信息用于反映所述终端设备支持的标签内容。
5.根据权利要求2所述的方法,其特征在于,所述数据筛选条件包括以下至少一项:
位置数据的位置标注误差小于预设阈值;
位置数据对应的区域属于预设区域;
位置数据对应的区域标签为预设区域标签;
位置数据的获取方式为预设获取方式;
位置数据的获取时间属于预设时间范围;
位置数据的数据质量等级大于预设质量等级;
位置数据不存在字段缺失;
位置数据不属于异常数据;
所述终端设备的终端标签为预设终端标签;
所述终端设备的终端能力等级大于预设能力等级;
所述终端设备的运动速度小于预设速度。
6.根据权利要求1所述的方法,其特征在于,所述终端设备根据所述第一信息对位置数据进行标注,得到数据标签,包括:
所述终端设备根据预先设定或协议规定的数据预处理方式对位置数据进行预处理,得到预处理后的位置数据;
所述终端设备根据所述第一信息对预处理后的位置数据进行标注,得到数据标签。
7.根据权利要求2所述的方法,其特征在于,所述第一信息还包括数据预处理方式,所述终端设备按照所述标签内容对所述第一位置数据进行标注,得到数据标签之前,所述方法还包括:
所述终端设备按照所述数据预处理方式对所述第一位置数据进行预处理,得到第二位置数据;
所述终端设备按照所述标签内容对所述第一位置数据进行标注,得到数据标签,包括:
所述终端设备按照所述标签内容对所述第二位置数据进行标注,得到数据标签。
8.根据权利要求6或7所述的方法,其特征在于,所述数据预处理方式包括以下至少一项:插值处理、平滑处理、量化处理、归一化处理。
9.根据权利要求7所述的方法,其特征在于,所述数据预处理方式包括插值处理,所述终端设备按照所述数据预处理方式对所述第一位置数据进行预处理,得到第二位置数据之前,所述方法还包括:
所述终端设备接收所述网络侧设备发送的第二信息,所述第二信息中携带标签密度指示,所述标签密度指示用于指示所述数据标签的标签密度;
所述终端设备按照所述数据预处理方式对所述第一位置数据进行预处理,得到第二位置数据,包括:
所述终端设备根据所述标签密度指示对所述第一位置数据进行插值处理,得到第二位置数据。
10.根据权利要求9所述的方法,其特征在于,所述标签密度指示包括以下任一项:
第一时间范围内,数据标签的标签数目为N1;
第一距离范围内,数据标签的标签数目为N2;
数据标签的标签密度为N3/时间单位,或者,N4/距离单位;
其中,N1、N2、N3和N4均为正整数。
11.根据权利要求10所述的方法,其特征在于,所述时间单位包括以下任一项:小时、分钟、秒、毫秒、微秒、帧、子帧、时隙、正交频分复用符号。
12.根据权利要求7所述的方法,其特征在于,所述数据预处理方式包括插值处理,所述终端设备按照所述数据预处理方式对所述第一位置数据进行预处理,得到第二位置数据之前,所述方法还包括:
所述终端设备接收所述网络侧设备发送的第三信息,所述第三信息中携带插值指示;
所述终端设备按照所述数据预处理方式对所述第一位置数据进行预处理,得到第二位置数据,包括:
所述终端设备按照所述插值指示对应的目标插值方法对所述第一位置数据进行插值处理,得到第二位置数据。
13.根据权利要求7所述的方法,其特征在于,所述数据预处理方式包括平滑处理,所述终端设备按照所述数据预处理方式对所述第一位置数据进行预处理,得到第二位置数据之前,所述方法还包括:
所述终端设备接收所述网络侧设备发送的第四信息,所述第四信息中携带平滑指示;
所述终端设备按照所述数据预处理方式对所述第一位置数据进行预处理,得到第二位置数据,包括:
所述终端设备按照所述平滑指示对应的目标平滑方法对所述第一位置数据进行平滑处理,得到第二位置数据。
14.根据权利要求7所述的方法,其特征在于,所述数据预处理方式包括量化处理,所述终端设备按照所述数据预处理方式对所述第一位置数据进行预处理,得到第二位置数据之前,所述方法还包括:
所述终端设备接收所述网络侧设备发送的第五信息,所述第五信息中携带数据量化辅助信息,所述数据量化辅助信息包括以下至少一项:
量化参考点的标识和位置;
量化方式,所述量化方式包括均匀量化或非均匀量化;
所述终端设备按照所述数据预处理方式对所述第一位置数据进行预处理,得到第二位置数据,包括:
所述终端设备根据所述数据量化辅助信息对所述第一位置数据进行量化处理,得到第二位置数据。
15.根据权利要求7所述的方法,其特征在于,所述数据预处理方式包括归一化处理,所述终端设备按照所述数据预处理方式对所述第一位置数据进行预处理,得到第二位置数据之前,所述方法还包括:
所述终端设备接收所述网络侧设备发送的第六信息,所述第六信息中携带归一化指示;
所述终端设备按照所述数据预处理方式对所述第一位置数据进行预处理,得到第二位置数据,包括:
所述终端设备按照所述归一化指示对应的目标归一化方法对所述第一位置数据进行归一化处理,得到第二位置数据。
16.根据权利要求1至15任一项所述的方法,其特征在于,所述终端设备包括常规终端设备和/或定位参考单元。
17.一种数据标注方法,其特征在于,所述方法包括:
网络侧设备向终端设备发送第一信息,所述第一信息用于对位置数据进行标注得到数据标签;所述数据标签用于对机器学习模型进行迭代训练,所述机器学习模型用于预测所述终端设备的位置信息。
18.根据权利要求17所述的方法,其特征在于,所述第一信息包括数据筛选条件和标签内容;其中,所述数据筛选条件用于筛选所述位置数据,以滤除不符合所述数据筛选条件的位置数据;所述标签内容用于按照所述标签内容对位置数据进行标注。
19.根据权利要求18所述的方法,其特征在于,所述标签内容包括以下至少一项:
位置标签,所述位置标签用于反映所述终端设备的位置坐标,所述位置坐标包括绝对位置坐标或相对位置坐标;
区域标签,所述区域标签用于反映所述位置数据对应的区域;
时间戳标签,所述时间戳标签用于反映所述位置数据的获取时间;
位置标注误差标签,所述位置标识误差标签用于反映所述位置标签与所述终端设备的真实位置之间的误差;
终端标签,所述终端标签包括所述终端设备的设备类型标签或身份标签;
数据获取标签,所述数据获取标签用于指示所述位置数据的获取方式;
运动状态标签,所述运动状态标签用于指示所述终端设备在获取所述位置数据时的运动速度及方向;
数据质量等级标签,所述数据质量等级标签用于指示所述位置数据的数据质量。
20.根据权利要求19所述的方法,其特征在于,所述方法还包括:
所述网络侧设备接收所述终端设备发送的标注响应信息,所述标注响应信息用于反映所述终端设备是否支持对位置数据进行标注,或者,所述标注响应信息用于反映所述终端设备支持的标签内容。
21.根据权利要求18所述的方法,其特征在于,所述数据筛选条件包括以下至少一项:
位置数据的位置标注误差小于预设阈值;
位置数据对应的区域属于预设区域;
位置数据对应的区域标签为预设区域标签;
位置数据的获取方式为预设获取方式;
位置数据的获取时间属于预设时间范围;
位置数据的数据质量等级大于预设质量等级;
位置数据不存在字段缺失;
位置数据不属于异常数据;
所述终端设备的终端标签为预设终端标签;
所述终端设备的终端能力等级大于预设能力等级;
所述终端设备的运动速度小于预设速度。
22.根据权利要求17所述的方法,其特征在于,所述方法还包括:
所述网络侧设备接收所述终端设备发送的数据标签;
所述网络侧设备按照预先设定的数据预处理方式对所述数据标签进行预处理,得到目标数据标签。
23.根据权利要求18所述的方法,其特征在于,所述第一信息还包括数据预处理方式,所述数据预处理方式用于对位置数据进行预处理。
24.根据权利要求22或23所述的方法,其特征在于,所述数据预处理方式包括以下至少一项:插值处理、平滑处理、量化处理、归一化处理。
25.根据权利要求23所述的方法,其特征在于,所述数据预处理方式包括插值处理,所述方法还包括:
所述网络侧设备向所述终端设备发送第二信息,所述第二信息中携带标签密度指示,所述标签密度指示用于指示所述数据标签的标签密度。
26.根据权利要求25所述的方法,其特征在于,所述标签密度指示包括以下任一项:
第一时间范围内,数据标签的标签数目为N1;
第一距离范围内,数据标签的标签数目为N2;
数据标签的标签密度为N3/时间单位,或者,N4/距离单位;
其中,N1、N2、N3和N4均为正整数。
27.根据权利要求26所述的方法,其特征在于,所述时间单位包括以下任一项:小时、分钟、秒、毫秒、微秒、帧、子帧、时隙、正交频分复用符号。
28.根据权利要求23所述的方法,其特征在于,所述数据预处理方式包括插值处理,所述方法还包括:
所述网络侧设备向所述终端设备发送第三信息,所述第三信息中携带插值指示,所述插值指示用于位置数据的插值处理。
29.根据权利要求23所述的方法,其特征在于,所述数据预处理方式包括平滑处理,所述方法还包括:
所述网络侧设备向所述终端设备发送第四信息,所述第四信息中携带平滑指示,所述平滑指示用于位置数据的平滑处理。
30.根据权利要求23所述的方法,其特征在于,所述数据预处理方式包括量化处理,所述方法还包括:
所述网络侧设备向所述终端设备发送第五信息,所述第五信息中携带数据量化辅助信息,所述数据量化辅助信息包括以下至少一项:
量化参考点的标识和位置;
量化方式,所述量化方式包括均匀量化或非均匀量化。
31.根据权利要求23所述的方法,其特征在于,所述数据预处理方式包括归一化处理,所述方法还包括:
所述网络侧设备向所述终端设备发送第六信息,所述第六信息中携带归一化指示,所述归一化指示用于位置数据的归一化处理。
32.根据权利要求17至31任一项所述的方法,其特征在于,所述终端设备包括常规终端设备和/或定位参考单元。
33.一种数据标注装置,其特征在于,应用于终端设备,所述装置包括:
第一信息接收模块,用于接收网络侧设备发送的第一信息,所述第一信息用于指示所述终端设备对位置数据进行标注;
数据标注模块,用于根据所述第一信息对位置数据进行标注,得到数据标签;所述数据标签用于对机器学习模型进行迭代训练,所述机器学习模型用于预测所述终端设备的位置信息。
34.一种数据标注装置,其特征在于,应用于网络侧设备,所述装置包括:
第一信息发送模块,用于向终端设备发送第一信息,所述第一信息用于对位置数据进行标注得到数据标签;所述数据标签用于对机器学习模型进行迭代训练,所述机器学习模型用于预测所述终端设备的位置信息。
35.一种终端设备,其特征在于,包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1至16任一项所述的数据标注方法的步骤。
36.一种网络侧设备,其特征在于,包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求17至32任一项所述的数据标注方法的步骤。
37.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1至16任一项所述的数据标注方法,或者实现如权利要求17至32任一项所述的数据标注方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211350294.1A CN117998295A (zh) | 2022-10-31 | 2022-10-31 | 数据标注方法、装置、终端设备及网络侧设备 |
PCT/CN2023/126883 WO2024093799A1 (zh) | 2022-10-31 | 2023-10-26 | 数据标注方法、装置、终端设备及网络侧设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211350294.1A CN117998295A (zh) | 2022-10-31 | 2022-10-31 | 数据标注方法、装置、终端设备及网络侧设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117998295A true CN117998295A (zh) | 2024-05-07 |
Family
ID=90888307
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211350294.1A Pending CN117998295A (zh) | 2022-10-31 | 2022-10-31 | 数据标注方法、装置、终端设备及网络侧设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN117998295A (zh) |
WO (1) | WO2024093799A1 (zh) |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102169291B1 (ko) * | 2018-09-20 | 2020-10-23 | 에스케이텔레콤 주식회사 | 측위모델구성장치 및 단말측위장치, 그 장치의 동작 방법 |
CN113449207B (zh) * | 2020-03-24 | 2024-09-06 | 花瓣云科技有限公司 | 电子设备定位的方法、装置、服务器、系统以及存储介质 |
US11812338B2 (en) * | 2020-08-04 | 2023-11-07 | Qualcomm Incorporated | Selective triggering of neural network functions for positioning measurement feature processing at a user equipment |
CN112073900B (zh) * | 2020-08-14 | 2021-05-25 | 珠海格力电器股份有限公司 | 定位基站数据流处理方法、装置、设备及计算机可读介质 |
CN114222238B (zh) * | 2020-09-03 | 2024-04-26 | 中国电信股份有限公司 | 定位方法、装置和计算机可读存储介质 |
CN112182048B (zh) * | 2020-09-11 | 2024-09-17 | 南方科技大学 | 数据标注方法、网络设备、终端、系统及存储介质 |
CN114090601B (zh) * | 2021-11-23 | 2023-11-03 | 北京百度网讯科技有限公司 | 一种数据筛选方法、装置、设备以及存储介质 |
-
2022
- 2022-10-31 CN CN202211350294.1A patent/CN117998295A/zh active Pending
-
2023
- 2023-10-26 WO PCT/CN2023/126883 patent/WO2024093799A1/zh unknown
Also Published As
Publication number | Publication date |
---|---|
WO2024093799A1 (zh) | 2024-05-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116488747A (zh) | 信息交互方法、装置及通信设备 | |
WO2023143572A1 (zh) | 基于人工智能ai模型的定位方法及通信设备 | |
CN117998295A (zh) | 数据标注方法、装置、终端设备及网络侧设备 | |
WO2024008111A1 (zh) | 数据采集方法及装置 | |
CN118042399A (zh) | 模型监督方法、终端及网络侧设备 | |
WO2024208167A1 (zh) | 信息处理方法、信息处理装置、终端及网络侧设备 | |
CN117390440A (zh) | 人工智能模型训练方法、装置、网络侧设备、终端及介质 | |
CN117493864A (zh) | 模型训练方法、装置、网络侧设备及终端设备 | |
US20240314728A1 (en) | Positioning method and communication device | |
CN117835262A (zh) | Ai模型的处理方法、装置及通信设备 | |
WO2024120445A1 (zh) | 模型输入信息的确定方法、装置、设备、系统及存储介质 | |
US20240372789A1 (en) | Communication Network Prediction Method, Terminal, and Network-Side Device | |
CN118283643A (zh) | 数据集确定方法、信息传输方法、装置和通信设备 | |
US20240323741A1 (en) | Measurement method and apparatus, device, and storage medium | |
CN117938689A (zh) | Ai模型配置方法、终端及网络侧设备 | |
CN117896838A (zh) | Ai模型推理方法、设备及可读存储介质 | |
CN117639862A (zh) | Csi预测处理方法、装置、通信设备及可读存储介质 | |
CN116489035A (zh) | 通信网络预测方法、终端及网络侧设备 | |
CN118158737A (zh) | 信息传输方法、信息传输装置和通信设备 | |
CN117560708A (zh) | 一种智能ai网络模型的性能监督方法、装置和通信设备 | |
CN117834427A (zh) | 更新ai模型参数的方法、装置及通信设备 | |
CN116847456A (zh) | 定位方法、装置、终端及网络侧设备 | |
CN118277783A (zh) | 模型训练处理方法、装置及相关设备 | |
CN116234000A (zh) | 定位方法及通信设备 | |
CN117997397A (zh) | 资源配置方法、装置、通信设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |