CN113766633A - 数据处理方法、装置、电子设备以及存储介质 - Google Patents
数据处理方法、装置、电子设备以及存储介质 Download PDFInfo
- Publication number
- CN113766633A CN113766633A CN202110523352.5A CN202110523352A CN113766633A CN 113766633 A CN113766633 A CN 113766633A CN 202110523352 A CN202110523352 A CN 202110523352A CN 113766633 A CN113766633 A CN 113766633A
- Authority
- CN
- China
- Prior art keywords
- probability
- wireless signal
- target
- information
- longitude
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W64/00—Locating users or terminals or network equipment for network management purposes, e.g. mobility management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/021—Services related to particular areas, e.g. point of interest [POI] services, venue services or geofences
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/30—Services specially adapted for particular environments, situations or purposes
- H04W4/33—Services specially adapted for particular environments, situations or purposes for indoor environments, e.g. buildings
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本申请实施例公开了一种数据处理方法、装置、电子设备以及存储介质,包括:采集目标设备的经纬度信息以及无线信号接入信息;根据所述经纬度信息以及无线信号接入信息,计算所述目标设备位于预设候选区域集合中每个候选区域对应的第一概率;根据所述第一概率在多个候选区域中选择目标区域,所述目标区域包含至少一个目标子区域;调用所述目标区域的无线信号连接信息,所述无线信号连接信息携带有在历史时段内连接无线资源所产生的数据;基于所述无线信号接入信息以及无线信号连接信息,计算所述目标设备到达每个目标子区域对应的第二概率;根据所述第一概率和第二概率,获取所述目标设备的位置,该方案可以提高定位的准确性。
Description
技术领域
本申请涉及计算机技术领域,具体涉及一种数据处理方法、装置、电子设备以及存储介质。
背景技术
目前,在室内环境中,需要通过专门的室内定位技术实现室内位置的定位。室内定位是指在室内环境中实现位置定位,主要采用无线通讯、基站定位、惯导定位等多种技术集成形成一套室内位置定位体系,从而实现人员、物体等在室内空间中的位置监控。
目前,室内定位的方案有利用射频技术进行室内定位的,也有利用经纬度信息进行室内定位的,但是,第一种方案对于设备要求较高,且无法对于广域候选区域进行匹配,当遇到候选区域的范围很大时,进行精确化定位需要进行多次重复计算,计算开销较大;在第二种方案中,信号容易受到墙壁格挡的影响,导致经纬度通常存在较大的误差,无法进行精确定位。
发明内容
本发明实施例提供一种数据处理方法、装置、电子设备以及存储介质,可以减小定位时的计算量,并且,提高定位的准确性。
本发明实施例提供了一种数据处理方法,包括:
采集目标设备的经纬度信息以及无线信号接入信息;
根据所述经纬度信息以及无线信号接入信息,计算所述目标设备位于预设候选区域集合中每个候选区域对应的第一概率;
根据所述第一概率在多个候选区域中选择目标区域,所述目标区域包含至少一个目标子区域;
调用所述目标区域的无线信号连接信息,所述无线信号连接信息携带有在历史时段内连接无线资源所产生的数据;
基于所述无线信号接入信息以及无线信号连接信息,计算所述目标设备到达每个目标子区域对应的第二概率;
根据所述第一概率和第二概率,获取所述目标设备的位置。
相应的,本申请实施例还提供了一种数据处理装置,包括:
采集模块,用于采集目标设备的经纬度信息以及无线信号接入信息;
第一计算模块,用于根据所述经纬度信息以及无线信号接入信息,计算所述目标设备位于预设候选区域集合中每个候选区域对应的第一概率;
选择模块,用于根据所述第一概率在多个候选区域中选择目标区域,所述目标区域包含至少一个目标子区域;
调用模块,用于调用所述目标区域的无线信号连接信息,所述无线信号连接信息携带有在历史时段内连接无线资源所产生的数据;
第二计算模块,用于基于所述无线信号接入信息以及无线信号连接信息,计算所述目标设备到达每个目标子区域对应的第二概率;
获取模块,用于根据所述第一概率和第二概率,获取所述目标设备的位置。
可选的,在本申请的一些实施例中,所述第一计算模块包括:
第一获取单元,用于获取预设决策树模型以及序列神经网络分类模型;
第一计算单元,用于根据所述决策树模型以及经纬度信息,计算所述目标设备到达预设候选区域集合中每个候选区域对应的经纬度定位概率;
第二计算单元,用于基于所述序列神经网络分类模型以及无线信号接入信息,计算所述目标设备到达预设候选区域集合中每个候选区域对应的无线信号定位概率;
融合单元,用于融合所述经纬度定位概率和无线信号定位概率,得到所述目标设备位于预设候选区域集合中每个候选区域对应的第一概率。
可选的,在本申请的一些实施例中,所述第一计算单元包括:
输出子单元,用于将所述经纬度信息输入至决策树模型中的每一棵树,输出每一棵树对应的分数值;
求和单元,用于对多个分数值进行求和,得到所述目标设备到达预设候选区域集合中每个候选区域对应的经纬度定位概率。
可选的,在本申请的一些实施例中,所述输出子单元具体用于:
通过所述决策树模型提取所述经纬度信息的特征向量;
将所述特征向量输入至决策树模型中的每一棵树中,得到所述每一棵树对应的叶子节点,其中,每个所述叶子节点对应一个约束条件;
检测所述叶子节点是否符合对应的约束条件;
基于叶子节点是否符合对应的约束条件,输出每一棵树对应的分数值。
可选的,在本申请的一些实施例中,所述第二计算单元具体用于:
从所述无线信号接入信息提取所述目标设备的物理地址以及无线信号接入强度值;
基于所述目标设备的物理地址以及无线信号接入强度值,构建所述无线信号接入信息对应的无线信号接入特征;
通过所述序列神经网络分类模型以及无线信号接入特征,计算所述目标设备到达预设候选区域集合中每个候选区域对应的无线信号定位概率。
可选的,在本申请的一些实施例中,所述选择模块具体用于:
将所述经纬度定位概率大于第一预设值的候选区域确定为目标区域,或者;
将所述无线信号定位概率大于第一预设值的候选区域确定为目标区域。
可选的,在本申请的一些实施例中,所述第二计算模块具体用于:
获取预设序列神经网络匹配模型;
从所述无线信号接入信息提取所述目标设备的物理地址,并构建所述物理地址对应的物理地址序列;
从所述无线信号连接信息中获取每个无线资源的连接频次以及无线信号强度值;
基于所述无线资源的连接频次以及无线信号强度值,构建所述无线信号连接信息对应的无线信号连接序列;
拼接所述物理地址序列和无线信号连接序列,得到拼接后序列;
将所述拼接后序列输入至所述序列神经网络匹配模型中,输出所述目标设备到达每个目标子区域对应的第二概率。
可选的,在本申请的一些实施例中,还包括保留模块,所述保留模块具体用于:
将第二概率大于第二预设值的目标子区域确定为候选子区域,并保留所述候选子区域;
所述获取模块具体用于:根据所述第一概率和所述候选子区域对应的第二概率,获取所述目标设备的位置。
可选的,在本申请的一些实施例中,所述获取模块具体用于:
基于贝叶斯法则计算第二概率的后验概率;
计算所述后验概率与所述第一概率之间的乘积,得到联合概率;
将最大的所述联合概率对应的目标子区域确定为所述目标设备的位置。
本申请实施例在采集目标设备的经纬度信息以及无线信号接入信息后,根据所述经纬度信息以及无线信号接入信息,计算所述目标设备位于预设候选区域集合中每个候选区域对应的第一概率,然后,根据所述第一概率在多个候选区域中选择目标区域,所述目标区域包含至少一个目标子区域,接着,调用所述目标区域的无线信号连接信息,所述无线信号连接信息携带有在历史时段内连接无线资源所产生的数据,再然后,基于所述无线信号接入信息以及无线信号连接信息,计算所述目标设备到达每个目标子区域对应的第二概率,最后,根据所述第一概率和第二概率,获取所述目标设备的位置。因此,该方案可以提高设备定位的准确性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a是本申请实施例提供的数据处理方法的场景示意图;
图1b是本申请实施例提供的数据处理方法的流程示意图;
图1c是本申请提供的用户到店情况示意图;
图1d是BERT模型的结构示意图;
图1e是本申请提供的BERT模型的结构示意图;
图2是本申请实施例提供的数据处理方法的另一流程示意图;
图3a是本申请实施例提供的数据处理装置的结构示意图;
图3b是本申请实施例提供的数据处理装置的另一结构示意图;
图4是本申请实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。
深度学习是机器学习的核心部分,其通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。其中,深度学习是机器学习领域中一个新的研究方向。即,深度学习是机器学习中一种基于对数据进行表征学习的方法。观测值(例如一幅图像)可以使用多种方式来表示,如每个像素强度值的向量,或者更抽象地表示成一系列边、特定形状的区域等。而使用某些特定的表示方法更容易从实例中学习任务(例如,人脸识别或面部表情识别)。深度学习的好处是用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
本申请实施例提供的方案涉及人工智能的深度学习等技术,现通过如下实施例进行说明。
本申请实施例提供一种数据处理方法、装置、电子设备和存储介质。
其中,该数据处理装置具体可以集成在终端或服务器中。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器,本申请在此不做限制。
例如,请参阅图1a,本申请提供一种数据处理系统,包括手机10和服务器20,其中,数据处理装置集成在服务器20中,具体的,用户进入到某个商场后,通过手机10打开定位服务,服务器20采集目标设备的经纬度信息以及无线信号接入信息,然后,服务器20根据经纬度信息以及无线信号接入信息,计算手机10位于预设候选区域集合(即商场)中每个候选区域(即商圈)对应的第一概率,接着,服务器20根据第一概率在多个候选区域中选择目标区域,目标区域包含至少一个目标子区域(即商铺),再然后,服务器20调用目标区域的无线信号连接信息,无线信号连接信息携带有在历史时段内连接无线资源所产生的数据,紧接着,服务器20基于无线信号接入信息以及无线信号连接信息,计算手机10到达每个目标子区域对应的第二概率,最后,服务器20根据第一概率和第二概率,定位手机10的位置。
本申请提供的数据处理方案,利用目标设备的经纬度信息以及无线信号接入信息召回目标区域,并利用无线信号接入信息以及无线信号连接信息,计算目标设备到达每个目标子区域的概率,即,本方案主要依赖于无线信号,可以避免出现在室内经纬度存在较大的误差而导致定位精度不准确的问题,并且,当遇到候选区域的范围很大时,无需进行多次重复计算,由此,在减小定位时的计算量的同时,提高了定位的准确性。
以下分别进行详细说明。需说明的是,以下实施例的描述顺序不作为对实施例优先顺序的限定。
一种数据处理方法,包括:采集目标设备的经纬度信息以及无线信号接入信息,根据经纬度信息以及无线信号接入信息,计算目标设备位于预设候选区域集合中每个候选区域对应的第一概率,根据第一概率在多个候选区域中选择目标区域,调用目标区域的无线信号连接信息,基于无线信号接入信息以及无线信号连接信息,计算目标设备到达每个目标子区域对应的第二概率,根据第一概率和第二概率,获取目标设备的位置。
请参阅图1b,图1b为本申请实施例提供的数据处理方法的流程示意图。该数据处理方法的具体流程可以如下:
101、采集目标设备的经纬度信息以及无线信号接入信息。
目标设备可以是任何能够接收基站信号并能够与服务器进行通信的计算设备。例如,目标设备可以是蜂窝电话、无绳电话、会话启动协议(Session Initiation Protocol,SIP)电话、无线本地环路(Wireless Local Loop,WLL)站、个人数字处理(PersonalDigital Assistant,PDA)、具有无线通信功能的手持设备、计算设备或连接到无线调制解调器的其它处理设备、车载设备、可穿戴设备、未来5G网络中的终端设备或者未来演进的PLMN(Public Land Mobile Network,公共陆地移动网络)中的终端设备等。
其中,目标设备的经纬度信息可以为全球定位系统定位所产生的定位信息,全球定位系统(Global Positioning System,GPS)是一种以人造地球卫星为基础的高精度无线电导航的定位系统,它在全球任何地方以及近地空间都能够提供准确的地理位置、车行速度及精确的时间信息,目标设备中可以装在有GPS接收机,并利用GPS接收机定从目标设备至GPS卫星的距离,并根据卫星星历所给出的观测瞬间卫星在空间的位置等信息求出目标设备的三维位置、三维运动速度和钟差等参数。
无线信号接入信息为WiFi信号接入信息,WiFi信号实质上是一种无线点,无线电是指在所有自由空间(包括空气和真空)传播的电磁波,是其中的一个有限频带,上限频率在3THz(太赫兹),下限频率较不统一,常见的有3KHz~3THz(ITU-国际电信联盟规定),9KHz~3THz,10KHz~3THz。
102、根据经纬度信息以及无线信号接入信息,计算目标设备位于预设候选区域集合中每个候选区域对应的第一概率。
其中,预设候选区域集合包括至少一个候选区域,该候选区域可以是预先设置的区域,如商场中的某个商圈或者是商场中的某一层,具体根据实际情况进行设置,进一步的,利用预设的决策树模型对经纬度信息进行处理,以及利用预设的神经网络模型对无线信号接入信息进行处理,计算目标设备位于预设候选区域集合中每个候选区域对应的第一概率,即,可选的,在一些实施例中,步骤“根据经纬度信息以及无线信号接入信息,计算目标设备位于预设候选区域集合中每个候选区域对应的第一概率”,具体可以包括:
(11)获取预设决策树模型以及序列神经网络分类模型;
(12)根据决策树模型以及经纬度信息,计算目标设备到达预设候选区域集合中每个候选区域对应的经纬度定位概率;
(13)基于序列神经网络分类模型以及无线信号接入信息,计算目标设备到达预设候选区域集合中每个候选区域对应的无线信号定位概率;
(14)融合经纬度定位概率和无线信号定位概率,得到目标设备位于预设候选区域集合中每个候选区域对应的第一概率。
其中,该决策树模型可以是XGBoost模型,XGBoost模型是梯度提升树模型的一种,同样是串行地生成模型,取所有模型的和为输出。XGBoost模型将损失函数作二阶泰勒展开,利用损失函数的二阶导数信息优化损失函数,根据损失函数选择是否分裂节点。同时,XGBoost在防止过拟合方面加入了正则化、学习率、列采样、近似最优分割点等手段。
需要说明的是,决策树是一种非参数的监督学习方法,它主要用于分类和回归。决策树的目的是构造一种模型,使之能够从样本数据的特征属性中,通过决策规则预测目标变量的值。
决策树往往采用的是自上而下的设计方法,每迭代循环一次,就会选择一个特征属性进行分叉,直到不能再分叉为止。因此在构建决策树的过程中,选择最佳(既能够快速分类,又能使决策树的深度小)的分叉特征属性是关键所在。这种“最佳性”可以用非纯度(impurity)进行衡量。如果一个数据集合中只有一种分类结果,则该集合最纯,即一致性好;反之有许多分类,则不纯,即一致性不好。有许多指标可以定量的度量这种非纯度,最常用的有熵,基尼指数(Gini Index)和分类误差。
XGBoost模型为多个弱学习器所集成的强学习器,弱学习器组成强学习器涉及一个概念:集成学习。集成学习是指将若干弱分类器组合之后产生一个强分类器。弱分类器指那些分类准确率只稍好于随机猜测的分类器(错误率<50%),而强学习器的准确率则高于弱分类器的准确率。XGBoost主要利用特征维度对样本空间进行划分,通过不断地进行特征分裂来添加树,最终通过贪婪算法和调节树的最大深度的超参数得到一个包含K棵树的模型,并利用该模型对样本进行预测,具体的,将经纬度信息输入至决策树模型中的每一棵树中,然后,对每棵树输出的分数值进行求和,从而得到定位设备到达预设候选区域集合中每个候选区域对应的经纬度定位概率,也即,可选的,在一些实施例中,步骤“根据决策树模型以及经纬度信息,计算目标设备到达预设候选区域集合中每个候选区域对应的经纬度定位概率”,具体可以包括:
(21)将经纬度信息输入至决策树模型中的每一棵树,输出每一棵树对应的分数值;
(22)对多个分数值进行求和,得到目标设备到达预设候选区域集合中每个候选区域对应的经纬度定位概率。
以多个弱学习器为CART(ClassificationAndRegressionTree,分类和回归树)为例说明,将经纬度信息输入XGBoost模型,通过XGBoost模型提取经纬度信息的特征向量,将该特征向量输入该多个弱学习器,每个弱学习器都可以对该特征向量进行特征分裂,得到该弱学习器所在决策树的叶子节点,由于每个弱学习器都对应于一个约束条件,其中,在不同场景下,约束条件是不相同的,在回归树下,弱学习器的约束条件则为:平方误差最小化准则,其中,平方误差用于表示回归树对于训练数据的预测误差,即,弱学习器的预测误差最小时,则确定该弱学习器满足约束条件;在分类树下,弱学习器的约束条件则为:基尼指数最小化准则,其中,基尼指数是一种不等性度量,可以用来度量任何不均匀分布,并且,基尼指数是是介于0~1之间的数,0-完全相等,1-完全不相等,总体内包含的类别越杂乱,基尼指数就越大(跟熵的概念很相似)。在CART算法中,基尼不纯度表示一个随机选中的样本在子集中被分错的可能性。基尼不纯度为这个样本被选中的概率乘以它被分错的概率。当一个节点中所有样本都是一个类时,基尼不纯度为零。即,弱学习器的基尼指数最小时,则确定该弱学习器满足约束条件。
对于符合约束条件的叶子节点,那么弱学习器输出一个大于0的叶子节点分数,对于不符合约束条件的叶子节点,那么弱学习器输出一个小于0的叶子节点分数,重复执行上述过程,多个弱学习器将会输出多个叶子节点分数,通过对该多个叶子节点分数进行求和,得到目标设备到达预设候选区域集合中每个候选区域对应的经纬度定位概率,即,可选的,在一些实施例中,步骤“将经纬度信息输入至决策树模型中的每一棵树,输出每一棵树对应的分数值”,具体可以包括:
(31)通过决策树模型提取经纬度信息的特征向量;
(32)将特征向量输入至决策树模型中的每一棵树中,得到每一棵树对应的叶子节点;
(33)检测叶子节点是否符合对应的约束条件;
(34)基于叶子节点是否符合对应的约束条件,输出每一棵树对应的分数值。
其中,约束条件可以根据实际情况进行灵活设置,在本申请中,需要预测每个候选区域对应的经纬度定位概率,考虑到候选区域对应不同经度和纬度,故先根据经度区分不同高度的候选区域,然后,再通过纬度区分候选区域的位置,最后,基于目标设备的经纬度信息,逐一计算目标设备到达预设候选区域集合中每个候选区域对应的经纬度定位概率。
需要说明的是,可以预先对该XGBoost模型进行预训练,以商场A内的室内定位为例进行具体说明,首先,采集近一个月内进入商场A的用户的经纬度信息,为了便于描述,以下简称样本,其中,该样本标注有用户所在区域,该区域包含区域内到店及区域内未到店,需要说明的是,区域内到店到店可以理解为在该区域内并且进入到店铺中,同样的,区域内未到店可以理解为在该区域内,但是并未进入到店铺中,请参阅图1c,图中圆形a表示区域内到店,长方形b表示区域内未到店,然后,将样本输入至XGBoost模型,以预测用户到店的情况,最后,基于用户的标签以及用户的预测结果,对该XGBoost模型的网络参数进行调整,直至学习完成,得到训练好的XGBoost模型,该训练好的XGBoost模型具有对经纬度信息预测用户到店的能力。
进一步的,在本申请中,序列神经网络可以为基于变换器的双向编码模型(BiDirectional Encoder Rpresentation From Transformers,BERT),BERT的网络架构使用的是多层Transformers-encoder结构,Transformers-encoder是由谷歌开源的,用于解决序列问题的神经网络结构,BERT模型的输入的编码向量(长度是512)是3个嵌入特征的单位和,这三个词嵌入特征是:词嵌入、位置嵌入以及分割嵌入,请参阅图1d,BERT的输入是token、segmentation和position embeddings的叠加,也就说每个单词的embedding是三个embedding的叠加。对于token embeddings(词嵌入),是通过单词表来实现的;而positional embedding(位置嵌入)s用来表示句子中单词的位置信息;segementembeddings(分割嵌入)则是对于句子整体的,即,用于区分两个句子,例如B是否是A的下文两个句子,例如B是否是A的下文,BERT是一种双向语言模型,它需要同时考虑单词的上文和下文,为了实现这一目的,模型采用了一种简单的方法:随机屏蔽(masking)部分输入token,然后训练模型去正确预测那些被屏蔽的token,具体来说,模型会随机选择语料中15%的单词,然后其中的80%会用[Mask]掩码代替原始单词,从而得到遮盖文本串,其中的10%会被随机换为另一个单词,剩下10%保持原单词不变,然后要求模型去正确预测被选中的单词。做这些处理的原因是,[Mask]只在训练中才会出现,如果选中单词都变为了[Mask],这会导致训练出来的模型可能会针对于[Mask],这与实际不符,所以才会有一些概率将[Mask]随机替换,而这个概率大小为10%×15%=1.5%,基本不会损害模型的语言理解能力,而模型为了预测正确,就需要保持每个输入token的分布式上下文表示,从而实现了对上下文进行特征提取的目的,前面的遮蔽语言模型是针对于单词量级的训练,而自然语言识别任务中有许多在句子量级上的,这就需要语言模型还要理解句子之间的关系,这有助于下游句子关系判断任务,而BERT模型中的下一句预测就是为了这一目的。它的原理也很简单,就是预训练一个二值化的下一句预测任务,具体来说,选择句子A和B作为训练样本:A的下一句有50%的可能是B,另外50%的可能B是随机取自语料库的,模型需要正确预测B是不是A的下一句,对于其它任务来说,可以根据BERT模型的输出信息作出对应的预测,在本申请中,可以构建无线信号接入信息的无线信号接入特征,即,利用无线信号的物理地址以及无线信号接入强度值,构建用于表征无线信号的特征序列(无线信号接入特征),然后,将无线信号接入特征输入至BERT模型,以计算目标设备到达预设候选区域集合中每个候选区域对应的无线信号定位概率,即,可选的,在一些实施例中,步骤“基于序列神经网络分类模型以及无线信号接入信息,计算目标设备到达预设候选区域集合中每个候选区域对应的无线信号定位概率”,具体可以包括:
(41)从无线信号接入信息提取目标设备的物理地址以及无线信号接入强度值;
(42)基于目标设备的物理地址以及无线信号接入强度值,构建无线信号接入信息对应的无线信号接入特征;
(43)通过序列神经网络分类模型以及无线信号接入特征,计算目标设备到达预设候选区域集合中每个候选区域对应的无线信号定位概率。
需要说明的是,无线信号接入强度值,又称接收信号强度(Received SignalStrength,RSS),RSS用于衡量接入的无线信号的强度,物理地址,又称媒体存取控制位址(Media Access Control Address,MAC),也称为局域网地址(LAN Address),以太网地址(Ethernet Address)或物理地址(Physical Address),它是一个用来确认网络设备位置的位址,在此,需要引申一个概念,基础结构型基本服务集(Basic Service Set,BSS),基础结构型基本服务集被界定在接入点的传输范围内,接入点负责基础结构型网络所有的通信,包括同一服务区域内所有移动节点的通信,BSS可用于提供WIFI服务,BSSID就是设备虚拟的MAC地址,这个MAC可以和设备的实际MAC一样,也可以是在实际MAC基础上末尾数字有所变动,不同厂家实现方式不一样,本申请基于BSSID以及RSS构建无线信号接入信息对应的无线信号接入特征,具体形式如:Bssid1:rssi1;Bssid2:rssi2;Bssid3:rssi3;...BssidN:rssin,在预测时,将无线信号接入特征输入至BERT模型,输出目标设备到达预设候选区域集合中每个候选区域对应的无线信号定位概率。
其中,该BERT模型可以是预先训练的,具体的,请参阅图1e,与常规的BERT模型的输入不同,在本申请中,该BERT模型并不做上下文的预测,因此,将遮盖文本串B设置为全0序列,遮盖文本串A则为mac地址序列及其强度值,具体形式请参阅前面实施例,其中,每组遮盖文本串A均标注有用户所在区域,该区域包含区域内到店及区域内未到店,将遮盖文本串A和遮盖文本串B输入至BERT模型后,取输出序列的第一位C作为分类层的输入,从而预测候选区域集合中每个候选区域对应的无线信号定位概率。
综上,则得到经纬度定位概率和无线信号定位概率,保留经纬度定位概率大于0.5的候选区域或保留无线信号定位概率大于0.5的候选区域,需要说明的是,当候选区域的经纬度定位概率和无线信号定位概率均大于0.5时,则取概率值大的作为其第一概率,如经纬度定位概率未0.6,无线信号定位概率为0.7,那么,候选区域的第一概率则为0.7,随后执行步骤103。
103、根据第一概率在多个候选区域中选择目标区域。
其中,目标区域包含至少一个目标子区域,在得到第一概率后,将经纬度定位概率大于第一预设值的候选区域确定为目标区域,或者;将无线信号定位概率大于第一预设值的候选区域确定为目标区域。当然,也可以将经纬度定位概率大于第一预设值且无线信号定位概率大于第一预设值的候选区域确定为目标区域,具体根据实际情况进行选择。
104、调用目标区域的无线信号连接信息。
其中,无线信号连接信息携带有在历史时段内连接无线资源所产生的数据,比如,无线信号连接信息携带有店铺A在过去一个月内,连接其无线资源的用户数量,以及每个连接无线资源的用户的无线信号接入强度。
105、基于无线信号接入信息以及无线信号连接信息,计算目标设备到达每个目标子区域对应的第二概率。
例如,具体的,可以将无线信号接入信息以及无线信号连接信息输入至序列神经网络匹配模型,以计算目标设备到达每个目标子区域对应的第二概率,其中,该序列神经网络匹配模型也可以为BERT模型,与序列神经网络分类模型不同的是,在该序列神经网络匹配模型中,遮盖文本串A为用户收到的MAC地址序列,遮盖文本串B为目标子区域(即店铺)历史访客的MAC地址以及连接无线资源时的信号接入强度值所构成的聚合序列,如店铺历史访客的MAC地址为08:00:20:0A:8C:6D,其连接无线资源时的信号接入强度值为-100db,那么其对应的聚合序列则为0800200A8C6D100。
为了减小计算量,可以取访问次数(即连接频次)最高的前10个访客的MAC地址以及连接无线资源时的信号接入强度值,然后,将用户收到的MAC地址序列与聚合序列进行拼接,再将拼接后序列至序列神经网络匹配模型中,输出目标设备到达每个目标子区域对应的第二概率,即,可选的,在一些实施例中,步骤“基于无线信号接入信息以及无线信号连接信息,计算目标设备到达每个目标子区域对应的第二概率”,具体可以包括:
(51)获取预设序列神经网络匹配模型;
(52)从无线信号接入信息提取目标设备的物理地址,并构建物理地址对应的物理地址序列;
(53)从无线信号连接信息中获取每个无线资源的连接频次以及无线信号强度值;
(54)基于无线资源的连接频次以及无线信号强度值,构建无线信号连接信息对应的无线信号连接序列;
(55)拼接物理地址序列和无线信号连接序列,得到拼接后序列;
(56)将拼接后序列输入至序列神经网络匹配模型中,输出目标设备到达每个目标子区域对应的第二概率。
进一步的,在得到第二概率后,可以将第二概率大于第二预设值的目标子区域确定为候选子区域,并保留候选子区域,随后执行步骤105,需要说明的是,第一预设值和第二预设值可以相等,也可以不相等,具体根据实际情况进行设置。
106、根据第一概率和第二概率,获取目标设备的位置。
具体的,将根据贝叶斯法则计算第二概率的后验概率与第一概率之间的乘积,然后,将最大的联合概率对应的目标子区域确定为目标设备的位置,需要说明的是,贝叶斯法则又被称为贝叶斯定理、贝叶斯法则是概率统计中的应用所观察到的现象对有关概率分布的主观判断(即先验概率)进行修正的标准方法。所谓贝叶斯法则,是指当分析样本大到接近总体数时,样本中事件发生的概率将接近于总体中事件发生的概率,通常,事件A在事件B(发生)的条件下的概率,与事件B在事件A的条件下的概率是不一样的;然而,这两者是有确定的关系,贝叶斯法则就是这种关系的陈述,比如P(A|B)和P(B|A)。按照乘法法则,可以立刻导出:P(A∩B)=P(A)*P(B|A)=P(B)*P(A|B),P(A|B)是已知B发生后A的条件概率,也由于得自B的取值而被称作A的后验概率,可知,第二概率的后验概率则为目标设备在候选区域的情况下属于目标子区域的概率,即,P=P(第一概率,第二概率)=P(第一概率)x P(第二概率|第一概率),可选的,在一些实施例中,可以根据第一概率和候选子区域对应的第二概率,获取目标设备的位置。
本申请实施例在采集目标设备的经纬度信息以及无线信号接入信息后,根据经纬度信息以及无线信号接入信息,计算目标设备位于预设候选区域集合中每个候选区域对应的第一概率,然后,根据第一概率在多个候选区域中选择目标区域,接着,调用目标区域的无线信号连接信息,再然后,基于无线信号接入信息以及无线信号连接信息,计算目标设备到达每个目标子区域对应的第二概率,最后,根据第一概率和第二概率,获取目标设备的位置。本申请提供的数据处理方案,利用目标设备的经纬度信息以及无线信号接入信息召回目标区域,并利用无线信号接入信息以及无线信号连接信息,计算目标设备到达每个目标子区域的概率,即,本方案利用无线信号接入信息和经纬度信息进行候选区域的召回,然后,再根据无线信号接入信息以及无线信号连接信息,在候选区域中获取目标设备的位置,可以避免出现在室内经纬度存在较大的误差而导致定位精度不准确的问题,并且,当遇到候选区域的范围很大时,无需进行多次重复计算,由此,在减小定位时的计算量的同时,提高了定位的准确性。
根据实施例所述的方法,以下将举例进一步详细说明。
在本实施例中将以该数据处理装置具体集成在服务器中为例进行说明。
请参阅图2,一种数据处理方法,具体流程可以如下:
201、服务器采集目标设备的经纬度信息以及无线信号接入信息。
服务器从数据库中获取目标设备上报的经纬度信息以及无线信号接入信息。
202、服务器根据经纬度信息以及无线信号接入信息,计算目标设备位于预设候选区域集合中每个候选区域对应的第一概率。
其中,预设候选区域集合包括至少一个候选区域,该候选区域可以是预先设置的,如商场中的某个商圈或者是商场中的某一层,进一步的,服务器可以利用预设的决策树模型对经纬度信息进行处理,以及利用预设的神经网络模型对无线信号接入信息进行处理,以估目标设备位于预设候选区域集合中每个候选区域对应的第一概率。
203、服务器根据第一概率在多个候选区域中选择目标区域。
其中,目标区域包含至少一个目标子区域,在得到第一概率后,将经纬度定位概率大于第一预设值的候选区域确定为目标区域,或者;将无线信号定位概率大于第一预设值的候选区域确定为目标区域。当然,也可以将经纬度定位概率大于第一预设值且无线信号定位概率大于第一预设值的候选区域确定为目标区域,具体根据实际情况进行选择。
204、服务器调用目标区域的无线信号连接信息。
其中,无线信号连接信息携带有在历史时段内连接无线资源所产生的数据,比如,无线信号连接信息携带有店铺A在过去一个月内,连接其无线资源的用户数量,以及每个连接无线资源的用户的无线信号接入强度。
205、服务器基于无线信号接入信息以及无线信号连接信息,计算目标设备到达每个目标子区域对应的第二概率。
例如,具体的,服务器可以将无线信号接入信息以及无线信号连接信息输入至序列神经网络匹配模型,以计算目标设备到达每个目标子区域对应的第二概率,其中,该序列神经网络匹配模型也可以为BERT模型,与序列神经网络分类模型不同的是,在该序列神经网络匹配模型中,遮盖文本串A为用户收到的MAC地址序列,遮盖文本串B为目标子区域(即店铺)历史访客的MAC地址以及连接无线资源时的信号接入强度值所构成的聚合序列。
206、服务器根据第一概率和第二概率,获取目标设备的位置。
具体的,服务器可以根据贝叶斯法则计算第二概率的后验概率与第一概率之间的乘积,然后,将最大的联合概率对应的目标子区域确定为目标设备的位置。
为了便于进一步理解本申请的数据处理方法,以下以用户到访商场S为例进行具体说明,商场S包括商圈A、商圈B以及商圈C,商圈A包括至少一个店铺,商圈B包括至少一个店铺,商圈C包括至少一个店铺,当用户到访商场S时,服务器可以获取用户的手机(即目标设备)的经纬度信息以及无线信号接入信息,服务器根据经纬度信息以及无线信号接入信息,计算手机位于商场S中每个商圈对应的第一概率,然后,服务器根据第一概率在商圈A、商圈B以及商圈C中选择目标商圈,比如,服务器根据经纬度信息以及无线信号接入信息,计算手机位于商圈A的概率为0.8、位于商圈B的概率为0.6以及位于商圈A的概率为0.5,服务器可以将商圈A确定为目标商圈,然后,服务器调用商圈A的无线信号连接信息,该无线信号连接信息携带有在历史时段内连接无线资源所产生的数据,接着,服务器基于无线信号接入信息以及无线信号连接信息,计算手机到达商圈A中每个店铺对应的第二概率,最后,服务器根据第一概率和第二概率,获取手机的位置,比如,服务器可以采用下式计算用户到访店铺的概率,即,手机位于店铺的概率P=P(第一概率)x P(第二概率|第一概率),根据如上计算得到的到访概率进行排序,保留概率P大于0.5对应的店铺,并在保留的店铺中选择概率最高的店铺确定为用户将要到访的店铺,若手机位于店铺的概率P均小于0.5.则输出未到访。
本申请实施例的服务器在采集目标设备的经纬度信息以及无线信号接入信息后,服务器根据经纬度信息以及无线信号接入信息,计算目标设备位于预设候选区域集合中每个候选区域对应的第一概率,然后,服务器根据第一概率在多个候选区域中选择目标区域,接着,服务器调用目标区域的无线信号连接信息,再然后,服务器基于无线信号接入信息以及无线信号连接信息,计算目标设备到达每个目标子区域对应的第二概率,最后,服务器根据第一概率和第二概率,获取目标设备的位置。本申请提供的数据处理方案,利用目标设备的经纬度信息以及无线信号接入信息召回目标区域,并利用无线信号接入信息以及无线信号连接信息,计算目标设备到达每个目标子区域的概率,即,本方案利用无线信号接入信息和经纬度信息进行候选区域的召回,然后,再根据无线信号接入信息以及无线信号连接信息,在候选区域中获取目标设备的位置,可以避免出现在室内经纬度存在较大的误差而导致定位精度不准确的问题,并且,当遇到候选区域的范围很大时,无需进行多次重复计算,由此,在减小定位时的计算量的同时,提高了定位的准确性。
为便于更好的实施本申请实施例的数据处理方法,本申请实施例还提供一种基于上述数据处理装置(简称处理装置)。其中名词的含义与上述数据处理方法中相同,具体实现细节可以参考方法实施例中的说明。
请参阅图3a,图3a为本申请实施例提供的数据处理装置的结构示意图,其中该互动装置可以包括采集模块301、第一计算模块302、选择模块303、调用模块304、第二计算模块305以及获取模块306,具体可以如下:
采集模块301,用于采集目标设备的经纬度信息以及无线信号接入信息。
采集模块301从数据库中获取目标设备上报的经纬度信息以及无线信号接入信息。
第一计算模块302,用于根据经纬度信息以及无线信号接入信息,计算目标设备位于预设候选区域集合中每个候选区域对应的第一概率。
其中,预设候选区域集合包括至少一个候选区域,第一计算模块302可以利用预设的决策树模型对经纬度信息进行处理,以及利用预设的神经网络模型对无线信号接入信息进行处理,以估目标设备位于预设候选区域集合中每个候选区域对应的第一概率。
可选的,在一些实施例中,第一计算模块302具体可以包括:
第一获取单元,用于获取预设决策树模型以及序列神经网络分类模型;
第一计算单元,用于根据所述决策树模型以及经纬度信息,计算目标设备到达预设候选区域集合中每个候选区域对应的经纬度定位概率;
第二计算单元,用于基于序列神经网络分类模型以及无线信号接入信息,计算目标设备到达预设候选区域集合中每个候选区域对应的无线信号定位概率;
融合单元,用于融合经纬度定位概率和无线信号定位概率,得到目标设备位于预设候选区域集合中每个候选区域对应的第一概率。
可选的,在一些实施例中,第一计算单元具体可以包括:
输出子单元,用于将经纬度信息输入至决策树模型中的每一棵树,输出每一棵树对应的分数值;
求和单元,用于对多个分数值进行求和,得到目标设备到达预设候选区域集合中每个候选区域对应的经纬度定位概率。
可选的,在一些实施例中,输出子单元具体可以用于:通过决策树模型提取经纬度信息的特征向量;将所述特征向量输入至决策树模型中的每一棵树中,得到每一棵树对应的叶子节点,其中,每个叶子节点对应一个约束条件;检测叶子节点是否符合对应的约束条件;基于叶子节点是否符合对应的约束条件,输出每一棵树对应的分数值。
可选的,在一些实施例中,第二计算单元具体可以用于:从无线信号接入信息提取目标设备的物理地址以及无线信号接入强度值;基于目标设备的物理地址以及无线信号接入强度值,构建无线信号接入信息对应的无线信号接入特征;通过序列神经网络分类模型以及无线信号接入特征,计算目标设备到达预设候选区域集合中每个候选区域对应的无线信号定位概率。
选择模块303,用于根据第一概率在多个候选区域中选择目标区域。
其中,目标区域包含至少一个目标子区域,在得到第一概率后,选择模块303将经纬度定位概率大于第一预设值的候选区域确定为目标区域,或者;选择模块303将无线信号定位概率大于第一预设值的候选区域确定为目标区域。
可选的,在一些实施例中,选择模块303具体可以用于:将经纬度定位概率大于第一预设值的候选区域确定为目标区域,或者;将无线信号定位概率大于第一预设值的候选区域确定为目标区域。
调用模块304,用于调用目标区域的无线信号连接信息。
其中,无线信号连接信息携带有在历史时段内连接无线资源所产生的数据
第二计算模块305,用于基于无线信号接入信息以及无线信号连接信息,计算目标设备到达每个目标子区域对应的第二概率。
例如,具体的,第二计算模块305可以将无线信号接入信息以及无线信号连接信息输入至序列神经网络匹配模型,以计算目标设备到达每个目标子区域对应的第二概率。
可选的,在一些实施例中,第二计算模块305具体可以用于:获取预设序列神经网络匹配模型;从无线信号接入信息提取目标设备的物理地址,并构建物理地址对应的物理地址序列;从无线信号连接信息中获取每个无线资源的连接频次以及无线信号强度值;基于无线资源的连接频次以及无线信号强度值,构建无线信号连接信息对应的无线信号连接序列;拼接物理地址序列和无线信号连接序列,得到拼接后序列;将拼接后序列输入至所述序列神经网络匹配模型中,输出目标设备到达每个目标子区域对应的第二概率。
获取模块306,用于根据第一概率和第二概率,获取目标设备的位置。
可选的,在一些实施例中,获取模块306具体可以用于:基于贝叶斯法则计算第二概率的后验概率;计算后验概率与所述第一概率之间的乘积,得到联合概率;将最大的所述联合概率对应的目标子区域确定为目标设备的位置。
可选的,在一些实施例中,请参阅图3b,定位装置具体还可以包括保留模块307,保留模块307具体可以用于:将第二概率大于第二预设值的目标子区域确定为候选子区域,并保留所述候选子区域;
获取模块306具体还可以用于:根据第一概率和所述候选子区域对应的第二概率,获取目标设备的位置。
本申请实施例的采集模块301在采集目标设备的经纬度信息以及无线信号接入信息后,第一计算模块302根据经纬度信息以及无线信号接入信息,计算目标设备位于预设候选区域集合中每个候选区域对应的第一概率,然后,选择模块303根据第一概率在多个候选区域中选择目标区域,接着,调用模块304调用目标区域的无线信号连接信息,再然后,第二计算模块305基于无线信号接入信息以及无线信号连接信息,计算目标设备到达每个目标子区域对应的第二概率,最后,获取模块306根据第一概率和第二概率,获取目标设备的位置。本申请提供的数据处理方案,利用目标设备的经纬度信息以及无线信号接入信息召回目标区域,并利用无线信号接入信息以及无线信号连接信息,计算目标设备到达每个目标子区域的概率,即,本方案利用无线信号接入信息和经纬度信息进行候选区域的召回,然后,再根据无线信号接入信息以及无线信号连接信息,在候选区域中获取目标设备的位置,可以避免出现在室内经纬度存在较大的误差而导致定位精度不准确的问题,并且,当遇到候选区域的范围很大时,无需进行多次重复计算,由此,在减小定位时的计算量的同时,提高了定位的准确性。
此外,本申请实施例还提供一种电子设备,如图4所示,其示出了本申请实施例所涉及的电子设备的结构示意图,具体来讲:
该电子设备可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读存储介质的存储器402、电源403和输入单元404等部件。本领域技术人员可以理解,图4中示出的电子设备结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器401是该电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器402内的软件程序和/或模块,以及调用存储在存储器402内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。可选的,处理器401可包括一个或多个处理核心;优选的,处理器401可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器401中。
存储器402可用于存储软件程序以及模块,处理器401通过运行存储在存储器402的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器402还可以包括存储器控制器,以提供处理器401对存储器402的访问。
电子设备还包括给各个部件供电的电源403,优选的,电源403可以通过电源管理系统与处理器401逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
该电子设备还可包括输入单元404,该输入单元404可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
尽管未示出,电子设备还可以包括显示单元等,在此不再赘述。具体在本实施例中,电子设备中的处理器401会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中,并由处理器401来运行存储在存储器402中的应用程序,从而实现各种功能,如下:
采集目标设备的经纬度信息以及无线信号接入信息,根据经纬度信息以及无线信号接入信息,计算目标设备位于预设候选区域集合中每个候选区域对应的第一概率,根据第一概率在多个候选区域中选择目标区域,调用目标区域的无线信号连接信息,基于无线信号接入信息以及无线信号连接信息,计算目标设备到达每个目标子区域对应的第二概率,根据第一概率和第二概率,获取目标设备的位置。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
本申请实施例在采集目标设备的经纬度信息以及无线信号接入信息后,根据经纬度信息以及无线信号接入信息,计算目标设备位于预设候选区域集合中每个候选区域对应的第一概率,然后,根据第一概率在多个候选区域中选择目标区域,接着,调用目标区域的无线信号连接信息,再然后,基于无线信号接入信息以及无线信号连接信息,计算目标设备到达每个目标子区域对应的第二概率,最后,根据第一概率和第二概率,获取目标设备的位置。本申请提供的数据处理方案,利用目标设备的经纬度信息以及无线信号接入信息召回目标区域,并利用无线信号接入信息以及无线信号连接信息,计算目标设备到达每个目标子区域的概率,即,本方案主要依赖于无线信号,可以避免出现在室内经纬度存在较大的误差而导致定位精度不准确的问题,并且,当遇到候选区域的范围很大时,无需进行多次重复计算,由此,在减小定位时的计算量的同时,提高了定位的准确性。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请实施例提供一种存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本申请实施例所提供的任一种数据处理方法中的步骤。例如,该指令可以执行如下步骤:
采集目标设备的经纬度信息以及无线信号接入信息,根据经纬度信息以及无线信号接入信息,计算目标设备位于预设候选区域集合中每个候选区域对应的第一概率,根据第一概率在多个候选区域中选择目标区域,调用目标区域的无线信号连接信息,基于无线信号接入信息以及无线信号连接信息,计算目标设备到达每个目标子区域对应的第二概率,根据第一概率和第二概率,获取目标设备的位置。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的指令,可以执行本申请实施例所提供的任一种数据处理方法中的步骤,因此,可以实现本申请实施例所提供的任一种数据处理方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本申请实施例所提供的一种数据处理方法、装置、电子设备以及存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (15)
1.一种数据处理方法,其特征在于,包括:
采集目标设备的经纬度信息以及无线信号接入信息;
根据所述经纬度信息以及无线信号接入信息,计算所述目标设备位于预设候选区域集合中每个候选区域对应的第一概率;
根据所述第一概率在多个候选区域中选择目标区域,所述目标区域包含至少一个目标子区域;
调用所述目标区域的无线信号连接信息,所述无线信号连接信息携带有在历史时段内连接无线资源所产生的数据;
基于所述无线信号接入信息以及无线信号连接信息,计算所述目标设备到达每个目标子区域对应的第二概率;
根据所述第一概率和第二概率,获取所述目标设备的位置。
2.根据权利要求1所述的方法,其特征在于,所述根据所述经纬度信息以及无线信号接入信息,计算所述目标设备位于预设候选区域集合中每个候选区域对应的第一概率,包括:
获取预设决策树模型以及序列神经网络分类模型;
根据所述决策树模型以及经纬度信息,计算所述目标设备到达预设候选区域集合中每个候选区域对应的经纬度定位概率;
基于所述序列神经网络分类模型以及无线信号接入信息,计算所述目标设备到达预设候选区域集合中每个候选区域对应的无线信号定位概率;
融合所述经纬度定位概率和无线信号定位概率,得到所述目标设备位于预设候选区域集合中每个候选区域对应的第一概率。
3.根据权利要求2所述的方法,其特征在于,所述根据所述决策树模型以及经纬度信息,计算所述目标设备到达预设候选区域集合中每个候选区域对应的经纬度定位概率,包括:
将所述经纬度信息输入至决策树模型中的每一棵树,输出每一棵树对应的分数值;
对多个分数值进行求和,得到所述目标设备到达预设候选区域集合中每个候选区域对应的经纬度定位概率。
4.根据权利要求3所述的方法,其特征在于,所述将所述经纬度信息输入至决策树模型中的每一棵树,输出每一棵树对应的分数值,包括:
通过所述决策树模型提取所述经纬度信息的特征向量;
将所述特征向量输入至决策树模型中的每一棵树中,得到所述每一棵树对应的叶子节点,其中,每个所述叶子节点对应一个约束条件;
检测所述叶子节点是否符合对应的约束条件;
基于叶子节点是否符合对应的约束条件,输出每一棵树对应的分数值。
5.根据权利要求2所述的方法,其特征在于,所述基于所述序列神经网络分类模型以及无线信号接入信息,计算所述目标设备到达预设候选区域集合中每个候选区域对应的无线信号定位概率,包括:
从所述无线信号接入信息提取所述目标设备的物理地址以及无线信号接入强度值;
基于所述目标设备的物理地址以及无线信号接入强度值,构建所述无线信号接入信息对应的无线信号接入特征;
通过所述序列神经网络分类模型以及无线信号接入特征,计算所述目标设备到达预设候选区域集合中每个候选区域对应的无线信号定位概率。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述根据所述第一概率在多个候选区域中选择目标区域,包括:
将所述经纬度定位概率大于第一预设值的候选区域确定为目标区域,或者;
将所述无线信号定位概率大于第一预设值的候选区域确定为目标区域。
7.根据权利要求1至6任一项所述的方法,其特征在于,所述基于所述无线信号接入信息以及无线信号连接信息,计算所述目标设备到达每个目标子区域对应的第二概率,包括:
获取预设序列神经网络匹配模型;
从所述无线信号接入信息提取所述目标设备的物理地址,并构建所述物理地址对应的物理地址序列;
从所述无线信号连接信息中获取每个无线资源的连接频次以及无线信号强度值;
基于所述无线资源的连接频次以及无线信号强度值,构建所述无线信号连接信息对应的无线信号连接序列;
拼接所述物理地址序列和无线信号连接序列,得到拼接后序列;
将所述拼接后序列输入至所述序列神经网络匹配模型中,输出所述目标设备到达每个目标子区域对应的第二概率。
8.根据权利要求7所述的方法,其特征在于,输出所述目标设备到达每个目标子区域对应的第二概率之后,还包括:
将第二概率大于第二预设值的目标子区域确定为候选子区域;
所述根据所述第一概率和第二概率,获取所述目标设备的位置,包括:根据所述第一概率和所述候选子区域对应的第二概率,获取所述目标设备的位置。
9.根据权利要求1至6任一项所述的方法,其特征在于,所述根据所述第一概率和第二概率,获取所述目标设备的位置,包括:
基于贝叶斯法则计算第二概率的后验概率;
计算所述后验概率与所述第一概率之间的乘积,得到联合概率;
将最大的所述联合概率对应的目标子区域确定为所述目标设备的位置。
10.一种数据处理装置,其特征在于,包括:
采集模块,用于采集目标设备的经纬度信息以及无线信号接入信息;
第一计算模块,用于根据所述经纬度信息以及无线信号接入信息,计算所述目标设备位于预设候选区域集合中每个候选区域对应的第一概率;
选择模块,用于根据所述第一概率在多个候选区域中选择目标区域,所述目标区域包含至少一个目标子区域;
调用模块,用于调用所述目标区域的无线信号连接信息,所述无线信号连接信息携带有在历史时段内连接无线资源所产生的数据;
第二计算模块,用于基于所述无线信号接入信息以及无线信号连接信息,计算所述目标设备到达每个目标子区域对应的第二概率;
获取模块,用于根据所述第一概率和第二概率,获取所述目标设备的位置。
11.根据权利要求10所述的装置,其特征在于,所述第一计算模块包括:
获取单元,用于获取预设决策树模型以及序列神经网络分类模型;
第一计算单元,用于根据所述决策树模型以及经纬度信息,计算所述目标设备到达预设候选区域集合中每个候选区域对应的经纬度定位概率;
第二计算单元,用于基于所述序列神经网络分类模型以及无线信号接入信息,计算所述目标设备到达预设候选区域集合中每个候选区域对应的无线信号定位概率;
融合单元,用于融合所述经纬度定位概率和无线信号定位概率,得到所述目标设备位于预设候选区域集合中每个候选区域对应的第一概率。
12.根据权利要求11所述的装置,其特征在于,所述第一计算单元包括:
输出子单元,用于将所述经纬度信息输入至决策树模型中的每一棵树,输出每一棵树对应的分数值;
求和单元,用于对多个分数值进行求和,得到所述目标设备到达预设候选区域集合中每个候选区域对应的经纬度定位概率。
13.根据权利要求12所述的装置,其特征在于,所述输出子单元具体用于:
通过所述决策树模型提取所述经纬度信息的特征向量;
将所述特征向量输入至决策树模型中的每一棵树中,得到所述每一棵树对应的叶子节点,其中,每个所述叶子节点对应一个约束条件;
检测所述叶子节点是否符合对应的约束条件;
基于叶子节点是否符合对应的约束条件,输出每一棵树对应的分数值。
14.一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现如权利要求1-9任一项所述数据处理方法的步骤。
15.一种存储介质,其特征在于,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1-9任一项所述数据处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110523352.5A CN113766633A (zh) | 2021-05-13 | 2021-05-13 | 数据处理方法、装置、电子设备以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110523352.5A CN113766633A (zh) | 2021-05-13 | 2021-05-13 | 数据处理方法、装置、电子设备以及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113766633A true CN113766633A (zh) | 2021-12-07 |
Family
ID=78787084
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110523352.5A Pending CN113766633A (zh) | 2021-05-13 | 2021-05-13 | 数据处理方法、装置、电子设备以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113766633A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114973594A (zh) * | 2022-07-28 | 2022-08-30 | 深圳宝路西智能科技有限公司 | 智能手表的信息交互方法、装置、电子设备及存储介质 |
CN115378753A (zh) * | 2022-08-19 | 2022-11-22 | 中国联合网络通信集团有限公司 | 楼宇归属虚拟接入间识别方法、装置、设备和存储介质 |
-
2021
- 2021-05-13 CN CN202110523352.5A patent/CN113766633A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114973594A (zh) * | 2022-07-28 | 2022-08-30 | 深圳宝路西智能科技有限公司 | 智能手表的信息交互方法、装置、电子设备及存储介质 |
CN114973594B (zh) * | 2022-07-28 | 2022-11-01 | 深圳宝路西智能科技有限公司 | 智能手表的信息交互方法、装置、电子设备及存储介质 |
CN115378753A (zh) * | 2022-08-19 | 2022-11-22 | 中国联合网络通信集团有限公司 | 楼宇归属虚拟接入间识别方法、装置、设备和存储介质 |
CN115378753B (zh) * | 2022-08-19 | 2023-11-28 | 中国联合网络通信集团有限公司 | 楼宇归属虚拟接入间识别方法、装置、设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110288979B (zh) | 一种语音识别方法及装置 | |
CN111897941B (zh) | 对话生成方法、网络训练方法、装置、存储介质及设备 | |
CN111382868A (zh) | 神经网络结构搜索方法和神经网络结构搜索装置 | |
US11249645B2 (en) | Application management method, storage medium, and electronic apparatus | |
CN106767835B (zh) | 定位方法和装置 | |
EP4350572A1 (en) | Method, apparatus and system for generating neural network model, devices, medium and program product | |
CN116664719B (zh) | 一种图像重绘模型训练方法、图像重绘方法及装置 | |
CN111523640A (zh) | 神经网络模型的训练方法和装置 | |
US20220309088A1 (en) | Method and apparatus for training dialog model, computer device, and storage medium | |
CN112329826A (zh) | 图像识别模型的训练方法、图像识别方法和装置 | |
CN113766633A (zh) | 数据处理方法、装置、电子设备以及存储介质 | |
CN110516113B (zh) | 一种视频分类的方法、视频分类模型训练的方法及装置 | |
US20230035366A1 (en) | Image classification model training method and apparatus, computer device, and storage medium | |
CN112214677B (zh) | 一种兴趣点推荐方法、装置、电子设备及存储介质 | |
CN113204577A (zh) | 信息推送方法、装置、电子设备和计算机可读介质 | |
CN114330510A (zh) | 模型训练方法、装置、电子设备和存储介质 | |
CN113822460A (zh) | 一种交通流量预测方法、装置、电子设备和存储介质 | |
CN111432347A (zh) | 信息处理方法、装置、存储介质及电子设备 | |
CN117726884B (zh) | 对象类别识别模型的训练方法、对象类别识别方法及装置 | |
CN113158030B (zh) | 异地兴趣点的推荐方法、装置、电子设备及存储介质 | |
CN114445692B (zh) | 图像识别模型构建方法、装置、计算机设备及存储介质 | |
CN115983372A (zh) | 一种神经网络训练方法、装置、计算设备及存储介质 | |
CN111667028B (zh) | 一种可靠负样本确定方法和相关装置 | |
CN114639072A (zh) | 人流量信息生成方法、装置、电子设备和计算机可读介质 | |
CN114329236A (zh) | 一种数据处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |