CN112232444A - 对象的地理位置数据确定方法、装置、设备及存储介质 - Google Patents
对象的地理位置数据确定方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN112232444A CN112232444A CN202011321715.9A CN202011321715A CN112232444A CN 112232444 A CN112232444 A CN 112232444A CN 202011321715 A CN202011321715 A CN 202011321715A CN 112232444 A CN112232444 A CN 112232444A
- Authority
- CN
- China
- Prior art keywords
- position data
- confidence
- data
- bayesian network
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 63
- 238000003860 storage Methods 0.000 title claims abstract description 16
- 238000012549 training Methods 0.000 claims description 91
- 238000004590 computer program Methods 0.000 claims description 14
- 230000006870 function Effects 0.000 claims description 11
- 238000010586 diagram Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- DDVBPZROPPMBLW-IZGXTMSKSA-N latrunculin A Chemical compound C([C@H]1[C@@]2(O)C[C@H]3C[C@H](O2)CC[C@@H](\C=C/C=C/CC\C(C)=C/C(=O)O3)C)SC(=O)N1 DDVBPZROPPMBLW-IZGXTMSKSA-N 0.000 description 3
- NSHPHXHGRHSMIK-IWQSFCKSSA-N latrunculin B Natural products C[C@H]1CC[C@@H]2C[C@@H](C[C@@](O)(O2)[C@@H]3CSC(=O)N3)OC(=O)C=C(C)/CCC=C/1 NSHPHXHGRHSMIK-IWQSFCKSSA-N 0.000 description 3
- DDVBPZROPPMBLW-UHFFFAOYSA-N latrunculin-A Natural products O1C(=O)C=C(C)CCC=CC=CC(C)CCC(O2)CC1CC2(O)C1CSC(=O)N1 DDVBPZROPPMBLW-UHFFFAOYSA-N 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000001364 causal effect Effects 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 239000010751 BS 2869 Class A2 Substances 0.000 description 1
- 125000002015 acyclic group Chemical group 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004138 cluster model Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/29—Graphical models, e.g. Bayesian networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Abstract
本发明实施例提供了一种对象的地理位置数据确定方法、装置、设备及存储介质,方法包括:从预设的地理位置数据池中,获取目标对象的多个地理位置数据,其中,每个所述地理位置数据的数据来源不同;将每个所述地理位置数据分别输入到预先训练的贝叶斯网络模型中,得到置信度;根据每个所述置信度,在多个所述地理位置数据中确定所述目标对象的真实地理位置数据。根据本发明实施例的方法,能够准确识别地理位置数据的准确性,提高企业数据库中地理位置信息的可信度。
Description
技术领域
本发明属于数据处理技术领域,尤其涉及一种对象的地理位置数据确定方法、装置、设备及存储介质。
背景技术
伴随着大数据时代的悄然来临,数据的价值得到了人们的广泛认同。数据已经作为企业的重要资产,被广泛应用于客户关系管理、合规性监管、运营风险管理等业务当中。然而并非所有数据都可能成为资产。如果没有将数据加以有效管理,数据可信度较低,即使数据再多,对于企业来说也只是无用信息,而且储存这些数据还需要付出人工和金钱,使数据成为企业的负担。
目前,企业数据库中保存的一些对象的位置信息或者从外部获取的位置信息准确性未知,而且又很难识别其中准确的位置信息。
发明内容
本发明实施例提供一种对象的地理位置数据确定方法、装置、设备及存储介质,能够准确识别地理位置数据的准确性,提高企业数据库中地理位置信息的可信度。
第一方面,本发明实施例提供一种对象的地理位置数据确定方法,方法包括:从预设的地理位置数据池中,获取目标对象的多个地理位置数据,其中,每个地理位置数据的数据来源不同;将每个地理位置数据分别输入到预先训练的贝叶斯网络模型中,得到置信度;根据每个置信度,在多个地理位置数据中确定目标对象的真实地理位置数据。
在一种可选的实施方式中,将每个地理位置数据分别输入到预先训练的贝叶斯网络模型中,得到置信度之前,该方法还包括:
获取训练样本集,训练样本集包括多个训练样本,每个训练样本包括一个对象的地理位置数据及其为对象真实地理位置数据的置信度标签;
利用训练样本训练预设贝叶斯网络模型,直至满足训练停止条件,得到训练后的贝叶斯网络模型。
在一种可选的实施方式中,利用训练样本训练预设贝叶斯网络模型,直至满足训练停止条件,得到目标贝叶斯网络模型,具体包括:
对每个训练样本,分别执行以下步骤:
将地理位置数据输入至预设的贝叶斯网络模型中,得到地理位置数据为对象真实地理位置数据的预测置信度;
根据预测置信度和置信度标签,确定贝叶斯网络模型的损失函数值;
在损失函数值不满足训练停止条件的情况下,调整贝叶斯网络模型的模型参数,并利用训练样本集训练参数调整后的贝叶斯网络模型,直至满足训练停止条件,得到训练后的贝叶斯网络模型。
在一种可选的实施方式中,获取训练样本集,包括:
获取多个对象中的每个对象的多个地理位置数据,同一个对象的多个地理位置数据对应多个来源;
针对同一个对象,分别计算目标来源的地理位置数据与每个其他来源的地理位置数据之间的距离;其他来源的地理位置数据为多个来源中除目标来源以外的来源;
将距离小于预设距离阈值的其他来源对应的地理位置数据的置信度标签确定为第一置信度,不小于的确定为第二置信度;
将同一个对象的地理位置数据及其对应的置信度标签作为一个训练样本,以得到训练样本集。
在一种可选的实施方式中,根据每个置信度,在多个地理位置数据中确定目标对象的真实地理位置数据,具体包括:
将置信度的数值大于预设阈值,且数值最高的地理位置数据确定为目标对象的真实地理位置数据。
第三方面,本发明实施例提供了一种对象的地理位置数据确定装置,装置包括:
第一获取模块,被配置为从预设的地理位置数据池中,获取目标对象的多个地理位置数据,其中,每个地理位置数据的数据来源不同;
置信度预测模块,被配置为将每个地理位置数据分别输入到预先训练的贝叶斯网络模型中,得到置信度;
第一判断模块,被配置为根据每个置信度,在多个地理位置数据中确定目标对象的真实地理位置数据。
第五方面,本发明实施例提供了一种对象的地理位置数据确定设备,设备包括:处理器,以及存储有计算机程序指令的存储器;处理器读取并执行计算机程序指令,以实现第一方面任一可选实施方式提供的对象的地理位置数据确定方法。
第八方面,本发明实施例提供了一种计算机存储介质,计算机存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现第一方面任一可选实施方式提供的对象的地理位置数据确定方法。
本发明实施例的对象的地理位置数据确定方法、装置、设备及计算机存储介质,能够通过预先训练的贝叶斯网络模型,确定目标对象的来源不同的多个地理位置数据的置信度,根据每个置信度,确定目标对象的真实地理位置数据;系统通过贝叶斯网络模型确定每个地理位置数据的置信度,效率高速度快;利用贝叶斯网络的不定性因果关联、不确定性问题处理能力、多源信息表达融合能力,使置信度的预测结果准确性更好,从而使确定的地理位置数据更准确。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种对象的地理位置数据确定方法的流程示意图;
图2是本发明实施例提供的一种集团地理位置数据确定方法流程示意图;
图3是本发明实施例提供的一种集团位置信息置信度匹配贝叶斯网络节点示意图;
图4是本发明实施例提供的一种集团位置信息置信度匹配贝叶斯网络示意图;
图5是本发明实施例提供的导入样本训练集后贝叶斯网络训练结果示意图;
图6是本发明实施例提供的一种对象的地理位置数据确定装置的结构示意图;
图7是本发明实施例提供的一种对象的地理位置数据确定设备的结构示意图。
具体实施方式
下面将详细描述本发明的各个方面的特征和示例性实施例,为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本发明进行进一步详细描述。应理解,此处所描述的具体实施例仅意在解释本发明,而不是限定本发明。对于本领域技术人员来说,本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
目前,企业数据库中保存的一些对象的位置信息其来源复杂,很多都是基于网络爬虫的方法获取的位置信息,即根据对象的名称或其他关键字,通过地图来爬取经纬度信息。因此,其准确性未知,而且又很难识别其中准确的位置信息。
在实际中关于对象的位置信息,特别是集团公司的位置信息,还可以根据公司员工在工作日白天发生的信令数据确定其常驻基站,通过对常驻基站聚类簇的计算,基于密度聚类模型,获取集团公司中心点位置的经纬度信息。基于密度聚类模型训练计算出来的集团位置数据质量会受到模型的输入参数的影响,同时也会存在将特殊集团识别为噪点的缺点,聚类质量难以控制保障,准确性未知。
此外,关于对象的位置信息还可以基于人工签到获取。例如,客户经理进行集团拜访或集团营销时发起的实时签到任务获取的集团位置信息。人工签到的集团位置数据比较准确,但覆盖范围小。
基于上述问题,本申请实施例提供了一种对象的地理位置数据确定方法、装置、设备及存储介质,能够提高识别对象的位置信息的准确性。
需要说明的是,本申请实施例提供的一种对象的地理位置数据确定方法中,可以预先建立地理位置数据池,将聚类模型训练、网络爬虫等多种来源获取的对象的位置数据汇聚其中。地理位置数据池中也可以包括人工签到获取的对象的地理位置数据。
下面首先对本发明实施例提供的一种对象的地理位置数据确定方法进行介绍,该方法可以通过一种对象的地理位置数据确定系统实现。
请参见图1,本申请实施例提供的一种对象的地理位置数据确定方法的流程示意图。该方法包括S101至S103。
S101.从预设的地理位置数据池中,获取目标对象的多个地理位置数据,其中,每个地理位置数据的数据来源不同。
数据池,即数据库连接池,负责分配、管理和释放数据库连接,它允许应用程序重复使用一个现有的数据库连接,而不是再重新建立一个;释放空闲时间超过最大空闲时间的数据库连接来避免因为没有释放数据库连接而引起的数据库连接遗漏。
地理位置数据池,即用于存储地理位置数据的数据池。本申请中的地理位置数据池中包括多种来源的地理位置数据,即,其中可以存在一个对象有多个地理位置数据的情况。
系统从预设的地理位置数据池中,获取目标对象的多个地理位置数据。
在一个示例中,参见图2,对象可以是集团公司,地理位置数据池可以是集团位置信息池。多种来源可以包括通过密度聚类模型得到的聚类输出经纬度、网络爬虫抓取的集团经纬度数据、任务签到获取的集团经纬度数据。集团位置信息池中包含的信息的样例数据如下表所示:
表1集团位置信息池样例数据表
S102.将每个地理位置数据分别输入到预先训练的贝叶斯网络模型中,得到置信度。
贝叶斯网络,又称为信度网,由一个有向无环图(Directed Acylic Graph,DAG)和条件概率表(ConditionalProbability Table,CPT)组成。一般情况下,构造贝叶斯网有三种不同的方式:
(1)由领域专家确定贝叶斯网的变量(有时也称为影响因子)节点,然后通过专家的知识来确定贝叶斯网络的结构,并指定它的分布参数。这种方式构造的贝叶斯网完全在专家的指导下进行,由于人类获得知识的有限性,导致构建的网络与实践中积累下的数据具有很大的偏差。
(2)由领域专家确定贝叶斯网络的节点,通过大量的训练数据,来学习贝叶斯网的结构和参数。这种方式完全是一种数据驱动的方法,具有很强的适应性,而且随着人工智能、数据挖掘和机器学习的不断发展,使得这种方法成为可能。如何从数据中学习贝叶斯网的结构和参数,已经成为贝叶斯网络研究的热点。
(3)由领域专家确定贝叶斯网络的节点,通过专家的知识来指定网络的结构,而通过机器学习的方法从数据中学习网络的参数。这种方式实际上是前两种方式的折衷,当领域中变量之间的关系较明显的情况下,这种方法能大大提高学习的效率。
基于贝叶斯网络的不定性因果关联、不确定性问题处理能力、多源信息表达融合能力,此步骤中采用预先训练的贝叶斯网络模型确定一个对象的每种来源的地理位置数据的置信度。
系统将每个地理位置数据分别输入到预先训练的贝叶斯网络模型中,得到置信度。
S103.根据每个置信度,在多个地理位置数据中确定目标对象的真实地理位置数据。
系统根据每个置信度,在多个地理位置数据中确定目标对象的真实地理位置数据。
在一个示例中,系统将置信度的数值大于预设阈值,且数值最高的地理位置数据确定为所述目标对象的真实地理位置数据。
本申请实施例提供的一种对象的地理位置数据确定方法,系统从预设的地理位置数据池中,获取目标对象的多个地理位置数据,其中,每个地理位置数据的数据来源不同;将每个地理位置数据分别输入到预先训练的贝叶斯网络模型中,得到置信度;根据每个置信度,在多个地理位置数据中确定目标对象的真实地理位置数据。该方法能够准确从一个对象的多个地理位置数据中识别出其真实地理位置信息,解决了对象的地理位置数据来源未知,难以识别真实性的问题,并且采用预先训练的贝叶斯网络模型,识别速度快、准确性高。
上述实施例提供的一种对象的地理位置数据确定方法,在步骤S102中提到了预先训练的贝叶斯网络模型,而贝叶斯网络模型的训练可以有多种实现方式。下面结合实施例和附图详细描述本申请提供的一种对象的地理位置数据确定方法中贝叶斯网络模型的训练过程。需要说明的是,以下实施例仅为本申请对所提供一种对象的地理位置数据确定方法的示例性说明和描述,基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在一个实施例中,上述步骤S102之前还可以包括贝叶斯网络模型的训练过程,具体可以包括步骤S104-S105。
S104.获取训练样本集,训练样本集包括多个训练样本,每个训练样本包括一个对象的地理位置数据及其为对象真实地理位置数据的置信度标签。
在一个示例中,步骤S104,可以具体包括:
S1041.获取多个对象中的每个对象的多个地理位置数据,同一个对象的多个地理位置数据对应多个来源。
S1042.针对同一个对象,分别计算目标来源的地理位置数据与每个其他来源的地理位置数据之间的距离;其他来源的地理位置数据为多个来源中除目标来源以外的来源。
在一个示例中,目标来源可以是任务签到获取的数据。系统针对同一个对象,分别计算目标来源的地理位置数据与每个其他来源的地理位置数据之间的距离。在该示例中,距离可以是经纬度空间距离差,其可以通过空间经纬度距离计算公式计算得到。
基于经纬度计算空间距离差公式:
C=sin(LatA*Pi/180)*sin(LatB*Pi/180)+cos(LatA*Pi/180)*cos(LatB*Pi/180)*cos((MLonA-MLonB)*Pi/180)
R=6371KM
Distance=R*Arccos(C)*Pi/180
注:A点经纬度(MLonA,LatA);B点经纬度(MLonB,LatB);R为地球平均半径;Pi为圆周率。
S1043.将距离小于预设距离阈值的其他来源对应的地理位置数据的置信度标签确定为第一置信度,不小于的确定为第二置信度。
在一个示例中,系统根据计算出来的距离差,评估信息池中集团的经纬度位置数据置信度,若距离差小于1km,则置信度为1,若距离差大于1km则置信度为0。步骤S1043判断完置信度之后的数据如下表所示:
表2地理位置数据的置信度表
集团编码 | A | A | A |
集团名称 | xx公司 | xx公司 | xx公司 |
集团规模 | 规模中等 | 规模中等 | 规模中等 |
集团类型 | 国营 | 国营 | 国营 |
集团网龄 | 8年 | 8年 | 8年 |
集团等级 | A2 | A2 | A2 |
集团V网类型 | 同事网 | 同事网 | 同事网 |
集团业务厚度 | 33 | 33 | 33 |
集团区域特征 | 本地集团 | 本地集团 | 本地集团 |
集团所属行业 | 制造业 | 制造业 | 制造业 |
集团V网成员规模 | 750 | 750 | 750 |
集团V网成员活跃度 | 77% | 77% | 77% |
位置信息来源类型 | 模型训练 | 网络爬虫 | 任务签到 |
经度 | 32.06297 | 29.2745 | 29.3124 |
纬度 | 118.7372 | 110.6345 | 111.2345 |
位置信息置信度 | 0 | 1 | 1 |
S1044.将同一个对象的地理位置数据及其对应的置信度标签作为一个训练样本,以得到训练样本集。
S105.利用训练样本训练预设贝叶斯网络模型,直至满足训练停止条件,得到训练后的贝叶斯网络模型。
在一个示例中,系统通过对已进行置信度评估的集团位置信息的学习基础之上,训练得出集团位置置信度和各节点变量之间的条件概率。从而实现针对未进行置信度评估的集团位置信息进行置信度预测。
在一个示例中,步骤S105中的贝叶斯网络模型,其可以通过如下过程构建:
首先确定包含层级、各节点内容,网络节点间的关联关系并最终绘制表示节点关联关系的有向无环图。如图3所示,集团位置置信度和集团本身密切相关,因此,在集团位置置信度匹配的贝叶斯节点选取中,构建了以集团客体属性、位置数据属性这两个个变量为准则层的贝叶斯网络节点结构。
如图4所示,通过对集团位置置信度匹配贝叶斯网络节点分析,以前后因果关系作为依据,构建贝叶斯网络结构,即有向无环的概率图。
结合贝叶斯网络DAG图,构建如下表所示指标体系:
表3集团位置信息置信度指标体系表
在一个示例中,步骤S105,可以具体包括:
S1051.对每个训练样本,分别执行以下步骤:
S1052.将地理位置数据输入至预设的贝叶斯网络模型中,得到地理位置数据为对象真实地理位置数据的预测置信度;
S1053.根据预测置信度和置信度标签,确定贝叶斯网络模型的损失函数值;
S1054.在损失函数值不满足训练停止条件的情况下,调整贝叶斯网络模型的模型参数,并利用训练样本集训练参数调整后的贝叶斯网络模型,直至满足训练停止条件,得到训练后的贝叶斯网络模型。
在一个示例中,系统可以将现有训练样本的数据按7:3的比例划分为训练集和测试集。针对先验概率的训练,通过对现有样本训练集进行学习,获得贝叶斯网络的各节点的条件概率。如下表所示,集团位置信息的复杂关联度通过贝叶斯网络的条件概率集得以凸显,由于各层级、各节点之间处于动态关联,当出现新的训练数据时,可以根据概率进行重新学习计算。
表4集团位置信息置信度贝叶斯网络模型边缘概率表(部分)
如图5所示,导入样本训练集后贝叶斯网络训练结果(部分)。
本申请实施例提供的一种对象的地理位置数据确定方法,能够利用训练样本集对预设的贝叶斯网络模型进行训练,得到训练后的贝叶斯网络模型。训练后的贝叶斯网络模型可以用于预测对象的地理位置数据的置信度,从而根据置信度确定对象的真实地理位置数据。
在一个实施例中,步骤S105得到训练后的贝叶斯网络模型之后,还可以包括模型验证过程。
训练完成后的贝叶斯网络,以样本测试集作为测试集进行模型验证。部分集团位置数据测试集置信度概率匹配预测结果如表5所示。最高可能性的分类结果与实际结果一致的达91.7%,由此可知根据训练组得出的集团位置信息置信度匹配贝叶斯网络具有较高的可信度,能够针对置信度未知的位置数据进行正确的置信度预测及匹配。
表5集团位置数据测试集置信度概率匹配预测
输出每条记录的置信度指标值,预测为“Yes”的则输出“1”,预测为“No”的则输出“0”。
在一个示例中,通过结合某年3-5月纯新增签到数据,来验证模型实际应用效果。利用纯新增签到数据与信息池中对应集团的位置数据记录计算空间距离差。若距离差<1km,则认为集团位置数据准确,标记为“1”;若距离差>=1km,则认为集团位置数据不准确,标记为“0”。与模型3-5月效果验证如下,准确率分别为82.7%、79.7%、81.6%,效果较好。
表6模型实际效果验证数据表
基于模型输出的集团可信位置资产,对该年3-5月数据进行对比分析,如下表所示可以看出模型输出的可信位置数据相比较单项聚类模型输出的准确数据和单项网络爬虫输出的准确数据规模均有提升,认为该模型具有实际应用价值。
表7多来源位置数据精准度对比表
本申请实施例提供一种对象的地理位置数据确定装置,请参考图6,包括:
第一获取模块601,被配置为从预设的地理位置数据池中,获取目标对象的多个地理位置数据,其中,每个地理位置数据的数据来源不同;
置信度预测模块602,被配置为将每个地理位置数据分别输入到预先训练的贝叶斯网络模型中,得到置信度;
第一判断模块603,被配置为根据每个置信度,在多个地理位置数据中确定目标对象的真实地理位置数据。
本申请提供的一种对象的地理位置数据确定装置,能够准确判断一个对象多种来源的地理位置数据的真实性,快速确定对象的真实地理位置数据,准确率高、判断速度快。
在一个实施例中,一种对象的地理位置数据确定装置还可以包括:
第二获取模块,被配置为获取训练样本集,训练样本集包括多个训练样本,每个训练样本包括一个对象的地理位置数据及其为对象真实地理位置数据的置信度标签;
模型训练模块,被配置为利用训练样本训练预设贝叶斯网络模型,直至满足训练停止条件,得到训练后的贝叶斯网络模型。
在一个示例中,模型训练模块具体包括:
对每个训练样本,分别执行以下步骤:
将地理位置数据输入至预设的贝叶斯网络模型中,得到地理位置数据为对象真实地理位置数据的预测置信度;
根据预测置信度和置信度标签,确定贝叶斯网络模型的损失函数值;
在损失函数值不满足训练停止条件的情况下,调整贝叶斯网络模型的模型参数,并利用训练样本集训练参数调整后的贝叶斯网络模型,直至满足训练停止条件,得到训练后的贝叶斯网络模型。
在一个示例中,第二获取模块具体包括:
获取多个对象中的每个对象的多个地理位置数据,同一个对象的多个地理位置数据对应多个来源;
针对同一个对象,分别计算目标来源的地理位置数据与每个其他来源的地理位置数据之间的距离;其他来源的地理位置数据为多个来源中除目标来源以外的来源;
将距离小于预设距离阈值的其他来源对应的地理位置数据的置信度标签确定为第一置信度,不小于的确定为第二置信度;
将同一个对象的地理位置数据及其对应的置信度标签作为一个训练样本,以得到训练样本集。
在一个实施例中,第一判断模块603,具体被配置为将置信度的数值大于预设阈值,且数值最高的地理位置数据确定为目标对象的真实地理位置数据。
上述各实施例提供的一种对象的地理位置数据确定方法可以由图7所示的一种对象的地理位置数据确定设备执行。
对象的地理位置数据确定设备可以包括处理器701以及存储有计算机程序指令的存储器702。
具体地,上述处理器701可以包括中央处理器(Central Processing Unit,CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本发明实施例的一个或多个集成电路。
存储器702可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器702可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在一个实例中,存储器702可以包括可移除或不可移除(或固定)的介质,或者存储器702是非易失性固态存储器。存储器702可在综合网关容灾设备的内部或外部。
在一个实例中,存储器702可以是只读存储器(Read Only Memory,ROM)。在一个实例中,该ROM可以是掩模编程的ROM、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、电可改写ROM(EAROM)或闪存或者两个或更多个以上这些的组合。
存储器702可以包括只读存储器(ROM),随机存取存储器(RAM),磁盘存储介质设备,光存储介质设备,闪存设备,电气、光学或其他物理/有形的存储器存储设备。因此,通常,存储器包括一个或多个编码有包括计算机可执行指令的软件的有形(非暂态)计算机可读存储介质(例如,存储器设备),并且当该软件被执行(例如,由一个或多个处理器)时,其可操作来执行参考根据本公开的一方面的方法所描述的操作。
处理器701通过读取并执行存储器702中存储的计算机程序指令,以实现上述任一实施例提供的定位5G网络干扰源的方法,并达到该方法达到的相应技术效果,为简洁描述在此不再赘述。
在一个示例中,对象的地理位置数据确定设备还可包括通信接口703和总线710。其中,如图4所示,处理器701、存储器702、通信接口703通过总线710连接并完成相互间的通信。
通信接口703,主要用于实现本发明实施例中各模块、装置、单元和/或设备之间的通信。
总线710包括硬件、软件或两者,将在线数据流量计费设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(Accelerated Graphics Port,AGP)或其他图形总线、增强工业标准架构(Extended Industry Standard Architecture,EISA)总线、前端总线(Front Side Bus,FSB)、超传输(Hyper Transport,HT)互连、工业标准架构(Industry Standard Architecture,ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线710可包括一个或多个总线。尽管本发明实施例描述和示出了特定的总线,但本发明考虑任何合适的总线或互连。
该对象的地理位置数据确定的设备能够准确识别一个对象的多个地理位置数据的真实性,其中,多个地理位置数据的来源可以不同。该设备的识别准确率高、识别速度快。
结合上述实施例中的一种对象的地理位置数据确定方法,本发明实施例可提供一种计算机存储介质来实现。该计算机存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种对象的地理位置数据确定方法。
需要明确的是,本发明并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本发明的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本发明的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、适当的固件、插件、功能卡等。当以软件方式实现时,本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RadioFrequency,RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本发明中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本发明不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
上面参考根据本公开的实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各方面。应当理解,流程图和/或框图中的每个方框以及流程图和/或框图中各方框的组合可以由计算机程序指令实现。这些计算机程序指令可被提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器,以产生一种机器,使得经由计算机或其它可编程数据处理装置的处理器执行的这些指令使能对流程图和/或框图的一个或多个方框中指定的功能/动作的实现。这种处理器可以是但不限于是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电路。还可理解,框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合,也可以由执行指定的功能或动作的专用硬件来实现,或可由专用硬件和计算机指令的组合来实现。
以上所述,仅为本发明的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种对象的地理位置数据确定方法,其特征在于,包括:
从预设的地理位置数据池中,获取目标对象的多个地理位置数据,其中,每个所述地理位置数据的数据来源不同;
将每个所述地理位置数据分别输入到预先训练的贝叶斯网络模型中,得到置信度;
根据每个所述置信度,在多个所述地理位置数据中确定所述目标对象的真实地理位置数据。
2.根据权利要求1所述的方法,其特征在于,所述将每个所述地理位置数据分别输入到预先训练的贝叶斯网络模型中,得到置信度之前,所述方法还包括:
获取训练样本集,所述训练样本集包括多个训练样本,每个所述训练样本包括一个对象的地理位置数据及其为所述对象真实地理位置数据的置信度标签;
利用所述训练样本训练预设贝叶斯网络模型,直至满足训练停止条件,得到训练后的贝叶斯网络模型。
3.根据权利要求2所述的方法,其特征在于,所述利用所述训练样本训练预设贝叶斯网络模型,直至满足训练停止条件,得到所述目标贝叶斯网络模型,具体包括:
对每个训练样本,分别执行以下步骤:
将所述地理位置数据输入至预设的贝叶斯网络模型中,得到所述地理位置数据为所述对象真实地理位置数据的预测置信度;
根据所述预测置信度和所述置信度标签,确定所述贝叶斯网络模型的损失函数值;
在所述损失函数值不满足训练停止条件的情况下,调整所述贝叶斯网络模型的模型参数,并利用所述训练样本集训练参数调整后的贝叶斯网络模型,直至满足所述训练停止条件,得到训练后的贝叶斯网络模型。
4.根据权利要求2所述的方法,其特征在于,所述获取训练样本集,包括:
获取多个对象中的每个对象的多个地理位置数据,同一个对象的多个地理位置数据对应多个来源;
针对同一个对象,分别计算目标来源的地理位置数据与每个其他来源的地理位置数据之间的距离;所述其他来源的地理位置数据为所述多个来源中除所述目标来源以外的来源;
将所述距离小于预设距离阈值的其他来源对应的地理位置数据的置信度标签确定为第一置信度,不小于的确定为第二置信度;
将同一个对象的地理位置数据及其对应的置信度标签作为一个训练样本,以得到所述训练样本集。
5.根据权利要求4所述的方法,其特征在于,所述目标来源的地理位置数据是人工签到获取的地理位置数据。
6.根据权利要求1所述的方法,其特征在于,所述根据每个所述置信度,在多个所述地理位置数据中确定所述目标对象的真实地理位置数据,具体包括:
将置信度的数值大于预设阈值,且数值最高的地理位置数据确定为所述目标对象的真实地理位置数据。
7.一种对象的地理位置数据确定装置,其特征在于,包括:
第一获取模块,被配置为从预设的地理位置数据池中,获取目标对象的多个地理位置数据,其中,每个所述地理位置数据的数据来源不同;
置信度预测模块,被配置为将每个所述地理位置数据分别输入到预先训练的贝叶斯网络模型中,得到置信度;
第一判断模块,被配置为根据每个所述置信度,在多个所述地理位置数据中确定所述目标对象的真实地理位置数据。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第二获取模块,被配置为在将每个所述地理位置数据分别输入到预先训练的贝叶斯网络模型中,得到置信度之前,获取训练样本集,所述训练样本集包括多个训练样本,每个所述训练样本包括一个对象的地理位置数据及其为所述对象真实地理位置数据的置信度标签;
模型训练模块,被配置为利用所述训练样本训练预设贝叶斯网络模型,直至满足训练停止条件,得到训练后的贝叶斯网络模型。
9.一种对象的地理位置数据确定设备,其特征在于,所述设备包括:处理器,以及存储有计算机程序指令的存储器;所述处理器读取并执行所述计算机程序指令,以实现如权利要求1-6任意一项所述的一种对象的地理位置数据确定方法。
10.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-6任意一项所述的一种对象的地理位置数据确定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011321715.9A CN112232444B (zh) | 2020-11-23 | 2020-11-23 | 对象的地理位置数据确定方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011321715.9A CN112232444B (zh) | 2020-11-23 | 2020-11-23 | 对象的地理位置数据确定方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112232444A true CN112232444A (zh) | 2021-01-15 |
CN112232444B CN112232444B (zh) | 2024-02-27 |
Family
ID=74124553
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011321715.9A Active CN112232444B (zh) | 2020-11-23 | 2020-11-23 | 对象的地理位置数据确定方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112232444B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030074471A1 (en) * | 2000-04-03 | 2003-04-17 | Mark Anderson | Method and apparatus for estimating a geographic location of a networked entity |
CN104750829A (zh) * | 2015-04-01 | 2015-07-01 | 华中科技大学 | 一种基于签到特征的用户位置分类方法及系统 |
CN110580487A (zh) * | 2018-06-08 | 2019-12-17 | Oppo广东移动通信有限公司 | 神经网络的训练方法、构建方法、图像处理方法和装置 |
CN110688536A (zh) * | 2019-09-25 | 2020-01-14 | 中国建设银行股份有限公司 | 一种标签预测方法、装置、设备和存储介质 |
CN111209318A (zh) * | 2020-01-02 | 2020-05-29 | 平安科技(深圳)有限公司 | 基于地理位置数据分析方法、装置、电子设备及存储介质 |
CN111797768A (zh) * | 2020-07-06 | 2020-10-20 | 华侨大学 | 一种城市道路交通拥堵多原因自动实时识别方法及系统 |
-
2020
- 2020-11-23 CN CN202011321715.9A patent/CN112232444B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030074471A1 (en) * | 2000-04-03 | 2003-04-17 | Mark Anderson | Method and apparatus for estimating a geographic location of a networked entity |
CN104750829A (zh) * | 2015-04-01 | 2015-07-01 | 华中科技大学 | 一种基于签到特征的用户位置分类方法及系统 |
CN110580487A (zh) * | 2018-06-08 | 2019-12-17 | Oppo广东移动通信有限公司 | 神经网络的训练方法、构建方法、图像处理方法和装置 |
CN110688536A (zh) * | 2019-09-25 | 2020-01-14 | 中国建设银行股份有限公司 | 一种标签预测方法、装置、设备和存储介质 |
CN111209318A (zh) * | 2020-01-02 | 2020-05-29 | 平安科技(深圳)有限公司 | 基于地理位置数据分析方法、装置、电子设备及存储介质 |
CN111797768A (zh) * | 2020-07-06 | 2020-10-20 | 华侨大学 | 一种城市道路交通拥堵多原因自动实时识别方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112232444B (zh) | 2024-02-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106600960B (zh) | 基于时空聚类分析算法的交通出行起讫点识别方法 | |
Zheng et al. | Detecting collective anomalies from multiple spatio-temporal datasets across different domains | |
Hung et al. | Methods for assessing the credibility of volunteered geographic information in flood response: A case study in Brisbane, Australia | |
CN110020224B (zh) | 地图兴趣点数据的关联方法、装置、设备及介质 | |
CN112669594B (zh) | 交通路况预测的方法、装置、设备及存储介质 | |
CN110532250B (zh) | 交规数据的处理方法及装置 | |
CN110598999B (zh) | 基于个体数据的交通出行分析方法、系统及存储介质 | |
CN109996245B (zh) | 通信资源投放评估方法、装置、电子设备及存储介质 | |
CN113723716B (zh) | 一种客流分级预警异常告警方法、设备及存储介质 | |
CN111737377A (zh) | 一种漂移轨迹的识别方法、装置及计算设备、存储介质 | |
CN109993390B (zh) | 告警关联及派单优化方法、装置、设备及介质 | |
CN111294841A (zh) | 一种无线网络问题的处理方法、装置及存储介质 | |
Tufuor et al. | Calibrating the Highway Capacity Manual arterial travel time reliability model | |
Karimzadeh et al. | Optimal clustering of pavement segments using K-prototype algorithm in a high-dimensional mixed feature space | |
Sousa et al. | How to evaluate the quality of coarse‐resolution DEM‐derived drainage networks | |
Mathew et al. | Comparative assessment of geospatial and statistical methods to estimate local road annual average daily traffic | |
CN112232444B (zh) | 对象的地理位置数据确定方法、装置、设备及存储介质 | |
CN117538503A (zh) | 一种实时智能的土壤污染监测系统及方法 | |
Pinelli et al. | A methodology for denoising and generating bus infrastructure data | |
CN115310735A (zh) | 商圈边界识别的方法、装置、设备及存储介质 | |
CN115391746A (zh) | 针对气象要素数据的插值方法、装置、电子设备及介质 | |
CN112749239B (zh) | 一种事件图谱构建方法、装置及计算设备 | |
Cipolla et al. | Identification of spatio-temporal outliers through minimum spanning tree | |
US9473368B1 (en) | Network graph representation of physically connected network | |
CN114281808A (zh) | 一种交通大数据清洗方法、装置、设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |