CN110457420B - 兴趣点位置识别方法、装置、设备及存储介质 - Google Patents
兴趣点位置识别方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN110457420B CN110457420B CN201910745387.6A CN201910745387A CN110457420B CN 110457420 B CN110457420 B CN 110457420B CN 201910745387 A CN201910745387 A CN 201910745387A CN 110457420 B CN110457420 B CN 110457420B
- Authority
- CN
- China
- Prior art keywords
- geographic element
- point
- distance
- interest
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 60
- 238000000605 extraction Methods 0.000 claims abstract description 20
- 230000006399 behavior Effects 0.000 claims description 25
- 238000012549 training Methods 0.000 claims description 25
- 230000015654 memory Effects 0.000 claims description 21
- 238000013145 classification model Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 11
- 238000013473 artificial intelligence Methods 0.000 abstract description 13
- 238000010276 construction Methods 0.000 description 26
- 238000010801 machine learning Methods 0.000 description 21
- 238000005516 engineering process Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 16
- 238000004422 calculation algorithm Methods 0.000 description 13
- 238000003058 natural language processing Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 5
- 230000002093 peripheral effect Effects 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 241000282414 Homo sapiens Species 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Remote Sensing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及一种兴趣点位置识别方法、装置、计算机可读存储介质和计算机设备,方法包括:获取到兴趣点位置文本和兴趣点坐标;对兴趣点位置文本进行语义提取得到各个第一地理要素名称,根据空间位置关系确定各个第一地理要素名称之间的从属关系;获取第一地理要素坐标;计算兴趣点与各个第一地理要素之间的第一距离,确定兴趣点与各个第一地理要素之间的位置冲突特征;计算各个第一地理要素之间的第二距离,确定第一地理要素名称之间的关系冲突特征;将位置冲突特征和关系冲突特征输入已训练的兴趣点位置识别模型中,得到对待识别兴趣点信息的识别结果。本申请提供的方案通过人工智能可以实现识别兴趣点信息的正确性,提高兴趣点信息的准确性。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种兴趣点位置识别方法、装置、设备及存储介质。
背景技术
随着电子地图技术的发展,人们使用电子设备查看电子地图。电子地图(Electronic map),即数字地图,是利用计算机技术,以数字方式存储和查阅的地图。在电子地图中包括POI(兴趣点,Point of Interest)数据。POI在电子地图中,一个POI数据可以是一栋房子、一个商铺、一个邮筒、一个公交站等。描述POI的基础属性包括坐标(经纬度)、名称和地址等。
然而,目前使用人工审核电子地图中POI数据的准确性或者根据预设规则分析电子地图中POI的准确性,存在对POI数据识别准确性较低的问题。
发明内容
基于此,有必要针对POI数据识别准确性较低的技术问题,提供一种兴趣点位置识别方法、装置、设备及存储介质。
一种兴趣点位置识别方法,包括:
获取待识别兴趣点信息,待识别兴趣点信息包括兴趣点位置文本和兴趣点坐标;
对兴趣点位置文本进行语义提取得到各个第一地理要素名称,根据空间位置关系确定各个第一地理要素名称之间的从属关系;
获取各个第一地理要素名称对应的第一地理要素坐标;
根据兴趣点坐标和各个第一地理要素坐标,确定兴趣点与各个第一地理要素之间的第一距离,根据第一距离与第一距离对应的地理要素类型,确定兴趣点与各个第一地理要素之间的位置冲突特征;
根据各个第一地理要素坐标计算各个第一地理要素之间的第二距离,根据第二距离和第二距离对应的第一地理要素名称之间的从属关系,确定第一地理要素名称之间的关系冲突特征;
将位置冲突特征和关系冲突特征输入已训练的兴趣点位置识别模型中,得到对待识别兴趣点信息的识别结果。
一种兴趣点位置识别装置,包括:
信息获取模块,用于获取待识别兴趣点信息,待识别兴趣点信息包括兴趣点位置文本和兴趣点坐标;
名称提取模块,用于对兴趣点位置文本进行语义提取得到各个第一地理要素名称,根据空间位置关系确定各个第一地理要素名称之间的从属关系;
坐标获取模块,用于获取各个第一地理要素名称对应的第一地理要素坐标;
位置特征确定模块,用于根据兴趣点坐标和各个第一地理要素坐标,确定兴趣点与各个第一地理要素之间的第一距离,根据第一距离与第一距离对应的地理要素类型,确定兴趣点与各个第一地理要素之间的位置冲突特征;
关系特征确定模块,用于根据各个第一地理要素坐标计算各个第一地理要素之间的第二距离,根据第二距离和第二距离对应的第一地理要素名称之间的从属关系,确定第一地理要素名称之间的关系冲突特征;
识别模块,用于将位置冲突特征和关系冲突特征输入已训练的兴趣点位置识别模型中,得到对待识别兴趣点信息的识别结果。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,该处理器执行程序时实现以下步骤:
获取待识别兴趣点信息,待识别兴趣点信息包括兴趣点位置文本和兴趣点坐标;
对兴趣点位置文本进行语义提取得到各个第一地理要素名称,根据空间位置关系确定各个第一地理要素名称之间的从属关系;
获取各个第一地理要素名称对应的第一地理要素坐标;
根据兴趣点坐标和各个第一地理要素坐标,确定兴趣点与各个第一地理要素之间的第一距离,根据第一距离与第一距离对应的地理要素类型,确定兴趣点与各个第一地理要素之间的位置冲突特征;
根据各个第一地理要素坐标计算各个第一地理要素之间的第二距离,根据第二距离和第二距离对应的第一地理要素名称之间的从属关系,确定第一地理要素名称之间的关系冲突特征;
将位置冲突特征和关系冲突特征输入已训练的兴趣点位置识别模型中,得到对待识别兴趣点信息的识别结果。
一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时,使得处理器执行以下步骤:
获取待识别兴趣点信息,待识别兴趣点信息包括兴趣点位置文本和兴趣点坐标;
对兴趣点位置文本进行语义提取得到各个第一地理要素名称,根据空间位置关系确定各个第一地理要素名称之间的从属关系;
获取各个第一地理要素名称对应的第一地理要素坐标;
根据兴趣点坐标和各个第一地理要素坐标,确定兴趣点与各个第一地理要素之间的第一距离,根据第一距离与第一距离对应的地理要素类型,确定兴趣点与各个第一地理要素之间的位置冲突特征;
根据各个第一地理要素坐标计算各个第一地理要素之间的第二距离,根据第二距离和第二距离对应的第一地理要素名称之间的从属关系,确定第一地理要素名称之间的关系冲突特征;
将位置冲突特征和关系冲突特征输入已训练的兴趣点位置识别模型中,得到对待识别兴趣点信息的识别结果。
上述兴趣点位置识别方法、装置、计算机可读存储介质和计算机设备,通过根据待识别兴趣点信息提取到位置冲突特征和关系冲突特征,使用位置冲突特征和关系冲突特征输入到已训练的兴趣点位置识别模型中进行识别,得到兴趣点信息的识别结果,能够识别兴趣点信息中位置的正确性,提高兴趣点信息的准确性。
附图说明
图1为一个实施例中兴趣点位置识别方法的应用环境图;
图2为一个实施例中兴趣点位置识别方法的流程示意图;
图3为一个实施例中确定从属关系的流程示意图;
图4为一个实施例中获取第一地理要素坐标的流程示意图;
图5为一个实施例中确定点位置冲突特征的流程示意图;
图6为一个实施例中确定线位置冲突特征的流程示意图;
图7为一个实施例中计算线距离的流程示意图;
图8为一个实施例中确定面位置冲突特征的流程示意图;
图9为另一个实施例中兴趣点位置识别方法的流程示意图;
图10为一个实施例中得到第一从属关系冲突特征的流程示意图;
图11为一个实施例中得到第二从属关系冲突特征的流程示意图;
图12为一个实施例中训练兴趣点位置识别模型的流程示意图;
图13为一个具体实施例中兴趣点位置识别方法的流程示意图;
图14为图13实施例中地理要素位置关系的示意图;
图15为一个实施例中兴趣点位置识别装置的结构框图;
图16为一个实施例中计算机设备的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
自然语言处理(Nature Language processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
本申请实施例提供的方案涉及人工智能的自然语言处理和机器学习等技术,具体通过如下实施例进行说明:
图1为一个实施例中兴趣点位置识别方法的应用环境图。参照图1,该兴趣点位置识别方法应用于兴趣点位置识别系统。该兴趣点位置识别系统包括终端102和服务器104。终端102和服务器104通过网络连接。终端102具体可以是台式终端或移动终端,移动终端具体可以手机、平板电脑、笔记本电脑等中的至少一种。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
具体地,服务器104获取终端102发送的待识别兴趣点信息,待识别兴趣点信息包括兴趣点位置文本和兴趣点坐标;服务器104对兴趣点位置文本进行语义提取得到各个第一地理要素名称,根据空间位置关系确定各个第一地理要素名称之间的从属关系;服务器104获取各个第一地理要素名称对应的第一地理要素坐标;服务器104根据兴趣点坐标和各个第一地理要素坐标,确定兴趣点与各个第一地理要素之间的第一距离,根据第一距离与第一距离对应的地理要素类型,确定兴趣点与各个第一地理要素之间的位置冲突特征;服务器104根据各个第一地理要素坐标计算各个第一地理要素之间的第二距离,根据第二距离和第二距离对应的第一地理要素名称之间的从属关系,确定第一地理要素名称之间的关系冲突特征;服务器104将位置冲突特征和关系冲突特征输入已训练的兴趣点位置识别模型中,得到对待识别兴趣点信息的识别结果。服务器104可以将对待识别兴趣点信息的识别结果返回到终端104中进行展示。
如图2所示,在一个实施例中,提供了一种兴趣点位置识别方法。本实施例主要以该方法应用于上述图1中的服务器120来举例说明。参照图2,该兴趣点位置识别方法具体包括如下步骤:
S202,获取待识别兴趣点信息,待识别兴趣点信息包括兴趣点位置文本和兴趣点坐标。
其中,待识别兴趣点信息是指需要进行位置正确性识别的兴趣点信息,兴趣点信息可以包括兴趣点位置文本和兴趣点坐标,位置正确性是指待识别兴趣点信息中的兴趣点坐标与其实际所在位置是否一致。兴趣点位置文本是指描述兴趣点的文本信息,可以是兴趣点名称、兴趣点地址等等。兴趣点坐标是指兴趣点的经纬度坐标。兴趣点,即POI,在地理信息系统中,一个POI可以是一栋房子、一个商铺、一个邮筒、一个公交站等。比如,兴趣点可以是“绍兴饭店”。兴趣点坐标是(31.18695,121.4967)。
具体地,服务器获取到待识别兴趣点信息,解析得到待识别兴趣点信息中的兴趣点名称、兴趣点地址和兴趣点坐标等等。
在一个实施例中,服务器获取到待识别兴趣点信息包括的兴趣点位置文本可以只包括兴趣点地址,也可以只包括兴趣点名称。即服务器得到的可以是兴趣点名称和兴趣点坐标,也可以是兴趣点地址和兴趣点坐标。
S204,对兴趣点位置文本进行语义提取得到各个第一地理要素名称,根据空间位置关系确定各个第一地理要素名称之间的从属关系。
其中,地理要素是地图的地理内容,包括表示地球表面自然形态所包含的要素,如地貌、水系、植被和土壤等自然地理要素与人类在生产活动中改造自然界所形成的要素,如居民地、道路网、通讯设备、工农业设施、经济文化和行政标志等社会经济要素。第一地理要素名称是指从兴趣点位置文本中通过分词和角色标注提取到的地理要素的名称。比如,兴趣点位置文本中兴趣点名称为“肯德基(新世界百货店)”。提取到的地理要素名称包括“肯德基”和“新世界百货”。空间位置关系是指在实际中地理要素之间的空间位置的关系。比如,在实际情况下,“肯德基”与“新世界百货”的空间位置关系应该是肯德基在新世界百货的范围内。从属关系是指地理要素名称之间的关系,可以根据地理要素的空间位置是否相互包含得到从属关系。可以包括主子关系和分店关系。主子关系是指前一个地理要素是后一个地理要素物理上的主点。比如,“新世界百货-停车场”中“新世界百货”是“停车场”物理上的主点,即“新世界百货”和“停车场”之间的为主子关系。分店关系是指后一个地理要素是前一个地理要素物理上的主点。比如,“肯德基(新世界百货店)”中“肯德基”与“新世界百货”为分店关系。
具体地,服务器对兴趣点位置文本使用自然语言处理技术(NLP)进行语义提取得到各个第一地理要素名称,可以将兴趣点位置文本中的兴趣点名称和兴趣点地址进行中文分词和角色标注,从兴趣点名称和兴趣点地址中抽取到各个第一地理要素名称。然后,服务器根据空间位置关系确定各个第一地理要素名称之间的从属关系。
S206,获取各个第一地理要素名称对应的第一地理要素坐标。
其中,地理要素坐标是指采用各种方式采集到地理要素坐标并存放到预先设置好的数据库中的。各种方式包括但不限于使用爬虫爬取、用户提供、从各种数据源获取等等。
具体地,服务器可以从预设设置好的数据库中获取到第一地理要素名称对应的第一地理要素坐标。
S208,根据兴趣点坐标和各个第一地理要素坐标,确定兴趣点与各个第一地理要素之间的第一距离,根据第一距离与第一距离对应的地理要素类型,确定兴趣点与各个第一地理要素之间的位置冲突特征。
其中,第一距离是指兴趣点坐标与第一地理要素坐标之间的距离。地理要素类型是根据第一距离对应的第一地理要素坐标得到,包括点类型、线类型和面类型。比如,第一地理要素坐标是点坐标时,地理要素名称的地理要素类型为点类型。比如,“建设大道568号”是点类型的地理要素名称。第一地理要素坐标是线坐标时,地理要素名称的地理要素类型为线类型。比如,“建设大道”是线类型的地理要素名称。第一地理要素坐标是面坐标时,地理要素名称的地理要素类型为面类型。比如,“湖北省武汉市江汉区”是面类型的地理要素名称。
冲突特征是指兴趣点坐标与其相关的地理元素的坐标在位置空间上的不一致性。冲突特征包括位置冲突特征和关系冲突特征。位置冲突特征是指兴趣点坐标与其相关的地理元素的坐标在位置上的不一致性,不一致说明位置冲突特征为有冲突,一致说明位置冲突特征为无冲突。比如,门牌号“建设大道568号”的位置与“肯德基”的位置是最近的。当“建设大道568号”的位置与“肯德基”的位置不是最近时,即有其他门牌号的位置与“肯德基”的位置最近,则“肯德基”与“建设大道568号”的位置有冲突。关系冲突特征是指地理要素之间从属关系之间的不一致性。比如,“肯德基”与“新世界百货”的从属关系应该是肯德基在新世界百货的范围内,如果计算得到的“肯德基”的坐标并没有在“新世界百货”的坐标范围内,则“肯德基”的坐标与相关的“新世界百货”的坐标的关系有冲突。
具体地,服务器根据兴趣点坐标和各个第一地理要素坐标计算出兴趣点与各个第一地理要素之间的第一距离。服务器确定第一距离对应的地理要素类型,并确定地理要素类型对应的各个相同地理要素类型的地理要素坐标,分别计算得到兴趣点坐标与各个相同地理要素类型的地理要素坐标的各个同类型距离。然后,比较第一距离和各个同类型距离得到兴趣点与各个第一地理要素之间的位置冲突特征。比如,第一距离和各个同类型距离得到兴趣点与各个第一地理要素之间的位置冲突特征。
S210,根据各个第一地理要素坐标计算各个第一地理要素之间的第二距离,根据第二距离和第二距离对应的第一地理要素名称之间的从属关系,确定第一地理要素名称之间的关系冲突特征。
其中,第二距离是指各个第一地理要素之间的距离。从属关系是指第一地理要素名称之间的包含关系,比如,“肯德基”与“新世界百货”的从属关系应该是肯德基在新世界百货的范围内。“新世界百货-停车场”的从属关系应该是停车场在新世界百货的范围内。
具体地,服务器根据各个第一地理要素坐标计算各个第一地理要素之间的第二距离。确定第二距离对应的第一地理要素名称,获取到第一地理要素名称之间的从属关系,根据第二距离和第二距离对应的第一地理要素名称之间的从属关系确定第一地理要素名称之间的关系冲突特征。
S212,将位置冲突特征和关系冲突特征输入已训练的兴趣点位置识别模型中,得到对待识别兴趣点信息的识别结果。
其中,兴趣点位置识别模型是使用历史人工审核流程中积累的正样本数据和负样本数据使用机器学习算法进行训练得到。其中,机器学习算法包括但不限于GBDT(GradientBoosted Decision Trees,梯度提升决策树)、CNN(Convolutional Neural Networks,卷积神经网络),LSTM(Long Short-Term Memory,长短期记忆网络)等等。待识别兴趣点信息的识别结果用于体现兴趣点信息的正确性,包括兴趣点信息正确结果、兴趣点信息错误结果和对应的置信度。兴趣点信息正确结果是指兴趣点信息中兴趣点坐标描述的位置正确结果,兴趣点信息错误结果是指指兴趣点信息中兴趣点坐标描述的位置错位结果,置信度是指对兴趣点信息描述的位置正确结果和错误结果的可信任程度。
具体地,服务器将提取到的位置冲突特征和关系冲突特征输入已训练的兴趣点位置识别模型中,兴趣点位置识别模型对输入的位置冲突特征和关系冲突特征进行分类识别,得到兴趣点信息正确结果和对应的置信度或者兴趣点信息错误结果和对应的置信度。
上述兴趣点位置识别方法,通过根据待识别兴趣点信息提取到位置冲突特征和关系冲突特征,使用位置冲突特征和关系冲突特征输入到已训练的兴趣点位置识别模型中进行识别,得到兴趣点信息的识别结果,能够识别兴趣点信息中位置的正确性,提高兴趣点信息的准确性。
在一个实施例中,如图3所示,步骤S204,即对兴趣点位置文本进行语义提取得到各个第一地理要素名称,根据空间位置关系确定各个第一地理要素名称之间的从属关系,包括步骤:
S302,将兴趣点位置文本输入到已训练的条件随机场模型中进行地理要素名称识别,得到各个第一地理要素名称。
其中,条件随机场模型是指根据已有的地理要素名称标注数据使用CRF算法(条件随机场算法,conditional random field algorithm)进行训练得到的,地理要素名称是指地理要素的文本名称。
具体地,服务器将兴趣点位置文本输入到已训练的条件随机场模型中提取出兴趣点位置文本中的地理要素名称,得到各个第一地理要素名称,比如,兴趣点地址为“湖北省武汉市江汉区汉口建设大道568号新世界百货(国贸店)1层”,将兴趣点地址文本输入到已训练的条件随机场模型中提取出“湖北省武汉市江汉区”、“建设大道568号”、“新世界百货”和“国贸”等地理要素名称。
S304,按照兴趣点位置文本的序列从各个第一地理要素名称中确定初始第一地理要素名称和目标第一地理要素名称。
其中,初始第一地理要素名称是指按照兴趣点位置文本的序列从各个第一地理要素名称随机选择的第一地理要素名称。目标第一地理要素名称是指按照兴趣点位置文本的序列从初始第一地理要素名称之后的各个第一地理要素名称中随机选择的第一地理要素名称。
具体地,服务器根据兴趣点位置文本的序列,即根据地理要素名称在兴趣点位置文本中的前后顺序确定各个第一地理要素名称的前后顺序,依次从各个第一地理要素名称中选择得到初始第一地理要素名称和目标第一地理要素名称。比如,“湖北省武汉市江汉区”为初始第一地理要素名称,“建设大道568号”为目标第一地理要素名称。
S306,获取初始第一地理要素名称和目标第一地理要素名称的空间位置关系。
S308,当初始第一地理要素名称的空间位置包括目标第一地理要素名称的空间位置时,初始第一地理要素名称和目标第一地理要素名称之间的关系为第一从属关系。
其中,第一从属关系是指主子关系,即初始第一地理要素名称的空间位置包括目标第一地理要素名称的空间位置。
具体地,服务器使用已有的工具获取到初始第一地理要素名称和目标第一地理要素名称的空间位置关系,当初始第一地理要素名称的空间位置包括目标第一地理要素名称的空间位置时,初始第一地理要素名称和目标第一地理要素名称之间的关系为第一从属关系。比如,“湖北省武汉市江汉区”的空间位置中包含有“建设大道568号”的空间位置。则说明“湖北省武汉市江汉区”是“建设大道568号”物理上的主点,则“湖北省武汉市江汉区”和“建设大道568号”是主子关系。
S310,当目标第一地理要素名称的空间位置包括初始第一地理要素名称的空间位置时,初始第一地理要素名称和目标第一地理要素名称之间的关系为第二从属关系。
其中,第二从属关系是指分店关系,即目标第一地理要素名称的空间位置包括初始第一地理要素名称的空间位置。
具体地,当目标第一地理要素名称的空间位置中包括初始第一地理要素名称的空间位置时,初始第一地理要素名称和目标第一地理要素名称之间的关系为第二从属关系。比如“国贸”的空间位置包括有“新世界百货”的空间位置,则“新世界百货”和“国贸”是分店关系。
在上述实例中,通过确定地理要素名称在兴趣点文本中的前后顺序,并根据前后顺序和地理要素名称的空间位置得到地理要素名称之间的从属关系,提高了得到从属关系的准确性,并方便后续使用。
在一个实例中,如图4所示,步骤S206,即获取各个第一地理要素名称对应的第一地理要素坐标,包括步骤:
S402,获取与兴趣点坐标的距离在预设范围内的各个第二地理要素坐标,获取第二地理要素坐标对应的第二地理要素名称。
S404,将第一地理要素名称与第二地理要素名称进行文本匹配。
第二地理要素坐标是指与兴趣点坐标的距离在预设范围内的地理要素坐标。文本匹配是指将地理要素名称进行匹配。可以使用前缀匹配算法进行文本匹配。
具体地,服务器遍历预先设置好的数据库,获取与兴趣点坐标的距离在预设范围内的各个第二地理要素坐标,即根据兴趣点坐标进行周边召回,周边召回是指,给定一个坐标,包括经度、纬度,根据预先设置好的距离范围,返回其周围的地理元素。并获取第二地理要素坐标对应的第二地理要素名称。然后将每个第一地理要素名称与获取到的所有第二地理要素名称使用前缀匹配算法进行文本匹配。
S406,当第一地理要素名称与第二地理要素名称中目标第二地理要素名称匹配时,将目标第二地理要素名称对应的目标第二地理要素坐标作为第一地理要素名称对应的第一地理要素坐标。
具体地,当第一地理要素名称与第二地理要素名称中目标第二地理要素名称匹配时,即第一地理要素名称与目标第二地理要素名称相同,此时,服务器将目标第二地理要素名称对应的目标第二地理要素坐标作为第一地理要素名称对应的第一地理要素坐标。
在上述实施例中,通过查找兴趣点坐标预设范围内的第二地理要素坐标和对应的第二地理要素名称,使用第一地理要素名称匹配到相同的第二地理要素名称,从而得到第一地理要素坐标,保证得到的第一地理要素坐标的精确度。
在一个实例中,步骤S406,在将第一地理要素名称与第二地理要素名称进行文本匹配之后,还包括步骤:
当第一地理要素名称与各个第二地理要素名称未匹配时,根据第一地理要素名称在预设数据库中查找对应的第一地理要素坐标。
其中,预设数据库是存储地理要素相同信息的数据库,包括,地理要素名称、地理要素坐标和地理要素类型等等。
具体地,当第一地理要素名称与各个第二地理要素名称全部不相同时,即第一地理要素名称与各个第二地理要素名称未匹配,此时,服务器根据第一地理要素名称直接在预设数据库中查找对应的第一地理要素坐标,保证获取到第一地理要素名称对应的第一地理要素坐标。
在一个实例中,如图5所示,步骤S208,即根据第一距离与第一距离对应的地理要素类型,确定兴趣点与各个第一地理要素之间的位置冲突特征,包括步骤:
S502,当第一距离对应的地理要素类型为点类型时,确定第一距离为第一点距离,根据第一点距离确定对应的第一地理要素为第一点地理要素。
其中,第一点距离是指兴趣点坐标与第一地理要素坐标点的距离。第一点地理要素是指地理要素坐标为坐标点的地理要素。比如,第一点地理要素对应的第一点地理要素名称可以是“建设大道666号”。
具体地,当第一距离对应的地理要素类型为点类型时,说明第一距离是兴趣点坐标与第一地理要素坐标点计算点与点的距离得到的。此时,确定第一距离为第一点距离,根据第一点距离确定对应的第一地理要素为第一点地理要素。
S504,获取点类型的各个点地理要素对应的点地理要素坐标,点地理要素坐标与兴趣点坐标的距离在预设目标范围内,计算兴趣点坐标与各个点地理要素坐标对应的各个点距离。
具体地,服务器可以获取到与兴趣点坐标的距离在预设目标范围内点类型的各个点地理要素对应的点地理要素坐标,计算兴趣点坐标与各个点地理要素坐标对应的各个点距离。比如,获取到与兴趣点坐标的距离在100米范围内的所有门牌号地理要素对应的点地理要素坐标。计算兴趣点坐标与各个门牌号地理要素对应的点地理要素坐标的距离。
S506,从各个点距离中获取目标点距离,将目标点距离与第一点距离进行比较。
S508,当目标点距离小于第一点距离时,得到兴趣点与第一点地理要素之间的位置冲突特征为位置有冲突特征。
S510,当目标点距离未小于第一点距离时,得到兴趣点与第一点地理要素之间的位置冲突特征为位置无冲突特征。
其中,目标点距离是指各个点距离中最短的距离。位置冲突特征包括位置有冲突特征和位置无冲突特征,使用0表示位置无冲突,使用1表示位置有冲突。
具体地,服务器从各个点距离中获取目标点距离,将目标点距离与第一点距离进行比较,当目标点距离小于第一点距离时,说明第一点地理要素坐标不是离兴趣点坐标最近的点地理要素坐标,即兴趣点信息中位置文本和坐标是不一致的,即得到兴趣点与第一点地理要素之间的位置冲突特征为位置有冲突特征。当目标点距离未小于第一点距离时,说明第一点地理要素坐标是离兴趣点坐标最近的点地理要素坐标,即兴趣点信息中位置文本和坐标是一致的。得到兴趣点与第一点地理要素之间的位置冲突特征为位置无冲突特征。
在一个具体实施例中,兴趣点位置文本中“建设大道666号”的第一点地理要素坐标与兴趣点坐标的距离为70米。而兴趣点坐标距离“建设大道568号”的距离为13米。即兴趣点坐标与“建设大道666号”存在冲突。得到位置冲突特征为有冲突,即位置冲突特征为(1)。相反的,当兴趣点位置文本中“建设大道568号”的地理要素坐标与兴趣点坐标的距离为13米,其他门牌号的距离都未小于13米,则得到位置冲突特征为无冲突,即位置冲突特征为(0)。
在上述实施例中,当第一距离对应的地理要素类型为点类型,计算得到兴趣点与第一点地理要素之间的位置冲突特征,将点类型的位置冲突特征作为后续机器学习模型的输入,能够提高机器学习模型输出的精确度。
在一个实例中,如图6所示,步骤S208,即根据第一距离与第一距离对应的地理要素类型,确定兴趣点与各个第一地理要素之间的位置冲突特征,包括:
S602,当第一距离对应的地理要素类型为线类型时,确定第一距离为第一线距离,根据第一线距离确定对应的第一地理要素为第一线地理要素。
其中,第一线距离是指兴趣点坐标与第一地理要素坐标线的距离。第一线地理要素是指地理要素坐标为坐标线的地理要素,即街道、公路、铁路等的地理要素。比如,第一线地理要素对应的第一线地理要素名称可以是“建设大道”。该坐标线可以是每隔一段距离得到的多个坐标点形成的。
具体地,当第一距离对应的地理要素类型为线类型时,说明第一距离是兴趣点坐标与第一地理要素坐标线计算点与线的距离得到的。此时,确定第一距离为第一线距离,根据第一点距离确定对应的第一地理要素为第一线地理要素。
S604,获取线类型的各个线地理要素对应的线地理要素坐标,线地理要素坐标与兴趣点坐标的距离在预设目标范围内,计算兴趣点坐标与各个线地理要素坐标对应的各个线距离。
具体的,服务器可以获取到与兴趣点坐标的距离在预设范围内线类型的各个线地理要素对应的线地理要素坐标,计算兴趣点坐标与各个线地理要素坐标对应的各个线距离。比如,获取到与兴趣点坐标的距离在200米范围内的所有道路地理要素对应的线地理要素坐标。计算兴趣线坐标与各个道路地理要素对应的线地理要素坐标的距离。
在一个实例中,可以计算出兴趣点坐标与线地理要素坐标之间点与线的最短距离。
在一个实施例中,可以计算出兴趣点坐标与线地理要素坐标中端点坐标之间的距离。
S606,从各个线距离中获取目标线距离,将目标线距离与第一线距离进行比较。
S608,当目标线距离小于第一线距离时,得到兴趣点与第一线地理要素之间的位置冲突特征为位置有冲突特征。
S610,当目标线距离未小于第一线距离时,得到兴趣点与第一线地理要素之间的位置冲突特征为位置无冲突特征。
其中,目标线距离是指各个线距离中最短的距离。
具体地,服务器从各个线距离中获取目标线距离,将目标线距离与第一线距离进行比较,当目标线距离小于第一线距离时,说明第一线地理要素坐标不是离兴趣点坐标最近的线地理要素坐标,即兴趣点信息中兴趣点位置文本和兴趣点坐标是不一致的,即兴趣点与第一线地理要素之间的位置冲突特征为位置有冲突特征。当目标线距离未小于第一线距离时,说明第一线地理要素坐标是离兴趣点坐标最近的线地理要素坐标,即兴趣点信息中兴趣点位置文本和兴趣点坐标是一致的。得到兴趣点与第一点地理要素之间的位置冲突特征为位置无冲突特征。
在一个具体的实施例中,兴趣点位置文本中“建设大道”的第一线地理要素坐标与兴趣点坐标的距离为40米,是最近的线地理要素,则兴趣点坐标与“建设大道”一致,得到位置冲突特征为位置无冲突特征(0)。兴趣点位置文本中“建设大道”的第一线地理要素坐标与兴趣点坐标的距离为40米,与最近的线地理要素坐标的距离为30米。则兴趣点坐标与“建设大道”不一致,得到位置冲突特征为位置有冲突特征(1)。
在一个实施例中,当兴趣点坐标在第一线地理要素坐标中时,得到兴趣点与第一线地理要素之间的位置冲突特征为位置无冲突特征,当兴趣点坐标未在第一线地理要素坐标中时,得到兴趣点与第一线地理要素之间的位置冲突特征为位置有冲突特征。比如,兴趣点“隧道口”的坐标在第一线地理要素“道路”上,即兴趣点“隧道口”与第一线地理要素“道路”一致,得到“隧道口”与“道路”位置冲突特征为位置无冲突特征(0),当兴趣点“隧道口”的坐标未在第一线地理要素“道路”上时,即兴趣点“隧道口”与第一线地理要素“道路”不一致,得到“隧道口”与“道路”位置冲突特征为位置无冲突特征(1)。
在上述实施例中,当第一距离对应的地理要素类型为线类型时,计算得到兴趣点与第一线地理要素之间的位置冲突特征,将线类型的位置冲突特征作为后续机器学习模型的输入,能够提高机器学习模型输出的精确度。
在一个实例中,如图7所示,步骤S606,即计算兴趣点坐标与各个线地理要素坐标对应的各个线距离,包括:
S702,根据兴趣点坐标与线地理要素坐标计算兴趣点与线地理要素之间的最短距离。
S704,当最短距离对应的与线地理要素的交点坐标在线地理要素坐标中,将最短距离作为线距离。
其中,最短距离是指兴趣点坐标与线地理要素坐标的垂直距离,即点与线的垂直距离。最短距离对应的与线地理要素的交点是指垂直距离与线地理要素的垂点,即点与线的垂点。
具体地,根据兴趣点坐标与线地理要素坐标计算兴趣点与线地理要素之间的最短距离。当最短距离对应的与线地理要素的交点坐标在线地理要素坐标中,将最短距离作为兴趣点坐标与线地理要素坐标之间的线距离。
S706,当最短距离对应的与线地理要素的交点坐标未在线地理要素坐标中时,获取线地理要素坐标中的各个端点坐标,计算兴趣点坐标与各个端点坐标的各个端点距离,从各个端点距离中确定目标端点距离,将目标端点距离作为线距离。
具体地,当短距离对应的与线地理要素的交点坐标未在线地理要素坐标中时,即短距离对应的与线地理要素的交点在线地理要素坐标的延长线上。说明,交点的坐标未在兴趣点坐标的预设距离范围内。此时,获取线地理要素坐标中的两个端点坐标,计算兴趣点坐标与两个端点坐标的两个端点距离,从两个端点距离中选取端点距离小的目标端点距离,将目标端点距离作为兴趣点坐标与线地理要素坐标之间的线距离。
在上实施例中,在兴趣点坐标与线地理要素坐标之间的距离时,当兴趣点坐标与线地理要素坐标距离的交点未在线地理要素坐标中时,计算兴趣点坐标与线地理要素坐标中端点坐标的距离作为线距离,保证得到的线距离的精确度。
在一个实例中,如图8所示,根据第一距离与第一距离对应的地理要素类型,确定兴趣点与各个第一地理要素之间的位置冲突特征,包括:
S802,当第一距离对应的地理要素类型为面类型时,确定第一距离为第一面距离,根据第一面距离确定对应的第一地理要素为第一面地理要素。
其中,第一面距离是指兴趣点坐标与第一地理要素坐标面的距离。第一面地理要素是指地理要素坐标为坐标区域范围的地理要素,比如大厦区域、行政区域、广场区域、绿地水域等等的地理要素。比如,第一面地理要素对应的第一面地理要素名称可以是“湖北省武汉市江汉区”。
S804,当第一面距离为第一目标面距离时,得到兴趣点与第一面地理要素之间的位置冲突特征为位置无冲突特征。
其中,第一目标面距离是指兴趣点坐标在第一面地理要素对应的第一面地理要素范围内,即第一目标面距离为0。
具体地,当第一面距离为第一目标面距离时,即兴趣点在第一面地理要素中,则得到兴趣点与第一面地理要素之间的位置冲突特征为位置无冲突特征。比如,兴趣点坐标中“114.2698,30.59505”在“湖北省武汉市江汉区”地理要素的坐标范围区域内。则兴趣点与第一面地理要素之间的位置冲突特征为位置无冲突特征(0)。
S806,当第一面距离为第二目标面距离时,得到兴趣点与第一面地理要素之间的位置冲突特征为位置有冲突特征。
其中,第二目标面距离是指兴趣点坐标在第一面地理要素对应的第一面地理要素范围外,即第一目标面距离不为0。
具体地,当第一面距离为第二目标面距离时,得到兴趣点与第一面地理要素之间的位置冲突特征为位置有冲突特征。比如,兴趣点坐标在地理要素的坐标范围区域外。则兴趣点与第一面地理要素之间的位置冲突特征为位置有冲突特征(1)。
在上述实施例中,当当第一距离对应的地理要素类型为面类型,计算得到兴趣点与第一面地理要素之间的位置冲突特征,将面类型的位置冲突特征作为后续机器学习模型的输入,能够提高机器学习模型输出的精确度。
在一个实例中,如图9所示,步骤S212,即将位置冲突特征和关系冲突特征输入已训练的兴趣点位置识别模型中,得到兴趣点信息正确性结果和兴趣点信息正确性结果对应的置信度,包括步骤:
S902,获取兴趣点位置文本对应的各个目标行为坐标,根据各个目标行为坐标计算目标中心坐标。
其中,目标行为坐标是指用户在兴趣点位置文本的兴趣点地址中定位的坐标,该定位的坐标可以从用户的行为数据中得到,比如用户支付时的定位信息,用户连接Wi-Fi(无线上网)时的定位信息,用户签到时的定位信息等等。目标中心坐标是指将各个目标行为坐标聚类之后聚类中心的坐标。
具体地,服务器获取兴趣点位置文本对应的各个目标行为坐标,根据各个目标行为坐标使用聚类算法将目标行为坐标进行聚类,计算出目标中心坐标。其中聚类算法可以是层次聚类算法,K均值聚类算法等等。
S904,计算目标中心坐标与兴趣点坐标的行为距离,将行为距离作为目标位置特征。
S906,将目标位置特征,位置冲突特征和关系冲突特征输入已训练的目标兴趣点位置识别模型中,得到兴趣点信息正确性结果和兴趣点信息正确性结果对应的置信度。
其中,目标兴趣点位置识别模型是指输入特征包括目标位置特征的机器学习模型,是预先使用已有的数据使用机器学习算法进行训练得到的,机器学习算法包括但不限于GBDT、CNN和LSTM等等。
具体地,服务器计算出目标中心坐标与兴趣点坐标的行为距离,将行为距离作为目标位置特征,并将目标位置特征,位置冲突特征和关系冲突特征输入已训练的目标兴趣点位置识别模型中,得到兴趣点信息正确性结果和兴趣点信息正确性结果对应的置信度。
在上述实施例中,通过使用目标位置、特征位置冲突特征和关系冲突特征来得到兴趣点信息正确性结果和兴趣点信息正确性结果对应的置信度,能够提高目标兴趣点位置识别模型的识别结果的准确性。
在一个实例中,如图10所示,步骤S210,即根据第二距离和第二距离对应的第一地理要素名称之间的从属关系,确定第一地理要素名称之间的关系冲突特征,包括步骤:
S1002,当第二距离对应的第一地理要素名称之间的从属关系为第一从属关系时,根据第二距离确定初始第一地理要素名称和目标第一地理要素名称,获取初始第一地理要素名称对应的初始第一地理要素坐标和目标第一地理要素名称对应的目标第一地理要素坐标。
S1004,当初始第一地理要素坐标中包括目标第一地理要素坐标时,得到初始第一地理要素名称和目标第一地理要素名称之间的关系冲突特征为无冲突特征。
S1006,当目标第一地理要素坐标中包括初始第一地理要素坐标时,得到初始第一地理要素名称和目标第一地理要素名称之间的关系冲突特征为有冲突特征。
其中,第一从属关系为主子关系。
具体地,当第二距离对应的第一地理要素名称之间的从属关系为主子关系时,根据计算得到的第二距离确定出两个第一地理要素名称,并按照兴趣点位置文本中的顺序确定两个第一地理要素名称的前后顺序,得到初始第一地理要素名称和目标第一地理要素名称,即兴趣点位置文本中的顺序在前的第一地理要素名称为初始第一地理要素名称,兴趣点位置文本中的顺序在后的第一地理要素名称为目标第一地理要素名称。并获取到对应的初始第一地理要素坐标和目标第一地理要素坐标。当目标第一地理要素坐标中包括初始第一地理要素坐标时,则这两个第一地理要素名称之间的关系冲突特征为有冲突特征。当初始第一地理要素坐标中包括目标第一地理要素坐标时,则这两个第一地理要素名称之间的关系冲突特征为无冲突特征。
在上述实施例中,根据第一从属关系确定对应的第一地理要素名称之间的关系冲突特征,然后将关系冲突特征作为后续机器学习模型的输入,能够提高机器学习模型输出的精确度。
在一个实例中,如图11所示,步骤S210,根据第二距离和第二距离对应的第一地理要素名称之间的从属关系,确定第一地理要素名称之间的关系冲突特征,包括:
S1102,当第二距离对应的第一地理要素名称之间的从属关系为第二从属关系时,根据第二距离确定初始第一地理要素名称和目标第一地理要素名称,获取初始第一地理要素名称对应的初始第一地理要素坐标和目标第一地理要素名称对应的目标第一地理要素坐标。
S1104,当目标第一地理要素坐标中包括初始第一地理要素坐标时,得到初始第一地理要素名称和目标第一地理要素名称之间的关系冲突特征为无冲突特征。
S1106,当初始第一地理要素坐标中包括目标第一地理要素坐标时,得到初始第一地理要素名称和目标第一地理要素名称之间的关系冲突特征为有冲突特征。
其中,第二从属关系为分店关系。
具体地,当第二距离对应的第一地理要素名称之间的从属关系为分店关系时,根据计算得到第二距离确定出两个第一地理要素名称,并按照兴趣点位置文本中的顺序确定两个第一地理要素名称的前后顺序,得到初始第一地理要素名称和目标第一地理要素名称,即兴趣点位置文本中的顺序在前的第一地理要素名称为初始第一地理要素名称,兴趣点位置文本中的顺序在后的第一地理要素名称为目标第一地理要素名称。并获取到对应的初始第一地理要素坐标和目标第一地理要素坐标。当目标第一地理要素坐标中包括初始第一地理要素坐标时,则这两个第一地理要素名称之间的关系冲突特征为无冲突特征。当初始第一地理要素坐标中包括目标第一地理要素坐标时,则这两个第一地理要素名称之间的关系冲突特征为有冲突特征。
在上述实施例中,根据第二从属关系确定对应的第一地理要素名称之间的关系冲突特征,然后将关系冲突特征作为后续机器学习模型的输入,能够提高机器学习模型输出的精确度。
在一个实例中,如图12所示,已训练的兴趣点位置识别模型的生成步骤,包括:
S1202,获取历史兴趣点信息和对应的历史兴趣点信息识别结果。
具体地,获取历史兴趣点信息包括兴趣点坐标和兴趣点位置文本,并获取到对应的历史兴趣点信息识别结果,历史兴趣点信息识别结果包括历史兴趣点信息中兴趣点坐标描述的位置正确和历史兴趣点信息中兴趣点坐标描述的位置错误,得到训练样本数据。
S1204,根据历史兴趣点信息得到历史位置冲突特征和历史关系冲突特征。
具体地,根据训练样本数据中的兴趣点坐标和兴趣点位置文本提取得到历史位置冲突特征和历史关系冲突特征。
S1206,将历史位置冲突特征和历史关系冲突特征输入到初始梯度下降树分类模型中,计算得到历史兴趣点信息对应的预测结果。
其中,初始梯度下降树分类模型是指根据初始参数得到的梯度下降树模型。设置初始梯度下降树分类模型中梯度下降树的深度为4,树的棵树为1000,特征数量为57。预测结果包括历史兴趣点信息中兴趣点坐标预测正确和历史兴趣点信息中兴趣点坐标预测错误。
具体地,将提取到的训练样本数据中的历史位置冲突特征和历史关系冲突特征输入到初始梯度下降树分类模型中,计算得到历史兴趣点信息对应的预测结果。其中,历史兴趣点信息中兴趣点坐标预测正确和历史兴趣点信息中兴趣点坐标预测错误。
S1208,根据历史兴趣点信息对应的预测结果与历史兴趣点信息对应的历史兴趣点信息识别结果计算得到训练损失值。
具体地,获取到历史兴趣点信息对应的历史兴趣点信息识别结果,将历史兴趣点信息识别结果作为标签。根据历史兴趣点信息对应的预测结果使用损失函数计算与标签之间的训练损失值。其中损失函数可以使用对数损失函数或者指数损失函数。
S1210,根据训练损失值不断调整初始梯度下降树分类模型的模型参数,直至满足收敛条件,得到兴趣点位置识别模型。
其中,收敛条件是指模型参数达到最优或者迭代次数到达最大次数。
具体地,根据训练损失值不断调整初始梯度下降树分类模型的模型参数,直至模型参数达到最优或者迭代次数到达最大次数,训练完成,得到兴趣点位置识别模型。
在一个实施例中,将历史兴趣点信息和对应的历史兴趣点信息识别结果随机分成10份,采用十折交叉验证法对模型参数进行调优。
在一个实施例中,将历史兴趣点信息和对应的历史兴趣点信息识别结果的样本数据分成训练集和验证集。使用训练集训练兴趣点位置识别模型,使用验证集对训练得到兴趣点位置识别模型进行验证,当达到预设准确率时,将对应的兴趣点位置识别模型作为最终的兴趣点位置识别模型。
在上述实施例中,通过历史样本数据训练得到兴趣点位置识别模型,然后将兴趣点位置识别模型部署到服务器中,服务器可以直接使用兴趣点位置识别模型进行识别,提高识别效率。
在一个具体的实施例中,兴趣点位置识别模型可以对电子地图产品中新增POI数据上线时对新增POI数据的正确性进行检验。也可以对用户反馈POI坐标错误的POI数据的正确性进行检验,还可以对已有POI数据库中的POI数据进行正确性检验。
如图13所示,为一个具体实施例中兴趣点位置识别方法的流程示意图,具体来说:
获取到输入的待识别兴趣点信息,包括兴趣点名称、地址和坐标,对兴趣点名称、地址进行文本理解,抽取到POI/交叉口/门牌等引用的点信息、道路等线信息和行政区划/街区/有名区域等引用的面信息。基于名称和地址的序列抽取到隐含的主子点关系或分店关系。对兴趣点坐标进行空间理解,即进行周边召回,得到兴趣点坐标周边一定范围内的地理要素,比如,POI召回、交叉口召回、门牌召回、道路召回、行政区域召回、街区召回、有名区域召回、主子点召回和绿地水系召回等等。得到周边一定范围内的地理要素的名称和坐标。将文本理解得到的地理要素名称和周边召回的地理要素名称进行文本匹配之后,得到了周边召回的地理要素名称中包括的文本理解得到的地理要素名称,从而得到文本理解得到的地理要素名称对应的文本理解的地理要素坐标。从而根据兴趣点坐标与文本理解的地理要素之间在位置关系上的冲突特征。
比如,某兴趣点的名称是“肯德基(新世界百货店)”,地址是“湖北省武汉市江汉区汉口建设大道568号新世界百货(国贸店)1层”,坐标是“114.2698,30.59505”。从POI名称中抽取得到“肯德基”这个点的POI和“新世界百货”这个有名区域面的名称,从POI地址中抽取得到“湖北省武汉市江汉区”这个行政区划面的名称,“新世界百货”、“国贸”这两个有名区域面的名称,“建设大道”这个线的名称,以及“建设大道568号”这个点的名称。同时,基于坐标“114.2698,30.59505”召回周边500米以内的地理要素,发现上述“建设大道”、“新世界百货”等地理要素均在该坐标500米范围内。得到“建设大道”、“新世界百货”等地理要素的坐标,计算坐标“114.2698,30.59505”与“建设大道”的坐标即点与线的位置冲突特征。如图14所示为电子地图中部分地理要素的位置关系示意图,兴趣点坐标与“建设大道”的距离为90米,“建设大道”是最近的道路,则得到兴趣点坐标与“建设大道”的位置无冲突。兴趣点坐标与“建设大道568号”之间点与点的距离为70米。而兴趣点坐标与“建设大道566号”之间点与点的距离为40米,即“建设大道568号”不是离兴趣点坐标最近的门牌号,则兴趣点坐标与“建设大道568号”之间的位置关系存在冲突,得到所有的位置关系的冲突特征。
然后,基于抽取得到的主子关系和分店关系。计算兴趣点的坐标与名称、地址中所包含的地理要素之间在从属关系上的冲突特征。比如,“肯德基(新世界百货店)”,从名称中抽取得到肯德基和新世界百货是分店关系,计算“肯德基”兴趣点的坐标在“新世界百货”区域中,则分店关系为无冲突特征,得到所有的从属关系冲突特征。基于得到的所有的位置关系的冲突特征和从属关系冲突特征,输入到入GBDT分类器得到最终的输出结果。
得到的输出结果中包括待识别兴趣点信息中兴趣点坐标描述位置的正确结果和对应的置信度,或者得到待识别兴趣点信息中兴趣点坐标描述位置的错误结果和对应的置信度,或者得到无法判断的结果。无法判断的结果是指待识别兴趣点信息中兴趣点坐标描述位置的错误结果和待识别兴趣点信息中兴趣点坐标描述位置的正确结果对应的置信度是相同的。
当得到的输出结果是待识别兴趣点信息中兴趣点坐标描述位置的错误结果和对应的置信度,根据错误结果和对应的置信度将待识别兴趣点信息召回。当得到的输出结果是待识别兴趣点信息中兴趣点坐标描述位置的正确结果和对应的置信度,根据错误结果和对应的置信度将待识别兴趣点信息保留。
在一个具体的实施例中,使用测试集(包含正负例各1000个样本)对传统使用预设规则识别方法和使用本申请的兴趣点位置识别方法进行测试,得到测试结果如表1所示:
表1
从测试结果来看,本申请中对兴趣点位置识别的结果精度和召回整体上都高于预设规则的识别结果,使识别结果的整体准确度相比预设规则的高,提升了对兴趣点位置正确性的识别,并提高兴趣点信息的准确性。
应该理解的是,虽然图2-13的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-13中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
如图15所示,为一实施例中的兴趣点位置识别装置1500的示意图,该装置包括:
信息获取模块1502,用于获取待识别兴趣点信息,待识别兴趣点信息包括兴趣点位置文本和兴趣点坐标;
名称提取模块1504,用于对兴趣点位置文本进行语义提取得到各个第一地理要素名称,根据空间位置关系确定各个第一地理要素名称之间的从属关系;
坐标获取模块1506,用于获取各个第一地理要素名称对应的第一地理要素坐标;
位置特征确定模块1508,用于根据兴趣点坐标和各个第一地理要素坐标,确定兴趣点与各个第一地理要素之间的第一距离,根据第一距离与第一距离对应的地理要素类型,确定兴趣点与各个第一地理要素之间的位置冲突特征;
关系特征确定模块1510,用于根据各个第一地理要素坐标计算各个第一地理要素之间的第二距离,根据第二距离和第二距离对应的第一地理要素名称之间的从属关系,确定第一地理要素名称之间的关系冲突特征;
识别模块1512,用于将位置冲突特征和关系冲突特征输入已训练的兴趣点位置识别模型中,得到对待识别兴趣点信息的识别结果。
在一个实施例中,名称提取模块1504还用于将兴趣点位置文本输入到已训练的条件随机场模型中进行地理要素名称识别,得到各个第一地理要素名称;按照兴趣点位置文本的序列从各个第一地理要素名称中确定初始第一地理要素名称和目标第一地理要素名称;获取初始第一地理要素名称和目标第一地理要素名称的空间位置关系;当初始第一地理要素名称的空间位置包括目标第一地理要素名称的空间位置时,初始第一地理要素名称和目标第一地理要素名称之间的关系为第一从属关系;当目标第一地理要素名称的空间位置包括初始第一地理要素名称的空间位置时,初始第一地理要素名称和目标第一地理要素名称之间的关系为第二从属关系。
在一个实施例中,坐标获取模块1506还用于获取与兴趣点坐标的距离在预设范围内的各个第二地理要素坐标,获取第二地理要素坐标对应的第二地理要素名称;将第一地理要素名称与第二地理要素名称进行文本匹配;当第一地理要素名称与第二地理要素名称中目标第二地理要素名称匹配时,将目标第二地理要素名称对应的目标第二地理要素坐标作为第一地理要素名称对应的第一地理要素坐标。
在一个实施例中,坐标获取模块1506还用于当第一地理要素名称与各个第二地理要素名称未匹配时,根据第一地理要素名称在预设数据库中查找对应的第一地理要素坐标。
在一个实施例中,位置特征确定模块1508还用于当第一距离对应的地理要素类型为点类型时,确定第一距离为第一点距离,根据第一点距离确定对应的第一地理要素为第一点地理要素;获取点类型的各个点地理要素对应的点地理要素坐标,点地理要素坐标与兴趣点坐标的距离在预设目标范围内,计算兴趣点坐标与各个点地理要素坐标对应的各个点距离;从各个点距离中获取目标点距离,将目标点距离与第一点距离进行比较;当目标点距离小于第一点距离时,得到兴趣点与第一点地理要素之间的位置冲突特征为位置有冲突特征;当目标点距离未小于第一点距离时,得到兴趣点与第一点地理要素之间的位置冲突特征为位置无冲突特征。
在一个实施例中,位置特征确定模块1508还用于当第一距离对应的地理要素类型为线类型时,确定第一距离为第一线距离,根据第一线距离确定对应的第一地理要素为第一线地理要素;获取线类型的各个线地理要素对应的线地理要素坐标,线地理要素坐标与兴趣点坐标的距离在预设目标范围内,计算兴趣点坐标与各个线地理要素坐标对应的各个线距离;从各个线距离中获取目标线距离,将目标线距离与第一线距离进行比较;当目标线距离小于第一线距离时,得到兴趣点与第一线地理要素之间的位置冲突特征为位置有冲突特征;当目标线距离未小于第一线距离时,得到兴趣点与第一线地理要素之间的位置冲突特征为位置无冲突特征。
在一个实施例中,位置特征确定模块1508还用于根据兴趣点坐标与线地理要素坐标计算兴趣点与线地理要素之间的最短距离;当最短距离对应的与线地理要素的交点坐标在线地理要素坐标中,将最短距离作为线距离;当最短距离对应的与线地理要素的交点坐标未在线地理要素坐标中时,获取线地理要素坐标中的各个端点坐标,计算兴趣点坐标与各个端点坐标的各个端点距离,从各个端点距离中确定目标端点距离,将目标端点距离作为线距离。
在一个实施例中,位置特征确定模块1508还用于当第一距离对应的地理要素类型为面类型时,确定第一距离为第一面距离,根据第一面距离确定对应的第一地理要素为第一面地理要素;当第一面距离为第一目标面距离时,得到兴趣点与第一面地理要素之间的位置冲突特征为位置无冲突特征;当第一面距离为第二目标面距离时,得到兴趣点与第一面地理要素之间的位置冲突特征为位置有冲突特征。
在一个实施例中,识别模块1512还用于获取兴趣点位置文本对应的各个目标行为坐标,根据各个目标行为坐标计算目标中心坐标;计算目标中心坐标与兴趣点坐标的行为距离,将行为距离作为目标位置特征;将目标位置特征,位置冲突特征和关系冲突特征输入已训练的目标兴趣点位置识别模型中,得到对待识别兴趣点信息的识别结果。
在一个实施例中,关系特征确定模块1510还用于当第二距离对应的第一地理要素名称之间的从属关系为第一从属关系时,根据第二距离确定初始第一地理要素名称和目标第一地理要素名称,获取初始第一地理要素名称对应的初始第一地理要素坐标和目标第一地理要素名称对应的目标第一地理要素坐标;当初始第一地理要素坐标中包括目标第一地理要素坐标时,得到初始第一地理要素名称和目标第一地理要素名称之间的关系冲突特征为无冲突特征;当目标第一地理要素坐标中包括初始第一地理要素坐标时,得到初始第一地理要素名称和目标第一地理要素名称之间的关系冲突特征为有冲突特征。
在一个实施例中,关系特征确定模块1510还用于当第二距离对应的第一地理要素名称之间的从属关系为第二从属关系时,根据第二距离确定初始第一地理要素名称和目标第一地理要素名称,获取初始第一地理要素名称对应的初始第一地理要素坐标和目标第一地理要素名称对应的目标第一地理要素坐标;当目标第一地理要素坐标中包括初始第一地理要素坐标时,得到初始第一地理要素名称和目标第一地理要素名称之间的关系冲突特征为无冲突特征;当初始第一地理要素坐标中包括目标第一地理要素坐标时,得到初始第一地理要素名称和目标第一地理要素名称之间的关系冲突特征为有冲突特征。
在一个实施例中,兴趣点位置识别装置1500,还包括:模型训练模块,用于获取历史兴趣点信息和对应的历史兴趣点信息识别结果;根据历史兴趣点信息得到历史位置冲突特征和历史关系冲突特征;将历史位置冲突特征和历史关系冲突特征输入到初始梯度下降树分类模型中,计算得到历史兴趣点信息对应的预测结果;根据历史兴趣点信息对应的预测结果与历史兴趣点信息对应的历史兴趣点信息识别结果计算得到训练损失值;根据训练损失值不断调整初始梯度下降树分类模型的模型参数,直至满足收敛条件,得到兴趣点位置识别模型。
图16示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中的服务器104。如图16所示,该计算机设备包括该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现兴趣点位置识别方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行兴趣点位置识别方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图16中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的兴趣点位置识别装置可以实现为一种计算机程序的形式,计算机程序可在如图16所示的计算机设备上运行。计算机设备的存储器中可存储组成该兴趣点位置识别装置的各个程序模块,比如,图15所示的信息获取模块、名称提取模块、坐标获取模块、位置特征确定模块、关系特征确定模块和识别模块。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的兴趣点位置识别方法中的步骤。
例如,图16所示的计算机设备可以通过如图15所示的兴趣点位置识别装置中的信息获取模块执行步骤S202。计算机设备可通过名称提取模块执行步骤S204。计算机设备可通过坐标获取模块执行步骤S206。计算机设备可通过位置特征确定模块执行步骤S208。计算机设备可通过关系特征确定模块执行步骤S210。计算机设备可通过识别模块执行步骤S212。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述兴趣点位置识别方法的步骤。此处兴趣点位置识别方法的步骤可以是上述各个实施例的兴趣点位置识别方法中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述兴趣点位置识别方法的步骤。此处兴趣点位置识别方法的步骤可以是上述各个实施例的兴趣点位置识别方法中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (26)
1.一种兴趣点位置识别方法,包括:
获取待识别兴趣点信息,所述待识别兴趣点信息包括兴趣点位置文本和兴趣点坐标;
对所述兴趣点位置文本进行语义提取得到各个第一地理要素名称,根据空间位置关系确定所述各个第一地理要素名称之间的从属关系;
获取所述各个第一地理要素名称对应的第一地理要素坐标;
根据兴趣点坐标和各个第一地理要素坐标,确定兴趣点与各个第一地理要素之间的第一距离,根据所述第一距离与所述第一距离对应的地理要素类型,确定所述兴趣点与各个第一地理要素之间的位置冲突特征;
根据所述各个第一地理要素坐标计算所述各个第一地理要素之间的第二距离,根据所述第二距离和所述第二距离对应的第一地理要素名称之间的从属关系,确定所述第一地理要素名称之间的关系冲突特征;
将所述位置冲突特征和所述关系冲突特征输入已训练的兴趣点位置识别模型中,得到对所述待识别兴趣点信息的识别结果。
2.根据权利要求1所述的方法,其特征在于,所述对所述兴趣点位置文本进行语义提取得到各个第一地理要素名称,根据空间位置关系确定所述各个第一地理要素名称之间的从属关系,包括:
将所述兴趣点位置文本输入到已训练的条件随机场模型中进行地理要素名称识别,得到各个第一地理要素名称;
按照所述兴趣点位置文本的序列从所述各个第一地理要素名称中确定初始第一地理要素名称和目标第一地理要素名称;
获取所述初始第一地理要素名称和所述目标第一地理要素名称的空间位置关系;
当所述初始第一地理要素名称的空间位置包括所述目标第一地理要素名称的空间位置时,所述初始第一地理要素名称和所述目标第一地理要素名称之间的关系为第一从属关系;
当所述目标第一地理要素名称的空间位置包括所述初始第一地理要素名称的空间位置时,所述初始第一地理要素名称和所述目标第一地理要素名称之间的关系为第二从属关系。
3.根据权利要求1所述的方法,其特征在于,获取所述各个第一地理要素名称对应的第一地理要素坐标,包括:
获取与所述兴趣点坐标的距离在预设范围内的各个第二地理要素坐标,获取所述第二地理要素坐标对应的第二地理要素名称;
将所述第一地理要素名称与所述第二地理要素名称进行文本匹配;
当所述第一地理要素名称与所述第二地理要素名称中目标第二地理要素名称匹配时,将所述目标第二地理要素名称对应的目标第二地理要素坐标作为所述第一地理要素名称对应的第一地理要素坐标。
4.根据权利要求3所述的方法,其特征在于,在所述将所述第一地理要素名称与所述第二地理要素名称进行文本匹配之后,还包括:
当所述第一地理要素名称与各个第二地理要素名称未匹配时,根据所述第一地理要素名称在预设数据库中查找对应的第一地理要素坐标。
5.根据权利要求1所述的方法,其特征在于,所述根据所述第一距离与所述第一距离对应的地理要素类型,确定所述兴趣点与各个第一地理要素之间的位置冲突特征,包括:
当所述第一距离对应的地理要素类型为点类型时,确定所述第一距离为第一点距离,根据所述第一点距离确定对应的第一地理要素为第一点地理要素;
获取所述点类型的各个点地理要素对应的点地理要素坐标,所述点地理要素坐标与所述兴趣点坐标的距离在预设目标范围内,计算所述兴趣点坐标与各个所述点地理要素坐标对应的各个点距离;
从所述各个点距离中获取目标点距离,将所述目标点距离与所述第一点距离进行比较;
当所述目标点距离小于所述第一点距离时,得到所述兴趣点与所述第一点地理要素之间的位置冲突特征为位置有冲突特征;
当所述目标点距离未小于所述第一点距离时,得到所述兴趣点与所述第一点地理要素之间的位置冲突特征为位置无冲突特征。
6.根据权利要求1所述的方法,其特征在于,所述根据所述第一距离与所述第一距离对应的地理要素类型,确定所述兴趣点与各个第一地理要素之间的位置冲突特征,包括:
当所述第一距离对应的地理要素类型为线类型时,确定所述第一距离为第一线距离,根据所述第一线距离确定对应的第一地理要素为第一线地理要素;
获取所述线类型的各个线地理要素对应的线地理要素坐标,所述线地理要素坐标与所述兴趣点坐标的距离在预设目标范围内,计算所述兴趣点坐标与各个所述线地理要素坐标对应的各个线距离;
从所述各个线距离中获取目标线距离,将所述目标线距离与所述第一线距离进行比较;
当所述目标线距离小于所述第一线距离时,得到所述兴趣点与所述第一线地理要素之间的位置冲突特征为位置有冲突特征;
当所述目标线距离未小于所述第一线距离时,得到所述兴趣点与所述第一线地理要素之间的位置冲突特征为位置无冲突特征。
7.根据权利要求6所述的方法,其特征在于,所述计算所述兴趣点坐标与各个所述线地理要素坐标对应的各个线距离,包括:
根据所述兴趣点坐标与线地理要素坐标计算所述兴趣点与所述线地理要素之间的最短距离;
当所述最短距离对应的与所述线地理要素的交点坐标在所述线地理要素坐标中,将所述最短距离作为线距离;
当所述最短距离对应的与所述线地理要素的交点坐标未在所述线地理要素坐标中时,获取所述线地理要素坐标中的各个端点坐标,计算所述兴趣点坐标与所述各个端点坐标的各个端点距离,从所述各个端点距离中确定目标端点距离,将所述目标端点距离作为线距离。
8.根据权利要求1所述的方法,其特征在于,所述根据所述第一距离与所述第一距离对应的地理要素类型,确定所述兴趣点与各个第一地理要素之间的位置冲突特征,包括:
当所述第一距离对应的地理要素类型为面类型时,确定所述第一距离为第一面距离,根据所述第一面距离确定对应的第一地理要素为第一面地理要素;
当所述第一面距离为第一目标面距离时,得到所述兴趣点与所述第一面地理要素之间的位置冲突特征为位置无冲突特征;
当所述第一面距离为第二目标面距离时,得到所述兴趣点与所述第一面地理要素之间的位置冲突特征为位置有冲突特征。
9.根据权利要求1所述的方法,其特征在于,所述将所述位置冲突特征和所述关系冲突特征输入已训练的兴趣点位置识别模型中,得到对所述待识别兴趣点信息的识别结果,包括:
获取所述兴趣点位置文本对应的各个目标行为坐标,根据所述各个目标行为坐标计算目标中心坐标;
计算所述目标中心坐标与所述兴趣点坐标的行为距离,将所述行为距离作为目标位置特征;
将所述目标位置特征,所述位置冲突特征和所述关系冲突特征输入已训练的目标兴趣点位置识别模型中,得到对所述待识别兴趣点信息的识别结果。
10.根据权利要求1所述的方法,其特征在于,根据所述第二距离和所述第二距离对应的第一地理要素名称之间的从属关系,确定所述第一地理要素名称之间的关系冲突特征,包括:
当所述第二距离对应的第一地理要素名称之间的从属关系为第一从属关系时,根据所述第二距离确定初始第一地理要素名称和目标第一地理要素名称,获取所述初始第一地理要素名称对应的初始第一地理要素坐标和所述目标第一地理要素名称对应的目标第一地理要素坐标;
当所述初始第一地理要素坐标中包括所述目标第一地理要素坐标时,得到所述初始第一地理要素名称和所述目标第一地理要素名称之间的关系冲突特征为无冲突特征;
当所述目标第一地理要素坐标中包括所述初始第一地理要素坐标时,得到所述初始第一地理要素名称和所述目标第一地理要素名称之间的关系冲突特征为有冲突特征。
11.根据权利要求1所述的方法,其特征在于,根据所述第二距离和所述第二距离对应的第一地理要素名称之间的从属关系,确定所述第一地理要素名称之间的关系冲突特征,包括:
当所述第二距离对应的第一地理要素名称之间的从属关系为第二从属关系时,根据所述第二距离确定初始第一地理要素名称和目标第一地理要素名称,获取所述初始第一地理要素名称对应的初始第一地理要素坐标和所述目标第一地理要素名称对应的目标第一地理要素坐标;
当所述目标第一地理要素坐标中包括所述初始第一地理要素坐标时,得到所述初始第一地理要素名称和所述目标第一地理要素名称之间的关系冲突特征为无冲突特征;
当所述初始第一地理要素坐标中包括所述目标第一地理要素坐标时,得到所述初始第一地理要素名称和所述目标第一地理要素名称之间的关系冲突特征为有冲突特征。
12.根据权利要求1所述的方法,其特征在于,所述已训练的兴趣点位置识别模型的生成步骤,包括:
获取历史兴趣点信息和对应的历史兴趣点信息识别结果;
根据所述历史兴趣点信息得到历史位置冲突特征和历史关系冲突特征;
将所述历史位置冲突特征和历史关系冲突特征输入到初始梯度下降树分类模型中,计算得到所述历史兴趣点信息对应的预测结果;
根据所述历史兴趣点信息对应的预测结果与所述历史兴趣点信息对应的历史兴趣点信息识别结果计算得到训练损失值;
根据所述训练损失值不断调整初始梯度下降树分类模型的模型参数,直至满足收敛条件,得到兴趣点位置识别模型。
13.一种兴趣点位置识别装置,其特征在于,所述装置包括:
信息获取模块,用于获取待识别兴趣点信息,所述待识别兴趣点信息包括兴趣点位置文本和兴趣点坐标;
名称提取模块,用于对所述兴趣点位置文本进行语义提取得到各个第一地理要素名称,根据空间位置关系确定所述各个第一地理要素名称之间的从属关系;
坐标获取模块,用于获取所述各个第一地理要素名称对应的第一地理要素坐标;
位置特征确定模块,用于根据兴趣点坐标和各个第一地理要素坐标,确定兴趣点与各个第一地理要素之间的第一距离,根据所述第一距离与所述第一距离对应的地理要素类型,确定所述兴趣点与各个第一地理要素之间的位置冲突特征;
关系特征确定模块,用于根据所述各个第一地理要素坐标计算所述各个第一地理要素之间的第二距离,根据所述第二距离和所述第二距离对应的第一地理要素名称之间的从属关系,确定所述第一地理要素名称之间的关系冲突特征;
识别模块,用于将所述位置冲突特征和所述关系冲突特征输入已训练的兴趣点位置识别模型中,得到对所述待识别兴趣点信息的识别结果。
14.根据权利要求13所述的装置,其特征在于,所述名称提取模块还用于将所述兴趣点位置文本输入到已训练的条件随机场模型中进行地理要素名称识别,得到各个第一地理要素名称;按照所述兴趣点位置文本的序列从所述各个第一地理要素名称中确定初始第一地理要素名称和目标第一地理要素名称;获取所述初始第一地理要素名称和所述目标第一地理要素名称的空间位置关系;当所述初始第一地理要素名称的空间位置包括所述目标第一地理要素名称的空间位置时,所述初始第一地理要素名称和所述目标第一地理要素名称之间的关系为第一从属关系;当所述目标第一地理要素名称的空间位置包括所述初始第一地理要素名称的空间位置时,所述初始第一地理要素名称和所述目标第一地理要素名称之间的关系为第二从属关系。
15.根据权利要求13所述的装置,其特征在于,坐标获取模块还用于获取与所述兴趣点坐标的距离在预设范围内的各个第二地理要素坐标,获取所述第二地理要素坐标对应的第二地理要素名称;将所述第一地理要素名称与所述第二地理要素名称进行文本匹配;当所述第一地理要素名称与所述第二地理要素名称中目标第二地理要素名称匹配时,将所述目标第二地理要素名称对应的目标第二地理要素坐标作为所述第一地理要素名称对应的第一地理要素坐标。
16.根据权利要求15所述的装置,其特征在于,所述坐标获取模块还用于当所述第一地理要素名称与各个第二地理要素名称未匹配时,根据所述第一地理要素名称在预设数据库中查找对应的第一地理要素坐标。
17.根据权利要求13所述的装置,其特征在于,所述位置特征确定模块还用于当所述第一距离对应的地理要素类型为点类型时,确定所述第一距离为第一点距离,根据所述第一点距离确定对应的第一地理要素为第一点地理要素;获取所述点类型的各个点地理要素对应的点地理要素坐标,所述点地理要素坐标与所述兴趣点坐标的距离在预设目标范围内,计算所述兴趣点坐标与各个所述点地理要素坐标对应的各个点距离;从所述各个点距离中获取目标点距离,将所述目标点距离与所述第一点距离进行比较;当所述目标点距离小于所述第一点距离时,得到所述兴趣点与所述第一点地理要素之间的位置冲突特征为位置有冲突特征;当所述目标点距离未小于所述第一点距离时,得到所述兴趣点与所述第一点地理要素之间的位置冲突特征为位置无冲突特征。
18.根据权利要求13所述的装置,其特征在于,所述位置特征确定模块还用于当所述第一距离对应的地理要素类型为线类型时,确定所述第一距离为第一线距离,根据所述第一线距离确定对应的第一地理要素为第一线地理要素;获取所述线类型的各个线地理要素对应的线地理要素坐标,所述线地理要素坐标与所述兴趣点坐标的距离在预设目标范围内,计算所述兴趣点坐标与各个所述线地理要素坐标对应的各个线距离;从所述各个线距离中获取目标线距离,将所述目标线距离与所述第一线距离进行比较;当所述目标线距离小于所述第一线距离时,得到所述兴趣点与所述第一线地理要素之间的位置冲突特征为位置有冲突特征;当所述目标线距离未小于所述第一线距离时,得到所述兴趣点与所述第一线地理要素之间的位置冲突特征为位置无冲突特征。
19.根据权利要求18所述的装置,其特征在于,所述位置特征确定模块还用于根据所述兴趣点坐标与线地理要素坐标计算所述兴趣点与所述线地理要素之间的最短距离;当所述最短距离对应的与所述线地理要素的交点坐标在所述线地理要素坐标中,将所述最短距离作为线距离;当所述最短距离对应的与所述线地理要素的交点坐标未在所述线地理要素坐标中时,获取所述线地理要素坐标中的各个端点坐标,计算所述兴趣点坐标与所述各个端点坐标的各个端点距离,从所述各个端点距离中确定目标端点距离,将所述目标端点距离作为线距离。
20.根据权利要求13所述的装置,其特征在于,所述位置特征确定模块还用于当所述第一距离对应的地理要素类型为面类型时,确定所述第一距离为第一面距离,根据所述第一面距离确定对应的第一地理要素为第一面地理要素;当所述第一面距离为第一目标面距离时,得到所述兴趣点与所述第一面地理要素之间的位置冲突特征为位置无冲突特征;当所述第一面距离为第二目标面距离时,得到所述兴趣点与所述第一面地理要素之间的位置冲突特征为位置有冲突特征。
21.根据权利要求13所述的装置,其特征在于,所述识别模块还用于获取所述兴趣点位置文本对应的各个目标行为坐标,根据所述各个目标行为坐标计算目标中心坐标;计算所述目标中心坐标与所述兴趣点坐标的行为距离,将所述行为距离作为目标位置特征;将所述目标位置特征,所述位置冲突特征和所述关系冲突特征输入已训练的目标兴趣点位置识别模型中,得到对所述待识别兴趣点信息的识别结果。
22.根据权利要求13所述的装置,其特征在于,所述关系特征确定模块还用于当所述第二距离对应的第一地理要素名称之间的从属关系为第一从属关系时,根据所述第二距离确定初始第一地理要素名称和目标第一地理要素名称,获取所述初始第一地理要素名称对应的初始第一地理要素坐标和所述目标第一地理要素名称对应的目标第一地理要素坐标;当所述初始第一地理要素坐标中包括所述目标第一地理要素坐标时,得到所述初始第一地理要素名称和所述目标第一地理要素名称之间的关系冲突特征为无冲突特征;当所述目标第一地理要素坐标中包括所述初始第一地理要素坐标时,得到所述初始第一地理要素名称和所述目标第一地理要素名称之间的关系冲突特征为有冲突特征。
23.根据权利要求13所述的装置,其特征在于,所述关系特征确定模块还用于当所述第二距离对应的第一地理要素名称之间的从属关系为第二从属关系时,根据所述第二距离确定初始第一地理要素名称和目标第一地理要素名称,获取所述初始第一地理要素名称对应的初始第一地理要素坐标和所述目标第一地理要素名称对应的目标第一地理要素坐标;当所述目标第一地理要素坐标中包括所述初始第一地理要素坐标时,得到所述初始第一地理要素名称和所述目标第一地理要素名称之间的关系冲突特征为无冲突特征;当所述初始第一地理要素坐标中包括所述目标第一地理要素坐标时,得到所述初始第一地理要素名称和所述目标第一地理要素名称之间的关系冲突特征为有冲突特征。
24.根据权利要求13所述的装置,其特征在于,所述装置,包括:
模型训练模块,用于获取历史兴趣点信息和对应的历史兴趣点信息识别结果;根据所述历史兴趣点信息得到历史位置冲突特征和历史关系冲突特征;将所述历史位置冲突特征和历史关系冲突特征输入到初始梯度下降树分类模型中,计算得到所述历史兴趣点信息对应的预测结果;根据所述历史兴趣点信息对应的预测结果与所述历史兴趣点信息对应的历史兴趣点信息识别结果计算得到训练损失值;根据所述训练损失值不断调整初始梯度下降树分类模型的模型参数,直至满足收敛条件,得到兴趣点位置识别模型。
25.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至12中任一项所述方法的步骤。
26.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至12中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910745387.6A CN110457420B (zh) | 2019-08-13 | 2019-08-13 | 兴趣点位置识别方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910745387.6A CN110457420B (zh) | 2019-08-13 | 2019-08-13 | 兴趣点位置识别方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110457420A CN110457420A (zh) | 2019-11-15 |
CN110457420B true CN110457420B (zh) | 2024-04-16 |
Family
ID=68486365
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910745387.6A Active CN110457420B (zh) | 2019-08-13 | 2019-08-13 | 兴趣点位置识别方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110457420B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111104611B (zh) * | 2019-11-18 | 2023-01-20 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、装置、设备及存储介质 |
CN111339409A (zh) * | 2020-02-20 | 2020-06-26 | 深圳壹账通智能科技有限公司 | 地图展示方法与系统 |
CN111881225A (zh) * | 2020-04-01 | 2020-11-03 | 北京嘀嘀无限科技发展有限公司 | 一种修正上车点名称的方法和系统 |
CN111737383B (zh) * | 2020-05-21 | 2021-11-23 | 百度在线网络技术(北京)有限公司 | 提取地理位置点空间关系的方法、训练提取模型的方法及装置 |
CN111931072B (zh) * | 2020-10-09 | 2021-01-15 | 深圳市天维大数据技术有限公司 | 点位推荐方法、装置、终端设备及存储介质 |
CN112000495B (zh) * | 2020-10-27 | 2021-02-12 | 博泰车联网(南京)有限公司 | 用于兴趣点信息管理的方法、电子设备和存储介质 |
CN113127759A (zh) * | 2021-04-16 | 2021-07-16 | 深圳集智数字科技有限公司 | 兴趣点处理方法、装置、计算设备及计算机可读存储介质 |
CN113626729B (zh) * | 2021-07-30 | 2024-04-16 | 高德软件有限公司 | 兴趣点信息的确定方法及设备 |
CN113706997B (zh) * | 2021-09-06 | 2023-06-27 | 深圳市指跃未来科技有限公司 | 城乡规划图纸标准化处理方法、装置及电子设备 |
CN115577294B (zh) * | 2022-11-22 | 2023-03-24 | 深圳市规划和自然资源数据管理中心(深圳市空间地理信息中心) | 一种基于兴趣点空间分布和语义信息的城市区域分类方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105005567A (zh) * | 2014-04-21 | 2015-10-28 | 腾讯科技(深圳)有限公司 | 兴趣点查询方法和系统 |
CN107741964A (zh) * | 2017-09-30 | 2018-02-27 | 百度在线网络技术(北京)有限公司 | 一种兴趣点显示方法、装置、设备和介质 |
CN108363698A (zh) * | 2018-03-13 | 2018-08-03 | 腾讯大地通途(北京)科技有限公司 | 兴趣点关系识别方法及装置 |
WO2018177316A1 (zh) * | 2017-03-29 | 2018-10-04 | 腾讯科技(深圳)有限公司 | 信息识别方法、计算设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190242720A1 (en) * | 2018-02-07 | 2019-08-08 | Topos Inc. | Systems and methods for constructing spatial activity zones |
-
2019
- 2019-08-13 CN CN201910745387.6A patent/CN110457420B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105005567A (zh) * | 2014-04-21 | 2015-10-28 | 腾讯科技(深圳)有限公司 | 兴趣点查询方法和系统 |
WO2018177316A1 (zh) * | 2017-03-29 | 2018-10-04 | 腾讯科技(深圳)有限公司 | 信息识别方法、计算设备及存储介质 |
CN107741964A (zh) * | 2017-09-30 | 2018-02-27 | 百度在线网络技术(北京)有限公司 | 一种兴趣点显示方法、装置、设备和介质 |
CN108363698A (zh) * | 2018-03-13 | 2018-08-03 | 腾讯大地通途(北京)科技有限公司 | 兴趣点关系识别方法及装置 |
Non-Patent Citations (1)
Title |
---|
顾及位置关系的网络POI地址信息标准化处理方法;王勇;刘纪平;郭庆胜;罗安;;测绘学报;20160515(第05期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN110457420A (zh) | 2019-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110457420B (zh) | 兴趣点位置识别方法、装置、设备及存储介质 | |
Vargas-Munoz et al. | OpenStreetMap: Challenges and opportunities in machine learning and remote sensing | |
CN108304423B (zh) | 一种信息识别方法及装置 | |
Sun et al. | Aligning geographic entities from historical maps for building knowledge graphs | |
CN111949877B (zh) | 一种个性化兴趣点推荐方法及系统 | |
CN111141301A (zh) | 导航终点确定方法、装置、存储介质和计算机设备 | |
CN112131261B (zh) | 基于社区网络的社区查询方法、装置和计算机设备 | |
CN112364238A (zh) | 一种基于深度学习的用户兴趣点推荐方法与系统 | |
CN112861972A (zh) | 一种展业区域的选址方法、装置、计算机设备和介质 | |
Yang et al. | Detecting interchanges in road networks using a graph convolutional network approach | |
Zhang et al. | An improved probabilistic relaxation method for matching multi-scale road networks | |
CN111368761A (zh) | 店铺营业状态识别方法、装置、可读存储介质和设备 | |
CN111143534A (zh) | 基于人工智能的品牌名的提取方法、装置及存储介质 | |
Lei | Geospatial data conflation: A formal approach based on optimization and relational databases | |
CN112699201B (zh) | 导航数据处理方法、装置、计算机设备和存储介质 | |
US20210270629A1 (en) | Method and apparatus for selecting a path to a destination | |
CN111782955A (zh) | 兴趣点表示和推送方法、装置、电子设备及存储介质 | |
Singh et al. | Intrinsic parameters based quality assessment of Indian OpenStreetMap dataset using supervised learning technique | |
CN111782973A (zh) | 兴趣点状态预测方法、装置、电子设备及存储介质 | |
CN113918802B (zh) | 导航方法、装置、设备、介质及产品 | |
Zhang et al. | Enrichment of topographic road database for the purpose of routing and navigation | |
CN113626729A (zh) | 兴趣点信息的确定方法及设备 | |
CN113175940A (zh) | 数据处理方法、装置、设备和存储介质 | |
CN111797183A (zh) | 挖掘信息点的道路属性的方法、装置及电子设备 | |
CN111858787A (zh) | 一种poi信息获取的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |