CN113535880B - 地理信息确定方法、装置、电子设备及计算机存储介质 - Google Patents

地理信息确定方法、装置、电子设备及计算机存储介质 Download PDF

Info

Publication number
CN113535880B
CN113535880B CN202111084487.2A CN202111084487A CN113535880B CN 113535880 B CN113535880 B CN 113535880B CN 202111084487 A CN202111084487 A CN 202111084487A CN 113535880 B CN113535880 B CN 113535880B
Authority
CN
China
Prior art keywords
address
data
fragments
fragment
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111084487.2A
Other languages
English (en)
Other versions
CN113535880A (zh
Inventor
王潇斌
龙定坤
徐光伟
刘楚
黄申
丁瑞雪
谢朋峻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Damo Institute Hangzhou Technology Co Ltd
Original Assignee
Alibaba Damo Institute Hangzhou Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Damo Institute Hangzhou Technology Co Ltd filed Critical Alibaba Damo Institute Hangzhou Technology Co Ltd
Priority to CN202111084487.2A priority Critical patent/CN113535880B/zh
Publication of CN113535880A publication Critical patent/CN113535880A/zh
Application granted granted Critical
Publication of CN113535880B publication Critical patent/CN113535880B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/909Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Remote Sensing (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例提供了一种地理信息确定方法、装置、电子设备及计算机存储介质,涉及数据处理技术领域。其中,方法包括:获取同一地理区域内多个地址数据;为多个地址数据分别生成多个地址片段,其中部分地址片段为有标签地址片段;为多个地址片段分别生成上下文特征向量;根据多个上下文特征向量,确定多个地址片段之间的上下文相似度;根据有标签地址片段和多个地址片段之间的上下文相似度,得到多个地址数据中无标签地址片段的标签类型。本申请实施例提供的地理信息确定方法成本较低且效率较高。

Description

地理信息确定方法、装置、电子设备及计算机存储介质
技术领域
本申请实施例涉及数据处理技术领域,尤其涉及一种地理信息确定方法、装置、电子设备及计算机存储介质。
背景技术
同一地理区域中通常包含有大量的地名,不同的地名对应的地理信息(如:地名类型)可能并不相同,例如:在杭州市这一地理区域中,对于地名“杭州市”而言,其地名类型为“地市名”,而对于“半道红社区”这一地名而言,其地名类型则为“社区名”。地名及其对应的地理信息是地址解析的重要数据资源,例如,在电商或外卖行业中,可能存在因地址输入不规范导致订单地址无效的情况,此时,可以通过查询用于存储地名及其对应的地理信息的数据库,对输入的地址进行规范化处理以得到有效地址信息,从而避免快递或外卖无法送达的问题。
目前,地地理信息主要依靠人工进行收集和整理,因此,成本较高且效率较低。
发明内容
有鉴于此,本申请实施例提供一种地理信息确定方案,以至少部分解决上述问题。
根据本申请实施例的第一方面,提供了一种地理信息确定方法,包括:
获取同一地理区域内的多个地址数据;
为所述多个地址数据分别生成多个地址片段,其中部分地址片段为有标签地址片段;
为所述多个地址片段分别生成上下文特征向量;
根据多个上下文特征向量,确定多个地址片段之间的上下文相似度;
根据有标签地址片段和多个地址片段之间的上下文相似度,得到所述多个地址数据中无标签地址片段的标签类型。
根据本申请实施例的第二方面,提供了一种地理信息确定装置,包括:
地址数据获取模块,用于获取同一地理区域内的多个地址数据;
地址片段生成模块,用于为所述多个地址数据分别生成多个地址片段,其中部分地址片段为有标签地址片段;
上下文特征向量生成模块,用于为所述多个地址片段分别生成上下文特征向量;
上下文相似度确定模块,用于根据多个上下文特征向量,确定多个地址片段之间的上下文相似度;
标签类型得到模块,用于根据有标签地址片段和多个地址片段之间的上下文相似度,得到所述多个地址数据中无标签地址片段的标签类型。
根据本申请实施例的第三方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如第一方面所述的地理信息确定方法对应的操作。
根据本申请实施例的第四方面,提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面所述的地理信息确定方法。
根据本申请实施例提供的地理信息确定方案,先获取现有的同一地理区域内的多个地址数据,并为多个地址数据分别生成多个地址片段,再从地址片段与地址片段所属地址数据中其它数据的上下文关系角度出发,计算得到各地址片段间的上下文相似度,进而基于上述地址片段中的有标签地址片段及各地址片段间的上下文相似度,得到地址片段中无标签地址片段的标签类型。本申请实施例的上述过程,无需人工参与,即可自动得到地名对应的地理信息:地名类型,因此,成本较低且效率较高。另外,由于本申请实施例是基于各地址片段间的上下文特征向量进行特征推理分析,从而得到各地址片段的地理信息的,因此,确定出的地理信息准确度也较高。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1为根据本申请实施例一的一种地理信息确定方法的步骤流程图;
图2为标签传播算法所基于的连通图示意图;
图3为图1所示实施例中的一种场景示例的示意图;
图4为根据本申请实施例二的一种地理信息确定方法的步骤流程图;
图5为根据本申请实施例三的一种地理信息确定装置的结构框图;
图6为根据本申请实施例四的一种电子设备的结构示意图。
具体实施方式
为了使本领域的人员更好地理解本申请实施例中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请实施例一部分实施例,而不是全部的实施例。基于本申请实施例中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本申请实施例保护的范围。
下面结合本申请实施例附图进一步说明本申请实施例具体实现。
实施例一、
参照图1,图1为根据本申请实施例一的一种地理信息确定方法的步骤流程图。具体地,本实施例提供的地理信息确定方法包括以下步骤:
步骤102,获取同一地理区域内的多个地址数据。
本步骤中的地理区域可以根据实际需求来确定,例如,当要确定某个省份内各地名对应的地理信息(地名类型)时,则可以将该省份设定为该地理区域;当要确定某个城市内各地名对应的地理信息时,则可以将该城市确定为该地理区域;当要确定某城市的某个区县内各地名对应的地理信息时,则可以将该区县确定为该地理区域,等等。
上述多个地址数据可以采用任意适当方式获取,例如从现有的地址数据库中获取等,本申请实施例对此不作限制。
步骤104,为多个地址数据分别生成多个地址片段,其中部分地址片段为有标签地址片段。
由于一个完整的地址数据中通常包括多个地名,例如:对于地址数据“拱墅区湖墅路半道红社区”,其中,包括多个地名,分别为:“拱墅区”、“湖墅路”以及“半道红社区”。因此,在获取到多个地址数据之后,可以为上述多个地址数据分别生成多个地址片段。
在生成的多个地址片段中,有些地址片段是与已知地名类型的标准地名相匹配的,将这些地址片段作为有标签地址片段,这样,可以根据上述标准地名,得到这些标签地址片段的地名类型。具体地:可以借助包含有标准地名及其对应的地名类型的数据库,如:地图数据库等,当某个地址片段与数据库中的某个标准地名相同时,则可以将该标准地名的地名类型确定为该地址片段的地名类型。例如:对于地址片段“半道红社区”,若在某地图数据库中,存在标准地名“半道红社区”,并且,该标准地名的地名类型为“社区”,则可以确定地址片段“半道红社区”为有标签地址片段,其地名类型为“社区”,进而后续针对每个地址片段分别确定其对应的地名类型。
步骤106,为多个地址片段分别生成上下文特征向量。
具体地,针对每个地址片段,可以生成一个上下文特征向量,其中,地址片段的上下文特征向量用于表征地址片段与该地址片段所属的地址数据中的其它数据的上下文关系。
例如,针对每个地址片段而言,可以基于该地址片段所属地址数据中其它数据所包含的字符内容,确定该地址片段对应的上下文特征向量,具体地:例如:可以预先构建包含预设数量个字符的字符表,然后将上下文特征向量的维度设定为上述预设数量,并且,上下文特征向量中的每个元素对应于字符表中的一个字符,之后,可以根据元素对应的字符是否在地址片段所属地址数据中的其它数据中出现,来设定该元素的具体元素值。
又如,还可以同时基于该地址片段所属地址数据中其它数据所包含的字符内容,以及,该地址片段与上述其它数据中各字符与该地址片段之间的位置关系(如:间隔的字符数量等等),确定该地址片段对应的上下文特征向量,具体地:例如:可以预先构建包含预设数量个字符的字符表,然后将上下文特征向量的维度设定为上述预设数量,并且,上下文特征向量中的每个元素对应于字符表中的一个字符,之后,可以根据元素对应的字符是否在地址片段所属地址数据中的其它数据中出现,以及,该字符与该地址片段之间的位置关系来设定该元素的具体元素值,等等。
但不限于此,其它上下文特征向量的具体确定方式也同样适用于本申请实施例的方案。
步骤108,根据多个上下文特征向量,确定多个地址片段之间的上下文相似度。
在得到多个地址片段的上下文特征向量之后,可以计算多个上下文特征向量间的相似度,作为多个地址片段间的上下文相似度。例如:地址片段a的上下文特征向量为A,地址片段b的上下文特征向量为B,则可以将上下文特征向量为A和上下文特征向量为B之间的相似度作为地址片段a和地址片段b间的上下文相似度。
若一个地址片段对应多个地址数据,则可以通过下述方式计算两个地址片段之间的上下文相似度:将该两个地址片段对应的上下文特征向量进行两两组合,得到多个向量对,其中,每个向量对中的两个上下文特征向量分别对应不同的地址片段;针对每个向量对,计算该向量对中的两个上下文特征向量之间的相似度,作为特征向量相似度;基于各特征向量相似度,得到该两个地址片段间的上下文相似度。
本申请实施例中,对基于各特征向量相似度,得到该两个地址片段间的上下文相似度是所采用的具体方式不做限定。如,可以对各特征向量的相似度求取平均值,将该平均值作为该两个地址片段间的上下文相似度等等。
例如:地址片段A和B均对应2个地址数据,地址片段A对应的上下文特征向量为A1和A2,地址片段B对应的上下文特征向量为B1和B2,则可以分别计算向量对A1和B1的相似度C1、A1和B2的相似度C2、A2和B1的相似度C3,以及,A2和B2的相似度C4,再对C1、C2、C3以及C4取平均得到C,并将C作为地址片段A和B间的上下文相似度。
步骤110,根据有标签地址片段和多个地址片段之间的上下文相似度,得到多个地址数据中无标签地址片段的标签类型。
其中,无标签地址片段的标签类型可以为无标签地址片段的地名类型。
对于生成的多个地址片段,其中,部分地址片段为标签已知的有标签地址片段,其余地址片段均为标签未知的无标签地址片段,可以采用标签传播算法,基于各地址片段之间的相似度,将有标签地址片段的标签传递给无标签地址片段,从而得到无标签地址片段的标签类型。
标签传播算法是基于连通图进行的。参见图2,图2为标签传播算法所基于的连通图示意图,在图2中,实线圈表示有标签地址片段,虚线圈表示无标签地址片段,各线圈之间的连线表示地址片段之间的相似度,具体地,可以为地址片段之间的上下文相似度。传播时,是通过地址片段之间的边进行标签传播的,边对应的相似度越大,表示两个地址片段越相似,则标签越易传播。本实施例中,可以采用标签传播算法得到无标签地址片段的标签类型(地名类型)。
参见图3,图3为本申请实施例一对应的场景示意图,以下,将参考图3所示的示意图,以一个具体场景示例,对本申请实施例进行说明:
假设获取杭州市内的多个地址数据(对于地址片段的数量不做限定,图中仅示出了地址数据1和地址数据2,其他地址数据未示出),具体地,地址数据1为:“拱墅半道红小区”,地址数据2为:“萧山区智慧新城”;为上述多个地址数据分别生成多个地址片段,具体地:为地址数据1“拱墅半道红小区”生成的地址片段为:拱墅”、“半道红小区”,并且,地址片段“半道红小区”为有标签地址片段,其地名类型为:小区;为地址数据2“萧山区智慧新城”生成的地址片段为:“萧山区”、“智慧新城”;并且,地址片段“萧山区”为有标签地址片段,其地名类型为:区县;“拱墅”对应的上下文特征向量为M、“半道红小区”对应的上下文特征向量为N、“萧山区”对应的上下文特征向量为P、“智慧新城”对应的上下文特征向量为Q;基于上述多个上下文特征向量,确定出上述多个地址片段间的上下文相似度,其中,“拱墅”与“半道红小区”间的上下文相似度为0;“萧山区”与“智慧新城”间的上下文相似度为0;“拱墅”与“萧山区”间的上下文相似度为1;“半道红小区”与“智慧新城”间的上下文相似度为1;之后,可以根据上述有标签地址片段,以及,上述多个地址片段间的上下文相似度,得到无标签地址片段的标签类型(地名类型),其中,可以得到无标签地址片段“拱墅”的标签类型(地名类型)为:区县、无标签地址片段“智慧新城”的标签类型(地名类型)为:小区。
本申请实施例中,先获取现有的同一地理区域内的多个地址数据,并为多个地址数据分别生成多个地址片段,再从地址片段与地址片段所属地址数据中其它数据的上下文关系角度出发,计算得到各地址片段间的上下文相似度,进而基于上述地址片段中的有标签地址片段及各地址片段间的上下文相似度,得到地址片段中无标签地址片段的标签类型。本申请实施例的上述过程,无需人工参与,即可自动得到地名对应的地理信息:地名类型,因此,成本较低且效率较高。另外,由于本申请实施例是基于各地址片段间的上下文特征向量进行特征推理分析,从而得到各地址片段的地理信息的,因此,确定出的地理信息准确度也较高。
本实施例的地理信息确定方法可以由任意适当的具有数据处理能力的电子设备执行,包括但不限于:服务器、PC机等。
实施例二、
参照图4,图4为根据本申请实施例一的一种地理信息确定方法的步骤流程图。具体地,本实施例提供的地理信息确定方法包括以下步骤:
步骤202,获取同一地理区域内的多个地址数据。
地理区域可以根据实际需求来确定,例如,当要确定某个省份内各地名对应的地理信息(地名类型)时,则可以将该省份设定为该地理区域;当要确定某个城市内各地名对应的地理信息时,则可以将该城市确定为该地理区域;当要确定某城市的某个区县内各地名对应的地理信息时,则可以将该区县确定为该地理区域,等等。
上述多个地址数据可以采用任意适当方式获取,例如从现有的地址数据库中获取等,本申请实施例对此不作限制。
步骤204,按照预设的拆分粒度对第一地址数据中相邻的字符进行拆分,得到多个字符片段。
其中,第一地址数据为步骤202中获取的多个地址数据中的任意一个地址数据。
拆分粒度可以是按照拆分后得到的字符片段中包含的字符数量设定的,本申请实施例中,对于拆分粒度的具体设定不做限定。由于地名包含的字符通常在2个至6个之间,因此,可以分别按照2个字符、3个字符、4个字符、5个字符以及6个字符的拆分粒度对地址数据进行拆分,例如:对于地址数据“半道红新村”,按照2个字符的拆分粒度进行拆分,可以得到的字符片段为:“半道”、“道红”、“红新”以及“新村”;按照3个字符的拆分粒度进行拆分,可以得到的字符片段为:“半道红”、“道红新”以及“红新村”;按照4个字符的拆分粒度进行拆分,可以得到的字符片段为:“半道红新”和“道红新村”;按照5个字符的拆分粒度进行拆分,可以得到的字符片段为“半道红新村”;由于该地址数据共5个字符,因此,最大拆分粒度为5个字符。
可选地,在其中一些实施例中,可以在本步骤执行之前,先对多个地址数据进行结构化处理,得到每个地址数据中的区划数据;对应地,在本步骤中,则可以按照预设的一个或多个拆分粒度,对第一地址数据中除区划数据之外的其他数据进行拆分,得到多个地址片段。例如:对于地址数据“杭州市拱墅区半道红新村”,可以先对其进行结构化处理,得到区划数据为:“省-浙江、市-杭州、区-拱墅”;之后,按照预设的一个或多个拆分粒度,对“半道红新村”进行拆分即可,以得到多个地址片段。
在获取到地址数据之后,先对地址数据进行结构化处理,可以得到其中的区划数据,这样,可以仅对除区划数据之外的其它数据进行拆分,因此,得到的地址片段的数量较少,进而,再针对较少的地址片段进行地理信息的确定,可以有效减少地理信息确定过程所涉及的数据量,进一步提高地理信息确定的效率。
步骤206,针对一个字符片段,统计在多个地址数据中,与该字符片段相邻的字符的种类数;并基于相邻的字符的种类数,确定该字符片段的边界自由度,边界自由度用于表征该字符片段与不同字符组合的自由度。
具体地,针对一个字符片段,可以统计多个地址数据中,与该字符片段左侧相邻的字符的种类数,作为该字符片段的左边界自由度;并且,统计多个地址数据中,与该字符片段右侧相邻的字符的种类数,作为该字符片段的右边界自由度;
将左边界自由度和右边界自由度中的最小值,确定为该字符片段的边界自由度。
步骤208,将各字符片段中,边界自由度大于预设自由度阈值的字符片段确定为第一地址数据的地址片段。
对于某个字符片段而言,在多个地址数据中,与该字符片段相邻的字符的总种类数越多,也即该字符与其他不同字符组合的自由度越高(边界自由度越高),则表明该字符片段为一个地名的可能性越大。例如:就字符片段“半道红”和字符片段“道红”而言,两者均出现在地址数据“拱墅区半道红”、“湖墅路半道红”以及“拱墅半道红”中,但是,与“半道红”相邻的字符的种类数为3(相邻字符分别为:“区”、“路”以及“墅”),而与“道红”相邻的字符的种类数则仅为1(相邻字符为:“半”),因此,与字符片段“道红”相比,“半道红”为一个地名的可能性更大,而字符片段“道红”则可能并非地名,是一个无效的字符片段。
基于上述原因,本申请实施例中,从所有字符片段中选择边界自由度较大(大于预设自由度阈值)的字符片段作为地址片段,以针对选择出的地名可能性较大的地址片段进行后续的地理信息确定,可以提高地理信息确定的效率以及准确性。
在生成的多个地址片段中,有些地址片段是与已知地名类型的标准地名相匹配的,将这些地址片段作为有标签地址片段,这样,可以根据上述标准地名,得到这些标签地址片段的地名类型。具体地:可以借助包含有标准地名及其对应的地名类型的数据库,如:地图数据库等,当某个地址片段与数据库中的某个标准地名相同时,则可以将该标准地名的地名类型确定为该地址片段的地名类型。例如:对于地址片段“半道红社区”,若在某地图数据库中,存在标准地名“半道红社区”,并且,该标准地名的地名类型为“社区”,则可以确定地址片段“半道红社区”为有标签地址片段,其地名类型为“社区”。
步骤210,针对第一地址片段,构建初始上下文特征向量,初始上下文特征向量中的元素与预设字符表中的字符一一对应。
其中,第一地址片段为步骤208中确定的多个地址片段中的任意一个地址片段。
针对每个地址片段,构建的初始上下文特征向量的维度可以等于预设字符表中包含的字符的总数量。
步骤212,基于第一地址片段所对应的地址数据中包含的除第一地址片段之外的其它数据,确定初始上下文特征向量中每个元素的元素值,得到第一地址片段对应的上下文特征向量。
可选地,在其中一些实施例中,可以通过如下方式,确定初始上下文特征向量中每个元素的元素值:
针对初始上下文特征向量中的第一元素,如果与第一元素对应的字符未出现在第一地址片段所对应的的地址数据中包含的除第一地址片段之外的其它数据中时,将第一元素的元素值确定为0;如果与第一元素对应的字符出现在其它数据中时,将第一元素的元素值确定为1。其中,第一元素为初始上下文特征向量中的任意一个元素。
例如:假设预设字符表中包含的字符的总数量为1000,对于地址数据“湖墅路半道红小区”中的地址片段“半道红”,根据步骤210可以针对该地址片段,构建一个1000维的初始上下文特征向量,该向量中各元素的初始元素值可以均设定为0;另外,假设该向量中前5个元素分别对应上述字符表中的字符:“湖”、“墅”、“路”、“小”以及“区”;在本步骤212中,可以按照下述方式对已经构建的初始元素值均为0的1000维初始上下文特征向量中的各元素值进行更新,以得到地址片段对应的上下文特征向量:由于针对初始上下文特征向量中的前5个元素,与其对应的字符均出现在地址片段“半道红”对应的地址数据“湖墅路半道红小区”中包含的除该地址片段之外的其它数据中,而字符表中的其它字符则未出现在上述其它数据中,因此,最终得到的上下文特征向量可以为前5位元素的元素值均为1,其它元素的元素值均为0的向量。
可选地,在另外一些实施例中,还可以通过如下方式,确定初始上下文特征向量中每个元素的元素值:
针对初始上下文特征向量中的第二元素,如果与第二元素对应的字符未出现在该地址片段对应的地址数据中包含的除第一地址片段之外的其它数据中时,将第二元素的元素值确定为0如果与第二元素对应的字符出现在其它数据中时,确定该字符与第一地址片段之间间隔的字符数量,并基于字符数量确定第二元素的元素值。
还以地址数据“湖墅路半道红小区”中的地址片段“半道红”为例,也可以按照下述方式对步骤210中已经构建的初始元素值均为0的1000维初始上下文特征向量中的各元素值进行更新,以得到地址片段对应的上下文特征向量:由于针对初始上下文特征向量中的前5个元素,与其对应的字符均出现在地址片段“半道红”对应的地址数据“湖墅路半道红小区”中包含的除该地址片段之外的其它数据中,并且,由于“湖”与地址片段“半道红”间间隔的字符数量为3,因此,对于初始上下文特征向量中与字符“湖”对应的元素(初始上下文特征向量中的第一位元素),该元素的元素值则可以基于上述字符数量3来确定(如,可将该元素值确定为3,也可确定为1/3,还可以确定为其它由3得到的数值);同样地,由于“墅”与地址片段“半道红”间间隔的字符数量为2,因此,对于初始上下文特征向量中与字符“墅”对应的元素(初始上下文特征向量中的第二位元素),该元素的元素值则可以基于上述字符数量2来确定(如,可将该元素值确定为2,也可确定为1/2,还可以确定为其它由2得到的数值);由于“路”、“小”与地址片段“半道红”间间隔的字符数量均为1,因此,对于初始上下文特征向量中与字符“路”或“小”对应的元素(初始上下文特征向量中的第三位或第四位元素),该元素的元素值则可以基于上述字符数量1来确定(如,可将该元素值确定为1等等);由于“区”与地址片段“半道红”间间隔的字符数量为2(初始上下文特征向量中的第五位元素),因此,对于初始上下文特征向量中与字符“区”对应的元素,该元素的元素值则可以基于上述字符数量2来确定(如,可将该元素值确定为2,也可确定为1/2,还可以确定为其它由2得到的数值);而字符表中的其它字符则未出现在上述其它数据中,因此,最终得到的上下文特征向量中,除前5位元素之外的其它元素的元素值可以均为0。
步骤214,根据多个上下文特征向量,确定多个地址片段之间的上下文相似度。
可选地,在其中一些实施例中,根据多个上下文特征向量,确定多个地址片段之间的上下文相似度,可以包括:针对任意两个地址片段,计算该两个地址片段对应的上下文特征向量之间的相似度,作为该两个地址片段间的上下文相似度。
本申请实施例中,对于计算两个地址片段对应的上下文特征向量之间的相似度时所采用的具体方式不做限定,例如:可以将两个上下文特征向量之间的欧式距离作为两个上下文特征向量之间的相似度,也可以将两个上下文特征向量之间的余弦相似度作为该两个上下文特征向量之间的相似度,等等。
可选地,在其中一些实施例中,若一个地址片段对应多个地址数据,则计算该两个地址片段对应的上下文特征向量之间的相似度,作为该两个地址片段间的上下文相似度,可以包括:
将该两个地址片段对应的上下文特征向量进行两两组合,得到多个向量对,其中,每个向量对中的两个上下文特征向量分别对应不同的地址片段;
针对每个向量对,计算该向量对中的两个上下文特征向量之间的相似度,作为特征向量相似度;
基于各特征向量相似度,得到该两个地址片段间的上下文相似度。
本申请实施例中,对基于各特征向量相似度,得到该两个地址片段间的上下文相似度是所采用的具体方式不做限定。如,可以对各特征向量的相似度求取平均值,将该平均值作为该两个地址片段间的上下文相似度等等。
例如:地址片段A和B均对应2个地址数据,地址片段A对应的上下文特征向量为A1和A2,地址片段B对应的上下文特征向量为B1和B2,则可以分别计算向量对A1和B1的相似度C1、A1和B2的相似度C2、A2和B1的相似度C3,以及,A2和B2的相似度C4,再对C1、C2、C3以及C4取平均得到C,并将C作为地址片段A和B间的上下文相似度。
步骤216,根据有标签地址片段和多个地址片段之间的上下文相似度,得到多个地址数据中无标签地址片段的标签类型。
其中,无标签地址片段的标签类型可以为无标签地址片段的地名类型。
对于生成的地址片段,其中,部分地址片段为标签已知的有标签地址片段,其余地址片段均为标签未知的无标签地址片段,可以采用标签传播算法,基于各地址片段之间的相似度,将有标签地址片段的标签传递给无标签地址片段,从而得到无标签地址片段的标签类型。
本申请实施例中,先获取现有的同一地理区域内的多个地址数据,并为多个地址数据分别生成多个地址片段,再从地址片段与地址片段所属地址数据中其它数据的上下文关系角度出发,计算得到各地址片段间的上下文相似度,进而基于上述地址片段中的有标签地址片段及各地址片段间的上下文相似度,得到地址片段中无标签地址片段的标签类型。本申请实施例的上述过程,无需人工参与,即可自动得到地名对应的地理信息:地名类型,因此,成本较低且效率较高。另外,由于本申请实施例是基于各地址片段间的上下文特征向量进行特征推理分析,从而得到各地址片段的地理信息的,因此,确定出的地理信息准确度也较高。
同时,本申请实施例,基于字符片段的边界自由度,从所有字符片段中排除掉地名可能性较小的地址片段,而选择地名可能性较大的地址片段以对其进行后续的地理信息确定,可以在保证地理信息确定准确性的前提下,减少地理信息确定时所涉及到的地址片段的数量,提高了地理信息确定的效率。
另外,本申请实施例中将地址片段对应的上下文特征向量间的相似度,作为地址片段间的上下文相似度,由于上下文特征向量能够表征地址片段与该地址片段对应的地址数据中的其它数据间的上下文关系,进而将上下文特征向量间的相似度(地址片段间的上下文相似度)作为地址片段间关联强度,进行标签传播,更有利于使得具有相同上下文关系的地址片段的标签保持一致,进一步地提高地理信息确定的准确性。
本实施例的地理信息确定方法可以由任意适当的具有数据处理能力的电子设备执行,包括但不限于:服务器、PC机等。
实施例三、
参见图5,图5为根据本申请实施例三的一种地理信息确定装置的结构框图。本申请实施例提供的地理信息确定装置包括:
地址数据获取模块302,用于获取同一地理区域内的多个地址数据;
地址片段生成模块304,用于为多个地址数据分别生成多个地址片段,其中部分地址片段为有标签地址片段;
上下文特征向量生成模块306,用于为多个地址片段分别生成上下文特征向量;
上下文相似度确定模块308,用于根据多个上下文特征向量,确定多个地址片段之间的上下文相似度;
标签类型得到模块310,用于根据有标签地址片段和多个地址片段之间的上下文相似度,得到多个地址数据中无标签地址片段的标签类型。
可选地,在其中一些实施例中,地址片段生成模块304具体用于:
按照预设的拆分粒度对第一地址数据中相邻的字符进行拆分,得到多个字符片段;针对一个字符片段,统计在多个地址数据中,与该字符片段相邻的字符的种类数;并基于相邻的字符的种类数,确定该字符片段的边界自由度,边界自由度用于表征该字符片段与不同字符组合的自由度;将各字符片段中,边界自由度大于预设自由度阈值的字符片段确定为第一地址数据的地址片段。
可选地,在其中一些实施例中,地址片段生成模块304在执行统计在多个地址数据中,与该字符片段相邻的字符的种类数;并基于相邻的字符的种类数,确定该字符片段的边界自由度的步骤时,具体用于:
统计在多个地址数据中,与该字符片段左侧相邻的字符的种类数,作为该字符片段的左边界自由度;统计在多个地址数据中,与该字符片段右侧相邻的字符的种类数,作为该字符片段的右边界自由度;将左边界自由度和右边界自由度中的最小值,确定为该字符片段的边界自由度。
可选地,在其中一些实施例中,上下文特征向量生成模块306在执行为多个地址片段分别生成上下文特征向量的步骤时,具体用于:
针对第一地址片段,构建初始上下文特征向量,初始上下文特征向量中的元素与预设字符表中的字符一一对应;基于第一地址片段所对应的地址数据中包含的除第一地址片段之外的其它数据,确定初始上下文特征向量中每个元素的元素值,得到第一地址片段对应的上下文特征向量。
可选地,在其中一些实施例中,上下文特征向量生成模块306在执行基于第一地址片段所对应的地址数据中包含的除第一地址片段之外的其它数据,确定初始上下文特征向量中每个元素的元素值的步骤时,具体用于:
针对初始上下文特征向量中的第一元素,如果与第一元素对应的字符未出现在第一地址片段所对应的地址数据中包含的除第一地址片段之外的其它数据中时,将第一元素的元素值确定为0;如果与第一元素对应的字符出现在其它数据中时,将第一元素的元素值确定为1。
可选地,在其中一些实施例中,上下文特征向量生成模块306在执行基于第一地址片段所对应的地址数据中包含的除第一地址片段之外的其它数据,确定初始上下文特征向量中每个元素的元素值的步骤时,具体用于:
针对初始上下文特征向量中的第二元素,如果与第二元素对应的字符未出现在第一地址片段所对应的地址数据中包含的除第一地址片段之外的其它数据中时,将第二元素的元素值确定为0;如果与第二元素对应的字符出现在其它数据中,确定第二元素对应的字符与第一地址片段之间间隔的字符数量,并基于字符数量确定第二元素的元素值。
可选地,在其中一些实施例中,上下文相似度确定模块308在执行根据多个上下文特征向量,确定多个地址片段之间的上下文相似度的步骤时,具体用于:
针对任意两个地址片段,计算该两个地址片段对应的上下文特征向量之间的相似度,作为该两个地址片段间的上下文相似度。
可选地,在其中一些实施例中,地理信息确定装置还包括:
结构化处理模块,用于在按照预设的拆分粒度对第一地址数据中相邻的字符进行拆分,得到多个字符片段之前,对多个地址数据进行结构化处理,得到每个地址数据中的区划数据;
地址片段生成模块304在执行按照预设的拆分粒度对第一地址数据中相邻的字符进行拆分,得到多个字符片段的步骤时,具体用于:
按照预设的一个或多个拆分粒度,对第一地址数据中除区划数据之外的其它数据进行拆分,得到多个字符片段。
可选地,在其中一些实施例中,若一个地址片段对应多个地址数据,上下文相似度确定模块308在执行计算该两个地址片段对应的上下文特征向量之间的相似度,作为该两个地址片段间的上下文相似度的步骤时,具体用于:
将该两个地址片段对应的上下文特征向量进行两两组合,得到多个向量对,其中,每个向量对中的两个上下文特征向量分别对应不同的地址片段;针对每个向量对,计算该向量对中的两个上下文特征向量之间的相似度,作为特征向量相似度;基于各特征向量相似度,得到该两个地址片段间的上下文相似度。
本实施例的地理信息确定装置用于实现前述多个方法实施例中相应的地理信息确定方法,并具有相应的方法实施例的有益效果,在此不再赘述。此外,本实施例的地理信息确定装置中的各个模块的功能实现均可参照前述方法实施例中的相应部分的描述,在此亦不再赘述。
实施例四、
参照图6,示出了根据本申请实施例四的一种电子设备的结构示意图,本申请具体实施例并不对电子设备的具体实现做限定。
如图6所示,该电子设备可以包括:处理器(processor)402、通信接口(Communications Interface)404、存储器(memory)406、以及通信总线408。
其中:
处理器402、通信接口404、以及存储器406通过通信总线408完成相互间的通信。
通信接口404,用于与其它电子设备或服务器进行通信。
处理器402,用于执行程序410,具体可以执行上述地理信息确定方法实施例中的相关步骤。
具体地,程序410可以包括程序代码,该程序代码包括计算机操作指令。
处理器402可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本申请实施例的一个或多个集成电路。智能设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器406,用于存放程序410。存储器406可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序410具体可以用于使得处理器402执行以下操作:获取同一地理区域内的多个地址数据;为多个地址数据分别生成多个地址片段,其中部分地址片段为有标签地址片段;为多个地址片段分别生成上下文特征向量;根据多个上下文特征向量,确定多个地址片段之间的上下文相似度;根据有标签地址片段和多个地址片段之间的上下文相似度,得到多个地址数据中无标签地址片段的标签类型。
程序410中各步骤的具体实现可以参见上述地理信息确定方法实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。
通过本实施例的电子设备,先获取现有的同一地理区域内的多个地址数据,并为多个地址数据分别生成多个地址片段,再从地址片段与地址片段所属地址数据中其它数据的上下文关系角度出发,计算得到各地址片段间的上下文相似度,进而基于上述地址片段中的有标签地址片段及各地址片段间的上下文相似度,得到地址片段中无标签地址片段的标签类型。本申请实施例的上述过程,无需人工参与,即可自动得到地名对应的地理信息:地名类型,因此,成本较低且效率较高。另外,由于本申请实施例是基于各地址片段间的上下文特征向量进行特征推理分析,从而得到各地址片段的地理信息的,因此,确定出的地理信息准确度也较高。
本申请实施例还提供了一种计算机程序产品,包括计算机指令,该计算机指令指示计算设备执行上述多个方法实施例中的任一地理信息确定方法对应的操作。
需要指出,根据实施的需要,可将本申请实施例中描述的各个部件/步骤拆分为更多部件/步骤,也可将两个或多个部件/步骤或者部件/步骤的部分操作组合成新的部件/步骤,以实现本申请实施例的目的。
上述根据本申请实施例的方法可在硬件、固件中实现,或者被实现为可存储在记录介质(诸如CD ROM、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码,或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如,RAM、ROM、闪存等),当软件或计算机代码被计算机、处理器或硬件访问且执行时,实现在此描述的地理信息确定方法。此外,当通用计算机访问用于实现在此示出的地理信息确定方法的代码时,代码的执行将通用计算机转换为用于执行在此示出的地理信息确定方法的专用计算机。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请实施例的范围。
以上实施方式仅用于说明本申请实施例,而并非对本申请实施例的限制,有关技术领域的普通技术人员,在不脱离本申请实施例的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本申请实施例的范畴,本申请实施例的专利保护范围应由权利要求限定。

Claims (12)

1.一种地理信息确定方法,包括:
获取同一地理区域内的多个地址数据;
为所述多个地址数据分别生成多个地址片段,其中部分地址片段为有标签地址片段;
为所述多个地址片段分别生成上下文特征向量;
根据多个上下文特征向量,确定多个地址片段之间的上下文相似度;
根据有标签地址片段和多个地址片段之间的上下文相似度,得到所述多个地址数据中无标签地址片段的标签类型;
其中,所述为所述多个地址片段分别生成上下文特征向量,包括:
基于各地址片段所属地址数据中其它数据所包含的字符内容,确定各地址片段对应的上下文特征向量。
2.根据权利要求1所述的方法,其中,所述为所述多个地址数据分别生成多个地址片段,包括:
按照预设的拆分粒度对第一地址数据中相邻的字符进行拆分,得到多个字符片段;
针对一个字符片段,统计在所述多个地址数据中,与该字符片段相邻的字符的种类数;并基于所述相邻的字符的种类数,确定该字符片段的边界自由度,所述边界自由度用于表征该字符片段与不同字符组合的自由度;
将各字符片段中,所述边界自由度大于预设自由度阈值的字符片段确定为所述第一地址数据的地址片段。
3.根据权利要求2所述的方法,其中,所述统计在所述多个地址数据中,与该字符片段相邻的字符的种类数;并基于所述相邻的字符的种类数,确定该字符片段的边界自由度,包括:
统计在所述多个地址数据中,与该字符片段左侧相邻的字符的种类数,作为该字符片段的左边界自由度;
统计在所述多个地址数据中,与该字符片段右侧相邻的字符的种类数,作为该字符片段的右边界自由度;
将所述左边界自由度和所述右边界自由度中的最小值,确定为该字符片段的边界自由度。
4.根据权利要求1-3任一所述的方法,其中,所述为所述多个地址片段分别生成上下文特征向量,包括:
针对第一地址片段,构建初始上下文特征向量,所述初始上下文特征向量中的元素与预设字符表中的字符一一对应;
基于所述第一地址片段所对应的地址数据中包含的除第一地址片段之外的其它数据,确定所述初始上下文特征向量中每个元素的元素值,得到所述第一地址片段对应的上下文特征向量。
5.根据权利要求4所述的方法,其中,所述基于所述第一地址片段所对应的地址数据中包含的除第一地址片段之外的其它数据,确定所述初始上下文特征向量中每个元素的元素值,包括:
针对所述初始上下文特征向量中的第一元素,如果与所述第一元素对应的字符未出现在所述第一地址片段所对应的地址数据中包含的除第一地址片段之外的其它数据中,将所述第一元素的元素值确定为0;
如果与所述第一元素对应的字符出现在所述其它数据中,将所述第一元素的元素值确定为1。
6.根据权利要求4所述的方法,其中,所述基于所述第一地址片段所对应的地址数据中包含的除第一地址片段之外的其它数据,确定所述初始上下文特征向量中每个元素的元素值,包括:
针对所述初始上下文特征向量中的第二元素,如果与所述第二元素对应的字符未出现在所述第一地址片段所对应的地址数据中包含的除第一地址片段之外的其它数据中时,将所述第二元素的元素值确定为0;
如果与所述第二元素对应的字符出现在所述其它数据中,确定所述第二元素对应的字符与所述第一地址片段之间间隔的字符数量,并基于所述字符数量确定所述第二元素的元素值。
7.根据权利要求1-3任一所述的方法,其中,所述根据多个上下文特征向量,确定多个地址片段之间的上下文相似度,包括:
针对任意两个所述地址片段,计算该两个地址片段对应的上下文特征向量之间的相似度,作为该两个地址片段间的上下文相似度。
8.根据权利要求2所述的方法,其中,在所述按照预设的拆分粒度对第一地址数据中相邻的字符进行拆分,得到多个字符片段之前,所述方法还包括:
对所述多个地址数据进行结构化处理,得到每个地址数据中的区划数据;
所述按照预设的拆分粒度对第一地址数据中相邻的字符进行拆分,得到多个字符片段,包括:
按照预设的一个或多个拆分粒度,对第一地址数据中除所述区划数据之外的其它数据进行拆分,得到多个字符片段。
9.根据权利要求7所述的方法,其中,若一个地址片段对应多个地址数据,所述计算该两个地址片段对应的上下文特征向量之间的相似度,作为该两个地址片段间的上下文相似度,包括:
将该两个地址片段对应的上下文特征向量进行两两组合,得到多个向量对,其中,每个向量对中的两个上下文特征向量分别对应不同的地址片段;
针对每个向量对,计算该向量对中的两个上下文特征向量之间的相似度,作为特征向量相似度;
基于各所述特征向量相似度,得到该两个地址片段间的上下文相似度。
10.一种地理信息确定装置,包括:
地址数据获取模块,用于获取同一地理区域内的多个地址数据;
地址片段生成模块,用于为所述多个地址数据分别生成多个地址片段,其中部分地址片段为有标签地址片段;
上下文特征向量生成模块,用于为所述多个地址片段分别生成上下文特征向量;
上下文相似度确定模块,用于根据多个上下文特征向量,确定多个地址片段之间的上下文相似度;
标签类型得到模块,用于根据有标签地址片段和多个地址片段之间的上下文相似度,得到所述多个地址数据中无标签地址片段的标签类型;
其中,所述上下文特征向量生成模块,具体用于基于各地址片段所属地址数据中其它数据所包含的字符内容,确定各地址片段对应的上下文特征向量。
11.一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-9中任一项所述的地理信息确定方法对应的操作。
12.一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如权利要求1-9中任一所述的地理信息确定方法。
CN202111084487.2A 2021-09-16 2021-09-16 地理信息确定方法、装置、电子设备及计算机存储介质 Active CN113535880B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111084487.2A CN113535880B (zh) 2021-09-16 2021-09-16 地理信息确定方法、装置、电子设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111084487.2A CN113535880B (zh) 2021-09-16 2021-09-16 地理信息确定方法、装置、电子设备及计算机存储介质

Publications (2)

Publication Number Publication Date
CN113535880A CN113535880A (zh) 2021-10-22
CN113535880B true CN113535880B (zh) 2022-02-25

Family

ID=78092705

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111084487.2A Active CN113535880B (zh) 2021-09-16 2021-09-16 地理信息确定方法、装置、电子设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN113535880B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108171529A (zh) * 2017-12-04 2018-06-15 昆明理工大学 一种地址相似度评估方法
CN108920457A (zh) * 2018-06-15 2018-11-30 腾讯大地通途(北京)科技有限公司 地址识别方法和装置及存储介质
CN111190988A (zh) * 2019-12-31 2020-05-22 京东城市(北京)数字科技有限公司 地址解析方法、装置、设备及计算机可读存储介质
CN111414357A (zh) * 2019-01-07 2020-07-14 阿里巴巴集团控股有限公司 地址数据处理方法、装置、系统和存储介质
CN111460054A (zh) * 2019-01-21 2020-07-28 阿里巴巴集团控股有限公司 地址数据处理方法及装置、设备和存储介质
CN112633003A (zh) * 2020-12-30 2021-04-09 平安科技(深圳)有限公司 一种地址识别方法、装置、计算机设备及存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8769584B2 (en) * 2009-05-29 2014-07-01 TVI Interactive Systems, Inc. Methods for displaying contextually targeted content on a connected television
US20240070157A1 (en) * 2019-10-05 2024-02-29 Liveramp, Inc. System and Method for Email Address Selection
CN111310456B (zh) * 2020-02-13 2023-06-20 支付宝(杭州)信息技术有限公司 一种实体名称匹配方法、装置及设备
CN111460327B (zh) * 2020-03-10 2023-06-16 口口相传(北京)网络技术有限公司 兴趣地搜索方法及装置、存储介质、计算机设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108171529A (zh) * 2017-12-04 2018-06-15 昆明理工大学 一种地址相似度评估方法
CN108920457A (zh) * 2018-06-15 2018-11-30 腾讯大地通途(北京)科技有限公司 地址识别方法和装置及存储介质
CN111414357A (zh) * 2019-01-07 2020-07-14 阿里巴巴集团控股有限公司 地址数据处理方法、装置、系统和存储介质
CN111460054A (zh) * 2019-01-21 2020-07-28 阿里巴巴集团控股有限公司 地址数据处理方法及装置、设备和存储介质
CN111190988A (zh) * 2019-12-31 2020-05-22 京东城市(北京)数字科技有限公司 地址解析方法、装置、设备及计算机可读存储介质
CN112633003A (zh) * 2020-12-30 2021-04-09 平安科技(深圳)有限公司 一种地址识别方法、装置、计算机设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于BERT-BiLSTM-CRF的中文地址解析方法;吴恪涵等;《地理与地理信息科学》;20210731;第37卷(第4期);第10-15页 *

Also Published As

Publication number Publication date
CN113535880A (zh) 2021-10-22

Similar Documents

Publication Publication Date Title
CN110895651B (zh) 地址标准化处理方法、装置、设备及计算机可读存储介质
CN108959370B (zh) 一种基于知识图谱中实体相似度的社区发现方法及装置
CN106325756B (zh) 一种数据存储、数据计算方法和设备
CN115577858B (zh) 基于区块链的碳排放量预测方法、装置及电子设备
CN110457704B (zh) 目标字段的确定方法、装置、存储介质及电子装置
CN112800197A (zh) 一种目标故障信息的确定方法和装置
CN111260220A (zh) 群控设备识别方法、装置、电子设备和存储介质
CN111159577B (zh) 一种社群划分方法、装置、存储介质及电子装置
CN106802958A (zh) Cad数据到gis数据的转换方法及系统
CN113535880B (zh) 地理信息确定方法、装置、电子设备及计算机存储介质
CN117390480A (zh) 一种信息提取方法、装置、设备及存储介质
CN110597248A (zh) 园区无人智慧巡检方法、装置、设备及存储介质
CN112487122B (zh) 地址归一化处理方法及装置
CN116050159A (zh) 一种仿真场景集生成方法、装置、设备及介质
CN110895582A (zh) 一种数据处理的方法和设备
CN114756365A (zh) 算力资源的标识方法、装置及计算机可读存储介质
CN114781517A (zh) 风险识别的方法、装置及终端设备
CN110188274B (zh) 搜索纠错方法及装置
CN114691691A (zh) 基于Geohash的空间数据处理方法、装置及电子设备
CN114579311A (zh) 执行分布式计算任务的方法、装置、设备以及存储介质
CN111291019B (zh) 数据模型的相似判别方法及装置
CN112016466A (zh) 人脸识别方法、系统、电子设备和计算机存储介质
CN112287005A (zh) 一种数据处理方法、装置、服务器及介质
CN112948246B (zh) 数据平台的ab测试控制方法、装置、设备及存储介质
CN117729176B (zh) 基于网络地址和响应体的应用程序接口聚合方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant