CN105630807A - 一种未知道路与已知道路关联关系的分析方法和装置 - Google Patents
一种未知道路与已知道路关联关系的分析方法和装置 Download PDFInfo
- Publication number
- CN105630807A CN105630807A CN201410602641.4A CN201410602641A CN105630807A CN 105630807 A CN105630807 A CN 105630807A CN 201410602641 A CN201410602641 A CN 201410602641A CN 105630807 A CN105630807 A CN 105630807A
- Authority
- CN
- China
- Prior art keywords
- road
- unknown
- interest
- point
- association
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Traffic Control Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开了一种未知道路与已知道路关联关系的分析方法及装置。其中,该方法包括:获取运单数据集合;根据所述运单数据集合中各条运单数据的地址信息及预置的道路数据库,得到已知道路集合和未知道路集合;针对未知道路集合中的未知道路,将未知道路关联的兴趣点与已知道路集合中已知道路关联的兴趣点进行匹配,选择兴趣点匹配度最高的已知道路作为未知道路的关联道路。本发明实施例利用关键字匹配程度分析未知道路与已知道路的关联关系,能够提高地址信息中道路识别的准确度,为其他以道路信息为依据的业务打好基础,为用户提供便利。
Description
技术领域
本发明涉及地理信息技术领域,特别是涉及一种未知道路与已知道路关联关系的分析方法和装置。
背景技术
目前有许多领域需要用到地址信息,如果地址信息有误,将直接影响业务质量。比如在电子商务领域用户购买货物时,需要在订单中填写订单地址,如果订单地址填写有误,将会导致货物无法及时送达至用户。
发明人在对现有地址信息进行分析的过程中发现,地址信息中的省市等区域信息一般不易出错,最容易出错的是地址信息中的道路信息。现有技术采用如下方法分析地址信息中的道路与预置的道路数据库中道路(也就是已知道路)的关联关系:
对地址信息进行分级,得到区域信息和道路名称;将所述道路名称与预置的道路数据库中所述区域内的已知道路的名称或者名称的拼音进行匹配,如果匹配不到名称或名称的拼音一致的道路,则认为该道路是未知道路,否则,建立地址中的道路与已知道路的关联关系。
现有技术中的分析方法基于现有的道路数据库仅能够识别出与已知道路的名称属于同音错别字的未知道路,并将该未知道路与已知道路关联起来;但针对地址中与已知道路的名称相比存在多字、少字、别名、颠倒字词的道路,现有技术无法正确分析出其与已知道路的关系,而是将其当作未知道路,从而使大量的地址信息中的道路无法被识别,严重影响具体业务的实施。
发明内容
为了解决上述技术问题,本发明实施例提供了一种未知道路与已知道路关联关系的分析方法和装置,能够提高地址中道路识别的准确度,为其他以道路信息为依据的业务打好基础,为用户提供便利。
本发明实施例公开了如下技术方案:
第一方面,本发明实施例公开了一种未知道路与已知道路关联关系的分析方法,包括:
获取运单数据集合;
根据所述运单数据集合中各条运单数据的地址信息及预置的道路数据库,得到已知道路集合和未知道路集合;
针对未知道路集合中的未知道路,将未知道路关联的兴趣点与已知道路集合中已知道路关联的兴趣点进行匹配,选择兴趣点匹配度最高的已知道路作为未知道路的关联道路。
优选的,所述针对未知道路集合中的未知道路,将未知道路关联的兴趣点与已知道路集合中已知道路关联的兴趣点进行匹配,选择兴趣点匹配度最高的已知道路作为未知道路的关联道路具体包括:
针对未知道路集合中的未知道路,将未知道路关联的兴趣点与已知道路集合中已知道路关联的兴趣点进行匹配;
选择与该未知道路关联的兴趣点匹配的兴趣点的数目最多的已知道路作为所述未知道路的关联道路。
优选的,所述针对未知道路集合中的未知道路,将未知道路关联的兴趣点与已知道路集合中已知道路关联的兴趣点进行匹配,选择兴趣点匹配度最高的已知道路作为未知道路的关联道路具体包括:
针对未知道路集合中的未知道路,将未知道路关联的兴趣点与已知道路集合中已知道路关联的兴趣点进行匹配;
按照与该未知道路匹配的兴趣点的数目由高到低的顺序,选择预设个数的已知道路作为该未知道路的待关联已知道路;
根据所述匹配的兴趣点的数目和待关联已知道路关联的兴趣点的个数,得到该未知道路与各待关联已知道路之间的匹配度;
选择匹配度最高的待关联已知道路作为所述未知道路的关联道路。
优选的,所述方法还包括:
判断未知道路的名称与该未知道路关联的已知道路名称的长度是否相同;
如果长度相同,则判断两者名称的文字及其顺序是否相同,如果有一字不同,标记所述未知道路为关联的已知道路的错别字道路;如果文字完全相同但文字顺序不完全相同,则标记所述未知道路为关联的已知道路的文字顺序颠倒道路;如果多个字不相同,查看两者名称是否存在于同一个地址信息中,如果是,标记所述未知道路为关联道路的临近道路;如果否,判断两者的兴趣点匹配度是否大于预置的匹配度阈值,如果是,标记所述未知道路为关联道路的别名道路;
如果长度不相同,判断两者名称的文字是否多一字或者少一字且其他文字完全相同,如果是,则标记所述未知道路为关联的已知道路的多字或少字道路;如果否,查看两者名称是否存在于同一个地址信息中,如果是,标记所述未知道路为关联的已知道路的临近道路;如果否,判断两者的兴趣点匹配度是否大于预置的匹配度阈值,如果是,标记所述未知道路为关联的已知道路的别名道路。
优选的,所述针对未知道路集合中的未知道路,将未知道路关联的兴趣点与已知道路集合中已知道路关联的兴趣点进行匹配具体为:
针对未知道路集合中关联的兴趣点的数目大于等于第一阈值的未知道路,将其关联的兴趣点与已知道路集合中关联的兴趣点的数目大于等于第二阈值的已知道路的兴趣点进行匹配。
优选的,所述根据所述匹配的兴趣点的数目和待关联已知道路关联的兴趣点的个数,得到该未知道路与各待关联已知道路之间的匹配度具体为:
根据所述匹配的兴趣点的数目和待关联已知道路关联的兴趣点的个数,计算所述匹配的兴趣点的数目与待关联已知道路关联的兴趣点的个数的比值,将该比值作为未知道路与待关联已知道路的匹配度。
优选的,所述根据所述运单数据集合中各条运单数据的地址信息及预置的道路数据库,得到已知道路集合和未知道路集合具体包括:
将所述运单数据集合中各条运单数据的地址信息进行分级,得到各条地址信息的区域信息和道路名称;
将各条地址信息的道路名称与预置的道路数据库中对应区域内的已知道路的名称或者名称的拼音进行匹配,得到已知道路和未知道路;
将所有已知道路中相同的已知道路及其关联的兴趣点进行合并,将合并处理后得到的所有已知道路及其关联兴趣点构成已知道路集合;
将所有未知道路中相同的未知道路及其关联的兴趣点进行合并,将合并处理后得到的所有未知道路及其关联兴趣点构成未知道路集合。
第二方面,本发明实施例公开了一种未知道路与已知道路关联关系的分析装置,包括:
获取单元,用于获取运单数据集合;
分类单元,用于根据所述运单数据集合中各条运单数据的地址信息及预置的道路数据库,得到已知道路集合和未知道路集合;
匹配选择单元,用于针对未知道路集合中的未知道路,将未知道路关联的兴趣点与已知道路集合中已知道路关联的兴趣点进行匹配,选择兴趣点匹配度最高的已知道路作为未知道路的关联道路。
优选的,所述匹配选择单元具体包括:
匹配子单元,用于针对未知道路集合中的未知道路,将未知道路关联的兴趣点与已知道路集合中已知道路关联的兴趣点进行匹配;
第一选择子单元,用于选择与该未知道路关联的兴趣点匹配的兴趣点的数目最多的已知道路作为所述未知道路的关联道路。
优选的,所述匹配选择单元具体包括:
匹配子单元,用于针对未知道路集合中的未知道路,将未知道路关联的兴趣点与已知道路集合中已知道路关联的兴趣点进行匹配;
第二选择子单元,用于按照与该未知道路匹配的兴趣点的数目由高到低的顺序,选择预设个数的已知道路作为该未知道路的待关联已知道路;
计算子单元,用于根据所述匹配的兴趣点的数目和待关联已知道路关联的兴趣点的个数,得到该未知道路与各待关联已知道路之间的匹配度;
第三选择子单元,用于选择匹配度最高的待关联已知道路作为所述未知道路的关联道路。
优选的,所述装置还包括:
第一判断单元,用于判断未知道路的名称与该未知道路关联的已知道路名称的长度是否相同;
第二判断单元,用于当第一判断单元判断结果为长度相同时,判断两者名称的文字及其顺序是否相同,如果有一字不同,标记所述未知道路为关联的已知道路的错别字道路;如果文字完全相同但文字顺序不完全相同,则标记所述未知道路为关联的已知道路的文字顺序颠倒道路;如果多个字不相同,查看两者名称是否存在于同一个地址信息中,如果是,标记所述未知道路为关联道路的临近道路;如果否,判断两者的兴趣点匹配度是否大于预置的匹配度阈值,如果是,标记所述未知道路为关联道路的别名道路;
第三判断单元,用于当第一判断单元判断结果为长度不相同时,判断两者名称的文字是否多一字或者少一字且其他文字完全相同,如果是,则标记所述未知道路为关联的已知道路的多字或少字道路;如果否,查看两者名称是否存在于同一个地址信息中,如果是,标记所述未知道路为关联的已知道路的临近道路;如果否,判断两者的兴趣点匹配度是否大于预置的匹配度阈值,如果是,标记所述未知道路为关联的已知道路的别名道路。
优选的,所述匹配子单元具体用于针对未知道路集合中关联的兴趣点的数目大于等于第一阈值的未知道路,将其关联的兴趣点与已知道路集合中关联的兴趣点的数目大于等于第二阈值的已知道路的兴趣点进行匹配。
优选的,所述计算子单元具体用于根据所述匹配的兴趣点的数目和待关联已知道路关联的兴趣点的个数,计算所述匹配的兴趣点的数目与待关联已知道路关联的兴趣点的个数的比值,将该比值作为未知道路与待关联已知道路的匹配度。
优选的,所述分类单元具体包括:
分级子单元,用于将所述运单数据集合中各条运单数据的地址信息进行分级,得到各条地址信息的区域信息和道路名称;
道路匹配子单元,用于将各条地址信息的道路名称与预置的道路数据库中对应区域内的已知道路的名称或者名称的拼音进行匹配,得到已知道路和未知道路;
第一合并子单元,用于将所有已知道路中相同的已知道路及其关联的兴趣点进行合并,将合并处理后得到的所有已知道路及其关联兴趣点构成已知道路集合;
第二合并子单元,用于将所有未知道路中相同的未知道路及其关联的兴趣点进行合并,将合并处理后得到的所有未知道路及其关联兴趣点构成未知道路集合。
由上述实施例可以看出,与现有技术相比本发明的优点在于:
获取运单数据集合,根据所述运单数据集合中各条运单数据的地址信息及预置的道路数据库,得到已知道路集合和未知道路集合;针对未知道路集合中的未知道路,将未知道路关联的兴趣点与已知道路集合中已知道路关联的兴趣点进行匹配,选择兴趣点匹配度最高的已知道路作为未知道路的关联道路。由于道路关联的兴趣点是与道路在地理位置上存在一定关联的兴趣点,本发明通过分析未知道路与已知道路关联的兴趣点的匹配程度来分析两者之间的关联关系,其本质是从地理位置的角度分析未知道路与已知道路的关联关系,能够提高地址中道路识别的准确度,为其他以道路信息为依据的业务打好基础,为用户提供便利。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例未知道路与已知道路关联关系的分析方法实施例1的流程图;
图2为本发明实施例未知道路与已知道路关联关系的分析方法实施例2的流程图;
图3为本发明实施例未知道路与已知道路关联关系的分析装置实施例1的结构图;
图4为图3所示装置中匹配选择单元的一种结构示意图;
图5为图3所示装置中匹配选择单元的另一种结构示意图;
图6为本发明实施例未知道路与已知道路关联关系的分析装置实施例2的结构图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明实施例进行详细描述。
实施例一
请参阅图1,为本发明实施例未知道路与已知道路关联关系的分析方法实施例1的流程图,从图1可知该方法具体包括:
S101:获取运单数据集合;
在具体实现时,如果运单数据数据库中将运单数据独立储存,可以从运单数据数据库中获取一定个数的运单数据,将其合并构成运单数据集合;如果运单数据数据库将运单数据按照集合方式储存,也可以从运单数据库中直接获取运单数据集合。
S102:根据所述运单数据集合中各条运单数据的地址信息及预置的道路数据库,得到已知道路集合和未知道路集合;
具体的,本步骤可以通过以下方式实现:
将所述运单数据集合中各条运单数据的地址信息进行分级,得到各条地址信息的区域信息和道路名称;
将各条地址信息的道路名称与预置的道路数据库中对应区域内的已知道路的名称或者名称的拼音进行匹配,得到已知道路和未知道路;
将所有已知道路中相同的已知道路及其关联的兴趣点进行合并,将合并处理后得到的所有已知道路及其关联兴趣点构成已知道路集合;
将所有未知道路中相同的未知道路及其关联的兴趣点进行合并,将合并处理后得到的所有未知道路及其关联兴趣点构成未知道路集合。
其中,“预置的道路数据库”可以是根据地理信息系统提供的道路信息建立的道路数据库,该预置的道路数据库储存的道路都是已知道路。对地址信息进行分级,得到地址信息的区域信息和道路信息,其中,区域信息是指包含省、市、区、县等标识具体区域的信息。比如:“河北省石家庄市桥西区裕华西路”其中,“河北省石家庄”是该地址信息的区域信息,“桥西区裕华西路”是该地址信息的道路信息。将各条地址信息的道路名称与预置的道路数据库中对应区域内的已知道路的名称或者名称的拼音进行匹配,匹配一致,确定该地址信息的道路是已知道路,匹配不一致,确定该地址信息的道路是未知道路。匹配得到已知道路和未知道路,再通过道路极其关联的兴趣点的合并,分别得到已知道路集合和未知道路集合。
103:针对未知道路集合中的未知道路,将未知道路关联的兴趣点与已知道路集合中已知道路关联的兴趣点进行匹配,选择兴趣点匹配度最高的已知道路作为未知道路的关联道路。
在具体实现时,本步骤可以通过以下方式实现,包括:
针对未知道路集合中的未知道路,将未知道路关联的兴趣点与已知道路集合中已知道路关联的兴趣点进行匹配;
选择与该未知道路关联的兴趣点匹配的兴趣点的数目最多的已知道路作为所述未知道路的关联道路。
在具体实现时,本步骤还可以通过以下方式实现:
针对未知道路集合中的未知道路,将未知道路关联的兴趣点与已知道路集合中已知道路关联的兴趣点进行匹配;
按照与该未知道路匹配的兴趣点的数目由高到低的顺序,选择预设个数的已知道路作为该未知道路的待关联已知道路;
根据所述匹配的兴趣点的数目和待关联已知道路关联的兴趣点的个数,得到该未知道路与各待关联已知道路之间的匹配度;
选择匹配度最高的待关联已知道路作为所述未知道路的关联道路。
具体的,上述“根据所述匹配的兴趣点的数目和待关联已知道路关联的兴趣点的个数,得到该未知道路与各待关联已知道路之间的匹配度”具体实现过程为根据所述匹配的兴趣点的数目和待关联已知道路关联的兴趣点的个数,计算所述匹配的兴趣点的数目与待关联已知道路关联的兴趣点的个数的比值,将该比值作为未知道路与待关联已知道路的匹配度。”
在具体实现时,为了提高地址信息中未知道路分析的准确度,本发明还可以对参与匹配的未知道路和已知道路分别进行限制。具体的,上述“针对未知道路集合中的未知道路,将未知道路关联的兴趣点与已知道路集合中已知道路关联的兴趣点进行匹配”具体为:
针对未知道路集合中关联的兴趣点的数目大于等于第一阈值的未知道路,将其关联的兴趣点与已知道路集合中关联的兴趣点的数目大于等于第二阈值的已知道路的兴趣点进行匹配。其中,第一阈值可以大于第二阈值,也可以小于第二阈值。
通过上述实施例可以看出:本发明通过获取运单数据集合,根据所述运单数据集合中各条运单数据的地址信息及预置的道路数据库,得到已知道路集合和未知道路集合;针对未知道路集合中的未知道路,将未知道路关联的兴趣点与已知道路集合中已知道路关联的兴趣点进行匹配,选择兴趣点匹配度最高的已知道路作为未知道路的关联道路。由于道路关联的兴趣点是与道路在地理位置上存在一定关联的兴趣点,本发明通过分析未知道路与已知道路关联的兴趣点的匹配程度来分析两者之间的关联关系,其本质是从地理位置的角度分析未知道路与已知道路的关系,能够提高地址中道路识别的准确度,为其他以道路信息为依据的业务打好基础,为用户提供便利。
实施例二
在实际应用中,除了需要正确识别地址信息中的道路,还需要进一步分析未知道路与关联道路的对应关系,基于此,本发明还提供了优选方案,该优选方案具体是在上述实施例一的基础上,增加了利用未知道路名称以及名称长度判断未知道路与关联的已知道路的对应关系的处理方式。
请参阅图2,为本发明实施例未知道路与已知道路关联关系的分析方法实施例2的流程图,从图2可知该方法具体包括:
S201:获取运单数据集合;
S202:根据所述运单数据集合中各条运单数据的地址信息及预置的道路数据库,得到已知道路集合和未知道路集合;
S203:针对未知道路集合中的未知道路,将未知道路关联的兴趣点与已知道路集合中已知道路关联的兴趣点进行匹配,选择兴趣点匹配度最高的已知道路作为未知道路的关联道路。
上述S201~ ̄S203与实施例一中S101~ ̄S103相同,在此不再赘述。
S204:判断未知道路的名称与该未知道路关联的已知道路名称的长度是否相同;如果相同,转入执行S205,如果不相同,转入执行S206;
S205:判断两者名称的文字及其顺序是否相同,如果有一字不同,标记所述未知道路为关联的已知道路的错别字道路;如果文字完全相同但文字顺序不完全相同,则标记所述未知道路为关联的已知道路的文字顺序颠倒道路;如果多个字不相同,查看两者名称是否存在于同一个地址信息中,如果是,标记所述未知道路为关联道路的临近道路;如果否,判断两者的兴趣点匹配度是否大于预置的匹配度阈值,如果是,标记所述未知道路为关联道路的别名道路;
S206:判断两者名称的文字是否多一字或者少一字且其他文字完全相同,如果是,则标记所述未知道路为关联的已知道路的多字或少字道路;如果否,查看两者名称是否存在于同一个地址信息中,如果是,标记所述未知道路为关联的已知道路的临近道路;如果否,判断两者的兴趣点匹配度是否大于预置的匹配度阈值,如果是,标记所述未知道路为关联的已知道路的别名道路。
在具体实现时,该匹配度阈值的取值范围可以为大于60%;优选的,该匹配度阈值取值为80%。
比如:未知道路是“中关材大街”,已知道路是“中关村大街”,若通过S201-S203分析出未知道路与已知道路相关联,再通过S204-S205判断出该未知道路为已知道路的错别字道路;
未知道路是“交大北路”,已知道路是“交通大学北路”,若通过S201-S203分析出未知道路与已知道路相关联,再通过S204-S206判断出该未知道路为已知道路的少字道路;
未知道路是“西城土路”,已知道路是“西土城路”,若通过S201-S203分析出未知道路与已知道路相关联,再通过S204-S205判断出该未知道路为已知道路的文字顺序颠倒道路;
未知道路是“世纪坛南路”,已知道路是“羊坊店路”若通过S201-S203分析出未知道路与已知道路相关联,再通过S204-S206判断两者的兴趣点匹配度大于预置的匹配度阈值,标记所述未知道路为关联的已知道路的别名道路。
进一步的,上述方法还可以包括:显示包括未知道路与关联道路对应关系的提示信息,根据用户选择的关联道路,对地址信息进行修改。
通过上述实施例可以看出:本发明在分析出未知道路与已知道路的关系之后,还通过判断未知道路与关联道路的名称长度、名称的文字以及顺序的关系,标记出未知道路与关联道路之间存在错别字、少字、多字、文字顺序颠倒、别名等对应关系。
实施例三
与上述一种未知道路与已知道路关联关系的分析方法相对应,本发明实施例还提供了一种未知道路与已知道路关联关系的分析装置。
请参阅图3,图3为本发明实施例未知道路与已知道路关联关系的分析装置实施例1的结构图;从图3可以看出该装置具体包括:
获取单元301,用于获取运单数据集合;
分类单元302,用于根据所述运单数据集合中各条运单数据的地址信息及预置的道路数据库,得到已知道路集合和未知道路集合;
匹配选择单元303,用于针对未知道路集合中的未知道路,将未知道路关联的兴趣点与已知道路集合中已知道路关联的兴趣点进行匹配,选择兴趣点匹配度最高的已知道路作为未知道路的关联道路。
如图4所示,匹配选择单元可包括:
匹配子单元401,用于针对未知道路集合中的未知道路,将未知道路关联的兴趣点与已知道路集合中已知道路关联的兴趣点进行匹配;
第一选择子单元402,用于选择与该未知道路关联的兴趣点匹配的兴趣点的数目最多的已知道路作为所述未知道路的关联道路。
如图5所示,匹配选择单元可以包括:
匹配子单元501,用于针对未知道路集合中的未知道路,将未知道路关联的兴趣点与已知道路集合中已知道路关联的兴趣点进行匹配;
第二选择子单元502,用于按照与该未知道路匹配的兴趣点的数目由高到低的顺序,选择预设个数的已知道路作为该未知道路的待关联已知道路;
计算子单元503,用于根据所述匹配的兴趣点的数目和待关联已知道路关联的兴趣点的个数,得到该未知道路与各待关联已知道路之间的匹配度;
第三选择子单元504,用于选择匹配度最高的待关联已知道路作为所述未知道路的关联道路。
优选的,上述匹配子单元具体用于针对未知道路集合中关联的兴趣点的数目大于等于第一阈值的未知道路,将其关联的兴趣点与已知道路集合中关联的兴趣点的数目大于等于第二阈值的已知道路的兴趣点进行匹配。
优选的,上述计算子单元具体用于根据所述匹配的兴趣点的数目和待关联已知道路关联的兴趣点的个数,计算所述匹配的兴趣点的数目与待关联已知道路关联的兴趣点的个数的比值,将该比值作为未知道路与待关联已知道路的匹配度。
优选的,上述分类单元具体包括:
分级子单元,用于将所述运单数据集合中各条运单数据的地址信息进行分级,得到各条地址信息的区域信息和道路名称;
道路匹配子单元,用于将各条地址信息的道路名称与预置的道路数据库中对应区域内的已知道路的名称或者名称的拼音进行匹配,得到已知道路和未知道路;
第一合并子单元,用于将所有已知道路中相同的已知道路及其关联的兴趣点进行合并,将合并处理后得到的所有已知道路及其关联兴趣点构成已知道路集合;
第二合并子单元,用于将所有未知道路中相同的未知道路及其关联的兴趣点进行合并,将合并处理后得到的所有未知道路及其关联兴趣点构成未知道路集合。
如图6所示,图6为本发明实施例未知道路与已知道路关联关系的分析装置实施例2的结构图,所述装置在上述实施例1装置的基础上还可以包括:
第一判断单元304,用于判断未知道路的名称与该未知道路关联的已知道路名称的长度是否相同;
第二判断单元305,用于当第一判断单元判断结果为长度相同时,判断两者名称的文字及其顺序是否相同,如果有一字不同,标记所述未知道路为关联的已知道路的错别字道路;如果文字完全相同但文字顺序不完全相同,则标记所述未知道路为关联的已知道路的文字顺序颠倒道路;如果多个字不相同,查看两者名称是否存在于同一个地址信息中,如果是,标记所述未知道路为关联道路的临近道路;如果否,判断两者的兴趣点匹配度是否大于预置的匹配度阈值,如果是,标记所述未知道路为关联道路的别名道路;
第三判断单元306,用于当第一判断单元判断结果为长度不相同时,判断两者名称的文字是否多一字或者少一字且其他文字完全相同,如果是,则标记所述未知道路为关联的已知道路的多字或少字道路;如果否,查看两者名称是否存在于同一个地址信息中,如果是,标记所述未知道路为关联的已知道路的临近道路;如果否,判断两者的兴趣点匹配度是否大于预置的匹配度阈值,如果是,标记所述未知道路为关联的已知道路的别名道路。
通过上述本发明实施例可以看出,本发明提供的装置,通过获取运单数据集合,根据所述运单数据集合中各条运单数据的地址信息及预置的道路数据库,得到已知道路集合和未知道路集合;针对未知道路集合中的未知道路,将未知道路关联的兴趣点与已知道路集合中已知道路关联的兴趣点进行匹配,选择兴趣点匹配度最高的已知道路作为未知道路的关联道路。由于道路关联的兴趣点是与道路在地理位置上存在一定关联的兴趣点,本发明通过分析未知道路与已知道路关联的兴趣点的匹配程度来分析两者之间的关联关系,其本质是从地理位置的角度分析未知道路与已知道路的关系,能够提高地址中道路识别的准确度,为其他以道路信息为依据的业务打好基础,为用户提供便利。
所述领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述到的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性、机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,可以采用软件功能单元的形式实现。
需要说明的是,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory,ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。
以上对本发明所提供的一种未知道路与已知道路关联关系的分析方法和装置进行了详细介绍,本文中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (14)
1.一种未知道路与已知道路关联关系的分析方法,其特征在于,包括:
获取运单数据集合;
根据所述运单数据集合中各条运单数据的地址信息及预置的道路数据库,得到已知道路集合和未知道路集合;
针对未知道路集合中的未知道路,将未知道路关联的兴趣点与已知道路集合中已知道路关联的兴趣点进行匹配,选择兴趣点匹配度最高的已知道路作为未知道路的关联道路。
2.如权利要求1所述的方法,其特征在于,所述针对未知道路集合中的未知道路,将未知道路关联的兴趣点与已知道路集合中已知道路关联的兴趣点进行匹配,选择兴趣点匹配度最高的已知道路作为未知道路的关联道路具体包括:
针对未知道路集合中的未知道路,将未知道路关联的兴趣点与已知道路集合中已知道路关联的兴趣点进行匹配;
选择与该未知道路关联的兴趣点匹配的兴趣点的数目最多的已知道路作为所述未知道路的关联道路。
3.如权利要求1所述的方法,其特征在于,所述针对未知道路集合中的未知道路,将未知道路关联的兴趣点与已知道路集合中已知道路关联的兴趣点进行匹配,选择兴趣点匹配度最高的已知道路作为未知道路的关联道路具体包括:
针对未知道路集合中的未知道路,将未知道路关联的兴趣点与已知道路集合中已知道路关联的兴趣点进行匹配;
按照与该未知道路匹配的兴趣点的数目由高到低的顺序,选择预设个数的已知道路作为该未知道路的待关联已知道路;
根据所述匹配的兴趣点的数目和待关联已知道路关联的兴趣点的个数,得到该未知道路与各待关联已知道路之间的匹配度;
选择匹配度最高的待关联已知道路作为所述未知道路的关联道路。
4.如权利要求1-3中任一项所述的方法,其特征在于,所述方法还包括:
判断未知道路的名称与该未知道路关联的已知道路名称的长度是否相同;
如果长度相同,则判断两者名称的文字及其顺序是否相同,如果有一字不同,标记所述未知道路为关联的已知道路的错别字道路;如果文字完全相同但文字顺序不完全相同,则标记所述未知道路为关联的已知道路的文字顺序颠倒道路;如果多个字不相同,查看两者名称是否存在于同一个地址信息中,如果是,标记所述未知道路为关联道路的临近道路;如果否,判断两者的兴趣点匹配度是否大于预置的匹配度阈值,如果是,标记所述未知道路为关联道路的别名道路;
如果长度不相同,判断两者名称的文字是否多一字或者少一字且其他文字完全相同,如果是,则标记所述未知道路为关联的已知道路的多字或少字道路;如果否,查看两者名称是否存在于同一个地址信息中,如果是,标记所述未知道路为关联的已知道路的临近道路;如果否,判断两者的兴趣点匹配度是否大于预置的匹配度阈值,如果是,标记所述未知道路为关联的已知道路的别名道路。
5.如权利要求1-3中任一项所述的方法,其特征在于,所述针对未知道路集合中的未知道路,将未知道路关联的兴趣点与已知道路集合中已知道路关联的兴趣点进行匹配具体为:
针对未知道路集合中关联的兴趣点的数目大于等于第一阈值的未知道路,将其关联的兴趣点与已知道路集合中关联的兴趣点的数目大于等于第二阈值的已知道路的兴趣点进行匹配。
6.如权利要求3所述的方法,其特征在于,所述根据所述匹配的兴趣点的数目和待关联已知道路关联的兴趣点的个数,得到该未知道路与各待关联已知道路之间的匹配度具体为:
根据所述匹配的兴趣点的数目和待关联已知道路关联的兴趣点的个数,计算所述匹配的兴趣点的数目与待关联已知道路关联的兴趣点的个数的比值,将该比值作为未知道路与待关联已知道路的匹配度。
7.如权利要求1-3中任一项所述的方法,其特征在于,所述根据所述运单数据集合中各条运单数据的地址信息及预置的道路数据库,得到已知道路集合和未知道路集合具体包括:
将所述运单数据集合中各条运单数据的地址信息进行分级,得到各条地址信息的区域信息和道路名称;
将各条地址信息的道路名称与预置的道路数据库中对应区域内的已知道路的名称或者名称的拼音进行匹配,得到已知道路和未知道路;
将所有已知道路中相同的已知道路及其关联的兴趣点进行合并,将合并处理后得到的所有已知道路及其关联兴趣点构成已知道路集合;
将所有未知道路中相同的未知道路及其关联的兴趣点进行合并,将合并处理后得到的所有未知道路及其关联兴趣点构成未知道路集合。
8.一种未知道路与已知道路关联关系的分析装置,其特征在于,包括:
获取单元,用于获取运单数据集合;
分类单元,用于根据所述运单数据集合中各条运单数据的地址信息及预置的道路数据库,得到已知道路集合和未知道路集合;
匹配选择单元,用于针对未知道路集合中的未知道路,将未知道路关联的兴趣点与已知道路集合中已知道路关联的兴趣点进行匹配,选择兴趣点匹配度最高的已知道路作为未知道路的关联道路。
9.如权利要求8所述的装置,其特征在于,所述匹配选择单元具体包括:
匹配子单元,用于针对未知道路集合中的未知道路,将未知道路关联的兴趣点与已知道路集合中已知道路关联的兴趣点进行匹配;
第一选择子单元,用于选择与该未知道路关联的兴趣点匹配的兴趣点的数目最多的已知道路作为所述未知道路的关联道路。
10.如权利要求8所述的装置,其特征在于,所述匹配选择单元具体包括:
匹配子单元,用于针对未知道路集合中的未知道路,将未知道路关联的兴趣点与已知道路集合中已知道路关联的兴趣点进行匹配;
第二选择子单元,用于按照与该未知道路匹配的兴趣点的数目由高到低的顺序,选择预设个数的已知道路作为该未知道路的待关联已知道路;
计算子单元,用于根据所述匹配的兴趣点的数目和待关联已知道路关联的兴趣点的个数,得到该未知道路与各待关联已知道路之间的匹配度;
第三选择子单元,用于选择匹配度最高的待关联已知道路作为所述未知道路的关联道路。
11.如权利要求8-10中任一项所述的装置,其特征在于,所述装置还包括:
第一判断单元,用于判断未知道路的名称与该未知道路关联的已知道路名称的长度是否相同;
第二判断单元,用于当第一判断单元的判断结果为长度相同时,判断两者名称的文字及其顺序是否相同,如果有一字不同,标记所述未知道路为关联的已知道路的错别字道路;如果文字完全相同但文字顺序不完全相同,则标记所述未知道路为关联的已知道路的文字顺序颠倒道路;如果多个字不相同,查看两者名称是否存在于同一个地址信息中,如果是,标记所述未知道路为关联道路的临近道路;如果否,判断两者的兴趣点匹配度是否大于预置的匹配度阈值,如果是,标记所述未知道路为关联道路的别名道路;
第三判断单元,用于当第一判断单元的判断结果为长度不相同时,判断两者名称的文字是否多一字或者少一字且其他文字完全相同,如果是,则标记所述未知道路为关联的已知道路的多字或少字道路;如果否,查看两者名称是否存在于同一个地址信息中,如果是,标记所述未知道路为关联的已知道路的临近道路;如果否,判断两者的兴趣点匹配度是否大于预置的匹配度阈值,如果是,标记所述未知道路为关联的已知道路的别名道路。
12.如权利要求9或10所述的装置,其特征在于,所述匹配子单元具体用于针对未知道路集合中关联的兴趣点的数目大于等于第一阈值的未知道路,将其关联的兴趣点与已知道路集合中关联的兴趣点的数目大于等于第二阈值的已知道路的兴趣点进行匹配。
13.如权利要求10中所述的装置,其特征在于,所述计算子单元具体用于根据所述匹配的兴趣点的数目和待关联已知道路关联的兴趣点的个数,计算所述匹配的兴趣点的数目与待关联已知道路关联的兴趣点的个数的比值,将该比值作为未知道路与待关联已知道路的匹配度。
14.如权利要求8-10中任一项所述的装置,其特征在于,所述分类单元具体包括:
分级子单元,用于将所述运单数据集合中各条运单数据的地址信息进行分级,得到各条地址信息的区域信息和道路名称;
道路匹配子单元,用于将各条地址信息的道路名称与预置的道路数据库中对应区域内的已知道路的名称或者名称的拼音进行匹配,得到已知道路和未知道路;
第一合并子单元,用于将所有已知道路中相同的已知道路及其关联的兴趣点进行合并,将合并处理后得到的所有已知道路及其关联兴趣点构成已知道路集合;
第二合并子单元,用于将所有未知道路中相同的未知道路及其关联的兴趣点进行合并,将合并处理后得到的所有未知道路及其关联兴趣点构成未知道路集合。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410602641.4A CN105630807B (zh) | 2014-10-31 | 2014-10-31 | 一种未知道路与已知道路关联关系的分析方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410602641.4A CN105630807B (zh) | 2014-10-31 | 2014-10-31 | 一种未知道路与已知道路关联关系的分析方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105630807A true CN105630807A (zh) | 2016-06-01 |
CN105630807B CN105630807B (zh) | 2020-02-07 |
Family
ID=56045757
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410602641.4A Active CN105630807B (zh) | 2014-10-31 | 2014-10-31 | 一种未知道路与已知道路关联关系的分析方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105630807B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109460443A (zh) * | 2018-09-03 | 2019-03-12 | 丰图科技(深圳)有限公司 | 生成目标区域内建筑体地址的方法、系统、设备及介质 |
CN110222139A (zh) * | 2019-06-14 | 2019-09-10 | 北京百度网讯科技有限公司 | 道路实体数据去重方法、装置、计算设备和介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101569883A (zh) * | 2009-05-22 | 2009-11-04 | 顺丰速运(集团)有限公司 | 一种运单的分发方法、装置及系统 |
CN102169498A (zh) * | 2011-04-14 | 2011-08-31 | 中国测绘科学研究院 | 一种地址模型的构建方法,以及地址匹配的方法和系统 |
CN102306161A (zh) * | 2011-07-22 | 2012-01-04 | 浙江百世技术有限公司 | 多区域重复性检测的方法和设备 |
CN102915299A (zh) * | 2012-10-23 | 2013-02-06 | 海信集团有限公司 | 一种分词方法及装置 |
CN102955783A (zh) * | 2011-08-19 | 2013-03-06 | 上海博泰悦臻电子设备制造有限公司 | 地图数据检索道路的方法及装置,车载系统 |
-
2014
- 2014-10-31 CN CN201410602641.4A patent/CN105630807B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101569883A (zh) * | 2009-05-22 | 2009-11-04 | 顺丰速运(集团)有限公司 | 一种运单的分发方法、装置及系统 |
CN102169498A (zh) * | 2011-04-14 | 2011-08-31 | 中国测绘科学研究院 | 一种地址模型的构建方法,以及地址匹配的方法和系统 |
CN102306161A (zh) * | 2011-07-22 | 2012-01-04 | 浙江百世技术有限公司 | 多区域重复性检测的方法和设备 |
CN102955783A (zh) * | 2011-08-19 | 2013-03-06 | 上海博泰悦臻电子设备制造有限公司 | 地图数据检索道路的方法及装置,车载系统 |
CN102915299A (zh) * | 2012-10-23 | 2013-02-06 | 海信集团有限公司 | 一种分词方法及装置 |
Non-Patent Citations (2)
Title |
---|
房玮睿: ""基于短消息平台的智能交通信息发布系统的研究预与设计"", 《中国优秀硕士学位论文全文数据库 工程科技II辑》 * |
翟仁健: ""基于全局一致性评价的多尺度矢量空间数据匹配方法研究"", 《中国博士学位论文全文数据库 基础科学辑》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109460443A (zh) * | 2018-09-03 | 2019-03-12 | 丰图科技(深圳)有限公司 | 生成目标区域内建筑体地址的方法、系统、设备及介质 |
CN109460443B (zh) * | 2018-09-03 | 2022-03-29 | 丰图科技(深圳)有限公司 | 生成目标区域内建筑体地址的方法、系统、设备及介质 |
CN110222139A (zh) * | 2019-06-14 | 2019-09-10 | 北京百度网讯科技有限公司 | 道路实体数据去重方法、装置、计算设备和介质 |
CN110222139B (zh) * | 2019-06-14 | 2021-07-09 | 北京百度网讯科技有限公司 | 道路实体数据去重方法、装置、计算设备和介质 |
Also Published As
Publication number | Publication date |
---|---|
CN105630807B (zh) | 2020-02-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108628811B (zh) | 地址文本的匹配方法和装置 | |
CN107656913A (zh) | 地图兴趣点地址提取方法、装置、服务器和存储介质 | |
CN104102719A (zh) | 一种轨迹信息的推送方法及装置 | |
CN104090970A (zh) | 兴趣点的展现方法及装置 | |
CN111931077B (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN104462155A (zh) | 一种兴趣点父子关系的建立方法及装置 | |
CN109492066B (zh) | 一种兴趣点分支名称的确定方法、装置、设备及存储介质 | |
CN110309433B (zh) | 一种数据处理方法、装置及服务器 | |
CN102236600A (zh) | 获得代码覆盖率的方法及装置 | |
CN106202028A (zh) | 一种地址信息识别方法及装置 | |
CN104679801A (zh) | 一种兴趣点搜索方法和装置 | |
CN110990520B (zh) | 一种地址编码方法、装置、电子设备和存储介质 | |
CN106855878B (zh) | 基于电子地图的历史行车轨迹显示方法和装置 | |
CN105550221A (zh) | 信息搜索方法及装置 | |
CN105203120A (zh) | 导航路线评测方法及装置 | |
CN103699623A (zh) | 地理编码实现方法和装置 | |
CN105426443A (zh) | 一种地图数据的处理方法、装置及系统 | |
CN107437367B (zh) | 一种标注选择方法及装置 | |
CN111382138B (zh) | Poi数据处理方法、装置、设备及介质 | |
CN105677878A (zh) | 一种基于bi系统的车辆信息多维展示的方法及系统 | |
CN111126422B (zh) | 行业模型的建立及行业的确定方法、装置、设备及介质 | |
CN105630807A (zh) | 一种未知道路与已知道路关联关系的分析方法和装置 | |
CN106095820A (zh) | 一种自动获取地址的方法及系统 | |
CN106503071A (zh) | Poi信息的处理方法及装置 | |
CN110737690A (zh) | 用户标签挖掘方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20200511 Address after: 310052 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province Patentee after: Alibaba (China) Co.,Ltd. Address before: 102200, No. 8, No., Changsheng Road, Changping District science and Technology Park, Beijing, China. 1-5 Patentee before: AUTONAVI SOFTWARE Co.,Ltd. |
|
TR01 | Transfer of patent right |