CN103021260B - 一种道路门牌数据的校验方法和装置 - Google Patents

一种道路门牌数据的校验方法和装置 Download PDF

Info

Publication number
CN103021260B
CN103021260B CN201210543889.9A CN201210543889A CN103021260B CN 103021260 B CN103021260 B CN 103021260B CN 201210543889 A CN201210543889 A CN 201210543889A CN 103021260 B CN103021260 B CN 103021260B
Authority
CN
China
Prior art keywords
road
doorplate
odd
data
even number
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210543889.9A
Other languages
English (en)
Other versions
CN103021260A (zh
Inventor
段建国
林海韬
林锡通
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201210543889.9A priority Critical patent/CN103021260B/zh
Publication of CN103021260A publication Critical patent/CN103021260A/zh
Application granted granted Critical
Publication of CN103021260B publication Critical patent/CN103021260B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明提供了一种道路门牌数据的校验方法和装置,该方法包括:S1、获取待校验的道路门牌数据;S2、将所获取的道路门牌数据中各门牌分配到对应所在道路的两侧;S3、针对同一道路,分别统计道路两侧的门牌号码的奇数个数和偶数个数,确定道路的奇数侧和偶数侧;S4、分别确定道路的奇数侧和偶数侧中门牌号码的分布规律,将不符合分布规律且与邻近门牌的号码之差超过预设阈值的门牌过滤掉。相较于现有技术,本发明能校验出奇偶错误、顺序排列错误和重复的道路门牌数据,提高道路门牌数据的准确率,有利于后续对道路数据进行有效插值,提高门牌定位服务的准确率和召回率。

Description

一种道路门牌数据的校验方法和装置
【技术领域】
本发明涉及地理位置服务技术领域,特别涉及一种道路门牌数据的校验方法和装置。
【背景技术】
在基于地理位置的定位服务领域中,兴趣点(Point Of Interest,POI)是电子地图数据的重要组成部分之一,在车载导航系统、互联网电子地图、无线位置服务等应用中,人们通过在电子地图上检索相关的兴趣点,进行地址匹配,从而查询到相关信息或导航到目的地。
电子地图的数据采集主要通过人工的方法,到实地采集兴趣点或道路等目标的空间位置坐标等信息,然后再将这些采集的坐标点制作成图。道路门牌数据是兴趣点的地址信息的重要表示形式之一。在门牌数据采集或制作时,因人为、设备、测量时间或测量环境等因素,不可避免会出现误差或错误。
由于道路门牌数据的错误,使得道路门牌信息不能与实际位置信息关联在一起,导致地址匹配错误或匹配失败。而且利用这些道路门牌数据进行插值时,也容易产生错误的结果,这样势必会影响地理定位服务的准确率和召回率。因而,有必要对道路门牌数据的正确性进行校验。
现有在处理错误的道路门牌数据时,仅根据门牌与道路的空间位置距离进行判断,将与道路的距离超过一定阈值的门牌剔除掉,并不能发现距离小于阈值的错误数据,无法解决门牌号码的重复、顺序和奇偶排列的错误。
【发明内容】
有鉴于此,本发明提供了一种道路门牌数据的校验方法和装置,能校验出奇偶错误、顺序排列错误和重复的道路门牌数据,提高道路门牌数据的准确率,有利于后续对道路数据进行有效插值,提高门牌定位服务的准确率和召回率。
具体技术方案如下:
一种道路门牌数据的校验方法,该方法包括以下步骤:
S1、获取待校验的道路门牌数据;
S2、将所获取的道路门牌数据中各门牌分配到对应所在道路的两侧;
S3、针对同一道路,分别统计道路两侧的门牌号码的奇数个数和偶数个数,确定道路的奇数侧和偶数侧;
S4、分别确定道路的奇数侧和偶数侧中门牌号码的分布规律,将不符合分布规律且与邻近门牌的号码之差超过预设阈值的门牌过滤掉。
根据本发明一优选实施例,所述道路门牌数据包括各门牌所在的道路编号、道路名称、道路形状、门牌编号、门牌号码和空间位置信息。
根据本发明一优选实施例,所述步骤S2具体包括:
S2_1、从所获取的道路门牌数据中提取各门牌所在的道路信息和对应的门牌号码;
S2_2、根据所述道路门牌数据中各门牌的空间位置,将各门牌对应的门牌号码分到所在道路的两侧。
根据本发明一优选实施例,在所述步骤S3和步骤S4之间还包括:
S3_1、将分布在奇数侧上偶数号码的门牌移动到偶数侧,将分布在偶数侧上奇数号码的门牌移动到奇数侧。
根据本发明一优选实施例,在所述步骤S3_1之前,还包括:
判断奇数侧上偶数号码的门牌或偶数侧上奇数号码的门牌与所在道路的垂直距离是否超过预设阈值,仅对不超过预设阈值的门牌执行步骤S3_1。
根据本发明一优选实施例,所述确定道路的奇数侧和偶数侧中门牌号码的分布规律,具体包括:
针对同一道路的同一侧,寻找道路门牌数据中最长递增或递减子序列,以该最长递增或递减子序列的排序规律作为该侧门牌号码的分布规律。
根据本发明一优选实施例,所述确定道路的奇数侧和偶数侧中门牌号码的分布规律,具体包括:
分别以道路的两端作为起点,计算各门牌与所述起点之间沿所在道路的距离,找出门牌号码中的逆序对,统计所述逆序对个数,将逆序对个数少的端点确定为道路的起点端,以该起点端依次递增确定为所述门牌号码的分布规律。
根据本发明一优选实施例,在所述步骤S4之后,还包括:
分别对道路两侧中相邻的门牌号码进行比较,去除重复的门牌。
一种道路门牌数据的校验装置,该装置包括:
输入模块,用于获取待校验的道路门牌数据;
门牌位置确定模块,用于将所述输入模块获取的道路门牌数据中各门牌分配到对应所在道路的两侧;
奇偶侧确定模块,用于针对同一道路,分别统计道路两侧的门牌号码的奇数个数和偶数个数,确定道路的奇数侧和偶数侧;
排序校验模块,用于分别确定道路的奇数侧和偶数侧中门牌号码的分布规律,将不符合分布规律且与邻近门牌的号码之差超过预设阈值的门牌过滤掉。
根据本发明一优选实施例,所述道路门牌数据包括各门牌所在的道路编号、道路名称、道路形状、门牌编号、门牌号码和空间位置信息。
根据本发明一优选实施例,所述门牌位置确定模块包括:
信息提取子模块,用于从所述输入模块获取的道路门牌数据中提取各门牌所在的道路信息和对应的门牌号码;
位置确定子模块,用于根据所述道路门牌数据中各门牌的空间位置,将各门牌对应的门牌号码分到所在道路的两侧。
根据本发明一优选实施例,该装置还包括:
奇偶性校验模块,用于在所述奇偶侧确定模块确定道路的奇数侧和偶数侧之后,将分布在奇数侧上偶数号码的门牌移动到偶数侧,将分布在偶数侧上奇数号码的门牌移动到奇数侧。
根据本发明一优选实施例,所述奇偶性校验模块在进行移动门牌之前,还包括:
判断奇数侧上偶数号码的门牌或偶数侧上奇数号码的门牌与所在道路的垂直距离是否超过预设阈值,仅对不超过预设阈值的门牌进行移动。
根据本发明一优选实施例,所述排序校验模块确定道路的奇数侧和偶数侧中门牌号码的分布规律,具体配置为:
针对同一道路的同一侧,寻找道路门牌数据中最长递增或递减子序列,以该最长递增或递减子序列的排序规律作为该侧门牌号码的分布规律。
根据本发明一优选实施例,所述排序校验模块确定道路的奇数侧和偶数侧中门牌号码的分布规律,具体配置为:
分别以道路的两端作为起点,计算各门牌与所述起点之间沿所在道路的距离,找出门牌号码中的逆序对,统计所述逆序对个数,将逆序对个数少的端点确定为道路的起点端,以该起点端依次递增确定为所述门牌号码的分布规律。
根据本发明一优选实施例,该装置还包括:
重复校验模块,用于分别对道路两侧中相邻的门牌号码进行比较,去除重复的门牌。
由以上技术方案可以看出,本发明提供的道路门牌数据的校验方法和装置,利用道路门牌编排的规律对地理信息数据中的道路门牌数据进行自动校验,有效解决了道路门牌数据中门牌的奇偶、顺序排列错误和重复门牌的校验问题,提高道路门牌数据的准确率,以利于后续对道路数据进行有效插值,提高门牌定位服务的准确率和召回率。
【附图说明】
图1为本发明实施例一提供的道路门牌数据的校验方法流程图;
图2为某一区域地图上部分门牌号码的初始状态示意图;
图3为本发明实施例二提供的道路门牌数据的校验方法流程图;
图4为本发明对图2中的门牌号码进行校验后的状态示意图;
图5为本发明实施例三提供的道路门牌数据的校验装置示意图;
图6为本发明实施例四提供的道路门牌数据的校验装置示意图。
【具体实施方式】
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
道路门牌是电子地图中兴趣点数据的组成部分。道路门牌的编排具有一定的规律,大多遵循以下原则:1、道路同一侧的门牌号码的奇偶性相同;2、门牌号码遵循从小到大或从大到小的顺序排列。
本发明依据这两个原则,对各个道路门牌的空间位置进行校验,判断门牌的排列是否遵循编排规律,从而提高道路门牌数据的准确率。
实施例一、
图1是本实施例提供的道路门牌数据的校验方法流程图,如图1所示,该方法包括:
步骤S101、获取待校验的道路门牌数据。
道路门牌数据通常分为两部分,一是道路数据,二是门牌数据,具体包括各门牌所在的道路编号、道路名称、道路形状、门牌编号、门牌号码和空间位置信息。
道路门牌数据可以但不限于采用以下存储方式:
表1
表2
表1为道路数据样例,包括道路编号、道路名称和道路形状等信息,表2为门牌数据样例,包括门牌所在的道路编号、门牌编号、门牌号码和空间位置等信息,空间位置信息通常采用X/Y坐标值或经纬度来表示该数据点。
步骤S102、将所获取的道路门牌数据中各门牌分配到对应所在道路的两侧。
每条道路都有道路形状,其包含的形状数据通常采用折线的方式进行表示。如表1中所示的道路形状,采用“line:12954830.950000,4824191.520000;12955076.220000,4824311.180000;12955585.420000,4824341.430000”来表示,该折线由“12954830.950000,4824191.520000”、“12955076.220000,4824311.180000”和“12955585.420000,4824341.430000”这3个点形成,即图2中所示的点D1、D2和D3。
根据道路门牌的空间位置信息中点坐标值,将各门牌分配到对应所在道路的两侧。如表2中,利用道路门牌数据中的空间位置信息与道路形状之间的关系,可以将门牌号码对应到该道路的两侧。
经过本步骤的处理,将各门牌分到道路的两侧,图2为某一区域地图上部分门牌号码的初始状态示意图,如图2所示,道路“上斜街”上的门牌分配在该道路的两侧。
步骤S103、针对同一道路,分别统计道路两侧的门牌号码的奇数个数和偶数个数,确定道路的奇数侧和偶数侧。
将所有的门牌号码分到道路两侧后,统计各道路两侧的门牌号码的奇数个数和偶数个数。
在确定道路的奇偶侧时,可以但不限于采用如下方法:
假设道路两侧分别为A侧和B侧,统计到A侧中偶数门牌号码的数目为a,奇数门牌号码的数目为b,统计到B侧中偶数门牌号码的数目为c,奇数门牌号码的数目为d。
(不等式1)
如果上述不等式1成立,则说明道路的A侧为偶数侧,道路的B侧为奇数侧。反之,道路的A侧为奇数侧,道路的B侧为偶数侧。
经过本步骤的判断,可以得到图2中道路“上斜街”的A侧为奇数侧,B侧为偶数侧。
根据门牌的编排规则可知,上述不等式1一般不会出现相等的情形,如果统计到道路两侧奇偶数目均相等或其他情形导致不等式两边相等时,说明提供的道路门牌数据不足,无法判断其奇偶分布情况,待收集更多的道路门牌数据后再进行判断。
步骤S104、分别确定道路的奇数侧和偶数侧中门牌号码的分布规律,将不符合分布规律且与邻近门牌的号码之差超过预设阈值的门牌过滤掉。
所述确定道路的奇数侧和偶数侧中门牌号码的分布规律,可以但不限于采用以下两种方法:
针对同一道路的同一侧,寻找道路门牌数据中最长递增或递减子序列,以该最长递增或递减子序列的排序规律作为该侧门牌号码的分布规律。
具体地,计算门牌的最长递增或递减子序列,可以采用现有的动态规划等通用算法来计算,于此不再赘述。
或者,分别以道路的两端作为起点,计算各门牌与所述起点之间沿所在道路的距离,找出门牌号码中的逆序对,统计所述逆序对个数,将逆序对个数少的端点确定为道路的起点端,以该起点端依次递增确定为所述门牌号码的分布规律。
例如,以数组C[5]=(3,1,4,5,2)查找逆序对为例,以数据C的值C[i]代表号码牌,数据C的顺序i代表距离端点的距离,如果满足i<j且C[i]>C[j]则为一个逆序对。
先以3为端点,当i=0时,C[0]=3,当j=1时,C[1]=1,满足i<j且C[i]>C[j],则(3,1)为一个逆序对,依次类推,可以找到的逆序对包括(3,1)、(3,2)、(4,2)和(5,2)。
再以2为端点,当i=0时,C[0]=2,当j=3时,C[1]=1,满足i<j且C[i]>C[j],则(2,1)为一个逆序对,依次类推,可以找到的逆序对包括(2,1)、(5,4)、(5,1)、(5,3)、(4,1)和(4,3)。
将逆序对个数少的端点确定为道路的起点,则以3为端点,并以该起点端依次递增确定为所述门牌号码的分布规律。
或者,通过不断删除包含在最多逆序对里的号码,直到没有逆序对,例如,在(3,1)、(3,2)、(4,2)和(5,2)包含最多的号码是2,则删除该号码2,数组C变为(3,1,4,5),新的数组还有一个逆序对(3,1),则再删除3或1后,新的数组将没有逆序对。而后将该序列递增规律确定为门牌号码的分布规律。
通过上述方法可以确定图2中道路“上斜街”奇数侧和偶数侧的排列顺序是沿着D1-D2-D3方向依次递减。
所述预设阈值可根据实际经验进行设定,如可以设定为30,对于不符合分布规律且号码之差超过该阈值的门牌,认为是错误的数据,予以删除。如图2中的3号门牌,该门牌位于51号和63号门牌之间,由于与临近门牌的号码之差大于预设阈值30,则可以判断该门牌为错误的门牌数据。
对于不符合分布规律,但与邻近门牌的号码之差小于预设阈值的门牌,则认为是可以接受的道路门牌数据误差或者是符合实际情形的门牌,不对该些门牌作处理。
如图2中的52号门牌,该门牌在顺序排列上不符合沿着D1到D3递减的分布规律,由于该门牌与邻近的门牌48号与50号的号码之差小于预设阈值30,则认为该门牌是可以接受的。
实施例二、
图3是本实施例提供的道路门牌数据的校验方法流程图,如图3所示,该方法包括:
步骤S301、获取待校验的道路门牌数据。
本步骤与实施例一中的步骤S101相同,于此不再赘述。
步骤S302、从所获取的道路门牌数据中提取各门牌所在的道路信息和对应的门牌号码。
例如,道路门牌数据中包括“宣武区上斜街63号”和其空间位置坐标,可以提取得到道路信息为“上斜街”和对应的门牌号码“63号”。
步骤S303、根据所述道路门牌数据中各门牌的空间位置,将各门牌对应的门牌号码分到所在道路的两侧。
根据“宣武区上斜街63号”的空间位置信息,将该门牌号码对应分到“上斜街”道路的一侧。
步骤S304、针对同一道路,分别统计道路两侧的门牌号码的奇数个数和偶数个数,确定道路的奇数侧和偶数侧。
本步骤与实施例一中的步骤S103相同,于此不再赘述。
步骤S305、判断奇数侧上偶数号码的门牌或偶数侧上奇数号码的门牌与所在道路的垂直距离是否超过预设距离阈值。如果是,则进入步骤S306,否则,进入步骤S309,删除对应的道路门牌数据。
所述预设距离阈值根据实际应用时要求的地址匹配精度来确定,将误差控制在一定的范围内。例如,可以定为50米,即最多只能移动100米。
步骤S306、将分布在奇数侧上偶数号码的门牌移动到偶数侧,将分布在偶数侧上奇数号码的门牌移动到奇数侧。
每个道路门牌到道路都有一个垂直距离,如果一个奇数号码的门牌在道路的偶数侧上,并且与道路的垂直距离小于预设阈值,在将该门牌镜像移动到对应的奇数侧。
如果奇偶性错误的门牌到道路的垂直距离超过预设距离阈值,则认为该门牌误差比较大,丢弃该门牌。
如图2中的36号门牌,计算得到该门牌到道路的垂直距离为13米,小于预设距离阈值50米,则进行镜像移动到如图4所示的36号的位置。
步骤S307、分别确定道路的奇数侧和偶数侧中门牌号码的分布规律,将不符合分布规律且与邻近门牌的号码之差超过预设阈值的门牌过滤掉。
本步骤的处理与实施例一中的步骤S104相同。
对于图2中的1号门牌,经过步骤S305和步骤S306处理由原来所在道路的B侧移动到A侧,移动后的该门牌不符合分布规律,而且与邻近门牌75号的号码之差超过了预设阈值,因而将该门牌丢弃。
步骤S308、分别对道路两侧中相邻的门牌号码进行比较,去除重复的门牌。
经过前面步骤的处理之后,道路两侧的门牌号码已是奇偶性准确且排列顺序基本符合门牌编排规律的门牌了。此时,重复的门牌只可能是相邻的两个门牌,所以本步骤中只对相邻的门牌进行比较,可以提高效率。
如图2所示,包括2个相邻的46号门牌,可任意去除其中一个门牌,经过处理之后的门牌,如图4所示。
值得一提的是,本步骤是为了去除道路门牌数据中的重复数据,本发明也可以不对该步骤的处理顺序加以限定。
例如,本步骤还可以设置在步骤S303之后,在门牌号码分到道路两侧后,就对道路两侧中的门牌号码进行比较,选出重复的门牌。或者,本步骤也可以设置在步骤S306之后,对进行奇偶性校验后的道路奇数侧和偶数侧中的门牌号码进行比较,选出重复的门牌。再将选出的这些重复的门牌与各自相邻门牌进行比较,去除与相邻门牌的号码奇偶性不相同或者与相邻门牌的号码之差超过预设阈值的门牌。
本发明可以有效地找出空间位置错误、奇偶排列错误以及顺序排列错误的门牌,并对处于误差范围内的问题门牌予以纠正,丢弃误差范围之外的问题门牌,提高道路门牌数据的准确性。
以上是对本发明所提供的方法进行的详细描述,下面对本发明提供的道路门牌数据的校验装置进行详细描述。
实施例三
图5是本实施例提供的道路门牌数据的校验装置示意图。如图5所示,该装置包括:
输入模块501,用于获取待校验的道路门牌数据。
道路门牌数据通常分为两部分,一是道路数据,二是门牌数据。道路数据包括道路编号、道路名称和道路形状等信息,门牌数据包括门牌所在的道路编号、门牌编号、门牌号码和空间位置等信息,空间位置信息通常采用X/Y坐标值或经纬度来表示该数据点。
道路门牌数据可以但不限于采用如表1和表2所示的存储方式。
门牌位置确定模块502,用于将输入模块501所获取的道路门牌数据中各门牌分配到对应所在道路的两侧。具体包括:
信息提取子模块5021,用于从输入模块501获取的道路门牌数据中提取各门牌所在的道路信息和对应的门牌号码。
例如,道路门牌数据中包括“宣武区上斜街63号”和其空间位置坐标,可以提取得到道路信息为“上斜街”和对应的门牌号码“63号”。
位置确定子模块5022,用于根据所述道路门牌数据中各门牌的空间位置,将各门牌对应的门牌号码分到所在道路的两侧。
根据“宣武区上斜街63号”的空间位置信息,将该门牌号码对应分到“上斜街”道路的一侧。
每条道路都有道路形状,其包含的形状数据通常采用折线的方式进行表示。如表1中所示的道路形状,采用“line:12954830.950000,4824191.520000;12955076.220000,4824311.180000;12955585.420000,4824341.430000”来表示,该折线由“12954830.950000,4824191.520000”、“12955076.220000,4824311.180000”和“12955585.420000,4824341.430000”这3个点形成,即图2中所示的点D1、D2和D3。
根据道路门牌的空间位置信息中点坐标值,将各门牌分配到对应所在道路的两侧。如表2中,利用道路门牌数据中的空间位置信息与道路形状之间的关系,可以将门牌号码对应到该道路的两侧。
经过本模块的处理,将各门牌分到道路的两侧,图2为某一区域地图上部分门牌号码的初始状态示意图,如图2所示,道路“上斜街”上的门牌分配在该道路的两侧。
奇偶侧确定模块503,用于针对同一道路,分别统计道路两侧的门牌号码的奇数个数和偶数个数,确定道路的奇数侧和偶数侧。
将所有的门牌号码分到道路两侧后,统计各道路两侧的门牌号码的奇数个数和偶数个数。
在确定道路的奇偶侧时,可以但不限于采用如下方法:
假设道路两侧分别为A侧和B侧,统计到A侧中偶数门牌号码的数目为a,奇数门牌号码的数目为b,统计到B侧中偶数门牌号码的数目为c,奇数门牌号码的数目为d。
如果上述不等式1成立,则说明道路的A侧为偶数侧,道路的B侧为奇数侧。反之,道路的A侧为奇数侧,道路的B侧为偶数侧。
经过本模块的判断,可以得到图2中道路“上斜街”的A侧为奇数侧,B侧为偶数侧。
根据门牌的编排规则可知,上述不等式1一般不会出现相等的情形,如果统计到道路两侧奇偶数目均相等或其他情形导致不等式两边相等时,说明提供的道路门牌数据不足,无法判断其奇偶分布情况,待收集更多的道路门牌数据后再进行判断。
排序校验模块504,用于分别确定道路的奇数侧和偶数侧中门牌号码的分布规律,将不符合分布规律且与邻近门牌的号码之差超过预设阈值的门牌过滤掉。
排序校验模块504确定道路的奇数侧和偶数侧中门牌号码的分布规律,可以但不限于配置为以下两种方式:
针对同一道路的同一侧,寻找道路门牌数据中最长递增或递减子序列,以该最长递增或递减子序列的排序规律作为该侧门牌号码的分布规律。
具体地,计算门牌的最长递增或递减子序列,可以采用现有的动态规划等通用算法来计算。
或者,分别以道路的两端作为起点,计算各门牌与所述起点之间沿所在道路的距离,找出门牌号码中的逆序对,统计所述逆序对个数,将逆序对个数少的端点确定为道路的起点端,以该起点端依次递增确定为所述门牌号码的分布规律。
例如,以数组C[5]=(3,1,4,5,2)查找逆序对为例,以数据C的值C[i]代表号码牌,数据C的顺序i代表距离端点的距离,如果满足i<j且C[i]>C[j]则为一个逆序对。
先以3为端点,当i=0时,C[0]=3,当j=1时,C[1]=1,满足i<j且C[i]>C[j],则(3,1)为一个逆序对,依次类推,可以找到的逆序对包括(3,1)、(3,2)、(4,2)和(5,2)。
再以2为端点,当i=0时,C[0]=2,当j=3时,C[1]=1,满足i<j且C[i]>C[j],则(2,1)为一个逆序对,依次类推,可以找到的逆序对包括(2,1)、(5,4)、(5,1)、(5,3)、(4,1)和(4,3)。
将逆序对个数少的端点确定为道路的起点,则以3为端点,并以该起点端依次递增确定为所述门牌号码的分布规律。
或者,通过不断删除包含在最多逆序对里的号码,直到没有逆序对,例如,在(3,1)、(3,2)、(4,2)和(5,2)包含最多的号码是2,则删除该号码2,数组C变为(3,1,4,5),新的数组还有一个逆序对(3,1),则再删除3或1后,新的数组将没有逆序对。而后将该序列递增规律确定为门牌号码的分布规律。
通过上述方法可以确定图2中道路“上斜街”奇数侧和偶数侧的排列顺序是沿着D1-D2-D3方向依次递减。
所述预设阈值可根据实际经验进行设定,如可以设定为30,对于不符合分布规律且号码之差超过该阈值的门牌,认为是错误的数据,予以删除。如图2中的3号门牌,该门牌位于51号和63号门牌之间,由于与临近门牌的号码之差大于预设阈值30,则可以判断该门牌为错误的门牌数据。
对于不符合分布规律,但与邻近门牌的号码之差小于预设阈值的门牌,则认为是可以接受的道路门牌数据误差或者是符合实际情形的门牌,不对该些门牌作处理。
如图2中的52号门牌,该门牌在顺序排列上不符合沿着D1到D3递减的分布规律,由于该门牌与邻近的门牌48号与50号的号码之差小于预设阈值30,则认为该门牌是可以接受的。
实施例四、
图6是本实施例提供的道路门牌数据的校验装置示意图,如图6所示,包括:
输入模块601,用于获取待校验的道路门牌数据。
门牌位置确定模块602,用于将输入模块601获取的道路门牌数据中提取各门牌所在的道路信息和对应的门牌号码。
奇偶侧确定模块603,用于针对同一道路,分别统计道路两侧的门牌号码的奇数个数和偶数个数,确定道路的奇数侧和偶数侧。
上述模块601、602和603与实施例三中的模块501、502和503对应相同,于此不再赘述。
奇偶性校验模块604,用于在所述奇偶侧确定模块确定道路的奇数侧和偶数侧之后,将分布在奇数侧上偶数号码的门牌移动到偶数侧,将分布在偶数侧上奇数号码的门牌移动到奇数侧。具体配置为:
判断奇数侧上偶数号码的门牌或偶数侧上奇数号码的门牌与所在道路的垂直距离是否超过预设距离阈值。如果是,将分布在奇数侧上偶数号码的门牌移动到偶数侧,将分布在偶数侧上奇数号码的门牌移动到奇数侧,否则,删除对应的道路门牌数据。
所述预设距离阈值根据实际应用时要求的地址匹配精度来确定,将误差控制在一定的范围内。例如,可以定为50米,即最多只能移动100米。
每个道路门牌到道路都有一个垂直距离,如果一个奇数号码的门牌在道路的偶数侧上,并且与道路的垂直距离小于预设阈值,在将该门牌镜像移动到对应的奇数侧。
如果奇偶性错误的门牌到道路的垂直距离超过预设距离阈值,则认为该门牌误差比较大,丢弃该门牌。
如图2中的36号门牌,计算得到该门牌到道路的垂直距离为13米,小于预设距离阈值50米,则进行镜像移动到如图4所示的36号的位置。
排序校验模块605,用于分别确定道路的奇数侧和偶数侧中门牌号码的分布规律,将不符合分布规律且与邻近门牌的号码之差超过预设阈值的门牌过滤掉。
本模块的配置与实施例三中的模块504的配置相同。
对于图2中的1号门牌,经过奇偶性校验模块604处理由原来所在道路的B侧移动到A侧,移动后的该门牌不符合分布规律,而且与邻近门牌75号的号码之差超过了预设阈值,因而将该门牌丢弃。
重复校验模块606,用于分别对所述排序校验模块605过滤后剩余的在奇数侧和偶数侧中相邻的门牌号码进行比较,去除重复的门牌。
经过前面模块的处理之后,道路两侧的门牌号码已是奇偶性准确且排列顺序基本符合门牌编排规律的门牌了。此时,重复的门牌只可能是相邻的两个门牌,所以本模块中只对相邻的门牌进行比较,可以提高效率。
如图2所示,包括2个相邻的46号门牌,可任意去除其中一个门牌,经过处理之后的门牌,如图4所示。
值得一提的是,重复校验模块606是为了去除道路门牌数据中的重复数据,本发明不对该模块的具体设置位置加以限定。
例如,重复检验模块606还可以设置于门牌位置确定模块602之后,用于分别对所述门牌位置确定模块602确定的道路两侧中的门牌号码进行比较,选出重复的门牌。
或者,重复检验模块606也可以设置于奇偶性校验模块604之后,用于分别对所述奇偶性校验模块604校验后的道路奇数侧和偶数侧中的门牌号码进行比较,选出重复的门牌。
对于选出的重复门牌,再将该些门牌与各自相邻门牌进行比较,去除与相邻门牌的号码奇偶性不相同或者与相邻门牌的号码之差超过预设阈值的门牌。
本发明提供的道路门牌数据的校验方法和装置,利用道路门牌编排的规律对地理信息数据中的道路门牌数据进行自动校验,有效地找出空间位置错误、奇偶排列错误以及顺序排列错误的门牌,并对处于误差范围内的问题门牌予以纠正,丢弃误差范围之外的问题门牌,提高道路门牌数据的准确率,以利于后续对道路数据进行有效插值,提高门牌定位服务的准确率和召回率。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (16)

1.一种道路门牌数据的校验方法,其特征在于,包括以下步骤:
S1、获取待校验的道路门牌数据;
S2、将所获取的道路门牌数据中各门牌分配到对应所在道路的两侧;
S3、针对同一道路,分别统计道路两侧的门牌号码的奇数个数和偶数个数,确定道路的奇数侧和偶数侧;
S4、分别确定道路的奇数侧和偶数侧中门牌号码的分布规律,将不符合分布规律且与邻近门牌的号码之差超过预设阈值的门牌过滤掉。
2.根据权利要求1所述的方法,其特征在于,所述道路门牌数据包括各门牌所在的道路编号、道路名称、道路形状、门牌编号、门牌号码和空间位置信息。
3.根据权利要求1所述的方法,其特征在于,所述步骤S2具体包括:
S2_1、从所获取的道路门牌数据中提取各门牌所在的道路信息和对应的门牌号码;
S2_2、根据所述道路门牌数据中各门牌的空间位置,将各门牌对应的门牌号码分到所在道路的两侧。
4.根据权利要求1所述的方法,其特征在于,在所述步骤S3和步骤S4之间还包括:
S3_1、将分布在奇数侧上偶数号码的门牌移动到偶数侧,将分布在偶数侧上奇数号码的门牌移动到奇数侧。
5.根据权利要求4所述的方法,其特征在于,在所述步骤S3_1之前,还包括:
判断奇数侧上偶数号码的门牌或偶数侧上奇数号码的门牌与所在道路的垂直距离是否超过预设阈值,仅对不超过预设阈值的门牌执行步骤S3_1。
6.根据权利要求1所述的方法,其特征在于,所述确定道路的奇数侧和偶数侧中门牌号码的分布规律,具体包括:
针对同一道路的同一侧,寻找道路门牌数据中最长递增或递减子序列,以该最长递增或递减子序列的排序规律作为该侧门牌号码的分布规律。
7.根据权利要求1所述的方法,其特征在于,所述确定道路的奇数侧和偶数侧中门牌号码的分布规律,具体包括:
分别以道路的两端作为起点,计算各门牌与所述起点之间沿所在道路的距离,找出门牌号码中的逆序对,统计所述逆序对个数,将逆序对个数少的端点确定为道路的起点端,以该起点端依次递增确定为所述门牌号码的分布规律。
8.根据权利要求1所述的方法,其特征在于,在所述步骤S4之后,还包括:
分别对道路两侧中相邻的门牌号码进行比较,去除重复的门牌。
9.一种道路门牌数据的校验装置,其特征在于,包括:
输入模块,用于获取待校验的道路门牌数据;
门牌位置确定模块,用于将所述输入模块获取的道路门牌数据中各门牌分配到对应所在道路的两侧;
奇偶侧确定模块,用于针对同一道路,分别统计道路两侧的门牌号码的奇数个数和偶数个数,确定道路的奇数侧和偶数侧;
排序校验模块,用于分别确定道路的奇数侧和偶数侧中门牌号码的分布规律,将不符合分布规律且与邻近门牌的号码之差超过预设阈值的门牌过滤掉。
10.根据权利要求9所述的装置,其特征在于,所述道路门牌数据包括各门牌所在的道路编号、道路名称、道路形状、门牌编号、门牌号码和空间位置信息。
11.根据权利要求9所述的装置,其特征在于,所述门牌位置确定模块包括:
信息提取子模块,用于从所述输入模块获取的道路门牌数据中提取各门牌所在的道路信息和对应的门牌号码;
位置确定子模块,用于根据所述道路门牌数据中各门牌的空间位置,将各门牌对应的门牌号码分到所在道路的两侧。
12.根据权利要求9所述的装置,其特征在于,该装置还包括:
奇偶性校验模块,用于在所述奇偶侧确定模块确定道路的奇数侧和偶数侧之后,将分布在奇数侧上偶数号码的门牌移动到偶数侧,将分布在偶数侧上奇数号码的门牌移动到奇数侧。
13.根据权利要求12所述的装置,其特征在于,所述奇偶性校验模块在进行移动门牌之前,还包括:
判断奇数侧上偶数号码的门牌或偶数侧上奇数号码的门牌与所在道路的垂直距离是否超过预设阈值,仅对不超过预设阈值的门牌进行移动。
14.根据权利要求9所述的装置,其特征在于,所述排序校验模块确定道路的奇数侧和偶数侧中门牌号码的分布规律,具体配置为:
针对同一道路的同一侧,寻找道路门牌数据中最长递增或递减子序列,以该最长递增或递减子序列的排序规律作为该侧门牌号码的分布规律。
15.根据权利要求9所述的装置,其特征在于,所述排序校验模块确定道路的奇数侧和偶数侧中门牌号码的分布规律,具体配置为:
分别以道路的两端作为起点,计算各门牌与所述起点之间沿所在道路的距离,找出门牌号码中的逆序对,统计所述逆序对个数,将逆序对个数少的端点确定为道路的起点端,以该起点端依次递增确定为所述门牌号码的分布规律。
16.根据权利要求9所述的装置,其特征在于,该装置还包括:
重复校验模块,用于分别对道路两侧中相邻的门牌号码进行比较,去除重复的门牌。
CN201210543889.9A 2012-12-14 2012-12-14 一种道路门牌数据的校验方法和装置 Active CN103021260B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210543889.9A CN103021260B (zh) 2012-12-14 2012-12-14 一种道路门牌数据的校验方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210543889.9A CN103021260B (zh) 2012-12-14 2012-12-14 一种道路门牌数据的校验方法和装置

Publications (2)

Publication Number Publication Date
CN103021260A CN103021260A (zh) 2013-04-03
CN103021260B true CN103021260B (zh) 2017-07-04

Family

ID=47969813

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210543889.9A Active CN103021260B (zh) 2012-12-14 2012-12-14 一种道路门牌数据的校验方法和装置

Country Status (1)

Country Link
CN (1) CN103021260B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110375763B (zh) * 2018-04-12 2023-05-23 博泰车联网科技(上海)股份有限公司 搜索兴趣点的方法、装置及智能终端
CN110413904A (zh) * 2019-07-25 2019-11-05 北京百度网讯科技有限公司 一种兴趣点地址数据处理方法、装置、服务器和介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101608925A (zh) * 2009-07-10 2009-12-23 北京四维图新科技股份有限公司 导航电子地图地理要素信息的反馈方法、终端及服务器
CN102496332A (zh) * 2011-12-15 2012-06-13 北京易华录信息技术股份有限公司 一种基于地理位置的道路信息编码系统及其编码方法
CN102609499A (zh) * 2012-02-01 2012-07-25 阎剩勇 一种基于街道的信息系统构建方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110063824A (ko) * 2008-10-07 2011-06-14 톰톰 인터내셔날 비.브이. 지도 데이터 교정 검증
JP2011112777A (ja) * 2009-11-25 2011-06-09 Alpine Electronics Inc リンク情報における番地関連情報の決定方法および補正方法ならびにナビゲーション装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101608925A (zh) * 2009-07-10 2009-12-23 北京四维图新科技股份有限公司 导航电子地图地理要素信息的反馈方法、终端及服务器
CN102496332A (zh) * 2011-12-15 2012-06-13 北京易华录信息技术股份有限公司 一种基于地理位置的道路信息编码系统及其编码方法
CN102609499A (zh) * 2012-02-01 2012-07-25 阎剩勇 一种基于街道的信息系统构建方法

Also Published As

Publication number Publication date
CN103021260A (zh) 2013-04-03

Similar Documents

Publication Publication Date Title
CN102867004B (zh) 一种地址匹配的方法及设备
KR101347467B1 (ko) 이동 국가 코드를 이용한 위치 필터링
AU2012339408B2 (en) Method and server for searching for nearby user in social network
EP2604977B1 (en) Apparatus and method for performing map matching
CN106575294B (zh) 一种轨迹数据查询的方法及装置
CN109936819B (zh) 上车点推荐方法、装置及设备
CN105933294A (zh) 网络用户定位方法、装置及终端
CN105828292A (zh) 一种基于地理围栏的位置检测方法及装置
CN106919567B (zh) 一种兴趣点poi地址的处理方法及装置
US10429190B2 (en) Vehicle localization based on wireless local area network nodes
CN102080963A (zh) 建立兴趣点与对应兴趣点图像间的关联关系的方法和装置
CN110399445B (zh) 一种兴趣点的处理方法、装置及设备
JP2014505241A (ja) 位置決定方法
KR20110055897A (ko) 신뢰도 기반의 무선랜 ap를 이용한 무선 디바이스의 실시간 위치 추적 시스템 및 방법
CN106708837A (zh) 兴趣点搜索方法、装置
CN103856893B (zh) 一种过滤定位信息的方法及装置
CN103929719A (zh) 定位信息的优化方法和优化装置
CN109257714B (zh) 一种基于iBeacon的室内定位及辅助导航方法、装置及系统
CN103021260B (zh) 一种道路门牌数据的校验方法和装置
KR20110033982A (ko) 지리적 위치에 대한 현재측정값을 지도물체에 할당하는 장치 및 방법
JP2013061270A (ja) 現在位置算出装置および現在位置算出方法
CN105101089B (zh) 一种实现定位的方法、相关装置及系统
JP2020046219A (ja) 情報処理装置および情報処理システム
CN112770326B (zh) LoRa网关部署方法、装置、设备及存储介质
CN104135547B (zh) 一种ip地址属性验证方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant