CN106294384A - 发现新路名的方法及装置 - Google Patents

发现新路名的方法及装置 Download PDF

Info

Publication number
CN106294384A
CN106294384A CN201510256164.5A CN201510256164A CN106294384A CN 106294384 A CN106294384 A CN 106294384A CN 201510256164 A CN201510256164 A CN 201510256164A CN 106294384 A CN106294384 A CN 106294384A
Authority
CN
China
Prior art keywords
road name
address
name
candidate sequence
path
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510256164.5A
Other languages
English (en)
Other versions
CN106294384B (zh
Inventor
王瑜
王瑞
叶舟
王金明
闵万里
傅巍伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Network Technology Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201510256164.5A priority Critical patent/CN106294384B/zh
Publication of CN106294384A publication Critical patent/CN106294384A/zh
Application granted granted Critical
Publication of CN106294384B publication Critical patent/CN106294384B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Remote Sensing (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Navigation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供一种发现新路名的方法,包括:从地址库中获取包括路名的地址;通过对所述地址进行分词,获得对应于所述地址的使用路名;如果所述使用路名不同于已有的路名,则所述使用路名为新路名。通过本申请的技术方案,为在地图上标示自动发现的新路提供了基础,加快了提高地图完备性和用户便利性的速度。

Description

发现新路名的方法及装置
技术领域
本申请涉及数据处理技术领域,尤其涉及一种发现新路名的方法和装置。
背景技术
一般的道路地图是由测绘人员在对道路进行测绘后制成的。测绘人员驾驶带有GPS(Global Positioning System,全球定位系统)的地图车在被测绘的道路上来回行驶,利用GPS上传的数据、结合途中采集的周边信息来生成地图上的道路路径,并按照市政对道路的命名来标注路名。
由于道路始终随着经济的发展处在不断更新的过程中,经常有新路出现,而专业的道路测绘往往在时间上滞后太多;另外,对一些偏远地区的道路,出于道路的利用率和测绘成本考虑可能不会进行专业测绘。现有技术中,可以利用车辆、行人等的定位数据来发现地图上未标示的道路,但是仍然需要人工来向市政查询这些道路的路名,使得地图上道路的命名严重滞后,对于需要通过道路名称来使用这些道路的情况,比如对要寻找这些道路上的商户或住房的用户来说,在相当长的时间里仍然极为不便。
发明内容
有鉴于此,本申请提供一种发现新路名的方法,包括:
从地址库中获取包括路名的地址;
通过对所述地址进行分词,获得对应于所述地址的使用路名;
如果所述使用路名不同于已有的路名,则所述使用路名为新路名。
本申请还提供了一种发现新路名的装置,包括:
地址获取单元,用于从地址库中获取包括路名的地址;
使用路名单元,用于通过对所述地址进行分词,获得对应于所述地址的使用路名;
新路名单元,用于在所述使用路名不同于已有的路名时,以所述使用路名为新路名。
由以上技术方案可见,本申请的实施例通过对地址库中的地址进行分词,得到对应于地址的使用路名,从中发现不同于已有路名的新路名,为在地图上标示自动发现的新路提供了基础,加快了提高地图完备性和用户便利性的速度。
附图说明
图1是本申请实施例一中一种发现新路名的方法的流程图;
图2是本申请实施例二中一种发现新路名的方法的流程图;
图3是本申请实施例二中一种发现新路路径的方法的流程图;
图4是本申请应用示例中所使用的数据库以及数据处理过程的示意图;
图5是应用本申请实施例的设备的一种硬件结构图;
图6是本申请实施例中的一种发现新路名的装置的逻辑结构图。
具体实施方式
当新建道路、或偏远地区道路周边的商户或住户进行商业活动或处理生活事项时,经常需要留下自己的地址,这些包括新路名的地址会出现在各种地址库中。本申请的实施例提出一种发现新路名的方法,利用在地址库中这些地址来进行新路名的自动发现,加快了对地图上的新道路进行名称标注,以解决现有技术存在的问题。
本申请的实施例可以应用在任何具有运算功能的设备上,其中实施例一的流程如图1所示。
步骤110,从地址库中获取包括路名的地址。
地址库可以是各种保存有地址的数据库,例如,包括收货地址的电商数据库、快递公司包括取件地址的发件人信息数据库和包括送件地址的收件人信息数据库、注册信息包括地址的注册用户信息数据库等等,本申请的实施例中不做限定。
如果地址库中的地址可能存在不包括路名的情况(例如,北京市朝阳区潘家园南里50号楼908,在市辖区后直接以小区名称定位,地址中不出现道路名称),则可以通过在地址中查找是否包括在命名道路时所使用的关键字等方式来去除不包括路名的地址。
步骤120,通过对所获取的地址进行分词,获得对应于该地址的使用路名。
可以采用各种分词技术来对步骤110中所获取的地址进行分词,例如,最少切分法、双向最大匹配法等,本实施例中对所采用的分词算法不做限定。
在分词结果中能够得到该地址中的路名。可以将该地址中的路名作为对应于该地址的使用路名,也可以先对该地址中的路名进行纠错后得到对应于所述地址的使用路名。由于填写地址的用户可能因打字错误、记忆偏差等原因输入有误的路名,采用后一种方式能够提高自动发现新路名的准确性。
需要说明的是,由于对路名纠错时只能采用已有路名作为正确值,而地址中的路名可能是尚未包括在已有路名中的新路名,如果地址中的路名与已有路名不同,既可能是因为地址中的路名是新路名,也可能是因为地址中的路名是错误的已有路名。纠错的结果不是把所有与已有路名不同的地址中的路名更改为正确值(即已有路名),而是筛选出地址中的路名是错误的已有路名的概率超过一定程度的情况,将这种情况下的地址中的路名修改为已有路名。因此,可以根据道路的变化程度、对新路名的准确度要求等实际应用环境的需要来决定所采用的纠错方式。
一种实现方式中,可以采用如下的纠错方式:如果地址中的路名与已有路名相同,则以地址中的路名作为对应于该地址的使用路名;如果地址中的路名不同于已有路名并且不存在与地址中的路名在一定编辑距离(editdistance)内的已有路名,则以地址中的路名作为对应于该地址的使用路名;如果地址中的路名不同于已有路名并且存在与地址中的路名在一定编辑距离内的已有路名(称为候选纠错结果),则根据地址中的路名与候选纠错结果之间的编辑距离、候选纠错结果的词频、和/或候选纠错结果在该地址中的上下文概率,在地址中的路名、候选纠错结果中选择其一来作为对应于该地址的使用路名。
这种实现方式中,编辑距离是将地址中的路名修改为候选纠错结果时所需要进行的编辑操作次数,确定中文词语之间的编辑距离可以考虑所采用的输入法。编辑距离越小,候选纠错结果的词频越高,地址中的路名属于错误输入的可能性越高;此外,路名在地址中的上下文也可以作为判断可能性的参考,例如,地址为杭州市西湖区文一路888号,地址中的路名为文一路,而文一西路在上文为“西湖区”、下文为“888号”之间出现的概率越高,意味着文一路属于错误输入了文一西路的可能性越高。因此,可以采用编辑距离、候选纠错结果的词频、候选纠错结果在地址中的上下文概率中的一个或者多个的组合作为条件,来判断将地址中的路名和一个至多个候选纠错结果中的哪一个作为使用路名。其中,候选纠错结果的词频、候选纠错结果在地址中的上下文概率可以经过对高质量语料库的统计来得到。
步骤130,如果所述使用路名不同于已有的路名,则所述使用路名为新路名。
将不同于已有路名、并且已经在地址库中出现的使用路名,作为新路名。
本实施例中,通过对地址库中的地址进行分词来获得使用路名,并且将不同于已有路名的使用路名作为新路名,为在地图上标示自动发现的新路提供了基础,提高了完善地图的速度,使得用户能够更快的从更加完备的地图中获得便利。
在本申请的实施例二中,对发现的新路路径,利用发现的新路名为其命名,从而自动完成新路路径的发现和命名。其流程如图2所示。
步骤210,从地址库中获取包括路名的地址。
步骤220,通过对所获取的地址进行分词,获得对应于该地址的使用路名。
步骤230,如果所述使用路名不同于已有的路名,则所述使用路名为新路名。
对上述三个步骤的详细描述请参见实施例一,不再重复。
步骤240,利用定位终端的运动轨迹进行新路路径的发现。
定位终端包括各种通过不同定位技术将位置信息上传给定位服务器的移动设备,例如车载定位仪、手机、平板电脑等,所采用的定位技术如GPS、LBS(Location Based Service,移动位置服务)等。定位服务器上定位终端上传的位置和时间信息反映了定位终端的运动轨迹,利用车辆和/或行人的运动轨迹,可以进行新路路径的自动发现。本步骤可以采用各种现有技术中发现新路路径的方法,本实施例不做限定。
需要说明的是,步骤240与步骤210至230之间没有时序关系。
在一种实现方式中,采用图3所示的流程进行新路路径的发现:
步骤310:将在已有路径之外的定位终端的运动轨迹作为候选序列;
获取定位服务器上不同定位终端的运动轨迹,或者同一定位终端在不同时间段的运动轨迹,排除这些运动轨迹中与已有路径重合的部分,将已有路径之外的运动轨迹作为候选序列。换言之,一个候选序列可以是定位服务器上记录的某个定位终端一次完整的运动轨迹,也可以是某个定位终端某次运动轨迹的一部分。
可以根据要发现的新路的类别,选择不同运行速度的定位终端的运动轨迹来生成候选序列,定位终端的运行速度可以由其位置和时间信息计算得出。例如,对发现车辆能够通行的新路即可满足地图的精度要求的场合,可以设置行车阈值,只采用运行速度达到行车阈值的运动轨迹来生成候选序列。还可以根据其他因素来选择用哪些运动轨迹来生成候选序列,如采用某个或某几个确定的定位终端的运动轨迹。
步骤320:根据候选序列起点和终点确定候选序列的中心点,将中心点的距离在第一阈值范围内的候选序列汇集为簇;
步骤310中生成的候选序列中可能包括了多条新路路径。对其中的单个候选序列而言,可能是一条完整的新路路径,也可能是一条新路路径的一部分。可以通过这些候选序列的起点和终点所反映的大致的位置关系,来将可能属于同一条新路路径的候选序列汇集为簇。具体而言,可以将候选序列的起点和终点的经度、纬度分别平均后得到该候选序列的中心点位置,设置第一阈值,把中心点之间的距离在第一阈值范围内的候选序列放在一个簇中。
步骤330:根据簇中候选序列之间的差异程度筛选出近似的候选序列;
中心点位置接近的候选序列可能在运动轨迹上有较大的差异,而且定位系统本身也可能发生误差较大的情形,因此对簇中的候选序列,要按照彼此之间的差异程度,把偏差较大的候选序列过滤掉,保留相互差异程度小的近似的候选序列。
可以按照对新路路径的精度要求、候选序列的数据精准程度、候选序列的多少等因素来选择具体的过滤算法。例如,对精准程度很高的候选序列(如属于某个经营固定线路旅游服务的车辆的若干次GPS定位数据),候选序列的起点之间的距离、终点之间的距离分别在一个较小的阈值内的,都可以认为是近似的候选序列。
一个例子中,可以以N(N为自然数)个相同的经度或纬度分别在每个候选序列上取N个离散点;对簇中的候选序列进行两两对比,将两个候选序列中具有相同的经度或纬度的离散点之间的距离加总后作为对比结果;再根据对比结果筛选出近似的候选序列。在每个候选序列上取N个点,每个候选序列上的第k个点的经度或纬度相同(k为大于等于1,小于等于N的整数);对比簇中的每两个候选序列,将这两个候选序列中第1个点之间的距离、第2个点之间的距离、直到第N个点之间的距离相加作为对比结果;对所有候选序列之间的对比结果,选择若干个相互之间的对比结果都在某个设定阈值内的候选序列作为近似的候选序列。
步骤340:将近似的候选序列平均后得到新路路径;
对筛选出的近似的候选序列,把这些候选序列中相同的经度上的离散点取纬度的平均值、或相同纬度上的离散点取经度的平均值,并将平均后的离散点连接为新路路径。
回到图2,步骤250,将新路路径一定距离内的地址对应的新路名作为该新路路径的名称。
对步骤230中发现的新路名,可以确定对应于新路名的地址的位置,确定地址的位置的具体方式可以采用现有技术中多种具有这一功能的地图服务中的实现,不再赘述。根据这些地址的位置,将新路路径设定距离内的地址对应的新路名作为该新路路径的路名。
可以以新路路径的曲线为中心线、以设定距离的两倍为宽度在地图上标示出一个区域,如果对应于新路名的地址在地图上的位置处于该区域中,则可以根据地址对应的新路名为该新路路径命名。如果处于该区域中的地址所对应的新路名只有一个,则可以将该新路名作为该新路路径的名称;如果处于该区域中的地址所对应的新路名超过一个,则既可以将距离该新路路径最近的一个地址所对应的新路名作为该新路路径的名称,也可以将该区域内对应于最多地址个数的新路名作为该新路路径的名称,还可以根据新路名对应的地址与该新路路径的距离远近、以及新路名的个数,给出该新路路径的可能路名和概率。
这个实施例中,通过自动将新路名和新路路径进行匹配,能够极大的加快在地图上标示新道路的速度,为用户更快的提供便利。
在本申请的一个应用示例中,基于电商的买家收货地址来发现新路名,基于行车GPS数据来发现新路路径,并将新路名和新路路径进行自动匹配,所涉及的数据库及处理流程如图4所示。本应用示例从以下三个数据库中读取数据,电商的买家收货地址数据库、GPS数据库和基础道路数据库,其中,电商的买家收货地址数据库中包括电商的买家收货地址,以买家为主键,例如:
买家A–杭州–文一西路***号*号楼邮局
买家B–杭州–大华西溪风情**栋
买家C–杭州–文一西路888号西溪蝶园*栋*单元***室
买家D–杭州–余杭区新华路良渚文化村**号**栋*单元***室
买家E–杭州–中心路***号第*号邮筒
GPS数据库中记录了各种定位终端的GPS信号的时间和地点;基础道路数据库中记录了已有道路的路径和路名。
从买家收货地址数据库中读取买家的收货地址,采用双向最大匹配法对所读取的地址进行分词,将整个地址先从前向后取词,每次减少一字,利用字典寻找词语进行断句;然后再从后向前重复上述取词的过程;选择大颗粒度词越多且非字典词越少的分词结果,从分词结果中提取出地址中的路名。例如,买家E的地址拆分为:中心路–***号–第*号邮筒,地址中的路名为中心路。
在基础道路数据库中查找是否有与地址中的路名相同的已有路名,如果有,则以地址中的路名为使用路名;如果没有,基于利用高质量的语料得到的每个已有路名的词频,对与地址中的路名在一定编辑距离内的已有路名,计算“词频/编辑距离”,将超过某个预定值的已有路名中“词频/编辑距离”最大的一个作为使用路名。
对比使用路名和基础道路数据库中的已有路名,将与已有路名不同的使用路名作为新路名,保存在候选新路名数据库中。新路名数据库以单个路名为主键,特征包括:省、市、县等。
可以每隔一定时间重复上述生成新路名的过程,例如,每30天进行一次,则在最近30天内最新被使用的路名会出现在候选新路名数据库中。
从GPS数据库中读取定位终端的时间和地点信息,以同一个定位终端为主键,生成该定位终端的运动轨迹;计算该定位终端的运行速度,去除运行速度低于行车阈值的定位终端的运动轨迹,以便将行车轨迹提取出来,过滤掉行人产生的运动轨迹。
然后,对行车轨迹进行统一的模式识别,生成新路路径。具体而言,利用基础道路数据库,提取出行车轨迹在已有道路之外的运动轨迹作为候选序列;计算每个候选序列的中心点经纬度,将中心点之间的距离在第一阈值范围内的候选序列提取出来归为一个簇;在簇中的每个候选序列上取N个离散点,每个候选序列上的第k个离散点的经度相同,并且相邻两个离散点之间间隔的经度值相同;遍历簇中两个候选序列的所有组合,计算每个组合中两个候选序列具有相同经度的离散点之间的距离之和,作为该组合中两个候选学之间的对比结果;把相互之间的对比结果都在第二阈值范围内的候选序列作为近似的候选序列;将近似的候选序列上具有相同经度的离散点的纬度值做平均,以离散点的经度值和平均后的纬度值来作为新路路径上的一个离散点,并用N个离散点生成新路路径。生成的新路路径保存在候选新路路径数据库中。
从候选新路名数据库中读取新路名,从候选新路路径数据库中读取新路路径,选取地理位置距离新路路径最近的新路名作为该新路路径的路名建议。如果某个新路路径附近有对应于多个新路名的地址,则可以给出该路径的路名为这些新路名的概率,例如对某条新路路径A,称为新路名X的可能性为60%,称为新路名Y的可能性为40%。
与上述流程实现对应,本申请的实施例还提供了一种发现新路名的装置。该装置可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为逻辑意义上的装置,是通过该装置所在的设备的CPU(Central Process Unit,中央处理器)将对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言,除了图5所示的CPU、内存以及非易失性存储器之外,发现新路名的装置所在的设备还包括用于实现网络通信功能的板卡等其他硬件。
图6所示为本实施例提供的一种发现新路名的装置,包括地址获取单元、使用路名单元和新路名单元,其中:地址获取单元用于从地址库中获取包括路名的地址;使用路名单元用于通过对所述地址进行分词,获得对应于所述地址的使用路名;新路名单元用于在所述使用路名不同于已有的路名时,以所述使用路名为新路名。
可选的,所述装置还包括新路路径发现单元和路名与路径匹配单元,其中:新路路径发现单元用于利用定位终端的运动轨迹进行新路路径的发现;路名与路径匹配单元用于将所述新路路径一定距离内的地址对应的新路名作为所述新路路径的名称。
可选的,所述路名与路径匹配单元具体用于:根据新路名对应的地址与所述新路路径的距离远近、以及新路名的个数,给出所述新路路径的可能路名和概率。
可选的,所述新路路径发现单元包括候选序列模块、簇生成模块、近似候选序列筛选模块和新路路径生成模块,其中:候选序列模块用于将在已有路径之外的定位终端的运动轨迹作为候选序列;簇生成模块用于根据候选序列起点和终点确定候选序列的中心点,将中心点的距离在第一阈值范围内的候选序列汇集为簇;近似候选序列筛选模块用于根据簇中候选序列之间的差异程度筛选出近似的候选序列;新路路径生成模块用于将所述近似的候选序列平均后得到新路路径。
可选的,所述近似候选序列筛选模块包括离散点子模块、对比结果子模块和筛选子模块,其中:离散点子模块用于在每个候选序列上取N个离散点,每个候选序列上的第k个离散点具有相同的经度或纬度;N为自然数,k为1到N之间的自然数;对比结果子模块用于对簇中的候选序列进行两两对比,将两个候选序列中具有相同的经度或纬度的离散点之间的距离加总后作为对比结果;筛选子模块用于根据所述对比结果筛选出近似的候选序列。
可选的,所述定位终端的运动轨迹为运行速度超过行车阈值的运动轨迹。
可选的,所述使用路名单元包括分词模块和纠错模块,其中:分词模块用于通过分词获得所述地址中的路名;纠错模块用于对所述地址中的路名进行纠错后得到对应于所述地址的使用路名。
可选的,所述纠错模块具体用于:当所述地址中的路名不同于已有路名时,如果不存在与所述地址中的路名在一定编辑距离内的已有路名,则以所述地址中的路名作为对应于所述地址的使用路名;如果存在,则根据所述地址中的路名与所述已有路名之间的编辑距离、所述已有路名的词频、和/或所述已有路名在所述地址中的上下文概率,在所述地址中的路名、所述已有路名中择一来作为对应于所述地址的使用路名。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

Claims (16)

1.一种发现新路名的方法,其特征在于,包括:
从地址库中获取包括路名的地址;
通过对所述地址进行分词,获得对应于所述地址的使用路名;
如果所述使用路名不同于已有的路名,则所述使用路名为新路名。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
利用定位终端的运动轨迹进行新路路径的发现;
将所述新路路径一定距离内的地址对应的新路名作为所述新路路径的名称。
3.根据权利要求2所述的方法,其特征在于,所述将新路路径一定距离内的地址对应的新路名作为所述新路路径的名称,包括:
根据新路名对应的地址与所述新路路径的距离远近、以及新路名的个数,给出所述新路路径的可能路名和概率。
4.根据权利要求2所述的方法,其特征在于,所述利用定位终端的运动轨迹进行新路路径的发现,包括:
将在已有路径之外的定位终端的运动轨迹作为候选序列;
根据候选序列起点和终点确定候选序列的中心点,将中心点的距离在第一阈值范围内的候选序列汇集为簇;
根据簇中候选序列之间的差异程度筛选出近似的候选序列;
将所述近似的候选序列平均后得到新路路径。
5.根据权利要求4所述的方法,其特征在于,所述根据簇中候选序列之间的差异程度筛选出近似的候选序列,包括:
在每个候选序列上取N个离散点,每个候选序列上的第k个离散点具有相同的经度或纬度;N为自然数,k为1到N之间的自然数;
对簇中的候选序列进行两两对比,将两个候选序列中具有相同的经度或纬度的离散点之间的距离加总后作为对比结果;
根据所述对比结果筛选出近似的候选序列。
6.根据权利要求2所述的方法,其特征在于,所述定位终端的运动轨迹为运行速度超过行车阈值的运动轨迹。
7.根据权利要求1至6任意一项所述的方法,其特征在于,所述通过对地址进行分词,获得对应于所述地址的使用路名,包括:
通过分词获得所述地址中的路名;
对所述地址中的路名进行纠错后得到对应于所述地址的使用路名。
8.根据权利要求7所述的方法,其特征在于,所述对地址中的路名进行纠错后得到对应于所述地址的使用路名,包括:
当所述地址中的路名不同于已有路名时,如果不存在与所述地址中的路名在一定编辑距离内的已有路名,则以所述地址中的路名作为对应于所述地址的使用路名;如果存在,则根据所述地址中的路名与所述已有路名之间的编辑距离、所述已有路名的词频、和/或所述已有路名在所述地址中的上下文概率,在所述地址中的路名、所述已有路名中择一来作为对应于所述地址的使用路名。
9.一种发现新路名的装置,其特征在于,包括:
地址获取单元,用于从地址库中获取包括路名的地址;
使用路名单元,用于通过对所述地址进行分词,获得对应于所述地址的使用路名;
新路名单元,用于在所述使用路名不同于已有的路名时,以所述使用路名为新路名。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:
新路路径发现单元,用于利用定位终端的运动轨迹进行新路路径的发现;
路名与路径匹配单元,用于将所述新路路径一定距离内的地址对应的新路名作为所述新路路径的名称。
11.根据权利要求10所述的装置,其特征在于,所述路名与路径匹配单元具体用于:根据新路名对应的地址与所述新路路径的距离远近、以及新路名的个数,给出所述新路路径的可能路名和概率。
12.根据权利要求10所述的装置,其特征在于,所述新路路径发现单元包括:
候选序列模块,用于将在已有路径之外的定位终端的运动轨迹作为候选序列;
簇生成模块,用于根据候选序列起点和终点确定候选序列的中心点,将中心点的距离在第一阈值范围内的候选序列汇集为簇;
近似候选序列筛选模块,用于根据簇中候选序列之间的差异程度筛选出近似的候选序列;
新路路径生成模块,用于将所述近似的候选序列平均后得到新路路径。
13.根据权利要求12所述的装置,其特征在于,所述近似候选序列筛选模块包括:
离散点子模块,用于在每个候选序列上取N个离散点,每个候选序列上的第k个离散点具有相同的经度或纬度;N为自然数,k为1到N之间的自然数;
对比结果子模块,用于对簇中的候选序列进行两两对比,将两个候选序列中具有相同的经度或纬度的离散点之间的距离加总后作为对比结果;
筛选子模块,用于根据所述对比结果筛选出近似的候选序列。
14.根据权利要求10所述的装置,其特征在于,所述定位终端的运动轨迹为运行速度超过行车阈值的运动轨迹。
15.根据权利要求9至14任意一项所述的装置,其特征在于,所述使用路名单元包括:
分词模块,用于通过分词获得所述地址中的路名;
纠错模块,用于对所述地址中的路名进行纠错后得到对应于所述地址的使用路名。
16.根据权利要求15所述的装置,其特征在于,所述纠错模块具体用于:
当所述地址中的路名不同于已有路名时,如果不存在与所述地址中的路名在一定编辑距离内的已有路名,则以所述地址中的路名作为对应于所述地址的使用路名;如果存在,则根据所述地址中的路名与所述已有路名之间的编辑距离、所述已有路名的词频、和/或所述已有路名在所述地址中的上下文概率,在所述地址中的路名、所述已有路名中择一来作为对应于所述地址的使用路名。
CN201510256164.5A 2015-05-19 2015-05-19 发现新路名的方法及装置 Active CN106294384B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510256164.5A CN106294384B (zh) 2015-05-19 2015-05-19 发现新路名的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510256164.5A CN106294384B (zh) 2015-05-19 2015-05-19 发现新路名的方法及装置

Publications (2)

Publication Number Publication Date
CN106294384A true CN106294384A (zh) 2017-01-04
CN106294384B CN106294384B (zh) 2019-09-03

Family

ID=57633168

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510256164.5A Active CN106294384B (zh) 2015-05-19 2015-05-19 发现新路名的方法及装置

Country Status (1)

Country Link
CN (1) CN106294384B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107292396A (zh) * 2017-08-14 2017-10-24 南宁学院 一种水电设备报修消息处理方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100305842A1 (en) * 2009-05-27 2010-12-02 Alpine Electronics, Inc. METHOD AND APPARATUS TO FILTER AND DISPLAY ONLY POIs CLOSEST TO A ROUTE
CN101996247A (zh) * 2010-11-10 2011-03-30 百度在线网络技术(北京)有限公司 地址数据库的建构方法及装置
CN102853846A (zh) * 2011-06-30 2013-01-02 北京畅联万方科技有限公司 一种道路导航数据拓扑关系正确性的批量测试方法
CN102902596A (zh) * 2012-09-29 2013-01-30 北京百度网讯科技有限公司 一种兴趣点数据校验方法及装置
CN103514235A (zh) * 2012-06-30 2014-01-15 北京百度网讯科技有限公司 一种增量码库的建立方法和装置
CN103714092A (zh) * 2012-09-29 2014-04-09 北京百度网讯科技有限公司 一种地理位置的搜索方法和装置
CN104572902A (zh) * 2014-12-26 2015-04-29 北京中交兴路车联网科技有限公司 一种信息点匹配的方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100305842A1 (en) * 2009-05-27 2010-12-02 Alpine Electronics, Inc. METHOD AND APPARATUS TO FILTER AND DISPLAY ONLY POIs CLOSEST TO A ROUTE
CN101996247A (zh) * 2010-11-10 2011-03-30 百度在线网络技术(北京)有限公司 地址数据库的建构方法及装置
CN102853846A (zh) * 2011-06-30 2013-01-02 北京畅联万方科技有限公司 一种道路导航数据拓扑关系正确性的批量测试方法
CN103514235A (zh) * 2012-06-30 2014-01-15 北京百度网讯科技有限公司 一种增量码库的建立方法和装置
CN102902596A (zh) * 2012-09-29 2013-01-30 北京百度网讯科技有限公司 一种兴趣点数据校验方法及装置
CN103714092A (zh) * 2012-09-29 2014-04-09 北京百度网讯科技有限公司 一种地理位置的搜索方法和装置
CN104572902A (zh) * 2014-12-26 2015-04-29 北京中交兴路车联网科技有限公司 一种信息点匹配的方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107292396A (zh) * 2017-08-14 2017-10-24 南宁学院 一种水电设备报修消息处理方法
CN107292396B (zh) * 2017-08-14 2020-05-05 南宁学院 一种水电设备报修消息处理方法

Also Published As

Publication number Publication date
CN106294384B (zh) 2019-09-03

Similar Documents

Publication Publication Date Title
US10101165B2 (en) Electronic device and method for planning tour route
US10034141B2 (en) Systems and methods to identify home addresses of mobile devices
CN100523735C (zh) 一种基于小网格路网组织结构的快速地图匹配方法
CN103092909B (zh) 一种用于结构化导航数据库的技术
CN102142215B (zh) 一种顾及位置与速度的地理信息自适应语音讲解方法
CN103471610B (zh) 一种支持在线、离线双模式的导航方法
CN102147795A (zh) 兴趣点检索方法、兴趣点检索装置和导航系统
CN109074532A (zh) 使用集群来确定所估计的收取/投递窗口
US9250075B2 (en) Generating travel time data
CN107124695A (zh) 基于联系人信息来标注被访问的位置的方法和系统
CN110020224B (zh) 地图兴趣点数据的关联方法、装置、设备及介质
CN107766433A (zh) 一种基于Geo‑BTree的范围查询方法及装置
CN103808325A (zh) 交通出行方案的生成方法及装置
US10672114B1 (en) Computationally efficient distance-based score approximations
CN104199860A (zh) 一种基于二维地理位置信息的数据集分片方法
CN104034340A (zh) 具有反欺骗者机制的导航系统及其操作的方法
CN111008255A (zh) 违章地点识别方法、装置、电子设备及存储介质
CN111931077B (zh) 数据处理方法、装置、电子设备及存储介质
CN111522892A (zh) 地理要素的检索方法及装置
AU2013360865B2 (en) Method and apparatus for vehicle usage recording
US10809072B1 (en) Computationally efficient distance-based score approximations
WO2015166352A2 (en) Techniques for synchronized address coding and print sequencing
CN112699640B (zh) 基于PostgreSQL的地理编码方法和系统
CN103246650B (zh) 一种道路逻辑模型制作方法
CN106294384A (zh) 发现新路名的方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20211112

Address after: No. 699, Wangshang Road, Binjiang District, Hangzhou, Zhejiang

Patentee after: Alibaba (China) Network Technology Co., Ltd

Address before: P.O. Box 847, 4th floor, Grand Cayman capital building, British Cayman Islands

Patentee before: Alibaba Group Holdings Limited

TR01 Transfer of patent right