CN102289467A - 确定目标网点的方法和装置 - Google Patents
确定目标网点的方法和装置 Download PDFInfo
- Publication number
- CN102289467A CN102289467A CN2011102066955A CN201110206695A CN102289467A CN 102289467 A CN102289467 A CN 102289467A CN 2011102066955 A CN2011102066955 A CN 2011102066955A CN 201110206695 A CN201110206695 A CN 201110206695A CN 102289467 A CN102289467 A CN 102289467A
- Authority
- CN
- China
- Prior art keywords
- operation network
- determining
- tree structure
- matched
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 230000011218 segmentation Effects 0.000 claims abstract description 109
- 230000001960 triggered effect Effects 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 241000283690 Bos taurus Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及确定目标网点的方法和装置。该方法包括:步骤一、根据分词词典中包括的区域名称,从地址信息中依次切分出各个分词;步骤二、根据得到的各个分词依次在保存的运营网点中查找匹配的运营网点;步骤三、根据匹配到的运营网点确定目标网点。该装置包括:切分模块、查找模块、确定模块。本发明利用包括区域名称的分词词典来对地址信息进行切词,保证切分出的分词能够准确反映出实际的地理区域,根据该种分词匹配具体的运营网点时,则能够匹配到更为准确的目标运营网点,大大提高了确定出的目标网点的准确性,另外,由于本发明直接由计算机系统自动执行切分词、查找、匹配及确定目标网点,处理过程无需人为参与,因此实现了过程的自动化处理。
Description
技术领域
本发明涉及物流技术,特别是涉及确定目标网点的方法和装置。
背景技术
目前,物流行业呈现出迅猛的发展趋势,出现了大量的物流企业。物流企业维护着自己一系列的运营网点,每个网点都会覆盖特定的地理区域。运营网点的作用是供物流企业在实现派送物品的业务中,确定派送的路径节点。
在物流派送过程中,经常需要根据用户提供的地址确定目标网点。这种目标网点可以是末端的取件网点或者是送件网点。比如,当一个用户需要寄送一份文件时,该用户可以向物流企业提供用户所在的始发地的详细地址,以便物流企业的人员能够到准确的地点去取件,此时,物流企业就需要根据用户提供的详细地址从维护的运营网点中确定目标网点,即一个具体的取件网点,之后就可以由取件网点的人员进行实际的取件工作。再如,当根据接收方的详细地址确定准确的送件网点时,物流企业也需要根据用户提供的接收方的详细地址从维护的运营网点中确定目标网点,即一个具体的送件网点,之后就可以由确定的送件网点的人员进行实际的送件工作。
在目前,物流企业一般都是采用人工确定目标网点的方法。也就是说,由工作人员根据用户提供的地址人为查找并确定目标网点,比如人为确认具体取件的网点或者具体送件的网点。此种人为确定目标网点的方法效率低下,大大增加了工作量,并且很容易出错,从而也大大降低了业务服务质量。
发明内容
本发明提供了确定目标网点的方法和装置,能够自动确定目标网点,提高准确性。
为了达到上述目的,本发明的技术方案是这样实现的:
确定目标网点的方法,包括:
步骤一、根据分词词典中包括的区域名称,从地址信息中依次切分出各个分词;
步骤二、根据得到的各个分词依次在保存的运营网点中查找匹配的运营网点;
步骤三、根据匹配到的运营网点确定目标网点。
其中,
所述分词词典进一步包括区域级别;则步骤一中进一步包括:将分词词典中的区域名称结合区域级别,从地址信息中依次切分出各个分词;
和/或,
所述分词词典进一步包括干扰词;则步骤一之前进一步包括:根据分词词典中的干扰词去除外部输入的地址信息中的干扰词;则步骤一中的地址信息为去除干扰词后的地址信息。
优选地,进一步包括:根据各行政区域的上下级关系,将已有的各个运营网点保存为树形结构;
所述步骤二包括:
A、从切分后得到的各个分词中依次选定当前未进行查找匹配处理的当前分词,在树形结构中查找是否有与其匹配的运营网点,如果是,执行步骤B,否则,执行如下步骤31;
B、如果该当前分词之前没有上一个分词,则返回步骤A,否则,根据所述树形结构判断该上一个分词是否为该当前分词的父节点,如果是,返回步骤A;
所述步骤三包括:步骤31、将最后匹配到的运营网点确定为目标网点。
优选地,所述将所有的运营网点保存为树形结构包括:根据各行政区域之间的上下级关系,将已有的各个运营网点对应的区域名称和/或区域简称保存在树形结构的节点中;
步骤A中,所述在树形结构中查找是否有匹配的运营网点包括:在树形结构的节点中查找是否有与所述当前分词相同的区域名称或区域简称。
可选地,所述查找为遍历查找;在步骤二中,如果地址信息中的一个分词匹配到树形结构中的多个运营网点。则
步骤二与步骤三之间进一步包括:将在树形结构中匹配到的多个运营网点的信息提供给用户以供选择;
步骤三中,所述最后匹配到的运营网点为用户选择的运营网点。
可选地,所述将在树形结构中匹配到的多个运营网点的信息提供给用户包括:
按照该多个运营网点以往被用户选择次数的顺序,将在树形结构中匹配到的该多个运营网点的信息顺序提供给用户。
优选地,该方法进一步包括:接收用户输入的新增的运营网点信息,根据该新增的运营网点更新所述树形结构;
和/或,
该方法进一步包括:接收用户输入的已有运营网点的新增的简称,当该新增的简称被输入的次数大于预定值时,将该新增的简称添加到所述分词词典的区域名称中,和/或在所述树形结构的对应节点中增加该已有运营网点的新增的简称。
确定目标网点的装置,包括:
切分模块,用于根据分词词典中包括的区域名称,从地址信息中依次切分出各个分词;
查找模块,用于根据所述切分模块得到的各个分词依次在保存的运营网点中查找匹配的运营网点;
确定模块、用于根据匹配到的运营网点确定目标网点。
优选地,
所述切分模块进一步用于,将区域名称结合分词词典中的区域级别,从地址信息中依次切分出各个分词;
和/或,在进行切分之前,根据分词词典中的干扰词去除地址信息中的干扰词;
和/或,
该装置进一步包括:扩展模块,用于接收用户输入的新增的运营网点信息,根据该新增的运营网点更新所述保存模块中保存的已有各个运营网点组成的树形结构;
和/或,
该装置进一步包括:接收用户输入的已有运营网点的新增的简称,当该新增的简称被输入的次数大于预定值时,将该新增的简称添加到所述分词词典的区域名称中,和/或在保存模块中所述树形结构的对应节点中增加该已有运营网点的新增的简称。
较佳地,该装置进一步包括保存模块,用于保存已有的各个运营网点组成的树形结构,该树形结构根据各行政区域的上下级关系形成;
所述查找模块包括:
第一查找子模块,用于从切分后得到的各个分词中依次选定当前未进行查找匹配处理的当前分词,在树形结构中查找是否有与其匹配的运营网点,如果否,触发所述确定模块,如果是,在该当前分词之前没有上一个分词时,返回执行所述选定的处理,在该当前分词之前有上一个分词时,根据所述树形结构判断该上一个分词是否为该当前分词的父节点,如果是,返回执行所述选定的处理;
所述确定模块包括:第一确定子模块,用于在受到触发时,将第一查找子模块最后匹配到的运营网点确定为目标网点。
由以上描述可以看出,在本发明提出的确定目标网点的方法和装置中,考虑到在物流行业中需要处理并分词的信息是与行政区域地点相关的信息,因此,预先设置了分词词典,该分词词典中包括了区域名称。本发明利用包括区域名称的分词词典来对地址信息进行切词,这样,则能够保证切分出的分词能够准确反映出实际的地理区域,根据该种分词匹配具体的运营网点时,则能够匹配到更为准确的目标运营网点,从而大大提高了确定出的目标网点的准确性,另外,由于本发明直接由计算机系统自动执行切分词、查找、匹配及确定目标网点,处理过程无需人为参与,因此实现了过程的自动化处理。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,以下将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,以下描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图所示实施例得到其它的实施例及其附图。
图1是本发明确定目标网点的基本流程图;
图2是在本发明一个优选实施例中确定目标网点的流程图;
图3是在本发明一个实施例中查找匹配运营网点的流程图;
图4是在本发明一个实施例中的确定目标网点的装置的基本结构图;
图5是在本发明一个实施例中确定目标网点的装置的优选结构图。
具体实施方式
以下将结合附图对本发明各实施例的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施例,都属于本发明所保护的范围。
在目前,分词技术已经在其它领域被广泛地应用,比如,在互联网的搜索引擎中,会通过分词技术进行分词进而搜索用户感兴趣的文章等。分词技术能够将一个序列切分成一个一个单独的词,从而进行文本挖掘,达到计算机自动识别语句含义的效果。
本发明将分词技术应用于物流行业中,用来确定目标网点。在具体实现时,因为已有的分词技术都应用于其它领域,没有充分考虑并结合物流行业的特点,无法使用。因此,经过对物流行业特点的深入分析及创造性劳动,本发明提供了独特的适合物流行业特点的分词方式,以及基于该独特的分词方式的确定目标网点的方法,参见图1,其核心思想包括:
步骤101、根据分词词典中包括的区域名称,从地址信息中依次切分出各个分词;步骤102、根据得到的各个分词依次在保存的运营网点中查找匹配的运营网点;步骤103、根据匹配到的运营网点确定目标网点。
可见,在本发明提出的确定目标网点的方法中,考虑到在物流行业中需要处理并分词的信息是与行政区域地点相关的信息,因此,预先设置了分词词典,该分词词典中包括了区域名称。之后,本发明利用包括区域名称的分词词典来对地址信息进行切词,这样,则能够保证切分出的分词能够准确反映出实际的地理区域,根据该种分词匹配具体的运营网点时,则能够匹配到更为准确的目标运营网点,从而大大提高了确定出的目标网点的准确性,另外,由于本发明直接由计算机系统自动执行切分词、查找、匹配及确定目标网点,处理过程无需人为参与,因此实现了过程的自动化处理。
因为地址信息是人工输入的,经常会存在地址信息中的地名不规范或者随意输入产生的干扰词,为了进一步提高本发明查找匹配目标网点的能力,在本发明的一个实施例中,分词词典中可以进一步包括区域级别和/或干扰词,这样,在根据分词词典对地址信息进行切分时,就可以进一步根据区域级别和/或干扰词来切分,从而得到更为准确的分词。
在本发明的一个较佳实施例中,为了提高切分出的分词匹配运营网点的速度和准确度,利用树形结构来保存已有的各个运营网点。进一步地,考虑到物流业务的特殊性,比如,各个运营网点之间存在上下级关系,任一一个运营网点可能存在一个或者多个简称,因此,本发明提出了独特地利用树形结构保存运营网点信息的方法,以及基于此方法来在树形结构中查找匹配出目标网点的方法。
下面,结合一个具体的例子来详细说明本发明的实现过程。
图2是在本发明一个优选实施例中确定目标网点的流程图。参见图2,在本发明一个优选的实施例中,确定目标网点的过程包括以下步骤:
步骤201:预先设置分词词典。
在本步骤中,结合物流业务的特点来设置专用的分词词典。在具体实现时,可以设置该分词词典包括区域名称,并且进一步地,还可以包括区域级别和/或干扰词。
在分词词典中,区域名称主要是各级行政区域的名称。比如包括中国的各级行政区域的名称,诸如:北京市、上海市、浙江省、江苏省、西湖区、牛街镇、城关乡、清河中街等。
为了在后续业务过程中,针对用户输入地址中的地名不规范的情况也能够进一步进行准确分词及匹配运营网点,本步骤进一步在分词词典中设置了区域级别。区域级别主要表示各级行政区域的级别,比如:省、自治区、直辖市、市、县、镇、乡、街等。
为了在后续业务过程中,针对用户随意输入地址使得地址中包括干扰词的情况也能够进一步进行准确分词及匹配运营网点,本步骤进一步在分词词典中设置了干扰词。干扰词主要是一些相对于地址没有实际意义的词,比如:的、了、呢等。
这样,在一种较佳情况下,分词词典包括三部分:区域名称、区域级别和干扰词。
步骤202:预先将已有的各个运营网点保存为树形结构。
这里,可以根据各行政区域的上下级关系,将已有的各个运营网点保存为树形结构。通过树形结构,能够准确地体现出从企业总部到各个运营网点的各级网点的路径信息。本步骤中,可以将各个运营网点对应的区域名称保存在树形结构的相应节点中。
另外,由于地址信息通常是人工输入的,因此,地址信息往往存在不规范性,比如,用户输入一个地名时,未写该地名的全称而是输入了该地名的简称,并且,不同用户输入的简称还可能不同,比如对于“乌鲁木齐市”,一个用户输入的可能是简称“乌市”,另一个用户输入的可能是另一简称“乌齐市”。为了在后续过程中,针对地名简称也可能进行运营网点的查找和匹配处理,在本发明一个可选实施例中,可以进一步将运营网点的一个或者多个区域名称的简称也保存在树形结构的相应节点中。
在具体实现中,可以采用一种称为“自然区域结点”(NaturalZoneNode,以下简称“结点”)的结构来保存网点信息,如下表1所示:
表1
基于匹配的效率考虑,可以利用上面的信息构造出三个关联数组(又称Map,提供“键-值”对(Key-Value)的存储和查找功能):
naturalZoneMap<Id,NaturalZoneNode>
以结点Id作为Key,结点对象作为Value,当知道结点Id时可以迅速找到对应的结点;
nameMap<Name,List<Id>>
以区域名称作为Key,结点Id列表作为Value,后续可以用来迅速查找一个区域名称所对应的所有结点Id;
shortNamesMap<ShortName,List<Id>>
与nameMap类似,不同的是这里用区域简称作为Key,后续可以用来迅速查找一个区域简称所对应的所有结点Id。
步骤203:接收用户输入的地址信息。
这里,地址信息可以是发件人的地址,那么,后续确定的目标网点就相应地是取件网点。地址信息也可以是收件人的地址,那么,后续确定的目标网点就相应地是送件网点。
步骤204:根据分词词典中包括的区域名称,从地址信息中依次切分出各个分词。
举例来说,比如地址信息为“浙江省杭州市西湖区教工路1号”。分词词典中包括区域名称“浙江省”、“杭州市”、“西湖区”,据此从前至后依次切分出各个分词“浙江省|杭州市|西湖区|教工路1号”(其中“|”代表分割符号)。
在分词词典中进一步包括区域级别和干扰词时,本步骤中进一步结合区域级别和干扰词进行分词。举例来说,地址信息为“浙江的杭州西湖教工路1号”。本步骤中,首先根据分词词典中的干扰词,确定地址信息中的干扰词为“的”,然后从地址信息中删除该干扰词。这样,地址信息变为“浙江杭州西湖教工路1号”。之后,将分词词典中的区域名称结合区域级别来一起切分,仅用区域名称词典无法准确分割。由于区域名称中并没有“浙江”、“杭州”、“西湖”等关键词,只有“浙江省”、“杭州市”、“西湖区”等,因此需要结合区域级别一起使用。利用区域级别中的“省”、“市”、“区”,与区域名称中的“浙江省”、“杭州市”、“西湖区”综合分析,得出“浙江”、“杭州”、“西湖”也可以作为分词依据,因此上述地址最终划分出的分词包括“浙江|杭州|西湖|教工路1号”。
步骤205:根据得到的各个分词依次在树形结构的运营网点中查找匹配的运营网点。
本步骤的核心实现方法可以包括如下步骤:
A、当切分后得到的各个分词中不存在未进行查找匹配处理的分词时(也就是说,所有分词的查找匹配过程已完成),结束本过程,执行如下步骤206;当切分后得到的各个分词中存在未进行查找匹配处理的分词时,从切分后得到的各个分词中依次选定当前未进行查找匹配处理的当前分词,在树形结构中查找是否有与该当前分词匹配的运营网点(比如,在树形结构的节点中查找是否有与所述当前分词相同的区域名称或区域简称,如果查找到,则确定有与该当前分词匹配的运营网点),如果是,执行步骤B,否则,直接执行如下步骤206;
B、如果该当前分词之前没有上一个分词,表示该当前分词是第一个分词,需要继续执行后续分词的匹配处理,则返回步骤A;如果该当前分词之前有上一个分词,根据所述树形结构判断该上一个分词是否为该当前分词的父节点,如果是父节点,返回步骤A,如果不是父节点,直接执行如下步骤206。
在具体的业务实现中,上述本步骤的核心实现方法具体可以参见图3所示(以nameMap匹配为例,shortNamesMap匹配方式类似),包括以下详细的流程步骤:
步骤301:预先将从地址信息中划分出的各个分词依次保存到一个字符列表addressList,类型为List<String>,即切分后的每一个词作为列表的一个元素;
并且,预先将匹配的结点保存到一个列表matchedZoneList,类型为List<NaturalZoneNode>,即一个结点作为一个元素,该列表初始值为空。
步骤302:设置计数器count=1。
步骤303:取出addressList中第count个元素a,判断nameMap中或者shortNamesMap是否有对应的节点,如果否,则结束;如果是则执行步骤304。
步骤304:设置nameMap对应一个节点nodeA,count=count+1。
步骤305:判断count是否大于addressList的长度,如果否,执行步骤306,如果是,过程结束。
步骤306:取addressList中第count个元素b,如果b在nameMap或者shortNamesMap中有对应结点nodeB,并且通过naturalZoneMap可以向上找出nodeB的所有父级结点,如果在nodeB的某一级父级结点包含nodeA,则将nodeB赋予nodeA,返回步骤304;当nodeB与nodeA没有父子关系或者b在nameMap中没有对应节点时则过程结束,nodeA即为最末端节点,添加到matchedZoneList,流程结束。
如果nameMap对应多个结点,则对每个结点执行步骤304-306的操作
shortNamesMap对应一个结点nodeA,执行与步骤304-306类似的操作,但是以shortNamesMap作为匹配的依据。
shortNamesMap对应多个结点,则对每个结点执行步骤304-306的操作,但是以shortNamesMap作为匹配的依据。
至此,步骤205的过程结束。
步骤206:将最后匹配到的运营网点确定为目标网点。
经过上述步骤205的处理,可以得到一个匹配结点列表matchedZoneList,该匹配结点列表中的节点就是最后匹配到的运营网点,从而可确定为目标网点。
本步骤中,匹配结果情况举例如下:
a)“浙江省杭州市西湖区教工路1号”
分词结果:“浙江省|杭州市|西湖区|教工路1号”;
匹配过程:“浙江省”->“杭州市”->“西湖区”,由于“浙江省”是“杭州市”的父级网点,“杭州市”是“西湖区”的父级网点,并且不存在其他匹配结果,所以“西湖区””就是唯一匹配网点;
返回结果:MatchType:1(表示有唯一匹配网点);MatchedZoneList:“西湖区”。
b)“浙江省西湖区教工路1号”
分词结果:“浙江省|西湖区|教工路1号”;
匹配过程:“浙江省”->“西湖区”,由于“浙江省”是“西湖区”的父级网点并且不存在其他匹配结果,所以“西湖区”就是唯一匹配网点;
返回结果:MatchType:1;MatchedZoneList:“西湖区”,解析结果与a)完全相同,所以即使地址没有写全也可以准确解析。
c)“浙江省绍兴中医院”
分词结果:“浙江省|绍兴|中医院”;
匹配过程:“浙江省”->“绍兴”,当解析到绍兴的时候,出现两个匹配结点:“浙江省|绍兴市”和“浙江省|绍兴市|绍兴县”,而且两个结点下面都有“中医院”这样的地址,所以无法唯一确定;
返回结果:MatchType:2(表示有多个可能匹配的网点);MatchedZoneList:“浙江省|绍兴市”和“浙江省|绍兴市|绍兴县”,需要人工确定。
可见,在实际的业务实现中,由于用户输入地址信息的不规范,本步骤206中可能出现最终匹配到多个运营网点,此时,需要将在树形结构中匹配到的多个运营网点的信息提供给用户以供选择,优选地,按照该多个运营网点以往被用户选择次数的大小顺序,将在树形结构中匹配到的该多个运营网点的信息顺序提供给用户,如以往被用户选择次数的较多的运营网点显示在上面,被用户选择次数的较少的运营网点显示在下面,之后将用户选择的运营网点确定为目标网点。
对于多匹配结果,一种具体的业务实现可以是:
参照上面的例子中提到的“浙江省绍兴中医院”将会返回两个匹配结点,如果根据实际使用频率对结果排序,这样可以保证将用户最常用的结点排在最前面。为此,可以对NaturalZoneNode结构进行扩充,增加“选中数量”(HitCount)字段:
那么当一个结点被用户选中时,HitCount将加1,因此对于“浙江省绍兴中医院”这个地址,如果更多人选择了“浙江省|绍兴市|绍兴县”这个结点,那么下次解析的时候会把这个结点排在“浙江省|绍兴市”前面,反之亦然。
至此,本发明的基本实现过程结束。
优选地,在本发明的实现过程中,为了更好地适应各种变化,本发明还可以进一步实现如下业务:
第一、实现词库和网点的动态调整。其具体的实现过程包括:
当国家行政区域发生变化时,获取需更新的行政区域信息,根据该行政区域信息更新所述分词词典以及调整所述树形结构;
当物流企业内部的运营网点发生调整时,获取需更新的运营网点的信息,根据该运营网点信息调整所述树形结构。
由于本发明进一步采用了上述词库和网点的动态调整过程,因此,在实现确定运营网点的过程中,所利用的分词词典及例如树形结构的各个运营网点都是最新的,进一步保证了所使用的分词词典的实时有效性,以及所查找匹配的运营网点信息的实时有效性。
第二、运营网点简称的动态添加。
在本发明的实现过程中,多数用户实际输入的地址信息中所使用的区域简称可能与系统中实际存储的该地名的区域名称或区域简称不同,为了满足用户的习惯书写要求,更为贴近业务实际情况,本发明还可以进一步实现运营网点简称的动态添加。其具体的实现过程包括:
接收用户输入的已有运营网点的新增的简称,当该新增的简称被输入的次数大于预定值时,将该新增的简称添加到所述分词词典的区域名称中,并且,还需要在所述树形结构的对应节点中增加该已有运营网点的新增的简称。
通过上述运营网点简称的动态添加,本发明进一步满足了用户输入地名的实际业务情况,进一步保证了本发明所使用分词词典和存储运营网点的树形结构的实时有效性。
对于运营网点简称的动态添加,在一种具体的实现过程中,本发明对上述表1所示的“自然区域结点”(NaturalZoneNode)进行扩充,添加“待审核简称”(PendingShortNames),参见如下表2所示:
表2
比如:“云南省|红河哈尼族彝族自治州”这个结点的初始简称只有“红河”,在实际使用过程中,可能有人会写成“红河自治州”、有人会写成“红河州”等。用户就可以把这些简称添加到这个结点的待审核简称列表中,每添加一次该简称的计数器就加1,如果某个简称的计数器达到预先设定的值(比如:10),那么这个简称就会添加到分词词典的区域名称部分和“云南省|红河哈尼族彝族自治州”的ShortNames列表中,同时把该名称从PendingShortNames列表中删除。
另外,本发明还提出了一种确定目标网点的装置,参见图4,包括:
切分模块401,用于根据分词词典中包括的区域名称,从地址信息中依次切分出各个分词;
查找模块402,用于根据所述切分模块得到的各个分词依次在保存的运营网点中查找匹配的运营网点;
确定模块403、用于根据匹配到的运营网点确定目标网点。
在本发明装置的一个实施例中,参见图4,所述切分模块401进一步用于,将区域名称结合分词词典中的区域级别,从地址信息中依次切分出各个分词;和/或,在进行切分之前,所述切分模块进一步用于根据分词词典中的干扰词去除地址信息中的干扰词。通过切分模块401的该种处理,可以进一步保证切分出的分词准确。
参见图5,在本发明装置的具体实现中,该装置可以进一步包括保存模块500,用于保存已有的各个运营网点组成的树形结构,该树形结构根据各行政区域的上下级关系形成;此时,所述查找模块402完成查找匹配的具体处理可以包括:
第一查找子模块,用于从切分后得到的各个分词中依次选定当前未进行查找匹配处理的当前分词,在树形结构中查找是否有与其匹配的运营网点,如果否,触发所述确定模块,如果是,在该当前分词之前没有上一个分词时,返回执行所述选定的处理,在该当前分词之前有上一个分词时,根据所述树形结构判断该上一个分词是否为该当前分词的父节点,如果是,返回执行所述选定的处理;则,
所述确定模块包括:第一确定子模块,用于在受到触发时,将第一查找子模块最后匹配到的运营网点确定为目标网点。
在本发明装置的另一个实施例中,为了进一步保证所使用的分词词典的实时有效性,以及所查找匹配的运营网点信息的实时有效性,参见图5,本发明装置可以进一步包括:第一扩展模501,用于获取需更新的行政区域信息,根据该行政区域信息更新所述分词词典以及调整所述树形结构;和/或,用于获取需更新的运营网点的信息,根据该运营网点信息调整所述树形结构。
在本发明装置的又一个实施例中,为了进一步符合用户输入地名的实际业务情况,保证所使用分词词典和存储运营网点的树形结构的实时有效性,参见图5,本发明装置可以进一步包括:第二扩展模502,用于接收用户输入的已有运营网点的新增的简称,当该新增的简称被输入的次数大于预定值时,将该新增的简称添加到所述分词词典的区域名称中,和/或在保存模块中所述树形结构的对应节点中增加该已有运营网点的新增的简称。
在本发明上述所有实施例的实现中,所述地址信息可以是中文地址或者是外文地址,当为外文地址时,可以根据外文地址的特点基于上述实现过程进行适应性调整,比如,英文地址一般为较小级别的区域名称在前,较大级别的区域名称在后,这样,上述处理过程中可以对查找过程进行相应调整,比如,在划分出各个分词之后,按照从后至前的顺序得到各个分词(与中文地址按照从前至后的顺序得到各个分词不同),然后依次在树形结构中进行查找(也就是说,仍然保证是从地址中的最高级别的名称开始依次查找),其具体实现过程的原理与上述过程相同。
在本发明上述所有实施例的实现中,目标网点可以是取件网点或者是送件网点。
本发明提供的各种实施例可根据需要以任意方式相互组合,通过这种组合得到的技术方案,也在本发明的范围内。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.确定目标网点的方法,其特征在于,
步骤一、根据分词词典中包括的区域名称,从地址信息中依次切分出各个分词;
步骤二、根据得到的各个分词依次在保存的运营网点中查找匹配的运营网点;
步骤三、根据匹配到的运营网点确定目标网点。
2.如权利要求1所述的确定目标网点的方法,其特征在于,
所述分词词典进一步包括区域级别;则步骤一中进一步包括:将分词词典中的区域名称结合区域级别,从地址信息中依次切分出各个分词;
和/或,
所述分词词典进一步包括干扰词;则步骤一之前进一步包括:根据分词词典中的干扰词去除外部输入的地址信息中的干扰词;则步骤一中的地址信息为去除干扰词后的地址信息。
3.如权利要求1或2所述的确定目标网点的方法,其特征在于,进一步包括:根据各行政区域的上下级关系,将已有的各个运营网点保存为树形结构;
所述步骤二包括:
A、从切分后得到的各个分词中依次选定当前未进行查找匹配处理的当前分词,在树形结构中查找是否有与其匹配的运营网点,如果是,执行步骤B,否则,执行如下步骤31;
B、如果该当前分词之前没有上一个分词,则返回步骤A,否则,根据所述树形结构判断该上一个分词是否为该当前分词的父节点,如果是,返回步骤A;
所述步骤三包括:步骤31、将最后匹配到的运营网点确定为目标网点。
4.如权利要求1~3中任一所述的确定目标网点的方法,其特征在于,
所述将所有的运营网点保存为树形结构包括:根据各行政区域之间的上下级关系,将已有的各个运营网点对应的区域名称和/或区域简称保存在树形结构的节点中;
步骤A中,所述在树形结构中查找是否有匹配的运营网点包括:在树形结构的节点中查找是否有与所述当前分词相同的区域名称或区域简称。
5.如权利要求1~4所述的确定目标网点的方法,其特征在于,在步骤二中,如果地址信息中的分词匹配到树形结构中的多个运营网点。则
步骤二与步骤三之间进一步包括:将在树形结构中匹配到的多个运营网点的信息提供给用户以供选择;
步骤三中,所述最后匹配到的运营网点为用户选择的运营网点。
6.如权利要求5所述的确定目标网点的方法,其特征在于,所述将在树形结构中匹配到的多个运营网点的信息提供给用户包括:
按照该多个运营网点以往被用户选择次数的顺序,将在树形结构中匹配到的该多个运营网点的信息顺序提供给用户。
7.如权利要求1~6所述的确定目标网点的方法,其特征在于,
该方法进一步包括:获取需更新的行政区域信息,根据该行政区域信息更新所述分词词典以及调整所述树形结构;
和/或,
该方法进一步包括:获取需更新的运营网点的信息,根据该运营网点信息调整所述树形结构;
和/或,
该方法进一步包括:接收用户输入的已有运营网点的新增的简称,当该新增的简称被输入的次数大于预定值时,将该新增的简称添加到所述分词词典的区域名称中,和/或在所述树形结构的对应节点中增加该已有运营网点的新增的简称。
8.确定目标网点的装置,用于实现权利要求1~7中任一的确定目标网点的方法,其特征在于,包括:
切分模块,用于根据分词词典中包括的区域名称,从地址信息中依次切分出各个分词;
查找模块,用于根据所述切分模块得到的各个分词依次在保存的运营网点中查找匹配的运营网点;
确定模块、用于根据匹配到的运营网点确定目标网点。
9.如权利要求8所述的确定目标网点的装置,其特征在于,
所述切分模块进一步用于,将区域名称结合分词词典中的区域级别,从地址信息中依次切分出各个分词;和/或,在进行切分之前,所述切分模块进一步用于根据分词词典中的干扰词去除地址信息中的干扰词;
和/或,
该装置进一步包括:第一扩展模块,用于获取需更新的行政区域信息,根据该行政区域信息更新所述分词词典以及调整所述树形结构;和/或,用于获取需更新的运营网点的信息,根据该运营网点信息调整所述树形结构;
和/或,
该装置进一步包括:第二扩展模块,接收用户输入的已有运营网点的新增的简称,当该新增的简称被输入的次数大于预定值时,将该新增的简称添加到所述分词词典的区域名称中,和/或在保存模块中所述树形结构的对应节点中增加该已有运营网点的新增的简称。
10.如权利要求8、9所述的确定目标网点的装置,其特征在于,该装置进一步包括保存模块,用于保存已有的各个运营网点组成的树形结构,该树形结构根据各行政区域的上下级关系形成;
所述查找模块包括:
第一查找子模块,用于从切分后得到的各个分词中依次选定当前未进行查找匹配处理的当前分词,在树形结构中查找是否有与其匹配的运营网点,如果否,触发所述确定模块,如果是,在该当前分词之前没有上一个分词时,返回执行所述选定的处理,在该当前分词之前有上一个分词时,根据所述树形结构判断该上一个分词是否为该当前分词的父节点,如果是,返回执行所述选定的处理;
所述确定模块包括:第一确定子模块,用于在受到触发时,将第一查找子模块最后匹配到的运营网点确定为目标网点。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011102066955A CN102289467A (zh) | 2011-07-22 | 2011-07-22 | 确定目标网点的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011102066955A CN102289467A (zh) | 2011-07-22 | 2011-07-22 | 确定目标网点的方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102289467A true CN102289467A (zh) | 2011-12-21 |
Family
ID=45335894
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2011102066955A Pending CN102289467A (zh) | 2011-07-22 | 2011-07-22 | 确定目标网点的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102289467A (zh) |
Cited By (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102750351A (zh) * | 2012-06-11 | 2012-10-24 | 迪尔码国际营销服务(北京)有限公司 | 基于规则的地址信息匹配方法 |
CN103279523A (zh) * | 2013-05-29 | 2013-09-04 | 北京京东尚科信息技术有限公司 | 一种处理地址信息的方法和装置 |
CN103558926A (zh) * | 2013-11-12 | 2014-02-05 | 金蝶软件(中国)有限公司 | 一种地名录入方法及装置 |
CN103559177A (zh) * | 2013-11-12 | 2014-02-05 | 金蝶软件(中国)有限公司 | 一种地名识别方法及装置 |
CN103678708A (zh) * | 2013-12-30 | 2014-03-26 | 小米科技有限责任公司 | 一种识别预设地址的方法及装置 |
CN103699487A (zh) * | 2013-12-27 | 2014-04-02 | 北京像素软件科技股份有限公司 | 实现自动触发逻辑的方法和装置 |
CN103853769A (zh) * | 2012-12-03 | 2014-06-11 | 北京百度网讯科技有限公司 | 一种地图查询请求处理方法及装置 |
CN104200369A (zh) * | 2014-08-27 | 2014-12-10 | 北京京东尚科信息技术有限公司 | 一种确定商品配送范围的方法和装置 |
CN104375992A (zh) * | 2013-08-12 | 2015-02-25 | 中国移动通信集团浙江有限公司 | 一种地址匹配的方法和装置 |
CN104598887A (zh) * | 2015-01-29 | 2015-05-06 | 华东师范大学 | 用于非规范格式手写中文地址的识别方法 |
CN105022747A (zh) * | 2014-04-28 | 2015-11-04 | 高德软件有限公司 | 一种地址查询串解析方法及装置 |
CN105260929A (zh) * | 2015-11-25 | 2016-01-20 | 无线生活(杭州)信息科技有限公司 | 一种生成订单的方法及装置 |
CN106269528A (zh) * | 2015-05-20 | 2017-01-04 | 阿里巴巴集团控股有限公司 | 提供地址分拣信息的方法及装置 |
CN106296059A (zh) * | 2015-06-02 | 2017-01-04 | 阿里巴巴集团控股有限公司 | 派送网点确定方法及设备 |
CN106920104A (zh) * | 2015-12-24 | 2017-07-04 | 北京京东尚科信息技术有限公司 | 网点的智能选择方法和装置 |
CN109118131A (zh) * | 2017-06-23 | 2019-01-01 | 菜鸟智能物流控股有限公司 | 一种物流数据处理方法及装置 |
CN109255562A (zh) * | 2017-07-12 | 2019-01-22 | 菜鸟智能物流控股有限公司 | 一种对象处理方法及装置 |
CN109255564A (zh) * | 2017-07-13 | 2019-01-22 | 菜鸟智能物流控股有限公司 | 一种取件点地址推荐方法及装置 |
CN109933800A (zh) * | 2019-03-22 | 2019-06-25 | 中国农业银行股份有限公司 | 数据机构体系的创建方法、信息查询方法及装置 |
CN110765773A (zh) * | 2019-10-31 | 2020-02-07 | 北京金堤科技有限公司 | 地址数据获取方法以及装置 |
CN110853312A (zh) * | 2019-11-13 | 2020-02-28 | 四川虹广网络科技有限公司 | 多级联动报警的接处警方法、终端和计算机可读存储介质 |
CN110851506A (zh) * | 2018-07-25 | 2020-02-28 | 上海柯林布瑞信息技术有限公司 | 临床大数据的搜索方法及装置、存储介质、服务器 |
CN111026787A (zh) * | 2019-11-22 | 2020-04-17 | 中国银行股份有限公司 | 网点检索方法、装置及系统 |
CN111160827A (zh) * | 2019-12-09 | 2020-05-15 | 上海东普信息科技有限公司 | 快递揽收方法、手持终端的快件揽收方法及存储介质 |
CN111210177A (zh) * | 2019-12-19 | 2020-05-29 | 上海东普信息科技有限公司 | 新型快递面单的三段码管理方法、系统及电子设备 |
CN111784239A (zh) * | 2020-06-17 | 2020-10-16 | 上海乾臻信息科技有限公司 | 派送网点的确定方法、装置、电子设备及存储介质 |
CN112529484A (zh) * | 2019-09-17 | 2021-03-19 | 北京京东振世信息技术有限公司 | 站点匹配方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101350012A (zh) * | 2007-07-18 | 2009-01-21 | 北京灵图软件技术有限公司 | 一种地址匹配的方法和系统 |
CN101719128A (zh) * | 2009-12-31 | 2010-06-02 | 浙江工业大学 | 一种基于模糊匹配的中文地理编码确定方法 |
CN101882163A (zh) * | 2010-06-30 | 2010-11-10 | 中国科学院地理科学与资源研究所 | 一种基于匹配规则的模糊中文地址地理赋值方法 |
US20110161334A1 (en) * | 2009-12-28 | 2011-06-30 | Verizon Patent And Licensing, Inc. | Translating and geocoding addresses |
-
2011
- 2011-07-22 CN CN2011102066955A patent/CN102289467A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101350012A (zh) * | 2007-07-18 | 2009-01-21 | 北京灵图软件技术有限公司 | 一种地址匹配的方法和系统 |
US20110161334A1 (en) * | 2009-12-28 | 2011-06-30 | Verizon Patent And Licensing, Inc. | Translating and geocoding addresses |
CN101719128A (zh) * | 2009-12-31 | 2010-06-02 | 浙江工业大学 | 一种基于模糊匹配的中文地理编码确定方法 |
CN101882163A (zh) * | 2010-06-30 | 2010-11-10 | 中国科学院地理科学与资源研究所 | 一种基于匹配规则的模糊中文地址地理赋值方法 |
Cited By (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102750351A (zh) * | 2012-06-11 | 2012-10-24 | 迪尔码国际营销服务(北京)有限公司 | 基于规则的地址信息匹配方法 |
CN103853769A (zh) * | 2012-12-03 | 2014-06-11 | 北京百度网讯科技有限公司 | 一种地图查询请求处理方法及装置 |
CN103853769B (zh) * | 2012-12-03 | 2018-11-09 | 北京百度网讯科技有限公司 | 一种地图查询请求处理方法及装置 |
CN103279523A (zh) * | 2013-05-29 | 2013-09-04 | 北京京东尚科信息技术有限公司 | 一种处理地址信息的方法和装置 |
CN104375992A (zh) * | 2013-08-12 | 2015-02-25 | 中国移动通信集团浙江有限公司 | 一种地址匹配的方法和装置 |
CN104375992B (zh) * | 2013-08-12 | 2018-01-30 | 中国移动通信集团浙江有限公司 | 一种地址匹配的方法和装置 |
CN103559177A (zh) * | 2013-11-12 | 2014-02-05 | 金蝶软件(中国)有限公司 | 一种地名识别方法及装置 |
CN103558926A (zh) * | 2013-11-12 | 2014-02-05 | 金蝶软件(中国)有限公司 | 一种地名录入方法及装置 |
CN103699487A (zh) * | 2013-12-27 | 2014-04-02 | 北京像素软件科技股份有限公司 | 实现自动触发逻辑的方法和装置 |
CN103678708A (zh) * | 2013-12-30 | 2014-03-26 | 小米科技有限责任公司 | 一种识别预设地址的方法及装置 |
CN103678708B (zh) * | 2013-12-30 | 2017-01-18 | 小米科技有限责任公司 | 一种识别预设地址的方法及装置 |
CN105022747A (zh) * | 2014-04-28 | 2015-11-04 | 高德软件有限公司 | 一种地址查询串解析方法及装置 |
CN105022747B (zh) * | 2014-04-28 | 2019-12-03 | 高德软件有限公司 | 一种地址查询串解析方法及装置 |
CN104200369A (zh) * | 2014-08-27 | 2014-12-10 | 北京京东尚科信息技术有限公司 | 一种确定商品配送范围的方法和装置 |
CN104200369B (zh) * | 2014-08-27 | 2019-12-31 | 北京京东尚科信息技术有限公司 | 一种确定商品配送范围的方法和装置 |
CN104598887A (zh) * | 2015-01-29 | 2015-05-06 | 华东师范大学 | 用于非规范格式手写中文地址的识别方法 |
CN104598887B (zh) * | 2015-01-29 | 2017-11-24 | 华东师范大学 | 用于非规范格式手写中文地址的识别方法 |
CN106269528A (zh) * | 2015-05-20 | 2017-01-04 | 阿里巴巴集团控股有限公司 | 提供地址分拣信息的方法及装置 |
CN106269528B (zh) * | 2015-05-20 | 2018-12-21 | 菜鸟智能物流控股有限公司 | 提供地址分拣信息的方法及装置 |
CN106296059A (zh) * | 2015-06-02 | 2017-01-04 | 阿里巴巴集团控股有限公司 | 派送网点确定方法及设备 |
CN106296059B (zh) * | 2015-06-02 | 2020-08-25 | 菜鸟智能物流控股有限公司 | 派送网点确定方法及设备 |
CN105260929A (zh) * | 2015-11-25 | 2016-01-20 | 无线生活(杭州)信息科技有限公司 | 一种生成订单的方法及装置 |
CN106920104A (zh) * | 2015-12-24 | 2017-07-04 | 北京京东尚科信息技术有限公司 | 网点的智能选择方法和装置 |
CN109118131A (zh) * | 2017-06-23 | 2019-01-01 | 菜鸟智能物流控股有限公司 | 一种物流数据处理方法及装置 |
CN109255562A (zh) * | 2017-07-12 | 2019-01-22 | 菜鸟智能物流控股有限公司 | 一种对象处理方法及装置 |
CN109255564A (zh) * | 2017-07-13 | 2019-01-22 | 菜鸟智能物流控股有限公司 | 一种取件点地址推荐方法及装置 |
CN110851506B (zh) * | 2018-07-25 | 2021-12-03 | 上海柯林布瑞信息技术有限公司 | 临床大数据的搜索方法及装置、存储介质、服务器 |
CN110851506A (zh) * | 2018-07-25 | 2020-02-28 | 上海柯林布瑞信息技术有限公司 | 临床大数据的搜索方法及装置、存储介质、服务器 |
CN109933800A (zh) * | 2019-03-22 | 2019-06-25 | 中国农业银行股份有限公司 | 数据机构体系的创建方法、信息查询方法及装置 |
CN112529484A (zh) * | 2019-09-17 | 2021-03-19 | 北京京东振世信息技术有限公司 | 站点匹配方法及系统 |
CN110765773A (zh) * | 2019-10-31 | 2020-02-07 | 北京金堤科技有限公司 | 地址数据获取方法以及装置 |
CN110853312A (zh) * | 2019-11-13 | 2020-02-28 | 四川虹广网络科技有限公司 | 多级联动报警的接处警方法、终端和计算机可读存储介质 |
CN111026787A (zh) * | 2019-11-22 | 2020-04-17 | 中国银行股份有限公司 | 网点检索方法、装置及系统 |
CN111160827A (zh) * | 2019-12-09 | 2020-05-15 | 上海东普信息科技有限公司 | 快递揽收方法、手持终端的快件揽收方法及存储介质 |
CN111210177A (zh) * | 2019-12-19 | 2020-05-29 | 上海东普信息科技有限公司 | 新型快递面单的三段码管理方法、系统及电子设备 |
CN111210177B (zh) * | 2019-12-19 | 2023-09-01 | 上海东普信息科技有限公司 | 新型快递面单的三段码管理方法、系统及电子设备 |
CN111784239A (zh) * | 2020-06-17 | 2020-10-16 | 上海乾臻信息科技有限公司 | 派送网点的确定方法、装置、电子设备及存储介质 |
CN111784239B (zh) * | 2020-06-17 | 2024-05-10 | 上海乾臻信息科技有限公司 | 派送网点的确定方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102289467A (zh) | 确定目标网点的方法和装置 | |
US11122009B2 (en) | Systems and methods for identifying geographic locations of social media content collected over social networks | |
CN107589855B (zh) | 一种根据地理位置推荐候选词的方法和装置 | |
CN102483748A (zh) | 用于地图搜索的查询解析 | |
US20130297581A1 (en) | Systems and methods for customized filtering and analysis of social media content collected over social networks | |
US20130297694A1 (en) | Systems and methods for interactive presentation and analysis of social media content collection over social networks | |
US20130304818A1 (en) | Systems and methods for discovery of related terms for social media content collection over social networks | |
CN104572955A (zh) | 一种基于聚类确定poi名称的系统及方法 | |
CN104011712A (zh) | 对跨语言查询建议的查询翻译进行评价 | |
CN103970733B (zh) | 一种基于图结构的中文新词识别方法 | |
CN102279889B (zh) | 一种基于地理信息的问题推送方法及系统 | |
CN105512864A (zh) | 一种基于互联网的岗位职业能力需求的自动获取方法 | |
CN104572956A (zh) | 确定poi信息有效性的系统及方法 | |
CN104679801A (zh) | 一种兴趣点搜索方法和装置 | |
CN107203526A (zh) | 一种查询串语义需求分析方法及装置 | |
CN105608113B (zh) | 判断文本中poi数据的方法及装置 | |
CN103902521A (zh) | 一种中文语句识别方法和装置 | |
CN102682046A (zh) | 社交网络的节点搜索和分析方法及搜索系统 | |
US10354339B2 (en) | Automatic initiation for generating a company profile | |
CN105159884A (zh) | 行业词典的建立方法和装置及行业识别方法和装置 | |
CN104572957A (zh) | 一种基于聚类的poi名称确定系统及方法 | |
CN102646124A (zh) | 一种自动识别地址信息的方法 | |
CN105183908A (zh) | 一种兴趣点poi数据的分类方法和装置 | |
CN104915426A (zh) | 信息排序方法、用于生成信息排序模型的方法及装置 | |
CN103955480A (zh) | 一种用于确定用户所对应的目标对象信息的方法与设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20111221 |