CN105205173A - 基于关键词数据库检索的快递分拣装置及方法 - Google Patents

基于关键词数据库检索的快递分拣装置及方法 Download PDF

Info

Publication number
CN105205173A
CN105205173A CN201510661588.XA CN201510661588A CN105205173A CN 105205173 A CN105205173 A CN 105205173A CN 201510661588 A CN201510661588 A CN 201510661588A CN 105205173 A CN105205173 A CN 105205173A
Authority
CN
China
Prior art keywords
delivery
website
part address
sent
screened
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510661588.XA
Other languages
English (en)
Inventor
周韶宁
张砚冰
范则款
朱德康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Baishi Technology Co Ltd
Original Assignee
Zhejiang Baishi Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Baishi Technology Co Ltd filed Critical Zhejiang Baishi Technology Co Ltd
Priority to CN201510661588.XA priority Critical patent/CN105205173A/zh
Publication of CN105205173A publication Critical patent/CN105205173A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • G06F16/24534Query rewriting; Transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Fuzzy Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及快递分拣技术领域,具体涉及一种基于关键词数据库检索的快递分拣装置及方法。其能够根据建立的检索数据库,通过对待派件地址进行分词而获取检索关键词并向检索数据库进行查询的方法,较高效率、较精确地获取与该待派件地址对应的待投递投递站点。本发明操作简单,维护成本低,实时性和地域性强,能够较佳地替代现有的人工分拣和半人工分拣方式。

Description

基于关键词数据库检索的快递分拣装置及方法
技术领域
本发明涉及快递分拣技术领域,具体地说,涉及一种基于关键词数据库检索的快递分拣装置及方法。
背景技术
现有的快递分拣多为人工分拣,由工作人员根据快递面单地址来手工分配快递的中转或末端派件站点。快递分拣人员不但需要记忆大量地址信息,还要根据城市和站点变化随时更新,记忆难度之大,可想而知。所以,不可避免的有分拣错误、效率低下且覆盖面窄的问题。另一些为半自动分拣,既通过人工设定一些地址关键词数据,采用基于词典的字符串匹配分词算法,关键词作为词典的部分或全部,借助计算机辅助进行派件站点识别。在这类半自动分拣中,由于实际快递地址规模庞大且书写方式多样,需要大量的人力和时间来整理关键词数据,维护开销大、变更不及时且容易出错。
发明内容
为了克服现有技术的上述缺陷,本发明提供了一种快递分拣装置。根据本发明的快递分拣装置,其包括:
历史派件地址数据库,其用于记载历史派件地址信息,历史派件地址信息包括由至少一个历史派件地址组成的历史派件地址集合;
站点派送区域数据库,其用于记载由至少一个投递站点组成的投递站点集合,任一投递站点均包括由与该投递站点对应的至少一个派件点组成的派件点集合;
经纬度解析模块,其用于将所述至少一个历史派件地址对应解析为至少一个历史派件地址经纬度信息,并用于将所有派件点对应解析成所有派件点经纬度信息;
映射处理模块,其用于对所述至少一个历史派件地址经纬度信息与所有派件点经纬度信息进行处理,以得到历史派件地址集合到投递站点集合的映射;
第一分词模块,其用于对所述至少一个历史派件地址进行分词以对应得到至少一个关键词集合,任一关键词集合均包括至少一个关键词,所有关键词经映射处理模块进行处理以得到所有关键词在所述至少一个投递站点中的关键词分布信息;
统计处理模块,其用于对关键词分布信息进行处理以得到所有关键词在任一投递站点中的出现频率,并将在任一投递站点处出现概率不低于设定第一阈值的关键词作为该投递站点的有效关键词;
检索数据库,其用于记载所有有效关键词和所述至少一个投递站点的信息,并建立所有有效关键词到所述至少一个投递站点的映射;
地址采集模块,其用于采集待派件地址;
第二分词模块,其用于对待派件地址进行分词以得到至少一个检索关键词,并将所述至少一个检索关键词发送至检索数据库以对应得到的至少一个待筛选投递站点;
解析模块,其用于对所述至少一个待筛选投递站点进行处理以得到任一待筛选投递站点的出现频率,并将出现概率不低于设定第二阈值的待筛选投递站点作为待投递投递站点;以及
输出模块,其用于输出待投递投递站点。
本发明的快递分拣装置中,能够根据历史派件地址而建立检索数据库,由于历史派件地址能够存储在历史派件地址数据库中,而地址采集模块处采集的当前派件地址信息也能够发送给历史派件地址数据库,故历史派件地址数据库由能够实时更新历史派件地址,使得检索数据库也能够实时进行更新,从而使得检索数据库具备较佳地实时性,进而较佳地提高了分拣准确率。
其次,检索数据库中能够对关键词和所有投递站点进行映射,从而能够根据关键词得到待投递投递站点,进而大大简化了分拣操作,能够得到较佳的分拣效率。
本发明的快递分拣装置中,第一分词模块和第二分词模块均能够包括两个分别用于定义分词的最长字串和最短字段的定义模块,从而较佳地保证了能够找到派件地址的所有可能的字串,提高了检索数据库建立和分拣的准确性。
作为优选,设定第一阈值为65%~95%。
本发明的快递分拣装置中,第一阈值能够设为65%~95%,从而能够较多的较准确的获取有效关键词,进而较佳地保证了分拣的准确性。
作为优选,设定第二阈值为60%~85%。
本发明的快递分拣装置中,第二阈值能够设为60%~85%,从而能够在保证较为精准获取待投递投递站点的同时,也较佳地减少了因待筛选投递站点的数量较少而导致的解析失败。
作为优选,地址采集模块包括用于提取电子面单中派件地址信息的第一输入模块,用于提取手写面单中地址信息的第二输入模块,以及用于识别文字的第三输入模块。
本发明的快递分拣装置中,地址采集模块能够包括多种类型的输入模块,从而能够较佳地适应多种不同类型的快递面单。
本发明提供了一种基于上述任一快递分拣装置的快递分拣方法。根据本发明的快递分拣方法,其包括以下步骤:
一、构建关键词与投递站点映射的检索数据库;
二、对待派件地址进行分词以得到检索关键词;
三、将检索关键词发送至检索数据库中,进而得到与待派件地址对应的待投递投递站点。
本发明的快递分拣方法中,能够以向检索数据库内查询检索关键词的方式而获取待派件地址,从而能够较佳地提高分拣效率。其次,由于检索数据库能够自动建立,从而使得检索数据库便于维护且能够实时更新,进而保证了分拣的准确性和及时性。
作为优选,步骤一包括以下步骤,
(1)从历史派件地址数据库中提取所有历史派件地址信息;
(2)从站点派送区域数据库中提取所有投递站点信息;
(3)采用经纬度解析模块对所有历史派件地址信息和所有投递站点的投递区域信息进行经纬度解析,从而得到所有历史派件地址经纬度信息和所有投递站点的投递区域经纬度信息;
(4)采用映射处理模块对所有历史派件地址经纬度信息和所有投递站点的投递区域经纬度信息进行处理,从而得到所有历史派件地址与所有投递站点间的映射关系;
(5)采用第一分词模块逐个对所有历史派件地址进行分词以对应得到至少一个关键词;
(6)根据步骤(4)中所有历史派件地址与所有投递站点间的映射关系,得到所有关键词在所述所有投递站点中的关键词分布信息;
(7)采用统计处理模块对关键词分布信息进行处理以得到所有关键词在任一投递站点中的出现频率,并将在任一投递站点处出现概率不低于设定第一阈值的关键词作为该投递站点的有效关键词;
(8)建立所有有效关键词到所有投递站点的映射,从而得到检索数据库。
本发明的快递分拣方法中,站点派送区域数据库能够用于记载由所有投递站点组成的投递站点集合,任一投递站点均能够包括由与该投递站点对应的所有派件点组成的派件点集合,而经纬度解析模块能够采用提供API接口的第三方GIS引擎,例如百度地图、高德地图、MAPABC等,从而通过API接口向第三方GIS引擎中输入地址信息即可得到与该地址信息对应的经纬度信息,从而大大简化了检索数据库的建立难度。另外,通过判定经纬度的方法将所有历史派件地址与所有投递站点进行对应时,能够较为准确地获取对应关系。
其次,第一分词模块能够采用随意分词方法,即能够对分词的最长字串和最短字段依次进行定义,从而较佳地保证了能够找到派件地址的所有可能的字串,提高了检索数据库的建立准确性。
作为优选,步骤(7)中,设定第一阈值为65%~95%。
本发明的快递分拣方法中,第一阈值能够设为65%~95%,从而能够较多的较准确的获取有效关键词,进而较佳地保证了分拣的准确性。
作为优选,步骤二包括以下步骤,
A、获取待派件地址;
B、对待派件地址进行分词以获得至少一个检索关键词。
本发明的快递分拣方法中,待派件地址进行分词的分词方法能够采用随意分词方法,即能够对分词的最长字串和最短字段依次进行定义,从而较佳地保证了能够找到派件地址的所有可能的字串,提高了分拣的准确性。
作为优选,步骤三包括以下步骤,
C、将所述至少一个检索关键词发送给检索数据库,以对应得到至少一个待筛选投递站点;
D、将在所述至少一个待筛选投递站点中出现概率不低于设定第二阈值的待筛选投递站点作为待投递投递站点,并经输出模块输出。
本发明的快递分拣方法中,能够基于检索数据库对待投递投递站点进行查询,从而大大简化了分拣过程并具备较佳的分拣准确性。
作为优选,步骤D中,设定第二阈值为60%~85%。
本发明的快递分拣方法中,第二阈值能够设为60%~85%,从而能够在保证较为精准获取待投递投递站点的同时,也较佳地减少了因待筛选投递站点的数量较少而导致的解析失败。
附图说明
图1为实施例1中一种快递分拣装置的示意图;
图2为实施例4中一种快递分拣方法的流程示意图;
图3为实施例4中检索数据库的建立流程示意图;
图4为实施例4中依据检索数据库进行分拣的流程示意图。
具体实施方式
下面结合附图与实施例对本发明作进一步详细描述。
实施例1
如图1所示,本实施例提供了一种快递分拣装置,其包括:
历史派件地址数据库,其用于记载历史派件地址信息,历史派件地址信息包括由至少一个历史派件地址组成的历史派件地址集合;
站点派送区域数据库,其用于记载由至少一个投递站点组成的投递站点集合,任一投递站点均包括由与该投递站点对应的至少一个派件点组成的派件点集合;
经纬度解析模块,其用于将所述至少一个历史派件地址对应解析为至少一个历史派件地址经纬度信息,并用于将所有派件点对应解析成所有派件点经纬度信息;
映射处理模块,其用于对所述至少一个历史派件地址经纬度信息与所有派件点经纬度信息进行处理,以得到历史派件地址集合到投递站点集合的映射;
第一分词模块,其用于对所述至少一个历史派件地址进行分词以对应得到至少一个关键词集合,任一关键词集合均包括至少一个关键词,所有关键词经映射处理模块进行处理以得到所有关键词在所述至少一个投递站点中的关键词分布信息;
统计处理模块,其用于对关键词分布信息进行处理以得到所有关键词在任一投递站点中的出现频率,并将在任一投递站点处出现概率不低于设定第一阈值的关键词作为该投递站点的有效关键词;
检索数据库,其用于记载所有有效关键词和所述至少一个投递站点的信息,并建立所有有效关键词到所述至少一个投递站点的映射;
地址采集模块,其用于采集待派件地址并同时发送给历史派件地址数据库;
第二分词模块,其用于对待派件地址进行分词以得到至少一个检索关键词,并将所述至少一个检索关键词发送至检索数据库以对应得到的至少一个待筛选投递站点;
解析模块,其用于对所述至少一个待筛选投递站点进行处理以得到任一待筛选投递站点的出现频率,并将出现概率不低于设定第二阈值的待筛选投递站点作为待投递投递站点;以及
输出模块,其用于输出待投递投递站点。
本实施例中,第一阈值设为90%,第二阈值设为80%。
本实施例中,地址采集模块包括用于提取电子面单中派件地址信息的第一输入模块,用于提取手写面单中地址信息的第二输入模块,以及用于识别文字的第三输入模块。其中,第一输入模块能够采用现有的任何一款扫码装置,进而能够较佳地读取电子面单中的派件地址信息;第二输入模块能够采用键盘装置,从而能够较佳地手工输入手写面单中的地址信息;第三输入模块能够采用现有的任何一款图片识别装置,从而能够较佳地识别图片中的文字信息。
本实施例中,输出模块包括用于输出语音信息的语音输出模块和用于输出图像信息的图像输出模块,从而能够以多种方式输出待投递投递站点,增加了其运用的灵活性。
本实施例中,第一分词模块和第二分词模块均包括两个分别用于定义分词的最长字串和最短字段的定义模块,从而较佳地保证了能够找到派件地址的所有可能的字串,提高了检索数据库建立和分拣的准确性。
实施例2
本实施例也提供了一种快递分拣装置,其与实施例1的不同之处在于:第一阈值设为65%,第二阈值设为60%。
实施例3
本实施例也提供了一种快递分拣装置,其与实施例1的不同之处在于:第一阈值设为95%,第二阈值设为85%。
实施例4
本实施例中提供了一种基于实施例1~3中任一快递分拣装置的快递分拣方法。
如图2所示,采用本实施例中的快递分拣方法进行快递分拣时,首先获取与快递单号对应的待派件地址,其次将该待派件地址进行解析,即分词后向检索数据库进行查询,若解析出待投递投递站点则输出该投递站点,若没有解析出待投递投递站点则转人工分拣。其大致概括为以下步骤:一、构建关键词与投递站点映射的检索数据库;二、对待派件地址进行分词以得到检索关键词;三、将检索关键词发送至检索数据库中,进而得到与待派件地址对应的待投递投递站点。
如图3所示,为本实施例中检索数据库的建立流程示意图,其包括以下步骤:
(1)从历史派件地址数据库中提取所有历史派件地址信息;
(2)从站点派送区域数据库中提取所有投递站点信息;
(3)采用经纬度解析模块对所有历史派件地址信息和所有投递站点的投递区域信息进行经纬度解析,从而得到所有历史派件地址经纬度信息和所有投递站点的投递区域经纬度信息;
(4)采用映射处理模块对所有历史派件地址经纬度信息和所有投递站点的投递区域经纬度信息进行处理,从而得到所有历史派件地址与所有投递站点间的映射关系;
(5)采用第一分词模块逐个对所有历史派件地址进行分词以对应得到至少一个关键词;
(6)根据步骤(4)中所有历史派件地址与所有投递站点间的映射关系,得到所有关键词在所述所有投递站点中的关键词分布信息;
(7)采用统计处理模块对关键词分布信息进行处理以得到所有关键词在任一投递站点中的出现频率,并将在任一投递站点处出现概率不低于设定第一阈值的关键词作为该投递站点的有效关键词;
(8)建立所有有效关键词到所有投递站点的映射,从而得到检索数据库。
如图3所示,为本实施例中依据检索数据库进行分拣的流程示意图,其包括以下步骤:
A、获取待派件地址;
B、对待派件地址进行分词以获得至少一个检索关键词。
C、将所述至少一个检索关键词发送给检索数据库,以对应得到至少一个待筛选投递站点;
D、将在所述至少一个待筛选投递站点中出现概率不低于设定第二阈值的待筛选投递站点作为待投递投递站点,并经输出模块输出。
总之,以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所作的均等变化与修饰,皆应属本发明专利的涵盖范围。

Claims (7)

1.基于关键词数据库检索的快递分拣装置,其包括:
检索数据库,其用于记载所有有效关键词和所有投递站点的信息,并建立所有有效关键词到所有投递站点的映射;
地址采集模块,其用于采集待派件地址;
第二分词模块,其用于对待派件地址进行分词以得到至少一个检索关键词,并将所述至少一个检索关键词发送至检索数据库以对应得到的至少一个待筛选投递站点;
解析模块,其用于对所述至少一个待筛选投递站点进行处理以得到任一待筛选投递站点的出现频率,并将出现概率不低于设定第二阈值的待筛选投递站点作为待投递投递站点;以及
输出模块,其用于输出待投递投递站点。
2.根据权利要求1中所述的分拣装置,其特征在于:设定第二阈值为60%~85%。
3.根据权利要求1或2中所述的分拣装置,其特征在于:地址采集模块包括用于提取电子面单中派件地址信息的第一输入模块,用于提取手写面单中地址信息的第二输入模块,以及用于识别文字的第三输入模块。
4.根据权利要求3中所述的分拣装置,其特征在于:输出模块包括语音输出模块和图像输出模块。
5.基于权利要求1中所述分拣装置的快递分拣方法,其包括以下步骤:
一、采集待派件地址;
二、对待派件地址进行分词以得到检索关键词;
三、将检索关键词发送至检索数据库中,进而得到与待派件地址对应的待投递投递站点。
6.根据权利要求5所述的分拣方法,其特征在于:步骤三包括以下步骤,
A、将所述至少一个检索关键词发送给检索数据库,以对应得到至少一个待筛选投递站点;
B、将在所述至少一个待筛选投递站点中出现概率不低于设定第二阈值的待筛选投递站点作为待投递投递站点,并经输出模块输出。
7.根据权利要求6所述的分拣方法,其特征在于:步骤B中,设定第二阈值为60%~85%。
CN201510661588.XA 2015-10-14 2015-10-14 基于关键词数据库检索的快递分拣装置及方法 Pending CN105205173A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510661588.XA CN105205173A (zh) 2015-10-14 2015-10-14 基于关键词数据库检索的快递分拣装置及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510661588.XA CN105205173A (zh) 2015-10-14 2015-10-14 基于关键词数据库检索的快递分拣装置及方法

Publications (1)

Publication Number Publication Date
CN105205173A true CN105205173A (zh) 2015-12-30

Family

ID=54952856

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510661588.XA Pending CN105205173A (zh) 2015-10-14 2015-10-14 基于关键词数据库检索的快递分拣装置及方法

Country Status (1)

Country Link
CN (1) CN105205173A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106412196A (zh) * 2016-05-31 2017-02-15 深圳市永兴元科技有限公司 联系人信息处理方法和装置
CN107609764A (zh) * 2017-09-01 2018-01-19 浙江百世技术有限公司 一种快递地址解析方法及系统
CN111346825A (zh) * 2020-02-26 2020-06-30 佛山科学技术学院 一种智能快递分拣机及分拣方法
CN111382922A (zh) * 2018-12-29 2020-07-07 顺丰科技有限公司 信息采集任务分配方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1959712A (zh) * 2006-08-14 2007-05-09 深圳市络道科技有限公司 按投递地址段自动制作商函的方法及其系统
CN101350012A (zh) * 2007-07-18 2009-01-21 北京灵图软件技术有限公司 一种地址匹配的方法和系统
CN104624509A (zh) * 2015-01-16 2015-05-20 浙江百世技术有限公司 一种快递自动分拣系统及自动分拣方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1959712A (zh) * 2006-08-14 2007-05-09 深圳市络道科技有限公司 按投递地址段自动制作商函的方法及其系统
CN101350012A (zh) * 2007-07-18 2009-01-21 北京灵图软件技术有限公司 一种地址匹配的方法和系统
CN104624509A (zh) * 2015-01-16 2015-05-20 浙江百世技术有限公司 一种快递自动分拣系统及自动分拣方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106412196A (zh) * 2016-05-31 2017-02-15 深圳市永兴元科技有限公司 联系人信息处理方法和装置
CN107609764A (zh) * 2017-09-01 2018-01-19 浙江百世技术有限公司 一种快递地址解析方法及系统
CN111382922A (zh) * 2018-12-29 2020-07-07 顺丰科技有限公司 信息采集任务分配方法及装置
CN111346825A (zh) * 2020-02-26 2020-06-30 佛山科学技术学院 一种智能快递分拣机及分拣方法

Similar Documents

Publication Publication Date Title
CN105373588A (zh) 快递分拣装置及方法
CN103368992B (zh) 一种信息推送方法及装置
CN110110577B (zh) 识别菜名的方法及装置、存储介质、电子装置
CN105069056A (zh) 基于字符串匹配的身份证住址信息解析方法及系统
CN105205173A (zh) 基于关键词数据库检索的快递分拣装置及方法
CN108256718B (zh) 保单服务任务分配方法、装置、计算机设备和存储设备
CN104750754A (zh) 网站所属行业的分类方法和服务器
CN103810168A (zh) 检索应用的方法、装置及终端
CN104624509A (zh) 一种快递自动分拣系统及自动分拣方法
CN102646124A (zh) 一种自动识别地址信息的方法
CN103914570A (zh) 基于字符串相似度算法的智能客服搜索方法与系统
CN106383862B (zh) 一种违规短信检测方法及系统
CN102375863A (zh) 一种地理信息领域的关键字提取的方法及装置
CN105159884A (zh) 行业词典的建立方法和装置及行业识别方法和装置
CN110633404A (zh) 应用程序消息推送的方法、装置、存储介质和终端设备
CN103559177A (zh) 一种地名识别方法及装置
CN113326363A (zh) 搜索方法及装置、预测模型训练方法及装置、电子设备
CN102446186B (zh) 中文地理编码及解码方法和装置
CN115409553B (zh) 一种基于大数据和位置信息的广告投放系统及其方法
CN102902737B (zh) 一种网络图像自主收集与筛选方法
CN107169065B (zh) 一种特定内容的去除方法和装置
CN115438340A (zh) 一种基于词素特征的挖矿行为识别方法及系统
CN112507223B (zh) 数据处理方法、装置、电子设备及可读存储介质
CN115600592A (zh) 文本内容的关键信息提取方法、装置、设备及介质
CN115292008A (zh) 用于分布式系统的事务处理方法、装置、设备及介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20151230