CN103020593A - 从大客户速递邮件中识别出拼凑邮件的方法及系统 - Google Patents

从大客户速递邮件中识别出拼凑邮件的方法及系统 Download PDF

Info

Publication number
CN103020593A
CN103020593A CN2012105049424A CN201210504942A CN103020593A CN 103020593 A CN103020593 A CN 103020593A CN 2012105049424 A CN2012105049424 A CN 2012105049424A CN 201210504942 A CN201210504942 A CN 201210504942A CN 103020593 A CN103020593 A CN 103020593A
Authority
CN
China
Prior art keywords
mail
sender
address
addr
zone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012105049424A
Other languages
English (en)
Inventor
韦蔚
霍俊
崔超
朱晓东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHENZHEN ROUTDATA TECHNOLOGY Co Ltd
Original Assignee
SHENZHEN ROUTDATA TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHENZHEN ROUTDATA TECHNOLOGY Co Ltd filed Critical SHENZHEN ROUTDATA TECHNOLOGY Co Ltd
Priority to CN2012105049424A priority Critical patent/CN103020593A/zh
Publication of CN103020593A publication Critical patent/CN103020593A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本发明适用于数据处理领域,提供了一种从大客户速递邮件中识别出拼凑邮件的方法及系统,所述方法包括下述步骤:步骤A,步骤A,获得待识别的速递邮件详情单的图像,确定所述图像中寄件人名址信息的填写区域;步骤B,从步骤A确定的填写区域中识别出寄件人名址信息,并与预存的大客户寄件人名址信息相对比;步骤C,若步骤B的对比结果为相匹配,则判断待识别的速递邮件为允许的大客户邮件,若步骤B的对比结果为不相匹配,则判断待识别的速递邮件为拼凑邮件。本发明在详情单图像已采集的前提下,通过图像识别的方法,对所有大客户的邮件详情单的内容进行识别,判断出不属于该大客户的邮件,以杜绝他人冒用此大客户以非法获取折扣的现象出现。

Description

从大客户速递邮件中识别出拼凑邮件的方法及系统
技术领域
本发明属于数据处理领域,尤其涉及一种从大客户速递邮件中识别出拼凑邮件的方法及系统。 
背景技术
一般速递公司的客户分为大客户和散户,大客户是邮件收寄是有折扣的,而散户没有。在业务发展过程中会出现,揽收人员讲散户的邮件拼凑到大客户的账户下进行收寄,从而违规实现邮件收寄折扣,从而造成速递公司的利益损失。 
发明内容
本发明所要解决的第一个技术问题在于提供一种从大客户速递邮件中识别出拼凑邮件的方法,旨在尽量杜绝出现他人冒用此大客户以非法获取折扣的现象。 
本发明是这样实现的,一种从大客户速递邮件中识别出拼凑邮件的方法,包括下述步骤: 
步骤A,获得待识别的速递邮件详情单的图像,确定所述图像中寄件人名址信息的填写区域; 
步骤B,从步骤A确定的填写区域中识别出寄件人名址信息,并与预存的大客户寄件人名址信息相对比; 
步骤C,若步骤B的对比结果为相匹配,则判断待识别的速递邮件为允许的大客户邮件,若步骤B的对比结果为不相匹配,则判断待识别的速递邮件为 拼凑邮件。 
本发明所要解决的第二个技术问题在于提供一种从大客户速递邮件中识别出拼凑邮件的系统,包括: 
寄件人名址填写区域确定单元,用于从获得的待识别的速递邮件详情单的图像中,确定所述图像中寄件人名址信息的填写区域; 
寄件人名址识别单元,用于从确定的填写区域中识别出寄件人名址信息,并与预存的大客户寄件人名址信息相对比; 
拼凑邮件确定单元,用于在对比结果为相匹配时,则判断待识别的速递邮件为允许的大客户邮件,在对比结果为不相匹配时,则用于判断待识别的速递邮件为拼凑邮件。 
本发明在详情单图像已采集的前提下,通过图像识别的方法,对所有大客户的邮件详情单的内容进行识别,判断出不属于该大客户的邮件,以杜绝他人冒用此大客户以非法获取折扣的现象出现。 
附图说明
图1是本发明提供的从大客户速递邮件中识别出拼凑邮件的方法的实现流程图; 
图2是本发明提供的邮件详情单的示意图; 
图3是图1所示流程的一个优化示意图; 
图4是本发明提供的从大客户速递邮件中识别出拼凑邮件的系统的结构原理图。 
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。 
本发明在详情单图像已采集的前提下,通过图像识别的方法,对所有大客户的邮件详情单的内容进行识别,判断出不属于该大客户的邮件。 
图1示出了本发明提供的从大客户速递邮件中识别出拼凑邮件的方法的实现流程,详述如下: 
步骤A,获得待识别的速递邮件详情单的图像,确定所述图像中寄件人名址信息的填写区域。 
邮件详情单的内容主要有两个部分:一是印刷的内容,有邮件条码,各个填写项的标题等,这部分是印刷体。二是寄件人填写的收寄件人的名址等信息,有手写体也有打印体。本发明中仅针对将寄件人名址印刷在填写区域的情况。 
为准确的识别图像,首先将一张邮件详情单的单原始彩色图像,识别出属于详情单印刷体的部分的色值,具体可使用相同(近似)色素值抽取的方法,然后将印刷部分的图像分离出来,分离成印刷内容和手填内容两个部分,仅针对印刷内容不符进行识别,以提高识别准确度。对于分离后的印刷内容部分,将其中与预设位置相符的区域确定为寄件人名址信息的填写区域,如图2所示,将与区域S相符合的区域默认为是填写区域。步骤B,从步骤A确定的填写区域中识别出寄件人名址信息,并与预存的大客户寄件人名址信息相对比。 
大客户的邮件,从邮件详情单信息的角度出发,主要的特征是寄件人的名址信息主要包括:寄件人名称、联系电话、单位名称、寄件人地址等要素。一般的大客户这些信息要素中有一两个是固定不变的,特别是单位名称和寄件人地址。通过下表的分析我们可看到,对于各种规模的大客户,单位名称和寄件人最复杂的情况下,也只有有限的几个。 
大客户规模 寄件人姓名 联系电话 单位名称 寄件人地址
小规模 一个 一个 一个 一个
中规模 多个 多个 一个 一个
大规模 大量 大量 几个 几个
[0025] 那么我们可以通过,客户注册的时候进行登记,或是与客户确认后可得到客户的合法单位名称信息和寄件人地址信息。 
寄件人名址中除了汉字以外还有数字,本发明使用OCR(Optical CharacterRecognition,光学字符识别)识别名址内容,以便同时能处理识别这两种内容的字符。由于判断的准确度依赖于识别的准确度,在字符识别时,不要求每个字符都能识别出来,但是要求能识别的字符,准确度要到95%以上,上述OCR的识别方式就可以满足需求。而对于无法识别出字符的邮件,可以认为此不具备被自动识别判断的条件,可以略过。 
步骤C,若步骤B的对比结果为相匹配,则判断待识别的速递邮件为允许的大客户邮件,若步骤B的对比结果为不相匹配,则判断待识别的速递邮件为拼凑邮件。 
对于能识别出准确字符的邮件,根据邮件的收寄信息,匹配此邮件的大客户的名址。那么判断是否为拼凑邮件的方法是:只要从识别出的信息中,有不存在于预存的大客户寄件人名址信息的字符存在,就可认为此邮件的寄件人信息与其大客户的名址信息不匹配,那么就是属于拼凑的邮件。 
在识别出速递邮件之后,还可进一步标记并进行记录,以便后续进一步处理。 
图3示出了图1的一种最优化的实现方案,具体不再赘述。 
本领域普通技术人员可以理解实现上述各实施例提供的方法中的全部或部分步骤可以通过程序来指令相关的硬件来完成,所述的程序可以存储于一计算机可读取存储介质中,该存储介质可以为ROM/RAM、磁盘、光盘等。 
图4示出了本发明提供的从大客户速递邮件中识别出拼凑邮件的系统的结构原理,为了便于描述,仅示出了与本发明相关的部分。此系统可以为内置于具有图像处理功能终端中的软件单元、硬件单元或软硬件结合的单元。 
参照图4,本系统包括寄件人名址填写区域确定单元41、寄件人名址识别单元42、拼凑邮件确定单元43,其中,寄件人名址填写区域确定单元41用于 从获得的待识别的速递邮件详情单的图像中,确定所述图像中寄件人名址信息的填写区域。然后寄件人名址识别单元42从确定的填写区域中识别出寄件人名址信息,并与预存的大客户寄件人名址信息相对比。最后,拼凑邮件确定单元43在对比结果为相匹配时,则判断待识别的速递邮件为允许的大客户邮件,在对比结果为不相匹配时,则用于判断待识别的速递邮件为拼凑邮件。 
进一步地,拼凑邮件确定单元43还用于对判断为拼凑邮件的速递邮件予以标记并记录。 
进一步地,寄件人名址填写区域确定单元41具体通过色素抽取的方式从所述图像中识别出印刷内容部分和手填内容部分,并分离出印刷内容部分,然后将分离出的印刷内容部分中与预设位置相符的区域确定为寄件人名址信息的填写区域。而寄件人名址识别单元42具体通过光学字符识别OCR的方式从确定的填写区域中识别出寄件人名址信息。 
本发明在详情单图像已采集的前提下,通过图像识别的方法,对所有大客户的邮件详情单的内容进行识别,判断出不属于该大客户的邮件,以杜绝他人冒用此大客户以非法获取折扣的现象出现,为事后稽查提供了行之有效的检测手段,可保证识别出拼凑邮件95%以上为真实的拼凑邮件,可适用于EMS、顺风等各个邮件快递公司。 
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。 

Claims (10)

1.一种从大客户速递邮件中识别出拼凑邮件的方法,其特征在于,包括下述步骤:
步骤A,获得待识别的速递邮件详情单的图像,确定所述图像中寄件人名址信息的填写区域;
步骤B,从步骤A确定的填写区域中识别出寄件人名址信息,并与预存的大客户寄件人名址信息相对比;
步骤C,若步骤B的对比结果为相匹配,则判断待识别的速递邮件为允许的大客户邮件,若步骤B的对比结果为不相匹配,则判断待识别的速递邮件为拼凑邮件。
2.如权利要求1所述的方法,其特征在于,在所述步骤C之后,所述方法还包括下述步骤:
对判断为拼凑邮件的速递邮件予以标记并记录。
3.如权利要求1所述的方法,其特征在于,所述步骤A通过如下方式确定所述图像中寄件人名址信息的填写区域:
通过色素抽取的方式从所述图像中识别出印刷内容部分和手填内容部分,并分离出印刷内容部分;
将分离出的印刷内容部分中与预设位置相符的区域确定为寄件人名址信息的填写区域。
4.如权利要求1所述的方法,其特征在于,所述步骤B具体通过光学字符识别OCR的方式从确定的填写区域中识别出寄件人名址信息。
5.如权利要求1所述的方法,其特征在于,所述步骤C具体包括如下步骤:
步骤C1,若识别出的寄件人名址信息中有不存在于预存的大客户寄件人名址信息中的字符存在,则认为对比结果不相匹配。
6.如权利要求1任一项至5所述的方法,其特征在于,所述寄件人名址信息包含寄件人的单位名称信息和地址信息。
7.一种从大客户速递邮件中识别出拼凑邮件的系统,其特征在于,包括:
寄件人名址填写区域确定单元,用于从获得的待识别的速递邮件详情单的图像中,确定所述图像中寄件人名址信息的填写区域;
寄件人名址识别单元,用于从确定的填写区域中识别出寄件人名址信息,并与预存的大客户寄件人名址信息相对比;
拼凑邮件确定单元,用于在对比结果为相匹配时,则判断待识别的速递邮件为允许的大客户邮件,在对比结果为不相匹配时,则用于判断待识别的速递邮件为拼凑邮件。
8.如权利要求7所述的系统,其特征在于,所述拼凑邮件确定单元还用于对判断为拼凑邮件的速递邮件予以标记并记录。
9.如权利要求7所述的系统,其特征在于,所述寄件人名址填写区域确定单元通过色素抽取的方式从所述图像中识别出印刷内容部分和手填内容部分,并分离出印刷内容部分,然后将分离出的印刷内容部分中与预设位置相符的区域确定为寄件人名址信息的填写区域。
10.如权利要求7所述的方法,其特征在于,所述寄件人名址识别单元具体通过光学字符识别OCR的方式从确定的填写区域中识别出寄件人名址信息。
CN2012105049424A 2012-11-30 2012-11-30 从大客户速递邮件中识别出拼凑邮件的方法及系统 Pending CN103020593A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012105049424A CN103020593A (zh) 2012-11-30 2012-11-30 从大客户速递邮件中识别出拼凑邮件的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012105049424A CN103020593A (zh) 2012-11-30 2012-11-30 从大客户速递邮件中识别出拼凑邮件的方法及系统

Publications (1)

Publication Number Publication Date
CN103020593A true CN103020593A (zh) 2013-04-03

Family

ID=47969184

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012105049424A Pending CN103020593A (zh) 2012-11-30 2012-11-30 从大客户速递邮件中识别出拼凑邮件的方法及系统

Country Status (1)

Country Link
CN (1) CN103020593A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107292227A (zh) * 2017-05-03 2017-10-24 浙江百世技术有限公司 一种收/寄件信息提取方法及系统
CN112257814A (zh) * 2020-11-26 2021-01-22 携程计算机技术(上海)有限公司 基于深度学习的邮件标签方法、系统、设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101916327A (zh) * 2010-07-09 2010-12-15 北京商纳科技有限公司 一种生成错题本的方法及系统
CN102622592A (zh) * 2012-01-19 2012-08-01 北京友录在线科技发展有限公司 一种基于云技术的名片识别方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101916327A (zh) * 2010-07-09 2010-12-15 北京商纳科技有限公司 一种生成错题本的方法及系统
CN102622592A (zh) * 2012-01-19 2012-08-01 北京友录在线科技发展有限公司 一种基于云技术的名片识别方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107292227A (zh) * 2017-05-03 2017-10-24 浙江百世技术有限公司 一种收/寄件信息提取方法及系统
CN112257814A (zh) * 2020-11-26 2021-01-22 携程计算机技术(上海)有限公司 基于深度学习的邮件标签方法、系统、设备及存储介质

Similar Documents

Publication Publication Date Title
US10095947B2 (en) Methods for mobile image capture of vehicle identification numbers in a non-document
CN106228675A (zh) 识别发票真伪的方法和装置
CN108717545B (zh) 一种基于手机拍照的票据识别方法及系统
CN101687225B (zh) 利用虚拟识别具有再寻址的寄送物来处理邮政寄送物的方法
CN101059885B (zh) 一种车票真伪核验方法
CN103914680B (zh) 一种喷印字符图像识别与校验系统及方法
JP3375766B2 (ja) 文字認識装置
CN108777021B (zh) 一种基于扫描仪混扫的票据识别方法及系统
CN102360419B (zh) 计算机扫描阅读管理方法及系统
US20060177118A1 (en) Method and system for extracting information from documents by document segregation
US20140268250A1 (en) Systems and methods for receipt-based mobile image capture
CN102194275A (zh) 一种车票自动检票方法
CN111598099B (zh) 图像文本识别性能的测试方法、装置、测试设备及介质
Ravirathinam et al. Automatic license plate recognition for indian roads using faster-rcnn
CN111462388A (zh) 一种票据检验方法、装置、终端设备及存储介质
CN110276352A (zh) 标识识别方法、装置、电子设备及计算机可读存储介质
CN112364837A (zh) 一种基于目标检测和文本识别的票据信息识别方法
JP2018190064A (ja) 会計処理システム
CN110008782A (zh) 条码信息的获取方法及装置
CN103020593A (zh) 从大客户速递邮件中识别出拼凑邮件的方法及系统
KR101742637B1 (ko) 반송 우편물 자동처리 시스템 및 방법
CN110414497A (zh) 对象电子化的方法、装置、服务器及存储介质
US8818023B2 (en) Bulk region of interest learning
CN111860263B (zh) 信息录入方法、装置及计算机可读存储介质
CN107291905A (zh) 一种基于互联网的专利产品验证方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20130403