CN101678404A - 包括对与邮寄件相关的签名进行图形分类的邮寄件处理方法 - Google Patents

包括对与邮寄件相关的签名进行图形分类的邮寄件处理方法 Download PDF

Info

Publication number
CN101678404A
CN101678404A CN200880018109A CN200880018109A CN101678404A CN 101678404 A CN101678404 A CN 101678404A CN 200880018109 A CN200880018109 A CN 200880018109A CN 200880018109 A CN200880018109 A CN 200880018109A CN 101678404 A CN101678404 A CN 101678404A
Authority
CN
China
Prior art keywords
signature
mailing
information
attribute
component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200880018109A
Other languages
English (en)
Other versions
CN101678404B (zh
Inventor
奥利维耶·戴普雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SOLISTEC
Solystic SAS
Original Assignee
SOLISTEC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SOLISTEC filed Critical SOLISTEC
Publication of CN101678404A publication Critical patent/CN101678404A/zh
Application granted granted Critical
Publication of CN101678404B publication Critical patent/CN101678404B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B07SEPARATING SOLIDS FROM SOLIDS; SORTING
    • B07CPOSTAL SORTING; SORTING INDIVIDUAL ARTICLES, OR BULK MATERIAL FIT TO BE SORTED PIECE-MEAL, e.g. BY PICKING
    • B07C3/00Sorting according to destination
    • B07C3/10Apparatus characterised by the means used for detection ofthe destination
    • B07C3/14Apparatus characterised by the means used for detection ofthe destination using light-responsive detecting means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/42Document-oriented image-based pattern recognition based on the type of document
    • G06V30/424Postal images, e.g. labels or addresses on parcels or postal envelopes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Sorting Of Articles (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)
  • Steroid Compounds (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Packaging For Recording Disks (AREA)

Abstract

一种邮寄件的邮政分拣方法,从邮寄件的图像获得签名(13),签名在分拣流程中用作邮寄件的标识符。根据某个图形相似性标准将签名分组成签名类或图形类(CG)(43),以便计算每个图形类的签名平均值。对于每个被考虑的图形类,分析签名平均值的活动,以便检测数字图像中某个信息块的有意义活动。利用所述活动检测的结果,在第二次分拣时寻找当前签名与第一次分拣时记录的签名之间的相符者。

Description

包括对与邮寄件相关的签名进行图形分类的邮寄件处理方法
技术领域
本发明涉及一种邮寄件处理方法,其中,在第一次分拣邮寄件时,对每个邮寄件的包含信息块的表面制作数字图像,从每个邮寄件相关图像获得一个类似于图形指纹的数字签名,作为该邮寄件的逻辑标识符,并将该邮寄件相关签名与分拣信息对应地保存于存储器;并且其中在第二次分拣邮寄件时,重新制作每个邮寄件的所述表面的数字图像,以便获得与该邮寄件相关的当前数字签名,并且,在第一次分拣存储的签名中寻找与该当前签名相符者,以便通过关联取回分拣信息。
背景技术
这种方法可以从法国专利文献FR-2841673中了解到。如果采用这种方法,就不再需要在邮寄件表面打上标识码或“时间戳”,也称为“IdTag”。邮寄件的标识是通过“虚拟”码来实现的,其优点是能避免使用条码打印机,从而大大降低了邮政分拣设备运行维护成本。
根据当前已知方法,每个数字签名包含一个称为“图像”的第一分量,表示相应邮寄件的数字图像的物理特征,以及一个称为“邮政”的第二分量,至少表明邮寄件图像中信息块的空间位置。具体地说,图像分量由称为“整体”的属性构成:“整体”属性表示从邮寄件数字图像的各点的全体获得的整体物理特征。图像分量还由称为“局部”的属性构成,“局部”属性表示从邮寄件图像的一个方格图(或多个不同方格图)的各部分获得的局部物理特征。
在实践中,在寻找当前签名与签名库中记录的候选签名之间的相符者,以便取回分拣信息时,首先比较图像的各图像分量,然后比较签名的各邮政分量。
当需要用这些虚拟标识码或签名来分拣来自于批量寄件人的成批邮寄件时,会面临如下问题:总的来说,同一寄件人的邮寄件的相关签名的图像分量(整体属性和局部属性)无法在这些签名之间相互区分。事实上,从图形上看起来,来自同一批量寄件人的邮寄件一般都相同:信封类型相同、信封上打印的图标相同、寄件人地址栏相同、收件人地址栏位置相同,等等。因此,在实践中,区分同一批量寄件人的两个邮寄件签名只能依靠收件人地址栏的内容。
但是,不能排除的可能情形是:在构造签名时,数据处理系统把寄件人地址当成了收件人地址。因而,在扫描同一寄件人的邮寄件相关签名时,可能发现两个签名相符,这两个签名的图像分量相同,并且邮政分量也相同,原因是这两个签名都错误地把寄件人地址栏当作了收件人地址栏。
在这种情况下,会发现在寻找相符者时签名匹配错误增加。这种匹配错误显然会导致邮寄件向分拣出口分道错误,从而产生邮件配送处理的额外成本。
发明内容
本发明的目的是提出一种更鲁棒的邮寄件处理方法,该方法可以减少上述匹配错误,尤其针对如下情况:要分拣的邮寄件来自于批量寄件人,因而其图形非常相似。
为此,本发明的目的是提出一种处理邮寄件的方法,其中,在第一次分拣邮寄件时,对每个邮寄件的包含信息块的表面形成数字图像,从每个邮寄件相关图像获得一个为所述邮寄件的逻辑标识符的数字签名,并将签名与分拣信息对应地存储在存储器中;在第二次分拣邮寄件时,重新形成每个邮寄件的所述表面的数字图像,以便获得与所述邮寄件相关的当前数字签名,并且,在第一次分拣时存储的各签名中寻找与该当前签名相符者,以便通过关联取回所述邮寄件的分拣信息,特征在于包括如下步骤:
-根据给定的图形相似性标准将签名分组成签名类或图形类,用来计算每个图形类的签名平均值;
-对每个被考虑的图形类分析签名平均值的活动,用来检测这些数字图像中的一个信息块的一个有意义活动;
-利用所述活动检测的结果寻找相符者。
本发明的基本思想是根据在运行中(àla volée)实时地合并整理(consolidé)的签名的图形模型将连续的签名分类,以便通过每个模型反映该模型所包含的签名的邮寄件图像的不变图形外观。每次当在向对应于签名模型的图形类中重新组入一个新签名而合并或更新该模型时都进行活动(或低频变化)分析,该活动分析允许显示邮寄件图像中收件人地址栏位置,因为该收件人邮政地址栏很可能就是呈现出最有意义低频活动的信息块,该信息块与其它信息块不同:在考虑来自于同一批量寄件人的邮寄件时,其它信息块通常是稳定的。
根据本发明的方法可以具有如下特征:
-根据签名的图像分量的一个给定图形相似性标准将签名分组成图形类,以便计算属于所考虑的图形类的各签名的图像分量的平均值;
-分析图像分量的平均值的活动,以便检测这些数字图像中某个信息块的一个有意义活动;
-利用所述活动检测的结果来比较各签名的邮政分量;
-利用签名的整体分量和局部分量来确定签名相似性;
-对整体分量设置赋范向量距离阈值,以便建立所述相似性;
-对局部属性计算相关系数,以便建立所述相似性;
-运用K-means类型的拓扑分析方法,以便分析图像分量的局部属性的活动;
-第二次分拣时,根据相继当前签名在运行中构建图形类。
根据本发明的方法可以对任何类型的邮寄件实施,例如信件、大尺寸或小尺寸的扁平物件。根据本发明的方法还可以应用于分拣包裹以及其它由虚拟标识码标识的物件。
附图说明
下文将结合附图更详细地描述根据本发明的方法的一个实施实例。该描述仅作为本发明的说明性、非限制性实例给出。
图1是邮寄件示意图,邮寄件上有多个信息块。
图2示意性地表示实施根据本发明方法的分拣机。
图3以流程图的形式说明当前分拣方法在第一次分拣时的流程。
图4示意性地说明从邮寄件提取签名的图像分量。
图5示意性地说明从邮寄件提取签名的邮政分量。
图6以流程图的形式说明根据本发明第一实施方式在第二次分拣时的流程。
图7详细说明根据本发明方法对签名分类的步骤。
图8表示根据本发明方法在分类签名时比较图像分量。
图9表示根据本发明方法更新图形类的图像分量的实例。
图10详细说明基于相应图形类的图像分量来修改当前邮寄件的邮政分量的步骤。
图11详细说明基于相应图形类的邮政分量来修改当前邮寄件的邮政分量的步骤。
图12以流程图的形式说明根据本发明第二实施方式在第二次分拣时的流程。
图13说明用预测机制缩小搜索空间的原则。
具体实施方式
根据本发明的方法,识别邮寄件,例如信件、小尺寸或大尺寸的、纸封皮或塑料封皮的扁平物件,以及其它需要利用数字签名自动分拣的物件,数字签名从邮寄件的表面的图像获得,而邮寄件的表面通常都有收件人邮政地址栏。因而,该数字签名还被称作图像签名,用于在邮政自动分拣机中替代条码标识码明确地标识邮寄件。分拣机一词从广义上指安装于一个或多个邮政分拣地的邮政分拣设备,必要时还包括视频编码器。
构造数字签名
图1描绘了一个邮寄件,标注为P,其表面例如带有:一个对应于邮政配送地址或收件人地址的第一信息块AD,一个对应于发件人地址的信息块AE,一个可能形为图形标志的信息块L,对应于其它补充文字信息,例如发件人打印的广告语。
图2示意性的描绘了一台邮政分拣机1,该机通常有一个供信入口2(该供信入口带有一个邮寄件P装入舱、一个用于将邮寄件侧立排成序列的分信理信器(dépileur))、一个用于形成每个邮寄件的带上述各种信息块的表面的图像的数码照相机3、一个桶式输送带(uncarrouselà godets)4用于将邮寄件送到分拣出口5。每个分拣出口可以配有多个分拣出口槽(通常一个前槽一个后槽),或一个分格槽,这都未超出本发明的范围。
图中还表示了一个数据处理系统,标注为6,用于OCR邮政地址识别。众所周知,该数据处理系统与视频编码器7相关联。根据本发明,系统6还能用来从照相机3形成的邮寄件数字图像获得数字签名。
图中还表示了一个与系统6类似的系统9,不过该系统9是另一个分拣机10的一部分,系统9例如通过通信网络8与系统6通信,可以将根据本发明的方法应用于多个分拣机上的多次分拣流程。
图3示意性地说明在机器1中第一次分拣时构造数字签名。在起始步骤11,通过供信入口2往分拣机1中送入邮寄件P。邮寄件P通过分信理信(dépilé),侧立地排成序列被送至数码相机3。
在步骤12,形成当前邮寄件的表面的数字图像,该表面可能带有图1所示的各信息块,例如AE、AD和L。
在步骤13,系统6通过OCR从图像自动识别配送地址,同时从该图像获得一个分配给该邮件数字签名V-Id。
在步骤14,如果邮政地址在步骤13被明确地识别出来,那么转入步骤16,将OCR识别出来的地址数据与邮寄件的签名V-Id相对应地保存于机器存储器。
如果在步骤13地址没有完全被OCR完全识别出来,也就是说得到的是模棱两可的地址信息,或根本没有结果,那么转入步骤15,将邮寄件图像送到视频编码系统7,以便由视频编码操作者提取地址信息,然后,在步骤16,通过步骤15视频编码获得的地址信息与步骤13获得的签名相对应地保存。
图3中,标注为17的块表示名称为BDref的数据库,该数据库中与每个邮寄件一一对应地保存着数字签名V-Id和第一次分拣时由OCR或视频编码识别出的邮寄件分拣数据(包括地址信息)。
步骤8对应于邮寄件在经过相机3后向机器的分拣出口传送的流程。
现在,图4和图5更详细地说明根据本发明的签名分量。图4重新表示了邮寄件P的数字图像,通常是多灰度级数字图像,带有信息块AD、AE、L。
根据本发明的签名的第一分量称为“图像分量”Ci,表示图像的物理特征。该图像分量例如是通过对数字图像的各点亮度统计分析而提取出来的,数字图像应该事先经过了一系列的过滤,降低了图像分辨率,以便降低统计分析处理时间并具有低频类型的内容,该低频类型的内容在多次采集时对亮度波动不太敏感。一个图像点的亮度对应于图像点的灰度值。
从邮寄件的低分辨率数字图像中,系统6通过计算提取出整体属性,这些整体属性表示图像的整体物理特征,例如邮件的高和宽、数字图像的各点的平均亮度值、标准偏差、亮度值的熵(平均信息量)(entropie)。
还可以通过计算提取局部属性,表示从数字图像的各部分取得的图像的局部物理特征,。图4显示了邮寄件P的数字图像被分为多个不同部分B11、B’45,这些不同部分来自于数字图像的不同方格图或网格M1、M2、M3、M4、M4。此处方格图M1定义了3×3个不同部分。方格图M5定义了8×10个不同部分。方格图内不同部分的数量和方格图的数量可以是应用于数字图像的统计分析的参数,以便从签名中提取图像分量Ci。从数字图像的来自方格图(例如M1或M3)的每个部分(例如B11和B’45),可以提取局部属性例如数字图像的该部分的点的平均亮度值、标准偏差、数字图像的该部分亮度值的熵。在邮寄件参差不齐的情况下,这些局部属性包含的信息就越发的有区别能力。对数字图像提取出来的整体属性和局部属性因此构成了签名的图像分量Ci。
图5说明了签名的称为“邮政分量”的第二分量Cp,该第二分量Cp至少表明邮寄件图像中信息块例如AD、AE、L的空间位置。通常用于邮政分拣机的光学字符识别系统OCR能提供表明数字图像中所检测到的文字信息块的空间位置的数据。这些表明空间位置的数据可以是构成每个信息块的矩形区域的空间坐标和取向。OCR系统还能提供数字图像中所检测到的每个信息块的文字描述。例如AD这样的信息块的文字描述可以由如下信息构成:信息块中所检测到的字符行的数量说明、每行字符中所检测到的单词的数量、每行字符的每个单词中所检测到的字符的数量。图5展示了一个实例,是信息块AD的文字描述,该描述构成了邮寄件签名的邮政分量Cp:
标注为33的“块#0/3”指数字图像中所检测到的3个信息块中的0号信息块;
标注为33’的“HN”是这样的数据:它表明数字图像中0号信息块的取向;
标注为33”的“(0684 0626 0895 0756)”是这样的数据:它代表数字图像中0号信息块的空间坐标;
标注为33’”的“行数4”表明0号信息块包含4行字符;
标注为34的“行#0”指0号信息块中所检测到的第一行字符;
标注为35的“单词数03”是这样的数据:它表明在第一行字符中检测到了3个单词;
标注为36的“各单词字符数010604”是这样的数据:它表明第一行字符的3个单词分别包含1、6、4个字符;
标注为37的“car#0(1007 l 009 i 019)”是这样的数据:它表明对于第一行字符的第一个字符,OCR识别出3个候选字符,分别为1、l、i,其相似距离分别为007、009、019;
标注为38的“Car#1(L 008 E 009 D 057)”是这样的数据:它表明对于第一行字符的第二个字符,OCR识别出3个候选字符,分别为L、E、D,其相似距离分别为008、009、057;
......以下对于第一行字符的其它字符可以如此类推,假定相似距离值0是最小的距离,也就是表示与理想字符的偏差最小。
构造签名始于这样的思想:邮寄件的数字签名是一个可解释的二维信号,其内容既可以从物理角度理解,也可以从字符角度理解。因为,邮寄件的签名由两个互补而且不相关(相互独立)的分量Ci和Cp构成。
在第二次分拣时寻找签名的相符者
图6表示第二次分拣时的签名管理流程,该第二次分拣在图3所示的第一次分拣之后。第一次分拣了的邮寄件重新进入分拣机1,侧立着排成序列在相机3前通过。在步骤41,重新对当前邮寄件的带信息块(例如收件人地址AD)的表面形成数字图像。在步骤42,重新获得当前邮寄件的当前签名V-IdC,如上文所示。当前签名V-IdC包含一个图像分量CiC和一个邮政分量CpC。
然后在步骤46,将当前签名V-IdC的图像分量CiC和邮政分量CpC与数据库BDRef 17中保存的签名的图像分量Ci和邮政分量Cp相比较,以便检测到相符者。
首先,可以比较图像分量的各整体属性,其中一个步骤就是对每个整体属性设置变化绝对值阈值,以便对数据库17中保存的签名进行初次筛选。该次筛选可以去除与当前签名极不相似的签名,只为后续比较保留少量候选签名。
然后,对候选签名比较图像分量的局部属性,从而进一步降低数据库17中候选签名的数量。为实现该比较,可以首先计算当前签名与各候选签名相应直方图之间滑动归一化相关系数,从而可以排除相比较的两个数字图像之间的亮度变化的影响;然后按属性类型计算当前签名与各候选签名中其它局部属性之间的归一化相关系数,从而可以排除由于每个局部属性的变化程度不同而引起的归一化问题。然后,依据相关系数将候选签名按递减相似度分类。保留固定数量的最相似候选签名。
现在开始比较签名的邮政分量Cp:测量表示信息块位置的数据之间的相似程度。该第二次比较有利地利用了与图像分量比较标准不相关的第二标准。然后,这些候选签名按信息块文字描述的相似度递减排序分类。
当然,邮政分量比较可以在图像分量比较之前进行,或者邮政分量比较和图像分量比较还可以同时进行,这些方式都在本发明的范围内。
如果在步骤46没有检测出相符者,那么在步骤47将当前邮寄件送至拒绝出口,以便例如能人工分拣。如果在步骤46检测到相符者,就从数据库17中取回当前邮寄件的地址和分拣数据,并且,在步骤48,当前邮件自动转向相应的分拣出口。
签名归类
根据本发明的方法,在图6的步骤46之前实施一个借助于签名分类实现的可靠性提高流程,一方面针对当前签名,另一方面针对数据库BDRef的签名。该可靠性提高流程可以在寻找相符者时调整要比较的签名的邮政分量,以便避免匹配失误。
所述分类的原则是:首先构造一种词典,该词典中列出签名的类别或“图形类”CG。
每个图形类以一个图像分量CiCG和一个邮政分量CpCG模型化,该图像分量CiCG和邮政分量CpCG与上文所述的签名的相应分量相似。
根据本发明,该词典是实时演化的,意思是说图形类的图像分量和邮政分量是在运行中更新的,也就是说,随着把一个签名归于一个图形类,该图形类相应地被合并整理。这种运行中的更新不需要延时处理,而是实时的。此外,随着这种运行中的更新,对于远程分拣中心的后续分拣也就不需要传送该词典。
下文中将会看到,根据本发明的方法的一个重要特征,每次更新图形类时,计算图形分量的平均值(合并整理阶段),并分析该平均值的低频活动,以便评估收件人地址栏的位置,从而允许在步骤46的寻找相符者、比较签名的邮政分量时使用恰当的信息块。低频分析意指分析低分辨率图像中的变化。
在步骤43,实施对当前签名VidC分类的流程,也就是说,将当前签名的图像分量CiC与词典19中的图形类的图像分量CiCG比较,以便确定词典中与当前签名最相似的图形类CGx。更具体地说,根据本发明的方法,比较图像分量CiC和CiCG的局部和整体属性,以便在步骤43输出时识别出归属图形类CGx。如果词典中没有任何图形类与当前签名相对应,就构造一个新的图形类CGx。
图7和图8更具体地说明了比较图像分量以便实施分类的流程。下文中将对这些图进行讲解。
在分类步骤后的步骤44,实施图形类CGx的图形分量低频活动分析,以便检测与属于该图形类的签名相关的数字图像中信息块的有意义的低频活动。参照图9,该步骤44被更具体地描述。
在步骤45,利用步骤44的活动分析的结果对当前签名进行可靠性提高处理。步骤44将参照图10和图11被更详细地说明。在步骤45结束时,当前签名和图形类CGx的邮政分量可能被调整了。这些调整使得在步骤46的寻找与数据库17中保存的签名相符者时避免匹配失误。
在寻找相符者的步骤46之后,如果在步骤49处于某种“强邮政标准”被检验的状况,则在步骤50合并为当前邮寄件识别出的图形类CGx的邮政分量。“强邮政标准”意指这样一种状况:当前签名的邮政分量CpC与在步骤46识别出的相符签名的邮政分量相似(例如:收件人地址栏块标识相同、该块内字符行数相同、该块内每行单词数相同,等等)。
对于第二次分拣时被处理的相继当前邮寄件,图6中步骤41至50的流程被如此重复。
图7和图8更详细地说明了签名分类步骤43。在初始化该流程时,即对第二次分拣时的第一个邮寄件,图形类CG数据库19或词典通常是空的。为了适应实时处理的限制,可以把词典中保留的图形类CG的数量限制在某个可调节的给定数值NbMaxCG上。数值NbMaxCG例如可以由机器操作者给出的“先验”信息来确定,该“先验”信息表明要处理的邮寄件的参差不齐程度。通常,对于两次分拣来自于多个批量发件人的邮寄件,可以将数值NbMaxCG调节至100左右。等于100的NbMaxCG值对应于一批不太均质的邮寄件,也就是说,较小数量的相继邮寄件属于同一个发件人。
图7中,在步骤51将当前签名V-IdC的当前图像分量CiC与数据库19中保存的每个图形类的图形分量CiCG比较,以便检测某种相似性。图形分量的比较与前文对步骤46所述的实施方式相同。具体地说,首先比较图像分量CiC和CiCG的整体属性,然后比较局部属性。整体属性和局部属性从邮寄件的低分辨率数字图像(例如0.25像素/mm)获得。
图8更具体地说明了图像分量CiC和CiCG的整体属性(51a)和局部属性(51b)的比较步骤51。从图上可以看到,作为整体属性有:邮寄件的高度H、宽度L、数字图像的各点的平均亮度值、亮度值的标准偏差E和熵S。在图8的左边,方框52内列出了第一个向量(单列表格),包含CiC的H、L、I、E、T数值;还有几个向量,包含与类CG1、CG2、......CGN关联的CiCG的相似数值。
为了预选候选图形类CGi,首先将图像分量CiC的每个整体属性与CG1、CG2、......CGN的图形分量的相应属性比较。例如,为了确定图形类CG1是否是候选者,将CiC与CG1的高度H之差与阈值τ1比较,将CiC与CG1的宽度L之差与阈值τ2比较......,阈值τ1、τ2......可以不同。如果对于所有属性,差值都小于阈值,那么CG1就是候选者。
然后计算CiC的向量HLIET与每个候选图形类的向量HLIET之间的距离(赋范向量距离,在图8上标为DVN)。在步骤53,这些赋范向量距离DVN也与一个(可调整的)阈值比较,以便确定与当前签名最相似的那个或那些图形类CGi。
对如此预选出来的图形类CGi,将其图像分量CiCG的局部属性与当前签名的图像分量CiC的局部属性比较。图8在方框54中用三个4×4矩阵(来自于构造签名时的一个4×4方格图)说明了局部属性,这三个矩阵分别有如下赋值:图像的各点的平均亮度值、标准偏差E、亮度值的熵S。
将CiC的局部属性与在步骤53选中的每个图形类的CiCG的局部属性相关,在步骤51结束时选择计算得的最高相关系数CC(-1≤CC≤1)。当然,在计算相关性值时可以采用多种大小的方格图。
然后,在步骤55,将该相关系数CC与一个(如需要,可调整的)阈值比较,以便更新图形类的词典19。如果在步骤55相关系数CC小于阈值,则在步骤56往词典19中增加一个新的图形类CGx,并更新词典中保留的图形类数量(必要时,在超过了NbMaxCG值的情况下,删除一个图形类,从词典中删除的图形类例如是在一个参考时期内最少使用的)。新图形类CGx的分量CiCG和CpCG用步骤46中用到的当前签名的分量CiC和CpC初始化。
现在,如果在步骤55相关系数CC大于或等于阈值,则在步骤57更新图形类CGx使用计数器,并更新该图形类CGx。
步骤55的阈值调整可以调节归类所要求的相似度。在实践中,应该找到这样一个阈值,它允许将具有很大图形相似性的邮寄件签名组在一起,避免同一寄件人的相同图形外形的邮寄件导致构造多个图形类。在步骤43结束时,图形类CGx因此被标识为与当前签名VidC相似。
图9说明了图形类CGx的图像分量的一组局部属性,该图形类CGx在图6的步骤44用于低频活动分析。这些局部属性是如下量的标准偏差值:平均亮度I、标准偏差E、熵T。这些值涉及邮寄件图像的某个方格图的各区域,如上文所述。作为例子,图中展示了图像的一个5×5方格图,因而在方框60中可以看到3个矩阵,每个矩阵有25个标准偏差值。为了计算矩阵I55、E55、T55中的每个标准偏差值,平均值合并了当前签名的局部属性的相应值。因此可以认为:通过计算该标准偏差,计算了图形类CGx的签名的平均值。三个矩阵I55、E55、T55可以合成一个矩阵G55,例如根据专业人员已经熟知的赋范主成分分析(ACPN)(une analyse en composantes principalesnormée)。该矩阵G是一种“变化网格”,显示低频变化,即每当矩阵G合并时发生的变化。
方框62中展示了矩阵G的综合结果,其中,矩阵元素被分成三类,分类采用的是这样的拓扑方法:基于观测空间内接近度度量的“K-means”类型的非监督方法。“K-means”方法可以在矩阵G将矩阵元素分离成3个级别:不变级、微变级、剧变级,分别用白、灰、黑色方框表示。为了排除与采集机械波动相关的变化的影响,可以不考虑矩阵G边缘被检测到“变化”的方块。可以根据其连接性和低频活动将方块分组。可以利用具有不同方格图的多个矩阵G。在步骤44结束时,通常检测到一个呈现出最有意义低频活动的信息块的空间地址。
图10说明了对步骤45中低频活动分析的结果的考虑。在步骤63,如果检测到一个G矩阵元素(或多个矩阵G的矩阵元素)的一个低频活动(例如通过检测黑色方块(方框62中的剧变块)的存在),则在步骤64检验矩阵G中该方块的位置是否与当前签名的邮政分量CpC中的信息块(该信息块已经作为收件人地址被保留)位置重合。确定这种重合可以通过方块及信息块的坐标的空间投影,以便测量空间距离,然后通过将该距离与阈值比较来实现。在检测到重合的情况下,流程进行至图11的步骤70。
如果在步骤63没有检测到任何低频活动,则进行至图11的步骤70。
如果在步骤64,没有检测到当前签名的邮政分量CpC中标识的信息块与呈现最有意义低频活动的矩阵“块”之间的空间重合,则在步骤65,度量该最强低频活动“块”与当前签名的邮政分量CpC中标识的所有其它信息块之间的空间重合度。如果没有检测到与所述其它信息块之间的任何重合,则流程进行至图11的步骤70。
如果在步骤65,检测到与所述其它信息块中某一个的空间重合,则在步骤66修改当前签名的邮政分量CpC,以便将该信息块标识为很可能的收件人地址栏,从而,该信息块将在步骤46用来寻找签名相符者。
图11中,在步骤70进行了合并度量,度量的对象是:构成图形类CGx的所有相继签名的邮政分量中被标识为收件人地址栏的信息块的空间位置的离散度。离散度的度量形式为标准偏差的值。如果检测到所度量的距离大于某个阈值,则流程进行至图6的步骤46。所表明的状况是:图形类CGx的邮政分量CpC不足够可靠,因为用来构建该图形类的签名的邮政分量不稳定。
反之,如果在步骤70,所度量的距离小于所述阈值,则流程进行至步骤71。在步骤71度量图形类CGx的邮政分量与当前签名的邮政分量CpC之间的空间重合度。这种度量的方法例如是:计算当前签名的邮政分量中标识为收件人地址栏的信息块的中心与相应图形类的收件人地址栏中心的平均位置之间的位置偏差。将该度量与低阈值比较,如果该度量值小于该低阈值,则流程进行至图6的步骤46,以便寻找签名的相符者。
如果在步骤71没有检测到空间重合,则流程进行到步骤72。在步骤72寻找是否存在一个当前签名的邮政分量CpC中标识的信息块满足如下条件:该信息块与类CGx的邮政分量标识为收件人地址栏的信息块的距离小于所述低阈值。
步骤72判定为肯定后,转至步骤73,这里该信息块以图形类CGx的邮政分量CpCG被标识为很可能的收件人地址栏。
反之,步骤72判定为否定后,流程转至74,度量当前签名的邮政分量CpC中标识的所有信息块与图形类CGx的邮政分量中标识为收件人地址栏的信息块之间的空间距离。如果该距离大于高阈值,则在步骤75重新初始化(RAZ)词典19中的类CGx的邮政分量。
图12表示了根据本发明的方法的另一种实施方法,该实施方法从步骤42起与图6的方法不同。步骤80紧接构造当前签名VidC的步骤42。在步骤80,借助词典19对当前签名归类,如上文所述。重新获得一个相似的图形类CGx。在必要时,基于图形类CGx的图像分量CiCG修改当前签名的邮政分量CpC,并且,在必要时,修改图形类CGx的邮政分量CpCG。
现在,在步骤81,根据可以从法国专利FR-2883943中了解到的序列预测机制从签名库17取回候选签名。步骤81利用邮寄件在第一次分拣时的某个序列(通过的先后次序)在第二分拣时重复的优点,能够限制数据库17中的搜索空间。被限制了的这一搜索空间构成候选签名。
在步骤82,根据前述归类机制,将每个候选签名归于图形类词典19。在步骤82结束时,已经给每个候选签名标识了一个图形类CGy。
如果在步骤83,检测到当前签名的图形类CGx与被考虑的候选签名的图形类CGy相同,那么在步骤84修改该候选签名的邮政分量Cp,该修改根据的机制就是参照图10和图11描述的、为了在候选签名的邮政分量中重新正确定位收件人邮政地址栏的机制。然后,在步骤85,如参照图11的描述,必要时根据图形类CGx的邮政分量修改候选签名的邮政分量。然后本方法进行至图6的步骤46。应该理解到:对于从步骤81输出的每个候选签名,都要重复步骤82至85。
现在,如果在步骤83没有在当前签名与候选签名之间检测到共同图形类,则流程直接转至图6的步骤46。
步骤81的限制搜索空间的流程基于如下思想:在第一次分拣时,给每个邮寄件分配一个时间序列号NO,该时间序列号NO与数据库17中的邮寄件签名相对应地保存于存储器。每个时间序列号NO例如可以通过并列如下成分构成:分拣机1所处分拣中心的中心号、分拣邮寄件的分拣机的机号、邮寄件发往的分拣出口槽的分拣出口槽号、邮寄件的时序索引号。在实践中,该索引号例如是一个计数器的值,该计数器与一个分拣出口槽相关联;当第一个邮寄件发往该槽时,该计数器初始化;每当一个新邮寄件被发往该槽时,该计数器增量1个单位。这样,每个邮寄件被分配了一个唯一的序列号NO。
在第一次分拣结束时,签名在数据库17中按序列分组。例如,签名按照分拣中心、分拣机、分拣出口槽分组,并按照邮寄件在每个分拣出口槽中存放的顺序排序。如下文所详述,数据库17中相邻的签名序列构成可识别段。
在第二次分拣时,在图12的步骤80结束时,给当前邮寄件的签名V-IdC分配一个通过索引号IP(从1至n......)。然后,如专利FR-2883943所述,通过线性接近法为当前签名计算一个估计的时间序列号NO。从存储器中保存的一系列时间序列号,通过线性接近来计算。图13描绘了一个图表:横坐标轴上是邮寄件通过索引IP,从374至405,分别对应于第二次分拣时步骤80数字签名V-Id被提取的第374至第405个邮寄件。纵坐标轴上有时间序列号NO的实例,这些时间序列号NO是在第一次分拣时分配的,此处是存放在编号为“76”和“86”的槽中的邮寄件。线性接近计算的原则是:根据图13上十字叉所表示的一系列邮寄件通过索引号/时间序列号对(IP,NO),用方程系统确定直线(NO=a.IP+b)的系数a、b例如D1、D2,以便能根据一个当前通过索引号IP计算该直线上的时间序列号NO。
此外,图12所示的根据本发明方法的实施方式在合并步骤50有利地利用了上述预测机制。如果如前所述,在步骤49处于“强邮政分量标准”状况,并且如果在步骤46确定的相符签名的时间序列号与估计的时间序列号NO相对应,那么在步骤50,为当前邮寄件标识的图形类CGx的邮政分量被合并。

Claims (7)

1.一种处理邮寄件(P)的方法,其中,在第一次分拣邮寄件时,对每个邮寄件的包含信息块(AD、AE、L)的表面形成数字图像(12),从每个邮寄件相关图像获得一个为所述邮寄件的逻辑标识符的数字签名(V-Id)(13),并将签名(V-Id)与分拣信息对应地存储在存储器中(16);在第二次分拣邮寄件时,重新形成每个邮寄件的所述表面的数字图像(41),以便获得与所述邮寄件相关的当前数字签名(V-IdC)(42),并且,在第一次分拣时存储的各签名中寻找与该当前签名相符者,以便通过关联取回所述邮寄件的分拣信息,所述方法的特征在于包括如下步骤:
-根据给定的图形相似性标准将签名分组成签名类或图形类(CG)(43),用来计算每个图形类的签名平均值(57);
-对于每个被考虑的图形类分析签名平均值的活动(60、61、62),用来检测这些数字图像中的一个信息块的一个有意义活动;
-利用所述活动检测的结果寻找相符者。
2.根据权利要求1的方法,其中每个与邮寄件相关联的数字签名包含表示邮寄件的数字图像的物理特征的图像分量(CiC)和至少表示邮寄件的图像中呈现的信息块的空间位置的邮政分量(CpC),并且其中:
-根据签名的图像分量的给定图形相似性标准将签名分组成图形类,以便计算属于所考虑的图形类的各签名的图像分量的平均值(CiCG);
-分析图像分量的平均值的活动(60、61、62),以便检测这些数字图像中一个信息块的一个有意义活动;
-利用所述检测的结果来比较各签名的邮政分量。
3.根据权利要求2的方法,其中签名的图像分量包括称为“整体”的第一属性和称为“局部”的第二属性,第一属性表示从邮寄件图像的各点的全体获得的整体物理特征,第二属性表示从邮寄件图像的一个方格图的各部分获得的局部物理特征;并且,利用所述整体属性和所述局部属性来建立签名的相似性。
4.根据权利要求3的方法,其中对整体分量设置赋范向量距离阈值,用来建立所述相似性。
5.根据权利要求3或4的方法,其中对局部属性计算相关系数,用来建立所述相似性。
6.根据权利要求3至5中任一项的方法,其中运用K-means类型的拓扑分析方法,用来分析图像分量的局部属性的活动。
7.根据前述任一项权利要求的方法,其中在第二次分拣时,根据相继当前签名在运行中构建图形类。
CN2008800181090A 2007-05-30 2008-05-22 包括对与邮寄件相关的签名进行图形分类的邮寄件处理方法 Expired - Fee Related CN101678404B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR0755342 2007-05-30
FR0755342A FR2916661B1 (fr) 2007-05-30 2007-05-30 Procede de traitement d'envois incluant une classification graphique des signatures associees aux envois
PCT/FR2008/050885 WO2008152277A2 (fr) 2007-05-30 2008-05-22 Procédé de traitement d'envois incluant une classification graphique des signatures associées aux envois

Publications (2)

Publication Number Publication Date
CN101678404A true CN101678404A (zh) 2010-03-24
CN101678404B CN101678404B (zh) 2013-10-30

Family

ID=38951453

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008800181090A Expired - Fee Related CN101678404B (zh) 2007-05-30 2008-05-22 包括对与邮寄件相关的签名进行图形分类的邮寄件处理方法

Country Status (12)

Country Link
US (1) US8126204B2 (zh)
EP (1) EP2155406B1 (zh)
JP (1) JP4785986B2 (zh)
CN (1) CN101678404B (zh)
AT (1) ATE475492T1 (zh)
CA (1) CA2688163C (zh)
DE (1) DE602008001985D1 (zh)
DK (1) DK2155406T3 (zh)
ES (1) ES2348009T3 (zh)
FR (1) FR2916661B1 (zh)
PT (1) PT2155406E (zh)
WO (1) WO2008152277A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103294746A (zh) * 2012-01-16 2013-09-11 国际商业机器公司 用于可视媒体数据中的去识别的方法和系统

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2918199B1 (fr) * 2007-06-26 2009-08-21 Solystic Sas Procede de traitement d'envois postaux exploitant l'identification virtuelle des envois avec le readressage
FR2920678B1 (fr) * 2007-09-07 2009-10-16 Solystic Sas Procede de traitement d'envois postaux avec des codes client associes a des empreintes numeriques.
DE102010013220A1 (de) 2010-03-29 2011-09-29 Siemens Aktiengesellschaft Verfahren und Vorrichtung zum Transportieren eines zu bedruckenden Gegenstands
FR2965193B1 (fr) 2010-09-23 2012-08-31 Solystic Procede de tri postal avec un recouvrement des informations de traitement usager entre les passes de tri
DE102012200580A1 (de) 2011-01-26 2012-07-26 Siemens Aktiengesellschaft Verfahren und Anordnung zum Identifizieren eines transportierten Gegenstands mit einem Etikett
AU2011200830B2 (en) * 2011-02-25 2014-09-25 Canon Kabushiki Kaisha Method, apparatus and system for modifying quality of an image
US8818023B2 (en) * 2011-03-25 2014-08-26 Siemens Industry, Inc. Bulk region of interest learning
EP2923775B1 (en) * 2014-03-26 2020-07-08 NEC Corporation Postal Sorting System
US10031925B2 (en) * 2014-10-15 2018-07-24 Thinkcx Technologies, Inc. Method and system of using image recognition and geolocation signal analysis in the construction of a social media user identity graph
KR101742637B1 (ko) * 2015-05-15 2017-06-01 주식회사 세중에스앤씨 반송 우편물 자동처리 시스템 및 방법
FR3037691B1 (fr) * 2015-06-16 2018-04-20 Solystic Appariement d'images d'articles postaux avec des descripteurs de singularites du champ de gradient

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19947259C1 (de) * 1999-09-30 2000-09-28 Siemens Ag Verfahren und Vorrichtung zum Sortieren von Sendungen
US6360001B1 (en) * 2000-05-10 2002-03-19 International Business Machines Corporation Automatic location of address information on parcels sent by mass mailers
DE20218212U1 (de) * 2002-08-12 2003-12-24 Mit Management Intelligenter Technologien Gmbh Vorrichtung zur automatischen Adressblockmarkierung
FR2866252B1 (fr) * 2004-02-18 2006-04-21 Solystic Procede pour trier des envois postaux en plusieurs passes de tri
ITTO20040299A1 (it) * 2004-05-07 2004-08-07 Elsag Spa Metodo di riconoscimento postale
FR2883493B1 (fr) * 2005-03-24 2007-04-20 Solystic Sas Procede de traitement d'envois incluant une gestion des empreintes numeriques des envois

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103294746A (zh) * 2012-01-16 2013-09-11 国际商业机器公司 用于可视媒体数据中的去识别的方法和系统
CN103294746B (zh) * 2012-01-16 2017-07-18 国际商业机器公司 用于可视媒体数据中的去识别的方法和系统

Also Published As

Publication number Publication date
JP4785986B2 (ja) 2011-10-05
WO2008152277A2 (fr) 2008-12-18
ES2348009T3 (es) 2010-11-26
US20100232642A1 (en) 2010-09-16
PT2155406E (pt) 2010-10-14
ATE475492T1 (de) 2010-08-15
FR2916661A1 (fr) 2008-12-05
EP2155406A2 (fr) 2010-02-24
DE602008001985D1 (de) 2010-09-09
CA2688163A1 (fr) 2008-12-18
CN101678404B (zh) 2013-10-30
CA2688163C (fr) 2014-10-07
DK2155406T3 (da) 2010-11-22
EP2155406B1 (fr) 2010-07-28
WO2008152277A3 (fr) 2009-02-12
US8126204B2 (en) 2012-02-28
JP2010528386A (ja) 2010-08-19
FR2916661B1 (fr) 2009-07-03

Similar Documents

Publication Publication Date Title
CN101678404B (zh) 包括对与邮寄件相关的签名进行图形分类的邮寄件处理方法
US7356162B2 (en) Method for sorting postal items in a plurality of sorting passes
JP4580233B2 (ja) 画像シグネチャによる郵便物の識別タグおよび関連するメール操作機
US6269171B1 (en) Method for exploiting correlated mail streams using optical character recognition
CN101795783B (zh) 利用与数字印记关联的客户代码处理邮政寄送件的方法
US5754671A (en) Method for improving cursive address recognition in mail pieces using adaptive data base management
US6640009B2 (en) Identification, separation and compression of multiple forms with mutants
US20080008383A1 (en) Detection and identification of postal metermarks
Palumbo et al. Postal address block location in real time
US8768064B2 (en) Image feature extraction device
CN102165490B (zh) 图像同一性尺度计算系统
CN114511718B (zh) 一种建筑施工用物料智能管理方法及系统
CN109993201A (zh) 一种图像处理方法、装置和可读存储介质
JP2015058390A (ja) 仕分装置および仕分方法
CN102046304B (zh) 利用信息处理来对多个邮件进行分拣的方法
CN113743523B (zh) 一种视觉多特征引导的建筑垃圾精细分类方法
CN109166093B (zh) 一种图像显著区域检测方法
CN113221696A (zh) 一种图像识别方法、系统、设备及存储介质
CN113408573A (zh) 基于机器学习的瓷砖色号自动分类归类的方法及装置
CN113553980B (zh) 一种图片的商标图形要素编码生成方法、系统及装置
US11640702B2 (en) Structurally matching images by hashing gradient singularity descriptors
CN115393748A (zh) 一种基于Logo识别的侵权商标检测方法
Pizano et al. A business form recognition system
US20030215113A1 (en) Region of interest identification using region of adjacent pixels analysis
KR100632406B1 (ko) 우편 영상 특징을 이용한 우편물 구분 장치

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20131030

Termination date: 20170522