CN110705486B - 一种基于视频图像识别快递面单上倾斜数字的方法 - Google Patents

一种基于视频图像识别快递面单上倾斜数字的方法 Download PDF

Info

Publication number
CN110705486B
CN110705486B CN201910950453.3A CN201910950453A CN110705486B CN 110705486 B CN110705486 B CN 110705486B CN 201910950453 A CN201910950453 A CN 201910950453A CN 110705486 B CN110705486 B CN 110705486B
Authority
CN
China
Prior art keywords
express
image
bill
segment
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910950453.3A
Other languages
English (en)
Other versions
CN110705486A (zh
Inventor
郭强
季磊
卞玉可
孙维越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Rengong Intelligent Technology Co.,Ltd.
Original Assignee
Jinan Dongshuo Microelectronic Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jinan Dongshuo Microelectronic Co ltd filed Critical Jinan Dongshuo Microelectronic Co ltd
Priority to CN201910950453.3A priority Critical patent/CN110705486B/zh
Publication of CN110705486A publication Critical patent/CN110705486A/zh
Application granted granted Critical
Publication of CN110705486B publication Critical patent/CN110705486B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/49Segmenting video sequences, i.e. computational techniques such as parsing or cutting the sequence, low-level clustering or determining units such as shots or scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/242Aligning, centring, orientation detection or correction of the image by image rotation, e.g. by 90 degrees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明的基于视频图像识别快递面单上倾斜数字的方法,包括:a).采集含有快递面单的视频图像;b)采用人工的方式对段码进行标注;c).对标注的快递面单图像样本进行训练,获取n段码的数字识别模型;d).用n个相同大小的矩形框框选出n段数字,计算出n个矩形框的中心点坐标;e).求取倾斜快递面单上倾斜数字的斜率;f).计算面单倾斜角度;g).旋转倾斜面单图像,使倾斜的面单图像变正;h).识别n段码。本发明的面单识别方法,无论快递在自动分拣系统上怎样放置,只要面单朝上,即可将面单段码准确无误地识别出来,保证了快递的自动分拣,无需人工分拣,提高了分拣效率,有益效果显著,适于应用。

Description

一种基于视频图像识别快递面单上倾斜数字的方法
技术领域
本发明涉及一种基于视频图像识别快递面单上倾斜数字的方法,更具体的说,尤其涉及一种通过求取倾斜码段的斜率将面单图像旋转变正的基于视频图像识别快递面单上倾斜数字的方法。
背景技术
随着物流业的高速发展,物流分拣技术在各快递和物流分拣中心的作用越来越重要。目前对包裹的逐次分拣过程还主要停留在人工分配状态,需要安排大量的工作人员进行识别、分拣货物。因此研究一种高效率与准确率的物流分拣方法十分必要。我公司2018年7月5日申请的专利“一种基于视频图像的快递面单三段码识别方法”,申请号:201810732728.1,提出了一种识别快递面单三段码的方法,在利用该快递面单识别方法对快递包裹分拣的过程中,发现在快递面单摆放倾斜时,无法有效识别三段码,导致准确率降低,无法分拣识别的快递包裹需要人工再次分拣,导致包裹分拣效率的降低和人工成本的增加。本文针对倾斜快递面单三段码(或多段码,本文以三段码为例)的识别进行研究。
发明内容
本发明为了克服上述技术问题的缺点,提供了一种通过求取倾斜码段的斜率将面单图像旋转变正的基于视频图像识别快递面单上倾斜数字的方法。
本发明的基于视频图像识别快递面单上倾斜数字的方法,其特征在于,通过以下步骤来实现:
a).图像采集,通过图像采集装置采集含有快递面单的视频图像,并对视频图像进行分帧,选取含有快递面单的单帧图像,并对图像进行二值化处理;
b)人工标注,设快递面单上的数字为n段码,每段码包含一组数字,采用人工的方式对快递面单图像上的n段码进行标注;
c).训练网络模型,对标注的快递面单图像样本进行训练,获取快递面单图像上n段码的数字识别模型;
d).倾斜数字框选,对步骤c)中出现的无法识别的倾斜面单数字进行进一步处理与识别,用n个相同大小的矩形框框选出n段数字,计算出n个矩形框的中心点坐标,设n个矩形框的中心点坐标分别为(x1,y1)、(x2,y2)、…、(xn,yn);
e).求倾斜面单斜率,利用公式(1)求取倾斜快递面单上倾斜数字的斜率k:
Figure BDA0002225490650000021
其中,(xi,yi)表示第i个矩形的中心点坐标,i=1,2,…,n;
f).计算面单倾斜角度,利用公式(2)计算快递面单图像的倾斜角度θ:
θ=arctan(k) (2)
g).校正图像,将所获取的倾斜面单图像旋转-θ角度,使倾斜的面单图像变正;
h).识别n段码,倾斜图像经步骤g)的旋转变正后,利用步骤c)训练好的快递面单数字模型识别n段码数字,并根据n段码数字所表征的目的地对快递进行自动分拣。
本发明的基于视频图像识别快递面单上倾斜数字的方法,步骤b)中,人工标注的内容为:标注出n段码中每位数字的位置及类别,数字的位置为数字外围的矩形框,类别为0、1、2、…、9的阿拉伯数字,数字位置及类别组成图像的标签文件。
本发明的基于视频图像识别快递面单上倾斜数字的方法,所述快递面单为三段码,三段码倾斜面单上倾斜数字的斜率k3通过步骤(3)求取:
Figure BDA0002225490650000031
其中,(xi,yi)表示第i个矩形的中心点坐标,i=1,2,3。
本发明的有益效果是:本发明的快递面单上倾斜数字的倾斜方法,首先采集快递面单的视频图像并分帧,选取含有快递面单的图像作为处理对象;然后对图像上的数码段进行标注,利用标注的面单图像作为训练样本,训练出快递面单图像上码段的识别模型;对于无法识别的倾斜快递面单,首先用n个相同大小的矩形框将每段数字框出,并求取矩形框的中心,然后利用所有矩形框的中心坐标计算出倾斜码段的斜率,然后将快递面单旋转斜率对应的角度,获取转换变正后的图像,然后对快递面单上的码段进行识别,解决了现有快递面单识别方法无法识别倾斜码段的技术问题,本发明的面单识别方法,无论快递在自动分拣系统上怎样放置,只要面单朝上,即可将面单段码准确无误地识别出来,保证了快递的自动分拣,无需人工分拣,提高了分拣效率,有益效果显著,适于应用。
附图说明
图1为本发明中三段码快递面单的图像示意图;
图2为本发明中倾斜摆放的三段码快递面单的图像示意图;
图3为本发明中矫正后三段码快递面单的示意图。
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
本发明的基于视频图像识别快递面单上倾斜数字的方法,其特征在于,通过以下步骤来实现:
a).图像采集,通过图像采集装置采集含有快递面单的视频图像,并对视频图像进行分帧,选取含有快递面单的单帧图像,并对图像进行二值化处理;
b)人工标注,设快递面单上的数字为n段码,每段码包含一组数字,采用人工的方式对快递面单图像上的n段码进行标注;
对于数字为3段码的快递面单来说,其包含3组数字,如图1所示,给出了本发明中三段码快递面单的图像示意图,第1段码数字为500,第2段码数字为020,第3段码数字为405,其不同的码段代表不同的含义,如第1段码可代表省或市,第2段码代表区或县,第3段码可代表具体的快递站点,这样,对3段码成功识别后,可实现快递物品的快速分拣。
该步骤中,人工标注的内容为:标注出n段码中每位数字的位置及类别,数字的位置为数字外围的矩形框,类别为0、1、2、…、9的阿拉伯数字,数字位置及类别组成图像的标签文件。
c).训练网络模型,对标注的快递面单图像样本进行训练,获取快递面单图像上n段码的数字识别模型;
d).倾斜数字框选,对步骤c)中出现的无法识别的倾斜面单数字进行进一步处理与识别,用n个相同大小的矩形框框选出n段数字,计算出n个矩形框的中心点坐标,设n个矩形框的中心点坐标分别为(x1,y1)、(x2,y2)、…、(xn,yn);
如图2所示,给出了本发明中倾斜摆放的三段码快递面单的图像示意图,所示的123为第一段码,456为第二段码,789为第三段码,其分别利用大小相同的矩形框框出,(x1,y1)、(x2,y2)、(x3,y3)分别为从左至右三个矩形框的中心点坐标。
e).求倾斜面单斜率,利用公式(1)求取倾斜快递面单上倾斜数字的斜率k:
Figure BDA0002225490650000041
其中,(xi,yi)表示第i个矩形的中心点坐标,i=1,2,…,n;
对于数字为3段码的快递面单来说,三段码倾斜面单上倾斜数字的斜率k3通过步骤(3)求取:
Figure BDA0002225490650000042
其中,(xi,yi)表示第i个矩形的中心点坐标,i=1,2,3。
f).计算面单倾斜角度,利用公式(2)计算快递面单图像的倾斜角度θ:
θ=arctan(k) (2)
g).校正图像,将所获取的倾斜面单图像旋转-θ角度,使倾斜的面单图像变正;
如图3所示,给出了本发明中矫正后三段码快递面单的示意图,图2中的快递面单向反方向旋转相应的倾斜角度后,即可获得正向摆放的快递面单图像,此时码段变正,有利于对面单码段进行识别。
h).识别n段码,倾斜图像经步骤g)的旋转变正后,利用步骤c)训练好的快递面单数字模型识别n段码数字,并根据n段码数字所表征的目的地对快递进行自动分拣。
本发明的基于视频图像识别快递面单上倾斜数字的方法,首先利用标注的面单图像作为训练样本集,训练出快递面单图像上n段码的数字识别模型;对于倾斜放置的面单,首先计算出面单上数字码段的倾斜角度,然后将面单图像旋转变正,保证了面单数字码段的准确、快速识别,解决了现有倾斜面单上的数字码段不易被识别的技术问题。

Claims (3)

1.一种基于视频图像识别快递面单上倾斜数字的方法,其特征在于,通过以下步骤来实现:
a).图像采集,通过图像采集装置采集含有快递面单的视频图像,并对视频图像进行分帧,选取含有快递面单的单帧图像,并对图像进行二值化处理;
b).人工标注,设快递面单上的数字为n段码,每段码包含一组数字,采用人工的方式对快递面单图像上的n段码进行标注;
c).训练网络模型,对标注的快递面单图像样本进行训练,获取快递面单图像上n段码的数字识别模型;
d).倾斜数字框选,对步骤c)中出现的无法识别的倾斜面单数字进行进一步处理与识别,用n个相同大小的矩形框框选出n段数字,计算出n个矩形框的中心点坐标,设n个矩形框的中心点坐标分别为(x1,y1)、(x2,y2)、…、(xn,yn);
e).求倾斜面单斜率,利用公式(1)求取倾斜快递面单上倾斜数字的斜率k:
Figure FDA0002980453970000011
其中,(xi,yi)表示第i个矩形的中心点坐标,i=1,2,…,n;
f).计算面单倾斜角度,利用公式(2)计算快递面单图像的倾斜角度θ:
θ=arctan(k) (2)
g).校正图像,将所获取的倾斜面单图像旋转-θ角度,使倾斜的面单图像变正;
h).识别n段码,倾斜图像经步骤g)的旋转变正后,利用步骤c)训练好的快递面单数字模型识别n段码数字,并根据n段码数字所表征的目的地对快递进行自动分拣。
2.根据权利要求1所述的基于视频图像识别快递面单上倾斜数字的方法,其特征在于:步骤b)中,人工标注的内容为:标注出n段码中每位数字的位置及类别,数字的位置为数字外围的矩形框,类别为0、1、2、…、9的阿拉伯数字,数字位置及类别组成图像的标签文件。
3.根据权利要求1或2所述的基于视频图像识别快递面单上倾斜数字的方法,其特征在于:所述快递面单为三段码,三段码倾斜面单上倾斜数字的斜率k3通过公式(3)求取:
Figure FDA0002980453970000021
其中,(xi,yi)表示第i个矩形的中心点坐标,i=1,2,3。
CN201910950453.3A 2019-10-08 2019-10-08 一种基于视频图像识别快递面单上倾斜数字的方法 Active CN110705486B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910950453.3A CN110705486B (zh) 2019-10-08 2019-10-08 一种基于视频图像识别快递面单上倾斜数字的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910950453.3A CN110705486B (zh) 2019-10-08 2019-10-08 一种基于视频图像识别快递面单上倾斜数字的方法

Publications (2)

Publication Number Publication Date
CN110705486A CN110705486A (zh) 2020-01-17
CN110705486B true CN110705486B (zh) 2021-06-25

Family

ID=69198008

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910950453.3A Active CN110705486B (zh) 2019-10-08 2019-10-08 一种基于视频图像识别快递面单上倾斜数字的方法

Country Status (1)

Country Link
CN (1) CN110705486B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112308915A (zh) * 2020-03-30 2021-02-02 北京沃东天骏信息技术有限公司 用于定位快递包裹的方法和装置
CN111767921A (zh) * 2020-06-30 2020-10-13 上海媒智科技有限公司 一种快递面单定位矫正方法及设备
CN112288372B (zh) * 2020-11-06 2023-09-26 辽宁黑北健科技有限公司 一种可同时识别一维条码和三段码字符的快递单识别方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7489245B2 (en) * 2003-04-09 2009-02-10 Visible Assets, Inc Networked RF tag for tracking baggage
CN103685664A (zh) * 2013-12-10 2014-03-26 杭州电子科技大学 一种快速发送快件派送通知的装置
CN104657728B (zh) * 2015-03-19 2018-01-09 江苏物联网研究发展中心 基于计算机视觉的条码识别系统
CN106355174B (zh) * 2016-09-23 2023-06-20 华南理工大学 一种快递单关键信息动态提取方法及系统
CN107341523A (zh) * 2017-07-13 2017-11-10 浙江捷尚视觉科技股份有限公司 基于深度学习的快递单信息识别方法和系统
CN108491843B (zh) * 2018-04-12 2022-11-18 腾讯科技(深圳)有限公司 一种图像处理方法、装置及存储介质

Also Published As

Publication number Publication date
CN110705486A (zh) 2020-01-17

Similar Documents

Publication Publication Date Title
CN110705486B (zh) 一种基于视频图像识别快递面单上倾斜数字的方法
US5607187A (en) Method of identifying a plurality of labels having data fields within a machine readable border
US7436979B2 (en) Method and system for image processing
CA2231450C (en) System and method for reading package information
CN110070090B (zh) 一种基于手写文字识别的物流标签信息检测方法及系统
CN101795783B (zh) 利用与数字印记关联的客户代码处理邮政寄送件的方法
CN104036235A (zh) 基于叶片hog特征和智能终端平台的植物物种识别方法
AU660506B2 (en) Identification system
CN111476210B (zh) 基于图像的文本识别方法、系统、设备及存储介质
CN111177308B (zh) 一种文本内容的识别情绪方法
CN1115064A (zh) 图象处理的改进
US9421579B2 (en) Method of merging a postal article into sorted mail, the method including assistance via visual designation of the location at which the postal article is to be inserted
GB2566365A (en) Optically readable markers
CN111178464A (zh) 一种基于神经网络的ocr识别在物流行业快递面单的应用
CN115783452A (zh) 基于物流商品的物流单号智能印刷出单粘贴综合化控制平台
TWI823463B (zh) 標籤完整度自適應檢測方法及系統
US8295540B2 (en) Method and a machine for processing mail runs using matrix accumulators
CN113822196B (zh) 一种方便复制传播的omr运输面单制作及识别方法
CN117237971B (zh) 基于多模态信息抽取的食品类质检报告数据抽取方法
CN110956174A (zh) 一种器件编号的识别方法
CN113869131B (zh) 一种结构文本化营业执照图片的方法
JPH0768222A (ja) 小包を処理するためのシステムおよび方法
CN115090559B (zh) 一种基于图像处理的玻璃瓶回收除杂方法及系统
JP2004148238A (ja) 郵便物仕分け装置、及び郵便物仕分け方法
CN113361446B (zh) 一种x射线包裹图像提取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20210902

Address after: Room 211, incubation garden, college student entrepreneurship Park, Shandong University of Finance and economics, No. 98, jiangshuiquan West Road, Lixia District, Jinan City, Shandong Province, 250014

Patentee after: Shandong Rengong Intelligent Technology Co.,Ltd.

Address before: 250101 room 2108, building 3, Aosheng building, 1166 Xinluo street, high tech Zone, Jinan City, Shandong Province

Patentee before: JINAN DONGSHUO MICROELECTRONIC Co.,Ltd.