CN103530758A - 基于智能终端、ocr技术的集装箱信息自动采集系统 - Google Patents

基于智能终端、ocr技术的集装箱信息自动采集系统 Download PDF

Info

Publication number
CN103530758A
CN103530758A CN201310528265.4A CN201310528265A CN103530758A CN 103530758 A CN103530758 A CN 103530758A CN 201310528265 A CN201310528265 A CN 201310528265A CN 103530758 A CN103530758 A CN 103530758A
Authority
CN
China
Prior art keywords
container
intelligent terminal
ocr
information
container number
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310528265.4A
Other languages
English (en)
Inventor
郑恒强
邓樱芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201310528265.4A priority Critical patent/CN103530758A/zh
Publication of CN103530758A publication Critical patent/CN103530758A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

本发明涉及一项基于智能终端、OCR技术的集装箱箱号采集系统。该系统利用移动智能终端的移动性、可编程性,结合目前已经成熟的OCR技术,打造出一个自动采集集装箱信息的系统,为集装箱物流的智能化、自动化提供简便、高效的集装箱信息自动采集系统。本发明具有自动采集集装箱信息,差错率低、可靠性高、开发难度小,实现效率高的特点。能够广泛应用于交通物流、海关监管等方面,同时还可以结合集装箱物流信息的电子化,进行电子数据的自动发送,为打造智能物流提供基础的数据源。

Description

基于智能终端、OCR技术的集装箱信息自动采集系统
本发明涉及一项基于智能终端、OCR技术的集装箱箱号采集系统。该系统利用移动智能终端的移动性、可编程性,结合目前已经成熟的OCR技术,打造出一个自动采集集装箱信息的系统,为集装箱物流的智能化、自动化提供简便、高效的集装箱信息自动采集系统。
背景技术
集装箱信息主要包括集装箱箱号、集装箱箱型代码、集装箱铅封号三个方面的内容。
集装箱箱号是集装箱运输过程当中最为主要的识别依据,采用ISO6346(1995)标准的集装箱,其箱号是由11位编码组成(见附图1),包括三个部分:
1、 第一部分由4位英文字母组成。
2、 第二部分由6位数字组成。
3、 第三部分为校验码,是由前4位字母和6位数字经过校验规则运算得到,用于识别在校验时是否发生错误,即第11位数字。具体的检验规则如下:集装箱编号共11位,前四位是字母,最后一位为校验码。举例如◎◎◎◎×××××××。字母取数值规则为:A=10,B至K依次取12至21,L至U依次取23至32,V至Z依次取34至38。箱号第一位的值乘以2的0次幂,第二位乘以2的1次幂,...以此类推,第十位乘以2的9次幂,然后求和。其和除以11的余数即为校验码的值,当余数为10时,校验码也为0。
集装箱的箱型代码是按照ISO 6364.2中第6章“标记的标志方法”,箱型和尺寸代码应作为一个整体在集装箱上标识。其组配代码结构为:四位字母或者数字,两位为箱型代码另外两位为尺寸代码(见附图1)。例如:20BK代表20英尺的散装货箱,40TK代表40英尺罐式箱。 
集装箱铅封是货物装入集装箱并正确地关闭箱门后,由特定人员施加的类似于锁扣的设备。铅封根据施加人员不同可分为海关封识、商检封识和商业封识。铅封一经正确锁上,除非暴力破坏(即剪开)否则无法打开,同时破坏后的铅封无法重新使用。每个铅封上都有唯一的编号标识,叫做铅封号。铅封号是由一串的字母以及数字组成(见附图2)。
集装箱箱号、集装箱箱型代码、集装箱铅封号这些集装箱信息都是集装箱运输过程当中非常重要的内容,当前国家正在积极推行贸易信息的无纸化,也就是利用电子数据进行贸易数据的传输,以及作为海关通关的重要依据,集装箱箱号、集装箱封签号都是构成海关通关电子数据的主要内容,是海关进行监管中所必须申报的,如果发生集装箱箱号录入错误或者封签号录入错误,势必影响贸易的正常进行。
与此同时,集装箱箱号、集装箱铅封号作为海运提单的一部分,是收发货人权利责任划分的重要依据,如果集装箱箱号、铅封号与实物不一致,势必影响收货人的提货以及发货人货款的兑付。
还有,集装箱箱号、箱型代码的准确与否,还关系集装箱所有人对于自身集装箱的调配、管理、调剂的效率。因为箱型代码能够反映出集装箱的装货容积、装货类型,装货重量等方面的内容。集装箱所有人通过对于集装箱箱号、箱型的管理能够有效调剂运力,分配集装箱仓位,实现经济效益的最大化。
由此可见,集装箱信息准确与否不仅关系到收/发货人的贸易的正常履行,而且还关系到货物能否正常顺利通关以及关系到集装箱所有人的自身管理效率。
在实际的使用过程中,集装箱信息的输入主要是通过键盘手工进行录入,虽然集装箱箱号是带有检验规则,但是在实际的使用中人工录入的差错率还是比较高的,在集装箱箱型代码和铅封号码由于没有校验规则,人工录入的差错率就更高了。
OCR(Optical Character Recognition,光学字符识别),是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。目前OCR技术已经很成熟,除了英文字母以及数字之外还能够识别出中文的印刷体,甚至中文手写体的也能到准确的识别。目前已经有多家公司推出了基于各种操作系统的OCR开发包(OCR SDK),便于用户进行高效的二次开发应用,目前网络上比较成熟的OCR SDK的供应商有:文通OCR SDK,ABBYY OCR SDK,云脉 OCR SDK等多款成熟的开发包。
利用OCR进行字符采集的优势:处理字符数度快,准确性高。尤其是对于识别技术非常成熟的英文字符和阿拉伯数字的识别率可以达到99%以上。印刷在集装箱上的集装箱箱号、集装箱箱型代码、集装箱铅封号等集装箱信息都是按照ISO规定,由英文字符、阿拉伯数字的标准字体构成的。
智能终端是指具有独立的操作系统,能够安装各种应用程序,通常具有图像以及动态影像的拍摄功能,具备无线接入互联网的功能,具备终端时间获取功能,具备终端识别功能,能够进行智能终端的终端地理定位(可以利用卫星定位、WIFI无线网络定位、移动基站定位)。目前的智能手机都属于智能终端,主要的智能手机操作系统有苹果手机的IOS操作系统,安卓手机的Android操作系统,微软的Windows Phone操作系统,黑莓手机的BlackBerry系统,诺基亚的Symbian系统和Asha系统。目前智能终端的数量和普及率都已经大大提高,据统计,2012年全球的智能手机出货量超过7亿部。另外根据市场研究公司尼尔森发布的《2013移动消费者报告》显示,中国智能手机的普及率达66%。据IT调查咨询机构IDC于2013年9月23日发布的消息称,2014年中国智能手机的出货量将达4.5亿部。除此之外,智能终端还包括目前的平板电脑、iPad、谷歌眼镜、智能手表,这些可移动的智能终端的出货量也在快速增长当中。由此可见,智能终端正处在高速普及当中,个人拥有智能终端的数量也在不断攀升当中。
智能终端具有移动性、便于携带型、能够安装应用程序,普遍具备图像/影像拍摄功能。
中国专利公布了CN200910170227.X的“一种集装箱箱号识别方法”,该专利的不足之处在于:
1:该项专利实用性不强。根据该项专利的说明书第七页所述,“将包含集装箱箱号的图片,经过图像处理技术切割出有用的箱号,并对切割出箱号再次进行图像的标准化”,这一表述首先就有问题,用何种标准切割出箱号的图片,计算机如何判断出源图片哪一部分包含着集装箱箱号,用哪种技术手段能够切割出“有用的”的箱号,是靠人工干预来操作还是电脑自动判断来切割?这个在说明书中都没有提到,众所周知,在集装箱表面,除了印刷有集装箱号,在集装箱箱门上印刷内容还包含箱号、箱型代码、最大承载重量、皮重、容积等等信息(集装箱图片见附图1)。如果靠电脑自动判断集装箱箱号的图片,不仅计算复杂,而且容易出错。如果靠人工来裁剪出箱号的图片,则又失去箱号识别的意义,因为人工来裁剪出箱号的图片,不仅仅需要人工来操作,还需要借助电脑等辅助设备来进行,工作量比直接靠人工来录入11位箱号更为繁琐、更容易出错,失去了实际应用上的意义。包含箱号的图片“切割”不出来,那该项专利所有后续的内容都失去了意义。
2:算法复杂,实现难度较大,实际使用效果尚待检验。该项专利,利用神经网络技术和欧氏距离法对图片中进行识别。在实际应用中需要按照这一专利来实现集装箱箱号的识别,对于技术人员来说,实现的过程较为复杂,实现时间较长。同时按照该项专利技术在实际的应用方面的实现效果如何、识别的速度高低、准确性与否还有待检验。
 发明内容
本发明是建立在智能终端上,利用智能终端的移动性、可编程性以及图像/影像的拍摄功能,借助技术成熟的OCR技术,建立起一个便捷、高效、准确性高的集装箱信息自动采集系统。
该系统的实施步骤如下:
1:该系统调用智能终端上的摄像头的拍摄功能,在智能终端的取景观察屏幕上构建一个固定的区域(该固定区域的功能是框选出集装箱箱号的区域),通过调整智能终端的镜头、焦距、位置等方法,在集装箱的箱号都能够被框选在该固定区域中之后,进行拍摄获取图像资料。
2:针对固定区域内的图像资料,利用OCR SDK开发包中应用进行OCR识别,获取集装箱箱号的字符和数字信息。
3:针对OCR识别获取的字符和数字信息,进行集装箱箱号的排序校验,集装箱型号规则为前面四位为大写的英文字母,后面7位为阿拉伯数字。
4:针对OCR识别获取的字符和数字信息,根据ISO组织对于标准集装箱的要求,集装箱箱号的最后一位为校验位,该位数值须用方框框出(见附图1)。利用这一特性,对于集装箱箱号的顺序进行再次校验。
5:将上述校验通过的字符和数字信息排序后,利用集装箱箱号的校验规则,再次进行检验,如果通过,则将经过处理的集装箱箱号信息输出,完成对于集装箱箱号的自动采集。如果校验不通过,可以用手工录入来进行补录,作为自动采集箱号的应急补充。
6:根据系统需要,按照步骤1的方法,针对集装箱箱型代码进行自动采集。通过OCR识别获取的集装箱箱型代码可以与ISO 6364.2中的箱型代码表进行核对校验,如果符合就可以将经过处理的箱型代码输出,完成对于集装箱箱号的自动采集。如果校验不通过,也可以采用手工录入的方式进行补录,作为自动采集箱型代码的应急补充。
7:根据系统需要,按照步骤1的方法,针对集装箱铅封号进行自动采集,可以在智能终端的取景屏幕上构建一个固定区域,因为铅封较小,便于翻转,可以将铅封号按照固定顺序进行放置在固定区域中,进行OCR识别,将获得的铅封号信息输出完成对于集装箱铅封号码的自动采集。
附图说明
附图1是集装箱箱号和集装箱箱型代码的实例。
附图2是集装箱铅封号的具体实例。
附图3是本发明中关于集装箱箱号自动采集地实施流程。
具体实施例
下面结合附图针对本发明进行进一步说明。
附图3是本发明中关于集装箱箱号自动采集的实施流程。进行集装箱箱号的自动采集,首先需要调用智能终端的摄像头功能,同时在智能终端的取景器(一般就是智能终端的显示屏幕)上构建一个固定区域。
调整智能终端的焦距、镜头、距离等方式,使得需采集箱号的集装箱箱号能够在该固定区域中显示,在箱号能够全部容纳入该固定区域中后,对于固定区域内的集装箱箱号进行拍摄。
拍摄之后,利用OCR技术对于拍摄的图片进行分析识别,获取其中的英文字符和阿拉伯数字。
根据集装箱箱号的规则进行首次排序:前面四位是英文字母,后面七位是阿拉伯数字的特点,对于识别出的英文字符、阿拉伯数字进行排序。
根据ISO标准,集装箱箱号最后一位是校验位,该校验位都要用方框框住(见附图1),利用这一特性,对于识别出的英文字符、阿拉伯数字的排序进行再次确认。
利用集装箱箱号的校验规则,对于识别出来的集装箱箱号的英文字符、阿拉伯数字进行校验。如果校验通过,则说明集装箱箱号自动采集顺利完成。如果校验不通过说明OCR识别或者排序上存在问题,可以用手工补录的方式进行集装箱箱号的采集。
 集装箱箱型代码、集装箱铅封号的自动采集也按照上述在取景器上构建一个固定区域,通过调整智能终端或者调整集装箱铅封位置的方法,使得被采集字符、数字被固定区域容纳后进行OCR识别,从而自动获取集装箱代码和铅封号的信息。
本发明的有益之处在于:
1:全部自动采集,差错率低。目前的OCR技术已经非常成熟,已经能够针对中文甚至中文手写体进行高准确度的识别,而集装箱信息(包含集装箱箱号、集装箱箱型代码、集装箱铅封号)的内容都是由简单的英文字母、阿拉伯数字印刷体构成,而且根据ISO要求,这些信息都必须完整规范准确,因此采用OCR技术进行识别在技术层面上是非常简单。同时,在进行集装箱箱号、集装箱箱型代码、集装箱铅封号采集时,使用了固定区域的采集方式,将大量容易干扰的数据筛除,不仅减少了OCR识别的计算量,提高了运算速度,而且大大提高了OCR识别的准确度。
2:可靠性高。集装箱箱号构成是有一定的规则,利用这些规则在前面基础上进行校验,大大减少了识别错误的产生几率,提高了可靠性。同时还结合了手工补录的方法,能够确保集装箱信息采集的顺利完成。
3:开发难度小,实现效率高。本发明是利用了智能终端的内部的摄像头、结合了目前通用的OCR SDK的开发包,能够高效地进行开发,应用于集装箱信息的自动采集。同时智能终端具有移动性,非常适合集装箱运输的流动性。能够实现全方位的数据采集。
4:可以配合目前物流信息的电子化趋势,为打造智能物流提供基础的数据源。

Claims (9)

1.本发明涉及一项基于智能终端、OCR技术的集装箱箱号采集系统,该系统调用智能终端的摄像头,结合成熟的OCR识别技术,建立起一个便捷、高效、准确性高的集装箱信息自动采集系统。
2.基于权利要求1所述,在智能终端的取景观察屏幕上构建一个固定的区域,通过调整智能终端的镜头、焦距、位置等方法,使得需采集的集装箱信息能够被框选在该固定区域中之后,进行拍摄获取图像资料。
3.基于权利要求1所述,针对获取的图像资料,利用OCR技术进行OCR识别,获取集装箱信息中的字符和数字信息。
4.基于权利要求1所述,根据集装箱箱号的规则进行首次排序:前面四位是英文字母,后面七位是阿拉伯数字的特点,对于识别出的英文字符、阿拉伯数字进行排序。
5.基于权利要求1所述,根据ISO标准,集装箱箱号最后一位是校验位,该校验位都要用方框框住(见附图1),利用这一特性,对于识别出的英文字符、阿拉伯数字的排序进行再次确认。
6.基于权利要求1所述,利用集装箱箱号的校验规则,对于识别出来的集装箱箱号的英文字符、阿拉伯数字进行校验。
7.如果校验通过,则说明集装箱箱号自动采集顺利完成,如果校验不通过说明OCR识别或者排序上存在问题,可以用手工补录的方式进行集装箱箱号的采集。
8.基于权利要求1所述,针对铅封号的自动采集,可以将铅封号按照固定顺序进行放置在固定区域中,进行OCR识别,将获得的铅封号信息输出完成对于集装箱铅封号码的自动采集。
9.基于权利要求1所述,集装箱箱型代码、集装箱铅封号的自动采集也按照上述在取景器上构建一个固定区域,通过调整智能终端或者调整集装箱铅封位置的方法,使得被采集字符、数字被固定区域容纳后进行OCR识别,从而自动获取集装箱箱型代码和铅封号的信息。
CN201310528265.4A 2013-10-31 2013-10-31 基于智能终端、ocr技术的集装箱信息自动采集系统 Pending CN103530758A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310528265.4A CN103530758A (zh) 2013-10-31 2013-10-31 基于智能终端、ocr技术的集装箱信息自动采集系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310528265.4A CN103530758A (zh) 2013-10-31 2013-10-31 基于智能终端、ocr技术的集装箱信息自动采集系统

Publications (1)

Publication Number Publication Date
CN103530758A true CN103530758A (zh) 2014-01-22

Family

ID=49932748

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310528265.4A Pending CN103530758A (zh) 2013-10-31 2013-10-31 基于智能终端、ocr技术的集装箱信息自动采集系统

Country Status (1)

Country Link
CN (1) CN103530758A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103996102A (zh) * 2014-06-04 2014-08-20 广州市华纬计算机科技有限公司 一种集装箱箱体查验方法
CN107423732A (zh) * 2017-07-26 2017-12-01 大连交通大学 基于Android平台的车辆VIN识别方法
CN110503046A (zh) * 2019-08-26 2019-11-26 华北电力大学(保定) 一种基于图像识别技术的铅封识别法
CN111753734A (zh) * 2020-06-24 2020-10-09 深圳中集智能科技有限公司 集装箱箱号识别系统、识别方法和电子设备
CN113065410A (zh) * 2021-03-10 2021-07-02 广州云从鼎望科技有限公司 集装箱掏箱流程智能化控制方法、系统、介质及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101650780A (zh) * 2009-09-08 2010-02-17 宁波中科集成电路设计中心有限公司 一种集装箱箱号识别方法
EP2196953A1 (de) * 2008-12-12 2010-06-16 Siemens Aktiengesellschaft Verfahren, Steuerungsprogramm und System zur Identifikation eines Containers in einer Containerkrananlage
CN101799673A (zh) * 2009-09-23 2010-08-11 乔峰 一种冷藏集装箱数据远程监控的装置和方法
CN101894277A (zh) * 2010-06-13 2010-11-24 电子科技大学 基于多分类支持向量机的集装箱箱号识别方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2196953A1 (de) * 2008-12-12 2010-06-16 Siemens Aktiengesellschaft Verfahren, Steuerungsprogramm und System zur Identifikation eines Containers in einer Containerkrananlage
CN101751560A (zh) * 2008-12-12 2010-06-23 西门子公司 识别集装箱吊装设备中的集装箱的方法、控制程序和系统
CN101650780A (zh) * 2009-09-08 2010-02-17 宁波中科集成电路设计中心有限公司 一种集装箱箱号识别方法
CN101799673A (zh) * 2009-09-23 2010-08-11 乔峰 一种冷藏集装箱数据远程监控的装置和方法
CN101894277A (zh) * 2010-06-13 2010-11-24 电子科技大学 基于多分类支持向量机的集装箱箱号识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
丁嵩冰: "集装箱箱号校验规则及其应用", 《集装箱化》, no. 02, 28 February 2006 (2006-02-28) *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103996102A (zh) * 2014-06-04 2014-08-20 广州市华纬计算机科技有限公司 一种集装箱箱体查验方法
CN103996102B (zh) * 2014-06-04 2017-12-12 广州市华纬计算机科技有限公司 一种集装箱箱体查验方法
CN107423732A (zh) * 2017-07-26 2017-12-01 大连交通大学 基于Android平台的车辆VIN识别方法
CN110503046A (zh) * 2019-08-26 2019-11-26 华北电力大学(保定) 一种基于图像识别技术的铅封识别法
CN111753734A (zh) * 2020-06-24 2020-10-09 深圳中集智能科技有限公司 集装箱箱号识别系统、识别方法和电子设备
CN113065410A (zh) * 2021-03-10 2021-07-02 广州云从鼎望科技有限公司 集装箱掏箱流程智能化控制方法、系统、介质及装置
CN113065410B (zh) * 2021-03-10 2024-06-04 广州云从鼎望科技有限公司 集装箱掏箱流程智能化控制方法、系统、介质及装置

Similar Documents

Publication Publication Date Title
US10572754B2 (en) Area of interest boundary extracting method and apparatus, device and computer storage medium
US10140511B2 (en) Building classification and extraction models based on electronic forms
US20190311227A1 (en) Generating searchable text for documents portrayed in a repository of digital images utilizing orientation and text prediction neural networks
US20200089985A1 (en) Character image processing method and apparatus, device, and storage medium
RU2571545C1 (ru) Классификация изображений документов на основании контента
CN107330471B (zh) 反馈内容的问题定位方法和装置、计算机设备、存储介质
CN103530758A (zh) 基于智能终端、ocr技术的集装箱信息自动采集系统
CN110175609B (zh) 界面元素检测方法、装置及设备
CN113313111A (zh) 文本识别方法、装置、设备和介质
US8792730B2 (en) Classification and standardization of field images associated with a field in a form
CN111461105B (zh) 一种文本识别方法和装置
CN109597902A (zh) 图片审核方法、装置、设备及存储介质
CN111695518A (zh) 结构化文档信息标注的方法、装置及电子设备
US20220236706A1 (en) Power grid user classification method and device and computer-readable storage medium
CN115100670A (zh) 保单信息处理方法及其系统、电子设备、存储介质
US9047533B2 (en) Parsing tables by probabilistic modeling of perceptual cues
CN110363206B (zh) 数据对象的聚类、数据处理及数据识别方法
CN111062262A (zh) 发票识别方法以及发票识别装置
CN109388935A (zh) 单证验证方法及装置、电子设备及可读存储介质
CN115620325A (zh) 表格结构的还原方法、装置、电子设备及存储介质
CN113011249A (zh) 票据审核方法、装置、设备及存储介质
CN112396060A (zh) 基于身份证分割模型的身份证识别方法及其相关设备
US20150169973A1 (en) Incomplete patterns
CN115937578A (zh) 食品安全预警方法、装置、计算机设备及存储介质
CN113743327A (zh) 单据识别方法、单据核对方法、装置和设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140122