CN110991446A - 标签识别方法、装置、设备及计算机可读存储介质 - Google Patents

标签识别方法、装置、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN110991446A
CN110991446A CN201911153223.0A CN201911153223A CN110991446A CN 110991446 A CN110991446 A CN 110991446A CN 201911153223 A CN201911153223 A CN 201911153223A CN 110991446 A CN110991446 A CN 110991446A
Authority
CN
China
Prior art keywords
label
tag
image
information
identification method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911153223.0A
Other languages
English (en)
Other versions
CN110991446B (zh
Inventor
李伟志
王键
李勤英
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Ouyeel Logistics Co ltd
Original Assignee
Shanghai Ouyeel Logistics Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Ouyeel Logistics Co ltd filed Critical Shanghai Ouyeel Logistics Co ltd
Priority to CN201911153223.0A priority Critical patent/CN110991446B/zh
Publication of CN110991446A publication Critical patent/CN110991446A/zh
Application granted granted Critical
Publication of CN110991446B publication Critical patent/CN110991446B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/087Inventory or stock management, e.g. order filling, procurement or balancing against orders
    • G06Q10/0875Itemisation or classification of parts, supplies or services, e.g. bill of materials
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Economics (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Operations Research (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Finance (AREA)
  • Quality & Reliability (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Development Economics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Accounting & Taxation (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种标签识别方法、装置、设备及计算机可读存储介质,其中,标签识别方法包括如下步骤:步骤S1,获取原图;步骤S2,基于所述原图,提取标签图像;步骤S3,对所述标签图像中的文字进行文字识别,生成识别结果;步骤S4,根据所述识别结果,确定标签信息。根据本发明的标签识别方法,能够自动有效识别标签的内容,避免使用人力抄写标签,从而提升效率和标签识别的正确率。

Description

标签识别方法、装置、设备及计算机可读存储介质
技术领域
本发明涉及钢铁物流领域,具体涉及标签识别方法、装置、设备及计算机可读存储介质。
背景技术
钢铁物流管理环节众多,在装车、装船等运输管理环节中,以及仓库的出、入库等管理环节中都需要对货物的信息进行收集管理。提高这些环节的管理效率,节约管理成本,提升作业安全性,一直是钢铁物流单位所希望的。
传统的信息采集方式是通过现场管理人员根据钢铁标签抄写货物信息,再对这些信息进行整理、管理,此种方式不仅效率低下,而且错误率高,导致整体物流成本居高不下。
发明内容
有鉴于此,本发明提供标签识别方法、装置、设备及计算机可读存储介质,以解决使用人力抄写标签,效率低和错误率高的问题。
为解决上述技术问题,一方面,本发明提供一种标签识别方法,包括如下步骤:
步骤S1,获取原图;
步骤S2,基于所述原图,提取标签图像;
步骤S3,对所述标签图像中的文字进行文字识别,生成识别结果;
步骤S4,根据所述识别结果,确定标签信息。
进一步地,所述步骤S2包括对所述原图进行透视性矫正。
进一步地,所述透视性矫正包括:
步骤S21,对所述原图进行分割处理;
步骤S22,对分割后的图片进行联通区域筛选,确定标签区域;
步骤S23,对所述标签区域进行轮廓拟合,确定所述标签区域的四个角的坐标信息;
步骤S24,基于所述四个角的坐标信息,进行所述透视性矫正。
进一步地,所述步骤S24中,当所述四个角的坐标信息满足预定条件时,进行所述透视性矫正。
进一步地,所述步骤S2包括对于所述原图或经过透视性矫正后的图像进行旋转性矫正。
进一步地,所述旋转性矫正包括:
对于所述原图或经过透视性矫正后的图像,识别其旋转角度,并按照旋转角度进行分类;
统计其方差信息;
将方差最大方向作为小角度调整的依据,基于所述旋转角度对所述原图或经过透视性矫正后的图像进行旋转。
进一步地,所述步骤S3包括:
步骤S31,提取所述标签图像中的文本的位置信息;
步骤S32,基于所述位置信息,获取每一段文本的坐标信息;
步骤S33,基于所述坐标信息对于所述标签图像进行切割,得到切割图像;
步骤S34,识别所述切割图像中的文字信息,生成所述识别结果。
进一步地,所述步骤S31中,通过Pixel_Link检测算法,提取所述标签图像中的文本的位置信息。
进一步地,所述标签识别方法还包括:
步骤S5,建立目标标签用语数据库,所述目标标签用语数据库中存储有多种标签对应的标签用语;
所述步骤S4包括:
根据所述识别结果,在所述目标标签用语数据库中进行检索,当检索到的文字与所述识别结果的差值小于一定阈值时,以所述检索到的文字作为标签用语,并基于所述标签用语获取所述标签信息。
进一步地,所述步骤S4中,当检索到的文字与所述识别结果的差值大于所述阈值时,将所述识别结果作为所述标签用语并将所述识别结果加入到所述目标标签用语数据库中。
进一步地,所述标签识别方法还包括:
步骤S6,建立标准标签用语数据库,所述标准标签用语数据库中的用语与所述目标标签用语数据库中的用语相对应,
所述步骤S4中基于所述标签用语获取所述标签信息包括:
基于所述标签用语,从所述标准标签用语数据库中获取与其对应的标准标签用语,以所述标准标签用语作为所述标签信息。
进一步地,所述标准标签用语数据库通过如下方法建立:
采集标签样本,生成样本集;
从所述样本集中提取标签用语,得到标签用语集;
对所述标签用语集通过机器学习进行训练,得到标准标签用语;
基于所述标准标签用语,得到所述标准标签用语数据库。
进一步地,,所述标签识别方法还包括:
步骤S7,建立标签模板,所述标签模板是基于所述标准标签用语生成的具有多条分类信息的格式文件,
所述步骤S4还包括:
将所述标签信息与所述标签模板进行匹配,生成模板化标签文件。
进一步地,所述标签模板中包括生产日期、货物名称、货物种类、生产厂家中的一个或多个。
第二方面,本发明提供一种仓库的出入库管理方法,包括如下步骤:
根据上述任一项所述的标签识别方法获取出入库货物的标签信息;
基于所述标签信息对货物的出入库进行管理。
第三方面,本发明提供一种标签识别装置,包括:
获取模块,用于获取原图;
标签图像提取模块,用于基于所述原图提取标签图像;
识别模块,用于对所述标签图像中的文字进行文字识别以生成识别结果;
标签信息生成模块,用于根据所述识别结果确定标签信息。
第四方面,本发明提供一种用于识别标签信息的电子设备,包括:
一个或多个处理器;
一个或多个存储器,其中存储了计算机可读代码,所述计算机可读代码当由所述一个或多个处理器运行时,使得所述处理器执行如下步骤:
步骤S1,获取原图;
步骤S2,基于所述原图,获取标签图像;
步骤S3,对所述标签图像中的文字进行文字识别,生成识别结果;
步骤S4,根据所述识别结果,确定标签信息。
第五方面,本发明提供一种非暂时性计算机存储介质,其中存储了计算机可读代码,所述计算机可读代码当由一个或多个处理器运行时,使得所述处理器执行如下步骤:
步骤S1,获取原图;
步骤S2,基于所述原图,获取标签图像;
步骤S3,对所述标签图像中的文字进行文字识别,生成识别结果;
步骤S4,根据所述识别结果,确定标签信息。
本发明的上述技术方案至少具有如下有益效果之一:
根据本发明的标签识别方法,能够自动有效识别标签的内容,避免使用人力抄写标签,从而提升效率和标签识别的正确率;
进一步地,本发明实施例的标签识别方法,采用非模板方式,可以对各种不同格式的标签进行识别,并能够根据已识别过的标签进行自学习,以便提升同类标签的识别正确率,同时各种不同格式、不同布局、不同叫法的标签在识别完成后,按照标准叫法进行内容输出。
附图说明
图1为根据本发明一实施例的标签识别方法的流程图;
图2为根据本发明一实施例的仓库的出入库管理方法的流程图;
图3为本发明实施例的的标签识别装置的示意图;
图4为本发明实施例的电子设备的示意图。
具体实施方式
下面将结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
首先,结合图2所示说明根据本发明实施例的仓库出入库管理方法。
如图2所示,根据本发明实施例的出入库管理方法,包括:
步骤101、根据标签识别方法获取出入库货物的标签信息。
也就是说,根据标签识别方法,对不同钢厂、不同品种的各式标签内容进行自动识别,并自动获取出入库货物标签信息。具体的标签识别方法,如后所述。
钢铁物流管理环节众多,在装车、装船等运输管理环节中,以及仓库的出、入库等管理环节中都需要对货物的信息进行收集管理。提高这些环节的管理效率,节约管理成本,提升作业安全性,一直是钢铁物流单位所希望的。
传统的信息采集方式是通过现场管理人员根据钢铁标签抄写货物信息,再对这些信息进行整理、管理,此种方式不仅效率低下,而且错误率高,导致整体物流成本居高不下。
步骤102、基于所述标签信息对货物的出入库进行管理。
接下来,可以将识别后的标签信息传递给物流管理单位,物流单位对货物的出入库进行管理。由此,自动识别的准确率高且效率快,能够使得出仓库入库管理更加顺畅。
当然,也可以将识别后的标签信息提供给管理系统,系统自动进行出入库管理,这里不一一列举。
下面结合图1详细说明根据本发明实施例的标签识别方法,可以将所述识别方法应用于所述仓库出入库管理方法。
根据本发明实施例的标签识别方法,如图1所示,包括如下步骤:
步骤S1,获取原图。
也就是说,通过例如拍照、录像、扫描等方式获取标签的图像。
步骤S2,基于所述原图,提取标签图像。
根据上述获取的原图,进行图像处理,使得标签便于识别,例如,图像处理可以包括对图片进行预处理和矫正等。
其中,预处理可以是进行滤波以去除噪点、或者根据拍摄的图像具体灯光环境、背景灯对图片进行亮度处理、去除背景光、背景图灯等等。
根据本发明一些实施例,对原图进行透视性矫正。该透视性矫正例如可以包括如下步骤:
步骤S21,对所述原图进行分割处理。
首先,例如,将所述原图首先经过ENet网络进行标签区域的分割处理。
步骤S22,对分割后的图片进行联通区域筛选,确定标签区域。
然后,将分割后的图片进行联通区域筛选,挑选最佳联通区域为标签区域。
步骤S23,对所述标签区域进行轮廓拟合,确定所述标签区域的四个角的坐标信息。
接着,对所述标签区域进行轮廓的拟合,根据拟合的轮廓确定标签区域四个角的坐标信息。
步骤S24,基于所述四个角的坐标信息,进行所述透视性矫正。
最后,根据获得的四个角的坐标信息,进行透视变换的矫正。
优选地,在进行透视性矫正之前,需要进行判断四个角的坐标信息是否满足预定条件,所述预定条件为进行四个角信息是透视性矫正对于标签四个角完整性最低要求,换言之,低于此预定条件,进行矫正后的图片质量会变差,这样将增大文本检测和识别的难度,甚至无法识别文字。当上述四个角的坐标信息满足预定条件,则进行透视性矫正。
根据本发明一些实施例,在所述原图或经过透视性矫正后的图像进行旋转性矫正。
考虑到原图或经过透视性矫正后的图像存在旋转,且旋转对文本的识别精度有影响,根据本发明的旋转型矫正,在实际抓取待识别图片的过程中保持旋转性较小角度进行抓取。
具体地,所述旋转性矫正,包括:
首先,对于所述原图或经过透视性矫正后的图像,识别其旋转角度,并按照旋转角度进行分类。
例如,将原图或经过透视性矫正后的图像送入VGG16网络进行旋转角度分类,旋转性分类的类别分为四个类别,分别是0°、90°、180°以及270°。
接着,统计其方差信息。
统计图片的方差信息,方差最大方向作为小角度(-45°至45°)调整的依据。
最后,将方差最大方向作为小角度调整的依据,基于所述旋转角度对所述原图或经过透视性矫正后的图像进行旋转。
步骤S3,对所述标签图像中的文字进行文字识别,生成识别结果。
具体地,根据本发明一些实施例,所述步骤S3步骤包括:
步骤S31,提取所述标签图像中的文本的位置信息。
例如,所述文本的位置信息采用YOLOV3和Pixel_Link检测算法对文本进行位置的提取。
优选地,通过Pixel_Link检测算法,提取所述标签图像中的文本的位置信息。以上是基于举例的两种算法的比较而优选出的检测算法,其中YOLOV3检测算法在速度上由于Pixel_Link检测算法,而后者在文字位置抓取的精准度上由于YOLOV3,同时,YOLOV3更倾向于抓取长文本以及字符距离较大的文本段,而Pixe_Link更倾向于抓取短文本以及字符距离较小的字段。经过对比,使用Pixel_Link检测算法作为文本检测的算法。
步骤S32,基于所述位置信息,获取每一段文本的坐标信息。
步骤S33,基于所述坐标信息对于所述标签图像进行切割,得到切割图像。
步骤S34,识别所述切割图像中的文字信息,生成所述识别结果。
例如,将切割后的带有文字的图像集送给CRNN网络进行文本的识别,随后CRNN返回图像中的文字信息。
步骤S4,根据所述识别结果,确定标签信息。
也就是说,根据上述识别后的文字信息,生成标签信息,以供使用。
其中,过程的矫正信息、标签坐标信息、识别信息,标签信息也可以一并返回,以满足不同的需求。
以上实施例在实践过程中,有出现以下三个问题,会对使用有一定困扰。
问题一、标签识别出来的文字与常用标签用语的文字有差异,导致没办法确认物品的种类,需要人员进一步处理,浪费人力和精力。
例如,在钢铁物流领域中,螺纹钢识别为螺玟钢,由于没有螺玟钢这个物品,需要人员进一步处理,再次查看标签和物品。
基于此第一个问题,本发明进一步提供了更加优先的方案。
上述标签识别方法还包括步骤S5,建立目标标签用语数据库,所述目标标签用语数据库中存储有多种标签对应的标签用语。
增加步骤S5,建立目标标签用语数据库,所述目标标签用于数据库中存储有多种标签对应的标签用语。
例如,在钢铁物流领域中,可以把螺纹钢、带肋钢筋等同一件物品的不同叫法,建立目标标签用语数据库。
在步骤S5的基础上,S4进一步优化为:
根据所述识别结果,在所述目标标签用语数据库中进行检索,当检索到的文字与所述识别结果的差值小于一定阈值时,以所述检索到的文字作为标签用语,并基于所述标签用语获取所述标签信息。
也就是说,所述识别出的标签文字与检索到的目标标签用语数据库中标签文字差值小于一定阈值,以所检索到的文字作为标签用语,并使用检索到的文字获取标签信息。例如,原标签图像实际文字螺纹钢被识别为螺玟钢,判断差异小于阈值,则生成螺纹钢的标签信息。
进一步地,以上检索和比对的信息可以返回给步骤S34做训练,以使得下次识别出来的文字更加准确。
当检索到的文字与所述识别结果的差值大于所述阈值时,将所述识别结果作为所述标签用语并将所述识别结果加入到所述目标标签用语数据库中。
也就是说,识别出的标签文字与检索到的目标标签用语数据库中标签文字差值大于一定阈值,以所识别的文字作为目标标签用语,进一步扩充目标标签用语数据库,并使用所识别的文字获取标签信息。
以上采用非模板式识别,可以对各种不同格式的标签进行识别,并能够根据已识别过的标签进行自学习,以便提升同类标签的识别正确率。
问题二、同一种品物品不同厂家叫法不一致,出现多种标签用语,不方便物流的管理。
信息不对称,系统之间信息不能互通。这主要源于各物流公司管理方式各异,对数据的采集方式不一致、不全面等原因所致。对钢铁货物的信息采集,随着二维码的普及,除了对标签文字技术外,通过二维码货物信息也是未来的一个趋势,但是各个钢厂的格式不一致、叫法不一致,导致识别内容无法通用,必须通过对应关系的转换方可使用。
例如,在钢铁物流领域中,同一件物品,有些钢厂叫螺纹钢,有些钢厂叫带肋钢筋,导致叫法不一致,对物流的管理也存在一定的困扰。
基于此第二个问题,本发明进一步提供了更加优化的方案。
增加步骤S6,建立标准标签用语数据库,所述标准标签用语数据库中的用语与所述目标标签用语数据库中的用语相对应。
在步骤S5或步骤S6的基础上,S4进一优化为:
基于所述标签用语,从所述标准标签用语数据库中获取与其对应的标准标签用语,以所述标准标签用语作为所述标签信息。
例如,标签用语为带肋钢筋,标准标签用语数据库是螺纹钢,则以螺纹钢为所述标签信息。
由此,对各种不同叫法的标签在识别完成后,按照标准标签用语进行内容输出,方便物流的管理。
根据本发明一些实施例,所述标准标签用语数据库通过如下方法建立:
1)采集标签样本,生成样本集。
2)从样本集中提取标签用语,得到标签用语集。
3)对标签用语集通过机器学习进行训练,得到标准标签用语。
4)基于所述标准标签用语,得到所述标准标签用语数据库。
由此,通过机器的学习和训练,可以使得机器识别标签用语后,自动生成标准标签用语,更加智能及快速,而且,通过机器扩充标准标签数据库更加全面。
第三个问题,各个标签信息位置比较杂乱,不方便整理和统计。
基于此第三问题,本发明进一步提供了进一步优化的方案,将标签信息记录于模板中,从而生成模板化标签文件。
可选地,标签识别方法还包括:步骤S7,建立标签模板,标签模板是基于标准标签用语生成的具有多条分类信息的格式文件。
例如,标签模板包括分类分类信息名称(使用标准标签用语)和其相应的空白区域(用于记录分类信息名称对应的具体信息的区域)。以上,可以使用excell、word等格式。
步骤S4还包括:将标签信息与标签模板进行匹配,生成模板化标签文件。
例如,当标签信息匹配到标签模板的分类信息名称,则提取标签信息中分类信息名称相对应的具体信息,并将分类信息名称对应的具体信息记录于相应的空白区域,从而生成模板化标签文件。由此,实现了非模板的标签信息转换为模板化的标签信息。
可选地,标签模板中包括生产日期、货物名称、货物种类、生产厂家中的一个或多个。
下面,结合图3,说明根据本发明实施例的图片中文字的识别装置。
如图3所示,本发明实施例的图片中文字的识别装置1000,包括:
获取模块1001,用于获取原图;
标签图像提取模块1002,用于基于所述原图提取标签图像;
识别模块1003,用于对所述标签图像中的文字进行文字识别以生成识别结果;
标签信息生成模块1004,用于根据所述识别结果确定标签信息。
此外,如图4所示,本发明实施例提供了一种电子设备,包括:处理器1401和存储器1402,在所述存储器1402中存储有计算机程序指令,其中,在所述计算机程序指令被所述处理器运行时,使得所述处理器1401执行以下步骤:
步骤S1,获取原图;
步骤S2,基于所述原图,提取标签图像;
步骤S3,对所述标签图像中的文字进行文字识别,生成识别结果;
步骤S4,根据所述识别结果,确定标签信息。
进一步地,电子设备还包括网络接口1403、输入设备1404、硬盘1405、和显示设备1406。
上述各个接口和设备之间可以通过总线架构互连。总线架构可以是可以包括任意数量的互联的总线和桥。具体由处理器1401代表的一个或者多个中央处理器(CPU),以及由存储器1402代表的一个或者多个存储器的各种电路连接在一起。总线架构还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其它电路连接在一起。可以理解,总线架构用于实现这些组件之间的连接通信。总线架构除包括数据总线之外,还包括电源总线、控制总线和状态信号总线,这些都是本领域所公知的,因此本文不再对其进行详细描述。
所述网络接口1403,可以连接至网络(如因特网、局域网等),从网络中获取相关数据,并可以保存在硬盘1405中。
所述输入设备1404,可以接收操作人员输入的各种指令,并发送给处理器1401以供执行。所述输入设备1404可以包括键盘或者点击设备(例如,鼠标,轨迹球(trackball)、触感板或者触摸屏等。
所述显示设备1406,可以将处理器1401执行指令获得的结果进行显示。
所述存储器1402,用于存储操作系统运行所必须的程序和数据,以及处理器1401计算过程中的中间结果等数据。
可以理解,本发明实施例中的存储器1402可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(ROM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)或闪存。易失性存储器可以是随机存取存储器(RAM),其用作外部高速缓存。本文描述的装置和方法的存储器1402旨在包括但不限于这些和任意其它适合类型的存储器。
在一些实施方式中,存储器1402存储了如下的元素,可执行模块或者数据结构,或者他们的子集,或者他们的扩展集:操作系统14021和应用程序14014。
其中,操作系统14021,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序14014,包含各种应用程序,例如浏览器(Browser)等,用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序14014中。
上述处理器1401,当调用并执行所述存储器1402中所存储的应用程序和数据,具体的,可以是应用程序14014中存储的程序或指令时,获取原图;基于所述原图,提取标签图像;对所述标签图像中的文字进行文字识别,生成识别结果;根据所述识别结果,确定标签信息。
本发明上述实施例揭示的方法可以应用于处理器1401中,或者由处理器1401实现。处理器1401可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器1401中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器1401可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器1402,处理器1401读取存储器1402中的信息,结合其硬件完成上述方法的步骤。
可以理解的是,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(ASIC)、数字信号处理器DSP)、数字信号处理设备(DSPD)、可编程逻辑设备(PLD)、现场可编程门阵列(FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。
对于软件实现,可通过执行本文所述功能的模块(例如过程、函数等)来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
另外,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器运行时,使得所述处理器执行以下步骤:
步骤S1,获取原图;
步骤S2,基于所述原图,提取标签图像;
步骤S3,对所述标签图像中的文字进行文字识别,生成识别结果;
步骤S4,根据所述识别结果,确定标签信息。
在本申请所提供的几个实施例中,应该理解到,所揭露方法和装置,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理包括,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述收发方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁盘或者光盘等各种可以存储程序代码的介质。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (18)

1.一种标签识别方法,其特征在于,包括如下步骤:
步骤S1,获取原图;
步骤S2,基于所述原图,提取标签图像;
步骤S3,对所述标签图像中的文字进行文字识别,生成识别结果;
步骤S4,根据所述识别结果,确定标签信息。
2.根据权利要求1所述的标签识别方法,其特征在于,所述步骤S2包括对所述原图进行透视性矫正。
3.根据权利要求2所述的标签识别方法,其特征在于,所述透视性矫正包括:
步骤S21,对所述原图进行分割处理;
步骤S22,对分割后的图片进行联通区域筛选,确定标签区域;
步骤S23,对所述标签区域进行轮廓拟合,确定所述标签区域的四个角的坐标信息;
步骤S24,基于所述四个角的坐标信息,进行所述透视性矫正。
4.根据权利要求3所述的标签识别方法,其特征在于,所述步骤S24中,当所述四个角的坐标信息满足预定条件时,进行所述透视性矫正。
5.根据权利要求1或2所述的标签识别方法,其特征在于,所述步骤S2包括对于所述原图或经过透视性矫正后的图像进行旋转性矫正。
6.根据权利要求5所述的标签识别方法,其特征在于,所述旋转性矫正包括:
对于所述原图或经过透视性矫正后的图像,识别其旋转角度,并按照旋转角度进行分类;
统计其方差信息;
将方差最大方向作为小角度调整的依据,基于所述旋转角度对所述原图或经过透视性矫正后的图像进行旋转。
7.根据权利要求1所述的标签识别方法,其特征在于,所述步骤S3包括:
步骤S31,提取所述标签图像中的文本的位置信息;
步骤S32,基于所述位置信息,获取每一段文本的坐标信息;
步骤S33,基于所述坐标信息对于所述标签图像进行切割,得到切割图像;
步骤S34,识别所述切割图像中的文字信息,生成所述识别结果。
8.根据权利要求7所述的标签识别方法,其特征在于,所述步骤S31中,通过Pixel_Link检测算法,提取所述标签图像中的文本的位置信息。
9.根据权利要求1所述的标签识别方法,其特征在于,所述标签识别方法还包括:
步骤S5,建立目标标签用语数据库,所述目标标签用语数据库中存储有多种标签对应的标签用语;
所述步骤S4包括:
根据所述识别结果,在所述目标标签用语数据库中进行检索,当检索到的文字与所述识别结果的差值小于一定阈值时,以所述检索到的文字作为标签用语,并基于所述标签用语获取所述标签信息。
10.根据权利要求9所述的标签识别方法,其特征在于,所述步骤S4中,当检索到的文字与所述识别结果的差值大于所述阈值时,将所述识别结果作为所述标签用语并将所述识别结果加入到所述目标标签用语数据库中。
11.根据权利要求9或10所述的标签识别方法,其特征在于,所述标签识别方法还包括:
步骤S6,建立标准标签用语数据库,所述标准标签用语数据库中的用语与所述目标标签用语数据库中的用语相对应,
所述步骤S4中基于所述标签用语获取所述标签信息包括:
基于所述标签用语,从所述标准标签用语数据库中获取与其对应的标准标签用语,以所述标准标签用语作为所述标签信息。
12.根据权利要求11所述的标签识别方法,其特征在于,所述标准标签用语数据库通过如下方法建立:
采集标签样本,生成样本集;
从所述样本集中提取标签用语,得到标签用语集;
对所述标签用语集通过机器学习进行训练,得到标准标签用语;
基于所述标准标签用语,得到所述标准标签用语数据库。
13.根据权利要求11或12所述的标签识别方法,其特征在于,所述标签识别方法还包括:
步骤S7,建立标签模板,所述标签模板是基于所述标准标签用语生成的具有多条分类信息的格式文件,
所述步骤S4还包括:
将所述标签信息与所述标签模板进行匹配,生成模板化标签文件。
14.根据权利要求13所述的标签识别方法,其特征在于,所述标签模板中包括生产日期、货物名称、货物种类、生产厂家中的一个或多个。
15.一种仓库的出入库管理方法,其特征在于,包括如下步骤:
根据权利要求1至14任一项所述的标签识别方法获取出入库货物的标签信息;
基于所述标签信息对货物的出入库进行管理。
16.一种标签识别装置,其特征在于,包括:
获取模块,用于获取原图;
标签图像提取模块,用于基于所述原图提取标签图像;
识别模块,用于对所述标签图像中的文字进行文字识别以生成识别结果;
标签信息生成模块,用于根据所述识别结果确定标签信息。
17.一种用于识别标签信息的电子设备,其特征在于,包括:
一个或多个处理器;
一个或多个存储器,其中存储了计算机可读代码,所述计算机可读代码当由所述一个或多个处理器运行时,使得所述处理器执行如下步骤:
步骤S1,获取原图;
步骤S2,基于所述原图,获取标签图像;
步骤S3,对所述标签图像中的文字进行文字识别,生成识别结果;
步骤S4,根据所述识别结果,确定标签信息。
18.一种非暂时性计算机存储介质,其特征在于,其中存储了计算机可读代码,所述计算机可读代码当由一个或多个处理器运行时,使得所述处理器执行如下步骤:
步骤S1,获取原图;
步骤S2,基于所述原图,获取标签图像;
步骤S3,对所述标签图像中的文字进行文字识别,生成识别结果;
步骤S4,根据所述识别结果,确定标签信息。
CN201911153223.0A 2019-11-22 2019-11-22 标签识别方法、装置、设备及计算机可读存储介质 Active CN110991446B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911153223.0A CN110991446B (zh) 2019-11-22 2019-11-22 标签识别方法、装置、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911153223.0A CN110991446B (zh) 2019-11-22 2019-11-22 标签识别方法、装置、设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN110991446A true CN110991446A (zh) 2020-04-10
CN110991446B CN110991446B (zh) 2020-10-23

Family

ID=70085799

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911153223.0A Active CN110991446B (zh) 2019-11-22 2019-11-22 标签识别方法、装置、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN110991446B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111612012A (zh) * 2020-05-25 2020-09-01 信雅达系统工程股份有限公司 健康码的识别方法及装置
CN111667214A (zh) * 2020-06-05 2020-09-15 上海锦商网络科技有限公司 基于二维码的货物信息获取方法、装置及电子设备
CN114239632A (zh) * 2021-12-09 2022-03-25 中冶赛迪重庆信息技术有限公司 一种线棒材标签的识别方法、系统、电子设备及介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103870822A (zh) * 2012-12-17 2014-06-18 北京千橡网景科技发展有限公司 词语识别方法及装置
CN104318573A (zh) * 2014-10-31 2015-01-28 广州超音速自动化科技有限公司 标签缺陷检测方法
CN105160654A (zh) * 2015-07-09 2015-12-16 浙江工商大学 基于特征点提取的毛巾标签缺陷检测方法
US20160086200A1 (en) * 2013-05-17 2016-03-24 Id's Co., Ltd. Product code analysis system and product code analysis program
WO2017170632A1 (ja) * 2016-03-29 2017-10-05 株式会社リクルートホールディングス 商品データ登録端末、商品データ登録方法および商品データ登録プログラム
CN107492091A (zh) * 2017-07-06 2017-12-19 东莞理工学院 基于机器视觉的标签外观检测方法及终端设备
CN107617573A (zh) * 2017-09-30 2018-01-23 浙江瀚镪自动化设备股份有限公司 一种基于多任务深度学习的物流编码识别和分拣方法
CN109598238A (zh) * 2018-12-04 2019-04-09 拉扎斯网络科技(上海)有限公司 信息处理方法及装置、存储介质和电子设备
CN110009796A (zh) * 2019-04-11 2019-07-12 北京邮电大学 发票类别识别方法、装置、电子设备及可读存储介质
CN110070090A (zh) * 2019-04-25 2019-07-30 上海大学 一种基于手写文字识别的物流标签信息检测方法及系统
CN110210952A (zh) * 2019-06-13 2019-09-06 讯飞智元信息科技有限公司 一种评标方法及装置
CN110210581A (zh) * 2019-04-28 2019-09-06 平安科技(深圳)有限公司 一种手写文本识别方法及装置、电子设备

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103870822A (zh) * 2012-12-17 2014-06-18 北京千橡网景科技发展有限公司 词语识别方法及装置
US20160086200A1 (en) * 2013-05-17 2016-03-24 Id's Co., Ltd. Product code analysis system and product code analysis program
CN104318573A (zh) * 2014-10-31 2015-01-28 广州超音速自动化科技有限公司 标签缺陷检测方法
CN105160654A (zh) * 2015-07-09 2015-12-16 浙江工商大学 基于特征点提取的毛巾标签缺陷检测方法
WO2017170632A1 (ja) * 2016-03-29 2017-10-05 株式会社リクルートホールディングス 商品データ登録端末、商品データ登録方法および商品データ登録プログラム
CN107492091A (zh) * 2017-07-06 2017-12-19 东莞理工学院 基于机器视觉的标签外观检测方法及终端设备
CN107617573A (zh) * 2017-09-30 2018-01-23 浙江瀚镪自动化设备股份有限公司 一种基于多任务深度学习的物流编码识别和分拣方法
CN109598238A (zh) * 2018-12-04 2019-04-09 拉扎斯网络科技(上海)有限公司 信息处理方法及装置、存储介质和电子设备
CN110009796A (zh) * 2019-04-11 2019-07-12 北京邮电大学 发票类别识别方法、装置、电子设备及可读存储介质
CN110070090A (zh) * 2019-04-25 2019-07-30 上海大学 一种基于手写文字识别的物流标签信息检测方法及系统
CN110210581A (zh) * 2019-04-28 2019-09-06 平安科技(深圳)有限公司 一种手写文本识别方法及装置、电子设备
CN110210952A (zh) * 2019-06-13 2019-09-06 讯飞智元信息科技有限公司 一种评标方法及装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111612012A (zh) * 2020-05-25 2020-09-01 信雅达系统工程股份有限公司 健康码的识别方法及装置
CN111667214A (zh) * 2020-06-05 2020-09-15 上海锦商网络科技有限公司 基于二维码的货物信息获取方法、装置及电子设备
CN111667214B (zh) * 2020-06-05 2024-03-15 上海锦商网络科技有限公司 基于二维码的货物信息获取方法、装置及电子设备
CN114239632A (zh) * 2021-12-09 2022-03-25 中冶赛迪重庆信息技术有限公司 一种线棒材标签的识别方法、系统、电子设备及介质
CN114239632B (zh) * 2021-12-09 2023-08-25 中冶赛迪信息技术(重庆)有限公司 一种线棒材标签的识别方法、系统、电子设备及介质

Also Published As

Publication number Publication date
CN110991446B (zh) 2020-10-23

Similar Documents

Publication Publication Date Title
US11868717B2 (en) Multi-page document recognition in document capture
CN110991446B (zh) 标签识别方法、装置、设备及计算机可读存储介质
CN112597312A (zh) 文本分类方法、装置、电子设备及可读存储介质
CN105631393A (zh) 信息识别方法及装置
CN111753717B (zh) 用于提取文本的结构化信息的方法、装置、设备及介质
CN102855298A (zh) 图像检索方法及系统
CN112418812A (zh) 分布式全链路自动化智能通关系统、方法及存储介质
CN113449698A (zh) 纸质文档的自动化录入方法、系统、装置及存储介质
CN202711171U (zh) 单据手写文字自动识别录入装置
CN113723376B (zh) 智能屏显数据采集方法、装置、设备及存储介质
CN114241501A (zh) 影像文档处理方法、装置及电子设备
US11195004B2 (en) Method and system for extracting information from document images
CN111552829B (zh) 用于分析图像素材的方法和装置
CN112418813A (zh) 基于智能解析识别的aeo资质智能评级管理系统、方法及存储介质
CN107861931B (zh) 模板文件处理方法、装置、计算机设备和存储介质
CN113807416B (zh) 一种模型训练方法、装置、电子设备以及存储介质
CN111667214B (zh) 基于二维码的货物信息获取方法、装置及电子设备
US20100023517A1 (en) Method and system for extracting data-points from a data file
CN115601586A (zh) 标签信息获取方法、装置、电子设备及计算机存储介质
CN114494681A (zh) 接线端子智能比对方法、系统、计算机设备及存储介质
US11659104B2 (en) Generation of an electronic document capable of receiving user input
CN113033832B (zh) 一种汽修数据录入方法、装置、终端设备及可读存储介质
JP2806340B2 (ja) 帳票管理装置
CN203070361U (zh) 一种基于手持终端的金融设备信息采集系统
Ondrejcek et al. Information extraction from scanned engineering drawings

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant