CN105488508A - 一种制药软袋薄膜字符智能切分的方法 - Google Patents

一种制药软袋薄膜字符智能切分的方法 Download PDF

Info

Publication number
CN105488508A
CN105488508A CN201510870461.9A CN201510870461A CN105488508A CN 105488508 A CN105488508 A CN 105488508A CN 201510870461 A CN201510870461 A CN 201510870461A CN 105488508 A CN105488508 A CN 105488508A
Authority
CN
China
Prior art keywords
character
height
duration
characters
width
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510870461.9A
Other languages
English (en)
Inventor
郭大庆
于振
任海燕
马永发
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Puda Software Technology Co Ltd
Original Assignee
Tianjin Puda Software Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Puda Software Technology Co Ltd filed Critical Tianjin Puda Software Technology Co Ltd
Priority to CN201510870461.9A priority Critical patent/CN105488508A/zh
Publication of CN105488508A publication Critical patent/CN105488508A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/158Segmentation of character regions using character size, text spacings or pitch estimation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

本发明涉及一种制药软袋薄膜字符智能切分的方法,包括:采集一张制药软袋薄膜字符图像;计算单个字符单个字符宽度、字符高度的粗略值;应用模式匹配方法将符合特征向量的字符分割开来;比较分割的字符个数是否与实际的字符个数相等,如果不相等,则修正d)中的字符宽度和字符高度,若所得字符个数小于产品批号的实际字符个数,则减小字符宽度,反之增加字符宽度;重新应用模式匹配,直到每个字符全部分开,得到字符宽度和字符高度的精确值;应用精确的字符宽度和字符高度去匹配整个图像的字符,将符合要求的所有字符分割出来。本发明可以精确地进行字符切分。

Description

一种制药软袋薄膜字符智能切分的方法
技术领域
本发明涉及一种制药软袋薄膜字符智能切分的方法。
背景技术
大冢制药软袋薄膜是输液药品的包装袋,在灌装密封之前需要检测薄膜上打印的字符,杜绝未喷打字符、喷打错误字符,重打、喷打字符不清楚等现象。在识别字符之前,需要提取字符模板来训练人工神经网络(以下简称神经网络)。
目前,字符模板的提取一种方法是利用开闭运算等形态学算法,但算法稳定性差,适用性不强,易受字符图像质量的影响。另一种是手动切分,即人工手动在图像上圈定单个字符,这种方法实现简单,但圈定的字符区域因人而异,虽然人员操作之前经过培训,可还是导致标准不统一造成的模板失效等问题。以上两种方法都存在很大不足。
发明内容
针对上述问题,本发明的目的是提供一种制药软袋薄膜字符智能切分的方法。本发明的技术方案如下:
下面结合附图和实施例对本发明的进行详细的描述。
一种制药软袋薄膜字符智能切分的方法,包括下列步骤:
1)采集一张制药软袋薄膜字符图像。
2)计算单个字符单个字符宽度、字符高度的粗略值,方法如下:
a)圈定一行字符区域,锁定计算区域;
b)经过图像预处理得到更加精确的字符区域;
c)根据b)步骤得到的字符区域的整体的宽度、高度平均求得单个字符宽度、字符高度,此时只是粗略值;
3)应用模式匹配方法将符合特征向量的字符分割开来;
4)比较分割的字符个数是否与实际的字符个数相等,如果不相等,则修正字符宽度和字符高度,若所得字符个数小于产品批号的实际字符个数,则减小字符宽度,反之增加字符宽度;返回步骤3)重新应用模式匹配,直到每个字符全部分开,得到字符宽度和字符高度的精确值,此过程称为迭代;
5)应用精确的字符宽度和字符高度去匹配整个图像的字符,将符合要求的所有字符分割出来。
本发明由于采取以上技术方案,其具有以下优点:
(1)本发明相比于以往手动切分,特别是大量字符存在的情况下,非常方便和准确,并且易于维护。
(2)本发明能够实现切分出来的模板标准统一,不会出现受员工主观性影响导致的模板库失效问题。
附图说明
图1是大冢制药软袋薄膜字符图;
图2是需要处理的字符区域;
图3是消除多余边界的字符区域;
图4是没有完全将字符分割出来的图像;
图5是整行完全将字符分割出来的图像;
图6是整个图像的字符分割;
具体实施方式
下面结合附图和实施例对本发明的进行详细的描述。
1)采集一张制药软袋薄膜字符图像。如图1所示,图像中共有3行字符,分别是生产批号、生产日期和有效期。
2)计算单个字符的精确宽度和高度,方法如下:
a)手动圈定一行字符区域,锁定计算区域;
b)应用中值滤波和动态阈值处理得到更加精确的字符区域;
c)根据b)步骤得到的字符区域整体的宽度、高度平均求得单个字符宽度、字符高度,此时只是粗略值;
d)应用模式匹配方法将符合特征向量的字符分割开来。模式匹配需要的特征向量共14种,分别为:
1,字符高度:单个字符的高度;
2,字符宽度:单个字符的宽度;
3,喷墨点宽度:字符打印的笔画宽度;
4,字符高度最大偏差比例:字符高度允许在2中的字符宽度上下偏差的范围;
5,极性:字符为黑色,背景为白色或者反之;
6,最大行数:字符的最大行数;
7,英文字母大写标志量:字符中若存在英文字符,是否全部是大写;
8,点打标志量:字符打印效果是否是一个个点组成;
9,是否有反射标志量:字符局部是否存在反光;
10,水平结构标志量:字符串是否是水平排列;
11,是否存在分隔符标志量:字符之间是否存在‘-’或‘=’符号;
12,是否存在逗号引号标志量:字符之间是否存在‘,’或‘:’符号;
13,是否存在断点标量:例如字符‘i’上面的点可能按噪声处理;
14,字符结构:例如字符串2013.08.18,字符结构为422,4代表2013,两个2分别代表08和18,即个数;
e)比较d)中分割的字符个数是否与实际的字符个数相等,如果不相等,则小幅度修正d)中的字符宽度和字符高度,若所得字符个数小于产品批号的实际字符个数,则减小字符宽度,反之增加字符宽度,返回步骤d重新应用模式匹配,直到每个字符全部分开时,得到字符宽度和字符高度的精确值,此过程称为迭代,迭代得到单个字符的字符宽度和字符高度的精确值;
3)应用e中得到的精确的字符宽度和字符高度去匹配整个图像的字符,将符合要求的所有字符分割出来。

Claims (2)

1.一种制药软袋薄膜字符智能切分的方法,包括下列步骤:
1)采集一张制药软袋薄膜字符图像。
2)计算单个字符单个字符宽度、字符高度的粗略值,方法如下:
a)圈定一行字符区域,锁定计算区域;
b)经过图像预处理得到更加精确的字符区域;
c)根据b)步骤得到的字符区域的整体的宽度、高度平均求得单个字符宽度、字符高度,此时只是粗略值;
3)应用模式匹配方法将符合特征向量的字符分割开来;
4)比较分割的字符个数是否与实际的字符个数相等,如果不相等,则修正字符宽度和字符高度,若所得字符个数小于产品批号的实际字符个数,则减小字符宽度,反之增加字符宽度;返回步骤3)重新应用模式匹配,直到每个字符全部分开,得到字符宽度和字符高度的精确值,此过程称为迭代;
5)应用精确的字符宽度和字符高度去匹配整个图像的字符,将符合要求的所有字符分割出来。
2.根据权利要求1所述的一种制药软袋薄膜字符智能切分的方法,其特征在于,步骤3)中采用的特征向量为:
①字符高度:单个字符的高度;
②字符宽度:单个字符的宽度;
③喷墨点宽度:字符打印的笔画宽度;
④字符高度最大偏差比例:字符高度允许在②中的字符宽度上下偏差的范围;
⑤极性:字符为黑色,背景为白色或者反之;
⑥最大行数:字符的最大行数;
⑦英文字母大写标志量:字符中若存在英文字符,是否全部是大写;
⑧点打标志量:字符打印效果是否是一个个点组成;
⑨是否有反射标志量:字符局部是否存在反光;
⑩水平结构标志量:字符串是否是水平排列;
是否存在分隔符标志量;
是否存在逗号或引号标志量;
是否存在断点标量;
字符结构。
CN201510870461.9A 2015-12-01 2015-12-01 一种制药软袋薄膜字符智能切分的方法 Pending CN105488508A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510870461.9A CN105488508A (zh) 2015-12-01 2015-12-01 一种制药软袋薄膜字符智能切分的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510870461.9A CN105488508A (zh) 2015-12-01 2015-12-01 一种制药软袋薄膜字符智能切分的方法

Publications (1)

Publication Number Publication Date
CN105488508A true CN105488508A (zh) 2016-04-13

Family

ID=55675480

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510870461.9A Pending CN105488508A (zh) 2015-12-01 2015-12-01 一种制药软袋薄膜字符智能切分的方法

Country Status (1)

Country Link
CN (1) CN105488508A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112215236A (zh) * 2020-10-21 2021-01-12 科大讯飞股份有限公司 文本识别方法、装置、电子设备及存储介质
CN116758531A (zh) * 2023-08-23 2023-09-15 苏州视谷视觉技术有限公司 一种基于深度学习的机器视觉系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7493530B2 (en) * 2002-06-25 2009-02-17 Avago Technologies General Ip (Singapore) Pte. Ltd. Method and apparatus for detecting an error in a bit sequence
CN102043959A (zh) * 2010-12-28 2011-05-04 青岛海信网络科技股份有限公司 车牌字符分割方法
CN102222226A (zh) * 2011-06-21 2011-10-19 杭州电子科技大学 一种基于先验分析的迭代式车牌字符分割方法
CN103093224A (zh) * 2011-11-08 2013-05-08 佳能株式会社 确定平均字符宽度的方法和装置及字符切分方法和设备
CN103198315A (zh) * 2013-04-17 2013-07-10 南京理工大学 基于字符轮廓和模板匹配的车牌字符分割算法
CN104408454A (zh) * 2014-06-30 2015-03-11 电子科技大学 基于弹性模板匹配算法的车牌字符分割方法
CN105023018A (zh) * 2015-08-13 2015-11-04 武汉楚锐自动化控制设备有限公司 一种喷码检测方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7493530B2 (en) * 2002-06-25 2009-02-17 Avago Technologies General Ip (Singapore) Pte. Ltd. Method and apparatus for detecting an error in a bit sequence
CN102043959A (zh) * 2010-12-28 2011-05-04 青岛海信网络科技股份有限公司 车牌字符分割方法
CN102222226A (zh) * 2011-06-21 2011-10-19 杭州电子科技大学 一种基于先验分析的迭代式车牌字符分割方法
CN103093224A (zh) * 2011-11-08 2013-05-08 佳能株式会社 确定平均字符宽度的方法和装置及字符切分方法和设备
CN103198315A (zh) * 2013-04-17 2013-07-10 南京理工大学 基于字符轮廓和模板匹配的车牌字符分割算法
CN104408454A (zh) * 2014-06-30 2015-03-11 电子科技大学 基于弹性模板匹配算法的车牌字符分割方法
CN105023018A (zh) * 2015-08-13 2015-11-04 武汉楚锐自动化控制设备有限公司 一种喷码检测方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112215236A (zh) * 2020-10-21 2021-01-12 科大讯飞股份有限公司 文本识别方法、装置、电子设备及存储介质
CN112215236B (zh) * 2020-10-21 2024-04-16 科大讯飞股份有限公司 文本识别方法、装置、电子设备及存储介质
CN116758531A (zh) * 2023-08-23 2023-09-15 苏州视谷视觉技术有限公司 一种基于深度学习的机器视觉系统
CN116758531B (zh) * 2023-08-23 2023-11-03 苏州视谷视觉技术有限公司 一种基于深度学习的机器视觉系统

Similar Documents

Publication Publication Date Title
CN105069466B (zh) 基于数字图像处理的行人服饰颜色识别方法
CN105512638B (zh) 一种基于融合特征的人脸检测与对齐方法
CN102903110B (zh) 对具有深度图像信息的图像的分割方法
CN105740945B (zh) 一种基于视频分析的人群计数方法
CN108921119B (zh) 一种障碍物实时检测和分类方法
CN106156684B (zh) 一种二维码识别方法及装置
CN102332157B (zh) 一种消除阴影的方法
CN107480682B (zh) 一种商品包装生产日期检测方法
CN105469113A (zh) 一种二维视频流中的人体骨骼点追踪方法及系统
CN104361131B (zh) 四维人脸模型数据库的建立方法
CN108764041A (zh) 用于下部遮挡人脸图像的人脸识别方法
CN103886589A (zh) 面向目标的自动化高精度边缘提取方法
CN104166988B (zh) 一种融入稀疏匹配信息的立体图像同步分割方法
CN105260705A (zh) 一种适用于多姿态下的驾驶人员接打电话行为检测方法
CN102147867B (zh) 一种基于主体的国画图像和书法图像的识别方法
CN102420985B (zh) 一种多视点视频对象提取方法
CN104598907B (zh) 一种基于笔画宽度图的图像中文字数据提取方法
CN107122775A (zh) 一种基于特征匹配的安卓手机身份证字符识别方法
CN107767379A (zh) Pcb板标注印刷质量检测方法
CN109993161A (zh) 一种文本图像旋转矫正方法及系统
CN106980845B (zh) 基于结构化建模的人脸关键点定位方法
CN107992807A (zh) 一种基于cnn模型的人脸识别方法及装置
CN105488508A (zh) 一种制药软袋薄膜字符智能切分的方法
CN102982524A (zh) 玉米果穗有序图像的拼接方法
CN109948461A (zh) 一种基于质心定位和距离变换的手语图像分割方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160413