CN110598691B - 一种基于改进多层感知机的药品字符标签的识别方法 - Google Patents
一种基于改进多层感知机的药品字符标签的识别方法 Download PDFInfo
- Publication number
- CN110598691B CN110598691B CN201910708433.5A CN201910708433A CN110598691B CN 110598691 B CN110598691 B CN 110598691B CN 201910708433 A CN201910708433 A CN 201910708433A CN 110598691 B CN110598691 B CN 110598691B
- Authority
- CN
- China
- Prior art keywords
- layer perceptron
- perceptron
- training
- introducing
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0463—Neocognitrons
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Medical Preparation Storing Or Oral Administration Devices (AREA)
Abstract
本发明涉及机器视觉学习领域,更具体地,涉及一种基于改进多层感知机的药品字符标签的识别方法。包括以下步骤:选取药瓶的字符标签,选取出字符标签中需要识别的区域;将待识别的区域以相片的形式进行预处理,定位目标区域;对目标区域进行划分,将目标区域中字符进行切割,将切割后的字符作为标签字符的数据集;构建多层感知机;将数据集输入到多层感知机中,得到最终的识别结果。本发明改进过的的多层感知机相比于传统的能防止陷入局部极小,寻得最优解。通过对多层感知机引入droupout以解决过拟合问题,引入使用动量的随机梯度下降以防止陷入局部极小的问题,引入ReLU解决梯度弥散的问题;相比于模板匹配法,有着较高的识别率和泛化能力。
Description
技术领域
本发明涉及机器视觉学习领域,更具体地,涉及一种基于改进多层感知机的药品字符标签的识别方法。
背景技术
机器视觉作为一门新兴的学科,近20年来一直以迅猛的速度进行发展,并且机器视觉的发展阶段已经由实验研究走向了实际应用,得到了广泛的工业应用。
药品在我们的日常生活中起到了举足轻重的作用,密切关系着我们的生活,关系着人们的健康甚至是生命健康安全。其中国家规定,在药品上必须表明产品批号、生产日期、有效期这三项内容,而且这三项内容是药品使用安全性的一方面,一般是使用一组阿拉伯数字或者数字加字母加汉字的形式来标识。国家药品管理部门对药厂及药品的检测要求也越来越严格。其中对药品、药品包装的视觉检测和分析是药品检测的重要手段之一。视觉检测作为机器视觉的一种,将其用在药品标签字符的识别上,可以提高生产效率和减少次品率。现有的对于药品标签识别是运用传统的模板匹配法进行识别,其局限性也非常明显,识别准确率不高,泛化能力差,这些都是字符标签识别的瓶颈所在。
发明内容
为了解决现有技术中机器视觉对于药品标签识别准确率不高,泛化能力差的不足,本发明提供了一种基于改进多层感知机的药品字符标签的识别方法。
一种基于改进多层感知机的药品字符标签的识别方法,包括以下步骤:
步骤S1:选取药瓶的字符标签,选取出字符标签中需要识别的区域;
步骤S2:将待识别的区域以相片的形式进行预处理,定位目标区域;
步骤S3:对目标区域进行划分,将目标区域中字符进行切割,将切割后的字符作为标签字符的数据集;
步骤S4:构建多层感知机,使用传统多层感知机作为基础,对其引入droupout以解决过拟合问题,引入使用动量的随机梯度下降以防止陷入局部极小的问题,引入ReLU解决梯度弥散的问题;
步骤S5:将步骤S3中的数据集输入到多层感知机中进行训练以及测试。
优选的,步骤S2中图像预处理的过程包括对图像进行翻转,去噪,灰度化以及二值化处理。
优选的,所述步骤S3中切割出来的每一张字符都需采取归一化操作,保持一样的大小和格式,并且给定对应的标签。
优选的,根据权利要求1所述的基于改进感知机的标签字符识别方法,其特征在于,所述步骤S4中,引入的Droupout结构,每个节点消失的概率:
其中,A为当前迭代次数,a为当前该节点消失的次数。
优选的,步骤S4引入的ReLU解决弥散的问题,即替换感知机的激活函数为一个非线性函数y=max(0,x)。
优选的,步骤S4引入的引入使用动量的随机梯度下降,其公式如下:
计算速度更新:v:=αv-∈g
计算应用更新:θ:=θ+v
其中,学习率∈,初始参数θ,动量参数α,初始速度v,梯度g。
优选的,在步骤S5中,将步骤S3中得到的数据集划分为训练集,验证集以及测试集,先将训练集的数据输入到多层感知机中进行训练,训练集采用反向传播来更新多层感知机的参数,在训练期间输入验证集进行多层感知机超参数的微调,多层感知机训练完毕后,利用测试集对多层感知机的性能进行测试,最后选择性能最佳的多层感知机进行药品标签的测试,验证其泛化能力。
优选的,数据集以比例5:1:1划分为训练集,验证集以及测试集。
与现有技术相比,本发明技术方案的有益效果是:
本发明改进过的的多层感知机相比于传统的能防止陷入局部极小,寻得最优解。通过对多层感知机引入droupout以解决过拟合问题,引入使用动量的随机梯度下降以防止陷入局部极小的问题,引入ReLU解决梯度弥散的问题;相比于模板匹配法,有着较高的识别率和泛化能力。
附图说明
图1为本发明的步骤流程图。
图2为实施例2中切割出来的待识别的字符。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
下面结合附图和实施例对本发明的技术方案做进一步的说明。
实施例1
如图1所示,一种基于改进多层感知机的药品字符标签的识别方法,包括以下步骤:
步骤S1:选取药瓶的字符标签,选取出字符标签中需要识别的区域;
步骤S2:将待识别的区域以相片的形式进行预处理,定位目标区域;
步骤S3:对目标区域进行划分,将目标区域中字符进行切割,将切割后的字符作为标签字符的数据集;
步骤S4:构建多层感知机,使用传统多层感知机作为基础,对其引入droupout以解决过拟合问题,引入使用动量的随机梯度下降以防止陷入局部极小的问题,引入ReLU解决梯度弥散的问题;
步骤S5:将步骤S3中的数据集输入到多层感知机中进行训练以及测试。
优选的,步骤S2中图像预处理的过程包括对图像进行翻转,去噪,灰度化以及二值化处理。
优选的,所述步骤S3中切割出来的每一张字符都需采取归一化操作,保持一样的大小和格式,并且给定对应的标签。
优选的,根据权利要求1所述的基于改进感知机的标签字符识别方法,其特征在于,所述步骤S4中,引入的Droupout结构,每个节点消失的概率:
其中,A为当前迭代次数,a为当前该节点消失的次数。
优选的,步骤S4引入的ReLU解决弥散的问题,即替换感知机的激活函数为一个非线性函数y=max(0,x)。
优选的,步骤S4引入的引入使用动量的随机梯度下降,其公式如下:
计算速度更新:v:=αv-∈g
计算应用更新:θ:=θ+v
其中,学习率∈,初始参数θ,动量参数α,初始速度v,梯度g。
优选的,在步骤S5中,将步骤S3中得到的数据集划分为训练集,验证集以及测试集,先将训练集的数据输入到多层感知机中进行训练,训练集采用反向传播来更新多层感知机的参数,在训练期间输入验证集进行多层感知机超参数的微调,多层感知机训练完毕后,利用测试集对多层感知机的性能进行测试,最后选择性能最佳的多层感知机进行药品标签的测试,验证其泛化能力。
优选的,数据集以比例5:1:1划分为训练集,验证集以及测试集。
实施例2
如图1以及图2所示,如附图1和2所示,本发明揭示了一种基于改进感知机的药品标签识别的方法,包括以下步骤:
S1:以实际需求为出发,将待识别的区域以相片的形式进行图片预处理,包括图像翻转,去噪,灰度化,二值化,然后对目标区域进行定位,将目标区域进行划分,利用算法将目标区域的字符进行切割出来作为标签字符的数据集,标签的数据集又分为训练集、验证机和测试集;
如图2所述,为切割出来的标签字符。本发明的数据集字母,符号分为
大写字母A,B,C,D,E,F,G,H,I,J,K,L,M,N,O,P,Q,R,S,T,U,V,W,Y;
小写字母a,b,c,d,e,f,g,h,I,j,k,l,m,n,o,p,q,r,s,t,u,v,w,x,y,z;
数字1,2,3,4,5,6,7,8,9,0,标签字符为上述字符的组合。条件允许的情况下,数据集大小应该是越大越好,数据集越大对于训练会有帮助。在实际中,数据集的制作方法不局限于本方法,可使用别的方法来制作数据。
S2:所述步骤S1算法分割出来的每一张字符都需采取归一化操作,保持一样的大小和格式,并且给定对应的标签,所述步骤S1的数据集分为训练集、验证集和测试集比例约为5:1:1。
S3:利用步骤S2所述改进的感知机对于S1制作的数据集进行测试,实现药品上标签字符的识别改进;
感知机引入的Droupout结构,每个节点消失的概率P=
0.5-a/2A(a>=0.5A),
0.5+(0.5-a/4A)(a<0.5A)
其中A为当前迭代次数,a为当前该节点消失的次数。即每个节点消失概率设置为0.5,随着节点消失越多,起赋予的消失概率越低。随着迭代次数上升,节点消失次数小于均值时,赋予其消失的概率也就越高。保证了每个节点能够尽量平均的进行丢失;
引入使用动量的随机梯度下降(SGDM)以防止陷入局部极小。其公式如下:
计算速度更新:v:=αv-∈g
计算应用更新:θ:=θ+v
其中,学习率∈,初始参数θ,动量参数α,初始速度v,梯度g。
相同或相似的标号对应相同或相似的部件;
附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制;
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
Claims (1)
1.一种基于改进多层感知机的药品字符标签的识别方法,其特征在于,包括以下步骤:
步骤S1:选取药瓶的字符标签,选取出字符标签中需要识别的区域;
步骤S2:将待识别的区域以相片的形式进行预处理,定位目标区域;
步骤S3:对目标区域进行划分,将目标区域中字符进行切割,将切割后的字符作为标签字符的数据集;
步骤S4:构建多层感知机,使用传统多层感知机作为基础,对其引入droupout以解决过拟合问题,引入使用动量的随机梯度下降以防止陷入局部极小的问题,引入ReLU 解决梯度弥散的问题;
步骤S5:将步骤S3中的数据集输入到多层感知机中进行训练以及测试;
步骤S2中图像预处理的过程包括对图像进行翻转,去噪,灰度化以及二值化处理;
所述步骤S3中切割出来的每一张字符都需采取归一化操作,保持一样的大小和格式,并且给定对应的标签;
所述步骤S4中,引入的Droupout结构,每个节点消失的概率:
其中,A为当前迭代次数,a为当前该节点消失的次数;
步骤S4引入的ReLU解决弥散的问题,即替换感知机的激活函数为一个非线性函数;
步骤S4引入的引入使用动量的随机梯度下降,其公式如下:
计算速度更新:v: =αv−ϵg
计算应用更新:θ:=θ+v
其中,学习率ϵ, 初始参数 θ, 动量参数α, 初始速度 v,梯度g;
在步骤S5中,将步骤S3中得到的数据集划分为训练集,验证集以及测试集,先将训练集的数据输入到多层感知机中进行训练,训练集采用反向传播来更新多层感知机的参数,在训练期间输入验证集进行多层感知机超参数的微调,多层感知机训练完毕后,利用测试集对多层感知机的性能进行测试,最后选择性能最佳的多层感知机进行药品标签的测试,验证其泛化能力;
数据集以比例5:1:1划分为训练集,验证集以及测试集。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910708433.5A CN110598691B (zh) | 2019-08-01 | 2019-08-01 | 一种基于改进多层感知机的药品字符标签的识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910708433.5A CN110598691B (zh) | 2019-08-01 | 2019-08-01 | 一种基于改进多层感知机的药品字符标签的识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110598691A CN110598691A (zh) | 2019-12-20 |
CN110598691B true CN110598691B (zh) | 2023-05-02 |
Family
ID=68853384
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910708433.5A Active CN110598691B (zh) | 2019-08-01 | 2019-08-01 | 一种基于改进多层感知机的药品字符标签的识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110598691B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113947616B (zh) * | 2021-09-23 | 2022-08-30 | 北京航空航天大学 | 一种基于层级化感知机的智能目标跟踪及丢失重检方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105067638A (zh) * | 2015-07-22 | 2015-11-18 | 广东工业大学 | 基于机器视觉的轮胎胎膜表面字符缺陷检测方法 |
CN107220655A (zh) * | 2016-03-22 | 2017-09-29 | 华南理工大学 | 一种基于深度学习的手写、印刷文本的分类方法 |
CN107330480A (zh) * | 2017-07-03 | 2017-11-07 | 贵州大学 | 手写字符计算机识别方法 |
CN108416348A (zh) * | 2018-01-29 | 2018-08-17 | 重庆邮电大学 | 基于支持向量机和卷积神经网络的车牌定位识别方法 |
CN109559298A (zh) * | 2018-11-14 | 2019-04-02 | 电子科技大学中山学院 | 一种基于深度学习的乳液泵缺陷检测的方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10049103B2 (en) * | 2017-01-17 | 2018-08-14 | Xerox Corporation | Author personality trait recognition from short texts with a deep compositional learning approach |
-
2019
- 2019-08-01 CN CN201910708433.5A patent/CN110598691B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105067638A (zh) * | 2015-07-22 | 2015-11-18 | 广东工业大学 | 基于机器视觉的轮胎胎膜表面字符缺陷检测方法 |
CN107220655A (zh) * | 2016-03-22 | 2017-09-29 | 华南理工大学 | 一种基于深度学习的手写、印刷文本的分类方法 |
CN107330480A (zh) * | 2017-07-03 | 2017-11-07 | 贵州大学 | 手写字符计算机识别方法 |
CN108416348A (zh) * | 2018-01-29 | 2018-08-17 | 重庆邮电大学 | 基于支持向量机和卷积神经网络的车牌定位识别方法 |
CN109559298A (zh) * | 2018-11-14 | 2019-04-02 | 电子科技大学中山学院 | 一种基于深度学习的乳液泵缺陷检测的方法 |
Non-Patent Citations (2)
Title |
---|
"Modified Convolutional Neural Network Based on Dropout and the Stochastic Gradient Descent Optimizer";Jing Yang et al.;《Algorithms》;20180307;第11卷(第28期);全文 * |
"基于卷积神经网络的小麦叶部病害图像识别研究";林中琦;《中国优秀硕士学位论文全文数据库 (信息科技辑)》;20180815(第08期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN110598691A (zh) | 2019-12-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | Dense U-net based on patch-based learning for retinal vessel segmentation | |
Rastgoo et al. | Multi-modal deep hand sign language recognition in still images using restricted Boltzmann machine | |
CN107680579B (zh) | 文本正则化模型训练方法和装置、文本正则化方法和装置 | |
Tomás et al. | Incorrect facemask-wearing detection using convolutional neural networks with transfer learning | |
Delgado-Ortet et al. | A deep learning approach for segmentation of red blood cell images and malaria detection | |
Liu et al. | Segmentation of white blood cells through nucleus mark watershed operations and mean shift clustering | |
Abdallah et al. | Attention-based fully gated CNN-BGRU for Russian handwritten text | |
Schlesinger | Cognitive attitudes in relation to susceptibility to interference | |
CN107291697A (zh) | 一种语义分析方法、电子设备、存储介质及其诊断系统 | |
CN110598691B (zh) | 一种基于改进多层感知机的药品字符标签的识别方法 | |
Benato et al. | Semi-supervised learning with interactive label propagation guided by feature space projections | |
Zin et al. | Handwritten character recognition on android for basic education using convolutional neural network | |
CN106919794A (zh) | 面向多数据源的药品类实体识别方法及装置 | |
Chaabouni et al. | Fractal and multi-fractal for arabic offline writer identification | |
CN115392256A (zh) | 一种基于语义分割的药物不良事件关系抽取方法 | |
Ghosh et al. | Text/non-text separation from handwritten document images using LBP based features: An empirical study | |
Wang et al. | A novel method of aircraft detection based on high-resolution panchromatic optical remote sensing images | |
Cilia et al. | An experimental comparison between deep learning and classical machine learning approaches for writer identification in medieval documents | |
Abdani et al. | Group and shuffle convolutional neural networks with pyramid pooling module for automated pterygium segmentation | |
Knüpfer et al. | A machine learning approach to determine bubble sizes in foam at a transparent wall | |
Adibhatla et al. | Unsupervised anomaly detection in printed circuit boards through student–teacher feature pyramid matching | |
Liu et al. | A convolutional recurrent neural-network-based machine learning for scene text recognition application | |
Yasin et al. | Severity grading and early retinopathy lesion detection through hybrid inception-ResNet architecture | |
Lei et al. | Segmented embedded rapid defect detection method for bearing surface defects | |
Umair et al. | A multi-layer holistic approach for cursive text recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |