CN109086771A - 一种光学字符识别方法 - Google Patents

一种光学字符识别方法 Download PDF

Info

Publication number
CN109086771A
CN109086771A CN201810933249.6A CN201810933249A CN109086771A CN 109086771 A CN109086771 A CN 109086771A CN 201810933249 A CN201810933249 A CN 201810933249A CN 109086771 A CN109086771 A CN 109086771A
Authority
CN
China
Prior art keywords
training set
pulse
converted
input
neuron
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810933249.6A
Other languages
English (en)
Other versions
CN109086771B (zh
Inventor
李建平
顾小丰
胡健
张马路
薛庆弢
苌浩阳
李顺利
蒋胜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201810933249.6A priority Critical patent/CN109086771B/zh
Publication of CN109086771A publication Critical patent/CN109086771A/zh
Application granted granted Critical
Publication of CN109086771B publication Critical patent/CN109086771B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0463Neocognitrons
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/063Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Neurology (AREA)
  • Character Discrimination (AREA)

Abstract

本发明公开了光学字符识别方法,其包括以下步骤:S1、将已知字符内容的光学图像进行相位编码转换为输入神经元;S2、将每个输入神经元转换为脉冲序列;S3、将得到的脉冲序列随机加入抖动强度为2ms的高斯噪声,得到输入脉冲序列;S4、将输入脉冲转换为脉冲感知神经元,并选出正样本训练集和负样本训练集;S5、通过感知机得到更新权值;S6、根据更新权值调整spiking神经网络,得到新的spiking神经网络;S7、采用新的spiking神经网络对待识别光学字符进行识别。本发明将将其负样本选取方式由原来的随机选取方式改变为选取驻点作为负样本的方式,并对学习规则作出相应调整,使得本发明的识别效率更高。

Description

一种光学字符识别方法
技术领域
本发明涉及字符识别领域,具体涉及一种光学字符识别方法。
背景技术
光学字符识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程,即针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。如何除错或利用辅助信息提高识别正确率,是光学字符识别中的重点和难点。
发明内容
针对现有技术中的上述不足,本发明提供的一种光学字符识别方法提高了光学字符的识别效率的问题。
为了达到上述发明目的,本发明采用的技术方案为:
提供一种光学字符识别方法,其包括以下步骤:
S1、将已知字符内容的光学图像进行相位编码转换为输入神经元;
S2、将每个输入神经元添加1%-25%的随机反转噪声后转换为脉冲序列;
S3、将得到的脉冲序列随机加入抖动强度为2ms的高斯噪声,得到输入脉冲序列;
S4、将输入脉冲转换为脉冲感知神经元,并选出正样本训练集和负样本训练集;
S5、通过感知机训练正样本训练集和负样本训练集并得到更新权值;
S6、根据更新权值调整spiking神经网络,得到新的spiking神经网络;
S7、将待识别样本输入到新的spiking神经网络中,得到对应的识别结果,完成光学字符的识别。
进一步地,步骤S1的具体方法为:
将已知字符内容的N个光学图像进行相位编码转换为40N个输入神经元,并将输出设定为N个类别,分别对应N个光学图像。
进一步地,步骤S4的具体方法为:
将输入脉冲转换为脉冲感知神经元,并根据公式
得到由期望的spiking神经元输出序列,并将其作为正样本训练集;其中为期望的脉冲发放时间,为在td时刻的膜电压,表示该样本集为由期望的点火时刻所组成的正样本集合
根据公式
得到负样本训练集,其中EPs为Spiking脉冲神经网络曲线中的驻点,表示该样本集为所有EPs组成的不期望点火时刻的负样本集合
进一步地,步骤S5的具体方法为:
通过感知机训练模型
训练正样本训练集和负样本训练集,得到更新权值Wnew;其中Wold为更新前的权值,为在td时刻的膜电压,表示硬限制函数;并且表示不期望点火而点火的情况,β1为该情况下的学习率;而并且表示期望点火却没有达到点火的情况,β2为该情况下的学习率;时,表示实际情况与期望情况一致,不需要调整权值。
本发明的有益效果为:本发明将改进的基于离线特性的Spiking神经网络应用到光学字符识别中,另外通过EMPD学习算法监控驻点的方式对PBSNLR学习算法进行改进,将其负样本选取方式由原来的随机选取方式改变为选取驻点作为负样本的方式,并对学习规则作出相应调整,使得本发明的识别效率更高。
附图说明
图1为本发明的流程示意图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
如图1所示,该光学字符识别方法包括以下步骤:
S1、将已知字符内容的光学图像进行相位编码转换为输入神经元;
S2、将每个输入神经元添加1%-25%的随机反转噪声后转换为脉冲序列;
S3、将得到的脉冲序列随机加入抖动强度为2ms的高斯噪声,得到输入脉冲序列;
S4、将输入的脉冲序列的监督学习转换为分类学习,即将输入脉冲转换为脉冲感知神经元,并选出正样本训练集和负样本训练集;
S5、通过感知机训练正样本训练集和负样本训练集并得到更新权值;
S6、根据更新权值调整spiking神经网络,得到新的spiking神经网络;
S7、将待识别样本输入到新的spiking神经网络中,根据待识别样本在新的spiking神经网络中的输出与已知内容的光学图像的相似度,选择相似度最高的光学图像对应的内容作为其识别结果,完成光学字符的识别。
步骤S1的具体方法为:将已知字符内容的N个光学图像进行相位编码转换为40N个输入神经元,并将输出设定为N个类别,分别对应N个光学图像。
步骤S4的具体方法为:将输入脉冲转换为脉冲感知神经元,并根据公式
得到由期望的spiking神经元输出序列,并将其作为正样本训练集;其中为期望的脉冲发放时间,为在td时刻的膜电压,表示该样本集为由期望的点火时刻所组成的正样本集合
根据公式
得到负样本训练集,其中EPs为Spiking脉冲神经网络曲线中的驻点,表示该样本集为所有EPs组成的不期望点火时刻的负样本集合
步骤S5的具体方法为:通过感知机训练模型
训练正样本训练集和负样本训练集,得到更新权值Wnew;其中Wold为更新前的权值,为在td时刻的膜电压,表示硬限制函数;并且表示不期望点火而点火的情况,β1为该情况下的学习率;而并且表示期望点火却没有达到点火的情况,β2为该情况下的学习率;时,表示实际情况与期望情况一致,不需要调整权值。
综上所述,本发明将改进的基于离线特性的Spiking神经网络应用到光学字符识别中,另外通过EMPD学习算法监控驻点的方式对PBSNLR学习算法进行改进,将其负样本选取方式由原来的随机选取方式改变为选取驻点作为负样本的方式,并对学习规则作出相应调整,使得本发明的识别效率更高。

Claims (4)

1.一种光学字符识别方法,其特征在于:包括以下步骤:
S1、将已知字符内容的光学图像进行相位编码转换为输入神经元;
S2、将每个输入神经元添加1%-25%的随机反转噪声后转换为脉冲序列;
S3、将得到的脉冲序列随机加入抖动强度为2ms的高斯噪声,得到输入脉冲序列;
S4、将输入脉冲转换为脉冲感知神经元,并选出正样本训练集和负样本训练集;
S5、通过感知机训练正样本训练集和负样本训练集并得到更新权值;
S6、根据更新权值调整spiking神经网络,得到新的spiking神经网络;
S7、将待识别样本输入到新的spiking神经网络中,得到对应的识别结果,完成光学字符的识别。
2.根据权利要求1所述的光学字符识别方法,其特征在于:所述步骤S1的具体方法为:
将已知字符内容的N个光学图像进行相位编码转换为40N个输入神经元,并将输出设定为N个类别,分别对应N个光学图像。
3.根据权利要求2所述的光学字符识别方法,其特征在于:所述步骤S4的具体方法为:
将输入脉冲转换为脉冲感知神经元,并根据公式
得到由期望的spiking神经元输出序列,并将其作为正样本训练集;其中为期望的脉冲发放时间,为在td时刻的膜电压,表示该样本集为由期望的点火时刻所组成的正样本集合
根据公式
得到负样本训练集,其中EPs为Spiking脉冲神经网络曲线中的驻点,表示该样本集为所有EPs组成的不期望点火时刻的负样本集合
4.根据权利要求3所述的光学字符识别方法,其特征在于:所述步骤S5的具体方法为:
通过感知机训练模型
训练正样本训练集和负样本训练集,得到更新权值Wnew;其中Wold为更新前的权值,为在td时刻的膜电压,表示硬限制函数;并且表示不期望点火而点火的情况,β1为该情况下的学习率;而并且表示期望点火却没有达到点火的情况,β2为该情况下的学习率;时,表示实际情况与期望情况一致,不需要调整权值。
CN201810933249.6A 2018-08-16 2018-08-16 一种光学字符识别方法 Active CN109086771B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810933249.6A CN109086771B (zh) 2018-08-16 2018-08-16 一种光学字符识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810933249.6A CN109086771B (zh) 2018-08-16 2018-08-16 一种光学字符识别方法

Publications (2)

Publication Number Publication Date
CN109086771A true CN109086771A (zh) 2018-12-25
CN109086771B CN109086771B (zh) 2021-06-08

Family

ID=64793459

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810933249.6A Active CN109086771B (zh) 2018-08-16 2018-08-16 一种光学字符识别方法

Country Status (1)

Country Link
CN (1) CN109086771B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111046865A (zh) * 2019-12-12 2020-04-21 电子科技大学 基于膜电压驱动的spiking神经元监督学习模型的光学字符识别方法
CN113408618A (zh) * 2021-06-18 2021-09-17 电子科技大学 一种基于R-Multi-parameter PBSNLR模型的图像分类方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101183430A (zh) * 2007-12-13 2008-05-21 中国科学院合肥物质科学研究院 一种基于模块神经网络sn9701矩阵列的手写体数字自动识别方法
WO2010075310A2 (en) * 2008-12-26 2010-07-01 Five Apes, Inc. Neural network based pattern recognizer
CN103226196A (zh) * 2013-05-17 2013-07-31 重庆大学 基于稀疏特征的雷达目标识别方法
US20130304683A1 (en) * 2010-01-19 2013-11-14 James Ting-Ho Lo Artificial Neural Networks based on a Low-Order Model of Biological Neural Networks
CN104933722A (zh) * 2015-06-29 2015-09-23 电子科技大学 一种基于Spiking-卷积网络模型的图像边缘检测方法
US9193075B1 (en) * 2010-08-26 2015-11-24 Brain Corporation Apparatus and methods for object detection via optical flow cancellation
CN105989376A (zh) * 2015-02-06 2016-10-05 展讯通信(上海)有限公司 一种基于神经网络的手写识别系统、装置和移动终端
EP2849083A4 (en) * 2012-05-10 2017-05-03 Consejo Superior De Investigaciones Científicas (CSIC) Method and system for converting pulsed-processing neural network with instantaneous integration synapses into dynamic integration synapses
CN107392136A (zh) * 2017-07-17 2017-11-24 河海大学常州校区 一种基于特征自适应震荡衰减的签名真伪性鉴别系统
CN107766326A (zh) * 2017-10-17 2018-03-06 云南财经大学 一种非语言图形符号交流的方法
WO2018102815A1 (en) * 2016-12-02 2018-06-07 Thomas Jefferson University Signal processing method for distinguishing and characterizing high-frequency oscillations

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101183430A (zh) * 2007-12-13 2008-05-21 中国科学院合肥物质科学研究院 一种基于模块神经网络sn9701矩阵列的手写体数字自动识别方法
WO2010075310A2 (en) * 2008-12-26 2010-07-01 Five Apes, Inc. Neural network based pattern recognizer
US20130304683A1 (en) * 2010-01-19 2013-11-14 James Ting-Ho Lo Artificial Neural Networks based on a Low-Order Model of Biological Neural Networks
US9193075B1 (en) * 2010-08-26 2015-11-24 Brain Corporation Apparatus and methods for object detection via optical flow cancellation
EP2849083A4 (en) * 2012-05-10 2017-05-03 Consejo Superior De Investigaciones Científicas (CSIC) Method and system for converting pulsed-processing neural network with instantaneous integration synapses into dynamic integration synapses
CN103226196A (zh) * 2013-05-17 2013-07-31 重庆大学 基于稀疏特征的雷达目标识别方法
CN105989376A (zh) * 2015-02-06 2016-10-05 展讯通信(上海)有限公司 一种基于神经网络的手写识别系统、装置和移动终端
CN104933722A (zh) * 2015-06-29 2015-09-23 电子科技大学 一种基于Spiking-卷积网络模型的图像边缘检测方法
WO2018102815A1 (en) * 2016-12-02 2018-06-07 Thomas Jefferson University Signal processing method for distinguishing and characterizing high-frequency oscillations
CN107392136A (zh) * 2017-07-17 2017-11-24 河海大学常州校区 一种基于特征自适应震荡衰减的签名真伪性鉴别系统
CN107766326A (zh) * 2017-10-17 2018-03-06 云南财经大学 一种非语言图形符号交流的方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
MALU ZHANG等: "EMPD: An Efficient Membrane Potential Driven Supervised Learning Algorithm for Spiking Neurons", 《IEEE TRANSACTIONS ON COGNITIVE AND DEVELOPMENTAL SYSTEMS》 *
YAN XU 等: "A New Supervised Learning Algorithm for Spiking Neurons", 《NEURAL COMPUTATION》 *
胡雷: "基于神经网络的时序信息识别研究", 《中国优秀硕士学位论文全文数据 信息科技辑》 *
胡雷: "基于神经网络的时序信息识别研究", 《中国秀硕士学位论文全文数据库 信息科技辑》 *
陈丽娟: "基于脉冲神经网络的车牌定位算法", 《中国高新技术企业》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111046865A (zh) * 2019-12-12 2020-04-21 电子科技大学 基于膜电压驱动的spiking神经元监督学习模型的光学字符识别方法
CN113408618A (zh) * 2021-06-18 2021-09-17 电子科技大学 一种基于R-Multi-parameter PBSNLR模型的图像分类方法
CN113408618B (zh) * 2021-06-18 2023-04-18 电子科技大学 一种基于R-Multi-parameter PBSNLR模型的图像分类方法

Also Published As

Publication number Publication date
CN109086771B (zh) 2021-06-08

Similar Documents

Publication Publication Date Title
CN109840531B (zh) 训练多标签分类模型的方法和装置
Razmjooy et al. Imperialist competitive algorithm-based optimization of neuro-fuzzy system parameters for automatic red-eye removal
US9619749B2 (en) Neural network and method of neural network training
CN110009057B (zh) 一种基于深度学习的图形验证码识别方法
Smelyakov et al. Braille character recognition based on neural networks
CN110472688A (zh) 图像描述的方法及装置、图像描述模型的训练方法及装置
RU2707147C1 (ru) Обучение нейронной сети посредством специализированных функций потерь
CN113505854B (zh) 一种人脸图像质量评价模型构建方法、装置、设备及介质
CN111651762A (zh) 一种基于卷积神经网络的pe恶意软件检测方法
CN109086771A (zh) 一种光学字符识别方法
CN110210468A (zh) 一种基于卷积神经网络特征融合迁移的文字识别方法
CN111028203B (zh) 一种基于显著性的cnn盲图像质量评估方法
CN105975497A (zh) 微博话题自动推荐方法及装置
Bulat et al. Lasp: Text-to-text optimization for language-aware soft prompting of vision & language models
CN115631365A (zh) 一种融合知识图谱的跨模态对比零样本学习方法
CN112464816A (zh) 基于二次迁移学习的地方手语识别方法、装置
Hu et al. Toward driver face recognition in the intelligent traffic monitoring systems
CN108345901A (zh) 一种基于自编码神经网络的符号图节点分类方法
CN110717525A (zh) 一种通道自适应优化的对抗攻击防御方法和装置
CN114548256A (zh) 一种基于对比学习的小样本珍稀鸟类识别方法
Bulat et al. LASP: Text-to-Text Optimization for Language-Aware Soft Prompting of Vision & Language Models
CN116563410A (zh) 基于两级生成对抗网络的电气设备电火花图像生成方法
CN115994224A (zh) 基于预训练语言模型的钓鱼url检测方法及系统
CN111814917B (zh) 一种存在模糊态的字轮图像数字识别方法
CN113792659A (zh) 文档识别方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant