CN111435445A - 字符识别模型的训练方法及装置、字符识别方法及装置 - Google Patents

字符识别模型的训练方法及装置、字符识别方法及装置 Download PDF

Info

Publication number
CN111435445A
CN111435445A CN201911347934.1A CN201911347934A CN111435445A CN 111435445 A CN111435445 A CN 111435445A CN 201911347934 A CN201911347934 A CN 201911347934A CN 111435445 A CN111435445 A CN 111435445A
Authority
CN
China
Prior art keywords
training
character
character recognition
target
recognition model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911347934.1A
Other languages
English (en)
Inventor
邓练兵
杨兴
吴浩清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhuhai Dahengqin Technology Development Co Ltd
Original Assignee
Zhuhai Dahengqin Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhuhai Dahengqin Technology Development Co Ltd filed Critical Zhuhai Dahengqin Technology Development Co Ltd
Priority to CN201911347934.1A priority Critical patent/CN111435445A/zh
Publication of CN111435445A publication Critical patent/CN111435445A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种字符识别模型的训练方法及装置、字符识别方法及装置,该字符识别模型的训练方法包括:获取训练样本,所述训练样本中包含具有字符的正样本图像及不具有字符的负样本图像;对所述训练样本进行分割,得到目标训练字符;根据所述目标训练字符提取第一目标训练特征;根据所述第一目标训练特征对深度可分离卷积神经网络模型进行训练,得到深度可分离卷积字符识别模型。本发明通过采用深度可分离卷积神经网络模型,可以实现空间信息和深度信息解耦合,减少网络参数量,提高训练准确率。

Description

字符识别模型的训练方法及装置、字符识别方法及装置
技术领域
本发明涉及识别技术领域,具体涉及一种字符识别模型的训练方法及装置、字符识别方法及装置。
背景技术
随着计算机的发展,信息技术也飞速发展,图像作为信息技术中的重要传播载体,在信息的传播中占有非常重要的地位,然而计算机并不能像人类一样通过视觉直接获取图像中所包含的信息,从而图像信息识别为文本信息这一过程对于计算机理解图像具有重要的意义。
传统的字符识别算法包含了大量的手工特征提取的过程,提取过程复杂且缓慢,而基于卷积神经网络的特征提取可以直接对图像进行处理,自动提取特征,但是提取过程网络参数量巨大,训练过程复杂,训练速度慢,训练准确率低。
发明内容
因此,本发明要解决的技术问题在于克服现有技术中的基于卷积神经网络对特征提取时网络参数量大的缺陷,从而提供一种字符识别模型的训练方法及装置、字符识别方法及装置。
根据第一方面,本发明实施例公开了一种字符识别模型的训练方法,包括如下步骤:获取训练样本,所述训练样本中包含具有字符的正样本图像及不具有字符的负样本图像;对所述训练样本进行分割,得到目标训练字符;根据所述目标训练字符提取第一目标训练特征;根据所述第一目标训练特征对深度可分离卷积神经网络模型进行训练,得到深度可分离卷积字符识别模型。
结合第一方面,在第一方面第一实施方式中,在所述对所述训练样本进行分割,得到目标训练字符之前,还包括:确定所述训练样本中字符倾斜度;当所述字符倾斜度不满足第一预设条件时,对所述训练样本进行倾斜矫正。
结合第一方面第一实施方式,在第一方面第二实施方式中,在根据所述第一目标训练特征对深度可分离卷积神经网络模型进行训练,得到深度可分离卷积字符识别模型之后,还包括:获取字符图像测试样本,所述字符图像测试样本中包含具有字符的正样本图像及不具有字符的负样本图像;根据所述字符图像测试样本提取第一测试特征;根据所述第一测试特征对所述深度可分离卷积字符识别模型进行测试,得到第一测试结果;当所述第一测试结果满足第二预设条件时,将所述深度可分离卷积字符识别模型确定为可用的深度可分离卷积字符识别模型。
根据第二方面,本发明实施例还公开了一种字符识别方法,包括如下步骤:获取待识别字符图像;对所述待识别字符图像进行分割,得到目标识别字符;根据所述目标识别字符提取目标识别特征;根据深度可分离卷积字符识别模型对所述目标识别特征进行识别,得到字符识别结果;所述深度可分离卷积字符识别模型为根据第一方面或第一方面任一实施方式所述的字符识别模型的训练方法训练得到;将所述字符识别结果进行组合,得到待识别字符。
根据第三方面,本发明实施例还公开了一种字符识别模型的训练装置,包括:第一获取模块,用于获取训练样本,所述训练样本中包含具有字符的正样本图像及不具有字符的负样本图像;第一分割模块,用于对所述训练样本进行分割,得到目标训练字符;第一提取模块,用于根据所述目标训练字符提取第一目标训练特征;训练模块,用于根据所述第一目标训练特征对深度可分离卷积神经网络模型进行训练,得到深度可分离卷积字符识别模型。
结合第三方面,在第三方面第一实施方式中,所述装置还包括:第一确定模块,用于确定所述训练样本中字符倾斜度;矫正模块,用于当所述字符倾斜度不满足第一预设条件时,对所述训练样本进行倾斜矫正。
结合第三方面第一实施方式,在第三方面第二实施方式中,所述装置还包括:第二获取模块,用于获取字符图像测试样本,所述字符图像测试样本中包含具有字符的正样本图像及不具有字符的负样本图像;第二提取模块,用于根据所述字符图像测试样本提取第一测试特征;测试模块,用于根据所述第一测试特征对所述深度可分离卷积字符识别模型进行测试,得到第一测试结果;第二确定模块,用于当所述第一测试结果满足第二预设条件时,将所述深度可分离卷积字符识别模型确定为可用的深度可分离卷积字符识别模型。
根据第四方面,本发明实施例还公开了一种字符识别装置,包括:第三获取模块,用于获取待识别字符图像;第三分割模块,用于对所述待识别字符图像进行分割,得到目标识别字符;第三提取模块,用于根据所述目标识别字符提取目标识别特征;识别模块,用于根据深度可分离卷积字符识别模型对所述目标识别特征进行识别,得到字符识别结果;所述深度可分离卷积字符识别模型为根据第一方面或第一方面任一实施方式所述的字符识别模型的训练方法训练得到;组合模块,用于将所述字符识别结果进行组合,得到待识别字符。
根据第五方面,本发明实施例还公开了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行如第一方面或第一方面任一实施方式所述字符识别模型的训练方法或如第二方面或第二方面任一实施方式所述的字符识别方法。
根据第六方面,本发明实施例还公开了一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现如第一方面或第一方面任一实施方式所述字符识别模型的训练方法或如第二方面或第二方面任一实施方式所述的字符识别方法。
本发明技术方案,具有如下优点:
1.本发明提供的字符识别模型的训练方法及装置,通过获取训练样本,训练样本中包含具有字符的正样本图像及不具有字符的负样本图像;对训练样本进行分割,得到目标训练字符;根据目标训练字符提取第一目标训练特征;根据第一目标训练特征对深度可分离卷积神经网络模型进行训练,得到深度可分离卷积字符识别模型,可以实现空间信息和深度信息解耦合,减少网络参数量,提高训练准确率。
2.本发明提供的字符识别方法及装置,通过获取待识别字符图像,对待识别字符图像进行分割,得到目标识别字符,根据目标识别字符提取目标识别特征,根据深度可分离卷积字符识别模型对目标识别特征进行识别,得到字符识别结果,减少了网络的参数量,提高字符识别准确率。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例1中字符识别模型的训练方法的一个具体示例的流程图;
图2为本发明实施例2中字符识别方法的一个具体示例的流程图;
图3为本发明实施例3中字符识别模型的训练装置的一个具体示例的原理框图;
图4为本发明实施例4中字符识别装置的一个具体示例的原理框图;
图5为本发明实施例5、6中电子终端的一个具体示例图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
实施例1
本实施例提供一种字符识别模型的训练方法,如图1所示,包括如下步骤:
S11:获取训练样本,训练样本中包含具有字符的正样本图像及不具有字符的负样本图像。
示例性地,图像样本可以是由某一路段监控视频拍摄的视频中解帧获取,也可以是在搜索引擎中搜索得到,该训练样本可以是获取到的图像样本中随机划分出的一部分,比如,随机划分出70%的图像样本作为训练样本。为了提高了训练准确性,获取的训练样本需要保证数据的多样性,比如,训练样本中字符种类、字符颜色等具有多样性以及图像背景具有多样性。本实施例对训练样本获取方式不做限定,本领域技术人员可以根据实际需要确定。
S12:对训练样本进行分割,得到目标训练字符。
示例性地,该训练样本中的目标训练字符包括汉字、英文字母以及数字,对字符图像进行分割,得到上述目标训练字符,字符分割方法可以为基于投影的基本字段分割和基于结构特征的字符分割方法,其中,基于投影的基本字段分割使用垂直或水平投影,先对字符图像进行二值化处理,再在水平或垂直上进行投影,通过对字符的长宽比,投影信息综合对字符进行切分;基于结构特征的字符分割使用字符结构上的特征点来进行分割,主要对于字符的一些局部极值、拐角点的特征、点间距和轮廓变化程度等特征进行字符分析。本发明实施例对字符分割方法不做限定,本领域技术人员可以根据实际情况选择。
S13:根据目标训练字符提取第一目标训练特征。
示例性地,该第一目标训练特征可以为字符的类型、字符的尺寸、字符的颜色等。本发明实施例对该第一目标训练特征不作具体限定,本领域技术人员可以根据实际需要设定。
S14:根据第一目标训练特征对深度可分离卷积神经网络模型进行训练,得到深度可分离卷积字符识别模型。
示例性地,将第一目标训练特征输入到深度可分离卷积神经网络模型中,对深度可分离卷积神经网络模型进行有监督或无监督的训练,通过第一目标特征不断调整深度可分离卷积神经网络模型的各个权值,进行训练优化,得到深度可分离卷积字符识别模型。深度可分离卷积将通道相关性和空间相关性去耦合,将通道相关性和空间相关性分开映射,即将传统的卷积操作改为两层的卷积操作,也即将原本标准的卷积操作因式分解成一个3*3的depthwise convolution和一个1*1的pointwise convolution操作,减少了网络参数量,提高训练准确率。
本发明提供的字符识别模型的训练方法,通过获取训练样本,训练样本中包含具有字符的正样本图像及不具有字符的负样本图像,对训练样本进行分割,得到目标训练字符,根据目标训练字符提取第一目标训练特征;根据第一目标训练特征对深度可分离卷积神经网络模型进行训练,得到深度可分离卷积字符识别模型,可以实现空间信息和深度信息解耦合,减少网络参数量,提高训练准确率。
作为本申请一个可选实施方式,在步骤S12之前,该字符识别模型的训练方法还包括:
首先,确定训练样本中字符倾斜度。
示例性地,该字符倾斜度可以为当前所得到的训练样本相对于水平线或竖直线的倾斜度,其可采用倾斜角度进行表示,该倾斜角度可以为训练样本的底边与水平线的夹角,也可以为训练样本的竖直边与竖直线的夹角。本发明实施例对该倾斜角度的表示不作限定,可以根据实际情况设定。
其次,当字符倾斜度不满足第一预设条件时,对训练样本进行倾斜矫正。
示例性地,该第一预设条件可以设置为该字符倾斜度小于或等于预设值,也可以设置为该倾斜角度在预设范围内;该预设值可以设置为3o或5o,该预设范围可以设置为2o-4o,本发明实施例对该第一预设条件及预设值和预设范围不作限定,本领域技术人员可以根据实际情况设定。
当字符倾斜度大于预设值或字符倾斜度不在预设范围内时,需要对训练样本进行倾斜矫正,该倾斜矫正方法可以采用图像旋转,即将倾斜的字符图像旋转到水平,图像的旋转点可以为图像中心点,也可以基于图像的顶点,本发明实施例对该图像旋转点不作限定,本领域技术人员可以根据图像实际情况进行选择。
作为本申请一个可选实施方式,在步骤S14之后,该字符识别模型的训练方法还包括:
首先,获取字符图像测试样本,字符图像测试样本中包含具有字符的正样本图像及不具有字符的负样本图像。
示例性地,获取字符图像测试样本的方式可以是步骤S11中获取到的图像样本中随机划分出的一部分,比如不同于训练样本的剩余30%作为字符图像测试样本。本实施例对字符图像测试样本的获取方式不做限定,可以根据需要确定。
其次,根据字符图像测试样本提取第一测试特征。
示例性地,该第一测试特征可以与上述第一目标训练特征一样,提高检测准确率,具体实施方式见实施例1中步骤“根据目标训练字符提取第一目标训练特征”,在此不再赘述。
再次,根据第一测试特征对深度可分离卷积字符识别模型进行测试,得到第一测试结果。
示例性地,本发明实施例用该第一测试特征去评估深度可分离卷积字符识别模型的好坏,将第二测试特征输入到深度可分离卷积字符识别模型中,得到第二测试结果,将第一测试结果与实际输出结果进行比较,来判断该深度可分离卷积字符识别模型的好坏。
最后,当第一测试结果满足第二预设条件时,将深度可分离卷积字符识别模型确定为可用的深度可分离卷积字符识别模型。
示例性地,该第二预设条件可以为正确识别的个数占所有样本个数的比例,例如该字符图像测试样本中字符图像为100个,识别正确的样本个数为95个,则可以将该深度可分离卷积字符识别模型确定为可用的深度可分离卷积字符识别模型。本申请实施例对第二预设条件不作限定,本领域技术人员可以根据实际使用需要确定。
实施例2
本发明实施例还提供一种字符识别方法,如图2所示,包括如下步骤:
S21:获取待识别字符图像。
示例性地,该待识别字符图像可以是通过道路摄像头实时捕获的图像,也可以是预先拍摄好存储在终端,进行识别时从终端调用的图像,本发明实施例对该待识别字符图像的获取不作限定,本领域技术人员可以根据实际情况选择。
S22:对待识别字符图像进行分割,得到目标识别字符。具体实现方式见实施例1中步骤S12,在此不再赘述。
S23:根据目标识别字符提取目标识别特征。具体实现方式见实施例1中步骤S13,在此不再赘述。
S24:根据深度可分离卷积字符识别模型对目标识别特征进行识别,得到字符识别结果。
示例性地,该深度可分离卷积字符识别模型是由实施例1中深度可分离卷积字符识别模型训练方法得到的,将目标识别特征输入到深度可分离卷积字符识别模型中进行识别,得到字符识别结果。
S25:将字符识别结果进行组合,得到待识别字符。
本发明提供的字符识别方法及装置,通过获取待识别字符图像,对待识别字符图像进行分割,得到目标识别字符,根据目标识别字符提取目标识别特征,根据深度可分离卷积字符识别模型对目标识别特征进行识别,得到字符识别结果,减少了网络的参数量,提高字符识别准确率。
作为本申请一个可选实施方式,在步骤S22之前,该方法还包括:
首先,确定目标识别字符图像中字符倾斜度。具体实现方式见实施例1中步骤“确定字符图像中字符倾斜度”,在此不再赘述。
其次,当字符倾斜度不满足第一预设条件时,对目标识别字符图像进行倾斜矫正。具体实现方式见实施例1中步骤“当字符倾斜度不满足第一预设条件时,对字符图像进行倾斜矫正”,在此不再赘述。
实施例3
本发明实施例还提供一种字符识别模型的训练装置,如图3所示,包括:
第一获取模块31,用于获取训练样本,训练样本中包含具有字符的正样本图像及不具有字符的负样本图像;具体实现方式见实施例1中步骤S11,在此不再赘述。
第一分割模块32,用于对训练样本进行分割,得到目标训练字符;具体实现方式见实施例1中步骤S12,在此不再赘述。
第一提取模块33,用于根据目标训练字符提取第一目标训练特征;具体实现方式见实施例1中步骤S13,在此不再赘述。
第二训练模块34,用于根据第一目标训练特征对深度可分离卷积神经网络模型进行训练,得到深度可分离卷积字符识别模型。具体实现方式见实施例1中步骤S14,在此不再赘述。
本发明提供的字符识别模型的训练装置,通过获取训练样本,训练样本中包含具有字符的正样本图像及不具有字符的负样本图像;对训练样本进行分割,得到目标训练字符;根据目标训练字符提取第一目标训练特征;根据第一目标训练特征对深度可分离卷积神经网络模型进行训练,得到深度可分离卷积字符识别模型,可以实现空间信息和深度信息解耦合,减少网络参数量,提高训练准确率。
作为本申请一个可选实施方式,该装置还包括:
第一确定模块,用于确定训练样本中字符倾斜度;具体实现方式见实施例1中对应的步骤,在此不再赘述。
矫正模块,用于当字符倾斜度不满足第一预设条件时,对训练样本进行倾斜矫正。具体实现方式见实施例1中对应的步骤,在此不再赘述。
作为本申请一个可选实施方式,该装置还包括:
第二获取模块,用于获取字符图像测试样本,字符图像测试样本中包含具有字符的正样本图像及不具有字符的负样本图像;具体实现方式见实施例1中对应的步骤,在此不再赘述。
第二提取模块,用于根据字符图像测试样本提取第一测试特征;具体实现方式见实施例1中对应的步骤,在此不再赘述。
测试模块,用于根据第一测试特征对深度可分离卷积字符识别模型进行测试,得到第一测试结果;具体实现方式见实施例1中对应的步骤,在此不再赘述。
第二确定模块,用于当第一测试结果满足第二预设条件时,将深度可分离卷积字符识别模型确定为可用的深度可分离卷积字符识别模型。具体实现方式见实施例1中对应的步骤,在此不再赘述。
实施例4
本发明实施例还提供一种字符识别装置,如图4所示,包括:
第三获取模块41,用于获取待识别字符图像;具体实现方式见实施例2中步骤S21,在此不再赘述。
第三分割模块42,用于对待识别字符图像进行分割,得到目标识别字符;具体实现方式见实施例2中步骤S22,在此不再赘述。
第三提取模块43,用于根据目标识别字符提取目标识别特征;具体实现方式见实施例2中步骤S23,在此不再赘述。
识别模块44,用于根据深度可分离卷积字符识别模型对目标识别特征进行识别,得到字符识别结果;深度可分离卷积字符识别模型为根据实施例1的字符识别模型的训练方法训练得到。具体实现方式见实施例2中步骤S24,在此不再赘述。
组合模块45,用于将字符识别结果进行组合,得到待识别字符;具体实现方式见实施例2中步骤S25,在此不再赘述。
本发明提供的字符识别装置,通过获取待识别字符图像,对待识别字符图像进行分割,得到目标识别字符,根据目标识别字符提取目标识别特征,根据深度可分离卷积字符识别模型对目标识别特征进行识别,得到字符识别结果,减少了网络的参数量,提高字符识别准确率。
作为本申请一个可选实施方式,该装置还包括:
第二确定模块,用于确定目标识别字符图像中字符倾斜度;具体实现方式见实施例2中对应的步骤,在此不再赘述。
第二倾斜矫正模块,用于当字符倾斜度不满足第一预设条件时,对目标识别字符图像进行倾斜矫正。具体实现方式见实施例2中对应的步骤,在此不再赘述。
实施例5
本发明实施例还提供了一种字符识别模型训练设备,如图5所示,该电子设备可以包括处理器51和存储器52,其中处理器51和存储器52可以通过总线或者其他方式连接,图5中以通过总线连接为例。
处理器51可以为中央处理器(Central Processing Unit,CPU)。处理器51还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器52作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本发明实施例1中的字符识别模型训练方法对应的程序指令/模块(例如,图3所示的第一获取模块31、第一分割模块32、第一提取模块33和训练模块34)。处理器51通过运行存储在存储器52中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及数据处理,即实现上述方法实施例中的深度可分离卷积字符识别模型训练方法。
存储器52可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器51所创建的数据等。此外,存储器52可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器52可选包括相对于处理器51远程设置的存储器,这些远程存储器可以通过网络连接至处理器51。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个模块存储在所述存储器52中,当被所述处理器51执行时,执行如图1所示实施例1中的深度可分离卷积字符识别模型训练方法。
上述字符识别模型训练设备具体细节可以对应参阅图1所示的实施例中对应的相关描述和效果进行理解,此处不再赘述。
实施例6
本发明实施例还提供了一种字符识别设备,如图5所示,该电子设备可以包括处理器51和存储器52,其中处理器51和存储器52可以通过总线或者其他方式连接,图5中以通过总线连接为例。
处理器51可以为中央处理器(Central Processing Unit,CPU)。处理器51还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器52作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本发明实施例中的字符识别方法对应的程序指令/模块(例如,图4所示的第三获取模块41、第三分割模块42、第三提取模块43、识别模块44和组合模块45)。处理器51通过运行存储在存储器52中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及数据处理,即实现上述方法实施例2中的字符识别方法。
存储器52可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器51所创建的数据等。此外,存储器52可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器52可选包括相对于处理器51远程设置的存储器,这些远程存储器可以通过网络连接至处理器51。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个模块存储在所述存储器52中,当被所述处理器51执行时,执行如图2所示实施例中的字符识别方法。
上述字符识别设备具体细节可以对应参阅图2所示的实施例2中对应的相关描述和效果进行理解,此处不再赘述。
实施例7
本发明实施例还提供了一种计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述实施例1中的深度可分离卷积字符识别模型的训练方法。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、存储记忆体(Random Access Memory,RAM)、快闪存储器(Flash Memory)、硬盘(HardDisk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
实施例8
本发明实施例还提供了一种计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述实施例2中的字符识别方法。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、存储记忆体(RandomAccess Memory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

Claims (10)

1.一种字符识别模型的训练方法,其特征在于,包括如下步骤:
获取训练样本,所述训练样本中包含具有字符的正样本图像及不具有字符的负样本图像;
对所述训练样本进行分割,得到目标训练字符;
根据所述目标训练字符提取第一目标训练特征;
根据所述第一目标训练特征对深度可分离卷积神经网络模型进行训练,得到深度可分离卷积字符识别模型。
2.根据权利要求1所述的方法,其特征在于,在所述对所述训练样本进行分割,得到目标训练字符之前,还包括:
确定所述训练样本中字符倾斜度;
当所述字符倾斜度不满足第一预设条件时,对所述训练样本进行倾斜矫正。
3.根据权利要求2所述的方法,其特征在于,在根据所述第一目标训练特征对深度可分离卷积神经网络模型进行训练,得到深度可分离卷积字符识别模型之后,还包括:
获取字符图像测试样本,所述字符图像测试样本中包含具有字符的正样本图像及不具有字符的负样本图像;
根据所述字符图像测试样本提取第一测试特征;
根据所述第一测试特征对所述深度可分离卷积字符识别模型进行测试,得到第一测试结果;
当所述第一测试结果满足第二预设条件时,将所述深度可分离卷积字符识别模型确定为可用的深度可分离卷积字符识别模型。
4.一种字符识别方法,其特征在于,包括如下步骤:
获取待识别字符图像;
对所述待识别字符图像进行分割,得到目标识别字符;
根据所述目标识别字符提取目标识别特征;
根据深度可分离卷积字符识别模型对所述目标识别特征进行识别,得到字符识别结果;所述深度可分离卷积字符识别模型为根据权利要求1-3任一项所述的字符识别模型的训练方法训练得到;
将所述字符识别结果进行组合,得到待识别字符。
5.一种字符识别模型的训练装置,其特征在于,包括:
第一获取模块,用于获取训练样本,所述训练样本中包含具有字符的正样本图像及不具有字符的负样本图像;
第一分割模块,用于对所述训练样本进行分割,得到目标训练字符;
第一提取模块,用于根据所述目标训练字符提取第一目标训练特征;
训练模块,用于根据所述第一目标训练特征对深度可分离卷积神经网络模型进行训练,得到深度可分离卷积字符识别模型。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
第一确定模块,用于确定所述训练样本中字符倾斜度;
矫正模块,用于当所述字符倾斜度不满足第一预设条件时,对所述训练样本进行倾斜矫正。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
第二获取模块,用于获取字符图像测试样本,所述字符图像测试样本中包含具有字符的正样本图像及不具有字符的负样本图像;
第二提取模块,用于根据所述字符图像测试样本提取第一测试特征;
测试模块,用于根据所述第一测试特征对所述深度可分离卷积字符识别模型进行测试,得到第一测试结果;
第二确定模块,用于当所述第一测试结果满足第二预设条件时,将所述深度可分离卷积字符识别模型确定为可用的深度可分离卷积字符识别模型。
8.一种字符识别装置,其特征在于,包括:
第三获取模块,用于获取待识别字符图像;
第三分割模块,用于对所述待识别字符图像进行分割,得到目标识别字符;
第三提取模块,用于根据所述目标识别字符提取目标识别特征;
识别模块,用于根据深度可分离卷积字符识别模型对所述目标识别特征进行识别,得到字符识别结果;所述深度可分离卷积字符识别模型为根据权利要求1-3任一项所述的字符识别模型的训练方法训练得到;
组合模块,用于将所述字符识别结果进行组合,得到待识别字符。
9.一种电子设备,其特征在于,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行如权利要求1至3任一所述字符识别模型的训练方法或权利要求4所述的字符识别方法。
10.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,该指令被处理器执行时实现如权利要求1至3任一所述字符识别模型的训练方法或权利要求4所述的字符识别方法。
CN201911347934.1A 2019-12-24 2019-12-24 字符识别模型的训练方法及装置、字符识别方法及装置 Pending CN111435445A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911347934.1A CN111435445A (zh) 2019-12-24 2019-12-24 字符识别模型的训练方法及装置、字符识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911347934.1A CN111435445A (zh) 2019-12-24 2019-12-24 字符识别模型的训练方法及装置、字符识别方法及装置

Publications (1)

Publication Number Publication Date
CN111435445A true CN111435445A (zh) 2020-07-21

Family

ID=71580942

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911347934.1A Pending CN111435445A (zh) 2019-12-24 2019-12-24 字符识别模型的训练方法及装置、字符识别方法及装置

Country Status (1)

Country Link
CN (1) CN111435445A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113627297A (zh) * 2021-07-30 2021-11-09 平安科技(深圳)有限公司 图像识别方法、装置、设备及介质
CN114782960A (zh) * 2022-06-22 2022-07-22 深圳思谋信息科技有限公司 模型训练方法、装置、计算机设备及计算机可读存储介质
CN115908998A (zh) * 2022-11-17 2023-04-04 北京星天科技有限公司 水深数据识别模型的训练方法、水深数据识别方法及装置

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101030258A (zh) * 2006-02-28 2007-09-05 浙江工业大学 基于bp神经网络的数显仪表动态显示字符识别方法
CN108846440A (zh) * 2018-06-20 2018-11-20 腾讯科技(深圳)有限公司 图像处理方法及装置、计算机可读介质和电子设备
CN108875696A (zh) * 2018-07-05 2018-11-23 五邑大学 基于深度可分离卷积神经网络的脱机手写汉字识别方法
CN109447069A (zh) * 2018-10-31 2019-03-08 沈阳工业大学 面向智能终端的车辆信息采集识别方法及系统
CN109508717A (zh) * 2018-10-09 2019-03-22 苏州科达科技股份有限公司 一种车牌识别方法、识别装置、识别设备及可读存储介质
CN109583445A (zh) * 2018-11-26 2019-04-05 平安科技(深圳)有限公司 文字图像校正处理方法、装置、设备及存储介质
CN110033016A (zh) * 2019-02-20 2019-07-19 阿里巴巴集团控股有限公司 数字键盘识别模型的训练方法、数字键盘识别方法及系统
CN110163199A (zh) * 2018-09-30 2019-08-23 腾讯科技(深圳)有限公司 车牌识别方法、车牌识别装置、车牌识别设备及介质
CN110378338A (zh) * 2019-07-11 2019-10-25 腾讯科技(深圳)有限公司 一种文本识别方法、装置、电子设备和存储介质
CN110414522A (zh) * 2019-07-08 2019-11-05 深兰科技(上海)有限公司 一种字符识别方法及装置
US20190347537A1 (en) * 2016-11-15 2019-11-14 Google Llc Efficient Convolutional Neural Networks and Techniques to Reduce Associated Computational Costs

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101030258A (zh) * 2006-02-28 2007-09-05 浙江工业大学 基于bp神经网络的数显仪表动态显示字符识别方法
US20190347537A1 (en) * 2016-11-15 2019-11-14 Google Llc Efficient Convolutional Neural Networks and Techniques to Reduce Associated Computational Costs
CN108846440A (zh) * 2018-06-20 2018-11-20 腾讯科技(深圳)有限公司 图像处理方法及装置、计算机可读介质和电子设备
CN108875696A (zh) * 2018-07-05 2018-11-23 五邑大学 基于深度可分离卷积神经网络的脱机手写汉字识别方法
CN110163199A (zh) * 2018-09-30 2019-08-23 腾讯科技(深圳)有限公司 车牌识别方法、车牌识别装置、车牌识别设备及介质
CN109508717A (zh) * 2018-10-09 2019-03-22 苏州科达科技股份有限公司 一种车牌识别方法、识别装置、识别设备及可读存储介质
CN109447069A (zh) * 2018-10-31 2019-03-08 沈阳工业大学 面向智能终端的车辆信息采集识别方法及系统
CN109583445A (zh) * 2018-11-26 2019-04-05 平安科技(深圳)有限公司 文字图像校正处理方法、装置、设备及存储介质
CN110033016A (zh) * 2019-02-20 2019-07-19 阿里巴巴集团控股有限公司 数字键盘识别模型的训练方法、数字键盘识别方法及系统
CN110414522A (zh) * 2019-07-08 2019-11-05 深兰科技(上海)有限公司 一种字符识别方法及装置
CN110378338A (zh) * 2019-07-11 2019-10-25 腾讯科技(深圳)有限公司 一种文本识别方法、装置、电子设备和存储介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
《数字图像模式识别工程项目研究》: "《数字图像模式识别工程项目研究》", 31 March 2014, 西南交通大学出版社 *
何东健等: "《数字图像处理》", 28 February 2015 *
叶人珍: "《视频图像处理研究 基于监控场景下的视觉算法》", 30 September 2018, 华中科技大学出版社 *
谢剑斌 等: "《视觉感知与智能视频监控》", 31 March 2012, 国防科技大学出版社 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113627297A (zh) * 2021-07-30 2021-11-09 平安科技(深圳)有限公司 图像识别方法、装置、设备及介质
CN113627297B (zh) * 2021-07-30 2024-06-11 平安科技(深圳)有限公司 图像识别方法、装置、设备及介质
CN114782960A (zh) * 2022-06-22 2022-07-22 深圳思谋信息科技有限公司 模型训练方法、装置、计算机设备及计算机可读存储介质
CN114782960B (zh) * 2022-06-22 2022-09-02 深圳思谋信息科技有限公司 模型训练方法、装置、计算机设备及计算机可读存储介质
CN115908998A (zh) * 2022-11-17 2023-04-04 北京星天科技有限公司 水深数据识别模型的训练方法、水深数据识别方法及装置
CN115908998B (zh) * 2022-11-17 2023-06-09 北京星天科技有限公司 水深数据识别模型的训练方法、水深数据识别方法及装置

Similar Documents

Publication Publication Date Title
CN108229509B (zh) 用于识别物体类别的方法及装置、电子设备
US20220092882A1 (en) Living body detection method based on facial recognition, and electronic device and storage medium
WO2020098250A1 (zh) 字符识别方法、服务器及计算机可读存储介质
CN109960742B (zh) 局部信息的搜索方法及装置
CN111368758B (zh) 一种人脸模糊度检测方法、装置、计算机设备及存储介质
CN109711407B (zh) 一种车牌识别的方法及相关装置
CN109117863B (zh) 基于深度卷积生成对抗网络的绝缘子样本扩充方法及装置
CN111222395A (zh) 目标检测方法、装置与电子设备
CN111435446A (zh) 一种基于LeNet车牌识别方法及装置
CN111435445A (zh) 字符识别模型的训练方法及装置、字符识别方法及装置
CN109726678B (zh) 一种车牌识别的方法及相关装置
CN111444911B (zh) 车牌识别模型的训练方法及装置、车牌识别方法及装置
CN112329881B (zh) 车牌识别模型训练方法、车牌识别方法及装置
CN110781980B (zh) 目标检测模型的训练方法、目标检测方法及装置
CN110599453A (zh) 一种基于图像融合的面板缺陷检测方法、装置及设备终端
CN111639513A (zh) 一种船只遮挡识别方法、装置及电子设备
CN114445651A (zh) 一种语义分割模型的训练集构建方法、装置及电子设备
CN114663726A (zh) 目标类别检测模型的训练方法、目标检测方法及电子设备
CN109712134B (zh) 虹膜图像质量评价方法、装置及电子设备
CN111104826B (zh) 一种车牌字符识别方法、装置及电子设备
CN110751163B (zh) 目标定位方法及其装置、计算机可读存储介质和电子设备
US20220122341A1 (en) Target detection method and apparatus, electronic device, and computer storage medium
CN109299652B (zh) 一种用于图像定位的模型训练方法、图像定位方法及装置
CN113255668B (zh) 文本识别方法、装置、电子设备、存储介质
CN117576109B (zh) 一种缺陷检测方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200721

RJ01 Rejection of invention patent application after publication