CN110991439B - 一种基于像素级多特征联合分类的手写体字符的提取方法 - Google Patents

一种基于像素级多特征联合分类的手写体字符的提取方法 Download PDF

Info

Publication number
CN110991439B
CN110991439B CN201911253552.2A CN201911253552A CN110991439B CN 110991439 B CN110991439 B CN 110991439B CN 201911253552 A CN201911253552 A CN 201911253552A CN 110991439 B CN110991439 B CN 110991439B
Authority
CN
China
Prior art keywords
pixel
character
characters
text
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911253552.2A
Other languages
English (en)
Other versions
CN110991439A (zh
Inventor
田博帆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Hongsong Information Technology Co ltd
Original Assignee
Nanjing Hongsong Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Hongsong Information Technology Co ltd filed Critical Nanjing Hongsong Information Technology Co ltd
Priority to CN201911253552.2A priority Critical patent/CN110991439B/zh
Publication of CN110991439A publication Critical patent/CN110991439A/zh
Application granted granted Critical
Publication of CN110991439B publication Critical patent/CN110991439B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Multimedia (AREA)
  • Character Input (AREA)

Abstract

本发明公开了一种基于像素级多特征联合分类的手写体字符的提取方法,具体步骤包括:(1)字符定位:通过字符连通域算法或目标识别检测YoLo v3算法对图片中的文本字符进行定位处理;(2)样本收集:收集含手写体文本字符和印刷体文本字符的重叠字符的真实样本,再通过合成方式追加若干个类真实的样本;(3)特征提取:对文本字符样本进行多特征提取,获得文本字符图;(4)像素分类:对文本字符的特征进行像素级分类,再对字符像素特征进行分类处理,获得字符特征的像素分类结果;(5)字符提取:根据像素分类结果,对图片中的像素位进行筛选并将判断为印刷体的字符像素的灰度值设置为白色,从而去除印刷体字符,提取出手写体字符。

Description

一种基于像素级多特征联合分类的手写体字符的提取方法
技术领域
本发明属于文本图像处理技术领域,尤其是涉及一种基于像素级多特征联合分类的手写体字符的提取方法。
背景技术
随着人工智能信息化时代的发展,图像识别技术逐渐兴起并已深入至各个行业,彻底改变了人类的生产和生活方式。然而技术的不断迭代更新,在传统图像识别领域,原本难以完成的图像处理任务,现阶段可通过人工智能方法实现图像处理的任务需求,弥补传统方法存在的不足。
随着科技的发展,随着人工智能的到来,新的一轮技术革命已然开始;计算机已逐步取代了人工的繁重工作。例如,在文本识别领域,由于大量文本信息待处理,传统的人工审阅方式已然无法满足需求;或者学生考试使用的部分自动批阅系统,以及票据、凭据等的识别录入系统,这些不仅节省了由人工参与而浪费的大量时间,同时提高了工作效率。但作为文本识别系统,对其识别的精度一直以来都有很高的要求,也是目前研究的重点;文本识别主要分为手写体识别和印刷体识别两种,考虑到手写体书写的随意性和复杂性等特点,混合识别变的非常有难度,大多数的识别系统都是将其分开进行识别;伴随智能化识别系统的发展,开始逐渐打破了旧的格局,开辟新的天地;文本识别的前提是先对文本进行定位,实际识别应用中文本大多为印刷体和手写体字符的混合,而手写体通常为识别的重点目标,故需提前对待识别的手写体做出精确定位变得至关重要。
图像识别技术的本质是通过计算机对图像进行预处理、提取图像特征再加以分析和理解,以识别图像中的目标和对象的技术。图像识别技术的区别在于图像处理方法的不同,人工智能识别技术相比传统识别技术更具优势,它主要是采用了人工神经网络,通过卷积的方式处理图像,不仅高效可靠,而且学习到的模型能够无限逼近真实预测函数。在文本图像识别领域,涉及众多的图像处理技术,包括:图像预处理技术、图像分割技术和图像分类技术等。其中,图像分割技术是图像处理到图像分析的关键技术,它是将图像分成若干个特定独立的区域,并对每个具有独特性质的区域进行感兴趣目标提取的技术过程。目前,图像分割方法主要分为四类:基于阈值的分割方法、基于区域的分割方法、基于边缘的分割方法以及基于特定理论的分割方法等。此外,每类技术在一定程度上相互融合,如图像分割技术涉及到图像分类技术,图像分离技术又涉及到图像分割技术,同时图像分类技术作为图像识别的核心技术已被广泛应用,有关它的研究仍在继续深入。
因此,有必要开发一种基于像素级多特征联合分类的手写体字符的提取方法,一种基于像素级多特征联合分类的手写体字符提取技术,它属于无模板分离技术,可在提取字符像素特征的基础上对每个像素进行分类,达到手写印刷字符完全分离的目的,进而提取出手写体字符。
发明内容
本发明要解决的技术问题是,提供一种基于像素级多特征联合分类的手写体字符的提取方法,对同时含有印刷体和手写体图片中的手写体部分做出精确定位,提高文本识别系统的精确度。
为解决上述技术问题,本发明采用的技术方案是:该基于像素级多特征联合分类的手写体字符的提取方法,具体包括以下步骤:
(1)字符定位:通过字符连通域算法或目标识别检测YoLo v3算法对图片中的文本字符进行定位处理,获取所述文本字符的定位坐标;
(2)样本收集:收集含手写体文本字符和印刷体文本字符的重叠字符的真实样本,再通过合成方式追加若干个类真实的样本,获得重叠文本字符样本;
(3)特征提取:对步骤(2)中的重叠文本字符样本进行多特征提取,特征维度可选择追加不同的学习样本,获得文本字符图;
(4)像素分类:对步骤(3)提取到的文本字符的特征进行像素级分类,再对字符像素特征进行分类处理,获得字符特征的像素分类结果;
(5)字符提取:根据步骤(4)中的字符特征的像素分类结果,对图片中的像素位进行筛选并将判断为印刷体的字符像素的灰度值设置为白色,从而去除印刷体字符,提取出手写体字符。
采用上述技方案,采用收集样本的方式无需模板,便可在提取字符像素特征的基础上对每个像素进行分类,达到手写印刷字符完全分离的目的,进而提取出手写体字符;该基于像素级多特征联合分类的手写体字符的提取方法属于无模板分离技术;实现了手写体与印刷体的定位及分离,在同时含有手写体和印刷体字符的复杂情况下,通过像素级别的分类判别方式实现手写和印刷体字符的分类,完成手写字符完全分离,提高了文本识别系统的精确度。
作为本发明的优选技术方案,所述步骤(1)中采用目标识别检测YoLo v3算法对图片中的文本字符进行定位处理的具体步骤为:
S1-1:对图片中的每个文本字符进行标注;
S1-2:通过DarkNet53网络对每个文本字符进行特征提取;并采用不同尺度的特征图对提取的特征进行目标检测;
S1-3:将DarkNet53网络产出的不同尺度的所述特征图作为输入,以FPN(featurepyramid networks)算法作为参考,通过卷积层和上采样对不同尺度的特征图进行融合,从而实现快速的对图片中的每个字符进行定位和检测。
作为本发明的优选技术方案,所述步骤(1)中采用所述字符连通域算法对图片中的文本字符进行定位处理的具体步骤为:
S11:按行和列遍历图片中第一个有像素值的点P(x,y),并赋予其一个标注label,然后将与该像素点相邻的所有前景像素都压入栈中;
S12:弹出栈顶像素,赋予其相同的标注label,然后再将与所述栈顶像素相邻的所有前景像素都压入栈中,重复此步骤,直至栈为空,便得到了图片中的某一个连通区域;
S13:重复步骤S11和步骤S12,完成整张图片的遍历,最终可得到所有文本字符的连通区域,从而实现文本字符的定位。其中遍历即进行整体筛选。
作为本发明的优选技术方案,所述步骤(2)中样本收集的通过合成方式追加若干个类真实的样本的具体合成方法为计算机合成方式,具体步骤为:
S21:将手写体文本字符图片和印刷体文本字符图片的大小调整为相同大小;
S22:对步骤(1)中调整大小后的图片做二值化处理,再对处理后的图片做或运算保留其有效像素位;
S23:根据二值化处理后的合成图,筛选出有效像素位,再从文本字符的原始图的对应位置选取合成图像素值,从而得到重叠混合的文本字符。
作为本发明的优选技术方案,所述步骤(3)中对所述字符样本进行多特征提取的具体步骤为:
S31:先对重叠文本字符样本进行多特征提取,将输入的文本字符图片的大小调整为统一的固定大小;特征维度根据需求选择追加不同的学习样本;
S32:使用全卷积FCN网络对图片中的多维特征进行卷积,提取有效的文本字符特征图。
作为本发明的优选技术方案,所述步骤S22中的二值化处理具体过程为:设定全局阈值128,将大于128的像素群像素值设定为白色,将小于128的像素群像素值设定为黑色。
作为本发明的优选技术方案,所述步骤S31中特征维度根据需求选择追加不同的学习样本包括字符的宽高、字符的关键笔画和字符的连通域。
作为本发明的优选技术方案,将输入的文本字符图片的大小调整为统一的固定大小32*32。
作为本发明的优选技术方案,所述步骤(4)中先通过上采样处理将提取到的文本字符的特征图片放大至输入图片的大小,保证特征图片的每个像素位与原图对齐,再对字符像素特征进行分类处理;分类处理的具体过程为:根据网络的对称性结构,对设定的多层卷积获取到文本字符的特征图后进行相同层数的上采样处理,反卷积至统一大小,对应分类每一个字符像素。由于字符的像素级分类和字符的分类不同,像素级分类要求的特征更加精确,因此先将图片放大至输入图片大小。
作为本发明的优选技术方案,所述步骤(5)中将判断为印刷体的字符像素的灰度值设置为255。
相比现有技术,该技术方案具有的有益效果是:该基于像素级多特征联合分类的手写体字符的提取方法属于无模板分离技术;实现了手写体与印刷体的定位及分离,在同时含有手写体和印刷体字符的复杂情况下,通过像素级别的分类判别方式实现手写和印刷体字符的分类,完成手写字符完全分离,提高了文本识别系统的精确度。
附图说明
下面结合附图和本发明的实施方式进一步详细说明:
图1是本发明的基于像素级多特征联合分类的手写体字符的提取方法的流程图;
图2是本发明的基于像素级多特征联合分类的手写体字符的提取方法的步骤(1)的文本字符定位结果图;
图3是本发明的基于像素级多特征联合分类的手写体字符的提取方法的步骤(2)的印刷和手写体字符合成样本的效果图;
图4是本发明的基于像素级多特征联合分类的手写体字符的提取方法的手写字符提取结果。
具体实施方式
实施例:如图1~4所示,该基于像素级多特征联合分类的手写体字符的提取方法,具体包括以下步骤:
(1)字符定位:通过字符连通域算法或目标识别检测YoLo v3算法对图片中的文本字符进行定位处理,获取所述文本字符的定位坐标,定位效果如附图1所示;
所述步骤(1)中采用目标识别检测YoLo v3算法对图片中的文本字符进行定位处理的具体步骤为:
S1-1:对图片中的每个文本字符进行标注;
S1-2:通过DarkNet53网络对每个文本字符进行特征提取;并采用不同尺度的特征图对提取的特征进行目标检测;
S1-3:将DarkNet53网络产出的不同尺度的所述特征图作为输入,以FPN(featurepyramid networks)算法作为参考,通过卷积层和上采样对不同尺度的特征图进行融合,从而实现快速的对图片中的每个字符进行定位和检测;
(2)样本收集:收集含手写体文本字符和印刷体文本字符的重叠字符的真实样本,再通过合成方式追加若干个类真实的样本,获得重叠文本字符样本,如图2所示;
所述步骤(2)中样本收集的通过合成方式追加若干个类真实的样本的具体合成方法为计算机合成方式,具体步骤为:
S21:将手写体文本字符图片和印刷体文本字符图片的大小调整为相同大小;
S22:对步骤(1)中调整大小后的图片做二值化处理,再对处理后的图片做或运算保留其有效像素位;
所述步骤S22中的二值化处理具体过程为:设定全局阈值128,将大于128的像素群像素值设定为白色,将小于128的像素群像素值设定为黑色;
S23:根据二值化处理后的合成图,筛选出有效像素位,再从文本字符的原始图的对应位置选取像素较大的值作为最终的合成图像素值,从而得到重叠混合的文本字符;
(3)特征提取:对步骤(2)中的重叠文本字符样本进行多特征提取,特征维度可选择追加不同的学习样本,获得文本字符图;
所述步骤(3)中对所述字符样本进行多特征提取的具体步骤为:
S31:先对重叠文本字符样本进行多特征提取,将输入的文本字符图片的大小调整为统一的固定大小32*32;特征维度根据需求选择追加不同的学习样本;
所述步骤S31中特征维度根据需求选择追加不同的学习样本包括字符的宽高、字符的关键笔画和字符的连通域;
S32:使用全卷积FCN网络对图片中的多维特征进行卷积,提取有效的文本字符特征图;同时为了确保图像的每个像素特征都能够被学习到,使用全卷积FCN网络对图片中的多维特征进行卷积,网络的具体层数可根据实际输入的图片大小做适当调整,保证每步卷积能够顺利进行的情况下,适当地加深网络层数,提取有效的字符特征图;
(4)像素分类:对步骤(3)提取到的文本字符的特征进行像素级分类,再对字符像素特征进行分类处理,获得字符特征的像素分类结果;
所述步骤(4)中先通过上采样处理将提取到的文本字符的特征图片放大至输入图片的大小,保证特征图片的每个像素位与原图对齐,再对字符像素特征进行分类处理;由于字符的像素级分类和字符的分类不同,像素级分类要求的特征更加精确,可通过上采样处理将提取到的字符特征图放大至输入图片的大小,保证特征图的每个像素位与原图对齐,再对字符像素特征进行分类处理;分类处理的具体过程为:根据网络的对称性结构,对设定的多层卷积获取到文本字符的特征图后进行相同层数的上采样处理,反卷积至统一大小(32*32),对应分类每一个字符像素;
(5)字符提取:根据步骤(4)中的字符特征的像素分类结果,对图片中的像素位进行筛选并将判断为印刷体的字符像素的灰度值设置为255(白色),从而去除印刷体字符,提取出手写体字符,根据原图中字符像素的分类结果,遍历图中的所有像素位将其判断为印刷体字符像素的灰度值全部置为255(白色),以达到完全去除印刷体字符,提取出手写体字符的目的;效果图如图3所示。
实施例2:该基于像素级多特征联合分类的手写体字符的提取方法,具体包括以下步骤:
(1)字符定位:通过字符连通域算法或目标识别检测YoLo v3算法对图片中的文本字符进行定位处理,获取所述文本字符的定位坐标;
所述步骤(1)中采用所述字符连通域算法对图片中的文本字符进行定位处理的具体步骤为:
S11:按行和列遍历图片中第一个有像素值的点P(x,y),并赋予其一个标注label,然后将与该像素点相邻的所有前景像素都压入栈中;
S12:弹出栈顶像素,赋予其相同的标注label,然后再将与所述栈顶像素相邻的所有前景像素都压入栈中,重复此步骤,直至栈为空,便得到了图片中的某一个连通区域;
S13:重复步骤S11和步骤S12,完成整张图片的遍历,最终可得到所有文本字符的连通区域,从而实现文本字符的定位;
所述步骤(2)中样本收集的通过合成方式追加若干个类真实的样本的具体合成方法为计算机合成方式,具体步骤为:
S21:将手写体文本字符图片和印刷体文本字符图片的大小调整为相同大小;
S22:对步骤(1)中调整大小后的图片做二值化处理,再对处理后的图片做或运算保留其有效像素位;
所述步骤S22中的二值化处理具体过程为:设定全局阈值128,将大于128的像素群像素值设定为白色,将小于128的像素群像素值设定为黑色;
S23:根据二值化处理后的合成图,筛选出有效像素位,再从文本字符的原始图的对应位置选取像素较大的值作为最终的合成图像素值,从而得到重叠混合的文本字符;
(3)特征提取:对步骤(2)中的重叠文本字符样本进行多特征提取,特征维度可选择追加不同的学习样本,获得文本字符图;
所述步骤(3)中对所述字符样本进行多特征提取的具体步骤为:
S31:先对重叠文本字符样本进行多特征提取,将输入的文本字符图片的大小调整为统一的固定大小32*32;特征维度根据需求选择追加不同的学习样本;
所述步骤S31中特征维度根据需求选择追加不同的学习样本包括字符的宽高、字符的关键笔画和字符的连通域;
S32:使用全卷积FCN网络对图片中的多维特征进行卷积,提取有效的文本字符特征图;同时为了确保图像的每个像素特征都能够被学习到,使用全卷积FCN网络对图片中的多维特征进行卷积,网络的具体层数可根据实际输入的图片大小做适当调整,保证每步卷积能够顺利进行的情况下,适当地加深网络层数,提取有效的字符特征图;
(4)像素分类:对步骤(3)提取到的文本字符的特征进行像素级分类,再对字符像素特征进行分类处理,获得字符特征的像素分类结果;
所述步骤(4)中先通过上采样处理将提取到的文本字符的特征图片放大至输入图片的大小,保证特征图片的每个像素位与原图对齐,再对字符像素特征进行分类处理;由于字符的像素级分类和字符的分类不同,像素级分类要求的特征更加精确,可通过上采样处理将提取到的字符特征图放大至输入图片的大小,保证特征图的每个像素位与原图对齐,再对字符像素特征进行分类处理,采用像素分类器对字符进行分类处理;分类处理的具体过程为:根据网络的对称性结构,对设定的多层卷积获取到文本字符的特征图后进行相同层数的上采样处理,反卷积至统一大小(32*32),对应分类每一个字符像素;
(5)字符提取:根据步骤(4)中的字符特征的像素分类结果,对图片中的像素位进行筛选并将判断为印刷体的字符像素的灰度值设置为255(白色),从而去除印刷体字符,提取出手写体字符,根据原图中字符像素的分类结果,遍历图中的所有像素位将其判断为印刷体字符像素的灰度值全部置为255(白色),以达到完全去除印刷体字符,提取出手写体字符的目的;效果图如图3所示。
上面结合附图对本发明的实施方式作了详细的说明,但是本发明不限于上述实施方式,在所属技术领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。

Claims (5)

1.一种基于像素级多特征联合分类的手写体字符的提取方法,其特征在于,具体包括以下步骤:
(1)字符定位:通过字符连通域算法或目标识别检测YoLo v3算法对图片中的文本字符进行定位处理,获取所述文本字符的定位坐标;
(2)样本收集:收集含手写体文本字符和印刷体文本字符的重叠字符的真实样本,再通过合成方式追加若干个类真实的样本,获得重叠文本字符样本;
(3)特征提取:对步骤(2)中的重叠文本字符样本进行多特征提取,特征维度可选择追加不同的学习样本,获得文本字符图;
(4)像素分类:对步骤(3)提取到的文本字符的特征进行像素级分类,获得字符特征的像素分类结果;
(5)字符提取:根据步骤(4)中的字符特征的像素分类结果,对图片中的像素位进行筛选并将判断为印刷体的字符像素的灰度值设置为白色,从而去除印刷体字符,提取出手写体字符;
所述步骤(1)中采用目标识别检测YoLo v3算法对图片中的文本字符进行定位处理的具体步骤为:
S1-1:对图片中的每个文本字符进行标注;
S1-2:通过DarkNet53网络对每个文本字符进行特征提取;并采用不同尺度的特征图对提取的特征进行目标检测;
S1-3:将DarkNet53网络产出的不同尺度的所述特征图作为输入,以FPN(featurepyramid networks)算法作为参考,通过卷积层和上采样对不同尺度的特征图进行融合,从而实现快速的对图片中的每个字符进行定位和检测;
所述步骤(1)中采用所述字符连通域算法对图片中的文本字符进行定位处理的具体步骤为:
S11:按行和列遍历图片中第一个有像素值的点P(x,y),并赋予其一个标注label,然后将与像素点相邻的所有前景像素都压入栈中;
S12:弹出栈顶像素,赋予其相同的标注label,然后再将与所述栈顶像素相邻的所有前景像素都压入栈中,重复此步骤,直至栈为空,便得到了图片中的某一个连通区域;
S13:重复步骤S11和步骤S12,完成整张图片的遍历,最终可得到所有文本字符的连通区域,从而实现文本字符的定位;
所述步骤(2)中样本收集的通过合成方式追加若干个类真实的样本的具体合成方法为计算机合成方式,具体步骤为:
S21:将手写体文本字符图片和印刷体文本字符图片的大小调整为相同大小;
S22:对步骤(1)中调整大小后的图片做二值化处理,再对处理后的图片做或运算保留其有效像素位;
S23:根据二值化处理后的合成图,筛选出有效像素位,再从文本字符的原始图的对应位置选取合成图像素值,从而得到重叠混合的文本字符;
所述步骤(3)中对所述字符样本进行多特征提取的具体步骤为:
S31:先对重叠文本字符样本进行多特征提取,将输入的文本字符图片的大小调整为统一的固定大小;特征维度根据需求选择追加不同的学习样本;
S32:使用全卷积FCN网络对图片中的多维特征进行卷积,提取有效的文本字符特征图;
所述步骤(4)中先通过上采样处理将提取到的文本字符的特征图片放大至输入图片的大小,保证特征图片的每个像素位与原图对齐,再对字符像素特征进行分类处理;分类处理的具体过程为:根据网络的对称性结构,对设定的多层卷积获取到文本字符的特征图后进行相同层数的上采样处理,反卷积至统一大小,对应分类每一个字符像素。
2.根据权利要求1所述的基于像素级多特征联合分类的手写体字符的提取方法,其特征在于,所述步骤S22中的二值化处理具体过程为:设定全局阈值128,将大于128的像素群像素值设定为白色,将小于128的像素群像素值设定为黑色。
3.根据权利要求1所述的基于像素级多特征联合分类的手写体字符的提取方法,其特征在于,所述步骤S31中特征维度根据需求选择追加不同的学习样本包括字符的宽高、字符的关键笔画和字符的连通域。
4.根据权利要求1所述的基于像素级多特征联合分类的手写体字符的提取方法,其特征在于,将输入的文本字符图片的大小调整为统一的固定大小32*32。
5.根据权利要求1所述的基于像素级多特征联合分类的手写体字符的提取方法,其特征在于,所述步骤(5)中将判断为印刷体的字符像素的灰度值设置为255。
CN201911253552.2A 2019-12-09 2019-12-09 一种基于像素级多特征联合分类的手写体字符的提取方法 Active CN110991439B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911253552.2A CN110991439B (zh) 2019-12-09 2019-12-09 一种基于像素级多特征联合分类的手写体字符的提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911253552.2A CN110991439B (zh) 2019-12-09 2019-12-09 一种基于像素级多特征联合分类的手写体字符的提取方法

Publications (2)

Publication Number Publication Date
CN110991439A CN110991439A (zh) 2020-04-10
CN110991439B true CN110991439B (zh) 2023-04-28

Family

ID=70091506

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911253552.2A Active CN110991439B (zh) 2019-12-09 2019-12-09 一种基于像素级多特征联合分类的手写体字符的提取方法

Country Status (1)

Country Link
CN (1) CN110991439B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111626283B (zh) * 2020-05-20 2022-12-13 北京字节跳动网络技术有限公司 文字提取方法、装置和电子设备
CN111626284B (zh) * 2020-05-26 2023-10-03 广东小天才科技有限公司 一种手写字体去除的方法、装置、电子设备和存储介质
CN111737478B (zh) * 2020-08-07 2021-06-01 北京易真学思教育科技有限公司 文本检测方法、电子设备及计算机可读介质
CN112597925B (zh) * 2020-12-28 2023-08-29 北京百舸飞驰科技有限公司 手写字迹的识别/提取、擦除方法及擦除系统、电子设备
CN113011299A (zh) * 2021-03-09 2021-06-22 天津职业技术师范大学(中国职业培训指导教师进修中心) 一种文本检测训练集中增加特殊负例的方法
CN113989816A (zh) * 2021-09-10 2022-01-28 浙江星算科技有限公司 一种基于人工智能的手写字体去除方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5699623B2 (ja) * 2011-01-20 2015-04-15 村田機械株式会社 画像処理装置、画像処理システム、画像処理方法、および、プログラム
CN107220655A (zh) * 2016-03-22 2017-09-29 华南理工大学 一种基于深度学习的手写、印刷文本的分类方法
CN108537146B (zh) * 2018-03-22 2023-03-31 五邑大学 一种印刷体与手写体混合文本行提取系统
CN110020692B (zh) * 2019-04-13 2023-04-07 南京红松信息技术有限公司 一种基于印刷体模板的手写体分离与定位方法

Also Published As

Publication number Publication date
CN110991439A (zh) 2020-04-10

Similar Documents

Publication Publication Date Title
CN110991439B (zh) 一种基于像素级多特征联合分类的手写体字符的提取方法
CN110956167B (zh) 一种基于定位字符的分类判别强化分离的方法
CN105373794B (zh) 一种车牌识别方法
CN108562589B (zh) 一种对磁路材料表面缺陷进行检测的方法
Zheng et al. An algorithm for accuracy enhancement of license plate recognition
CN102332096B (zh) 一种视频字幕文本提取和识别的方法
Preethi et al. Region-based convolutional neural network for segmenting text in epigraphical images
CN108596166A (zh) 一种基于卷积神经网络分类的集装箱箱号识别方法
CN104408449B (zh) 智能移动终端场景文字处理方法
CN103093240A (zh) 书法字识别方法
CN104809481A (zh) 一种基于自适应色彩聚类的自然场景文本检测的方法
CN106529532A (zh) 一种基于积分特征通道与灰度投影的车牌识别系统
CN102043945A (zh) 基于车辆实时跟踪和二进指数分类车牌字符识别的方法
CN110008900B (zh) 一种由区域到目标的可见光遥感图像候选目标提取方法
CN109598681B (zh) 一种对称唐卡修复后图像的无参考质量评价方法
Turki et al. Text detection based on MSER and CNN features
CN112183639B (zh) 一种矿物图像识别与分类方法
CN110751619A (zh) 一种绝缘子缺陷检测方法
CN109800762A (zh) 一种基于动态匹配因子的模糊车牌识别算法
CN112446259A (zh) 图像处理方法、装置、终端和计算机可读存储介质
Kasar et al. Multi-script and multi-oriented text localization from scene images
CN113191358A (zh) 金属零件表面文本检测方法和系统
CN109271882B (zh) 一种区分颜色的手写体汉字提取方法
Ntzios et al. An old greek handwritten OCR system based on an efficient segmentation-free approach
CN108734170B (zh) 基于机器学习和模板的车牌字符分割方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant