CN108875696A - 基于深度可分离卷积神经网络的脱机手写汉字识别方法 - Google Patents

基于深度可分离卷积神经网络的脱机手写汉字识别方法 Download PDF

Info

Publication number
CN108875696A
CN108875696A CN201810729888.0A CN201810729888A CN108875696A CN 108875696 A CN108875696 A CN 108875696A CN 201810729888 A CN201810729888 A CN 201810729888A CN 108875696 A CN108875696 A CN 108875696A
Authority
CN
China
Prior art keywords
depth
convolution
image
neural networks
convolutional neural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201810729888.0A
Other languages
English (en)
Inventor
应自炉
陈鹏飞
朱健菲
陈俊娟
甘俊英
翟懿奎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuyi University
Original Assignee
Wuyi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuyi University filed Critical Wuyi University
Priority to CN201810729888.0A priority Critical patent/CN108875696A/zh
Publication of CN108875696A publication Critical patent/CN108875696A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/30Writer recognition; Reading and verifying signatures
    • G06V40/33Writer recognition; Reading and verifying signatures based only on signature image, e.g. static signature recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了基于深度可分离卷积神经网络的脱机手写汉字识别方法,首先对图像进行图像裁剪和图像负像的预处理,然后设计一个基于深度可分离卷积的卷积神经网络,使用随机梯度下降法和反向传播算法进行有监督的训练,当模型收敛时,保存模型参数。最后使用保存的模型对测试图像进行识别以验证模型的有效性,本发明能够降低模型的计算量以及存储量,使得基于神经网络的脱机手写汉字识别模型能够离线的运行在移动端设备上,在图像预处理和卷积神经网络设计方面加以改进,主要减少卷积神经网络的计算复杂度和模型容量,使其能够适用于计算资源和存储资源受限的计算设备。

Description

基于深度可分离卷积神经网络的脱机手写汉字识别方法
技术领域
本发明涉及模式识别和图像分类领域,具体涉及基于深度可分离卷积神经网络的脱机手写汉字识别方法。
背景技术
脱机手写汉字识别只有二维的图像信息,相比于联机手写汉字识别却少笔画顺序信息,所以在分类识别时,一直是一个较为困难的识别问题。传统的方法分为三部分,一是对数据进行预处理;二是人工设计特征提取;三是将特征进行分类识别。近几年,由于卷积神经网络在计算机视觉方面的成功应用,使得脱机手写汉字识别的识别准确率大幅提升。卷积神经网络只需要将原始数据做简单的预处理,便可以自动地提取特征并分类识别,完全自主地学习一个端到端的识别模型。
专利CN201611009032和CN20170304188均是采用卷积神经网络来对手写汉字进行识别。专利CN201611009032采用原始图像加图像方向特征的方式对卷积神经网络进行训练,专利CN20170304188采用不同尺寸的图像分别设计了一个两列卷积神经网络,两种方法均基于卷积神经网络,都能取得比传统方法较好的结果。
现今,识别准确率较高的卷积神经网络的网络模型容量较大,而且计算复杂度方面都较高。对于像移动端设备这种资源受限的计算设备,将较大容量的模型部署到移动端,需要耗费较大的成本。而且受限于计算资源,也无法适用于时间敏感和实时性较高的应用。
专利CN201611009032采用原始图像加图像方向特征的卷积神经网络,其对图像要先计算方向特征,然后再训练卷积神经网络;专利CN20170304188没有较为复杂的图像预处理,而是针对两个不同尺寸的原始图像进行训练,其训练的卷积神经网络模型较为庞大。对于计算资源和存储受限的计算设备,过多的图像预处理方法和较大的卷积神经网络都不能很好的使用。
目前,卷积神经网络(Convolution neural network,CNN)在脱机手写汉字识别领域已经取得了较为杰出的成果。但是,网络模型需要较大的存储量和计算资源,这些因素制约了网络模型在移动设备上的部署。采用云端部署的方案,无法适用于时间敏感和实时性有较高要求的应用。所以,采用离线部署就非常有必要。为了解决现有技术在模型容量和计算复杂度方面的不足,本发明旨在设计一个模型容量小而且计算复杂度较低的应用于脱机手写汉字识别的卷积神经网络模型。
发明内容
本发明的目的是为解决上述不足,提供基于深度可分离卷积神经网络的脱机手写汉字识别方法。
本发明的目的是通过以下技术方案实现的:
基于深度可分离卷积神经网络的脱机手写汉字识别方法,具体步骤如下:
步骤一,脱机手写汉字图像的预处理:深度可分离卷积神经网络的输入数据为单通道的灰度图像,大小为32×32,由于,原始图像大小不确定,所以首先对输入的原始图像进行缩放处理,缩放后的图像大小为32×32;所识别的手写汉字的原始背景颜色是白色,灰度值为255,为了减少计算量,将白色背景反转为黑色背景,灰度值为0;同时,汉字的亮度值也进行了反转,反转后的图像中更多的亮度值为0,图像矩阵更加稀疏,减少了计算量,原始图像的亮度值为Y(x,y),反转图像的亮度值为X(x,y),其中x,y是二维坐标位置,图像负像满足以下公式:
1.Y(x,y)=255-X(x,y) (1)
步骤二,设计一个基于深度可分离卷积的卷积神经网络模型:
针对设计的深度可分离卷积网络中所使用的深度可分离卷积进行详细说明,一个卷积层的输入特征图为X,大小为M×H×W,其中M是输入特征图通道数,H和W是输入特征图的高和宽;输出特征图为Y,大小为N×H′×W′,其中,N是输出特征图通道数,H′和W′是输出特征图的高和宽;卷积核为F,大小为C×K×K×N,其中,K是卷积核的大小。假设卷积步长和补边为1,由卷积的定义可知,有以下公式:
其参数量和计算复杂度分别为:
C×K×K×N (3)
C×K×K×N×H′×W′ (4)
深度可分离卷积中,每个卷积核对应只一个输入特征图,所以根据深度可分离卷积的定义,有以下公式:
为了保证有相同的输出特征图,在深度可分离卷积后面加入一个输出特征图为N的1×1标准卷积,其参数量和计算复杂度分别为:
C×K×K+C×1×1×N (6)
C×K×K×H′×W′+C×H′×W′×N (7)
使用深度可分离卷积,相比较于标准卷积,其计算复杂度和参数量都减少相同倍数,由公式(3)和公式(6)可得,
由公式(4)和(7)可得,
所以,当深度可分离卷积核K的大小为3时,相比于标准卷积,其参数量和计算复杂度要减少8到9倍。
使用深度可分离卷积,设计一个9层的深度可分离卷积神经网络,网络结构如下:
[Input]→[64C3]→2×[96dwC3,96C1]→[MP3]→2×[128dwC3,128C1]→2×[192dwC3,192C1]→2×[384dwC3,384C1]→[Dropout]→[3755C1]→[GAP]→[3755SoftMax]
其中,64C3表示有64个3×3标准卷积,96dwC3表示有96个3×3深度可分离卷积,MP3表示最大池化层,GAP表示全局平均池化层,其它层的参数以此类推;需要说明的是,每一个标准卷积层和深度可分离卷积层,均使用ReLU激活函数和批量归一化操作,Dropout层的参数设置为0.5,脱机手写汉字类别包括常用的3755个汉字,SoftMax层输出节点为3755;
步骤三,训练深度可分离卷积神经网络,采用随机梯度下降法和反向传播算法训练,步骤二中,设计的网络模型输出是SoftMax层,根据SoftMax多分类函数的定义,有以下公式:
其中,是输出的类别概率;
在随机梯度下降法中,最小化损失函数来使网络模型收敛;在分类任务中,采用输出的交叉熵作为损失函数,其定义如下公式:
随机梯度下降法是基于小批量样本数据的算法,根据梯度下降法的定义,基于批量样本的梯度可以表示为:
其中,m′表示小批量样本数,L(x,y,θ)是公式(9)的损失函数,随机梯度下降算法的网络模型参数更新如下:
θ←θ-αg (11)
其中,α是学习率;
采用上述的随机梯度下降法进行训练,训练的初始学习率设置为0.1,测试间隔设置为5000次训练时间,并保存网络模型参数,最大迭代次数设置为30万次,每10万次降低学习率10倍,当网络模型收敛时,可以提前停止训练,保存验证准确率最大的模型为最终模型;
步骤四,测试网络模型的有效性,本发明使用开源的脱机手写汉字数据集CASIA-HWDB,其中,采用CASIA-HWDB1.0和CASIA-HWDB1.1作为训练数据,将CASIA-HWDB-competition数据作为验证集数据,分别训练和测试了两个网络模型,一个是采用标准卷积的网络模型,一个是采用深度可分离卷积的网络模型,实验结果表明,标准卷积网络神经网络模型取得了96%的测试准确率;使用深度可分离卷积网络模型相比于标准卷积神经网络模型,模型容量和计算量均减少8到9倍,测试准确率为95.3%,相比而言,准确率仅降低了0.7%,本发明在损失了轻微的准确率的情况下,拥有更少的存储量和计算复杂度,能够更好地部署到计算资源和存储容量受限的设备当中,进行离线地计算。
本发明具有如下有益的效果:
本发明采用基于深度可分离卷积设计的神经网络模型,能够降低模型的计算量以及存储量,使得基于神经网络的脱机手写汉字识别模型能够离线的运行在移动端设备上,在图像预处理和卷积神经网络设计方面加以改进,主要减少卷积神经网络的计算复杂度和模型容量,使其能够适用于计算资源和存储资源受限的计算设备;主要改进包括:1)针对图像预处理只对原始图像进行简单的缩放和反转操作,没有过多的复杂操作,以减少计算量;2)针对卷积神经网络中的标准卷积,使用一种计算复杂度和参数较少的深度可分离卷积代替,以减少计算量和模型的参数量;而且本发明采用的是单列的深度可分离卷积神经网络,相比于专利CN20170304188的两列卷积神经网络,在计算复杂度和模型容量方面都有较为明显的优势。
附图说明
图1为本发明的流程图;
图2为本发明的图像预处理原图像;
图3为本发明的图像预处理缩放图像;
图4为本发明的图像预处理图像负像。
具体实施方式
下面结合附图对本发明作进一步的说明:
如图1-图4所示,基于深度可分离卷积神经网络的脱机手写汉字识别方法,具体步骤如下:
步骤一,脱机手写汉字图像的预处理:深度可分离卷积神经网络的输入数据为单通道的灰度图像,大小为32×32,由于,原始图像大小不确定,所以首先对输入的原始图像进行缩放处理,缩放后的图像大小为32×32;所识别的手写汉字的原始背景颜色是白色,灰度值为255,为了减少计算量,将白色背景反转为黑色背景,灰度值为0;同时,汉字的亮度值也进行了反转,反转后的图像中更多的亮度值为0,图像矩阵更加稀疏,减少了计算量,原始图像的亮度值为Y(x,y),反转图像的亮度值为X(x,y),其中x,y是二维坐标位置,图像负像满足以下公式:
Y(x,y)=255-X(x,y) (1)
图2-图4是图像数据预处理的实例图;
步骤二,设计一个基于深度可分离卷积的卷积神经网络模型:
针对设计的深度可分离卷积网络中所使用的深度可分离卷积进行详细说明,一个卷积层的输入特征图为X,大小为M×H×W,其中M是输入特征图通道数,H和W是输入特征图的高和宽;输出特征图为Y,大小为N×H′×W′,其中,N是输出特征图通道数,H′和W′是输出特征图的高和宽;卷积核为F,大小为C×K×K×N,其中,K是卷积核的大小。假设卷积步长和补边为1,由卷积的定义可知,有以下公式:
其参数量和计算复杂度分别为:
C×K×K×N (3)
C×K×K×N×H′×W′ (4)
深度可分离卷积中,每个卷积核对应只一个输入特征图,所以根据深度可分离卷积的定义,有以下公式:
为了保证有相同的输出特征图,在深度可分离卷积后面加入一个输出特征图为N的1×1标准卷积,其参数量和计算复杂度分别为:
C×K×K+C×1×1×N (6)
C×K×K×H′×W′+C×H′×W′×N (7)
使用深度可分离卷积,相比较于标准卷积,其计算复杂度和参数量都减少相同倍数,由公式(3)和公式(6)可得,
由公式(4)和(7)可得,
所以,当深度可分离卷积核K的大小为3时,相比于标准卷积,其参数量和计算复杂度要减少8到9倍。
使用深度可分离卷积,设计一个9层的深度可分离卷积神经网络,网络结构如下:
[Input]→[64C3]→2×[96dwC3,96C1]→[MP3]→2×[128dwC3,128C1]→2×[192dwC3,192C1]→2×[384dwC3,384C1]→[Dropout]→[3755C1]→[GAP]→[3755SoftMax]
其中,64C3表示有64个3×3标准卷积,96dwC3表示有96个3×3深度可分离卷积,MP3表示最大池化层,GAP表示全局平均池化层,其它层的参数以此类推;需要说明的是,每一个标准卷积层和深度可分离卷积层,均使用ReLU激活函数和批量归一化操作,Dropout层的参数设置为0.5,脱机手写汉字类别包括常用的3755个汉字,SoftMax层输出节点为3755;
步骤三,训练深度可分离卷积神经网络,采用随机梯度下降法和反向传播算法训练,步骤二中,设计的网络模型输出是SoftMax层,根据SoftMax多分类函数的定义,有以下公式:
其中,是输出的类别概率;
在随机梯度下降法中,最小化损失函数来使网络模型收敛;在分类任务中,采用输出的交叉熵作为损失函数,其定义如下公式:
随机梯度下降法是基于小批量样本数据的算法,根据梯度下降法的定义,基于批量样本的梯度可以表示为:
其中,m′表示小批量样本数,L(x,y,θ)是公式(9)的损失函数,随机梯度下降算法的网络模型参数更新如下:
θ←θ-αg (11)
其中,α是学习率;
采用上述的随机梯度下降法进行训练,训练的初始学习率设置为0.1,测试间隔设置为5000次训练时间,并保存网络模型参数,最大迭代次数设置为30万次,每10万次降低学习率10倍,当网络模型收敛时,可以提前停止训练,保存验证准确率最大的模型为最终模型;
步骤四,测试网络模型的有效性,本发明使用开源的脱机手写汉字数据集CASIA-HWDB,其中,采用CASIA-HWDB1.0和CASIA-HWDB1.1作为训练数据,将CASIA-HWDB-competition数据作为验证集数据,分别训练和测试了两个网络模型,一个是采用标准卷积的网络模型,一个是采用深度可分离卷积的网络模型,实验结果表明,标准卷积网络神经网络模型取得了96%的测试准确率;使用深度可分离卷积网络模型相比于标准卷积神经网络模型,模型容量和计算量均减少8到9倍,测试准确率为95.3%,相比而言,准确率仅降低了0.7%,本发明在损失了轻微的准确率的情况下,拥有更少的存储量和计算复杂度,能够更好地部署到计算资源和存储容量受限的设备当中,进行离线地计算。

Claims (1)

1.基于深度可分离卷积神经网络的脱机手写汉字识别方法,其特征在于:具体步骤如下:
步骤一,脱机手写汉字图像的预处理:深度可分离卷积神经网络的输入数据为单通道的灰度图像,大小为32×32,由于,原始图像大小不确定,所以首先对输入的原始图像进行缩放处理,缩放后的图像大小为32×32;所识别的手写汉字的原始背景颜色是白色,灰度值为255,为了减少计算量,将白色背景反转为黑色背景,灰度值为0;同时,汉字的亮度值也进行了反转,反转后的图像中更多的亮度值为0,图像矩阵更加稀疏,减少了计算量,原始图像的亮度值为Y(x,y),反转图像的亮度值为X(x,y),其中x,y是二维坐标位置,图像负像满足以下公式:
1.Y(x,y)=255-X(x,y) (1)
步骤二,设计一个基于深度可分离卷积的卷积神经网络模型:
针对设计的深度可分离卷积网络中所使用的深度可分离卷积进行详细说明,一个卷积层的输入特征图为X,大小为M×H×W,其中M是输入特征图通道数,H和W是输入特征图的高和宽;输出特征图为Y,大小为N×H′×W′,其中,N是输出特征图通道数,H′和W′是输出特征图的高和宽;卷积核为F,大小为C×K×K×N,其中,K是卷积核的大小,假设卷积步长和补边为1,由卷积的定义可知,有以下公式:
其参数量和计算复杂度分别为:
C×K×K×N (3)
C×K×K×N×H′×W′ (4)
深度可分离卷积中,每个卷积核对应只一个输入特征图,所以根据深度可分离卷积的定义,有以下公式:
为了保证有相同的输出特征图,在深度可分离卷积后面加入一个输出特征图为N的1×1标准卷积,其参数量和计算复杂度分别为:
C×K×K+C×1×1×N (6)
C×K×K×H′×W′+C×H′×W′×N (7)
使用深度可分离卷积,相比较于标准卷积,其计算复杂度和参数量都减少相同倍数。由公式(3)和公式(6)可得,
由公式(4)和(7)可得,
所以,当深度可分离卷积核K的大小为3时,相比于标准卷积,其参数量和计算复杂度要减少8到9倍;
使用深度可分离卷积,设计一个9层的深度可分离卷积神经网络,网络结构如下:
[Input]→[64C3]→2×[96dwC3,96C1]→[MP3]→2×[128dwC3,128C1]→2×[192dwC3,192C1]→
2×[384dwC3,384C1]→[Dropout]→[3755C1]→[GAP]→[3755SoftMax]
其中,64C3表示有64个3×3标准卷积,96dwC3表示有96个3×3深度可分离卷积,MP3表示最大池化层,GAP表示全局平均池化层,其它层的参数以此类推;需要说明的是,每一个标准卷积层和深度可分离卷积层,均使用ReLU激活函数和批量归一化操作,Dropout层的参数设置为0.5,脱机手写汉字类别包括常用的3755个汉字,SoftMax层输出节点为3755;
步骤三,训练深度可分离卷积神经网络,采用随机梯度下降法和反向传播算法训练,步骤二中,设计的网络模型输出是SoftMax层,根据SoftMax多分类函数的定义,有以下公式:
其中,是输出的类别概率;
在随机梯度下降法中,最小化损失函数来使网络模型收敛;在分类任务中,采用输出的交叉熵作为损失函数,其定义如下公式:
随机梯度下降法是基于小批量样本数据的算法,根据梯度下降法的定义,基于批量样本的梯度可以表示为:
其中,m′表示小批量样本数,L(x,y,θ)是公式(9)的损失函数,随机梯度下降算法的网络模型参数更新如下:
θ←θ-αg (11)
其中,α是学习率;
采用上述的随机梯度下降法进行训练,训练的初始学习率设置为0.1,测试间隔设置为5000次训练时间,并保存网络模型参数,最大迭代次数设置为30万次,每10万次降低学习率10倍,当网络模型收敛时,可以提前停止训练,保存验证准确率最大的模型为最终模型;步骤四,测试网络模型的有效性,本发明使用开源的脱机手写汉字数据集CASIA-HWDB,其中,采用CASIA-HWDB1.0和CASIA-HWDB1.1作为训练数据,将CASIA-HWDB-competition数据作为验证集数据,分别训练和测试了两个网络模型,一个是采用标准卷积的网络模型,一个是采用深度可分离卷积的网络模型,实验结果表明,标准卷积网络神经网络模型取得了96%的测试准确率;使用深度可分离卷积网络模型相比于标准卷积神经网络模型,模型容量和计算量均减少8到9倍,测试准确率为95.3%,相比而言,准确率仅降低了0.7%,本发明在损失了轻微的准确率的情况下,拥有更少的存储量和计算复杂度,能够更好地部署到计算资源和存储容量受限的设备当中,进行离线地计算。
CN201810729888.0A 2018-07-05 2018-07-05 基于深度可分离卷积神经网络的脱机手写汉字识别方法 Withdrawn CN108875696A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810729888.0A CN108875696A (zh) 2018-07-05 2018-07-05 基于深度可分离卷积神经网络的脱机手写汉字识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810729888.0A CN108875696A (zh) 2018-07-05 2018-07-05 基于深度可分离卷积神经网络的脱机手写汉字识别方法

Publications (1)

Publication Number Publication Date
CN108875696A true CN108875696A (zh) 2018-11-23

Family

ID=64299096

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810729888.0A Withdrawn CN108875696A (zh) 2018-07-05 2018-07-05 基于深度可分离卷积神经网络的脱机手写汉字识别方法

Country Status (1)

Country Link
CN (1) CN108875696A (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109766825A (zh) * 2019-01-08 2019-05-17 哈尔滨理工大学 基于神经网络的手写签名识别系统
CN110008861A (zh) * 2019-03-21 2019-07-12 华南理工大学 一种基于全局和局部特征学习的行人再识别方法
CN110210582A (zh) * 2019-06-17 2019-09-06 上海海事大学 一种基于局部协作表示分类的手写汉字识别方法
CN110232341A (zh) * 2019-05-30 2019-09-13 重庆邮电大学 基于卷积-堆叠降噪编码网络的半监督学习图像识别方法
CN110298899A (zh) * 2019-06-10 2019-10-01 天津大学 一种基于卷积神经网络特征图匹配的图像纹理合成方法
CN110490195A (zh) * 2019-08-07 2019-11-22 桂林电子科技大学 一种水表表盘读数识别方法
CN110659599A (zh) * 2019-09-19 2020-01-07 安徽七天教育科技有限公司 一种基于扫描试卷的离线笔迹鉴定系统以及使用方法
CN111123232A (zh) * 2019-11-11 2020-05-08 浙江大学 一种具有任务适应性的雷达个体识别系统
CN111435445A (zh) * 2019-12-24 2020-07-21 珠海大横琴科技发展有限公司 字符识别模型的训练方法及装置、字符识别方法及装置
CN111882053A (zh) * 2019-11-25 2020-11-03 华南理工大学 一种基于拼接卷积的神经网络模型压缩方法
CN111881794A (zh) * 2020-07-20 2020-11-03 元神科技(杭州)有限公司 一种视频行为识别方法及系统
CN111914993A (zh) * 2020-06-05 2020-11-10 西安理工大学 基于非均匀分组的多尺度轻量型深度卷积神经网络模型
CN112036461A (zh) * 2020-08-24 2020-12-04 湖北师范大学 手写数字图像识别方法、装置、设备及计算机存储介质
CN112699917A (zh) * 2020-12-11 2021-04-23 北京信息科技大学 一种非线性光学卷积神经网络的图像识别方法
CN113128614A (zh) * 2021-04-29 2021-07-16 西安微电子技术研究所 基于图像梯度的卷积方法、基于方向卷积的神经网络及分类方法
CN113205107A (zh) * 2020-11-02 2021-08-03 哈尔滨理工大学 一种基于改进高效率网络的车型识别方法
CN113705338A (zh) * 2021-07-15 2021-11-26 电子科技大学 一种改进的离线手写汉字识别方法
CN114581861A (zh) * 2022-03-02 2022-06-03 北京交通大学 一种基于深度学习卷积神经网络的轨道区域识别方法
CN115426055A (zh) * 2022-11-07 2022-12-02 青岛科技大学 一种基于解耦卷积神经网络的含噪水声信号盲源分离方法

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109766825A (zh) * 2019-01-08 2019-05-17 哈尔滨理工大学 基于神经网络的手写签名识别系统
CN110008861A (zh) * 2019-03-21 2019-07-12 华南理工大学 一种基于全局和局部特征学习的行人再识别方法
CN110232341B (zh) * 2019-05-30 2022-05-03 重庆邮电大学 基于卷积-堆叠降噪编码网络的半监督学习图像识别方法
CN110232341A (zh) * 2019-05-30 2019-09-13 重庆邮电大学 基于卷积-堆叠降噪编码网络的半监督学习图像识别方法
CN110298899A (zh) * 2019-06-10 2019-10-01 天津大学 一种基于卷积神经网络特征图匹配的图像纹理合成方法
CN110298899B (zh) * 2019-06-10 2023-04-07 天津大学 一种基于卷积神经网络特征图匹配的图像纹理合成方法
CN110210582A (zh) * 2019-06-17 2019-09-06 上海海事大学 一种基于局部协作表示分类的手写汉字识别方法
CN110490195A (zh) * 2019-08-07 2019-11-22 桂林电子科技大学 一种水表表盘读数识别方法
CN110659599A (zh) * 2019-09-19 2020-01-07 安徽七天教育科技有限公司 一种基于扫描试卷的离线笔迹鉴定系统以及使用方法
CN111123232A (zh) * 2019-11-11 2020-05-08 浙江大学 一种具有任务适应性的雷达个体识别系统
CN111123232B (zh) * 2019-11-11 2022-03-18 浙江大学 一种具有任务适应性的雷达个体识别系统
CN111882053B (zh) * 2019-11-25 2023-10-13 华南理工大学 一种基于拼接卷积的神经网络模型压缩方法
CN111882053A (zh) * 2019-11-25 2020-11-03 华南理工大学 一种基于拼接卷积的神经网络模型压缩方法
CN111435445A (zh) * 2019-12-24 2020-07-21 珠海大横琴科技发展有限公司 字符识别模型的训练方法及装置、字符识别方法及装置
CN111914993B (zh) * 2020-06-05 2024-04-16 西安理工大学 基于非均匀分组的多尺度深度卷积神经网络模型构建方法
CN111914993A (zh) * 2020-06-05 2020-11-10 西安理工大学 基于非均匀分组的多尺度轻量型深度卷积神经网络模型
CN111881794A (zh) * 2020-07-20 2020-11-03 元神科技(杭州)有限公司 一种视频行为识别方法及系统
CN111881794B (zh) * 2020-07-20 2023-10-10 元神科技(杭州)有限公司 一种视频行为识别方法及系统
CN112036461A (zh) * 2020-08-24 2020-12-04 湖北师范大学 手写数字图像识别方法、装置、设备及计算机存储介质
CN112036461B (zh) * 2020-08-24 2023-06-02 湖北师范大学 手写数字图像识别方法、装置、设备及计算机存储介质
CN113205107A (zh) * 2020-11-02 2021-08-03 哈尔滨理工大学 一种基于改进高效率网络的车型识别方法
CN112699917A (zh) * 2020-12-11 2021-04-23 北京信息科技大学 一种非线性光学卷积神经网络的图像识别方法
CN113128614A (zh) * 2021-04-29 2021-07-16 西安微电子技术研究所 基于图像梯度的卷积方法、基于方向卷积的神经网络及分类方法
CN113128614B (zh) * 2021-04-29 2023-06-16 西安微电子技术研究所 基于图像梯度的卷积方法、基于方向卷积的神经网络及分类方法
CN113705338B (zh) * 2021-07-15 2023-04-07 电子科技大学 一种改进的离线手写汉字识别方法
CN113705338A (zh) * 2021-07-15 2021-11-26 电子科技大学 一种改进的离线手写汉字识别方法
CN114581861A (zh) * 2022-03-02 2022-06-03 北京交通大学 一种基于深度学习卷积神经网络的轨道区域识别方法
CN115426055A (zh) * 2022-11-07 2022-12-02 青岛科技大学 一种基于解耦卷积神经网络的含噪水声信号盲源分离方法

Similar Documents

Publication Publication Date Title
CN108875696A (zh) 基于深度可分离卷积神经网络的脱机手写汉字识别方法
CN106250939B (zh) 基于fpga+arm多层卷积神经网络的手写体字符识别方法
CN108510012A (zh) 一种基于多尺度特征图的目标快速检测方法
CN110322495A (zh) 一种基于弱监督深度学习的场景文本分割方法
AU2020101435A4 (en) A panoramic vision system based on the uav platform
CN108710906B (zh) 基于轻量级网络LightPointNet的实时点云模型分类方法
CN111259880B (zh) 一种基于卷积神经网络的电力操作票文字识别方法
Zhang et al. Content-adaptive sketch portrait generation by decompositional representation learning
Li et al. LPSNet: a novel log path signature feature based hand gesture recognition framework
CN114255238A (zh) 一种融合图像特征的三维点云场景分割方法及系统
CN108052884A (zh) 一种基于改进残差神经网络的手势识别方法
WO2023065759A1 (zh) 基于时空增强网络的视频动作识别方法
CN110059593B (zh) 一种基于反馈卷积神经网络的面部表情识别方法
CN107704859A (zh) 一种基于深度学习训练框架的文字识别方法
CN109948457B (zh) 基于卷积神经网络和cuda加速的实时目标识别方法
CN112862690A (zh) 一种基于Transformers的低分辨率图像超分辨方法及系统
Mao et al. Classroom micro-expression recognition algorithms based on multi-feature fusion
CN114581918A (zh) 一种文本识别模型训练方法及装置
Han et al. BLNet: Bidirectional learning network for point clouds
CN108460772B (zh) 基于卷积神经网络的广告骚扰传真图像检测系统及方法
CN113903043B (zh) 一种基于孪生度量模型的印刷汉字字体识别方法
Zhang et al. Research On Face Image Clustering Based On Integrating Som And Spectral Clustering Algorithm
CN113313127B (zh) 文本图像识别方法、装置、计算机设备和存储介质
CN115587628A (zh) 一种深度卷积神经网络轻量化方法
Liu et al. Multi-digit Recognition with Convolutional Neural Network and Long Short-term Memory

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20181123

WW01 Invention patent application withdrawn after publication