CN107967497A - 基于卷积神经网络和极限学习机的手写体识别方法 - Google Patents

基于卷积神经网络和极限学习机的手写体识别方法 Download PDF

Info

Publication number
CN107967497A
CN107967497A CN201710748310.5A CN201710748310A CN107967497A CN 107967497 A CN107967497 A CN 107967497A CN 201710748310 A CN201710748310 A CN 201710748310A CN 107967497 A CN107967497 A CN 107967497A
Authority
CN
China
Prior art keywords
neural networks
convolutional neural
layer
test
learning machine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710748310.5A
Other languages
English (en)
Inventor
张文博
王阳
朱鑫
刘其民
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunpad Communication (kunshan) Co Ltd
Kunshan Kunpeng Uav Technology Co Ltd
Suzhou Ming Yi Think Tank Mdt Infotech Ltd
Original Assignee
Kunpad Communication (kunshan) Co Ltd
Kunshan Kunpeng Uav Technology Co Ltd
Suzhou Ming Yi Think Tank Mdt Infotech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunpad Communication (kunshan) Co Ltd, Kunshan Kunpeng Uav Technology Co Ltd, Suzhou Ming Yi Think Tank Mdt Infotech Ltd filed Critical Kunpad Communication (kunshan) Co Ltd
Priority to CN201710748310.5A priority Critical patent/CN107967497A/zh
Publication of CN107967497A publication Critical patent/CN107967497A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • G06V30/244Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
    • G06V30/2455Discrimination between machine-print, hand-print and cursive writing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Character Discrimination (AREA)

Abstract

一种基于卷积神经网络和极限学习机的手写体识别方法,其步骤为初始化,构建卷积神经网络层,随机产生加权极限学习机的输入权值W与隐层偏置b;划分数据集产生训练样本和测试样本并进行数据预处理;进行卷积神经网络提取特征,得到训练集特征和测试机特征;根据训练集特征训练极限学习机分类器得到输出权重,根据测试机特征及输出权重,得到最终的手写识别结果。本发明相比较单纯使用极限学习机,其可以提高准确率,缩短测试和训练时间。

Description

基于卷积神经网络和极限学习机的手写体识别方法
技术领域
本发明属于计算机视觉领域,特别涉及一种手写体识别方法,主要可用于光学字符识别。
背景技术
手写体识别是计算机视觉领域的基础研究内容,它的主要任务是在纸、照片、触摸屏或其他设备中接受并识别人手写的文字等信息。
手写体识别主要可以分为两类:脱机手写识别和在线手写识别。其中脱机手写识别比较困难,因为不同的人具有不同的书写风格。目前大部分手写体识别都采用了人工神经网络,并且取得了较好的识别效果,但是由于人工神经网络存在着训练花费时间过大,容易陷入局部最优解等缺点。而很多先前工作也表明,将神经网络和其他分类器结合使用往往能取得更好的结果,消除陷入局部最优解的缺点。
发明内容
本发明的目的在于针对上述已有手写体识别技术中存在的问题,提出一种基于卷积神经网络和极限学习机的手写体识别方法,可以提高手写体识别训练的速度同时避免模型陷入局部最优解。同时相比于直接使用目前流行的极限学习机作为分类器,卷积神经网络的使用提供了比原始图像更高层次的特征,这将导致识别效果优于单纯的极限学习机。
实现本发明的技术关键是:结合卷积神经网络与极限学习机实现手写体的识别,即使用卷积神经网络提取更高层次的图像特征,接着使用极限学习机作为分类器进行手写体的识别。考虑到具体的训练时间,我们将基于卷积网络和极限学习机的模型分为两个版本:快速版本和精确版本,精确版本比快速版本训练时间长,精度高。以快速版本为基准,在快速版本基础上通过提高训练时间,提高识别精度。
本发明的技术方案一种基于卷积神经网络和极限学习机的手写体识别方法,其步骤如下
(6)初始化:
(1a)构建卷积神经网络;
(1b)随机产生加权极限学习机的输入权值与隐层偏置;
(7)划分数据集产生训练样本train和测试样本test;
(8)数据预处理:
(3a)将训练集数据进行归一化处理:train=train/255;
(3b)将测试集数据进行归一化处理:test=test/255;
(9)卷积神经网络提取特征:
(4a)随机产生卷积神经网络的卷积核;
(4b)使用初始化后的卷积神经网络,输入训练集,运行前馈神经网络,在最后一个池化层得到卷积神经网络提取的训练集特征;
(4c)使用初始化后的卷积神经网络,输入测试集,运行前馈神经网络,在最后一个池化层得到卷积神经网络提取的测试集特征;
(10)训练极限学习机分类器:
(5a)将卷积神经网络提取的训练集特征p输入到极限学习机中,根据标签得到极限学习机的输出权重;
(5b)将卷积神经网络提取的测试集特征q输入到极限学习机中,得到最终的手写体识别结果。
为了得到更精确的结果,在步骤4中,(4a)随机产生卷积神经网络的卷积核;
(4b)使用初始化后的卷积神经网络,输入训练集,训练卷积神经网络,得到一个训练好的卷积神经网络模型;
(4c)使用训练好的卷积神经网络模型,输入训练集,运行其前馈神经网络,在最后一个池化层得到卷积神经网络提取的训练集特征;
(4d)使用训练好的卷积神经网络模型,输入测试集,运行前馈神经网络,在最后一个池化层得到卷积神经网络提取的测试集特征。
通过使用训练好的卷积神经网络模型,虽然比较使用初始化的卷积神经网络耗费的时间比较长,但是其结果却更精确。
上述步骤(2)划分数据集产生训练样本和测试样本的数据来源于MNIST数据库,随机选取其中数张图片作为训练样本train,随机选取数张图片作为测试样本test。
上述步骤(3)中,步骤(3a)将训练集数据进行归一化处理,train=train/255,其中train为训练集样本;步骤(3b)将测试集数据进行归一化处理:test=test/255,test为测试集样本。
上述步骤(1a)中所述卷积神经网络结构由输入层、第一卷积层、第一池化层、第二卷积层、第二池化层和全连接层构成,卷积层步长为d,卷积层激活函数为g(.);步骤(5)中选择极限学习机作为分类器,确定它的隐层激励函数为g(·),所述函数g(·)的公式如下:
池化层下采样函数为均池化函数down(.):取四个点均值;选定隐层节点个数为L。
上述的卷积层公式:
X代表该层输入数据;K为卷积核,b为归一化后测试样本或第i个隐层单元的偏置,
其中代表第l层第j个特征图,f(·)代表卷积层的激活函数,代表第l层第i个输入图像第j个输出图像对应的卷积核,代表该层的偏置,Mj表示输入特征图集合。
上述的池化层公式:
X代表该层输入数据;b为归一化后测试样本或第i个隐层单元的偏置;
其中代表第l层第j个特征图,代表该特征图对应的偏置,down(·)代表下采样函数,下采样窗口为n*n,特征图经过下采样后缩小了n倍。
所述L个隐层节点的单隐层极限学习机网络可以表示为:
其中βi代表输出权重系数,g()代表激活函数,Wi×pj表示Wi和pj的内积;oj为输出的手写体识别结果。
本发明与现有技术相比,具有以下优点:
1.本发明运用结合了卷积神经网络和极限学习机两种模型的优点,使用卷积神经网络可以提取更高层次的特征,使用极限学习机作为分类器可以缩短模型训练时间同时消除卷积神经网络中陷入局部最优值的缺点。而精确版本和快速版本最大的区别在于使用的卷积神经网络是否是训练好的,训练好的卷积神经网络可以在增加训练时间的条件下提高整个模型的准确率;
2.本发明相比于单纯地使用极限学习机进行手写体识别而言,卷积神经网络的加入减少了极限学习机中隐层结点数,而极限学习机中隐层结点数关系到整个模型运行时占用的内存,加入卷积神经网络后极大地减小了模型运行的内存,当然取得的结果也比单纯应用极限学习机的准确率高很多。
3.本发明相比于单纯地使用卷积神经网络进行手写体识别而言,使用极限学习机作为分类器可以消除卷积神经网络陷入局部最优值的缺点,理论上在增大隐层结点数的条件下可以得到比单纯使用卷积神经网络更高的精确度,同时快速版本的方法可以省去卷积神经网络的训练时间,在时间上远少于单纯的使用卷积神经网络进行手写体识别。
附图说明
图1,是本发明的实现流程图。
图2,卷积网络结构图。
具体实施方式
以下参照附图,以快速版本为例对本发明的技术方案和效果进行进一步说明:
参照图1,本发明的具体实施步骤如下:
步骤1.初始化。
1.1)初始化卷积神经网络:结构如附图2所示,卷积层步长为d,卷积层激活函数为g(.):
池化层下采样函数为均池化函数down(.):取四个点均值
1.2)选择极限学习机作为分类器,确定它的隐层激励函数g(·)为sigmoid函数:
并选定隐层节点个数为L;
1.3)随机产生加权极限学习机网络的输入权值W与隐层偏置b,表示如下:
Wi=[wi,1,wi,2,…,wi,n]T
bi为第i个隐层单元的偏置。
T代表矩阵转置
步骤2.划分样本。
2.1)样本来源于MNIST数据库,随机从中取出其中42000张图片作为训练样本A:
Ai=[a1,a2,…,a42000]T,aj代表了第i张图片
选28000张图片作为测试样本Z:
Zi=[Z1,Z2,Z3,Z4…Z28000]T,Zi代表了第i张图片
2.2)为了方便重复实验我们可以从kaggle网站上下载数据集(https://www.kaggle.com/c/digit-recognizer)。
步骤3.数据预处理。
3.1)将训练样本集A归一化:
3.2)将测试样本Z归一化:
其中,ai,zi分别表示第i张训练或测试图片。
步骤4.卷积网络提取特征。
4.1)随机产生卷积神经网络的卷积核ki,j
4.2)训练卷积神经网络:
4.2.1)卷积层公式:
其中代表第l层第j个特征图,f(·)代表卷积层的激活函数,代表第l层第i个输入图像第j个输出图像对应的卷积核,代表该层的偏置,Mj表示输入特征图集合。
X代表该层输入数据。
4.2.2)池化层公式:
其中代表第l层第j个特征图,代表该特征图对应的偏置,down(·)代表下采样函数,下采样窗口为n*n,特征图经过下采样后缩小了n倍。
4.3)使用随机卷积核的神经网络模型提取训练样本的特征p;
4.4)使用随机卷积核的神经网络模型提取测试样本的特征q;
步骤5.极限学习机分类。
5.1)L个隐层节点的单隐层极限学习机网络可以表示为:
其中Wi×pj表示Wi和pj的内积。
其中βi代表输出权重系数,g()代表激活函数,Wi×pj表示Wi和pj的内积
5.2)训练极限学习机
隐层节点输出H为:
则训练得到的输出权重为:
β^=H-1T
其中T为训练样本的标签,H-1为隐层输出的广义逆。
5.3)使用极限学习机进行测试:
其中βi代表输出权重系数,g()代表激活函数,Wi×pj表示Wi和pj的内积。
其中输出oj就是手写体识别结果。
为了取得更精确的图像特征,在快速版本的基础上增加了精确版本,使其手写识别结果更精确。精确版本和快速版本的区别主要在于步骤4,快速版本采用随机使用随机卷积核的神经网络模型提取训练样本的特征p;使用随机卷积核的神经网络模型提取测试样本的特征q;精确版本则使用经过训练好的卷积核的神经网络模型提取训练样本的特征p;使用训练好的卷积核的神经网络模型提取测试样本的特征q;由于训练好的样本需要训练时间,因此,精确版本耗费时长比快速版本长,但是其结果更精确。具体见精确版本的步骤4。
精确版本的步骤4如下:
步骤4.卷积网络提取特征。
4.1)随机产生卷积神经网络的卷积核ki,j
4.2)训练卷积神经网络:
4.2.1)卷积层公式:
其中代表第l层第j个特征图,f(·)代表卷积层的激活函数,代表第l层第i个输入图像第j个输出图像对应的卷积核,代表该层的偏置,Mj表示输入特征图集合,X代表该层输入数据。
4.2.2)池化层公式:
其中代表第l层第j个特征图,代表该特征图对应的偏置,down(·)代表下采样函数,下采样窗口为n*n,特征图经过下采样后缩小了n倍。
训练整个卷积神经网络,直至微调完模型中所有参数。
4.3)使用训练好的卷积核的神经网络模型提取训练样本的特征p;
4.4)使用训练好的卷积核的神经网络模型提取测试样本的特征q;
本发明的效果可通过以下实验进一步说明:
1.实验条件。
实验环境:计算机采用Intel(R) Core(TM) i5-3230M CPU@2.60Ghz,12GB内存,软件采用Matlab2012a仿真实验平台。
实验参数:卷积神经网络卷积层步长d=1,极限学习机隐层节点数L=2000。
2.实验内容与结果。
实验:使用本发明的快速版本,精确版本和极限学习机进行比较,最终结果见表1。
表一
测试集准确率 训练时间(s) 测试时间(s)
极限学习机 0.9556 981.4959 8.9857
快速版本 0.9771 867.4280 3.9936
精确版本 0.9889 883.1841 4.2120
从表一可以得出,本发明相比于极限学习机,不论快速版本或精确版本均可以提高不少的准确率,其中精确版本比快速版本准确率提高不少。

Claims (7)

1.一种基于卷积神经网络和极限学习机的手写体识别方法,其步骤如下
(1)初始化:
(1a)构建卷积神经网络;
(1b)随机产生加权极限学习机的输入权值与隐层偏置;
(2)划分数据集产生训练样本train和测试样本test;
(3)数据预处理:
(3a)将训练集数据进行归一化处理:train=train/255;
(3b)将测试集数据进行归一化处理:test=test/255;
(4)卷积神经网络提取特征:
(4a)随机产生卷积神经网络的卷积核;
(4b)使用初始化后的卷积神经网络,输入训练集,运行前馈神经网络,在最后一个池化层得到卷积神经网络提取的训练集特征;
(4c)使用初始化后的的卷积神经网络,输入测试集,运行前馈神经网络,在最后一个池化层得到卷积神经网络提取的测试集特征;
(5)训练极限学习机分类器:
(5a)将卷积神经网络提取的训练集特征p输入到极限学习机中,根据标签得到极限学习机的输出权重;
(5b)将卷积神经网络提取的测试集特征q输入到极限学习机中,得到最终的手写体识别结果。
2.根据权利要求1所述的基于卷积神经网络和极限学习机的手写体识别方法,其特征在于在所述步骤(4)卷积神经网络提取特征具体为:
(4a)随机产生卷积神经网络的卷积核;
(4b)使用初始化后的卷积神经网络,输入训练集,训练卷积神经网络,得到一个训练好的卷积神经网络模型;
(4c)使用训练好的卷积神经网络模型,输入训练集,运行其前馈神经网络,在最后一个池化层得到卷积神经网络提取的训练集特征;
(4d)使用训练好的卷积神经网络模型,输入测试集,运行前馈神经网络,在最后一个池化层得到卷积神经网络提取的测试集特征。
3.根据权利要求1或2所述的基于卷积神经网络和极限学习机的手写体识别方法,其特征在于步骤(2)划分数据集产生训练样本和测试样本的数据来源于MNIST数据库,随机选取其中数张图片作为训练样本train,随机选取数张图片作为测试样本test。
4.根据权利要求1或2所述的基于卷积神经网络和极限学习机的手写体识别方法,其特征在于步骤(3)中,步骤(3a)将训练集数据进行归一化处理,train=train/255,其中train为训练集样本;步骤(3b)将测试集数据进行归一化处理:test=test/255,test为测试集样本。
5.根据权利要求1或2所述的基于卷积神经网络和极限学习机的手写体识别方法,其特征在于步骤(1a)中所述卷积神经网络结构由输入层、第一卷积层、第一池化层、第二卷积层、第二池化层和全连接层构成,卷积层步长为d,卷积层激活函数为g(.);步骤(5)中选择极限学习机作为分类器,确定它的隐层激励函数为g(·),所述函数g(·)的公式如下:
池化层下采样函数为均池化函数down(.):取四个点均值;选定隐层节点个数为L。
6.根据权利要求5所述的基于卷积神经网络和极限学习机的手写体识别方法,其特征在于卷积层公式:
X代表该层输入数据;K为卷积核,b为归一化后测试样本或第i个隐层单元的偏置,
其中代表第l层第j个特征图,f(·)代表卷积层的激活函数,代表第l层第i个输入图像第j个输出图像对应的卷积核,代表该层的偏置,Mj表示输入特征图集合。
池化层公式:
X代表该层输入数据;b为归一化后测试样本或第i个隐层单元的偏置,
其中代表第l层第j个特征图,代表该特征图对应的偏置,down(·)代表下采样函数,下采样窗口为n*n,特征图经过下采样后缩小了n倍。
7.根据权利要求5所述的基于卷积神经网络和极限学习机的手写体识别方法,其特征在于L个隐层节点的单隐层极限学习机网络可以表示为:
其中βi代表输出权重系数,g()代表激活函数,Wi×pj表示Wi和pj的内积。
CN201710748310.5A 2017-08-28 2017-08-28 基于卷积神经网络和极限学习机的手写体识别方法 Pending CN107967497A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710748310.5A CN107967497A (zh) 2017-08-28 2017-08-28 基于卷积神经网络和极限学习机的手写体识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710748310.5A CN107967497A (zh) 2017-08-28 2017-08-28 基于卷积神经网络和极限学习机的手写体识别方法

Publications (1)

Publication Number Publication Date
CN107967497A true CN107967497A (zh) 2018-04-27

Family

ID=61996689

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710748310.5A Pending CN107967497A (zh) 2017-08-28 2017-08-28 基于卷积神经网络和极限学习机的手写体识别方法

Country Status (1)

Country Link
CN (1) CN107967497A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109035488A (zh) * 2018-08-07 2018-12-18 哈尔滨工业大学(威海) 基于cnn特征提取的航空发动机时间序列异常检测方法
CN109064478A (zh) * 2018-07-17 2018-12-21 暨南大学 一种基于极限学习机的天文图像轮廓提取方法
CN109271947A (zh) * 2018-09-28 2019-01-25 合肥工业大学 一种基于热成像的夜间实时手语识别系统
CN109730652A (zh) * 2019-03-08 2019-05-10 江苏霆升科技有限公司 室性早搏定位识别方法及装置
CN112183550A (zh) * 2020-09-09 2021-01-05 上海鹰觉科技有限公司 基于深度学习的船舶分类识别方法
CN113591913A (zh) * 2021-06-28 2021-11-02 河海大学 一种支持增量学习的图片分类方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104992165A (zh) * 2015-07-24 2015-10-21 天津大学 基于极限学习机的交通标志识别方法
CN105068644A (zh) * 2015-07-24 2015-11-18 山东大学 一种基于卷积神经网络的p300脑电信号检测方法
CN106096543A (zh) * 2016-06-08 2016-11-09 东华大学 一种基于改进型极限学习机的手写数字识别方法
US20160378861A1 (en) * 2012-09-28 2016-12-29 Sri International Real-time human-machine collaboration using big data driven augmented reality technologies
CN106295516A (zh) * 2016-07-25 2017-01-04 天津大学 基于图像的雾霾pm2.5值估计方法
CN107069708A (zh) * 2017-03-14 2017-08-18 国网湖北省电力公司 一种基于极限学习机的输电网线路有功安全校正方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160378861A1 (en) * 2012-09-28 2016-12-29 Sri International Real-time human-machine collaboration using big data driven augmented reality technologies
CN104992165A (zh) * 2015-07-24 2015-10-21 天津大学 基于极限学习机的交通标志识别方法
CN105068644A (zh) * 2015-07-24 2015-11-18 山东大学 一种基于卷积神经网络的p300脑电信号检测方法
CN106096543A (zh) * 2016-06-08 2016-11-09 东华大学 一种基于改进型极限学习机的手写数字识别方法
CN106295516A (zh) * 2016-07-25 2017-01-04 天津大学 基于图像的雾霾pm2.5值估计方法
CN107069708A (zh) * 2017-03-14 2017-08-18 国网湖北省电力公司 一种基于极限学习机的输电网线路有功安全校正方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
LILI GUO 等: "A Hybrid Deep Learning CNN-ELM Model and Its Application in Handwritten Numeral Recognition", 《JOURNAL OF COMPUTATIONAL INFORMATION SYSTEMS》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109064478A (zh) * 2018-07-17 2018-12-21 暨南大学 一种基于极限学习机的天文图像轮廓提取方法
CN109035488A (zh) * 2018-08-07 2018-12-18 哈尔滨工业大学(威海) 基于cnn特征提取的航空发动机时间序列异常检测方法
CN109271947A (zh) * 2018-09-28 2019-01-25 合肥工业大学 一种基于热成像的夜间实时手语识别系统
CN109730652A (zh) * 2019-03-08 2019-05-10 江苏霆升科技有限公司 室性早搏定位识别方法及装置
CN112183550A (zh) * 2020-09-09 2021-01-05 上海鹰觉科技有限公司 基于深度学习的船舶分类识别方法
CN113591913A (zh) * 2021-06-28 2021-11-02 河海大学 一种支持增量学习的图片分类方法及装置
CN113591913B (zh) * 2021-06-28 2024-03-29 河海大学 一种支持增量学习的图片分类方法及装置

Similar Documents

Publication Publication Date Title
CN107967497A (zh) 基于卷积神经网络和极限学习机的手写体识别方法
Pu et al. Variational autoencoder for deep learning of images, labels and captions
CN109376242B (zh) 基于循环神经网络变体和卷积神经网络的文本分类方法
CN111242841B (zh) 一种基于语义分割和深度学习的图片背景风格迁移方法
Mao et al. Explain images with multimodal recurrent neural networks
US10963685B2 (en) Generating variations of a known shred
CN110826338B (zh) 一种单选择门与类间度量的细粒度语义相似识别的方法
CN110110323B (zh) 一种文本情感分类方法和装置、计算机可读存储介质
CN109740148A (zh) 一种BiLSTM结合Attention机制的文本情感分析方法
CN109063719B (zh) 一种联合结构相似性和类信息的图像分类方法
CN103258210B (zh) 一种基于字典学习的高清图像分类方法
CN109582782A (zh) 一种基于用弱监督深度学习的文本聚类方法
CN108121975A (zh) 一种联合原始数据和生成数据的人脸识别方法
CN114818891B (zh) 小样本多标签文本分类模型训练方法及文本分类方法
CN107729311A (zh) 一种融合文本语气的中文文本特征提取方法
CN111968193A (zh) 一种基于StackGAN网络的文本生成图像方法
Hu et al. Sketch-a-classifier: Sketch-based photo classifier generation
CN109062958B (zh) 一种基于TextRank和卷积神经网络的小学作文自动分类方法
Baluja Learning typographic style
CN115270752A (zh) 一种基于多层次对比学习的模板句评估方法
CN113806543B (zh) 一种基于残差跳跃连接的门控循环单元的文本分类方法
CN109086463A (zh) 一种基于区域卷积神经网络的问答社区标签推荐方法
Khayyat et al. A deep learning based prediction of arabic manuscripts handwriting style.
CN113409157B (zh) 一种跨社交网络用户对齐方法以及装置
CN112801092B (zh) 一种自然场景图像中字符元素检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180427