CN109919192A - 一种基于卷积神经网络和词向量的图像分类方法及系统 - Google Patents

一种基于卷积神经网络和词向量的图像分类方法及系统 Download PDF

Info

Publication number
CN109919192A
CN109919192A CN201910090400.9A CN201910090400A CN109919192A CN 109919192 A CN109919192 A CN 109919192A CN 201910090400 A CN201910090400 A CN 201910090400A CN 109919192 A CN109919192 A CN 109919192A
Authority
CN
China
Prior art keywords
term vector
collection
vector
image data
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910090400.9A
Other languages
English (en)
Inventor
姚宏
贾浩森
刘超
董理君
康晓军
李新川
李圣文
梁庆中
郑坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Geosciences
Original Assignee
China University of Geosciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Geosciences filed Critical China University of Geosciences
Priority to CN201910090400.9A priority Critical patent/CN109919192A/zh
Publication of CN109919192A publication Critical patent/CN109919192A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于卷积神经网络和词向量的图像分类方法及系统,其方法包括:首先获取训练用的图像数据集和语料数据集;然后对所述语料数据集进行词向量生成处理,获取所述语料数据集对应的词向量集,并根据词向量集,得到标签对应的词语的语义向量集;进而,对所述训练用的图像数据集做预处理,并将预处理后的图像数据集和标签对应的词语的语义向量集输入图片分类模型,以对图片分类模型进行训练,得到训练后的图片分类模型;最后利用训练好的图片分类模型,对待分类图片进行图片分类。本发明的有益效果是:在原有的图像卷积分类的基础上添加标签词向量,并利用标签词向量调节图片分类模型的内部参数,从而大大提高了图像分类的准确率。

Description

一种基于卷积神经网络和词向量的图像分类方法及系统
技术领域
本发明涉及图像分类领域,尤其涉及一种基于卷积神经网络和词向量的图像分类方法及系统。
背景技术
随着计算机技术的发展,图像分类技术不仅是学术界的研究热点,同时在现实生活中也越来越受到各大互联网公司的重点关注。
对图像进行分类,可以解放人工标注的成本,大大减少劳动力,同时机器识别比人眼识别更加精确。
虽然图像分类在很多领域有广泛的应用,各种各样的图像分类方法也被提出,例如有基于纹理的图像分类技术、基于形状的图像分类技术,还有基于空间关系的图像分类技术等。但是,目前的图像分类方法还存在着很多问题。首先是图像分类的准确度不高,这让情感分析在实际的应用中很难发挥很大的作用。其次是图像分类的方法很多都依赖于人工的设计和参与,耗费了大量的人力与物力,推广能力较差。
本发明针对传统的图片分类方法只单独考虑图片的信息,而忽略了图像的标签导致分类的准确率不高的问题,在原有的图像卷积分类的基础上添加标签词向量,并利用标签词向量调节图片分类模型的内部参数,从而大大提高了图像分类的准确率。
发明内容
为了解决传统的图片分类方法只单独考虑图片的信息,而忽略了图像的标签导致分类的准确率不高的问题,本发明提供了一种基于卷积神经网络和词向量的图像方法及系统,一种基于卷积神经网络和词向量的图像方法,主要包括以下步骤:
S101:根据待分类图片,从各开源图像数据库中选择并获取训练用的图像数据集;所述训练用的图像数据集中包含多张图片,每张图片均对应有分类标签;
S102:根据所述训练用的图像数据集,获取对应的语料数据集;所述语料数据集需包含所述训练用的图像数据集中所有图片对应的分类标签;
S103:对所述语料数据集进行词向量生成处理,获取所述语料数据集对应的词向量集;并从所述词向量集中获取所述训练用的图像数据集中每张图片的标签所对应的词向量,得到标签对应的词语的语义向量集;
S104:对所述训练用的图像数据集做预处理,以将所述训练用的图像数据集中的所有照片的处理为相同的大小和格式,得到预处理后的图像数据集;
S105:将预处理后的图像数据集和标签对应的词语的语义向量集输入图片分类模型,以对图片分类模型进行训练,得到训练后的图片分类模型;所述图片分类模型为LeNet-5卷积神经网络模型;
S106:利用训练好的图片分类模型,对待分类图片进行图片分类。
进一步地,步骤S103中,所述语料数据集采用Text8或者Wikimedia数据集。
进一步地,步骤S103中,对所述语料数据集进行词向量生成处理,获取所述语料数据集对应的词向量集的方法为:根据所述语料数据集,采用Word2Vec词向量生成工具将所述语料数据集中的所有词汇转换为N维的词向量,得到语料数据集对应的词向量集;其中,所述Word2Vec词向量生成工具为已利用skip-gram模型完成词向量训练的Word2Vec词向量生成工具;N为大于1的正整数。
进一步地,步骤S105中,所述LeNet-5卷积神经网络模型依次包括:卷积层、池化层和全连接层;将预处理后的图像数据集和标签对应的词语的语义向量集输入图片分类模型,以对图片分类模型进行训练,得到训练后的图片分类模型的步骤包括:
S201:将预处理后的图像数据集和标签对应的词语的语义向量集作为输入,输入至卷积层,得到所述预处理后的图像数据集的特征矩阵;
S202:将得到的特征矩阵输入池化层,进行池化操作,以去除所述特征矩阵中的噪声,得到池化后的特征矩阵;
S203:将池化后的特征矩阵输入至全连接层,得到预测向量;其中,预测向量的维度与所述标签对应的词语的语义向量的维度相同;
S204:根据所述预测向量和所述标签对应的词语的语义向量,反向调节卷积层、池化层和全连接层的内部参数,并将参数调节后的LeNet-5卷积神经网络模型作为新的图片分类模型;
S205:判断是否达到预先设定的最大迭代次数?若是,则到步骤S206;否则,返回步骤S201;
S206:将此时的图片分类模型作为训练后的图片分类模型。
进一步地,步骤S204中,反向调节卷积层、池化层和全连接层的内部参数所使用的损失函数f(x)如下所示:
f(x)=cos(xtrue,xpred)
上式中,xtrue为所述标签对应的词语的语义向量;xpred为所述预测向量。
进一步地,一种基于卷积神经网络和词向量的图像分类系统,其特征在于:包括以下模块:
训练数据获取模块,用于根据待分类图片,从各开源图像数据库中选择并获取训练用的图像数据集;所述训练用的图像数据集中包含多张图片,每张图片均对应有分类标签;
语料数据获取模块,用于根据所述训练用的图像数据集,获取对应的语料数据集;所述语料数据集需包含所述训练用的图像数据集中所有图片对应的分类标签;
语义向量获取模块,用于对所述语料数据集进行词向量生成处理,获取所述语料数据集对应的词向量集;并从所述词向量集中获取所述训练用的图像数据集中每张图片的标签所对应的词向量,得到标签对应的词语的语义向量集;
预处理模块,用于对所述训练用的图像数据集做预处理,以将所述训练用的图像数据集中的所有照片的处理为相同的大小和格式,得到预处理后的图像数据集;
模型训练模块,用于将预处理后的图像数据集和标签对应的词语的语义向量集输入图片分类模型,以对图片分类模型进行训练,得到训练后的图片分类模型;所述图片分类模型为LeNet-5卷积神经网络模型;
图片分类模块,用于利用训练好的图片分类模型,对待分类图片进行图片分类。
进一步地,语义向量获取模块中,所述语料数据集采用Text8或者Wikimedia数据集。
进一步地,语义向量获取模块中,对所述语料数据集进行词向量生成处理,获取所述语料数据集对应的词向量集的方法为:根据所述语料数据集,采用Word2Vec词向量生成工具将所述语料数据集中的所有词汇转换为N维的词向量,得到语料数据集对应的词向量集;其中,所述Word2Vec词向量生成工具为已利用skip-gram模型完成词向量训练的Word2Vec词向量生成工具;N为大于1的正整数。
进一步地,模型训练模块中,所述LeNet-5卷积神经网络模型依次包括:卷积层、池化层和全连接层;将预处理后的图像数据集和标签对应的词语的语义向量集输入图片分类模型,以对图片分类模型进行训练,得到训练后的图片分类模型的步骤包括以下单元:
卷积单元,用于将预处理后的图像数据集和标签对应的词语的语义向量集作为输入,输入至卷积层,得到所述预处理后的图像数据集的特征矩阵;
池化单元,用于将得到的特征矩阵输入池化层,进行池化操作,以去除所述特征矩阵中的噪声,得到池化后的特征矩阵;
全连接单元,用于将池化后的特征矩阵输入至全连接层,得到预测向量;其中,预测向量的维度与所述标签对应的词语的语义向量的维度相同;
参数调节单元,用于根据所述预测向量和所述标签对应的词语的语义向量,反向调节卷积层、池化层和全连接层的内部参数,并将参数调节后的LeNet-5卷积神经网络模型作为新的图片分类模型;
判断单元,用于判断是否达到预先设定的最大迭代次数?若是,则到结束单元;否则,返回卷积单元;
结束单元,用于将此时的图片分类模型作为训练后的图片分类模型。
进一步地,参数调节单元中,反向调节卷积层、池化层和全连接层的内部参数所使用的损失函数f(x)如下所示:
f(x)=cos(xtrue,xpred)
上式中,xtrue为所述标签对应的词语的语义向量;xpred为所述预测向量。
本发明提供的技术方案带来的有益效果是:本发明所提出的技术方案,针对传统的图片分类方法只单独考虑图片的信息,而忽略了图像的标签导致分类的准确率不高的问题,在原有的图像卷积分类的基础上添加标签词向量,并利用标签词向量调节图片分类模型的内部参数,从而大大提高了图像分类的准确率。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1是本发明实施例中一种基于卷积神经网络和词向量的图像分类方法的流程图;
图2是本发明实施例中一种基于卷积神经网络和词向量的图像分类系统的模块组成示意图。
具体实施方式
为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本发明的具体实施方式。
本发明的实施例提供了一种基于卷积神经网络和词向量的图像分类方法及系统。
请参考图1,图1是本发明实施例中一种基于卷积神经网络和词向量的图像分类方法的流程图,具体包括如下步骤:
S101:根据待分类图片,从各开源图像数据库中选择并获取训练用的图像数据集;所述训练用的图像数据集中包含多张图片,每张图片均对应有分类标签;且所述待分类图片要分类得到的分类标签为所述训练用的图像数据集的所有分类标签中的一种;
例如:一张猫的图片,对应的分类标签为“猫”;一栋房子的照片,对应的标签为“房屋”;
在本实施例中,所述训练用的图像数据集采用CIFAR-10图像数据集;
S102:根据所述训练用的图像数据集,获取对应的语料数据集;所述语料数据集需包含所述训练用的图像数据集中所有图片对应的分类标签;
S103:对所述语料数据集进行词向量生成处理,获取所述语料数据集对应的词向量集;并从所述词向量集中获取所述训练用的图像数据集中每张图片的标签所对应的词向量,得到标签对应的词语的语义向量集;
S104:对所述训练用的图像数据集做预处理,以将所述训练用的图像数据集中的所有照片的处理为相同的大小和格式,得到预处理后的图像数据集;
S105:将预处理后的图像数据集和标签对应的词语的语义向量集输入图片分类模型,以对图片分类模型进行训练,得到训练后的图片分类模型;所述图片分类模型为LeNet-5卷积神经网络模型;
S106:利用训练好的图片分类模型,对待分类图片进行图片分类。
步骤S103中,所述语料数据集采用Text8或者Wikimedia数据集。
步骤S103中,对所述语料数据集进行词向量生成处理,获取所述语料数据集对应的词向量集的方法为:根据所述语料数据集,采用Word2Vec词向量生成工具将所述语料数据集中的所有词汇转换为N维的词向量,得到语料数据集对应的词向量集;其中,所述Word2Vec词向量生成工具为已利用skip-gram模型完成词向量训练的Word2Vec词向量生成工具;N为大于1的正整数,在本发明实施例中,N的取值为10。如表1所示为利用Word2Vec词向量生成工具生成词汇对应的词向量的示例:
表1词向量生成示例
track [-1.2312,0.9934,1.3987,5.7573,-8.2221,......,8.6543]
cat [4.9984,2.8379,-0.8765,-8.3738,1.3738,......,8.7477]
dog [2.8745,-3.3637,-0.3736,9.7453,6.3736,......,7.3628]
horse [3.7382,-0.3826,1.3735,-0.3836,9.3672,......,-2.3728]
airplane [2.8373,1.3737,-9.4836,0.2279,-1.3837,......,8.3837]
步骤S105中,所述LeNet-5卷积神经网络模型依次包括:卷积层、池化层和全连接层;将预处理后的图像数据集和标签对应的词语的语义向量集输入图片分类模型,以对图片分类模型进行训练,得到训练后的图片分类模型的步骤包括:
S201:将预处理后的图像数据集和标签对应的词语的语义向量集作为输入,输入至卷积层,得到所述预处理后的图像数据集的特征矩阵;
S202:将得到的特征矩阵输入池化层,进行池化操作,以去除所述特征矩阵中的噪声,得到池化后的特征矩阵;
S203:将池化后的特征矩阵输入至全连接层,得到预测向量;其中,预测向量的维度与所述标签对应的词语的语义向量的维度相同;
S204:根据所述预测向量和所述标签对应的词语的语义向量,反向调节卷积层、池化层和全连接层的内部参数,并将参数调节后的LeNet-5卷积神经网络模型作为新的图片分类模型;
S205:判断是否达到预先设定的最大迭代次数?若是,则到步骤S206;否则,返回步骤S201;
S206:将此时的图片分类模型作为训练后的图片分类模型。
步骤S204中,反向调节卷积层、池化层和全连接层的内部参数所使用的损失函数f(x)如下所示:
f(x)=cos(xtrue,xpred)
上式中,xtrue为所述标签对应的词语的语义向量;xpred为所述预测向量。
请参阅图2,图2为本发明实施例中一种基于卷积神经网络和词向量的图像分类系统的模块组成示意图,包括依次连接的:训练数据获取模块11、语料数据获取模块12、语义向量获取模块13、预处理模块14、模型训练模块15和图片分类模块16;
训练数据获取模块11,用于根据待分类图片,从各开源图像数据库中选择并获取训练用的图像数据集;所述训练用的图像数据集中包含多张图片,每张图片均对应有分类标签;且所述待分类图片要分类得到的分类标签为所述训练用的图像数据集的所有分类标签中的一种;
语料数据获取模块12,用于根据所述训练用的图像数据集,获取对应的语料数据集;所述语料数据集需包含所述训练用的图像数据集中所有图片对应的分类标签;
语义向量获取模块13,用于对所述语料数据集进行词向量生成处理,获取所述语料数据集对应的词向量集;并从所述词向量集中获取所述训练用的图像数据集中每张图片的标签所对应的词向量,得到标签对应的词语的语义向量集;
预处理模块14,用于对所述训练用的图像数据集做预处理,以将所述训练用的图像数据集中的所有照片的处理为相同的大小和格式,得到预处理后的图像数据集;
模型训练模块15,用于将预处理后的图像数据集和标签对应的词语的语义向量集输入图片分类模型,以对图片分类模型进行训练,得到训练后的图片分类模型;所述图片分类模型为LeNet-5卷积神经网络模型;
图片分类模块16,用于利用训练好的图片分类模型,对待分类图片进行图片分类。
在本发明实施例中,语义向量获取模块13中,所述语料数据集采用Text8或者Wikimedia数据集。
在本发明实施例中,语义向量获取模块13中,对所述语料数据集进行词向量生成处理,获取所述语料数据集对应的词向量集的方法为:根据所述语料数据集,采用Word2Vec词向量生成工具将所述语料数据集中的所有词汇转换为N维的词向量,得到语料数据集对应的词向量集;其中,所述Word2Vec词向量生成工具为已利用skip-gram模型完成词向量训练的Word2Vec词向量生成工具;N为大于1的正整数。
在本发明实施例中,模型训练模块15中,所述LeNet-5卷积神经网络模型依次包括:卷积层、池化层和全连接层;将预处理后的图像数据集和标签对应的词语的语义向量集输入图片分类模型,以对图片分类模型进行训练,得到训练后的图片分类模型的步骤包括以下单元:
卷积单元,用于将预处理后的图像数据集和标签对应的词语的语义向量集作为输入,输入至卷积层,得到所述预处理后的图像数据集的特征矩阵;
池化单元,用于将得到的特征矩阵输入池化层,进行池化操作,以去除所述特征矩阵中的噪声,得到池化后的特征矩阵;
全连接单元,用于将池化后的特征矩阵输入至全连接层,得到预测向量;其中,预测向量的维度与所述标签对应的词语的语义向量的维度相同;
参数调节单元,用于根据所述预测向量和所述标签对应的词语的语义向量,反向调节卷积层、池化层和全连接层的内部参数,并将参数调节后的LeNet-5卷积神经网络模型作为新的图片分类模型;
判断单元,用于判断是否达到预先设定的最大迭代次数?若是,则到结束单元;否则,返回卷积单元;
结束单元,用于将此时的图片分类模型作为训练后的图片分类模型。
在本发明实施例中,参数调节单元中,反向调节卷积层、池化层和全连接层的内部参数所使用的损失函数f(x)如下所示:
f(x)=cos(xtrue,xpred)
上式中,xtrue为所述标签对应的词语的语义向量;xpred为所述预测向量。
本发明的有益效果是:本发明所提出的技术方案,针对传统的图片分类方法只单独考虑图片的信息,而忽略了图像的标签导致分类的准确率不高的问题,在原有的图像卷积分类的基础上添加标签词向量,并利用标签词向量调节图片分类模型的内部参数,从而大大提高了图像分类的准确率。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于卷积神经网络和词向量的图像分类方法,其特征在于:包括以下步骤:
S101:根据待分类图片,从各开源图像数据库中选择并获取训练用的图像数据集;所述训练用的图像数据集中包含多张图片,每张图片均对应有分类标签;
S102:根据所述训练用的图像数据集,获取对应的语料数据集;所述语料数据集需包含所述训练用的图像数据集中所有图片对应的分类标签;
S103:对所述语料数据集进行词向量生成处理,获取所述语料数据集对应的词向量集;并从所述词向量集中获取所述训练用的图像数据集中每张图片的标签所对应的词向量,得到标签对应的词语的语义向量集;
S104:对所述训练用的图像数据集做预处理,以将所述训练用的图像数据集中的所有照片的处理为相同的大小和格式,得到预处理后的图像数据集;
S105:将预处理后的图像数据集和标签对应的词语的语义向量集输入图片分类模型,以对图片分类模型进行训练,得到训练后的图片分类模型;所述图片分类模型为LeNet-5卷积神经网络模型;
S106:利用训练好的图片分类模型,对待分类图片进行图片分类。
2.如权利要求1所述的一种基于卷积神经网络和词向量的图像分类方法,其特征在于:步骤S103中,所述语料数据集采用Text8或者Wikimedia数据集。
3.如权利要求1所述的一种基于卷积神经网络和词向量的图像分类方法,其特征在于:步骤S103中,对所述语料数据集进行词向量生成处理,获取所述语料数据集对应的词向量集的方法为:根据所述语料数据集,采用Word2Vec词向量生成工具将所述语料数据集中的所有词汇转换为N维的词向量,得到语料数据集对应的词向量集;其中,所述Word2Vec词向量生成工具为已利用skip-gram模型完成词向量训练的Word2Vec词向量生成工具;N为大于1的正整数。
4.如权利要求1所述的一种基于卷积神经网络和词向量的图像分类方法,其特征在于:步骤S105中,所述LeNet-5卷积神经网络模型依次包括:卷积层、池化层和全连接层;将预处理后的图像数据集和标签对应的词语的语义向量集输入图片分类模型,以对图片分类模型进行训练,得到训练后的图片分类模型的步骤包括:
S201:将预处理后的图像数据集和标签对应的词语的语义向量集作为输入,输入至卷积层,得到所述预处理后的图像数据集的特征矩阵;
S202:将得到的特征矩阵输入池化层,进行池化操作,以去除所述特征矩阵中的噪声,得到池化后的特征矩阵;
S203:将池化后的特征矩阵输入至全连接层,得到预测向量;其中,预测向量的维度与所述标签对应的词语的语义向量的维度相同;
S204:根据所述预测向量和所述标签对应的词语的语义向量,反向调节卷积层、池化层和全连接层的内部参数,并将参数调节后的LeNet-5卷积神经网络模型作为新的图片分类模型;
S205:判断是否达到预先设定的最大迭代次数?若是,则到步骤S206;否则,返回步骤S201;
S206:将此时的图片分类模型作为训练后的图片分类模型。
5.如权利要求4所述的一种基于卷积神经网络和词向量的图像分类方法,其特征在于:步骤S204中,反向调节卷积层、池化层和全连接层的内部参数所使用的损失函数f(x)如下所示:
f(x)=cos(xtrue,xpred)
上式中,xtrue为所述标签对应的词语的语义向量;xpred为所述预测向量。
6.一种基于卷积神经网络和词向量的图像分类系统,其特征在于:包括以下模块:训练数据获取模块,用于根据待分类图片,从各开源图像数据库中选择并获取训练用的图像数据集;所述训练用的图像数据集中包含多张图片,每张图片均对应有分类标签;
语料数据获取模块,用于根据所述训练用的图像数据集,获取对应的语料数据集;所述语料数据集需包含所述训练用的图像数据集中所有图片对应的分类标签;
语义向量获取模块,用于对所述语料数据集进行词向量生成处理,获取所述语料数据集对应的词向量集;并从所述词向量集中获取所述训练用的图像数据集中每张图片的标签所对应的词向量,得到标签对应的词语的语义向量集;
预处理模块,用于对所述训练用的图像数据集做预处理,以将所述训练用的图像数据集中的所有照片的处理为相同的大小和格式,得到预处理后的图像数据集;
模型训练模块,用于将预处理后的图像数据集和标签对应的词语的语义向量集输入图片分类模型,以对图片分类模型进行训练,得到训练后的图片分类模型;所述图片分类模型为LeNet-5卷积神经网络模型;
图片分类模块,用于利用训练好的图片分类模型,对待分类图片进行图片分类。
7.如权利要求6所述的一种基于卷积神经网络和词向量的图像分类系统,其特征在于:语义向量获取模块中,所述语料数据集采用Text8或者Wikimedia数据集。
8.如权利要求6所述的一种基于卷积神经网络和词向量的图像分类系统,其特征在于:语义向量获取模块中,对所述语料数据集进行词向量生成处理,获取所述语料数据集对应的词向量集的方法为:根据所述语料数据集,采用Word2Vec词向量生成工具将所述语料数据集中的所有词汇转换为N维的词向量,得到语料数据集对应的词向量集;其中,所述Word2Vec词向量生成工具为已利用skip-gram模型完成词向量训练的Word2Vec词向量生成工具;N为大于1的正整数。
9.如权利要求6所述的一种基于卷积神经网络和词向量的图像分类系统,其特征在于:模型训练模块中,所述LeNet-5卷积神经网络模型依次包括:卷积层、池化层和全连接层;将预处理后的图像数据集和标签对应的词语的语义向量集输入图片分类模型,以对图片分类模型进行训练,得到训练后的图片分类模型的步骤包括以下单元:
卷积单元,用于将预处理后的图像数据集和标签对应的词语的语义向量集作为输入,输入至卷积层,得到所述预处理后的图像数据集的特征矩阵;
池化单元,用于将得到的特征矩阵输入池化层,进行池化操作,以去除所述特征矩阵中的噪声,得到池化后的特征矩阵;
全连接单元,用于将池化后的特征矩阵输入至全连接层,得到预测向量;其中,预测向量的维度与所述标签对应的词语的语义向量的维度相同;
参数调节单元,用于根据所述预测向量和所述标签对应的词语的语义向量,反向调节卷积层、池化层和全连接层的内部参数,并将参数调节后的LeNet-5卷积神经网络模型作为新的图片分类模型;
判断单元,用于判断是否达到预先设定的最大迭代次数?若是,则到结束单元;否则,返回卷积单元;
结束单元,用于将此时的图片分类模型作为训练后的图片分类模型。
10.如权利要求9所述的一种基于卷积神经网络和词向量的图像分类系统,其特征在于:参数调节单元中,反向调节卷积层、池化层和全连接层的内部参数所使用的损失函数f(x)如下所示:
f(x)=cos(xtrue,xpred)
上式中,xtrue为所述标签对应的词语的语义向量;xpred为所述预测向量。
CN201910090400.9A 2019-01-30 2019-01-30 一种基于卷积神经网络和词向量的图像分类方法及系统 Pending CN109919192A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910090400.9A CN109919192A (zh) 2019-01-30 2019-01-30 一种基于卷积神经网络和词向量的图像分类方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910090400.9A CN109919192A (zh) 2019-01-30 2019-01-30 一种基于卷积神经网络和词向量的图像分类方法及系统

Publications (1)

Publication Number Publication Date
CN109919192A true CN109919192A (zh) 2019-06-21

Family

ID=66961048

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910090400.9A Pending CN109919192A (zh) 2019-01-30 2019-01-30 一种基于卷积神经网络和词向量的图像分类方法及系统

Country Status (1)

Country Link
CN (1) CN109919192A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110503160A (zh) * 2019-08-28 2019-11-26 北京达佳互联信息技术有限公司 图像识别方法、装置、电子设备及存储介质
CN111222000A (zh) * 2019-12-31 2020-06-02 中国地质大学(武汉) 一种基于图卷积神经网络的图像分类方法及系统
CN112396078A (zh) * 2019-08-16 2021-02-23 中国移动通信有限公司研究院 一种服务分类方法、装置、设备及计算机可读存储介质
GB2586858A (en) * 2019-09-06 2021-03-10 Smiths Heimann Sas Image retrieval system

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107766873A (zh) * 2017-09-06 2018-03-06 天津大学 基于排序学习的多标签零样本分类方法
CN107944447A (zh) * 2017-12-15 2018-04-20 北京小米移动软件有限公司 图像分类方法及装置
US20180225548A1 (en) * 2017-01-19 2018-08-09 Hrl Laboratories, Llc Multi-view embedding with soft-max based compatibility function for zero-shot learning

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180225548A1 (en) * 2017-01-19 2018-08-09 Hrl Laboratories, Llc Multi-view embedding with soft-max based compatibility function for zero-shot learning
CN107766873A (zh) * 2017-09-06 2018-03-06 天津大学 基于排序学习的多标签零样本分类方法
CN107944447A (zh) * 2017-12-15 2018-04-20 北京小米移动软件有限公司 图像分类方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
DONGZHE WANG ET.AL: "Task-generic semantic convolutional neural network for web text-aided image classification", 《NEUROCOMPUTING》 *
HUAPENG XU ET.AL: "Fine-grained Image Classification by Visual-Semantic Embedding", 《PROCEEDINGS OF THE TWENTY-SEVENTH INTERNATIONAL JOINT CONFERENCE ON ARTIFICIAL INTELLIGENCE (IJCAI-18)》 *
冀中 等: "基于深度示例差异化的零样本多标签图像分类", 《计算机科学与探索》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112396078A (zh) * 2019-08-16 2021-02-23 中国移动通信有限公司研究院 一种服务分类方法、装置、设备及计算机可读存储介质
CN110503160A (zh) * 2019-08-28 2019-11-26 北京达佳互联信息技术有限公司 图像识别方法、装置、电子设备及存储介质
GB2586858A (en) * 2019-09-06 2021-03-10 Smiths Heimann Sas Image retrieval system
GB2586858B (en) * 2019-09-06 2023-10-25 Smiths Heimann Sas Image retrieval system
CN111222000A (zh) * 2019-12-31 2020-06-02 中国地质大学(武汉) 一种基于图卷积神经网络的图像分类方法及系统
CN111222000B (zh) * 2019-12-31 2023-05-26 中国地质大学(武汉) 一种基于图卷积神经网络的图像分类方法及系统

Similar Documents

Publication Publication Date Title
CN109919192A (zh) 一种基于卷积神经网络和词向量的图像分类方法及系统
CN107239444B (zh) 一种融合词性与位置信息的词向量训练方法及系统
CN107330446B (zh) 一种面向图像分类的深度卷积神经网络的优化方法
CN106528528A (zh) 文本情感分析的方法及装置
CN108363753A (zh) 评论文本情感分类模型训练与情感分类方法、装置及设备
CN103699523A (zh) 产品分类方法和装置
CN104809469A (zh) 一种面向服务机器人的室内场景图像分类方法
CN108427740B (zh) 一种基于深度度量学习的图像情感分类与检索算法
CN106547885A (zh) 一种文本分类系统及方法
Salunke et al. A new approach for automatic face emotion recognition and classification based on deep networks
CN112560495A (zh) 一种基于情感分析的微博谣言检测方法
CN106815310A (zh) 一种对海量文档集的层次聚类方法及系统
CN110415071B (zh) 一种基于观点挖掘分析的汽车竞品对比方法
CN111127423B (zh) 一种基于cnn-bp神经网络算法水稻病虫害识别方法
CN107679501B (zh) 一种基于标签自提纯的深度学习方法
CN112612970A (zh) 一种基于微博事件关系的谣言检测方法及其系统
CN109977213A (zh) 一种面向智能问答系统的最优答案选择方法
CN110263855A (zh) 一种利用共基胶囊投影进行图像分类的方法
Lim et al. Training network design based on convolution neural network for object classification in few class problem
CN107506362A (zh) 基于用户群优化的图像分类仿脑存储方法
CN108960772A (zh) 基于深度学习的企业评审辅助方法及系统
Feldkamp et al. Knowledge discovery and robustness analysis in manufacturing simulations
CN107392463A (zh) 一种城市功能区识别方法、模块、装置及其存储装置
Gupta et al. Generating image captions using deep learning and natural language processing
CN109960793A (zh) 意见挖掘装置以及智能终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190621

RJ01 Rejection of invention patent application after publication