CN109657694A - 图片自动分类方法、装置及计算机可读存储介质 - Google Patents
图片自动分类方法、装置及计算机可读存储介质 Download PDFInfo
- Publication number
- CN109657694A CN109657694A CN201811254121.3A CN201811254121A CN109657694A CN 109657694 A CN109657694 A CN 109657694A CN 201811254121 A CN201811254121 A CN 201811254121A CN 109657694 A CN109657694 A CN 109657694A
- Authority
- CN
- China
- Prior art keywords
- picture
- training
- neural network
- identification model
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000013528 artificial neural network Methods 0.000 claims abstract description 67
- 230000004913 activation Effects 0.000 claims description 12
- 210000002569 neuron Anatomy 0.000 claims description 8
- 210000005036 nerve Anatomy 0.000 claims description 2
- 230000006399 behavior Effects 0.000 claims 2
- 238000010586 diagram Methods 0.000 description 9
- 238000003908 quality control method Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种图像识别技术,揭露了一种图片自动分类方法、装置及计算机可读存储介质,该方法包括:为每一个预设图片类别准备预设数量的标注有对应的图片类别的图片样本;将每一个预设图片类别对应的图片样本分为第一比例的训练子集和第二比例的验证子集,将各个训练子集中的图片样本进行混合以得到训练集,并将各个验证子集中的图片样本进行混合以得到验证集;通过训练集训练神经网络图片识别模型;通过验证集验证训练的神经网络图片识别模型的准确率;接收由用户终端输入的当前图片;利用训练好的神经网络图片识别模型对当前图片进行类别识别及标注;接收查询指令,根据查询指令在数据库中查找图片资料并显示找到的图片资料。
Description
技术领域
本发明涉及图像识别领域,尤其涉及一种图片自动分类方法、装置及计算机可读存储介质。
背景技术
目前很多事务办理(例如保险)都可以通过网络处理,客户直接使用输入终端打开操作界面将需要的信息及图片资料(通常的图片包括身份证、户口本、驾照、出生证等)上传,接收终端接收到信息及图片资料后,势必需要对所述图片进行标注分类。目前的操作方式是安排质控员在接收终端前对所述图片资料进行标注分类,这种方式势必影响工作效率。另外由于人工处理耗时,拉长了事务处理进度,这样势必影响客户的体验。
发明内容
本发明提供一种图片自动分类方法、装置及计算机可读存储介质,其主要目的在于提高图片标注的效率。
为实现上述目的,本发明提供一种图片自动分类方法,应用于电子装置中,所述方法包括:
为每一个预设图片类别准备预设数量的标注有对应的图片类别的图片样本;
将每一个预设图片类别对应的图片样本分为第一比例的训练子集和第二比例的验证子集,将各个训练子集中的图片样本进行混合以得到训练集,并将各个验证子集中的图片样本进行混合以得到验证集;
通过所述训练集训练神经网络图片识别模型;
通过所述验证集验证训练的所述神经网络图片识别模型的准确率,当准确率大于或者等于预设阈值时,训练结束;
接收由用户终端输入的当前图片;
利用训练好的神经网络图片识别模型对所述当前图片进行类别识别及标注,并存储识别结果及标注结果至数据库;
接收针对一图片类别的查询指令,根据所述查询指令在所述数据库中查找图片资料并显示找到的图片资料。
可选地,所述方法还包括:当准确率小于所述预设阈值,增加每一个预设图片类别对应的证件图片样本的数量,再重新将每一预设图片类别更新后的图片样本分为新的训练子集及验证子集。
可选地,所述接收由用户终端输入的当前图片的步骤包括:
显示用户输入界面;
接收由用户输入的所述图片信息;及
接收由用户上传的所述图片资料。
可选地,所述通过所述训练集训练神经网络图片识别模型的步骤包括:
构建神经网络图片识别模型,所述神经网络图片识别模型为AlexNet神经网络,所述神经网络图片识别模型包括5个卷积层及3个全连接层,最后一个全连接层的输出是具有1000个输出的输出层,在每一个卷积层以及全连接层后紧跟的操作是激活操作,卷积层卷积操作公式为:
其中l表示第l层,j表示卷积层的第j个核,M表示卷积核所在区域,k表示卷积核,b表示偏置,x表示特征图对应位置的值,f表示激活函数,i、j、l为自然数;
将所述训练集代入所述神经网络图片识别模型进行训练。
可选地,所述全连接层表达式为:
yj=f(xi)=bj+Σiwij.xj
其中yj是一个输出向量中的第j个神经元,xi是输入向量中的第i个神经元,w是一个全连层中的权重参数。
本发明还提供一种电子装置,所述电子装置包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的图片自动分类程序,所述图片自动分类程序被所述处理器执行时实现如下步骤:
为每一个预设图片类别准备预设数量的标注有对应的图片类别的图片样本;
将每一个预设图片类别对应的图片样本分为第一比例的训练子集和第二比例的验证子集,将各个训练子集中的图片样本进行混合以得到训练集,并将各个验证子集中的图片样本进行混合以得到验证集;
通过所述训练集训练神经网络图片识别模型;
通过所述验证集验证训练的所述神经网络图片识别模型的准确率,当准确率大于或者等于预设阈值时,训练结束;
接收由用户终端输入的当前图片;
利用训练好的神经网络图片识别模型对所述当前图片进行类别识别及标注,并存储识别结果及标注结果至数据库;
接收针对一图片类别的查询指令,根据所述查询指令在所述数据库中查找图片资料并显示找到的图片资料。
可选地,所述图片自动分类程序被所述处理器执行时还实现如下步骤:当准确率小于所述预设阈值,增加每一个预设图片类别对应的证件图片样本的数量,再重新将每一预设图片类别更新后的图片样本分为新的训练子集及验证子集。
可选地,所述接收由用户终端输入的当前图片的步骤包括:
显示用户输入界面;
接收由用户输入的所述图片信息;及
接收由用户上传的所述图片资料。
可选地,所述通过所述训练集训练神经网络图片识别模型的步骤包括:
构建神经网络图片识别模型,所述神经网络图片识别模型为AlexNet神经网络,所述神经网络图片识别模型包括5个卷积层及3个全连接层,最后一个全连接层的输出是具有1000个输出的输出层,在每一个卷积层以及全连接层后紧跟的操作是激活操作,卷积层卷积操作公式为:
其中l表示第l层,j表示卷积层的第j个核,M表示卷积核所在区域,k表示卷积核,b表示偏置,x表示特征图对应位置的值,f表示激活函数,i、j、l为自然数;
将所述训练集代入所述神经网络图片识别模型进行训练。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有图片自动分类程序,所述图片自动分类程序可被一个或者多个处理器执行,以实现上述的图片自动分类方法的步骤。
本发明提供的图片自动分类方法、装置及计算机可读存储介质通过训练神经网络图片识别模型并利用训练好的神经网络图片识别模型来识别及标注图片,从而提升图片标注的效率。
附图说明
图1为本发明一实施例提供的图片自动分类方法的流程示意图;
图2为本发明一实施例提供的电子装置的内部结构示意图;
图3为本发明一实施例提供的图片自动分类方法利用到的Alexnet神经网络的结构示意图;
图4为本发明一实施例提供的电子装置中图片自动分类程序的模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种图片自动分类方法。参照图1所示,为本发明一实施例提供的图片自动分类方法的流程示意图。该方法可以由一个装置执行,该装置可以由软件和/或硬件实现。
在本实施例中,图片自动分类方法包括:
S101,为每一个预设图片类别准备预设数量的标注有对应的图片类别的图片样本;例如,预设图片类别包括身份证、居住证、户口本、驾照、出生证等,预设数量为1000张;
S102,将每一个预设图片类别对应的图片样本分为第一比例的训练子集和第二比例的验证子集,将各个训练子集中的图片样本进行混合以得到训练集,并将各个验证子集中的图片样本进行混合以得到验证集;例如第一比例为80%,第二比例为20%;
S103,通过所述训练集训练神经网络图片识别模型;
S104,通过所述验证集验证训练的所述神经网络图片识别模型的准确率,当准确率大于或者等于预设阈值时,训练结束;
S105,接收由用户终端输入的当前图片;例如当前图片为身份证的正反面扫描件;
S106,利用训练好的神经网络图片识别模型对所述当前图片进行类别识别及标注,并存储识别结果及标注结果至数据库;
S107,接收针对一图片类别的查询指令,根据所述查询指令在所述数据库中查找图片资料并显示找到的图片资料;例如查询指令针对的是身份证类别的,找到所述身份证类别的资料并显示,以方便质控员审查。
进一步地,所述方法还包括:当准确率小于所述预设阈值,增加每一个预设图片类别对应的证件图片样本的数量,再重新将每一预设图片类别更新后的图片样本分为新的训练子集及验证子集。
进一步地,所述步骤S103包括:
构建神经网络图片识别模型,所述神经网络图片识别模型为AlexNet神经网络,所述神经网络图片识别模型包括5个卷积层及3个全连接层,最后一个全连接层的输出是具有1000个输出的输出层,在每一个卷积层以及全连接层后紧跟的操作是激活操作,卷积层卷积操作公式为:
其中l表示第l层,j表示卷积层的第j个核,M表示卷积核所在区域,k表示卷积核,b表示偏置,x表示特征图对应位置的值,f表示激活函数,i、j、l为自然数;
将所述训练集代入所述神经网络图片识别模型进行训练。
所述AlexNet神经网络的架构示意图如图3所示,包含5个卷积层及3个全连接层。
进一步地,所述步骤S105包括:
显示用户输入界面;
接收由用户输入的所述图片信息;及
接收由用户上传的所述图片资料。
例如在用户输入界面上,用户输入身份证的信息:身份证号及名字,并上传身份证的正反面扫描件。
进一步地,所述全连接层表达式为:
yj=f(xi)=bj+Σjwij.xj
其中yj是一个输出向量中的第j个神经元,xi是输入向量中的第i个神经元,w是一个全连层中的权重参数。
本实施例提出的图片自动分类方法通过训练神经网络图片识别模型并利用训练好的神经网络图片识别模型来识别及标注图片,从而提升图片标注的效率。
本发明还提供一种电子装置1。参照图2所示,为本发明一实施例提供的电子装置的内部结构示意图。
在本实施例中,电子装置1可以是电脑或服务器。所述电子装置1至少包括存储器11、处理器13,通信总线15,以及网络接口17。
其中,存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是电子装置的内部存储单元,例如所述电子装置的硬盘。存储器11在另一些实施例中也可以是电子装置的外部存储设备,例如电子装置上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(FlashCard)等。进一步地,存储器11还可以既包括电子装置的内部存储单元也包括外部存储设备。存储器11不仅可以用于存储安装于电子装置1的应用软件及各类数据,例如图片自动分类程序111的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
处理器13在一些实施例中可以是一中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器11中存储的程序代码或处理数据。
通信总线15用于实现这些组件之间的连接通信。
网络接口17可选的可以包括标准的有线接口、无线接口(如WI-FI接口),通常用于在电子装置1与其他电子设备之间建立通信连接。
可选地,电子装置1还可以包括用户接口,用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子装置中处理的信息以及用于显示可视化的用户界面。
图2仅示出了具有组件11~17的电子装置1,本领域技术人员可以理解的是,图2示出的结构并不构成对电子装置的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
在图2所示的电子装置1的实施例中,存储器11中存储有图片自动分类程序;处理器13执行存储器11中存储的电子装置时实现如下步骤:
为每一个预设图片类别准备预设数量的标注有对应的图片类别的图片样本;例如,预设图片类别包括身份证、居住证、户口本、驾照、出生证等,预设数量为1000张;
将每一个预设图片类别对应的图片样本分为第一比例的训练子集和第二比例的验证子集,将各个训练子集中的图片样本进行混合以得到训练集,并将各个验证子集中的图片样本进行混合以得到验证集;例如第一比例为80%,第二比例为20%;
通过所述训练集训练神经网络图片识别模型;
通过所述验证集验证训练的所述神经网络图片识别模型的准确率,当准确率大于或者等于预设阈值时,训练结束;
接收由用户终端输入的当前图片;例如当前图片为身份证的正反面扫描件;
利用训练好的神经网络图片识别模型对所述当前图片进行类别识别及标注,并存储识别结果及标注结果至数据库;
接收针对一图片类别的查询指令,根据所述查询指令在所述数据库中查找图片资料并显示找到的图片资料;例如查询指令针对的是身份证类别的,找到所述身份证类别的资料并显示,以方便质控员审查。
进一步地,所述图片自动分类程序被所述处理器执行时还实现如下步骤:当准确率小于所述预设阈值,增加每一个预设图片类别对应的证件图片样本的数量,再重新将每一预设图片类别更新后的图片样本分为新的训练子集及验证子集。
进一步地,所述通过所述训练集训练神经网络图片识别模型的步骤包括:
构建神经网络图片识别模型,所述神经网络图片识别模型为AlexNet神经网络,所述神经网络图片识别模型包括5个卷积层及3个全连接层,最后一个全连接层的输出是具有1000个输出的输出层,在每一个卷积层以及全连接层后紧跟的操作是激活操作,卷积层卷积操作公式为:
其中l表示第l层,j表示卷积层的第j个核,M表示卷积核所在区域,k表示卷积核,b表示偏置,x表示特征图对应位置的值,f表示激活函数,i、j、l为自然数;
将所述训练集代入所述神经网络图片识别模型进行训练。
所述AlexNet神经网络的架构示意图如图3所示,包含5个卷积层及3个全连接层。
进一步地,所述接收由用户终端输入的当前图片的步骤包括:
显示用户输入界面;
接收由用户输入的所述图片信息;及
接收由用户上传的所述图片资料。
例如在用户输入界面上,用户输入身份证的信息:身份证号及名字,并上传身份证的正反面扫描件。
进一步地,所述图片自动分类程序被所述处理器执行时还实现如下步骤:所述全连接层表达式为:
yj=f(xi)=bj+Σiwij.xj
其中yj是一个输出向量中的第j个神经元,xi是输入向量中的第i个神经元,w是一个全连层中的权重参数。
本实施例提出的电子装置通过训练神经网络图片识别模型并利用训练好的神经网络图片识别模型来识别及标注图片,从而提升图片标注的效率。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有的图片自动分类程序,所述图片自动分类程序可被一个或多个处理器执行,以实现如下操作:
为每一个预设图片类别准备预设数量的标注有对应的图片类别的图片样本;例如,预设图片类别包括身份证、居住证、户口本、驾照、出生证等,预设数量为1000张;
将每一个预设图片类别对应的图片样本分为第一比例的训练子集和第二比例的验证子集,将各个训练子集中的图片样本进行混合以得到训练集,并将各个验证子集中的图片样本进行混合以得到验证集;例如第一比例为80%,第二比例为20%;
通过所述训练集训练神经网络图片识别模型;
通过所述验证集验证训练的所述神经网络图片识别模型的准确率,当准确率大于或者等于预设阈值时,训练结束;
接收由用户终端输入的当前图片;例如当前图片为身份证的正反面扫描件;
利用训练好的神经网络图片识别模型对所述当前图片进行类别识别及标注,并存储识别结果及标注结果至数据库;
接收针对一图片类别的查询指令,根据所述查询指令在所述数据库中查找图片资料并显示找到的图片资料;例如查询指令针对的是身份证类别的,找到所述身份证类别的资料并显示,以方便质控员审查。
本发明计算机可读存储介质具体实施方式与上述电子装置和方法各实施例基本相同,在此不作累述。
可选地,在其他实施例中,图片自动分类程序还可以被分割为一个或者多个模块,一个或者多个模块被存储于存储器11中,并由一个或多个处理器(本实施例为处理器13)所执行以完成本发明,本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段,用于描述图片自动分类程序在电子装置中的执行过程。
例如,参照图4所示,为本发明电子装置一实施例中的图片自动分类程序的程序模块示意图,该实施例中,图片自动分类程序可以被分割为准备模块10、划分模块20、训练模块30、验证模块40、接收模块50、识别模块60及查找模块70,示例性地:
所述准备模块10用于:为每一个预设图片类别准备预设数量的标注有对应的图片类别的图片样本;例如,预设图片类别包括身份证、居住证、户口本、驾照、出生证等,预设数量为1000张;
所述划分模块20用于:将每一个预设图片类别对应的图片样本分为第一比例的训练子集和第二比例的验证子集,将各个训练子集中的图片样本进行混合以得到训练集,并将各个验证子集中的图片样本进行混合以得到验证集;例如第一比例为80%,第二比例为20%;
所述训练模块30用于:通过所述训练集训练神经网络图片识别模型;
所述验证模块40用于:通过所述验证集验证训练的所述神经网络图片识别模型的准确率,当准确率大于或者等于预设阈值时,训练结束;
所述接收模块50用于:接收由用户终端输入的当前图片;例如当前图片为身份证的正反面扫描件;
所述识别模块60用于:利用训练好的神经网络图片识别模型对所述当前图片进行类别识别及标注,并存储识别结果及标注结果至数据库;
所述查找模块70用于:接收针对一图片类别的查询指令,根据所述查询指令在所述数据库中查找图片资料并显示找到的图片资料;例如查询指令针对的是身份证类别的,找到所述身份证类别的资料并显示,以方便质控员审查。
上述准备模块10、划分模块20、训练模块30、验证模块40、接收模块50、识别模块60及查找模块70等程序模块被执行时所实现的功能或操作步骤与上述实施例大体相同,在此不再赘述。
需要说明的是,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种图片自动分类方法,应用于电子装置中,其特征在于,所述方法包括:
为每一个预设图片类别准备预设数量的标注有对应的图片类别的图片样本;
将每一个预设图片类别对应的图片样本分为第一比例的训练子集和第二比例的验证子集,将各个训练子集中的图片样本进行混合以得到训练集,并将各个验证子集中的图片样本进行混合以得到验证集;
通过所述训练集训练神经网络图片识别模型;
通过所述验证集验证训练的所述神经网络图片识别模型的准确率,当准确率大于或者等于预设阈值时,训练结束;
接收由用户终端输入的当前图片;
利用训练好的神经网络图片识别模型对所述当前图片进行类别识别及标注,并存储识别结果及标注结果至数据库;
接收针对一图片类别的查询指令,根据所述查询指令在所述数据库中查找图片资料并显示找到的图片资料。
2.如权利要求1所述的图片自动分类方法,其特征在于,所述方法还包括:当准确率小于所述预设阈值,增加每一个预设图片类别对应的证件图片样本的数量,再重新将每一预设图片类别更新后的图片样本分为新的训练子集及验证子集。
3.如权利要求1所述的图片自动分类方法,其特征在于,所述接收由用户终端输入的当前图片的步骤包括:
显示用户输入界面;
接收由用户输入的所述图片信息;及
接收由用户上传的所述图片资料。
4.如权利要求1所述的图片自动分类方法,其特征在于,所述通过所述训练集训练神经网络图片识别模型的步骤包括:
构建神经网络图片识别模型,所述神经网络图片识别模型为AlexNet神经网络,所述神经网络图片识别模型包括5个卷积层及3个全连接层,最后一个全连接层的输出是具有1000个输出的输出层,在每一个卷积层以及全连接层后紧跟的操作是激活操作,卷积层卷积操作公式为:
其中l表示第l层,j表示卷积层的第j个核,M表示卷积核所在区域,k表示卷积核,b表示偏置,x表示特征图对应位置的值,f表示激活函数,i、j、l为自然数;
将所述训练集代入所述神经网络图片识别模型进行训练。
5.如权利要求4所述的图片自动分类方法,其特征在于,所述全连接层表达式为:
yj=f(xi)=bj+∑iwij·xj
其中yj是一个输出向量中的第j个神经元,xi是输入向量中的第i个神经元,w是一个全连层中的权重参数。
6.一种电子装置,其特征在于,所述电子装置包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的图片自动分类程序,所述图片自动分类程序被所述处理器执行时实现如下步骤:
为每一个预设图片类别准备预设数量的标注有对应的图片类别的图片样本;
将每一个预设图片类别对应的图片样本分为第一比例的训练子集和第二比例的验证子集,将各个训练子集中的图片样本进行混合以得到训练集,并将各个验证子集中的图片样本进行混合以得到验证集;
通过所述训练集训练神经网络图片识别模型;
通过所述验证集验证训练的所述神经网络图片识别模型的准确率,当准确率大于或者等于预设阈值时,训练结束;
接收由用户终端输入的当前图片;
利用训练好的神经网络图片识别模型对所述当前图片进行类别识别及标注,并存储识别结果及标注结果至数据库;
接收针对一图片类别的查询指令,根据所述查询指令在所述数据库中查找图片资料并显示找到的图片资料。
7.如权利要求6所述的电子装置,其特征在于,所述图片自动分类程序被所述处理器执行时还实现如下步骤:当准确率小于所述预设阈值,增加每一个预设图片类别对应的证件图片样本的数量,再重新将每一预设图片类别更新后的图片样本分为新的训练子集及验证子集。
8.如权利要求6所述的电子装置,其特征在于,所述接收由用户终端输入的当前图片的步骤包括:
显示用户输入界面;
接收由用户输入的所述图片信息;及
接收由用户上传的所述图片资料。
9.如权利要求6所述的电子装置,其特征在于,所述通过所述训练集训练神经网络图片识别模型的步骤包括:
构建神经网络图片识别模型,所述神经网络图片识别模型为AlexNet神经网络,所述神经网络图片识别模型包括5个卷积层及3个全连接层,最后一个全连接层的输出是具有1000个输出的输出层,在每一个卷积层以及全连接层后紧跟的操作是激活操作,卷积层卷积操作公式为:
其中表示第l层,j表示卷积层的第j个核,M表示卷积核所在区域,k表示卷积核,b表示偏置,x表示特征图对应位置的值,f表示激活函数,i、j、l为自然数;
将所述训练集代入所述神经网络图片识别模型进行训练。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有图片自动分类程序,所述图片自动分类程序可被一个或者多个处理器执行,以实现如权利要求1至5中任一项所述的图片自动分类方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811254121.3A CN109657694A (zh) | 2018-10-26 | 2018-10-26 | 图片自动分类方法、装置及计算机可读存储介质 |
PCT/CN2019/088636 WO2020082732A1 (zh) | 2018-10-26 | 2019-05-27 | 图片自动分类方法、装置及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811254121.3A CN109657694A (zh) | 2018-10-26 | 2018-10-26 | 图片自动分类方法、装置及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109657694A true CN109657694A (zh) | 2019-04-19 |
Family
ID=66110009
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811254121.3A Pending CN109657694A (zh) | 2018-10-26 | 2018-10-26 | 图片自动分类方法、装置及计算机可读存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN109657694A (zh) |
WO (1) | WO2020082732A1 (zh) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110222736A (zh) * | 2019-05-20 | 2019-09-10 | 北京字节跳动网络技术有限公司 | 训练分类器的方法、装置、电子设备和计算机可读存储介质 |
CN110275974A (zh) * | 2019-06-28 | 2019-09-24 | 武汉轻工大学 | 样本数据集的数据添加方法、装置、终端设备及存储介质 |
CN110490221A (zh) * | 2019-07-05 | 2019-11-22 | 平安科技(深圳)有限公司 | 多标签分类方法、电子装置及计算机可读存储介质 |
WO2020082732A1 (zh) * | 2018-10-26 | 2020-04-30 | 平安科技(深圳)有限公司 | 图片自动分类方法、装置及计算机可读存储介质 |
CN111241235A (zh) * | 2019-12-28 | 2020-06-05 | 深圳市九洲电器有限公司 | 基于智能语音的网盘搜索方法及相关产品 |
CN111510752A (zh) * | 2020-06-18 | 2020-08-07 | 平安国际智慧城市科技股份有限公司 | 数据传输方法、装置、服务器及存储介质 |
CN111680740A (zh) * | 2020-06-04 | 2020-09-18 | 京东方科技集团股份有限公司 | 神经网络的训练方法、装置及用电负荷的判别方法、装置 |
CN112053343A (zh) * | 2020-09-02 | 2020-12-08 | 平安科技(深圳)有限公司 | 用户图片数据的处理方法、装置、计算机设备及存储介质 |
CN112132230A (zh) * | 2020-10-09 | 2020-12-25 | 腾讯科技(深圳)有限公司 | 图像分类方法及装置 |
CN112348089A (zh) * | 2020-11-10 | 2021-02-09 | 中南民族大学 | 工作状态识别方法、服务器、存储介质及装置 |
CN113051969A (zh) * | 2019-12-26 | 2021-06-29 | 深圳市超捷通讯有限公司 | 物件识别模型训练方法及车载装置 |
CN113449814A (zh) * | 2021-07-20 | 2021-09-28 | 曲阜师范大学 | 一种图片层级分类方法及系统 |
US11727673B1 (en) | 2022-06-09 | 2023-08-15 | Soochow University | Visual analysis method for cable element identification |
WO2023236371A1 (zh) * | 2022-06-09 | 2023-12-14 | 苏州大学 | 用于电缆元件识别的视觉分析方法 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111597373B (zh) * | 2020-05-19 | 2023-06-20 | 清华大学 | 基于卷积神经网络和连通图的图片归类方法及相关设备 |
CN111680642B (zh) * | 2020-06-11 | 2023-06-23 | 石家庄铁道大学 | 一种地形分类方法及装置 |
CN111739617B (zh) * | 2020-06-15 | 2023-07-11 | 中国医学科学院医学信息研究所 | 医疗影像人工智能质控标注方法、装置、设备及存储介质 |
CN112731160A (zh) * | 2020-12-25 | 2021-04-30 | 东莞新能安科技有限公司 | 电池滞回模型训练方法、估算电池soc的方法和装置 |
CN115114467B (zh) * | 2021-03-17 | 2024-05-14 | 腾讯科技(深圳)有限公司 | 图片神经网络模型的训练方法以及装置 |
CN113269229A (zh) * | 2021-04-22 | 2021-08-17 | 中国科学院信息工程研究所 | 一种面向深度学习分类模型泛化能力增强的训练方法 |
CN114677563A (zh) * | 2022-04-08 | 2022-06-28 | 李燕秋 | 基于区块链的神经网络在线学习方法及系统 |
CN116738297B (zh) * | 2023-08-15 | 2023-11-21 | 北京快舒尔医疗技术有限公司 | 一种基于深度自编码的糖尿病分型方法和系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106934364A (zh) * | 2017-03-09 | 2017-07-07 | 腾讯科技(上海)有限公司 | 人脸图片的识别方法及装置 |
CN107292823A (zh) * | 2017-08-20 | 2017-10-24 | 平安科技(深圳)有限公司 | 电子装置、发票分类的方法及计算机可读存储介质 |
CN107527060A (zh) * | 2016-06-20 | 2017-12-29 | 青岛海尔智能技术研发有限公司 | 一种冷藏装置存储物管理系统和冷藏装置 |
CN107704514A (zh) * | 2017-08-31 | 2018-02-16 | 努比亚技术有限公司 | 一种照片管理方法、装置及计算机可读存储介质 |
WO2018166114A1 (zh) * | 2017-03-13 | 2018-09-20 | 平安科技(深圳)有限公司 | 图片识别的方法、系统、电子装置及介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102567742A (zh) * | 2010-12-15 | 2012-07-11 | 中国科学院电子学研究所 | 一种基于自适应核函数选择的支持向量机自动分类方法 |
CN104517122A (zh) * | 2014-12-12 | 2015-04-15 | 浙江大学 | 一种基于优化卷积架构的图像目标识别方法 |
CN104992177A (zh) * | 2015-06-12 | 2015-10-21 | 安徽大学 | 基于深层卷积神经网络的网络色情图像检测方法 |
CN105243398B (zh) * | 2015-09-08 | 2018-09-04 | 西安交通大学 | 基于线性判别分析准则的改进卷积神经网络性能的方法 |
CN109657694A (zh) * | 2018-10-26 | 2019-04-19 | 平安科技(深圳)有限公司 | 图片自动分类方法、装置及计算机可读存储介质 |
-
2018
- 2018-10-26 CN CN201811254121.3A patent/CN109657694A/zh active Pending
-
2019
- 2019-05-27 WO PCT/CN2019/088636 patent/WO2020082732A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107527060A (zh) * | 2016-06-20 | 2017-12-29 | 青岛海尔智能技术研发有限公司 | 一种冷藏装置存储物管理系统和冷藏装置 |
CN106934364A (zh) * | 2017-03-09 | 2017-07-07 | 腾讯科技(上海)有限公司 | 人脸图片的识别方法及装置 |
WO2018166114A1 (zh) * | 2017-03-13 | 2018-09-20 | 平安科技(深圳)有限公司 | 图片识别的方法、系统、电子装置及介质 |
CN107292823A (zh) * | 2017-08-20 | 2017-10-24 | 平安科技(深圳)有限公司 | 电子装置、发票分类的方法及计算机可读存储介质 |
CN107704514A (zh) * | 2017-08-31 | 2018-02-16 | 努比亚技术有限公司 | 一种照片管理方法、装置及计算机可读存储介质 |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020082732A1 (zh) * | 2018-10-26 | 2020-04-30 | 平安科技(深圳)有限公司 | 图片自动分类方法、装置及计算机可读存储介质 |
CN110222736A (zh) * | 2019-05-20 | 2019-09-10 | 北京字节跳动网络技术有限公司 | 训练分类器的方法、装置、电子设备和计算机可读存储介质 |
CN110275974A (zh) * | 2019-06-28 | 2019-09-24 | 武汉轻工大学 | 样本数据集的数据添加方法、装置、终端设备及存储介质 |
CN110490221A (zh) * | 2019-07-05 | 2019-11-22 | 平安科技(深圳)有限公司 | 多标签分类方法、电子装置及计算机可读存储介质 |
CN110490221B (zh) * | 2019-07-05 | 2023-06-23 | 平安科技(深圳)有限公司 | 多标签分类方法、电子装置及计算机可读存储介质 |
CN113051969A (zh) * | 2019-12-26 | 2021-06-29 | 深圳市超捷通讯有限公司 | 物件识别模型训练方法及车载装置 |
CN111241235A (zh) * | 2019-12-28 | 2020-06-05 | 深圳市九洲电器有限公司 | 基于智能语音的网盘搜索方法及相关产品 |
CN111680740A (zh) * | 2020-06-04 | 2020-09-18 | 京东方科技集团股份有限公司 | 神经网络的训练方法、装置及用电负荷的判别方法、装置 |
CN111510752A (zh) * | 2020-06-18 | 2020-08-07 | 平安国际智慧城市科技股份有限公司 | 数据传输方法、装置、服务器及存储介质 |
WO2021174869A1 (zh) * | 2020-09-02 | 2021-09-10 | 平安科技(深圳)有限公司 | 用户图片数据的处理方法、装置、计算机设备及存储介质 |
CN112053343A (zh) * | 2020-09-02 | 2020-12-08 | 平安科技(深圳)有限公司 | 用户图片数据的处理方法、装置、计算机设备及存储介质 |
CN112132230A (zh) * | 2020-10-09 | 2020-12-25 | 腾讯科技(深圳)有限公司 | 图像分类方法及装置 |
CN112132230B (zh) * | 2020-10-09 | 2024-02-20 | 腾讯科技(深圳)有限公司 | 图像分类方法及装置 |
CN112348089A (zh) * | 2020-11-10 | 2021-02-09 | 中南民族大学 | 工作状态识别方法、服务器、存储介质及装置 |
CN112348089B (zh) * | 2020-11-10 | 2024-01-16 | 中南民族大学 | 工作状态识别方法、服务器、存储介质及装置 |
CN113449814A (zh) * | 2021-07-20 | 2021-09-28 | 曲阜师范大学 | 一种图片层级分类方法及系统 |
CN113449814B (zh) * | 2021-07-20 | 2022-10-04 | 曲阜师范大学 | 一种图片层级分类方法及系统 |
US11727673B1 (en) | 2022-06-09 | 2023-08-15 | Soochow University | Visual analysis method for cable element identification |
WO2023236371A1 (zh) * | 2022-06-09 | 2023-12-14 | 苏州大学 | 用于电缆元件识别的视觉分析方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2020082732A1 (zh) | 2020-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109657694A (zh) | 图片自动分类方法、装置及计算机可读存储介质 | |
CN110163476A (zh) | 项目智能推荐方法、电子装置及存储介质 | |
CN108629043A (zh) | 网页目标信息的提取方法、装置及存储介质 | |
CN109871446A (zh) | 意图识别中的拒识方法、电子装置及存储介质 | |
WO2018090641A1 (zh) | 识别保险单号码的方法、装置、设备及计算机可读存储介质 | |
CN107194398A (zh) | 车损部位的识别方法及系统 | |
CN106682602A (zh) | 一种驾驶员行为识别方法及终端 | |
CN106489149A (zh) | 一种基于数据挖掘和众包的数据标注方法及系统 | |
CN109359798A (zh) | 任务分配方法、装置及存储介质 | |
CN110287785A (zh) | 文本结构化信息提取方法、服务器及存储介质 | |
CN108766444A (zh) | 用户身份验证方法、服务器及存储介质 | |
CN108491866A (zh) | 色情图片鉴定方法、电子装置及可读存储介质 | |
CN110516544A (zh) | 基于深度学习的人脸识别方法、装置及计算机可读存储介质 | |
CN107958230A (zh) | 人脸表情识别方法及装置 | |
CN109492222A (zh) | 基于概念树的意图识别方法、装置及计算机设备 | |
CN110162599A (zh) | 招聘面试方法、装置及计算机可读存储介质 | |
CN110135889A (zh) | 智能推荐书单的方法、服务器及存储介质 | |
CN108229131A (zh) | 仿冒app识别方法及装置 | |
CN110020653A (zh) | 图像语义分割方法、装置及计算机可读存储介质 | |
CN110135421A (zh) | 车牌识别方法、装置、计算机设备及计算机可读存储介质 | |
CN110246506A (zh) | 人声智能检测方法、装置及计算机可读存储介质 | |
CN110008997A (zh) | 图像纹理相似度识别方法、装置及计算机可读存储介质 | |
CN109977750A (zh) | 印章真伪校验方法、装置及计算机可读存储介质 | |
CN110347789A (zh) | 文本意图智能分类方法、装置及计算机可读存储介质 | |
CN107784482A (zh) | 招聘方法、电子装置及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |