CN110288041A - 基于深度学习的中草药分类建模方法及系统 - Google Patents
基于深度学习的中草药分类建模方法及系统 Download PDFInfo
- Publication number
- CN110288041A CN110288041A CN201910583245.4A CN201910583245A CN110288041A CN 110288041 A CN110288041 A CN 110288041A CN 201910583245 A CN201910583245 A CN 201910583245A CN 110288041 A CN110288041 A CN 110288041A
- Authority
- CN
- China
- Prior art keywords
- chinese herbal
- herbal medicine
- image
- medicine image
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 241000411851 herbal medicine Species 0.000 title claims abstract description 236
- 238000013135 deep learning Methods 0.000 title claims abstract description 32
- 238000013145 classification model Methods 0.000 title claims abstract description 29
- 238000010276 construction Methods 0.000 title claims abstract description 28
- 238000012549 training Methods 0.000 claims abstract description 53
- 238000012360 testing method Methods 0.000 claims abstract description 34
- 238000000034 method Methods 0.000 claims abstract description 32
- 230000000694 effects Effects 0.000 claims abstract description 27
- 230000011218 segmentation Effects 0.000 claims abstract description 25
- 238000012545 processing Methods 0.000 claims abstract description 24
- 238000004458 analytical method Methods 0.000 claims abstract description 8
- 238000010606 normalization Methods 0.000 claims description 10
- 230000009467 reduction Effects 0.000 claims description 9
- 238000012546 transfer Methods 0.000 claims description 7
- 244000025254 Cannabis sativa Species 0.000 claims description 6
- 239000003814 drug Substances 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 229940079593 drug Drugs 0.000 claims description 4
- 230000000877 morphologic effect Effects 0.000 claims description 4
- 230000006870 function Effects 0.000 claims description 3
- 235000002918 Fraxinus excelsior Nutrition 0.000 claims 1
- 239000002956 ash Substances 0.000 claims 1
- 238000005516 engineering process Methods 0.000 abstract description 3
- 101100153586 Caenorhabditis elegans top-1 gene Proteins 0.000 description 4
- 101100370075 Mus musculus Top1 gene Proteins 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 239000000039 congener Substances 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 229910003460 diamond Inorganic materials 0.000 description 1
- 239000010432 diamond Substances 0.000 description 1
- 239000000686 essence Substances 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Medical Preparation Storing Or Oral Administration Devices (AREA)
Abstract
本发明公开了一种基于深度学习的中草药分类建模方法及系统,属于深度学习技术领域,要解决的技术问题为基于深度学习如何快速、准确的对中草药进行分类。方法包括:获取若干个中草药图像形成数据集;基于最大类间方差方法和K均值算法分别对每个中草药图像进行分割处理,并选择效果明显的目标中草药图像;对于每种种类的中草药图像,将目标中草药图像划分为训练集和测试集;对训练集和测试集中的目标中草药图像分别标注标签;基于GoodLeNet构建分类模型,并输入训练集对分类模型进行训练,得到训练后分类模型;输入测试集对训练后分类模型进行验证。系统包括输入模块、分割模块、划分模块、划分模块、建模分析模块和验证模块。
Description
技术领域
本发明涉及深度学习技术领域,具体地说是一种基于深度学习的中草药分类建模方法及系统。
背景技术
中草药植物种类分别在中医领域具有重要意义。对于不同种类的中草药植物,部分种类的中草药在外形上颇为相似;对于相同种类的中草药植物,由于中草药植物生长环境等因素的影响,同种种类的中草药植物可能呈现不同的形态。鉴于上述原因,对于中草药的分类需要草药经验十分丰富的人才能快速、准确的进行分类。
手工进行分类的话就会浪费大量的人力物力,而且对于分类人员还需要他们有比较丰富的中草药分类经验,效率太低,且分类时使用的物种种类和图片的数量都比较少,并且只能适用于自己特定的数据集或者他们设定的情况,不具有普遍性。
深度学习(Deep Learning,DL)或阶层学习(hierarchical learning)是机器学习的技术和研究领域之一,通过建立具有阶层结构的人工神经网络(Artifitial NeuralNetworks,ANNs),在计算系统中实现人工智能,深度学习被用于对复杂结构和大样本的高维数据进行学习。
基于深度学习如何快速、准确的对中草药进行分类,是需要解决的技术问题。
发明内容
本发明的技术任务是针对以上不足,提供一种基于深度学习的中草药分类建模方法及系统,来解决基于深度学习如何快速、准确的对中草药进行分类的问题。
第一方面,本发明提供一种的基于深度学习的中草药分类建模方法,包括:
获取若干个中草药图像形成数据集,所述若干个中草药图像涵盖多种种类的中草药、并涵盖每种种类中草药的多种形态;
基于最大类间方差方法和K均值算法分别对每个中草药图像进行分割处理,得到与所述中草药图像对应的两个效果不同的目标中草药图像,并选择效果明显的目标中草药图像;
对于每种种类的中草药图像,将目标中草药图像划分为训练集和测试集;
对训练集和测试集中的目标中草药图像分别标注标签,所述标签用于标识目标中草药图像对应的中草药种类和编号;
基于GoodLeNet构建分类模型,并输入训练集对分类模型进行训练,得到训练后分类模型;
输入测试集对训练后分类模型进行验证。
本实施方式中,获取多种种类、多种形态的中草药图像形成数据集,通过最大类间方差法和K均值算法分别对每个中草药图像进行分割,并选取效果好的目标中草药图像输出,效果好为理解为能够识别出中草药种类,并从上述目标中草药图像中选取一定比例作为训练集,剩下的作为测试集,基于GoodLeNet构建分类模型,通过训练集训练分类模型,通过测试集验证训练后分类模型。通过上述步骤,得到的训练后分类模型能够对多种中草药进行分类,即使由于生长环境不同导致同种类的中草药有不同形态,也可通过通过该训练后分类模型进行分类。
作为优选,基于最大类间方差方法对每个中草药图像进行分割处理,包括如下步骤:
分别提取中草药图像的红色通道、绿色通道和蓝色通道对应的灰度图像,得到三个灰度图像;
基于最大类间方差方法分别对上述三个灰度图像进行分割处理,得到三个分割后灰度图像;
分别对上述三个分割后灰度图像进行形态学的闭操作,得到三个去噪后灰度图像;
分别对上述三个去噪后灰度图像中轮廓断裂的部分进行填充,得到填充后灰度图像;
基于上述三个填充后灰度图像截取中草药图像的分割效果的,得到目标中草药图像。
作为优选,提取中草药图像的红色通道、绿色通道和蓝色通道对应的灰度图像时,分别对上述三个灰度图像进行取反操作。
作为优选,基于K均值算法对中草药图像进行分割处理,包括如下步骤:
将中草药图像从RGB空间转换到Lab空间,L表示亮度,a通道包括的颜色依次为深绿色、灰色和粉红色,b通道包括的颜色依次是为灰色和黄色;
分别提取中草药图像的a通道分量和b通道分量,并将中草药图像转换为双精度图像,得到双精度中草药图像;
分别提取双精度中草药图像的行向量和列向量,并基于行向量和列向量对双精度中草药图像进行重构,得到重构后中草药图像;
从重构后中草药图像中选取K个像素点为中心点,重构后中草药图像中除中心点之外的像素点为剩余像素点,通过剩余像素点与上述K个中心点的欧式距离判定像素点的类别,得到与所述中草药图像对应的多个分割图像;
从上述多个分割图像中选取能够识别中草药种类的分割图像,得到目标中草药图像。
作为优选,对于基于最大类间方差方法和K均值算法分别对每个中草药图像进行分割处理,得到与所述中草药图像对应的两个效果不同的目标中草药图像,如果上述两个目标中草药图像不能识别中草药的种类,通过手动分割的方式对中草药图像进行分割。
作为优选,对于每种种类的中草药图像,将60%-90%的目标中草药图像划分为训练集,将剩余的中草药图像划分为测试集。
更优的,输入训练集对分类模型进行训练之前,对目标中草药图像进行格式转换,转换后中草药图像的大小为256*256、格式为lmdb格式的图像。
作为优选,分类模型包括卷积层、池化层、Inception模块和全连接层,上述卷积层和池化层均多层;
输入训练集对分类模型进行训练,包括如下步骤:
通过卷积层对训练集进行特征提取,得到图像特征;
通过池化层对特征图像进行降维操作,得到池化后图像特征;
通过局部响应对池化后图像特征进行归一化操作,得到归一化后图像特征;
通过卷积层对归一化后图像特征进行非线性转化,得到非线性转换后图像特征;
通过卷积层对非线性转化后图像特征进行卷积计算,并通过局部响应归一化操作,得到二次归一化后图像特征;
通过池化层对上述二次归一化后图像特征进行降维操作,得到输入特征;
将上述输入特征输入Inception模块进行计算的,得到输出特征;
将上述输出特征输入全连接层,通过全连接内配置的softmax函数进行分类,输出分类结果,并得到训练后分类模型。
第二方面,本发明提供一种基于深度学习的中草药分类建模系统,包括:
输入模块,所述输入模块用于获取若干个中草药图像形成数据集,所述若干个中草药图像涵盖多种种类的中草药、并涵盖每种种类中草药的多种形态;
分割模块,所述分割模块用于基于最大类间方差方法和K均值算法分别对每个中草药图像进行分割处理,得到与所述中草药图像对应的两个效果不同的目标中草药图像,并选择效果明显的目标中草药图像输出;
划分模块,所述划分模块用于对于每种种类的中草药图像,将目标中草药图像划分为训练集和测试集;
建模分析模块,所述建模分析模块用于基于GoogLeNet构建分类模型,并用于获取训练集并通过训练集对分类模型进行训练,得到训练后分类模型;
验证模块,所述验证模块用于获取测试集并通过测试集对训练后分类模型进行验证。
本发明的基于深度学习的中草药分类建模方法及系统具有以下优点:
1、收集多种种类、每种种类不同形态的中草药图像组成数据集,并通过最大类间方差方法和K均值算法对每个中草药图像分别进行分割处理,选取效果好的分割后中草药图像作为目标中草药图像作为目标中草药图像,通过上述目标中草药图像构建模型并验证模型,通过该分类模型可对多个种类、大数量的中草药图像进行分类,辅助中草药人员对中草药进行分类;
2、对于分类效果不明显的进行人工分类,提高了分类精度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
下面结合附图对本发明进一步说明。
附图1为实施例1基于深度学习的中草药分类建模方法的流程框图;
附图2为实施例1基于深度学习的中草药分类建模方法中基于最大类间方差方法进行切割的效果图;
附图3为实施例1基于深度学习的中草药分类建模方法中基于K均值算法方法进行切割效果图;
附图4为实施例1基于深度学习的中草药分类建模方法中通过测试集验证训练后分类模型准确率对比图;
附图5为实施例1基于深度学习的中草药分类建模方法中进一步优化后准确率对比图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明,以使本领域的技术人员可以更好地理解本发明并能予以实施,但所举实施例不作为对本发明的限定,在不冲突的情况下,本发明实施例以及实施例中的技术特征可以相互结合。
需要理解的是,在本发明实施例的描述中,“第一”、“第二”等词汇,仅用于区分描述的目的,而不能理解为指示或暗示相对重要性,也不能理解为指示或暗示顺序。在本发明实施例中的“多个”,是指两个或两个以上。
本发明实施例中的属于“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,单独存在B,同时存在A和B这三种情况。另外,本文中字符“/”一般表示前后关联对象是一种“或”关系。
本发明实施例提供基于深度学习的中草药分类建模方法及系统,用于解决基于深度学习如何快速、准确的对中草药进行分类的技术问题。
实施例1:
如附图1所示,本发明的基于深度学习的中草药分类建模方法,包括如下步骤:
S100、获取若干个中草药图像形成数据集,所述若干个中草药图像涵盖多种种类的中草药、并涵盖每种种类中草药的多种形态;
S200、基于最大类间方差方法和K均值算法分别对每个中草药图像进行分割处理,得到与所述中草药图像对应的两个效果不同的目标中草药图像,并选择效果明显的目标中草药图像;
S300、对于每种种类的中草药图像,将目标中草药图像划分为训练集和测试集;
S400、对训练集和测试集中的目标中草药图像分别标注标签,所述标签用于标识目标中草药图像对应的中草药种类和编号;
S500、基于GoogLeNet构建分类模型,并输入训练集对分类模型进行训练,得到训练后分类模型;
S600、输入测试集对训练后分类模型进行验证。
其中,最大类间方差法是一种自适应的阈值确定的方法,又叫大津法,简称OTSU。它是按图像的灰度特性,将图像分成背景和目标两部分。背景和目标之间的类间方差越大,说明构成图像的两部分的差别越大,当部分目标错分为背景或部分背景错分为目标都会导致两部分差别变小。因此,使类间方差最大的分割意味着错分概率最小。
步骤S200中基于最大类间分割方法对每个中草药图像进行分割处理,包括如下分步骤:
(1)、分别提取中草药图像的红色通道、绿色通道和蓝色通道对应的灰度图像,得到三个灰度图像;
(2)、基于最大类间方差方法分别对上述三个灰度图像进行分割处理,得到三个分割后灰度图像;
(3)、分别对上述三个分割后灰度图像进行形态学的闭操作,得到三个去噪后灰度图像;
(4)、分别对上述三个去噪后灰度图像中轮廓断裂的部分进行填充,得到填充后灰度图像;
(5)、基于上述三个填充后灰度图像截取中草药图像的分割效果的,得到目标中草药图像。
步骤(3)使用半径为9的圆盘结构对灰度图像进行形态学的闭操作,其中半径为9的圆盘结构为在一个矩形里构造一个半径为9的圆,在圆内取值为1,即保留原像素的值,矩形中除圆之外的部分取为0,即把矩形中除圆之外的部分设置为背景。
步骤(4)为了使得灰度图像中轮廓线更加光滑,消除灰度图像中的小空间,对轮廓中断裂的部分进行填充。
在通过最大类间方差方法对中草药图像进行分割时,可能将目标植物覆盖成背景,因此在步骤(1)中将中草药图像转换为灰度图像时,对每个灰度图像进行取反操作。
K均值算法是通过计算数据点到每一个聚类中心的某种距离来选择该数据点应该属于哪一个类。使用求极值的方法来确定如何调整迭代运算,也就是使得同一个类内数据点之间的距离方差最小,而不同类之间数据点的距离方差最大。
步骤S200中基于K均值算法对中草药图像进行分割处理,包括如下步骤:
(1)、将中草药图像从RGB空间转换到Lab空间,L表示亮度,a通道包括的颜色依次为深绿色、灰色和粉红色,b通道包括的颜色依次是为灰色和黄色;
(2)、分别提取中草药图像的a通道分量和b通道分量,并将中草药图像转换为双精度图像,得到双精度中草药图像;
(3)、分别提取双精度中草药图像的行向量和列向量,并基于行向量和列向量对双精度中草药图像进行重构,得到重构后中草药图像;
(4)、从重构后中草药图像中选取K个像素点为中心点,重构后中草药图像中除中心点之外的像素点为剩余像素点,通过剩余像素点与上述K个中心点的欧式距离判定像素点的类别,得到与所述中草药图像对应的多个分割图像;
(5)、从上述多个分割图像中选取能够识别中草药种类的分割图像,得到目标中草药图像。
上述步骤(4)中设置分割的区域个数(即把目标中草药图像分为几类,及确定K值),对于中草药分类一般设置2~5三个选项来对目标中草药图像进行分割,设定K均值算法的其它参数,通过剩余像素点与上述K个中心点的欧式距离判定像素点的类别,并设置聚类次数5~7次,最后得到我们需要的分割后的不同区域的图像,从中挑选能够把中草药植物分割出来的图像作为需要的数据。
对于基于最大类间方差方法和K均值算法分别对每个中草药图像进行分割处理,得到与所述中草药图像对应的两个效果不同的目标中草药图像,如果上述两个目标中草药图像不能识别中草药的种类,通过手动分割的方式对中草药图像进行分割。
步骤S300中,将目标中草药图像分为训练集和测试集时,训练集中每一个种类中的中草药大约占次种类的60%-90%,测试集中每一个种类的中草药大约占此种类的10%-40%。本实施例中,训练集占此种类的80%,测试集占20%。
将目标中草药图像分为训练集和测试集后,对每个目标中草药图像进行格式转换,转换后目标中草药图像的大小为256*256,图片格式为lmdb格式。
GoogLeNet模型是通过一系列卷积对输入图片进行特征的提取,虽然增加了网络的深度和宽度,模型的参数量却没有增加很多,主要是因为防止计算爆炸的现象,采用了池化等一系列操作来对数据进行降维,最后使用一个softmax把每张图片属于哪个类别的概率输出,我们把概率最大的那个类作为我们最后的预测结果,由此实现中草药的分类。
本实施例中分类模型包括卷积层、池化层、Inception模块和全连接层,上述卷积层和池化层均多层。
输入训练集对分类模型进行训练,包括如下步骤:
(1)通过卷积层对训练集进行特征提取,得到图像特征,具体的使用大小为步长为2、卷积核大小为7×7的卷积层对训练集图像进行特征提取;
(2)由于上述步骤(1)得到的参数比较多,因此通过池化层对特征图像进行降维操作,得到池化后图像特征,具体的使用步长为2、卷积核大小为3×3的池化层进行降维;
(3)通过局部响应对池化后图像特征进行归一化操作,得到归一化后图像特征;
(4)通过卷积层对归一化后图像特征进行非线性转化,得到非线性转换后图像特征,具体的使用大小为1×1的卷积核进行非线性转化;
(5)通过卷积层对非线性转化后图像特征进行卷积计算,具体的使用大小为步长为1、卷积核大小为3×3的卷积层进行卷积计算,并通过局部响应归一化操作,得到二次归一化后图像特征;
(6)为降低图像的维度,通过池化层对上述二次归一化后图像特征进行降维操作,得到输入特征,具体的使用步长为2、卷积核大小为3×3的池化层进行池化;
(7)将上述输入特征输入Inception模块进行计算的,得到输出特征;
(8)将上述输出特征输入全连接层,通过全连接内配置的softmax函数进行分类,输出分类结果,并得到训练后分类模型。
步骤(7)中Inception模块为9个连续的Inception Module,并且在第三个Inception Module和第六个Inception Module之后加入辅助分类器,辅助分类器包含:一个滤波器大小为5×5、步长为3的均值池化层,具有128个滤波器的1×1卷积,一个包含1024个神经元的全连接层,随即去掉其中70%的神经元来减小计算量,最后使用一个带有softmax损失的线性层作为分类器;它们的损失以折扣权重(辅助分类器损失权重是0.3)加到整个Inception模块的损失中去,因为随着Inception模块网络层数的加深它的参数量也会相应的增加,所以第二个和第七个Inception Module后边增加了步长为2、卷积核大小为3×3的池化层来对网络进行降维;在整个Inception模块的最后加入一个InceptionModule后加入一个7×7的均值池化层。
通过上述步骤对分类模型进行训练后,得到训练后分类模型。
将测试集输入训练后分类模型中,通过训练后分类模型对测试集进行分类,并将测试结果与实际种类做对比,验证该训练后分类模型的准确率。
如附图2所示,图中左边为原中草药图像,右边两个为使用最大类间方差方法选取不同颜色、进行分割处理后得到效果图。
附图3中,选取两组数据,分别为原中草药图像和使用K均值算法对图像进行分割算法进行分割后效果图。
附图4中,为验证训练后分类模型的示意图,X线段代表使用分割之后的图片进行实验得到的Top-5准确率,方块线段代表使用没有经过分割的图片进行实验得到的准确率,三角线段代表使用分割之后的图片进行实验得到的Top-1准确率,菱形线段代表使用没经过分割的图片进行实验得到的Top-1准确率。此次使用分割后的图像进行实验得到的Top-1准确率为67.4%,Top-5的准确率为92.4%。
附图5中,通过进行多次实验的方式来调整和选取合适的参数,对网络参数进行了进一步的调整之后得到的准确率,这一次实验得到的Top-1的准确率为72%,Top-5的准确率为93.6%。
实施例2:
本发明的基于深度学习的中草药分类建模系统,包括输入模块、分割模块、划分模块、划分模块、建模分析模块和验证模块。
输入模块用于获取若干个中草药图像形成数据集,所述若干个中草药图像涵盖多种种类的中草药、并涵盖每种种类中草药的多种形态。
分割模块用于基于最大类间方差方法和K均值算法分别对每个中草药图像进行分割处理,得到与所述中草药图像对应的两个效果不同的目标中草药图像,并选择效果明显的目标中草药图像输出。
本实施例中分割模块能够执行实施例1公开的基于最大类间方差方法对中草药图像进行分割处理的步骤,并且能够直线实施例1公开的基于K均值算法对每个中草药图像进行分割处理的步骤。
同时,本实施例中分割模块支持手动分割,对于基于最大类间方差方法和K均值算法分别对每个中草药图像进行分割处理,得到与所述中草药图像对应的两个效果不同的目标中草药图像,如果上述两个目标中草药图像不能识别中草药的种类,通过手动分割的方式对中草药图像进行分割。
划分模块用于对于每种种类的中草药图像,将目标中草药图像划分为训练集和测试集。本实施例中对于每种种类的中草药图像,将60%-90%的目标中草药图像划分为训练集,将剩余的中草药图像划分为测试集。
建模分析模块用于基于GoogLeNet构建分类模型,并用于获取训练集并通过训练集对分类模型进行训练,得到训练后分类模型。
本实施例中分类模型包括卷积层、池化层、Inception模块和全连接层,上述卷积层和池化层均多层,该建模分析模块支持实施例公开的输入训练集对分类模型进行训练的步骤。
验证模块用于获取测试集并通过测试集对训练后分类模型进行验证。
作为本实施例的改进,还包括格式转换模块,该格式转换模块用于对目标中草药图像进行格式转换,转换后中草药图像的大小为256*256、格式为lmdb格式的图像。建模分析模块获取训练集之前,通过格式转换模块对目标中草药图像进行格式转换,验证模块获取测试集之前,通过格式转换模块对目标中草药图像进行格式转换。
本实施例的基于深度学习的中草药分类建模系统执行实施例1公开的基于深度学习的中草药分类建模方法。
以上所述实施例仅是为充分说明本发明而所举的较佳的实施例,本发明的保护范围不限于此。本技术领域的技术人员在本发明基础上所作的等同替代或变换,均在本发明的保护范围之内。本发明的保护范围以权利要求书为准。
Claims (9)
1.基于深度学习的中草药分类建模方法,其特征在于包括:
获取若干个中草药图像形成数据集,所述若干个中草药图像涵盖多种种类的中草药、并涵盖每种种类中草药的多种形态;
基于最大类间方差方法和K均值算法分别对每个中草药图像进行分割处理,得到与所述中草药图像对应的两个效果不同的目标中草药图像,并选择效果明显的目标中草药图像;
对于每种种类的中草药图像,将目标中草药图像划分为训练集和测试集;
对训练集和测试集中的目标中草药图像分别标注标签,所述标签用于标识目标中草药图像对应的中草药种类和编号;
基于GoogLeNet构建分类模型,并输入训练集对分类模型进行训练,得到训练后分类模型;
输入测试集对训练后分类模型进行验证。
2.根据权利要求1所述的基于深度学习的中草药分类建模方法,其特征在于基于最大类间方差方法对每个中草药图像进行分割处理,包括如下步骤:
分别提取中草药图像的红色通道、绿色通道和蓝色通道对应的灰度图像,得到三个灰度图像;
基于最大类间方差方法分别对上述三个灰度图像进行分割处理,得到三个分割后灰度图像;
分别对上述三个分割后灰度图像进行形态学的闭操作,得到三个去噪后灰度图像;
分别对上述三个去噪后灰度图像中轮廓断裂的部分进行填充,得到填充后灰度图像;
基于上述三个填充后灰度图像截取中草药图像的分割效果的,得到目标中草药图像。
3.根据权利要求2所述的基于深度学习的中草药分类建模方法,其特征在于提取中草药图像的红色通道、绿色通道和蓝色通道对应的灰度图像时,分别对上述三个灰度图像进行取反操作。
4.根据权利要求1、2或3所述的基于深度学习的中草药分类建模方法,其特征在于基于K均值算法对中草药图像进行分割处理,包括如下步骤:
将中草药图像从RGB空间转换到Lab空间,L表示亮度,a通道包括的颜色依次为深绿色、灰色和粉红色,b通道包括的颜色依次是为灰色和黄色;
分别提取中草药图像的a通道分量和b通道分量,并将中草药图像转换为双精度图像,得到双精度中草药图像;
分别提取双精度中草药图像的行向量和列向量,并基于行向量和列向量对双精度中草药图像进行重构,得到重构后中草药图像;
从重构后中草药图像中选取K个像素点为中心点,重构后中草药图像中除中心点之外的像素点为剩余像素点,通过剩余像素点与上述K个中心点的欧式距离判定像素点的类别,得到与所述中草药图像对应的多个分割图像;
从上述多个分割图像中选取能够识别中草药种类的分割图像,得到目标中草药图像。
5.根据权利要求4所述的基于深度学习的中草药分类建模方法,其特征在于对于基于最大类间方差方法和K均值算法分别对每个中草药图像进行分割处理,得到与所述中草药图像对应的两个效果不同的目标中草药图像,如果上述两个目标中草药图像不能识别中草药的种类,通过手动分割的方式对中草药图像进行分割。
6.根据权利要求1、2或3所述的基于深度学习的中草药分类建模方法,其特征在于对于每种种类的中草药图像,将60%-90%的目标中草药图像划分为训练集,将剩余的中草药图像划分为测试集。
7.根据权利要求1、2或3所述的基于深度学习和中草药分类建模方法,其特征在于输入训练集对分类模型进行训练之前,对目标中草药图像进行格式转换,转换后中草药图像的大小为256*256、格式为lmdb格式的图像。
8.根据权利要求1、2或3所述的基于深度学习的中草药分类建模方法,其特征在于分类模型包括卷积层、池化层、Inception模块和全连接层,上述卷积层和池化层均多层;
输入训练集对分类模型进行训练,包括如下步骤:
通过卷积层对训练集进行特征提取,得到图像特征;
通过池化层对特征图像进行降维操作,得到池化后图像特征;
通过局部响应对池化后图像特征进行归一化操作,得到归一化后图像特征;
通过卷积层对归一化后图像特征进行非线性转化,得到非线性转换后图像特征;
通过卷积层对非线性转化后图像特征进行卷积计算,并通过局部响应归一化操作,得到二次归一化后图像特征;
通过池化层对上述二次归一化后图像特征进行降维操作,得到输入特征;
将上述输入特征输入Inception模块进行计算的,得到输出特征;
将上述输出特征输入全连接层,通过全连接内配置的softmax函数进行分类,输出分类结果,并得到训练后分类模型。
9.基于深度学习的中草药分类建模系统,其特征在于包括:
输入模块,所述输入模块用于获取若干个中草药图像形成数据集,所述若干个中草药图像涵盖多种种类的中草药、并涵盖每种种类中草药的多种形态;
分割模块,所述分割模块用于基于最大类间方差方法和K均值算法分别对每个中草药图像进行分割处理,得到与所述中草药图像对应的两个效果不同的目标中草药图像,并选择效果明显的目标中草药图像输出;
划分模块,所述划分模块用于对于每种种类的中草药图像,将目标中草药图像划分为训练集和测试集;
建模分析模块,所述建模分析模块用于基于GoogLeNet构建分类模型,并用于获取训练集并通过训练集对分类模型进行训练,得到训练后分类模型;
验证模块,所述验证模块用于获取测试集并通过测试集对训练后分类模型进行验证。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910583245.4A CN110288041A (zh) | 2019-07-01 | 2019-07-01 | 基于深度学习的中草药分类建模方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910583245.4A CN110288041A (zh) | 2019-07-01 | 2019-07-01 | 基于深度学习的中草药分类建模方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110288041A true CN110288041A (zh) | 2019-09-27 |
Family
ID=68020285
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910583245.4A Pending CN110288041A (zh) | 2019-07-01 | 2019-07-01 | 基于深度学习的中草药分类建模方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110288041A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112381840A (zh) * | 2020-11-27 | 2021-02-19 | 深源恒际科技有限公司 | 一种用于定损视频中车辆外观部件标注的方法及系统 |
CN113539412A (zh) * | 2021-07-19 | 2021-10-22 | 闽江学院 | 基于深度学习的中草药推荐系统 |
CN114818909A (zh) * | 2022-04-22 | 2022-07-29 | 北大荒信息有限公司 | 一种基于作物长势特征的杂草检测方法和装置 |
-
2019
- 2019-07-01 CN CN201910583245.4A patent/CN110288041A/zh active Pending
Non-Patent Citations (2)
Title |
---|
AFFIX MARETA: "Herbal leaf classification using images in natural background", 《IEEE》 * |
SHUPENG LIU: "utomatic Classification of Chinese Herbal Based on Deep Learning Method", 《IEEE》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112381840A (zh) * | 2020-11-27 | 2021-02-19 | 深源恒际科技有限公司 | 一种用于定损视频中车辆外观部件标注的方法及系统 |
CN113539412A (zh) * | 2021-07-19 | 2021-10-22 | 闽江学院 | 基于深度学习的中草药推荐系统 |
CN113539412B (zh) * | 2021-07-19 | 2023-11-28 | 闽江学院 | 基于深度学习的中草药推荐系统 |
CN114818909A (zh) * | 2022-04-22 | 2022-07-29 | 北大荒信息有限公司 | 一种基于作物长势特征的杂草检测方法和装置 |
CN114818909B (zh) * | 2022-04-22 | 2023-09-15 | 北大荒信息有限公司 | 一种基于作物长势特征的杂草检测方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107016405B (zh) | 一种基于分级预测卷积神经网络的害虫图像分类方法 | |
CN108648191B (zh) | 基于贝叶斯宽度残差神经网络的害虫图像识别方法 | |
CN107977671A (zh) | 一种基于多任务卷积神经网络的舌象分类方法 | |
CN112132817B (zh) | 一种混合注意力机制的眼底图像视网膜血管分割方法 | |
CN106682633B (zh) | 基于机器视觉的粪便镜检图像有形成分的分类识别方法 | |
CN108830188A (zh) | 基于深度学习的车辆检测方法 | |
CN109583425A (zh) | 一种基于深度学习的遥感图像船只集成识别方法 | |
CN103996018B (zh) | 基于4dlbp的人脸识别方法 | |
CN107464250A (zh) | 基于三维mri图像的乳腺肿瘤自动分割方法 | |
CN107506797A (zh) | 一种基于深度神经网络和多模态影像阿尔兹海默病分类方法 | |
CN108109160A (zh) | 一种基于深度学习的免交互式GrabCut舌体分割方法 | |
CN112183635A (zh) | 一种多尺度反卷积网络实现植物叶部病斑分割与识别方法 | |
CN108108761A (zh) | 一种基于深度特征学习的快速交通信号灯检测方法 | |
CN106446942A (zh) | 基于增量学习的农作物病害识别方法 | |
CN112801212A (zh) | 一种基于小样本半监督学习的白细胞分类计数方法 | |
CN109711426A (zh) | 一种基于gan和迁移学习的病理图片分类装置及方法 | |
CN106530283A (zh) | 一种基于svm的医疗图像血管识别方法 | |
CN111489370B (zh) | 基于深度学习的遥感图像的分割方法 | |
CN105427309A (zh) | 面向对象高空间分辨率遥感信息提取的多尺度分层处理方法 | |
CN110288041A (zh) | 基于深度学习的中草药分类建模方法及系统 | |
CN108629369A (zh) | 一种基于Trimmed SSD的尿沉渣有形成分自动识别方法 | |
CN111814563B (zh) | 一种种植结构的分类方法及装置 | |
CN109871875A (zh) | 一种基于深度学习的建筑物变化检测方法 | |
CN111079620A (zh) | 基于迁移学习的白细胞图像检测识别模型构建方法及应用 | |
CN107748889A (zh) | 一种乳腺肿瘤超声图像自动分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190927 |