CN106709506A - 一种中草药种类及不同产地的识别分类方法 - Google Patents

一种中草药种类及不同产地的识别分类方法 Download PDF

Info

Publication number
CN106709506A
CN106709506A CN201611065397.8A CN201611065397A CN106709506A CN 106709506 A CN106709506 A CN 106709506A CN 201611065397 A CN201611065397 A CN 201611065397A CN 106709506 A CN106709506 A CN 106709506A
Authority
CN
China
Prior art keywords
herbal medicine
chinese herbal
data
identifying
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611065397.8A
Other languages
English (en)
Inventor
李会
骆德汉
孙运龙
彭珂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN201611065397.8A priority Critical patent/CN106709506A/zh
Publication of CN106709506A publication Critical patent/CN106709506A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明公开了一种中草药种类及不同产地的识别分类方法,属于信息识别及处理领域,包括如下步骤:对中草药样本数据预处理,并把数据集分成两组,训练集数据和测试集数据;构建支持向量机SVM训练模型,确定涉及的参数组合,所述参数组合包括核函数参数和惩罚因子,训练集数据作为训练模型的输入;运用仿生搜索算法对支持向量机SVM的参数组合进行寻优;根据获取的最优参数,对模型进行优化,测试集数据作为优化模型的输入,进行数据测试,得到中草药种类及不同产地的识别分类。本发明提供了一种中草药种类及不同产地的识别分类方法,具有参数设置简单、快速检测、全局搜索能力强等优点,为识别不同产地的中草药提供基础。

Description

一种中草药种类及不同产地的识别分类方法
技术领域
本发明涉及信息识别及处理领域,尤其涉及一种中草药种类及不同产地的识别分类方法。
背景技术
随着计算机技术、信息处理等的快速发展,中草药种类及不同产地的识别为中草药的品质鉴定等问题尤为重要。相关中草药的不同产地研究方式从多个方面进行开展,有效成分与生态因子间的相关性研究,有效成分间的差异性研究,中药材成分的指纹图谱研究,中草药成分分析鉴别方法研究,成分元素的波浪式分布研究,中草药不同部位的有效成分含量研究,运用高效液相色谱分析方法研究。为中草药品质鉴定提供一定的理论基础和实践工作指导经验。
由于中草药实际的数据特点,支持向量机SVM中核函数及参数的人工选择具有一定的局限性和盲目性,运用仿生搜索算法解决参数优化的问题,提升分类准确率和速率。因此,提出一种中草药种类及不同产地的识别分类方法。
发明内容
为了克服现有技术的不足,本发明提出了一种中草药种类及不同产地的识别分类方法,具有参数设置简单、快速检测、全局搜索能力强等优点,为识别不同产地的中草药提供基础。
本发明所采用的技术方案:一种中草药种类及不同产地的识别分类方法,所述方法的实现过程包括以下步骤:
步骤一:对中草药样本数据集进行特征提取的预处理,特征提取后的中草药样本数据集分成两组,75%数据集作为训练集数据,25%数据集作为测试集数据;
步骤二:构建支持向量机SVM训练模型,确定其涉及到的参数组合,所述参数组合包括核函数参数和惩罚因子,将所述训练集数据作为所述训练模型的输入;
步骤三:运用仿生搜索算法对支持向量机SVM的参数组合进行寻优,在全局范围内获得最优解;
步骤四:根据获取的最优参数,对模型进行优化,将所述测试集数据作为优化模型的输入,进行数据测试,得到中草药种类及不同产地的识别分类。
所述方法的实现过程步骤为:
步骤一中将采集并测量得到的一个中草药样本数据信息矩阵Fs向量化,选取其中达到稳态响应值的测量值,组成训练样本矩 其中r代表训练样本矩阵的行数,由选取的样本类,样本个数及稳态时间值个数决定,j代表训练样本类别个数j∈[1,3],i代表第j类训练样本个数i∈[1,ni]。
所述方法的实现过程步骤为:
步骤二中采用径向基函数作为支持向量机的核函数,其形式为:
其中xi、xj表示提取的中草药样本数据信息的两个不同特征向量;σ是径向基函数的宽度参数。
所述方法的实现过程步骤为:
步骤三中运用仿生搜索算法对支持向量机SVM的核函数参数、惩罚因子进行寻优,其具体过程步骤为:
1)获取中草药样本数据集;
2)确定仿生搜索初始种群个体数量number=20,最大迭代次数Maxreplace=100,在[-1,1]范围内生成生物个体的初始位置;
3)赋予生物个体随机飞行方向与距离,计算生物个体所在位置与原点之间的距离Disti,获取味道浓度判定值Ci,其中i表示第i个生物个体;
4)将分类准确率作为适应度函数Fitness function:最佳味道浓度值Smelli=Fitness function(Ci);
5)找到适应度函数中最大值对应的分类准确率最高的生物个体,并保留最佳味道浓度值及其当前所在的位置;
6)进入迭代寻优过程,判别最高分类准确率是否优于前一代最高分类正确率,若是则将当前最高分类准确率的位置坐标赋给初始坐标,否则返回至步骤3);判别是否达到最大迭代次数,若是则结束进程,否则返回至步骤3);
7)记录最优参数,优化模型构建完毕。
与现有技术相比,本发明的有益效果是:本发明运用仿生搜索算法的参数设置简单、快速检测、全局搜索能力强等特性,构建支持向量机SVM预测模型,通过参数寻优后再进行模型优化,提高了分类准确率和精度,可有效的应用到中草药种类及不同产地的识别分类。
附图说明
图1为中草药种类及不同产地的识别分类总体流程图。
图2为仿生搜索算法对支持向量机SVM的参数寻优流程图。
图3为优化模型的测试集数据样本判别图。
图4为图3优化模型的测试集数据样本判别的所有待测样本相关性判别结果图。
具体实施方式
下面结合具体实施例进一步说明本发明的技术方案。
1.参照附图1,按以下步骤进行:
步骤1:选取安徽何首乌、广东何首乌、河南何首乌样品各100克,各备份为20份,每份为5克(g),切割成面积约1平方厘米的片状,放置在采集样品烧杯(200毫升)置于恒温(60℃)恒湿(75%)的实验箱中静置100分钟。
步骤2:选取20份中的15份样品(另5份作为未知样品待检测)应用仿生嗅觉系统对已知安徽何首乌、广东何首乌、河南何首乌气味样品进行采集检测,测量时间t为100秒(S),采集速率为7.747毫升/分钟(ml/min),并将所测数据Fs(S1,S2,……SN)保存至计算机。
步骤3:对步骤2中采集所得到的测量数据采用支持向量机SVM进行识别判断训练,其中径向基和函数为:
其中xi、xj表示提取的中草药样本数据信息的两个不同特征向量;σ是径向基函数的宽度参数。
运用仿生搜索算法对训练模型中的参数进行寻优,优化模型后再进行数据测试,得到中草药种类及不同产地的识别分类。
2.所述步骤2及步骤3中使用的数据集及方法,具体步骤如下:
步骤1):将采集并测量得到的15份安徽何首乌、广东何首乌、河南何首乌样本数据信息矩阵Fs向量化,选取其中达到稳态响应值的测量值,组成训练样本矩阵 其数据如下表1所示:
表1训练样本矩阵PT数据
其中r=45代表训练样本矩阵的行数(其中r=45=3×15×1,选取的样本类别个数j=3,每个类中样本个数i=10,每个样本稳态时间值个数为1),则训练样本的均值为
步骤2):由步骤1)可得到训练样本去均值后形成的样本矩阵T=PT-μ,T∈R45×10,则T的协方差矩阵为
Q=T×TT(Q∈R45×45) (2)
其中TT是T的转置矩阵。
3.参照附图2,根据仿生搜索算法的特点,具体步骤如下所示:
步骤1:算法初始化,设定仿生搜索初始种群个体数量number=20,最大迭代次数Maxreplace=100,在[-1,1]范围内生成生物个体的初始位置坐标(X-axis,Y-axis);
步骤2:赋予生物个体随机飞行方向与距离,计算生物个体所在位置与原点之间的距离Disti,获取味道浓度判定值Ci,其中i表示第i个生物个体;
Xi=X-axis+Random Value;Yi=X-axis+Random Value
步骤3:将分类准确率作为适应度函数Fitness function,味道浓度判定值Ci代入其中:
最佳味道浓度值Smelli=Fitness function(Ci)
步骤3:将分类准确率作为适应度函数Fitness function,味道浓度判定值Ci代入其中:
最佳味道浓度值Smelli=Fitness function(Ci);
步骤4:找到适应度函数中最大值对应的分类正确率最高的生物个体,并保留最佳味道浓度值及其当前所在的位置,此时生物群体向该位置移动,每隔固定距离d记录途径位置上的气味浓度值:
Smellbest=bestSmell
X-axis=X(bestIndex);Y-axis=Y(bestIndex)
步骤5:进入迭代寻优过程,判别最高分类准确率是否优于前一代最高分类正确率,若是则将当前最高分类准确率的位置坐标赋给初始坐标,否则返回至步骤2;判别是否达到最大迭代次数,若是则结束进程,否则返回至步骤2;
步骤6:记录最优参数,优化模型构建完毕。
未知样品测试集数据分类判别:
从3个产地何首乌样品的剩余待测样品中任意选取5组作为未知样品,重复步骤2的操作,并利用SVM算法结合相关距离公式:
相关系数定义
相关系数是衡量随机变量X与Y相关程度的一种方法,取值范围是[-1,1]。
相关距离定义
Dxy=1-ρXY
来对5组样品进行判别检测,判别检测结果如图3所示,能准确识别并输出未知样品的分类及不同产地的名称。
综上所述的本发明的实施方式,并不构成对本发明保护范围的限定。任何在本发明的精神原则之内所作出的修改、等同替换和改进等,均应包含在本发明的权利要求保护范围之内。

Claims (4)

1.一种中草药种类及不同产地的识别分类方法,其特征在于,所述方法的实现过程包括以下步骤:
步骤一:对中草药样本数据集进行特征提取的预处理,特征提取后的中草药样本数据集分成两组,75%数据集作为训练集数据,25%数据集作为测试集数据;
步骤二:构建支持向量机SVM训练模型,确定其涉及到的参数组合,所述参数组合包括核函数参数和惩罚因子,将所述训练集数据作为所述训练模型的输入;
步骤三:运用仿生搜索算法对支持向量机SVM的参数组合进行寻优,在全局范围内获得最优解;
步骤四:根据获取的最优参数,对模型进行优化,将所述测试集数据作为优化模型的输入,进行数据测试,得到中草药种类及不同产地的识别分类。
2.根据权利1所述的一种中草药种类及不同产地的识别分类方法,其特征在于,所述方法的实现过程步骤为:
步骤一中将采集并测量得到的一个中草药样本数据信息矩阵Fs向量化,选取其中达到稳态响应值的测量值,组成训练样本矩 其中r代表训练样本矩阵的行数,由选取的样本类,样本个数及稳态时间值个数决定,j代表训练样本类别个数j∈[1,3],i代表第j类训练样本个数i∈[1,ni]。
3.根据权利1所述的一种中草药种类及不同产地的识别分类方法,其特征在于,所述方法的实现过程步骤为:
步骤二中采用径向基函数作为支持向量机的核函数,其形式为:
K ( x i , x j ) = exp ( - | | x i - x j | | 2 2 σ 2 )
其中xi、xj表示提取的中草药样本数据信息的两个不同特征向量;σ是径向基函数的宽度参数。
4.根据权利1所述的一种中草药种类及不同产地的识别分类方法,其特征在于,所述方法的实现过程步骤为:
步骤三中运用仿生搜索算法对支持向量机SVM的核函数参数、惩罚因子进行寻优,其具体过程步骤为:
1)获取中草药样本数据集;
2)确定仿生搜索初始种群个体数量number=20,最大迭代次数Maxreplace=100,在[-1,1]范围内生成生物个体的初始位置;
3)赋予生物个体随机飞行方向与距离,计算生物个体所在位置与原点之间的距离Disti,获取味道浓度判定值Ci,其中i表示第i个生物个体;
4)将分类准确率作为适应度函数Fitness function:最佳味道浓度值Smelli=Fitness function(Ci);
5)找到适应度函数中最大值对应的分类准确率最高的生物个体,并保留最佳味道浓度值及其当前所在的位置;
6)进入迭代寻优过程,判别最高分类准确率是否优于前一代最高分类正确率,若是则将当前最高分类准确率的位置坐标赋给初始坐标,否则返回至步骤3);判别是否达到最大迭代次数,若是则结束进程,否则返回至步骤3);
7)记录最优参数,优化模型构建完毕。
CN201611065397.8A 2016-11-28 2016-11-28 一种中草药种类及不同产地的识别分类方法 Pending CN106709506A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611065397.8A CN106709506A (zh) 2016-11-28 2016-11-28 一种中草药种类及不同产地的识别分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611065397.8A CN106709506A (zh) 2016-11-28 2016-11-28 一种中草药种类及不同产地的识别分类方法

Publications (1)

Publication Number Publication Date
CN106709506A true CN106709506A (zh) 2017-05-24

Family

ID=58934066

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611065397.8A Pending CN106709506A (zh) 2016-11-28 2016-11-28 一种中草药种类及不同产地的识别分类方法

Country Status (1)

Country Link
CN (1) CN106709506A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107480587A (zh) * 2017-07-06 2017-12-15 阿里巴巴集团控股有限公司 一种模型配置以及图像识别的方法及装置
CN109102022A (zh) * 2018-08-13 2018-12-28 淮北师范大学 一种基于支持向量机的光变曲线分类方法
CN109934277A (zh) * 2019-03-06 2019-06-25 颐保医疗科技(上海)有限公司 一种基于人工智能的中药材采收时间的鉴别方法
CN109948676A (zh) * 2019-03-06 2019-06-28 颐保医疗科技(上海)有限公司 一种基于人工智能的中药材种植产地的鉴别方法
CN111783866A (zh) * 2020-06-28 2020-10-16 中国电子科技集团公司第二十研究所 一种基于改进foa-svm的生产物流预警信息多分类方法
CN111985545A (zh) * 2020-08-10 2020-11-24 中国平安人寿保险股份有限公司 基于人工智能的目标数据检测方法、装置、设备及介质
CN112749513A (zh) * 2021-01-22 2021-05-04 北京中天鹏宇科技发展有限公司 一种电源模块的智能统型方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7283984B1 (en) * 2005-02-01 2007-10-16 Sun Microsystems, Inc. Method and apparatus for optimizing support vector machine kernel parameters
CN103164707A (zh) * 2011-12-09 2013-06-19 天津工业大学 一种基于支持向量机和粒子群优化算法的镜头边界检测方法
CN103440527A (zh) * 2013-07-29 2013-12-11 辽宁大学 一种改进蚁群算法优化支持向量机参数的方法
CN105388402A (zh) * 2015-10-30 2016-03-09 山东电力研究院 基于参数优化svm算法的交联电缆局部放电模式识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7283984B1 (en) * 2005-02-01 2007-10-16 Sun Microsystems, Inc. Method and apparatus for optimizing support vector machine kernel parameters
CN103164707A (zh) * 2011-12-09 2013-06-19 天津工业大学 一种基于支持向量机和粒子群优化算法的镜头边界检测方法
CN103440527A (zh) * 2013-07-29 2013-12-11 辽宁大学 一种改进蚁群算法优化支持向量机参数的方法
CN105388402A (zh) * 2015-10-30 2016-03-09 山东电力研究院 基于参数优化svm算法的交联电缆局部放电模式识别方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
刘虎等: "改进的遗传算法在SVM参数优化中的应用", 《云南师范大学学报》 *
刘路等: "基于人工蜂群算法的支持向量机优化", 《天津大学学报》 *
邓炳荣: "基于仿生嗅觉和核方法的中药材鉴别研究", 《中国优秀硕士学位论文全文数据库 医药卫生科技辑》 *
高雷阜等: "改进蚁群算法在SVM参数优化研究中的应用", 《计算机工程与应用》 *
黄建才: "《输电线路绝缘子泄漏电流去噪和特征提取的研究》", 31 October 2015 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107480587A (zh) * 2017-07-06 2017-12-15 阿里巴巴集团控股有限公司 一种模型配置以及图像识别的方法及装置
CN107480587B (zh) * 2017-07-06 2020-12-08 创新先进技术有限公司 一种模型配置以及图像识别的方法及装置
CN109102022B (zh) * 2018-08-13 2020-07-03 淮北师范大学 一种基于支持向量机的光变曲线分类方法
CN109102022A (zh) * 2018-08-13 2018-12-28 淮北师范大学 一种基于支持向量机的光变曲线分类方法
CN109934277B (zh) * 2019-03-06 2023-05-12 颐保医疗科技(上海)有限公司 一种基于人工智能的中药材采收时间的鉴别方法
CN109948676A (zh) * 2019-03-06 2019-06-28 颐保医疗科技(上海)有限公司 一种基于人工智能的中药材种植产地的鉴别方法
CN109934277A (zh) * 2019-03-06 2019-06-25 颐保医疗科技(上海)有限公司 一种基于人工智能的中药材采收时间的鉴别方法
CN109948676B (zh) * 2019-03-06 2024-05-07 颐保医疗科技(上海)有限公司 一种基于人工智能的中药材饮片种植产地鉴别方法
CN111783866A (zh) * 2020-06-28 2020-10-16 中国电子科技集团公司第二十研究所 一种基于改进foa-svm的生产物流预警信息多分类方法
CN111985545A (zh) * 2020-08-10 2020-11-24 中国平安人寿保险股份有限公司 基于人工智能的目标数据检测方法、装置、设备及介质
CN111985545B (zh) * 2020-08-10 2024-05-17 中国平安人寿保险股份有限公司 基于人工智能的目标数据检测方法、装置、设备及介质
CN112749513A (zh) * 2021-01-22 2021-05-04 北京中天鹏宇科技发展有限公司 一种电源模块的智能统型方法
CN112749513B (zh) * 2021-01-22 2023-12-15 北京中天鹏宇科技发展有限公司 一种电源模块的智能统型方法

Similar Documents

Publication Publication Date Title
CN106709506A (zh) 一种中草药种类及不同产地的识别分类方法
CN105044298B (zh) 一种基于机器嗅觉的蟹类新鲜度等级检测方法
CN104374738B (zh) 一种基于近红外提高鉴别结果的定性分析方法
CN103499609B (zh) 一种对蜂蜜香气智能嗅觉动态响应特征及差异化信息动态表征研究的方法
CN105447857B (zh) 脉冲涡流红外热图像的特征提取方法
CN105954412B (zh) 用于山核桃新鲜度检测的传感器阵列优化方法
CN105224960A (zh) 基于聚类算法的玉米种子高光谱图像分类识别模型更新方法
CN105334504B (zh) 基于大边界的非线性判别投影模型的雷达目标识别方法
CN103500342B (zh) 一种基于加速度计的人体行为识别方法
CN102023137A (zh) 一种白酒鉴别方法
CN103674884A (zh) 基于近红外光谱信息的烟叶风格特征的随机森林分类方法
CN106383088A (zh) 一种基于多光谱成像技术的种子纯度快速无损检测方法
CN107132311A (zh) 一种基于频域特征提取的快速气体识别算法
CN105928899A (zh) 一种卷烟烟支色斑污染的检测方法及系统
CN105181650A (zh) 一种使用近红外光谱技术快速鉴别茶叶品种的方法
CN106560695A (zh) 联合三种检测方法的武夷岩茶产地鉴别方法
Fu et al. Discrimination of geographical indication of Chinese green teas using an electronic nose combined with quantum neural networks: A portable strategy
CN103499646A (zh) 一种蜂蜜特征香气分析及蜂蜜香气体系模拟的方法
CN101566569B (zh) 一种通过特征参量鉴别多种荧光光谱混叠物质的系统和方法
Bottega et al. Precision agriculture applied to soybean: Part I-Delineation of management zones
CN108229011A (zh) 一种页岩岩相发育主控因素判断方法、设备及存储设备
CN103488868A (zh) 一种建立蜂蜜品质差异的智能嗅觉判别模型的研究方法
CN103310205A (zh) 一种手写体数字识别方法及装置
CN102930291A (zh) 用于图形图像的k近邻局部搜索遗传自动聚类方法
CN110414549B (zh) 一种模糊正交线性鉴别分析的茶叶近红外光谱分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170524

RJ01 Rejection of invention patent application after publication