CN112036482A - 一种基于电子鼻传感器数据的中药材分类方法 - Google Patents
一种基于电子鼻传感器数据的中药材分类方法 Download PDFInfo
- Publication number
- CN112036482A CN112036482A CN202010896134.1A CN202010896134A CN112036482A CN 112036482 A CN112036482 A CN 112036482A CN 202010896134 A CN202010896134 A CN 202010896134A CN 112036482 A CN112036482 A CN 112036482A
- Authority
- CN
- China
- Prior art keywords
- data
- sensor
- electronic nose
- stage
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 239000003814 drug Substances 0.000 title claims abstract description 26
- 239000000463 material Substances 0.000 claims abstract description 48
- 238000005070 sampling Methods 0.000 claims abstract description 36
- 230000002159 abnormal effect Effects 0.000 claims abstract description 29
- 238000012937 correction Methods 0.000 claims abstract description 18
- 238000012545 processing Methods 0.000 claims abstract description 8
- 238000004364 calculation method Methods 0.000 claims abstract description 7
- 230000004044 response Effects 0.000 claims description 25
- 238000002347 injection Methods 0.000 claims description 20
- 239000007924 injection Substances 0.000 claims description 20
- 230000008569 process Effects 0.000 claims description 13
- 238000004140 cleaning Methods 0.000 claims description 7
- 238000000342 Monte Carlo simulation Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 239000000284 extract Substances 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 4
- 238000012935 Averaging Methods 0.000 claims description 3
- 230000001174 ascending effect Effects 0.000 claims description 3
- 239000007789 gas Substances 0.000 description 10
- 241000125175 Angelica Species 0.000 description 9
- 235000001287 Guettarda speciosa Nutrition 0.000 description 9
- 238000001514 detection method Methods 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 241000304531 Allium macrostemon Species 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000007635 classification algorithm Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000011664 nicotinic acid Substances 0.000 description 2
- 230000008786 sensory perception of smell Effects 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 229940126680 traditional chinese medicines Drugs 0.000 description 2
- 206010035664 Pneumonia Diseases 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 241000411851 herbal medicine Species 0.000 description 1
- 235000008216 herbs Nutrition 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N27/00—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Chemical & Material Sciences (AREA)
- Electrochemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Health & Medical Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Investigating Or Analyzing Materials By The Use Of Electric Means (AREA)
Abstract
本发明基于电子鼻传感器数据的中药材分类方法,其包括步骤:1)用电子鼻采集中药材气味数据;2)对电子鼻传感器数据去噪,使所有样本的同一阶段的数据量相同,并得到不含异常值的数据集;3)提取电子鼻传感器数据特征,其包括特征计算、异常样本去除和特征校正;4)选择极限树作为分类器,对经特征校正处理后的数据进行分类。本发明解决了噪声对传感器数据后续处理及分类的影响,并且可以有效地去除异常样本,并对波动剧烈的特征数据有效地进行校正,解决了传感器漂移、采样差异等影响传感器数据分类准确性的技术问题,其采用的极限树作为分类器能很好的适应对中药材这种多类别小样本数据集进行分类。
Description
技术领域
本发明涉及中药材分类技术,特别涉及一种基于传感器数据的中药材分类方法。
背景技术
中药材是我国独特且具有战略意义的宝贵资源。它为中华民族的繁衍昌盛做出了巨大贡献。特别是在当今抗击新冠肺炎的过程中,中药发挥了巨大的作用,已成为疫情防控的一大亮点。
然而,长期以来中药材生产经营管理较为粗放,品质良莠不齐。这不但严重影响了中药材质量和临床疗效、损害了中医药的信誉,也阻碍了中药材产业健康发展。近年来,国家已出台了多项文件,对中药的鉴别提出了更高的要求,并鼓励第三方检验检测机构发展,力促中医药产业的健康有序升级。因此,如何提高中药材鉴别的性能迫在眉睫,意义重大。
中药材鉴别方法主要包括基原鉴别、性状鉴别、显微鉴别和理化鉴别四大类。在实际操作中,首选的方法是中药材性状鉴别。鉴别者根据中药材的形、色、味、质等外在指标进行鉴别。在所有的外观性状指标中,中药材的气味是一个十分重要的性状。这是因为中药的外观形态和色泽可以人为改变,或者随着中药存储的时间以及存储的环境的变化而发生很大的变化;但气味却不易更改,而且中药材气味与所含化学成分直接相关,能直接反应药物内在本质,是中药材外在质量表现与内在物质基础的关联点。
传统的中药材鉴别主要依赖专业的药剂师人工检测完成。这种鉴别方法不仅工作繁重,鉴别结果还受限于药剂师专业技术水平、经验、疲劳度等多种主观条件影响,出错率较高,可重复性差,繁琐耗时,在中药材鉴别领域难以推广。近年来,基于仿生嗅觉的电子鼻技术得到了长足的发展,有望解决上述难题。电子鼻又称人工嗅觉系统,是一种用来分析、识别和检测气味的具有人工智能特点的仿生检测仪器。与人类嗅觉以及普通气体检测仪相比,电子鼻的传感器能够实时地对各种气体进行响应,具有准确性、灵敏度高、可重复性好、响应时间短、检测速度快、检测范围广等特点。正因为电子鼻有这些优点,本发明将它应用到中药材鉴别领域,实现中药材自动分类。
要实现基于电子鼻传感器数据的中药材分类,需要解决以下关键问题:(1)噪声数据去除。电子鼻传感器在采集中药材气味数据时,由于软硬件系统会受各种因素影响,从而引入噪声数据。如何恰当地去除噪声数据是提升分类性能的一个关键问题。(2)特征提取。中药材品种众多、成分复杂,而传感器对每种成分的响应是不一样的,且存在漂移现象。另外,电子鼻在抽取进样瓶中中药材散发的气味时,有可能没有充分抽到顶空气体而导致提取的特征出现异常。因此,中药材分类算法需要提取气味数据中恰当的特征,做到既能保证较高的准确率,又能尽可能的降低算法复杂性。(3)小样本处理。中药材品种多种多样,但每一个品种的样本数量是很有限的,加上偶然因素会导致采集的样本不能够使用,最终能用于训练的样本是很少的。如何选择恰当的分类算法来处理这种小样本分类问题,是实现中药材自动分类的关键问题。
发明内容
有鉴于此,本发明的目的是提供一种基于电子鼻传感器数据的中药材分类方法,以解决基于电子鼻传感器数据进行中药材分类时,噪声干扰、特征提取准确性和样本量小影响分类准确性的技术问题。
本发明基于电子鼻传感器数据的中药材分类方法,包括以下步骤:
1)用电子鼻采集中药材气味数据,数据采集过程分P1、P2和P3三个阶段:
P1阶段为基线阶段,这一阶段向电子鼻中低速通入经过滤的空气一段时间;
P2阶段为进样阶段,这一阶段电子鼻抽取进样瓶中药材样本散发的气味,使进样瓶顶空气体流入传感器气室,获得传感器对样本气味的响应;
P3阶段为清洗阶段,这一阶段向电子鼻高速通入经过滤的空气,利用经过滤的空气清洗传感器气室,为下一次进样进行准备;
2)对电子鼻传感器数据去噪,使所有样本的同一阶段的数据量相同,并得到不含异常值的数据集,其包括步骤:
a)采用公式(1)计算阶段Pi(1≤i≤3)电子鼻的传感器Xm(1≤m≤M)应采样的采样点个数Ni:
Ni=ti×f (1)
其中M为电子鼻的传感器个数,f为采样频率,ti为阶段Pi的时长;
b)按时序从Pi结束之处开始,从原始数据集中由后往前取Ni个采样点作为阶段Pi的采样点,其余采样点舍弃;如果不足Ni个采样点,则采用复制最后一个采样点的方式补齐;
c)对所有中药材样本重复上述过程,使得它们在同一阶段的数据量相同;
d)使用均值滤波器对步骤0得到的数据进行滤波,输出去噪后的数据;
3)提取电子鼻传感器数据特征,其包括步骤:特征计算、异常样本去除和特征校正;
所述特征计算包括步骤:
a)计算电子鼻的每一个传感器的基线值:计算基线阶段每一个传感器数据的均值,得到的均值即为该传感器的基线值;
b)对于电子鼻的温度、压力和电压传感器,计算每一个传感器数据的如下特征:
特征1:进样阶段传感器数据的中值;
特征2:进样阶段传感器数据的均值;
c)对于电子鼻除温度、压力和电压传感器外的传感器,计算每一个传感器数据的如下三个特征:
特征3:选取每个传感器进样阶段的5个最大的值,求它们的中值,用该中值减去其基线值即得到特征3;
特征4:
I)计算进样阶段斜率向量K:K的每个分量k
其中(x1,y1)与(x2,y2)是两个采样点,y1和y2是传感器的响应,x1和x2是采样点序号且满足x2-x1=5,对进样阶段中所有的采样点都执行这样的操作,得到斜率向量K;
II)对K中的分量进行升序排序,选取倒数第2个斜率k′作为特征4;
特征5:计算进样阶段的每一个采样点的响应减基线值,然后采用蒙特卡洛方法求进样阶段的传感器响应曲线下面积,便得到特征5;
所述异常样本去除包括步骤:
b)统计K′中满足公式(5)的分量的个数n
其中T1为阈值;
c)如果n大于预先设定的阈值T2,则将样本j舍弃;
d)重复步骤a)~c),完成第i个类别的ci个样本的检测;
e)对所有的类别重复上述步骤,输出去除了异常样本的特征数据;
所述特征校正包括步骤:
b)统计S′中满足公式(5)的分量的个数n
c)如果n大于预先设定的阈值T,则传感器Xm的特征数据舍弃;否则,对传感器Xm的特征数据进行校正:求S′中所有不满足公式(5)的分量的平均值,结果赋值给S′中满足公式(5)的分量,得到S″,将S″乘以归一化因子便得到第i个类别校正后的特征数据;
d)对所有的类别重复上述步骤,输出校正后的特征数据;
4)选择极限树作为分类器,对经特征校正处理后的数据进行分类。
本发明的有益效果:
本发明基于电子鼻传感器数据的中药材分类方法,其数据去噪步骤使得所有样本的同一阶段的数据量相同,并通过均值滤波得到不含异常值的数据集,解决了噪声对传感器数据后续处理及分类的影响。本发明中公开的提取电子鼻传感器数据特征的步骤可以有效地去除异常样本,并对波动剧烈的特征数据有效地进行校正,解决了传感器飘逸、采样差异等影响传感器数据分类准确性的技术问题。并且其采用的极限树作为分类器能很好的适应对中药材这种多类别小样本数据集进行分类。
附图说明
图1是电子鼻采集中药材气味数据过程示意图。图中仅显示了一个传感器的数据,即单变量时间序列数据。t1:基线阶段时长;t2:进样阶段时长;t3:清洗阶段时长。
图2是某一个中药材样本对应的原始传感器数据曲线图。它是一个多变量时间序列数据集,每一条曲线则是一个单变量时间序列数据集,对应一个传感器的响应。
图3是基于电子鼻传感器数据的中药材分类流程图。
图4是中药材气味数据中的正常样本与异常样本的传感器响应曲线对比。
图5是特征校正结果的示例图。图5中(a)是特征校正前三种中药材的传感器响应曲线;图5中(b)是特征校正后三种中药材的传感器响应曲线。
具体实施方式
下面结合附图和实施例对本发明作进一步描述。
本实施例中基于电子鼻传感器数据的中药材分类方法,包括以下步骤:
1)用电子鼻采集中药材气味数据,电子鼻包括温度传感器、湿度传感器、压力传感器、电压传感器、气体传感器等多个传感器。因此,对每一个中药材样本进行气味采集,会得到一个多变量时间序列数据的集合。本实施例中电子鼻的每个传感器的采样频率f=1Hz,电子鼻采集中药材气味数据过程示意图如图1所示,数据采集过程分P1、P2和P3三个阶段:
P1阶段为基线阶段,这一阶段向电子鼻中低速通入经过滤的空气一段时间;
P2阶段为进样阶段,这一阶段电子鼻抽取进样瓶中药材样本散发的气味,使进样瓶顶空气体流入传感器气室,获得传感器对样本气味的响应;
P3阶段为清洗阶段,这一阶段向电子鼻高速通入经过滤的空气,利用经过滤的空气清洗传感器气室,为下一次进样进行准备。
本实施例使用电子鼻共采集了80种中药材气味数据,每一种中药材采集了3次,合计240个样本。为了让不同样本标签的特征数据都参与训练,采用人工划分的方式,把数据进行2:1的划分,每一种中药材对应2个样本训练,1个测试样本。
电子鼻传感器数据由于各种因素会引入各种噪声。例如,由于软硬件交互延迟、系统干扰等原因,会导致采集到的原始数据集中,不同中药材样本的同一阶段的数据量不尽相同,并且含有各种异常值,这些都可看做噪声,为了消除噪声对数据处理的影响,因此下一步需要对传感器数据去噪。
2)对电子鼻传感器数据去噪,使所有样本的同一阶段的数据量相同,并得到不含异常值的数据集,其包括步骤:
a)采用公式(1)计算阶段Pi(1≤i≤3)电子鼻的传感器Xm(1≤m≤M)应采样的采样点个数Ni:
Ni=ti×f (6)
其中M为电子鼻的传感器个数,f为采样频率,ti为阶段Pi的时长;
b)按时序从Pi结束之处开始,从原始数据集中由后往前取Ni个采样点作为阶段Pi的采样点,其余采样点舍弃;如果不足Ni个采样点,则采用复制最后一个采样点的方式补齐;
c)对所有中药材样本重复上述过程,使得它们在同一阶段的数据量相同;
d)使用均值滤波器对步骤0得到的数据进行滤波,输出去噪后的数据。
3)为了实现中药材分类,需要从去噪后的数据集中提取出可以表征中药材的特征。提取电子鼻中每一个传感器数据的特征包括步骤:特征计算、异常样本去除和特征校正;
所述特征计算包括步骤:
a)计算电子鼻的每一个传感器的基线值:计算基线阶段每一个传感器数据的均值,得到的均值即为该传感器的基线值;
b)对于电子鼻的温度、压力和电压传感器,计算每一个传感器数据的如下特征:
特征1:进样阶段传感器数据的中值;
特征2:进样阶段传感器数据的均值;
c)对于电子鼻除温度、压力和电压传感器外的传感器,计算每一个传感器数据的如下三个特征:
特征3:选取每个传感器进样阶段的5个最大的值,求它们的中值,用该中值减去其基线值即得到特征3;
特征4:
I)计算进样阶段斜率向量K:K的每个分量k
其中(x1,y1)与(x2,y2)是两个采样点,y1和y2是传感器的响应,x1和x2是采样点序号且满足x2-x1=5,对进样阶段中所有的采样点都执行这样的操作,得到斜率向量K;
II)对K中的分量进行升序排序,选取倒数第2个斜率k′作为特征4;
特征5:计算进样阶段的每一个采样点的响应减基线值,然后采用蒙特卡洛方法求进样阶段的传感器响应曲线下面积,便得到特征5。
本实施例中传感器个数M=24,其中气体传感器共16个,上述特征计算步骤会计算这16个传感器的特征3、特征4和特征5,按列排序得到48个特征列;温度传感器2个、湿度传感器2个,压力传感器2个、电压传感器2个,上述特征计算步骤会计算这8个传感器的特征1和特征2,得到16个特征列。因此,本实施例中一共有64个特征列。
采样过程中,如果进样瓶中样本的顶空气体没有被充分抽到到电子鼻的传感器气室中,有可能导致提取的特征出现异常,进而导致该样本无法使用。由于传感器对过滤的空气的响应远不及对中药材气味的响应大,基于这一特征本实施例中提出了基于斜率特征的异常样本去除算法。
所述异常样本去除包括步骤:
b)统计K′中满足公式(5)的分量的个数n
其中T1为阈值,本实施例中T1=0.05;
c)如果n大于预先设定的阈值T2,本实施例中T2=6,则将样本j舍弃;
d)重复步骤a)~c),完成第i个类别的ci个样本的检测;
e)对所有的类别重复上述步骤,输出去除了异常样本的特征数据。
图4显示了采用本实施例中基于斜率特征的异常样本去除算法进行异常样本去除的一个示例结果,它对比了中药材(薤白)气味数据中的正常样本与异常样本的传感器响应曲线。其中薤白2的一个传感器响应曲线几乎没有变化,被检测为异常样本而去除。薤白1和薤白3对应的曲线为正常样本的曲线,这两个样本被保留。
传感器采样过程中会存在数据漂移现象,这可能会导致上述构造的特征有很大的波动。为了降低传感器漂移的影响,需要对特征计算得到的特征数据进行校正。通常,电子鼻中药材气味数据包含的种类较多,而每种一中药材的样本数量却很少,常规的异常值检测方法(如3σ准则)难判断样本是否异常。针对这种多类别小样本数据集,本实施例中提出了一种基于传感器响应曲线下面积的特征校正方法,该方法通过计算每一个传感器进样阶段的面积来判断样本是否需要进行特征校正。
所述特征校正包括步骤:
a)对第i个类别(1≤i≤C)的ci个样本,采用蒙特卡洛方法分别计算同一个传感器Xm(1≤m≤M)在进样阶段的曲线下面积Sm j,Sm j即特征5,这ci个面积构成向量对向量S归一化,得到归一化的向量S′:
b)统计S′中满足公式(5)的分量的个数n
c)如果n大于预先设定的阈值T,本实施例中T=6,则传感器Xm的特征数据舍弃;否则,对传感器Xm的特征数据进行校正:求S′中所有不满足公式(5)的分量的平均值,结果赋值给S′中满足公式(5)的分量,得到S″,将S″乘以归一化因子便得到第i个类别校正后的特征数据;
d)对所有的类别重复上述步骤,输出校正后的特征数据。
图5显示了采用本实施例中提出的基于传感器响应曲线下面积的特征校正方法进行特征校正的一个示例结果,它对比了中药材气味数据中的三种中药材校正前(图5(a))和校正后(图5(b))的传感器响应曲线。从图5(a)可以看出,当归3的特征数据和当归1、当归2的特征数据有一定的差别。当归3的曲线的各个峰值明显大于当归1和当归2。图5(b)是校正后的特征数据。校正后当归3的曲线和当归1、当归2的曲线的峰值的差距缩小了,波动也较之前更为平缓。
从图4和图5可以直观地看出,本实施例中的中药材分类方法的电子鼻传感器数据特征提取步骤,该步骤可以有效地去除异常样本,并对波动剧烈的特征数据有效地进行校正。
4)选择极限树(ExtraTrees)作为分类器,对经特征校正处理后的数据进行分类。极限树具有训练过程快,简单,易操作,是一种快速简易方法。
本实施例选择极限树作为分类器,在特征提取得到的特征数据的训练集上进行训练,然后对测试集进行分类,同时与其他分类器进行了对比,结果参见表1,其中带下划线的粗体数据表示性能最好的数据。
表1各种分类器在测试集上的分类结果
算法 | RandomForest | ExtraTrees | SVM | XGBoost |
准确率 | 0.899 | <u>0.937</u> | 0.544 | 0.734 |
kappa系数 | 0.897 | <u>0.936</u> | 0.539 | 0.731 |
时间 | 1.222 | 0.556 | <u>0.023</u> | 5.043 |
从表1可以看出极限树的分类准确率最高,达到了0.937,同时kappa系数达到了0.936。极限树在时间上虽然没有SVM的时间快。但是SVM的准确率和kappa系数在所有分类器当中是最低的,并不实用。表1的实验结果表明对于中药材分类这种多类别小样本数据集分类问题,选择极限树做为分类器是一个较佳的方案。
最后说明的是,以上实施例仅用以说明本发明的技术方案,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (1)
1.一种基于电子鼻传感器数据的中药材分类方法,其特征在于,包括以下步骤:
1)用电子鼻采集中药材气味数据,数据采集过程分P1、P2和P3三个阶段:
P1阶段为基线阶段,这一阶段向电子鼻中低速通入经过滤的空气一段时间;
P2阶段为进样阶段,这一阶段电子鼻抽取进样瓶中药材样本散发的气味,使进样瓶顶空气体流入传感器气室,获得传感器对样本气味的响应;
P3阶段为清洗阶段,这一阶段向电子鼻高速通入经过滤的空气,利用经过滤的空气清洗传感器气室,为下一次进样进行准备;
2)对电子鼻传感器数据去噪,使所有样本的同一阶段的数据量相同,并得到不含异常值的数据集,其包括步骤:
a)采用公式(1)计算阶段Pi(1≤i≤3)电子鼻的传感器Xm(1≤m≤M)应采样的采样点个数Ni:
Ni=ti×f (1)
其中M为电子鼻的传感器个数,f为采样频率,ti为阶段Pi的时长;
b)按时序从Pi结束之处开始,从原始数据集中由后往前取Ni个采样点作为阶段Pi的采样点,其余采样点舍弃;如果不足Ni个采样点,则采用复制最后一个采样点的方式补齐;
c)对所有中药材样本重复上述过程,使得它们在同一阶段的数据量相同;
d)使用均值滤波器对步骤0得到的数据进行滤波,输出去噪后的数据;
3)提取电子鼻传感器数据特征,其包括步骤:特征计算、异常样本去除和特征校正;
所述特征计算包括步骤:
a)计算电子鼻的每一个传感器的基线值:计算基线阶段每一个传感器数据的均值,得到的均值即为该传感器的基线值;
b)对于电子鼻的温度、压力和电压传感器,计算每一个传感器数据的如下特征:
特征1:进样阶段传感器数据的中值;
特征2:进样阶段传感器数据的均值;
c)对于电子鼻除温度、压力和电压传感器外的传感器,计算每一个传感器数据的如下三个特征:
特征3:选取每个传感器进样阶段的5个最大的值,求它们的中值,用该中值减去其基线值即得到特征3;
特征4:
I)计算进样阶段斜率向量K:K的每个分量k
其中(x1,y1)与(x2,y2)是两个采样点,y1和y2是传感器的响应,x1和x2是采样点序号且满足x2-x1=5,对进样阶段中所有的采样点都执行这样的操作,得到斜率向量K;
II)对K中的分量进行升序排序,选取倒数第2个斜率k′作为特征4;
特征5:计算进样阶段的每一个采样点的响应减基线值,然后采用蒙特卡洛方法求进样阶段的传感器响应曲线下面积,便得到特征5;
所述异常样本去除包括步骤:
b)统计K′中满足公式(5)的分量的个数n
其中T1为阈值;
c)如果n大于预先设定的阈值T2,则将样本j舍弃;
d)重复步骤a)~c),完成第i个类别的ci个样本的检测;
e)对所有的类别重复上述步骤,输出去除了异常样本的特征数据;
所述特征校正包括步骤:
b)统计S′中满足公式(5)的分量的个数n
c)如果n大于预先设定的阈值T,则传感器Xm的特征数据舍弃;否则,对传感器Xm的特征数据进行校正:求S′中所有不满足公式(5)的分量的平均值,结果赋值给S′中满足公式(5)的分量,得到S″,将S″乘以归一化因子便得到第i个类别校正后的特征数据;
d)对所有的类别重复上述步骤,输出校正后的特征数据;
4)选择极限树作为分类器,对经特征校正处理后的数据进行分类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010896134.1A CN112036482B (zh) | 2020-08-31 | 2020-08-31 | 一种基于电子鼻传感器数据的中药材分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010896134.1A CN112036482B (zh) | 2020-08-31 | 2020-08-31 | 一种基于电子鼻传感器数据的中药材分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112036482A true CN112036482A (zh) | 2020-12-04 |
CN112036482B CN112036482B (zh) | 2023-10-24 |
Family
ID=73587449
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010896134.1A Active CN112036482B (zh) | 2020-08-31 | 2020-08-31 | 一种基于电子鼻传感器数据的中药材分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112036482B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113433270A (zh) * | 2021-06-29 | 2021-09-24 | 北京中医药大学 | 一种电子鼻结合LightGBM的姜黄属中药快速鉴定方法 |
CN117110215A (zh) * | 2023-10-18 | 2023-11-24 | 肇庆市大正铝业有限公司 | 一种铝合金原料的智能识别方法及系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103499665A (zh) * | 2013-07-30 | 2014-01-08 | 中国标准化研究院 | 一种基于遗传算法优化西湖龙井茶树种检测方法 |
CN105628741A (zh) * | 2016-01-04 | 2016-06-01 | 中国农业大学 | 一种基于电子鼻的数据空间转换的猪肉风味自动分类方法 |
CN105973858A (zh) * | 2016-06-13 | 2016-09-28 | 宜春学院 | 一种中药品质自动检测系统 |
CN106295575A (zh) * | 2016-08-10 | 2017-01-04 | 天津大学 | 一种基于响应曲线微分特性的电子鼻采样数据预校验方法 |
CN106568907A (zh) * | 2016-11-07 | 2017-04-19 | 常熟理工学院 | 一种基于半监督鉴别投影的大闸蟹新鲜度无损检测方法 |
CN107132311A (zh) * | 2017-03-30 | 2017-09-05 | 深圳大学 | 一种基于频域特征提取的快速气体识别算法 |
CN108226053A (zh) * | 2017-12-22 | 2018-06-29 | 南京中医药大学 | 基于多元智能融合的非结构化特征区分方法 |
CN110794090A (zh) * | 2019-10-22 | 2020-02-14 | 天津大学 | 情感电子鼻实现方法 |
US20200093327A1 (en) * | 2017-01-23 | 2020-03-26 | Shanghai Changshan Intelligent Technology Corporation Limited | Automatic cooking apparatus and method of using it for cooking |
-
2020
- 2020-08-31 CN CN202010896134.1A patent/CN112036482B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103499665A (zh) * | 2013-07-30 | 2014-01-08 | 中国标准化研究院 | 一种基于遗传算法优化西湖龙井茶树种检测方法 |
CN105628741A (zh) * | 2016-01-04 | 2016-06-01 | 中国农业大学 | 一种基于电子鼻的数据空间转换的猪肉风味自动分类方法 |
CN105973858A (zh) * | 2016-06-13 | 2016-09-28 | 宜春学院 | 一种中药品质自动检测系统 |
CN106295575A (zh) * | 2016-08-10 | 2017-01-04 | 天津大学 | 一种基于响应曲线微分特性的电子鼻采样数据预校验方法 |
CN106568907A (zh) * | 2016-11-07 | 2017-04-19 | 常熟理工学院 | 一种基于半监督鉴别投影的大闸蟹新鲜度无损检测方法 |
US20200093327A1 (en) * | 2017-01-23 | 2020-03-26 | Shanghai Changshan Intelligent Technology Corporation Limited | Automatic cooking apparatus and method of using it for cooking |
CN107132311A (zh) * | 2017-03-30 | 2017-09-05 | 深圳大学 | 一种基于频域特征提取的快速气体识别算法 |
CN108226053A (zh) * | 2017-12-22 | 2018-06-29 | 南京中医药大学 | 基于多元智能融合的非结构化特征区分方法 |
CN110794090A (zh) * | 2019-10-22 | 2020-02-14 | 天津大学 | 情感电子鼻实现方法 |
Non-Patent Citations (4)
Title |
---|
HUAYING ZHOU 等: "Identification of Chinese Herbal Medicines with Electronic Nose Technology: Applications and Challenges", 《MATERIALS AND APPLICATIONS FOR SENSORS AND TRANSDUCERS》, vol. 17, no. 5, pages 1 - 5 * |
党晓芳 等: "中药西河柳电子鼻气味识别中的最佳特征提取法", 《万方》, pages 479 - 483 * |
田逢春 等: "带参考向量的ICA电子鼻背景干扰消除算法", 《计算机工程》, vol. 38, no. 21, pages 26 - 29 * |
邹慧琴 等: "基于RBF-RF级联分类器电子鼻对中药的快速鉴别", 《世界科学技术-中医药现代化》, vol. 15, no. 9, pages 1876 - 1881 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113433270A (zh) * | 2021-06-29 | 2021-09-24 | 北京中医药大学 | 一种电子鼻结合LightGBM的姜黄属中药快速鉴定方法 |
CN117110215A (zh) * | 2023-10-18 | 2023-11-24 | 肇庆市大正铝业有限公司 | 一种铝合金原料的智能识别方法及系统 |
CN117110215B (zh) * | 2023-10-18 | 2024-04-02 | 肇庆市大正铝业有限公司 | 一种铝合金原料的智能识别方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112036482B (zh) | 2023-10-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112036482B (zh) | 一种基于电子鼻传感器数据的中药材分类方法 | |
CN110811609A (zh) | 基于自适应模板匹配与机器学习算法融合的癫痫棘波智能检测方法 | |
CN112435714A (zh) | 一种肿瘤免疫亚型分类方法及系统 | |
CN106503254A (zh) | 语料分类方法、装置及终端 | |
Dahigaonkar et al. | Identification of ayurvedic medicinal plants by image processing of leaf samples | |
CN103048273A (zh) | 基于模糊聚类的水果近红外光谱分类方法 | |
Setiawan et al. | Classification of cell types in Acute Myeloid Leukemia (AML) of M4, M5 and M7 subtypes with support vector machine classifier | |
Pandit et al. | Survey on automatic rbc detection and counting | |
CN115982557B (zh) | 一种气体浓度检测用数据处理系统 | |
CN108415901A (zh) | 一种基于词向量和上下文信息的短文本主题模型 | |
CN110189799B (zh) | 基于变量重要性评分和奈曼皮尔逊检验的宏基因组特征选择方法 | |
CN115294377A (zh) | 一种道路裂缝的识别系统及方法 | |
CN110542659B (zh) | 基于可见光光谱的珍珠光泽检测方法 | |
CN116432088B (zh) | 一种复合光学薄膜层厚智能监测方法及系统 | |
CN114707608A (zh) | 医疗质控数据处理方法、装置、设备、介质及程序产品 | |
Anushya | Herbal leaves image clustering via K-Means | |
CN114595365A (zh) | 一种构建卷烟特征关联性的方法、装置、电子设备及介质 | |
CN114199989A (zh) | 一种基于质谱数据融合的广陈皮识别方法及系统 | |
CN110689076A (zh) | 一种基于近红外光谱数据特征提取的农药残留检测方法 | |
CN117711593B (zh) | 一种智慧药房进出药管理系统 | |
CN113139405A (zh) | 一种基于多峰拟合解析的细胞分类结果校正方法 | |
CN110619366A (zh) | 一种基于神经网络的真菌maldi—tof质谱数据识别方法 | |
Güney et al. | Discrimination of different fish species by E-nose | |
CN116504314B (zh) | 基于细胞动态分化的基因调控网络构建方法 | |
Safuan et al. | Lymphoblast cell morphology identification to detect Acute Lymphoblastic Leukemia (ALL) using various color segmentation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |