CN110057975B - 一种嗅感描述符获取方法、系统及相关装置 - Google Patents

一种嗅感描述符获取方法、系统及相关装置 Download PDF

Info

Publication number
CN110057975B
CN110057975B CN201910324005.2A CN201910324005A CN110057975B CN 110057975 B CN110057975 B CN 110057975B CN 201910324005 A CN201910324005 A CN 201910324005A CN 110057975 B CN110057975 B CN 110057975B
Authority
CN
China
Prior art keywords
descriptor
sniffing
sniff
characteristic data
random forest
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910324005.2A
Other languages
English (en)
Other versions
CN110057975A (zh
Inventor
骆德汉
靳樱子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Dexin Semiconductor Technology Co ltd
Original Assignee
Guangzhou Dexin Semiconductor Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Dexin Semiconductor Technology Co ltd filed Critical Guangzhou Dexin Semiconductor Technology Co ltd
Priority to CN201910324005.2A priority Critical patent/CN110057975B/zh
Publication of CN110057975A publication Critical patent/CN110057975A/zh
Application granted granted Critical
Publication of CN110057975B publication Critical patent/CN110057975B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/0001Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00 by organoleptic means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers

Landscapes

  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Food Science & Technology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请所提供的一种嗅感描述符获取方法,包括:获取目标对象的气体分子的物化特性数据;将物化特性数据输入预设随机森林模型,输出对应的嗅感描述符;其中,预设随机森林模型是模型训练而得到的。该方法利用预设随机森林模型获取目标对象对应的嗅感描述符,相比于相关技术中通过人工嗅辩获取嗅感描述符,避免了测试环境、实验偏差、受试者敏感度和训练程度等多因素的影响,故能够提高获取的嗅感描述符的准确度。此外,该方法在需要获取大量目标对象的嗅感描述符时,可以节省大量时间和资源。本申请还提供一种嗅感描述符获取系统、设备及计算机可读存储介质,均具有上述有益效果。

Description

一种嗅感描述符获取方法、系统及相关装置
技术领域
本申请涉及嗅感描述符获取领域,特别涉及一种嗅感描述符获取方法、系统、设备及计算机可读存储介质。
背景技术
多年来,气味科学家和香水行业都试图建立关于气味性质的特征描述、测量和预测的综合性标准,嗅觉感知被作为一种手段引入研究中,嗅觉感知通常以语义描述符的形式实现,例如:嗅辩专家凭借其嗅觉感知,用一些描述性的词语对气味进行评价,例如“花香”,“果香”等。这种评价在化学领域已经是一种用于气体分析的重要手段,如GC/O(色相谱-闻香)方法;在香水以及香精香料领域,更是将此作为气味分类的标准,如芳香轮,红酒轮。但嗅感描述符的获取在现阶段主要通过人工嗅辩实现。人工方法下的嗅感描述符在个体与个体间存在差异,实施人工嗅辩也会受到如测试环境、实验偏差、受试者敏感度和训练程度等多因素的影响,导致获取的嗅感描述符准确度不高。此外,如果需要获取大量化学物质的嗅感描述符,需要耗费大量时间和资源。
因此,如何能够提高获取的嗅感描述符的准确度是本领域技术人员亟需解决的技术问题。
发明内容
本申请的目的是提供一种嗅感描述符获取方法、系统、设备及计算机可读存储介质,能够提高获取的嗅感描述符的准确度。
为解决上述技术问题,本申请提供一种嗅感描述符获取方法,包括:
获取目标对象的气体分子的物化特性数据;
将所述物化特性数据输入预设随机森林模型,输出对应的嗅感描述符;其中,所述预设随机森林模型是模型训练而得到的。
优选地,所述将所述物化特性数据输入预设随机森林模型,输出对应的嗅感描述符,包括:
在利用化学分析软件获取原始样本物化特性数据后,对所述原始样本物化特性数据进行标准化处理,得到样本物化特性数据;
利用所述样本物化特性数据和预设随机森林算法进行所述模型训练,得到所述预设随机森林模型;
将所述物化特性数据输入所述预设随机森林模型,输出对应的嗅感描述符。
优选地,所述将所述物化特性数据输入所述预设随机森林模型,输出对应的嗅感描述符,包括:
将所述物化特性数据输入所述预设随机森林模型,分别得到所述预设随机森林模型中各个分类回归树对应的嗅感评分预测值;
在利用各个所述嗅感评分预测值计算出嗅感评分预测平均值后,依据所述嗅感评分预测平均值确定对应的嗅感描述符。
优选地,依据所述嗅感评分预测平均值确定对应的嗅感描述符之后,还包括:
利用预设数量的所述嗅感描述符对应的物化特性数据,对未标记气体分子的未标记物化特性数据进行特征相关性分析,得到所述未标记气体分子对应的未标记嗅感评分预测平均值;
根据所述未标记嗅感评分预测平均值,确定对应的未标记嗅感描述符。
本申请还提供一种嗅感描述符获取系统,包括:
物化特性数据获取模块,用于获取目标对象的气体分子的物化特性数据;
嗅感描述符输出模块,用于将所述物化特性数据输入预设随机森林模型,输出对应的嗅感描述符;其中,所述预设随机森林模型是模型训练而得到的。
优选地,所述嗅感描述符输出模块,包括:
标准化处理单元,用于在利用化学分析软件获取原始样本物化特性数据后,对所述原始样本物化特性数据进行标准化处理,得到样本物化特性数据;
模型训练单元,用于利用所述样本物化特性数据和预设随机森林算法进行所述模型训练,得到所述预设随机森林模型;
嗅感描述符输出单元,用于将所述物化特性数据输入所述预设随机森林模型,输出对应的嗅感描述符。
优选地,所述嗅感描述符输出单元,包括:
嗅感评分预测值获取子单元,用于将所述物化特性数据输入所述预设随机森林模型,分别得到所述预设随机森林模型中各个分类回归树对应的嗅感评分预测值;
嗅感描述符确定子单元,用于在利用各个所述嗅感评分预测值计算出嗅感评分预测平均值后,依据所述嗅感评分预测平均值确定对应的嗅感描述符。
优选地,该嗅感描述符获取系统还包括:
特征相关性分析模块,用于利用预设数量的所述嗅感描述符对应的物化特性数据,对未标记气体分子的未标记物化特性数据进行特征相关性分析,得到所述未标记气体分子对应的未标记嗅感评分预测平均值;
未标记嗅感描述符确定模块,用于根据所述未标记嗅感评分预测平均值,确定对应的未标记嗅感描述符。
本申请还提供一种设备,包括:
存储器和处理器;其中,所述存储器用于存储计算机程序,所述处理器用于执行所述计算机程序时实现上述所述的嗅感描述符获取方法的步骤。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述所述的嗅感描述符获取方法的步骤。
本申请所提供的一种嗅感描述符获取方法,包括:获取目标对象的气体分子的物化特性数据;将所述物化特性数据输入预设随机森林模型,输出对应的嗅感描述符;其中,所述预设随机森林模型是模型训练而得到的。
该方法利用预设随机森林模型获取目标对象对应的嗅感描述符,相比于相关技术中通过人工嗅辩获取嗅感描述符,避免了测试环境、实验偏差、受试者敏感度和训练程度等多因素的影响,故能够提高获取的嗅感描述符的准确度。此外,该方法在需要获取大量目标对象的嗅感描述符时,可以节省大量时间和资源。本申请还提供一种嗅感描述符获取系统、设备及计算机可读存储介质,均具有上述有益效果,在此不再赘述。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例所提供的一种嗅感描述符获取方法的流程图;
图2为本申请实施例所提供的一种嗅感描述符获取系统的结构框图。
具体实施方式
本申请的核心是提供一种嗅感描述符获取方法,能够提高获取的嗅感描述符的准确度。本申请的另一核心是提供一种嗅感描述符获取系统、设备及计算机可读存储介质。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
多年来,气味科学家和香水行业都试图建立关于气味性质的特征描述、测量和预测的综合性标准,嗅觉感知被作为一种手段引入研究中,嗅觉感知通常以语义描述符的形式实现,但嗅感描述符的获取在现阶段主要通过人工嗅辩实现。人工方法下的嗅感描述符在个体与个体间存在差异,实施人工嗅辩也会受到如测试环境、实验偏差、受试者敏感度和训练程度等多因素的影响,导致获取的嗅感描述符准确度不高。本申请提供的一种嗅感描述符获取方法,能够提高获取的嗅感描述符的准确度。具体请参考图1,图1为本申请实施例所提供的一种嗅感描述符获取方法的流程图,该嗅感描述符获取方法具体包括:
S101、获取目标对象的气体分子的物化特性数据;
本申请先是获取目标对象的气体分子的物化特性数据,在此对目标对象不作具体限定,应由本领域技术人员根据实际情况作出相应的设定,该目标对象具体可以为化学物质、香料及香精等。生理上的嗅觉系统机制表明嗅觉体验是嗅觉系统对化学分子进行特异性编码加工的结果,这也证明气体的分子特性决定了它的气味。通过气味的分子特性去预测其嗅觉感知,是解决气味特性与感官评价关系的一项重要内容。主要存在两方面待解决的问题:一是如何得到标准化的嗅感描述符词库,能够有效表征嗅觉感知。二是如何建立气体分子的物化特性与嗅感描述之间的关系。
物质气味通常是由混合气体组成,即自然界气味是混合气体组成,而单一成分的单一气味一般为人工萃取的纯净香料释放的。上述气体分子的物化特性数据,即为表征目标对象的气体分子的特征信息。在此对物化特性数据的获取方式不作具体限定,需根据实际情况而定。例如,若目标对象是水果和鲜花,可以利用以下两种途径获取其物化特性数据:一是通过查询公开的资料,二是通过GC-MS检测来获取;若目标对象是香料纯净物,则直接从其产品的标签即可获取其成分信息。近年来,生理学上的最新研究表明,物质气味跟分子的轮廓等化学特征存在关系,故本申请使用的数据集,是采用专业的化学分析软件,获取的这些物化特性数据。
S102、将物化特性数据输入预设随机森林模型,输出对应的嗅感描述符;其中,预设随机森林模型是模型训练而得到的。
本申请在获取目标对象的气体分子的物化特性数据后,将物化特性数据输入预设随机森林模型,输出对应的嗅感描述符。在此对预设随机森林模型的获取方式不作具体限定,应由本领域技术人员根据实际情况作出相应的设定。
进一步地,上述将物化特性数据输入预设随机森林模型,输出对应的嗅感描述符,通常包括:在利用化学分析软件获取原始样本物化特性数据后,对原始样本物化特性数据进行标准化处理,得到样本物化特性数据;利用样本物化特性数据和预设随机森林算法进行模型训练,得到预设随机森林模型;将物化特性数据输入预设随机森林模型,输出对应的嗅感描述符。具体地,利用化学分析软件获取4776维的原始样本物化特性数据,搜集到的气体分子的原始样本物化特性数据具有小样本,高维度,强噪声,非线性的特点。由于原始样本物化特性数据的某些特征维度在指标上缺失较多,本申请去除了85%以上含有缺失值的特征,将少量缺失的部分进行了中值插补。另外,考虑到不同属性值之间可能由于单位不同,有可能不利于进行比较分析,因此采用了min-max标准化处理。经过数据清洗后留下了1803维特征,也即样本物化特性数据,通过Boruta算法实现特征选择,过程如下:
1、通过对原始数据集所有属性进行shuffle得到新的特征(也称为阴影属性)与原始特征拼接成扩展数据集;
2、在扩展数据集上运行随机森林回归,获得评价特征重要性的Z分值;
3、将阴影属性分值低于最大Z分值(Zmax)的属性标记为+1,记为hits;
4、使用Zmax对阴影属性中重要性无法确定的属性进行双侧显著性检验,标记阴影属性分值小于Zmax的特征为0;
5、根据伯努利公式计算hits属性的概率,将概率值低于0.01的属性标记为重要,并将其移出扩展数据集;
6、重复上述步骤,直到所有属性均被视为“重要”,或者算法达到随机森林运行前设置的极限值。
输出为每个样本对应的嗅感评分,一共有19个嗅感标签,也是描述嗅感的19个词语,评分范围为0—100,由实验人员给出分数,分数越大表示该气味闻起来与标签越接近。随机森林算法用于回归预测时,对于变量选择和模型缩减来说是非常有用的,例如,可以使用重要的变量建立一个简单的更加容易解释的并且能够获得相同预测正确率的模型。作为一个具有相当高预测正确率的顶级分类器,能够在没有额外的参数调节和正式的变量选择的情况下(因为能够无视不相关的变量)表现出优秀的性能,并能够避免过学习问题。此外,还能处理拥有大量变量的案例而不需要正式的变量缩减程序,对异常值不敏感,不要求数据符合正态或其他分布,能够处理不平衡数据。因此,随机森林被广泛应用于化学信息处理领域,应用随机森林模型,输入为样本的物化特性数据,输出为嗅感评分,与真实的嗅感评分进行相关性对比,采用K折交叉训练,实现最优参数的选择。
进一步地,上述将物化特性数据输入预设随机森林模型,输出对应的嗅感描述符,通常包括:将物化特性数据输入预设随机森林模型,分别得到预设随机森林模型中各个分类回归树对应的嗅感评分预测值;在利用各个嗅感评分预测值计算出嗅感评分预测平均值后,依据嗅感评分预测平均值确定对应的嗅感描述符。具体地,由于随机森林模型是由A棵分类回归树{T1(x),T2(2),…,TA(x)}组成的集成学习器,其中x∈{x1,x2,…,xm}是一个包含m维特征的目标向量,在本申请实施例中就是代表气体分子物化特性的一个样本。随机森林模型将生成A个输出{y1=T1(x),y2=T2(x),…,A=TA(x)},其中,yb∈{1,2,…,A},即为第b棵树给出的嗅感评分预测值,而随机森林模型得到的嗅感评分预测平均值为各棵分类回归树对应的嗅感评分预测值的简单平均。算法过程具体如下:
1、用Bagging方法形成子训练集;
2、对于每个子训练集,用如下过程形成一颗不剪枝的分类回归树:
(1)、设共有m个原始特征,给定一个正整数mtry,使其满足mtry<<m,在每个内部节点,从m个属性中随机抽取mtry个属性作为该分裂节点的候选属性。在生成整个森林的过程中,mtry不变;
(2)、从mtry个属性中选出最好的分裂方式对该节点进行分裂;
(3)、每棵树令其充分成长,不进行剪枝。
3、重复第一步,第二步,直到生成n棵分类回归树(n要足够大);
4、对样本进行回归预测时,得到的预测结果(即嗅感评分预测平均值)是森林中的每棵树输出的嗅感评分预测值的平均,也就是:
其中,y为嗅感评分预测平均值,yi是任意一棵分类回归树对应的嗅感评分预测值。
当mtry=m时,即最佳分裂点从全部特征中选取,随机森林就和Bagging一样了。但随机森林在其基础上引入随机选择属性,更大程度上降低了树之间的相关性,同时建立的单棵不剪技的分类回归树能够得到较低的偏差,从而保证了随机森林的分类性能。
进一步地,依据嗅感评分预测平均值确定对应的嗅感描述符之后,通常还可以包括:利用预设数量的嗅感描述符对应的物化特性数据,对未标记气体分子的未标记物化特性数据进行特征相关性分析,得到未标记气体分子对应的未标记嗅感评分预测平均值;根据未标记嗅感评分预测平均值,确定对应的未标记嗅感描述符。具体地,利用自然语言处理中的分布式语义方面的知识,利用GloVe模型训练得到嗅感词语的300维向量,也称为词向量。将组成的向量空间成为词向量空间。将每个样本作为一行,对应的19个嗅感评分作为列特征,组成评分空间。通过对空间内的特征进行相关性分析,可以发现,基于词向量空间的相关性矩阵和评分空间的相似性矩阵具有类似的结构。本申请实施例先是利用Lasso回归拟合词向量间的关系,得到18个已知评分的嗅感和1个未知评分的嗅感间的映射关系,再采用坐标轴下降法求解。Lasso回归使得一些系数变小,甚至还是一些绝对值较小的系数直接变为0,因此特别适用于参数数目缩减与参数的选择,因而用来估计稀疏参数。它可以为每个嗅感筛选与其相关的词向量来拟合,本实施例在词向量空间得到映射,假设该映射同样存在于嗅感评分空间,即可通过已知的嗅感评分来得到未经标记的嗅感评分,最后确定对应的未标记嗅感描述符。
本申请利用预设随机森林模型获取目标对象对应的嗅感描述符,相比于相关技术中通过人工嗅辩获取嗅感描述符,避免了测试环境、实验偏差、受试者敏感度和训练程度等多因素的影响,故能够提高获取的嗅感描述符的准确度。此外,该方法在需要获取大量目标对象的嗅感描述符时,可以节省大量时间和资源。
下面对本申请实施例提供的一种嗅感描述符获取系统、设备及计算机可读存储介质进行介绍,下文描述的嗅感描述符获取系统、设备及计算机可读存储介质与上文描述的嗅感描述符获取方法可相互对应参照。
请参考图2,图2为本申请实施例所提供的一种嗅感描述符获取系统的结构框图;该嗅感描述符获取系统包括:
物化特性数据获取模块201,用于获取目标对象的气体分子的物化特性数据;
嗅感描述符输出模块202,用于将物化特性数据输入预设随机森林模型,输出对应的嗅感描述符;其中,预设随机森林模型是模型训练而得到的。
基于上述实施例,本实施例中嗅感描述符输出模块202,通常包括:
标准化处理单元,用于在利用化学分析软件获取原始样本物化特性数据后,对原始样本物化特性数据进行标准化处理,得到样本物化特性数据;
模型训练单元,用于利用样本物化特性数据和预设随机森林算法进行模型训练,得到预设随机森林模型;
嗅感描述符输出单元,用于将物化特性数据输入预设随机森林模型,输出对应的嗅感描述符。
基于上述实施例,本实施例中嗅感描述符输出单元,通常包括:
嗅感评分预测值获取子单元,用于将物化特性数据输入预设随机森林模型,分别得到预设随机森林模型中各个分类回归树对应的嗅感评分预测值;
嗅感描述符确定子单元,用于在利用各个嗅感评分预测值计算出嗅感评分预测平均值后,依据嗅感评分预测平均值确定对应的嗅感描述符。
基于上述实施例,本实施例中该嗅感描述符获取系统通常还可以包括:
特征相关性分析模块,用于利用预设数量的嗅感描述符对应的物化特性数据,对未标记气体分子的未标记物化特性数据进行特征相关性分析,得到未标记气体分子对应的未标记嗅感评分预测平均值;
未标记嗅感描述符确定模块,用于根据未标记嗅感评分预测平均值,确定对应的未标记嗅感描述符。
本申请还提供一种设备,包括:存储器和处理器;其中,存储器用于存储计算机程序,处理器用于执行计算机程序时实现上述任意实施例的嗅感描述符获取方法的步骤。
本申请还提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述任意实施例的嗅感描述符获取方法的步骤。
该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例提供的系统而言,由于其与实施例提供的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本申请所提供的一种嗅感描述符获取方法、系统、设备及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。

Claims (6)

1.一种嗅感描述符获取方法,其特征在于,包括:
利用化学分析软件获取目标对象的气体分子的物化特性数据,目标对象的气体分子的物化特性数据为目标对象的气体分子的特征信息;
将所述物化特性数据输入预设随机森林模型,输出对应的嗅感描述符;其中,由嗅感描述符全面地表征目标对象的嗅觉感知,所述预设随机森林模型是模型训练而得到的;
其中,预设随机森林模型,通过Boruta算法实现特征选择;
所述将所述物化特性数据输入预设随机森林模型,输出对应的嗅感描述符,包括:
在获取原始样本物化特性数据后,对所述原始样本物化特性数据进行标准化处理,得到样本的物化特性数据;
利用所述样本物化特性数据和预设随机森林算法进行所述模型训练,得到所述预设随机森林模型;
将所述物化特性数据输入所述预设随机森林模型,分别得到所述预设随机森林模型中各个分类回归树对应的嗅感评分预测值;
在利用各个所述嗅感评分预测值计算出嗅感评分预测平均值后,依据所述嗅感评分预测平均值确定对应的嗅感描述符。
2.根据权利要求1所述的嗅感描述符获取方法,其特征在于,依据所述嗅感评分预测平均值确定对应的嗅感描述符之后,还包括:
利用预设数量的所述嗅感描述符对应的物化特性数据,对未标记气体分子的未标记物化特性数据进行特征相关性分析,得到所述未标记气体分子对应的未标记嗅感评分预测平均值;
根据所述未标记嗅感评分预测平均值,确定对应的未标记嗅感描述符。
3.一种嗅感描述符获取系统,其特征在于,包括:
物化特性数据获取模块,用于获取目标对象的气体分子的物化特性数据,目标对象的气体分子的物化特性数据为目标对象的物化特性数据;
嗅感描述符输出模块,用于将所述物化特性数据输入预设随机森林模型,输出对应的嗅感描述符;其中,所述预设随机森林模型是模型训练而得到的,由多种嗅感描述符全面地表征目标对象的嗅觉感知;
所述嗅感描述符输出模块,包括:
标准化处理单元,用于在利用化学分析软件获取原始样本物化特性数据后,对所述原始样本物化特性数据进行标准化处理,得到样本物化特性数据信息;
模型训练单元,用于利用所述样本物化特性数据和预设随机森林算法进行所述模型训练,得到所述预设随机森林模型;
嗅感描述符输出单元,用于将所述物化特性数据输入所述预设随机森林模型,输出对应的嗅感描述符;
所述嗅感描述符输出单元,包括:
嗅感评分预测值获取子单元,用于将所述物化特性数据输入所述预设随机森林模型,分别得到所述预设随机森林模型中各个分类回归树对应的嗅感评分预测值;
嗅感描述符确定子单元,用于在利用各个所述嗅感评分预测值计算出嗅感评分预测平均值后,依据所述嗅感评分预测平均值确定对应的嗅感描述符。
4.根据权利要求3所述的嗅感描述符获取系统,其特征在于,还包括:
特征相关性分析模块,用于利用预设数量的所述嗅感描述符对应的物化特性数据,对未标记气体分子的未标记物化特性数据进行特征相关性分析,得到所述未标记气体分子对应的未标记嗅感评分预测平均值;
未标记嗅感描述符确定模块,用于根据所述未标记嗅感评分预测平均值,确定对应的未标记嗅感描述符。
5.一种嗅感描述符获取设备,其特征在于,包括:
存储器和处理器;其中,所述存储器用于存储计算机程序,所述处理器用于执行所述计算机程序时实现如权利要求1或2任一项所述的嗅感描述符获取方法的步骤。
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1或2任一项所述的嗅感描述符获取方法的步骤。
CN201910324005.2A 2019-04-22 2019-04-22 一种嗅感描述符获取方法、系统及相关装置 Active CN110057975B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910324005.2A CN110057975B (zh) 2019-04-22 2019-04-22 一种嗅感描述符获取方法、系统及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910324005.2A CN110057975B (zh) 2019-04-22 2019-04-22 一种嗅感描述符获取方法、系统及相关装置

Publications (2)

Publication Number Publication Date
CN110057975A CN110057975A (zh) 2019-07-26
CN110057975B true CN110057975B (zh) 2023-07-25

Family

ID=67320087

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910324005.2A Active CN110057975B (zh) 2019-04-22 2019-04-22 一种嗅感描述符获取方法、系统及相关装置

Country Status (1)

Country Link
CN (1) CN110057975B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111724868A (zh) * 2020-05-06 2020-09-29 嘉兴汇智诚电子科技有限公司 一种voc气味评级模型及优化方法
CN112992286B (zh) * 2021-04-13 2023-08-15 广东工业大学 一种物质气味留香值快速获取方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4498005B2 (ja) * 2004-05-12 2010-07-07 キヤノン株式会社 香り情報処理装置および香り情報処理システム
CN101692053B (zh) * 2009-10-09 2012-01-18 江苏大学 基于多传感信息融合的名优茶品质仪器智能化审评方法
CN107274065A (zh) * 2017-05-15 2017-10-20 崔哲 食物口感和风味的主观评价与光谱数据建模方法及系统
CN107468210A (zh) * 2017-06-29 2017-12-15 江苏大学 一种基于终端检测+互联网+大数据云计算平台的人工嗅觉检测方法
CN108287184A (zh) * 2017-12-29 2018-07-17 东北电力大学 基于电子鼻的石蜡嗅味等级评定方法
CN108932483B (zh) * 2018-06-19 2022-03-25 广东工业大学 一种基于机器嗅觉的气味识别方法及装置

Also Published As

Publication number Publication date
CN110057975A (zh) 2019-07-26

Similar Documents

Publication Publication Date Title
Sanchez-Lengeling et al. Machine learning for scent: Learning generalizable perceptual representations of small molecules
Vigneau et al. Random forests: A machine learning methodology to highlight the volatile organic compounds involved in olfactory perception
US20200300829A1 (en) Utilization of electronic nose-based analysis of odorants
Prasad et al. Newer classification and regression tree techniques: bagging and random forests for ecological prediction
Kiela et al. Grounding semantics in olfactory perception
Han et al. Acoustic classification of Australian anurans based on hybrid spectral-entropy approach
CN110057975B (zh) 一种嗅感描述符获取方法、系统及相关装置
Er et al. The classification of white wine and red wine according to their physicochemical qualities
JP6933464B2 (ja) 香料組成構築システム
JP7255792B2 (ja) 匂い表現予測システム、及び匂い表現予測カテゴライズ方法
Yue et al. An approach to assessing site index changes of Norway spruce based on spatially and temporally disjunct measurement series
CN113627532B (zh) 食品安全检测方法、装置、设备及存储介质
CN112992286B (zh) 一种物质气味留香值快速获取方法
US20220113250A1 (en) Method for Near-Infrared Spectral Wavelength Selection Based on Improved Team Progress Algorithm
CN111401444A (zh) 红酒原产地的预测方法、装置、计算机设备及存储介质
Liu et al. In silico prediction of fragrance retention grades for monomer flavors using QSPR models
Thakur et al. Rényi entropy based mutual information for semi-supervised bird vocalization segmentation
Baudrit et al. A probabilistic graphical model for describing the grape berry maturity
US20220392583A1 (en) System for training an ensemble neural network device to assess predictive uncertainty
JP2008537362A (ja) 嗅覚情報符号化装置及びその方法と香りコード生成装置及びその方法
Demir et al. Possible Use of Data Mining for Analysis and Prediction of Apple Physical Properties.
CN109063767A (zh) 一种基于样本和变量共识的近红外光谱建模方法
CN115910223A (zh) 基于PLS-LSBoost梯度提升树的辐照白酒生产工艺优化方法
Huzir et al. Stepwise regression of agarwood oil significant chemical compounds into four quality differentiation
CN114821324A (zh) 一种基于选择性学习与回放的遥感图像农作物识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20210709

Address after: 510000 2nd floor, building B25, Huachuang Animation Industrial Park, Jinshan Village, Shiji Town, Panyu District, Guangzhou City, Guangdong Province

Applicant after: Guangzhou Dexin Semiconductor Technology Co.,Ltd.

Address before: No.729, Dongfeng East Road, Yuexiu District, Guangzhou City, Guangdong Province 510060

Applicant before: GUANGDONG University OF TECHNOLOGY

GR01 Patent grant
GR01 Patent grant