CN117407708A - 基于烹饪领域的气味识别模型训练方法和装置 - Google Patents

基于烹饪领域的气味识别模型训练方法和装置 Download PDF

Info

Publication number
CN117407708A
CN117407708A CN202311154219.2A CN202311154219A CN117407708A CN 117407708 A CN117407708 A CN 117407708A CN 202311154219 A CN202311154219 A CN 202311154219A CN 117407708 A CN117407708 A CN 117407708A
Authority
CN
China
Prior art keywords
odor
sample
training
training data
cooking
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311154219.2A
Other languages
English (en)
Inventor
徐迎庆
于港
孙宇驰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN202311154219.2A priority Critical patent/CN117407708A/zh
Publication of CN117407708A publication Critical patent/CN117407708A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/245Classification techniques relating to the decision surface
    • G06F18/2451Classification techniques relating to the decision surface linear, e.g. hyperplane
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Medical Informatics (AREA)
  • Algebra (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Investigating Or Analyzing Materials By The Use Of Fluid Adsorption Or Reactions (AREA)

Abstract

本发明提供一种基于烹饪领域的气味识别模型训练方法和装置,包括:根据目标烹饪任务的时长确定采集方式,采集得到气味样本;对所述气味样本进行数据处理,以得到气味特征;基于预设规则对所述气味特征进行类别标注,以得到类别训练数据样本,利用所述类别训练数据样本构成训练数据集;其中,所述预设规则至少包括先验经验和除气味外的理化指标;基于所述训练数据集,利用预先选择的机器学习方法进行建模及训练,以得到气味识别模型。本发明针对目标烹饪任务构建气味识别模型,通过时长确定采集方式,并对采集到的气味样本进行处理及标注,利用得到训练数据集的进行模型建模及训练,实现效率更高、误差更小的识别烹饪过程中的气味的效果。

Description

基于烹饪领域的气味识别模型训练方法和装置
技术领域
本发明涉及气味识别技术领域,尤其涉及一种基于烹饪领域的气味识别模型训练方法和装置。
背景技术
随着科学技术的不断进步、物质生活水平的不断提高,人们对烹饪工具的要求也不断提高,随着智能化家电的发展,智能控制、自动烹饪逐渐成为新一代烹饪电器的技术趋势和产品化特征。
现有技术中,自动烹饪大多是根据预先设置的烹饪参数和烹饪时长进行烹饪控制,由于烹饪者的经验、或食材本身的变化(例如含水量、解冻程度不同、食材品牌不同等)、或烹饪器具加热一致性差异的原因,单纯的计时控制无法恰到好处地保证食材烹饪到最佳状态,经常出现过度烹饪(焦糊)或烹饪不足(夹生)的现象出现。如果通过用户监控食物的烹饪状态,对于具有封闭或半封闭烹饪腔体的烹饪器具而言,用户难以直接观察到腔体内食物烹饪的状态,无法做到根据食材的理化特征智能地、实时地判断烹饪阶段,进而无法获知食物在烹饪过程中的生熟程度,可能会影响烹饪的成功率,给用户带来不好的体验。同时,此外,对于经验不足的用户,即使能够直接观察到食物烹饪的状态,也不能获知食物在烹饪过程中的生熟程度,从而影响烹饪的成功率。
故而,亟需一种方法以实现智能实时监控食物的烹饪状态。目前,存在部分研究采用气味对食物的状态进行实时识别,进而达到实时监控的目的。然而,现有气味识别方法通常为利用预存的数据库与需要识别的气味进行比较,效率较低、误差较大。
综上,现有技术存在效率较低、误差较大的问题。
发明内容
本发明提供一种基于烹饪领域的气味识别模型训练方法和装置,用以解决现有技术中效率较低、误差较大的缺陷,实现效率更高、误差更小的识别烹饪过程中的气味的效果。
本发明提供一种基于烹饪领域的气味识别模型训练方法,包括:
根据目标烹饪任务的时长确定采集方式,采集得到气味样本;
对所述气味样本进行数据处理,以得到气味特征;
基于预设规则对所述气味特征进行类别标注,以得到类别训练数据样本,利用所述类别训练数据样本构成训练数据集;其中,所述预设规则至少包括先验经验和除气味外的理化指标;
基于所述训练数据集,利用预先选择的机器学习方法进行建模及训练,以得到气味识别模型。
根据本发明提供的一种基于烹饪领域的气味识别模型训练方法,根据目标烹饪任务的时长确定采集方式,采集得到气味样本,具体包括:
若目标烹饪任务的时长小于预设时长,选择持续采集方式;若目标烹饪任务的时长不小于预设时长,选择间隔采集方式;
根据选择的采集方式采集得到气味样本。
根据本发明提供的一种基于烹饪领域的气味识别模型训练方法,使用间隔采集的采集方式时,对所述气味样本进行数据处理,以得到气味特征,具体包括:
对所述气味样本进行校准,以得到气味校准样本;
提取所述气味校准样本在采集阶段数据的第一气味特征,所述第一气味特征至少包括采集阶段数据初始基线、上升斜率、下降斜率、最大值、达峰时间、吹扫阶段的吹扫斜率、吹扫基线和响应降半时间;
提取所述气味校准样本在连续多个采集窗的特征值变化特征,以得到第二气味特征;
基于所述气味校准样本进行降采样,以得到第三气味特征;
基于所述气味校准样本,采用预设数据处理方法,将所述气味校准样本的时域传感器信号转化为高维空间或频域空间数据,提取所述高维空间或频域空间数据中预先选择的代表特征,以得到第四气味特征,所述代表特征至少包括主要频率、主成分向量;
选择所述第一气味特征、第二气味特征、第三气味特征和第四气味特征中的至少一个构成气味特征。
根据本发明提供的一种基于烹饪领域的气味识别模型训练方法,基于预设规则对所述气味特征进行类别标注,以得到类别训练数据样本,利用所述类别训练数据样本构成训练数据集,之后还包括:
将所述训练数据集按照预设比例分为训练集、内部验证集和外部验证集。
根据本发明提供的一种基于烹饪领域的气味识别模型训练方法,机器学习方法选择支持向量机;基于所述训练数据集,利用预先选择的机器学习方法进行建模及训练,以得到气味识别模型,具体包括:
根据所述训练数据集,利用序列最小优化算法基于第一预设公式计算预先构建的约束最优化问题,以得到最优化系数向量;
根据所述训练数据集,基于所述最优化系数向量,利用第二预设公式求解预先构建的超平面,以得到气味识别模型。
根据本发明提供的一种基于烹饪领域的气味识别模型训练方法,所述第一预设公式包括:
s.t.0≤ai≤A,i=1,2,…,N
其中,ai、aj表示最优化系数;K(xi,xj)表示选择的核函数;N表示训练集样本数;xi是第i个样本的气味特征向量,yi是第i个样本的气味类别标签;A表示最优化系数最大值。
根据本发明提供的一种基于烹饪领域的气味识别模型训练方法,所述第二预设公式包括:
所述超平面包括:
wTx+b=0
其中,表示最优化系数向量;K(xi,xj)表示选择的核函数;N表示训练集样本数;xi是第i个样本的气味特征向量,yi是第i个样本的气味类别标签,w表示第一超平面系数;b表示第二超平面系数。
本发明还提供一种基于烹饪领域的气味识别模型训练装置,包括:
采集单元,用于根据目标烹饪任务的时长确定采集方式,采集得到气味样本;
处理单元,用于对所述气味样本进行数据处理,以得到气味特征;
标注单元,用于基于预设规则对所述气味特征进行类别标注,以得到类别训练数据样本,利用所述类别训练数据样本构成训练数据集;其中,所述预设规则至少包括先验经验和除气味外的理化指标;
模型单元,基于所述训练数据集,利用预先选择的机器学习方法进行建模及训练,以得到气味识别模型。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述基于烹饪领域的气味识别模型训练方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述基于烹饪领域的气味识别模型训练方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述基于烹饪领域的气味识别模型训练方法。
本发明提供的基于烹饪领域的气味识别模型训练方法和装置,通过根据目标烹饪任务的时长确定采集方式,采集得到气味样本;对所述气味样本进行数据处理,以得到气味特征;基于预设规则对所述气味特征进行类别标注,以得到类别训练数据样本,利用所述类别训练数据样本构成训练数据集;其中,所述预设规则至少包括先验经验和除气味外的理化指标;基于所述训练数据集,利用预先选择的机器学习方法进行建模及训练,以得到气味识别模型。本发明针对目标烹饪任务构建气味识别模型,通过时长确定采集方式,并对采集到的气味样本进行处理及标注,利用得到训练数据集的进行模型建模及训练,实现效率更高、误差更小的识别烹饪过程中的气味的效果。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的基于烹饪领域的气味识别模型训练方法的流程示意图之一;
图2是本发明提供的基于烹饪领域的气味识别模型训练方法的流程示意图之二;
图3是本发明提供的基于烹饪领域的气味识别模型训练装置的结构示意图;
图4是本发明提供的电子设备的结构示意图。
附图标记:
310:采集单元;320:处理单元;330:标注单元;340:模型单元;
410:处理器;420:通信接口;430:存储器;440:通信总线。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合图1-图2描述本发明的基于烹饪领域的气味识别模型训练方法,如图1,图1是本发明提供的基于烹饪领域的气味识别模型训练方法的流程示意图之一,包括以下步骤:
步骤110:根据目标烹饪任务的时长确定采集方式,采集得到气味样本。
首先进行目标烹饪任务的获取。获取的是需要构建的气味识别模型针对的烹饪任务,本发明所提及的目标烹饪任务是针对采集到的气体进行状态判断的任务,例如,基于采集到的气体样本区分不同的烹饪状态(生、最佳、焦糊)的任务。进一步地,也可以是基于采集到的气体样本区分不同的烹饪食材或菜谱(烤牛排、炸薯条、炒青菜)的任务。
随后根据目标烹饪任务的时长确定采集方式,采集得到气味样本。具体地,对目标烹饪任务的时长做出判断,匹配持续采集或间隔采集的采集方式。进一步地,在一些实施例中,采集方式的确定还可以根据目标烹饪任务及目标烹饪任务涉及的烹饪设备来确定。具体地,根据烹饪设备的性质对目标烹饪任务的时长做出判断,匹配持续采集或间隔采集的采集方式。
需要注意的是,持续采集适用于气体环境多变、需要进行不间断监测的任务,间隔采集适用于气体环境较为稳定、对传感器损耗较大的任务。此外,对于间隔采集法,还需要根据需求选择采集时间和吹扫时间。
确定采集方式后,对于目标烹饪任务涉及的烹饪设备,采用电子鼻采集得到气味样本。电子鼻的布置可以根据实际采集需求进行设定,为了避免由于电子鼻本身造成的误差,可以采用多个电子鼻同时进行采集,多个电子鼻至少包括同批次且同种的多个电子鼻、不同批次但同种的多个电子鼻以及同批次但不同单体的多个电子鼻,具体的电子鼻配置可以根据实际需求进行选择。
步骤120:对所述气味样本进行数据处理,以得到气味特征。
采集得到气味样本后,对气味样本进行数据处理,数据处理包括数据校准、特征提取和数据挖掘,得到气味特征。
步骤130:基于预设规则对所述气味特征进行类别标注,以得到类别训练数据样本,利用所述类别训练数据样本构成训练数据集;其中,所述预设规则至少包括先验经验和除气味外的理化指标。
对得到的气味特征,基于预设规则进行类别标注,标注其所属类别或属性,得到类别训练数据样本。预设规则是根据不同烹饪方法的食材指标、任务目标制定的。在类别标注过程中,需要结合先验经验和除气味外的理化指标分析,综合得出气味特征的类别标签。例如对于基于采集到的气体样本区分不同的烹饪状态的目标烹饪任务,类别标签包括生、最佳、焦糊等。对于基于采集到的气体样本区分不同的烹饪食材或菜谱的目标烹饪任务,类别标签包括烤牛排、炸薯条、炒青菜等。需要注意的是,在一些实施例中,先验经验可以包括人类(烹饪者/厨师/品尝者/消费者等)感官评价及经验。
对气味特征标注完成类别标签后,得到类别训练数据样本,所有的类别训练数据样本构成训练数据集。
步骤140:基于所述训练数据集,利用预先选择的机器学习方法进行建模及训练,以得到气味识别模型。
获得训练数据集后,选择机器学习方法进行气味识别模型的建模及训练。机器学习方法包括SVM(支持向量机)、RandomForest(随机森林)、Naive Bayes(贝叶斯决策)、Decision Tree(决策树)、ANN(人工神经网络)、CNN(卷积神经网络)、RNN(循环神经网络)、LSTM、Transformer等。
基于上述实施例,该方法中,根据目标烹饪任务的时长确定采集方式,采集得到气味样本,具体包括:
若目标烹饪任务的时长小于预设时长,选择持续采集方式;若目标烹饪任务的时长不小于预设时长,选择间隔采集方式;
根据选择的采集方式采集得到气味样本。
具体地,利用预设时长对目标烹饪任务的时长进行判断,根据判断结果匹配持续采集或间隔采集的采集方式。具体来说,若目标烹饪任务的时长小于预设时长,则说明目标烹饪任务的烹饪时间较短,可采用持续采集的方式进行采集,即对目标烹饪任务进行全时段监测,使用全烹饪过程的连续数据进行模型的建模及训练。需要了解的是,烹饪时间较短的烹饪任务例如煎炒炸炖等。
若目标烹饪任务的时长不小于预设时长,则说明目标烹饪任务的烹饪时间较长,可采用间隔采集的方式进行采集,即对目标烹饪任务进行分窗间隔采集的方法,从每个数据窗中提取数据特征模型的建模及训练。需要了解而是,烹饪时间较长的烹饪任务例如蒸、烘烤、熟成、烟熏等。需要注意的是,对于间隔采集法,还需要根据实际需求确定采集时间tsample和吹扫时间tsweep。具体来说,采集时间tsample和吹扫时间tswee与目标烹饪任务、目标气体浓度、干扰物质含量、传感器灵敏度、传感器寿命均有关。tsample最长以监测所出现的最高气体浓度激发传感器的响应不超量程为界,越短对传感器损耗越少;tsweep以将传感器信号吹扫到基线为准,在这个范围内,采集时间tsample和吹扫时间tsweep可以根据气味识别任务任意选择,本发明对此不做限制。
基于上述实施例,该方法中,使用间隔采集的采集方式时,对所述气味样本进行数据处理,以得到气味特征,具体包括:
对所述气味样本进行校准,以得到气味校准样本;
提取所述气味校准样本在采集阶段数据的第一气味特征,所述第一气味特征至少包括采集阶段数据初始基线、上升斜率、下降斜率、最大值、达峰时间、吹扫阶段的吹扫斜率、吹扫基线和响应降半时间;
提取所述气味校准样本在连续多个采集窗的特征值变化特征,以得到第二气味特征;
基于所述气味校准样本进行降采样,以得到第三气味特征;
基于所述气味校准样本,采用预设数据处理方法,将所述气味校准样本的时域传感器信号转化为高维空间或频域空间数据,提取所述高维空间或频域空间数据中预先选择的代表特征,以得到第四气味特征,所述代表特征至少包括主要频率、主成分向量;
选择所述第一气味特征、第二气味特征、第三气味特征和第四气味特征中的至少一个构成气味特征。
具体地,电子鼻技术是模仿人类嗅觉的一个传感器阵列检测系统,具有响应时间短、检测速度快、样品预处理简便、测定评估范围广等优点,但就目前的电子鼻技术而言,具有传感器灵敏度不高、漂移影响大、重复性不理想等问题,需要对电子鼻采集得到的气味样本进行校准。
进一步地,校准主要指不同电子鼻之间的校准,在一些实施例中,还包括同一个电子鼻在使用过程中的老化校准。校准方法至少包括标定曲线法、零点校准法、通道归一化校准以及预测-归一化校准。在具体操作过程中,可以针对实际情况对校准方法进行选择,本发明给出的方式不代表对本发明的限制。
进一步地,通道归一化校准法适用于多传感器电子鼻数据,具体内容包括:将目标气体响应下最高响应的通道数值映射到1,其他通道传感器根据比例进行归一化,以得到气味校准样本。
标定曲线法包括:测量不同气体传感器在多个已知浓度的气体环境中所对应的输出量,将所得气体传感器的输出量与对应的已知气体浓度拟合为标定曲线;选择某一个传感器作为标准,将其他传感器的标定曲线通过仿射变换到标准曲线上,变换矩阵或变换参数即为该气体传感器的校准参数,将实际测量的值乘以校准参数,得到传感器校准后的响应值作为气味校准样本。这种方法适用于检测任务为固定气体的任务。
零点校准法包括:在零点处进行校准,即在没有气体存在时,调整零点电位,使输出为零,以得到气味校准样本。
校准完成得到气味校准样本后,对气味校准样本进行特征提取和数据挖掘。具体来说,对于间隔采集法得到的气味数据,对气味校准样本可以提取第一气味特征、第二气味特征、第三气味特征和第四气味特征。选择第一气味特征、第二气味特征、第三气味特征和第四气味特征中的至少一个构成气味特征。
第一气味特征包括采集阶段数据的初始基线、上升斜率、下降斜率、最大值、达峰时间,吹扫阶段的吹扫斜率、吹扫基线、响应降半时间等;
第二气味特征包括连续多个窗的特征值变化特征;
第三气味特征包括对原始数据降采样,例如由10HZ数据降采样到1Hz或0.5Hz;
第四气味特征包括:采用预设数据处理方法,将时域传感器信号转化为高维空间或频域空间数据,提取有代表性的特征值,例如主要频率、主成分向量等。预设数据处理方法包括用PCA、LDA、FFT等数据处理方法,可根据实际需求进行选择,本发明对此不做限制。
进一步地,对于持续采集法得到的气味数据,对气味校准样本可以提取第三气味特征和第四气味特征。选择第三气味特征和第四气味特征中的至少一个构成气味特征。
基于上述实施例,该方法中,基于预设规则对所述气味特征进行类别标注,以得到类别训练数据样本,利用所述类别训练数据样本构成训练数据集,之后还包括:
将所述训练数据集按照预设比例分为训练集、内部验证集和外部验证集。
具体地,得到训练数据集后,所有标签训练数据组成训练数据集。按照预设比例将训练数据集分成训练集和内部验证集、外部验证集。具体的划分比例可以根据实际需求进行调整,例如,在一个实施例中,按照8:2的比例将训练数据集分成训练集和内部验证集,使用新一套电子鼻重复实验采集的数据作为外部验证集。在一个实施例中,按照8:1:1的比例将训练数据集分成训练集和内部验证集、外部验证集。
基于上述实施例,该方法中,机器学习方法选择支持向量机;基于所述训练数据集,利用预先选择的机器学习方法进行建模及训练,以得到气味识别模型,具体包括:
根据所述训练数据集,利用序列最小优化算法基于第一预设公式计算预先构建的约束最优化问题,以得到最优化系数向量;
根据所述训练数据集,基于所述最优化系数向量,利用第二预设公式求解预先构建的超平面,以得到气味识别模型。
基于上述实施例,该方法中,所述第一预设公式包括:
s.t.0≤ai≤A,i=1,2,…,N
其中,ai、aj表示最优化系数;K(xi,xj)表示选择的核函数;N表示训练集样本数;xi是第i个样本的气味特征向量,yi是第i个样本的气味类别标签;A表示最优化系数最大值。
基于上述实施例,该方法中,所述第二预设公式包括:
所述超平面包括:
wTx+b=0
其中,表示最优化系数向量;K(xi,xj)表示选择的核函数;N表示训练集样本数;xi是第i个样本的气味特征向量,yi是第i个样本的气味类别标签,w表示第一超平面系数;b表示第二超平面系数。
具体地,机器学习方法选择SVM进行气味识别模型的建模,具体包括:对于训练集预先设定的气味类别标签包括{c1,c2,…,ck},其中xi是第i个样本的气味特征向量,yi是第i个样本的气味类别标签,k是类别数。
(1)构造约束最优化问题:
s.t.0≤ai≤A,i=1,2,…,N
其中,ai、aj表示最优化系数;K(xi,xj)表示选择的核函数(例如高斯核);N表示训练集样本数。
(2)使用序列最小优化算法求解上述最优化问题,得到
(3)选择的支持向量(xi,yi),求解超平面wTx+b=0:
该超平面即为气味识别模型。
之后,在利用该气味识别模型执行烹饪阶段识别任务时,将新采集到的待测烹饪气体特征值输入到超平面内,得出烹饪程度预测类别作为烹饪阶段识别结果:
进一步地,机器学习方法选择Naive Bayes进行气味识别模型的建模,具体包括:
对于训练集预先设定的气味类别标签包括{c1,c2,…,ck},其中xi是第i个样本的气味特征向量,yi是第i个样本的气味类别标签,k是类别数。
根据贝叶斯定理,对于一个新的样本x,它属于类别cj的概率可以表示为:
其中P(x|cj)是类条件概率,P(cj)是先验概率,P(x)是证据因子。由于P(x)对于所有类别都相同,因此只需比较分子部分即可。对于每个类别cj,需要计算P(x|cj)和P(cj)。
对于连续分布的气味特征其服从高斯分布,然后根据训练集中属于类别cj的样本计算均值和方差,从而得到P(x|cj)。例如使用高斯分布估计P(x|cj):
其中,μ为样本均值,σ为样本方差。
得到P(x|cj)和P(cj)后,将P(x)视为一个固定参数,构成P(cj|x),完成建模,得到气味识别模型。
在使用气味识别模型应用时,输入待测烹饪气体的特征值x,计算它属于每个类别的概率P(cj|x),然后选择概率最大的类别作为待测烹饪气体的预测类别。
y=argmaxP(y=ck)
其中,ck表示第k个气味类别。
进一步地,机器学习方法选择深度神经网络进行气味识别模型的建模,具体包括:
对于训练集预先设定的气味类别标签包括{c1,c2,…,ck},其中xi是第i个样本的气味特征向量,yi是第i个样本的气味类别标签,k是类别数。
首先定义损失函数。常用的损失函数有均方误差(MSE)和交叉熵(Cross-Entropy)等。以均方误差为例,其定义为:
其中hatyii表示第i个样本的深度神经网络输出。
其次进行优化,最小化损失函数。常用的优化算法有随机梯度下降(SGD)、动量法(Momentum)和Adam等。以SGD为例,其更新规则为:
thetak+1=thetak-eta*nablaL(thetak)
其中theta表示神经网络参数,eta表示学习率,nablaL(thetak)表示损失函数关于参数thetak的梯度,k表示迭代轮数。
之后使用反向传播算法计算梯度。反向传播算法通过链式法则计算损失函数关于每个参数的梯度。具体而言,对于每一层l,定义δl为该层误差项,其计算方法如下:
对于输出层C,误差项δC=nablaaL⊙σ′(zC)
对于隐藏层c,误差项δc=((wc+1)Tδc+1)⊙σ′(zc)
其中,zc表示第c层的激活值,σ′(zc)表示第c层激活函数的导数,⊙表示Hadamard积,w表示待求取权重矩阵,nablaaL表示损失函数梯度。
然后计算损失函数关于每个参数的梯度。具体而言:
对于权重矩阵其梯度为/>
其中,表示激活函数,k表示迭代轮数,L表示损失函数,k表示神经元索引,/>表示误差项,c表示隐藏层索引。
最后根据上述梯度更新规则来更新网络参数,并重复上述过程直至收敛,得到气味识别模型。
利用内部验证集、外部验证集进行验证,准确率验证通过则输出气味识别模型。
在气味识别模型应用时,输入待测烹饪气体特征值至气味识别模型,直接输出待测烹饪气体的预测类别。
基于上述实施例,本发明提供一种利用气味识别模型训练方法进行一次模型训练的具体实施例,如图2所示,包括以下步骤:
S1:训练开始,获取目标烹饪任务;
S2:根据目标烹饪任务的烹饪方式和烹饪器具确定采集方式,采集得到气味样本;
S3:对气味样本进行数据处理,得到气味特征;
S4:基于感官实验/除气味外的理化指标对气味特征进行类别标注,得到类别训练数据样本,进而组成训练数据集;将训练数据集划分成训练集、内部验证集和外部验证集;
S5:根据训练数据集,利用预先选择的机器学习方法进行建模及训练,以得到气味识别模型;
S6:输出气味识别模型;
S7:训练结束。
本发明提供的基于烹饪领域的气味识别模型训练方法,通过根据目标烹饪任务的时长确定采集方式,采集得到气味样本;对所述气味样本进行数据处理,以得到气味特征;基于预设规则对所述气味特征进行类别标注,以得到类别训练数据样本,利用所述类别训练数据样本构成训练数据集;其中,所述预设规则至少包括先验经验和除气味外的理化指标;基于所述训练数据集,利用预先选择的机器学习方法进行建模及训练,以得到气味识别模型。本发明针对目标烹饪任务构建气味识别模型,通过时长确定采集方式,并对采集到的气味样本进行处理及标注,利用得到训练数据集的进行模型建模及训练,实现效率更高、误差更小的识别烹饪过程中的气味的效果。
下面对本发明提供的基于烹饪领域的气味识别模型训练装置进行描述,下文描述的基于烹饪领域的气味识别模型训练装置与上文描述的基于烹饪领域的气味识别模型训练方法可相互对应参照。如图3,图3是本发明提供的基于烹饪领域的气味识别模型训练装置的结构示意图,基于烹饪领域的气味识别模型训练装置包括:
采集单元310,用于根据目标烹饪任务的时长确定采集方式,采集得到气味样本;
处理单元320,用于对所述气味样本进行数据处理,以得到气味特征;
标注单元330,用于基于预设规则对所述气味特征进行类别标注,以得到类别训练数据样本,利用所述类别训练数据样本构成训练数据集;其中,所述预设规则至少包括先验经验和除气味外的理化指标;
模型单元340,基于所述训练数据集,利用预先选择的机器学习方法进行建模及训练,以得到气味识别模型。
基于上述实施例,该装置中,根据目标烹饪任务的时长确定采集方式,采集得到气味样本,具体包括:
若目标烹饪任务的时长小于预设时长,选择持续采集方式;若目标烹饪任务的时长不小于预设时长,选择间隔采集方式;
根据选择的采集方式采集得到气味样本。
基于上述实施例,该装置中,使用间隔采集的采集方式时,对所述气味样本进行数据处理,以得到气味特征,具体包括:
对所述气味样本进行校准,以得到气味校准样本;
提取所述气味校准样本在采集阶段数据的第一气味特征,所述第一气味特征至少包括采集阶段数据初始基线、上升斜率、下降斜率、最大值、达峰时间、吹扫阶段的吹扫斜率、吹扫基线和响应降半时间;
提取所述气味校准样本在连续多个采集窗的特征值变化特征,以得到第二气味特征;
基于所述气味校准样本进行降采样,以得到第三气味特征;
基于所述气味校准样本,采用预设数据处理方法,将所述气味校准样本的时域传感器信号转化为高维空间或频域空间数据,提取所述高维空间或频域空间数据中预先选择的代表特征,以得到第四气味特征,所述代表特征至少包括主要频率、主成分向量;
选择所述第一气味特征、第二气味特征、第三气味特征和第四气味特征中的至少一个构成气味特征。
基于上述实施例,该装置中,基于预设规则对所述气味特征进行类别标注,以得到类别训练数据样本,利用所述类别训练数据样本构成训练数据集,之后还包括:
将所述训练数据集按照预设比例分为训练集、内部验证集和外部验证集。
基于上述实施例,该装置中,机器学习方法选择支持向量机;基于所述训练数据集,利用预先选择的机器学习方法进行建模及训练,以得到气味识别模型,具体包括:
根据所述训练数据集,利用序列最小优化算法基于第一预设公式计算预先构建的约束最优化问题,以得到最优化系数向量;
根据所述训练数据集,基于所述最优化系数向量,利用第二预设公式求解预先构建的超平面,以得到气味识别模型。
基于上述实施例,该装置中,所述第一预设公式包括:
s.t.0≤ai≤A,i=1,2,…,N
其中,ai、aj表示最优化系数;K(xi,xj)表示选择的核函数;N表示训练集样本数;xi是第i个样本的气味特征向量,yi是第i个样本的气味类别标签;A表示最优化系数最大值。
基于上述实施例,该装置中,所述第二预设公式包括:
所述超平面包括:
/>
其中,表示最优化系数向量;K(xi,xj)表示选择的核函数;N表示训练集样本数;xi是第i个样本的气味特征向量,yi是第i个样本的气味类别标签,w表示第一超平面系数;b表示第二超平面系数。
本发明提供的基于烹饪领域的气味识别模型训练装置,通过根据目标烹饪任务的时长确定采集方式,采集得到气味样本;对所述气味样本进行数据处理,以得到气味特征;基于预设规则对所述气味特征进行类别标注,以得到类别训练数据样本,利用所述类别训练数据样本构成训练数据集;其中,所述预设规则至少包括先验经验和除气味外的理化指标;基于所述训练数据集,利用预先选择的机器学习方法进行建模及训练,以得到气味识别模型。本发明针对目标烹饪任务构建气味识别模型,通过时长确定采集方式,并对采集到的气味样本进行处理及标注,利用得到训练数据集的进行模型建模及训练,实现效率更高、误差更小的识别烹饪过程中的气味的效果。
图4示例了一种电子设备的实体结构示意图,如图4所示,该电子设备可以包括:处理器(processor)410、通信接口(Communications Interface)420、存储器(memory)430和通信总线440,其中,处理器410,通信接口420,存储器430通过通信总线440完成相互间的通信。处理器410可以调用存储器430中的逻辑指令,以执行基于烹饪领域的气味识别模型训练方法,该方法包括:根据目标烹饪任务的时长确定采集方式,采集得到气味样本;对所述气味样本进行数据处理,以得到气味特征;基于预设规则对所述气味特征进行类别标注,以得到类别训练数据样本,利用所述类别训练数据样本构成训练数据集;其中,所述预设规则至少包括先验经验和除气味外的理化指标;基于所述训练数据集,利用预先选择的机器学习方法进行建模及训练,以得到气味识别模型。
此外,上述的存储器430中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的基于烹饪领域的气味识别模型训练方法,该方法包括:根据目标烹饪任务的时长确定采集方式,采集得到气味样本;对所述气味样本进行数据处理,以得到气味特征;基于预设规则对所述气味特征进行类别标注,以得到类别训练数据样本,利用所述类别训练数据样本构成训练数据集;其中,所述预设规则至少包括先验经验和除气味外的理化指标;基于所述训练数据集,利用预先选择的机器学习方法进行建模及训练,以得到气味识别模型。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的基于烹饪领域的气味识别模型训练方法,该方法包括:根据目标烹饪任务的时长确定采集方式,采集得到气味样本;对所述气味样本进行数据处理,以得到气味特征;基于预设规则对所述气味特征进行类别标注,以得到类别训练数据样本,利用所述类别训练数据样本构成训练数据集;其中,所述预设规则至少包括先验经验和除气味外的理化指标;基于所述训练数据集,利用预先选择的机器学习方法进行建模及训练,以得到气味识别模型。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种基于烹饪领域的气味识别模型训练方法,其特征在于,包括:
根据目标烹饪任务的时长确定采集方式,采集得到气味样本;
对所述气味样本进行数据处理,以得到气味特征;
基于预设规则对所述气味特征进行类别标注,以得到类别训练数据样本,利用所述类别训练数据样本构成训练数据集;其中,所述预设规则至少包括先验经验和除气味外的理化指标;
基于所述训练数据集,利用预先选择的机器学习方法进行建模及训练,以得到气味识别模型。
2.根据权利要求1所述的基于烹饪领域的气味识别模型训练方法,其特征在于,根据目标烹饪任务的时长确定采集方式,采集得到气味样本,具体包括:
若目标烹饪任务的时长小于预设时长,选择持续采集方式;若目标烹饪任务的时长不小于预设时长,选择间隔采集方式;
根据选择的采集方式采集得到气味样本。
3.根据权利要求1所述的基于烹饪领域的气味识别模型训练方法,其特征在于,使用间隔采集的采集方式时,对所述气味样本进行数据处理,以得到气味特征,具体包括:
对所述气味样本进行校准,以得到气味校准样本;
提取所述气味校准样本在采集阶段数据的第一气味特征,所述第一气味特征至少包括采集阶段数据初始基线、上升斜率、下降斜率、最大值、达峰时间、吹扫阶段的吹扫斜率、吹扫基线和响应降半时间;
提取所述气味校准样本在连续多个采集窗的特征值变化特征,以得到第二气味特征;
基于所述气味校准样本进行降采样,以得到第三气味特征;
基于所述气味校准样本,采用预设数据处理方法,将所述气味校准样本的时域传感器信号转化为高维空间或频域空间数据,提取所述高维空间或频域空间数据中预先选择的代表特征,以得到第四气味特征,所述代表特征至少包括主要频率、主成分向量;
选择所述第一气味特征、第二气味特征、第三气味特征和第四气味特征中的至少一个构成气味特征。
4.根据权利要求1所述的基于烹饪领域的气味识别模型训练方法,其特征在于,基于预设规则对所述气味特征进行类别标注,以得到类别训练数据样本,利用所述类别训练数据样本构成训练数据集,之后还包括:
将所述训练数据集按照预设比例分为训练集、内部验证集和外部验证集。
5.根据权利要求1所述的基于烹饪领域的气味识别模型训练方法,其特征在于,机器学习方法选择支持向量机;基于所述训练数据集,利用预先选择的机器学习方法进行建模及训练,以得到气味识别模型,具体包括:
根据所述训练数据集,利用序列最小优化算法基于第一预设公式计算预先构建的约束最优化问题,以得到最优化系数向量;
根据所述训练数据集,基于所述最优化系数向量,利用第二预设公式求解预先构建的超平面,以得到气味识别模型。
6.根据权利要求5所述的基于烹饪领域的气味识别模型训练方法,其特征在于,所述第一预设公式包括:
s.t.0≤ai≤A,i=1,2,…,N
其中,ai、aj表示最优化系数;K(xi,xj)表示选择的核函数;N表示训练集样本数;xi是第i个样本的气味特征向量,yi是第i个样本的气味类别标签;A表示最优化系数最大值。
7.根据权利要求6所述的基于烹饪领域的气味识别模型训练方法,其特征在于,所述第二预设公式包括:
所述超平面包括:
wTx+b=0
其中,表示最优化系数向量;K(xi,xj)表示选择的核函数;N表示训练集样本数;xi是第i个样本的气味特征向量,yi是第i个样本的气味类别标签,w表示第一超平面系数;b表示第二超平面系数。
8.一种基于烹饪领域的气味识别模型训练装置,其特征在于,包括:
采集单元,用于根据目标烹饪任务的时长确定采集方式,采集得到气味样本;
处理单元,用于对所述气味样本进行数据处理,以得到气味特征;
标注单元,用于基于预设规则对所述气味特征进行类别标注,以得到类别训练数据样本,利用所述类别训练数据样本构成训练数据集;其中,所述预设规则至少包括先验经验和除气味外的理化指标;
模型单元,基于所述训练数据集,利用预先选择的机器学习方法进行建模及训练,以得到气味识别模型。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述基于烹饪领域的气味识别模型训练方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述基于烹饪领域的气味识别模型训练方法。
CN202311154219.2A 2023-09-07 2023-09-07 基于烹饪领域的气味识别模型训练方法和装置 Pending CN117407708A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311154219.2A CN117407708A (zh) 2023-09-07 2023-09-07 基于烹饪领域的气味识别模型训练方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311154219.2A CN117407708A (zh) 2023-09-07 2023-09-07 基于烹饪领域的气味识别模型训练方法和装置

Publications (1)

Publication Number Publication Date
CN117407708A true CN117407708A (zh) 2024-01-16

Family

ID=89491556

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311154219.2A Pending CN117407708A (zh) 2023-09-07 2023-09-07 基于烹饪领域的气味识别模型训练方法和装置

Country Status (1)

Country Link
CN (1) CN117407708A (zh)

Similar Documents

Publication Publication Date Title
RU2719032C2 (ru) Способ и аппарат для управления процессом приготовления пищевого продукта
Li et al. Nondestructive detection of total volatile basic nitrogen (TVB-N) content in pork meat by integrating hyperspectral imaging and colorimetric sensor combined with a nonlinear data fusion
Jiang et al. Quantitative analysis of fatty acid value during rice storage based on olfactory visualization sensor technology
JP6542802B2 (ja) 食品の調理プロセスを制御する方法及び調理装置
Sabilla et al. Estimating gas concentration using artificial neural network for electronic nose
JP5403621B2 (ja) 匂い識別方法
CN106568907B (zh) 一种基于半监督鉴别投影的大闸蟹新鲜度无损检测方法
CN106295801B (zh) 一种基于果蝇算法优化广义回归神经网络算法的茶叶储存时间分类方法
CN107180245A (zh) 一种室内外场景识别方法及装置
Tudu et al. Towards versatile electronic nose pattern classifier for black tea quality evaluation: An incremental fuzzy approach
CN109812840A (zh) 烹饪温度检测方法、装置及灶具
Ratanasanya et al. Model-based optimization of coffee roasting process: Model development, prediction, optimization and application to upgrading of Robusta coffee beans
WO2021251139A1 (ja) 揚げ物廃棄時期管理装置、揚げ物廃棄時期管理システム、および揚げ物廃棄時期管理方法
CN117407708A (zh) 基于烹饪领域的气味识别模型训练方法和装置
Srivastava et al. Development of a low cost optimized handheld embedded odor sensing system (HE-Nose) to assess ripeness of oranges
CN111248716B (zh) 食材的烹饪控制方法、图像处理方法、装置及烹饪设备
CN110553295A (zh) 油烟机的调档方法、装置及油烟机
CN114680659A (zh) 烹饪设备控制方法、装置和烹饪设备
CA3213613A1 (en) Determination device, learning device, determination system, determination method, learning method, and program
GholamHosseini et al. Intelligent processing of E-nose information for fish freshness assessment
Gholam Hosseini et al. Intelligent fish freshness assessment
CN113091910A (zh) 一种基于神经网络的温度估测方法
CN117233326A (zh) 基于气味的烹饪程度识别方法和装置
Alzaga et al. Machine learning-based pork meat quality prediction and shelf-life estimation
Lelono et al. Tofu shelf life using electronic nose based on curve fitting method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination