CN111351757A - 用于预测食用油样品的油掺杂的定量量度的方法和系统 - Google Patents

用于预测食用油样品的油掺杂的定量量度的方法和系统 Download PDF

Info

Publication number
CN111351757A
CN111351757A CN201911322867.8A CN201911322867A CN111351757A CN 111351757 A CN111351757 A CN 111351757A CN 201911322867 A CN201911322867 A CN 201911322867A CN 111351757 A CN111351757 A CN 111351757A
Authority
CN
China
Prior art keywords
oil sample
oil
sample
edible oil
predictive model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911322867.8A
Other languages
English (en)
Other versions
CN111351757B (zh
Inventor
林俊良
温特济祖·埃勒雅尔德-奥昌蒂瑙
阮氏金银
舒鲁蒂·戈帕尔克里希纳·基尼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wilmar International Ltd
Original Assignee
Wilmar International Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wilmar International Ltd filed Critical Wilmar International Ltd
Publication of CN111351757A publication Critical patent/CN111351757A/zh
Application granted granted Critical
Publication of CN111351757B publication Critical patent/CN111351757B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/02Food
    • G01N33/03Edible oils or edible fats
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/3577Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing liquids, e.g. polluted water
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/359Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/65Raman scattering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N2021/3595Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using FTIR
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biochemistry (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)

Abstract

根据实施方案,提供了用于预测食用油样品的油掺杂的定量量度的方法。所述方法包括:接收所述食用油样品的光谱数据的至少一部分;提供能够生成所述食用油样品中的掺杂物的预测的单一预测模型,其中所述单一预测模型是包括深度神经网络的非线性模型;以及使用所述单一预测模型处理所述光谱数据的所述至少一部分。根据进一步的实施方案,还提供了计算机可读存储介质,其包括计算机可读指令,所述计算机可读指令在由计算机执行时可操作用于预测所述食用油样品的油掺杂的定量量度。根据更进一步的实施方案,提供了用于预测食用油样品的油掺杂的定量量度的设备或系统。

Description

用于预测食用油样品的油掺杂的定量量度的方法和系统
相关申请的交叉引用
本申请要求2018年12月21日提交的新加坡专利申请号10201811511R的优先权,该专利申请以其全部内容并入本文参考。
技术领域
多个实施方案涉及用于预测食用油样品的油掺杂的定量量度的方法及用于其的设备或系统。
背景技术
油掺杂的预测已被广泛地公开。先前的出版物描述了例如在特级初榨橄榄油和芝麻油中的应用。
可以使用不同的技术来测定油掺杂,例如,基于DNA的标记筛选、使用傅立叶变换近红外(FT-NIR)、傅立叶变换中红外(FT-MIR)和拉曼光谱的快速筛选,或者预测模型。
在基于DNA的标记筛选中,将来自不同植物来源的DNA用于鉴定掺杂。该技术的优点是,DNA水平标记提供了不可反驳的掺杂证据。然而,基于DNA的标记筛选有几个不利的缺点。例如,该筛选技术是破坏性的过程,因此用于筛选的样品不能回收。此外,DNA提取是缓慢的过程并且需要大的样品量。最重要的是,由该类型的技术构建的模型主要是定性的,因为其难以从DNA中定量被掺加的油。
使用FT-NIR、FT-MIR和拉曼光谱的快速筛选使用通过透射或反射测量的光能量来检测样品中包含的化学标志(chemical signatures)。与基于DNA的标记筛选相比,该技术是快速且非破坏性的过程。可以建立定量模型来从丰富的数据集挖掘信息。主要缺点是与FT-NIR、FT-MIR或拉曼光谱相关的特征不是特定化合物存在的直接证据。因此,不确定性和不准确性的水平相对较高。
基于DNA标记的技术和快速筛选技术均提供了技术平台来提供特征丰富的数据集,但是这些技术并不能提供鉴别或预测结果的方式。因此,将提供数据采集的技术与建模技术相结合,以使得特征可以与样品的定性构成或样品的定量组成相关联。
对于油掺杂最常用的技术是称为偏最小二乘法(PLS)的线性计算方法。例如,PLS1是当PLS用于定量的单一结果而被建模时的情况。
先前的出版物已经描述了在多个单一结果上使用PLS1来模拟不同掺杂物的预测。在该出版物中,建立了四个模型来预测四种不同的掺杂物。
使用PLS1的缺点是必须证实多个预测结果,并且对结果的解释既不容易也不直接。例如,油1在油-A中掺杂了10%,但是有四种模型来预测油1、油2、油3和油4的掺杂。来源于模型1的预测可能给出正确的10%掺杂水平,但模型2至4也可能如此,每个模型都预测出非零的掺杂物水平。因此,鉴于有四种模型来评估,难以确定事实并区分哪种掺杂物被掺加。
PLS一般用于单一油结果的主要原因是掺杂一种油在光谱数据中生成线性特征。然而,当掺杂多于一种的油时,或者当存在多于一个品牌的油时,或者当油从不同的地理位置获得时,或者当油通过不同的加工技术获得时,所生成的信号可能是非线性的,因此使得PLS不适合预测更复杂的样品。
研发还集中在快速技术上,如通常具有掺杂的定性测定的FT-NIR、FT-MIR和拉曼光谱。掺杂的定量测定可能使用偏最小二乘法(例如,PLS-DA和PLS1)并以特异于一种掺杂物的方式进行建模。该过程可能需要对几个建模结果进行仔细的解释以辨认存在哪些特定的掺杂物,并且在多个模型上聚集的误差使得在工业应用中要求掺杂水平变得不切实际,因为其需要一定程度的人为干预来解释模型结果。
因此,需要预测油掺杂的定量量度并捕获不变的掺杂信息的方法和系统,从而至少解决上文提到的问题并满足能够推广到盲样品和盲品牌的工业需求。
发明内容
根据一个实施方案,提供了一种用于预测食用油样品的油掺杂的定量量度的方法。所述方法可以包括:接收所述食用油样品的光谱数据的至少一部分;提供能够生成所述食用油样品中的掺杂物的预测的单一预测模型,其中所述单一预测模型是包括深度神经网络的非线性模型;以及使用所述单一预测模型处理所述光谱数据的所述至少一部分。
根据一个实施方案,提供了一种计算机可读存储介质,其包括计算机可读指令,所述计算机可读指令在由计算机执行时可操作用于预测食用油样品的油掺杂的定量量度。可以将所述计算机可读指令配置为执行根据各种实施方案的方法。
根据一个实施方案,提供了一种设备或系统。所述设备或系统可以包括:接收单元,其被配置为接收食用油样品的光谱数据的至少一部分;存储器,其用于存储能够生成所述食用油样品中的掺杂物的预测的单一预测模型,其中所述单一预测模型是包括深度神经网络的非线性模型;以及处理器,其被配置为访问存储在所述存储器中的所述单一预测模型以执行根据多个实施方案的方法的步骤,以生成所述食用油样品中的油掺杂的定量量度的预测。
附图说明
在附图中,在不同的视图中,相同的附图标记通常指代相同的部分。附图不一定按比例绘制,而是通常将重点放在说明本发明的原理上。在以下描述中,参考以下附图描述了本发明的多个实施方案,其中:
图1A示出了说明根据多个实施方案的用于预测食用油样品的油掺杂的方法的流程图。
图1B示出了根据多个实施方案的用于预测食用油样品的油掺杂的设备或系统的示意图。
图2A至2N示出了表示最终PLS2实验结果的图表,其以量百分比的方式反映了花生油以及掺杂物大豆油和葵花油的预测分布。
图3A至3N示出了表示最终深度学习实验结果的图表,其以量百分比的方式反映了花生油以及掺杂物大豆油和葵花油的预测分布。
图4示出了根据一个实施方案的基于不同品牌测试的线性隐空间中的数据的图形表示。
图5示出了根据一个实施方案的基于不同品牌测试的非线性变换空间中的数据的图形表示。
图6A至6J示出了表示盲品牌测试的最终PLS2结果的图表,其以量百分比的方式反映了花生油以及掺杂物大豆油和葵花油的预测分布。
图7A至7J示出了表示盲品牌测试的最终深度学习结果的图表,其以量百分比的方式反映了花生油以及掺杂物大豆油和葵花油的预测分布。
图8示出了根据多个实施方案的深度学习模型的示意图。
图9A至9C示出了说明根据多个实施方案的实际掺杂与基于FT-NIR、基于拉曼光谱以及基于FT-NIR和拉曼光谱的组合的预测掺杂之间的关系的各自图表。
图10示出了说明从图9A至9C的分析获得的交叉验证均方根误差(RMSECV)的图表。
具体实施方式
以下详细描述参照附图进行,所述附图通过示例的方式示出了可以实施本发明的具体细节和实施方案。足够详细地描述这些实施方案,以使本领域技术人员能够实施本发明。在不脱离本发明范围的情况下,可以利用其它实施方案,并且可以进行结构、逻辑和电学方面的改变。多个实施方案不一定相互排斥,因为一些实施方案可以与一个或多个其它实施方案组合以形成新的实施方案。
在其中一种方法或装置/设备中的上下文中描述的实施方案对于其它方法或装置/设备类似地有效。相似地,在方法的上下文中描述的实施方案对于装置类似地有效,反之亦然。
在一个实施方案的上下文中描述的特征可以相应地适用于其它实施方案中相同或相似的特征。在一个实施方案的上下文中描述的特征可以相应地适用于其它实施方案,即便这些特征在这些其它实施方案中没有明确地描述。此外,针对一个实施方案的上下文中的特征描述的添加和/或组合和/或替换可以相应地适用于其它实施方案中的相同或相似特征。
在多个实施方案的上下文中,关于特征或要素使用的冠词“一种”、“一个”和“所述”包括对一个或多个所述特征或要素的引用。
在多个实施方案的上下文中,短语“基本上”可以包括“精确地”和合理的偏差。
在多个实施方案的上下文中,应用于数值的术语“约”或“近似”包括精确值和合理的偏差。
如本文所使用的,术语“和/或”包括一个或多个相关的列出项目的任意和所有组合。
如本文所使用的,“A或B中的至少一个”的形式的短语可以包括A或B,或者A和B两者。相应地,“A或B或C中的至少一个”或包括另外的列出项目的形式的短语,可以包括一个或多个相关的列出项目的任意和所有组合。
多个实施方案可以使用FT-NIR、FT-MIR和拉曼光谱上的深度学习模型来提供对油掺杂物的定量检测。
油掺杂物的检测是困难的任务。多个实施方案可以提供整合深度学习和FT-NIR/FT-MIR/拉曼光谱技术的应用,以检测样品中是否存在多种掺杂物,如果存在,则检测每种掺杂物的定量的量,从而解决工业需求的实际方面。例如,与偏最小二乘法相比,深度学习的其它优势在于,该技术能够学习数据中复杂的非线性结构,而这用线性模型是不可能的(如偏最小二乘法中那样,从而解决与构建多个PLS1模型相关的误差)。
与PLS相比,深度学习模型可以非常好地处理数据中的非线性结构。也可以处理多种掺杂油。深度学习需要训练足够大的数据集以至少使过度拟合最小化或避免过度拟合。
多个实施方案提供了包括快速测试FT-NIR、FT-MIR、拉曼光谱和深度学习模型在内的技术的组合以预测掺杂的定量量度,例如,在可能掺杂了未知油的情况下实现掺杂油的类型的(定性的)精确检测,以及在添加了两种或更多种掺杂物的情况下实现掺杂物质的精确定量。换言之,可以实现对多于一种掺杂物的油掺杂的精确预测。
图1A示出了说明根据多个实施方案的用于预测食用油样品的油掺杂的定量量度的方法100的流程图。在图1A中,在步骤102中,接收食用油样品的光谱数据的至少一部分。在步骤104中,提供能够生成食用油样品中掺杂物的预测的单一预测模型。在步骤106中,使用单一预测模型处理光谱数据的所述至少一部分。
在多个实施方案的上下文中,术语“被处理/加工”或“处理/加工”可以意指分析或数学评估。
方法100可以是预测食用油样品中的多于一种掺杂物,换言之,食用油样品中的至少两种掺杂物的方法。
多个实施方案可以在一个单一模型中提供对多个定量掺杂物结果的建模。这有利地解决了在使用PLS1时面临的问题,其中在PLS1中,将多个模型应用于预测掺杂,并且必需对结果进行进一步的人工解释。
例如,单一预测模型可以是线性模型。两个变量的定量预测可以使用PLS2来实现。PLS2相对不常见,甚至更显然不知道其用于预测油掺杂。通常,与PLS1相比,PLS2能够实现通常不需要进一步的人工确证的结果预测,并且可以更容易地进行解释。
在一个实施方案中,单一预测模型可以是非线性模型。单一预测模型可以包括深度神经网络(DNN)。DNN可以在输入层与输出层之间具有多个层。DNN可以是前馈网络,其中数据从输入层流向输出层,而不回送。输入层可以接收一个或多个输入。中间层可以是专门的。例如,中间层可以包括卷积层,所述卷积层在光谱内自动找到特征图(总结数据特征)。输出层可以提供一个或多个输出。例如,可以监督深度神经网络。
单一预测模型可用于对复杂性状建模,并考虑不同的油品牌、加工技术、地理位置和其它变量。认为这些性状导致(光谱)数据具有非线性结构。深度学习模型旨在发现非线性模式,从而为分析和评估数据的非线性提供了非常好且有用的工具。
多个实施方案可以通过影响模型例如从来自特定油品牌的完整信息中学习到的内容来预测随机油品牌,从而提供另外的模型训练策略的开发。这样,根据多个实施方案的方法100可以使得单一预测模型能够满足工业需求,包括推广到不同的品牌特定性状的掺杂的预测。
在多个实施方案中,单一预测模型可以由特征的矩阵进行训练,其中每个特征对应于在特定波数的光谱数据的强度。光谱数据可以基于训练实例,所述训练实例可以包括食用油样品的加工技术,或者食用油样品的品牌,或者获得食用油样品的地理位置,或其任意组合。
在多个实施方案中,食用油样品可以选自花生油样品、橄榄油样品、玉米油样品、椰子油样品、棉籽油样品、棕榈油样品、芥花油样品、红花油样品、芝麻油样品、大豆油样品、葵花油样品、山茶籽油样品、胡麻籽(亚麻籽)油样品,以及具有相对较高比例的某些脂肪酸的油样品,例如,高芥酸菜籽油、低芥酸菜籽油或高油酸葵花油。
例如,食用油样品可以是花生油样品。
在多个实施方案中,方法100可以进一步包括生成食用油样品中的至少两种掺杂物的预测。换言之,单一预测模型的输出层可以提供所述至少两种掺杂物或变量的多个输出。
在多个实施方案的上下文中,术语“生成”可以意指“确定”。
所述至少两种掺杂物的预测可以基本上同时生成。不需要数据的进一步确证和人工干预。
所述预测可以包括所述至少两种掺杂物中的每一种的至少类型或百分比量。
在多个实施方案中,方法100可以进一步包括在接收光谱数据的所述至少一部分之前,使用FT-NIR、FT-MIR或拉曼光谱获得光谱数据。
例如,光谱数据可以包括FT-NIR、FT-MIR或拉曼光谱数据。光谱数据可以表示在特定波数的生育酚/生育三烯酚带,或脂肪酸的酸值,或过氧化值,或聚合物化合物等。特定波数可以为4476至9008。
可以例如通过基线位移的校正、用于缩放样品中的数据的标准正态变量变换、或者用于缩放样品间的数据的多元散射校正以及Savitzky-Goly滤波器来预处理光谱数据。可以将滤波器进一步配置成模拟更平滑的一阶或二阶导数信号。
虽然将上述方法示出和描述为一系列步骤或事件,但是应当理解,这样的步骤或事件的任何顺序都不应以限制性的意义来解释。例如,一些步骤可以以不同的顺序发生和/或与除本文示出和/或描述的步骤或事件以外的其它步骤或事件同时发生。此外,可能不需要所有示出的步骤来实现本文所述的一个或多个方面或实施方案。此外,本文所述的一个或多个步骤可以在一个或多个单独的动作和/或阶段中进行。
多个实施方案进一步提供了一种计算机可读存储介质,其包括计算机可读指令,所述计算机可读指令在由计算机执行时可操作用于预测食用油样品的油掺杂的定量量度。根据多个实施方案,可以将计算机可读指令配置为执行方法100。
图1B示出了根据多个实施方案的用于预测食用油样品的油掺杂的设备或系统120的示意图。在图1B中,设备或系统120包括:接收单元122,其被配置为接收食用油样品的光谱数据的至少一部分;存储器124,其用于存储能够生成食用油样品中的掺杂物的预测的单一预测模型;以及处理器126,其被配置为访问存储在存储器124中的单一预测模型以执行根据多个实施方案的方法100的步骤(图1A),以生成食用油样品中的油掺杂的定量量度的预测。接收单元122、存储器124和处理器126可以彼此通信,如线128、130所示。通信可以是双向的。单一预测模型可以是包括深度神经网络的非线性模型。
设备或系统120可以包括与在图1A的方法100中描述的那些相同或相似的元件或部件,因此,相似的元件可以与在图1A的方法100的上下文中描述的相同,因此这里省略了相应的描述。
以下将以所进行的实验的形式描述实施例,以提供对方法100和设备或系统120的更好理解。
样品和样品制备
用掺杂物大豆油和掺杂物葵花油掺加纯花生油样品。掺杂率以5%的增量从5%增加到50%。允许二元和三元共混,因此增加了实验的复杂性,但也增加了特征丰富的数据集。例如,三元共混物允许多达O(n2)这一量级的多种组合。
使用多达两个的不同玻璃瓶和多达六次的玻璃瓶不同旋转,对每个共混物进行重复测量,以获得给定样品的示例光谱。对20个混有大豆和葵花油的花生油样品进行分析,总共产生977个光谱。光谱、更具体地是FT-NIR光谱用一阶导数预处理并用信号正态变量来变换。
深度学习模型
构建了深度学习模型以对花生油中大豆油和葵花油的定量掺杂进行建模。所述模型包括多个层,每一层都与数学变换相关联。所述模型找到了正确的数学变换来将输入(例如,光谱或光谱数据)转换成输出。所述模型可以通过用计算输出的概率来遍历所述层而识别正确的数学变换。
在简单的形式中,对于数学变换,每个深度学习模型包括特征(f1至fX)的矩阵,每个特征由权重来运算。权重可以表示对输出的影响程度,或者可以与对输出的影响程度相关。这些特征可以对应于在不同波数的FT-NIR光谱强度。应当理解,也可以考虑本文没有提到的其它特征。
更具体地,深度学习模型,或者可互换地称为深度神经网络,接受光谱作为输入。每个神经网络层由多个节点表示,用随机权重初始化。通过正向传播过程,数据输入通过与节点关联的权重相乘而流经该网络。合适的激活函数转换该结果,从而可以对非线性进行建模。激活函数可以是sigmoid函数或tanh函数。每一层也可以由专门的节点例如卷积节点来表示,所述卷积节点将光谱转换成特征图(即,光谱内具有辨别信号的区域)。应当理解,层的顺序不是限制性的。该过程可以在网络中的多个层上重复,直到最终到达输出层,在所述输出层中累计结果以表示油及其(一种或多种)掺杂物的定量比例。图8示出了根据多个实施方案的深度学习模型800的图示。在图8中,输入im,802包括m个数量的特征,例如,用于建模的光谱的强度。隐藏节点hr,k,804的大小为r和k,表示隐藏节点804的深度和宽度。每个隐藏节点804(如虚线区域806中展开和描绘的)计算由Σ808表示的权重w之和,并应用激活函数f 810来估计数据中的非线性关系。如果隐藏节点属于卷积类型的层,则权重对应于滤波器,当应用于输入时,所述滤波器创建特征图。输出os包括用于估计油和掺杂物的定量的s个数量的输出。输出的初始估计通常具有大的误差,因为网络800的节点(例如,804)被初始分配随机权重。反向传播算法重新调整这些权重w,从而可以减少输出812中的误差。这种正向传播和反向传播的迭代过程改变深度神经网络800中的权重w,直到误差足够小,或者直到误差已经停止减小。为了防止数据的过度拟合,通常可以为正向传播保存一组分发数据,以基本上同时检查未在深度神经网络800上训练的独立数据集上的误差是否也具有足够小的误差。
在光谱没有进行预处理的情况下,例如如上所述,可能包括配置在网络前面的一维卷积神经网络节点,以便可以学习合适的滤波器来“自动地”预处理数据以获得更高质量的辨别信号。应当理解,层的顺序不是限制性的。
PLS2模型
PLS2模型是线性模型。PLS2对应于有几个因变量的情况。这不同于PLS1,PLS1对应于只有一个因变量的情况。对于PLS1,将特征X投影到隐变量空间T和一个因变量y中。对于PLS2,特征X和因变量Y二者都是矩阵,并且都被投影到隐变量空间T和U中,其中回归模型可用于确保协方差最大化。
实验—A部分
深度学习模型和PLS2模型中的每一种均通过交叉验证进行训练,并以下面两种方式进行:
(i)划分90%的数据用于训练,10%的样品用于盲法测试;
(ii)使用90%的油品牌进行训练,使用10%的盲品牌进行测试。
图2A至2N示出了表示最终PLS2结果(基于上述方式(i))的图表,其以量百分比的方式反映了花生油以及掺杂物大豆油和葵花油的预测分布。每种情况的实际比值见下表1。
表1
花生油、大豆油和葵花油的实际比值
2A 100:0:0
2B 60:0:40
2C 70:15:15
2D 80:10:10
2E 90:10:0
2F 50:0:50
2G 60:40:0
2H 70:30:0
2I 80:20:0
2J 90:5:5
2K 50:50:0
2L 70:0:30
2M 80:0:20
2N 90:0:10
图3A至3N示出了表示最终深度学习结果的图表,其以量百分比的方式反映了花生油以及掺杂物大豆油和葵花油的预测分布。每种情况的实际比值见下表2。
表2
Figure BDA0002327630640000101
Figure BDA0002327630640000111
将两种模型的最终结果相互比较以反映准确性的对比。
从最终的PLS2结果可以观察到,一些样品的预测可能不能正确反映实际百分比。例如,在图2B中,实际40%的葵花油的一些预测值可能超过55%,而这更接近花生油的实际百分比(60%)。这可能导致样品中掺杂的类型和量的预测的不确定性。然而,PLS2模型可能适用于掺杂水平相对较低且不同掺杂物的区分不是至关重要的油样品。
相比之下,图3B示出了使用深度学习模型的约40%的一致预测值,其接近于实际的40%的葵花油。
根据最终结果,深度学习模型预测达到了高得多的准确性。当掺杂的量与被测试的油样品的量相当时,这就更加明显了。
深度学习模型旨在用于非线性模式探索,并在非线性变换空间上工作,而PLS2模型则在线性隐空间上工作。
图4示出了线性隐空间中的数据的图形表示(基于上面的方式(ii),更具体地,基于不同品牌测试)。图4右侧的图例示出了花生油、大豆油和葵花油的各自百分比量,将其分组为a组、b组和c组以便于识别图4中的不同绘图点。白色背景的矩形标签表示不同品牌的油样品,所述油样品可能涉及不同的加工技术,和/或可能从不同的地理位置获得,以及其它变量。例如,标签SG可以表示从西班牙的圣格洛丽亚(Santa Gloria)获得的油品牌。
从a组、b组和c组观察到,PLS2模型(其为线性方法)能够充分区分不同水平的油掺杂。然而,从图4中的a组进一步观察到,表示含有低水平掺杂物的不同油品牌的绘图点在线性隐空间中形成大的散布或分布。这表明,如果被测试的油品牌不同于用于构建PLS2模型的油品牌,那么PLS2模型可能不适用于测定油掺杂。换言之,在线性隐空间中,数据可以区分出所期望的掺杂模式。然而,加工技术、品牌、地理位置和其它变量的影响并没有被视为不变的模式。
图5示出了非线性变换空间中的数据的图形表示(基于上面的方式(ii),更具体地,基于不同品牌测试)。图5右侧的图例示出了花生油、大豆油和葵花油的各自百分比量,将其分组为d组、e组和f组以便于识别图5中的不同绘图点。类似于图4,图5中具有白色背景的矩形标签表示不同品牌的油样品,所述油样品可能涉及不同的加工技术,和/或可能从不同的地理位置获得,以及其它变量。
从d组、e组和f组观察到,深度学习模型能够充分区分不同水平的油掺杂。更重要的是,从图5中的d组观察到,含有低水平掺杂物的不同油品牌的绘图点集中在非线性变换空间中。这表明,深度学习模型能够对复杂的性状进行建模,并考虑不同的油品牌、加工技术、地理位置和其它变量。换言之,在非线性变换空间中,品牌(地理位置和加工类型)的影响成为不变量。
深度学习模型还考虑了盲品牌,这在PLS2模型中是不可能的。
图6A至6J示出了表示最终PLS2结果的图表(基于上面的方式(ii),更具体地,盲品牌测试),其以量百分比的方式反映了花生油以及掺杂物大豆油和葵花油的预测分布。在图6A至6J中,花生油和掺杂物中的每一者均由三组不同的阴影602、604、606表示。每组602、604、606可以与不同的品牌相关联,所述品牌可以表示不同的地理位置或不同的加工类型。每种情况的实际比值见下表3。
表3
Figure BDA0002327630640000121
Figure BDA0002327630640000131
图7A至7J示出了表示盲品牌测试的最终深度学习结果的图表,其以量百分比的方式反映了花生油以及掺杂物大豆油和葵花油的预测分布。在图7A至7J中,花生油和掺杂物中的每一者均由三组不同的阴影602、604、606表示。每组602、604、606可以与不同的品牌相关联,所述品牌可以表示不同的地理位置或不同的加工类型。每种情况的实际比值见下表4。
表4
花生油、大豆油和葵花油的实际比值
7A 50:0:50
7B 60:40:0
7C 80:0:20
7D 90:10:0
7E 50:50:0
7F 70:0:30
7G 80:20:0
7H 60:0:40
7I 70:30:0
7J 90:0:10
将来自两种模型的盲品牌测试的最终结果相互比较以反映准确性的对比。
发现深度学习模型能够提供一致的结果,尽管油是不同品牌的,而PLS2模型结果表明了不同的油品牌影响预测值。
表5示出了在三组代表性阴影602、604、606中的每一者中使用的示例性样品的概要。
表5
Figure BDA0002327630640000141
Figure BDA0002327630640000151
Figure BDA0002327630640000161
HM:自制花生油
通过将光电子学方法与机器学习相结合,进行了上述混合实验(A部分)来检测油的掺杂(>=2种掺杂物)。实验结果表明,在盲法测试时,能够以约5%的灵敏度检测两种或更多种掺杂物。这些混合实验中出现的误差明显低于使用常规或现有方法或系统时出现的误差。因此,根据多个实施方案的方法或设备/系统提供了改进的技术效果。此外,从以上混合实验(A部分)得出的结论是,根据多个实施方案的方法或设备/系统与感兴趣的主要油(在这种情况下是花生油)的品牌无关。
本实验已经如下面实验(B部分)中解释的那样进行了修改,连同结果一起,以证明以下附加要点:
·与掺杂油的品牌无关;
·能够推广到另外的掺杂油类型(玉米),其中所述另外的掺杂油类型更普遍地掺杂到花生油中;
·能够推广到其它光电子学技术;
·能够超过如以上实验(A部分)所示的5%的检测极限。
实验—B部分
掺杂了22个品牌的玉米油的一个品牌的花生油。掺杂以1%的增量从85%增加到99%。根据以下光电子学技术对三种不同类型的数据进行了分析:FT-NIR、FT-MIR(傅里叶变换中红外)和拉曼光谱。
对来自相应样品的数据如下所述进行建模。
根据实验(A部分)中的步骤对每种光电子学技术分别进行数据预处理、机器学习和建模,另外的不同之处在于:
·将来自三种光电子学技术的数据合并以测试和确定模型是否变得更加灵敏。
·在合并前使用来自每种技术的交叉验证进行变量选择,以避免源自大量特征的过度拟合或至少使源自大量特征的过度拟合最小化。
·因此,预处理的数据是具有n行样品和m个特征(从原始数据规约而来,其中m=x+y+z,x个特征来自FT-NIR,y个特征来自FT-MIR,z个特征来自拉曼光谱)的数据矩阵,深度学习模型(如本文所述)从所述数据矩阵中学习为了预测掺杂物玉米油所需的参数。
·基于20%的玉米油品牌构建了盲数据集以确保所述模型与油无关。将来自剩余80%的掺入花生油中的玉米油品牌的数据用于构建深度学习模型。
图9A至9C示出了说明实际掺杂与基于FT-NIR、FT-MIR和拉曼光谱的预测掺杂之间的关系的图表。X轴和Y轴表示任意值(从0到15的范围),分别表示85%至99%之间的掺杂。
从图9A至9C中,数据分析表明,每种技术都以约5%误差界限的高灵敏度检测掺杂,甚至当物理掺杂为1%时也是如此。当将数据组合时,所述模型能够将该误差界限降低到低于5%,表明多模态光电子学数据用于改进检测的效用,并且技术效果进一步提高。例如,对于FT-NIR和拉曼光谱法,单个技术(或方法)的交叉验证均方根误差(RMSECV)分别为0.54和1.30。当将这些技术(即FT-NIR和拉曼光谱法)组合时,RMSECV降低到0.02,如图10所示。所述模型也与玉米油品牌无关,因此表明所述模型可能与主要油品牌和掺杂物品牌都无关。
为了分析不同的油样品的影响,使单独的一组含有山茶籽油和掺杂物高油酸葵花(HOSF)油的样品用于盲品牌测试的两个模型。所获得的结果表明了当使用多模技术并且多模技术与山茶籽油品牌或高油酸葵花油品牌无关时的RMSECV的类似的减小,导致与对于花生油样品以及大豆油和葵花油掺杂物相同的结论,从而反映了深度学习模型准确地预测不同油类型样品中的油掺杂物的能力,而与油品牌无关。
虽然已经参照具体实施方案特别地示出和描述了本发明,但是本领域技术人员应当理解,在不脱离由所附权利要求限定的本发明的精神和范围的情况下,可以在其中进行形式和细节上的多种改变。因此,本发明的范围由所附权利要求指定,并且因此旨在包括落入权利要求的等同含义和范围内的所有改变。

Claims (10)

1.一种用于预测食用油样品的油掺杂的定量量度的方法,所述方法包括:
接收所述食用油样品的光谱数据的至少一部分;
提供能够生成所述食用油样品中的掺杂物的预测的单一预测模型,其中所述单一预测模型是包括深度神经网络的非线性模型;以及
使用所述单一预测模型处理所述光谱数据的所述至少一部分。
2.根据权利要求1所述的方法,其中从特征的矩阵构建所述单一预测模型,其中每个特征对应于在特定波数的所述光谱数据的强度。
3.根据权利要求1或2所述的方法,其中所述食用油样品选自花生油样品、橄榄油样品、玉米油样品、椰子油样品、棉籽油样品、棕榈油样品、芥花油样品、红花油样品、芝麻油样品、大豆油样品、葵花油样品、山茶籽油样品、胡麻籽(亚麻籽)油样品以及具有相对较高比例的某些脂肪酸的油样品,包括高芥酸菜籽油、低芥酸菜籽油或高油酸葵花油。
4.根据权利要求3所述的方法,其中所述食用油样品是花生油样品。
5.根据前述权利要求中任一项所述的方法,进一步包括生成所述食用油样品中的至少两种掺杂物的预测。
6.根据权利要求5所述的方法,其中所述至少两种掺杂物的所述预测基本上同时生成。
7.根据权利要求5或6所述的方法,其中所述预测包括所述至少两种掺杂物中的每一种的类型和百分比量。
8.根据前述权利要求中任一项所述的方法,进一步包括在接收光谱数据的至少一部分之前,使用傅里叶变换近红外(FT-NIR)、傅立叶变换中红外(FT-MIR)或拉曼光谱获得所述光谱数据。
9.一种计算机可读存储介质,包括计算机可读指令,所述计算机可读指令在由计算机执行时可操作用于预测食用油样品的油掺杂的定量量度,所述计算机可读指令被配置为执行根据权利要求1至8中任一项所述的方法。
10.一种设备或系统,包括:
接收单元,其被配置为接收食用油样品的光谱数据的至少一部分;
存储器,其用于存储能够生成所述食用油样品中的掺杂物的预测的单一预测模型,其中所述单一预测模型是包括深度神经网络的非线性模型;以及
处理器,其被配置为访问存储在所述存储器中的所述单一预测模型以执行根据权利要求1至8中任一项所述的方法的步骤,以生成所述食用油样品中的油掺杂的定量量度的预测。
CN201911322867.8A 2018-12-21 2019-12-20 用于预测食用油样品的油掺杂的定量量度的方法和系统 Active CN111351757B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
SG10201811511R 2018-12-21
SG10201811511RA SG10201811511RA (en) 2018-12-21 2018-12-21 Method and system for predicting oil adulteration of an edible oil sample

Publications (2)

Publication Number Publication Date
CN111351757A true CN111351757A (zh) 2020-06-30
CN111351757B CN111351757B (zh) 2023-09-05

Family

ID=71102951

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911322867.8A Active CN111351757B (zh) 2018-12-21 2019-12-20 用于预测食用油样品的油掺杂的定量量度的方法和系统

Country Status (3)

Country Link
CN (1) CN111351757B (zh)
SG (1) SG10201811511RA (zh)
WO (1) WO2020130947A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111487384A (zh) * 2019-01-28 2020-08-04 丰益国际有限公司 处理至少一种油样品的脂质含量并模拟至少一种训练样品及预测掺合配方等的方法和系统

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113406249B (zh) * 2021-06-16 2022-04-05 江南大学 一种预测茶油中掺假油种类的方法
CN113588596A (zh) * 2021-08-25 2021-11-02 浙江大学 一种鱼粉中掺假动物源蛋白粉鉴别和含量检测方法及系统
CN114088837A (zh) * 2021-11-22 2022-02-25 青海大学 一种基于甘三酯指纹图谱的亚麻籽油掺假检测方法及其应用

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101995392A (zh) * 2010-11-15 2011-03-30 中华人民共和国上海出入境检验检疫局 快速检测橄榄油掺伪的方法
CN103398970A (zh) * 2013-07-24 2013-11-20 骆驰 一种定性和定量分析食用油并进而检测地沟油的方法
CN105136735A (zh) * 2015-09-07 2015-12-09 天津工业大学 一种用于三元掺伪芝麻油含量的快速、无损分析方法
CA2979083A1 (en) * 2015-03-11 2016-09-15 Hormoz Azizian Method and technique for verification of olive oil composition
CN106525760A (zh) * 2016-10-27 2017-03-22 天津工业大学 一种用于六元调和油定量分析的方法
US20170299506A1 (en) * 2016-04-18 2017-10-19 Hormoz Azizian Verification Of Olive Oil Composition
CN107727590A (zh) * 2017-09-27 2018-02-23 天津工业大学 一种多元调和油快速无损的定量分析方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103293234B (zh) * 2012-03-01 2014-12-31 河南工业大学 结合单标号学习和多标号学习的食用油掺伪鉴别方法
CN102636454B (zh) * 2012-05-15 2015-08-12 武汉轻工大学 近红外光谱快速测定食用油中低碳数脂肪酸含量的方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101995392A (zh) * 2010-11-15 2011-03-30 中华人民共和国上海出入境检验检疫局 快速检测橄榄油掺伪的方法
CN103398970A (zh) * 2013-07-24 2013-11-20 骆驰 一种定性和定量分析食用油并进而检测地沟油的方法
CA2979083A1 (en) * 2015-03-11 2016-09-15 Hormoz Azizian Method and technique for verification of olive oil composition
CN105136735A (zh) * 2015-09-07 2015-12-09 天津工业大学 一种用于三元掺伪芝麻油含量的快速、无损分析方法
US20170299506A1 (en) * 2016-04-18 2017-10-19 Hormoz Azizian Verification Of Olive Oil Composition
CN106525760A (zh) * 2016-10-27 2017-03-22 天津工业大学 一种用于六元调和油定量分析的方法
CN107727590A (zh) * 2017-09-27 2018-02-23 天津工业大学 一种多元调和油快速无损的定量分析方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
DIEGO L.等: "Using H-1 and C-13 NMR techniques and artificial neural networks to detect the adulteration of olive oil with hazelnut oil", 《EUROPEAN FOOD RESEARCH AND TECHNOLOGY》 *
DIEGO L.等: "Using H-1 and C-13 NMR techniques and artificial neural networks to detect the adulteration of olive oil with hazelnut oil", 《EUROPEAN FOOD RESEARCH AND TECHNOLOGY》, vol. 219, 12 August 2004 (2004-08-12) *
NEVA GROSELJ等: "The Use of FT-MIR Spectroscopy and Counter-Propagation Artificial Neural Networks for Tracing the Adulteration of Olive Oil", 《ACTA CHIMICA SLOVENICA》 *
NEVA GROSELJ等: "The Use of FT-MIR Spectroscopy and Counter-Propagation Artificial Neural Networks for Tracing the Adulteration of Olive Oil", 《ACTA CHIMICA SLOVENICA》, vol. 55, no. 4, 31 December 2008 (2008-12-31), XP055721656 *
陈雯柏: "《人工神经网络原理与实践》", 31 January 2016, 西安电子科技大学出版社, pages: 53 - 55 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111487384A (zh) * 2019-01-28 2020-08-04 丰益国际有限公司 处理至少一种油样品的脂质含量并模拟至少一种训练样品及预测掺合配方等的方法和系统

Also Published As

Publication number Publication date
SG10201811511RA (en) 2020-07-29
WO2020130947A1 (en) 2020-06-25
CN111351757B (zh) 2023-09-05

Similar Documents

Publication Publication Date Title
CN111351757B (zh) 用于预测食用油样品的油掺杂的定量量度的方法和系统
Rossel et al. Predicting soil properties from the Australian soil visible–near infrared spectroscopic database
Duarte et al. Analyzing community‐weighted trait means across environmental gradients: should phylogeny stay or should it go?
Ferré et al. Net analyte signal calculation for multivariate calibration
Guerrero et al. Assessment of soil organic carbon at local scale with spiked NIR calibrations: effects of selection and extra‐weighting on the spiking subset
Mander et al. Classification of grass pollen through the quantitative analysis of surface ornamentation and texture
CN103534578B (zh) 确定样本中存在的成分的光谱装置以及方法
de Santana et al. Comparison of PLS and SVM models for soil organic matter and particle size using vis-NIR spectral libraries
Wadoux et al. Soil spectral inference with r
CN105510249A (zh) 校准曲线创建装置、目标成分校准装置、及电子设备
Bricklemyer et al. Comparing vis–NIRS, LIBS, and combined vis–NIRS‐LIBS for intact soil core soil carbon measurement
CN108830253B (zh) 筛选模型建立方法、光谱筛选装置及方法
US10495778B2 (en) System and methods for cross-tool optical fluid model validation and real-time application
Allegrini et al. Generalized error-dependent prediction uncertainty in multivariate calibration
Campos et al. Advanced predictive methods for wine age prediction: Part II–A comparison study of multiblock regression approaches
Pittaki‐Chrysodonta et al. Evaluating three calibration transfer methods for predictions of soil properties using mid‐infrared spectroscopy
Lopes et al. New insights into time series analysis-II-Non-correlated observations
Sales et al. Multivariate standardization techniques using UV-Vis data
CN111487384A (zh) 处理至少一种油样品的脂质含量并模拟至少一种训练样品及预测掺合配方等的方法和系统
CN114184599A (zh) 单细胞拉曼光谱采集数目估计方法、数据处理方法及装置
Andrade‐Garda et al. Partial Least‐Squares Regression
CN113567605A (zh) 质量色谱图的自动化解释模型构建方法、装置和电子设备
Zhang et al. Artificial neural networks based on genetic input selection for quantification in overlapped capillary electrophoresis peaks
CN102542284A (zh) 辨识光谱的方法
Hayward et al. phytoclass: A pigment‐based chemotaxonomic method to determine the biomass of phytoplankton classes

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Lin Junliang

Inventor after: Wentzizu eljard ochandiano

Inventor after: Ruan Shijinyin

Inventor after: Shuruti goparkrishna Gini

Inventor before: Lin Junliang

Inventor before: Wentzizu elyard ochantinau

Inventor before: Ruan Shijinyin

Inventor before: Shuruti goparkrishna Gini

GR01 Patent grant
GR01 Patent grant