CN113196053A - 信息处理装置、信息处理装置的控制方法及程序 - Google Patents

信息处理装置、信息处理装置的控制方法及程序 Download PDF

Info

Publication number
CN113196053A
CN113196053A CN201980083701.7A CN201980083701A CN113196053A CN 113196053 A CN113196053 A CN 113196053A CN 201980083701 A CN201980083701 A CN 201980083701A CN 113196053 A CN113196053 A CN 113196053A
Authority
CN
China
Prior art keywords
information
spectrum
processing apparatus
information processing
measured substance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980083701.7A
Other languages
English (en)
Inventor
河村英孝
田谷彰大
吉正泰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of CN113196053A publication Critical patent/CN113196053A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/33Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using ultraviolet light
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/3577Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing liquids, e.g. polluted water
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/65Raman scattering
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N23/00Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00
    • G01N23/02Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00 by transmitting the radiation through the material
    • G01N23/06Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00 by transmitting the radiation through the material and measuring the absorption
    • G01N23/083Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00 by transmitting the radiation through the material and measuring the absorption the radiation being X-rays
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N23/00Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00
    • G01N23/20Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00 by using diffraction of the radiation by the materials, e.g. for investigating crystal structure; by using scattering of the radiation by the materials, e.g. for investigating non-crystalline materials; by using reflection of the radiation by the materials
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N23/00Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00
    • G01N23/22Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00 by measuring secondary emission from the material
    • G01N23/223Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00 by measuring secondary emission from the material by irradiating the sample with X-rays or gamma-rays and by measuring X-ray fluorescence
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/62Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode
    • G01N27/622Ion mobility spectrometry
    • G01N27/623Ion mobility spectrometry combined with mass spectrometry
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2201/00Features of devices classified in G01N21/00
    • G01N2201/12Circuits of general importance; Signal processing
    • G01N2201/129Using chemometrical methods
    • G01N2201/1296Using chemometrical methods using neural networks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8624Detection of slopes or peaks; baseline correction
    • G01N30/8631Peaks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8693Models, e.g. prediction of retention times, method development and validation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Electrochemistry (AREA)
  • Toxicology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)

Abstract

信息处理装置辅助用户关于使用学习模型估计的与被测物质有关的定量信息的判断。信息处理装置包括信息获取部和可靠性获取部。信息获取部通过将包含被测物质和杂质的样品的频谱信息输入到学习模型中来获取与被测物质有关的定量信息。可靠性获取部获取与所获取的与被测物质有关的定量信息相关的可靠性。

Description

信息处理装置、信息处理装置的控制方法及程序
技术领域
本发明涉及信息处理装置、信息处理装置的控制方法及其程序。
背景技术
频谱分析被广泛用作获知各种样品中包含的特定成分(以下称为“被测物质”)的浓度或量的方法。频谱分析使得能够检测当对样品给予某种刺激时生成的响应,使得能够基于获得的信号来获得关于构成样品的成分的信息(频谱信息)。频谱信息是各自具有温度、质量和特定质量的计数碎片的数量,以及包括光的电磁波的强度,这些特征表征了刺激和响应。频谱分析还包括使用电子碰撞作为刺激来记录通过分解生成的碎片的质量的量并获得诸如结构的信息。
对于频谱分析,存在如下方法:通过在预先使用成分之间的三维尺寸、电荷、亲水性或疏水性等的差异尝试分离之后,利用电磁波进行辐射,来进行分析。该方法称为分离分析。例如,在液相色谱法(以下称为HPLC)中,通过优化分析条件(诸如柱种类、流动相种类、温度、流速等),来从其他物质(以下称为杂质)中分离被测物质。然后,通过测量分离的被测物质的频谱能够获知浓度和量。另外,在难以从杂质中分离被测物质的情况下,可以预先进行去除一部分杂质的预处理,或者可以考虑优化分离条件。除非通过预处理或优化分离条件就能够实现与杂质的分离,否则将尝试通过算术处理进行的峰分割。
作为传统的峰分割方法,存在设置基线的方法、通过使用峰之间的最小值进行垂直分割的方法、以及通过使用专利文献1和专利文献2中描述的最小二乘法来拟合和分割诸如高斯函数的适当函数的方法。
在这方面,HPLC通常用于分析生物样品。然而,由于在生物样品(诸如尿液和血液)中具有很多杂质,并且存在包含源自摄入物的未知杂质的情况,因此,需要操作人员熟悉考虑从杂质中分离被测物质的分离条件、预处理和峰分割方法等。
另外,存在许多如下情况:诸如在食品中的农药残留的分析和环境分析中,样品包含大量的杂质。因此,强烈需要如下方法:使得即使是初学者也能够简单而准确地分析杂质样品中的被测物质,而无需预处理。
引用列表
专利文献
专利文献1:日本特开平6-324029号公报
专利文献2:日本特开2006-177980号公报
专利文献3:日本特开2018-152000号公报
发明内容
技术问题
如上所述,传统上,为了从频谱信息中获取诸如被测物质的浓度和量的定量信息,需要用于分离杂质的预处理和诸如峰分割方法的算术处理。因此,可以想到的是,用户使用基于包括被测物质的样品的频谱信息的学习模型来计算定量信息。用户基于经验等确定计算结果是否准确,如果计算结果不确定,则用户改变分析条件或预处理,并再次从分析开始重复计算流程。因此,即使计算结果不准确,也可以照原样采用计算值,或者相反,可能进行不必要的重新分析。
本发明的目的是辅助用户确定通过使用学习模型估计的被测物质的定量信息。
要注意的是,本发明的目的不限于上述目的,并且本说明书的公开内容的其他目的之一是:实现从稍后在实施例的描述中所描述的构造得到的、且无法通过传统技术实现的功能/效果。
解决问题的技术方案
根据本发明的信息处理装置包括以下部件。具体地,信息处理装置包括:信息获取部,其用于获取通过将包含被测物质和杂质的样品的频谱信息输入到学习模型中而估计的所述被测物质的定量信息;以及可靠性获取部,其用于获取所获取的被测物质的定量信息的可靠性。
本发明的有利效果
本发明使得能够辅助用户确定通过使用学习模型估计的被测物质的定量信息。
附图说明
[图1]是示出根据第一实施例的包括信息处理装置的信息处理系统的整体构造的示例的图。
[图2]是示出第一实施例中的与学习模型的生成有关的处理过程的流程图的示例的图。
[图3]是示出第一实施例中的用于获取可靠性的处理过程的流程图的示例的图。
[图4A]是示出第一实施例中的样品的频谱信息的示例的图。
[图4B]是示出第一实施例中的样品的频谱信息的示例的图。
[图5]是示出第一实施例中的Δ值与相关系数之间的对应关系的示例的图。
[图6]是示出第一实施例中的用于显示被测物质的定量信息和可靠性的画面的示例的图。
[图7]是示出根据第二实施例的包括信息处理装置的信息处理系统的整体构造的示例的图。
[图8]是用于描述第二实施例中的分类学习模型的图。
[图9A]是示出示例1的仿真结果的图。
[图9B]是示出示例2的仿真结果的图。
[图9C]是示出示例3的仿真结果的图。
具体实施方式
下文中将参照附图描述用于执行本发明(实施例)的形式。然而,本发明的范围不限于下述实施例。
[第一实施例]
在描述第一实施例之前,首先描述术语。
(样品)
本实施例中的样品是包含多种类型化合物的混合物。在本实施例中,假设样品包含被测物质和其他物质(杂质)。对样品没有特别限制,只要样品是混合物即可。另外,不需要识别混合物的成分,并且可以包含未知成分。例如,可以是诸如血液、尿液或唾液的生物混合物,或者可以是食物或饮料。对生物样品的分析包括有关样品供体的营养或健康状况的线索,因此该分析具有医学和营养价值。例如,尿中的维生素B3与糖、脂质和蛋白质的代谢以及能量产生相关,因此测量其尿中的代谢物(N1-甲基-2-吡啶酮-5-甲酰胺)对于维持身体健康的营养指导很有用。
(被测物质)
本实施例中的被测物质是样品中包含的一种或多种已知组分。例如,被测物质是从由蛋白质、DNA、病毒、真菌、水溶性维生素、脂溶性维生素、有机酸、脂肪酸、氨基酸、糖、农药和内分泌干扰物组成的组中选择的至少一种。
例如,如果需要获知营养物的量,则被测物质是硫胺素(维生素B1)、核黄素(维生素B2)、作为维生素B3的代谢物的N1-甲基烟酰胺、N1-甲基-2-吡啶酮-5-甲酰胺、作为维生素B6的代谢物的4-吡哆醇酸等。此外,还有水溶性维生素,诸如N1-甲基-4-吡啶酮-3-甲酰胺、泛酸(维生素B5)、吡哆醇(维生素B6)、生物素(维生素B7)、蝶酸单麸氨酸(维生素B9)、氰钴胺(维生素B12)和抗坏血酸(维生素C)。此外,存在氨基酸,诸如L-色氨酸、赖氨酸、蛋氨酸、苯丙氨酸、苏氨酸、缬氨酸、亮氨酸、异亮氨酸和L-组氨酸。此外,被测物质可以是矿物质,诸如钠、钾、钙、镁和磷。
(定量信息)
本实施例中的定量信息是从由样品中包含的被测物质的量、样品中包含的被测物质的浓度、以及样品中被测物质的有无组成的组中选择的至少一种。另外,定量信息是从由样品中包含的被测物质的浓度或量与被测物质的基准量的比率、以及样品中包含的被测物质的量或浓度的比率组成的组中选择的至少一种。
(频谱信息)
本实施例中的频谱信息是从由色谱、光电子频谱、红外吸收频谱(IR频谱)、核磁共振频谱(NMR频谱)、荧光频谱、X-射线荧光频谱、紫外/可见吸收频谱(UV/Vis频谱)、拉曼频谱、原子吸收频谱、火焰发射频谱、发射分光频谱、X射线吸收频谱、X射线衍射频谱、顺磁共振吸收频谱、电子自旋共振频谱、质谱和热分析频谱组成的组中选择的至少一种。
随后,将参照图1描述本实施例中的信息处理系统。图1是示出根据第一实施例的包括信息处理装置的信息处理系统的整体构造的图。
本实施例中的信息处理系统包括信息处理装置10、数据库22和分析器23。信息处理装置10和数据库22彼此连接,以能够经由通信部彼此通信。在本实施例中,通信部由局域网(LAN)21组成。另外,信息处理装置10和分析器23经由诸如通用串行总线(USB)的标准通信部连接。LAN可以是有线LAN、无线LAN或WAN。此外,USB可以是LAN。
数据库22管理通过分析器23的分析而获取的频谱信息。另外,数据库22管理由稍后描述的学习模型生成部分42生成的学习模型(预训练模型)。信息处理装置10经由LAN 21获取由数据库22管理的频谱信息和学习模型。
本实施例中的学习模型是回归学习模型,并且能够将通过诸如深度学习等机器学习生成的模型用作学习模型。这里,将通过使用教师数据训练并构造为能够做出适当的预测的机器学习算法称为学习模型。有多种类型的机器学习算法用于学习模型。例如,能够使用利用神经网络的深度学习。神经网络由输入层、输出层和多个隐藏层组成,其中各个层通过称为激活函数的计算公式相互连接。当使用具有标签(与输入对应的输出)的教师数据时,确定激活函数的系数,使得建立输入与输出之间的关系。利用多个教师数据来确定系数使得能够生成学习模型,该学习模型能够高精度地预测针对输入的输出。
分析器23是用于分析样品、被测物质等的设备。分析器23对应于分析部的示例。如上所述,在本实施例中,信息处理装置10和分析器23可通信地彼此连接。然而,分析器23可以配设在信息处理装置10内部,或者信息处理装置10可以配设在分析器23内部。此外,分析结果(频谱信息)可以经由诸如非易失性存储器的记录介质从分析器23传递到信息处理装置10。
本实施例中的分析器23不受限制,只要其能够获取频谱信息即可,并且能够将使用化学分析方法或物理分析方法的设备用于分析器23。在本实施例中,使用化学分析方法的设备使用从例如由诸如液相色谱法或气相色谱法的色谱法和毛细管电泳法组成的组中选择的至少一种方法。在本实施例中,使用物理分析方法的设备使用从例如由光电子频谱法、红外吸收频谱法、核磁共振频谱法、荧光频谱法、X射线荧光频谱法、可见/紫外吸收频谱法、拉曼频谱法、原子吸收频谱法、火焰发射频谱法、发射频谱法、X射线吸收频谱法、X射线衍射法、使用顺磁共振吸收等的电子自旋共振频谱法、质谱法和热分析方法组成的组中选择的至少一种方法。
例如,使用液相色谱法的设备配备有流动相容器、液体进给泵、样品注入单元、柱、检测器和A/D转换器。作为检测器,使用利用紫外线、可见光、红外线等的电磁波检测器、电化学检测器、离子检测器等。在这种情况下,所得频谱信息是检测器随时间的输出的强度。
信息处理装置10包括通信IF 31、ROM 32、RAM 33、存储部分34、操作部分35、显示部分36和控制部分37,作为其功能部件。
通信IF(接口)31例如由LAN卡和USB接口卡实现。通信IF 31经由LAN 21和USB控制外部设备(例如,数据库22和分析器23)与信息处理装置10之间的通信。ROM(只读存储器)32由非易失性存储器等实现,并存储各种程序等。RAM(随机存取存储器)33由易失性存储器等实现,并临时存储各种信息。存储部分34例如由HDD(硬盘驱动器)等实现,并存储各种信息。操作部分35例如由键盘、鼠标等来实现,并且来自用户的指令被输入到装置中。显示部分36例如由显示器等实现,并向用户显示各种信息。操作部分35和显示部分36在控制部分37的控制下提供作为GUI(图形用户界面)的功能。
控制部分37例如由至少一个CPU(中央处理单元)实现,并且整体地控制信息处理装置10中的处理。控制部分37包括频谱信息获取部分41、学习模型生成部分42、学习模型获取部分43、估计部分44、信息获取部分45、可靠性获取部分46和显示控制部分47,作为其功能部件。
频谱信息获取部分41从分析器23获取至少包括被测物质和杂质的样品的分析结果,具体为样品的频谱信息。另外,可以从预先存储分析结果的数据库22获取样品的频谱信息。此外,以相同的方式获取被测物质的频谱信息。被测物质的频谱信息是在存在单一被测物质的情况下获得的频谱信息。然后,频谱信息获取部分41将所获取的样品的频谱信息输出至估计部分44和可靠性获取部分46。此外,所获取的被测物质的频谱信息被输出至学习模型生成部分42和可靠性获取部分46。
学习模型生成部分42通过使用由频谱信息获取部分41获取的被测物质的频谱信息来生成教师数据。然后,学习模型生成部分42通过使用教师数据进行深度学习并生成学习模型。稍后将详细描述教师数据的生成和学习模型的生成。然后,学习模型生成部分42将所生成的学习模型输出至学习模型获取部分43。另外,学习模型生成部分42可以将所生成的学习模型输出至数据库22。
学习模型获取部分43获取由学习模型生成部分42生成的学习模型。如果学习模型存储在数据库22中,则学习模型获取部分43从数据库22获取学习模型。然后,学习模型获取部分43将获取的学习模型输出到估计部分44。
估计部分44通过将由频谱信息获取部分41获取的样品的频谱信息输入到由学习模型获取部获取的学习模型中,来使学习模型估计样品中包含的被测物质的定量信息。然后,估计部分44将估计的定量信息输出到信息获取部分45。估计部分44对应于用于通过将样品的频谱信息输入到学习模型中来估计被测物质的定量信息的估计部的示例。
信息获取部分45获取由学习模型估计的定量信息。换句话说,信息获取部分45对应于信息获取部的示例,该信息获取部用于获取通过将包含被测物质和杂质的样品的频谱信息输入到学习模型中而估计的被测物质的定量信息。然后,信息获取部分45将获取的定量信息输出到显示控制部分47。
可靠性获取部分46获取由信息获取部分45获取的被测物质的定量信息的可靠性。换句话说,可靠性获取部分46对应于可靠性获取部的示例,该可靠性获取部用于获取所获取的被测物质的定量信息的可靠性。本实施例中的可靠性是指示由学习模型估计的被测物质的定量信息能够被信赖的程度的指标。将在后面详细描述可靠性的获取。然后,可靠性获取部分46将获取的可靠性输出到显示控制部分47。
显示控制部分47使显示部分36显示由信息获取部分45获取的定量信息和由可靠性获取部分46获取的可靠性。显示控制部分47对应于显示控制部的示例。
控制部分37的各个单元中的至少一些可以被实现为独立的设备。另外,一些单元中的各个可以被实现为实现各功能的软件。在这种情况下,实现功能的软件可以经由云或任何其他网络在服务器上运行。在本实施例中,假设各单元由本地环境中的软件实现。
图1所示的信息处理系统的构造仅是示例。例如,信息处理装置10的存储部分34可以包括数据库22的功能,并且存储部分34可以保留各种信息。
随后,将参照图2至图6描述本实施例中的处理过程。
图2是与学习模型的生成有关的处理过程的流程图。
(S201)(分析单独被测物质)
在步骤S201中,分析器23分析单独被测物质并获取被测物质的频谱信息。可以从灵敏度和分析时间的观点适当地选择分析条件。此时,分析器23通过以多种方式改变被测物质的浓度来分析被测物质。需要多少种类型的被测物质取决于物质的性质等。然而,一般而言,期望将被测物质的类型改变三次或更多次。在存在多种类型的被测物质的情况下,期望针对各类型的被测物质来分析被测物质。然而,如果被测物质的信号彼此充分分离,则可以同时分析被测物质。然后,分析器23将获取的频谱信息输出到信息处理装置10。信息处理装置10从分析器23接收频谱信息,并将频谱信息保留在RAM 33或存储部分34中。频谱信息获取部分41获取如此保留的频谱信息。如上所述,可以将作为分析结果的频谱信息保留在数据库22中。在这种情况下,频谱信息获取部分41从数据库22获取频谱信息。另外,分析器23对被测物质进行分析的定时可以是任何定时,只要在步骤S202中生成教师数据之前进行分析即可。
(S202)(生成教师数据)
在步骤S202中,学习模型生成部分42通过使用由频谱信息获取部分41获取的被测物质的频谱信息来生成多个教师数据。将具体描述生成教师数据的方法。通过将由随机数生成的任意波形添加到被测物质的频谱信息中来生成教师数据。例如,在液相色谱法中,由频谱信息(色谱)指示的波形通常具有高斯分布。因此,学习模型生成部分42将其峰高、中值和标准偏差由随机数确定的多个高斯曲线(高斯函数)相加,以生成多个随机噪声。
不需要在整个保留时间内(从样品的注入起,检测器检测到化合物所花费的时间)准备频谱信息。仅需要准备被测物质的峰在中心的修剪数据。修剪范围越宽,由稍后描述的计算部分进行的定量的精度越高,但是增大精度所需的教师数据的数量增加。修剪范围优选为被测物质峰的标准偏差(σ)的6倍或更大至30倍或更小,更优选为10倍或更大至20倍或更小,甚至更优选为14倍或更大至18倍或更小。
随后,将任意波形添加到修剪数据。要添加的波形的数量优选为可能导致峰在色谱上不分离并且彼此交叠的数量,但是通常优选为两个或更大至八个或更小。如果要添加的波形的数量超过八个,则难以预测被测物质的峰的形状,并且定量精度可能降低。如果要添加的波形的数量少于两个,则可能无法对具有交叠峰的色谱进行准确的定量。要添加的波形的数量更优选为三个或更大至六个或更小,并且甚至更优选为四个或更大至五个或更小。假设任意波形的形状具有由下面的等式1表示的高斯函数。
[数学式1]
Figure BDA0003119218550000101
其中a由相对于被测物质的预期峰高的0到α%范围内的随机数确定,b由相对于修剪范围的最大β%范围内的随机数确定。例如,在相对于被测物质的峰的中心修剪±8σ的范围的情况下,b是在-8σ×β%至+8σ×β%的范围内的任意值。α和β的值优选为50或更大至300或更小,更优选为50或更大至250或更小,并且进一步优选为50或更大至200或更小。值c由如下范围内的随机数确定,该范围优选为被测物质峰的标准偏差的0.1倍或更大至10倍或更小,更优选0.2倍或更大至8倍或更小,并且进一步优选0.5倍或更大至5倍或更小。
学习模型生成部分42生成通过将多个随机噪声中的各个添加到由被测物质的频谱信息指示的波形而生成的多个波形。以这种方式生成的多个波形被用作包含被测物质和杂质的虚拟样品的频谱信息(学习频谱信息)。换句话说,将多个生成的频谱信息确定为构成教师数据的输入数据。此外,学习模型生成部分42将根据作为生成的频谱信息的基础的被测物质的频谱信息识别出的峰高(定量信息),确定为构成教师数据的正确答案数据。以这种方式,学习模型生成部分42生成作为一对输入数据和正确答案数据的多个教师数据。另外,由于学习模型生成部分42在步骤S201中根据被测物质的浓度获取频谱信息,因此针对各浓度生成多个教师数据。应该注意的是,色谱波形的峰宽随着保留时间的增加而趋于增大,因此学习模型生成部分42可以加宽生成的波形的宽度。
专利文献3公开了一种通过将被检体的质谱数据与癌症的有无相关联来进行机器学习的方法。然而,需要大量的教师数据来提高机器学习的精度。在专利文献3中,准备了90,000种数据作为教师数据。换句话说,机器学习使得能够高精度地分析复杂的分析结果,而其缺点是必须准备大量的教师数据。在本实施例中,不需要准备大量的教师数据(这是机器学习的缺点),从而能够减轻用户的负担。
尽管如上所述生成了教师数据,但是可以通过使用分析器23分析多个样品来获取用于学习的样品的频谱信息,并且可以将该频谱信息与被测物质的定量信息一起用作教师数据。另外,可以通过与上述方法不同的方法来生成虚拟样品的频谱信息。
(S203)(生成学习模型)
在步骤S203中,学习模型生成部分42通过使用在步骤S202中针对各浓度生成的多个教师数据,根据预定算法进行机器学习,来生成学习模型。在本实施例中,神经网络被用作预定算法。学习模型生成部分42通过使神经网络使用多个教师数据进行学习来生成学习模型,该学习模型基于样品的频谱信息的输入来估计样品中包含的被测物质的定量信息。由于神经网络的学习方法是公知技术,因此在本实施例中省略详细描述。另外,作为预定算法,例如,可以使用SVM(支持向量机)、DNN(深度神经网络)、CNN(卷积神经网络)等。在存在多种类型的被测物质的情况下,学习模型生成部分42针对各物质构建学习模型。然后,学习模型生成部分42将生成的学习模型存储到RAM 33、存储部分34或数据库22中。
如上所述,基于样品的频谱信息,生成估计样品中包含的被测物质的定量信息的学习模型。
随后,将描述获取可靠性的方法。图3是示出用于获取可靠性的处理过程的流程图。
(S301)(分析样品)
在步骤S301中,分析器23分析目标样品并获取样品的频谱信息。假设分析条件与上述步骤S201中相同。然后,分析器23将获取的频谱信息输出到信息处理装置10。信息处理装置10从分析器23接收频谱信息,并将频谱信息存储到RAM 33或存储部分34中以进行保留。频谱信息获取部分41获取由此保留的频谱信息。如上所述,可以将作为分析结果的频谱信息保留在数据库22中。在这种情况下,频谱信息获取部分41从数据库22获取频谱信息。此外,分析器23分析样品的定时可以是任何定时,只要在步骤S302中估计定量信息之前进行分析即可。
(S302)(估计定量信息)
在步骤S302中,学习模型获取部分43获取存储在RAM 33、存储部分34或数据库22中的学习模型。然后,通过输入在步骤S301中获取的样品的频谱信息,估计部分44使获取的学习模型估计样品中包含的被测物质的定量信息。此外,估计部分44根据需要将估计的定量信息转换为在显示部分36中显示的格式。要在显示部分36中显示的格式可以是g/L、mol/L等的浓度,或者可以是与基准量(标准量)的比率。只要由学习模型估计的值是这些显示格式中的任何一种,就无需转换该值。然后,信息获取部分45从估计部分44获取估计的定量信息,并将该定量信息存储到RAM 33或存储部分34中。
如上所述,即使没有将被测物质的峰与杂质的峰完全分离,使用通过机器学习获得的学习模型也能够准确地获取被测物质的定量信息,而无需关于分析的复杂和高级的知识。结果,即使是非专家也能够容易地对被测物质进行高精度的定量分析。
(S303)(获取可靠性)
在步骤S303中,可靠性获取部分46获取在步骤S302中估计的定量信息的可靠性。将详细描述获取可靠性的方法。
可靠性获取部分46获取由频谱信息获取部分41输出的被测物质的频谱信息。然后,可靠性获取部分46识别根据被测物质的频谱信息识别出的峰(第一峰)的保留时间(第一保留时间)。随后,可靠性获取部分46获取由频谱信息获取部分41输出的样品的频谱信息。然后,可靠性获取部分46根据样品的频谱信息识别具有最接近第一峰的保留时间的保留时间的峰(第二峰)。可靠性获取部分46计算如上所述识别出的第一峰的保留时间与第二峰的保留时间之间的时间差,并将计算出的时间差取为Δ值。另选地,可以将Δ值用作被测物质的频谱信息中的半峰全宽的中心的保留时间与样品的频谱信息的第二峰的半峰全宽的中心的保留时间之间的时间差。
图4A示出了从频谱信息获取部分41获取的样品的频谱信息401。图4A和图4B所示的样品的频谱信息401是色谱,其中纵轴指示信号强度,横轴指示保留时间。图4B示出了如402所指示的、频谱信息401的提取范围。在图4B中,为便于描述,将相同范围内的被测物质的频谱信息403叠加。可靠性获取部分46从被测物质的频谱信息403中识别出第一峰404。然后,可靠性获取部分46识别具有最接近第一峰的保留时间的保留时间的第二峰405。第一峰的保留时间与第二峰的保留时间之间的时间差406是Δ值。
随后,可靠性获取部分46生成包含被测物质和杂质的虚拟样品的多个频谱信息,其具有与计算出的Δ值相同的Δ值。该生成方法类似于在步骤S202中描述的方法。然后,可靠性获取部分46将多个生成的频谱信息输入到在步骤S302中获取的学习模型,并且针对各生成的频谱信息估计虚拟样品中包含的被测物质的定量信息。在本说明书中,估计的定量信息被称为“估计值”。另外,将从在虚拟样品的频谱信息的生成中使用的被测物质的频谱信息中识别出的峰的高度(定量信息)称为“正确答案值”。可靠性获取部分46计算多个估计值与正确答案值之间的相关系数,并将计算出的相关系数用作在步骤S302中估计的定量信息的可靠性。可靠性获取部分46获取以这种方式计算出的可靠性,并将可靠性存储到RAM33或存储部分34中。
尽管在本实施例中在步骤S303中计算了相关系数,但是可以针对各Δ值预先计算相关系数。图5是示出针对各Δ值计算相关系数的结果的图。在预先计算相关系数的情况下,可靠性获取部分46在图5的Δ值的列中搜索同第一峰的保留时间与第二峰的保留时间之间的时间差(Δ值)相同的值。如果作为搜索结果发现了相同的值,则可靠性获取部分46从相关系数列中获取与该值相对应的相关系数,并将所获取的相关系数用作可靠性。除非找到相同的值,否则可靠性获取部分46可以从图5中的Δ值列中识别最接近计算出的Δ值的值。
(S304)(显示定量信息和可靠性)
在步骤S304中,显示控制部分47使显示部分36显示在步骤S302中由学习模型估计的样品中包含的被测物质的定量信息以及在步骤S303中计算出的可靠性。在这种情况下,可以以图形格式或表格格式来布置和显示定量信息和可靠性。图6示出了在显示部分36中显示的画面(窗口)的示例。此外,可以根据诸如“高”或“低”的可靠性值来显示等级。如果计算出的可靠性高于预定阈值,则可以改变估计的定量信息的显示形式,诸如颜色、字符粗细和字符大小。当计算出的可靠性低于预定阈值时,这同样适用。
以这种方式将估计的定量信息的可靠性呈现给用户,从而使用户更容易确定由学习模型估计的被测物质的定量信息能够被信赖的程度。换句话说,可以辅助用户确定通过使用学习模型估计的被测物质的定量信息。
[第二实施例]
随后,将描述第二实施例。在第一实施例中,将估计值与正确答案值之间的相关系数用作可靠性。在第二实施例中,将通过分类学习模型估计的分类概率用作可靠性。
图7是示出根据第二实施例的信息处理系统的整体构造的图。除了以下功能部分之外,第二实施例中的信息处理系统的整体构造以及信息处理装置10的硬件构造和功能构造与第一实施例的相同,因此将省略其描述。
频谱信息获取部分41从分析器23获取至少包括被测物质和杂质的样品的分析结果,具体为样品的频谱信息。另外,可以从预先存储分析结果的数据库22中获取样品的频谱信息。此外,以相同的方式获取被测物质的频谱信息。被测物质的频谱信息是在存在单一被测物质的情况下获得的频谱信息。然后,频谱信息获取部分41将所获取的样品的频谱信息输出至估计部分44。此外,所获取的被测物质的频谱信息被输出至学习模型生成部分42。
学习模型生成部分42通过使用由频谱信息获取部分41获取的被测物质的频谱信息来生成教师数据。然后,学习模型生成部分42通过使用教师数据进行深度学习并生成学习模型。在第二实施例中生成的学习模型是分类学习模型。图8是用于描述第二实施例中的分类学习模型的图。如图8所示,在输出层中有多个节点,并且各节点对应于指示被测物质的定量信息的类别。另外,输出层的各节点的输出值指示分类概率。关于教师数据的生成和学习模型的生成的详细描述如第一实施例中所述。然后,学习模型生成部分42将所生成的学习模型输出至学习模型获取部分43。学习模型生成部分42可以将所生成的学习模型输出至数据库22。
估计部分44通过将由频谱信息获取部分41获取的样品的频谱信息输入到学习模型中,来使由学习模型获取部分43获取的学习模型估计样品中包含的被测物质的定量信息。另外,学习模型获取部分43还使学习模型对估计的定量信息的分类概率进行估计。此外,估计部分44将估计的定量信息输出到信息获取部分45,并且将估计的分类概率输出到可靠性获取部分46。
可靠性获取部分46获取由信息获取部分45获取的被测物质的定量信息的可靠性。本实施例中的可靠性是由学习模型估计的分类概率。因此,将从估计部分44获取的分类概率用作定量信息的可靠性。可靠性获取部分46将获取的可靠性输出到显示控制部分47。
随后,将描述第二实施例中的处理过程。除了以下几点以外,第二实施例中用于生成学习模型的处理过程与图2所示的流程图相同。
在步骤S203中,当学习模型生成部分42生成学习模型时,学习模型生成部分42使用分类学习模型。因此,在利用教师数据进行学习时,使学习模型进行学习,以使浓度的输出值接近100%,其中该输出值在输出层的节点当中具有最大的输出值(分类概率),其对应于作为正确答案数据的定量信息。
除了以下几点以外,第二实施例中用于获取可靠性的处理过程与图3所示的流程图相同。
在步骤S302中,估计部分44使学习模型估计分类概率和样品中包含的被测物质的定量信息。作为学习模型的输出值的、与具有最高分类概率的节点相对应的定量信息被假设为样品中包含的被测物质的定量信息。然后,在步骤S303中,可靠性获取部分46获取估计的分类概率作为可靠性。在步骤S304中,显示控制部分47使显示部分36显示在步骤S302中由学习模型估计的样品中包含的被测物质的定量信息以及在步骤S303中获取的可靠性。
如上所述,可以采用分类学习模型的分类概率作为可靠性。与第一实施例类似,第二实施例也能够辅助用户确定通过使用学习模型估计的被测物质的定量信息。
[其他实施例]
尽管以上已经详细描述了实施例,但是本发明可以被执行为其他形式,诸如系统、装置、方法、程序、存储介质等。具体地,本发明可以应用于通过分配信息处理装置的功能而由多个设备组成的系统,或者可以应用于由单个设备组成的设备。另外,为了在计算机上实现本发明的功能和处理,安装在计算机中的程序代码本身也实现了本发明。此外,本发明的范围还包括用于实现上述实施例中描述的功能和处理的计算机程序本身。另外,当计算机执行读取的程序时,可以实现上述实施例的功能,或者可以基于程序的指令,与计算机上运行的OS等组合实现实施例的功能。在这种情况下,OS等进行部分或全部实际处理,并且该处理使得上述实施例的功能得以实现。此外,可以将从记录介质读取的程序写入配设在插入计算机中的功能扩展板或连接至计算机的功能扩展单元中的存储器中,使得实现上述实施例的一些或全部功能。本发明的范围不限于上述实施例。可以组合上述多个实施例中的至少两个。
[示例]
下面将通过给出示例和比较例来更详细地描述本发明。本发明不限于以下示例。示例1至3对应于第一实施例,示例4对应于第二实施例。
[示例1]
作为示例1,首先,将描述将上述数据处理方法应用于仿真数据的示例,以评估方法的有利效果。
作为被测物质数据(被测物质的频谱信息),准备了11种类型的正态分布波形数据,其中,中值=250,标准偏差=20,峰高=以0.1为增量的0.0-1.0。
将中值、标准偏差和峰高被设置为随机数的四个正态分布波形添加到各被测物质数据,以将结果用作样品数据(虚拟样品的频谱信息)。对于单独被测物质数据,准备了1,000种类型的样品数据。将各样品数据与各样品数据中包含的被测物质数据的峰高组合,以形成11,000个教师数据,并通过使用教师数据进行机器学习以生成回归学习模型。将全连接神经网络用作机器学习方法,并将relu函数和线性函数用作激活函数。均方误差被用作损失函数,并且Adam被用作优化算法。需要大约100个时期(epoch)的迭代操作来获得足够的定量精度。
随后,准备通过与样品数据相同的方法创建的大量样品数据。其中,关注样品数据的峰,其位于被测物质数据的峰附近。将取峰的最大值的保留时间与取被测物质数据的峰的最大值的保留时间进行比较,并选择时间差(Δ值)为25的1100个样品数据。将这些样品数据输入到学习模型,以计算样品数据中包含的被测物质的峰高。图9A示出了示例1的仿真结果。图9A是将横轴作为用于创建样品数据的被测物质的峰高(正确答案值)、并将纵轴作为通过使用学习模型获得的被测物质的峰高(估计值)的图。如图9A所示,正确答案值与估计值之间的相关系数是0.99,并且该相关系数被用作Δ值为25的样品数据的可靠性。
[示例2]
除了选择了Δ值为20的1100个样品数据,将这些样品数据输入到学习模型中,并计算样品数据中包含的被测物质的峰高之外,示例2与示例1相同。示例2的仿真结果在图9B中示出。如图9B所示,相关系数为0.93,并且该值被用作Δ值为20的样品数据的可靠性。
[示例3]
除了选择了Δ值为15的1100个样品数据,将这些样品数据输入到学习模型中,并计算样品数据中包含的被测物质的峰高之外,示例3与示例1和2相同。示例3的仿真结果在图9C中示出。如图9C所示,相关系数为0.87,并且该值被用作Δ值为15的样品数据的可靠性。
[示例4]
在示例4中,使用以与示例1中相同的方式准备的教师数据进行机器学习,以生成分类学习模型。将全连接神经网络用作机器学习方法,并将relu函数和softmax函数用作激活函数。将交叉熵损失函数用作损失函数,并将SGD用作优化算法。需要大约100个时期的迭代操作来获得足够的定量精度。
随后,通过使用与样品数据相同的方法创建11个数据。将这些数据输入到学习模型中,以对样品数据中包含的被测物质的峰高进行分类。另外,将各分类值的分类概率用作可靠性。
本发明不限于上述实施例,并且在不脱离本发明的精神和范围的情况下可以进行各种变型和改变。因此,附上了权利要求以公开本发明的范围。
本申请要求2018年12月20日提交的日本专利申请第2018-238829号的优先权,这些申请的全部内容通过引用并入本文。
[附图标记列表]
10 信息处理装置;
21 LAN;
22 数据库;
23 分析器;
31 通信IF;
32 ROM;
33 RAM;
34 存储部分;
35 操作部分;
36 显示部分;
37 控制部分;
41 频谱信息获取部分;
42 学习模型生成部分;
43 学习模型获取部分;
44 估计部分;
45 信息获取部分;
46 可靠性获取部分;
47 显示控制部分。

Claims (35)

1.一种信息处理装置,其包括:
信息获取部,其用于获取通过将包含被测物质和杂质的样品的频谱信息输入到学习模型中而估计的所述被测物质的定量信息;以及
可靠性获取部,其用于获取所获取的被测物质的定量信息的可靠性。
2.根据权利要求1所述的信息处理装置,其中,所述可靠性获取部通过使用所述样品的频谱信息和所述被测物质的频谱信息,来获取所述可靠性。
3.根据权利要求1所述的信息处理装置,其中,
所述频谱信息是色谱,并且
所述可靠性获取部通过使用基于所述样品的频谱信息而识别的保留时间以及基于所述被测物质的频谱信息而识别的保留时间,来获取所述可靠性。
4.根据权利要求1至3中的任一项所述的信息处理装置,其中,所述可靠性是基于所述被测物质的频谱信息而识别的所述被测物质的定量信息与通过所述学习模型而估计的所述被测物质的定量信息之间的相关系数。
5.根据权利要求1所述的信息处理装置,其中,所述可靠性是通过所述学习模型而估计的分类概率。
6.根据权利要求1至5中的任一项所述的信息处理装置,所述信息处理装置还包括:
显示控制部,其用于使显示部分显示所获取的可靠性。
7.根据权利要求6所述的信息处理装置,其中,所述显示控制部还使所述显示部分显示所获取的被测物质的定量信息。
8.根据权利要求1至7中的任一项所述的信息处理装置,其中,所述学习模型是通过使用多对学习频谱信息作为教师数据而学习的学习模型,所述多对学习频谱信息是,基于所述被测物质的频谱信息、以及基于所述被测物质的频谱信息而识别的所述被测物质的定量信息来生成的。
9.根据权利要求8所述的信息处理装置,其中,所述学习频谱信息是通过使用所述被测物质的频谱信息和随机噪声来生成的。
10.根据权利要求9所述的信息处理装置,其中,所述随机噪声是通过组合多个高斯函数而获得的波形。
11.根据权利要求1至10中的任一项所述的信息处理装置,所述信息处理装置还包括:
估计部,其用于通过将所述样品的频谱信息输入到所述学习模型中,来估计所述被测物质的定量信息。
12.根据权利要求1所述的信息处理装置,其中,所述频谱信息是色谱、光电子频谱、红外吸收频谱、核磁共振频谱、荧光频谱、X-射线荧光频谱、紫外/可见吸收频谱、拉曼频谱、原子吸收频谱、火焰发射频谱、发射分光频谱、X射线吸收频谱、X射线衍射频谱、顺磁共振吸收频谱、电子自旋共振频谱、质谱和热分析频谱中的至少一者。
13.根据权利要求1或12所述的信息处理装置,所述信息处理装置还包括:
分析部,其用于进行用于获取所述样品的频谱信息的分析。
14.根据权利要求13所述的信息处理装置,其中,所述分析部进行色谱法、毛细管电泳法、光电子频谱法、红外吸收频谱法、核磁共振频谱法、荧光频谱法、X射线荧光频谱法、可见/紫外吸收频谱法、拉曼频谱法、原子吸收频谱法、火焰发射频谱法、发射频谱法、X射线吸收频谱法、X射线衍射法、使用顺磁共振吸收的电子自旋共振频谱法、质谱法和热分析方法中的至少一者。
15.根据权利要求1至14中的任一项所述的信息处理装置,其中,所述被测物质是蛋白质、DNA、病毒、真菌、水溶性维生素、脂溶性维生素、有机酸、脂肪酸、氨基酸、糖、农药和内分泌干扰物中的至少一者。
16.根据权利要求1至15中的任一项所述的信息处理装置,其中,所述被测物质是硫胺素、核黄素、N1-甲基烟酰胺、N1-甲基-2-吡啶酮-5-甲酰胺、4-吡哆醇酸、N1-甲基-4-吡啶酮-3-甲酰胺、泛酸、吡哆醇、生物素、蝶酸单麸氨酸、氰钴胺和抗坏血酸中的至少一者。
17.根据权利要求1至16中的任一项所述的信息处理装置,其中,所述定量信息是所述样品中包含的所述被测物质的量、所述样品中包含的所述被测物质的浓度、所述样品中所述被测物质的有无、所述样品中包含的所述被测物质的浓度或量与所述被测物质的基准量的比率、和所述样品中包含的所述被测物质的量或浓度的比率中的至少一者。
18.一种信息处理装置的控制方法,所述控制方法包括:
信息获取步骤,获取通过将包含被测物质和杂质的样品的频谱信息输入到学习模型中而估计的所述被测物质的定量信息;以及
可靠性获取步骤,获取所获取的被测物质的定量信息的可靠性。
19.根据权利要求18所述的信息处理装置的控制方法,其中,所述可靠性获取步骤包括:通过使用所述样品的频谱信息和所述被测物质的频谱信息,来获取所述可靠性。
20.根据权利要求18所述的信息处理装置的控制方法,其中,
所述频谱信息是色谱,并且
所述可靠性获取步骤包括:通过使用基于所述样品的频谱信息而识别的保留时间以及基于所述被测物质的频谱信息而识别的保留时间,来获取所述可靠性。
21.根据权利要求18至20中的任一项所述的信息处理装置的控制方法,其中,所述可靠性是基于所述被测物质的频谱信息而识别的所述被测物质的定量信息与通过所述学习模型而估计的所述被测物质的定量信息之间的相关系数。
22.根据权利要求18所述的信息处理装置的控制方法,其中,所述可靠性是通过所述学习模型而估计的分类概率。
23.根据权利要求18至22中的任一项所述的信息处理装置的控制方法,所述控制方法还包括:
显示控制步骤,使显示部分显示所获取的可靠性。
24.根据权利要求23所述的信息处理装置的控制方法,其中,所述显示控制步骤还包括:使所述显示部分显示所获取的被测物质的定量信息。
25.根据权利要求18至24中的任一项所述的信息处理装置的控制方法,其中,所述学习模型是通过使用多对学习频谱信息作为教师数据而学习的学习模型,所述多对学习频谱信息是,基于所述被测物质的频谱信息、以及基于所述被测物质的频谱信息而识别的所述被测物质的定量信息来生成的。
26.根据权利要求25所述的信息处理装置的控制方法,其中,所述学习频谱信息是通过使用所述被测物质的频谱信息和随机噪声来生成的。
27.根据权利要求26所述的信息处理装置的控制方法,其中,所述随机噪声是通过组合多个高斯函数而获得的波形。
28.根据权利要求18至27中的任一项所述的信息处理装置的控制方法,所述控制方法还包括:
估计步骤,通过将所述样品的频谱信息输入到所述学习模型中,来估计所述被测物质的定量信息。
29.根据权利要求18所述的信息处理装置的控制方法,其中,所述频谱信息是色谱、光电子频谱、红外吸收频谱、核磁共振频谱、荧光频谱、X-射线荧光频谱、紫外/可见吸收频谱、拉曼频谱、原子吸收频谱、火焰发射频谱、发射分光频谱、X射线吸收频谱、X射线衍射频谱、顺磁共振吸收频谱、电子自旋共振频谱、质谱和热分析频谱中的至少一者。
30.根据权利要求18或29所述的信息处理装置的控制方法,所述控制方法还包括:
分析步骤,进行用于获取所述样品的频谱信息的分析。
31.根据权利要求30所述的信息处理装置的控制方法,其中,所述分析步骤包括:进行色谱法、毛细管电泳法、光电子频谱法、红外吸收频谱法、核磁共振频谱法、荧光频谱法、X射线荧光频谱法、可见/紫外吸收频谱法、拉曼频谱法、原子吸收频谱法、火焰发射频谱法、发射频谱法、X射线吸收频谱法、X射线衍射法、使用顺磁共振吸收的电子自旋共振频谱法、质谱法和热分析方法中的至少一者。
32.根据权利要求18至31中的任一项所述的信息处理装置的控制方法,其中,所述被测物质是蛋白质、DNA、病毒、真菌、水溶性维生素、脂溶性维生素、有机酸、脂肪酸、氨基酸、糖、农药和内分泌干扰物中的至少一者。
33.根据权利要求18至32中的任一项所述的信息处理装置的控制方法,其中,所述被测物质是硫胺素、核黄素、N1-甲基烟酰胺、N1-甲基-2-吡啶酮-5-甲酰胺、4-吡哆醇酸、N1-甲基-4-吡啶酮-3-甲酰胺、泛酸、吡哆醇、生物素、蝶酸单麸氨酸、氰钴胺和抗坏血酸中的至少一者。
34.根据权利要求18至33中的任一项所述的信息处理装置的控制方法,其中,所述定量信息是所述样品中包含的所述被测物质的量、所述样品中包含的所述被测物质的浓度、所述样品中所述被测物质的有无、所述样品中包含的所述被测物质的浓度或量与所述被测物质的基准量的比率、和所述样品中包含的所述被测物质的量或浓度的比率中的至少一者。
35.一种程序,其使计算机用作根据权利要求1至17中的任一项所述的信息处理装置的各个部。
CN201980083701.7A 2018-12-20 2019-12-16 信息处理装置、信息处理装置的控制方法及程序 Pending CN113196053A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2018-238829 2018-12-20
JP2018238829 2018-12-20
PCT/JP2019/049158 WO2020129895A1 (ja) 2018-12-20 2019-12-16 情報処理装置、情報処理装置の制御方法、及びプログラム

Publications (1)

Publication Number Publication Date
CN113196053A true CN113196053A (zh) 2021-07-30

Family

ID=71101751

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980083701.7A Pending CN113196053A (zh) 2018-12-20 2019-12-16 信息处理装置、信息处理装置的控制方法及程序

Country Status (4)

Country Link
US (1) US20210311001A1 (zh)
JP (1) JP7483367B2 (zh)
CN (1) CN113196053A (zh)
WO (1) WO2020129895A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7469799B2 (ja) 2020-07-08 2024-04-17 東京都公立大学法人 計測装置および計測方法
KR102458523B1 (ko) * 2020-10-13 2022-10-25 서강대학교산학협력단 실리콘 광증배기 기반 광자 계수 엑스선 검출기의 에너지 스펙트럼 데이터 처리 방법 및 서버
KR102271995B1 (ko) * 2021-01-12 2021-07-05 국방과학연구소 인공 신경망을 이용한 지표면 화학 작용제 탐지 시스템
CN117980998A (zh) 2021-09-30 2024-05-03 富士胶片株式会社 学习用数据的获取方法、学习用数据获取系统、软传感器的构建方法、软传感器、学习用数据
FR3136856A1 (fr) * 2022-06-21 2023-12-22 Commissariat A L'energie Atomique Et Aux Energies Alternatives Méthode de validation des prédictions d’un modèle supervisé d’analyse quantitative multivariée de données spectrales

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4468742A (en) * 1981-03-17 1984-08-28 The Regents Of University Of California Microprocessor system for quantitative chromatographic data analysis
JPH0694696A (ja) * 1992-09-17 1994-04-08 Hitachi Ltd クロマトグラム解析方法及びクロマトグラフ装置
JPH06324029A (ja) * 1993-03-15 1994-11-25 Hitachi Ltd クロマトグラム解析表示方法及びその装置
CN1423749A (zh) * 2000-07-04 2003-06-11 模式识别系统控股有限公司 分析选定的多组分样品的方法
US20150066387A1 (en) * 2013-08-30 2015-03-05 Shimadzu Corporation Substance identification method and mass spectrometer using the same
CN106248844A (zh) * 2016-10-25 2016-12-21 中国科学院计算技术研究所 一种肽段液相色谱保留时间预测方法及系统
CN107440684A (zh) * 2016-05-09 2017-12-08 三星电子株式会社 用于预测分析物的浓度的方法和设备
CN108064341A (zh) * 2017-06-12 2018-05-22 深圳前海达闼云端智能科技有限公司 物质成分检测方法、装置和检测设备
CN108351331A (zh) * 2015-11-05 2018-07-31 株式会社岛津制作所 色谱质谱分析数据处理方法以及处理装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016004525A (ja) * 2014-06-19 2016-01-12 株式会社日立製作所 データ分析システム及びデータ分析方法
WO2018117129A1 (ja) * 2016-12-19 2018-06-28 株式会社ユカシカド 尿検査装置および尿検査方法
WO2019092837A1 (ja) * 2017-11-09 2019-05-16 富士通株式会社 波形解析装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4468742A (en) * 1981-03-17 1984-08-28 The Regents Of University Of California Microprocessor system for quantitative chromatographic data analysis
JPH0694696A (ja) * 1992-09-17 1994-04-08 Hitachi Ltd クロマトグラム解析方法及びクロマトグラフ装置
JPH06324029A (ja) * 1993-03-15 1994-11-25 Hitachi Ltd クロマトグラム解析表示方法及びその装置
CN1423749A (zh) * 2000-07-04 2003-06-11 模式识别系统控股有限公司 分析选定的多组分样品的方法
US20150066387A1 (en) * 2013-08-30 2015-03-05 Shimadzu Corporation Substance identification method and mass spectrometer using the same
CN108351331A (zh) * 2015-11-05 2018-07-31 株式会社岛津制作所 色谱质谱分析数据处理方法以及处理装置
CN107440684A (zh) * 2016-05-09 2017-12-08 三星电子株式会社 用于预测分析物的浓度的方法和设备
CN106248844A (zh) * 2016-10-25 2016-12-21 中国科学院计算技术研究所 一种肽段液相色谱保留时间预测方法及系统
CN108064341A (zh) * 2017-06-12 2018-05-22 深圳前海达闼云端智能科技有限公司 物质成分检测方法、装置和检测设备

Also Published As

Publication number Publication date
JP2020101543A (ja) 2020-07-02
JP7483367B2 (ja) 2024-05-15
US20210311001A1 (en) 2021-10-07
WO2020129895A1 (ja) 2020-06-25

Similar Documents

Publication Publication Date Title
US20210311001A1 (en) Information processing apparatus, control method of information processing apparatus, and computer-readable storage medium therefor
Checa et al. Lipidomic data analysis: tutorial, practical guidelines and applications
Xi et al. Statistical analysis and modeling of mass spectrometry-based metabolomics data
WO2020105566A1 (ja) 情報処理装置、情報処理装置の制御方法、プログラム、算出装置、及び算出方法
US7676329B2 (en) Method and system for processing multi-dimensional measurement data
JP5496650B2 (ja) サンプル内の個々の要素を識別及び定量化するために分光測定データを分析するシステム、方法及びコンピュータプログラム製品
EP3495812A1 (en) Analysis data processing method and analysis data processing device
Hendrickx et al. Reverse engineering of metabolic networks, a critical assessment
Ortiz et al. Usefulness of PARAFAC for the quantification, identification, and description of analytical data
Percival et al. Univariate and multivariate statistical approaches to the analysis and interpretation of NMR-based metabolomics datasets of increasing complexity
Ju et al. Identification of rice varieties and adulteration using gas chromatography-ion mobility spectrometry
US11841373B2 (en) Information processing apparatus, method for controlling information processing apparatus, and program
Rezaei-Tavirani et al. Advantage of applying OSC to 1H NMR-based metabonomic data of celiac disease
US20220252531A1 (en) Information processing apparatus and control method for information processing apparatus
JP2020106340A (ja) 情報処理装置、情報処理装置の制御方法、及びプログラム
JP2021009135A (ja) 情報処理装置、情報処理装置の制御方法、及びプログラム
CN104350378B (zh) 用于测量光谱系统的性能的方法和设备
Oller-Moreno et al. Sliding window multi-curve resolution: application to gas chromatography–ion mobility spectrometry
Sena et al. Chemometrics in bioanalytical chemistry
SkOV et al. Chemometrics, mass spectrometry, and foodomics
Akbari Lakeh et al. Discriminating normal regions within cancerous hen ovarian tissue using multivariate hyperspectral image analysis
Wijetunge et al. Unsupervised learning for exploring MALDI imaging mass spectrometry ‘omics’ data
Mohammadkhani et al. Effect of different pretreatment methods on classification of serum samples measured with 1 H-NMR
Mattsson Analysis of LC-MS data in untargeted nutritional metabolomics
Ten-Doménech et al. Analysis of longitudinal metabolomic data using multivariate curve resolution-alternating least squares and pathway analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination