CN110214271A - 分析数据解析方法以及分析数据解析装置 - Google Patents

分析数据解析方法以及分析数据解析装置 Download PDF

Info

Publication number
CN110214271A
CN110214271A CN201780084104.7A CN201780084104A CN110214271A CN 110214271 A CN110214271 A CN 110214271A CN 201780084104 A CN201780084104 A CN 201780084104A CN 110214271 A CN110214271 A CN 110214271A
Authority
CN
China
Prior art keywords
data
analysis
caused
sample
machine learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201780084104.7A
Other languages
English (en)
Other versions
CN110214271B (zh
Inventor
玉井雄介
梶原茂树
藤田真
爱须亮太
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shimadzu Corp
Original Assignee
Shimadzu Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shimadzu Corp filed Critical Shimadzu Corp
Publication of CN110214271A publication Critical patent/CN110214271A/zh
Application granted granted Critical
Publication of CN110214271B publication Critical patent/CN110214271B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/0027Methods for using particle spectrometers
    • H01J49/0036Step by step routines describing the handling of the data generated during a measurement
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/0033Features or image-related aspects of imaging apparatus classified in A61B5/00, e.g. for MRI, optical tomography or impedance tomography apparatus; arrangements of imaging apparatus in a room
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/478Contour-based spectral representations or scale-space representations, e.g. by Fourier analysis, wavelet analysis or curvature scale-space [CSS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • G06F2218/10Feature extraction by analysing the shape of a waveform, e.g. extracting parameters relating to peaks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Radiology & Medical Imaging (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Analytical Chemistry (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Chemical & Material Sciences (AREA)
  • Biophysics (AREA)
  • Pathology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Quality & Reliability (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

该分析数据解析方法是一种使用了由分析装置(1)测量出的分析结果数据(31)的机器学习的解析方法,包括以下步骤:生成对分析结果数据(31)在不对识别造成影响的范围内加入数据变动所得到的模拟数据(32);使用所生成的模拟数据(32)进行机器学习;以及使用通过机器学习得到的判别基准(23b)进行判别。

Description

分析数据解析方法以及分析数据解析装置
技术区域
本发明涉及一种分析数据解析方法,特别是涉及一种使用了机器学习的分析数据解析方法以及分析数据解析装置。
背景技术
以往,已知一种使用了机器学习的分析数据解析方法。这种分析数据解析方法例如在日本特开2016-28229号公报中被公开。
在上述日本特开2016-28229号公报中公开了一种使用机器学习来解析谱数据的分析数据解析方法。在机器学习中,需要利用多个数据(多个模式)进行学习。在上述日本特开2016-28229号公报中,从谱数据间隔剔除谱成分来降低各个学习用数据的数据量。
现有技术文献
专利文献
专利文献1:日本特开2016-28229号公报
发明内容
发明要解决的问题
然而,在上述日本特开2016-28229号公报中公开的使用了机器学习的分析数据解析方法等使用了机器学习的分析数据解析方法中,难以大量获取适于机器学习的数据(作为判别对象的典型的数据)。例如以几千为单位获取生物体试样的分析结果数据等是困难的。在用于机器学习的数据数少的情况下,存在机器学习的精度易于因数据变动而降低等问题。
本发明是为了解决如上所述的问题而完成的,本发明的目的之一在于,提供一种即使在使用机器学习对难以大量获取作为判别对象的典型的数据的分析数据进行判别的情况下也能够使机器学习的精度提高的分析数据解析方法以及数据解析装置。
用于解决问题的方案
为了实现上述目的,本发明的第一方面中的分析数据解析方法是一种使用了由分析装置测量出的分析结果数据的机器学习的解析方法,包括以下步骤:多个模拟数据生成步骤,生成对多个分析结果数据在不对识别造成影响的范围内加入数据变动所得到的多个模拟数据;使用所生成的多个模拟数据进行机器学习;以及判别步骤,使用通过机器学习得到的判别基准进行判别。此外,在本发明中“不对识别造成影响的范围”设为在加入了数据变动时判别的结果不会反转的范围。
本发明的第一方面的分析数据解析方法如上所述那样包括以下步骤:在不对识别造成影响的范围内加入数据变动来生成多个模拟数据;使用所生成的多个模拟数据进行机器学习;以及使用通过机器学习得到的判别基准进行判别。由此,能够生成在不对识别造成影响的范围内加入变动所得到的多个模拟数据。其结果,能够增加用于机器学习的数据,因此能够提高机器学习的精度。
在此,在图像识别的领域,通过对获取到的图像加入变换来增加数据数是容易的,但是在科学分析的数据的情况下,难以确认数据可变动范围,在只是单纯增加数据的情况下,虽然对训练数据进行了学习,但是也可能由于过度匹配而导致判别精度降低,该过度匹配是无法对未知的数据(想要判别的数据)进行匹配(无法通用化)的状态。因此,在上述第一方面的分析数据解析方法中,优选的是,不对识别造成影响的范围是与伴随由分析装置进行的测量所产生的特定的变动因素对应的范围。由此,能够将伴随分析装置的测量而由各种因素产生的数据的偏差、偏移等变动进行模拟数据化来进行学习。其结果,能够抑制由伴随分析装置的测量所产生的变动因素导致的机器学习的精度的降低。
在该情况下,优选的是,多个分析结果数据是由分析装置获得的谱,特定的变动因素是在使用分析装置获得谱时产生的由分析装置或试样引起的变动因素。由此,并非学习简单的数值数据,而能够学习对由于具有分布而难以评价可变动范围的谱加入伴随实际的测量所产生的变动而生成的多个模拟数据。其结果,能够抑制伴随实际的测量所产生的由分析装置或试样引起的变动因素所导致的机器学习的精度的降低。
在上述不对识别造成影响的范围是与伴随由分析装置进行的测量所产生的特定的变动因素对应的范围的分析数据解析方法中,优选的是,多个模拟数据是通过在由特定的变动因素引起的多个分析结果数据的变动的范围内加入数据变动而生成的。由此,能够使用加入伴随由分析装置进行的测量所产生的变动而生成的多个模拟数据进行学习。其结果,能够抑制伴随由分析装置进行的测量所产生的多个变动因素所导致的机器学习的精度的降低。
在该情况下,优选的是,还包括以下步骤:获取由特定的变动因素引起的多个分析结果数据的变动;以及通过加入所获取到的由特定的变动因素引起的多个分析结果数据的变动,来生成多个模拟数据。由此,能够使用与伴随实际的测量所产生的变动因素对应的模拟数据进行学习,并且能够抑制利用加入了并非伴随测量所产生的数据变动所得到的模拟数据进行学习。其结果,能够抑制过度匹配,因此能够抑制机器学习的精度降低。
在对上述多个分析结果数据在由特定的变动因素引起的变动的范围内加入数据变动的分析数据解析方法中,优选的是,在多个模拟数据生成步骤中,通过与由试样引起的谱的强度变化的比例相应地使谱的强度值变动,来生成多个模拟数据。由此,能够使用与作为伴随测量所产生的变动因素之一的按试样各不相同的谱的强度变化的比例(数据的偏移)对应的模拟数据进行学习。其结果,能够抑制由按试样各不相同的谱的强度变化的比例引起的机器学习的精度的降低。
在对上述多个分析结果数据在由特定的变动因素引起的变动的范围内加入数据变动的分析数据解析方法中,优选的是,随着试样的质量或试样吸收的波长的增加,由试样引起的谱的强度变化的比例以大致固定的比例增加或减少,通过将强度变化的比例乘以谱的强度值来生成多个模拟数据。由此,能够使用反映了与试样的质量或试样吸收的波长的值相应的谱的强度变化的比例的模拟数据来进行学习。其结果,能够抑制由与试样的质量或试样吸收的波长的值相应的谱的强度变化的比例引起的机器学习的精度的降低。
在对上述多个分析结果数据在由特定的变动因素引起的变动的范围内加入数据变动的分析数据解析方法中,优选的是,在多个模拟数据生成步骤中,通过对谱的基线给予与在测定分析数据时产生的基线的变动对应的变动,来生成多个模拟数据。由此,能够使用与作为伴随测量所产生的变动因素之一的测定环境的差异对应的模拟数据来进行学习。其结果,能够抑制由测定环境的差异引起的机器学习的精度的降低。
在对上述多个分析结果数据在由特定的变动因素引起的变动的范围内加入数据变动的分析数据解析方法中,优选的是,在多个模拟数据生成步骤中,加入多个分析装置的个体差异数据之差来生成多个模拟数据。由此,能够使用与作为伴随测量所产生的变动因素之一的分析装置之间的谱的检测灵敏度的误差对应的模拟数据来进行学习。其结果,能够抑制由分析装置间的检测灵敏度的误差导致的机器学习的精度的降低。
在对上述多个分析结果数据在由特定的变动因素引起的变动的范围内加入数据变动的分析数据解析方法中,优选的是,在多个模拟数据生成步骤中,通过对多个分析结果数据在不对识别造成影响的范围内加入随机数,来生成多个模拟数据。由此,能够使用与作为伴随测量所产生的变动因素之一的随机噪声对应的模拟数据来进行学习。其结果,能够在测量时混入了噪声的情况下抑制机器学习的精度降低。
在对上述多个分析结果数据在由特定的变动因素引起的变动的范围内加入数据变动的分析数据解析方法中,优选的是,在多个模拟数据生成步骤中,通过与在由分析装置进行测量时检测到的杂质相应地对谱加入杂质的峰,来生成多个模拟数据。由此,能够使用与作为伴随测量所产生的变动因素之一的杂质的混入对应的模拟数据来进行学习。其结果,能够在混入了杂质时抑制机器学习的精度降低。
在上述特定的变动因素是在使用分析装置获得谱时产生的由分析装置或试样引起的变动因素的分析数据解析方法中,优选的是,针对由作为分析装置的、用于生成质谱的质谱分析装置测量出的多个分析结果数据,使用多个模拟数据进行机器学习。由此,能够生成对得到的质谱加入伴随质谱分析装置的测量所产生的变动所得到的多个模拟数据以用于机器学习。其结果,能够抑制由伴随质谱分析装置的测量所产生的特定因素导致的机器学习的精度的降低。
在该情况下,优选的是,多个分析结果数据包含从被检者提取出的生物体试样的质谱,在判别步骤中,使用判别基准对试样的多个分析结果数据进行癌的判别。由此,能够通过根据由机器学习生成的判别基准对使用难以大量获取的生物体试样得到的质谱的数据进行判别,由此进行癌判别。
本发明的第二方面的分析数据解析装置具备:数据输入部,其获取由分析装置获得的分析结果数据;存储部,其存储有判别基准和机器学习的判别算法,其中,该判别基准是通过使用模拟数据进行机器学习而生成的,所述模拟数据是对分析结果数据在不对识别造成影响的范围内加入数据变动而生成的;以及运算部,其使用判别基准,按照判别算法对由数据输入部获取到的分析结果数据进行判别。
如上所述,本发明的第二方面的分析数据解析装置具备:数据输入部,其获取分析结果数据;存储部,其存储有判别基准和机器学习的判别算法,其中,该判别基准是通过使用模拟数据进行机器学习而生成的,该模拟数据是对分析结果数据在不对识别造成影响的范围内加入数据变动而生成的;以及运算部,其使用判断基准对获取到的分析结果数据进行判别。由此,能够生成在不对识别造成影响的范围内加入变动所得到的多个模拟数据。其结果,能够增加用于机器学习的数据,因此能够提高机器学习的精度。
发明的效果
根据本发明,如上所述,能够提供一种即使在使用机器学习对难以大量获取作为判别对象的典型的数据的分析数据进行判别的情况下也能够提高机器学习的精度的分析数据解析方法以及数据解析装置。
附图说明
图1是示出本发明的第一实施方式~第五实施方式的分析数据解析装置的概要的框图。
图2是示出本发明的第一实施方式的学习时流程(A)和判别时流程(B)的流程图。
图3是示出本发明的第一实施方式的试样的强度比的图表。
图4是示出在本发明的第一实施方式中使用的分析结果数据(A)和生成的模拟数据(B)的谱图。
图5是用于说明本发明的第一实施方式的判别结果的表。
图6是示出在本发明的第二实施方式中使用的分析结果数据(A)和生成的模拟数据(B)的谱图。
图7是示出本发明的第三实施方式的由装置间的灵敏度曲线的差异引起的强度比的图表。
图8是示出在本发明的第三实施方式中使用的分析结果数据(A)和生成的模拟数据(B)的谱图。
图9是示出在本发明的第四实施方式中使用的分析结果数据(A)和生成的模拟数据(B)的谱图。
图10是示出在本发明的第五实施方式中使用的分析结果数据(A)和生成的模拟数据(B)的谱图。
图11是示出本发明的第六实施方式的分析数据解析装置的概要的框图。
具体实施方式
下面,基于附图来说明本发明的具体的实施方式。
[第一实施方式]
首先,参照图1~图5来说明第一实施方式的分析数据解析装置100的结构。
如图1所示,分析数据解析装置100具备数据处理部2。另外,分析数据解析系统由分析数据解析装置100和分析装置1构成。另外,分析数据解析装置100也作为分析装置1的控制装置发挥功能。
分析数据解析装置100使用所生成的质谱32(参照图4的(B))进行机器学习,其结果,使用所得到的判别基准23b进行试样3的判别。例如在试样3为生物体试样的情况下,判别是癌等的判别。另外,例如在试样3为非生物体试样的情况下,是材质判别等。
分析装置1是对测定试样3进行科学分析的装置。分析装置1例如生成谱来作为分析结果数据。如果是生成谱的分析装置,则可以是任何装置,例如是生成质谱的质谱分析装置。在第一实施方式中,构成为针对由作为分析装置的用于生成质谱的分析装置1测量出的多个分析结果数据,使用多个模拟数据进行机器学习。
分析装置1可以是任何类型,例如是基质辅助激光分离离子化四极离子阱飞行时间质谱分析装置(MALDI-QIT-TOFMS)。
分析装置1具备:离子化部10、离子阱11以及飞行时间质谱分析部12。
分析装置1在离子化部10中利用MALDI法使试样3离子化,利用离子阱11暂时捕捉所产生的离子,并进行与质荷比(m/z)相应的离子的筛选。从离子阱11射出的离子因由飞行时间质谱分析部12所具备的反射电极13产生的电场而折返,被离子检测器14检测。
数据处理部2包括分析控制部21、谱制作部22、存储部23以及运算部24。在存储部23中存储有用于判别的判别算法23a和通过机器学习生成的判别基准23b。判别基准23b是通过机器学习生成的用于判别的参数。作为机器学习的例子,例如使用SVM(SupportVector Machine:支持向量机)。另外,判别例如是癌的判别。
分析控制部21控制离子化部10、离子阱11以及飞行时间质谱分析部12。另外,谱制作部22基于在离子检测器14中检测出的值来生成质谱,将生成的质谱的数据发送到运算部24。运算部24使用存储部23中存储的判别算法23a和判别基准23b对输入的质谱进行判别。
输入部5例如是键盘、鼠标、触摸面板等,该输入部5与数据处理部2连接来进行使谱解析开始等操作。另外,显示部4例如是与数据处理部2连接的液晶显示器等监视器,用于显示判别结果等。
另外,在第一实施方式中,测量试样3是生物体试样。例如是从被检者提取出的尿、血液。另外,在第一实施方式中,分析结果数据包含从被检者提取出的生物体试样3的质谱,构成为在判别步骤中使用判别基准23b对试样3的多个分析结果数据进行癌的判别。
接着,参照图2来说明第一实施方式的学习时的流程和判别时的流程。
首先,参照图2的(A)来说明学习时的流程。在进行试样3的质谱的判别之前,利用与数据处理部2独立的学习装置(例如计算机)实施学习。图2的(A)是示出学习时的流程的流程图。在步骤S1中获取试样3的质谱。接着,在步骤S2中生成加入了伴随测量所产生的变动因素所得到的多个模拟数据。接着,在步骤S3中使用获取到的质谱和生成的多个模拟数据进行机器学习来生成判别基准23b。
接着,参照图2的(B)来说明判别时的流程。由数据处理部2的运算部24进行判别。图2的(B)是示出学习时的流程的流程图。在步骤S4中获取试样3的质谱。接着,在步骤S5中使用在步骤S3中生成的判别基准23b来进行癌判别。
接着,参照图3和图4来说明本发明的第一实施方式的模拟数据生成步骤。
图3是表示试样3的谱的质荷比与获得的谱的强度变化的比例的关系的图表30,横轴表示质荷比(m/z),纵轴表示获得的谱的强度变化的比例。在质谱分析中,根据所测量的试样的不同,所获得的谱的强度有时与实际的值不同。在第一实施方式中,关于试样3的质谱,在质荷比小的范围内获得的检测强度比实际的值大,反之,在质荷比大的范围内,检测强度比小于实际的值。直线30a示出试样3的质谱与实际的值相比较的情况下的比例,随着质荷比增加,强度变化的比例以大致固定的比例增加。
图4的(A)是试样3的分析结果数据的质谱31,图4的(B)是对质谱31在不对识别造成影响的范围内加入数据变动而生成的模拟数据的质谱32。此外,不对识别造成影响的范围是指与伴随由分析装置1进行的测量所产生的特定的变动因素对应的范围,在第一实施方式中,对加入由这些变动因素中的以下变动因素引起的变动来生成模拟数据的例子进行说明,该变动因素是在使用分析装置1获得试样3的质谱31时的由试样3引起的。即,通过在由试样3的强度变化的比例引起的质谱31的变动的范围内加入数据变动来生成质谱32。另外,质谱31和质谱32是本发明的“多个分析结果数据”和“多个模拟数据”的一例。
在第一实施方式中包括以下步骤:获取由特定的变动因素引起的多个分析结果数据的变动;以及通过加入所获取到的由特定的变动因素引起的多个分析结果数据的变动来生成多个模拟数据。具体地说,获取作为试样3的分析结果数据的质谱31的强度变化的比例,将获取到的强度变化的比例乘以质谱31,由此生成作为模拟数据的质谱32。如图3的图表所示,在质荷比为400以下的范围内,强度比的值为1.0以下,因此生成的质谱32的区域32a的谱的检测强度比质谱31的区域31a的检测强度小。另外,在质荷比大于400的范围内,强度比的值大于1.0,因此,生成的质谱32的区域32b的检测强度比质谱31的区域31b的检测强度大。
在第一实施方式中,生成在图3的图表30示出的直线30a的比例的范围内加入变动所得到的多个模拟数据,以进行机器学习。
图5是表示使用判别基准23b进行试样3的判别所得到的结果的表,该判别基准23b是以使正确答案(癌)数据和不正确答案(非癌)数据各自的数据数为预先收集到的分析结果数据的3倍和5倍的方式生成模拟数据并进行机器学习而生成的。随着数据量增加,判别一致度和特异度的精度提高。另外,在使数据数从3倍增加到5倍的情况下,灵敏度的精度略微降低,但认为这是由于通过提高判别一致度使灵敏度接近了真值。在此,3倍和5倍的数据数是指分析结果数据与模拟数据的总数为分析结果数据的3倍和5倍的数据数。此外,在本说明书中,“灵敏度”是指例如在癌判别的情况下将癌判定为癌的比例,“特异度”是指将非癌判定为非癌的比例。
(第一实施方式的效果)
在第一实施方式中能够获得如下的效果。
在第一实施方式中,如上所述,分析数据解析装置100的数据处理部2的谱制作部22基于由分析装置1的离子检测器14检测出的试样3的离子强度来生成质谱31。由谱制作部22生成的质谱31被发送到运算部24。运算部24构成为使用存储部23中存储的判别算法23a和判别基准23b对输入的质谱31进行判别。另外,在第一实施方式中包括通过将试样3的每个质荷比的强度变化的比例乘以质谱31来生成质谱32的步骤。由此,能够生成在不对判别造成影响的范围内加入变动所得到的模拟数据(质谱32)。其结果,能够增加用于机器学习的数据,因此能够提高机器学习的精度。
另外,在第一实施方式中,如上所述,不对识别造成影响的范围是与伴随由分析装置1进行的测量所产生的特定的变动因素对应的范围。由此,能够学习与伴随分析装置1的测量所产生的变动因素对应的数据,因此能够抑制由伴随分析装置1的测量所产生的变动因素导致的机器学习的精度的降低。
另外,在第一实施方式中,如上所述,分析结果数据是由分析装置1获得的质谱31,特定的变动因素是在使用分析装置1获得质谱31时产生的由试样3引起的变动因素。由此,能够学习与获得质谱31时的由试样3引起的变动因素对应的质谱32,因此能够抑制由试样3引起的变动因素所导致的机器学习的精度的降低。
另外,在第一实施方式中,如上所述,通过在由试样3的强度变化的比例引起的质谱31的变动的范围内加入数据变动来生成质谱32。由此,能够使用加入了伴随由分析装置1进行的测量所产生的变动而生成的质谱32来进行学习。其结果,能够抑制伴随由分析装置1进行的测量所产生的多个变动因素所导致的机器学习的精度的降低。
另外,在第一实施方式中,如上所述那样包括以下步骤:获取由试样3的强度变化的比例引起的质谱31的变动;以及通过加入获取到的由试样3的强度变化的比例引起的质谱31的变动来生成质谱32。由此,能够使用与伴随测量所产生的试样3的强度变化的比例对应的质谱32来进行学习,并且能够抑制利用并非伴随测量所产生的数据变动进行学习。其结果,能够抑制过度匹配,因此能够抑制机器学习的精度降低。
另外,在第一实施方式中,如上所述,在模拟数据生成步骤中,通过与由试样3引起的质谱31的强度变化的比例相应地使质谱31的强度值变动来生成质谱32。由此,能够使用与按试样3各不相同的质谱31的强度变化的比例对应的质谱32来进行学习。其结果,能够抑制由按试样3各不相同的质谱31的强度变化的比例引起的机器学习的精度的降低。
另外,在第一实施方式中,如上所述,随着试样3的质量的增加,由试样3引起的质谱31的强度变化的比例以大致一定的比例增加,通过将强度变化的比例乘以质谱31的强度值来生成质谱32。由此,能够使用反映了与试样3的质量相应的质谱31的强度变化的比例的质谱32来进行学习。其结果,能够抑制由与试样3的质量的值相应的质谱31的强度变化的比例引起的机器学习的精度的降低。
另外,在第一实施方式中,如上所述,针对由作为分析装置的用于生成质谱的分析装置1测量出的质谱31,使用质谱32进行机器学习。由此,能够生成对得到的质谱31加入伴随分析装置1的测量所产生的变动所得到的质谱32以用于机器学习。其结果,能够抑制由伴随分析装置1的测量所产生的特定因素导致的机器学习的精度的降低。
另外,在第一实施方式中,如上所述,分析结果数据包含从被检者提取出的生物体试样3的质谱31,在判别步骤中使用判别基准23b对试样3的质谱31进行癌的判别。由此,通过机器学习来判别质谱31的数据,由此能够进行癌判别。此外,生物体试样3例如是从被检者提取出的血液、尿。
[第二实施方式]
接着,参照图1和图6来说明第二实施方式的分析数据解析装置200的结构。在第二实施方式中,对加入伴随测量所产生的特定的变动因素中的由试样3的质谱的基线的变动引起的变动来制作模拟数据的例子进行说明。
图6是试样3的质谱40以及通过给予与在测定质谱40时产生的基线的变动对应的变动而生成的质谱41。与质谱40的基线的高度h1相比,质谱41的基线的高度h2变小。此外,质谱40和质谱41是本发明的“多个分析结果数据”和“多个模拟数据”的一例。
第二实施方式的分析数据解析装置200在模拟数据生成步骤中,同生成了与试样3的质谱31的强度变化的比例对应的质谱32的第一实施方式不同,生成与试样3的质谱40的基线的变动对应的模拟数据。此外,对与上述第一实施方式同样的结构附加相同的附图标记并省略其说明。
如图6所示,第二实施方式的分析数据解析装置200在模拟数据生成步骤中通过对试样3的质谱40的基线给予与在测定质谱40时产生的基线的变动对应的变动来生成质谱41。然后,使用所生成的质谱41进行学习,并生成判别基准23b,使用所生成的判别基准23b进行判别。在第二实施方式中,在试样3的质谱40的基线的上升范围或下降范围内使质谱40的基线下降或上升,由此制作多个模拟数据并进行机器学习。
另外,第二实施方式的分析数据解析装置200的其它结构与第一实施方式的分析数据解析装置100的结构相同。
(第二实施方式的效果)
在第二实施方式中能够获得如下效果。
在第二实施方式中,如上所述,通过对试样3的质谱40的基线给予与在测定质谱40时产生的基线的变动对应的变动来生成质谱41。由此,能够使用与测量环境的差异对应的质谱41来进行学习。其结果,能够抑制由测量环境的差异引起的机器学习的精度的降低。
另外,第二实施方式的分析数据解析装置200的其它效果与第一实施方式的分析数据解析装置100的效果相同。
[第三实施方式]
接着,参照图1、图7以及图8来说明第三实施方式的分析数据解析装置300的结构。在第三实施方式中,对加入伴随测量所产生的特定的变动因素中的由分析装置1的个体差异数据之差引起的变动来制作模拟数据的例子进行说明。
图7是示出分析装置1的个体差异数据之差的图表50。横轴是质荷比,纵轴是检测强度比。在此,个体差异数据相当于针对质荷比的检测灵敏度按每个分析装置1略微不同的个体差异。以共同的基准求出灵敏度的分布所得到的是灵敏度曲线,每个个体的灵敏度曲线之差是在利用其它分析装置1测定出作为模拟数据的基础的分析结果数据的情况下产生的数据的偏差。在图7的例子中,在质荷比为200以下,强度比小于1.0,在质荷比大于200的范围内,强度比的值大于1.0。另外,图8是试样3的质谱51以及在质谱51中反映了分析装置1的检测灵敏度的个体差异数据之差的质谱52。
如图7的图表所示,在质荷比为200以下的范围内,强度比的值为1.0以下,因此生成的质谱52的区域52a的谱的检测强度比质谱51的区域51a的检测强度小。另外,在质荷比大于200的范围内,强度比的值比1.0大,因此生成的质谱52的区域52b的检测强度比质谱51的区域51b的检测强度大。此外,质谱51和质谱52是本发明的“多个分析结果数据”和“多个模拟数据”的一例。
第三实施方式的分析数据解析装置300在模拟数据生成步骤中,同生成与试样3的质谱31的强度变化的比例对应的质谱32的第一实施方式不同,加入分析装置1的个体差异数据之差来生成质谱52。此外,在第三实施方式中,在图7的检测强度比以下的范围内对分析结果数据(质谱31)加入变动来制作多个模拟数据,从而进行机器学习。另外,对与上述第一实施方式同样的结构附加相同的附图标记并省略其说明。
第三实施方式的分析数据解析装置300在模拟数据生成步骤中对试样3的质谱51加入分析装置1的个体差异数据之差(图表50)来生成质谱52。然后,使用所生成的质谱52进行学习,生成判别基准23b,使用所生成的判别基准23b进行判别。
另外,第三实施方式的分析数据解析装置300的其它结构与第一实施方式的分析数据解析装置100的结构相同。
(第三实施方式的效果)
在第三实施方式中能够获得如下效果。
在第三实施方式中,如上所述那样对试样3的质谱51加入分析装置1的个体差异数据之差来生成质谱52,使用所生成的质谱52进行学习,使用得到的判别基准23b进行判别。由此,能够使用与分析装置1之间的谱的检测灵敏度的误差对应的质谱52进行学习。其结果,能够抑制由分析装置1之间的检测灵敏度的误差引起的机器学习的精度的降低。
另外,第三实施方式的分析数据解析装置300的其它效果与第一实施方式的分析数据解析装置100的效果相同。
[第四实施方式]
接着,参照图1和图9来说明第四实施方式的分析数据解析装置400的结构。在第四实施方式中,对加入伴随测量所产生的特定的变动因素中的由在测量时可能混入的随机噪声变动引起的变动来制作模拟数据的例子进行说明。
图9的(A)是试样3的质谱60,图9的(B)是对质谱60在不对识别造成影响的范围内加入了随机数所得到的质谱61。由于加入了随机数,因此在质谱61中整体上增加了峰。此外,在本实施方式中,“不对识别造成影响的范围”是指通过重复进行基于在实际进行数据收集的过程中产生的范围的标准试样的测量所得到的范围。另外,在本实施方式中,“随机数”是指与由往往在测定时不可避免地混入的随机噪声引起的数据变动对应的变动。另外,质谱60和质谱61是本发明的“多个分析结果数据”和“多个模拟数据”的一例。
第四实施方式的分析数据解析装置400在模拟数据生成步骤中,同生成与试样3的质谱31的强度变化的比例对应的质谱32的第一实施方式不同,通过对试样3的质谱60在不对识别造成影响的范围内加入随机数来生成质谱61。此外,对与上述第一实施方式同样的结构附加相同的附图标记并省略其说明。
第四实施方式的分析数据解析装置400在模拟数据生成步骤中通过对质谱60在不对识别造成影响的范围内加入随机数来生成质谱61。然后,使用在将生成的质谱61用于学习之后生成的判别基准23b来进行判别。
另外,第四实施方式的分析数据解析装置400的其它结构与第一实施方式的分析数据解析装置100的结构相同。
(第四实施方式的效果)
在第四实施方式中能够获得如下效果。
在第四实施方式中,如上所述,在模拟数据生成步骤中,通过对质谱60在不对识别造成影响的范围内加入随机数来生成质谱61。由此,能够使用与随机噪声对应的质谱61进行学习。其结果,能够在测量时混入了噪声的情况下抑制机器学习的精度降低。
另外,第四实施方式的分析数据解析装置400的其它效果与第一实施方式的分析数据解析装置100的效果相同。
[第五实施方式]
接着,参照图1和图10来说明第五实施方式的分析数据解析装置500的结构。在第五实施方式中,对加入伴随测量所产生的特定的变动因素中的由可能在测量时混入的杂质引起的变动来制作模拟数据的例子进行说明。
图10的(A)是试样3的质谱70,图10的(B)是通过对质谱70加入杂质的峰而生成的质谱71。此外,质谱70和质谱71是本发明的“多个分析结果数据”和“多个模拟数据”的一例。
第五实施方式的分析数据解析装置500在模拟数据生成步骤中,同生成与试样3的质谱31的强度变化的比例对应的质谱32的第一实施方式不同,通过与在由分析装置1进行测量时检测的杂质相应地对质谱70加入杂质的峰来生成模拟数据。能够在质谱71的区域71a中确认在质谱70的区域70a中未曾看到的杂质的峰。此外,作为杂质,例如考虑在处理试样3的情况下附着在作业人员的手指上的角质等。有可能混入的杂质根据试样3而不同,因此只要事先获取可能混入的杂质的数据即可。另外,对与上述第一实施方式同样的结构附加相同的附图标记并省略其说明。
第五实施方式的分析数据解析装置500在模拟数据生成步骤中通过与在由分析装置1进行测量时检测的杂质相应地对质谱70加入杂质的峰来生成质谱71。使用在将生成的质谱71用于学习之后生成的判别基准23b来进行判别。在第五实施方式中,通过改变杂质的峰的高度来制作多个模拟数据以用于机器学习。
另外,第五实施方式的分析数据解析装置500的其它结构与第一实施方式的分析数据解析装置100的结构相同。
(第五实施方式的效果)
在第五实施方式中能够获得如下效果。
在第五实施方式中,如上所述那样通过与在由分析装置1进行测量时检测的杂质相应地对质谱70加入杂质的峰来生成质谱71。由此,能够使用与杂质的混入对应的质谱71进行学习。其结果,能够在混入了杂质时抑制机器学习的精度降低。
[第六实施方式]
接着,参照图11来说明第六实施方式的分析数据解析装置600的结构。同使用由分析装置1生成的质谱31进行判别的第一实施方式不同,第六实施方式的分析数据解析装置600构成为在数据输入部7中获取由其它分析装置生成的分析结果数据6,使用获取到的分析结果数据6来进行判别。
如图11所示,第六实施方式的分析数据解析装置600具备:数据输入部7,其获取由其它分析装置生成的分析结果数据6;存储部23,其存储有判别基准23b和机器学习的判别算法23a,其中,该判别基准23b是通过使用模拟数据进行机器学习而生成的,该模拟数据是对分析结果数据6在不对识别造成影响的范围内加入数据变动而生成的;以及运算部24,其使用判断基准23b对获取到的分析结果数据6进行判别。
第六实施方式的分析数据解析装置600对经由硬盘、USB存储器等外部保存介质、因特网获取到的分析结果数据进行解析。
(第六实施方式的效果)
在第六实施方式中能够获得如下效果。
在第六实施方式中,如上所述,分析数据解析装置600具备:数据输入部7,其获取分析结果数据6;存储部23,其存储有判别基准23b和机器学习的判别算法23a,其中,该判别基准23b是通过使用模拟数据进行机器学习而生成的,该模拟数据是对分析结果数据6在不对识别造成影响的范围内加入数据变动而生成的;以及运算部24,其使用判断基准23b对获取到的分析结果数据6进行判别。由此,能够生成在不对判别造成影响的范围内加入变动所得到的多个模拟数据。其结果,能够增加用于机器学习的数据,因此能够提高机器学习的精度。
[变形例]
此外,应该认为本次公开的实施方式在所有方面都是例示性的而不是限制性的。本发明的范围并非由上述实施方式的说明来表示,而是由权利要求书来表示,本发明的范围还包括与权利要求书等同的含义和范围内的所有变更(变形例)。
例如,在上述第一实施方式~第五实施方式中示出获得质谱来作为分析结果数据的例子,但是本发明不限于此。也可以将非谱的数据作为分析结果数据。
另外,在上述第一实施方式~五实施方式中示出使用MALDI法来作为离子化部10的离子化方法的例子,但是本发明不限于此。例如也可以使用ESI(电喷雾法)等来作为离子化的方法。
另外,在上述第一实施方式~第五实施方式中示出构成为具备质谱分析装置来作为分析装置的例子,但是本发明不限于此。在本发明中,只要是能够获得谱来作为分析结果数据、并对得到的谱加入伴随检测所产生的变动的分析装置即可。例如既可以使用FT-IR(傅里叶变换红外谱仪),也可以使用色谱仪。
另外,在上述第一实施方式~第五实施方式中分别示出制作加入与伴随测量所产生的变动因素对应的变动所得到的模拟数据来进行学习的例子,但是本发明不限于此。在本发明中,既可以将在第一实施方式~第五实施方式中制作出的模拟数据进行组合来进行机器学习,也可以使用所有的模拟数据进行机器学习。若像这样构成,则能够增加用于机器学习的数据数(数据的模式),因此能够进一步提高机器学习的精度。
另外,在上述第一实施方式~第六实施方式中,作为机器学习的方法,示出使用SVM(支持向量机)生成判别基准23b的例子,但是本发明不限于此。例如,既可以使用神经网络,也可以使用迭代算法(AdaBoost)。还可以是除这些以外的机器学习。
另外,在上述第一实施方式中示出用于癌的判别的例子,但是本发明不限于此。例如也可以用于除癌以外的疾病的判别。
附图标记说明
1:分析装置;6、31、40、51、60、70:分析结果数据;7:数据输入部;23:存储部;23a:判别算法;23b:判别基准;24:运算部;30:由试样的质量引起的强度比(伴随分析装置的测量所产生的特定的变动因素);32、41、52、61、71:模拟数据;100、200、300、400、500、600:分析数据解析装置。

Claims (14)

1.一种分析数据解析方法,使用了由分析装置测量出的分析结果数据的机器学习,该分析数据解析方法包括以下步骤:
多个模拟数据生成步骤,生成对多个分析结果数据在不对识别造成影响的范围内加入数据变动所得到的多个模拟数据;
使用所生成的所述多个模拟数据进行所述机器学习;以及
判别步骤,使用通过所述机器学习得到的判别基准进行判别。
2.根据权利要求1所述的分析数据解析方法,其特征在于,
所述不对识别造成影响的范围是与伴随由分析装置进行的测量所产生的特定的变动因素对应的范围。
3.根据权利要求2所述的分析数据解析方法,其特征在于,
所述多个分析结果数据是由分析装置获得的谱,
所述特定的变动因素是在使用所述分析装置获得所述谱时产生的由所述分析装置或试样引起的变动因素。
4.根据权利要求2或3所述的分析数据解析方法,其特征在于,
所述多个模拟数据是通过在由所述特定的变动因素引起的所述多个分析结果数据的变动的范围内加入数据变动而生成的。
5.根据权利要求4所述的分析数据解析方法,其特征在于,还包括以下步骤:
获取由所述特定的变动因素引起的所述多个分析结果数据的变动;以及
通过加入所获取到的由所述特定的变动因素引起的所述多个分析结果数据的变动,来生成所述多个模拟数据。
6.根据权利要求3所述的分析数据解析方法,其特征在于,
在所述多个模拟数据生成步骤中,通过与由所述试样引起的所述谱的强度变化的比例相应地使所述谱的强度值变动,来生成所述多个模拟数据。
7.根据权利要求3所述的分析数据解析方法,其特征在于,
随着所述试样的质量或所述试样吸收的波长的增加,由所述试样引起的所述谱的强度变化的比例以大致固定的比例增加或减少,通过将所述强度变化的比例乘以所述谱的强度值来生成所述多个模拟数据。
8.根据权利要求3所述的分析数据解析方法,其特征在于,
在所述多个模拟数据生成步骤中,通过对所述谱的基线给予与在测定所述多个分析结果数据时产生的所述基线的变动对应的变动,来生成所述多个模拟数据。
9.根据权利要求3所述的分析数据解析方法,其特征在于,
在所述多个模拟数据生成步骤中,加入多个分析装置的个体差异数据之差来生成所述多个模拟数据。
10.根据权利要求3所述的分析数据解析方法,其特征在于,
在所述多个模拟数据生成步骤中,通过对所述多个分析结果数据在所述不对识别造成影响的范围内加入随机数,来生成所述多个模拟数据。
11.根据权利要求3所述的分析数据解析方法,其特征在于,
在所述多个模拟数据生成步骤中,通过与在由所述分析装置进行测量时检测到的杂质相应地对所述谱加入所述杂质的峰,来生成所述多个模拟数据。
12.根据权利要求3所述的分析数据解析方法,其特征在于,
针对由作为所述分析装置的、用于生成质谱的质谱分析装置测量出的多个分析结果数据,使用所述多个模拟数据进行所述机器学习。
13.根据权利要求12所述的分析数据解析方法,其特征在于,
所述多个分析结果数据包含从被检者提取出的生物体试样的质谱,
在所述判别步骤中,使用所述判别基准对所述试样的所述多个分析结果数据进行癌的判别。
14.一种分析数据解析装置,具备:
数据输入部,其获取由分析装置获得的分析结果数据;
存储部,其存储有判别基准和机器学习的判别算法,其中,所述判别基准是使用模拟数据进行机器学习而生成的,所述模拟数据是对所述分析结果数据在不对识别造成影响的范围内加入数据变动而生成的;以及
运算部,其使用所述判别基准,按照所述判别算法对由所述数据输入部获取到的分析结果数据进行判别。
CN201780084104.7A 2017-01-19 2017-01-19 分析数据解析方法以及分析数据解析装置 Active CN110214271B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2017/001793 WO2018134952A1 (ja) 2017-01-19 2017-01-19 分析データ解析方法および分析データ解析装置

Publications (2)

Publication Number Publication Date
CN110214271A true CN110214271A (zh) 2019-09-06
CN110214271B CN110214271B (zh) 2022-11-15

Family

ID=62909062

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780084104.7A Active CN110214271B (zh) 2017-01-19 2017-01-19 分析数据解析方法以及分析数据解析装置

Country Status (5)

Country Link
US (1) US11423331B2 (zh)
EP (1) EP3572805A4 (zh)
JP (1) JP6813033B2 (zh)
CN (1) CN110214271B (zh)
WO (1) WO2018134952A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11507824B2 (en) * 2018-06-28 2022-11-22 Applied Materials, Inc. Training spectrum generation for machine learning system for spectrographic monitoring
EP3847958A4 (en) * 2018-09-04 2021-09-08 Shenzhen Institutes of Advanced Technology ARRHYTHMIA DETECTION METHOD AND APPARATUS, ELECTRONIC DEVICE AND COMPUTER INFORMATION MEDIA
WO2020070786A1 (ja) * 2018-10-02 2020-04-09 株式会社島津製作所 識別器の生成方法
JP2020101524A (ja) * 2018-11-19 2020-07-02 キヤノン株式会社 情報処理装置、情報処理装置の制御方法、プログラム、算出装置、及び算出方法
JP6915005B2 (ja) 2019-08-28 2021-08-04 日本電子株式会社 マススペクトル処理装置及びモデル生成方法
WO2021085581A1 (ja) * 2019-11-01 2021-05-06 キヤノン株式会社 情報処理装置、及び情報処理装置の制御方法
WO2023053216A1 (ja) * 2021-09-28 2023-04-06 富士通株式会社 機械学習プログラム、機械学習方法および機械学習装置

Citations (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5559728A (en) * 1990-10-09 1996-09-24 University Of Washington Calibration transfer for second order analytical instruments
CN1412539A (zh) * 2002-11-22 2003-04-23 中国人民解放军第二军医大学 快速定量分析复杂混合物的化学信息修饰法及光谱分析仪
CN1595117A (zh) * 2004-06-18 2005-03-16 中国科学院上海有机化学研究所 一种基于电荷耦合装置的在线自校正激光诱导荧光检测方法
WO2006098087A1 (ja) * 2005-03-14 2006-09-21 Japan Health Sciences Foundation 膵臓癌診断用マーカータンパク質
JP2006313124A (ja) * 2005-05-09 2006-11-16 Denso Corp 液面検出装置
EP1871063A2 (en) * 2006-06-21 2007-12-26 NTT DoCoMo Inc. Data transmission with trellis coding
WO2008094087A1 (en) * 2007-01-30 2008-08-07 Telefonaktiebolaget Lm Ericsson (Publ) Sbas correction information in ms based agps system
JP2008256667A (ja) * 2006-10-13 2008-10-23 Hitachi High-Technologies Corp 質量分析装置を用いた定量分析方法
CN101460826A (zh) * 2006-03-29 2009-06-17 坎根生物科技公司 用于提高峰的检测的过滤装置和方法
CN101520421A (zh) * 2009-04-08 2009-09-02 北京农产品质量检测与农田环境监测技术研究中心 一种土壤重金属含量检测模型的建模方法及其应用
US20100197237A1 (en) * 2007-07-04 2010-08-05 Zte Corporation Channel estimation method of the mobile communication system based on the time division pilot field
JP2011033346A (ja) * 2009-07-29 2011-02-17 Shimadzu Corp クロマトグラフ質量分析データ解析方法及び装置
CN102175750A (zh) * 2011-02-25 2011-09-07 中国科学院上海有机化学研究所 生物体样品基质辅助激光解吸离子化-傅立叶变换离子回旋共振质谱分析方法
CN102194641A (zh) * 2010-03-16 2011-09-21 株式会社岛津制作所 质量分析数据处理方法和质量分析数据处理设备
CN102252992A (zh) * 2011-04-28 2011-11-23 天津红日药业股份有限公司 一种对中药提取过程进行近红外在线检测方法
JP2012220365A (ja) * 2011-04-11 2012-11-12 Shimadzu Corp 糖ペプチド解析方法及び解析装置
JP2013210207A (ja) * 2012-03-30 2013-10-10 Nec Corp レーダ画像の目標識別装置、目標識別方法、及び目標識別プログラム
CN103563043A (zh) * 2011-03-31 2014-02-05 马泰奥·弗洛里迪亚 用于样品定量化学分析的具有对仪器响应的校准的特别是医学领域的系统及其对应方法
JP5441728B2 (ja) * 2010-01-15 2014-03-12 パナソニック株式会社 官能検査装置及び官能検査方法
JP2014044110A (ja) * 2012-08-27 2014-03-13 Shimadzu Corp 質量分析装置、及び該装置を用いた癌診断装置
GB2502604B (en) * 2012-05-31 2014-04-30 Broadcom Corp Determination of receiver path delay
WO2014085826A2 (en) * 2012-11-30 2014-06-05 Applied Proteomics, Inc. Method for evaluation of presence of or risk of colon tumors
JP2014178229A (ja) * 2013-03-15 2014-09-25 Dainippon Screen Mfg Co Ltd 教師データ作成方法、画像分類方法および画像分類装置
CN104572910A (zh) * 2014-12-26 2015-04-29 天津大学 一种基于向量模型的气相色谱质谱谱图检索方法
CN105008908A (zh) * 2013-02-22 2015-10-28 株式会社岛津制作所 数据处理装置以及数据处理方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8463718B2 (en) * 2000-08-07 2013-06-11 Health Discovery Corporation Support vector machine-based method for analysis of spectral data
GB2495899B (en) * 2011-07-04 2018-05-16 Thermo Fisher Scient Bremen Gmbh Identification of samples using a multi pass or multi reflection time of flight mass spectrometer
US8948487B2 (en) * 2011-09-28 2015-02-03 Siemens Aktiengesellschaft Non-rigid 2D/3D registration of coronary artery models with live fluoroscopy images
US20150170536A1 (en) * 2013-12-18 2015-06-18 William Marsh Rice University Time-Varying Learning and Content Analytics Via Sparse Factor Analysis
JP2016028229A (ja) 2014-07-08 2016-02-25 キヤノン株式会社 データ処理装置、及びそれを有するデータ表示システム、試料情報取得システム、データ処理方法、プログラム、記憶媒体

Patent Citations (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5559728A (en) * 1990-10-09 1996-09-24 University Of Washington Calibration transfer for second order analytical instruments
CN1412539A (zh) * 2002-11-22 2003-04-23 中国人民解放军第二军医大学 快速定量分析复杂混合物的化学信息修饰法及光谱分析仪
CN1595117A (zh) * 2004-06-18 2005-03-16 中国科学院上海有机化学研究所 一种基于电荷耦合装置的在线自校正激光诱导荧光检测方法
WO2006098087A1 (ja) * 2005-03-14 2006-09-21 Japan Health Sciences Foundation 膵臓癌診断用マーカータンパク質
JP2006313124A (ja) * 2005-05-09 2006-11-16 Denso Corp 液面検出装置
CN101460826A (zh) * 2006-03-29 2009-06-17 坎根生物科技公司 用于提高峰的检测的过滤装置和方法
EP1871063A2 (en) * 2006-06-21 2007-12-26 NTT DoCoMo Inc. Data transmission with trellis coding
JP2008256667A (ja) * 2006-10-13 2008-10-23 Hitachi High-Technologies Corp 質量分析装置を用いた定量分析方法
WO2008094087A1 (en) * 2007-01-30 2008-08-07 Telefonaktiebolaget Lm Ericsson (Publ) Sbas correction information in ms based agps system
US20100197237A1 (en) * 2007-07-04 2010-08-05 Zte Corporation Channel estimation method of the mobile communication system based on the time division pilot field
CN101520421A (zh) * 2009-04-08 2009-09-02 北京农产品质量检测与农田环境监测技术研究中心 一种土壤重金属含量检测模型的建模方法及其应用
JP2011033346A (ja) * 2009-07-29 2011-02-17 Shimadzu Corp クロマトグラフ質量分析データ解析方法及び装置
JP5441728B2 (ja) * 2010-01-15 2014-03-12 パナソニック株式会社 官能検査装置及び官能検査方法
CN102194641A (zh) * 2010-03-16 2011-09-21 株式会社岛津制作所 质量分析数据处理方法和质量分析数据处理设备
CN102175750A (zh) * 2011-02-25 2011-09-07 中国科学院上海有机化学研究所 生物体样品基质辅助激光解吸离子化-傅立叶变换离子回旋共振质谱分析方法
CN103563043A (zh) * 2011-03-31 2014-02-05 马泰奥·弗洛里迪亚 用于样品定量化学分析的具有对仪器响应的校准的特别是医学领域的系统及其对应方法
JP2012220365A (ja) * 2011-04-11 2012-11-12 Shimadzu Corp 糖ペプチド解析方法及び解析装置
CN102252992A (zh) * 2011-04-28 2011-11-23 天津红日药业股份有限公司 一种对中药提取过程进行近红外在线检测方法
JP2013210207A (ja) * 2012-03-30 2013-10-10 Nec Corp レーダ画像の目標識別装置、目標識別方法、及び目標識別プログラム
GB2502604B (en) * 2012-05-31 2014-04-30 Broadcom Corp Determination of receiver path delay
JP2014044110A (ja) * 2012-08-27 2014-03-13 Shimadzu Corp 質量分析装置、及び該装置を用いた癌診断装置
WO2014085826A2 (en) * 2012-11-30 2014-06-05 Applied Proteomics, Inc. Method for evaluation of presence of or risk of colon tumors
CN104969071A (zh) * 2012-11-30 2015-10-07 应用蛋白质组学公司 用于评估结肠肿瘤的存在或风险的方法
CN105008908A (zh) * 2013-02-22 2015-10-28 株式会社岛津制作所 数据处理装置以及数据处理方法
JP2014178229A (ja) * 2013-03-15 2014-09-25 Dainippon Screen Mfg Co Ltd 教師データ作成方法、画像分類方法および画像分類装置
CN104572910A (zh) * 2014-12-26 2015-04-29 天津大学 一种基于向量模型的气相色谱质谱谱图检索方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
A.K. CONLIN,ET AL: "Data augmentation: an alternative approach to the analysis of", 《CHEMOMETRICS AND INTELLIGENT LABORATORY SYSTEMS》 *
ISIDRO CORTES-CIRIANO,ET AL: "Improved Chemical Structure−Activity Modeling Through Data", 《JOURNAL OF CHEMICAL INFORMATION AND MODELING》 *
JAMES P.HOBERT, ET ALL: "Improving the Convergence Properties of", 《STATISTICAL SCIENCE》 *
M.J. S´AIZ-ABAJO ET: "Ensemble methods and data augmentation by noise addition applied to the analysis of spectroscopic data", 《ANALYTICA CHIMICA ACTA》 *
M.J. S´AIZ-ABAJO,ET AL: "Ensemble methods and data augmentation by noise addition", 《ANALYTICA CHIMICA ACTA》 *
蔡靖, 等: "单颗粒气溶胶飞行时间质谱仪在细颗粒物研究中的应用和进展", 《分析化学》 *

Also Published As

Publication number Publication date
US11423331B2 (en) 2022-08-23
EP3572805A4 (en) 2020-09-16
JP6813033B2 (ja) 2021-01-13
CN110214271B (zh) 2022-11-15
JPWO2018134952A1 (ja) 2019-11-07
WO2018134952A1 (ja) 2018-07-26
EP3572805A1 (en) 2019-11-27
US20200065699A1 (en) 2020-02-27

Similar Documents

Publication Publication Date Title
CN110214271A (zh) 分析数据解析方法以及分析数据解析装置
CN104025249B (zh) 针对滞留时间确定或确认的视窗化质谱分析数据的使用
CN104297355B (zh) 一种基于液相色谱/质谱联用的拟靶标代谢组学分析方法
Hantao et al. Multivariate curve resolution combined with gas chromatography to enhance analytical separation in complex samples: A review
CN109655532A (zh) 一种对卷烟分类鉴别的方法
JP6760380B2 (ja) 分析データ処理方法及び分析データ処理装置
DE102010019590A1 (de) Datenabhängiges Erfassungssystem für die Massenspektrometrie und Verfahren für dessen Anwendung
CN105793701B (zh) 质量分析方法和质量分析装置
WO2015037003A1 (en) Method and electronic nose for comparing odors
CN106062548A (zh) 质谱分析方法及质谱分析装置
Chen et al. Untargeted identification of adulterated Sanqi powder by near-infrared spectroscopy and one-class model
CN105981130A (zh) 质谱分析装置及质谱分析方法
WO2020105566A1 (ja) 情報処理装置、情報処理装置の制御方法、プログラム、算出装置、及び算出方法
CN109187840A (zh) 一种血液中有机污染物的高通量筛查分析方法
CN107132194A (zh) 一种基于紫外可见光谱及化学模式识别的三七及其伪品鉴别方法
CN106770003A (zh) 基于近红外光谱技术的木材识别方法及系统
CN105588892B (zh) 基于指纹图谱的微损鉴别交趾黄檀种属的方法
CN110579554A (zh) 3d质谱预测分类
CN107402192A (zh) 一种快速分析香精香料质量稳定性的方法
CN109791158A (zh) 用于复杂样品的多属性监测的方法
US11841373B2 (en) Information processing apparatus, method for controlling information processing apparatus, and program
CN110167659A (zh) 利用基质辅助激光解吸/离子化飞行时间质谱仪进行时间对强度分布分析
CN102906851A (zh) 分析质谱的方法、计算机程序及系统
CN107271396A (zh) 一种茶叶中总黄酮含量的快速检测方法
CN102998279A (zh) 一种快速鉴别灵芝孢子粉真伪的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant