CN111433592B - 辨别方法、辨别装置以及记录介质 - Google Patents
辨别方法、辨别装置以及记录介质 Download PDFInfo
- Publication number
- CN111433592B CN111433592B CN201880078199.6A CN201880078199A CN111433592B CN 111433592 B CN111433592 B CN 111433592B CN 201880078199 A CN201880078199 A CN 201880078199A CN 111433592 B CN111433592 B CN 111433592B
- Authority
- CN
- China
- Prior art keywords
- principal component
- cells
- raman
- cell
- spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012850 discrimination method Methods 0.000 title claims abstract description 10
- 238000001237 Raman spectrum Methods 0.000 claims abstract description 212
- 238000000034 method Methods 0.000 claims abstract description 67
- 238000001228 spectrum Methods 0.000 claims abstract description 58
- 238000000513 principal component analysis Methods 0.000 claims abstract description 44
- 238000001069 Raman spectroscopy Methods 0.000 claims description 108
- 238000012706 support-vector machine Methods 0.000 claims description 41
- 230000008569 process Effects 0.000 claims description 38
- 238000004364 calculation method Methods 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 18
- 238000010801 machine learning Methods 0.000 claims description 12
- 239000011159 matrix material Substances 0.000 claims description 11
- 230000003595 spectral effect Effects 0.000 claims description 9
- 230000005284 excitation Effects 0.000 claims description 7
- 210000004027 cell Anatomy 0.000 description 291
- 238000012545 processing Methods 0.000 description 40
- 238000004891 communication Methods 0.000 description 27
- 238000005259 measurement Methods 0.000 description 22
- 230000003287 optical effect Effects 0.000 description 11
- 238000001514 detection method Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 10
- 230000008859 change Effects 0.000 description 9
- 238000012544 monitoring process Methods 0.000 description 9
- 241000894007 species Species 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 210000004748 cultured cell Anatomy 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 150000001408 amides Chemical class 0.000 description 2
- 208000016557 Acute basophilic leukemia Diseases 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 102000018832 Cytochromes Human genes 0.000 description 1
- 108010052832 Cytochromes Proteins 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 210000003651 basophil Anatomy 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 210000003855 cell nucleus Anatomy 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000001678 irradiating effect Effects 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/63—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
- G01N21/65—Raman scattering
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/483—Physical analysis of biological material
- G01N33/487—Physical analysis of biological material of liquid biological material
- G01N33/48707—Physical analysis of biological material of liquid biological material by electrical means
- G01N33/48728—Investigating individual cells, e.g. by patch clamp, voltage clamp
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01J—MEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
- G01J3/00—Spectrometry; Spectrophotometry; Monochromators; Measuring colours
- G01J3/28—Investigating the spectrum
- G01J3/44—Raman spectrometry; Scattering spectrometry ; Fluorescence spectrometry
- G01J3/4412—Scattering spectrometry
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N15/00—Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
- G01N15/10—Investigating individual particles
- G01N15/14—Optical investigation techniques, e.g. flow cytometry
- G01N15/1429—Signal processing
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N15/00—Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
- G01N15/10—Investigating individual particles
- G01N15/14—Optical investigation techniques, e.g. flow cytometry
- G01N15/1434—Optical arrangements
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N15/00—Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
- G01N15/10—Investigating individual particles
- G01N15/14—Optical investigation techniques, e.g. flow cytometry
- G01N15/1456—Optical investigation techniques, e.g. flow cytometry without spatial resolution of the texture or inner structure of the particle, e.g. processing of pulse signals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N15/00—Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
- G01N15/10—Investigating individual particles
- G01N2015/1006—Investigating individual particles for cytology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Biomedical Technology (AREA)
- Dispersion Chemistry (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Signal Processing (AREA)
- Molecular Biology (AREA)
- Urology & Nephrology (AREA)
- Food Science & Technology (AREA)
- Medicinal Chemistry (AREA)
- Hematology (AREA)
- Biophysics (AREA)
- Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供辨别方法、学习方法、辨别装置以及存储介质,能够基于从细胞得到的拉曼光谱,与以往相比更准确地辨别细胞的种类。在辨别试样中包含的细胞的种类的方法中,从一个未辨别的细胞取得一个拉曼光谱,计算表示所述未辨别的细胞的拉曼光谱与多个主成分的光谱一致的程度的多个一致度,所述多个主成分的光谱通过由从种类明确的多个细胞的每一个逐个得到的拉曼光谱构成的多个拉曼光谱的主成分分析而得到,基于通过使用有监督学习的学习模型将与通过所述主成分分析得到的所述种类明确的多个细胞的每一个对应的多个主成分得分按种类分类的结果,对所述多个一致度进行分类,由此辨别所述未辨别的细胞的种类。
Description
技术领域
本发明涉及用于基于拉曼光谱辨别细胞的种类的辨别方法、学习方法、辨别装置以及记录介质。
背景技术
在再生医疗领域中,需要调查培养的细胞是否分化为所希望的种类的细胞。在医疗诊断领域中,有时调查从患者采集的细胞是否是正常种类的细胞。这样,需要辨别来自生物体的细胞的种类的方法。在使用对细胞进行染色的方法或破坏细胞的方法的情况下,无法观察所辨别的细胞的经时性变化或进行所辨别的细胞的培养等,因此辨别细胞的种类的方法优选为非破坏性和非侵入性方法。
作为这种方法具有利用拉曼分光的方法。在日本专利公开公报特开2010-181391号中记载了如下内容:对从细胞的多个部位测量的拉曼光谱或规定波长范围的拉曼光谱进行主成分分析,根据得到的主成分得分进行细胞的判定。
在测量来自细胞的拉曼散射光的情况下,从细胞膜、核、高尔基体等细胞内的各部分分别产生拉曼散射光。因此,由细胞得到的拉曼光谱为多个信号重叠的复杂的形状。因此,从由细胞得到的拉曼光谱中发现表征该细胞的拉曼谱带并进行评价是困难的。在日本专利公开公报特开2010-181391号所记载的技术中,需要得到细胞内的拉曼光谱的分布,存在测量所需的时间长的问题。此外,即使是同种的细胞,细胞内的各种结构体的分布也是多样的,得到与结构体的分布对应的拉曼光谱的分布的重要性也不明确。换句话说,利用拉曼光谱准确地辨别细胞的种类的方法尚未确立。
发明内容
本发明是鉴于这种情况而完成的,其目的在于提供辨别方法、学习方法、辨别装置以及记录介质,能够基于从细胞得到的拉曼光谱,与以往相比更准确地辨别细胞的种类。
本发明提供一种辨别方法,辨别试样中包含的细胞的种类,其特征在于,从一个未辨别的细胞取得一个拉曼光谱,计算表示所述未辨别的细胞的拉曼光谱与多个主成分的光谱一致的程度的多个一致度,所述多个主成分的光谱通过由从种类明确的多个细胞的每一个逐个得到的拉曼光谱构成的多个拉曼光谱的主成分分析而得到,基于通过使用有监督学习的学习模型将与通过所述主成分分析得到的所述种类明确的多个细胞的每一个对应的多个主成分得分按种类分类的结果,对所述多个一致度进行分类,由此辨别所述未辨别的细胞的种类。
本发明的辨别方法的特征在于,所述学习模型是支持向量机。
本发明的辨别方法的特征在于,将与种类明确的多个细胞的每一个对应的多个主成分得分和所述多个细胞的每个种类作为监督数据,进行所述学习模型的机器学习。
本发明的辨别方法的特征在于,向一个细胞的整体照射激发光,通过测量来自所述一个细胞的整体的拉曼散射光来取得拉曼光谱。
本发明提供一种学习方法,进行用于基于拉曼光谱辨别试样中包含的细胞的种类的学习,其特征在于,取得多个主成分的光谱和与所述多个细胞的每一个对应的多个主成分得分,所述多个主成分的光谱通过对由从种类明确的多个细胞的每一个逐个得到的拉曼光谱构成的多个拉曼光谱进行主成分分析而得到,将多组所述多个主成分得分和所述多个细胞的每个种类作为监督数据,以通过使用有监督学习的学习模型能够根据所述种类对多组所述多个主成分得分进行分类的方式,进行所述学习模型的机器学习,存储所述多个主成分的光谱和基于学习后的所述学习模型的所述多个主成分得分的分类结果。
本发明的学习方法的特征在于,通过所述学习模型将包含分别将所述多个主成分得分作为成分的多个坐标点的坐标空间分割为多个区域,由此对多组所述多个主成分得分进行分类。
本发明提供一种辨别装置,辨别试样中包含的细胞的种类,其特征在于,包括:计算部,计算表示从未辨别的细胞取得的拉曼光谱与多个主成分的光谱一致的程度的多个一致度,所述多个主成分的光谱通过由从种类明确的多个细胞的每一个逐个得到的拉曼光谱构成的多个拉曼光谱的主成分分析而得到;以及辨别部,基于通过使用有监督学习的学习模型将与通过所述主成分分析得到的所述种类明确的多个细胞的每一个对应的多个主成分得分按种类分类的结果,对所述多个一致度进行分类,由此辨别所述未辨别的细胞的种类。
本发明的辨别装置的特征在于,还具备学习部,所述学习部将与种类明确的多个细胞的每一个对应的多个主成分得分和所述多个细胞的每个种类作为监督数据,进行所述学习模型的机器学习。
本发明的辨别装置的特征在于,还具备从外部取得所述监督数据的第一取得部。
本发明的辨别装置的特征在于,还具备第二取得部,所述第二取得部从外部取得通过所述学习模型将所述多个主成分的光谱和与所述种类明确的多个细胞的每一个对应的多个主成分得分按种类分类的结果。
本发明提供一种计算机程序,使计算机执行辨别试样中包含的细胞的种类的处理,其特征在于,使计算机执行包括以下步骤的处理:计算表示从未辨别的细胞取得的拉曼光谱对多个主成分的光谱贡献的程度的多个一致度,所述多个主成分的光谱通过由从种类明确的多个细胞的每一个逐个得到的拉曼光谱构成的多个拉曼光谱的主成分分析而得到的步骤;以及基于通过使用有监督学习的学习模型将与通过所述主成分分析得到的所述种类明确的多个细胞的每一个对应的多个主成分得分按种类分类的结果,对所述多个一致度进行分类,由此辨别所述未辨别的细胞的种类的步骤。
本发明提供一种计算机程序,使计算机进行用于辨别试样中包含的细胞的种类的学习,其特征在于,使计算机执行包括以下步骤的处理:取得多个主成分的光谱和与所述多个细胞的每一个对应的多个主成分得分,所述多个主成分的光谱通过对由从种类明确的多个细胞的每一个逐个得到的拉曼光谱构成的多个拉曼光谱进行主成分分析而得到的步骤;将多组所述多个主成分得分和所述多个细胞的每个种类作为监督数据,以通过使用有监督学习的学习模型能够根据所述种类对所述多个主成分得分进行分类的方式,进行所述学习模型的机器学习的步骤;以及存储所述多个主成分的光谱和基于学习后的所述学习模型的所述多个主成分得分的分类结果的步骤。
在本发明中,从一个细胞取得一个拉曼光谱,基于所取得的拉曼光谱来辨别细胞的种类。此外,基于从种类明确的多个细胞得到的多个拉曼光谱的主成分分析的结果,计算表示未辨别的细胞的拉曼光谱与主成分的光谱一致的程度的多个一致度。基于通过使用有监督学习的学习模型对与种类明确的多个细胞对应的多个主成分得分进行了分类的结果,对与未辨别的细胞对应的多个一致度进行分类来辨别细胞的种类。通过使用从各细胞逐个取得的拉曼光谱,进行与细胞整体的特征对应的辨别的处理。另外,可以使用拉曼光谱的全部进行辨别,或者也可以使用拉曼光谱的一部分而不使用其他部分进行辨别。此外,可以使用拉曼光谱的全部进行学习,或者也可以使用拉曼光谱的一部分而不使用其他部分进行学习。
此外,在本发明中,通过使用支持向量机作为使用有监督学习的学习模型,容易对与多个细胞的每一个对应的多个主成分得分进行分类,并且容易对与未辨别的细胞对应的多个一致度进行分类。
此外,在本发明中,将与种类明确的多个细胞的每一个对应的多个主成分得分和各细胞的种类作为监督数据,进行支持向量机等学习模型的机器学习。作为机器学习的结果,能够进行更准确的细胞的种类的辨别。
此外,在本发明中,进行细胞的种类的辨别的辨别装置从外部取得监督数据。能够基于由辨别装置的使用者以外进行的拉曼光谱的测量结果,使学习模型进行学习。
此外,在本发明中,辨别装置从外部取得通过从种类明确的多个细胞得到的多个拉曼光谱的主成分分析而得到的多个主成分的光谱、以及通过学习模型将与种类明确的多个细胞的每一个对应的多个主成分得分按种类分类的结果。能够使用由辨别装置的使用者以外进行的学习的结果,进行细胞的种类的辨别。
此外,在本发明中,对与种类明确的多个细胞的每一个对应的多个主成分得分进行分类时,通过支持向量机等学习模型,将包含将多个主成分得分作为成分的坐标点的坐标空间分割为多个区域。例如,坐标点是将第一主成分得分和第二主成分得分作为成分的二维坐标点。根据坐标空间的分割,按细胞的种类对多个主成分得分进行分类。
此外,在本发明中,在从一个细胞取得一个拉曼光谱时,向一个细胞的整体照射激发光,测量来自一个细胞的整体的拉曼散射光。能够在短时间内进行拉曼光谱的测量,此外,能够进行反映了细胞整体的特征的拉曼光谱的测量。
在本发明中,不受细胞内的细微结构的影响而进行与细胞整体的特征对应的辨别的处理,此外,不使用拉曼光谱中包含的一部分的拉曼谱带,而与拉曼光谱的整体特征进行比较来进行细胞的种类的辨别。因而,与以往相比能够更准确地辨别细胞的种类等,本发明起到优异的效果。
附图说明
图1是表示拉曼散射光测量装置的结构的框图。
图2是表示辨别装置的内部结构的框图。
图3是表示辨别装置进行学习的处理的步骤的流程图。
图4是表示拉曼光谱的例子的曲线图。
图5是表示拉曼光谱数据的例子的图表。
图6A是表示通过对从多个RBL和多个CHO得到的多个拉曼光谱进行主成分分析而得到的主成分的光谱的例子的曲线图。
图6B是表示通过对从多个RBL和多个CHO得到的多个拉曼光谱进行主成分分析而得到的主成分的光谱的例子的曲线图。
图7是表示主成分得分的计算结果的例子的图表。
图8是表示通过实施方式1的支持向量机分割坐标空间的例子的特性图。
图9是表示存储装置的内部结构例的框图。
图10是表示从外部取得监督数据并辨别装置进行学习的处理的步骤的流程图。
图11是表示通过从外部取得学习数据并辨别装置进行学习的处理的步骤的流程图。
图12是表示辨别装置进行细胞的种类的辨别的处理的步骤的流程图。
图13是表示拉曼光谱中的指纹区域的例子的曲线图。
图14A是表示指纹区域的主成分的光谱的例子的曲线图。
图14B是表示指纹区域的主成分的光谱的例子的曲线图。
图15是表示通过实施方式2的支持向量机分割坐标空间的例子的特性图。
具体实施方式
以下,基于本发明的实施方式的附图对本发明进行具体说明。
在本实施方式的细胞的种类的辨别方法中,通过拉曼散射光测量装置从包含多个细胞的试样测量各细胞的拉曼光谱,通过辨别装置并基于测量的拉曼光谱进行细胞的种类的辨别。在试样中包含多种细胞。例如,试样是包含培养的细胞的试样或包含从人等生物体采集的细胞的试样。此处,细胞的种类的不同包括活化的细胞与未活化的细胞的不同、生细胞与死细胞的不同、以及正常的细胞与异常的细胞的不同等。
(实施方式1)
图1是表示拉曼散射光测量装置1的结构的框图。拉曼散射光测量装置1包括保持试样5的试样保持部16、照射激光的照射部11、掩膜142、分束器141和透镜15。例如,试样5为液状,收纳于培养皿等容器。试样保持部16例如是载置收纳有试样5的容器的试样台。试样保持部16也可以是试样台以外的形态。照射部11照射的激光通过掩膜142会聚成细的光束,被分束器141反射并通过透镜15照射到试样5。照射部11、掩膜142、分束器141和透镜15配置成在透镜15中激光仅通过光轴和光轴附近。图1中由实线箭头表示激光。
拉曼散射光测量装置1还具备分光器13和检测光的检测部12。在试样5中的照射了激光的部分产生拉曼散射。所产生的拉曼散射光由透镜15聚光,通过分束器141射入分光器13。在图1中由虚线箭头拉曼散射光。分光器13对所射入的拉曼散射光进行分光。检测部12检测分光器13分光后的各波长的光。拉曼散射光测量装置1为了激光和拉曼散射光的导光、聚光和分离而具备由反射镜、透镜和滤光器等多个光学部件构成的光学部件。图1中省略了掩膜142、透镜15和分束器141以外的光学系统。另外,拉曼散射光测量装置1也可以是来自照射部11的激光通过分束器141而拉曼散射光被分束器141反射的结构。
拉曼散射光测量装置1还具备:使试样保持部16移动的驱动部17、控制部18、以及用于观察试样保持部16所保持的试样5的相机19。例如,驱动部17使试样保持部16沿水平方向移动。通过驱动部17使试样保持部16移动,试样5移动而改变在试样5中从照射部11照射激光的部分。即,通过驱动部17的动作,改变试样5中产生拉曼散射光的部分。相机19例如包括拍摄元件。照射部11、检测部12、分光器13、驱动部17和相机19与控制部18连接。
控制部18控制拉曼散射光测量装置1的各部。照射部11由控制部18控制导通和断开。分光器13由控制部18控制进行分光并由检测部12检测的光的波长。检测部12将与各波长的光的检测强度对应的信号输出到控制部18。控制部18输入检测部12输出的信号,基于由分光器13分光后的光的波长和所输入的信号表示的光的检测强度来生成拉曼光谱。控制部18控制驱动部17的动作,使试样保持部16移动而改变在试样5中产生拉曼散射光的部分。此外,控制部18使相机19拍摄试样5,能够确认在试样5中产生拉曼散射光的部分。这样,拉曼散射光测量装置1能够取得来自试样5的各部分的拉曼光谱。例如,相机19配置成使用与从照射部11向试样5照射的激光同轴的光来拍摄试样5。通过进行使用了与激光同轴的光的拍摄,容易确认并调整在试样5中产生拉曼散射光的部分的位置。
辨别装置2与拉曼散射光测量装置1连接,该辨别装置2进行用于辨别试样5中包含的细胞的种类的处理。辨别装置2与控制部18连接。图2是表示辨别装置2的内部结构的框图。辨别装置2使用个人计算机等计算机而构成。辨别装置2包括:进行运算的CPU(CentralProcessing Unit中央处理器)21、存储伴随运算而产生的临时数据的RAM(Random AccessMemory随机存取存储器)22、从光盘等记录介质20读取信息的驱动部23、以及硬盘等非易失性存储部24。此外,辨别装置2包括:接受使用者的操作的键盘或鼠标等操作部25、液晶显示器等显示部26、接口部27和通信部28。控制部18与接口部27连接。通信部28与辨别装置2外的通信网络3连接,经由通信网络3与外部的装置进行通信。通信部28能够经由通信网络3从外部下载数据。
CPU212使驱动部23读取记录于记录介质20的计算机程序241,并且将所读取的计算机程序241存储在存储部24中。CPU21根据需要将计算机程序241从存储部24加载到RAM22中,按照加载的计算机程序241执行辨别装置2所需的处理。另外,计算机程序241也可以通过通信部28从辨别装置2的外部下载。控制部18将表示所生成的拉曼光谱的拉曼光谱数据输出到辨别装置2。辨别装置2通过接口部27接收拉曼光谱数据,CPU21将拉曼光谱数据存储在存储部24中。
拉曼散射光测量装置1和辨别装置2构成一个分析装置。辨别装置2也能够控制拉曼散射光测量装置1的动作。控制部18将表示利用相机19拍摄的试样5的图像的图像数据输出到辨别装置2,辨别装置2通过接口部27接收图像数据,CPU21可以使显示部26显示图像数据所示的试样5的图像。使用者可以对操作部25进行操作,输入用于控制拉曼散射光测量装置1的指示。例如,CPU21根据所输入的指示从接口部27向控制部18输出控制信号,该控制信号指示测量试样5中特定的部分的拉曼光谱。控制部18接收控制信号,按照接收到的控制信号,控制照射部11、检测部12、分光器13和驱动部17的动作,测量试样5中特定的部分的拉曼光谱。
在本实施方式中,辨别装置2通过作为使用有监督学习的学习模型的支持向量机进行细胞的种类的辨别。为了适当地进行细胞的种类的辨别,需要进行支持向量机的学习。图3是表示辨别装置2进行学习的处理的步骤的流程图。CPU21按照计算机程序241执行辨别装置2所需的处理。拉曼散射光测量装置1从包含种类明确的多个细胞的试样5取得多个拉曼光谱(S11)。拉曼散射光测量装置1从试样5中包含的多个细胞的每一个逐个测量拉曼光谱。例如,预先调整包括透镜15的光学系统,以使来自照射部11的激光向一个细胞的整体照射,拉曼散射光测量装置1向一个细胞的整体照射激光。激光在透镜15中仅通过光轴和光轴附近而向一个细胞的整体照射。透镜15使通过激光的照射而从细胞的整体产生的拉曼散射光聚光,检测部12检测来自细胞的整体的拉曼散射光。针对一个细胞得到平均的拉曼光谱,所得到的拉曼光谱反映细胞整体的特征。由于从一个细胞取得一个拉曼光谱,所以与从一个细胞取得多个拉曼光谱的情况相比,缩短了测量时间。
拉曼散射光测量装置1通过利用驱动部17使试样保持部16移动,改变照射激光的细胞并从多个细胞的每一个逐个取得拉曼光谱。例如,控制部18使用相机19检测各细胞,并且控制驱动部17以便依次向各细胞照射激光。此外,例如通过确认了显示于显示部26的试样5的图像的使用者对操作部25进行操作,可以将改变试样5的位置的指示输入辨别装置2。按照指示的控制信号从辨别装置2输入控制部18,控制部18按照控制信号控制驱动部17,依次向各细胞照射激光。由此,从试样5取得多个拉曼光谱。
图4是表示拉曼光谱的例子的曲线图。横轴表示拉曼位移,纵轴表示各拉曼位移中的拉曼散射光的强度。拉曼位移由波数表示,单位是cm-1。拉曼散射光的强度的单位是a.u.(arbitrary unit,任意单位)。图4中表示了作为细胞使用了RBL(Rat BasophilicLeukemia cell大鼠嗜碱性粒细胞)和CHO(Chinese Hamster Ovary cell中国仓鼠卵巢细胞)的例子。在图4中将CHO的拉曼光谱的基线设为比RBL的基线大的值而表示了两种拉曼光谱。两种拉曼光谱的形状相似,难以根据拉曼光谱的形状区别两种细胞。
控制部18输出表示多个拉曼光谱的拉曼光谱数据,辨别装置2通过接口部27接收拉曼光谱数据,并且将拉曼光谱数据存储在存储部24中。拉曼光谱数据包含表示从多个细胞的每一个得到的拉曼光谱的数据。表示一个拉曼光谱的数据与产生了测量的拉曼散射光的一个细胞、即拉曼光谱的产生源的细胞相关联。
图5是表示拉曼光谱数据的例子的图表。图5中表示了测量拉曼光谱的细胞的数量为N(N为自然数)的例子。在图5中,对各细胞赋予编号来相互区别,纵向排列细胞的编号。在拉曼光谱数据中以与各细胞相关联的方式记录有对各拉曼位移测量的拉曼散射光的强度的值。图5中的**表示数值。对于各细胞,多个拉曼散射光的强度的值横向排列,各拉曼散射光的强度的值与各拉曼位移的值对应。在图5中由粗框包围表示编号1的细胞的拉曼光谱的数据。一个细胞的拉曼光谱由多维数据表示,该多维数据由与各拉曼位移对应的拉曼散射光的强度构成。拉曼光谱数据包含与多个细胞对应的多个多维数据。
接着,CPU21进行从所取得的多个拉曼光谱中除去背景信号的背景处理(S12)。接着,CPU21进行多个拉曼光谱的主成分分析(S13)。在S13中,CPU21进行表示多个拉曼光谱的多个多维数据的主成分分析。具体地说,如果将测量了拉曼光谱的细胞的数量设为N、将一个拉曼光谱中包含的拉曼散射光的强度值的数量设为M(M为自然数),则对将拉曼散射光的强度值作为要素的N行M列的矩阵进行主成分分析。例如,由图5所示的框包围的矩阵是主成分分析的对象。由一行中包含的M个要素构成的多维数据表示一个拉曼光谱,并与一个细胞对应。
CPU21通过主成分分析进行计算,该计算生成集中了多个拉曼光谱的全部信息中最多比例的信息的第一主成分的光谱、集中了次多比例的信息的第二主成分的光谱等多个主成分的光谱。图6A和图6B表示通过对从多个RBL和多个CHO得到的多个拉曼光谱进行主成分分析而得到的主成分的光谱的例子的曲线图。图6A和图6B表示对从多个RBL和多个CHO得到的多个拉曼光谱进行了主成分分析的结果。图6A表示第一主成分的光谱的例子,图6B表示第二主成分的光谱的例子。横轴表示拉曼位移,纵轴表示各拉曼位移中的拉曼散射光的强度。
在S13中,CPU21进一步对多个拉曼光谱的每一个计算多个主成分得分。主成分得分是表示各拉曼光谱对主成分的光谱贡献的比例的数值。第一主成分得分表示一个拉曼光谱对第一主成分的光谱贡献的比例,第二主成分得分表示一个拉曼光谱对第二主成分的光谱贡献的比例。换句话说,主成分得分表示以何种比例组合各拉曼光谱而构成主成分的光谱。通过将分别乘以第一主成分得分的多个拉曼光谱相加,得到第一主成分的光谱。CPU21通过矩阵计算来计算多个主成分得分。对各拉曼光谱计算多个主成分得分。其结果是,与各拉曼光谱和细胞对应地得到多个主成分得分。
图7是表示主成分得分的计算结果的例子的图表。与各拉曼光谱的产生源的细胞的编号对应地记录有多个主成分得分。图7中的**表示数值。对于各细胞,多个主成分得分横向排列。在图7中由粗框包围与编号1的细胞对应的多个主成分得分的值。多个主成分得分的组与一个拉曼光谱对应,并且与该拉曼光谱的产生源的一个细胞对应。与多个拉曼光谱和多个细胞对应地计算多组多个主成分得分。CPU21将多组多个主成分得分存储在RAM22或存储部24中。
接着,CPU21生成包含坐标点的坐标空间,该坐标点将与多个细胞的每一个对应的多个主成分得分作为成分(S14)。例如,CPU21通过在二维坐标上绘制将第一主成分得分和第二主成分得分作为成分的多个坐标点,生成包含与多个细胞对应的多个坐标点的坐标空间。通过接口部27或操作部25接收细胞信息,该细胞信息表示测量了拉曼光谱的细胞是何种细胞,接着,CPU21将接收到的细胞信息和与多个细胞的每一个对应的多个主成分得分作为监督数据,进行支持向量机的学习(S15)。在S15中,CPU21进行调整支持向量机的参数的机器学习,以便能够根据细胞信息所示的各细胞的种类对与各细胞对应的多个主成分得分进行分类。例如,CPU21为了辨别细胞的种类而进行处理,该处理通过支持向量机将包含将第一主成分得分和第二主成分得分作为成分的多个坐标点的坐标空间分割为多个区域。此时,CPU21调整支持向量机的参数,以便将坐标空间分割成与不同种类的细胞对应的坐标点包含于不同的区域。
图8是表示通过实施方式1的支持向量机分割了坐标空间的例子的特性图。在图中,横轴表示第一主成分得分,纵轴表示第二主成分得分。在二维坐标空间内包含将第一主成分得分和第二主成分得分作为成分的多个坐标点。图8中表示了与从多个RBL得到的多个拉曼光谱对应的多个坐标点和与从多个CHO得到的多个拉曼光谱对应的多个坐标点。从相同种类的细胞得到相似形状的拉曼光谱,主成分得分也成为相似的数值。因此,在坐标空间内具有如下倾向:与相同种类的细胞对应的坐标点存在于相互接近的位置,与不同种类的细胞对应的坐标点存在于相互分离的位置。由虚线包围的多个坐标点与多个CHO对应。由点划线包围的多个坐标点与多个RBL对应。CPU21调整支持向量机的参数,以便能够通过支持向量机将二维坐标空间分割为包含与CHO对应的坐标点的区域和包含与RBL对应的坐标点的区域。图8中由直线表示分割的多个区域的边界61。进而,CPU21调整支持向量机的参数,以使在坐标空间内坐标点与边界61之间的余量尽可能大。S15的处理对应于学习部。
接着,CPU21通过学习后的支持向量机的处理来进行生成边界61的计算,该边界将坐标空间分割成与不同种类的细胞对应的坐标点包含于不同的区域(S16)。如图8所示,在分割二维坐标空间的情况下,边界61生成为二维空间内的直线或曲线。接着,CPU21将学习数据存储在存储部24中,该学习数据表示支持向量机的学习结果,并且包含在S13中生成的主成分的光谱、在S16中生成的边界61和表示与由边界61分割的各区域对应的细胞的种类的数据(S17)。边界61和与由边界61分割的各区域对应的细胞的种类对应于将与种类明确的多个细胞的每一个对应的多个主成分得分按种类分类的结果。以上,辨别装置2进行学习的处理结束。S11~S17的处理随时反复进行。例如,改变试样5中包含的细胞的种类,反复进行S11~S17的处理。例如,对设想的多个种类的组合进行S11~S17的处理。
在以上的说明中,表示了辨别装置2制作监督数据的例子,但是辨别装置2也可以进行从外部取得监督数据的处理。存储监督数据的存储装置4与通信网络3连接。
图9是表示存储装置4的内部结构例的框图。存储装置4是服务器装置等计算机。存储装置4包括CPU41、RAM42、硬盘等非易失性存储部43和通信部44。通信部44与通信网络3连接。存储部43存储有计算机程序431。CPU41按照计算机程序431执行各种处理。此外,存储部43存储有监督数据。监督数据由拉曼散射光测量装置1或辨别装置2的制造厂商或者其他使用者上传到存储装置4。另外,在本实施方式中,表示了由单一的计算机构成存储装置4的例子,但是存储装置4也可以由经由通信网络3相互连接的多个计算机构成。
图10是表示辨别装置2从外部取得监督数据并进行学习的处理的步骤的流程图。辨别装置2和存储装置4进行辨别装置2从存储装置4取得监督数据所需的认证处理(S21)。例如,辨别装置2的CPU21使通信部28经由通信网络3将通过使用者对操作部25进行操作而输入的密码等认证信息发送到存储装置4。存储装置4的CPU41判定从辨别装置2发送的认证信息是否正当,在认证信息为正当的情况下允许监督数据的下载,在认证信息不正当的情况下进行不允许下载的处理。此外,例如辨别装置2的CPU21进行用于支付监督数据的使用费的处理。存储装置4的CPU41进行确认是否进行了用于支付的处理的处理,并且进行如下处理:在确认到进行了用于支付的处理的情况下允许监督数据的下载,在未确认到进行了用于支付的处理的情况下不允许下载。例如,CPU41使通信部44将表示认证结果的信息经由通信网络3发送到辨别装置2。
在得到允许下载的认证结果的情况下,CPU21通过通信部28从存储装置4下载监督数据并存储在存储部24中(S22)。例如,在由通信部28接收到表示允许下载的认证结果的信息的情况下,CPU21进行S22的处理。监督数据包含:由多个细胞的拉曼光谱的主成分分析得到的多个主成分的光谱;与多个细胞的每一个对应的多个主成分得分;以及表示各细胞是哪个种类的细胞的细胞信息。S22的处理对应于第一取得部。CPU21使用下载的监督数据进行支持向量机的机器学习(S23)。S23的处理是与S14~S16的处理同样的处理。接着,CPU21将学习数据存储在存储部24中,该学习数据包含监督数据中包含的主成分的光谱、所生成的边界61以及表示与各区域对应的细胞的种类的数据(S24),并且使辨别装置2进行学习的处理结束。
此外,辨别装置2也可以进行从外部取得拉曼光谱数据的处理。存储装置4将拉曼光谱数据和细胞信息存储在存储部43中。拉曼光谱数据和细胞信息通过拉曼散射光测量装置1或辨别装置2的制造厂商或者其他使用者上传到存储装置4。CPU21在S11中通过通信部28经由通信网络3从存储装置4下载拉曼光谱数据和细胞信息,由此从外部取得拉曼光谱数据,并且将拉曼光谱数据和细胞信息存储在存储部24中。CPU21利用所取得的拉曼光谱数据和细胞信息,执行S12~S17的处理。CPU21可以在进行下载之前进行与S21同样的认证处理。
此外,用于学习的监督数据可以是从多次测量得到的数据。例如,拉曼散射光测量装置1可以使用多个试样5进行多次测量,辨别装置2根据通过多次测量得到的拉曼光谱来制作监督数据。例如,拉曼散射光测量装置1可以使用包含不同的细胞的多个试样5进行多次测量,辨别装置2根据通过多次测量得到的拉曼光谱来制作监督数据。此外,用于学习的监督数据也可以是包含从拉曼光谱数据制作的监督数据和从外部取得的监督数据的双方的数据。
此外,辨别装置2可以进行从外部取得学习数据的处理。存储装置4将学习数据存储在存储部43中,该学习数据包含主成分的光谱、由支持向量机生成的边界61、以及表示与由边界61分割的各区域对应的细胞的种类的数据。学习数据通过拉曼散射光测量装置1或辨别装置2的制造厂商或者其他使用者上传到存储装置4。图11是表示辨别装置2通过从外部取得学习数据来进行学习的处理的步骤的流程图。辨别装置2和存储装置4进行辨别装置2从存储装置4取得学习数据所需的认证处理(S31)。例如,辨别装置2的CPU21使通信部28将认证信息发送到存储装置4,存储装置4的CPU41进行如下处理:判定认证信息是否正当,在认证信息正当的情况下允许学习数据的下载,在认证信息不正当的情况下不允许下载。此外,例如辨别装置2的CPU21进行用于支付学习数据的使用费的处理。存储装置4的CPU41进行如下处理:在确认进行了用于支付的处理的情况下允许学习数据的下载,在未确认进行了用于支付的处理的情况下不允许下载。例如,CPU41使通信部44经由通信网络3将表示认证结果的信息发送到辨别装置2。
在得到允许下载的认证结果的情况下,CPU21通过通信部28经由通信网络3从存储装置4下载学习数据(S32)。例如,在通过通信部28接收到表示允许下载的认证结果的信息的情况下,CPU21进行S32的处理。S32的处理对应于第二取得部。接着,CPU21将下载的学习数据存储在存储部24中(S33),并且使辨别装置2进行学习的处理结束。另外,辨别装置2也可以进行将拉曼光谱数据、监督数据或学习数据上传到存储装置4的处理。
在本实施方式中,辨别装置2利用学习数据进行试样5中包含的细胞的种类的辨别。图12是表示辨别装置2进行细胞的种类的辨别的处理的步骤的流程图。CPU21按照计算机程序241执行辨别装置2所需的处理。拉曼散射光测量装置1从包含未辨别种类的一个或多个细胞的试样5取得拉曼光谱(S41)。拉曼散射光测量装置1与S11中的测量同样地对试样5中包含的每一个细胞测量一个拉曼光谱。在辨别对象的细胞为一个的情况下得到一个拉曼光谱,在辨别对象的细胞为多个的情况下得到多个拉曼光谱。控制部18输出表示一个或多个拉曼光谱的拉曼光谱数据,辨别装置2通过接口部27接收拉曼光谱数据并将拉曼光谱数据存储在存储部24中。
接着,CPU21进行从所取得的拉曼光谱中除去背景信号的背景处理(S42)。接着,CPU21计算多个一致度,该多个一致度表示所取得的拉曼光谱与学习数据中包含的数据所示的多个主成分的光谱一致的程度(S43)。一致度通过与主成分分析时计算的主成分得分相同的方法计算。在S43中,CPU21使用与在S12中对多个拉曼光谱的每一个计算多个主成分得分的计算方法相同的计算方法,计算未辨别种类的细胞的拉曼光谱相对于多个主成分的光谱的一致度。CPU21对一个拉曼光谱计算与在S12中计算的主成分得分相同数量的一致度。例如,CPU21使用在S12中的矩阵计算中用于计算主成分得分的矩阵进行矩阵计算,由此计算多个一致度。例如,CPU21计算以与第一主成分得分相同的计算方法计算的第一一致度和以与第二主成分得分相同的计算方法计算的第二一致度。第一一致度表示未辨别种类的细胞的拉曼光谱与学习数据所示的第一主成分的光谱在多大程度上一致,第二一致度表示拉曼光谱与第二主成分的光谱在多大程度上一致。S43的处理对应于计算部。
接着,CPU21在坐标空间内绘制将与各细胞对应的多个一致度作为成分的坐标点(S44)。例如,CPU21在二维坐标上绘制将第一一致度和第二一致度作为成分的坐标点。接着,CPU21通过学习数据中包含的数据所示的边界61将坐标空间分割为多个区域,判定与各细胞对应的坐标点包含于哪个区域(S45)。
接着,CPU21将学习数据中包含的数据所示的与由边界61分割的各区域对应的细胞的种类设为与判定为包含于各区域的坐标点对应的细胞的种类,由此辨别细胞的种类(S46)。S44~S46的处理对应于辨别部。接着,CPU21将表示细胞的种类的辨别结果的数据存储在存储部24中(S47)。CPU21可以使显示部26显示细胞的种类的辨别结果。以上,进行细胞的种类的辨别的处理结束。
例如,辨别装置2用于辨别通过培养而分化为所希望的种类的细胞和未分化的细胞。基于从判明为已分化的细胞和判明为未分化的细胞得到的拉曼光谱来制作监督数据,进行支持向量机的学习并制作学习数据。此后,通过拉曼散射光测量装置1从包含培养的细胞的试样5测量拉曼光谱,辨别装置2基于学习数据,辨别试样5中包含的细胞是分化为所希望的种类的细胞还是未分化的细胞。此外,辨别装置2也可以在通过支持向量机辨别细胞的种类时,根据坐标空间中的与各细胞对应的坐标点与边界61之间的距离,判定细胞的分化程度。
例如,辨别装置2用于辨别所采集的细胞是否是正常种类的细胞。基于从判明为是正常的细胞和判明为异常的细胞得到的拉曼光谱来制作监督数据,进行支持向量机的学习并制作学习数据。此后,通过拉曼散射光测量装置1从包含采集的细胞的试样5测量拉曼光谱,辨别装置2基于学习数据,辨别试样5中包含的细胞是否是正常的细胞。此外,辨别装置2也可以在通过支持向量机辨别细胞的种类时,根据坐标空间中的与各细胞对应的坐标点与边界61之间的距离,判定异常细胞的异常程度。
如以上详细叙述的那样,在本实施方式中,从一个细胞取得一个拉曼光谱,基于所取得的拉曼光谱来辨别细胞的种类。与利用细胞内的拉曼光谱的分布来辨别细胞的种类的方法相比,缩短了辨别所需的时间。通过使用从各细胞逐个取得的拉曼光谱,与使用细胞内的拉曼光谱的分布的情况相比,不受细胞内的细微结构的影响而进行与细胞整体的特征对应的辨别处理。
此外,在本实施方式中,辨别装置2对从种类明确的多个细胞得到的多个拉曼光谱进行主成分分析,通过支持向量机将与多个拉曼光谱的每一个对应的多个主成分得分按种类分类。此外,辨别装置2基于与种类明确的多个细胞的每一个对应的多个主成分得分的分类结果,通过对与未辨别的细胞对应的多个一致度进行分类来辨别细胞的种类。从相同种类的细胞得到相似形状的拉曼光谱,主成分得分也具有成为相似数值的倾向,因此能够对与种类明确的细胞对应的主成分得分的组进行分类,通过根据分类结果对与未辨别的细胞对应的一致度进行分类来辨别细胞。不是着眼于在细胞中将拉曼光谱中包含的一部分的拉曼谱带作为特征,而是比较拉曼光谱的整体特征进行细胞的种类的辨别,因此与以往相比能够准确且容易地辨别细胞的种类。此外,由于使用支持向量机进行辨别,所以通过进行支持向量机的学习,能够改进辨别装置2以便能够更准确地辨别细胞的种类。
(实施方式2)
在实施方式2中,表示利用拉曼光谱的一部分进行细胞的辨别的方式。在细胞的拉曼光谱中包含较强地反映了细胞的特征且因细胞的种类而引起的变化大的部分和几乎不反映细胞特征且因细胞的种类而引起的变化小的部分。以下,将细胞的拉曼光谱中较强地反映了细胞特征的部分称为指纹区域。在实施方式2中,使用指纹区域进行细胞的辨别。
图13是表示拉曼光谱中的指纹区域的例子的曲线图。图13所示的拉曼光谱与图4所示的拉曼光谱相同。指纹区域的范围是拉曼位移为1250~1750cm-1的范围。指纹区域反映了细胞色素C、核酸、脂质或酰胺的二级结构(酰胺I、II或III等)等来自细胞内部的结构物的重要信息。因此,指纹区域较强地反映了细胞特征,与拉曼光谱中的其他部分相比,因细胞的种类而引起的变化大。
在实施方式2中,拉曼散射光测量装置1的结构与实施方式1相同。与实施方式1同样,拉曼散射光测量装置1通过执行S11~S17的处理,进行用于辨别细胞的种类的支持向量机的学习。在S11中,拉曼散射光测量装置1通过从试样5中包含的多个细胞的每一个逐个测量拉曼光谱来取得多个拉曼光谱。
在S13中,辨别装置2的CPU21进行多个拉曼光谱中的指纹区域的主成分分析。即,CPU21对表示多个拉曼光谱的多个多维数据中与指纹区域对应的多维数据进行主成分分析。例如,图5所示的矩阵中从与拉曼位移为1250~1750cm-1的范围对应的部分提取的矩阵是主成分分析的对象。CPU21通过主成分分析进行生成与指纹区域相关的第一主成分的光谱和与指纹区域相关的第二主成分的光谱等的与指纹区域相关的多个主成分的光谱的计算。
图14A和图14B是表示与指纹区域相关的主成分的光谱的例子的曲线图。图14A和图14B表示对从多个RBL和多个CHO得到的多个拉曼光谱进行了主成分分析的结果。图14A表示第一主成分的光谱的例子,图14B表示第二主成分的光谱的例子。横轴表示拉曼位移,纵轴表示各拉曼位移中的拉曼散射光的强度。
在S13中,CPU21还对多个拉曼光谱的每一个计算与指纹区域相关的第一主成分得分和与指纹区域相关的第二主成分得分等的与指纹区域相关的多个主成分得分。与指纹区域相关的第一主成分得分表示一个拉曼光谱中的指纹区域对指纹区域的第一主成分的光谱贡献的比例。与各拉曼光谱和细胞对应地得到指纹区域的多个主成分得分。
另外,辨别装置2也可以在S13中生成与比指纹区域的范围大的拉曼位移的范围对应的主成分的光谱,从主成分的光谱中提取与指纹区域对应的部分,利用提取的部分计算与指纹区域相关的主成分得分。此外,拉曼散射光测量装置1也可以从在S11中测量的拉曼光谱中提取指纹区域,对表示提取的指纹区域的数据进行S12以后的处理。此外,拉曼散射光测量装置1也可以在S11中测量拉曼光谱时仅测量指纹区域,对表示测量的指纹区域的数据进行S12以后的处理。在使用任一方法的情况下都能够得到与指纹区域相关的多个主成分得分。
接着,CPU21在S14中生成包含将指纹区域的多个主成分得分作为成分的坐标点的坐标空间。例如,CPU21在二维坐标上绘制将与指纹区域相关的第一主成分得分和与指纹区域相关的第二主成分得分作为成分的多个坐标点。在S15中,CPU21将细胞信息和与指纹区域相关的多个主成分得分作为监督数据进行支持向量机的学习。例如,CPU21为了辨别细胞的种类而进行如下处理:通过支持向量机将包含将与指纹区域相关的第一主成分得分和与指纹区域相关的第二主成分得分作为成分的多个坐标点的坐标空间分割为多个区域。与实施方式1同样,CPU21调整支持向量机的参数,以便将坐标空间分割成与不同种类的细胞对应的坐标点包含于不同的区域。
图15是表示通过实施方式2的支持向量机分割了坐标空间的例子的特性图。横轴表示与指纹区域相关的第一主成分得分,纵轴表示与指纹区域相关的第二主成分得分。在图中,在二维坐标空间内包含将与指纹区域相关的第一主成分得分和与指纹区域相关的第二主成分得分作为成分的多个坐标点。图15中表示了与从多个RBL得到的多个拉曼光谱对应的多个坐标点和与从多个CHO得到的多个拉曼光谱对应的多个坐标点。从相同种类的细胞得到同样的指纹区域,与指纹区域相关的主成分得分成为类似的数值。因此,在坐标空间内具有如下倾向:与相同种类的细胞对应的坐标点存在于相互接近的位置,与不同种类的细胞对应的坐标点存在于相互分离的位置。由虚线包围的多个坐标点与多个CHO对应。由点划线包围的多个坐标点与多个RBL对应。CPU21调整支持向量机的参数,以便能够将二维坐标空间分割成包含与CHO对应的坐标点的区域和包含与RBL对应的坐标点的区域。图15中表示了由折线表现了分割的多个区域的边界61的例子。此外,CPU21调整支持向量机的参数,以使在坐标空间内坐标点与边界61之间的余量尽可能大。
CPU21与实施方式1同样执行S16和S17的处理。作为S11~S17的结果,将学习数据存储在存储部24中,该学习数据包含与指纹区域相关的主成分的光谱、边界61和表示与由边界61分割的各区域对应的细胞的种类的数据。与实施方式1同样,辨别装置2可以进行从外部取得监督数据或学习数据的处理。
与实施方式1同样,拉曼散射光测量装置1通过执行S41~S47的处理,使用学习数据进行试样5中包含的细胞的种类的辨别。在S41中,拉曼散射光测量装置1对试样5中包含的一个细胞取得一个拉曼光谱。在S43中,辨别装置2的CPU21从所取得的拉曼光谱中提取指纹区域来计算一致度,该一致度表示所提取的指纹区域与学习数据中包含的数据所示的指纹区域所涉及的主成分的光谱一致的程度。CPU21利用与计算主成分得分的计算方法相同的计算方法来计算与指纹区域相关的一致度。CPU21对一个拉曼光谱以与指纹区域的主成分得分相同的数量计算与指纹区域相关的一致度。例如,CPU21计算通过与第一主成分得分相同的计算方法计算的第一一致度和通过与第二主成分得分相同的计算方法计算的第二一致度。
另外,拉曼散射光测量装置1也可以在S41中测量拉曼光谱时仅测量指纹区域,对表示测量的指纹区域的数据进行S42以后的处理。即使在这种情况下也能够得到与指纹区域相关的一致度。
CPU21与实施方式1同样执行S44~S47的处理。通过S41~S47的处理,得到试样5中包含的细胞的种类的辨别结果。如上所述,在实施方式2中,利用从细胞得到的拉曼光谱中的指纹区域进行支持向量机的学习和细胞的辨别。指纹区域较强地反映了细胞特征且因细胞的种类而引起的变化大,因此辨别装置2通过利用指纹区域,能够使支持向量机进行学习,以便能够更可靠地对种类不同的细胞进行分类。通过使用该支持向量机,辨别装置2能够精度良好地进行细胞的种类的辨别。
在以上的实施方式1以及2中,表示了拉曼散射光测量装置1向试样5照射激光的方式,但也可以是拉曼散射光测量装置1为了拉曼光谱的测量而向试样5照射激光以外的激发光的方式。此外,在实施方式1以及2中,表示了为了改变试样5中拉曼散射光产生的部分而使试样5移动的方式,但也可以是拉曼散射光测量装置1为了改变试样5中拉曼散射光产生的部分而使激发光的光路移动的方式。
此外,在实施方式1以及2中,表示了为了从一个细胞测量一个拉曼光谱而向一个细胞整体照射激光来测量拉曼光谱的方式。但是,拉曼散射光测量装置1也可以依次向一个细胞内的多个部分照射激发光,测量与一个细胞内的多个部分对应的多个拉曼光谱,制作代表多个拉曼光谱的一个拉曼光谱。例如,拉曼散射光测量装置1制作对多个拉曼光谱进行了平均的拉曼光谱。即使这样,也能够从一个细胞测量一个拉曼光谱。也能够将光学系统设定为依次向一个细胞内的多个部分照射激发光的拉曼散射光测量装置1用于细胞的种类的辨别。
此外,在实施方式1以及、2中,表示了为了细胞的种类的辨别而进行通过支持向量机将二维坐标空间分割为多个区域的处理的方式,但是也可以是辨别装置2也可以是进行将三维以上的坐标空间分割为多个区域的处理的方式。例如,在辨别装置2进行将三维坐标空间分割为多个区域的处理的方式中,使用包含将第一主成分得分、第二主成分得分和第三主成分得分作为成分的坐标点的坐标空间、以及包含将第一、第二、第三一致度作为成分的坐标点的坐标空间,边界61为平面或曲面。此外,在实施方式1、2以及2中,表示了作为使用有监督学习的学习模型表示了使用支持向量机的方式,但是也可以是辨别装置2也可以是使用支持向量机以外的学习模型的方式。例如,也可以是辨别装置2也可以是使用卷积神经网络作为使用有监督学习的学习模型的方式。此外,辨别装置2不仅能够用于细胞的种类的辨别,也能够用于细胞核的种类的辨别或蛋白质的种类的辨别等细胞内的部分或生物体物质的辨别。此外,在实施方式1以及2中,表示了拉曼散射光测量装置1和辨别装置2为一体而构成分析装置的方式,但也可以是辨别装置2从拉曼散射光测量装置1分离的方式。
本发明并不限定于上述实施方式的内容,能够在权利要求所示的范围内进行各种变更。即,组合在权利要求所示的范围内适当变更的技术手段而得到的实施方式也包含在本发明的技术范围内。
(附记1)
一种辨别方法,辨别试样中包含的细胞的种类,其特征在于,
从一个未辨别的细胞取得一个拉曼光谱,
计算表示与所述未辨别的细胞的拉曼光谱的所述拉曼位移范围对应的部分和与多个主成分的光谱的所述拉曼位移范围对应的部分一致的程度的多个一致度,所述多个主成分的光谱通过对与由从种类明确的多个细胞的每一个逐个得到的拉曼光谱构成的多个拉曼光谱的预先确定的拉曼位移范围对应的部分进行主成分分析而得到,
基于通过使用有监督学习的学习模型将与通过所述主成分分析得到的所述种类明确的多个细胞的每一个对应的多个主成分得分按种类分类的结果,对所述多个一致度进行分类,由此辨别所述未辨别的细胞的种类。
(附记2)
一种学习方法,进行用于基于拉曼光谱辨别试样中包含的细胞的种类的学习,其特征在于,
取得与多个主成分的光谱的所述拉曼位移范围对应的部分和与所述多个细胞的每一个对应的多个主成分得分,所述多个主成分的光谱通过对与由从种类明确的多个细胞的每一个逐个得到拉曼光谱构成的多个拉曼光谱的预先确定的拉曼位移范围对应的部分进行主成分分析而得到,
将多组所述多个主成分得分和所述多个细胞的每个种类作为监督数据,进行使用有监督学习的学习模型的机器学习,以便能够通过所述学习模型根据所述种类对多组所述多个主成分得分进行分类,
存储与所述多个主成分的光谱的所述拉曼位移范围对应的部分和基于学习后的所述学习模型的所述多个主成分得分的分类结果。
(附记3)
一种辨别装置,辨别试样中包含的细胞的种类,其特征在于,具备:
计算部,计算表示与从未辨别的细胞取得的拉曼光谱的所述拉曼位移范围对应的部分和与多个主成分的光谱的所述拉曼位移范围对应的部分一致的程度的多个一致度,所述多个主成分的光谱通过对与由从种类明确的多个细胞的每一个逐个得到的拉曼光谱构成的多个拉曼光谱的预先确定的拉曼位移范围对应的部分进行主成分分析而得到;以及
辨别部,基于通过使用有监督学习的学习模型将与通过所述主成分分析得到的所述种类明确的多个细胞的每一个对应的多个主成分得分按种类分类的结果,对所述多个一致度进行分类,由此辨别所述未辨别的细胞的种类。
(附记4)
一种计算机程序,使计算机执行辨别试样中包含的细胞的种类的处理,其特征在于,
使计算机执行包括以下步骤的处理:
计算表示与从未辨别的细胞取得的拉曼光谱的所述拉曼位移范围对应的部分和与多个主成分的光谱的所述拉曼位移范围对应的部分贡献的程度的多个一致度,所述多个主成分的光谱通过由从种类明确的多个细胞的每一个逐个得到的拉曼光谱构成的多个拉曼光谱的预先确定的拉曼位移范围对应的部分的主成分分析而得到的步骤;以及
基于通过使用有监督学习的学习模型将与通过所述主成分分析得到的所述种类明确的多个细胞的每一个对应的多个主成分得分按种类分类的结果,对所述多个一致度进行分类,由此辨别所述未辨别的细胞的种类的步骤。
(附记5)
一种计算机程序,使计算机进行用于辨别试样中包含的细胞的种类的学习,其特征在于,
使计算机执行包括以下步骤的处理:
取得与多个主成分的光谱的所述拉曼位移范围对应的部分和与所述多个细胞的每一个对应的多个主成分得分,所述多个主成分的光谱通过对与由从种类明确的多个细胞的每一个逐个得到的拉曼光谱构成的多个拉曼光谱的预先确定的拉曼位移范围对应的部分进行主成分分析而得到;
将多组所述多个主成分得分和所述多个细胞的每个种类作为监督数据,进行使用有监督学习的学习模型的机器学习,以便能够通过所述学习模型根据所述种类对所述多个主成分得分进行分类的步骤;以及
存储与所述多个主成分的光谱的所述拉曼位移范围对应的部分和基于学习后的所述学习模型的所述多个主成分得分的分类结果的步骤。
附图标记说明:
1:拉曼散射光测量装置;11:照射部;12:检测部;13:分光器;15:透镜;18:控制部;2:辨别装置;21:CPU;24:存储部;241:计算机程序;3:通信网络;4:存储装置;5:试样。
Claims (9)
1.一种辨别方法,辨别试样中包含的细胞的种类,其中,
存储多个主成分的光谱和将多个主成分得分通过使用有监督学习的学习模型按种类分类的分类结果,所述多个主成分的光谱通过对由从种类明确的多个细胞的每一个逐个得到的拉曼光谱构成的多个拉曼光谱进行主成分分析而得到,所述多个主成分得分通过所述主成分分析而得到,表示各细胞的拉曼光谱对所述多个主成分的光谱贡献的比例,
从一个未辨别的细胞取得一个拉曼光谱,
通过与对所述主成分的光谱计算所述主成分得分的方法相同的矩阵计算,计算表示所述未辨别的细胞的拉曼光谱与所述多个主成分的光谱一致的程度的多个一致度,
基于所述分类结果对所述多个一致度进行分类,由此辨别所述未辨别的细胞的种类。
2.根据权利要求1所述的辨别方法,其中,
所述学习模型是支持向量机。
3.根据权利要求1或2所述的辨别方法,其中,
将与种类明确的多个细胞的每一个对应的多个主成分得分和所述多个细胞的每个种类作为监督数据,进行所述学习模型的机器学习。
4.根据权利要求1或2所述的辨别方法,其中,
向一个细胞的整体照射激发光,
通过测量来自所述一个细胞的整体的拉曼散射光来取得拉曼光谱。
5.一种辨别装置,辨别试样中包含的细胞的种类,其中,具备:
存储部,存储多个主成分的光谱和将多个主成分得分通过使用有监督学习的学习模型按种类分类的分类结果,所述多个主成分的光谱通过对由从种类明确的多个细胞的每一个逐个得到的拉曼光谱构成的多个拉曼光谱进行主成分分析而得到,所述多个主成分得分通过所述主成分分析而得到,表示各细胞的拉曼光谱对所述多个主成分的光谱贡献的比例,
计算部,通过与对所述主成分的光谱计算所述主成分得分的方法相同的矩阵计算,计算表示从未辨别的细胞取得的拉曼光谱与所述多个主成分的光谱一致的程度的多个一致度;以及
辨别部,基于所述分类结果对所述多个一致度进行分类,由此辨别所述未辨别的细胞的种类。
6.根据权利要求5所述的辨别装置,其中,
还具备学习部,所述学习部将与种类明确的多个细胞的每一个对应的多个主成分得分和所述多个细胞的每个种类作为监督数据,进行所述学习模型的机器学习。
7.根据权利要求6所述的辨别装置,其中,
还具备从外部取得所述监督数据的第一取得部。
8.根据权利要求5至7中任一项所述的辨别装置,其中,
还具备第二取得部,所述第二取得部从外部取得所述多个主成分的光谱和通过所述学习模型将与所述种类明确的多个细胞的每一个对应的多个主成分得分按种类分类的结果。
9.一种记录介质,记录有使计算机执行辨别试样中包含的细胞的种类的处理的计算机程序,其中,
所述计算机程序使计算机执行包括以下步骤的处理:
在存储有多个主成分的光谱和将多个主成分得分通过使用有监督学习的学习模型按种类分类的分类结果的状态下,通过与对所述主成分的光谱计算所述主成分得分的方法相同的矩阵计算,计算表示从未辨别的细胞取得的拉曼光谱与多个主成分的光谱一致的程度的多个一致度的步骤,其中,所述多个主成分的光谱通过对由从种类明确的多个细胞的每一个逐个得到的拉曼光谱构成的多个拉曼光谱进行主成分分析而得到,所述多个主成分得分通过所述主成分分析而得到,表示各细胞的拉曼光谱对所述多个主成分的光谱贡献的比例;以及
基于所述分类结果对所述多个一致度进行分类,由此辨别所述未辨别的细胞的种类的步骤。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017-238644 | 2017-12-13 | ||
JP2017238644 | 2017-12-13 | ||
PCT/JP2018/045591 WO2019117177A1 (ja) | 2017-12-13 | 2018-12-12 | 判別方法、学習方法、判別装置及びコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111433592A CN111433592A (zh) | 2020-07-17 |
CN111433592B true CN111433592B (zh) | 2023-09-15 |
Family
ID=66819260
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880078199.6A Active CN111433592B (zh) | 2017-12-13 | 2018-12-12 | 辨别方法、辨别装置以及记录介质 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11125692B2 (zh) |
EP (1) | EP3709005A1 (zh) |
JP (1) | JP7232771B2 (zh) |
CN (1) | CN111433592B (zh) |
WO (1) | WO2019117177A1 (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR112020024296A2 (pt) | 2018-08-27 | 2021-03-09 | Regeneron Pharmaceuticals, Inc. | Métodos para produção de um intermediário de purificação de proteína concentrado, para monitoramento e controle dos atributos de qualidade críticos em um intermediário de purificação de proteína e para monitorar e controlar os níveis de excipientes no fluido de cultura de células colhido e/ou intermediário de purificação de proteína, e, intermediário de purificação de proteína |
JP7383939B2 (ja) * | 2019-09-03 | 2023-11-21 | 東ソー株式会社 | 学習装置、学習方法、細胞判別装置、細胞判別方法、細胞判別学習プログラムおよび細胞判別プログラム |
WO2021070385A1 (ja) * | 2019-10-11 | 2021-04-15 | アイポア株式会社 | 粒子の識別を行うためのセンサ、測定器、コンピュータ装置、およびシステム |
WO2022075094A1 (ja) * | 2020-10-05 | 2022-04-14 | パナソニックIpマネジメント株式会社 | 処理装置、システム、方法、コンピュータプログラム |
JPWO2022107517A1 (zh) * | 2020-11-20 | 2022-05-27 | ||
CN113267482B (zh) * | 2021-01-28 | 2023-07-25 | 深圳市罗湖区人民医院 | 一种鼻咽癌单细胞检测方法、存储介质及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012059748A1 (en) * | 2010-11-04 | 2012-05-10 | The University Of Nottingham | Method, apparatus and software for identifying cells |
CN103487425A (zh) * | 2013-09-12 | 2014-01-01 | 福建师范大学 | 一种利用表面增强拉曼光谱判别癌细胞的方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006130728A2 (en) * | 2005-05-31 | 2006-12-07 | The Regents Of The University Of California | Single-cell raman spectroscopy for the non-destructive, non-invasive analysis of cells and cellular components |
US8379197B2 (en) * | 2006-01-05 | 2013-02-19 | Chemimage Corporation | Spectroscopic systems and methods for classifying and pharmaceutically treating cells |
WO2008100582A2 (en) * | 2007-02-14 | 2008-08-21 | Chemimage Corporation | Spectroscopic system and method for predicting outcome of disease |
WO2009021178A1 (en) * | 2007-08-08 | 2009-02-12 | Chemimage Corporation | Raman difference spectra based disease classification |
GB2466442A (en) * | 2008-12-18 | 2010-06-23 | Dublin Inst Of Technology | A system to analyze a sample on a slide using Raman spectroscopy on an identified area of interest |
JP2010181391A (ja) | 2009-02-05 | 2010-08-19 | Mutsumi Takagi | 動物細胞の識別方法 |
CN108351289B (zh) | 2015-10-28 | 2021-11-26 | 国立大学法人东京大学 | 分析装置 |
-
2018
- 2018-12-12 US US16/771,987 patent/US11125692B2/en active Active
- 2018-12-12 EP EP18889335.8A patent/EP3709005A1/en not_active Withdrawn
- 2018-12-12 WO PCT/JP2018/045591 patent/WO2019117177A1/ja unknown
- 2018-12-12 JP JP2019559678A patent/JP7232771B2/ja active Active
- 2018-12-12 CN CN201880078199.6A patent/CN111433592B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012059748A1 (en) * | 2010-11-04 | 2012-05-10 | The University Of Nottingham | Method, apparatus and software for identifying cells |
CN103487425A (zh) * | 2013-09-12 | 2014-01-01 | 福建师范大学 | 一种利用表面增强拉曼光谱判别癌细胞的方法 |
Non-Patent Citations (2)
Title |
---|
杨静 ; 王成 ; 谢成颖 ; 翁小阜 ; 魏勋斌 ; .基于主成分分析和反向传播神经网络的肝癌细胞后向散射显微光谱判别.生物医学工程学杂志.2017,(第02期),92-98. * |
陈秀丽等.基于PCA和BP网络的地中海贫血红细胞拉曼光谱判别.中国激光.2009,第36卷(第09期),2449-2451. * |
Also Published As
Publication number | Publication date |
---|---|
WO2019117177A1 (ja) | 2019-06-20 |
CN111433592A (zh) | 2020-07-17 |
US20210140891A1 (en) | 2021-05-13 |
US11125692B2 (en) | 2021-09-21 |
EP3709005A1 (en) | 2020-09-16 |
JPWO2019117177A1 (ja) | 2021-01-14 |
JP7232771B2 (ja) | 2023-03-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111433592B (zh) | 辨别方法、辨别装置以及记录介质 | |
Ortega et al. | Detecting brain tumor in pathological slides using hyperspectral imaging | |
US11896382B2 (en) | Hyperspectral image-guided ocular imager for alzheimer's disease pathologies | |
JP6333326B2 (ja) | スペクトルイメージングによる生体試料の分析方法 | |
CN108572163B (zh) | 荧光图像分析装置、分析方法及预处理的评价方法 | |
EP1865315B1 (en) | Cell image analyzing method, cell image analyzing device | |
EP1922695B1 (en) | Method of, and apparatus and computer software for, performing image processing | |
JP6611716B2 (ja) | 分類を支援するための分析法 | |
US20190072484A1 (en) | Tumor cell detection method and tumor cell detection device | |
US20170254741A1 (en) | Quality evaluation method and quality evaluation device | |
JP2007020449A (ja) | スクリーニング方法およびスクリーニング装置 | |
EP1733218A2 (en) | Method and system for monitoring material separation process such as electrophoresis process in a sample | |
EP2422182B1 (en) | Method and apparatus for multi-parameter data analysis | |
JP4728025B2 (ja) | 細胞画像解析装置 | |
JP7355323B2 (ja) | 計測制御装置、分光計測装置、及び計測制御方法 | |
US10895537B2 (en) | Laser intensity calibration | |
KR102139477B1 (ko) | 매질 특성 차이를 이용한 영상 기반의 시료 분석 장치를 이용하여 시료를 측정하고 분석하는 방법 | |
EP4317970A1 (en) | Cell life/death determining method, cell life/death determining device, and cell life/death determining system | |
JP2023067851A (ja) | 細胞の成熟度の評価方法 | |
US20230349820A1 (en) | A method and a system for analyzing a spectral signature of a compound specimen | |
CN107991283B (zh) | 拉曼光谱检测设备和拉曼光谱检测方法 | |
WO2021024214A1 (en) | Method and apparatus for particle detection in turbid or clear medium | |
CN116773496A (zh) | 基于三维荧光分析的茶叶检测系统、方法、设备及存储介质 | |
JP2020039312A (ja) | 染色体異常判定システム、測定装置及び解析装置 | |
Regner | Randomness in Biological Systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |