CN110648763A - 利用人工智能进行光谱分析以进行肿瘤评估的方法及设备 - Google Patents
利用人工智能进行光谱分析以进行肿瘤评估的方法及设备 Download PDFInfo
- Publication number
- CN110648763A CN110648763A CN201910934131.XA CN201910934131A CN110648763A CN 110648763 A CN110648763 A CN 110648763A CN 201910934131 A CN201910934131 A CN 201910934131A CN 110648763 A CN110648763 A CN 110648763A
- Authority
- CN
- China
- Prior art keywords
- spectral
- evaluated
- human tissue
- spectral data
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 206010028980 Neoplasm Diseases 0.000 title claims abstract description 47
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 27
- 238000010183 spectrum analysis Methods 0.000 title claims abstract description 23
- 230000003595 spectral effect Effects 0.000 claims abstract description 82
- 238000001228 spectrum Methods 0.000 claims abstract description 58
- 238000012545 processing Methods 0.000 claims abstract description 24
- 238000005259 measurement Methods 0.000 claims abstract description 15
- 238000012549 training Methods 0.000 claims abstract description 13
- 238000003672 processing method Methods 0.000 claims abstract description 7
- 238000013106 supervised machine learning method Methods 0.000 claims abstract description 7
- 239000011159 matrix material Substances 0.000 claims description 45
- 238000000513 principal component analysis Methods 0.000 claims description 9
- 238000000354 decomposition reaction Methods 0.000 claims description 8
- 238000007781 pre-processing Methods 0.000 claims description 8
- 238000012706 support-vector machine Methods 0.000 claims description 8
- 238000004458 analytical method Methods 0.000 claims description 6
- 238000009499 grossing Methods 0.000 claims description 3
- 238000000491 multivariate analysis Methods 0.000 claims description 3
- 238000010202 multivariate logistic regression analysis Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 239000013598 vector Substances 0.000 description 10
- 230000006870 function Effects 0.000 description 5
- 238000010239 partial least squares discriminant analysis Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000003384 imaging method Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000001069 Raman spectroscopy Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000004445 quantitative analysis Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001506 fluorescence spectroscopy Methods 0.000 description 1
- 238000002189 fluorescence spectrum Methods 0.000 description 1
- 238000002599 functional magnetic resonance imaging Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012847 principal component analysis method Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/63—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
- G01N21/64—Fluorescence; Phosphorescence
- G01N21/6428—Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes"
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/63—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
- G01N21/65—Raman scattering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Pathology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Theoretical Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Immunology (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Analytical Chemistry (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Optics & Photonics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明提供了一种利用人工智能进行光谱测量以进行肿瘤评估的方法及设备。对预先准备的人体组织进行光谱分析以获取所述预先准备的人体组织的光谱数据;对获取的所述预先准备的光谱数据进行处理以得到光谱的量化特征;基于处理后得到的光谱数据的量化特征,利用监督式机器学习方法,训练一个分类器;针对待评估的人体组织,采用第一步骤中使用光谱测量来获取所述待评估的人体组织的光谱数据;采用第二步骤中的处理方法,对所述待评估的人体组织的光谱数据进行处理以得到其量化特征;采用第三步骤训练好的分类器对处理后的所述待评估的人体组织的光谱数据进行分类,从而评估此所述待评估的人体组织的肿瘤状态和级别。
Description
技术领域
本发明涉及人工智能领域,具体涉及一种利用人工智能进行光谱分析以进行肿瘤评估的方法及设备。
背景技术
一直以来,无论哪种肿瘤,一直期待强调及早发现的重要性。一般,都是采用影像学检查对于肿瘤进行评估和筛选。对于肿瘤患者来说,影像是肿瘤评估的关键。具体地,一般通过将形态影像学和功能影像学的结合,包括PET/CT、功能MRI、功能CT等,由此进行肿瘤评估。
但是,因为光谱的数据复杂,信息丰富,而且光谱测量速度快,仪器价格相对便宜,所以采用光谱分析技术,综合考虑所有的数据,辨认其中的重要的特征信息,具有其独特的优势,但是对样品作出判别是非常困难的事情。
发明内容
本发明所要解决的技术问题是针对现有技术中存在上述缺陷,提供利用人工智能进行光谱分析以进行肿瘤评估的方法。
根据本发明,提供了一种利用人工智能进行光谱分析以进行肿瘤评估的方法,包括:
第一步骤:对预先准备的人体组织进行光谱测量以获取所述预先准备的人体组织的光谱数据;
第二步骤:对获取的所述预先准备的光谱数据进行处理以获得其量化特征;
第三步骤:基于处理后得到的光谱数据的量化特征,利用监督式机器学习方法,训练一个分类器;
第四步骤:针对待评估的人体组织,采用第一步骤中使用光谱测量来获取所述待评估的人体组织的光谱数据;
第五步骤:采用第二步骤中的处理方法,对所述待评估的人体组织的光谱数据进行处理以获得量化特征;
第六步骤:采用第三步骤训练好的分类器对处理后的所述待评估的人体组织的光谱数据进行分类,从而评估此所述待评估的人体组织的肿瘤状态。
优选地,所述利用人工智能进行光谱分析以进行肿瘤评估的方法还包括:在判断所述待评估的人体组织存在肿瘤时,采用第三步骤训练好的分类器评估所述待评估的人体组织的肿瘤级别。
优选地,所述处理后得到的光谱数据的特征包括下述特征中的一种或多种:第一种特征是一系列人体组织内部关键分子的指纹峰的峰值;第二种特征是采用所述峰值选择性地算得的一系列比值;第三种特征是用多重变量分析的方法对光谱进行线性分解而得到一系列的分量谱的叠加系数。
优选地,对光谱进行线性分解包括:
先用历史数据作为标记好的训练范例,分解出基本成分谱;
将所有的光谱数据都存在一个矩阵X里,其中X为m行n列,行数m为频率或波长数据,列数n为光谱数目,X矩阵里的每一列为一个真实谱;
利用线性分解法将X分解为两个矩阵的乘积,X=WH,其中W为m行r列的矩阵,H为r行n列的矩阵,W矩阵的每列代表基本成分谱,X矩阵里的每一个真实谱被分解成一系列基本成分谱的线性叠加,H矩阵的每列为一个真实谱分解后的叠加系数;
从一系列的叠加系数里选取一部分作为最优的成分组成分类特征。
优选地,第六步骤包括:对光谱数据x’进行投影并分解为从历史数据里算得的基本成分谱的线性叠加,其数学式子为:h’=pinv(W)x’,其中pinv(W)为矩阵W的赝逆,其式子为:pinv(W)=(WTW)-1WT,其中T表示转置,-1表示矩阵的逆;h’里包含了把真实谱分解为基本成分谱所得的一系列线性叠加系数;从h’里选取同样的最优成分;基于选取的最优成分,利用训练好的分类器来评估此所述待评估的人体组织的肿瘤状态和其级别。
优选地,多重变量分析方法采用主成分分析方法、偏最小二乘法方法或者非负矩阵分解方法。
优选地,对获取的所述预先准备的光谱数据进行处理包括光谱预处理。
优选地,光谱预处理包括光滑处理、去背底处理、归一化处理中的一种或多种。
优选地,所述分类器是支持向量机、判别分析或者K-近邻算法的分类器。
另一方面,本发明还提供了一种利用人工智能进行光谱分析以进行肿瘤评估的设备,包括:
第一单元,用于对预先准备的人体组织进行光谱测量以获取所述预先准备的人体组织的光谱数据;
第二单元,用于对获取的所述预先准备的光谱数据进行处理以获得其量化特征;
第三单元,用于基于处理后得到的光谱数据的量化特征,利用监督式机器学习方法,训练一个分类器;
第四单元,用于针对待评估的人体组织,采用第一单元中使用光谱测量来获取所述待评估的人体组织的光谱数据;
第五单元,用于采用第二单元中的处理方法,对所述待评估的人体组织的光谱数据进行处理以获得其量化特征;
第六单元,用于采用第三单元训练好的分类器对处理后的所述待评估的人体组织的光谱数据进行分类,从而评估此所述待评估的人体组织的肿瘤状态和其级别。
本发明采用样品的光谱数据对样品进行定量的分析和分类,根据产生的结果,可以给出一个样品离分类边界的距离,以供医生作参考。本发明用机器学习的方法寻找大数据里的特征信息,由人工智能来判断样品;相对传统的肿瘤评估方法,这样可以建立统一的定量的标准,增加客观性,而且速度快。本发明的方法操作灵活,本发明可以很容易结合多种不同的特征,综合起来,定量的作出判别。通过人工智能参测到的特征信息,本发明还可以对样品在分子水平上的性质提供关键信息。
附图说明
结合附图,并通过参考下面的详细描述,将会更容易地对本发明有更完整的理解并且更容易地理解其伴随的优点和特征,其中:
图1示意性地示出了根据本发明优选实施例的利用人工智能进行光谱分析以进行肿瘤评估的方法的总体流程图。
需要说明的是,附图用于说明本发明,而非限制本发明。注意,表示结构的附图可能并非按比例绘制。并且,附图中,相同或者类似的元件标有相同或者类似的标号。
具体实施方式
为了使本发明的内容更加清楚和易懂,下面结合具体实施例和附图对本发明的内容进行详细描述。
图1示意性地示出了根据本发明优选实施例的利用人工智能进行光谱分析以进行肿瘤评估的方法的总体流程图。
如图1所示,根据本发明优选实施例的利用人工智能进行光谱分析以进行肿瘤评估的方法包括:
第一步骤S1:对预先准备的人体组织进行光谱测量以获取所述预先准备的人体组织的光谱数据;
其中,光谱数据可以是拉曼光谱数据和/或荧光光谱数据。
其中,人体组织可以是体内人体组织和/或体外人体组织。
而且,预先准备的人体组织的数量足以用作训练分类器。
第二步骤S2:对获取的所述预先准备的光谱数据进行处理以获得量化特征;
第三步骤S3:基于处理后得到的光谱数据的量化特征,利用监督式机器学习方法,训练一个分类器;
第四步骤S4:针对待评估的人体组织,采用第一步骤中使用光谱测量来获取所述待评估的人体组织的光谱数据;
第五步骤S5:采用第二步骤中的处理方法,对所述待评估的人体组织的光谱数据进行处理以得到量化特征;
第六步骤S6:采用第三步骤训练好的分类器对处理后的所述待评估的人体组织的光谱数据进行分类,从而评估此所述待评估的人体组织的肿瘤状态。
优选地,在判断所述待评估的人体组织存在肿瘤时,执行第七步骤S7:采用第三步骤训练好的分类器评估所述待评估的人体组织的肿瘤级别。
在另一优选实施例中,本发明还提供了一种利用人工智能进行光谱分析以进行肿瘤评估的设备,包括:
第一单元,用于对预先准备的人体组织进行光谱测量以获取所述预先准备的人体组织的光谱数据;
第二单元,用于对获取的所述预先准备的光谱数据进行处理以获得量化特征;
第三单元,用于基于处理后得到的光谱数据的量化特征,利用监督式机器学习方法,训练一个分类器;
第四单元,用于针对待评估的人体组织,采用第一单元中使用光谱测量来获取所述待评估的人体组织的光谱数据;
第五单元,用于采用第二单元中的处理方法,对所述待评估的人体组织的光谱数据进行处理以获得量化特征;
第六单元,用于采用第三单元训练好的分类器对处理后的所述待评估的人体组织的光谱数据进行分类,从而评估此所述待评估的人体组织的肿瘤状态。
第七单元,用于采用第三步骤训练好的分类器评估所述待评估的人体组织的肿瘤级别。
<具体示例>
对获取的所述预先准备的光谱数据进行处理包括光谱预处理;例如,光谱预处理包括光滑(去噪音)处理、去背底(对于拉曼光谱)处理、归一化处理等。
此后,根据光谱的数据建立一系列的特征用来分类。本发明采用的特征可以是下面这些特征中的一种或者几种的集合。第一种特征是一系列组织内部关键分子的指纹峰的峰值;第二种特征是用上述峰值选择性地算得一系列比值;第三种特征是用多重变量分析的方法对光谱进行线性分解,从而得到一些列的分量谱及其叠加系数(相对含量),而这些相对含量将作为分类使用的特征。
本发明使用的多重变量分析方法可采用主成分分析(principal componentanalysis,PCA),偏最小二乘法(partial least squares,PLS),非负矩阵分解(nonnegative matrix factorization,NMF)等方法。分类器可以选用支持向量机(supportvector machine,SVM),判别分析(discriminant analysis,DA),或者K-近邻算法(k-nearest neighbor,KNN)的分类器。
对光谱进行线性分解包括:
先用大量的历史数据作为标记好的训练范例,分解出基本成分谱;
将所有的光谱数据都存在一个矩阵X里,其中X为m行n列,行数m为频率或波长数据,列数n为光谱数目,X矩阵里的每一列为一个真实谱;
利用线性分解法将X分解为两个矩阵的乘积,X=WH,其中W为m行r列的矩阵,H为r行n列的矩阵,W矩阵的每列代表基本成分谱,X矩阵里的每一个真实谱被分解成一系列基本成分谱的线性叠加,H矩阵的每列为一个真实谱分解后的叠加系数;
从一系列的叠加系数里选取一部分作为最优的成分组成分类特征。
然后,在已知标记的情况下对这些训练范例进行分类,训练好一个分类器。当需要对一个新的谱x’进行分类时,把光谱数据x’投影到从历史数据里算得的基本成分谱而分解成基本成分谱的线性叠加,其数学式子为:h’=pinv(W)x’,其中pinv(W)为矩阵W的赝逆,其式子为:pinv(W)=(WTW)-1WT,其中T表示转置,-1表示矩阵的逆;h’里包含了把真实谱分解为基本成分谱所得的一系列线性叠加系数;从h’里选取同样的最优成分;用训练好的分类器来判断这个新的光谱来源的性质,即组织的类别,如是否恶性肿瘤,和具体的肿瘤级别。
也就是说,在这种情况下,第六步骤包括:对光谱数据x’进行投影并分解为从历史数据里算得的基本成分谱的线性叠加,其数学式子为:h’=pinv(W)x’,其中pinv(W)为矩阵W的赝逆,其式子为:pinv(W)=(WTW)-1WT,其中T表示转置,-1表示矩阵的逆;h’里包含了把真实谱分解为基本成分谱所得的一系列线性叠加系数;从h’里选取同样的最优成分;基于选取的最优成分,利用训练好的分类器来评估此所述待评估的人体组织的肿瘤状态。
在使用PLS时,对原始数据的预处理还包含中心化(mean centering),也就是对所有样品光谱计算出一个平均谱,然后从每个谱里扣除这个平均谱。
对于荧光谱,上述的分析过程基本相同。在对荧光谱预处理时,不需要扣除背底。
主成分分析(principal component analysis,PCA)
PCA利用正交变换来对一系列可能相关的变量的观测值进行线性变换,从而投影为一系列线性不相关变量的值,这些不相关变量称为主成分(Principal Components,PCs)。具体地,主成分可以看做一个线性方程,其包含一系列线性系数来指示投影方向。主成分不相关也就是互相正交。沿着第一个主成分的方向,数据的方差最大。然后依次递减。在作PCA的时候,可以对数据X的协方差矩阵解本征值方程。具体地,首先对数据X中心化,表示为X0,协方差矩阵为X0X0 T。求得的本征向量就是代表主成分的方向,也被叫做负荷向量(PC loadings),存为矩阵W里的列。然后把原始数据X投影到主成分上,得到主成分分数(PCscores),也就是一组线性叠加系数,存在H矩阵里。H=pinv(W)X=WTX。因为本征向量是正交归一的,所以pinv(W)=WT。W矩阵也可以只保留一部分主成分,算出分数,用来分类。在实际操作中,求本征向量可以通过对X0进行奇异值分解得到。X0=WΣVT。其中W和V为左右奇异向量,而Σ是一个对角矩阵,包含了一系列的奇异值。W就是对X主成分分析的本征向量。
偏二乘法(partial least squares,PLS)
偏最小二乘法和主成分分析很相似。不同的是PLS涉及两个矩阵X和Y。假设X和Y是中心化后的矩阵。PLS将将X矩阵作为预测元变量,而Y为响应变量。把响应变量Y设置为原始数据的类别标记。PLS将X和Y矩阵之间的关系表示为。
X=TPT+E
Y=UQT+F
其中T和U为X分数和Y分数矩阵,P和Q为正交载荷矢量,E和F为误差项。PLS寻找和Y相关的X的分量,也就是寻找一对线性变化使得X和Y在变换之后的协方差最大。具体的计算可以通过下面的伪代码实现。
1)初始化矩阵u
2)w=XTu(uTu)-1
3)t=Xw
4)c=YTt(tTt)-1
5)||c||->1
6)u=Yc
7)重复步骤2-6直到满足收敛的条件。
PLS拟合出来的分数矩阵T包含了每个光谱的一组分数。一个或多个分数可以作为分类特征用来训练分类器。训练好之后,可以对新数据进行分类。而当对新的数据分类时,先将新的谱做预处理,包括中心化,然后把新的数据投影到PLS的载荷矢量P上,得到新数据的分数。然后用训练好的分类器对新数据分类。
偏最小二乘判别分析(PLS-DA)
另外一种特殊的PLS方法称为偏最小二乘判别分析(PLS-DA)。此时PLS-DA就是一种监督化的分析。如果用PLS-DA的分析方法,首先用历史数据做PLS-DA。当有新的数据时,将新数据做完预处理后,求得新的y来判断新数据的属性。具体操作可以通过如下步骤完成。假设,X和Y都是中心化的矩阵。
Y=XB+F
X=TPT+E
Y=TQT+F
定义一个比重函数W,使得
T=XW(PTW)-1,
于是,
Y=XW(PTW)-1QT+F。
所以,拟合得到的矩阵B为
B=W(PTW)-1QT。
对于一个新的光谱数据x’,其对应的y值可以通过下面的计算来估计
y’=x’B=x’W(PTW)-1QT。
y’给出的就是这个新数据对应的样品的种类。
上述步骤里的W,T,P,Q可以通过下面伪代码得到。
1)设定一个P值,初始化误差矩阵E和F为E0=X,F0=Y。
2)for p=1到P,do
3)计算PLS比重矢量W
Wp=E0 TF0;
4)计算并归一分数矢量
Tp=E0Wp(Wp TE0 TE0Wp)-1/2;
5)计算X载荷矢量
Pp=E0 TTp;
6)计算Y载荷矢量
Qp=F0 TTp;
7)更新X误差矩阵
E0=E0-TpPp T;
8)更新Y误差矩阵
F0=F0-TpQp T;
9)end for
10)得到W,T,P,Q矩阵
非负矩阵分解(nonnegative matrix factorization,NMF)
NMF是另一种对矩阵(信号)进行分解的方法:X=WH。和PCA,PLS不同的是,NMF在拟合的时候,在要求误差小的同时,只要求信号本身为非负,而分解出来的矩阵W和H也都是非负。因为采用的光信号,物质的含量,都应该是非负的。所以NMF有时可以得到样品中特定化学成分的真实光谱,以及其相对含量。这是NMF的优势。
支持向量机(support vector machine,SVM)
不管对于上面哪种方法得到需要分类的特征,都可以用SVM来分类。可以把一种特征,或者多种特征综合起来进行分类。SVM的基本思想是寻找一个超平面以最大距离隔开两组不同的数据,或者说寻找两组数据之间的最佳边界。之所以称为超平面是因为,这个数据可以是一维,二维或多维。一维的超平面就是一根线。而这个最远的超平面是以平面到所谓的支持向量的距离来衡量的。而支持向量其实就是两组数据之间最近的数据点。实际上,这是理想情况。因为真实的两组数据可能有重叠的部分。此时,称这个两组数据之间的间隔为软间隔。在拟合的时候,需要加入一个损失函数来考虑误判的数据。另外在寻找最大间隔的时候,可以采用不同的核函数而产生不同的间隔计算方法和边界的形状。这个核函数可以是线性的,也可以是多项式,或者高斯径向基函数等等。
<技术效果>
本发明的优点至少包括:
1.本发明采用的是用样品的光谱数据对样品进行定量的分析和分类,根据产生的结果,甚至可以给出一个样品离分类边界的距离给医生作参考。
2.如背景技术中所述,因为光谱的数据复杂,信息丰富,所以综合考虑所有的数据,辨认其中的重要的特征信息,对样品作出判别是非常困难的事情。本发明用机器学习的方法寻找大数据里的特征信息,由人工智能来判断样品。相对传统的肿瘤评估方法,这样可以建立统一的定量的标准,增加客观性,而且速度快。
3.本发明的方法操作灵活,本发明可以很容易结合多种不同的特征,综合起来,定量的作出判别。
4.通过人工智能参测到的特征信息,本发明还可以对样品在分子水平上的性质提供关键信息。
需要说明的是,除非特别指出,否则说明书中的术语“第一”、“第二”、“第三”等描述仅仅用于区分说明书中的各个组件、元素、步骤等,而不是用于表示各个组件、元素、步骤之间的逻辑关系或者顺序关系等。
可以理解的是,虽然本发明已以较佳实施例披露如上,然而上述实施例并非用以限定本发明。对于任何熟悉本领域的技术人员而言,在不脱离本发明技术方案范围情况下,都可利用上述揭示的技术内容对本发明技术方案作出许多可能的变动和修饰,或修改为等同变化的等效实施例。因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何简单修改、等同变化及修饰,均仍属于本发明技术方案保护的范围内。
Claims (10)
1.一种利用人工智能进行光谱分析以进行肿瘤评估的方法,其特征在于包括:
第一步骤:对预先准备的人体组织进行光谱测量以获取所述预先准备的人体组织的光谱数据;
第二步骤:对获取的所述预先准备的光谱数据进行处理以得到光谱的量化特征;
第三步骤:基于处理后得到的光谱数据的量化特征,利用监督式机器学习方法,训练一个分类器;
第四步骤:针对待评估的人体组织,采用第一步骤中使用光谱测量来获取所述待评估的人体组织的光谱数据;
第五步骤:采用第二步骤中的处理方法,对所述待评估的人体组织的光谱数据进行处理以得到其量化特征;
第六步骤:采用第三步骤训练好的分类器对处理后的所述待评估的人体组织的光谱数据进行分类,从而评估此所述待评估的人体组织的肿瘤状态和级别。
2.根据权利要求1所述的利用人工智能进行光谱分析以进行肿瘤评估的方法,其特征在于还包括:在判断所述待评估的人体组织存在肿瘤时,采用第三步骤训练好的分类器评估所述待评估的人体组织的肿瘤级别。
3.根据权利要求1或2所述的利用人工智能进行光谱分析以进行肿瘤评估的方法,其特征在于,所述处理后得到的光谱数据的量化特征包括下述特征中的一种或多种:第一种特征是一系列人体组织内部关键分子的指纹峰的峰值;第二种特征是采用所述峰值选择性地算得的一系列比值;第三种特征是用多重变量分析的方法对光谱进行线性分解而得到一系列的分量谱的叠加系数。
4.根据权利要求3所述的利用人工智能进行光谱分析以进行肿瘤评估的方法,其特征在于,对光谱进行线性分解包括:
先用历史数据作为标记好的训练范例,分解出基本成分谱;
将所有的光谱数据都存在一个矩阵X里,其中X为m行n列,行数m为频率或波长数据,列数n为光谱数目,X矩阵里的每一列为一个真实谱;
利用线性分解法将X分解为两个矩阵的乘积,X=WH,其中W为m行r列的矩阵,H为r行n列的矩阵,W矩阵的每列代表基本成分谱,X矩阵里的每一个真实谱被分解成一系列基本成分谱的线性叠加,H矩阵的每列为一个真实谱分解后的叠加系数;
从一系列的叠加系数里选取一部分作为最优的成分组成分类特征。
5.根据权利要求4所述的利用人工智能进行光谱分析以进行肿瘤评估的方法,其特征在于,第六步骤包括:对光谱数据x’进行投影并分解为从历史数据里算得的基本成分谱的线性叠加,其数学式子为:h’=pinv(W)x’,其中pinv(W)为矩阵W的赝逆,其式子为:pinv(W)=(WTW)-1WT,其中T表示转置,-1表示矩阵的逆;h’里包含了把真实谱分解为基本成分谱所得的一系列线性叠加系数;从h’里选取同样的最优成分;基于选取的最优成分,利用训练好的分类器来评估此所述待评估的人体组织的肿瘤状态及其级别。
6.根据权利要求3所述的利用人工智能进行光谱分析以进行肿瘤评估的方法,其特征在于,多重变量分析方法采用主成分分析方法、偏最小二乘法方法或者非负矩阵分解方法。
7.根据权利要求1或2所述的利用人工智能进行光谱分析以进行肿瘤评估的方法,其特征在于,对获取的所述预先准备的光谱数据进行处理包括光谱预处理。
8.根据权利要求7所述的利用人工智能进行光谱分析以进行肿瘤评估的方法,其特征在于,光谱预处理包括光滑处理、去背底处理、归一化处理中的一种或多种。
9.根据权利要求1或2所述的利用人工智能进行光谱分析以进行肿瘤评估的方法,其特征在于,所述分类器是支持向量机、判别分析或者K-近邻算法的分类器。
10.一种利用人工智能进行光谱分析以进行肿瘤评估的设备,其特征在于包括:
第一单元,用于对预先准备的人体组织进行光谱测量以获取所述预先准备的人体组织的光谱数据;
第二单元,用于对获取的所述预先准备的光谱数据进行处理以获得量化特征;
第三单元,用于基于处理后得到的光谱数据的量化特征,利用监督式机器学习方法,训练一个分类器;
第四单元,用于针对待评估的人体组织,采用第一单元中使用光谱测量来获取所述待评估的人体组织的光谱数据;
第五单元,用于采用第二单元中的处理方法,对所述待评估的人体组织的光谱数据进行处理;
第六单元,用于采用第三单元训练好的分类器对处理后的所述待评估的人体组织的光谱数据进行分类,从而评估此所述待评估的人体组织的肿瘤状态及级别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910934131.XA CN110648763A (zh) | 2019-09-29 | 2019-09-29 | 利用人工智能进行光谱分析以进行肿瘤评估的方法及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910934131.XA CN110648763A (zh) | 2019-09-29 | 2019-09-29 | 利用人工智能进行光谱分析以进行肿瘤评估的方法及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110648763A true CN110648763A (zh) | 2020-01-03 |
Family
ID=68993179
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910934131.XA Pending CN110648763A (zh) | 2019-09-29 | 2019-09-29 | 利用人工智能进行光谱分析以进行肿瘤评估的方法及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110648763A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111721751A (zh) * | 2020-06-30 | 2020-09-29 | 四川大学华西医院 | 一种检测结直肠恶性肿瘤的装置 |
JPWO2022092079A1 (zh) * | 2020-10-27 | 2022-05-05 | ||
CN116705215A (zh) * | 2023-08-04 | 2023-09-05 | 南京诺源医疗器械有限公司 | 一种用于脑室检测的荧光标记系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001092859A1 (en) * | 2000-06-02 | 2001-12-06 | Medicometrics Aps | Method and system for classifying a biological sample |
CN107239857A (zh) * | 2017-05-31 | 2017-10-10 | 武汉大学 | 基于ls_svm和pca的架空输电线路风险评估方法 |
WO2017215284A1 (zh) * | 2016-06-14 | 2017-12-21 | 山东大学 | 基于卷积神经网络的胃肠道肿瘤显微高光谱图像处理方法 |
CN107907500A (zh) * | 2017-10-19 | 2018-04-13 | 宁夏大学 | 一种羊肉产地的检测方法 |
CN108169184A (zh) * | 2017-09-05 | 2018-06-15 | 哈尔滨工业大学 | 一种肿瘤分类鉴别模型的建立方法及其应用 |
CN110033032A (zh) * | 2019-03-29 | 2019-07-19 | 中国科学院西安光学精密机械研究所 | 一种基于显微高光谱成像技术的组织切片分类方法 |
WO2019142136A1 (en) * | 2018-01-17 | 2019-07-25 | Ods Medical Inc. | System and methods for real-time raman spectroscopy for cancer detection |
-
2019
- 2019-09-29 CN CN201910934131.XA patent/CN110648763A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001092859A1 (en) * | 2000-06-02 | 2001-12-06 | Medicometrics Aps | Method and system for classifying a biological sample |
WO2017215284A1 (zh) * | 2016-06-14 | 2017-12-21 | 山东大学 | 基于卷积神经网络的胃肠道肿瘤显微高光谱图像处理方法 |
CN107239857A (zh) * | 2017-05-31 | 2017-10-10 | 武汉大学 | 基于ls_svm和pca的架空输电线路风险评估方法 |
CN108169184A (zh) * | 2017-09-05 | 2018-06-15 | 哈尔滨工业大学 | 一种肿瘤分类鉴别模型的建立方法及其应用 |
CN107907500A (zh) * | 2017-10-19 | 2018-04-13 | 宁夏大学 | 一种羊肉产地的检测方法 |
WO2019142136A1 (en) * | 2018-01-17 | 2019-07-25 | Ods Medical Inc. | System and methods for real-time raman spectroscopy for cancer detection |
CN110033032A (zh) * | 2019-03-29 | 2019-07-19 | 中国科学院西安光学精密机械研究所 | 一种基于显微高光谱成像技术的组织切片分类方法 |
Non-Patent Citations (2)
Title |
---|
吴国庆、等: "多源光谱特征组合的COD光学检测方法研究" * |
李斌、等: "基于太赫兹光谱技术的D-无水葡萄糖定性定量分析研究" * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111721751A (zh) * | 2020-06-30 | 2020-09-29 | 四川大学华西医院 | 一种检测结直肠恶性肿瘤的装置 |
JPWO2022092079A1 (zh) * | 2020-10-27 | 2022-05-05 | ||
JP7298778B2 (ja) | 2020-10-27 | 2023-06-27 | コニカミノルタ株式会社 | 情報処理装置、情報処理システムおよび学習済みモデル |
CN116705215A (zh) * | 2023-08-04 | 2023-09-05 | 南京诺源医疗器械有限公司 | 一种用于脑室检测的荧光标记系统 |
CN116705215B (zh) * | 2023-08-04 | 2023-09-29 | 南京诺源医疗器械有限公司 | 一种用于脑室检测的荧光标记系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Meszlényi et al. | Resting state fMRI functional connectivity-based classification using a convolutional neural network architecture | |
Trevisan et al. | Extracting biological information with computational analysis of Fourier-transform infrared (FTIR) biospectroscopy datasets: current practices to future perspectives | |
Wang et al. | Support vector machine learning-based fMRI data group analysis | |
Nørgaard et al. | A modification of canonical variates analysis to handle highly collinear multivariate data | |
CN110648763A (zh) | 利用人工智能进行光谱分析以进行肿瘤评估的方法及设备 | |
Luts et al. | Nosologic imaging of the brain: segmentation and classification using MRI and MRSI | |
US20080010330A1 (en) | Method and system for detecting difference between plural observed results | |
US9921201B2 (en) | Calibration curve creating method and calibration curve creation apparatus | |
Comelli et al. | Radiomics: a new biomedical workflow to create a predictive model | |
Skarysz et al. | Convolutional neural networks for automated targeted analysis of raw gas chromatography-mass spectrometry data | |
JP2014190795A (ja) | 検量線作成方法および検量線作成装置、並びに目的成分検量装置 | |
Campos-Delgado et al. | Extended blind end-member and abundance extraction for biomedical imaging applications | |
Jha et al. | Alzheimer disease detection in MRI using curvelet transform with KNN | |
Attyé et al. | TractLearn: A geodesic learning framework for quantitative analysis of brain bundles | |
CN112951342A (zh) | 数据解析系统以及数据解析方法 | |
Bagaria et al. | Bone fractures detection using support vector machine and error backpropagation neural network | |
Guo et al. | A sparse representation method for magnetic resonance spectroscopy quantification | |
Alansary et al. | Automatic brain localization in fetal MRI using superpixel graphs | |
CN114611582A (zh) | 一种基于近红外光谱技术分析物质浓度的方法及系统 | |
CN111125629B (zh) | 一种域自适应的pls回归模型建模方法 | |
Archana et al. | Detection of Alzheimer disease in MR images using structure tensor | |
US20200279148A1 (en) | Material structure analysis method and material structure analyzer | |
US10564105B2 (en) | Variable reduction method for spectral searching | |
Saneipour et al. | Improvement of MRI brain image segmentation using Fuzzy unsupervised learning | |
CN116028858A (zh) | 基于预标签的自监督神经网络学习心拍分类方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200103 |