CN114923893B - 一种无损免标记快速乳腺癌拉曼光谱病理分级分期方法 - Google Patents
一种无损免标记快速乳腺癌拉曼光谱病理分级分期方法 Download PDFInfo
- Publication number
- CN114923893B CN114923893B CN202210622396.8A CN202210622396A CN114923893B CN 114923893 B CN114923893 B CN 114923893B CN 202210622396 A CN202210622396 A CN 202210622396A CN 114923893 B CN114923893 B CN 114923893B
- Authority
- CN
- China
- Prior art keywords
- spectrum
- breast cancer
- grading
- raman spectrum
- tissue
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 206010006187 Breast cancer Diseases 0.000 title claims abstract description 50
- 208000026310 Breast neoplasm Diseases 0.000 title claims abstract description 50
- 238000001237 Raman spectrum Methods 0.000 title claims abstract description 50
- 238000000034 method Methods 0.000 title claims abstract description 36
- 230000001575 pathological effect Effects 0.000 title claims abstract description 35
- 238000001228 spectrum Methods 0.000 claims abstract description 62
- 238000004458 analytical method Methods 0.000 claims abstract description 45
- 238000001514 detection method Methods 0.000 claims abstract description 18
- 230000007170 pathology Effects 0.000 claims abstract description 13
- 238000012706 support-vector machine Methods 0.000 claims abstract description 13
- 210000001519 tissue Anatomy 0.000 claims description 68
- 206010028980 Neoplasm Diseases 0.000 claims description 44
- 239000013307 optical fiber Substances 0.000 claims description 35
- 201000011510 cancer Diseases 0.000 claims description 34
- 230000003595 spectral effect Effects 0.000 claims description 26
- 210000000481 breast Anatomy 0.000 claims description 13
- 102000004169 proteins and genes Human genes 0.000 claims description 10
- 235000014113 dietary fatty acids Nutrition 0.000 claims description 9
- 230000005284 excitation Effects 0.000 claims description 9
- 229930195729 fatty acid Natural products 0.000 claims description 9
- 239000000194 fatty acid Substances 0.000 claims description 9
- 150000004665 fatty acids Chemical class 0.000 claims description 9
- 238000012360 testing method Methods 0.000 claims description 9
- 238000012549 training Methods 0.000 claims description 9
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 claims description 8
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 claims description 8
- 230000008878 coupling Effects 0.000 claims description 8
- 238000010168 coupling process Methods 0.000 claims description 8
- 238000005859 coupling reaction Methods 0.000 claims description 8
- 108020004707 nucleic acids Proteins 0.000 claims description 8
- 150000007523 nucleic acids Chemical class 0.000 claims description 8
- 102000039446 nucleic acids Human genes 0.000 claims description 8
- 239000004065 semiconductor Substances 0.000 claims description 8
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 claims description 7
- 150000002632 lipids Chemical class 0.000 claims description 7
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 claims description 7
- 238000009499 grossing Methods 0.000 claims description 6
- 238000012847 principal component analysis method Methods 0.000 claims description 6
- 238000012795 verification Methods 0.000 claims description 6
- 238000001069 Raman spectroscopy Methods 0.000 claims description 5
- 238000001574 biopsy Methods 0.000 claims description 5
- 108091005461 Nucleic proteins Proteins 0.000 claims description 4
- 239000000090 biomarker Substances 0.000 claims description 4
- 210000005075 mammary gland Anatomy 0.000 claims description 4
- 239000000835 fiber Substances 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 230000001066 destructive effect Effects 0.000 claims description 2
- 238000010606 normalization Methods 0.000 claims description 2
- 238000009659 non-destructive testing Methods 0.000 claims 1
- 238000003745 diagnosis Methods 0.000 abstract description 6
- 238000005516 engineering process Methods 0.000 abstract description 3
- 238000011160 research Methods 0.000 abstract description 3
- 238000010183 spectrum analysis Methods 0.000 abstract description 3
- 238000005065 mining Methods 0.000 abstract 1
- 239000000306 component Substances 0.000 description 24
- 230000001965 increasing effect Effects 0.000 description 6
- 108090000623 proteins and genes Proteins 0.000 description 6
- 230000007423 decrease Effects 0.000 description 3
- 230000036541 health Effects 0.000 description 3
- 208000030776 invasive breast carcinoma Diseases 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 101100421503 Arabidopsis thaliana SIGA gene Proteins 0.000 description 2
- 101100042610 Arabidopsis thaliana SIGB gene Proteins 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000003211 malignant effect Effects 0.000 description 2
- 238000001543 one-way ANOVA Methods 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- -1 785nm laser Substances 0.000 description 1
- 102000001554 Hemoglobins Human genes 0.000 description 1
- 108010054147 Hemoglobins Proteins 0.000 description 1
- UPYKUZBSLRQECL-UKMVMLAPSA-N Lycopene Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1C(=C)CCCC1(C)C)C=CC=C(/C)C=CC2C(=C)CCCC2(C)C UPYKUZBSLRQECL-UKMVMLAPSA-N 0.000 description 1
- OENHQHLEOONYIE-UKMVMLAPSA-N all-trans beta-carotene Natural products CC=1CCCC(C)(C)C=1/C=C/C(/C)=C/C=C/C(/C)=C/C=C/C=C(C)C=CC=C(C)C=CC1=C(C)CCCC1(C)C OENHQHLEOONYIE-UKMVMLAPSA-N 0.000 description 1
- 238000000540 analysis of variance Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 235000013734 beta-carotene Nutrition 0.000 description 1
- TUPZEYHYWIEDIH-WAIFQNFQSA-N beta-carotene Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1=C(C)CCCC1(C)C)C=CC=C(/C)C=CC2=CCCCC2(C)C TUPZEYHYWIEDIH-WAIFQNFQSA-N 0.000 description 1
- 239000011648 beta-carotene Substances 0.000 description 1
- 229960002747 betacarotene Drugs 0.000 description 1
- 150000001746 carotenes Chemical class 0.000 description 1
- 235000005473 carotenes Nutrition 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 239000008358 core component Substances 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000012757 fluorescence staining Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000010587 phase diagram Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 235000018102 proteins Nutrition 0.000 description 1
- 239000010453 quartz Substances 0.000 description 1
- 238000005057 refrigeration Methods 0.000 description 1
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N silicon dioxide Inorganic materials O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- NCYCYZXNIZJOKI-UHFFFAOYSA-N vitamin A aldehyde Natural products O=CC=C(C)C=CC=C(C)C=CC1=C(C)CCCC1(C)C NCYCYZXNIZJOKI-UHFFFAOYSA-N 0.000 description 1
- OENHQHLEOONYIE-JLTXGRSLSA-N β-Carotene Chemical compound CC=1CCCC(C)(C)C=1\C=C\C(\C)=C\C=C\C(\C)=C\C=C\C=C(/C)\C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C OENHQHLEOONYIE-JLTXGRSLSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/63—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
- G01N21/65—Raman scattering
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N1/00—Sampling; Preparing specimens for investigation
- G01N1/02—Devices for withdrawing samples
- G01N1/04—Devices for withdrawing samples in the solid state, e.g. by cutting
- G01N1/06—Devices for withdrawing samples in the solid state, e.g. by cutting providing a thin slice, e.g. microtome
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N1/00—Sampling; Preparing specimens for investigation
- G01N1/28—Preparing specimens for investigation including physical details of (bio-)chemical methods covered elsewhere, e.g. G01N33/50, C12Q
- G01N1/286—Preparing specimens for investigation including physical details of (bio-)chemical methods covered elsewhere, e.g. G01N33/50, C12Q involving mechanical work, e.g. chopping, disintegrating, compacting, homogenising
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2132—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on discrimination criteria, e.g. discriminant analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2134—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on separation criteria, e.g. independent component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/245—Classification techniques relating to the decision surface
- G06F18/2451—Classification techniques relating to the decision surface linear, e.g. hyperplane
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H70/00—ICT specially adapted for the handling or processing of medical references
- G16H70/60—ICT specially adapted for the handling or processing of medical references relating to pathologies
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Analytical Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Epidemiology (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
Abstract
本发明适用于医学临床乳腺癌诊断与术中检测技术领域,提供了一种无损免标记快速乳腺癌拉曼光谱病理分级分期方法,包括如下步骤:步骤一、获取乳腺组织样品;步骤二、测量组织拉曼光谱;步骤三、组织拉曼光谱预处理;步骤四、获取光谱特征差异信息;步骤五、利用所获差异化拉曼光谱信息对乳腺癌进行分期和分级。本发明中的一种无损免标记快速乳腺癌拉曼光谱病理分级分期方法,结合大量临床验证性前期研究,提出广义判别分析、主成分分析-支持向量机和主成分分析-线性判别分析的光谱分析手段,应用于不同乳腺癌病变组织拉曼光谱数据的归类和鉴别,挖掘组织病理状态所包含的统计学光谱信息,实现基于拉曼光谱检测技术的乳腺癌病理分期和分级。
Description
技术领域
本发明属于医学临床乳腺癌诊断与术中检测技术领域,尤其涉及一种无损免标记快速乳腺癌拉曼光谱病理分级分期方法。
背景技术
乳腺癌是世界上最常见的恶性肿瘤,也是威胁我国女性健康的常见恶性疾病之一。2019年最新全国最新癌症报告显示,在2015年度我国乳腺癌新发病例约30.4万例,是女性癌症发病率第一,占所有癌症发病率的16.51%,而在全球范围,乳腺癌更占女性所有癌症发病率的30%;在新发病例中,约有7.4万人死于乳腺癌,是女性癌症死亡率第五位,占所有癌症死亡率7.82%,而在全球范围,乳腺癌更占女性所有癌症死亡率的15%。
现有技术基于病理荧光染色与标记分析方法的乳腺癌TNM分期、分级方法,整个病理切片分析过程需要大量时间,且其准确度常常受到医生经验和病变组织典型性等因素制约,极大地降低了临床诊疗效率。导致这样的缺点的原因是,病理切片制备、分析、诊断过程有较多的人为主观因素参与,且主要从组织结构特征方面进行判别诊断,缺乏客观、量化的组织成分信息。
已有技术采用拉曼光谱分析手段仅能实现健康组织、良性癌变与恶性癌变的鉴别分析,即仅能实现乳腺癌病理分型,尚无法实现基于TNM系统的乳腺癌精准分期、分级。导致这一缺点的原因是,缺乏成熟的数据分析手段与实验检测手段。
因此,针对以上现状,迫切需要开发一种无损免标记快速乳腺癌拉曼光谱病理分级分期方法,以克服当前实际应用中的不足。
发明内容
针对现有技术存在的不足,本发明实施例的目的在于提供一种无损免标记快速乳腺癌拉曼光谱病理分级分期方法,以解决上述背景技术中的问题。
为实现上述目的,本发明提供如下技术方案:
一种无损免标记快速乳腺癌拉曼光谱病理分级分期方法,包括如下步骤:
步骤一、获取乳腺组织样品:通过临床保乳手术、组织病理活检和组织冰冻切片,得到乳腺组织样品;
步骤二、测量组织拉曼光谱:通过拉曼光谱检测装置所使用的激发激光经二向色镜发射后,被凸透镜汇聚于乳腺组织上,在组织表面与内部激发出光谱信息,光谱信息透过二向色镜后被光纤束结构收集,并由光谱仪记录分析;
步骤三、组织拉曼光谱预处理:通过光谱范围选择、去除荧光背景、光谱曲线下面积校准以及光谱平滑的方法,完成测量光谱荧光背景去除、光谱曲线平滑与归一化等预处理操作;
步骤四、获取光谱特征差异信息:明确健康乳腺组织与浸润性导管癌组织所具有的光谱特征,并提出不同分期、分级条件下,浸润性导管癌组织所含有的色氨酸、苯丙氨酸、β-类胡萝卜素、脂质、核酸、蛋白质和脂肪酸生物标志物的光谱特征差异;
步骤五、结合所获拉曼光谱信息对乳腺癌样品进行病理分期和分级:通过广义判别分析算法、主成分分析-支持向量机和主成分分析-线性判别分析算法,实现乳腺癌TNM分期和分级并对其应用效力进行了对比分析。
作为本发明进一步的技术方案,在步骤二中,拉曼光谱检测装置包括装置体、光谱仪、光纤耦合镜、长通滤波片、带通滤波片、二向色镜、平凸透镜、光纤输出准直器和半导体激光器,所述光纤耦合镜、长通滤波片、带通滤波片、二向色镜、平凸透镜和光纤输出准直器均设置在装置体内,装置体的两端分别与光谱仪和半导体激光器采用光纤束与光纤连接。
作为本发明进一步的技术方案,在步骤二中,光纤束结构为一个圆形转线性排列的光纤阵列结构,其圆形排布面为光谱采集端,其线性排布面连接至光谱仪,光纤束线性排布面的尺寸以及光纤束所含光纤的数量,可根据光谱仪CCD像元排布进行设计。
作为本发明进一步的技术方案,在步骤五中,广义判别分析算法的使用步骤如下:
步骤一、利用广义判别分析算法,对健康乳腺组织与浸润性导管癌组织的光谱特征进行归类和鉴别;
步骤二、利用广义判别分析算法,归类与鉴别不同分期浸润性导管癌组织差异化光谱信息;
步骤三、利用广义判别分析算法,针对同期条件下不同级的浸润性导管癌组织差异化光谱信息进行鉴别。
作为本发明进一步的技术方案,在步骤五中,采用后验概率方法对基于广义判别分析算法的乳腺癌分期和分级准确性进行量化评价。
作为本发明进一步的技术方案,在步骤五中,主成分分析-支持向量机包括RBF、多项式和线性三种内核的拉曼光谱分期和分级方法,主成分分析-支持向量机的使用步骤如下:
步骤一、利用主成分分析方法对光谱数据集进行降维并提取主要的差异特征信息,获取最显著特征变量PC1和PC2输入至SVM的算法;
步骤二、利用网格搜索方法结合交叉验证从训练集光谱中确定RBF、多项式和线性三种内核的最优参数,认定分类精度最高的参数作为构建最终SVM模型的最佳参数;
步骤三、将所建模型应用于验证测试集数据,验证模型的分类性能。
作为本发明进一步的技术方案,训练集光谱占光谱数据总量的80%,测试集数据占光谱数据总量的20%,训练集与测试集的划分比率根据样品量大小进行调整。
作为本发明进一步的技术方案,在步骤五中,主成分分析-线性判别分析算法的使用步骤如下:
步骤一、通过主成分分析方法降低光谱数据集的维度,并且结合单因素方差分析,提取和识别显著差异主成分信息;
步骤二、将提取的显著差异主成分信息作为线性判别函数的输入变量,生成PCA-LDA光谱病理鉴别模型;
步骤三、利用模型对健康乳腺组织与不同TNM分期分级浸润性导管癌组织的光谱特征进行归类和判别。
与现有技术相比,本发明的有益效果是:
1)本发明首先提出一种简易化的共聚焦拉曼光谱检测装置,采用785nm激光、光纤束、光谱仪等核心元器件,实现临床保乳手术中切除的组织、组织病理活检所采集的组织、乳腺组织冰冻病理切片等各类样品的拉曼光谱信息高效采集;
2)本发明提出采用上述共聚焦拉曼光谱检测装置,快速检测临床保乳手术中切除的组织、组织病理活检所采集的组织、乳腺组织冰冻病理切片等各类样品所含脂肪酸、蛋白质、胡萝卜素、血红蛋白和核酸等生物标志物光谱特征信息;
3)本发明提出建立了基于广义判别分析、提出基于三种运算内核的主成分分析-支持向量机以及提出基于主成分分析-线性判别分析,实现基于拉曼光谱信息的乳腺癌病理分期、分级。
结合大量临床验证性前期研究,归纳分析,提出广义判别分析、主成分分析-支持向量机和成分分析-线性判别分析的光谱分析手段,应用于不同乳腺癌病变组织拉曼光谱数据的归类和鉴别,挖掘组织病理状态所包含的统计学光谱信息,实现基于拉曼光谱检测技术的乳腺癌病理分期和分级。
为更清楚地阐述本发明的结构特征和功效,下面结合附图与具体实施例来对本发明进行详细说明。
附图说明
图1为本发明实施例提供的无损免标记快速乳腺癌拉曼光谱病理分级分期方法的工作流程图。
图2为本发明实施例提供的简易化的光谱检测装置对光谱检测的光路图。
图3为本发明实施例提供的健康组、浸润性乳腺癌一期、二期和三期的归一化平均拉曼光谱图及差谱图。
图4为本发明实施例提供的主要拉曼特征峰的强度统计图。
图5为本发明实施例提供的广义判别分析算法病理判别模型对比图。
图6为本发明实施例提供的基于广义判别分析算法的后验概率值对比图。
图7为本发明实施例提供的基于RBF、多项式和线性三种内核的PCA-SVM模型对比图。
图8为本发明实施例提供的健康、一期、二期和三期的PCA-LDA分数散点图。
附图标记:1-装置体,2-光谱仪,3-光纤耦合镜,4-长通滤波器,5-带通滤波器,6-二向平镜,7-平凸透镜,8-光纤输出准直器,9-半导体激光器。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
以下结合具体实施例对本发明的具体实现进行详细描述。
实施例1
如图1所示,作为本发明一个实施例提供的一种无损免标记快速乳腺癌拉曼光谱病理分级分期方法,包括如下步骤:
步骤一、获取乳腺组织样品:通过临床保乳手术、组织病理活检和组织冰冻切片,得到乳腺组织样品;
步骤二、测量组织拉曼光谱:通过拉曼光谱检测装置所使用的激发激光经二向色镜反射后,被凸透镜汇聚于乳腺组织上,在组织表面与内部激发出光谱信息,光谱信息透过二向色镜后被光纤束结构收集,并由光谱仪记录分析;
步骤三、组织拉曼光谱预处理:通过光谱范围选择、去除荧光背景、光谱曲线下面积校准以及光谱平滑的方法,完成测量光谱荧光背景去除、光谱曲线平滑与归一化等预处理的操作;
步骤四、获取光谱特征差异信息:明确健康乳腺组织与浸润性导管癌组织所具有的光谱特征,并提出不同分期、分级条件下,浸润性导管癌组织所含有的色氨酸、苯丙氨酸、β-类胡萝卜素、脂质、核酸、蛋白质和脂肪酸生物标志物的光谱特征差异;
步骤五、所获得拉曼光谱信息对乳腺癌进行分期和分级:通过广义判别分析算法、主成分分析-支持向量机和主成分分析-线性判别分析算法,实现乳腺癌TNM分期和分级并对其应用效力进行了对比分析。
在本实施例中,结合大量临床验证性前期研究,提出广义判别分析、主成分分析-支持向量机和主成分分析-线性判别分析的光谱分析手段,应用于不同乳腺癌病变组织拉曼光谱数据的归类和鉴别,挖掘组织病理状态所包含的统计学光谱信息,实现基于拉曼光谱检测技术的乳腺癌病理分期和分级。
如图2所示,作为本发明的一种优选实施例,在步骤二中,拉曼光谱检测装置包括装置体1、光谱仪2、光纤耦合镜3、长通滤波片4、带通滤波片5、二向色镜6、平凸透镜7、光纤输出准直器8和半导体激光器9,所述光纤耦合镜3、长通滤波片4、带通滤波片5、二向色镜6、平凸透镜7和光纤输出准直器8均设置在装置体1内,装置体1的两端分别与光谱仪2和半导体激光器9利用光纤结构连接。
如图2所示,作为本发明的一种优选实施例,在步骤二中,光纤束结构为一个圆形转线性排列的光纤阵列结构,其圆形排布面为光谱采集端,其线性排布面连接至光谱仪2,光纤束线性排布面的尺寸以及光纤束所含光纤的数量与直径,可根据光谱仪2CCD像元排布进行设计。
如图2所示,作为本发明的一种优选实施例,采用简易化的共聚焦拉曼光谱检测系统的光路,该系统主要由光谱激发端和光谱采集端两部分组成,在光谱激发端,使用波长为785nm功率连续可调半导体激光器9作为激发光源。采用光纤耦合镜3与光束准直器8对激发光准直输出,激发光通过785nm带通滤波片5(避免激光的光谱边带分量或杂散光进入激发光路,通过二向色镜6),用石英平凸透镜7将光聚焦在乳腺生物组织上,探测到的光谱信息透过二向色镜6透射,用长通滤波片4滤掉背向杂散激光,利用石英平凸透镜7将探测光耦合进光纤束,将获取到的拉曼散射光子传输至光谱仪2,并被背感光深度制冷CCD检测到。
实施例2
作为本发明的一种优选实施例,在步骤五中,广义判别分析算法的使用步骤如下:
步骤一、利用广义判别分析算法,对健康乳腺组织与浸润性导管癌组织的光谱特征进行归类和判别;
步骤二、利用广义判别分析算法,归纳鉴别不同分期浸润性导管癌组织差异化光谱信息;
步骤三、针对同期条件下不同级的浸润性导管癌组织差异化光谱信息进行鉴别。
如图3所示,(A)为健康乳腺组织(对照组)和浸润性乳腺癌不同TNM分期{一期[StageI—SI(SIG1,SIG2和SIG3)]、二期[StageII—SII(SIIG1,SIIG2和SIIG3)]和三期[StageIII—SIII(SIIIG1,SIIIG2和SIIIG3)]}的归一化平均拉曼光谱。
结果表明光谱特征峰分布于754cm-1(色氨酸),1003cm-1(苯丙氨酸)、1155cm-1(β-类胡萝卜素)、1450cm-1(脂质)、1525cm-1(β-类胡萝卜素)、1585cm-1(核酸)、1664cm-1(蛋白质和脂肪酸)、2930cm-1(蛋白质和脂肪酸)。
为了比较在健康组和癌变组[一期(SI)、二期(SII)和三期(SIII)]中上述生化物质的差异,所作差谱如图1(B)中所示,差谱表明癌变组中色氨酸、核酸和蛋白质的特征峰强度较高,健康组中苯丙氨酸、β-胡萝卜素和脂质的特征峰强度较高。
如图4所示,为了进一步探索在浸润性乳腺癌不同TNM分期[一期(SI)、二期(SII)和三期(SIII)]中上述生物物质的变化规律,对754cm-1(色氨酸),1003cm-1(苯丙氨酸)、1155cm-1(β-类胡萝卜素)、1450cm-1(脂质)、1525cm-1(β-类胡萝卜素)、1585cm-1(核酸)、1664cm-1(蛋白质和脂肪酸)、2930cm-1(蛋白质和脂肪酸)的特征峰强度通过单因素方差分析(ANOVA)方法进行统计学分析,所有研究的光谱特征峰均存在显著的强度差异(P<0.0001)。
如图4所示,当乳腺组织从健康病变为三期癌症时,位于754cm-1处色氨酸的归一化峰值强度在健康组和癌症组之间呈增加趋势,并且在癌症从一期加剧至三期这一过程中出现些许下降的趋势,位于1003cm-1处苯丙氨酸表现出与色氨酸峰相似的变化规律,但在癌症病变过程中强度下降趋势非常明显。位于1155和1525cm-1处的β-类胡萝卜素峰的强度均急剧地呈线性下降。当癌症处于一期时,脂质(1450cm-1)、蛋白质和脂肪酸(1664cm-1和2930cm-1)的强度变化明显低于健康组,而在癌症严重程度增加后,其强度变化增强,其中1450cm-1和2930cm-1的增量更为显著。相反地,核酸(1585cm-1)强度在癌症一期时明显高于健康组织,并且随着癌变严重程度的增加而轻微增强
实施例3
作为本发明的一种优选实施例,为了提取更可靠的与TNM分期、分级直接相关的光谱特征纤细,实现乳腺癌分期分级的判别诊断,构建了广义判别分析病理判别模型来诊断乳腺肿瘤的分期和分级。
如图5(A)所示,健康组、一期(SI)癌症和二期(SII)癌的光谱分布在第一投射方向(GD1)的负轴上但彼此分离,而三期(SIII)癌症的光谱分布在GD1正轴上。健康组和一期(SI)癌症的光谱均聚集在第二投影方向(GD2)的负轴上,而二期(SII)和三期(SIII)癌症的光谱则分布在正轴上,健康组(对照组)去除时,如图4(B)所示,一期(SI),二期(SII)和三期(SIII)癌症被GD1和GD2的零线正确地归类。
在分期结果的基础上,进一步构建了分级的广义判别分析模型。每一分期包含三个分级,如一期(SI)包括一级(Grade1、G1),二级(Grade2、G2)和三级(Grade3、G3)。一期(SI)、二期(SII)和三期(SIII)中各分级的GDA结果分别如图5(C)、(D)和(E)所示,各分级同样均被GD1和GD2准确地归类。在GD1和GD2形成的特征空间中,同类的光谱大体聚集成团,并具有良好的紧致性,且异类彼此分离。
实施例4
作为本发明的一种优选实施例,在步骤五中,采用后验概率方法对基于广义判别分析算法的乳腺癌分期和分级准确性进行量化评价。
如图6所示,同时利用广义判别分析算法进一步计算了不同TNM分期和分级的后验概率并将其表示为二维三元相图,三元图内的一个点具有总概率。
图6(A)为一期(SI)、二期(SII)和三期(SIII)癌症的后验概率,结果表明一期(SI)癌症和二期(SII)癌症的后验概分界值为0.5,三期(SIII)癌症的后验概率均接近1。
在图6(B)、(C)和(D)分别为一期(SI)、二期(SII)和三期(SIII)相对应下各分级的后验概率值。
在图6(B)(一期分级)中,一级(G1)和三级(G3)的后验概分界值为0.5,二级(G2)的后验概率值大部分接近于1。
在图6(C)(二期分级)中,一级(G1)和二级(G2)的后验概分界值为0.5,三级(G3)的后验概率值主要接近于1。
在图6(D)(三期分级)中,一级(G1)、二级(G2)和三级(G3)的后验概率均接近1。
实施例5
作为本发明的一种优选实施例,在步骤五中,主成分分析-支持向量机包括RBF、多项式和线性三种内核的拉曼光谱分期和分级方法,主成分分析-支持向量机的使用步骤如下:
步骤一、利用主成分分析方法对光谱数据集进行降维并且提取特征信息,获取最显著特征变量PC1和PC2输入至SVM的算法;
步骤二、利用网格搜索方法结合交叉验证从训练集光谱中确定RBF、多项式和线性三种内核的最优参数,认定分类精度最高的参数作为构建最终SVM模型的最佳参数;
步骤三、将所建模型应用于验证测试集数据,验证模型的分类性能。
在图7中,(A)为RBF内核PCA-SVM模型分类准确率随参数C和γ变化关系;(B)为多项式内核PCA-SVM模型分类准确率随参数C和多项式阶数d的变化关系;(C)为线性核函数PCA-SVM算法分类准确度与参数C的关系。
如图7所述,以80%实验数据为训练数据集,采用网格搜索结合LOOCV来优化每个核的参数,以观察PCA-SVM模型训练过程中不同参数对分类精度的影响。在图7(A)中,RBF内核PCA-SVM模型中参数C在2-10至210的范围内变化,参数γ在2-8至210的范围内变化;并随着C在这一变化范围内增大而γ相应减小时,RBF核的精度逐渐提高;其中C=0.5,γ=0.0039时,模型的准确率达到了最高75.83%。
在多项式内核时,同样需要对两个参数(参数C和多项式阶数d)进行优化。如图7(B)中所示,当C值和项式阶数d均逐渐增大时,模型的准确率也逐渐提高;其中参数C=256,多项式阶数d=5时,模型的分类准确率最高,可以达到73.33%。
对于线性核PCA-SVM模型,只需要优化一个参数C。如图7(C)中显示了分类精度与参数C的关系,当C=64时,分类准确率达到最高值25%,优化SVM算法和参数后,选择准确率最高时的参数作为最佳参数构建模型,并在测试集(其他20%光谱数据)中进行模型性能验证,结果表明:RBF核PCA-SVM模型在测试集中的总体分类准确率为80.91%,多项式核PCA-SVM模型的总体分类准确率均为73.64%,而线性核PCA-SVM模型的总体分类准确率为36.36%。
实施例6
作为本发明的一种优选实施例,在步骤五中,主成分分析-线性判别分析算法的使用步骤如下:
步骤一、通过主成分分析方法降低光谱数据集的维度,并且结合单因素方差分析,提取和识别显著差异主成分信息;
步骤二、将提取的显著差异主成分信息作为线性判别函数的输入变量,生成PCA-LDA光谱病理鉴别模型;
步骤三、利用模型对健康乳腺组织与不同TNM分期分级浸润性导管癌组织的光谱特征进行归类和判别。
如图8所示,利用主成分分析方法(PCA)降低光谱数据集的数据维度,并且结合单因素方差分析(one-way ANOVA)提取、识别显著差异主成分信息(Principal Components,PCs,P<0.01)。
将所提取的最显著主成分PCs(PC1、PC2和PC3)作为线性判别函数(LDA)的输入变量,生成PCA-LDA光谱病理鉴别模型。
如图8所示,展示了基于PCA-LDA算法散点健康、一期[SI(SIG1,SIG2和SIG3)]二期[SII(SIIG1,SIIG2和SIIG3)]和三期[SIII(SIIIG1,SIIIG2和SIIIG3)]的归类结果。结果表明健康组、一期(SI)和三期(SIII)被第一主函数和第二主函数的零线准确地区分且彼此分离,而二期(SI)介于一期(SI)和三期(SIII)间未被完全地归类诊断。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种无损免标记快速乳腺癌拉曼光谱病理分级分期方法,其特征在于,包括如下步骤:
步骤一、获取乳腺组织样品:通过临床保乳手术、组织病理活检和组织冰冻切片,得到乳腺组织样品;
步骤二、测量组织拉曼光谱:通过拉曼光谱检测装置所使用的激发激光经二向色镜反射后,被凸透镜汇聚于乳腺组织上,在组织表面与内部激发出光谱信息,光谱信息透过二向色镜后被光纤束结构收集,并由光谱仪记录分析;
步骤三、组织拉曼光谱预处理:通过光谱范围选择、去除荧光背景、光谱曲线下面积校准以及光谱平滑的方法,完成测量光谱荧光背景去除、光谱曲线平滑与归一化的预处理;
步骤四、获取光谱特征差异信息:明确健康乳腺组织与浸润性导管癌组织所具有的光谱特征,并提出不同分期、分级条件下,浸润性导管癌组织所含有的色氨酸、苯丙氨酸、β-类胡萝卜素、脂质、核酸、蛋白质和脂肪酸生物标志物的光谱特征差异;
步骤五、结合所获得拉曼光谱信息对乳腺癌进行病理分期和分级:通过广义判别分析算法、主成分分析-支持向量机和主成分分析-线性判别分析算法,对乳腺癌TNM进行分期和分级并对其应用效力进行对比分析。
2.根据权利要求1所述的无损免标记快速乳腺癌拉曼光谱病理分级分期方法,其特征在于,步骤二中,拉曼光谱检测装置包括装置体、光谱仪、光纤耦合镜、长通滤波片、带通滤波片、二向色镜、平凸透镜、光纤输出准直器和半导体激光器,所述光纤耦合镜、长通滤波片、带通滤波片、二向色镜、平凸透镜和光纤输出准直器均设置在装置体内,装置体的两端分别与光谱仪和半导体激光器电性连接。
3.根据权利要求2所述的无损免标记快速乳腺癌拉曼光谱病理分级分期方法,其特征在于,在步骤二中,光纤束结构为一个圆形转线性排列的光纤阵列结构,其圆形排布面为光谱采集端,其线性排布面连接至光谱仪,光纤束线性排布面的尺寸以及光纤束所含光纤的数量与直径,可根据光谱仪CCD像元排布进行设计。
4.根据权利要求1所述的无损免标记快速乳腺癌拉曼光谱病理分级分期方法,其特征在于,在步骤五中,广义判别分析算法的使用步骤如下:
步骤一、利用广义判别分析算法,对健康乳腺组织与浸润性导管癌组织的光谱特征进行归类和鉴别;
步骤二、利用广义判别分析算法,归类与鉴别不同分期浸润性导管癌组织差异化光谱信息;
步骤三、利用广义判别分析算法,针对同期条件下不同级的浸润性导管癌组织差异化光谱信息进行鉴别。
5.根据权利要求1所述的无损免标记快速乳腺癌拉曼光谱病理分级分期方法,其特征在于,在步骤五中,采用后验概率方法对基于广义判别分析算法的乳腺癌分期和分级准确性进行量化评价。
6.根据权利要求1所述的无损免标记快速乳腺癌拉曼光谱病理分级分期方法,其特征在于,在步骤五中,主成分分析-支持向量机包括RBF、多项式和线性三种内核的拉曼光谱分期和分级方法,主成分分析-支持向量机的使用步骤如下:
步骤一、利用主成分分析方法对光谱数据集进行降维并且提取主要的差异特征信息,获取最显著特征变量PC1和PC2输入至SVM的算法;
步骤二、利用网格搜索方法结合交叉验证从训练集光谱中确定RBF、多项式和线性三种内核的最优参数,认定分类精度最高的参数作为构建最终SVM模型的最佳参数;
步骤三、将所建模型应用于验证测试集数据,验证模型的分类性能。
7.根据权利要求6所述的无损免标记快速乳腺癌拉曼光谱病理分级分期方法,其特征在于,训练集光谱占光谱数据总量的80%,测试集数据占光谱数据总量的20%,训练集与测试集的划分比率根据样品量进行调整。
8.根据权利要求1所述的无损免标记快速乳腺癌拉曼光谱病理分级分期方法,其特征在于,在步骤五中,主成分分析-线性判别分析算法的使用步骤如下:
步骤一、通过主成分分析方法降低光谱数据集的维度,并且结合单因素方差分析,提取和识别显著差异主成分信息;
步骤二、将提取的显著差异主成分信息作为线性判别函数的输入变量,生成PCA-LDA光谱病理鉴别模型;
步骤三、利用模型对健康乳腺组织与不同TNM分期分级浸润性导管癌组织的光谱特征进行归类和判别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210622396.8A CN114923893B (zh) | 2022-06-02 | 2022-06-02 | 一种无损免标记快速乳腺癌拉曼光谱病理分级分期方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210622396.8A CN114923893B (zh) | 2022-06-02 | 2022-06-02 | 一种无损免标记快速乳腺癌拉曼光谱病理分级分期方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114923893A CN114923893A (zh) | 2022-08-19 |
CN114923893B true CN114923893B (zh) | 2024-04-30 |
Family
ID=82813143
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210622396.8A Active CN114923893B (zh) | 2022-06-02 | 2022-06-02 | 一种无损免标记快速乳腺癌拉曼光谱病理分级分期方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114923893B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115409830A (zh) * | 2022-09-30 | 2022-11-29 | 广州医科大学附属第一医院(广州呼吸中心) | 一种输尿管肾盂肿瘤的检测系统、装置及存储介质 |
CN116030032A (zh) * | 2023-02-16 | 2023-04-28 | 四川省肿瘤医院 | 基于拉曼光谱数据的乳腺癌分析设备、系统及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011088580A1 (en) * | 2010-01-22 | 2011-07-28 | British Columbia Cancer Agency Branch | Apparatus and methods for characterization of lung tissue by raman spectroscopy |
CN108713143A (zh) * | 2015-09-10 | 2018-10-26 | 光束线诊断有限公司 | 用于分析包含根据每个细胞产生的ftir光谱识别或分选细胞样本的方法、计算机程序和系统 |
CN110412291A (zh) * | 2019-07-30 | 2019-11-05 | 福建师范大学 | 一种构建sers光谱探针检测乳腺癌标志物egfr磷酸化酪氨酸的方法 |
WO2022076879A1 (en) * | 2020-10-08 | 2022-04-14 | Board Of Supervisors Of Louisiana State University And Agricultural And Mechanical College | Raman spectroscopy system and methods of using the same |
-
2022
- 2022-06-02 CN CN202210622396.8A patent/CN114923893B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011088580A1 (en) * | 2010-01-22 | 2011-07-28 | British Columbia Cancer Agency Branch | Apparatus and methods for characterization of lung tissue by raman spectroscopy |
CN108713143A (zh) * | 2015-09-10 | 2018-10-26 | 光束线诊断有限公司 | 用于分析包含根据每个细胞产生的ftir光谱识别或分选细胞样本的方法、计算机程序和系统 |
CN110412291A (zh) * | 2019-07-30 | 2019-11-05 | 福建师范大学 | 一种构建sers光谱探针检测乳腺癌标志物egfr磷酸化酪氨酸的方法 |
WO2022076879A1 (en) * | 2020-10-08 | 2022-04-14 | Board Of Supervisors Of Louisiana State University And Agricultural And Mechanical College | Raman spectroscopy system and methods of using the same |
Non-Patent Citations (2)
Title |
---|
基于高波数拉曼光谱的口腔癌检测方法研究;胡阳;董明利;于明鑫;张韬;朱智慧;;仪器仪表学报;20191215(第12期);全文 * |
拉曼光谱技术在乳腺癌临床应用方面的研究进展;申李胜男;李思敏;李倩;麻帅;韩冰;;吉林大学学报(医学版);20200328(第02期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN114923893A (zh) | 2022-08-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114923893B (zh) | 一种无损免标记快速乳腺癌拉曼光谱病理分级分期方法 | |
Stone et al. | Raman spectroscopy for identification of epithelial cancers | |
US20070178067A1 (en) | System and method for cytological analysis by raman spectroscopic imaging | |
US20060281068A1 (en) | Cytological methods for detecting a disease condition such as malignancy by Raman spectroscopic imaging | |
US7103401B2 (en) | Colonic polyp discrimination by tissue fluorescence and fiberoptic probe | |
US6768918B2 (en) | Fluorescent fiberoptic probe for tissue health discrimination and method of use thereof | |
US9798918B2 (en) | Method and system for analyzing biological specimens by spectral imaging | |
US20060253261A1 (en) | Digitizing biology | |
JP2006517417A (ja) | 改良された診断用蛍光・反射 | |
JPH10505167A (ja) | ラマン分光分析法および蛍光分光分析法を用いて子宮頚前癌を診断するための光学方法および装置 | |
US20120200850A1 (en) | Cytological methods for detecting a condition such as transplant efficiency by raman spectroscopic imaging | |
CN108474691B (zh) | 基于拉曼的免疫测定系统和方法 | |
CN102740762A (zh) | 由拉曼光谱法表征肺组织的设备和方法 | |
US20050250091A1 (en) | Raman molecular imaging for detection of bladder cancer | |
AU2014235921A1 (en) | Method and system for analyzing biological specimens by spectral imaging | |
CN103476321B (zh) | 具有个性化阈值的肿瘤组织分类 | |
CN111398250A (zh) | 一种基于光与物质相互作用所产生的分子碎片谱的肿瘤诊断方法 | |
CN115541556A (zh) | 一种预测或辅助诊断类风湿关节炎的生物标志物 | |
US9903869B2 (en) | Device and method for analyzing a sample for the identification of prostate tumours | |
WO2007011571A2 (en) | Digitizing biology | |
WO2018195466A1 (en) | System and method for characterization of a brain tissue sample using raman marker regions | |
JP7242851B2 (ja) | 子宮頸がんのグレード検出のためのスクリーニングキットおよびその調製方法 | |
CN112611701B (zh) | 一种基于动态相干光学成像技术的循环肿瘤细胞检测装置 | |
CN115060701A (zh) | 一种干燥综合征模型及其建立方法、应用 | |
CN117038060A (zh) | 一种基于机器学习级联的拉曼光谱分子检测及成像装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |