CN110763652A - 一种检测braf v600e突变的近红外光谱方法 - Google Patents
一种检测braf v600e突变的近红外光谱方法 Download PDFInfo
- Publication number
- CN110763652A CN110763652A CN201910332553.XA CN201910332553A CN110763652A CN 110763652 A CN110763652 A CN 110763652A CN 201910332553 A CN201910332553 A CN 201910332553A CN 110763652 A CN110763652 A CN 110763652A
- Authority
- CN
- China
- Prior art keywords
- braf
- mutation
- mutant
- wild type
- spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 102200055464 rs113488022 Human genes 0.000 title claims abstract description 227
- 238000000034 method Methods 0.000 title claims abstract description 103
- 230000035772 mutation Effects 0.000 title claims abstract description 85
- 238000002329 infrared spectrum Methods 0.000 title claims abstract description 31
- 230000003595 spectral effect Effects 0.000 claims abstract description 81
- 238000001228 spectrum Methods 0.000 claims abstract description 78
- 206010028980 Neoplasm Diseases 0.000 claims abstract description 59
- 201000011510 cancer Diseases 0.000 claims abstract description 59
- 238000012545 processing Methods 0.000 claims abstract description 18
- 238000004458 analytical method Methods 0.000 claims abstract description 8
- 239000012188 paraffin wax Substances 0.000 claims description 92
- 206010009944 Colon cancer Diseases 0.000 claims description 86
- 208000001333 Colorectal Neoplasms Diseases 0.000 claims description 71
- 238000001514 detection method Methods 0.000 claims description 46
- 208000024770 Thyroid neoplasm Diseases 0.000 claims description 42
- 201000002510 thyroid cancer Diseases 0.000 claims description 42
- 238000012937 correction Methods 0.000 claims description 26
- 238000003759 clinical diagnosis Methods 0.000 claims description 22
- 238000005259 measurement Methods 0.000 claims description 21
- 230000009467 reduction Effects 0.000 claims description 18
- 238000010200 validation analysis Methods 0.000 claims description 17
- 238000000513 principal component analysis Methods 0.000 claims description 15
- 230000035945 sensitivity Effects 0.000 claims description 15
- 238000002790 cross-validation Methods 0.000 claims description 13
- 230000005540 biological transmission Effects 0.000 claims description 9
- 238000011156 evaluation Methods 0.000 claims description 5
- 238000013528 artificial neural network Methods 0.000 claims description 2
- 238000003909 pattern recognition Methods 0.000 claims description 2
- 238000012847 principal component analysis method Methods 0.000 claims description 2
- 238000003745 diagnosis Methods 0.000 abstract description 12
- 238000010827 pathological analysis Methods 0.000 abstract description 6
- 230000001575 pathological effect Effects 0.000 abstract description 6
- 238000003860 storage Methods 0.000 abstract description 5
- 230000008569 process Effects 0.000 abstract description 3
- 210000001519 tissue Anatomy 0.000 description 122
- 238000012795 verification Methods 0.000 description 20
- 238000007781 pre-processing Methods 0.000 description 18
- 208000029742 colonic neoplasm Diseases 0.000 description 15
- 238000003752 polymerase chain reaction Methods 0.000 description 13
- 238000009826 distribution Methods 0.000 description 12
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 11
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 11
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 11
- 235000013922 glutamic acid Nutrition 0.000 description 11
- 239000004220 glutamic acid Substances 0.000 description 11
- 239000004474 valine Substances 0.000 description 11
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 10
- 238000004497 NIR spectroscopy Methods 0.000 description 9
- 230000001186 cumulative effect Effects 0.000 description 7
- 238000000605 extraction Methods 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 7
- 101000984753 Homo sapiens Serine/threonine-protein kinase B-raf Proteins 0.000 description 5
- 102100027103 Serine/threonine-protein kinase B-raf Human genes 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000007490 hematoxylin and eosin (H&E) staining Methods 0.000 description 5
- 238000010186 staining Methods 0.000 description 4
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000003364 immunohistochemistry Methods 0.000 description 3
- 201000001441 melanoma Diseases 0.000 description 3
- 108090000623 proteins and genes Proteins 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 201000003741 Gastrointestinal carcinoma Diseases 0.000 description 2
- 206010064571 Gene mutation Diseases 0.000 description 2
- 102000043136 MAP kinase family Human genes 0.000 description 2
- 108091054455 MAP kinase family Proteins 0.000 description 2
- 108700020796 Oncogene Proteins 0.000 description 2
- 206010039491 Sarcoma Diseases 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 230000002055 immunohistochemical effect Effects 0.000 description 2
- 201000002313 intestinal cancer Diseases 0.000 description 2
- 238000000386 microscopy Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 102100030011 Endoribonuclease Human genes 0.000 description 1
- 101710199605 Endoribonuclease Proteins 0.000 description 1
- 238000005033 Fourier transform infrared spectroscopy Methods 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 101710113029 Serine/threonine-protein kinase Proteins 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 101150048834 braF gene Proteins 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 229960005395 cetuximab Drugs 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000004043 dyeing Methods 0.000 description 1
- 102000052116 epidermal growth factor receptor activity proteins Human genes 0.000 description 1
- 108700015053 epidermal growth factor receptor activity proteins Proteins 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- YOHYSYJDKVYCJI-UHFFFAOYSA-N n-[3-[[6-[3-(trifluoromethyl)anilino]pyrimidin-4-yl]amino]phenyl]cyclopropanecarboxamide Chemical compound FC(F)(F)C1=CC=CC(NC=2N=CN=C(NC=3C=C(NC(=O)C4CC4)C=CC=3)C=2)=C1 YOHYSYJDKVYCJI-UHFFFAOYSA-N 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 235000018102 proteins Nutrition 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012883 sequential measurement Methods 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 238000002626 targeted therapy Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/359—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/3563—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing solids; Preparation of samples therefor
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/50—Mutagenesis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/10—Signal processing, e.g. from mass spectrometry [MS] or from PCR
Landscapes
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Analytical Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Chemical & Material Sciences (AREA)
- Pathology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Theoretical Computer Science (AREA)
- Immunology (AREA)
- General Physics & Mathematics (AREA)
- Genetics & Genomics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Evolutionary Computation (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Bioethics (AREA)
- Artificial Intelligence (AREA)
- Signal Processing (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明公开了一种检测BRAF V600E突变的近红外光谱方法,先收集BRAF V600E野生型与突变型的癌组织切片,测量其近红外光谱,采用化学计量学方法进行光谱数据处理,采用模式识别分析方法建立检测BRAF V600E野生型与突变型的模型;再取未知BRAF V600E突变与否的癌组织切片,按相同方法采集光谱并进行光谱数据处理,最后应用所建模型进行预测。本发明方法能够灵敏、特异、准确、耐用、简便、快速、无损和低费用的检测癌组织BRAF V600E野生型与突变型,适用于可能发生BRAF V600E突变的多种癌组织,也适用于病理组织从储存到病理诊断过程中多个环节的组织形式,可用于临床辅助诊断。
Description
技术领域
本发明涉及人体基因突变的检测方法,更具体地说,涉及一种检测BRAF V600E突变的近红外光谱分析方法。
背景技术
鼠类肉瘤滤过性毒菌致癌同源体B1(v-raf murine sarcoma viral oncogenehomolog B1,BRAF)是一个重要的丝氨酸/苏氨酸蛋白激酶,由它参与的丝裂原活化蛋白激酶(mitogen-activated protein kinase,MAPK)信号通路调控细胞的增殖、分化和凋亡。BRAF基因突变常见于结直肠癌、甲状腺癌和黑色素瘤等恶性肿瘤中,目前已发现有超过30种BRAF突变类型,其中V600E突变被认为是最常见的,其导致蛋白质产物中第600位的缬氨酸(V)被谷氨酸(E)替代。
对BRAF V600E突变的检测,在癌症诊断(参考文献:Guoren Deng,Ian Bell,Suzanne Crawley,et al.BRAF Mutation Is Frequently Present in SporadicColorectal Cancer with Methylated hMLH1,But Not in Hereditary NonpolyposisColorectal Cancer[J].Clinical Cancer Research,2004,10:191-195.)、靶向治疗(参考文献:Federica Di Nicolantonio,Miriam Martini,Francesca Molinari,et al.Wild-Type BRAF Is Required for Response to Panitumumab or Cetuximab in MetastaticColorectal Cancer[J].Journal of Clinical Oncology,2008,26:5705-5712.)、癌症预后(参考文献:Jolien Tol,JeroenR.Dijkstra,Marjolein Klomp,et al.Markers forEGFR Pathway Activation as Predictor of Outcome in Metastatic ColorectalCancer Patients Treated with or without Cetuximab[J].European Journal ofCancer,2010,46:1997-2009.)等方面均具有重要意义。
目前用于临床检测BRAF V600E突变的常用方法包括免疫组织化学(IHC)结合显微镜检查、聚合酶链式反应(PCR)和基因测序。然而,在IHC-显微技术中,IHC是一个多步骤过程,很容易受各种因素的影响而导致染色失败,包括全阴性、全阳性、背景太深、阳性对照染色良好但阳性样品未染色、染色强度不均匀。此外,在显微镜观察中,由于形态学方法的主观性和复杂性,突变检测的准确性严重受限于病理学家的经验。另一方面,聚合酶链反应(PCR)和基因测序至少存在操作繁琐、耗时和高费用等缺陷。因此,建立一种灵敏、特异、准确、耐用、简便、快速、无损和低费用的方法来辅助检测BRAF V600E突变是一个亟待解决的问题。
发明内容
本发明的目的在于克服现有技术存在的不足,提供一种灵敏、特异、准确、耐用、简便、快速、无损和低费用的检测BRAF V600E突变的近红外光谱分析方法。
经研究,本发明的技术方案如下:
一种检测BRAF V600E突变的近红外光谱方法,包括以下步骤:
(1)收集并记录BRAF V600E野生型与突变型的癌组织切片;
(2)测量步骤(1)所得每片切片的近红外光谱;
(3)对步骤(2)所得光谱,采用化学计量学方法进行光谱数据处理,采用模式识别分析方法建立BRAF V600E野生型与突变型的预测模型;
(4)取未知BRAF V600E突变与否的癌组织切片,按照步骤(2)所述方法测量近红外光谱,按照步骤(3)所述方法进行光谱数据处理,然后应用步骤(3)所建模型预测该癌组织切片是否发生BRAF V600E突变。
本发明方法是基于BRAF V600E野生型与突变型的特征信息即缬氨酸与谷氨酸的结构差异来对癌组织中BRAF V600E突变进行检测,所以本发明方法不受疾病部位的影响,即本发明方法适用于可能发生BRAF V600E突变的多种癌组织切片,如大肠癌组织切片、甲状腺癌组织切片、黑色素瘤组织切片等。本发明提供了运用基于大肠癌BRAF V600E野生型和突变型组织切片建立的模型准确预测甲状腺癌BRAF V600E突变型组织切片的实施例,以及运用基于大肠癌BRAF V600E野生型和甲状腺癌BRAF V600E突变型组织切片建立的模型准确预测大肠癌BRAF V600E突变型的实施例,这些实施例都证实了上述结论。
优选的,一种检测BRAF V600E突变的近红外光谱方法,包括以下步骤:
(1)收集并记录BRAF V600E野生型与突变型的癌组织切片;
(2)设置透反射光谱测量参数:分辨率8cm-1、扫描次数不低于64次、扫描范围12000~4000cm-1,测量步骤(1)所得每片切片的近红外透反射光谱,每次扫描切片前以相同参数扫描并扣除背景;
(3)对步骤(2)所得光谱,不经或经化学计量学预处理,选择建模光谱范围,采用主成分分析法即PCA降维,根据模型性能选取1个或多个主成分作为建模特征变量,采用非线性模式识别分析方法建立BRAF V600E野生型与突变型的预测模型;
(4)取未知BRAF V600E突变与否的癌组织切片,按照步骤(2)所述方法测量近红外光谱,按照步骤(3)所述方法进行光谱数据处理,然后应用步骤(3)所建模型预测该组织切片是否发生BRAF V600E突变。
上述步骤(2)中的光谱测量模式和参数均经过了优选。只有采用适合于癌组织切片检测BRAF V600E突变的近红外光谱测量模式和参数,才能获得表征性能强的近红外光谱,从而为建立预测性能优良的BRAF V600E突变检测模型提供高质量的数据。
由于癌组织切片较薄,样品信息较少,本发明优选测量癌组织切片的透反射光谱。测量时,分析光从积分球检测窗射出,穿透样品后在载玻片制样专用红外透反射光谱测量附件(专利申请号:201811655256.0)的金箔内表面被反射,在返回积分球检测窗的途中再次穿透样品,因此,透反射光谱中样品信号强度是透射光谱的两倍,大大提高了检测灵敏度。
高的分辨率可以获得更多的数据,但同时也伴随着噪音的增加。为了确定最佳的分辨率,本发明固定扫描次数为32次,分别以分辨率为2cm-1、4cm-1、8cm-1、16cm-1、32cm-1对同一切片平行测量6次,综合方差大小及方差光谱的平滑程度得出分辨率为8cm-1和16cm-1时光谱最佳,但由于16cm-1的分辨率较低,切片信息数据较少,因此,光谱测量的分辨率优选为8cm-1。
增加扫描次数可降低光谱的噪音,但光谱的采集时间会相应增加。为了确定最佳的扫描次数,本发明固定分辨率为8cm-1,分别以扫描次数为16、32、64、128次对同一切片平行测量6次,结果发现,扫描次数为16次和32次时光谱的方差较大,扫描次数为64次和128次时光谱的方差无明显差异,而扫描次数越多,光谱的采集时间越长,因此,光谱测量的扫描次数优选为不低于64次。
优选的,上述步骤(3)中所述模型检测性能的评价参数包括临床诊断性能和模型性能。临床诊断性能为灵敏度、特异度和准确度,模型性能为校正集正判率、交叉验证正判率和验证集正判率。本发明方法使用临床诊断性能和模型性能两类评价参数对所建模型进行评价,保证了所建模型具有良好的预测性能和实用性能。
具体的,一种检测BRAF V600E突变的近红外光谱方法,包括以下步骤:
(1)收集并记录BRAF V600E野生型与突变型的癌组织切片;
(2)设置透反射光谱测量参数:分辨率8cm-1、扫描次数不低于64次、扫描范围12000~4000cm-1,测量步骤(1)所得每片切片的近红外透反射光谱,每次扫描切片前以相同参数扫描并扣除背景;
(3)对步骤(2)所得光谱,不经预处理,选择建模光谱范围为9000~6800cm-1和6500~4000cm-1,采用PCA降维,按照方差贡献率由高到低的顺序以及累积方差贡献率大于85%选取前4~8个主成分作为建模特征变量,采用对向传播人工神经网络即CP-ANN方法建立BRAF V600E野生型与突变型的预测模型;
(4)取未知BRAF V600E突变与否的癌组织切片,按照步骤(2)所述方法测量近红外光谱,按照步骤(3)所述方法进行光谱数据处理,然后应用步骤(3)所建模型预测该组织切片是否发生BRAF V600E突变。
上述步骤(3)中的光谱预处理方案、建模光谱范围和建模特征变量均为适于癌组织切片检测BRAF V600E突变的优选方案。建模光谱范围和建模特征变量的优化有助于提取癌组织中BRAF V600E野生型与突变型的特征信息以提高预测模型的特异性。本发明的实施例显示,在基于大肠癌组织切片和甲状腺癌组织切片的近红外透反射光谱建立BRAF V600E野生型与突变型的预测模型时,使用不同的光谱预处理方案、建模光谱范围和建模特征变量,所建模型的性能存在明显差异。
具体的,上述方法的步骤(1)和步骤(4)中所述癌组织为大肠癌组织或/和甲状腺癌组织。本发明提供了基于大肠癌组织切片或/和甲状腺癌组织切片建立模型预测大肠癌组织切片或/和甲状腺癌组织切片中BRAF V600E野生型与突变型的实施例。从这些实施例可以看出,本发明方法可以大肠癌组织切片建模,也可以大肠癌组织切片和甲状腺癌组织切片组合建模,所建模型均能够灵敏、特异、准确地检测大肠癌组织切片和甲状腺癌组织切片中BRAF V600E野生型与突变型,校正集正判率、交叉验证正判率和验证集正判率均达到84.0%以上。
具体的,上述方法的步骤(1)中所述癌组织切片可为石蜡切片、脱蜡切片或/和苏木素-伊红即HE染色切片。以上三种组织切片是病理学诊断常用的组织切片形式,也代表了病理组织从基本的储存形式到免疫组化病理诊断的整个过程。本发明对三种组织切片进行了分别建模和组合建模,结果表明,以不同类型切片所建立的多个模型均能够灵敏、特异、准确地预测癌组织切片中的BRAF V600E野生型与突变型。由于石蜡切片是病理组织的基本储存形式,以其为检测样品无需进行繁琐耗时的样品前处理就可以快速、无损地进行临床辅助诊断,可先于病理诊断、分子诊断等复杂诊断进行,而且用石蜡切片建立的模型具有良好的临床诊断性能(特别是灵敏度100.0%)和最佳的模型性能,因此,优选癌组织切片为石蜡切片。
优选的,上述方法的步骤(2)是在每片组织切片的3个不同位置各测量一张光谱,每张光谱均用于建模,以最大限度地利用组织切片中BRAF V600E野生型与突变型的特征信息,尽可能灵敏、特异、准确地进行检测。
优选的,上述方法的步骤(2)中测量切片的光谱时,是取BRAF V600E野生型与突变型的癌组织切片交替测量。采用野生型与突变型不同类别样品交替测量的方式可避免因采用相同类别样品顺序测量可能导致的系统误差对所建模型的预测可靠性产生干扰。
优选的,上述方法的步骤(3)中所述采用CP-ANN方法建立的预测模型结构为12×12。CP-ANN模型的结构对模型的拟合及预测性能有较大的影响,本发明研究结果显示,CP-ANN模型结构为12×12时,模型性能优于10×10,与15×15基本相当,所以优选CP-ANN结构为12×12。
本发明是基于癌组织切片的近红外光谱,结合化学计量学技术,检测BRAF V600E野生型与突变型,具有以下优点:
1)本发明方法不受疾病部位的影响,适用于可能发生BRAF V600E突变的多种癌组织切片,包括大肠癌组织切片、甲状腺癌组织切片、黑色素瘤组织切片;
2)本发明方法不受癌组织切片形式的影响,适用于病理组织从储存到免疫组化病理诊断多个阶段的病理组织切片,即石蜡切片、脱蜡切片或/和HE染色切片,无需额外制备组织切片;尤其是以石蜡切片作为检测样品时,无需进行脱蜡、HE染色等繁琐、耗时的样品前处理就可以快速、无损地完成检测,可作为临床辅助诊断先于病理诊断、分子诊断等复杂诊断进行;
3)本发明方法使用临床诊断性能和模型性能两类评价参数对所建模型进行评价,保证所建模型具有良好的预测性能和实用性能;
4)本发明方法操作简便、快速(单张光谱测量时间以秒计)、无损、耐用性好、检测费用低,能够灵敏、特异、准确地检测癌组织中BRAF V600E野生型与突变型。
附图说明
图1为大肠癌组织切片BRAF V600E野生型平均光谱与突变型平均光谱的差异图。
图2为实施例1预测大肠癌BRAF V600E野生型与突变型的大肠癌石蜡切片最优CP-ANN模型的分布图:白色区域代表野生型,灰色区域代表突变型;W和M分别代表野生型和突变型的校正集切片,w和m分别代表野生型和突变型的验证集切片。
图3为实施例1预测甲状腺癌BRAF V600E突变的大肠癌石蜡切片最优CP-ANN模型的分布图:白色区域代表野生型,灰色区域代表突变型;W和M分别代表野生型与突变型的校正集切片,w和m分别代表野生型和突变型的验证集切片,p代表甲状腺癌预测集切片。
图4为实施例2预测大肠癌BRAF V600E野生型与突变型的大肠癌脱蜡切片最优CP-ANN模型的分布图:白色区域代表野生型,灰色区域代表突变型;W和M分别代表野生型和突变型的校正集切片,w和m分别代表野生型和突变型的验证集切片。
图5为实施例3预测大肠癌BRAF V600E野生型与突变型的大肠癌HE染色切片最优CP-ANN模型的分布图:白色区域代表野生型,灰色区域代表突变型;W和M分别代表野生型与突变型的校正集切片,w和m分别代表野生型和突变型的验证集切片。
图6为实施例6预测大肠癌与甲状腺癌BRAF V600E突变的大肠癌野生型与甲状腺癌突变型石蜡切片最优CP-ANN模型的分布图:白色区域代表野生型,灰色区域代表突变型;W和M分别代表野生型与突变型的校正集切片,w和m分别代表野生型和突变型的验证集切片。
图7为实施例7预测大肠癌与甲状腺癌BRAF V600E突变的大肠癌野生型与大肠癌和甲状腺癌突变型石蜡切片最优CP-ANN模型的分布图:白色区域代表野生型,灰色区域代表突变型;W和M分别代表野生型与突变型的校正集切片,w和m分别代表野生型和突变型的验证集切片。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明的优选实施例进行详细的描述。
优选实施例中使用的近红外光谱仪为Nicolet iS50 FT-IR光谱仪(ThermoFisher Scientific),配置积分球附件和载玻片制样专用红外透反射光谱测量附件(专利申请号:201811655256.0)。
优选实施例中,所建模型检测性能的评价参数包括临床诊断性能和模型性能。临床诊断性能为灵敏度、特异度和准确度,模型性能为校正集正判率、交叉验证正判率和验证集正判率。计算临床诊断性能即灵敏度、特异度和准确度时,当1个样品的3张光谱的3个预测结果均为BRAF V600E野生型时,样品的最终检测结果为BRAF V600E野生型,否则为BRAFV600E突变型。换句话说,当1个样品的3张光谱的3个预测结果中至少有一个是BRAF V600E突变型时,样品的最终检测结果为BRAF V600E突变型。
实施例1 基于大肠癌野生型与突变型建立的检测石蜡切片中BRAF V600E突变的近红外光谱方法
1.样品的收集
收集并记录来自不同患者的大肠癌组织石蜡切片共104片,其中包括52片BRAFV600E野生型和52片BRAF V600E突变型。
2.光谱的测量
将光谱仪预热2小时并通过校验后,设置光谱测量参数为分辨率8cm-1、扫描次数64次、扫描范围12000~4000cm-1,将载玻片制样专用红外透反射光谱测量附件罩在置于积分球检测窗上的切片(载玻片向上)上方以完全遮蔽切片后,测量每片切片的近红外透反射光谱,每次扫描切片前以相同参数扫描并扣除背景,每片切片分别在3个不同位置各测量一张光谱,每张光谱均用于建模,BRAF V600E野生型与突变型组织切片交替测量。
3.光谱特征变量的提取与建模
(1)光谱预处理方案的选择
为了使所建模型具有优良的预测性能,对包括未处理即NP、多元散射校正即MSC、标准正则变换即SNV、一阶导数即FD、二阶导数即SD、Savitzky-Golay平滑即SGS、Norris平滑即NDS的多种光谱预处理技术进行了筛选与组合,见表1中的模型1-10。结果表明,所得光谱不经预处理时,所建模型的预测性能最优,如表1中的模型1。
(2)建模光谱范围的选择
采用前述优选的光谱预处理方案,根据石蜡切片中BRAF V600E野生型与突变型的近红外特征吸收的差异,如图1所示,人工优化建模光谱范围为9000~6800cm-1和6500~4000cm-1。比较表1中的模型1和13可以发现,选择不同建模光谱范围时,所建模型的性能存在明显差异。
(3)光谱数据的降维与主成分的选择
对所选建模光谱范围内的光谱数据进行PCA降维,当使用不同的主成分建模时,模型的性能存在明显差异,如表1中的模型1、11和12,最终按照方差贡献率由高到低的顺序以及累积方差贡献率大于85%选取前6个主成分作为建模特征变量。
(4)模型的建立与验证
采用CP-ANN方法建立石蜡切片中BRAF V600E突变的预测模型。从10×10、12×12和15×15三种结构中筛选最优CP-ANN模型结构,见表1中的模型1、14和15。结果发现,CP-ANN模型的结构为12×12时,模型性能优于10×10与15×15,所以优选CP-ANN模型结构为12×12。
从52片BRAF V600E野生型和52片BRAF V600E突变型大肠癌组织石蜡切片中随机选取12片BRAF V600E野生型和12片BRAF V600E突变型作为验证集切片,其余为校正集切片。使用校正集与验证集光谱数据的主成分得分建立与验证检测石蜡切片中BRAF V600E野生型与突变型的CP-ANN模型。结果显示,所建最优CP-ANN模型(表1模型1)的临床诊断性能即灵敏度为100.0%、特异度为87.5%、准确度为93.8%,模型性能即校正集正判率为98.0%、交叉验证正判率为95.0%、验证集正判率为94.4%,说明该模型具有优良的检测性能,能够准确检测石蜡切片中BRAF V600E野生型与突变型。最优CP-ANN模型的分布图如图2所示。
表1 检测石蜡切片中BRAF V600E突变的CP-ANN模型的主要建模参数与模型性能
4.未知样品的预测
(1)未知样品为大肠癌组织石蜡切片
取1片未知BRAF V600E突变与否的大肠癌组织石蜡切片,按照前述方法采集光谱并进行光谱数据处理,然后应用所建CP-ANN模型进行BRAF V600E野生型与突变型预测。结果该大肠癌组织石蜡切片预测为BRAF V600E突变型,与荧光聚合酶链式反应(PCR)方法的检测结果一致,说明本实施例所建方法能够对大肠癌组织石蜡切片中BRAF V600E野生型与突变型进行准确检测。
(2)未知样品为甲状腺癌组织石蜡切片
取8片未知BRAF V600E突变与否的甲状腺癌组织石蜡切片,按照前述方法采集光谱并进行光谱数据处理,然后应用所建CP-ANN模型进行BRAF V600E野生型与突变型预测。结果显示:8片甲状腺癌组织石蜡切片均预测为BRAF V600E突变型,与各自的荧光PCR方法检测结果一致,说明本实施例所建方法能够对甲状腺癌组织石蜡切片中BRAF V600E野生型与突变型进行准确检测。预测甲状腺癌BRAF V600E突变的大肠癌石蜡切片最优CP-ANN模型的分布图如图3所示。
综合上述实验结果可知,基于大肠癌野生型与突变型建立的检测石蜡切片中BRAFV600E突变的近红外光谱方法不仅适用于大肠癌BRAF V600E突变型检测,也适用于甲状腺癌BRAF V600E突变型检测,一方面证实了本发明方法确实是基于BRAF V600E野生型与突变型的特征信息即缬氨酸与谷氨酸的结构差异来检测BRAF V600E突变,另一方面也证实了本发明方法不受病变部位的影响,适用于可能发生BRAF V600E突变的多种癌症如大肠癌、甲状腺癌、黑色素瘤的BRAF V600E突变检测。
实施例2 基于大肠癌野生型与突变型建立的检测脱蜡切片中BRAF V600E突变的近红外光谱方法
1.样品的收集
收集并记录来自不同患者的大肠癌组织脱蜡切片共104片,其中包括52片BRAFV600E野生型和52片BRAF V600E突变型。
2.光谱的测量
同实施例1。
3.光谱特征变量的提取与建模
(1)光谱预处理方案的选择
为了使所建模型具有优良的预测性能,对包括NP、MSC、SNV、FD、SD、SGS、NDS的多种光谱预处理技术进行了筛选与组合,见表2中的模型1-10。结果表明,所得光谱不经预处理时,所建模型的预测性能最优,如表2中的模型1。
(2)建模光谱范围的选择
由于本实施例与实施例1均是基于BRAF V600E野生型与突变型的特征信息即缬氨酸与谷氨酸的结构差异来检测BRAF V600E突变,所以本实施例优选的建模光谱范围与实施例1相同,为9000~6800cm-1和6500~4000cm-1,如图1所示。
(3)光谱数据的降维与主成分的选择
对所选建模光谱范围内的光谱数据进行PCA降维,当使用不同的主成分建模时,模型的性能存在明显差异,如表2中的模型1、11和12,最终按照方差贡献率由高到低的顺序以及累积方差贡献率大于85%选取前8个主成分作为建模特征变量。
(4)模型的建立与验证
采用CP-ANN方法建立脱蜡切片中BRAF V600E突变的预测模型。从10×10、12×12和15×15三种结构中筛选最优CP-ANN模型结构,见表2中的模型1、14和15。结果发现,CP-ANN模型的结构为12×12时,模型性能优于10×10与15×15,所以优选CP-ANN模型结构为12×12。
从52片BRAF V600E野生型和52片BRAF V600E突变型大肠癌组织脱蜡切片中随机选取12片BRAF V600E野生型和12片BRAF V600E突变型作为验证集切片,其余为校正集切片。使用校正集与验证集光谱数据的主成分得分建立与验证检测脱蜡切片中BRAF V600E野生型与突变型的CP-ANN模型。结果显示,所建最优CP-ANN模型(表2模型1)的临床诊断性能即灵敏度为100.0%、特异度为92.5%、准确度为96.3%,模型性能即校正集正判率为97.0%、交叉验证正判率为88.0%、验证集正判率为94.4%,说明该模型具有优良的检测性能,能够准确检测脱蜡切片中BRAF V600E野生型与突变型。最优CP-ANN模型的分布图如图4所示。
表2 检测脱蜡切片中BRAF V600E突变的CP-ANN模型的主要建模参数与模型性能
4.未知样品的预测
取1片未知BRAF V600E突变与否的大肠癌组织脱蜡切片,按照前述方法采集光谱并进行光谱数据处理,然后应用所建CP-ANN模型进行BRAF V600E野生型与突变型预测。结果该大肠癌组织脱蜡切片预测为BRAF V600E野生型,与荧光PCR方法的检测结果一致,说明本实施例所建方法能够对大肠癌组织脱蜡切片中BRAF V600E野生型与突变型进行准确检测。
实施例3 基于大肠癌野生型与突变型建立的检测HE染色切片中BRAF V600E突变的近红外光谱方法
1.样品的收集
收集并记录来自不同患者的大肠癌组织HE染色切片共104片,其中包括52片BRAFV600E野生型和52片BRAF V600E突变型。
2.光谱的测量
同实施例1。
3.光谱特征变量的提取与建模
(1)光谱预处理方案的选择
为了使所建模型具有优良的预测性能,对包括NP、MSC、SNV、FD、SD、SGS、NDS的多种光谱预处理技术进行了筛选与组合,见表3中的模型1-10。结果表明,所得光谱不经预处理时,所建模型的预测性能最优,如表3中的模型1。
(2)建模光谱范围的选择
由于本实施例与实施例1均是基于BRAF V600E野生型与突变型的特征信息即缬氨酸与谷氨酸的结构差异来检测BRAF V600E突变,所以本实施例优选的建模光谱范围与实施例1相同,为9000~6800cm-1和6500~4000cm-1,如图1所示。
(3)光谱数据的降维与主成分的选择
对所选建模光谱范围内的光谱数据进行PCA降维,当使用不同的主成分建模时,模型的性能存在明显差异,如表3中的模型1、11和12,最终按照方差贡献率由高到低的顺序以及累积方差贡献率大于85%选取前5个主成分作为建模特征变量。
(4)模型的建立与验证
采用CP-ANN方法建立HE染色切片中BRAF V600E突变的预测模型。从10×10、12×12和15×15三种结构中筛选最优CP-ANN模型结构,见表3中模型1、14和15。结果发现,CP-ANN模型的结构为12×12时,模型性能优于10×10,几乎与15×15相当,所以优选CP-ANN模型结构为12×12。
从52片BRAF V600E野生型和52片BRAF V600E突变型大肠癌组织HE染色切片中随机选取12片BRAF V600E野生型和12片BRAF V600E突变型作为验证集切片,其余为校正集切片。使用校正集与验证集光谱数据的主成分得分建立与验证检测HE染色切片中BRAF V600E野生型与突变型的CP-ANN模型。结果显示,所建最优CP-ANN模型(表3模型1)的临床诊断性能即灵敏度为100.0%、特异度为80.0%、准确度为90.0%,模型性能即校正集正判率为93.0%、交叉验证正判率为84.0%、验证集正判率为86.1%,说明该模型具有优良的检测性能,能够准确检测HE染色切片中BRAF V600E野生型与突变型。最优CP-ANN模型的分布图如图5所示。
表3 检测HE染色切片中BRAF V600E突变的CP-ANN模型的主要建模参数与模型性能
4.未知样品的预测
取1片未知BRAF V600E突变与否的大肠癌组织HE染色切片,按照前述方法采集光谱并进行光谱数据处理,然后应用所建CP-ANN模型进行BRAF V600E野生型与突变型预测。结果该大肠癌组织HE染色切片预测为BRAF V600E突变型,与荧光PCR方法的检测结果一致,说明本实施例所建方法能够对大肠癌组织HE染色切片中BRAF V600E野生型与突变型进行准确检测。
实施例4 基于大肠癌野生型与突变型建立的检测脱蜡切片和石蜡切片中BRAFV600E突变的近红外光谱方法
1.样品的收集
收集并记录来自不同患者的大肠癌组织切片共104片。其中,52片BRAF V600E野生型组织切片包括26片脱蜡切片和26片石蜡切片,52片BRAF V600E突变型组织切片包括26片脱蜡切片和26片石蜡切片。
2.光谱的测量
同实施例1。
3.光谱特征变量的提取与建模
(1)光谱预处理方案的选择
由实施例1和2可知,石蜡切片和脱蜡切片的最优光谱预处理方案均为不经预处理,所以本实施例的光谱预处理方案优选为不经预处理。
(2)建模光谱范围的选择
由于本实施例与实施例1均是基于BRAF V600E野生型与突变型的特征信息即缬氨酸与谷氨酸的结构差异来检测BRAF V600E突变,所以本实施例优选的建模光谱范围与实施例1相同,为9000~6800cm-1和6500~4000cm-1。
(3)光谱数据的降维与主成分的选择
对所选建模光谱范围内的光谱数据进行PCA降维,按照方差贡献率由高到低的顺序以及累积方差贡献率大于85%选取前5个主成分作为建模特征变量。
(4)模型的建立与验证
采用CP-ANN方法建立脱蜡切片和石蜡切片中BRAF V600E突变的预测模型。由实施例1和2可知,石蜡切片和脱蜡切片的最优CP-ANN模型结构均为12×12,所以本实施例优选CP-ANN模型结构为12×12。
从52片BRAF V600E野生型和52片BRAF V600E突变型大肠癌组织切片中随机选取12片BRAF V600E野生型(6片脱蜡切片和6片石蜡切片)和12片BRAF V600E突变型(6片脱蜡切片和6片石蜡切片)作为验证集切片,其余为校正集切片。使用校正集与验证集光谱数据的主成分得分建立与验证检测脱蜡切片和石蜡切片中BRAF V600E野生型与突变型的CP-ANN模型。结果显示,所建CP-ANN模型的临床诊断性能即灵敏度为100.0%、特异度为90.0%、准确度为95.0%,模型性能即校正集正判率为96.0%、交叉验证正判率为94.0%、验证集正判率为95.8%,说明该模型具有优良的检测性能,能够准确检测脱蜡切片和石蜡切片中BRAF V600E野生型与突变型。
4.未知样品的预测
分别取未知BRAF V600E突变与否的大肠癌组织石蜡切片1片和大肠癌组织脱蜡切片1片,按照前述方法采集光谱并进行光谱数据处理,然后应用所建CP-ANN模型进行BRAFV600E野生型与突变型预测。结果该大肠癌组织石蜡切片和大肠癌组织脱蜡切片均预测为BRAF V600E突变型,与各自荧光PCR方法的检测结果一致,说明本实施例所建方法能够对大肠癌组织石蜡切片和脱蜡切片中BRAF V600E野生型与突变型进行准确检测。
实施例5 基于大肠癌野生型与突变型建立的检测脱蜡切片和HE染色切片中BRAFV600E突变的近红外光谱方法
1.样品的收集
收集并记录来自不同患者的大肠癌组织切片共104片。其中,52片BRAF V600E野生型组织切片包括26片脱蜡切片和26片HE染色切片,52片BRAF V600E突变型组织切片包括26片脱蜡切片和26片HE染色切片。
2.光谱的测量
同实施例1。
3.光谱特征变量的提取与建模
(1)光谱预处理方案的选择
由实施例2和3可知,脱蜡切片和HE染色切片的最优光谱预处理方案均为不经预处理,所以本实施例的光谱预处理方案优选为不经预处理。
(2)建模光谱范围的选择
由于本实施例与实施例1均是基于BRAF V600E野生型与突变型的特征信息即缬氨酸与谷氨酸的结构差异来检测BRAF V600E突变,所以本实施例优选的建模光谱范围与实施例1相同,为9000~6800cm-1和6500~4000cm-1,如图1所示。
(3)光谱数据的降维与主成分的选择
对所选建模光谱范围内的光谱数据进行PCA降维,按照方差贡献率由高到低的顺序以及累积方差贡献率大于85%选取前7个主成分作为建模特征变量。
(4)模型的建立与验证
采用CP-ANN方法建立脱蜡切片和HE染色切片中BRAF V600E突变的预测模型。由实施例2和3可知,脱蜡切片和HE染色切片的最优CP-ANN模型结构均为12×12,所以本实施例优选CP-ANN模型结构为12×12。
从52片BRAF V600E野生型和52片BRAF V600E突变型大肠癌组织切片中随机选取12片BRAF V600E野生型(6片脱蜡切片和6片HE染色切片)和12片BRAF V600E突变型(6片脱蜡切片和6片HE染色切片)作为验证集切片,其余为校正集切片。使用校正集与验证集光谱数据的主成分得分建立与验证检测脱蜡切片和HE染色切片中BRAF V600E野生型与突变型的CP-ANN模型。结果显示,所建CP-ANN模型的临床诊断性能即灵敏度为100.0%、特异度为85.0%、准确度为92.5%,模型性能即校正集正判率为96.0%、交叉验证正判率为95.0%、验证集正判率为84.7%,说明该模型具有优良的检测性能,能够准确检测脱蜡切片和HE染色切片中BRAF V600E野生型与突变型。
4.未知样品的预测
分别取未知BRAF V600E突变与否的大肠癌组织HE染色切片1片和大肠癌组织脱蜡切片1片,按照前述方法采集光谱并进行光谱数据处理,然后应用所建CP-ANN模型进行BRAFV600E野生型与突变型预测。结果该大肠癌组织HE染色切片和大肠癌组织脱蜡切片均预测为BRAF V600E突变型,与各自荧光PCR方法的检测结果一致,说明本实施例所建方法能够对大肠癌组织HE染色切片和脱蜡切片中BRAF V600E野生型与突变型进行准确检测。
实施例1-5建立的最优CP-ANN模型的性能比较见表4。
表4 样品类型与相应CP-ANN模型的性能
由表4可以看出:
(1)实施例1-5建立的检测石蜡切片、脱蜡切片、HE染色切片中BRAF V600E突变的5个CP-ANN模型都能够灵敏、准确地预测大肠癌BRAF V600E野生型与突变型,5个模型的灵敏度都达到100.0%,说明本发明所建方法可用于癌组织不同类型切片中BRAF V600E突变的临床辅助诊断,同时也证明了癌组织中BRAF V600E野生型与突变型之间的差异可以通过近红外光谱进行表征。
(2)实施例4的校正集样品包括40个BRAF V600E突变型样品(20个脱蜡切片和20个石蜡切片)与40个BRAF V600E野生型样品(20个脱蜡切片和20个石蜡切片),这些样品之间存在两种类型的差异:第一种差异是BRAF V600E野生型与突变型的差异即缬氨酸与谷氨酸的结构差异,第二种差异是脱蜡切片与石蜡切片的差异即有无石蜡的差异。但实施例4所建模型相比实施例1所建模型具有更好的临床诊断性能,证明其是基于BRAF V600E野生型与突变型的差异来检测BRAF V600E突变,而不是基于脱蜡切片与石蜡切片的差异来检测BRAFV600E突变。
同理,实施例5的校正集样品之间也存在两种类型的差异:第一种差异是BRAFV600E野生型与突变型的差异即缬氨酸与谷氨酸的结构差异,第二种差异是脱蜡切片与HE染色切片的差异即有无HE染色的差异,但实施例5所建模型相比实施例3所建模型具有更好的临床诊断性能,也证明了其是基于BRAF V600E野生型与突变型的差异而不是基于有无HE染色的差异来检测BRAF V600E突变。
(3)实施例2所建模型具有最佳的临床诊断性能,原因可能在于脱蜡切片的近红外光谱中没有来自石蜡或HE染色剂的干扰。实施例3所建模型具有最差的临床诊断性能,原因可能在于HE染色剂对样品近红外光谱吸收的干扰强于石蜡。但综合来看,实施例1使用的石蜡切片最适合于BRAF V600E突变的近红外临床辅助诊断,原因如下:①石蜡切片是病理组织的基本储存形式,直接以石蜡切片作为检测样品,则无需进行脱蜡、HE染色等繁琐、耗时的样品前处理就可以快速、无损地进行临床辅助诊断,检测后的石蜡切片可继续供其它临床检测使用。②使用石蜡切片建立的CP-ANN模型具有良好的临床诊断性能:灵敏度为100.0%、特异性为87.5%、准确度为93.8%;同时,具有最佳的模型性能:校正集正判率为98.0%、交叉验证正判率95.0%、验证集正判率94.4%。
实施例6 基于大肠癌野生型与甲状腺癌突变型建立的检测石蜡切片中BRAFV600E突变的近红外光谱方法
1.样品的收集
收集并记录来自不同患者的大肠癌BRAF V600E野生型石蜡切片8片和甲状腺癌BRAF V600E突变型石蜡切片8片。
2.光谱的测量
同实施例1。
3.光谱特征变量的提取与建模
(1)光谱预处理方案的选择
为了使所建模型具有优良的预测性能,对包括NP、MSC、SNV、FD、SD、SGS、NDS的多种光谱预处理技术进行了筛选与组合。结果表明,所得光谱不经预处理时,所建模型的预测性能最优。
(2)建模光谱范围的选择
由于本实施例与实施例1均是基于BRAF V600E野生型与突变型的特征信息即缬氨酸与谷氨酸的结构差异来检测BRAF V600E突变,所以本实施例优选的建模光谱范围与实施例1相同,为9000~6800cm-1和6500~4000cm-1。
(3)光谱数据的降维与主成分的选择
对所选建模光谱范围内的光谱数据进行PCA降维,按照方差贡献率由高到低的顺序以及累积方差贡献率大于85%选取前4个主成分作为建模特征变量。
(4)模型的建立与验证
采用CP-ANN方法建立石蜡切片中BRAF V600E突变的预测模型。从10×10、12×12和15×15三种结构中筛选最优CP-ANN模型结构。结果发现,CP-ANN模型的结构为12×12时,模型性能优于10×10,与15×15基本相当,所以本实施例优选CP-ANN模型结构为12×12。
从8片BRAF V600E野生型大肠癌组织石蜡切片和8片BRAF V600E突变型甲状腺癌组织石蜡切片中分别取2片BRAF V600E野生型和2片BRAF V600E突变型作为验证集切片,其余为校正集切片。使用校正集与验证集光谱数据的主成分得分建立与验证检测石蜡切片中BRAF V600E野生型与突变型的CP-ANN模型。结果显示,所建最优CP-ANN模型的临床诊断性能即灵敏度为100.0%、特异度为100.0%、准确度为100.0%,模型性能即校正集正判率为100.0%、交叉验证正判率为97.0%、验证集正判率为91.7%,说明该模型具有优良的检测性能,能够准确检测不同癌组织中BRAF V600E野生型与突变型。最优CP-ANN模型的分布图如图6所示。
4.未知样品的预测
分别取未知BRAF V600E突变与否的甲状腺癌组织石蜡切片1片和大肠癌组织石蜡切片2片,按照前述方法采集光谱并进行光谱数据处理,然后应用所建CP-ANN模型进行BRAFV600E野生型与突变型预测。结果该甲状腺癌组织切片预测为BRAF V600E突变型,2片大肠癌组织切片中1片预测为BRAF V600E突变型,另1片预测为BRAF V600E野生型,与各自的荧光PCR方法检测结果一致,说明本实施例所建方法能够对大肠癌和甲状腺癌组织中BRAFV600E野生型与突变型进行准确检测。
实施例7 基于大肠癌野生型与大肠癌、甲状腺癌突变型建立的检测石蜡切片中BRAF V600E突变的近红外光谱方法
1.样品的收集
收集并记录来自不同患者的大肠癌BRAF V600E野生型石蜡切片8片、大肠癌BRAFV600E突变型石蜡切片4片和甲状腺癌BRAF V600E突变型石蜡切片4片。
2.光谱的测量
同实施例1。
3.光谱特征变量的提取与建模
(1)光谱预处理方案的选择
为了使所建模型具有优良的预测性能,对包括NP、MSC、SNV、FD、SD、SGS、NDS的多种光谱预处理技术进行了筛选与组合。结果表明,所得光谱不经预处理时,所建模型的预测性能最优。
(2)建模光谱范围的选择
由于本实施例与实施例1均是基于BRAF V600E野生型与突变型的特征信息即缬氨酸与谷氨酸的结构差异来检测BRAF V600E突变,所以本实施例优选的建模光谱范围与实施例1相同,为9000~6800cm-1和6500~4000cm-1,如图1所示。
(3)光谱数据的降维与主成分的选择
对所选建模光谱范围内的光谱数据进行PCA降维,按照方差贡献率由高到低的顺序以及累积方差贡献率大于85%选取前4个主成分作为建模特征变量。
(4)模型的建立与验证
采用CP-ANN方法建立石蜡切片中BRAF V600E突变的预测模型。从10×10、12×12和15×15三种结构中筛选最优CP-ANN模型结构。结果发现,CP-ANN模型的结构为12×12时,模型性能优于10×10,与15×15基本相当,所以本实施例优选CP-ANN模型结构为12×12。
从8片BRAF V600E野生型石蜡切片(大肠癌)和8片BRAF V600E突变型石蜡切片(大肠癌和甲状腺癌各4片)中分别取2片BRAF V600E野生型和2片BRAF V600E突变型(大肠癌和甲状腺癌各1片)作为验证集切片,其余为校正集切片。使用校正集与验证集光谱数据的主成分得分建立与验证检测石蜡切片中BRAF V600E野生型与突变型的CP-ANN模型。结果显示,所建最优CP-ANN模型的临床诊断性能即灵敏度为100.0%、特异度为100.0%、准确度为100.0%,模型性能即校正集正判率为100.0%、交叉验证正判率为94.0%、验证集正判率为91.7%,说明该模型具有优良的检测性能,能够准确检测不同癌组织中BRAF V600E野生型与突变型。最优CP-ANN模型的分布图如图7所示。
4.未知样品的预测
分别取未知BRAF V600E突变与否的甲状腺癌组织石蜡切片1片和大肠癌组织石蜡切片2片,按照前述方法采集光谱并进行光谱数据处理,然后应用所建CP-ANN模型进行BRAFV600E野生型与突变型预测。结果该甲状腺癌组织预测为BRAF V600E突变型,2片大肠癌组织中1片预测为BRAF V600E突变型,另1片预测为BRAF V600E野生型,均与各自的荧光PCR方法检测结果一致,说明本实施例所建方法能够对不同部位的癌组织中BRAF V600E野生型与突变型进行准确检测。
实施例1、6和7均是检测石蜡切片中BRAF V600E突变的近红外光谱方法,只是建模样品的癌症部位或/和基因型不同,其各自建立的最优CP-ANN模型的性能比较见表5。
表5 癌症类型与相应CP-ANN模型的性能
由表5可以看出:
实施例6使用大肠癌BRAF V600E野生型石蜡切片与甲状腺癌BRAF V600E突变型石蜡切片进行建模,所建CP-ANN模型的临床诊断性能与模型性能均好。实施例6使用的建模样品包含了两种类型的差异,即①BRAF V600E野生型与突变型之间的差异,②大肠癌与甲状腺癌之间的差异。实施例6的实验结果显示其所建CP-ANN模型不仅能够准确预测用于建模的大肠癌BRAF V600E野生型石蜡切片和甲状腺癌BRAF V600E突变型石蜡切片,还能够准确预测未用于建模的大肠癌BRAF V600E突变型石蜡切片。从而再次证明了本发明方法是基于BRAF V600E野生型与突变型之间的差异进行的检测,因为如果其是基于大肠癌与甲状腺癌之间的差异进行的检测,则大肠癌BRAF V600E突变型石蜡切片便会被预测为大肠癌的野生型,但事实并非如此,大肠癌BRAF V600E突变型石蜡切片被准确预测为突变型。
实施例7使用大肠癌BRAF V600E野生型石蜡切片与大肠癌BRAF V600E突变型、甲状腺癌BRAF V600E突变型石蜡切片进行建模,所建CP-ANN模型的临床诊断性能与模型性能均较好,说明本发明方法能够对不同部位癌组织进行准确检测。
综上所述,本发明方法是基于癌组织中BRAF V600E野生型与突变型之间的差异进行的检测,能够对不同部位癌组织BRAF V600E野生型与突变型进行准确检测,不受疾病部位的干扰,适用于可能发生BRAF V600E突变的多种癌组织切片的辅助诊断。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管通过参照本发明的优选实施例已经对本发明进行了描述,但本领域技术人员应当理解,可以在形式上和细节上对其作出各种各样的改变,而不偏离所附权利要求书所限定的本发明的保护范围。
Claims (8)
1.一种检测BRAF V600E突变的近红外光谱方法,其特征在于,包括以下步骤:
(1)收集并记录BRAF V600E野生型与突变型的癌组织切片;
(2)测量步骤(1)所得每片切片的近红外光谱;
(3)对步骤(2)所得光谱,采用化学计量学方法进行光谱数据处理,采用模式识别分析方法建立BRAF V600E野生型与突变型的预测模型;
(4)取未知BRAF V600E突变与否的癌组织切片,按照步骤(2)所述方法测量近红外光谱,按照步骤(3)所述方法进行光谱数据处理,然后应用步骤(3)所建模型预测该癌组织切片是否发生BRAF V600E突变。
2.根据权利要求1所述的一种检测BRAF V600E突变的近红外光谱方法,其特征在于,包括以下步骤:
(1)收集并记录BRAF V600E野生型与突变型的癌组织切片;
(2)设置透反射光谱测量参数:分辨率8cm-1、扫描次数不低于64次、扫描范围12000~4000cm-1,测量步骤(1)所得每片切片的近红外透反射光谱,每次扫描切片前以相同参数扫描并扣除背景;
(3)对步骤(2)所得光谱,不经或经化学计量学预处理,选择建模光谱范围,采用主成分分析法即PCA降维,根据模型性能选取1个或多个主成分作为建模特征变量,采用非线性模式识别分析方法建立BRAF V600E野生型与突变型的预测模型;
(4)取未知BRAF V600E突变与否的癌组织切片,按照步骤(2)所述方法测量近红外光谱,按照步骤(3)所述方法进行光谱数据处理,然后应用步骤(3)所建模型预测该癌组织切片是否发生BRAF V600E突变。
3.根据权利要求2所述的一种检测BRAF V600E突变的近红外光谱方法,其特征在于,包括以下步骤:
(1)收集并记录BRAF V600E野生型与突变型的癌组织切片;
(2)设置透反射光谱测量参数:分辨率8cm-1、扫描次数不低于64次、扫描范围12000~4000cm-1,测量步骤(1)所得每片切片的近红外透反射光谱,每次扫描切片前以相同参数扫描并扣除背景;
(3)对步骤(2)所得光谱,不经预处理,选择建模光谱范围为9000~6800cm-1和6500~4000cm-1,采用PCA降维,按照方差贡献率由高到低的顺序以及累积方差贡献率大于85%选取前4~8个主成分作为建模特征变量,采用对向传播人工神经网络即CP-ANN方法建立BRAFV600E野生型与突变型的预测模型;
(4)取未知BRAF V600E突变与否的癌组织切片,按照步骤(2)所述方法测量近红外光谱,按照步骤(3)所述方法进行光谱数据处理,然后应用步骤(3)所建模型预测该癌组织切片是否发生BRAF V600E突变。
4.根据权利要求1至3所述的一种检测BRAF V600E突变的近红外光谱方法,其特征在于:步骤(1)和步骤(4)中所述癌组织为大肠癌组织或/和甲状腺癌组织。
5.根据权利要求1至3所述的一种检测BRAF V600E突变的近红外光谱方法,其特征在于:步骤(1)中所述切片为石蜡切片、脱蜡切片或/和苏木素-伊红即HE染色切片。
6.根据权利要求1至3所述的一种检测BRAF V600E突变的近红外光谱方法,其特征在于:步骤(2)中是在每片切片的3个不同位置各测量一张光谱,每张光谱均用于建模。
7.根据权利要求1至3所述的一种检测BRAF V600E突变的近红外光谱方法,其特征在于:步骤(2)中测量切片的光谱时,是取BRAF V600E野生型与突变型的癌组织切片交替测量。
8.根据权利要求1至3所述的一种检测BRAF V600E突变的近红外光谱方法,其特征在于:步骤(3)中所述模型检测性能的评价参数包括临床诊断性能和模型性能,所述临床诊断性能包括灵敏度、特异度和准确度,所述模型性能包括校正集正判率、交叉验证正判率和验证集正判率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910332553.XA CN110763652B (zh) | 2019-04-12 | 2019-04-12 | 一种检测braf v600e突变的近红外光谱方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910332553.XA CN110763652B (zh) | 2019-04-12 | 2019-04-12 | 一种检测braf v600e突变的近红外光谱方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110763652A true CN110763652A (zh) | 2020-02-07 |
CN110763652B CN110763652B (zh) | 2022-11-04 |
Family
ID=69328705
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910332553.XA Expired - Fee Related CN110763652B (zh) | 2019-04-12 | 2019-04-12 | 一种检测braf v600e突变的近红外光谱方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110763652B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109490239A (zh) * | 2018-12-27 | 2019-03-19 | 重庆医科大学 | 一种载玻片制样专用红外透反射光谱测量附件 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108732121A (zh) * | 2018-08-01 | 2018-11-02 | 重庆医科大学 | 一种基于红外光谱鉴别良性与恶性肿瘤的方法 |
CN109580527A (zh) * | 2019-01-18 | 2019-04-05 | 重庆医科大学 | 一种基于组织切片鉴别abo血型的红外光谱分析方法 |
-
2019
- 2019-04-12 CN CN201910332553.XA patent/CN110763652B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108732121A (zh) * | 2018-08-01 | 2018-11-02 | 重庆医科大学 | 一种基于红外光谱鉴别良性与恶性肿瘤的方法 |
CN109580527A (zh) * | 2019-01-18 | 2019-04-05 | 重庆医科大学 | 一种基于组织切片鉴别abo血型的红外光谱分析方法 |
Non-Patent Citations (2)
Title |
---|
HUI CHEN ET AL: "Diagnosis of colorectal cancer by near-infrared optical fiber spectroscopy and random forest", 《SPECTROCHIMIA ACTA PART A:MOLECULAR AND BIOMOLECULAR SPECTROSCOPY 》 * |
丁金旺 等: "基于ARMS法检测BRAF V600E突变在甲状腺乳头状癌中的临床价值", 《中国耳鼻咽喉头颈外科》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109490239A (zh) * | 2018-12-27 | 2019-03-19 | 重庆医科大学 | 一种载玻片制样专用红外透反射光谱测量附件 |
CN109490239B (zh) * | 2018-12-27 | 2024-02-02 | 重庆医科大学 | 一种载玻片制样专用红外透反射光谱测量附件 |
Also Published As
Publication number | Publication date |
---|---|
CN110763652B (zh) | 2022-11-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10379056B2 (en) | Diagnosis of cancer | |
Nallala et al. | Infrared spectral histopathology for cancer diagnosis: a novel approach for automated pattern recognition of colon adenocarcinoma | |
CN108732121B (zh) | 一种基于红外光谱鉴别良性与恶性肿瘤的方法 | |
CN109085136B (zh) | 近红外漫反射光谱测定水泥生料氧化物成分含量的方法 | |
KR20070068401A (ko) | 암의 예후에 대한 마커 후보의 분석 및 최적화를 위한 방법및 컴퓨터 프로그램 제품 | |
CN109115692B (zh) | 一种光谱数据分析方法及装置 | |
JP2021511108A (ja) | がん検出を目的としたリアルタイムラマン分光法のためのシステムおよび方法 | |
Wald et al. | Infrared imaging of primary melanomas reveals hints of regional and distant metastases | |
KR101400649B1 (ko) | 가시광선 및 근적외선을 이용한 투과식 혈란 검출 방법 | |
Chen et al. | Near-infrared spectroscopy as a diagnostic tool for distinguishing between normal and malignant colorectal tissues | |
Happillon et al. | Diagnosis approach of chronic lymphocytic leukemia on unstained blood smears using Raman microspectroscopy and supervised classification | |
CN110749565A (zh) | 一种快速鉴别普洱茶存储年份的方法 | |
CN111537469A (zh) | 一种基于近红外技术的苹果品质快速无损检测方法 | |
JP2013533960A (ja) | がんの診断 | |
CN110763652B (zh) | 一种检测braf v600e突变的近红外光谱方法 | |
CN109100315B (zh) | 一种基于噪信比的波长选择方法 | |
Lin et al. | Identification of pulmonary edema in forensic autopsy cases of fatal anaphylactic shock using Fourier transform infrared microspectroscopy | |
CN110987858A (zh) | 一种利用神经网络数据模型进行油品快速检测的方法 | |
Kitahashi et al. | Development of robust models for rapid classification of microplastic polymer types based on near infrared hyperspectral images | |
KR20160055008A (ko) | 생체 시료의 분석 시스템 및 이를 이용한 분석 방법 | |
Kujdowicz et al. | Evaluation of grade and invasiveness of bladder urothelial carcinoma using infrared imaging and machine learning | |
Lewis et al. | Developing Raman spectroscopy as a diagnostic tool for label‐free antigen detection | |
JP2017523423A (ja) | 線維化を検出及び定量化する方法 | |
WO2021092489A2 (en) | Label-free spectral pathology for in vivo diagnosis | |
Brunner et al. | Visible-and near-infrared hyperspectral imaging for the quantitative analysis of PD-L1+ cells in human lymphomas: Comparison with fluorescent multiplex immunohistochemistry |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20221104 |
|
CF01 | Termination of patent right due to non-payment of annual fee |