CN110724743B - 人血液中结直肠癌诊断相关的甲基化生物标记物及其应用 - Google Patents
人血液中结直肠癌诊断相关的甲基化生物标记物及其应用 Download PDFInfo
- Publication number
- CN110724743B CN110724743B CN201911119701.6A CN201911119701A CN110724743B CN 110724743 B CN110724743 B CN 110724743B CN 201911119701 A CN201911119701 A CN 201911119701A CN 110724743 B CN110724743 B CN 110724743B
- Authority
- CN
- China
- Prior art keywords
- colorectal cancer
- early
- stage
- methylation
- methylated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 206010009944 Colon cancer Diseases 0.000 title claims abstract description 75
- 208000001333 Colorectal Neoplasms Diseases 0.000 title claims abstract description 75
- 239000000090 biomarker Substances 0.000 title claims abstract description 33
- 239000008280 blood Substances 0.000 title claims abstract description 14
- 210000004369 blood Anatomy 0.000 title claims abstract description 14
- 238000003745 diagnosis Methods 0.000 title claims abstract description 10
- 238000000034 method Methods 0.000 claims description 23
- 230000011987 methylation Effects 0.000 claims description 14
- 238000007069 methylation reaction Methods 0.000 claims description 14
- 238000012360 testing method Methods 0.000 claims description 13
- 238000012163 sequencing technique Methods 0.000 claims description 10
- 239000003153 chemical reaction reagent Substances 0.000 claims description 5
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 238000011529 RT qPCR Methods 0.000 claims description 2
- 238000001369 bisulfite sequencing Methods 0.000 claims description 2
- 238000007847 digital PCR Methods 0.000 claims description 2
- 238000004128 high performance liquid chromatography Methods 0.000 claims description 2
- 238000012164 methylation sequencing Methods 0.000 claims description 2
- 238000007855 methylation-specific PCR Methods 0.000 claims description 2
- 238000012175 pyrosequencing Methods 0.000 claims description 2
- 238000007671 third-generation sequencing Methods 0.000 claims description 2
- 238000003556 assay Methods 0.000 claims 1
- 238000003149 assay kit Methods 0.000 claims 1
- 238000004519 manufacturing process Methods 0.000 claims 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 claims 1
- 238000001514 detection method Methods 0.000 abstract description 29
- 238000012216 screening Methods 0.000 abstract description 9
- 238000013399 early diagnosis Methods 0.000 abstract description 2
- 230000035945 sensitivity Effects 0.000 description 22
- 108020004414 DNA Proteins 0.000 description 13
- 238000004458 analytical method Methods 0.000 description 13
- 239000000523 sample Substances 0.000 description 11
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 6
- 239000003550 marker Substances 0.000 description 6
- 238000007637 random forest analysis Methods 0.000 description 6
- 206010028980 Neoplasm Diseases 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000002159 abnormal effect Effects 0.000 description 4
- 201000011510 cancer Diseases 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 230000005856 abnormality Effects 0.000 description 3
- 238000002052 colonoscopy Methods 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 3
- 210000004921 distal colon Anatomy 0.000 description 3
- 230000002550 fecal effect Effects 0.000 description 3
- 230000003902 lesion Effects 0.000 description 3
- 239000002679 microRNA Substances 0.000 description 3
- 238000007481 next generation sequencing Methods 0.000 description 3
- 108090000623 proteins and genes Proteins 0.000 description 3
- 238000002579 sigmoidoscopy Methods 0.000 description 3
- 108091029430 CpG site Proteins 0.000 description 2
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 2
- CTQNGGLPUBDAKN-UHFFFAOYSA-N O-Xylene Chemical compound CC1=CC=CC=C1C CTQNGGLPUBDAKN-UHFFFAOYSA-N 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 210000003608 fece Anatomy 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000011528 liquid biopsy Methods 0.000 description 2
- 108091070501 miRNA Proteins 0.000 description 2
- 150000007523 nucleic acids Chemical group 0.000 description 2
- 239000002773 nucleotide Substances 0.000 description 2
- 125000003729 nucleotide group Chemical group 0.000 description 2
- 238000004393 prognosis Methods 0.000 description 2
- 238000011896 sensitive detection Methods 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 238000007399 DNA isolation Methods 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 206010018910 Haemolysis Diseases 0.000 description 1
- 108700011259 MicroRNAs Proteins 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 238000009004 PCR Kit Methods 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 230000001594 aberrant effect Effects 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000003766 bioinformatics method Methods 0.000 description 1
- 238000009534 blood test Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000003749 cleanliness Effects 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 230000000378 dietary effect Effects 0.000 description 1
- 230000008995 epigenetic change Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 210000001035 gastrointestinal tract Anatomy 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000008588 hemolysis Effects 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 230000006607 hypermethylation Effects 0.000 description 1
- 230000000968 intestinal effect Effects 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012950 reanalysis Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 238000002791 soaking Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/154—Methylation markers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Engineering & Computer Science (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Analytical Chemistry (AREA)
- Zoology (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Physics & Mathematics (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Hospice & Palliative Care (AREA)
- Biophysics (AREA)
- Oncology (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明公开了与结直肠癌相关的甲基化生物标记物及其应用,所述与结直肠癌相关的甲基化生物标记物是cg21644830、cg11407741、cg12619536、cg04156369、cg15248577、cg16903605、cg00397851、cg01922936、cg17849956、cg15717808、cg18323466、cg15177071、cg19918758、cg26337020、cg01333350、cg07344025、cg03786924、cg04380513、和cg12665504的组合。本发明所筛选的19种生物标记物的组合与血液中与结直肠癌诊断高端相关,特别是所选择的生物标记物的组合,对于早期的结直肠癌样本的针对性很强,利用这些生物标记物以及相应的检测技术开展结直肠癌的无创早筛早诊意义重大。
Description
技术领域
本发明属于生物技术领域,具体涉及人血液中结直肠癌诊断相关的甲基化生物标记物及其应用。
背景技术
结直肠癌是常见的恶性肿瘤,占全部恶性肿瘤的10%,其在恶性肿瘤中居第3位,严重威胁着人类的健康。在我国,随着人们生活水平的提高和饮食结构的改变,结直肠癌的发病率日渐增加,死亡率亦大幅增加,尤其在近十年,结直肠癌发病率的增加每年>4%,远超2%的国际水平。机制研究表明,结直肠癌主要是由基因突变和表观遗传学改变的逐渐积累和共同作用引起,这是一个发展较为缓慢的过程。在结直肠癌筛查方法中,仅有粪便隐血试验(fecal occult blood test,FOBT)和乙状结肠镜检查具有高级别的循证医学证据。FOBT是目前应用最为广泛的筛查方法,具有无创、价廉的优点,筛查敏感性30%~80%。研究显示,对参加至少一次筛查的人群而言,FOBT可以降低25%的死亡风险。乙状结肠镜主要观察远侧结肠的病变情况,达到60%~70%结肠镜的检查敏感性。乙状结肠镜筛查的理论基础在于多数结肠病变位于镜身所及的远端结肠,同时,部分伴有远端结肠病变的近侧肿瘤也可以在随后的结肠镜检查中得以诊断。乙状结肠镜的筛查效果受到肠道清洁程度、操作者经验、病变分布特点和筛检频率等因素的影响。此外,作为一种非侵入性的结直肠癌筛查方法,大便基因检测具有特异性高、敏感性强、无需行肠道准备、易于检查和接受等优点。目前的大便基因检测包括大便DNA检测(stool DNA testing,sDNA)及大便微小RNA检测(microRNA,miRNA)。
但是现有的结肠镜检查具有侵入性,对于结直肠癌患者来说大大降低了筛查的意愿。粪便基因检测目前主要依靠单一生物标记物或者少数几个生物标记物作为检测依据,存在检测准确率低,灵敏度低的缺点。
相对于血液样本而言,现有的检测技术依赖于粪便,而粪便样本普遍存在其他生物DNA污染问题,样本保存质量低,保存成本高,检测噪音高,并且样本易获得性及患者提供意愿较血液差。
液体活检(liquid biopsy,LB)作为精准医疗新技术,因其可定性定量检测肿瘤直接相关的肿瘤细胞和DNA,并具有非入侵性、取样便捷、实时监测等特点,逐步在肿瘤诊疗中发挥越来越重要的作用。
发明内容
基于此,本发明提供了用于诊断、预测人结直肠癌及其预后的差异化甲基化生物标记物。
实现上述目的技术方案如下。
人血液中与结直肠癌诊断相关的甲基化生物标记物,所述甲基化生物标记物是cg21644830、cg11407741、cg12619536、cg04156369、cg15248577、cg16903605、cg00397851、cg01922936、cg17849956、cg15717808、cg18323466、cg15177071、cg19918758、cg26337020、cg01333350、cg07344025、cg03786924、cg04380513、和cg12665504的组合。
在其中一些实施例中,所述甲基化生物标记物还包括以下中的至少一种:cg25602490、cg14590817、cg14652031、cg05376505、cg15385562、cg27116061、cg08592707、cg02408333、cg04342092、cg21583226、cg06952671、cg08327269、cg09942248、cg06287318、cg19019371、cg25262044、cg11092616、cg12926104、cg25184481、cg06779469、cg21621906、cg07927379、cg25832771、cg02362467、cg01419567、cg16673106、cg16057262、cg11416076、cg25213928、cg06918887、cg05937496、cg22329423、cg05155840、cg23434186、cg14101302、cg23232563、cg12080391、cg05095123、cg23198529、cg15547669、cg19239848、cg02270183、cg25918303、cg19752627、cg21995919、cg12243375、cg03410436、cg12652174、cg15386368、cg27405960、cg00868383、cg17014953、cg15356923、cg10218490、cg15847198、cg02899206、cg01966612、cg11425280、cg14202910、cg15179725、cg10273340、cg24899571、cg14834850、cg24140030、cg22090773、cg24924091、cg26226802、cg06728579、cg22388982、cg07900968、cg20354430、cg11086760、cg09670616、cg17880199、cg24867142、cg24176678、cg05094548、cg01151699、cg19219577、cg25567337、cg26522240、cg23198902、cg11428482、cg00414171、cg18603154、cg04836221、cg01216370、cg18138147、cg14163665、cg07326648、cg10212705。
在其中一些实施例,所述甲基化生物标记物是cg01922936,cg12652174,cg18323466,cg10218490,cg26337020,cg07344025,cg14652031,cg16057262,cg04380513,cg12665504,cg12619536,cg15717808,cg17849956,cg02362467,cg21644830,cg21583226,cg04156369,cg23232563,cg00397851,cg06779469,cg02408333,c g21995919,cg01333350,cg12080391,cg16903605,cg11407741,cg06952671,cg15248577,cg03786924,c g00868383,cg19752627,cg19918758,cg25832771,cg21621906,cg23434186,cg01419567的组合。
在其中一些实施例,包括以上110种的生物标记物。
在其中一些实施例,所述结直肠癌是早期结直肠癌(1-2期结直肠癌)。
本发明的另一个目的是提供所述的与人结直肠癌相关的甲基化生物标记物在制备人检测结直肠癌的试剂盒中的应用。
本发明的另一个目的是提供诊断、预测人结直肠癌的检测试剂盒。
所述诊断、预测结直肠癌的检测试剂盒,包括有检测上述的甲基化生物标记物的试剂。
本发明的发明人经过大量的实验,发现了人血液中与结直肠癌诊断相关的19种生物标记物的组合。特别地,所选择的生物标记物的组合,对于早期的结直肠癌样本的针对性非常强,这些生物标记物的选择对于早期结直肠癌的预测是非常好的。进一步,在19种生物标记物的基础上,构建更全面的血液中与结直肠癌诊断相关的110种生物标记物的检测平台,利用这些位点以及相应的检测技术开展结直肠癌的无创早筛早诊意义重大。
附图说明
图1是实施例2中110个位点在结直肠癌与正常组织样本的表达热图。
图2是实施例2中cg21995919位点的ROC曲线。
图3是实施例2中cg03786924位点的ROC曲线。
图4是实施例2中cg15248577位点的ROC曲线。
图5是实施例3中19个位点试集ROC曲线。
图6是实施例4中19个位点试集ROC曲线。
图7是实施例5中19个位点试集ROC曲线。
图8是实施例6中19个位点试集ROC曲线。
图9是实施例7中9个位点试集ROC曲线。
图10是实施例8中37个位点试集ROC曲线。
具体实施方式
为了便于理解本发明,下面将对本发明进行更全面的描述。本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明公开内容的理解更加透彻全面。
下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。实施例中所用到的各种常用化学试剂,均为市售产品。
除非另有定义,本发明所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不用于限制本发明。本发明所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。
本发明中,CpG位点表示二核苷酸对,碱基鸟嘌呤(G)紧随胞嘧啶(C)之后,CpG是胞嘧啶(C)-磷酸(p)-鸟嘌呤(G)的缩写。
本发明中,“标记物”是指能够用于指示受试者患有结直肠癌的情况。这些标记物可以是核酸序列、大分子、小分子等等,例如可以是一定长度的核酸序列,也可以是一个特定位点的核苷酸或者两个特定位点的核苷酸,其与受试者患有结直肠的情况。根据本发明的实施例,本发明提供的标记物指的是能够用于检测、预测或者诊断受试者是否患者结直肠的CpG位点。
本发明中,早期结直肠癌,主要是指1-2期结直肠癌。
本发明中,分析所述标记物的位点甲基化的情况,分析的方法可以包括:焦磷酸测序法、重亚硫酸盐转化测序法、甲基化芯片法、qPCR法、数字PCR法、二代测序法(nextgeneratio sequencing,NGS)、三代测序法、全基因组甲基化测序法、DNA富集检测法、简化亚硫酸氢盐测序技术、HPLC法、MassArray、甲基化特异PCR、或它们的组合。本发明的一个实施例中,基于二代测序法。
实施例1
本实施例公开了上述用于预测结直肠癌ctDNA差异性甲基化标记物(marker)的检测方法,具体包括以下步骤:
1.全血处理
1.1利用EDTAK2抗凝真空采血管(BD,Cat#367525)采集10mL全血,充分混匀,避免出现溶血,并在4-6小时内对全血进行血浆分离处理。
1.2全血于低速离心机进行4℃,1600g,15min离心处理,小心吸取上层血浆,避免吸取中间的白膜层,所得血浆再次于高速离心机进行4℃,16000g,10min离心处理,获得所需样品血浆。
2.组织样本处理
临床手术切除结直肠癌肠癌组织样本后,4采用%的中性福尔马林固定,经过梯度酒精脱水,二甲苯透明,浸蜡,包埋切片,最终形成结直肠癌组织FFPE样本。
3.血浆cfDNA和组织DNA的提取。
血浆cfDNA提取具体操作步骤按照Thermo Fisher公司的MagMAX TM Cell-FreeDNA Isolation Kit说明书进行,组织DNA提取具体操作步骤按照Qiagen公司的AllPreDNA/RNA FFPE Kit说明书进行。
4.将提取后的组织DNA进行打断,血浆cfDNA无需进行打断,具体操作如下:
4.1取组织DNA,用EB补足体积至130ul,转移至打断管中于Covaris M220按照以下程序进行打断:
4.2将打断完的组织DNA转移至1.5ml离心管中,用Nanodrop 2000测定打断后浓度。
5.将提取的血浆cfDNA或是打断后的组织DNA进行亚硫酸氢盐转化,使DNA中未发生甲基化的胞嘧啶脱氨基转变成尿嘧啶,而甲基化的胞嘧啶保持不变,得到亚硫酸氢盐转化后的DNA,转化具体操作按照Zymo Research的EZ DNA Methylation-Lightning Kit说明书进行。
6.对转化后的DNA进行建库,具体的操作步骤按照AnchorDx的AnchorDxEpiVisioTM Methylation Library Prep Kit(AnchorDx,Cat#A0UX00019)以及AnchorDxEpiVisioTM Indexing PCR Kit(AnchorDx,Cat#A2DX00025)说明书进行。得到测序预文库。
7.对测序预文库进行特定区域捕获,具体的操作步骤参考AnchorDx PanMet V2–Pan-cancer methylation panel(AnchorDx,Cat#A0UX00023)的说明进行,形成测序终文库。
8.采用Illumina公司的测序仪对测序终文库进行测序,得到测序结果。
9.数据的分析:
对测序仪的下机原始数据,进行常规的生物信息学分析处理,先通过fastp过滤低质量(QC低,长度短、太多N等)的读长(reads),然后去除reads双端的adapter、共有序列、PolyA/T,得到理想的插入片段序列(target区间),使用bismark将这些reads比对hg19对应的位置后,根据UMI对reads进行去重,得到每份样本被探针捕获得到的真实reads数据(bamfile),对bam文件进行统计和分析,得到甲基化数据,用于后续的数据再分析。
实施例2
本实施例公开了一种用于诊断结直肠癌的甲基化特异性生物标记物,利用113例肠镜无异常的正常人的组织样本以及195例结直肠癌病人的组织样本,利用实施例1所述方法进行组织样本甲基化水平分析。利用在不同组别的甲基化水平差异筛选出与结直肠癌相关的生物标记物,并对位点数据在正常与结直肠癌样本中进行聚类分析,结果请见图1。从图1可以看到,一共筛选出110个在正常与结直肠癌样本存在最显著异常甲基化的位点。图中,红色为位点高甲基化表达,蓝色为位点低甲基化表达。该110个甲基化生物标记物(以下简称位点或者marker)为:
cg25602490、cg14590817、cg15248577、cg14652031、cg05376505、cg15385562、cg27116061、cg08592707、cg02408333、cg04342092、cg21583226、cg06952671、cg08327269、cg09942248、cg06287318、cg19019371、cg25262044、cg11092616、cg12926104、cg25184481、cg06779469、cg21621906、cg07927379、cg25832771、cg02362467、cg21644830、cg07344025、cg16903605、cg26337020、cg01922936、cg01419567、cg19918758、cg16673106、cg16057262、cg12665504、cg04380513、cg11416076、cg17849956、cg00397851、cg04156369、cg25213928、cg06918887、cg11407741、cg05937496、cg15177071、cg22329423、cg05155840、cg23434186、cg18323466、cg14101302、cg23232563、cg12080391、cg05095123、cg23198529、cg15547669、cg19239848、cg02270183、cg25918303、cg19752627、cg21995919、cg12243375、cg12619536、cg03410436、cg12652174、cg15386368、cg27405960、cg15717808、cg00868383、cg17014953、cg15356923、cg03786924、cg10218490、cg15847198、cg02899206、cg01333350、cg01966612、cg11425280、cg14202910、cg15179725、cg10273340、cg24899571、cg14834850、cg24140030、cg22090773、cg24924091、cg26226802、cg06728579、cg22388982、cg07900968、cg20354430、cg11086760、cg09670616、cg17880199、cg24867142、cg24176678、cg05094548、cg01151699、cg19219577、cg25567337、cg26522240、cg23198902、cg11428482、cg00414171、cg18603154、cg04836221、cg01216370、cg18138147、cg14163665、cg07326648、cg10212705。
其中,这些甲基化生物标记物(marker)在以上的113例肠镜无异常的正常人的组织样本以及195例结直肠癌病人的组织样本中进行二分类判断,单独每个位点AUC可以高达0.981,如位点cg21995919。请见图2。其中,其他的位点的AUC也大部分在0.9以上,如cg03786924的AUC为0.96(请见图3),cg15248577的AUC为0.974(请见图4)。说明了利用该方法筛选出来的位点都与结直肠癌高度相关。
实施例3
利用其中19个位点的信息,对113例肠镜无异常的正常人以及195例结直肠癌病人组织样本进行检测,具体的实验以及下机数据处理与实施例1一致,利用随机森林模型进行建模分析,按照6:4的切分,进行20次重复,在98%的特异性下,测试集的1期的检测灵敏度为96.7%±0.036,2期的检测灵敏度为98%±0.037,3期的检测灵敏度为98.2%±0.029,4期的检测灵敏度为91.5%±0.068,对于可治疗的结直肠癌样本(1-3期),检测的整体灵敏度为97.5%±0.022,对于所有的结直肠癌样本,检测的整体灵敏度为95.2%±0.036。整体的AUC为0.99±0.007。表明了这些位点组合与结直肠癌的高度相关。结果请见图5。
所述19个生物标记物:cg21644830、cg11407741、cg12619536、cg04156369、cg15248577、cg16903605、cg00397851、cg01922936、cg17849956、cg15717808、cg18323466、cg15177071、cg19918758、cg26337020、cg01333350、cg07344025、cg03786924、cg04380513、和cg12665504。
实施例4
利用以上19个位点(与实施例3相同)的信息,对116例肠镜无异常的正常人以及85例1-2期结直肠癌病人组织样本进行检测,具体的实验步骤与下机数据处理与实施例1一致,利用随机森林模型进行建模分析,按照6:4的切分,进行20次重复,在98%的特异性下,测试集的1期的检测灵敏度为94.6%±0.051,2期的检测灵敏度为98.6%±0.031,对于预后效果较好的早期结直肠癌样本(1-2期),检测的整体灵敏度为96.6%±0.035。整体的AUC为0.99±0.007。表明了这些位点与早期的结直肠癌的高度相关。结果请参见图6。
本实施例与实施例3的主要区别在于,基于不同时期的肿瘤样本数据进行建模分析,模型学习的数据关系是不同的,从而对于测试集的样本预测模型也不尽相同。本实施例更加针对的是1-2期样本的数据特征,应该说对于早期的结直肠癌样本的针对性更强,但是也通过分析看到,通过两种不同的数据集学习得到的测试集预测,在早期的样本中,一样的特异性下,灵敏度相差无几,也证明了这些位点的选择以及对于早期结直肠癌的预测都是非常好的。
实施例5
利用以上的19个位点在血浆样本中进行测试,对222例肠镜无异常的正常人以及438例结直肠癌病人血浆样本进行检测,利用随机森林模型进行建模分析,按照6:4的切分,进行20次重复,在90%的特异性下,各分期的检测灵敏性为(I:68.7%±0.09,II:85.5%±0.042,III:88.9%±0.057,IV:95.5%±0.032,可治愈的I-III:81.1%±0.05,I-IV:84.1%±0.042),在95%的特异性下,各分期的检测灵敏性为(I:58.2%±0.115,II:81%±0.053,III:82.8%±0.067,IV:94.8%±0.032,可治愈的I-III:74.3%±0.065,I-IV:78.7%±0.053)整体的AUC为0.94±0.013。表明了这些位点的组合对于结直肠癌血浆样本的检测灵敏度也是相当不错的,非常有利于利用这些位点的组合进行无创、灵敏地检测出结直肠癌。结果请参见图7。
实施例6
利用以上19个位点在血浆样本中进行测试,对222例肠镜无异常的正常人以及191例早期(1-2期)结直肠癌病人血浆样本进行检测,利用随机森林模型进行建模分析,按照6:4的切分,进行20次重复,在90%的特异性下,对于所有的早期结直肠癌样本,各分期的检测灵敏性为(I:65.2%±0.103,II:84.6%±0.065,可治愈的I-II:76.1%±0.070),整体的AUC为0.92±0.02。表明了这些位点的一个子集对于结直肠癌早期血浆样本的检测灵敏度也是相当不错的,非常有利于利用这些位点的组合进行无创、灵敏地检测出早期结直肠癌。结果请参见图8。
实施例7
在以上19个位点中,随机选取9个位点(cg01922936,cg11407741,cg04156369,cg00397851,cg01333350,cg12619536,cg15717808,cg15248577,和cg16903605),组合一个组合。在血浆样本中进行测试,对222例肠镜无异常的正常人以及438例结直肠癌病人血浆样本进行检测,利用随机森林模型进行建模分析,按照6:4的切分,进行20次重复,在90%的特异性下,各分期的检测灵敏性为(I:54.7%±0.078,II:82.5%±0.05,III:83.1%±0.064,IV:95.1%±0.035,可治愈的I-III:74%±0.046,I-IV:78.4%±0.037),在95%的特异性下,各分期的检测灵敏性为(I:48.5%±0.08,II:78.5%±0.049,III:79.5%±0.073,IV:93.9%±0.034,可治愈的I-III:69.4%±0.043,I-IV:74.6%±0.034)整体的AUC为0.91±0.012。相比实施例5的19个位点组合,该实施例的9个位点的组合在结直肠癌中的各分期中的检测灵敏性都有所下降。请参见图9。
实施例8
利用以上其中的19个位点,再从剩余的91个位点中随机选取18个位点,组合一个37位点的组合。在血浆样本中进行测试,对222例肠镜无异常的正常人以及438例结直肠癌病人血浆样本进行检测,利用随机森林模型进行建模分析,按照6:4的切分,进行20次重复,在90%的特异性下,各分期的检测灵敏性为(I:63.7%±0.124,II:86.1%±0.061,III:87.1%±0.058,IV:96%±0.025,可治愈的I-III:79.3%±0.061,I-IV:82.8%±0.049),在95%的特异性下,各分期的检测灵敏性为(I:55.4%±0.102,II:82.1%±0.062,III:83%±0.058,IV:95.2%±0.03,可治愈的I-III:73.9%±0.056,I-IV:78.4%±0.047)整体的AUC为0.94±0.01。相比实施例5的19个位点组合,37个位点的组合在更高地特异性下,某些分期的检测灵敏性有一定的提高。请参见图10。
37个位点的信息:cg01922936,cg12652174,cg18323466,cg10218490,cg26337020,cg07344025,cg14652031,cg16057262,cg04380513,cg12665504,cg12619536,cg15717808,cg17849956,cg02362467,cg21644830,cg21583226,cg04156369,cg23232563,cg00397851,cg06779469,cg02408333,c g21995919,cg01333350,cg12080391,cg16903605,cg11407741,cg06952671,cg15248577,cg03786924,c g00868383,cg19752627,cg19918758,cg25832771,cg21621906,cg23434186,cg01419567。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (5)
1.人血液中与结直肠癌诊断相关的甲基化生物标记物,其特征是,所述甲基
化生物标记物是cg21644830、cg11407741、cg12619536、cg04156369、cg15248577、cg16903605、cg00397851、cg01922936、cg17849956、cg15717808、cg18323466、cg15177071、cg19918758、cg26337020、cg01333350、cg07344025、cg03786924、cg04380513、和cg12665504的组合;所述结直肠癌是早期结直肠癌,所述早期结直肠癌是1-2期结直肠癌。
2.人血液中与结直肠癌诊断相关的甲基化生物标记物,其特征是,所述甲基化生物标记物是cg01922936,cg12652174,cg18323466, cg10218490, cg26337020,cg07344025 ,cg14652031,cg16057262,cg04380513,cg12665504,cg12619536,cg15717808,cg17849956,cg02362467,cg21644830,cg21583226,cg04156369,cg23232563,cg00397851,cg06779469,cg02408333,c g21995919,cg01333350,cg12080391,cg16903605,cg11407741,cg06952671, cg15248577, cg03786924, cg00868383,cg19752627,cg19918758,cg25832771,cg21621906,cg23434186,cg01419567的组合;所述结直肠癌是早期结直肠癌,所述早期结直肠癌是1-2期结直肠癌。
3.检测权利要求1-2任一项所述的甲基化生物标记物的试剂在制备检测人早期结直肠癌的试剂盒中的应用。
4.一种诊断、预测人早期结直肠癌的检测试剂盒,其特征是,包括检测权利要求1-2任一项所述的甲基化生物标记物甲基化的试剂。
5.根据权利要求4所述的检测试剂盒,其特征是,所述试剂是根据采用焦磷酸测序法、重亚硫酸盐转化测序法、甲基化芯片法、qPCR法、数字PCR法、二代测序法、三代测序法、全基因组甲基化测序法、DNA富集检测法、简化亚硫酸氢盐测序技术、HPLC法、MassArray、甲基化特异PCR、或它们的组合所使用的试剂。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911119701.6A CN110724743B (zh) | 2019-11-15 | 2019-11-15 | 人血液中结直肠癌诊断相关的甲基化生物标记物及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911119701.6A CN110724743B (zh) | 2019-11-15 | 2019-11-15 | 人血液中结直肠癌诊断相关的甲基化生物标记物及其应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110724743A CN110724743A (zh) | 2020-01-24 |
CN110724743B true CN110724743B (zh) | 2021-02-26 |
Family
ID=69224305
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911119701.6A Active CN110724743B (zh) | 2019-11-15 | 2019-11-15 | 人血液中结直肠癌诊断相关的甲基化生物标记物及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110724743B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114317736B (zh) * | 2021-08-19 | 2022-09-13 | 广州市基准医疗有限责任公司 | 用于泛癌种检测的甲基化标志物组合及其应用 |
CN115851923A (zh) * | 2022-05-25 | 2023-03-28 | 广州市基准医疗有限责任公司 | 用于检测结直肠癌淋巴结转移的甲基化生物标记物及其应用 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109072300A (zh) * | 2015-12-17 | 2018-12-21 | 伊路敏纳公司 | 区分复杂生物样品中的甲基化水平 |
WO2019071161A1 (en) * | 2017-10-06 | 2019-04-11 | Youhealth Biotech, Limited | METHYLATION MARKERS FOR THE DIAGNOSIS OF CANCER |
CN110358836A (zh) * | 2019-07-31 | 2019-10-22 | 中山大学附属第六医院 | 筛查或诊断肿瘤的试剂组合、试剂盒和装置 |
-
2019
- 2019-11-15 CN CN201911119701.6A patent/CN110724743B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109072300A (zh) * | 2015-12-17 | 2018-12-21 | 伊路敏纳公司 | 区分复杂生物样品中的甲基化水平 |
WO2019071161A1 (en) * | 2017-10-06 | 2019-04-11 | Youhealth Biotech, Limited | METHYLATION MARKERS FOR THE DIAGNOSIS OF CANCER |
CN110358836A (zh) * | 2019-07-31 | 2019-10-22 | 中山大学附属第六医院 | 筛查或诊断肿瘤的试剂组合、试剂盒和装置 |
Non-Patent Citations (1)
Title |
---|
Integrated genomic analysis of colorectal cancer progression reveals activation of EGFR through demethylation of the EREG promoter;X Qu;《Oncogene》;20160606;第35卷(第50期);附件表2及GEO Accession:GSE77955 * |
Also Published As
Publication number | Publication date |
---|---|
CN110724743A (zh) | 2020-01-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110387421A (zh) | 用于肺癌检测的DNA甲基化qPCR试剂盒及使用方法 | |
CN112176057B (zh) | 利用CpG位点甲基化水平检测胰腺导管腺癌的标志物及其应用 | |
CN108588230B (zh) | 一种用于乳腺癌诊断的标记物及其筛选方法 | |
CN107034301A (zh) | 一种检测肺结节为良性或恶性的试剂盒及其应用 | |
CN111500705B (zh) | IgAN肠道菌群标志物、IgAN代谢物标志物及其应用 | |
CN110724743B (zh) | 人血液中结直肠癌诊断相关的甲基化生物标记物及其应用 | |
CN112301130A (zh) | 一种肺癌早期检测的标志物、试剂盒及方法 | |
CN111424093B (zh) | 用于肺癌诊断的试剂盒、装置及方法 | |
CN111378758B (zh) | 用于肺癌诊断的试剂盒、装置及方法 | |
CN113724862B (zh) | 一种结直肠癌生物标志物及其筛选方法和应用 | |
CN108998531B (zh) | 肺癌下调长链非编码rna标志物及其应用 | |
TWI571514B (zh) | 評估罹患大腸直腸癌風險的方法 | |
WO2013160176A1 (en) | Diagnostic mirna profiles in multiple sclerosis | |
EP3726221B1 (en) | Hierarchical model for detecting benign and malignant degrees of colorectal tumors and application thereof | |
CN108998530B (zh) | 肺癌上调长链非编码rna标志物及其应用 | |
JP6612509B2 (ja) | 大腸癌の予後診断を補助する方法、記録媒体および判定装置 | |
CN105950723B (zh) | 用于结直肠癌早期诊断的无创甲基化定量检测试剂盒 | |
CN114107514A (zh) | 一种用于结直肠癌诊断的miRNA分子标志物及其试剂盒 | |
CN115803448A (zh) | 来自外周血红细胞的微核dna及其用途 | |
TWI626314B (zh) | 評估罹患大腸直腸癌風險的方法 | |
CN111455057B (zh) | 用于肺癌诊断的试剂盒、装置及方法 | |
CN113948150B (zh) | Jmml相关基因甲基化水平评估方法、模型及构建方法 | |
CN110714075B (zh) | 一种用于检测肺肿瘤良恶性程度的分级模型及其应用 | |
CN115044671A (zh) | 可用于胃癌her2伴随诊断的基因甲基化标记物或其组合和应用 | |
CN117431315A (zh) | 大肠癌淋巴结转移检测甲基化生物标记物及检测试剂盒 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |