CN114250298A - 胰腺导管腺癌的dna甲基化标志物及其应用 - Google Patents
胰腺导管腺癌的dna甲基化标志物及其应用 Download PDFInfo
- Publication number
- CN114250298A CN114250298A CN202011005627.8A CN202011005627A CN114250298A CN 114250298 A CN114250298 A CN 114250298A CN 202011005627 A CN202011005627 A CN 202011005627A CN 114250298 A CN114250298 A CN 114250298A
- Authority
- CN
- China
- Prior art keywords
- tget
- probe
- seq
- nucleotide sequence
- methylation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 201000008129 pancreatic ductal adenocarcinoma Diseases 0.000 title claims abstract description 164
- 239000003550 marker Substances 0.000 title claims abstract description 35
- 230000007067 DNA methylation Effects 0.000 title claims abstract description 29
- 230000011987 methylation Effects 0.000 claims abstract description 299
- 238000007069 methylation reaction Methods 0.000 claims abstract description 299
- 238000000034 method Methods 0.000 claims abstract description 46
- 238000001514 detection method Methods 0.000 claims abstract description 32
- 229920000371 poly(diallyldimethylammonium chloride) polymer Polymers 0.000 claims abstract description 18
- 239000000523 sample Substances 0.000 claims description 787
- 239000002773 nucleotide Substances 0.000 claims description 220
- 125000003729 nucleotide group Chemical group 0.000 claims description 220
- 239000000126 substance Substances 0.000 claims description 177
- 239000003795 chemical substances by application Substances 0.000 claims description 56
- 238000012163 sequencing technique Methods 0.000 claims description 24
- 239000000090 biomarker Substances 0.000 claims description 22
- 230000015654 memory Effects 0.000 claims description 22
- 239000011159 matrix material Substances 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 17
- 238000003745 diagnosis Methods 0.000 claims description 17
- 108090000623 proteins and genes Proteins 0.000 claims description 13
- 230000015572 biosynthetic process Effects 0.000 claims description 12
- 238000004891 communication Methods 0.000 claims description 9
- 238000002360 preparation method Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 7
- 238000003556 assay Methods 0.000 claims description 5
- 239000003153 chemical reaction reagent Substances 0.000 abstract description 19
- 238000010276 construction Methods 0.000 abstract description 2
- 108020004414 DNA Proteins 0.000 description 67
- 239000000047 product Substances 0.000 description 30
- 238000012549 training Methods 0.000 description 30
- 238000012360 testing method Methods 0.000 description 23
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 22
- 230000003321 amplification Effects 0.000 description 22
- 238000003199 nucleic acid amplification method Methods 0.000 description 22
- 238000012706 support-vector machine Methods 0.000 description 19
- 239000000243 solution Substances 0.000 description 18
- 108091029430 CpG site Proteins 0.000 description 16
- 239000011541 reaction mixture Substances 0.000 description 15
- 239000011324 bead Substances 0.000 description 13
- 238000000746 purification Methods 0.000 description 13
- 206010028980 Neoplasm Diseases 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 12
- 210000002381 plasma Anatomy 0.000 description 12
- 238000002156 mixing Methods 0.000 description 10
- 238000003786 synthesis reaction Methods 0.000 description 10
- 230000003211 malignant effect Effects 0.000 description 8
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 8
- 239000007788 liquid Substances 0.000 description 7
- 229910001868 water Inorganic materials 0.000 description 7
- 238000012408 PCR amplification Methods 0.000 description 6
- 239000007795 chemical reaction product Substances 0.000 description 6
- 238000013399 early diagnosis Methods 0.000 description 6
- 230000035945 sensitivity Effects 0.000 description 6
- 239000006228 supernatant Substances 0.000 description 6
- 239000000872 buffer Substances 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- 238000005119 centrifugation Methods 0.000 description 5
- 238000011534 incubation Methods 0.000 description 5
- 239000011534 wash buffer Substances 0.000 description 5
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 4
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 238000001574 biopsy Methods 0.000 description 4
- 210000004369 blood Anatomy 0.000 description 4
- 239000008280 blood Substances 0.000 description 4
- 238000002790 cross-validation Methods 0.000 description 4
- 238000006209 dephosphorylation reaction Methods 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 108010077544 Chromatin Proteins 0.000 description 3
- 210000003483 chromatin Anatomy 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical class O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 230000002194 synthesizing effect Effects 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- 238000010200 validation analysis Methods 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- 101150008989 55 gene Proteins 0.000 description 2
- 102000012410 DNA Ligases Human genes 0.000 description 2
- 108010061982 DNA Ligases Proteins 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 2
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 2
- LSNNMFCWUKXFEE-UHFFFAOYSA-N Sulfurous acid Chemical compound OS(O)=O LSNNMFCWUKXFEE-UHFFFAOYSA-N 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000002512 chemotherapy Methods 0.000 description 2
- 230000001351 cycling effect Effects 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000030609 dephosphorylation Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012336 endoscopic ultrasonography Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 239000013642 negative control Substances 0.000 description 2
- 238000007481 next generation sequencing Methods 0.000 description 2
- 108020004707 nucleic acids Proteins 0.000 description 2
- 150000007523 nucleic acids Chemical class 0.000 description 2
- 102000039446 nucleic acids Human genes 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000004393 prognosis Methods 0.000 description 2
- 238000003753 real-time PCR Methods 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 108050009160 DNA polymerase 1 Proteins 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 238000000585 Mann–Whitney U test Methods 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 239000012807 PCR reagent Substances 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 description 1
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 description 1
- 229920001030 Polyethylene Glycol 4000 Polymers 0.000 description 1
- 235000014443 Pyrus communis Nutrition 0.000 description 1
- 101710086015 RNA ligase Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 238000003149 assay kit Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000012148 binding buffer Substances 0.000 description 1
- 238000003766 bioinformatics method Methods 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 239000012084 conversion product Substances 0.000 description 1
- 230000000120 cytopathologic effect Effects 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000008367 deionised water Substances 0.000 description 1
- 229910021641 deionized water Inorganic materials 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- MTHSVFCYNBDYFN-UHFFFAOYSA-N diethylene glycol Chemical compound OCCOCCO MTHSVFCYNBDYFN-UHFFFAOYSA-N 0.000 description 1
- 239000013024 dilution buffer Substances 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 239000005457 ice water Substances 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 238000011528 liquid biopsy Methods 0.000 description 1
- 230000036210 malignancy Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 238000012164 methylation sequencing Methods 0.000 description 1
- 239000011259 mixed solution Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000017074 necrotic cell death Effects 0.000 description 1
- 238000010827 pathological analysis Methods 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000003793 prenatal diagnosis Methods 0.000 description 1
- 238000002271 resection Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 230000008733 trauma Effects 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/154—Methylation markers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Engineering & Computer Science (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Analytical Chemistry (AREA)
- Zoology (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Physics & Mathematics (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Hospice & Palliative Care (AREA)
- Biophysics (AREA)
- Oncology (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供了一系列可以用于胰腺导管腺癌标记物及检测产品。本发明的cfDNA甲基化标志物,可以有效鉴别胰腺导管腺癌:本专利保护的PDAC甲基化标志物在正常人群的cfDNA和PDAC患者人群的ctDNA中,其水平有显著的差异,因此可用于判断受检对象患有PDAC的风险。本发明可以用于准确地检测受检人提供的样本中,所有panel对应的PDAC甲基化标志物的实际水平:使用本试剂盒提供的试剂、panel、接头和建库流程,可从少量cfDNA或ctDNA样本制备高丰度、高多样性的DNA甲基化文库,准确地测定本专利中包括的PDAC甲基化标志物的信号水平,用于评估受检对象是否患有PDAC。
Description
技术领域
本发明属于分子生物医学技术领域,具体涉及一种胰腺导管腺癌的DNA甲基化标志物及其应用。
背景技术
胰腺导管腺癌(pancreatic ductal adenocarcinoma,简称PDAC)是实体肿瘤中预后最差的恶性肿瘤之一,5年总体生存率不到5%。早期诊断并行手术切除是唯一可能治愈PDAC的手段。在我国经济发达地区,PDAC新发估计病例数列男性第7位,女性第6位,并且呈快速上升趋势。
早期PDAC起病隐匿、进展迅速且对化疗高度耐药,死亡率高,迫切需要可靠精准的早期诊疗手段,及早发现。晚期PDAC病人治疗前通常也需要有明确的病理学诊断。获取组织或细胞行病理学诊断的途径通常为超声内镜(EUS)或者CT引导下的细针穿刺(FNA)。由于组织取材量受限,即便是EUS-FNA,其检测准确性也有较大的改善空间。对于影像学表现典型而EUS-FNA活检阴性的病人,往往需要再行EUS-FNA活检,进一步增加了对病人的创伤。
因此亟需发掘新的准确性高、无创、简单的筛查方法及方式。
发明内容
为了克服现有技术中所存在的问题,本发明的目的在于提供一种胰腺导管腺癌的DNA甲基化标志物及其应用。
为了实现上述目的以及其他相关目的,本发明采用如下技术方案:
本发明的第一方面,提供胰腺导管腺癌的DNA甲基化标志物或者能检测所述胰腺导管腺癌的DNA甲基化标志物的物质用于制备胰腺导管腺癌检测产品的用途;以人类参考基因组Hg19的序列为基准,所述胰腺导管腺癌的DNA甲基化标志物包括如下基因靶点中的任一个或多个:
可选择的,所述胰腺导管腺癌的DNA甲基化标志物还包括如下基因靶点中的任一个或多个:
基因靶点编号 | 染色质编号 | 起始坐标 | 终点坐标 |
tget_46 | chr10 | 26505477 | 26505676 |
tget_47 | chr17 | 56410482 | 56410681 |
tget_48 | chr14 | 24641158 | 24641357 |
tget_49 | chr16 | 50715190 | 50715389 |
tget_50 | chr12 | 133485709 | 133485908 |
tget_51 | chr6 | 106547142 | 106547341 |
tget_52 | chr6 | 158402071 | 158402270 |
tget_53 | chr2 | 177025102 | 177025301 |
tget_54 | chr2 | 11546249 | 11546448 |
tget_55 | chr12 | 57529619 | 57529818。 |
本发明第二方面,提供一种胰腺导管腺癌检测用探针组合,所述探针组合包括以下特征中的一项或多项:(1)tget_01的探针;(2)tget_02的探针;(3)tget_03的探针;(4)tget_04的探针;(5)tget_05的探针;(6)tget_06的探针;(7)tget_07的探针;(8)tget_08的探针;(9)tget_09的探针;(10)tget_10的探针;(11)tget_11的探针;(12)tget_12的探针;(13)tget_13的探针;(14)tget_14的探针;(15)tget_15的探针;(16)tget_16的探针;(17)tget_17的探针;(18)tget_18的探针;(19)tget_19的探针;(20)tget_20的探针;(21)tget_21的探针;(22)tget_22的探针;(23)tget_23的探针;(24)tget_24的探针;(25)tget_25的探针;(26)tget_26的探针;(27)tget_27的探针;(28)tget_28的探针;(29)tget_29的探针;(30)tget_30的探针;(31)tget_31的探针;(32)tget_32的探针;(33)tget_33的探针;(34)tget_34的探针;(35)tget_35的探针;(36)tget_36的探针;(37)tget_37的探针;(38)tget_38的探针;(39)tget_39的探针;(40)tget_40的探针;(41)tget_41的探针;(42)tget_42的探针;(43)tget_43的探针;(44)tget_44的探针;(45)tget_45的探针;可选的,还包括以下特征中的一项或多项:(46)tget_46的探针;(47)tget_47的探针;(48)tget_48的探针;(49)tget_49的探针;(50)tget_50的探针;(51)tget_51的探针;(52)tget_52的探针;(53)tget_53的探针;(54)tget_54的探针;(55)tget_55的探针。
本发明第三方面提供胰腺导管腺癌检测试剂盒,所述试剂盒中包括前述的胰腺导管腺癌检测用探针组合。
本发明第四方面提供一种胰腺导管腺癌诊断用装置,包括:
样本PDAC生物标志物的甲基化水平数据矩阵形成模块,用于将样本PDAC生物标志物的甲基化水平形成数据矩阵,所述样本PDAC生物标志物选自前述的用途中的所述胰腺导管腺癌的DNA甲基化标志物;
PDAC诊断模块,用于将样本PDAC生物标志物的甲基化水平数据矩阵输入PDAC诊断模型,计算受检者患有PDAC的可能性。
本发明第五方面提供一种设备,所述设备选自计算机可读存储介质或计算机处理设备或电子终端;所述计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现胰腺导管腺癌诊断方法,所述方法包括以下步骤:
S1,将样本PDAC生物标志物的甲基化水平形成数据矩阵,所述样本PDAC生物标志物选自前述的胰腺导管腺癌的DNA甲基化标志物;
S2,将样本PDAC生物标志物的甲基化水平数据矩阵输入PDAC诊断模型,计算受检者患有PDAC的可能性。
所述计算机处理设备,包括处理器及前述的计算机可读存储介质,所述处理器执行所述计算机可读存储介质上的计算机程序,实现所述胰腺导管腺癌诊断方法。
所述电子终端,包括:处理器、存储器、及通信器;所述存储器用于存储计算机程序,所述通信器用于与外部设备进行通信连接,所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行所述胰腺导管腺癌诊断方法。
与现有技术相比,本发明具有如下有益效果:
本发明的cfDNA甲基化标志物,可以有效鉴别胰腺导管腺癌:本专利保护的PDAC甲基化标志物在正常人群的cfDNA和PDAC患者人群的ctDNA中,其水平有显著的差异,因此可用于判断受检对象是否已经患有PDAC。
本发明可以用于准确地检测受检人提供的样本中,所有panel对应的PDAC甲基化标志物的实际水平:使用本试剂盒提供的试剂、panel、接头和建库流程,可从少量cfDNA或ctDNA样本制备高丰度、高多样性的DNA甲基化文库,准确地测定本专利中包括的PDAC甲基化标志物的信号水平,用于评估受检对象患有PDAC的风险。
本发明可以有效对个人进行胰腺导管腺癌进行早期筛查,且具有较高的灵敏度和特异性,为胰腺导管腺癌的鉴别提供了新方法。检测过程无创,安全性高。同时因为血液样本可以常温运输,大大提高了检测的方便性。
附图说明
图1是本发明所采取的技术方案流程图。
图2是使用实施例1中55条探针检测训练组样本,对检测数据使用SVM方法建立PDAC诊断模型后,在训练组样本中交叉验证该诊断模型的ROC曲线。
图3是使用实施例2中10条探针检测训练组样本,对检测数据使用SVM方法建立PDAC诊断模型后,在训练组样本中交叉验证该诊断模型的ROC曲线。
图4是使用实施例2中10条探针获得的SVM模型,对测试组样本进行打分后,其分值在PDAC和对照组样本中的分布。
图5是使用实施例2中10条探针获得的SVM模型,对测试组样本进行验证后ROC曲线。
具体实施方式
无创/微创的液体活检技术的出现为肿瘤提供了传统组织活检之外的诊断途径,也是近年来肿瘤研究的主要热点领域之一。高通量高灵敏度的新一代测序技术(nextgeneration sequencing,NGS)的飞速发展为液体活及检精准肿瘤基因检测提供了强有力的技术支撑。肿瘤液体活检采用的最主要分子标记之一为循环肿瘤DNA(circulatingtumor DNA,ctDNA),ctDNA是指循环血中游离于细胞外的部分降解了的机体内源性DNA,其来源主要是肿瘤细胞的坏死、凋亡和分泌过程。血浆游离DNA目前已广泛地应用于产前诊断,而ctDNA在不同肿瘤患者(包括早期肿瘤)的外周血浆中普遍存在。
已有大量研究证实ctDNA基因突变检测对于肿瘤早期诊断、靶向用药指导、化疗疗效预测、耐药及复发监测、预后评估等方面有着巨大的应用潜力。与ctDNA突变检测相比较,ctDNA甲基化检测在肿瘤中的潜在应用范围更广,且检测结果非常一致。
本发明探究了一种新的检测媒介,在血浆循环核酸(circulating free DNA,cfDNA)中检测胰腺导管腺癌特有的DNA甲基化标志物,旨在通过无创的检测方法,使用这些标志物精准评估受检者患有胰腺导管腺癌的可能性,实现对胰腺导管腺癌的无创早筛和早诊。
在进一步描述本发明具体实施方式之前,应理解,本发明的保护范围不局限于下述特定的具体实施方案;还应当理解,本发明实施例中使用的术语是为了描述特定的具体实施方案,而不是为了限制本发明的保护范围。下列实施例中未注明具体条件的试验方法,通常按照常规条件,或者按照各制造商所建议的条件。
当实施例给出数值范围时,应理解,除非本发明另有说明,每个数值范围的两个端点以及两个端点之间任何一个数值均可选用。除非另外定义,本发明中使用的所有技术和科学术语与本技术领域技术人员通常理解的意义相同。除实施例中使用的具体方法、设备、材料外,根据本技术领域的技术人员对现有技术的掌握及本发明的记载,还可以使用与本发明实施例中所述的方法、设备、材料相似或等同的现有技术的任何方法、设备和材料来实现本发明。
除非另外说明,本发明中所公开的实验方法、检测方法、制备方法均采用本技术领域常规的分子生物学、生物化学、染色质结构和分析、分析化学、细胞培养、重组DNA技术及相关领域的常规技术。
本发明一实施例提供的胰腺导管腺癌的DNA甲基化标志物或者能检测所述胰腺导管腺癌的DNA甲基化标志物的物质用于制备胰腺导管腺癌检测产品的用途;以人类参考基因组Hg19的序列为基准,所述胰腺导管腺癌的DNA甲基化标志物包括如下基因靶点中的任一个或多个:
可选择的,所述胰腺导管腺癌的DNA甲基化标志物还包括如下基因靶点中的任一个或多个:
基因靶点编号 | 染色质编号 | 起始坐标 | 终点坐标 |
tget_46 | chr10 | 26505477 | 26505676 |
tget_47 | chr17 | 56410482 | 56410681 |
tget_48 | chr14 | 24641158 | 24641357 |
tget_49 | chr16 | 50715190 | 50715389 |
tget_50 | chr12 | 133485709 | 133485908 |
tget_51 | chr6 | 106547142 | 106547341 |
tget_52 | chr6 | 158402071 | 158402270 |
tget_53 | chr2 | 177025102 | 177025301 |
tget_54 | chr2 | 11546249 | 11546448 |
tget_55 | chr12 | 57529619 | 57529818。 |
能检测所述胰腺导管腺癌的DNA甲基化标志物的物质是指能够检测所述胰腺导管腺癌的DNA甲基化标志物(即“靶点”)的甲基化的水平的物质。可以为特异性探查靶点甲基化水平的物质,如探针等。
所述基因靶点均含有CpG位点。进一步的,每个基因靶点中所有CpG位点甲基化水平的均值,或多个CpG位点甲基化水平的均值,或单个CpG位点的甲基化水平都可以作为诊断胰腺导管腺癌良恶性的标志物。
进一步的,所述胰腺导管腺癌检测产品用于胰腺导管腺癌的判断、诊断。
优选的,所述胰腺导管腺癌检测产品用于胰腺导管腺癌的早期判断、早期诊断。
可选的,所述胰腺导管腺癌检测产品用于检测样本中的DNA,所述样本选自血浆。
所述DNA可以是ctDNA或cfDNA。
进一步的,所述胰腺导管腺癌检测产品包括以下特征中的一项或多项:(1)特异性探查tget_01甲基化水平的物质、(2)特异性探查tget_02甲基化水平的物质、(3)特异性探查tget_03甲基化水平的物质、(4)特异性探查tget_04甲基化水平的物质、(5)特异性探查tget_05甲基化水平的物质、(6)特异性探查tget_06甲基化水平的物质、(7)特异性探查tget_07甲基化水平的物质、(8)特异性探查tget_08甲基化水平的物质、(9)特异性探查tget_09甲基化水平的物质、(10)特异性探查tget_10甲基化水平的物质、(11)特异性探查tget_11甲基化水平的物质、(12)特异性探查tget_12甲基化水平的物质、(13)特异性探查tget_13甲基化水平的物质、(14)特异性探查tget_14甲基化水平的物质、(15)特异性探查tget_15甲基化水平的物质、(16)特异性探查tget_16甲基化水平的物质、(17)特异性探查tget_17甲基化水平的物质和(18)特异性探查tget_18甲基化水平的物质、(19)特异性探查tget_19甲基化水平的物质、(20)特异性探查tget_20甲基化水平的物质、(21)特异性探查tget_21甲基化水平的物质、(22)特异性探查tget_22甲基化水平的物质、(23)特异性探查tget_23甲基化水平的物质、(24)特异性探查tget_24甲基化水平的物质、(25)特异性探查tget_25甲基化水平的物质、(26)特异性探查tget_26甲基化水平的物质、(27)特异性探查tget_27甲基化水平的物质、(28)特异性探查tget_28甲基化水平的物质、(29)特异性探查tget_29甲基化水平的物质、(30)特异性探查tget_30甲基化水平的物质、(31)特异性探查tget_31甲基化水平的物质、(32)特异性探查tget_32甲基化水平的物质、(33)特异性探查tget_33甲基化水平的物质、(34)特异性探查tget_34甲基化水平的物质、(35)特异性探查tget_35甲基化水平的物质、(36)特异性探查tget_36甲基化水平的物质、(37)特异性探查tget_37甲基化水平的物质、(38)特异性探查tget_38甲基化水平的物质、(39)特异性探查tget_39甲基化水平的物质、(40)特异性探查tget_40甲基化水平的物质、(41)特异性探查tget_41甲基化水平的物质、(42)特异性探查tget_42甲基化水平的物质、(43)特异性探查tget_43甲基化水平的物质、(44)特异性探查tget_44甲基化水平的物质、(45)特异性探查tget_45甲基化水平的物质;
可选择地,所述胰腺导管腺癌检测产品还包括以下特征中任一项或多项的组合:(46)特异性探查tget_46甲基化水平的物质、(47)特异性探查tget_47甲基化水平的物质、(48)特异性探查tget_48甲基化水平的物质、(49)特异性探查tget_49甲基化水平的物质、(50)特异性探查tget_50甲基化水平的物质、(51)特异性探查tget_51甲基化水平的物质、(52)特异性探查tget_52甲基化水平的物质、(53)特异性探查tget_53甲基化水平的物质、(54)特异性探查tget_54甲基化水平的物质、(55)特异性探查tget_55甲基化水平的物质。
在一种实施方式中,还包括以下特征中的一项或多项:(1)所述特异性探查tget_01甲基化水平的物质包括tget_01的探针;(2)所述特异性探查tget_02甲基化水平的物质包括tget_02的探针;(3)所述特异性探查tget_03甲基化水平的物质包括tget_03的探针;(4)所述特异性探查tget_04甲基化水平的物质包括tget_04的探针;(5)所述特异性探查tget_05甲基化水平的物质包括tget_05的探针;(6)所述特异性探查tget_06甲基化水平的物质包括tget_06的探针;(7)所述特异性探查tget_07甲基化水平的物质包括tget_07的探针;(8)所述特异性探查tget_08甲基化水平的物质包括tget_08的探针;(9)所述特异性探查tget_09甲基化水平的物质包括tget_09的探针;(10)所述特异性探查tget_10甲基化水平的物质包括tget_10的探针;(11)所述特异性探查tget_11甲基化水平的物质包括tget_11的探针;(12)所述特异性探查tget_12甲基化水平的物质包括tget_12的探针;(13)所述特异性探查tget_13甲基化水平的物质包括tget_13的探针;(14)所述特异性探查tget_14甲基化水平的物质包括tget_14的探针;(15)所述特异性探查tget_15甲基化水平的物质包括tget_15的探针;(16)所述特异性探查tget_16甲基化水平的物质包括tget_16的探针;(17)所述特异性探查tget_17甲基化水平的物质包括tget_17的探针;(18)所述特异性探查tget_18甲基化水平的物质包括tget_18的探针;(19)所述特异性探查tget_19甲基化水平的物质包括tget_19的探针;(20)所述特异性探查tget_20甲基化水平的物质包括tget_20的探针;(21)所述特异性探查tget_21甲基化水平的物质包括tget_21的探针;(22)所述特异性探查tget_22甲基化水平的物质包括tget_22的探针;(23)所述特异性探查tget_23甲基化水平的物质包括tget_23的探针;(24)所述特异性探查tget_24甲基化水平的物质包括tget_24的探针;(25)所述特异性探查tget_25甲基化水平的物质包括tget_25的探针;(26)所述特异性探查tget_26甲基化水平的物质包括tget_26的探针;(27)所述特异性探查tget_27甲基化水平的物质包括tget_27的探针;(28)所述特异性探查tget_28甲基化水平的物质包括tget_28的探针;(29)所述特异性探查tget_29甲基化水平的物质包括tget_29的探针;(30)所述特异性探查tget_30甲基化水平的物质包括tget_30的探针;(31)所述特异性探查tget_31甲基化水平的物质包括tget_31的探针;(32)所述特异性探查tget_32甲基化水平的物质包括tget_32的探针;(33)所述特异性探查tget_33甲基化水平的物质包括tget_33的探针;(34)所述特异性探查tget_34甲基化水平的物质包括tget_34的探针;(35)所述特异性探查tget_35甲基化水平的物质包括tget_35的探针;(36)所述特异性探查tget_36甲基化水平的物质包括tget_36的探针;(37)所述特异性探查tget_37甲基化水平的物质包括tget_37的探针;(38)所述特异性探查tget_38甲基化水平的物质包括tget_38的探针;(39)所述特异性探查tget_39甲基化水平的物质包括tget_39的探针;(40)所述特异性探查tget_40甲基化水平的物质包括tget_40的探针;(41)所述特异性探查tget_41甲基化水平的物质包括tget_41的探针;(42)所述特异性探查tget_42甲基化水平的物质包括tget_42的探针;(43)所述特异性探查tget_43甲基化水平的物质包括tget_43的探针;(44)所述特异性探查tget_44甲基化水平的物质包括tget_44的探针;(45)所述特异性探查tget_45甲基化水平的物质包括tget_45的探针;(46)所述特异性探查tget_46甲基化水平的物质包括tget_46的探针;(47)所述特异性探查tget_47甲基化水平的物质包括tget_47的探针;(48)所述特异性探查tget_48甲基化水平的物质包括tget_48的探针;(49)所述特异性探查tget_49甲基化水平的物质包括tget_49的探针;(50)所述特异性探查tget_50甲基化水平的物质包括tget_50的探针;(51)所述特异性探查tget_51甲基化水平的物质包括tget_51的探针;(52)所述特异性探查tget_52甲基化水平的物质包括tget_52的探针;(53)所述特异性探查tget_53甲基化水平的物质包括tget_53的探针;(54)所述特异性探查tget_54甲基化水平的物质包括tget_54的探针;(55)所述特异性探查tget_55甲基化水平的物质包括tget_55的探针。
设前述的tget的编号为N,所述tget_N的探针是指用于作为引物参与PCR反应扩增tget_N靶点区域的物质。例如,tget_01的探针是指用于作为引物参与PCR反应扩增tget_01靶点区域的物质。tget_02的探针是指用于作为引物参与PCR反应扩增tget_02靶点区域的物质。tget_03的探针是指用于作为引物参与PCR反应扩增tget_03靶点区域的物质。依此类推,……tget_53的探针是指用于作为引物参与PCR反应扩增tget_53靶点区域的物质。tget_54的探针是指用于作为引物参与PCR反应扩增tget_54靶点区域的物质。tget_55的探针是指用于作为引物参与PCR反应扩增tget_55靶点区域的物质。
可选的,所述探针包括公共序列和特异性序列,在同一套胰腺导管腺癌检测产品中,各个tget_N的公共序列相同。例如,所述公共序列可以为如SEQ ID NO:59所示的序列。具体的:GACTGGAGTTCAGACGTGTGCTCTTCCGATCT。公共序列用于配适测序使用的Illumina测序平台,是每一个探针都需要的保留的部分。方便进行二代测序等操作。
所述特异性序列用于区分不同的靶点。
在一种实施方式中,还包括以下特征中的一项或多项:(1)所述tget_01的探针的核苷酸序列如SEQ ID NO.1所示。(2)所述tget_02的探针的核苷酸序列如SEQ ID NO.2所示。(3)所述tget_03的探针的核苷酸序列如SEQ ID NO.3所示。(4)所述tget_04的探针的核苷酸序列如SEQ ID NO.4所示。(5)所述tget_05的探针的核苷酸序列如SEQ ID NO.5所示。(6)所述tget_06的探针的核苷酸序列如SEQ ID NO.6所示。(7)所述tget_07的探针的核苷酸序列如SEQ ID NO.7所示。(8)所述tget_08的探针的核苷酸序列如SEQ ID NO.8所示。(9)所述tget_09的探针的核苷酸序列如SEQ ID NO.9所示。(10)所述tget_10的探针的核苷酸序列如SEQ ID NO.10所示。(11)所述tget_11的探针的核苷酸序列如SEQ ID NO.11所示。(12)所述tget_12的探针的核苷酸序列如SEQ ID NO.12所示。(13)所述tget_13的探针的核苷酸序列如SEQ ID NO.13所示。(14)所述tget_14的探针的核苷酸序列如SEQ ID NO.14所示。(15)所述tget_15的探针的核苷酸序列如SEQ ID NO.15所示。(16)所述tget_16的探针的核苷酸序列如SEQ ID NO.16所示。(17)所述tget_17的探针的核苷酸序列如SEQ IDNO.17所示。(18)所述tget_18的探针的核苷酸序列如SEQ ID NO.18所示。(19)所述tget_19的探针的核苷酸序列如SEQ ID NO.19所示。(20)所述tget_20的探针的核苷酸序列如SEQID NO.20所示。(21)所述tget_21的探针的核苷酸序列如SEQ ID NO.21所示。(22)所述tget_22的探针的核苷酸序列如SEQ ID NO.22所示。(23)所述tget_23的探针的核苷酸序列如SEQ ID NO.23所示。(24)所述tget_24的探针的核苷酸序列如SEQ ID NO.24所示。(25)所述tget_25的探针的核苷酸序列如SEQ ID NO.25所示。(26)所述tget_26的探针的核苷酸序列如SEQ ID NO.26所示。(27)所述tget_27的探针的核苷酸序列如SEQ ID NO.27所示。(28)所述tget_28的探针的核苷酸序列如SEQ ID NO.28所示。(29)所述tget_29的探针的核苷酸序列如SEQ ID NO.29所示。(30)所述tget_30的探针的核苷酸序列如SEQ ID NO.30所示。(31)所述tget_31的探针的核苷酸序列如SEQ ID NO.31所示。(32)所述tget_32的探针的核苷酸序列如SEQ ID NO.32所示。(33)所述tget_33的探针的核苷酸序列如SEQ ID NO.33所示。(34)所述tget_34的探针的核苷酸序列如SEQ ID NO.34所示。(35)所述tget_35的探针的核苷酸序列如SEQ ID NO.35所示。(36)所述tget_36的探针的核苷酸序列如SEQ IDNO.36所示。(37)所述tget_37的探针的核苷酸序列如SEQ ID NO.37所示。(38)所述tget_38的探针的核苷酸序列如SEQ ID NO.38所示。(39)所述tget_39的探针的核苷酸序列如SEQID NO.39所示。(40)所述tget_40的探针的核苷酸序列如SEQ ID NO.40所示。(41)所述tget_41的探针的核苷酸序列如SEQ ID NO.41所示。(42)所述tget_42的探针的核苷酸序列如SEQ ID NO.42所示。(43)所述tget_43的探针的核苷酸序列如SEQ ID NO.43所示。(44)所述tget_44的探针的核苷酸序列如SEQ ID NO.44所示。(45)所述tget_45的探针的核苷酸序列如SEQ ID NO.45所示。(46)所述tget_46的探针的核苷酸序列如SEQ ID NO.46所示。(47)所述tget_47的探针的核苷酸序列如SEQ ID NO.47所示。(48)所述tget_48的探针的核苷酸序列如SEQ ID NO.48所示。(49)所述tget_49的探针的核苷酸序列如SEQ ID NO.49所示。(50)所述tget_50的探针的核苷酸序列如SEQ ID NO.50所示。(51)所述tget_51的探针的核苷酸序列如SEQ ID NO.51所示。(52)所述tget_52的探针的核苷酸序列如SEQ ID NO.52所示。(53)所述tget_53的探针的核苷酸序列如SEQ ID NO.53所示。(54)所述tget_54的探针的核苷酸序列如SEQ ID NO.54所示。(55)所述tget_55的探针的核苷酸序列如SEQ IDNO.55所示。
具体的,见表1,其中探针编号即为SEQ ID NO。
表1(起始和终点坐标是指探针对应的DNA序列在基因组中的坐标。所有ctDNA或cfDNA都来自基因组DNA,因为它们是基因组DNA在细胞死亡过程中经历降解之后的产物。这些序列仅限于每个探针中的特异性序列;公共序列不存在于基因组中,原因是它如果和某个基因组序列对应,会把这个序列误当作探针进行检测,因此造成假阳性或假阴性结果。)
本发明一实施例提供的胰腺导管腺癌检测用探针组合,所述探针组合包括以下特征中的一项或多项:(1)tget_01的探针;(2)tget_02的探针;(3)tget_03的探针;(4)tget_04的探针;(5)tget_05的探针;(6)tget_06的探针;(7)tget_07的探针;(8)tget_08的探针;(9)tget_09的探针;(10)tget_10的探针(11)tget_11的探针;(12)tget_12的探针;(13)tget_13的探针;(14)tget_14的探针;(15)tget_15的探针;(16)tget_16的探针;(17)tget_17的探针;(18)tget_18的探针;(19)tget_19的探针;(20)tget_20的探针;(21)tget_21的探针;(22)tget_22的探针;(23)tget_23的探针;(24)tget_24的探针;(25)tget_25的探针;(26)tget_26的探针;(27)tget_27的探针;(28)tget_28的探针;(29)tget_29的探针;(30)tget_30的探针;(31)tget_31的探针;(32)tget_32的探针;(33)tget_33的探针;(34)tget_34的探针;(35)tget_35的探针;(36)tget_36的探针;(37)tget_37的探针;(38)tget_38的探针;(39)tget_39的探针;(40)tget_40的探针;(41)tget_41的探针;(42)tget_42的探针;(43)tget_43的探针;(44)tget_44的探针;(45)tget_45的探针。
可选的,还包括以下特征中的一项或多项:(46)tget_46的探针;(47)tget_47的探针;(48)tget_48的探针;(49)tget_49的探针;(50)tget_50的探针;(51)tget_51的探针;(52)tget_52的探针;(53)tget_53的探针;(54)tget_54的探针;(55)tget_55的探针。
所述胰腺导管腺癌检测用探针组合用于胰腺导管腺癌的判断、诊断。
优选的,所述胰腺导管腺癌检测用探针组合用于胰腺导管腺癌的早期判断、早期诊断。
在一种实施方式中,还包括以下特征中的一项或多项:(1)所述tget_01的探针的核苷酸序列如SEQ ID NO.1所示。(2)所述tget_02的探针的核苷酸序列如SEQ ID NO.2所示。(3)所述tget_03的探针的核苷酸序列如SEQ ID NO.3所示。(4)所述tget_04的探针的核苷酸序列如SEQ ID NO.4所示。(5)所述tget_05的探针的核苷酸序列如SEQ ID NO.5所示。(6)所述tget_06的探针的核苷酸序列如SEQ ID NO.6所示。(7)所述tget_07的探针的核苷酸序列如SEQ ID NO.7所示。(8)所述tget_08的探针的核苷酸序列如SEQ ID NO.8所示。(9)所述tget_09的探针的核苷酸序列如SEQ ID NO.9所示。(10)所述tget_10的探针的核苷酸序列如SEQ ID NO.10所示。(11)所述tget_11的探针的核苷酸序列如SEQ ID NO.11所示。(12)所述tget_12的探针的核苷酸序列如SEQ ID NO.12所示。(13)所述tget_13的探针的核苷酸序列如SEQ ID NO.13所示。(14)所述tget_14的探针的核苷酸序列如SEQ ID NO.14所示。(15)所述tget_15的探针的核苷酸序列如SEQ ID NO.15所示。(16)所述tget_16的探针的核苷酸序列如SEQ ID NO.16所示。(17)所述tget_17的探针的核苷酸序列如SEQ IDNO.17所示。(18)所述tget_18的探针的核苷酸序列如SEQ ID NO.18所示。(19)所述tget_19的探针的核苷酸序列如SEQ ID NO.19所示。(20)所述tget_20的探针的核苷酸序列如SEQID NO.20所示。(21)所述tget_21的探针的核苷酸序列如SEQ ID NO.21所示。(22)所述tget_22的探针的核苷酸序列如SEQ ID NO.22所示。(23)所述tget_23的探针的核苷酸序列如SEQ ID NO.23所示。(24)所述tget_24的探针的核苷酸序列如SEQ ID NO.24所示。(25)所述tget_25的探针的核苷酸序列如SEQ ID NO.25所示。(26)所述tget_26的探针的核苷酸序列如SEQ ID NO.26所示。(27)所述tget_27的探针的核苷酸序列如SEQ ID NO.27所示。(28)所述tget_28的探针的核苷酸序列如SEQ ID NO.28所示。(29)所述tget_29的探针的核苷酸序列如SEQ ID NO.29所示。(30)所述tget_30的探针的核苷酸序列如SEQ ID NO.30所示。(31)所述tget_31的探针的核苷酸序列如SEQ ID NO.31所示。(32)所述tget_32的探针的核苷酸序列如SEQ ID NO.32所示。(33)所述tget_33的探针的核苷酸序列如SEQ ID NO.33所示。(34)所述tget_34的探针的核苷酸序列如SEQ ID NO.34所示。(35)所述tget_35的探针的核苷酸序列如SEQ ID NO.35所示。(36)所述tget_36的探针的核苷酸序列如SEQ IDNO.36所示。(37)所述tget_37的探针的核苷酸序列如SEQ ID NO.37所示。(38)所述tget_38的探针的核苷酸序列如SEQ ID NO.38所示。(39)所述tget_39的探针的核苷酸序列如SEQID NO.39所示。(40)所述tget_40的探针的核苷酸序列如SEQ ID NO.40所示。(41)所述tget_41的探针的核苷酸序列如SEQ ID NO.41所示。(42)所述tget_42的探针的核苷酸序列如SEQ ID NO.42所示。(43)所述tget_43的探针的核苷酸序列如SEQ ID NO.43所示。(44)所述tget_44的探针的核苷酸序列如SEQ ID NO.44所示。(45)所述tget_45的探针的核苷酸序列如SEQ ID NO.45所示。(46)所述tget_46的探针的核苷酸序列如SEQ ID NO.46所示。(47)所述tget_47的探针的核苷酸序列如SEQ ID NO.47所示。(48)所述tget_48的探针的核苷酸序列如SEQ ID NO.48所示。(49)所述tget_49的探针的核苷酸序列如SEQ ID NO.49所示。(50)所述tget_50的探针的核苷酸序列如SEQ ID NO.50所示。(51)所述tget_51的探针的核苷酸序列如SEQ ID NO.51所示。(52)所述tget_52的探针的核苷酸序列如SEQ ID NO.52所示。(53)所述tget_53的探针的核苷酸序列如SEQ ID NO.53所示。(54)所述tget_54的探针的核苷酸序列如SEQ ID NO.54所示。(55)所述tget_55的探针的核苷酸序列如SEQ IDNO.55所示。
本发明一实施例的胰腺导管腺癌检测试剂盒,所述试剂盒中包括前述的胰腺导管腺癌检测用探针组合。
基于本发明所述试剂盒中还可以包括其他一些甲基化定量PCR所需要的常规试剂,例如DNA提取试剂、亚硫酸盐、去离子水、Taq mix buffer等中的一种或多种。由于此类甲基化定量PCR常用试剂均可经市场途径单独购得或者自行配置,因此具体需要将哪些试剂装配入试剂盒,可以根据客户实际需要配置,为方便起见,也可全部装配入试剂盒。
本发明一实施例提供的胰腺导管腺癌诊断用装置,包括:
样本PDAC生物标志物的甲基化水平数据矩阵形成模块,用于将样本PDAC生物标志物的甲基化水平形成数据矩阵,所述样本PDAC生物标志物选自前述的用途中的所述胰腺导管腺癌的DNA甲基化标志物;
PDAC诊断模块,用于将样本PDAC生物标志物的甲基化水平数据矩阵输入PDAC诊断模型,计算受检者患有PDAC的可能性。
进一步的,所述样本PDAC生物标志物的甲基化水平为采用前述的胰腺导管腺癌检测用探针组合或前述试剂盒并利用二代测序检测分析获得。
可选的,将所述将测序数据与人类参考基因组序列(Hg19)均进行胞嘧啶到胸腺嘧啶(CT)和腺嘌呤到鸟嘌呤(AG)的转化,转化后将测序数据与同样转化后的人类参考基因组序列(Hg19)进行比对;比对后,获得PDAC生物标志物的甲基化水平。
所述PDAC生物标志物的甲基化水平包括每个标志物的CpG位点的甲基化水平。每个标志物内有多个CpG位点;经过计算后,单个CpG位点的甲基化均值导入SVM模型,计算出的数值为区分正常血浆DNA和PDAC血浆DNA的关键指标。
若输出结果大于预设值,则判定受检者样本中PDAC甲基化生物标志物水平超出正常水平,提示受检者患有PDAC,若输出结果不大于预设值,则提示受检者未患有PDAC。所述预设值可以根据建立模型时的诊断数据进行设置,例如建模时,将恶性类型编码为1,良性类型编码为0,由R软件(3.4.4)、caret软件包(6.0-84)、e1071(1.7-1)训练模型的过程中,默认将阈值设置为0.5。构建出的模型最终也以0.5为评分阈值对样本进良性和恶性区分,最终训练获得的模型即为PDAC诊断模型。
本发明提供的设备,所述设备选自计算机可读存储介质或计算机处理设备或电子终端;所述计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现胰腺导管腺癌诊断方法,所述方法包括以下步骤:
S1,将每个样本PDAC生物标志物的甲基化水平形成数据矩阵,所述样本PDAC生物标志物选自权利要求1中所述的胰腺导管腺癌的DNA甲基化标志物;
S2,将样本PDAC生物标志物的甲基化水平数据矩阵输入PDAC诊断模型,计算受检者患有PDAC的可能性;
所述计算机处理设备,包括处理器及前述的计算机可读存储介质,所述处理器执行所述计算机可读存储介质上的计算机程序,实现所述胰腺导管腺癌诊断方法;
所述电子终端,包括:处理器、存储器、及通信器;所述存储器用于存储计算机程序,所述通信器用于与外部设备进行通信连接,所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行所述胰腺导管腺癌诊断方法。
进一步的,所述电子终端包括处理器、存储器、通信器、通信接口和系统总线;存储器和通信接口通过系统总线与处理器和通信器连接并完成相互间的通信,存储器用于存储计算机程序,通信器、通信接口用于和其他设备进行通信,处理器和通信器用于运行计算机程序,使电子终端执行如上方法的各个步骤。
上述提到的系统总线可以是外设部件互连标准(PeripheralPomponentInterconnect,简称PCI)总线或扩展工业标准结构(ExtendedIndustryStandardArchitecture,简称EISA)总线等。该系统总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。通信接口用于实现数据库访问装置与其他设备(例如客户端、读写库和只读库)之间的通信。存储器可能包含随机存取存储器(RandomAccessMemory,简称RAM),也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。
上述的处理器可以是通用处理器,包括中央处理器(CentralProcessingUnit,简称CPU)、网络处理器(NetworkProcessor,简称NP)等;还可以是数字信号处理器(DigitalSignalProcessing,简称DSP)、专用集成电路(ApplicationSpecificIntegratedCircuit,简称ASIC)、现场可编程门阵列(Field-ProgrammableGateArray,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过计算机程序相关的硬件来完成。前述的计算机程序可以存储于一计算机可读存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;所述计算机可读存储介质可包括,但不限于,软盘、光盘、CD-ROM(只读光盘存储器)、磁光盘、ROM(只读存储器)、RAM(随机存取存储器)、EPROM(可擦除可编程只读存储器)、EEPROM(电可擦除可编程只读存储器)、磁卡或光卡、闪存、或适于存储机器可执行指令的其他类型的介质/机器可读介质。所述计算机可读存储介质可以是未接入计算机设备的产品,也可以是已接入计算机设备使用的部件。
在具体实现上,所述计算机程序为执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。
本发明的胰腺导管腺癌检测试剂盒的使用方法,如图1所示,包括如下步骤:
1)提取受检者血浆中cfDNA;2)将受检者血浆中cfDNA进行亚硫酸盐转化;3)将步骤2)获得的cfDNA进行解链,将单链cfDNA连接二代测序用接头序列;4)合成单链cfDNA的互补链,获得双链cfDNA;引物序列:CGCAGCACATCCCTTTCTCAC(SEQ ID NO.56)。5)采用前述胰腺导管腺癌检测试剂盒中的试剂对步骤4)获得的双链cfDNA进行扩增;6)将步骤5)获得的产物上连接索引序列,建立测序文库;7)进行文库测序。
在一种实施方式中,所述试剂盒的使用方法如下:
1.血浆cfDNA样本的提取。采用streck血液收集管收集受检者2ml全血样本,3天内离心分离血浆;采用QIAGEN QIAamp Circulating Nucleic Acid Kit试剂盒根据说明书提取cfDNA。
2.cfDNA转化:保留甲基化的鸟嘌呤脱氧核苷酸残基。使用亚硫酸氢盐转化试剂盒(如EZ DNA Methylation Kit,D5001,Zymo Research)对ctDNA进行转化并纯化。
1)制备转化(CT)反应混合物:混合以下试剂
试剂 | 体积(μL) |
H<sub>2</sub>O | 900 |
Dilution Buffer | 300 |
Resuspension Buffer | 50 |
2)强力振荡CT试剂10分钟。
3)将20ng cfDNA溶液用水调节体积至30μL。
4)在每个cfDNA样本中加入130μL混合好的CT试剂,振荡混匀。
5)使用以下条件孵育反应混合物:98摄氏度,10分钟→64摄氏度,2小时30分钟→4摄氏度保持恒温。
6)在孵育期间准备洗涤缓冲液:在标有“洗涤缓冲液”(Wash buffer)的塑料瓶中加入24毫升无水乙醇,充分混合后在瓶体上标注“已加入乙醇”。
7)在试剂盒提供的离心纯化柱中加入600μL“结合缓冲液”(Binding buffer);再加入150μL孵育后的转化产物并振荡混匀。
8)10000g下离心30秒;去除过柱的液体。
9)在离心纯化柱中加入100μL洗涤缓冲液;10000g下离心30秒;去除过柱的液体。
10)在离心纯化柱中加入200μL脱璜化缓冲液(Desulphonation buffer);在室温下孵育15分钟;在10000g下离心30秒;去除过柱的液体。
11)在离心纯化柱中加入200μL洗涤缓冲液;10000g下离心30秒;去除过柱的液体;重复一次
12)将离心纯化柱在10000g下离心30秒;去除残存液体;将离心纯化柱转入一个新的干净的1.5毫升离心管。
13)在离心纯化柱中加入16μL TE(0.1mM Tris-Cl,0.1mM EDTA)缓冲液;在室温下孵育1-5分钟;在10000g下离心30秒;在离心机最高速下离心60秒。
14)转移15μL过滤后液体至新的离心管,用于下一步反应
3.单链化:解链cfDNA,为接头连接做好准备。将转化后的cfDNA加热至95度,并保持3分钟,;从而将双链cfDNA解链为2根单链cfDNA。具体实验条件与参数参考发明专利申请CN201880040459.0。
4.去磷酸化并单链化:使用磷酸酶(如Antarctic Phosphatase,New EnglandBiolab)对转化并解链后的单链cfDNA进行去磷酸化处理,防止在接头连接步骤中接头序列连接在cfDNA的5’端(此类产物无法用于后续实验步骤);解链cfDNA,为接头连接做好准备。具体实验条件与参数参考发明专利申请CN201880040459.0。
1)制备去磷酸化(dephosphorylation)反应混合物:混合以下试剂
试剂 | 体积(μL) |
10x RNA ligase buffer | 4 |
Antarctic Phosphatase | 1 |
解链后cfDNA | 15 |
2)在前述转化产物中加入5μL去磷酸化反应混合物。
3)使用以下条件孵育反应混合物:37摄氏度,10分钟→95摄氏度2分钟;随即迅速转移至冰水浴中,静置不少于1分钟后继续下一实验步骤。
5.连接接头序列:将去磷酸化后的单链cfDNA与合成(如经由IDT合成)的接头序列混合(接头序列如SEQ ID NO:57和SEQ ID NO:58所示),使用连接酶(如T4 DNA ligase,NewEngland Biolab)进行连接反应,用于第二链合成和后续PCR扩增。具体实验条件与参数参考发明专利申请CN201880040459.0。
1)制备连接(ligation)反应混合物:混合以下试剂和底物
试剂 | 体积(μL) |
50x PEG4000 | 8 |
Splinted Adapter(10uM) | 2 |
ATP(10mM) | 2 |
H<sub>2</sub>O | 7 |
T4 DNA ligase(30wU/μL) | 1 |
总计 | 20 |
2)在前述去磷酸化反应产物中,加入20μL连接反应混合物。
3)使用以下条件孵育反应混合物:37摄氏度,2小时。
6.第二链合成:合成单链cfDNA的互补链在连接反应产物中加入dNTP和DNA聚合酶(如Phusion DNA聚合酶,ThermoFisher),以单链状态的连接产物为模板,合成cfDNA的ll互补链,增加后续半靶向扩增中PCR的底物量。具体实验条件与参数参考发明专利申请CN201880040459.0。
1)制备第二链合成(Second strand synthesis)反应混合物:混合以下试剂
试剂 | 体积(μL) |
第二链合成引物(SEQ ID NO.56) | 0.5 |
Phusion HF Buffer(10X) | 5 |
Phusion DNA polymerase | 1 |
EDTA(500mM) | 0.8 |
H<sub>2</sub>O | 1.7 |
总计 | 10 |
2)在前述去磷酸化反应产物中,加入20μL连接反应混合物。
3)使用以下条件孵育反应混合物:95摄氏度,30秒→62摄氏度,2分钟→68摄氏度,15分钟→4摄氏度保持恒温。
7.第二链合成产物纯化:对第二链合成产物进行纯化(如AMPure磁珠纯化,Beckman-Coulter)。具体实验条件与参数参考发明专利申请CN201880040459.0。
1)反应产物转移至80μL AMPure beads中,涡旋混匀;在室温中温育5分钟;低速短暂离心后,将离心管放置到磁力架上;至溶液澄清后去除上清。
2)用150μL 80%乙醇溶液,清洗磁珠两遍
3)去除残留乙醇溶液;在室温下晾干磁珠5分钟。
4)加入16μL H2O,室温下温育2-5分钟;将离心管放置到磁力架上直至溶液澄清;吸取15μL上清液转移到新的离心管中。
8.半靶向扩增:对PDAC诊断用靶点区域,即panel中探针结合的区域下游序列,进行特异扩增;同时在产物中加入后续扩增与测序所需通用序列。
所有探针作为PCR引物参与扩增反应,已提前按照相同浓度和体积混合为引物池。将第二链合成后的双链cfDNA产物与一定体积的引物池混合液混合,加入dNTP和DNA聚合酶(如Taq PCR Master Mix聚合酶预混合物,Qiagen)后,以第二链合成后双链cfDNA为模板进行扩增。具体实验条件与参数参考发明专利申请CN201880040459.0。
1)制备半靶向扩增反应混合物:混合以下试剂
2)在前述经纯化的第二链合成产物中,加入35μL半靶向扩增反应混合物。
3)设定以下PCR循环条件进行扩增:95摄氏度,3分钟→(95摄氏度,15秒→72摄氏度,90秒)X 20→72摄氏度,60秒→4摄氏度保持恒温
9.半靶向扩增产物纯化:对半靶向扩增产物进行纯化(如AMPure磁珠纯化,Beckman-Coulter)。具体实验条件与参数参考发明专利申请CN201880040459.0。
1)反应产物转移至80μL AMPure beads中,涡旋混匀;在室温中温育5分钟;低速短暂离心后,将离心管放置到磁力架上;至溶液澄清后去除上清。
2)用150μL 80%乙醇溶液,清洗磁珠两遍
3)去除残留乙醇溶液;在室温下晾干磁珠5分钟。
4)加入20μL H2O,室温下温育2-5分钟;将离心管放置到磁力架上直至溶液澄清;吸取19μL上清液转移到新的离心管中。
10.索引扩增:扩增半靶向扩增产物,并在产物内加入全长测序用序列和样品特异条形码。
11.将纯化后半靶向扩增产物与带有条形码的通用引物(Illumina的标准引物,具体为TruSeq Index PCR Primers)混合,加入dNTP和DNA聚合酶(如Phusion High-FidelityPCR预混合物,ThermoFisher),以半靶向扩增产物为模板进行扩增。对扩增产物进行纯化(如AMPure磁珠纯化,Beckman-Coulter)获得最终文库。具体实验条件与参数参考发明专利申请CN201880040459.0。
1)制备索引扩增反应混合物:混合以下试剂
试剂 | 体积(μL) |
Phusion High-Fidelity PCR Master Mix | 25 |
Unique Dual Index Primers | 4 |
H<sub>2</sub>O | 19 |
总计 | 48 |
2)取2μL前述经纯化的半靶向扩增产物,加入48μL半靶向扩增反应混合物。
3)设定以下PCR循环条件进行扩增:95摄氏度,3分钟→(98摄氏度,10秒→65摄氏度,75秒)X 10→65摄氏度,2分钟→4摄氏度保持恒温
12.索引扩增产物纯化:对索引扩增产物进行纯化(如AMPure磁珠纯化,Beckman-Coulter)。具体实验条件与参数参考发明专利申请CN201880040459.0。
1)反应产物转移至50μL AMPure beads中,涡旋混匀;在室温中温育5分钟;低速短暂离心后,将离心管放置到磁力架上;至溶液澄清后去除上清。
2)用150μL 80%乙醇溶液,清洗磁珠两遍
3)去除残留乙醇溶液;在室温下晾干磁珠5分钟。
4)加入25μL H2O,室温下温育2-5分钟;将离心管放置到磁力架上直至溶液澄清;吸取24μL上清液转移到新的离心管中,获得最终甲基化文库。
13.测序:文库用Illumina Nextseq 550测序仪进行双端测序,测序量为每个样本2~5M。
本发明基于二代测序进行检测,使用本发明的试剂盒进行检测后,获得的数据结果可结合生物信息学分析得出结论。
测序结果中所有CpG位点甲基化水平的均值,或多个CpG位点甲基化水平的均值,或单个CpG位点的甲基化水平组合都可以作为诊断胰腺导管腺癌良恶性的标志物。
进一步的,获得的测序结果的分析方法包括如下步骤:
在一种实施方式中,测序结果的分析方法包括如下步骤:
12.1数据的预处理:
1)使用Trim_galore v 0.6.0、cutadapt v2.1软件对Illumina Nextseq 550测序仪下机的双端150bp测序数据进行去接头处理。在Read 1的3’端去除接头序列为“AGATCGGAAGAGCACACGTCTGAACTCCAGTC”,(SEQ ID NO:57)在Read 2的3’端去除接头序列“AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT”,(SEQ ID NO:58)并去除两端测序质量值低于20的碱基。如果5’端有3bp的接头序列则去掉整条read。去接头后短于30个碱基的read也被去掉。
2)合并双端序列为单端序列使用Pear v0.9.6软件,合并至少重叠20个碱基的两端reads,如果合并之后的reads短于30个碱基则舍弃。
14.测序数据比对
1)首先将人类参考基因组序列(Hg19)使用Bismark软件分别进行胞嘧啶到胸腺嘧啶(CT)和腺嘌呤到鸟嘌呤(AG)转化,并且分别对转换后的基因组使用Bowtie2软件构建索引。
2)将预处理的数据同样进行CT和AG转化。
3)使用Bowtie2软件分别将转化后的序列比对到转化后的人类参考基因组,最短种子序列长度20,种子序列不允许错配。
15.提取甲基化信息:对于表1所示的每个标志物的CpG位点,根据上述比对结果,获取每个位点对应的甲基化水平。
16.将样本的甲基化水平合并成数据矩阵。
表1所示的差异化甲基化标志物的坐标是根据训练集样本分组发现的,具体步骤为:
Wilcox Mann-Whitney秩和检验,使用筛选出FDR小于0.05的差异甲基化位点。
1)使用metilene v0.2-7软件,根据panel中各序列中的单个CpG双核苷酸位置的甲基化水平数据,获取差异甲基化区段(命令行:metilene_linux64-M 100-m 3-t 30-a癌症分类名称-b正常组织样本分类名称甲基化水平矩阵>差异甲基化区域矩阵),要求同一个甲基化区段内差异甲基化位点不少于3个,相邻两个差异甲基化位点距离不超过100个碱基,差异甲基化区域中位点的平均甲基化水平的组间差异不小于0.1,将满足上述条件的差异甲基化位点组合成成候选差异甲基化区域。
2)在候选差异甲基化区域,对两组样本进行Wilcox Mann–Whitney U检验,计算两组样本在该区域的差异甲基化的统计显著性,选取FDR小于0.05的差异甲基化区域。
筛选出的差异化甲基化标志物的坐标见表1。上述甲基化标志物区域的甲基化水平在PDAC患者cfDNA中上升。每个标志物区域中的所有CpG位点的甲基化水平都可以通过简化甲基化测序的方法获得。每个区域中所有CpG位点甲基化水平的均值,或多个CpG位点甲基化水平的均值,或单个CpG位点的甲基化水平,即所有CpG位点甲基化的水平及其任意组合均可作为诊断PDAC的标志物。
17.代入PDAC诊断模型,评估受检者患有PDAC的可能
将步骤15中建立的测试集样本的PDAC生物标志物的甲基化水平数据矩阵,输入PDAC诊断模型,计算受检者患有PDAC的可能性。
输出结果形式:默认评分阈值为0.5,输出结果大于0.5则判定受检者样本中PDAC甲基化生物标志物水平超出正常水平,提示受检者患有PDAC。
所述PDAC诊断模型可以采用以下方法建立:
利用训练组的样本数据,使用构建支持向量机模型方法建立PDAC诊断模型。进一步的,利用测试组的样本数据,对模型进行验证。
具体的,为了建立基于cfDNA甲基化标志物水平的PDAC诊断模型,将入组样本按照比例划分训练组与测试组,所述入组样本数据包括已知是否患有PDAC的受检者的cfDNA甲基化水平的数据矩阵,其中未患有PDAC的受检者的数据为阴性对照样本,患有PDAC的受检者的数据为PDAC样本。
在训练组中,基于cfDNA差异甲基化标志物(即基因靶点tget_01至tget_55中任一个或多个的组合),使用构建支持向量机模型方法建立PDAC诊断模型,以在测试组中验证该组cfDNA甲基化标志物的分预测效果。
更为具体的,PDAC诊断模型建模步骤如下:
1)随机将入组样本分为训练组和测试组。
在一个具体实施方式中,入组样本共165例,其中样本1-123(123例)作为训练组,样本124-165(42例)作为测试组。
2)开发疾病分类系统:比对训练集中PDAC样本和阴性对照样本在甲基化标志物水平上的差异,使用支持向量机建模方法(Support Vector Machine,SVM),训练PDAC诊断模型。
具体训练过程如下:
a)使用R软件(v3.4.4)的caret软件包(6.0-84)构建训练模型,使用重复交叉验证的训练模式。
在一个具体实施方式中,采用如下命令行:ctrl<-trainControl(method="repeatedcv",number=3,repeats=10,allowParallel=TRUE)。其中method="repeatedcv"表示训练方法采用重复抽样交叉验证,number=3表示训练模型调参的折数,repeats=10表示交叉验证调参过程重复十次,allowParallel=TRUE表示并行计算。
b)使用caret软件包(6.0-84)和e1071(1.7-1)软件包,输入入组样本数据,构建SVM模型。
在一个具体实施方式中,采用如下命令行:mod_svm<-train(train_data,train_meta,method='svmRadialSigma',trControl=ctrl)其中,train_data表示入组样本数据,train_meta表示训练集的表型信息,method='svmRadialSigma'表示使用的模型是调节sigma值的SVM模型,trControl=ctrl表示训练模型的模式采用a步骤提到的训练模式。通过10次3折交叉验证确定最优的超参数:确定损失参数Cost=1,高斯核平滑参数sigma=0.00827717。
在构建模型的过程中,可赋予恶性类型及良性类型不同的编码,并设置阈值,由R软件、caret软件包、e1071训练模型,最终训练获得可基于评分阈值区分样本良性和恶性的PDAC诊断模型。
在一个具体实施方式中,将恶性类型编码为1,良性类型编码为0,由R软件(3.4.4)、caret软件包(6.0-84)、e1071(1.7-1)训练模型的过程中,默认将阈值设置为0.5。构建出的模型最终也以0.5为评分阈值对样本进良性和恶性区分,最终训练获得的模型即为PDAC诊断模型。
计算过程如下:
命令行:
svm_pred=predict(mod_svm,test_data,type="prob")
其中svm_pred表示测试集样本经过SVM预测模型得到的预测分数、mod_svm表示SVM预测模型、test_data表示入组样本数据、type="prob"表示输出预测分数。
实施例1
本实施例采用前述的试剂盒使用方法及测序结果的分析方法,使用基因靶点tget_01至tget_55,共55个靶点进行模型建立(所述临床样本源于协和医科大学附属医院提供的血浆样本,所述临床样本包括PDAC阳性和健康人的样本,样本数量为42份),结果如图2所示,测试组总体AUC为0.848,与实际结果比对,确定验证的准确性,评估该PDAC诊断模型的特异性和灵敏度。
结果表明,预测模型的灵敏度(预测中使用协和医科大学附属医院提供的42份PDAC和健康人对照组样本;在使用本实例中的靶点组合和模型预测所有样本后计算灵敏度和特异性;灵敏度计算公式如下:True positive/Total positive;这里Total positive定义为受检的PDAC样本总数,数量为23份;True positive定义在模型预测为PDAC阳性的样本中(数量为23份),属于真实的PDAC样本的数量,数量为17):73.8%;
特异性(样本和预测方法同灵敏度;特异性计算公式如下:True negative/Totalnegative;这里Total negative定义为受检的健康人对照样本总数,数量为19;Truenegative定义在模型预测为健康人的样本中(数量为19份),属于真实的健康人样本的数量,数量为16份):84.2%。
应用前述55个靶点获得的PDAC诊断模型,可以输入tget_01至tget_55这55个基因靶点中的任一种或多种组合,进行PDAC诊断。
本发明的检测产品的设计不是简单地将多个基因区域加和,而是在计算甲基化标志物的水平后,通过整合受检样本中不同甲基化靶点区域的测序结果;将甲基化标志物的水平进一步根据诊断模型,对每一个受检样本内PDAC信号水平定量评分;将评分与设定阈值比较后,评估每个受检样本提供者患有PDAC的可能性。
实施例2
本实施例提供表1中10条可用于诊断血浆样本中PDAC信号水平的探针及其在临床样本中的实测与分析结果。探针编号为:seq_01、seq_07、seq_08、seq_11、seq_12、seq_13、seq_49、seq_50、seq_51、seq_52。所述临床样本源于协和医科大学附属医院提供的血浆样本,所述临床样本包括PDAC阳性和健康人的样本,样本数量为165份。
其中,将临床样本分为检测训练组样本(样本1-123,123例)和测试组样本(样本124-165,42例);所述训练组样本用于进行模型建立;测试组样本用于对建立的模型进行验证
如图3所示,使用本实例中的10条探针检测训练组样本,对检测数据使用SVM方法建立PDAC诊断模型后,在训练组样本中交叉验证该诊断模型的AUC值为1.0,表明该模型准确率高。
使用本实例中的10条探针获得的PDAC诊断模型,对测试组样本进行打分后,其分值在PDAC和对照组样本中的分布如图4所示,表明在123例训练组样本中,使用上述10条探针检测对应的10个靶点之后,将靶点信号代入SVM模型计算,得出每个的样本的数值;然后将PDAC样本和normal样本的数值的分布以小提琴图的方式展示出来。从结果中可以看到,PDAC样本的数值总体显著大于normal样本的数值。如图5所示,使用使用本实施例中的10条探针获得的SVM模型,对测试组样本进行验证后AUC值为0.85,表明这10个探针序列可以作为PDAC诊断序列。
以上所述,仅为本发明的较佳实施例,并非对本发明任何形式上和实质上的限制,应当指出,对于本技术领域的普通技术人员,在不脱离本发明方法的前提下,还将可以做出若干改进和补充,这些改进和补充也应视为本发明的保护范围。凡熟悉本专业的技术人员,在不脱离本发明的精神和范围的情况下,当可利用以上所揭示的技术内容而做出的些许更动、修饰与演变的等同变化,均为本发明的等效实施例;同时,凡依据本发明的实质技术对上述实施例所作的任何等同变化的更动、修饰与演变,均仍属于本发明的技术方案的范围内。
序列表
<110> 中国医学科学院北京协和医院
<120> 胰腺导管腺癌的DNA甲基化标志物及其应用
<160> 58
<170> SIPOSequenceListing 1.0
<210> 1
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
gactggagtt cagacgtgtg ctcttccgat ctaattccta atcccccacc cacccacca 59
<210> 2
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
gactggagtt cagacgtgtg ctcttccgat ctacaacaaa tttacccaac acatctcaa 59
<210> 3
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
gactggagtt cagacgtgtg ctcttccgat ctaccaaccc ccctcttctc acccactaa 59
<210> 4
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
gactggagtt cagacgtgtg ctcttccgat ctacctcact aatacacccc aaccaaccc 59
<210> 5
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
gactggagtt cagacgtgtg ctcttccgat ctcacaaaaa acaaaccaaa ccctcccaa 59
<210> 6
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
gactggagtt cagacgtgtg ctcttccgat ctcacatcct cacaactcaa ctccctccc 59
<210> 7
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
gactggagtt cagacgtgtg ctcttccgat ctccaaacaa accaccctca ccccaccct 59
<210> 8
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
gactggagtt cagacgtgtg ctcttccgat ctccaaatca ttcccaatcc caccaaaac 59
<210> 9
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
gactggagtt cagacgtgtg ctcttccgat ctccacactc caaataaaaa caaacccac 59
<210> 10
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
gactggagtt cagacgtgtg ctcttccgat ctcctcccca ccaccaaaca cactctacc 59
<210> 11
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
gactggagtt cagacgtgtg ctcttccgat ctctcatacc cacccataca ccccaattc 59
<210> 12
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
gactggagtt cagacgtgtg ctcttccgat cttacccaac atcatcccca aacttccat 59
<210> 13
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
gactggagtt cagacgtgtg ctcttccgat cttcctcctc catccaaata ccttccaca 59
<210> 14
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
gactggagtt cagacgtgtg ctcttccgat ctgggtgggg tttggagagg gagagaagg 59
<210> 15
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
gactggagtt cagacgtgtg ctcttccgat ctggtagtgt agggaagggt aaggtggtg 59
<210> 16
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
gactggagtt cagacgtgtg ctcttccgat ctgtaggagt gttggtgggg gtggtttta 59
<210> 17
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
gactggagtt cagacgtgtg ctcttccgat ctgttgagtg attgggttgg gggtaagag 59
<210> 18
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
gactggagtt cagacgtgtg ctcttccgat ctgttggtgt ttaatgttgg ggtttgggg 59
<210> 19
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
gactggagtt cagacgtgtg ctcttccgat ctgtttgggg gttagggagt ggattgggg 59
<210> 20
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
gactggagtt cagacgtgtg ctcttccgat cttggtgttt agagttggtg ggagaggtg 59
<210> 21
<211> 60
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
gactggagtt cagacgtgtg ctcttccgat cttggttggt agggatgggt ttaatggtgt 60
<210> 22
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
gactggagtt cagacgtgtg ctcttccgat cttgtatggg atttaaggtg ttgtgtgga 59
<210> 23
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
gactggagtt cagacgtgtg ctcttccgat cttttggggg ttggaaggaa gggtgtagg 59
<210> 24
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
gactggagtt cagacgtgtg ctcttccgat cttttggttt ggttgggatt tggtgttgg 59
<210> 25
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
gactggagtt cagacgtgtg ctcttccgat cttttgtgag gtggtagagg agatgtggg 59
<210> 26
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
gactggagtt cagacgtgtg ctcttccgat ctttttggtg ttggttatgt gttgggtga 59
<210> 27
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
gactggagtt cagacgtgtg ctcttccgat ctaggtggag gagtgatggg gggatataa 59
<210> 28
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
gactggagtt cagacgtgtg ctcttccgat ctagtggtgg gaaagaggtt tgagggaag 59
<210> 29
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
gactggagtt cagacgtgtg ctcttccgat ctagtgttag gagggggtga gagtgttgt 59
<210> 30
<211> 63
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
gactggagtt cagacgtgtg ctcttccgat ctgggatttt gagggtggat agatgtttaa 60
ggt 63
<210> 31
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
gactggagtt cagacgtgtg ctcttccgat ctggttgagg tttggagatg tatgtgggt 59
<210> 32
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
gactggagtt cagacgtgtg ctcttccgat ctgtaggtgg tttggggtta tattgtggt 59
<210> 33
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
gactggagtt cagacgtgtg ctcttccgat ctgttggggt tttggttgtg gaaaggatg 59
<210> 34
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
gactggagtt cagacgtgtg ctcttccgat ctgtttgtgg gggaagattt tttgtgggg 59
<210> 35
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
gactggagtt cagacgtgtg ctcttccgat cttagtgtgt tggtggtggg ggagtattt 59
<210> 36
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
gactggagtt cagacgtgtg ctcttccgat cttggatgtt tagtttgggg ttgtgggga 59
<210> 37
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
gactggagtt cagacgtgtg ctcttccgat cttgggtggg aagaggatgt ttgaaggtt 59
<210> 38
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
gactggagtt cagacgtgtg ctcttccgat cttgtttggg aaatgtaggt tttttggga 59
<210> 39
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
gactggagtt cagacgtgtg ctcttccgat ctttatagta tagtgttgag gtgggggtg 59
<210> 40
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
gactggagtt cagacgtgtg ctcttccgat ctttgatttg aggtgttaga gatgggtgg 59
<210> 41
<211> 62
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
gactggagtt cagacgtgtg ctcttccgat ctttggggtt ggttatgttt tatagatggt 60
tt 62
<210> 42
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
gactggagtt cagacgtgtg ctcttccgat ctttttggtt tgtttgagga tgtgttggt 59
<210> 43
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
gactggagtt cagacgtgtg ctcttccgat ctttttggtt tgtttgagga tgtgttggt 59
<210> 44
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
gactggagtt cagacgtgtg ctcttccgat cttttttgtg gtttgttggg aggaagtgg 59
<210> 45
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
gactggagtt cagacgtgtg ctcttccgat ctttttttgt tggagtgtgt ggggagtag 59
<210> 46
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 46
gactggagtt cagacgtgtg ctcttccgat ctaaacccaa aacaactcac ccacaactc 59
<210> 47
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 47
gactggagtt cagacgtgtg ctcttccgat ctaaacccac ccacctacat accaccccc 59
<210> 48
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 48
gactggagtt cagacgtgtg ctcttccgat ctaacatcac tcccaacact caaaaacca 59
<210> 49
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 49
gactggagtt cagacgtgtg ctcttccgat ctaactcaac ctcactttcc ctaccacct 59
<210> 50
<211> 60
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 50
gactggagtt cagacgtgtg ctcttccgat ctaattcccc tctatcccac ctacttccct 60
<210> 51
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 51
gactggagtt cagacgtgtg ctcttccgat ctagaggtgt tggggagttt tgggtttga 59
<210> 52
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 52
gactggagtt cagacgtgtg ctcttccgat ctagggagag gtgttggggg ttaatggtg 59
<210> 53
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 53
gactggagtt cagacgtgtg ctcttccgat ctagggttag aggttgttgt ggggagaga 59
<210> 54
<211> 60
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 54
gactggagtt cagacgtgtg ctcttccgat ctgggagtgg gaagtagatg ttgtttgtgt 60
<210> 55
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 55
gactggagtt cagacgtgtg ctcttccgat ctggggaaga ggggggttgg aatgggatt 59
<210> 56
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 56
cgcagcacat ccctttctca c 21
<210> 57
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 57
agatcggaag agcacacgtc tgaactccag tc 32
<210> 58
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 58
agatcggaag agcgtcgtgt agggaaagag tgt 33
Claims (10)
2.根据权利要求1所述的用途,其特征在于,还包括以下特征中的一项或多项:
1)所述胰腺导管腺癌检测产品用于胰腺导管腺癌的判断、诊断;
2)所述胰腺导管腺癌检测产品用于检测样本中的DNA,所述样本选自血浆;
3)所述胰腺导管腺癌检测产品包括以下特征中的一项或多项:(1)特异性探查tget_01甲基化水平的物质、(2)特异性探查tget_02甲基化水平的物质、(3)特异性探查tget_03甲基化水平的物质、(4)特异性探查tget_04甲基化水平的物质、(5)特异性探查tget_05甲基化水平的物质、(6)特异性探查tget_06甲基化水平的物质、(7)特异性探查tget_07甲基化水平的物质、(8)特异性探查tget_08甲基化水平的物质、(9)特异性探查tget_09甲基化水平的物质、(10)特异性探查tget_10甲基化水平的物质、(11)特异性探查tget_11甲基化水平的物质、(12)特异性探查tget_12甲基化水平的物质、(13)特异性探查tget_13甲基化水平的物质、(14)特异性探查tget_14甲基化水平的物质、(15)特异性探查tget_15甲基化水平的物质、(16)特异性探查tget_16甲基化水平的物质、(17)特异性探查tget_17甲基化水平的物质和(18)特异性探查tget_18甲基化水平的物质、(19)特异性探查tget_19甲基化水平的物质、(20)特异性探查tget_20甲基化水平的物质、(21)特异性探查tget_21甲基化水平的物质、(22)特异性探查tget_22甲基化水平的物质、(23)特异性探查tget_23甲基化水平的物质、(24)特异性探查tget_24甲基化水平的物质、(25)特异性探查tget_25甲基化水平的物质、(26)特异性探查tget_26甲基化水平的物质、(27)特异性探查tget_27甲基化水平的物质、(28)特异性探查tget_28甲基化水平的物质、(29)特异性探查tget_29甲基化水平的物质、(30)特异性探查tget_30甲基化水平的物质、(31)特异性探查tget_31甲基化水平的物质、(32)特异性探查tget_32甲基化水平的物质、(33)特异性探查tget_33甲基化水平的物质、(34)特异性探查tget_34甲基化水平的物质、(35)特异性探查tget_35甲基化水平的物质、(36)特异性探查tget_36甲基化水平的物质、(37)特异性探查tget_37甲基化水平的物质、(38)特异性探查tget_38甲基化水平的物质、(39)特异性探查tget_39甲基化水平的物质、(40)特异性探查tget_40甲基化水平的物质、(41)特异性探查tget_41甲基化水平的物质、(42)特异性探查tget_42甲基化水平的物质、(43)特异性探查tget_43甲基化水平的物质、(44)特异性探查tget_44甲基化水平的物质、(45)特异性探查tget_45甲基化水平的物质;可选择地,还包括以下特征中任一项或多项的组合:(46)特异性探查tget_46甲基化水平的物质、(47)特异性探查tget_47甲基化水平的物质、(48)特异性探查tget_48甲基化水平的物质、(49)特异性探查tget_49甲基化水平的物质、(50)特异性探查tget_50甲基化水平的物质、(51)特异性探查tget_51甲基化水平的物质、(52)特异性探查tget_52甲基化水平的物质、(53)特异性探查tget_53甲基化水平的物质、(54)特异性探查tget_54甲基化水平的物质、(55)特异性探查tget_55甲基化水平的物质。
3.根据权利要求2所述的用途,其特征在于,还包括以下特征中的一项或多项:
(1)所述特异性探查tget_01甲基化水平的物质包括tget_01的探针;
(2)所述特异性探查tget_02甲基化水平的物质包括tget_02的探针;
(3)所述特异性探查tget_03甲基化水平的物质包括tget_03的探针;
(4)所述特异性探查tget_04甲基化水平的物质包括tget_04的探针;
(5)所述特异性探查tget_05甲基化水平的物质包括tget_05的探针;
(6)所述特异性探查tget_06甲基化水平的物质包括tget_06的探针;
(7)所述特异性探查tget_07甲基化水平的物质包括tget_07的探针;
(8)所述特异性探查tget_08甲基化水平的物质包括tget_08的探针;
(9)所述特异性探查tget_09甲基化水平的物质包括tget_09的探针;
(10)所述特异性探查tget_10甲基化水平的物质包括tget_10的探针;
(11)所述特异性探查tget_11甲基化水平的物质包括tget_11的探针;
(12)所述特异性探查tget_12甲基化水平的物质包括tget_12的探针;
(13)所述特异性探查tget_13甲基化水平的物质包括tget_13的探针;
(14)所述特异性探查tget_14甲基化水平的物质包括tget_14的探针;
(15)所述特异性探查tget_15甲基化水平的物质包括tget_15的探针;
(16)所述特异性探查tget_16甲基化水平的物质包括tget_16的探针;
(17)所述特异性探查tget_17甲基化水平的物质包括tget_17的探针;
(18)所述特异性探查tget_18甲基化水平的物质包括tget_18的探针;
(19)所述特异性探查tget_19甲基化水平的物质包括tget_19的探针;
(20)所述特异性探查tget_20甲基化水平的物质包括tget_20的探针;
(21)所述特异性探查tget_21甲基化水平的物质包括tget_21的探针;
(22)所述特异性探查tget_22甲基化水平的物质包括tget_22的探针;
(23)所述特异性探查tget_23甲基化水平的物质包括tget_23的探针;
(24)所述特异性探查tget_24甲基化水平的物质包括tget_24的探针;
(25)所述特异性探查tget_25甲基化水平的物质包括tget_25的探针;
(26)所述特异性探查tget_26甲基化水平的物质包括tget_26的探针;
(27)所述特异性探查tget_27甲基化水平的物质包括tget_27的探针;
(28)所述特异性探查tget_28甲基化水平的物质包括tget_28的探针;
(29)所述特异性探查tget_29甲基化水平的物质包括tget_29的探针;
(30)所述特异性探查tget_30甲基化水平的物质包括tget_30的探针;
(31)所述特异性探查tget_31甲基化水平的物质包括tget_31的探针;
(32)所述特异性探查tget_32甲基化水平的物质包括tget_32的探针;
(33)所述特异性探查tget_33甲基化水平的物质包括tget_33的探针;
(34)所述特异性探查tget_34甲基化水平的物质包括tget_34的探针;
(35)所述特异性探查tget_35甲基化水平的物质包括tget_35的探针;
(36)所述特异性探查tget_36甲基化水平的物质包括tget_36的探针;
(37)所述特异性探查tget_37甲基化水平的物质包括tget_37的探针;
(38)所述特异性探查tget_38甲基化水平的物质包括tget_38的探针;
(39)所述特异性探查tget_39甲基化水平的物质包括tget_39的探针;
(40)所述特异性探查tget_40甲基化水平的物质包括tget_40的探针;
(41)所述特异性探查tget_41甲基化水平的物质包括tget_41的探针;
(42)所述特异性探查tget_42甲基化水平的物质包括tget_42的探针;
(43)所述特异性探查tget_43甲基化水平的物质包括tget_43的探针;
(44)所述特异性探查tget_44甲基化水平的物质包括tget_44的探针;
(45)所述特异性探查tget_45甲基化水平的物质包括tget_45的探针;
可选择地,还包括以下特征中任一项或多项的组合:
(46)所述特异性探查tget_46甲基化水平的物质包括tget_46的探针;
(47)所述特异性探查tget_47甲基化水平的物质包括tget_47的探针;
(48)所述特异性探查tget_48甲基化水平的物质包括tget_48的探针;
(49)所述特异性探查tget_49甲基化水平的物质包括tget_49的探针;
(50)所述特异性探查tget_50甲基化水平的物质包括tget_50的探针;
(51)所述特异性探查tget_51甲基化水平的物质包括tget_51的探针;
(52)所述特异性探查tget_52甲基化水平的物质包括tget_52的探针;
(53)所述特异性探查tget_53甲基化水平的物质包括tget_53的探针;
(54)所述特异性探查tget_54甲基化水平的物质包括tget_54的探针;
(55)所述特异性探查tget_55甲基化水平的物质包括tget_55的探针。
4.根据权利要求3所述的用途,其特征在于,包括以下特征中的一项或多项:
(1)所述tget_01的探针的核苷酸序列如SEQ ID NO.1所示;
(2)所述tget_02的探针的核苷酸序列如SEQ ID NO.2所示;
(3)所述tget_03的探针的核苷酸序列如SEQ ID NO.3所示;
(4)所述tget_04的探针的核苷酸序列如SEQ ID NO.4所示;
(5)所述tget_05的探针的核苷酸序列如SEQ ID NO.5所示;
(6)所述tget_06的探针的核苷酸序列如SEQ ID NO.6所示;
(7)所述tget_07的探针的核苷酸序列如SEQ ID NO.7所示;
(8)所述tget_08的探针的核苷酸序列如SEQ ID NO.8所示;
(9)所述tget_09的探针的核苷酸序列如SEQ ID NO.9所示;
(10)所述tget_10的探针的核苷酸序列如SEQ ID NO.10所示;
(11)所述tget_11的探针的核苷酸序列如SEQ ID NO.11所示;
(12)所述tget_12的探针的核苷酸序列如SEQ ID NO.12所示;
(13)所述tget_13的探针的核苷酸序列如SEQ ID NO.13所示;
(14)所述tget_14的探针的核苷酸序列如SEQ ID NO.14所示;
(15)所述tget_15的探针的核苷酸序列如SEQ ID NO.15所示;
(16)所述tget_16的探针的核苷酸序列如SEQ ID NO.16所示;
(17)所述tget_17的探针的核苷酸序列如SEQ ID NO.17所示;
(18)所述tget_18的探针的核苷酸序列如SEQ ID NO.18所示;
(19)所述tget_19的探针的核苷酸序列如SEQ ID NO.19所示;
(20)所述tget_20的探针的核苷酸序列如SEQ ID NO.20所示;
(21)所述tget_21的探针的核苷酸序列如SEQ ID NO.21所示;
(22)所述tget_22的探针的核苷酸序列如SEQ ID NO.22所示;
(23)所述tget_23的探针的核苷酸序列如SEQ ID NO.23所示;
(24)所述tget_24的探针的核苷酸序列如SEQ ID NO.24所示;
(25)所述tget_25的探针的核苷酸序列如SEQ ID NO.25所示;
(26)所述tget_26的探针的核苷酸序列如SEQ ID NO.26所示;
(27)所述tget_27的探针的核苷酸序列如SEQ ID NO.27所示;
(28)所述tget_28的探针的核苷酸序列如SEQ ID NO.28所示;
(29)所述tget_29的探针的核苷酸序列如SEQ ID NO.29所示;
(30)所述tget_30的探针的核苷酸序列如SEQ ID NO.30所示;
(31)所述tget_31的探针的核苷酸序列如SEQ ID NO.31所示;
(32)所述tget_32的探针的核苷酸序列如SEQ ID NO.32所示;
(33)所述tget_33的探针的核苷酸序列如SEQ ID NO.33所示;
(34)所述tget_34的探针的核苷酸序列如SEQ ID NO.34所示;
(35)所述tget_35的探针的核苷酸序列如SEQ ID NO.35所示;
(36)所述tget_36的探针的核苷酸序列如SEQ ID NO.36所示;
(37)所述tget_37的探针的核苷酸序列如SEQ ID NO.37所示;
(38)所述tget_38的探针的核苷酸序列如SEQ ID NO.38所示;
(39)所述tget_39的探针的核苷酸序列如SEQ ID NO.39所示;
(40)所述tget_40的探针的核苷酸序列如SEQ ID NO.40所示;
(41)所述tget_41的探针的核苷酸序列如SEQ ID NO.41所示;
(42)所述tget_42的探针的核苷酸序列如SEQ ID NO.42所示;
(43)所述tget_43的探针的核苷酸序列如SEQ ID NO.43所示;
(44)所述tget_44的探针的核苷酸序列如SEQ ID NO.44所示;
(45)所述tget_45的探针的核苷酸序列如SEQ ID NO.45所示;
可选择地,还包括以下特征中任一项或多项的组合:
(46)所述tget_46的探针的核苷酸序列如SEQ ID NO.46所示;
(47)所述tget_47的探针的核苷酸序列如SEQ ID NO.47所示;
(48)所述tget_48的探针的核苷酸序列如SEQ ID NO.48所示;
(49)所述tget_49的探针的核苷酸序列如SEQ ID NO.49所示;
(50)所述tget_50的探针的核苷酸序列如SEQ ID NO.50所示;
(51)所述tget_51的探针的核苷酸序列如SEQ ID NO.51所示;
(52)所述tget_52的探针的核苷酸序列如SEQ ID NO.52所示;
(53)所述tget_53的探针的核苷酸序列如SEQ ID NO.53所示;
(54)所述tget_54的探针的核苷酸序列如SEQ ID NO.54所示;
(55)所述tget_55的探针的核苷酸序列如SEQ ID NO.55所示。
5.一种胰腺导管腺癌检测用探针组合,其特征在于,所述探针组合包括以下特征中的一项或多项:
(1)tget_01的探针;(2)tget_02的探针;(3)tget_03的探针;(4)tget_04的探针;(5)tget_05的探针;(6)tget_06的探针;(7)tget_07的探针;(8)tget_08的探针;(9)tget_09的探针;(10)tget_10的探针;(11)tget_11的探针;(12)tget_12的探针;(13)tget_13的探针;(14)tget_14的探针;(15)tget_15的探针;(16)tget_16的探针;(17)tget_17的探针;(18)tget_18的探针;(19)tget_19的探针;(20)tget_20的探针;(21)tget_21的探针;(22)tget_22的探针;(23)tget_23的探针;(24)tget_24的探针;(25)tget_25的探针;(26)tget_26的探针;(27)tget_27的探针;(28)tget_28的探针;(29)tget_29的探针;(30)tget_30的探针;(31)tget_31的探针;(32)tget_32的探针;(33)tget_33的探针;(34)tget_34的探针;(35)tget_35的探针;(36)tget_36的探针;(37)tget_37的探针;(38)tget_38的探针;(39)tget_39的探针;(40)tget_40的探针;(41)tget_41的探针;(42)tget_42的探针;(43)tget_43的探针;(44)tget_44的探针;(45)tget_45的探针;可选的,还包括以下特征中的一项或多项:(46)tget_46的探针;(47)tget_47的探针;(48)tget_48的探针;(49)tget_49的探针;(50)tget_50的探针;(51)tget_51的探针;(52)tget_52的探针;(53)tget_53的探针;(54)tget_54的探针;(55)tget_55的探针。
6.如权利要求5所述的胰腺导管腺癌检测用探针组合,其特征在于,包括以下特征中的一项或多项:
(1)所述tget_01的探针的核苷酸序列如SEQ ID NO.1所示;
(2)所述tget_02的探针的核苷酸序列如SEQ ID NO.2所示;
(3)所述tget_03的探针的核苷酸序列如SEQ ID NO.3所示;
(4)所述tget_04的探针的核苷酸序列如SEQ ID NO.4所示;
(5)所述tget_05的探针的核苷酸序列如SEQ ID NO.5所示;
(6)所述tget_06的探针的核苷酸序列如SEQ ID NO.6所示;
(7)所述tget_07的探针的核苷酸序列如SEQ ID NO.7所示;
(8)所述tget_08的探针的核苷酸序列如SEQ ID NO.8所示;
(9)所述tget_09的探针的核苷酸序列如SEQ ID NO.9所示;
(10)所述tget_10的探针的核苷酸序列如SEQ ID NO.10所示;
(11)所述tget_11的探针的核苷酸序列如SEQ ID NO.11所示;
(12)所述tget_12的探针的核苷酸序列如SEQ ID NO.12所示;
(13)所述tget_13的探针的核苷酸序列如SEQ ID NO.13所示;
(14)所述tget_14的探针的核苷酸序列如SEQ ID NO.14所示;
(15)所述tget_15的探针的核苷酸序列如SEQ ID NO.15所示;
(16)所述tget_16的探针的核苷酸序列如SEQ ID NO.16所示;
(17)所述tget_17的探针的核苷酸序列如SEQ ID NO.17所示;
(18)所述tget_18的探针的核苷酸序列如SEQ ID NO.18所示;
(19)所述tget_19的探针的核苷酸序列如SEQ ID NO.19所示;
(20)所述tget_20的探针的核苷酸序列如SEQ ID NO.20所示;
(21)所述tget_21的探针的核苷酸序列如SEQ ID NO.21所示;
(22)所述tget_22的探针的核苷酸序列如SEQ ID NO.22所示;
(23)所述tget_23的探针的核苷酸序列如SEQ ID NO.23所示;
(24)所述tget_24的探针的核苷酸序列如SEQ ID NO.24所示;
(25)所述tget_25的探针的核苷酸序列如SEQ ID NO.25所示;
(26)所述tget_26的探针的核苷酸序列如SEQ ID NO.26所示;
(27)所述tget_27的探针的核苷酸序列如SEQ ID NO.27所示;
(28)所述tget_28的探针的核苷酸序列如SEQ ID NO.28所示;
(29)所述tget_29的探针的核苷酸序列如SEQ ID NO.29所示;
(30)所述tget_30的探针的核苷酸序列如SEQ ID NO.30所示;
(31)所述tget_31的探针的核苷酸序列如SEQ ID NO.31所示;
(32)所述tget_32的探针的核苷酸序列如SEQ ID NO.32所示;
(33)所述tget_33的探针的核苷酸序列如SEQ ID NO.33所示;
(34)所述tget_34的探针的核苷酸序列如SEQ ID NO.34所示;
(35)所述tget_35的探针的核苷酸序列如SEQ ID NO.35所示;
(36)所述tget_36的探针的核苷酸序列如SEQ ID NO.36所示;
(37)所述tget_37的探针的核苷酸序列如SEQ ID NO.37所示;
(38)所述tget_38的探针的核苷酸序列如SEQ ID NO.38所示;
(39)所述tget_39的探针的核苷酸序列如SEQ ID NO.39所示;
(40)所述tget_40的探针的核苷酸序列如SEQ ID NO.40所示;
(41)所述tget_41的探针的核苷酸序列如SEQ ID NO.41所示;
(42)所述tget_42的探针的核苷酸序列如SEQ ID NO.42所示;
(43)所述tget_43的探针的核苷酸序列如SEQ ID NO.43所示;
(44)所述tget_44的探针的核苷酸序列如SEQ ID NO.44所示;
(45)所述tget_45的探针的核苷酸序列如SEQ ID NO.45所示;
可选择地,还包括以下特征中任一项或多项的组合:
(46)所述tget_46的探针的核苷酸序列如SEQ ID NO.46所示;
(47)所述tget_47的探针的核苷酸序列如SEQ ID NO.47所示;
(48)所述tget_48的探针的核苷酸序列如SEQ ID NO.48所示;
(49)所述tget_49的探针的核苷酸序列如SEQ ID NO.49所示;
(50)所述tget_50的探针的核苷酸序列如SEQ ID NO.50所示;
(51)所述tget_51的探针的核苷酸序列如SEQ ID NO.51所示;
(52)所述tget_52的探针的核苷酸序列如SEQ ID NO.52所示;
(53)所述tget_53的探针的核苷酸序列如SEQ ID NO.53所示;
(54)所述tget_54的探针的核苷酸序列如SEQ ID NO.54所示;
(55)所述tget_55的探针的核苷酸序列如SEQ ID NO.55所示。
7.一种胰腺导管腺癌检测用试剂盒,其特征在于,所述试剂盒中包括权利要求5-6任一所述的胰腺导管腺癌检测用探针组合。
8.一种胰腺导管腺癌诊断用装置,包括:
样本PDAC生物标志物的甲基化水平数据矩阵形成模块,用于将样本PDAC生物标志物的甲基化水平形成数据矩阵,所述样本PDAC生物标志物选自权利要求1所述用途中的所述胰腺导管腺癌的DNA甲基化标志物;
PDAC诊断模块,用于将样本PDAC生物标志物的甲基化水平数据矩阵输入PDAC诊断模型,计算受检者患有PDAC的可能性。
9.如权利要求8所述的胰腺导管腺癌诊断用装置,其特征在于,所述样本PDAC生物标志物的甲基化水平为采用权利要求5或6所述的胰腺导管腺癌检测用探针组合或权利要求7所述试剂盒并利用二代测序检测分析获得。
10.一种设备,所述设备选自计算机可读存储介质或计算机处理设备或电子终端;所述计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现胰腺导管腺癌诊断方法,所述方法包括以下步骤:
S1,将样本PDAC生物标志物的甲基化水平形成数据矩阵,所述样本PDAC生物标志物选自权利要求1中所述的胰腺导管腺癌的DNA甲基化标志物;
S2,将样本PDAC生物标志物的甲基化水平数据矩阵输入PDAC诊断模型,计算受检者患有PDAC的可能性;
所述计算机处理设备,包括处理器及前述的计算机可读存储介质,所述处理器执行所述计算机可读存储介质上的计算机程序,实现所述胰腺导管腺癌诊断方法;
所述电子终端,包括:处理器、存储器、及通信器;所述存储器用于存储计算机程序,所述通信器用于与外部设备进行通信连接,所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行所述胰腺导管腺癌诊断方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011005627.8A CN114250298A (zh) | 2020-09-23 | 2020-09-23 | 胰腺导管腺癌的dna甲基化标志物及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011005627.8A CN114250298A (zh) | 2020-09-23 | 2020-09-23 | 胰腺导管腺癌的dna甲基化标志物及其应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114250298A true CN114250298A (zh) | 2022-03-29 |
Family
ID=80788549
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011005627.8A Pending CN114250298A (zh) | 2020-09-23 | 2020-09-23 | 胰腺导管腺癌的dna甲基化标志物及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114250298A (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120040861A1 (en) * | 2010-08-13 | 2012-02-16 | Somalogic, Inc. | Pancreatic Cancer Biomarkers and Uses Thereof |
WO2013048174A2 (ko) * | 2011-09-28 | 2013-04-04 | 사회복지법인 삼성생명공익재단 | Ca19-9, 카텝신 d 및 매트릭스 메탈로프로틴나제-7의 측정수단을 포함하는 췌장암 진단용 키트 |
US20130273543A1 (en) * | 2010-12-21 | 2013-10-17 | Decode Genetics Ehf. | Genetic variants useful for risk assessment of thyroid cancer |
US20160223555A1 (en) * | 2013-06-20 | 2016-08-04 | The Trustees Of The University Of Pennsylvania | Methods for diagnosing pancreatic cancer |
US20160348182A1 (en) * | 2014-02-04 | 2016-12-01 | Beth Israel Deaconess Medical Center, Inc. | Methods and kits for the diagnosis and treatment of pancreatic cancer |
CN106834426A (zh) * | 2015-12-04 | 2017-06-13 | 博尔诚(北京)科技有限公司 | 用于检测胰腺癌的组合物及其用途 |
CN107385050A (zh) * | 2017-08-04 | 2017-11-24 | 上海易毕恩生物技术有限公司 | 用于检测胰腺癌的基因标志物、试剂盒及胰腺癌检测方法 |
CN108949976A (zh) * | 2018-07-06 | 2018-12-07 | 中国医学科学院北京协和医院 | C12orf70和/或C17orf107基因在胰腺癌检测产品中的用途 |
CN109777874A (zh) * | 2019-01-29 | 2019-05-21 | 上海长海医院 | 一种适用于胰腺导管腺癌诊断及预后判断的血浆外泌体miRNA标志物及应用 |
CN110770354A (zh) * | 2017-04-19 | 2020-02-07 | 鹍远基因公司 | 用于文库构建和序列分析的组合物和方法 |
CN111254194A (zh) * | 2020-01-13 | 2020-06-09 | 东南大学 | 基于cfDNA的测序及数据分析的癌症相关生物标记及其在cfDNA样品分类中的应用 |
US20200255904A1 (en) * | 2017-09-29 | 2020-08-13 | Arizona Board Of Regents On Behalf Of The University Of Arizona | Dna methylation biomarkers for cancer diagnosing |
CN112176057A (zh) * | 2020-09-23 | 2021-01-05 | 中国人民解放军海军军医大学第一附属医院 | 利用CpG位点甲基化水平检测胰腺导管腺癌的标志物及其应用 |
-
2020
- 2020-09-23 CN CN202011005627.8A patent/CN114250298A/zh active Pending
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120040861A1 (en) * | 2010-08-13 | 2012-02-16 | Somalogic, Inc. | Pancreatic Cancer Biomarkers and Uses Thereof |
US20130273543A1 (en) * | 2010-12-21 | 2013-10-17 | Decode Genetics Ehf. | Genetic variants useful for risk assessment of thyroid cancer |
WO2013048174A2 (ko) * | 2011-09-28 | 2013-04-04 | 사회복지법인 삼성생명공익재단 | Ca19-9, 카텝신 d 및 매트릭스 메탈로프로틴나제-7의 측정수단을 포함하는 췌장암 진단용 키트 |
US20160223555A1 (en) * | 2013-06-20 | 2016-08-04 | The Trustees Of The University Of Pennsylvania | Methods for diagnosing pancreatic cancer |
US20160348182A1 (en) * | 2014-02-04 | 2016-12-01 | Beth Israel Deaconess Medical Center, Inc. | Methods and kits for the diagnosis and treatment of pancreatic cancer |
CN106834426A (zh) * | 2015-12-04 | 2017-06-13 | 博尔诚(北京)科技有限公司 | 用于检测胰腺癌的组合物及其用途 |
CN110770354A (zh) * | 2017-04-19 | 2020-02-07 | 鹍远基因公司 | 用于文库构建和序列分析的组合物和方法 |
CN107385050A (zh) * | 2017-08-04 | 2017-11-24 | 上海易毕恩生物技术有限公司 | 用于检测胰腺癌的基因标志物、试剂盒及胰腺癌检测方法 |
US20200255904A1 (en) * | 2017-09-29 | 2020-08-13 | Arizona Board Of Regents On Behalf Of The University Of Arizona | Dna methylation biomarkers for cancer diagnosing |
CN108949976A (zh) * | 2018-07-06 | 2018-12-07 | 中国医学科学院北京协和医院 | C12orf70和/或C17orf107基因在胰腺癌检测产品中的用途 |
CN109777874A (zh) * | 2019-01-29 | 2019-05-21 | 上海长海医院 | 一种适用于胰腺导管腺癌诊断及预后判断的血浆外泌体miRNA标志物及应用 |
CN111254194A (zh) * | 2020-01-13 | 2020-06-09 | 东南大学 | 基于cfDNA的测序及数据分析的癌症相关生物标记及其在cfDNA样品分类中的应用 |
CN112176057A (zh) * | 2020-09-23 | 2021-01-05 | 中国人民解放军海军军医大学第一附属医院 | 利用CpG位点甲基化水平检测胰腺导管腺癌的标志物及其应用 |
Non-Patent Citations (2)
Title |
---|
WU, HW ET AL: "Noninvasive detection of pancreatic ductal adenocarcinoma using the methylation signature of circulating tumour DNA", BMC MEDICINE, vol. 20, no. 1, 25 November 2022 (2022-11-25), pages 458 * |
张志文等: "胰腺导管腺癌中胰腺星形细胞的研究进展", 临床与病理杂志, vol. 37, no. 09, 30 September 2017 (2017-09-30), pages 1971 - 1977 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112176057B (zh) | 利用CpG位点甲基化水平检测胰腺导管腺癌的标志物及其应用 | |
JP2014521334A (ja) | サンプルにおける異なる異数性の有無を決定する方法 | |
TW201718874A (zh) | 血漿dna之單分子定序 | |
KR102605749B1 (ko) | 자간전증에 특이적인 순환 rna 시그니처 | |
CN107142320B (zh) | 用于检测肝癌的基因标志物及其用途 | |
CN106399304B (zh) | 一种与乳腺癌相关的snp标记 | |
WO2023142630A1 (zh) | 一种用于膀胱尿路上皮癌诊断的检测方法和试剂盒 | |
CN115516110A (zh) | 结直肠癌dna甲基化的检测方法及试剂 | |
TW202336235A (zh) | 血漿粒線體dna分析之應用 | |
CN114317738A (zh) | 用于检测胃癌淋巴结节转移相关的甲基化生物标记物或其组合及应用 | |
CN109161593B (zh) | 环状RNA和microRNA在结直肠癌筛查诊断的应用 | |
CN112951325B (zh) | 一种用于癌症检测的探针组合的设计方法及其应用 | |
TW201934568A (zh) | 一種用於檢測食道癌的基因標誌物及其用途和檢測方法 | |
CN115466791A (zh) | 用于检测转移性前列腺癌的甲基化生物标志物组合及应用 | |
CN114250298A (zh) | 胰腺导管腺癌的dna甲基化标志物及其应用 | |
CN115851923A (zh) | 用于检测结直肠癌淋巴结转移的甲基化生物标记物及其应用 | |
CN110628898B (zh) | Baz1b易感snp位点检测试剂及其制备的试剂盒 | |
CN106636351B (zh) | 一种与乳腺癌相关的snp标记及其应用 | |
CN106868128B (zh) | 一组辅助诊断乳腺癌的生物标记物及其应用 | |
CN110628897B (zh) | 一种kfs致病基因新突变及其应用 | |
CN115772566B (zh) | 用于辅助检测肺癌体细胞erbb2基因突变的甲基化生物标记物及其应用 | |
CN113981059B (zh) | 一种地中海贫血症突变基因检测引物组合物及其试剂 | |
CN116891899B (zh) | 一种基因标志物组合、试剂盒及检测方法 | |
CN110205322B (zh) | 一种乳腺癌致病基因sec63的突变snp位点及其应用 | |
CN110643700B (zh) | Kfs相关基因突变在制备检测试剂盒中的应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |