CN117813403A - 用于疾病检测的方法 - Google Patents
用于疾病检测的方法 Download PDFInfo
- Publication number
- CN117813403A CN117813403A CN202280041974.7A CN202280041974A CN117813403A CN 117813403 A CN117813403 A CN 117813403A CN 202280041974 A CN202280041974 A CN 202280041974A CN 117813403 A CN117813403 A CN 117813403A
- Authority
- CN
- China
- Prior art keywords
- methylation
- dna
- seq
- certain embodiments
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 298
- 238000001514 detection method Methods 0.000 title abstract description 31
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title description 132
- 201000010099 disease Diseases 0.000 title description 83
- 230000011987 methylation Effects 0.000 claims abstract description 514
- 238000007069 methylation reaction Methods 0.000 claims abstract description 514
- 238000007481 next generation sequencing Methods 0.000 claims abstract description 74
- 241000282414 Homo sapiens Species 0.000 claims description 328
- 208000001333 Colorectal Neoplasms Diseases 0.000 claims description 220
- 206010009944 Colon cancer Diseases 0.000 claims description 195
- 210000004369 blood Anatomy 0.000 claims description 26
- 239000008280 blood Substances 0.000 claims description 26
- 230000000977 initiatory effect Effects 0.000 claims description 17
- 239000010836 blood and blood product Substances 0.000 claims description 3
- 229940125691 blood product Drugs 0.000 claims description 3
- 206010028980 Neoplasm Diseases 0.000 abstract description 138
- 208000003200 Adenoma Diseases 0.000 abstract description 109
- 239000000090 biomarker Substances 0.000 abstract description 103
- 201000011510 cancer Diseases 0.000 abstract description 92
- 238000012216 screening Methods 0.000 abstract description 78
- 206010001233 Adenoma benign Diseases 0.000 abstract description 73
- 239000000203 mixture Substances 0.000 abstract description 70
- 102000053602 DNA Human genes 0.000 description 630
- 108020004414 DNA Proteins 0.000 description 629
- 239000000523 sample Substances 0.000 description 321
- 239000012634 fragment Substances 0.000 description 170
- 238000006243 chemical reaction Methods 0.000 description 118
- 150000007523 nucleic acids Chemical class 0.000 description 115
- 102000039446 nucleic acids Human genes 0.000 description 108
- 108020004707 nucleic acids Proteins 0.000 description 108
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 description 97
- 238000012163 sequencing technique Methods 0.000 description 74
- 238000009396 hybridization Methods 0.000 description 68
- 230000035772 mutation Effects 0.000 description 68
- 125000003729 nucleotide group Chemical group 0.000 description 67
- 108090000623 proteins and genes Proteins 0.000 description 66
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 62
- 239000002773 nucleotide Substances 0.000 description 58
- 210000001519 tissue Anatomy 0.000 description 57
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical class NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 56
- 238000011282 treatment Methods 0.000 description 56
- 208000035475 disorder Diseases 0.000 description 49
- 239000011324 bead Substances 0.000 description 45
- 230000003321 amplification Effects 0.000 description 42
- 210000004027 cell Anatomy 0.000 description 42
- 239000003153 chemical reaction reagent Substances 0.000 description 42
- 238000003199 nucleic acid amplification method Methods 0.000 description 42
- 108091034117 Oligonucleotide Proteins 0.000 description 41
- 238000004458 analytical method Methods 0.000 description 39
- 239000000243 solution Substances 0.000 description 39
- 230000015654 memory Effects 0.000 description 38
- 238000003752 polymerase chain reaction Methods 0.000 description 38
- 239000013615 primer Substances 0.000 description 36
- 238000003745 diagnosis Methods 0.000 description 33
- 239000000306 component Substances 0.000 description 32
- 102000004190 Enzymes Human genes 0.000 description 30
- 108090000790 Enzymes Proteins 0.000 description 30
- 239000003795 chemical substances by application Substances 0.000 description 30
- 230000000875 corresponding effect Effects 0.000 description 30
- 229940035893 uracil Drugs 0.000 description 30
- 239000003814 drug Substances 0.000 description 29
- 210000002381 plasma Anatomy 0.000 description 28
- 108091029430 CpG site Proteins 0.000 description 25
- 238000003753 real-time PCR Methods 0.000 description 25
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 24
- 238000002052 colonoscopy Methods 0.000 description 24
- 230000035945 sensitivity Effects 0.000 description 24
- 230000002255 enzymatic effect Effects 0.000 description 23
- 238000013507 mapping Methods 0.000 description 23
- 229940124597 therapeutic agent Drugs 0.000 description 21
- 239000011534 wash buffer Substances 0.000 description 21
- 239000012472 biological sample Substances 0.000 description 20
- 230000005291 magnetic effect Effects 0.000 description 20
- 238000003908 quality control method Methods 0.000 description 20
- 108010090804 Streptavidin Proteins 0.000 description 19
- 238000003556 assay Methods 0.000 description 19
- 230000008685 targeting Effects 0.000 description 19
- 108091093088 Amplicon Proteins 0.000 description 18
- 230000000295 complement effect Effects 0.000 description 18
- 239000003550 marker Substances 0.000 description 18
- 230000003287 optical effect Effects 0.000 description 18
- 230000002159 abnormal effect Effects 0.000 description 17
- 210000001072 colon Anatomy 0.000 description 17
- 238000002360 preparation method Methods 0.000 description 17
- 238000000746 purification Methods 0.000 description 17
- 238000003860 storage Methods 0.000 description 17
- 108091028043 Nucleic acid sequence Proteins 0.000 description 16
- 238000004891 communication Methods 0.000 description 16
- 230000001965 increasing effect Effects 0.000 description 16
- 230000008569 process Effects 0.000 description 16
- 239000003155 DNA primer Substances 0.000 description 15
- 108020004682 Single-Stranded DNA Proteins 0.000 description 15
- 238000012360 testing method Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 14
- 230000006607 hypermethylation Effects 0.000 description 14
- 108091026890 Coding region Proteins 0.000 description 13
- 238000004422 calculation algorithm Methods 0.000 description 13
- 230000008859 change Effects 0.000 description 13
- 230000000694 effects Effects 0.000 description 13
- 238000012545 processing Methods 0.000 description 13
- 239000000047 product Substances 0.000 description 13
- 238000002560 therapeutic procedure Methods 0.000 description 13
- 238000010200 validation analysis Methods 0.000 description 13
- 206010058314 Dysplasia Diseases 0.000 description 12
- 238000004925 denaturation Methods 0.000 description 12
- 230000036425 denaturation Effects 0.000 description 12
- 210000001165 lymph node Anatomy 0.000 description 12
- 238000001356 surgical procedure Methods 0.000 description 12
- -1 C-5 propynyl-uridine Chemical compound 0.000 description 11
- 239000006228 supernatant Substances 0.000 description 11
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 10
- 230000007067 DNA methylation Effects 0.000 description 10
- 208000037062 Polyps Diseases 0.000 description 10
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 10
- 238000001369 bisulfite sequencing Methods 0.000 description 10
- 210000000349 chromosome Anatomy 0.000 description 10
- 229940127089 cytotoxic agent Drugs 0.000 description 10
- 230000001419 dependent effect Effects 0.000 description 10
- 239000003623 enhancer Substances 0.000 description 10
- 230000008826 genomic mutation Effects 0.000 description 10
- 238000005259 measurement Methods 0.000 description 10
- 208000015768 polyposis Diseases 0.000 description 10
- 230000002441 reversible effect Effects 0.000 description 10
- 238000011144 upstream manufacturing Methods 0.000 description 10
- 101000653374 Homo sapiens Methylcytosine dioxygenase TET2 Proteins 0.000 description 9
- 102100030803 Methylcytosine dioxygenase TET2 Human genes 0.000 description 9
- 239000002246 antineoplastic agent Substances 0.000 description 9
- 150000001875 compounds Chemical class 0.000 description 9
- 230000036961 partial effect Effects 0.000 description 9
- 238000007637 random forest analysis Methods 0.000 description 9
- 206010048832 Colon adenoma Diseases 0.000 description 8
- 230000009471 action Effects 0.000 description 8
- 229940104302 cytosine Drugs 0.000 description 8
- 238000012217 deletion Methods 0.000 description 8
- 230000037430 deletion Effects 0.000 description 8
- 102000052116 epidermal growth factor receptor activity proteins Human genes 0.000 description 8
- 108700015053 epidermal growth factor receptor activity proteins Proteins 0.000 description 8
- 238000011156 evaluation Methods 0.000 description 8
- 239000000463 material Substances 0.000 description 8
- YOHYSYJDKVYCJI-UHFFFAOYSA-N n-[3-[[6-[3-(trifluoromethyl)anilino]pyrimidin-4-yl]amino]phenyl]cyclopropanecarboxamide Chemical compound FC(F)(F)C1=CC=CC(NC=2N=CN=C(NC=3C=C(NC(=O)C4CC4)C=CC=3)C=2)=C1 YOHYSYJDKVYCJI-UHFFFAOYSA-N 0.000 description 8
- 239000002751 oligonucleotide probe Substances 0.000 description 8
- 229960001756 oxaliplatin Drugs 0.000 description 8
- DWAFYCQODLXJNR-BNTLRKBRSA-L oxaliplatin Chemical compound O1C(=O)C(=O)O[Pt]11N[C@@H]2CCCC[C@H]2N1 DWAFYCQODLXJNR-BNTLRKBRSA-L 0.000 description 8
- 108090000765 processed proteins & peptides Proteins 0.000 description 8
- 230000001105 regulatory effect Effects 0.000 description 8
- 239000000126 substance Substances 0.000 description 8
- 238000012549 training Methods 0.000 description 8
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 7
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 7
- 108700028369 Alleles Proteins 0.000 description 7
- GHASVSINZRGABV-UHFFFAOYSA-N Fluorouracil Chemical compound FC1=CNC(=O)NC1=O GHASVSINZRGABV-UHFFFAOYSA-N 0.000 description 7
- 208000018522 Gastrointestinal disease Diseases 0.000 description 7
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 7
- 238000012408 PCR amplification Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 229960002949 fluorouracil Drugs 0.000 description 7
- 238000003780 insertion Methods 0.000 description 7
- 230000037431 insertion Effects 0.000 description 7
- 238000007855 methylation-specific PCR Methods 0.000 description 7
- 229920001184 polypeptide Polymers 0.000 description 7
- 102000004196 processed proteins & peptides Human genes 0.000 description 7
- 238000004393 prognosis Methods 0.000 description 7
- 235000018102 proteins Nutrition 0.000 description 7
- 102000004169 proteins and genes Human genes 0.000 description 7
- 230000009467 reduction Effects 0.000 description 7
- 239000002002 slurry Substances 0.000 description 7
- 208000024891 symptom Diseases 0.000 description 7
- 230000001225 therapeutic effect Effects 0.000 description 7
- GAGWJHPBXLXJQN-UORFTKCHSA-N Capecitabine Chemical compound C1=C(F)C(NC(=O)OCCCCC)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](C)O1 GAGWJHPBXLXJQN-UORFTKCHSA-N 0.000 description 6
- GAGWJHPBXLXJQN-UHFFFAOYSA-N Capecitabine Natural products C1=C(F)C(NC(=O)OCCCCC)=NC(=O)N1C1C(O)C(O)C(C)O1 GAGWJHPBXLXJQN-UHFFFAOYSA-N 0.000 description 6
- 108091033380 Coding strand Proteins 0.000 description 6
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 6
- 101000744505 Homo sapiens GTPase NRas Proteins 0.000 description 6
- 239000012148 binding buffer Substances 0.000 description 6
- 210000001124 body fluid Anatomy 0.000 description 6
- 229960004117 capecitabine Drugs 0.000 description 6
- 238000013145 classification model Methods 0.000 description 6
- 238000004590 computer program Methods 0.000 description 6
- 238000007847 digital PCR Methods 0.000 description 6
- 239000003937 drug carrier Substances 0.000 description 6
- 230000014509 gene expression Effects 0.000 description 6
- 230000036541 health Effects 0.000 description 6
- 238000000338 in vitro Methods 0.000 description 6
- 239000008194 pharmaceutical composition Substances 0.000 description 6
- 230000002265 prevention Effects 0.000 description 6
- 239000013074 reference sample Substances 0.000 description 6
- 108091008146 restriction endonucleases Proteins 0.000 description 6
- 238000006467 substitution reaction Methods 0.000 description 6
- 208000011580 syndromic disease Diseases 0.000 description 6
- 210000002700 urine Anatomy 0.000 description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- VVIAGPKUTFNRDU-UHFFFAOYSA-N 6S-folinic acid Natural products C1NC=2NC(N)=NC(=O)C=2N(C=O)C1CNC1=CC=C(C(=O)NC(CCC(O)=O)C(O)=O)C=C1 VVIAGPKUTFNRDU-UHFFFAOYSA-N 0.000 description 5
- 101100215673 Arabidopsis thaliana AGL11 gene Proteins 0.000 description 5
- 108020004705 Codon Proteins 0.000 description 5
- 102100030708 GTPase KRas Human genes 0.000 description 5
- 102100039788 GTPase NRas Human genes 0.000 description 5
- 101000584612 Homo sapiens GTPase KRas Proteins 0.000 description 5
- 101000605639 Homo sapiens Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit alpha isoform Proteins 0.000 description 5
- 101000984753 Homo sapiens Serine/threonine-protein kinase B-raf Proteins 0.000 description 5
- 102000014160 PTEN Phosphohydrolase Human genes 0.000 description 5
- 108010011536 PTEN Phosphohydrolase Proteins 0.000 description 5
- 102100038332 Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit alpha isoform Human genes 0.000 description 5
- 101150073911 STK gene Proteins 0.000 description 5
- 102100027103 Serine/threonine-protein kinase B-raf Human genes 0.000 description 5
- 108700009124 Transcription Initiation Site Proteins 0.000 description 5
- 102000015098 Tumor Suppressor Protein p53 Human genes 0.000 description 5
- 108010078814 Tumor Suppressor Protein p53 Proteins 0.000 description 5
- 229960002685 biotin Drugs 0.000 description 5
- 235000020958 biotin Nutrition 0.000 description 5
- 239000011616 biotin Substances 0.000 description 5
- 239000012503 blood component Substances 0.000 description 5
- 208000035269 cancer or benign tumor Diseases 0.000 description 5
- 238000002512 chemotherapy Methods 0.000 description 5
- 230000009615 deamination Effects 0.000 description 5
- 238000006481 deamination reaction Methods 0.000 description 5
- 238000013461 design Methods 0.000 description 5
- 229940079593 drug Drugs 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- VVIAGPKUTFNRDU-ABLWVSNPSA-N folinic acid Chemical compound C1NC=2NC(N)=NC(=O)C=2N(C=O)C1CNC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 VVIAGPKUTFNRDU-ABLWVSNPSA-N 0.000 description 5
- 235000008191 folinic acid Nutrition 0.000 description 5
- 239000011672 folinic acid Substances 0.000 description 5
- 230000004927 fusion Effects 0.000 description 5
- 238000010348 incorporation Methods 0.000 description 5
- 229960001691 leucovorin Drugs 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 5
- 238000004949 mass spectrometry Methods 0.000 description 5
- 230000007170 pathology Effects 0.000 description 5
- 238000000513 principal component analysis Methods 0.000 description 5
- 238000002271 resection Methods 0.000 description 5
- 230000019491 signal transduction Effects 0.000 description 5
- 239000007787 solid Substances 0.000 description 5
- 238000013518 transcription Methods 0.000 description 5
- 230000035897 transcription Effects 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- BXTJCSYMGFJEID-XMTADJHZSA-N (2s)-2-[[(2r,3r)-3-[(2s)-1-[(3r,4s,5s)-4-[[(2s)-2-[[(2s)-2-[6-[3-[(2r)-2-amino-2-carboxyethyl]sulfanyl-2,5-dioxopyrrolidin-1-yl]hexanoyl-methylamino]-3-methylbutanoyl]amino]-3-methylbutanoyl]-methylamino]-3-methoxy-5-methylheptanoyl]pyrrolidin-2-yl]-3-met Chemical compound C([C@H](NC(=O)[C@H](C)[C@@H](OC)[C@@H]1CCCN1C(=O)C[C@H]([C@H]([C@@H](C)CC)N(C)C(=O)[C@@H](NC(=O)[C@H](C(C)C)N(C)C(=O)CCCCCN1C(C(SC[C@H](N)C(O)=O)CC1=O)=O)C(C)C)OC)C(O)=O)C1=CC=CC=C1 BXTJCSYMGFJEID-XMTADJHZSA-N 0.000 description 4
- RYVNIFSIEDRLSJ-UHFFFAOYSA-N 5-(hydroxymethyl)cytosine Chemical compound NC=1NC(=O)N=CC=1CO RYVNIFSIEDRLSJ-UHFFFAOYSA-N 0.000 description 4
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 4
- 239000002138 L01XE21 - Regorafenib Substances 0.000 description 4
- 241000124008 Mammalia Species 0.000 description 4
- 101710163270 Nuclease Proteins 0.000 description 4
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 4
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 4
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 4
- 235000001014 amino acid Nutrition 0.000 description 4
- 150000001413 amino acids Chemical class 0.000 description 4
- 238000007622 bioinformatic analysis Methods 0.000 description 4
- 239000010839 body fluid Substances 0.000 description 4
- 239000000872 buffer Substances 0.000 description 4
- 230000003197 catalytic effect Effects 0.000 description 4
- 208000029742 colonic neoplasm Diseases 0.000 description 4
- 238000002790 cross-validation Methods 0.000 description 4
- VFLDPWHFBUODDF-FCXRPNKRSA-N curcumin Chemical compound C1=C(O)C(OC)=CC(\C=C\C(=O)CC(=O)\C=C\C=2C=C(OC)C(O)=CC=2)=C1 VFLDPWHFBUODDF-FCXRPNKRSA-N 0.000 description 4
- 230000003247 decreasing effect Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000029087 digestion Effects 0.000 description 4
- 208000010643 digestive system disease Diseases 0.000 description 4
- 229930013356 epothilone Natural products 0.000 description 4
- 150000003883 epothilone derivatives Chemical class 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 238000009472 formulation Methods 0.000 description 4
- 208000018685 gastrointestinal system disease Diseases 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 230000012010 growth Effects 0.000 description 4
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical class O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 4
- 230000003902 lesion Effects 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- 230000003211 malignant effect Effects 0.000 description 4
- 238000002844 melting Methods 0.000 description 4
- 230000008018 melting Effects 0.000 description 4
- 125000002496 methyl group Chemical class [H]C([H])([H])* 0.000 description 4
- 230000003647 oxidation Effects 0.000 description 4
- 238000007254 oxidation reaction Methods 0.000 description 4
- 230000037361 pathway Effects 0.000 description 4
- 239000002096 quantum dot Substances 0.000 description 4
- 239000011535 reaction buffer Substances 0.000 description 4
- 210000000664 rectum Anatomy 0.000 description 4
- 229960004836 regorafenib Drugs 0.000 description 4
- FNHKPVJBJVTLMP-UHFFFAOYSA-N regorafenib Chemical compound C1=NC(C(=O)NC)=CC(OC=2C=C(F)C(NC(=O)NC=3C=C(C(Cl)=CC=3)C(F)(F)F)=CC=2)=C1 FNHKPVJBJVTLMP-UHFFFAOYSA-N 0.000 description 4
- 230000003252 repetitive effect Effects 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 235000000346 sugar Nutrition 0.000 description 4
- 238000010257 thawing Methods 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 238000005406 washing Methods 0.000 description 4
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 3
- ZDTFMPXQUSBYRL-UUOKFMHZSA-N 2-Aminoadenosine Chemical compound C12=NC(N)=NC(N)=C2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ZDTFMPXQUSBYRL-UUOKFMHZSA-N 0.000 description 3
- 101710095342 Apolipoprotein B Proteins 0.000 description 3
- 102100040202 Apolipoprotein B-100 Human genes 0.000 description 3
- 208000009458 Carcinoma in Situ Diseases 0.000 description 3
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 3
- 108020003215 DNA Probes Proteins 0.000 description 3
- 239000003298 DNA probe Substances 0.000 description 3
- 201000006107 Familial adenomatous polyposis Diseases 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 208000017095 Hereditary nonpolyposis colon cancer Diseases 0.000 description 3
- 102000003960 Ligases Human genes 0.000 description 3
- 108090000364 Ligases Proteins 0.000 description 3
- 206010027476 Metastases Diseases 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- DNIAPMSPPWPWGF-UHFFFAOYSA-N Propylene glycol Chemical compound CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 239000002253 acid Substances 0.000 description 3
- 239000013543 active substance Substances 0.000 description 3
- 238000007792 addition Methods 0.000 description 3
- 229940049595 antibody-drug conjugate Drugs 0.000 description 3
- 229960000397 bevacizumab Drugs 0.000 description 3
- 238000001574 biopsy Methods 0.000 description 3
- 229960005395 cetuximab Drugs 0.000 description 3
- 208000029664 classic familial adenomatous polyposis Diseases 0.000 description 3
- 238000002648 combination therapy Methods 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 3
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 3
- 229960004679 doxorubicin Drugs 0.000 description 3
- 238000006911 enzymatic reaction Methods 0.000 description 3
- 230000004049 epigenetic modification Effects 0.000 description 3
- 210000003743 erythrocyte Anatomy 0.000 description 3
- 230000001747 exhibiting effect Effects 0.000 description 3
- 239000012530 fluid Substances 0.000 description 3
- 230000005017 genetic modification Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 201000004933 in situ carcinoma Diseases 0.000 description 3
- 210000000265 leukocyte Anatomy 0.000 description 3
- 150000002632 lipids Chemical class 0.000 description 3
- 239000004973 liquid crystal related substance Substances 0.000 description 3
- 210000004072 lung Anatomy 0.000 description 3
- 230000017156 mRNA modification Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 208000015122 neurodegenerative disease Diseases 0.000 description 3
- 239000008188 pellet Substances 0.000 description 3
- 150000004713 phosphodiesters Chemical class 0.000 description 3
- 102000040430 polynucleotide Human genes 0.000 description 3
- 108091033319 polynucleotide Proteins 0.000 description 3
- 239000002157 polynucleotide Substances 0.000 description 3
- 239000002244 precipitate Substances 0.000 description 3
- 230000035935 pregnancy Effects 0.000 description 3
- 230000002062 proliferating effect Effects 0.000 description 3
- 238000001959 radiotherapy Methods 0.000 description 3
- 239000011541 reaction mixture Substances 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 210000003296 saliva Anatomy 0.000 description 3
- 210000002966 serum Anatomy 0.000 description 3
- 150000008163 sugars Chemical class 0.000 description 3
- 230000005945 translocation Effects 0.000 description 3
- 238000011269 treatment regimen Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 238000003260 vortexing Methods 0.000 description 3
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 2
- GVJHHUAWPYXKBD-UHFFFAOYSA-N (±)-α-Tocopherol Chemical compound OC1=C(C)C(C)=C2OC(CCCC(C)CCCC(C)CCCC(C)C)(C)CCC2=C1C GVJHHUAWPYXKBD-UHFFFAOYSA-N 0.000 description 2
- JHSXDAWGLCZYSM-UHFFFAOYSA-N 4-(4-chloro-2-methylphenoxy)-N-hydroxybutanamide Chemical compound CC1=CC(Cl)=CC=C1OCCCC(=O)NO JHSXDAWGLCZYSM-UHFFFAOYSA-N 0.000 description 2
- NMUSYJAQQFHJEW-KVTDHHQDSA-N 5-azacytidine Chemical compound O=C1N=C(N)N=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NMUSYJAQQFHJEW-KVTDHHQDSA-N 0.000 description 2
- ZAYHVCMSTBRABG-JXOAFFINSA-N 5-methylcytidine Chemical compound O=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZAYHVCMSTBRABG-JXOAFFINSA-N 0.000 description 2
- STQGQHZAVUOBTE-UHFFFAOYSA-N 7-Cyan-hept-2t-en-4,6-diinsaeure Natural products C1=2C(O)=C3C(=O)C=4C(OC)=CC=CC=4C(=O)C3=C(O)C=2CC(O)(C(C)=O)CC1OC1CC(N)C(O)C(C)O1 STQGQHZAVUOBTE-UHFFFAOYSA-N 0.000 description 2
- 102000012758 APOBEC-1 Deaminase Human genes 0.000 description 2
- 108010079649 APOBEC-1 Deaminase Proteins 0.000 description 2
- 102000002797 APOBEC-3G Deaminase Human genes 0.000 description 2
- 108010004483 APOBEC-3G Deaminase Proteins 0.000 description 2
- 208000004998 Abdominal Pain Diseases 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 2
- 206010006187 Breast cancer Diseases 0.000 description 2
- 208000026310 Breast neoplasm Diseases 0.000 description 2
- 201000009030 Carcinoma Diseases 0.000 description 2
- 206010052358 Colorectal cancer metastatic Diseases 0.000 description 2
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 2
- UHDGCWIWMRVCDJ-CCXZUQQUSA-N Cytarabine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@@H](O)[C@H](O)[C@@H](CO)O1 UHDGCWIWMRVCDJ-CCXZUQQUSA-N 0.000 description 2
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 2
- 238000001712 DNA sequencing Methods 0.000 description 2
- AOJJSUZBOXZQNB-TZSSRYMLSA-N Doxorubicin Chemical compound O([C@H]1C[C@@](O)(CC=2C(O)=C3C(=O)C=4C=CC=C(C=4C(=O)C3=C(O)C=21)OC)C(=O)CO)[C@H]1C[C@H](N)[C@H](O)[C@H](C)O1 AOJJSUZBOXZQNB-TZSSRYMLSA-N 0.000 description 2
- 101150039808 Egfr gene Proteins 0.000 description 2
- 206010017993 Gastrointestinal neoplasms Diseases 0.000 description 2
- 208000008051 Hereditary Nonpolyposis Colorectal Neoplasms Diseases 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 101001023964 Homo sapiens Growth/differentiation factor 6 Proteins 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- 101150068332 KIT gene Proteins 0.000 description 2
- 101150105104 Kras gene Proteins 0.000 description 2
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 2
- 206010025323 Lymphomas Diseases 0.000 description 2
- 201000005027 Lynch syndrome Diseases 0.000 description 2
- 101150105382 MET gene Proteins 0.000 description 2
- 101100175321 Mus musculus Gdf6 gene Proteins 0.000 description 2
- ZDZOTLJHXYCWBA-VCVYQWHSSA-N N-debenzoyl-N-(tert-butoxycarbonyl)-10-deacetyltaxol Chemical compound O([C@H]1[C@H]2[C@@](C([C@H](O)C3=C(C)[C@@H](OC(=O)[C@H](O)[C@@H](NC(=O)OC(C)(C)C)C=4C=CC=CC=4)C[C@]1(O)C3(C)C)=O)(C)[C@@H](O)C[C@H]1OC[C@]12OC(=O)C)C(=O)C1=CC=CC=C1 ZDZOTLJHXYCWBA-VCVYQWHSSA-N 0.000 description 2
- 101150073096 NRAS gene Proteins 0.000 description 2
- 108091005461 Nucleic proteins Proteins 0.000 description 2
- 101150073900 PTEN gene Proteins 0.000 description 2
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 2
- 101150063858 Pik3ca gene Proteins 0.000 description 2
- 108020004518 RNA Probes Proteins 0.000 description 2
- 239000003391 RNA probe Substances 0.000 description 2
- 101150040067 STK11 gene Proteins 0.000 description 2
- 206010039491 Sarcoma Diseases 0.000 description 2
- DWAQJAXMDSEUJJ-UHFFFAOYSA-M Sodium bisulfite Chemical compound [Na+].OS([O-])=O DWAQJAXMDSEUJJ-UHFFFAOYSA-M 0.000 description 2
- 101150080074 TP53 gene Proteins 0.000 description 2
- 108091036066 Three prime untranslated region Proteins 0.000 description 2
- 208000024770 Thyroid neoplasm Diseases 0.000 description 2
- 108010020764 Transposases Proteins 0.000 description 2
- 102000008579 Transposases Human genes 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- 102000005789 Vascular Endothelial Growth Factors Human genes 0.000 description 2
- 108010019530 Vascular Endothelial Growth Factors Proteins 0.000 description 2
- 206010000059 abdominal discomfort Diseases 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 229960000643 adenine Drugs 0.000 description 2
- GFFGJBXGBJISGV-UHFFFAOYSA-N adenyl group Chemical group N1=CN=C2N=CNC2=C1N GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 2
- 239000000611 antibody drug conjugate Substances 0.000 description 2
- 238000003149 assay kit Methods 0.000 description 2
- 229960002756 azacitidine Drugs 0.000 description 2
- 229960002170 azathioprine Drugs 0.000 description 2
- LMEKQMALGUDUQG-UHFFFAOYSA-N azathioprine Chemical compound CN1C=NC([N+]([O-])=O)=C1SC1=NC=NC2=C1NC=N2 LMEKQMALGUDUQG-UHFFFAOYSA-N 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- GXJABQQUPOEUTA-RDJZCZTQSA-N bortezomib Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)B(O)O)NC(=O)C=1N=CC=NC=1)C1=CC=CC=C1 GXJABQQUPOEUTA-RDJZCZTQSA-N 0.000 description 2
- 229960001467 bortezomib Drugs 0.000 description 2
- 101150048834 braF gene Proteins 0.000 description 2
- 150000001720 carbohydrates Chemical class 0.000 description 2
- 235000014633 carbohydrates Nutrition 0.000 description 2
- 229960004562 carboplatin Drugs 0.000 description 2
- 190000008236 carboplatin Chemical compound 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 239000012141 concentrate Substances 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 239000013068 control sample Substances 0.000 description 2
- 239000006071 cream Substances 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 229940109262 curcumin Drugs 0.000 description 2
- 235000012754 curcumin Nutrition 0.000 description 2
- 239000004148 curcumin Substances 0.000 description 2
- 229960000684 cytarabine Drugs 0.000 description 2
- STQGQHZAVUOBTE-VGBVRHCVSA-N daunorubicin Chemical compound O([C@H]1C[C@@](O)(CC=2C(O)=C3C(=O)C=4C=CC=C(C=4C(=O)C3=C(O)C=21)OC)C(C)=O)[C@H]1C[C@H](N)[C@H](O)[C@H](C)O1 STQGQHZAVUOBTE-VGBVRHCVSA-N 0.000 description 2
- 229960000975 daunorubicin Drugs 0.000 description 2
- 238000003795 desorption Methods 0.000 description 2
- VFLDPWHFBUODDF-UHFFFAOYSA-N diferuloylmethane Natural products C1=C(O)C(OC)=CC(C=CC(=O)CC(=O)C=CC=2C=C(OC)C(O)=CC=2)=C1 VFLDPWHFBUODDF-UHFFFAOYSA-N 0.000 description 2
- 239000003085 diluting agent Substances 0.000 description 2
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 2
- 229960003668 docetaxel Drugs 0.000 description 2
- 239000000839 emulsion Substances 0.000 description 2
- 108700021358 erbB-1 Genes Proteins 0.000 description 2
- MMXKVMNBHPAILY-UHFFFAOYSA-N ethyl laurate Chemical compound CCCCCCCCCCCC(=O)OCC MMXKVMNBHPAILY-UHFFFAOYSA-N 0.000 description 2
- VJJPUSNTGOMMGY-MRVIYFEKSA-N etoposide Chemical compound COC1=C(O)C(OC)=CC([C@@H]2C3=CC=4OCOC=4C=C3[C@@H](O[C@H]3[C@@H]([C@@H](O)[C@@H]4O[C@H](C)OC[C@H]4O3)O)[C@@H]3[C@@H]2C(OC3)=O)=C1 VJJPUSNTGOMMGY-MRVIYFEKSA-N 0.000 description 2
- 229960005420 etoposide Drugs 0.000 description 2
- 230000007717 exclusion Effects 0.000 description 2
- 230000029142 excretion Effects 0.000 description 2
- 230000002550 fecal effect Effects 0.000 description 2
- 239000007850 fluorescent dye Substances 0.000 description 2
- 238000013467 fragmentation Methods 0.000 description 2
- 238000006062 fragmentation reaction Methods 0.000 description 2
- 102000054767 gene variant Human genes 0.000 description 2
- 230000000762 glandular Effects 0.000 description 2
- 229940029575 guanosine Drugs 0.000 description 2
- 208000011953 hyperplastic polyposis syndrome Diseases 0.000 description 2
- 238000009169 immunotherapy Methods 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 239000003112 inhibitor Substances 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 210000004185 liver Anatomy 0.000 description 2
- 210000002751 lymph Anatomy 0.000 description 2
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 2
- 230000009401 metastasis Effects 0.000 description 2
- 230000001394 metastastic effect Effects 0.000 description 2
- 206010061289 metastatic neoplasm Diseases 0.000 description 2
- 210000000214 mouth Anatomy 0.000 description 2
- 230000009826 neoplastic cell growth Effects 0.000 description 2
- 230000004770 neurodegeneration Effects 0.000 description 2
- 230000000683 nonmetastatic effect Effects 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 108700025694 p53 Genes Proteins 0.000 description 2
- 201000002528 pancreatic cancer Diseases 0.000 description 2
- 208000008443 pancreatic carcinoma Diseases 0.000 description 2
- 229960001972 panitumumab Drugs 0.000 description 2
- 239000000546 pharmaceutical excipient Substances 0.000 description 2
- 230000000144 pharmacologic effect Effects 0.000 description 2
- 210000003800 pharynx Anatomy 0.000 description 2
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical compound [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 239000002987 primer (paints) Substances 0.000 description 2
- 230000000069 prophylactic effect Effects 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 238000004445 quantitative analysis Methods 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000010079 rubber tapping Methods 0.000 description 2
- WUILNKCFCLNXOK-CFBAGHHKSA-N salirasib Chemical compound CC(C)=CCC\C(C)=C\CC\C(C)=C\CSC1=CC=CC=C1C(O)=O WUILNKCFCLNXOK-CFBAGHHKSA-N 0.000 description 2
- 238000011896 sensitive detection Methods 0.000 description 2
- 210000001599 sigmoid colon Anatomy 0.000 description 2
- 210000003491 skin Anatomy 0.000 description 2
- 150000003384 small molecules Chemical class 0.000 description 2
- HRZFUMHJMZEROT-UHFFFAOYSA-L sodium disulfite Chemical compound [Na+].[Na+].[O-]S(=O)S([O-])(=O)=O HRZFUMHJMZEROT-UHFFFAOYSA-L 0.000 description 2
- 235000010267 sodium hydrogen sulphite Nutrition 0.000 description 2
- 229940001584 sodium metabisulfite Drugs 0.000 description 2
- 235000010262 sodium metabisulphite Nutrition 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 239000007921 spray Substances 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 239000000829 suppository Substances 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 238000013268 sustained release Methods 0.000 description 2
- 239000012730 sustained-release form Substances 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 210000001138 tear Anatomy 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 201000002510 thyroid cancer Diseases 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 210000003384 transverse colon Anatomy 0.000 description 2
- 239000000439 tumor marker Substances 0.000 description 2
- 238000012070 whole genome sequencing analysis Methods 0.000 description 2
- MFZSNESUTRVBQX-XEURHVNRSA-N (2S)-2-amino-6-[4-[[3-[[(2S)-1-[[(1S,2R,3S,5S,6S,16E,18E,20R,21S)-11-chloro-21-hydroxy-12,20-dimethoxy-2,5,9,16-tetramethyl-8,23-dioxo-4,24-dioxa-9,22-diazatetracyclo[19.3.1.110,14.03,5]hexacosa-10,12,14(26),16,18-pentaen-6-yl]oxy]-1-oxopropan-2-yl]-methylamino]-3-oxopropyl]disulfanyl]pentanoylamino]hexanoic acid Chemical compound CO[C@@H]1\C=C\C=C(C)\Cc2cc(OC)c(Cl)c(c2)N(C)C(=O)C[C@H](OC(=O)[C@H](C)N(C)C(=O)CCSSC(C)CCC(=O)NCCCC[C@H](N)C(O)=O)[C@]2(C)O[C@H]2[C@H](C)[C@@H]2C[C@@]1(O)NC(=O)O2 MFZSNESUTRVBQX-XEURHVNRSA-N 0.000 description 1
- RIFDKYBNWNPCQK-IOSLPCCCSA-N (2r,3s,4r,5r)-2-(hydroxymethyl)-5-(6-imino-3-methylpurin-9-yl)oxolane-3,4-diol Chemical compound C1=2N(C)C=NC(=N)C=2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O RIFDKYBNWNPCQK-IOSLPCCCSA-N 0.000 description 1
- RKSLVDIXBGWPIS-UAKXSSHOSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-iodopyrimidine-2,4-dione Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(I)=C1 RKSLVDIXBGWPIS-UAKXSSHOSA-N 0.000 description 1
- QLOCVMVCRJOTTM-TURQNECASA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-prop-1-ynylpyrimidine-2,4-dione Chemical compound O=C1NC(=O)C(C#CC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 QLOCVMVCRJOTTM-TURQNECASA-N 0.000 description 1
- PISWNSOQFZRVJK-XLPZGREQSA-N 1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-methyl-2-sulfanylidenepyrimidin-4-one Chemical compound S=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 PISWNSOQFZRVJK-XLPZGREQSA-N 0.000 description 1
- ZOHXWSHGANNQGO-DSIKUUPMSA-N 1-amino-4-[[5-[[(2S)-1-[[(1S,2R,3S,5S,6S,16E,18E,20R,21S)-11-chloro-21-hydroxy-12,20-dimethoxy-2,5,9,16-tetramethyl-8,23-dioxo-4,24-dioxa-9,22-diazatetracyclo[19.3.1.110,14.03,5]hexacosa-10,12,14(26),16,18-pentaen-6-yl]oxy]-1-oxopropan-2-yl]-methylamino]-2-methyl-5-oxopentan-2-yl]disulfanyl]-1-oxobutane-2-sulfonic acid Chemical compound CO[C@@H]([C@@]1(O)C[C@H](OC(=O)N1)[C@@H](C)[C@@H]1O[C@@]1(C)[C@@H](OC(=O)[C@H](C)N(C)C(=O)CCC(C)(C)SSCCC(C(N)=O)S(O)(=O)=O)CC(=O)N1C)\C=C\C=C(C)\CC2=CC(OC)=C(Cl)C1=C2 ZOHXWSHGANNQGO-DSIKUUPMSA-N 0.000 description 1
- VSNHCAURESNICA-NJFSPNSNSA-N 1-oxidanylurea Chemical compound N[14C](=O)NO VSNHCAURESNICA-NJFSPNSNSA-N 0.000 description 1
- VOXZDWNPVJITMN-ZBRFXRBCSA-N 17β-estradiol Chemical compound OC1=CC=C2[C@H]3CC[C@](C)([C@H](CC4)O)[C@@H]4[C@@H]3CCC2=C1 VOXZDWNPVJITMN-ZBRFXRBCSA-N 0.000 description 1
- YKBGVTZYEHREMT-KVQBGUIXSA-N 2'-deoxyguanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)O1 YKBGVTZYEHREMT-KVQBGUIXSA-N 0.000 description 1
- CKTSBUTUHBMZGZ-SHYZEUOFSA-N 2'‐deoxycytidine Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 CKTSBUTUHBMZGZ-SHYZEUOFSA-N 0.000 description 1
- JRYMOPZHXMVHTA-DAGMQNCNSA-N 2-amino-7-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1h-pyrrolo[2,3-d]pyrimidin-4-one Chemical compound C1=CC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O JRYMOPZHXMVHTA-DAGMQNCNSA-N 0.000 description 1
- BSKHPKMHTQYZBB-UHFFFAOYSA-N 2-methylpyridine Chemical compound CC1=CC=CC=N1 BSKHPKMHTQYZBB-UHFFFAOYSA-N 0.000 description 1
- RHFUOMFWUGWKKO-XVFCMESISA-N 2-thiocytidine Chemical compound S=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 RHFUOMFWUGWKKO-XVFCMESISA-N 0.000 description 1
- ODADKLYLWWCHNB-UHFFFAOYSA-N 2R-delta-tocotrienol Natural products OC1=CC(C)=C2OC(CCC=C(C)CCC=C(C)CCC=C(C)C)(C)CCC2=C1 ODADKLYLWWCHNB-UHFFFAOYSA-N 0.000 description 1
- OTXNTMVVOOBZCV-UHFFFAOYSA-N 2R-gamma-tocotrienol Natural products OC1=C(C)C(C)=C2OC(CCC=C(C)CCC=C(C)CCC=C(C)C)(C)CCC2=C1 OTXNTMVVOOBZCV-UHFFFAOYSA-N 0.000 description 1
- LMMLLWZHCKCFQA-UGKPPGOTSA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)-2-prop-1-ynyloxolan-2-yl]pyrimidin-2-one Chemical compound C1=CC(N)=NC(=O)N1[C@]1(C#CC)O[C@H](CO)[C@@H](O)[C@H]1O LMMLLWZHCKCFQA-UGKPPGOTSA-N 0.000 description 1
- XXSIICQLPUAUDF-TURQNECASA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-prop-1-ynylpyrimidin-2-one Chemical compound O=C1N=C(N)C(C#CC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 XXSIICQLPUAUDF-TURQNECASA-N 0.000 description 1
- ZAYHVCMSTBRABG-UHFFFAOYSA-N 5-Methylcytidine Natural products O=C1N=C(N)C(C)=CN1C1C(O)C(O)C(CO)O1 ZAYHVCMSTBRABG-UHFFFAOYSA-N 0.000 description 1
- AGFIRQJZCNVMCW-UAKXSSHOSA-N 5-bromouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(Br)=C1 AGFIRQJZCNVMCW-UAKXSSHOSA-N 0.000 description 1
- FHIDNBAQOFJWCA-UAKXSSHOSA-N 5-fluorouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(F)=C1 FHIDNBAQOFJWCA-UAKXSSHOSA-N 0.000 description 1
- KDOPAZIWBAHVJB-UHFFFAOYSA-N 5h-pyrrolo[3,2-d]pyrimidine Chemical compound C1=NC=C2NC=CC2=N1 KDOPAZIWBAHVJB-UHFFFAOYSA-N 0.000 description 1
- CYJRNFFLTBEQSQ-UHFFFAOYSA-N 8-(3-methyl-1-benzothiophen-5-yl)-N-(4-methylsulfonylpyridin-3-yl)quinoxalin-6-amine Chemical compound CS(=O)(=O)C1=C(C=NC=C1)NC=1C=C2N=CC=NC2=C(C=1)C=1C=CC2=C(C(=CS2)C)C=1 CYJRNFFLTBEQSQ-UHFFFAOYSA-N 0.000 description 1
- HCAJQHYUCKICQH-VPENINKCSA-N 8-Oxo-7,8-dihydro-2'-deoxyguanosine Chemical compound C1=2NC(N)=NC(=O)C=2NC(=O)N1[C@H]1C[C@H](O)[C@@H](CO)O1 HCAJQHYUCKICQH-VPENINKCSA-N 0.000 description 1
- 102100035886 Adenine DNA glycosylase Human genes 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- 101150102415 Apob gene Proteins 0.000 description 1
- 206010003445 Ascites Diseases 0.000 description 1
- 241000416162 Astragalus gummifer Species 0.000 description 1
- 208000023275 Autoimmune disease Diseases 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 206010005003 Bladder cancer Diseases 0.000 description 1
- 108010006654 Bleomycin Proteins 0.000 description 1
- 206010005949 Bone cancer Diseases 0.000 description 1
- 208000018084 Bone neoplasm Diseases 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 206010008342 Cervix carcinoma Diseases 0.000 description 1
- 208000011359 Chromosome disease Diseases 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 229920002261 Corn starch Polymers 0.000 description 1
- 108091029523 CpG island Proteins 0.000 description 1
- 102000001493 Cyclophilins Human genes 0.000 description 1
- 108010068682 Cyclophilins Proteins 0.000 description 1
- CMSMOCZEIVJLDB-UHFFFAOYSA-N Cyclophosphamide Chemical compound ClCCN(CCCl)P1(=O)NCCCO1 CMSMOCZEIVJLDB-UHFFFAOYSA-N 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical class OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 108090000323 DNA Topoisomerases Proteins 0.000 description 1
- 102000003915 DNA Topoisomerases Human genes 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 108010092160 Dactinomycin Proteins 0.000 description 1
- CKTSBUTUHBMZGZ-UHFFFAOYSA-N Deoxycytidine Natural products O=C1N=C(N)C=CN1C1OC(CO)C(O)C1 CKTSBUTUHBMZGZ-UHFFFAOYSA-N 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 101100193652 Dictyostelium discoideum rapA gene Proteins 0.000 description 1
- 240000001879 Digitalis lutea Species 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- LVGKNOAMLMIIKO-UHFFFAOYSA-N Elaidinsaeure-aethylester Natural products CCCCCCCCC=CCCCCCCCC(=O)OCC LVGKNOAMLMIIKO-UHFFFAOYSA-N 0.000 description 1
- 206010014733 Endometrial cancer Diseases 0.000 description 1
- 206010014759 Endometrial neoplasm Diseases 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 239000001856 Ethyl cellulose Substances 0.000 description 1
- ZZSNKZQZMQGXPY-UHFFFAOYSA-N Ethyl cellulose Chemical compound CCOCC1OC(OC)C(OCC)C(OCC)C1OC1C(O)C(O)C(OC)C(CO)O1 ZZSNKZQZMQGXPY-UHFFFAOYSA-N 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 229940121710 HMGCoA reductase inhibitor Drugs 0.000 description 1
- 102000003964 Histone deacetylase Human genes 0.000 description 1
- 108090000353 Histone deacetylase Proteins 0.000 description 1
- 101001000351 Homo sapiens Adenine DNA glycosylase Proteins 0.000 description 1
- 235000008694 Humulus lupulus Nutrition 0.000 description 1
- XDXDZDZNSLXDNA-TZNDIEGXSA-N Idarubicin Chemical compound C1[C@H](N)[C@H](O)[C@H](C)O[C@H]1O[C@@H]1C2=C(O)C(C(=O)C3=CC=CC=C3C3=O)=C3C(O)=C2C[C@@](O)(C(C)=O)C1 XDXDZDZNSLXDNA-TZNDIEGXSA-N 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 108091029795 Intergenic region Proteins 0.000 description 1
- 206010061252 Intraocular melanoma Diseases 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- 229930126263 Maytansine Natural products 0.000 description 1
- 102000029749 Microtubule Human genes 0.000 description 1
- 108091022875 Microtubule Proteins 0.000 description 1
- 229930192392 Mitomycin Natural products 0.000 description 1
- PCZOHLXUXFIOCF-UHFFFAOYSA-N Monacolin X Natural products C12C(OC(=O)C(C)CC)CC(C)C=C2C=CC(C)C1CCC1CC(O)CC(=O)O1 PCZOHLXUXFIOCF-UHFFFAOYSA-N 0.000 description 1
- 208000014767 Myeloproliferative disease Diseases 0.000 description 1
- NWIBSHFKIJFRCO-WUDYKRTCSA-N Mytomycin Chemical compound C1N2C(C(C(C)=C(N)C3=O)=O)=C3[C@@H](COC(N)=O)[C@@]2(OC)[C@@H]2[C@H]1N2 NWIBSHFKIJFRCO-WUDYKRTCSA-N 0.000 description 1
- GXCLVBGFBYZDAG-UHFFFAOYSA-N N-[2-(1H-indol-3-yl)ethyl]-N-methylprop-2-en-1-amine Chemical compound CN(CCC1=CNC2=C1C=CC=C2)CC=C GXCLVBGFBYZDAG-UHFFFAOYSA-N 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 108700020796 Oncogene Proteins 0.000 description 1
- 102000043276 Oncogene Human genes 0.000 description 1
- 108700005081 Overlapping Genes Proteins 0.000 description 1
- 208000000821 Parathyroid Neoplasms Diseases 0.000 description 1
- 235000019483 Peanut oil Nutrition 0.000 description 1
- 108091093037 Peptide nucleic acid Proteins 0.000 description 1
- 206010034764 Peutz-Jeghers syndrome Diseases 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- 206010035226 Plasma cell myeloma Diseases 0.000 description 1
- 229920002732 Polyanhydride Polymers 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 206010036790 Productive cough Diseases 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 206010060862 Prostate cancer Diseases 0.000 description 1
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 208000015634 Rectal Neoplasms Diseases 0.000 description 1
- 208000006265 Renal cell carcinoma Diseases 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 241000538730 Rocio Species 0.000 description 1
- 235000019485 Safflower oil Nutrition 0.000 description 1
- KQXDHUJYNAXLNZ-XQSDOZFQSA-N Salinomycin Chemical compound O1[C@@H]([C@@H](CC)C(O)=O)CC[C@H](C)[C@@H]1[C@@H](C)[C@H](O)[C@H](C)C(=O)[C@H](CC)[C@@H]1[C@@H](C)C[C@@H](C)[C@@]2(C=C[C@@H](O)[C@@]3(O[C@@](C)(CC3)[C@@H]3O[C@@H](C)[C@@](O)(CC)CC3)O2)O1 KQXDHUJYNAXLNZ-XQSDOZFQSA-N 0.000 description 1
- 239000004189 Salinomycin Substances 0.000 description 1
- 208000032947 Serrated polyposis syndrome Diseases 0.000 description 1
- 208000000453 Skin Neoplasms Diseases 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 208000005718 Stomach Neoplasms Diseases 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- LSNNMFCWUKXFEE-UHFFFAOYSA-N Sulfurous acid Chemical compound OS(O)=O LSNNMFCWUKXFEE-UHFFFAOYSA-N 0.000 description 1
- 229940123237 Taxane Drugs 0.000 description 1
- 229920001615 Tragacanth Polymers 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- 108700025716 Tumor Suppressor Genes Proteins 0.000 description 1
- 102000044209 Tumor Suppressor Genes Human genes 0.000 description 1
- 102000007537 Type II DNA Topoisomerases Human genes 0.000 description 1
- 108010046308 Type II DNA Topoisomerases Proteins 0.000 description 1
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 1
- 208000008385 Urogenital Neoplasms Diseases 0.000 description 1
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 1
- 208000002495 Uterine Neoplasms Diseases 0.000 description 1
- 201000005969 Uveal melanoma Diseases 0.000 description 1
- 229940122803 Vinca alkaloid Drugs 0.000 description 1
- 229930003427 Vitamin E Natural products 0.000 description 1
- 208000004354 Vulvar Neoplasms Diseases 0.000 description 1
- 208000027418 Wounds and injury Diseases 0.000 description 1
- IEDXPSOJFSVCKU-HOKPPMCLSA-N [4-[[(2S)-5-(carbamoylamino)-2-[[(2S)-2-[6-(2,5-dioxopyrrolidin-1-yl)hexanoylamino]-3-methylbutanoyl]amino]pentanoyl]amino]phenyl]methyl N-[(2S)-1-[[(2S)-1-[[(3R,4S,5S)-1-[(2S)-2-[(1R,2R)-3-[[(1S,2R)-1-hydroxy-1-phenylpropan-2-yl]amino]-1-methoxy-2-methyl-3-oxopropyl]pyrrolidin-1-yl]-3-methoxy-5-methyl-1-oxoheptan-4-yl]-methylamino]-3-methyl-1-oxobutan-2-yl]amino]-3-methyl-1-oxobutan-2-yl]-N-methylcarbamate Chemical compound CC[C@H](C)[C@@H]([C@@H](CC(=O)N1CCC[C@H]1[C@H](OC)[C@@H](C)C(=O)N[C@H](C)[C@@H](O)c1ccccc1)OC)N(C)C(=O)[C@@H](NC(=O)[C@H](C(C)C)N(C)C(=O)OCc1ccc(NC(=O)[C@H](CCCNC(N)=O)NC(=O)[C@@H](NC(=O)CCCCCN2C(=O)CCC2=O)C(C)C)cc1)C(C)C IEDXPSOJFSVCKU-HOKPPMCLSA-N 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- DPXJVFZANSGRMM-UHFFFAOYSA-N acetic acid;2,3,4,5,6-pentahydroxyhexanal;sodium Chemical compound [Na].CC(O)=O.OCC(O)C(O)C(O)C(O)C=O DPXJVFZANSGRMM-UHFFFAOYSA-N 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 229930183665 actinomycin Natural products 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 210000004100 adrenal gland Anatomy 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 108010081667 aflibercept Proteins 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 239000000783 alginic acid Substances 0.000 description 1
- 235000010443 alginic acid Nutrition 0.000 description 1
- 229920000615 alginic acid Polymers 0.000 description 1
- 229960001126 alginic acid Drugs 0.000 description 1
- 150000004781 alginic acids Chemical class 0.000 description 1
- 229940100198 alkylating agent Drugs 0.000 description 1
- 239000002168 alkylating agent Substances 0.000 description 1
- SHGAZHPCJJPHSC-YCNIQYBTSA-N all-trans-retinoic acid Chemical compound OC(=O)\C=C(/C)\C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C SHGAZHPCJJPHSC-YCNIQYBTSA-N 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- WNROFYMDJYEPJX-UHFFFAOYSA-K aluminium hydroxide Chemical compound [OH-].[OH-].[OH-].[Al+3] WNROFYMDJYEPJX-UHFFFAOYSA-K 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 229940045799 anthracyclines and related substance Drugs 0.000 description 1
- 230000001028 anti-proliverative effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical class OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 1
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 210000003567 ascitic fluid Anatomy 0.000 description 1
- 108010044540 auristatin Proteins 0.000 description 1
- 238000002869 basic local alignment search tool Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- 210000000013 bile duct Anatomy 0.000 description 1
- 239000013060 biological fluid Substances 0.000 description 1
- 239000005082 bioluminescent agent Substances 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 229960001561 bleomycin Drugs 0.000 description 1
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 210000001772 blood platelet Anatomy 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- 229960000455 brentuximab vedotin Drugs 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 239000006172 buffering agent Substances 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 239000001768 carboxy methyl cellulose Substances 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 210000004534 cecum Anatomy 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 239000002458 cell surface marker Substances 0.000 description 1
- 108091092356 cellular DNA Proteins 0.000 description 1
- 230000019522 cellular metabolic process Effects 0.000 description 1
- 230000033077 cellular process Effects 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 229920002301 cellulose acetate Polymers 0.000 description 1
- IKNAJTLCCWPIQD-UHFFFAOYSA-K cerium(3+);lanthanum(3+);neodymium(3+);oxygen(2-);phosphate Chemical compound [O-2].[La+3].[Ce+3].[Nd+3].[O-]P([O-])([O-])=O IKNAJTLCCWPIQD-UHFFFAOYSA-K 0.000 description 1
- 201000010881 cervical cancer Diseases 0.000 description 1
- 210000003679 cervix uteri Anatomy 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 239000013626 chemical specie Substances 0.000 description 1
- 239000005081 chemiluminescent agent Substances 0.000 description 1
- 229960004630 chlorambucil Drugs 0.000 description 1
- JCKYGMPEJWAADB-UHFFFAOYSA-N chlorambucil Chemical compound OC(=O)CCCC1=CC=C(N(CCCl)CCCl)C=C1 JCKYGMPEJWAADB-UHFFFAOYSA-N 0.000 description 1
- 208000024971 chromosomal disease Diseases 0.000 description 1
- 108091092240 circulating cell-free DNA Proteins 0.000 description 1
- 229960004316 cisplatin Drugs 0.000 description 1
- DQLATGHUWYMOKM-UHFFFAOYSA-L cisplatin Chemical compound N[Pt](N)(Cl)Cl DQLATGHUWYMOKM-UHFFFAOYSA-L 0.000 description 1
- 229940110456 cocoa butter Drugs 0.000 description 1
- 235000019868 cocoa butter Nutrition 0.000 description 1
- 201000002758 colorectal adenoma Diseases 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 235000005687 corn oil Nutrition 0.000 description 1
- 239000002285 corn oil Substances 0.000 description 1
- 239000008120 corn starch Substances 0.000 description 1
- 235000012343 cottonseed oil Nutrition 0.000 description 1
- 239000002385 cottonseed oil Substances 0.000 description 1
- 208000030381 cutaneous melanoma Diseases 0.000 description 1
- 229960004397 cyclophosphamide Drugs 0.000 description 1
- 208000031513 cyst Diseases 0.000 description 1
- 230000003436 cytoskeletal effect Effects 0.000 description 1
- 239000000824 cytostatic agent Substances 0.000 description 1
- 239000002254 cytotoxic agent Substances 0.000 description 1
- 231100000599 cytotoxic agent Toxicity 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000002939 deleterious effect Effects 0.000 description 1
- BTNBMQIHCRIGOU-UHFFFAOYSA-N delta-tocotrienol Natural products CC(=CCCC(=CCCC(=CCCOC1(C)CCc2cc(O)cc(C)c2O1)C)C)C BTNBMQIHCRIGOU-UHFFFAOYSA-N 0.000 description 1
- 229950008925 depatuxizumab mafodotin Drugs 0.000 description 1
- 238000005869 desulfonation reaction Methods 0.000 description 1
- 229910003460 diamond Inorganic materials 0.000 description 1
- 239000010432 diamond Substances 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 239000013024 dilution buffer Substances 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 150000002009 diols Chemical class 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- WBZKQQHYRPRKNJ-UHFFFAOYSA-L disulfite Chemical compound [O-]S(=O)S([O-])(=O)=O WBZKQQHYRPRKNJ-UHFFFAOYSA-L 0.000 description 1
- GRWZHXKQBITJKP-UHFFFAOYSA-L dithionite(2-) Chemical compound [O-]S(=O)S([O-])=O GRWZHXKQBITJKP-UHFFFAOYSA-L 0.000 description 1
- 239000003534 dna topoisomerase inhibitor Substances 0.000 description 1
- 238000011304 droplet digital PCR Methods 0.000 description 1
- 238000012377 drug delivery Methods 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 230000008482 dysregulation Effects 0.000 description 1
- 230000005684 electric field Effects 0.000 description 1
- 238000002330 electrospray ionisation mass spectrometry Methods 0.000 description 1
- 239000003480 eluent Substances 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 239000012149 elution buffer Substances 0.000 description 1
- 210000000750 endocrine system Anatomy 0.000 description 1
- 210000004696 endometrium Anatomy 0.000 description 1
- 238000001839 endoscopy Methods 0.000 description 1
- 210000002889 endothelial cell Anatomy 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000006862 enzymatic digestion Effects 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 210000003238 esophagus Anatomy 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 229930182833 estradiol Natural products 0.000 description 1
- 229960005309 estradiol Drugs 0.000 description 1
- 235000019325 ethyl cellulose Nutrition 0.000 description 1
- 229920001249 ethyl cellulose Polymers 0.000 description 1
- LVGKNOAMLMIIKO-QXMHVHEDSA-N ethyl oleate Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OCC LVGKNOAMLMIIKO-QXMHVHEDSA-N 0.000 description 1
- 229940093471 ethyl oleate Drugs 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 210000001508 eye Anatomy 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 238000001917 fluorescence detection Methods 0.000 description 1
- 239000006260 foam Substances 0.000 description 1
- 238000007672 fourth generation sequencing Methods 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 210000000232 gallbladder Anatomy 0.000 description 1
- WIGCFUFOHFEKBI-UHFFFAOYSA-N gamma-tocopherol Natural products CC(C)CCCC(C)CCCC(C)CCCC1CCC2C(C)C(O)C(C)C(C)C2O1 WIGCFUFOHFEKBI-UHFFFAOYSA-N 0.000 description 1
- 206010017758 gastric cancer Diseases 0.000 description 1
- 210000001035 gastrointestinal tract Anatomy 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 229960005277 gemcitabine Drugs 0.000 description 1
- SDUQYLNIPVEERB-QPPQHZFASA-N gemcitabine Chemical compound O=C1N=C(N)C=CN1[C@H]1C(F)(F)[C@H](O)[C@@H](CO)O1 SDUQYLNIPVEERB-QPPQHZFASA-N 0.000 description 1
- 229960000578 gemtuzumab Drugs 0.000 description 1
- 229960003297 gemtuzumab ozogamicin Drugs 0.000 description 1
- 230000007614 genetic variation Effects 0.000 description 1
- 230000037442 genomic alteration Effects 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 239000008187 granular material Substances 0.000 description 1
- 201000010536 head and neck cancer Diseases 0.000 description 1
- 208000014829 head and neck neoplasm Diseases 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 201000005787 hematologic cancer Diseases 0.000 description 1
- 208000019691 hematopoietic and lymphoid cell neoplasm Diseases 0.000 description 1
- 208000024200 hematopoietic and lymphoid system neoplasm Diseases 0.000 description 1
- 150000002402 hexoses Chemical class 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 230000001744 histochemical effect Effects 0.000 description 1
- 229940121372 histone deacetylase inhibitor Drugs 0.000 description 1
- 239000003276 histone deacetylase inhibitor Substances 0.000 description 1
- 238000001794 hormone therapy Methods 0.000 description 1
- 208000017819 hyperplastic polyp Diseases 0.000 description 1
- 229940099279 idamycin Drugs 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 229950004101 inotuzumab ozogamicin Drugs 0.000 description 1
- 238000009830 intercalation Methods 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 238000001990 intravenous administration Methods 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 229960004768 irinotecan Drugs 0.000 description 1
- UWKQSNNFCGGAFS-XIFFEERXSA-N irinotecan Chemical compound C1=C2C(CC)=C3CN(C(C4=C([C@@](C(=O)OC4)(O)CC)C=4)=O)C=4C3=NC2=CC=C1OC(=O)N(CC1)CCC1N1CCCCC1 UWKQSNNFCGGAFS-XIFFEERXSA-N 0.000 description 1
- 201000008632 juvenile polyposis syndrome Diseases 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 229940043355 kinase inhibitor Drugs 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 238000007834 ligase chain reaction Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 201000007270 liver cancer Diseases 0.000 description 1
- 208000014018 liver neoplasm Diseases 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 229950003526 lorvotuzumab mertansine Drugs 0.000 description 1
- 239000006210 lotion Substances 0.000 description 1
- PCZOHLXUXFIOCF-BXMDZJJMSA-N lovastatin Chemical compound C([C@H]1[C@@H](C)C=CC2=C[C@H](C)C[C@@H]([C@H]12)OC(=O)[C@@H](C)CC)C[C@@H]1C[C@@H](O)CC(=O)O1 PCZOHLXUXFIOCF-BXMDZJJMSA-N 0.000 description 1
- 229960004844 lovastatin Drugs 0.000 description 1
- QLJODMDSTUBWDW-UHFFFAOYSA-N lovastatin hydroxy acid Natural products C1=CC(C)C(CCC(O)CC(O)CC(O)=O)C2C(OC(=O)C(C)CC)CC(C)C=C21 QLJODMDSTUBWDW-UHFFFAOYSA-N 0.000 description 1
- 239000007937 lozenge Substances 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 239000012139 lysis buffer Substances 0.000 description 1
- VTHJTEIRLNZDEV-UHFFFAOYSA-L magnesium dihydroxide Chemical compound [OH-].[OH-].[Mg+2] VTHJTEIRLNZDEV-UHFFFAOYSA-L 0.000 description 1
- 239000000347 magnesium hydroxide Substances 0.000 description 1
- 229910001862 magnesium hydroxide Inorganic materials 0.000 description 1
- 230000036210 malignancy Effects 0.000 description 1
- 208000026045 malignant tumor of parathyroid gland Diseases 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000000816 matrix-assisted laser desorption--ionisation Methods 0.000 description 1
- WKPWGQKGSOKKOO-RSFHAFMBSA-N maytansine Chemical compound CO[C@@H]([C@@]1(O)C[C@](OC(=O)N1)([C@H]([C@@H]1O[C@@]1(C)[C@@H](OC(=O)[C@H](C)N(C)C(C)=O)CC(=O)N1C)C)[H])\C=C\C=C(C)\CC2=CC(OC)=C(Cl)C1=C2 WKPWGQKGSOKKOO-RSFHAFMBSA-N 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 239000002082 metal nanoparticle Substances 0.000 description 1
- 230000001035 methylating effect Effects 0.000 description 1
- 238000012164 methylation sequencing Methods 0.000 description 1
- 210000004688 microtubule Anatomy 0.000 description 1
- 229960004857 mitomycin Drugs 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 229910052590 monazite Inorganic materials 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 201000000050 myeloid neoplasm Diseases 0.000 description 1
- 208000010125 myocardial infarction Diseases 0.000 description 1
- 210000003928 nasal cavity Anatomy 0.000 description 1
- 210000001989 nasopharynx Anatomy 0.000 description 1
- 239000006199 nebulizer Substances 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 230000001613 neoplastic effect Effects 0.000 description 1
- 210000000653 nervous system Anatomy 0.000 description 1
- 239000012457 nonaqueous media Substances 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 150000003833 nucleoside derivatives Chemical class 0.000 description 1
- 201000002575 ocular melanoma Diseases 0.000 description 1
- 239000003921 oil Substances 0.000 description 1
- 235000019198 oils Nutrition 0.000 description 1
- 239000002674 ointment Substances 0.000 description 1
- 239000004006 olive oil Substances 0.000 description 1
- 235000008390 olive oil Nutrition 0.000 description 1
- 231100000590 oncogenic Toxicity 0.000 description 1
- 230000002246 oncogenic effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 208000010655 oral cavity squamous cell carcinoma Diseases 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 208000003154 papilloma Diseases 0.000 description 1
- 230000005298 paramagnetic effect Effects 0.000 description 1
- 238000007911 parenteral administration Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 239000006072 paste Substances 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 238000003068 pathway analysis Methods 0.000 description 1
- 239000000312 peanut oil Substances 0.000 description 1
- 210000003899 penis Anatomy 0.000 description 1
- GJVFBWCTGUSGDD-UHFFFAOYSA-L pentamethonium bromide Chemical compound [Br-].[Br-].C[N+](C)(C)CCCCC[N+](C)(C)C GJVFBWCTGUSGDD-UHFFFAOYSA-L 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 239000008177 pharmaceutical agent Substances 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 239000003757 phosphotransferase inhibitor Substances 0.000 description 1
- 238000000053 physical method Methods 0.000 description 1
- 239000002504 physiological saline solution Substances 0.000 description 1
- 239000006187 pill Substances 0.000 description 1
- 230000001817 pituitary effect Effects 0.000 description 1
- 229910052697 platinum Inorganic materials 0.000 description 1
- 210000004910 pleural fluid Anatomy 0.000 description 1
- 229920001481 poly(stearyl methacrylate) Polymers 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 229920000515 polycarbonate Polymers 0.000 description 1
- 239000004417 polycarbonate Substances 0.000 description 1
- 229920000728 polyester Polymers 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 229920005862 polyol Polymers 0.000 description 1
- 150000003077 polyols Chemical class 0.000 description 1
- 208000014081 polyp of colon Diseases 0.000 description 1
- 239000003910 polypeptide antibiotic agent Substances 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 150000004804 polysaccharides Chemical class 0.000 description 1
- 229920001592 potato starch Polymers 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 230000003449 preventive effect Effects 0.000 description 1
- 230000037452 priming Effects 0.000 description 1
- 230000000861 pro-apoptotic effect Effects 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 210000002307 prostate Anatomy 0.000 description 1
- 230000002685 pulmonary effect Effects 0.000 description 1
- 238000004549 pulsed laser deposition Methods 0.000 description 1
- 239000013062 quality control Sample Substances 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 239000000376 reactant Substances 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 206010038038 rectal cancer Diseases 0.000 description 1
- 201000001275 rectum cancer Diseases 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 210000001525 retina Anatomy 0.000 description 1
- 229930002330 retinoic acid Natural products 0.000 description 1
- 150000004492 retinoid derivatives Chemical class 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- RHFUOMFWUGWKKO-UHFFFAOYSA-N s2C Natural products S=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 RHFUOMFWUGWKKO-UHFFFAOYSA-N 0.000 description 1
- ULRUOUDIQPERIJ-PQURJYPBSA-N sacituzumab govitecan Chemical compound N([C@@H](CCCCN)C(=O)NC1=CC=C(C=C1)COC(=O)O[C@]1(CC)C(=O)OCC2=C1C=C1N(C2=O)CC2=C(C3=CC(O)=CC=C3N=C21)CC)C(=O)COCC(=O)NCCOCCOCCOCCOCCOCCOCCOCCOCCN(N=N1)C=C1CNC(=O)C(CC1)CCC1CN1C(=O)CC(SC[C@H](N)C(O)=O)C1=O ULRUOUDIQPERIJ-PQURJYPBSA-N 0.000 description 1
- 229950000143 sacituzumab govitecan Drugs 0.000 description 1
- 235000005713 safflower oil Nutrition 0.000 description 1
- 239000003813 safflower oil Substances 0.000 description 1
- 229960001548 salinomycin Drugs 0.000 description 1
- 235000019378 salinomycin Nutrition 0.000 description 1
- 210000003079 salivary gland Anatomy 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 239000004054 semiconductor nanocrystal Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 239000008159 sesame oil Substances 0.000 description 1
- 235000011803 sesame oil Nutrition 0.000 description 1
- 238000010008 shearing Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 201000000849 skin cancer Diseases 0.000 description 1
- 201000003708 skin melanoma Diseases 0.000 description 1
- 210000000813 small intestine Anatomy 0.000 description 1
- 235000019812 sodium carboxymethyl cellulose Nutrition 0.000 description 1
- 229920001027 sodium carboxymethylcellulose Polymers 0.000 description 1
- 239000004289 sodium hydrogen sulphite Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 239000003549 soybean oil Substances 0.000 description 1
- 235000012424 soybean oil Nutrition 0.000 description 1
- 238000009987 spinning Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 210000003802 sputum Anatomy 0.000 description 1
- 208000024794 sputum Diseases 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 239000008174 sterile solution Substances 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 201000011549 stomach cancer Diseases 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- LSNNMFCWUKXFEE-UHFFFAOYSA-L sulfite Chemical compound [O-]S([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-L 0.000 description 1
- 210000004243 sweat Anatomy 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 239000000454 talc Substances 0.000 description 1
- 229910052623 talc Inorganic materials 0.000 description 1
- 229960001603 tamoxifen Drugs 0.000 description 1
- DKPFODGZWDEEBT-QFIAKTPHSA-N taxane Chemical class C([C@]1(C)CCC[C@@H](C)[C@H]1C1)C[C@H]2[C@H](C)CC[C@@H]1C2(C)C DKPFODGZWDEEBT-QFIAKTPHSA-N 0.000 description 1
- 101150056532 terf2ip gene Proteins 0.000 description 1
- 210000001550 testis Anatomy 0.000 description 1
- 238000005382 thermal cycling Methods 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 210000001541 thymus gland Anatomy 0.000 description 1
- 210000001685 thyroid gland Anatomy 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
- 229940044693 topoisomerase inhibitor Drugs 0.000 description 1
- 239000000196 tragacanth Substances 0.000 description 1
- 235000010487 tragacanth Nutrition 0.000 description 1
- 229940116362 tragacanth Drugs 0.000 description 1
- 229940125725 tranquilizer Drugs 0.000 description 1
- 239000003204 tranquilizing agent Substances 0.000 description 1
- 230000002936 tranquilizing effect Effects 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 238000002054 transplantation Methods 0.000 description 1
- 229960000575 trastuzumab Drugs 0.000 description 1
- 229960001612 trastuzumab emtansine Drugs 0.000 description 1
- 208000022271 tubular adenoma Diseases 0.000 description 1
- 239000000107 tumor biomarker Substances 0.000 description 1
- 230000009452 underexpressoin Effects 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 210000003932 urinary bladder Anatomy 0.000 description 1
- 201000005112 urinary bladder cancer Diseases 0.000 description 1
- 206010046766 uterine cancer Diseases 0.000 description 1
- 210000004291 uterus Anatomy 0.000 description 1
- 210000001215 vagina Anatomy 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 235000019165 vitamin E Nutrition 0.000 description 1
- 239000011709 vitamin E Substances 0.000 description 1
- 229940046009 vitamin E Drugs 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
- 229960002760 ziv-aflibercept Drugs 0.000 description 1
- 239000011729 δ-tocotrienol Substances 0.000 description 1
- ODADKLYLWWCHNB-LDYBVBFYSA-N δ-tocotrienol Chemical compound OC1=CC(C)=C2O[C@@](CC/C=C(C)/CC/C=C(C)/CCC=C(C)C)(C)CCC2=C1 ODADKLYLWWCHNB-LDYBVBFYSA-N 0.000 description 1
- 235000019144 δ-tocotrienol Nutrition 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/154—Methylation markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Engineering & Computer Science (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Analytical Chemistry (AREA)
- Zoology (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Physics & Mathematics (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Hospice & Palliative Care (AREA)
- Biophysics (AREA)
- Oncology (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明尤其提供用于癌症检测(例如筛检)的方法及与其相关的组合物。在各种实施方式中,本发明提供用于结直肠及/或晚期腺瘤检测(例如筛检)的方法及与其相关的组合物。在各种实施方式中,本发明提供用于筛检的方法,其包括分析一种或多种甲基化生物标记的甲基化状态;及与所述方法相关的组合物。在各种实施方式中,本发明提供用于检测(例如筛检)的方法,其包括检测(例如筛检)cfDNA中,例如ctDNA中的一种或多种甲基化生物标记的甲基化状态。在各种实施方式中,本发明提供用于筛检的方法,其包括使用下一代测序技术检测(例如筛检)cfDNA中,例如ctDNA中的一种或多种甲基化生物标记的甲基化状态。
Description
技术领域
本发明大体上涉及用于识别用以检测疾病或病状(诸如癌症)的生物标记的方法及系统。
背景技术
疾病检测为预防疾病进展、诊断及治疗的重要组成部分。举例而言,早期检测结直肠癌(colorectal cancer;CRC)已显示,经由对CRC的早期治疗,能大幅度改善罹患CRC的患者的结果。然而,尽管当前工具可用于筛检及诊断CRC及其他癌症,但每年仍有数百万个体死于可经由早期干预及检测来治疗的诸如CRC的疾病。当前用以筛检及诊断疾病的工具不足。
DNA甲基化为影响多种细胞过程(包括例如细胞分化)的控制机制。因此,甲基化失调可导致包括癌症的疾病。DNA甲基化的累积变化(例如高甲基化或低甲基化),尤其当所述变化位于关键基因中时,可产生癌性细胞。甲基化状态的此等变化若得到检测,则可用于预测受试者对罹患癌症的易感性,以及癌症及潜在其他疾病的产生或存在。
用于分析给定生物体的全基因组甲基化状态的最常见方法是全基因组亚硫酸氢盐测序(whole genome bisulfite sequencing;WGBS)。在此方法中,样品DNA中的单胞嘧啶的甲基化状态是藉由首先用亚硫酸氢钠处理DNA(例如呈片段化形式),之后进行测序来测定。DNA甲基化最多地在CpG二核苷酸处存在于哺乳动物中—CpG二核苷酸为DNA区,其中沿着其5'→3'方向在碱基的线性序列中胞嘧啶核苷酸后紧接着鸟嘌呤核苷酸。在WGBS中,亚硫酸氢钠用于将未甲基化胞嘧啶转化成尿嘧啶,而胞嘧啶的甲基化形式(例如5-甲基胞嘧啶及5-羟甲基胞嘧啶)保持不变。随后,例如经由下一代测序技术对经亚硫酸氢盐处理的DNA片段进行测序。需要特定算法及/或工具,诸如Bismark,以定位序列读段及在CpG、CHG及CHH情形下以单碱基分辨率进行甲基化识别(methylation calling)。因此,WGBS技术识别全基因组的单胞嘧啶甲基化位点。然而,该方法可能对于特定短基因组区的分辨率较低,所述特定短基因组区可在进一步差异甲基化区的分析的情形下用作特定疾病或病状的生物标记。
因此,需要用于分析DNA的甲基化状态及识别甲基化生物标记的改良方法、系统及设备。具体而言,需要用于诊断及/或分类结直肠赘瘤的方法。
发明内容
本发明尤其提供用于识别用以检测疾病或病状的生物标记的各种系统、方法及设备。本文所论述的疾病或病状可为例如晚期腺瘤、结直肠癌、其他癌症或与异常甲基化状态相关联的其他疾病或病状(例如,神经退化性疾病、肠胃道病症及其类似者)。
在各种实施方式中,本发明提供用于检测结直肠癌及/或晚期腺瘤的方法,其包括分析受试者的cfDNA(例如ctDNA)中的一种或多种甲基化生物标记。在各种实施方式中,本发明提供用于结直肠癌及/或晚期腺瘤检测的方法,其包括使用下一代测序(nextgeneration sequencing;NGS)技术(例如靶向NGS技术、基于杂交捕获的NGS技术)测定DNA(例如cfDNA)中的一种或多种甲基化生物标记的甲基化状态。本文所提供的各种方法适用于藉由分析受试者的可获取组织样品,例如作为血液或血液组分(例如cfDNA,例如ctDNA)的组织样品进行结直肠癌及/或晚期腺瘤筛检。
在各种实施方式中,本文所描述的方法包括筛检cfDNA(例如ctDNA)中的一种或多种突变标记的突变。经由本文所描述的检测方法识别的突变可用于结合甲基化生物标记的甲基化状态进一步分类及/或诊断疾病或病状。举例而言,可在对单个样品进行的同一分析(例如NGS分析)中获取(例如同时)是否存在突变标记的突变及甲基化标记的甲基化状态的情况。在同一分析中获得对应于甲基化及突变标记的信息允许藉由不必进行单独分析来降低成本及增加效率。另外或可替代地,突变标记可允许进一步分类疾病或病状(例如癌症)。针对一种或多种突变的存在及/或不存在,亦可允许识别或建议治疗该疾病及/或病状的疗法。
在各种实施方式中,本发明涉及用于识别受试者(例如人类受试者)的cfDNA中甲基化生物标记的甲基化状态及/或基于一种或多种已知生物标记的甲基化状态检测(例如筛检)疾病及/或病状(例如癌症)的方法及/或系统。
本发明涉及一种检测人类个体的结直肠癌的方法,该方法包括:测定在来自从该受试者获得的样品的DNA中识别的表9、表10、表11及/或图2的DMR中的每一个的至少一部分的甲基化状态;及至少部分地基于表9、10、11及/或图2的DMR中的每一个的至少一部分的经测定甲基化状态相比于来自未患该疾病的受试者的参考样品时更高或更低,来判定该受试者是否患有结直肠癌。
在某些实施方式中,表9、表10、表11及/或图2的DMR中的每一个是包含至少一部分的甲基化基因座,该至少一部分包含至少三(3)个CpG,且所述甲基化基因座各自的长度等于或小于5000bp。
在某些实施方式中,获自甲基化生物标记读数的依读段(read-wise)甲基化值用于例如使用分类模型来识别或诊断疾病。在某些实施方式中,甲基化生物标记的依读段甲基化值可基于未受疾病及/或病状影响的对照DNA样品(例如来自“健康”受试者的cfDNA、血沉棕黄层DNA、来自“健康”组织的DNA)的多个甲基化读数与受疾病或病状影响的病理性DNA样品(例如cfDNA,例如ctDNA)的多个甲基化读数相比的比较。
在各种实施方式中,本发明涉及使用NGS测序数据获得一种或多种目标生物标记(例如DMR)的依读段甲基化值的方法及/或系统。尽管应理解个别标记的甲基化状态可能改变罹患疾病的受试者的DNA,但当前用于识别异常甲基化的基于生物信息的工具不足以精确检测异常甲基化模式。举例而言,当前工具对于对照与疾病病状之间的甲基化状态变化不够敏感,无法检测到甲基化标记的显著甲基化变化。另外,此类工具的信噪比较高,尤其当如在某些疾病中使用cfDNA作为样品源时,样品中的cfDNA的量在血液或血浆样品中可为较小的。甲基化的依读段评估允许更适当地识别及评估甲基化。
在各种实施方式中,本发明涉及用于在DNA,例如cfDNA的样品上进行下一代测序法(NGS)的方法及/或系统。DNA样品上的NGS测序典型地使用标准组制造试剂盒及技术进行。然而,标准NGS技术可能不足以覆盖目标区,尤其当区的GC含量可能在区与区之间变化较大。举例而言,甲基化标记可能具有高GC含量,而突变标记可能具有低GC含量。在某些NGS测序条件下,GC含量变化可导致具有高GC含量的区过表达及/或低GC含量区过低表达。增加高GC含量区的GC覆盖度所采用的步骤可转而减少低GC含量区的覆盖度(或反之亦然)。另外,当前NGS测序技术缺乏足以用于测定样品数据质量的方式。
在某些实施方式中,本文所揭示的方法及系统可改良NGS测序数据质量。在某些实施方式中,低GC含量区的覆盖度可藉由改变探针设计及/或与DNA样品处理相关的实验参数来改善。举例而言,具有低CG含量的突变标记的测序可藉由增加探针平铺密度及/或在低GC含量区中重叠探针来改善。在某些实施方式中,GC丢弃(dropout)率用作质量控制值以评估NGS测序覆盖度。GC丢弃率指示高GC含量目标区(例如,具有大于50% GC含量的区)的覆盖度。在某些实施方式中,需要具有低GC丢弃率(例如,6%或更小)的测序数据。
在某些实施方式中,DNA的转化率用于定量评估NGS数据质量。举例而言,DNA的对照序列(例如掺入(spike-in)对照)的转化可用于评估未甲基化及/或甲基化胞嘧啶至尿嘧啶的转化(例如亚硫酸氢盐或酶转化)率。当例如亚硫酸氢盐或酶处理DNA时,未甲基化胞嘧啶至尿嘧啶的高转化效率为合乎需要的。当研究经测序、经转化DNA的资料时,未经转化的胞嘧啶典型地识别为甲基化的。在某些实施方式中,甲基化胞嘧啶至尿嘧啶的低转化率为合乎需要的。在某些实施方式中,改变与DNA转化相关的参数以提高或改变转化率。举例而言,提高亚硫酸氢盐试剂与DNA的比率可用于改变转化率。在某些实施方式中,改变包括多个循环(例如,多个变性及转化步骤)、循环中的步骤时间、循环的温度或其组合的热循环步骤可经调节以影响转化率。
在一个方面中,本发明涉及一种方法,其包含:将样品中的多个DNA片段的未甲基化胞嘧啶转化成尿嘧啶以产生多个经转化DNA片段,其中该多个DNA片段获自生物样品;且对该多个经转化DNA片段进行测序以产生多个序列读段,其中各序列读段对应于经转化DNA片段。
在某些实施方式中,转化多个DNA片段的未甲基化胞嘧啶包括对多个DNA片段进行亚硫酸氢盐处理。在某些实施方式中,多个DNA片段包含双链DNA片段且亚硫酸氢盐处理包含:(i)使样品中的多个DNA片段变性以产生多个单链DNA片段,及(ii)将多个单链DNA片段的未甲基化胞嘧啶转化成尿嘧啶以产生多个经转化DNA片段。在某些实施方式中,在90℃-97℃的温度下执行(i)的变性步骤。在某些实施方式中,执行(i)的变性步骤小于10分钟、小于5分钟或小于2分钟(例如,若重复步骤(i),则每次重复亦如此)。在某些实施方式中,在55℃-65℃的温度下执行(ii)的转化步骤。在某些实施方式中,执行(ii)的转化步骤小于5小时、小于4.5小时、小于4小时、小于3小时、小于2小时、小于1小时、小于30分钟、或小于15分钟、小于5分钟(例如,若重复步骤(i),则每次重复亦如此)。在某些实施方式中,在93℃至97℃范围内的温度下(例如,在约95℃下)执行(i)的变性步骤约1分钟,且在58℃至62℃范围内的温度下(例如,在60℃下)执行(ii)的转化步骤约10分钟。在某些实施方式中,重复(i)的变性步骤及(ii)的转化步骤。在某些实施方式中,重复(i)的变性步骤及(ii)的转化步骤至少五次、至少十次、至少十五次或至少20次。
在某些实施方式中,转化多个DNA片段的未甲基化胞嘧啶包含对多个DNA片段进行酶处理。
在某些实施方式中,转化多个DNA片段的未甲基化胞嘧啶包含使多个DNA片段变性(例如使用甲酰胺,使用氢氧化钠)。
在某些实施方式中,在对多个DNA片段进行酶处理之前,对多个DNA片段执行变性。
在某些实施方式中,酶处理包括使多个DNA片段与载脂蛋白B mRNA编辑催化多肽样(Apolipoprotein B mRNA Editing Catalytic Polypeptide-like;APOBEC)家族(例如APOBEC-1、APOBEC-2、APOBEC-3A、APOBEC-3B、APOBEC-3C、APOBEC-3D、APOBEC-3E、APOBEC-3F、APOBEC-3G、APOBEC-3H、APOBEC-4及/或活化诱导性(胞苷)去胺酶(Activation-induceddeaminase;AID))的成员接触(例如,其中多个DNA片段与APOBEC(例如APOBEC反应缓冲液)接触)。
在某些实施方式中,对多个DNA片段进行酶处理执行小于4小时、小于3小时、小于2小时、小于1小时、小于30分钟或小于15分钟(例如,其中多个DNA片段经受APOBEC处理约2至约4小时,例如约3小时)。
在某些实施方式中,多个DNA片段包含多个无细胞DNA(cell-free DNA;cfDNA)片段。
在某些实施方式中,多个DNA片段包含细胞DNA片段。
在某些实施方式中,多个DNA片段(总计)包含至少1ng、至少5ng、至少10ng或至少20ng DNA。
在某些实施方式中,多个DNA片段基本上由各自长度在100bp至600bp范围内(例如,约125bp至约200bp,或约140bp至约160bp(例如,对于cfDNA))(例如,约150bp至约350bp,或约200bp至约300bp(例如,对于剪切DNA))的DNA片段组成。
在某些实施方式中,多个DNA片段基本上由各自长度在1000bp至200,000bp范围内[例如,平均长度为约10,000bp(例如,对于基因组DNA,例如,来自包含组织或血沉棕黄层的样品)]的DNA片段组成。
在某些实施方式中,多个序列读段为至少50bp、至少100bp、至少150bp、至少200bp、至少300bp、至少400bp、至少500bp或更长。
在某些实施方式中,测序步骤包含成对末端测序。
在某些实施方式中,测序步骤包含单端测序。
在某些实施方式中,生物样品包含血液、血清、尿液、血浆或粪便。
在某些实施方式中,生物样品包含结直肠细胞、息肉细胞、腺细胞或癌细胞。
在某些实施方式中,生物样品为来自哺乳动物的生物样品。
在某些实施方式中,生物样品为来自人类的生物样品。
在某些实施方式中,该方法进一步包括自生物样品片段化DNA以产生多个DNA片段。
在某些实施方式中,该方法包括将转接子(adapter)附接至多个经转化DNA片段(例如,在测序步骤之前)。在某些实施方式中,该方法包括将转接子附接至多个经转化DNA片段的5'端及3'端两者。在某些实施方式中,执行附接步骤以使得至少40%、至少50%、至少60%、至少70%的经转化DNA片段附接至转接子。在某些实施方式中,转接子包含样品索引(sample index)。在某些实施方式中,转接子包含片段条形码。在某些实施方式中,附接转接子包括连接。在某些实施方式中,附接转接子包括PCR。在某些实施方式中,执行附接步骤以使得至少40%、至少50%、至少60%、至少70%的经转化DNA片段具有在5'端及3'端处附接的转接子。在某些实施方式中,经转化单链DNA片段的5'端、3'端或两者处的转接子包含样品索引。在某些实施方式中,经转化单链DNA片段的5'端、3'端或两者处的转接子包含片段条形码。在某些实施方式中,经转化单链DNA片段中的每一个上的片段条形码为不同的。在某些实施方式中,经转化单链DNA片段中的至少两者上的片段条形码相同,其中至少两个经转化单链DNA片段在生物样品中不与彼此成沃森-克里克(Watson-Crick)配对。
在某些实施方式中,该方法包括扩增已附接有转接子的多个经转化DNA片段(例如,其中该方法包括扩增使用经转化DNA片段制备的库)。
在某些实施方式中,该方法进一步包括富集经转化DNA片段。在某些实施方式中,富集包括选择性富集。在某些实施方式中,选择性富集包括扩增。在某些实施方式中,选择性富集包括杂交捕获。在某些实施方式中,杂交捕获包括用捕获探针捕获经转化DNA片段的子集,所述捕获探针靶向所关注的基因组中的一个或多个基因组区(例如DMR)。
在某些实施方式中,一个或多个基因组区包含有包含一个或多个CpG位点的区。
在某些实施方式中,一个或多个基因组区包含具有高GC含量(例如约70%至约80% GC含量)或低GC含量(例如约30%至约40% GC含量)的区。
在某些实施方式中,一个或多个基因组区包含GC含量介于约50%至约60% GC含量范围内的区。
在某些实施方式中,一个或多个基因组区包含一个或多个基因组突变。在某些实施方式中,一个或多个基因组区包含(i)包含一个或多个CpG位点的区及(ii)已知包括一个或多个基因组突变的区。
在某些实施方式中,一个或多个基因组突变包含单核苷酸变异体、倒置、缺失、插入、颠换、易位、融合、截短、扩增或其组合。
在某些实施方式中,一个或多个基因组区包含NRAS基因、PTEN基因、PIK3CA基因、STK11基因、TP53基因、KIT基因、MET基因、KRAS基因、BRAF基因或EGFR基因的至少一部分。
在某些实施方式中,捕获探针为重叠捕获探针(例如其中捕获探针是平铺的)。在某些实施方式中,捕获探针重叠至少10bp、至少20bp、至少30bp、至少40bp、至少50bp、至少60bp、至少70bp、至少80bp、至少90bp或至少100bp。
在某些实施方式中,捕获探针的长度为约50bp至约200bp(例如长度为约120bp)。
在某些实施方式中,捕获探针包含至少一个靶向完全甲基化基因组区的捕获探针。
在某些实施方式中,捕获探针包含至少一个靶向完全未甲基化基因组区的捕获探针。
在某些实施方式中,捕获探针包含至少一个靶向部分甲基化基因组区(例如其中至少1个CpG位点经甲基化)的捕获探针。
在某些实施方式中,靶向基因组区(例如完全甲基化区、部分甲基化区、完全未甲基化区)的捕获探针不捕获与靶向序列确切对应的DNA片段。捕获探针可与DNA片段结合(例如杂交)且在一些碱基对(例如非沃森-克里克碱基配对)之间形成错配键。举例而言,在某些实施方式中,当捕获探针与DNA片段结合(例如与DNA片段杂交)时,可容许至多8个错配(例如非沃森-克里克碱基配对)。错配允许例如靶向完全甲基化基因组区的捕获探针与可部分甲基化的DNA片段杂交。
在某些实施方式中,捕获探针包含至少一个靶向编码链的捕获探针。
在某些实施方式中,捕获探针包含至少一个靶向模板链(例如非编码链)的捕获探针。
在某些实施方式中,捕获探针包含靶向一个或多个基因组区中的至少一个的捕获探针的群组,其中捕获探针的群组包含:(i)至少一个靶向基因组区的完全甲基化模板链的捕获探针;(ii)至少一个靶向基因组区的完全甲基化编码链的捕获探针;(iii)至少一个靶向基因组区的完全未甲基化模板链的捕获探针;及(iv)至少一个靶向基因组区的完全未甲基化编码链的捕获探针(例如,其中捕获探针的群组具有至少四个靶向基因组区的捕获探针-一个靶向至正向(例如编码)链的甲基化型式的捕获探针,一个靶向至正向(例如编码)链的未甲基化型式的捕获探针,一个靶向至反向(例如非编码)链的甲基化型式的捕获探针及一个靶向至反向(例如非编码)链的未甲基化型式的捕获探针)。
在某些实施方式中,靶向所关注的基因组中的一个或多个基因组区的捕获探针靶向与所关注的基因组中的一个或多个基因组区不超过1000个相似区、不超过500个相似区、不超过400个相似区、不超过300个相似区、不超过200个相似区、不超过100个相似区、不超过25个相似区、不超过10个相似区、不超过5个相似区(例如,其中靶向一个或多个基因组区中之一的捕获探针与所关注的靶向区类似的不超过1000个区杂交)(例如,其中使用24bp序列窗口定量目标基因组区与另一类似区的相似度)。
在某些实施方式中,(i)第一组捕获探针靶向一个或多个基因组区,该一个或多个基因组区包含有包含一个或多个CpG位点的区,且第二组捕获探针靶向已知包括一个或多个基因组突变的一个或多个基因组区,及(ii)第一组捕获探针不包括重叠捕获探针且第二组捕获探针包括重叠捕获探针。在某些实施方式中,重叠探针重叠至少10%、至少20%、至少30%、至少40%、至少50%、至少60%或更多。
在某些实施方式中,捕获探针中的至少两个靶向同一基因组区。
在某些实施方式中,捕获探针靶向至少2个、至少4个、至少9个、至少10个、至少25个、至少50个、至少75个、至少100个、至少150个、至少200个、至少203个、至少220个基因组区。
在某些实施方式中,捕获探针为RNA探针。
在某些实施方式中,捕获探针为DNA探针。
在某些实施方式中,一个或多个基因组区中的每一个的长度等于或小于5000bp、4000bp、3000bp、2000bp、1000bp、950bp、900bp、850bp、800bp、750bp、700bp、650bp、600bp、550bp、500bp、450bp、400bp、350bp、300bp、250bp、200bp、150bp、100bp、50bp、40bp、30bp、20bp或10bp。
在某些实施方式中,一个或多个基因组区中的至少一个具有至少5000bp、4000bp、3000bp、2000bp、1000bp、950bp、900bp、850bp、800bp、750bp、700bp、650bp、600bp、550bp、500bp、450bp、400bp、350bp、300bp、250bp、200bp、150bp、100bp、50bp、40bp、30bp、20bp或10bp的长度。
在某些实施方式中,该方法进一步包括扩增经转化DNA片段。在某些实施方式中,扩增步骤在选择性富集步骤之后进行。
在某些实施方式中,所测序的该多个经转化DNA片段对应于至少30%、至少40%或至少50%的藉由杂交捕获所捕获的经转化DNA片段。
在某些实施方式中,该方法进一步包括添加对照DNA分子至样品中,其中在添加对照DNA至样品中之前已测定对照DNA分子的序列、甲基化碱基的数目及未甲基化碱基的数目。在某些实施方式中,该方法进一步包括将样品中的对照DNA分子的未甲基化胞嘧啶转化成尿嘧啶以产生经转化的对照DNA分子;及对经转化的对照DNA分子进行测序以产生多个对照序列读段。在某些实施方式中,同时进行对照DNA分子及DNA片段的未甲基化胞嘧啶的转化。在某些实施方式中,同时对经转化对照DNA分子及DNA片段进行测序。在某些实施方式中,该方法进一步包括测定对照DNA分子的未甲基化胞嘧啶转化为尿嘧啶的数目。
在某些实施方式中,对照DNA分子中至少90%、至少95%、至少96%、至少97%、至少98%、至少99%的未甲基化胞嘧啶转化成尿嘧啶。
在某些实施方式中,该方法进一步包括测定对照DNA分子的甲基化胞嘧啶转化为尿嘧啶的数目。在某些实施方式中,多个DNA片段中至多5%、至多4%、至多3%、至多2%或至多1%的甲基化胞嘧啶转化成尿嘧啶。
在另一方面中,本发明涉及一种方法,其包括:将多个序列读段映射(mapping)至参考序列,其中多个序列读段对应于样品(例如,来自个体的cfDNA样品,未知是否该个体罹患与异常DNA甲基化水平相关的疾病、病症或病状)中的多个经转化DNA片段,其中样品中多个DNA片段的未甲基化胞嘧啶已转化为尿嘧啶以产生多个经转化DNA片段,多个序列读段包含一个或多个(例如共同)映射至一个或多个基因组区的序列读段的子集,且各序列读段子集包含映射至独特基因组区(例如DMR)的序列读段;及测定一个或多个序列读段子集中的每一个的甲基化水平[(例如测定各序列读段子集的甲基化水平)(例如测定各基因组区的甲基化水平)(例如,其中给定子集的甲基化水平对应于子集中多个满足临限条件的序列读段(例如按库大小标准化),例如其中该临限条件包含最小总CpG计数及最小甲基化CpG计数(例如经甲基化的最小CpG%))(例如,其中DMR的给定读段不必覆盖整个DMR)]。
在某些实施方式中,该方法进一步包括:将多个序列读段映射至参考序列,其中多个序列读段对应于样品中的多个经转化DNA片段,其中样品中多个DNA片段的未甲基化胞嘧啶已转化为尿嘧啶以产生多个经转化DNA片段,多个序列读段包含一个或多个(例如共同)映射至一个或多个基因组区的序列读段的子集,且各序列读段子集包含映射至独特基因组区(例如DMR)的序列读段;及测定一个或多个序列读段子集中的每一个的甲基化水平[(例如测定各序列读段子集的甲基化水平)(例如各基因组区的甲基化水平)(例如,其中给定子集的甲基化水平对应于子集中多个满足临限条件的序列读段(例如按库大小标准化),例如其中该临限条件包含最小总CpG计数及最小甲基化CpG计数(例如经甲基化的最小CpG%))(例如,其中DMR的给定读段不必覆盖整个DMR)]。
在某些实施方式中,一个或多个基因组区中的每一个的长度等于或小于5000bp、4000bp、3000bp、2000bp、1000bp、950bp、900bp、850bp、800bp、750bp、700bp、650bp、600bp、550bp、500bp、450bp、400bp、350bp、300bp、250bp、200bp、150bp、100bp、50bp、40bp、30bp、20bp或10bp。
在某些实施方式中,一个或多个基因组区中的至少一个具有至少5000bp、4000bp、3000bp、2000bp、1000bp、950bp、900bp、850bp、800bp、750bp、700bp、650bp、600bp、550bp、500bp、450bp、400bp、350bp、300bp、250bp、200bp、150bp、100bp、50bp、40bp、30bp、20bp、10bp或8bp的长度。
在某些实施方式中,一个或多个基因组区包含至少2个、至少4个、至少9个、至少10个、至少25个、至少50个、至少75个、至少100个、至少150个、至少200个、至少203个、至少220个基因组区。
在某些实施方式中,参考序列为经亚硫酸氢盐转化的基因组。
在某些实施方式中,参考序列为经亚硫酸氢盐转化的人类基因组。
在某些实施方式中,测定一个或多个序列读段子集中的每一个的甲基化水平包括:针对给测序列读段,测定CpG位点的总数及甲基化CpG位点的总数。在某些实施方式中,测定一个或多个序列读段子集中的每一个的甲基化水平包括:对给测序列读段指定一定值(例如二进制值),其中该值藉由比较(i)读段中的CpG位点的总数或读段中的甲基化CpG位点的总数或按读段中的CPG位点的总数及甲基化CpG位点的总数计的数目(例如,经甲基化的CpG位点的总数百分比)与(ii)一个或多个参考值(例如,CpG位点的总数的临限值及经甲基化的CpG位点的百分比临限值)来确定。
在某些实施方式中,测定映射至给定基因组区的序列读段的给定子集的甲基化水平包含对子集中的序列读段所指定的值求和,且针对各序列读段子集重复此测定(例如其中各序列读段子集映射至独特DMR,且其中测定各DMR的甲基化水平)。在某些实施方式中,该方法包括至少部分地基于求和值检测(例如使用机器学习算法)与异常DNA甲基化水平相关的疾病、病症或病状。
在某些实施方式中,该方法包括至少部分地基于一个或多个序列读段子集中的每一个的甲基化水平检测(例如使用机器学习算法)与异常DNA甲基化水平相关的疾病、病症或病状。
在某些实施方式中,该方法进一步包含去重测序读段。
在某些实施方式中,在测定一个或多个序列读段子集中个别序列读段的甲基化水平之前进行去重测序读段。
在某些实施方式中,去重序列读段包括去重光学重复序列读段。在某些实施方式中,光学重复序列读段共享影像块(例如用于NGS的流动槽上的斑点)。在某些实施方式中,光学重复序列读段之间的距离小于2500bp、小于2000bp、小于1500bp、小于1000bp、小于500bp、小于100bp。
在某些实施方式中,去重序列读段包括去重PCR重复测序读段及/或过度测序重复序列读段。在某些实施方式中,若两个或更多个序列读段具有(1)5'端坐标,(2)3'端坐标且(3)读段上的各给定特定CpG位置的甲基化状态相同(例如,对读段上的各给定特定CpG位置指定的二进制值相同),则该两个或更多个序列读段视为PCR重复测序读段及/或过度测序重复序列读段,其中序列读段的5'端坐标及3'端坐标分别对应于映射至参考序列的序列读段的最5'(5'-most)核苷酸及最3'(3'-most)核苷酸处的位置。
在某些实施方式中,去重序列读段不包含移除在特定CpG位置处具有不同甲基化状态的重复序列读段。
在某些实施方式中,去重序列读段包括对与在生物样品中彼此成沃森-克里克配对的链对应的序列读段去重。
在某些实施方式中,该方法包括在映射之前自多个序列读段中的每一个之一或两个末端移除一个或多个核酸碱基(例如其中一个或多个核酸碱基对应于转接子序列、索引及/或条形码)。
在某些实施方式中,该方法进一步包括测定各序列读段子集的GC丢弃率。在某些实施方式中,GC丢弃率小于6%。
在某些实施方式中,将多个序列读段映射至参考序列进一步包括确定中靶比率(例如百分比),其中中靶比率为多个序列读段的中靶及/或近靶(near-target)碱基的数目与多个序列读段的所映射碱基的总数的比率。在某些实施方式中,中靶比率为至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少99%。
在某些实施方式中,将多个序列读段映射至参考序列进一步包括确定脱靶比率(例如百分比),其中脱靶比率为多个序列读段的脱靶碱基的数目与多个序列读段的所映射碱基的总数的比率。在某些实施方式中,脱靶比率小于95%、小于90%、小于85%、小于80%、小于70%、小于60%、小于50%、小于40%、小于30%、小于20%、小于10%、小于5%。
在某些实施方式中,将多个序列读段映射至参考序列进一步包括确定多个所映射序列读段中的每一个的映射质量评分,其中映射质量评分为对应于序列读段错位(例如其中序列读段的映射位置不正确)的机率的值(例如其中映射质量评分为序列读段错位的机率的对数的函数)。
在某些实施方式中,该方法包括:若序列读段的映射质量评分为至少10、至少15、至少20、至少25、至少30,则测定一个或多个子集中的序列读段的甲基化水平。
在某些实施方式中,映射质量评分为单一末端映射质量评分。
在某些实施方式中,映射质量评分为成对末端映射质量评分。
在某些实施方式中,该方法进一步包括基于来自多个序列读段的序列信息检测是否存在一个或多个突变。在某些实施方式中,一个或多个基因组突变包含单核苷酸变异体、倒置、缺失、插入、颠换、易位、融合、截短、扩增或其组合。在某些实施方式中,一个或多个突变存在于NRAS基因、PTEN基因、PIK3CA基因、STK11基因、TP53基因、KIT基因、MET基因、KRAS基因、BRAF基因及EGFR基因中的一个或多个中。
在某些实施方式中,一个或多个基因组区中的一个为甲基化基因座,其包含选自图2或图3的DMR的差异甲基化区(DMR)的至少一部分(例如至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%)。
在某些实施方式中,一个或多个基因组区包含在基因DLX6-AS1内的甲基化基因座;及在基因GDF6内的甲基化基因座。
在某些实施方式中,一个或多个基因组区包含在基因ZAN内的甲基化基因座。在某些实施方式中,一个或多个基因组区进一步包含[chr14:97412990-97413410](SEQ ID NO:374)内的甲基化基因座。
在某些实施方式中,一个或多个基因组区中的每一个的长度等于或小于5000bp、4000bp、3000bp、2000bp、1000bp、950bp、900bp、850bp、800bp、750bp、700bp、650bp、600bp、550bp、500bp、450bp、400bp、350bp、300bp、250bp、200bp、150bp、100bp、50bp、40bp、30bp、20bp或10bp。
在某些实施方式中,一个或多个基因组区中的至少一个具有至少5000bp、4000bp、3000bp、2000bp、1000bp、950bp、900bp、850bp、800bp、750bp、700bp、650bp、600bp、550bp、500bp、450bp、400bp、350bp、300bp、250bp、200bp、150bp、100bp、50bp、40bp、30bp、20bp或10bp的长度。
在某些实施方式中,该方法为检测一种或多种与癌症有关的生物标记的方法。
在某些实施方式中,该方法为检测一种或多种与晚期腺瘤有关的生物标记的方法。
在某些实施方式中,该方法为检测一种或多种与结直肠癌有关的生物标记的方法。
在某些实施方式中,该方法为检测一种或多种与疾病、病症或病状有关的生物标记的方法,该疾病、病症或病状与异常DNA甲基化水平有关。在某些实施方式中,该疾病、病症或病状为或包含肠胃道病症或神经退化性病症。
在另一方面中,本发明涉及一种检测(例如筛检)人类受试者的结直肠癌的方法,该方法包括:测定来自从受试者获得的样品的DNA中所识别的至少两种或更多种标记中的每一个的甲基化状态,及至少部分地基于所述两种或更多种标记中的每一个的经测定甲基化状态,判定该受试者是否患有结直肠癌,其中所述两种或更多种标记中的每一个为甲基化基因座,该甲基化基因座包含选自图2的DMR的差异甲基化区(DMR)的至少一部分(例如至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%)。
在某些实施方式中,该方法包括测定以下DMR中的每一个的至少一部分(例如至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%)的甲基化状态:
表8:CRC的2-DMR组别(panel)
chr | 起始 | 结束 | SEQ ID NO. |
7 | 96997902 | 96999222 | SEQ ID NO.:92 |
8 | 96145538 | 96145718 | SEQ ID NO.:108 |
在某些实施方式中,该方法包括测定以下DMR中的每一个的至少一部分(例如至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%)的甲基化状态:
表9:CRC的4-DMR组别
chr | 起始 | 结束 | SEQ ID NO. |
7 | 96997902 | 96999222 | SEQ ID NO.:92 |
8 | 96145538 | 96145718 | SEQ ID NO.:108 |
2 | 100322218 | 100322818 | SEQ ID NO.:28 |
2 | 29115776 | 29116791 | SEQ ID NO.:17 |
在某些实施方式中,该方法包括测定以下DMR中的每一个的至少一部分(例如至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%)的甲基化状态:
表10:CRC的9-DMR组别
chr | 起始 | 结束 | SEQ ID NO. |
7 | 96997902 | 96999222 | SEQ ID NO.:92 |
8 | 96145538 | 96145718 | SEQ ID NO.:108 |
2 | 100322218 | 100322818 | SEQ ID NO.:28 |
2 | 29115776 | 29116791 | SEQ ID NO.:17 |
2 | 88765502 | 88766042 | SEQ ID NO.:25 |
4 | 153249541 | 153249721 | SEQ ID NO.:55 |
2 | 86790271 | 86790811 | SEQ ID NO.:24 |
2 | 176094518 | 176094878 | SEQ ID NO.:35 |
3 | 37453325 | 37453874 | SEQ ID NO.:41 |
在某些实施方式中,样品为组织样品(例如结直肠组织,例如息肉、腺瘤)、血液样品、粪便样品或血液产物样品(例如血浆样品)。
在某些实施方式中,样品包含自人类受试者的血液或血浆分离的DNA。
在某些实施方式中,DNA为人类受试者的无细胞DNA(cfDNA)。
在某些实施方式中,该方法包括使用下一代测序(NGS)测定一种或多种标记中的每一个的甲基化状态。
在某些实施方式中,该方法包括使用一个或多个富集目标区的捕获诱饵捕获一个相应甲基化基因座或多个相应甲基化基因座。
在某些实施方式中,各甲基化基因座的长度等于或小于5000bp。
在某些实施方式中,该方法进一步包括藉由测定(例如同时测定)自受试者获得的样品中所识别的一种或多种突变标记存在突变(例如单核苷酸变异)的方法,测定受试者患有结直肠癌。
在某些实施方式中,一种或多种突变标记包含以下基因中的一个或多个的至少一部分:NRAS、PTEN、KRAS、PIK3CA、EGFR、BRAF、STK11、TP53、KIT及MET。
在某些实施方式中,该方法进一步包括基于突变标记中的一个或多个所识别的突变的存在,对结直肠癌进行分类。在某些实施方式中,分类包含至少部分地基于突变标记中的一个或多个所识别的突变,识别结直肠癌可藉由特定疗法(例如治疗剂、药物等)治疗。
在另一方面中,本发明涉及一种检测人类受试者的结直肠癌的方法,该方法包括:测定来自人类受试者的样品的脱氧核糖核酸(deoxyribonucleic acid;DNA)中以下两者的甲基化状态:(i)基因DLX6-AS1内的甲基化基因座;及(ii)基因GDF6内的甲基化基因座;及至少基于该经测定的甲基化状态诊断人类受试者中的结直肠癌。
在某些实施方式中,该方法包括测定基因DLX6-AS1内的甲基化基因座的甲基化状态,其中基因DLX6-AS1内的甲基化基因座包含[chr7:96997902-96999222](SEQ ID NO.:92)的至少一部分(例如至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%)。
在某些实施方式中,该方法包括测定基因GDF6内的甲基化基因座的甲基化状态,其中基因GDF6内的甲基化基因座包含[chr8:96145538-96145718](SEQ ID NO.:108)的至少一部分(例如至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%)。
在某些实施方式中,该方法进一步包括识别以下基因中的一个或多个中是否存在一个或多个突变(例如单核苷酸变异):NRAS、PTEN、KRAS、PIK3CA、EGFR、BRAF、STK11、TP53、KIT及MET。
在某些实施方式中,该方法进一步包括至少部分地基于所识别的一个或多个突变对结直肠癌进行分类。在某些实施方式中,分类包含至少部分地基于所识别的一个或多个突变,识别结直肠癌可藉由特定疗法(例如治疗剂、药物等)治疗。
在某些实施方式中,DNA为人类受试者的无细胞DNA。
在某些实施方式中,该方法包括测定甲基化状态,其使用下一代测序(NGS)测定。
在某些实施方式中,DNA是自人类受试者的血液或血浆分离的。
在某些实施方式中,各甲基化基因座的长度等于或小于5000bp。
在某些实施方式中,甲基化状态为依读段甲基化值。
在另一方面中,本发明涉及一种检测(例如筛检)人类受试者的晚期腺瘤的方法,该方法包括:测定来自从受试者获得的样品的DNA中所识别的至少两种或更多种标记中的每一个的甲基化状态,及至少部分地基于所述两种或更多种标记中的每一个的经测定甲基化状态,判定该受试者是否患有晚期腺瘤,其中所述两种或更多种标记中的每一个为甲基化基因座,该甲基化基因座包含选自图3(例如220标记表)的DMR的差异甲基化区(DMR)的至少一部分(例如至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%)。
在某些实施方式中,该方法包括测定以下DMR中的每一个的至少一部分(例如至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%)的甲基化状态:
表15:AA的2-DMR组别
chr | 起始 | 结束 | SEQ ID NO. |
7 | 100785927 | 100786167 | SEQ ID NO.:221 |
14 | 97412990 | 97413410 | SEQ ID NO.:374 |
在某些实施方式中,该方法包括测定以下DMR中的每一个的至少一部分(例如至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%)的甲基化状态:
表16:AA的4-DMR组别
chr | 起始 | 结束 | SEQ ID NO. |
7 | 100785927 | 100786167 | SEQ ID NO.:221 |
14 | 97412990 | 97413410 | SEQ ID NO.:374 |
20 | 3083167 | 3083587 | SEQ ID NO.:411 |
8 | 37797956 | 37798676 | SEQ ID NO.:329 |
在某些实施方式中,该方法包括测定以下DMR中的每一个的至少一部分(例如至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%)的甲基化状态:
表17:AA的10-DMR组别
chr | 起始 | 结束 | SEQ ID NO. |
7 | 100785927 | 100786167 | SEQ ID NO.:221 |
14 | 97412990 | 97413410 | SEQ ID NO.:374 |
20 | 3083167 | 3083587 | SEQ ID NO.:411 |
8 | 37797956 | 37798676 | SEQ ID NO.:329 |
16 | 57091834 | 57092014 | SEQ ID NO.:387 |
4 | 7940020 | 7940200 | SEQ ID NO.:287 |
19 | 40811045 | 40811585 | SEQ ID NO.:403 |
1 | 154567391 | 154567691 | SEQ ID NO.:246 |
14 | 105364294 | 105364612 | SEQ ID NO.:376 |
9 | 61862430 | 61863030 | SEQ ID NO.:338 |
在某些实施方式中,样品为组织样品(例如结直肠组织,例如息肉、腺瘤)、血液样品、粪便样品或血液产物样品(例如血浆样品)。
在某些实施方式中,样品包含自人类受试者的血液或血浆分离的DNA。
在某些实施方式中,DNA为人类受试者的无细胞DNA(cfDNA)。
在某些实施方式中,该方法包括使用下一代测序(NGS)测定一种或多种标记中的每一个的甲基化状态。
在某些实施方式中,该方法包括使用一个或多个富集目标区的捕获诱饵捕获一个相应甲基化基因座或多个相应甲基化基因座。
在某些实施方式中,各甲基化基因座的长度等于或小于5000bp。
在某些实施方式中,该方法进一步包括藉由测定(例如同时测定)自受试者获得的样品中所识别的一种或多种突变标记存在突变(例如单核苷酸变异)的方法,测定受试者患有晚期腺瘤。
在某些实施方式中,一种或多种突变标记包含以下基因中的一个或多个的至少一部分:NRAS、PTEN、KRAS、PIK3CA、EGFR、BRAF、STK11、TP53、KIT及MET。
在某些实施方式中,该方法进一步包含基于突变标记中的一个或多个所识别的突变的存在,对晚期腺瘤进行分类。在某些实施方式中,分类包含至少部分地基于突变标记中的一个或多个所识别的突变,识别晚期腺瘤可藉由特定疗法(例如治疗剂、药物等)治疗。
在另一方面中,本发明涉及一种检测人类受试者的晚期腺瘤的方法,该方法包括:测定来自人类受试者的样品的脱氧核糖核酸(DNA)中以下两者的甲基化状态:(i)基因ZAN内的甲基化基因座;及(ii)包含[chr14:97412990-97413410](SEQ ID NO.:374)的至少一部分(例如至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%)的甲基化基因座;及至少基于该经测定的甲基化状态诊断人类受试者中的晚期腺瘤。
在某些实施方式中,该方法包括测定基因ZAN内的甲基化基因座的甲基化状态,其中基因ZAN内的甲基化基因座包含[chr7:100785927-100786167](SEQ ID NO.:221)的至少一部分(例如至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%)。
在某些实施方式中,该方法进一步包含识别以下基因中的一个或多个中是否存在一个或多个突变(例如单核苷酸变异):NRAS、PTEN、KRAS、PIK3CA、EGFR、BRAF、STK11、TP53、KIT及MET。
在某些实施方式中,该方法进一步包括至少部分地基于所识别的一个或多个突变对晚期腺瘤进行分类。在某些实施方式中,分类包含至少部分地基于所识别的一个或多个突变,识别晚期腺瘤可藉由特定疗法(例如治疗剂、药物等)治疗。
在某些实施方式中,DNA为人类受试者的无细胞DNA。
在某些实施方式中,该方法包括测定甲基化状态,其使用下一代测序(NGS)测定。
在某些实施方式中,DNA是自人类受试者的血液或血浆分离。
在某些实施方式中,各甲基化基因座的长度等于或小于5000bp。
在某些实施方式中,甲基化状态为依读段甲基化值。
在另一方面中,本发明涉及一种系统,其包含:计算装置的处理器;及具有储存于其上的指令的内存,其中所述指令在由该处理器执行时使得该处理器执行本文所描述的方法中的任一个的一个或多个步骤。
在各种方面中,本发明的方法及组合物可与所属领域中已知的生物标记组合使用,例如,如美国专利第10,006,925号及美国专利第63,011,970号中所揭示,所述美国专利以全文引用的方式并入本文中。
在其他方面中,本发明涉及一种用于执行前述段落中所提及的方法中的任一个的系统,该系统包含:处理器;及其上具有指令的内存,所述指令在由该处理器执行时使得该处理器执行该方法的一个或多个(至多所有)步骤。
定义
一(A或An):冠词“一(a/an)”在本文中用以指冠词的一个或多于一个(亦即至少一个)文法对象。藉助于实例,“一要素(an element)”是指一个要素或多于一个要素。
约:当在本文中关于一个值使用时,术语“约(about)”是指在上下文中对于所参考的值而言类似的值。一般而言,在熟悉上下文的情况下,所属技术领域中具有通常知识者应了解由该上下文中的“约”所涵盖的相关变化程度。举例而言,在一些具体实例中,例如如本文所阐述,术语“约”可涵盖在参考值的25%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或分数%内的值范围。
晚期腺瘤:如本文所用,术语“晚期腺瘤(advanced adenoma)”典型地是指是指展现相对异常、不可控及/或自主生长的第一适应症但尚未归类为癌变化的细胞。在结肠组织的情形下,“晚期腺瘤”是指赘生性生长,其展示具有高分级发育不良及/或>=10mm的大小及/或绒毛状(villious)组织类型及/或锯齿状组织类型伴任何类型的发育不良的病征。
施用:如本文所用,术语“施用(administration)”典型地是指向受试者或系统施用组合物以例如达成本身为该组合物、包括于该组合物中或以其他方式藉由该组合物递送的药剂的递送。
药剂:如本文所用,术语“药剂(agent)”是指实体(例如小分子、肽、多肽、核酸、脂质、多糖、复合物、组合、混合物、系统或现象,诸如热、电流、电场、磁力、磁场等)。
改善:如本文所用,术语“改善(amelioration)”是指预防、减轻、缓和或改良受试者的病况。改善包括(但不要求)疾病、病症或病状的完全恢复或完全预防。
扩增子或扩增子分子:如本文所用,术语“扩增子(amplicon)”或“扩增子分子(amplicon molecule)”是指藉由自模板核酸分子转录产生的核酸分子,或具有与其互补的序列的核酸分子,或包括任何此类核酸分子的双链核酸。转录可自引物起始。
扩增:如本文所用,术语“扩增(amplification)”是指模板核酸分子与各种试剂组合用于自模板核酸分子产生其他核酸分子,所述其他核酸分子可与模板核酸分子的区段及/或与其互补的序列一致或类似(例如与其至少70%一致,例如至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致)。
扩增反应混合物:如本文所用,术语“扩增反应混合物(amplification reactionmixture)”或“扩增反应(amplification reaction)”是指模板核酸分子以及足以扩增模板核酸分子的试剂。
生物样品:如本文所用,术语“生物样品(biological sample)”典型地是指获自或源自如本文中所描述的所关注生物源(例如,组织或生物体或细胞培养物)的样品。在一些具体实例中,例如如本文所阐述,生物源为或包括诸如动物或人类等生物体。在一些具体实例中,例如如本文所阐述,生物样品为或包括生物组织或液体。在一些具体实例中,例如如本文所阐述,生物样品可为或包括细胞、组织或体液。在一些具体实例中,例如如本文所阐述,生物样品可为或包括血液、血球、无细胞DNA、游离漂浮核酸、腹水、活检样品、手术试样、含细胞体液、痰液、唾液、粪便、尿液、脑脊髓液、腹膜液、胸膜液、淋巴、妇科液、分泌物、排泄物、皮肤拭子、阴道拭子、口腔拭子、鼻拭子、洗液或灌洗液(诸如导管灌洗液或支气管肺泡灌洗液)、抽吸物、刮屑、骨髓。在一些具体实例中,例如如本文所阐述,生物样品为或包括自单一受试者或多个受试者获得的细胞。样品可为直接获自生物源的“初级样品”,或可为“经处理的样品”。生物样品亦可称为“样品”。
生物标记:如本文所用,与其在所属技术领域中的用途一致的术语“生物标记(biomarker)”是指一种实体,其存在、水平或形式与所关注的特定生物事件或状况相关,以使得其被视为该事件或状况的“标记”。所属技术领域中具有通常知识者应了解例如在DNA生物标记的情形下,生物标记可为或包括基因座(诸如一个或多个甲基化基因座)及/或基因座的状态(例如一个或多个甲基化基因座的状态)。仅给出生物标记的几个实例,在一些具体实例中,例如如本文所阐述,生物标记可为或包括特定疾病、病症或病状的标记,或可为例如受试者中可产生、出现或复发特定疾病、病症或病状的定性或定量机率的标记。在一些具体实例中,例如如本文所阐述,生物标记可为或包括特定治疗结果或其定性或定量机率的标记。因此,在各种实施方式中,例如如本文所阐述,生物标记可为所关注的相关生物事件或状况的预测、预后及/或诊断。生物标记可为任何化学物质类别的实体。举例而言,在一些具体实例中,例如如本文所阐述,生物标记可为或包括核酸、多肽、脂质、碳水化合物、小分子、无机药剂(例如金属或离子)或其组合。在一些具体实例中,例如如本文所阐述,生物标记为细胞表面标记。在一些具体实例中,例如如本文所阐述,生物标记为细胞内的。在一些具体实例中,例如如本文所阐述,生物标记发现于细胞外部(例如被分泌或以其他方式产生或存在于细胞外部,例如体液中,诸如血液、尿液、泪液、唾液、脑脊髓液及其类似物中)。在一些具体实例中,例如如本文所阐述,生物标记为甲基化基因座的甲基化状态。在一些情况下,例如如本文所阐述,生物标记可称为“标记”。
仅给出生物标记的一个实例,在一些具体实例中,例如如本文所阐述,术语是指由基因编码的产物的表达,该产物的表达为特定肿瘤、肿瘤子类别、肿瘤分期等的特征。或者或另外,在一些具体实例中,例如如本文所阐述,特定标记的存在或水平可与特定信号传导路径的活性(或活性水平)相关,例如该信号传导路径的活性为特定肿瘤类别的特征。
所属技术领域中具有通常知识者应了解,生物标记可个别地确定所关注的特定生物事件或状况,或可代表或有助于确定所关注的特定生物事件或状况的统计机率。所属技术领域中具有通常知识者应了解,标记的特异性及/或敏感性可随着与所关注的特定生物事件或状况相关而不同。
血液组分:如本文所用,术语“血液组分(blood component)”是指全血的任何组分,包括红血球、白血球、血浆、血小板、内皮细胞、间皮细胞、上皮细胞及无细胞DNA。血液组分亦包括血浆组分,包括蛋白质、代谢物、脂质、核酸及碳水化合物,及可例如由于妊娠、器官移植、感染、损伤或疾病而存在于血液中的任何其他细胞。
癌症:如本文所用,术语“癌症(cancer)”、“恶性肿瘤(malignancy)”、“赘瘤(neoplasm)”、“肿瘤(tumor)”及“癌瘤(carcinoma)”可互换使用以指其中细胞展现或展现出相对异常、不可控及/或自主生长以使得所述细胞展示或展示出异常升高的增殖速率及/或异常生长表型的疾病、病症或病状。在一些具体实例中,例如如本文所阐述,癌症可包括一个或多个肿瘤。在一些具体实例中,例如如本文所阐述,癌症可为或包括癌变前(例如良性)、恶性、转移前、转移性及/或非转移性细胞。在一些具体实例中,例如如本文所阐述,癌症可为或包括实体肿瘤。在一些具体实例中,例如如本文所阐述,癌症可为或包括血液肿瘤。一般而言,所属领域中已知的不同类型癌症的实例包括例如结直肠癌;造血癌症,包括白血病、淋巴瘤(霍奇金(Hodgkin)氏及非霍奇金氏)、骨髓瘤及骨髓增生病症;肉瘤;黑素瘤;腺瘤;实体组织癌瘤;口腔、咽喉、喉部及肺的鳞状细胞癌;肝癌;生殖泌尿癌症,诸如前列腺癌、子宫颈癌、膀胱癌、子宫癌及子宫内膜癌及肾细胞癌;骨癌;胰脏癌;皮肤癌;皮肤或眼内黑素瘤;内分泌系统癌;甲状腺癌;副甲状腺癌;头颈癌;乳癌;胃肠癌及神经系统癌;良性病灶,诸如乳头状瘤;及其类似癌症。
化学治疗剂:如本文所用,与其在所属技术领域中的用途一致的术语“化学治疗剂(chemotherapeutic agent)”是指已知或具有已知治疗或促进治疗癌症的特征的一种或多种药剂。具体而言,化学治疗剂包括促细胞凋亡剂、细胞生长抑制剂及/或细胞毒性剂。在一些具体实例中,例如如本文所阐述,化学治疗剂可为或包括烷基化剂、蒽环霉素、细胞骨架瓦解剂(例如微管靶向部分,诸如紫杉烷、美登素及其类似物)、埃博霉素(epothilone)、组蛋白脱乙酰基酶抑制剂HDAC)、拓朴异构酶抑制剂(例如拓朴异构酶I及/或拓朴异构酶II的抑制剂)、激酶抑制剂、核苷酸类似物或核苷酸前驱体类似物、肽抗生素、铂类药剂、类视黄素、长春花生物碱及/或具有相关抗增殖活性的类似物。在一些特定具体实例中,例如如本文所阐述,化学治疗剂可为或包括放线菌素、全反式视黄酸、奥瑞他汀(Auiristatin)、阿扎胞苷(Azacitidine)、硫唑嘌呤(azathioprine)、博莱霉素、硼替佐米(Bortezomib)、卡铂(Carboplatin)、卡培他滨(Capecitabine)、顺铂(Cisplatin)、苯丁酸氮芥(Chlorambucil)、环磷酰胺、姜黄素、阿糖胞苷(Cytarabine)、道诺霉素(Daunorubicin)、多西他赛(Docetaxel)、脱氧氟尿苷、阿霉素(Doxorubicin)、表柔比星(Epirubicin)、埃博霉素(Epothilone)、依托泊苷(Etoposide)、氟尿嘧啶、吉西他滨(Gemcitabine)、羟基尿素、埃达霉素(Idarubicin)、伊马替尼(Imatinib)、伊立替康(Irinotecan)、美登素及/或其类似物(例如DM1)氮芥(Mechlorethamine)、巯基嘌呤、甲胺喋呤(Methotrexate)、米托蒽醌(Mitoxantrone)、类美登素、奥沙利铂(Oxaliplatin)、紫杉醇、培美曲塞(Pemetrexed)、替尼泊苷(Teniposide)、硫鸟嘌呤(Tioguanine)、拓朴替康(Topotecan)、戊柔比星(Valrubicin)、长春碱(Vinblastine)、长春新碱(Vincristine)、长春地辛(Vindesine)、长春瑞宾(Vinorelbine)或其组合。在一些具体实例中,例如如本文所阐述,化学治疗剂可用于抗体-药物结合物的情形下。在一些具体实例中,例如如本文所阐述,化学治疗剂为抗体-药物结合物中所存在的选自由以下组成的群中之一者:hLL1-阿霉素、hRS7-SN-38、hMN-14-SN-38、hLL2-SN-38、hA20-SN-38、hPAM4-SN-38、hLL1-SN-38、hRS7-Pro-2-P-Dox、hMN-14-Pro-2-P-Dox、hLL2-Pro-2-P-Dox、hA20-Pro-2-P-Dox、hPAM4-Pro-2-P-Dox、hLL1-Pro-2-P-Dox、P4/D10-阿霉素、吉妥珠单抗奥佐米星(gemtuzumab ozogamicin)、本妥昔单抗维多汀(brentuximab vedotin)、曲妥珠单抗恩他新(trastuzumab emtansine)、英妥珠单抗奥佐米星(inotuzumab ozogamicin)、格巴妥莫单抗维多汀(glembatumomab vedotin)、SAR3419、SAR566658、BIIB015、BT062、SGN-75、SGN-CD19A、AMG-172、AMG-595、BAY-94-9343、ASG-5ME、ASG-22ME、ASG-16M8F、MDX-1203、MLN-0264、抗PSMA ADC、RG-7450、RG-7458、RG-7593、RG-7596、RG-7598、RG-7599、RG-7600、RG-7636、ABT-414、IMGN-853、IMGN-529、伏司妥珠单抗马佛多坦(vorsetuzumab mafodotin)及洛瓦土珠单抗美登素(lorvotuzumabmertansine)。在一些具体实例中,例如如本文所阐述,化学治疗剂可为或包含法呢基-硫代水杨酸(farnesyl-thiosalicylic acid;FTS)、4-(4-氯-2-甲基苯氧基)-N-羟基丁酰胺(4-(4-Chloro-2-methylphenoxy)-N-hydroxybutanamide;CMH)、雌二醇(E2)、四甲氧基芪(tetramethoxystilbene;TMS)、δ-生育三烯醇、盐霉素或姜黄素。
组合疗法:如本文所用,术语“组合疗法”是指向受试者施用两种或更多种药剂或方案,使得两种或更多种药剂或方案一起治疗受试者的疾病、病状或病症。在一些具体实例中,例如如本文所阐述,两种或更多种治疗剂或方案可同时、依序或以重叠给药方案施用。所属技术领域中具有通常知识者应了解组合疗法包括但不要求两种药剂或方案一起以单一组合物形式施用,亦不同时施用。
可比较:如本文所用,术语“可比较(comparable)”是指两个或更多个条件、情况、药剂、实体、群体等的集合内的成员可彼此不一致但充分类似以允许其间的比较,使得所属技术领域中具有通常知识者将了解到,可基于观测到的差异或类似性合理地得出结论。在一些具体实例中,例如如本文所阐述,条件、情况、药剂、实体、群体等的可比较集合典型地特征在于多个基本上一致的特征及零个、一个或多个不同特征。所属技术领域中具有通常知识者应理解,在上下文中,需要何种程度的一致性才使集合的成员可比较。举例而言,所属技术领域中具有通常知识者应了解,条件、情况、药剂、实体、群体等的集合成员,在藉由足够数目及类型的实质上一致特征表征以保证所观测到的差异可完全或部分归因于其不一致特征的合理结论时彼此可比较。
对应于:如本文所用,术语“对应于(corresponding to)”是指两个或更多个实体之间的关系。举例而言,术语“对应于”可用于表示化合物或组合物中的结构元素相对于另一化合物或组合物(例如适当参考化合物或组合物)的位置/身分。举例而言,在一些具体实例中,聚合物中的单体残基(例如多核苷酸中的核酸残基)可识别为“对应于”适当参考聚合物中的残基。所属技术领域中具有通常知识者容易了解如何识别“对应”核酸。举例而言,所属技术领域中具有通常知识者将意识到可用以例如识别根据本发明的核酸中的“对应”残基的各种序列比对策略,包括软件程序,诸如(例如)BLAST、CS-BLAST、CUSASW++、DIAMOND、FASTA、GGSEARCH/GLSEARCH、Genoogle、HMMER、HHpred/HHsearch、IDF、Infernal、KLAST、USEARCH、parasail、PSI-BLAST、PSI-Search、ScalaBLAST、Sequilab、SAM、SSEARCH、SWAPHI、SWAPHI-LS、SWIMM或SWIPE。所属技术领域中具有通常知识者亦应了解,在一些情况下,术语“对应于”可用以描述与另一事件或实体(例如,适当参考事件或实体)共有相关相似性的事件或实体。仅给出一个实例,来自受试者的样品中的DNA片段可描述为“对应于”基因,以便在一些具体实例中指示其展示特定程度的序列一致性或同源性,或共享特定特征序列组件。
可检测部分:如本文所用的术语“可检测部分(detectable moiety)”是指可检测的任何元素、分子、官能基、化合物、片段或其他部分。在一些具体实例中,例如如本文所阐述,单独提供或利用可检测部分。在一些具体实例中,例如如本文所阐述,可检测部分与另一药剂结合(例如与其连接)提供及/或利用。可检测部分的实例包括但不限于各种配位体、放射性核素(例如3H、14C、18F、19F、32P、35S、135I、125I、123I、64Cu、187Re、111In、90Y、99mTc、177Lu、89Zr等)、荧光染料、化学发光剂、生物发光剂、光谱可解析的无机荧光半导体纳米晶体(亦即量子点)、金属纳米颗粒、纳米簇、顺磁金属离子、酶、比色标签、生物素、长叶毛地黄配质(dioxigenin)、半抗原及可获得抗血清或单克隆抗体的蛋白质。
诊断:如本文所用,术语“诊断(Diagnosis)”是指判定受试者是否患有疾病、病症、病状或病况及/或将罹患疾病、病症、病状或病况的定性或定量机率。举例而言,在癌症诊断中,诊断可包括关于癌症的风险、类型、分期、恶性程度或其他分类的判定。在一些情况下,例如如本文所阐述,诊断可为或包括与预后及/或可能对一种或多种一般或特定治疗剂或方案起反应相关的判定。
诊断信息:如本文所用,术语“诊断信息(diagnostic information)”是指可用于提供诊断的信息。诊断信息可包括(不限于)生物标记状态信息。
差异甲基化:如本文所用,术语“差异甲基化(differentially methylated)”描述甲基化状态在第一病状与第二病状之间不同的甲基化位点。差异甲基化的甲基化位点可称为差异甲基化位点。在一些情况下,例如如本文所阐述,DMR由扩增子定义,该扩增子使用寡核苷酸引物,例如针对DMR扩增或针对扩增子中存在的所关注的DNA区的扩增选择的一对寡核苷酸引物进行扩增所产生。在一些情况下,例如如本文所阐述,DMR定义为藉由一对寡核苷酸引物扩增的DNA区,该对寡核苷酸引物包括具有寡核苷酸引物的序列或与寡核苷酸引物互补的序列的区。在一些情况下,例如如本文所阐述,DMR定义为藉由一对寡核苷酸引物扩增的DNA区,该对寡核苷酸引物不包括具有寡核苷酸引物的序列或与寡核苷酸引物互补的序列的区。如本文所用,可藉由相关基因的名称,继之以起始位置的三个数字明确地识别特定提供的DMR,使得例如可将ZAN的起始于位置100785927处的DMR识别为ZAN'927。如本文所用,可藉由染色体编号,继之以DMR的起始及结束位置明确地识别特定提供的DMR。
差异甲基化区:如本文所用,术语“差异甲基化区”(differentially methylatedregion;DMR)是指包括一个或多个差异甲基化位点的DNA区。在所关注的所选病状,诸如癌症病况下,包括较大数目或频率的甲基化位点的DMR可称为高甲基化DMR。在所关注的所选病状,诸如癌症病况下,包括较小数目或频率的甲基化位点的DMR可称为低甲基化DMR。作为结直肠癌的甲基化生物标记的DMR可称为结直肠癌DMR。作为晚期腺瘤的甲基化生物标记的DMR可称为晚期腺瘤DMR。在一些情况下,例如如本文所阐述,DMR可为单核苷酸,该单核苷酸为甲基化位点。在一些情况下,例如如本文所阐述,DMR的长度为至少10个、至少15个、至少20个、至少30个、至少50个或至少75个碱基对。在一些情况下,例如如本文所阐述,DMR的长度等于或小于5000bp、4,000bp、3,000bp、2,000bp、1,000bp、950bp、900bp、850bp、800bp、750bp、700bp、650bp、600bp、550bp、500bp、450bp、400bp、350bp、300bp、250bp、200bp、150bp、100bp、50bp、40bp、30bp、20bp或10bp(例如其中甲基化状态系使用定量聚合酶链反应(quantitative polymerase chain reaction;qPCR),例如甲基化敏感性限制酶定量聚合酶链反应(methylation sensitive restriction enzyme quantitative polymerasechain reaction;MSRE-qPCR)测定)(例如其中甲基化状态使用下一代测序技术,例如靶向下一代测序测定)。在一些情况下,例如如本文所阐述,作为晚期腺瘤的甲基化生物标记的DMR亦可适用于识别结直肠癌,且反之亦然。
DNA区:如本文所用,“DNA区”是指较大DNA分子的任何连续部分。所属技术领域中具有通常知识者将熟悉用于基于例如第一DNA区及第二DNA区的序列相似性(例如序列一致性或同源性)及/或情形(例如第一DNA区及第二DNA区上游及/或下游核酸的序列一致性或同源性)确定第一DNA区及第二DNA区是否对应的技术。
除非本文中另外规定,否则人类中所发现或与人类相关的序列(例如与人类DNA杂交)发现于、基于及/或衍生自通常称为且所属技术领域中具有通常知识者已知为智人(人类)基因组组装体GRCh38、hg38及/或基因组参考联合会(Genome Reference Consortium)人类构建体38的例示性代表性人类基因组序列。所属技术领域中具有通常知识者应进一步了解hg38的DNA区可藉由已知系统提及,包括根据指定编号识别特定核苷酸位置或其范围。
给药方案:如本文所用,术语“给药方案(dosing regimen)”可指施用受试者的一种或多种相同或不同单位剂量的集合,通常包括多个单位剂量,各单位剂量的施用与其他单位剂量的施用相隔一段时间。在各种实施方式中,例如如本文所阐述,给药方案的一个或多个或所有单位剂量可相同或可变化(例如随时间推移增加、随时间推移减少或根据受试者及/或根据行医者的决定调节)。在各种实施方式中,例如如本文所阐述,各剂量之间的一个或多个或所有时间段可相同或可变化(例如随时间推移增加、随时间推移减少或根据受试者及/或根据行医者的决定调节)。在一些具体实例中,例如如本文所阐述,既定治疗剂具有推荐给药方案,其可涉及一个或多个剂量。典型地,市售药物的至少一种推荐给药方案为所属技术领域中具有通常知识者已知。在一些具体实例中,例如如本文所阐述,给药方案在相关群体中施用时与所需或有益结果相关(亦即为治疗给药方案)。
下游:如本文所用,术语“下游(downstream)”意谓第一DNA区相对于第二DNA区更接近包括第一DNA区及第二DNA区的核酸的C端。
基因:如本文所用,术语“基因(gene)”是指单一DNA区,例如染色体中的单一DNA区,其包括编码产物(例如RNA产物及/或多肽产物)的编码序列,以及有助于调控编码序列表达的全部、一些DNA序列或无所述DNA序列。在一些具体实例中,例如如本文所阐述,基因包括一个或多个非编码序列。在一些特定具体实例中,例如如本文所阐述,基因包括外显子及内含子序列。在一些具体实例中,例如如本文所阐述,基因包括一个或多个调控组件,其例如可控制或影响基因表现(例如,细胞类型特异性表现、诱导型表现等)的一个或多个方面。在一些具体实例中,例如如本文所阐述,基因包括启动子。在一些具体实例中,例如如本文所阐述,基因包括以下中之一者或两者:(i)在编码序列上游延伸预定数目个核苷酸的DNA核苷酸及(ii)在编码序列下游延伸预定数目个核苷酸的DNA核苷酸。在各种实施方式中,例如如本文所阐述,预定数目个核苷酸可为500bp、1kb、2kb、3kb、4kb、5kb、10kb、20kb、30kb、40kb、50kb、75kb或100kb。
同源性:如本文所用,术语“同源性”是指聚合分子之间,例如核酸分子(例如DNA分子及/或RNA分子)之间及/或多肽分子之间的总体相关性。所属技术领域中具有通常知识者应了解,同源性可例如藉由一致性百分比或同源性百分比(序列相似性)来界定。在一些具体实例中,例如如本文所阐述,若聚合分子的序列至少25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或99%一致,则将所述聚合分子视为彼此“同源”。在一些具体实例中,例如如本文所阐述,若聚合分子的序列至少25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或99%类似,则将所述聚合分子视为彼此“同源”。
杂交:如本文所用,“杂交”是指第一核酸与第二核酸缔合以形成双链结构,该缔合经由互补核苷酸配对进行。所属技术领域中具有通常知识者将认识到,互补序列以及其他序列可杂交。在各种实施方式中,例如如本文所阐述,杂交可例如在具有至少70%互补性,例如至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%互补性的核苷酸序列之间进行。所属技术领域中具有通常知识者应进一步了解,第一核酸与第二核酸的杂交是否发生或不发生可取决于各种反应条件。杂交可进行的条件为所属技术领域中已知的。
低甲基化:如本文所用,术语“低甲基化(hypomethylation)”是指与参考状态相比,在所关注状态下甲基化的核苷酸少至少一个的甲基化基因座的状态(例如相较于健康对照,结直肠癌中甲基化的核苷酸少至少一个)。
高甲基化:如本文所用,术语“高甲基化(hypermethylation)”是指与参考状态相比,在所关注状态下甲基化的核苷酸多至少一个的甲基化基因座的状态(例如相较于健康对照,结直肠癌中甲基化的核苷酸多至少一个)。
一致性、一致:如本文所用,术语“一致性(identity)”及“一致(identical)”是指聚合分子之间,例如核酸分子(例如DNA分子及/或RNA分子)之间及/或多肽分子之间的总体相关性。用于计算如两个所提供的序列之间的一致性百分比的方法是所属领域中已知的。举例而言,两个核酸或多肽序列的一致性百分比的计算可例如藉由出于最佳比较目的比对两个序列(或一个或两个序列的互补序列)来进行(例如可将空位引入第一及第二序列中的一个或两个中以便最佳比对,且出于比较目的可忽略非一致序列)。接着比较对应位置处的核苷酸或氨基酸。当第一序列中的一个位置由与第二序列中对应位置相同的残基(例如核苷酸或氨基酸)占据时,则分子在彼位置处一致。两个序列之间的一致性百分比为所述序列共有的一致位置数目的函数,且视情况考虑为了两个序列的最佳比对而可能需要引入的空位的数目及各空位的长度。序列的比较及两个序列之间的一致性百分比的确定可使用计算算法,诸如基于局部比对算法的检索工具(basic local alignment search tool;BLAST)实现。
“改善”、“增加”或“减少”:如本文所用,此等术语或语法上可比的比较术语指示相对于可比参考测量值之值。举例而言,在一些具体实例中,例如如本文所阐述,用所关注药剂实现的评估值可相对于用可比参考药剂或无药剂获得的评估值“改善”。或者或另外,在一些具体实例中,例如如本文所阐述,所关注受试者或系统中的评估值可相对于在不同条件下或在不同时间点(例如在诸如施用所关注药剂的事件之前或之后)、或在不同、可比受试者中(例如在存在所关注的特定疾病、病症或病状的一个或多个指标情况下,或在暴露于条件或药剂等之前,在与所关注受试者或系统不同的可比受试者或系统中)在同一受试者或系统中获得的评估值“改善”。在一些具体实例中,例如如本文所阐述,比较术语是指统计相关差异(例如,足以达成统计相关性的流行率及/或量值的差异)。所属技术领域中具有通常知识者将意识到,或将能够容易地在给定情形下测定需要或足以达成此类统计显著性的差异程度及/或流行率。
甲基化:如本文所用,术语“甲基化(methylation)”包括在(i)胞嘧啶的C5位置;(ii)胞嘧啶的N4位置;及(iii)腺嘌呤的N6位置中的任一个处的甲基化。甲基化也包括(iv)其他类型的核苷酸甲基化。甲基化的核苷酸可称为“甲基化核苷酸”或“甲基化核苷酸碱基”。在某些实施方式中,例如如本文所阐述,甲基化尤其是指胞嘧啶残基的甲基化。在一些情况下,甲基化尤其是指存在于CpG位点中的胞嘧啶残基的甲基化。
甲基化分析:如本文所用,术语“甲基化分析(methylation assay)”是指可用于测定甲基化基因座的甲基化状态的任何技术。
甲基化生物标记:如本文所用,术语“甲基化生物标记(methylation biomarker)”是指作为或包括至少一个甲基化基因座及/或至少一个甲基化基因座的甲基化状态(例如高甲基化基因座)的生物标记。具体而言,甲基化生物标记为特征在于在一个或多个核酸基因座的甲基化状态中在第一状态与第二状态之间(例如在癌状态与非癌状态之间)变化的生物标记。
甲基化基因座:如本文所用,术语“甲基化基因座(methylation locus)”是指包括至少一个差异甲基化区的DNA区。在所关注的所选病状(诸如癌性病况)下包括较大数目或频率的甲基化位点的甲基化基因座可称为高甲基化基因座。在所关注的所选病状(诸如癌性病况)下包括较小数目或频率的甲基化位点的甲基化基因座可称为低甲基化基因座。在一些情况下,例如如本文所阐述,甲基化基因座具有至少10个、至少15个、至少20个、至少30个、至少50个或至少75个碱基对的长度。在一些情况下,例如如本文所阐述,甲基化基因座具有小于5000bp、4,000bp、3,000bp、2,000bp、1,000bp、950bp、900bp、850bp、800bp、750bp、700bp、650bp、600bp、550bp、500bp、450bp、400bp、350bp、300bp、250bp、200bp、150bp、100bp、50bp、40bp、30bp、20bp或10bp的长度(例如其中甲基化状态使用定量聚合酶链反应(qPCR),例如甲基化敏感性限制酶定量聚合酶链反应(MSRE-qPCR)测定)。
甲基化位点:如本文所用,甲基化位点是指在至少一种病状下甲基化的核苷酸或核苷酸位置。在其甲基化状态下,甲基化位点可称为经甲基化的位点。
甲基化状态:如本文所用,“甲基化状态(methylation status)”、“甲基化状况(methylation state)”或“甲基化轮廓(methylation profile)”是指甲基化基因座内甲基化位点处甲基化的数目、频率或模式。因此,第一状态与第二状态之间的甲基化状态的变化可为或包括甲基化位点的数目、频率或模式的增加,或可为或包括甲基化位点的数目、频率或模式的减少。在各种情况下,甲基化状态随甲基化值变化而变化。
甲基化值:如本文所用,术语“甲基化值”是指甲基化状态的数值表示,例如呈表示甲基化基因座的甲基化的频率或比率的数目形式。在一些情况下,例如如本文所阐述,甲基化值可藉由一种方法产生,该方法包括在用甲基化依赖性限制酶限制消化样品之后,定量样品中所存在的完整核酸的量。在一些情况下,例如如本文所阐述,甲基化值可藉由一种方法产生,该方法包括在样品的亚硫酸氢盐反应之后比较扩增概况。在一些情况下,例如如本文所阐述,甲基化值可藉由比较经亚硫酸氢盐处理的核酸及未经处理的核酸的序列而产生。在一些情况下,例如如本文所阐述,甲基化值为、包括或是基于定量PCR结果。在一些情况下,例如如本文所阐述,甲基化值
突变:如本文所用,术语“突变(mutation)”是指生物分子(例如核酸或蛋白)相较于参考生物分子中的遗传变异。举例而言,在一些具体实例中,与参考核酸分子相比,核酸中的突变可包含核碱基取代、一个或多个核碱基的缺失、一个或多个核碱基的插入、两个或更多个核碱基的倒置或截短。类似地,相比于参考多肽,蛋白质中的突变可包含氨基酸取代、插入、倒置或截短。额外突变,例如融合及插入/缺失为所属技术领域中具有通常知识者已知。在一些具体实例中,突变包含与基因产物功能损失相关的基因变异体。功能损失可为功能的完全去除,例如酶的酶活性的去除;或功能的部分损失,例如酶的酶活性降低。在一些具体实例中,突变体包含与功能获得,例如基因产物中特征或活性具有负或非所需改变相关的基因变异体。在一些具体实例中,突变体的特征在于相较于参考,所需水平或活性降低或损失;在一些具体实例中,突变体的特征在于相较于参考,非所需水平或活性提高或增加。在一些具体实例中,参考生物分子为野生型生物分子。
核酸:如本文所用,术语“核酸(nucleic acid)”在其最广泛意义上是指并入或可并入寡核苷酸链中的任何化合物及/或物质。在一些具体实例中,例如如本文所阐述,核酸为经由磷酸二酯键并入或可并入寡核苷酸链中的化合物及/或物质。如将自上下文了解,在一些具体实例中,例如如本文所阐述,术语核酸是指个别核酸残基(例如,核苷酸及/或核苷),且在一些具体实例中,例如如本文所阐述,是指包含多个个别核酸残基的多核苷酸链。核酸可为或包括DNA、RNA或其组合。核酸可包括天然核酸残基、核酸类似物及/或合成残基。在一些具体实例中,例如如本文所阐述,核酸包括天然核苷酸(例如腺苷、胸苷、鸟苷、胞苷、尿苷、脱氧腺苷、脱氧胸苷、脱氧鸟苷及脱氧胞苷)。在一些具体实例中,例如如本文所阐述,核酸为或包括一种或多种核苷酸类似物(例如2-氨基腺苷、2-硫代胸苷、肌苷、吡咯并-嘧啶、3-甲基腺苷、5-甲基胞苷、C-5丙炔基-胞苷、C-5丙炔基-尿苷、2-氨基腺苷、C5-溴尿苷、C5-氟尿苷、C5-碘尿苷、C5-丙炔基-尿苷、C5-丙炔基-胞苷、C5-甲基胞苷、2-氨基腺苷、7-脱氮腺苷、7-脱氮鸟苷、8-侧氧基腺苷、8-侧氧基鸟苷、0(6)-甲基鸟嘌呤、2-硫代胞苷、甲基化碱基、插入碱基及其组合)。
在一些具体实例中,例如如本文所阐述,核酸具有编码功能性基因产物,诸如RNA或蛋白质的核苷酸序列。在一些具体实例中,例如如本文所阐述,核酸包括一个或多个内含子。在一些具体实例中,例如如本文所阐述,核酸包括一个或多个基因。在一些具体实例中,例如如本文所阐述,核酸藉由以下中的一个或多个制备:自天然来源分离、藉由基于互补模板的聚合进行酶合成(活体内或体外)、在重组细胞或系统中复制及化学合成。
在一些具体实例中,例如如本文所阐述,核酸类似物与核酸的不同之处在于该核酸类似物不使用磷酸二酯主链。举例而言,在一些具体实例中,例如如本文所阐述,核酸可包括一种或多种肽核酸,其在所属技术领域中已知且在主链中具有肽键代替磷酸二酯键。或者或另外,在一些具体实例中,例如如本文所阐述,核酸具有一个或多个硫代磷酸酯及/或5'-N-氨基亚磷酸酯键而非磷酸二酯键。在一些具体实例中,例如如本文所阐述,如与天然核酸中的糖相比,核酸包含一种或多种经修饰的糖(例如2'-氟核糖、核糖、2'-脱氧核糖、阿拉伯糖及己糖)。
在一些具体实例中,例如如本文所阐述,核酸为或包括至少3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、20、225、250、275、300、325、350、375、400、425、450、475、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000个或更多个残基。在一些具体实例中,例如如本文所阐述,核酸为部分或完全单链的,或部分或完全双链的。
核酸检测分析:如本文所用,术语“核酸检测分析(nucleic acid detectionassay)”是指测定所关注核酸的核苷酸组合物的任何方法。核酸检测分析包括但不限于DNA测序方法(例如下一代测序方法)、基于聚合酶链反应的方法、探针杂交方法、连接酶链反应等。
核苷酸:如本文所用,术语“核苷酸(nucleotide)”是指多核苷酸(例如DNA及/或RNA聚合物)的结构组分或构建嵌段。核苷酸包括碱基(例如腺嘌呤、胸腺嘧啶、尿嘧啶、鸟嘌呤或胞嘧啶)及糖分子及至少一个磷酸酯基。如本文所用,核苷酸可为甲基化核苷酸或未甲基化核苷酸。所属技术领域中具有通常知识者应了解,核酸术语,诸如作为实例,“基因座(locus)”或“核苷酸(nucleotide)”可指单个核酸分子的基因座或核苷酸及/或代表该基因座或核苷酸(例如具有相同的一致核酸序列及/或核酸序列背景,或具有基本上一致核酸序列及/或核酸背景)的多种核酸(例如样品及/或受试者代表中的多种核酸)内的累积基因座或核苷酸群体。
寡核苷酸引物:如本文所用,术语寡核苷酸引物或引物是指使用、能够使用或供用于自模板核酸分子产生扩增子的核酸分子。在转录容许条件(例如在存在核苷酸及DNA聚合酶的情况下,且在适合温度及pH下)下,寡核苷酸引物可提供自寡核苷酸引物杂交的模板的转录的起始点。典型地,寡核苷酸引物为长度在5与200个核苷酸之间的单链核酸。所属技术领域中具有通常知识者应了解,自模板核酸分子产生扩增子的最佳引物长度可随包括温度参数、引物组成及转录或扩增方法的条件而变化。如本文所用,一对寡核苷酸引物是指一组分别与模板双链核酸分子的第一链及第二链互补的两个寡核苷酸引物。一对寡核苷酸引物中的第一及第二成员可称为分别相对于模板核酸链的“正向”寡核苷酸引物及“反向”寡核苷酸引物,这是因为正向寡核苷酸引物能够与互补于模板核酸链的核酸链杂交,反向寡核苷酸引物能够与模板核酸链杂交,且正向寡核苷酸引物相对于模板核酸链的位置为反向寡核苷酸引物序列相对于模板核酸链的5'位置。所属技术领域中具有通常知识者应了解,第一及第二寡核苷酸引物分别识别为正向及反向寡核苷酸引物系任意的,因为此等识别符视给定核酸链或其互补序列是否用作模板核酸分子而定。
重叠:术语“重叠(overlapping)”在本文中参考两个DNA区使用,该两个DNA区各自含有与另一区中相同长度的子序列实质上一致的子序列(例如两个DNA区具有共同子序列)。“实质上一致”意谓两个一致长的子序列相差少于指定数量的碱基对。在某些情况下,例如如本文所阐述,各子序列具有至少20个碱基对的长度,其彼此相差少于4、3、2或1个碱基对(例如,两个子序列具有至少80%、至少85%、至少90%、至少95%相似性、至少97%相似性、至少98%相似性、至少99%相似性或至少99.5%相似性)。在某些情况下,例如如本文所阐述,各子序列具有至少24个碱基对的长度,其相差少于5、4、3、2或1个碱基对(例如,两个子序列具有至少80%、至少85%、至少90%、至少95%相似性、至少97%相似性、至少98%相似性、至少99%相似性或至少99.5%相似性)。在某些情况下,例如如本文所阐述,各子序列具有至少50个碱基对的长度,其相差少于10、9、8、7、6、5、4、3、2或1个碱基对(例如,两个子序列具有至少80%、至少85%、至少90%、至少95%相似性、至少97%相似性、至少98%相似性、至少99%相似性或至少99.5%相似性)。在某些情况下,例如如本文所阐述,各子序列具有至少100个碱基对的长度,其相差少于20、15、10、9、8、7、6、5、4、3、2或1个碱基对(例如,两个子序列具有至少80%、至少85%、至少90%、至少95%相似性、至少97%相似性、至少98%相似性、至少99%相似性或至少99.5%相似性)。在某些情况下,例如如本文所阐述,各子序列具有至少200个碱基对的长度,其相差少于40、30、20、15、10、9、8、7、6、5、4、3、2或1个碱基对(例如,两个子序列具有至少80%、至少85%、至少90%、至少95%相似性、至少97%相似性、至少98%相似性、至少99%相似性或至少99.5%相似性)。在某些情况下,例如如本文所阐述,各子序列具有至少250个碱基对的长度,其相差少于50、40、30、20、15、10、9、8、7、6、5、4、3、2或1个碱基对(例如,两个子序列具有至少80%、至少85%、至少90%、至少95%相似性、至少97%相似性、至少98%相似性、至少99%相似性或至少99.5%相似性)。在某些情况下,例如如本文所阐述,各子序列具有至少300个碱基对的长度,其相差少于60、50、40、30、20、15、10、9、8、7、6、5、4、3、2或1个碱基对(例如,两个子序列具有至少80%、至少85%、至少90%、至少95%相似性、至少97%相似性、至少98%相似性、至少99%相似性或至少99.5%相似性)。在某些情况下,例如如本文所阐述,各子序列具有至少500个碱基对的长度,其相差少于100、60、50、40、30、20、15、10、9、8、7、6、5、4、3、2或1个碱基对(例如,两个子序列具有至少80%、至少85%、至少90%、至少95%相似性、至少97%相似性、至少98%相似性、至少99%相似性或至少99.5%相似性)。在某些情况下,例如如本文所阐述,各子序列具有至少1000个碱基对的长度,其相差少于200、100、60、50、40、30、20、15、10、9、8、7、6、5、4、3、2或1个碱基对(例如,两个子序列具有至少80%、至少85%、至少90%、至少95%相似性、至少97%相似性、至少98%相似性、至少99%相似性或至少99.5%相似性)。在某些情况下,例如如本文所阐述,两个DNA区中的第一区的子序列可包含两个DNA区中的第二区的全部(或反之亦然)(例如共同子序列可含有任一或两个区的全部)。在某些实施方式中,在甲基化基因座具有包含本文所列的DMR序列的“至少一部分”(例如DMR序列的至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%或至少90%)的序列情况下,甲基化基因座的重叠部分与DMR序列的重叠部分具有至少95%相似性、至少98%相似性或至少99%相似性(例如若重叠部分为100bp,则甲基化基因座的与DMR的部分重叠的部分相差不超过1bp、不超过2bp或不超过5bp)。在某些实施方式中,在甲基化基因座具有包含本文所列的DMR序列的“至少一部分”的序列情况下,此意谓甲基化基因座具有与DMR序列共同的子序列,该子序列具有覆盖DMR序列的至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%或至少90%的连续系列的碱基,例如其中共同的子序列相差不超过1bp、不超过2bp或不超过5bp)。在某些实施方式中,在甲基化基因座具有包含本文所列的DMR序列的“至少一部分”的序列情况下,此意谓甲基化基因座含有与DMR序列内的CpG二核苷酸对应的CpG二核苷酸的至少一部分(例如至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%或至少90%)。
医药组合物:如本文所用,术语“医药组合物(pharmaceutical composition)”是指活性剂连同一种或多种医药学上可接受的载剂一起调配的组合物。在一些具体实例中,例如如本文所阐述,活性剂以适合于向受试者施用的单位剂量的量存在于例如治疗方案中,该治疗方案在向相关群体施用时展示统计学上显著的实现预定治疗功效的机率。在一些具体实例中,例如如本文所阐述,医药组合物可经调配以特定形式(例如以固体形式或液体形式)施用,及/或可特定地经调适用于例如:经口施用(例如,作为浸液(drenche)(水性或非水性溶液或悬浮液)、锭剂、胶囊、丸剂、粉末、颗粒、糊剂等,其可经特定地调配例如用于颊内、舌下或全身性吸收);非经肠施用(例如作为例如无菌溶液或悬浮液或持续释放调配物等藉由皮下、肌内、静脉内或硬膜外注射);局部施用(例如,作为例如施加于皮肤、肺或口腔的乳膏、软膏、贴剂或喷雾剂);阴道内或直肠内施用(例如,作为阴道药栓、栓剂、乳膏或泡沫);眼部施用;经鼻或经肺施用等。
医药学上可接受:如本文所用,应用于用于调配如本文所揭示的组合物的一种或多种或所有组分的术语“医药学上可接受(pharmaceutically acceptable)”意谓各组分必须与组合物的其他成分兼容且对其接受者无害。
医药学上可接受的载剂:如本文所用,术语“医药学上可接受的载剂(pharmaceutically acceptable carrier)”是指促进药剂(例如医药剂)调配及/或修饰其生物利用度的医药学上可接受的材料、组合物或媒剂,诸如液体或固体填充剂、稀释剂、赋形剂或溶剂囊封材料。可充当医药学上可接受的载剂的物质的一些实例包括:糖,诸如乳糖、葡萄糖及蔗糖;淀粉,诸如玉米淀粉及马铃薯淀粉;纤维素及其衍生物,诸如羧甲基纤维素钠、乙基纤维素及乙酸纤维素;粉末状黄蓍;麦芽;明胶;滑石;赋形剂,诸如可可脂(cocoabutter)及栓剂蜡;油,诸如花生油、棉籽油、红花油、芝麻油、橄榄油、玉米油及大豆油;二醇,诸如丙二醇;多元醇,诸如丙三醇、山梨糖醇、甘露糖醇及聚乙二醇;酯,诸如油酸乙酯及月桂酸乙酯;琼脂;缓冲剂,诸如氢氧化镁及氢氧化铝;褐藻酸;无热原质水;等张生理盐水;林格氏溶液(Ringer'ssolution);乙醇;pH缓冲溶液;聚酯、聚碳酸酯及/或聚酸酐;及医药调配物中所用的其他无毒兼容物质。
息肉病症候群:如本文所用的术语“息肉病(polyposis)”及“息肉病症候群(polyposis syndrome)”是指遗传病状,包括(但不限于)家族性腺瘤性息肉病(familialadenomatous polyposis;FAP)、遗传性非息肉性结直肠癌(hereditary nonpolyposiscolorectal cancer;HNPCC)/林奇(Lynch)症候群、加登纳(Gardner)症候群、透克氏(Turcot)症候群、MUTYH息肉病、佩兹-杰格斯(Peutz-Jeghers)症候群、考登氏(Cowden)病、家族性青少年息肉病及增生性息肉病。在某些实施方式中,息肉病包括锯齿状息肉病症候群。锯齿状息肉病由具有以下的受试者分类:具有5个或更多个接近乙状结肠的锯齿状息肉,其中两个或更多个大小为至少10mm;在锯齿状息肉病家族病史的情况下,具有接近乙状结肠的锯齿状息肉;及/或在整个结肠中具有20个或更多个锯齿状息肉。
预防(Prevent或prevention):如本文所用,与疾病、病症或病状的发生有关的术语“预防(prevent/prevention)”是指降低产生该疾病、病症或病状的风险;延迟该疾病、病症或病状的发作;延迟该疾病、病症或病状的一种或多种特征或症状的发作;及/或降低该疾病、病症或病状的一种或多种特征或症状的频率及/或严重程度。预防可指在特定受试者中的预防或对一群受试者产生的统计影响。当疾病、病症或病状的发作已推迟预定时间段时,预防可视为完成。
探针:如本文所用,术语“探针(probe)”、“捕获探针(capture probe)”或“诱铒(bait)”是指能够与互补目标杂交且包括可检测部分的单链或双链核酸分子。在某些实施方式中,例如如本文所阐述,探针是限制消化产物或是以合成方式产生的核酸,例如藉由重组或扩增产生的核酸。在一些情况下,例如如本文所阐述,探针是适用于检测、识别及/或分离目标序列,诸如基因序列的捕获探针。在各种情况下,例如如本文所阐述,探针的可检测部分可为例如酶(例如ELISA,以及基于酶的组织化学分析)、荧光部分、放射性部分或与发光信号相关的部分。
预后:如本文所用,术语“预后(prognosis)”是指测定至少一种可能未来结果或事件的定性或定量机率。如本文所用,预后可为受试者的疾病、病症或病状(诸如癌症)的可能病程的测定、关于受试者的预期寿命的测定或关于对疗法(例如特定疗法)的反应的测定。
预后信息:如本文所用,术语“预后信息(prognostic information)”是指可用于提供预后的信息。预后信息可包括(不限于)生物标记状态信息。
启动子:如本文所用,“启动子(promoter)”可指直接或间接(例如经由结合启动子的蛋白质或物质)与RNA聚合酶结合且参与编码序列的转录起始的DNA调节区。
参考:如本文所用,描述进行比较所相对于的标准或对照。举例而言,在一些具体实例中,例如如本文所阐述,将所关注的药剂、受试者(subject)、动物、个人(individual)、群体、样品、序列或值与参考或对照药剂、受试者、动物、个人、群体、样品、序列或值进行比较。在一些具体实例中,例如如本文所阐述,测试及/或测定其参考或特征与所关注样品中的特征的测试或测定基本上是同时的。在一些具体实例中,例如如本文所阐述,参考为视情况在有形介质中实施的历史参考。典型地,如所属技术领域中具有通常知识者将理解,参考在与经受评估者(例如关于样品)相当的条件或环境下测定或表征。所属技术领域中具有通常知识者应了解,何时存在足够类似性以证明对特定可能性参考物或对照物的依赖及/或与其进行的比较。
风险:如本文关于疾病、病症或病状所用,术语“风险(risk)”是指特定受试者将罹患疾病、病症或病状的定性或定量机率(无论以百分比或以其他方式表示)。在一些具体实例中,例如如本文所阐述,风险以百分比表示。在一些具体实例中,例如如本文所阐述,风险为等于或大于0、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100%的定性或定量机率。在一些具体实例中,例如如本文所阐述,风险以相对于参考风险或水平或归因于参考的相同结果的风险的定性或定量风险水平表示。在一些具体实例中,例如如本文所阐述,相比于参考样品,相对风险增加或降低1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2、3、4、5、6、7、8、9、10或更多个因子。
样品:如本文所用,术语“样品(sample)”典型地是指获自或源自所关注的来源的材料的等分试样。在一些具体实例中,例如如本文所阐述,所关注的来源为生物或环境来源。在一些具体实例中,例如如本文所阐述,样品为直接自所关注来源获得的“初级样品”。在一些具体实例中,例如如本文所阐述,如将自上下文了解,术语“样品”是指藉由处理初级样品(例如藉由移除初级样品的一种或多种组分及/或藉由将一种或多种药剂添加至初级样品)获得的制备物。此类“经处理样品”可包括例如自样品萃取或藉由使初级样品经受诸如核酸扩增或逆转录、分离及/或纯化某些组分等技术而获得的细胞、核酸或蛋白质。
在某些情况下,例如如本文所阐述,经处理样品可为已扩增(例如,预扩增)的DNA样品。因此,在各种情况下,例如如本文所阐述,所识别的样品可指初级形式的样品或经处理形式的样品。在一些情况下,例如如本文所阐述,酶消化DNA的样品可指初级酶消化DNA(酶消化的立即产物)或经进一步处理的样品,诸如酶消化DNA,其已经受扩增步骤(例如中间扩增步骤,例如预扩增)及/或过滤步骤、纯化步骤或修饰样品以例如在测定甲基化状态(例如DNA的初级样品及/或DNA在其原始来源情形下所存在的甲基化状态)的过程中促进另一步骤的步骤。
筛检:如本文所用,术语“筛检(screening)”是指旨在产生诊断信息及/或预后信息的任何方法、技术、制程或举措。因此,所属技术领域中具有通常知识者应了解,术语筛检涵盖判定受试者是否患有疾病、病症或病状(例如结直肠癌、晚期腺瘤)、可能患有或产生该疾病、病症或病状、或处于患有或产生该疾病、病症或病状的风险下的方法、技术、制程或举措。
特异性:如本文所用,生物标记的“特异性”是指藉由不存在所关注事件或状况(其中生物标记的测量精确地指示不存在所关注事件或状况(真阴性率))表征的样品的百分比。在各种实施方式中,例如如本文所阐述,阴性样品的表征与生物标记无关,且可藉由任何相关量度,例如所属技术领域中具有通常知识者已知的任何相关量度来达成。因此,特异性反映当在未表征所关注事件或状况的样品中测量时,生物标记检测到不存在所关注事件或状况的机率。在所关注事件或状况为结直肠癌的特定具体实例中,例如如本文所阐述,特异性是指生物标记在不患有结直肠癌的受试者中检测到不存在结直肠癌的机率。结直肠癌的不存在可例如藉由组织学测定。
敏感性:如本文所用,生物标记的“敏感性”是指藉由存在所关注事件或状况(其中生物标记的测量精确地指示存在所关注事件或状况(真阳性率))表征的样品的百分比。在各种实施方式中,例如如本文所阐述,阳性样品的表征与生物标记无关,且可藉由任何相关量度,例如所属技术领域中具有通常知识者已知的任何相关量度来达成。因此,敏感性反映当在表征存在所关注事件或状况的样品中测量时,生物标记检测到存在所关注事件或状况的机率。在所关注事件或状况为结直肠癌的特定具体实例中,例如如本文所阐述,敏感性是指在患有结直肠癌的受试者中生物标记检测到存在结直肠癌的机率。结直肠癌的存在可例如藉由组织学测定。
单核苷酸多态性(Single Nucleotide Polymorphism;SNP):如本文所用,术语“单核苷酸多态性(single nucleotide polymorphism)”或“SNP”是指基因组中的特定碱基位置,在该位置中,已知替代性碱基将一个等位基因与另一等位基因区分开来。在一些具体实例中,一个或几个SNP及/或CNP足以将复杂的基因变异体彼此区分开来,以使得出于分析目的,一个或一集合SNP及/或CNP可视为特定变异体、性状、细胞类型、受试者、物种等或其集合的特征。在一些具体实例中,一个或一集合SNP及/或CNP可视为限定特定变异体、性状、细胞类型、受试者、物种等或其集合。
实体肿瘤:如本文所用,术语“实体肿瘤(solid tumor)”是指包括癌细胞的异常组织块。在各种实施方式中,例如如本文所阐述,实体肿瘤为或包括不含有囊肿或液体区域的异常组织块。在一些具体实例中,例如如本文所阐述,实体肿瘤可为良性的;在一些具体实例中,实体肿瘤可为恶性的。实体肿瘤的实例包括癌瘤、淋巴瘤及肉瘤。在一些具体实例中,例如如本文所阐述,实体肿瘤可为或包括肾上腺、胆管、膀胱、骨骼、脑、乳房、子宫颈、结肠、子宫内膜、食道、眼睛、胆囊、胃肠道、肾脏、喉部、肝脏、肺、鼻腔、鼻咽、口腔、卵巢、阴茎、垂体、前列腺、视网膜、唾液腺、皮肤、小肠、胃、睪丸、胸腺、甲状腺、子宫、阴道及/或外阴肿瘤。
癌症分期:如本文所用,术语“癌症分期(stage of cancer)”是指癌症进展程度的定性或定量评估。在一些具体实例中,例如如本文所阐述,用于确定癌症分期的准则可包括但不限于以下中的一个或多个:癌症位于身体中何处、肿瘤大小、癌症是否已扩散至淋巴结、癌症是否已扩散至身体的一个或多个不同部分等。在一些具体实例中,例如如本文所阐述,癌症可使用所谓的TNM系统分期,根据该系统,T是指主要肿瘤(通常称为原发肿瘤)的大小及范围;N是指具有癌症的邻近淋巴结的数目;且M是指癌症是否已转移。在一些具体实例中,例如如本文所阐述,癌症可称为0期(异常细胞存在但未扩散至附近组织,亦称为原位癌或CIS;CIS不为癌症,但可能变为癌症)、I-III期(癌症存在;数目愈高,肿瘤愈大且扩散至附近组织愈多)或IV期(癌症已扩散至身体的远程部分)。在一些具体实例中,例如如本文所阐述,癌症可指定为选自由以下组成的群的分期:原位(异常细胞存在但尚未扩散至邻近组织);局部(癌症局限于其开始的位置,没有其已扩散的迹象);区域(癌症已扩散至邻近淋巴结、组织或器官):远程(癌症已扩散至身体的远程部分);及未知(不存在足够信息以识别癌症分期)。
对……易感:对疾病、病症或病状“易感(susceptible to)”的受试者处于罹患该疾病、病症或病状风险下。在一些具体实例中,例如如本文所阐述,对疾病、病症或病状易感的受试者不呈现该疾病、病症或病状的任何症状。在一些具体实例中,例如如本文所阐述,对疾病、病症及/或病状易感的受试者尚未经诊断患有该疾病、病症及/或病状。在一些具体实例中,例如如本文所阐述,对疾病、病症或病状易感的受试者为已暴露于与疾病、病症或病状的发展相关的状况或呈现与该疾病、病症或病状的发展相关的生物标记状态(例如甲基化状态)的受试者。在一些具体实例中,例如如本文所阐述,罹患疾病、病症及/或病状的风险为基于群体的风险(例如罹患疾病、病症或病状的受试者的家族成员)。
受试者:如本文所用,术语“受试者(subject)”是指生物体,典型地指哺乳动物(例如人类)。在一些具体实例中,例如如本文所阐述,受试者罹患疾病、病症或病状。在一些具体实例中,例如如本文所阐述,受试者对疾病、病症或病状易感。在一些具体实例中,例如如本文所阐述,受试者呈现疾病、病症或病状的一种或多种症状或特征。在一些具体实例中,例如如本文所阐述,受试者未罹患疾病、病症或病状。在一些具体实例中,例如如本文所阐述,受试者不呈现疾病、病症或病状的任何症状或特征。在一些具体实例中,例如如本文所阐述,受试者为具有一个或多个特点的某人,该一个或多个特点的特征在于对疾病、病症或病状易感或处于疾病、病症或病状的风险。在一些具体实例中,例如如本文所阐述,受试者为患者。在一些具体实例中,例如如本文所阐述,受试者为已进行诊断及/或已施用疗法的受试者。在一些情况下,例如如本文所阐述,人类受试者可互换称为“个体”。
治疗剂:如本文所用,术语“治疗剂(therapeutic agent)”是指在向受试者施用时引发所需药理学效应的任何药剂。在一些具体实例中,例如如本文所阐述,若药剂在适当群体中展现统计显著效果,则其被视为治疗剂。在一些具体实例中,例如如本文所阐述,适当群体可为模型生物体群体或人类群体。在一些具体实例中,例如如本文所阐述,适当群体可由各种准则定义,诸如特定年龄组、性别、遗传背景、先前存在的临床病状等。在一些具体实例中,例如如本文所阐述,治疗剂为可用于治疗疾病、病症或病状的物质。在一些具体实例中,例如如本文所阐述,治疗剂为在可出售以向人类施用之前已经或需要由政府机构批准的药剂。在一些具体实例中,例如如本文所阐述,治疗剂为医学处方所需要以用于向人类施用的药剂。
治疗有效量:如本文所用,术语“治疗有效量(therapeutically effectiveamount)”是指对其所施用者产生所需效应的量。在一些具体实例中,例如如本文所阐述,术语是指当根据治疗给药方案向罹患疾病、病症及/或病状或对疾病、病症或病状易感的群体施用时足以治疗该疾病、病症或病状的量。所属技术领域中具有通常知识者应了解,术语治疗有效量实际上未必需要在特定个体中达成成功治疗。确切而言,治疗有效量可为当向需要此类治疗的个体施用时在相当大数目的受试者中提供特定所需药理学反应的量。在一些具体实例中,例如如本文所阐述,提及治疗有效量可为提及如在一种或多种特定组织(例如受疾病、病症或病状影响的组织)或流体(例如血液、唾液、血清、汗液、泪液、尿液等)中测量的量。所属技术领域中具有通常知识者应了解,在一些具体实例中,治疗有效量的特定药剂可以单次剂量调配及/或施用。在一些具体实例中,例如如本文所阐述,治疗有效的药剂可以多个剂量,例如作为多剂量给药方案的一部分调配及/或施用。
治疗:如本文所用,术语“治疗(treatment)”(亦为“治疗(treat)”或“治疗(treating)”)是指施用部分或完全缓解、改善、减轻、抑制特定疾病、病症或病状的一种或多种症状、特点及/或病因、延迟其发作、降低其严重程度及/或降低其发生率,或经施用以便实现任何此类结果的疗法。在一些具体实例中,例如如本文所阐述,此类治疗可针对不展现相关疾病、病症或病状的病征的受试者及/或仅展现疾病、病症或病状的早期病征的受试者。或者或另外,此类治疗可针对展现相关疾病、病症及/或病状的一种或多种经确认的病征的受试者。在一些具体实例中,例如如本文所阐述,治疗可针对已诊断为罹患相关疾病、病症及/或病状的受试者。在一些具体实例中,例如如本文所阐述,治疗可针对已知具有一种或多种在统计学上与相关疾病、病症或病状发展风险增加相关的易感性因素的受试者。在各种实例中,治疗针对癌症。
上游:如本文所用,术语“上游(upstream)”意谓第一DNA区相对于第二DNA区更接近包括第一DNA区及第二DNA区的核酸的N端。
单位剂量:如本文所用,术语“单位剂量(unit dose)”是指以单次剂量及/或以医药组合物的物理离散单位施用的量。在多个具体实例中,例如如本文所阐述,单位剂量含有预定量的活性剂。在一些具体实例中,例如如本文所阐述,单位剂量含有整个单次剂量的药剂。在一些具体实例中,例如如本文所阐述,施用超过一个单位剂量以达成总单次剂量。在一些具体实例中,例如如本文所阐述,需要或者认为需要施用多个单位剂量,以便达成既定效应。单位剂量可为例如含有预定量的一种或多种治疗部分的一定体积的液体(例如可接受的载剂)、预定量的呈固体形式的一种或多种治疗部分、含有预定量的一种或多种治疗部分的持续释放调配物或药物递送装置等。应了解,单位剂量可以除治疗剂之外还包括各种组分中的任一个的调配物形式存在。举例而言,可包括可接受的载剂(例如医药学上可接受的载剂)、稀释剂、稳定剂、缓冲剂、防腐剂等。所属技术领域中具有通常知识者应了解,在多个具体实例中,例如如本文所阐述,特定治疗剂的总适当日剂量可包含单位剂量的一部分或多个单位剂量,且可例如由开业医师在合理的医学判断范围内来决定。在一些具体实例中,例如如本文所阐述,任何特定受试者或生物体的特定有效剂量水平可视多种因素而定,所述因素包括经治疗的病症及该病症的严重程度;所采用的特定活性化合物的活性;所采用的特定组合物;受试者的年龄、体重、总体健康状况、性别及饮食;施用时间及所采用的特定活性化合物的排泄速率;治疗持续时间;与所采用的特定化合物组合或同时使用的药物及/或其他疗法;及医疗技术中熟知的类似因素。
未甲基化:如本文所用,术语“未甲基化(unmethylated)”及“非甲基化(non-methylated)”可互换使用且意谓经识别的DNA区不包括甲基化核苷酸。
变异体:如本文所用,术语“变异体(variant)”是指显示与参考实体的显著结构一致性,但与参考实体相比在一个或多个化学部分的存在、不存在或水平方面与参考实体结构上不同的实体。在一些具体实例中,例如如本文所阐述,变异体亦在功能上与其参考实体不同。一般而言,特定实体是否恰当地视为参考实体的“变异体”是基于其与参考实体的结构一致性的程度。变异体可为与参考相当但不一致的分子。举例而言,变异体核酸可以核苷酸序列中的一个或多个差异不同于参考核酸。在一些具体实例中,例如如本文所阐述,变异体核酸显示出的与参考核酸的总体序列一致性为至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%或99%。在多个具体实例中,例如如本文所阐述,若所关注核酸具有与参考核酸一致但在特定位置具有少量序列改变的序列,则将所关注核酸视为参考核酸的“变异体”。在一些具体实例中,例如如本文所阐述,与参考相比,变异体具有10、9、8、7、6、5、4、3、2或1个经取代的残基。在一些具体实例中,例如如本文所阐述,与参考相比,变异体具有不超过5、4、3、2或1个残基添加、取代或缺失。在各种实施方式中,例如如本文所阐述,添加、取代或缺失的数目少于约25、约20、约19、约18、约17、约16、约15、约14、约13、约10、约9、约8、约7、约6,且通常少于约5、约4、约3或约2个残基。
附图说明
藉由结合附图参考以下描述,本发明的前述及其他目的、方面、特征及优势将变得更为显而易见且更好理解,在附图中:
图1为根据说明性具体实例的例示性杂交捕获方法的流程图。
图2为根据说明性具体实例的经识别用于结直肠癌检测的203个DMR(差异甲基化区)的清单。
图3为根据说明性具体实例的经识别用于晚期腺瘤检测的220个DMR(差异甲基化区)的清单。
图4为根据说明性具体实例的突变生物标记区的列表。
图5为根据说明性具体实例的例示性杂交捕获方法的流程图。
图6为根据说明性具体实例的例示性库制备方法的流程图。
图7为根据说明性具体实例的例示性生物信息工作流程。
图8为根据说明性具体实例的展示结直肠癌验证集上203标记组别的接受者操作特征(receiver operating characteristic;ROC)曲线的图。
图9为展示结直肠癌的例示性分类模型的敏感性值及整体特异性的条形图。
图10A及10B为根据说明性具体实例的展示针对受试者验证集中的各样品,测定两个个别甲基化标记区的甲基化样品临限值的例示性值的盒状图。
图11为展示晚期腺瘤的例示性分类模型的敏感性值及根据晚期腺瘤类型的总体特异性的条形图。
图12为展示晚期腺瘤的例示性分类模型的敏感性值及整体特异性的条形图。
图13为根据说明性具体实例的用于生物信息处理步骤的流程图。
图14为一系列根据说明性具体实例的比较经亚硫酸氢盐(BS)转化的样品及经酶(EM)转化的样品的样品质量的条形图。
图15为根据说明性具体实例的比较使用亚硫酸氢盐(BS)转化或酶(EM)转化制备的样品组的PCA图。
图16为用于某些具体实例中的例示性云端计算环境的方块图。
图17为用于某些具体实例中的示例计算装置及示例移动计算设备的方块图。
具体实施方式
所主张的发明的系统、架构、装置、方法及处理意欲涵盖使用本文中所描述的具体实例的信息所进行的变化及改编。如此描述所涵盖,可执行本文中所描述的系统、架构、装置、方法及处理的改编及/或修改。
在整个实施方式中,其中物品、装置、系统及架构描述为具有、包括或包含特定组件,或其中处理及方法描述为具有、包括或包含特定步骤,意欲另外存在基本上由所列举的组件组成或由所列举的组件组成的本发明的物品、装置、系统及架构,且存在根据本发明的基本上由所列举的处理步骤组成或由所列举的处理步骤组成的处理及方法。
应理解,步骤的次序或用于执行某一动作的次序不重要,只要本发明保持可操作即可。此外,可同时进行两个或更多个步骤或动作。
本文中提及的任何公开案(例如,在背景技术部分中)并非承认该公开案充当关于本文中存在的申请专利范围中的任一项的现有技术。现有技术部分是出于清晰性的目的而存在,且并不意谓为对关于任何申请专利范围的现有技术的描述。
如所指出,文档以引用的方式并入本文中。当特定术语的涵义存在任何偏差时,由上述定义部分提供的涵义作为控制。
标题是为了方便读者而提供-标题的存在及/或置放不意欲限制本文所描述的主题的范畴。
使用UDX结肠测试检测结直肠赘瘤中的甲基化
在某些实施方式中,本文所描述的方法、系统及技术用于进行UDX结肠测试。UDX结肠测试是基于下一代测序(next generation sequencing;NGS)的定性体外诊断,其使用高产量、基于靶向杂交的捕获及生物信息处理以检测DNA(例如人类受试者的cfDNA)中超过300个结直肠瘤形成(例如结直肠癌、晚期腺瘤)相关甲基化基因座中的甲基化。在某些实施方式中,UDX结肠测试利用来自全血血浆的无细胞DNA(cfDNA)以便识别甲基化基因座。
阳性结果可能指示存在结直肠癌(colorectal cancer;CRC)或晚期腺瘤(advanced adenoma;AA)。若出现阳性结果,之后可进行诊断结肠镜检或其他诊断确认分析。UDX结肠测试可用于检测(例如筛检)处于CRC的平均风险下的45岁或更为年长的成人的结直肠瘤形成。
在某些实施方式中,UDX结肠测试包括用于测试来自全血样品的cfDNA的试剂、软件、程序或其组合。
图1展示使用本文所揭示的方法及技术处理DNA样品的例示性方法(100)的流程图。在某些实施方式中,测试使用约10至约20ng的自约4ml血浆萃取的cfDNA(110)。所萃取的cfDNA可经历转化(例如亚硫酸氢盐或酶转化)(120)。接着使用经转化DNA构建(130)测序库。所关注区(例如甲基化标记及突变标记)可使用目标富集策略(例如杂交捕获)富集(140)。接着使用下一代测序(150)技术测序所捕获的目标。使用经设计以检测(例如筛检)包括甲基化及突变(例如核苷酸取代)的基因组改变的定制生物信息分析管线(160)处理测序数据。
检测结直肠癌及晚期腺瘤
在各种实施方式中,本发明的用于检测结直肠癌的甲基化生物标记是选自作为或包括图2中所列的DMR的至少一部分的甲基化基因座。图2列出发现DMR的DNA区,其包括染色体数目(chr)、染色体上的DMR的起始(“起始(start)”)及结束(“结束(end)”)位置以及DMR区的大小(例如“宽度”)(“区的大小”)。亦列出DMR的其他特征,包括是否存在任何增强子(1表示“存在”,空白表示“不存在”)、已知在该区中具有启动子的任何基因名称(“启动子”)、基因的转录起始位点(transcription start site;TSS)上游的任何1-5kb区(“1至5kb”)、5'非翻译区(“5'UTR”)、在该区中具有外显子的基因名称(“外显子”)、在该区中具有内含子的基因名称、3'非翻译区(“3'UTR”)及关于是否存在CpG岛(island)、CPG岸(shore)、CpG礁(shelf)及CpG公海(open sea)(CpG_基因间区(inter))的标记符号。若DMR的基因提及为与另一不同DMR相关联,则“重叠基因”列将显示为“是”。
在各种实施方式中,本发明的用于检测晚期腺瘤的甲基化生物标记斯选自作为或包括图3中所列的DMR的至少一部分的甲基化基因座。图3列出发现DMR的DNA区,其中包括染色体数目(chr)、染色体上的DMR的起始(“起始”)及结束(“结束”)位置,以及亦列出DMR区的大小(例如“宽度”)(“区的大小”)。亦列出DMR的额外特征,如上所识别。
为避免任何疑义,本文在图2或图3中提供的任何甲基化生物标记可为或尤其包括于结直肠癌标记及/或晚期腺瘤标记中。另外,本文中的任何甲基化生物标记可为或包括于晚期腺瘤甲基化生物标记中。
在一些具体实例中,该甲基化生物标记可为或包括单个甲基化基因座。在一些具体实例中,甲基化生物标记可为或包括两个或更多个甲基化基因座。在一些具体实例中,甲基化生物标记可为或包括单差异甲基化区(DMR)(例如,(i)选自图2或图3中所列的那些的DMR),(ii)涵盖选自图2或图3中所列的那些的DMR的DMR,(iii)与一个或多个选自图2或图3中所列的那些的DMR重叠的DMR,或(iv)作为选自图2或图3中所列的那些的DMR的一部分的DMR)。在一些具体实例中,甲基化基因座可为或包括两个或更多个DMR(例如两个、三个、四个或更多个选自图2或图3中所列的那些的DMR),或两个、三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个、十三个、十四个、十五个、十六个、十七个、十八个、十九个、二十个、二十一个、二十二个、二十三个、二十四个或更多个DMR,其中的每一个与选自如图2或图3中所列的那些的DMR重叠及/或涵盖选自前述的DMR)。在一些具体实例中,甲基化生物标记可为或包括单一甲基化位点(例如单一CpG位点、甲基化胞嘧啶残基)。在其他具体实例中,甲基化生物标记可为或包括两个或更多个甲基化位点。在一些具体实例中,甲基化基因座可包括两个或更多个DMR且进一步包括邻近于所包括的DMR中的一个或多个的DNA区。
在一些情况下,甲基化基因座为或包括基因,诸如图2或图3中所提供的基因。在一些情况下,甲基化基因座为或包括基因的一部分,例如图2或图3中所提供的基因的一部分。在一些情况下,甲基化基因座包括但不限于基因的所识别核酸边界。举例而言,甲基化基因座可包括在基因的转录起始位点(TSS)上游的1至5kb的区。甲基化基因座当前可不与任何已知基因相关。
在一些情况下,甲基化基因座为或包括基因的编码区,诸如图2或图3中所提供的基因的编码区。在一些情况下,甲基化基因座为或包括基因的编码区的一部分,例如图2或图3中所提供的基因的编码区的一部分。在一些情况下,甲基化基因座包括但不限于基因的编码区的所识别核酸边界。
在一些情况下,甲基化基因座为或包括基因(诸如图2或图3中所提供的基因)的启动子、增强子及/或其他调控区。在一些情况下,甲基化基因座为或包括基因的启动子、增强子及/或调控区的一部分,例如图2或图3中所提供的基因的启动子及/或调控区的一部分。在一些情况下,甲基化基因座包括但不限于基因的启动子及/或其他调控区的所识别核酸边界。在一些具体实例中,甲基化基因座为或包括高CpG密度启动子,或其一部分。
在一些具体实例中,甲基化基因座为或包括非编码序列。在一些具体实例中,甲基化基因座为或包括一个或多个外显子及/或一个或多个内含子。
在一些具体实例中,甲基化基因座包括在编码序列上游延伸预定数目个核苷酸的DNA区及/或在编码序列下游延伸预定数目个核苷酸的DNA区。在各种情况下,上游及/或下游的预定数目个核苷酸可以是或包括例如500bp、1kb、2kb、3kb、4kb、5kb、10kb、20kb、30kb、40kb、50kb、75kb或100kb。所属技术领域中具有通常知识者应了解,能够影响编码序列表达的甲基化生物标记通常可在编码序列(上游及/或下游)的此等距离中的任一个内。
所属技术领域中具有通常知识者应了解,识别为甲基化生物标记的甲基化基因座不必在单一实验、反应或扩增子中分析。识别为结直肠癌甲基化生物标记的单一甲基化基因座可例如在包括甲基化基因座内的一个或多个不同或重叠DNA区(例如一个或多个不同或重叠DMR)的单独扩增(或提供足以扩增其的寡核苷酸引物及条件)的方法中加以分析。所属技术领域中具有通常知识者应进一步了解,识别为甲基化生物标记的甲基化基因座无需针对甲基化基因座内存在的各核苷酸或各CpG的甲基化状态加以分析。相反地,可例如藉由分析甲基化基因座内的单个DNA区,例如藉由分析甲基化基因座内的单个DMR来分析作为甲基化生物标记的甲基化基因座。
本发明的DMR可为甲基化基因座或包括甲基化基因座的一部分。在一些情况下,DMR为具有长度例如为1至5,000bp的甲基化基因座的DNA区。在各种实施方式中,DMR为长度等于或小于5000bp、4,000bp、3,000bp、2,000bp、1,000bp、950bp、900bp、850bp、800bp、750bp、700bp、650bp、600bp、550bp、500bp、450bp、400bp、350bp、300bp、250bp、200bp、150bp、100bp、50bp、40bp、30bp、20bp或10bp的甲基化基因座的DNA区。在一些具体实例中,DMR的长度为1、2、3、4、5、6、7、8或9bp。
包括但不限于本文所提供的甲基化基因座及DMR的甲基化生物标记可包括至少一个作为结直肠癌生物标记的甲基化位点。
为了清楚起见,所属技术领域中具有通常知识者应了解广泛使用术语甲基化生物标记,使得甲基化基因座可为包括一个或多个DMR的甲基化生物标记,所述DMR中的每一个本身亦为甲基化生物标记,且所述DMR中的每一个可包括一个或多个甲基化位点,所述甲基化位点中的每一个本身亦为甲基化生物标记。此外,甲基化生物标记可包括两个或更多个甲基化基因座。因此,作为甲基化生物标记的状态不取决于生物标记中所包括的核酸的邻接性,而是基于在第一病状与第二病状之间(诸如在结直肠癌与对照、晚期腺瘤及对照,或结直肠癌与晚期腺瘤及对照之间)所包括的DNA区的甲基化状态是否存在变化。
如本文所提供,甲基化基因座可为一个或多个甲基化基因座中的任一个,所述甲基化基因座中的每一个为、包括或作为图2或图3中所识别的基因(或特定DMR)的一部分。在一些具体实例中,结直肠癌及/或晚期腺瘤甲基化生物标记包括单一甲基化基因座,其为、包括或作为图2或图3中所识别的基因的一部分。
在一些具体实例中,甲基化生物标记包括两个或更多个甲基化基因座,其中的每一个为、包括或作为图2或图3中所识别的基因的一部分。在一些具体实例中,结直肠癌及/或晚期腺瘤甲基化生物标记包括多个甲基化基因座,其中的每一个为、包括或作为图2或图3中所识别的基因的一部分。
在各种实施方式中,甲基化生物标记可为或包括存在于本文所提供的一个或多个甲基化基因座(例如一个或多个DMR)内的一个或多个个别核苷酸(例如在CpG的情况下为单个个别胞嘧啶残基)或(例如多个CpG的)多个个别胞嘧啶残基。因此,在某些实施方式中,甲基化生物标记为或包括多个个别甲基化位点的甲基化状态。
在各种实施方式中,甲基化生物标记为、包括或特征在于甲基化状态的变化,其为一个或多个甲基化基因座(例如一个或多个DMR)内的一个或多个甲基化位点的甲基化变化。在各种实施方式中,甲基化生物标记为或包括甲基化状态的变化,其为一个或多个甲基化基因座(例如一个或多个DMR)内甲基化位点(例如一个或多个CpG位点)的数目变化。在各种实施方式中,甲基化生物标记为或包括甲基化状态的变化,其为一个或多个甲基化基因座(例如一个或多个DMR)内的甲基化位点的频率变化。在各种实施方式中,甲基化生物标记为或包括甲基化状态的变化,其为一个或多个甲基化基因座(例如一个或多个DMR)内的甲基化位点的模式变化。
在各种实施方式中,一个或多个甲基化基因座(例如一个或多个DMR)的甲基化状态是以经甲基化的样品中所存在的一个或多个甲基化基因座(例如一个或多个DMR)的分数或百分比表示,例如以在一个或多个特定甲基化基因座(例如一个或多个特定DMR)处经甲基化的样品中的DNA的个别DNA链的数目的分数表示。所属技术领域中具有通常知识者应了解,在一些情况下,甲基化的分数或百分比可针对例如样品内的一个或多个所分析的DMR,由甲基化DMR与未甲基化DMR的比率计算。
在各种实施方式中,将一个或多个甲基化基因座(例如一个或多个DMR)的甲基化状态与参考样品或一组参考样品中的一个或多个甲基化基因座(例如一个或多个DMR)的参考甲基化状态值及/或甲基化状态相比较。举例而言,在某些实施方式中,参考样品群组为获自个体的多个样品,其中已知所述样品表示特定病状(例如“正常”非癌症病状,或癌症病状)。在某些情况下,参考为来自相同来源(例如来自相同来源(例如来自同一受试者)的先前样品)的非同时样品。在某些情况下,一个或多个甲基化基因座(例如一个或多个DMR)的甲基化状态的参考为样品(例如来自受试者的样品)或已知表示特定病状(例如癌症病状或非癌症病状)的多个样品中的一个或多个甲基化基因座(例如一个或多个DMR)的甲基化状态。因此,参考可为或包括一个或多个预定临限值,所述临限值可为定量的(例如,甲基化值)或定性的。所属技术领域中具有通常知识者应了解,参考测量值典型地藉由使用与进行非参考测量的方法相同、类似或相当的方法进行的测量来产生。
在各种实施方式中,将一个或多个甲基化基因座(例如一个或多个DMR)的甲基化状态与参考样品中的一个或多个甲基化基因座(例如一个或多个DMR)的参考甲基化状态值及/或甲基化状态相比较。在某些情况下,参考为来自相同来源(例如来自相同来源(例如来自同一个体)的先前样品)的非同时样品。在某些情况下,一个或多个甲基化基因座(例如一个或多个DMR)的甲基化状态的参考为样品(例如来自受试者的样品)或已知表示特定病状(例如癌症病状或非癌症病状)的多个样品中的一个或多个甲基化基因座(例如一个或多个DMR)的甲基化状态。因此,参考可为或包括一个或多个预定临限值,所述临限值可为定量的(例如,甲基化值)或定性的。所属技术领域中具有通常知识者应了解,参考测量值典型地藉由使用与进行非参考测量的方法相同、类似或相当的方法进行的测量来产生。
在各种实施方式中,甲基化基因座的甲基化状态可基于映射至甲基化基因座的一个或多个读段(例如使用NGS技术获得)的甲基化。举例而言,当分析自测序技术,例如NGS测序技术,例如靶向NGS测序技术获得的测序数据时,测序数据可包括DNA片段的碱基对的推断或机率性序列。DNA片段的碱基对的推断或机率性序列已知为读段。读段可例如在基因组(例如参考基因组,例如亚硫酸氢盐转化的参考基因组)中映射至甲基化基因座(例如DMR,突变标记)参考序列。基于读段序列与参考序列的比较,个别CpG或胞嘧啶残基可识别为与参考状况相比是高甲基化还是低甲基化的。在某些实施方式中,基于考虑甲基化位点(例如CpG)的数目及甲基化百分比的预定最小临限值,测定读段的依读段甲基化值(例如依读段甲基化分数)。在某些实施方式中,依读段甲基化值为二进制值。
晚期腺瘤
在某些实施方式中,本文所呈现的方法及组合物适用于筛检晚期腺瘤。晚期腺瘤包括(但不限于):结肠及/或直肠中的赘生性腺瘤生长、位于结肠的近端部分中的腺瘤、位于结肠及/或直肠的远程部分中的腺瘤、低级发育不良的腺瘤、高级发育不良的腺瘤、具有任何大小的展示高级发育不良的病征的结直肠组织的赘生性生长、具有大小大于或等于10mm的任何组织及/或发育不良级别的结直肠组织的赘生性生长、具有任何发育不良类型及任何大小的绒毛状组织型结直肠组织的赘生性生长及具有任何发育不良级别及/或大小的锯齿状组织型结直肠组织。
结直肠癌
在某些实施方式中,本发明的方法及组合物适用于筛检结直肠癌。结直肠癌包括(但不限于)结肠癌、直肠癌及其组合。结直肠癌包括转移性结直肠癌及非转移性结直肠癌。结直肠癌包括位于结肠癌的近端部分中的癌症及位于结肠的远程部分中的癌症。
结直肠癌包括所属技术领域中已知的各种可能分期中的任一者的结直肠癌,包括例如I期、II期、III期及IV期结直肠癌(例如0、I、IIA、IIB、IIC、IIIA、IIIB、IIIC、IVA、IVB及IVC期)。结直肠癌包括肿瘤/淋巴结/癌转移(Tumor/Node/Metastasis;TNM)分期系统的所有分期。关于结直肠癌,T可指肿瘤是否生长至结肠或直肠壁中,且若生长至结肠或直肠壁中,生长了多少层;N可指肿瘤是否已扩散至淋巴结,且若已扩散至淋巴结,扩散至多少个淋巴结及所扩散的淋巴结位于何处;且M可指癌症是否已扩散至身体其他部位,且若已扩散至身体其他部位,扩散至何部位及扩散程度。T、N及M的特定分期为所属技术领域中已知。T分期可包括TX、T0、Tis、T1、T2、T3、T4a及T4b;N分期可包括NX、N0、N1a、N1b、N1c、N2a及N2b;M分期可包括M0、M1a及M1b。此外,结直肠癌的级别可包括GX、G1、G2、G3及G4。分期癌症且尤其结直肠癌的各种方法为所属技术领域中所熟知,例如在全球信息网(world wide web)上以cancer.net/cancer-types/colorectal-cancer/stages所总结。
在某些情况下,本发明包括筛检早期结直肠癌。早期结直肠癌可包括例如位于受试者内的结直肠癌,例如此是因为其尚未扩散至受试者的淋巴结,例如接近癌症的淋巴结(N0期),且尚未扩散至远程部位(M0期)。早期癌症包括对应于例如0至IIC期的结直肠癌。
因此,本发明的结直肠癌尤其包括癌前结直肠癌及恶性结直肠癌。本发明的方法及组合物适用于筛检所有形式及分期(包括但不限于本文中所提及或所属技术领域中另外已知的那些形式及分期,以及其所有子集)的结直肠癌。因此,所属技术领域中具有通常知识者应了解,对本文所提供的结直肠癌的所有提及包括但不限于所有形式及分期(包括但不限于本文中所提及或所属技术领域中另外已知的那些形式及分期,以及其所有子集)的结直肠癌。
受试者及样品
使用本文所提供的方法及组合物分析的样品可为任何生物样品及/或包括核酸的任何样品。在各种特定具体实例中,使用本文所提供的方法及组合物分析的样品可为来自哺乳动物的样品。在各种特定具体实例中,使用本文所提供的方法及组合物分析的样品可为来自人类受试者的样品。在各种特定具体实例中,使用本文所提供的方法及组合物分析的样品可为来自小鼠、大鼠、猪、马、鸡或牛的样品。
在各种情况下,人类受试者为诊断或寻求诊断为患有结直肠赘瘤(例如结直肠癌、晚期腺瘤)、诊断或寻求诊断为处于患有该赘瘤的风险下及/或诊断或寻求诊断为处于患有该赘瘤的即刻风险的受试者。在各种情况下,人类受试者为经识别为需要筛检结直肠赘瘤(例如结直肠癌、晚期腺瘤)的受试者的受试者。在某些情况下,人类受试者为藉由开业医师识别为需要结直肠癌筛检的受试者。在各种情况下,人类受试者由于年龄经识别为需要结直肠癌筛检,例如由于年龄等于或大于40岁,例如年龄等于或大于49、45、50、55、60、65、70、75、80、85或90岁,但在一些情况下,18岁或更大的受试者可经识别为处于风险下及/或需要筛检结直肠赘瘤(例如结直肠癌、晚期腺瘤)。在各种情况下,基于(但不限于)家族病史、先前诊断及/或开业医师评估,人类受试者经识别为处于高风险及/或需要筛检结直肠赘瘤(例如结直肠癌、晚期腺瘤)。在各种情况下,人类受试者为未诊断为患有癌症(诸如结直肠癌)、未处于患有该癌症的风险下、未处于患有该癌症的即刻风险下、未诊断为患有该癌症及/或未寻求该癌症诊断或其任何组合的受试者。
来自受试者(例如人类或其他哺乳动物受试者)的样品可为例如血液、血液组分(例如血浆、血沉棕黄层)、cfDNA(无细胞DNA)、ctDNA(循环肿瘤DNA)、粪便或组织(例如晚期腺瘤及/或结直肠组织)的样品。在一些特定具体实例中,样品为受试者的排泄物或体液(例如受试者的粪便、血液、血浆、淋巴或尿液)或结直肠赘瘤的组织样品,诸如结肠息肉、晚期腺瘤及/或结直肠癌。来自受试者的样品可为细胞或组织样品,例如具有癌症或包括例如肿瘤或转移性组织的癌细胞的细胞或组织样品。举例而言,样品可包括结直肠细胞、息肉细胞或腺细胞。在各种实施方式中,来自受试者(例如人类或其他哺乳动物受试者)的样品可藉由活检(例如结肠镜检切除、细针抽吸或组织活检)或手术获得。
在各种特定具体实例中,样品为无细胞DNA(cfDNA)的样品。cfDNA典型地以短双链片段形式发现于生物体液(例如血浆、血清或尿液)中。cfDNA的浓度典型地较低,但在特定条件下可显著增加,包括但不限于妊娠、自体免疫病症、心肌梗塞及癌症。循环肿瘤DNA(ctDNA)为特定地源自癌细胞的循环DNA的组分。ctDNA可存在于人类体液中。举例而言,在一些情况下,可发现ctDNA与白血球及红血球结合及/或与白血球及红血球相关。在一些情况下,可发现ctDNA不与白细胞及红血球结合及/或与白血球及红血球相关。检测肿瘤来源的cfDNA的各种测试是基于检测癌症(例如相关癌症)所特有的遗传或表观遗传修饰。癌症所特有的遗传或表观遗传修饰可包括(但不限于)肿瘤抑制基因、活化致癌基因、高甲基化及/或染色体病症中的致癌或癌症相关突变。癌症或癌前期所特有的遗传或表观遗传修饰的检测可确认,所检测的cfDNA为ctDNA。
cfDNA及ctDNA提供源组织的甲基化状态的实时或几乎实时度量值。cfDNA及ctDNA在血液中的半衰期为约2小时,使得在给定时间采集的样品相对及时地反映源组织的状态。
自样品分离核酸(例如自血液或血浆分离cfDNA)的多种方法为所属技术领域中已知的。核酸可例如(但不限于)藉由标准DNA纯化技术,藉由直接基因捕获(例如藉由澄清样品以移除分析抑制剂及用捕获剂自澄清样品捕获目标核酸(若存在)以产生捕获复合物,且分离捕获复合物以回收目标核酸)来分离。
在某些实施方式中,样品可具有所需最小量的DNA(例如cfDNA、gDNA)(例如DNA片段)以便后续测定甲基化状态。举例而言,在某些实施方式中,可需要样品具有至少5ng、至少10ng、至少20ng(或更多)DNA。
测量甲基化状态的方法
甲基化状态可藉由所属领域中已知的多种方法及/或藉由本说明书中提供的方法测量。所属技术领域中具有通常知识者应了解,用于测量甲基化状态的方法一般可应用于来自任何来源及任何种类的样品,且将进一步了解可用于将样品修饰成适用于藉由给定方法测量的形式的处理步骤。
在某些实施方式中,处理步骤涉及对样品的DNA进行片段化或剪切。举例而言,自细胞、组织或其他来源获得的基因组DNA(例如gDNA)可能需要在测序之前片段化。在某些实施方式中,DNA可在测量甲基化状态之前使用物理方法(例如使用超音波发生器、喷雾器技术、流体动力剪切等)片段化。在某些实施方式中,DNA可使用酶方法(例如使用核酸内切酶或转座酶)片段化。某些样品,例如cfDNA样品可能不需要片段化。cfDNA片段的长度为约200bp且可适合于本文所提供的某些方法。长度为约100-1000bp的DNA片段适用于在本文所描述的某些NGS技术,包括例如基于的技术中分析。某些技术可能需要约100-1000bp范围的DNA片段。相比之下,约10kb或更长的DNA片段适用于长读段测序技术。
测量甲基化状态的方法包括(但不限于):包括全基因组亚硫酸氢盐测序、靶向亚硫酸氢盐测序、靶向酶甲基化测序、甲基化状态特异性聚合酶链反应(PCR)的方法;包括质谱分析、甲基化数组的方法;包括甲基化特异性核酸酶的方法;包括基于质谱的分离的方法;包括目标特异性捕获(例如杂交捕获)的方法及包括甲基化特异性寡核苷酸引物的方法。某些特定甲基化分析利用亚硫酸氢盐试剂(例如酸式亚硫酸盐离子)或酶转化试剂(例如Tet甲基胞嘧啶双加氧酶2)。
亚硫酸氢盐试剂尤其可包括亚硫酸氢盐(bisulfite)、焦亚硫酸盐(disulfite)、酸式亚硫酸盐(hydrogen sulfite)、焦亚硫酸钠或其组合,所述试剂可用于区分甲基化及未甲基化核酸。亚硫酸氢盐以不同方式与胞嘧啶及5-甲基胞嘧啶相互作用。在典型的基于亚硫酸氢盐的方法中,DNA(例如单链DNA、双链DNA)与亚硫酸氢盐的接触使未甲基化胞嘧啶脱胺(例如转化)成尿嘧啶,而甲基化胞嘧啶保持不受影响。选择性地保留甲基化胞嘧啶,但不保留未甲基化胞嘧啶。因此,在经亚硫酸氢盐处理的样品中,尿嘧啶残基代替未甲基化胞嘧啶残基且因此为其提供识别信号,而其余(甲基化)胞嘧啶残基因此为甲基化胞嘧啶残基提供识别信号。经亚硫酸氢盐处理的样品可例如藉由下一代测序(NGS)或本文所揭示的其他方法分析。
在一些具体实例中,经亚硫酸氢盐处理的样品可使用至少为的亚硫酸氢盐与DNA的亚硫酸氢盐比率处理。在某些实施方式中,经亚硫酸氢盐处理的样品包含单链DNA片段或双链DNA片段。
在一些具体实例中,亚硫酸氢盐处理包括使DNA片段(例如双链DNA)经历一个或多个变性转化循环以便在DNA片段中将未甲基化胞嘧啶转化成尿嘧啶。变性将样品中的双链DNA片段转化为单链DNA片段。转化使得单链DNA的未甲基化胞嘧啶变成尿嘧啶。在一些具体实例中,仅进行一个变性转化循环。在一些具体实例中,进行两个、三个、四个、五个、六个、七个、八个、九个、十个、十五个、二十个或更多个变性转化循环。在一些具体实例中,进行变性步骤的温度在约80℃-100℃(例如约90℃-97℃,例如约96℃)的温度下。在一些具体实例中,变性步骤进行小于10分钟(例如小于5分钟、小于5分钟、小于2分钟或更小)。在某些实施方式中,转化步骤进行小于2.5小时(例如,小于2小时、小于1小时、小于30分钟、小于15分钟或更小)。在某些实施方式中,转化步骤在55℃至65℃的温度下进行。在某些实施方式中,经转化DNA片段可在进行变性转化循环之后储存在约4℃的温度下。在一些具体实例中,亚硫酸氢盐处理可在库制备之前施用。在一些具体实例中,亚硫酸氢盐处理可在库制备之后施用。
酶转化试剂可包括Tet甲基胞嘧啶双加氧酶2(TET2)。TET2氧化5-甲基胞嘧啶且因此保护其免受藉由APOBEC的连续脱胺。APOBEC使未甲基化胞嘧啶脱胺成尿嘧啶,而经氧化的5-甲基胞嘧啶保持不受影响。因此,在经TET2处理的样品中,尿嘧啶残基代替未甲基化胞嘧啶残基且因此为其提供识别信号,而其余(甲基化)胞嘧啶残基因此为甲基化胞嘧啶残基提供识别信号。经TET2处理的样品可例如藉由下一代测序(NGS)分析。在某些实施方式中,APOBEC是指载脂蛋白B mRNA编辑催化多肽样(APOBEC)家族的成员(或多个成员)。在某些实施方式中,APOBEC可指APOBEC-1、APOBEC-2、APOBEC-3A、APOBEC-3B、APOBEC-3C、APOBEC-3D、APOBEC-3E、APOBEC-3F、APOBEC-3G、APOBEC-3H、APOBEC-4及/或活化诱导性(胞苷)去氨酶(AID)。
测量甲基化状态的方法可包括(但不限于)大量平行测序(例如下一代测序法)以测定甲基化状况,例如边合成边测序(sequencing by-synthesis)、实时(例如单分子)测序、珠粒乳液测序、纳米孔测序或所属技术领域中已知的其他测序技术。在一些具体实例中,测量甲基化状态的方法可包括全基因组测序,例如以碱基对分辨率测量经亚硫酸氢盐或酶处理的物质的全基因组甲基化状态。
在一些具体实例中,测量甲基化状态的方法包括简化代表性亚硫酸氢盐测序(reduced representation bisulfite sequencing),例如利用限制酶以碱基对分辨率测量来自经亚硫酸氢盐或酶处理的物质的高CpG含量区的甲基化状态。
在一些具体实例中,测量甲基化状态的方法可包括靶向测序,例如以碱基对分辨率测量来自经亚硫酸氢盐或酶处理的物质的预选基因组位置的甲基化状态。
在一些具体实例中,所关注区(例如DMR)的预选(捕获)(例如富集)可藉由互补、体外合成的寡核苷酸序列(例如捕获诱饵/探针)进行。捕获探针(例如寡核苷酸捕获探针、寡核苷酸捕获诱饵)适用于靶向测序(例如NGS)技术以富集寡核苷酸(例如DNA)序列中的特定关注区。举例而言,当对DNA的特定预定区的序列测序时,目标区的富集是有用的。在某些实施方式中,捕获探针约10至1000bp长(例如约10至约200bp长)(例如约120bp长)。在某些实施方式中,靶向一个或多个捕获探针以捕获对应于一个或多个甲基化基因座(例如包含一个或多个DMR的至少一部分的甲基化基因座,例如如图2及/或图3中所发现)的所关注区(例如基因组标记)。在某些实施方式中,将捕获探针靶向至低甲基化或高甲基化的甲基化基因座。举例而言,可将捕获探针靶向至特定甲基化基因座。然而,若对应于甲基化基因座的DNA片段在使用捕获探针富集之前经转化(例如经亚硫酸氢盐或酶转化),则经转化的DNA片段的序列将如本文中所描述因特定胞嘧啶残基未甲基化所致而变化。因此,若胞嘧啶系低甲基化的,则靶向未转化的DNA区可导致一些错配。虽然捕获探针-目标序列杂交可容许一些错配,但可需要第二探针富集低甲基化的DNA区。
在某些实施方式中,评估捕获探针(例如在测序之前)靶向所关注基因组的多个区的能力。举例而言,当设计捕获探针以靶向特定关注区(例如DMR)时,可考虑捕获探针靶向基因组的多个区的能力。如本文所论述,配对(例如非沃森-克里克配对)中的错配允许捕获探针与基因组的其他非预期区杂交。另外,特定目标序列可在基因组中的其他地方重复。重复序列为高度重复序列的共同序列。在某些实施方式中,捕获探针经设计以使得其仅靶向基因组的少数类似区。在某些实施方式中,捕获探针可与基因组中的500个或更少、100个或更少、50个或更少、10个或更少、5个或更少类似区杂交。在某些实施方式中,使用围绕基因组移动的24bp窗口且根据序列次序类似性将窗口区与参考序列匹配来计算与所关注区的目标类似的区。可使用其他大小的窗口及/或技术。
举例而言,一个或多个DNA片段(例如ctDNA、片段化gDNA)的杂交捕获可使用靶向至基因组的所关注预定区的捕获探针进行。在某些实施方式中,捕获探针靶向至少2个(例如至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、50、75、100、150个或更多个)预定关注区(例如基因组标记,例如DMR)。在某些实施方式中,捕获探针重叠。在某些实施方式中,重叠探针重叠至少10%、至少20%、至少30%、至少40%、至少50%、至少60%或更多。
在某些实施方式中,捕获探针为核酸探针(例如DNA探针、RNA探针)。在一些具体实例中,方法也可包括使用靶向测序识别突变区(例如个别核苷酸碱基),例如确定一个或多个预选的基因组位置中是否存在突变(例如基因组标记,例如突变标记)。在某些实施方式中,也可以碱基对分辨率自亚硫酸氢盐或酶处理的DNA中识别突变。
在一些具体实例中,用于测量甲基化状态的方法可包括Illumina甲基化分析,例如以单核苷酸分辨率在基因组中定量测量超过850,000个甲基化位点。
各种甲基化分析程序可与亚硫酸氢盐处理结合使用以测定目标序列,诸如DMR的甲基化状态。此类分析尤其可包括甲基化特异性限制酶qPCR、经亚硫酸氢盐处理的核酸的测序、PCR(例如具有序列特异性扩增)、甲基化特异性核酸酶辅助次要等位基因富集PCR及甲基化敏感性高分辨率熔融。在一些具体实例中,DMR自经转化(例如经亚硫酸氢盐或酶转化)的DNA片段扩增以用于库制备。
在一些具体实例中,测序库可使用经转化(例如经亚硫酸氢盐或酶转化)的寡核苷酸片段(例如cfDNA、gDNA片段、合成核苷酸序列等)根据例如Illumina方案、Accel-Methyl-Seq DNA库试剂盒(Swift Bioscience)方案、基于转座酶的Nextera XT方案或其类似物制备。在一些具体实例中,寡核苷酸片段为已经转化(例如经亚硫酸氢盐或酶转化)的DNA片段。在某些实施方式中,用于制备测序库的DNA片段可为单链DNA片段或双链DNA片段。在某些实施方式中,库可藉由将转接子附接至DNA片段来制备。转接子含有短(例如约100至约1000bp)序列(例如寡核苷酸序列),所述短序列允许库(例如DNA库)的寡核苷酸片段结合至用于例如下一代测序(NGS)的流动池且在该流动池上产生簇。在NGS之前,转接子可连接至库片段。在某些实施方式中,连接酶共价连接转接子及库片段。在某些实施方式中,转接子附接至经转化DNA片段的5'端及3'端中的任一者或两者。在某些实施方式中,执行附接步骤以使得至少40%、至少50%、至少60%、至少70%的经转化DNA片段附接至转接子。在某些实施方式中,执行附接步骤以使得至少40%、至少50%、至少60%、至少70%的经转化DNA片段具有在5'端及3'端处附接的转接子。
在某些实施方式中,本文中所用的转接子含有有助于样品识别的寡核苷酸的序列。举例而言,在某些实施方式中,转接子包括样品索引。样品索引为核酸(例如DNA、RNA)的短序列(例如约8至约10个碱基),其充当样品识别符且尤其允许在单次测序运行及/或流动池(例如用于NGS技术)中多任务处理及/或合并多个样品。在某些实施方式中,经转化单链DNA片段的5'端、3'端或两者处的转接子包括样品索引。在某些实施方式中,转接子序列可包括分子条形码。分子条形码可充当独特分子识别符以在例如DNA测序期间识别目标分子。在某些实施方式中,可随机产生DNA条形码。在某些实施方式中,可预定或预设DNA条形码。在某些实施方式中,DNA条形码在各DNA片段上不同。在某些实施方式中,在生物样品中,彼此不互补(例如,彼此不成沃森-克里克配对)的两个单链DNA片段的DNA条形码可相同。在某些实施方式中,在将转接子连接至DNA片段之后,DNA片段可经扩增(例如使用PCR)。在某些实施方式中,至少40%(例如至少至少50%、至少60%、至少70%)的经转化DNA片段具有在5'端及3'端处附接的转接子。
在某些实施方式中,使用高通量及/或下一代测序(NGS)技术实现寡核苷酸(例如DNA)序列的碱基对水平分辨率,允许分析甲基化状态及/或识别突变。举例而言,在某些实施方式中,NGS可包括单一末端或成对末端测序。在单一末端测序中,一种技术在一个方向上—自片段之一个末端至该片段的相对末端读取测序片段。在某些实施方式中,此产生单个DNA序列,接着可将其与参考序列比对。在成对末端测序中,在自片段的一个末端至该片段的相对末端的第一方向上读取测序片段。可读取测序片段直至达到指定读段长度。接着,在与第一方向相反的第二方向上读取测序片段。在某些实施方式中,具有多个读段对可有助于改良读段比对及/或识别未藉由单一末端读取检测到的突变(例如插入、缺失、倒置等)。
可用于甲基化检测的另一方法包括用甲基化特异性寡核苷酸引物进行PCR扩增(MSP方法),例如如应用于经亚硫酸氢盐处理的样品(参见例如Herman1992Proc.Natl.Acad.Sci.USA 93:9821-9826,其关于测定甲基化状态的方法以引用的方式并入本文中)。甲基化状态特异性寡核苷酸引物用于经亚硫酸氢盐处理的DNA的扩增的用途允许在甲基化核酸与未甲基化核酸之间区分。用于MSP方法的寡核苷酸引物对包括至少一个能够与包括甲基化位点(例如CpG位点)的序列杂交的寡核苷酸引物。包括处于与胞嘧啶残基互补的位置的T残基的寡核苷酸引物将在亚硫酸氢盐处理之前选择性地杂交至其中胞嘧啶未经甲基化的模板,而包括处于与胞嘧啶残基互补的位置的G残基的寡核苷酸引物将在亚硫酸氢盐处理之前选择性地杂交至其中胞嘧啶为甲基化胞嘧啶的模板。可在有或无测序扩增子情况下,例如使用凝胶电泳获得MSP结果。MSP(甲基化特异性PCR)允许使用经亚硫酸氢盐转化的DNA的PCR扩增,对基因座特异性DNA甲基化进行高度敏感检测(检测水平达0.1%等位基因,具有完全特异性)。
可用于在对样品进行亚硫酸氢盐处理之后测定甲基化状态的另一方法为甲基化敏感性高分辨率熔融(Methylation-Sensitive High Resolution Melting;MS-HRM)PCR(参见例如Hussmann 2018Methods Mol Biol.1708:551-571,其关于测定甲基化状态的方法以引用的方式并入本文中)。MS-HRM为基于杂交熔融检测所关注的特定基因座处的甲基化水平的管内(in-tube)、基于PCR的方法。在进行MS-HRM之前对DNA进行亚硫酸氢盐处理确保甲基化DNA与未甲基化DNA之间的不同碱基组成,其用于藉由高分辨率熔融分离所得扩增子。独特引物设计促进分析的高灵敏度,使得能够在未甲基化背景中检测到低至0.1%-1%的甲基化等位基因。用于MS-HRM分析的寡核苷酸引物经设计与甲基化等位基因互补,且特异性退火温度使得此等引物能够退火于甲基化等位基因及未甲基化等位基因两者,由此增加分析的灵敏度。
可用于在对样品进行亚硫酸氢盐处理后测定甲基化状态的另一方法为定量多重甲基化特异性PCR(Quantitative Multiplex Methylation-Specific PCR;QM-MSP)。QM-MSP使用甲基化特异性引物对DNA甲基化进行敏感性定量(参见例如Fackler2018MethodsMol Biol.1708:473-496,其关于测定甲基化状态的方法以引用的方式并入本文中)。QM-MSP为二步骤PCR方法,其中在第一步骤中,一对基因特异性引物(正向及反向)在一个PCR反应中同时及以多重方式扩增同一基因的甲基化及未甲基化复本。此甲基非依赖性扩增步骤在36个PCR循环之后产生至多109个复本/μL的扩增子。在第二步骤中,使用实时PCR及两个独立荧光团(例如6FAM及VIC),用标准曲线定量第一反应的扩增子以检测同一孔中各基因的甲基化/未甲基化DNA。在100,000个参考基因复本中可检测到一个甲基化复本。
可用于在对样品进行亚硫酸氢盐处理后测定甲基化状态的另一方法为甲基化特异性核酸酶辅助次要等位基因富集(Methylation Specific Nuclease-assisted Minor-allele Enrichment;MS-NaME)(参见例如Liu 2017Nucleic Acids Res.45(6):e39,其关于测定甲基化状态的方法以引用的方式并入本文中)。Ms-NaME基于探针在对双链(ds)DNA(double-stranded DNA;DSN)具有特异性的DNA核酸酶存在下与目标序列的选择性杂交,使得杂交产生随后藉由DSN消化的双链DNA区。因此,靶向未甲基化序列的寡核苷酸探针产生局部双链区,从而导致消化未甲基化目标;能够与甲基化序列杂交的寡核苷酸探针产生导致消化甲基化目标、使甲基化目标完整的局部双链区。此外,寡核苷酸探针可同时将DSN活性引导至经亚硫酸氢盐处理的DNA中的多个目标。后续扩增可富集未经消化的序列。Ms-NaME可独立地或与本文所提供的其他技术组合使用。
可用于在对样品进行亚硫酸氢盐处理之后测定甲基化状态的另一方法为甲基化敏感性单核苷酸引物延伸(Methylation-sensitive Single Nucleotide PrimerExtension;Ms-SNuPETM)(参见例如Gonzalgo 2007Nat Protoc.2(8):1931-6,其关于测定甲基化状态的方法以引用的方式并入本文中)。在Ms-SNuPE中,使用Ms-SNuPE进行链特异性PCR以产生DNA模板用于定量甲基化分析。接着用经设计以直接在所询问的CpG位点上游杂交的寡核苷酸进行SNuPE。可使反应产物在聚丙烯酰胺凝胶上经电泳以用于藉由磷光体影像分析进行观测及定量。扩增子也可携带直接或间接可检测标记,诸如荧光标记、放射性核素或具有可藉由质谱分析区分的质量的可拆卸分子片段或其他实体。检测可藉助于例如矩阵辅助雷射解吸附/电离质谱(matrix assisted laser desorption/ionization massspectrometry;MALDI)或使用电喷雾质谱(electron spray mass spectrometry;ESI)进行及/或观测。
可用于在对样品进行亚硫酸氢盐处理之后测定甲基化状态的某些方法在基于扩增的方法中利用第一寡核苷酸引物、第二寡核苷酸引物及寡核苷酸探针。举例而言,寡核苷酸引物及探针可用于实时聚合酶链反应(real-time polymerase chain reaction;PCR)或微滴式数位PCR(droplet digital PCR;ddPCR)的方法中。在各种情况下,第一寡核苷酸引物、第二寡核苷酸引物及/或寡核苷酸探针选择性地杂交甲基化DNA及/或未甲基化DNA,使得扩增或探针信号指示样品的甲基化状态。
用于检测甲基化状态(例如,一定水平的5-甲基胞嘧啶的存在)的其他基于亚硫酸氢盐的方法揭示于例如Frommer(1992Proc Natl Acad Sci U S A.1;89(5):1827-31,其关于测定甲基化状态的方法以引用的方式并入本文中)中。
在某些MSRE-qPCR具体实例中,使用例如实时PCR或数字PCR,在呈天然(例如未消化)形式的样品的等分试样中测量总DNA的量。
各种扩增技术可单独或与本文所描述的用于检测甲基化状态的其他技术结合使用。已检阅本说明书的所属技术领域中具有通常知识者应了解如何将所属技术领域中已知及/或本文所述的各种扩增技术与所属技术领域中已知及/或本文所提供的用于甲基化状态测定的各种其他技术组合。扩增技术包括(但不限于)PCR,例如定量PCR(qPCR)、实时PCR及/或数位PCR。所属技术领域中具有通常知识者应了解,聚合酶扩增可在单一反应中多任务扩增多个目标。PCR扩增子的长度典型地为100至2000个碱基对。在各种情况下,扩增技术足以测定甲基化状态。
基于数位PCR(Digital PCR;dPCR)的方法涉及在具有96孔、384孔、或更多孔的盘的孔中或在个别乳液微滴(ddPCR)中,例如使用微流体装置分割及分布样品,使得一些孔包括一个或多个模板复本且其他孔不包括模板复本。因此,在扩增之前每孔模板分子的平均数目小于一。进行模板扩增的孔的数目提供模板浓度的量度。若样品已与MSRE接触,则进行模板扩增的孔的数目提供甲基化模板浓度的量度。
在各种实施方式中,基于荧光的实时PCR分析(诸如MethyLightTM)可用于测量甲基化状态(参见例如Campan 2018Methods Mol Biol.1708:497-513,其关于测定甲基化状态的方法以引用的方式并入本文中)。MethyLight为用于敏感地检测及定量基因组的候选区的DNA甲基化的定量、基于荧光的实时PCR方法。MethyLight独特地适合于相对于未甲基化DNA的高背景检测低频甲基化DNA区,因为其组合甲基化特异性引发(priming)与甲基化特异性荧光探测(probing)。另外,MethyLight可与数字PCR组合以用于个别甲基化分子的高度敏感检测,用于疾病检测及筛检。
用于测定甲基化状态的基于实时PCR的方法典型地包括基于对外部标准物的分析产生未甲基化DNA的标准曲线的步骤。标准曲线可由至少两个点构建且可允许将经消化DNA的实时Ct值及/或未消化DNA的实时Ct值与已知定量标准物进行比较。在特定情况下,可测定经MSRE消化的样品及/或未消化的样品或样品等分试样的样品Ct值,且可由标准曲线计算DNA的基因组当量。可评估经MSRE消化的DNA及未消化DNA的Ct值以识别所消化的扩增子(例如经有效消化;例如产生45的Ct值)。亦可识别在经消化或未消化的条件下未扩增的扩增子。所关注扩增子的经校正Ct值可接着在各条件下直接比较,以确定各条件之间的甲基化状态的相对差异。或者或另外,经消化DNA与未消化DNA的Ct值之间的δ差异可用于确定各条件之间的甲基化状态的相对差异。
在某些特定具体实例中,靶向亚硫酸氢盐测序(例如使用杂交捕获)以及其他技术可用于测定疾病及/或病状的甲基化生物标记的甲基化状态。举例而言,结直肠赘瘤(例如晚期腺瘤及/或结直肠癌)甲基化生物标记作为或包括单个甲基化基因座。在某些特定具体实例中,靶向亚硫酸氢盐测序以及其他技术可用于测定作为或包括两个或更多个甲基化基因座的甲基化生物标记的甲基化状态。
所属技术领域中具有通常知识者应了解,在其中在本文所提供的结直肠癌筛检方法中分析多个甲基化基因座(例如多个DMR)的甲基化状态的具体实例中,可以多种形式中的任一者测量或表示各甲基化基因座的甲基化状态,且多个甲基化基因座的甲基化状态(较佳各自以相同、类似或相当方式测量及/或表示)可以多种形式中的任一者共同或累积地分析或表示。在各种实施方式中,各甲基化基因座的甲基化状态可作为甲基化部分测量。在各种实施方式中,各甲基化基因座的甲基化状态可表示为来自总测序读段的甲基化读段与参考样品相比较的百分比值。在各种实施方式中,各甲基化基因座的甲基化状态可表示为与参考的定性比较,例如藉由将各甲基化基因座识别为高甲基化或低甲基化。
在分析单个甲基化基因座的一些具体实例中,单个甲基化基因座的高甲基化构成受试者罹患或可能罹患病状(例如癌症)(例如晚期腺瘤、结直肠癌)的诊断,而单个甲基化基因座不存在高甲基化构成受试者可能未罹患病状的诊断。在一些具体实例中,多个经分析的甲基化基因座中的单个甲基化基因座(例如单个DMR)的高甲基化构成受试者罹患或可能罹患病状的诊断,而多个经分析的甲基化基因座中的任何甲基化基因座处不存在高甲基化构成受试者可能未罹患病状的诊断。在一些具体实例中,多个经分析的甲基化基因座中的经测定百分比(例如预定百分比)(例如至少10%(例如至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或100%))的甲基化基因座的高甲基化构成受试者罹患或可能罹患病状的诊断,而多个经分析的甲基化基因座中的经测定百分比(例如预定百分比)(例如至少10%(例如至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或100%))的甲基化基因座不存在高甲基化构成受试者可能未罹患病状的诊断。在一些具体实例中,多个经分析的甲基化基因座(例如2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、50、100、150或更多个DMR)中的经测定数目(例如预定数目)(例如至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、50、100、150或更多个DMR)的甲基化基因座的高甲基化构成受试者罹患或可能罹患病状的诊断,而多个经分析的甲基化基因座(例如2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、50、100、150或更多个DMR)中的经测定数目(例如预定数目)(例如至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、50、100、150或更多个DMR)的甲基化基因座不存在高甲基化构成受试者可能未罹患病状的诊断。
在一些具体实例中,定性或定量地测量多个甲基化基因座(例如多个DMR)的甲基化状态且组合测量多个甲基化基因座中的每一个以提供诊断。在一些具体实例中,多个甲基化基因座中的每一个的所定量测量甲基化状态个别地经加权,且加权值经合并以提供可与参考比较的单一值以便提供诊断。
在一些具体实例中,甲基化状态可包括测定映射至基因组区(例如DMR)的甲基化读段及/或未甲基化读段。举例而言,当使用如本文所揭示的特定测序技术(例如NGS、全基因组亚硫酸氢盐测序等)时,产生序列读段。序列读段为所推断的对应于经测序的寡核苷酸(例如DNA)片段(例如cfDNA片段、gDNA片段)的全部或一部分的碱基对序列(例如机率性序列)。在某些实施方式中,可使用参考序列(例如经亚硫酸氢盐转化的参考序列)将序列读段映射(例如比对)至特定所关注区,以便判定读段是否存在任何改变或变化。改变可包括甲基化及/或突变。所关注区可包括一种或多种基因组标记,包括甲基化标记(例如DMR)、突变标记或如本文所揭示的其他标记。
举例而言,在经亚硫酸氢盐或酶处理的DNA片段的情况下,处理将未甲基化胞嘧啶转化成尿嘧啶,而甲基化胞嘧啶未转化成尿嘧啶。因此,针对具有甲基化胞嘧啶的DNA片段产生的序列读段将与针对不具有甲基化胞嘧啶的同一DNA片段产生的序列读段不同。胞嘧啶核苷酸后接鸟嘌呤核苷酸的位点(例如CpG位点)处的甲基化可备受关注。
质量控制方案
在某些实施方式中,可实施质量控制步骤。质量控制步骤用于确定特定步骤或制程是否在特定参数内进行。在某些实施方式中,质量控制步骤可用于确定给定分析的结果的有效性。另外或替代地,质量控制步骤可用于确定测序数据质量。举例而言,质量控制步骤可用于确定一个或多个DNA区的读段覆盖度。用于质量控制的定量度量值包括(但不限于)AT丢弃率、GC丢弃率、亚硫酸氢盐转化率(例如亚硫酸氢盐转化效率)及其类似物。未能满足临限质量控制条件(例如,最小转化率、最大CG丢弃率等)可指示例如转化步骤中的一个或多个不在适当参数内执行。
举例而言,在本文所描述的方法中,可使转化方案的各种步骤优化以降低AT及/或GC丢弃率。如由所属技术领域中具有通常知识者应理解,AT及GC丢弃度量值基于特定目标区的AT或GC含量而指示其的不充分覆盖度。在某些实施方式中,具有低GC丢弃率的样品适用于识别哪些样品经适当处理。举例而言,发现小于10%、小于9%、小于8%、小于7%、小于6%、小于5%、小于4%或更小的GC丢弃率可适用于识别经适当处理的样品。
在某些实施方式中,质量控制步骤可涉及测定中靶比率及/或脱靶比率。与所关注区(例如DMR)对准的序列读段被视为中靶,而未与所关注区(例如DMR)对准的序列读段被视为脱靶。在某些实施方式中,中靶比率表示为中靶碱基相对于所比对碱基的总数的百分比。在某些实施方式中,中靶比率表示为中靶及近靶碱基相对于所比对碱基的总数的百分比。近靶碱基可为目标区的某一数目个碱基内(例如在500bp内、在200bp内、在100bp内)的碱基。在某些实施方式中,对于通过质量控制的测序实验,中靶比率为至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少99%或更多。在某些实施方式中,脱靶比率表示为脱靶碱基相对于所比对碱基的总数的百分比。在某些实施方式中,对于通过质量控制的测序实验,脱靶比率小于95%、小于90%、小于85%、小于80%、小于70%、小于60%、小于50%、小于40%、小于30%、小于20%、小于10%、小于1%。
在某些实施方式中,质量控制步骤可包括测定映射的序列读段的质量评分。质量评分为定量序列读段经不正确地映射的机率的值。举例而言,当映射短序列或重复序列时,序列有可能将映射至参考基因组中的多个位置。相比于序列读段与参考基因组的其他可能比对,质量评分考虑序列读段与参考基因组的最佳比对。在某些实施方式中,质量评分为映射质量(Mapping Quality;MAPQ)评分。MAPQ为读段未对准的负的、按对数比例调整的机率。高得分指示读段正确对准的高可信度,而低得分指示读段正确对准的低可信度。在某些实施方式中,可使用以下等式计算MAPQ得分:
MAPQ得分=-10log10 Pr{映射位置为错误的}。
在某些实施方式中,MAPQ得分舍入至最接近的整数。在某些实施方式中,Pr为如自比对(例如,映射)工具获得的序列读段不正确地映射的机率。在某些实施方式中,比例因子为1(而非10)或另一数目。
人工掺入对照
可使用对照核酸(例如DNA)分子(例如“掺入对照(spike-in control)”)评估或估计未甲基化胞嘧啶及甲基化胞嘧啶转化成尿嘧啶的转化效率。对照核酸分子可用于涉及DNA样品的转化(例如亚硫酸氢盐或酶转化)的测序方法中。
当DNA如本文所述经历转化(例如亚硫酸氢盐或酶转化)时,转化可能不完全。亦即,一些数目的未甲基化胞嘧啶可能未转化成尿嘧啶。若转化不完全使得未甲基化胞嘧啶大部分未转化,则未转化的未甲基化胞嘧啶可识别为在测序DNA时发生甲基化。因此,为了测定亚硫酸氢盐转化是否完全,对照DNA分子可与来自样品的DNA片段一起经历转化。在某些实施方式中,对经转化的对照DNA分子进行测序(例如使用如本文所述的NGS技术)产生多个对照序列读段。对照序列读段可用于测定未甲基化胞嘧啶及/或甲基化胞嘧啶转化成尿嘧啶的转化率。
先前技术并未认识到,对照(例如对照DNA分子)适用于包括于各样品中。相反,其假定对于给定运行,转化效率在样品之间保持相对恒定。然而,本发明人已识别出DNA片段中未甲基化胞嘧啶转化成尿嘧啶的转化率可能因样品而显著不同。举例而言,在单一批次的经处理样品内,转化效率可在10%至110%范围内。应注意,可能存在过度转化以使得转化效率可能大于100%,例如当甲基化胞嘧啶的10%得到转化时,转化效率为110%。在某些实施方式中,转化效率在30%至110%范围内。在其他具体实例中,转化效率在50%至100%范围内。
在某些实施方式中,对照DNA分子可在片段化之后及使用例如亚硫酸氢盐或酶试剂转化之前添加至样品中。在某些实施方式中,多个(例如两个、三个、四个或更多个)对照DNA序列可添加至样品的DNA片段。对照DNA分子可为已知序列。举例而言,对照序列中的序列、甲基化碱基的数目及未甲基化碱基的数目在将对照DNA分子添加至样品中之前已测定。在某些实施方式中,对照序列可为体外产生以含有人工甲基化或未甲基化核苷酸(例如甲基化胞嘧啶)的DNA序列。在某些实施方式中,对照序列可为经产生以含有完全未甲基化DNA核苷酸的DNA序列。
掺入对照序列的高转化效率可用于推断经历与掺入对照相同的转化制程的DNA片段的转化效率。举例而言,未甲基化掺入对照DNA序列中的至少98%未甲基化胞嘧啶的脱氨指示转化效率较高且样品可通过质量控制评定。在某些实施方式中,对照DNA序列的多个DNA片段中至少90%、至少95%、至少96%、至少97%、至少98%、至少99%的未甲基化胞嘧啶转化成尿嘧啶。高转化效率是重要的,因为当DNA经受亚硫酸氢盐或酶处理时,所有(或几乎所有)未甲基化胞嘧啶转化为尿嘧啶为理想的。如上文所描述,未转化、未甲基化胞嘧啶可充当数据中的噪声源。
另外,当使用转化制程处理DNA时,甲基化胞嘧啶转化成尿嘧啶为不合需要的。掺入对照的甲基化胞嘧啶的转化指示,在经历与甲基化掺入对照相同的处理的DNA样品中甲基化胞嘧啶已转化成尿嘧啶。甲基化掺入对照中的甲基化胞嘧啶不应转化成尿嘧啶。出于与上文所描述相同的原因,甲基化胞嘧啶转化成尿嘧啶可能在甲基化分析期间引起据称未甲基化胞嘧啶的错误识别。在某些实施方式中,对照DNA序列的多个DNA片段中至多5%、至多4%、至多3%、至多2%或至多1%的甲基化胞嘧啶转化成尿嘧啶。举例而言,甲基化掺入对照DNA序列中的至多2%甲基化胞嘧啶的脱氨指示转化效率较高且样品可通过质量控制评定。
识别突变
在如本文所揭示的某些具体实例中,可以一种或多种预定突变生物标记形式识别基因组突变。在各种实施方式中,本发明的突变生物标记除甲基化生物标记以外亦用于病状的进一步检测(例如筛检)及/或分类。在某些实施方式中,关于一种或多种结直肠癌生物标记的甲基化状态的信息可与突变生物标记组合以便进一步分类所识别的结直肠癌。另外或替代地,突变生物标记可用于确定或建议(例如,支持或反对)所识别的疾病及/或病状的特定治疗过程。
在某些实施方式中,识别基因组突变可使用如本文所论述的测序技术(例如NGS测序技术)进行。在某些实施方式中,寡核苷酸(例如cfDNA片段、gDNA片段)经测序至足以在样品中以低至1.0%、0.75%、0.5%、0.25%、0.1%、0.075%、0.05%、0.025%、0.01%或0.005%的频率检测到基因组突变(例如以突变生物标记形式,以肿瘤标记形式)的读段深度。
基因组突变一般包括如所属技术领域中所理解的DNA的核苷酸碱基对序列的任何变异。在一些具体实例中,核酸中的突变可包括相比于参考DNA序列的单核苷酸变异体、倒置、缺失、插入、颠换、易位、融合、截短、扩增或其组合。
图4列出其中发现适用基因组突变的DNA区。DNA区包括在染色体上含有突变标记的目标区的染色体编号(chr)、起始(“起始”)及结束(“结束”)位置,及基因名称(例如NRAS、PTEN、KRAS、PIK3CA、EGFR、BRAF、STK22、TP53、KIT及MET),在所述基因中发现突变标记以及已识别出具有突变的密码子的识别符。为避免疑义,图4中所列的基因中的每一个亦可包括未列出于图4中的其他突变。
藉助于实例,图4的第一列中所列的NRAS_p.A146识别基因NRAS在密码子146处具有突变。藉由一个或多个探针靶向的DNA区由染色体编号1及分别为114709462及114709702的起始位置及结束位置识别。在同一染色体上,起始位置114709581(“i.起始”)及结束位置114709583(“i.结束”)对应于编码突变密码子的DNA序列。在所识别的突变中,氨基酸丙氨酸(“A”)改变为脯氨酸(“P”),如图4中所示。在特定分析中,在DNA片段的非编码(“-1”)链中识别出突变。所提供的序列对应于突变密码子的碱基对,其使用大写字母识别。在密码子的任一侧上提供30bp缓冲物用于进一步识别该区。
可使用NGS测序技术(例如靶向NGS测序技术、杂交NGS测序技术等)或本文揭示的其他测序技术识别突变。在如本文所揭示的某些具体实例中,可在经转化(例如经亚硫酸氢盐或酶转化)DNA片段中识别突变。在某些实施方式中,可使用单一测序分析(例如NGS分析)平行(例如同时)识别突变及甲基化基因座。在某些实施方式中,一个或多个捕获探针经靶向以捕获及/或富集对应于一种或多种突变标记(例如如图4中发现的突变区及位点)的寡核苷酸(例如DNA)序列的所关注区。
在某些实施方式中,突变标记含有低GC含量区。归因于低GC含量,当使用经调适用于高GC含量区的方案对低GC含量区进行测序时,可能无法获得区的足够覆盖。举例而言,使用仅目标区的1×平铺密度对低GC含量区进行靶向NGS测序(例如靶向亚硫酸氢盐测序)可能无法提供对突变区的足够覆盖。平铺(例如,平铺密度、平铺频率)是指靶向至区的多个探针。可使用增加的探针平铺密度(例如经由增加靶向区的探针的数目)以便为区提供额外覆盖。举例而言,可经由增加的平铺来改善低GC含量区的覆盖。因此,将区的平铺密度增加为至少2×平铺(例如,3×、4×或更多)可有益于增强靶向区的富集。举例而言,在2×平铺的情况下,由一探针覆盖的区可经两个彼此重叠的探针覆盖。另外或替代地,探针可重叠以允许增强区的覆盖度。举例而言,探针可重叠至少10%、20%、30%、40%、50%或更多。两个探针彼此重叠的量可取决于所需平铺密度、靶向区的序列或其他因素。为避免疑义,亦可相对于高GC含量区(例如甲基化基因座)改变探针的平铺及/或重叠。
例示性去重步骤
在如本文所论述的某些具体实例中,在测序资料中发现重复序列。重复序列由如本文所论述的许多潜在来源产生,且因此可需要自测序数据移除。由于来自癌症的信号较低,因此在分析中移除重复序列尤其重要。若不移除重复序列,则癌症信号会在噪声中丢失。
举例而言,在某些实施方式中,测序数据可包括自样品的测序寡核苷酸片段(例如DNA片段,例如cfDNA、gDNA片段)获得的大量读段。对应于特定DNA片段的多个读段可引起假变异体调用(call)(例如识别(identification)同一DNA片段的多个变异体),其将干扰甲基化CpG位点及/或突变的识别。在某些实施方式中,移除重复序列,随后测定依读段甲基化值。在某些实施方式中,生物信息包(例如Picard、SAMTools)可用于标记重复序列及自测序数据移除。
图13示出根据说明性具体实例的对测序数据进行以移除重复序列的一系列生物信息步骤(1300)。提供及/或获取(例如如本文所描述)自例如NGS测序技术获取的读段数据(1310)。在某些实施方式中,测序数据系获自如本文所描述的经亚硫酸氢盐或酶转化的DNA片段。获自测序数据的读段接着可与参考序列比对(1320)。在某些实施方式中,参考序列为经亚硫酸氢盐转化的基因组(例如经亚硫酸氢盐转化的人类基因组)。可接着移除对应于光学重复序列的读段(1330)。光学重复序列可在制备用于测序的样品期间产生。光学重复序列可能与流动池类型相关联。举例而言,具有图案化流动池的NGS序列发生器具有模板跳跃及因此引起簇重复的问题。模板跳跃在序列自流动池上的一个光点至流动池上的另一光点“跳跃”时发生。重复簇可导致数据集中的特定读段的过度表示。重复簇亦可由NGS序列发生器的传感器产生,该传感器将基板(例如,流动池)上的单一扩增簇不正确地识别为多个簇。在某些实施方式中,当两个读段共享一致碱基序列时识别出光学重复序列。在某些实施方式中,若一对读段均在同一影像块(例如用于NGS的流动池上的光点上),且读段之间的距离小于100bp(例如当使用NExtSeq设备时)及2500bp(例如当使用NovaSeq设备时),则读段称为光学重复序列。
在某些实施方式中,亦可移除PCR重复序列(亦称为库重复序列)及/或过度测序重复序列(1340)。PCR重复序列及过度测序重复序列为对确切相同DNA片段的两个或更多个复本进行测序而产生的序列读段。PCR重复序列及过度测序重复序列可在库制备期间产生。在某些实施方式中,若序列读段具有相同的(1)5'端坐标、(2)3'端坐标及(3)甲基化水平,则所述序列读段视为PCR重复序列或过度测序重复序列,其中序列读段的5'端坐标及3'端坐标对应于序列读段的分别映射至参考序列的最5'核苷酸及最3'核苷酸所处的位置。最后,对经去重读段进行质量过滤(1350),此使得移除额外读段。
在某些实施方式中,去重序列读段不包含移除具有不同甲基化水平的重复序列读段。举例而言,样品可具有两个相同序列读段。然而,一个序列读段可具有经甲基化的CpG位点,而另一链中的相同CpG位点未经甲基化。在某些实施方式中,可保持两链用于其他生物信息分析。不希望受任何特定理论束缚,重复片段内存在不同甲基化水平可归因于测序误差或一个片段的不同来源。
应用
本发明的方法及组合物可用于多种应用中的任一者中。举例而言,本发明的方法及组合物可用于筛检或帮助筛检病状(例如癌症)。具体而言,所述方法及组合物可用于筛检或帮助筛检结直肠赘瘤,例如晚期腺瘤及/或结直肠癌。在各种情况下,使用本发明的方法及组合物进行筛检可检测到任何分期的结直肠癌,包括(但不限于)早期结直肠癌。在一些具体实例中,使用本发明的方法及组合物进行筛检应用于40岁或更大,例如40、45、50、55、60、65、70、75、80、85或90岁或更大的受试者。具体而言,40岁或更大的受试者关注结直肠癌及/或晚期腺瘤筛检。在一些具体实例中,使用本发明的方法及组合物进行筛检应用于18岁或更大,例如18、20、25、30、35、40、45、50、55、60、65、70、75、80、85或90岁或更大的受试者。在一些具体实例中,使用本发明的方法及组合物进行筛检应用于18至40岁的受试者。在各种实施方式中,使用本发明的方法及组合物进行筛检应用于经历腹痛或不适(例如经历未诊断或不完全诊断的腹痛或不适)的受试者。在各种实施方式中,使用本发明的方法及组合物进行筛检应用于不经历可能与癌症或结直肠赘瘤(诸如晚期腺瘤、息肉病及/或结直肠癌)相关的症状的个体。因此,在某些实施方式中,使用本发明的方法及组合物进行筛检至少相对于晚期或非早期癌症而言为完全或部分预防性或防治性的。
在各种实施方式中,使用本发明的方法及组合物进行癌症筛检可应用于无症状人类受试者。具体而言,若受试者未通过非侵入性可观测标志(例如无基于装置的探测、组织样品分析、体液分析、手术或癌症筛检中的一个、若干个或全部)报告及/或展现足够支持受试者可能罹患病状的医疗合理怀疑的病状特征,则该受试者可称作“无症状”。在根据本发明的方法及组合物筛检的无症状个体中检测诸如晚期腺瘤及/或早期结直肠癌的结直肠赘瘤尤其为可能的。
所属技术领域中具有通常知识者应了解,针对诸如晚期腺瘤及/或结直肠癌的结直肠赘瘤的常规预防性及/或防治性筛检改良诊断。如上所指出,根据至少一个癌症分期系统,早期癌症包括0期至IIC期的结直肠癌。因此,本发明尤其提供特别适用于诊断及治疗结直肠赘瘤的方法及组合物,所述结直肠赘瘤包括晚期腺瘤、息肉病及/或早期结直肠癌。一般而言,且具体而言,在其中每年实施根据本发明的筛检的具体实例中,及/或其中受试者在筛检时无症状的具体实例中,本发明的方法及组合物尤其可能检测到早期结直肠癌。
在各种实施方式中,根据本发明的结直肠癌筛检针对给定受试者执行一次或针对给定受试者执行多次。在各种实施方式中,根据本发明的结直肠癌筛检定期进行,例如每六个月、每年、每两年、每三年、每四年、每五年或每十年进行。
在各种实施方式中,使用本文所揭示的方法及组合物进行筛检将提供对病状的诊断(例如结直肠赘瘤的类型或类别)。在其他情况下,使用本文所揭示的方法及组合物筛检结直肠赘瘤将指示患有一种或多种病状,但对于对特定病状的诊断并非决定性的。举例而言,筛检可用于将受试者分类为患有一种或多种病状或病状组合,包括(但不限于)晚期腺瘤及/或结直肠癌。在各种情况下,使用本发明的方法及组合物进行筛检之后可为另一诊断确认分析,该另一分析可确认、支持、削弱或否决由先前筛检(例如根据本发明的筛检)产生的诊断。
在各种实施方式中,根据本发明的方法及组合物进行筛检例如藉由早期结直肠癌诊断降低结直肠癌死亡率。数据支持,结直肠癌筛检降低结直肠癌死亡率,其效应持续超过30年(参见例如Shaukat 2013N Engl J Med.369(12):1106-14)。此外,结直肠癌尤其难以治疗,至少部分因为结直肠癌在不存在及时筛检的情况下,直至癌症经过早期才可能检测到。至少出于此原因,结直肠癌的治疗通常不成功。为了使群体范围的结直肠癌结果的改善最大化,利用根据本发明的筛检可与例如募集符合条件的受试者结合以确保广泛筛检。
在各种实施方式中,包括一种或多种本文所揭示的方法及/或组合物的结直肠赘瘤筛检之后为治疗结直肠癌,例如治疗早期结直肠癌。在各种实施方式中,结直肠癌(例如早期结直肠癌)的治疗包括施用包括手术、放射疗法及化学疗法中的一个或多个的治疗方案。在各种实施方式中,结直肠癌(例如早期结直肠癌)的治疗包括施用包括本文所提供的治疗中的一个或多个的治疗方案以用于治疗0期结直肠癌、I期结直肠癌及/或II期结直肠癌。
在各种实施方式中,结直肠癌的治疗包括藉由移除癌组织的手术(例如藉由局部切除(例如藉由结肠镜)、部分结肠切除术或完全结肠切除术)中的一个或多个,来治疗早期结直肠癌,例如0期结直肠癌或I期结直肠癌。
在各种实施方式中,结直肠癌的治疗包括藉由移除癌组织的手术(例如藉由局部切除(例如藉由结肠镜)、部分结肠切除术或完全结肠切除术)、移除接近所识别的结直肠癌组织的淋巴结的手术及化学疗法(例如施用5-FU及甲酰四氢叶酸、奥沙利铂(oxaliplatin)或卡培他滨(capecitabine)中的一个或多个)中的一个或多个,来治疗早期结直肠癌,例如II期结直肠癌。
在各种实施方式中,结直肠癌的治疗包括藉由移除癌组织的手术(例如藉由局部切除(例如藉由基于结肠镜的切除)、部分结肠切除术或完全结肠切除术)、移除接近所识别的结直肠癌组织的淋巴结的手术、化学疗法(例如施用5-FU、甲酰四氢叶酸、奥沙利铂、卡培他滨中的一个或多个,例如以以下的组合形式:(i)5-FU与甲酰四氢叶酸,(ii)5-FU、甲酰四氢叶酸与奥沙利铂(例如FOLFOX)或(iii)卡培他滨与奥沙利铂(例如CAPEOX))及放射疗法中的一个或多个,来治疗III期结直肠癌。
在各种实施方式中,结直肠癌的治疗包括藉由移除癌组织的手术(例如藉由局部切除(例如藉由结肠镜)、部分结肠切除术或完全结肠切除术)、移除接近所识别的结直肠癌组织的淋巴结的手术、移除转移瘤的手术、化学疗法(例如施用5-FU、甲酰四氢叶酸、奥沙利铂、卡培他滨、伊立替康(irinotecan)、靶向VEGF之治疗剂(例如贝伐单抗(bevacizumab)、塞维-阿柏西普(ziv-aflibercept)或雷莫芦单抗(ramucirumab)、靶向EGFR之治疗剂(例如西妥昔单抗(cetuximab)或帕尼单抗(panitumumab))、瑞戈非尼(Regorafenib)、曲氟尿苷及替吡嘧啶(tipiracil)中的一个或多个,例如以以下的组合形式或包括以下:(i)5-FU与甲酰四氢叶酸,(ii)5-FU、甲酰四氢叶酸与奥沙利铂(例如FOLFOX),(iii)卡培他滨与奥沙利铂(例如CAPEOX),(iv)甲酰四氢叶酸、5-FU、奥沙利铂与伊立替康(FOLFOXIRI)及(v)曲氟尿苷与替吡嘧啶(Lonsurf))、放射疗法、肝动脉输注(例如若癌症已转移至肝脏)、肿瘤消融、肿瘤栓塞术、结肠支架、结直肠切除术(colorectomy)、结肠造口术(例如转流(diverting)结肠造口术)及免疫疗法(例如帕博利珠单抗(pembrolizumab))中的一个或多个,来治疗IV期结直肠癌。
所属技术领域中具有通常知识者可例如如藉由开业医师所判定,单独或以任何组合、以任何顺序、方案及/或治疗程序利用本文所提供的结直肠癌治疗。所属技术领域中具有通常知识者将进一步了解,晚期治疗选项可适合于先前已罹患癌症或结直肠癌的受试者,例如诊断为患有复发性结直肠癌的受试者中的早期癌症。
在一些具体实例中,本文提供的用于结直肠赘瘤筛检的方法及组合物可告知例如由个体、保健机构、保健从业者、健康保险供货商、政府机构或保健费用相关的其他各方所承担的治疗及/或付款(例如,报销或减少医疗护理(诸如筛检或治疗)费用)决定及/或行为。
在一些具体实例中,本文所提供的用于结直肠赘瘤筛检的方法及组合物可告知作出关于健康保险供货商是否报销支付者或接受者例如用于以下的保健费用的决定:用于(1)自身筛检(例如,报销用于以其他方式不可用的筛检、仅可用于周期性/常规筛检或仅可用于临时及/或偶然动机的筛检);及/或用于(2)治疗,包括例如基于筛检结果而起始、维持及/或改变疗法。举例而言,在一些具体实例中,本文所提供的用于结直肠赘瘤筛检的方法及组合物用作关于是否向保健费用支付者或接受者提供报销或减少费用的判定的依据、促成因素或支持。在一些情况下,寻求报销或费用减少的一方可提供根据本说明书进行的筛检的结果以及对此类保健费用报销或费用减少的要求。在一些情况下,关于作出是否提供保健费用报销或费用减少的判定的一方将在接收及/或审阅根据本说明书进行的筛检的结果后,全部或部分地达成判定。
为避免任何疑义,所属技术领域中具有通常知识者将自本发明了解,本说明书的用于结直肠癌诊断的方法及组合物至少用于体外用途。因此,本发明的所有方面及具体实例可至少体外进行及/或使用。
试剂盒
本发明尤其包括试剂盒,其包括一种或多种如本文所提供用于筛检的组合物,视情况与其使用说明书组合用于筛检(例如筛检晚期腺瘤、结直肠癌、其他癌症或与异常甲基化状态相关的其他疾病或病状,例如神经退化性疾病、肠胃道病症及其类似者)。在各种实施方式中,用于筛检与异常甲基化状态相关的疾病或病状的试剂盒可包括一个或多个寡核苷酸探针(例如一个或多个经生物素标记的寡核苷酸探针)。在某些实施方式中,用于筛检的试剂盒视情况包括一种或多种如本文所揭示的亚硫酸氢盐转化试剂。在某些实施方式中,用于筛检的试剂盒视情况包括一种或多种如本文所揭示的酶转化试剂。在某些实施方式中,用于筛检的试剂盒可包括如本文所描述的一个或多个转接子。在某些实施方式中,试剂盒可包括一种或多种用于库制备的试剂。在某些实施方式中,试剂盒可包括软件(例如用于分析DMR的甲基化状态)。
实施例
实施例1:识别与结直肠癌及晚期腺瘤有关的标记
此实施例的目的是识别结直肠癌及结肠腺瘤样品(例如来自患有晚期腺瘤的受试者的样品)的DNA中的差异甲基化区(DMR)。DMR的识别藉由比较患有结直肠癌及/或结肠腺瘤的受试者的DNA与匹配对照样品来进行。此比较允许开发将阐明来自无细胞(cfDNA)的结直肠癌及晚期腺瘤相关甲基化模式的方法。
使用全基因组亚硫酸氢盐测序(WGBS)识别自多种来源获得的基因组DNA(gDNA)及cfDNA的样品中甲基化状态的差异。gDNA系获自具有不同组织背景(例如结直肠癌、结肠腺瘤、肺癌、乳癌、胰脏癌、胃癌及匹配对照)的组织样品及血沉棕黄层样品。
使用DNeasy Blood&Tissue试剂盒(Qiagen)根据制造商的方案,萃取来自组织及血沉棕黄层样品的基因组DNA(gDNA)。接着进一步处理所萃取的gDNA以将其片段化。举例而言,用Covaris S220超音波处理器将gDNA片段化为具有约400bp长度的区段。
使用QIAamp Circulating Nucleic Acid试剂盒(Qiagen)根据制造商的方案,萃取来自血浆样品的cfDNA。
所萃取及片段化的gDNA(基因组DNA)及cfDNA经EZ DNA Methylation-Lightning试剂盒(ZymoResearch)亚硫酸氢盐转化。藉由使用Accel-NGS Methyl-seq DNA库试剂盒(Swift Biosciences)由经亚硫酸氢盐转化的DNA片段制备测序库。使用成对末端测序,用NovaSeq6000(Illumina)设备以37.5x的平均深度对经转化DNA片段进行测序。对于此实验,进行成对末端测序以使得覆盖经转化DNA片段的各末端的150bp(例如2×150)。使用Bisulfite Read Mapper与Bowtie 2比对经测序的读段与经亚硫酸氢盐转化的人类基因组(Ensembl 91组装体)。以下步骤用于比对经测序的读段与经亚硫酸氢盐转化的人类基因组:
1.测序质量的评估
2.与参考基因组(hG38)比对
3.自转接子二聚体去重及清除
4.甲基化识别(例如甲基化核酸的识别)
藉由比较结肠癌及/或结肠腺瘤组织样品的个别CpG的beta(β)值与匹配对照组织来进行差异甲基化区分析。β值反映样品中的CpG读段的甲基化水平。β值为0指示在特定CpG位置处未发现甲基化读段,而β值为1指示所有读段均完全甲基化。将个别CpG甲基化值分数合并成在彼此50bp距离内具有最少3个CpG的区。评估该区的q值(其为藉由组间标签置换测试校正的p值)以便选择来自患有结直肠癌及/或结肠腺瘤的受试者的DNA区,所述区与获自对照受试者的DNA中的相同区的甲基化具有显著差异。q值<0.05视为显示出差异甲基化区(DMR)的高统计显著性。进一步评估大量区以确定与具有非结直肠癌来源的组织样品、非结直肠来源的对照组织样品、血沉棕黄层样品及来自健康受试者的cfDNA相比,是否存在显著甲基化信号。
总计,6061个DMR最初被识别为对于结直肠癌及/或晚期腺瘤有意义。此等DMR包括更倾向指示结直肠癌的区、更倾向指示不同组织学亚型的结肠腺瘤的DMR及指示结直肠癌及晚期腺瘤两者的区。
使用依读段信号计分法,根据全基因组测序数据对选定目标区进行进一步癌症信号分析。在组织-对照成对样品中计算允许最大限度地分离癌症读段与对照读段的临限值。将所计算的分数应用于从受试者的血浆cfDNA获得的各读段。
实施例2:特征评估及算法开发
此实施例的目的是识别来自实施例1的哪些差异甲基化区(DMR)更倾向指示结直肠癌及/或晚期腺瘤且可用于后续组别研发。此实施例中所执行的工作评估了约2000个DMR,发现其更倾向指示结直肠癌。在训练-验证(train-verification)设定中对约2000个DMR的样品集采用初始目标区及预测模型。自较大样品集获得的结果充当进一步QC管线定义及优化本文所述的癌症信号检测方法的基础。
方法
图5为如本文中所执行的杂交捕获方法(500)的流程图。本文中进一步描述杂交捕获方法(500)的步骤。在步骤(505)中,自血浆萃取cfDNA。需要约10-约20ng的DNA以供处理。接着向cfDNA样品中添加人工掺入对照(510)。人工掺入对照用于在后续质量控制步骤中监测甲基化胞嘧啶及/或未甲基化胞嘧啶转化至尿嘧啶的转化率。接着对DNA样品进行转化(例如亚硫酸氢盐或酶转化)(515)。转接酶(adaptase)连接步骤(520)为同时进行末端修复加尾(tailing)及将第一转接子连接至DNA片段(例如cfDNA片段)的3'端的反应。延伸步骤(525)产生互补、无尿嘧啶的库分子。转接子连接步骤(530)向新产生的库分子添加第二转接子。接着使用qPCR评定库扩增的最佳循环数目(535)。接着进行PCR标引(indexing)(540)以增加产率且并入全长转接子用于库片段的单标引或双标引(545)。接着将甲基化及/或突变捕获探针与经标引库池(indexed library pools)杂交(550)。接着藉由结合经生物素标记、杂交的捕获探针使目标DNA片段富集,所述捕获探针与链霉抗生物素蛋白涂布的珠粒杂交。捕获之后,将所捕获的分子接着使用PCR扩增(555)。此捕获后的扩增步骤伴有纯化及质量控制步骤。最后,接着使用NGS技术测序所捕获及扩增的分子以获得对应于DNA片段的读段(560)。进行后续生物信息分析(565)以识别经甲基化及/或突变的经测序目标。
样品集
该研究系在西班牙塞维利亚(Sevilla,Spain)的维尔根德尔罗西奥医院研究伦理委员会(The Research Ethics Committee of the Virgen del Rocio Hospital)批准下进行(伦理委员会批准参考号:2014PI/155)。所有患者在取样之前提供书面知情同意书。
患者群组
在内视镜检科及门诊部中,自进行结肠镜检用于筛检之前或由于粪便隐血(结肠镜检前样品)的平均风险患者收集血液样品。经由在CRC治疗之前自肿瘤科预先招募CRC患者丰富结直肠癌(CRC)数目,且样品获自生物库(结肠镜检后样品)。结直肠癌患者的分期根据AJCC Cancer Staging Manual第8版界定,该文献以全文引用的方式并入本文中。
在结肠镜检之前最多60天直至结肠镜检当天(但在施用任何镇定剂用于该程序之前)收集结肠镜检前血液样品。为了纳入患者,结肠镜检必须到达盲肠且结直肠的各区段的可见度必须为“良好”或“极佳”的。基于结肠镜检及病理学结果将患者指配至病状组。结肠镜检及病理学结果包括以下结果:结直肠癌(CRC)、晚期腺瘤(AA)、非晚期腺瘤(non-advanced adenoma;NAA)、增生性息肉或健康(例如“正常”)结直肠。患有AA的受试者定义为具有以下的受试者:腺瘤等于或大于1cm、管绒毛状组织、高度发育不良及/或锯齿状腺瘤伴发育不良、原位癌。
在结肠镜检之后至少3天收集来自等待CRC治疗的结肠镜检后患者的血液样品。收集的平均时间为结肠镜检后15天。收集时间在3至75天范围内。
研究纳入标准
参与者可为女性或男性且要求为至少45岁。
研究排除标准
排除标准为:(1)先前诊断患有癌症,除了患有新诊断结直肠癌的患者,(2)CRC家族病史,(3)具有基因癌症倾向性的个人或家族病史,(4)先前诊断患有良性胃肠疾病,(5)怀孕及(6)对于患有结直肠癌的参与者,针对当前癌症有当前或先前疗法。当前或先前疗法包括:除确定诊断、化疗、免疫疗法、激素疗法及/或放射疗法所需的外科治疗以外的外科治疗。
血浆样品收集方案
使用以下两种方法中之一者收集血浆样品。在第一种方法中,使用K2 EDTA管收集血浆。用此等类型的管收集的血浆在收集2小时内藉由双旋离心萃取。在第二种方法中,用Cell-Free DNAStreck管收集血浆。接着在收集2天内用双旋离心萃取血浆。在两种方法中,血浆都储存于-80℃下直至对其进行分析。
自血浆萃取的cfDNA及质量对照样品
使用QIAamp MinElute ccfDNA Midi试剂盒(Qiagen)根据制造商的说明书,自4mL人类血浆萃取cfDNA。
使用dsDNA HS分析试剂盒(Thermo Fisher Scientific)测量cfDNA浓度。
在Fragment Analyzer(Agilent)上用DNF-474NGS片段试剂盒评估cfDNA质量。
至少需要10ng的经萃取cfDNA进入下一步骤。
DNA的亚硫酸氢盐及酶转化
使用优化的EZ DNA Methylation-Direct试剂盒(Zymo)对来自患者中的每一个的10ng与20ng之间的cfDNA进行亚硫酸氢盐处理。在16个复制样品上使用NEBNext EnzymaticMethyl-seq Conversion Module(NEB)试剂盒以及甲酰胺变性。将来自用酶方法制备的复制样品的结果与实施例3中的经亚硫酸氢盐转化的样品进行比较。cfDNA的脱氨有助于识别甲基化及未甲基化胞嘧啶残基,尤其在CpG位点处的所述残基。
NEB试剂盒为基于酶的亚硫酸氢盐转化的替代方法以用于使cfDNA脱氨。在酶方法中,TET2氧化甲基化胞嘧啶(5-甲基胞嘧啶(5-mC)及5-羟甲基胞嘧啶(5-hmC))。在氧化之后,使用APOBEC(载脂蛋白B mRNA编辑酶,催化聚肽样)处理DNA。使未经修饰的胞嘧啶(例如不受TET2氧化影响的未甲基化胞嘧啶)脱氨为尿嘧啶。
在酶方法中,将10μl TET2反应缓冲液、1μl DTT(二硫苏糖醇)、1μl氧化补充剂及1μl TET2添加至28μl DNA。添加5μl稀释Fe(II)溶液且在37℃下培育1小时。接着停止DNA氧化。接着清洁氧化DNA。将4μl甲酰胺添加至16μl的氧化DNA中用于变性。接着将以下添加至20μl变性DNA中:68μl水、10μl APOBEC反应缓冲液、1μl BSA及1μl APOBEC。接着在37℃下培育溶液3小时。
EZ DNA Methylation-Direct试剂盒(Zymo)方案的优化版本如下文所呈现地使用。该方案的优化版本含有各种质量控制及实验参数,其对于维持经测序的cfDNA的完整性及/或识别是否有任何错误存在于所述过程中而言为重要的。
在cfDNA转化之前,向所有cfDNA样品中添加人工甲基化及未甲基化掺入(PremiumRRBS试剂盒[Diagenode])对照序列。使用1:10000比率(按体积计)的掺入对照比cfDNA,添加掺入对照序列。
在下文呈现的方案的优化版本中,CT转化试剂与样品的比率低于标准比率。举例而言,在标准方案中,可使用20μl的样品及130μl的CT转化试剂。在下文呈现的方案中,117μl CT转化试剂用于33μl样品。增加的样品的量考虑到低量的起始物质。另外,可增加样品的量及/或减少亚硫酸氢盐试剂的量以补偿亚硫酸氢盐试剂的侵袭性性质,该亚硫酸氢盐试剂可能进一步使DNA片段化。
另外,改变变性及转化循环的温度及变性-转化循环的数目。在标准方案中,变性-转化循环运行单次。另外,在标准方案下,变性在98℃下进行8分钟,而转化在64℃下进行3.5小时。
CT转化试剂为含有焦亚硫酸钠的试剂。该试剂用于cfDNA的亚硫酸氢盐转化。如由制造商提供,各CT转化试剂管经设计用于10次各别DNA处理。如下制备CT转化试剂:
1.将790μl M-溶解缓冲液及300μl M-稀释缓冲液添加至CT转化试剂管中。
2.在室温下以频繁涡旋或震荡将溶液混合10分钟(在暗处保持)。
3.将160μl M-反应缓冲液添加至溶液中且再混合1分钟。
注意事项:在CT转化试剂中发现痕量的未溶解试剂为正常的。CT转化试剂为光敏感性的,使其曝露于光的情况减至最少。
-将117μl CT转化试剂添加至33μl样品中。将溶液用移液管向上及向下移取约5次。
-藉由翻转混合样品且接着短暂离心以确保无小液滴在管盖中或管面上。
-将样品置于热循环仪中且使用以下方案运行:
-若样品未准备好,则藉由添加24ml 100%乙醇至6ml M-洗涤缓冲液浓缩物(D5020)或添加96ml 100%乙醇至24ml M-洗涤缓冲液浓缩物(D5021)中来制备M-洗涤缓冲液。
-将600μl M-结合缓冲液添加至Zymo-SpinTMIC管柱中且将该管柱置于所提供的收集管中。
-将样品装载至含有M-结合缓冲液的Zymo-SpinTMIC管柱中。封闭盖且藉由翻转管柱若干次来混合样品。
-以全速(13000g)离心管柱1分钟。丢弃流过物。
-将100μl M-洗涤缓冲液添加至管柱中。以全速(13000g)离心管柱1分钟。
-将200μl M-脱磺化缓冲液添加至管柱中且在室温(20℃-30℃)下培育确切30分钟。在此培育期之后,以全速(13000g)离心管柱1分钟。
-将200μl M-洗涤缓冲液添加至管柱中。以全速(13000g)离心管柱1分钟。丢弃流过物。
-再将200μl M-洗涤缓冲液添加至管柱中且在较高速度(15000g)下离心管柱1.5分钟。
-将管柱置于1.5ml微量离心管中。将17μl M-洗脱缓冲液直接添加至管柱基质中且培育2分钟。以全速(20000g)离心管柱1.5分钟以洗脱DNA。
-藉由将洗脱液转移至管柱膜中且等待2分钟来进行第二洗脱。以全速(20000g)离心管柱1.5分钟以洗脱DNA。
-将15μl的各亚硫酸氢盐化cfDNA样品转移至具有不含RNA酶/DNA酶的盖的8条带管中,且在-20℃下冷冻以用于后续库制备。
在Fragment AnalyzerTM(Agilent)上使用RNA 6000Pico试剂盒(Agilent)评估经转化cfDNA质量。
库制备
经转化cfDNA用作NGS(下一代测序)库制备的输入。Methyl-Seq DNA库试剂盒(Swift Bioscience)用于使用经转化cfDNA制备库。图6展示涉及向DNA片段添加转接子序列的一系列步骤(600)。经亚硫酸氢盐转化的单链DNA片段首先经受转接酶连接步骤(610)。转接酶连接步骤为高效、独立于模板的反应,其同时进行末端修复加尾及将第一转接子(截短转接子1)连接至DNA片段的3'端。接下来,执行延伸步骤(620)以产生互补、无尿嘧啶的库分子。延伸后,连接(630)添加第二转接子(截短转接子2)至新产生的库分子。接着进行PCR标引(640)以增加产率且并入全长转接子用于库片段的单标引或双标引。基于珠粒的清除步骤用于移除寡核苷酸及小片段两者。
在96系统(Roche)上使用KAPAFAST(Sigma-Aldrich)藉由qPCR评估最佳库扩增。qPCR用于测量如本文所述的所制备库的总浓度。所需库材料的最少量为约200ng。qPCR确定可能需要进行以便获得最少量的库材料的最佳PCR循环数目。将所产生的DNA库首先在Compact自动化系统(Diagenode目录号B03000002)上使用 XP(Beckman Coulter)纯化,接着使用QubitTMdsDNA HS分析试剂盒(Thermo Fisher Scientific)定量,且最后在Fragment AnalyzerTM(Agilent)上用高灵敏度NGS片段分析试剂盒(DNF-474)评估其大小。
杂交捕获
120-bp生物素标记的DNA探针经设计用于靶向(例如选择性)富集经亚硫酸氢盐或酶转化的DNA。120-bp探针经设计以靶向预定区的高甲基化片段(100%甲基化CpG)或低甲基化片段(100%未甲基化CpG)(例如甲基化标记、突变标记)。探针经设计以使得每个链存在至少一个探针且每个甲基化状态存在一个探针。亦即,存在靶向编码链的两个探针及靶向非编码链的两个探针。各对的两个探针中的一个靶向甲基化片段,而另一个探针靶向未甲基化片段。对于捕获部分甲基化区,探针及目标区使用8的错配计数(例如在属于目标区的DNA片段与捕获探针之间,至多约8个碱基可错配(例如形成非沃森-克里克碱基配对))。
在此实验中,使用1×平铺密度设计用于甲基化目标的探针。使用3×平铺密度设计用于突变目标的探针,其中目标中的各碱基由至少3个不同探针覆盖(例如其中探针之间存在实质性重叠)。使用3×平铺设计突变探针以确保低CG含量区(例如具有约30%至约40% GC含量之区)的更高捕获效率,否则所述区会过低表示。平铺密度是指探针对目标区的覆盖度。举例而言,经设计具有1×平铺密度的探针将覆盖目标区的各碱基至少一次。具有3×平铺密度的探针将覆盖目标区至少3次。
定制算法将候选探针与基因组进行比对,且对中靶映射事件及脱靶映射事件的可能发生数目进行评分。自最终组别设计省略具有>250个全局映射至脱靶区的基因组区的探针。合成经生物素标记的探针且合并成最终靶向甲基化组别。在初始分析设计及测试之后亦进行脱靶映射。若目标在实际组别中引起超过1%的脱靶捕获,则省略目标。
将经纯化库(各为约187.5ng)一起汇集于8个丛中,使用concentrator plus(Eppendorf)干燥且使用的快速杂交目标富集(Fast Hybridization TargetEnrichment)方案及如本文所描述的定制面版探针捕获,该定制面版探针经设计以捕获所关注的甲基化及突变目标。与经生物素标记的探针结合的片段使用经链霉抗生物素蛋白涂布的珠粒捕获。
根据制造商的方案,使用PCR扩增将来自纯化库的所捕获片段再扩增11个循环。接着用Twist珠粒纯化所扩增库。
描述Twist快速杂交目标富集方案的例示性方法呈现如下。值得注意地,在步骤(例如步骤23-步骤28)期间维持快速洗涤缓冲液1的70℃温度对富含GC区至关重要。此等步骤的温度差异会导致高于预期GC丢弃率(例如,大于6%的GC丢弃率)。举例而言,当在65℃下使用快速洗涤缓冲液1时,GC丢弃率为约30%,此出人意料地高。因此,使移液时间减至最少且维持快速洗涤缓冲液1及样品-快速洗涤缓冲液1混合物的温度为重要的。
Twist快速杂交目标富集方案
在开始之前
将所有所需试剂在冰上解冻,接着脉冲涡旋2秒以混合及脉冲旋转。
在捕获探针与库池的杂交的准备中,亦将库池在冰上解冻:
来自Twist快速杂交试剂:
快速杂交混合物
杂交增强剂
1.使用各经扩增、经标引的库的浓度来计算杂交所需的各库的体积(以μl为单位)。将来自各经扩增、经标引的库的所计算体积转移至杂交反应管(例如0.2-ml薄壁PCR带管、96孔盘)中用于待进行的各杂交反应。
制备预杂交溶液
2.将以下体积的试剂添加至各扩增经标引的库中以产生如下表1中所示的预杂交溶液。藉由轻击管来混合溶液。
表1.用于预杂交溶液的试剂的体积
3.对管进行脉冲旋转,且确保溶液中存在的气泡数目最少。
4.使用SpeedVac系统(或类似蒸发器装置)在用于杂交反应的管中使用低热或不使用热干燥预杂交溶液(包括库、探针、阻断剂)。
重要事项:步骤12至18(下文)与预杂交溶液干燥并行地进行且在30分钟下进行杂交。
使用来自步骤1的等分库及杂交反应溶液,以及解冻的快速杂交混合物及杂交增强剂。
重要事项:在进行此步骤之前,热循环仪及PCR管或板的兼容性藉由在95℃下将其培育至多5分钟以确保其在热及压力下不破裂来测试。调节热循环仪封盖的紧密性及/或使用热循环仪模型专用的垫片。
所需试剂
·干燥的杂交反应物(来自步骤4)
·试剂解冻:
·快速杂交混合物
·杂交增强剂
在开始之前
在表2中使用以下条件程序化96孔热循环仪,且将经加热的封盖设定为85℃:
表2.热循环仪程序步骤。
步骤 | 温度 | 时间 |
1 | 95℃ | 保持 |
2 | 95℃ | 5min |
3 | 60℃ | 15min至4小时 |
再悬浮预杂交溶液
5.将快速杂交混合物加热至65℃持续10分钟,或直至所有沉淀物溶解。涡旋混合物且立即使用。不使快速杂交混合物冷却至室温。
6.使来自步骤4的干燥预杂交溶液再悬浮于20μl快速杂交混合物中。
遵循此过程时需要考虑的一些注意事项呈现如下。若此再悬浮的溶液需要转移至二级容器中进行杂交,则再悬浮的溶液藉由轻击混合且再培育5分钟用于再悬浮。快速杂交混合物为黏性的。用移液管缓慢移取混合物以确保准确度。存在于捕获探针中的小白色颗粒不影响最终捕获产物。
7.对管进行脉冲旋转,且确保不存在显现气泡。
8.将30μl杂交增强剂添加至预杂交溶液的顶部。
9.对管进行脉冲旋转以确保所有溶液均在管底部。
注意事项:杂交增强剂在脉冲旋转之后在杂交反应顶部沉降。此并不影响最终捕获产物。
将管转移至预加热热循环仪。接着将程序移动至热循环仪程序的步骤2及3。
重要事项:紧密密封管以防止在培育时段内蒸发。
所杂交目标与链霉抗生物素蛋白珠粒的结合
所需试剂
·如上文所制备的杂交反应物。
·来自Twist快速洗涤缓冲液:
快速结合缓冲液
快速洗涤缓冲液1
洗涤缓冲液2
·来自Twist结合及纯化珠粒(Binding and Purification Bead):
链霉抗生物素蛋白结合珠粒
在开始之前
检验以下试剂的沉淀物。若观测到沉淀物,则在48℃下加热试剂直至沉淀物溶解:
快速结合缓冲液
快速洗涤缓冲液1
洗涤缓冲液2
对于各杂交反应:
将450μl快速洗涤缓冲液1预热至70℃
将700μl洗涤缓冲液2预热至48℃
将链霉抗生物素蛋白结合珠粒平衡至室温持续至少30分钟。
维持快速洗涤缓冲液1的温度在70℃下至关重要。因此,使移液时间减至最少。另外,使快速洗涤缓冲液1保持在加热块上持续整个移液时间。
在捕获后PCR扩增、纯化及进行QC的步骤的准备中:
使DNA纯化珠粒(来自Twist结合及纯化珠粒)平衡至室温持续至少30分钟
在冰上解冻KAPA HiFi HotStart ReadyMix
使扩增引物(来自Twist快速杂交及洗涤试剂盒(Fast Hybridization and WashKit))在冰上解冻
在此等试剂解冻后,将所述试剂脉冲涡旋2秒以混合。
制备珠粒
12.使预平衡的链霉抗生物素蛋白结合珠粒涡旋直至混合。
13.将100μl链霉抗生物素蛋白结合珠粒添加至1.5-ml微量离心管中。制备一个管用于各杂交反应。
14.将200μl快速结合缓冲液添加至管中的每一个中且藉由移液混合。
15.将管置放在磁性台架上1分钟,接着移出。丢弃澄清上清液。珠粒集结粒不受干扰。自磁性台架移出该管。
16.再重复洗涤步骤(步骤14及15)两次,总共洗涤三次。
17.在自第三次洗涤移除澄清上清液之后,添加最终200μl快速结合缓冲液。藉由涡旋将珠粒再悬浮直至均质化。
18.在杂交完成之后,打开热循环仪封盖且将各杂交反应的体积快速转移(包括杂交增强剂)至来自步骤18的经洗涤的链霉抗生物素蛋白结合珠粒的对应管中。藉由移液及轻击来混合溶液。
注意事项:在60℃下直接自热循环仪进行快速转移为使脱靶结合减至最少的关键步骤。在将溶液转移至经洗涤的链霉抗生物素蛋白结合珠粒之前,不自热循环仪移出杂交反应管或以其他方式使其冷却至低于60℃。
结合目标
19.在室温下在震荡器、摇臂或旋转器上以足以保持溶液混合的速度使杂交反应的管与链霉抗生物素蛋白结合珠粒混合30分钟。
注意事项:不涡旋溶液。不需要剧烈混合。
20.自混合器移除含有与链霉抗生物素蛋白结合珠粒进行杂交反应的管,且进行脉冲旋转以确保所有溶液在管底部。
21.将管置放在磁性台架上1分钟。
22.移除且丢弃包括杂交增强剂的澄清上清液。珠粒集结粒不受干扰。
注意事项:在上清液移除后及在某些样品中的各洗涤步骤期间可见痕量杂交增强剂。其并不影响最终捕获产物。
23.自磁性台架移出管且添加200μl预加热的快速洗涤缓冲液1。藉由移液混合溶液。
24.将管在70℃下培育5分钟。
25.将管置放在磁性台架上1分钟。
26.移除且丢弃澄清上清液。珠粒集结粒不受干扰。
27.自磁性台架移出管且再添加200μl预加热的快速洗涤缓冲液1。藉由移液混合溶液。
28.将管在70℃下培育5分钟。
29.将来自步骤28的全部体积(约200μL)转移至新的1.5-ml微量离心管中,各杂交反应一个管。将管置放在磁性台架上1分钟。
注意事项:此步骤需要管转移,因为其归因于可黏附至管表面的非靶向库而减少了背景。
30.移除且丢弃澄清上清液。珠粒集结粒不受干扰。
31.自磁性台架移出管且将200μl的48℃洗涤缓冲液2添加至各管中。藉由移液混合溶液,且接着进行脉冲旋转以确保所有溶液在管底部。
32.将管在48℃下培育5分钟。
33.将管置放在磁性台架上1分钟。
34.移除且丢弃澄清上清液。珠粒集结粒不受干扰。
35.再进行洗涤(步骤31-34)两次,总共洗涤三次。
36.最终洗涤之后,使用10μl移液管移除所有痕量上清液。紧接着遵循下一步骤。不使珠粒干燥。
37.自磁性台架移出管且添加45μl水。藉由移液混合溶液直至均质化。将溶液(下文称为链霉抗生物素蛋白结合珠粒浆料)在冰上培育。
捕获后PCR扩增、纯化及进行QC
所需试剂
链霉抗生物素蛋白结合珠粒浆料(来自步骤38)
乙醇
分子生物学级别水
经解冻及平衡的试剂:
DNA纯化珠粒
KAPA HiFi HotStart ReadyMix(或等效物)
扩增引物
Agilent生物分析仪高灵敏度DNA试剂盒(或等效物)
Thermo Fisher Scientific Qubit dsDNA高灵敏度定量分析。
在开始之前
制备500μl 80%乙醇用于待处理的各链霉抗生物素蛋白结合珠粒浆料。
准备珠粒、热循环仪及PCR混合物
38.使用如下表3中所呈现的以下条件程序化热循环仪。将加热的封盖设定为105℃。如上文所陈述,根据以下程序进行PCR扩增持续11个循环。然而,对于某些样品,基于如上文所论述进行的qPCR评估的结果的结果运行更多或更少循环。
表3.用于PCR的热循环仪条件。
注意事项:扩增循环的数目视杂交反应大小而变化。
39.若链霉抗生物素蛋白结合珠粒浆料沉淀,则藉由移液将其混合。
40.将22.5μl链霉抗生物素蛋白结合珠粒浆料转移至0.2-ml薄壁PCR带管。
41.将溶液保持在冰上,直至即用于下一步骤中。
注意事项:将剩余22.5μl水/链霉抗生物素蛋白结合珠粒浆料储存在-20℃下以供未来使用。
藉由将以下试剂添加至含有链霉抗生物素蛋白结合珠粒浆料的管中来制备PCR混合物。藉由移液混合溶液。
PCR扩增
42.对管进行脉冲旋转且转移至热循环仪。接着启动循环程序。
43.当热循环仪程序完成时,自阻断中移出管且随后进行纯化步骤。
44.将DNA纯化珠粒涡旋混合。
45.将90μl(1.8×)均质化DNA纯化珠粒添加至来自步骤44的管中的每一个中。藉由涡旋充分混合溶液。
注意事项:不必自扩增PCR产物回收上清液或移除链霉抗生物素蛋白结合珠粒。
46.将溶液在室温下培育5分钟。
47.将管置放在磁性盘上1分钟。
48.在不自磁性盘移出管的情况下,移除且丢弃澄清上清液。
49.将DNA纯化珠粒集结粒用200μl新制的80%乙醇洗涤1分钟,接着移除。丢弃乙醇。此洗涤重复一次,洗涤总共两次,同时将管保持在磁性盘上。
50.使用10μl移液管,移除所有残余乙醇。珠粒集结粒不受干扰。
51.将珠粒集结粒在磁性盘上风干5-10分钟或直至珠粒集结粒干燥。注意不过度干燥珠粒集结粒。
52.自磁性盘移出管且添加32μl水。藉由移液混合溶液直至均质化且在室温下培育2分钟。
53.将管置放于磁性盘上,且静置3分钟或直至珠粒完全集结。
54.将30μl的含有富集库的澄清上清液转移至洁净薄壁PCR 0.2-ml带管,同时确保不干扰珠粒集结粒。
55.使用Agilent生物分析仪高灵敏度DNA试剂盒及Thermo Fisher ScientificQubit dsDNA高灵敏度定量分析对各富集库进行验证及定量。
注意事项:当使用Agilent生物分析仪高灵敏度DNA试剂盒时,装载0.5μl最终样品。
56.使用150-1,000bp的范围设定,平均片段长度为约375-425bp。样品的最终浓度大于或等于15ng/μl,但此视杂交反应大小、杂交时间及所用PCR循环数目而定。
接着将所捕获的库池汇集在一起以在Illumina NovaSeq SP PE150上测序(各96样品1个通道)。
生物信息工作流程
测序数据分析
生物信息工作流程包括根据预定关注区进行的基因组制备。针对预定关注区进行比对,且丢弃不在此等区内的序列。本文所用的生物信息工作流程(700)示于图7中。修整(702)原始FASTQ档案(701)以移除转接子末端且使用比对工具(例如BISMARK)与所制备的基因组(704)组合(703)。FASTQ档案为含有来自簇的序列数据的文本文件,所述簇在流动池上通过过滤器。接着标记且移除光学重复序列(705)。对于配对末端操作,针对各链产生正向及反向读段且计算机仿真组合以产生对应于双链片段的单链的序列读段(706)。排序比对档案(707、708),标记重复序列,且置于所关注的目标中,亦即.bam档案(707)或掺入(spike-in;SI)对照.bam档案(708)。对.bam档案进一步去重及质量过滤且经由Picard度量值及QC概述工作流程运行。
生物信息工作流程的最终输出为:
包括所关注目标(例如甲基化及/或突变标记)的经修整、比对、去重及经品质过滤的读段的.bam档案;
包括掺入对照序列的经修整、比对、去重及经品质过滤的读段的.bam档案。掺入对照序列用于转化质量控制(例如,确定转化率,例如转化效率);及
具有所分析的每个样品及每个区的统计概述的.xsl档案(用于样品及区质量控制)。
癌症信号推论及预测算法
样品的.bam档案进一步用于指配依读段甲基化值。将基于具有最小预定CpG数目及最小甲基化百分比的读段的预定临限值应用于所关注目标区中的各测序读段。取决于读段是否超过临限值,各目标区(例如DMR)中的各读段得到1或0的分数。接着统计分数以发现通过临限值条件的DMR的读段的总数目。使用个别样品的有效库大小进一步标准化依读段甲基化值。所得值经log2变换且用作预测算法建置、训练及验证中的输入。
结直肠癌模型
使用50折蒙地卡罗(Monte Carlo)交叉验证,使用结直肠癌样品及结肠镜检阴性对照样品的训练集进行初始特征过滤。在每次迭代(iteration)中,50%样品用作训练样品且50%样品用作验证样品。顺序反向选择(Sequential Backward Selection;SBS)用于降维以藉由降低用随机森林进行另一预测模型构建的复杂度来避免过度拟合。顺序反向选择学习在各步骤处信息最多的特征(例如DMR),且接着取决于已经选择的特征而选择下一特征。SBS为依序制程,其中移除来自完整特征子集的特征直至新特征子空间含有模型未得到改良的特征集合。使用SBS选择203个标记区的集合(列于图2中)。随机森林(randomforest;RF)机器学习算法构建于训练集上,且应用于未用于特征筛选或预测算法训练阶段中的独立验证集。接着将基于验证集根据模型的个别预测与患者的真正病状进行比较。接着计算灵敏度及特异性值。
晚期腺瘤模型
类似于结直肠癌模型,对用于晚期腺瘤检测潜能的标记进行初步分析。使用关于结直肠癌组织样品定义的预选区清单及AMBER评分临限值,在交叉验证设置下分开评估由晚期腺瘤及对照样品获得的结果。50折蒙地卡罗交叉验证如上用于每次迭代中。在每次迭代中,50%样品用作训练且50%样品用于测试及验证。顺序反向选择(SBS)用于降维以藉由降低预测模型构建的复杂度来避免过度拟合。使用SBS,选择220个标记区的集合(列于图3中)。使用随机森林(RF)、PLS-DA及支持向量机(support vector machine;SVM)模型构建预测模型。个别样品结果呈现为其中测试特定样品的所有折迭的一致预测。
结果及质量过滤
基于对映射质量、重复量、转化及覆盖度的评估,37个样品被视为对于额外分析无效且被排除。此留下70个结直肠癌样品、81个晚期腺瘤样品、37个非晚期腺瘤样品、14个胃肠疾病样品及142个结肠镜检阴性样品用于进一步分析。
结直肠癌模型
如以下表4中所呈现,基于68个ctDNA样品使用依读段甲基化值训练机器学习模型。所分析的样品来自18位早期(I-II)及16位晚期(III-IV)CRC患者及34位年龄、BMI、性别及国家来源匹配的无赘瘤对照。受试者的中值年龄为63岁[50-74],平均BMI为27[19.5-37],50%受试者为女性,50% CRC为远程癌症。受试者来自乌克兰或西班牙。
表4.训练受试者人口统计资料。
接着将此模型应用于受试者的独立验证集,如下表5中所呈现。受试者来自西班牙、乌克兰及德国。受试者包括36位I期-IV期癌症患者(中值年龄61.5岁[55-82],BMI 28[16-39],女性47%,42%肿瘤为远程)及159位年龄及性别匹配的对照。87位对照受试者具有阴性结肠镜检结果(cNEG),19位患有增生性息肉(hyperplastic polyp;HP),37位具有小的非晚期腺瘤(NAA),且16位经诊断患有其他良性胃肠疾病(gastrointestinal disease;GID)。
表5.验证受试者人口统计资料。
使用如图2中所呈现的203标记组别,该模型正确地分类验证受试者组中的92%(33/36)CRC患者。图8为展示203标记CRC组别在验证集上的效能的ROC曲线。
图9展示每个CRC分期的CRC灵敏度值、整体特异性、验证集中的灵敏度。每个CRC分期的灵敏度介于以下范围内:对于I期CRC为83%(5/6)、对于II期CRC为92%(11/12)、对于III期CRC为92%(12/13)直至对于IV期CRC为100%(5/5)。该模型的特异性为97%(154/159),其中100%(37/37)NAA、94%(15/16)GID、95%(18/19)HP及97%cNEG患者经正确识别为不患有CRC。病变位置、性别、BMI、年龄及国家来源与预测结果无显著相关。
图10A及10B是两个个别DMR验证集中的各样品中AMBER评分值的盒状图。如自盒状图可见,两个个别DMR具有区分CRC与其他病状的较强能力。对照样品(CNT)包括来自未经测定患有CRC(例如cNEG、HP、NAA、GID)的受试者的所有样品。
使用KEGG路径分析对203个DMR(图2)进行进一步分析。KEGG路径分析识别细胞代谢过程中所涉及的关键路径。分析结果呈现于以下表6中。识别为促成DMR面版的主要路径经识别为与癌症以及调节细胞多能性的信号传导路径有关,其通常在癌症中受到影响。
表6.KEGG路径分析结果。
DAVID KEGG路径
项目
hsa05216:甲状腺癌
hsa04550:调节多能性的信号传导路径
hsa05200:癌症路径
hsa04015:Rap1信号传导路径
对203个DMR的子集分析显示DMR的子集在区分验证集中的CRC与对照样品方面出人意料地表现良好。发现2、4、9及24个DMR的组合在自对照受试者中识别CRC受试者方面表现良好。举例而言,仅两个DMR的组别显示78%的AUC。尽管准确度随着DMR的数目增加而提高,但此等较小DMR组别亦可用于识别罹患CRC的受试者。此等DMR组合子集的结果呈现于下表7中。
表7.CRC DMR组别统计资料。
2 | 4 | 9 | 24 | 203 | |
AUC | 0.78 | 0.83 | 0.87 | 0.92 | 0.97 |
灵敏度 | 0.54 | 0.80 | 0.83 | 0.90 | 0.92 |
特异性 | 0.89 | 0.72 | 0.64 | 0.72 | 0.97 |
精确度 | 0.82 | 0.74 | 0.68 | 0.76 | 0.93 |
κ | 0.43 | 0.39 | 0.32 | 0.45 | 0.78 |
表8、9、10及11(下文呈现)分别对应于表7中所指示的2、4、9及24个DMR组合。表8、9、10及11中所列的DMR也见于图2中所示的203DMR组别中。尽管最佳执行DMR组别为203DMR组别(图2),较小组别经证明亦为出人意料地适用的。举例而言,相较于4、9及24DMR组别,二标记组别具有出人意料地高的AUC、精确度及κ值。
表8.CRC的2-DMR组别。
chr | 起始 | 结束 | SEQ ID NO. |
7 | 96997902 | 96999222 | SEQ ID NO.:92 |
8 | 96145538 | 96145718 | SEQ ID NO.:108 |
表9.CRC的4-DMR组别。
chr | 起始 | 结束 | SEQ ID NO. |
7 | 96997902 | 96999222 | SEQ ID NO.:92 |
8 | 96145538 | 96145718 | SEQ ID NO.:108 |
2 | 100322218 | 100322818 | SEQ ID NO.:28 |
2 | 29115776 | 29116791 | SEQ ID NO.:17 |
表10.CRC的9-DMR组别。
chr | 起始 | 结束 | SEQ ID NO. |
7 | 96997902 | 96999222 | SEQ ID NO.:92 |
8 | 96145538 | 96145718 | SEQ ID NO.:108 |
2 | 100322218 | 100322818 | SEQ ID NO.:28 |
2 | 29115776 | 29116791 | SEQ ID NO.:17 |
2 | 88765502 | 88766042 | SEQ ID NO.:25 |
4 | 153249541 | 153249721 | SEQ ID NO.:55 |
2 | 86790271 | 86790811 | SEQ ID NO.:24 |
2 | 176094518 | 176094878 | SEQ ID NO.:35 |
3 | 37453325 | 37453874 | SEQ ID NO.:41 |
表11.CRC的24DMR组别。
chr | 起始 | 结束 | SEQ ID NO. |
7 | 96997902 | 96999222 | SEQ ID NO.:92 |
8 | 96145538 | 96145718 | SEQ ID NO.:108 |
2 | 100322218 | 100322818 | SEQ ID NO.:28 |
2 | 29115776 | 29116791 | SEQ ID NO.:17 |
2 | 88765502 | 88766042 | SEQ ID NO.:25 |
4 | 153249541 | 153249721 | SEQ ID NO.:55 |
2 | 86790271 | 86790811 | SEQ ID NO.:24 |
2 | 176094518 | 176094878 | SEQ ID NO.:35 |
3 | 37453325 | 37453874 | SEQ ID NO.:41 |
10 | 43105168 | 43105348 | SEQ ID NO.:124 |
7 | 90596855 | 90597335 | SEQ ID NO.:90 |
6 | 28988380 | 28988560 | SEQ ID NO.:69 |
19 | 53254542 | 53254962 | SEQ ID NO.:190 |
7 | 141072108 | 141073057 | SEQ ID NO.:99 |
14 | 104117671 | 104117851 | SEQ ID NO.:159 |
6 | 163413139 | 163413679 | SEQ ID NO.:80 |
5 | 38555799 | 38556399 | SEQ ID NO.:60 |
2 | 95025733 | 95026933 | SEQ ID NO.:26 |
7 | 35257235 | 35257535 | SEQ ID NO.:86 |
1 | 2132912 | 2133092 | SEQ ID NO.:2 |
3 | 128491607 | 128492807 | SEQ ID NO.:49 |
20 | 23049079 | 23049259 | SEQ ID NO.:193 |
1 | 243917149 | 243917569 | SEQ ID NO.:15 |
1 | 38045915 | 38046095 | SEQ ID NO.:6 |
在一些具体实例中,本发明包括DMR的组合,其中DMR中的每一个为、包括以下所有、包括以下部分:表8的DMR(例如如图2中所示),或存在于经识别为与表8的DMR相关的基因中。在一些具体实例中,本发明包括DMR的组合,其中DMR中的每一个为、包括以下所有、包括以下部分:表9的DMR(例如如图2中所示),或存在于经识别为与表9的DMR相关的基因中。一些具体实例中,本发明包括DMR的组合,其中DMR中的每一个为、包括以下所有、包括以下部分:表10的DMR(例如如图2中所示),或存在于经识别为与表10的DMR相关的基因中。一些具体实例中,本发明包括DMR的组合,其中DMR中的每一个为、包括以下所有、包括以下部分:表11的DMR(例如如图2中所示),或存在于经识别为与表11的DMR相关的基因中。
晚期腺瘤模型
使用对应于个别DMR的所计算的依读段甲基化值,以基于来自81位晚期腺瘤患者及136位年龄、BMI、性别及国家来源匹配的无赘瘤对照的217个ctDNA样品来构建及交叉验证机器学习模型。关于用于验证及训练模型中的晚期腺瘤受试者的统计资料呈现如下:中位年龄63岁[46-79],平均BMI 28[19-48],女性51%。受试者来自西班牙、乌克兰及德国群体。具有不同形式的晚期腺瘤的患者的分布可如下表12中所列而见。
表12.验证及训练受试者人口统计资料。
与RF、PLS-DA及SVM分类模型组合评估SBS特征过滤方法以识别所关注的DMR。基于SVM分类模型的SBS所选特征(DMR)在交叉验证设定中展示最佳效能。
关于模型对诊断患有各种分类及类型的晚期腺瘤的受试者的灵敏度的统计结果呈现于图11及12中。晚期腺瘤模型正确地分类58%(47/81)的AA患者且总体上具有90%特异性(123/136)。关于使用模型正确识别的AA亚类的百分比的统计资料提供如下:40%(2/5)经诊断患有晚期腺瘤伴锯齿状病变<10mm及发育不良,44%(8/18)患有具有绒毛状组分的腺瘤,50%(8/16)患有低级、>=1cm管状腺瘤,68%(17/25)为患有高级发育不良的患者,70%(7/10)患有锯齿状病变>=1cm,及71%(5/7)患有原位癌。另外,关于模型对于在结肠及直肠中的各个位置所发现的AA的灵敏度,统计资料提供于图12中。举例而言,该模型的灵敏度对于近端AA(接近脾曲且位于结肠中的AA)为52.5%,对于远程AA(远离脾曲且位于结肠中的AA)为70%,且对于位于直肠中的AA为50%。
还使用KEGG路径分析进一步分析所有220个贡献区(contributing region)。KEGG路径分析结果呈现于下表13中。主要促成路径与癌症以及信号传导路径有关,其在癌症出现时受影响。
表13.KEGG路径分析结果.
对220个DMR(如图3中所示)的子集分析显示DMR的子集在区分验证集中的AA与对照样品方面出人意料地表现良好。发现2、4、9及24个DMR的组合在自对照受试者中识别AA受试者方面表现良好。举例而言,仅两个DMR的组别显示82%的AUC。尽管准确度随着DMR的数目增加而提高,但此等较小DMR组别也可用于识别罹患AA的受试者。此等DMR组合子集的结果呈现于下表14中。
表14.晚期腺瘤(AA)DMR组别统计资料。
表15、16及17(呈现于下文中)分别对应于表14中指示的2、4及10个DMR组合。表15、16及17中所列的DMR也见于图3中所示的220DMR组别中。尽管最佳执行DMR组别为220DMR组别,较小组别经证明亦为出人意料地适用的。举例而言,相比于4DMR组别及10DMR组别,2-DMR组别具有出人意料地高的特异性。此外,2-标记组别的AUC值表明,2-DMR组别的DMR显著地贡献于220-DMR组别的AUC。
表15.AA的2-DMR组别。
chr | 起始 | 结束 | SEQ ID NO. |
7 | 100785927 | 100786167 | SEQ ID NO.:221 |
14 | 97412990 | 97413410 | SEQ ID NO.:374 |
表16.AA的4-DMR组别。
chr | 起始 | 结束 | SEQ ID NO. |
7 | 100785927 | 100786167 | SEQ ID NO.:221 |
14 | 97412990 | 97413410 | SEQ ID NO.:374 |
20 | 3083167 | 3083587 | SEQ ID NO.:411 |
8 | 37797956 | 37798676 | SEQ ID NO.:329 |
表17.AA的10-DMR组别。
chr | 起始 | 结束 | SEQ ID NO. |
7 | 100785927 | 100786167 | SEQ ID NO.:221 |
14 | 97412990 | 97413410 | SEQ ID NO.:374 |
20 | 3083167 | 3083587 | SEQ ID NO.:411 |
8 | 37797956 | 37798676 | SEQ ID NO.:329 |
16 | 57091834 | 57092014 | SEQ ID NO.:387 |
4 | 7940020 | 7940200 | SEQ ID NO.:287 |
19 | 40811045 | 40811585 | SEQ ID NO.:403 |
1 | 154567391 | 154567691 | SEQ ID NO.:246 |
14 | 105364294 | 105364612 | SEQ ID NO.:376 |
9 | 61862430 | 61863030 | SEQ ID NO.:338 |
在一些具体实例中,本发明包括DMR的组合,其中DMR中的每一个为、包括以下所有、包括以下部分:表15的DMR(例如如图2中所示),或存在于经识别为与表15的DMR相关的基因中。在一些具体实例中,本发明包括DMR的组合,其中DMR中的每一个为、包括以下所有、包括以下部分:表16的DMR(例如如图2中所示),或存在于经识别为与表16的DMR相关的基因中。在一些具体实例中,本发明包括DMR的组合,其中DMR中的每一个为、包括以下所有、包括以下部分:表17的DMR(例如如图2中所示),或存在于经识别为与表17的DMR相关的基因中。
实施例3:亚硫酸氢盐转化相对于酶转化
此实施例的目的为展现亚硫酸氢盐及酶转化两者在使用NGS分析识别甲基化位点方面的有用性。具体而言,两种方法在本文中展示可用于判定结直肠癌是否存在。另外,此实施例展示不同处理步骤(诸如移除重复序列(例如光学重复序列、PCR重复序列))对获自NGS分析的数据量的影响。显示去重自生物信息分析管线移除大量读段。
图13显示在测序数据上进行以移除重复序列的一系列生物信息步骤(1300)。如本文所描述获取自NGS测序技术获取的读段数据(1310)。在此实施例中,测序数据系获自经亚硫酸氢盐及酶转化的DNA片段。接着将获自测序数据的读段与参考序列比对(1320)。接着移除对应于光学重复序列的读段(1330)。在光学去重之后,接着移除PCR重复序列(亦称为库重复序列)(1340)。最后,对经去重读段进行质量过滤(1350),此使得移除额外读段。
在此实施例中,针对使用亚硫酸氢盐及酶转化制备的16个样品对进行比较性分析,以比较两种转化方法的效能。图14展示一系列组别,其比较样品在经历不同生物信息分析之后的亚硫酸氢盐(bisulfite;BS)及酶(enzymatic;EM)转化数据质量。y轴指示在分析的各个阶段所存在的读段的数目。如名称为“所有”的组别中所示,经酶转化方法处理的样品最初呈现较高量的获取数据(例如更多读段)。在比对之后,自进一步分析移除未与目标区对准的读段。对准读段的数目展示于名称为“原始”的组别中。在两种条件下在比对之后均存在更少读段,但在EM数据集的样品中仍存在较多读段(平均而言)。在读段比对之后,移除对应于光学重复序列的读段(“optical_rm”)。名称为“optical_rm”的组别显示移除光学重复序列后剩余读段的数目。在光学去重之后,自样品移除PCR重复序列(“deDup”)最后,对档案进行质量过滤(“filtered”)以移除任何剩余错误读段。如图14中可见,亚硫酸氢盐及酶转化样品中剩余读段的数目类似。
接着使用203CRC标记组别(图2)对所得数据进行PCA(主组分分析)。不同条件群组定义如下:用亚硫酸氢盐转化制备的CRC样品(CRC_Bis)、用酶转化制备的CRC样品(CRC_EM)、用亚硫酸氢盐转化制备的对照样品(CNT_Bis)以及用酶转化制备的对照样品(CNT_EM)。应注意,使用亚硫酸氢盐及酶转化两者制备16个样品中的每一个。理想地,两个组别之间的结果应相同,不管是使用亚硫酸氢盐转化抑或酶转化。如可在图15中的PCA图上所见,可在两种病状(结直肠癌及对照样品)之间但未在转化方法之间发现最大分离。如PCA图中可见,样品对呈现出紧密地标绘在一起。
使用先前所研发的预测算法对68个样品进行进一步分析,产生用类似预测评分类似分类的样品对,如下表18中所示。
表18.用酶转化、亚硫酸氢盐转化制备的成对样品。
样品名称提供独特样品编号,以及制备-酶(_EM)转化或亚硫酸氢盐(_Bis)转化的方法。使用随机森林(RF)预测模型产生各样品的预测评分。在此情况下,RF预测模型为结直肠癌预测模型,其使用图2的203个标记的甲基化状态以预测特定受试者是否罹患CRC。高于0.5的预测评分与患有CRC的受试者相关,而低于0.5的预测评分与处于对照组中的受试者相关。预测样品所属的群组展示于“预测”栏中。“参考”栏指示受试者实际上所属的群组。如自所述结果可见,经亚硫酸氢盐处理的样品及经相应酶处理的样品产生类似预测评分且产生相同诊断。单个错分类的CRC样品对(UDX019715_Bis及UDX019715_EM)是来自患有II期CRC的受试者。
计算机系统及网络环境
如图16中所示,展示且描述了用于提供以供识别生物标记用的系统、方法及架构的网络环境2300的实现方式,所述生物标记用于检测疾病或病状,诸如晚期腺瘤、结直肠癌、其他癌症或与如本文所描述的异常甲基化状态相关的其他疾病或病状。简单概述之,现参看图16,展示且描述了例示性云端计算环境2300的方块图。云端计算环境2300可包括一个或多个资源提供器2302a、2302b、2302c(统称为2302)。各资源提供器2302可包括计算资源。在一些实现方式中,计算资源可包括用于处理数据的任何硬件及/或软件。举例而言,计算资源可包括能够执行算法、计算机程序及/或计算机应用程序的硬件及/或软件。在一些实现方式中,例示性计算资源可包括具有储存及撷取能力的应用服务器及/或数据库。各资源提供器2302可与云端计算环境2300中的任何其他资源提供器2302连接。在一些实现方式中,资源提供器2302可经计算机网络2308连接。各资源提供器2302可经计算机网络2308与一个或多个计算装置2304a、2304b、2304c(统称为2304)连接。
云端计算环境2300可包括资源管理器2306。资源管理器2306可经计算机网络2308与资源提供器2302及计算装置2304连接。在一些实现方式中,资源管理器2306可藉由一个或多个资源提供器2302辅助向一个或多个计算装置2304提供计算资源。资源管理器2306可接收来自特定计算装置2304的对于计算资源的请求。资源管理器2306可识别能够提供由计算装置2304请求的计算资源的一个或多个资源提供器2302。资源管理器2306可选择资源提供器2302以提供计算资源。资源管理器2306可辅助资源提供器2302与特定计算装置2304之间的连接。在一些实现方式中,资源管理器2306可建立特定资源提供器2302与特定计算装置2304之间的连接。在一些实现方式中,资源管理器2306可将特定计算装置2304再导向至具有所请求计算资源的特定资源提供器2302。
图17展示可用于实施本发明中描述的技术的计算装置2400及移动计算设备2450的实例。计算装置2400旨在表示各种形式的数字计算机,诸如膝上型计算机、桌面计算机、工作站、个人数字助理、服务器、刀锋型服务器、大型计算机及其他合适的计算机。移动计算设备2450旨在表示各种形式的移动式装置,诸如个人数字助理、移动电话、智能电话及其他类似计算装置。在此展示的组件、其连接及关系及其功能仅意欲为实例且不意欲为限制性的。
计算装置2400包括处理器2402、内存2404、储存装置2406、连接至内存2404及多个高速扩充端口2410的高速接口2408以及连接至低速扩充端口2414及储存装置2406的低速接口2412。各处理器2402、内存2404、储存装置2406、高速接口2408、高速扩充端口2410及低速接口2412使用各种总线互连,且可安装在共同主板上或视需要以其他方式安装。处理器2402可处理用于在计算装置2400内执行的指令,包括储存于内存2404中或在储存装置2406上的指令,以在外部输入/输出装置(诸如耦接至高速界面2408的显示器2416)上显示GUI的图形信息。在其他实现方式中,可按需要连同多个内存及内存类型使用多个处理器及/或多个总线。此外,多个计算装置可与提供必需操作部分(例如,作为服务器库、刀锋型服务器的群组,或多处理器系统)的各装置连接。因此,当术语用于本文中时,其中多个功能描述为由“处理器”执行,此涵盖其中多个功能由任何数目的计算装置(一个或多个)的任何数目的处理器(一个或多个)执行的具体实例。此外,当功能描述为由“处理器”执行时,此涵盖其中功能由任何数目的计算装置(一个或多个)(例如,在分布式计算系统中)的任何数目的处理器(一个或多个)执行的具体实例。
内存2404在计算装置2400内储存信息。在一些实现方式中,内存2404为一个或多个挥发性内存单元。在一些实现方式中,内存2404为一个或多个非挥发性内存单元。内存2404也可是另一种形式的计算机可读媒体,诸如磁盘或光盘。
储存装置2406能够为计算装置2400提供大量储存。在一些实现方式中,储存装置2406可为或可含有计算机可读媒体,诸如软盘装置、硬盘装置、光盘装置或磁带装置、闪存或其他类似固态内存装置,或装置的数组,包括呈储存局域网络或其他组态形式的装置。指令可储存于信息载体中。指令在由一个或多个处理装置(例如处理器2402)执行时,实施一种或多种方法,诸如上文所述的那些方法。指令也可由一个或多个储存装置,诸如计算机可读或机器可读媒体(例如内存2404、储存装置2406或处理器2402上的内存)储存。
高速接口2408管理针对计算装置2400的带宽密集型操作,而低速接口2412管理带宽密集较低的操作。此类功能的配置仅为实例。在一些实现方式中,高速接口2408被耦接至内存2404、显示器2416(例如,经由图形处理器或加速器),及至高速扩充埠2410,其可容纳各种扩充卡(图中未示)。在实现方式中,将低速接口2412耦接至储存装置2406及低速扩充埠2414。可包括各种通信埠(例如USB、以太网络、无线以太网络)的低速扩充埠2414可例如经由网络适配器耦接至一个或多个输入/输出装置,诸如键盘、指针设备、扫描仪或网络连接装置(诸如交换器或路由器)。
计算装置2400可以多种不同形式实施,如图中所示。举例而言,其可作为标准服务器2420、或多次以此类服务器的群组实施。另外,其可以个人计算机(诸如膝上型计算机2422)的形式实施。其亦可以机架服务器系统(rack server system)2424的一部分的形式实施。替代地,来自计算装置2400的组件可与诸如移动计算设备2450的行动装置(图中未示)中的其他组件组合。此类装置中的每一个可含有计算装置2400及移动计算设备2450中的一个或多个,且整个系统可由彼此通信的多个计算装置构成。
移动计算设备2450包括处理器2452、内存2464、输入/输出装置(诸如显示器2454)、通信接口2466及收发器2468,以及其他组件。移动计算设备2450也可具备储存装置(诸如微驱动或其他装置)以提供额外储存。处理器2452、内存2464、显示器2454、通信接口2466及收发器2468中的每一个使用各种总线互连,且所述组件中的若干可安装在共同主板上或视需要以其他方式安装。
处理器2452可执行在移动计算设备2450内的指令,包括储存于内存2464中的指令。处理器2452可以包括独立及多个模拟及数字处理器的芯片的芯片组的形式实施。处理器2452可提供例如用于配合移动计算设备2450的其他组件,诸如用户接口的控制件、由移动计算设备2450运行的应用程序及藉由移动计算设备2450的无线通信。
处理器2452可经由控制接口2458及耦接至显示器2454的显示接口2456与用户通信。显示器2454可为例如TFT(薄膜晶体管液晶显示器)显示器或OLED(有机发光二极管)显示器或其他合适的显示器技术。显示接口2456可包含用于驱动显示器2454以将图形及其他信息呈现至用户的合适电路。控制接口2458可接收来自使用者的命令且将其转化用以呈递至处理器2452。此外,外部接口2462可提供与处理器2452的通信,以使移动计算设备2450与其他装置的附近区域通讯能够达成。外部接口2462可例如在一些实现方式中提供有线通信,或在其他实现方式中提供无线通信,且也可使用多个接口。
内存2464在移动计算设备2450内储存信息。内存2464可实施为以下中的一个或多个:一个或多个计算机可读媒体或媒介、一个或多个挥发性内存单元或一个或多个非挥发性内存单元。扩展内存2474也可提供移动计算设备2450且经由扩充接口2472与其连接,该扩充接口可包括例如单列直插式内存模块(Single In Line Memory Module;SIMM)卡界面。扩展内存2474可提供用于移动计算设备2450的额外储存空间,或也可为移动计算设备2450储存应用程序或其他信息。具体而言,扩展内存2474可包括进行或补充上文所描述的处理的指令,且也可包括安全信息。因此,举例而言,扩展内存2474可作为用于移动计算设备2450的安全模块提供,且可用准许安全使用移动计算设备2450的指令编程。另外,可经由SIMM卡提供安全应用程序以及额外信息,诸如以不可侵入方式将识别信息置放在SIMM卡上。
内存可包括例如闪存及/或NVRAM内存(非挥发性随机存取内存),如下文所论述。在一些实现方式中,指令储存于信息载体中。指令在由一个或多个处理装置(例如处理器2452)执行时,实施一种或多种方法,诸如上文所述的那些方法。指令也可由一个或多个储存装置,诸如一个或多个计算机可读或机器可读媒体(例如内存2464、扩展内存2474或处理器2452上的内存)储存。在一些实现方式中,指令可以传播信号形式例如经收发器2468或外部接口2462接收。
移动计算设备2450可通过通信接口2466无线通信,必要时该通信接口可包括数字信号处理电路。通信接口2466可提供各种模式或协议下的通信,诸如GSM语音电话(全球行动通信系统)、短讯息服务(Short Message Service;SMS)、增强讯息服务(EnhancedMessaging Service;EMS)或MMS传信(多媒体讯息服务)、分码多重存取(code divisionmultiple access;CDMA)、分时多重存取(time division multiple access;TDMA)、个人数字手机(Personal Digital Cellular;PDC)、宽带分码多重存取(Wideband Code DivisionMultiple Access;WCDMA)、CDMA2000或通用封包无线电服务(General Packet RadioService;GPRS)以及其他。此类通信可例如通过收发器2468使用射频进行。另外,可诸如使用Wi-FiTM或其他此类收发器(图中未示)发生短程通信。另外,GPS(全球定位系统)接收器模块2470可将额外的导航相关及位置相关无线数据提供至移动计算设备2450,所述数据可适当地由移动计算设备2450上运行的应用程序来使用。
移动计算设备2450也可使用音讯编译码器2460有声地通信,该音讯编译码器可接收来自用户的口头信息并且将其转化成可用数字信息。音讯编译码器2460可同样地对使用者产生可听声音,诸如经由例如在移动计算设备2450的听筒中的扬声器。此类声音可包括来自话音电话呼叫的声音、可包括记录声音(例如话音讯息、音乐档案等)且也可包括由移动计算设备2450上运行的应用程序产生的声音。
移动计算设备2450可以多种不同形式实施,如图中所示。举例而言,其可以移动电话2480形式实施。其也可以智能电话2482、个人数字助理或其他类似行动装置的部分的形式实施。
本文所描述的系统及技术的各种实现方式可以数字电子电路、集成电路、特别设计的特定应用集成电路(application specific integrated circuit,ASIC)、计算机硬件、韧体、软件及/或其组合的形式实现。此等各种实现方式可包括在一个或多个在包括至少一个可程序化处理器的可程序化系统上可执行及/或可译的计算机程序中实施,该可程序化处理器可为专用或通用,其经耦接以接收来自以下的数据及指令并且将数据及指令传送至以下:储存系统、至少一个输入设备及至少一个输出装置。
此等计算机程序(也称为程序、软件、软件应用程序或程序代码)包括用于可程序化处理器的机器指令,且可以高级程序及/或面向对象的程序化语言及/或以组合/机器语言实施。如本文所用,术语机器可读媒体及计算机可读媒体是指用于提供机器指令及/或数据至可程序化处理器的任何计算机程序产品、设备及/或装置(例如,磁盘、光盘、内存、可程序化逻辑设备(Programmable Logic Device,PLD)),该可程序化处理器包括接收作为机器可读信号的机器指令的机器可读媒体。术语机器可读信号是指用于向可程序化处理器提供机器指令及/或数据的任何信号。
为了提供与使用者的互动,本文所描述的系统及技术可实施于具有以下的计算机上:显示设备(例如阴极射线管(cathode ray tube,CRT)或液晶显示器(liquid crystaldisplay,LCD)监视器),用于向用户显示信息;以及键盘及指针设备(例如鼠标或轨迹球),用户可藉由其提供输入至计算机。其他类型的装置亦可用以提供与使用者的互动;举例而言,向使用者提供的回馈可为任何形式的感觉回馈(例如,视觉回馈、听觉回馈或触觉回馈);且来自使用者的输入可以任何形式接收,包括声学、话音或触觉输入。
本文所描述的系统及技术可实施于包括后端组件(例如,作为数据服务器)或包括中间软件组件(例如,应用程序服务器)或包括前端组件(例如,具有图形用户接口或用户可经由其与本文所描述的系统及技术的实现方式互动的网络浏览器的客户端计算机)或此等后端、中间软件或前端组件的任何组合的计算系统中。系统的组件可由任何形式或媒体的数字数据通信(例如,通信网络)互连。通信网络的实例包括局域网络(local areanetwork;LAN)、广域网(wide area network;WAN)及因特网。
计算系统可包括客户端以及服务器。客户端以及服务器大体上彼此远离且通常经由通信网络互动。客户端与服务器的关系藉助于在各别计算机上运作且具有彼此的客户端-服务器关系的计算机程序产生。
本文中所描述的不同实现方式的组件可经组合以形成上文不特定阐述的其他实现方式。组件可自本文中所描述的处理、计算机程序、数据库等移出而不有害地影响其操作。另外,图式中所描绘的逻辑流程并不需要所展示的特定次序或依序次序以达成所需结果。可将各种分开的组件组合成一个或多个个别组件以执行本文中所描述的功能。
在通篇说明书中,其中将设备及系统描述为具有、包括或包含特定组件,或其中将制程及方法描述为具有、包括或包含特定步骤,另外,意欲存在本发明的设备及系统,所述设备及系统基本上由所列举的组件组成或由所列举的组件组成,且存在根据本发明的制程及方法,所述制程及方法基本上由所列举的加工步骤组成或由所列举的加工步骤组成。
应理解,步骤的次序或用于执行某一动作的次序不重要,只要本发明保持可操作即可。此外,可同时进行两个或更多个步骤或动作。
当参考特定的较佳具体实例,已具体地对本发明进行展示及描述时,所属技术领域中具有通常知识者应理解,在不脱离如所附申请专利范围所定义的本发明的精神及范畴的情况下,其中可对形式及细节做多种改变。
其他具体实例
虽然吾等已描述多种具体实例,但显而易见,本发明及实施例可提供利用本文所描述的组合物及方法或由本文所描述的组合物及方法涵盖的其他具体实例。因此,应了解范畴应由以下定义:可根据本发明及随附申请专利范围而非藉由已藉助于实施例表示的特定具体实例来理解。
本文中引用的所有参考文献均以引用的方式并入本文中。
序列表
<110> 通用诊断股份公司
<120> 用于疾病检测的方法
<130> AX210102EP
<150> US63/189,001
<151> 2021-05-14
<160> 469
<170> BiSSAP 1.3.6
<210> 1
<211> 181
<212> DNA
<213> Homo sapiens
<400> 1
acgggggggc tgttcaccag gaaggggcag ggctgcagcc tcagcctccc ctccagatgc 60
cggcagcacc agcctctgcc tgcatggggc cgcgaggttt gcagtgacat cccccgagct 120
tcctgacctg ccccggacac ggagcacggc tcccaggggc cgcacaggca cccgctggcc 180
t 181
<210> 2
<211> 181
<212> DNA
<213> Homo sapiens
<400> 2
tggaggcgtg gggaccccat ctccaaatac agccacattg ggggttaggg ctccccacgt 60
gaatttaggg gacacttcag ttcgtcccgg cggggactgg ggacgccggg ctgtgtgctg 120
tgtcctgtgg gagagtttgt tcaccctgct ggaggctccc tgatgagccc tggcgtctgc 180
t 181
<210> 3
<211> 481
<212> DNA
<213> Homo sapiens
<400> 3
gcaattaggg atccttgggg ggcttgggct ggtaattaag gtgatgtata attagagttt 60
caacaaaaat tatccgggat taaaaatctt ttgaataatt tcgtttaaaa ttttcaaata 120
gcgttaaata caatttatca ggttttgaat caaacccgtg taacgagtct tggaagctgc 180
agctcccgtc gccggcgcgg gaggaccagg agcagctccg gcgacttccc cgtgcgggaa 240
ggaaacttcg cgagcgaagc cagctggctg gggcctcgcc gcggtgcagc ggcggccgcg 300
ggctcagaat cgagccaccg agggctgcag acggcgtggg ccgggtcggg gagcggggcc 360
tgggggaccc cgggccggcc ggtagtctcg gccgacttcc cactccccgc gcacaaagtc 420
gcggccaact accgcggagc agcgcccgcg tccacaccgc gcagcctggc gccccgaccc 480
t 481
<210> 4
<211> 481
<212> DNA
<213> Homo sapiens
<400> 4
gcaaccaaaa ggagacattt tgacatggag acatatacag ggaatatgcc ctgtgaacat 60
gaagatggcc atatgcaagc ccaggagaga agcctggaag agaccgtttc ctcacagcgc 120
tcagaaggaa agaaccctgc caacatcttg ctttcagatg cccccaggat tgtcagacaa 180
taagatctgt tattgacgcc accgggttgg tgatacttag gtacagcagc cctagcaaac 240
gaatacaccc ccatgagaac taagctccct gagagcggta agctgccttg tcttgctcac 300
agctgacaag aacacgcctg tacggtcact tagcacctag tactgccatt taaccgtttc 360
actagtatgt atgaaccgga gagcctgtca agggaagagc tgaatctttt atcttttgta 420
acgactaccc agtgaaagaa accgcgggta tgcaataaaa acctgttgaa tcgattaaac 480
c 481
<210> 5
<211> 241
<212> DNA
<213> Homo sapiens
<400> 5
cgggaggggc ggagccgacg ggatgcgcgc caggccccgc ccctcctccg ggcccgcccc 60
cggcctggcc attggccgca gagctcgggg gcgtggtcga gctggggctg ggggcgcccg 120
cggtgcccgc ccgcgagtct cgctgcctcc ctcccggggc tgcgggcccg gcggccgggc 180
tggctgggcc gcgcttgggt tcccgcgccg gctcccgcac ccgcaatggg gaactcacac 240
c 241
<210> 6
<211> 181
<212> DNA
<213> Homo sapiens
<400> 6
ccacgtcggc ctgcgtaaag cccagcttga tgcgccgctg cttgaactgc ttggcgaact 60
gctccaggtc gtccgagctg ggcgcatcct cgtccgagtg ctcgcccacc gatgagccgc 120
cgccgcccgc gcccgggtgc aggtgcgccg ccgccgcgtg caggccgccc gcgtgtgcat 180
g 181
<210> 7
<211> 703
<212> DNA
<213> Homo sapiens
<400> 7
tgcgcacctt gacggctcct tagggacaga ccagccgcag gcaagagggg caggtgggca 60
ggattcatcc cgagtttcca atatatttaa tctctaaacc tgataagtac aatgcgcgca 120
tagtctaatt tttttccatt ttgtcccttt ttttgcttgt tttgaatgtt tttcacgtta 180
ataccgaggt cacctacaga ttacaattaa taacttagaa ttccatttta taacattata 240
cactggcttg tatatatata tgtatagatt atatatagat ttatacatat ataaaaacac 300
actgcaccaa ggaaacccat gcttatcggc ataagcaaca aagagagcga caaataccgc 360
aacgaggaaa gtgcacctta aaacttgttt cctttttttt tttttacaat tgtatcgata 420
tatatgtgtg tcccaaagac tcagtgccaa gagatttata catcctaaat ttatatttgt 480
tagagcgaat atttaaattt tttaaaagtg agggctgggg agacacagaa aagactctcg 540
gattatcctg ccatccactg agagccggat gagcacagct aaggagccgc aggagcctgc 600
gctgctgtcg cagcctctga attctcatga attcccagcc ttttggaaag ggggccgggt 660
gaggctggaa gagggatccg gaggtaggag atgaggaccc agg 703
<210> 8
<211> 361
<212> DNA
<213> Homo sapiens
<400> 8
aaccaccacc ttggatttca gatcgaggaa aggaagccaa agcaaaggtg tggttacaca 60
ggacatccat agacaaatcg ttgcctctct aagtgggcct gagctttgcg gctccagaag 120
cgcgaggcgc ggttggtgcg gacgcggggg cgtgggagtc atcgctctcc ccgcagccct 180
ggccgagctc tctgctgtcc tcccgagttt gggccagaga ccacggctca ctccctaacg 240
ccctcgcaag gacggctgcc cgtcgggcca agggcgcccc gggctggagg ccggagcaag 300
acggccccgc gggactcggg agccttggta aggcggaggc tcagaccccg ttcacgaaaa 360
c 361
<210> 9
<211> 426
<212> DNA
<213> Homo sapiens
<400> 9
cttgacgacc gcagcaagat ggagacgctg ccaggcttgc tgcagcggcc cgaccccggg 60
gcgcttagcg cagcgcagct ggagcagctg cgaaaattca aggtgggtgc gcccgcgccc 120
ccatccagcg tccaccaaag tgtagctgcc ccaggactgg ggccccagac tgggaagaga 180
gccgccgaga gaaggggagc gggagcctgt tccctgataa agtggggagg gcgcagggga 240
gacccccggc ggacctctag gcgtctgatc ccagcacaga gcgcgacggg catctgagag 300
tgcaggaaga actaactcag ggactcggcc agagaaatgg gccgaaatta ctgccagaca 360
catccgacct tagtaaaggc ccctcatcct gaacaagcgg cagaatgata ttttatctgt 420
aagaag 426
<210> 10
<211> 541
<212> DNA
<213> Homo sapiens
<400> 10
gcgcccttcg gcagaagcag caaaccgccg gcaagcccag cgaggagggc tgccggggtc 60
tgggcttggg aattggctgg cacccagcgg aaagggacgt gagctgagcg gcgggggaga 120
agagtgcgca ggtcagaggg cggcgcgcag cggcgctccg cgaggtcccc acgccgggcg 180
atatggggtg cctgctgttt ctgctgctct gggcgctcct ccaggcttgg ggaagcgctg 240
aaggtgggtg gaacgagggc gcttgagtgc actcgcggga gggcggagag agggagctgg 300
gtagggacgg ggagggcaac gcctgatggg gactggtgag acccgggacg cactggcgcg 360
atctaggtag aaaactcgct gctccctggc tccggggaga ggcagcgcgg cacagagttc 420
gctggcatca gccgcctcct gaagctcatc tcctcttgtt tctttcttcc ttctctttat 480
gctggctgct ctcccggcca cttgctacac gcctccaatc ttcattctct cccagtcccg 540
c 541
<210> 11
<211> 301
<212> DNA
<213> Homo sapiens
<400> 11
tgggcagggt ggactcagag gttgggaagc tgctcctgag aggagaagcc tctgtctcta 60
cacaggaacc tacctgacac atgaggcaaa aggctccgac gatgctccag acgcggacac 120
ggccatcatc aatgcagaag gcgggcagtc aggaggggac gacaagaagg aatatttcat 180
ctagaggcgc ctgcccactt cctgcgcccc ccaggggccc tgtggggact gctggggccg 240
tcaccaaccc ggacttgtac agagcaaccg cagggccgcc cctcccgctt gctccccagc 300
c 301
<210> 12
<211> 721
<212> DNA
<213> Homo sapiens
<400> 12
gccaggcaac acgaagggac tcgcccaggg ccccccaggg ctcggtgctg gccctgatgc 60
cccgtgcctc cccatctccc gaggggccac tcattcggca aacctttatt aagcccctcc 120
aggacccccg acgccgccta ggcgcccagc gacgcgcggc aggtggcagc agctcgggcc 180
cccgccgcac tccaggcgcc cgcagcgctc gccctgacgc ggccgccatg gcgcaggaga 240
acgcggcctt ctcgcccggg caggaggagc cgccgcggcg ccgcggccgc cagcgctacg 300
tggagaagga tggccggtgc aacgtgcagc agggcaacgt gcgcgagaca taccgctacc 360
tgacggacct gttcaccacg ctggtggacc tgcagtggcg cctcagcctg ttgttcttcg 420
tcctggccta cgcgctcacc tggctcttct tcggcgccat ctggtggctg atcgcctacg 480
gccgcggcga cctggagcac ctggaggaca ccgcgtggac gccgtgcgtc aacaacctca 540
acggcttcgt ggccgccttc ctcttctcca tcgagaccga gaccaccatc ggctacgggc 600
accgcgtcat caccgaccag tgccccgagg gcatcgtgct gctgctgctg caggccatcc 660
tgggctccat ggtgaacgcc ttcatggtgg gctgcatgtt cgtcaagatc tcgcagccca 720
a 721
<210> 13
<211> 181
<212> DNA
<213> Homo sapiens
<400> 13
aggggctcgt ggggaggggg cggagcccag gcctggagag ccggggactt tcctgggccc 60
gggcgggggc cttaatgatc ccaggggagc cggttgaagc cggagacggg gagcttgtgt 120
tggaggtggg gggagaggcg tggaaggatc ggagtctgga ggtattggaa gccaagggtg 180
t 181
<210> 14
<211> 241
<212> DNA
<213> Homo sapiens
<400> 14
ttagcgctct taagattggg cctcccagtt tgaggaaggg gcgggctgct gtctacctct 60
gtgaatctgc cctggaccac cccgggagag aaggagggct ccggggaatc tcgcacattc 120
caggcaaagg ctcccgggcc gcagcctctg tgccacaccc ttggcccggg ccaggtgtgc 180
gccctcctcg ctgcgagggg gagcgggcgg ctgcggggag cgattttcca gcccggtttg 240
t 241
<210> 15
<211> 421
<212> DNA
<213> Homo sapiens
<400> 15
caagaacagg tgggaagaaa aacagcagcc tgatccgtct tgcttttccc ttttctccat 60
gcagccagca cttttccttc tcactctccc cgcacgccca cgcccacccg cttctgcacc 120
gagaacctcg aggcgcgcac gcacgtggag gtgacgccaa gcccagcggc gaggtcgggg 180
ctgggggtgg ggggagccgg cgtcccgcgg gcccccgagg ccggggagct ccgccagcgc 240
attgtgcgag cgagctgaat gcagccgagg ggcgagcgcg cgggctcgca cggattagcc 300
gtgctttccc atgagccaca aaagaatgcc cgaatctggg acatctgtca tcaaggggca 360
ggctgctcag gatgcaaggt aaccagagct ttcctcggac tgcttcagtc tttggggacg 420
t 421
<210> 16
<211> 181
<212> DNA
<213> Homo sapiens
<400> 16
tggaaacgct ccccagacga cgctcgccgg gcccgtggga ggccgcggga gcttgggggg 60
acttcccaaa gcctgagccc cctagcgatg cgcggggtgg gcgggggaaa gaccctgagg 120
gctgcgcgcg ctgcgttcgc gaggtccggc cgtcagtgcg ccccgacctt tcagtgtccg 180
c 181
<210> 17
<211> 1016
<212> DNA
<213> Homo sapiens
<400> 17
ggtcgcgcag aggcgctggg ggctgtggaa gccccgcggc cgcctcccgt gggcaccggt 60
gtcgctggcc gcggggaggc cttctcgggg cggagcggcc cacccggcgg ggatggggac 120
tcctcgtggc ggccgctgac ggacggccca actttaggtt gaggggcgcg gggtgtgcgg 180
gacccggcgg cggagctggg ctctgggcca cgaccgccag ccgcggctgc cccgagagtc 240
cccgcacgcg cagtggcttt ccaacgcggc ctcttcccat ttctcacttg actccccttg 300
cgcattaaat tgtcgagaaa cctttggcca gtgggtcttc aaagctaaac caaatggctg 360
tccttgcagt ccttggctac ctgagatccc ttaattctga accatccgca cctgggaggg 420
gaagttgaaa ggagcgctgg agctgagccc gcatccttaa ggatcccatt cactgcttat 480
gatggtagag ctttgaatta gatgtcaggc tgttcacgtc atccagactc tggttttcag 540
ctctgtgctg agacagtgtt ttgatacgta tcagaggatg atgttcctat gggacaataa 600
cttgctgtat gttctgagat actagactgc gttcatattg tagcaccatc atcgtataaa 660
acgggcgcct ttgaaaggtt tcagtaaaca ccttcctcag gaacatccgc cagcacttaa 720
attgtacttc actttcactt tgacgtttgt tgtttgtgaa tcttgtgcac aatttaaagt 780
gagtcgtcta aacagcacag gatcacgtgg tgcggggcat tgagcaactg gggaggaaag 840
cagagacttg aacctgctgg agtctagttg gtctgcgttt ttatgttgga gaaccatcct 900
ggttccagct tattttgctt tcgtaaatat gatgcatttt ttaaatgctt tcatttgata 960
cggtctatct ggactgtaag attgagtcta gccatgcatg gaatgtgttt acttct 1016
<210> 18
<211> 1546
<212> DNA
<213> Homo sapiens
<400> 18
ctctgtactg tacttaactg gtgagacgcc acctcccgcc cacatcttcc tgtttttcag 60
tctcccattt ccgaccataa gctcctccaa ggcttttgcc cagaccccta gacgactgtt 120
ctggacccag tttataaaga ctgcctggct ggccaggaaa tcccccagag gcctccttcc 180
gtgtccccgg gccaaatctg tgaagagaaa acggaaggct accatgtcac gaaaaactat 240
gatcaaataa attattatgc cttttctcct attgatctgc cttttgtcaa ctgattttca 300
gtgaaccttc ggagagccat ggggaagttt tccctttccc cctacagggc tctgaatctg 360
aaggtaagag tgagcctata gggggaacct tctggctccc tcacaggaac tgactgagca 420
ggagttggaa aagccacttg gattcccatt tcctcaactc cccgccaata ccaaggcgtc 480
tgtttttaca ggctctttcg tggtgttctg ggcacattca acttccaatg cagctgagag 540
ggtcgggaac agttagagaa caggggtggc agccgcccgg gaggctgcaa ggcgctcgcc 600
cgcaacgcac aggcgcgcgc ggcgcacccg gcctccggcc tccccaggtc gggcctggca 660
gctgcgggaa ggaggtcagc gcagccgcca cacttcgccc gggcgctggc ccgacccgac 720
cgccggcgac tctctggcag cgcccggaga ccgccagccc ctgggccgcc cgtccgcaga 780
gccccctccg ccccgggacc ctcgcgcgca gctcaagttg ggagccccgc tccgcaggcg 840
agcgcgcgcc caccacccac acccactgcc actcatgcac accgcgggtc cggagatgcc 900
cccgagcgtt ttaaaatcca gaaacatcac atggtagcca catccggcgg ctgttacctg 960
ctcgcagcac ccagaccctc gccctggttt cccgggagcc cgcaaacccg gcacgcgggc 1020
tgcgcgccct cccgcaagcc accgctcagc gccagcgcgc cggcaagccg cctaccttag 1080
gggtctgcac ttcaggtccc gtcggcacct ccaacttcct cttggttacc cagaagaaca 1140
gcagcaccgt gatccagagc accccgaaga ctggcagaac cagccgacga gtcaggcgcc 1200
gcatggtccc ctttgccgct tcctctccgc ggcgctacgt cccgggggca ccccccggcg 1260
gtcagggttg gcggggcagg agtcctggcg agcgcctcgc tctggggagc tctagaccca 1320
ggatccggtt ggaggggcgg caggatcctg caaggcgccc ttcccgcttc gaagagaagc 1380
gagcctgggt ggggggtgca gggcgacccg aaacgtggca gggaaggacc gagggcagcc 1440
aagctggacg cccgctccag cgggagaagc gcggtggctg ccgagatgtt ccccacgccg 1500
ccaccgcggc tgccgccgcc gccgccgccg ccttgcccgc tgccgc 1546
<210> 19
<211> 181
<212> DNA
<213> Homo sapiens
<400> 19
agaggccgcg ctttccagcg tggagaccgg acggtgcggc cgtgctccgg ctcaggccct 60
ccgcgcggta ggaaacggcg agggccgtcc cggggagcag cctcacttcg cagctttgct 120
cgccttggta gggaaatggc cttgggcgga ggcgggggac aggcagggaa cggagtggcc 180
a 181
<210> 20
<211> 661
<212> DNA
<213> Homo sapiens
<400> 20
gcgccgaggg tggagggaga aggggctttt gagatcatcc tggagaggaa actgaggcct 60
gggggttgtg ggtggaaaac aggaaggaac cggtagccct tggcacgtat tcttagagga 120
gaaaacggag gctcacaaag gtcagatcac agagccggcc agtgttggag cacaggcggc 180
ccggggtgag cgccagaggt gggctttctt ccctcactga aagccgggag ggagagagag 240
agagagaacg ggggccggcg gagaagaggg cgagacgaaa gtaagcaaag ggacattaga 300
agggaaggca gagccgaggg acgcggaccg agcggccgag cagtggaaag ggcggcaggt 360
gaaaggcaca gagaggaaag atgcgcgggg gacgcgccgc tcacctatgg ttgacaccac 420
ggtgcccacg aagtagaagg cgccggggaa gtcccagcgc gggcgcagcg cgtcggcgcg 480
gacgccggcg gccagcgcgg cctcgtagtg ccggaggaag gcgcgcagct ctggctcggc 540
cacgccgtgc gcagcgctga agttgcgcag cgtggcgccc cagcgcgccc gcgcctccgc 600
ctcgccgggg ctctcgagcg ccgagaagac tgtggcaccc gccaccaggt agaggccgat 660
g 661
<210> 21
<211> 181
<212> DNA
<213> Homo sapiens
<400> 21
gccgatgggg cgcggctcct tggagcatgc gcacacaaac tttccgctag gaatcaagcg 60
agcatgcgca cacagatgtt agggttcggg cgagctattt ggagcctgcg cagtcagatc 120
cgaggacatg ttgacgtcgt ccgagagtct taaaatcctg ctctggccgg attccagact 180
c 181
<210> 22
<211> 301
<212> DNA
<213> Homo sapiens
<400> 22
ctgggttggg agcctgggca gggtgggtgt caagtggctc tggcaactgg accccttcgg 60
ggttgccctc aggatcagga tgaaaagggg gaagtcaggc tggagcagca gcgcggttca 120
cgcagagagc accccaggca gccacgaact ggcttgctcc gttcagattt ctcttaaaca 180
gcagttttcc gtttctgttc tatggcctct gagggaattt cccaaattaa ccttcactaa 240
gctttcctga gggactgttt ttgagcgctg atgggggaat ttcccccttt tgaccacact 300
g 301
<210> 23
<211> 181
<212> DNA
<213> Homo sapiens
<400> 23
aatcttcacc tcaaccttgt aggaggagcc ggtgagcagc ttgatggtgc ggttctggcc 60
gaagcgctgc ccgtccacct tgtaaaagac cgggccgtca ttaggctgga tgcgcagcgc 120
gatggagagg cgcacgaggc ccggcaggtc ccccatgtct gggcgagggt ctggcgcggc 180
g 181
<210> 24
<211> 541
<212> DNA
<213> Homo sapiens
<400> 24
aggttgaggt gaaccccaag ccccacgcgg agaggtgccg caacccggcg cgcggacctg 60
gcaggaagac cggcacgaag tggctgaagt acatgatgga gttgctcagg gccgagcaga 120
aatagtagcc ctcgttctct cggcggaagt cgctcagggt gaggacgaag gtgtccccca 180
acctcttgcc cgagaaccgc tgggtgtcca gcccctcggc cgccttgggc ttgttttggg 240
agaggtatag gaggaaggtg ggactggcgg cggcgccgcg cggctggaag agccacgagc 300
agcccgacgt cgggttggac agcagcacct ggcacttcag ctccactgtc tcgcccaggt 360
tccaggtccg atccagcggc gacacccgga actggctcgg cctggcggcg tctgcaggcg 420
gcaagcagcg aggctgagcc cgcagtcccg cgccccccgc cccccgcccg ccccatcccc 480
tgccttcccg ggcgtctcaa actcacggag cagcaaggcc agcggcagga gcaaggcggt 540
c 541
<210> 25
<211> 541
<212> DNA
<213> Homo sapiens
<400> 25
ggggcgacgc agtggcgaag tcgggctgtg ggcccggcgg cggcaccagg cggagaagcg 60
ccactcaacc ccatccctgg gctgcagagg gcccagcgcg gagggctccg cgcgtcggga 120
gccggtggaa gaggagaaga gcgcgcgggc gacagtcata caggccttgg ggcagggcgc 180
gcctcgcgct ccagggagcc acgccagccc gctgcgcctc cgcagcaacc gccgcctgca 240
cgtggcgggg cgagagagct gctagggcgg tttctccgcc tcgggcctgt tgggcggggc 300
cggctaaggt gcgcgtgctc gctggtccta acggttctgt tgggcgtttc tgctgagagg 360
cgggaggggc tgagagtctg tgcgaaggta ggtggacaga ctgcattgct tgttgttgcg 420
cttcggaggc ggcgatcccc gaaggcgagc tgaaatacgg ctggagcgtt cccaggctac 480
agtttgtagc cgacgattgt ggaagactag gagccggaga ggtggcccac cctcagggag 540
c 541
<210> 26
<211> 1201
<212> DNA
<213> Homo sapiens
<400> 26
ggtctgcgcg gagtctgagc ggcgctcgtc ccgtcccaag gccgacgcca gcacgccgtc 60
atggcccccg cagcggcgac ggggggcagc accctgccca gtggcttctc ggtcttcacc 120
accttgcccg acttgctctt catctttgag tttgtgagtg gctcctggcc ggggaaggga 180
cggggtgggc tgagccgtgc gctctctcgg gcgcccagca cagctgtcgg acgggatccg 240
ctagctgcgc aggttctggg agcatcgggg cagcaggcgc agggcgggga ctaagccagg 300
gaagtcccct cccacctccg gtcctttgtg cccttctaga ccaacagaat gaggggaaca 360
gtctacagga ctatggagga aaaactgggt tcccaactgg ggtcagatgt aggcagcggg 420
gcaggggggg acggctcttg gttcgctggt cccaaagctg cgcgcggggc ccacttgacg 480
cgcgcagcgc caccgaagct cccgccgcgc tttgcgcggt tgggtagaag tgcgcagctt 540
ttacaaggga gaaggtttcg ttaaaaaaga aaaaaaaatc agcaagagaa acattagtat 600
taccaaccga gatttggaga tgagagggag ctgaatccgg tttattttct tctggccttt 660
taaagtttct ggcgagggaa cgtatttgcg accaattcga tctggaaatg aggccatcgt 720
ttgcttggcc gcagtccttc tgccccgtgt gcggggtggg ggtggaggag atggggggtg 780
gggggtgggg ggtggcggcg agagcgatcc gcgcgcctcg actgaccttg ggcaggcccg 840
gggcctctgc acctgcggtc ggtcccgcct tgcacgcacg gtctctgcct gaggctgcag 900
gaaagcgctt cctactgaga actcctgata agcgctcacg gtgtcgcgaa gccgaagtga 960
cctccctcag cctcaactcc ccgggggccg ctggccttca cctgggaggg gtgtgccctg 1020
tatgtcctgt gggtgcggtc cgtcaccgcc tgagggacac cttttccggc accccaccct 1080
cagaagtgtc agcgtggaga gttgggcggg aaagaaaatg tcggagcctg gctgtttaaa 1140
aattggaccc caggttgtta ttgcctgatt ggagggggag ggtgtgaata ccaaagggag 1200
c 1201
<210> 27
<211> 421
<212> DNA
<213> Homo sapiens
<400> 27
aattctgctt ggtctgtggt aaatgccctt tctgagaagc aaccatgacc ttctcaagaa 60
tacttcagag gcacttttgc tccttctcca ctaaccgaca tcctgttttg ctggaacaca 120
tggggcagag cgcacacagc tttgttcctg cacccgccct cagagctttg ccacctgttt 180
tcaggctgcc tctgcctcca aaccctgcgg agccctccct gccccgtgct ttgaagcagt 240
ttctttggaa gctgctgcac aggggttaac aacaagcaac aactcaggtc gcattcttgt 300
caacggaagg gagggccagg tggaaccgcc aagggggcca tttctggctt tgctggaggc 360
tgtcagcttc tggtgggagc cacagcctga gggcagccag gatggctctg ctgggaggga 420
c 421
<210> 28
<211> 601
<212> DNA
<213> Homo sapiens
<400> 28
ggcggcgcgc tgcgagcggc tgagaccgcg ggcgggggcg ggcgcctggc ttgggcagcg 60
tcctcagcgc ggtgtgggcg gcgagccccg cagggctgca atcgttccgg ggtgggggcc 120
gggacaggca ccgcgggcgc aatctgagcc cctgcccacg cgcagcggcc tctcagtccc 180
gccggcttag gtaacccagg tcgctgcggt aacgcagtga ccgcgctcca ggtccgcgtc 240
tcttgcgatg cttcccccac tcgcctgagg gctcctgcgc gactgcgcgc gcgtcctctg 300
cctgccgcct ccccgcagag gtgccggggc cctgggagca ggtggccttg gccgcgggct 360
gctggcgcgc cggcaccgcg gcacctgctc ttccccagag gcctggccgc ccccacaacc 420
tgtggctccg cttaagcaag aacccaggaa aagtcaccaa acgcatcacg catctctagc 480
ttcgacttag gaaattgtcc taaatgactg gggaggctga agtgggcacc cagaggcccc 540
gcctcagcga gcttcttctc ttaactctag gctgaggcct ttgagaactc attttaacag 600
a 601
<210> 29
<211> 301
<212> DNA
<213> Homo sapiens
<400> 29
tttctaggac ttaccggttt ctcacaccct ctccccacca tcaaaatcat ggtttcagag 60
gcattaggcc aaaaaactgc aaaagggagc ctccttctgg gaagtctccg gcccttccgc 120
ggctcccggc gtctccagca gagggctctc ggctgtgccg actcaggaca gctgctgcga 180
cggggccggc tacgcttgtc agagcagcag ctggtgattt tggacttgcc tttgctggca 240
ggggagcgct atcgagggtt cattttatcc agcttgagga aagaaaggtc ggagtgtagg 300
g 301
<210> 30
<211> 301
<212> DNA
<213> Homo sapiens
<400> 30
tgagccgaga gggccactga gccccagcct cagcgacaca gctagaccct gtcaaggaaa 60
ggggaaggaa ggaaagggaa agcaaagaaa agaaaacaaa aaagcagaag caaacgggca 120
agaggccagc gtgtggtccc gggctggcct cagtagtaaa gatgctcgga ggattgattg 180
atttgccgga ttctgcgcgg tttcccagcc tgtgcctggt tgcagtgccc tccctgtggt 240
cgctggctgc ccggacccat acccagcccc acgcctgccc tgccctcttc ccagccagag 300
t 301
<210> 31
<211> 181
<212> DNA
<213> Homo sapiens
<400> 31
ggcgccctcg gctctcccct tcgggcctcc ggggaagcgt ccccgctagg ggtggggtct 60
tgggactccc tggggcttcc ggagctgacc cgtggggggt ctgctgccct cagttcctgc 120
tgaccaaagt cctgccggat ctggcgccta cgaggacgtg gcgggtggag ctcagaccgg 180
t 181
<210> 32
<211> 181
<212> DNA
<213> Homo sapiens
<400> 32
actttaagcc tcgctgaggc gcagacccgg ttcccctctc ctgccttcgc agtctctctg 60
ccacccccgc ccccgccccg ggatcctgcg cgatccagcg cctgggcccc cgccctgccc 120
caggcggacg ctcccgaagc ccggccggag acccggcggg ccgggcgcga gcggagcggg 180
a 181
<210> 33
<211> 371
<212> DNA
<213> Homo sapiens
<400> 33
accagaagag cagcatgagg agccccgccg ggcggcgagg ggtcgcccag cctgtcctca 60
tcctgagctg gcgcaagcct tccggccggg tcctcgggcg cacgcggctc ccgccccgcc 120
tgctgagcgc ggcctgcccc gcccgcacct ctgtctaggc ctctgggggc gccccggccc 180
cgcccccgcc gccctcggcc aatcagacgt gcgtctcctc ggccccgggg cggagcgggc 240
caggtgtggg aaatgaacag ggctgggcgc tagatacctg cgtggggtag gacccgcgag 300
gaagaggtac gtgcggatcg gtgggagagc caggcaccag acaggctcct gcactggagg 360
gttcggtccc c 371
<210> 34
<211> 481
<212> DNA
<213> Homo sapiens
<400> 34
ggggttgagg tcctcgtccg ggagacagga ggacaaggat ccccgcctct cgtggggtgc 60
cagcggcatg agattattac acgtggtgga gaaaatgcag cgcagtaagg ggagagagca 120
cccacctctc caaccccctg ccctgccgcg actccaggct ccgctcctgg gtgggggttt 180
attttctctt ggcatcacgg gacagaagaa tcgatgcata ccctttccgg ctattcagac 240
cttgcggggt atgaagtttt aaagaggggt gggggcaccg gcaggtgcag agtaacattc 300
tttttttgtt cttgaaagca aagtgtgagg gacccggtgg agctgtcgaa tcccttgctg 360
aaattcacag ctctctgccc ccgcagtcgc tcgctcaagg tctgtgttag agaaggtcat 420
ttgggaggct gctttcgtct taatacctgc ttctcgggaa aagatcttta cgctaaaaat 480
a 481
<210> 35
<211> 361
<212> DNA
<213> Homo sapiens
<400> 35
cgaagaggga ggaagaagag agtgccttac accaaactgc agcttaaaga actggagaac 60
gagtatgcca ttaacaaatt cattaacaag gacaagcggc ggcgtatctc ggctgctacg 120
aacctatctg agagacaagt gaccatttgg tttcagaacc gaagagtgaa ggacaagaaa 180
attgtctcca agctcaaaga tactgtctcc tgatgtggtc caggttggcc acagacagct 240
tagaagccat tcggttgtct ccaaaaggcc tttggaaaga cttgaatatg tatttaattc 300
cccccacccc ctgccaatgg tggcaaattt tgtgaattgt ttttctctct tccccttatc 360
t 361
<210> 36
<211> 181
<212> DNA
<213> Homo sapiens
<400> 36
tgaaataatc atgtccagaa atgtatcaaa ggccagaggg attatcccac ttaatagctc 60
cacagatgcg cccagaagaa tgtggacgcg cgacaggacg ggctgaaagg ctgcaggagg 120
aagcaggcag ccccggctcc tggctttacc atttcggttg ctttcctaaa aggctacatg 180
c 181
<210> 37
<211> 301
<212> DNA
<213> Homo sapiens
<400> 37
tttggggcgt gagttttctt cgggcttttt ttcccctctt ttaattcccc gagcgcaatt 60
tggggcgcat gcgtccacga gacgccccgc taccgccctc taagggtgaa gcagggactc 120
cagccagtcc tcaaaatccc agggcaccgg aggctggcag ccgggctggg ggagggcggg 180
gaggggaaag ccctggagcc acagagcacg aggttgggct gaatctattc gtacctttta 240
ttggcttcac tgcgcgagga aattaaagat cctcccccac ccctacaggc cttcaaagca 300
g 301
<210> 38
<211> 181
<212> DNA
<213> Homo sapiens
<400> 38
gggaggaaat ccgacttcac cttgggctca gagttgcaag gaaggtcact gtgggatcag 60
cctgagccca aaaggatggg ctaatgggag cggccgcagg tgcacgcgcg ctcggccgct 120
cccattagtg ttacgtctgc cgggggaaga aggtggggtg gggggttggg ggcgccggga 180
g 181
<210> 39
<211> 661
<212> DNA
<213> Homo sapiens
<400> 39
gcccagctag agtttccaaa aaagttagaa taacttcctc tcccggagac ctcggttttg 60
cacaagccgg ccttgaaatc agagcctttc cagcaactcc gagagcgtgt gctcggcgac 120
cgcgggcttg gccagcggcg cgcgctcggc gccccggcgc ccccagcccc acgcgcgccg 180
ggcgggcgcc atggaggagg gctccagctc gcccgtgtcc cccgtggaca gcctgggcac 240
cagcgaggag gagctcgaga ggcagcccaa gcgcttcggc cggaagcggc gctacagcaa 300
gaagtcgagc gaagatggca gcccgacccc gggcaagcgc ggcaagaagg gcagccccag 360
cgcgcagtcc ttcgaggagc tgcagagcca gcgcatcctg gccaacgtgc gcgagcgcca 420
gcgcacccag tcgctcaacg aggccttcgc ggcgctgcgc aagatcatcc ccacgctgcc 480
ctctgacaag ctgagcaaga tccagacgct caagctggcc gccaggtaca tagacttcct 540
ctaccaggtc ctgcagagcg acgagatgga caataagatg accagctgca gctacgtggc 600
ccacgagcgc ctcagctacg ccttctccgt gtggcgcatg gagggcgcgt ggtccatgtc 660
c 661
<210> 40
<211> 301
<212> DNA
<213> Homo sapiens
<400> 40
cattttaatt gtccaaaact aattgccctt ttacaagtct gtgatataag aggcaggaaa 60
gcaatgtgga gacagaggtg atttccatta acagaggcct ggcagcaggc aggcactcac 120
cgacgctttt cagggaagtc cgtctcctga ttaatgtgct tccgggggca gacagcggat 180
gcgtctcctt gctcagggat ggggtgcatg ggggcatggt ctgaggtttt gtgcaggttg 240
tttgaggttt ccttagccct cttgctgaga aaggcaggaa gaggacagtg gagtgtttct 300
g 301
<210> 41
<211> 550
<212> DNA
<213> Homo sapiens
<400> 41
tctatagtgg ccaaggggtc cagttgtccc ctgagtccgg aggggtgggc ctaagaaggg 60
ggcagctctc ccccattaag caccataagc cgagtggtac agagcttgtg cccaacccca 120
gcagagaagc actaaggggg ggttggtgcc ctccttggcc acatcctctg gaccagaggg 180
tataaacagc cacacagtgg tcacttcttg ataggagaga gagttaggct gcgggaagtt 240
cccccgttca aggtcgtgcc tcatgggggc ccaggtgaca gccaggccgg ggttgatttt 300
attgtgtatt caccagcctg agcgtcctta ggggtggcag gcagggaggt cgaggtcact 360
gatgctggtg ctctcagcat gtagttatgc aggagagtca ctgctctgta ttggacagag 420
gctgatggaa aagggtggtt tgtggatcgc agtactcaag cattcctgga aaaggggact 480
ctgagaccag cccactaaga atcatgctgt tcaggagatc agccttcaag agaaccagtt 540
ttcaaagccc 550
<210> 42
<211> 419
<212> DNA
<213> Homo sapiens
<400> 42
gctgaagaca caaatgttta caatgaccac agcgatgacg ggatccgaga gaaaggcaag 60
gcggaagggg tgaggccgga agccgaagtg ccgcagggag ttagcggcgt ctcggttgcc 120
atggagacca ggagctccaa aacgcggagg tctttagcgt cccggaccaa cgagtgccag 180
gggacaatgt gggcgccaac ttcgccacca gccgggtcca gcagccccag ccagcccacc 240
tggaagtcct ccttgtattc ctccctcgcc tactctgagg ccttccacta cagcttcgca 300
gcccggcccc gccgcctcac gcagcttgcg ctggcgcagc gtcccgagcc tcagctgctt 360
cgtctgcgcc cctcctcgct gcgcacccaa gatatctcgc acttgctcac cggcgtctt 419
<210> 43
<211> 541
<212> DNA
<213> Homo sapiens
<400> 43
ataacgcgta atggagttaa gatgcagatt ctggagccag actgtctgag ttcaaaggct 60
cctaatagct gggctcctta acctctctgt gcctcacttc ctcgtccgga aattgaagct 120
aataagagca ctgacttccc tgggcggcgg ttgaaggcta cctgtgtgga tctgggcaca 180
gcgaagagcg gagccttaac agggtgagca cgccggttgc gcgctctcca gagcagccca 240
gcatctcccg ccagcctcgc tgcccgctcc gccccggcgc aggggcccca agcccacagg 300
caacgccagc gcgctcccaa ccgctggaga cagaaacaat gtgcgcgcgc acacggccca 360
cgtgcacgcg cgcacgccca cgcggcatac aggcgcgcac gtgcacacgc gcgcctgcac 420
agctctgcgg ctctgctccg gccccacagg cccatcttaa agtgtttcgt gctctaactt 480
accaaacacg tggcagccgg cagaacgaaa aggaaaataa atgaactgcg acgaaataaa 540
g 541
<210> 44
<211> 421
<212> DNA
<213> Homo sapiens
<400> 44
agtttgaaag aatccagtgt agaaacagac ttctccgtcc aatttggttt taatcagtaa 60
tcatataagt atacccacat aaccacctaa gtggagagca gacgcccaga ttcacggtcc 120
ccacgtgttg ctggagttgg cgcagacgcg tgtgcgggca tagcggcgga cgtgacaccg 180
cattttctcc gaattcctgc catctagggt ggtgccgccc caagaggggg ccgtggggag 240
gtggggtaat aggctgcgca atccacttgc tctgggggag cttagggttc agagcagagc 300
gcaactccgg ggggctgtcg cacagcccca ttctcccaca ccagaagagc aatgctcctt 360
atggatgatt aatagccggg cttctcctga ccatgcggcg cgtccctgcc ggcaccactt 420
a 421
<210> 45
<211> 181
<212> DNA
<213> Homo sapiens
<400> 45
ctgcgggctg agctcgcccc ctcccccgac ttctttgcgg ggcattttct cttgctggtg 60
tattacgtgt catttctcac ggggcattgc cggccgcttt tctgcaactg tcctttcgga 120
tttggtgatc tggtccggca cagaggctct cctaggaggt ggtgcccatg catattcatt 180
c 181
<210> 46
<211> 181
<212> DNA
<213> Homo sapiens
<400> 46
ggcgccggag tggggagcag gcaatccccc aggctcggag aaatctttta tcccgaaatc 60
cagggtgtcc cccggtcagg atcgactcgg cgccgcgttg gcttcctcgc tcaaccctga 120
catcccggtc cccaccagtc accgcagccg ggcggactcc gaaggcagcg gccgctgggg 180
a 181
<210> 47
<211> 421
<212> DNA
<213> Homo sapiens
<400> 47
aaggctataa cactggtcca gcctgagaga agcccaagtg gggttcactg ccctctgagc 60
cacagattta agggggaggg tgtggaaact gccggctgct gaggtccaaa ctcaccgaag 120
gtactgaccg ccgcggctcc tctcttcaca gcgtctgccg gaggcctccg tttactccgg 180
ttaccgagac aacgccaccc ctcttccagg gaggcggaac cagggcgggc cgtggggcgc 240
atgcgcggcc ggcgtccagc tctccgggaa cccggtacct atccgccctt tggtcgggcc 300
ttctccgcct catgacactg gttcaaagcc aaacagaaaa gcccgacgag tttattatcc 360
cctaaaggac gtcatgtaga taattaaatg acatgaatac cgtcgaagat acctgcctga 420
t 421
<210> 48
<211> 325
<212> DNA
<213> Homo sapiens
<400> 48
ccttcctcct ccgggcagct tctctcagtg gcagctgtgt tccccatggt ttgtcctgga 60
tgtctccctt gtgccatcct tgcaagcccg cggccagcgc ctccacccac gctccggcct 120
tgctcccact cccaccgctc tgccacctcc cacctcagcc tcccaccttg gtgtggaggg 180
accagcgtcg aagacaaagg aatctctgac gagaaccggc cagtccggga gggacggcgg 240
ggaagggggt gctgctctgg cggagccctc acttcactcg cttcccctcg agcgcccctc 300
taggctgggg cccggccgct ctggg 325
<210> 49
<211> 1201
<212> DNA
<213> Homo sapiens
<400> 49
gttcaattcc agccccttaa agcagaaggc tccctccctc ggcatcagtg caggctctcc 60
cacctcatta ctgttctgtg tctttgggaa tcgtagagtc tgtggccccc acgtcctagg 120
tgtctcggca ccctggaccc aggcgcctcc gagattctat atcgcttctg acccctacct 180
tcaagcctgg caggctcccc gcggaaccct gctgagaccc ggagacaatc gggccgtgct 240
tctccctcct ccacgaacag ccacggttta tttggagcgg ccggggccgg cggcctgaca 300
actggtaaat ccgtttcgtt aggcacaatt tgtctgcaat ttgtcagccc ggctgggaaa 360
cgctccccag acgcctcggc tgccgcacgg gccctacctg gttctcgaat cctgcctgct 420
cataaacgaa tcctagcacg gggtgcctgc gtagacctgg agctcaccac cagatgttcc 480
cgacctcggg agaggaggct ttttccaaaa caacgaattt ccttccttgt tttccggtaa 540
aggagcgttc gccacacacg gggtccctga acgcggggcc tttcccctcg tggttggagc 600
aacgcggagt tcaagcctgg ccgccacaga ataattttaa atgccccgtt ttcagacaga 660
tccagaacgc cgtctacgcc taccggcggc agatcttcaa gcccgcggcg gccccattct 720
tattgaaatc ccactaaacg gattccgact ccggcttggg gcggggggag acttccagac 780
ccggcgctct cccccacacg caccccagtc acacaggata aagggctgcg gggcgcagcg 840
cgcgggggcg caagcaggag cgagctgggt taagccgcga aaagccggcg cacgggacca 900
gccggcaggt gcagccgccg ctcggcggcc cggctcggac gcatccgccg cggtggcctg 960
gggattgggg gcggccgaga caaaggcccc agttcggggg ccgggaggcg ggggtgcttt 1020
gcgaggctct gggaatgcca gggtctcgtg gcctgtggct ccgagaaatg ggaagacaag 1080
aggcccgagg cgggcctgct gtgcccaggt aaccaaatac tccctctggt taaagtccct 1140
ataaccaggg tttccggtct ctggcagggc caaggcgagc cccaaaggta ggggccacag 1200
g 1201
<210> 50
<211> 601
<212> DNA
<213> Homo sapiens
<400> 50
gttgttgtga gtattgcact ctgtttttcc tgtttcttca gtatttattt cacaaggaca 60
gacagagaat gtgtgatttg aggtgattag aaagctgata ttattgaggg cgacaccgtg 120
agagagacag agagacagag gcggagagaa acccgaaacc ccgttacagc taggagcctc 180
tgaaactgac agctggtttt cctttgcttg tctgcctgct agacgtggac atttttcatt 240
tacggttctg cacgttacct cggatgcctg cttggctttc cttaaaggga gattcatttc 300
tctgagagat gatgtggatg gtattagcag aaaagcccag aacaccagaa aggtgctgag 360
aaaagcgggg cccgcaagac agagcaggtt ctatcctgtg gggcacttgt cttccttgcg 420
accgtccttt ctgccgttcc tcacccttca ccttgccttt gtttcatatt gtgtaacagt 480
cagtatcttg cgattgcaat ttggtgaaga tgaatacttg ttcaaccatt tttcaaaagc 540
tcttatgacg ggagccatag tggtgtattt atatatattc atagctcttc tttatgtcac 600
t 601
<210> 51
<211> 481
<212> DNA
<213> Homo sapiens
<400> 51
tttccctcct cggcccagct gaacgaggct caatgcctca aagatgcaga gctgcctcgg 60
tggacatgct ctgtggctga tattataatt ttcataatgc gcttttatgt cgcgccagac 120
tcctccggtg aggagcccgc agagctgctg aaaggggctt tgagaggccc gggcgcgcgg 180
ctgctgcgag ctgcgcgccc cccgccggcc tgagtggcac cgcgtgcccc tgccggggcg 240
cggctcctgc actgcgggcg cgcaggcggc ggcgggctct gccggcgccc cttattagca 300
tgcaccctgg gtgcgcctgg cctgctcccg ctgcttccgg gcctctctgc gcccctccga 360
gtctctgcca tccgcctggg tgcgaggtcc ctggccttgc tcctggtcaa actccattcc 420
gctccagctc aggctttagg gaaggtcaag gtgttaaaat gtgggcagaa cattccggaa 480
g 481
<210> 52
<211> 661
<212> DNA
<213> Homo sapiens
<400> 52
agaagtggag agaagaagaa acaaatggag gaagaaggag aaagggaaaa agcagacgga 60
aaaagtgaag tagtacgagg gcgtcccagc ggggcggccc gagaagctcc agcttcttcc 120
cgagcggccg ccgctatccc ccgggggggc gtctggcccc actccggacc acgcccgagc 180
gatcctggtc gccgactgcc acagccgtgc ttcccggcgc gggatccaag ccgcggagcc 240
acctgttagg cgcgcgccgt cggaagccca ggcgcggcgg cgctggagaa tcctctcgaa 300
gtttccgggt gcgcggggag gccccaggtg cgccccgaca tcccgacacg gcccagcacg 360
ggtaagtgtc ggcggccccc cgcttctcct tcctgggtcc cctcccgctg cccccggccg 420
tggcgggaag gaaagttgtg cggagagttg gtacctgcgc tgagctccag gctggcgctg 480
tcgctacccg tgccgccggt gccggcggcc gccgccgcgc ctgggccata cctgacgaca 540
gcggcgaacg aagacgacga ggaggcggcg ggggacgcgg gcggcggctg cgccggagtc 600
ctcaagtggc cctgggatgt ggcgggcgtg caggacggcg acgacgacga agcggcggcg 660
g 661
<210> 53
<211> 1261
<212> DNA
<213> Homo sapiens
<400> 53
gtgctgatag cgcaccccag cacggaggaa agcctcacag tctacgccct tgcccctggg 60
gagaggggcc cccaccgcgt ccaccaagcg cccgtacttg ggcagggggc cgtcctcgtg 120
aggaagtggg gtaagccggc acctgcgggt ggccgtggct ccagacttca gggaggcgaa 180
gtccagcact ctcctgtcta tggcgcggct ccagcttcgc agcttctcca ctaccaaagg 240
cctgttacgc gtcaccagct ccagctggga gaagaccaag tccaccgcca gcgtgaaggg 300
cagcaccaga gtgtgagtcg gggcgtcgta gcgcagctgc agcagcaccc gggcgcgtcc 360
ggggctgtgg gagccgaagt gagtgtactg gacttggcgg ggcccgaagg tgcaggggaa 420
gcggcgcggg gagagcgcgc ccttgagccg cggcagggcg tccagtaccg tgacttcgca 480
ccggtccccc ggctgcactc caatcaccag atcccggagc gggtcgagcc aaagggaacg 540
acccaggggc acccggagtc cagggttggc aatcagcacg ctggggccgt cggggcgagt 600
gccgtcaagc gcaccccggg cgggcaggta aagcgccggg tcgggctcgg tcccaagtga 660
ggatgcccgt ccctgcagcg cggggcgact caagagcagg caggcgagcg ccacaaggag 720
ctgccggggc gtcccagtcg ggtgccgaga agcccccgcc atggccacgg atggctcctg 780
gcgttgggat tcccggggtg gggtgccctg tgcaaagagg gatctgctga gcggcaggtg 840
caggcagtgg aagcagtagc tgctgtccag tcggtagccg acttgcggat ccagcaagag 900
ccagcggctg cgcttcggct gctgcaggta acggcagcgg gggaaggggc tctgcccact 960
tcctgctcag ccccggtcgc aagtctctct ctgctggctt ctggggaccc cagatacgcg 1020
cccagcgcgg cgagacttag cgagggtgca gcgctgtccc ctccgctcct gggcgcttca 1080
cccagcctac cttacacacc ttctcgccgg gagccgtggc cgccgcactg ctgcccgcgc 1140
tgccagactc cgaccagctg tctggatact ctcttcccca ggtgccacaa agggattgtc 1200
cctcagggtt gggagagaga cggtgactgt actcgggtca gtcctgcgtc tgtgagattg 1260
a 1261
<210> 54
<211> 181
<212> DNA
<213> Homo sapiens
<400> 54
agggaccggg agcggcaggg gctgcacatg acctggggcg cgggaaggag cccgctgccg 60
tctaggcccg cgaagggccc cggcagccgc cgacttctga ggaaaagcag aacggtgttt 120
ggtttactaa agtagccgcc tcctaccact cttcctcccc agccccgctc tctgctcccc 180
a 181
<210> 55
<211> 181
<212> DNA
<213> Homo sapiens
<400> 55
agcatgtgtg gaagaggcag gcattattag cagcgcgtcc gcctcggcca cctccctgct 60
cccgcctcgg ccacctccct gctcccgccc cggccctggg ggcctctgtt cagcctccac 120
cagctcagtc gcccacggag actcccgaac tcttaaatcc cagccctgta gtcaaaacca 180
c 181
<210> 56
<211> 721
<212> DNA
<213> Homo sapiens
<400> 56
cttgcacaca tgccttcagc ccctggtacc gtcttctctc cccgggtcgc gacactgact 60
cgtcaacgtt aatgggggtc cgcgactgct gcggggacga gggcgcagag cagcccccgc 120
cacgggccgg tccacgcagg ggccgagaaa gtggcggaga ggcggtggcc gaggcccagg 180
ggcgagcgcg ggctgagctg gtccctgctg cgttcacgag cgacacccac cccttcgctg 240
cggacgcccc gcgggcgcca ggctgggggc cctgcgaccg acccctcccg cccccgaggt 300
accgccgggc ccgcctggca ggcagcgcgt cccgcgagct ggagggccga gtttcgcggg 360
gccgtggggc gtgtgggtga aggcgacacc tcggatgcgg gacgcatgaa tggtggcaga 420
gcaggggtcg ggatccgttc atgggttggg agagagatgc ttttgtgagc acgggaaagt 480
agcgctgccg gagaacagct ctgaggcggg atcaaaagcc gccggcgaag ccccgccgag 540
gaacacggcc gctgcccggg gcggctcgcg agcgtgcgtg tgtggagggg aggatgccgc 600
cccgcggggt cttcggaggg tgccgggagc gggttctcag tgcagttccc ccgtcttcgc 660
tgggggcacg gctgctcaca ggccccggcc cgcgtgtgtg gagcggggcg agggggtgag 720
g 721
<210> 57
<211> 181
<212> DNA
<213> Homo sapiens
<400> 57
gctattactg tcaagtaccc ttgactcttt atttttgccc ttttatctat tacaactaat 60
tcgagttctt ttgccctttt cagtctaaga cgtgggcttt ctgcaaagcc tccccctgcc 120
agcgagctct cggagcgcgg agcctttaga aattgagggg tttactgtca aaatgaaaat 180
t 181
<210> 58
<211> 601
<212> DNA
<213> Homo sapiens
<400> 58
gccttcggga agtcctgcag gagccgcgtt ccaggagggc agctggcagc cgccccaggc 60
ccccgggccg cctgcaggtg attaggctaa tgagctgccc cgggggcgcg gagaccggcc 120
tggcgagcgg attacccggc gcccagctgc tgccggcgga gactcccagg agctccggag 180
aggaaccctc cgaaggtgac ttcagaactg gaggtaggaa atcggcttct caggcgaaag 240
cctcaggttt tctgatctga tccaggtcgg gtgcagactg gggctgaatc cacaaatgtg 300
gagatttagc cacagcctcg gaggcgcgga gcggccacct aagcgtctgc ccttctcgtc 360
tcccggatca ctggggtgtg ttgtttttaa agtgggggat ttgcgtgttg agagacggtt 420
tgtgttcctc gggaggagta agtgacttgg agctggtttg tcaatggctg gacggaagga 480
ggcgccccgg ctgtgtgtga cgggcaggga aggggtgccc agaggggaca ggtaataggg 540
ggttccggag ccacggcggt ttcagaacct tggggcctgt gccgttgaag ccccggtagg 600
g 601
<210> 59
<211> 361
<212> DNA
<213> Homo sapiens
<400> 59
ctcgaggctg aggatggtgg ctatggcttc ggggagcggg gggacgcgga cgtgtaatcg 60
ccagtgtggc ccattttacg gtagggtaga atctgaggga aggcggactg agatgccggt 120
atagcgccga tccctcctcc ctctagtcag ggattaggag cactgcgatg agggaatccc 180
gtctctgctc ccccttggcg ctcacgcgcc tggaatgtga gtggtgcaat cccggcaaag 240
ctccccgaga ccccagtgcc acgcggatga gaccgaaggg gagcggagtt gagccaggcg 300
ccgggctagt ccacaacttg gcatggccga gcacctgggc gctggtcgta ggggacagcg 360
c 361
<210> 60
<211> 601
<212> DNA
<213> Homo sapiens
<400> 60
tcctgaatcc agctttgtgc ttttacacaa cataacagaa atggcatctt tcacaaagcc 60
taactttgac ctccaacact ttaactttgg gtttaaccag tacaccacct tcggaagtta 120
gcacataaaa atacaggtaa gtcaaatgca ctacggatac agaaaggacg aggaacaggt 180
ttaaagggga gttgaagcag aggggcacga aatcacctgg caggtcacct ctccgaagga 240
aaaacatttc aagctccctc ccatccccca ggtaacctct ggcctcagaa ctcactgccc 300
tgcgtggggc agaagttctg ggcgctggag tccgcgtccc ccaggacacg agggtgaccc 360
aagggcgcgc ggagagcggc gggacccgga gcggcgctct ccggggtcac tcccctagga 420
cgctccgcag agctgggagc gctgccccac cccgcccggg ccgcccctgg ggaccccgct 480
cggggctccg cggctcccct gctccgcgcc gcgcccaccc gcccccagga ctcacggtac 540
gctcccgcgc cgctatcttg ccatcccctg ccgccggctc tgtagcctcg gccgccgccc 600
c 601
<210> 61
<211> 301
<212> DNA
<213> Homo sapiens
<400> 61
ccgacctaac cacactccag tctcttctag gtcgtcaccg ctctgcacca aacaaatgag 60
tcctgtttca ccactagggt gccgaggtgg atggtggatg ctggcccccg cccctggcag 120
cgctcagccc ttagaaacca gagccagctg acaacacgcg aaacacacag gcacagcgaa 180
aacgccgagc cgacgctcat tccctctgcc ccctccctct gctctctgta acaaggagga 240
cacgtacaca gcctttacac acttaaaagc ccttgcgact ccctctgaat tcttagttac 300
t 301
<210> 62
<211> 181
<212> DNA
<213> Homo sapiens
<400> 62
tggtttcccc tgcgtgcggg atcgcacagc gcctgtttcc ttgcttccca agggggtggt 60
gtggagggga agggggaatg atttttcttg cgtctcccgg aagctgtgct gttagacaca 120
attacctcag ctaggtcact gagaccaaat catacgggac gcttaatgaa ggaccgcatt 180
c 181
<210> 63
<211> 961
<212> DNA
<213> Homo sapiens
<400> 63
tgcggctcgg tcaggcgcgt gggggaaggg cagggcaagt ggggtgatca tgatcatttt 60
tagcccaggg tcagtagagt agggcacaga agtcagacaa atctgccaga gtttcaggag 120
cgccagctac atggccagat cctgcccggg tggcctcatt tctctgggtc cccgcactcc 180
ttgggaggtc tgatgaaagc ttggggtctt ctccattccc cagaacactg cagagaggag 240
ttttattttg cttacaattc aggagtccgg gcaggcagag cgggcccagg ttaaggacgc 300
cttctagagc tggggatgac aggatttgtc agtggaaaag cgttggcttc tcacggccct 360
agctggtaca gggaaccgcg ggcgggaagc tgggcgggac gcgtggactt gctgagaatg 420
gggatgtgga gggcttggct ctttgcggag tgcgggttgg caagaggcgc ttggagtaga 480
ataaaggcgg cgcagggcca aaaactacct aaagacacag ctcccgcagg cgcgcccaag 540
gtgcggagga aacgctccat gtatggggac aaaatagtgt ctgtccagaa cgtacatctt 600
gggtgctcaa acccgacagt gtgccgtctg agacgccgac gcaagtgaag tcaagcattg 660
gcctgatgtt gggacttttc ctgtccctca tcaaagccac actcccagga cctggggcct 720
ccatgctggg gagagaggtg agccccgcag ggcagcccag gaggcgcgca acgccctgac 780
cccggcttct aggcgccagc cgtcagtaac aggcctgggc tgccacgccg aaatcacgcc 840
tcgagtttct gagccaggga ctactggggg tctggaattg ttagtctagt ctgtggagga 900
tgccttttct taaatgtggg gcgttcaagg cccaggaaac ctcgtccccc cacctcttca 960
c 961
<210> 64
<211> 181
<212> DNA
<213> Homo sapiens
<400> 64
ctccaagccg acgcgccctg ttttatgcct tgagtaggcg ggagccttgc aggtctgtgg 60
gtttctttct caaaggaaaa ttgctgggct cgtgaggaac agcctcgggc acttgctcta 120
cttggaaagg gtgaagagcg cgggctttgg aaccctaggc gcgcccgcaa tcccagctct 180
g 181
<210> 65
<211> 721
<212> DNA
<213> Homo sapiens
<400> 65
aaataagtcg tgaacatttc tgtcttttaa aactgtgact ccttggactc tagccttctc 60
tgggaggccg ggaggctgcg cgcgggacgg attttgcagg cgcacgcgtc ccagcaggtc 120
gcagcccgtg ggtccctcgc tgtccttcct gaaccccgct taggcgagac tctagcgggt 180
gaccctggct ccttccctgt cctctctgcc gtccccttct tgtgcggttt ccatccgttc 240
attcattcgt tcgacctctc attcattccg aacttcctcc tgctgcgtct tctttcgtgt 300
tcaccacact cttctacctc cccgcccctc ccaaccccca cttttcttgc caaatgtcaa 360
tgatttggga cagctcccag ccgtgaatta ataaagaccg aggttctgtt gcaggaaagg 420
gcagacatta gggaacaaat acgttcaatt tcaattccac agtcaacaaa tagtcatttt 480
tggaccgagg ttaatgtgtt caaaacgcgt ccctcaggca cgaccaccgt cttttttttc 540
cctccaaacc tctcaaagta aggttatttc ctaccgggaa aacagagtcc caaatcttgt 600
ccgattaaaa tttctatctc aaaaacaact ctctctcctg ctctctaaaa attcaaaggt 660
ttattgcaaa atgccacatt cacttatttc caacatttaa ggaatttgct gccattagaa 720
a 721
<210> 66
<211> 241
<212> DNA
<213> Homo sapiens
<400> 66
gatctccctc taatggtaga aacttttccc ttttccagct ctttaccaac agcctaatcg 60
cctcattagc atatcaacaa tagtccaatt gctcgccagt accacaatct gccgccggcc 120
gctccgacac aggtataaag gcctctctac gccgcgaact tgcttctaga gcgcactcca 180
gcctgcgaac tgataaaacc ttcctcgagc tccgccgcga ggccctgccc caacaccccc 240
t 241
<210> 67
<211> 440
<212> DNA
<213> Homo sapiens
<400> 67
gagatagagt gagaactccg tctcaaaaaa aaaaaaaaaa aatacctcct tcttctctca 60
aaactctcca atggcttcca ccctgggtca tcaacatggc ctggaagagc cgtactctgg 120
atacccgagg gcgcggcccc agcgccgcga cgccccgccc ctctggctgc tccgctctgg 180
gatgcacttc cgacgccctc taggcttggg agttccgcgc ctctcggtgt cgcctggggg 240
gcgtgctccg gttggcgcac tgattcccag ttgggtaggg gaggcttgac tgagctccca 300
cccggaattt caccttagac ctttaaagac cttgctccgg cctcccgcgc cagcgctaac 360
acctagtcct ctttagtgga gttccggcgg aaggggatgg cgggcacccg acggtggtct 420
cctcccagat ggcgaatttc 440
<210> 68
<211> 721
<212> DNA
<213> Homo sapiens
<400> 68
aataagaaag ttgaggagca aaacgacgtg tctaacgtca cacattgagc taaagacaga 60
tgggatctga catgcattgt cagcacaaat acagcgcttt taaaaatcat acggattttg 120
tgtcgtgagg cactcaggac tcagctgatc tcggcgttca gtcgtgcgtg attttggatt 180
tgcacctcgc ccttgggcaa gtgcagaatc ctggggttat acaaagcaca tcacagttaa 240
cccctttgtc ccagtccgca gaatgagagc tcggagcccg gccatgggtg gctcggttat 300
ataggcagga aaatcaagga acccaggtgt gagcaggggc gtttgtggcg cggagagagc 360
tcctgtcctt gccgtccacc tatttctcag gcttggcccc tggcgtgtag aaaaccgcat 420
ctccggaaaa cccagaaagt tacgtcgccc aggtactctc ttgtcattct ccgggatgta 480
aaagactcag ggtctcttca cggatcactg aaaccgcctt ctccgaggcc tccagggtga 540
ctaaagagag ggtgggtgtt ctgtgttctc ccgccggtgt gttcctcttc atgtccaacc 600
gcttgtgtct gtgcccgcta gggtctcggg ggtttttata ggcacaggat gggggcgtgg 660
cgggccaggg tggtcttggg aaatgcaaca tttgggcgcg gaggaagaag tgcccctcct 720
c 721
<210> 69
<211> 181
<212> DNA
<213> Homo sapiens
<400> 69
tgcattgcat tatactatag cagcaactat acttttaaat gattcgaatc ttgaggtttc 60
aaactgaacc gtcttgtgcc ttttgcccgg cgggcatttc tgcggggacc gcgggtcacc 120
ttctgaattt ttaccttcat aaacagcaag gactgcgctc tttcgcacgg cgccccgttt 180
t 181
<210> 70
<211> 601
<212> DNA
<213> Homo sapiens
<400> 70
cccaccccag ctccttcctc cctctgtcat tggtcacaga acaagtcagt catgatccag 60
attgaaggag aaacctggag caaaatggcc ccagcgcttc cccacctgag agggatcagc 120
tgaggccccg cccccccatc cctgggagaa ccgggctggt cactctgggg tcggggcggg 180
gcacacctgt gcccggagtc tgaggtcact caccggctga ccctggtggt ggtgcgggcc 240
caggaacctc aggcccctca gtaacacatt ccctgcggtc ttcgagaact ttcctcaggg 300
cgcccacagc cctgtgccat cttctccacc cgcgcttcac gctctgattc tcgccgcggc 360
tgtggaagct caggaatcgc gtgtcgccca cgaaggcgcc gcggaggaac tcagggccca 420
cgtggtgaag gcggagcccg gcggccttca agtacccggg gtgcgggcct gggctccggg 480
aacccgcaca ttgcgggcgg gagaggcgca gggtgcctgg gacgccgccc cgctcgcctc 540
tctcctggac gccgtcgccc tgcctccccg cggggacaca gcctccctcc cacgtcccgc 600
c 601
<210> 71
<211> 421
<212> DNA
<213> Homo sapiens
<400> 71
gagttcctct ttgaccagac ggcctatgca ttgggccagc tgagccctag atcattcctc 60
ctttatcaaa gttttaatcc tctctgaggt cccgtgcact cacctcgcag ctctcttggg 120
agcccttcct gactgctgcg tttcctcccg tctgctgggg ccagctccgg gccttggcgt 180
atgccgcctg cttccctttt tataggctcc acctgcctca ctaaacatct ttaagcctct 240
gaaatcagag gccgtgtctt gtgcctctta accctttact gagcccagca cattgtgagt 300
actctaagaa tgtctacgga gtgactgacg aaccaggaag atggaggaga tgggttcctg 360
cactccctgt gctcgcccct ggagagctcc tgtgatatgg aagagaatcc caggctcctg 420
g 421
<210> 72
<211> 421
<212> DNA
<213> Homo sapiens
<400> 72
cgacgaggag ggcggtgctg agcccatagc aagtctgtgg atgccccctg gtggccctaa 60
atagaatggc ttcaatggat ggaaatttaa cgtgctcgca tccccagcac gttaaattac 120
ccagaaaagt aagagaaaaa gaacagacac atcagaaatg tctctggcca aacctttcaa 180
gtacgaatca aggcaagata tggcgatgaa caagcagaga aaagtggact gcaaaggaag 240
cagtaattaa tctgtcagag aagggagggc tccttcctgc ttccggacca tgttggatgt 300
gagtctagat gcgagacatc tattatagag ataatagaag aggttagcgg aaccaaggat 360
ggttcacttt tcttctttag aaataccatt aatgctgatc gtcttcgccg ccgcctgcgt 420
g 421
<210> 73
<211> 181
<212> DNA
<213> Homo sapiens
<400> 73
aggacatgga gcaaattagc atcacacaaa tgacgatgct gcaaatgagc ggtgtacagg 60
gttggcgggt gttgcaggca ggtttcctgt cgttggcgcc acgtgctgca gaaagaggac 120
ccctccccct gcgggccgcc gctgcgcccg tgcatccgtc acaggtacaa ttcgcaccgg 180
a 181
<210> 74
<211> 241
<212> DNA
<213> Homo sapiens
<400> 74
cgtcctaggg gacaggtgtc catcctcact ttcctgatag aagaccgccc ccctagataa 60
gcgggcggcc tccgtgccca tataaggccg gcttgggctc cacgccggcc tcccgcccgc 120
agcccgcctg cctggcaggg cctttgcatt cctcccgcca gctgtctccc cgctaggggc 180
gggggtgtag tttagcccgg ccctccgggc tgggtcgcca gggagtagaa agggagcact 240
c 241
<210> 75
<211> 481
<212> DNA
<213> Homo sapiens
<400> 75
cggcggcggc ggcggcggga ggagacgcag gtcacgcccc cttcccacca cctcccgccg 60
ccgacggggc gcgcgcgccg aggagcccgg gacaggtgac tcctagagga ctgcgtctgc 120
gcctcccccg gcgggagtcc cttcttcgcg gcctctgccg ccccctgcgt cccctcctgg 180
gcttccgaga gtctgactca gccaagccgg catcgcttcg cctcctacaa cacaccccga 240
gcgcgagaag aaattacagg attgcagggg cacggctaat gcgctctaat tacccaccgc 300
cgctgtcatc cgcggcgctc cgcggcgctg ggccaacgcg ccgtaattaa gacgccgctc 360
cccggtcccg gaaccctccc ttcgccaccc tccacccacc cacctcgcgg tccccaggac 420
cactggctgc caactcctgc cgccctctgg gactgcccct cagtcccagg agagctatga 480
g 481
<210> 76
<211> 721
<212> DNA
<213> Homo sapiens
<400> 76
gcgcgtgcac acgtggtggc ttttatttct tcgcacgtgt tcgtggtctt ccttctggag 60
cctctcccct cccccagccc cacttctctc atctctacag cttgaacctt ttccccgagg 120
acacccaatg aactgcccgg tagcttcagg ctcccggggc gagagccagg cagacgcggg 180
acttaggctg cgcggataat tgggagcaat taggtcccaa gatacgtaaa cttcaaccga 240
acggggcgcc cgggagctag ggaatgcaaa gggaggacag gcgcccgtgt gaggcttgag 300
agtatactgg agaggttagg aggtgatggc ggggtaggac ggggagaagt gagggggcat 360
cgagggctag gtcctcagtc ctaggggcgg agtaggggaa gctgctactt ggagagagct 420
gctaggtttt aagcgcgccc ggaaacacgc ctcgccacca cccagccacc accaacggaa 480
aatctgtcag tgcatgtagc ccttcctgcc acggagaagg tggccaaggt ctagaggagg 540
ccagcaggcc aggcgaagca acgctcccgc gctgcagggg gcggggaggc agcggggaac 600
ctggggcgca ggaacgcggg cggaggtgcg atagcagaag cgcaaatggg tcgcctctga 660
cagagatcgg gcagtgggtt aagtccccgt ttgtggcgcg gagtcaaaga gtgtgtgtgt 720
g 721
<210> 77
<211> 1021
<212> DNA
<213> Homo sapiens
<400> 77
gggcccctaa agccactcac ctcgatttct gcggatccaa aggtggaaag acactgtccc 60
gatcaggagc atcgcaaggg tctggagaaa gggccatcca taaatgaaga tcaggactcc 120
gtattctgag actgtttcaa tcacaaataa gactcggaac agcctctgga aggccgacag 180
catttcgcgt ttctggcctg ggaaagtaag ggtgcgctaa ggcacgagta gtacagctcc 240
tcccgccacc gcagagcccg ccggcgggaa gagaccagac accgacggag aagcgaagtt 300
caggacgcga aggaaagggc cacttcgggt cggggtcaac ccagactgga ccaatgcaca 360
gtctaggtgg attaacgcgc caccgcgaga agtgggcacg ggaccacatg cggctggcaa 420
gacgtcccag ggctcaagct ccaggctcgg tcaccaaaca acggtgataa catccacaac 480
gccacgtaaa ccatctttgg gccttgatcg ttttccaata accgactgaa ctgagggcgt 540
gaccaaacga caagaaccgg aggagaggac ccggagaacg gagcagcatc ccgccgcccg 600
cctccaggaa agcccgaggc actgtagcag gagggtctgg gctccgcgcc ttaattacac 660
cgccctggac ccgcctcttc cgccgctcgc tcctctgacc ggcacccgaa ggtgctgtcc 720
cgcccacgga ctcgctcaca ctccgtttct tcgatccttt agacgacttt ttaccgttca 780
gggatgctct ccgttaccgc ctctgccatt tggttgccct ccctgcggtc caagggcctg 840
gaacactccc cagggctgcc aggccagcgc tttccagggg ctccagccta cagcgccgcc 900
acctggggct ggagccagaa acgcaggggc cgggggctca ccggctgcca agtagagggc 960
gtcgaaaatg gggctgggtg tgtaagaatg cttgtgattt ttgcacactg attttgtatc 1020
c 1021
<210> 78
<211> 1176
<212> DNA
<213> Homo sapiens
<400> 78
gatgaaggag ctagatagaa gaaaagatta gcagggttct gtcaaagcga ccaggaggct 60
gaagaaacct cctgtacctt cagctgcccc tgaagccctc cttcctcccc agcccgctct 120
ccatacaaaa taggactaaa tgttaaaagg aatcctgtgc acggggaaga gggaggcgag 180
ctcgggagat gtgggagcac agggtggggc ggctcctgcg aggagctcct ggctgcacag 240
gctccatctg atatgtcagc tcccgcatcc gagagctgat gagagatgga gggagctcag 300
aagaaaaccc tgcgagtgtc gggggagggg aggccttaac attcggatca gattaaccag 360
tgctcaaccg cagtgcccgc gccggcccct ccgctgatcc gcagcatccg aaagccgcag 420
ggcgcggggg cctgtggggc cgggcccggg agctgcgaga ccaggggccg gtgacccccc 480
gcgggggacc gagcgaggat ggggaagtca gcggctttac ctgcgatgga ccaggtccag 540
cggtagaact ctaccgtgtc gttgagtgcc gtggacacta cgtttaggac actacccggc 600
tccgagtcca ggagccccat cgcggcgatg agcgggcgct ggcggcagga gaaagcggag 660
acccagagag agggctgacc ccggaggcgg tggcggccga cggggcgagc ggcggccggg 720
aacccctcta acggcggcgg cccggctgcg tcttctcctg ctcctcaagg cgccgcggcg 780
gcggggatgc ggcagaaggc agggccaagc ggaaggcgtc gtcaaggttc ccgggagaaa 840
gacgaggagg tggaggaggc ccagccgcca gcacagtgcg ctgcaccagt ctgcagcctc 900
gcgcagccgc ccctccaatc tcctcagccg gcgtcacgtg gccgcgcgcg ggggcggggg 960
gccggccgcc cctcctccct ccctccctcc ctagtattgg gactcgctgg cgtagggatg 1020
ctgcgctcaa gggtgcgacg ccaactgggc tcgcgcaggc gcgcgccgtc gagcgggagc 1080
gggacacctg ggctcctcct tggcccctcc ccgcacaagt cgcctcatta gccttccccg 1140
cccctgtccc gggcatcggc ccctgcggag gagttc 1176
<210> 79
<211> 901
<212> DNA
<213> Homo sapiens
<400> 79
cagcccctgc ggtcctcaaa gttggccccc tgggaggggg cggcagggag caggatgaag 60
gatttgttgt aggaggagga ttcacacatc tgggcgaagg gaggggcagc gccgctgctg 120
ggacgcggcg cggacccgca tcattgcgcg cagcagccgc tgcagcagcc gccggggacc 180
gcggagccgg gacgcccccg ctcggcccgc gccccgctcc ccgccccacc cccgcccgcc 240
gggcccagca acgcagggtg cctaggagcc gcgggctgcg cagggaggcg ggcagcggcc 300
ctcgcgcgct tctgccgccc ccggagccgg cgcgcggcga gcgcagggcg agcgcgcgtc 360
gggcggcggc cgcgctgggg ggcgtgaggc gagcggcgcg gagagcggca ggggcgaaac 420
ttcgcgggcc agatgcccga gggcgcggcg gcgctgccag gctgccgctg ctgcccctgc 480
gggccccgag cgcgcctccg caggcggcac tgcccgcggc gcggcgtgtg caccgagcga 540
gtgaaggtat gtgtggcggg cgcggctgga gctgccgccg ccgccgccgc cgcgccagca 600
ggtcctaatg cctgtcactt cccaggacgc tggcagcagc agcagcccgg agcccccgag 660
ccctcggcag gtttgcgtgt ccttccccgc gatctgattg gataaagtgg gggctcgacg 720
gtggccgacg tgggacagtc tggctgtggc aggggtctcg gaaaccatgg gttattgcag 780
tggcaggtgc acgcttatct ttatctgtgg catgcaactg gtaagtgaca cttgggtccc 840
cttattctgt aatgtgtctt tgagatagtg ggcaggggag tgcagcaaag ggtctgccat 900
t 901
<210> 80
<211> 541
<212> DNA
<213> Homo sapiens
<400> 80
actgccgact tctatagatc aaggacttca ttggtgcagc tgaggaaatt cttccaaaca 60
agtctaaatg ttggaaatcc accaaactgc agagaaagac ctcttgcctc cgtattcttt 120
cttcatctgt aaaaatgttg acttctgctt ttcagactac gcgcacagcc tctttatttc 180
ctactgcggc ttcattccct cacggaacac tgacgccatc gcgaaggaag catttcgagc 240
acgactgacg ctccccttat tatttgctaa gccgctgcgc tcgggtctgg ctacgatttg 300
ctttcagaat aacgggaagg tgcaacaaga tcgcttccct agaggcgcgt cgcccgcgtg 360
gcccggaccc cccacgcccg cccgccgccc cgtgggtgcg cacgcgtgtc cgcgcaggct 420
tcccgcctgg cgagtgcaag gctcctctcc gccgtgctgc tttccagcct ctcagcaaat 480
cacgaacacc gaaagaagcc acggcggcga cgggaggggc gtcgcgcgtg cttccctcgg 540
c 541
<210> 81
<211> 301
<212> DNA
<213> Homo sapiens
<400> 81
tggctcaaaa tattcaaaat tttttccaga gtttggcctt ttcttcagca ctgggaattg 60
tgatccaaag cttttcctga tgaggcacaa agttggagaa acaaaacgca aactaagcaa 120
caatgaaaca gaacagagtg aatctgctgt agctcaagag aggacgtagc tgcccccact 180
ccgcatcccc gggctcgggt ttgccttgct gacctctgct gccacctggt gccgcacaga 240
gaaactgagg agaaaccaca tcagtctcct tcagcctcag cttcacatct gtggtgggtc 300
a 301
<210> 82
<211> 541
<212> DNA
<213> Homo sapiens
<400> 82
gggcgggagg gttggggtgt gggtggctcc ctaagtcgac actcgtgcgg ctgcggttcc 60
agccccctcc ccccgccact caggggcggg aagtggcggg tgggagtcac ccaagcgtga 120
ctgcccgagg cccctcctgc cgcggcgagg aagctccata aaagccctgt cgcgacccgc 180
tctctgcacc ccatccgctg gctctcaccc ctcggagacg ctcgcccgac agcatagtac 240
ttgccgccca gccacgcccg cgcgccagcc accgtgagtg ctacgacccg tctgtctagg 300
ggtgggagcg aacggggcgc ccgcgaactt gctagagacg cagcctcccg ctctgtggag 360
ccctggggcc ctgggatgat cgcgctccac tccccagcgg actatgccgg ctccgcgccc 420
cgacgcggac cagccctctt ggcggctaaa ttccacttgt tcctctgctc ccctctgatt 480
gtccacggcc cttctcccgg gcccttcccg ctgggcggtt cttctgagtt accttttagc 540
a 541
<210> 83
<211> 181
<212> DNA
<213> Homo sapiens
<400> 83
gaggacagaa gggggcgctg ccgggccagt gcggaggctg cagccgccca ctgcagaacg 60
cgcccttggt tgggtctggc gagctgcccg cgtagtggag tggtgttagg gctcccaagt 120
agaaagaacc tgttccctac gtaggtgtcg gttgtactta agagcatcat ttggtcgctc 180
g 181
<210> 84
<211> 481
<212> DNA
<213> Homo sapiens
<400> 84
ccaaaaaaga gttcgcggcg gggctctccg agcatgacat tgttgtggga taatttggcg 60
aagggagcag atagcccttt ctggctgaca tttcttgtgc aaaacatgct gaatacgatt 120
agcaatcccc ccgcaccgcg gcgggcgccc gcagccaatc ccgagccaga gtttccgcgc 180
gaccactccc agtttggttt cgtaggcgcg gggccgctct ccgagggcgc cctcagagcc 240
cgcgattgat ataaatatgt aatctgtatt gatgggccag gagacgcacc ccgacacctt 300
ggcccgaagg ccgggagctg tgggggctgc cccaacgtgg ctggtggggg gcctggccat 360
tgggctcgcc ccgcccctac ccggacgtga gccccatacc ggggtccctt agaagggccc 420
ttgggccccg cgcagttaac aagtggggtg tttatggtgc gcgcccagtc tgccttgggt 480
g 481
<210> 85
<211> 181
<212> DNA
<213> Homo sapiens
<400> 85
gaaagcggat ccggttggac tccagatgta ggtagagcag gttgcccaag ggagcgaaga 60
ccgcgtccgg cagcgccccc agggcgttcc cgtccagccg cagcttgact agactctcca 120
ggccctcgaa ggagccgcgg cttaggcggc tgatctcgtt cccgttggcg tagaggatgc 180
g 181
<210> 86
<211> 301
<212> DNA
<213> Homo sapiens
<400> 86
ccactctttc aaattctcat ttgtagctcc cggaactcag aagacagtcg acccccaaaa 60
ctgtccagga agtaatcggt ttccggcttt tggacaatgg tccctcgctt aacgaatgct 120
aacgaatgct cccttagctg ggagctgcag ggaccggtcc cggcaggtct aaccaaccgt 180
ccgcaggcgc cgtggtcgag agcagagccg agacggcggg gcagggtgcc aagcggaggg 240
cacagcctgg cagccaccgt tggcggcagg agagaatggg agaagggaga cccgcttctc 300
a 301
<210> 87
<211> 301
<212> DNA
<213> Homo sapiens
<400> 87
cgggactatt aacctggaac cccaagaggg ggagaaaagc ggacaaggga cacgtttcct 60
gcttcgagat gaaggtcttg ttggctgggt gccctggcct gcccgggcgg acgcgtggga 120
cctgcgtgga tggcgcacgc tgcagccaaa caggctgccc gagggctctt cctgagcgca 180
gttcctccgg tgtttaaaaa caaactcaaa ctaagtgaga gtttctcttt ggaatcgctt 240
cacttgggaa aatgatccag ccttccacca gcaactgtgc actgtcccct ctggtgactg 300
c 301
<210> 88
<211> 181
<212> DNA
<213> Homo sapiens
<400> 88
tccagggacg tgaagctgag cgtacagcgg gcgctcccag acactgggga aagtgcttta 60
cgatgtcccg agtccctcca gtctcgccag cggggcgagc gtgagggtgc cccgaccgac 120
cagcggcccc gggtgcaggg tggcgggccc ggcggcgcgc gtccccctcc ccctcctggc 180
g 181
<210> 89
<211> 181
<212> DNA
<213> Homo sapiens
<400> 89
ctcacctttc ctggggctgc gtccccgcgg gacgccaggt tcccggtttc ttctaggtcg 60
ccctggttcc tggcagctcc tggtgccacg cggtcctcta cggtctcctc tgacctgaga 120
gggacagtga gatggggctg gcggggatgg gggtccccgc gctgttggaa agcagcgggg 180
c 181
<210> 90
<211> 481
<212> DNA
<213> Homo sapiens
<400> 90
gtgctaggga cccgggggag ggcaaggacg taaaggaaag agacccctct tcctcaggat 60
ctgggggttc atttgtagat tctctcaagc ctacaatatg ggttctcccc tcctccgcca 120
ctagtgctcg ccctttcgcg cgcgtggggg acgggcgagg ggacccctcg gcccccaccg 180
cgcaaggggc tgcgcggctg cttgggccac ttgttatttt ttgcgcacag gcttggatat 240
tgggcgttta gtcagtaatt tagctttgga aattggtgaa acgttagact gtgccctggt 300
attgtttaac gtatccaacc taaagggaag tgggacagtt accttgggac ctattgttcg 360
gtacttcggg tcctggaaag cgagatttgg gtgttcagtc tcgaggtctc tgaatcttcc 420
cgctgctgga gagaaatgcg cgctgtggag ttgtctggac atttaggaat gtctctcgaa 480
c 481
<210> 91
<211> 181
<212> DNA
<213> Homo sapiens
<400> 91
ctgcaaactg tgtaagaggg agaggaattc cccgccaagt tgaaaagttg aacctgcctc 60
ccaaactttc tcctgtagtc cagacgggga cgccctgagg gagcgtttgt gtcagtaatg 120
ggaaatctgc aagctagacg gaaatgacct gctagtgatt gcgctgtaaa gaagccggaa 180
t 181
<210> 92
<211> 1321
<212> DNA
<213> Homo sapiens
<400> 92
ctagaaccct aaaaactcct ttggcctcca gaaagacccc ggtgcagctc tctaccctaa 60
cccctaagcc cctctcaagt gagagcctct cagttagtac tcagttgcca cgtctcgcag 120
gaactttgga gcaagttttc agctcccagg tgtccaacct ttaaaaggaa aagcataata 180
atactaacct ttctttcacg accacgcgaa acgcaaagga tgtggagtgg ggaggggagg 240
aaaaaaaaag gggcggccag ccaaatcaaa gcttgggaga cattttgaca gtgcgcttga 300
aataatgctc ttaatttttg gaaggttttc aagaaggggg tggggggcac gtgggagaac 360
cacaactttc tcctgtctgt cactcaagcg gccagagagg gctccaacct ccagctcccg 420
cggcaacaca cagtgggaaa ttgcttcaag atacagtggg gctctattct ttctctaccc 480
ctgccccgcc tttcccgagc agtgaacttc acagagaggg tggtaaggga gggttatcct 540
gggtgtcaaa aatctgtgca tagcctgaga tcagaagagt taaccccagg ccctagaccc 600
agcccagcgg ccaaactggc accccgtgct gatcagcccc cgcatcccca tatctgcatc 660
cccatatcta cctccccagt cgggggtggt gaggtttggg ggaggggggc gacactacca 720
tatgcatcca ccacctaagt ccagcccagg ctggcttcaa tgaaagctgg caaatccggc 780
gaatctcgca gaaattttct tcgaacttaa ttcaatttta aagtggattt ttactattaa 840
aaacgctgcc gagcaacaca ttgaattaat ctgactgtac ggttttaatt acagtgaggg 900
tttctctaca aatctgtaca agacagtggc tggttcttgg aggatctctg cctcctgaat 960
tccattatcg ggcccctggt tccctgcaga cggcagctcg tgggagccag ctgcggtgcg 1020
agcgttcagt cgccctctgc ttctgccggg cctcctggct cctgtccctc ctcccttcct 1080
tcatcccagc cccatggaga gcccaggatt cctgcctgtc atttgagact gctgaactga 1140
tatcctgaaa cgctaccctt gctttttaaa ctcttgggcc ccagactttt gagccccctg 1200
agcatcgttc ttaaagtggc tcgttttgtc tgggagggtg acctcttgtg tagtgttttt 1260
tgaagggttc tcctgcttcg acttagcagc tgttagagtg ggcagcgtga tgcccagtct 1320
g 1321
<210> 93
<211> 421
<212> DNA
<213> Homo sapiens
<400> 93
tatgattttc tagaacagca aaacacagta gtcccaaaaa agagagtaag agagagcagc 60
ccatctaata gagtgtcccg gaggccagcg ccagcgggtg ctgtaaggag cccggcggcg 120
gcaggtggga attgattgag ctggctgcac ttgtgtacca ggatgcagag ttctccaggt 180
agctggacgc tggggactgg ttggaggtcg gagggtgggc atgagggtgg tggctgagcg 240
agcgggacga gccctggggc tcccacaccg ctggagactg cggcgagtta cacgccattg 300
ggtcgctgga gctgggactg tgctccgggg gcatctcccc gtttttcatg atcttcttga 360
tcttggatct tttgttctga aaccagattt tcacctgagt tggggaacaa aggcacacgt 420
t 421
<210> 94
<211> 781
<212> DNA
<213> Homo sapiens
<400> 94
ctccactaac tttattctcg ctccctggac caagcgcatc gctggggcca gggttgtcat 60
ggttcttgtt tccaaggccc cttggaagaa ggaaagggat gagaaaggtg cgctggcggg 120
cgcacccggc ggcggcgagc gcggaggtgc tgcggtacct accatggtat tcttgtcccg 180
gaacgtagta ggtggggttg cccgcaatat gcagggaaat gagcacctcg ccctgctccc 240
catccccttc cagctccccg tggtgggtgc acaggaaaaa gaagggcgaa aagcgggggt 300
aatagccagc cgccgcgcgc gccctcagcg tcgcccccag caacagcgct aggaggaaag 360
tctgccgggc ccagccactg cgctccatgc cgccgccgcc gccgccgccg ccgcgcgccc 420
tacgcgccgc tcgctcattc agttttggag acgccgggac ggaggagcca cgcggagaga 480
aggcgagaag aaggcggacg ggagcggaac gggctcggga gcgggcctgg gagcgggccc 540
ccgccgagaa gttccgcggg agacggcggc tcccaaagtt actttgggcc gcgggagcgc 600
gggaccgggg ctgcgggcgc cgagagcgcg tcgtctgccg cctccgtgcg ccgccgccgc 660
ctctgcgcga cgcccctcgg ccaggcctgg gaaagcgccc gccccgctcc acaccttctt 720
aaagccccgg gcgccgcgtc ccccccgccg ccgccacacg tgtcccggcc gctcccccgc 780
c 781
<210> 95
<211> 181
<212> DNA
<213> Homo sapiens
<400> 95
gggctctgct cttctttaag gagtcccaca gggcctggcc cgcccctgac ctcgcaaccc 60
ttgagattag taacgggatg agtgaggatc cgggtggccc ctgcgtggca gccagtaaga 120
gtctcagcct tcccggttcg ggaaagggga agaatgcagg aggggtagga tttctttcct 180
g 181
<210> 96
<211> 361
<212> DNA
<213> Homo sapiens
<400> 96
ctaattaccc ctcttaatta aagtctttag cagttgtttc attgttttgg caagaaaaca 60
ggagagacgt gcagttagaa acaccagagc ccgagctcac agcggagccg ctgattaaca 120
cttgaagcat ttcaaggacc tggcacccgc cacagtttgg ttttcatcca tgtttcctcc 180
ttgaatggaa gtatattcgt ctataaacat acatacacat gtaaaaacac ggaggctccg 240
tttgccagct gtgtacaagt cagtatgtgc cgtcaggatg caaacaatag atacctgtct 300
atctatgatt gtaatgcgtt tgaggagatg tacattgcat acagctactg gatacgttgt 360
t 361
<210> 97
<211> 1261
<212> DNA
<213> Homo sapiens
<400> 97
atgtttcatg tcctattgtc attctcatcc ggctaggcac ttctcgggga cgctgtgtgg 60
tgttgaggtt ttacagggaa aatgctaacc ttggcgcctc ctgaattatc aactagctac 120
ggggtgccca gatttttctc ccgagttcca gacccagggc accccgaggc ggcgcctggc 180
cgaggagctc cgcactgcgc cttgttaaca gctgggtccg ggcaaactcg cgccacctaa 240
ttctctgccc tctaccggct tgagatgctt attcctcagg gagggcaaga atcgaaacga 300
ttgagaccaa ctatttacaa gtgaggcaac cgggctacag gtgcctcgag ggaaaggagg 360
ctgggtctgc gctcccacac cttgccgacg gctccacgtc cctgtctgcg cccgaggtcc 420
accggtctgt gaagcccact ttccccgcct ccctctcgcg ttgtgccgct tggggcgccc 480
gctaggaccc aaaatgcgga ctggtgggcc gcccatcaag ggttgcccgc ggtagggcgg 540
gggctcccgt gagctgctcc caaaccccac tcgcaggatg ctgccctgac gcccagggcc 600
aacccgggga gccaaggccc ccggtctctg caaggccgac cccagcccgc tggggaccct 660
gcaagcccgc gcgtggctcc cagcacgccg ggcgtccgcg gggcgagctg ctcagggtca 720
ctcggggtcc ctcgccaata caggccgcgc ggagagtgtg aggcgagccc cgggcccgcg 780
cccccacgag cacctacctt ccaggtaccc aaccccagga tgggcatctt ggcgccgttg 840
ttgagcagga gacggcttgc catggctgct gcgctcccca gacccccgcc cagtacggtg 900
cggccttggc cgcggcgcgt acctttaaat agcccgtgag gtcggcagaa agggcgcctg 960
cggttggcgc gccgctgcgc gaaggagcct tctgattggt tgcgctgggg gtgccgcggc 1020
ggccttcccc aagggtcggc ggggatgctt cttccgcctg gtcctagtgg cagcggattc 1080
tttccgcccc caacgctcgc ccgcgccccg cgtggcagaa aggagttcct cagctgctgt 1140
atctggtggg aaagcgaatg ctttagcgaa aataacaggc atcccataaa tacatagact 1200
agaaataagt tttggtttca ttaagagccc agaagaatgc ctttgttgtc caaccccagt 1260
t 1261
<210> 98
<211> 301
<212> DNA
<213> Homo sapiens
<400> 98
ttgcagcctg ttcctgtttt ttaaaagtat ttataaaagc tgaatgtcaa ttttctactt 60
agagttataa atagaagcag atgctctggt ttgttgatca gcacgctgtg ttcttacagg 120
ggaagtcaaa gaatccgaag tgtgcttgga gcatagaact agcgcaagag ggcgctagtg 180
aggcggtgcg gcgcgggcgg ccaggagcta gggtttgaaa acagacttcg gtttgagccc 240
tgaatctgcc acttagaagc tgtgtgccct tgggaagcga taataataca tttaccaaag 300
t 301
<210> 99
<211> 950
<212> DNA
<213> Homo sapiens
<400> 99
actccgcagc cgctctcagc tcagtcctag gtggaaacgc ctgtagcttg caaggtagcg 60
cctgtggctt tctggggaaa aaaagatcaa atgcctccca agacaccagc gacccaaacc 120
ggggatgcag ggagctcgct tggccccttt gaaggccgac tccgcaataa gcagtttttc 180
ctttaaataa ccgtagtgga tttgagagaa ttttccatgg ctgaaaagag aaacaggagc 240
tgtaggcaac atccctaaat ttataataat gcatgtaaac atgctacata ccacatatat 300
gtatatgtgc ataaatatgg atgtggttgg gcacatacct atctagacac cattgacttg 360
cctggtcaaa gaataagact tagacatttc gtgcctggga aatggtgcag tttatcttta 420
aggagactag aaaaataaga gatgaggctc acgttgcacg gatgacatca ctagcttttg 480
gctgcgcgct cggtgttctc gtctgtgggt tttagccaag gctgcagcta cccgcgccgg 540
acgagagagc gcggcagcag cttcctccgg cgcccgcacc cgggcaatgc gatttcccca 600
gtcccctggg cgcagcctgg gctctcgcgc ctcccgggca ccagccgagc ctgcgaggcc 660
tcggagccgc cgcggctaga ggaggaggcg acgaggggaa gccgagtgac ccagcctccc 720
tcccccaccc tctccccatt catctcggcg accaccgcgc gccgggagcc ggatcgtggg 780
acgccgaggc caggacggga ttctctgcac gctgtcgagt gagccggcat ctcggcgccc 840
gggtgggctg cgaagaaaat ggtgcaatct gagagcgact gagcccagct gggcagagca 900
gacggggtgc cagagtgcca agggctcagg tgcctggaga aaggggcgga 950
<210> 100
<211> 344
<212> DNA
<213> Homo sapiens
<400> 100
ggagtgcgga gcgcggtggt gcgagagggc ttggaggggg cgctcaggca gggcgtgggt 60
ttccctcaga ttcaatgatc ctgctgggct cggtggagcg gtcggaactg caggccctcc 120
tgcagcgcca cctgtgtcct gagcgcaggc tgcgcgcagc ccaagagatg gcgcggaagt 180
tgtcggagct gccttacgac gggaaggcgc ggctggctgg ggaggggctc cccggcgcgc 240
ctccaggccg gcccgagtcc ttcgcctttg tggatgagga tgaggacgaa gacctctctg 300
gcaagagcga ggtgaccgcg ccgggaaggg ctagggagtg ggat 344
<210> 101
<211> 421
<212> DNA
<213> Homo sapiens
<400> 101
gggatgacct aaagtccagc tatcaaaatg cgccgcgttt tcagaaaaac tactgccacg 60
atttaaccta aaaagcttca tctgtatttt ctgccacagt ttgcttccgt ttccttcagt 120
cactattccc tggcgaagtc tccacgcgct cccgttcgcc ggggaactta gggtatccgg 180
gcttccctaa attgacaagc gggggccggc gccttcgccc gccttcgctg gccgccgctt 240
ggtttgttct tcttctcctt cggggacttc tccgcccgcg cccgcgcccg cgccccagct 300
ttcgtcccgc tgtgcggaga tgccacccag ctccaccgca ggaccgcgga gcgagaggcg 360
gcagacgcgc tccgggggcc gccggtcaag aggaagatga agggcgcgac gacttcgcgg 420
t 421
<210> 102
<211> 301
<212> DNA
<213> Homo sapiens
<400> 102
ctcgaggcgg tcgggacgct ttgtccccaa agtcccatga gaagggagga gggtggatcg 60
aaagcgccaa aaatcaatca gaaatcgtcc ccgtagtttg tgcgcgtgca aaggttctcg 120
cagctacact gccagaatag aacgtgctcc tccgctttta taccccggaa aaaaggcgtg 180
gtcagttgta ctcccttccc gcagtcactt ccaggcactc aggctgggtc tcccccagca 240
cctccaggag ggcccaggtt gtgtgggtgg gtgcatggac ggacaggaac tggctctttc 300
c 301
<210> 103
<211> 181
<212> DNA
<213> Homo sapiens
<400> 103
ggtgcaggag agcacacgct gactgtgaat aagtgtgtca gttcttaagg tccagcaaca 60
caaagcgaaa agttagtgga ggactacgag cgcgatctcg acagagggcg ctgggtggtc 120
agtggctcca gcaaccacgc ggctggggtg cgccgggaag ggagctggat gttttagcct 180
c 181
<210> 104
<211> 181
<212> DNA
<213> Homo sapiens
<400> 104
gggcctggga ggctgcgcct tcttcccgcg aatcccgaaa actgcgcggc aaaggcgggt 60
tccgcagaag tcgcgcgtga cccggggcgc cgccctcctc ggggcccatt cggatctgcc 120
gcccgtcctc tccagagcgc cccctggcgc cctctaggcc atcttgattc caccgccgca 180
g 181
<210> 105
<211> 1921
<212> DNA
<213> Homo sapiens
<400> 105
cgtgtcctgc cctcctccct ccagcgctgc cccaagtgcc cggccgcccc ctcggacctc 60
cttttccagg ggcttttccg tgttccccgt attcacacga cttctctgcc tgtggatgtc 120
tcatgaccct ctagagcagc gactttttcc tccctcattc cttccactcc cctcgggcat 180
ctaagtagca ggaacctgac tgtccaaagt tgatttggga gcagccggct gcccttctaa 240
aatgatctag gaaaggtgcc agtaacataa gccgccgcct gctgaaactg gcgcttcctc 300
agccactcgc tgcggccagc gtgaaagggg aggggaaagg ggcattcctg gcacggtcag 360
gtgtctacgg acagcaatct tagttaattc tcaaaacccc ggaagatcca gaaatggggt 420
gctgacaggg acctaacctg tccaccaccc ctcggtcggt gggactgaaa cccatgtctt 480
tgagctgctt taccagttta tttccaaaaa gtcctcctac acctgggaag ggacatagaa 540
agctgatccc attgccagcc ggatttcttt acttaactct caaccgtggt aaatctaatt 600
cgcttacgac ctctttccga gagctgggaa tctgcagaga tgctctgttt tctgctgtac 660
taatctcagg cttcccaaag cgagtgcctc gcccagctcc taggggaatc cacggagccc 720
caggcgcagg gcaaaggatg gggcgggatg gggacatcgt acctgcgctc cgggagccgc 780
tgggagtccg gccggccccg gccgcgggga ggaaaagcaa cggcttgggc tccttatccg 840
tgacgcgcgc tcccctgcgc ccccggggcc tcccgtgggc tccgtgcggg gacaaagcca 900
gcgccagcag gaagagtgcg ggcaaagggg cgccgggctt aaggggccgc atgttcgcaa 960
gccgggagga gagagcggga gactccggga ggatcccgac gcaggtccgg agggtgcgcg 1020
gcccaagaga aggccagcgg gaccacagcg cggctacgcg gccggccgca gtcttcaccg 1080
cgcgcctgcc cttgtctacg tcccgggggt cggctggagc tgcactggga ctcggtcctc 1140
agtgtgccga agcctaagcg ctgcggggcg cggggcggga acgggaggcg gtgcctgggg 1200
ccacggggtc gtcccccagg atgagggcgt gtcccagcgc gcgggaccct cggaagtccg 1260
cgctgggccg ggcgggcacc agcctcggac tcagcgggtc tcagggctcc ctgcgcaacg 1320
cctgcctcgg atccggaccc cgggctcgct ctctggtcgc cgtccccggg aggacccagt 1380
agggtaactg ccgcgtcgcc ccggcggttc tccctgggct ctgtctcccg ccgcctccac 1440
cccccgagcc tcggggtccg tcacggcttc ccctggctgg cggggtcagt agaacccgcg 1500
gcgcctaggt ccggacggaa aaaagcaggg ccggggtgcg gcctggatga gcggagatct 1560
ccgcgccttg ggctcaaagg tgcggggtgc gctctgctgc cgagcccctg ctcgctcagg 1620
aacactggcc acgccgtcac gccagccgcc cctgccccag gtctggaggc ccgacctgct 1680
ctcctaggcg cagcaccgcg ttctcttccg cgtgggggag cggcgggcgg aagaggtctg 1740
gggctgggca ccggggacac gcgcccagct cccctggcct ccctgggggg agtggccggt 1800
ttcagtgctt ccccaggtga aatcgccaag gttgaccagt gcgcccaaaa aagcagccgg 1860
ctggattttt cttcaaatta gggaactctt ataaagagtt ttagtgttaa caacttaaaa 1920
a 1921
<210> 106
<211> 361
<212> DNA
<213> Homo sapiens
<400> 106
ccctgtgtga accaacgggc gggcaaggcg ctgcagggag ggactccaaa gacacacgcg 60
cgcagccctc ctcccgcccg cagcccttca gctgctacag tggccacagc tattccgagg 120
tctattccgg cctcgccgcc gtggcgaggc ttgcgcatgc gcactgggcg cctgaataat 180
ggctcaggcg ccggccctgc ctgcgttgcc cgcaggccgg agtcccccac cctgctgcgg 240
gtttatcgct ccagctcatg ctcatactcc tttgtaccat gggattttac ttacaaaaca 300
agttcaacga taaaataatt aagaatttta ggagtgcagg ggccgggcgc ggtggctcac 360
g 361
<210> 107
<211> 541
<212> DNA
<213> Homo sapiens
<400> 107
ataccccata aatactgatt ggctattacg cgcataacgt gagatcaaaa ggagttccta 60
caaagaccct taaatcctcc agacttctta agcttaggaa agatttttgc ttggttttcg 120
gttttctttt tcttattttg agcagcagac cagcgtgact ccacagtttc aaagagcaag 180
cgtctatatt tgtgtgaccc ggggccgagc tggggaaggg gaagcagagc agcgctgacg 240
cagtcaggtc cctggtgcag gtgccagctc cccacagcgc gccgaactcc ccagtatgag 300
cgaacctcaa gtcactgccc tcgcgcttgt cgagcgaact ctcaaggctt gcaggtcgtc 360
tccaggagtc agagaggtcc ggactccggg gattcctgct ccgcggagaa ctggggagcc 420
cccgttcctg tgccactctc aggtggggtg actttgggct ctgggaagga gagctgtgtc 480
cgtgtcacga gggggccccg gcaggtggcg agcagcaccg aagcgcgggc caggacgctc 540
g 541
<210> 108
<211> 181
<212> DNA
<213> Homo sapiens
<400> 108
aataattaca gtcagtttca cttaaggggg agatcagccc ggtgctcttc ggccgccccg 60
ggaggaaaag ggcggggagt gggggcaggt cggccgggca gtccagcttg cccggcccag 120
ggcctgacca ccccggctcc ccatctggct ggtgcatggc gcggggaagg gggcgcgcca 180
g 181
<210> 109
<211> 751
<212> DNA
<213> Homo sapiens
<400> 109
gaatgttgtt ccttaagaga ggattagagt ttttccttcc cccttttcct gcctatgaca 60
tggtgatgaa atgtgaagag ctggaaatca caaagcccac cgaggtggct gcgggtctgc 120
ctccgaagtt atcagtgtaa tcgggcctct gtgtatgcct gcacgtgtat tttcatgatt 180
ggaagattag gagcacggat ttgttcctgc aagtctcctc ttttgttgtc atgagagtgt 240
tatgttaacg cttgtgataa cgataagaca gaaactattg aaaagggtgc agtggtggtg 300
tgaaggatta atcctttgct tgcttcacat ctgaacagga atctccacac aaatgtccca 360
catgtggaag aacctttaat cagagaagta atctgaaaac tcaccttctc acccatacag 420
acatcaagcc ctacagctgc gagcagtgcg gcaaagtgtt caggcgaaac tgtgatctgc 480
ggcggcacag cctgactcac accccgcggc aggacttcta gagaagccca ggatctgtcc 540
cgtgccgccg ctgctcccct ccccagacac ctctccacgt ctcctaccca gggggtcgca 600
tccctagccc ttcactgacc ccagctcttc ccttgctgca gccgcacctg cagctccagg 660
gagttaactc ttcttctggg ggactgagaa ctgtagaaag ccacacacta ctacatccct 720
tcacaaagag tatatgctag tttcttgtag a 751
<210> 110
<211> 452
<212> DNA
<213> Homo sapiens
<400> 110
tgacaggccg agcgactgca gtaggagggg gcgggcccgg ctctcggtcc gcccccacgc 60
cgggctcggg gtgggggctc ggggcctatt acgggatgga agctccgggt gtcgcggggg 120
cgggaggaat taagggaggg agagaggcgc gcgggtgaaa ggcgcattga tgcagcctgc 180
ggcggcctcg gagcgcggcg gagccagacg ctgaccacgt tcctctcctc ggtctcctcc 240
gcctccagct ccgcgctgcc cggcagccgg gagccatgcg accccagggc cccgccgcct 300
ccccgcagcg gctccgcggc ctcctgctgc tcctgctgct gcagctgccc gcgccgtcga 360
gcgcctctga gatccccaag gggaagcaaa aggcgcagct ccggcagagg gaggtggtgg 420
acctggtgag tccgagggag ccgagccggg ac 452
<210> 111
<211> 301
<212> DNA
<213> Homo sapiens
<400> 111
tcagaggatt gtaaaccact taagaaaagg aaacagaact tggggaggcg gtggcggcga 60
gagtaaacaa ctcccagggg gcccgtctgc agcgcctagg ggaggggaga ggccgggagc 120
cgcctccggg ggtctcgcgg ggccgccgct gggacagatg agtcggagac aggccaagcc 180
ggaacctcgc tgggtaagga acaggaccgg agcgcgctcc gggtgggaga ggcttgcgct 240
cctgcagccc cttcccaggg cctgcgctga ctcatggcgc gcactggagc ccctgcagtc 300
g 301
<210> 112
<211> 531
<212> DNA
<213> Homo sapiens
<400> 112
atgagctaca gggaagatgg ttaggaggac agagagaaga acaacgacga caaaaaaaaa 60
atgcatgtca gataagaaat acgtcctaaa gagacaagtt tagatgagga ggtggggcgg 120
cgaacatgag tgcggaccgc acgacttagc cctgagcgcc cgattggcgc ccggctcgcc 180
gagctcccag cgcgtctcgc tccggctccc cgcgcctcca gggtacagaa aacagagtgt 240
tttgtagagc tccagggtcc taaaggtggg gactggggac ccgcaaaagc tggggtggag 300
agcacagccc tgaccatctg agcccccgga gccagggcgt gagtgagcgc ctccacacgc 360
cacccctgaa gcccaccacg cacctttggc agagagggac ccacctcgct tactgcgtct 420
ccatcggttg ccttggcagt ggctgtaatc catgcagttc agaatgatga gggcaaagga 480
gaaaaggcga aactgcatct gggcggtcgg gcgggggaga gacgcctctc a 531
<210> 113
<211> 181
<212> DNA
<213> Homo sapiens
<400> 113
ggaatcccag atggggccca gacagtggca aaagagggag gaagagaggg agaaagggag 60
cagcggctgc tactgcaaac agttcccctt cgcagctctg cgctcagctc gcccatcagt 120
gtgccactgc ctctccgtcc tcctcctcgg agctgggcgc aggggggcgc ccgggaggcg 180
g 181
<210> 114
<211> 301
<212> DNA
<213> Homo sapiens
<400> 114
cggtaattac gagaaaatac ccagtctcgc catcagtttt gctaaccggt acttgaaaat 60
gggaaacggg gaacttatcc aacctccaat ttgtcacagt tgtatagctt tcgtattaat 120
tctgtacaga cgtgaaatag gtgggtacgt agcaacgtgc tgggcataaa ttaagcaaca 180
atggccacgc gaggtctcgt ccgccgcgga gctccagtgg tgggcactgc caccttgcca 240
tccctagccc ccaccgccct tcgcagagtc cagtccggga ggctgacggt gcgctggctt 300
t 301
<210> 115
<211> 541
<212> DNA
<213> Homo sapiens
<400> 115
caggacacct ggatgacaac caggtccctg ctctggaaac cgttaggagt agaggattct 60
cagagggggt ggaggcaggg tgtgcgtact ccaggtggct tattaccgcg gggccggggc 120
cgtggtaatt tgggaaacca tagtcaatat agctattgtt ttcaaatagc agactaggga 180
aactgaccct ggacaatgtc ttcctggcag gcgggaacac gcagaatttg gagtgaaacg 240
gaaaggggca tggggtcgcc aaggtggtga aacgccgcat taaggcgctt caagatagct 300
ggagttttgc ttgggaaact cagagggatc tcgcccggcc ggcacaatgg cgtttctgaa 360
cccatgccca gcccactggg ggcagtcctt gctgcttgca gaggccagac gcttcttgca 420
acttctaagc ggcgagagct gccaccttgc caatgactca accgtttgcc tatgccctct 480
gggctgtgcc accagccgca gccgccctgc tcccccaccc acccttctcc ccaggctccg 540
c 541
<210> 116
<211> 721
<212> DNA
<213> Homo sapiens
<400> 116
attcactttc aaccctccag gggaggaggg ggtgcgggtg gggaggggag acggctccca 60
gctccacctc gcgcgcggcg cggccagtgc actcggctcc gggagaggcg agcagcgccg 120
gtgagccccg cagcagcgca cccggccgcg gagccccgcg atggagtgag tatccccgag 180
ccgcgccgcc agctgctctc ctctcggcat gttgccatgg tgaccgcggc ggcaggcaga 240
tcccgctcgg gtccgcgtcc aggatgggtg tttaatttca gccccgtgtg tacgcctggt 300
gtttctatag cagccgccgc ggcggcagga ggcaaggggt gggagccccg ggtggcgtgg 360
tttttgcggc tgccccttgg ctagcagggc ctggggggcg agtgagggga gtagatgatg 420
ttgctaagga cggaggcata ttctaggctt tcctatctct gccccaagct tccgcttatc 480
ggggagttgg ccgcaatagc catgacttcc gattcctaac catgtcagca ttattggact 540
gcagttaaaa aaagagggag ggggtcactg cggatcggaa gcaaacgcgg ttcagtgtga 600
agcgtgtaat ggaaggatga gttagtgggt aatatgagcc agggctgcaa tgtcctggct 660
actagaaacc atcagaagac ccaaaagaat tgatttgttc ctggggtatt ggagaaataa 720
g 721
<210> 117
<211> 630
<212> DNA
<213> Homo sapiens
<400> 117
aagagctgag ctgggtctgc tggtcctcgg actgtccttg gctcctctcc ttgctcttac 60
gcagctggca taaggggcca ctccttcaat agggaccacc ccccggcgcc gtcgctgcct 120
cctggcctgc tgcccatgcc tgcatcgtct ctgagacccc ttagcaacca aggacactaa 180
ctctccaggt gcagacgacg acaccccagg cacagagatg gacccgccta cccaagttca 240
caagagatca gaatcagagc taggactgga atctagcatc ctgaggcttg acgaaatcct 300
ccttaaatcc acccttgccc tggaggccgg gatcccctaa gccaagagaa aagcggtgca 360
gctccagcag ctgcaacttc ctggctgggc tggtccggct gcctggactg tcccggagag 420
tctgtgactg gcccgtccag aaggaaagcg gcctcccggg ccctcctccg ttccaatccc 480
ttacctctct cgggctccac caccgtcctg ccgacccagt ttcaggggac ctgcctgtga 540
attctttgtt ccaaacccag ggagccccct gtctccattg cgccctggcc cacctccagg 600
ccgttctgcc agcccaagct gctgctcaca 630
<210> 118
<211> 181
<212> DNA
<213> Homo sapiens
<400> 118
cggggggccc tgaccccctg ccttactctc cgggcccgcc gcagtagcag tagcattgct 60
gctggttggt gcgatggggc gagtcccact cgagctcctc gggctggtag gacagcacca 120
tcttcacggc ctgcagcgtc ctggcgatgg cgcccttctt cagcgcgccg cctttctggg 180
g 181
<210> 119
<211> 481
<212> DNA
<213> Homo sapiens
<400> 119
ggaggacaga agatgttaca ctttactcag ggaacagagg cgggcaactg gccctgtgac 60
tgcagccaac agctttaaga acacagtcct ttctgcttca aggttaggga gacgttctcg 120
cctctttctt ctttgcagtt attattcaag aggcttcccc cgaccccagt ccccagcacc 180
atcctcagag cttcagacca tacattgaca gtgagcaaag ggggccccag gcaggcgggt 240
ctggggccaa ggagggcggc tcccctgcgc ggatccttcc ctggtggctc ccaaatccgg 300
cgttttctct gccgcctctc cctcggggga gactcggaaa ggctgcaaaa atctgggcgc 360
ccgttcgctc gcttgtcaag aagcaaactg tcttcacatt ctccaagagc aacatccctg 420
cctaggaaga ggaaggaaga ggcaaaataa ataaaaccag ttaatgttgt agttaacttg 480
c 481
<210> 120
<211> 181
<212> DNA
<213> Homo sapiens
<400> 120
ctcagtcact tgcacaacgc atatcgctag taagcgttgc tggtgggatc acactcagca 60
cttcataggc aaagaaaatc ccaggagtgc cgaggaaacg ctgtcaagat gtcaaaaata 120
cgcggtaaga cgtcagcccg gtgagcatcc tccgcactgc ggaccgcccg gggtcggggt 180
c 181
<210> 121
<211> 301
<212> DNA
<213> Homo sapiens
<400> 121
cctcaatgtc cacagtcact cgccactgcc tgggtctcta ccctcggcca cctcactgac 60
ttacttcttg atggcaaaca cagttaaccc aatggtggtg ttctggagcc tgaactgctc 120
gttgaggatg tcgatgttga atgtgccctc ccagacaatg ggagccagcc aaggggtacc 180
acgaggacat ccttcctact gcacatggag agaggcgtgc ggtcacatgg agctggcagg 240
gtgccaccca catgcgcctc tggcacacgg ccgcccccac ctggaaactc cactcagctt 300
c 301
<210> 122
<211> 332
<212> DNA
<213> Homo sapiens
<400> 122
taccgccctg cgcagccagg ctggctggca ggctgcagcg ggaagcgcct gtgggtcctc 60
ggcgctgact gcagagctgg gtggaggcag cggaaccaaa actgctgtgt cactgcacgc 120
tgcagctgtt gccagggtga ccgggtgagt ttcccacgct tgcccgggcg gcagcgtgcg 180
ggccggcggg tggggcggag gggtgtgcag agaggccagt ggtgtcgtgc cacccgatgc 240
ccgggggtgt ccactcccct ctcctgggtc acgtgaccag ggcccctgcc ctgcggtgtt 300
gtggggtgta tgtgtggttc ttgggggggt cc 332
<210> 123
<211> 361
<212> DNA
<213> Homo sapiens
<400> 123
tggcaacgca gccgcctcag ggcagtgtga cttcctgatg gtggtgactc aggacaacaa 60
aagcgagagg ccctgagagt caggcgggca ccacagggcc ttgctgaggc agccggggac 120
tcccgctccc tctgctgaca ccattggtgg ccagtgagtc agaggcagag gtgccagaga 180
ccccgcccga agggaggaga tctgagagcc tgcagccaca ggctcctcca ggactcgagc 240
accggggccg cacagagagc cctttctctc ctgggcaggc caggcgggga tcccccagcg 300
ccctaacctg ctctgtgacc acggcaatgt ggccttgggg atgtgccctg cctctctggg 360
t 361
<210> 124
<211> 181
<212> DNA
<213> Homo sapiens
<400> 124
ccgtggtgga gttcaagcgg aaggaggtgc ttgtccgcgc gtgctgtggt ctacccagtg 60
tctgtctccg gccacagttc gtttctcggt cggtttagtg tccgtgtagc cacccaaccg 120
tgtggccgac cattcgcgct ttcatttgtc cttcgcctcc gtctgcgccg tctgtcctag 180
g 181
<210> 125
<211> 241
<212> DNA
<213> Homo sapiens
<400> 125
gttccgtcac acgcatttag agccagaagc agcatggcaa atcatcattt taaagctgag 60
gaaaccacta gcctgcaaga tgacatgact caggcagtca tgccaccaag ataggaacgg 120
atatcggtca ccatggcagc caaaattgct gggtcctgtc caaccagcaa gtacagagga 180
acttgaggga aacatggatt tagggcaaat caagctgtgg tttgtgggcc tatctccttt 240
g 241
<210> 126
<211> 181
<212> DNA
<213> Homo sapiens
<400> 126
agggtgaggt gcggtgaata gccgtatccg gaaaccgagc gtgccccggg cttctttccc 60
gccgccagac cccgcacagc cgccctggga cgtttttcga ggcttgggac ctaagacggg 120
tccccggacc ctgctgggaa accagggggc gtttttcgtc cctctctgag gccattatcc 180
a 181
<210> 127
<211> 181
<212> DNA
<213> Homo sapiens
<400> 127
gggagggggc gcagagggtc gcgggggagc cggcagtgac cgcgcctggg gtgtgtctta 60
cagactcgag ttgccgcgtc gggctgggcg cgccgccggg tcccatggag ctggaggggc 120
agtggtggcg aggacagctg gccgccgata ttcaccaagc gcttcgctac aaggtaactc 180
c 181
<210> 128
<211> 481
<212> DNA
<213> Homo sapiens
<400> 128
cggcctggct gccccatcaa agcctccaag tgcccccacg gggtcgagga ggactcaggg 60
ttcccctgga atgcctgaag ccggcttgcc tcaggcagcc tgaagggaag accacacctc 120
gtccagcata aggcggctag cagctacgcc gcgcgcgggg ctggctcccg gagctctctg 180
ccacccagcg ctgtgcccgg gaactcggct tcccagggga ggaagagcca gcccgcgggg 240
ctcttcccca gcctggaagc gtaggcactc ggccgaggcc agtggcttcc caggcccggg 300
tctcagcctg gctgactggg agactctccc gatagcccgg cacatccctc ctcacccgct 360
ccgccccctc caggccccag aggccccctc ccctgacagc tgacctccag tgcgccccca 420
acactttctc tgccagctgc tggctgtcgc ccccacacat cagctcccac ctctccgcca 480
c 481
<210> 129
<211> 1561
<212> DNA
<213> Homo sapiens
<400> 129
gaggccatgc tgcaaaccca gacttttcag gctgcatctc agatataccg aagtgtgtac 60
ccgctacgca cagtgcggtg atgcctggcc acctccagcc tccagcgggg acctcctgcc 120
caggtggagt ctgaatgccc accgccacca gcccacgcgc gcagtgggcg tacacgtggt 180
gacctgcctg cggctgggtt cccagctccg gctcctcctc cctccagctc tcgctcggct 240
tcctgcagta tcacgtgcag ctgcgctggg tgcaggatgg cggcggccgc ggcggcggca 300
gcagcggtgg gtgtcaggct ccgggactgc tgcagccgag gcgctgtgct cctgctcttc 360
ttttccctgt ctcctcggcc cccggccgcc gccgcctggc tgctgggcct gcggcccgag 420
gacactgctg gaggccgcgt gtccctggag gggggcaccc tgcgcgccgc cgaaggcacc 480
agcttcctcc tgcgtgtcta tttccagcca ggaccgccgg ccaccgccgc accggtgccc 540
tcaccgaccc tcaactcggg ggagaatggc accggcgact gggctccgcg gctcgtgttc 600
atcgaggagc ccccgggcgg tggcggcgtg gcccccagcg cggtccccac tcgccccccg 660
ggaccgcagc gctgcaggga gcagagcgac tgggcatcgg acgtggaagt cctggggccc 720
ttgcgtcccg ggggcgtggc aggctcggcc ctggtccagg tgcgagtgcg ggagctgcgc 780
aagggcgaag cggagcgggg cggcgcgggc ggtggcggga agctcttttc actctgcgcc 840
tgggatgggc gcgcgtggca ccaccacggc gccgccggcg gcttcctgct gcgcgttcgc 900
ccgcggttgt acggcccagg cggggacctg ctgccccctg cgtggctgcg ggcgctcggg 960
gcgctcctgc tgctagcctt gtcggccctg ttcagcggcc tgcgcctgag cctgctgtcg 1020
ctggacccgg tggagttacg ggtgctgcgg aacagcggct cggccgccga gcaggagcag 1080
gcgcgccgcg tgcaggccgt tcgcggcagg gggacccatc tgctctgcac cctactcctg 1140
ggccaagccg gagccaacgc ggccctggct ggctggctgt acacctcgct gccgccgggc 1200
ttcgggggca ccggggaaga ctacagcgaa gaggggatcc acttcccgtg gctgccggcg 1260
ctcgtgtgca ccggcgcggt attcctgggc gccgaaatct gcccctactc agtgtgttcg 1320
cggcacgggc tggccatcgc ctcgcacagc gtgtgcctga cccggcttct gatggcagcc 1380
gccttccccg tgtgctaccc gctgggccgc ctgctggact gggcgctgcg ccaggagata 1440
agcaccttct acacgcggga gaagttgctg gagacgttgc gggccgcaga cccctacagt 1500
gacctggtga aggaggagct caacatcata cagggtgccc tggagctgcg caccaaagtt 1560
g 1561
<210> 130
<211> 541
<212> DNA
<213> Homo sapiens
<400> 130
cggccgagcg cgccgccctg gccaaggcgc tcaaaatgac cgatgcgcag gtcaaaacct 60
ggttccagaa ccggcggaca aagtggaggt gagcaagcgg ggcgggccgg ccgcccgcga 120
gcggcgcggt ctcaggcagc tctcggttca ttggcctctc gtggggcgca catacttttt 180
ccgctcgcgg tttctgatcc tttcggagga gcgagctccc gctaggcttg cggggagctg 240
gaagcaaccg aggccgatag ctgggatggg gctgaagagc cctggctctg ttttaccgga 300
ggcttcaggg ctttctggtt ggcacactct ctgccggtgt agacgcggca ggtctattcc 360
gccgcttggg caaacaggcg ggttagtgca ctccacgcag tccaggctcc agggatctgt 420
gagtcctggg gagctttttg tttgcgcaaa ctcttgctta tggaatcctg ctctgtcctg 480
gagactggat gcagaacagc ccgcaccttg ttgcagcgct ccagccgggc tcccggcaga 540
g 541
<210> 131
<211> 541
<212> DNA
<213> Homo sapiens
<400> 131
catgtgcgtg ttttccaggg gccgctgaca cggggatgga ggtgagggct ggagaggtct 60
gaagagggtt cctaaagtcc aagggggtgt ctgttgggtt caacccgaga cgctgaacgc 120
aagcaaataa ataaataaac ggtactttcc gagcgtcgcg agcggagcct gcagctgcct 180
ggagtccgag ccctcggtgg cggcggcggc agctccctag ccagccctgg cgccgaaaga 240
gccccttctc ccgggaagtt ggcctccccc tcctcgcgtc agccagcgag ctcgctcagc 300
cgccggccct ccccactccg atcgccaatc cctagcccca gtcgccgccc tccttctccc 360
cgggactcgt ctccctccag aggccgccaa gccaggggga accgatgtcc cgactggggc 420
tgaaacccgg ttcctgcgcc cctaccccct acccgccgcg cgtcctcggc tccctcctgg 480
gcgtccgctc ctctcacact ctcgcccggt gcccaggact cgggcgcttc cgcaccccag 540
c 541
<210> 132
<211> 410
<212> DNA
<213> Homo sapiens
<400> 132
gccgggagaa cagagaccag gacggcctca gcgcggaagc cctgtccagg gcccgaacgt 60
gggtgcgggc tgggggcgca gcggcagaaa cgcggcctta gacgcgcgcg gggggccggt 120
gtcccccccg cccccacggc accgggagcc gctcgctcat ccatcccgca gaccgggcgg 180
tgagatgact ccgagccccg cgcacggcgg ccgcgagcaa acgctccgac gtctgtggtg 240
acgtctcgta ttgatttagg gacacggggc ggctgtggct gtggcccacg gctcgtgggg 300
agcccgagtc tgtgcgcagg gaacgccgct gcgtggcctc tctcgggcct gtgccgcgga 360
ggaaggcggc gcccggggtt cggggccggg gtctcacgtc cgccccctcg 410
<210> 133
<211> 541
<212> DNA
<213> Homo sapiens
<400> 133
gtggtgtcgc cgcgcaggtc cagggtggcg cgtggctgct gagcccccgc ctgtgcgacg 60
ccctcatggc catggacgtc atgctgtgca ccgcctccat cttcaacctg tgcgccatca 120
gcgtggacag gtgcgccgcc ctccccgccc gcgccccggc gcccccgcgc cccgcccgcc 180
gccctcaccg cggcctgtgc gctgtccggc gccccctcgg cgctccccgc aggttcgtgg 240
ccgtggccgt gccgctgcgc tacaaccggc agggtgggag ccgccggcag ctgctgctca 300
tcggcgccac gtggctgctg tccgcggcgg tggcggcgcc cgtactgtgc ggcctcaacg 360
acgtgcgcgg ccgcgacccc gccgtgtgcc gcctggagga ccgcgactac gtggtctact 420
cgtccgtgtg ctccttcttc ctaccctgcc cgctcatgct gctgctctac tgggccacgt 480
tccgcggcct gcagcgctgg gaggtggcac gtcgcgccaa gctgcacggc cgcgcgcccc 540
g 541
<210> 134
<211> 481
<212> DNA
<213> Homo sapiens
<400> 134
aaatgttccc cttcccttga cgctatagct tagatgggag ggagccactg ctgaggaaac 60
acctccttaa cccaaagaca gagggttccc caggcggggg tgtgggaact cggaggtggg 120
ggtgagggaa ggccaacctc cacgcttcgg cccggaggtt cccccgcctc ttcctgcacg 180
actggattcc ttctccatcc gcgcctccgg cccggtccct gccccgccaa atccgcgcat 240
cggtttccca tcccatagcg cagataggta gggcaggtac acagggaggt gttcgaatga 300
tccccgtttc acagaagacg aaactgaggc tgggaggcct ggggactggc ccggctgcag 360
cgccgccgtt agccgaaggt gggagccggc gcggtcacgc gcatggagcg tggatcgcga 420
cgatttcggg ggagggggca agggcgctcc gcaggccctg agccggccgg ggggtggggt 480
c 481
<210> 135
<211> 241
<212> DNA
<213> Homo sapiens
<400> 135
taagtttatc gcgccaacgg taagatgtcg ctctggacgc gtgcacctgc tctcgcaatc 60
accgactgcg gtcagcatct tccttagagc agcgccccgg gccacttgga tcccggtctc 120
aatttactaa gcgaacccag aggatgcccc gagtcctgga ccgcagagcc gctcgcgaga 180
ggcaccgggg ctgtaaccgc gcaacctcgt gccgcgggcg gaggcgaggg aggattcccc 240
g 241
<210> 136
<211> 481
<212> DNA
<213> Homo sapiens
<400> 136
tcgaggctga gctctgtgcc gagcccactg tattttcacc ggaaaatgcg agactttcat 60
ttctacctct cgaatgccca gtctttgagt cctgcagccc ccgggtcgcc cgggtcccgg 120
agccggcggg tgtgaacggg gccaaagccc tccaggccgg gcgtgtcagc cccgcccccg 180
aggctctttg catattcatg accttggcgg gcatgcgcac cgcggcggcg gcggcggcgg 240
ggctcccggg ccgccaggcg accgggcggg ccggcgtcga ccttccccga cccaggcatc 300
ctcaaccgcg gcctcctcct cccttgtctt gatggaaagg gcttggcgtc ccccccactc 360
ccaaccacct gagagcctcg cgctggaagg actttggtaa ttatttgttt cagttgagct 420
gttttcagtc taggctaggc tgagtcttgt aatgagtatg gatttgccag taaataagtc 480
c 481
<210> 137
<211> 478
<212> DNA
<213> Homo sapiens
<400> 137
ccggcagggc tcctcgccca cctcgagacc cgggacgggg gcctagggga cccaggacgt 60
ccccagtgcc gttagcggct ttcagggggc ccggagcgcc tcggggaggg atgggacccc 120
gggggcgggg agggggggca gactgcgctc accgcgcctt ggcatcctcc cccgggctcc 180
agcaaacttt tctttgttcg ctgcagtgcc gccctacacc gtggtctatt tcccagttcg 240
aggtaggagc atgtgtctgg cagggaaggg aggcaggggc tggggctgca gcccacagcc 300
cctcgcccac ccggagagat ccgaaccccc ttatccctcc gtcgtgtggc ttttaccccg 360
ggcctccttc ctgttccccg cctctcccgc catgcctgct ccccgcccca gtgttgtgtg 420
aaatcttcgg aggaacctgt ttccctgttc cctccctgca ctcctgaccc ctccccgg 478
<210> 138
<211> 181
<212> DNA
<213> Homo sapiens
<400> 138
ccagccccgg cggacccgcc cccggcccgg cccagcgtcc ccaggggctc ccggcccacc 60
ccgtccgttc tggagcgaga gttcactccc cgggctgact gctccaagcc ccctttatta 120
gaagcattcc ttgtggaaaa acaggaaaca ctgacctgta aaacaaaacg cttattaaaa 180
t 181
<210> 139
<211> 181
<212> DNA
<213> Homo sapiens
<400> 139
ctccccacca cttggtctga gaggggctgg ggccggaagg ccagggaatc tctggtggat 60
ttgggggttc atattgctca gggtaccagc cgatgcgttt tgaggggcgg gagtcgagga 120
attagaatcg cctttaaccc tcaagagttg cgccttcagc ctcgggatcc cagatgcgtc 180
g 181
<210> 140
<211> 181
<212> DNA
<213> Homo sapiens
<400> 140
agcccagagt ccggcctacc acggcggcca ctcctcgggc agtgacgacg accgagacgg 60
tgagggcggc caccgctggg gagggaggcc cgggctcagg cctggaagct ccctattgga 120
tcaggactgc aggcctgaca gtgatgggtt aaatctaagc agcatgaact cagcaggggt 180
t 181
<210> 141
<211> 346
<212> DNA
<213> Homo sapiens
<400> 141
gtcaccccac cctgcggcac agtgtatccc actgaggccc ctcggtcgct cccactcgtc 60
gtgccctcac ctagtcaggt cccgcagccg cgcctcctcc ccgcgcaggt accgcctcag 120
cagccccagc agccggcgct cgggcgccag ggcgcgcgcc acgctggtca gcgccgagaa 180
cgtgtcgccc cgagccgcag ccctttctgg gtctcctgtc ccgagcgcca gcaccgccag 240
cagcgccgcc agccgcgccc caggacccat agccagcgct cgcgaacttc ccctcagaca 300
gtcctggccg cgcggcggca gccgctcccg ccctcgcctg ccccgc 346
<210> 142
<211> 181
<212> DNA
<213> Homo sapiens
<400> 142
gcgcaagtcc ccacggtttc cagacggggc gcgcagagcc cagctcccta ctcccacatg 60
ctgctccacg atcactgcgc tcgggaggat cggggaggat ccgggaggac tagcttggta 120
tttgcagcgc ccacccctcc cccactcccc ctcggttcca cagtctcacg gagagcgcgc 180
c 181
<210> 143
<211> 181
<212> DNA
<213> Homo sapiens
<400> 143
agcgactaga gacagcgtcg ctccaagaaa aagccgggtt ctgctcccgg gaccgacgcc 60
gcgccgccct gcgctctcgc cgcctgcgct cgccctgcgc tggcccgggt cgctgtgcta 120
atcgccgagc tctccccaaa cttcctgcat gctgaacttt ccgagcgcgt gtgggtgccg 180
c 181
<210> 144
<211> 181
<212> DNA
<213> Homo sapiens
<400> 144
cgacacccgg cgtgccctcg ggagccggcg tctgtgcccc gagccgccca ccccgccgcg 60
cctgtgacgc cgggctctgc cccccgtgga cgcccgcagc cctccagccg tcagagccct 120
ctcagacgca ccccatcgcg gccccgtccc cactgctccg cggagagctc cctctgccct 180
t 181
<210> 145
<211> 961
<212> DNA
<213> Homo sapiens
<400> 145
gcagggggcg gggccgaggg cccggggagg gggctccagg cgatttcaga gtcgcgagtc 60
ggggccggga tttcgcaggg aaagcccagc ggttgcagct gcggcggatc cctcggcact 120
gtccgccgcg cgccggggca gcccagggcc ggcggcagct ccgcaaagtc gcggaacgag 180
aggaggcgga gcgccggcca agtggtgggg ctcagcgctg gggctgggct gggctgggag 240
aggtgtgccc agggagcctg gatcccggtg cccttctccc tcgtgtggag cggccagtgc 300
ggccagaggc gagctgacgg cctggaaaga gaaatcaaat tgcagcctcc ccaaagacgc 360
tgagttacgc gggcgagccg gttcccgggg atcgttcgcg agcgcgcaga gagccgcgcc 420
gcgccgcaga gccctcccgg ggccgccggc cagaagcggg gcgccgtccg acaggcagca 480
gcccctgggc gcggggttcg gccgcgagtg agcccctgtg cagagagggg gcgtgcaagg 540
ctccgccggc ccccccgcag cccgcgcccg acttgggcgc cccctccgtc ccattctggg 600
agcgatgccc cccgctcctc gcaccccccg ggaacgccgc gagcatggag aagtcgagta 660
gcgaggattc ttcgatccat cggagtccat ctttggacag caaggactcg gactttgcca 720
agccgtccac ctccggccgc ccgttcggcc gcggcttcac ggccggcgcc ttctacggca 780
ccgcgggctc ccggggccag agccgcgccg aggccggcgt taagaccgac aagtgcaatg 840
cacccaaagg cagcaagtac gtggtgtttt acctggacct gtcctttgtg ttcctcctag 900
aatttaagaa gtgcaacatg gccaggggct gcctctgctg cttgaagtac atgatgttcc 960
t 961
<210> 146
<211> 781
<212> DNA
<213> Homo sapiens
<400> 146
cctaccccac ggcgtaggca gcaaagcttt ataaatcccc cttctctgag agactagaag 60
cagcatgcat ctgacaattg tcaatttcaa aacaaacacg ctccgggact tgaacgcagc 120
ggggcattca gtagcgaatg ctgtctcctt gagttagggc aaagcctgcg tgcccgccgt 180
cccctcacca cttcctcttc cccagccccc acctgagagc agacattcgg aatgatgtgt 240
agtgcgaggc ggctagcctc ccagcagaaa gccatcctta ccattcccct caccctccgc 300
cctctgatcg cccacccgcc gaaagggttt ctaaaaatag cccagggctt caaggccgcg 360
cttctgtgaa gtgtggagcg agcgggcacg tagcggtctc tgccaggtgg ctggagccct 420
ggaagcgaga aggcgcttcc tccctgcatt tccacctcac cccacccccg gctcattttt 480
ctaagaaaaa gtttttgcgg ttccctttgc ctcctacccc cgctgccgcg cggggtctgg 540
gtgcagaccc ctgccaggtt ccgcagtgtg cagcggcggc tgctgcgctc tcccagcctc 600
ggcgagggtt aaaggcgtcc ggagcaggca gagcgccgcg cgccagtcta tttttacttg 660
cttcccccgc cgctccgcgc tcccccttct cagcagttgc acatgccagc tctgctgaag 720
gcatcaatga aaacagcagt aggggcggcc gggctcctgc gaacaacaac aaaacaaaca 780
a 781
<210> 147
<211> 241
<212> DNA
<213> Homo sapiens
<400> 147
cccaccctct gcctcgctga gctccctgct gcgagggcct cgggtgcaag ggggaggcag 60
gtctctatct catggagctg tcagatgaga catcgcgatc ggagtcctca gcctcgcttg 120
gcggcggcgg cgggtcgcta agcgggaccg cagtgaaagc aggagacttt ctagaaaaaa 180
acaccagttg tcaaccttgg ggcaggcagg aatcctgaag acggacggca ctcctcctcc 240
t 241
<210> 148
<211> 601
<212> DNA
<213> Homo sapiens
<400> 148
ggggcagttt tgatggctaa cccctctttc catcctttgg gggaaaattg ctcatctccc 60
tataggtgga actctaaaga caatgtattc ctaaaagggg ccatctgggc ggtgtcctct 120
tttcccagcg ccctgatttc tattcttaga tctggagata ggcggctttc atttttcctg 180
ctcccagttc ccagaccttc cgtggggccg caggatcccc ggctggcggg tcgcggaggg 240
tggccggccg ggctgcgcac tgcgcgcctc cgctgcgggg ctccgggcct gtggactcag 300
cggagtccgc tgagtcagtt tcttcccgcg cgactcccgg ccgcgccgcc gctgcggtgg 360
aatctggtcc caggaggcgg cgtccgcccg gggtccggtc taggcgtgcg tgggggccac 420
ggtcacggtc atcccagcca ggcccggctc cagcagcccc acggccgccg ccagagttct 480
gcgcggcccg tcgcctcggc ggagcctctg gcaggcccct gagctcgttt ttggggcctg 540
agtgggggag gaggaagccg agcaggaggg ctccggagag ggagggcaac gcggggcggg 600
g 601
<210> 149
<211> 661
<212> DNA
<213> Homo sapiens
<400> 149
ctctgcgatc cctccagtgg gcgtctcccg gagcagcgtc ccgcctgccc actgagcagc 60
tctcagcagg gtgagctggc ccctctccct gctctgcctt ttttcaactt cggcgaggtc 120
gggaaggtga gctccgagct tccggaagca ctgggttccc aactcaagta tttatgcggt 180
gcttgtttcc ttgggacgcg ctccctcccg ccctattgcc ggaagactgc tggttgccta 240
ctccccgctc cctggagttt tattttttcc tctccctacg tcggtgtttg tcctctgcat 300
cactgtggag ggggtggagc tgggagactc gcagattcct cctcacagta ggtgggatcg 360
tggcgctttc ccgcttttcc cttccaaaaa cttggacaac tggacgagtc atgccttttc 420
tgggctcgta gccgtttcca caagcttccc tcactagcct tcctcgctag cctccttaac 480
catgcatttg acttcaacag gcacgctaag cgcggtacct ggaaacctcc agtccacgca 540
ccggcgtcca cgcatctagc tcctgcacct gaacctggct ctcgacctca cctcctccag 600
tccgggtttc ttccttctca ccgagctcac ccgtgcagca gtctggcaaa ttttattccc 660
c 661
<210> 150
<211> 1225
<212> DNA
<213> Homo sapiens
<400> 150
ctcgctccct gggggtttgg ggcaacttcc ccgctacgtc gcccagggat tttaaataat 60
tgccagccac cagaaacccc ctaaccctta attcttccct ccgagaccca gcccgctgct 120
tgccacttcc ctctccaaac gctggcgggg gtgggtggca gcaccgaggc gattttcttc 180
gtcttttttt cctccgggtt ttgtcatgga aacgctgaca caacctccag acggcggccg 240
agcccggccg gggactgagg gcttttggga ccctgcggga gcgcggcgcg cacaccgcac 300
tccccgggca acagctggac gcgaccatat cccgggtagg ggcgggggga gcgcgacgct 360
ccgccccggc gctagggtcc ctccctcctc ccggctctcc gcaggcgccc tcccctcgcc 420
gggggccgcg agttgcattt ggtaaaaccc agccccggaa tatatagatc gttggagcgc 480
aatgaagtag cctttggaga gaagggagag ggcccgtcgg acagccacag cggccagcgc 540
agcggcagcg gcggcggcac caccatcacc gctcgcaccc cagccgcccg gcccgcgacc 600
aggcagcggc ggccgccggc gggatcggag gaggcggcgg agcggcgagg aggaggagca 660
ggagcgcgca gccagcgggt ccacgcatct cagcacttcc agaccaactc cggcaccttc 720
cacacccctg cccgggctgg gggctccgag agcggccgcg aagcgactcc gatcctccct 780
ctgagccttg ctcagctctg ccccgcgcct cccgggctcc ggtccgcgcg gcggggtccc 840
tgctcctgcg ccccgggcgc gcttcccgga caccccggtc cccgcagcca ggacaaagcc 900
atgaagccag cgctgctgga agtgatgagg atgaacagaa tctgccggat ggtgctggcc 960
acttgcttgg gatcctttat cctggtcatc ttctatttcc aaagtatgtt gcacccaggt 1020
agggggcgcg ttagcgtggt tttgttggat attttcttct ctctcgcgct ctagctcgct 1080
ccgcctgatt tctgcctctt ccaaccctac ctctccgcct tcggcctctt cggggctcct 1140
ggctgcccag agctcctggc tgcccagatc tacccgggtc accgcgtcgg gatggggagg 1200
agaagggaag gtgtgcttcg ccctc 1225
<210> 151
<211> 181
<212> DNA
<213> Homo sapiens
<400> 151
cttctcagga agccaagctc cctcaccctg tggcgacgcc gcgggcggaa tgcgcatgcg 60
cgccacgagc cacaatcgta gggttgggcg cgccctgccg gccaccaggg gcagcgcagg 120
agctgagcgc accccatcag cgaaagaagc gcgcctcccc gctcttttct gaaccgtatc 180
t 181
<210> 152
<211> 181
<212> DNA
<213> Homo sapiens
<400> 152
tttctatatt gagaacacag accacatgag tgagagggct cggtaatgct agcgagacgg 60
cactggcaag acctgggtgg aggaagcgga cgtgcgggtg ctccctccca gggttcctgc 120
acccatggcc ttgagcaggg gcgtgttcat tcccaccggg agtgcagcca gcacgaacgg 180
g 181
<210> 153
<211> 361
<212> DNA
<213> Homo sapiens
<400> 153
ggcaaaatac acgccatatg attggatcct taagggcagc acatcctacc cggaaagctg 60
cctacttaac aataccaaag gcttactcaa agaggcacgt gaatctttcg catggaatac 120
ttttggaacc cagaccgaag tgcccagggg ttaatcacgg cgccggtctt acagcaccct 180
cagcggcttc agccctgaga ctctgcaggt gaaggctcgg ggggtgtgga cgggacccca 240
caccgcgccg cccgccgact cacttcttgc ggacttcttc cagcaactgc tgtttcaggc 300
ggttggtgct cacaccgtcg aagttgtagt ttctctcttc cttcatagtg tcaggccaga 360
g 361
<210> 154
<211> 181
<212> DNA
<213> Homo sapiens
<400> 154
atggtttcca tagcaacaac agcacaagct gccgggtccc agagacgccc tagggtcaga 60
ggtcatctcc gtggcaacgg aaacttcccg cgctacggcg gctccaacgg gccgcttccg 120
ccgcattgcg tagcgaagcc cccggcgagc cgaggctggg agcgcggtga tggccggtcc 180
c 181
<210> 155
<211> 541
<212> DNA
<213> Homo sapiens
<400> 155
gccataggtt cttttttgac gcatggagca gaggcctctt cttgcctcta agaaggatga 60
acacttgctc tgtccttttc caggctcagc ggagcggaga aaaaggtgga ggttagcgtc 120
cagaggaggt gagagaagag caagtcacct tggcggcacc cccgcctccc ctcccgctgt 180
tccaacaact gcccagaggc tccggcctcc gaggaactgc aggcgaggcc agacgttttc 240
tcatcatcgc cctccagctg caggggcaca cgcgttcacg cccctccggg gactattcgg 300
ctttccgatc tcctctcctc tcccttccgt ccacccttta gaagagctca cggagctgcg 360
gggcttcccg gtgcctgctc agaggccagg cagggcatct ccccgccgtg cccgtgcctc 420
cccccgggct cctgggagac cccccatctg gccttccttt ctcattcaga cactgtcggg 480
ggacgctcgg ggtttgatga gggagtgagg ctagaacttt cgtaactagc ccaccctgct 540
t 541
<210> 156
<211> 181
<212> DNA
<213> Homo sapiens
<400> 156
agggccgggg actgtggcgc tgcaggctcg agatagcttg gacgggaatc ccatcgggga 60
gacaagctag atactcagcc ggagcagcag cggcgtctca ggctcgcgtc cctcagctcg 120
gatgccacac tcacctagct tccgggccgg gctccgcgct ccttccctcc ctccctcctc 180
c 181
<210> 157
<211> 421
<212> DNA
<213> Homo sapiens
<400> 157
ctttcaagtg tccaggccat aaattcttct caattccctc tctctctcct tgtcggaatt 60
aatgagatca gatctgatca gggcgctgat gtgttcagcg ccaaatcaca caacagcgcg 120
cgcaccgtaa tggaatttgc atctaatgca tacataaatc aaacatcttt ctggacattt 180
tcatatgcat aatgtcattt catccagttc tctctgtgca gagggggaga tttttctctc 240
tgagagaatg actttcttta atgctttcat tttattttcg ctgactgcag tccgggagaa 300
tgcgctcggt cggagaatct ttcggggcgc ggttgacagt tctttttcca agaggggtcc 360
ttcacattta tcatgcctct tcctcggggg ctttgttatg caaatgtggc tgaaattgat 420
a 421
<210> 158
<211> 241
<212> DNA
<213> Homo sapiens
<400> 158
tccgccctcc gcccgcctgc gcccgccctc agcccaagat ttctagggca ttggccgcgc 60
tgctgggtga tccctccggg ctcaagttgc aagggggcgg gccgggccgg aggtggagtc 120
tcccgccaat tgaagcctcc gctataaatt gaactccctg cactgctgaa gcccagatgc 180
ctcgccaggc cacgtcgcgg ttggtggtcg gagagggcga ggggtcccag ggggcttcgg 240
g 241
<210> 159
<211> 181
<212> DNA
<213> Homo sapiens
<400> 159
cagggaagac cctcggccgg agagccaagt gctgctggga ggtggccggg cgtggccggg 60
ctgtgctgtg ggaaccgctg ggtgggggcg cgctgggttg cccacgctcc tggcgcgctg 120
ccggcctgga gacgccgccg ccgccctctt gcaccccgag ggcccgcacc tcgaaactcc 180
g 181
<210> 160
<211> 841
<212> DNA
<213> Homo sapiens
<400> 160
ctgcccagac cggagctgga gaggggcgag aggctctggc ccatgccggc cacgtccttg 60
tggtaggggg tatagaggtt attcatggag gccagcccgc gctcatcccg catgagcgtg 120
aagctaccgc tcacgttgcc cgccaggcgc tggtggtggt gcgggtggtg gtggtgatgg 180
tggtggtggt gatggtgggg gaacttgtcc gagactgtgg agatgggagg cagcggctgc 240
agaggggtca aggtggtgta ggtggtgggc atgctcatac ctgggggagt ctcgcaggcc 300
atggtcatgg tgggatgcag ggggccggcc aggctgtgct caggggcccg gtggtggtgg 360
tggtaatctc cgccgccgct gccgccgtcc agcagggacg ccatgcccat ggagcgcggg 420
tgcgcggggg gcaggtggct gccgcggtgc gccacggagc tgcgcgcgtg ggggctgccg 480
cccagcaggt cggcaggggc gggcaccggc tcatggctca ccccgtgcag ctcgccgatc 540
gcttccatgg tcagctgcgc gttcatcgtg atccgggcga gcaggcggcg gacacaacat 600
cgatgtggcc aggcagaggc ggcgaggggc gcacggagtc cggtcttcac atcggctgct 660
ggcgactgtt gccttccttc ctctcactgt ggggctctgt ctctctctct ctctctctcc 720
gtgtgtgtgt gtccgtgtgt gcgtgtgcgt gtgtgtgtgt gtgtgtgtct cgccttccct 780
cttacccccc accttcccct ctgcgtcctc ggcttttttt tttttaatat taatttccaa 840
a 841
<210> 161
<211> 421
<212> DNA
<213> Homo sapiens
<400> 161
cgaggagcta gcgcagaccg ctctccgccc tcagctgcgg cgaggcaagg gctggcagcg 60
ctcggacgcc tccgtcttgc ccttcccatg cctaagcgcg gggaattaca cgttcccggt 120
gtagaacaga cgatcggggc tattagggct gggcggtggg agtgggggtt gggagcacca 180
tttttggctg gacgtgtgtc cagactcatc gtctctggtc cttaggaccc catcttcctc 240
tgcatctcca ggtgtcggcc cctctgtacc cgcctcccac ggggctcgtc cggcgaaggg 300
cagccgcagc ccacatctac tccccgccct caatccctgc cccctctgcc cgccgcagtc 360
actcgcctgg ctgggagcaa gcctcccctc tcgctgaggg tgcagagagc gcctagggcg 420
c 421
<210> 162
<211> 901
<212> DNA
<213> Homo sapiens
<400> 162
caccagcgtt atatcccgtc gctgcttcac atatattatt tacctggccc gggtggcatt 60
ttactttgca tccttgattg ggagtctcag gggctacgaa caaacgtttt atccccgggt 120
agccggcggg tgcggagcga gtattcgtgg ggcgggataa gtgcggaagt cgctgcgccc 180
tcgtcccttc atctccgggg gacggccact ctcagggttc ccgaggagcc cgctccgtgc 240
acctaggccc taggtcggct cccaagccct ggcccgccgc tacaccagcg gtttcttacc 300
cgcaagtaca aatgtgacac agacaccagc tcctcgtgct cttggctccc agggtttctt 360
tcaccgcgcc tcagcacctg cagcttctcc actcttacag cgcccgccgt cgtcaaggca 420
acagagggat gcccggtgac agactcggcg ccggcttccg gcgccgtaag agaagcgtcc 480
gcgcgggcgt tctggacccg cagagttctc ggcgtttccg aagctcttgg tgtggccggg 540
acccgggaga aggagcaggg ctggtggggc tgctgcagcc ggtgagtgtg tgctggcgct 600
gggggctgga acctcctagg ccagtctctg ggcggtgccg caggaccctg ctcgctgcgg 660
ctctgaggcg gaaacagggg ctggggccga gcgcgggctg gaagctttgg tccctggagt 720
gtcgcttcca gtctggggcc gaggcggtcg cctgtgtaga cccgggatcc tcaaatagaa 780
cgaatccggg accctgcaga aatgaagggc atgtagtgta gaggtttttc ctttttattt 840
agaaaggaat gaaagaccga cagtgcacct gcttggatag taagcacgtg acccaaaact 900
t 901
<210> 163
<211> 361
<212> DNA
<213> Homo sapiens
<400> 163
ctcaaggtct ctctctctca gcaccctcgc cggccggcgt ctgacgcggg tgccagggtc 60
tccgggcacc tttcagtgtc cattccctca gccagccagg actccgcaac ccagcagttg 120
ccgctgcggc cacagcccga ggggacctgc ggacaggacg ccggcaggag gaggggtgcg 180
cagcgcccgc gcagagcgtc tccctcgcta cgcagcgaga cccgggcctc ccggccccag 240
gagcccccag ctgcctcgcc aggtgtgtgg gactgaagtt cttggagaag ggagtccaac 300
tcttcaaggt aactgtctcc ttccctccag agcgaggctc tcccagggcg cccggcgagc 360
c 361
<210> 164
<211> 181
<212> DNA
<213> Homo sapiens
<400> 164
gcgcctcttg gggtatcctt ccacggggtg gggtatcctt ccacggggtg aaggctgcgg 60
agagtcgcag ctgcaggcat ggcctccggt cggcggacgc tggtgacctg gcgtcgtgca 120
gggtgtcact ttctccttta attttttttg atgtttcagt ggtttacgaa ggtatttgtt 180
t 181
<210> 165
<211> 388
<212> DNA
<213> Homo sapiens
<400> 165
aggtcaaagg atgagtggcc tggctgaaca gcccctgctg cctacagccg gacgctggtg 60
ggcactgaag ctgcaggtct ggagggagtc cgaggagcga ggctgcgtgg gattactgct 120
ggtgctaggg caggcacctg ccatctggac gggagtggaa ggaagtcgcg gggcagtaat 180
agggggcagc aggcgctttg aggcgccttg gggtaagtgc cgcagagacc cagcgggaat 240
gcaggatggc agggcggcct cggggcggca gcaggcactg cgcggtggcc caggaagacg 300
cagcgcggcc gggctggggc gcagggcggc ttcggggcgc cagggggcgt tgtgaagtcg 360
tggcccgctc cgggcggtct caggtgcc 388
<210> 166
<211> 181
<212> DNA
<213> Homo sapiens
<400> 166
aggcttgagc gcccagcgac agacaagtgt cctaagaatt ggtgcctctt ctagggaaaa 60
ggaggcctgg gctccaaggc cttaaagact cgcctaattt tccgcacgga tgagtagacc 120
caggcccagt tcggatccgt ctttatctta tcgtctgtgt cagagaaata tgtcatattt 180
c 181
<210> 167
<211> 361
<212> DNA
<213> Homo sapiens
<400> 167
tcactgttgt tacctgcatt tttccctggg ccagctctgc caccgagtgg aagtgggcca 60
acaagtctgt gcccatcggg cctcagtttc tctttctgta caacagaagg gttgacgaaa 120
gcaaccttgc gcttgttaag aggtgggggg cgcggggagc actcggcccg gcgggcggag 180
acttttctct gcattgcgat ggtggttggc aggccctggg gaattacggt acttcgcctt 240
cggggacgcc cagctgtttt ggggctttct ctctattggg ggtaggatgt ttgtggtctt 300
gactggaaag ccgggacagg cgtctggagg actccccact acatcctgta ccctggaagg 360
c 361
<210> 168
<211> 361
<212> DNA
<213> Homo sapiens
<400> 168
gcccgcaggt tcctgggtct ctccttcaag accacatccc ccagagaccg gcggagtttc 60
gcacagcctt ctgggactta tagttcttta aggacgcgga gtgggctcac gccgcgggta 120
ggcaaacaga gcgggactgc atttcccaga gtgcactgaa gacacggagg cgcggagcag 180
ggcgggagga ccgtttccat agcaaagacg accagccgag gatggctggc ggaggcgtgg 240
ggcaggccgc aggaccctcg aaggatcgtg tgagaccccg ggcagcctct tgggaggcca 300
tttcgaggag aaaaccttga tttctgcctc aggaccctgg gcctcagttt tcctatctga 360
g 361
<210> 169
<211> 241
<212> DNA
<213> Homo sapiens
<400> 169
agtgagccac cggcggggct gggattcgaa cccagtggaa tcagaaccgt gcaggtccca 60
taacccacct agaccctagc aactccaggc tagagggtca ccgcgtctat gcgaggccgg 120
gtgggcgggc cgtcagctcc gccctgggga ggggtccgcg ctgctgattg gctgtggccg 180
gcaggtgaac cctcagccaa tcagcggtac ggggggcggt gcctccgggg ctcacctggc 240
t 241
<210> 170
<211> 181
<212> DNA
<213> Homo sapiens
<400> 170
acgccaggca gtggtacgag ccgccgccgc cgccgccgcc gccaccgccg ccgccgccgc 60
cactgccacc gccgccgccg ccggtgggga cgtgaagcac catctcttgc aggttcacca 120
cagactggcc gaagaagcag agggacttca ggtggctcct cgctgcctcc tcgtcgctga 180
a 181
<210> 171
<211> 181
<212> DNA
<213> Homo sapiens
<400> 171
ggaaagaaac aagcatcgaa agctacatga agggggtgca gcgctgttct aaaacacaaa 60
atgccgagcc ccgttttccc tttccctccc cgctcggtcc tgcgcccacc ccgtcccgcg 120
ctggccactc aggcaagctg taaatggata taggtaaaga tgcaggaggt gatggagaag 180
g 181
<210> 172
<211> 241
<212> DNA
<213> Homo sapiens
<400> 172
ttgagagctg ggaattgatt tctaagcctg gtttgagctg agggccacag agccagtgca 60
ggaggagacc ctgccccaga aataggccag tgcttgttat gcaggccttg gcggttcccc 120
gtttccttac gtaacctcag tgttcacgct gtttcctttt gttgattccc tccgtgtgac 180
tgtttttctg tcaatctcct tagctaatga gctccttata aggagaatgg atggatcaga 240
g 241
<210> 173
<211> 781
<212> DNA
<213> Homo sapiens
<400> 173
tgcagagtca ggaaagattt cctgagcctg gactgagagg ccaaggtggg tttgcggagg 60
caggagagag ctccagatca ggaggcagtg tgggccaagc cggggggcgg caggatgtga 120
gcacagagag ggcagcaacc cttctacaga ccagttcaat tccagtaacc ccagcctgcc 180
gtaggggtgg gggacagcct ggctgcagcg gggcccacct gccagtgtgt gccttgcctg 240
cgctccacct tccccctcgg gcactgcggc tttcttggga cagcaggacc ccagttaaac 300
agccctgttt cctgcccagc cgtggctgcc gcctcttctc ggaggatttt tttttcccac 360
aactcaacaa ccactaccac ttgcagctaa gcagaaggga agttaggact cgcattttgc 420
ctctgtagcg cctgtaatca gccccacaca gcccccgccg caggcgccca tcagtgccac 480
ttccggagac tacttgagat acacctgctc acgctaaaag gagaagcagt aatccatcaa 540
aacaacccca ggcgccgggg cgggagaggc tgagactcag tttcccctcc catggaacag 600
ggcagtgttg ggcatctgaa gtccccacgg gtcctggcat tctggaagaa cacgactcag 660
tagctttccc cttctgggcc tcggtttccc tgtctgccaa aggtgcaggg agatgagctc 720
ccagctcatg cctctgggcc tcctacctcg cccccaccct catctctccc tttccagaga 780
c 781
<210> 174
<211> 334
<212> DNA
<213> Homo sapiens
<400> 174
gccccaagtc cttcctgaac ctctctgggt cgcactctcc ccagcccctc cccccacgcc 60
ccatcgcatg gccccgacac tggcagaagg cggccgccca gcctgagcac cttgtgcagg 120
tctgcggcca gcgcgcccac cagctcctgc tcctgctcct ggatcaggcg ctgcagcgcc 180
tccagctgct ggatccggaa ctgcagcgga cgggtcctgc ccgagctgaa ggcggcgcgg 240
gcgcgcttca cggcctcgct gatcttgctc atggcgcctg gggacagaga gcacctgcag 300
ctggctgagg ggcacgagcg cgccctgcct ccca 334
<210> 175
<211> 181
<212> DNA
<213> Homo sapiens
<400> 175
gccttgaagg ccgcagcgcc agccggctcc ctccgccggg gaaaggagtg cggccagggc 60
ttggcgcccg cagctgggca gatcctcggc cgctcctgag gcggggacga agggcgcgac 120
ccgctgcggc cacagcgggt tacgggctgc gggctccgtt ctgggcctgg ggagcagatt 180
c 181
<210> 176
<211> 301
<212> DNA
<213> Homo sapiens
<400> 176
ccatttgcga tcggcacctg gaggggcgcg ccgtgcacaa tgagggcggg gccgtggggc 60
tccgggtgcg ggcggcggcc gagtgcccac gtgggtgcag gctaggccgg gctgatttcc 120
ctggaacccc gcgccgcgtg cttccctgta atgagctccc agggcccgag gtgagcttcc 180
tcggctgctc acacggcagc cgcgtggcag caaagaacac ggggactttt ttcttccgtg 240
cctgacagct cattagaaga attaatttac tctagcgttt gcagtttaaa ggacattatt 300
t 301
<210> 177
<211> 324
<212> DNA
<213> Homo sapiens
<400> 177
cgcccggttt ggccccggaa aggcaggaag ggggcgggga agggatggcg agctcggggt 60
gcaccgcctg tttcttttct ggttaggtat cgtccttgga gaagatggaa gcggagaggc 120
ggccggcgcc gggctcgccc tccgagggcc tgtttgcgga cgggcacctg atcttgtgga 180
cgctgtgctc ggtcctgctg ccggtgttca tcaccttctg gtgtagcctc cagcggtcgc 240
gccggcagct gcaccgcagg gacatcttcc gcaagagcaa gcacgggtgg cgcgacacgg 300
acctgttcag ccagcccacc tact 324
<210> 178
<211> 721
<212> DNA
<213> Homo sapiens
<400> 178
cacccggggg ctcgccggcc ggctccgcgc atcccgccct ctcaatggac tttcttacct 60
cttaatgtag ttcctgccat acaggatctg ttgcagcaag gtcaccaagg caaaggcgca 120
gatgaagatg aagagcaaag ttcggctccc caacaaatcc cggttggccg aggggtccgc 180
gtagcgcatc ctggctaccg ggcgccgcgg gcgcggggta cggggcggcc aggcaatgac 240
tcgcggggtt ccggggcccc ggggggcgcg cggccgactt ggcgcctcac ggtgcggtca 300
ggcaggcggg ggacttcgag gggcaaagtt tctggttggc gcggccggag ctgggggcat 360
ccaagcgtcg caggcgctgg ggcggcaagc aggacagggc cggtggcagg gagctctgcc 420
gcggccaggg gccttcccca cccccgggta cctttacctc caggcgccgg tgccgggtag 480
ccgccgattt ccccgcggag gggagacgcc aggtgccacg agccggaggc ggcccctccc 540
gccgaggtgg cggccaatgg ggagcaagac ccgggctccg tcccctgtgc gccccagcgc 600
gccgcgcatc gacccctcca gtccggcgcc ggatcgcggt tgcccagcgc gctgtgccct 660
gccgggggcg ggccacgttt gatctccggg cccgcagcaa gggatcgcga aggttggcct 720
c 721
<210> 179
<211> 421
<212> DNA
<213> Homo sapiens
<400> 179
ctgcttctga ccacgccccc gcgcccaccc tcttcccacc ctcctcccac ccagggctct 60
ccagacgcgc atgcgcaccc gttgtgcatc tgccgcgtgg tgaccgacac gccgtcggcg 120
ccgtccccgc tgggccgcag cagcaggttc ccgcactcgg ggtagcgctc caggagcagt 180
tgtgcctcca gccggctcac cttcaggaag cacctgtggc gggccgcgtc acccactcgg 240
gaccccggag accaagtccg ctcttctgca cgtaaaccct gcctcctctg agacccagcc 300
ccatccccat cccctaggcc caggagaccc tgccctgctc tccagaccca ggcccctccc 360
acggagaccc agtccggcct tccaggctcc tagtttttgt ggggtttttt gttttttttt 420
t 421
<210> 180
<211> 421
<212> DNA
<213> Homo sapiens
<400> 180
gggtcgaagg gggcgtgtct tccataacca cgccccctcc atgcagcaag cgattctccg 60
cgtccgaggc cagtttcctg gagggagagg ccagtccccc tttgggcgcc cgccgccgtt 120
tctcggcgct gctggagccc agccgcttca gcgcccccca agaggacgag gatgaggccc 180
ggctgcgcag gcctccccgg cccagctccg accccgcggg atccctggat gcacgggccc 240
ccaaagagga gactcaaggg gaaggcacct ccagcgccgg ggactccgag gccagtgagt 300
gccctatcgt gctgccttcc ccaatcttcc ccaatgtcct actggtcata tagtgagcat 360
cccacgagcc tggtgctgtt tatgaaagat ctcaggtcct attcacattg caatttggga 420
t 421
<210> 181
<211> 181
<212> DNA
<213> Homo sapiens
<400> 181
gtgcggcgga agccggagct catactgcgc acggagaacg ggctctggct caaggtggag 60
ccgctgcctc cgcgggcctg agcgtgggcg cgcccctgcg gctcccgagg gtccaggccc 120
cgcccccaaa ggaccaggac tcgccccaaa gatcccgagg gcataggcca cccccctcga 180
a 181
<210> 182
<211> 181
<212> DNA
<213> Homo sapiens
<400> 182
tggagacccg gttcgaggcc cgacaaccca gagccaccgt ggccatcggg tccccgcctg 60
gcggaagtgg ccaggcgtcc acgagcgcgg cgcgtatagg ttcacctcgc tcgctccgca 120
gcccccaggg gctcatggct gcctatcccc cctttacaag aggacaatga ggctacacat 180
g 181
<210> 183
<211> 344
<212> DNA
<213> Homo sapiens
<400> 183
cgttccgttt gaaccccata catcccttcg tcctcgggac ccccctccag ccctcctcaa 60
gcgcccctcg tcagtctggc ctccacgccc cgtcccctca gcccgccaac ctcactgcca 120
cgaccctgcg tggcccctgc cgagcccgcg ggcagcacct ggcctgtgcc tcgtccaggc 180
tctggtcggt gatggccatg atctgctgca ggacgtcgct cgtgtcgagg cgccgcgggg 240
cggggggcga tggcgcgggg cgcggcgggg cggccatgag cggcagggcc gggcgggcgc 300
tgtgagggtg ccgtcgagcc tggagcacta ccactggcgc cgca 344
<210> 184
<211> 181
<212> DNA
<213> Homo sapiens
<400> 184
gggccacaga ggctgggcct ccaggagaat aggacacaga ccagtgaaga cgagacctga 60
aacgccggct gcagctagag acaaaggccg cgccaaaagc ggaaagccgt cctcgtcgct 120
ccagctgcgt gcctgattgg acggtttcca gcccagcgtc tctgattgga taatgcttta 180
g 181
<210> 185
<211> 181
<212> DNA
<213> Homo sapiens
<400> 185
agcagagaac acagagcagt gaacaagaga tctggagctc cagcggcagc aagagacaaa 60
ggccgcgcca taccagaaag ccgtcctctt cgctccagct gcctgcctga ttggagggtt 120
tccagaccag cctccctgat tggattatgc ttaaggctct gccccctcag tacctgagtg 180
a 181
<210> 186
<211> 181
<212> DNA
<213> Homo sapiens
<400> 186
ctgcttgtct ctgggacggt gtgtgtgtgt gtgtgcgcgc cgctgtgatt gtatgtcagc 60
gcgcttcgct gggtgtcggg ggaaggtgcg cgtgtctcca ggcctcctgc ccgagaacag 120
cggcgctgct ctctgattgg ccgcggccgc gccagtgaga agctcccgaa tcctgcggta 180
a 181
<210> 187
<211> 541
<212> DNA
<213> Homo sapiens
<400> 187
agaagctgga gcggcagctg gccctgcccg ccacggagca ggccgccacc caggtgagcc 60
ccgcacctgc ccactccctc ccctccccgg gcctcctacc cacccctgac actgcacccc 120
gcctccccag gagtccacat tccaggagct gtgcgagggg ctgctggagg agtcggatgg 180
tgagggggag ccaggccagg gcgaggggcc ggaggctggg gatgccgagg tctgtcccac 240
gcccgcccgc ctggccacca cagagaagaa gacggagcag cagcggcggc gggagaaggc 300
tgtgcacagg ctggtgagcg cctgggccag cggggcctgc ctctgatgcc tcgccccctt 360
ccttccttcc tcccaccatg ggctgccctg ggtgctgcgg gcagcctgca caccccaagc 420
cccgcatgtg gcctgtggtt tgggctgttt gggatcctca cagctgagac tcatttccca 480
gcctcttcca ggcagggctc gggctggggt gggacagggt ccctggcgct tctgtttgag 540
g 541
<210> 188
<211> 361
<212> DNA
<213> Homo sapiens
<400> 188
gttcccccat ctctccgatt ttctcctcct ctgtccctct gtcccctctg tccctctgtc 60
cctccgctgc agctgtgggt gggcatgcct gcctggtatg tggccgcctg ccgggccaat 120
gtcaagagcg gtgccatcat ggccaacctg tcagacacgg agatccagcg cgagatcggc 180
atcagcaacc cgctgcaccg actcaagcta cgcctcgcca tccaggagat ggtctcgctc 240
acctcgccct cagcccccgc ctcctcccgc actgtgagtg tccggcggcc aattccagcc 300
ttcgcttcct cagagccccg cctcttgccc tcagtctagc caatcctggg cctgctcact 360
c 361
<210> 189
<211> 356
<212> DNA
<213> Homo sapiens
<400> 189
cctctctgag cctcagtttc ttcagtggac tcaagaatga tactcagtgt aaggattctc 60
aaaacgagca tcagcaggtt ccgcccacgc cggcctcctg ggttcagttc tctaataacc 120
acctcccttc cccgcctact ccagccaatc cttgtgctga ctcggctcct ggccacgccc 180
taaccccacc cccgctgcct ctaaacccgt ccccacccct gcagcctcac aggctgccgt 240
cagattctca agcccctatt cctctcggtg gcctaaatcc ccaactgctc ggggccactt 300
ttcaggccaa aatgggccca aaatggggag ggcaagtgat gaatgtcact agacag 356
<210> 190
<211> 421
<212> DNA
<213> Homo sapiens
<400> 190
cagagaagag ttttaagcag agaaacgacg cggtgggcgg tcggtgtcca cactgaccta 60
aagcaaaaag gtcggggcca gtacccactt cagaacgatt ttaatccgaa atggacgcag 120
atctctagac cctctcggag cgacgggact gggaacgtct tagggccacg ccgcgagagg 180
aatgagcagg ttcggggttt taacctacag ggcgacccca aaacccgaca gcggagcgtg 240
ggaacctgtg gcccgcgagg cgcaggcttg aacccgaaag acggagactc acccgagagc 300
gccagtagcc ccgcgagatc cgcttccggg tcggcaggaa cctgcgcgta cgcgagtgca 360
ctggggcggc gcaaggggca agggcagggg cagggcgcgg acaactgtgg ggatgggcgg 420
g 421
<210> 191
<211> 181
<212> DNA
<213> Homo sapiens
<400> 191
gctgagcatc cgcagccgcc accaggcccc gcccagcggc cgcagccagc caggccgcgc 60
ccgggacgac tgcagagcgc ggtgagtgaa cgcggccaga gggagggact caggcgtccc 120
aggtccccgc cctgcccctc cccgggggcc cgacatcccg accctcagct ccctcttttt 180
c 181
<210> 192
<211> 181
<212> DNA
<213> Homo sapiens
<400> 192
cgaggagaag aaaaaccact actcgtacgg ctggtccttc tacttcggcg ggctgtcgtt 60
catcctggcc gaggtgatag gcgtgctggc cgtcaacatc tacatcgagc gcagccgcga 120
ggcgcactgc cagtctcgct cggacctgct caaggccggc gggggcgcgg gcggcagtgg 180
c 181
<210> 193
<211> 181
<212> DNA
<213> Homo sapiens
<400> 193
agcggagaca gcgacgcaca acgggccgca gaggggagcc ccattgaggt cgagccgtgc 60
ccacctgcta tagctggtgt tgttgtctcc cgtaacccac tggaagccgc gcaggggccc 120
gaggcgcttg gggtcgccgc agccgggtgg cagctgcagg ccgatccaga ggcgccggcg 180
g 181
<210> 194
<211> 1981
<212> DNA
<213> Homo sapiens
<400> 194
agatctgact ggcattgagg aaggtcgcgg ggcccgggta gagcgcgaag cagtcgtgct 60
cgacgcactg gctgccaccc ggctgcggct ctgcgggtgc ggggaacccc aggccggcca 120
gggccagcgc gccaaggacc aggaccccaa gcatgttacc caggcgcgcc gcgtgcaggc 180
gccggggaaa gcgcgggcac tgcgacaggg ccgtgccgga gcagaggggc acaggacgcc 240
gatggcgaca gcctctcctg tccgtcccag cccagacact tcttgccgct gcgcgcagcc 300
cctgcgaggc agcctctgac atgcggatcg gccagggctc gagtttataa gtgcccggcc 360
ctccctccct ggacgttcgg gaaaaggaag gaagtgcctg gtgggaaggg ctgatgccgc 420
atactcggat tgctgggttc tctggccgcc cttgcgcccg ccctcgcgca tgggatcacc 480
tcgccgggat gagtaaaccc tgccctggcg cagggaggtt ctcgggcggg gccgacaggg 540
gcaggcgcca gggaaggcca gcacccctgt aacaagacga ctgtccccgc ccaccactcg 600
ggcccccacg cgtgcagccc tctttcatct cttggtcctc ctttctttct tttcatacat 660
gttacagcca cttccaagga aagcctggat tgcaagagct ctgggaaccg gagacttcag 720
agaagagggc tttgaatggg gagtggggga ggtggtgcac aggacctgca agacgctggg 780
aggggtgatc ggcaccaagg gcactttggg aggacctgcc taggacgtgg acttccccga 840
agacaggatc gcaaggagag acagctggat cctgtccgcg gccaaggtgc ctggctcagg 900
aaaccagcgg agcgcgcttg gcctcacagg acagtgggtg tggctggggt gacggggcag 960
ggtggggaag actggcctaa caccagcgcc ctctgcccca tggctggcca gggacccgcg 1020
agtccctgga cacgcactgg ccaacgccag accccatctc atcgggtggg gaagtcgcgg 1080
ggacactgtc agggcgccga agtccggacc cggctcagag gcggtggcag gtgaattgct 1140
gcggcgccgg gtaggggcgg gcgcgtggga gcgagtcagc ctggccagtt tcggcccagc 1200
ttccgaagga tggtgcttct tgcaccccaa cagagtggct ggcaaccccc caggggagcg 1260
cgcaggatcc cagctgatcc cacccgggtc ggctaaggag gtttccattt cgtccagagt 1320
ccgaattgat acccacgtgc atagaaacgc cacttgctcg gcaaagggca ctgaagagcc 1380
accgtcctgt ggatgggcag ggtggggggg gggctggagg aggacatggg aatccgtcac 1440
tttcgacctc ttccggtggt tcacttaccg ggaatgcgga agagtgggtc tccccctcgg 1500
gtcgccccca taatggtgag aggcaaactg tttaaaaaca cccttgcctc tctcctctac 1560
tgtcctcaca acgagcgcca gggggcggcg ctgtcgagct ctaaacaaag ccaaggaagt 1620
tggagaagtt tcgggctaaa aagggttaag gtgtaggagc acagagtcct ccttctgggg 1680
ttggaagctc cgttcccggg cagctcagcg tggattccgc tgcgttcacc tcttgcctcc 1740
agggcccagt agatcctggg ctttaaacaa gaacagagag tatggcgtct gccacgtgcg 1800
acagacacgc accggtgggg tgggccgggc tggactggac tgacctgcag tgaccaaacg 1860
ggtggggcgt ggacactctg aaagtgaaaa aggcaagcac gactgtcccg ccgcacactc 1920
cccagcgcct tggggcagag agcctccaaa cgtcccgctg agttgagctc ttcgctggga 1980
a 1981
<210> 195
<211> 661
<212> DNA
<213> Homo sapiens
<400> 195
ctccagcacc cgccaacgtg cctttaggag cacggcaggc accacccccc cgcccccgct 60
ccccctactc tggggaacta cctctgctca ccgccttccc gtggccaaac ccaaatatga 120
gttccccgaa cttttcagga gcggacgcgc tcacgggtca aatccactcc cctccaaggg 180
ccttaacacg ggcgcccagc tacctcggag aaaagccagc gggtagggcg gaggtattgc 240
tctcggtcat caacgcaaac atcccctcgg gtgcctacag cggcctgctt aggggagcag 300
cgtgttcaga gcaaatggag agcttcctgt atctccgagg aaaaaagaaa agccgccgcc 360
ccggcagcct cggcctgctg gggacctgtc ctccccacta aaagcgcgcg ctgcccgagg 420
agctgcccgg gagagaacgc tccaccccgg gcgtcggtgc cgctcctcgt ctcgccgccc 480
caaacactca agtggcagat tccgacaagt gggaggcagc aagtggaaat attcgcaaca 540
accgcggaaa gttactccag cccggggggc cggcaggaaa ctgaagcggg gaacttcgcc 600
aaacgcgggc tgccgaggga cgcgaggggc cgggctcgct ggccggggcg cgcggggaca 660
c 661
<210> 196
<211> 361
<212> DNA
<213> Homo sapiens
<400> 196
gtcggaagct cgggggtcgg gcgggagcct ccggaagggc cccgcggagc cgggagtccg 60
aggccgcgcg cacgccgaac cgagcgtacc aactccgcgc ccggacgcgt ggcgcccccc 120
caacccgcag tcaccgcggg ctacgccact cccacccggc acacgcgaca cccgccgcgc 180
gcaggctcct gcttgcaggt ccggccgctg ctcgggccaa gtaaacaccg ggctgggaaa 240
gctcgctgcg gagccgctcg ggggcaagcc agccccgcca cgcgcgcctc cgcggccccg 300
ggaagtcagg ggcgaccgct gcctgggcag tgacggcccc tctctgggca gtgacggccc 360
c 361
<210> 197
<211> 181
<212> DNA
<213> Homo sapiens
<400> 197
ctcggcgcac aggtgtctgc gcccaggccg cgcgctaaac acgtttctaa ttagcatttc 60
tttaaacaat gctgatcaca atcttgccac cgtaatccac tccaaatgca tcgttgagat 120
tgcagcacgg aaagcgagag aggaaattcg ctgcgaatct caaactttct tttgtttata 180
t 181
<210> 198
<211> 1861
<212> DNA
<213> Homo sapiens
<400> 198
cccgggaaag acctcccaag caggttctgc gaaggggccc caccgccttc agcccgcctg 60
ggtcagcctt ataaggggga aaggggacag aagtctgcag aacagagatc ctagcgtagc 120
cgctcagggt accttcccag gtcaccattg ctcctctgcc ctctccacat ccgccctccc 180
gtgagcgcag gatgcacgca caggcagcgg ttacaaaact cagcgcaacg ttgcaacccg 240
cacaaaaggc gcacacaaaa tcattaaaaa gaaatacaca gagtggaaag aactcgcaca 300
agctccaact cgctaaaggt ggaaggagtc aggttacaaa ctctccctcc ccggcctaaa 360
tgctttgctt tagtttgcag aaaatcgttt gtcagttttt ttcttggtta ttcattattc 420
gggcaaatgc aagtatgttt tctagctgag ttcaccaatc caaacctcaa accacattcc 480
tccactccag gcctccgttc tgtccgcgga cttatgatcc tgcctgccag caggagtcta 540
ccctgaagtc gcgtgggata gataaagtga ggagaggagg atgaatggac agacaaacga 600
gagcaattct tctacctgtg ggctgtccta cgccttgcag tgccgggtcc tgcggcgacc 660
actgagcccc ttcgtcctcg ccctcagtcc cttcgtcctc gtcttcggtc tccgctttcc 720
cagtcggccg gggctcgtcg tccacgaccc cgcacgtgcc gccgacgtcg ccctgccgat 780
tccgccgcag gaggtggaac tgtagtggtg ccggcggctt ctcccctggg gcggcggtgg 840
cgaggcgctc gctggcggcg ggcagcggct ggatgaaata cgcctccccc agcaggtaga 900
aggcgccgcg cacgccctcg cagaggctga gggcggcagc cgagctggga tcgccattca 960
cggtgccgga gtagaagcag tgcgccaggt cggtttccgg aagcggcgtc tcggacccgg 1020
atttgcgccc cacgttctgg agcgtgaagc cgggcgccaa aaagctgctg tcgggccgca 1080
gctccagatc cagctgctgg tcaaaggcgt gcaggcggag gcgcgtggtc ccgtgtcccg 1140
gggcgcgctc cagctccggc accactagct cctcgtcctc ctcggagggg cgcccgagtg 1200
cgtccgacac ggccagtagc gccgcggcga gcagcagcag cgtgggtact ggcccaaagc 1260
tccgagaccc cggagcccgc tccgcgttcc ccatgtcgct gcccagcttg cgccttccga 1320
acccctcggg cacagctcgc tgcattggag ccccaggaga caccgctcgt agcagcgcac 1380
ggagcgaggg acctttagtt cgggtcggga gagcaaagcc tcgttggcct gctctggatt 1440
gttaaaatta acaatttcta ttattcgttg gaagggcgcg cagagccggc tacagccgaa 1500
gctcccggag tcactaaaag gaggcgctgc agttctgccg gcgcgcggga agtttttctt 1560
ccagcgcaaa gttggagaca ctgagaggca ggcgcaggca gagtggctct gctgggacaa 1620
gaagcgctct ggggcgcctc cggggctgag gcaacgcgga gattggtgcc tggcgcccct 1680
cttcggcctc cgccttggct gcgatgttgc tcactctgct cagggctctc ccctctccgt 1740
ccggtagcgc accctggctt tgcaatagcc cctggctcgg agccgctttc cagcgagtgc 1800
aagaaccggg cagccgagcg gtccttttat agtggaccag tgaaaccccc acccccaccc 1860
c 1861
<210> 199
<211> 781
<212> DNA
<213> Homo sapiens
<400> 199
gcgtctggga gagcgaggcc gagcaaggaa agcatttcga accttccagt ccagaggaag 60
ggactgtcgg gcaccccctt ccccgccccc acccctggga cgttaaagtg accagagcgg 120
atgttcgatg gcgcctcggg gcagtttggg gttctgggtc ggttccagcg gctttaggca 180
gaaagtgctc gctctcaccc agcacatctc tctccttgtc cctggagttg cgcgcttcgc 240
ggggccgatg tagaacttag ggcgccttgc cgtggttggc gcgccccggg tgcagcgaga 300
ggccatcccc gagcgctacc tccccggagc ggagcacgcc ggctcccagt actaggggct 360
gcgctcgagc agtggcgggg gcggaggggt ggttcttttc cttctcctcc gccagaggcc 420
acgggcgccc ttgttcccgc cggccaggtc ctatcaaagg aggctgccgg aactcaagag 480
gcagaaaaag accagttagg cggtgcagac ggtctgggac gtggcagacg gacggaccct 540
cggcggacag gtggtcggcg tcggggtgcg gtgggtaggg gcgaggacaa cgcagggtgc 600
gctgggttgg gacgtgggtc cacttttgta gaccagctgt ttggagagct gtatttaaga 660
ctcgcgtatc cagtgttttg tcgcagagag ttttcgctct taaatcctgg gggtttctta 720
gaaagcaact tagaactcga gattcacctt tcgtttccct ttccccaaaa gtagcgtaac 780
c 781
<210> 200
<211> 361
<212> DNA
<213> Homo sapiens
<400> 200
gagaggggct tgtcacacgg gcccctgcct gcagtgtgac ccttctcagc ttctctcagc 60
agccctgcct gcagagtgtc accaccacca tgatcatttc cctgacactg cgagggtcgg 120
gggacgtcct gggtagagac agggcccgtg gcagcagcag gctcaggggc gccctacact 180
ggtgggctgg ggacctggtg gagaccacgc caagggctgg acaaggggac gagcctccac 240
cctggcctct ccgcaggcct cagcagcccc tcccacaggc agaagggttg acactgggtt 300
ctgccctcac tgcaagagct gcaagtgcca cgtgctgttc tgcccaatct ggtgtctgca 360
g 361
<210> 201
<211> 421
<212> DNA
<213> Homo sapiens
<400> 201
caacacccaa actaaaacct ctcacctgag tgtaagggcg tgctgacctt cttaagcaga 60
gagctcttcc atcagggggc tccctaaggg catctctgtt cctagcggcg aagccctcac 120
cccactttgc tctgcttagc ctgagacacg caactttctc cagcctttac tcttcgctga 180
attctcacgg cgggcttgcg ggtacgttca ggagcgaggt tgggggcccg gcccgctggg 240
cgctgttcac aggtagcttg gaccagagca ggggcttcat cattacctgc ggggacaggt 300
gggacacatg catttccggg gtcatcccag acctcctgga ggatgctgat tgatgctgtc 360
ccgtttgaga actactgtgt ccaggtagca gaggcctccc cgatgcccct tgagtagtgg 420
g 421
<210> 202
<211> 541
<212> DNA
<213> Homo sapiens
<400> 202
ctaacactgt agactgtagc gcatcgaatc attagacaat gaccattcac tttagggaaa 60
ttaattctaa aattaccgac ctcttttggg agagtcgaac tgattatcac gtctggcaaa 120
atccattctc acgtgagtgt cgtcgtcgtt gtcagaatct tctctctccg ggggtcttgg 180
cacccggcga ctgcgaggtg gtggttccgg agcggcagct gcagcggcag ccccgccagc 240
ctggttatca cctctggcaa ggtttgcaga tgggttgtgg gctccagggt tcgagccacc 300
ggcaacgtct tgggctcccc ttactgcttc ggcatcagca gcattagcaa caggttgaaa 360
ccagcgggca gaggcggagt caaatccagc agctgcggct gctgcgccga tgcccggggc 420
tgcggcgagc gcggaggccg cagctacaac ttggctgagg gctaaagtcg gctctgcagc 480
cgaagcgaca gccggggctg aggatgggga aaggtctctc tcgaggctgt ctgttggaaa 540
a 541
<210> 203
<211> 421
<212> DNA
<213> Homo sapiens
<400> 203
aaggcaagac taagcattcc acattcatag agtaagggga cacttgggga gtttttaaag 60
atgagtgctt aattatttaa agagaagaca tacgttttct cttccatatt tataaattac 120
tgttcgctac caaagcattt ctaaagatgc gagcgttgtg cagtcggtgg acttggcagc 180
gctgtcgcag ccacctgtgc ggcatcatac agcagcattc aacagatgct tcaagaaaac 240
tgcgatgggt ttttgctttt cgaaacagaa cttgggtgcc gacagtatgt tcactgccaa 300
attaaatttc aaagcctgaa ttcagtggcg atggagggaa tcagaggatt cccaaaatgc 360
cccttttgga atagactgga cagctccttt cacaaatatg gaaacagagg cacagagaga 420
a 421
<210> 204
<211> 601
<212> DNA
<213> Homo sapiens
<400> 204
aataagctta acacagaaag ataatgacac tcccacggac tggcacagaa ggccgcgctc 60
cgaatgacat cgcgatcaca gaggcacaga cagcgtcaca aagccccacg cgtactcaca 120
ccgaaggctc agccgtcgcg cgtttccctc ccaggcccca ggaactagta actagggacg 180
cttctggtct ctaggcgagg agagggggag agcgcaatct ttgcgcctgc gcacactcct 240
gctcttaccc gccggaaccc tgggccacgc ccggctcgcg taatcacgca ctgcgcaggc 300
accgcccgct ctgctctaag gtccctctca ctccttcagc agcccgagga caatcccctc 360
aacactaggc cacgccttgt ctccgcccct ctcgtccgac ccctggagag aggctggcgc 420
ctgcgcgatg gggggttcca gcgtcgactc acggagtcct tcggatgaga gcgtctgggt 480
gccagacgag gccgggggtt tgttttgggt ggtttgggag tccgagctcg agggctgggc 540
caggaagggc aggcgaggcg ggcggctccg acgcgggtcg cgaaggccca gccgcgtcct 600
c 601
<210> 205
<211> 541
<212> DNA
<213> Homo sapiens
<400> 205
ggcgttcggg gcggcttggg gcggcgggac cactggagtg agctgtggga gagatggggg 60
tgtgcctgtg tgtaaaagat ctgtcagagt gtgaggctcc gtgagagggt gtggtttctg 120
tgtgtgtgtg tgtgtgtgtg tgacagaccg agagtccagt gtgagaccag ggtatgttcg 180
tgtgtgacag agcgagacgg gccagtgtga gagaccagtg agtgtgagag agatagggat 240
gtgcctgcat ttgaaagaga gcgtgtgaag ctcagtgaga ggttgcgagg tgtgtgggtg 300
tgtaagtgtg taacagacca ggtgtccaga gcgtgagacc aggatgtatt cgtgtgagag 360
agtgagacgg gctggatgga gtgtgagaga ccagtgagtg tgagagatgg gcgtgtgcct 420
gtgtgtgaaa ggccggtcgg tcggtgggtg aggctcaatg agaggccggt gtgtgttcga 480
gagagagaag aatcaccatg tatgcgagac tagactgtgc aagaacagag tgtgagactg 540
t 541
<210> 206
<211> 1141
<212> DNA
<213> Homo sapiens
<400> 206
ctcgtgatcc tcctgcctcg gcctcccaaa cacaacctcc acctttcagg ccgctccgcc 60
cgcaggggcc caaggcgcca gctccccatc ggtcttcggt atcctcacct aagccctttc 120
cagtcatccc ggatgggaac ttgcagacct gagccagttc tcctggggac caaaatatct 180
cacctcccag atctaagggt cccgccagga gtgacgaaac gttcgaattc ctgcgagaaa 240
agtggcaggc caccaggccc tctgggaaat gtagtccaga gcgggaccca cgccgattcc 300
tgtcagctcc tcgcctgggc ccacccgaaa cggctgctcc ctcaactctc aacatccagc 360
cgagcctcgg agttgcgggt cgccgtagcg ctgcgcaatg gagatgagcc tcccggggaa 420
cccggcccaa gcctcaccct cacacaggaa agcagatgtg ttctggccgg aagttgagtg 480
gggccgcggg gcctgctggg aggtgttgtc ctcggaaacg tcgctggcgc ggagggatgg 540
ttcggcgctt taggcgtctg tcacagacct atctgcgggt cgccttcacc cagcatctca 600
gaaactgcgc gcgggatgaa cattcgggtg tttccggcag gtgacgctgc cgagtccccg 660
cagcaggggg cgagcaaggg actcgcggtt gacgggacac ggatcctcta aggcccagag 720
tgtcccgagt agcggcagtg gggagtgctc agggtacgct aatggtgagt ggttgcagtt 780
gatgggacaa aaaactgtga tgggagttag tgtgggtgtg tggttgtgtg tgtgagtgtg 840
acggcacgaa taatctgatg gggtgattgt gatatttggt tgcgcgggat tatgatgaaa 900
tgtgtgatat gtgtgtgatt atgattaagg ctgtagcgag tgtgaacgtg gcgaagtgtg 960
cgtgattgta atatgtctag tagttcttgt cttgagctgg cttttctgta gcatttggca 1020
cagttggtaa cggcttgaaa aacacttatt tgttttctac tgatcctccc tccttgttgg 1080
ccactcctct gtagtcttct ttgctgtctt ttttacccta gtagcccttg gccctttgta 1140
a 1141
<210> 207
<211> 901
<212> DNA
<213> Homo sapiens
<400> 207
ccccctggag acaaggtagg ggggagcaga ggaggcaggc gccgcggagg accctggccg 60
acctctagtc cctccgccgc cgccaccgga gcggtgcgtc ccggggctcg agcgcagccg 120
agtacccgcc gaaggctgtc cccatcagtg cgtgtctgct gccgggcagc ggcagcatcc 180
aacctgcttt attcctcctg cctgcagcgc cacagcgagc gagcgagcga ggagggggag 240
agagggagtc tgtctgcaaa gtgctgctcc ctggtgctca gaggcggctg ctccagctcc 300
aactctcatt catttcgccg gttaacatga gagatcatgg ccgccttcgg gcttctcagc 360
tatgagcaga gaccgctgaa gcgcccccgg ctcgggccgc ccgacgtcta cccacaggac 420
cccaagcaga aggaggtaag ggcgccggcg gcctccccgg caaccggggc cgcgctctgc 480
agcactgacc cggggccaag ttggcccagc gggcatcgcc ggcgctgcgg tggaagaggt 540
cggggagggg gattagaggc gggggccagg ctgggggtgc tgggcgaccc cccggcggcg 600
gagaccgagc ggctgtcagt ccccgcgctc cactggggcg ctcgctttcc atgtgccggt 660
cgctttcccg ttgccgggcc ttgcacggcg ccgccgggcg cttctcgggc ttcttccctg 720
ccgaaacctt gctcgctctc acccgtttct gcctgcttta tttttcttct tgccgcttcg 780
gtaaatcgtc gtaaactttt tgaaaaatgt tggaatgcag tgcatcctac actgaggtct 840
tgcgttttgc ttttgctggc cagggacgaa ggtgaggggg aagcttttca aattttccag 900
t 901
<210> 208
<211> 841
<212> DNA
<213> Homo sapiens
<400> 208
aaagttagcc cgccacgttg aacccctgtc caagcggcgc tatgccaagc tctccggcag 60
cctctcccct acccaataca gttaatcttc tcctctttgt aaacccccca agtgacgcgg 120
agcaaaactt aatcggtcca gggaacccag acacgtcttc cgcgccgcac ggacttccca 180
gaaggagcct ggaggcaggc gctggatccc tctaggcacc tccgtccccg ccggctcccc 240
tcccccgcgc ccgctgggcc actcacccgc gtggggcatg gtgatggtct cgttggtgtt 300
ggagcccacg ttgaagatga ccacggctga ggcgttctgc aggaacgcgt tccggatctt 360
atccctgtac gtgcagttgc ccttggggat gagggctatc cagttcttgc cgcgggtcgg 420
ggcggcgaac ttggtgttgg ggtcgcaggc caggcggtcg tgggccgagc tggccatgac 480
cacctccccg cgggcgtcct gcttgggcga gtgctctccg tagcgcccgc actccgtctt 540
ctccgtgtgc agctccgcgc cgccgccgcc cgccgccccg gccccggggt ccggcgcggg 600
ctcggcgtag gtgatgttca cgaaggcggt gtaccattcc tccttctcgg ccacggtaaa 660
gtccaggcag agcagatgca cgaaacaaaa ggaaagcagc catgttgaga gagccagact 720
gcagcacgct tggatgagag acattgccat ctttatccgc cggggccccc tccccgcccc 780
cgcgccctcc ctccgtcccg tccctcctcc ccagccccgg ccaaccccgg gccgctgcct 840
c 841
<210> 209
<211> 421
<212> DNA
<213> Homo sapiens
<400> 209
gctttttcag atttgggatc ctccccgggg aggacctcct ggcgccccct ggcagtttcc 60
cgccgcctag ggccgacttt tccacctcca gctcccgggc gggggaggcc ccgtacggcc 120
gcttagacgg gctggggcgg gaagattgca gcggctttgg gtttactcct tgtttcttca 180
taatccctag tggagctggg tcaatttcag gcacagccca tccgagtcag gcgaggtcca 240
gaaaggcctg actcgcctgg cagcctcaac ggacttgtcc ccgcagccgt tgactagccg 300
ttgacgagcg gacctcccgg tcgtcatggc gactgtgaaa tgtagggtgg agcgcatgcg 360
ttcgaagcca ttcgcgcggg cagtccctgc gtgtccccct gcgtgtcccc ccacgtgctc 420
c 421
<210> 210
<211> 950
<212> DNA
<213> Homo sapiens
<400> 210
actccgcagc cgctctcagc tcagtcctag gtggaaacgc ctgtagcttg caaggtagcg 60
cctgtggctt tctggggaaa aaaagatcaa atgcctccca agacaccagc gacccaaacc 120
ggggatgcag ggagctcgct tggccccttt gaaggccgac tccgcaataa gcagtttttc 180
ctttaaataa ccgtagtgga tttgagagaa ttttccatgg ctgaaaagag aaacaggagc 240
tgtaggcaac atccctaaat ttataataat gcatgtaaac atgctacata ccacatatat 300
gtatatgtgc ataaatatgg atgtggttgg gcacatacct atctagacac cattgacttg 360
cctggtcaaa gaataagact tagacatttc gtgcctggga aatggtgcag tttatcttta 420
aggagactag aaaaataaga gatgaggctc acgttgcacg gatgacatca ctagcttttg 480
gctgcgcgct cggtgttctc gtctgtgggt tttagccaag gctgcagcta cccgcgccgg 540
acgagagagc gcggcagcag cttcctccgg cgcccgcacc cgggcaatgc gatttcccca 600
gtcccctggg cgcagcctgg gctctcgcgc ctcccgggca ccagccgagc ctgcgaggcc 660
tcggagccgc cgcggctaga ggaggaggcg acgaggggaa gccgagtgac ccagcctccc 720
tcccccaccc tctccccatt catctcggcg accaccgcgc gccgggagcc ggatcgtggg 780
acgccgaggc caggacggga ttctctgcac gctgtcgagt gagccggcat ctcggcgccc 840
gggtgggctg cgaagaaaat ggtgcaatct gagagcgact gagcccagct gggcagagca 900
gacggggtgc cagagtgcca agggctcagg tgcctggaga aaggggcgga 950
<210> 211
<211> 661
<212> DNA
<213> Homo sapiens
<400> 211
cccatttgcc gccctggcgg ggcagggcga tagggagact caggccgtcc caccgattgg 60
cgcgtgagct gaggcaagac cggagactgg tctcccgggc tgaactttct gtgctggaaa 120
atgaatgctc tgagctttgg aagctctcag ggtacaaatt ctcagatcat cagtcctcac 180
ctgagggacc ttccgcggca tctatgcggg catggttact gcctctggtg ccccccgcag 240
ccgcgcgcag gtaccgtgcg acatcgcgat ggcccagctc ctcagccagg tccacgggca 300
gacggcccca ggcatcgcgc acgtccagcc gcgccccggc ccggtgcagc accaccagcg 360
tgtccaggaa gccctcccgg gcagcgtcgt gcacgggtcg ggtgagagtg gcggggtcgg 420
cgcagttggg ctccgcgccg tggagcagca gcagctccgc cactcgggcg ctgcccatca 480
tcatgacctg ccagagagaa cagaatggtc agagccaggg tgggggccgg catgacggaa 540
aggaagcttg tgtagagccc cctcaccgcc aagcagaccc ccacacaagc cccaggtgtc 600
taattacccc tacatttgct tccagtttcc aatttccttc ttgagttctc tatccattct 660
t 661
<210> 212
<211> 661
<212> DNA
<213> Homo sapiens
<400> 212
cacagggctg atggtgacga agtcgcgggg ccgcgggccc agcagctgcg ctcgggcgga 60
ggccggcccg ggacccgggg ccgcagccag cttgaggcgc aatgtgcgca ggaagcggcg 120
caggcggtct ggggggcagt ccgagagcag cagctgcact gcgccggccc cgggggtgtc 180
gtgggcgggg agccgcaggg tgctgcgccc ggcctcggcg aaacgcgtga agaggcgcgc 240
ggcgcgcaga ggaaagcagc gcggccgccc cgcgggccct ggcgcttgca gccgcagcat 300
caactcgcgg cgctcgttgc gacccaggct cagctccgcg gtgcgcaggg cctggcgcct 360
tcgcggctgc ccgcccgggc tcagctcctc cacagccacg cggcaccgca gctccgagtc 420
ctcatattcc cctgccgccg cctctatgcc cgagagcatc gtcaccgcct ctgctggtct 480
gcgaagacac cggagcacag gggtcatgag gattcatgag acgtaatggg tgctataggg 540
gacgtaatgg gtgctataaa ggacgtgaca gggagcaggg tcaaggctac acaagatcac 600
gaggactgtc actggtaaca caaagaggtc acaaagacgg agaaagggct ttgggctaac 660
c 661
<210> 213
<211> 421
<212> DNA
<213> Homo sapiens
<400> 213
cgaggagcta gcgcagaccg ctctccgccc tcagctgcgg cgaggcaagg gctggcagcg 60
ctcggacgcc tccgtcttgc ccttcccatg cctaagcgcg gggaattaca cgttcccggt 120
gtagaacaga cgatcggggc tattagggct gggcggtggg agtgggggtt gggagcacca 180
tttttggctg gacgtgtgtc cagactcatc gtctctggtc cttaggaccc catcttcctc 240
tgcatctcca ggtgtcggcc cctctgtacc cgcctcccac ggggctcgtc cggcgaaggg 300
cagccgcagc ccacatctac tccccgccct caatccctgc cccctctgcc cgccgcagtc 360
actcgcctgg ctgggagcaa gcctcccctc tcgctgaggg tgcagagagc gcctagggcg 420
c 421
<210> 214
<211> 601
<212> DNA
<213> Homo sapiens
<400> 214
atcctgcaga gggcaggagc atgagggaga gtgccatccc tcagctgaag gccactgtgc 60
cttgtatttc tggtttgggc aagtgaggag cctgccagcc cctggcagga agtgcacgtg 120
accggcggct ggccaggggc acagagacgc actccacaca gaaacccagg ctggcggggt 180
gggcggccgg ggagccagcc ctgcagatgt tactaagtga aacctgatgt ggtgacatga 240
gaatccacag aacgtctcac aaacaacctg ccccgggatg ttttggattg agttttgtgg 300
ttatgacgtg aagaaacctc acatgtcagg ataaaaataa ccctggcttc agtacataac 360
gcgagttaca gttcaacaga accagatgtg aaaacgtcag ccacccagtt caggcccagc 420
agggtccctg ctccactccg gcctccctcc ctgctggggt tggggtccat gtgcccggac 480
agcccgttgt gggctcaaga tctgctgcct ggaggataca agggaagggc cagaggccgc 540
tcaggggagg cagcaccacc ttctccgagg ccagctcctc ttctgtgaac caggcagggc 600
t 601
<210> 215
<211> 1021
<212> DNA
<213> Homo sapiens
<400> 215
ggtcgggagc cacagcttct gaatattcct tcggaacttt tttctcactt gattcccaag 60
cctgtcatgg ggttcttttt caatggcact gacctgcaat tacccaacga gcagcgggac 120
agccccgggc aggacgcatc ctgggtgggt gacgtgatcc cgcagtctcc tccccgaccc 180
catatcccat acaatgatcc tcgcttacag aagtcaaggg ggaaagatga cgctttcaaa 240
gcccgaatct ctttaccctg gagccagaac cagcgtcgcc gccgtcccct gcagctcagc 300
cggcaacgcg cgccgagcct cggggcgcag cttggagacg cgcttgctcg ttctgggaag 360
gggcacggga cgcacggttc cccggcccca gctgcacagc tcagctcggg gctctcacct 420
atcctcgttc agagccacat tcggctgcct cccctgacca cccgacacaa agagattcgc 480
cggtggaaag aatcgatttc aaaattcaag ctcaccgctg ctcaacaagg cgcgcacgtt 540
tctccccgtc tggcttcaca tgtcccaaac ttccagtaac agaaatgagg aagcagcagc 600
cttccccggc tgctggcgga ggcagtgggt gtaacttgtg aagtttcgtg ctatgatgaa 660
tctggtcact tgggtgtgtt ggagagggtt ggtcgctcct cccttcctcc tcccaccatc 720
acctccctcc tctccgcctc cctctccaat ttaattcttc cctctggcat tcgccggctg 780
tcactcagaa tcccagcacc ctccccacca catccttggg ggcaatgtat ttcgaaaagg 840
tcttaaccat tttacggatg aacctggtca ccctgcacaa agcgtgagtg cttgtcaaat 900
aattttctac agcacgtggc aaaaaagcag cgcctcttaa aagatataaa aggccagcaa 960
tgttacataa gcgcccccca ccagcccttc aaggacagaa acgtgggtag ttcattcagt 1020
g 1021
<210> 216
<211> 241
<212> DNA
<213> Homo sapiens
<400> 216
gcaagaaacg gctcccggct cgcgtgtacg ccgacacctc ggcccaacgc aggactcgag 60
gtggtttcta gtgcccgggt ggctgcaagt ctgccctccg agggaggctg gacaagcggc 120
gcccccaggt cgagcggcct ctcgctgcct ggcagtgcct ggcagccccc acctctgcca 180
gtgcttcgga aacccgcctg gccaggttcg cccgcggtga aaaatgaaag caaattcccc 240
a 241
<210> 217
<211> 1021
<212> DNA
<213> Homo sapiens
<400> 217
agccggaact ttcctcgacg aaggctccct cctgcgcctg tgtctggaga acccccagag 60
cgctgcaagt tagcaagaga gattcgatgg cggctctgga aggcgcacga agggtggggc 120
gggggagcaa agaggccact gggtgaccca gcctggtccg gggtgaaacg ctagagaagg 180
cgcctcgcct tccttatttc aatgcaactc ctcggcccca gacggtaaaa atagtttcca 240
agctgccgcg gacgcccagg atgtgtttgc agagatcaaa ctggggagga ggcagctttg 300
taaaagttgc agaaagatta gccgagaagc gtccgcccgg cggggctcaa gaaagcttgg 360
ggacagctcc atgttccttg gggcggaatg gcccaagaat tggcctgggt aaccccctgc 420
ccagttctct gtcctcactt cgagccagtg cttaaataac ttcccgccgc ctgccctgca 480
aacttcccgg cgcggcgccg ttgaggccag gacacagcaa aggctagcaa aaccccgccg 540
cggcgcgctc ggccccggcc ctgagaggct gcgcgggtgg gaggaccagt gtggtttctg 600
ctcccactcg gctgcccaga ccctcaagac cgatccccca actcctggga gcgggtgctt 660
ccctctggga gccgagatct tgcggggcca gcgagggcgc aaagtgcgcg cgctggcccg 720
cgcgggggcg gccgcgcgtc tctccgcggg gcctgtcgcc aggccggccg cggcgcgtga 780
gtgatgaggg cagagaaggg cgcccataaa tcgcgggtgt cagggcgaaa aactctcttt 840
attgtctgcg tgatggatgg gcccggggac gagacaccaa atacttcgta tcgcctttaa 900
atgggaacac attttccgcg gccataattc atgtttttta aatagaaagt ttgaaatgtt 960
gcctatattt caccagccct gacatattta tgaatcgctc cctgcatgca aatatcatta 1020
c 1021
<210> 218
<211> 181
<212> DNA
<213> Homo sapiens
<400> 218
agggtgaggt gcggtgaata gccgtatccg gaaaccgagc gtgccccggg cttctttccc 60
gccgccagac cccgcacagc cgccctggga cgtttttcga ggcttgggac ctaagacggg 120
tccccggacc ctgctgggaa accagggggc gtttttcgtc cctctctgag gccattatcc 180
a 181
<210> 219
<211> 301
<212> DNA
<213> Homo sapiens
<400> 219
tgggcagggt ggactcagag gttgggaagc tgctcctgag aggagaagcc tctgtctcta 60
cacaggaacc tacctgacac atgaggcaaa aggctccgac gatgctccag acgcggacac 120
ggccatcatc aatgcagaag gcgggcagtc aggaggggac gacaagaagg aatatttcat 180
ctagaggcgc ctgcccactt cctgcgcccc ccaggggccc tgtggggact gctggggccg 240
tcaccaaccc ggacttgtac agagcaaccg cagggccgcc cctcccgctt gctccccagc 300
c 301
<210> 220
<211> 361
<212> DNA
<213> Homo sapiens
<400> 220
ggcgagactg acctggagat gataaggcca gttgaagaga cactggagaa gagaagacag 60
tttgttttac acattgcagg aaatcagatt agacagttag ggtgtggaca caaaagcgag 120
gaccttgcag gcactgggga gaagtgaccc cattcaatag tccttggtct ccttctgccc 180
tgcggctgcg cttcctcggc tctcacggca ccagcagaat tccatgtgag agggagcttg 240
tcgagcgtgg cctcttccca cttggggctg ctttctgcat ccctgtgcct ggctgtgggc 300
ctccatttgc cctctactgt cttcccttag gacatcattt atgcagagaa aggttcgtgt 360
g 361
<210> 221
<211> 241
<212> DNA
<213> Homo sapiens
<400> 221
gggattacag gcgtgagccg ccgcgcccag ccccctcctc actctctttc tcttcctgta 60
acttctacag ctgggcaaga gctgggtctc cagcggttgc acggagaagt gtgtctgcac 120
gggaggagcc attcagtgcg gggacttccg atgcccctct gggtcccact gccagctcac 180
ttccgacaac agcaacagca attgtgtctc agacagtaag gggagcgacc ggggaggttg 240
g 241
<210> 222
<211> 361
<212> DNA
<213> Homo sapiens
<400> 222
tagatggggc tgagggcaga ggaaggaaaa agaaaacctc cgaggtcagt gcggggcgag 60
gtgagcccct cccagggccc tctggcccag gaggatgaag cgcgccggct tcgctcttgc 120
acgccggctt gccatccggg taagcgcggg aaaggcggcc acagggcgcg gcggcagcgc 180
agcgcgtggg atctcacgac ccatccgtta acccaccgtt cccaggagct ccgaggcgca 240
gcggcgacag aggttcgccc cggcctgcta gcattggcat tgcggttgac tgagcttcgc 300
ctaacaggct tggggagggt gggctgggct gggctgggct gggctgggtg ctgcccggct 360
g 361
<210> 223
<211> 781
<212> DNA
<213> Homo sapiens
<400> 223
ctgtcctatc tttttttttt tttttttttt ttttttttca gaaaagatag cctaaaaggg 60
ttaagaatcc cagcaagaca caacatagat gggctgaaaa ctcgtggcag gatggaaggg 120
tataaagacg ccggggaagt ggctggggaa taataaaata agagggaagc taaaccagtg 180
acccttgtcg gcagtgaaaa gcgggagatt agaaaatgtt tcatgctaat ttccatggag 240
atttctttaa tttagcgaag actgcttccc gggctccgcc tggcccgcgc cggcccgcgt 300
cctcggtggt ctgggcgccc cggctgagcc gctagcgggt cactcgggcg gctccgacgt 360
ctctatcagc cgcgcccgcg ccgcccgcct ccccgcgctg ctgcccggct ctcgggctct 420
cgcttttttt tttttttttt ctttccgcgg cagtcttagg attcttgtca catgatggct 480
tcatcgggcc cttctcctcc tgatcctttc aagctctttc tcctgcctgg catatcaaag 540
gagatttgtg ggtcaccgag ccgggacgca gcatataaag tcatcagcct ggccggcacc 600
acctcgatca tttgccgcat tgttcttgca aggagcccag gatggctgtg gctttttaat 660
aactagctta gtagttagcc gaaaaatctt agtttttaaa aatacaaaaa aaaaaaaaaa 720
aaaaaaagag acagtctgat agtttatttg tttttccata cactcttaat tgaaactcag 780
t 781
<210> 224
<211> 241
<212> DNA
<213> Homo sapiens
<400> 224
ttgagagctg ggaattgatt tctaagcctg gtttgagctg agggccacag agccagtgca 60
ggaggagacc ctgccccaga aataggccag tgcttgttat gcaggccttg gcggttcccc 120
gtttccttac gtaacctcag tgttcacgct gtttcctttt gttgattccc tccgtgtgac 180
tgtttttctg tcaatctcct tagctaatga gctccttata aggagaatgg atggatcaga 240
g 241
<210> 225
<211> 301
<212> DNA
<213> Homo sapiens
<400> 225
cagggcgccg ggacactgct tggcgcgtcc tgggagtgaa gcgcattgaa cccagctcag 60
gctggtggtg ggggagtctt ggcaatgctc tctctccaaa ggcgagttga tcacagacgc 120
tggcagtgag tcagcggcac cgccagggct gctgagaaat ccctcctgct gtccgatcgc 180
attcctggaa gggtgggccg ctcagggccc cccagctcca gtcccactca ggccccagaa 240
tcccagcagc ccaccactca cttctttgcg ctcactcttc cttctggtcc ccacacaccg 300
c 301
<210> 226
<211> 349
<212> DNA
<213> Homo sapiens
<400> 226
ggcagcgcgc acgggaggga gcggcggggg gcgggccggg agcggaacag ctcgcggctc 60
tggaatgcca ggcatccagg tcacccgcgg ctgcaagatt aatggctcca gcgaggagcc 120
aagaacagct cggcgctcac tcgctccccg gggagcggaa acgcctcccg gccggccccc 180
ctcttctcac ccactagcaa gctcccagaa acccgcccca tggcttcctt tctttggcag 240
agtcaggctc cagaagtccg ccttcctcca caggcaccct aatctgccgt gcccttgcag 300
cttctcctcc ccagactcct cagggaaacc ccagggctgc cccctcccc 349
<210> 227
<211> 412
<212> DNA
<213> Homo sapiens
<400> 227
tggatcccaa caacaggaaa ctacctaaat caccgaccag ttctggtgct gcccgcgaag 60
ggctgcctcg cccgccgccg ccgccgcctc cgccgctgcc gccgccgcca aggagagaac 120
cctgccatcg cgcctggccc ggcccagccc agcccctagg caacctgcgc ccgccagtgc 180
aacagagtgc cccaggcggc cgcaaatgcg tcaaggaagg ggaagccaca ggccccagta 240
aggtattcct gggagggaga gggaggaaaa gagagggagg aaaggcaggg agagaggaat 300
aaaggcgggg agcaggcgag acgagagcag ctccgagaag cagtgtgcgc gccgctttcc 360
caaatcttgc agcccagcga gccggcgcca agaggcggta gccgtggaag gc 412
<210> 228
<211> 181
<212> DNA
<213> Homo sapiens
<400> 228
tggaggcgtg gggaccccat ctccaaatac agccacattg ggggttaggg ctccccacgt 60
gaatttaggg gacacttcag ttcgtcccgg cggggactgg ggacgccggg ctgtgtgctg 120
tgtcctgtgg gagagtttgt tcaccctgct ggaggctccc tgatgagccc tggcgtctgc 180
t 181
<210> 229
<211> 181
<212> DNA
<213> Homo sapiens
<400> 229
ccgcccccca gctgcgcggc cgtccctcgg ctccgcccca cagctgtgtg accgccctgc 60
ggctccgccc gcagctgcac gttcgtccct cggctccgcc cccagttgct cgtcggttcc 120
ctcggctccg ccccctcggc tgtgcgtctg gccctcagct ccacccccag ctgcgcgtcc 180
g 181
<210> 230
<211> 181
<212> DNA
<213> Homo sapiens
<400> 230
gcgggctctg tttattctgt gaccagattc cttctaaaag aaggaaggcc atgtctgcct 60
gaagcctatt ggctgggcct actctggacc cgcccctctt ttttttttca tgacacacac 120
cacagcgaag tctgtgcgga atcctaaacc agcccaattt acatccattc atgaatctgt 180
g 181
<210> 231
<211> 601
<212> DNA
<213> Homo sapiens
<400> 231
gttgttgtga gtattgcact ctgtttttcc tgtttcttca gtatttattt cacaaggaca 60
gacagagaat gtgtgatttg aggtgattag aaagctgata ttattgaggg cgacaccgtg 120
agagagacag agagacagag gcggagagaa acccgaaacc ccgttacagc taggagcctc 180
tgaaactgac agctggtttt cctttgcttg tctgcctgct agacgtggac atttttcatt 240
tacggttctg cacgttacct cggatgcctg cttggctttc cttaaaggga gattcatttc 300
tctgagagat gatgtggatg gtattagcag aaaagcccag aacaccagaa aggtgctgag 360
aaaagcgggg cccgcaagac agagcaggtt ctatcctgtg gggcacttgt cttccttgcg 420
accgtccttt ctgccgttcc tcacccttca ccttgccttt gtttcatatt gtgtaacagt 480
cagtatcttg cgattgcaat ttggtgaaga tgaatacttg ttcaaccatt tttcaaaagc 540
tcttatgacg ggagccatag tggtgtattt atatatattc atagctcttc tttatgtcac 600
t 601
<210> 232
<211> 361
<212> DNA
<213> Homo sapiens
<400> 232
aaaaatgatg gcgaggaatg cagagggccc taaatggacc ctaagatgaa gtacgggtgg 60
tggctggaga gctgggactg gaaggtgggg ctgggggaga cgggtaagca gcttgctttg 120
gtgaggagct cccacgctga gaacggtggg aggagggaat gatggggaaa cctttgttta 180
atgaggaaac ctaattattg cgcatctgga agtcttagtc cctactacca gacgaaggcg 240
ggtacctgag ggatgcagtg cgcatgcccg agccgtcgga tttgcatgat aaggctcgca 300
cgtgagccaa ctccggcgca gcccaggctg tgccgcggcc ggccgccaat ggaatcttgc 360
t 361
<210> 233
<211> 1321
<212> DNA
<213> Homo sapiens
<400> 233
ctagaaccct aaaaactcct ttggcctcca gaaagacccc ggtgcagctc tctaccctaa 60
cccctaagcc cctctcaagt gagagcctct cagttagtac tcagttgcca cgtctcgcag 120
gaactttgga gcaagttttc agctcccagg tgtccaacct ttaaaaggaa aagcataata 180
atactaacct ttctttcacg accacgcgaa acgcaaagga tgtggagtgg ggaggggagg 240
aaaaaaaaag gggcggccag ccaaatcaaa gcttgggaga cattttgaca gtgcgcttga 300
aataatgctc ttaatttttg gaaggttttc aagaaggggg tggggggcac gtgggagaac 360
cacaactttc tcctgtctgt cactcaagcg gccagagagg gctccaacct ccagctcccg 420
cggcaacaca cagtgggaaa ttgcttcaag atacagtggg gctctattct ttctctaccc 480
ctgccccgcc tttcccgagc agtgaacttc acagagaggg tggtaaggga gggttatcct 540
gggtgtcaaa aatctgtgca tagcctgaga tcagaagagt taaccccagg ccctagaccc 600
agcccagcgg ccaaactggc accccgtgct gatcagcccc cgcatcccca tatctgcatc 660
cccatatcta cctccccagt cgggggtggt gaggtttggg ggaggggggc gacactacca 720
tatgcatcca ccacctaagt ccagcccagg ctggcttcaa tgaaagctgg caaatccggc 780
gaatctcgca gaaattttct tcgaacttaa ttcaatttta aagtggattt ttactattaa 840
aaacgctgcc gagcaacaca ttgaattaat ctgactgtac ggttttaatt acagtgaggg 900
tttctctaca aatctgtaca agacagtggc tggttcttgg aggatctctg cctcctgaat 960
tccattatcg ggcccctggt tccctgcaga cggcagctcg tgggagccag ctgcggtgcg 1020
agcgttcagt cgccctctgc ttctgccggg cctcctggct cctgtccctc ctcccttcct 1080
tcatcccagc cccatggaga gcccaggatt cctgcctgtc atttgagact gctgaactga 1140
tatcctgaaa cgctaccctt gctttttaaa ctcttgggcc ccagactttt gagccccctg 1200
agcatcgttc ttaaagtggc tcgttttgtc tgggagggtg acctcttgtg tagtgttttt 1260
tgaagggttc tcctgcttcg acttagcagc tgttagagtg ggcagcgtga tgcccagtct 1320
g 1321
<210> 234
<211> 421
<212> DNA
<213> Homo sapiens
<400> 234
cctaccttca ctgaaggctc tcggcagcac ctgatggctt gtgagtgtgt ttgtctttgg 60
tgtatatagg ttttgcctta gtttagaatt ctctcctgaa gtcccccgca atgtcactgt 120
agccactaac ccttggtcac acggagtgtg gagccagctg tcagtttctg ggcaggctct 180
ggccgggaac gcatacaacg tcaaagcagt gaataagcga tttctgcagt tcccgtagct 240
gccagcctgt gcagtcctct gtgatgcttg gggaccggct cctcggtcac accccagtcc 300
tgctctgaag gttgccgttt tccaaacaga aggatggtag ctagagggga gatagcaaga 360
ttctggagtc tggaaagcct tcacttgggt atgtgtgcaa agaatggatt gttgtactgt 420
g 421
<210> 235
<211> 181
<212> DNA
<213> Homo sapiens
<400> 235
tttctatatt gagaacacag accacatgag tgagagggct cggtaatgct agcgagacgg 60
cactggcaag acctgggtgg aggaagcgga cgtgcgggtg ctccctccca gggttcctgc 120
acccatggcc ttgagcaggg gcgtgttcat tcccaccggg agtgcagcca gcacgaacgg 180
g 181
<210> 236
<211> 181
<212> DNA
<213> Homo sapiens
<400> 236
tgaccggggg cgggagcagg gtcgtggcgt ccgaacctcc gggctgcagg gggcgcggag 60
cgggcgggct ggcccagaaa acaaatcctg cggtgtcgca tttcctgcaa cgtgagccag 120
gtcgggcggg gtgaagggtc tgaggccacc gcagggacgc atgggctgga gagtggggca 180
g 181
<210> 237
<211> 181
<212> DNA
<213> Homo sapiens
<400> 237
ccaacagcac ggacttgaac cgggtcgcat gccggagcgg acgggatgag gtgcaccgca 60
gaactgggga ctcctggtgc cgggacgcgg cgggctgggg cgccccactc tcggggcaag 120
tctgcaatgc ccggtgccca caaaaaggac acatccatct ttgtcacccc gaggcctggc 180
a 181
<210> 238
<211> 481
<212> DNA
<213> Homo sapiens
<400> 238
aggccggaca gggaaagtgg cctggggcga acagaggcgg ggaggcgggg ctgagcgagc 60
gagggggatc ccccaggagc aggaggagct gggcaagggg ggcggttgcg gggaggggtg 120
gatggttcgg aatgggcgtg gtcttgccga atgggagggt ctaacgcgag tggttggcgt 180
cccgcgcggg gcccaaagtg tgacacgggt gggcttggaa ccgggacctt agctactggt 240
ggggctgaag cccaccctgc cattgttctg ccacggtcag tggggcttgc tcctccctat 300
gggaagcact tacggccggg agcgggaatc ccgtcaccac cgcggtgggg aagccgcacg 360
gaaatccacg gggtgcggac ggtgccatct cctggaagtt ggccagagaa ccccactctg 420
tccgcaaatc gctcttattt aataacaact atcatcgatt gtgatcctaa cctgggcctc 480
c 481
<210> 239
<211> 721
<212> DNA
<213> Homo sapiens
<400> 239
gtgcccttac cccttaccct cacaaagggc cccaccgccg gaagccgccc gcgctcccac 60
accttgtgca ggtctcccct gaaatgaatt ttaatttccg ctgagggcag gcggcgtcgt 120
gagtcctgag cccgtggcgg cggcggcggc gcgggtgtgg ggccgcgcgg ccgggagcgg 180
gcggaagaga gcgcgaattt gaatttcaaa ggcatctgga acccaagtgc ttctgcgttg 240
cccgattgtg tgtgtggcgc ttttgtgtgt ccgcgaatgc gcgcgtgcgt gtgtggcgtg 300
tgtctgggtg ttttatgact gtcctccgtg aggccgtgtg tgagcccttg cgtgggccgt 360
gagtgcggca gggagcgcgg tgtccggggg ccgcctgtcg gtgtgtctgt gcgtgcttgt 420
gcgctagcct ttgcctctgc gagtgcgtat ttttaggacc gagtctgtct atatgagcct 480
gtgtctgtgt gtgtgcgctc ccggccctgc gtgtgtctgt gagcgtctgc cggggcgcgt 540
gtgtgctcgg aaccccgcgg tggtgtgcgg gtgtgtccgt gtgtctgtgc acgtgcaggc 600
gagcgttccc atctgtgtgt gtgcatctga gtctgggcta tgtgtgactc agggaccagt 660
ctatgagcct gcctgtgcct ttgagccgat acctgtgtgt gactcaggga cgagtctatg 720
a 721
<210> 240
<211> 181
<212> DNA
<213> Homo sapiens
<400> 240
gcctgtcacc tgcaccagga gctgctggat gaggccgagc tggagctgga gctggagccc 60
ggggccggcc tagccctggc cccgctgctg cggcacctgg gcctcacgcg catgaacatc 120
agcgcccggc gcttcaccct ctgctgagga acacctgtgc cccccgactc cccgccccct 180
c 181
<210> 241
<211> 241
<212> DNA
<213> Homo sapiens
<400> 241
ctcccggcgc tcctccagcg ctggctgttc gcgggcaggg tgggctgggg ctcctgaata 60
tgcggggggc ggggcggggg ccggcgtgag ctgtcacctg agaggaccgg cggggttgcc 120
gggagggagg ccggcgccag gcatccagct ccgccccgct cggtccagcc tcctgcgccc 180
accctctgtc ctcgaggggc gaccggggtg cgggtcggag atgatggtcc agtttctttg 240
t 241
<210> 242
<211> 364
<212> DNA
<213> Homo sapiens
<400> 242
aggaagggca gtgggccccg ccgccgcctc ccaatggcga ggctgcggga ttgcctgccc 60
cgcctgatgc tcacgctccg gtccctgctc ttctggtccc tggtctactg ctactgcggg 120
ctctgcgcct ccatccacct gctcaaactt ttgtggagcc tcggcaaggg gccggcgcag 180
accttccggc ggcccgcccg ggagcaccct cccgcgtgcc tgagcgaccc ctccttgggc 240
acccactgct acgtgcggat caaggtgaag ggccgcgcgg gcctggcggg agcgggaggg 300
agcgtgaccg ccgcgagggt ggggggctcc gggcttctcc ttccgagacg ctggctcagc 360
gtcc 364
<210> 243
<211> 481
<212> DNA
<213> Homo sapiens
<400> 243
cctcgccccc cgccccctgc gcgaacccat tttccagtcc tggtcaccag aggcgcagcg 60
cacagccttt ccggtggaac cagtgcgaaa acacccgagg aaatgaaaag aacaagaaag 120
tgctaccttg gcaaccacgg gcgtttagtg gccagctggt gggctgggga gggcggccgc 180
tgcccccctg ccgctggtac tctcctcgac tacgcgtatt cttaagcaat aacaacgtaa 240
tccgtattat ccacccaaga atacccgtca ccgaagagag tcagaggacc aagctgccgc 300
tgccgctgct accgctgccg ctgctaccgc tgccgctgct actgccgccg ccgccgccac 360
cagaactctt gctgctcgct gagcccgccc ctgcctgggg atgggctgag cttgaccggg 420
accataaatc cataactcga tttccctaaa gaaggatcca aagctgtgct cggctgcttc 480
c 481
<210> 244
<211> 901
<212> DNA
<213> Homo sapiens
<400> 244
ttcttccgaa cccctcttgg gaatactgaa tggaaaaggg ggagcgtgag caagtgcttg 60
gtagagtgta gacattgtgg gatttgactg tggtaccatc gctttgacgt cctagtgctg 120
atttttacac ctgcattctg cttagggcac cggcaacagt tttccgtttg tgcctactcc 180
acctgctgtc tttgttgggt cagcgaacat cgcctccctc taccgctcaa tcagcaaaag 240
ggaccgccct tgaggacctc acccgccgct cactcccctc ccaaattcgc gggcatcgcc 300
tccggtcgcc tcttccgaag gcctaacgag catgttagct gcgaacggag gtgaggaggc 360
tccgctgact gaccggtgcc catgtccagg gcacgcacaa acgccatgac ttggcttggc 420
ctctctctta gttattcaca gctcagcccg ataggcacct ccggggcggc gacggcaaag 480
agggtgagct tattaagtgc agctccacgg ggactggcct ctctgcacgg ctgtgtacac 540
ctgagcgaga cgctcagtcg ctctctaaag ccgcttctgc ggatgacaga cacggagata 600
aacgtgagag gtggcccacc acgacttgcc ctcctttgcc cgggtttgcc cctcgctgag 660
gaggctgttc tacatctgac ccttggagca ggccggctga cagcgtagta aaggaagatt 720
tctgcgggag ggcggccagt gcaaaacaat tccctgaccg ggaatcgaac ccgggccgtg 780
acgctttcag caccgaatcc tagccactag acaaccatgc agatgcggaa agctgctttc 840
tctcccttct tcgacctgaa gcgacacttt cctgtgctct aggaggactt gggtcttgtg 900
a 901
<210> 245
<211> 361
<212> DNA
<213> Homo sapiens
<400> 245
ccttggattc ctcgccaagt tagtaaggtg tgaggtctct tttccttccc ctgacgcgcc 60
tggttgcggg agcaaaaggg aagagctgac agcctagact aacgacattg ccgtgactcg 120
gattcgaacc gaggttgctg cggccacaac gcagagtact aaccactata cgatcacggc 180
gagccacagg ctaagccgcg atggcggagc ttgctctagc ccttttgacg tcaatggatt 240
tcgattatta ggcggattcg ttcccagaca gccacagggg actcgcgctt ttctttcatg 300
cccgctctgc ttttccctcc cttcctccca atcttcatac gtgatgagaa caattctcat 360
c 361
<210> 246
<211> 301
<212> DNA
<213> Homo sapiens
<400> 246
aaacacattt tctctgctgt atcctcagcc tacctgggga gcaggaccat ttgggtttgg 60
taagagaaaa aaggagggcg aaaaccccgg acactcctcc tgtctcccga cgctcgttct 120
ggccgtctgg ccctcagtac taagcaggcc ctgacctact tgtcttactc ttgctgcttc 180
ttcccgccgg gcctcttgcc ccttctccga ccatgctgca ggtcctgccc caactttagg 240
acttcagaac tcctccaccg tgccgtggag gaacagccct tcttccacct cacgcacacc 300
c 301
<210> 247
<211> 721
<212> DNA
<213> Homo sapiens
<400> 247
gccaggcaac acgaagggac tcgcccaggg ccccccaggg ctcggtgctg gccctgatgc 60
cccgtgcctc cccatctccc gaggggccac tcattcggca aacctttatt aagcccctcc 120
aggacccccg acgccgccta ggcgcccagc gacgcgcggc aggtggcagc agctcgggcc 180
cccgccgcac tccaggcgcc cgcagcgctc gccctgacgc ggccgccatg gcgcaggaga 240
acgcggcctt ctcgcccggg caggaggagc cgccgcggcg ccgcggccgc cagcgctacg 300
tggagaagga tggccggtgc aacgtgcagc agggcaacgt gcgcgagaca taccgctacc 360
tgacggacct gttcaccacg ctggtggacc tgcagtggcg cctcagcctg ttgttcttcg 420
tcctggccta cgcgctcacc tggctcttct tcggcgccat ctggtggctg atcgcctacg 480
gccgcggcga cctggagcac ctggaggaca ccgcgtggac gccgtgcgtc aacaacctca 540
acggcttcgt ggccgccttc ctcttctcca tcgagaccga gaccaccatc ggctacgggc 600
accgcgtcat caccgaccag tgccccgagg gcatcgtgct gctgctgctg caggccatcc 660
tgggctccat ggtgaacgcc ttcatggtgg gctgcatgtt cgtcaagatc tcgcagccca 720
a 721
<210> 248
<211> 181
<212> DNA
<213> Homo sapiens
<400> 248
aggggctcgt ggggaggggg cggagcccag gcctggagag ccggggactt tcctgggccc 60
gggcgggggc cttaatgatc ccaggggagc cggttgaagc cggagacggg gagcttgtgt 120
tggaggtggg gggagaggcg tggaaggatc ggagtctgga ggtattggaa gccaagggtg 180
t 181
<210> 249
<211> 661
<212> DNA
<213> Homo sapiens
<400> 249
cctcccgcct cgccacctcc ccggccccca gacagcgaca ctgctcgccc tgcctggagg 60
ctcccgctca gtcccctcgg aggaggggag gcagacgcag tctcacggtt ttcttggcgg 120
gctccttttt cctcttcttc tccgagttgc tgtggtaggg caggtcgcgg ccgcggtagg 180
acgggccgcg ggtcagctcc agctcgctgt agggcggcag cgcgtcgtcg gacgcgtcct 240
cctggtcgtc ctgcgacgag ccggccttgt aggtgccggg cggcgaccaa gcgtagtagg 300
aggcgctgcg cgggccgagc tgcgcgctcc gcttggatgg cgtctccagg ctgccaccgc 360
ggctggcgcc ctcgggccgc gcctggcgct cccgcgcgct gcccaggtac gagtggtcgt 420
atttgggtgc ggtgcctggc gtgcggctca ccagccgcgg caggtgcgcg tcctcggcgg 480
gtctgcggcg cgcggggctg aaggcccagc cgcggtcagc atcggtcagg ggctcgcggc 540
tgcggctgcg ctgaccgtag tactcctcca aggagtcgtc ctggtagaag ccgctgtgcg 600
cccgcgactc cgagcgctcg aagcggctcc cgccccgcgc ctcgtgactg ttgccgtctg 660
c 661
<210> 250
<211> 781
<212> DNA
<213> Homo sapiens
<400> 250
tggcctaaga aggggggaag ctcgaggggt tgtggggcac acccttgggc cttccgggac 60
agtaggctct taaaccctag aggaggggag acaaaagaaa cgctctccca caggggtccc 120
tccagtcgcc aactagaagg gtttccctct caacacagac atgtttgcct cttcatcaca 180
tggagtcacc acgaatggag cacttgggga cgcaggtcta ggtgtcccca agctcggtgc 240
ctctagtgcc ctcccctcta ggggcatttt agaagaagtg atttaaatcc agcttatttc 300
ggcggcagct ggactattcc tttgcttatt tggggatggg tgaggggcat accctttagg 360
aaaacgtttc caaatgatgt aataatttct ctctcatctc tggtcttgct ccagacttgg 420
cctcttcctc gccactctgt cccggcctcc cgcccccgca ggctcccgtg cggacttagc 480
agttcgcgcc gtagccctcc tggtttttta ccgcgccttg gtcgcgcggc ccccggtgcg 540
ggcctcgtcg ctccgacagc cctacagctg tccctacggc ccgcaccgac agctcgtccc 600
cgccacctcc ctccgggctg tagggacgtc gagatccgaa tcctcacagc gcctgacccg 660
gggccgtgtt gggtacgggt acggcgagag ccttccgagc cgcctccaaa actctccccg 720
cggacctcag cagtccctcc acgcgtcggg gccctgctgg ccggccatgc cctctgagga 780
g 781
<210> 251
<211> 241
<212> DNA
<213> Homo sapiens
<400> 251
ttagcgctct taagattggg cctcccagtt tgaggaaggg gcgggctgct gtctacctct 60
gtgaatctgc cctggaccac cccgggagag aaggagggct ccggggaatc tcgcacattc 120
caggcaaagg ctcccgggcc gcagcctctg tgccacaccc ttggcccggg ccaggtgtgc 180
gccctcctcg ctgcgagggg gagcgggcgg ctgcggggag cgattttcca gcccggtttg 240
t 241
<210> 252
<211> 181
<212> DNA
<213> Homo sapiens
<400> 252
cctttatttc tgcagagctg agggcaggcg gcgcaacaaa tctcaggtaa aagagcatca 60
gatttcagaa gagctgtatt ctagacttgg cgcaggcccc tttggggaga agagcccagg 120
ggctatagag aacagaggtt tgaaggaagc aaaagctggc gagaggtttt ttttttgtcg 180
c 181
<210> 253
<211> 301
<212> DNA
<213> Homo sapiens
<400> 253
attgggtgat cacggggagc tcacctgagc gctcccgagg cttgggctct ggtccctgct 60
aatccccaga gccgataaaa actggtcata ggataaagaa gcagctaagt ttgcagcggg 120
cagaggggag gcaggaactg gagaggacgc gagtggcggg tggcgggggc ggtgtgtagg 180
ggtgacgtcc acccggcaga gagggttcct tgtcccctgg agccgaacac aggaaaatca 240
gctggtgagt caatgggact ttgttaggat agtcacaggg cgcagctggc gccggcttaa 300
g 301
<210> 254
<211> 181
<212> DNA
<213> Homo sapiens
<400> 254
ccgctttcgc cgcggcctcc catcgtggag gctcagagtg cagctattcc tgcagccggc 60
cttcctattt tcagtaatct gattaggggt cgatgttggt gggctcgggg acggcttctc 120
cgtgaggtcg ttatttagcg cgcaccgggt cgcctgagcc cggggtcgcg gccaaagggg 180
t 181
<210> 255
<211> 301
<212> DNA
<213> Homo sapiens
<400> 255
aaaccacgac tgcagaccca ggcctcctgc tctgtgagca ggcaaaagcc ctgccctcct 60
gagcagggct ataactgccc aaactgcagc tgtgcatcag agcctccctg tgctcttgcg 120
ggagggctgg gagcgggcag gatctgcctt cccgggtgca gctgccctcc caggtgcagg 180
acccgggtgt ctctgcagcc tgaacccttg ggtgccccag gaaggacccc cacacttctc 240
ctgcagagca gagagaagcc aagcagcagg agcagacacc ctggagcctg gtcacggtgg 300
g 301
<210> 256
<211> 661
<212> DNA
<213> Homo sapiens
<400> 256
catcaattgt cttaatacaa ggttggtggc aaaaaacggc tcacaagtat gcatacaaag 60
gggccaaaca cattgagcag caaaaccccc aaagcagaca ccgcccgaga cccgctggag 120
cgcttccgca aatctcgcga gatagcaggc agcgatgcct tttgctccgg tttctcgtga 180
gaccccgggg cttcagcttc tcgtttgcgg agcccgcggc ggcgtttcct ggggcaacag 240
caatggcggc ctcgctgtcc gagcggctct tctcgctgga gctgctggtg gactgggtgc 300
gtttggaagc ccggctgctg ccgtcccccg ctgccgcagt ggagcaggag gaggaagagg 360
aggaaaagga gcagggggag gcctcgtcgc cgcgcggtct gtgccccgcc gtggccttcc 420
gcctgctgga cttccccacg ctgttggttt accctcctga cggccccggc gctcccgccg 480
ccgaaccgtg gcccggtgtc atccgcttcg gtcgcggcaa gtcctgcctc ttccgcctgc 540
agcctgctac cctgcactgc cggctcctgc ggaccccgct tgccaccttg ctgctgcagc 600
tgccccctgg gcgcccgacg cccaccccac agctcctggg ggcctgcgac atttcgctgg 660
c 661
<210> 257
<211> 301
<212> DNA
<213> Homo sapiens
<400> 257
cttatttgtt tggtctgtaa cgtcagtctt tgagtttctt gttttcagat actgaaattc 60
ttcacatcct tcaaaaaacc atgcagacaa aggacacgat gaccacagga catggagaaa 120
tggatttcag caggacgttc atcacgggct gagtctgtgg tttccagctt ctgattagga 180
aaccaaacaa gccctctgca cggacgtgca caaaggagga agtggcaagt gattctttat 240
tagcccctga gttttcagag gggccttgga actaaaccta aagttgtgcc cccaccctgg 300
a 301
<210> 258
<211> 554
<212> DNA
<213> Homo sapiens
<400> 258
ctccccatct ctagacttcc ctgtctgctc atcccctctc ttccgtgccc ccctgaacaa 60
cacctttgcc tgtaaggtta agaggctccc gtttggagcc ctagggatcc gcagtggtaa 120
taccactgcg atggacactt cggtttcctt ttttgtcttt aaccctgaac agtgactggt 180
ttatgtatat gtgtgtctgt gtatctttgt gtgcacccac cgggccccag acaagtggat 240
gaggggcgaa atagttgcga aaaagaaaat aactataata gagcatacta ctacccagaa 300
ttggacctag atcaaggatt ctttgtcact taattttaga tttgctgact gttttttttt 360
ttttttgagg gggtaagggg agagtggggg acccattctg cctttgaaat ggtcactggg 420
cacggttgtg ctgcaaataa cacatcgcgc ttttgccatt caccacagac tactttgcgg 480
acttgcctta tttcctagtg gactggagta tttcattgca aaatttgggt ttagtggaga 540
tctccagtca gttt 554
<210> 259
<211> 781
<212> DNA
<213> Homo sapiens
<400> 259
cccaagcaga gaattgtgtc tgagggaccc taagggaggg agtgatgttg gtttggggtt 60
ccggggaggc agcggtcatt gtgtatttgc acccgagtgt tgagacccgg ggaacgggaa 120
atattacagc tctgaggctc tgtgagggcg ggtccttccc accccaaagc cagaggccag 180
gagggaggcc ttcggttagg gtggggaaag acattctctt ctcttcttgc accctaagcg 240
atctcagcac ccagagacgc tgtctcagca cccagagact ctgggatttc tcacgggcgg 300
ttttctgcct tcaggcttag gttcttcgta aactcacagc actttagcgg tgaggagtgg 360
gaaggctgag accctatccc tgaggcggag gagaaaagta ggaaaatcaa tacatggtgg 420
ggcggaggca gacctaaccg ggagagagga cgttgctcca cacatctcag ccctgtcatc 480
ctaataagac ggggtggtag gagggggaca cgctggcgtc cagcagagaa acctggtcct 540
ctcaaagaga ggacccaacc ggtttcctgc gtttaggagg gaaattaccc atcctgcaat 600
gcctgtaaaa taaccgttta tttaatagtt aaaaaaaaaa aaaactccag tgataaatgt 660
ccgttaccga tggtcagcat aaagtgccaa tcgcaatata acgcccggct cttggctggc 720
tgctccctcg cagtgtcgcg gcagcggagg ccgggccccc tgcagacccc aggcccgagg 780
t 781
<210> 260
<211> 481
<212> DNA
<213> Homo sapiens
<400> 260
cccgcgacgg gctggaagcg gccgccgtgc tgcgagcggc gggggctggg ccggtccgga 60
gcccaggggg cggcggcggc ggcggcggcg gcgggcggac tcttgcccag gctgcgggcg 120
ccgcggctgt cccggccgcc gcggttcccc gggcccgcgc cgcgcgccgc gccgcgggct 180
ccggcttcag gaacggctcg gtggtgccgc accacttcat gatgtcgctt taccggagcc 240
tggccgggag ggctccggcc ggggcagccg ctgtctccgc ctcgggccat ggtcgcgcgg 300
acacgatcac cggcttcaca gaccaggcga cccaaggtac ttacgcctct tctgtgcccg 360
cccatcccgt caggtcctgg gctgagacca gccccggagc cgtgccgcag ctccgttaca 420
tttggagccg cggccccatg cggcccaccc tcaggtgata gaaagaaact tcgccgaggc 480
c 481
<210> 261
<211> 781
<212> DNA
<213> Homo sapiens
<400> 261
tcagggtagg ctgggccgct gctagctctt gatttagtct catgtccgcc tttgtgccgg 60
cctctccgat ttgtgggtcc ttccaagaaa gagtcctcta gggcagctag ggtcgtctct 120
tgggtctggc gaggcggcag gccttcttcg gacctatccc cagaggtgta acggagactt 180
tctccactgc agggcggcct ggggcgggca tctgccaggc gagggagctg ccctgccgcc 240
gagattgtgg ggaaacggcg tggaagacac cccatcggag ggcacccaat ctgcctctgc 300
actcgattcc atcctgcaac ccaggagaaa ccatttccga gttccagccg cagaggcacc 360
cgcggagttg ccaaaagaga ctcccgcgag gtcgctcgga accttgaccc tgacacctgg 420
acgcgaggtc tttcaggacc agtctcggct cggtagcctg gtccccgacc accgcgacca 480
ggagttcctt cttcccttcc tgctcaccag ccggccgccg gcagcggctc caggaaggag 540
caccaacccg cgctgggggc ggaggttcag gcggcaggaa tggagaggct gatcctcctc 600
tagccccggc gcattcactt aggtgcggga gccctgaggt tcagcctgac tttcccgact 660
ccgccgggcg cttggtgggc tcctgggctt ctgggctcac ccttacacct gtgtactaaa 720
gggctgctac cctcccgagg tgtacgtccg ccgcctcggc gctcatcggg gtgttttttc 780
a 781
<210> 262
<211> 661
<212> DNA
<213> Homo sapiens
<400> 262
gcgccgaggg tggagggaga aggggctttt gagatcatcc tggagaggaa actgaggcct 60
gggggttgtg ggtggaaaac aggaaggaac cggtagccct tggcacgtat tcttagagga 120
gaaaacggag gctcacaaag gtcagatcac agagccggcc agtgttggag cacaggcggc 180
ccggggtgag cgccagaggt gggctttctt ccctcactga aagccgggag ggagagagag 240
agagagaacg ggggccggcg gagaagaggg cgagacgaaa gtaagcaaag ggacattaga 300
agggaaggca gagccgaggg acgcggaccg agcggccgag cagtggaaag ggcggcaggt 360
gaaaggcaca gagaggaaag atgcgcgggg gacgcgccgc tcacctatgg ttgacaccac 420
ggtgcccacg aagtagaagg cgccggggaa gtcccagcgc gggcgcagcg cgtcggcgcg 480
gacgccggcg gccagcgcgg cctcgtagtg ccggaggaag gcgcgcagct ctggctcggc 540
cacgccgtgc gcagcgctga agttgcgcag cgtggcgccc cagcgcgccc gcgcctccgc 600
ctcgccgggg ctctcgagcg ccgagaagac tgtggcaccc gccaccaggt agaggccgat 660
g 661
<210> 263
<211> 361
<212> DNA
<213> Homo sapiens
<400> 263
ccgcagaggg atggcctccc ggcagggact cctcggctcc cctctgttct gagactgctg 60
ctgggaccgg ggtccgactc taaagagaaa actcaaacag caaaaaaagg aatatcgact 120
cagttccgag ggcgggggcc ggggctcgtt ctcacccgcg cgcggcccct cgacctctcg 180
gacccgggcc accagctctg cgcccctcac gcctccctcg gggtctctgt gtctctctcc 240
cgctcccgga ctccctcctc cttctgactg ctgttatttg ggctgttgtc cctccccgct 300
ccctggtacc tcagctcgga ccttagcctg tgcctgcagc ccggagtccc ctcctgccct 360
g 361
<210> 264
<211> 541
<212> DNA
<213> Homo sapiens
<400> 264
ggggcgacgc agtggcgaag tcgggctgtg ggcccggcgg cggcaccagg cggagaagcg 60
ccactcaacc ccatccctgg gctgcagagg gcccagcgcg gagggctccg cgcgtcggga 120
gccggtggaa gaggagaaga gcgcgcgggc gacagtcata caggccttgg ggcagggcgc 180
gcctcgcgct ccagggagcc acgccagccc gctgcgcctc cgcagcaacc gccgcctgca 240
cgtggcgggg cgagagagct gctagggcgg tttctccgcc tcgggcctgt tgggcggggc 300
cggctaaggt gcgcgtgctc gctggtccta acggttctgt tgggcgtttc tgctgagagg 360
cgggaggggc tgagagtctg tgcgaaggta ggtggacaga ctgcattgct tgttgttgcg 420
cttcggaggc ggcgatcccc gaaggcgagc tgaaatacgg ctggagcgtt cccaggctac 480
agtttgtagc cgacgattgt ggaagactag gagccggaga ggtggcccac cctcagggag 540
c 541
<210> 265
<211> 601
<212> DNA
<213> Homo sapiens
<400> 265
ctggtaacgt cccttcctgt cgcatggatt caaggccgac ctgccccagc accaccacca 60
gcagccttct gctggggccg gcacagctgg gagcaacctc ctactctcag gcagacgcgc 120
agcaccaagc agagaggccc ggtgcaggat cccagcgccg aaccagcgcc ggctcagtgg 180
acgcggaagg ggccggcggc cgcggccggt cccatccccc actgcagacc cccagcctgt 240
ggcggtggtc cagttccgcc aggaaaccgc cgcctggagc tgtgggtcgc gcacattaac 300
gcatccagcg gaaaaatgaa ggagacccaa attcaaagtt aaagtaatgg tgacccgaga 360
ggtgccttga tgagaaggtt tggggtcccg gttactgatg gttatcattc ttacgagatg 420
ctggtcacct acgaagggag aaaggcacga ggagcgcctg accaaagtgg ttttgccctg 480
cttcccgcaa gaggtggcac ccacggctgg aacgcaggag tcagacccac agtccccagc 540
tctggacgcc cgcagcgggg cctcgaagag gttcagggcg gtgcccgcgg cgctcgggcc 600
g 601
<210> 266
<211> 421
<212> DNA
<213> Homo sapiens
<400> 266
aattctgctt ggtctgtggt aaatgccctt tctgagaagc aaccatgacc ttctcaagaa 60
tacttcagag gcacttttgc tccttctcca ctaaccgaca tcctgttttg ctggaacaca 120
tggggcagag cgcacacagc tttgttcctg cacccgccct cagagctttg ccacctgttt 180
tcaggctgcc tctgcctcca aaccctgcgg agccctccct gccccgtgct ttgaagcagt 240
ttctttggaa gctgctgcac aggggttaac aacaagcaac aactcaggtc gcattcttgt 300
caacggaagg gagggccagg tggaaccgcc aagggggcca tttctggctt tgctggaggc 360
tgtcagcttc tggtgggagc cacagcctga gggcagccag gatggctctg ctgggaggga 420
c 421
<210> 267
<211> 181
<212> DNA
<213> Homo sapiens
<400> 267
ggcgccctcg gctctcccct tcgggcctcc ggggaagcgt ccccgctagg ggtggggtct 60
tgggactccc tggggcttcc ggagctgacc cgtggggggt ctgctgccct cagttcctgc 120
tgaccaaagt cctgccggat ctggcgccta cgaggacgtg gcgggtggag ctcagaccgg 180
t 181
<210> 268
<211> 421
<212> DNA
<213> Homo sapiens
<400> 268
ccgctcggct ccgcggccgg tggcggaggc tggggccgcg ttgttgccgc cgcgctccgc 60
ccctgggggc aggtgcgggc ggcagggacc cgccccaagg cccgggcgcg ggagccggcg 120
caccgaggcg gacgagaggg aggaaccagc gtgaggaccc acaggcggcc ctggcagagc 180
ttggctaggg cgtagcgggg acccgcccca cctgcgccgc gggatggtgc ccagagggga 240
cccctcccac tggattcctc tggggtccgc gaagcccgcg gccgcgcgtg ggtagcagac 300
agcgccccta atttggcatc tttctcttct ggagctgcac aggcttcaga ggctgtacag 360
ggtcttcgcc tgggcctcca ttctcactgc tcatccaggg aaaaagggtt catctgtccc 420
c 421
<210> 269
<211> 181
<212> DNA
<213> Homo sapiens
<400> 269
tgaaataatc atgtccagaa atgtatcaaa ggccagaggg attatcccac ttaatagctc 60
cacagatgcg cccagaagaa tgtggacgcg cgacaggacg ggctgaaagg ctgcaggagg 120
aagcaggcag ccccggctcc tggctttacc atttcggttg ctttcctaaa aggctacatg 180
c 181
<210> 270
<211> 481
<212> DNA
<213> Homo sapiens
<400> 270
gggaggagag agcgagcggt caggcaaagc tccatgcacg ccttcccctc tcctccactt 60
gagaagagtc ggcctctggg actggtgggt ttcgagaggt tgaggtgacc ttaaggcttt 120
actgaggtag aagaagccgg ttgacgggcg acttccgaag actggtgtaa agcgaagaag 180
gttctagagt caaactctga ctctcggggc ctgactcgca aaactcgggg gctcccgaga 240
agccgcggac gccgctctgc acctgttgcc gccgtcactc atcccgccag gcgggcgggg 300
ccgcgcgggt ggcttggtca ggacctgcca ttcagcccag tcgggctccg gtgctcgccc 360
cggacggcgc cccaagcggg tcccggcccc gctgagcacc tccagcagtg gcacagcctc 420
tggaggggtc cgggacgaag ccacccgcgc ggtagggggc gacttagcgg tttcagcctc 480
c 481
<210> 271
<211> 481
<212> DNA
<213> Homo sapiens
<400> 271
tctctgaagg acggtggcag caggggtcag ggcactacca ggagctacag aggatttggg 60
tggggggtct tctggaggga gaaaccagga ctgcgagaat cttctgcttc gggcaggaaa 120
aggtgaggcc gggtttgctt cgcaggcacg gagcgcgcag gcgcagagag gtgtttcact 180
ccttcccgtc gcgacccaga gactcgcgaa cctcacttcg gccactcagg tgggcgcgac 240
gcggccctag caacggaaac gccgcgcctg cgcattgcct tccgcctgcc ccctcccccc 300
ccccgccccc cgcattccgc gcctgcgcca ccgcgggagg cctgggtggg cgcagctgtg 360
ggagccggtc ggagtccgag cgctccgtcg cggggcccgg ccgcttggcg agcctgctcc 420
gggccccagc acttagcctg tggtcctcca ggccgtcttc ccgctttcct gctggcccca 480
t 481
<210> 272
<211> 301
<212> DNA
<213> Homo sapiens
<400> 272
cattttaatt gtccaaaact aattgccctt ttacaagtct gtgatataag aggcaggaaa 60
gcaatgtgga gacagaggtg atttccatta acagaggcct ggcagcaggc aggcactcac 120
cgacgctttt cagggaagtc cgtctcctga ttaatgtgct tccgggggca gacagcggat 180
gcgtctcctt gctcagggat ggggtgcatg ggggcatggt ctgaggtttt gtgcaggttg 240
tttgaggttt ccttagccct cttgctgaga aaggcaggaa gaggacagtg gagtgtttct 300
g 301
<210> 273
<211> 301
<212> DNA
<213> Homo sapiens
<400> 273
aaaggaaccc ttaaaggaac tatatggttc taaaaaaacc ctaaatgtat attgcaacag 60
gatgcctcct accacacaca gcaatggccg ggagagaaag acgcagaaaa ccctaccgtt 120
aatatctgca ttaccttttg cctagtgaac caagagagat ctggggaaat gaccgccata 180
ctaacgctct ctttgtttca aaatagccca cacagctgca ttttgcaggt ggtgaacagc 240
ttttactact tttagttgag acagctctaa gctgaggaaa cgggcatgaa ctgcagttcc 300
c 301
<210> 274
<211> 550
<212> DNA
<213> Homo sapiens
<400> 274
tctatagtgg ccaaggggtc cagttgtccc ctgagtccgg aggggtgggc ctaagaaggg 60
ggcagctctc ccccattaag caccataagc cgagtggtac agagcttgtg cccaacccca 120
gcagagaagc actaaggggg ggttggtgcc ctccttggcc acatcctctg gaccagaggg 180
tataaacagc cacacagtgg tcacttcttg ataggagaga gagttaggct gcgggaagtt 240
cccccgttca aggtcgtgcc tcatgggggc ccaggtgaca gccaggccgg ggttgatttt 300
attgtgtatt caccagcctg agcgtcctta ggggtggcag gcagggaggt cgaggtcact 360
gatgctggtg ctctcagcat gtagttatgc aggagagtca ctgctctgta ttggacagag 420
gctgatggaa aagggtggtt tgtggatcgc agtactcaag cattcctgga aaaggggact 480
ctgagaccag cccactaaga atcatgctgt tcaggagatc agccttcaag agaaccagtt 540
ttcaaagccc 550
<210> 275
<211> 312
<212> DNA
<213> Homo sapiens
<400> 275
tctcgcggag gaacccgcca tctgccagaa gccccaaaga cgccccgccc cacttcccac 60
agcttcctgg cccgccccgc cgctgcctcc cgccccaccg cggctcccag gccgctggcc 120
ctaccggcac cccccctttg gcgagtcggc agccacgtcc ttgtcctcac ccgcagcgca 180
gtgacgccga cccatccaac ggtcatcgca tgcgcgtgcc ccgcgcaggc cccaaacccc 240
cacggattag gttgaaggtc agacaaaaaa tcccggaccc atacgtccgg ttccttaagg 300
ccttgcccac ac 312
<210> 276
<211> 241
<212> DNA
<213> Homo sapiens
<400> 276
gcccactcgc ccagccacgg gccaagagcg cacggaccca ggcgggcggc agcccacccg 60
ccaccacgca gctccacttc gctgttccac agccaccaac cgcacagccg gcacagtccc 120
gcccgcgcag ctggcccaat cgggcctggg ctgcaaaagc ccagggaata tgagggctcc 180
ctacttccaa gtttctttaa taaaaatatt acatttaatg atgcttgtca atatcctcac 240
c 241
<210> 277
<211> 421
<212> DNA
<213> Homo sapiens
<400> 277
cgcaagcgag gggaggagac gcaaagccgg ggagtgagtg attaaagaaa agaaagaagg 60
gcttcttgca gctccgggct gtgttttttc ctgcgcgccc tggcgcagtc cccggctcgg 120
aaaggcagga gcacgtgagc ggtttgcaga gcagcccggc ccagccgcgc gcccgtggcc 180
ggaggctcca tttaccctcc gcggagggcg ctgtgcggcg gcacttaagc ggcagcttcc 240
tctctcccag gcggcctttg tggctgtggc cgggacaggg aaaagctgcc caggccaaga 300
gggcgggggc gtcaggggca gccagcgccg cctttgcgca actgaagcgg atgaagccgc 360
ctgctctcag gtcttctaag gagaaggtct ttttatcact cccattttac agatgaggaa 420
a 421
<210> 278
<211> 1201
<212> DNA
<213> Homo sapiens
<400> 278
gttcaattcc agccccttaa agcagaaggc tccctccctc ggcatcagtg caggctctcc 60
cacctcatta ctgttctgtg tctttgggaa tcgtagagtc tgtggccccc acgtcctagg 120
tgtctcggca ccctggaccc aggcgcctcc gagattctat atcgcttctg acccctacct 180
tcaagcctgg caggctcccc gcggaaccct gctgagaccc ggagacaatc gggccgtgct 240
tctccctcct ccacgaacag ccacggttta tttggagcgg ccggggccgg cggcctgaca 300
actggtaaat ccgtttcgtt aggcacaatt tgtctgcaat ttgtcagccc ggctgggaaa 360
cgctccccag acgcctcggc tgccgcacgg gccctacctg gttctcgaat cctgcctgct 420
cataaacgaa tcctagcacg gggtgcctgc gtagacctgg agctcaccac cagatgttcc 480
cgacctcggg agaggaggct ttttccaaaa caacgaattt ccttccttgt tttccggtaa 540
aggagcgttc gccacacacg gggtccctga acgcggggcc tttcccctcg tggttggagc 600
aacgcggagt tcaagcctgg ccgccacaga ataattttaa atgccccgtt ttcagacaga 660
tccagaacgc cgtctacgcc taccggcggc agatcttcaa gcccgcggcg gccccattct 720
tattgaaatc ccactaaacg gattccgact ccggcttggg gcggggggag acttccagac 780
ccggcgctct cccccacacg caccccagtc acacaggata aagggctgcg gggcgcagcg 840
cgcgggggcg caagcaggag cgagctgggt taagccgcga aaagccggcg cacgggacca 900
gccggcaggt gcagccgccg ctcggcggcc cggctcggac gcatccgccg cggtggcctg 960
gggattgggg gcggccgaga caaaggcccc agttcggggg ccgggaggcg ggggtgcttt 1020
gcgaggctct gggaatgcca gggtctcgtg gcctgtggct ccgagaaatg ggaagacaag 1080
aggcccgagg cgggcctgct gtgcccaggt aaccaaatac tccctctggt taaagtccct 1140
ataaccaggg tttccggtct ctggcagggc caaggcgagc cccaaaggta ggggccacag 1200
g 1201
<210> 279
<211> 661
<212> DNA
<213> Homo sapiens
<400> 279
tggggcaatc acggggctgc gcgttgccac gggactgcgc gttgccacgg gacgccggtg 60
ccactgcggg gaagcgacgg cagccatggg ggagagggtc gggttcgctg acctcgttcg 120
ggggagcaat gggcgccccc cggcgggcag gcccttgtgg caaggaggcc aaggtgccgg 180
gggacccggg gacccgggtc gggcgcgcgt tacctcctcc gcgctgcagc agcgagctcg 240
ggttcgcctg ctggtctgag agcgtaccct gtgcggcgcg ccgcttctcc gagtgcacga 300
tcagcagcat gtcgatagat acagcgttga tgtccttctt cagctccatg atgccgcctc 360
ctttccgacc tgggcgccgc ggccgcacgc taggctgctt gcgctgcaaa tggccccgtg 420
cgcgcagctg ccccacacgg gagagggcga gggcgcggaa gagggcgctc ccccgccgct 480
ggagccgcag ggcgctgctt ttcgctgact ctgccaaaca cgccattagg gcccgcctgg 540
gagggcgcta ccctaatgaa gcggctctaa gtcacctttg aaaggaaatc cccgggccca 600
agccttgacc tgcaccgggg ccatagtcag caggggcggc cggtccagag cctccctccc 660
t 661
<210> 280
<211> 361
<212> DNA
<213> Homo sapiens
<400> 280
cattttaata tatagtcaat ggctctttgt ggaagggaca aaaagaaact acgcgcagtt 60
gttgaataga ctttgcgcta ggcaaagaca ggttaatcga gggccgcatc gcgaaaacaa 120
gcgagtgttg tatgtttgca ctgaatccaa atgtctgcat tttcctaact aaatcaaagg 180
gagtgttatt tctttttctg ctcactcatc tgaaggtaag taaattttct ctggcgatca 240
aaagcctggt cggcaacaaa gaccgcgccc gctttttcca ccgtcctggt gtggcgagtt 300
gcggaatttc aataactgtg acaagggtga ctgatttgtg aactagaaaa ggtttgaatg 360
t 361
<210> 281
<211> 301
<212> DNA
<213> Homo sapiens
<400> 281
catgttaact gggagcgcag aattccttta aagtcaaact ttgcgaacaa gaataatctt 60
gaaaaagacc ctttaggcgc aaatcaacgc tcaagaacgt tgccaatcac ttgtaacctc 120
cttaggcatt tcacggatgt gttatttatg ctcaaggagg ggtctccttt cagcccggca 180
acccaaatct ttgctctgtg cttcggactc agtgggggct tgtcggatga gccactggga 240
aaatatgcgt cccctcactt ctccttaatc aactaaggtc accttgacgg agcgcttccc 300
t 301
<210> 282
<211> 181
<212> DNA
<213> Homo sapiens
<400> 282
ccagggccgc ggccggaagc ccctggctgc acgcgcgggc ccaggcggcc cccagccctg 60
tgagctcgca tggcgcgccc tctgggtcct cgcggtcacc ttgcattccg agcacggccg 120
tgttatgtat gcctttagtt gatgctggcc aaaattagac aacttagtgg cagacgtcga 180
g 181
<210> 283
<211> 421
<212> DNA
<213> Homo sapiens
<400> 283
ctctcctcgc cgctcctccc cgcctccccg cggagggttg acccttcaat tcggagtccc 60
ggcctgtggg cgggcggggg agcgccgcgg ctgtaagccg aggatcaggc ggcggcgcgg 120
agagcgcgcc cgggcggcca gcgccgagcg cgcggagctg gcgtggggag acacggcagg 180
aaaggcgagt cggagtgggt gatgagaggc cgggagagcc cgtccgagcc ggagagaccg 240
gagagaaggg agcgagcgac tgtgcggcgc tcacgctgcc agagcccggg cggagtgcag 300
tcgcctccaa agccttagag cggcgcccca gtcactgcag ctcttcaccc tagagctgtg 360
ccctgggacc acagagacca agagcatgga aatcggctga gaggtacaaa agaaataagg 420
a 421
<210> 284
<211> 481
<212> DNA
<213> Homo sapiens
<400> 284
atcgatccgc agggctgata cacacttaat taaactcatt ttgtgtagtg tacaaactag 60
ttaaggccat ttaatttatt tcggcgtata ttacccccca attaccgccg gcgcagggcc 120
agccaattgc cgggcattta ataacaggcc cggcggtggg gccggagccg gccgagagaa 180
tggggcttgg gggacccaaa tcctatgccc tggccccgac cctacctcaa gcctccaggc 240
cctgagcttc ggtcgcgagg gtcagccccg gctcccctgc ccgcgcctcg gcccctgcgc 300
agagttgccg cgggtagggc cctgctcggc ctcaccagga gggctgggcg ggcgtgcagg 360
tcggagtggc tccccgcggc ctaaaggccc ggtcggccga gtctgaacag cagctccgca 420
tcctccaagc agaggccctg aagtgactgc attttgagtc tctgaaattt ggaagaaagc 480
a 481
<210> 285
<211> 181
<212> DNA
<213> Homo sapiens
<400> 285
ctgcgctcag attaacggaa aaagacaccc ctctagagtc cggcagcagc gggcgggcac 60
cggcgccttc tccacacagg agaatctcgg cgatttacac ccccaggcta cgcagaaaaa 120
gcggcttcgg aatccgccgc aagtcccctc ctcgggtcgc cggggaagtc tggcctcccg 180
c 181
<210> 286
<211> 181
<212> DNA
<213> Homo sapiens
<400> 286
aagaaatcaa gaagctccgg gcagtagggc cctgctccct ccaatcagag cccagcccgg 60
ggccagagca ggaagcgcgg cggtgggacg cgcggtgaca gccccgcgcc ccccggggcc 120
cgccggccag gggagaggac ggtgcggccg ctgcgcgaca gctccgggcc cgcgcctctc 180
g 181
<210> 287
<211> 181
<212> DNA
<213> Homo sapiens
<400> 287
gggcttgcgg ggtcccgcgg gaggacccgc ctcaaagagc cggcccgatc atcgcctcct 60
agaataccca gctcaacgtc tacctggagt cggctctaca ggacgcgctc atctcaaacc 120
cagagctcag gcttttaggg cagagagcga gagaaaggct tgctttacag aaagggaaac 180
t 181
<210> 288
<211> 901
<212> DNA
<213> Homo sapiens
<400> 288
gaaagggagg gagggagggg agggatcgag agagagcggg gagagagagg ctgcaatctc 60
ctccctgaat cgcgcacagc gctgcagatc ccactgctcc gacatgcggg ccgaatgcag 120
gtgagaaaag gcacggactc tgcggctgcg aacccaaact tgggcaccgc acggtgcgca 180
ctgctcagcc ttcgcccccg tgggcgaaag gctgctgcgg tttcaggcgg ctgcttcgtg 240
actaatgacc ttgcgcagag ttgttaagaa aaaagagaaa cccgcgctct ccggggtgag 300
aagggactga ctctgggcgt ctctgaagat ggctcgggct tctctttggc gcgccggggg 360
gaccctgaca ctgaccgctc tgtgacgcga gtagtctccc ctgcaccgtg cccgaagcga 420
cgtgccgggg gatttttcat tctcgatctg ttgactggct cccccgctgc atgagcagag 480
tcggagttga gactggcttg ttgctggccc cagcgcctgg tgcaggaagc gactcacgtt 540
tgtctgggtg gccggagccg gagcagagcc tgggtttgga gtgagtgcct ggaacgtgaa 600
ttggactcaa ctcgagtagc agcaaagacc agcgggctgg caggcggggg aggctgcagg 660
ctcattcccc acctcttccc agccccactg cccgtctgcc ggagcggttc tggccccttc 720
cgacagagcg gggactagag ccggggattc tccgcccgct gaggggatga ctctgggttg 780
ggggagcgcc gaacccgcgg cgcgcagtgt cccgtgaact gtgagtactg cgactgaacg 840
gcggcaggcg agcgggcgat tagcacccat tgcatgaatt atgaaacaat aactttcgga 900
a 901
<210> 289
<211> 421
<212> DNA
<213> Homo sapiens
<400> 289
ccagcgtgcg aattccgccc cgggatgcga aggagttcga acgcatggag tggaaaacag 60
gcaggcgtga tgtggccata gtgggagtca agactgcgga aatggagcga cctgcaggct 120
agaggagaga tccacgtgcg ggatccactt tgacctcggc ttcatctctg atgctcttac 180
tgtgttcgct tcggctttgg agtccaagat atgtgcggtc cccactacga aaccagctgc 240
ctgcacccgg attccagagc ctaggccctt acctatggga aatcctatag ctccagatgc 300
tggaatccga gctctgatag gaaaacgccc taatgctggc atctctcgct tagcacatag 360
gcaagaaaat ggggcacgac ccccaaatcc actcccttcc agcctccgaa aaatgcaccc 420
a 421
<210> 290
<211> 301
<212> DNA
<213> Homo sapiens
<400> 290
aggcgagaga gagaatcgcc caggcggctt aggcagccag tgggccagtg ggcctgcgcg 60
ccggggtcag gatggcaggg cagtgtgtcc atcctggcgg gacagtaatt gccccgggtc 120
tgacacgacg ccgggggctc agggcgcctc catccatctc catccagtta gcgacgcgcc 180
ccccgaccgg gcgggtggcc gggcttgggc ctcagctccg aataatgaga acaattgtct 240
ccccgcctgg catagccctc cgccgctcct ccgggttcgc tgcccctctc atttctctag 300
c 301
<210> 291
<211> 721
<212> DNA
<213> Homo sapiens
<400> 291
aagaatgaac ccgtcgttag cccccggtgc cctggctctt gtttaaatcc ttagatcgag 60
aaggacttga aggagatccc aggctcccag ctctgcgccc ctgggccagt ttcctctcgg 120
gacgcggact gaggagggat gcagggggag gggcattggg ccgggctttc cagctgcaaa 180
cacgtctggc gccgaggcgg gcccattttg tgcctcctgg ggacggaccg tgggcggcgc 240
gcagcggcgg gacgcgtttt ggggacgtgg tggccagcgc cttcctgcag accccacagg 300
gaagtactcc ctttgacctc cggggagctg cgaccaggtt atacgttgct ggtggaaaag 360
tgacaattct aggaaaagag ctaaaagccg gatcggtgac cgaaaggtgt gggtctcagg 420
gttccccggg tctaactcgc cgggtccaac cgcagcatca gccttggggc ggcagataat 480
ctttcggtct cgcctggggc gcaagatgca ggatcggggg caaatggctt ctcccaactt 540
ccccctaatt cgggttctgc cagatggttg tcgtttgctg aagtggctcg gcggcatttc 600
cttttgtttt aaactgatca atgagcgaac ctgggatggg ctgaaaaagt agattgtagg 660
agggaataat gggaaacccg acttggggcg cctccttccc tgcctcctac tgcagtttct 720
c 721
<210> 292
<211> 181
<212> DNA
<213> Homo sapiens
<400> 292
ttagaaactg acatgttcta ccccagggcc tccgcgaacg acagcaggcg agaatccttg 60
ctctggacac ggggaacagg gtcagcatct cgtctcctat ctccaccgac ctgtctctgg 120
cttttcttag tccccagatg cgcccagaag gtcctggaga gtggtgcgtc cccttggcaa 180
c 181
<210> 293
<211> 541
<212> DNA
<213> Homo sapiens
<400> 293
tccttacctg ccctccgccc acccgtgggc ccctagccaa cttctccctg cgactggggg 60
taacaggcag tgcttgccct ctctactgtc ccggcggcat ccacatgttt ccggacacct 120
gagcaccccg gtcccgccga ggagcctccg ggtggggaga agagcaccgg tgcccctagc 180
cccgcacatc agcgcggacc gcggctgcct aacctctggg tcccgtcccc tccttttcct 240
ccgggggagg aggatggggt tgggaacgct ttccccgagg atgctcgtgt ggctggtggc 300
ctcggggatt gttttctacg gggagctatg ggtctgcgct ggcctcgatt atgattacac 360
ttttgatggg aacgaagagg ataaaacaga gactatagat tacaaggacc cgtgtaaagc 420
cggtaagtgg ctctccaggt tgggacggtg gcgcgccggg ggccgctgcg ctgggtttcc 480
catgggtggc ggtgggagct cacctgtttc cttccctccc gcgtcagccc ctccgccgcc 540
c 541
<210> 294
<211> 241
<212> DNA
<213> Homo sapiens
<400> 294
ggtgcgggag cccggcgagg tcgagctggg cggcggcggg ggccgcgccg agggaggagg 60
ggaaggcgga ggcgcgggga gcgtgtttgg ggcgccgcgg cggggagggt ggcggccgct 120
ggtgcgcgcg gggcgctgtg tatgcgcgct cccccgctcg gggaggaaga tggcccaaaa 180
gggaaagttg gggtgacgcg cgcggtcccc ggaggctcgg cggggggcac cgcggccagc 240
c 241
<210> 295
<211> 361
<212> DNA
<213> Homo sapiens
<400> 295
ctggaggcag ggctatgagc acaagtgggg cgccctgtgg gtgtgcaacc gcggtcgggg 60
agcacaggct tccgaagaga aactgagctc taagtgccac tcaggccgga cgagttccag 120
agggggacag cgccctcctc gaaaagcctt ggtttctccc cgccccctct tgtgacagaa 180
agttggcaag gatgccccgt aggagtgcga gccgctcccc tcctccgaaa agccgcgggc 240
ttccgctgct ccgggcatca ccaccaacag cttcccactc ccacccctgg gactaggaca 300
ggggacttca ccctcctcct tccttccgga ggagcccgcg gcttcgcctg aggcctcgcg 360
g 361
<210> 296
<211> 181
<212> DNA
<213> Homo sapiens
<400> 296
tggtttcccc tgcgtgcggg atcgcacagc gcctgtttcc ttgcttccca agggggtggt 60
gtggagggga agggggaatg atttttcttg cgtctcccgg aagctgtgct gttagacaca 120
attacctcag ctaggtcact gagaccaaat catacgggac gcttaatgaa ggaccgcatt 180
c 181
<210> 297
<211> 961
<212> DNA
<213> Homo sapiens
<400> 297
tgcggctcgg tcaggcgcgt gggggaaggg cagggcaagt ggggtgatca tgatcatttt 60
tagcccaggg tcagtagagt agggcacaga agtcagacaa atctgccaga gtttcaggag 120
cgccagctac atggccagat cctgcccggg tggcctcatt tctctgggtc cccgcactcc 180
ttgggaggtc tgatgaaagc ttggggtctt ctccattccc cagaacactg cagagaggag 240
ttttattttg cttacaattc aggagtccgg gcaggcagag cgggcccagg ttaaggacgc 300
cttctagagc tggggatgac aggatttgtc agtggaaaag cgttggcttc tcacggccct 360
agctggtaca gggaaccgcg ggcgggaagc tgggcgggac gcgtggactt gctgagaatg 420
gggatgtgga gggcttggct ctttgcggag tgcgggttgg caagaggcgc ttggagtaga 480
ataaaggcgg cgcagggcca aaaactacct aaagacacag ctcccgcagg cgcgcccaag 540
gtgcggagga aacgctccat gtatggggac aaaatagtgt ctgtccagaa cgtacatctt 600
gggtgctcaa acccgacagt gtgccgtctg agacgccgac gcaagtgaag tcaagcattg 660
gcctgatgtt gggacttttc ctgtccctca tcaaagccac actcccagga cctggggcct 720
ccatgctggg gagagaggtg agccccgcag ggcagcccag gaggcgcgca acgccctgac 780
cccggcttct aggcgccagc cgtcagtaac aggcctgggc tgccacgccg aaatcacgcc 840
tcgagtttct gagccaggga ctactggggg tctggaattg ttagtctagt ctgtggagga 900
tgccttttct taaatgtggg gcgttcaagg cccaggaaac ctcgtccccc cacctcttca 960
c 961
<210> 298
<211> 601
<212> DNA
<213> Homo sapiens
<400> 298
gcactccagg cgcgtccagc acgttgcttt tctcatttgc tgctgctccg ggatctttgg 60
cagcagcaaa accccattct tttaagggct gcgcagagtt gtgccgccca tgcccggctg 120
gtttgaaggt gccccatggg cgggcgcgga cgtgtggttg ctccagtgtt tcctagagca 180
ctctcagcca cgcccccgcc accccagcgg cgctgcagga accagcccgc cgccagcgcg 240
aaggtgagac cgggcgccac gtgcttaccc ggcggcctcc ggaaccagcc ctgcccgccg 300
gctgtgcgcg gatgcctgca gacgccgagc tgctgccccc gtgtggcctg gtgcgggggc 360
tcctcctgct cactgggggc gcgtcccggt aaaccagaac ctcagcccat caactcactc 420
gtggggttac tgaggaggag aatctttggt tctcaccgtc atggctcacc cagtggctga 480
atcccgctcg cacgtgccgc atccaggcag ctgtggaaac tggttgaaac caggatggtc 540
agctgctacc ctgtgtttgg gggactatgt gacagtgcct gctgtgtccc tattctggtg 600
c 601
<210> 299
<211> 181
<212> DNA
<213> Homo sapiens
<400> 299
ctccaagccg acgcgccctg ttttatgcct tgagtaggcg ggagccttgc aggtctgtgg 60
gtttctttct caaaggaaaa ttgctgggct cgtgaggaac agcctcgggc acttgctcta 120
cttggaaagg gtgaagagcg cgggctttgg aaccctaggc gcgcccgcaa tcccagctct 180
g 181
<210> 300
<211> 181
<212> DNA
<213> Homo sapiens
<400> 300
attcaaggta ataaacaaac aaacaaacaa acaaacaaac agacagaaag ccttttgcct 60
gggaggtctc gcgattccca cgcttggggg cgacaagagt tggctggagc agggtcggtc 120
gaggctagtt aacaggtggg agcaacttta ttctgccggt gtttaactgc tgtcttaacc 180
g 181
<210> 301
<211> 541
<212> DNA
<213> Homo sapiens
<400> 301
tctgatccag tgtaatcgcg aaggtaacac catggtccca acagagcggc ctaaaacctg 60
ctcatggcaa aggaacaaaa gggtcttgca gctatcctgg aagttaagtc cagacgtata 120
aaaatgaaaa agaaaactta acccccccct ttttgttctt ttcttaaaaa aaaaaaaaag 180
agtatttgag gcttccgttg acttctttta tcttgtaact tgccttgcct ttccttccct 240
taacttccga ctggcccgaa ggcagctgct gtgctgggct gccctagcct cctgtgccat 300
gttttatgca tgaagatgat ggggcggtaa tttattcaag cagagacgat caccgggctc 360
ctgtgtctgc cctcgcgtca gaggagccgt gcaatggcag ggggagggca ggtgtgtctg 420
actgcacgca ggaatgggct gaaatgggaa tccctctctg taggcagaaa tgaagagcag 480
agctttgctg ctagagctga atcagagcaa caccccttac cttttagggc gtatgattta 540
t 541
<210> 302
<211> 489
<212> DNA
<213> Homo sapiens
<400> 302
ccaacgactg tttttactta gggaaactac tgaactgccc cccgattcct taccgcatct 60
ctgcattgtc ccaagttgga agttgagact aaagcaccaa gatacaagag acgcggcatc 120
ccaaaaggag atttttgtgt attctgcgaa atacacaaaa gggctagcca aagaaagtcc 180
tcacacacgt gcatggtata aaagcaccag ctttaaaaag agaagtgttt ttgttttttt 240
gtttgagaag cataattgaa gtgagcagtt ttagaatcag tgcagcaaat ttagagattt 300
caaaagagat caatatagaa gggatcaaat ccacacaatc atgggaacgc tatgaactca 360
ctggcaaaat gcagtcactg aaggaaaaac gtcagtgtca aaatgctact atttcacctc 420
tttgtgtacg atttctgaga gaactgccac gtttggagat gctaaattta cccaatgcct 480
tcgtagcct 489
<210> 303
<211> 181
<212> DNA
<213> Homo sapiens
<400> 303
cgtttgccgt catcctggcc tcctacggtg ccgtggcccg agctgtctgt tgcatgcggt 60
tcagcggagg ccggaggagg gcggtgggca cgtgtgggtc ccacctgaca gccgtctgcc 120
tgttctacgg ctcggccatc tacacctacc tgcagcccgc gcagcgctac aaccaggcac 180
g 181
<210> 304
<211> 601
<212> DNA
<213> Homo sapiens
<400> 304
cccaccccag ctccttcctc cctctgtcat tggtcacaga acaagtcagt catgatccag 60
attgaaggag aaacctggag caaaatggcc ccagcgcttc cccacctgag agggatcagc 120
tgaggccccg cccccccatc cctgggagaa ccgggctggt cactctgggg tcggggcggg 180
gcacacctgt gcccggagtc tgaggtcact caccggctga ccctggtggt ggtgcgggcc 240
caggaacctc aggcccctca gtaacacatt ccctgcggtc ttcgagaact ttcctcaggg 300
cgcccacagc cctgtgccat cttctccacc cgcgcttcac gctctgattc tcgccgcggc 360
tgtggaagct caggaatcgc gtgtcgccca cgaaggcgcc gcggaggaac tcagggccca 420
cgtggtgaag gcggagcccg gcggccttca agtacccggg gtgcgggcct gggctccggg 480
aacccgcaca ttgcgggcgg gagaggcgca gggtgcctgg gacgccgccc cgctcgcctc 540
tctcctggac gccgtcgccc tgcctccccg cggggacaca gcctccctcc cacgtcccgc 600
c 601
<210> 305
<211> 421
<212> DNA
<213> Homo sapiens
<400> 305
cgacgaggag ggcggtgctg agcccatagc aagtctgtgg atgccccctg gtggccctaa 60
atagaatggc ttcaatggat ggaaatttaa cgtgctcgca tccccagcac gttaaattac 120
ccagaaaagt aagagaaaaa gaacagacac atcagaaatg tctctggcca aacctttcaa 180
gtacgaatca aggcaagata tggcgatgaa caagcagaga aaagtggact gcaaaggaag 240
cagtaattaa tctgtcagag aagggagggc tccttcctgc ttccggacca tgttggatgt 300
gagtctagat gcgagacatc tattatagag ataatagaag aggttagcgg aaccaaggat 360
ggttcacttt tcttctttag aaataccatt aatgctgatc gtcttcgccg ccgcctgcgt 420
g 421
<210> 306
<211> 241
<212> DNA
<213> Homo sapiens
<400> 306
cgtcctaggg gacaggtgtc catcctcact ttcctgatag aagaccgccc ccctagataa 60
gcgggcggcc tccgtgccca tataaggccg gcttgggctc cacgccggcc tcccgcccgc 120
agcccgcctg cctggcaggg cctttgcatt cctcccgcca gctgtctccc cgctaggggc 180
gggggtgtag tttagcccgg ccctccgggc tgggtcgcca gggagtagaa agggagcact 240
c 241
<210> 307
<211> 391
<212> DNA
<213> Homo sapiens
<400> 307
ctggtgatgc tggaggaggt accggggagg agcgtgtgtg gccccggcct ctcactagca 60
gcggcggctc ccgacgctag cctgctcgag cgcacccagc accctcccca agaccatggc 120
ccgcacctgg acccgcggtt aacttagccc gccgcggaga gagccaggca atgcctgggt 180
ggtgtcgtgc tcaccagctc ctttccgcag acctgatgcc gatcagattt actccctgct 240
gaattcaccc cccagtcagg ccggttttcc ttgtttcacc gtgttctctg aatacactga 300
attactccga gcatctatag ttggcaatgc cctgcgcatt ttccgcactc cgatacactt 360
tacactgaac accaattcgg aagttgtgtg g 391
<210> 308
<211> 181
<212> DNA
<213> Homo sapiens
<400> 308
gctgcagtgt gcctttctgc ggacggccac ggccacctgg ccaggaagcg gctgctgcag 60
cagtcattct gcggcatctt gcggccttgg cgggcggtgc tgtgccgcgt tctgctgccc 120
ccaaggcaat gctggctttc cctgtgtggg gctggattgt ttgtttcatt tactcgcata 180
a 181
<210> 309
<211> 421
<212> DNA
<213> Homo sapiens
<400> 309
gggtgctgga ctagccacaa cgtgcgttgg ggttattccc tgggcgccgc acccaccggt 60
gcccatctcc cacctcagca gactttcctc ctagcagccc gcaggcttcg gggaatgcat 120
cggataccca agccctggct gcctccctcc tcctcctcgc gctgctgcag caaagggctc 180
gtcctccctc agtcgcgaag gagattatcc tagcgttgcg ccatgttatg ccctcgcctc 240
cccttccttc ctcgccgccg gctccaaagc ctcgccgagg cccatcgccc gggccccttc 300
cccccggttc caaatccctg ccgcaggggc cgcccgggag ctctgcggag gcgccggagt 360
cttggggcgc ctcacccttc ctggctttgg agaggagccg ggctgacagc gaagcccagt 420
c 421
<210> 310
<211> 541
<212> DNA
<213> Homo sapiens
<400> 310
gccaaagaca tagactaacc ccacccgcta gcgcccaccg aagttactga ttaggaaggt 60
tcccctggca tcagcccatt tgcttcacac actcttcctc cttcccaagg ggctaacgga 120
aaagttgcac ctaccagcgg taggagcacg gggaatcgcg cacgcaggcc ctccgcgcgg 180
cttcccggag cggcctttgg cgactgcgcc gcccctacaa ggccgcacac ccctcgccag 240
cactccggca gcctcgcaca agacggagcc cacgcaggct tctagttttc taaaccaaaa 300
actgcacgcg ccggcgtgtg aatctgacgg agagactttt agagttttgt ttggttttca 360
gttcagaccg ctacgctgtc agagcaagca actccgagcc ttgatgggaa tgacttacaa 420
gccgcggtgc gggctgagcc tgcctctctc ggggttcttt ccccaaggga gtgggagaca 480
attgggcctg gaacctaaaa ggaagagagc ctgtgctagc cgcggggtag aggggaagga 540
g 541
<210> 311
<211> 181
<212> DNA
<213> Homo sapiens
<400> 311
ctgccacaca ccgcaggcag cgctgacaga ctcggccttc cgggagcgca ggcgggtggg 60
gggcgccgcc cttgtcgctg tccggagccc cgcaggcccg tggccccctg cctggttctc 120
ccgcctctgc aagcctagcc ttcaggactc cgcctcgccc ccctcttttc tgttcggaga 180
c 181
<210> 312
<211> 301
<212> DNA
<213> Homo sapiens
<400> 312
tggctcaaaa tattcaaaat tttttccaga gtttggcctt ttcttcagca ctgggaattg 60
tgatccaaag cttttcctga tgaggcacaa agttggagaa acaaaacgca aactaagcaa 120
caatgaaaca gaacagagtg aatctgctgt agctcaagag aggacgtagc tgcccccact 180
ccgcatcccc gggctcgggt ttgccttgct gacctctgct gccacctggt gccgcacaga 240
gaaactgagg agaaaccaca tcagtctcct tcagcctcag cttcacatct gtggtgggtc 300
a 301
<210> 313
<211> 301
<212> DNA
<213> Homo sapiens
<400> 313
acaactgcac acagtccaaa actcacgctc acacacatca aaacacaact tcgcacgtcc 60
aaaactcaca cacacacacg acacaacttc acacaacgtc caaaactcac gctcacacac 120
atcaaaacac aacttcacac agcgtccaaa actcacgctc acacacatca aaacacaatg 180
tccaaagctc acgctcacac gcgcgttgaa agcagccgga acaacacaat ttcctccaag 240
gggaaatgcc gattcgaatg acagcgaatt tctcatcgga aaccatgcag gccagaagga 300
a 301
<210> 314
<211> 301
<212> DNA
<213> Homo sapiens
<400> 314
ctttttgaaa tgaattgagg taaaataacc gtttcaggtc catcccttac atggcaaagt 60
aaaaagctgg agtcagtaca cagtgttggg gtgggggcag cgtttggggg cgacgagttt 120
tgtgcaccgc gctggagtac cctgcacata aggtccgctc atgggcttct cagtacggac 180
tcgccggcgg gaacaattaa ttgagcaaag cgcccctttc tgggctggag caaggttcgc 240
ggctgcagat atctcaagct gaaggcaaga gcccaggcga ggcgcaggca ggccacgtgg 300
c 301
<210> 315
<211> 181
<212> DNA
<213> Homo sapiens
<400> 315
ggtccagccg tctgagctgc cccagacggt ggaagtcgaa ggccgtgatg ttggttatga 60
agttgccgcc gaggctgtag gtgagcacgt cgtgggggct cggcagcgag ctggtcttgg 120
gcactacgcg gagccccctg ttggtgcaca ggagatgctg gggatgctgg cagtcgcagc 180
g 181
<210> 316
<211> 481
<212> DNA
<213> Homo sapiens
<400> 316
aagaaagtag ggaagcgctc agtagaatcc ggcgcctctg agccggcgcc aactggccag 60
gtccatactc ggggcagatc ccagggctgg gactctcatt cgatggtccc aaatttgatc 120
tctttgacag tggggctgag caaatgcagc cctgaaaaag ataagcttag cgagagctgc 180
gggcatttgg caaaggatgc tgctctcaga accgtggctt ctgctcctca ccagtgcgtc 240
tctagcctgg ggctcctatt ttccctagag ggaccctgga aaatgggacg gctgccgaag 300
agaaggcgaa ggtcagggcg cggagctcta cggtaaccac gcgacgcgta gtgggagagt 360
gcgaacctta tggtagcgcc cggactaagc ggacacagac ccctctggtt ttacaaaggc 420
ggctgtgacg aggacttccc acggccttgt tggagggcgt cctgttagcc ctgctcagcc 480
t 481
<210> 317
<211> 301
<212> DNA
<213> Homo sapiens
<400> 317
acatacatac atatatatat aattagaatg aataagacag aatttgatag ctcaacaggg 60
tgactatagt caataatact ttaattgtac attaaaaatt aacttaggtc agcgcgaggg 120
agcccgggtg gccgccatta ctgagcctgg cgctgcggct ggcgctggga gagcggggag 180
ggacggggcc gcagctggtg gcagagaggg agggagggtg ggtgagcagg ctgcgggggc 240
cgtggggctc agggtttccg ggcgtgtgtg tcggggaggg cggagggagg tgcctgaagg 300
g 301
<210> 318
<211> 181
<212> DNA
<213> Homo sapiens
<400> 318
tcccctggct gcatttctta aaaatttggg agcctgggag tgagttttct ccgaggcgtg 60
tgtgagaggc ggcgggggtg ttttcctgcg cgaggggcgg gtgaagttca ttgcccccac 120
ttttcccgcg acctttttcg gacccgattt tggatcgagt tgaggggggc gcgggcgttt 180
t 181
<210> 319
<211> 301
<212> DNA
<213> Homo sapiens
<400> 319
ccttcagcaa tggtacgggg actgctgtgg ggcctgggtg agggtgacgg ctgaggagag 60
tggtgggccc taggagcccc tcaccagcaa gcgccttcaa tgattgagcc cctgtggggg 120
cctttgggag agtaggtgtg gatgaattgg gctttatcta aaggggtaat atgtgtattg 180
aaaaatacac acgtagtgaa caccaaatcc cgggagtagt gctagtggtg ggtttgtcag 240
ctgtcaaggg ctctgcaacc ctttctctga atccaagtag ttcttccttt ggacagggaa 300
c 301
<210> 320
<211> 181
<212> DNA
<213> Homo sapiens
<400> 320
aacgatggaa ggctggagtt ggtaacattc tgagacgggt gtagcctagg gaagagtaag 60
gtgtccggcc gggctgtatc tcgtgggtgg cgagggaaca ttgcctgtct cggaaacagt 120
tcccaagaca acgcgcatcc cagacgcccg gcgaggctgc cttcctacag gtcttttact 180
t 181
<210> 321
<211> 181
<212> DNA
<213> Homo sapiens
<400> 321
ggccgacgac acgtggtgga aaagtagcta ttatttacat gcgtgttgca gtttttgata 60
atgcgattgc tgctgctaat gtgactaacg cgatgccgat gaacatctcg gcgttttttg 120
gtgcaggata agcgggtgta gactctgtct gtttagtccc agattctcct cctttaatga 180
a 181
<210> 322
<211> 181
<212> DNA
<213> Homo sapiens
<400> 322
aaattcatca gttggggtgg ttgagattgg gtgagtggtt ttgggggttt tgttttgttt 60
ttgcaaccgt tctttccaaa cactccccgc cgccccccac caccgcagaa aaaagagctt 120
ttagcataag gcggatgcta tctatccgcg gtagaaactg ggtcttctgg tcccaaggaa 180
t 181
<210> 323
<211> 361
<212> DNA
<213> Homo sapiens
<400> 323
ctaattaccc ctcttaatta aagtctttag cagttgtttc attgttttgg caagaaaaca 60
ggagagacgt gcagttagaa acaccagagc ccgagctcac agcggagccg ctgattaaca 120
cttgaagcat ttcaaggacc tggcacccgc cacagtttgg ttttcatcca tgtttcctcc 180
ttgaatggaa gtatattcgt ctataaacat acatacacat gtaaaaacac ggaggctccg 240
tttgccagct gtgtacaagt cagtatgtgc cgtcaggatg caaacaatag atacctgtct 300
atctatgatt gtaatgcgtt tgaggagatg tacattgcat acagctactg gatacgttgt 360
t 361
<210> 324
<211> 423
<212> DNA
<213> Homo sapiens
<400> 324
cgccgccttc tccacggccc cggccggact tgggctgctt tcgggacctt caggttgtcg 60
caccttcgcg ggcacctgcg gctgctccag cgtggggacc aggcttccca cgggctccat 120
tgggagctct gccccggctt ggcctccggg cgcagcctcc caagactcct ccatcccgcg 180
cgccccgcca cccggagacg ctgaggagcg cacctgggcc cagtgcagag gagcttcgct 240
ctcctccgtc cggattggtc cagccgcgtc gccgaagttg tcaggccacg cccctccccg 300
aaggaccccg ctgtgattgg ctgtggctga ggttctgctg ccccgacccc cttcgggaca 360
cagccccggc ctccaccagg cactgggagg gagctgagaa cggcagcggg gccaggcgag 420
ggt 423
<210> 325
<211> 344
<212> DNA
<213> Homo sapiens
<400> 325
ggagtgcgga gcgcggtggt gcgagagggc ttggaggggg cgctcaggca gggcgtgggt 60
ttccctcaga ttcaatgatc ctgctgggct cggtggagcg gtcggaactg caggccctcc 120
tgcagcgcca cctgtgtcct gagcgcaggc tgcgcgcagc ccaagagatg gcgcggaagt 180
tgtcggagct gccttacgac gggaaggcgc ggctggctgg ggaggggctc cccggcgcgc 240
ctccaggccg gcccgagtcc ttcgcctttg tggatgagga tgaggacgaa gacctctctg 300
gcaagagcga ggtgaccgcg ccgggaaggg ctagggagtg ggat 344
<210> 326
<211> 481
<212> DNA
<213> Homo sapiens
<400> 326
agtgaggaag tcgctgtaga gcagccggcc ctggtcgtcc gccgccagca cgcggtcccc 60
ggggctcagg tccttcacca gcttggtgcc gccctgctcc aggtgcaccg tggccgagcc 120
cgggaagcag cctcccgatt tggccgccac cgagttctct gcgggtgagg agaagggaaa 180
gaagagagga cagggcattg agttccgaga gggaggcgcg tctcggggag gagggcgcac 240
gcttggtgcc cgcgctccta ggccaggggt gcgcaaggcg cggggcgggg cgattgattc 300
caggcgggtc ccgcacacac ctccctcccc caaccccact gccccaggga caggattccg 360
acacattcct taacgactct ctaagtctgg gctggcggtc acagaggttg gctggcgttt 420
cctgcagagg ccggtgacac tctttccttc cgccttcctc caaccccacc cccagctccg 480
c 481
<210> 327
<211> 421
<212> DNA
<213> Homo sapiens
<400> 327
gggatgacct aaagtccagc tatcaaaatg cgccgcgttt tcagaaaaac tactgccacg 60
atttaaccta aaaagcttca tctgtatttt ctgccacagt ttgcttccgt ttccttcagt 120
cactattccc tggcgaagtc tccacgcgct cccgttcgcc ggggaactta gggtatccgg 180
gcttccctaa attgacaagc gggggccggc gccttcgccc gccttcgctg gccgccgctt 240
ggtttgttct tcttctcctt cggggacttc tccgcccgcg cccgcgcccg cgccccagct 300
ttcgtcccgc tgtgcggaga tgccacccag ctccaccgca ggaccgcgga gcgagaggcg 360
gcagacgcgc tccgggggcc gccggtcaag aggaagatga agggcgcgac gacttcgcgg 420
t 421
<210> 328
<211> 481
<212> DNA
<213> Homo sapiens
<400> 328
aaggacttct gccggcttcc ttcagaaaaa tcaagaattt aagaaaatac ttgttatgca 60
aacaaacatt tagcccactt aacattgagc tacggtcgtc caaagctgct tagtgtccgc 120
gaggaggccg tccggatgcg cgatgattca ggccttctcc gccagctcca cccgggacgc 180
gagcacccgg cgtggacctc tgcgtcccgg gcccacgacg cccgcgccgc ggggtgcgcg 240
cactgcgtcc ccgctctcct gggactgcgc cccgagtaac acgtgcaggg ggcactgggt 300
cccctgcaag cggcgagaac gccggcagcc ctggccagtt aagcggggag tgggtccacg 360
cggaccacag cggcaactca gcccaggacg agcctcgggt caagttctcc gactccgcac 420
tcgggcacct agcgggccgc gccccggagc tacgcggccc caacctcacc tgcccgccca 480
a 481
<210> 329
<211> 721
<212> DNA
<213> Homo sapiens
<400> 329
cgcgtcccgg actgggctgg aggagtctcc ggatttacct ggctggcctt gtcccttcaa 60
ttggggtcat cccatccttg ccccctggcc tgccagcgcc gcttccagcc ggtctcctta 120
gggcaagggg aggctgggct cagaaaagtc ggcccttgga ataccggcgc tcctgggctg 180
caggagaccc tggcgtcccc atccctctag aggcccctct cccacggcgc cgtttgtgca 240
gtgagctctg tgctgggtcc cgcgtccttg cctctccttt gcctctcctg gaagtaactc 300
gagctttggc tgtttctcca ttgacttcgc gcaaagattg cgaagaaaga aacgcggctg 360
gggaagcggg gttccctcac cgcagcccac ccgggcctcc ttccgcgact tccctcttag 420
tcagggcctc agtacgcctt tgctttgctg gcagcgagcg ctgcagcgcc gcagcccgac 480
cccaagcctc ctacaagggg gtcgcaagtc ccagcagccg cgcgagcatt ggcgacccct 540
ccccaccgca gagatttcct gcgccgacca cgtgctcgca gctccacgca cgccgtggat 600
ttgagggtcg ggcccccgcg gccgccgctt cctttcctgt cccaaatcca gcctaagagc 660
cgcttccctt tccctgtcct cctgacccca gtggcaaccg tttctccacc gccccttgcc 720
c 721
<210> 330
<211> 181
<212> DNA
<213> Homo sapiens
<400> 330
ggtgcaggag agcacacgct gactgtgaat aagtgtgtca gttcttaagg tccagcaaca 60
caaagcgaaa agttagtgga ggactacgag cgcgatctcg acagagggcg ctgggtggtc 120
agtggctcca gcaaccacgc ggctggggtg cgccgggaag ggagctggat gttttagcct 180
c 181
<210> 331
<211> 181
<212> DNA
<213> Homo sapiens
<400> 331
gctcacgggc gttggccgcg ttccgctgcg actgcttgca ctctgcggct gagcccttgg 60
ccgggagggg cttcttgcca ccaccgcccg cgctaccacc tgcgccgccg cccccagcca 120
cacggggccg cttcctcttg cagccttccg cgctgccggc tgtgcccaga gcgcagcgct 180
c 181
<210> 332
<211> 301
<212> DNA
<213> Homo sapiens
<400> 332
tcagaggatt gtaaaccact taagaaaagg aaacagaact tggggaggcg gtggcggcga 60
gagtaaacaa ctcccagggg gcccgtctgc agcgcctagg ggaggggaga ggccgggagc 120
cgcctccggg ggtctcgcgg ggccgccgct gggacagatg agtcggagac aggccaagcc 180
ggaacctcgc tgggtaagga acaggaccgg agcgcgctcc gggtgggaga ggcttgcgct 240
cctgcagccc cttcccaggg cctgcgctga ctcatggcgc gcactggagc ccctgcagtc 300
g 301
<210> 333
<211> 301
<212> DNA
<213> Homo sapiens
<400> 333
atccatcctt aaatccttgg atgtgtttag acgcacaagc attcatcaac tatttgttga 60
gctcctactg tgtgccaagc acgcctctaa gcgctgggga cggcgatgga acaaaacaca 120
cttccggttc tctggagttt acatatcggc gtgtatgtag gggctggggc gttcattatg 180
cattgctggg gggcttctag tacggccagc gctgcttttc attctgttcc cagttacctg 240
tcctgtttga ggctcagcct gtcttgtttc cctggaagcc tttgctacaa agcggtgcca 300
t 301
<210> 334
<211> 181
<212> DNA
<213> Homo sapiens
<400> 334
agctcacagc cgggatggca ggagagtgcg gaagcggcac atggcagaca caaccgggga 60
tgacccagct cctcaccaga gggcaggtac cggaaaccag caaacacgat ttgacaggac 120
gcagagcaaa caccgcatta aacagctcct gcgttccaag gccaggtgct tagttcatct 180
a 181
<210> 335
<211> 181
<212> DNA
<213> Homo sapiens
<400> 335
ttgcgtgtca tgtacacatg tgcttgtgcg cgcacgtgtg ggagtgcgcg tgtacgcgca 60
cctgtgagcg ctcggcgcag gcccgcgaca cgcccgagcc cctcccgccg cgccccgctc 120
tcgcccacct cctggtgctc cacctccccg ccgcccgggt gcgtggcctc tcgggaagac 180
c 181
<210> 336
<211> 301
<212> DNA
<213> Homo sapiens
<400> 336
cggtaattac gagaaaatac ccagtctcgc catcagtttt gctaaccggt acttgaaaat 60
gggaaacggg gaacttatcc aacctccaat ttgtcacagt tgtatagctt tcgtattaat 120
tctgtacaga cgtgaaatag gtgggtacgt agcaacgtgc tgggcataaa ttaagcaaca 180
atggccacgc gaggtctcgt ccgccgcgga gctccagtgg tgggcactgc caccttgcca 240
tccctagccc ccaccgccct tcgcagagtc cagtccggga ggctgacggt gcgctggctt 300
t 301
<210> 337
<211> 313
<212> DNA
<213> Homo sapiens
<400> 337
tgccctcccg cccttggaaa cttgtggacc ccagaatctc agctttccgc ctaccaaagg 60
tgccccgatc ccctcccact gccctagcag cggcccagcc ccaacgcctt tggctagaga 120
ttgaaatcct ctggaaccaa ccactggacg ctctggattg gggcggaacg cgcttccact 180
gtctcgaaag cagcaccttc tcggatttga gcctttgcgg cgcgcctggg ctgagatctg 240
agaaatgcgc cctgggccac aggcagcagc ggaggcgggg aaggaacaac tttccctccg 300
ccctctaacc aca 313
<210> 338
<211> 601
<212> DNA
<213> Homo sapiens
<400> 338
gggcacgcag gccgtcctgt cctcgagatc accgcgtcac gacttttggg gagactcacc 60
cccaccaaca ccgtccagag aggcctgagg gagggattcc atgctgcctt ctccggactc 120
tgcgtcgggt ttcctcaccc tgttcggccc tttgtgactc ttggcatccg gagactttcc 180
cctcgaccca gtggagccgt caggccggag cctcagagcc ttgacaccca agcactgcca 240
cggaagtctc cccctttgcc aagcctcggg gactggtttc taagacaacc gtgggaacca 300
ctgtgacggg agaaaccgct tgtgcttcgc gcatgcgcat tggctgggcc gactcgttct 360
cccctcctgg cagtcaggct gcgtcccctt taaagaacgc caccgctgag aactgaccct 420
cacatctccc ttcctgaatt tctttaggga aagcaacaac catccctgta agccatgggt 480
tttcatgcgg aggaaggaga gggctagttg tctgagaggg taactgctta aggctgcaga 540
ctaggaaatg ggattccagg tttaagatag ctcctttctg gacctcagtc cttcacctag 600
t 601
<210> 339
<211> 181
<212> DNA
<213> Homo sapiens
<400> 339
tccccaggcg ggaggtaggc gcggagtggg ttggaggcaa aggacctggc tggcctttgc 60
ctggaaagtt ctgaaaacct cagcagtgac cgcagactaa gactgagtgg aaaggttccc 120
gctagcgttt gtggctctaa gtggcaggag gaggcggagc atcttgaacc tgcagccctg 180
g 181
<210> 340
<211> 601
<212> DNA
<213> Homo sapiens
<400> 340
ccaaggcggc cctccttcca gtgctgccag gagagggaaa aggcactcag ggagtttttg 60
ctggagataa gagcaatttt tgaaaaaaag gtagtaaggc aggaggtgga gtctgccacg 120
ggtctctttc aaacttgcta ctttccatcc cgttaataca atcccggccc tgtttcccgg 180
ccccgcggcc attgcagagt catgaagtca tcgcagctgc gcctgcagcc aggcgggaac 240
gggaacggga actggctggc cgcggtccct tctgtccccc gccagccgga aatgtccgcg 300
cgctgaaaag cagacgctgc ctgcccgggg aacggcgaga gagagcgaga aaaaaaaaag 360
cctgaaggcg gcgcggcagc cagcgagagg ggagaaacag attcacaccc aggggcctcc 420
gggcagggcc cacgggactc aggccgtgtc ccgcttggaa tgtggagcag gcgcggcctc 480
ggcgtcagca gagctcccct gcatctcctc ctgggggtgt gggggccgag tgggagaact 540
ggcggacaga ggaaaggggc ctcgctcgca aggcccgggc ggggaggcct ggcctcctgc 600
t 601
<210> 341
<211> 181
<212> DNA
<213> Homo sapiens
<400> 341
ctttcccagg gcccccagag acggcccccg caggctctct ccgcggccgg ggctgggcag 60
gttgcgggct tagggcggcg ttgtctcatc cggcggcctg ggcaggtgcg gcagggccgg 120
cgctcacgcg ggcctgtgtg tccttggccc acagagatgg acggcgatgg cggccgccga 180
g 181
<210> 342
<211> 661
<212> DNA
<213> Homo sapiens
<400> 342
gaaacgcggg aggcgaaggc gaggctgctc aggggcggct cgggccgcct ccagggacgg 60
ggacgagccg tgcgcgccgg gggaggggga ggcgctggcg ctgcggcggc cgcggggagg 120
gccaccttcc cagcacacgc acacacgcgc ccccggccct ccgctgcgcc agctgccgct 180
gcccgccgac cgctgacctc caggcaccag agcgcccggg gacagcgatc tgggaaccgg 240
gaccgcgcgc tggcacacgc agtggccgcc gccgctccgc cgagcgctgc ctgtagcacc 300
tgcacggtgg tttggaaccg cttctcggag gtctggccgg gaaggtctgg gcaggagaat 360
gttccacgaa ggcgtcccag aggcatctgc agcctacgct ctcccgttct tttctggcgc 420
ccacgagccc ctgaccgagt cccgggggtc gctgaagacg cccacgggtg ctcgaacgcc 480
cgttggtgcc aggctgcccg gcctttaggg ccttggctga ggacacccct ttcctcccca 540
ccagacggag cgaccgccct ttgccaaccc caagcaaagc tggggtccca accttacgtg 600
cgctaccgcc ccctccaggc atttgacctc cccgcgtccc cattcttgat gggccccgcc 660
c 661
<210> 343
<211> 721
<212> DNA
<213> Homo sapiens
<400> 343
attcactttc aaccctccag gggaggaggg ggtgcgggtg gggaggggag acggctccca 60
gctccacctc gcgcgcggcg cggccagtgc actcggctcc gggagaggcg agcagcgccg 120
gtgagccccg cagcagcgca cccggccgcg gagccccgcg atggagtgag tatccccgag 180
ccgcgccgcc agctgctctc ctctcggcat gttgccatgg tgaccgcggc ggcaggcaga 240
tcccgctcgg gtccgcgtcc aggatgggtg tttaatttca gccccgtgtg tacgcctggt 300
gtttctatag cagccgccgc ggcggcagga ggcaaggggt gggagccccg ggtggcgtgg 360
tttttgcggc tgccccttgg ctagcagggc ctggggggcg agtgagggga gtagatgatg 420
ttgctaagga cggaggcata ttctaggctt tcctatctct gccccaagct tccgcttatc 480
ggggagttgg ccgcaatagc catgacttcc gattcctaac catgtcagca ttattggact 540
gcagttaaaa aaagagggag ggggtcactg cggatcggaa gcaaacgcgg ttcagtgtga 600
agcgtgtaat ggaaggatga gttagtgggt aatatgagcc agggctgcaa tgtcctggct 660
actagaaacc atcagaagac ccaaaagaat tgatttgttc ctggggtatt ggagaaataa 720
g 721
<210> 344
<211> 301
<212> DNA
<213> Homo sapiens
<400> 344
tgcaccgctc tctcagcgct gaccacactg gtttgtaaat gtttcgtttc tggctcttct 60
cttccacccc ttccaccttc ccagagttgg ggtcccgggg ttgggtgtgg gggaccaaga 120
agatttgcct ctgcgtcccc agggcgggca cccctccacc cgggggagca ttcggaatcg 180
cttgtgtgtg cacggaggaa acagtccggc aaaaaggctc tggttacagc ctgcctgcct 240
tggcaaattc aagcaactgt cagttgaaaa aaacagcgtt gggttggact gagtgcagga 300
g 301
<210> 345
<211> 316
<212> DNA
<213> Homo sapiens
<400> 345
tggaaaaagc ccctgaccag cgcactcaac ctgcgggccg aagggctgct ctccggccag 60
cctgggcgcc ggggacagca gccggcgcgg cgtcctacct ggtgaagttc gtcctgccct 120
cggcgtggac ccaggccccg gtcgccgccc gggagggcac cggcctcgct cgcttgctcg 180
ctcgcccgcc cttgcccgct cgctccccgc ccgccgcctc cctcgcgcgc ccgctccggt 240
cctccggctc ccactacagc tcattccaat atggcatcct ctctgtgcgc atgctcggcg 300
ctcttttttt tttttt 316
<210> 346
<211> 181
<212> DNA
<213> Homo sapiens
<400> 346
gcgggtgaga ctatggagca gcgtcttcgg cggccgcggc ggcagcagca gcagcagctt 60
ctgaacgcgc ctcaatgaga gcggcggtgg cggcagccgg gccgagagac ggactcgggc 120
tgactccagc cgctgggagc gcgaggccat gtaacccgct cggctccagg ctgcgaggtg 180
c 181
<210> 347
<211> 181
<212> DNA
<213> Homo sapiens
<400> 347
ccgtggtgga gttcaagcgg aaggaggtgc ttgtccgcgc gtgctgtggt ctacccagtg 60
tctgtctccg gccacagttc gtttctcggt cggtttagtg tccgtgtagc cacccaaccg 120
tgtggccgac cattcgcgct ttcatttgtc cttcgcctcc gtctgcgccg tctgtcctag 180
g 181
<210> 348
<211> 241
<212> DNA
<213> Homo sapiens
<400> 348
cctgtctgtg cacgcacaca cacattccca agcataccag cctcccctga gcctggagcc 60
cctgaagcca tgagcagcct gtgctcaggt ggcccccacc ctctccacac gggagcggct 120
acagccaggt cacggatccc ctccctcccc agagagaagg ggcaggctgg gggatgaaac 180
ctaggctcag tgttccctcc cccgcatcct ctcctggcac tctccagagg aggaagggga 240
g 241
<210> 349
<211> 1561
<212> DNA
<213> Homo sapiens
<400> 349
gaggccatgc tgcaaaccca gacttttcag gctgcatctc agatataccg aagtgtgtac 60
ccgctacgca cagtgcggtg atgcctggcc acctccagcc tccagcgggg acctcctgcc 120
caggtggagt ctgaatgccc accgccacca gcccacgcgc gcagtgggcg tacacgtggt 180
gacctgcctg cggctgggtt cccagctccg gctcctcctc cctccagctc tcgctcggct 240
tcctgcagta tcacgtgcag ctgcgctggg tgcaggatgg cggcggccgc ggcggcggca 300
gcagcggtgg gtgtcaggct ccgggactgc tgcagccgag gcgctgtgct cctgctcttc 360
ttttccctgt ctcctcggcc cccggccgcc gccgcctggc tgctgggcct gcggcccgag 420
gacactgctg gaggccgcgt gtccctggag gggggcaccc tgcgcgccgc cgaaggcacc 480
agcttcctcc tgcgtgtcta tttccagcca ggaccgccgg ccaccgccgc accggtgccc 540
tcaccgaccc tcaactcggg ggagaatggc accggcgact gggctccgcg gctcgtgttc 600
atcgaggagc ccccgggcgg tggcggcgtg gcccccagcg cggtccccac tcgccccccg 660
ggaccgcagc gctgcaggga gcagagcgac tgggcatcgg acgtggaagt cctggggccc 720
ttgcgtcccg ggggcgtggc aggctcggcc ctggtccagg tgcgagtgcg ggagctgcgc 780
aagggcgaag cggagcgggg cggcgcgggc ggtggcggga agctcttttc actctgcgcc 840
tgggatgggc gcgcgtggca ccaccacggc gccgccggcg gcttcctgct gcgcgttcgc 900
ccgcggttgt acggcccagg cggggacctg ctgccccctg cgtggctgcg ggcgctcggg 960
gcgctcctgc tgctagcctt gtcggccctg ttcagcggcc tgcgcctgag cctgctgtcg 1020
ctggacccgg tggagttacg ggtgctgcgg aacagcggct cggccgccga gcaggagcag 1080
gcgcgccgcg tgcaggccgt tcgcggcagg gggacccatc tgctctgcac cctactcctg 1140
ggccaagccg gagccaacgc ggccctggct ggctggctgt acacctcgct gccgccgggc 1200
ttcgggggca ccggggaaga ctacagcgaa gaggggatcc acttcccgtg gctgccggcg 1260
ctcgtgtgca ccggcgcggt attcctgggc gccgaaatct gcccctactc agtgtgttcg 1320
cggcacgggc tggccatcgc ctcgcacagc gtgtgcctga cccggcttct gatggcagcc 1380
gccttccccg tgtgctaccc gctgggccgc ctgctggact gggcgctgcg ccaggagata 1440
agcaccttct acacgcggga gaagttgctg gagacgttgc gggccgcaga cccctacagt 1500
gacctggtga aggaggagct caacatcata cagggtgccc tggagctgcg caccaaagtt 1560
g 1561
<210> 350
<211> 301
<212> DNA
<213> Homo sapiens
<400> 350
gccccagccc gccccgctaa ctggggctca ccttccctaa gccttggcgg ggaagggcga 60
ggcaggttct cctcacttcc caaactggga aactgacgct ccgggatggc gctcgccgga 120
acccggcccc tacccagcgc tgggagcccg ctctccccgc caccggagcg gttcacctcc 180
caattctttg catggcttgc cctagcgatg caaagaattg ggaggtgaac ccagcctact 240
cagcccgtaa gtcactactg aaatgtcacc tcctcaacgt gtcttcctca aaaccacccg 300
c 301
<210> 351
<211> 661
<212> DNA
<213> Homo sapiens
<400> 351
ccaggggtgg gaggacactt cgggcccagc gtagaggagg cctccgaggc ccaagcgggc 60
ttcggctgct gcgagtcccc agaggctccc tcgggcctca ctcgcggtgt ctcctccaga 120
cgccaggggc aggccacgaa gccgagggct ccgcgtggcc gtgggagaag cggggtgcac 180
ggagccttcc cgcgcccaga cgccgagggg atgcaaacag gggagccggg cctggtatgg 240
ccaacctcca ggatcgaggg gccccagaat gtgcgtgtgg ccgggggcgg gggcagctgc 300
gggggccaga actagagtat tccttcgctc tcccctgggg gccgggcccc cacgagttgc 360
agcagagccc gtctgtaatt agggcctcct ggtccggcaa agctgcggct gctcccagag 420
agagttgggg tcttctcagg gcccgcgatg ggggagtggt cgtggtcaga cccccgtgag 480
ccccttcgga aggtcccagt ccctgtccat tcttctgtcc cgcagctctc tccgcgcagg 540
cggggcagag ccggggaaga agacgctgga cgaggggtct tggggccgcc tcgctggctg 600
cggttggaag cacccgtttt cccgcccgcc cgcgcaggcg ctgctctgtg gccaccagca 660
g 661
<210> 352
<211> 301
<212> DNA
<213> Homo sapiens
<400> 352
gctcgcgtcg ctcgcgtccc tccggccccg cttagcgacg cgcgcgggga ggcagcggct 60
gggccagctc cggggacgcc cgcgcgctcg cttgctcgcg acgcggcgga gccagccaca 120
gccacccggc ttcgcgctcc tccgatgtcc tcatttactg caattgtctt cggcgagatc 180
tcagagccag ggccaggagg cgggggcggg gcagaggagg gagcaggagg gaagtccttt 240
ccgctgctcc aggtcccagc tactccgcgg agccgggcgg ccagaggcga gggcgcccca 300
a 301
<210> 353
<211> 301
<212> DNA
<213> Homo sapiens
<400> 353
cgcggtccgg ccattggccg gcgccccccc cccgcccgcg cgcccccgcc ggccgcgcac 60
tccatgaagg gcccattagc gcggcaggtg cctcccgggc tgtaaattcg ccccgattta 120
tctccccggg gacgaaataa atccagcttg gatgggagtg tagttaggca aaggttttca 180
tgcgaaatca ggaaaaaata cgagaacgta ttttattaac ggaaagaatg cagatttgag 240
gacccgcccg cgcgctcgga gcgccccact cggggaagag tcccggcccg cgtcccagtc 300
g 301
<210> 354
<211> 181
<212> DNA
<213> Homo sapiens
<400> 354
cacacctcat tggtccctgg ctaattcacc aatttacaaa cagcaggaaa tagaaactta 60
agagaaatac acacttctga gaaactgaaa cgacagggga aaggaggtct cactgagcac 120
cgtcccagca tccggacacc acagcggccc ttcgctccac gcagaaaacc acacttctca 180
a 181
<210> 355
<211> 541
<212> DNA
<213> Homo sapiens
<400> 355
gtggtgtcgc cgcgcaggtc cagggtggcg cgtggctgct gagcccccgc ctgtgcgacg 60
ccctcatggc catggacgtc atgctgtgca ccgcctccat cttcaacctg tgcgccatca 120
gcgtggacag gtgcgccgcc ctccccgccc gcgccccggc gcccccgcgc cccgcccgcc 180
gccctcaccg cggcctgtgc gctgtccggc gccccctcgg cgctccccgc aggttcgtgg 240
ccgtggccgt gccgctgcgc tacaaccggc agggtgggag ccgccggcag ctgctgctca 300
tcggcgccac gtggctgctg tccgcggcgg tggcggcgcc cgtactgtgc ggcctcaacg 360
acgtgcgcgg ccgcgacccc gccgtgtgcc gcctggagga ccgcgactac gtggtctact 420
cgtccgtgtg ctccttcttc ctaccctgcc cgctcatgct gctgctctac tgggccacgt 480
tccgcggcct gcagcgctgg gaggtggcac gtcgcgccaa gctgcacggc cgcgcgcccc 540
g 541
<210> 356
<211> 481
<212> DNA
<213> Homo sapiens
<400> 356
gttcctgtcc tgaggggcgg ggaggagagg aggggggggg tacgaggccg gctgggcggg 60
gggcgctaac gcggctctcg gcgcccccag gggccttcct gctgtgctgg acgcccttct 120
tcgtggtgca catcacgcag gcgctgtgtc ctgcctgctc cgtgcccccg cggctggtca 180
gcgccgtcac ctggctgggc tacgtcaaca gcgccctcaa ccccgtcatc tacactgtct 240
tcaacgccga gttccgcaac gtcttccgca aggccctgcg tgcctgctgc tgagccgggc 300
acccccggac gccccccggc ctgatggcca ggcctcaggg accaaggaga tggggagggc 360
gcttttgtac gttaattaaa caaattcctt cccaaactca gctgtgaagg ctcctggggg 420
ctgatgggga gtggggaaga ggggtttctg cctcagtggc cccaggcccc ccagccagtt 480
a 481
<210> 357
<211> 181
<212> DNA
<213> Homo sapiens
<400> 357
gtccacgccc cgcgcggctc cctcgcgtcc cgcgtcccgc gtcccgcgtc ccctgctcac 60
ccggtggcaa agccggcgag gaggcggcgg cgctggtggg gactgacccg gcagtccgag 120
aatccaccgc ggccttttca cccaaccgcc ccctcctgcg tgggggcccc gcatcccctg 180
g 181
<210> 358
<211> 181
<212> DNA
<213> Homo sapiens
<400> 358
gggcgcggcc gcggtggccc gagcgcggct gtcagcctgg cggggcggca gcaccgtgcc 60
tcgcgccccg cgcagccctg gcacccagcc cgctgccccc cgcatccccg ctccgctcca 120
acgctcggag ccctcggtgc cgcgcctgtt ccagtgtgtt acaactcgac ccaggccctc 180
a 181
<210> 359
<211> 181
<212> DNA
<213> Homo sapiens
<400> 359
cacgccctcc tcttctgcct cagcgaccag ctctaccgaa ggcagccatc tccttcactg 60
cctgcccctg cgcccgcggc atcccaggcc cgtcttctct ggcctccagg cttgcaacag 120
cccaccgagg ttgggggtag ggggaatgtt cctcagtccc accttggtct ttccaagcca 180
a 181
<210> 360
<211> 601
<212> DNA
<213> Homo sapiens
<400> 360
cttccaaagg ggcctcctca cttcggagat gcagtgacaa gttaatatgg gcgtccaagc 60
ctctgtttcc caggaggaaa tttgcaagag gcggcagccc ctgagcgccc agagctcttg 120
aaaggccacc caggagaggt gtgagacccg gcggcagcat ccgtccaggt gggacccgct 180
gagcgccgtg gccagtcccc cattcccatc ccggcacccc aaaggcgcgc tcgcccgatt 240
gcttcgagtt ccccgacctg gggatttttt ttttagccgc tggtggtggg cgcctcgtgg 300
gctaaggccc ggcgcctgct ctgctacccg cgctgccttt agcggtcgcc cccgccgccg 360
ctgccaggga cgtgctggga aagcccaagc cccgggagaa gatgccggcc atcctggtcg 420
cctccaaaat gaagtcggga ctgcccaaac ccgtgcacag cgccgcgccc atcctgcacg 480
tgcccccggc ccgggcgggc ccccagccct gctacctgaa gttgggaagc aaggtggagg 540
tgagcaagac cacctatcct agccagatcc ccctgaaatc gcaggtgctg caggggctgc 600
a 601
<210> 361
<211> 2041
<212> DNA
<213> Homo sapiens
<400> 361
cctccacctc tcgcattttc aaaggattaa gcagcaatct ccaggaaaga aaatcaatcc 60
cctccccacc atcccatccc cagccaagct acggctccgc caccacctcc gaggcccgcc 120
gccgccgcct ctctatccgc atcccggata ggggcgccac caccccgcgc gtgaccccgc 180
tttcccgcgg gtacagataa aaatcccctc acccttccgt agatgccatg gtctggggaa 240
cgccccctcc tcttcagcac tatccggcag ctgtgggcga gggagaaagc ggacgccggg 300
gtgagcgcga agtgcggccg ggagcggtat ttaagaggag cctctgcccg cccttccacc 360
cgcctccggg gtaagccctt tagcgcctca acgggcgcag gaggctcctg cgggcgctaa 420
tccgcgtccc ggctctccac ggcgcgcgac ccgcgctccc ctccgcccgc ggggatggcg 480
cttggcgggg agctccgggg gctccgaggg tggcttcccc gagagagcga tgcgcccagg 540
gctgcaggag ggcgcacgcc ggcgatgcgc ccctgcagcc gctgccacct gtgctttgct 600
gcggggctcg cgggcgcggc gagtggcggg agcagagagt ggtggcagag gacggtgagc 660
gtgcgtgcgc gtgtgcgggt gtgtgcgcgc ctggggaggc ggtggaggcc gctgcgctct 720
ggctcggcgc cggccaggga gggattgcaa ggtttagccc cgccggagct ggggatttgc 780
aggcgatccc tctctatttt cgtcgagagc tgacatcacc cgcgccgccg cctcgggcaa 840
ctcctttaac cgccgccccc cgcccccatc tccagtcgcg gtccctcctc tgccatccct 900
ccccccagcc tctcgccata aattagccaa ataagaaaag aggccccgcc gctcgtccgg 960
gaaggcttgg gcagccggtg gcaggagccc aggatctaag gagtagctat tgtttcccct 1020
gaagcccgcg tggccccagg tcaccccgtg cggggtgaag cgcaggcgac cgcgcggaga 1080
cccgggatgc ccctccgtct ccgcctccct ggagcagccc ctggcgctcc ctcctcactc 1140
cccggagcac ccgcttcagc tcacactcac ccccaaactc acaggcaggc acacccaccc 1200
catcctccca cgtctggggg tcccaggtcc agcggagtcg agcggctgaa acacgcgggt 1260
ggtgcagcct aaacgcggcc cagctgcgct ccctcccccg ccgaagctcg aataaatctc 1320
tggccttcaa ttattcagcg agattaatat taatgcagct ccctgggggc ggcgggcggg 1380
gtgcagggga ggccgggatt tttttttttt ttttttaggc cgagagaggt cggcctcgtg 1440
ggtgccggct gagaaggcgc ggagagttgg ccgaggggtg agtggcgggg gacggttctc 1500
cacccactcg gcgctgctcg ccgcctgctt ccgtgtcccg ggggcggcgc acagagacag 1560
atgggcttgt gcaagggaga gttcgagcct tccggacgcc tttgcataaa aatgacgaga 1620
cctgtgcagc tttgattatc tctggaatac tgcaggaacc tagggtccca ctacttgccg 1680
accctgtgag cgcagagcag gcaaagcctc actttcctcg tctaggcaat ggaacccaaa 1740
agaactcact tggagggcca caggagaatt aaacagactc tctttttccc cggggtagac 1800
gatcttcgga tttgcgctgt gctggacctt gttagacgat ggaacgcgac cggccacgtg 1860
caaactctct gagtaggtcc cggggatggt gccagaggag ccggagtccc agcaggaccg 1920
attggtagtt aaatgccagg cgctgatatc cgaaggcttg agttcttcac caccttctag 1980
ctgagtaacc tggggcaaat tcctccatct ctctcttcat cccacctgta aaatgggact 2040
a 2041
<210> 362
<211> 541
<212> DNA
<213> Homo sapiens
<400> 362
tgcggagaag cagctccact ccccagcccc aagtcttgcg ggcagttccc gaagaaaaga 60
tgggtttggg gcggtcgcga aagcggcgcc tcgcgtgttt tcctgccgtt cccgggtcct 120
tatagcccgg ccggagactc cgctgagttg actcggcgcc cggggtcctg ccaggggtag 180
tgaatgctgg gaactgagat aacgcaacgt ggcgtttcgg actccccgct ggaccgggcc 240
gtggagagga gctgcgttcc cacagggcat ccctaagcgt cctctgtccc cgcctatgag 300
gacacaacct ggaagtccag gccactggtt gccgccttgg agttggatgt accgtgaaag 360
tgcggccccg acgcaggaag caggcacctt cccccgcact atggaagctc gcgcccctcg 420
cttctcgaaa cacctgattc acggcgtcga ccctgcttcg ctgggtctgc ggacattggg 480
ctcctcagct ttccgccaca gggtgtacgc gcccgggccc aggcgggtgt aggtcccacg 540
t 541
<210> 363
<211> 478
<212> DNA
<213> Homo sapiens
<400> 363
ccggcagggc tcctcgccca cctcgagacc cgggacgggg gcctagggga cccaggacgt 60
ccccagtgcc gttagcggct ttcagggggc ccggagcgcc tcggggaggg atgggacccc 120
gggggcgggg agggggggca gactgcgctc accgcgcctt ggcatcctcc cccgggctcc 180
agcaaacttt tctttgttcg ctgcagtgcc gccctacacc gtggtctatt tcccagttcg 240
aggtaggagc atgtgtctgg cagggaaggg aggcaggggc tggggctgca gcccacagcc 300
cctcgcccac ccggagagat ccgaaccccc ttatccctcc gtcgtgtggc ttttaccccg 360
ggcctccttc ctgttccccg cctctcccgc catgcctgct ccccgcccca gtgttgtgtg 420
aaatcttcgg aggaacctgt ttccctgttc cctccctgca ctcctgaccc ctccccgg 478
<210> 364
<211> 346
<212> DNA
<213> Homo sapiens
<400> 364
gtcaccccac cctgcggcac agtgtatccc actgaggccc ctcggtcgct cccactcgtc 60
gtgccctcac ctagtcaggt cccgcagccg cgcctcctcc ccgcgcaggt accgcctcag 120
cagccccagc agccggcgct cgggcgccag ggcgcgcgcc acgctggtca gcgccgagaa 180
cgtgtcgccc cgagccgcag ccctttctgg gtctcctgtc ccgagcgcca gcaccgccag 240
cagcgccgcc agccgcgccc caggacccat agccagcgct cgcgaacttc ccctcagaca 300
gtcctggccg cgcggcggca gccgctcccg ccctcgcctg ccccgc 346
<210> 365
<211> 301
<212> DNA
<213> Homo sapiens
<400> 365
ggcagagagg gtgggaatgg gggagaagca tgaaccagta ggaagggggg gcagacagag 60
agaaaagtca cagttacaat gacaggaaca gaaacacgga cagtcaccaa gggccagaca 120
cacagcgggg gtcagggctg caaaccgaga aggcagaaca agaagaaatc gagaagaaga 180
gcagtcagac aaggaaggaa gggctcgctg gggctgcagt cagatgtgca tgatggctca 240
agaggaaatt tttttctaaa aaaagtcttt ttgattaaat gactcaacta aaaaaaaaaa 300
a 301
<210> 366
<211> 661
<212> DNA
<213> Homo sapiens
<400> 366
aggctgattc gtcacaggcc gtcagcgcgg gccacgccta tttcctctcc aggttctaat 60
taggtcaggg gccctacagc ctcttgggta gtttgcaagt gcgtcgcgga gccggcctcg 120
gaaatatggc gacagcttca gctttcagtg tgagggagcc gagggcccag ccaaaccctg 180
cgggaggcaa ttcctgggta cccttcccat attttcggtc tttgggctgc gccgtggtaa 240
cctcagagcc tggttgcgtg ctcaccagcg acaagtgtct ttcattggga catgaaaggg 300
gactgggaag tgccgtgcag tttcagggtg gtttctggtt aattacattt tcatgggttt 360
tcgcagagtc tgggggcaat ttgtgtcctc cagagaccag ggaccagggc cgaagctacg 420
gcaggggaga cgcggccagg gccgtggctt ctagtgcgag ctcggttcgc gtccgttccc 480
gtctggcgcc cgggcctccg ggagcccagg gccttgaatg agacagtgct cgtccttgaa 540
aaagcagttc taggtcactc ggcctgcttt gccagcattc cgggccccag ctcaccttcc 600
gccatccatg ttgacaacac cagttctacg acgaagcggg cgattcctct tgcctggaat 660
t 661
<210> 367
<211> 181
<212> DNA
<213> Homo sapiens
<400> 367
cctcctcggc tcagcctggg cccctcccca tccaacatcc actccagtcc tcattcaact 60
tcctcttcct gcgaaagagg ggcgctgccc cgtgacctac acagactgag acacgatcgc 120
catgaatgga gacctctgga aaagctcagg agccgaggcc cacggggccc agcagaggcc 180
t 181
<210> 368
<211> 1225
<212> DNA
<213> Homo sapiens
<400> 368
ctcgctccct gggggtttgg ggcaacttcc ccgctacgtc gcccagggat tttaaataat 60
tgccagccac cagaaacccc ctaaccctta attcttccct ccgagaccca gcccgctgct 120
tgccacttcc ctctccaaac gctggcgggg gtgggtggca gcaccgaggc gattttcttc 180
gtcttttttt cctccgggtt ttgtcatgga aacgctgaca caacctccag acggcggccg 240
agcccggccg gggactgagg gcttttggga ccctgcggga gcgcggcgcg cacaccgcac 300
tccccgggca acagctggac gcgaccatat cccgggtagg ggcgggggga gcgcgacgct 360
ccgccccggc gctagggtcc ctccctcctc ccggctctcc gcaggcgccc tcccctcgcc 420
gggggccgcg agttgcattt ggtaaaaccc agccccggaa tatatagatc gttggagcgc 480
aatgaagtag cctttggaga gaagggagag ggcccgtcgg acagccacag cggccagcgc 540
agcggcagcg gcggcggcac caccatcacc gctcgcaccc cagccgcccg gcccgcgacc 600
aggcagcggc ggccgccggc gggatcggag gaggcggcgg agcggcgagg aggaggagca 660
ggagcgcgca gccagcgggt ccacgcatct cagcacttcc agaccaactc cggcaccttc 720
cacacccctg cccgggctgg gggctccgag agcggccgcg aagcgactcc gatcctccct 780
ctgagccttg ctcagctctg ccccgcgcct cccgggctcc ggtccgcgcg gcggggtccc 840
tgctcctgcg ccccgggcgc gcttcccgga caccccggtc cccgcagcca ggacaaagcc 900
atgaagccag cgctgctgga agtgatgagg atgaacagaa tctgccggat ggtgctggcc 960
acttgcttgg gatcctttat cctggtcatc ttctatttcc aaagtatgtt gcacccaggt 1020
agggggcgcg ttagcgtggt tttgttggat attttcttct ctctcgcgct ctagctcgct 1080
ccgcctgatt tctgcctctt ccaaccctac ctctccgcct tcggcctctt cggggctcct 1140
ggctgcccag agctcctggc tgcccagatc tacccgggtc accgcgtcgg gatggggagg 1200
agaagggaag gtgtgcttcg ccctc 1225
<210> 369
<211> 721
<212> DNA
<213> Homo sapiens
<400> 369
gtgatgaaca taagacacaa atagagccaa gatcgacttt cttaggaagg gggagaggag 60
ggaactcttc acgaagggag gtgggagtcc acctcagacc tctattggaa ggaaatcgag 120
ttgttccggg ggactgaggt ctcttgcata aggcatggga tccttattat tattattatt 180
atttttaaat cccccgcgga ggagctctgg gcaaatgaat accgaggcgc cgctctagct 240
ggttaggctt gggatgcgat aactcagtgc cctcttgcag acttgcatag aaataattac 300
tgggttgtcg tggaggggac acgagacaga gggagttctc cgtaatgtgc cttgcggaga 360
gaaaggtcca agaatgcaat tcgtcccaga gtggcccggc aggggcgggg tgcgagtggg 420
tggtggagta ggggtgggag tggagagagg tggtttctgt agagaataat tattgtacca 480
gggcccgccg aggcacgagg cactctattt tgttttgtaa tcacgacgac tattattttt 540
agtctgatca atgggcacaa tttctaagca gcgcagtggt ggatgctcgc aaacttttgc 600
gcaccgctgg aaacccacta ggttgagttg caaaacgtac cgcgtagacg cccctggtgg 660
cgccgagaga agagctaggc ctgcccagca cagagccgga gagcgtcggg ccttccggaa 720
g 721
<210> 370
<211> 701
<212> DNA
<213> Homo sapiens
<400> 370
aatttatgtt gaagggtcct gcaaataaca aaaatagata aaacaggaaa atgaatttaa 60
atctcaccct ttccaaaact ttgctacaac tcataataac aagggtaata aatgcttacg 120
aagcagaggt caaacgggaa acattagcaa acgaggagag gcgcaggagc ccaggatcat 180
gcctcgatgc ccaccaagtt gggcattagg tcactatcag agagaaatgc agccagccac 240
ttcagctatg gcttcagctg aggcaaaagc tgtgctgcca agttgctgaa cctgctcttt 300
ctccgttcct ttgagattca ttaaagaaag ttcagaaaca caactacatg aggtgaggat 360
aagggcatat gcagaccccc ttcaataaaa cttactttca tctactccca tccatatcca 420
aatccctcag cttgggtgga caaactttcc agagagggtg actgaaaata agatactcct 480
tctagaaaca actggccgaa ggggcaccag aaaactttct atgctccaag ttgaggtaag 540
ctaccaaatt gggccccaca gagggtggcc tgaagtctca gaaacacagc tgcacaagga 600
ggaacgcgtc agccagaagg cagggagagc cagaggaaca tggtgtccag cgtctcctaa 660
ccaggatcta gccgagcaga gaaaacattc agcctcctcc c 701
<210> 371
<211> 901
<212> DNA
<213> Homo sapiens
<400> 371
attagtaagc aaatcaccac ccacaactaa ggggacagcg gaagccagcc tcagatgact 60
gaaaccccca agtcagtagc tctcctcaaa atttccggcg ggttattata gataatgact 120
tttcccaccg ccctaagcag ccgaagcttg actcagtgat gattctctct atcccgtaac 180
tgcgaggaag tgggcgatca gcaaattgcc cttttgcagg aggctgggga cgcccctgga 240
agttcgcttt cattctccag gttttctgcc ttttcccttc ccccttcctg caacgccccc 300
gcgcctcctc agcctgggga tttcctggcg cttcgccggc cctctccgca accccctgat 360
aaatcggttc agaaccagtc tggctgggag gcccgagggc tgacagcagc ggagcggccc 420
cggccggggt ctcacggact ctcggggtct ggccgacacg gccgctcccg tcactgcagc 480
gcgggctgag ctcacggccg cgcgcccgcc gccgccgccg ccgccgcctt catgctgcag 540
cgcagggctc agttccacgc ggccaggagg ccgccgttgc ccacacgcga cgctttggga 600
agcccagctc ccgggtccgc cccggccgcg gccgcagccc cggacctcgg ctgcttgcct 660
cgcgcctgaa ctgcggactc gccccagcgc ggtggccagc gggcggggcg ctgtgttccg 720
cggcgcgcag ggaggcggtg agcgtgtgca gagctgcccg aacggaggac tatgtatgtg 780
tgtgcgcgtg tttgcgtgtg tttgagcgtg tttttccttc ttcccttgag gatgtgaatt 840
gtttagcagc tggctgctcc cttaggatcc ttgactttgg ggagctctgg ctgtgaacac 900
a 901
<210> 372
<211> 241
<212> DNA
<213> Homo sapiens
<400> 372
ggtgtctggc cggcgcgggg ctcgcccagc ctggtccggg gagaggactg gctgggcagg 60
ggcgccgccc cgcctcggga gaggcgggcc gggcggggct gggagtattt gaggctcgga 120
gccaccgccc cgccggcgcc cgcagcacct cctcgccagc agccgtccgg agccagccaa 180
cgagcggtga gctgcgcggg gcgcggggga cgcggctccg gccgggcagg ggagagggcg 240
c 241
<210> 373
<211> 421
<212> DNA
<213> Homo sapiens
<400> 373
agtcagggag gaacctcatt tacataacgg ccgcccctct gtctcctggc gggggccgga 60
gtcccgcccc tcgtccaact tgaaatctgt tgggtcacgg gccagtcact ccgacctagg 120
caagcctgtg gtggagctgg aagagtttgt gagggcggtc ccgggagcgg attgggtctg 180
ggagttccca gaggcggcta taagaaccgg gaactgggcg cggggagctg agttgctggt 240
agtgcccgtg gtgcttggtt cgaggtggcc gttagttgac tccgcggagt tcatctccct 300
ggttttcccg tcctaacgtc gctcgccttt cagtcaggat gtctgcccgt ggcccggcta 360
tcggcatcga cctgggcacc acctattcgt gcgtcggggt cttccaacat ggcaaggtgg 420
a 421
<210> 374
<211> 421
<212> DNA
<213> Homo sapiens
<400> 374
ctttcaagtg tccaggccat aaattcttct caattccctc tctctctcct tgtcggaatt 60
aatgagatca gatctgatca gggcgctgat gtgttcagcg ccaaatcaca caacagcgcg 120
cgcaccgtaa tggaatttgc atctaatgca tacataaatc aaacatcttt ctggacattt 180
tcatatgcat aatgtcattt catccagttc tctctgtgca gagggggaga tttttctctc 240
tgagagaatg actttcttta atgctttcat tttattttcg ctgactgcag tccgggagaa 300
tgcgctcggt cggagaatct ttcggggcgc ggttgacagt tctttttcca agaggggtcc 360
ttcacattta tcatgcctct tcctcggggg ctttgttatg caaatgtggc tgaaattgat 420
a 421
<210> 375
<211> 181
<212> DNA
<213> Homo sapiens
<400> 375
cagggaagac cctcggccgg agagccaagt gctgctggga ggtggccggg cgtggccggg 60
ctgtgctgtg ggaaccgctg ggtgggggcg cgctgggttg cccacgctcc tggcgcgctg 120
ccggcctgga gacgccgccg ccgccctctt gcaccccgag ggcccgcacc tcgaaactcc 180
g 181
<210> 376
<211> 319
<212> DNA
<213> Homo sapiens
<400> 376
cgggtgtggt gggcgtcccg ggtgcgcggt gggcggcggc ccgggggtgt ggtgggcggt 60
gtcccgggtg cacggtgggc gtcccgggtg cgcggtgggc ggtgtcccgg gtgcgcggtg 120
ggcggtgtcc cgggtgcgcg gtgggcggcg tcccgggtgc gcggtgggcg gcgtcccggg 180
tgcgcggtgg gtggcggccc gggtgcgcgg tgggcggtgg cctgggtgcg cggtgggcgg 240
caccatccag gcttgctgcg atgttggcaa gaggacgagg tctcctcacc atgcatgtct 300
cagaacatac ctctgtcgt 319
<210> 377
<211> 841
<212> DNA
<213> Homo sapiens
<400> 377
ctgcccagac cggagctgga gaggggcgag aggctctggc ccatgccggc cacgtccttg 60
tggtaggggg tatagaggtt attcatggag gccagcccgc gctcatcccg catgagcgtg 120
aagctaccgc tcacgttgcc cgccaggcgc tggtggtggt gcgggtggtg gtggtgatgg 180
tggtggtggt gatggtgggg gaacttgtcc gagactgtgg agatgggagg cagcggctgc 240
agaggggtca aggtggtgta ggtggtgggc atgctcatac ctgggggagt ctcgcaggcc 300
atggtcatgg tgggatgcag ggggccggcc aggctgtgct caggggcccg gtggtggtgg 360
tggtaatctc cgccgccgct gccgccgtcc agcagggacg ccatgcccat ggagcgcggg 420
tgcgcggggg gcaggtggct gccgcggtgc gccacggagc tgcgcgcgtg ggggctgccg 480
cccagcaggt cggcaggggc gggcaccggc tcatggctca ccccgtgcag ctcgccgatc 540
gcttccatgg tcagctgcgc gttcatcgtg atccgggcga gcaggcggcg gacacaacat 600
cgatgtggcc aggcagaggc ggcgaggggc gcacggagtc cggtcttcac atcggctgct 660
ggcgactgtt gccttccttc ctctcactgt ggggctctgt ctctctctct ctctctctcc 720
gtgtgtgtgt gtccgtgtgt gcgtgtgcgt gtgtgtgtgt gtgtgtgtct cgccttccct 780
cttacccccc accttcccct ctgcgtcctc ggcttttttt tttttaatat taatttccaa 840
a 841
<210> 378
<211> 181
<212> DNA
<213> Homo sapiens
<400> 378
gccagtggcc tctagcccgc tgccgaggcg ccaccttcag tactgcggcc aggagagtgg 60
cgctcccctc ttataccgta ggctgagtcc cgcccagccg ccagcggccc aacccggagg 120
tgctgcacag cccgccttcc cgccaccctc tcccacgacg ccgggaggtc tgcatgcact 180
g 181
<210> 379
<211> 241
<212> DNA
<213> Homo sapiens
<400> 379
caaggtcaga ccctttggct gcaacacgtc cgtcaagaag ccaggcaaat ctagcatgca 60
aactaggatc attttcgggc gttggggccc ccccgcttga aatctggttt ccatgttcac 120
aaaacgcagc ccgactggtg gaactcgcga ctccagacgc agagaagctg tgggcagagg 180
cggaggcaga gggtgggaat gcagcctggc gttggagtgg ggagaaaggg gagggaggaa 240
c 241
<210> 380
<211> 181
<212> DNA
<213> Homo sapiens
<400> 380
gcaggcccgc actgggcttc atccccactc gggacaggca gtggctccat tgacccggat 60
gagctgcgca ctgtgctgca gtcgtgtctg cgcgagagcg ccatctcgct gcctgacgag 120
aagctggacc agctgacgct ggcgctcttc gaatcggccg acgcggacgg caacggggcc 180
a 181
<210> 381
<211> 301
<212> DNA
<213> Homo sapiens
<400> 381
gcggcttgag gtcctgctcg tccaagcccc gcgggatctg ccccacgaag agcttgatgg 60
cgtcgtggtc cttcatgggt acggcgggac cggggtttag cccgctcatg ccgacgccgc 120
tgtccgcggt gctgaaaccc aggcgcgggc cggggccagc gggctgcgct gaccctcccg 180
gcgccgcggc catgtccccg ccctgtcagc cctcccgccg gtcccactgg tcccgcctgt 240
cccgccgtcc cctccctgga ccggtggcga gggccagggg gagggggcgg agcccgggcg 300
g 301
<210> 382
<211> 301
<212> DNA
<213> Homo sapiens
<400> 382
agcggctggg ccgcgccgga cgggcgtcgg gggtctgggc cgcgaacccg ccgcggggcc 60
gccggaacct ccgcgaaggt tctaggcctt tgtggcgtca ccgtctcctt gcggaagctt 120
ccgccggcgc cgaataaaac ccgccgcgga ggagccggtg gctctagtgc ggtggagcca 180
ggcgtggaag tcggtccggc gcggggcggg gggcgggcgg gagctacaag cggcggcggc 240
ggcggcgacc gtgaccgtga cgcgcgagcg ggcggcgggg gcgcgggcca ggggcgcggg 300
c 301
<210> 383
<211> 181
<212> DNA
<213> Homo sapiens
<400> 383
caagcccggg tcccgccgat gggcacgccc tcctccctca ggctcacctg cccagcccca 60
tccctcccag tccgccacgc ccccggggcc cgccctgcgc tcacttctcc acgcccacga 120
cgatgtagcg gtcttgtaag aagtggaacc agccctgcat gagcagcgcc cactggatgc 180
c 181
<210> 384
<211> 241
<212> DNA
<213> Homo sapiens
<400> 384
tatgcaggtg gtgccgatta actttgaaaa aatcacgact gagccttcac gagtgaggcg 60
gggaaggagg aggcagcgga ggttgtatgg ccccatcacc ggggcaattc agaaaggctg 120
tttctataaa caaatcctta aacgtctggt aagaaatgag tccgcgacgg aacgagagca 180
gatcgtggtt cgcgtgttta ctgccgagtg ggacgcggac tggggccgga ccttccacag 240
a 241
<210> 385
<211> 301
<212> DNA
<213> Homo sapiens
<400> 385
ctgatctccc cccgcacccc actgtctgaa tacagaggcc ccctcctctc tactggggag 60
cccagacatc tagcccttgc cctgtgtggt tctctccggg tgaggtggga gggacctgcc 120
gggagagaca acatccctgc tgcttcactc acggtgtgaa gccggaaggg accagactca 180
gaccccctcc cgggccagcc tctccgtgaa gcccctttct ccagcaggag agtgtagctg 240
cccctctggg tgctcagggg ccttctcagc ctcacctgac cctcaccttg ggggtggggg 300
g 301
<210> 386
<211> 361
<212> DNA
<213> Homo sapiens
<400> 386
ggacctccaa ggaggccaga gctgtttctc ccgtttggag agggagatcc tagcctttct 60
caatactttt tgatttctgg gaaaggagaa gttggaaggc cgcctcgcct cctgtctcgg 120
tggcgttcaa ggttatccag acagcggtct gcgggtttca tttgcaagtc actgcgcggc 180
gcatgcagaa gcagccgcgg gccggcgggg cgcgcagata aggtctgggg gcgtgggttt 240
cgggctgtac ctgcattatc gcggcttcct taagctcgga tgaatatgta aatctctcgc 300
tgcagccttc cggtgccgca gtcgcagccg tgggggccgc ctccgctgta gcaattccga 360
g 361
<210> 387
<211> 181
<212> DNA
<213> Homo sapiens
<400> 387
aggcttgagc gcccagcgac agacaagtgt cctaagaatt ggtgcctctt ctagggaaaa 60
ggaggcctgg gctccaaggc cttaaagact cgcctaattt tccgcacgga tgagtagacc 120
caggcccagt tcggatccgt ctttatctta tcgtctgtgt cagagaaata tgtcatattt 180
c 181
<210> 388
<211> 361
<212> DNA
<213> Homo sapiens
<400> 388
tcactgttgt tacctgcatt tttccctggg ccagctctgc caccgagtgg aagtgggcca 60
acaagtctgt gcccatcggg cctcagtttc tctttctgta caacagaagg gttgacgaaa 120
gcaaccttgc gcttgttaag aggtgggggg cgcggggagc actcggcccg gcgggcggag 180
acttttctct gcattgcgat ggtggttggc aggccctggg gaattacggt acttcgcctt 240
cggggacgcc cagctgtttt ggggctttct ctctattggg ggtaggatgt ttgtggtctt 300
gactggaaag ccgggacagg cgtctggagg actccccact acatcctgta ccctggaagg 360
c 361
<210> 389
<211> 241
<212> DNA
<213> Homo sapiens
<400> 389
agtgagccac cggcggggct gggattcgaa cccagtggaa tcagaaccgt gcaggtccca 60
taacccacct agaccctagc aactccaggc tagagggtca ccgcgtctat gcgaggccgg 120
gtgggcgggc cgtcagctcc gccctgggga ggggtccgcg ctgctgattg gctgtggccg 180
gcaggtgaac cctcagccaa tcagcggtac ggggggcggt gcctccgggg ctcacctggc 240
t 241
<210> 390
<211> 301
<212> DNA
<213> Homo sapiens
<400> 390
taccaggagt ttaacaaata tttatcgaat gaatgaattc attcatttac ttattcaatc 60
aagaagattg aaatcttaca gtcagaagct gcagccacag aggcagccca aagctcgttt 120
attaaatgcc ggctgtggtg gccgtgtcct gccagcatag tctggtgtgg cctctatggc 180
gccctcggga gggtggtgac aatatagcac aaggtgctca agctcctggg atggcttcac 240
ctggaggctg gggaggcagg gtgggaaagg tgagcaccgt cattacatga gggtgactcc 300
t 301
<210> 391
<211> 334
<212> DNA
<213> Homo sapiens
<400> 391
gccccaagtc cttcctgaac ctctctgggt cgcactctcc ccagcccctc cccccacgcc 60
ccatcgcatg gccccgacac tggcagaagg cggccgccca gcctgagcac cttgtgcagg 120
tctgcggcca gcgcgcccac cagctcctgc tcctgctcct ggatcaggcg ctgcagcgcc 180
tccagctgct ggatccggaa ctgcagcgga cgggtcctgc ccgagctgaa ggcggcgcgg 240
gcgcgcttca cggcctcgct gatcttgctc atggcgcctg gggacagaga gcacctgcag 300
ctggctgagg ggcacgagcg cgccctgcct ccca 334
<210> 392
<211> 181
<212> DNA
<213> Homo sapiens
<400> 392
ggccaagaag tctttttctg ggaggctgga gctgcagcgc cacctgcagg ccaaggagtc 60
tttttctggg aggctggagc tgcagcgcga cgtgcaggcc aaggagtctt tttctgggag 120
gctggagctg cagttgcagt gaagtcacag gttccgtgac gtcacaggtg ggcaggcgca 180
c 181
<210> 393
<211> 181
<212> DNA
<213> Homo sapiens
<400> 393
agtaaggaat catgtcgggg ccaccgaggc tgcaggtgca agcgaggggc gccttcctct 60
tgcgggccaa cgtgctcagg gtcatggggc cggctcaaag tgcacaactc cgcatcctgg 120
cctctgctct gctccggcac gaggcgcagg ctgcgcgtgc acccggcggc ggaggcgggc 180
c 181
<210> 394
<211> 181
<212> DNA
<213> Homo sapiens
<400> 394
aagatgacgt aaatgatgac ttgtgagcag tggcctgcct ctgttgccat gacaaccgga 60
gcttgactac ttggcctttg caaggttggc cgaggcgggt tcttcgttaa ctcgagatta 120
aggaaggata tttagggggg agggtgtgtg tgtgtgcggc ggattaaaga cgaaaggagt 180
a 181
<210> 395
<211> 181
<212> DNA
<213> Homo sapiens
<400> 395
ccaaaagcta catttttatc caagtgtgaa gaatggggag agctgcaaag aaagcaacaa 60
gtggccccgg gcggagccgg ggggtggggg cgccagcctc ctcccgccgg ctgcgctgct 120
gcgcctggcc cccgcccccg caggcatgcg gggtgattca cctcgcccag actgcgccca 180
g 181
<210> 396
<211> 241
<212> DNA
<213> Homo sapiens
<400> 396
cataaccacc taaagaatgg tgaaataaat gttcttggaa attcctaccc ggactggcta 60
gtccttgcgg aagcagcgtc cgggccctcg ggtaacgttt gaagagctgg cagcgtctca 120
ggctgctgcg tggcgaaggg gcggaccggg ggacgggggg gtgggccctt aggggctggg 180
gcgggacttc cctgggcact gagtcaaagc ttgaggggag tgttcgctcc cgcattttcg 240
a 241
<210> 397
<211> 181
<212> DNA
<213> Homo sapiens
<400> 397
gcaaacggcc tcggccgaga gcattcgctt tccagatgag aatggcatct tcagggaccc 60
gctggtagtg gggccaggtc tccacagggc cggtccagtc cttcctaccc acccgggccc 120
tgcggccagg cggggccggg aggggcggat gccggagggc gctgggggag gccgacccgc 180
g 181
<210> 398
<211> 351
<212> DNA
<213> Homo sapiens
<400> 398
caggcggagg gtcctcagag tcgggggtgg ggggcctgtg gggcggcccc ggcccacacc 60
ggggagtgcg gcgaccagac ggccagctgc cgaatctgag gcctcggtgg gtccgtcgcc 120
cgcctctctt ggacaagtcc aggcgatgtg agcacgccca gcctcctaca tttcactccc 180
gtctctccca aacagaccta gcgcaaaacg agcactgaca cagcgggggc ccacatcccg 240
gaggttcttt agggagaggt cggggagtgc ggttacctat ggctccgaag tccccgctgg 300
catcctgaaa ggcatcgtat ttctcgctta aggcgttacc cttgtggtag t 351
<210> 399
<211> 301
<212> DNA
<213> Homo sapiens
<400> 399
ggagactctg tctgaaagaa aaaaaaaaga aatataagta cggtaaaggg aaaaacaaca 60
acttgctcga gataagccct gtttacttgg gggcctcgct tttccatgtg tgtttgccca 120
gctcatcctg aggctgccca cacggctgtg ggtcctgctt tatcacccag cagcagatgc 180
ctctgcggct ttgtggccaa accctggccc tgcacagcct ccttgtggcc tgagcttatt 240
gcaggctgca cggtgcacat tacaaatggt cagttggagg ccaggcgcgg tggctcacgc 300
c 301
<210> 400
<211> 361
<212> DNA
<213> Homo sapiens
<400> 400
tcagctcagg gaggaagccc tgcctgaaaa ggctgcagct taggctgtta ctctttcatc 60
actcagccca gcatctgatc acatcctctg tcactcaggg actgagtggg cggggcctta 120
agcattatcc aatcagagac gctgggctgg aaaccgtcca atcaggcagg cagctggagc 180
aaagaggacg gcttccgggt ttggcgcggc ctttgtctct cgctgcatct ggagctctag 240
gtcgcctctt cgctactctg tgtcctctgc tcctagaggc ccaccctctg tggccctgtg 300
tcctgtaggt attgggagat ccacagccaa gatgccggga ccccttagaa gcctagaaat 360
g 361
<210> 401
<211> 181
<212> DNA
<213> Homo sapiens
<400> 401
agcagagaac acagagcagt gaacaagaga tctggagctc cagcggcagc aagagacaaa 60
ggccgcgcca taccagaaag ccgtcctctt cgctccagct gcctgcctga ttggagggtt 120
tccagaccag cctccctgat tggattatgc ttaaggctct gccccctcag tacctgagtg 180
a 181
<210> 402
<211> 421
<212> DNA
<213> Homo sapiens
<400> 402
tttggaccgt gattgtaaag aagctgttct aaacccgtcg gggggcggtg tttgcaggga 60
gggaagtagc gtgaggcagg ttggggaagg cgtgagaggc ctaggagagc cgaggggcgg 120
tggaggggtg tggcctagaa tgttaggcgg agcgggaggt gggccgggcc ttcggacgcc 180
ctgtcccgca gacgttgacg agtgcagcga ggaggacctt tgccagagcg gcatctgtac 240
caacaccgac ggctccttcg agtgcatctg tcctccggga caccgcgctg gcccggacct 300
cgcctcctgc ctcggtgaga ggccccgccc cggcctgatc cctcctccct tcgactcccc 360
gactcgccga ttggcctccc acctctgtct ttcctcctcc gcttctcccc tccccttacc 420
t 421
<210> 403
<211> 541
<212> DNA
<213> Homo sapiens
<400> 403
ctgttggctg caggatgaac ctccattcta accttacgct ttagcgccgc cccgccctct 60
ctcggccgtt tgcacctcat tagctggagt ctctattagg ccccgccccc atttgcccgc 120
ctctaccatt tacccgccca gcctggagcg tccgggccgg caagtccagc gccggggcct 180
cactgtttcc gcgtgtgaag cgttcgaaga ctgccatgga cccgcggcca gagaccgcat 240
ccgcctgtag cactaacgcg tcccgcagcg ctgcgtagcc gcacagcccc accgcagggc 300
gcgggcccag ccgcactgtg aacacccggc cccagcggcc ggagagctac gggtagccgg 360
tgctcagcgg gtgcccatag ggttcctcat cggagccatt gcccccagct ccctcttcct 420
tcagacccag gagtcctcgt ctcagaccct cattcctcag gcccaggaat tcaaatcccc 480
agctccttcc tccctgagat ccaggagtcc aggcccccac ttccttcttc ccttaggacc 540
t 541
<210> 404
<211> 361
<212> DNA
<213> Homo sapiens
<400> 404
gttcccccat ctctccgatt ttctcctcct ctgtccctct gtcccctctg tccctctgtc 60
cctccgctgc agctgtgggt gggcatgcct gcctggtatg tggccgcctg ccgggccaat 120
gtcaagagcg gtgccatcat ggccaacctg tcagacacgg agatccagcg cgagatcggc 180
atcagcaacc cgctgcaccg actcaagcta cgcctcgcca tccaggagat ggtctcgctc 240
acctcgccct cagcccccgc ctcctcccgc actgtgagtg tccggcggcc aattccagcc 300
ttcgcttcct cagagccccg cctcttgccc tcagtctagc caatcctggg cctgctcact 360
c 361
<210> 405
<211> 356
<212> DNA
<213> Homo sapiens
<400> 405
cctctctgag cctcagtttc ttcagtggac tcaagaatga tactcagtgt aaggattctc 60
aaaacgagca tcagcaggtt ccgcccacgc cggcctcctg ggttcagttc tctaataacc 120
acctcccttc cccgcctact ccagccaatc cttgtgctga ctcggctcct ggccacgccc 180
taaccccacc cccgctgcct ctaaacccgt ccccacccct gcagcctcac aggctgccgt 240
cagattctca agcccctatt cctctcggtg gcctaaatcc ccaactgctc ggggccactt 300
ttcaggccaa aatgggccca aaatggggag ggcaagtgat gaatgtcact agacag 356
<210> 406
<211> 181
<212> DNA
<213> Homo sapiens
<400> 406
gaatagactt acgtggacca cttatgatag aaaccaaaat gatttcctct taccaagttg 60
aaaacggttt atgttaaaat tgtttgccgg cgggttggac ccagtcctgc tagggagtct 120
gctgcagctc aggaacgggg atctgggaat cggggatctc ggtctgggaa ctgggatctt 180
a 181
<210> 407
<211> 181
<212> DNA
<213> Homo sapiens
<400> 407
gccatggggg agcgcgcgcg gggctgttcg ctgggcgtgg cgggcgggtg tggccagggg 60
tgtgggtctg tgagggaccg gtcggaaggg cgtcgcgcgg cctcgggtga catgcggggg 120
gcggcgagcg cgagtgtccg cgagccgacg ccgctcccgg gtagaggcgc cccccgcaca 180
a 181
<210> 408
<211> 181
<212> DNA
<213> Homo sapiens
<400> 408
tgctcccaac aggcacctgt ggaccccaga ttccatcctt ctggctcagt tcacttccag 60
gcctttgccc gcgccagtcc ctgtacctgc cggtctcccc accgcatccc acgggtgtca 120
gaaatggggc ccctcccgca agcgcctcag tgtcccaacg ccggcgtccg ggctgcagag 180
c 181
<210> 409
<211> 721
<212> DNA
<213> Homo sapiens
<400> 409
cggctgcatc agctttctag acaacgggag aaaagagaaa tggtggagga ggggaaatcc 60
tatgccctcc tcctcgcgga aatcaaggcc gacctccctg acgccccccc ggaaggaagc 120
gcgtggtcgg ctgccagccg agacccccat ctgcgcctcc agctgcaggg cctttgctgg 180
gcggttcctc gcccgcaatt cccccacgag ccctggggag acccagcgct aaccaggggt 240
gcccaaggga ggagccggga gaggccctcc tggaggtggg cacagcccag gcaaacatca 300
gcagacggaa ccagcacccg ggacccaggg aaacgtcacc tgccaccagg agctccacag 360
ggtcgctgag ctccgattcg aaggtgtggg gcacccagga gcggtagcgg cacctgtagt 420
tgccggcgtg ctggggcccc acgaagatca gctcgaggtt cgccgcggcc ccgggggtgc 480
ggaccgtctt cacggccttc gtctcgccct cgcgcagcag ctcgaaggtg acgtcgggga 540
tgggtccctc gcagcgcagg acggcatctc ggcccgccag gaccgcccca ctccacgtcg 600
cccggagctg aggcctggga gggggtcctg ggcggagcgg gcgggtggtc gggccaggcc 660
acgccccagg ccacgcccca ggccacaccc caggccacac cccaggccgc gcccgcgcct 720
g 721
<210> 410
<211> 601
<212> DNA
<213> Homo sapiens
<400> 410
caccaggagg ggccgggggc ttagcgccag ggcccggggg atcgccgtgg atgcgctggt 60
gctgcagcag attggagcgc tgccggaagc tctggccgca ctcagcgcaa cggaaaggct 120
gttcgcccgt gtgcactctc cgatgctctt ccaggcgcgc gctgcgcacg aagccctggc 180
cacagtcgcc gcacacgaac ggccgctcct cggtgtgcgt aagctggtgg cgcagcaggt 240
gcgagctgcg gctgaagctg cggccgcact cgctgcacac gaatggtcgc tcacccgtgt 300
ggatcttctg gtgcctcagc aggttgctgc gttggctgaa caccttgcca catacatcgc 360
aacggccgcc cctaaccacc ccgcccccag tgctggggcg gccccggctc cggcccctgg 420
gggagcgcca gcgggtggtg atcagagcag ggcccacacc ccggcaggga tcctcgtccg 480
tggggtcctg ttcactcctc agatcgctgg ggagcagaag cgcatgcgca aagccacctt 540
cgcgggaggg tgattggatc tggccagaaa ggccagccat gccgaggtcc caggggacgt 600
g 601
<210> 411
<211> 421
<212> DNA
<213> Homo sapiens
<400> 411
gcaggggagg cactgcgggg acgggcgggg tgagcgggag gaggggagcc gggagtcgag 60
gggttggagg ggaacgcagc gaggcgggga tgctggggtc cagggctcgg agtgcgggcg 120
ggacaccggg gctgcggctg caggcacgct cgggcgccac tgggcctcga ccgcggtcac 180
gggcggggcg tccagatctg ctcggcacct tggtttcttg gatgacctct cggtgacagc 240
cctcagcgtc ctcaccctca gctagggacg ggtctcccgt ggactacagc gtggggaacc 300
cttcctcgag cctcggggtc atcgctggtg ggcgccactg ttgcagctgc cccaccctcc 360
accactccag acccttcctc cttcctcctc gccctgctgc ggcttgagcc cgggcccacc 420
c 421
<210> 412
<211> 301
<212> DNA
<213> Homo sapiens
<400> 412
actccccgag acagggaccc ggagacgtgg gctttgtcag tttaacagat tctgcctccg 60
ggaaccaact gccgggagat tctgattggc tcagccgcgt gcccacgtga ccgaccaaaa 120
ccggccacca gggtctccca actgcctgtc aaacgcacag ccctgttggg cccccggaga 180
ggaagagccg agaaggaggc caggccgggg gtcaggtggc ttcctctatg ggccctttaa 240
tccacctcac ttttttatct tctttttttt cccagcagct ttattaagtt ataattcaca 300
c 301
<210> 413
<211> 301
<212> DNA
<213> Homo sapiens
<400> 413
ccaggagccc tgagccttgg ccctcaggcc ccaggaggga ggtcaggagg gaggcgtgga 60
caagggtccg gccgtagctg gtcccgtcct ggaagctgct taagttcctg gttcccaccg 120
gggccaagag tgatacctga tcctggggga ttgtgaaatg acctcatgtg gcagcccgcc 180
cgcggtgccc gcaaagccct ccaccctccc cttccccgct cggctccacc cctaccccac 240
gccccctccc gcgcgcgcgg ttaaatcccc gcacctgagc atcggctcac acctgcaccc 300
c 301
<210> 414
<211> 421
<212> DNA
<213> Homo sapiens
<400> 414
gcccctcgac ccaggggacg ggatcctgta agtctcacct gcctatctcc atcccaggcc 60
tcgggcacga gggtggttgt actatcctgg ttatggtagc tccactcgag caagctttat 120
tttaacatat aagctattcg tttagtggag gcttcattaa actactcccc tccaccacca 180
cctcgggaag ttgtggtcaa aacccaccag accgactgtg gtggaagttg atgcggaagc 240
tggagagccc gcggctctgg aggggtgagc cgccccggag aggggaccca tcctcctttc 300
cgcgcccgga aagagcgggg gagaagagga agtccagtta caactccttt cctcagcccc 360
ttaaaggaaa ggtatcagct aaccacgggg agctggcagc ctaagagaaa gtaggaacct 420
a 421
<210> 415
<211> 601
<212> DNA
<213> Homo sapiens
<400> 415
catcgggcct tgcagcagcg ccgcagatat tctgcctccc attttgcccg cggggacgcc 60
gaggcccggc gccgcatcct gccgcccgtt ttgcccgcgg ggaagccgag gcccgatgcc 120
gtaccctgcc gcccgttttg cccgcgggga agccgaggcc cggcgccgca tcctgccgcc 180
cgttttgccc gcggggaagc cgaggcccgg cgccgtatcc tgccgcccgt tttacccgcg 240
aggaagccga ggcccggcgc cgtatcgtgc cgcccgtttt gcccgcgggg aagccgaggc 300
ccggcgccgt atcctgtggc cgttttaccc gcgggaaagt cgaggcccgg cgccgtatcc 360
tgccgcccgt tttacccgcg aggaagccga ggcccggcgc cgtatcctgc cgcccgtttt 420
acccgcggag acgccgaggc ccgatgccgt atcctgccgc ccgttttacc cgcgggaaag 480
ccgaggcccg gtgctgtatt ctgccgccca ttttacccgc ggggaagctg aggcccagtg 540
ctgtttaata tcttactcat gttcacttga tgagaaagtg acagatctga gacaaaccca 600
g 601
<210> 416
<211> 361
<212> DNA
<213> Homo sapiens
<400> 416
acgcgtcgcc gaaaagccag gcccggaggt gcctaagtca gggaccgaga cgcaaacata 60
gacacaagga tgcacaagca cgccctcccc gaagttgaca aaaatcagcc gataaaatac 120
aaagtgccgc ggccgccgca ggtcagcgct gacctcctgc tgccgagagg accgaatgcc 180
gacgtccgga cgctgtcatt tccatccagc gaaggcacct gggctgcacg gtctcgtctc 240
cctccttcgc gcgagggatg cctcctcctg cctctcctcc ccgcatctcc ccacctccca 300
agtgtgtgaa cacgaaaaca atacgtggaa agcccgatcg gggggagcta ggacccgccg 360
g 361
<210> 417
<211> 181
<212> DNA
<213> Homo sapiens
<400> 417
aggatccccc tcccccaacc tgcttcaagg gtagccctgt tcctgtctgc cctccccgcc 60
cccacagaaa tagagatgag aaggggcagg cgaagaacta ggagtgtctg cgagaccatc 120
ccaggaccct gagcccccca actctctgca tcccagggct gacttcgaca tgaagcgcct 180
c 181
<210> 418
<211> 181
<212> DNA
<213> Homo sapiens
<400> 418
gcccccaccc cagccttgga tagggtagta tacgataggg ggcgtaaaga agggtcatgg 60
gctccggtgg tcgcaggtcc caccggcaac cgccagggcg ggggcagcag gagcaggaac 120
ctgctcgcct ccgcatctcg tcggctcccc tctcccgcca gactcctgtc tctgcgccag 180
g 181
<210> 419
<211> 181
<212> DNA
<213> Homo sapiens
<400> 419
cctccccttc aaaagccacc ttggcaaggc attagctaaa catcttctcg gtcccagaag 60
gcttcccctg tgaagtctgc agcgttcaaa cgacaaccag caaatcccca gagacaggtc 120
cctgggaatt agctgcgccg ggcgggatga aagccgctct gatgttctgg agcgagagag 180
t 181
<210> 420
<211> 241
<212> DNA
<213> Homo sapiens
<400> 420
ccgtctcaaa ataaataaat aaatacatac atacataaag taaaataatg aataaataaa 60
ataagaaatg gggaaatgga tcagcaagaa agtgcccgcc ccaggcatgg gtgccgtgcg 120
ggacggggac gcggcccagc cgggaatcgg ggtgcccagg gtgcgatgtg cgaggggctc 180
ctgagcgcgt gtgctccgcc cgaccccgcc ctgtcccccc gacacacagg tggacccagg 240
g 241
<210> 421
<211> 181
<212> DNA
<213> Homo sapiens
<400> 421
agcgcgcccc tatcctgcac gcatccgcgg ccccgggccc tttccgcagc cccacgcggt 60
ctcctcccgg gttaaatcta tccactcgcg cgttccttgg cagccgtgat cacaggcgtg 120
accacggtcc ccaagccctc gcgcctccgt ccacgctatt gcggccgccc ctgcgcgcct 180
g 181
<210> 422
<211> 808
<212> DNA
<213> Homo sapiens
<400> 422
tgatccatct gggccctcca ggtgcaacac ctgacaacat ccatcggcaa cttcgtccat 60
gaacacatca cgccggggac tcaagcacgt taaactgctc caattggtag ctaaacgaga 120
gattgcaaaa catgcctcta ctcaacggct taatgtctga gcacttacct cccccgctgc 180
tctgccgttg ggagcactgg tctctgggtg agggacttcc agcaagaagt attcacaaat 240
gaaacaaaag ctcagcaaac ttgagctgaa ggcaggggaa ggagagctgc ttcctgaata 300
tcaatgaggg gaggaatcgg gtggatcgta gaaatgtttc gtgttggttg tgtaaaccac 360
tgcctcggag ctgtcagaac ccaactagga aaggaagggg ccctgcctgt gccactcgcc 420
acagagctcg ggtctctcag aagaaagaag cgtccctaag aatagaatcc caccaagtac 480
acattctgag caggctctgt ttctgaaacg taactgttta ctcgaaggtc ttctacatct 540
ttccaagtag cctttttcca tcccccacag ccacacggtg ggaacctcct tcacacggtc 600
acataagcat tcacgcactc ggcttagctg tgtggccttg ggcggctccg gattcggccc 660
tgtggtttgc gtgggcagcc cggatggctg gtgggcccgg tcctgctgcc ccctttatct 720
ctgctcacca agcagagaaa aaccacagta atgtgtgtcg cccagagaca ctggcaccct 780
gacaactaca gcaacgggtt ctttgtgc 808
<210> 423
<211> 421
<212> DNA
<213> Homo sapiens
<400> 423
agtcaggagc gggcgagctg tatttttatg ctaaaattta cacaaaggga cggccccagg 60
ctctccctcc tttacaagct gtggtcagtc acgccgtctg gccgaggaat ccggctttca 120
cagggggaag caaataatag gacggggaaa ccgcagggtc cttgggcact cagagctgtc 180
actcatcaca aatccataaa acaattcgtg tggaagtaat gatattgttt aaccactgta 240
tttttgatta atgtataaat aatttaactg agtatttctt gagttttcag cgtgtctgcc 300
attatttacc ggccctgtca tgacggctgc tggtgctctg ccatataaaa catcctcaag 360
tccgtccgag gaggctggtg ggttgttaat ggtcttaggg ggaaacggca ttgcagctat 420
t 421
<210> 424
<211> 241
<212> DNA
<213> Homo sapiens
<400> 424
aatgaaaaaa atgcataaca acaaagaata tgaatatgga tcacatctct accagagtta 60
atcaactgat gcaaactctt gcacaaatgc tgaaagctgt accatacctg tctggtcttg 120
gctgaggttt caatgaatgg aatcccgtaa ctcttggcca gttcgtgggc ttgttttgta 180
tcaactgtcc ttgttggcaa atcacacttg tttcccacta gcaccatagg tacatcatcc 240
g 241
<210> 425
<211> 241
<212> DNA
<213> Homo sapiens
<400> 425
tgctcctagt acctgtagag gttaatatcc gcaaatgact tgctattatt gatggcaaat 60
acacagagga agccttcgcc tgtcctcatg tattggtctc tcatggcact gtactcttct 120
tgtccagctg tatccagtat gtccaacaaa caggtttcac catctataac cacttgtttt 180
ctgtaagaat cctgggggtg tggagggtaa gggggcaggg agggagggaa gttcaatttt 240
t 241
<210> 426
<211> 241
<212> DNA
<213> Homo sapiens
<400> 426
caagtgagag acaggatcag gtcagcgggc taccactggg cctcacctct atggtgggat 60
catattcatc tacaaagtgg ttctggatta gctggattgt cagtgcgctt ttcccaacac 120
cacctgctcc aaccaccacc agtttgtact cagtcatttc acaccagcaa gaacctgttg 180
gaaaccagta atcagggtta attggcgagc cacatctaca gtactttaaa gctttctata 240
a 241
<210> 427
<211> 241
<212> DNA
<213> Homo sapiens
<400> 427
caagtgagag acaggatcag gtcagcgggc taccactggg cctcacctct atggtgggat 60
catattcatc tacaaagtgg ttctggatta gctggattgt cagtgcgctt ttcccaacac 120
cacctgctcc aaccaccacc agtttgtact cagtcatttc acaccagcaa gaacctgttg 180
gaaaccagta atcagggtta attggcgagc cacatctaca gtactttaaa gctttctata 240
a 241
<210> 428
<211> 241
<212> DNA
<213> Homo sapiens
<400> 428
ttgcagcaat tcactgtaaa gctggaaagg gacgaactgg tgtaatgata tgtgcatatt 60
tattacatcg gggcaaattt ttaaaggcac aagaggccct agatttctat ggggaagtaa 120
ggaccagaga caaaaaggta agttattttt tgatgttttt cctttcctct tcctggatct 180
gagaatttat tggaaaacag attttgggtt tctttttttc cttcagtttt attgaggtgt 240
a 241
<210> 429
<211> 301
<212> DNA
<213> Homo sapiens
<400> 429
tatagcataa ttgagagaaa aactgatata ttaaatgaca taacagttat gattttgcag 60
aaaacagatc tgtatttatt tcagtgttac ttacctgtct tgtctttgct gatgtttcaa 120
taaaaggaat tccataactt cttgctaagt cctgagcctg ttttgtgtct actgttctag 180
aaggcaaatc acatttattt cctactagga ccataggtac atcttcagag tccttaactc 240
ttttaatttg ttctctggga aagaaaaaaa agttatagca cagtcattag taacacaaat 300
a 301
<210> 430
<211> 301
<212> DNA
<213> Homo sapiens
<400> 430
tatagcataa ttgagagaaa aactgatata ttaaatgaca taacagttat gattttgcag 60
aaaacagatc tgtatttatt tcagtgttac ttacctgtct tgtctttgct gatgtttcaa 120
taaaaggaat tccataactt cttgctaagt cctgagcctg ttttgtgtct actgttctag 180
aaggcaaatc acatttattt cctactagga ccataggtac atcttcagag tccttaactc 240
ttttaatttg ttctctggga aagaaaaaaa agttatagca cagtcattag taacacaaat 300
a 301
<210> 431
<211> 241
<212> DNA
<213> Homo sapiens
<400> 431
atttaaaccc acctataatg gtgaatatct tcaaatgatt tagtattatt tatggcaaat 60
acacaaagaa agccctcccc agtcctcatg tactggtccc tcattgcact gtactcctct 120
tgacctgctg tgtcgagaat atccaagaga caggtttctc catcaattac tacttgcttc 180
ctgtaggaat cctgagaagg gagaaacaca gtctggatta ttacagtgca ccttttactt 240
c 241
<210> 432
<211> 241
<212> DNA
<213> Homo sapiens
<400> 432
aagaatggtc ctgcaccagt aatatgcata ttaaaacaag atttacctct attgttggat 60
catattcgtc cacaaaatga ttctgaatta gctgtatcgt caaggcactc ttgcctacgc 120
caccagctcc aactaccaca agtttatatt cagtcatttt cagcaggcct tataataaaa 180
ataatgaaaa tgtgactata ttagaacatg tcacacataa ggttaataca ctatcaaata 240
c 241
<210> 433
<211> 241
<212> DNA
<213> Homo sapiens
<400> 433
aagaatggtc ctgcaccagt aatatgcata ttaaaacaag atttacctct attgttggat 60
catattcgtc cacaaaatga ttctgaatta gctgtatcgt caaggcactc ttgcctacgc 120
caccagctcc aactaccaca agtttatatt cagtcatttt cagcaggcct tataataaaa 180
ataatgaaaa tgtgactata ttagaacatg tcacacataa ggttaataca ctatcaaata 240
c 241
<210> 434
<211> 241
<212> DNA
<213> Homo sapiens
<400> 434
tataagatat tattttattt tacagagtaa cagactagct agagacaatg aattaaggga 60
aaatgacaaa gaacagctca aagcaatttc tacacgagat cctctctctg aaatcactga 120
gcaggagaaa gattttctat ggagtcacag gtaagtgcta aaatggagat tctctgtttc 180
tttttcttta ttacagaaaa aataactgaa tttggctgat ctcagcatgt ttttaccata 240
c 241
<210> 435
<211> 241
<212> DNA
<213> Homo sapiens
<400> 435
tataagatat tattttattt tacagagtaa cagactagct agagacaatg aattaaggga 60
aaatgacaaa gaacagctca aagcaatttc tacacgagat cctctctctg aaatcactga 120
gcaggagaaa gattttctat ggagtcacag gtaagtgcta aaatggagat tctctgtttc 180
tttttcttta ttacagaaaa aataactgaa tttggctgat ctcagcatgt ttttaccata 240
c 241
<210> 436
<211> 241
<212> DNA
<213> Homo sapiens
<400> 436
gctctggaat gccagaacta caatcttttg atgacattgc atacattcga aagaccctag 60
ccttagataa aactgagcaa gaggctttgg agtatttcat gaaacaaatg aatgatgcac 120
atcatggtgg ctggacaaca aaaatggatt ggatcttcca cacaattaaa cagcatgcat 180
tgaactgaaa agataactga gaaaatgaaa gctcactctg gattccacac tgcactgtta 240
a 241
<210> 437
<211> 241
<212> DNA
<213> Homo sapiens
<400> 437
ccctcaagga gataagtgat ggagatgtga taatttcagg aaacaaaaat ttgtgctatg 60
caaatacaat aaactggaaa aaactgtttg ggacctccgg tcagaaaacc aaaattataa 120
gcaacagagg tgaaaacagc tgcagtaagt caccgctttc tgtttagttt atggagttgg 180
ttctaatggg tcctttattt gtatttagaa tattgaaggg ctattcccat ttaaattact 240
t 241
<210> 438
<211> 241
<212> DNA
<213> Homo sapiens
<400> 438
actcagcagc atctcagggc caaaaattta atcagtggaa aaatagcctc aattcttacc 60
atccacaaaa tggatccaga caactgttca aactgatggg acccactcca tcgagatttc 120
actgtagcta gaccaaaatc acctattttt actgtgaggt cttcatgaag aaatatatct 180
gaggtgtagt aagtaaagga aaacagtaga tctcattttc ctatcagagc aagcattatg 240
a 241
<210> 439
<211> 241
<212> DNA
<213> Homo sapiens
<400> 439
ctccggctga agcaccagtg cccatcccac cgagcccaga caccaaggac cggtggcgca 60
gcatgactgt ggtgccgtac ttggaggacc tgcacggcgc ggacgaggac gaggacctct 120
tcgacatcga ggatgacatc atctacactc aggacttcac ggtgcccggt gagtctggcg 180
ggggcccctg cccggctctg ctgactcggc caggatgtcc cacgggagca gggtgcctgc 240
c 241
<210> 440
<211> 241
<212> DNA
<213> Homo sapiens
<400> 440
aatgtgtaaa atcacttctt tttccccccc tttttttttt taactgtgga aaatctaaag 60
tcttcaagaa tccttgatga attcaagttc tgtcttataa atagtactaa ccttgtttca 120
taaattagca tctgaaatta aattaggcat ccaataaata tttgctgaat gaagtagact 180
ttaaaatcta aatatgttaa atagtgtttc ctgtttaaga ctattttcta ttataaaatt 240
a 241
<210> 441
<211> 241
<212> DNA
<213> Homo sapiens
<400> 441
tgccaaagtt tgtgattcca catttctctt ccattgtaga gcaaatccat ccccacaccc 60
tgttcactcc tttgctgatt ggtttcgtaa tcgtagctgg catgatgtgc attattgtga 120
tgattctgac ctacaaatat ttacaggtaa ccatttattt gttctctctc cagagtgctc 180
taatgactga gacaataatt attaaaaggt gatctatttt tccctttctc cccacagaaa 240
c 241
<210> 442
<211> 241
<212> DNA
<213> Homo sapiens
<400> 442
ccagcctgaa tgatgacatt cttttcgggg tgttcgcaca aagcaagcca gattctgccg 60
aaccaatgga tcgatctgcc atgtgtgcat tccctatcaa atatgtcaac gacttcttca 120
acaagatcgt caacaaaaac aatgtgagat gtctccagca tttttacgga cccaatcatg 180
agcactgctt taatagggta agtcacatca gttccccact tataaactgt gaggtataaa 240
t 241
<210> 443
<211> 6
<212> PRT
<213> Homo sapiens
<400> 443
Lys Pro Leu Arg His His
1 5
<210> 444
<211> 4
<212> PRT
<213> Homo sapiens
<400> 444
Cys Arg Ala Val
1
<210> 445
<211> 4
<212> PRT
<213> Homo sapiens
<400> 445
Cys Arg Ala Val
1
<210> 446
<211> 6
<212> PRT
<213> Homo sapiens
<400> 446
Lys Pro Leu Arg His His
1 5
<210> 447
<211> 4
<212> PRT
<213> Homo sapiens
<400> 447
Cys Arg Ala Val
1
<210> 448
<211> 4
<212> PRT
<213> Homo sapiens
<400> 448
Cys Arg Ala Val
1
<210> 449
<211> 4
<212> PRT
<213> Homo sapiens
<400> 449
Gln Ala Gly Val
1
<210> 450
<211> 5
<212> PRT
<213> Homo sapiens
<400> 450
Glu Lys Leu Pro Arg
1 5
<210> 451
<211> 63
<212> DNA
<213> Homo sapiens
<400> 451
ctgaaagctg taccatacct gtctggtctt ggctgaggtt tcaatgaatg gaatcccgta 60
act 63
<210> 452
<211> 63
<212> DNA
<213> Homo sapiens
<400> 452
gtattggtct ctcatggcac tgtactcttc ttgtccagct gtatccagta tgtccaacaa 60
aca 63
<210> 453
<211> 63
<212> DNA
<213> Homo sapiens
<400> 453
tagctggatt gtcagtgcgc ttttcccaac accacctgct ccaaccacca ccagtttgta 60
ctc 63
<210> 454
<211> 63
<212> DNA
<213> Homo sapiens
<400> 454
ctggattgtc agtgcgcttt tcccaacacc acctgctcca accaccacca gtttgtactc 60
agt 63
<210> 455
<211> 63
<212> DNA
<213> Homo sapiens
<400> 455
caagaggccc tagatttcta tggggaagta aggaccagag acaaaaaggt aagttatttt 60
ttg 63
<210> 456
<211> 62
<212> DNA
<213> Homo sapiens
<400> 456
tatttcagtg ttacttacct gtcttgtctt tgctgatgtt tcaataaaag gaattccata 60
ac 62
<210> 457
<211> 63
<212> DNA
<213> Homo sapiens
<400> 457
tgtgtctact gttctagaag gcaaatcaca tttatttcct actaggacca taggtacatc 60
ttc 63
<210> 458
<211> 63
<212> DNA
<213> Homo sapiens
<400> 458
gtactggtcc ctcattgcac tgtactcctc ttgacctgct gtgtcgagaa tatccaagag 60
aca 63
<210> 459
<211> 63
<212> DNA
<213> Homo sapiens
<400> 459
tagctgtatc gtcaaggcac tcttgcctac gccaccagct ccaactacca caagtttata 60
ttc 63
<210> 460
<211> 63
<212> DNA
<213> Homo sapiens
<400> 460
ctgtatcgtc aaggcactct tgcctacgcc accagctcca actaccacaa gtttatattc 60
agt 63
<210> 461
<211> 63
<212> DNA
<213> Homo sapiens
<400> 461
tctacacgag atcctctctc tgaaatcact gagcaggaga aagattttct atggagtcac 60
agg 63
<210> 462
<211> 63
<212> DNA
<213> Homo sapiens
<400> 462
acacgagatc ctctctctga aatcactgag caggagaaag attttctatg gagtcacagg 60
taa 63
<210> 463
<211> 63
<212> DNA
<213> Homo sapiens
<400> 463
gagtatttca tgaaacaaat gaatgatgca catcatggtg gctggacaac aaaaatggat 60
tgg 63
<210> 464
<211> 63
<212> DNA
<213> Homo sapiens
<400> 464
gggacctccg gtcagaaaac caaaattata agcaacagag gtgaaaacag ctgcagtaag 60
tca 63
<210> 465
<211> 63
<212> DNA
<213> Homo sapiens
<400> 465
aaactgatgg gacccactcc atcgagattt cactgtagct agaccaaaat cacctatttt 60
tac 63
<210> 466
<211> 63
<212> DNA
<213> Homo sapiens
<400> 466
ctgcacggcg cggacgagga cgaggacctc ttcgacatcg aggatgacat catctacact 60
cag 63
<210> 467
<211> 63
<212> DNA
<213> Homo sapiens
<400> 467
gcgccggtct ctcccaggac aggcacaaac acgcacctca aagctgttcc gtcccagtag 60
att 63
<210> 468
<211> 63
<212> DNA
<213> Homo sapiens
<400> 468
atcgtagctg gcatgatgtg cattattgtg atgattctga cctacaaata tttacaggta 60
acc 63
<210> 469
<211> 63
<212> DNA
<213> Homo sapiens
<400> 469
ttccctatca aatatgtcaa cgacttcttc aacaagatcg tcaacaaaaa caatgtgaga 60
tgt 63
Claims (11)
1.一种检测人类受试者的结直肠癌的方法,该方法包括:
测定在来自从该受试者获得的样品的DNA中识别的以下表9的DMR中的每一个的至少一部分的甲基化状态:
及
至少部分地基于表9的所述DMR中的每一个的至少一部分的经测定的甲基化状态,来判定该受试者是否患有结直肠癌。
2.如权利要求1所述的方法,其中该方法包括测定在来自从该受试者获得的样品的DNA中识别的以下表10的DMR中的每一个的至少一部分的甲基化状态:
及
至少部分地基于表10的所述DMR中的每一个的至少一部分的经测定的甲基化状态,来判定该受试者是否患有结直肠癌。
3.如权利要求1-2所述的方法,其中该方法包括测定在来自从该受试者获得的样品的DNA中识别的以下表11的DMR中的每一个的至少一部分的甲基化状态:
及
至少部分地基于表11的所述DMR中的每一个的至少一部分的经测定甲基化状态,来判定该受试者是否患有结直肠癌。
4.如权利要求1-3所述的方法,其中该方法包括测定在来自从该受试者获得的样品的DNA中识别的图2的DMR中的每一个的至少一部分的甲基化状态,及
至少部分地基于图2的所述DMR中的每一个的至少一部分的经测定甲基化状态,来判定该受试者是否患有结直肠癌。
5.如权利要求1-4中任一项所述的方法,其中该样品为组织样品、血液样品、粪便样品或血液产物样品。
6.如权利要求1-5中任一项所述的方法,其中该样品包含从该人类受试者的血液或血浆分离的DNA。
7.如权利要求1-6中任一项所述的方法,其中该DNA为该人类受试者的无细胞DNA(cell-free DNA;cfDNA)。
8.如权利要求1-7中任一项所述的方法,其中该方法包括使用下一代测序(nextgeneration sequencing;NGS)测定一种或多种标记中的每一个的甲基化状态。
9.如权利要求1-8中任一项所述的方法,其中该方法包括使用一个或多个对目标区富集的捕获诱饵来捕获一个或多个相应的甲基化基因座。
10.如权利要求1-9中任一项所述的方法,其中表9、表10、表11及/或图2的所述DMR中的每一个包含至少一部分的甲基化基因座,各所述部分包含至少三(3)个CpG,且各所述甲基化基因座的长度等于或小于5000bp。
11.如权利要求10所述的方法,其中各甲基化基因座的长度等于或小于3000bp。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163189001P | 2021-05-14 | 2021-05-14 | |
US63/189,001 | 2021-05-14 | ||
EP21189077.7 | 2021-08-02 | ||
PCT/EP2022/063005 WO2022238560A1 (en) | 2021-05-14 | 2022-05-13 | Methods for disease detection |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117813403A true CN117813403A (zh) | 2024-04-02 |
Family
ID=77168089
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202280041974.7A Pending CN117813403A (zh) | 2021-05-14 | 2022-05-13 | 用于疾病检测的方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20220411878A1 (zh) |
CN (1) | CN117813403A (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11898199B2 (en) | 2019-11-11 | 2024-02-13 | Universal Diagnostics, S.A. | Detection of colorectal cancer and/or advanced adenomas |
-
2022
- 2022-05-13 US US17/744,231 patent/US20220411878A1/en active Pending
- 2022-05-13 CN CN202280041974.7A patent/CN117813403A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
US20220411878A1 (en) | 2022-12-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2019201577B2 (en) | Cancer diagnostics using biomarkers | |
CN101370946B (zh) | 用于使生物标志产物水平与疾病相关联的方法和装置 | |
US11898199B2 (en) | Detection of colorectal cancer and/or advanced adenomas | |
DK2681333T3 (en) | EVALUATION OF RESPONSE TO GASTROENTEROPANCREATIC NEUROENDOCRINE NEOPLASIS (GEP-NENE) THERAPY | |
AU2012352153B2 (en) | Cancer diagnostics using non-coding transcripts | |
AU2013277971B2 (en) | Molecular malignancy in melanocytic lesions | |
US20220389519A1 (en) | Biomarkers predictive of anti-immune checkpoint response | |
CN107988362B (zh) | 一种肺癌相关33基因靶向捕获测序试剂盒及其应用 | |
CN101688239A (zh) | 结肠癌的早期检测和预后 | |
KR20140140069A (ko) | 전반적 발달장애의 진단 및 치료용 조성물 및 그 진단 및 치료 방법 | |
US20210332440A1 (en) | Detection of advanced adenoma and/or early stage colorectal cancer | |
CN115917009A (zh) | 结肠直肠肿物的检测 | |
AU2008203227A1 (en) | Colorectal cancer prognostics | |
KR20190026769A (ko) | 유전자 발현 프로파일을 사용하여 폐암을 진단하기 위한 조성물 및 방법 | |
KR20160059446A (ko) | 암 유전체 돌연변이 검출용 유전자 패널 | |
CN117813403A (zh) | 用于疾病检测的方法 | |
CN111575379B (zh) | 甲状腺癌相关58基因检测试剂盒及其使用方法 | |
AU2004205270B2 (en) | Colorectal cancer prognostics | |
KR102115948B1 (ko) | 대사증후군의 위험인자 예측용 단일염기다형성 및 이의 용도 | |
KR102115941B1 (ko) | 대사증후군의 위험인자 예측용 단일염기다형성 및 이의 용도 | |
KR102039529B1 (ko) | 대사증후군의 위험인자 예측용 단일염기다형성 및 이의 용도 | |
TW202307218A (zh) | 用於疾病偵測的方法 | |
TW202311533A (zh) | 用於疾病偵測的方法 | |
KR100892587B1 (ko) | 대장암 특이적 발현감소 유전자의 메틸화된 프로모터를함유하는 암 진단용 조성물 및 그 용도 | |
KR20110113642A (ko) | 유방 종양의 하위분류 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |