JP7361774B2 - シーケンスリードの独立したアラインメントおよびペアリングによって高度に相同なシーケンスにおける遺伝的変異を検出するための方法 - Google Patents
シーケンスリードの独立したアラインメントおよびペアリングによって高度に相同なシーケンスにおける遺伝的変異を検出するための方法 Download PDFInfo
- Publication number
- JP7361774B2 JP7361774B2 JP2021527023A JP2021527023A JP7361774B2 JP 7361774 B2 JP7361774 B2 JP 7361774B2 JP 2021527023 A JP2021527023 A JP 2021527023A JP 2021527023 A JP2021527023 A JP 2021527023A JP 7361774 B2 JP7361774 B2 JP 7361774B2
- Authority
- JP
- Japan
- Prior art keywords
- region
- read
- interest
- reads
- pms2
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 227
- 230000007614 genetic variation Effects 0.000 title claims description 59
- 108010074346 Mismatch Repair Endonuclease PMS2 Proteins 0.000 claims description 137
- 102100037480 Mismatch repair endonuclease PMS2 Human genes 0.000 claims description 137
- 238000012163 sequencing technique Methods 0.000 claims description 126
- 239000000523 sample Substances 0.000 claims description 124
- 108700024394 Exon Proteins 0.000 claims description 88
- 108090000623 proteins and genes Proteins 0.000 claims description 74
- 101000738907 Homo sapiens Protein PMS2CL Proteins 0.000 claims description 59
- 102100037481 Protein PMS2CL Human genes 0.000 claims description 59
- 108020004414 DNA Proteins 0.000 claims description 39
- 238000007838 multiplex ligation-dependent probe amplification Methods 0.000 claims description 34
- 108700028369 Alleles Proteins 0.000 claims description 26
- 108091092195 Intron Proteins 0.000 claims description 18
- 238000004422 calculation algorithm Methods 0.000 claims description 17
- 238000007480 sanger sequencing Methods 0.000 claims description 7
- 108091008109 Pseudogenes Proteins 0.000 description 71
- 102000057361 Pseudogenes Human genes 0.000 description 71
- 238000007481 next generation sequencing Methods 0.000 description 62
- 238000012360 testing method Methods 0.000 description 61
- 230000011514 reflex Effects 0.000 description 39
- 150000007523 nucleic acids Chemical class 0.000 description 30
- 230000035945 sensitivity Effects 0.000 description 30
- 102000039446 nucleic acids Human genes 0.000 description 26
- 108020004707 nucleic acids Proteins 0.000 description 26
- 238000006243 chemical reaction Methods 0.000 description 24
- 210000004027 cell Anatomy 0.000 description 22
- 238000003752 polymerase chain reaction Methods 0.000 description 22
- 108091093088 Amplicon Proteins 0.000 description 18
- 238000012217 deletion Methods 0.000 description 17
- 230000037430 deletion Effects 0.000 description 17
- 230000035772 mutation Effects 0.000 description 17
- 206010028980 Neoplasm Diseases 0.000 description 16
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 15
- 208000035199 Tetraploidy Diseases 0.000 description 14
- 230000008569 process Effects 0.000 description 14
- 238000001514 detection method Methods 0.000 description 13
- 201000011510 cancer Diseases 0.000 description 12
- 239000013610 patient sample Substances 0.000 description 12
- 238000003556 assay Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 11
- 230000007704 transition Effects 0.000 description 11
- 238000004458 analytical method Methods 0.000 description 10
- 239000012634 fragment Substances 0.000 description 9
- 230000001717 pathogenic effect Effects 0.000 description 9
- 208000008051 Hereditary Nonpolyposis Colorectal Neoplasms Diseases 0.000 description 8
- 201000005027 Lynch syndrome Diseases 0.000 description 8
- 201000010099 disease Diseases 0.000 description 8
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 8
- 206010051922 Hereditary non-polyposis colorectal cancer syndrome Diseases 0.000 description 7
- 239000011324 bead Substances 0.000 description 7
- 239000008280 blood Substances 0.000 description 7
- 210000004369 blood Anatomy 0.000 description 7
- 238000013507 mapping Methods 0.000 description 7
- 239000011159 matrix material Substances 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 239000002773 nucleotide Substances 0.000 description 7
- 125000003729 nucleotide group Chemical group 0.000 description 7
- 230000002441 reversible effect Effects 0.000 description 7
- 238000004088 simulation Methods 0.000 description 7
- 108020004635 Complementary DNA Proteins 0.000 description 6
- 108091028043 Nucleic acid sequence Proteins 0.000 description 6
- 108091034117 Oligonucleotide Proteins 0.000 description 6
- 238000010804 cDNA synthesis Methods 0.000 description 6
- 239000002299 complementary DNA Substances 0.000 description 6
- 108091033319 polynucleotide Proteins 0.000 description 6
- 102000040430 polynucleotide Human genes 0.000 description 6
- 239000002157 polynucleotide Substances 0.000 description 6
- 101100310856 Drosophila melanogaster spri gene Proteins 0.000 description 5
- 238000012408 PCR amplification Methods 0.000 description 5
- 238000000137 annealing Methods 0.000 description 5
- 238000013459 approach Methods 0.000 description 5
- 239000000872 buffer Substances 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 238000010839 reverse transcription Methods 0.000 description 5
- 238000001847 surface plasmon resonance imaging Methods 0.000 description 5
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 4
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 4
- 102100027685 Hemoglobin subunit alpha Human genes 0.000 description 4
- 101001009007 Homo sapiens Hemoglobin subunit alpha Proteins 0.000 description 4
- 125000003275 alpha amino acid group Chemical group 0.000 description 4
- 230000004075 alteration Effects 0.000 description 4
- 230000003321 amplification Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 238000013467 fragmentation Methods 0.000 description 4
- 238000006062 fragmentation reaction Methods 0.000 description 4
- 238000009396 hybridization Methods 0.000 description 4
- 238000003199 nucleic acid amplification method Methods 0.000 description 4
- 238000000746 purification Methods 0.000 description 4
- 238000010200 validation analysis Methods 0.000 description 4
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 3
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 3
- 108091026890 Coding region Proteins 0.000 description 3
- 102000053602 DNA Human genes 0.000 description 3
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 3
- 101000617738 Homo sapiens Survival motor neuron protein Proteins 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 102100021947 Survival motor neuron protein Human genes 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- 238000003149 assay kit Methods 0.000 description 3
- 230000002759 chromosomal effect Effects 0.000 description 3
- 238000004925 denaturation Methods 0.000 description 3
- 230000036425 denaturation Effects 0.000 description 3
- 238000003205 genotyping method Methods 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 239000002096 quantum dot Substances 0.000 description 3
- 239000011535 reaction buffer Substances 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 210000003296 saliva Anatomy 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 238000005382 thermal cycling Methods 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- 208000005676 Adrenogenital syndrome Diseases 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- 208000008448 Congenital adrenal hyperplasia Diseases 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- 101000777277 Homo sapiens Serine/threonine-protein kinase Chk2 Proteins 0.000 description 2
- 101000861263 Homo sapiens Steroid 21-hydroxylase Proteins 0.000 description 2
- 102100034343 Integrase Human genes 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 238000000342 Monte Carlo simulation Methods 0.000 description 2
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 2
- 241000276498 Pollachius virens Species 0.000 description 2
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 2
- 102100031075 Serine/threonine-protein kinase Chk2 Human genes 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 102100027545 Steroid 21-hydroxylase Human genes 0.000 description 2
- 108010006785 Taq Polymerase Proteins 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000010828 elution Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000012530 fluid Substances 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 102000054766 genetic haplotypes Human genes 0.000 description 2
- PHTQWCKDNZKARW-UHFFFAOYSA-N isoamylol Chemical compound CC(C)CCO PHTQWCKDNZKARW-UHFFFAOYSA-N 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 239000006249 magnetic particle Substances 0.000 description 2
- 208000022499 mismatch repair cancer syndrome Diseases 0.000 description 2
- 244000052769 pathogen Species 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 108090000765 processed proteins & peptides Proteins 0.000 description 2
- 102000004196 processed proteins & peptides Human genes 0.000 description 2
- 102000004169 proteins and genes Human genes 0.000 description 2
- 238000003908 quality control method Methods 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 238000003757 reverse transcription PCR Methods 0.000 description 2
- 238000012502 risk assessment Methods 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 208000002320 spinal muscular atrophy Diseases 0.000 description 2
- 208000011580 syndromic disease Diseases 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 101150005355 36 gene Proteins 0.000 description 1
- 241000473391 Archosargus rhomboidalis Species 0.000 description 1
- 102000036365 BRCA1 Human genes 0.000 description 1
- 108700020463 BRCA1 Proteins 0.000 description 1
- 101150072950 BRCA1 gene Proteins 0.000 description 1
- 102000052609 BRCA2 Human genes 0.000 description 1
- 108700020462 BRCA2 Proteins 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 101150008921 Brca2 gene Proteins 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 108020004998 Chloroplast DNA Proteins 0.000 description 1
- 208000036248 Constitutional mismatch repair deficiency syndrome Diseases 0.000 description 1
- 102100021147 DNA mismatch repair protein Msh6 Human genes 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 230000005526 G1 to G0 transition Effects 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 208000015872 Gaucher disease Diseases 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 208000017095 Hereditary nonpolyposis colon cancer Diseases 0.000 description 1
- 101000968658 Homo sapiens DNA mismatch repair protein Msh6 Proteins 0.000 description 1
- 101000685323 Homo sapiens Succinate dehydrogenase [ubiquinone] flavoprotein subunit, mitochondrial Proteins 0.000 description 1
- 201000011062 Li-Fraumeni syndrome Diseases 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 108700020796 Oncogene Proteins 0.000 description 1
- 101150048740 PMS2 gene Proteins 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 238000002123 RNA extraction Methods 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 102100023155 Succinate dehydrogenase [ubiquinone] flavoprotein subunit, mitochondrial Human genes 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 108010012306 Tn5 transposase Proteins 0.000 description 1
- 108091023045 Untranslated Region Proteins 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 238000011481 absorbance measurement Methods 0.000 description 1
- 238000003916 acid precipitation Methods 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 201000006288 alpha thalassemia Diseases 0.000 description 1
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 1
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 1
- 238000002869 basic local alignment search tool Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- 238000005251 capillar electrophoresis Methods 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 235000013330 chicken meat Nutrition 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000003271 compound fluorescence assay Methods 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 238000003748 differential diagnosis Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 238000011143 downstream manufacturing Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000006862 enzymatic digestion Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 210000003754 fetus Anatomy 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 231100000221 frame shift mutation induction Toxicity 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 201000011045 hereditary breast ovarian cancer syndrome Diseases 0.000 description 1
- 208000021991 hereditary neoplastic syndrome Diseases 0.000 description 1
- 238000007849 hot-start PCR Methods 0.000 description 1
- 238000013101 initial test Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000036210 malignancy Effects 0.000 description 1
- 230000008774 maternal effect Effects 0.000 description 1
- KJLLKLRVCJAFRY-UHFFFAOYSA-N mebutizide Chemical compound ClC1=C(S(N)(=O)=O)C=C2S(=O)(=O)NC(C(C)C(C)CC)NC2=C1 KJLLKLRVCJAFRY-UHFFFAOYSA-N 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 239000002480 mineral oil Substances 0.000 description 1
- 235000010446 mineral oil Nutrition 0.000 description 1
- 230000033607 mismatch repair Effects 0.000 description 1
- 208000015833 mismatch repair cancer syndrome 1 Diseases 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000007918 pathogenicity Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 210000002307 prostate Anatomy 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 238000013442 quality metrics Methods 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 239000012925 reference material Substances 0.000 description 1
- 239000013074 reference sample Substances 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000010979 ruby Substances 0.000 description 1
- 229910001750 ruby Inorganic materials 0.000 description 1
- 238000005185 salting out Methods 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/10—Ploidy or copy number detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/30—Unsupervised data analysis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- Chemical & Material Sciences (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Bioethics (AREA)
- Epidemiology (AREA)
- Evolutionary Computation (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Description
[0001]本出願は、2018年7月27日に出願された米国仮出願第62/711,454号、および2018年9月12日に出願された米国仮出願第62/730,479号に対する優先権を主張し、これらはそれぞれ、すべての表、図面、および請求項を含む全体が本明細書に組み込まれる。
[0035]参照される任意の表(例えば、表S1、表S2など)を含む補充データは、申請すれば入手可能となるであろう。本特許出願に関する科学論文のバージョンは、本出願と共に添付文書として提供される。
[0036]本明細書で使用される場合、「精製された」およびその派生語は、分子が、分子が含有される試料の、少なくとも90重量%、95重量%、または少なくとも98重量%の濃度で試料中に存在することを意味する。
[0052]本明細書に記載の方法によってポリヌクレオチドが分析される試料は、同じ個体からの多数の試料、異なる個体からの多数の試料、またはそれらの組合せに由来し得る。一部の実施形態では、試料は、単一の個体からの複数のポリヌクレオチドを含む。一部の実施形態では、試料は、2つ以上の個体からの複数のポリヌクレオチドを含む。例えば、試料は、妊婦に由来し、妊婦およびその胎児からのポリヌクレオチドを含む。個体は、ポリヌクレオチドが由来し得る任意の生物またはその部分であり、その非限定的な例として、植物、動物、真菌、原生生物、モネラ界の生物、ウイルス、ミトコンドリア、およびクロロプラストが挙げられる。試料ポリヌクレオチドは、対象、例えば、培養細胞株、生検、血液試料、頬スワブ、細胞を含有する流体試料(例えば、唾液)を含む、細胞試料、組織試料、流体試料、またはそれらに由来する器官試料(またはこれらのいずれかに由来する細胞培養物)などから単離され得る。対象は、以下に限定されないが、ウシ、ブタ、マウス、ラット、ニワトリ、ネコ、イヌなどを含む動物であってもよく、通常、哺乳動物、例えば、ヒトである。試料は、化学合成によってなど、人工的に由来してもよい。一部の実施形態では、試料は、DNAを含む。一部の実施形態では、試料は、対象の血漿から抽出された無細胞DNAを含む。一部の実施形態では、試料は、ゲノムDNAを含む。一部の実施形態では、試料は、ミトコンドリアDNA、クロロプラストDNA、プラスミドDNA、細菌の人工染色体、酵母の人工染色体、オリゴヌクレオチドタグ、試料が得られる対象以外の生物(例えば、細菌、ウイルス、または真菌)からのポリヌクレオチドまたはそれらの組合せを含む。一部の実施形態では、抽出された核酸は、妊婦の母体血漿からの無細胞DNAを含む。
[0080]一部の実施形態では、バリアントは、コンピュータにより実装されるコーラーアルゴリズムで検出される。原則として、例えば、SNP、インデル、逆位、およびCNVを検出するために、任意のバリアントコーラーが利用され得る。一部の場合には、遺伝的変異、例えば、欠失が検出される場合に、ブレークポイントを検出/解明することが可能であるコーラーが使用される。例えば、コーラーは、Tattini, L.ら、Front Bioeng Biotechnol. 2015; 3: 92頁に記載されたコーラーから選択することができる。一部の場合には、バリアントは、0~7、または0~8という予測倍数性に基づいて特定される。一部の場合には、バリアントは、2という予測倍数性に基づいて特定される。他の場合には、バリアントは、6という予測倍数性に基づいて特定される。他の場合には、バリアントは、4という予測倍数性に基づいて特定される。例えば、SNVおよびインデルは、4に設定された(例えば、四倍体PMS2のエクソン12~15領域に対して)試料-倍数性オプションを有するGATK 4.0 HaplotypeCaller[29]を使用して特定され得る。他の場合には、SNVおよび短いインデルは、2に設定された(例えば、二倍体PMS2のエクソン11領域に対して)試料-倍数性オプションを有するGATK 1.6[30]およびFreeBayes[31]を使用して特定され得る。LR-PCRデータにおける二倍体SNVコーリングでは、GATK 1.6が同様に使用され得る。
[0123]好ましい実施形態では、本明細書に記載の方法の一部は、コンピュータにより実装される。本明細書に記載のシステムおよびプロセスのある特定の態様および例が動作し得る例示的環境およびシステム。図10に示されるように、一部の例では、システムは、クライアントサーバーモデルに従って実装可能である。システムは、ユーザーデバイス102上で実行されるクライアントサイドの部分と、サーバーシステム110上で実行されるサーバーサイド部分とを含み得る。ユーザーデバイス102は、任意の電子デバイス、例えば、デスクトップ型コンピュータ、ラップトップ型コンピュータ、タブレット型コンピュータ、PDA、携帯電話(例えば、スマートホン)などを含み得る。
PMS2の3’エクソンにおいて臨床的に取り扱うことが可能なバリアントの検出
[0134]この実施例は、PMS2の3’エクソンにおけるSNV、インデル、およびCNVの検出のための戦略を示す。この研究は、西部治験審査委員会(Western Institutional Review Board)による免除として検討および指定され、医療保険の携行と責任に関する法律(Health Insurance Portability and Accountability Act)(HIPAA)に従った。
研究試料:
[0135]付属の表S1は、いずれの試料セットを特定のアッセイおよび分析のために使用したかを示す。細胞株DNAは、Coriell Cell Repositories(Camden、NJ)(付属の表S2)から購入した。患者試料DNAは、匿名化された血液または唾液試料から抽出した。既知陽性を有するDNA試料は、Invitae Corporationからの寄贈であった。
[0136]DNAを抽出し、1×SPRIビーズとのインキュベーションによりさらに精製し、続いて、80%エタノールで洗浄し、TE(10mMのTris-HCl、1mMのEDTA、pH8.0)中に溶出した。およそ300ngの溶出したDNAは、以下の最終濃度を有する別々の遺伝子および偽遺伝子特異的LR-PCR反応における鋳型としての役割を果たした:1xLongAmp Taq Reaction Buffer(New England Biolabs、NEB)、0.3mM dNTPs、1μMの遺伝子または偽遺伝子特異的フォワードプライマー、1μMの共通リバースプライマーLRPCR_Unv_R(付属の表S3におけるすべてのプライマーシーケンス)、0.25%のホルムアミド、および5ユニットのLongAmp Hot Start Taq DNA Polymerase(NEB)。遺伝子特異的フォワードプライマーPMS2_LRPCR_Fを含む反応により、PMS2のエクソン11~15にわたる約17kbのアンプリコンが得られ(フォワードプライマー標的エクソン10)、一方、偽遺伝子特異的フォワードプライマーPMS2CL_Fの使用によって、PMS2CL(エクソン6からPMS2CLの上流の領域にわたる)から約18kbを増幅させた。サーマルサイクリングは、94℃で5分、続いて94℃で30秒間および65℃で18.5分の30サイクルの初期変性を含んだ。最終伸長は、65℃で18.5分であり、続いて4℃で保持した。LR-PCRアンプリコンの質は、0.5%アガロースゲル電気泳動を使用して評価し、広範囲Qubitアッセイキット(Thermo Fisher)により定量した。
[0140]以前に記載されたように、ターゲットNGSを実施した[7、8]。簡潔には、患者の血液または唾液試料からDNAを単離し、色素ベースの蛍光アッセイによって定量し、次いで、超音波処理によって200~1000bpに断片化した。断片化されたDNAを末端修飾、Aテイル化、およびアダプターライゲーションによってNGSライブラリーに変換した。次いで、試料をバーコード付加プライマーを用いるPCRによって増幅させ、多重化させ、PMS2とPMS2CLの間に共通の領域に相補的な40マーのオリゴヌクレオチド(Integrated DNA Technologies)を用いて、ハイブリッド捕捉に基づく濃縮に供した。全パネルについて平均シーケンシング深度が約500×のHiSeq 2500(PMS2における被覆率は約1000×)で、NGSを実施した。すべての標的ヌクレオチドは、20リードの最小深度で被覆される必要がある。
[0141]ハイブリッド捕捉データでは、基準ゲノムのPMS2遺伝子座におけるPMS2およびPMS2CLを起源とするリードを集計するために、ペアエンドNGSリードをBWA-MEM[27]を使用して、hg19ヒト基準ゲノムに対して最初にアラインさせた。PMS2のエクソン11におけるアラインメントを遺伝子と偽遺伝子の間の既知の差の部位で重複するリードのみを含むようにフィルタリングした。PMS2のエクソン12~15に対してアラインしたリードおよびPMS2CLのエクソン3~6に対してアラインしたリードをsamtool[28]を使用してBAMファイル中にパーティショニングした。BAMファイルをPicard(Broad Institute)を使用して、2つのアラインされていないFASTQファイル(2つのファイルのうちの1つに構文解析されたリードペアの各数)に変換した。各シングルエンドFASTQファイルはhg19ゲノムに対して別々にリアラインされ、曖昧なアラインメント、および各リードに対するいくつかのトップアラインメントの報告を可能にした。得られたシングルエンドアラインメントを使用して、以下の方式でペアエンドアラインメントを生じさせた:1)両方のシングルエンドリードは同じリード名を有した、2)両方のシングルエンドリードが、PMS2のエクソン12~15にわたる領域に対してマッピングされた、3)両方のシングルエンドリードが互いに1000bpの範囲内にアラインされた、および4)多数の推定上のペアが、所与のリード名に関する上記条件を満たし、最も高いアラインメントスコアを有するペアが選択された。上記のように適当なペアを形成することができないリードは破棄された。得られたペアエンドBAMファイルは、PMS2シーケンスに対してマッピングされたPMS2とPMS2CLの両方に起源するリードを含有した。
[0143]PMS2とPMS2CLからのリードがマッピングされた(上記を参照されたい)PMS2領域では、SNVおよび短いインデルを4に設定し、max-reads-per-alignment-startオプションをオフにし、およびmin-pruningオプションを1に設定した試料倍数性オプションを有するGATK 4.0 HaplotypeCaller[29]を使用して特定した。二倍体PMS2のエクソン11領域では、GATK 1.6[30]およびFreeBayes[31]を使用して、SNVおよび短いインデルを特定した。LR-PCRデータにおける二倍体SNVコールでは、GATK 1.6を同様に使用した。本発明者らが対立遺伝子のドロップアウトを疑ったLR-PCR試料では(Discussionを参照されたい)、Integrative Genomics ViewerにおけるNGSデータの目視検査によってABを決定した[32]。
[0144]ハイブリッド捕捉断片のショートリードNGSでは、PMS2のエクソン11におけるCNVは、以前に記載したアルゴリズム[7]を使用して、ターゲット位置における相対的NGSリード深度を測定することによって決定した。PMS2およびPMS2CLに起源するリードがPMS2シーケンスに位置するBAMファイルから、PMS2のエクソン12~15におけるCNVをコールするために(上記「リードアラインメント」を参照されたい)、CNVコールアルゴリズムに対する2つの改変がなされた:1)予測した野生型コピー数を2から4のコピーに変更した、および2)どの程度の可能性でHMMが野生型からCNV状態に遷移するかを決定するパラメーターであるPCNVを0.01に設定し、経験的データから高いCNV感度および特異性を得た。
[0146]単一コピーの複製および欠失を、以前に記載したように[33]、試料の所与のバッチのCNV陰性試料のうちの1つにおいて観察されたリード数を改変することによって導入した。ベースラインコピー数が4であったPMS2のエクソン12~15では、単一コピーの欠失および複製を、それぞれ、リードを75%までサブサンプリングするかまたはリード数を125%で増加させることによって導入した。PMS2の4つの最終エクソンにおけるすべての可能なエクソンの連続する組合せについて、シミュレートしたCNVを作成した。各CNVのサイズおよび位置について、2186個の試料をシミュレートし、CNVコールアルゴリズムによって試験し、感度を、正確に検出された合成CNVのパーセンテージとして計算した。偽遺伝子リードは遺伝子シーケンスからフィルタリングされるため、CNVを、2というベースラインコピー数を有したPMS2のエクソン11において別々にシミュレートした。
[0147]四倍体バックグラウンド(遺伝子および偽遺伝子を起源とするリードが再度マッピングされた、PMS2のエクソン12~15に関連する)におけるインデルをシミュレーションして、GATK4を使用してインデルコールの感度をよりよく試験した。2つの二倍体アルゴリズムであって、そのうちの少なくとも1つが、インデルを含有することがCounsyl Reliant HCSパネルによって以前に決定された、2つの二倍体アルゴリズムをマージして、四倍体アラインメントを作成した。試料のうちの1つがインデルの中央に位置する100bpの領域において、他の試料よりも多くのリードを有する場合、各マージされた二倍体試料がアラインされたリードとおよそ同じ数を有するように、リードを二項式によりダウンサンプリングした。次いで、上記セクションSNVおよびインデルのコールにおいて記載したように、GATK4を使用して、これらの合成四倍体アラインメントからインデルをコールした。
[0148]PMS2の5つの最終エクソンにおけるすべてのバリアントについて、5段階分類カテゴリーシステム(良性、良性である可能性が高い、病的意義が不明なバリアント、病原性である可能性が高い、病原性)[34]を使用するAmerican College of Medical Genetics and Genomics(ACMG)基準に従って、バリアント解釈を実施した。公開された文献および公的に利用可能なデータベースにおいて入手可能なエビデンスを使用して分類を行った。集団データベースにおけるPMS2バリアントの特定は不正確な可能性があるため、対立遺伝子頻度に基づく規則は使用しなかった。バリアントの分類は、委員会が認定した検査室統括責任者らによって再調査および承認された。
[0149]製造業者のプロトコールに従って、MLPAを実施した(MRC Holland、12/11/17に発行されたprobemix P008-C1 PMS2プロトコールおよび3/23/18に発行されたMLPA General Protocol)。全体として、ゲノムDNAをミネラルオイルで被覆して、ハイブリダイゼーションおよびライゲーションの間の蒸発を低減させ、次に、DNAを98℃で5分間変性させ、次いで25℃に保持した。ハイブリダイゼーション試薬およびプローブミックスを試料に添加し、95℃で1分間、次いで、60℃で16~20時間インキュベートした。近接する位置にあるターゲットDNAに結合するプローブペアを54℃で15分間ライゲーションし、次いで、PCRにより35サイクル増幅させた。増幅したプローブをROXラダーおよびホルムアミドと混合し、次いで、キャピラリー電気泳動機器で分離した。Coffalyser software(MRC Holland)により、PMS2プローブの強度を基準プローブの強度に対して、最初は各試料内で、次いで試料間で正規化した。各試料の正規化したプローブ強度を基準試料の平均強度と比較し、Coffalyserはその領域でCNVコールを発した。
[0150]LR-PCRデータおよびハイブリッド捕捉データからSNV、インデル、およびCNV特異的リフレックスレートを使用し、次に、pymc[35]を用いるMarkov Chain Monte Carloシミュレーションを使用して、大きなコホートサイズまで外挿し、リフレックスレートを推定した。
[0151]PMS2およびPMS2CL由来のLR-PCRアンプリコンからのNGSリードをPMS2に対してアラインし、GATK UniversalGenotyperを用いてバリアントをコールした。バリアントが、試料の100%において、PMS2特異的アンプリコンにおける基準対立遺伝子に対してホモ接合性であり、かつPMS2CL特異的アンプリコンにおける(PMS2に対してアラインされたように)代替の対立遺伝子に対してホモ接合性である場合に、部位を信頼性ありとみなした。
RNA抽出および逆転写:
[0152]製造業者の説明書に従い、400μLの全血から、Agencourt RNAdvance Bloodキット(Beckman Coulter)を用いて、33種の試料からRNAを抽出した。採血を実施した後の7日以内に、RNAを血液チューブから抽出した。抽出の質をRNA 6000 Nanoキット(Agilent)により評価した。Qubit HS RNA Assayキット(Thermo Fisher)によりRNAを定量した。
[0155]各試料について、2つの反応物を設定した:1)フォワードプライマーPMS2_RNA_FおよびリバースプライマーRNA_Unv_RはcDNAから1.5kbのPMS2を増幅させた、および2)フォワードプライマーPMS2CL_FおよびリバースプライマーRNA_Unv_RはcDNA(付属の表S3におけるプライマーシーケンス)から1.5kbのPMS2CLを増幅させた。PCR反応は、1x LongAmp Taq Reaction Buffer(NEB)、0.3mMのdNTP、フォワードプライマーとリバースプライマーをそれぞれ1μM、20~70ngのcDNA、0.1U/μLのLongAmp Taq DNAポリメラーゼ(NEB)を含有し、水で25μLとした。サーマルサイクリングは以下の通りであった:94℃で5分間、94℃で30秒間を30サイクル、PMS2については52℃で、PMS2CLについては55℃でアニーリング、65℃で2分間、続いて、65℃で10分間最終伸長、次いで、4℃で保持。PCR産物を1.2×SPRIビーズで精製した。2%アガロースゲルまたはDNA7500キット(Agilent)でアンプリコンを可視化した。
[0156]各アンプリコン50~100ngをBioruptor(Diagenode)を用い、30秒オンおよび90秒オフの12サイクルで50μL体積に断片化した。断片化は、High Sensitivity DNAキット(Agilent)で可視化した。すべての断片化材料をライブラリー調製の入力に使用した。KAPA Hyper Prepキット(Kapa Biosystems)をライブラリー調製に使用し、製造業者の説明書に従った。アダプターをPMS2については15μMおよびPMS2CLについては3μMに希釈した。濃縮PCRを9サイクル実施した。吸光度測定(Tecan M200)を使用して試料を定量し、10nMに正規化し、1つの反応物に統一した。KAPA Library Quantification Kit(Kapa Biosystems)を使用するqPCRで最終ライブラリーを定量し、二重インデックスを有するシングルリードをNextSeq 550 System(Illumina)で75サイクルシーケンシングした。
[0157]ベースコールファイルをbcl2fastq(Illumina)を使用してFASTQファイルに変換した。FASTQファイルをSTAR[36]を使用してアラインした。
[0158]メトリックスを以下のように定義した:感度=TP/(TP+FN);特異性=TN/(TN+FP)。ClopperおよびPearson[37]の方法によってCIを計算した。SNVおよびインデルでは、真の陰性を、使用したコホートにおいて多型であると判明した部位(本発明者らが、少なくとも1つの試料において非基準塩基を観察した位置)で観察された一致した陰性結果と定義した。
ゼロヌクレオチドは、PMS2のエクソン12~15をPMS2CLと確実に識別することができる:
[0159]短いDNA断片のNGSは、断片自体が遺伝子または偽遺伝子に対して明確にアラインされ得る場合にのみ、5つの最終エクソンにおけるPMS2特異的バリアントを特定することができるであろう。偽遺伝子の妨害を克服するために、ユニークマッピングは、PMS2とPMS2CLの間で異なる塩基に依拠することになる。hg19基準ゲノムでは、これらの識別塩基は稀であり(図1D、左のバー):PMS2(20ntのイントロンシーケンスで埋められた)の5つの最終エクソンのそれぞれにおけるシーケンス同一性は97%を超え、差は、それぞれ、エクソン11から15において26、0、1、1、および0個の塩基を含むに過ぎない。さらに、以前の報告では、自然変異は、基準ゲノムにおいて表されるこれらの識別塩基の信頼性を抑制し得る[17、18]。
[0161]その根拠としてショートリードNGSを使用し、臨床的に必要とされる場合にのみ、バリアントが遺伝子起源であるか偽遺伝子起源であるかを明確にするための直交アッセイを含むリフレックス試験を実施する、PMS2の3’エクソンに関するワークフローの妥当性を評価した(図2A)。試験のショートリードNGS段階では、分子アプローチは、PMS2の5つの最終エクソンにわたり一致する。患者試料からのLR-PCRデータにおいて、PMS2とPMS2CLの間で変化することが示された位置を特異的に回避する捕捉プローブを設計することによって、それらが遺伝子起源であるか偽遺伝子起源であるかが曖昧な方式で、DNA断片を捕捉する(図2B、紫色のボックス)。
[0165]本明細書に記載のリフレックスワークフローは、ショートリードNGS試験(図2)が(1)PMS2のエクソン11におけるバリアントを特定する、および(2)PMS2/PMS2CL起源の曖昧性を有するエクソン12~15においてバリアントに関するリフレックス試験を必要とする試料を知らせる、高い分析感度および特異性を有する場合にのみ、臨床的に実行可能である。SNVおよびインデルに関するショートリードNGS試験の精度を評価するために、その結果を144個の患者試料および155種の細胞株に関するLR-PCRで観察されたものと比較した(図3)。エクソン12~15における遺伝子型一致を測定することによって不規則な混同行列が必要され、これは、ショートリードNGS遺伝子型が四倍体であると報告され(方法を参照されたい)、一方、LR-PCRは、遺伝子と偽遺伝子の両方に関する二倍体遺伝子型コールを返すためである(図3Aはいくつかの例を強調する)。行列は、代替対立遺伝子の存在が適当に検出されるが、代替対立遺伝子の数が一致しない「許容されるドーセッジの誤差」を含む;このような誤差は、ショートリードNGSにおける代替対立遺伝子の存在がリフレックス試験を誘発し、訂正されるのに十分であるため、許容されると考えられる。真の集合としてLR-PCR用いる1,678部位において比較した場合、ショートリードNGS試験は、エクソン11において100%の分析感度と100%の分析特異性を有し(図3B)、エクソン12~15において99.9%の分析感度と100%の分析特異性を有した(図3C)。
[0168]PMS2の5つの最終エクソンにおけるCNVに関するショートリードNGSの感度および特異性を評価するために、患者試料、細胞株、既知陽性、およびシミュレーションした陽性を有する試料を試験した。SNVおよびインデルと同様に、上記CNV検出アルゴリズムを、PMS2のエクソン11について2つおよびエクソン12~15において4つのコピー数ベースラインを使用するために、適応させた(図2B、青色のボックス;方法を参照されたい)。5つの最終エクソンにおいてCNVを有する3つの既知陽性試料を予測されたエクソンを包含するCNVを有するとして正確に特定した(図5A)。細胞株のうちの4つおよび臨床試料のうちの1つにおけるエクソン13~14の欠失をさらに観察した;臨床試料では、ショートリードNGSは、四倍体バックグラウンドからのシグナル低下を特定し(図5B)、MLPAは、同様の欠失の存在を確認し(図5C)、かつLR-PCRアンプリコンにおけるNGSは、欠失は、PMS2よりもむしろPMS2CLにおいて存在することを明らかにした(図5D)。興味深いことに、この領域の2つのコピーのうちの1つだけがPMS2CLにおいて欠失するが、LR-PCRプロファイルは、欠失した領域において75%のシグナル低下を示す。LR-PCRの間、これは、より短い欠失を保有する対立遺伝子の優先的増幅から生じることが推測される。したがって、LR-PCRデータは、曖昧性除去をもたらす点で特有であったが、ショートリードNGSおよびMLPAデータは、解釈可能なコピー数値をより容易に有した。
共通の細胞株に関する遺伝子および偽遺伝子特異的バリアント情報:
[0173]以下の実施形態は例示的であり、本発明を限定することを意図しない。
(a)目的物の第1の領域および第2の領域における目的物の多数の部位からペアエンドシーケンシングによってシーケンスリードを得るステップであって、シーケンスリードが、目的物の各部位で得られた第1のリードおよび第2のリードを含む、ステップと、
(b)基準ゲノムに対してシーケンスリードをアラインするステップであって、第1のリードおよび第2のリードが基準ゲノムに対して別々にアラインされ、アライナーが第1のリードおよび第2のリードのそれぞれについて多数の可能なアラインメントを発する、ステップと、
(c)目的物の第1の領域に対してアラインする第1のリードおよび第2のリードを特定するステップと、
(d)ステップ(c)において特定されたリードから第1のリードおよび第2のリードをペアリングし、それによってトップペアアラインメントを生じるステップと、
(e)ステップ(d)で生じたトップペアアラインメントにおける遺伝的変異を検出するステップと
を含む、方法。
(a)1つまたは複数のプロセッサー、
(b)メモリ、および
(c)1つまたは複数のプログラム
を含むシステムであって、1つまたは複数のプログラムが、メモリに記憶され、1つまたは複数のプロセッサーによって実行されるよう構成され、1つまたは複数のプログラムは、実施形態1を実行するための命令を含む、システム。
1. Nagy R, Sweet K, Eng C. Highly penetrant hereditary cancer syndromes. Oncogene. 2004;23: 6445-6470.
2. Lu KH, Wood ME, Daniels M, Burke C, Ford J, Kauff ND, et al. American Society of Clinical Oncology Expert Statement: collection and use of a cancer family history for oncology providers. J Clin Oncol. 2014;32: 833-840.
3. Mucci LA, Hjelmborg JB, Harris JR, Czene K, Havelick DJ, Scheike T, et al. Familial Risk and Heritability of Cancer Among Twins in Nordic Countries. JAMA. 2016;315: 68-76.
4. Foulkes WD. Inherited Susceptibility to Common Cancers. N Engl J Med. 2008;359: 2143-2153.
5. Garber JE, Offit K. Hereditary cancer predisposition syndromes. J Clin Oncol. 2005;23: 276-292.
6. Vogelstein B, Papadopoulos N, Velculescu VE, Zhou S, Diaz LA, Kinzler KW. Cancer Genome Landscapes. Science. 2013;339: 1546-1558.
7. Vysotskaia VS, Hogan GJ, Gould GM, Wang X, Robertson AD, Haas KR, et al. Development and validation of a 36-gene sequencing assay for hereditary cancer risk assessment. PeerJ. 2017;5: e3046.
8. Kang HP, Maguire JR, Chu CS, Haque IS, Lai H, Mar-Heyming R, et al. Design and validation of a next generation sequencing assay for hereditary BRCA1 and BRCA2 mutation testing. PeerJ. 2016;4: e2162.
9. Bunnell AE, Garby CA, Pearson EJ, Walker SA, Panos LE, Blum JL. The Clinical Utility of Next Generation Sequencing Results in a Community-Based Hereditary Cancer Risk Program. J Genet Couns. 2017;26: 105-112.
10. Desmond A, Kurian AW, Gabree M, Mills MA, Anderson MJ, Kobayashi Y, et al. Clinical Actionability of Multigene Panel Testing for Hereditary Breast and Ovarian Cancer Risk Assessment. JAMA Oncol. 2015;1: 943-951.
11. Lynch HT, Smyrk T, Lynch J, Fitzgibbons R Jr, Lanspa S, McGinn T. Update on the differential diagnosis, surveillance and management of hereditary non-polyposis colorectal cancer. Eur J Cancer. 1995;31A: 1039-1046.
12. Blount J, Prakash A. The changing landscape of Lynch syndrome due to PMS2 mutations. Clin Genet. 2018;94: 61-69.
13. Sijmons RH, Hofstra RMW. Review: Clinical aspects of hereditary DNA Mismatch repair gene mutations. DNA Repair . 2016;38: 155-162.
14. Tiwari AK, Roy HK, Lynch HT. Lynch syndrome in the 21st century: clinical perspectives. QJM. 2016;109: 151-158.
15. Lynch HT, Fusaro RM, Lynch JF. Cancer Genetics in the New Era of Molecular Biology. Ann N Y Acad Sci. 1997;833: 1-28.
16. De Vos M, Hayward BE, Picton S, Sheridan E, Bonthron DT. Novel PMS2 pseudogenes can conceal recessive mutations causing a distinctive childhood cancer syndrome. Am J Hum Genet. 2004;74: 954-964.
17. Hayward BE, De Vos M, Valleley EMA, Charlton RS, Taylor GR, Sheridan E, et al. Extensive gene conversion at the PMS2 DNA mismatch repair locus. Hum Mutat. 2007;28: 424-430.
18. van der Klift HM, Tops CMJ, Bik EC, Boogaard MW, Borgstein A-M, Hansson KBM, et al. Quantification of sequence exchange events between PMS2 and PMS2CL provides a basis for improved mutation scanning of Lynch syndrome patients. Hum Mutat. 2010;31: 578-587.
19. Vaughn CP, Robles J, Swensen JJ, Miller CE, Lyon E, Mao R, et al. Clinical analysis of PMS2: mutation detection and avoidance of pseudogenes. Hum Mutat. 2010;31: 588-593.
20. Vaughn CP, Hart KJ, Samowitz WS, Swensen JJ. Avoidance of pseudogene interference in the detection of 3' deletions in PMS2. Hum Mutat. 2011;32: 1063-1071.
21. van der Klift HM, Mensenkamp AR, Drost M, Bik EC, Vos YJ, Gille HJJP, et al. Comprehensive Mutation Analysis of PMS2 in a Large Cohort of Probands Suspected of Lynch Syndrome or Constitutional Mismatch Repair Deficiency Syndrome. Hum Mutat. 2016;37: 1162-1179.
22. Li J, Dai H, Feng Y, Tang J, Chen S, Tian X, et al. A Comprehensive Strategy for Accurate Mutation Detection of the Highly Homologous PMS2. J Mol Diagn. 2015;17: 545-553.
23. Vaughn CP, Baker CL, Samowitz WS, Swensen JJ. The frequency of previously undetectable deletions involving 3’ Exons of the PMS2 gene. Genes Chromosomes Cancer. 2013;52: 107-112.
24. Espenschied CR, LaDuca H, Li S, McFarland R, Gau C-L, Hampel H. Multigene Panel Testing Provides a New Perspective on Lynch Syndrome. J Clin Oncol. 2017;35: 2568-2575.
25. Etzler J, Peyrl A, Zatkova A, Schildhaus H-U, Ficek A, Merkelbach-Bruse S, et al. RNA-based mutation analysis identifies an unusual MSH6 splicing defect and circumvents PMS2 pseudogene interference. Hum Mutat. 2008;29: 299-305.
26. Herman DS, Smith C, Liu C, Vaughn CP, Palaniappan S, Pritchard CC, et al. Efficient Detection of Copy Number Mutations in PMS2 Exons with a Close Homolog. J Mol Diagn. 2018;20: 512-521.
27. Li H. Aligning sequence reads, clone sequences and assembly contigs with BWA-MEM [Internet]. 2013. Available: arxiv.org/abs/1303.3997
28. Li H, Handsaker B, Wysoker A, Fennell T, Ruan J, Homer N, et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 2009;25: 2078-2079.
29. Poplin R, Ruano-Rubio V, DePristo MA, Fennell TJ, Carneiro MO, Van der Auwera GA, et al. Scaling accurate genetic variant discovery to tens of thousands of samples [Internet]. 2017. doi:10.1101/201178
30. Garrison E, Marth G. Haplotype-based variant detection from short-read sequencing [Internet]. arXiv [q-bio.GN]. 2012. Available: arxiv.org/abs/1207.3907
31. McKenna A, Hanna M, Banks E, Sivachenko A, Cibulskis K, Kernytsky A, et al. The Genome Analysis Toolkit: a MapReduce framework for analyzing next-generation DNA sequencing data. Genome Res. 2010;20: 1297-1303.
32. Home | Integrative Genomics Viewer [Internet]. [cited 7 Sep 2018]. Available: www.broadinstitute.org/igv
33. Hogan GJ, Vysotskaia VS, Beauchamp KA, Seisenberger S, Grauman PV, Haas KR, et al. Validation of an Expanded Carrier Screen that Optimizes Sensitivity via Full-Exon Sequencing and Panel-wide Copy Number Variant Identification. Clin Chem. 2018;64: 1063-1073.
34. Richards S, Aziz N, Bale S, Bick D, Das S, Gastier-Foster J, et al. Standards and guidelines for the interpretation of sequence variants: a joint consensus recommendation of the American College of Medical Genetics and Genomics and the Association for Molecular Pathology. Genet Med. 2015;17: 405-424.
35. Salvatier J, Wiecki TV, Fonnesbeck C. Probabilistic programming in Python using PyMC3. PeerJ Comput Sci. PeerJ Inc.; 2016;2: e55.
36. Dobin A, Davis CA, Schlesinger F, Drenkow J, Zaleski C, Jha S, et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 2013;29: 15-21.
37. Clopper CJ, Pearson ES. The Use of Confidence or Fiducial Limits Illustrated in the Case of the Binomial. Biometrika. 1934;26: 404.
38. Zook JM, Catoe D, McDaniel J, Vang L, Spies N, Sidow A, et al. Extensive sequencing of seven human genomes to characterize benchmark reference materials. Sci Data. 2016;3: 160025.
39. Zook JM, Chapman B, Wang J, Mittelman D, Hofmann O, Hide W, et al. Integrating human sequence data sets provides a resource of benchmark SNP and indel genotype calls. Nat Biotechnol. 2014;32: 246-251.
[0213]本明細書に記載の実施例および実施形態は、例示のみを目的物とし、それらを考慮した様々な修正または変化は、当技術分野の当業者に示唆されることになり、本出願の趣旨および範囲ならびに添付の特許請求の範囲の範囲内に含まれるべきであることが理解される。本明細書で引用されたすべての刊行物、特許、および特許出願は、参照によりすべての目的物のためにその全体が本明細書に組み込まれる。
Claims (37)
- 対象のゲノムにおける遺伝的変異を検出するための方法であって、ゲノムが、目的物の高度に相同な第1の領域および第2の領域を含み、前記方法が、
(a)目的物の第1の領域および第2の領域における目的物の多数の部位からペアエンドシーケンシングによってシーケンスリードを得るステップであって、シーケンスリードが、目的物の各部位で得られた第1のリードおよび第2のリードを含む、前記ステップと、
(b)基準ゲノムに対してシーケンスリードをアラインするステップであって、第1のリードおよび第2のリードが基準ゲノムに対して別々にアラインされ、アライナーが第1のリードおよび第2のリードのそれぞれについて多数の可能なアラインメントを発し、ここで、基準ゲノムが、目的物の第1の相同な領域または第2の相同な領域のマスク部分または改変部分を含まない、前記ステップと、
(c)目的物の第1の領域に対してアラインする第1のリードおよび第2のリードを特定するステップと、
(d)ステップ(c)において特定されたリードから第1のリードおよび第2のリードのトップペアアラインメントを生じるステップと、
(e)ステップ(d)で生じたトップペアアラインメントにおける遺伝的変異を検出するステップと
を含む、前記方法。 - ステップ(b)の前に、基準ゲノムに対して第1のリードおよび第2のリードをアラインするステップであって、アライナーが、第1のリードおよび第2のリードの各ペアについて、目的物の第1の領域または第2の領域に対して最良のペアエンドアラインメントを発し、かつ目的物の第1の領域または第2の領域に対する最も高いトップアラインメントスコアに関連するペアエンドリードのみが、ステップ(b)において別々にアラインされる前記ステップを含む、請求項1に記載の方法。
- シーケンスリードが、目的物の多数の部位のダイレクトターゲットシーケンシング(DTS)によって得られ、第1のリードがゲノムシーケンスリードを含み、第2のリードが目的物の部位と関連したプローブシーケンスリードを含む、請求項1または2に記載の方法。
- ステップ(b)において、シーケンスリードが、Burrows-Wheeler Aligner(BWA)アルゴリズムを使用してアラインされる、請求項1~3のいずれか1項に記載の方法。
- ステップ(b)において、アライナーが、目的物の第1の領域および第2の領域に関する最小のアラインメントスコアを満たすアラインメントのみを発する、請求項1~4のいずれか1項に記載の方法。
- 目的物の第1の領域に対する第1のリードおよび第2のリードのアラインメントが、互いに一定数の塩基の範囲内にある場合にのみ、第1のリードおよび第2のリードが、ステップ(d)においてペアリングされる、請求項1~5のいずれか1項に記載の方法。
- 目的物の第1の領域に対する第1のリードおよび第2のリードのアラインメントが、約100bp、約200bp、約200bp、約300bp、約400bp、約500bp、約600bp、約700bp、約800bp、約900bp、約1000bp、約1100bp、約1200bp、約1300bp、約1400bp、約1500bp、または1500bp超の範囲内の場合にのみ、第1のリードおよび第2のリードが、ステップ(d)においてペアリングされる、請求項1~6のいずれか1項に記載の方法。
- ステップ(d)において、多数のペアアラインメントを生じるステップと、多数のペアアラインメントのそれぞれについてアラインメントスコアを計算するステップと、最も高いアラインメントスコアを有するものとしてトップペアアラインメントを特定するステップとを含む、請求項1~7のいずれか1項に記載の方法。
- ステップ(d)におけるトップペアアラインメントが、多数のペアアラインメントと比較して最も小さな鋳型長を有するものとして選択される、請求項1~8のいずれか1項に記載の方法。
- 遺伝的変異が、SNP、インデル、逆位、および/またはCNVを含む、請求項1~9のいずれか1項に記載の方法。
- ステップ(e)における検出するステップが、SNP、インデル、逆位、および/またはCNVをコールするステップを含む、請求項1~10のいずれか1項に記載の方法。
- ステップ(e)における検出するステップが、コピー数を決定するための隠れマルコフモデル(HMM)コーラーを使用するステップを含む、請求項1~11のいずれか1項に記載の方法。
- ステップ(e)における検出するステップが、2という予測倍数性に基づく、請求項1~12のいずれか1項に記載の方法。
- ステップ(e)における検出するステップが、4という予測倍数性に基づく、請求項1~12のいずれか1項に記載の方法。
- 遺伝的変異がステップ(e)において検出される場合、対象のゲノムの一部がロングレンジPCRによって増幅され、マルチプレックスライゲーション依存性プローブ増幅(MLPA)によってアッセイされる、請求項1~14のいずれか1項に記載の方法。
- 遺伝的変異がステップ(e)において検出される場合、目的物の第1の領域の一部がロングレンジPCRによって増幅され、産物またはその部分がサンガーシーケンシングまたはNGSによってシーケンシングされる、請求項1~14のいずれか1項に記載の方法。
- 遺伝的変異がステップ(e)において検出される場合、対象のゲノムDNAは、マルチプレックスライゲーション依存性プローブ増幅(MLPA)によってアッセイされる、請求項1~14のいずれか1項に記載の方法。
- シーケンスリードが、30~50bpまたは100~200bpの長さである、請求項1~17のいずれか1項に記載の方法。
- 目的物の高度に相同な第1の領域および第2の領域が、少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または99%より高いパーセンテージで同一である、請求項1~18のいずれか1項に記載の方法。
- シーケンスリードが、目的物の第1の領域および/または第2の領域内の1つまたは複数のエクソンから得られる、請求項1~19のいずれか1項に記載の方法。
- シーケンスリードが、目的物の第1の領域および/または第2の領域内の1つまたは複数のイントロンから得られる、請求項1~19のいずれか1項に記載の方法。
- シーケンスリードが、目的物の第1の領域および/または第2の領域内の1つまたは複数のエクソンおよびイントロンから得られる、請求項1~19のいずれか1項に記載の方法。
- シーケンスリードが、目的物の第1の領域および/または第2の領域内の1つまたは複数のエクソンおよびイントロンから得られ、イントロンが、エクソンの付近に存在する、請求項1~19のいずれか1項に記載の方法。
- シーケンスリードが、目的物の第1の領域および/または第2の領域と関連した1つまたは複数の臨床的に取り扱うことが可能な領域から得られる、請求項1~19のいずれか1項に記載の方法。
- 目的物の第1の領域が遺伝子を含み、目的物の第2の領域が偽遺伝子を含む、請求項1~24のいずれか1項に記載の方法。
- 目的物の第1の領域が偽遺伝子を含み、目的物の第2の領域が遺伝子を含む、請求項1~24のいずれか1項に記載の方法。
- 目的物の第1の領域が、2つの対立遺伝子を含む、請求項1~24のいずれか1項に記載の方法。
- 目的物の第2の領域が、2つの対立遺伝子を含む、請求項1~24のいずれか1項に記載の方法。
- 遺伝子が、PMS2である、請求項25~28のいずれか一項に記載の方法。
- 偽遺伝子が、PMS2CLである、請求項25~28のいずれか一項に記載の方法。
- 目的物の多数の部位が、対象のゲノムのPMS2のエクソンおよび別の部分のエクソン内に存在する、請求項1~30のいずれか1項に記載の方法。
- 目的物の多数の部位は、PMS2のエクソンおよびPMS2CLのエクソン内に存在する、請求項1~30のいずれか1項に記載の方法。
- 目的物の多数の部位が、PMS2のエクソン11、12、13、14、および/または15ならびにPMS2CLのエクソン2、3、4、5、および/または6内に存在する、請求項1~30のいずれか1項に記載の方法。
- 対象はヒトであり、シーケンスリードはヒト基準ゲノムに対してアラインされる、請求項1~33のいずれか1項に記載の方法。
- コンピュータにより実装される、請求項1~34のいずれか1項に記載の方法。
- 請求項1~35のいずれか1項に記載の方法を実施するためのコンピュータ実行可能命令を含む非一時的なコンピュータ可読記憶媒体。
- (a)1つまたは複数のプロセッサー、
(b)メモリ、および
(c)1つまたは複数のプログラム
を含むシステムであって、1つまたは複数のプログラムが、メモリに記憶され、1つまたは複数のプロセッサーによって実行されるよう構成され、1つまたは複数のプログラムは、請求項1~35のいずれか1項に記載の方法を実行するための命令を含む、前記システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023171957A JP2024001120A (ja) | 2018-07-27 | 2023-10-03 | シーケンスリードの独立したアラインメントおよびペアリングによって高度に相同なシーケンスにおける遺伝的変異を検出するための方法 |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862711454P | 2018-07-27 | 2018-07-27 | |
US62/711,454 | 2018-07-27 | ||
US201862730479P | 2018-09-12 | 2018-09-12 | |
US62/730,479 | 2018-09-12 | ||
PCT/US2019/043678 WO2020023882A1 (en) | 2018-07-27 | 2019-07-26 | Method for detecting genetic variation in highly homologous sequences by independent alignment and pairing of sequence reads |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023171957A Division JP2024001120A (ja) | 2018-07-27 | 2023-10-03 | シーケンスリードの独立したアラインメントおよびペアリングによって高度に相同なシーケンスにおける遺伝的変異を検出するための方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021532826A JP2021532826A (ja) | 2021-12-02 |
JP7361774B2 true JP7361774B2 (ja) | 2023-10-16 |
Family
ID=69181993
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021527023A Active JP7361774B2 (ja) | 2018-07-27 | 2019-07-26 | シーケンスリードの独立したアラインメントおよびペアリングによって高度に相同なシーケンスにおける遺伝的変異を検出するための方法 |
JP2023171957A Pending JP2024001120A (ja) | 2018-07-27 | 2023-10-03 | シーケンスリードの独立したアラインメントおよびペアリングによって高度に相同なシーケンスにおける遺伝的変異を検出するための方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023171957A Pending JP2024001120A (ja) | 2018-07-27 | 2023-10-03 | シーケンスリードの独立したアラインメントおよびペアリングによって高度に相同なシーケンスにおける遺伝的変異を検出するための方法 |
Country Status (4)
Country | Link |
---|---|
US (2) | US20220284985A1 (ja) |
EP (1) | EP3830828A4 (ja) |
JP (2) | JP7361774B2 (ja) |
WO (2) | WO2020023882A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112634988B (zh) * | 2021-01-07 | 2021-10-08 | 内江师范学院 | 基于Python语言的基因变异检测方法及系统 |
US20220245408A1 (en) * | 2021-01-20 | 2022-08-04 | Rutgers, The State University Of New Jersey | Method of Calibration Using Master Calibration Function |
CN117437978A (zh) * | 2023-12-12 | 2024-01-23 | 北京旌准医疗科技有限公司 | 一种二代测序数据的低频基因突变分析方法、装置及其应用 |
CN117497049B (zh) * | 2024-01-03 | 2024-04-19 | 广州迈景基因医学科技有限公司 | 一种snp突变来源的区分方法、系统及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160300014A1 (en) | 2015-04-13 | 2016-10-13 | Invitae Corporation | Methods, systems and processes of identifying genetic variation in highly similar genes |
JP2018500625A (ja) | 2014-10-10 | 2018-01-11 | インヴァイティ コーポレイションInvitae Corporation | シーケンシングリードのde novoアセンブリーの方法、システム、およびプロセス |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2854057B1 (en) * | 2010-05-18 | 2018-03-07 | Natera, Inc. | Methods for non-invasive pre-natal ploidy calling |
US9092401B2 (en) * | 2012-10-31 | 2015-07-28 | Counsyl, Inc. | System and methods for detecting genetic variation |
US20140088942A1 (en) * | 2012-09-27 | 2014-03-27 | Ambry Genetics | Molecular genetic diagnostic system |
WO2014089536A1 (en) * | 2012-12-07 | 2014-06-12 | Invitae Corporation | Multiplex nucleic acid detection methods |
JP2018502602A (ja) * | 2014-12-29 | 2018-02-01 | カウンシル,インコーポレーテッド | 相同性の高い領域において遺伝子型を決定する方法 |
AU2016220135B2 (en) * | 2015-02-17 | 2021-07-29 | Dovetail Genomics Llc | Nucleic acid sequence assembly |
-
2019
- 2019-07-26 WO PCT/US2019/043678 patent/WO2020023882A1/en unknown
- 2019-07-26 JP JP2021527023A patent/JP7361774B2/ja active Active
- 2019-07-26 EP EP19841978.0A patent/EP3830828A4/en active Pending
-
2020
- 2020-01-23 WO PCT/US2020/014739 patent/WO2021021243A1/en active Application Filing
- 2020-01-23 US US17/630,385 patent/US20220284985A1/en active Pending
-
2021
- 2021-01-26 US US17/158,978 patent/US20210225456A1/en active Pending
-
2023
- 2023-10-03 JP JP2023171957A patent/JP2024001120A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018500625A (ja) | 2014-10-10 | 2018-01-11 | インヴァイティ コーポレイションInvitae Corporation | シーケンシングリードのde novoアセンブリーの方法、システム、およびプロセス |
US20160300014A1 (en) | 2015-04-13 | 2016-10-13 | Invitae Corporation | Methods, systems and processes of identifying genetic variation in highly similar genes |
Non-Patent Citations (1)
Title |
---|
Familial Cancer,2017年,Vol. 17,pp.387-394 |
Also Published As
Publication number | Publication date |
---|---|
JP2021532826A (ja) | 2021-12-02 |
EP3830828A1 (en) | 2021-06-09 |
US20220284985A1 (en) | 2022-09-08 |
WO2021021243A1 (en) | 2021-02-04 |
EP3830828A4 (en) | 2022-05-04 |
US20210225456A1 (en) | 2021-07-22 |
WO2020023882A1 (en) | 2020-01-30 |
JP2024001120A (ja) | 2024-01-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6854272B2 (ja) | 遺伝子の変異の非侵襲的な評価のための方法および処理 | |
JP7361774B2 (ja) | シーケンスリードの独立したアラインメントおよびペアリングによって高度に相同なシーケンスにおける遺伝的変異を検出するための方法 | |
JP6227095B2 (ja) | 遺伝的変異の非侵襲的評価のための方法およびプロセス | |
KR102540202B1 (ko) | 유전적 변이의 비침습 평가를 위한 방법 및 프로세스 | |
Meyer et al. | Identifying and mitigating bias in next-generation sequencing methods for chromatin biology | |
Zeng et al. | Aberrant gene expression in humans | |
Tang et al. | Evaluation of bioinformatic programmes for the analysis of variants within splice site consensus regions | |
JP2017099406A (ja) | 実験条件を要因として含める診断プロセス | |
Soukupova et al. | Validation of CZECANCA (CZEch CAncer paNel for Clinical Application) for targeted NGS-based analysis of hereditary cancer syndromes | |
US20170329893A1 (en) | Methods of determining genomic health risk | |
Gould et al. | Detecting clinically actionable variants in the 3′ exons of PMS2 via a reflex workflow based on equivalent hybrid capture of the gene and its pseudogene | |
Yadav et al. | Next-Generation sequencing transforming clinical practice and precision medicine | |
Crockett et al. | Bioinformatics tools in clinical genomics | |
KR102665592B1 (ko) | 유전적 변이의 비침습 평가를 위한 방법 및 프로세스 | |
Hedges | Bioinformatics of Human Genetic Disease Studies | |
Orlando et al. | Current and future trends in diagnostics and treatment | |
WO2019156591A1 (en) | Methods and systems for prediction of frailty background | |
Papenfuss et al. | Bioinformatics Analysis of Sequence Data | |
Uziela | Making microarray and RNA-seq gene expression data comparable | |
Hinchcliffe | Managing Incidental Findings in Exome Sequencing for Research | |
Lyon | Software Considerations for Processing, Analyzing and Interpreting Exome & Genome Sequence Data in Clinical Settings | |
Weistra | Determining differential expression of splice variants in RNA-Seq | |
KR20240068794A (ko) | 유전적 변이의 비침습 평가를 위한 방법 및 프로세스 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220621 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230428 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230518 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230817 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230904 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231003 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7361774 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |