JP2018533143A - ゲノム分析のためのシステムおよび方法 - Google Patents
ゲノム分析のためのシステムおよび方法 Download PDFInfo
- Publication number
- JP2018533143A JP2018533143A JP2018526496A JP2018526496A JP2018533143A JP 2018533143 A JP2018533143 A JP 2018533143A JP 2018526496 A JP2018526496 A JP 2018526496A JP 2018526496 A JP2018526496 A JP 2018526496A JP 2018533143 A JP2018533143 A JP 2018533143A
- Authority
- JP
- Japan
- Prior art keywords
- sequence
- data
- lead
- variant
- aligned
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 353
- 238000004458 analytical method Methods 0.000 title claims description 16
- 238000012163 sequencing technique Methods 0.000 claims abstract description 169
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 32
- 239000002773 nucleotide Substances 0.000 claims description 75
- 125000003729 nucleotide group Chemical group 0.000 claims description 75
- 108020004414 DNA Proteins 0.000 claims description 57
- 241000282414 Homo sapiens Species 0.000 claims description 54
- 150000001413 amino acids Chemical group 0.000 claims description 51
- 150000007523 nucleic acids Chemical group 0.000 claims description 47
- 230000015654 memory Effects 0.000 claims description 43
- 238000003556 assay Methods 0.000 claims description 38
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 33
- 238000013507 mapping Methods 0.000 claims description 33
- 230000002547 anomalous effect Effects 0.000 claims description 29
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 27
- 230000008569 process Effects 0.000 claims description 26
- 230000002596 correlated effect Effects 0.000 claims description 22
- 102000053602 DNA Human genes 0.000 claims description 20
- 235000019506 cigar Nutrition 0.000 claims description 19
- 238000001514 detection method Methods 0.000 claims description 19
- 238000012545 processing Methods 0.000 claims description 19
- 108020004635 Complementary DNA Proteins 0.000 claims description 15
- 238000010804 cDNA synthesis Methods 0.000 claims description 15
- 239000002299 complementary DNA Substances 0.000 claims description 15
- 230000001580 bacterial effect Effects 0.000 claims description 13
- 230000002538 fungal effect Effects 0.000 claims description 13
- 230000003612 virological effect Effects 0.000 claims description 13
- 230000006870 function Effects 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 11
- 238000007906 compression Methods 0.000 claims description 11
- 230000006835 compression Effects 0.000 claims description 11
- 238000004422 calculation algorithm Methods 0.000 claims description 10
- 238000003491 array Methods 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 108010026552 Proteome Proteins 0.000 claims description 8
- 230000002829 reductive effect Effects 0.000 claims description 8
- 241000894007 species Species 0.000 claims description 8
- 102000040650 (ribonucleotides)n+m Human genes 0.000 claims description 6
- 108020004682 Single-Stranded DNA Proteins 0.000 claims description 6
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims description 6
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 claims description 6
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 claims description 6
- 238000002864 sequence alignment Methods 0.000 claims description 5
- 229920000642 polymer Chemical group 0.000 claims description 4
- 229930024421 Adenine Natural products 0.000 claims description 3
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 claims description 3
- 229960000643 adenine Drugs 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 3
- 229940104302 cytosine Drugs 0.000 claims description 3
- 230000001788 irregular Effects 0.000 claims description 3
- 238000010257 thawing Methods 0.000 claims description 3
- 229940113082 thymine Drugs 0.000 claims description 3
- 125000003275 alpha amino acid group Chemical group 0.000 claims 33
- 239000000523 sample Substances 0.000 description 32
- 239000012634 fragment Substances 0.000 description 29
- 238000005516 engineering process Methods 0.000 description 22
- 102000040430 polynucleotide Human genes 0.000 description 21
- 108091033319 polynucleotide Proteins 0.000 description 21
- 239000002157 polynucleotide Substances 0.000 description 21
- 238000007481 next generation sequencing Methods 0.000 description 20
- 102000039446 nucleic acids Human genes 0.000 description 19
- 108020004707 nucleic acids Proteins 0.000 description 19
- 235000001014 amino acid Nutrition 0.000 description 16
- 229940024606 amino acid Drugs 0.000 description 16
- 239000011324 bead Substances 0.000 description 16
- 108700028369 Alleles Proteins 0.000 description 15
- 150000002500 ions Chemical class 0.000 description 15
- 210000004027 cell Anatomy 0.000 description 13
- 238000002360 preparation method Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 11
- 239000002609 medium Substances 0.000 description 11
- 230000035772 mutation Effects 0.000 description 11
- 238000003780 insertion Methods 0.000 description 10
- 230000037431 insertion Effects 0.000 description 10
- 238000012217 deletion Methods 0.000 description 9
- 230000037430 deletion Effects 0.000 description 9
- 108091034117 Oligonucleotide Proteins 0.000 description 8
- 230000000875 corresponding effect Effects 0.000 description 8
- 238000010348 incorporation Methods 0.000 description 8
- 230000008859 change Effects 0.000 description 6
- 210000000349 chromosome Anatomy 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 102100030569 Nuclear receptor corepressor 2 Human genes 0.000 description 5
- 101710153660 Nuclear receptor corepressor 2 Proteins 0.000 description 5
- 238000013459 approach Methods 0.000 description 5
- 239000012472 biological sample Substances 0.000 description 5
- 238000007672 fourth generation sequencing Methods 0.000 description 5
- 238000009396 hybridization Methods 0.000 description 5
- 239000000047 product Substances 0.000 description 5
- 230000002441 reversible effect Effects 0.000 description 5
- 239000004065 semiconductor Substances 0.000 description 5
- 239000007787 solid Substances 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 4
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 4
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 238000003384 imaging method Methods 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 102000004169 proteins and genes Human genes 0.000 description 4
- 238000012175 pyrosequencing Methods 0.000 description 4
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 3
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 3
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 3
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- -1 deoxyribose sugars Chemical class 0.000 description 3
- 239000007850 fluorescent dye Substances 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 108020004999 messenger RNA Proteins 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 125000003835 nucleoside group Chemical group 0.000 description 3
- 102000054765 polymorphisms of proteins Human genes 0.000 description 3
- 235000000346 sugar Nutrition 0.000 description 3
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 125000004429 atom Chemical group 0.000 description 2
- 238000004630 atomic force microscopy Methods 0.000 description 2
- 238000001574 biopsy Methods 0.000 description 2
- 239000011616 biotin Substances 0.000 description 2
- 229960002685 biotin Drugs 0.000 description 2
- 235000020958 biotin Nutrition 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 239000000975 dye Substances 0.000 description 2
- 239000000839 emulsion Substances 0.000 description 2
- 238000000799 fluorescence microscopy Methods 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 125000000623 heterocyclic group Chemical group 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 238000010899 nucleation Methods 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 239000002777 nucleoside Substances 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 210000002381 plasma Anatomy 0.000 description 2
- 235000018102 proteins Nutrition 0.000 description 2
- 150000003212 purines Chemical class 0.000 description 2
- 150000003230 pyrimidines Chemical class 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 2
- 238000007480 sanger sequencing Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000007841 sequencing by ligation Methods 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 210000004243 sweat Anatomy 0.000 description 2
- 210000001138 tear Anatomy 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000004627 transmission electron microscopy Methods 0.000 description 2
- 210000002700 urine Anatomy 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 206010003445 Ascites Diseases 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- IGXWBGJHJZYPQS-SSDOTTSWSA-N D-Luciferin Chemical compound OC(=O)[C@H]1CSC(C=2SC3=CC=C(O)C=C3N=2)=N1 IGXWBGJHJZYPQS-SSDOTTSWSA-N 0.000 description 1
- 230000007067 DNA methylation Effects 0.000 description 1
- 230000008836 DNA modification Effects 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- CYCGRDQQIOGCKX-UHFFFAOYSA-N Dehydro-luciferin Natural products OC(=O)C1=CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 CYCGRDQQIOGCKX-UHFFFAOYSA-N 0.000 description 1
- MYMOFIZGZYHOMD-UHFFFAOYSA-N Dioxygen Chemical compound O=O MYMOFIZGZYHOMD-UHFFFAOYSA-N 0.000 description 1
- BJGNCJDXODQBOB-UHFFFAOYSA-N Fivefly Luciferin Natural products OC(=O)C1CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 BJGNCJDXODQBOB-UHFFFAOYSA-N 0.000 description 1
- 238000006424 Flood reaction Methods 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- DDWFXDSYGUXRAY-UHFFFAOYSA-N Luciferin Natural products CCc1c(C)c(CC2NC(=O)C(=C2C=C)C)[nH]c1Cc3[nH]c4C(=C5/NC(CC(=O)O)C(C)C5CC(=O)O)CC(=O)c4c3C DDWFXDSYGUXRAY-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 241001312372 Mycobacterium canettii Species 0.000 description 1
- 241000187479 Mycobacterium tuberculosis Species 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 208000020584 Polyploidy Diseases 0.000 description 1
- 206010036790 Productive cough Diseases 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 102000004523 Sulfate Adenylyltransferase Human genes 0.000 description 1
- 108010022348 Sulfate adenylyltransferase Proteins 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- RTAQQCXQSZGOHL-UHFFFAOYSA-N Titanium Chemical compound [Ti] RTAQQCXQSZGOHL-UHFFFAOYSA-N 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- IRLPACMLTUPBCL-FCIPNVEPSA-N adenosine-5'-phosphosulfate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@@H](CO[P@](O)(=O)OS(O)(=O)=O)[C@H](O)[C@H]1O IRLPACMLTUPBCL-FCIPNVEPSA-N 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 208000036878 aneuploidy Diseases 0.000 description 1
- 231100001075 aneuploidy Toxicity 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 230000003851 biochemical process Effects 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 239000006143 cell culture medium Substances 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 210000003850 cellular structure Anatomy 0.000 description 1
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 239000003636 conditioned culture medium Substances 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 150000002170 ethers Chemical class 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000005669 field effect Effects 0.000 description 1
- 239000010408 film Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- LIYGYAHYXQDGEP-UHFFFAOYSA-N firefly oxyluciferin Natural products Oc1csc(n1)-c1nc2ccc(O)cc2s1 LIYGYAHYXQDGEP-UHFFFAOYSA-N 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 238000003205 genotyping method Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 125000005843 halogen group Chemical group 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 229920001519 homopolymer Polymers 0.000 description 1
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000012606 in vitro cell culture Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000008774 maternal effect Effects 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 230000005257 nucleotidylation Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- JJVOROULKOMTKG-UHFFFAOYSA-N oxidized Photinus luciferin Chemical compound S1C2=CC(O)=CC=C2N=C1C1=NC(=O)CS1 JJVOROULKOMTKG-UHFFFAOYSA-N 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000008775 paternal effect Effects 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 229920001690 polydopamine Polymers 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 108090000765 processed proteins & peptides Chemical group 0.000 description 1
- 238000010223 real-time analysis Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 150000003291 riboses Chemical class 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 210000003802 sputum Anatomy 0.000 description 1
- 208000024794 sputum Diseases 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 210000001179 synovial fluid Anatomy 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
- 239000010936 titanium Substances 0.000 description 1
- 229910052719 titanium Inorganic materials 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
- 239000002569 water oil cream Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/10—Gene or protein expression profiling; Expression-ratio estimation or normalisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/20—Sequence assembly
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/10—Signal processing, e.g. from mass spectrometry [MS] or from PCR
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B45/00—ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
- G16B50/30—Data warehousing; Computing architectures
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Databases & Information Systems (AREA)
- Organic Chemistry (AREA)
- Bioethics (AREA)
- Genetics & Genomics (AREA)
- Public Health (AREA)
- Evolutionary Computation (AREA)
- Epidemiology (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Physiology (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【選択図】図1
Description
本出願は、2015年8月6日に出願された米国仮特許出願第62/201,923号の利益を主張し、その出願の全体は参照として本明細書に援用される。
(技術分野)
本出願は、ゲノム分析のためのシステムおよび方法に関する。
当業者によるこれらの用語の理解に加えて、以下の用語を以下で議論してこの明細書において使用されるような用語の意味を例証する。本明細書および請求項において使用される場合、単数形「1つの(a)」、「1つの(an)」および「その(the)」には、文脈が明確に指示しない限り複数形の相応が含まれ得る。例えば、「細胞」という用語には複数の細胞が含まれ、それらにはその混合物が含まれる。
多くの次世代シーケンシング技法は短いリード配列を生成し、次いでそれはアライメントされ、より長い配列情報へとアセンブルすることができる。短いリード配列は、複数の良好な候補アライメントロケーションがある場合に、正確にアライメントさせるのが難しくなる可能性がある。短いリード配列はサンプル中に存在するバリエーションがある場合に、正確にアライメントさせるのが難しくなる可能性がある。本明細書において、これらの問題に対処する方法が提供される。これらの方法において、リードのペアのための最も良好なアライメントは、ペアにおける個別のリードのアライメントクオリティおよびペアのアライメントのフィーチャ(ペアにおけるアライメントされたリードの間の距離およびペアにおけるアライメントされたリードの相対的方向性等)を考慮することで見出すことができる。いくつかの実施形態において、リードのペアにおけるこれらのアライメントフィーチャを観察する確率は、シーケンシング技術およびサンプルの性質の知識に基づいて推測することができ、ペアのアライメントのスコアリングに使用することができる。
アライメントされるか、アセンブルされるか、またはそうでなければ本開示の技法を使用してプロセシングされる、シーケンシング情報は、次世代シーケンシング(NGS)プラットフォームからのものとすることができる。本開示の技法は、異なるソースプラットフォーム、異なるファイルフォーマット、異なるリード長、異なる正確性、異なるクオリティスコア、異なる誤差率、および異なる優勢タイプまたは誤差源のシーケンシング情報により、使用することができる。
本明細書において開示される方法およびシステムは、暗号化を用いることもできる。暗号化は、ワンタイムパッド暗号を暗号化のために使用して遂行することができる。暗号化方法の追加の非限定的な例は、暗号論的擬似乱数生成器、情報理論的に安全なアルゴリズム、整数因数分解アルゴリズム、素数判定、アドバンスドアクセスコンテンツシステム、対称鍵アルゴリズム、破壊暗号化アルゴリズム(broken cryptography algorithms)、暗号解読アルゴリズム、および暗号学的ハッシュ関数を含むことができる。さらに、暗号化方法は、公開鍵、秘密鍵および/またはパスフレーズ(安全な電子メール転送において使用されるものに類似する)を利用する鍵ペア概念を利用することができる。例えば、暗号化分析デバイスは意図される受理者デバイスの公開鍵を有することができる。同様に、意図される受理者デバイスは暗号化分析デバイスの公開鍵を有する必要がある。また、鍵付ハッシュメッセージ認証コード(HMAC)を使用して、秘密の暗号化鍵と組み合わせて暗号学的ハッシュ関数を用いてメッセージ認証コードを生成することができる。このメッセージ認証コードを使用して、データ保全性を検証することに加えて、伝送された配列またはデータを認証することの両方ができる。暗号鍵が配列データの送信および受理のために使用される場合に、鍵は、例えば無作為に生成することができ、十分なエントロピーを有することができる。エントロピーは予測不能のコンピューターオペレーションに由来することができる。例えば、ディスクドライブヘッドの動きである。
コンピューターシステムは、非一時的コンピューター可読媒体中に含有される命令を使用して、本明細書において開示される方法を実行することができる。非一時的コンピューター可読媒体は、いくつかの事例において、一時的な伝搬シグナル以外のコンピューター可読媒体をすべて含むことができる。
Claims (216)
- シーケンシングデバイスによって生成される生の遺伝子配列データをアライメントさせる方法であって、
(a)シーケンシングデバイスによって生成される生の遺伝子配列データを得ることと;
(b)前記シーケンシングデバイスによって生成される前記生の遺伝子配列データを、代替パスを含むゲノムバリエーションマップ上のロケーションへマッピングすることと;
(c)前記バリエーションマップ上のそのロケーションに従って、前記シーケンシングデバイスによって生成される前記生の遺伝子配列データをアライメントさせることと、
を含む、方法。 - 前記マッピングが、グラフアライメントによって遂行される、請求項1に記載の方法。
- 前記グラフアライメントが、少なくとも1つのグラフを使用する、請求項2に記載の方法。
- 前記マッピングが、ギャップアライメントを使用して遂行される、請求項1に記載の方法。
- 前記マッピングが、セミギャップアライメントを使用して遂行される、請求項1に記載の方法。
- 前記代替パスの特定のパスが、前記マッピングの間にマッピングされる回数を蓄積することを更に含む、請求項1に記載の方法。
- 前記生の遺伝子配列データが1又は2以上のリードペアを含み、リードペアのサブセットについて可能なアライメントが正確である確率が、(a)前記リードペアの個別のリードが正しくアライメントされる確率、および(b)前記ペアにおける前記アライメントされたリードの間の距離および前記ペアにおける両方のリードのアライメント方向性を含む、前記リードペアのアライメントフィーチャの観察についての推定確率の関数として計算される、請求項1に記載の方法。
- 前記生の遺伝子配列データが1又は2以上のリードペアを含み、リードペアのサブセットについて可能なアライメントが正確である確率が、(a)前記リードペアの個別のリードが正しくアライメントされる確率、(b)前記ペアにおける前記アライメントされたリードの間の距離および前記ペアにおける両方のリードのアライメント方向性を含む、前記ペアのアライメントフィーチャの観察についての推定確率、および(c)前記サブセットにおける1又は2以上の他のリードペアの可能なアライメントフィーチャの観察についての推定確率の関数として計算される、請求項1に記載の方法。
- リードのサブセットについて可能なアライメントが正確である確率が、(a)前記リードペアの個別のリードが正しくアライメントされる確率、および(b)前記サブセットにおける1又は2以上の他のリードの可能なアライメントフィーチャの観察についての推定確率の関数として計算される、請求項1に記載の方法。
- 新規バリアントを同定する方法であって、
(a)複数の配列リードを得ることと;
(b)代替パスによって表わされる既知のバリアントを含むグラフリファレンスに対して前記複数の配列リードをアライメントさせることと;
(c)1又は2以上の代替パスに対して変則的にアライメントする前記複数の配列リードのサブセットを使用して、新規バリアントを同定することと、
を含む、方法。 - 前記新規バリアントが、構造バリアントを含む、請求項10に記載の方法。
- 新規バリアントの同定に使用される前記複数の配列リードの前記サブセットが、前記グラフリファレンス中のすべての代替パスへ変則的にアライメントする、請求項10に記載の方法。
- 前記配列リードがリードペアを含み、変則的なアライメントが、大多数のアライメントされたリードペアのものとは異なる、アライメントされたリードペア方向性を含む、請求項10に記載の方法。
- 前記配列リードがリードペアを含み、変則的なアライメントが、大多数のアライメントされたリードペアよりも有意に小さいかまたは大きい、アライメントされたリードペアインサート長を含む、請求項10に記載の方法。
- 前記インサート長が、前記アライメントされたリードのサブセットの前記インサート長の中央値よりも10%を超えて大きいかまたは小さい、請求項14に記載の方法。
- 前記インサート長が、前記アライメントされたリードのサブセットの前記インサート長の99番目のパーセンタイル値よりも大きいか、または1番目のパーセンタイル値よりも小さい、請求項14に記載の方法。
- 前記インサート長が、いくつかのユーザー指定値よりも大きいかまたは小さい、請求項14に記載の方法。
- 前記配列リードがリードペアを含み、変則的なアライメントが、1つのリードがアライメントされ、1つのリードがアライメントされないリードペアを含む、請求項10に記載の方法。
- 変則的なアライメントが、リードの一部がクリップされたリードを含む、請求項10に記載の方法。
- クリップされた前記リードの部分が10%よりも大きい、請求項19に記載の方法。
- 前記同定された新規のバリアントが、標的適用について以前に文書化されないバリアントである、請求項10に記載の方法。
- 前記同定された新規バリアントが、前記グラフリファレンス中に存在しないバリアントである、請求項10に記載の方法。
- 前記同定された新規バリアントのサブセットが、前記グラフリファレンスへ自動的に追加されて更新されたグラフリファレンスを生じ、前記更新されたグラフリファレンスが別のアライメントのために使用される、請求項10に記載の方法。
- 前記グラフリファレンス中の代替パスへアライメントするリード数をカウントすること、および前記グラフリファレンス中の代替パスへアライメントするリードの前記数を使用して前記既知のバリアントを同定することを更に含む、請求項23に記載の方法。
- 前記同定された新規バリアントが構造バリアントを含む、請求項23に記載の方法。
- 前記既知のバリアントが標的適用のために以前に文書化されている、請求項23に記載の方法。
- 前記新規バリアントが、標的適用のために以前に文書化されていない、請求項23に記載の方法。
- 前記既知のバリアントが、前記グラフリファレンス中に存在するバリアントである、請求項23に記載の方法。
- 前記新規バリアントが、前記グラフリファレンス中に存在しないバリアントである、請求項23に記載の方法。
- 変則的なアライメントが、
a)大多数のアライメントされたリードペアのものとは異なる、アライメントされたリードペア方向性;
b)大多数のアライメントされたリードペアよりも有意に小さいかまたは大きい、アライメントされたリードペアインサート長;
c)1つのリードがアライメントされ、1つのリードがアライメントされない、リードペア;
d)リードの一部がクリップされたリード;
e)インサート長が、アライメントされたリードペアのサブセットのインサート長の99番目のパーセンタイル値よりも大きいか、または1番目のパーセンタイル値よりも小さい、リードペア;および
f)リードが異なるリファレンス配列へアライメントする、リードペア、
のうちの1又は2以上を含む、請求項23に記載の方法。 - あらかじめ定義されたクオリティ尺度または検出確実性尺度を満たす前記同定された新規バリアントのサブセットを同定すること、および前記サブセットを前記グラフリファレンスへ追加することを更に含む、請求項23に記載の方法。
- あらかじめ定義されたサイズ範囲内である前記同定された新規バリアントのサブセットを同定すること、および前記サブセットを前記グラフリファレンスへ追加することを更に含む、請求項23に記載の方法。
- ゲノムのあらかじめ定義された領域内に位置する前記同定された新規バリアントのサブセットを同定すること、および前記サブセットを前記グラフリファレンスへ追加することを更に含む、請求項23に記載の方法。
- あらかじめ定義された相対値または絶対値を超える頻度を備えた配列リードのうちの1又は2以上において検出される前記同定された新規バリアントのサブセットを同定すること、および前記サブセットを前記グラフリファレンスへ追加することを更に含む、請求23に記載の方法。
- 前記更新されたグラフリファレンスが、後続のアライメントおよびバリアント検出のために使用される、請求項23に記載の方法。
- 前記グラフリファレンスが、2つ以上のアライメントおよびバリアント検出において使用され漸進的に更新される、請求項23に記載の方法。
- 前記グラフリファレンスが、同じコンピューター上で2つ以上のアライメントおよびバリアント検出において使用され漸進的に更新される、請求項23に記載の方法。
- 前記グラフリファレンスが、1又は2以上のコンピューターの中で共有および更新される、請求項23に記載の方法。
- 前記グラフリファレンスが中央レポジトリ中で保存および更新され、1又は2以上のコンピューターの中で共有される、請求項23に記載の方法。
- 前記既知のバリアントまたは前記新規バリアントが種内バリアントを含む、請求項10に記載の方法。
- 前記既知のバリアントまたは前記新規バリアントが種間バリアントを含む、請求項10に記載の方法。
- 配列バリアントを検出する方法であって、
a)複数の配列リードを得ることと;
b)代替パスによって表わされた既知のバリアントを含むグラフリファレンスに対して前記複数の配列リードのサブセットをアライメントさせることを含むプロセスによって、アライメントされたリードのバッチを生成することと;
c)アライメントされたリードの前記バッチ内の1又は2以上の変則的にアライメントされたリードを同定することと;
d)前記1又は2以上の変則的にアライメントされたリードを使用して新規構造バリアントを同定することと、
を含む、該方法。 - 前記グラフリファレンス中の代替パスへアライメントする、アライメントされたリードの前記バッチ中のリードの数をカウントすること、およびリードの前記数を使用して既知のバリアントを同定することを更に含む、請求項42に記載の方法。
- 少なくとも1つの追加のバッチのためにステップa)〜d)を遂行することを更に含む、請求項42に記載の方法。
- 少なくとも1つの追加のバッチのためにステップa)〜d)を遂行することを更に含む、請求項43に記載の方法。
- 前記既知のバリアントが標的適用のために以前に文書化されている、請求項42に記載の方法。
- 前記新規構造バリアントが標的適用のために以前に文書化されていない、請求項42に記載の方法。
- 前記既知のバリアントが前記グラフリファレンス中に存在するバリアントである、請求項42に記載の方法。
- 前記新規構造バリアントがグラフリファレンス中に存在しないバリアントである、請求項42に記載の方法。
- 前記バッチからの前記変則的にアライメントされたリードのサブセットがファイルへ書き込まれ、続いて、前記新規構造バリアントの同定に使用される、請求項42に記載の方法。
- 前記バッチからの前記変則的にアライメントされたリードのサブセットをコンピュータープログラムへ渡して、リードの前記サブセットをファイルへ書き込むことなしに、前記新規構造バリアントを同定する、請求項42に記載の方法。
- 変則的なアライメントが、
a)大多数のアライメントされたリードペアのものとは異なる、アライメントされたリードペア方向性;
b)大多数のアライメントされたリードペアよりも有意に小さいかまたは大きい、アライメントされたリードペアインサート長;
c)1つのリードがアライメントされ、1つのリードがアライメントされない、リードペア;
d)リードの一部がクリップされたリード;
e)インサート長が、アライメントされたリードペアのサブセットのインサート長の99番目のパーセンタイル値よりも大きいか、または1番目のパーセンタイル値よりも小さい、リードペア;および
f)リードが異なるリファレンス配列へアライメントする、リードペア、
のうちの1又は2以上を含む、請求項42に記載の方法。 - 追加のフィーチャを使用して前記グラフリファレンス中の代替パスへアライメントするリードの追加のフィーチャをトラッキングして、既知のバリアントを同定することを更に含む、請求項43に記載の方法。
- 前記複数の配列リードの10%未満が、ファイルの2回以上からのリードである、請求項42に記載の方法。
- 前記既知のバリアントまたは前記新規構造バリアントが種内バリアントを含む、請求項42に記載の方法。
- 直線リファレンスがアライメントされたリードのために使用されたフォーマットとコンパチブルなフォーマットで、配列リードのグラフリファレンスアライメントを簡潔に特徴づけるシステムであって、
a)リードのグラフリファレンス配列へのグラフアライメントを受理するように構成され、前記グラフリファレンス配列が、リファレンス配列に対するバリアントパスによって表わされる既知のバリアントを含む、受理モジュールと;
b)前記リファレンス配列の座標に対するそのアライメントの開始、および前記リードがバリアントパスへアライメントする場合に、前記バリアントパスの識別番号を表わすリードタグの報告によって、前記リードの前記グラフアライメントを特徴づける、報告モジュールと、
を含む、システム。 - 前記報告モジュールが、前記リードがバリアントパスへアライメントする場合に設定されるリードフラグを更に報告する、請求項56に記載のシステム。
- b)の前記リードタグが提供される場合、前記報告モジュールが、前記バリアントパスの座標に対してアライメントされたリードの前記開始を指示する第2のリードタグを更に出力する、請求項56に記載のシステム。
- b)の前記リードタグが提供される場合、前記報告モジュールが、前記バリアントパスの座標に対してアライメントされたリードの前記開始および終了を指示する第2のリードタグを更に出力する、請求項56に記載のシステム。
- b)の前記リードタグが提供される場合、前記報告モジュールが、前記バリアントパスに対する文字列アライメントスコアを含む第2のリードタグを更に出力する、請求項56に記載のシステム。
- b)の前記リードタグが提供される場合、前記報告モジュールが、どれだけのリードが前記バリアントパスへマッピングされるかを含む第2のリードタグを更に出力する、請求項56に記載のシステム。
- 前記報告モジュールが、どれだけのリードが前記リファレンス配列へマッピングされるかを含む第2のリードタグを更に出力する、請求項56に記載のシステム。
- 前記報告モジュールが、前記リファレンス配列へマッピングされるリードを含む第2のリードタグを更に出力する、請求項56に記載のシステム。
- 前記報告モジュールが、バリアントパスへ最初にマッピングされるリードを指示する第2のリードタグを更に出力する、請求項56に記載のシステム。
- 前記アライメントの前記開始が、前記リファレンス配列の上への射影を指示する、請求項56に記載のシステム。
- 配列リードペアの変則的なグラフアライメントを決定するシステムであって、
a)直線リファレンスパスを含むグラフリファレンスへアライメントされたリードペアを受理し、前記リードペアのうちの少なくとも1つのリードが、前記アライメントのうちのいくつかまたはすべてを代替パス上に有する、受理モジュールと;
b)前記少なくとも1つのリードを前記直線リファレンス座標系へ変換し、変換操作情報をメタデータとして保存する、変換モジュールと;
c)前記リードペアにおける、前記変換されたリード、前記メタデータ、および第2のリードを、インプットとして採用し、前記リードペアへの特異的な特性を計算する、計算モジュールと;
d)前記特性を採用し、前記グラフリファレンスへ変則的にアライメントされるかまたは否かとして前記ペアを分類する、判断モジュールと、
を含む、システム。 - 前記特性が、前記直線リファレンスパスに対するインサート長を含む、請求項66に記載のシステム。
- 前記特性が、前記直線リファレンスパスに対するCIGARスコアを含む、請求項66に記載のシステム。
- 前記特性が、前記直線リファレンスパスに対するアライメント位置を含む、請求項66に記載のシステム。
- 前記アライメント報告が下流の分析ツールとコンパチブルである、請求項66に記載のシステム。
- 少なくとも1つのフェーズ化された代替配列パスを生成する方法であって、
a)リファレンス配列を得ることと;
b)代替リファレンス配列上の相関する遺伝子座を検索することと;
c)前記相関する遺伝子座を含む、少なくとも1つのフェーズ化された代替配列パスを生成することと、
を含む、該方法。 - 前記相関する遺伝子座が2つ以上の別個の起源からである、請求項71に記載の方法。
- 前記相関する遺伝子座が、前記リファレンス配列上の2つ以上のロケーションへマッピングされる、異なる配列のセットを含む、請求項71に記載の方法。
- 前記異なる配列のセットのうちの少なくとも2つがフェーズ化される、請求項73に記載の方法。
- 前記異なる配列のフェーズ化されたセットをインデックス化することを更に含む、請求項74に記載の方法。
- リファレンス配列を代替パスによりインデックス化する方法であって、
(a)リファレンス配列を受理することと;
(b)前記リファレンス配列へマッピングされる代替配列を受理することと;
(c)前記リファレンス配列および前記代替配列のk−merを2時間以下で生成することと;
(d)前記k−merを使用して、代替パスにより前記リファレンス配列をインデックス化することと、
を含む、方法。 - 前記リファレンス配列が核酸配列である、請求項76に記載の方法。
- 前記核酸配列がゲノム配列である、請求項77に記載の方法。
- 前記核酸配列が、二本鎖DNA、一本鎖DNA、DNA/RNAハイブリッド、一本鎖RNA、二本鎖RNA、または相補的DNA(cDNA)を含む、請求項77に記載の方法。
- 前記核酸配列が合成配列である、請求項77に記載の方法。
- 前記ゲノム配列がヒトゲノムからである、請求項78に記載の方法。
- 前記ゲノム配列が非ヒトゲノムからである、請求項78に記載の方法。
- 前記非ヒトゲノムが、細菌ゲノム、ウイルスゲノム、真菌ゲノム、原生動物ゲノム、および植物ゲノムからなる群から選択される、請求項82に記載の方法。
- 前記リファレンス配列がアミノ酸配列である、請求項76に記載の方法。
- 前記アミノ酸配列が既知の配列である、請求項87に記載の方法。
- 前記アミノ酸配列が機能性配列である、請求項88に記載の方法。
- 前記アミノ酸配列が合成配列である、請求項87に記載の方法。
- 前記アミノ酸配列がヒトである、請求項87に記載の方法。
- 前記アミノ酸配列が非ヒトである、請求項87に記載の方法。
- 前記非ヒトアミノ酸配列が、細菌配列、ウイルス配列、真菌配列、原生動物配列、および植物配列からなる群から選択される、請求項87に記載の方法。
- 前記代替パスが未知のアミノ酸配列を含む、請求項76に記載の方法。
- 前記生成が、直線リファレンス座標系を使用して、前記k−merを直接インデックス化する、請求項76に記載の方法。
- 前記生成が、ノードID、エッジ、またはパスをアサインすることを包含しない、請求項76に記載の方法。
- リファレンス配列を代替パスによりインデックス化する方法であって、
(a)リファレンス配列を受理することと;
(b)前記リファレンス配列へマッピングされる代替配列を受理することと;
(c)前記リファレンス配列および前記代替配列のインデックス化された複数のk−merを生成することであって、前記インデックス化された複数のk−merが80ギガバイト以下のサイズである、生成することと;
(d)前記k−merを使用して、代替パスにより前記リファレンス配列をインデックス化することと、
を含む、方法。 - コンピューター空間が、ディスク、ram、またはアドレス空間のうちの1又は2以上から選択される、請求項94に記載の方法。
- 前記リファレンス配列が核酸配列である、請求項94に記載の方法。
- 前記核酸配列がゲノム配列である、請求項96に記載の方法。
- 前記核酸配列が、二本鎖DNA、一本鎖DNA、DNA/RNAハイブリッド、一本鎖RNA、二本鎖RNA、または相補的DNA(cDNA)を含む、請求項96に記載の方法。
- 前記核酸配列が合成配列である、請求項96に記載の方法。
- 前記ゲノム配列がヒトゲノムからである、請求項97に記載の方法。
- 前記ゲノム配列が非ヒトゲノムからである、請求項97に記載の方法。
- 前記非ヒトゲノムが、細菌ゲノム、ウイルスゲノム、真菌ゲノム、原生動物ゲノム、および植物ゲノムからなる群から選択される、請求項101に記載の方法。
- 前記リファレンス配列がアミノ酸配列である、請求項94に記載の方法。
- 前記アミノ酸配列が既知の配列である、請求項103に記載の方法。
- 前記アミノ酸配列が機能性配列である、請求項104に記載の方法。
- 前記アミノ酸配列が合成配列である、請求項103に記載の方法。
- 前記アミノ酸配列がヒトである、請求項103に記載の方法。
- 前記アミノ酸配列が非ヒトである、請求項103に記載の方法。
- 前記非ヒトアミノ酸配列が、細菌配列、ウイルス配列、真菌配列、原生動物配列、および植物配列からなる群から選択される、請求項103に記載の方法。
- 前記生成ステップが、直線リファレンス座標系を直接使用すること、および代替配列の前記k−merが前記直線座標系中に現われるように代替配列の前記k−merを直接インデックス化することによって遂行される、請求項94に記載の方法。
- 前記生成ステップが、ノードID、エッジ、またはパスをアサインすることを含まない、請求項110に記載の方法。
- リファレンス配列中のk−merのインデックスのクエリを、代替パスにより実行する方法であって、
(a)リファレンス配列からの複数のk−merを含むインデックスを、代替パスにより検索することと;
(b)k−merを備えた前記インデックスのクエリを、1計算スレッドあたり毎秒69,000以上のk−merの率で、実行することと
を含む、該方法。 - 前記クエリが、1計算スレッドあたり毎秒345,000以上のk−merの率で複数の計算スレッド上で遂行される、請求項112に記載の方法。
- 前記計算スレッドの数が4より大きい、請求項113に記載の方法。
- 前記クエリが、1計算コアあたり毎秒355,000以上のk−merの率で複数の計算コア上で遂行される、請求項112に記載の方法。
- プロセッサ作業のうちの95%を超えるものが、インデックスのクエリ専用である、請求項112に記載の方法。
- プロセッサ作業が、インデックスのクエリに単独で専用の作業である、請求項113に記載の方法。
- 前記プロセッサ作業が、カーネルタスク、メモリスワップ、またはI/Oからなる群から選択される1又は2以上のタスクを含まない、請求項113に記載の方法。
- 前記k−merが少なくとも20の長さである、請求項112に記載の方法。
- 前記k−merが少なくとも32の長さである、請求項112に記載の方法。
- 配列を比較する方法であって、
(a)シーケンサーがシーケンシングアッセイを遂行している間に、前記該シーケンサーからのリードを検索することと;
(b)前記シーケンサーが前記シーケンシングアッセイを遂行している間に、前記リードと配列とを比較することと;
(c)特異的な遺伝子座が前記リード中にあるかどうかを決定することと、
を含む、方法。 - 前記特異的な遺伝子座の出現のカウントを蓄積することを更に含む、請求項121に記載の方法。
- 代替配列を有するリファレンス配列中の遺伝子座をフェーズ化する方法であって、
(a)各々が遺伝子座を含む配列中の複数の代替パスの出現の数を検索することと;
(b)前記複数の代替パスについての出現の前記数に基づいて、異なる代替パスからの遺伝子座を共通のグループへとグループ化することと;
(c)共通のグループ化に基づいて、前記遺伝子座をフェーズ化することと、
を含む、該方法。 - 配列を比較する方法であって、
(a)シーケンサーがシーケンシングアッセイを遂行している間に、前記シーケンサーからのリードを検索することと;
(b)前記シーケンサーが前記シーケンシングアッセイを遂行している間に、前記リードを暗号化することと;
(c)前記リードの解読なしに、前記リードをリファレンス配列と比較することと、
を含む、方法。 - 前記リファレンス配列が配列バリエーションマップである、請求項124に記載の方法。
- 前記リファレンス配列がリファレンス核酸配列である、請求項124に記載の方法。
- 前記核酸配列がゲノム配列である、請求項126に記載の方法。
- 前記核酸配列が、二本鎖DNA、一本鎖DNA、DNA/RNAハイブリッド、一本鎖RNA、二本鎖RNA、または相補的DNA(cDNA)を含む、請求項126に記載の方法。
- 前記核酸配列が合成配列である、請求項126に記載の方法。
- 前記ゲノム配列がヒトゲノムからである、請求項127に記載の方法。
- 前記ゲノム配列が非ヒトゲノムからである、請求項127に記載の方法。
- 前記非ヒトゲノムが、細菌ゲノム、ウイルスゲノム、真菌ゲノム、原生動物ゲノム、および植物ゲノムからなる群から選択される、請求項131に記載の方法。
- 前記リファレンス配列がアミノ酸配列である、請求項136に記載の方法。
- 前記アミノ酸配列が既知の配列である、請求項133に記載の方法。
- 前記アミノ酸配列が機能性配列である、請求項134に記載の方法。
- 前記アミノ酸配列が合成配列である、請求項133に記載の方法。
- 前記アミノ酸配列がヒトである、請求項133に記載の方法。
- 前記アミノ酸配列が非ヒトである、請求項133に記載の方法。
- 前記非ヒトアミノ酸配列が、細菌配列、ウイルス配列、真菌配列、原生動物配列、および植物配列からなる群から選択される、請求項138に記載の方法。
- 配列を比較する方法であって、
(a)シーケンサーがシーケンシングアッセイを遂行している間に、前記シーケンサーからのリードを検索することと;
(b)前記シーケンサーが前記シーケンシングアッセイを遂行している間に、前記リードを暗号化することと;
(c)前記暗号化されたリードをプロセシングデバイスへ伝送することと、
を含む、方法。 - 前記暗号化されたリードを解読することを更に含む、請求項140に記載の方法。
- 前記シーケンシングアッセイが進行中である間に、前記リードをリファレンス配列と比較することを更に含む、請求項141に記載の方法。
- 前記暗号化されたリードに関係する解読鍵を伝送することを更に含む、請求項140に記載の方法。
- 配列を比較する方法であって、
(a)シーケンサーがシーケンシングアッセイを遂行している間に、前記シーケンサーからのリードを検索することと;
(b)前記シーケンサーが前記シーケンシングアッセイを遂行している間に、プロセシングデバイス上の前記リードを圧縮することと;
(c)前記シーケンサーが前記シーケンシングアッセイを遂行している間に、前記リードを解凍することと;
(d)前記シーケンサーが前記シーケンシングアッセイを遂行している間に、前記リードをリファレンス配列へ比較することと、
を含む、方法。 - 既知のバリアントをコールする方法であって、
(a)リードを検索することと;
(b)前記リードからk−merプロファイルを生成することと;
(c)前記k−merプロファイルのクエリを、リファレンス配列からのk−merプロファイルのインデックスに対して、代替パスにより実行して、既知のバリアントをコールすることと
を含む、該方法。 - 前記既知のバリアントが、1コアあたり毎秒10のバリアントコール以上の率で、少なくとも単一のコアを使用してコールされる、請求項145に記載の方法。
- シーケンシングデータの圧縮のためのシステムであって、
(a)シーケンシングデータの受理のための、受理モジュールと;
(b)前記シーケンシングデータの保存のための、メモリユニットと;
(c)前記メモリおよびその上に保存された前記シーケンシングデータへのアクセスを有し、前記シーケンシングデータのうちのいくつかまたはすべてをセーブするように構成された、エンコーディングモジュールと、
を含む、システム。 - 前記シーケンシングデータが、前記受理したシーケンシングデータの90%以上のレベルへ圧縮される、請求項147に記載のシステム。
- 前記シーケンシングデータが、配列識別子、塩基コールデータ、コメントライン、および該塩基コールデータについてのクオリティ値のうちの1又は2以上から選択されるフィールドを含む、請求項147に記載のシステム。
- 前記エンコーディングモジュールが、前記シーケンシングデータ中の塩基コールデータを、前記シーケンシングデータの残りから分離する、請求項149に記載のシステム。
- 前記塩基コールデータ中のヌクレオチド塩基が、アデニン、チミン、グアニン、シトシン、および決定されなかった塩基からなる群から選択されるヌクレオチド塩基と関連する、請求項150に記載のシステム。
- 決定されなかった塩基について、前記エンコーディングモジュールが、塩基コールデータを前記シーケンシングデータ中の前記シーケンシングデータの残りから分離せず、前記決定されなかった塩基と関連するリードをエンコードする、請求項147に記載のシステム。
- 前記決定されなかった塩基と関連するリードが、未分離リードとして圧縮される、請求項152に記載のシステム。
- 決定されなかった塩基を備えたリードの前記ロケーションがセーブされる、請求項147に記載のシステム。
- 決定されなかった塩基を備えたすべてのリードがセーブされる、請求項147に記載のシステム。
- 前記決定されなかった塩基と関連する前記リードが長さで256塩基未満であり、前記決定されなかった塩基のロケーションは1バイト未満でセーブされる、請求項152に記載のシステム。
- 前記決定されなかった塩基と関連する前記リードが長さで65536塩基未満であり、前記決定されなかった塩基のロケーションは2バイト未満でセーブされる、請求項152に記載のシステム。
- 前記エンコーディングモジュールが、差分エンコーディングを使用して情報をセーブする、請求項147に記載のシステム。
- 前記エンコーディングモジュールが、ヌクレオチドベースのデータ上で塩基−4エンコーディングを遂行する、請求項147に記載のシステム。
- 前記シーケンシングデータの各々のフィールドが順次セーブされる、請求項152に記載のシステム。
- 少なくとも2つのフィールドが分離したファイル中のセーブされる、請求項152に記載のシステム。
- 少なくとも2つの異なるファイルが、各々のフィールド上で遂行される異なる圧縮アルゴリズムを使用してセーブされる、請求項152に記載のシステム。
- 配列識別子フィールド中のデータが、差分エンコーディングを使用して圧縮される、請求項152に記載のシステム。
- 塩基コールデータがBurrows−Wheeler変換を使用して処理される、請求項152に記載のシステム。
- 前記塩基コールデータの前記プロセシングが、ランレングスエンコーディングを実行すること、およびHuffmanエンコーディングを使用して圧縮することを更に含む、請求項164に記載のシステム。
- コメントのためのラインが差分エンコーディングを使用して圧縮される、請求項152に記載のシステム。
- フィールドが空の場合に、コメントのための追加のラインが無視される、請求項166に記載のシステム。
- クオリティ値データがBurrows−Wheeler変換を使用して処理される、請求項162に記載のシステム。
- 前記処理が、ランレングスエンコーディングを実行すること、およびHuffmanエンコーディングを使用して圧縮することを更に含む、請求項163に記載のシステム。
- 配列アライメントマップ(SAM)データの圧縮のためのシステムであって、
(a)前記SAMデータをその上に保存したメモリと;
(b)前記メモリおよびその上に保存された前記SAMデータへアクセスでき、前記SAMデータを80%以上のレベルへ圧縮するように構成された、エンコーディングモジュールと、
を含む、システム。 - 前記エンコーディングモジュールが、差分エンコーディングを使用して、前記SAMデータ中のクエリテンプレート名を圧縮する、請求項170に記載のシステム。
- 前記エンコーディングモジュールが、差分エンコーディングを使用して、前記SAMデータ中のリファレンス配列名を圧縮する、請求項170に記載のシステム。
- 前記エンコーディングモジュールが、差分エンコーディングを使用して、前記SAMデータ中の左端のマッピング位置を圧縮する、請求項170に記載のシステム。
- 前記エンコーディングモジュールが、差分エンコーディングを使用して、前記SAMデータ中のメイトリードのリファレンス名を圧縮する、請求項170に記載のシステム。
- 前記エンコーディングモジュールが、差分エンコーディングを使用して、前記SAMデータ中のメイトリードの位置を圧縮する、請求項170に記載のシステム。
- 前記エンコーディングモジュールが、Huffmanコーディング方法を使用して、CIGAR文字列からのデータを圧縮する、請求項170に記載のシステム。
- 前記エンコーディングモジュールが、辞書ベースの方法を使用して、CIGAR文字列からのデータを圧縮する、請求項170に記載のシステム。
- 前記エンコーディングモジュールが、塩基4エンコーディングを使用して、前記SAMデータからの塩基コールデータを圧縮する、請求項170に記載のシステム。
- 前記エンコーディングモジュールが、前記SAMデータからのクオリティデータを圧縮する、請求項170に記載のシステム。
- (a)前記エンコーディングモジュールが、差分エンコーディングを使用して、クエリテンプレート名、リファレンス配列名、左端のマッピング位置、前記メイトリードのリファレンス名、および前記メイトリードの位置のうちの1又は2以上を含む前記SAMデータからのデータを圧縮するように構成され;
(b)前記エンコーディングモジュールが、Huffmanコーディングまたは辞書ベースの方法を使用して、CIGAR文字列を含む前記SAMデータからのデータを圧縮するように構成され;
(c)前記エンコーディングモジュールが、塩基−4エンコーディングを使用して、塩基コールデータを含む前記SAMデータからのデータを圧縮するように構成され;
(d)前記エンコーディングモジュールは、クオリティデータを含む前記SAMデータからのデータを圧縮するように構成される、
請求項170に記載のシステム。 - 前記SAMデータが順次順序付けられる、請求項170に記載のシステム。
- VCFデータの圧縮のためのシステムであって、
前記VCFデータをその上に保存したメモリと;
前記メモリおよびその上に保存された前記VCFデータへアクセスでき、ゲノムデータを前記VCFデータの95%以上のレベルへエンコードするように構成された、エンコーディングモジュールと、
を含む、システム。 - 前記エンコーディングモジュールが、差分エンコーディングを使用して、前記VCFデータ中のクエリテンプレート名を圧縮する、請求項182に記載のシステム。
- 前記エンコーディングモジュールが、差分エンコーディングを使用して、前記VCFデータ中のリファレンス配列名を圧縮する、請求項182に記載のシステム。
- 前記エンコーディングモジュールが、差分エンコーディングを使用して、前記VCFデータ中の左端のマッピング位置を圧縮する、請求項182に記載のシステム。
- 前記エンコーディングモジュールが、差分エンコーディングを使用して、前記VCFデータ中のメイトリードのリファレンス名を圧縮する、請求項182に記載のシステム。
- 前記エンコーディングモジュールが、差分エンコーディングを使用して、前記VCFデータ中のメイトリードの位置を圧縮する、請求項182に記載のシステム。
- 前記エンコーディングモジュールが、Huffmanコーディング方法を使用して、データ形式をcigar文字列に圧縮する、請求項182に記載のシステム。
- 前記エンコーディングモジュールが、辞書ベースの方法を使用して、データ形式をcigar文字列に圧縮する、請求項182に記載のシステム。
- 前記エンコーディングモジュールが、塩基4エンコーディングを使用して、前記VCFデータからの塩基コールデータを圧縮する、請求項182に記載のシステム。
- 前記エンコーディングモジュールが、前記VCFデータからのクオリティデータを圧縮する、請求項182に記載のシステム。
- 決定されなかった塩基コールのリードについて、前記決定されなかった塩基コールの位置がセーブされる、請求項182に記載のシステム。
- 決定されなかった塩基コールを備えたすべてのリードについて、前記決定されなかった塩基コールの位置がセーブされる、請求項165に記載のシステム。
- 生のプロテオーム配列データをアライメントさせる方法であって、
(a)生のプロテオーム配列データを検索することと;
(b)前記生のプロテオーム配列データを、代替パスを含むバリエーションマップ上のロケーションへマッピングすることと;
(c)前記バリエーションマップ上の前記ロケーションに従って、前記生のプロテオーム配列データをアライメントさせることと、
を含む、方法。 - 前記マッピングが、グラフアライメントによって遂行される、請求項194に記載の方法。
- 前記グラフアライメントが、少なくとも1つのグラフを使用する、請求項195に記載の方法。
- 前記マッピングが、ギャップアライメントを使用して遂行される、請求項194に記載の方法。
- 前記マッピングが、セミギャップアライメントを使用して遂行される、請求項194に記載の方法。
- 前記代替パスからの特定のパスが、前記マッピングステップにおいてマッピングされる回数を蓄積することを更に含む、請求項194に記載の方法。
- 少なくとも代替配列パスを生成する方法であって、
a)リファレンス配列を得ることと;
b)前記リファレンス配列に代わるリファレンス配列上の相関する遺伝子座を検索することと、
c)前記相関する遺伝子座を含む、少なくとも1つの代替配列パスを生成することと、
を含む、方法。 - 前記相関する遺伝子座が2つ以上の別個の起源からである、請求項200に記載の方法。
- 前記相関する遺伝子座が、前記リファレンス配列上の2以上のロケーションへマッピングされる、異なる配列のセットである、請求項200に記載の方法。
- アミノ酸配列を比較する方法であって、
a)アミノ酸配列を検索することと;
b)前記アミノ酸配列からk−merプロファイルを生成することと;
c)データベース内の複数の配列からのk−merプロファイルのインデックスに対して、前記k−merプロファイルを問い合わせることと、
を含む、方法。 - アミノ酸配列に対して既知のバリアントをコールするためのシステムであって、
(a)アミノ酸配列を検索することと;
(b)前記アミノ酸配列からk−merプロファイルを生成することと;
(c)既知のアミノ酸およびポリマー配列のデータセットからのk−merプロファイルのインデックスに対して、代替パスにより、前記k−merプロファイルを問い合わせて、バリアントをコールすることと、
を含む、システム。 - 既知のバリアントが、1コアあたり毎秒10のバリアントコール以上の率で、少なくとも単一のコアを使用して同定される、請求項204に記載の方法。
- アミノ酸配列データの圧縮のためのシステムであって、
(a)アミノ酸配列データを受理するためのモジュールと;
(b)前記アミノ酸配列データを保存するためのメモリユニットと;
(c)前記メモリおよびその上に保存された前記アミノ酸配列データへアクセスでき、前記アミノ酸配列データのうちのいくつかまたはすべてをエンコードするように構成された、エンコーディングモジュールと、
を含む、システム。 - サンプル中の種および/または株を同定する方法であって、
a)リードを検索することと;
b)前記リードからk−merプロファイルを生成することと;
c)リファレンス配列からのk−merプロファイルのインデックスに対して、代替パスにより、前記k−merプロファイルを問い合わせて、バリアントをコールすることと;
d)前記コールされたバリアントに基づいて、前記サンプル中に存在する種または株を決定することと、
を含む、方法。 - 前記k−merプロファイルが、ギャップを導入したk−merを含む、請求項207に記載の方法。
- 前記k−merプロファイルが、1,000,000の塩基中最大1の頻度で異なる配列を圧縮する、請求項207に記載の方法。
- 前記代替パスのインデックスがフェーズ化された情報を含む、請求項207に記載の方法。
- 株間の差と直接関連するk−merのみが使用される、請求項207に記載の方法。
- 前記k−merインデックスのサイズが、前記リファレンス配列からの前記k−merプロファイルのインデックスに比較して、少なくとも99%低減される、請求項211に記載の方法。
- 前記k−merインデックスのサイズが、前記リファレンス配列からの前記k−merプロファイルのインデックスに比較して、少なくとも99.9%低減される、請求項211に記載の方法。
- 株間の差と直接関連するk−mer決定のみがバリアント決定のために使用される、請求項208に記載の方法。
- 前記k−merインデックスのサイズが、前記リファレンス配列からの前記k−merプロファイルのインデックスに比較して、少なくとも99%低減される、請求項214に記載の方法。
- 前記k−merインデックスのサイズが、前記リファレンス配列からの前記k−merプロファイルのインデックスに比較して、少なくとも99.9%低減される、請求項214に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562201923P | 2015-08-06 | 2015-08-06 | |
US62/201,923 | 2015-08-06 | ||
PCT/US2016/045564 WO2017024138A1 (en) | 2015-08-06 | 2016-08-04 | Systems and methods for genomic analysis |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018533143A true JP2018533143A (ja) | 2018-11-08 |
JP6946292B2 JP6946292B2 (ja) | 2021-10-06 |
Family
ID=57943995
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018526496A Active JP6946292B2 (ja) | 2015-08-06 | 2016-08-04 | ゲノム分析のためのシステムおよび方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US11929149B2 (ja) |
EP (1) | EP3332034B1 (ja) |
JP (1) | JP6946292B2 (ja) |
CN (1) | CN108350494B (ja) |
AU (2) | AU2016301354B2 (ja) |
CA (1) | CA2994406A1 (ja) |
WO (1) | WO2017024138A1 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111261225A (zh) * | 2020-02-06 | 2020-06-09 | 西安交通大学 | 一种基于二代测序数据的反转相关复杂变异检测方法 |
CN112164419A (zh) * | 2020-09-04 | 2021-01-01 | 云舟生物科技(广州)有限公司 | 在orf中插入蛋白标签的方法以及计算机存储介质 |
WO2022054178A1 (ja) * | 2020-09-09 | 2022-03-17 | 株式会社日立ハイテク | 個体ゲノムの構造変異検出方法及び装置 |
KR102646434B1 (ko) * | 2022-12-07 | 2024-03-12 | 주식회사 엔비아이티 | 도트 플롯 뷰어를 포함하는 blast 기반의 사용자 인터페이스를 제공하는 전자 장치 |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2766498B1 (en) | 2011-10-14 | 2019-06-19 | President and Fellows of Harvard College | Sequencing by structure assembly |
US11021737B2 (en) | 2011-12-22 | 2021-06-01 | President And Fellows Of Harvard College | Compositions and methods for analyte detection |
WO2013184754A2 (en) | 2012-06-05 | 2013-12-12 | President And Fellows Of Harvard College | Spatial sequencing of nucleic acids using dna origami probes |
EP2971184B1 (en) | 2013-03-12 | 2019-04-17 | President and Fellows of Harvard College | Method of generating a three-dimensional nucleic acid containing matrix |
US10395759B2 (en) | 2015-05-18 | 2019-08-27 | Regeneron Pharmaceuticals, Inc. | Methods and systems for copy number variant detection |
WO2017079406A1 (en) | 2015-11-03 | 2017-05-11 | President And Fellows Of Harvard College | Method and apparatus for volumetric imaging of a three-dimensional nucleic acid containing matrix |
NZ745249A (en) | 2016-02-12 | 2021-07-30 | Regeneron Pharma | Methods and systems for detection of abnormal karyotypes |
CN116200465A (zh) | 2016-04-25 | 2023-06-02 | 哈佛学院董事及会员团体 | 用于原位分子检测的杂交链反应方法 |
WO2017189677A1 (en) * | 2016-04-27 | 2017-11-02 | Arc Bio, Llc | Machine learning techniques for analysis of structural variants |
EP4428536A2 (en) | 2016-08-31 | 2024-09-11 | President and Fellows of Harvard College | Methods of combining the detection of biomolecules into a single assay using fluorescent in situ sequencing |
CN107480471B (zh) * | 2017-07-19 | 2020-09-01 | 福建师范大学 | 基于小波变换为特征的序列相似性分析的方法 |
GB2589159B (en) | 2017-12-29 | 2023-04-05 | Clear Labs Inc | Nucleic acid sequencing apparatus |
MX2020012672A (es) * | 2018-05-31 | 2021-02-09 | Koninklijke Philips Nv | Sistema y metodo para interpretacion de alelos usando un genoma de referencia basado en graficos. |
EP3861135B1 (en) * | 2018-10-04 | 2023-08-02 | Arc Bio, LLC | Normalization controls for managing low sample inputs in next generation sequencing |
WO2020076976A1 (en) | 2018-10-10 | 2020-04-16 | Readcoor, Inc. | Three-dimensional spatial molecular indexing |
IL279436B1 (en) * | 2018-10-31 | 2024-07-01 | Illumina Inc | Systems and methods for grouping and shrinking tiling readings |
CN109753939B (zh) * | 2019-01-11 | 2021-04-20 | 银丰基因科技有限公司 | 一种hla测序峰图识别方法 |
CN109979537B (zh) * | 2019-03-15 | 2020-12-18 | 南京邮电大学 | 一种面向多条序列的基因序列数据压缩方法 |
CN110349635B (zh) * | 2019-06-11 | 2021-06-11 | 华南理工大学 | 一种基因测序数据质量分数的并行压缩方法 |
CN112233726A (zh) * | 2020-10-23 | 2021-01-15 | 深圳未知君生物科技有限公司 | 一种细菌菌株的分析方法、分析装置和存储介质 |
WO2023225326A1 (en) * | 2022-05-20 | 2023-11-23 | Twinstrand Biosciences, Inc. | Genomics alignment probability score rescaler |
WO2023244782A1 (en) * | 2022-06-16 | 2023-12-21 | The Jackson Laboratory | Systems and methods for identifying cross-species gene and gene variant relationships |
WO2024000268A1 (zh) * | 2022-06-29 | 2024-01-04 | 深圳华大生命科学研究院 | 一种图像处理方法、装置、设备及介质 |
CN115458051B (zh) * | 2022-09-28 | 2023-03-21 | 北京泛生子基因科技有限公司 | 一种可保留分子标签信息的在测序数据中模拟小变异的方法、装置及计算机可读存储介质 |
CN115602244B (zh) * | 2022-10-24 | 2023-04-28 | 哈尔滨工业大学 | 一种基于序列比对骨架的基因组变异检测方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012239430A (ja) * | 2011-05-19 | 2012-12-10 | Natl Inst Of Radiological Sciences | 網羅的フラグメント解析における遺伝子同定方法および発現解析方法 |
JP2014505935A (ja) * | 2010-12-29 | 2014-03-06 | ダウ アグロサイエンシィズ エルエルシー | Dna配列のデータ解析法 |
US20150199475A1 (en) * | 2014-01-10 | 2015-07-16 | Seven Bridges Genomics Inc. | Systems and methods for use of known alleles in read mapping |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5750341A (en) | 1995-04-17 | 1998-05-12 | Lynx Therapeutics, Inc. | DNA sequencing by parallel oligonucleotide extensions |
AU6846698A (en) | 1997-04-01 | 1998-10-22 | Glaxo Group Limited | Method of nucleic acid amplification |
US6787308B2 (en) | 1998-07-30 | 2004-09-07 | Solexa Ltd. | Arrayed biomolecules and their use in sequencing |
AR021833A1 (es) | 1998-09-30 | 2002-08-07 | Applied Research Systems | Metodos de amplificacion y secuenciacion de acido nucleico |
US7244559B2 (en) | 1999-09-16 | 2007-07-17 | 454 Life Sciences Corporation | Method of sequencing a nucleic acid |
US7211390B2 (en) | 1999-09-16 | 2007-05-01 | 454 Life Sciences Corporation | Method of sequencing a nucleic acid |
US8396950B1 (en) | 2000-03-02 | 2013-03-12 | Rockstar Consortium Us Lp | Method and apparatus for the fast detection of connectivity loss between devices in a network |
EP2159285B1 (en) | 2003-01-29 | 2012-09-26 | 454 Life Sciences Corporation | Methods of amplifying and sequencing nucleic acids |
EP2639578B1 (en) | 2006-12-14 | 2016-09-14 | Life Technologies Corporation | Apparatus for measuring analytes using large scale fet arrays |
US8262900B2 (en) | 2006-12-14 | 2012-09-11 | Life Technologies Corporation | Methods and apparatus for measuring analytes using large scale FET arrays |
WO2008111048A2 (en) * | 2007-03-09 | 2008-09-18 | Ghost, Inc. | System and method for browser within a web site and proxy server |
CN101889074A (zh) | 2007-10-04 | 2010-11-17 | 哈尔西恩莫尔丘勒公司 | 采用电子显微镜对核酸聚合物测序 |
US8862979B2 (en) | 2008-01-15 | 2014-10-14 | Microsoft Corporation | Multi-client collaboration to access and update structured data elements |
EP2544113A1 (en) * | 2011-07-05 | 2013-01-09 | Koninklijke Philips Electronics N.V. | Genomic/proteomic sequence representation, visualization, comparison and reporting using a bioinformatics character set and a mapped bioinformatics font |
US8209130B1 (en) * | 2012-04-04 | 2012-06-26 | Good Start Genetics, Inc. | Sequence assembly |
US20140025593A1 (en) | 2012-07-23 | 2014-01-23 | DLC Enterprises, Inc. | Compliance Analysis System |
-
2016
- 2016-08-04 US US15/750,350 patent/US11929149B2/en active Active
- 2016-08-04 JP JP2018526496A patent/JP6946292B2/ja active Active
- 2016-08-04 EP EP16833874.7A patent/EP3332034B1/en active Active
- 2016-08-04 CA CA2994406A patent/CA2994406A1/en active Pending
- 2016-08-04 CN CN201680059045.3A patent/CN108350494B/zh active Active
- 2016-08-04 AU AU2016301354A patent/AU2016301354B2/en active Active
- 2016-08-04 WO PCT/US2016/045564 patent/WO2017024138A1/en active Application Filing
-
2022
- 2022-09-27 AU AU2022241472A patent/AU2022241472B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014505935A (ja) * | 2010-12-29 | 2014-03-06 | ダウ アグロサイエンシィズ エルエルシー | Dna配列のデータ解析法 |
JP2012239430A (ja) * | 2011-05-19 | 2012-12-10 | Natl Inst Of Radiological Sciences | 網羅的フラグメント解析における遺伝子同定方法および発現解析方法 |
US20150199475A1 (en) * | 2014-01-10 | 2015-07-16 | Seven Bridges Genomics Inc. | Systems and methods for use of known alleles in read mapping |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111261225A (zh) * | 2020-02-06 | 2020-06-09 | 西安交通大学 | 一种基于二代测序数据的反转相关复杂变异检测方法 |
CN112164419A (zh) * | 2020-09-04 | 2021-01-01 | 云舟生物科技(广州)有限公司 | 在orf中插入蛋白标签的方法以及计算机存储介质 |
WO2022054178A1 (ja) * | 2020-09-09 | 2022-03-17 | 株式会社日立ハイテク | 個体ゲノムの構造変異検出方法及び装置 |
KR102646434B1 (ko) * | 2022-12-07 | 2024-03-12 | 주식회사 엔비아이티 | 도트 플롯 뷰어를 포함하는 blast 기반의 사용자 인터페이스를 제공하는 전자 장치 |
Also Published As
Publication number | Publication date |
---|---|
CA2994406A1 (en) | 2017-02-09 |
AU2016301354A1 (en) | 2018-02-15 |
EP3332034A4 (en) | 2019-01-02 |
US20200090786A1 (en) | 2020-03-19 |
JP6946292B2 (ja) | 2021-10-06 |
AU2016301354B2 (en) | 2022-06-30 |
EP3332034B1 (en) | 2024-09-25 |
AU2022241472A1 (en) | 2022-10-20 |
CN108350494B (zh) | 2024-02-27 |
CN108350494A (zh) | 2018-07-31 |
AU2022241472B2 (en) | 2024-10-03 |
WO2017024138A1 (en) | 2017-02-09 |
US11929149B2 (en) | 2024-03-12 |
EP3332034A1 (en) | 2018-06-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6946292B2 (ja) | ゲノム分析のためのシステムおよび方法 | |
US11149308B2 (en) | Sequence assembly | |
Magi et al. | Nanopore sequencing data analysis: state of the art, applications and challenges | |
US20220246234A1 (en) | Using cell-free dna fragment size to detect tumor-associated variant | |
US9115401B2 (en) | Partition defined detection methods | |
US20190139628A1 (en) | Machine learning techniques for analysis of structural variants | |
JP2018536914A (ja) | 遺伝医学検査のためのシステムおよび方法 | |
CA3182741A1 (en) | Chimeric amplicon array sequencing | |
CA3101527A1 (en) | Methods for fingerprinting of biological samples |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190802 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201022 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20210121 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20210322 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210421 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210816 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210915 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6946292 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |