JP2021530203A - 試料同一性保証のための方法およびシステム - Google Patents
試料同一性保証のための方法およびシステム Download PDFInfo
- Publication number
- JP2021530203A JP2021530203A JP2020571427A JP2020571427A JP2021530203A JP 2021530203 A JP2021530203 A JP 2021530203A JP 2020571427 A JP2020571427 A JP 2020571427A JP 2020571427 A JP2020571427 A JP 2020571427A JP 2021530203 A JP2021530203 A JP 2021530203A
- Authority
- JP
- Japan
- Prior art keywords
- sequencing
- allelic
- sample
- dna
- nucleotides
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 75
- 238000012252 genetic analysis Methods 0.000 claims abstract description 12
- 238000012163 sequencing technique Methods 0.000 claims description 56
- 239000000523 sample Substances 0.000 claims description 47
- 125000003729 nucleotide group Chemical group 0.000 claims description 44
- 239000002773 nucleotide Substances 0.000 claims description 38
- 108090000623 proteins and genes Proteins 0.000 claims description 30
- 238000004458 analytical method Methods 0.000 claims description 23
- 238000007481 next generation sequencing Methods 0.000 claims description 23
- 108091034117 Oligonucleotide Proteins 0.000 claims description 22
- 238000012070 whole genome sequencing analysis Methods 0.000 claims description 20
- 238000007482 whole exome sequencing Methods 0.000 claims description 19
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 claims description 10
- 239000012472 biological sample Substances 0.000 claims description 9
- 108700028369 Alleles Proteins 0.000 claims description 8
- 238000012408 PCR amplification Methods 0.000 claims description 6
- 230000003321 amplification Effects 0.000 claims description 5
- 210000004369 blood Anatomy 0.000 claims description 5
- 239000008280 blood Substances 0.000 claims description 5
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 5
- 210000002381 plasma Anatomy 0.000 claims description 3
- 210000002966 serum Anatomy 0.000 claims description 3
- 210000004243 sweat Anatomy 0.000 claims description 3
- 210000001138 tear Anatomy 0.000 claims description 3
- 210000002700 urine Anatomy 0.000 claims description 3
- 206010003445 Ascites Diseases 0.000 claims description 2
- 210000001175 cerebrospinal fluid Anatomy 0.000 claims description 2
- 210000000056 organ Anatomy 0.000 claims description 2
- 210000003296 saliva Anatomy 0.000 claims description 2
- 108020004414 DNA Proteins 0.000 description 34
- 108091092878 Microsatellite Proteins 0.000 description 16
- 108091033319 polynucleotide Proteins 0.000 description 16
- 102000040430 polynucleotide Human genes 0.000 description 16
- 239000002157 polynucleotide Substances 0.000 description 16
- 238000003205 genotyping method Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 10
- 150000001413 amino acids Chemical class 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 102000039446 nucleic acids Human genes 0.000 description 8
- 108020004707 nucleic acids Proteins 0.000 description 8
- 150000007523 nucleic acids Chemical class 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 239000000203 mixture Substances 0.000 description 6
- 239000003153 chemical reaction reagent Substances 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 229920000642 polymer Polymers 0.000 description 4
- 239000004055 small Interfering RNA Substances 0.000 description 4
- 108091028664 Ribonucleotide Proteins 0.000 description 3
- -1 adapter Substances 0.000 description 3
- 239000005547 deoxyribonucleotide Substances 0.000 description 3
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 3
- 150000002500 ions Chemical class 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000002493 microarray Methods 0.000 description 3
- 229920001184 polypeptide Polymers 0.000 description 3
- 108090000765 processed proteins & peptides Proteins 0.000 description 3
- 102000004196 processed proteins & peptides Human genes 0.000 description 3
- 238000012175 pyrosequencing Methods 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 239000002336 ribonucleotide Substances 0.000 description 3
- 125000002652 ribonucleotide group Chemical group 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 2
- 108700024394 Exon Proteins 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- 108700011259 MicroRNAs Proteins 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- 108091027967 Small hairpin RNA Proteins 0.000 description 2
- 108020004459 Small interfering RNA Proteins 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 239000000090 biomarker Substances 0.000 description 2
- 238000001574 biopsy Methods 0.000 description 2
- 210000004027 cell Anatomy 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 238000011109 contamination Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000012530 fluid Substances 0.000 description 2
- 238000007672 fourth generation sequencing Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 125000005647 linker group Chemical group 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 239000002679 microRNA Substances 0.000 description 2
- 102000004169 proteins and genes Human genes 0.000 description 2
- 230000002285 radioactive effect Effects 0.000 description 2
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 1
- KJLPSBMDOIVXSN-UHFFFAOYSA-N 4-[4-[2-[4-(3,4-dicarboxyphenoxy)phenyl]propan-2-yl]phenoxy]phthalic acid Chemical compound C=1C=C(OC=2C=C(C(C(O)=O)=CC=2)C(O)=O)C=CC=1C(C)(C)C(C=C1)=CC=C1OC1=CC=C(C(O)=O)C(C(O)=O)=C1 KJLPSBMDOIVXSN-UHFFFAOYSA-N 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 108091029795 Intergenic region Proteins 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- DHKHKXVYLBGOIT-UHFFFAOYSA-N acetaldehyde Diethyl Acetal Natural products CCOC(C)OCC DHKHKXVYLBGOIT-UHFFFAOYSA-N 0.000 description 1
- 125000002777 acetyl group Chemical class [H]C([H])([H])C(*)=O 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 125000003342 alkenyl group Chemical group 0.000 description 1
- 125000000217 alkyl group Chemical group 0.000 description 1
- 125000003275 alpha amino acid group Chemical group 0.000 description 1
- 229940059260 amidate Drugs 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 239000013060 biological fluid Substances 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000006143 cell culture medium Substances 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 210000003850 cellular structure Anatomy 0.000 description 1
- 238000012864 cross contamination Methods 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 125000000392 cycloalkenyl group Chemical group 0.000 description 1
- 125000000753 cycloalkyl group Chemical group 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000001493 electron microscopy Methods 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- NPUKDXXFDDZOKR-LLVKDONJSA-N etomidate Chemical compound CCOC(=O)C1=CN=CN1[C@H](C)C1=CC=CC=C1 NPUKDXXFDDZOKR-LLVKDONJSA-N 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 238000000126 in silico method Methods 0.000 description 1
- 238000012606 in vitro cell culture Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000029226 lipidation Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 235000019689 luncheon sausage Nutrition 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 230000002438 mitochondrial effect Effects 0.000 description 1
- 239000011807 nanoball Substances 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 235000021317 phosphate Nutrition 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical group 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6827—Hybridisation assays for detection of mutation or polymorphism
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/10—Signal processing, e.g. from mass spectrometry [MS] or from PCR
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Physics & Mathematics (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Analytical Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Genetics & Genomics (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Immunology (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Bioethics (AREA)
- Signal Processing (AREA)
- Evolutionary Computation (AREA)
- Public Health (AREA)
- Epidemiology (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
本開示は、対立遺伝子型決定を含む遺伝子解析のための方法、ならびにそのような解析を実装するためのシステムを提供する。
Description
関連出願の相互参照
本出願は、米国特許法第119条(e)の下で、2018年6月29日に出願された、米国特許仮出願第62/692,366号の優先権の利益を主張し、その全体内容が、参照によりその全体において本明細書に組み込まれる。
本出願は、米国特許法第119条(e)の下で、2018年6月29日に出願された、米国特許仮出願第62/692,366号の優先権の利益を主張し、その全体内容が、参照によりその全体において本明細書に組み込まれる。
配列表の組み込み
添付の配列表のデータは、本明細書において、参照により本出願に組み込まれる。添付の配列表テキストファイルRADY_1WO_Sequence_Listing.txtは、2019年6月25日に作成され、8kbである。ファイルは、Windows OSを使用しているコンピュータでMicrosoft Wordを使用してアクセスすることができる。
添付の配列表のデータは、本明細書において、参照により本出願に組み込まれる。添付の配列表テキストファイルRADY_1WO_Sequence_Listing.txtは、2019年6月25日に作成され、8kbである。ファイルは、Windows OSを使用しているコンピュータでMicrosoft Wordを使用してアクセスすることができる。
発明の分野
本発明は、概して、遺伝子解析に関し、より具体的には、試料同一性を確実にするための対立遺伝子型決定のための方法およびシステムに関する。
本発明は、概して、遺伝子解析に関し、より具体的には、試料同一性を確実にするための対立遺伝子型決定のための方法およびシステムに関する。
次世代配列決定(NGS)プラットフォームを使用する全ゲノム配列決定(WGS)、全エクソーム配列決定(WES)、および標的遺伝子パネル配列決定は、複数の手順ステップを伴う複雑なプロセスである。NGSにおけるプロセス中の試料交換または汚染は、偽陽性バリアント検出および遺伝子型誤分類をもたらし得る。プロセス全体の試料同一性の保証は、重要な品質管理コンポーネントである。正しい試料同一性を確実にするプロセスは、配列決定施設の課題である。
現在、いくつかのNGS施設は、アレイベースの遺伝子型決定を実施し、一塩基多型(SNP)を使用して、NGSデータから呼び出される遺伝子型プロファイリングと、アレイベースの遺伝子型データ(SNPマイクロアレイ)から呼び出される遺伝子型プロファイリングとの間の一致を取得している。特定のプロセスに関連する、または関連しないエラーは、アレイベース遺伝子型決定において発生し得、SNPアレイデータとNGSデータとの間の不整合な遺伝子型呼び出しをもたらし得ることが知られている。一方、NGSの深度カバレッジは、NGSデータからのSNP呼び出し、特に低マイナー対立遺伝子頻度(MAF)SNPに影響を与える。NGSパネル配列決定のために、カスタム設計されたアレイワークフローは、NGSパネルデータとSNPマイクロアレイデータとの間の一致を最適化するように、作成されなければならない。ワークフローは、完了するのに2〜3日を必要とする。追加的に、比較的試料量が少ない研究所では、初期計測、コストの修正、および人員配置モデルを開発する必要があり得る。
正しい試料同一性を保証するための改善された方法は、遺伝子解析を実施するときに、必要とされる。
本発明は、対立遺伝子型決定を介して遺伝子解析を行うための方法およびシステムを提供する。本方法は、正しい試料同一性を確実にするために、異なるタイプの対立遺伝子型決定技術の組み合わせを利用する。
したがって、一態様において、本発明は、遺伝子解析を実施するための方法を提供する。本方法は、
(a)短鎖縦列反復(STR)増幅を介して試料の第1の対立遺伝子型を決定することと、
(b)遺伝子配列決定を介して試料の第2の対立遺伝子型を決定することと、
(c)第1の対立遺伝子型と第2の対立遺伝子型との間の対立遺伝子一致を決定することと、を含む。
(a)短鎖縦列反復(STR)増幅を介して試料の第1の対立遺伝子型を決定することと、
(b)遺伝子配列決定を介して試料の第2の対立遺伝子型を決定することと、
(c)第1の対立遺伝子型と第2の対立遺伝子型との間の対立遺伝子一致を決定することと、を含む。
実施形態において、本方法は、対立遺伝子プロファイリング一致表を生成することをさらに含む。一実施形態において、本方法は、第1の対立遺伝子型および第2の対立遺伝子型が単一の対象のものであるかどうかを決定するために統計的確率を計算することを含む。
様々な実施形態において、遺伝子配列決定は、全ゲノム配列決定(WGS)または急速全ゲノム配列決定(rWGS)または全エクソーム配列決定(WES)、次世代配列(NGS)、標的遺伝子パネル配列決定、またはそれらの組み合わせを含む。
配列決定が、WESまたは標的遺伝子パネル配列決定を含む実施形態において、これらの用途において対立遺伝子型決定を可能にする、配列番号1〜41から選択される1つ以上のオリゴヌクレオチドを有するパネルが、利用される。
したがって、本発明は、配列番号1〜41から選択される1つ以上のオリゴヌクレオチドを有するパネルをさらに提供する。実施形態において、各オリゴヌクレオチドは、約50〜120ヌクレオチドの長さである。一実施形態において、各オリゴヌクレオチドは、約50ヌクレオチド以上の長さである。一実施形態において、各オリゴヌクレオチドは、120ヌクレオチド以下の長さである。
一実施形態において、本発明は、本開示の方法を実施するように構成されている遺伝子解析システムを提供する。システムは、(a)メモリに動作可能に接続されている少なくとも1つのプロセッサと、(b)DNA試料中のDNAのPCR増幅から生成された配列情報を含むDNA解析情報を受信するように構成されている受信機コンポーネントと、(c)少なくとも1つのプロセッサによって実行され、本開示の方法、例えば、対立遺伝子型を決定して、対立遺伝子プロファイリング一致表を生成し、そして、第1の対立遺伝子型および第2の対立遺伝子型が単一の対象のものであるかどうかを決定するために統計的確率を計算することを実施するように構成されている、解析コンポーネントと、を含む。
別の実施形態において、本発明は、本発明の方法を実施するためのシステムを提供する。システムは、少なくとも1つのプロセッサと、非一時的メモリとを有するコントローラを含む。コントローラは、本明細書に記載される方法のプロセスのうちの1つ以上を実施するように構成されている。
さらに別の実施形態において、本発明は、コンピュータプログラムで符号化された非一時的なコンピュータ可読格納媒体を提供する。プログラムは、1つ以上のプロセッサによって実行されるときに、1つ以上のプロセッサに、本開示の方法を実装する動作を実施させる、命令を含む。
また別の実施形態において、本発明は、コンピューティングシステムを提供する。システムは、メモリと、メモリに結合された1つ以上のプロセッサとを含み、1つ以上のプロセッサは、本開示の方法を実装する動作を実施するように構成される。
発明の詳細な説明
本発明は、複数の対立遺伝子型決定技術の組み合わせを含む、試料同一性を確実にするための革新的な方法に基づく。本開示の方法論は、試料同一性を保証して、異なる試料間の潜在的な交差汚染を検出するために、GlobalFiler(商標)PCR増幅キットによって、およびLobSTR(商標)ソフトウェアを使用してNGSによって生成されたSTR(短鎖縦列反復)対立遺伝子プロファイリングの一致を比較することを含む。
本発明は、複数の対立遺伝子型決定技術の組み合わせを含む、試料同一性を確実にするための革新的な方法に基づく。本開示の方法論は、試料同一性を保証して、異なる試料間の潜在的な交差汚染を検出するために、GlobalFiler(商標)PCR増幅キットによって、およびLobSTR(商標)ソフトウェアを使用してNGSによって生成されたSTR(短鎖縦列反復)対立遺伝子プロファイリングの一致を比較することを含む。
GlobalFiler(商標)パネルは、ヒトゲノム内の24の位置の対立遺伝子状態の決定、ならびに2つ以上の試料の汚染(混合)の事象の特定を可能にする。WGSまたはWESまたはNGSパネル上の計算ワークフロー(配列番号1〜41のオリゴヌクレオチドがプールダウンプローブ設計に含まれている)データセットは、コンピュータ上での(in silico)STR推論ソフトウェア(lobSTR(商標)など)を使用して、ヒトゲノム内の同じ24の位置の対立遺伝子状態の独立した決定を可能にする。24の位置のうち18以上が一致しているならば2つの試料は同じ個体由来であったという統計的枠組みは、いかなる合理的な疑いも排除する(1/1,000,000,000,000,000未満の誤差の確率)ことを可能にするものである。
STRによって予測された対立遺伝子型プロファイリングと、WGSまたはWESによって予測された対立遺伝子型プロファイリングとの間の一致は、高い一貫性がある。GlobalFiler(商標)を使用したSTR遺伝子型決定は、高精度および高感度で一貫した遺伝子座プロファイリングを生成することができる。ワークフローは、比較的シンプルかつ簡単であり、実験室の技術者は4〜6時間以内に完了させる。STR反応を設定することは、マイクロアレイほど大きなバッチセットを必要としない。さらに、バッチ中の比較的小さな試料セットにより、試薬は失われない。
本組成物および方法を記載する前に、本発明は、記載される特定の方法および実験条件に限定されず、そのような組成物、方法および条件は、変動し得ることを理解されたい。また、本明細書で使用される用語は、特定の実施形態を記載することのみを目的としており、本発明の範囲は、添付の特許請求の範囲にのみ限定されるため、限定することを意図するものではないことも理解されたい。
本明細書および添付の特許請求の範囲で使用されるように、単数形「a」、「an」、および「the」は、文脈が明示的に別段の指示に示さない限り、複数形の参照を含む。したがって、例えば、「方法」への参照は、この開示などを読むと当業者に明らかになるであろう、本明細書に記載されるタイプの1つ以上の方法、および/またはステップを含む。
別段の定義がない限り、本明細書で使用される全ての技術用語および科学用語は、本発明が属する当業者によって一般に理解される意味と同じ意味を有する。本明細書に記載されるものと類似または同等の任意の方法および材料は、本発明の実践または試験に使用されることができるが、好ましい方法および材料は、ここに記載される。
方法
本発明は、対立遺伝子型決定を介して遺伝子解析を行うための方法を提供する。本方法は、試料同一性を確実にするために、異なるタイプの対立遺伝子型決定技術の組み合わせを利用する。
本発明は、対立遺伝子型決定を介して遺伝子解析を行うための方法を提供する。本方法は、試料同一性を確実にするために、異なるタイプの対立遺伝子型決定技術の組み合わせを利用する。
したがって、一態様において、本発明は、遺伝子解析を実施するための方法を提供する。本方法は、
(a)短鎖縦列反復(STR)増幅を介して試料の第1の対立遺伝子型を決定することと、
(b)遺伝子配列決定を介して試料の第2の対立遺伝子型を決定することと、
(c)第1の対立遺伝子型と第2の対立遺伝子型との間の対立遺伝子一致を決定することと、を含む。
(a)短鎖縦列反復(STR)増幅を介して試料の第1の対立遺伝子型を決定することと、
(b)遺伝子配列決定を介して試料の第2の対立遺伝子型を決定することと、
(c)第1の対立遺伝子型と第2の対立遺伝子型との間の対立遺伝子一致を決定することと、を含む。
本開示の方法は、対立遺伝子型を生成するための遺伝子配列決定を企図する。
配列決定は、当該技術分野で既知の任意の方法によって行われ得る。配列決定方法は、Maxam−Gilbert配列決定に基づく技法、鎖終了に基づく技法(chain−termination−based techniques)、ショットガン配列決定、架橋PCR配列決定、単一分子リアルタイム配列決定、イオン半導体配列決定(Ion Torrent(商標)配列決定)、ナノポア配列決定、パイロシークエンス(454)、合成による配列決定、ライゲーションによる配列決定(SOLiD(商標)配列決定)、電子顕微鏡による配列決定、ジデオキシ配列決定反応(Sanger法)、大規模並列配列決定、ポロニー配列決定、およびDNAナノボール配列決定を含むが、これらに限定されない。いくつかの実施形態において、配列決定は、プライマーをテンプレートにハイブリダイズしてテンプレート/プライマー二本鎖を形成すること、ポリメラーゼがテンプレート依存的な様式でプライマーにヌクレオチドを付加するのを可能にする条件下で、検出可能に標識されたヌクレオチドの存在下で二本鎖をポリメラーゼ酵素と接触させること、組み込まれた標識ヌクレオチドからのシグナルを検出すること、少なくとも1回、接触および検出ステップを連続的に繰り返すことを含み、組み込まれた標識ヌクレオチドの連続検出は、核酸の配列を決定する。いくつかの実施形態において、配列決定は、対の末端リードを取得することを含む。
いくつかの実施形態において、核酸の配列決定は、全ゲノム配列決定(WGS)、急速WGS、全エクソーム配列決定(WES)、標的遺伝子パネル配列決定、次世代配列決定(NGS)、またはそれらの任意の組み合わせを使用して実施される。いくつかの実施形態において、標的配列決定が実施されており、DNAまたはRNA配列決定のいずれかであり得る。標的配列決定は、全ゲノムのサブセットに対するものであり得る。いくつかの実施形態において、標的配列決定は、イントロン、エクソン、非コード配列、またはそれらの組み合わせに対するものである。DNAは、大規模並列配列決定であるNGSプラットフォームを使用して配列決定される。NGS技術は高スループット配列情報を提供し、目的の配列に整列する各配列リードがカウント可能であるという点で、デジタル定量情報を提供する。特定の実施形態において、クローン増幅されたDNAテンプレートまたは単一のDNA分子は、フローセル内で(例えば、国際公開第WO2014/015084号に記載されるように)大規模並列様式で配列決定される。高スループット配列情報に加えて、NGSは、各配列リードがカウント可能であり、個々のクローナルDNAテンプレートまたは単一のDNA分子を表すという点で、定量的情報を提供する。NGSの配列決定技術は、パイロシークエンス、可逆的ダイターミネーターを用いた合成による配列決定、オリゴヌクレオチドプローブライゲーションによる配列決定、およびイオン半導体配列決定を含む。個々の試料由来のDNAを個別に配列決定することができ(すなわち、単一配列決定)、または複数の試料由来のDNAをプールして、一回の配列決定ランでインデックス化ゲノム分子として配列決定して(すなわち、多重配列決定)、最大数億リードのDNA配列を生成することができる。市販のプラットフォームに、例えば、合成による配列決定、イオン半導体配列決定、パイロシークエンス、可逆的ダイターミネーター配列決定、ライゲーションによる配列決定、単一分子配列決定、ハイブリダイゼーションによる配列決定、およびナノポア配列決定のためのプラットフォームを含む。実施形態において、本開示の方法論は、Illumina,Inc(HiSeq(商標)X10、HiSeq(商標)1000、HiSeq(商標)2000、HiSeq(商標)2500、HiSeq(商標)4000、NovaSeq(商標)5000、NovaSeq(商標)6000、Genome Analyzers(商標)、MiSeq(商標)システム)、Applied Biosystems Life Technologies(ABI PRISM(商標)配列検出システム、SOLiD(商標)システム、Ion PGM(商標)シーケンサー、イオンProton(商標)シーケンサーなどのシステムを利用する。
「ポリヌクレオチド」、「ヌクレオチド配列」、「核酸」、および「オリゴヌクレオチド」という用語は、同義に使用される。これらは、デオキシリボヌクレオチドもしくはリボヌクレオチド、またはその誘導体のいずれかの任意の長さのヌクレオチドのポリマー形態を指す。ポリヌクレオチドは、任意の三次元構造を有し得、既知または未知の任意の機能を実施し得る。ポリヌクレオチドは、一本鎖もしくは多本鎖(例えば、一本鎖、二本鎖、および三重らせん)であり得、修飾ヌクレオチドまたは塩基もしくはそれらの誘導体を含む、デオキシリボヌクレオチド、リボヌクレオチド、および/またはデオキシリボヌクレオチドもしくはリボヌクレオチドの誘導体もしくは修飾形態を含有する。遺伝子コードが縮重しているため、2つ以上のコドンは、特定のアミノ酸をコードするために使用され得、本発明は、特定のアミノ酸配列をコードするポリヌクレオチドを包含する。ヌクレアーゼ耐性を増加させる修飾(例えば、デオキシ、2’−O−Me、ホスホロチオエートなど)を含む使用条件下でポリヌクレオチドが所望の官能性を保持する限り、任意のタイプの修飾ヌクレオチドまたはヌクレオチド誘導体が使用され得る。標識は、検出または捕捉、例えば、放射性もしくは非放射性標識またはアンカー、例えば、ビオチンの目的のために組み込まれ得る。ポリヌクレオチドという用語はまた、ペプチド核酸(PNA)も含む。ポリヌクレオチドは、天然に存在し得るか、または非天然に存在し得る。ポリヌクレオチドは、RNA、DNA、またはその両方、および/または修飾形態および/またはそれらの誘導体を含有し得る。ヌクレオチドの配列は、非ヌクレオチドコンポーネントによって中断され得る。1つ以上のホスホジエステル結合は、代替の連結基によって置き換えられ得る。これらの代替の連結基は、リン酸塩が、P(O)S(「チオエート」)、P(S)S(「ジチオエート」)、(O)NR2(「アミデート」)、P(O)R、P(O)OR’、COまたはCH2(「ホルムアセタール」)で置き換えられる実施形態を含むが、これらに限定されず、各RまたはR’は、独立して、H、または任意にエーテル(−−O−−)連結、アリール、アルケニル、シクロアルキル、シクロアルケニル、もしくはアラルジルを含有する、置換もしくは非置換アルキル(1〜20C)である。以下は、ポリヌクレオチドの非限定的な例である:遺伝子または遺伝子断片のコード領域または非コード領域、遺伝子間DNA、結合解析から定義される遺伝子座(遺伝子座)、エクソン、イントロン、メッセンジャーRNA(mRNA)、トランスファーRNA、リボソームRNA、短い干渉RNA(siRNA)、短いヘアピンRNA(shRNA)、マイクロRNA(miRNA)、小ヌクレオラールRNA、リボザイム、cDNA、組換えポリヌクレオチド、分岐ポリヌクレオチド、プラスミド、ベクター、任意の配列の単離されたDNA、任意の配列の単離されたRNA、核酸プローブ、アダプター、およびプライマー。ポリヌクレオチドは、メチル化ヌクレオチドおよびヌクレオチド誘導体などの修飾ヌクレオチドを含み得る。存在する場合、ヌクレオチド構造への修飾は、ポリマーの組立の前または後に得られ得る。ヌクレオチドの配列は、非ヌクレオチドコンポーネントによって中断され得る。ポリヌクレオチドは、標識コンポーネント、タグ、反応性部分、または結合パートナーとのコンジュゲーションなどにより、重合後にさらに修飾され得る。特に明記しない限り、ポリヌクレオチド配列は、提供される場合、5’〜3’方向に列挙される。
実施形態において、配列決定は、オリゴヌクレオチドのパネルの使用を含む。例えば、パネルは、配列決定が、WESまたは標的遺伝子パネル配列決定を含む場合に、有用である。
したがって、本発明は、1つ以上のオリゴヌクレオチドを有するパネルを提供する。実施形態において、オリゴヌクレオチドは、表Iに示すように、配列番号1〜41から選択される1つ以上のオリゴヌクレオチドを含む。
本発明のポリヌクレオチド、例えば、本発明のパネルのオリゴヌクレオチドは、任意の好適な長さのDNAまたはRNA分子であり得る。例えば、当業者は、標的遺伝子パネルで利用されるオリゴヌクレオチドに好適な長さを理解するだろう。かかる分子は、典型的には、約50〜150、50〜140、50〜130、50〜120、50〜110、50〜100、50〜100、50〜90、50〜80、50〜70、または50〜60ヌクレオチドの長さである。例えば、分子は、約50、55、60、65、70、75、80、85、90、95、100、105、110、115、または120ヌクレオチドの長さであり得る。かかるポリヌクレオチドは、少なくとも約50ヌクレオチド、少なくとも約55ヌクレオチド、少なくとも約60ヌクレオチド、少なくとも約65ヌクレオチド、少なくとも約70ヌクレオチド、少なくとも約75ヌクレオチド、少なくとも約80ヌクレオチド、少なくとも約85ヌクレオチド、少なくとも約90ヌクレオチド、少なくとも約95ヌクレオチド、少なくとも約100ヌクレオチド、少なくとも約110ヌクレオチド、少なくとも約120ヌクレオチドまたは120ヌクレオチド超を含む、少なくとも約50〜約120ヌクレオチド以上を含み得る。
本明細書で使用される場合、「ポリペプチド」は、アミノ酸から構成され、当業者によってタンパク質として認識される組成物を指す。アミノ酸残基のための従来の1文字または3文字のコードは、本明細書で使用される。「ポリペプチド」および「タンパク質」は、本明細書では、任意の長さのアミノ酸のポリマーを指すように同義に使用される。ポリマーは、直鎖状、または分岐状であり得、修飾アミノ酸を含み得、非アミノ酸によって中断され得る。この用語はまた、天然にまたは介入によって修飾されたアミノ酸ポリマー、例えば、ジスルフィド結合形成、グリコシル化、脂質化、アセチル化、リン酸化、または任意の他の操作もしくは修飾、例えば、標識コンポーネントとのコンジュゲーションも包含する。また、定義には、例えば、アミノ酸(例えば、非天然アミノ酸、合成アミノ酸などを含む)の1つ以上の誘導体を含有するポリペプチド、ならびに当該技術分野で既知の他の修飾も含まれる。
本明細書で使用される場合、本明細書で「試料」という用語は、核酸を含有するか、または核酸を含有すると推定される任意の物質を指す。試料は、被験者から得られた生体試料であり得る。核酸は、RNA、DNA、例えば、ゲノムDNA、ミトコンドリアDNA、ウイルスDNA、合成DNA、またはRNAから逆転写されたcDNAであることができる。核酸試料中の核酸は、概して、ハイブリダイズされたプライマーの伸長のためのテンプレートとして仕える。いくつかの実施形態において、生体試料は、生体流体試料である。流体試料は、全血、血漿、血清、腹水、脳脊髄液、汗、尿、涙、唾液、口腔試料、腔洗浄液(cavity rinse)、排泄物、または器官洗浄液(organ rinse)であり得る。流体試料は、実質的に細胞を含まない液体試料(例えば、血漿、血清、汗、尿、および涙)であることができる。他の実施形態において、生体試料は、固体生体試料、例えば、排泄物または組織生検、例えば、腫瘍生検である。試料はまた、インビトロ細胞培養成分(細胞培養培地中の細胞の成長から生じる条件付き培地、組換え細胞、および細胞コンポーネントを含むが、これらに限定されない)を含むことができる。いくつかの実施形態において、試料は、複数の供給源由来の核酸の混合物である生体試料であり、すなわち、1つの生体試料に2つ以上の寄与因子、例えば、2つ以上の個体が存在する。一実施形態において、生体試料は、乾燥した血斑である。
本発明において、被験者は、典型的にはヒトであるが、イヌ、ネコ、ウサギ、ウシ、鳥、ラット、ウマ、ブタ、またはサルを含むが、これらに限定されない、そのゲノム上にメチル化マークを有する任意の種であることができる。
コンピュータシステム
本発明は、機能的コンポーネントおよび様々な処理ステップの観点から部分的に記載される。そのような機能的コンポーネントおよび処理ステップは、指定された機能を実施して、様々な結果を達成するように構成されている任意の数のコンポーネント、動作、および技術によって実現され得る。例えば、本発明は、様々な機能を実行し得る、様々な生物学的試料、バイオマーカー、要素、材料、コンピュータ、データソース、格納システムおよび媒体、情報収集技術およびプロセス、データ処理基準、統計解析、回帰解析などを用い得る。追加的に、本発明は、遺伝子解析に関連して記載されているが、本発明は、任意の数の用途、環境、およびデータ解析と併せて実践され得、本明細書に記載されるシステムは、本発明のための単なる例示的な用途である。
本発明は、機能的コンポーネントおよび様々な処理ステップの観点から部分的に記載される。そのような機能的コンポーネントおよび処理ステップは、指定された機能を実施して、様々な結果を達成するように構成されている任意の数のコンポーネント、動作、および技術によって実現され得る。例えば、本発明は、様々な機能を実行し得る、様々な生物学的試料、バイオマーカー、要素、材料、コンピュータ、データソース、格納システムおよび媒体、情報収集技術およびプロセス、データ処理基準、統計解析、回帰解析などを用い得る。追加的に、本発明は、遺伝子解析に関連して記載されているが、本発明は、任意の数の用途、環境、およびデータ解析と併せて実践され得、本明細書に記載されるシステムは、本発明のための単なる例示的な用途である。
本発明の様々な態様による遺伝子解析の方法は、例えば、コンピュータシステム上で動作するコンピュータプログラムを使用して、任意の好適な方法で実装され得る。本発明の様々な態様に従った、例示的な遺伝子解析システムは、コンピュータシステム、例えば、プロセッサおよびランダムアクセスメモリ、例えば、リモートアクセス可能なアプリケーションサーバ、ネットワークサーバ、パーソナルコンピュータまたはワークステーションを含む、従来のコンピュータシステムと併せて実装され得る。コンピュータシステムはまた、大量格納システムおよびユーザインターフェース、例えば、従来のモニタ、キーボード、およびトラッキングデバイスなどの追加のメモリデバイスまたは情報格納システムを適切に含む。しかしながら、コンピュータシステムは、任意の好適なコンピュータシステムおよび関連する機器を含み得、任意の好適な様式で構成され得る。一実施形態において、コンピュータシステムは、スタンドアロンシステムを含む。別の実施形態において、コンピュータシステムは、サーバおよびデータベースを含むコンピュータのネットワークの一部である。
遺伝子情報を受信、処理、および解析するために必要とされるソフトウェアは、単一のデバイスに実装され得るか、または複数のデバイスに実装され得る。ソフトウェアは、情報の格納および処理がユーザに対して遠隔で行われるように、ネットワークを介してアクセス可能であり得る。本発明の様々な態様による遺伝子解析システムおよびその様々な要素は、データ収集、処理、および/または解析などの遺伝子解析を容易にするための機能および動作を提供する。本遺伝子解析システムは、試料に関連する情報を維持して、解析を容易にする。例えば、本実施形態において、コンピュータシステムは、ゲノムに関連する情報を受信、格納、検索、解析、および報告し得る、コンピュータプログラムを実行する。コンピュータプログラムは、生データを処理し、補足データを生成するための処理モジュール、ならびに生データおよび補足データを解析して遺伝子解析を実施するための解析モジュールなどの、様々な機能または動作を実施する複数のモジュールを含み得る。
遺伝子解析システムによって実施される手順は、遺伝子解析を容易にするための任意の好適なプロセスを含み得る。一実施形態において、遺伝子解析システムは、対立遺伝子の一致を決定するように構成される。
遺伝子解析システムはまた、様々な追加のモジュールおよび/または個々の機能を提供し得る。例えば、遺伝子解析システムは、例えば、処理および解析機能に関連する情報を提供するための、報告機能を含み得る。遺伝子解析システムはまた、アクセスを制御して、他の管理機能を実施するなどの、様々な管理および管理機能を提供し得る。
以下の実施例は、本発明の利点および特徴をさらに例示するために提供されるが、本発明の範囲を限定することを意図しない。この実施例は、使用され得るものの典型であるが、当業者に既知の他の手順、方法論、または技術は、代替的に、使用され得る。
実施例I
NGS WGS試料同一性保証
以下の方法論は、試料同一性を決定するために利用される。
NGS WGS試料同一性保証
以下の方法論は、試料同一性を決定するために利用される。
ステップ1.STR増幅ワークフロー
1.ThermoFisher GlobalFiler(商標)PCR増幅キットを用いて、ゲノムDNAまたは血斑(1.2mm)を使用してSTR PCR増幅を設定する。
2.AB Veriti(商標)PCRマシンを使用してサイクリングを実行する。
3.AB Genetic Analyzer(商標)で電気泳動を設定する。
4.GeneMapper(商標)ソフトウェアを使用して、STR対立遺伝子プロファイリングを生成する。
5.STR対立遺伝子プロファイリングを報告する。
1.ThermoFisher GlobalFiler(商標)PCR増幅キットを用いて、ゲノムDNAまたは血斑(1.2mm)を使用してSTR PCR増幅を設定する。
2.AB Veriti(商標)PCRマシンを使用してサイクリングを実行する。
3.AB Genetic Analyzer(商標)で電気泳動を設定する。
4.GeneMapper(商標)ソフトウェアを使用して、STR対立遺伝子プロファイリングを生成する。
5.STR対立遺伝子プロファイリングを報告する。
STR増幅ワークフローの結果:24対の数字−現在、個々のDNAのデジタル指紋を含む、対立遺伝子型としても知られている。
追加的に、試料がDNAを含有しない、非ヒトDNAを含有する、または2つ以上の個々のDNAを含有する場合、警告フラグが立ち得る。
ステップ2.WGSまたはWESワークフロー(ステップ1と並行して実施され得る)
1.同じ試料(または同じ個体由来の別の試料)を使用して、PCRを含まないIllumina WGS(商標)ライブラリ(WGS(商標)ライブラリは、生体認証マーカーDNA断片を自然に含む)を作製する。代替的に、またはそれに追加的に、同じ試料(または同じ個体由来の別の試料)を使用して、溶液捕捉標的アプローチを使用して、IDT xGEN(商標)WESプローブ、ミトコンドリアパネル、および/または表Iに示されるカスタム生体認証マーカープローブと結合した市販のKAPAHyper(商標)バーコード化ペアエンドライブラリを使用してWES(商標)ライブラリを作製する。表Iのカスタム生体認証マーカープローブは、WES(商標)ライブラリのバイオマーカーの近辺で試料DNAを捕捉する。
2.HiSeq(商標)2500もしくは4000、またはNovaSeq(商標)6000、または他のハイスループットシーケンサ上で試料をロードする。
3.脱多重化、マッピング、および診断バリアント呼び出しを含む、配列決定後解析を実施する。
4.(lobSTR(商標)などの、特殊なソフトウェアを使用して)STR対立遺伝子プロファイルを計算的に決定する。
5.WGSデータによって呼び出されるSTRを報告する。
1.同じ試料(または同じ個体由来の別の試料)を使用して、PCRを含まないIllumina WGS(商標)ライブラリ(WGS(商標)ライブラリは、生体認証マーカーDNA断片を自然に含む)を作製する。代替的に、またはそれに追加的に、同じ試料(または同じ個体由来の別の試料)を使用して、溶液捕捉標的アプローチを使用して、IDT xGEN(商標)WESプローブ、ミトコンドリアパネル、および/または表Iに示されるカスタム生体認証マーカープローブと結合した市販のKAPAHyper(商標)バーコード化ペアエンドライブラリを使用してWES(商標)ライブラリを作製する。表Iのカスタム生体認証マーカープローブは、WES(商標)ライブラリのバイオマーカーの近辺で試料DNAを捕捉する。
2.HiSeq(商標)2500もしくは4000、またはNovaSeq(商標)6000、または他のハイスループットシーケンサ上で試料をロードする。
3.脱多重化、マッピング、および診断バリアント呼び出しを含む、配列決定後解析を実施する。
4.(lobSTR(商標)などの、特殊なソフトウェアを使用して)STR対立遺伝子プロファイルを計算的に決定する。
5.WGSデータによって呼び出されるSTRを報告する。
WGSワークフローからの結果:少なくとも21対の数字(および追加のN/D(「未定」)呼び出し)−個々のDNAの独立したデジタル指紋を含む対立遺伝子型。
追加的に、試料がDNAを含有しない、非ヒトDNAを含有する、または2つ以上の個々のDNAを含有する場合、警告フラグが立ち得る。
ステップ3.GlobalFiler(商標)によって呼び出されて、WGSまたはWESまたはパネル配列決定によって呼び出されるSTR対立遺伝子プロファイリングを使用して一致を生成する。
過去の試料から統計的に導き出された推論(ならびに前述のワークフローの両方の広範な科学的検証)を使用して、その後、2つの対立遺伝子型が同じ個体に由来し、個々のDNAの処理中に偶発的なスワップ、混合物、または他の干渉が発生しないことを保証する可能性がある。これは、ステップ2で産生される臨床遺伝子診断が意図される個体のためであることを保証する。
以下に示される対立遺伝子プロファイリング一致表は、本明細書に記載される方法を使用して生成される。
コア生体認証DNA捕捉試薬配列は、表Iに示されるように合成されて、遺伝子標的配列パネル(WESを含む)DNA捕捉試薬に添加され得る。いくつかの実施形態において、より長いDNA試薬配列は、上に示されるコアDNA配列を取り囲む、参照ヒトゲノム配列を使用して、設計されることができる。一実施形態において、IDT xGEN(商標)エクソーム研究パネルv1.0とIDT xGEN(商標)ロックダウンカスタムプローブを使用して、長さ120のオリゴヌクレオチドは、上記の表Iに示されるコア生体認証DNA捕捉試薬配列を含む配列が使用される。
本発明は、上記の実施例を参照して記載されてきたが、修正および変形は、本発明の趣旨および範囲内に包含されることを理解されたい。したがって、本発明は、以下の特許請求の範囲によってのみ限定される。
Claims (21)
- (a)短鎖縦列反復(STR)増幅を介して試料の第1の対立遺伝子型を決定することと、
(b)遺伝子配列決定を介して前記試料の第2の対立遺伝子型を決定することと、
(c)前記第1の対立遺伝子型と前記第2の対立遺伝子型との間の対立遺伝子一致を決定することと
を含む、方法。 - (c)が、対立遺伝子プロファイリング一致表を生成することを含む、請求項1に記載の方法。
- 前記第1の対立遺伝子型および前記第2の対立遺伝子型が単一の対象のものであるかどうかを決定するために統計的確率を計算することをさらに含む、請求項1に記載の方法。
- 前記被験者が、ヒトである、請求項3に記載の方法。
- 前記第1の対立遺伝子型が、GeneMapper(商標)を介して生成される、請求項1に記載の方法。
- 前記第2の対立遺伝子型が、lobSTR(商標)を介して生成される、請求項1に記載の方法。
- 前記試料が、生体試料である、請求項1に記載の方法。
- 前記試料が、全血、血漿、血清、腹水、脳脊髄液、汗、尿、涙、唾液、口腔試料、腔洗浄液(cavity rinse)、排泄物、器官洗浄液(organ rinse)、毛または皮膚である、請求項1に記載の方法。
- 前記試料が、血液である、請求項1に記載の方法。
- 遺伝子配列決定が、全ゲノム配列決定(WGS)、急速全ゲノム配列決定(rWGS)、全エクソーム配列決定(WES)、次世代配列(NGS)、標的遺伝子パネル配列決定、またはそれらの組み合わせを含む、請求項1に記載の方法。
- WESまたは標的遺伝子パネル配列決定が、配列番号1〜41からなる群から選択される1つ以上のオリゴヌクレオチドを有するパネルを含む、請求項10に記載の方法。
- 各オリゴヌクレオチドが、約50〜120ヌクレオチドの長さである、請求項11に記載の方法。
- 各オリゴヌクレオチドが、50ヌクレオチド以上の長さである、請求項11に記載の方法。
- 各オリゴヌクレオチドが、120ヌクレオチド以下の長さである、請求項11に記載の方法。
- (a)および(b)が、並行して実施される、請求項1に記載の方法。
- 配列番号1〜41からなる群から選択される1つ以上のオリゴヌクレオチドを含む、パネル。
- 各オリゴヌクレオチドが、約50〜120ヌクレオチドの長さである、請求項16に記載のパネル。
- 各オリゴヌクレオチドが、50ヌクレオチド以上の長さである、請求項16に記載のパネル。
- 各オリゴヌクレオチドが、120ヌクレオチド以下の長さである、請求項16に記載のパネル。
- (a)メモリに動作可能に接続されている少なくとも1つのプロセッサと、(b)DNA試料中のDNAのPCR増幅から生成された配列情報を含むDNA解析情報を受信するように構成されている受信機コンポーネントと、(c)前記少なくとも1つのプロセッサによって実行され、(i)前記配列情報から対立遺伝子型を決定し、(ii)対立遺伝子プロファイリング一致表を生成し、そして、(iii)第1の対立遺伝子型および第2の対立遺伝子型が単一の対象由来であるかどうかを決定するために統計的確率を計算するように、構成されている、解析コンポーネントと、を備える、遺伝子解析システム。
- (a)メモリに動作可能に接続されている少なくとも1つのプロセッサと、(b)DNA試料中のDNAのPCR増幅から生成された配列情報を含むDNA解析情報を受信するように構成されている受信機コンポーネントと、(c)前記少なくとも1つのプロセッサによって実行され、請求項1に記載の(a)〜(c)を実施するように構成されている、解析コンポーネントと、を備える、遺伝子解析システム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862692366P | 2018-06-29 | 2018-06-29 | |
US62/692,366 | 2018-06-29 | ||
PCT/US2019/039859 WO2020006431A1 (en) | 2018-06-29 | 2019-06-28 | Method and system for sample identity assurance |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2021530203A true JP2021530203A (ja) | 2021-11-11 |
Family
ID=68987607
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020571427A Pending JP2021530203A (ja) | 2018-06-29 | 2019-06-28 | 試料同一性保証のための方法およびシステム |
Country Status (6)
Country | Link |
---|---|
US (1) | US20200005894A1 (ja) |
EP (1) | EP3815091A4 (ja) |
JP (1) | JP2021530203A (ja) |
AU (1) | AU2019291926A1 (ja) |
IL (1) | IL279770A (ja) |
WO (1) | WO2020006431A1 (ja) |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2011207544A1 (en) * | 2010-01-19 | 2012-09-06 | Verinata Health, Inc. | Identification of polymorphic sequences in mixtures of genomic DNA by whole genome sequencing |
US20140163900A1 (en) * | 2012-06-02 | 2014-06-12 | Whitehead Institute For Biomedical Research | Analyzing short tandem repeats from high throughput sequencing data for genetic applications |
WO2014015084A2 (en) * | 2012-07-17 | 2014-01-23 | Counsyl, Inc. | System and methods for detecting genetic variation |
US9181583B2 (en) * | 2012-10-23 | 2015-11-10 | Illumina, Inc. | HLA typing using selective amplification and sequencing |
KR101533792B1 (ko) * | 2015-02-24 | 2015-07-06 | 대한민국 | Ngs 기반 인간 객체의 상염색체 분석방법 |
EP4407622A2 (en) * | 2015-07-14 | 2024-07-31 | Personal Genome Diagnostics Inc. | Neoantigen analysis |
WO2017070497A1 (en) * | 2015-10-21 | 2017-04-27 | Dana-Farber Cancer Institute, Inc. | Methods and compositions for use of driver mutations in cll |
KR101667526B1 (ko) * | 2015-12-30 | 2016-10-19 | 대한민국 | 차세대 염기서열분석법을 이용한 인간 객체의 확장 상염색체 str 분석방법 |
US20170226594A1 (en) * | 2016-02-08 | 2017-08-10 | Wafa Ali Rashed Altayari | Short tandem repeat (str) dna fingerprint method and kit |
US10822647B2 (en) * | 2016-07-12 | 2020-11-03 | Biodynamics S.R.L. | Methods for using long ssDNA polynucleotides as primers (superprimers) in PCR assays |
-
2019
- 2019-06-28 AU AU2019291926A patent/AU2019291926A1/en active Pending
- 2019-06-28 JP JP2020571427A patent/JP2021530203A/ja active Pending
- 2019-06-28 US US16/457,215 patent/US20200005894A1/en active Pending
- 2019-06-28 WO PCT/US2019/039859 patent/WO2020006431A1/en unknown
- 2019-06-28 EP EP19826231.3A patent/EP3815091A4/en not_active Withdrawn
-
2020
- 2020-12-24 IL IL279770A patent/IL279770A/en unknown
Also Published As
Publication number | Publication date |
---|---|
US20200005894A1 (en) | 2020-01-02 |
EP3815091A1 (en) | 2021-05-05 |
WO2020006431A1 (en) | 2020-01-02 |
IL279770A (en) | 2021-03-01 |
AU2019291926A1 (en) | 2021-02-18 |
EP3815091A4 (en) | 2022-03-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kumar et al. | Next-generation sequencing and emerging technologies | |
Goodwin et al. | Oxford Nanopore sequencing, hybrid error correction, and de novo assembly of a eukaryotic genome | |
Liu et al. | Interrogating the “unsequenceable” genomic trinucleotide repeat disorders by long-read sequencing | |
Chen et al. | RNA editome in rhesus macaque shaped by purifying selection | |
EP3631018B1 (en) | Methods to detect large rearrangements in brca1/2 | |
Li et al. | Quality control of RNA-seq experiments | |
CN108138227A (zh) | 使用具有独特分子索引(umi)的冗余读段在测序dna片段中抑制误差 | |
JP7171709B2 (ja) | 圧縮分子タグ付き核酸配列データを用いた融合の検出のための方法 | |
KR20190112843A (ko) | 희귀 돌연변이 및 카피수 변이를 검출하기 위한 시스템 및 방법 | |
Barone et al. | HLA-genotyping of clinical specimens using Ion Torrent-based NGS | |
CN113614246A (zh) | 用于鉴别肿瘤模型的方法和组合物 | |
US20150344977A1 (en) | Method And System For Detection Of An Organism | |
US20160319347A1 (en) | Systems and methods for detection of genomic variants | |
JP2020532999A (ja) | 非侵襲性の移植前遺伝子診断のためのシステムおよび方法 | |
CN114657261B (zh) | 一种与绵羊胸椎数相关的snp分子标记、引物组、试剂盒及检测方法和应用 | |
EP1889924B1 (en) | Method of designing probes for detecting target sequence and method of detecting target sequence using the probes | |
JP7532396B2 (ja) | パートナー非依存性遺伝子融合検出のための方法 | |
JP2022537442A (ja) | ヒト胚におけるコピー数変異を検証するために単一ヌクレオチド変異の密度を使用するシステム、コンピュータプログラム製品及び方法 | |
JP2021530203A (ja) | 試料同一性保証のための方法およびシステム | |
JP7446343B2 (ja) | ゲノム倍数性を判定するためのシステム、コンピュータプログラム及び方法 | |
US20190373871A1 (en) | Method for assaying genetic variants | |
US20040126800A1 (en) | Regulatory single nucleotide polymorphisms and methods therefor | |
WO2024010809A2 (en) | Methods and systems for detecting recombination events | |
CN118186097A (zh) | 降解检材个体识别的snp复合体系 | |
Liharska et al. | Transcriptomics: Approaches to Quantifying Gene Expression and Their Application to Studying the Human Brain |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210304 Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210305 |