ES2962223T3 - Métodos para unir adaptadores a ácidos nucleicos de muestra - Google Patents
Métodos para unir adaptadores a ácidos nucleicos de muestra Download PDFInfo
- Publication number
- ES2962223T3 ES2962223T3 ES21157081T ES21157081T ES2962223T3 ES 2962223 T3 ES2962223 T3 ES 2962223T3 ES 21157081 T ES21157081 T ES 21157081T ES 21157081 T ES21157081 T ES 21157081T ES 2962223 T3 ES2962223 T3 ES 2962223T3
- Authority
- ES
- Spain
- Prior art keywords
- adapters
- sample
- stranded
- molecules
- nucleic acid
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 150000007523 nucleic acids Chemical class 0.000 title abstract description 117
- 102000039446 nucleic acids Human genes 0.000 title abstract description 108
- 108020004707 nucleic acids Proteins 0.000 title abstract description 108
- 238000000034 method Methods 0.000 title abstract description 60
- 239000002773 nucleotide Substances 0.000 claims abstract description 71
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 71
- 108091034117 Oligonucleotide Proteins 0.000 claims description 10
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 claims description 7
- 108010006785 Taq Polymerase Proteins 0.000 claims description 5
- 108010017826 DNA Polymerase I Proteins 0.000 claims description 4
- 102000004594 DNA Polymerase I Human genes 0.000 claims description 4
- 238000012163 sequencing technique Methods 0.000 abstract description 45
- 230000003321 amplification Effects 0.000 abstract description 15
- 238000003199 nucleic acid amplification method Methods 0.000 abstract description 15
- 239000000523 sample Substances 0.000 description 97
- 108020004414 DNA Proteins 0.000 description 68
- 206010028980 Neoplasm Diseases 0.000 description 49
- 201000011510 cancer Diseases 0.000 description 32
- 102000040430 polynucleotide Human genes 0.000 description 28
- 108091033319 polynucleotide Proteins 0.000 description 28
- 239000002157 polynucleotide Substances 0.000 description 28
- 210000004027 cell Anatomy 0.000 description 25
- 201000010099 disease Diseases 0.000 description 25
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 25
- 238000006243 chemical reaction Methods 0.000 description 22
- 239000012634 fragment Substances 0.000 description 17
- 238000004458 analytical method Methods 0.000 description 14
- 230000000694 effects Effects 0.000 description 14
- 102000053602 DNA Human genes 0.000 description 13
- 102000004190 Enzymes Human genes 0.000 description 13
- 108090000790 Enzymes Proteins 0.000 description 13
- 210000001124 body fluid Anatomy 0.000 description 11
- 239000010839 body fluid Substances 0.000 description 11
- 239000000203 mixture Substances 0.000 description 11
- 230000035772 mutation Effects 0.000 description 11
- 238000009826 distribution Methods 0.000 description 10
- 238000012937 correction Methods 0.000 description 8
- 230000002068 genetic effect Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 6
- 210000004369 blood Anatomy 0.000 description 6
- 239000008280 blood Substances 0.000 description 6
- 238000007481 next generation sequencing Methods 0.000 description 6
- 210000002381 plasma Anatomy 0.000 description 6
- 108090000623 proteins and genes Proteins 0.000 description 6
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 5
- 108060002716 Exonuclease Proteins 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 102000013165 exonuclease Human genes 0.000 description 4
- 208000015181 infectious disease Diseases 0.000 description 4
- 210000002966 serum Anatomy 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 210000001519 tissue Anatomy 0.000 description 4
- 108010047956 Nucleosomes Proteins 0.000 description 3
- 230000004075 alteration Effects 0.000 description 3
- 238000001574 biopsy Methods 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 230000002759 chromosomal effect Effects 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 230000007614 genetic variation Effects 0.000 description 3
- 210000004602 germ cell Anatomy 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 210000001623 nucleosome Anatomy 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000008439 repair process Effects 0.000 description 3
- 230000000392 somatic effect Effects 0.000 description 3
- 238000002560 therapeutic procedure Methods 0.000 description 3
- 239000000439 tumor marker Substances 0.000 description 3
- 210000002700 urine Anatomy 0.000 description 3
- 241000124008 Mammalia Species 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- 208000000453 Skin Neoplasms Diseases 0.000 description 2
- 108020003224 Small Nucleolar RNA Proteins 0.000 description 2
- 102000042773 Small Nucleolar RNA Human genes 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 208000036878 aneuploidy Diseases 0.000 description 2
- 231100001075 aneuploidy Toxicity 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 239000006227 byproduct Substances 0.000 description 2
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- 210000003722 extracellular fluid Anatomy 0.000 description 2
- 238000007672 fourth generation sequencing Methods 0.000 description 2
- 210000002865 immune cell Anatomy 0.000 description 2
- 230000003902 lesion Effects 0.000 description 2
- -1 less than 500 Chemical class 0.000 description 2
- 210000000265 leukocyte Anatomy 0.000 description 2
- 230000001717 pathogenic effect Effects 0.000 description 2
- 230000026731 phosphorylation Effects 0.000 description 2
- 238000006366 phosphorylation reaction Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000004393 prognosis Methods 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 208000030507 AIDS Diseases 0.000 description 1
- 206010069754 Acquired gene mutation Diseases 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 206010005949 Bone cancer Diseases 0.000 description 1
- 208000018084 Bone neoplasm Diseases 0.000 description 1
- 208000003174 Brain Neoplasms Diseases 0.000 description 1
- 208000024172 Cardiovascular disease Diseases 0.000 description 1
- 208000037051 Chromosomal Instability Diseases 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 108091028732 Concatemer Proteins 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 101100408379 Drosophila melanogaster piwi gene Proteins 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 208000005016 Intestinal Neoplasms Diseases 0.000 description 1
- 208000008839 Kidney Neoplasms Diseases 0.000 description 1
- 108020005198 Long Noncoding RNA Proteins 0.000 description 1
- 206010025323 Lymphomas Diseases 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 208000003445 Mouth Neoplasms Diseases 0.000 description 1
- 208000010505 Nose Neoplasms Diseases 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 1
- 208000037581 Persistent Infection Diseases 0.000 description 1
- 208000002151 Pleural effusion Diseases 0.000 description 1
- 208000020584 Polyploidy Diseases 0.000 description 1
- 208000032236 Predisposition to disease Diseases 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 206010036790 Productive cough Diseases 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 208000015634 Rectal Neoplasms Diseases 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 208000005718 Stomach Neoplasms Diseases 0.000 description 1
- 108091046869 Telomeric non-coding RNA Proteins 0.000 description 1
- 206010043515 Throat cancer Diseases 0.000 description 1
- 208000024770 Thyroid neoplasm Diseases 0.000 description 1
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000006154 adenylylation Effects 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 210000003567 ascitic fluid Anatomy 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 210000001772 blood platelet Anatomy 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 230000003822 cell turnover Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000004836 empirical method Methods 0.000 description 1
- 210000002889 endothelial cell Anatomy 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 230000001973 epigenetic effect Effects 0.000 description 1
- 230000004049 epigenetic modification Effects 0.000 description 1
- 210000003743 erythrocyte Anatomy 0.000 description 1
- 230000001605 fetal effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 230000004545 gene duplication Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000004077 genetic alteration Effects 0.000 description 1
- 210000003731 gingival crevicular fluid Anatomy 0.000 description 1
- 201000005787 hematologic cancer Diseases 0.000 description 1
- 208000024200 hematopoietic and lymphoid system neoplasm Diseases 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000007834 ligase chain reaction Methods 0.000 description 1
- 208000014018 liver neoplasm Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 230000001926 lymphatic effect Effects 0.000 description 1
- 230000008774 maternal effect Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 210000003097 mucus Anatomy 0.000 description 1
- 208000037830 nasal cancer Diseases 0.000 description 1
- 230000017074 necrotic cell death Effects 0.000 description 1
- 238000007857 nested PCR Methods 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 239000013610 patient sample Substances 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000012175 pyrosequencing Methods 0.000 description 1
- 239000011535 reaction buffer Substances 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000007086 side reaction Methods 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000037439 somatic mutation Effects 0.000 description 1
- 210000003802 sputum Anatomy 0.000 description 1
- 208000024794 sputum Diseases 0.000 description 1
- 210000004243 sweat Anatomy 0.000 description 1
- 210000001179 synovial fluid Anatomy 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 230000002792 vascular Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6853—Nucleic acid amplification reactions using modified primers or templates
- C12Q1/6855—Ligating adaptors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1065—Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2525/00—Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
- C12Q2525/10—Modifications characterised by
- C12Q2525/191—Modifications characterised by incorporating an adaptor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2533/00—Reactions characterised by the enzymatic reaction principle used
- C12Q2533/10—Reactions characterised by the enzymatic reaction principle used the purpose being to increase the length of an oligonucleotide strand
- C12Q2533/107—Probe or oligonucleotide ligation
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Analytical Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Immunology (AREA)
- Biomedical Technology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Plant Pathology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
Se describen métodos para preparar ácidos nucleicos bicatenarios con salientes monocatenarios para amplificación y secuenciación. El contacto de moléculas de ácido nucleico bicatenario de extremos romos con Taq da como resultado la adición dirigida sin plantilla de un solo nucleótido a los extremos 3' del ácido nucleico con A agregado con mayor frecuencia seguido de G seguido de C y T. La cola G es suficientemente frecuente que la eficiencia de la ligación de moléculas de ácido nucleico a adaptadores se puede aumentar significativamente al incluir adaptadores con colas T y C. La eficiencia de la ligación se puede aumentar aún más con adaptadores de extremos romos para ligar a moléculas de ácido nucleico de extremos romos que fallaron. someterse a relaves. (Traducción automática con Google Translate, sin valor legal)
Description
DESCRIPCIÓN
Métodos para unir adaptadores a ácidos nucleicos de muestra
ANTECEDENTES
[0001]El cáncer es una de las principales causas de enfermedad a nivel mundial. Cada año, decenas de millones de personas son diagnosticadas de cáncer en todo el mundo, y más de la mitad acaban muriendo a causa del mismo. En muchos países, el cáncer es la segunda causa de muerte más frecuente tras las enfermedades cardiovasculares. La detección temprana de la enfermedad está asociada con unos resultados más positivos en muchos tipos de cáncer.
[0002]A menudo, el cáncer se detecta mediante biopsias de tumores, seguidas de un análisis de las células, los marcadores o el ADN extraído de las células. Sin embargo, más recientemente se ha propuesto que el cáncer también puede detectarse a partir de ácidos nucleicos libres de células que están presentes en los fluidos corporales, como la sangre o la orina (ver, por ejemplo, Siravegna et al., Nature Reviews, 2017). Estas pruebas tienen la ventaja de no ser invasivas y pueden realizarse sin tener que identificar mediante biopsia las células sospechosas de ser cancerosas. No obstante, la cantidad de ácido nucleico en los fluidos corporales es muy baja. Por consiguiente, estos análisis requieren métodos eficientes para convertir el ADN nativo libre de células -presente en los fluidos corporales- en formas susceptibles de analizarse.
[0003]Preparar las moléculas de ADN a partir de muestras de pacientes para su posterior análisis suele requerir que se reparen primero los salientes monocatenarios para permitir la ligación a los adaptadores para su amplificación y secuenciación. La reparación puede llevarse a cabo digiriendo la cadena saliente o extendiendo la cadena opuesta para producir un extremo romo, seguido de la fosforilación de los extremos 5' y la ligación del extremo romo a los adaptadores. De manera alternativa, tras la creación de extremos romos, los extremos romos pueden poliadenilarse con una polimerasa Taq. Los fragmentos poliadenilados se aparean y se ligan con adaptadores que incluyen una cola T de un solo nucleótido en el extremo 3'. Esta configuración favorece la ligación deseada de adaptador-molécula de ADN, pero la eficiencia de conversión global de las moléculas de ADN en una muestra con respecto a las moléculas que pueden secuenciarse puede seguir siendo inaceptablemente baja en el caso de las muestras en las que solo están disponibles pequeñas cantidades de ácido nucleico.
[0004]El documento WO 2015/044262 describe composiciones enzimáticas para la reparación, adenilación y fosforilación de extremos de ADN. El documento WO 2016/135300 desvela diversos métodos y kits para mejorar la eficiencia en la construcción de bibliotecas de secuenciación de próxima generación. Wu et al. (Nat. Methods, 9, i-ii, 2012) describen métodos para una creación más rápida de bibliotecas de secuenciación de próxima generación.
RESUMEN
[0005]La invención proporciona un kit que comprende adaptadores que son al menos parcialmente bicatenarios con un saliente de un solo nucleótido T en el extremo 3' (adaptadores con cola T) y adaptadores que son al menos parcialmente bicatenarios con un saliente de un solo nucleótido C en el extremo 3' (adaptadores con cola C).
[0006]En algunas realizaciones, la relación molar de los adaptadores al menos parcialmente bicatenarios con un saliente de un solo nucleótido T con respecto al saliente de un solo nucleótido C es de entre 4:1 y 2:1, por ejemplo 3:1. En algunas realizaciones, el porcentaje de adaptadores de cola C con respecto a los adaptadores de cola T es de aproximadamente un 5-40% en moles, por ejemplo un 10-35%, un 15-25%, un 20-35%, un 25-35% o aproximadamente un 30%.
[0007]En algunas realizaciones, el kit también comprende adaptadores al menos parcialmente bicatenarios con extremos romos. En algunas realizaciones, la relación molar de los adaptadores de extremo romo respecto a los adaptadores con cola es de entre 1:5 y 1:500, por ejemplo de entre 1:10 y 1:100. En algunas realizaciones, los adaptadores de extremo romo están presentes con una relación molar de un 0,2-20%, o un 0,5-15% o un 1-10% respecto a los adaptadores con cola T y los adaptadores con cola C.
[0008]En algunas realizaciones, el kit también comprende una polimerasa T4 o un fragmento de Klenow grande; y/o una polimerasa Taq. En algunas realizaciones, el kit también comprende cuatro tipos de nucleótidos estándar.
[0009]En algunas realizaciones, el kit carece de adaptadores al menos parcialmente bicatenarios con colas 3' de un solo nucleótido A, y de adaptadores al menos parcialmente bicatenarios con colas 3' de un solo nucleótido G.
[0010]En algunas realizaciones, los adaptadores son adaptadores en forma de Y. En algunas realizaciones, los adaptadores comprenden oligonucleótidos de SEQ ID n.° 1 y 2, y 3 y 2.
[0011]En algunas realizaciones, los adaptadores comprenden un primer sitio de unión y/o un código de barras. En algunas realizaciones, los códigos de barras proporcionan entre 64 y 90000, entre 400 y 22500, entre 400 y 14400 o entre 900 y 14400 combinaciones de códigos de barras diferentes.
[0012]Un kit de la invención puede ser útil en un método para preparar ácidos nucleicos para su análisis, que incluye: (a) crear ácidos nucleicos bicatenarios de extremos romos con salientes monocatenarios en una muestra mediante la acción de una o más enzimas que proporcionan actividad polimerasa 5'-3' y actividad de corrección de errores 3'-5', y cuatro tipos de nucleótidos estándar, de manera que los salientes monocatenarios con extremos 5' sirven como plantillas para la extensión de una cadena complementaria mediante la actividad polimerasa, y los salientes monocatenarios con extremos 3' se digieren mediante la actividad de corrección de errores produciendo ácidos nucleicos de extremos romos; (b) sin separar los ácidos nucleicos de extremos romos del resto de componentes de la muestra, añadir colas en los extremos de los ácidos nucleicos de extremos romos mediante la acción de una polimerasa sin función de corrección de errores 3'-5' que lleva a cabo una adición dirigida sin plantilla de un nucleótido a los extremos 3' de los ácidos nucleicos de extremos romos, de manera que A se añade preferentemente a G o preferentemente a C o T; (c) aparear los ácidos nucleicos del paso (c) con adaptadores al menos parcialmente bicatenarios con salientes de un solo nucleótido T o C en el extremo 3'; y (d) ligar los ácidos nucleicos con los adaptadores. Opcionalmente, el método también incluye desnaturalizar las una o más enzimas tras el paso (a). Opcionalmente, el método también incluye poner en contacto la muestra con las una o más enzimas, los cuatro tipos de nucleótidos estándar y la polimerasa sin una función de corrección de errores 3'-5'. Opcionalmente, la muestra se pone en contacto a la vez con las una o más enzimas, los cuatro tipos de nucleótidos estándar y la polimerasa sin una función de corrección de errores 3'-5'. Opcionalmente, el paso (b) se lleva a cabo a una mayor temperatura que el paso (a). Opcionalmente, el paso (a) se lleva a cabo a temperatura ambiente y el paso (b) se lleva a cabo a una temperatura de más de 60°C. Opcionalmente, las una o más enzimas son una polimerasa con actividad polimerasa 5'-3' y actividad de corrección de errores 3'-5'. Opcionalmente, la polimerasa sin una función de corrección de errores 3'-5' es una polimerasa termostábil y el método también incluye aumentar la temperatura de la muestra tras el paso (a) para inactivar la polimerasa con actividad polimerasa 5'-3' y actividad de corrección de errores 3'-5'. Opcionalmente, el también incluye (e) amplificar los ácidos nucleicos ligados a los adaptadores; y (f) analizar los ácidos nucleicos.
[0013]Opcionalmente, el método también incluye poner en contacto la muestra con adaptadores al menos parcialmente bicatenarios de extremos romos que se ligan con ácidos nucleicos bicatenarios de extremos romos que no han recibido la adición dirigida sin plantilla de un nucleótido a los extremos 3' durante el paso de ligación. Opcionalmente, la primera polimerasa es una polimerasa T4 o un fragmento de Klenow grande. Opcionalmente, la segunda polimerasa es una polimerasa Taq. Opcionalmente, al menos los pasos (a)-(e) se llevan a cabo en un solo tubo. Opcionalmente, los pasos (a)-(f) o (a) a (g) se llevan a cabo en un solo tubo. Opcionalmente, la relación molar de los adaptadores al menos parcialmente bicatenarios con un solo nucleótido T con respecto a los de un solo nucleótido C es de entre 4:1 y 2:1, preferiblemente 3:1. Opcionalmente, la relación molar de los adaptadores de extremo romo respecto a los adaptadores con cola es de entre 1:5 y 1:500, preferiblemente de entre 1:10 y 1:100. Opcionalmente, al menos un 70% de los ácidos nucleicos bicatenarios de la muestra se unen a los adaptadores. Opcionalmente, se analizan al menos un 70% de los ácidos nucleicos bicatenarios disponibles en la muestra. Opcionalmente, el paso (f) comprende secuenciar los ácidos nucleicos ligados a los adaptadores. Opcionalmente, en la secuenciación se secuencia un nucleótido que ha formado un saliente en el paso (c) o (d).
[0014]Un kit de la presente invención también puede ser útil en un método para convertir ADN bicatenario en ADN marcado con adaptadores, que incluye: (a) poner en contacto una población de moléculas de ADN bicatenario con una población de adaptadores al menos parcialmente bicatenarios, de manera que: (i) la población de moléculas de ADN bicatenario comprende moléculas de ADN que comprenden un saliente con un solo nucleótido A y moléculas de ADN que comprenden un saliente con un solo nucleótido G, de manera que en la población los salientes con un solo nucleótido A son más abundantes (por ejemplo, 10 veces, 100 veces, 1000 veces) que los salientes con un solo nucleótido G, y (ii) la población de adaptadores al menos parcialmente bicatenarios comprende adaptadores que comprenden un saliente con un solo nucleótido T y adaptadores que comprenden un saliente con un solo nucleótido C; y (b) ligar los adaptadores con las moléculas de ADN, de manera que la ligación produce ADN marcado con adaptadores.
[0015]Opcionalmente, (i) la población de moléculas de ADN bicatenario también comprende al menos uno de los siguientes: moléculas de ADN que comprenden un saliente con un solo nucleótido C, moléculas de ADN que comprenden un saliente con un solo nucleótido T, o un extremo romo, y (ii) la población de adaptadores al menos parcialmente bicatenarios también comprende al menos uno de los siguientes: adaptadores que comprenden un saliente con un solo nucleótido G, adaptadores que comprenden un saliente con un solo nucleótido A, o un extremo romo. Opcionalmente, los adaptadores al menos parcialmente bicatenarios comprenden un sitio de unión del cebador de NGS ('secuenciación de próxima generación') y un código de barras de ADN. Opcionalmente, la población de adaptadores al menos parcialmente bicatenarios comprende múltiples códigos de barras de ADN diferentes. Opcionalmente, el número de combinaciones de códigos de barras que pueden unirse a ambos extremos de una molécula de ADN bicatenario es menor que el número de moléculas de ADN bicatenario presentes en la población, por ejemplo entre 5 y 10 000 combinaciones diferentes. Opcionalmente, el método también incluye: (c) amplificar el ADN marcado con adaptadores utilizando cebadores de amplificación que comprenden un código de barras de índice de muestra y una secuencia de nucleótidos adaptada para hibridarse con un oligonucleótido inmovilizado en un soporte de celdas de flujo.
Opcionalmente, los adaptadores son adaptadores en forma de Y. Opcionalmente, la muestra es una muestra de fluido corporal, como sangre entera, suero o plasma. Opcionalmente, la población de ácido nucleico es una población de ácido nucleico libre de células. Opcionalmente, la muestra procede de un sujeto sospechoso de padecer cáncer. Opcionalmente, el paso de análisis detecta una variante somática o de línea germinal, una variación en el número de copias, una variación de un solo nucleótido (SNV), un indel o una fusión de genes.
[0016]Puede producirse una población de ácidos nucleicos adaptados utilizando un kit de la presente invención, de manera que la población comprende una pluralidad de moléculas de ácido nucleico y cada una de ellas comprende un fragmento de ácido nucleico flanqueado a ambos lados por un adaptador que incluye un código de barras con un par de bases A/T o G/C entre el fragmento de ácido nucleico y el adaptador. La pluralidad de moléculas de ácido nucleico puede incluir al menos 100000 moléculas. La proporción de pares de bases A/T respecto a pares de bases G/C puede ser de entre 2:1 y 4:1. Al menos un 99% de las moléculas de ácido nucleico de la población pueden tener un fragmento de ácido nucleico flanqueado por adaptadores con diferentes códigos de barras.
BREVE DESCRIPCION DE LA FIGURA
[0017]La Figura 1 (FIG. 1) muestra adaptadores -de ADN de muestra- en forma de Y, de extremos romos, marcados y de unión a colas de T y colas de C.
DEFINICIONES
[0018]El término 'sujeto' hace referencia a un animal, como una especie de mamífero (preferiblemente un ser humano) o una especie aviar (es decir, un pájaro), u otro organismo, por ejemplo una planta. Más específicamente, un sujeto puede ser un vertebrado, por ejemplo un mamífero, como un ratón, un primate, un simio o un ser humano. Los animales incluyen los animales de granja, los animales relacionados con el deporte y las mascotas. El sujeto puede ser un individuo sano, un individuo que padece una enfermedad o es sospechoso de padecer una enfermedad o tiene una predisposición a las enfermedades, o bien un individuo que necesita terapia o se sospecha que puede necesitar terapia.
[0019]Una variante genética es una alteración, una variante o un polimorfismo en una muestra de ácido nucleico o en el genoma de un sujeto. Dicha alteración, variante o polimorfismo puede producirse con respecto a un genoma de referencia, que puede ser un genoma de referencia del sujeto o de otro individuo. Las variaciones incluyen una o más variaciones de un solo nucleótido (SNVs), inserciones, deleciones, repeticiones, pequeñas inserciones, pequeñas deleciones, pequeñas repeticiones, uniones de variantes estructurales, repeticiones en tándem de longitud variable, y/o secuencias de flanqueo, variaciones en el número de copias (CNVs), transversiones y otros reordenamientos que también constituyen formas de variación genética. Una variación puede ser un cambio de base, una inserción, una deleción, una repetición, una variación del número de copias, una transversión o una combinación de las mismas.
[0020]Un marcador de cáncer es una variante genética asociada con la presencia o el riesgo de desarrollar cáncer. Un marcador de cáncer puede proporcionar un indicio de que un sujeto padece cáncer o tiene un mayor riesgo de desarrollar cáncer que un sujeto de la misma especie y de la misma edad y sexo. Un marcador de cáncer puede causar cáncer o no.
[0021]Una etiqueta de ácido nucleico es un ácido nucleico corto (por ejemplo, con una longitud de menos de 100, 50 o 10 nucleótidos), normalmente de una secuencia artificial y normalmente de ADN, que se usa para etiquetar los ácidos nucleicos de muestra a fin de diferenciar los ácidos nucleicos de diferentes muestras (por ejemplo, que constituyen un índice de muestras), de diferentes tipos o que han sido sometidos a diferentes procesos. Las etiquetas pueden ser de cadena simple o de cadena doble. Las etiquetas nucleicas pueden descodificarse para revelar información como la muestra de origen, la forma o el procesamiento de un ácido nucleico. Las etiquetas pueden usarse para permitir el agrupamiento y el procesamiento paralelo de múltiples ácidos nucleicos que portan diferentes etiquetas, de manera que los ácidos nucleicos se desgranan posteriormente leyendo las etiquetas. Las etiquetas también pueden denominarse 'códigos de barras' o 'identificadores moleculares'.
[0022]Los adaptadores son ácidos nucleicos cortos (por ejemplo, con una longitud de menos de 500, 100 o 50 nucleótidos y normalmente de ADN) que normalmente son al menos parcialmente bicatenarios para formar enlaces con uno o ambos extremos de una molécula de ácido nucleico de muestra. Los adaptadores pueden incluir sitios de unión de cebadores para permitir la amplificación de una molécula de ácido nucleico de muestra flanqueada por adaptadores en ambos extremos, y/o un sitio de unión del cebador de secuenciación, incluidos los sitios de unión de cebadores para secuencias de próxima generación. Los adaptadores también pueden incluir sitios de unión para sondas de captura, como un oligonucleótido unido a un soporte de celdas de flujo. Los adaptadores también pueden incluir una etiqueta tal y como se ha descrito anteriormente. Preferiblemente, las etiquetas se posicionan en relación con el cebador y los sitios de unión del cebador de secuenciación, de tal manera que se incluye una etiqueta en los amplicones y las lecturas de secuenciación de un ácido nucleico de muestra. A los respectivos extremos de una molécula de muestra pueden unirse los mismos adaptadores o adaptadores diferentes. A veces, se une el mismo adaptador a los respectivos extremos, pero la etiqueta es diferente. Uno de los adaptadores preferidos es un adaptador en forma de Y en el que un extremo es un extremo romo o con cola, tal y como se describe en el presente documento, para unirse a un ácido nucleico de muestra, que también tiene un extremo romo -o una cola- y un nucleótido complementario. Otro adaptador preferido es un adaptador en forma de campana que, de manera similar, tiene un extremo romo o con cola para unirse al ácido nucleico que ha de analizarse.
[0023]Los cuatro tipos de nucleótidos estándar son A, C, G, T para los desoxirribonucleótidos, y A, C, T y U para los ribonucleótidos.
DESCRIPCIÓN DETALLADA
1. General
[0024]La preparación de muestras para las plataformas de secuenciación de nueva generación sigue a menudo un protocolo similar. Normalmente, las muestras contienen fragmentos de ácido nucleico bicatenario con salientes monocatenarios. Estos fragmentos pueden tener extremos romos y ligarse a los adaptadores directamente. Pero dichas ligaciones también generan subproductos en los que los adaptadores o fragmentos forman concatémeros. La formación de estos subproductos puede reducirse mediante un procedimiento alternativo en el que los fragmentos de extremos romos se poliadenilan y se ligan a adaptadores con cola T. Los kits comerciales que llevan a cabo la reparación de extremos y la adición de una cola en un solo tubo son rápidos y fáciles de usar y pueden usarse con adaptadores que están disponibles comercialmente. (Por ejemplo, NEBNext Ultra II; New England Biolabs, Ipswich, Massachusetts, Estados Unidos). Sin embargo, el uso de kits que no están optimizados para la poliadenilación puede dar como resultado la adición de colas de otros nucleótidos, como G, T y C. El resultado de una adición de colas ineficiente es una ligación ineficiente de los adaptadores y unas bibliotecas de baja complejidad.
[0025]Un kit de la invención puede ser útil en métodos mejorados para preparar ácidos nucleicos bicatenarios (preferiblemente ADN) con salientes monocatenarios para su amplificación y posterior análisis, particularmente una secuenciación. Se ha descubierto que poner en contacto ácidos nucleicos bicatenarios y de extremos romos con Taq en presencia de los cuatro tipos de nucleótidos estándar da como resultado una adición dirigida sin plantilla de un solo nucleótido a los extremos 3' del ácido nucleico, de tal manera que más frecuentemente se añade A, seguida de G y seguida de C y T. Si bien la inclusión de moléculas de ácido nucleico adicionales aumenta el potencial de reacciones secundarias fuera del objetivo, se ha descubierto que la proporción de adición de colas de G no es lo suficientemente alta con respecto a la adición de colas de una sola A y que la eficiencia de ligación de las moléculas de ácido nucleico de una muestra a los adaptadores puede aumentarse de manera considerable incluyendo una mezcla personalizada de adaptadores con adición de colas no solo de T (como en los métodos anteriores), sino también de C, de manera que dichos adaptadores se aparean respectivamente con los extremos 3' de las moléculas de ADN con colas de A y G. La eficiencia de ligación puede aumentarse aún más incluyendo también adaptadores de extremos romos (es decir, a los que no se les ha añadido ninguna cola con nucleótidos) para ligar las moléculas de ácido nucleico de extremos romos de la muestra que no han conseguido recibir una de adición de cola de ningún nucleótido.
2. Muestras
[0026]Una muestra puede ser cualquier muestra biológica aislada de un sujeto. Las muestras pueden incluir tejidos corporales, como tumores sólidos conocidos o sospechados, sangre entera, plaquetas, suero, plasma, heces, glóbulos rojos, glóbulos blancos o leucocitos, células endoteliales, biopsias tisulares, fluido cerebroespinal, fluido sinovial, fluido linfático, líquido ascítico, fluido intersticial o extracelular, el fluido de los espacios entre células, incluido el líquido crevicular gingival, médula ósea, efusiones pleurales, fluido cerebroespinal, saliva, mocos, esputos, semen, sudor u orina. Preferiblemente, las muestras son fluidos corporales, especialmente sangre y fracciones de esta, y orina. Una muestra puede estar aislada originalmente de un sujeto o puede haberse sometido a un procesamiento adicional para eliminar o añadir componentes, por ejemplo células, o para enriquecer un componente con respecto a otro. Por consiguiente, un fluido corporal preferido para su análisis es el plasma o suero que contiene ácidos nucleicos libres de células.
[0027]El volumen de plasma puede depender de la profundidad de lectura deseada para las regiones secuenciadas. Algunos volúmenes ejemplares son 0,4-40 mL, 5-20 mL, 10-20 mL. Por ejemplo, el volumen puede ser de 0,5 mL, 1 mL, 5 mL, 10 mL, 20 mL, 30 mL o 40 mL. El volumen de plasma muestreado puede ser, por ejemplo, de 5 a 20 mL.
[0028]Una muestra puede comprender diversas cantidades de ácido nucleico que contiene equivalentes genómicos. Por ejemplo, una muestra de aproximadamente 30 ng de ADN puede contener aproximadamente 10000 equivalentes del genoma humano haploide y, en el caso del ADN libre de células, aproximadamente 200000 millones de moléculas de ácido nucleico individuales. De manera similar, una muestra de aproximadamente 100 ng de ADN puede contener aproximadamente 30 000 equivalentes del genoma humano haploide y, en el caso del ADN libre de células, aproximadamente 600 000 millones de moléculas individuales. Algunas muestras contienen 1-500, 2-100, 5-150 ng de ADN libre de células, por ejemplo 5-30 ng o 10-150 ng de ADN libre de células.
[0029]Una muestra puede comprender ácidos nucleicos de diferentes fuentes. Por ejemplo, una muestra puede comprender ADN de línea germinal o ADN somático. Una muestra puede comprender ácidos nucleicos que son portadores de mutaciones. Por ejemplo, una muestra puede comprender ADN que porta mutaciones de la línea germinal y/o mutaciones somáticas. Una muestra también puede comprender ADN que porta mutaciones asociadas al cáncer (por ejemplo, mutaciones somáticas asociadas al cáncer).
[0030] Las cantidades ejemplares de ácidos nucleicos libres de células presentes en una muestra antes de la amplificación son de entre aproximadamente 1 fg y aproximadamente 1 |jg, por ejemplo de 1 pg a 200 ng, de 1 ng a 100 ng, o de 10 ng a 1000 ng. Por ejemplo, la cantidad puede ser de hasta aproximadamente 600 ng, de hasta aproximadamente 500 ng, de hasta aproximadamente 400 ng, de hasta aproximadamente 300 ng, de hasta aproximadamente 200 ng, de hasta aproximadamente 100 ng, de hasta aproximadamente 50 ng o de hasta aproximadamente 20 ng de moléculas de ácido nucleico libre de células. La cantidad puede ser de al menos 1 fg, al menos 10 fg, al menos 100 fg, al menos 1 pg, al menos 10 pg, al menos 100 pg, al menos 1 ng, al menos 10 ng, al menos 100 ng, al menos 150 ng o al menos 200 ng de moléculas de ácido nucleico libre de células. La cantidad puede ser de hasta 1 fentogramo (fg), 10 fg, 100 fg, 1 picogramo (pg), 10 pg, 100 pg, 1 ng, 10 ng, 100 ng, 150 ng o 200 ng de moléculas de ácido nucleico libre de células. El método puede comprender obtener de 1 fentogramo (fg) a 200 ng.
[0031] Una muestra ejemplar es de 5-10 ml de sangre entera, plasma o suero que incluye aproximadamente 30 ng de ADN o aproximadamente 10000 equivalentes del genoma haploide.
[0032] Los ácidos nucleicos libres de células son ácidos nucleicos que no están contenidos en una célula o unidos de cualquier otra manera a una célula o, en otras palabras, son los ácidos nucleicos que quedan en una muestra de eliminación de células intactas. Los ácidos nucleicos libres de células incluyen el ADN, el ARN e híbridos de los mismos, lo que incluye el ADN genómico, el ADN mitocondrial, el siRNA, el mi-ARN, el ARN circulante (ARNc), el ARNt, el ARNr, el ARN pequeño nucleolar (snoRNA), el ARN asociado a Piwi (piRNA), el ARN no codificante largo (ncRNA largo), o fragmentos de cualquiera de estos. Los ácidos nucleicos libres de células pueden ser bicatenarios, monocatenarios o un híbrido de estos. Las moléculas de ADN bicatenario -de manera que al menos algunas de ellas tienen salientes monocatenarios- son una forma preferida de ADN libre de células para cualquier método desvelado en el presente documento. Un ácido nucleico libre de células puede liberarse en los fluidos corporales mediante secreción o mediante procesos de muerte celular, por ejemplo la necrosis y la apoptosis. Algunos ácidos nucleicos libres de células se liberan en los fluidos corporales desde células cancerosas, por ejemplo ADN circulante tumoral (ADNct). Otros se liberan desde células sanas.
[0033] Un ácido nucleico libre de células puede presentar una o más modificaciones epigenéticas; por ejemplo, un ácido nucleico libre de células puede estar acetilado, metilado, ubiquitinado, fosforilado, sumoilado, sumoilado, ribosilado y/o citrulinado.
[0034] Los ácidos nucleicos libres de células tienen una distribución de tamaño de unos 100-500 nucleótidos, particularmente de entre 110 y aproximadamente 230 nucleótidos, con un modo de unos 168 nucleótidos y un segundo pico menor de entre 240 y 440 nucleótidos.
[0035] Los ácidos nucleicos libres de células pueden aislarse de los fluidos corporales mediante un paso de partición en el que los ácidos nucleicos libres de células, tal y como se encuentran en la solución, se separan de las células intactas y otros componentes no solubles del fluido corporal. La partición puede incluir técnicas como la centrifugación o la filtración. De manera alternativa, las células de los fluidos corporales pueden lisarse, y los ácidos nucleicos celulares y los ácidos nucleicos libres de células pueden procesarse conjuntamente. Generalmente, tras añadir tampones y pasos de lavado, los ácidos nucleicos pueden precipitarse con un alcohol. También pueden usarse otros pasos de limpieza adicionales, como columnas a base de sílice, para eliminar las sales o los contaminantes. Por ejemplo, durante la reacción pueden añadirse ácidos nucleicos portadores de volumen no específicos para optimizar algunos aspectos del procedimiento, como el rendimiento.
[0036] Después del procesamiento, las muestras pueden incluir varias formas de ácidos nucleicos, incluidos el ADN bicatenario, el ADN monocatenario y el ARN monocatenario. De manera opcional, el ADN y el ARN monocatenarios pueden convertirse en formas bicatenarias para que puedan incluirse en posteriores pasos de análisis y procesamiento.
3. Unión de las moléculas de ácido nucleico de muestra a los adaptadores
[0037] El ácido nucleico presente en una muestra con o sin un procesamiento previo, tal y como se ha descrito anteriormente, suele contener una parte sustancial de moléculas en forma de moléculas parcialmente bicatenarias con salientes monocatenarios. Estas moléculas pueden convertirse en moléculas bicatenarias de extremos romos tratándose con una o más enzimas para proporcionar una polimerasa 5'-3' y una exonucleasa 3'-5' (o función correctora) en presencia de los cuatro tipos de nucleótidos estándar, tal y como se muestra en la parte superior de la Figura 1. Esta combinación de actividades puede extender cadenas con un extremo 3' encastrado, de manera que se alinean por el extremo con el extremo 5' de la cadena opuesta (en otras palabras, se crea un extremo romo), o bien puede digerir cadenas con salientes de 3', de manera que, igualmente, se alinean con el extremo 5' de la cadena opuesta. Opcionalmente, ambas actividades pueden obtenerse mediante una sola polimerasa. Preferiblemente, la polimerasa es sensible al calor, de manera que su actividad puede interrumpirse cuando se eleva la temperatura. Los ejemplos de polimerasas adecuadas incluyen los fragmentos de Klenow grandes y la polimerasa T4.
[0038]Preferiblemente, las una o más enzimas que proporcionan actividad polimerasa 5'-3' y actividad exonucleasa 3'-5' se desnaturalizan subiendo la temperatura o de cualquier otra manera. Por ejemplo, la desnaturalización puede llevarse a cabo subiendo la temperatura a 75°-80° C. Después, se actúa sobre las muestras con una polimerasa que carece de una función correctora (parte central de la Figura 1). Preferiblemente, esta polimerasa es termoestable, de manera que permanece activa a elevadas temperaturas. Las polimerasas Taq, Tth y los fragmentos grandes de Bst son ejemplos de una polimerasa de este tipo. La segunda polimerasa lleva a cabo una adición sin plantilla de un solo nucleótido a los extremos 3' de ácidos nucleicos de extremos romos. Si bien la mezcla de reacción normalmente contiene cantidades molares iguales de cada uno de los cuatro tipos de nucleótidos estándar del paso anterior, los cuatro tipos de nucleótidos no se añaden a los extremos 3' en igual proporción. En lugar de ello, A se añade más frecuentemente, seguida de G y seguida de C y T.
[0039]Después de añadir colas a las moléculas de muestra, y con o sin una posterior purificación de las moléculas de muestra con cola, las moléculas de muestra con cola se ponen en contacto con adaptadores que tienen colas con nucleótidos T y C complementarios en un extremo de los adaptadores (parte inferior de la Figura 1). Normalmente, los adaptadores se forman mediante la síntesis separada y el apareamiento de sus respectivas cadenas. Por lo tanto, las colas de T y C adicionales pueden añadirse como un nucleótido extra en la síntesis de una de las cadenas. Normalmente no se incluyen los adaptadores con colas de G y A, puesto que, si bien estos adaptadores pueden aparearse con moléculas de muestra con colas de C y T, respectivamente, también se aparearían con otros adaptadores. Las moléculas adaptadoras y las moléculas de muestra que contienen nucleótidos complementarios (por ejemplo, T-A y C-G) en sus extremos 3' se aparean y pueden ligarse unas con otras. El porcentaje de adaptadores con colas de C con respecto a los adaptadores con colas de T es de aproximadamente un 5-40% en moles, por ejemplo un 10-35%, un 15-25%, un 20-35%, un 25-35% o aproximadamente un 30%. Puesto que la adición dirigida sin plantilla de un solo nucleótido a los extremos 3' de las moléculas de muestra no llega a completarse del todo, la muestra también contiene algunas moléculas de muestra con extremos romos que no han recibido colas. Estas moléculas pueden recuperarse proporcionando también a la muestra adaptadores que tengan un -y, preferiblemente, sólo un- extremo romo. Normalmente, los adaptadores con extremos romos se proporcionan con un ratio molar de un 0,2-20% o un 0,5-15% o un 1-10% de los adaptadores con adaptadores con colas de T y C. Pueden proporcionarse adaptadores de extremos romos al mismo tiempo, antes o después de los adaptadores con colas de T y C. Los adaptadores de extremos romos que se ligan de nuevo con moléculas de muestra de extremos romos producen moléculas de muestra flanqueadas a ambos lados por adaptadores. Estas moléculas carecen de los pares de nucleótidos A-T o C-G entre las muestras y los adaptadores que están presentes cuando las moléculas de muestra con colas se ligan con los adaptadores con colas.
[0040]Preferiblemente, los adaptadores usados en estas reacciones tienen un -y sólo un- extremo con cola de T o C o un -y sólo un- extremo romo, de manera que pueden ligarse con las moléculas de muestra únicamente en una orientación. Los adaptadores pueden ser, por ejemplo, adaptadores con forma de Y en los que un extremo tiene cola o es romo y el otro extremo tiene dos cadenas simples. Los adaptadores con forma de Y ejemplares tienen las siguientes secuencias, de manera que '(6 bases)' indica una etiqueta. El oligonucleótido superior incluye una cola con una sola base T.
[0041]Adaptador universal:
5’AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGAT
CT (SEQ ID NO. 1).
[0042]
Adaptador, índice 1-12: 5’ GATCGGAAGAGCACACGTCTGAACTCCAGTCAC (6
basesl ATCTCGTATGCCGTCTTCTGCTTG (SEQ ID NO. 2)
[0043]Otro adaptador en forma de Y con una cola de C tiene las siguientes secuencias:
5’AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTT
CCGATCC (SEQ ID NO. 3) y el Adaptador, índice 1-12: 5 ’
GAT CGGAAG AGC AC ACGTC TGA AC TC C AGT C AC
(6 bases! ATCTCGTATGCCGTCTTCTGCTTG (SEQ ID NO. 2)
[0044]Pueden sintetizarse combinaciones personalizadas de estos oligonucleótidos, incluidos los oligonucleótidos con ambas colas (de T y C), para usarse en los métodos de la presente invención.
[0045]Una versión truncada de estas secuencias adaptadoras se describe en Rohland et al., Genome Res., mayo de 2012; 22(5): 939-946.
[0046]Los adaptadores también pueden tener forma de campana con un solo extremo, que tiene cola o es romo. Los adaptadores pueden incluir un sitio de unión de cebadores para amplificación, un sitio de unión para un cebador de secuenciación y/o una etiqueta de ácido nucleico con fines de identificación. En una sola reacción pueden usarse los mismos adaptadores o adaptadores diferentes.
[0047]Cuando los adaptadores incluyen una etiqueta de identificación y los ácidos nucleicos de una muestra se unen a los adaptadores en cada extremo, el número de potenciales combinaciones de identificadores aumenta exponencialmente con el número de etiquetas únicas proporcionadas (es decir, nn combinaciones, donde n es el número de etiquetas de identificación únicas). En algunos métodos, el número de combinaciones de etiquetas únicas es suficiente para que sea estadísticamente probable que todas o prácticamente todas (por ejemplo, al menos un 90%) las diferentes moléculas de ADN bicatenario presentes en la muestra reciban una combinación de etiquetas diferente. En algunos métodos, el número de combinaciones únicas de etiquetas identificadoras es menor que el número de moléculas únicas de ADN bicatenario presentes en la muestra (por ejemplo, 5-10000 combinaciones de etiquetas diferentes).
[0048]Uno de los kits que proporcionan enzimas adecuadas para llevar a cabo los métodos anteriores es el kit 'NEBNext® Ultra™ II DNA Library Prep Kit' de Illumina®. El kit proporciona los siguientes reactivos:
[0049]La mezcla enzimática 'NEBNext Ultra II End Prep Enzyme Mix', el tampón de reacción 'NEBNext Ultra II End Prep Reaction Buffer', el potenciador de ligación 'NEBNext Ligation Enhancer', la mezcla 'NEBNext Ultra II Ligation Master Mix -20' y la mezcla 'NEBNext® Ultra II Q5® Master Mix'.
[0050]La formación de extremos romos y la adición de colas a ácidos nucleicos de muestra pueden llevarse a cabo en un solo tubo. No es necesario separar los ácidos nucleicos de extremos romos de la(s) enzima(s) que llevan a cabo la formación de extremos romos antes de que se produzca la reacción de adición de colas. Opcionalmente, todas las enzimas, nucleótidos y otros reactivos se suministran a la vez antes de que se produzca la reacción de formación de extremos romos. 'Suministrar a la vez' quiere decir que todos se introducen en la muestra lo suficientemente próximos en el tiempo como para que todos estén presentes cuando se produzca la incubación de la muestra a fin de que tenga lugar la formación de extremos romos. Opcionalmente, no se elimina nada de las muestras después de suministrar las enzimas, los nucleótidos y otros reactivos al menos hasta que se hayan completado las incubaciones para la formación de extremos romos y para la adición de colas. A menudo, la reacción de adición de colas se lleva a cabo a una temperatura mayor que la reacción de formación de extremos romos. Por ejemplo, la reacción de formación de extremos romos puede realizarse a temperatura ambiente, en la que la polimerasa 5'-3' y la exonucleasa 3'-5' están activas y la polimerasa termoestable está inactiva o mínimamente activa, y la reacción de adición de colas puede realizarse a una temperatura elevada, por ejemplo de más de 60° C, cuando la polimerasa 5'-3' y la exonucleasa 3'-5' están inactivas y la polimerasa termoestable está activa.
[0051]La unión de los adaptadores con colas de T y C tal y como se ha descrito da como resultado una población de ácidos nucleicos adaptados, de manera que la población comprende una pluralidad de moléculas de ácido nucleico y cada una de ellas comprende un fragmento de ácido nucleico flanqueado a ambos lados por un adaptador que incluye un código de barras con un par de bases A/T o G/C entre el fragmento de ácido nucleico y el adaptador. La pluralidad de moléculas de ácido nucleico puede incluir al menos 10000, 100 000 o 1000 000 de moléculas. La proporción de pares de bases A/T con respecto a pares de bases G/C en las regiones de unión entre los fragmentos y los adaptadores de flanqueo depende de la proporción entre los adaptadores con colas de T y los adaptadores con colas de C y puede ser, por ejemplo, de entre 2:1 y 4:1. La mayoría de los ácidos nucleicos de la población están flanqueados por adaptadores con diferentes códigos de barras (por ejemplo, al menos un 99%). Si también se incluyen adaptadores de extremos romos, la población incluye moléculas de ácido nucleico en un fragmento de ácido nucleico que se une directamente a un adaptador por un extremo o ambos (es decir, no interviene ningún par A/T o G/C).
4. Amplificación
[0052]Los ácidos nucleicos de muestra flanqueados por adaptadores pueden amplificarse mediante PCR y otros métodos de amplificación normalmente cebados por cebadores que se unen a sitios de unión de cebadores en los adaptadores que flanquean un ácido nucleico que se va a amplificar. Los métodos de amplificación pueden incluir ciclos de extensión, desnaturalización y apareamiento derivados de un termociclado o pueden ser isotérmicos, como en la amplificación mediada por transcripción. Otros métodos de amplificación incluyen la reacción en cadena de la ligasa, la amplificación por desplazamiento de cadena, la amplificación basada en secuencias de ácidos nucleicos y la replicación autosostenida basada en secuencias.
[0053]Preferiblemente, los métodos en los que pueden usarse los kits de la invención provocan que al menos un 75, 80, 85, 90 o 95% de los ácidos nucleicos bicatenarios presentes en la muestra se unan a los adaptadores. Preferiblemente, el uso de colas de T y C aumenta el porcentaje de ácidos nucleicos bicatenarios presentes en la muestra que se unen a adaptadores, en comparación con los métodos de control realizados sólo con adaptadores con colas de T, en al menos un 1, 2, 3, 4, 5, 6, 7, 8, 9 o 10% (de manera que un aumento de rendimiento desde un 75% hasta un 80% se considera un aumento de un 5%). Preferiblemente, la adición de colas de T y C en combinación con adaptadores de extremos romos aumenta el porcentaje de ácidos nucleicos bicatenarios que se unen a adaptadores en al menos un 5, 10, 15, 20 o 25%. El porcentaje de ácidos nucleicos que se unen a adaptadores puede determinarse mediante una electroforesis comparativa en gel de la muestra original y la muestra procesada después de que se haya completado la unión a los adaptadores.
[0054]Preferiblemente, los métodos en los que pueden usarse los kits de la invención provocan que al menos un 75, 80, 85, 90 o 95% de las moléculas bicatenarias disponibles presentes en la muestra se secuencien. Preferiblemente, el uso de colas de T y C aumenta el porcentaje de ácidos nucleicos bicatenarios presentes en la muestra que se secuencian, en comparación con los métodos de control realizados sólo con adaptadores con colas de T, en al menos un 1, 2, 3, 4, 5, 6, 7, 8, 9 o 10%. Preferiblemente, la adición de colas de T y C en combinación con adaptadores de extremos romos aumenta el porcentaje de ácidos nucleicos bicatenarios presentes en la muestra que se secuencian, en comparación con los métodos de control realizados sólo con adaptadores con colas de T, en al menos un 5, 10, 15, 20 o 25%. El porcentaje de ácidos nucleicos que se secuencian puede determinarse comparando el número de moléculas que se secuencian realmente en base al número que podría haberse secuenciado en base a los ácidos nucleicos de entrada y las regiones del genoma que son objeto de la secuenciación.
5. Etiquetas
[0055]Las etiquetas que proporcionan códigos de barras o identificadores moleculares pueden incorporarse o unirse a los adaptadores mediante ligación o PCR de extensión solapada, entre otros métodos. Generalmente, la asignación de identificadores únicos o no únicos -o códigos de barras moleculares- en las reacciones sigue los métodos y sistemas que se describen en las solicitudes de patente de EE. UU. 20010053519, 20030152490 y 20110160078 y en las patentes de EE. UU. nos 6,582,908 y 7,537,898.
[0056]Las etiquetas pueden unirse a los ácidos nucleicos de muestra de manera aleatoria o no aleatoria. En algunos casos, se introducen en micropocillos en un ratio esperado de identificadores únicos. Por ejemplo, los identificadores únicos pueden cargarse de manera que se cargan más de aproximadamente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50, 100, 500, 1000, 5000, 10 000, 50 000, 100 000, 500 000, 1 000 000, 10 000 000, 50 000 000 o 1 000 000 000 de identificadores únicos por cada muestra de genoma. En algunos casos, los identificadores únicos pueden cargarse de manera que se cargan menos de aproximadamente 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50, 100, 500, 1000, 5000, 10 000, 50000, 100 000, 500 000, 1000 000, 10000 000, 50 000 000 o 1000 000 000 de identificadores únicos por cada muestra de genoma. En algunos casos, el número promedio de identificadores únicos que se cargan por cada muestra de genoma es menor que, o mayor que, aproximadamente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50, 100, 500, 1000, 5000, 10000, 50000, 100000, 500000, 1000000, 10000000, 50000000 o 1000000000 de identificadores únicos por cada muestra de genoma.
[0057]En algunos casos, los identificadores únicos pueden ser oligonucleótidos de una secuencia predeterminada, aleatoria o semialeatoria. En otros casos, puede usarse una pluralidad de códigos de barras, de tal manera que los códigos de barras no son necesariamente únicos unos respecto a otros dentro de la pluralidad. En este ejemplo, los códigos de barras pueden estar ligados a moléculas individuales, de tal manera que la combinación del código de barras y la secuencia a la que puede estar ligado crea una secuencia única que puede rastrearse individualmente. Tal y como se describe en el presente documento, la detección de códigos de barras no únicos en combinación con los datos de secuencia de las porciones iniciales (comienzo) y finales (parada) de las lecturas de secuencia puede permitir asignar una identidad única a una molécula particular. La longitud, o el número de pares de bases, de una lectura de secuencia individual también puede usarse para asignar una identidad única a dicha molécula. Tal y como se describe en el presente documento, los fragmentos de una cadena simple de ácido nucleico al que se le ha asignado una identidad única pueden usarse, por tanto, para identificar posteriormente fragmentos de la cadena principal.
[0001]Los polinucleótidos de una muestra pueden etiquetarse con el número suficiente de etiquetas diferentes para que haya una alta probabilidad (por ejemplo, de al menos un 90%, al menos un 95%, al menos un 98%, al menos un 99%, al menos un 99,9% o al menos un 99,99%) de que todos los polinucleótidos que corresponden a una región genómica particular porten una etiqueta identificadora diferente (las moléculas de la región están básicamente etiquetadas de forma única). La región genómica a la que corresponden los polinucleótidos puede ser, por ejemplo, (1) todo el panel de los genes que se están secuenciando, (2) alguna parte de dicho panel, como la asignación a un solo gen, exón o intrón, (3) una única coordenada de nucleótidos (por ejemplo, al menos un nucleótido del polinucleótido corresponde a la coordenada, por ejemplo la posición de inicio, la posición de parada, un punto intermedio o cualquier punto entre ambas), o (4) un par particular de coordenadas de nucleótidos de inicio/parada (comienzo/final). El número de identificadores diferentes (recuento de etiquetas) que es necesario para etiquetar prácticamente de forma única los polinucleótidos es una función de cuántas moléculas de polinucleótidos originales de la muestra corresponden a la región. Esto, a su vez, es una función de varios factores. Uno de los factores es el número total de equivalentes del genoma haploide que se han incluido en el ensayo. Otro factor es el tamaño promedio de las moléculas de polinucleótidos. Otro factor es la distribución de las moléculas a lo largo de la región. Esto, a su vez, puede ser una función del patrón de escisión (cabe esperar que la escisión se produzca principalmente entre nucleosomas, de manera que haya más polinucleótidos asignados a lo largo de la ubicación de un nucleosoma que entre nucleosomas). Otro factor es la distribución de los códigos de barras en el 'pool' y la eficiencia de ligación de los códigos de barras individuales, lo que potencialmente provoca diferencias en la concentración efectiva de un código de barras con respecto a otro. Otro factor es el tamaño de la región en la que están confinadas las moléculas que han de etiquetarse de forma única (por ejemplo, el mismo inicio/parada o el mismo exón).
[0002]El identificador puede ser un solo código de barras unido a un extremo de una molécula, o dos códigos de barras, cada uno de ellos unido a diferentes extremos de la molécula. Unir códigos de barras independientemente a ambos extremos de una molécula aumenta al cuadrado el número de posibles identificadores. En este caso, el número de códigos de barras diferentes se selecciona de tal manera que la combinación de los códigos de barras en cada extremo de un polinucleótido particular tiene una alta probabilidad de ser única con respecto a otros polinucleótidos asignados a la misma región genómica seleccionada.
[0003]En algunas realizaciones, el número de combinaciones de códigos de barras o identificadores diferentes (recuento de etiquetas) utilizado puede ser de al menos 64, 100, 400, 900, 1400, 2500, 5625, 10000, 14400, 22500 o 40000 y de no más de 90000, 40000, 22500, 14400 o 10000. Por ejemplo, el número de combinaciones de códigos de barras o identificadores puede ser de entre 64 y 90000, de entre 400 y 22500, de entre 400 y 14400 o de entre 900 y 14400.
[0004]En una muestra que comprende ADN genómico fragmentado, por ejemplo ADN libre de células (ADNcf), de una pluralidad de genomas, hay bastantes probabilidades de que más de un polinucleótido de diferentes genomas tenga las mismas posiciones de inicio y parada ('duplicados' o 'análogos'). El número probable de que los duplicados comiencen en cualquier posición es una función del número de equivalentes del genoma haploide presentes en una muestra y de la distribución de los tamaños de los fragmentos. Por ejemplo, el ADNcf tiene un máximo de fragmentos en aproximadamente 160 nucleótidos y la mayoría de los fragmentos en este máximo oscilan entre aproximadamente 140 nucleótidos y 180 nucleótidos. Por consiguiente, el ADNcf de un genoma de aproximadamente 3000 millones de bases (por ejemplo, el genoma humano) puede estar compuesto de casi 20 millones (2x107) de fragmentos de polinucleótidos. Una muestra de aproximadamente 30 ng de ADN puede contener aproximadamente 10000 equivalentes del genoma humano haploide. (De manera similar, una muestra de aproximadamente 100 ng de ADN puede contener aproximadamente 30 000 equivalentes del genoma humano haploide). Una muestra que contenga aproximadamente 10000 (104) equivalentes del genoma haploide de este ADN puede contener aproximadamente 200 000 millones (2x1011) de moléculas de polinucleótidos individuales. Se ha determinado empíricamente que en una muestra de aproximadamente 10000 equivalentes del genoma haploide de ADN humano hay aproximadamente 3 polinucleótidos duplicados que comienzan en cualquier posición dada. Por consiguiente, dicha colección puede contener una variedad de aproximadamente 6x1010-8x1010 (aproximadamente entre 60 000 millones y 80 000 millones; por ejemplo, aproximadamente 70000 millones [7x1010]) de moléculas de polinucleótidos secuenciadas diferentemente.
[0005]La probabilidad de identificar correctamente las moléculas depende del número inicial de equivalentes genómicos, de la distribución de longitud de las moléculas secuenciadas, de la uniformidad de secuencias y del número de etiquetas. El número puede calcularse usando una distribución de Poisson. Cuando el recuento de etiquetas es igual a uno, equivale a no tener ninguna etiqueta única o ningún etiquetado. La Tabla 1 de más abajo muestra las probabilidades de identificar correctamente una molécula como única suponiendo una distribución de tamaño libre de células típica como la mencionada anteriormente.
Tabla 1
[006]En este caso, al secuenciar el ADN genómico, puede que no sea posible determinar qué lecturas de secuencia se derivan de qué moléculas originales. Este problema puede atenuarse etiquetando las moléculas originales con un número suficiente de identificadores únicos (es decir, el recuento de etiquetas), de tal manera que haya probabilidades de que dos moléculas duplicadas, es decir, moléculas que tienen las mismas posiciones de inicio y parada, porten identificadores únicos diferentes a fin de que las lecturas de secuencia puedan rastrearse hasta las moléculas originales particulares. Un enfoque para este problema consiste en etiquetar de forma única todas -o casi todas- las moléculas originales diferentes presentes en la muestra. Sin embargo, dependiendo del número de equivalentes génicos haploides y la distribución de los tamaños de los fragmentos en la muestra, esto podría requerir miles de millones de identificadores únicos diferentes.
[0007]Este método puede resultar caro y laborioso. Una población de polinucleótidos en una muestra de ADN genómico fragmentado puede etiquetarse con n identificadores únicos diferentes, de manera que n es al menos 2 y no más de 100000*z, de manera que z es un indicativo de la tendencia central (es decir, la media, la mediana, la moda) del número esperado de moléculas duplicadas que tienen las mismas posiciones de inicio y parada. n puede ser al menos cualquiera de entre 2*z, 3*z, 4*z, 5*z, 6*z, 7*z, 8*z, 9*z, 10*z, 11*z, 12*z, 13*z, 14*z, 15*z, 16*z, 17*z, 18*z, 19*z, 20*z o 100*z (es decir, el límite inferior). n no puede ser mayor que 100000*z, 10000*z, 2000*z, 1000*z, 500*z o 100*z (es decir, el límite superior). Por consiguiente, n puede variar entre cualquier combinación de estos límites superior e inferior. n puede ser de entre 100*z y 1000*z, de entre 5*z y 15*z, de entre 8*z y 12*z, o de aproximadamente 10*z. Por ejemplo, un equivalente del genoma humano haploide tiene aproximadamente 3 picogramos de ADN. Una muestra de aproximadamente 1 microgramo de ADN contiene aproximadamente 300 000 equivalentes del genoma humano haploide. El número n puede ser de entre 15 y 45, de entre 24 y 36, de entre 64 y 2500, de entre 625 y 31 000, o aproximadamente de entre 900 y 4000. Pueden obtenerse mejoras en la secuenciación siempre y cuando al menos algunos de los polinucleótidos duplicados o análogos porten identificadores únicos, es decir, porten etiquetas diferentes. No obstante, puede seleccionarse el número de etiquetas utilizadas, de tal manera que haya al menos un 95% de posibilidades de que todas las moléculas duplicadas que comiencen en una posición dada porten identificadores únicos. Por ejemplo, una muestra que comprende aproximadamente 10 000 equivalentes del genoma humano haploide de ADNcf puede etiquetarse con aproximadamente 36 identificadores únicos. Los identificadores únicos pueden comprender seis códigos de barras de ADN únicos. Unidos a ambos extremos de un polinucleótido, se producen 36 posibles identificadores únicos. Las muestras etiquetadas de este modo pueden ser aquellas con un rango de entre aproximadamente 10 ng y aproximadamente 100 ng, aproximadamente 1 |jg o aproximadamente 10 |jg de polinucleótidos fragmentados, por ejemplo ADN genómico, por ejemplo ADNcf.
[0008]Por consiguiente, usando los kits de la invención pueden obtenerse composiciones de polinucleótidos etiquetados. Los polinucleótidos pueden comprender ADN fragmentado, por ejemplo ADNcf. Un conjunto de polinucleótidos de la composición que se asignan a una posición de base asignable en un genoma pueden etiquetarse de forma no única, es decir, el número de identificadores diferentes puede ser de al menos 2 e inferior al número de polinucleótidos que se asignan a la posición de base asignable. Una composición de entre aproximadamente 10 ng y aproximadamente 10 jg (por ejemplo, de aproximadamente 10 ng-1 jg, de aproximadamente 10 ng-100 ng, de aproximadamente 100 ng-10 jg, de aproximadamente 100 ng-1 jg, o de aproximadamente 1 jg-10 jg ) puede portar entre 2, 5, 10, 50 o 100 y 100, 1000, 10000 o 100000 identificadores diferentes. Por ejemplo, pueden usarse entre 5 y 100 o entre 100 y 4000 identificadores diferentes para etiquetar los polinucleótidos de dicha composición.
[0009]Los eventos en los que moléculas diferentes que se asignan a la misma coordenada (en este caso, que tienen las mismas posiciones de inicio/parada), y portan las mismas -y no diferentes- etiquetas, se denominan 'colisiones moleculares'. En algunos casos, el número real de colisiones moleculares puede ser mayor que el número de colisiones teóricas, calculado -por ejemplo- como se ha explicado anteriormente. Esto puede ser una función de la distribución desigual de moléculas a lo largo de las coordenadas, de las diferencias en la eficiencia de ligación entre códigos de barras y de otros factores. En este caso, pueden usarse métodos empíricos para determinar el número de códigos de barras que son necesarios para acercarse al número teórico de colisiones. Por ejemplo, un método para determinar el número de códigos de barras que es necesario para reducir las colisiones de códigos de barras para un determinado equivalente del genoma haploide puede estar basado en la distribución de longitud de las moléculas secuenciadas y la uniformidad de secuencias. El método incluye crear una pluralidad de conjuntos de moléculas de ácido nucleico; etiquetar cada conjunto con números de códigos de barras que aumentan progresivamente; y determinar el número óptimo de códigos de barras que reduce el número de colisiones de códigos de barras a un nivel teórico; por ejemplo, podría deberse a las diferencias en las concentraciones efectivas de los códigos de barras a causa de las diferencias en el agrupamiento y la eficiencia de ligación.
[0010]El número de identificadores que son necesarios para etiquetar prácticamente de forma única los polinucleótidos asignados a una región puede determinarse empíricamente. Por ejemplo, un número seleccionado de identificadores diferentes puede unirse a las moléculas de una muestra, y puede calcularse el número de identificadores diferentes para las moléculas asignadas a la región. Si se usa un número insuficiente de identificadores, algunos polinucleótidos asignados a la región portarán el mismo identificador. En ese caso, el número de identificadores contabilizado será inferior al número de moléculas originales de la muestra. El número de identificadores diferentes utilizados puede aumentarse repetidamente para un tipo de muestra hasta que no se detecte ningún identificador adicional que corresponda a nuevas moléculas originales. Por ejemplo, en una primera iteración pueden contabilizarse cinco identificadores diferentes que corresponden a al menos cinco moléculas originales diferentes. En una segunda iteración, y usando más códigos de barras, se contabilizan siete identificadores diferentes que corresponden a al menos siete moléculas originales diferentes. En una tercera iteración, y usando más códigos de barras, se contabilizan diez identificadores diferentes que corresponden a al menos diez moléculas originales diferentes. En una cuarta iteración, y usando más códigos de barras, se contabilizan de nuevo 10 identificadores diferentes. En este punto, añadir más códigos de barras probablemente no aumentará el número de moléculas originales detectadas.
6. Secuenciación
[0060]Los ácidos nucleicos de muestra flanqueados por adaptadores con o sin una amplificación previa pueden someterse a una secuenciación. Los métodos de secuenciación incluyen, por ejemplo, la secuenciación de Sanger, la secuenciación de alto rendimiento, la pirosecuenciación, la secuenciación mediante síntesis, la secuenciación de una sola molécula, la secuenciación de nanoporos, la secuenciación de semiconductores, la secuenciación por ligación, la secuenciación por hibridación, el método 'RNA-Seq' (Illumina), el método 'Digital Gene Expression' (Helicos), la secuenciación de próxima generación, el método 'Single Molecule Sequencing by Synthesis' (SMSS) (Helicos), la secuenciación masiva paralela, el método 'Clonal Single Molecule Array' (Solexa), la secuenciación de escopeta, la secuenciación por Ion Torrent, la secuenciación de nanoporos de Oxford Nanopore, la secuenciación de Roche Genia, la secuenciación Maxam-Gilbert, el paseo cromosómico y la secuenciación utilizando las plataformas de PacBio, SOLiD, Ion Torrent o Nanopore. Las reacciones de secuenciación pueden llevarse a cabo en una gran variedad de unidades de procesamiento de muestras, que pueden incluir múltiples carriles, múltiples canales, múltiples pocillos u otros medios para procesar múltiples conjuntos de muestras prácticamente de manera simultánea. Las unidades de procesamiento de muestras también pueden incluir múltiples cámaras de muestras que permiten procesar múltiples tandas simultáneamente.
[0061]Las reacciones de secuenciación pueden realizarse sobre uno o más tipos de fragmentos que se sabe que contienen marcadores de cáncer u otras enfermedades. Las reacciones de secuenciación también pueden realizarse sobre cualquier fragmento de ácido nucleico que esté presente en la muestra. Las reacciones de secuenciación pueden proporcionar una cobertura de la secuencia del genoma de al menos un 5%, un 10%, un 15%, un 20%, un 25%, un 30%, un 40%, un 50%, un 60%, un 70%, un 80%, un 90%, un 95%, un 99%, un 99,9% o un 100%. En otros casos, la cobertura de la secuencia del genoma puede ser inferior a un 5%, un 10%, un 15%, un 20%, un 25%, un 30%, un 40%, un 50%, un 60%, un 70%, un 80%, un 90%, un 95%, un 99%, un 99,9% o un 100%.
[0062]Pueden llevarse a cabo reacciones de secuenciación simultáneas usando la secuenciación multiplexada. En algunos casos, pueden secuenciarse ácidos nucleicos libres de células con al menos 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 50000 o 100000 reacciones de secuenciación. En otros casos, pueden secuenciarse polinucleótidos libres de células con menos de 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 50000 o 100 000 reacciones de secuenciación. Las reacciones de secuenciación pueden realizarse secuencialmente o simultáneamente. Puede realizarse un análisis de datos posterior sobre todas las reacciones de secuenciación o sobre parte de las mismas. En algunos casos, el análisis de datos puede realizarse sobre al menos 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 50000 o 100000 reacciones de secuenciación. En otros casos, el análisis de datos puede realizarse sobre menos de 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10 000, 50 000 o 100000 reacciones de secuenciación.
[0063]El método de secuenciación puede ser la secuenciación masiva paralela, es decir, la secuenciación simultánea (o en rápida sucesión) de al menos 100, 1000, 10000, 100000, 1 millón, 10 millones, 100 millones o 1000 millones de moléculas de ácido nucleico.
7. Análisis
[0064]Los kits de la invención pueden resultar útiles en métodos que se usan para diagnosticar la presencia de enfermedades -particularmente cáncer- en un sujeto, para caracterizar las enfermedades (por ejemplo, realizar la estadificación del cáncer o determinar la heterogeneidad del cáncer), para monitorizar la respuesta al tratamiento de una enfermedad y para realizar un pronóstico sobre el riesgo de desarrollar una enfermedad o sobre la evolución posterior de una enfermedad.
[0065]Usando estos métodos pueden detectarse diversos tipos de cáncer. Las células cancerosas, como la mayoría de las células, pueden caracterizarse por su tasa de renovación celular, por la que las células viejas mueren y son sustituidas por células nuevas. Generalmente, las células muertas, al entrar en contacto con el sistema vascular de un sujeto, pueden liberar ADN o fragmentos de ADN en el torrente sanguíneo. Y sucede lo mismo con las células cancerosas durante varias fases de la enfermedad. Dependiendo de la fase de la enfermedad, las células cancerosas también pueden caracterizarse por diversas aberraciones genéticas, como la variación en el número de copias, y por la aparición de raras mutaciones. Este fenómeno puede usarse para detectar la presencia o ausencia de cánceres individuales mediante estos métodos.
[0066]Los tipos y el número de cánceres que pueden detectarse incluyen los cánceres de la sangre, los cánceres cerebrales, los cánceres pulmonares, los cánceres de la piel, los cánceres nasales, los cánceres de garganta, los cánceres hepáticos, los cánceres óseos, los linfomas, los cánceres del páncreas, los cánceres de la piel, los cánceres intestinales, los cánceres rectales, los cánceres de la tiroides, los cánceres de vejiga, los cánceres renales, los cánceres orales, los cánceres estomacales, los tumores sólidos, los tumores heterogéneos, los tumores homogéneos y similares.
[0067]Los cánceres pueden detectarse a partir de variaciones genéticas, lo que incluye las mutaciones, las mutaciones raras, los indeles, las variaciones en el número de copias, las transversiones, las translocaciones, las inversiones, las deleciones, la aneuploidia, la aneuploidia parcial, la poliploidia, la inestabilidad cromosómica, las alteraciones cromosómicas estructurales, las fusiones de genes, las fusiones cromosómicas, el truncamiento de genes, la amplificación génica, las duplicaciones de genes, las lesiones cromosómicas, las lesiones del ADN, los cambios anormales en las modificaciones químicas del ácido nucleico, los cambios anormales en los patrones epigenéticos, los cambios anormales en la metilación del ácido nucleico, las infecciones y el cáncer.
[0068]La información genética también puede usarse para caracterizar una forma específica de cáncer. Los cánceres son a menudo heterogéneos en cuanto a su composición y su estadificación. Los datos del perfil genético pueden permitir la caracterización de los subtipos de cáncer específicos, que puede ser importante para el diagnóstico o el tratamiento del subtipo específico en cuestión. Esta información también puede proporcionar pistas al sujeto o al médico en lo referente al pronóstico de un tipo de cáncer específico y puede permitir que el sujeto o el médico se adapten a las opciones de tratamiento según la evolución de la enfermedad. Algunos cánceres evolucionan y se vuelven más agresivos y genéticamente inestables. Otros cánceres pueden seguir siendo benignos o permanecer inactivos o latentes. Los kits de la invención pueden resultar útiles en métodos que pueden ser útiles para determinar la evolución de una enfermedad.
[0069]El presente análisis también es útil para determinar la eficacia de una opción de tratamiento particular. Las opciones de tratamiento eficaces pueden aumentar la cantidad de variaciones del número de copias o mutaciones raras que se detectan en la sangre del sujeto si el tratamiento tiene éxito, ya que más tipos de cáncer pueden desaparecer y liberar ADN. En otros ejemplos, esto puede no suceder. En otro ejemplo, quizás algunas opciones de tratamiento pueden correlacionarse con los perfiles genéticos de los cánceres con el paso del tiempo. Esta correlación puede ser útil para escoger una terapia. Asimismo, si se observa que un cáncer está en remisión tras el tratamiento, los kits de la invención pueden ser útiles en los métodos que se usan para monitorizar las enfermedades residuales o la reaparición de una enfermedad.
[0070]Los kits de la invención pueden ser útiles en los métodos que se usan para detectar variaciones genéticas en enfermedades diferentes al cáncer. Las células inmunitarias, como las células B, pueden experimentar una rápida expansión clonal ante la presencia de determinadas enfermedades. Las expansiones clonales pueden monitorizarse usando la detección de la variación del número de copias y también pueden monitorizarse determinados estados inmunitarios. En este ejemplo, a lo largo del tiempo puede realizarse un análisis de la variación del número de copias para obtener un perfil sobre cómo puede estar evolucionando una enfermedad particular. La detección de la variación del número de copias o incluso de mutaciones raras puede usarse para determinar cómo está cambiando una población de patógenos durante el transcurso de una infección. Esto puede ser particularmente importante durante las infecciones crónicas, como el SIDA/VIH o las infecciones por hepatitis, en las que los virus pueden cambiar los estados de su ciclo vital y/o mutar en formas más virulentas durante el curso de la infección. Los kits de la invención pueden ser útiles en los métodos que se usan para determinar o trazar un perfil de las actividades de rechazo del cuerpo huésped, a medida que las células inmunitarias tratan de destruir el tejido trasplantado, y para monitorizar el estado del tejido trasplantado y modificar el curso del tratamiento o la prevención del rechazo.
[0071]Asimismo, los kits de la invención pueden ser útiles en los métodos que se usan para caracterizar la heterogeneidad de una enfermedad anormal en un sujeto, de manera que los métodos incluyen generar un perfil genético de los polinucleótidos extracelulares del sujeto, y de manera que el perfil genético comprende múltiples datos derivados del análisis de la variación del número de copias y del análisis de las mutaciones raras. En algunos casos, lo que incluye -pero no se limita a- el cáncer, una enfermedad puede ser heterogénea. Las células patógenas pueden no ser idénticas. En el caso del cáncer, se sabe que algunos tumores comprenden diferentes tipos de células tumorales, de manera que algunas células están en diferentes estadios del cáncer. En otros ejemplos, la heterogeneidad puede comprender múltiples focos de enfermedad. De igual modo, en el caso del cáncer puede haber múltiples focos, de manera que uno o más focos tal vez sean el resultado de metástasis que se han propagado desde el sitio original.
[0072]Los kits de la invención pueden ser útiles en los métodos que se usan para generar o trazar un perfil de un conjunto de datos que es un compendio de la información genética obtenida a partir de diferentes células en una enfermedad heterogénea. Este conjunto de datos puede comprender el análisis de la variación del número de copias y el análisis de mutaciones raras, solos o de forma combinada.
[0073]Los kits de la invención pueden ser útiles en métodos que se usan para diagnosticar, pronosticar, monitorizar u observar cánceres u otras enfermedades de origen fetal. Es decir, estas metodologías pueden utilizarse en una mujer embarazada para diagnosticar, pronosticar, monitorizar u observar cánceres u otras enfermedades en un bebé nonato cuyo ADN y otros ácidos nucleicos pueden circular conjuntamente con las moléculas maternas.
[0074]9. Kits
Los kits de la invención pueden usarse para poner en práctica cualquiera de los métodos anteriores. Los kits de la invención incluyen un par de adaptadores al menos parcialmente bicatenarios con colas 3' de nucleótidos simples T y C, respectivamente. Preferiblemente, los oligonucleótidos emparejados son idénticos salvo por las colas de T y C. Opcionalmente, el kit carece de adaptadores al menos parcialmente bicatenarios con colas 3' de nucleótidos simples A y G. Preferiblemente, los adaptadores tienen forma de Y, como los adaptadores que comprenden oligonucleótidos de las SEQ ID Nos. 1 y 2, y 3 y 2. Los kits también pueden incluir enzimas para poner en práctica los métodos, como una polimerasa T4 o un fragmento de Klenow grande, y/o una polimerasa Taq, y opcionalmente los cuatro tipos de nucleótidos estándar. Los kits también pueden incluir un embalaje, prospectos, CDs o similares que proporcionan instrucciones para poner en práctica los métodos reivindicados.
Ejemplos
[0075]El uso de adaptadores con colas de C y T contribuyó a aumentar la sensibilidad al capturar más moléculas en una muestra. Los adaptadores de C se evaluaron en proporciones de 0 a 1:2,75 (36%) con respecto a los adaptadores de T, tal y como se muestra en la Tabla 2.
Tabla 2
[0076]Todas las muestras en las que estaban presentes los adaptadores con colas de C mostraron una mayor producción de ácidos nucleicos ligados a adaptadores (% de ligación) que las muestras en las que las colas de C estaban ausentes. La mejor producción fue para los cebadores de colas de C respecto a los de colas de T con un ratio de 1:3,25 (aproximadamente un 30%), pero se obtuvieron producciones mejoradas con ratios de 0,5:3,25 (aproximadamente un 15%) a 1:2,75 (un 36%).
[0077]Tras la secuenciación de ADN amplificado, se calculó la diversidad de cada preparación. La diversidad es el número de moléculas secuenciadas, calculado del siguiente modo: (tamaño promedio de la molécula de ADN, en bp) * (# de moléculas únicas secuenciadas) / (tamaño de la región objetivo, en bp). De manera general, la diversidad fue mayor en las muestras en las que estaba presente el adaptador con colas de C. La secuenciación también indicó que la proporción de los adaptadores con colas de T -respecto a los adaptadores con colas de C- incorporados fue de aproximadamente un 10%.
Claims (13)
1. Un kit, que comprende:
adaptadores al menos parcialmente bicatenarios con un saliente de un solo nucleótido T en el extremo 3' (adaptadores con cola de T); y
adaptadores al menos parcialmente bicatenarios con un saliente de un solo nucleótido C en el extremo 3' (adaptadores con cola de C).
2. El kit de la reivindicación 1, de manera que la proporción molar de los adaptadores al menos parcialmente bicatenarios con un saliente de un solo nucleótido T respecto a los adaptadores con un saliente de un solo nucleótido C es de 4:1 a 2:1, por ejemplo de 3:1.
3. El kit de la reivindicación 1, de manera que el porcentaje de adaptadores con cola de C respecto a los adaptadores con cola de T es de aproximadamente un 5-40% en moles, por ejemplo un 10-35%, un 15-25%, un 20-35%, un 25-35% o aproximadamente un 30%.
4. El kit de cualquiera de las reivindicaciones anteriores, que además comprende:
adaptadores al menos parcialmente bicatenarios con extremos romos.
5. El kit de la reivindicación 4, de manera que la proporción molar de los adaptadores con extremos romos respecto a los adaptadores con colas es de 1:5 a 1:500, por ejemplo de 1:10 a 1:100.
6. El kit de la reivindicación 4, de manera que los adaptadores con extremos romos están en una proporción molar de un 0,2-20%, o un 0,5-15%, o un 1-10% de adaptadores con los adaptadores con cola de T y cola de C.
7. El kit de cualquiera de las reivindicaciones anteriores, que además comprende:
una polimerasa T4 o un fragmento de Klenow grande; y/o
una polimerasa Taq.
8. El kit de la reivindicación 7, que además comprende cuatro tipos de nucleótidos estándar.
9. El kit de cualquiera de las reivindicaciones anteriores, de manera que el kit carece de adaptadores al menos parcialmente bicatenarios con colas 3' de un solo nucleótido A, y de adaptadores al menos parcialmente bicatenarios con colas 3' de un solo nucleótido G.
10. El kit de cualquiera de las reivindicaciones anteriores, de manera que los adaptadores son adaptadores con forma de Y.
11. El kit de la reivindicación 10, de manera que los adaptadores comprenden oligonucleótidos de las SEQ ID Nos 1 y 2, y 3 y 2.
12. El kit de cualquiera de las reivindicaciones anteriores, de manera que los adaptadores comprenden un sitio de unión de cebadores y/o un código de barras.
13. El kit de la reivindicación 12, de manera que los códigos de barras proporcionan entre 64 y 90 000, entre 400 y 22500, entre 400 y 14400, o entre 900 y 14400 combinaciones de códigos de barras diferentes.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762485769P | 2017-04-14 | 2017-04-14 | |
PCT/US2017/027809 WO2017181146A1 (en) | 2016-04-14 | 2017-04-14 | Methods for early detection of cancer |
US201762486663P | 2017-04-18 | 2017-04-18 | |
US201762517145P | 2017-06-08 | 2017-06-08 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2962223T3 true ES2962223T3 (es) | 2024-03-18 |
Family
ID=63792821
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES18783709T Active ES2868074T3 (es) | 2017-04-14 | 2018-04-13 | Métodos para unir adaptadores a ácidos nucleicos de muestra |
ES21157081T Active ES2962223T3 (es) | 2017-04-14 | 2018-04-13 | Métodos para unir adaptadores a ácidos nucleicos de muestra |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES18783709T Active ES2868074T3 (es) | 2017-04-14 | 2018-04-13 | Métodos para unir adaptadores a ácidos nucleicos de muestra |
Country Status (10)
Country | Link |
---|---|
US (2) | US20200131567A1 (es) |
EP (2) | EP3885445B1 (es) |
JP (2) | JP7046097B2 (es) |
CN (1) | CN110546272B (es) |
AU (1) | AU2018252018A1 (es) |
CA (1) | CA3057163A1 (es) |
ES (2) | ES2868074T3 (es) |
HU (1) | HUE063675T2 (es) |
PL (1) | PL3885445T3 (es) |
WO (1) | WO2018191702A2 (es) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3561072A1 (en) | 2012-12-10 | 2019-10-30 | Resolution Bioscience, Inc. | Methods for targeted genomic analysis |
ES2856598T3 (es) | 2015-11-11 | 2021-09-27 | Resolution Bioscience Inc | Construcción de alta eficiencia de bibliotecas de ADN |
WO2017181146A1 (en) | 2016-04-14 | 2017-10-19 | Guardant Health, Inc. | Methods for early detection of cancer |
RU2019108294A (ru) | 2016-08-25 | 2020-09-25 | Резолюшн Байосайенс, Инк. | Способы обнаружения изменений количества геномных копий в образцах днк |
CN116144735A (zh) * | 2019-08-12 | 2023-05-23 | 深圳市真迈生物科技有限公司 | 核酸样本处理方法、测序方法和试剂盒 |
US20220073906A1 (en) * | 2020-09-08 | 2022-03-10 | Resolution Bioscience, Inc. | Adaptors and methods for high efficiency construction of genetic libraries and genetic analysis |
EP4251760A1 (en) * | 2020-11-25 | 2023-10-04 | Alida Biosciences, Inc. | Multiplexed profiling of rna and dna modifications |
WO2022131285A1 (ja) * | 2020-12-15 | 2022-06-23 | ジェノダイブファーマ株式会社 | Dnaサンプルのシーケンスにおけるアダプター結合効率を評価する方法 |
EP4388091A2 (en) * | 2021-08-20 | 2024-06-26 | Guardant Health, Inc. | Methods for simultaneous molecular and sample barcoding |
WO2023097295A1 (en) * | 2021-11-24 | 2023-06-01 | Alida Biosciences, Inc. | Rna and dna analysis using engineered surfaces |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6582908B2 (en) | 1990-12-06 | 2003-06-24 | Affymetrix, Inc. | Oligonucleotides |
US20030017081A1 (en) | 1994-02-10 | 2003-01-23 | Affymetrix, Inc. | Method and apparatus for imaging a sample on a device |
EP1448799B2 (en) | 2001-11-28 | 2018-05-16 | Life Technologies Corporation | Methods of selective nucleic acid isolation |
US8835358B2 (en) | 2009-12-15 | 2014-09-16 | Cellular Research, Inc. | Digital counting of individual molecules by stochastic attachment of diverse labels |
WO2011161549A2 (en) * | 2010-06-24 | 2011-12-29 | Population Genetics Technologies Ltd. | Methods and compositions for polynucleotide library production, immortalization and region of interest extraction |
US8829172B2 (en) * | 2011-03-11 | 2014-09-09 | Academia Sinica | Multiplex barcoded paired-end diTag (mbPED) sequencing approach and ITS application in fusion gene identification |
US10023856B2 (en) * | 2013-09-25 | 2018-07-17 | Thermo Fisher Scientific Baltics Uab | Enzyme composition for DNA end repair, adenylation, phosphorylation |
CN114717291A (zh) * | 2013-12-30 | 2022-07-08 | 阿特雷卡公司 | 使用核酸条形码分析与单细胞缔合的核酸 |
CA2956925C (en) * | 2014-08-01 | 2024-02-13 | Dovetail Genomics, Llc | Tagging nucleic acids for sequence assembly |
WO2016135300A1 (en) * | 2015-02-26 | 2016-09-01 | Qiagen Gmbh | Efficiency improving methods for gene library generation |
-
2018
- 2018-04-13 PL PL21157081.7T patent/PL3885445T3/pl unknown
- 2018-04-13 ES ES18783709T patent/ES2868074T3/es active Active
- 2018-04-13 HU HUE21157081A patent/HUE063675T2/hu unknown
- 2018-04-13 CA CA3057163A patent/CA3057163A1/en active Pending
- 2018-04-13 AU AU2018252018A patent/AU2018252018A1/en active Pending
- 2018-04-13 ES ES21157081T patent/ES2962223T3/es active Active
- 2018-04-13 EP EP21157081.7A patent/EP3885445B1/en active Active
- 2018-04-13 JP JP2019555645A patent/JP7046097B2/ja active Active
- 2018-04-13 EP EP18783709.1A patent/EP3610032B1/en active Active
- 2018-04-13 WO PCT/US2018/027632 patent/WO2018191702A2/en unknown
- 2018-04-13 CN CN201880025117.1A patent/CN110546272B/zh active Active
-
2019
- 2019-10-08 US US16/596,180 patent/US20200131567A1/en active Pending
-
2020
- 2020-05-21 US US16/880,706 patent/US20200283839A1/en not_active Abandoned
-
2022
- 2022-02-04 JP JP2022016339A patent/JP7514263B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
WO2018191702A3 (en) | 2019-02-21 |
JP2020516281A (ja) | 2020-06-11 |
PL3885445T3 (pl) | 2024-01-29 |
JP7046097B2 (ja) | 2022-04-01 |
CA3057163A1 (en) | 2018-10-18 |
ES2868074T3 (es) | 2021-10-21 |
US20200283839A1 (en) | 2020-09-10 |
EP3885445B1 (en) | 2023-08-23 |
EP3885445C0 (en) | 2023-08-23 |
CN110546272A (zh) | 2019-12-06 |
JP2022048389A (ja) | 2022-03-25 |
HUE063675T2 (hu) | 2024-01-28 |
EP3610032A4 (en) | 2020-05-06 |
AU2018252018A1 (en) | 2019-10-10 |
EP3885445A1 (en) | 2021-09-29 |
EP3610032B1 (en) | 2021-03-10 |
JP7514263B2 (ja) | 2024-07-10 |
EP3610032A2 (en) | 2020-02-19 |
WO2018191702A2 (en) | 2018-10-18 |
CN110546272B (zh) | 2024-06-07 |
US20200131567A1 (en) | 2020-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2962223T3 (es) | Métodos para unir adaptadores a ácidos nucleicos de muestra | |
US11795501B2 (en) | Methods for next generation genome walking and related compositions and kits | |
JP7220200B2 (ja) | ライブラリー構築および配列解析のための組成物および方法 | |
ES2908704T3 (es) | Construcción de colecciones de secuenciación de nueva generación (NGS) usando desplazamiento de hebra competitivo | |
KR101858344B1 (ko) | 바코드 서열을 포함하는 어댑터를 이용한 차세대 염기서열 분석 방법 | |
CN109844137B (zh) | 用于鉴定嵌合产物的条形码化环状文库构建 | |
TW202012638A (zh) | 用於癌症及贅瘤之評估的組合物及方法 | |
CN110741096A (zh) | 用于检测循环肿瘤dna的组合物和方法 | |
ES2971348T3 (es) | Métodos de reparación de salientes 3' | |
JP2022546485A (ja) | 腫瘍高精度アッセイのための組成物および方法 | |
US20240002922A1 (en) | Methods for simultaneous molecular and sample barcoding | |
WO2023150633A2 (en) | Multifunctional primers for paired sequencing reads | |
US20240336913A1 (en) | Method for producing a population of symmetrically barcoded transposomes | |
WO2024186768A1 (en) | Hybrid ssdna- and dsdna-ngs library preparation methods |