CN110785493A - 模块式核酸衔接头 - Google Patents
模块式核酸衔接头 Download PDFInfo
- Publication number
- CN110785493A CN110785493A CN201880043050.4A CN201880043050A CN110785493A CN 110785493 A CN110785493 A CN 110785493A CN 201880043050 A CN201880043050 A CN 201880043050A CN 110785493 A CN110785493 A CN 110785493A
- Authority
- CN
- China
- Prior art keywords
- artificial sequence
- sequence
- dna
- sources
- note
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 150000007523 nucleic acids Chemical class 0.000 title claims abstract description 41
- 108020004707 nucleic acids Proteins 0.000 title claims abstract description 38
- 102000039446 nucleic acids Human genes 0.000 title claims abstract description 38
- 108091034117 Oligonucleotide Proteins 0.000 claims abstract description 274
- 230000000295 complement effect Effects 0.000 claims abstract description 28
- 230000037452 priming Effects 0.000 claims abstract description 25
- 238000000034 method Methods 0.000 claims description 35
- 125000003729 nucleotide group Chemical group 0.000 claims description 26
- 239000002773 nucleotide Substances 0.000 claims description 25
- 238000012163 sequencing technique Methods 0.000 claims description 13
- 238000013507 mapping Methods 0.000 claims description 8
- 238000000137 annealing Methods 0.000 claims description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 abstract description 224
- 108020004414 DNA Proteins 0.000 description 221
- 239000000523 sample Substances 0.000 description 41
- 229920001184 polypeptide Polymers 0.000 description 26
- 102000004196 processed proteins & peptides Human genes 0.000 description 26
- 108090000765 processed proteins & peptides Proteins 0.000 description 26
- 238000007481 next generation sequencing Methods 0.000 description 13
- 238000013461 design Methods 0.000 description 10
- 239000000203 mixture Substances 0.000 description 10
- 239000012472 biological sample Substances 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 7
- 238000003752 polymerase chain reaction Methods 0.000 description 7
- 210000004027 cell Anatomy 0.000 description 6
- 238000002360 preparation method Methods 0.000 description 6
- 239000000126 substance Substances 0.000 description 6
- 230000003321 amplification Effects 0.000 description 5
- 230000004071 biological effect Effects 0.000 description 5
- 238000003199 nucleic acid amplification method Methods 0.000 description 5
- XEBWQGVWTUSTLN-UHFFFAOYSA-M phenylmercury acetate Chemical compound CC(=O)O[Hg]C1=CC=CC=C1 XEBWQGVWTUSTLN-UHFFFAOYSA-M 0.000 description 5
- 210000001519 tissue Anatomy 0.000 description 5
- 108091028043 Nucleic acid sequence Proteins 0.000 description 4
- 238000007792 addition Methods 0.000 description 4
- 238000003556 assay Methods 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 239000012530 fluid Substances 0.000 description 4
- 125000003275 alpha amino acid group Chemical group 0.000 description 3
- 238000001574 biopsy Methods 0.000 description 3
- 210000001124 body fluid Anatomy 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 101100340610 Mus musculus Igdcc3 gene Proteins 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 150000001413 amino acids Chemical class 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 239000010839 body fluid Substances 0.000 description 2
- 210000001185 bone marrow Anatomy 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000035475 disorder Diseases 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 210000002751 lymph Anatomy 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000002207 metabolite Substances 0.000 description 2
- 210000004910 pleural fluid Anatomy 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 150000003384 small molecules Chemical class 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- 102100022524 Alpha-1-antichymotrypsin Human genes 0.000 description 1
- 206010003445 Ascites Diseases 0.000 description 1
- 101000678026 Homo sapiens Alpha-1-antichymotrypsin Proteins 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- 206010036790 Productive cough Diseases 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 210000003567 ascitic fluid Anatomy 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 1
- 150000005829 chemical entities Chemical class 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000029142 excretion Effects 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 239000012678 infectious agent Substances 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 239000005445 natural material Substances 0.000 description 1
- 238000013188 needle biopsy Methods 0.000 description 1
- 238000002515 oligonucleotide synthesis Methods 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000011158 quantitative evaluation Methods 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 238000007790 scraping Methods 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 210000003802 sputum Anatomy 0.000 description 1
- 208000024794 sputum Diseases 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- YNJBWRMUSHSURL-UHFFFAOYSA-N trichloroacetic acid Chemical compound OC(=O)C(Cl)(Cl)Cl YNJBWRMUSHSURL-UHFFFAOYSA-N 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1065—Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1093—General methods of preparing gene libraries, not provided for in other subgroups
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/04—Libraries containing only organic compounds
- C40B40/06—Libraries containing nucleotides or polynucleotides, or derivatives thereof
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2525/00—Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
- C12Q2525/10—Modifications characterised by
- C12Q2525/191—Modifications characterised by incorporating an adaptor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2535/00—Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
- C12Q2535/122—Massive parallel sequencing
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Immunology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本公开内容提供了用于制备核酸文库的试剂盒。所述试剂盒包括第一和第二寡核苷酸,其各自具有尾序列、共同序列以及独特标识符序列和可变长度标点标记中的至少一种。所述试剂盒进一步包括第一引物,其具有第一样品标识符序列和在所述第一引物的3’端的第一引发序列。所述第一引发序列包括所述第一寡核苷酸的所述尾序列。所述试剂盒进一步包括第二引物,其具有第二样品标识符序列和在所述第二引物的3’端的第二引发序列。所述第二引发序列与所述第二寡核苷酸的所述第二尾序列互补。
Description
背景
本公开内容总体涉及用于核酸的下一代测序的样品制备,并且更具体地,涉及用于核酸的分离和鉴定的系统和方法。
供下一代测序(next generation sequencing)(NGS)平台(例如,ILLUMINA合成测序(sequencing-by-synthesis)平台)使用的分叉的核酸衔接头(也称为Y-衔接头)可以包括特征,例如使得能够样品多重化、分子计数等的样品标识符(sample identifiers)(SID)和独特标识符(unique identifiers)(UID)。因此,分叉的衔接头可以使得能够经由衔接头连接方法进行有效的NGS文库制备,从而在允许用UIDs正确计数分子且错误降低时使可以以双末端方式(paired-end fashion)测序的分子的数目达到最大。然而,当产生和使用诸如这些的衔接头时可能产生许多挑战。
在一个方面,寡核苷酸(oligo)制造的成本高。对于具有16种独特UIDs的衔接头设计,为了产生具有16种不同单链SIDs的衔接头,必须产生274种不同的寡核苷酸序列。然而,只有少数寡核苷酸制造商能够以足够高的纯度、以足够大的规模生产如此大量的不同寡核苷酸以满足这些规格。
在另一个方面,向最终测序文库 (其可以包含NGS实验中输入分子的最终浓度的10-15%)添加PhiX有效地减少可用于来自样品的DNA分子的测序读长(reads)的数目。PhiXDNA经常在文库制备期间用作掺入(spike-in)对照,作为NGS实验的质量控制,或者在不太复杂的DNA样品的情况下增加复杂性。例如,如果文库序列中的位置3和4处的100%的碱基是G和T,则可以使用PhiX,这是因为PhiX增加这些位置处的复杂性,从而允许ILLUMINA测序仪正确区分簇并使分子定相。
在又另一个方面,对于16种2-碱基UIDs(即,具有2个核苷酸的长度的UIDs),UID中的任何错误都结果产生不同的可接受的UID。与可以更好地区分的UIDs相比,这可以导致分子计数过多,以及不太有效的错误降低。
在进一步的方面,在NGS实验中经常观察到的已知现象涉及来自一种样品的分子的SID与来自另一种品的分子附着或以其他方式有关。这可以导致将分子分配给不正确的样品。如果衔接头方案仅在衔接头的一侧含有SID,并且SID没有直接附着至感兴趣的分子,则这种交换效应(crossover effect)可以扰乱识别变异(variant calling),由此导致不正确的变异识别。与其他上述挑战一起考虑,显然NGS实验的核酸衔接头存在改进的空间。
因此,需要用于核酸衔接头的新设计,所述核酸衔接头使得能够在NGS实验中有更低的制造成本和更高的效率和准确性。
概述
本发明通过提供试剂盒和方法克服上述缺点,所述试剂盒和方法包括模块式的核酸衔接头,如以下列举的列表所述:
1.用于制备具有衔接头序列的核酸文库用于测序的试剂盒,所述试剂盒包括:
第一寡核苷酸,其具有第一尾序列、第一共同序列和以下中的至少一种:i)第一独特标识符序列,和ii)第一可变长度标点标记(punctuation mark);
第二寡核苷酸,其具有第二尾序列、与所述第一共同序列互补的第二共同序列和以下中的至少一种:i)与所述第一独特标识符序列互补的第二独特标识符序列,和ii)与所述第一可变长度标点标记互补的第二可变长度标点标记;
第一引物,其具有第一样品标识符序列和在所述第一引物的3’端的第一引发序列,所述第一引发序列包括所述第一寡核苷酸的所述第一尾序列;和
第二引物,其具有第二样品标识符序列和在所述第二引物的3’端的第二引发序列,所述第二引发序列与所述第二寡核苷酸的所述第二尾序列互补。
2.1的试剂盒,其中所述第一样品标识符序列和所述第二样品标识符序列具有一对一映射(mapping)。
3.2的试剂盒,其中所述第一可变长度标点标记具有2-4个核苷酸的长度。
4.2的试剂盒,其中所述第一可变长度标点标记包括G和C核苷酸中的至少一个。
5.1的试剂盒,其中所述第一独特标识符序列具有至少5个核苷酸的长度。
6.5的试剂盒,其中所述第一独特标识符序列具有至少3的成对编辑距离。
7.用于制备具有衔接头序列的核酸文库用于测序的试剂盒,所述试剂盒包括:
多个寡核苷酸对,每个所述寡核苷酸对包括:
第一寡核苷酸,其具有第一尾序列、第一共同序列和以下中的至少一种:i)第一独特标识符序列,和ii)第一可变长度标点标记,和
第二寡核苷酸,其具有第二尾序列、与所述第一共同序列互补的第二共同序列和以下中的至少一种:i)与所述第一独特标识符序列互补的第二独特标识符序列,和ii)与所述第一可变长度标点标记互补的第二可变长度标点标记,
第一引物,其具有第一样品标识符序列和在所述第一引物的3’端的第一引发序列,所述第一引发序列包括所述第一寡核苷酸的所述第一尾序列;和
第二引物,其具有第二样品标识符序列和在所述第二引物的3’端的第二引发序列,所述第二引发序列与所述第二寡核苷酸的所述第二尾序列互补。
8.7的试剂盒,其中每个所述多个寡核苷酸对的每个所述第一独特标识符序列是不同的。
9.7的试剂盒,其中每个所述多个寡核苷酸对的每个所述第一尾序列是相同的。
10.7的试剂盒,其中每个所述多个寡核苷酸对的每个所述第二尾序列是相同的。
11.7的试剂盒,其中每个所述多个寡核苷酸对退火以形成分叉的衔接头。
12.7的试剂盒,其中所述第一样品标识符序列和所述第二样品标识符序列具有一对一映射。
13.12的试剂盒,其中每个所述第一可变长度标点标记具有2-4个核苷酸的长度。
14.12的试剂盒,其中每个所述第一可变长度标点标记包括G和C核苷酸中的至少一个。
15.7的试剂盒,其中每个所述第一独特标识符序列具有至少5个核苷酸的长度。
16.15的试剂盒,其中每个所述第一独特标识符序列具有至少3的成对编辑距离。
17.制备核酸分子的文库的方法,所述方法包括:
将多个寡核苷酸衔接头之一附着至靶核酸的每端以提供衔接头-靶-衔接头构建体,每个所述多个寡核苷酸衔接头具有:
第一寡核苷酸,其具有第一尾序列、第一共同序列和以下中的至少一种:i)第一独特标识符序列,和ii)第一可变长度标点标记,和
第二寡核苷酸,其具有第二尾序列、与所述第一共同序列互补的第二共同序列和以下中的至少一种:i)与所述第一独特标识符序列互补的第二独特标识符序列,和ii)与所述第一可变长度标点标记互补的第二可变长度标点标记;
使第一引物与所述衔接头-靶-衔接头构建体退火,所述第一引物具有第一样品标识符序列和在所述第一引物的3’端的第一引发序列,所述第一引发序列包括所述第一寡核苷酸的所述第一尾序列;和
将每个所述第一引物和所述第二引物延伸以形成与所述衔接头-靶-衔接头构建体的各链互补的延伸产物。
18.17的方法,其中每个所述多个寡核苷酸衔接头的每个所述第一独特标识符序列是不同的。
19.17的方法,其中每个所述多个寡核苷酸衔接头的每个所述第一尾序列是相同的。
20.17的方法,其中每个所述多个寡核苷酸衔接头的每个所述第二尾序列是相同的。
21.17的方法,其中所述第一样品标识符序列和所述第二样品标识符序列具有一对一映射。
22.21的方法,其中每个所述第一可变长度标点标记具有2-4个核苷酸的长度。
23.21的方法,其中每个所述第一可变长度标点标记包括G和C核苷酸中的至少一个。
24.17的方法,其中每个所述第一独特标识符序列具有至少5个核苷酸的长度。
25.24的方法,其中每个所述第一独特标识符序列具有至少3的成对编辑距离。
本发明的前述和其他方面以及优点将从以下描述显现。在所述描述中,参考形成其一部分的附图,并且其中通过举例说明的方式显示本发明的优选实施方案。然而,这种实施方案不一定代表本发明的全部范围,并且因此,参考权利要求和本文用于解释本发明的范围。
附图简述
图1是描绘根据本公开内容的模块式核酸衔接头的组分的实施方案的示意图。
图2A是用根据本公开内容的模块式核酸衔接头制备核酸的文库的方法的示意举例说明。在该方法的第一部分中,举例说明用于装配衔接头寡核苷酸的集合体的方案,包括设计具有预定分子条形码(UIDs)的衔接头寡核苷酸以及具有SIDs的正向和反向引物,用于在连接至样品核酸文库片段后扩增衔接头寡核苷酸。在本实例中,每个样品核酸片段在每端连接至16种不同的退火的衔接头之一(每种退火的衔接头具有16种预定分子条形码或UIDs之一)。连接后,样品中的每个核酸片段都与256种不同的可能分子条形码序列对之一有关。图2A按照它们出现的顺序分别公开了SEQ ID NOS 3,4,3,4,197和198。
图2B是图2A的方法的示意举例说明的继续。在退火的衔接头连接至核酸样品中的靶DNA分子后,图2A中举例说明的具有SIDs的引物用于聚合酶链反应(PCR)实验的第一轮和第二轮中,以并入SIDs和NGS平台特异性序列(例如,用于ILLUMINA测序仪的p5和p7序列)。图2B按照它们出现的顺序分别公开了SEQ ID NOS 199-203、198、197和204-206。
图2C是图2A和2B的方法的示意举例说明的继续。PCR扩增后,对举例说明的PCR产物进行测序。在本实例中,对于每种PCR产物,用下划线指示用于在ILLUMINA平台(例如,ILLUMINA HISEQ系列)上测序的相关引发位点。图2C按照它们出现的顺序分别公开了SEQID NOS 207-217。
详述
I.定义
在本申请中,除非另外从上下文清楚,否则(i)术语“一个/种(a)”可以理解为意指“至少一个/种”;(ii)术语“或”可以理解为意指“和/或”;(iii)术语“包含”和“包括”可以理解为包含逐条列举的组分或步骤,无论它们是单独呈现还是与一种或多种额外组分或步骤一起呈现;且(iv)术语“约”和“近似”可以理解为允许如本领域普通技术人员将理解的标准偏差;且(v)在提供范围的情况下,包括端点。
近似:如本文所用的,如应用于一个或多个所考虑的值的术语“近似”或“约”,是指类似于确定的参考值的值。在某些实施方案中,术语“近似”或“约”是指落入所述确定的参考值的任一方向(大于或小于)的25%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或更小内的值的范围,除非另有说明或另外从上下文明显(除了这种数字将超过可能值的100%的场合)。
与……有关:当该术语在本文中使用时,如果一个事件或实体的存在、水平和/或形式与另一个事件或实体的存在、水平和/或形式相关,则两个事件或实体与彼此“有关”。例如,如果特定实体(例如,多肽、遗传特征、代谢物等)的存在、水平和/或形式与疾病、病症或状况(例如,穿过相关群体)的发病率和/或对疾病、病症或状况(例如,穿过相关群体)的易感性相关,则认为该特定实体(例如,多肽、遗传特征、代谢物等)与特定疾病、病症或状况有关。在一些实施方案中,如果两个或更多个实体直接或间接地相互作用,则它们在物理上与彼此“有关”,从而使得它们与彼此物理接近和/或保持与彼此物理接近。在一些实施方案中,与彼此物理有关的两个或更多个实体与彼此共价连接;在一些实施方案中,与彼此物理有关的两个或更多个实体不与彼此共价连接,但例如借助氢键、范德瓦尔斯相互作用、疏水作用、磁性及其组合非共价有关。
生物样品:如本文所用的,术语“生物样品”一般是指如本文所述获得自或源自感兴趣的生物来源(例如,组织或生物或细胞培养物)的样品。在一些实施方案中,感兴趣的来源包括诸如动物或人的生物,或由其组成。在一些实施方案中,生物样品包括生物组织或流体,或由其组成。在一些实施方案中,生物样品可以是或包括骨髓;血液;血液细胞;腹水;组织或细针活组织检查样品;含细胞的体液;自由漂浮的核酸;痰;唾液;尿;脑脊液,腹膜液;胸膜液(pleural fluid);粪便;淋巴;妇科液(gynecological fluids);皮肤拭子;阴道拭子;口腔拭子;鼻拭子;洗涤液(washings)或灌洗液(lavages),如导管灌洗液或支气管肺泡灌洗液;抽吸物;刮除物(scrapings);骨髓样品;组织活组织检查样品;外科手术样品;其他体液,分泌物和/或排泄物;和/或来自其的细胞,等。在一些实施方案中,生物样品包括获得自个体的细胞,或由其组成。在一些实施方案中,获得的细胞是或包括来自从其获得样品的个体的细胞。在一些实施方案中,样品是通过任何适当的手段直接获得自感兴趣的来源的“原始样品”。例如,在一些实施方案中,通过选自活组织检查(例如,细针抽吸或组织活组织检查)、外科手术、收集体液(例如,血液、淋巴、粪便等)等的方法获得原始生物样品。在一些实施方案中,如从上下文中将清楚的,术语“样品”是指通过处理(例如,通过除去其一种或多种组分和/或通过向其添加一种或多种试剂)原始样品获得的制剂。例如,使用半透膜过滤。这种“处理的样品”可以包括例如从样品提取的或通过使原始样品经受诸如mRNA的扩增或逆转录、某些组分的分离和/或纯化等的技术而获得的核酸或蛋白。
包含:本文描述为“包含”一个或多个指定的要素或步骤的组合物或方法是开放式的,从而意味着指定的要素或步骤是必不可少的,但在所述组合物或方法的范围内可以添加其他要素或步骤。要理解的是,描述为“包含(comprising)”(或其“包含(comprises)”)一个或多个指定的要素或步骤的组合物或方法还描述相应的、更有限制的“基本上由”相同的指定的要素或步骤“组成”(或其“基本上由”相同的指定的要素或步骤“组成”)组合物或方法,从而意味着所述组合物或方法包括指定的必要要素或步骤,并且还可以包括不实质性影响所述组合物或方法的一种或多种基本和新特征的额外要素或步骤。还理解的是,本文描述为“包含”一个或多个指定的要素或步骤或“基本上由”一个或多个指定的要素或步骤“组成”的任何组合物或方法也描述相应的、更有限制的和封闭式的“由”指定的要素或步骤“组成”(或“由”指定的要素或步骤“组成”)的组合物或方法,以便排除任何其他未提及的要素或步骤。在本文公开的任何组合物或方法中,任何指定的必要要素或步骤的已知或公开的等同物可以代替该要素或步骤。
设计的:如本文所用的,术语“设计的”是指这样的试剂,(i)其结构由人手选择;(ii)通过需要人手的方法产生;和/或(iii)与天然物质和其他已知试剂不同。
测定:阅读本说明书的本领域普通技术人员将理解,“测定”可以利用本领域技术人员可用的多种技术(包括例如本文明确提及的特定技术)中的任一种或通过使用本领域技术人员可用的多种技术(包括例如本文明确提及的特定技术)中的任一种来完成。在一些实施方案中,测定涉及操纵物理样品。在一些实施方案中,测定涉及考虑和/或操纵数据或信息,例如利用适合于执行相关分析的计算机或其他处理部件。在一些实施方案中,测定涉及从来源接收相关信息和/或材料。在一些实施方案中,测定涉及将样品或实体的一种或多种特征与可比较的参照进行比较。
同一性:如本文所用的,术语“同一性”是指聚合分子之间,例如核酸分子(例如DNA分子和/或RNA分子)之间和/或多肽分子之间的总相关性。在一些实施方案中,如果聚合分子的序列至少25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或99%相同,则它们被认为与彼此“基本上相同”。例如,两个核酸或多肽序列的百分比同一性计算可以通过对最佳比较来说比对两个序列来进行(例如,可以为了最佳比对在第一和第二序列中的一个或两个中引入缺口,并且对比较来说,可以把不相同的序列忽略不计)。在某些实施方案中,对比较来说比对的序列的长度是参考序列的长度的至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%或基本上100%。然后比较相应位置处的核苷酸。当第一序列中的位置被与第二序列中的相应位置相同的残基(例如,核苷酸或氨基酸)占据时,则分子在该位置是相同的。两个序列之间的百分比同一性是所述序列共有的相同位置的数目的函数,计及缺口的数目以及每个缺口的长度,其需要被引入以用于两个序列的最佳比对。两个序列之间的序列比较和百分比同一性的确定可以使用数学算法来完成。例如,可以使用已被并入ALIGN程序(2.0版)的Meyers和Miller (CABIOS, 1989, 4:11-17)的算法确定两个核苷酸序列之间的同一性百分比。在一些示例性实施方案中,用ALIGN程序进行的核酸序列比较使用PAM120权重残基表、12的缺口长度罚分和4的缺口罚分。另一方面,可以使用GCG软件包中的GAP程序使用NWSgapdna.CMP矩阵确定两个核苷酸序列之间的百分比同一性。
样品:如本文所用的,术语“样品”是指作为或含有感兴趣的组合物用于定性和或定量评估的物质。在一些实施方案中,样品是生物样品(即,来自生物(例如,细胞或生物)。在一些实施方案中,样品来自地质、水生、天文或农业来源。在一些实施方案中,感兴趣的来源包括诸如动物或人的生物,或由其组成。在一些实施方案中,用于法医分析的样品是或包括生物组织,生物流体,有机或非有机物质,如例如衣物、污垢、塑料、水。在一些实施方案中,农业样品包括有机物质,诸如叶、花瓣、树皮、木材、种子、植物、果实等,或由其组成。
基本上:如本文所用的,术语“基本上”是指表现出感兴趣的特征或性质的总的或接近总的程度或等级的定性状况。生物学领域的普通技术人员将理解,生物学和化学现象很少(如果有过的话)达到完成和/或进行到完全或达到或避免绝对结果。因此,在本文中使用术语“基本上”来捕获许多生物学和化学现象中固有的潜在的缺乏完全。
合成的:如本文所用的,词语“合成的”意指由人手产生,并且因此呈自然界中不存在的形式,这是因为其具有自然界中不存在的结构,或者是因为其与其在自然界中不与之有关的一种或多种其他组分有关,或者不与其在自然界中与之有关的一种或多种其他组分有关。
变体:如本文所用的,术语“变体”是指这样的实体,其显示与参考实体的显著的结构同一性,但与参考实体相比在一个或多个化学部分的存在或水平上与参考实体在结构上不同。在许多实施方案中,变体在功能上也与其参考实体不同。通常,是否将特定实体正确地认为是参考实体的“变体”基于其与参考实体的结构同一性的程度。如本领域技术人员将理解的,任何生物或化学参考实体都具有某些特征性结构要素。根据定义,变体是共有一个或多个这种特征性结构要素的不同化学实体。仅举几个实例,小分子可以具有特征性核心结构要素(例如,大环核心)和/或一个或多个特征性侧基(pendent)部分,以致小分子的变体是共有核心结构要素和特征性侧基部分、但在其他侧基部分和/或在核心内存在的键的类型(单键对双键,E对Z等)中不同的变体,多肽可以具有包含在线性或三维空间中相对于彼此具有指定的位置和/或有助于特定生物功能的多个氨基酸的特征性序列要素,核酸可以具有包含在线性或三维空间中相对于另一者具有指定的位置的多个核苷酸残基的特征性序列要素。例如,由于氨基酸序列中的一个或多个差异和/或共价附着至多肽主链的化学部分(例如,碳水化合物、脂质等)中的一个或多个差异的结果,变体多肽可以与参考多肽不同。在一些实施方案中,变体多肽显示与参考多肽的总序列同一性为至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%或99%。另一方面或另外地,在一些实施方案中,变体多肽不与参考多肽共有至少一个特征性序列要素。在一些实施方案中,所述参考多肽具有一种或多种生物活性。在一些实施方案中,变体多肽共有参考多肽的生物活性中的一种或多种。在一些实施方案中,变体多肽缺乏参考多肽的生物活性中的一种或多种。在一些实施方案中,与参考多肽相比,变体多肽显示降低水平的一种或多种生物活性。在许多实施方案中,如果感兴趣的多肽具有的氨基酸序列除了在特定位置处的少量序列改变以外与亲本的氨基酸序列相同,则认为感兴趣的多肽是亲本或参考多肽的“变体”。一般,与亲本相比,变体中的残基的少于20%、15%、10%、9%、8%、7%、6%、5%、4%、3%、2%被取代。在一些实施方案中,变体与亲本相比具有10、9、8、7、6、5、4、3、2或1个取代的残基。经常,变体具有非常小数目(例如,少于5、4、3、2或1个)的取代的功能残基(即,参与特定生物活性的残基)。此外,与亲本相比,变体一般具有不超过5、4、3、2或1个添加或缺失,并且经常不具有添加或缺失。此外,任何添加或缺失一般少于约25、约20、约19、约18、约17、约16、约15、约14、约13、约10、约9、约8、约7、约6个残基,且通常少于约5、约4、约3或约2个残基。在一些实施方案中,变体也可以具有一种或多种功能缺陷和/或可以另外被认为是“突变体”。在一些实施方案中,所述亲本或参考多肽是自然界中发现的多肽。如本领域普通技术人员将理解的,在自然界中通常可以发现特定感兴趣的多肽的多种变体,特别是当感兴趣的多肽是传染剂多肽时。
II. 某些实施方案的详述
还如上所讨论的,在各种情况下,提供用于NGS等的核酸文库制备的衔接头可能是有用的。然而,当前的衔接头设计就制造的成本、测序的效率和下游碱基识别(base-calling)的准确性、样品鉴定等而论具有几个缺点。
用根据本公开内容的模块式核酸衔接头可以克服这些和其他挑战。在一个方面,可以使用一种方案来实现所公开的衔接头以克服上述挑战,借此将UIDs和SIDs分配至寡核苷酸的两个分开的组上(图1)。因此,在一个实施方案中,制备分叉的衔接头的集合体,其中每个衔接头具有选自两种或更多种不同的UID序列的组的UID。在将含有UID的分叉的衔接头与靶核酸连接后,所得的连接产物用引物进行扩增,所述引物包括SIDs和任选其他序列信息,如NGS平台特异性序列。所得的扩增产物既包括来自初始衔接头连接步骤的一对UIDs,也包括来自扩增步骤的SID(或一对SIDs)。值得注意的是,前述模块式设计的变化形式也在本公开内容的范围内。例如,可以交换UIDs和SIDs的位置。即,分叉的衔接头上的UIDs可以代替SID,并且扩增引物中包括的SIDs可以代替UIDs。结果,通过连接并入SIDs,并且通过PCR扩增并入UIDs。公开的模块式核酸衔接头的再其他变化形式将从以下公开内容变得显而易见。
公开的模块式核酸衔接头设计的一个优点是,代替每个衔接头具有其自身SID、然后通过通用PCR引物对进行扩增,所述衔接头是通用的(例如,将具有16种不同UIDs的衔接头集合至一个衔接头管中),并且PCR引物含有SIDs。在这个设计中,UIDs和SIDs是分离的,从而允许减少要产生的必需寡核苷酸的数目。对于具有16种不同的UIDs和16种SIDs的衔接头设计,需要64种不同的寡核苷酸,而不是274种。此外,这些寡核苷酸比先前设计中的那些更短,这也降低寡核苷酸合成成本,并且同样可以增加连接的效率(且因此增加测定效率)。在一个方面,不同的UIDs的组包括2、4、8、16、32、64、128或更多种不同的UID序列。在另一个方面,不同的SIDs的组包括2、4、8、16、32、64、128或更多种不同的SID序列。值得注意的是,选择的UIDs和SIDs的数目将取决于实验的特性,包括期望的用于多重化的样品的数目,NGS平台(即,测序仪器)的容量,待分析的核酸样品的复杂性等。
在公开的模块式核酸衔接头设计的另一个方面,代替在每个衔接头的末端具有一致的GT的2-碱基标点标记,所述标点标记以可变的长度合成。可变长度标点标记的使用(图1)确保读长内的每个位置处的足够复杂性,因此不需要PhiX掺入或其他类似对照或复杂性增强材料。在一个实施方案中,所述标点标记在2-和4-碱基之间变化。在这个实现中,在T-突出端之前的最后一个碱基选自C核苷酸或G核苷酸,由此允许更强的氢键(即,“G-C封条”),这可以显示改善的连接效率。在另一个实施方案中,标点标记的末端碱基选自任何核苷酸中的任一种。在一个方面,可以设计标点标记,从而使得测序读长中的位置在该位置处从来都不具有大于选择的百分比(例如,62.5%)的任何碱基,从而消除了当使用公开的衔接头时添加PhiX或其他类似试剂的需要。表1和2中显示标点标记和每个位置处的碱基%的分类细目的列表。
表 1
表 2
*假设核酸样品在每个位置处具有每个碱基的25%表现
在本公开内容的另一个方面,可以设计UIDs,从而使得如果UID中发生一个或多个错误,则UID不结果产生与选择的UID序列的集合体中的另一种UID相同的序列。这样,可以校正具有一个或多个错误的UIDs或将其从进一步分析中除去。在所附的实现中,代替具有2个核苷酸的长度的UIDs,使用具有5个核苷酸的长度的UID,其成对编辑距离为至少3。如本文所定义的,成对编辑距离是两个字符串(例如,核苷酸序列)之间的相似性的量度,如通过计数将一个串转化成另一个串所需的最小操作数所确定的。如本公开内容的实例中所用的,根据Levenshtein距离确定成对编辑距离,其中操作限于缺失、插入和取代;然而,如本领域普通技术人员将理解的,可以使用其他方法来计算成对编辑距离。在成对编辑距离为3的情况下,总是可以正确地鉴定具有单一错误的UIDs。这允许最多到25种不同的UIDs (参见,例如,Faircloth, 等人 2012.PLoS ONE 7(8): e42543)。在所附的实现(表3)中,使用16种UIDs。也可以使用不同长度的UIDs(例如,具有长度短至2个碱基和长至10个碱基的UIDs的设计)。在2碱基UIDs并使用如本文所述的可变标点标记的情况下,可以生成成对汉明距离(pairwise hamming distance)为2的UIDs +标点标记 - 在这个实现(表4)中,UIDs中的一个取代错误永远不会结果产生与组中的另一个UID +标点标记相同的UID +标点标记序列。如本文所定义的,汉明距离是两个串之间的编辑距离,其中唯一允许的操作是取代。两个额外的UID方案显示于下表5和6中。
表3 (方案1)
表4 (方案4)
表5 (方案2)
表6 (方案3)
参考表3-6中举例说明的衔接头方案,可以将UID和标点标记与任何合适的衔接头序列组合。例如,ILLUMINA i5和i7衔接头序列分别是TCTTTCCCTACACGACGCTCTTCCGATCT (SEQID NO:1)和AGATCGGAAGAGCACACGTCTGAACTCCAGTCAC (SEQ ID NO:2)。可以将表3的第一行中的UID序列(UID) CAGAT和i5标点标记(i5 punc) C与ILLUMINA i5衔接头序列组合以提供寡核苷酸序列TCTTTCCCTACACGACGCTCTTCCGATCTCAGATC*T (SEQ ID NO:3),其中星号(*)表示硫代磷酸酯键。类似地,可以将UID的反向互补序列(complement)(rc UID) ATCTG和i7标点标记(i7 punc) G (i5标点标记C的反向互补序列)与ILLUMINA i7衔接头序列组合以提供寡核苷酸序列GATCTGAGATCGGAAGAGCACACGTCTGAACTCCAGTCAC (SEQ ID NO:4),其中该序列包括5'-磷酸基团。表3-6各自列出可用于制备16种寡核苷酸对的组的16种不同的UID/标点标记组合的组。
为了制备衔接头,合成、纯化和退火每个寡核苷酸对以提供退火的衔接头的同质群体。然后将16种不同的退火的衔接头的集合体组合以制备一种具有16种不同的UIDs的衔接头集合体。将理解的是,也可以使用描述的方法来制备具有多于或少于16种不同的UIDs的衔接头的集合体。
在本公开内容的另一个方面,代替仅一个测序读长上的SID,可以将SID并入一个或两个PCR引物,用于扩增由靶核酸与具有不同的UIDs的退火的衔接头连接产生的产物。通过使用具有并入其中的SIDs的引物,由测序产生的两个索引读长(index reads)将提供SIDs。在一个引物对内,可以设计SIDs以具有一对一映射,从而使得当来自一个索引读长的SID已知时,来自另一读长(来自双末端)的SID是可预测的。当与第一SID有关的来自一种样品的分子附着至与第二SID有关的来自另一种样品的分子时,这种SIDs的一对一映射使得能够除去SID中的读长。在表7和8中显示的实现中,SIDs是彼此的反向物(reverse)。当两个序列以相反顺序共有相同的核苷酸序列时,一个序列被认为是另一序列的“反向物”。例如,如果第一SID具有序列AACT,则具有序列TCAA的第二SID将是第一SID的反向物。值得注意的是,序列的反向物不同于序列的反向互补序列。SIDs具有3的最小成对编辑距离,因此在最多到1个错误的情况下,SID可以总是与正确的SID序列正确有关。Faircloth和同事(Faircloth, 等人 2012. PLoS ONE 7(8):e42543)描述了与本公开内容一起使用的示例SIDs。尽管表7和8中的序列包括96个SID对,但将理解的是,在本公开内容的上下文中可以使用SIDs的再其他序列、组合和数目。
表7
表 8
在一个方面,将理解的是,模块式核酸衔接头的实施方案可包括本文所述的特征的任何组合。在一个实例中,表5中举例说明的方案预期具有长度为2个核苷酸的UIDs和可变长度标点标记的衔接头,而表6中举例说明的方案预期具有长度为2个核苷酸的UIDs和单一核苷酸标点标记(即,标点标记不具有可变的长度)的衔接头。
序列表
<110> ROCHE SEQUENCING SOLUTIONS, INC.
F. HOFFMANN-LA ROCHE AG
ROCHE DIAGNOSTICS GMBH
<120> 模块式核酸衔接头
<130> P34320-WO
<140>
<141>
<150> 62/525,595
<151> 2017-06-27
<160> 217
<170> PatentIn version 3.5
<210> 1
<211> 36
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 1
tctttcccta cacgacgctc ttccgatctc agatct 36
<210> 2
<211> 34
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 2
agatcggaag agcacacgtc tgaactccag tcac 34
<210> 3
<211> 36
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 3
tctttcccta cacgacgctc ttccgatctc agatct 36
<210> 4
<211> 40
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 4
gatctgagat cggaagagca cacgtctgaa ctccagtcac 40
<210> 5
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 5
aatgatacgg cgaccaccga gatctacacg ttaagcgaca ctctttccct acacgacgct 60
ct 62
<210> 6
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 6
aatgatacgg cgaccaccga gatctacacg agaccaaaca ctctttccct acacgacgct 60
ct 62
<210> 7
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 7
aatgatacgg cgaccaccga gatctacaca gccgtaaaca ctctttccct acacgacgct 60
ct 62
<210> 8
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 8
aatgatacgg cgaccaccga gatctacact tcgaagcaca ctctttccct acacgacgct 60
ct 62
<210> 9
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 9
aatgatacgg cgaccaccga gatctacaca tgacaggaca ctctttccct acacgacgct 60
ct 62
<210> 10
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 10
aatgatacgg cgaccaccga gatctacact cgtgcataca ctctttccct acacgacgct 60
ct 62
<210> 11
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 11
aatgatacgg cgaccaccga gatctacacc gaagtcaaca ctctttccct acacgacgct 60
ct 62
<210> 12
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 12
aatgatacgg cgaccaccga gatctacacg aatccgtaca ctctttccct acacgacgct 60
ct 62
<210> 13
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 13
aatgatacgg cgaccaccga gatctacacg aagtgctaca ctctttccct acacgacgct 60
ct 62
<210> 14
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 14
aatgatacgg cgaccaccga gatctacacg tccttgaaca ctctttccct acacgacgct 60
ct 62
<210> 15
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 15
aatgatacgg cgaccaccga gatctacacc atgtgtgaca ctctttccct acacgacgct 60
ct 62
<210> 16
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 16
aatgatacgg cgaccaccga gatctacaca cctcttcaca ctctttccct acacgacgct 60
ct 62
<210> 17
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 17
aatgatacgg cgaccaccga gatctacact ccgatcaaca ctctttccct acacgacgct 60
ct 62
<210> 18
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 18
aatgatacgg cgaccaccga gatctacacc gtatctcaca ctctttccct acacgacgct 60
ct 62
<210> 19
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 19
aatgatacgg cgaccaccga gatctacact tgcaacgaca ctctttccct acacgacgct 60
ct 62
<210> 20
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 20
aatgatacgg cgaccaccga gatctacact gataggcaca ctctttccct acacgacgct 60
ct 62
<210> 21
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 21
aatgatacgg cgaccaccga gatctacaca acagtccaca ctctttccct acacgacgct 60
ct 62
<210> 22
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 22
aatgatacgg cgaccaccga gatctacaca ggaacacaca ctctttccct acacgacgct 60
ct 62
<210> 23
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 23
aatgatacgg cgaccaccga gatctacact cctcatgaca ctctttccct acacgacgct 60
ct 62
<210> 24
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 24
aatgatacgg cgaccaccga gatctacaca gagcagaaca ctctttccct acacgacgct 60
ct 62
<210> 25
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 25
aatgatacgg cgaccaccga gatctacacg aacgaagaca ctctttccct acacgacgct 60
ct 62
<210> 26
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 26
aatgatacgg cgaccaccga gatctacact tgagctcaca ctctttccct acacgacgct 60
ct 62
<210> 27
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 27
aatgatacgg cgaccaccga gatctacacg ctgaatcaca ctctttccct acacgacgct 60
ct 62
<210> 28
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 28
aatgatacgg cgaccaccga gatctacaca gattgcgaca ctctttccct acacgacgct 60
ct 62
<210> 29
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 29
aatgatacgg cgaccaccga gatctacacc aacttggaca ctctttccct acacgacgct 60
ct 62
<210> 30
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 30
aatgatacgg cgaccaccga gatctacact tggtgcaaca ctctttccct acacgacgct 60
ct 62
<210> 31
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 31
aatgatacgg cgaccaccga gatctacacc tgtaccaaca ctctttccct acacgacgct 60
ct 62
<210> 32
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 32
aatgatacgg cgaccaccga gatctacaca ctctgagaca ctctttccct acacgacgct 60
ct 62
<210> 33
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 33
aatgatacgg cgaccaccga gatctacacc tcctagtaca ctctttccct acacgacgct 60
ct 62
<210> 34
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 34
aatgatacgg cgaccaccga gatctacacg ccaatacaca ctctttccct acacgacgct 60
ct 62
<210> 35
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 35
aatgatacgg cgaccaccga gatctacacc ctcatctaca ctctttccct acacgacgct 60
ct 62
<210> 36
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 36
aatgatacgg cgaccaccga gatctacact gagctgtaca ctctttccct acacgacgct 60
ct 62
<210> 37
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 37
aatgatacgg cgaccaccga gatctacacg tctcatcaca ctctttccct acacgacgct 60
ct 62
<210> 38
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 38
aatgatacgg cgaccaccga gatctacact aagcgcaaca ctctttccct acacgacgct 60
ct 62
<210> 39
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 39
aatgatacgg cgaccaccga gatctacaca gctaccaaca ctctttccct acacgacgct 60
ct 62
<210> 40
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 40
aatgatacgg cgaccaccga gatctacacc ttcactgaca ctctttccct acacgacgct 60
ct 62
<210> 41
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 41
aatgatacgg cgaccaccga gatctacacg agagtacaca ctctttccct acacgacgct 60
ct 62
<210> 42
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 42
aatgatacgg cgaccaccga gatctacacg cgttagaaca ctctttccct acacgacgct 60
ct 62
<210> 43
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 43
aatgatacgg cgaccaccga gatctacaca ggcaatgaca ctctttccct acacgacgct 60
ct 62
<210> 44
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 44
aatgatacgg cgaccaccga gatctacacg ctacaacaca ctctttccct acacgacgct 60
ct 62
<210> 45
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 45
aatgatacgg cgaccaccga gatctacact cagtaggaca ctctttccct acacgacgct 60
ct 62
<210> 46
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 46
aatgatacgg cgaccaccga gatctacacc tatgcctaca ctctttccct acacgacgct 60
ct 62
<210> 47
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 47
aatgatacgg cgaccaccga gatctacact gctgtgaaca ctctttccct acacgacgct 60
ct 62
<210> 48
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 48
aatgatacgg cgaccaccga gatctacacc cgaagataca ctctttccct acacgacgct 60
ct 62
<210> 49
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 49
aatgatacgg cgaccaccga gatctacaca gaccttgaca ctctttccct acacgacgct 60
ct 62
<210> 50
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 50
aatgatacgg cgaccaccga gatctacaca ctgcttgaca ctctttccct acacgacgct 60
ct 62
<210> 51
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 51
aatgatacgg cgaccaccga gatctacact aagtggcaca ctctttccct acacgacgct 60
ct 62
<210> 52
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 52
aatgatacgg cgaccaccga gatctacacc gcaatgtaca ctctttccct acacgacgct 60
ct 62
<210> 53
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 53
aatgatacgg cgaccaccga gatctacact gaccgttaca ctctttccct acacgacgct 60
ct 62
<210> 54
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 54
aatgatacgg cgaccaccga gatctacacc ctcgaataca ctctttccct acacgacgct 60
ct 62
<210> 55
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 55
aatgatacgg cgaccaccga gatctacact gctctacaca ctctttccct acacgacgct 60
ct 62
<210> 56
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 56
aatgatacgg cgaccaccga gatctacacg tcgttacaca ctctttccct acacgacgct 60
ct 62
<210> 57
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 57
aatgatacgg cgaccaccga gatctacaca tagtcggaca ctctttccct acacgacgct 60
ct 62
<210> 58
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 58
aatgatacgg cgaccaccga gatctacact agcaggaaca ctctttccct acacgacgct 60
ct 62
<210> 59
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 59
aatgatacgg cgaccaccga gatctacact acggaagaca ctctttccct acacgacgct 60
ct 62
<210> 60
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 60
aatgatacgg cgaccaccga gatctacaca ggtgttgaca ctctttccct acacgacgct 60
ct 62
<210> 61
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 61
aatgatacgg cgaccaccga gatctacacc cgatgtaaca ctctttccct acacgacgct 60
ct 62
<210> 62
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 62
aatgatacgg cgaccaccga gatctacacc tcgacttaca ctctttccct acacgacgct 60
ct 62
<210> 63
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 63
aatgatacgg cgaccaccga gatctacacg tagtaccaca ctctttccct acacgacgct 60
ct 62
<210> 64
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 64
aatgatacgg cgaccaccga gatctacaca ttagccgaca ctctttccct acacgacgct 60
ct 62
<210> 65
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 65
aatgatacgg cgaccaccga gatctacact ggaccataca ctctttccct acacgacgct 60
ct 62
<210> 66
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 66
aatgatacgg cgaccaccga gatctacacc atctgctaca ctctttccct acacgacgct 60
ct 62
<210> 67
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 67
aatgatacgg cgaccaccga gatctacacg actacgaaca ctctttccct acacgacgct 60
ct 62
<210> 68
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 68
aatgatacgg cgaccaccga gatctacacg cttcacaaca ctctttccct acacgacgct 60
ct 62
<210> 69
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 69
aatgatacgg cgaccaccga gatctacaca acgtagcaca ctctttccct acacgacgct 60
ct 62
<210> 70
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 70
aatgatacgg cgaccaccga gatctacaca ccatgtcaca ctctttccct acacgacgct 60
ct 62
<210> 71
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 71
aatgatacgg cgaccaccga gatctacacc tgtggtaaca ctctttccct acacgacgct 60
ct 62
<210> 72
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 72
aatgatacgg cgaccaccga gatctacacg ttggcataca ctctttccct acacgacgct 60
ct 62
<210> 73
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 73
aatgatacgg cgaccaccga gatctacacg atacctgaca ctctttccct acacgacgct 60
ct 62
<210> 74
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 74
aatgatacgg cgaccaccga gatctacacg acgtcataca ctctttccct acacgacgct 60
ct 62
<210> 75
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 75
aatgatacgg cgaccaccga gatctacacc aggatgtaca ctctttccct acacgacgct 60
ct 62
<210> 76
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 76
aatgatacgg cgaccaccga gatctacaca caccgataca ctctttccct acacgacgct 60
ct 62
<210> 77
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 77
aatgatacgg cgaccaccga gatctacact gcttgctaca ctctttccct acacgacgct 60
ct 62
<210> 78
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 78
aatgatacgg cgaccaccga gatctacact ggaagcaaca ctctttccct acacgacgct 60
ct 62
<210> 79
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 79
aatgatacgg cgaccaccga gatctacact atgaccgaca ctctttccct acacgacgct 60
ct 62
<210> 80
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 80
aatgatacgg cgaccaccga gatctacacc cgcttaaaca ctctttccct acacgacgct 60
ct 62
<210> 81
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 81
aatgatacgg cgaccaccga gatctacacc ctcgttaaca ctctttccct acacgacgct 60
ct 62
<210> 82
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 82
aatgatacgg cgaccaccga gatctacaca gctaagcaca ctctttccct acacgacgct 60
ct 62
<210> 83
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 83
aatgatacgg cgaccaccga gatctacacc taagaccaca ctctttccct acacgacgct 60
ct 62
<210> 84
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 84
aatgatacgg cgaccaccga gatctacact cacctagaca ctctttccct acacgacgct 60
ct 62
<210> 85
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 85
aatgatacgg cgaccaccga gatctacacg cataacgaca ctctttccct acacgacgct 60
ct 62
<210> 86
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 86
aatgatacgg cgaccaccga gatctacaca ggttcctaca ctctttccct acacgacgct 60
ct 62
<210> 87
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 87
aatgatacgg cgaccaccga gatctacacc gagttagaca ctctttccct acacgacgct 60
ct 62
<210> 88
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 88
aatgatacgg cgaccaccga gatctacact cttcgacaca ctctttccct acacgacgct 60
ct 62
<210> 89
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 89
aatgatacgg cgaccaccga gatctacact actgctcaca ctctttccct acacgacgct 60
ct 62
<210> 90
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 90
aatgatacgg cgaccaccga gatctacacc tgccataaca ctctttccct acacgacgct 60
ct 62
<210> 91
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 91
aatgatacgg cgaccaccga gatctacacc caagtagaca ctctttccct acacgacgct 60
ct 62
<210> 92
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 92
aatgatacgg cgaccaccga gatctacacg accgataaca ctctttccct acacgacgct 60
ct 62
<210> 93
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 93
aatgatacgg cgaccaccga gatctacacc atacggaaca ctctttccct acacgacgct 60
ct 62
<210> 94
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 94
aatgatacgg cgaccaccga gatctacact ctagtccaca ctctttccct acacgacgct 60
ct 62
<210> 95
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 95
aatgatacgg cgaccaccga gatctacaca gtgacctaca ctctttccct acacgacgct 60
ct 62
<210> 96
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 96
aatgatacgg cgaccaccga gatctacaca cctagacaca ctctttccct acacgacgct 60
ct 62
<210> 97
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 97
aatgatacgg cgaccaccga gatctacacg tggtatgaca ctctttccct acacgacgct 60
ct 62
<210> 98
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 98
aatgatacgg cgaccaccga gatctacacg ttatggcaca ctctttccct acacgacgct 60
ct 62
<210> 99
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 99
aatgatacgg cgaccaccga gatctacaca acagcgaaca ctctttccct acacgacgct 60
ct 62
<210> 100
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 100
aatgatacgg cgaccaccga gatctacacg tcctgttaca ctctttccct acacgacgct 60
ct 62
<210> 101
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 101
caagcagaag acggcatacg agatgcgaat tggtgactgg agttcagacg tgtgc 55
<210> 102
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 102
caagcagaag acggcatacg agataaccag aggtgactgg agttcagacg tgtgc 55
<210> 103
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 103
caagcagaag acggcatacg agataatgcc gagtgactgg agttcagacg tgtgc 55
<210> 104
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 104
caagcagaag acggcatacg agatcgaagc ttgtgactgg agttcagacg tgtgc 55
<210> 105
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 105
caagcagaag acggcatacg agatggacag tagtgactgg agttcagacg tgtgc 55
<210> 106
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 106
caagcagaag acggcatacg agattacgtg ctgtgactgg agttcagacg tgtgc 55
<210> 107
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 107
caagcagaag acggcatacg agatactgaa gcgtgactgg agttcagacg tgtgc 55
<210> 108
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 108
caagcagaag acggcatacg agattgccta aggtgactgg agttcagacg tgtgc 55
<210> 109
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 109
caagcagaag acggcatacg agattcgtga aggtgactgg agttcagacg tgtgc 55
<210> 110
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 110
caagcagaag acggcatacg agatagttcc tggtgactgg agttcagacg tgtgc 55
<210> 111
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 111
caagcagaag acggcatacg agatgtgtgt acgtgactgg agttcagacg tgtgc 55
<210> 112
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 112
caagcagaag acggcatacg agatcttctc cagtgactgg agttcagacg tgtgc 55
<210> 113
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 113
caagcagaag acggcatacg agatactagc ctgtgactgg agttcagacg tgtgc 55
<210> 114
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 114
caagcagaag acggcatacg agatctctat gcgtgactgg agttcagacg tgtgc 55
<210> 115
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 115
caagcagaag acggcatacg agatgcaacg ttgtgactgg agttcagacg tgtgc 55
<210> 116
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 116
caagcagaag acggcatacg agatcggata gtgtgactgg agttcagacg tgtgc 55
<210> 117
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 117
caagcagaag acggcatacg agatcctgac aagtgactgg agttcagacg tgtgc 55
<210> 118
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 118
caagcagaag acggcatacg agatcacaag gagtgactgg agttcagacg tgtgc 55
<210> 119
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 119
caagcagaag acggcatacg agatgtactc ctgtgactgg agttcagacg tgtgc 55
<210> 120
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 120
caagcagaag acggcatacg agatagacga gagtgactgg agttcagacg tgtgc 55
<210> 121
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 121
caagcagaag acggcatacg agatgaagca aggtgactgg agttcagacg tgtgc 55
<210> 122
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 122
caagcagaag acggcatacg agatctcgag ttgtgactgg agttcagacg tgtgc 55
<210> 123
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 123
caagcagaag acggcatacg agatctaagt cggtgactgg agttcagacg tgtgc 55
<210> 124
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 124
caagcagaag acggcatacg agatgcgtta gagtgactgg agttcagacg tgtgc 55
<210> 125
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 125
caagcagaag acggcatacg agatggttca acgtgactgg agttcagacg tgtgc 55
<210> 126
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 126
caagcagaag acggcatacg agatacgtgg ttgtgactgg agttcagacg tgtgc 55
<210> 127
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 127
caagcagaag acggcatacg agataccatg tcgtgactgg agttcagacg tgtgc 55
<210> 128
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 128
caagcagaag acggcatacg agatgagtct cagtgactgg agttcagacg tgtgc 55
<210> 129
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 129
caagcagaag acggcatacg agattgatcc tcgtgactgg agttcagacg tgtgc 55
<210> 130
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 130
caagcagaag acggcatacg agatcataac cggtgactgg agttcagacg tgtgc 55
<210> 131
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 131
caagcagaag acggcatacg agattctact ccgtgactgg agttcagacg tgtgc 55
<210> 132
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 132
caagcagaag acggcatacg agattgtcga gtgtgactgg agttcagacg tgtgc 55
<210> 133
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 133
caagcagaag acggcatacg agatctactc tggtgactgg agttcagacg tgtgc 55
<210> 134
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 134
caagcagaag acggcatacg agatacgcga atgtgactgg agttcagacg tgtgc 55
<210> 135
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 135
caagcagaag acggcatacg agataccatc gagtgactgg agttcagacg tgtgc 55
<210> 136
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 136
caagcagaag acggcatacg agatgtcact tcgtgactgg agttcagacg tgtgc 55
<210> 137
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 137
caagcagaag acggcatacg agatcatgag aggtgactgg agttcagacg tgtgc 55
<210> 138
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 138
caagcagaag acggcatacg agatagattg cggtgactgg agttcagacg tgtgc 55
<210> 139
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 139
caagcagaag acggcatacg agatgtaacg gagtgactgg agttcagacg tgtgc 55
<210> 140
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 140
caagcagaag acggcatacg agatcaacat cggtgactgg agttcagacg tgtgc 55
<210> 141
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 141
caagcagaag acggcatacg agatggatga ctgtgactgg agttcagacg tgtgc 55
<210> 142
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 142
caagcagaag acggcatacg agattccgta tcgtgactgg agttcagacg tgtgc 55
<210> 143
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 143
caagcagaag acggcatacg agatagtgtc gtgtgactgg agttcagacg tgtgc 55
<210> 144
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 144
caagcagaag acggcatacg agattagaag ccgtgactgg agttcagacg tgtgc 55
<210> 145
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 145
caagcagaag acggcatacg agatgttcca gagtgactgg agttcagacg tgtgc 55
<210> 146
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 146
caagcagaag acggcatacg agatgttcgt cagtgactgg agttcagacg tgtgc 55
<210> 147
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 147
caagcagaag acggcatacg agatcggtga atgtgactgg agttcagacg tgtgc 55
<210> 148
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 148
caagcagaag acggcatacg agattgtaac gcgtgactgg agttcagacg tgtgc 55
<210> 149
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 149
caagcagaag acggcatacg agatttgcca gtgtgactgg agttcagacg tgtgc 55
<210> 150
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 150
caagcagaag acggcatacg agattaagct ccgtgactgg agttcagacg tgtgc 55
<210> 151
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 151
caagcagaag acggcatacg agatcatctc gtgtgactgg agttcagacg tgtgc 55
<210> 152
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 152
caagcagaag acggcatacg agatcattgc tggtgactgg agttcagacg tgtgc 55
<210> 153
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 153
caagcagaag acggcatacg agatggctga tagtgactgg agttcagacg tgtgc 55
<210> 154
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 154
caagcagaag acggcatacg agataggacg atgtgactgg agttcagacg tgtgc 55
<210> 155
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 155
caagcagaag acggcatacg agatgaaggc atgtgactgg agttcagacg tgtgc 55
<210> 156
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 156
caagcagaag acggcatacg agatgttgtg gagtgactgg agttcagacg tgtgc 55
<210> 157
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 157
caagcagaag acggcatacg agatatgtag ccgtgactgg agttcagacg tgtgc 55
<210> 158
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 158
caagcagaag acggcatacg agatttcagc tcgtgactgg agttcagacg tgtgc 55
<210> 159
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 159
caagcagaag acggcatacg agatccatga tggtgactgg agttcagacg tgtgc 55
<210> 160
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 160
caagcagaag acggcatacg agatgccgat tagtgactgg agttcagacg tgtgc 55
<210> 161
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 161
caagcagaag acggcatacg agattaccag gtgtgactgg agttcagacg tgtgc 55
<210> 162
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 162
caagcagaag acggcatacg agattcgtct acgtgactgg agttcagacg tgtgc 55
<210> 163
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 163
caagcagaag acggcatacg agatagcatc aggtgactgg agttcagacg tgtgc 55
<210> 164
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 164
caagcagaag acggcatacg agatacactt cggtgactgg agttcagacg tgtgc 55
<210> 165
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 165
caagcagaag acggcatacg agatcgatgc aagtgactgg agttcagacg tgtgc 55
<210> 166
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 166
caagcagaag acggcatacg agatctgtac cagtgactgg agttcagacg tgtgc 55
<210> 167
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 167
caagcagaag acggcatacg agatatggtg tcgtgactgg agttcagacg tgtgc 55
<210> 168
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 168
caagcagaag acggcatacg agattacggt tggtgactgg agttcagacg tgtgc 55
<210> 169
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 169
caagcagaag acggcatacg agatgtccat aggtgactgg agttcagacg tgtgc 55
<210> 170
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 170
caagcagaag acggcatacg agattactgc aggtgactgg agttcagacg tgtgc 55
<210> 171
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 171
caagcagaag acggcatacg agattgtagg acgtgactgg agttcagacg tgtgc 55
<210> 172
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 172
caagcagaag acggcatacg agattagcca cagtgactgg agttcagacg tgtgc 55
<210> 173
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 173
caagcagaag acggcatacg agattcgttc gtgtgactgg agttcagacg tgtgc 55
<210> 174
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 174
caagcagaag acggcatacg agatacgaag gtgtgactgg agttcagacg tgtgc 55
<210> 175
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 175
caagcagaag acggcatacg agatgccagt atgtgactgg agttcagacg tgtgc 55
<210> 176
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 176
caagcagaag acggcatacg agataattcg ccgtgactgg agttcagacg tgtgc 55
<210> 177
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 177
caagcagaag acggcatacg agatattgct ccgtgactgg agttcagacg tgtgc 55
<210> 178
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 178
caagcagaag acggcatacg agatcgaatc gagtgactgg agttcagacg tgtgc 55
<210> 179
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 179
caagcagaag acggcatacg agatccagaa tcgtgactgg agttcagacg tgtgc 55
<210> 180
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 180
caagcagaag acggcatacg agatgatcca ctgtgactgg agttcagacg tgtgc 55
<210> 181
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 181
caagcagaag acggcatacg agatgcaata cggtgactgg agttcagacg tgtgc 55
<210> 182
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 182
caagcagaag acggcatacg agattccttg gagtgactgg agttcagacg tgtgc 55
<210> 183
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 183
caagcagaag acggcatacg agatgattga gcgtgactgg agttcagacg tgtgc 55
<210> 184
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 184
caagcagaag acggcatacg agatcagctt ctgtgactgg agttcagacg tgtgc 55
<210> 185
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 185
caagcagaag acggcatacg agatctcgtc atgtgactgg agttcagacg tgtgc 55
<210> 186
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 186
caagcagaag acggcatacg agatataccg tcgtgactgg agttcagacg tgtgc 55
<210> 187
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 187
caagcagaag acggcatacg agatgatgaa ccgtgactgg agttcagacg tgtgc 55
<210> 188
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 188
caagcagaag acggcatacg agatatagcc aggtgactgg agttcagacg tgtgc 55
<210> 189
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 189
caagcagaag acggcatacg agataggcat acgtgactgg agttcagacg tgtgc 55
<210> 190
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 190
caagcagaag acggcatacg agatcctgat ctgtgactgg agttcagacg tgtgc 55
<210> 191
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 191
caagcagaag acggcatacg agattccagt gagtgactgg agttcagacg tgtgc 55
<210> 192
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 192
caagcagaag acggcatacg agatcagatc cagtgactgg agttcagacg tgtgc 55
<210> 193
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 193
caagcagaag acggcatacg agatgtatgg tggtgactgg agttcagacg tgtgc 55
<210> 194
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 194
caagcagaag acggcatacg agatcggtat tggtgactgg agttcagacg tgtgc 55
<210> 195
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 195
caagcagaag acggcatacg agatagcgac aagtgactgg agttcagacg tgtgc 55
<210> 196
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 196
caagcagaag acggcatacg agatttgtcc tggtgactgg agttcagacg tgtgc 55
<210> 197
<211> 66
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的引物”
<400> 197
aatgatacgg cgaccaccga gatctacacg ttaagcgtct ttccctacac gacgctcttc 60
cgatct 66
<210> 198
<211> 66
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的引物”
<400> 198
caagcagaag acggcatacg agatgcgaat tggtgactgg agttcagacg tgtgctcttc 60
cgatct 66
<210> 199
<211> 43
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 199
tctttcccta cacgacgctc ttccgatctc agatctgatt aca 43
<210> 200
<211> 48
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 200
gattacactt ttgacagatc ggaagagaca cgtctgaact ccagtcac 48
<210> 201
<211> 48
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 201
tgtaatcaga tctgagatcg gaagagcaca cgtctgaact ccagtcac 48
<210> 202
<211> 44
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 202
tctttcccta cacgacgctc ttccgatctg tcaaaagtgt aatc 44
<210> 203
<211> 49
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 203
gattacactt ttgacagatc ggaagagcac acgtctgaac tccagtcac 49
<210> 204
<211> 43
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 204
tgtaatcaga tctgagatcg gaagagcgtc gtgtagggaa aga 43
<210> 205
<211> 44
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 205
gattacactt ttgacagatc ggaagagcgt cgtgtaggga aaga 44
<210> 206
<211> 66
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 206
aatgatacgg cgaccaccga gatctacacc ttaagcgtct ttccctacac gacgctcttc 60
cgatct 66
<210> 207
<211> 80
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 207
aatgatacgg cgaccaccga gatctacacg ttaagcgtct ttccctacac gacgctcttc 60
cgatctcaga tctgattaca 80
<210> 208
<211> 80
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 208
gattacactt ttacagatcg gaagagcaca cgtctgaact ccagtcacca attcgcatct 60
cgtatgccgt cttctgcttg 80
<210> 209
<211> 80
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 209
gttcgtcttc tgccgtatgc tctacgctta accactgacc tcaagtctgc acacgacaag 60
gctagagtct agactaatgt 80
<210> 210
<211> 81
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 210
ctaatgtgaa aactgtctag ccttctcgca gcacatccct ttctgcgaat tccacatcta 60
gagccaccag cggcatagta a 81
<210> 211
<211> 81
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 211
gattacactt ttgacagatc ggaagagcac acgtctgaac tccagtcacc aattcgcatc 60
tcgtatgccg tcttctgctt g 81
<210> 212
<211> 80
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 212
gttcgtcttc tgccgtatgc tctacgctta accactgacc tcaagtctgc acacgacaag 60
gctagagtct agactaatgt 80
<210> 213
<211> 80
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 213
ttactatgcc gctggtggct ctagatgtgc aattcgcaga aagggatgtg ctgcgagaag 60
gctagagtct agactaatgt 80
<210> 214
<211> 80
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 214
ttactatgcc gctggtggct ctagatgtgc aattcgcaga aagggatgtg ctgcgagaag 60
gctagagtct agactaatgt 80
<210> 215
<211> 81
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 215
gattacactt ttgacagatc ggaagagcac acgtctgaac tccagtcacc aattcgcatc 60
tcgtatgccg tcttctgctt g 81
<210> 216
<211> 81
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 216
gattacactt ttgacagatc ggaagagcgt cgtgtaggga aagacgctta aggtgtagat 60
ctcggtggtc gccgtatcat t 81
<210> 217
<211> 80
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注=“人工序列描述:合成的寡核苷酸”
<400> 217
gttcgtcttc tgccgtatgc tctacgctta accactgacc tcaagtctgc acacgacaag 60
gctagagtct agactaatgt 80
Claims (15)
1.用于制备具有衔接头序列的核酸文库用于测序的试剂盒,所述试剂盒包括:
第一寡核苷酸,其具有第一尾序列、第一共同序列和以下中的至少一种:i)第一独特标识符序列,和ii)第一可变长度标点标记;
第二寡核苷酸,其具有第二尾序列、与所述第一共同序列互补的第二共同序列和以下中的至少一种:i)与所述第一独特标识符序列互补的第二独特标识符序列,和ii)与所述第一可变长度标点标记互补的第二可变长度标点标记;
第一引物,其具有第一样品标识符序列和在所述第一引物的3’端的第一引发序列,所述第一引发序列包括所述第一寡核苷酸的所述第一尾序列;和
第二引物,其具有第二样品标识符序列和在所述第二引物的3’端的第二引发序列,所述第二引发序列与所述第二寡核苷酸的所述第二尾序列互补。
2.权利要求1的试剂盒,其中所述第一样品标识符序列和所述第二样品标识符序列具有一对一映射。
3.权利要求2的试剂盒,其中所述第一可变长度标点标记具有2-4个核苷酸的长度。
4.权利要求2的试剂盒,其中所述第一可变长度标点标记包括G和C核苷酸中的至少一个。
5.权利要求1的试剂盒,其中所述第一独特标识符序列具有至少5个核苷酸的长度。
6.权利要求5的试剂盒,其中所述第一独特标识符序列具有至少3的成对编辑距离。
7.用于制备具有衔接头序列的核酸文库用于测序的试剂盒,所述试剂盒包括:
多个寡核苷酸对,每个所述寡核苷酸对包括:
第一寡核苷酸,其具有第一尾序列、第一共同序列和以下中的至少一种:i)第一独特标识符序列,和ii)第一可变长度标点标记,和
第二寡核苷酸,其具有第二尾序列、与所述第一共同序列互补的第二共同序列和以下中的至少一种:i)与所述第一独特标识符序列互补的第二独特标识符序列,和ii)与所述第一可变长度标点标记互补的第二可变长度标点标记,
第一引物,其具有第一样品标识符序列和在所述第一引物的3’端的第一引发序列,所述第一引发序列包括所述第一寡核苷酸的所述第一尾序列;和
第二引物,其具有第二样品标识符序列和在所述第二引物的3’端的第二引发序列,所述第二引发序列与所述第二寡核苷酸的所述第二尾序列互补。
8.权利要求7的试剂盒,其中每个所述多个寡核苷酸对的每个所述第一独特标识符序列是不同的。
9.权利要求7的试剂盒,其中每个所述多个寡核苷酸对的每个所述第一尾序列是相同的。
10.权利要求7的试剂盒,其中每个所述多个寡核苷酸对的每个所述第二尾序列是相同的。
11.权利要求7的试剂盒,其中每个所述多个寡核苷酸对退火以形成分叉的衔接头。
12.权利要求7的试剂盒,其中所述第一样品标识符序列和所述第二样品标识符序列具有一对一映射。
13.权利要求7的试剂盒,其中每个所述第一独特标识符序列具有至少5个核苷酸的长度。
14.权利要求15的试剂盒,其中每个所述第一独特标识符序列具有至少3的成对编辑距离。
15.制备核酸分子的文库的方法,所述方法包括:
将多个寡核苷酸衔接头之一附着至靶核酸的每端以提供衔接头-靶-衔接头构建体,每个所述多个寡核苷酸衔接头具有:
第一寡核苷酸,其具有第一尾序列、第一共同序列和以下中的至少一种:i)第一独特标识符序列,和ii)第一可变长度标点标记,和
第二寡核苷酸,其具有第二尾序列、与所述第一共同序列互补的第二共同序列和以下中的至少一种:i)与所述第一独特标识符序列互补的第二独特标识符序列,和ii)与所述第一可变长度标点标记互补的第二可变长度标点标记;
使第一引物与所述衔接头-靶-衔接头构建体退火,所述第一引物具有第一样品标识符序列和在所述第一引物的3’端的第一引发序列,所述第一引发序列包括所述第一寡核苷酸的所述第一尾序列;和
将每个所述第一引物和所述第二引物延伸以形成与所述衔接头-靶-衔接头构建体的各链互补的延伸产物。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762525595P | 2017-06-27 | 2017-06-27 | |
US62/525595 | 2017-06-27 | ||
PCT/EP2018/067246 WO2019002366A1 (en) | 2017-06-27 | 2018-06-27 | MODULAR ADAPTERS OF NUCLEIC ACID |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110785493A true CN110785493A (zh) | 2020-02-11 |
CN110785493B CN110785493B (zh) | 2023-12-05 |
Family
ID=62751007
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880043050.4A Active CN110785493B (zh) | 2017-06-27 | 2018-06-27 | 模块式核酸衔接头 |
Country Status (8)
Country | Link |
---|---|
US (2) | US20200109397A1 (zh) |
EP (1) | EP3645717B1 (zh) |
JP (1) | JP7030857B2 (zh) |
CN (1) | CN110785493B (zh) |
DK (1) | DK3645717T3 (zh) |
ES (1) | ES2898644T3 (zh) |
LT (1) | LT3645717T (zh) |
WO (1) | WO2019002366A1 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US12037640B2 (en) * | 2021-01-08 | 2024-07-16 | Agilent Technologies, Inc. | Sequencing an insert and an identifier without denaturation |
EP4314328A1 (en) * | 2021-03-29 | 2024-02-07 | Illumina, Inc. | Compositions and methods for assessing dna damage in a library and normalizing amplicon size bias |
CN118355129A (zh) | 2021-12-07 | 2024-07-16 | 卡里布生物科学公司 | 捕获crispr核酸内切酶切割产物的方法 |
WO2024073412A2 (en) * | 2022-09-26 | 2024-04-04 | The Rockefeller University | Compositions and methods for synthesizing multi-indexed sequencing libraries |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008093098A2 (en) * | 2007-02-02 | 2008-08-07 | Illumina Cambridge Limited | Methods for indexing samples and sequencing multiple nucleotide templates |
CN104838014A (zh) * | 2012-10-15 | 2015-08-12 | 生命技术公司 | 用于标靶核酸富集的组合物、方法、系统和试剂盒 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2924487T3 (es) * | 2016-01-29 | 2022-10-07 | Hoffmann La Roche | Un adaptador de conformación en Y novedoso para secuenciación de ácidos nucleicos y procedimiento de uso |
-
2018
- 2018-06-27 WO PCT/EP2018/067246 patent/WO2019002366A1/en unknown
- 2018-06-27 EP EP18734550.9A patent/EP3645717B1/en active Active
- 2018-06-27 JP JP2019571503A patent/JP7030857B2/ja active Active
- 2018-06-27 CN CN201880043050.4A patent/CN110785493B/zh active Active
- 2018-06-27 DK DK18734550.9T patent/DK3645717T3/da active
- 2018-06-27 LT LTEPPCT/EP2018/067246T patent/LT3645717T/lt unknown
- 2018-06-27 ES ES18734550T patent/ES2898644T3/es active Active
-
2019
- 2019-12-19 US US16/721,533 patent/US20200109397A1/en not_active Abandoned
-
2022
- 2022-11-03 US US18/052,337 patent/US20230081899A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008093098A2 (en) * | 2007-02-02 | 2008-08-07 | Illumina Cambridge Limited | Methods for indexing samples and sequencing multiple nucleotide templates |
CN104838014A (zh) * | 2012-10-15 | 2015-08-12 | 生命技术公司 | 用于标靶核酸富集的组合物、方法、系统和试剂盒 |
Non-Patent Citations (2)
Title |
---|
AARON M NEWMAN等: "Integrated digital error suppression for improved detection of circulating tumor DNA" * |
BRANT C. FAIRCLOTH等: "Not All Sequence Tags Are Created Equal: Designing and Validating Sequence Identification Tags Robust to Indels" * |
Also Published As
Publication number | Publication date |
---|---|
ES2898644T3 (es) | 2022-03-08 |
EP3645717B1 (en) | 2021-08-11 |
JP2020529833A (ja) | 2020-10-15 |
WO2019002366A1 (en) | 2019-01-03 |
LT3645717T (lt) | 2021-12-10 |
CN110785493B (zh) | 2023-12-05 |
DK3645717T3 (da) | 2021-11-08 |
US20230081899A1 (en) | 2023-03-16 |
EP3645717A1 (en) | 2020-05-06 |
US20200109397A1 (en) | 2020-04-09 |
JP7030857B2 (ja) | 2022-03-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2018331434B2 (en) | Universal short adapters with variable length non-random unique molecular identifiers | |
AU2018210188B2 (en) | Methods and systems for generation and error-correction of unique molecular index sets with heterogeneous molecular lengths | |
AU2018266377B2 (en) | Universal short adapters for indexing of polynucleotide samples | |
CN110785493B (zh) | 模块式核酸衔接头 | |
JP2020072674A (ja) | 核酸の標準化された配列決定のための方法およびその使用 | |
US20110129827A1 (en) | Methods for transcript analysis | |
JP7171709B2 (ja) | 圧縮分子タグ付き核酸配列データを用いた融合の検出のための方法 | |
JP7051677B2 (ja) | 次世代シークエンシングのための高分子量dnaサンプル追跡タグ | |
CN110997944A (zh) | 用于检测brca1/2中的大片段重排方法和系统 | |
KR20220156837A (ko) | 공간적으로 분해된 단세포 rna 서열분석 방법 | |
CN105112518B (zh) | 一种基于Pacbio RS II测序平台的HLA分型方法 | |
JP6766191B2 (ja) | 次世代シーケンシングにおける検体間相互汚染の検出方法 | |
JP2023521687A (ja) | 浮動バーコード | |
EP3918091A1 (en) | Method of sequencing nucleic acid with unnatural base pairs | |
JP7152599B2 (ja) | 塩基配列決定のためのモジュール式およびコンビナトリアル核酸試料調製のためのシステムおよび方法 | |
CN114214734A (zh) | 一种单分子靶标基因建库方法及其试剂盒 | |
US11913062B2 (en) | System and method for isolation and qualification of nucleic acids | |
WO2023058100A1 (ja) | 構造多型の検出方法、プライマーセット及びプライマーセットの設計方法 | |
CN117844906A (zh) | 反转录接头引物、LncRNA的建库测序方法及应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |