CN112840023A - 使用索引和条形码识别阵列上的配体的方法和组合物 - Google Patents
使用索引和条形码识别阵列上的配体的方法和组合物 Download PDFInfo
- Publication number
- CN112840023A CN112840023A CN201980064490.2A CN201980064490A CN112840023A CN 112840023 A CN112840023 A CN 112840023A CN 201980064490 A CN201980064490 A CN 201980064490A CN 112840023 A CN112840023 A CN 112840023A
- Authority
- CN
- China
- Prior art keywords
- subpopulation
- bead
- capture probe
- beads
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000003446 ligand Substances 0.000 title claims abstract description 95
- 238000000034 method Methods 0.000 title claims abstract description 87
- 239000000203 mixture Substances 0.000 title abstract description 12
- 239000011324 bead Substances 0.000 claims abstract description 516
- 239000000523 sample Substances 0.000 claims abstract description 496
- 238000012163 sequencing technique Methods 0.000 claims abstract description 54
- 108091033319 polynucleotide Proteins 0.000 claims description 192
- 102000040430 polynucleotide Human genes 0.000 claims description 192
- 239000002157 polynucleotide Substances 0.000 claims description 192
- 150000007523 nucleic acids Chemical class 0.000 claims description 145
- 239000000758 substrate Substances 0.000 claims description 142
- 102000039446 nucleic acids Human genes 0.000 claims description 141
- 108020004707 nucleic acids Proteins 0.000 claims description 141
- 125000003729 nucleotide group Chemical group 0.000 claims description 116
- 239000002773 nucleotide Substances 0.000 claims description 109
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 58
- 239000000427 antigen Substances 0.000 claims description 20
- 108091007433 antigens Proteins 0.000 claims description 20
- 102000036639 antigens Human genes 0.000 claims description 20
- 239000012634 fragment Substances 0.000 claims description 19
- 238000003786 synthesis reaction Methods 0.000 claims description 15
- 102000003960 Ligases Human genes 0.000 claims description 12
- 108090000364 Ligases Proteins 0.000 claims description 12
- 230000000295 complement effect Effects 0.000 claims description 12
- 238000006243 chemical reaction Methods 0.000 claims description 11
- 238000011049 filling Methods 0.000 claims description 5
- 210000004027 cell Anatomy 0.000 description 26
- 238000001514 detection method Methods 0.000 description 19
- 239000000463 material Substances 0.000 description 12
- 238000003205 genotyping method Methods 0.000 description 11
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 10
- 238000009396 hybridization Methods 0.000 description 10
- 125000006850 spacer group Chemical group 0.000 description 10
- 239000003153 chemical reaction reagent Substances 0.000 description 9
- 238000010348 incorporation Methods 0.000 description 9
- 239000011148 porous material Substances 0.000 description 9
- 108020004414 DNA Proteins 0.000 description 8
- 238000003491 array Methods 0.000 description 8
- 238000003556 assay Methods 0.000 description 8
- -1 polypropylene Polymers 0.000 description 8
- 238000003776 cleavage reaction Methods 0.000 description 7
- 102000004169 proteins and genes Human genes 0.000 description 7
- 230000007017 scission Effects 0.000 description 7
- 230000002194 synthesizing effect Effects 0.000 description 7
- 102000004190 Enzymes Human genes 0.000 description 6
- 108090000790 Enzymes Proteins 0.000 description 6
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 6
- 239000011521 glass Substances 0.000 description 6
- 108020004999 messenger RNA Proteins 0.000 description 6
- 238000007481 next generation sequencing Methods 0.000 description 6
- 108090000623 proteins and genes Proteins 0.000 description 6
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 6
- 108700028369 Alleles Proteins 0.000 description 5
- 108091034117 Oligonucleotide Proteins 0.000 description 5
- 239000007850 fluorescent dye Substances 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 230000002441 reversible effect Effects 0.000 description 5
- 239000000377 silicon dioxide Substances 0.000 description 5
- PPBRXRYQALVLMV-UHFFFAOYSA-N Styrene Chemical compound C=CC1=CC=CC=C1 PPBRXRYQALVLMV-UHFFFAOYSA-N 0.000 description 4
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 4
- 230000003321 amplification Effects 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- 150000004676 glycans Chemical class 0.000 description 4
- 239000000017 hydrogel Substances 0.000 description 4
- 238000003199 nucleic acid amplification method Methods 0.000 description 4
- 229920001282 polysaccharide Polymers 0.000 description 4
- 239000005017 polysaccharide Substances 0.000 description 4
- 229920000936 Agarose Polymers 0.000 description 3
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 3
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 3
- 108091005461 Nucleic proteins Proteins 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 229910052739 hydrogen Inorganic materials 0.000 description 3
- 239000001257 hydrogen Substances 0.000 description 3
- 239000004055 small Interfering RNA Substances 0.000 description 3
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 3
- 229940113082 thymine Drugs 0.000 description 3
- 229940035893 uracil Drugs 0.000 description 3
- 229920000049 Carbon (fiber) Polymers 0.000 description 2
- 239000000020 Nitrocellulose Substances 0.000 description 2
- 239000004677 Nylon Substances 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- 108091007412 Piwi-interacting RNA Proteins 0.000 description 2
- 239000004698 Polyethylene Substances 0.000 description 2
- 239000004743 Polypropylene Substances 0.000 description 2
- 239000004793 Polystyrene Substances 0.000 description 2
- 229920002684 Sepharose Polymers 0.000 description 2
- 108020003224 Small Nucleolar RNA Proteins 0.000 description 2
- 102000042773 Small Nucleolar RNA Human genes 0.000 description 2
- 108020004459 Small interfering RNA Proteins 0.000 description 2
- 239000004809 Teflon Substances 0.000 description 2
- 229920006362 Teflon® Polymers 0.000 description 2
- 108091046869 Telomeric non-coding RNA Proteins 0.000 description 2
- NIXOWILDQLNWCW-UHFFFAOYSA-N acrylic acid group Chemical group C(C=C)(=O)O NIXOWILDQLNWCW-UHFFFAOYSA-N 0.000 description 2
- 239000012472 biological sample Substances 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 239000004917 carbon fiber Substances 0.000 description 2
- 229920001577 copolymer Polymers 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000002866 fluorescence resonance energy transfer Methods 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 238000012165 high-throughput sequencing Methods 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 108091070501 miRNA Proteins 0.000 description 2
- 238000002493 microarray Methods 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 229920001220 nitrocellulos Polymers 0.000 description 2
- 108091027963 non-coding RNA Proteins 0.000 description 2
- 102000042567 non-coding RNA Human genes 0.000 description 2
- 239000012038 nucleophile Substances 0.000 description 2
- 229920001778 nylon Polymers 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 239000004033 plastic Substances 0.000 description 2
- 229920003023 plastic Polymers 0.000 description 2
- 229920001748 polybutylene Polymers 0.000 description 2
- 229920000573 polyethylene Polymers 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 229920001155 polypropylene Polymers 0.000 description 2
- 229920002223 polystyrene Polymers 0.000 description 2
- 229920002635 polyurethane Polymers 0.000 description 2
- 239000004814 polyurethane Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012175 pyrosequencing Methods 0.000 description 2
- 239000011347 resin Substances 0.000 description 2
- 229920005989 resin Polymers 0.000 description 2
- 229910052710 silicon Inorganic materials 0.000 description 2
- 239000010703 silicon Substances 0.000 description 2
- 108091029842 small nuclear ribonucleic acid Proteins 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 229910052717 sulfur Inorganic materials 0.000 description 2
- JUIKUQOUMZUFQT-UHFFFAOYSA-N 2-bromoacetamide Chemical group NC(=O)CBr JUIKUQOUMZUFQT-UHFFFAOYSA-N 0.000 description 1
- PHIYHIOQVWTXII-UHFFFAOYSA-N 3-amino-1-phenylpropan-1-ol Chemical compound NCCC(O)C1=CC=CC=C1 PHIYHIOQVWTXII-UHFFFAOYSA-N 0.000 description 1
- CLGFIVUFZRGQRP-UHFFFAOYSA-N 7,8-dihydro-8-oxoguanine Chemical compound O=C1NC(N)=NC2=C1NC(=O)N2 CLGFIVUFZRGQRP-UHFFFAOYSA-N 0.000 description 1
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 108020001738 DNA Glycosylase Proteins 0.000 description 1
- 102000028381 DNA glycosylase Human genes 0.000 description 1
- 102100035619 DNA-(apurinic or apyrimidinic site) lyase Human genes 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 208000034826 Genetic Predisposition to Disease Diseases 0.000 description 1
- 101001137256 Homo sapiens DNA-(apurinic or apyrimidinic site) lyase Proteins 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 102000039471 Small Nuclear RNA Human genes 0.000 description 1
- 108091027967 Small hairpin RNA Proteins 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- 108020000999 Viral RNA Proteins 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 239000012491 analyte Substances 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000002144 chemical decomposition reaction Methods 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 239000005289 controlled pore glass Substances 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001212 derivatisation Methods 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000007672 fourth generation sequencing Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 238000007306 functionalization reaction Methods 0.000 description 1
- 238000011223 gene expression profiling Methods 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- GPRLSGONYQIRFK-UHFFFAOYSA-N hydron Chemical compound [H+] GPRLSGONYQIRFK-UHFFFAOYSA-N 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000003018 immunoassay Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 230000005291 magnetic effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- KVLNTIPUCYZQHA-UHFFFAOYSA-N n-[5-[(2-bromoacetyl)amino]pentyl]prop-2-enamide Chemical compound BrCC(=O)NCCCCCNC(=O)C=C KVLNTIPUCYZQHA-UHFFFAOYSA-N 0.000 description 1
- 239000002159 nanocrystal Substances 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 238000003203 nucleic acid sequencing method Methods 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 125000003835 nucleoside group Chemical group 0.000 description 1
- 230000005298 paramagnetic effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 238000007841 sequencing by ligation Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- ZCUFMDLYAMJYST-UHFFFAOYSA-N thorium dioxide Chemical compound O=[Th]=O ZCUFMDLYAMJYST-UHFFFAOYSA-N 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6816—Hybridisation assays characterised by the detection means
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6834—Enzymatic or biochemical coupling of nucleic acids to a solid phase
- C12Q1/6837—Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
- C12Q1/6874—Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2521/00—Reaction characterised by the enzymatic activity
- C12Q2521/50—Other enzymatic activities
- C12Q2521/501—Ligase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2533/00—Reactions characterised by the enzymatic reaction principle used
- C12Q2533/10—Reactions characterised by the enzymatic reaction principle used the purpose being to increase the length of an oligonucleotide strand
- C12Q2533/101—Primer extension
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2533/00—Reactions characterised by the enzymatic reaction principle used
- C12Q2533/10—Reactions characterised by the enzymatic reaction principle used the purpose being to increase the length of an oligonucleotide strand
- C12Q2533/107—Probe or oligonucleotide ligation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2535/00—Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
- C12Q2535/122—Massive parallel sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2563/00—Nucleic acid detection characterized by the use of physical, structural and functional properties
- C12Q2563/149—Particles, e.g. beads
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2563/00—Nucleic acid detection characterized by the use of physical, structural and functional properties
- C12Q2563/179—Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Health & Medical Sciences (AREA)
- Zoology (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Analytical Chemistry (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本文提供的一些实施方案包括用于检测阵列上的靶配体的方法和组合物。在一些实施方案中,捕获探针特异性结合到来自样本的靶配体,确定阵列中包含该捕获探针的小珠的位置,并且对该小珠进行解码以识别该捕获探针和该样本。在一些实施方案中,条形码指示附接于小珠的捕获探针;并且索引指示小珠亚群。在一些实施方案中,该条形码和该索引通过测序来确定。
Description
相关申请
本申请要求2019年9月20日提交的标题为“METHODS AND COMPOSITIONS FORHIGH-THROUGHPUT GENOTYPING ON ARRAYS USING INDEXES AND BARCODES”的美国临时申请62/903,108;以及2018年10月25日提交的标题为“POSITIONAL IDENTIFICATION OFMICROFEATURES IN ARRAYS USING BARCODES”的美国临时申请62/750,370的优先权,这些临时申请各自全文以引用方式并入。
技术领域
本文提供的一些实施方案包括用于检测阵列上的靶配体的方法和组合物。在一些实施方案中,捕获探针特异性结合到来自样本的靶配体,确定阵列中包含捕获探针的小珠的位置,并且对小珠进行解码以识别捕获探针和样本。在一些实施方案中,条形码指示附接于小珠的捕获探针;并且索引指示小珠亚群。在一些实施方案中,条形码和索引通过测序来确定。
背景技术
生物样本中存在的特定核酸序列的检测已被用作例如鉴定和分类微生物、诊断传染病、检测和表征遗传异常、鉴定与癌症相关联的遗传变化、研究对疾病的遗传易感性,以及测量对各种类型的治疗的反应的方法。用于检测生物样本中的特定核酸序列的常用技术是核酸测序。
核酸测序方法已从Maxam和Gilbert所使用的化学降解方法以及Sanger所使用的链延长方法得到了显著发展。现在使用了允许在单个芯片上并行处理数千个核酸的若干测序方法。一些平台包括基于小珠的形式和微阵列形式,其中二氧化硅小珠用探针官能化,这取决于此类形式在包括测序、基因分型、基因表达谱分析在内的应用中的应用。
发明内容
一些实施方案包括检测多个靶配体的方法,该方法包括:(a)获得第一小珠亚群和第二小珠亚群,其中每个小珠包含:特异性结合到靶配体的捕获探针、包含指示该捕获探针的条形码和该条形码的条形码引物结合位点3′的第一多核苷酸、以及包含索引和该索引的索引引物结合位点3′的第二多核苷酸,其中第一亚群的索引不同于第二亚群的索引;(b)使第一靶配体与第一小珠亚群的捕获探针接触,以及使第二靶配体与第二小珠亚群的捕获探针接触;(c)将包含特异性结合的第一靶配体和第二靶配体的第一小珠亚群和第二小珠亚群分布在基板上;(d)检测特异性结合到第一靶配体和第二靶配体的捕获探针;以及(e)解码包含所检测的捕获探针的小珠在基板上的位置。
在一些实施方案中,捕获探针包含核酸,第一靶配体和第二靶配体包含核酸,并且步骤(d)包括使特异性结合到第一靶配体和第二靶配体的捕获探针延伸。
在一些实施方案中,第一多核苷酸包含捕获探针。
在一些实施方案中,第一小珠亚群和第二小珠亚群的捕获探针各自包含彼此不同的核苷酸序列。
在一些实施方案中,第一小珠亚群和第二小珠亚群的不同捕获探针包含相同的核苷酸序列。
在一些实施方案中,捕获探针包含能够与单核苷酸多态性(SNP)或其互补序列杂交的核苷酸序列。
在一些实施方案中,步骤(d)包括捕获探针的聚合酶延伸。
在一些实施方案中,步骤(d)包括捕获探针的连接酶延伸。
在一些实施方案中,步骤(d)包括捕获探针的单核苷酸延伸。
在一些实施方案中,步骤(d)包括用多个核苷酸延伸捕获探针。
在一些实施方案中,所延伸的捕获探针包含可检测标记。
在一些实施方案中,捕获探针包含抗体或其抗原结合片段。
在一些实施方案中,第一小珠亚群和第二小珠亚群的捕获探针各自特异性结合到彼此不同的靶配体。
在一些实施方案中,第一小珠亚群和第二小珠亚群的不同捕获探针特异性结合到相同的靶配体。
在一些实施方案中,检测包括使特异性结合到捕获探针的第一靶配体和第二靶配体与第二抗体或其抗原结合片段接触,其中该第二抗体或其抗原结合片段包含可检测标记。
在一些实施方案中,条形码引物结合位点包含相同的核苷酸序列。
在一些实施方案中,第一小珠亚群的索引的核苷酸序列包含相同的核苷酸序列,并且第二小珠亚群的索引的核苷酸序列包含相同的核苷酸序列。
在一些实施方案中,索引引物结合位点的核苷酸序列包含相同的核苷酸序列。
在一些实施方案中,使第一靶配体与第一小珠亚群的捕获探针接触和使第二靶配体与第二小珠亚群的捕获探针接触在不同的反应体积中进行。
一些实施方案还包括,在将第一小珠亚群和第二小珠亚群分布在基板上之前,组合第一小珠亚群和第二小珠亚群。
在一些实施方案中,在将第二小珠亚群分布在基板上之前,将第一小珠亚群分布在基板上。
在一些实施方案中,步骤(d)在步骤(c)之前进行。
在一些实施方案中,所检测的捕获探针包含可检测标记。
在一些实施方案中,步骤(d)还包括确定所检测的捕获探针在基板上的位置。
在一些实施方案中,确定所检测的捕获探针的位置包括边合成边测序的至少一个循环。
在一些实施方案中,步骤(e)包括通过对基板上的索引进行测序来解码包含所检测的捕获探针的小珠的索引的位置。
在一些实施方案中,步骤(e)包括通过对基板上的条形码进行测序来解码包含所检测的捕获探针的小珠的条形码的位置。
在一些实施方案中,流通池包括基板。
在一些实施方案中,分布的第一小珠亚群和第二小珠亚群构成阵列。
在一些实施方案中,第一靶配体和第二靶配体获自不同的受试者。
在一些实施方案中,第一小珠亚群和第二小珠亚群各自包含至少50个彼此不同的捕获探针。
一些实施方案还包括至少10个不同小珠亚群,每个亚群包含不同于另一亚群的索引。
一些实施方案包括检测靶核酸的方法,该方法包括:(a)获得靶核酸,该靶核酸包含能够与第一捕获探针杂交的第一部分和能够与第二捕获探针杂交的第二部分;(b)获得小珠群体,每个小珠包含:第一捕获探针、第二捕获探针,其中第二捕获探针经由可切割接头附接于小珠,并且其中第二捕获探针包含可检测标记和第一多核苷酸,该第一多核苷酸包含指示第一捕获探针或第二捕获探针的条形码和该条形码的条形码引物结合位点3′;(c)将第一捕获探针与第二捕获探针连接,包括:使靶核酸与小珠群体的小珠的第一捕获探针和第二捕获探针杂交,以生成包含在第一捕获探针和第二捕获探针之间的单链缺口的双链核酸,以及填充第一捕获探针和第二捕获探针之间的该缺口;(d)切割可切割接头以生成包含可检测标记的第一捕获探针;(e)将小珠群体分布在基板上;以及(f)解码包含第一捕获探针的小珠在基板上的位置,该第一捕获探针包含可检测标记。
在一些实施方案中,第一捕获探针包含第一多核苷酸。
在一些实施方案中,步骤(e)在步骤(d)之前进行。
在一些实施方案中,每个小珠包含第二多核苷酸,该第二多核苷酸包含指示靶核酸来源的索引和该索引的索引引物结合位点3′。
在一些实施方案中,步骤(f)包括确定包含可检测标记的第一捕获探针在基板上的位置。
在一些实施方案中,步骤(f)包括通过对基板上的条形码进行测序来解码包含第一捕获探针的小珠的条形码在基板上的位置,该第一捕获探针包含可检测标记。
在一些实施方案中,流通池包括基板。
在一些实施方案中,分布的小珠群体构成阵列。
在一些实施方案中,该小珠群体包括第一小珠亚群和第二小珠亚群,每个小珠包含第二多核苷酸,该第二多核苷酸包含索引和该索引的索引引物结合位点3′,其中第一亚群的索引不同于第二亚群的索引。
在一些实施方案中,第一小珠亚群的索引的核苷酸序列包含相同的核苷酸序列,并且第二小珠亚群的索引的核苷酸序列包含相同的核苷酸序列。
在一些实施方案中,使用第一小珠亚群的连接或切割步骤在与使用第二小珠亚群的连接或切割步骤不同的反应体积中进行。
一些实施方案还包括,在将小珠群体分布在基板上之前,组合第一小珠亚群和第二小珠亚群。
在一些实施方案中,在将第二小珠亚群分布在基板上之前,将第一小珠亚群分布在基板上。
在一些实施方案中,步骤(f)包括通过对基板上的索引进行测序来解码包含所检测的捕获探针的小珠的索引的位置。
一些实施方案包括试剂盒,该试剂盒包括:第一小珠亚群和第二小珠亚群,其中每个小珠包含:特异性结合到靶配体的捕获探针、包含指示该捕获探针的条形码和该条形码的条形码引物结合位点3′的第一多核苷酸、以及包含索引和该索引的索引引物结合位点3′的第二多核苷酸,其中第一亚群的索引不同于第二亚群的索引,其中第一体积包括第一小珠亚群,并且第二体积包括第二小珠亚群。
在一些实施方案中,捕获探针选自核酸、抗体或其抗原结合片段。
在一些实施方案中,第一多核苷酸包含捕获探针。
在一些实施方案中,第一小珠亚群和第二小珠亚群的捕获探针各自特异性结合到彼此不同的靶配体。
在一些实施方案中,第一小珠亚群和第二小珠亚群的不同捕获探针特异性结合到相同的靶配体。
一些实施方案包括用于解码多核苷酸在阵列中的位置的方法,该方法包括:(a)获得基板,所述基板具有分布在基板的表面上的多核苷酸阵列,其中每个多核苷酸包含条形码的引物结合位点3′,其中每个多核苷酸连接到捕获探针;(b)使多个引物与引物结合位点杂交;以及(c)通过使所杂交的引物延伸来确定条形码的序列,其中每个条形码的序列指示多核苷酸在阵列中的位置。
附图说明
图1示出了包含条形码、引物结合位点和经由5′接头附接于小珠的捕获探针的多核苷酸的示例性实施方案。
图2示出了包含捕获探针、条形码和引物结合位点的多核苷酸的示例性实施方案,该引物结合位点经由5′接头附接于小珠,并且在捕获探针和条形码之间具有可切割接头。
图3示出了包含条形码、引物结合位点和经由3′接头附接于小珠的捕获探针的多核苷酸的示例性实施方案。
图4示出了包含间隔区、条形码、引物结合位点和经由5′接头附接于小珠的捕获探针的多核苷酸的示例性实施方案。
图5A示出了小珠的示例性实施方案,该小珠具有包含条形码、条形码引物结合位点和捕获探针的附接的第一多核苷酸,并且具有包含索引和索引引物结合位点的附接的第二多核苷酸。
图5B示出了包含与附接于小珠的捕获探针杂交的单核苷酸多态性(SNP)的靶核酸的示例性实施方案。
图5C示出了用可检测标记延伸的捕获探针的示例性实施方案。
图5D示出了与条形码引物结合位点杂交的条形码引物以及该条形码引物的延伸的示例性实施方案。
图5E示出了与索引引物结合位点杂交的索引引物以及该索引引物的延伸的示例性实施方案。
图6A示出了以下项的示例性实施方案:小珠,该小珠包含单个多核苷酸,该单个多核苷酸包含捕获探针(左图);小珠,该小珠包含:核酸捕获探针、包含指示该捕获探针的条形码的多核苷酸、以及包含将一个小珠亚群与另一小珠亚群区分开来的索引的多核苷酸(中间图);和小珠,该小珠包含:包含抗体或该抗体的抗原结合片段的捕获探针、包含指示该捕获探针的条形码的多核苷酸、以及包含将一个小珠亚群与另一小珠亚群区分开来的索引的多核苷酸(右图)。
图6B示出了以下项的示例性实施方案:小珠,该小珠包含与靶核酸杂交的第一捕获探针和第二捕获探针,其中第一捕获探针包含可切割接头(左图);以及小珠,该小珠包含蛋白质捕获探针,该蛋白质捕获探针瞬时结合基板以生成包含可检测标记的信号(右图)。
图6C示出了双探针测定的示例性实施方案,其中靶核酸与小珠上的第一捕获探针和第二捕获探针杂交,第一捕获探针连接到第二捕获探针,并且可切割接头被切割以生成包含延伸的第一捕获探针的小珠,该延伸的第一捕获探针包含可检测标记。
图7A是固定在流通池上的小珠池的照片。
图7B是某些分组(bin)中某些小珠类型的重复数的条形图。
图7C是平均C强度对平均T强度的图。平均C强度是来自一对核苷酸中的标记胞嘧啶的荧光强度,平均T强度是来自一对核苷酸中的标记胸腺嘧啶的荧光强度。
图8是代表性样本的某些分组中某些小珠类型的数量的直方图。
具体实施方式
本文提供的一些实施方案包括用于检测阵列上的靶配体的方法和组合物。在一些实施方案中,靶配体可包括核酸、蛋白质或其他抗原。在一些实施方案中,捕获探针特异性结合到来自样本的靶配体,确定阵列中包含捕获探针的小珠的位置,并且对小珠进行解码以识别捕获探针和样本。在一些实施方案中,条形码指示附接于小珠的捕获探针;并且索引指示小珠亚群。在一些实施方案中,条形码和索引通过测序来确定。一些实施方案还包括双探针测定,其中在靶核酸的存在下将附接于小珠的第一捕获探针和第二捕获探针连接在一起,从小珠切割连接产物的末端,并且在阵列上检测和解码包含延伸的捕获探针的小珠。
本文提供的一些实施方案涉及阵列上的高通量基因分型。一些实施方案涉及解码微特征在阵列中的位置。在一些实施方案中,微特征包括具有条形码和索引的多核苷酸。一些实施方案包括对条形码和索引进行测序,以识别多核苷酸在阵列中的位置。
通过杂交解码包括识别捕获探针在随机分布的捕获探针阵列中的位置。该方法通常涉及使标记的杂交探针与捕获探针的一个或多个部分杂交、对杂交事件成像以及移除杂交探针的若干连续循环。通过杂交解码需专用试剂、专用流体设备和专用检测器。在一些实施方案中,通过杂交解码可花费长达8小时的7-8个连续循环。
本发明的实施方案包括含有引物结合位点和条形码的多核苷酸的随机分布阵列。在一些实施方案中,可使用高通量测序系统容易地对条形码进行测序以解码阵列。一些实施方案可显著减少在没有额外试剂、杂交探针或专用解码设备的情况下解码阵列所花费的时间。
一些实施方案包括使用下一代测序(NGS)技术和基于小珠的微阵列。一些此类实施方案提供了高性能、低成本和高通量的基因分型测定,这种测定可在通用NGS测序平台上运行,对基板和试剂进行微小的修改。
在一些多路复用(multiplex)方法中,可通过保持每个样本物理分离来并行处理来自不同来源的多个核酸样本。本文提供的一些实施方案包括核酸索引方法,该方法通过经由相关小珠上的索引来索引每个样本,消除对在所有步骤中隔开各个样本的物理屏障的需要。在一些实施方案中,索引解复用(demultiplex)通过测序执行,并且可使用标准的边合成边测序(SBS)化学在客户现场执行。此外,通过采用可使用标准平台和SBS化学在客户现场实现的通过测序解码(DBS)方法,减少了由于小珠阵列的内部解码引起的成本、空间和时间限制。
一些实施方案包括含有图5A所示的小珠的索引富集小珠池。在一些此类实施方案中,小珠包含:第一多核苷酸,该第一多核苷酸包含基因座特异性捕获探针、用于阵列上相关探针的位置识别的条形码和用于条形码的SBS读取的条形码引物结合位点;以及第二多核苷酸,该第二多核苷酸包含用于样本多路复用的索引和用于索引的SBS读取的索引引物结合位点。
在一些实施方案中,小珠池复杂度由捕获探针的数量或丛(plexity,N)以及由所支持的样本数量(S)限定。因此,支持丛N和S个样本的小珠池将由S×N个独特的小珠类型组成。在一些实施方案中,捕获探针和/或索引引物包括额外的3′正交封闭剂,以避免在SBS期间对两种寡核苷酸之一的干扰。
一些实施方案包括进行基因分型测定,其中含有S个孔的多孔板装载有S个小珠池,每个小珠池具有独特的样本索引,其中每个孔含有N种独特的小珠类型。在从样本生成核酸文库后,用包括随机引物扩增、随后酶促片段化和纯化的步骤处理核酸样本,将每个样本文库添加到索引孔中,并允许其与捕获探针杂交。在杂交完成后,通过添加包含荧光核苷酸和适当聚合酶的掺入混合物来执行单碱基延伸测定以探测感兴趣的SNP。在掺入结束时,将板中的所有小珠捕获样本合并并装载到流通池中。流通池可以是普通的或有图案的,并且表面被适当地改性以支持小珠在所需密度下的固定。在一些实施方案中,在小珠固定时,执行SNP读出,该SNP读出包括单个扫描循环以读取来源于SNP位点处的荧光掺入的信号。该循环可包括仪器上的SBS循环。还进行条形码读出,包括12-20个SBS循环(取决于小珠池的多重性)来识别捕获探针和流通池内特定小珠的位置。在一些实施方案中,该步骤可被经过所识别的SNP的额外测序循环替换。还进行样本索引读出,包括6-12个SBS循环来读取样本索引。在一些实施方案中,整个流通池测定可包括少于约30个SBS循环,并且可在少于4小时内执行。
如本文所用,“阵列”可指不同微特征的群体,诸如包含多核苷酸的微特征,该微特征与表面相关联或附接,使得不同的微特征可根据相对位置彼此区分。阵列的单个特征可包括微特征的单个拷贝,或者该微特征的多个拷贝可作为阵列的单个特征处的微特征的群体而存在。每个特征处的微特征的群体通常是同质的,具有单个种类的微特征。因此,单个核酸序列的多个拷贝可存在于一个特征处,例如,存在于具有相同序列的多个核酸分子上。
在一些实施方案中,微特征的异质群体可存在于一个特征处。因此,一个特征可以但不必仅包括单个微特征种类,而是可包括多个不同的微特征种类,诸如具有不同序列的核酸的混合物。阵列的相邻特征可为彼此离散的,因为它们不重叠。因此,特征可彼此邻近或由缺口隔开。在特征间隔开的实施方案中,相邻位点可隔开例如小于100μm、50μm、10μm、5μm、1μm、0.5μm、100nm、50nm、10nm、5nm、1nm、0.5nm、100pm、50pm、1pm的距离或在前述距离中任两个距离的范围内的任何距离。阵列上特征的布局也可根据相邻特征之间的中心至中心距离来理解。可用于本发明的阵列可具有中心至中心间距小于约100μm、50μm、10μm、5μm、1μm、0.5μm、100nm、50nm、10nm、5nm、1nm、0.5nm、100pm、50pm、1pm或在前述距离中任两个距离的范围内的任何距离的相邻特征。
在一些实施方案中,上文和本文其他地方所述的距离值可表示阵列的相邻特征之间的平均距离。因此,除非有相反的明确说明,例如通过距离构成阵列的所有相邻特征之间的阈值距离的明确说明,否则并非所有相邻特征都需要落入指定范围内。实施方案可与具有各种密度中的任一种密度的特征的阵列一起使用。某些实施方案的密度的示例范围包括约10,000,000个特征/cm2至约2,000,000,000个特征/cm2;约100,000,000个特征/cm2至约1,000,000,000个特征/cm2;约100,000个特征/cm2至约10,000,000个特征/cm2;约1,000,000个特征/cm2至约5,000,000个特征/cm2;约10,000个特征/cm2至约100,000个特征/cm2;约20,000个特征/cm2至约50,000个特征/cm2;约1,000个特征/cm2至约5,000个特征/cm2,或在前述密度中任两个密度的范围内的任何密度。
如本文所用,“表面”可指可与试剂、小珠或分析物接触的基板或支撑结构的一部分。表面可为基本上平坦的或平面的。另选地,表面可为圆形的或轮廓状的。可包括在表面上的示例性轮廓为孔、凹陷、柱、脊、通道等。可用作基板或支撑结构的示例性材料包括:玻璃,诸如改性的或官能化的玻璃;塑料,诸如丙烯酸、聚苯乙烯或苯乙烯与另一种材料的共聚物、聚丙烯、聚乙烯、聚丁烯、聚氨酯或特氟隆;多糖或交联多糖,诸如琼脂糖或琼脂糖凝胶;尼龙;硝化纤维;树脂;二氧化硅或基于二氧化硅的材料,包括硅和改性硅;碳纤维;金属;无机玻璃;光纤束,或多种其他聚合物。单一材料或几种不同材料的混合物可形成可用于本发明的表面。在一些实施方案中,表面包括孔。在一些实施方案中,支撑结构可包括一个或多个层。示例性支撑结构可包括芯片、膜、多孔板和流通池。
如本文所用,“小珠”可指由刚性或半刚性材料制成的小主体。主体可具有例如以球形、椭圆形、微球形或其他公认的颗粒形状为特征的形状,无论是具有规则的尺寸还是不规则的尺寸。可用于小珠的示例性材料包括:玻璃,诸如改性的或官能化的玻璃;塑料,诸如丙烯酸、聚苯乙烯或苯乙烯与另一种材料的共聚物、聚丙烯、聚乙烯、聚丁烯、聚氨酯或特氟隆;多糖或交联多糖,诸如琼脂糖或琼脂糖凝胶;尼龙;硝化纤维;树脂;二氧化硅或基于二氧化硅的材料,包括硅和改性硅;碳纤维;金属;无机玻璃;或多种其他聚合物。示例性小珠包括可控孔玻璃小珠、顺磁性小珠、氧化钍溶胶、琼脂糖小珠、纳米晶体和本领域已知的其他小珠。小珠可由生物或非生物材料制成。由于在本文所述方法的各个步骤中使用磁体容易操纵磁珠,所以磁珠是特别有用的。用于某些实施方案中的小珠可具有约0.1μm至约100μm,约0.1nm至约500nm的直径、宽度或长度。在一些实施方案中,用于某些实施方案中的小珠可具有小于约100μm、50μm、10μm、5μm、1μm、0.5μm、100nm、50nm、10nm、5nm、1nm、0.5nm、100pm、50pm、1pm的直径、宽度或长度,或在前述直径、宽度或长度中任两个直径、宽度或长度的范围内的任何直径、宽度或长度。小珠尺寸可被选择为具有减小的尺寸,从而获得每单位面积更多的特征,同时保持足够的信号(每个特征的模板拷贝)以便分析特征。
在一些实施方案中,多核苷酸可附接于小珠。在一些实施方案中,小珠可分布到基板表面上的孔内。可用于某些实施方案中的示例性小珠阵列包括随机排序的BEADARRAY技术(Illumina公司(San Diego CA))。此类小珠阵列公开于:Michael等人,Anal Chem,第70卷,第1242-1248页(1998年);Walt,Science,第287卷,第451-452页(2000年);Fan等人,Cold Spring Harb Symp Quant Biol,第68卷,第69-78页(2003年);Gunderson等人,第37卷,第549-554页(2005年);Bibikova等人,Am J Pathol,第165卷,第1799-1807页(2004年);Fan等人,Genome Res,第14卷,第878-885页(2004年);Kuhn等人,Genome Res,第14卷,第2347-2356页(2004年);Yeakley等人,第20卷,第353-358页(2002年);以及Bibikova等人,Genome Res,第16卷,第383-393页(2006年),这些文献中的每一篇均全文以引用方式并入。
如本文所用,“多核苷酸”和“核酸”可互换使用,并且可指任何长度的核苷酸的聚合形式,即核糖核苷酸或脱氧核糖核苷酸。因此,该术语包括单链、双链或多链DNA或RNA。术语多核苷酸还指双链分子和单链分子两者。多核苷酸的示例包括基因或基因片段、基因组DNA、基因组DNA片段、外显子、内含子、信使RNA(mRNA)、转移RNA、核糖体RNA、非编码RNA(ncRNA)诸如PIWI相互作用RNA(piRNA)、小干扰RNA(siRNA)和长非编码RNA(lncRNA)、小发夹(shRNA)、小核RNA(snRNA)、微RNA(miRNA)、小核仁RNA(snoRNA)和病毒RNA、核酶、cDNA、重组多核苷酸、支链多核苷酸、质粒、载体、任何序列的分离DNA、任何序列的分离RNA、核酸探针、引物或前述任一项的扩增拷贝。多核苷酸可包含经修饰的核苷酸,诸如甲基化的核苷酸和核苷酸类似物,包括具有非天然碱基的核苷酸、具有经修饰的天然碱基诸如氮杂或去氮杂嘌呤的核苷酸。多核苷酸可由以下四种核苷酸碱基的特定序列构成:腺嘌呤(A)、胞嘧啶(C)、鸟嘌呤(G)和胸腺嘧啶(T)。当多核苷酸是RNA时,尿嘧啶(U)也可例如作为胸腺嘧啶的天然替代物存在。尿嘧啶也可用于DNA。因此,术语“序列”是指多核苷酸或任何核酸分子(包括天然碱基和非天然碱基)的字母表示。
如本文所用,“靶核酸”或其语法等同形式可指期望测序、分析和/或进一步操纵的核酸分子或序列。在一些实施方案中,靶核酸可附接于阵列。在一些实施方案中,可将捕获探针附接于阵列,并且该阵列随后用于检测与探针相互作用的样本中的靶核酸。就这一点而言,应当理解,在一些实施方案中,术语“靶”和“探针”可在核酸检测方法方面互换使用。
如本文所用,“捕获探针”可指具有足够的互补性以特异性杂交至靶核酸的多核苷酸。捕获探针可用作用于将靶核酸与混合物中的其他核酸和/或组分分离的亲和结合分子。在一些实施方案中,靶核酸可通过介入分子由捕获探针特异性结合。介入分子的示例包括接头、衔接子和其他具有足够互补性以特异性杂交至靶序列和捕获探针两者的桥接核酸。
如本文所用,“杂交”、“使…杂交”或其语法等同形式可指其中一种或多种多核苷酸反应形成复合物的反应,该复合物至少部分地经由核苷酸残基的碱基之间的氢键形成。氢键可通过Watson-Crick碱基配对、Hoogstein结合或以任何其他序列特异性方式出现。复合物可具有形成双链体结构的两条链、形成多链复合物的三条或更多条链、单条自杂交链或它们的任何组合。除了氢键之外,这些链还可通过力交联或以其他方式结合。
如本文所用,“使…延伸”、“延伸”或其任何语法等同形式可指通过延伸酶诸如聚合酶向引物、多核苷酸或其他核酸分子添加dNTP。例如,在本文所公开的一些方法中,所得的延伸引物包括RNA的序列信息。虽然一些实施方案被论述为使用聚合酶诸如DNA聚合酶或逆转录酶进行延伸,但延伸也可以本领域熟知的任何其他方式进行。例如,可通过将随机寡核苷酸的短片段连接在一起来进行延伸,该随机寡核苷酸诸如已杂交至感兴趣的链的寡核苷酸。
如本文所用,“连接”、“将…连接”或其其他语法等同形式可指通过磷酸二酯键结合两条核苷酸链。此类反应可由连接酶催化。连接酶是指通过ATP或类似的三磷酸酯的水解来催化该反应的一类酶。
通过测序解码
实施方案包括使用高通量测序来解码阵列的微特征的位置。在一些实施方案中,阵列的微特征包括多核苷酸。在一些实施方案中,多核苷酸可随机分布在基板的表面上。在一些实施方案中,多核苷酸可包含引物结合位点和条形码。在一些实施方案中,多核苷酸可包含捕获探针、引物结合位点和条形码。
解码多核苷酸在阵列中的位置的一些实施方案可包括(a)获得基板,所述基板具有分布在基板的表面上的多核苷酸阵列,其中每个多核苷酸包含条形码和引物结合位点;(b)使多个引物与所述引物结合位点杂交;以及(c)通过使杂交的引物延伸来确定条形码的序列。在一些此类实施方案中,每个条形码的序列可指示多核苷酸在阵列中的位置。例如,在一些实施方案中,可用多核苷酸制备阵列,其中条形码已知与某些捕获探针相关联,使得识别阵列上条形码的位置可指示相关联的捕获探针的位置。在此类实施方案中,每个多核苷酸可通过共同元件与捕获探针相关联。例如,多核苷酸和捕获探针可各自结合到相同的微特征诸如小珠。在更多此类实施方案中,每个多核苷酸可包含捕获探针。
在一些实施方案中,条形码可包括可用于识别阵列内的多核苷酸的核酸序列。该条形码可包括与其他条形码可区分的独特核苷酸序列。该条形码还可通过条形码的序列,也可通过条形码在多核苷酸内的位置,例如通过引物结合位点的5′位置,与多核苷酸和靶核酸中的其他核苷酸序列区分开来。例如,在一些实施方案中,条形码的序列可在多个核酸中存在不止一次,然而,位于引物结合位点5’处的条形码可被检测到。条形码可具有足以成为群体中的多个条形码内和/或被分析或询问的多个多核苷酸和靶核酸内的独特核苷酸序列的任何期望序列长度。在一些实施方案中,条形码是在约6-30个核苷酸范围内的多核苷酸内的核酸或区域。条形码可为例如6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸或更长。例如,条形码可为35、40、45或50个核苷酸或更长。用于一些实施方案的合适的条形码公开于美国专利8,053,192,该专利全文以引用方式并入。在一些实施方案中,条形码可将阵列中的一个多核苷酸与另一个多核苷酸区分开来,使得每个条形码不同于另一个条形码。在一些实施方案中,条形码可将阵列中多核苷酸的一个群体与多核苷酸的另一个群体区分开来,使得一组条形码不同于另一组条形码。
在一些实施方案中,引物结合位点可以是条形码的3′,使得与引物结合位点杂交的引物可被延伸以提供条形码的互补序列。例如,引物可被延伸以获得条形码的序列。在一些实施方案中,引物结合位点可直接邻近多核苷酸中的条形码。在一些实施方案中,多核苷酸的群体中的每个引物结合位点可具有相同的序列。在一些实施方案中,多核苷酸的一个亚群可包括具有第一序列的引物结合位点,并且多核苷酸的另一亚群可包括具有第二序列的引物结合位点。在一些实施方案中,使不同引物与多个不同引物结合位点杂交可以是同时的、顺序的或迭代的。
一些实施方案包括含有捕获探针的多核苷酸。在一些实施方案中,捕获探针可包括可与靶核酸杂交的序列。在一些实施方案中,多核苷酸的群体可包括彼此不同的捕获探针。在一些实施方案中,每个捕获探针可彼此不同。在一些实施方案中,捕获探针可彼此相似,例如它们可具有相似的序列和/或具有相似长度的相似序列。在一些实施方案中,捕获探针可与另一个捕获探针相差少于20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3或2个核苷酸的数量,其中核苷酸的数量可为捕获探针中的连续核苷酸、非连续核苷酸、插入核苷酸或缺失核苷酸。在一些实施方案中,捕获探针可与另一个捕获探针相差单个核苷酸。在一些实施方案中,引物结合位点和条形码可以是捕获探针的5′。在一些实施方案中,引物结合位点和条形码可以是捕获探针的3′。
一些实施方案包括含有可切割接头的多核苷酸。在一些此类实施方案中,可将可切割接头定位成使得切割接头可将捕获探针与引物结合位点和条形码分离。在一些实施方案中,可切割接头可位于捕获探针、引物结合位点和条形码之间的多核苷酸内。在一些实施方案中,可切割接头可移除包含引物结合位点和连接到捕获探针的条形码的多核苷酸。例如,多核苷酸和捕获探针均可与小珠结合。可切割接头的切割可从小珠中移除包含引物结合位点和条形码的多核苷酸。
在一些实施方案中,可切割接头可具有对应于至少2、3、5、10、15、20、25、30、50、100、500个核苷酸的长度,或在前述长度的任两个长度的范围内的长度。在一些实施方案中,可切割接头易于被试剂诸如光、碱、酸和酶诸如序列特异性限制酶或蛋白酶切割。可切割接头可包括一定的核苷酸序列,诸如酶的识别位点,并且/或者可包括易于用试剂切割的某些经修饰的核苷酸。在一些实施方案中,可切割接头可包括尿嘧啶,其可被外源碱基切割剂诸如DNA糖基化酶(UDG)切割。在一些实施方案中,可切割接头可包括8-羟基鸟嘌呤,其可被8-羟基鸟嘌呤DNA糖基化酶(FPG蛋白)切割。可切割接头的更多示例公开于美国专利申请公布2005/0181394,该专利全文以引用方式并入。
在一些实施方案中,多核苷酸附接于基板。在一些实施方案中,基板可包括小珠。可通过在多核苷酸的5′端或3′端处或附近与基板表面的单点共价附接,将多核苷酸固定到基板上,诸如小珠或其他表面上。在一些实施方案中,多核苷酸可包含附接于基板的间隔区。在一些实施方案中,间隔区可具有对应于至少2、3、5、10、15、20、25、30、50、100、500个核苷酸的长度,或在前述长度的任两个长度的范围内的长度。本领域已知的任何合适的共价附接方式均可用于此目的。所选择的附接化学将取决于固体载体的性质,以及对其应用的任何衍生化或官能化。多核苷酸可包含可为非核苷酸化学修饰的部分,以促进附接。在一些实施方案中,多核苷酸可包含例如位于5'端的含硫亲核试剂,诸如硫代磷酸酯或硫代磷酸盐。就固体承载的聚丙烯酰胺水凝胶而言,该亲核试剂将与水凝胶中存在的溴乙酰胺基团结合。将多核苷酸附接于固体载体的示例性方式是经由5′硫代磷酸酯附接于由聚合的丙烯酰胺和N-(5-溴乙酰氨基戊基)丙烯酰胺(BRAPA)构成的水凝胶,其公开于美国专利8,168,388中,该专利全文以引用方式并入。
在一些实施方案中,阵列中多核苷酸的位置可通过对多核苷酸的条形码进行测序来解码。例如,条形码序列可与阵列上的位点相关联,并且该位点可与特定捕获探针相关联。一些实施方案包括下一代测序(NGS),其可指允许克隆扩增分子和单个核酸分子的大规模平行测序的测序方法。NGS的示例包括边连接边测序和使用可逆染料终止子的边合成边测序(SBS)。在SBS中,监测核酸引物沿核酸模板的延伸,以确定模板中核苷酸的序列。基础化学过程可以是聚合。在特定的基于聚合酶的SBS实施方案中,以依赖于模板的方式添加荧光标记的核苷酸以使引物延伸,使得对添加至引物的核苷酸的顺序和类型的检测可用于确定模板的序列。
可对一个或多个扩增的核酸进行SBS或涉及在循环中重复递送试剂的其他检测技术。例如,为了启动第一SBS循环,可使一个或多个标记的核苷酸、DNA聚合酶等流入/流过容纳有一个或多个扩增核酸分子的水凝胶小珠。可检测其中引物延伸导致标记的核苷酸掺入的那些位点。任选地,核苷酸可进一步包括可逆终止属性,一旦将核苷酸添加至引物,该可逆终止属性终止进一步的引物延伸。例如,可将具有可逆终止子部分的核苷酸类似物添加至引物,使得随后的延伸直到递送解封闭剂以除去该部分才发生。因此,对于使用可逆终止的实施方案,可在检测发生之前或之后将解封闭试剂递送到流通池。洗涤可在各个递送步骤之间进行。然后可重复该循环n次以将引物延伸n个核苷酸,从而检测长度为n的序列。
一些SBS实施方案包括检测在将核苷酸掺入延伸产物时释放的质子。例如,基于对释放的质子的检测的测序可使用电检测器和可商购获得的相关技术。此类测序系统的示例是焦磷酸测序,诸如可从454Life Sciences(Roche的子公司)商购获得的平台;使用γ-磷酸标记的核苷酸的测序,诸如可从Pacific Biosciences商购获得的平台;以及使用质子检测的测序,诸如可从Life Technologies的Ion Torrent子公司商购获得的平台。一些实施方案包括美国专利申请公布2005/0130173和2006/0134633以及美国专利4,971,903、6,258,568和6,210,891中所述的焦磷酸测序,这些专利各自全文以引用方式并入。一些实施方案包括公开于美国专利5,599,675和美国专利5,750,341中的边连接边测序,这些专利中的每一篇均全文以引用方式并入。
一些实施方案可利用涉及DNA聚合酶活性的实时监测的方法。例如,核苷酸掺入可通过带有荧光团的聚合酶与γ-磷酸标记的核苷酸之间的荧光共振能量转移(FRET)相互作用来检测,或者用零模式波导(ZMW)来检测。另一种可用的测序技术是纳米孔测序。在一些纳米孔的实施方案中,靶核酸或从靶核酸移除的单独核苷酸穿过纳米孔。当核酸或核苷酸穿过纳米孔时,可通过测量孔的电导率的波动来识别每种核苷酸类型。
如图1所示,在一些实施方案中,阵列的微特征可包括经由5′接头20附接于小珠10的多核苷酸。多核苷酸可包含条形码30、引物结合位点40和捕获探针50。引物60可与引物结合位点杂交并被延伸以获得条形码的序列,从而解码阵列中微特征的位置。在一些实施方案中,捕获探针可与靶核酸杂交,并且捕获探针可例如通过聚合酶或通过连接酶延伸。在一些实施方案中,捕获探针可参与桥式扩增。桥式扩增的方法公开于美国专利7,985,565和7,115,400,这些专利各自全文以引用方式并入。
如图2所示,在一些实施方案中,阵列的微特征可包括多核苷酸,该多核苷酸包含捕获探针50、条形码30和引物结合位点40,其中该多核苷酸经由5′接头20附接于小珠10。在一些实施方案中,多核苷酸可包含捕获探针和条形码之间的可切割接头70。在一些实施方案中,引物60可与引物结合位点杂交,并确定条形码的序列,从而解码芯片中微特征的位置。在一些实施方案中,可切割多核苷酸,并且从包括小珠和捕获探针的微特征移除条形码和引物结合位点。一些此类实施方案在使靶核酸与捕获探针杂交之前提供解码阵列。在一些实施方案中,靶核酸可在阵列中的解码位置处与捕获探针杂交。在一些实施方案中,杂交的捕获探针可例如通过聚合酶或通过连接酶延伸。在一些实施方案中,捕获探针可参与桥式扩增。
如图3所示,在一些实施方案中,阵列的微特征可包括多核苷酸,该多核苷酸包含条形码30、引物结合位点40和经由3′接头25附接于小珠10的捕获探针50。在一些实施方案中,引物结合位点可邻接附接于小珠的接头。一些实施方案可包括在测定中使用此类微特征来筛选和开发某些聚合酶。例如,与附接于具有间隔区的小珠的引物位点相比,可针对附接于没有间隔区的小珠的引物位点筛选聚合酶的活性。在一些实施方案中,靶核酸可与捕获探针杂交。在一些实施方案中,杂交的靶核酸例如通过聚合酶或通过连接酶延伸。
如图4所示,阵列的微特征的实施方案可包括多核苷酸,该多核苷酸包含间隔区80、条形码30、引物结合位点40和经由5′接头20附接于小珠10的捕获探针50。
对多个靶核酸进行测序
一些实施方案包括对多个靶核酸进行测序。在一些实施方案中,靶核酸可来源于不同来源,诸如不同受试者,例如来自不同受试者的基因组DNA。在一些实施方案中,不同的靶核酸可与不同的索引相关联,使得索引可识别靶核酸的特定群体,诸如来源于单一来源的群体。
一些实施方案包括获得至少第一小珠亚群和第二小珠亚群,其中每个小珠包含:包含捕获探针、指示相同小珠的该捕获探针的条形码和该条形码的条形码引物结合位点3′的第一多核苷酸、以及包含索引和该索引的索引引物结合位点3′的第二多核苷酸,其中第一亚群的索引不同于第二亚群的索引。
在一些实施方案中,第一小珠亚群的索引的核苷酸序列包含相同的核苷酸序列,并且第二小珠亚群的索引的核苷酸序列包含相同的核苷酸序列。在一些实施方案中,索引引物结合位点的核苷酸序列包含相同的核苷酸序列。
在一些实施方案中,第一小珠亚群和/或第二亚群的捕获探针各自包含彼此不同的核苷酸序列。例如,第一亚群的捕获探针可彼此不同;并且/或者第一亚群的捕获探针可彼此不同。在一些实施方案中,第一小珠亚群的捕获探针各自包括具有与第二小珠亚群的捕获探针相同的核苷酸序列的捕获探针。在一些实施方案中,捕获探针可包含能够与单核苷酸多态性(SNP)或其互补序列杂交的核苷酸序列。在一些实施方案中,条形码引物结合位点包含相同的核苷酸序列。
一些实施方案还包括使第一靶核酸与第一小珠亚群的捕获探针杂交,以及使第二靶核酸与第二小珠亚群的捕获探针杂交。在一些此类实施方案中,使第一靶核酸与第一小珠亚群的捕获探针杂交和使第二靶核酸与第二小珠亚群的捕获探针杂交在不同的位置进行。例如,不同的位置包括不同的反应体积,诸如不同的孔,诸如多壁板中的不同孔。例如,在96孔板中,96个不同小珠亚群可与96个不同的靶核酸杂交,其中每个不同小珠亚群与不同孔中的不同靶核酸杂交。
在一些实施方案中,包含杂交的捕获探针和靶核酸的不同小珠亚群分布在基板诸如平面基板上。在一些实施方案中,分布的小珠亚群构成阵列。在一些实施方案中,基板包括多个离散位点。在一些实施方案中,基板包括多个孔。在一些实施方案中,基板包括多个通道。在一些实施方案中,流通池包括基板。
在一些实施方案中,将包含杂交的捕获探针和靶核酸的不同小珠亚群在分布于基板上之前进行组合。在一些实施方案中,将包含杂交的捕获探针和靶核酸的不同小珠亚群按顺序分布在基板上。例如,将包含杂交的捕获探针和靶核酸的第一小珠亚群分布在基板上,然后将包含杂交的捕获探针和靶核酸的第二小珠亚群分布在基板上。
在一些实施方案中,使杂交的捕获探针延伸。在一些实施方案中,在将包含杂交的捕获探针和靶核酸的不同小珠亚群分布在基板上之前延伸杂交的捕获探针。在一些实施方案中,在将包含杂交的捕获探针和靶核酸的小珠分布在基板上之后延伸杂交的捕获探针。在一些实施方案中,使杂交的捕获探针延伸可包括聚合酶延伸。在一些实施方案中,使杂交的捕获探针延伸可包括基于连接酶的延伸,诸如在存在连接酶的情况下将延伸探针连接到捕获探针。在一些实施方案中,延伸步骤可向延伸的捕获探针添加可检测标记。在一些实施方案中,可检测标记可包括荧光标记。
一些实施方案包括解码基板上的小珠。一些实施方案包括通过识别延伸的捕获探针、条形码和索引在基板上的位置来解码小珠。在一些实施方案中,基板上某个位置处特定条形码的存在指示该位置处的特定捕获探针。在一些实施方案中,基板上某个位置处某个索引的存在指示靶核酸的某个亚群的靶核酸与基板上的该位置相关联。在一些实施方案中,基板上某个位置处延伸的捕获探针的存在指示靶核酸的该亚群中某个靶核酸的存在。在一些实施方案中,条形码的种类、索引的种类和表面上单个位置处延伸的捕获探针的存在指示靶核酸的特定亚群中特定靶核酸的存在。
在一些实施方案中,解码基板上的小珠包括检测杂交的捕获探针或延伸的捕获探针的位置。在一些实施方案中,检测杂交的捕获探针或延伸的捕获探针的位置包括用可检测标记使杂交的捕获探针延伸。在一些实施方案中,检测杂交的捕获探针或延伸的捕获探针的位置包括边合成边测序的至少一个循环。
在一些实施方案中,解码基板上的小珠包括解码包含延伸的捕获探针的小珠的索引的位置。一些实施方案包括使多个索引引物与索引引物位点杂交,并使杂交的索引引物延伸。在一些实施方案中,使杂交的索引引物延伸包括边合成边测序的至少一个循环。在一些实施方案中,解码小珠的索引的位置包括对基板上的索引进行测序。
在一些实施方案中,解码基板上的小珠包括解码包含延伸的捕获探针的小珠的条形码的位置。一些实施方案包括使多个条形码引物与条形码引物位点杂交,并使杂交的条形码引物延伸。在一些实施方案中,解码基板上的小珠包括使杂交的条形码引物延伸,而使杂交的条形码引物延伸包括边合成边测序的至少一个循环。在一些实施方案中,解码基板上的小珠包括解码小珠的条形码的位置,而解码小珠的条形码的位置包括对基板上的条形码进行测序。
在一些实施方案中,第一小珠亚群和第二小珠亚群各自包含至少50个包含不同核苷酸序列的捕获探针。在一些实施方案中,第一小珠亚群和第二小珠亚群各自包含至少100、200、300、400或500个或更多个包含不同核苷酸序列的捕获探针。在一些实施方案中,第一小珠亚群和第二小珠亚群各自包含至少5000个包含不同核苷酸序列的捕获探针。在一些实施方案中,第一小珠亚群和第二小珠亚群各自包含至少50,000个包含不同核苷酸序列的捕获探针。
一些实施方案包括至少10个不同小珠亚群,每个亚群包含不同于另一亚群的索引。一些实施方案包括至少100个不同小珠亚群,每个亚群包含不同于另一亚群的索引。一些实施方案包括至少1000个不同小珠亚群,每个亚群包含不同于另一亚群的索引。一些实施方案包括至少10,000个不同小珠亚群,每个亚群包含不同于另一亚群的索引。
一些实施方案的各方面在图5A至图5E中示出。如图5A所示,小珠亚群包括这样的小珠,该小珠具有包含条形码、条形码引物结合位点和捕获探针的附接的第一多核苷酸,并且具有包含索引和索引引物结合位点的附接的第二多核苷酸。不同小珠亚群可包括不同的索引。不同小珠亚群(具有特定索引的每个亚群)可分布到96孔板的孔中,使得每个孔包含单个小珠亚群。
如图5B所示,来自靶核酸群体的靶核酸与捕获探针杂交,其中该靶核酸包含SNP。在一些实施方案中,将靶核酸的亚群添加到包含小珠亚群的每个孔中。靶核酸的每个亚群可来源于不同的来源,诸如不同的受试者。例如,靶核酸的亚群可通过由核酸的单一来源(诸如来自受试者的单个核酸样本)制备核酸文库来获得。在一些实施方案中,靶核酸不需要待测序的衔接子。
如图5C所示,可延伸杂交至包含SNP的靶核酸的捕获探针。在一些实施方案中,可通过添加掺入混合物来进行延伸,该掺入混合物包括荧光核苷酸和合适的聚合酶。在一些实施方案中,该延伸为单碱基延伸。
在一些实施方案中,将所有小珠组合并分布在流通池的表面上。流通池可具有图案化的表面,并且该表面可被改性以支持小珠在所需密度下的固定。
在一些实施方案中,执行SNP读出。在一些实施方案中,执行扫描循环以读取来自捕获探针的SNP位点处的掺入的信号。在一些实施方案中,该循环可包括边合成边测序的至少一个循环。在一些实施方案中,延伸的捕获探针的3′端被切割并封闭。
如图5D所示,条形码引物与条形码引物结合位点杂交,并且使该条形码引物延伸。在一些实施方案中,条形码引物的延伸包括条形码读出。在一些实施方案中,该延伸可包括边合成边测序的至少一个循环。在一些实施方案中,边合成边测序的循环数可取决于小珠亚群中不同条形码的数量。在一些实施方案中,延伸可包括12-20个边合成边测序循环。在一些实施方案中,延伸识别捕获探针和特定小珠在流通池内的位置。
如图5E所示,索引引物与索引引物结合位点杂交,并且使该索引引物延伸。在一些实施方案中,索引引物的延伸包括索引读出。在一些实施方案中,该延伸可包括边合成边测序的至少一个循环。在一些实施方案中,边合成边测序的循环数可取决于小珠的多个亚群中不同索引的数量。在一些实施方案中,延伸可包括6-12个边合成边测序循环。
某些检测靶配体的方法
一些实施方案包括检测靶配体的方法。在一些实施方案中,靶配体可包括核酸、蛋白质或其他抗原。在一些实施方案中,靶配体获自不同的来源,例如获自不同的样本、不同的个体受试者或不同的受试者群体。
在一些实施方案中,检测靶配体的方法可包括获得小珠群体,其中每个小珠包含特异性结合到靶配体的捕获探针。例如,捕获探针可包括核酸、抗体或抗体的抗原结合片段。在一些实施方案中,小珠包含第一多核苷酸,该第一多核苷酸包含指示相同小珠的捕获探针的条形码和该条形码的条形码引物结合位点3′。在一些实施方案中,每个小珠还包括第二多核苷酸,该第二多核苷酸包含索引和该索引的索引引物结合位点3′。在一些实施方案中,小珠群体包括第一小珠亚群和第二小珠亚群。在一些实施方案中,第一小珠亚群的索引不同于第二小珠亚群的索引。例如,第一小珠亚群的索引可用于从第二小珠亚群的索引中识别第一小珠亚群。
一些实施方案包括使第一靶配体与第一小珠亚群的捕获探针接触,以及使第二靶配体与第二小珠亚群的捕获探针接触。例如,第一靶配体可获自配体的第一样本,并且第二靶配体可获自配体的第二样本。一些实施方案还包括将包含特异性结合的第一靶配体和第二靶配体的第一小珠亚群和第二小珠亚群分布在基板上。一些实施方案还包括检测与分布在基板上的第一靶配体和第二靶配体特异性结合的捕获探针。一些实施方案还包括解码包含所检测的捕获探针的小珠在基板上的位置。
在一些实施方案中,捕获探针包含核酸,并且靶配体包含核酸。在一些实施方案中,第一多核苷酸包含捕获探针。在其他实施方案中,捕获探针不同于第一多核苷酸。在一些实施方案中,小珠亚群的捕获探针包含彼此不同的核苷酸序列。在一些实施方案中,不同小珠亚群可包括相同或不同的捕获探针。在一些实施方案中,捕获探针包含能够与单核苷酸多态性(SNP)或其互补序列杂交的核苷酸序列。
在一些此类实施方案中,检测特异性结合到靶配体的捕获探针包括使特异性结合到靶配体的捕获探针延伸。在一些实施方案中,延伸可包括聚合酶延伸和/或连接酶延伸。在一些实施方案中,延伸包括可检测的核苷酸,诸如荧光标记的核苷酸。在一些实施方案中,延伸包括捕获探针的单核苷酸延伸。在一些实施方案中,延伸包括用多个核苷酸延伸捕获探针。
在一些此类实施方案中,捕获探针包含抗体或其抗原结合片段。在一些实施方案中,小珠亚群的捕获探针特异性结合到彼此不同的靶配体。在一些实施方案中,不同小珠亚群可包括相同或不同的捕获探针。在一些此类实施方案中,小珠亚群的不同捕获探针特异性结合到相同的靶配体。
在一些实施方案中,检测特异性结合到靶配体的捕获探针包括免疫测定。例如,使特异性结合到捕获探针的靶配体与第二抗体或其抗原结合片段接触,其中第二抗体或其抗原结合片段包含可检测标记,诸如荧光标记。
在一些实施方案中,条形码引物结合位点包含相同的核苷酸序列。
在一些实施方案中,小珠亚群的索引的核苷酸序列包含相同的核苷酸序列,并且可将一个小珠亚群与另一小珠亚群区分开来。例如,第一小珠亚群的索引的核苷酸序列和第二小珠亚群的索引的核苷酸序列包含相同的核苷酸序列。
在一些实施方案中,索引引物结合位点的核苷酸序列包含相同的核苷酸序列。
在一些实施方案中,使第一靶配体与第一小珠亚群的捕获探针接触和使第二靶配体与第二小珠亚群的捕获探针接触在不同的位置进行。例如,不同的位置可包括不同的反应体积,诸如在微量滴定板的不同孔中的不同体积。
一些实施方案还包括,在将第一小珠亚群和第二小珠亚群分布在基板上之前,组合第一小珠亚群和第二小珠亚群。在其他实施方案中,在将第二小珠亚群分布在基板上之前,将第一小珠亚群分布在基板上。在一些实施方案中,在检测特异性结合到配体的捕获探针之前,将小珠亚群分布在基板上。
在一些实施方案中,检测特异性结合到靶配体的捕获探针还可包括确定特异性结合到靶配体的捕获探针在基板上的位置。
在一些实施方案中,解码所检测的捕获探针的位置包括解码包含所检测的捕获探针的小珠的索引的位置。一些实施方案还包括使多个索引引物与索引引物位点杂交,并使杂交的索引引物延伸。在一些实施方案中,使杂交的索引引物延伸包括边合成边测序的至少一个循环。在一些实施方案中,解码小珠的索引的位置包括对基板上的索引进行测序。
在一些实施方案中,解码所检测的捕获探针的位置包括解码包含所检测的捕获探针的小珠的条形码的位置。一些此类实施方案包括使多个条形码引物与条形码引物位点杂交,并使杂交的条形码引物延伸。在一些实施方案中,使杂交的条形码引物延伸包括边合成边测序的至少一个循环。在一些实施方案中,解码小珠的条形码的位置包括对基板上的条形码进行测序。
在一些实施方案中,基板包括多个离散位点。在一些实施方案中,基板包括多个孔。在一些实施方案中,基板包括多个通道。在一些实施方案中,流通池包括基板。在一些实施方案中,分布的第一小珠亚群和第二小珠亚群构成阵列。
在一些实施方案中,第一小珠亚群和第二小珠亚群各自包含至少50、100、500、1000或5000个彼此不同的捕获探针,或在前述数量的任两个数量之间的任何数量的捕获探针。一些实施方案还包括至少5、10、20、50、100、200、500、1000个不同小珠亚群,每个亚群包含不同于另一亚群的索引,或在前述数量的任两个数量之间的任何数量的不同小珠亚群。
图6A的左图中示出了包括小珠200的实施方案,其中多核苷酸210附接于该小珠。该多核苷酸包含与靶核酸220杂交的捕获探针。该捕获探针用包含可检测标记230的核苷酸延伸。在一些实施方案中,该多核苷酸可包含指示该捕获探针的条形码,以及可用于对条形码进行测序和识别的条形码引物结合位点。在一些实施方案中,该多核苷酸还可包含指示来自另一小珠亚群的小珠亚群索引,以及可用于对索引进行测序和识别的索引引物结合位点。在一些实施方案中,小珠可以阵列形式分布在基板上并被解码。解码可包括确定可检测标记在阵列上的位置;确定附接于阵列上的小珠的条形码;并且/或者确定附接于阵列上的小珠的索引。
图6A的中间图中示出了包括小珠200的实施方案,其中捕获探针240附接于该小珠。该捕获探针与靶核酸220杂交。第一多核苷酸260也附接于该小珠,该第一多核苷酸包含指示捕获探针的条形码,以及可用于对条形码进行测序和识别的条形码引物结合位点。第二多核苷酸250也附接于该小珠,该第二多核苷酸包含指示来自另一小珠亚群的小珠亚群索引。该捕获探针用包含可检测标记230的核苷酸延伸。在一些实施方案中,小珠可以阵列形式分布在基板上并被解码。解码可包括确定可检测标记在阵列上的位置;确定附接于阵列上的小珠的条形码;并且/或者确定附接于阵列上的小珠的索引。
图6A的右图中示出了包括小珠200的实施方案,其中捕获探针270附接于该小珠,其中该捕获探针是抗体或抗体的抗原结合片段。该捕获探针特异性结合到配体280。该配体还与包含可检测标记230的第二抗体290结合。第一多核苷酸260也附接于该小珠,该第一多核苷酸包含指示捕获探针的条形码,以及可用于对条形码进行测序和识别的条形码引物结合位点。第二多核苷酸250也附接于该小珠,该第二多核苷酸包含指示来自另一小珠亚群的小珠亚群索引。在一些实施方案中,小珠可以阵列形式分布在基板上并被解码。解码可包括确定可检测标记在阵列上的位置;确定附接于阵列上的小珠的条形码;并且/或者确定附接于阵列上的小珠的索引。
图6B的右图中示出了包括小珠200的实施方案,其中包含蛋白质的捕获探针330附接于该小珠。在一些实施方案中,小珠可以阵列形式分布在基板上。针对蛋白质的基板340接触蛋白质以生成包含可检测标记230的信号。可确定信号在阵列上的位置。在一些实施方案中,小珠可包括也附接于该小珠的第一多核苷酸,该第一多核苷酸包含指示捕获探针的条形码,以及可用于对条形码进行测序和识别的条形码引物结合位点。在一些实施方案中,小珠可包括也附接于该小珠的第二多核苷酸,该第二多核苷酸包含指示来自另一小珠亚群的小珠亚群索引。在一些实施方案中,在阵列上对小珠进行解码。解码可包括确定可检测标记在阵列上的位置;确定附接于阵列上的小珠的条形码;并且/或者确定附接于阵列上的小珠的索引。
靶核酸的测序和分析
一些实施方案包括靶核酸的测序和/或分析。一些实施方案包括根据本文提供的方法解码多核苷酸在阵列中的位置;使靶核酸与捕获探针杂交;使该捕获探针延伸;以及检测在阵列上的某个位置处与靶核酸杂交的捕获探针的延伸。在一些实施方案中,在使靶核酸与多核苷酸杂交之前,可解码多核苷酸在阵列上的位置。在一些实施方案中,在检测到与靶核酸杂交的捕获探针的延伸之后,可解码多核苷酸在阵列上的位置。在一些此类实施方案中,每个多核苷酸可通过共同元件与捕获探针相关联。例如,多核苷酸和捕获探针可各自结合到相同的微特征诸如小珠。在更多此类实施方案中,每个多核苷酸可包含捕获探针。
一些实施方案包括捕获探针的单碱基延伸(SBE)。在一些实施方案中,SBE可用于检测靶核酸中的等位基因、突变或其他特征。简而言之,SBE利用在接近或邻近检测位置的位置处与靶基因组片段杂交的捕获探针,该检测位置指示特定基因座。聚合酶可用于用标记有检测标记的核苷酸类似物使捕获探针的3′端延伸。基于酶的保真度,仅当核苷酸与靶核酸中的检测位置互补时,才将该核苷酸掺入捕获探针中。如果需要,可将核苷酸衍生化,使得使用封闭基团(包括可逆的封闭基团)不会发生进一步的延伸,因此仅添加单个核苷酸。可例如在阵列中的特定位置处检测延伸的捕获探针中标记的核苷酸的存在,并且识别所添加的核苷酸以确定基因座或等位基因的种类。SBE可在已知条件下进行,诸如在美国专利9,441,267和US 9,045,796中所述的那些,这些专利中的每一篇均全文以引用方式并入。
一些实施方案包括等位基因特异性引物延伸(ASPE)。在一些实施方案中,ASPE可包括在其3′端核苷酸组成不同的捕获探针的延伸。ASPE方法可使用含有可切割接头的核苷或核苷酸进行,使得可在检测到探针之后移除标记。这允许进一步使用探针或验证检测到的信号是由于现在已被移除的标记。简而言之,ASPE可通过使靶核酸与捕获探针杂交来进行,该捕获探针具有与检测位置互补的3′序列部分和与邻近检测位置的序列互补的5′部分。捕获探针的3′部分的模板指导修饰,例如通过聚合酶添加标记的核苷酸,产生标记的延伸产物,但仅在模板包括靶序列的情况下。然后可检测这种标记的引物延伸产物的存在,例如,基于其在阵列中的位置来指示特定等位基因的存在。在一些实施方案中,ASPE可用多个捕获探针进行,所述多个捕获探针具有相似的5′端,使得它们在靶核酸中的相同检测位置附近退火,但具有不同的3′端,使得聚合酶仅修饰具有与检测位置互补的3′端的捕获探针。具有与特定检测位置互补的3′端碱基的捕获探针被称为该位置的完全匹配(PM)探针,而具有3′端错配碱基并且不能在ASPE反应中延伸的捕获探针是该位置的错配(MM)探针。可检测PM探针中标记的核苷酸的存在,并确定捕获探针的3′序列以识别在检测位置处的特定等位基因。
一些实施方案包括用于解码多核苷酸在阵列中的位置的方法。一些此类方法包括:(a)获得基板,所述基板具有分布在基板的表面上的多核苷酸阵列,其中每个多核苷酸包含条形码的引物结合位点3′,其中每个多核苷酸连接到捕获探针;(b)使多个引物与引物结合位点杂交;以及(c)通过使所杂交的引物延伸来确定条形码的序列,其中每个条形码的序列指示多核苷酸在阵列中的位置。在一些实施方案中,每个多核苷酸经由小珠连接到捕获探针。在一些实施方案中,每个多核苷酸包含捕获探针。在一些实施方案中,捕获探针为引物结合位点的3′。在一些实施方案中,捕获探针为条形码的5′。在一些实施方案中,捕获探针包含与另一个捕获探针不同的序列。在一些实施方案中,捕获探针与另一个捕获探针相差少于5个不同的核苷酸。在一些实施方案中,每个捕获探针包含不同的序列。在一些实施方案中,多核苷酸随机分布在基板的表面上。在一些实施方案中,条形码包含与另一个条形码不同的序列。在一些实施方案中,每个条形码包含不同的序列。在一些实施方案中,每个引物结合位点包含相同的序列。在一些实施方案中,多核苷酸附接于小珠。在一些实施方案中,小珠分布在孔中。在一些实施方案中,每个多核苷酸包含可切割接头。在一些实施方案中,可切割接头适于从引物结合位点和条形码移除捕获探针。在一些实施方案中,基板包括孔。在一些实施方案中,每个多核苷酸包含间隔区。在一些实施方案中,间隔区附接于基板。在一些实施方案中,间隔区附接于小珠。一些实施方案还包括使靶核酸与捕获探针杂交。在一些实施方案中,使靶核酸与捕获探针杂交在测定条形码的序列之后进行。在一些实施方案中,使靶核酸与捕获探针杂交在测定条形码的序列之前进行。一些实施方案还包括使杂交的靶核酸或多核苷酸延伸。在一些实施方案中,延伸包括连接。一些实施方案还包括扩增靶核酸。
一些实施方案包括对靶核酸进行测序的方法。一些此类方法(a)根据前述方法中的任一种方法解码多核苷酸在阵列中的位置;(b)使靶核酸与捕获探针杂交;(c)使与靶核酸杂交的捕获探针延伸;以及(d)检测所延伸的捕获探针的位置。在一些实施方案中,(d)检测所延伸的捕获探针的位置在(a)解码多核苷酸在阵列中的位置之前进行。在一些实施方案中,捕获探针由连接酶延伸。在一些实施方案中,捕获探针由聚合酶延伸。在一些实施方案中,捕获探针通过添加单个核苷酸来延伸。一些实施方案还包括在使靶核酸与捕获探针杂交之前从捕获探针切割引物结合位点和条形码。一些实施方案还包括在使靶核酸与捕获探针杂交之后从捕获探针切割引物结合位点和条形码。
某些双探针方法
一些实施方案包括用第一捕获探针和第二捕获探针检测靶核酸。在一些实施方案中,靶核酸包含能够与第一捕获探针杂交的第一部分和能够与第二捕获探针杂交的第二部分。在一些实施方案中,获得小珠群体,其中每个小珠包含第一捕获探针和第二捕获探针。在一些实施方案中,两个捕获探针中的一个捕获探针经由可切割接头附接于小珠。在一些实施方案中,捕获探针中的一个捕获探针包含可检测标记,诸如荧光标记。在一些实施方案中,靶核酸与捕获探针杂交以生成包含单链缺口的双链核酸。该缺口被填充,并且可切割接头被切割。检测延伸的捕获探针。在一些实施方案中,捕获探针中的一个捕获探针包含可检测标记,诸如荧光标记。在一些实施方案中,在缺口填充期间将可检测标记掺入延伸的捕获探针中。
在一些实施方案中,第二捕获探针经由可切割接头附接于小珠,并且第二捕获探针包含可检测标记,诸如荧光标记。可切割接头的示例包括可通过化学方式、通过酶诸如核酸内切酶以及通过某些频率的光切割的接头。在一些实施方案中,每个小珠还包括第一多核苷酸,该第一多核苷酸包含指示第一或第二捕获探针的条形码和该条形码的条形码引物结合位点3′。在一些实施方案中,第一捕获探针包含第一多核苷酸。在一些实施方案中,第一捕获探针不同于第一多核苷酸。
在一些实施方案中,将第一捕获探针的末端连接到第二捕获探针的末端。在一些实施方案中,通过以下方式将第一捕获探针连接到第二捕获探针:使靶核酸与小珠群体的小珠的第一捕获探针和第二捕获探针杂交,以生成包含在第一捕获探针和第二捕获探针之间的单链缺口的双链核酸,以及填充第一捕获探针和第二捕获探针之间的该缺口。在一些实施方案中,可用聚合酶和/或连接酶进行缺口填充。在一些实施方案中,切割可切割接头以生成包括第一捕获探针的小珠,该第一捕获探针包含可检测标记。在一些实施方案中,将小珠群体分布在基板上。在一些实施方案中,在可切割接头被切割后,将小珠群体分布在基板上。在一些实施方案中,在可切割接头被切割之前,或在将第一捕获探针连接到第二捕获探针之前,将小珠群体分布在基板上。在一些实施方案中,确定包含第一捕获探针的小珠在基板上的位置,该第一捕获探针包含可检测标记。
在一些实施方案中,解码包含具有可检测标记的第一捕获探针的小珠在基板上的位置包括解码包含具有可检测标记的第一捕获探针的小珠的条形码在基板上的位置。一些此类实施方案可包括使条形码引物与条形码引物位点杂交,并使杂交的条形码引物延伸。在一些实施方案中,使杂交的条形码引物延伸包括边合成边测序的至少一个循环。在一些实施方案中,解码小珠的条形码的位置包括对基板上的条形码进行测序。
在一些实施方案中,每个小珠包含第二多核苷酸,该第二多核苷酸包含指示靶核酸来源的索引和该索引的索引引物结合位点3′。
在一些实施方案中,该小珠群体包括第一小珠亚群和第二小珠亚群,每个小珠包含第二多核苷酸,该第二多核苷酸包含索引和该索引的索引引物结合位点3′,其中第一亚群的索引不同于第二亚群的索引。在一些实施方案中,第一小珠亚群的索引的核苷酸序列包含相同的核苷酸序列,并且第二小珠亚群的索引的核苷酸序列包含相同的核苷酸序列。在一些实施方案中,索引引物结合位点的核苷酸序列包含相同的核苷酸序列。
在一些实施方案中,使用第一小珠亚群的连接或切割步骤在与使用第二小珠亚群的连接或切割步骤不同的位置处进行。在一些实施方案中,不同的位置包括不同的反应体积。在一些实施方案中,不同的位置包括不同的孔。
一些实施方案还包括,在将小珠群体分布在基板上之前,组合第一小珠亚群和第二小珠亚群。在其他实施方案中,在将第二小珠亚群分布在基板上之前,将第一小珠亚群分布在基板上。
在一些实施方案中,解码包含具有可检测标记的第一捕获探针的小珠在基板上的位置包括确定包括所检测的捕获探针的小珠的索引的位置。一些此类实施方案包括使多个索引引物与索引引物位点杂交,并使杂交的索引引物延伸。在一些实施方案中,使杂交的索引引物延伸包括边合成边测序的至少一个循环。在一些实施方案中,解码小珠的索引的位置包括对基板上的索引进行测序。
在一些实施方案中,基板包括多个离散位点。在一些实施方案中,基板包括多个孔。在一些实施方案中,基板包括多个通道。在一些实施方案中,流通池包括基板。在一些实施方案中,分布的小珠群体构成阵列。
图6B的左图中示出了一个实施方案,其中小珠200包括经由可切割接头310附接于该小珠的第一捕获探针300。第二捕获探针320附接于该小珠。将来自某个样本的靶核酸220与第一捕获探针和第二捕获探针杂交,并且使第一捕获探针延伸以用包含可检测标记230的核苷酸填充第一捕获探针和第二捕获探针之间的缺口。在缺口被填充后,移除靶核酸,并且切割可切割接头以生成延伸的第二捕获探针,该延伸的第二捕获探针包含附接于小珠的可检测标记。该小珠可以阵列形式分布在基板上并被解码。未示出包含指示附接于小珠的样本的索引的多核苷酸和包含指示第一捕获探针或第二捕获探针的条形码的多核苷酸。解码可包括确定可检测标记在阵列上的位置;确定附接于阵列上的小珠的条形码;并且/或者确定附接于阵列上的小珠的索引。
图6C示出了一个实施方案,其中第一捕获探针经由其5′端附接于小珠200。第二捕获探针360经由其3′端和可切割接头310附接于小珠。第二捕获探针包含可检测标记230。靶核酸220与第一捕获探针和第二捕获探针杂交,第一捕获探针延伸并连接到第二捕获探针。在一些实施方案中,靶核酸可包括结构变异(SV)。可切割接头被切割以生成延伸的第一捕获探针,该延伸的第一捕获探针包含可检测标记并附接于小珠。该小珠可以阵列形式分布在基板上并被解码。未示出包含指示附接于小珠的样本的索引的多核苷酸和包含指示第一捕获探针或第二捕获探针的条形码的多核苷酸。解码可包括确定可检测标记在阵列上的位置;确定附接于阵列上的小珠的条形码;并且/或者确定附接于阵列上的小珠的索引。在不存在靶核酸的情况下,从小珠切割第二捕获探针和可检测标记。
试剂盒和系统
一些实施方案包括用于解码微特征(诸如阵列上的多核苷酸)的试剂盒和系统。一些此类试剂盒和系统可包括基板诸如芯片,或具有随机分布在基板表面上的多核苷酸阵列的流体池(fluidic cell)。多核苷酸可包含条形码的引物结合位点3′。在一些此类实施方案中,每个多核苷酸可包含捕获探针。在更多此类实施方案中,每个多核苷酸可通过共同元件与捕获探针相关联。例如,多核苷酸和捕获探针可各自结合到相同的微特征诸如小珠。一些实施方案包括检测器,该检测器适于检测来自与阵列中的多核苷酸杂交的试剂的信号;此类试剂可包括测序试剂,诸如包含可检测标记的核苷酸。一些实施方案包括检测器,该检测器适于检测可由将核苷酸掺入多核苷酸(诸如焦磷酸盐)或氢离子变化引起的信号。
一些实施方案包括含有至少第一小珠亚群和第二小珠亚群的试剂盒或系统。在一些实施方案中,亚群的每个小珠可包括第一多核苷酸,该第一多核苷酸包含捕获探针、指示相同小珠的捕获探针的条形码和该条形码的条形码引物结合位点3′。在一些实施方案中,亚群的每个小珠还可包括第二多核苷酸,该第二多核苷酸包含索引和该索引的索引引物结合位点3′。在一些实施方案中,小珠亚群的索引可指示该特定小珠亚群。在一些实施方案中,第一亚群的索引不同于第二亚群的索引。在本文提供的试剂盒和系统的一些实施方案中,第一体积包括第一小珠亚群,并且第二体积包括第二小珠亚群。
在一些实施方案中,第一小珠亚群和第二小珠亚群的捕获探针各自包含彼此不同的核苷酸序列。在一些实施方案中,第一小珠亚群和第二小珠亚群的不同捕获探针包含相同的核苷酸序列。在一些实施方案中,捕获探针包含能够与单核苷酸多态性(SNP)或其互补序列杂交的核苷酸序列。
在一些实施方案中,条形码引物结合位点包含相同的核苷酸序列。一些实施方案还包括能够与条形码引物位点杂交的多个条形码引物。
在一些实施方案中,第一小珠亚群的索引的核苷酸序列包含相同的核苷酸序列,并且第二小珠亚群的索引的核苷酸序列包含相同的核苷酸序列。在一些实施方案中,索引引物结合位点的核苷酸序列包含相同的核苷酸序列。一些实施方案还包括能够与索引引物位点杂交的多个索引引物。
在一些实施方案中,基板包括多个离散位点。在一些实施方案中,基板包括多个孔。在一些实施方案中,基板包括多个通道。在一些实施方案中,流通池包括基板。在一些实施方案中,该基板适于使得第一小珠亚群和第二小珠亚群的组合在该基板的表面上形成小珠阵列,并且该阵列能够在多个边合成边测序循环中进行测序。
在一些实施方案中,第一小珠亚群和第二小珠亚群各自包含至少50个包含不同核苷酸序列的捕获探针。在一些实施方案中,第一小珠亚群和第二小珠亚群各自包含至少500个包含不同核苷酸序列的捕获探针。在一些实施方案中,第一小珠亚群和第二小珠亚群各自包含至少5000个包含不同核苷酸序列的捕获探针。在一些实施方案中,第一小珠亚群和第二小珠亚群各自包含至少50000个包含不同核苷酸序列的捕获探针。
一些实施方案包括至少10个不同小珠亚群,每个亚群包含不同于另一亚群的索引。一些实施方案包括至少100个不同小珠亚群,每个亚群包含不同于另一亚群的索引。一些实施方案包括至少1000个不同小珠亚群,每个亚群包含不同于另一亚群的索引。一些实施方案包括至少10000个不同小珠亚群,每个亚群包含不同于另一亚群的索引。
一些实施方案包括试剂盒,该试剂盒包括:随机分布在基板表面上的多核苷酸阵列,其中每个多核苷酸包含条形码的引物结合位点3′并连接到捕获探针,其中每个多核苷酸包含不同的条形码并连接到不同的捕获探针。在一些实施方案中,每个多核苷酸经由小珠连接到捕获探针。在一些实施方案中,每个多核苷酸包含捕获探针。在一些实施方案中,基板是平面的。在一些实施方案中,基板包括孔。在一些实施方案中,多核苷酸附接于小珠。在一些实施方案中,小珠分布在孔中。在一些实施方案中,流通池包括阵列。
一些实施方案包括含有第一小珠亚群和第二小珠亚群的试剂盒和系统。在一些实施方案中,每个小珠包含特异性结合到靶配体的捕获探针。靶配体的示例包括核酸、蛋白质或其他抗原。捕获探针的示例包括核酸、抗体和抗体的抗原结合片段。在一些实施方案中,每个小珠包含第一多核苷酸,该第一多核苷酸包含指示相同小珠的捕获探针的条形码和该条形码的条形码引物结合位点3′。在一些实施方案中,每个小珠包含第二多核苷酸,该第二多核苷酸包含索引和该索引的索引引物结合位点3′。在一些此类实施方案中,第一亚群的索引不同于第二亚群的索引。例如,第一小珠亚群的索引可用于将第一小珠亚群与第二小珠亚群区分开来。在一些实施方案中,第一小珠亚群与第二小珠亚群分开。例如,第一体积包括第一小珠亚群,并且第二体积包括第二小珠亚群。
在一些实施方案中,捕获探针包含核酸,并且靶配体包含靶核酸。在一些此类实施方案中,第一多核苷酸包含捕获探针。在一些实施方案中,捕获探针包含能够与单核苷酸多态性(SNP)或其互补序列杂交的核苷酸序列。
在一些实施方案中,捕获探针包含抗体或抗体的抗原结合片段。
在一些实施方案中,第一小珠亚群和第二小珠亚群的捕获探针各自特异性结合到彼此不同的靶配体。例如,第一小珠亚群的捕获探针各自特异性结合到彼此不同的靶配体;并且第二小珠亚群的捕获探针各自特异性结合到彼此不同的靶配体。在一些实施方案中,第一小珠亚群和第二小珠亚群的不同捕获探针特异性结合到相同的靶配体。例如,第一小珠亚群的一组不同的捕获探针与第一小珠亚群的一组不同的捕获探针特异性结合到相同的靶配体。
在一些实施方案中,条形码引物结合位点包含相同的核苷酸序列。一些实施方案还包括能够与条形码引物位点杂交的多个条形码引物。
在一些实施方案中,第一小珠亚群的索引的核苷酸序列包含相同的核苷酸序列,并且/或者第二小珠亚群的索引的核苷酸序列包含相同的核苷酸序列。在一些实施方案中,索引引物结合位点的核苷酸序列包含相同的核苷酸序列。一些实施方案还包括能够与索引引物位点杂交的多个索引引物。
在一些实施方案中,基板包括多个离散位点。在一些实施方案中,基板包括多个孔。在一些实施方案中,基板包括多个通道。在一些实施方案中,流通池包括基板。在一些实施方案中,该基板适于使得第一小珠亚群和第二小珠亚群的组合在该基板的表面上形成小珠阵列,并且该阵列能够在多个边合成边测序循环中进行测序。
在一些实施方案中,第一小珠亚群和第二小珠亚群各自包含至少50、100、500、1000或5000个彼此不同的捕获探针,或在前述数量的任两个数量之间的任何数量的捕获探针。一些实施方案还包括至少5、10、20、50、100、200、500、1000个不同小珠亚群,每个亚群包含不同于另一亚群的索引,或在前述数量的任两个数量之间的任何数量的不同小珠亚群。
一些实施方案包括试剂盒,该试剂盒包括:第一小珠亚群和第二小珠亚群,其中每个小珠包含:特异性结合到靶配体的捕获探针、包含指示捕获探针的条形码和该条形码的条形码引物结合位点3′的第一多核苷酸、以及包含索引和该索引的索引引物结合位点3′的第二多核苷酸,其中第一亚群的索引不同于第二亚群的索引,其中第一体积包括第一小珠亚群,并且第二体积包括第二小珠亚群。在一些实施方案中,捕获探针包含核酸,并且靶配体包含靶核酸。在一些实施方案中,第一多核苷酸包含捕获探针。在一些实施方案中,第一小珠亚群和第二小珠亚群的捕获探针各自包含彼此不同的核苷酸序列。在一些实施方案中,第一小珠亚群和第二小珠亚群的不同捕获探针包含相同的核苷酸序列。在一些实施方案中,捕获探针包含抗体或其抗原结合片段。在一些实施方案中,第一小珠亚群和第二小珠亚群的捕获探针各自特异性结合到彼此不同的靶配体。在一些实施方案中,第一小珠亚群和第二小珠亚群的不同捕获探针特异性结合到相同的靶配体。在一些实施方案中,条形码引物结合位点包含相同的核苷酸序列。
一些实施方案还包括能够与条形码引物位点杂交的多个条形码引物。在一些实施方案中,第一小珠亚群的索引的核苷酸序列包含相同的核苷酸序列,并且第二小珠亚群的索引的核苷酸序列包含相同的核苷酸序列。在一些实施方案中,索引引物结合位点的核苷酸序列包含相同的核苷酸序列。
一些实施方案还包括能够与索引引物位点杂交的多个索引引物。在一些实施方案中,流通池包括基板。在一些实施方案中,该基板适于使得第一小珠亚群和第二小珠亚群的组合在该基板的表面上形成小珠阵列,并且该阵列能够在多个边合成边测序循环中进行测序。在一些实施方案中,第一小珠亚群和第二小珠亚群各自包含至少50个彼此不同的捕获探针。在一些实施方案中,第一小珠亚群和第二小珠亚群各自包含至少500个彼此不同的捕获探针。一些实施方案还包括至少10个不同小珠亚群,每个亚群包含不同于另一亚群的索引。
实施例
实施例1—通过测序解码阵列
合成多个多核苷酸,每个多核苷酸从5′至3′依次包含:间隔区、独特条形码、引物结合位点和独特捕获探针。条形码和捕获探针的序列是已知的;对于每个多核苷酸而言,引物结合位点的序列是相同的。每个多核苷酸附接于小珠。小珠随机分布到芯片的孔中。通过将引物与引物结合位点杂交、延伸该引物并检测条形码的序列来解码小珠阵列。该条形码的位置识别相关联的捕获探针的位置。
实施例2—通过测序解码阵列上的条形码
制备由人基因组DNA制备的核酸文库。制备小珠亚群。将第一多核苷酸和第二多核苷酸附接于每个小珠。第一多核苷酸包含捕获探针、条形码引物结合位点和指示该捕获探针的条形码。第二多核苷酸包含索引和索引引物结合位点。
将包含18816种不同代码/探针类型的小珠池装载到HiSeq流通池上(图7A)。固定后,使用SBS化学对20个核苷酸长的代码测序,并通过将代码序列与一系列小珠类型进行比对来确定每个小珠的种类。图7B是某些分组中某些小珠类型的重复数的直方图,并且示出了使用基于测序的解码过程识别了97.5%的预期内容,并且绝大多数小珠类型以足以进行基因分型研究的水平存在。
实施例3—使用FFN检测在HiSeq上进行基因分型的性能
为了展示使用FFN检测在HiSeq上进行基因分型的性能,将寡核苷酸靶DNA与缀合至探针寡核苷酸的小珠的悬浮液杂交。将小珠装载到HiSeq流通池上。使用荧光核苷酸将与靶DNA结合的探针延伸单个碱基。对装载了小珠的流通池进行成像,以获得基因分型小珠强度。使用SBS化学切割荧光核苷酸并对小珠进行解码。比对解码和基因分型读段以测量测定性能。根据预期的基因型对各个点着色。图7C是C强度对T强度的图,其中每个点是给定小珠类型的所有重复的平均值,并且根据预期的基因型着色,并显示使用荧光核苷酸的单碱基探针延伸使得能够进行准确的基因分型。
实施例4—用10,368丛(plex)小珠池多路复用12个样本
该实施例展示了在单个流通池上解复用多个样本,并且具体地,展示了使用10,368丛小珠池多路复用12个样本的能力。将单个小珠池分别与12个不同的索引序列杂交。杂交后,将样本合并并装载到HiSeq流通池中。然后进行两次单独的读取,一次基于杂交索引识别样本,另一次读取基于解码读取识别小珠类型。图8是代表性样本的某些分组中某些小珠类型的数量的直方图,并显示大多数小珠类型以足以进行给定样本的基因分型实验的水平存在。图7中的表汇总了同时合并和装载的12个索引样本中解复用和解码小珠的一致性,这表明样本表示是一致的,并且大多数探针都存在于所有样本中。
如本文所用,术语“包含”与“包括”、“含有”或“特征在于”同义,并且是包括性的或开放式的,并且不排除另外的未列举的要素或方法步骤。
以上描述公开了本发明的几种方法和材料。本发明易于在方法和材料上进行修改,以及在制造方法和设备上进行改变。考虑到本公开或本文公开的本发明的实践,这种修改对于本领域技术人员来说将变得显而易见。因此,并非意图将本发明限制于本文所公开的具体实施方案,而是其涵盖了落入本发明的真实范围和精神内的所有修改形式和替代形式。
本文引用的所有参考文献,包括但不限于公开和未公开的申请、专利和参考文献,均全文以引用方式并入本文,并且据此成为本说明书的一部分。就以引用方式并入的出版物和专利或专利申请与说明书中包含的公开内容相矛盾的程度而言,本说明书旨在取代和/或优先于任何此类矛盾的材料。
Claims (52)
1.一种检测多个靶配体的方法,包括:
(a)获得第一小珠亚群和第二小珠亚群,其中每个小珠包含:
特异性结合到靶配体的捕获探针,
第一多核苷酸,所述第一多核苷酸包含指示所述捕获探针的条形码和所述条形码的条形码引物结合位点3′,和
第二多核苷酸,所述第二多核苷酸包含索引和所述索引的索引引物结合位点3′,其中所述第一亚群的索引不同于所述第二亚群的索引;
(b)使第一靶配体与所述第一小珠亚群的捕获探针接触,以及使第二靶配体与所述第二小珠亚群的捕获探针接触;
(c)将包含所述特异性结合的第一靶配体和第二靶配体的所述第一小珠亚群和所述第二小珠亚群分布在基板上;
(d)检测特异性结合到所述第一靶配体和所述第二靶配体的捕获探针;以及
(e)解码包含所检测的捕获探针的小珠在所述基板上的位置。
2.根据权利要求1所述的方法,其中:
所述捕获探针包含核酸,
所述第一靶配体和所述第二靶配体包含核酸,并且
步骤(d)包括使特异性结合到所述第一靶配体和所述第二靶配体的捕获探针延伸。
3.根据权利要求2所述的方法,其中所述第一多核苷酸包含所述捕获探针。
4.根据权利要求2或3所述的方法,其中所述第一小珠亚群和所述第二小珠亚群的捕获探针各自包含彼此不同的核苷酸序列。
5.根据权利要求4所述的方法,其中所述第一小珠亚群和所述第二小珠亚群的不同捕获探针包含相同的核苷酸序列。
6.根据权利要求2至5中任一项所述的方法,其中所述捕获探针包含能够与单核苷酸多态性(SNP)或其互补序列杂交的核苷酸序列。
7.根据权利要求2至6中任一项所述的方法,其中步骤(d)包括所述捕获探针的聚合酶延伸。
8.根据权利要求2至6中任一项所述的方法,其中步骤(d)包括所述捕获探针的连接酶延伸。
9.根据权利要求2至8中任一项所述的方法,其中步骤(d)包括所述捕获探针的单核苷酸延伸。
10.根据权利要求2至8中任一项所述的方法,其中步骤(d)包括用多个核苷酸延伸所述捕获探针。
11.根据权利要求2至10中任一项所述的方法,其中所延伸的捕获探针包含可检测标记。
12.根据权利要求1所述的方法,其中所述捕获探针包含抗体或其抗原结合片段。
13.根据权利要求12所述的方法,其中所述第一小珠亚群和所述第二小珠亚群的捕获探针各自特异性结合到彼此不同的靶配体。
14.根据权利要求12或13所述的方法,其中所述第一小珠亚群和所述第二小珠亚群的不同捕获探针特异性结合到相同的靶配体。
15.根据权利要求12至14中任一项所述的方法,其中所述检测包括使特异性结合到所述捕获探针的所述第一靶配体和所述第二靶配体与第二抗体或其抗原结合片段接触,其中所述第二抗体或其抗原结合片段包含可检测标记。
16.根据权利要求1至15中任一项所述的方法,其中所述条形码引物结合位点包含相同的核苷酸序列。
17.根据权利要求1至16中任一项所述的方法,其中所述第一小珠亚群的索引的核苷酸序列包含相同的核苷酸序列,并且所述第二小珠亚群的索引的核苷酸序列包含相同的核苷酸序列。
18.根据权利要求1至17中任一项所述的方法,其中所述索引引物结合位点的核苷酸序列包含相同的核苷酸序列。
19.根据权利要求1至18中任一项所述的方法,其中使所述第一靶配体与所述第一小珠亚群的捕获探针接触和使所述第二靶配体与所述第二小珠亚群的捕获探针接触在不同的反应体积中进行。
20.根据权利要求1至19中任一项所述的方法,还包括在将所述第一小珠亚群和所述第二小珠亚群分布在所述基板上之前,组合所述第一小珠亚群和所述第二小珠亚群。
21.根据权利要求1至19中任一项所述的方法,其中在将所述第二小珠亚群分布在所述基板上之前,将所述第一小珠亚群分布在所述基板上。
22.根据权利要求1至21中任一项所述的方法,其中步骤(d)在步骤(c)之前进行。
23.根据权利要求1至22中任一项所述的方法,其中所检测的捕获探针包含可检测标记。
24.根据权利要求1至23中任一项所述的方法,其中步骤(d)还包括确定所检测的捕获探针在所述基板上的位置。
25.根据权利要求24所述的方法,其中确定所检测的捕获探针的位置包括边合成边测序的至少一个循环。
26.根据权利要求1至25中任一项所述的方法,其中步骤(e)包括通过对所述基板上的索引进行测序来解码包含所检测的捕获探针的所述小珠的索引的位置。
27.根据权利要求1至26中任一项所述的方法,其中步骤(e)包括通过对所述基板上的条形码进行测序来解码包含所检测的捕获探针的所述小珠的条形码的位置。
28.根据权利要求1至27中任一项所述的方法,其中流通池包括所述基板。
29.根据权利要求1至28中任一项所述的方法,其中所述分布的第一小珠亚群和第二小珠亚群构成阵列。
30.根据权利要求1至29中任一项所述的方法,其中所述第一靶配体和所述第二靶配体获自不同的受试者。
31.根据权利要求1至30中任一项所述的方法,其中所述第一小珠亚群和所述第二小珠亚群各自包含至少50个彼此不同的捕获探针。
32.根据权利要求1至31中任一项所述的方法,还包括至少10个不同小珠亚群,每个亚群包含不同于另一亚群的索引。
33.一种检测靶核酸的方法,包括:
(a)获得靶核酸,所述靶核酸包含能够与第一捕获探针杂交的第一部分和能够与第二捕获探针杂交的第二部分;
(b)获得小珠群体,每个小珠包含:
所述第一捕获探针,
所述第二捕获探针,其中所述第二捕获探针经由可切割接头附接于所述小珠,并且其中所述第二捕获探针包含可检测标记,和
第一多核苷酸,所述第一多核苷酸包含指示所述第一捕获探针或所述第二捕获探针的条形码和所述条形码的条形码引物结合位点3′;
(c)将所述第一捕获探针与所述第二捕获探针连接,包括:
使所述靶核酸与所述小珠群体的小珠的所述第一捕获探针和所述第二捕获探针杂交,以生成包含在所述第一捕获探针和所述第二捕获探针之间的单链缺口的双链核酸,以及
填充所述第一捕获探针和所述第二捕获探针之间的缺口;
(d)切割所述可切割接头以生成包含所述可检测标记的第一捕获探针;
(e)将所述小珠群体分布在基板上;以及
(f)解码包含所述第一捕获探针的所述小珠在所述基板上的位置,所述第一捕获探针包含所述可检测标记。
34.根据权利要求33所述的方法,其中所述第一捕获探针包含所述第一多核苷酸。
35.根据权利要求33或34所述的方法,其中步骤(e)在步骤(d)之前进行。
36.根据权利要求33至35中任一项所述的方法,其中每个小珠包含第二多核苷酸,所述第二多核苷酸包含指示所述靶核酸来源的索引和所述索引的索引引物结合位点3′。
37.根据权利要求33至36中任一项所述的方法,其中步骤(f)包括确定包含所述可检测标记的所述第一捕获探针在所述基板上的位置。
38.根据权利要求33至37中任一项所述的方法,其中步骤(f)包括通过对所述基板上的条形码进行测序来解码包含所述第一捕获探针的所述小珠的条形码在所述基板上的位置,所述第一捕获探针包含所述可检测标记。
39.根据权利要求33至38中任一项所述的方法,其中流通池包括所述基板。
40.根据权利要求33至39中任一项所述的方法,其中所述分布的小珠群体构成阵列。
41.根据权利要求33至40中任一项所述的方法,其中所述小珠群体包括第一小珠亚群和第二小珠亚群,每个小珠包含第二多核苷酸,所述第二多核苷酸包含索引和所述索引的索引引物结合位点3′,其中所述第一亚群的索引不同于所述第二亚群的索引。
42.根据权利要求41所述的方法,其中所述第一小珠亚群的索引的核苷酸序列包含相同的核苷酸序列,并且所述第二小珠亚群的索引的核苷酸序列包含相同的核苷酸序列。
43.根据权利要求41或42所述的方法,其中使用所述第一小珠亚群的所述连接或切割步骤在与使用所述第二小珠亚群的所述连接或切割步骤不同的反应体积中进行。
44.根据权利要求41至43中任一项所述的方法,还包括在将所述小珠群体分布在所述基板上之前,组合所述第一小珠亚群和所述第二小珠亚群。
45.根据权利要求41至43中任一项所述的方法,其中在将所述第二小珠亚群分布在所述基板上之前,将所述第一小珠亚群分布在所述基板上。
46.根据权利要求33至45中任一项所述的方法,其中步骤(f)包括通过对所述基板上的索引进行测序来解码包含所检测的捕获探针的所述小珠的索引的位置。
47.一种试剂盒,包括:
第一小珠亚群和第二小珠亚群,其中每个小珠包含:
特异性结合到靶配体的捕获探针,
第一多核苷酸,所述第一多核苷酸包含指示所述捕获探针的条形码和所述条形码的条形码引物结合位点3′,和
第二多核苷酸,所述第二多核苷酸包含索引和所述索引的索引引物结合位点3′,
其中所述第一亚群的索引不同于所述第二亚群的索引,
其中第一体积包括所述第一小珠亚群,并且第二体积包括所述第二小珠亚群。
48.根据权利要求47所述的试剂盒,其中所述捕获探针选自核酸、抗体或其抗原结合片段。
49.根据权利要求47或48所述的试剂盒,其中所述第一多核苷酸包含所述捕获探针。
50.根据权利要求47至49中任一项所述的试剂盒,其中所述第一小珠亚群和所述第二小珠亚群的捕获探针各自特异性结合到彼此不同的靶配体。
51.根据权利要求50所述的试剂盒,其中所述第一小珠亚群和所述第二小珠亚群的不同捕获探针特异性结合到相同的靶配体。
52.一种用于解码多核苷酸在阵列中的位置的方法,包括:
(a)获得基板,所述基板具有分布在所述基板的表面上的多核苷酸阵列,其中每个多核苷酸包含条形码的引物结合位点3′,其中每个多核苷酸连接到捕获探针;
(b)使多个引物与所述引物结合位点杂交;以及
(c)通过使所杂交的引物延伸来确定所述条形码的序列,其中每个条形码的序列指示多核苷酸在所述阵列中的位置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311801071.7A CN117778535A (zh) | 2018-10-25 | 2019-10-23 | 使用索引和条形码识别阵列上的配体的方法和组合物 |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862750370P | 2018-10-25 | 2018-10-25 | |
US62/750,370 | 2018-10-25 | ||
US201962903108P | 2019-09-20 | 2019-09-20 | |
US62/903,108 | 2019-09-20 | ||
PCT/US2019/057704 WO2020086746A1 (en) | 2018-10-25 | 2019-10-23 | Methods and compositions for identifying ligands on arrays using indexes and barcodes |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311801071.7A Division CN117778535A (zh) | 2018-10-25 | 2019-10-23 | 使用索引和条形码识别阵列上的配体的方法和组合物 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112840023A true CN112840023A (zh) | 2021-05-25 |
CN112840023B CN112840023B (zh) | 2024-03-01 |
Family
ID=70328366
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980064490.2A Active CN112840023B (zh) | 2018-10-25 | 2019-10-23 | 使用索引和条形码识别阵列上的配体的方法和组合物 |
CN202311801071.7A Pending CN117778535A (zh) | 2018-10-25 | 2019-10-23 | 使用索引和条形码识别阵列上的配体的方法和组合物 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311801071.7A Pending CN117778535A (zh) | 2018-10-25 | 2019-10-23 | 使用索引和条形码识别阵列上的配体的方法和组合物 |
Country Status (12)
Country | Link |
---|---|
US (2) | US11667957B2 (zh) |
EP (1) | EP3870704A4 (zh) |
JP (1) | JP2022503873A (zh) |
KR (1) | KR20210084441A (zh) |
CN (2) | CN112840023B (zh) |
AU (1) | AU2019364418A1 (zh) |
BR (1) | BR112021006190A2 (zh) |
CA (1) | CA3113270A1 (zh) |
IL (1) | IL281551A (zh) |
MX (1) | MX2021003768A (zh) |
SG (1) | SG11202102722SA (zh) |
WO (1) | WO2020086746A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113416766A (zh) * | 2021-07-02 | 2021-09-21 | 苏州拉索生物芯片科技有限公司 | 一种生物芯片的解码方法 |
CN116536399A (zh) * | 2023-07-07 | 2023-08-04 | 之江实验室 | 一种基于微珠测序的基因芯片编解码方法及基因芯片 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210087613A1 (en) | 2019-09-20 | 2021-03-25 | Illumina, Inc. | Methods and compositions for identifying ligands on arrays using indexes and barcodes |
WO2023096675A1 (en) * | 2021-11-23 | 2023-06-01 | Pleno, Inc. | Encoded endonuclease assays |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003002979A2 (en) * | 2001-06-28 | 2003-01-09 | Illumina, Inc. | Multiplex decoding of array sensors with microspheres |
AU2004205311A1 (en) * | 1999-04-20 | 2004-09-23 | Illumina, Inc. | Detection of nucleic acid reactions on bead arrays |
US20110311975A1 (en) * | 2009-02-27 | 2011-12-22 | Koninklijke Philips Electronics N.V. | Genomic selection and sequencing using encoded microcarriers |
US20120071327A1 (en) * | 2008-12-11 | 2012-03-22 | Febit Holding Gmbh | Indexing of nucleic acid populations |
CN103781918A (zh) * | 2011-04-13 | 2014-05-07 | 空间转录公司 | 用于组织样本中核酸的局部或空间检测的方法和产品 |
CN105164279A (zh) * | 2013-04-25 | 2015-12-16 | 萤火虫生物股份有限公司 | 靶核酸的多重分析 |
US20150368704A1 (en) * | 2014-06-19 | 2015-12-24 | Illumina, Inc. | Methods and compositions for single cell genomics |
CN106460051A (zh) * | 2014-05-08 | 2017-02-22 | 富鲁达公司 | 集成的单细胞测序 |
US20170240963A1 (en) * | 2013-11-13 | 2017-08-24 | Nugen Technologies, Inc. | Compositions and methods for identification of a duplicate sequencing read |
US20170327876A1 (en) * | 2016-05-16 | 2017-11-16 | Nanostring Technologies, Inc. | Methods for detecting target nucleic acids in a sample |
US20170349939A1 (en) * | 2016-06-06 | 2017-12-07 | Redvault Biosciences, Lp | Target reporter constructs and uses thereof |
CN107532207A (zh) * | 2015-04-10 | 2018-01-02 | 空间转录公司 | 生物样本的空间区别、多重核酸分析 |
WO2018064640A1 (en) * | 2016-10-01 | 2018-04-05 | Berkeley Lights, Inc. | Dna barcode compositions and methods of in situ identification in a microfluidic device |
US20180291369A1 (en) * | 2017-04-06 | 2018-10-11 | MyOmicsDx, Inc | Error-proof nucleic acid library construction method and kit |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4971903A (en) | 1988-03-25 | 1990-11-20 | Edward Hyman | Pyrophosphate-based method and apparatus for sequencing nucleic acids |
US5552278A (en) | 1994-04-04 | 1996-09-03 | Spectragen, Inc. | DNA sequencing by stepwise ligation and cleavage |
US5750341A (en) | 1995-04-17 | 1998-05-12 | Lynx Therapeutics, Inc. | DNA sequencing by parallel oligonucleotide extensions |
GB9620209D0 (en) | 1996-09-27 | 1996-11-13 | Cemu Bioteknik Ab | Method of sequencing DNA |
GB9626815D0 (en) | 1996-12-23 | 1997-02-12 | Cemu Bioteknik Ab | Method of sequencing DNA |
ATE545710T1 (de) | 1997-04-01 | 2012-03-15 | Illumina Cambridge Ltd | Verfahren zur vervielfältigung von nukleinsäuren |
EP2045334A1 (en) * | 1998-06-24 | 2009-04-08 | Illumina, Inc. | Decoding of array sensors with microspheres |
AR021833A1 (es) | 1998-09-30 | 2002-08-07 | Applied Research Systems | Metodos de amplificacion y secuenciacion de acido nucleico |
US20060275782A1 (en) | 1999-04-20 | 2006-12-07 | Illumina, Inc. | Detection of nucleic acid reactions on bead arrays |
WO2005003375A2 (en) | 2003-01-29 | 2005-01-13 | 454 Corporation | Methods of amplifying and sequencing nucleic acids |
US20050181394A1 (en) | 2003-06-20 | 2005-08-18 | Illumina, Inc. | Methods and compositions for whole genome amplification and genotyping |
US7670810B2 (en) | 2003-06-20 | 2010-03-02 | Illumina, Inc. | Methods and compositions for whole genome amplification and genotyping |
WO2008093098A2 (en) | 2007-02-02 | 2008-08-07 | Illumina Cambridge Limited | Methods for indexing samples and sequencing multiple nucleotide templates |
EP3889325A1 (en) * | 2014-06-26 | 2021-10-06 | 10X Genomics, Inc. | Methods of analyzing nucleic acids from individual cells or cell populations |
SG10201903408VA (en) * | 2014-10-17 | 2019-05-30 | Illumina Cambridge Ltd | Contiguity preserving transposition |
EP3601605B1 (en) * | 2017-03-24 | 2023-11-22 | National University of Singapore | Methods for multiplex detection of molecules |
-
2019
- 2019-10-23 SG SG11202102722SA patent/SG11202102722SA/en unknown
- 2019-10-23 MX MX2021003768A patent/MX2021003768A/es unknown
- 2019-10-23 AU AU2019364418A patent/AU2019364418A1/en active Pending
- 2019-10-23 JP JP2021517476A patent/JP2022503873A/ja active Pending
- 2019-10-23 WO PCT/US2019/057704 patent/WO2020086746A1/en unknown
- 2019-10-23 CN CN201980064490.2A patent/CN112840023B/zh active Active
- 2019-10-23 KR KR1020217009648A patent/KR20210084441A/ko active Search and Examination
- 2019-10-23 BR BR112021006190-8A patent/BR112021006190A2/pt unknown
- 2019-10-23 CN CN202311801071.7A patent/CN117778535A/zh active Pending
- 2019-10-23 EP EP19876740.2A patent/EP3870704A4/en active Pending
- 2019-10-23 CA CA3113270A patent/CA3113270A1/en active Pending
- 2019-10-23 US US16/661,885 patent/US11667957B2/en active Active
-
2021
- 2021-03-16 IL IL281551A patent/IL281551A/en unknown
-
2023
- 2023-04-18 US US18/302,193 patent/US20230313275A1/en active Pending
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2004205311A1 (en) * | 1999-04-20 | 2004-09-23 | Illumina, Inc. | Detection of nucleic acid reactions on bead arrays |
WO2003002979A2 (en) * | 2001-06-28 | 2003-01-09 | Illumina, Inc. | Multiplex decoding of array sensors with microspheres |
US20120071327A1 (en) * | 2008-12-11 | 2012-03-22 | Febit Holding Gmbh | Indexing of nucleic acid populations |
US20110311975A1 (en) * | 2009-02-27 | 2011-12-22 | Koninklijke Philips Electronics N.V. | Genomic selection and sequencing using encoded microcarriers |
CN103781918A (zh) * | 2011-04-13 | 2014-05-07 | 空间转录公司 | 用于组织样本中核酸的局部或空间检测的方法和产品 |
CN105164279A (zh) * | 2013-04-25 | 2015-12-16 | 萤火虫生物股份有限公司 | 靶核酸的多重分析 |
US20170240963A1 (en) * | 2013-11-13 | 2017-08-24 | Nugen Technologies, Inc. | Compositions and methods for identification of a duplicate sequencing read |
CN106460051A (zh) * | 2014-05-08 | 2017-02-22 | 富鲁达公司 | 集成的单细胞测序 |
US20150368704A1 (en) * | 2014-06-19 | 2015-12-24 | Illumina, Inc. | Methods and compositions for single cell genomics |
CN107532207A (zh) * | 2015-04-10 | 2018-01-02 | 空间转录公司 | 生物样本的空间区别、多重核酸分析 |
US20170327876A1 (en) * | 2016-05-16 | 2017-11-16 | Nanostring Technologies, Inc. | Methods for detecting target nucleic acids in a sample |
US20170349939A1 (en) * | 2016-06-06 | 2017-12-07 | Redvault Biosciences, Lp | Target reporter constructs and uses thereof |
WO2018064640A1 (en) * | 2016-10-01 | 2018-04-05 | Berkeley Lights, Inc. | Dna barcode compositions and methods of in situ identification in a microfluidic device |
US20180291369A1 (en) * | 2017-04-06 | 2018-10-11 | MyOmicsDx, Inc | Error-proof nucleic acid library construction method and kit |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113416766A (zh) * | 2021-07-02 | 2021-09-21 | 苏州拉索生物芯片科技有限公司 | 一种生物芯片的解码方法 |
CN116536399A (zh) * | 2023-07-07 | 2023-08-04 | 之江实验室 | 一种基于微珠测序的基因芯片编解码方法及基因芯片 |
Also Published As
Publication number | Publication date |
---|---|
MX2021003768A (es) | 2021-05-27 |
US20230313275A1 (en) | 2023-10-05 |
IL281551A (en) | 2021-05-31 |
WO2020086746A1 (en) | 2020-04-30 |
CN112840023B (zh) | 2024-03-01 |
US20200131570A1 (en) | 2020-04-30 |
US11667957B2 (en) | 2023-06-06 |
BR112021006190A2 (pt) | 2021-06-29 |
CA3113270A1 (en) | 2020-04-30 |
KR20210084441A (ko) | 2021-07-07 |
JP2022503873A (ja) | 2022-01-12 |
AU2019364418A1 (en) | 2021-04-22 |
EP3870704A1 (en) | 2021-09-01 |
EP3870704A4 (en) | 2023-01-11 |
SG11202102722SA (en) | 2021-04-29 |
CN117778535A (zh) | 2024-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11970695B2 (en) | Sample preparation on a solid support | |
US11692223B2 (en) | Methods and arrays for producing and sequencing monoclonal clusters of nucleic acid | |
CN112840023B (zh) | 使用索引和条形码识别阵列上的配体的方法和组合物 | |
WO2021074087A1 (en) | Systems and methods for detecting multiple analytes | |
US20210087613A1 (en) | Methods and compositions for identifying ligands on arrays using indexes and barcodes | |
US20230348973A1 (en) | Paired-end re-synthesis using blocked p5 primers | |
CN117813396A (zh) | 混合聚类 | |
RU2816708C2 (ru) | Способы и композиции для определения лигандов на матрицах с использованием индексов и штрихкодов | |
CN114026250A (zh) | 核酸测序的改善 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40053733 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |