CN118451201A - 空间组学平台和系统 - Google Patents
空间组学平台和系统 Download PDFInfo
- Publication number
- CN118451201A CN118451201A CN202280085868.9A CN202280085868A CN118451201A CN 118451201 A CN118451201 A CN 118451201A CN 202280085868 A CN202280085868 A CN 202280085868A CN 118451201 A CN118451201 A CN 118451201A
- Authority
- CN
- China
- Prior art keywords
- sequence
- spatial
- substrate
- seq
- oligonucleotides
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims abstract description 270
- 108091034117 Oligonucleotide Proteins 0.000 claims description 566
- 239000000758 substrate Substances 0.000 claims description 401
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 claims description 321
- 239000011324 bead Substances 0.000 claims description 254
- 210000001519 tissue Anatomy 0.000 claims description 247
- 238000012163 sequencing technique Methods 0.000 claims description 224
- 125000003729 nucleotide group Chemical group 0.000 claims description 148
- 239000002773 nucleotide Substances 0.000 claims description 143
- 239000002105 nanoparticle Substances 0.000 claims description 141
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 115
- 239000002299 complementary DNA Substances 0.000 claims description 115
- 239000012634 fragment Substances 0.000 claims description 94
- 238000011065 in-situ storage Methods 0.000 claims description 90
- 238000003559 RNA-seq method Methods 0.000 claims description 79
- 238000009396 hybridization Methods 0.000 claims description 76
- 108090000623 proteins and genes Proteins 0.000 claims description 63
- 239000000126 substance Substances 0.000 claims description 63
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 claims description 61
- 108020004999 messenger RNA Proteins 0.000 claims description 57
- 108020004414 DNA Proteins 0.000 claims description 55
- 210000000170 cell membrane Anatomy 0.000 claims description 55
- 239000003599 detergent Substances 0.000 claims description 55
- 210000004027 cell Anatomy 0.000 claims description 52
- 230000000295 complement effect Effects 0.000 claims description 50
- 102000004169 proteins and genes Human genes 0.000 claims description 49
- 239000002245 particle Substances 0.000 claims description 42
- 108010077544 Chromatin Proteins 0.000 claims description 38
- 238000003556 assay Methods 0.000 claims description 38
- 210000003483 chromatin Anatomy 0.000 claims description 38
- 238000003776 cleavage reaction Methods 0.000 claims description 34
- 230000007017 scission Effects 0.000 claims description 34
- 102000008579 Transposases Human genes 0.000 claims description 32
- 108010020764 Transposases Proteins 0.000 claims description 32
- 229960002685 biotin Drugs 0.000 claims description 32
- 239000011616 biotin Substances 0.000 claims description 32
- 235000020958 biotin Nutrition 0.000 claims description 30
- 238000013507 mapping Methods 0.000 claims description 29
- 229910052747 lanthanoid Inorganic materials 0.000 claims description 28
- 150000002602 lanthanoids Chemical class 0.000 claims description 28
- 108010090804 Streptavidin Proteins 0.000 claims description 23
- 238000006243 chemical reaction Methods 0.000 claims description 23
- 238000009792 diffusion process Methods 0.000 claims description 22
- 230000002441 reversible effect Effects 0.000 claims description 22
- 102000053602 DNA Human genes 0.000 claims description 21
- 238000010839 reverse transcription Methods 0.000 claims description 21
- 238000002493 microarray Methods 0.000 claims description 20
- 108010067770 Endopeptidase K Proteins 0.000 claims description 19
- 238000011049 filling Methods 0.000 claims description 17
- 150000001615 biotins Chemical class 0.000 claims description 16
- 238000003384 imaging method Methods 0.000 claims description 16
- 239000003446 ligand Substances 0.000 claims description 16
- 238000011068 loading method Methods 0.000 claims description 16
- 210000003463 organelle Anatomy 0.000 claims description 14
- 238000002360 preparation method Methods 0.000 claims description 14
- 230000003381 solubilizing effect Effects 0.000 claims description 14
- 238000012165 high-throughput sequencing Methods 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 13
- 238000005516 engineering process Methods 0.000 claims description 11
- 230000012202 endocytosis Effects 0.000 claims description 10
- 230000010189 intracellular transport Effects 0.000 claims description 10
- 230000008685 targeting Effects 0.000 claims description 10
- 102000040650 (ribonucleotides)n+m Human genes 0.000 claims description 9
- ZYFVNVRFVHJEIU-UHFFFAOYSA-N PicoGreen Chemical group CN(C)CCCN(CCCN(C)C)C1=CC(=CC2=[N+](C3=CC=CC=C3S2)C)C2=CC=CC=C2N1C1=CC=CC=C1 ZYFVNVRFVHJEIU-UHFFFAOYSA-N 0.000 claims description 9
- 239000011248 coating agent Substances 0.000 claims description 9
- 238000000576 coating method Methods 0.000 claims description 9
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 claims description 7
- 239000010931 gold Substances 0.000 claims description 7
- 229910052737 gold Inorganic materials 0.000 claims description 7
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 5
- CGNLCCVKSWNSDG-UHFFFAOYSA-N SYBR Green I Chemical compound CN(C)CCCN(CCC)C1=CC(C=C2N(C3=CC=CC=C3S2)C)=C2C=CC=CC2=[N+]1C1=CC=CC=C1 CGNLCCVKSWNSDG-UHFFFAOYSA-N 0.000 claims description 4
- ULHRKLSNHXXJLO-UHFFFAOYSA-L Yo-Pro-1 Chemical compound [I-].[I-].C1=CC=C2C(C=C3N(C4=CC=CC=C4O3)C)=CC=[N+](CCC[N+](C)(C)C)C2=C1 ULHRKLSNHXXJLO-UHFFFAOYSA-L 0.000 claims description 4
- 208000027697 autoimmune lymphoproliferative syndrome due to CTLA4 haploinsuffiency Diseases 0.000 claims description 4
- 238000003786 synthesis reaction Methods 0.000 claims description 4
- ACOJCCLIDPZYJC-UHFFFAOYSA-M thiazole orange Chemical compound CC1=CC=C(S([O-])(=O)=O)C=C1.C1=CC=C2C(C=C3N(C4=CC=CC=C4S3)C)=CC=[N+](C)C2=C1 ACOJCCLIDPZYJC-UHFFFAOYSA-M 0.000 claims description 4
- 230000001413 cellular effect Effects 0.000 claims 2
- 230000002934 lysing effect Effects 0.000 claims 2
- 239000012528 membrane Substances 0.000 claims 2
- ANRHNWWPFJCPAZ-UHFFFAOYSA-M thionine Chemical compound [Cl-].C1=CC(N)=CC2=[S+]C3=CC(N)=CC=C3N=C21 ANRHNWWPFJCPAZ-UHFFFAOYSA-M 0.000 claims 2
- 239000000203 mixture Substances 0.000 abstract description 33
- 239000012491 analyte Substances 0.000 abstract description 19
- 238000012512 characterization method Methods 0.000 abstract description 4
- 230000002962 histologic effect Effects 0.000 abstract description 3
- 239000000523 sample Substances 0.000 description 123
- 150000007523 nucleic acids Chemical class 0.000 description 90
- 102000039446 nucleic acids Human genes 0.000 description 88
- 108020004707 nucleic acids Proteins 0.000 description 88
- 102000040430 polynucleotide Human genes 0.000 description 50
- 108091033319 polynucleotide Proteins 0.000 description 50
- 239000002157 polynucleotide Substances 0.000 description 50
- 238000003752 polymerase chain reaction Methods 0.000 description 31
- 238000010438 heat treatment Methods 0.000 description 25
- ROSDSFDQCJNGOL-UHFFFAOYSA-N Dimethylamine Chemical compound CNC ROSDSFDQCJNGOL-UHFFFAOYSA-N 0.000 description 24
- 229920001213 Polysorbate 20 Polymers 0.000 description 23
- 229920004890 Triton X-100 Polymers 0.000 description 23
- 239000000975 dye Substances 0.000 description 23
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 23
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 23
- -1 NP40 Substances 0.000 description 22
- 239000000463 material Substances 0.000 description 21
- 230000009137 competitive binding Effects 0.000 description 16
- 230000000694 effects Effects 0.000 description 16
- 239000000499 gel Substances 0.000 description 16
- 230000003321 amplification Effects 0.000 description 15
- 238000002372 labelling Methods 0.000 description 15
- 238000003199 nucleic acid amplification method Methods 0.000 description 15
- 230000017105 transposition Effects 0.000 description 15
- UMCMPZBLKLEWAF-BCTGSCMUSA-N 3-[(3-cholamidopropyl)dimethylammonio]propane-1-sulfonate Chemical compound C([C@H]1C[C@H]2O)[C@H](O)CC[C@]1(C)[C@@H]1[C@@H]2[C@@H]2CC[C@H]([C@@H](CCC(=O)NCCC[N+](C)(C)CCCS([O-])(=O)=O)C)[C@@]2(C)[C@@H](O)C1 UMCMPZBLKLEWAF-BCTGSCMUSA-N 0.000 description 14
- 239000003833 bile salt Substances 0.000 description 13
- 229940093761 bile salts Drugs 0.000 description 13
- 230000003993 interaction Effects 0.000 description 13
- 102000004190 Enzymes Human genes 0.000 description 12
- 108090000790 Enzymes Proteins 0.000 description 12
- 238000003491 array Methods 0.000 description 12
- 230000002255 enzymatic effect Effects 0.000 description 12
- 230000008569 process Effects 0.000 description 12
- 230000035945 sensitivity Effects 0.000 description 12
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 11
- 102000012410 DNA Ligases Human genes 0.000 description 11
- 108010061982 DNA Ligases Proteins 0.000 description 11
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 11
- 238000006073 displacement reaction Methods 0.000 description 11
- 108091093088 Amplicon Proteins 0.000 description 10
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 10
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 10
- 238000007792 addition Methods 0.000 description 10
- 238000000137 annealing Methods 0.000 description 10
- 230000008859 change Effects 0.000 description 9
- 239000011521 glass Substances 0.000 description 9
- 239000007787 solid Substances 0.000 description 9
- 230000015572 biosynthetic process Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 239000002077 nanosphere Substances 0.000 description 8
- 125000006850 spacer group Chemical group 0.000 description 8
- 241000894007 species Species 0.000 description 8
- QGKMIGUHVLGJBR-UHFFFAOYSA-M (4z)-1-(3-methylbutyl)-4-[[1-(3-methylbutyl)quinolin-1-ium-4-yl]methylidene]quinoline;iodide Chemical compound [I-].C12=CC=CC=C2N(CCC(C)C)C=CC1=CC1=CC=[N+](CCC(C)C)C2=CC=CC=C12 QGKMIGUHVLGJBR-UHFFFAOYSA-M 0.000 description 7
- 238000013459 approach Methods 0.000 description 7
- 239000000834 fixative Substances 0.000 description 7
- 238000000338 in vitro Methods 0.000 description 7
- 239000011148 porous material Substances 0.000 description 7
- 239000012472 biological sample Substances 0.000 description 6
- 239000000872 buffer Substances 0.000 description 6
- 230000005684 electric field Effects 0.000 description 6
- 239000000017 hydrogel Substances 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 108091093037 Peptide nucleic acid Proteins 0.000 description 5
- 108010012306 Tn5 transposase Proteins 0.000 description 5
- 239000003795 chemical substances by application Substances 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 229910052739 hydrogen Inorganic materials 0.000 description 5
- 239000001257 hydrogen Substances 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 5
- 238000013508 migration Methods 0.000 description 5
- 230000005012 migration Effects 0.000 description 5
- 229920003023 plastic Polymers 0.000 description 5
- 239000004033 plastic Substances 0.000 description 5
- 108091092584 GDNA Proteins 0.000 description 4
- WZUVPPKBWHMQCE-UHFFFAOYSA-N Haematoxylin Chemical compound C12=CC(O)=C(O)C=C2CC2(O)C1C1=CC=C(O)C(O)=C1OC2 WZUVPPKBWHMQCE-UHFFFAOYSA-N 0.000 description 4
- 102100034343 Integrase Human genes 0.000 description 4
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 4
- 230000027455 binding Effects 0.000 description 4
- 229910052799 carbon Inorganic materials 0.000 description 4
- 239000003153 chemical reaction reagent Substances 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 238000011534 incubation Methods 0.000 description 4
- 238000002955 isolation Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 239000000178 monomer Substances 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 229920000642 polymer Polymers 0.000 description 4
- 108090000765 processed proteins & peptides Proteins 0.000 description 4
- 102000004196 processed proteins & peptides Human genes 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 150000003839 salts Chemical class 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 238000010186 staining Methods 0.000 description 4
- 238000005406 washing Methods 0.000 description 4
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 3
- 101000852665 Alopecosa marikovskyi Omega-lycotoxin-Gsp2671a Proteins 0.000 description 3
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- 108010061833 Integrases Proteins 0.000 description 3
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 3
- 108091005804 Peptidases Proteins 0.000 description 3
- 239000004365 Protease Substances 0.000 description 3
- 108091028664 Ribonucleotide Proteins 0.000 description 3
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 3
- 238000013467 fragmentation Methods 0.000 description 3
- 238000006062 fragmentation reaction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 230000035515 penetration Effects 0.000 description 3
- 230000008823 permeabilization Effects 0.000 description 3
- 229920002401 polyacrylamide Polymers 0.000 description 3
- 229920001184 polypeptide Polymers 0.000 description 3
- 238000011176 pooling Methods 0.000 description 3
- 239000002336 ribonucleotide Substances 0.000 description 3
- 125000002652 ribonucleotide group Chemical group 0.000 description 3
- 238000005096 rolling process Methods 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 239000010703 silicon Substances 0.000 description 3
- 229910052710 silicon Inorganic materials 0.000 description 3
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- MSSXOMSJDRHRMC-UHFFFAOYSA-N 9H-purine-2,6-diamine Chemical compound NC1=NC(N)=C2NC=NC2=N1 MSSXOMSJDRHRMC-UHFFFAOYSA-N 0.000 description 2
- 229920000089 Cyclic olefin copolymer Polymers 0.000 description 2
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 2
- 102000010834 Extracellular Matrix Proteins Human genes 0.000 description 2
- 108010037362 Extracellular Matrix Proteins Proteins 0.000 description 2
- 241000078511 Microtome Species 0.000 description 2
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 2
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 2
- PPBRXRYQALVLMV-UHFFFAOYSA-N Styrene Chemical compound C=CC1=CC=CC=C1 PPBRXRYQALVLMV-UHFFFAOYSA-N 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 230000021736 acetylation Effects 0.000 description 2
- 238000006640 acetylation reaction Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 229920001222 biopolymer Polymers 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 238000010804 cDNA synthesis Methods 0.000 description 2
- 150000001720 carbohydrates Chemical class 0.000 description 2
- 235000014633 carbohydrates Nutrition 0.000 description 2
- 239000000701 coagulant Substances 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000004132 cross linking Methods 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- YQGOJNYOYNNSMM-UHFFFAOYSA-N eosin Chemical compound [Na+].OC(=O)C1=CC=CC=C1C1=C2C=C(Br)C(=O)C(Br)=C2OC2=C(Br)C(O)=C(Br)C=C21 YQGOJNYOYNNSMM-UHFFFAOYSA-N 0.000 description 2
- 210000002744 extracellular matrix Anatomy 0.000 description 2
- 230000008014 freezing Effects 0.000 description 2
- 238000007710 freezing Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000003205 genotyping method Methods 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 238000007490 hematoxylin and eosin (H&E) staining Methods 0.000 description 2
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- DRAVOWXCEBXPTN-UHFFFAOYSA-N isoguanine Chemical compound NC1=NC(=O)NC2=C1NC=N2 DRAVOWXCEBXPTN-UHFFFAOYSA-N 0.000 description 2
- 150000002632 lipids Chemical class 0.000 description 2
- 238000012067 mathematical method Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 239000011859 microparticle Substances 0.000 description 2
- 239000004005 microsphere Substances 0.000 description 2
- 125000004573 morpholin-4-yl group Chemical group N1(CCOCC1)* 0.000 description 2
- 238000007481 next generation sequencing Methods 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 239000012188 paraffin wax Substances 0.000 description 2
- 125000001805 pentosyl group Chemical class 0.000 description 2
- 150000004713 phosphodiesters Chemical class 0.000 description 2
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 2
- 235000019419 proteases Nutrition 0.000 description 2
- 125000006853 reporter group Chemical group 0.000 description 2
- 239000011347 resin Substances 0.000 description 2
- 229920005989 resin Polymers 0.000 description 2
- 239000000377 silicon dioxide Substances 0.000 description 2
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 238000011282 treatment Methods 0.000 description 2
- 235000011178 triphosphate Nutrition 0.000 description 2
- 239000001226 triphosphate Substances 0.000 description 2
- 241001430294 unidentified retrovirus Species 0.000 description 2
- 239000011800 void material Substances 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- URDCARMUOSMFFI-UHFFFAOYSA-N 2-[2-[bis(carboxymethyl)amino]ethyl-(2-hydroxyethyl)amino]acetic acid Chemical compound OCCN(CC(O)=O)CCN(CC(O)=O)CC(O)=O URDCARMUOSMFFI-UHFFFAOYSA-N 0.000 description 1
- XQCZBXHVTFVIFE-UHFFFAOYSA-N 2-amino-4-hydroxypyrimidine Chemical compound NC1=NC=CC(O)=N1 XQCZBXHVTFVIFE-UHFFFAOYSA-N 0.000 description 1
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical group CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- QGZKDVFQNNGYKY-UHFFFAOYSA-O Ammonium Chemical compound [NH4+] QGZKDVFQNNGYKY-UHFFFAOYSA-O 0.000 description 1
- 244000105975 Antidesma platyphyllum Species 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 239000011547 Bouin solution Substances 0.000 description 1
- 108090000565 Capsid Proteins Proteins 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 239000004713 Cyclic olefin copolymer Substances 0.000 description 1
- 241000450599 DNA viruses Species 0.000 description 1
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 1
- 239000004593 Epoxy Substances 0.000 description 1
- 208000034454 F12-related hereditary angioedema with normal C1Inh Diseases 0.000 description 1
- SXRSQZLOMIGNAQ-UHFFFAOYSA-N Glutaraldehyde Chemical compound O=CCCCC=O SXRSQZLOMIGNAQ-UHFFFAOYSA-N 0.000 description 1
- 102000003886 Glycoproteins Human genes 0.000 description 1
- 108090000288 Glycoproteins Proteins 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- 102000012330 Integrases Human genes 0.000 description 1
- 108090001090 Lectins Proteins 0.000 description 1
- 102000004856 Lectins Human genes 0.000 description 1
- 108090001030 Lipoproteins Proteins 0.000 description 1
- 102000004895 Lipoproteins Human genes 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- OSRWYQUSDMUYBS-UHFFFAOYSA-N OBO.OP(O)(O)=O Chemical class OBO.OP(O)(O)=O OSRWYQUSDMUYBS-UHFFFAOYSA-N 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 108010089430 Phosphoproteins Proteins 0.000 description 1
- 102000007982 Phosphoproteins Human genes 0.000 description 1
- 239000004952 Polyamide Substances 0.000 description 1
- 239000004698 Polyethylene Substances 0.000 description 1
- 239000004743 Polypropylene Substances 0.000 description 1
- 239000004793 Polystyrene Substances 0.000 description 1
- 229930185560 Pseudouridine Natural products 0.000 description 1
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 101710086015 RNA ligase Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 241000191967 Staphylococcus aureus Species 0.000 description 1
- 208000037065 Subacute sclerosing leukoencephalitis Diseases 0.000 description 1
- 206010042297 Subacute sclerosing panencephalitis Diseases 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 239000004809 Teflon Substances 0.000 description 1
- 229920006362 Teflon® Polymers 0.000 description 1
- 229910052771 Terbium Inorganic materials 0.000 description 1
- 108020000999 Viral RNA Proteins 0.000 description 1
- 125000002777 acetyl group Chemical class [H]C([H])([H])C(*)=O 0.000 description 1
- NIXOWILDQLNWCW-UHFFFAOYSA-N acrylic acid group Chemical group C(C=C)(=O)O NIXOWILDQLNWCW-UHFFFAOYSA-N 0.000 description 1
- 229920006397 acrylic thermoplastic Polymers 0.000 description 1
- 238000007259 addition reaction Methods 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 125000003545 alkoxy group Chemical group 0.000 description 1
- 125000003282 alkyl amino group Chemical group 0.000 description 1
- 230000029936 alkylation Effects 0.000 description 1
- 238000005804 alkylation reaction Methods 0.000 description 1
- 125000005336 allyloxy group Chemical group 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 238000004873 anchoring Methods 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 150000001540 azides Chemical class 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 230000006287 biotinylation Effects 0.000 description 1
- 238000007413 biotinylation Methods 0.000 description 1
- 125000001246 bromo group Chemical group Br* 0.000 description 1
- 239000007975 buffered saline Substances 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000006037 cell lysis Effects 0.000 description 1
- 239000000919 ceramic Substances 0.000 description 1
- 239000002738 chelating agent Substances 0.000 description 1
- 125000003636 chemical group Chemical group 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 125000001309 chloro group Chemical group Cl* 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 238000005345 coagulation Methods 0.000 description 1
- 230000015271 coagulation Effects 0.000 description 1
- 230000009918 complex formation Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 229920001577 copolymer Polymers 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 239000000412 dendrimer Substances 0.000 description 1
- 229920000736 dendritic polymer Polymers 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000010339 dilation Effects 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- NAGJZTKCGNOGPW-UHFFFAOYSA-N dithiophosphoric acid Chemical class OP(O)(S)=S NAGJZTKCGNOGPW-UHFFFAOYSA-N 0.000 description 1
- 241001493065 dsRNA viruses Species 0.000 description 1
- 230000002681 effect on RNA Effects 0.000 description 1
- 238000000295 emission spectrum Methods 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 1
- 125000001153 fluoro group Chemical group F* 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 238000011331 genomic analysis Methods 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 235000009424 haa Nutrition 0.000 description 1
- 208000016861 hereditary angioedema type 3 Diseases 0.000 description 1
- 125000000623 heterocyclic group Chemical group 0.000 description 1
- 150000002431 hydrogen Chemical class 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 125000004356 hydroxy functional group Chemical group O* 0.000 description 1
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 239000002523 lectin Substances 0.000 description 1
- 238000007834 ligase chain reaction Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- HWYHZTIRURJOHG-UHFFFAOYSA-N luminol Chemical compound O=C1NNC(=O)C2=C1C(N)=CC=C2 HWYHZTIRURJOHG-UHFFFAOYSA-N 0.000 description 1
- 239000006249 magnetic particle Substances 0.000 description 1
- 102000016470 mariner transposase Human genes 0.000 description 1
- 108060004631 mariner transposase Proteins 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 238000000386 microscopy Methods 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 238000000465 moulding Methods 0.000 description 1
- 238000007837 multiplex assay Methods 0.000 description 1
- 229940048195 n-(hydroxyethyl)ethylenediaminetriacetic acid Drugs 0.000 description 1
- 230000031689 negative regulation of reverse transcription Effects 0.000 description 1
- 230000005015 neuronal process Effects 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 239000012038 nucleophile Substances 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 125000000951 phenoxy group Chemical group [H]C1=C([H])C([H])=C(O*)C([H])=C1[H] 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 235000021317 phosphate Nutrition 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 239000002953 phosphate buffered saline Substances 0.000 description 1
- 125000002467 phosphate group Chemical class [H]OP(=O)(O[H])O[*] 0.000 description 1
- AQSJGOWTSHOLKH-UHFFFAOYSA-N phosphite(3-) Chemical class [O-]P([O-])[O-] AQSJGOWTSHOLKH-UHFFFAOYSA-N 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 238000000206 photolithography Methods 0.000 description 1
- OXNIZHLAWKMVMX-UHFFFAOYSA-N picric acid Chemical compound OC1=C([N+]([O-])=O)C=C([N+]([O-])=O)C=C1[N+]([O-])=O OXNIZHLAWKMVMX-UHFFFAOYSA-N 0.000 description 1
- 238000005498 polishing Methods 0.000 description 1
- 229920003229 poly(methyl methacrylate) Polymers 0.000 description 1
- 229920002647 polyamide Polymers 0.000 description 1
- 229920001748 polybutylene Polymers 0.000 description 1
- 229920000573 polyethylene Polymers 0.000 description 1
- 229920001155 polypropylene Polymers 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 229920002223 polystyrene Polymers 0.000 description 1
- 229920002635 polyurethane Polymers 0.000 description 1
- 239000004814 polyurethane Substances 0.000 description 1
- 238000002331 protein detection Methods 0.000 description 1
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- HBCQSNAFLVXVAY-UHFFFAOYSA-N pyrimidine-2-thiol Chemical compound SC1=NC=CC=N1 HBCQSNAFLVXVAY-UHFFFAOYSA-N 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 238000000163 radioactive labelling Methods 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 125000006413 ring segment Chemical group 0.000 description 1
- JRPHGDYSKGJTKZ-UHFFFAOYSA-N selenophosphoric acid Chemical compound OP(O)([SeH])=O JRPHGDYSKGJTKZ-UHFFFAOYSA-N 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- GZCRRIHWUXGPOV-UHFFFAOYSA-N terbium atom Chemical compound [Tb] GZCRRIHWUXGPOV-UHFFFAOYSA-N 0.000 description 1
- ISXSCDLOGDJUNJ-UHFFFAOYSA-N tert-butyl prop-2-enoate Chemical compound CC(C)(C)OC(=O)C=C ISXSCDLOGDJUNJ-UHFFFAOYSA-N 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 125000005207 tetraalkylammonium group Chemical group 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- 125000005208 trialkylammonium group Chemical group 0.000 description 1
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 1
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 235000012431 wafers Nutrition 0.000 description 1
- 239000001993 wax Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1065—Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1082—Preparation or screening gene libraries by chromosomal integration of polynucleotide sequences, HR-, site-specific-recombination, transposons, viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1096—Processes for the isolation, preparation or purification of DNA or RNA cDNA Synthesis; Subtracted cDNA library construction, e.g. RT, RT-PCR
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6804—Nucleic acid analysis using immunogens
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Crystallography & Structural Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Immunology (AREA)
- Plant Pathology (AREA)
- Virology (AREA)
- Pathology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本公开提供了组合物、方法和试剂盒,所述组合物、方法和试剂盒促进对组织中的组学变异的表征,同时保留与所述组织中靶分析物的来源相关的空间信息。
Description
相关申请的交叉引用
本申请根据35U.S.C.§119(e)要求2021年12月31日提交的美国临时申请号63/295,831的优先权,其公开内容以引用方式并入本文以用于所有目的。
技术领域
本公开提供了组合物、方法和试剂盒,该组合物、方法和试剂盒促进对组织中的组学变异的表征,同时保留与组织中靶分析物的来源相关的空间信息。
以引用方式并入序列表
本申请随附的是于2022年12月29日创建的名称为“00140-028WO1.xml”的序列表,并且其具有8,140字节的数据,在IBM-PC、MS-Windows操作系统上进行机器格式化。该序列表据此全文以引用方式并入以用于所有目的。
背景技术
用于检测并分析组织样本中的核酸(例如,mRNA或基因组DNA)的现有技术通常一次提供一个或有限数目的基因的空间或局部信息,或者提供样本中的所有基因的信息而没有期望的位置信息。最近的关注已聚焦于技术的发展,该技术实现对组织中的转录组和/或基因组变异的表征,同时保留关于组织的空间信息。存在对在组织样本的背景下表征核酸的方法的需求。
发明内容
本公开提供了组合物、方法和试剂盒,该组合物、方法和试剂盒促进对组织中的组学变异的表征,同时保留与组织中靶分析物的来源相关的空间信息。
在特定实施方案中,本公开提供了一种空间基因组学转座酶可及染色质高通量测序测定(ATAC-Seq)方法,包括:(A)将纳米粒子负载到阵列的纳米孔中,其中该纳米粒子包含通过可选择性裂解的接头(例如,脱硫生物素分子(ddBio)或PC接头)附接到纳米粒子的寡核苷酸,该寡核苷酸包含衔接子序列(例如,P5衔接子序列(SEQ ID NO:1)、P7衔接子序列(SEQ ID NO:2)等)、空间地址序列和转座体杂交区域;(B)对寡核苷酸的空间地址序列进行解码以确定纳米粒子的x,y位置;(C)将组织放置在阵列中的纳米粒子的顶部上,并使细胞膜溶解以接近组织中的染色质区域;(D)利用转座体复合物将染色质区域标签化(tagmentating)以形成标签化片段,并去除转座体复合物;(E)将组织透化以允许标签化片段扩散到阵列中的纳米粒子;(F)通过使标签化片段与寡核苷酸的转座体杂交区域杂交来将标签化片段捕获到纳米粒子;(G)加工捕获的标签化片段以制备用于测序的纳米粒子结合的基因组文库构建体;(H)通过(例如,使用加热和添加的生物素)裂解可选择性裂解的接头来从纳米粒子释放基因组文库构建体;(I)通过使用测序仪对基因组文库构建体进行测序并将测序读段与纳米粒子的x,y位置进行映射来获得组织的空间基因组学信息。在又一个实施方案中,纳米粒子为小珠。在另一个实施方案或又一个实施方案中,转座体复合物为TN5转座体复合物。在另一个实施方案或又一个实施方案中,空间地址序列是通过使用杂交解码方法来解码的。在另一个实施方案或又一个实施方案中,细胞膜是通过使用温和清洁剂(例如,NP40、吐温20、胆汁盐、Triton X100和(3-((3-胆酰胺丙基)二甲基铵基)-1-丙烷磺酸内盐)(CHAPS))来溶解的。在另一个实施方案或又一个实施方案中,组织是通过使用清洁剂(例如,吐温20和/或Triton X100)和蛋白酶K来透化的。在另一个实施方案或又一个实施方案中,捕获的标签化片段是通过使用顶链连接、与Y形衔接子杂交和空位填充连接步骤(例如,使用缺少链置换活性的DNA聚合酶、dNTP以及DNA连接酶)来加工的。在另一个实施方案或又一个实施方案中,在测序之前,文库构建体是使用PCR来扩增的。在另一个实施方案或又一个实施方案中,测序仪利用合成测序技术。在另一个实施方案或又一个实施方案中,转座体复合物的杂交区域是通过使用辅助寡核苷酸来初始封闭的,该辅助寡核苷酸然后在步骤(E)中去除。
在某个实施方案中,本公开还提供了一种空间多组学转座酶可及染色质高通量测序测定(ATAC-Seq)和RNA-Seq方法,包括:(A)将纳米粒子负载到阵列的纳米孔中,其中纳米粒子包含通过可选择性裂解的接头(例如,脱硫生物素分子(ddBio)或PC接头)附接到纳米粒子的两组寡核苷酸,第一组寡核苷酸包含第一衔接子序列(例如,P5衔接子序列(SEQ IDNO:1)、P7衔接子序列(SEQ ID NO:2)等)、空间地址序列和转座体杂交区域,第二组寡核苷酸包含第二衔接子序列(例如,P5衔接子序列(SEQ ID NO:1)、P7衔接子序列(SEQ ID NO:2)等)、测序引物位点序列(例如,R1测序引物位点序列(例如,SEQ ID NO:5至6)、R2测序引物位点序列(例如,SEQ ID NO:7至8)等)、空间地址序列、唯一分子标识符(UMI)序列和寡(dT)序列;(B)对寡核苷酸的空间地址序列进行解码以确定纳米粒子的x,y位置;(C)将组织放置在阵列中的纳米粒子的顶部上,并使细胞膜溶解以接近组织中的聚-A RNA转录物和染色质区域;(D)利用第一转座体复合物将染色质区域标签化以形成标签化片段,并去除第一转座体复合物;(E)将组织透化以允许标签化片段和聚-A RNA转录物扩散到阵列中的纳米粒子;(F)通过(i)使标签化片段与第一组寡核苷酸的转座体杂交区域杂交以及(ii)使聚-A RNA转录物与第二组寡核苷酸的寡(dT)序列杂交来将标签化片段和聚-A RNA转录物捕获到纳米粒子;(G')加工包含捕获的标签化片段的第一组寡核苷酸以制备用于测序的纳米粒子结合的基因组文库构建体;(G”)在单链模板转换寡核苷酸的存在下逆转录包含捕获的聚-ARNA转录物的第二组寡核苷酸以制备用于测序的纳米粒子结合的cDNA文库构建体;(H)通过(例如,通过使用加热和添加的生物素)裂解可选择性裂解的接头来从纳米粒子释放基因组文库构建体和cDNA文库构建体;(I)使用PCR来扩增基因组文库构建体和cDNA文库构建体,并将经扩增的产物分裂为包含两种经扩增的构建体的两个部分;(J)利用第一衔接子引物(例如,P5引物或P7引物)和第二衔接子引物(例如,P5引物或P7引物)来扩增经扩增的构建体的第一部分以形成ATAC-Seq文库,其中第一衔接子引物和第二衔接子引物与衔接子序列结合,并且其中第一衔接子引物和/或第二衔接子引物还包含索引序列(例如,i5序列、i7序列等)和/或测序引物位点序列(例如,R1测序引物位点序列(例如,SEQ ID NO:5至6)、R2测序引物位点序列(例如,SEQ ID NO:7至8)等);(J')利用包含序列引物序列的引物以及TSM将经扩增的构建体的第二部分标签化,并随后使用PCR利用包含测序引物位点序列的第一衔接子引物以及包含索引序列和测序引物位点序列的第二衔接子引物来扩增标签化的经扩增的文库构建体以形成RNA-Seq文库,其中第一衔接子引物和第二衔接子引物具有差异序列引物序列;以及(K)通过使用测序仪对ATAC-Seq文库和RNA-Seq文库进行测序并将测序读段与纳米粒子的x,y位置进行映射来获得多组学信息。在又一个实施方案中,纳米粒子为小珠。在另一个实施方案或又一个实施方案中,转座体复合物为TN5转座体复合物。在另一个实施方案或又一个实施方案中,空间地址序列是通过使用杂交解码方法来解码的。在另一个实施方案或又一个实施方案中,细胞膜是通过使用温和清洁剂(例如,NP40、吐温20、胆汁盐、Triton X100和(3-((3-胆酰胺丙基)二甲基铵基)-1-丙烷磺酸内盐)(CHAPS))来溶解的。在另一个实施方案或又一个实施方案中,组织是通过使用清洁剂(例如,吐温20和/或Triton X100)和蛋白酶K来透化。在另一个实施方案或又一个实施方案中,捕获的标签化片段是通过使用顶链连接、与Y形衔接子杂交和空位填充连接步骤(例如,缺少链置换活性的DNA聚合酶、dNTP以及DNA连接酶)来加工的。在另一个实施方案或又一个实施方案中,在测序之前,文库构建体是使用PCR来扩增的。在另一个实施方案或又一个实施方案中,测序仪利用合成测序技术。在另一个实施方案或又一个实施方案中,转座体的杂交区域是通过使用辅助寡核苷酸来初始封闭,该辅助寡核苷酸然后在步骤(E)中去除。在另一个实施方案或又一个实施方案中,步骤(G)和步骤(G')是相继地或同时地执行的。在另一个实施方案或又一个实施方案中,步骤(J)和步骤(J')是相继地或同时地执行的。在另一个实施方案或又一个实施方案中,寡d(T)序列包含5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个或30个核苷酸,或包括前述数目中的任意两个数目或在其之间的核苷酸范围(例如,16个至20个核苷酸)。
在特定实施方案中,本公开还提供了一种使用小珠芯片的空间转录组学方法,包括:(A)将小珠负载到小珠芯片的纳米孔中,其中小珠包含寡核苷酸,该寡核苷酸包含衔接子序列(例如,P5衔接子序列(SEQ ID NO:1)、P7衔接子序列(SEQ ID NO:2)等)、空间地址序列、任选的序列引物位点(例如,R1序列引物位点(例如,SEQ ID NO:5至6)、R2序列引物位点(例如,SEQ ID NO:7至8)等)和寡(dT)序列;(B)对寡核苷酸的空间地址序列进行解码以确定小珠的x,y位置;(C)将组织放置于小珠芯片的切片区域(例如,hyb-seal切片区域)中,并使细胞膜溶解以接近组织中的聚-A RNA转录物;(D)将聚-A RNA转录物捕获到小珠;(E)逆转录包含捕获的聚-A RNA转录物的寡核苷酸:(i)在单链模板转换寡核苷酸的存在下,以制备用于测序的小珠结合的cDNA文库构建体,或(ii)进一步执行与单链寡核苷酸的单链连接反应以制备用于测序的小珠结合的cDNA文库构建体;(F)使用PCR利用衔接子引物(例如,P5衔接子引物、P7衔接子引物等)从切片区域(例如,hyb-seal切片区域)扩增小珠结合的cDNA文库构建体;以及(G)通过使用测序仪对经扩增的cDNA文库构建体进行测序并将测序读段与小珠芯片中的小珠的x,y位置进行映射来获得转录组学信息。在又一个实施方案中,小珠芯片具有大于300000的特征密度(特征/mm2)。在另一个实施方案或又一个实施方案中,小珠包含镧系元素纳米磷光体标记。
在某个实施方案中,本公开提供了一种检测靶向的RNA和蛋白质的空间多组学方法,包括:(A)将多组经镧系元素纳米磷光体标记的小珠负载到阵列中,其中第一组小珠包含寡核苷酸,该寡核苷酸包含衔接子序列(例如,P5衔接子序列(SEQ ID NO:1)、P7衔接子序列(SEQ ID NO:2)等)、空间地址序列、任选的序列引物位点(例如,R1序列引物位点(例如,SEQ ID NO:5至6)、R2序列引物位点(例如,SEQ ID NO:7至8)等)和寡(dT)序列,并且第二组小珠包含寡核苷酸,该寡核苷酸包含空间地址序列、UMI序列和捕获序列;(B)将组织放置在小珠的顶部上,并使细胞膜溶解以接近组织中的聚-A RNA转录物和蛋白质;(C)添加包含与蛋白质靶标特异性结合的条形码核苷酸序列的抗体;(D)将聚-A RNA转录物捕获到第一组小珠;(D')通过将抗体的条形码核苷酸序列与捕获序列杂交来将抗体捕获到第二组小珠;(E)利用oNTPS逆转录包含捕获的聚-A RNA转录物的寡核苷酸;(F)添加与各组小珠上的寡核苷酸结合的引物,并利用oNTPS来延伸引物;(G)添加与延伸的引物序列结合的dsDNA染料;以及(H)通过对各组小珠进行成像和解码来检测靶向的RNA和蛋白质。在又一个实施方案中,dsDNA染料为基于花菁的染料(例如,PicoGreen)。在另一个实施方案或又一个实施方案中,对各组小珠进行成像和解码是同时地执行的。在另一个实施方案或又一个实施方案中,步骤(D)和步骤(D')是相继地或同时地执行的。
在特定实施方案中,本公开还提供了一种用于对空间定址的纳米粒子进行原位解码的方法,该方法包括:(A)将寡核苷酸包被的纳米粒子输注到组织中,该寡核苷酸包被的纳米粒子包含附接的寡核苷酸,该附接的寡核苷酸包含衔接子序列(例如,P5衔接子序列(SEQ ID NO:1)、P7衔接子序列(SEQ ID NO:2)等)、序列引物位点(例如,R1序列引物位点(例如,SEQ ID NO:5至6)、R2序列引物位点(例如,SEQ ID NO:7至8)等)、空间地址序列和寡d(T)序列;(B)通过将组织中的mRNA与寡核苷酸的寡d(T)序列杂交来原位捕获mRNA;(C)原位逆转录包含捕获的聚-A RNA转录物的寡核苷酸以形成纳米粒子结合的cDNA构建体;(D)通过以下对cDNA构建体进行原位映射:(i)对空间地址序列进行直接原位测序;或(ii)使用杂交解码方法以对空间地址序列进行原位解码;以及(E)利用清洁剂(例如,吐温20和/或Triton X100)和蛋白酶K来消化组织,并分离带标签的构建体;(F)从纳米粒子中分出cDNA构建体,对cDNA构建体进行文库制备,并对cDNA构建体进行测序。
在某个实施方案中,本公开还提供了一种用于对空间定址的纳米粒子进行原位解码的方法,该方法包括:(A)将包含多组固定寡核苷酸的纳米粒子输注到组织中,该多组固定寡核苷酸包含:第一组寡核苷酸,其包含衔接子序列(例如,P5衔接子序列(SEQ ID NO:1)、P7衔接子序列(SEQ ID NO:2)等)、序列引物位点(例如,R1序列引物位点(例如,SEQ IDNO:5至6)、R2序列引物位点(例如,SEQ ID NO:7至8)等)、空间地址序列和寡d(T)序列;第二组寡核苷酸,其包含空间地址序列和Sbs/ME序列;任选的第三组寡核苷酸,其包含衔接子序列(例如,P5衔接子序列(SEQ ID NO:1)、P7衔接子序列(SEQ ID NO:2)等)、空间地址序列和Sbs/ME序列,其中第一组寡核苷酸和第三组寡核苷酸通过可选择性裂解的接头(例如,基于生物素的分子、PC接头和稀有切割酶的辨识位点)附接到纳米粒子,并且其中第二组寡核苷酸不通过可选择性切割的接头附接到纳米粒子;(B)通过将组织中的mRNA与第一组寡核苷酸的寡d(T)序列杂交来原位捕获mRNA;(C)原位逆转录包含捕获的聚-A RNA转录物的寡核苷酸以形成纳米粒子结合的cDNA构建体;(D)通过裂解可选择性裂解的接头从纳米粒子中异位提取cDNA构建体并从纳米粒子中分出cDNA构建体;(E)通过以下对第二组寡核苷酸进行原位映射:(i)对空间地址序列进行直接原位测序;或(ii)使用杂交解码方法以对空间地址序列进行原位解码;以及(F)对cDNA构建体进行文库制备并对cDNA构建体进行测序。在又一个实施方案中,寡核苷酸包被的纳米粒子是利用针对内吞和胞内运输的生物触发剂或者利用针对特定亚细胞器的靶向部分或配体来官能化的。在另一个实施方案或又一个实施方案中,寡核苷酸包被的纳米粒子包含镧系元素纳米磷光体标记或Q点粒子。
在特定实施方案中,本公开提供了一种在小珠芯片上使用异位空间捕获的空间基因组学方法,包括:(A)将小珠负载到小珠芯片的纳米孔中,其中小珠包含通过可选择性裂解的接头(例如,基于生物素的分子、PC接头和稀有切割酶的辨识位点)附接到纳米粒子的寡核苷酸,该寡核苷酸包含第一衔接子序列(例如,P5衔接子序列(SEQ ID NO:1)、P7衔接子序列(SEQ ID NO:2)等)、空间地址序列和第一捕获序列;(B)对寡核苷酸的空间地址序列进行解码以确定小珠的x,y位置;(C)将组织放置于小珠芯片的切片区域中,使细胞膜溶解,并添加包含第二衔接子序列(例如,P5衔接子序列(SEQ ID NO:1)、P7衔接子序列(SEQ ID NO:2)等、任选的UMI序列、样本索引序列和第二捕获序列的寡核苷酸的非栓系池,其中第一捕获序列和第二捕获序列与生物分子的不同部分结合;(D)将生物分子捕获到寡核苷酸的第一捕获序列和第二捕获序列;(E)将第一捕获序列延伸和/或连接到第二捕获序列以形成构建体,该构建体包含第一衔接子序列、空间地址序列、第一捕获序列、感兴趣的空位或桥分子、第二捕获序列、任选的UMI序列和第二衔接子序列;(F)通过使用测序仪对构建体进行测序并将测序读段与小珠的x,y位置进行映射来异位获得组织的空间基因组学信息。在又一个实施方案中,第一捕获序列和第二捕获序列具有与靶向的基因的互补序列。在另一个实施方案或又一个实施方案中,感兴趣的空位或桥分子包含长度多达千个核苷酸的核苷酸。
在某个实施方案中,本公开提供了一种空间基因组学转座酶可及染色质高通量测序测定(ATAC-Seq)方法,包括:(A)提供底物,该底物包含通过可选择性裂解的接头附接到底物的寡核苷酸,该寡核苷酸包含衔接子序列、空间地址序列和转座体杂交区域,其中如果底物为有序底物,则寡核苷酸的空间地址序列是任选的;(B)对寡核苷酸的空间地址序列进行解码以确定寡核苷酸在底物上的x,y位置,其中如果底物为有序底物,则步骤(B)是任选的;(C)将组织放置在底物的顶部上,并使细胞膜溶解以接近组织中的染色质区域;(D)利用转座体复合物将染色质区域标签化以形成标签化片段,并去除转座体复合物;(E)将组织透化以允许标签化片段扩散到底物;(F)通过使标签化片段与寡核苷酸的转座体杂交区域杂交来将标签化片段捕获到底物;(G)加工捕获的标签化片段以制备用于测序的底物结合的基因组文库构建体;(H)通过选择性裂解该接头从底物释放基因组文库构建体;(I)通过使用测序仪对基因组文库构建体进行测序并将测序读段与寡核苷酸的x,y位置进行映射来获得组织的空间基因组学信息。在又一个实施方案中,底物为板、多孔板、载片、流通池或纳米粒子。在另一个实施方案中,底物为图案化底物,其包括由缺少固定寡核苷酸的间隙区域隔开的固定寡核苷酸的区域。在再一个实施方案中,底物为图案化底物,其包括由缺少固定寡核苷酸的间隙区域隔开的固定寡核苷酸岛或簇,并且其中固定寡核苷酸的每个岛或簇具有与固定寡核苷酸的其他岛或簇的空间地址序列不同的空间地址序列。在又一个实施方案中,底物为有序底物,并且寡核苷酸在底物上的x,y位置是预定的或可易于确定的,而不必在步骤(B)中对空间地址序列进行解码。在再一个实施方案中,转座体复合物为TN5转座体复合物。在另一个实施方案中,空间地址序列是通过使用杂交解码方法来解码的。在再一个实施方案中,细胞膜是通过使用温和清洁剂溶解的。温和清洁剂的示例包括但不限于NP40、吐温20、胆汁盐、Triton X100和(3-((3-胆酰胺丙基)二甲基铵基)-1-丙烷磺酸内盐)(CHAPS)。在又一个实施方案中,组织是通过使用清洁剂(例如,吐温20和/或Triton X100)和蛋白酶K来透化。在再一个实施方案中,捕获的标签化片段是通过使用顶链连接、与Y形衔接子杂交和空位填充连接步骤来加工的。在某个实施方案中,在测序之前,文库构建体是使用PCR来扩增的。在又一个实施方案中,测序仪利用合成测序技术。在再一个实施方案中,转座体复合物的杂交区域是通过使用辅助寡核苷酸来初始封闭,该辅助寡核苷酸然后在步骤(E)中去除。
在特定实施方案中,本公开还提供了一种空间多组学转座酶可及染色质高通量测序测定(ATAC-Seq)和RNA-Seq方法,包括:(A)提供底物,该底物包含通过可选择性裂解的接头附接到底物的多组固定寡核苷酸,其中该底物包含:第一组寡核苷酸,其包含第一衔接子序列、空间地址序列和转座体复合物杂交区域;和第二组寡核苷酸,其包含第二衔接子序列、测序引物位点序列、空间地址序列、唯一分子标识符(UMI)序列和寡(dT)序列,其中如果底物为有序底物,则第一组寡核苷酸和/或第二组寡核苷酸的空间地址序列是任选的;(B)对寡核苷酸的空间地址序列进行解码以确定寡核苷酸在底物上的x,y位置,其中如果底物为有序底物,则步骤(B)是任选的;(C)将组织放置在底物的顶部上,并使细胞膜溶解以接近组织中的聚-A RNA转录物和染色质区域;(D)利用第一转座体复合物将染色质区域标签化以形成标签化片段,并去除第一转座体复合物;(E)将组织透化以允许标签化片段和聚-ARNA转录物扩散到底物;(F)通过(i)使标签化片段与第一组寡核苷酸的转座体杂交区域杂交以及(ii)使聚-A RNA转录物与第二组寡核苷酸的寡(dT)序列杂交来将标签化片段和聚-A RNA转录物捕获到底物;(G')加工包含捕获的标签化片段的第一组寡核苷酸以制备用于测序的底物结合的基因组文库构建体;(G”)在单链模板转换寡核苷酸的存在下逆转录包含捕获的聚-A RNA转录物的第二组寡核苷酸以制备用于测序的底物结合的cDNA文库构建体;(H)通过选择性裂解该接头从底物释放基因组文库构建体和cDNA文库构建体;(I)使用PCR来扩增基因组文库构建体和cDNA文库构建体,并将经扩增的产物分裂为包含两种经扩增的构建体的两个部分;(J)利用第一衔接子引物和第二衔接子引物扩增经扩增的构建体的第一部分以形成ATAC-Seq文库,其中第一衔接子引物和第二衔接子引物分别与第一衔接子序列和第二衔接子序列结合,并且其中第一衔接子引物和/或第二衔接子引物还包含索引序列和/或测序引物位点序列;(J')利用包含序列引物序列的引物以及转座体复合物(TSM)将经扩增的构建体的第二部分标签化,并随后使用PCR利用包含测序引物位点序列的第一衔接子引物以及包含索引序列和测序引物位点序列的第二衔接子引物来扩增标签化的经扩增的文库构建体以形成RNA-Seq文库,其中第一衔接子引物和第二衔接子引物具有差异序列引物序列;以及(K)通过使用测序仪对ATAC-Seq文库和RNA-Seq文库进行测序并将测序读段与寡核苷酸的x,y位置进行映射来获得多组学信息。在另一个实施方案中,底物为板、多孔板、载片、流通池或纳米粒子。在再一个实施方案中,底物为图案化底物,其包括由缺少固定寡核苷酸的间隙区域隔开的固定寡核苷酸的区域。在又一个实施方案中,底物为图案化底物,其包括由缺少固定寡核苷酸的间隙区域隔开的两组固定寡核苷酸的岛或簇,并且其中固定寡核苷酸的每个岛或簇具有与固定寡核苷酸的其他岛或簇的空间地址序列不同的空间地址序列。在再一个实施方案中,底物为有序底物,并且寡核苷酸在底物上的x,y位置是预定的或可易于确定的,而不必在步骤(B)中对空间地址序列进行解码。在另一个实施方案中,转座体复合物为TN5转座体复合物。在再一个实施方案中,空间地址序列是通过使用杂交解码方法来解码的。在又一个实施方案中,细胞膜是通过使用温和清洁剂溶解的。在再一个实施方案中,组织是通过使用清洁剂和蛋白酶K来透化的。在另一个实施方案中,捕获的标签化片段是通过使用顶链连接、与Y形衔接子杂交和空位填充连接步骤来加工的。在再一个实施方案中,在测序之前,文库构建体是使用PCR来扩增的。在某个实施方案中,测序仪利用合成测序技术。在另一个实施方案中,转座体复合物的杂交区域是通过使用辅助寡核苷酸来初始封闭的,该辅助寡核苷酸然后在步骤(E)中被去除。在再一个实施方案中,步骤(G)和步骤(G')是相继地或并发地执行的。在又一个实施方案中,步骤(J)和步骤(J')是相继地或并发地执行的。在再一个实施方案中,寡d(T)序列包含16个至20个核苷酸。
在特定实施方案中,本公开还提供了一种空间转录组学方法,包括:(A)提供包含特征的底物,其中寡核苷酸固定在底物的特征上,其中寡核苷酸包含衔接子序列、空间地址序列、任选的序列引物位点和寡(dT)序列,其中如果底物为有序底物,则寡核苷酸的空间地址序列是任选的;(B)对寡核苷酸的空间地址序列进行解码以确定该寡核苷酸在底物上的x,y位置,其中如果底物为有序底物,则步骤(B)是任选的;(C)将组织放置于底物上,并使细胞膜溶解以接近组织中的聚-A RNA转录物;(D)将聚-A RNA转录物捕获到寡核苷酸;(E)逆转录包含捕获的聚-A RNA转录物的寡核苷酸:(i)在单链模板转换寡核苷酸的存在下,以制备用于测序的底物结合的cDNA文库构建体,或(ii)进一步执行与单链寡核苷酸的单链连接反应以制备用于测序的底物结合的cDNA文库构建体;(F)使用PCR利用衔接子引物来扩增寡核苷酸结合的cDNA文库构建体;(G)通过使用测序仪对经扩增的cDNA文库构建体进行测序并将测序读段与寡核苷酸在底物的特征上的x,y位置进行映射来获得转录组学信息。在另一个实施方案中,底物为微阵列、板、多孔板或流通池。在再一个实施方案中,底物为有序底物,并且寡核苷酸在底物的特征上的x,y位置是预定的或可易于确定的,而不必在步骤(B)中对空间地址序列进行解码。在又一个实施方案中,底物具有大于300000的特征密度(特征/mm2)。在再一个实施方案中,寡核苷酸和/或底物的特征还包含镧系元素纳米磷光体标记。
在特定实施方案中,本公开提供了一种检测靶向的RNA和蛋白质的空间多组学方法,包括:(A)提供包含具有镧系元素纳米磷光体标记的特征的底物,其中特征包含多组固定寡核苷酸,其中第一组寡核苷酸包含衔接子序列、空间地址序列、任选的序列引物位点和寡(dT)序列,并且第二组寡核苷酸包含空间地址序列、UMI序列和捕获序列,并且其中如果底物为有序底物,则第一组寡核苷酸和/或第二组寡核苷酸的空间地址序列是任选的;(B)对寡核苷酸的空间地址序列进行解码以确定该寡核苷酸在底物上的x,y位置,其中如果底物为有序底物,则步骤(B)是任选的;(C)将组织放置在底物的顶部上,并使细胞膜溶解以接近组织中的聚-A RNA转录物和蛋白质;(D)添加包含与靶向的蛋白质特异性结合的条形码核苷酸序列的抗体;(E)将聚-A RNA转录物捕获到第一组寡核苷酸;(E')通过将抗体的条形码核苷酸序列与捕获序列杂交来将抗体捕获到第二组寡核苷酸;(F)利用oNTPS逆转录包含捕获的聚-A RNA转录物的寡核苷酸;(F)添加与底物的特征上的寡核苷酸结合的引物,并利用oNTPS来延伸引物;(H)添加与延伸的引物序列结合的dsDNA染料;以及(I)通过成像来检测靶向的RNA和蛋白质,并确定第一组寡核苷酸和第二组寡核苷酸在底物的特征上的x,y位置。在另一个实施方案中,底物为微阵列、板、多孔板或流通池。在再一个实施方案中,底物为有序底物,并且寡核苷酸在底物的特征上的x,y位置是预定的或可易于确定的,而不必在步骤(B)中对空间地址序列进行解码。在又一个实施方案中,底物具有大于300000的特征密度(特征/mm2)。在再一个实施方案中,dsDNA染料为基于花菁的染料。在某个实施方案中,基于花菁的染料选自SYBR Green I、PicoGreen、SYBR Safe、SYBR Gold、噻唑橙、噁唑黄、Safe-Green和Chai Green。在又一个实施方案中,步骤(D)和步骤(D')是相继地或并发地执行的。
在特定实施方案中,本公开还提供了一种用于对空间定址的寡核苷酸进行原位解码的方法,该方法包括:(A)将寡核苷酸包被的底物输注到组织中,该寡核苷酸包被的底物包含固定寡核苷酸,该固定寡核苷酸包含衔接子序列、序列引物位点、空间地址序列和寡d(T)序列;(B)通过将组织中的mRNA与寡核苷酸的寡d(T)序列杂交来原位捕获mRNA;(C)原位逆转录包含捕获的聚-A RNA转录物的寡核苷酸以形成底物结合的cDNA构建体;(D)通过以下对cDNA构建体进行原位映射:(i)对空间地址序列进行直接原位测序;或(ii)使用杂交解码方法以对空间地址序列进行原位解码;以及(E)利用清洁剂和蛋白酶K来消化组织,并分离底物结合的cDNA构建体;(F)从底物中分出cDNA构建体,对cDNA构建体进行文库制备,并对cDNA构建体进行测序。在又一个实施方案中,底物的大小为10nm至10μm。在再一个实施方案中,底物是利用针对内吞和胞内运输的生物触发剂或者利用针对特定亚细胞器的靶向部分或配体来官能化的。在另一个实施方案中,底物或寡核苷酸包含镧系元素纳米磷光体标记或Q点粒子。
在特定实施方案中,本公开还提供了一种用于对空间定址的寡核苷酸进行原位解码的方法,包括:(A)将寡核苷酸包被的底物输注到组织中,该寡核苷酸包被的底物包含多组固定寡核苷酸组,多组固定寡核苷酸包含:第一组寡核苷酸,其包含第一衔接子序列、序列引物位点、空间地址序列和寡d(T)序列;第二组寡核苷酸,其包含空间地址序列和Sbs/ME序列;任选的第三组寡核苷酸,其包含第一衔接子序列、空间地址序列和Sbs/ME序列,其中第一组寡核苷酸和第三组寡核苷酸通过可选择性裂解的接头附接到底物,并且其中第二组寡核苷酸不通过可选择性裂解的接头附接到底物;(B)通过将组织中的mRNA与第一组寡核苷酸的寡d(T)序列杂交来原位捕获mRNA;(C)原位逆转录包含捕获的聚-A RNA转录物的寡核苷酸以形成底物结合的cDNA构建体;(D)通过对该可裂解的接头进行选择性裂解从底物中异位提取cDNA构建体并从底物中分出cDNA构建体;(E)通过以下对第二组寡核苷酸进行原位映射:(i)对空间地址序列进行直接原位测序;或(ii)使用杂交解码方法以对空间地址序列进行原位解码;以及(F)对cDNA构建体进行文库制备并对cDNA构建体进行测序。在另一个实施方案中,底物的大小为10nm至10μm。在再一个实施方案中,底物是利用针对内吞和胞内运输的生物触发剂或者利用针对特定亚细胞器的靶向部分或配体来官能化的。在再一个实施方案中,底物或多组寡核苷酸包含镧系元素纳米磷光体标记或Q点粒子。
在特定实施方案中,本公开提供了一种在底物上使用异位空间捕获的空间基因组学方法,包括:(A)提供包含特征的底物,其中特征包含通过可选择性裂解的接头附接到底物的特征的固定寡核苷酸,寡核苷酸包含第一衔接子序列、空间地址序列和第一捕获序列,其中如果底物为有序底物,则寡核苷酸的空间地址序列是任选的;(B)对寡核苷酸的空间地址序列进行解码以确定小珠的x,y位置,其中如果底物为有序底物,则步骤(B)是任选的;(C)将组织放置底物上,使细胞膜溶解,并添加包含第二衔接子序列、任选的UMI序列、样本索引序列和第二捕获序列的寡核苷酸的非栓系池,其中第一捕获序列和第二捕获序列与生物分子的不同部分结合;(D)将生物分子捕获到寡核苷酸的第一捕获序列和第二捕获序列;(E)将第一捕获序列延伸和/或连接到第二捕获序列以形成构建体,该构建体包含第一衔接子序列、空间地址序列、第一捕获序列、感兴趣的空位或桥分子、第二捕获序列、任选的UMI序列和第二衔接子序列;以及(F)通过使用测序仪对构建体进行测序并将测序读段与寡核苷酸的经确定的x,y位置进行映射来异位获得组织的空间基因组学信息。在又一个实施方案中,底物为微阵列、板、多孔板或流通池。在另一个实施方案中,底物为有序底物,并且寡核苷酸在底物的特征上的x,y位置是预定的或可易于确定的,而不必在步骤(B)中对空间地址序列进行解码。在再一个实施方案中,底物具有大于300000的特征密度(特征/mm2)。在另一个实施方案中,第一捕获序列和第二捕获序列具有与靶向的基因的互补序列。在再一个实施方案中,感兴趣的空位或桥分子包含长度多达千个核苷酸的核苷酸。
附图说明
图1呈现了可用于各种空间组学系统和平台的本公开的基于纳米粒子的阵列的图,这些空间组学系统和平台包括但不限于:空间蛋白质组学系统和平台;空间转录组学系统和平台;空间农业基因组学(agrigenomic)系统和平台;空间表观基因组学系统和平台;空间表型组学系统和平台;空间配体组学(ligandomic)系统和平台;以及空间多组学系统和平台。如图所示,每个纳米粒子包含按位置并按样本类型标识纳米粒子的唯一条形码。
图2呈现了用于实施本文所公开的各种空间组学系统和平台的基于阵列的设计的实施方案。如图所示,小珠或纳米孔包含:地址序列(例如,靶序列、样本ID序列和衔接子序列);以及与以下互补的捕获序列:特异性蛋白结合的寡核苷酸;RNA/DNA;或捕获序列。例如,捕获序列可与具有连接的抗体或连接的scFC结构域的寡核苷酸杂交,该连接的抗体或连接的scFC结构域允许利用下游信号生产进行分析物捕获(例如,蛋白质捕获)。另选地,捕获序列可与寡核苷酸杂交以进行标签捕获和二次读出(例如,抗体连接的转座体、其他DNA信号生成方法)。在另一示例中,捕获序列可与基因组序列结合以进行直接捕获应用(例如,WGA/类似应用)。
图3图示了空间组学系统和平台的样本工作流程,其利用包被有可结合mRNA(和/或蛋白质或DNA)的带条形码的寡核苷酸的纳米粒子。对小珠的3D原位成像可用于对条形码进行解码。可通过逆转录将mRNA拷贝到带条形码的寡核苷酸上;然后从组织中提取cDNA分子,之后进行文库制备和测序以产生空间定位的组学信息(例如,空间定位的转录组学信息)。
图4示出了使用组织扩张和带条形码的环形寡核苷酸的输注,之后进行原位滚环扩增以产生带条形码的纳米球的方案。本公开的方法的此实施方案是有利的,因为其可导致带条形码的寡核苷酸的改善的组织穿透,因为带条形码的寡核苷酸小于寡核苷酸包被的纳米粒子。
图5示出了在纳米粒子上具有两种寡核苷酸(解码寡核苷酸和捕获寡核苷酸)可能是有利的,原因如下:可执行逆转录反应,并且可在对条形码进行解码之前提取cDNA,使得cDNA分子将不必经受解码反应(解码寡核苷酸与纳米粒子一起保留)。解码寡核苷酸/捕获寡核苷酸化学计量可以是不同的,并且可改变寡核苷酸本身以贴合需要。为了克服密度问题(即,如果纳米粒子太靠近,可能难以对单个小珠进行成像),可将解码引物位点制成若干型式(例如,sbs3.1、sbs3.2、sbs3.9);然后进行多轮杂交和通过测序的解码。任一轮中的平均密度将为实际小珠密度的1/10。该方法可处理具有不同寡核苷酸类型的多模态或共测定纳米粒子(该图示示出了mRNA捕获寡核苷酸和用于基于Tn5的DNA标签化的转座子)。
图6A至图6C呈现了用于对随机排序的小珠阵列上的不同序列进行解码的方法的实施方案。(A至B)该方法开始于将经标记的解码核苷酸与高浓度的小小珠上的地址片段杂交,这实现快速杂交,之后进行洗涤以去除非特异性信号和背景。(C)在荧光读出后,执行针对其他解码核苷酸组的若干再杂交步骤,直到有足够的数据来清楚地确定每个小珠的身份。
图7提供了用于使用组织来原位实施空间转录组学的示例性工作流程。如图所示,将包含地址序列和捕获序列的小珠放置于阵列中,并使用相继杂交和错误校正策略来对它们的位置进行解码。之后,将冷冻的组织切片放置在经解码的载片上,染色并成像,捕获RNA,并随后通过下一代测序进行剖析。
图8提供了示出本文所公开的空间组学的方法可如何扩展至使用基于小珠的阵列的转座酶可及染色质高通量测序测定(ATAC-Seq)的工作流程图。
图9提供了示出本文所公开的空间组学的方法可如何经修改以执行使用基于小珠的阵列的ATAC-Seq和RNA-Seq的共测定。
图10提供了涉及可如何修饰小珠以实施图9的工作流程图的实施方案。特别地,修饰小珠使得2种类型的寡核苷酸附接到每个小珠,两种寡核苷酸均具有相同的空间条形码。一种寡核苷酸捕获gDNA,而另一种寡核苷酸捕获mRNA。此类型的小珠的组装可通过修改分裂-池化技术来实现。通过对两种寡核苷酸类型使用不同的接头区域,赋予组装特异性。
图11提供了涉及可如何修饰小珠以实施图9的工作流程图的附加实施方案。特别地,修饰小珠使得2种类型的寡核苷酸附接到每个小珠,两种寡核苷酸均具有相同的空间条形码。一种寡核苷酸捕获gDNA,而另一种寡核苷酸捕获mRNA。此类型的小珠的组装可通过修改分裂-池化技术来实现。通过合并封闭/去封闭步骤允许使用相同的接头序列,减少必须合成的唯一寡核苷酸的数目。
图12A至图12C提供了本文所公开的空间组学的替代方法,其利用从底物释放的寡核苷酸来原位捕获RNA分子。在最初的具体实施中,RNA分子必须从组织扩散到小珠阵列上,以便与捕获寡核苷酸杂交。(A)逆转此过程(即,允许寡核苷酸从小珠阵列扩散到组织中)可提高捕获效率,因为带条形码的寡核苷酸比平均mRNA转录物短得多,并且因此可更有效地扩散到组织中(150bp对3kb)。(B)利用组织上方的正极施加电场也可以帮助驱动寡核苷酸深入组织中。然而,电场也会导致mRNA迁移;在理论上,较短的寡核苷酸应能够捕获较长的mRNA分子,但较短的mRNA片段不能被捕获。(C)另选方法将是向寡核苷酸赋予正电荷,使得在小珠下方施加电场将导致mRNA朝小珠迁移,而带正电荷的空间寡核苷酸将朝组织迁移。向寡核苷酸赋予正电荷可通过使用带正电荷的肽核酸(PNA)寡核苷酸或附接到带正电荷的金纳米粒子的寡核苷酸来实现。
图13提供了利用基于小珠的基因分型策略进行异位空间捕获的空间组学测定。如图所示,产生小珠,该小珠包括x,y空间的识别代码(即,地址序列)和第一捕获序列(例如,LSP1),该识别代码和该第一捕获序列利用含生物素的残基拴系于小珠。将小珠放置在阵列中,并且对x,y位置进行解码。形成寡核苷酸的另一池,该寡核苷酸未拴系于底物并且包含第二捕获序列(LSP2)、索引序列且任选地包含UMI标签。将组织样本切片并放置在小珠的顶部上并对其进行处理以释放靶分子(例如,DNA、RNA、多肽),然后通过与捕获序列杂交将该靶分子拴系于小珠。然后添加寡核苷酸的非拴系池并与将其靶分子中的互补序列杂交。洗涤以去除未结合的寡核苷酸和非靶向的分子后,执行延伸和连接步骤以形成图14的构建体。
图14提供了图13中制作的构建体的图,示出了构成构建体的各种序列的排列。该构建体被描绘为具有UMI序列,但是UMI是任选的并且可以不存在。
图15图示了可如何通过使用本文所描述的解码方法将图13的小珠的x,y位置可视化。
图16A至16B提供了关于微阵列系统可如何用于本文所公开的用于空间组学的方法的实施方案。(A)微阵列系统可通过以下用于空间转录组学:包括含有经拴系寡核苷酸的小珠,寡核苷酸包含P7序列、地址序列、任选的序列引物位点序列和寡dT(OdT)序列。然后将来自样本的RNA与OdT序列原位杂交。将结合的RNA逆转录,并且然后利用RNA连接酶将编码连接到转录物的端部。使用P5引物和P7引物,扩增转录物以及簇/序列。小珠的x,y位置可利用解码协议使用地址序列来确定。(B)微阵列系统可通过以下用于空间蛋白质组学:将OdT序列替换为可捕获带标签的核酸配体或mAb的序列文库。
图17提供了可如何改善本文所公开的系统以捕获包含短条形码序列的抗体的图。
图18提供了可用于空间多组学(RNA和蛋白质)检测的基于镧系元素纳米磷光体小珠的微阵列的图。如图所示,微阵列包含可结合不同靶分子(例如,RNA和蛋白质)的多组寡核苷酸。
图19提供了用于空间多组学应用的图18的基于镧系元素纳米磷光体小珠的微阵列的附加实施方案和细节。
具体实施方式
如本文所用,除非上下文另有明确指示,否则单数形式“一个”、“一种”和“该”包括复数指代。因此,例如,提及“蛋白质”包括两种或更多种蛋白质的混合物等。
还应当理解,在各种实施方案的描述使用术语“包括”的情况下,本领域的技术人员将理解,在一些特定实例中,实施方案可替代地使用语言“基本上由...组成”或“由...组成”来描述。
如本文所用,术语“包括”、“包含”、“具有”以及它们的任何变型旨在涵盖非排他性的包括,使得工艺、方法、方法限定的产品,或者包括、包含或含有元素或元素列表的物质组合物不仅包括那些元素,而且可包括未明确列出的或此类工艺、方法、方法限定的产品或物质组合物固有的其他元素。类似地,“包括”、“包含”、“具有”和“含有”是可互换的,并非旨在进行限制。
除了在操作实施例中,或在另外指明的情况下,本文所用的所有表示成分或反应条件的量的数字应理解为在所有情况下均用术语“约”修饰。当用于描述本公开的实施方案时,与百分比相关的术语“约”意指±1%、±2%、±3%、±4%、±5%。如本文所用,术语“约”可意指在如本领域普通技术人员所确定的特定值的可接受误差范围内,这可部分地取决于该值的测量或确定方式,例如,测量系统的限制。另选地,“约”可意指给定值的±20%、±10%、±5%或±1%的范围。另选地,具体地讲相对于生物系统或方法,该术语可意指在值的数量级内、在值的5倍内或在值的2倍内。在本申请和权利要求书中描述特定值的情况下,除非另外指明,否则可假设术语“约”的含义在该特定值的可接受误差范围内。另外,在提供值的范围和/或子范围的情况下,范围和/或子范围可包括该范围和/或子范围的端点。在一些情况下,变化可包括特定量的20%、10%、5%、1%、0.5%或甚至0.1%的量或浓度。
对于本文的数值范围的表述而言,明确设想了其间具有相同精确度的每个居间数字。例如,对于6-9或6至9的范围而言,除了6和9之外,还设想了数字7和8,并且对于6.0-7.0的范围而言,明确地设想了数字6.0、6.1、6.2、6.3、6.4、6.5、6.6、6.7、6.8、6.9和7.0。
为了描述和公开可与本文的描述结合使用的方法,本文提及的所有出版物全文以引用方式并入本文。此外,关于在一个或多个出版物中呈现的与本公开中明确定义的术语相似或相同的任何术语,在所有方面都将以本公开中明确提供的术语定义为准。
应当理解,本公开不限于本文所述的具体方法、方案和试剂等,因为这些可有所变化。本文所用的术语仅出于描述具体实施方案或方面的目的,并非旨在限制本公开的范围。
如本文所用,当结合多核苷酸使用时,术语“互补的”旨在表示包含核苷酸序列的多核苷酸,该核苷酸序列能够在某些条件下选择性地退火为靶多核苷酸的鉴定区域。如本文所用,术语“基本上互补的”和语法上的等同物旨在表示包含核苷酸序列的多核苷酸,该核苷酸序列包括能够在某些条件下特异性地退火为靶多核苷酸的鉴定区域。退火是指一个核酸与另一个核酸的核苷酸碱基配对相互作用,其导致双链体、三链体或其他更高有序结构的形成。主要相互作用通常通过Watson-Crick和Hoogsteen型氢键具有核苷酸碱基特异性,例如,A:T、A:U和G:C。在某些实施方案中,碱基堆积和疏水相互作用也可有助于双链体稳定性。多核苷酸退火为靶核酸的互补或基本上互补的区域的条件是本领域熟知的,例如,如Nucleic Acid Hybridization,A Practical Approach,Hames和Higgins编辑,IRLPress,Washington,D.C.(1985),以及Wetmur和Davidson,Mol.Biol.31:349(1968)中所述。退火条件将取决于具体应用,并且可由本领域技术人员常规地确定,而无需过度实验。
如本文所用,术语“dNTP”是指脱氧核苷三磷酸。NTP是指核糖核苷酸三磷酸。嘌呤碱基(Pu)包括腺嘌呤(A)、鸟嘌呤(G)及它们的衍生物和类似物。嘧啶碱基(Py)包括胞嘧啶(C)、胸腺嘧啶(T)、尿嘧啶(U)以及它们的衍生物和类似物。通过举例说明而非限制的方式,此类衍生物或类似物的示例为用报告基团修饰、生物素酰化、胺修饰、放射标记、烷基化等的那些,并且还包括硫代磷酸酯、亚磷酸酯、环原子修饰的衍生物等。报告基团可为荧光基团(诸如荧光素)、化学发光基团(诸如鲁米诺)、铽螯合剂(诸如能够通过延迟荧光进行检测的N-(羟乙基)乙二胺三乙酸)等等。
如本文所用,术语“杂交”是指其中两个单链多核苷酸非共价结合以形成稳定双链多核苷酸的过程。所得的双链多核苷酸是“杂交体”或“双链体”。杂交条件将通常包括小于约1M,更通常小于约500mM并且可小于约200mM的盐浓度。杂交缓冲液可包括缓冲盐溶液,诸如5% SSPE,或本领域已知的其他此类缓冲液。杂交温度可低至5℃,但通常大于22℃,并且更通常大于约30℃,并且通常超过37℃。杂交通常在严格条件下进行,即探针将与其靶子序列杂交但将不与其他非互补序列杂交的条件。严格条件是序列依赖性的并且在不同的情况下是不同的,并且可由本领域的技术人员常规地确定。
如本文所用,术语“连接”、“连接的”及其语法上的等同物旨在表示通常在模板驱动的反应中,在两个或更多个核酸(例如,寡核苷酸和/或多核苷酸)的末端之间形成共价键或连接。键或连接的性质可广泛变化,并且连接可通过酶促或化学方式进行。如本文所用,连接通常通过酶促方式进行以在一个寡核苷酸的5'碳末端核苷酸与另一个核苷酸的3'碳之间形成磷酸二酯键。模板驱动的连接反应描述于以下参考文献中:美国专利号4,883,750;5,476,930;5,593,826;和5,871,921,其全文以引用方式并入本文中。术语“连接”还涵盖磷酸二酯键的非酶促形成,以及寡核苷酸末端之间的非磷酸二酯共价键(诸如硫代磷酸酯键、二硫键等)的形成。
如本文所用,术语“核酸”意指核苷酸单体的单链和双链聚合物,包括通过核苷酸间磷酸二酯键或核苷酸间类似物,以及相关的抗衡离子(例如,H+、NH4+、三烷基铵、四烷基铵、Mg2+、Na+等)连接的2'-脱氧核糖核苷酸(DNA)和核糖核苷酸(RNA)。核酸可以是多核苷酸或寡核苷酸。核酸可完全由脱氧核糖核苷酸组成、完全由核糖核苷酸组成或由它们的混合物组成。核苷酸单体单元可包含本文所述的任何核苷酸,其包括但不限于天然存在的核苷酸和核苷酸类似物。核酸的大小通常在几个单体单元(例如,5-40个)至数千个单体核苷酸单元的范围内。核酸包括但不限于基因组DNA、eDNA、hnRNA、mRNA、rRNA、tRNA、片段核酸、从亚细胞细胞器诸如线粒体或叶绿体获得的核酸、以及从可存在于生物样品之上或之中的微生物或DNA或RNA病毒获得的核酸。
如本文所用,术语“核苷酸类似物”是指具有修饰的核苷酸碱基部分、修饰的戊糖部分和/或修饰的磷酸酯部分,以及在多核苷酸的情况下修饰的核苷酸间键的合成类似物,如通常在别处所述(例如,Scheit,Nucleotide Analogs,John Wiley,New York,1980;Englisch,Angew.Chem.Int.Ed.Engl.30:613-29,1991;Agarwal,Protocols forPolynucleotides and Analogs,Humana Press,1994;以及S.Verma和F.Eckstein,Ann.Rev.Biochem.67:99-134,1998)。示例性磷酸酯类似物包括但不限于硫代磷酸酯、二硫代磷酸酯、磷酸硒酸酯、磷酸二硒酸酯、苯胺磷酸硫醇酯、苯胺磷酸酯、氨基磷酸酯、硼酸磷酸盐,包括相关的抗衡离子,例如,H+、NH4 +、Na+(如果存在此类抗衡离子)。示例性修饰的核苷酸碱基部分包括但不限于5-甲基胞嘧啶(5mC);C-5-丙炔基类似物,包括但不限于C-5丙炔基-C和C-5丙炔基-U;2,6-二氨基嘌呤,也称为2-氨基腺嘌呤或2-氨基-dA);次黄嘌呤、假尿苷、2-硫代嘧啶、异胞嘧啶(isoC)、5-甲基isoC和异鸟嘌呤(isoG;参见,例如,美国专利5,432,272)。示例性戊糖部分包括但不限于锁定核酸(LNA)类似物,包括但不限于Bz-A-LNA、5-Me-Bz-C-LNA、dmf-G-LNA和T-LNA(参见,例如,The Glen Report,16(2):5,2003;Koshkin等人,Tetrahedron 54:3607-30,1998)以及2'-修饰或3'-修饰,在该修饰中2'-位置或3'-位置是氢、羟基、烷氧基(例如,甲氧基、乙氧基、烯丙氧基、异丙氧基、丁氧基、异丁氧基和苯氧基)、叠氮基、氨基、烷基氨基、氟、氯或溴。修饰的核苷酸间键包括磷酸酯类似物、具有非手性和不带电荷的亚基间连接的类似物(例如,Sterchak,E.P.等人,Organic Chern.,52:4202,1987)和具有非手性亚基间连接的不带电荷的吗啉基聚合物(参见,例如,美国专利号5,034,506)。一些核苷酸间键类似物包括吗啉酸酯、缩醛和聚酰胺连接的杂环。
在“多核苷酸”的语境中,如本文所用,术语“变体”和“衍生物”是指包含已通过引入核苷酸置换、缺失或添加而改变的多核苷酸的核苷酸序列或多核苷酸的片段的多核苷酸。多核苷酸的变体或衍生物可以为包含多核苷酸的核苷酸序列的一部分的融合多核苷酸。如本文所用,术语“变体”或“衍生物”也指已经经化学修饰的多核苷酸或其片段,例如通过将任何类型的分子共价附接到多核苷酸来进行。例如但不限于,多核苷酸或其片段可被化学修饰,例如通过乙酰化、磷酸化、甲基化等。变体或衍生物以不同于天然存在的或起始的核苷酸或多核苷酸的方式在所附接的分子的类型或位置方面进行修饰。变体或衍生物还包括核苷酸或多核苷酸上天然存在的一个或多个化学基团的缺失。多核苷酸或多核苷酸片段的变体或衍生物可使用本领域技术人员已知的技术通过化学修饰进行化学修饰,所述技术包括但不限于特异性化学裂解、乙酰化、制剂等。此外,多核苷酸或多核苷酸片段的变体或衍生物可包含一种或多种dNTP或核苷酸类似物。多核苷酸变体或衍生物可具有与本文所述的多核苷酸或多核苷酸片段相似或相同的功能。与本文所述的多核苷酸或多核苷酸的片段相比,多核苷酸变体或衍生物可具有附加的或不同的功能。
如本文所用,当用于提及核酸分子时,术语“双链”意指核酸分子中的基本上所有的核苷酸与互补核苷酸氢键键合。部分双链核酸可占其与互补核苷酸氢键键合的核苷酸的至少10%、25%、50%、60%、70%、80%、90%或95%。
如本文所用,当用于提及核酸分子时,术语“单链”意指核酸分子中基本上没有核苷酸与互补核苷酸氢键键合。
如本文所用,当用于提及捕获探针或其他核酸时,术语“基因特异性”或“靶特异性”意指捕获探针或其他核酸,其包含特异性于靶向的核酸(例如,来自组织样本的核酸)的核苷酸序列,即能够选择性地退火至靶向的核酸的识别区域的核苷酸的序列。基因特异性捕获探针可具有单一物类的寡核苷酸,或可包含具有不同序列的两种或更多种物质。因此,基因特异性捕获探针可为两个或更多个序列,包括3个、4个、5个、6个、7个、8个、9个或10个或更多个不同序列。基因特异性捕获探针可包含基因特异性捕获引物序列和通用捕获探针序列。其他序列诸如测序引物位点序列、条形码、唯一分子标识符等也可包含在基因特异性捕获引物中。
相比之下,当用于提及捕获探针或其他核酸时,术语“通用”意指在多种捕获探针中具有共同核苷酸序列的捕获探针或核酸。共同序列可以是例如与相同衔接子序列互补的序列。通用捕获探针适用于探查多种不同多核苷酸,而不必辨别不同物类,而基因特异性捕获引物适用于辨别不同物类。
在各种实施方案中,捕获元件(例如,捕获引物或捕获探针或其他核酸序列)可间隔开以(A)空间分辨单个细胞的几何结构内的核酸,即,每个细胞多个捕获位点;(B)在约单细胞水平下,即,每个细胞约1个捕获位点,空间分辨核酸。另外,捕获元件可如上述A或B中那样间隔开,并且可:(I)间隔开以在规则间歇下从样本中取样核酸,例如,以网格或图案间隔开,使得约每隔一个或每5个或每10个细胞进行取样,或约每隔一组或每5组或每10组2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个细胞进行取样;(II)间隔开以从样本的一个或多个区域中的基本上所有可获得的细胞捕获样本;或(III)间隔开以从样本中的基本上所有可获得的细胞捕获样本。
如本文所用,术语“扩增子”当用于提及核酸时,意指复制该核酸的产物,其中该产物具有与该核酸的核苷酸序列的至少一部分相同或互补的核苷酸序列。扩增子可通过使用核酸或其扩增子作为模板的多种扩增方法中的任一种产生,所述扩增方法包括例如聚合酶延伸、聚合酶链反应(PCR)、滚环扩增(RCA)、连接延伸或连接酶链反应。扩增子可以是具有特定核苷酸序列的单拷贝(例如,PCR产物)或该核苷酸序列的多拷贝(例如,RCA的串联产物)的核酸分子。靶核酸的第一扩增子可为互补拷贝。后续的扩增子是在生成第一扩增子后,由靶核酸或由第一扩增子形成的拷贝。后续的扩增子可具有与靶核酸基本上互补或与靶核酸基本上相同的序列。
可产生的模板拷贝或扩增子的数目可通过以下调节:适当修改扩增反应,包括例如改变所运行的扩增循环的数目、在扩增反应中使用不同持续合成能力的聚合酶和/或改变扩增反应运行的时间长度、以及修改本领域已知的影响扩增产率的其他条件。核酸模板的拷贝数可为至少1个、10个、100个、200个、500个、1000个、2000个、3000个、4000个、5000个、6000个、7000个、8000个、9000个和10,000个拷贝,或包括前述数目中的任意两个或在前述数目中的任意两个之间的范围,并且可根据特定应用而变化。
如本文所用,术语“标签化”、“标记”或“标记的”是指通过使用转座酶介导的片段化和标记,将核酸(例如,DNA)转化成准备用于簇形成和测序的溶液中的接头修饰的模板。该方法通常涉及由转座体复合物修饰核酸,该转座体复合物包含与包含转座子末端序列的接头复合的转座酶。标签化导致核酸的片段化和接头与双链体片段的两条链的5'端的连接同时发生。在去除转座酶的纯化步骤后,通过PCR将附加序列添加到适应片段的末端。
“转座酶”意指一种酶,所述酶能够与包含转座子末端的组合物(例如,转座子、转座子末端、转座子末端组合物)形成功能性复合物,并且例如在体外转座反应中,催化含转座子末端的组合物插入或转座到与其一起温育的双链靶核酸中。如本文所示的转座酶还可包括来自逆转录转座子和逆转录病毒的整合酶。转座酶、转座体和转座体复合物是本领域技术人员通常已知的,如美国专利公布号2010/0120098的公开内容中所示的,该专利文献的内容全文以引用方式并入本文。虽然本文所述的许多实施方案涉及Tn5转座酶和/或高活性Tn5转座酶,但应当理解,能够以足够的效率将转座子末端插入到5'-标签并将靶核酸片段化以用于其预期目的的任何转座体系均可用于本发明。在具体实施方案中,优选的转座体系能够以随机或几乎随机的方式将转座子末端插入到5'-标签并将靶核酸片段化。
如本文所用,术语“转座反应”是指其中一个或多个转座子例如在随机位点或几乎随机位点处插入到靶核酸中的反应。转座反应中的基本组分是转座酶和DNA寡核苷酸,该DNA寡核苷酸表现出转座子的核苷酸序列,包括转移的转座子序列及其互补序列(未转移的转座子末端序列)以及形成功能性转座或转座体复合物所需的其他组分。DNA寡核苷酸还可根据需要或期望包含附加的序列(例如,接头或引物序列)。在一些实施方案中,本文提供的方法由以下举例说明:采用由高活性Tn5转座酶和Tn5型转座子末端形成的转座复合物(Goryshin和Reznikoff,1998,J.Biol.Chem.,273:7367)或者通过MuA转座酶以及包含Rl和R2末端序列的Mu转座子末端(Mizuuchi,1983,Cell,35:785;Savilahti等人,1995,EMBOJ.,14:4893)。然而,能够以随机或几乎随机的方式以足够的效率将转座子末端插入到5'-标签并将靶DNA片段化以用于其预期目的的任何转座体系均可用于本发明。可用于本发明方法的本领域已知的转座系统的示例包括但不限于金黄色葡萄球菌Tn552(Colegio等人,2001,J Bacterid.,183:2384-8;Kirby等人,2002,MoI Microbiol,43:173-86)、TyI(Devine和Boeke,1994,Nucleic Acids Res.,22:3765-72和国际专利申请号WO 95/23875)、转座子Tn7(Craig,1996,Science.271:1512;Craig,1996,Review in:Curr TopMicrobiol Immunol,204:27-48)、TnIO和ISlO(Kleckner等人,1996,Curr Top MicrobiolImmunol,204:49-82)、Mariner转座酶(Lampe等人,1996,EMBO J.,15:5470-9)、Tci(Plasterk,1996,Curr Top Microbiol Immunol,204:125-43)、P因子(Gloor,2004,Methods MoI Biol,260:97-114)、TnJ(Ichikawa和Ohtsubo,1990,J Biol Chem.265:18829-32)、细菌插入序列(Ohtsubo和Sekine,1996,Curr.Top.Microbiol.Immunol.204:1-26),逆转录病毒(Brown等人,1989,Proc Natl Acad Sci USA,86:2525-9),以及酵母的逆转录转座子(Boeke和Corces,1989,Annu Rev Microbiol.43:403-34)。用于将转座子末端插入靶序列中的方法可使用任何合适的转座子体系在体外进行,对于所述转座子体系,合适的体外转座体系是可用的或可基于本领域的知识开发。一般来讲,适用于本文提供的方法的体外转座体系至少需要足够纯度、足够浓度和足够体外转座活性的转座酶以及转座子末端,转座酶与转座子末端形成功能性复合物,该功能性复合物具有能够催化转座反应的相应转座酶。可用于本发明的合适的转座酶转座子末端序列包括但不限于野生型、衍生型或突变型转座子末端序列,其与选自野生型、衍生型或突变型转座酶的转座酶形成复合物。
如本文所用,术语“转座体复合物”是指非共价结合到双链核酸的转座酶。例如,复合物可以是在支持非共价复合物形成的条件下与双链转座子DNA一起预温育的转座酶。双链转座子DNA可包括但不限于Tn5 DNA、Tn5 DNA的一部分、转座子末端组合物、转座子末端组合物的混合物或能够与转座酶(诸如高活性Tn5转座酶)相互作用的其他双链DNA。
术语“转座子末端”(TE)是指双链核酸,例如双链DNA,其仅表现出与在体外转座反应中起作用的转座酶或整合酶形成复合物所必需的核苷酸序列(“转座子末端序列”)。在一些实施方案中,转座子端能够在转座反应中与转座酶形成功能性复合物。作为非限制性示例,转座子末端可包括由野生型或突变型Tn5转座酶识别的19-bp外端(“OE”)转座子末端、内端(“IE”)转座子末端、或“嵌合末端”(“ME”)转座子末端、或R1和R2转座子末端,如美国专利公布号2010/0120098的公开内容中所示的,该专利文献的内容全文以引用方式并入本文。转座子末端可包括适用于在体外转座反应中与转座酶或整合酶形成功能性复合物的任何核酸或核酸类似物。例如,转座子末端可包含DNA、RNA、修饰碱基、非天然碱基、修饰主链,并且可以在一条链或两条链中包含切口。尽管术语“DNA”有时在本公开中与转座子末端的组合物结合使用,但应当理解,任何合适的核酸或核酸类似物均可用于转座子末端。
如本文所用,当用于提及核苷酸序列时,术语“地址”、“标签”或“索引”旨在表示与其他索引以及与样本内所含的多核苷酸内的其他核苷酸序列可辨别的唯一核苷酸序列。核苷酸“地址”、“标签”或“索引”可以是随机的或具体设计的核苷酸序列。“地址”、“标签”或“索引”可具有任何期望的序列长度,只要其具有的长度足以使其成为群体中的多个索引内和/或被分析或探查的多种多核苷酸内的唯一核苷酸序列。本公开的核苷酸“地址”、“标签”或“索引”可用于,例如,附接到靶多核苷酸以对特定物类加标签或加标志,以识别群体内的带标签物类的所有成员。因此,索引可用作条形码,其中相同分子物类的不同成员可含有相同索引,并且其中不同多核苷酸的群体内的不同物类可具有不同索引。在特定实施方案中,“地址”、“标签”或“索引”包含5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、35个、40个、45个、50个、60个、70个、80个、90个或100个核苷酸,或包括上述数目中的任意两个或在上述数目中的任意两个之间的核苷酸范围(例如,5个至50个核苷酸、10个至30个核苷酸、15个至25个核苷酸等)。
如本文所用,当用于提及核苷酸序列时,“空间地址”、“空间标签”或“空间索引”意指编码与组织样本中经定址、带标签或带索引的核酸的来源区域或位置相关的空间信息的地址、标签或索引。在特定实施方案中,“空间地址”、“空间标签”或“空间索引”包含7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、35个、40个、45个、50个、60个、70个、80个、90个或100个核苷酸,或包括上述数目中的任意两个或在上述数目中的任意两个之间的核苷酸范围(例如,8个至50个核苷酸、10个至30个核苷酸、15个至25个核苷酸等)。
如本文所用,术语“底物”旨在表示固体载体。该术语包括可用作固体或半固体基础用于形成特征,诸如用于沉积生物聚合物(包括核酸、多肽和/或其他聚合物)的孔的任何材料。例如,如本文所提供的底物是经改性的,或者可通过本领域技术人员熟知的多种方法改性以适应生物聚合物的附接。示例性类型的底物材料包括玻璃、改性玻璃、功能化玻璃、无机玻璃、微球(包括惰性和/或磁性粒子)、塑料、多糖、尼龙、硝化纤维、陶瓷、树脂、二氧化硅、基于二氧化硅的材料、碳、金属、光纤或光纤束、除以上举例说明的那些之外的多种聚合物(例如,环烯烃共聚物、聚丙烯酰胺、环烯烃聚合物等)、以及多孔微量滴定板。具体类型的示例性塑料包括丙烯酸树脂、聚苯乙烯、苯乙烯与其他材料的共聚物、聚丙烯、聚乙烯、聚丁烯、聚氨酯和TeflonTM。具体类型的示例性的基于二氧化硅的材料包括硅和各种形式的改性硅。在特定实施方案中,如本文所用,“亚态”包括但不限于小珠、微阵列、板、多孔板或流通池(例如,非图案化流通池或图案化流通池)。底物可包括平面表面,或包括非平面(例如,凸或凹)表面。本领域技术人员将知道或理解,如本文所提供的底物的组成和几何结构可根据预期用途和用户的优选要求而变化。在一些实施方案中,底物可以是图案化的。例如,底物可被图案化为具有纳米孔。因此,尽管在本文中参考微阵列举例说明了平面底物诸如载片、芯片或晶圆,但在给定本文所提供的教导内容和指导的情况下,本领域技术人员将理解本文举例说明或本领域熟知的多种其他底物也可用于本文的方法和/或组合物中。
在某些实施方案中,本文所公开的“底物”还可包含固定的捕获剂或捕获寡核苷酸的岛或簇。岛或簇可通过使用桥式扩增在底物(例如,流通池)的表面上产生。在这种情况下,底物包含底物的表面上的多个固定捕获寡核苷酸,其与存在于附近引物或寡核苷酸上的互补衔接子区域结合以形成桥样结构;然后使用聚合酶延伸这些桥样结构,产生双链分子,然后将该双链分子变性以留下锚定到底物的单链捕获寡核苷酸。多次迭代上述过程后,形成固定捕获寡核苷酸的岛或簇。可与本文所公开的方法和组合物一起使用的前述方法的示例可见于WO 2022/015913 A1,其全文以引用的方式并入本文中。在特定实施方案中,附近引物或寡核苷酸通过可选择性裂解的接头附接到底物(例如,流通池)。每个岛或簇的形状可以是大致圆形或椭圆形。每个岛或簇具有的平均直径可为200nm、250nm、300nm、350nm、400nm、450nm、500nm、550nm、600nm、650nm、700nm、750nm、800nm、850nm、900nm、950nm、1000nm、1050nm、1100nm、1200nm,或包括前述直径中的任意两个直径或在前述直径中的任意两个直径之间的范围。在又一个实施方案中,每1mm2的表面积,底物(例如,流通池)的表面包括30万个、40万个、50万个、60万个、70万个、80万个、90万个、100万个、110万个、120万个、130万个、140万个、150万个、160万个、170万个、180万个、190万个、200万个、210万个、220万个、230万个、240万个或250万个簇,或包括前述数目中的任意两个数目或在前述数目中的任意两个数目之间的范围。在特定实施方案中,如本文所公开的“底物”包含固定捕获寡核苷酸的岛或簇,该固定捕获寡核苷酸包含衔接子序列、空间地址序列、任选的序列引物位点和针对靶向的分析物的捕获部分。在再一个实施方案中,底物上的每个簇或岛(例如,流通池)包含具有唯一空间地址序列的捕获寡核苷酸,因此可识别每个簇或岛的x,y位置。在这种情况下,可通过对空间地址序列进行解码来确定每个簇或岛的x,y位置。对空间地址序列进行解码的方法包括但不限于本文所公开的杂交解码或测序解码方法。
在一些实施方案中,底物是有序底物。“有序底物”是指不同区域在底物的暴露层之中或之上的布置,其中每个区域包括具有分配的x,y空间地址或可易于确定的x,y空间地址的特征(例如,纳米孔)。“有序底物”可具有特定图案的特征。在一些实施方案中,图案可以为特征部和/或间隙区域的重复布置。在某个实施方案中,“有序底物”的表面可被图案化为具有空间地址序列。可以用于本文阐述的方法和组合物中的示例性图案化底物描述于美国序列号13/661,524和美国专利申请公布号2012/0316086Al中有所描述,这两份专利中的每一者以引用方式并入本文。在特定实施方案中,有序底物的特征可包含固定寡核苷酸,或固定寡核苷酸的岛或簇。在此类实施方案中,可容易地确定固定捕获寡核苷酸的岛或簇的位置,而不必对固定寡核苷酸的空间地址序列进行解码。因此,具有唯一空间地址序列的固定寡核苷酸对于“有序底物”是任选的。“有序底物”的示例包括但不限于图案化流通池、小珠芯片阵列和微阵列。
如本文所用,术语“间隙区域”是指底物中或表面上与底物或表面的其他区域分开的区域。例如,间隙区域可将阵列的一个特征部与阵列的另一个特征部分开。彼此分开的两个区域可以为离散的,彼此缺乏接触。在另一个示例中,间隙区域可将特征部的第一部分与特征部的第二部分分开。由间隙区域提供的分离可以是部分分离或完全分离。间隙区域通常具有与表面上特征的表面材料不同的表面材料。例如,阵列的特征可具有量或浓度超过存在于间隙区域处的量或浓度的捕获剂或捕获寡核苷酸。在一些实施方案中,捕获剂或引物可能不存在于间隙区域处。
在一些实施方案中,底物在表面中包括孔或凹陷的阵列。这可如本领域通常已知的那样使用多种技术来制造,这些技术包括但不限于光刻、压印技术、模制技术和微蚀刻技术。本领域的技术人员将会知道,所使用的技术将取决于阵列底物的组成和形状。
图案化底物或有序底物的特征可以是玻璃、硅、塑料或其他合适的固体载体上的孔(例如,微孔或纳米孔)阵列中的具有图案化的共价连接的凝胶(诸如聚(N-(5-叠氮基乙酰胺基戊基)丙烯酰胺-共丙烯酰胺)(PAZAM,参见,例如,美国公布专利申请序列号61/753,833,该专利以引用方式并入本文中)。该方法产生用于测序的凝胶垫,该凝胶垫在具有大量循环的测序运行中可为稳定的。聚合物与孔的共价连接有助于在多种用途期间以及在结构化基板的整个寿命期间将凝胶保持为结构化特征。然而,在许多实施方案中,凝胶无需共价连接到孔。例如,在一些条件下,不含硅烷的丙烯酰胺(SFA,参见,例如,美国专利申请公布号2011/0059865Al,其以引用的方式并入本文中)(其未共价附接到结构化底物的任意部分)可用作凝胶材料。
在特定实施方案中,结构化底物或有序底物可通过以下方法来制作:将固体载体材料图案化为具有孔(例如,微孔或纳米孔),用凝胶材料(例如,PAZAM、SFA或它们的化学改性的变体,诸如SFA的叠氮化版本(叠氮-SFA))涂覆图案化载体,并且例如通过化学或机械抛光来抛光已涂覆凝胶的载体,从而将凝胶保持在孔中,而从孔之间的结构化底物的表面上的间隙区域移除基本上所有凝胶或使基本上所有凝胶失活。引物核酸可附着到凝胶材料。然后可使靶核酸(例如,片段化的人基因组)的溶液与已抛光的底物接触,使得单个靶核酸将通过与附着到凝胶材料的引物的相互作用接种到单个孔中;然而,由于不存在凝胶材料或该凝胶材料失活,靶核酸将不占用间隙区域。靶核酸的扩增将被限制在孔中,因为间隙区域中不存在凝胶或凝胶失活会阻止生长的核酸群体(nucleic acid colony)的向外迁移。该工艺可方便地制造、可扩展、且利用常规微型或纳米制造方法。图案化底物或有序底物可包括例如蚀刻到载片或芯片中的孔。
孔的蚀刻的图案和几何结构可呈多种不同形状和大小,只要此类特征彼此在物理上或功能上可隔开即可。具有此类结构特征的尤其有用的底物是可选择诸如微球的固体载体粒子的大小的图案化底物。具有这些特性的示例性图案化底物是与小珠阵列技术(Illumina,Inc.,San Diego,Calif)结合使用的蚀刻底物。更多示例描述于美国专利号6,770,441,该专利以引用的方式并入本文。
在一些实施例中,本文所公开的底物为流通池。如本文所用,术语“流通池”是指包括固体表面的室,一种或多种流体试剂可流过该固体表面。可容易地用于本公开的方法中的流通池以及相关流体系统和检测平台的示例描述于例如以下中:Bentley等人,Nature456:53-59(2008);WO 04/018497、US 7,057,026、WO 91/06678、WO 07/123744、US 7,329,492、US 7,21 1,414、US 7,315,019、US 7,405,281和US2008/0108082,其中每一篇以引用方式并入本文。流通池可以是“非图案化流通池”,其中流通池的表面包括随机或半随机布置的特征(例如,包括寡核苷酸的簇或岛的区域)。另选地,流通池可以是“图案化流通池”,其中流通池包括在跨流通池的表面的固定位置处的特征(例如,纳米孔)。“图案化流通池”的特征还可包括固定寡核苷酸或固定寡核苷酸的簇或岛。“图案化流通池”可以是“有序底物”,因为图案化流通池的特征具有分配的x,y空间地址或可易于确定的x,y空间地址。
如本文所用,当用于提及核酸时,术语“固定”旨在表示经由共价键或非共价键直接或间接附接到底物或底物的特征。在某些实施方案中,可使用共价附接,但全部所需的是核酸在旨在使用载体的条件下(例如,在需要核酸扩增和/或测序的应用中)保持固定或附接到载体。待用作捕获引物或扩增引物的寡核苷酸可被固定,使得3'-端可用于酶促延伸,并且序列的至少一部分能够与互补序列杂交。固定可通过与表面附接的寡核苷酸杂交而发生,在这种情况下,所固定的寡核苷酸或多核苷酸可处于3'-5'取向。另选地,寡核苷酸的固定可包括使用可选择性裂解的接头。可选择性裂解的接头的示例包括但不限于基于生物素的分子(例如,脱硫生物素分子(ddBio)、PC接头以及稀有切割酶的辨识位点。通常,可选择性裂解的接头可通过加热、竞争性结合、pH改变、化学裂解、酶裂解和/或光裂解来裂解。裂解可选择性裂解的接头导致核酸或其部分从底物或底物的特征释放。
某些实施方案可利用惰性底物或基质(例如,载玻片、聚合物小珠等),该惰性底物或基质已例如通过施加包含反应性基团的中间材料层或涂层被官能化,这些反应性基团允许共价附接到生物分子诸如多核苷酸。此类底物的示例包括但不限于负载在惰性底物(诸如玻璃)上的聚丙烯酰胺水凝胶,尤其是如WO 2005/065814和US2008/0280773中所述的聚丙烯酰胺水凝胶,这些文献的内容全文以引用方式并入本文。在此类实施方案中,生物分子(例如,多核苷酸)可直接共价附接到中间材料(例如,水凝胶),但该中间材料本身可非共价附接到底物或基质(例如,玻璃底物)。术语“共价附接到底物”应相应地被解释为涵盖这种类型的布置。
示例性共价连接包括,例如,使用点击化学技术产生的那些。示例性非共价连接包括但不限于非特异性相互作用(例如,氢键合、离子键合、范德瓦尔斯相互作用等)或特异性相互作用(例如,亲和相互作用、受体-配体相互作用、抗体表位相互作用、抗生物素蛋白-生物素相互作用、链霉抗生物素蛋白-生物素相互作用、凝集素碳水化合物相互作用等)。示例性连接在美国专利号6,737,236、7,259,258、7,375,234和7,427,678;和美国专利公布号201 1/0059865Al中阐述,这些专利文献中的每一篇以引用方式并入本文。
如本文所用,术语“阵列”是指可根据相对位置彼此区分的一组位点。位于阵列的不同位点处的不同分子可根据位点在阵列中的位置而彼此区分。阵列的单个位点可包含一种或多种特定类型的分子。例如,位点可包含具有特定序列的单个靶核酸分子,或者位点可包含具有相同序列(和/或其互补序列)的若干核酸分子。阵列的位点可以是位于同一基板上的不同特征。示例性特征包括但不限于基板中的孔、基板中或基板上的小珠(或其他粒子)、基板的突出部、基板上的脊或基板中的通道。阵列的位点可以是各自带有不同分子的单独的基板。可根据基板在与基板相关联的表面上的位置,或者根据基板在液体或凝胶中的位置,来识别附接到单独基板的不同分子。其中单独的基板位于表面上的示例性阵列包括但不限于在孔中具有小珠的那些阵列。
如本文所用,术语“多个”旨在表示两个或更多个不同成员的群体。多个数目可在小、中、大到极大的大小范围内。小的多个数目的大小可在例如几个成员到数十个成员的范围内。中等大小的多个数目可在例如数十个成员到约100个成员或数百个成员的范围内。大的多个数目可在例如约数百个成员到约1000个成员、到数千个成员、和多达数万个成员的范围内。极大的多个数目可在例如数万成员到约几十万、一百万、几百万、几千万、和多达或超过数亿成员的范围内。因此,多个的以成员数来测量的大小范围可从两个到远远超过一亿个成员,以及在上述示例性范围之间和超过上述示例性范围的所有大小。微阵列内的示例性数目的特征包括1.28cm2内的多个约500,000个或更多个分散特征。示例性核酸多个数目包括例如约1×105个、5×105个和1×106个或更多个不同核酸物类的群体。因此,术语的定义打算包含大于二的所有整数值。多个数目的上限可以例如通过核酸样本中寡核苷酸序列的理论多样性来设定。
如本文所用,术语“组织样本”是指已从受试者获得、固定、切片并安装在平面表面(例如,显微镜载片)上的组织片。组织样本可以是福尔马林固定的石蜡包埋的(FFPE)组织样本或新鲜组织样本或冷冻组织样本等。本文所公开的方法可在对组织样本进行染色之前或之后执行。例如,在苏木精与伊红染色后,可根据本文所提供的方法对组织样本进行空间分析。方法可包括(例如,使用苏木精与伊红染色)分析样本的组织学特征,以及然后对组织进行空间分析。
如本文所用,术语“福尔马林固定的石蜡包埋的(FFPE)组织切片”是指组织片,例如,已经从受试者获得、在甲醛(例如,在磷酸缓冲盐水中的3%至5%甲醛)或Bouin溶液中固定、在蜡中包埋、切成薄切片并随后安装在平面表面(例如,显微镜载片)上的活检组织。
本文中对变量的任何定义中的要素列表的表述包括将该变量定义为所列要素的任何单个要素或组合(或子组合)。本文对实施方案的表述包括作为任何单个实施方案或与任何其他实施方案或其部分组合的那个实施方案。
本说明书中提及的所有专利和出版物均以引用方式并入本文,其程度如同每个独立的专利和出版物被具体且单独地指出以引用方式并入那样。
空间蛋白质基因组学的新兴领域正受到新技术的发展的驱动,该新技术允许将单细胞组映射到其在组织中的空间位置。空间基因组技术捕获生物学信息的“位置”。现今的产品使用斑点状阵列或物理分离的液滴来从细胞群体或组织学样本捕获核酸信息。现今的分辨率受到可用于识别转录物和蛋白质的x,y位置的特征的密度的限制。另外,当前技术不能用于多组学应用。
本文描述了用于空间组学应用的改善的方法和组合物,这些方法和组合物保留与组织中分析物的来源相关的空间信息。空间组学应用的示例包括但不限于:空间基因组学应用、空间蛋白质组学应用;空间转录组学应用;空间农业基因组学应用;空间表观基因组学应用;空间表型组学应用;空间配体组学应用;以及空间多组学应用(例如,转录组学和基因组学应用)。
本公开部分地基于以下认识:可通过使用附接到阵列或附接到中间底物(如小珠)的探针,将与组织样本中分析物的空间来源相关的信息与阵列中的x,y位置相关,该探针包括“空间地址”和针对来自组织的靶向的分析物的捕获部分。“空间地址”可通过使用各种技术来解码,这些技术包括但不限于杂交解码和测序解码。在特定实施方案中,解码方法是提出于以下的杂交解码方法:Gunderson等人的(Genome Res.14(5):870-874)(2004))。然后探针的捕获部分可与来自组织样本的靶分析物异位结合或杂交。另选地,空间定址的探针可首先从阵列或中间底物(例如,小珠)脱离,并且然后与组织样本中的靶分析物原位结合。与组织样本中的不同分析物结合的寡核苷酸可基于它们的空间地址来区分,并且可映射到它们在组织样本中的来源区域上,从而提供空间组学信息。组织样本中的分析物的示例包括基因组DNA、甲基化DNA、特异性甲基化DNA序列、信使RNA(mRNA)、聚A mRNA、片段化mRNA、片段化DNA、线粒体DNA、病毒RNA、微RNA、原位合成的PCR产物、RNA/DNA杂交体、脂质、碳水化合物、蛋白质、糖蛋白、脂蛋白、磷蛋白、蛋白质的特异性磷酰化或乙酰化变体,或病毒外壳蛋白。
本公开还部分地基于以下认识:可空间定址的探针可附接到阵列或中间底物(例如,小珠或纳米粒子)的表面,使得探针结合于样品中的靶分析物以用于组学应用。在特定实施方案中,附接到阵列或中间底物的表面的可空间定址的探针包括相同的空间地址。在另一个实施方案中,可空间定址的探针是通过使用脱硫生物素分子而可逆地附接到中间底物的阵列的表面的。在又一个实施方案中,中间底物为小珠。在再一个实施方案中,小珠放置于图案化在底物(例如,小珠芯片)的表面上的纳米孔中。在又一个实施方案中,数千个探针附接到小珠,所有可空间定址的探针都具有相同的空间地址序列。在再一个实施方案中,探针使用脱硫生物素分子(ddBio)而可逆地附接到小珠,这允许探针在限定条件下以有限的横向扩散释放。通过使用此类可逆脱离,探针可扩散到靶向的分析物(而不是从相反的方向),这可改善分析物捕获和测定灵敏度。
本公开还部分地基于以下认识:多种类型的探针可附接到中间底物(例如,小珠或纳米粒子),使得不同类型的探针结合于样本中的不同靶分析物以用于多组学应用。在特定实施方案中,附接到中间底物的探针类型中的至少一个探针类型包括空间地址。在另一个实施方案中,附接到中间底物的所有探针包括相同的空间地址。在再一个实施方案中,附接到中间底物(例如,小珠或纳米粒子)的多种类型的探针因包含不同捕获部分而不同。在某些实施方案中,捕获部分可因包含相同类型的核酸但具有不同序列而不同。在这种情况下,探针可用于例如表观基因组学应用。在其他情况下,捕获部分可因包含不同类型的核酸(例如,RNA和DNA)而不同。在这种情况下,这些探针可用于例如转录组学和基因组学应用。在另外的实施方案中,捕获部分可因包含不同类型的生物分子(例如,DNA和蛋白质(例如,抗体))而不同。可用作捕获部分的生物分子的示例包括但不限于核酸、抗体、核酸配体、scFv、抗原结合结构域、蛋白质、肽、受体、半抗原等。在这种情况下,这些探针可用于例如基因组学和蛋白质组学应用。在更另外的实施方案中,捕获部分可依据以下而不同:包含相同类型的核酸但具有不同序列、包含不同类型的核酸、包含不同类型的生物分子或前述的任何组合。在又一个实施方案中,多个探针可逆地附接到小珠。在再一个实施方案中,小珠放置于图案化在底物(例如,小珠芯片)的表面上的纳米孔中。在又一个实施方案中,数千个探针附接到小珠,所有探针都具有相同的空间地址。在再一个实施方案中,数千个探针可逆地附接到小珠,所有探针都具有相同的空间地址序列。在再一个实施方案中,多种类型的探针使用脱硫生物素(ddBio)可逆地附接到小珠,这允许探针在限定条件下以有限的侧向扩散释放。通过使用此类可逆脱离,多个探针可扩散到靶向的分析物(而不是从相反的方向),这可改善分析物捕获和测定灵敏度。
在另一个实施方案中,本公开提供了包含本文所公开的可空间定址的探针的纳米粒子或小珠。在特定实施方案中,小珠包含本所文公开的可空间定址的探针。在又一个实施方案中,小珠包含小珠的表面上的链霉抗生物素蛋白。在再一个实施方案中,小珠包含经由键或可逆键与小珠结合的多个寡核苷酸。可逆键的示例包括生物素分子,诸如ddBio分子。结合小珠的寡核苷酸通常包含衔接子序列,诸如P5序列或P7序列。如本文所用,P5序列包括由SEQ ID NO:1(AATGATACGGCGACCACCGA)定义的序列,并且P7序列包括由SEQ ID NO:2(CAAGCAGAAGACGGCATACGA)定义的序列。在一些实施方案中,P5或P7序列还可包括间隔区多核苷酸,其长度可为1至20个核苷酸,诸如1至15或1至10个核苷酸,诸如2个、3个、4个、5个、6个、7个、8个、9个或10个核苷酸。在一些实施方案中,该间隔区包括10个核苷酸。在一些实施方案中,该间隔区包括10个核苷酸。在一些实施方案中,该间隔区是聚T间隔区,诸如10T间隔区。间隔区核苷酸可包括在多核苷酸的5'端,其可通过与寡核苷酸的5'端的键而附接到合适的载体。可通过存在于该多核苷酸的5'端的含硫亲核物质(诸如硫代磷酸酯)来实现附接。在一些实施方案中,寡核苷酸将包括聚T间隔区和5'硫代磷酸酯基团。因此,在一些实施方案中,P5序列为5'硫代磷酸酯-TTTTTTTTTTAATGATACGGCGACCACCGA-3'(SEQ ID NO:3),并且在一些实施方案中,P7序列为5'硫代磷酸酯-TTTTTTTTTTCAAGCAGAAGACGGCATACGA-3'(SEQ ID NO:4)。在某些实施方案中,附接到小珠的寡核苷酸包含允许在经解码时确定寡核苷酸/小珠的x,y位置的地址序列。在另外的实施方案中,地址序列包含7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、35个、40个、45个、50个、60个、70个、80个、90个或100个核苷酸,或包括上述数目中的任意两个或在上述数目中的任意两个之间的核苷酸范围(例如,8个至50个核苷酸、10个至30个核苷酸、15个至25个核苷酸等)。在另一个实施方案中,附接到小珠的寡核苷酸包含转座体杂交区域(Tsm hyb)。在更另外的实施方案中,寡核苷酸包含测序引物位点序列。测序引物位点序列的示例包括与来自IlluminaTM的Read 1(R1)和Read 2(R2)测序引物互补的序列。R1测序引物位点序列的示例包括R1 SBS3(长):ACACTCTTTCCCTACACGACGCTCTTCCGATCT(SEQ ID NO:5);以及R1 SBS3(短):ACACTCTTTCCCTACACGAC(SEQ ID NO:6)。R2测序引物位点序列的示例包括R2 SBS12(长):GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT(SEQ ID NO:7);以及R2 SBS12(短):GTGACTGGAGTTCAGACGTGT(SEQ ID NO:8)。
在另外的实施方案中,寡核苷酸还可包含一个或多个接头序列。在再一个实施方案中,寡核苷酸还可包含一个或多个索引序列。在某些实施方案中,寡核苷酸可包含一个或多个唯一分子标识符(UMI)序列。唯一分子标识符(UMI)是一类分子条形码,其在测序期间提供错误校正和增加的准确性。这些分子条形码是用于唯一地标记样品文库中每个分子的短序列。UMI用于广泛的测序应用,许多是围绕DNA和cDNA中的PCR复制。UMI去重也可用于RNA-seq基因表达分析和其他定量测序方法。在特定实施方案中,UMI包含6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个或30个核苷酸,或包括前述数目中的任意两个数目或在其之间的核苷酸范围(例如,8个至20个、8个至16个等)。如先前所指出,寡核苷酸包含可与来自生物学样本(例如,组织样本)的分析物特异性结合的部分或序列。因此,附接到小珠的寡核苷酸是针对来自生物学样本的分析物的可空间定址的探针。可选择可与来自生物学样本的分析物特异性结合的部分或序列以用于特定组学应用。例如,寡核苷酸可包含用于转录组学或用于测定(例如,RNA-seq测定)的寡d(T)序列。另选地,寡核苷酸可包含与来自生物学样本的基因组DNA结合的序列,用于基因组学应用或用于测定(例如,ATAC-seq测定)。如本文所呈现的实施例中所提供,小珠可包含具有不同部分或序列的多种类型的寡核苷酸,使得可空间定址的探针可与来自生物学样本的两种或更多种不同类型的分析物特异性结合。使用多种类型的寡核苷酸理想地适用于多组学或多测定应用。
在某个实施方案中,本公开提供了用于空间组学的方法和组合物,其利用具有高特征密度的小珠芯片。小珠芯片,例如由IlluminaTM开发的Infinium小珠芯片,具有的特征密度是空间基因组学领域中提出的其他阵列化特征的密度的3000倍(参见表1)。
表1.各种阵列的特征密度
由于小珠芯片具有x,y格式,它们理想地适用于组学应用和系统。小珠芯片可通过添加捕获感兴趣的蛋白质分析物的探针来提供空间多组学信息。例如,包含附加序列的抗体或核酸配体可用于与靶向的蛋白分析物结合,并且然后通过使附加序列与探针的互补捕获序列杂交而附接到小珠(例如,参见图2)。探针的x,y位置可通过对空间地址序列进行解码来确定。可利用较小的小珠、纳米孔、成像灵敏度等进一步提高小珠芯片阵列的分辩率。可检测特定的分析物(核酸、蛋白质),并且可对地址序列和其他序列进行解码。
在特定实施方案中,本发明提供了包含可空间定址的探针的纳米粒子或小珠。
可空间定址的探针可通过以下来与组织接触:将组织直接放置在包含探针的表面上(例如,参见图16A至图16B);将组织放置在物质(诸如过滤器或凝胶或薄型缓冲层)上,从而将组织与可空间定址的探针隔开,使得靶核酸可从组织、穿过物质扩散到可空间定址的探针;将组织放置在物质(诸如过滤器或凝胶或薄型缓冲层)上,从而将组织与可空间定址的探针隔开,使得可空间定址的探针可从包含可空间定址的探针的表面、穿过物质扩散到靶标;将靶标从组织中提取到中间底物(例如,凝胶、过滤器、固体底物或前述的组合)上,然后将其放置在支撑探针的表面上;以及前述的组合。在每种情况下,选择该技术以基本上保持编码样本中的靶标的空间取向的信息。
在另一示例中,组织样本与阵列接触,并且阵列上的可空间定址的探针释放到组织样本中以与组织样本中的核酸杂交(例如,参见图12A至图12C)。可将组织样本直接放置在包含可空间定址的探针的表面上,或者可将组织样本放置在物质诸如过滤器或凝胶或薄型缓冲层上,从而将组织样本与可空间定址的探针隔开,使得释放的可空间定址的探针可从阵列穿过物质扩散到组织样本中的核酸。可使用可释放基团或可选择性裂解的部分或接头(例如,脱硫生物素分子)将探针锚定在阵列上。可使用例如化学裂解、酶裂解或光裂解从阵列释放可空间定址的探针。在另一示例中,可将空间定址的探针打印到阵列的表面上并使其干燥。可通过再水合从阵列释放可空间定址的探针。在再一示例中,可使用在某种处理的存在下溶解的物质将可空间定址的探针打印到阵列上。然后在将组织样本放置于阵列上之前应用释放可空间定址的探针的处理。
在特定实施方案中,在本文所公开的组合物、方法和试剂盒中使用的组织是新鲜的未经加工组织。在另选实施方案中,在本文所公开的组合物、方法和试剂盒中使用的组织是在用在本公开的组合物、方法和试剂盒中之前加工的。用于加工组织的方法可包括以下步骤:固定组织、包埋组织、对组织进行染色、以及对组织进行切片。可使用化学固定剂或通过快速冷冻来固定组织。化学固定剂可为凝结剂固定剂,该凝结剂固定剂从组织中去除水,导致蛋白质(主要在细胞外基质中)的凝结和变形;并且交联固定剂在组织的分子之间形成化学键。凝结剂固定剂的示例包括但不限于乙醇、甲醇、苦味酸、丙酮、Clarke溶液、Bouin和Carnoy。交联固定剂的示例包括但不限于甲醛和戊二醛。在特定实施方案中,在本文所公开的组合物、方法和试剂盒中使用的组织不是利用化学固定剂固定的。在特点实施方案中,在本文所公开的组合物、方法和试剂盒中使用的组织是通过快速冷冻固定的。在本文所公开的组合物、方法和试剂盒中使用的组织可通过被包埋和切片来加工。包埋过程通常需要使用包埋剂来包埋组织。包埋剂的示例包括但不限于石蜡、火棉胶、环氧树脂、丙烯酸树脂和最佳切割温度(OCT)复合物。OCT复合物是二醇与树脂的水溶性共混物,该水溶性共混物为-10℃和更低的温度下的恒冷箱切片提供方便的标本基质。在特定实施方案中,在本文所公开的组合物、方法和试剂盒中使用的组织包埋在OCT复合物中。一旦经包埋或经固定,通常使用如超薄冷冻切片机、冷冻切片机或切片机的装置将组织切割成从50纳米直至100μm的非常薄的切片。可在置于本文所公开的阵列上之前对组织切片进行染色。另选地,不在置于本文所公开的阵列上之前对组织切片进行染色。染色是通过使用染料使组织着色的过程。其允许利用光学显微镜来显现待研究的细胞和细胞外基质。染料分子具有两个结构域:色原提供颜色,并且助色团使得可与组织结合。助色团在化学上是易变的:可以是可电离的,可与金属离子反应(然后它们被称为媒染剂),或者可与组织分子反应。大多数染料可溶于水。在特定实施方案中,组织切片用苏木精和伊红来染色。苏木精用于显现带负电荷的DNA。伊红用于显现带正电荷的基团,诸如氨基基团。因此,本公开的组合物、方法和试剂盒可提供可与组织切片中的经染色结构直接相关的空间组学信息。
为了用于本文所描述的空间组学应用,本文还描述了制造的试剂盒和制品。此类试剂盒可包括分隔开来以接纳一个或多个容器的载体、包装或容器,例如,小瓶、管等,每个容器包括将用于本文所描述的方法中的独立元件中的一个元件。适合的容器包括,例如,瓶、小瓶、注射器和试管。该容器可由多种材料形成,诸如,玻璃或塑料。
例如,容器可包括本文所公开的一种或多种可空间定址的探针,任选地在组合物中或与本文所公开的另一试剂(例如,阵列、小珠芯片)组合。可选地,该容器具有无菌入口(例如,该容器可以为静脉输液袋或具有可被皮下注射针刺穿的塞子的小瓶)。任选地,此类试剂盒包括识别描述或标记或关于其在本文所描述的方法中的使用的说明。
试剂盒通常将包括一个或多个附加容器,每个容器带有各种材料(诸如任选地呈浓缩形式的试剂和/或装置)中一种或多种从商业和用户的观点出发期望用于与本文所描述的可空间定址的探针一起使用的材料。此类材料的非限制性示例包括但不限于:缓冲液、稀释剂、过滤器、针、注射器;载体、包装、容器、小瓶和/或列出内容物和/或使用说明的管标签,以及带有使用说明的包装说明书。也通常将包括一套说明书。
标记可在容器上或与容器相关联。在形成标记的字母、数字或其它字符附接、模制或蚀刻到容器本身的情形下,标记可在容器上,而在其存在于同样支撑容器的容座或载体例如如包装说明书内时,标记可与容器相关联。标记可用于指示内容物将用于特定空间组学应用。例如,在本文所描述的方法中,该标记还可指示使用内容物的方向。
本公开还提供了本文所描述的方法和组合物可由以下方面(方面1至方面92)进一步限定:
1.一种空间基因组学转座酶可及染色质高通量测序测定(ATAC-Seq)方法,包括
(A)将粒子负载到底物的孔中,其中粒子包含通过可选择性裂解的接头附接到粒子的寡核苷酸,寡核苷酸包含衔接子序列、空间地址序列和转座体杂交区域;
(B)对寡核苷酸的空间地址序列进行解码以确定粒子的x,y位置;
(C)将组织放置在阵列中的粒子的顶部上,并使细胞膜溶解以接近组织中的染色质区域;
(D)利用转座体复合物将染色质区域标签化以形成标签化片段,并去除转座体复合物;
(E)将组织透化以允许标签化片段扩散到阵列中的粒子;
(F)通过使标签化片段与寡核苷酸的转座体杂交区域杂交来将标签化片段捕获到粒子;
(G)加工捕获的标签化片段以制备用于测序的粒子结合的基因组文库构建体;
(H)通过选择性裂解该接头从粒子释放基因组文库构建体;
(I)通过使用测序仪对基因组文库构建体进行测序并将测序读段与粒子的x,y位置进行映射来获得组织的空间基因组学信息,任选地,其中该粒子是微粒或纳米粒子;并且/或者
任选地,其中该底物选自微阵列、小珠芯片、多孔板或流通池;并且/或者
任选地,其中该衔接子序列包含P5衔接子序列或者包含P7衔接子序列,更任选地,其中该衔接子序列包含与SEQ ID NO:1至SEQ ID NO:4的序列98%相同的序列,还更任选地,其中该衔接子序列包含SEQ ID NO:1或SEQ ID NO:2的序列;并且/或者
任选地,其中空间地址序列包含8个至50个核苷酸,还更任选地,其中空间地址序列包含10个至30个核苷酸;并且/或者
任选地,其中该转座体杂交区域包含与由转座体复合物产生的多核苷酸的标签化端部互补的序列;并且/或者
任选地,可选择性裂解的接头选自基于生物素的分子、PC接头以及稀有切割酶的辨识位点,更任选地,可选择性裂解的接头包含脱硫生物素分子(ddBio);并且/或者
任选地,其中可选择性裂解的接头可通过加热、竞争性结合、pH改变、化学裂解、酶裂解和/或光裂解来裂解,更任选地,其中可选择性裂解的接头可通过竞争性结合和加热来裂解,更任选地,可选择性裂解的接头通过添加生物素和加热来裂解。
2.根据方面1所述的空间基因组学ATAC-Seq方法,其中该纳米粒子是小珠,任选地,其中小珠包被有链霉抗生物素蛋白,更任选地,其中纳米粒子是链霉抗生物素蛋白包被的磁性小珠。
3.根据方面1或方面2所述的空间基因组学ATAC-Seq方法,其中转座体复合物为基于TN5的转座体复合物。
4.根据前述方面中任一项所述的空间基因组学ATAC-Seq方法,其中空间地址序列是通过使用杂交解码方法来解码的。
5.根据前述方面中任一项所述的空间基因组学ATAC-Seq方法,其中细胞膜是通过使用温和清洁剂来溶解的,任选地,其中温和清洁剂选自NP40、吐温20、胆汁盐、TritonX100和(3-((3-胆酰胺丙基)二甲基铵基)-1-丙烷磺酸盐)(CHAPS)。
6.根据前述方面中任一项所述的空间基因组学ATAC-Seq方法,其中组织是通过使用清洁剂和蛋白酶K来透化的,任选地其中清洁剂为吐温20和/或Triton X100。
7.根据前述方面中任一项所述的空间基因组学ATAC-Seq方法,其中捕获的标签化片段是通过使用顶链连接、与Y形衔接子杂交和空位填充连接步骤来加工的,
任选地其中顶链连接利用DNA连接酶,并且/或者
任选地其中空位填充连接步骤包括使用缺少链置换活性的DNA聚合酶、dNTP以及DNA连接酶,更任选地,缺少链置换活性的DNA聚合酶选自基于T4的聚合酶、基于T7的聚合酶、基于Pfu的聚合酶或基于Taq的聚合酶,并且/或者
任选地,其中Y形衔接子在其末端是非互补的,以防止其自连接并因此在退火至寡核苷酸后形成Y形。
8.根据前述方面中任一项所述的空间基因组学ATAC-Seq方法,其中在测序之前,文库构建体是使用PCR来扩增的。
9.根据前述方面中任一项所述的空间基因组学ATAC-Seq方法,其中测序仪利用合成测序技术。
10.根据前述方面中任一项所述的空间基因组学ATAC-Seq方法,其中转座体复合物的杂交区域是通过使用辅助寡核苷酸来初始封闭的,该辅助寡核苷酸然后在步骤(E)中被去除。
11.一种空间多组学转座酶可及染色质高通量测序测定(ATAC-Seq)和RNA-Seq方法,包括:
(A)将粒子负载到阵列的孔中,其中粒子包含通过可选择性裂解的接头附接到粒子的两组寡核苷酸,第一组寡核苷酸包含第一衔接子序列、空间地址序列和转座体杂交区,第二组寡核苷酸包含第一衔接子序列、测序引物位点序列、空间地址序列、唯一分子标识符(UMI)序列和寡(dT)序列;
(B)对寡核苷酸的空间地址序列进行解码以确定粒子的x,y位置;
(C)将组织放置在阵列中的粒子的顶部上,并使细胞膜溶解以接近组织中的聚-ARNA转录物和染色质区域;
(D)利用第一转座体复合物将染色质区域标签化以形成标签化片段,并去除第一转座体复合物;
(E)将组织透化以允许标签化片段和聚-A RNA转录物扩散到阵列中的粒子;
(F)通过(i)使标签化片段与第一组寡核苷酸的转座体杂交区域杂交以及(ii)使聚-A RNA转录物与第二组寡核苷酸的寡(dT)序列杂交来将标签化片段和聚-A RNA转录物捕获到纳米粒子;
(G')加工包含捕获的标签化片段的第一组寡核苷酸以制备用于测序的粒子结合的基因组文库构建体;
(G”)在单链模板转换寡核苷酸的存在下逆转录包含捕获的聚-A RNA转录物的第二组寡核苷酸以制备用于测序的纳米粒子结合的cDNA文库构建体;
(H)通过选择性裂解该接头从粒子释放基因组文库构建体和cDNA文库构建体;
(I)使用PCR来扩增基因组文库构建体和cDNA文库构建体,并将经扩增的产物分裂为包含两种经扩增的构建体的两个部分;
(J)利用第一衔接子引物和第二衔接子引物扩增经扩增的构建体的第一部分以形成ATAC-Seq文库,其中第一衔接子引物和第二衔接子引物与衔接子序列结合,并且其中第一衔接子引物和/或第二衔接子引物还包含索引序列和/或测序引物位点序列;
(J')利用包含序列引物序列的引物以及TSM将经扩增的构建体的第二部分标签化,并随后使用PCR利用包含测序引物位点序列的第一衔接子引物以及包含索引序列和测序引物位点序列的第二衔接子引物来扩增标签化的经扩增的文库构建体以形成RNA-Seq文库,其中第一衔接子引物和第二衔接子引物具有差异序列引物序列;以及
(K)通过使用测序仪对ATAC-Seq文库和RNA-Seq文库进行测序并将测序读段与粒子的x,y位置进行映射来获得多组学信息。
任选地,其中该粒子是微粒或纳米粒子;并且/或者
任选地,其中第一衔接子序列包含P5衔接子序列并且第二衔接子序列包含P7衔接子序列,或者反之亦然,更任选地,其中第一衔接子序列包含SEQ ID NO:1的序列并且第二衔接子序列包含SEQ ID NO:2的序列,或者反之亦然;并且/或者
任选地,其中第一衔接子引物包含互补的P5衔接子序列并且第二衔接子引物包含互补的P7衔接子序列,或者反之亦然,更任选地,其中第一衔接子引物包含与SEQ ID NO:1互补的序列并且第二衔接子引物包含与SEQ ID NO:2互补的序列,或者反之亦然;并且/或者
任选地,其中UMI序列包含8个至20个核苷酸,更任选地,其中UMI序列包含8个至16个核苷酸;并且/或者
任选地,其中空间地址序列包含8个至50个核苷酸,还更任选地,其中空间地址序列包含10个至30个核苷酸;并且/或者
任选地,其中该转座体杂交区域包含与由转座体复合物产生的多核苷酸的标签化端部互补的序列;并且/或者
任选地,其中第一衔接子引物的测序引物位点序列包含Read 1(R1)测序引物位点序列,更任选地,第二衔接子序列包含SEQ ID NO:5或SEQ ID NO:6的R1测序引物位点序列;并且/或者
任选地,其中第二衔接子序列的测序引物位点序列包含Read 2(R2)测序引物位点序列,更任选地,第二衔接子序列包含SEQ ID NO:7或SEQ ID NO:8的R2测序引物位点序列;并且/或者
任选地,其中索引序列包含6个至10个核苷酸;并且/或者
任选地,可选择性裂解的接头选自基于生物素的分子、PC接头以及稀有切割酶的辨识位点,更任选地,可选择性裂解的接头包含脱硫生物素分子(ddBio);并且/或者
任选地,其中可选择性裂解的接头可通过加热、竞争性结合、pH改变、化学裂解、酶裂解和/或光裂解来裂解,更任选地,其中可选择性裂解的接头可通过竞争性结合和加热来裂解,更任选地,可选择性裂解的接头通过添加生物素和加热来裂解。
12.根据方面11所述的空间多组学ATAC-Seq和RNA-Seq方法,其中该粒子是小珠,任选地,其中小珠包被有链霉抗生物素蛋白,更任选地,其中纳米粒子是链霉抗生物素蛋白包被的磁性小珠。
13.根据方面11或方面12所述的空间多组学ATAC-Seq和RNA-Seq方法,其中转座体复合物为TN5转座体复合物。
14.根据方面11至13中任一项所述的空间多组学ATAC-Seq和RNA-Seq方法,其中空间地址序列是通过使用杂交解码方法来解码的。
15.根据方面11至14中任一项所述的空间多组学ATAC-Seq和RNA-Seq方法,其中细胞膜是通过使用温和清洁剂来溶解的,任选地,其中细胞膜是使用温和清洁剂来溶解的,该温和清洁剂选自NP40、吐温20、胆汁盐、Triton X100和(3-((3-胆酰胺丙基)二甲基铵基)-1-丙烷磺酸盐)(CHAPS)。
16.根据方面11至15中任一项所述的空间多组学ATAC-Seq和RNA-Seq方法,其中组织是通过使用清洁剂和蛋白酶K来透化的,任选地其中清洁剂为吐温20和/或Triton X100。
17.根据方面11至16中任一项所述的空间多组学ATAC-Seq和RNA-Seq方法,其中捕获的标签化片段是通过使用顶链连接、与Y形衔接子杂交和空位填充连接步骤来加工的,
任选地,其中顶链连接利用DNA连接酶,并且/或者
任选地,其中空位填充连接步骤包括使用缺少链置换活性的DNA聚合酶、dNTP以及DNA连接酶,更任选地,缺少链置换活性的DNA聚合酶选自基于T4的聚合酶、基于T7的聚合酶、基于Pfu的聚合酶或基于Taq的聚合酶,并且/或者
任选地,其中Y形衔接子e在其末端是非互补的,以防止其自连接并因此在退火至寡核苷酸后形成Y形。
18.根据方面11至17中任一项所述的空间多组学ATAC-Seq和RNA-Seq方法,其中在测序之前,文库构建体是使用PCR来扩增的。
19.根据方面11至18中任一项所述的空间多组学ATAC-Seq和RNA-Seq方法,其中测序仪利用合成测序技术。
20.根据方面11至19中任一项所述的空间多组学ATAC-Seq和RNA-Seq方法,其中转座体复合物的杂交区域是通过使用辅助寡核苷酸来初始封闭的,该辅助寡核苷酸然后在步骤(E)中被去除。
21.根据方面11至20中任一项所述的空间多组学ATAC-Seq和RNA-Seq方法,其中步骤(G)和步骤(G')是相继地或同时地执行的。
22.根据方面11至21中任一项所述的空间多组学ATAC-Seq和RNA-Seq方法,其中步骤(J)和步骤(J')是相继地或同时地执行的。.
23.根据方面11至22中任一项所述的空间多组学ATAC-Seq和RNA-Seq方法,其中寡d(T)序列包含16个至20个核苷酸。
24.一种使用小珠芯片的空间转录组学方法,包括:
(A)将小珠负载到小珠芯片的孔中,其中小珠包含寡核苷酸,该寡核苷酸包含衔接子序列、空间地址序列、任选的序列引物位点和寡(dT)序列;
(B)对寡核苷酸的空间地址序列进行解码以确定小珠的x,y位置;
(C)将组织放置在小珠芯片的顶部上,并使细胞膜溶解以接近组织中的聚-A RNA转录物;
(D)将聚-A RNA转录物捕获到小珠;
(E)逆转录包含捕获的聚-A RNA转录物的寡核苷酸:(i)在单链模板转换寡核苷酸的存在下,以制备用于测序的小珠结合的cDNA文库构建体,或(ii)进一步执行与单链寡核苷酸的单链连接反应以制备用于测序的小珠结合的cDNA文库构建体;
(F)使用PCR和衔接子序列引物来扩增小珠结合的cDNA文库构建体;
(G)通过使用测序仪对经扩增的cDNA文库构建体进行测序并将测序读段与小珠芯片中的小珠的x,y位置进行映射来获得转录组学信息,
任选地,其中小珠芯片的孔为纳米孔;并且/或者
任选地,其中纳米粒子为链霉抗生物素蛋白包被的小珠,更任选地,其中纳米粒子为链霉抗生物素蛋白包被的磁性小珠;并且/或者
任选地,其中该衔接子序列包含P5衔接子序列或者包含P7衔接子序列,更任选地,其中该衔接子序列包含与SEQ ID NO:1至SEQ ID NO:4的序列98%相同的序列,还更任选地,其中该衔接子序列包含SEQ ID NO:1或SEQ ID NO:2的序列;并且/或者
任选地,其中衔接子引物包含互补的P5衔接子序列或互补的P7衔接子序列,更任选地,其中第一衔接子引物包含与SEQ ID NO:1互补的序列或与SEQ ID NO:2互补的序列,并且/或者
任选地,其中测序引物位点序列包含Read 1(R1)测序引物位点序列,更任选地,其中测序引物位点序列包含SEQ ID NO:5或SEQ ID NO:6的R1测序引物位点序列;并且/或者
任选地,其中测序引物位点序列包含Read 2(R2)测序引物位点序列,更任选地,其中测序引物位点序列包含SEQ ID NO:7或SEQ ID NO:8的R2测序引物位点序列;并且/或者
任选地,其中空间地址序列包含8个至50个核苷酸,还更任选地,其中空间地址序列包含10个至30个核苷酸;并且/或者
任选地,组织放置在附连到小珠芯片的顶部的可去除孵育室中,其中小珠芯片的不同节段包括可去除孵育室并且/或者小珠芯片的不同节段包括单独的可去除孵育室;并且/或者
任选地,其中细胞膜是通过使用温和清洁剂来溶解的,任选地,其中细胞膜是使用温和清洁剂来溶解的,该温和清洁剂选自NP40、吐温20、胆汁盐、Triton X100和(3-((3-胆酰胺丙基)二甲基铵基)-1-丙烷磺酸盐)(CHAPS)。
25.根据方面24所述的空间转录组学方法,其中小珠芯片具有大于300000的特征密度(特征/mm2)。
26.根据方面25所述的空间转录组学方法,其中小珠还包含镧系元素纳米磷光体标记。
27.一种检测靶向的RNA和蛋白质的空间多组学方法,包括:
(A)将多组经镧系元素纳米磷光体标记的小珠负载到阵列中,其中第一组小珠包含含有衔接子序列、空间地址序列、任选的序列引物位点序列和寡(dT)序列的寡核苷酸,并且第二组小珠包含含有空间地址序列、UMI序列和捕获序列的寡核苷酸;
(B)对寡核苷酸的空间地址序列进行解码以确定该寡核苷酸在阵列中的x,y位置;
(C)将组织放置在小珠的顶部上,并使细胞膜溶解以接近组织中的聚-A RNA转录物和蛋白质;
(D)添加包含与蛋白质靶标特异性结合的条形码核苷酸序列的抗体;
(E)将聚-A RNA转录物捕获到第一组小珠;
(E')通过将抗体的条形码核苷酸序列与捕获序列杂交来将抗体捕获到第二组小珠;
(F)利用oNTPS逆转录包含捕获的聚-A RNA转录物的寡核苷酸;
(G)添加与各组小珠上的寡核苷酸结合的引物,并利用oNTPS来延伸引物;
(H)添加与延伸的引物序列结合的dsDNA染料;以及
(I)通过对各组小珠进行成像和解码来检测靶向的RNA和蛋白质,
任选地,其中纳米粒子为链霉抗生物素蛋白包被的小珠,更任选地,其中纳米粒子为链霉抗生物素蛋白包被的磁性小珠;并且/或者
任选地,其中该衔接子序列包含P5衔接子序列或者包含P7衔接子序列,更任选地,其中该衔接子序列包含与SEQ ID NO:1至SEQ ID NO:4的序列98%相同的序列,还更任选地,其中该衔接子序列包含SEQ ID NO:1或SEQ ID NO:2的序列;并且/或者
任选地,其中测序引物位点序列包含Read 1(R1)测序引物位点序列,更任选地,其中测序引物位点序列包含SEQ ID NO:5或SEQ ID NO:6的R1测序引物位点序列;并且/或者
任选地,其中测序引物位点序列包含Read 2(R2)测序引物位点序列,更任选地,其中测序引物位点序列包含SEQ ID NO:7或SEQ ID NO:8的R2测序引物位点序列;并且/或者
任选地,其中测序引物位点序列包含Read 1(R1)测序引物位点序列,更任选地,其中测序引物位点序列包含SEQ ID NO:5或SEQ ID NO:6的R1测序引物位点序列;并且/或者
任选地,其中测序引物位点序列包含Read 2(R2)测序引物位点序列,更任选地,其中测序引物位点序列包含SEQ ID NO:7或SEQ ID NO:8的R2测序引物位点序列;并且/或者
任选地,其中UMI序列包含8个至20个核苷酸,更任选地,其中UMI序列包含8个至16个核苷酸;并且/或者
任选地,其中空间地址序列包含8个至50个核苷酸,还更任选地,其中空间地址序列包含10个至30个核苷酸;并且/或者
任选地,其中寡d(T)序列包含16个至20个核苷酸;并且/或者
任选地,其中细胞膜是通过使用温和清洁剂来溶解的,任选地,其中细胞膜是使用温和清洁剂来溶解的,该温和清洁剂选自NP40、吐温20、胆汁盐、Triton X100和(3-((3-胆酰胺丙基)二甲基铵基)-1-丙烷磺酸盐)(CHAPS);并且/或者
任选地,其中条形码核苷酸序列包含5个至20个核苷酸,更任选地,其中条形码核苷酸序列包含10个至15个核苷酸;并且/或者
任选地,其中dsDNA染料为基于花菁的染料,更任选地,其中dsDNA染料为选自SYBRGreen I、PicoGreen、SYBR Safe、SYBR Gold、噻唑橙、噁唑黄、Safe-Green和Chai Green的基于花菁的染料。
28.根据方面27所述的空间多组学方法,其中dsDNA染料为Picogreen。
29.根据方面27或方面28所述的空间多组学方法,其中对各组小珠进行成像和解码是同时地执行的。
30.根据方面27至29中任一项所述的空间多组学方法,其中步骤(E)和步骤(E')是相继地或同时地执行的。
31.一种用于对空间定址的纳米粒子进行原位解码的方法,包括:
(A)将包含固定寡核苷酸的纳米粒子输注到组织中,寡核苷酸包含衔接子序列、序列引物位点序列、空间地址序列和寡d(T)序列;
(B)通过将组织中的mRNA与寡核苷酸的寡d(T)序列杂交来原位捕获mRNA;
(C)原位逆转录包含捕获的聚-A RNA转录物的寡核苷酸以形成纳米粒子结合的cDNA构建体;
(D)通过以下对cDNA构建体进行原位映射:
(i)对空间地址序列进行直接原位测序;或者
(ii)使用杂交解码方法以对空间地址序列进行原位解码;以及
(E)利用清洁剂和蛋白酶K来消化组织,并分离带标签的构建体;
(F)从纳米粒子中分出cDNA构建体,对cDNA构建体进行文库制备,并对cDNA构建体进行测序,
任选地,其中纳米粒子为链霉抗生物素蛋白包被的小珠,更任选地,其中纳米粒子为链霉抗生物素蛋白包被的磁性小珠;并且/或者
任选地,其中该衔接子序列包含P5衔接子序列或者包含P7衔接子序列,更任选地,其中该衔接子序列包含与SEQ ID NO:1至SEQ ID NO:4的序列98%相同的序列,还更任选地,其中该衔接子序列包含SEQ ID NO:1或SEQ ID NO:2的序列;并且/或者
任选地,其中测序引物位点序列包含Read 1(R1)测序引物位点序列,更任选地,其中测序引物位点序列包含SEQ ID NO:5或SEQ ID NO:6的R1测序引物位点序列;并且/或者
任选地,其中测序引物位点序列包含Read 2(R2)测序引物位点序列,更任选地,其中测序引物位点序列包含SEQ ID NO:7或SEQ ID NO:8的R2测序引物位点序列;并且/或者
任选地,其中空间地址序列包含8个至50个核苷酸,还更任选地,其中空间地址序列包含10个至30个核苷酸;并且/或者
任选地,其中寡d(T)序列包含16个至20个核苷酸;并且/或者
任选地,其中清洁剂为吐温20和/或Triton X100。
32.一种用于对空间定址的纳米粒子进行原位解码的方法,包括:
(A)将包含多组固定寡核苷酸的纳米粒子输注到组织中,多组固定寡核苷酸包括:
第一组寡核苷酸,其包含衔接子序列、序列引物位点、空间地址序列和寡d(T)序列;
第二组寡核苷酸,其包含空间地址序列和Sbs/ME序列;
任选的第三组寡核苷酸,其包含衔接子序列、空间地址序列和Sbs/ME序列,
其中第一组寡核苷酸和第三组寡核苷酸通过可选择性裂解的接头附接到纳米粒子,并且其中第二组寡核苷酸不通过可选择性裂解的接头附接到纳米粒子;
(B)通过将组织中的mRNA与第一组寡核苷酸的寡d(T)序列杂交来原位捕获mRNA;
(C)原位逆转录包含捕获的聚-A RNA转录物的寡核苷酸以形成纳米粒子结合的cDNA构建体;
(D)通过裂解可裂解的接头从纳米粒子中异位提取cDNA构建体并从纳米粒子中分出cDNA构建体;
(E)通过以下对第二组寡核苷酸进行原位映射:
(i)对空间地址序列进行直接原位测序;或者
(ii)使用杂交解码方法以对空间地址序列进行原位解码;以及
(F)对cDNA构建体进行文库制备并对cDNA构建体进行测序,
任选地,其中纳米粒子为链霉抗生物素蛋白包被的小珠,更任选地,其中纳米粒子为链霉抗生物素蛋白包被的磁性小珠;并且/或者
任选地,其中该衔接子序列包含P5衔接子序列或者包含P7衔接子序列,更任选地,其中该衔接子序列包含与SEQ ID NO:1至SEQ ID NO:4的序列98%相同的序列,还更任选地,其中该衔接子序列包含SEQ ID NO:1或SEQ ID NO:2的序列;并且/或者
任选地,其中测序引物位点序列包含Read 1(R1)测序引物位点序列,更任选地,其中测序引物位点序列包含SEQ ID NO:5或SEQ ID NO:6的R1测序引物位点序列;并且/或者
任选地,其中测序引物位点序列包含Read 2(R2)测序引物位点序列,更任选地,其中测序引物位点序列包含SEQ ID NO:7或SEQ ID NO:8的R2测序引物位点序列;并且/或者
任选地,其中空间地址序列包含8个至50个核苷酸,还更任选地,其中空间地址序列包含10个至30个核苷酸;并且/或者
任选地,其中寡d(T)序列包含16个至20个核苷酸;并且/或者
任选地,可选择性裂解的接头选自基于生物素的分子、PC接头以及稀有切割酶的辨识位点,更任选地,可选择性裂解的接头包含脱硫生物素分子(ddBio);并且/或者
任选地,其中可选择性裂解的接头可通过加热、竞争性结合、pH改变、化学裂解、酶裂解和/或光裂解来裂解,更任选地,其中可选择性裂解的接头可通过竞争性结合和加热来裂解,更任选地,可选择性裂解的接头通过添加生物素和加热来裂解。
33.根据方面31或方面32所述的方法,其中纳米粒子是利用针对内吞和胞内运输的生物触发剂或者利用针对特定亚细胞器的靶向部分或配体来官能化的。
34.根据方面31至33中任一项所述的方法,其中纳米粒子还包含镧系元素纳米磷光体标记或Q点粒子。
35.一种在小珠芯片上使用异位空间捕获的空间基因组学方法,包括:
(A)将小珠负载到小珠芯片的孔中,其中小珠包含通过可选择性裂解的接头附接到纳米粒子的寡核苷酸,寡核苷酸包含第一衔接子序列、空间地址序列和第一捕获序列;
(B)对寡核苷酸的空间地址序列进行解码以确定小珠的x,y位置;
(C)将组织放置于小珠芯片的经切片区域中,使细胞膜溶解,并添加包含第二衔接子序列、任选的UMI序列、样本索引序列和第二捕获序列的寡核苷酸的非栓系池,其中第一捕获序列和第二捕获序列与生物分子的不同部分结合;
(D)将生物分子捕获到寡核苷酸的第一捕获序列和第二捕获序列;
(E)将第一捕获序列延伸和/或连接到第二捕获序列以形成构建体,该构建体包含第一衔接子序列、空间地址序列、第一捕获序列、感兴趣的空位或桥分子、第二捕获序列、任选的UMI序列和第二衔接子序列;以及
(F)通过使用测序仪对构建体进行测序并将测序读段与小珠的x,y位置进行映射来异位获得组织的空间基因组学信息,
任选地,其中孔为纳米孔;并且/或者
任选地,其中第一衔接子序列包含P5衔接子序列并且第二衔接子序列包含P7衔接子序列,或者反之亦然,更任选地,其中第一衔接子序列包含SEQ ID NO:1的序列并且第二衔接子序列包含SEQ ID NO:2的序列,或者反之亦然;并且/或者
任选地,其中UMI序列包含8个至20个核苷酸,更任选地,其中UMI序列包含8个至16个核苷酸;并且/或者
任选地,其中空间地址序列包含8个至50个核苷酸,更任选地,其中空间地址序列包含10个至30个核苷酸;并且/或者
任选地,可选择性裂解的接头选自基于生物素的分子、PC接头以及稀有切割酶的辨识位点,更任选地,可选择性裂解的接头包含脱硫生物素分子(ddBio);并且/或者
任选地,其中可选择性裂解的接头可通过加热、竞争性结合、pH改变、化学裂解、酶裂解和/或光裂解来裂解,更任选地,其中可选择性裂解的接头可通过竞争性结合和加热来裂解,更任选地,可选择性裂解的接头通过添加生物素和加热来裂解;并且/或者
任选地,其中细胞膜是通过使用温和清洁剂来溶解的,任选地,其中细胞膜是使用温和清洁剂来溶解的,该温和清洁剂选自NP40、吐温20、胆汁盐、Triton X100和(3-((3-胆酰胺丙基)二甲基铵基)-1-丙烷磺酸盐)(CHAPS)。
36.根据方面35所述的方法,其中第一捕获序列和第二捕获序列具有与靶向的基因的互补序列。
37.根据方面35或方面36所述的方法,其中感兴趣的空位或桥分子包含长度多达千个核苷酸的核苷酸。
38.一种空间基因组学转座酶可及染色质高通量测序测定(ATAC-Seq)方法,包括
(A)提供底物,该底物包含通过可选择性裂解的接头附接到底物的寡核苷酸,该寡核苷酸包含衔接子序列、空间地址序列和转座体杂交区域,其中如果底物为有序底物,则寡核苷酸的空间地址序列是任选的;
(B)对寡核苷酸的空间地址序列进行解码以确定寡核苷酸在底物上的x,y位置,其中如果底物为有序底物,则步骤(B)是任选的;
(C)将组织放置在底物的顶部上,并使细胞膜溶解以接近组织中的染色质区域;
(D)利用转座体复合物将染色质区域标签化以形成标签化片段,并去除转座体复合物;
(E)将组织透化以允许标签化片段扩散到底物;
(F)通过使标签化片段与寡核苷酸的转座体杂交区域杂交来将标签化片段捕获到底物;
(G)加工捕获的标签化片段以制备用于测序的底物结合的基因组文库构建体;
(H)通过选择性裂解该接头从底物释放基因组文库构建体;
(I)通过使用测序仪对基因组文库构建体进行测序并将测序读段与寡核苷酸的x,y位置进行映射来获得组织的空间基因组学信息。
任选地,其中底物的至少一部分包含具有链霉抗生物素蛋白的包被物;并且/或者
任选地,其中该衔接子序列包含P5衔接子序列或者包含P7衔接子序列,更任选地,其中该衔接子序列包含与SEQ ID NO:1至SEQ ID NO:4的序列98%相同的序列,还更任选地,其中该衔接子序列包含SEQ ID NO:1或SEQ ID NO:2的序列;并且/或者
任选地,其中空间地址序列包含8个至50个核苷酸,还更任选地,其中空间地址序列包含10个至30个核苷酸;并且/或者
任选地,其中该转座体杂交区域包含与由转座体复合物产生的多核苷酸的标签化端部互补的序列;并且/或者
任选地,可选择性裂解的接头选自基于生物素的分子、PC接头以及稀有切割酶的辨识位点,更任选地,可选择性裂解的接头包含脱硫生物素分子(ddBio);并且/或者
任选地,其中可选择性裂解的接头可通过加热、竞争性结合、pH改变、化学裂解、酶裂解和/或光裂解来裂解,更任选地,其中可选择性裂解的接头可通过竞争性结合和加热来裂解,更任选地,可选择性裂解的接头通过添加生物素和加热来裂解。
39.根据方面38所述的空间基因组学ATAC-Seq方法,其中转座体复合物为TN5转座体复合物。
40.根据方面38或方面39所述的空间基因组ATAC-Seq方法,其中底物为板、多孔板、载片、流通池或纳米粒子,任选地,其中底物的至少一部分包含链霉抗生物素蛋白包被物。
41.根据方面38至40中任一项所述的空间基因组学ATAC-Seq方法,其中底物包括由缺少固定寡核苷酸的间隙区域隔开的固定寡核苷酸的区域。
42.根据方面41所述的空间基因组学ATAC-Seq方法,其中底物包括由缺失固定寡核苷酸的间隙区域隔开的固定寡核苷酸的岛或簇,并且其中固定寡核苷酸的每个岛或簇具有与固定寡核苷酸的其他岛或簇的空间地址序列不同的空间地址序列。
43.根据方面38至42中任一项所述的空间基因组学ATAC-Seq方法,其中空间地址序列是通过使用杂交解码方法来解码的。
44.根据方面38至41中任一项所述的空间基因组学ATAC-Seq方法,其中底物为有序底物,并且寡核苷酸在底物上的x,y位置是预定的或可易于确定的,而不必在步骤(B)中对空间地址序列进行解码。
45.根据方面38至44中任一项所述的空间基因组学ATAC-Seq方法,其中细胞膜是通过使用温和清洁剂来溶解的,任选地,其中温和清洁剂选自NP40、吐温20、胆汁盐、TritonX100和(3-((3-胆酰胺丙基)二甲基铵基)-1-丙烷磺酸盐)(CHAPS)。
46.根据方面38至45中任一项所述的空间基因组学ATAC-Seq方法,其中组织是通过使用清洁剂和蛋白酶K来透化的,任选地其中清洁剂为吐温20和/或Triton X100。
47.根据方面38至46中任一项所述的空间基因组学ATAC-Seq方法,其中捕获的标签化片段是通过使用顶链连接、与Y形衔接子杂交和空位填充连接步骤来加工的,
任选地,其中顶链连接利用DNA连接酶,并且/或者
任选地,其中空位填充连接步骤包括使用缺少链置换活性的DNA聚合酶、dNTP以及DNA连接酶,更任选地,缺少链置换活性的DNA聚合酶选自基于T4的聚合酶、基于T7的聚合酶、基于Pfu的聚合酶或基于Taq的聚合酶,并且/或者
任选地,其中Y形衔接子在其末端是非互补的,以防止其自连接并因此在退火至寡核苷酸后形成Y形。
48.根据方面38至46中任一项所述的空间基因组学ATAC-Seq方法,其中在测序之前,文库构建体是使用PCR来扩增的。
49.根据方面38至47中任一项所述的空间基因组学ATAC-Seq方法,其中测序仪利用合成测序技术。
50.根据方面38至48中任一项所述的空间基因组学ATAC-Seq方法,其中转座体复合物的杂交区域是通过使用辅助寡核苷酸来初始封闭的,该辅助寡核苷酸然后在步骤(E)中被去除。
51.一种空间多组学转座酶可及染色质高通量测序测定(ATAC-Seq)和RNA-Seq方法,包括:
(A)提供底物,该底物包含通过可选择性裂解的接头附接到底物的多组固定寡核苷酸,其中该底物包含:第一组寡核苷酸,其包含第一衔接子序列、空间地址序列和转座体复合物杂交区域;和第二组寡核苷酸,其包含第二衔接子序列、测序引物位点序列、空间地址序列、唯一分子标识符(UMI)序列和寡(dT)序列,其中如果底物为有序底物,则第一组寡核苷酸和/或第二组寡核苷酸的空间地址序列是任选的;
(B)对寡核苷酸的空间地址序列进行解码以确定寡核苷酸在底物上的x,y位置,其中如果底物为有序底物,则步骤(B)是任选的;
(C)将组织放置在底物的顶部上,并使细胞膜溶解以接近组织中的聚-A RNA转录物和染色质区域;
(D)利用第一转座体复合物将染色质区域标签化以形成标签化片段,并去除第一转座体复合物;
(E)将组织透化以允许标签化片段和聚-A RNA转录物扩散到底物;
(F)通过(i)使标签化片段与第一组寡核苷酸的转座体杂交区域杂交以及(ii)使聚-A RNA转录物与第二组寡核苷酸的寡(dT)序列杂交来将标签化片段和聚-A RNA转录物捕获到底物;
(G')加工包含捕获的标签化片段的第一组寡核苷酸以制备用于测序的底物结合的基因组文库构建体;
(G”)在单链模板转换寡核苷酸的存在下逆转录包含捕获的聚-A RNA转录物的第二组寡核苷酸以制备用于测序的底物结合的cDNA文库构建体;
(H)通过选择性裂解该接头从底物释放基因组文库构建体和cDNA文库构建体;
(I)使用PCR来扩增基因组文库构建体和cDNA文库构建体,并将经扩增的产物分裂为包含两种经扩增的构建体的两个部分;
(J)利用第一衔接子引物和第二衔接子引物扩增经扩增的构建体的第一部分以形成ATAC-Seq文库,其中第一衔接子引物和第二衔接子引物分别与第一衔接子序列和第二衔接子序列结合,并且其中第一衔接子引物和/或第二衔接子引物还包含索引序列和/或测序引物位点序列;
(J')利用包含序列引物序列的引物以及转座体复合物(TSM)将经扩增的构建体的第二部分标签化,并随后使用PCR利用包含测序引物位点序列的第一衔接子引物以及包含索引序列和测序引物位点序列的第二衔接子引物来扩增标签化的经扩增的文库构建体以形成RNA-Seq文库,其中第一衔接子引物和第二衔接子引物具有差异序列引物序列;以及
(K)通过使用测序仪对ATAC-Seq文库和RNA-Seq文库进行测序并将测序读段与寡核苷酸的x,y位置进行映射来获得多组学信息,
任选地,其中第一衔接子序列包含P5衔接子序列并且第二衔接子序列包含P7衔接子序列,或者反之亦然,更任选地,其中第一衔接子序列包含SEQ ID NO:1的序列并且第二衔接子序列包含SEQ ID NO:2的序列,或者反之亦然;并且/或者
任选地,其中第一衔接子引物包含互补的P5衔接子序列并且第二衔接子引物包含互补的P7衔接子序列,或者反之亦然,更任选地,其中第一衔接子引物包含与SEQ ID NO:1互补的序列并且第二衔接子引物包含与SEQ ID NO:2互补的序列,或者反之亦然;并且/或者
任选地,其中UMI序列包含8个至20个核苷酸,更任选地,其中UMI序列包含8个至16个核苷酸;并且/或者
任选地,其中空间地址序列包含8个至50个核苷酸,还更任选地,其中空间地址序列包含10个至30个核苷酸;并且/或者
任选地,其中该转座体杂交区域包含与由转座体复合物产生的多核苷酸的标签化端部互补的序列;并且/或者
任选地,其中第一衔接子引物的测序引物位点序列包含Read 1(R1)测序引物位点序列;并且/或者
任选地,其中第二衔接子序列的测序引物位点序列包含Read 2(R2)测序引物位点序列;并且/或者
任选地,其中索引序列包含6个至10个核苷酸;并且/或者
任选地,可选择性裂解的接头选自基于生物素的分子、PC接头以及稀有切割酶的辨识位点,更任选地,可选择性裂解的接头包含脱硫生物素分子(ddBio);并且/或者
任选地,其中可选择性裂解的接头可通过加热、竞争性结合、pH改变、化学裂解、酶裂解和/或光裂解来裂解,更任选地,其中可选择性裂解的接头可通过竞争性结合和加热来裂解,更任选地,可选择性裂解的接头通过添加生物素和加热来裂解。
52.根据方面51所述的空间多组学ATAC-Seq和RNA-Seq方法,其中转座体复合物为TN5转座体复合物。
53.根据方面51或方面52所述的空间多组学ATAC-Seq和RNA-Seq方法,其中底物为板、多孔板、载片、流通池或纳米粒子,任选地,其中底物的至少一部分包含链霉抗生物素蛋白包被物。
54.根据方面51至53中任一项所述的空间基因组学ATAC-Seq方法,其中底物包括由缺少固定寡核苷酸的间隙区域隔开的固定寡核苷酸的区域。
55.根据方面54所述的空间多组学ATAC-Seq和RNA-Seq方法,其中底物包括由缺少固定寡核苷酸的间隙区域隔开的两组固定寡核苷酸的岛或簇,并且其中固定寡核苷酸的每个岛或簇具有与固定寡核苷酸的其他岛或簇的空间地址序列不同的空间地址序列。
56.根据方面51至55中任一项所述的空间多组学ATAC-Seq和RNA-Seq方法,其中空间地址序列是通过使用杂交解码方法来解码的。
57.根据方面51或方面52所述的空间多组学ATAC-Seq和RNA-Seq方法,其中底物为有序底物,并且寡核苷酸在底物上的x,y位置是预定的或可易于确定的,而不必在步骤(B)中对空间地址序列进行解码。
58.根据方面51至57中任一项所述的空间多组学ATAC-Seq和RNA-Seq方法,其中细胞膜是通过使用温和清洁剂来溶解的,任选地,其中细胞膜是使用温和清洁剂来溶解的,该温和清洁剂选自NP40、吐温20、胆汁盐、Triton X100和(3-((3-胆酰胺丙基)二甲基铵基)-1-丙烷磺酸盐)(CHAPS)。
59.根据方面51至58中任一项所述的空间多组学ATAC-Seq和RNA-Seq方法,其中组织是通过使用清洁剂和蛋白酶K来透化的,任选地其中清洁剂为吐温20和/或Triton X100。
60.根据方面51至59中任一项所述的空间多组学ATAC-Seq和RNA-Seq方法,其中捕获的标签化片段是通过使用顶链连接、与Y形衔接子杂交和空位填充连接步骤来加工的。
任选地,其中顶链连接利用DNA连接酶,并且/或者
任选地,其中空位填充连接步骤包括使用缺少链置换活性的DNA聚合酶、dNTP以及DNA连接酶,更任选地,缺少链置换活性的DNA聚合酶选自基于T4的聚合酶、基于T7的聚合酶、基于Pfu的聚合酶或基于Taq的聚合酶,并且/或者
任选地,其中Y形衔接子e在其末端是非互补的,以防止其自连接并因此在退火至寡核苷酸后形成Y形。
61.根据方面51至60中任一项所述的空间多组学ATAC-Seq和RNA-Seq方法,其中在测序之前,文库构建体是使用PCR来扩增的。
62.根据方面51至61中任一项所述的空间多组学ATAC-Seq和RNA-Seq方法,其中测序仪利用合成测序技术。
63.根据方面51至62中任一项所述的空间多组学ATAC-Seq和RNA-Seq方法,其中转座体复合物的杂交区域是通过使用辅助寡核苷酸来初始封闭的,该辅助寡核苷酸然后在步骤(E)中被去除。
64.根据方面51至63中任一项所述的空间多组学ATAC-Seq和RNA-Seq方法,其中步骤(G)和步骤(G')是相继地或并发地执行的。
65.根据方面51至64中任一项所述的空间多组学ATAC-Seq和RNA-Seq方法,其中步骤(J)和步骤(J')是相继地或并发地执行的。
66.根据方面51至65中任一项所述的空间多组学ATAC-Seq和RNA-Seq方法,其中寡d(T)序列为16个至20个核苷酸。
67.一种空间转录组学方法,包括:
(A)提供包含特征的底物,其中寡核苷酸固定在底物的特征上,其中寡核苷酸包含衔接子序列、空间地址序列、任选的序列引物位点和寡(dT)序列,其中如果底物为有序底物,则寡核苷酸的空间地址序列是任选的;
(B)对寡核苷酸的空间地址序列进行解码以确定该寡核苷酸在底物上的x,y位置,其中如果底物为有序底物,则步骤(B)是任选的;
(C)将组织放置于底物上,并使细胞膜溶解以接近组织中的聚-A RNA转录物;
(D)将聚-A RNA转录物捕获到寡核苷酸;
(E)逆转录包含捕获的聚-A RNA转录物的寡核苷酸:(i)在单链模板转换寡核苷酸的存在下,以制备用于测序的底物结合的cDNA文库构建体,或(ii)进一步执行与单链寡核苷酸的单链连接反应以制备用于测序的底物结合的cDNA文库构建体;
(F)使用PCR利用衔接子引物来扩增寡核苷酸结合的cDNA文库构建体;
(G)通过使用测序仪对经扩增的cDNA文库构建体进行测序并将测序读段与寡核苷酸在底物的特征上的x,y位置进行映射来获得转录组学信息,
任选地,其中底物的至少一部分包含链霉抗生物素蛋白包被物;并且/或者
任选地,其中衔接子序列包含P5衔接子序列或者包含P7衔接子序列,更任选地,其中该衔接子序列包含与SEQ ID NO:1至SEQ ID NO:4的序列98%相同的序列,还更任选地,其中衔接子序列包含SEQ ID NO:1或SEQ ID NO:2的序列;并且/或者
任选地,其中衔接子引物包含互补的P5衔接子序列或互补的P7衔接子序列,更任选地,其中第一衔接子引物包含与SEQ ID NO:1互补的序列或与SEQ ID NO:2互补的序列,并且/或者
任选地,其中空间地址序列包含8个至50个核苷酸,还更任选地,其中空间地址序列包含10个至30个核苷酸;并且/或者
任选地,组织放置在附连到底物的顶部上的可去除孵育室中;并且/或者
任选地,其中细胞膜是通过使用温和清洁剂来溶解的,任选地,其中细胞膜是使用温和清洁剂来溶解的,该温和清洁剂选自NP40、吐温20、胆汁盐、Triton X100和(3-((3-胆酰胺丙基)二甲基铵基)-1-丙烷磺酸盐)(CHAPS)。
68.根据方面67所述的空间转录组学方法,其中底物为微阵列、板、多孔板或流通池。
69.根据方面67或方面68所述的空间多组学ATAC-Seq和RNA-Seq方法,其中底物为有序底物,并且寡核苷酸在底物的特征上的x,y位置是预定的或可易于确定的,而不必在步骤(B)中对空间地址序列进行解码。
70.根据方面67至69中任一项所述的空间转录组学方法,其中底物具有大于300000的特征密度(特征/mm2)。
71.根据方面67至69中任一项所述的空间转录组学方法,其中寡核苷酸和/或底物的特征还包含镧系元素纳米磷光体标记。
72.一种检测靶向的RNA和蛋白质的空间多组学方法,包括:
(A)提供包含具有镧系元素纳米磷光体标记的特征的底物,其中特征包含多组固定寡核苷酸,其中第一组寡核苷酸包含衔接子序列、空间地址序列、任选的序列引物位点和寡(dT)序列,并且第二组寡核苷酸包含空间地址序列、UMI序列和捕获序列,并且其中如果底物为有序底物,则第一组寡核苷酸和/或第二组寡核苷酸的空间地址序列是任选的;
(B)对寡核苷酸的空间地址序列进行解码以确定该寡核苷酸在底物上的x,y位置,其中如果底物为有序底物,则步骤(B)是任选的;
(C)将组织放置在底物的顶部上,并使细胞膜溶解以接近组织中的聚-A RNA转录物和蛋白质;
(D)添加包含与靶向的蛋白质特异性结合的条形码核苷酸序列的抗体;
(E)将聚-A RNA转录物捕获到第一组寡核苷酸;
(E')通过将抗体的条形码核苷酸序列与捕获序列杂交来将抗体捕获到第二组寡核苷酸;
(F)利用oNTPS逆转录包含捕获的聚-A RNA转录物的寡核苷酸;(F)添加与底物的特征上的寡核苷酸结合的引物,并利用oNTPS来延伸引物;
(H)添加与延伸的引物序列结合的dsDNA染料;以及
(I)通过成像来检测靶向的RNA和蛋白质,并确定第一组寡核苷酸和第二组寡核苷酸在底物的特征上的x,y位置,
任选地,其中底物的至少一部分包含链霉抗生物素蛋白包被物;并且/或者
任选地,其中衔接子序列包含P5衔接子序列或者包含P7衔接子序列,更任选地,其中该衔接子序列包含与SEQ ID NO:1至SEQ ID NO:4的序列98%相同的序列,还更任选地,其中衔接子序列包含SEQ ID NO:1或SEQ ID NO:2的序列;并且/或者
任选地,其中UMI序列包含8个至20个核苷酸,更任选地,其中UMI序列包含8个至16个核苷酸;并且/或者
任选地,其中空间地址序列包含8个至50个核苷酸,还更任选地,其中空间地址序列包含10个至30个核苷酸;并且/或者
任选地,其中寡d(T)序列包含16个至20个核苷酸;并且/或者
任选地,其中细胞膜是通过使用温和清洁剂来溶解的,任选地,其中细胞膜是使用温和清洁剂来溶解的,该温和清洁剂选自NP40、吐温20、胆汁盐、Triton X100和(3-((3-胆酰胺丙基)二甲基铵基)-1-丙烷磺酸盐)(CHAPS);并且/或者
任选地,其中条形码核苷酸序列包含5个至20个核苷酸,更任选地,其中条形码核苷酸序列包含10个至15个核苷酸。
73.根据方面72所述的空间多组学方法,其中底物为微阵列、板、多孔板或流通池。
74.根据方面72或方面73所述的空间多组学方法,其中底物为有序底物,并且寡核苷酸在底物的特征上的x,y位置是预定的或可易于确定的,而不必在步骤(B)中对空间地址序列进行解码。
75.根据方面72至74中任一项所述的空间多组学方法,其中底物具有大于300000的特征密度(特征/mm2)。
76.根据方面72至75中任一项所述的空间多组学方法,其中dsDNA染料为基于花菁的染料。
77.根据方面76所述的空间多组学方法,其中基于花菁的染料选自SYBR Green I、PicoGreen、SYBR Safe、SYBR Gold、噻唑橙、噁唑黄、Safe-Green和Chai Green,任选地,其中dsDNA染料为PicoGreen。
78.根据方面72至77中任一项所述的空间多组学方法,其中步骤(E)和步骤(E')是相继地或并发地执行的。
79.一种用于对空间定址的寡核苷酸进行原位解码的方法,包括:
(A)将寡核苷酸包被的底物输注到组织中,寡核苷酸包被的底物包含固定寡核苷酸,该固定寡核苷酸包含衔接子序列、序列引物位点、空间地址序列和寡d(T)序列;
(B)通过将组织中的mRNA与寡核苷酸的寡d(T)序列杂交来原位捕获mRNA;
(C)原位逆转录包含捕获的聚-A RNA转录物的寡核苷酸以形成底物结合的cDNA构建体;
(D)通过以下对cDNA构建体进行原位映射:
(i)对空间地址序列进行直接原位测序;或者
(ii)使用杂交解码方法以对空间地址序列进行原位解码;以及
(E)利用清洁剂和蛋白酶K来消化组织,并分离底物结合的cDNA构建体;以及
(F)从底物中分出cDNA构建体,对cDNA构建体进行文库制备,并对cDNA构建体进行测序。
任选地,其中底物的至少一部分包含链霉抗生物素蛋白;并且/或者
任选地,其中衔接子序列包含P5衔接子序列或者包含P7衔接子序列,更任选地,其中该衔接子序列包含与SEQ ID NO:1至SEQ ID NO:4的序列98%相同的序列,还更任选地,其中衔接子序列包含SEQ ID NO:1或SEQ ID NO:2的序列;并且/或者
任选地,其中空间地址序列包含8个至50个核苷酸,还更任选地,其中空间地址序列包含10个至30个核苷酸;并且/或者
任选地,其中寡d(T)序列包含16个至20个核苷酸;并且/或者
任选地,其中清洁剂为吐温20和/或Triton X100。
80.根据方面79所述的方法,其中底物的大小为10nm至10μm。
81.根据方面79或方面80所述的方法,其中底物是利用针对内吞和胞内运输的生物触发剂或者利用针对特定亚细胞器的靶向部分或配体来官能化的。
82.根据方面79至82中任一项所述的方法,其中底物或寡核苷酸包含镧系元素纳米磷光体标记或Q点粒子。
83.一种用于对空间定址的寡核苷酸进行原位解码的方法,包括:
(A)将寡核苷酸包被的底物输注到组织中,寡核苷酸包被的底物包含多组固定寡核苷酸组,多组固定寡核苷酸包括:
第一组寡核苷酸,其包含第一衔接子序列、序列引物位点、空间地址序列和寡d(T)序列;
第二组寡核苷酸,其包含空间地址序列和Sbs/ME序列;
任选的第三组寡核苷酸,其包含第一衔接子序列、空间地址序列和Sbs/ME序列,
其中第一组寡核苷酸和第三组寡核苷酸通过可选择性裂解的接头附接到底物,并且其中第二组寡核苷酸不通过可选择性裂解的接头附接到底物;
(B)通过将组织中的mRNA与第一组寡核苷酸的寡d(T)序列杂交来原位捕获mRNA;
(C)原位逆转录包含捕获的聚-A RNA转录物的寡核苷酸以形成底物结合的cDNA构建体;
(D)通过对该可裂解的接头进行选择性裂解从底物中异位提取cDNA构建体并从底物中分出cDNA构建体;
(E)通过以下对第二组寡核苷酸进行原位映射:
(i)对空间地址序列进行直接原位测序;或者
(ii)使用杂交解码方法以对空间地址序列进行原位解码;以及
(F)对cDNA构建体进行文库制备并对cDNA构建体进行测序,
任选地,其中底物的至少一部分包含链霉抗生物素蛋白;并且/或者
任选地,其中衔接子序列包含P5衔接子序列或者包含P7衔接子序列,更任选地,其中该衔接子序列包含与SEQ ID NO:1至SEQ ID NO:4的序列98%相同的序列,还更任选地,其中衔接子序列包含SEQ ID NO:1或SEQ ID NO:2的序列;并且/或者
任选地,其中空间地址序列包含8个至50个核苷酸,还更任选地,其中空间地址序列包含10个至30个核苷酸;并且/或者
任选地,其中寡d(T)序列包含16个至20个核苷酸;并且/或者
任选地,可选择性裂解的接头选自基于生物素的分子、PC接头以及稀有切割酶的辨识位点,更任选地,可选择性裂解的接头包含脱硫生物素分子(ddBio);并且/或者
任选地,其中可选择性裂解的接头可通过加热、竞争性结合、pH改变、化学裂解、酶裂解和/或光裂解来裂解,更任选地,其中可选择性裂解的接头可通过竞争性结合和加热来裂解,更任选地,可选择性裂解的接头通过添加生物素和加热来裂解。
84.根据方面83所述的方法,其中底物的大小为10nm至10μm。
85.根据方面83或方面85所述的方法,其中底物是利用针对内吞和胞内运输的生物触发剂或者利用针对特定亚细胞器的靶向部分或配体来官能化的。
86.根据方面83至85中任一项所述的方法,其中底物或寡核苷酸包含镧系元素纳米磷光体标记或Q点粒子。
87.一种在底物上使用异位空间捕获的空间基因组学方法,包括:
(A)提供包含特征的底物,其中特征包含通过可选择性裂解的接头附接到底物的特征的固定寡核苷酸,寡核苷酸包含第一衔接子序列、空间地址序列和第一捕获序列,其中如果底物为有序底物,则寡核苷酸的空间地址序列是任选的;
(B)对寡核苷酸的空间地址序列进行解码以确定小珠的x,y位置,其中如果底物为有序底物,则步骤(B)是任选的;
(C)将组织放置在底物上,使细胞膜溶解,并添加包含第二衔接子序列、任选的UMI序列、样本索引序列和第二捕获序列的寡核苷酸的非栓系池,其中第一捕获序列和第二捕获序列与生物分子的不同部分结合;
(D)将生物分子捕获到寡核苷酸的第一捕获序列和第二捕获序列;
(E)将第一捕获序列延伸和/或连接到第二捕获序列以形成构建体,该构建体包含第一衔接子序列、空间地址序列、第一捕获序列、感兴趣的空位或桥分子、第二捕获序列、任选的UMI序列和第二衔接子序列;以及
(F)通过使用测序仪对构建体进行测序并将测序读段与寡核苷酸的经确定的x,y位置进行映射来异位获得组织的空间基因组学信息,
任选地,其中底物的孔包括链霉抗生物素蛋白包被物;并且/或者
任选地,其中第一衔接子序列包含P5衔接子序列并且第二衔接子序列包含P7衔接子序列,或者反之亦然,更任选地,其中第一衔接子序列包含SEQ ID NO:1的序列并且第二衔接子序列包含SEQ ID NO:2的序列,或者反之亦然;并且/或者
任选地,其中空间地址序列包含8个至50个核苷酸,还更任选地,其中空间地址序列包含10个至30个核苷酸;并且/或者
任选地,可选择性裂解的接头选自基于生物素的分子、PC接头以及稀有切割酶的辨识位点,更任选地,可选择性裂解的接头包含脱硫生物素部分(ddBio);并且/或者
任选地,其中可选择性裂解的接头可通过加热、竞争性结合、pH改变、化学裂解、酶裂解和/或光裂解来裂解,更任选地,其中可选择性裂解的接头可通过竞争性结合和加热来裂解,更任选地,可选择性裂解的接头通过添加生物素和加热来裂解;并且/或者
任选地,其中细胞膜是通过使用温和清洁剂来溶解的,任选地,其中细胞膜是使用温和清洁剂来溶解的,该温和清洁剂选自NP40、吐温20、胆汁盐、Triton X100和(3-((3-胆酰胺丙基)二甲基铵基)-1-丙烷磺酸盐)(CHAPS)。
88.根据方面87所述的空间多组学方法,其中底物为微阵列、板、多孔板或流通池。
89.根据方面87或方面88所述的空间多组学方法,其中底物为有序底物,并且寡核苷酸在底物的特征上的x,y位置是预定的或可易于确定的,而不必在步骤(B)中对空间地址序列进行解码。
90.根据方面87至89中任一项所述的空间多组学方法,其中底物具有大于300000的特征密度(特征/mm2)。
91.根据方面87至90中任一项所述的方法,其中第一捕获序列和第二捕获序列具有与靶向的基因的互补序列。
92.根据方面87至91中任一项所述的方法,其中感兴趣的空位或桥分子包含长度多达千个核苷酸的核苷酸。
以下实施例旨在说明而非限制本公开。尽管它们是可使用方法中的典型方法,但另选地也可使用本领域技术人员已知的其他方法。
实施例
使用基于小珠的阵列执行空间基因组学测定。基于小珠的阵列可用于将空间组学技术扩展到ATAC-Seq(例如,参见图8)。基于小珠的阵列使用包被有经ddBio标记的寡核苷酸的小珠,这些寡核苷酸含有P5序列、空间条形码和转座体杂交区域。用于空间基因组学分析的转座子含有ME序列以及称为Tsm hyb区域的悬伸部。在开始空间基因组学测定之前,将小珠负载到图案化底物中并对空间条形码进行解码。这种解码方法可包括但不限于通过杂交解码和测序解码。在特定实施方案中,解码方法是提出于以下的杂交解码方法:Gunderson等人的(Genome Res.14(5):870-874)(2004))(例如,参见图15)。
接下来,将组织切片放置在小珠阵列的顶部上,并使用温和清洁剂使细胞膜溶解。利用Tn5转座体将开放染色质区域标签化,然后去除Tn5并利用清洁剂和蛋白酶处理使组织进一步透化。在此过程期间,标签化片段可向下扩散至小珠并通过Tsm hyb区域的杂交被寡核苷酸捕获。可在载片上执行空间基因组学测定的顶链连接、hyb-至-Y和空位填充连接步骤。然后利用加热+添加生物素来释放寡核苷酸以超过ddBio,并且可在管中执行PCR。对最终文库进行定量,并且随后将其负载到测序仪上以产生空间基因组学信息。
一个可能的关注是Tn5转座体可能在将细胞核标签化之前与小珠阵列杂交。解决这一点的一种方式是首先利用辅助寡核苷酸封闭转座体上的杂交区域。在标签化后,可洗掉过量的转座体,然后可在SDS/蛋白酶处理步骤期间将辅助寡核苷酸熔化掉。另选地,可将组织安置在单独的表面(例如,盖片)上,并随后在组织的标签化和洗涤后将其转移到小珠阵列。
使用基于小珠的阵列执行空间多组学测定。上述ATAC-Seq工作流程可修改为空间多组学测定。例如,多组学测定可提供来自ATAC-Seq/RNA-Seq两者的信息,随后的文库制备步骤围绕SNARE-Seq方法来建模(例如,参见图9)。对于此测定,从上方对小珠进行轻微修饰,使得在每个小珠上存在两种类型的寡核苷酸,两者均具有相同的空间条形码。gDNA捕获寡核苷酸与上述相同,但此外还存在具有P5测序引物和R1测序引物的mRNA捕获寡核苷酸,之后是空间条形码、UMI和寡(dT)序列。此类型的小珠的组装可通过修改用于小珠组装的分裂-池化技术来实现。在一种方法中,通过对两种寡核苷酸类型使用不同的接头区域,赋予组装特异性(例如,参见图10)。在第二种方法中,通过合并封闭/去封闭步骤允许使用相同的接头序列,减少必须合成的唯一寡核苷酸的数目(例如,参见图11)。此方法还可赋予寡核苷酸组装的改善的特异性。空间多组学测定使用两种类型的转座体,一种类型具有Tsm hyb区域,并且另一类型具有R2测序引物。首先,将组织切片放置在已如上所述解码的小珠阵列中,之后进行温和细胞溶解(例如,参见图9)。将Tn5转座体添加到组织,之后进行标签化、Tn5去除和组织透化,并通过小珠阵列捕获片段。由于加寡(dT)尾的寡核苷酸也被包括在小珠上,因此聚-A RNA转录物也将被捕获。
空间多组学测定同时提供用于测序的ATAC-Seq和RNA-Seq文库的步骤。利用DNA连接酶进行的顶链连接将空间条形码连接到ATAC-Seq文库的gDNA片段,但对RNA没有影响。接下来的逆转录将RNA片段拷贝到带空间条形码的寡核苷酸上。此步骤也填充针对ATAC-Seq文库的空位,因为逆转录酶可使用ssDNA作为模板并且具有链置换活性。逆转录酶也表现出模板转换活性,因此模板转换寡核苷酸的包括允许向片段的3'端添加PCR引物着陆位点。在此步骤后,使用加热和生物素来释放寡核苷酸,并且可执行PCR以在同一管中扩增ATAC-Seq片段和RNA-Seq片段两者。在PCR扩增后,将产物分裂。一半经历利用P5引物和P7-i7-R2引物的PCR以优先扩增ATAC-Seq文库并添加i7索引。另一半经历利用R2-TSM的标签化,之后进行利用P5-R1引物和P7-i7-R2引物的PCR以优先扩增RNA-Seq文库。然后对样本进行定量并将其负载到测序仪上,并使用引物对ATAC-Seq文库进行测序。在负载在测序仪上之前划分两种文库类型确保覆盖度和读段长度对于每种文库类型均是适当的。这种类型的方法可扩展为测定更多分析物(例如,使用带DNA标签的抗体来测定蛋白质)并通过将适当的捕获序列结合到小珠上来测定特定靶标(例如,参见图1)。
利用基于小珠的基因分型策略进行异位空间捕获的空间组学测定。想法是在文库制备测定中使用x,y空间的附接到捕获探针(例如,LSP1)的识别代码(例如,参见图13)。然后将这些小珠滴入阵列中,并使用杂交解码(例如,参见图15)或测序解码来地x,y位置进行解码。将样本切片放置于阵列上,并将核酸和或蛋白质洗脱至小珠阵列的表面,通过文库制备过程捕获材料,并使用第二探针(例如,LSP2)来捕获感兴趣的序列。从载片回收文库,对感兴趣的位置和SNV(或其他桥连分子)进行测序,并对信号的XY分布进行映射和显示。
产生小珠,该小珠包括p5序列、x,y空间的识别代码(即,地址序列)和第一捕获序列(例如,LSP1),它们利用含生物素的残基拴系于小珠。识别代码通常为10bp至60bp。第一捕获序列通常为25bp至45bp。寡核苷酸可通过序列和阵列附接到小珠,或者小珠池可使用标准小珠池化学来制备。将小珠放置在阵列中,并且使用对x,y位置进行解码。形成寡核苷酸的另一池,该寡核苷酸未拴系于底物并且包含P7序列、第二捕获序列(LSP2)、索引序列且任选地包含UMI标签。将组织样本切片并放置在小珠的顶部上并对其进行处理以释放靶分子(例如,DNA、RNA、多肽),然后通过与捕获序列杂交将该靶分子拴系于小珠。另选地,在放置在小珠的顶部上之前,可利用以mAb加标签的核酸来对组织进行染色。然后添加寡核苷酸的非拴系池并与将其靶分子中的互补序列杂交。洗涤以去除未结合的寡核苷酸和非靶向的分子后,执行延伸和连接步骤以形成构建体(例如,参见图14)。构建体可捕获在小珠上或在文库的载片上的样本片段化孔中。然后对文库构建体进行聚簇和测序。然后对结果进行映射并确定空间数据。
利用使用小珠或基于纳米粒子的阵列的组合式RNA/蛋白质检测的空间多组学测定。图17提供了在基于小珠的阵列中提供对mRNA和抗体的原位扩增和捕获的方法。如图所示,感兴趣的蛋白分析物被抗体原位结合。抗体包含并且可延伸的附加核酸序列。在3个至10个捕获序列延伸循环后,抗体/蛋白质分析物被捕获在小珠上。小珠包含至少2种类型的探针,一种探针可经由附加的核酸序列捕获抗体/蛋白质分析物,而包含寡(dT)捕获部分的另一种探针可直接与mRNA杂交。探针具有地址序列并且因此其x,y位置可在阵列(例如,小珠芯片)上识别。图18和图19提供了前述方法的另外的实施方案,条件是小珠可为具有窄的发射光谱的镧系元素纳米磷光体小珠,并且可基于颜色来识别靶标。镧系元素纳米磷光体小珠的直径为约1μm,并且约100个镧系元素纳米磷光体小珠可装配到具有约10μm的直径的纳米孔中。在将抗体/分析物和RNA捕获到小珠上后,通常通过使用蛋白酶K和SDS来消化掉组织,并利用oNTPs执行cDNA合成。然后扩增oNTP介导的信号,对地址序列进行解码并通过使用dsDNA染料对结合的靶向分析物进行成像。对于前述方法的一些考虑包括以下:空间分辨率、灵敏度和靶标复杂度是相互关联的(更多的靶标→每个与细胞相邻的靶标更少的小珠→降低的分辨率/灵敏度);如果灵敏度、复杂度比空间分辨率更重要,则可增加侧向扩散(例如,通过加热)以允许分析物遇到更多的小珠;可能需要进行扩增以提高灵敏度;并且同时进行解码/检测是可能的,因为dsDNA染料如Picogreen在485nm处激发,而纳米磷光体在280nm/IR处激发。前述方法的一些优点包括:快速且同时的位置解码和标靶检测;减少的COGS和更短、更简单的工作流程(无LP,无测序,无循环杂交/成像);并且该方法利用ILMN小珠/阵列专业知识。
使用对带条形码的纳米粒子的原位解码的空间基因组学。用于对单细胞转录组进行空间映射的方法涉及使用包被有带条形码的寡核苷酸的表面,其中每个条形码的空间位置是已知的。这种方法的一个具体实施是利用小珠阵列,并且组织内的RNA分子扩散到小珠并被含有寡(dT)的带条形码的寡核苷酸捕获。将捕获的RNA逆转录成cDNA,将地址条形码与cDNA序列连接。这之后进行文库制备以及使用下一代测序平台的测序。在分析期间,使用空间条形码来映射所获得的读段的物理位置。还可使用寡核苷酸缀合的抗体或核酸配体以此方法对蛋白质进行映射。前述方法的缺点包括:低灵敏度(即,许多mRNA分子未被检测到);垂直方向上空间信息的丢失;与组织块不相容,组织必须被切片至约10μm并切片被安置在表面上,这是费力且耗时的,使得能够对组织块中的转录组进行映射对于神经科学应用将是尤其有利的,因为神经元过程可跨越多个切片并呈现mRNA转译;以及不能靶向特定亚细胞器。
为了克服前述问题,本公开提供了一种用于空间组学平台和系统的方法,该空间组学平台和系统利用经原位解码的带条形码的寡核苷酸。对于原位方法,将以包被有可结合mRNA(和/或蛋白质或DNA)的带条形码的寡核苷酸的纳米粒子输注到组织。对纳米粒子的3D原位成像可用于对条形码进行解码。可通过逆转录将mRNA拷贝到带条形码的寡核苷酸上;然后从组织中提取cDNA分子,之后进行文库制备和测序以产生空间定位的转录组。通过以带条形码的纳米粒子输注到组织将克服以下问题:低灵敏度,通过将纳米粒子输注在整个组织中可限制mRNA在被带条形码的寡核苷酸结合之前必须行进的距离,从而提高灵敏度;竖直方向上空间信息的损失,可在多个光学平面中执行对小珠的原位成像;与组织块不相容,可将纳米粒子输注到组织块或组织切片中,并且可在3个维度上执行成像;不能靶向特定亚细胞器,纳米粒子可被功能化以靶向特定的亚细胞器。
用于对带条形码的纳米粒子进行原位解码的工作流程。图3提供了用于对带条形码的纳米粒子进行原位解码的示例性工作流程:
(1)产生带空间条形码的捕获小珠/粒子。这些粒子可以是树枝状体、可聚簇的粒子或金纳米粒子或已经用寡核苷酸包被的量子点。另选地,带条形码的捕获小珠/粒子可以是带条形码的环状寡核苷酸,其在组织中扩增以产生带空间条形码的纳米球(例如,参见图4)。
(2)将带空间条形码的捕获小珠/粒子输注到组织中。对于活组织,粒子可利用内吞和细胞内运输的生物触发剂来官能化。它们还可靶向特定亚细胞器。在固定或冷冻的组织中,可在膜透化后将粒子灌注到组织中。扩张技术也可用于扩张组织以改善纳米粒子的渗透。对于带空间条形码的纳米球,可以如下修改方案:将组织与LabelX一起孵育,以实现将RNA锚定于水凝胶;通过在水凝胶中孵育组织,消化蛋白质并去除脂质,以及在ddH2O中扩张,使组织膨胀以便允许带空间条形码的纳米球更好地渗透;添加环状条形码并允许扩散穿过组织;执行滚环扩增并将纳米球可逆地拴系到水凝胶以防止测序期间的移动(诸如利用光激活的拴系和释放)。
(3)以条形码对捕获的材料加标签。mRNA可扩散至纳米粒子并通过聚-dT尾与寡核苷酸杂交。然后该寡核苷酸作为用于逆转录的引物,并且所得的cDNA包括空间条形码。另选方法将为从纳米粒子上裂解寡核苷酸,并使其扩散到组织中并遇到mRNA(例如,参见图4和图5)。这可能是有利的,因为相较于全长mRNA,短寡核苷酸可更容易地扩散穿过组织。然而,对纳米粒子的解码将必须在寡核苷酸释放之前执行,或通过不可裂解的解码寡核苷酸执行(例如,参见图5)。
(4)组织内空间条形码的映射。存在至少三种方式来在组织内映射空间条形码:(a)对附接到小珠的带DNA条形码的寡核苷酸进行直接原位测序。(b)使用多光谱小珠(即,组合镧系元素或Q点粒子),其中每种颜色与特定的DNA条形码序列相关联。对于带空间条形码的纳米球,使用前述技术对空间条形码进行原位解码。这可能难以实现,因为产生足够的唯一颜色以覆盖期望的条形码空间将是具有挑战性的。例如,已证明镧系元素可产生10^3种不同小珠颜色,而10^14个100nm球体可装进5mm立方体中。(c)另选地,可采用基于杂交的解码方案。在此方案中,数字“tango”杂交位点被编码到寡核苷酸上,并且与不同颜色的荧光互补寡核苷酸进行多轮杂交。使用此方法可仅用三个15-mer解码数百万的独特组合,并且这可以潜在地扩展到更高的数目。图6概述了解码方案。单独地,mRNA所拷贝到其上的寡核苷酸引物将具有经由数据库与tango代码相关联的条形码。这样,当对cDNA进行最终测序时,将显示寡核苷酸条形码,实现确定小珠的空间位置。可在测序仪上执行光学z-切片,其中样本在流通池上,但也可利用另一成像平台,诸如光片显微镜。另一考虑是小珠/粒子越小(或在条形码由单个寡核苷酸组成的限度内),在测序/解码步骤期间信号将越低。在这些情况下,可使用随机光学重建显微镜法(STORM)或相关技术。
(5)文库制备和测序。在逆转录后,可利用蛋白酶来消化组织,并在从纳米粒子裂解后从组织中提取cDNA分子。可在管中执行随后的文库制备步骤,之后进行测序。对于带空间条形码的纳米球,利用切割单链DNA的限制酶(如HaeIII)短切纳米球,以释放带空间条形码的寡核苷酸。然后mRNA与寡-d(T)序列结合,之后进行cDNA合成。
利用寡核苷酸从底物释放来增强对RNA分子的捕获的空间转录组学测定。使用带条形码的表面的当前工作流程遭受低灵敏度并且许多RNA分子未在最终的测序文库中检测到。这可能部分是由于在方案的初始步骤中对RNA分子的低效率捕获。在最初的具体实施中,RNA分子必须从组织扩散到小珠阵列上,以便与捕获寡核苷酸杂交。逆转此过程(即,允许寡核苷酸从小珠阵列扩散到组织中)可提高捕获效率,因为带条形码的寡核苷酸比平均mRNA转录物短得多,并且因此可更有效地扩散到组织中(150bp对3kb;参见图12A)。小珠上的双脱硫生物素键允许寡核苷酸以空间受控方式释放。仍然可能出现一些侧向扩散,但是需要进一步的实验工作来确定此方法相对于标准方法的侧向扩散的程度,以及确定灵敏度是否得到改善。
利用组织上方的正极施加电场也可以帮助驱动寡核苷酸深入组织中(例如,参见图12B)。然而,电场也会导致mRNA迁移;在理论上,较短的寡核苷酸应能够捕获较长的mRNA分子,但较短的mRNA片段不能被捕获。另选方法将是向寡核苷酸赋予正电荷,使得在小珠下方施加电场将导致mRNA朝小珠迁移,而带正电荷的空间寡核苷酸将朝组织迁移(例如,参见图12C)。向寡核苷酸赋予正电荷可通过使用带正电荷的肽核酸(PNA)寡核苷酸,使用描述于Ishizuka等人的(Nucleic Acid Research36(5):1464-1471(2008))方法来实现;或者使用附接到带正电荷的金纳米粒子的寡核苷酸,使用描述于Yao等人的(NPG Asia Mater 7:e159(2015))以及Ojea-Jiménez等人的(ACS Nano6(9):7692-7702(2012))方法来实现。这些寡核苷酸可在寡(dT)序列远端的位点处与带空间条形码的寡核苷酸杂交以防止对逆转录的抑制,并且然后在稍后的步骤中去除。另一选项将为将带空间条形码的寡核苷酸合成为PNA/DNA杂交寡核苷酸。另一可能的关注是在由带条形码的寡核苷酸捕获之前片段的侧向扩散,这将降低测定的空间分辨率。侧向扩散程度的一个决定因素是温度;较高的温度导致较大的扩散。当前的空间转录组学工作流程(例如,10x Visium,HDST)在逆转录或透化步骤期间达到高达56℃的温度,该温度匹配在片段捕获之前工作流程中的最高温度(标签化期间的55℃)。尽管将需要实验工作来估计侧向扩散程度,但温度似乎与此类型的工作流程相容。
根据前面的描述,将显而易见的是,可对本文所述的发明进行变型和修改以将其用于各种用途和条件。因此,此类实施方案也在以下权利要求书的范围内。
Claims (92)
1.一种空间基因组学转座酶可及染色质高通量测序测定(ATAC-Seq)方法,包括
(A)将纳米粒子负载到阵列的纳米孔中,其中所述纳米粒子包含通过两个脱硫生物素分子(ddBio)附接到所述纳米粒子的寡核苷酸,所述寡核苷酸包含P5序列、空间地址序列和转座体杂交区域;
(B)对所述寡核苷酸的所述空间地址序列进行解码以确定所述纳米粒子的x,y位置;
(C)将组织放置在所述阵列中的所述纳米粒子的顶部上,并使细胞膜溶解以接近所述组织中的染色质区域;
(D)利用转座体复合物将所述染色质区域标签化以形成标签化片段,并去除所述转座体复合物;
(E)将所述组织透化以允许所述标签化片段扩散到所述阵列中的所述纳米粒子;
(F)通过使所述标签化片段与所述寡核苷酸的所述转座体杂交区域杂交来将所述标签化片段捕获到所述纳米粒子;
(G)加工捕获的标签化片段以制备用于测序的纳米粒子结合的基因组文库构建体;
(H)通过使用加热和添加的生物素从所述纳米粒子释放所述基因组文库构建体;
(I)通过使用测序仪对所述基因组文库构建体进行测序并将测序读段与小珠的所述x,y位置进行映射来获得所述组织的空间基因组学信息。
2.根据权利要求1所述的空间基因组学ATAC-Seq方法,其中所述纳米粒子为小珠。
3.根据权利要求1或权利要求2所述的空间基因组学ATAC-Seq方法,其中所述转座体复合物为TN5转座体复合物。
4.根据前述权利要求中任一项所述的空间基因组学ATAC-Seq方法,其中所述空间地址序列是通过使用杂交解码方法来解码的。
5.根据前述权利要求中任一项所述的空间基因组学ATAC-Seq方法,其中所述细胞膜是通过使用温和清洁剂来溶解的。
6.根据前述权利要求中任一项所述的空间基因组学ATAC-Seq方法,其中所述组织是通过使用清洁剂和蛋白酶K来透化的。
7.根据前述权利要求中任一项所述的空间基因组学ATAC-Seq方法,其中所述捕获的标签化片段是通过使用顶链连接、与Y形衔接子杂交和空位填充连接步骤来加工的。
8.根据前述权利要求中任一项所述的空间基因组学ATAC-Seq方法,其中在测序之前,所述文库构建体是使用PCR来扩增的。
9.根据前述权利要求中任一项所述的空间基因组学ATAC-Seq方法,其中所述测序仪利用合成测序技术。
10.根据前述权利要求中任一项所述的空间基因组学ATAC-Seq方法,其中所述转座体复合物的所述杂交区域是通过使用辅助寡核苷酸来初始封闭的,所述辅助寡核苷酸然后在步骤(E)中被去除。
11.一种空间多组学转座酶可及染色质高通量测序测定(ATAC-Seq)和RNA-Seq方法,包括:
(A)将纳米粒子负载到阵列的纳米孔中,其中所述纳米粒子包含通过两个脱硫生物素分子(ddBio)附接到所述纳米粒子的两组寡核苷酸,第一组寡核苷酸包含P5序列、空间地址序列和转座体杂交区域,第二组寡核苷酸包含P5序列、R1测序引物位点序列、空间地址序列、唯一分子标识符(UMI)序列和寡(dT)序列;
(B)对所述寡核苷酸的所述空间地址序列进行解码以确定所述纳米粒子的x,y位置;
(C)将组织放置在所述阵列中的所述纳米粒子的顶部上,并使细胞膜溶解以接近所述组织中的聚-A RNA转录物和染色质区域;
(D)利用第一转座体复合物将所述染色质区域标签化以形成标签化片段,并去除所述第一转座体复合物;
(E)将所述组织透化以允许所述标签化片段和聚-A RNA转录物扩散到所述阵列中的所述纳米粒子;
(F)通过(i)使所述标签化片段与所述第一组寡核苷酸的所述转座体杂交区域杂交以及(ii)使所述聚-A RNA转录物与所述第二组寡核苷酸的所述寡(dT)序列杂交来将所述标签化片段和聚-A RNA转录物捕获到所述纳米粒子;
(G')加工包含捕获的标签化片段的所述第一组寡核苷酸以制备用于测序的纳米粒子结合的基因组文库构建体;
(G”)在单链模板转换寡核苷酸的存在下逆转录包含捕获的聚-A RNA转录物的所述第二组寡核苷酸以制备用于测序的纳米粒子结合的cDNA文库构建体;
(H)通过使用加热和添加的生物素从所述纳米粒子中释放所述基因组文库构建体和所述cDNA文库构建体;
(I)使用PCR来扩增所述基因组文库构建体和所述cDNA文库构建体,并将经扩增的产物分裂为包含两种经扩增的构建体的两个部分;
(J)利用P5引物和P7-i7-R2引物来扩增所述经扩增的构建体的第一部分以形成ATAC-Seq文库;
(J')利用R2-TSM将所述经扩增的构建体的第二部分标签化,并随后使用PCR利用P5-R1引物和P7-i7-R2引物来扩增标签化的经扩增的文库构建体以形成RNA-Seq文库;以及
(K)通过使用测序仪对所述ATAC-Seq文库和所述RNA-Seq文库进行测序并将测序读段与所述纳米粒子的x,y位置进行映射来获得多组学信息。
12.根据权利要求11所述的空间多组学ATAC-Seq和RNA-Seq方法,其中所述纳米粒子为小珠。
13.根据权利要求11或权利要求12所述的空间多组学ATAC-Seq和RNA-Seq方法,其中所述转座体复合物为TN5转座体复合物。
14.根据权利要求11至13中任一项所述的空间多组学ATAC-Seq和RNA-Seq方法,其中所述空间地址序列是通过使用杂交解码方法来解码的。
15.根据权利要求11至14中任一项所述的空间多组学ATAC-Seq和RNA-Seq方法,其中所述细胞膜是通过使用温和清洁剂来溶解的。
16.根据权利要求11至15中任一项所述的空间多组学ATAC-Seq和RNA-Seq方法,其中所述组织是通过使用清洁剂和蛋白酶K来透化的。
17.根据权利要求11至16中任一项所述的空间多组学ATAC-Seq和RNA-Seq方法,其中所述捕获的标签化片段是通过使用顶链连接、与Y形衔接子杂交和空位填充连接步骤来加工的。
18.根据权利要求11至17中任一项所述的空间多组学ATAC-Seq和RNA-Seq方法,其中在测序之前,所述文库构建体是使用PCR来扩增的。
19.根据权利要求11至18中任一项所述的空间多组学ATAC-Seq和RNA-Seq方法,其中所述测序仪利用合成测序技术。
20.根据权利要求11至19中任一项所述的空间多组学ATAC-Seq和RNA-Seq方法,其中所述转座体复合物的所述杂交区域是通过使用辅助寡核苷酸来初始封闭的,所述辅助寡核苷酸然后在步骤(E)中被去除。
21.根据权利要求11至20中任一项所述的空间多组学ATAC-Seq和RNA-Seq方法,其中步骤(G)和步骤(G')是同时地执行的。
22.根据权利要求11至21中任一项所述的空间多组学ATAC-Seq和RNA-Seq方法,其中步骤(J)和步骤(J')是相继地或并发地执行的。
23.根据权利要求11至22中任一项所述的空间多组学ATAC-Seq和RNA-Seq方法,其中所述寡d(T)序列包含16个至20个核苷酸。
24.一种使用小珠芯片的空间转录组学方法,包括:
(A)将小珠负载到小珠芯片的纳米孔中,其中所述小珠包含寡核苷酸,所述寡核苷酸包含P5或P7序列、空间地址序列、任选的序列引物位点和寡(dT)序列;
(B)对所述寡核苷酸的所述空间地址序列进行解码以确定所述小珠的x,y位置;
(C)将组织放置于所述小珠芯片的hyb-seal切片区域中,并使细胞膜溶解以接近所述组织中的聚-A RNA转录物;
(D)将所述聚-A RNA转录物捕获到所述小珠;
(E)逆转录包含捕获的聚-A RNA转录物的所述寡核苷酸:(i)在单链模板转换寡核苷酸的存在下,以制备用于测序的小珠结合的cDNA文库构建体,或(ii)进一步执行与单链寡核苷酸的单链连接反应以制备用于测序的小珠结合的cDNA文库构建体;
(F)使用PCR利用P5引物或P7引物从hyb-seal切片扩增所述小珠结合的cDNA文库构建体;以及
(G)通过使用测序仪对经扩增的cDNA文库构建体进行测序并将测序读段与所述小珠芯片中的所述小珠的x,y位置进行映射来获得转录组学信息。
25.根据权利要求24所述的空间转录组学方法,其中所述小珠芯片具有大于300000的特征密度(特征/mm2)。
26.根据权利要求25所述的空间转录组学方法,其中所述小珠包含镧系元素纳米磷光体标记。
27.一种检测靶向的RNA和蛋白质的空间多组学方法,包括:
(A)将多组经镧系元素纳米磷光体标记的小珠负载到阵列中,其中第一组小珠包含含有P5衔接子序列或P7衔接子序列、空间地址序列、任选的序列引物位点和寡(dT)序列的寡核苷酸,并且第二组小珠包含含有空间地址序列、UMI序列和捕获序列的寡核苷酸;
(B)将组织放置在所述小珠的顶部上,并使细胞膜溶解以接近所述组织中的聚-A RNA转录物和蛋白质;
(C)添加包含与蛋白质靶标特异性结合的条形码核苷酸序列的抗体;
(D)将所述聚-A RNA转录物捕获到所述第一组小珠;
(D')通过将所述抗体的所述条形码核苷酸序列与所述捕获序列杂交来将所述抗体捕获到所述第二组小珠;
(E)利用oNTPS逆转录包含捕获的聚-A RNA转录物的所述寡核苷酸;
(F)添加与所述组小珠上的寡核苷酸结合的引物,并利用oNTPS来延伸所述引物;
(G)添加与延伸的引物序列结合的dsDNA染料;以及
(H)通过对所述组小珠进行成像和解码来检测靶向的RNA和蛋白质。
28.根据权利要求27所述的空间多组学方法,其中所述dsDNA染料为PicoGreen。
29.根据权利要求27或权利要求28所述的空间多组学方法,其中对所述组小珠进行成像和解码是同时地执行的。
30.根据权利要求27至29中任一项所述的空间多组学方法,其中步骤(D)和步骤(D')是同时地执行的。
31.一种用于对空间定址的纳米粒子进行原位解码的方法,包括:
(A)将包含固定寡核苷酸的纳米粒子输注到组织中,所述寡核苷酸包含P5序列、R1序列引物位点、空间地址序列和寡d(T)序列;
(B)通过将所述组织中的mRNA与所述寡核苷酸的所述寡d(T)序列杂交来原位捕获mRNA;
(C)原位逆转录包含捕获的聚-A RNA转录物的所述寡核苷酸以形成纳米粒子结合的cDNA构建体;
(D)通过以下对所述cDNA构建体进行原位映射:
(i)对所述空间地址序列进行直接原位测序;或者
(ii)使用杂交解码方法以对所述空间地址序列进行原位解码;以及
(E)利用清洁剂和蛋白酶K来消化所述组织,并分离带标签的构建体;
(F)从所述纳米粒子中分出所述cDNA构建体,对所述cDNA构建体进行文库制备,并对所述cDNA构建体进行测序。
32.一种用于对空间定址的纳米粒子进行原位解码的方法,包括:
(A)将包含多组固定寡核苷酸的纳米粒子输注到组织中,所述多组固定寡核苷酸包括:
第一组寡核苷酸,其包含衔接子序列、序列引物位点、空间地址序列和寡d(T)序列;
第二组寡核苷酸,其包含空间地址序列和Sbs/ME序列;
任选的第三组寡核苷酸,其包含所述衔接子序列、空间地址序列和Sbs/ME序列,
其中所述第一组寡核苷酸和所述第三组寡核苷酸通过可裂解的接头附接到所述纳米粒子,并且其中所述第二组寡核苷酸不通过可裂解的接头附接到所述纳米粒子;
(B)通过将所述组织中的mRNA与所述第一组寡核苷酸的所述寡d(T)序列杂交来原位捕获mRNA;
(C)原位逆转录包含捕获的聚-A RNA转录物的所述寡核苷酸以形成纳米粒子结合的cDNA构建体;
(D)通过裂解所述可裂解的接头从所述纳米粒子中异位提取所述cDNA构建体并从所述纳米粒子中分出所述cDNA构建体;
(E)通过以下对所述第二组寡核苷酸进行原位映射:
(i)对所述空间地址序列进行直接原位测序;或者
(ii)使用杂交解码方法以对所述空间地址序列进行原位解码;以及
(F)对所述cDNA构建体进行文库制备并对所述cDNA构建体进行测序。
33.根据权利要求31或权利要求32所述的方法,其中寡核苷酸包被的纳米粒子是利用针对内吞和胞内运输的生物触发剂或者利用针对特定亚细胞器的靶向部分或配体来官能化的。
34.根据权利要求31至33中任一项所述的方法,其中所述寡核苷酸包被的纳米粒子还包含镧系元素纳米磷光体标记或Q点粒子。
35.一种在小珠芯片上使用异位空间捕获的空间基因组学方法,包括:
(A)将小珠负载到小珠芯片的纳米孔中,其中所述小珠包含通过生物素分子附接到所述纳米粒子的寡核苷酸,所述寡核苷酸包含P5序列、空间地址序列和第一捕获序列;
(B)对所述寡核苷酸的所述空间地址序列进行解码以确定所述小珠的x,y位置;
(C)将组织放置于所述小珠芯片的经切片区域中,使细胞膜溶解,并添加包含P7序列、任选的UMI序列、样本索引序列和第二捕获序列的寡核苷酸的非栓系池,其中所述第一捕获序列和所述第二捕获序列与生物分子的不同部分结合;
(D)将所述生物分子捕获到所述寡核苷酸的所述第一捕获序列和所述第二捕获序列;
(E)将所述第一捕获序列延伸和/或连接到所述第二捕获序列以形成构建体,所述构建体包含所述P5序列、所述空间地址序列、所述第一捕获序列、感兴趣的空位或桥分子、所述第二捕获序列、所述任选的UMI序列和所述P7序列;以及
(F)通过使用测序仪对所述构建体进行测序并将测序读段与所述小珠的x,y位置进行映射来异位获得所述组织的空间基因组学信息。
36.根据权利要求35所述的方法,其中所述第一捕获序列和所述第二捕获序列具有与靶向的基因的互补序列。
37.根据权利要求35或权利要求36所述的方法,其中所述感兴趣的空位或桥分子包含长度多达千个核苷酸的核苷酸。
38.一种空间基因组学转座酶可及染色质高通量测序测定(ATAC-Seq)方法,包括:
(A)提供底物,所述底物包含通过可选择性裂解的接头附接到底物的寡核苷酸,所述寡核苷酸包含衔接子序列、空间地址序列和转座体杂交区域,其中如果所述底物为有序底物,则所述寡核苷酸的所述空间地址序列是任选的;
(B)对所述寡核苷酸的所述空间地址序列进行解码以确定所述寡核苷酸在所述底物上的x,y位置,其中如果所述底物为有序底物,则步骤(B)是任选的;
(C)将组织放置在所述底物的顶部上,并使细胞膜溶解以接近所述组织中的染色质区域;
(D)利用转座体复合物将所述染色质区域标签化以形成标签化片段,并去除所述转座体复合物;
(E)将所述组织透化以允许所述标签化片段扩散到所述底物;
(F)通过使所述标签化片段与所述寡核苷酸的所述转座体杂交区域杂交来将所述标签化片段捕获到所述底物;
(G)加工捕获的标签化片段以制备用于测序的底物结合的基因组文库构建体;
(H)通过选择性裂解所述接头从所述底物释放所述基因组文库构建体;
(I)通过使用测序仪对所述基因组文库构建体进行测序并将测序读段与所述寡核苷酸的x,y位置进行映射来获得所述组织的空间基因组学信息。
39.根据权利要求38所述的空间基因组学ATAC-Seq方法,其中所述转座体复合物为TN5转座体复合物。
40.根据权利要求38或权利要求39所述的空间基因组ATAC-Seq方法,其中所述底物为板、多孔板、载片、流通池或纳米粒子,任选地,其中所述底物的至少一部分包含链霉抗生物素蛋白包被物。
41.根据权利要求38至40中任一项所述的空间基因组学ATAC-Seq方法,其中所述底物包括由缺少固定寡核苷酸的间隙区域隔开的固定寡核苷酸区域。
42.根据权利要求41所述的空间基因组学ATAC-Seq方法,其中所述底物包括由缺少固定寡核苷酸的间隙区域隔开的固定寡核苷酸的岛或簇,并且其中固定寡核苷酸的每个岛或簇具有与固定寡核苷酸的其他岛或簇的空间地址序列不同的空间地址序列。
43.根据权利要求38至42中任一项所述的空间基因组学ATAC-Seq方法,其中所述空间地址序列是通过使用杂交解码方法来解码的。
44.根据权利要求38至41中任一项所述的空间基因组学ATAC-Seq方法,其中所述底物为有序底物,并且所述寡核苷酸在所述底物上的所述x,y位置是预定的或可易于确定的,而不必在步骤(B)中对所述空间地址序列进行解码。
45.根据权利要求38至44中任一项所述的空间基因组学ATAC-Seq方法,其中所述细胞膜是通过使用温和清洁剂来溶解的。
46.根据权利要求38至45中任一项所述的空间基因组学ATAC-Seq方法,其中所述组织是通过使用清洁剂和蛋白酶K来透化的。
47.根据权利要求38至46中任一项所述的空间基因组学ATAC-Seq方法,其中所述捕获的标签化片段是通过使用顶链连接、与Y形衔接子杂交和空位填充连接步骤来加工的。
48.根据权利要求38至47中任一项所述的空间基因组学ATAC-Seq方法,其中在测序之前,所述文库构建体是使用PCR来扩增的。
49.根据权利要求38至48中任一项所述的空间基因组学ATAC-Seq方法,其中所述测序仪利用合成测序技术。
50.根据权利要求38至49中任一项所述的空间基因组学ATAC-Seq方法,其中所述转座体复合物的所述杂交区域是通过使用辅助寡核苷酸来初始封闭的,所述辅助寡核苷酸然后在步骤(E)中被去除。
51.一种空间多组学转座酶可及染色质高通量测序测定(ATAC-Seq)和RNA-Seq方法,包括:
(A)提供底物,所述底物包含通过可选择性裂解的接头附接到所述底物的多组固定寡核苷酸,其中所述底物包含:第一组寡核苷酸,其包含第一衔接子序列、空间地址序列和转座体复合物杂交区域;和第二组寡核苷酸,其包含第二衔接子序列、测序引物位点序列、空间地址序列、唯一分子标识符(UMI)序列和寡(dT)序列,其中如果所述底物为有序底物,则所述第一组寡核苷酸和/或所述第二组寡核苷酸的所述空间地址序列是任选的;
(B)对所述寡核苷酸的所述空间地址序列进行解码以确定所述寡核苷酸在所述底物上的x,y位置,其中如果所述底物为有序底物,则步骤(B)是任选的;
(C)将组织放置在所述底物的顶部上,并使细胞膜溶解以接近所述组织中的聚-A RNA转录物和染色质区域;
(D)利用第一转座体复合物将所述染色质区域标签化以形成标签化片段,并去除所述第一转座体复合物;
(E)将所述组织透化以允许所述标签化片段和聚-A RNA转录物扩散到所述底物;
(F)通过(i)使所述标签化片段与所述第一组寡核苷酸的所述转座体杂交区域杂交以及(ii)使所述聚-A RNA转录物与所述第二组寡核苷酸的所述寡(dT)序列杂交来将所述标签化片段和聚-A RNA转录物捕获到所述底物;
(G')加工包含捕获的标签化片段的所述第一组寡核苷酸以制备用于测序的底物结合的基因组文库构建体;
(G”)在单链模板转换寡核苷酸的存在下逆转录包含捕获的聚-A RNA转录物的所述第二组寡核苷酸以制备用于测序的底物结合的cDNA文库构建体;
(H)通过选择性裂解所述接头从所述底物释放所述基因组文库构建体和所述cDNA文库构建体;
(I)使用PCR来扩增所述基因组文库构建体和所述cDNA文库构建体,并将经扩增的产物分裂为包含两种经扩增的构建体的两个部分;
(J)利用第一衔接子引物和第二衔接子引物扩增所述经扩增的构建体的第一部分以形成ATAC-Seq文库,其中所述第一衔接子引物和所述第二衔接子引物分别与第一衔接子序列和第二衔接子序列结合,并且其中所述第一衔接子引物和/或所述第二衔接子引物还包含索引序列和/或测序引物位点序列;
(J')利用包含序列引物序列的引物以及转座体复合物(TSM)将所述经扩增的构建体的第二部分标签化,并随后使用PCR利用包含测序引物位点序列的所述第一衔接子引物以及包含索引序列和测序引物位点序列的所述第二衔接子引物来扩增标签化的经扩增的文库构建体以形成RNA-Seq文库,其中所述第一衔接子引物和所述第二衔接子引物具有差异序列引物序列;以及
(K)通过使用测序仪对所述ATAC-Seq文库和所述RNA-Seq文库进行测序并将测序读段与所述寡核苷酸的x,y位置进行映射来获得多组学信息。
52.根据权利要求51所述的空间多组学ATAC-Seq和RNA-Seq方法,其中所述转座体复合物为TN5转座体复合物。
53.根据权利要求51或权利要求52所述的空间多组学ATAC-Seq和RNA-Seq方法,其中所述底物为板、多孔板、载片、流通池或纳米粒子,任选地,其中所述底物的至少一部分包含链霉抗生物素蛋白包被物。
54.根据权利要求51至53中任一项所述的空间基因组学ATAC-Seq方法,其中所述底物包括由缺少固定寡核苷酸的间隙区域隔开的固定寡核苷酸区域。
55.根据权利要求54所述的空间多组学ATAC-Seq和RNA-Seq方法,其中所述底物包括由缺少固定寡核苷酸的间隙区域隔开的两组固定寡核苷酸的岛或簇,并且其中所述固定寡核苷酸的每个岛或簇具有与固定寡核苷酸的其他岛或簇的空间地址序列不同的空间地址序列。
56.根据权利要求51至55中任一项所述的空间多组学ATAC-Seq和RNA-Seq方法,其中所述空间地址序列是通过使用杂交解码方法来解码的。
57.根据权利要求51或权利要求52所述的空间多组学ATAC-Seq和RNA-Seq方法,其中所述底物为有序底物,并且所述寡核苷酸在所述底物上的所述x,y位置是预定的或可易于确定的,而不必在步骤(B)中对所述空间地址序列进行解码。
58.根据权利要求51至57中任一项所述的空间多组学ATAC-Seq和RNA-Seq方法,其中所述细胞膜是通过使用温和清洁剂来溶解的。
59.根据权利要求51至58中任一项所述的空间多组学ATAC-Seq和RNA-Seq方法,其中所述组织是通过使用清洁剂和蛋白酶K来透化的。
60.根据权利要求51至59中任一项所述的空间多组学ATAC-Seq和RNA-Seq方法,其中所述捕获的标签化片段是通过使用顶链连接、与Y形衔接子杂交和空位填充连接步骤来加工的。
61.根据权利要求51至60中任一项所述的空间多组学ATAC-Seq和RNA-Seq方法,其中在测序之前,所述文库构建体是使用PCR来扩增的。
62.根据权利要求51至61中任一项所述的空间多组学ATAC-Seq和RNA-Seq方法,其中所述测序仪利用合成测序技术。
63.根据权利要求51至62中任一项所述的空间多组学ATAC-Seq和RNA-Seq方法,其中所述转座体复合物的所述杂交区域是通过使用辅助寡核苷酸来初始封闭的,所述辅助寡核苷酸然后在步骤(E)中被去除。
64.根据权利要求51至63中任一项所述的空间多组学ATAC-Seq和RNA-Seq方法,其中步骤(G)和步骤(G')是相继地或并发地执行的。
65.根据权利要求51至64中任一项所述的空间多组学ATAC-Seq和RNA-Seq方法,其中步骤(J)和步骤(J')是相继地或并发地执行的。
66.根据权利要求51至65中任一项所述的空间多组学ATAC-Seq和RNA-Seq方法,其中所述寡d(T)序列包含16个至20个核苷酸。
67.一种空间转录组学方法,包括:
(A)提供包含特征的底物,其中寡核苷酸固定在所述底物的所述特征上,其中所述寡核苷酸包含衔接子序列、空间地址序列、任选的序列引物位点和寡(dT)序列,其中如果所述底物为有序底物,则所述寡核苷酸的所述空间地址序列是任选的;
(B)对所述寡核苷酸的所述空间地址序列进行解码以确定所述寡核苷酸在所述底物上的x,y位置,其中如果所述底物为有序底物,则步骤(B)是任选的;
(C)将组织放置于所述底物上,并使细胞膜溶解以接近所述组织中的聚-A RNA转录物;
(D)将所述聚-A RNA转录物捕获到所述寡核苷酸;
(E)逆转录包含捕获的聚-A RNA转录物的所述寡核苷酸:(i)在单链模板转换寡核苷酸的存在下,以制备用于测序的底物结合的cDNA文库构建体,或(ii)进一步执行与单链寡核苷酸的单链连接反应以制备用于测序的底物结合的cDNA文库构建体;
(F)使用PCR利用衔接子引物来扩增寡核苷酸结合的cDNA文库构建体;
(G)通过使用测序仪对经扩增的cDNA文库构建体进行测序并将测序读段与所述寡核苷酸在所述底物的所述特征上的x,y位置进行映射来获得转录组学信息。
68.根据权利要求67所述的空间转录组学方法,其中所述底物为微阵列、板、多孔板或流通池。
69.根据权利要求67或权利要求68所述的空间多组学ATAC-Seq和RNA-Seq方法,其中所述底物为有序底物,并且所述寡核苷酸在所述底物的所述特征上的所述x,y位置是预定的或可易于确定的,而不必在步骤(B)中对所述空间地址序列进行解码。
70.根据权利要求67至69中任一项所述的空间转录组学方法,其中所述底物具有大于300000的特征密度(特征/mm2)。
71.根据权利要求67至70中任一项所述的空间转录组学方法,其中寡核苷酸和/或所述底物的所述特征还包含镧系元素纳米磷光体标记。
72.一种检测靶向的RNA和蛋白质的空间多组学方法,包括:
(A)提供包含具有镧系元素纳米磷光体标记的特征的底物,其中所述特征包含多组固定寡核苷酸,其中第一组寡核苷酸包含衔接子序列、空间地址序列、任选的序列引物位点和寡(dT)序列,并且第二组寡核苷酸包含空间地址序列、UMI序列和捕获序列,并且其中如果所述底物为有序底物,则所述第一组寡核苷酸和/或所述第二组寡核苷酸的所述空间地址序列是任选的;
(B)对所述寡核苷酸的所述空间地址序列进行解码以确定所述寡核苷酸在所述底物上的x,y位置,其中如果所述底物为有序底物,则步骤(B)是任选的;
(C)将组织放置在所述底物的顶部上,并使细胞膜溶解以接近所述组织中的聚-A RNA转录物和蛋白质;
(D)添加包含与靶向的蛋白质特异性结合的条形码核苷酸序列的抗体;
(E)将所述聚-A RNA转录物捕获到所述第一组寡核苷酸;
(E')通过将所述抗体的所述条形码核苷酸序列与所述捕获序列杂交来将所述抗体捕获到所述第二组寡核苷酸;
(F)利用oNTPS逆转录包含捕获的聚-A RNA转录物的所述寡核苷酸;
(F)添加与所述底物的所述特征上的寡核苷酸结合的引物,并利用oNTPS来延伸所述引物;
(H)添加与延伸的引物序列结合的dsDNA染料;以及
(I)通过成像来检测靶向的RNA和蛋白质,并确定所述第一组寡核苷酸和所述第二组寡核苷酸在所述底物的所述特征上的所述x,y位置。
73.根据权利要求72所述的空间多组学方法,其中所述底物为微阵列、板、多孔板或流通池。
74.根据权利要求72或权利要求73所述的空间多组学方法,其中所述底物为有序底物,并且所述寡核苷酸在所述底物的所述特征上的所述x,y位置是预定的或可易于确定的,而不必在步骤(B)中对所述空间地址序列进行解码。
75.根据权利要求72至74中任一项所述的空间多组学方法,其中所述底物具有大于300000的特征密度(特征/mm2)。
76.根据权利要求72至75中任一项所述的空间多组学方法,其中所述dsDNA染料为基于花菁的染料。
77.根据权利要求76所述的空间多组学方法,其中所述基于花菁的染料选自SYBRGreen I、PicoGreen、SYBR Safe、SYBR Gold、噻唑橙、噁唑黄、Safe-Green和Chai Green。
78.根据权利要求72至77中任一项所述的空间多组学方法,其中步骤(E)和步骤(E')是相继地或并发地执行的。
79.一种用于对空间定址的寡核苷酸进行原位解码的方法,包括:
(A)将寡核苷酸包被的底物输注到组织中,所述寡核苷酸包被的底物包含固定寡核苷酸,所述固定寡核苷酸包含衔接子序列、序列引物位点、空间地址序列和寡d(T)序列;
(B)通过将所述组织中的mRNA与所述寡核苷酸的所述寡d(T)序列杂交来原位捕获mRNA;
(C)原位逆转录包含捕获的聚-A RNA转录物的所述寡核苷酸以形成底物结合的cDNA构建体;
(D)通过以下对所述cDNA构建体进行原位映射:
(i)对所述空间地址序列进行直接原位测序;或者
(ii)使用杂交解码方法以对所述空间地址序列进行原位解码;以及
(E)利用清洁剂和蛋白酶K来消化所述组织,并分离所述底物结合的cDNA构建体;以及
(F)从所述底物中分出所述cDNA构建体,对所述cDNA构建体进行文库制备,并对所述cDNA构建体进行测序。
80.根据权利要求79所述的方法,其中所述底物的大小为10nm至10μm。
81.根据权利要求79或权利要求80所述的方法,其中所述底物是利用针对内吞和胞内运输的生物触发剂或利用针对特定亚细胞器的靶向部分或配体来官能化的。
82.根据权利要求79至81中任一项所述的方法,其中所述底物或寡核苷酸包含镧系元素纳米磷光体标记或Q点粒子。
83.一种用于对空间定址的寡核苷酸进行原位解码的方法,包括:
(A)将寡核苷酸包被的底物输注到组织中,所述寡核苷酸包被的底物包含多组固定寡核苷酸组,所述多组固定寡核苷酸包括:
第一组寡核苷酸,其包含第一衔接子序列、序列引物位点、空间地址序列和寡d(T)序列;
第二组寡核苷酸,其包含空间地址序列和Sbs/ME序列;
任选的第三组寡核苷酸,其包含所述第一衔接子序列、空间地址序列和Sbs/ME序列,
其中所述第一组寡核苷酸和所述第三组寡核苷酸通过可选择性裂解的接头附接到所述底物,并且其中所述第二组寡核苷酸不通过可选择性裂解的接头附接到所述底物;
(B)通过将所述组织中的mRNA与所述第一组寡核苷酸的所述寡d(T)序列杂交来原位捕获mRNA;
(C)原位逆转录包含捕获的聚-A RNA转录物的所述寡核苷酸以形成底物结合的cDNA构建体;
(D)通过对可裂解的接头进行选择性裂解从所述底物中异位提取所述cDNA构建体并从所述底物中分出所述cDNA构建体;
(E)通过以下对所述第二组寡核苷酸进行原位映射:
(i)对所述空间地址序列进行直接原位测序;或者
(ii)使用杂交解码方法以对所述空间地址序列进行原位解码;以及
(F)对所述cDNA构建体进行文库制备并对所述cDNA构建体进行测序。
84.根据权利要求83所述的方法,其中所述底物的大小为10nm至10μm。
85.根据权利要求83或权利要求84所述的方法,其中所述底物是利用针对内吞和胞内运输的生物触发剂或利用针对特定亚细胞器的靶向部分或配体来官能化的。
86.根据权利要求83至85中任一项所述的方法,其中所述底物或多组寡核苷酸包含镧系元素纳米磷光体标记或Q点粒子。
87.一种在底物上使用异位空间捕获的空间基因组学方法,包括:
(A)提供包含特征的底物,其中所述特征包含通过可选择性裂解的接头附接到所述底物的所述特征的固定寡核苷酸,所述寡核苷酸包含第一衔接子序列、空间地址序列和第一捕获序列,其中如果所述底物为有序底物,则所述寡核苷酸的所述空间地址序列是任选的;
(B)对所述寡核苷酸的所述空间地址序列进行解码以确定小珠的x,y位置,其中如果所述底物为有序底物,则步骤(B)是任选的;
(C)将组织放置在所述底物上,使细胞膜溶解,并添加包含第二衔接子序列、任选的UMI序列、样本索引序列和第二捕获序列的寡核苷酸的非栓系池,其中所述第一捕获序列和所述第二捕获序列与生物分子的不同部分结合;
(D)将所述生物分子捕获到所述寡核苷酸的所述第一捕获序列和所述第二捕获序列;
(E)将所述第一捕获序列延伸和/或连接到所述第二捕获序列以形成构建体,所述构建体包含所述第一衔接子序列、所述空间地址序列、所述第一捕获序列、感兴趣的空位或桥分子、所述第二捕获序列、所述任选的UMI序列和所述第二衔接子序列;以及
(F)通过使用测序仪对所述构建体进行测序并将测序读段与所述寡核苷酸的经确定的x,y位置进行映射来异位获得所述组织的空间基因组学信息。
88.根据权利要求87所述的空间多组学方法,其中所述底物为微阵列、板、多孔板或流通池。
89.根据权利要求87或权利要求88所述的空间多组学方法,其中所述底物为有序底物,并且所述寡核苷酸在所述底物的所述特征上的所述x,y位置是预定的或可易于确定的,而不必在步骤(B)中对所述空间地址序列进行解码。
90.根据权利要求87至89中任一项所述的空间多组学方法,其中所述底物具有大于300000的特征密度(特征/mm2)。
91.根据权利要求87至90中任一项所述的方法,其中所述第一捕获序列和所述第二捕获序列具有与靶向的基因的互补序列。
92.根据权利要求87至91中任一项所述的方法,其中所述感兴趣的空位或桥分子包含长度多达千个核苷酸的核苷酸。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163295831P | 2021-12-31 | 2021-12-31 | |
US63/295831 | 2021-12-31 | ||
PCT/US2022/082546 WO2023130019A2 (en) | 2021-12-31 | 2022-12-29 | Spatial omics platforms and systems |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118451201A true CN118451201A (zh) | 2024-08-06 |
Family
ID=87000335
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202280085868.9A Pending CN118451201A (zh) | 2021-12-31 | 2022-12-29 | 空间组学平台和系统 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN118451201A (zh) |
WO (1) | WO2023130019A2 (zh) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US12060412B2 (en) * | 2016-03-21 | 2024-08-13 | The Broad Institute, Inc. | Methods for determining spatial and temporal gene expression dynamics in single cells |
AU2017345562B2 (en) * | 2016-10-19 | 2024-01-25 | Illumina Singapore Pte. Ltd. | Methods for chemical ligation of nucleic acids |
CN114174531A (zh) * | 2019-02-28 | 2022-03-11 | 10X基因组学有限公司 | 用空间条码化寡核苷酸阵列对生物分析物进行概况分析 |
KR20220136080A (ko) * | 2020-02-03 | 2022-10-07 | 일루미나, 인코포레이티드 | 바이오틴-스트렙타비딘 절단 조성물 및 라이브러리 단편 절단 |
WO2023081863A1 (en) * | 2021-11-05 | 2023-05-11 | New York Genome Center, Inc. | Methods and compositions for molecular interaction mapping using transposase |
-
2022
- 2022-12-29 WO PCT/US2022/082546 patent/WO2023130019A2/en active Application Filing
- 2022-12-29 CN CN202280085868.9A patent/CN118451201A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2023130019A3 (en) | 2023-09-14 |
WO2023130019A2 (en) | 2023-07-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11702693B2 (en) | Methods for printing cells and generating arrays of barcoded cells | |
US11732300B2 (en) | Increasing efficiency of spatial analysis in a biological sample | |
US20230002812A1 (en) | Generating capture probes for spatial analysis | |
EP4107285B1 (en) | Methods and compositions for integrated in situ spatial assay | |
EP4165207B1 (en) | Methods for determining a location of an analyte in a biological sample | |
US20230081381A1 (en) | METHODS TO COMBINE FIRST AND SECOND STRAND cDNA SYNTHESIS FOR SPATIAL ANALYSIS | |
CN107580632B (zh) | 用于全转录组扩增的方法和组合物 | |
AU2017386533B2 (en) | Analysis system for orthogonal access to and tagging of biomolecules in cellular compartments | |
CN113767177A (zh) | 生成用于空间分析的捕获探针 | |
JP5951755B2 (ja) | 定量的ヌクレアーゼプロテクションアッセイ(qNPA)法および定量的ヌクレアーゼプロテクション配列決定(qNPS)法の改善 | |
US20200370105A1 (en) | Methods for performing spatial profiling of biological molecules | |
WO2021237087A1 (en) | Spatial analysis to detect sequence variants | |
CN112840024A (zh) | 单细胞中的核条形码化和捕获 | |
CN115896252A (zh) | 用于组织样本中核酸的局部或空间检测的方法和产品 | |
US20230304072A1 (en) | Methods and compositions related to microsphere surface gelation | |
KR20210061962A (ko) | 화학 조성물 및 이의 사용 방법 | |
CN118451201A (zh) | 空间组学平台和系统 | |
WO2024145553A1 (en) | Materials and methods for preparation of a spatial transcriptomics library | |
WO2024138154A2 (en) | Spatial transposition-based rna sequencing library preparation method | |
WO2024138170A1 (en) | Spatial mrna/protein co-assays using aptamers |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |