CN114807305A - 一种构建原核生物单细胞rna测序文库的方法 - Google Patents
一种构建原核生物单细胞rna测序文库的方法 Download PDFInfo
- Publication number
- CN114807305A CN114807305A CN202210385267.1A CN202210385267A CN114807305A CN 114807305 A CN114807305 A CN 114807305A CN 202210385267 A CN202210385267 A CN 202210385267A CN 114807305 A CN114807305 A CN 114807305A
- Authority
- CN
- China
- Prior art keywords
- sequence
- cell
- rna
- prokaryotic
- sequencing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 66
- 238000012174 single-cell RNA sequencing Methods 0.000 title claims description 14
- 210000004027 cell Anatomy 0.000 claims abstract description 119
- 238000012163 sequencing technique Methods 0.000 claims abstract description 59
- 238000003559 RNA-seq method Methods 0.000 claims abstract description 26
- 210000001236 prokaryotic cell Anatomy 0.000 claims abstract description 15
- 238000010839 reverse transcription Methods 0.000 claims description 37
- 125000002652 ribonucleotide group Chemical group 0.000 claims description 36
- 108091028664 Ribonucleotide Proteins 0.000 claims description 35
- 239000002336 ribonucleotide Substances 0.000 claims description 35
- 239000002299 complementary DNA Substances 0.000 claims description 27
- 230000000295 complement effect Effects 0.000 claims description 20
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 18
- 239000002773 nucleotide Substances 0.000 claims description 18
- 125000003729 nucleotide group Chemical group 0.000 claims description 18
- 230000003321 amplification Effects 0.000 claims description 7
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 7
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 4
- 125000003275 alpha amino acid group Chemical group 0.000 claims 2
- 238000012408 PCR amplification Methods 0.000 claims 1
- 108020004999 messenger RNA Proteins 0.000 abstract 4
- 238000005336 cracking Methods 0.000 abstract 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 29
- 239000003153 chemical reaction reagent Substances 0.000 description 19
- 241000894006 Bacteria Species 0.000 description 15
- 108090000623 proteins and genes Proteins 0.000 description 14
- 239000011324 bead Substances 0.000 description 12
- 230000014509 gene expression Effects 0.000 description 11
- 108020004414 DNA Proteins 0.000 description 10
- 239000000126 substance Substances 0.000 description 10
- 102000004190 Enzymes Human genes 0.000 description 9
- 108090000790 Enzymes Proteins 0.000 description 9
- 229940088598 enzyme Drugs 0.000 description 9
- 239000003921 oil Substances 0.000 description 9
- 101710086015 RNA ligase Proteins 0.000 description 8
- 210000002421 cell wall Anatomy 0.000 description 8
- 239000000523 sample Substances 0.000 description 8
- 102100031780 Endonuclease Human genes 0.000 description 7
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 7
- 239000000203 mixture Substances 0.000 description 7
- 210000001938 protoplast Anatomy 0.000 description 7
- 239000000243 solution Substances 0.000 description 7
- 102000012410 DNA Ligases Human genes 0.000 description 6
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 6
- 108091034117 Oligonucleotide Proteins 0.000 description 6
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 6
- 239000007853 buffer solution Substances 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000011160 research Methods 0.000 description 6
- VYZAMTAEIAYCRO-UHFFFAOYSA-N Chromium Chemical compound [Cr] VYZAMTAEIAYCRO-UHFFFAOYSA-N 0.000 description 5
- 241000588724 Escherichia coli Species 0.000 description 5
- 210000000170 cell membrane Anatomy 0.000 description 5
- 229910052804 chromium Inorganic materials 0.000 description 5
- 239000011651 chromium Substances 0.000 description 5
- 239000005547 deoxyribonucleotide Substances 0.000 description 5
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 5
- 239000011859 microparticle Substances 0.000 description 5
- 230000008823 permeabilization Effects 0.000 description 5
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 4
- 108010061982 DNA Ligases Proteins 0.000 description 4
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 4
- 101000804764 Homo sapiens Lymphotactin Proteins 0.000 description 4
- 102100035304 Lymphotactin Human genes 0.000 description 4
- 229920001213 Polysorbate 20 Polymers 0.000 description 4
- 230000004888 barrier function Effects 0.000 description 4
- 230000001413 cellular effect Effects 0.000 description 4
- 210000000349 chromosome Anatomy 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000007613 environmental effect Effects 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 4
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 4
- 239000000376 reactant Substances 0.000 description 4
- LBCZOTMMGHGTPH-UHFFFAOYSA-N 2-[2-[4-(2,4,4-trimethylpentan-2-yl)phenoxy]ethoxy]ethanol Chemical compound CC(C)(C)CC(C)(C)C1=CC=C(OCCOCCO)C=C1 LBCZOTMMGHGTPH-UHFFFAOYSA-N 0.000 description 3
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 3
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 3
- 206010028980 Neoplasm Diseases 0.000 description 3
- 102000009097 Phosphorylases Human genes 0.000 description 3
- 108010073135 Phosphorylases Proteins 0.000 description 3
- 238000007792 addition Methods 0.000 description 3
- 238000005119 centrifugation Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 239000002480 mineral oil Substances 0.000 description 3
- 235000010446 mineral oil Nutrition 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- QRLVDLBMBULFAL-UHFFFAOYSA-N Digitonin Natural products CC1CCC2(OC1)OC3C(O)C4C5CCC6CC(OC7OC(CO)C(OC8OC(CO)C(O)C(OC9OCC(O)C(O)C9OC%10OC(CO)C(O)C(OC%11OC(CO)C(O)C(O)C%11O)C%10O)C8O)C(O)C7O)C(O)CC6(C)C5CCC4(C)C3C2C QRLVDLBMBULFAL-UHFFFAOYSA-N 0.000 description 2
- 108060002716 Exonuclease Proteins 0.000 description 2
- 229920002594 Polyethylene Glycol 8000 Polymers 0.000 description 2
- 239000007795 chemical reaction product Substances 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- UVYVLBIGDKGWPX-KUAJCENISA-N digitonin Chemical compound O([C@@H]1[C@@H]([C@]2(CC[C@@H]3[C@@]4(C)C[C@@H](O)[C@H](O[C@H]5[C@@H]([C@@H](O)[C@@H](O[C@H]6[C@@H]([C@@H](O[C@H]7[C@@H]([C@@H](O)[C@H](O)CO7)O)[C@H](O)[C@@H](CO)O6)O[C@H]6[C@@H]([C@@H](O[C@H]7[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O7)O)[C@@H](O)[C@@H](CO)O6)O)[C@@H](CO)O5)O)C[C@@H]4CC[C@H]3[C@@H]2[C@@H]1O)C)[C@@H]1C)[C@]11CC[C@@H](C)CO1 UVYVLBIGDKGWPX-KUAJCENISA-N 0.000 description 2
- UVYVLBIGDKGWPX-UHFFFAOYSA-N digitonine Natural products CC1C(C2(CCC3C4(C)CC(O)C(OC5C(C(O)C(OC6C(C(OC7C(C(O)C(O)CO7)O)C(O)C(CO)O6)OC6C(C(OC7C(C(O)C(O)C(CO)O7)O)C(O)C(CO)O6)O)C(CO)O5)O)CC4CCC3C2C2O)C)C2OC11CCC(C)CO1 UVYVLBIGDKGWPX-UHFFFAOYSA-N 0.000 description 2
- 102000013165 exonuclease Human genes 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 238000012268 genome sequencing Methods 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- WSFSSNUMVMOOMR-NJFSPNSNSA-N methanone Chemical compound O=[14CH2] WSFSSNUMVMOOMR-NJFSPNSNSA-N 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 102000004169 proteins and genes Human genes 0.000 description 2
- 239000001397 quillaja saponaria molina bark Substances 0.000 description 2
- 229920002477 rna polymer Polymers 0.000 description 2
- 229930182490 saponin Natural products 0.000 description 2
- 150000007949 saponins Chemical class 0.000 description 2
- 239000012798 spherical particle Substances 0.000 description 2
- GPRLSGONYQIRFK-MNYXATJNSA-N triton Chemical compound [3H+] GPRLSGONYQIRFK-MNYXATJNSA-N 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 1
- 241000186361 Actinobacteria <class> Species 0.000 description 1
- 206010002383 Angina Pectoris Diseases 0.000 description 1
- 108020004513 Bacterial RNA Proteins 0.000 description 1
- 108091032955 Bacterial small RNA Proteins 0.000 description 1
- 108010059892 Cellulase Proteins 0.000 description 1
- 108010022172 Chitinases Proteins 0.000 description 1
- 102000012286 Chitinases Human genes 0.000 description 1
- 241000606161 Chlamydia Species 0.000 description 1
- ZAMOUSCENKQFHK-UHFFFAOYSA-N Chlorine atom Chemical compound [Cl] ZAMOUSCENKQFHK-UHFFFAOYSA-N 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 241000192700 Cyanobacteria Species 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 241000192125 Firmicutes Species 0.000 description 1
- 108010031186 Glycoside Hydrolases Proteins 0.000 description 1
- 102000005744 Glycoside Hydrolases Human genes 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 238000012179 MicroRNA sequencing Methods 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 102000016943 Muramidase Human genes 0.000 description 1
- 241000204031 Mycoplasma Species 0.000 description 1
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 1
- 108091061960 Naked DNA Proteins 0.000 description 1
- 208000006595 Necrotizing Ulcerative Gingivitis Diseases 0.000 description 1
- 208000025157 Oral disease Diseases 0.000 description 1
- 208000009019 Pericoronitis Diseases 0.000 description 1
- 108010059820 Polygalacturonase Proteins 0.000 description 1
- 101710188535 RNA ligase 2 Proteins 0.000 description 1
- 239000013614 RNA sample Substances 0.000 description 1
- 101710204104 RNA-editing ligase 2, mitochondrial Proteins 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- 241000606701 Rickettsia Species 0.000 description 1
- 101000924393 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Vacuolar aminopeptidase 1 Proteins 0.000 description 1
- LSNNMFCWUKXFEE-UHFFFAOYSA-N Sulfurous acid Chemical compound OS(O)=O LSNNMFCWUKXFEE-UHFFFAOYSA-N 0.000 description 1
- 108091046869 Telomeric non-coding RNA Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 239000002518 antifoaming agent Substances 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 229940106157 cellulase Drugs 0.000 description 1
- 239000000460 chlorine Substances 0.000 description 1
- 229910052801 chlorine Inorganic materials 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 208000002925 dental caries Diseases 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000011304 droplet digital PCR Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 239000002532 enzyme inhibitor Substances 0.000 description 1
- 229940125532 enzyme inhibitor Drugs 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 108010093305 exopolygalacturonase Proteins 0.000 description 1
- 238000000799 fluorescence microscopy Methods 0.000 description 1
- 238000007672 fourth generation sequencing Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 208000007565 gingivitis Diseases 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 239000007791 liquid phase Substances 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 238000012164 methylation sequencing Methods 0.000 description 1
- 239000011325 microbead Substances 0.000 description 1
- 208000030194 mouth disease Diseases 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 210000000633 nuclear envelope Anatomy 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 201000001245 periodontitis Diseases 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 230000000379 polymerizing effect Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 238000012372 quality testing Methods 0.000 description 1
- 239000011535 reaction buffer Substances 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000003938 response to stress Effects 0.000 description 1
- 239000003161 ribonuclease inhibitor Substances 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 210000004357 third molar Anatomy 0.000 description 1
- 238000007671 third-generation sequencing Methods 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/02—Libraries contained in or displayed by microorganisms, e.g. bacteria or animal cells; Libraries contained in or displayed by vectors, e.g. plasmids; Libraries containing only microorganisms or vectors
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B50/00—Methods of creating libraries, e.g. combinatorial synthesis
- C40B50/06—Biochemical methods, e.g. using enzymes or whole viable microorganisms
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Microbiology (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Wood Science & Technology (AREA)
- Engineering & Computer Science (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Analytical Chemistry (AREA)
- General Chemical & Material Sciences (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Immunology (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供一种构建原核生物单细胞RNA测序文库的方法。该方法可对在保持原核生物细胞不裂解的状态下为mRNA加上一个延长序列,利用这个延长序列可以高效率地调取原核生物mRNA,并为不同细胞来源的mRNA标记不同的细胞标签,获得低偏好性的原核生物单细胞mRNA测序文库。
Description
技术领域
本发明涉及一种构建原核生物单细胞RNA测序文库的方法,属于基因测序技术领域。
背景技术
随着基因测序技术水平的提高以及人类基因组计划、癌症基因组计划、Meta-Hit计划等重大项目的相继开展,基因组研究和RNA测序日渐成为生物和医学研究的有力工具。然而,迄今为止RNA测序使用的测序材料大多是来源于数百万甚至更多细胞的混合RNA样本。由此获得的RNA序列与数量信息仅能代表群体细胞的平均情况,或者其中数量占优势的细胞的情况,而忽视了单个细胞独有的特性。为解决这个问题,单细胞测序技术应运而生。与传统的大量细胞RNA测序相比,单细胞RNA测序技术可以发现单个细胞基因表达的异质性,还可以通过基因表达情况将不同细胞归类、鉴定细胞类型并比较不同分类和细胞类型的表达差异。其优势是多方位和多层次的。但目前成熟的单细胞RNA测序技术都只能应用于真核细胞,尚无成熟的原核生物单细胞RNA测序解决方案。
原核生物单细胞研究具有重要意义。即使在相同实验室条件下生长的等基因群体中,原核生物中的基因表达也是高度异质的。原核生物分化出的不同的亚群,在群落的生存中承担不同的角色。例如,控制发育和应激反应状态的基因表达程序,如抗生素耐药性,可能在少数单个细胞中随机启动。群体水平的基因表达测量不足以揭示这种罕见的状态。到目前为止,这些状态只能在可操作的模型系统中进行表征,并且通过荧光显微镜等单细胞方法,一次只能测量有限的一组报告基因,这种方法成本高,难以广泛使用。
现有的SPLiT-seq测序技术通过组合条形码标记RNA的细胞起源,为原核生物单细胞转录组学提供了一个略有缺陷的方案。在SPLiT-seq中,mRNA以多孔板形式使用随机六聚体寡核苷酸引物和poly-T引物的混合引物,通过反转录将原核生物总RNA转化为cDNA,然后建库测序。该方法的细胞条码在反转录过程通过四次收集细胞和重新分布到多孔板中,每次加一小段条码,由多次加码的组合来使大多数细胞拥有独特的细胞条码,这种加码方式操作复杂且效果不稳定。同时,由于随机引物在一条mRNA上有多个结合位点,每条mRNA反转录获得的cDNA数量不一样,由此引发的偏好性会严重影响RNA表达量检测的准确性。并且也因为随机引物的原因,该方法无法通过对单条mRNA进行标记分子标签来降低PCR偏好性。此外,SPLiT-seq技术需要多次向多孔板的每个孔中分别加细胞和反应液,实验操作复杂费时。
发明内容
鉴于上述现有技术中存在的不足,本发明的目的在于提供一种高效、低偏好性、便于实验操作的构建原核生物单细胞RNA测序文库的方法。
本发明为解决上述问题进行了深入研究,结果发现:通过对原核生物单细胞的RNA加特殊的延长序列,这样处理的RNA可以直接使用部分序列与特殊的延长序列反向互补的引物进行反转录和标记细胞标签,从而能够以高效和简便的途径获得原核生物单细胞的RNA测序文库。
即,本发明包括,
1.一种构建原核生物单细胞RNA测序文库的方法,该方法包括下述步骤:
细胞固定:固定原核生物细胞;
加延长序列:对固定的原核生物细胞的RNA序列在3'端加如SEQ ID No.1所示的核苷酸序列,得到延长的RNA序列;
反转录:对延长的RNA序列采用如SEQ ID No.2所示的核苷酸序列进行反转录得到cDNA序列;
扩增:对cDNA序列进行PCR得到扩增的cDNA序列;
建库:采用扩增的cDNA序列构建测序用文库。
2.根据项1所述的方法,其中,在所述细胞固定步骤之后进行单细胞穿孔步骤。
3.根据项1所述的方法,其中,固定的原核生物细胞的数量为1-1020个,优选的数量为1-1010,更优选的数量为1-107。
4.根据项1所述的方法,其中,SEQ ID NO:1所示的核苷酸序列由核糖核苷酸和/或脱氧核糖核苷酸组成,优选的核糖核苷酸的比例为0-80%,更优选的核糖核苷酸的比例为0-50%,进一步优选的核糖核苷酸的比例为0-25%,进一步优选的核糖核苷酸的比例为0-10%,最优选的核糖核苷酸的比例为0。
5.根据项1所述的方法,其中,SEQ ID NO:2所示的核苷酸序列由核糖核苷酸和/或脱氧核糖核苷酸组成,优选的核糖核苷酸的比例为0-80%,更优选的核糖核苷酸的比例为0-50%,进一步优选的核糖核苷酸的比例为0-25%,进一步优选的核糖核苷酸的比例为0-10%,最优选的核糖核苷酸的比例为0。
6.根据项1所述的方法,其中,所述加延长序列步骤在单细胞环境中处理。
7.根据项1所述的方法,其中,所述加标签序列步骤和/或反转录步骤在单细胞环境中处理。
8.根据项7所述的方法,其中,在所述反转录步骤之后进行打破单细胞环境的步骤。
9.一种原核生物单细胞RNA测序文库,其通过项1-8任一项所述的方法获得,其至少包含RNA序列或其反向互补序列,延长序列或其互补序列,以及细胞标签或其反向互补序列。
10.一种原核生物单细胞RNA测序文库的测序方法,其对通过项1-9任一项所述的方法构建的文库进行测序。
根据本发明的一个方面,提供一种构建原核生物单细胞RNA测序文库的方法,包括:细胞固定:固定原核生物细胞;加延长序列:对固定的原核生物细胞的RNA序列在3'端加如SEQ ID No.1所示的核苷酸序列,得到延长的RNA序列;反转录:对延长的RNA序列采用如SEQ ID No.2所示的核苷酸序列进行反转录得到cDNA序列;扩增:对cDNA序列进行PCR得到扩增的cDNA序列;以及,建库:采用扩增的cDNA序列构建测序用文库。
在本发明中,“原核生物”是指一类细胞核无核膜包裹,只存在称作核区的裸露DNA的原始单细胞生物。原核生物的样本类型包括但不限于:革兰氏阴性菌,革兰氏阳性菌,细菌、蓝藻、放线菌、支原体、衣原体、立克次氏体;这些细胞来源包括但不限于:原代培养、细胞系培养、组织、生物体、环境来源。
在本发明中,“单细胞”是指有细胞膜或细胞壁的单一细胞个体。通过本发明文库构建方法获得的文库中能够根据细胞标记进行拆分,进而获得来源于不同细胞个体的序列。
在上述构建原核生物单细胞RNA测序文库的方法中,所述固定步骤采用的固定试剂可以是选自甲醛、福尔马林、甲醇、NP-40、丙酮、Triton、Tween 20、皂素、洋地黄皂苷和Leucoperm中的一种或两种以上的组合。所述固定试剂的优选浓度为0.1%-20%,更优选的浓度为0.1%-1%。(所述固定的原核生物细胞的数量为1-1020个,更优选的数量为104-1010,更优选的数量为106-107。样本菌体湿重为10-6-1010毫克,优选的菌体湿重为10-3-106毫克,更优选的菌体湿重为10-2-103毫克。
在上述构建原核生物单细胞RNA测序文库的方法中,固定原核生物细胞可以采用对固定的原核生物样本进行去细胞壁处理,得到原生质体。
在上述构建原核生物单细胞RNA测序文库的方法中,在所述细胞固定步骤之后进行单细胞穿孔步骤。经过本步骤处理的细胞仍保留了单细胞环境,但进行下一步反应的试剂和其他反应物可以通过。单细胞穿孔可以是对去细胞壁的原生质体进行细胞膜穿孔,也可以是对没有细胞壁的原核生物的细胞膜直接进行穿孔,具体可以是,例如对没有细胞壁的L型细菌的细胞膜直接进行通透化处理。经穿孔处理后的细胞不允许mRNA分子通过但允许下一步反应的其他试剂和反应物通过,允许通过的分子的分子量大小在10-500kDa,优选的允许通过的分子的分子量大小在20-400kDa,更优选的允许通过的分子的分子量大小在30-300kDa,进一步优选的允许通过的分子的分子量大小在40-200kDa。
在上述构建原核生物单细胞RNA测序文库的方法中,去细胞壁的步骤采用的试剂可以是选自液氮、纤维素酶、果胶酶、溶菌酶、多糖酶、多肽酶、糖水解酶和几丁质酶中的一种或两种以上的组合。所述去细胞壁的试剂的优选浓度为0.1%-20%,更优选的浓度为1%-5%。
在上述构建原核生物单细胞RNA测序文库的方法中,通透化处理采用的试剂可以是选自甲醛、福尔马林、甲醇、NP-40、丙酮、Triton、Tween20、皂素、洋地黄皂苷和Leucoperm中的一种或两种以上的组合。所述通透化处理试剂的优选浓度为0.01%-20%,更优选的浓度为0.1%-5%。
在上述构建原核生物单细胞RNA测序文库的方法中,对固定的原核生物细胞的RNA序列在3'端加的特异核苷酸序列是如SEQ ID NO:1所示的核苷酸序列。
SEQ ID NO:1:5'-(N)a-3',
其中,N选自A、T、C、G、U五种碱基中的任意一种;优选地N选自A、T、C、G、四种碱基中的任意一种。a为6以上自然数;优选地a为6~1000;更优选地a为6~100;进一步优选地a为10~30。优选的SEQ ID NO:1不会有连续10个以上的碱基与其余序列反向互补,以避免序列自身形成发卡结构。
在上述构建原核生物单细胞RNA测序文库的方法中,SEQ ID NO:1所示的核苷酸序列由核糖核苷酸和/或脱氧核糖核苷酸组成,优选的核糖核苷酸的比例为0-80%,更优选的核糖核苷酸的比例为0-50%,进一步优选的核糖核苷酸的比例为0-25%,进一步优选的核糖核苷酸的比例为0-10%,最优选的核糖核苷酸的比例为0,即此时SEQ ID NO:1所示的核苷酸序列均由脱氧核糖核苷酸组成。
在本发明中,如SEQ ID No.1所示的核苷酸序列是经特殊设计的延长序列,能够用于与RNA进行连接。
在上述构建原核生物单细胞RNA测序文库的方法中,加延长序列的试剂可以是选自连接、修饰、聚合或延长脱氧核糖核酸或核糖核酸的酶。具体可以是选自磷酸化酶,DNA连接酶,RNA连接酶,DNA聚合酶,RNA聚合酶,反转录酶中的一种或两种以上的组合。优选为DNA连接酶或RNA连接酶中的一种。更优选为RNA连接酶。
在上述构建原核生物单细胞RNA测序文库的方法中,对延长的RNA序列进行反转录的核苷酸序列是如SEQ ID No.2所示的核苷酸序列。
SEQ ID NO:2:5'-(M)k(N)'b-3',
(M)k为细胞标签,M选自A、T、C、G、U五种碱基中的任意一种;优选地M选自A、T、C、G、四种碱基中的任意一种。M中碱基的组合可以是完全随机的,也可以是预设的有限的数量为10-1020个组合,优选的组合数量为102-1010,更优选的组合数量为103-107。可以是随机的碱基组合。k为6以上的自然数;优选地k为6-50;更优选地k为8-30;进一步优选地k为10-20。b为6以上的自然数;优选地b为6-100;更优选地b为10-50;进一步优选地b为12-30。N选自A、T、C、G、U五种碱基中的任意一种;优选地N选自A、T、C、G、四种碱基中的任意一种。(N)'b与(N)a核苷酸序列部分或全部反向互补。优选地(N)'b与(N)a有6个以上碱基反向互补;更优选地(N)'b与(N)a有6-50个碱基反向互补,进一步优选地(N)'b与(N)a有7-40个碱基反向互补,进一步优选地(N)'b与(N)a有8-30个碱基反向互补。
在上述构建原核生物单细胞RNA测序文库的方法中,SEQ ID NO:2所示的核苷酸序列由核糖核苷酸和/或脱氧核糖核苷酸组成,优选的核糖核苷酸的比例为0-80%,更优选的核糖核苷酸的比例为0-50%,进一步优选的核糖核苷酸的比例为0-25%,进一步优选的核糖核苷酸的比例为0-10%,最优选的核糖核苷酸的比例为0,即此时SEQ ID NO:2所示的核苷酸序列均由脱氧核糖核苷酸组成。
在本发明中,如SEQ ID No.2所示的核苷酸序列是引物序列,也是带有细胞标签序列和与延长序列全部或部分反向互补的序列,能够用于特异性识别、调取和反转录带有特殊设计的延长序列的RNA序列。在上述构建原核生物单细胞RNA测序文库的方法中,加标签序列的试剂可以是选自反转录酶,DNA连接酶,RNA连接酶,DNA聚合酶,RNA聚合酶,TemplateSwitching RT Enzyme Mix中的一种或两种以上的组合。最优的选择为反转录酶或Template Switching RT Enzyme Mix。
在上述构建原核生物单细胞RNA测序文库的方法中,所述加延长序列步骤在单细胞环境中处理。
在上述构建原核生物单细胞RNA测序文库的方法中,所述反转录步骤在单细胞外环境中处理。
在上述构建原核生物单细胞RNA测序文库的方法中,单细胞环境是指对单细胞内存在的多种物质通过一定的屏障进行保护,从而将单细胞内的物质与其他环境的物质相隔离的单细胞内的物质的存在形式。上述屏障的形式可以是由例如单细胞的细胞膜所形成的屏障,也可以是由特定仪器或实验方法将单细胞内存在的多种物质转化为与其他细胞来源或其他环境来源的物质相隔离的存在形式。例如包括了单细胞内多种物质的液滴,该液滴可以保存原单细胞内的多种物质,并使之与其他细胞来源或其他环境来源的物质相隔离。在本发明的实施例中,包括单细胞内多种物质的液滴可以采用油包水液滴(在油相中散布的液相液滴)。具体的油包水液滴可以通过液滴数字PCR仪,Bio-Rad ddSEQ,10x GenomicsChromium,1CellBio,inDrop或Droplet等仪器制备。液滴的体积为0.01-50nL,优选地体积为0.1-2nL。
在上述构建原核生物单细胞RNA测序文库的方法中,所述每个单细胞环境中包括的原生质体和/或单细胞的数量为1-5个,优选的原生质体和/或单细胞的数量为1-4个,更优选的原生质体和/或单细胞的数量为1-3个,更优选的原生质体和/或单细胞的数量为1-2个,最优选地原生质体和/或单细胞的数量为1个。
在上述构建原核生物单细胞RNA测序文库的方法中,单细胞环境可以进一步增加单细胞外的其他实验试剂和反应物,如用于加延长序列的试剂,具体可以是SEQ ID No.1,磷酸化酶,RNA连接酶,RNA连接酶缓冲体系,用于反转录的试剂(缓冲体系,反转录酶,寡核苷酸)等。进一步增加的其他实验试剂的存在形式可以根据具体的单细胞环境进行选择。如,当单细胞环境为油包水的液滴时,增加的寡核苷酸可以连接在微粒上进行处理,再进一步与在先的单细胞环境混合形成新的单细胞液滴。具体的,如SEQ ID No.2所示的核苷酸序列等的存在形式可以是与载体微粒连接。所述与微粒连接可以是直接连接也可以是通过采用或修改于商品化的连接有特定寡核苷酸的载体微粒产品,如Chemgenes Barcodedbeads、Bio-rad SureCell WTA beads、Bio-rad SureCell ATAC-Seq beads、10xGenomicsChromium Single Cell 3'Kit gel beads、10x Genomics Chromium Single Cell 5'Kitgel beads、10x Genomics Chromium Single Cell Multiome ATAC+Gene Expression gelbeads、10xGenomics Chromium Next GEM Single Cell ATAC Gel Beads。所述载体微粒的形状可以是球形,正方体,长方体,圆锥体,圆柱体或其他不规则形状,其直径或最长的边可以是1-1000微米,优选的微粒形状是球形(可称为微珠),球形微粒的直径为10-100微米,优选的球形微粒的直径是20-50微米。
在上述构建原核生物单细胞RNA测序文库的方法中,每个单细胞环境只能添加一个细胞标签。具体的细胞标签可以是如SEQ ID No.2所示的核苷酸序列中的(M)k部分。
在上述构建原核生物单细胞RNA测序文库的方法中,反转录步骤的单细胞外环境可以是反转录单细胞液滴。所述反转录单细胞液滴包括加了延长序列的RNA,反转录酶或Template Switching RT Enzyme Mix,和如SEQ ID No.2所示的核苷酸序列。所述反转录单细胞液滴进一步包括其他用于反转录的试剂,如选自DTT,NP-40,Tween 20,PEG-8000,EDTA,Tris,反转录酶缓冲体系,Template Switching反转录缓冲体系,TemplateSwitching Oligo中的一种或两种以上。优选的反转录步骤的酶为Template Switching RTEnzyme Mix。优选地其他用于反转录的试剂为Template Switching反转录缓冲体系和Template Switching Oligo。其中,Template Switching Oligo为长度6-100bp的核苷酸序列,含有1-10bp的核糖核苷酸碱基,其余为脱氧核糖核苷酸碱基。优选的为含1-10bp的核糖核苷酸碱基,最优选的为含3bp的核糖核酸核苷酸碱基。其序列特征为,3'端为连续3个碱基G,这三个碱基可以是核糖核苷酸或脱氧核糖核苷酸,优选的是核糖核苷酸。
在上述构建原核生物单细胞RNA测序文库的方法中,所述反转录步骤使用的仪器可以是选自PCR仪、水浴锅、恒温摇床、培养箱、调温器、空调中的一种或两种以上,最合适的是PCR仪。
在上述构建原核生物单细胞RNA测序文库的方法中,在所述反转录步骤之后可以进行打破单细胞环境的步骤。即在需要测序的原核生物细胞数量为一个以上的细胞时,可以在此步骤中打破多个单细胞环境,将多个细胞进行混合,从而实现多个细胞的RNA信息能够同时进入后续建库步骤。由于在之前的加标签序列步骤中,单个细胞内的RNA都被标记了相同的细胞标签,因此经混合的多个细胞的RNA也能在后续测序步骤中被准确识别。
在上述构建原核生物单细胞RNA测序文库的方法中,所述打破单细胞环境的步骤可以是破坏油包水液滴的方法,具体例如将油包水的液滴于0至-279摄氏度冷冻然后融化1-2次、加热到80-200摄氏度并冷却、加入表面张力消消泡剂、加入脱泡剂、加入脂溶性试剂、加入水溶性试剂、震荡或离心。优选地是将油包水的液滴于-20摄氏度冷冻然后融化1-2次。
可选地,在上述构建原核生物RNA测序文库的方法中,在所述反转录步骤之后进行去除rRNA的步骤。所述去除rRNA的步骤可以采用商业试剂盒,如Illumina Ribo-Zero革兰氏阴性菌rRNA去除试剂盒。
在上述构建原核生物单细胞RNA测序文库的方法中,所述建库步骤可以是二代测序文库的构建步骤。如打断,末端修复,加A,加接头和文库扩增等步骤。所述建库步骤也可以通过商品化的试剂盒实现,如 UltraTMII FS DNA Library Prep Kit、Chromium Next GEM Single Cell 3′Library Kit、Chromium Next GEM Single Cell 5′Library Kit、ThruPLEX DNA-Seq Kit、RegeneTMDNA Library Prep Kit、HIFFTMDNALibrary Preparation Kit、 DNA PCR-Free Prep、 DNA Prep等。
在本发明中,扩增步骤使用的试剂可以是选自MNase,核酸内切酶,核酸外切酶,磷酸化酶,DNA聚合酶,RNA聚合酶,DNA连接酶、RNA连接酶、引物和缓冲体系中的一种或两种以上。
根据本申请的另一方面,提供了一种原核生物单细胞RNA测序文库,所述文库的片段序列特征为至少包含RNA序列或其反向互补序列,延长序列或其反向互补序列,以及细胞标签或其反向互补序列。
根据本申请的另一方面,提供了一种原核生物单细胞RNA测序文库的测序方法,其对通过对在上述构建原核生物单细胞RNA测序文库的方法中获得的文库进行测序。
与现有技术相比,本发明实现了一种低偏好性的原核生物单细胞RNA测序文库的构建方法。通过在固定的原核生物单细胞中,对RNA序列加上一段特殊设计的延长序列,延长原核生物单细胞RNA。这样处理的RNA能够直接使用与所加延长序列反向互补的引物对RNA进行反转录。由于使用的不是随机引物,每个mRNA分子在反转录过程中只生成一条cDNA。上述引物中还增加了细胞标签序列,通过使每个细胞的RNA带有独特的细胞标签来区分来自不同细胞的mRNA,从而实现对文库中不同细胞的识别。同时,上述引物中还可以引入一段分子标签序列来标记mRNA分子,进一步降低偏好性。这样可以实现低偏好性的原核生物单细胞RNA文库的构建。同时,该方法操作简便,效率高,适于科研实验和临床研究等多种场景的应用和推广。
附图说明
图1是一例构建原核生物单细胞RNA测序文库的方法的流程图,
1-原核生物细胞样本;2-固定的原核细胞;3-除去细胞壁的原核细胞;4-经通透化处理的原核细胞;5-RNA加延长序列的原核细胞;6-带有单细胞标签的微粒;7-单细胞转录体系液滴;8-经反转录获得的cDNA;9-原核生物单细胞mRNA测序文库。
发明的具体实施方式
实施例
以下结合附图和实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例是用于解释本发明,并非对本发明的限定。
实施例1 L型大肠杆菌单细胞RNA测序
1.细胞固定和通透化处理。
使用含0.01%甲醛和0.1%Tween20的PBS重悬5000个或2万个L型大肠杆菌细胞,室温孵育15分钟。离心,然后用含1%BSA的PBS洗涤两次,PBS洗涤一次。离心去上清。因为L型大肠杆菌无细胞壁,所以这里无需对原核细胞进行破壁处理。经过本步骤处理的细胞仍保留了单细胞环境,但进行延长序列反应的试剂和其他反应物可以自由通过。
2.在细菌RNA 3'端连接即延长序列.
2.1加入20μL3'端接头连接溶液:1×T4 RNA Ligase Buffer,0.5μM 3'端RNA接头序列(即本实施例的延长序列:5'-/5rApp/CTGTCTCTTATACACATCTGACGCTGCCGACGA/3ddC/-3',5rApp表示5'端磷酸化的核糖核苷酸碱基A,3ddC表示3'端封闭的脱氧核糖核苷酸碱基C),30%PEG8000,1U/μLRNA酶抑制剂,10U/μLT4 RNA Ligase 2。4℃孵育16小时。
2.2离心,PBS洗涤两次
3.生成单细胞液滴及反转录。
3.1配制细胞反转录溶液:1×Template Switching RT Buffer,1%DTT,5000或20,000个-上一步处理后的细胞,5U/μL Template Switching RT Enzyme Mix,1mM dNTPs,1mM Template switch Oligo(序列:5'-AGGCAGTCTATCAACGCAGTACATrGrGrG-3',rG表示核糖核酸碱基G),1U/μLRNA酶抑制剂。
3.2架置10x Genomics的Chromium Next GEM Chip H(PN-1000162),在标记为“1”的行上加入100μL的细胞反转录溶液,在标记为“2”的行上加入50μL 10x GenomicsChromium Next GEM Single Cell ATAC Gel Bead(PN-1000160),在标记为“3”的行上加入50μL的矿物油。矿物油用于生成油包水的液滴,10x Genomics Chromium Next GEM SingleCell ATAC Gel Bead提供连在微粒上的细胞标签和本实施例的延长序列的反向互补序列,细胞反转录溶液提供细胞及反转录反应所需试剂。
3.3将完成上样的Chip放入10x Genomics Chromium Single Cell Controller,点击“play”按钮。等待液滴生成程序运行完成。生成单细胞液滴反转录体系。
3.4将单细胞液滴反转录体系转移到PCR管,运行反转录程序:53℃1小时,85℃ 5分钟。
4.cDNA扩增:
4.1将上一步的PCR管置于-20℃冰箱中冷冻半小时,然后室温融化,使油包水的液滴形态破裂,管中液体分为两层,上层为水层,下层为矿物油层。
4.2加入cDNA扩增溶液:500nM primer1(序列:5'-[磷酸化]AATGATACGGCGACCACCGAGA-3'),500nM primer2(序列:5'-AGGCAGTCTATCAACGCAGTAC-3'),1X KAPA HiFi HotStart ReadyMix。混匀,放入PCR仪。
4.3运行PCR程序:
步骤2-4进行20个循环。
4.4使用Ampure XP磁珠纯化扩增的cDNA。
5.去除rRNA:
5.1使用lambda核酸外切酶消化上一步扩增的cDNA,得到单链cDNA。
5.2使用Illumina Ribo-Zero革兰氏阴性菌rRNA去除试剂盒去除rRNA反转录生成的单链cDNA。去除rRNA反转录生成的单链cDNA后保留的产物大部分为mRNA反转录生成的单链cDNA。
5.3使用引物(序列:5'-AATGATACGGCGACCACCGAGA-3')和Bst DNA聚合酶将单链cDNA恢复为双链cDNA。
6.构建测序文库:
6.1cDNA打断,末端修复及加A:取26μL扩增的cDNA,加入2μLNEBNext Ultra II FSEnzyme Mix和7μL NEBNext Ultra II FS Reaction Buffer,混匀置于PCR仪中。37℃ 5分钟,65℃ 30分钟。
6.2连接头:向上一步反应产物中加入30μL NEBNext Ultra II Ligation MasterMix,1μL NEBNext Ligation Enhancer,2.5μL read2接头(终浓度1μM。由上寡核苷酸(序列:5'-[磷酸化]GATCGGAAGAGCACACGTCTGAACTCCAGTC-3')和下寡核苷酸(序列:5'-CTTCCGATCT-3')梯度退火生成),20℃孵育15分钟。使用Ampure XP磁珠纯化。
6.3文库扩增:向上一步反应产物中加入文库引物1,文库引物2,1×KAPA HiFiHotStart ReadyMix。混匀,放入PCR仪。
(文库引物1终浓度500nM,序列:5'-AATGATACGGCGACCACCGAGATCTACAC-3',文库引物2终浓度500nM,序列:5'-CAAGCAGAAGACGGCATACGAGAT(i7 index)GTGACTGGAGTTCAGACG-3'。i7 index为8bp个碱基,用于从测序数据中拆分文库)
运行以下程序:
步骤2-4进行16个循环。
6.4使用Ampure XP磁珠纯化扩增的文库。使用TapeStation进行文库质检。
实施例2对实施例1获得的文件进行测序和数据分析
1.使用Illumina NextSeq平台进行测序。读长设置为:read1:80bp,i5 index:16bp,i7 index:8bp,read2:80bp。。其中,read2读取的测序数据为转录组的mRNA部分序列,read1读取的测序数据为转录组的mRNA部分序列的反向互补序列,i5 index读取的测序数据为细胞标签,i7 index读取的测序数据为文库的拆分标记。
2.通过i7 index读取的测序数据拆分文库,i5 index读取的测序数据的数据归类测序片段所属的细胞;将read2读取的数据序列和read1读取的测序数据的反向互补序列比对大肠杆菌参考基因组,确认其来源的mRNA所对应基因。通过对所有测序到的mRNA的UMI数量及其所属细胞整理生成单细胞RNA表达量的矩阵。
3.结果总结
统计每个样本上样细胞总数;在测序结果中可以拆分出的单细胞数量计为文库细胞数;测序数据的reads总数除以文库细胞数计为平均每个细胞测序Reads数;以及每个样本中单个细胞捕获基因种类的中位数计为单细胞捕获基因中位数。获得的结果统计如下:
使用本方法对单细胞的捕获效率在10%-20%。大肠杆菌含有的基因数大约为4200个,使用本方法单细胞捕获到的基因中位数为总基因数量的4.5%-10%,可以很好地满足下游数据分析的要求。
根据本发明,可以对原核生物的样本进行单细胞RNA的检测。进而可以比较不同细胞之间RNA序列、种类及表达量的区别。这些细胞之间的区别包括但不限于:不同物种来源、不同宿主来源、不同环境来源、不同原核生物种类、不同细胞周期、不同发育阶段、不同培养条件、不同处理条件、不同原核生物个体。
根据本发明,可以与其他研究DNA、RNA、蛋白的方法联合使用研究细胞特性或功能,以及染色质构象、DNA、RNA和蛋白质的功能。这些其他研究DNA、RNA、蛋白的方法包括但不限于:基因芯片、QPCR、一代测序、二代测序、三代测序、四代测序、基因测序、基因组测序、宏基因组测序、外显子测序、内含子测序、目标基因捕获测序、RNA测序、表达谱测序、转录组测序、小RNA转录组、微RNA测序、宏转录组测序、LncRNA测序、肿瘤基因测序、肿瘤基因组测序、Bisulfite甲基化测序、ChIP-DNA测序、MeDIP测序、RRBS测序、Target-BS测序、hmC测序。
本发明在传染病、病原体感染,感染性炎症、口腔疾病如龋齿、菌斑性龈炎、牙周炎、智齿冠周炎、坏死溃疡性龈炎和咽峡炎等疾病的病因研究、预防、诊断、治疗、康复指导、检测和预后有应用潜力。
还需要说明的是,在可实施且不明显违背本发明的主旨的前提下,在本说明书中作为某一技术方案的构成部分所描述的任一技术特征或技术特征的组合同样也可以适用于其它技术方案;并且,在可实施且不明显违背本发明的主旨的前提下,作为不同技术方案的构成部分所描述的技术特征之间也可以以任意方式进行组合,来构成其它技术方案。本发明也包含在上述情况下通过组合而得到的技术方案,并且这些技术方案相当于记载在本说明书中。
上述说明示出并描述了本发明的优选实施例,如前所述,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域技术人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。
Claims (10)
1.一种构建原核生物单细胞RNA测序文库的方法,该方法包括下述步骤:
细胞固定:固定原核生物细胞;
加延长序列:对固定的原核生物细胞的RNA序列在3'端加如SEQ ID No.1所示的核苷酸序列,得到延长的RNA序列;
反转录:对延长的RNA序列采用如SEQ ID No.2所示的核苷酸序列进行反转录得到cDNA序列;
扩增:对cDNA序列进行PCR扩增得到扩增的cDNA序列;
建库:采用扩增的cDNA序列构建测序用文库。
2.根据权利要求1所述的方法,其中,在所述细胞固定步骤之后进行单细胞穿孔步骤。
3.根据权利要求1所述的方法,其中,固定的原核生物细胞的数量为1-1020个,优选的数量为1-1010,更优选的数量为1-107。
4.根据权利要求1所述的方法,其中,SEQ ID NO:1所示的核苷酸序列由核糖核苷酸和/或脱氧核糖核苷酸组成,优选的核糖核苷酸的比例为0-80%,更优选的核糖核苷酸的比例为0-50%,进一步优选的核糖核苷酸的比例为0-25%,进一步优选的核糖核苷酸的比例为0-10%,最优选的核糖核苷酸的比例为0。
5.根据权利要求1所述的方法,其中,SEQ ID NO:2所示的细胞标签核苷酸序列引物由核糖核苷酸和/或脱氧核糖核苷酸组成,优选的核糖核苷酸的比例为0-80%,更优选的核糖核苷酸的比例为0-50%,进一步优选的核糖核苷酸的比例为0-25%,进一步优选的核糖核苷酸的比例为0-10%,最优选的核糖核苷酸的比例为0。
6.根据权利要求1所述的方法,其中,所述加延长序列步骤在单细胞环境中处理。
7.根据权利要求1所述的方法,其中,所述反转录步骤在单细胞环境中处理。
8.根据权利要求7所述的方法,其中,在所述反转录步骤之后进行打破单细胞环境的步骤。
9.一种原核生物单细胞RNA测序文库,其通过权利要求1-8任一项所述的方法获得,其至少包含RNA序列或其反向互补序列,延长序列或其反向互补序列,以及细胞标签或其反向互补序列。
10.一种原核生物单细胞RNA测序文库的测序方法,其对通过权利要求1-8任一项所述的方法构建的文库进行测序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210385267.1A CN114807305A (zh) | 2022-04-13 | 2022-04-13 | 一种构建原核生物单细胞rna测序文库的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210385267.1A CN114807305A (zh) | 2022-04-13 | 2022-04-13 | 一种构建原核生物单细胞rna测序文库的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114807305A true CN114807305A (zh) | 2022-07-29 |
Family
ID=82536975
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210385267.1A Pending CN114807305A (zh) | 2022-04-13 | 2022-04-13 | 一种构建原核生物单细胞rna测序文库的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114807305A (zh) |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150087556A1 (en) * | 2013-09-20 | 2015-03-26 | University Of Massachusetts | COMPOSITIONS AND METHODS FOR MAKING cDNA LIBRARIES FROM SMALL RNAs |
CN104540964A (zh) * | 2012-07-24 | 2015-04-22 | 赛昆塔公司 | 使用序列标签的单细胞分析 |
CN108103055A (zh) * | 2018-01-09 | 2018-06-01 | 上海亿康医学检验所有限公司 | 一种单细胞rna逆转录与文库构建的方法 |
CN108193283A (zh) * | 2017-12-21 | 2018-06-22 | 上海美吉生物医药科技有限公司 | 一种单细胞转录组文库建立方法及其应用 |
CN110157785A (zh) * | 2018-02-13 | 2019-08-23 | 浙江大学 | 一种单细胞rna测序文库构建方法 |
US20190382753A1 (en) * | 2018-05-17 | 2019-12-19 | Illumina, Inc. | High-throughput single-cell sequencing with reduced amplification bias |
US20190390266A1 (en) * | 2018-03-30 | 2019-12-26 | Massachusetts Institute Of Technology | Single-cell rna sequencing using click-chemistry |
CN110747514A (zh) * | 2019-09-27 | 2020-02-04 | 北京生命科学研究所 | 一种高通量单细胞小rna文库构建方法 |
CN111549025A (zh) * | 2020-06-08 | 2020-08-18 | 郑州大学第一附属医院 | 链置换引物和细胞转录组文库构建方法 |
US20200291450A1 (en) * | 2016-06-17 | 2020-09-17 | Ludwig Institute For Cancer Research Ltd | Methods of small-rna transcriptome sequencing and applications thereof |
CN113151423A (zh) * | 2016-08-05 | 2021-07-23 | 生物辐射实验室股份有限公司 | 第二链引导 |
WO2021208036A1 (en) * | 2020-04-16 | 2021-10-21 | Singleron (Nanjing) Biotechnologies, Ltd. | A method for detection of whole transcriptome in single cells |
CN113789364A (zh) * | 2021-08-16 | 2021-12-14 | 东南大学 | 一种超微量全长rna测序文库的构建方法 |
CN114015755A (zh) * | 2020-12-31 | 2022-02-08 | 中国科学院北京基因组研究所(国家生物信息中心) | 用于标记核酸分子的方法和试剂盒 |
CN114107459A (zh) * | 2021-11-11 | 2022-03-01 | 浙江大学 | 一种基于寡核苷酸链杂交标记的高通量单细胞测序方法 |
-
2022
- 2022-04-13 CN CN202210385267.1A patent/CN114807305A/zh active Pending
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104540964A (zh) * | 2012-07-24 | 2015-04-22 | 赛昆塔公司 | 使用序列标签的单细胞分析 |
US20150087556A1 (en) * | 2013-09-20 | 2015-03-26 | University Of Massachusetts | COMPOSITIONS AND METHODS FOR MAKING cDNA LIBRARIES FROM SMALL RNAs |
US20200291450A1 (en) * | 2016-06-17 | 2020-09-17 | Ludwig Institute For Cancer Research Ltd | Methods of small-rna transcriptome sequencing and applications thereof |
CN113151423A (zh) * | 2016-08-05 | 2021-07-23 | 生物辐射实验室股份有限公司 | 第二链引导 |
CN108193283A (zh) * | 2017-12-21 | 2018-06-22 | 上海美吉生物医药科技有限公司 | 一种单细胞转录组文库建立方法及其应用 |
CN108103055A (zh) * | 2018-01-09 | 2018-06-01 | 上海亿康医学检验所有限公司 | 一种单细胞rna逆转录与文库构建的方法 |
CN110157785A (zh) * | 2018-02-13 | 2019-08-23 | 浙江大学 | 一种单细胞rna测序文库构建方法 |
US20190390266A1 (en) * | 2018-03-30 | 2019-12-26 | Massachusetts Institute Of Technology | Single-cell rna sequencing using click-chemistry |
US20190382753A1 (en) * | 2018-05-17 | 2019-12-19 | Illumina, Inc. | High-throughput single-cell sequencing with reduced amplification bias |
CN110747514A (zh) * | 2019-09-27 | 2020-02-04 | 北京生命科学研究所 | 一种高通量单细胞小rna文库构建方法 |
WO2021208036A1 (en) * | 2020-04-16 | 2021-10-21 | Singleron (Nanjing) Biotechnologies, Ltd. | A method for detection of whole transcriptome in single cells |
CN111549025A (zh) * | 2020-06-08 | 2020-08-18 | 郑州大学第一附属医院 | 链置换引物和细胞转录组文库构建方法 |
CN114015755A (zh) * | 2020-12-31 | 2022-02-08 | 中国科学院北京基因组研究所(国家生物信息中心) | 用于标记核酸分子的方法和试剂盒 |
CN113789364A (zh) * | 2021-08-16 | 2021-12-14 | 东南大学 | 一种超微量全长rna测序文库的构建方法 |
CN114107459A (zh) * | 2021-11-11 | 2022-03-01 | 浙江大学 | 一种基于寡核苷酸链杂交标记的高通量单细胞测序方法 |
Non-Patent Citations (5)
Title |
---|
FABIAN IMDAHL等: "Advances and challenges in single-cell RNA-seq of microbial communities", CURR OPIN MICROBIOL., vol. 57, pages 2 * |
MICHAEL HAGEMANN-JENSEN等: "Small-seq for single-cell small-RNA sequencing", NAT PROTOC., vol. 13, no. 10, pages 1 * |
QIN MA等: "Single-Cell RNA Sequencing of Plant-Associated Bacterial Communities", FRONT MICROBIOL., vol. 10, pages 1 * |
刘宏德,孙啸,谢建明编: "生物数据分析与实践", vol. 978, 31 December 2021, 南京东南大学出版社, pages: 208 * |
黄岩谊;王建斌;张先念;李天奇;刘峰;陈雅琪;JIACHENG YAO;ZEYAO LI;: "液滴超高通量单细胞RNA测序系统的比较分析", 科学新闻, no. 02 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6897023B2 (en) | Method for determining relative abundance of nucleic acid sequences | |
EP1054999B1 (en) | Solid phase selection of differentially expressed genes | |
US7217522B2 (en) | Genetic analysis by sequence-specific sorting | |
US7365179B2 (en) | Multiplexed analytical platform | |
CN115516109A (zh) | 条码化核酸用于检测和测序的方法 | |
US20030148273A1 (en) | Target enrichment and amplification | |
TW201321518A (zh) | 微量核酸樣本的庫製備方法及其應用 | |
CN102625838A (zh) | 用于生成rRNA除尽的样本或者用于从样本分离rRNA的方法、组合物和试剂盒 | |
CN113249439A (zh) | 一种简化dna甲基化文库及转录组共测序文库的构建方法 | |
EP3615683B1 (en) | Methods for linking polynucleotides | |
US20020164634A1 (en) | Methods for reducing complexity of nucleic acid samples | |
EP2820153B1 (en) | Method of identifying vdj recombination products | |
JP4669614B2 (ja) | 多型dnaフラグメントおよびその使用 | |
CN112251501A (zh) | 一种内参基因集合及其筛选方法、通用引物组、试剂盒、反应体系及应用 | |
CN112585279A (zh) | 一种rna建库方法及试剂盒 | |
US20060228714A1 (en) | Nucleic acid representations utilizing type IIB restriction endonuclease cleavage products | |
US20020055112A1 (en) | Methods for reducing complexity of nucleic acid samples | |
CN117089597A (zh) | 一种单细胞文库构建测序方法及其应用 | |
CN114807305A (zh) | 一种构建原核生物单细胞rna测序文库的方法 | |
CN102559856A (zh) | 去除测序文库中的载体片段的方法 | |
US20060240431A1 (en) | Oligonucletide guided analysis of gene expression | |
CN114657646A (zh) | 一种构建原核生物rna测序文库的方法 | |
US20230094911A1 (en) | Solid Supports and Methods for Depleting and/or Enriching Library Fragments Prepared from Biosamples | |
CA2419613A1 (en) | Methods for reducing complexity of nucleic acid samples | |
CN117545852A (zh) | 用于消耗和/或富集由生物样品制备的文库片段的固体载体和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |