CN114645330A - 一种病原体宏转录组测序文库的制备方法、试剂盒及筛选感染病原体的方法和装置 - Google Patents
一种病原体宏转录组测序文库的制备方法、试剂盒及筛选感染病原体的方法和装置 Download PDFInfo
- Publication number
- CN114645330A CN114645330A CN202011520074.XA CN202011520074A CN114645330A CN 114645330 A CN114645330 A CN 114645330A CN 202011520074 A CN202011520074 A CN 202011520074A CN 114645330 A CN114645330 A CN 114645330A
- Authority
- CN
- China
- Prior art keywords
- sample
- module
- sequencing
- host
- seq
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012163 sequencing technique Methods 0.000 title claims abstract description 101
- 244000052769 pathogen Species 0.000 title claims abstract description 91
- 230000001717 pathogenic effect Effects 0.000 title claims abstract description 54
- 238000012216 screening Methods 0.000 title claims abstract description 33
- 208000015181 infectious disease Diseases 0.000 title claims abstract description 30
- 238000002360 preparation method Methods 0.000 title claims abstract description 12
- 238000000034 method Methods 0.000 title claims description 38
- 238000006243 chemical reaction Methods 0.000 claims abstract description 52
- 230000002458 infectious effect Effects 0.000 claims abstract description 10
- 108090000623 proteins and genes Proteins 0.000 claims description 117
- 239000000523 sample Substances 0.000 claims description 102
- 244000005700 microbiome Species 0.000 claims description 63
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 60
- 238000010839 reverse transcription Methods 0.000 claims description 41
- 108010012306 Tn5 transposase Proteins 0.000 claims description 39
- 239000013068 control sample Substances 0.000 claims description 36
- 239000000872 buffer Substances 0.000 claims description 32
- 238000001514 detection method Methods 0.000 claims description 31
- 238000010201 enrichment analysis Methods 0.000 claims description 27
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 claims description 24
- 230000014509 gene expression Effects 0.000 claims description 22
- 230000001105 regulatory effect Effects 0.000 claims description 22
- 230000004044 response Effects 0.000 claims description 20
- 238000012360 testing method Methods 0.000 claims description 18
- 238000013467 fragmentation Methods 0.000 claims description 17
- 238000006062 fragmentation reaction Methods 0.000 claims description 17
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 claims description 14
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 claims description 14
- 239000007853 buffer solution Substances 0.000 claims description 13
- 241000894007 species Species 0.000 claims description 13
- 239000004353 Polyethylene glycol 8000 Substances 0.000 claims description 12
- 239000011324 bead Substances 0.000 claims description 12
- 229910001629 magnesium chloride Inorganic materials 0.000 claims description 12
- 229940113115 polyethylene glycol 200 Drugs 0.000 claims description 12
- 229940085678 polyethylene glycol 8000 Drugs 0.000 claims description 12
- 235000019446 polyethylene glycol 8000 Nutrition 0.000 claims description 12
- 239000003161 ribonuclease inhibitor Substances 0.000 claims description 12
- 241000700605 Viruses Species 0.000 claims description 11
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 claims description 10
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 claims description 9
- 238000012408 PCR amplification Methods 0.000 claims description 9
- 206010036790 Productive cough Diseases 0.000 claims description 9
- 238000002123 RNA extraction Methods 0.000 claims description 9
- 208000024794 sputum Diseases 0.000 claims description 9
- 210000003802 sputum Anatomy 0.000 claims description 9
- 210000001124 body fluid Anatomy 0.000 claims description 8
- 230000028327 secretion Effects 0.000 claims description 8
- 230000029142 excretion Effects 0.000 claims description 7
- 239000012530 fluid Substances 0.000 claims description 7
- 108020004418 ribosomal RNA Proteins 0.000 claims description 7
- 239000012678 infectious agent Substances 0.000 claims description 6
- 241000894006 Bacteria Species 0.000 claims description 5
- 241000233866 Fungi Species 0.000 claims description 5
- 239000010839 body fluid Substances 0.000 claims description 5
- DEQXHPXOGUSHDX-UHFFFAOYSA-N methylaminomethanetriol;hydrochloride Chemical compound Cl.CNC(O)(O)O DEQXHPXOGUSHDX-UHFFFAOYSA-N 0.000 claims description 5
- 241000606161 Chlamydia Species 0.000 claims description 4
- 241000204031 Mycoplasma Species 0.000 claims description 4
- 244000045947 parasite Species 0.000 claims description 4
- 206010034133 Pathogen resistance Diseases 0.000 claims description 3
- 230000009471 action Effects 0.000 claims description 3
- 238000003556 assay Methods 0.000 claims description 3
- 238000000746 purification Methods 0.000 claims description 3
- 210000003608 fece Anatomy 0.000 claims 1
- 238000004458 analytical method Methods 0.000 abstract description 11
- 238000003759 clinical diagnosis Methods 0.000 abstract description 4
- 230000005745 host immune response Effects 0.000 abstract description 4
- 238000012512 characterization method Methods 0.000 abstract description 3
- 230000003993 interaction Effects 0.000 abstract 1
- 238000003752 polymerase chain reaction Methods 0.000 description 38
- 108020004414 DNA Proteins 0.000 description 32
- 239000000203 mixture Substances 0.000 description 15
- 239000000047 product Substances 0.000 description 13
- 239000000243 solution Substances 0.000 description 10
- 230000003321 amplification Effects 0.000 description 9
- 238000003199 nucleic acid amplification method Methods 0.000 description 9
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 8
- 235000019333 sodium laurylsulphate Nutrition 0.000 description 7
- 230000031018 biological processes and functions Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 239000013610 patient sample Substances 0.000 description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- 102100034343 Integrase Human genes 0.000 description 5
- 241000588747 Klebsiella pneumoniae Species 0.000 description 5
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 5
- 239000006228 supernatant Substances 0.000 description 5
- 208000024891 symptom Diseases 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- 230000009385 viral infection Effects 0.000 description 5
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 4
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- 230000003115 biocidal effect Effects 0.000 description 4
- 238000010195 expression analysis Methods 0.000 description 4
- 230000028993 immune response Effects 0.000 description 4
- 244000005706 microflora Species 0.000 description 4
- 108020004707 nucleic acids Proteins 0.000 description 4
- 150000007523 nucleic acids Chemical class 0.000 description 4
- 102000039446 nucleic acids Human genes 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000000241 respiratory effect Effects 0.000 description 4
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 208000036142 Viral infection Diseases 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000000875 corresponding effect Effects 0.000 description 3
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 3
- 239000012634 fragment Substances 0.000 description 3
- 230000000813 microbial effect Effects 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 239000011535 reaction buffer Substances 0.000 description 3
- 238000003753 real-time PCR Methods 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 239000001226 triphosphate Substances 0.000 description 3
- 235000011178 triphosphate Nutrition 0.000 description 3
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 3
- 241001678559 COVID-19 virus Species 0.000 description 2
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 2
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 2
- 101001033249 Homo sapiens Interleukin-1 beta Proteins 0.000 description 2
- 102100039065 Interleukin-1 beta Human genes 0.000 description 2
- 238000010802 RNA extraction kit Methods 0.000 description 2
- 241000008910 Severe acute respiratory syndrome-related coronavirus Species 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 238000007622 bioinformatic analysis Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000009274 differential gene expression Effects 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000000899 immune system response Effects 0.000 description 2
- PHTQWCKDNZKARW-UHFFFAOYSA-N isoamylol Chemical compound CC(C)CCO PHTQWCKDNZKARW-UHFFFAOYSA-N 0.000 description 2
- 239000001103 potassium chloride Substances 0.000 description 2
- 235000011164 potassium chloride Nutrition 0.000 description 2
- 230000012423 response to bacterium Effects 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 230000003827 upregulation Effects 0.000 description 2
- YMZPQKXPKZZSFV-CPWYAANMSA-N 2-[3-[(1r)-1-[(2s)-1-[(2s)-2-[(1r)-cyclohex-2-en-1-yl]-2-(3,4,5-trimethoxyphenyl)acetyl]piperidine-2-carbonyl]oxy-3-(3,4-dimethoxyphenyl)propyl]phenoxy]acetic acid Chemical compound C1=C(OC)C(OC)=CC=C1CC[C@H](C=1C=C(OCC(O)=O)C=CC=1)OC(=O)[C@H]1N(C(=O)[C@@H]([C@H]2C=CCCC2)C=2C=C(OC)C(OC)=C(OC)C=2)CCCC1 YMZPQKXPKZZSFV-CPWYAANMSA-N 0.000 description 1
- GXAFMKJFWWBYNW-OWHBQTKESA-N 2-[3-[(1r)-1-[(2s)-1-[(2s)-3-cyclopropyl-2-(3,4,5-trimethoxyphenyl)propanoyl]piperidine-2-carbonyl]oxy-3-(3,4-dimethoxyphenyl)propyl]phenoxy]acetic acid Chemical compound C1=C(OC)C(OC)=CC=C1CC[C@H](C=1C=C(OCC(O)=O)C=CC=1)OC(=O)[C@H]1N(C(=O)[C@@H](CC2CC2)C=2C=C(OC)C(OC)=C(OC)C=2)CCCC1 GXAFMKJFWWBYNW-OWHBQTKESA-N 0.000 description 1
- 241000588626 Acinetobacter baumannii Species 0.000 description 1
- 102100040006 Annexin A1 Human genes 0.000 description 1
- VBHNUSLICDXYSJ-UHFFFAOYSA-N C1CN(C(CN1)CCO)S(=O)(=S)O Chemical compound C1CN(C(CN1)CCO)S(=O)(=S)O VBHNUSLICDXYSJ-UHFFFAOYSA-N 0.000 description 1
- 102100025597 Caspase-4 Human genes 0.000 description 1
- 208000003322 Coinfection Diseases 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 102100023226 Early growth response protein 1 Human genes 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 229920002527 Glycogen Polymers 0.000 description 1
- 102100028976 HLA class I histocompatibility antigen, B alpha chain Human genes 0.000 description 1
- 102100028971 HLA class I histocompatibility antigen, C alpha chain Human genes 0.000 description 1
- 108010058607 HLA-B Antigens Proteins 0.000 description 1
- 108010052199 HLA-C Antigens Proteins 0.000 description 1
- 241000606766 Haemophilus parainfluenzae Species 0.000 description 1
- 101000959738 Homo sapiens Annexin A1 Proteins 0.000 description 1
- 101000933112 Homo sapiens Caspase-4 Proteins 0.000 description 1
- 101001049697 Homo sapiens Early growth response protein 1 Proteins 0.000 description 1
- 101000840275 Homo sapiens Interferon alpha-inducible protein 27, mitochondrial Proteins 0.000 description 1
- 101001082058 Homo sapiens Interferon-induced protein with tetratricopeptide repeats 2 Proteins 0.000 description 1
- 101001082060 Homo sapiens Interferon-induced protein with tetratricopeptide repeats 3 Proteins 0.000 description 1
- 101001034844 Homo sapiens Interferon-induced transmembrane protein 1 Proteins 0.000 description 1
- 101001034842 Homo sapiens Interferon-induced transmembrane protein 2 Proteins 0.000 description 1
- 101001034846 Homo sapiens Interferon-induced transmembrane protein 3 Proteins 0.000 description 1
- 101000998140 Homo sapiens Interleukin-36 alpha Proteins 0.000 description 1
- 101000614442 Homo sapiens Keratin, type I cytoskeletal 16 Proteins 0.000 description 1
- 101000861454 Homo sapiens Protein c-Fos Proteins 0.000 description 1
- 101001057508 Homo sapiens Ubiquitin-like protein ISG15 Proteins 0.000 description 1
- 108091058560 IL8 Proteins 0.000 description 1
- 102000002227 Interferon Type I Human genes 0.000 description 1
- 108010014726 Interferon Type I Proteins 0.000 description 1
- 102100029604 Interferon alpha-inducible protein 27, mitochondrial Human genes 0.000 description 1
- 102100027303 Interferon-induced protein with tetratricopeptide repeats 2 Human genes 0.000 description 1
- 102100027302 Interferon-induced protein with tetratricopeptide repeats 3 Human genes 0.000 description 1
- 102100040021 Interferon-induced transmembrane protein 1 Human genes 0.000 description 1
- 102100040020 Interferon-induced transmembrane protein 2 Human genes 0.000 description 1
- 102100040035 Interferon-induced transmembrane protein 3 Human genes 0.000 description 1
- 102100033474 Interleukin-36 alpha Human genes 0.000 description 1
- 102000004890 Interleukin-8 Human genes 0.000 description 1
- 108090001007 Interleukin-8 Proteins 0.000 description 1
- 102000002791 Interleukin-8B Receptors Human genes 0.000 description 1
- 108010018951 Interleukin-8B Receptors Proteins 0.000 description 1
- 102100040441 Keratin, type I cytoskeletal 16 Human genes 0.000 description 1
- 206010061259 Klebsiella infection Diseases 0.000 description 1
- 241001646834 Mesona Species 0.000 description 1
- 241000588650 Neisseria meningitidis Species 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 1
- 102100027584 Protein c-Fos Human genes 0.000 description 1
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 1
- 206010057190 Respiratory tract infections Diseases 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 229930189077 Rifamycin Natural products 0.000 description 1
- 101150060340 S100a8 gene Proteins 0.000 description 1
- 101150012953 S100a9 gene Proteins 0.000 description 1
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 1
- 241000193998 Streptococcus pneumoniae Species 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 229920004890 Triton X-100 Polymers 0.000 description 1
- 239000013504 Triton X-100 Substances 0.000 description 1
- 102100027266 Ubiquitin-like protein ISG15 Human genes 0.000 description 1
- 206010046306 Upper respiratory tract infection Diseases 0.000 description 1
- 108020000999 Viral RNA Proteins 0.000 description 1
- 229940126575 aminoglycoside Drugs 0.000 description 1
- -1 aminoglycoside Chemical class 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 238000005251 capillar electrophoresis Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 230000004665 defense response Effects 0.000 description 1
- 231100000676 disease causative agent Toxicity 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 229940124307 fluoroquinolone Drugs 0.000 description 1
- 229940096919 glycogen Drugs 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000003120 macrolide antibiotic agent Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 230000007112 pro inflammatory response Effects 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 239000000376 reactant Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 208000023504 respiratory system disease Diseases 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 229960003292 rifamycin Drugs 0.000 description 1
- HJYYPODYNSCCOU-ODRIEIDWSA-N rifamycin SV Chemical compound OC1=C(C(O)=C2C)C3=C(O)C=C1NC(=O)\C(C)=C/C=C/[C@H](C)[C@H](O)[C@@H](C)[C@@H](O)[C@@H](C)[C@H](OC(C)=O)[C@H](C)[C@@H](OC)\C=C\O[C@@]1(C)OC2=C3C1=O HJYYPODYNSCCOU-ODRIEIDWSA-N 0.000 description 1
- 238000011451 sequencing strategy Methods 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 239000001632 sodium acetate Substances 0.000 description 1
- 235000017281 sodium acetate Nutrition 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 229940031000 streptococcus pneumoniae Drugs 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 230000005758 transcription activity Effects 0.000 description 1
- 241001529453 unidentified herpesvirus Species 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- 150000003952 β-lactams Chemical class 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B50/00—Methods of creating libraries, e.g. combinatorial synthesis
- C40B50/06—Biochemical methods, e.g. using enzymes or whole viable microorganisms
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Molecular Biology (AREA)
- Zoology (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- Analytical Chemistry (AREA)
- Biotechnology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明实施例提供了一种病原体的宏转录组测序文库的制备方法、试剂盒及筛选感染病原体的生物信息分析方法和装置;本发明实施例提供的宏转录组测序样品的制备方法、试剂盒及筛选感染病原体的生物信息分析方法,利用一次宏转录组测序反应,可同时进行多种潜在病原体的鉴定和宿主免疫响应的表征,综合多维度信息,直接筛选出可能感染的已知或未知病原体,反映病原体与宿主的相互作用,为后续临床诊断提供有力指导。
Description
技术领域
本发明涉及宏转录组测序技术领域,特别是涉及一种病原体宏转录组测序文库的制备方法、试剂盒及筛选感染病原体的生物信息分析方法和装置。
背景技术
临床常见的病原体检测方法有病原体培养、荧光PCR和抗体抗原检测等。一方面,这些技术都需要先验知识,只能检测已知的病原体,具有偏好性;另一方面,这些方法通量较低,可同时检测的病原体种类有限,检测往往需要的较长的时间。基于这些问题,亟需一种全病原体的快速筛选方法,能够通过一次操作就可以直接鉴定出众多已知和未知的病原体,减少检测种类,缩短检测时间,为临床诊断及用药提供指导。
发明内容
本申请的目的在于提供一种病原体宏转录组测序文库的制备方法、试剂盒及筛选感染病原体的生物信息分析方法和装置,以实现感染病原体的快速筛选。
本申请第一方面提供了一种病原体宏转录组测序文库的制备方法,其包括以下步骤:
(1)提取待测样品的总RNA,通过逆转录获得含有RNA/DNA杂交链的逆转录产物;其中,所述逆转录的反应体系中包含2-3μM的随机六聚体;
(2)将所述RNA/DNA杂交链在打断缓冲液中,在Tn5转座酶复合体作用下打断并接上测序接头后,向反应体系中加入十二烷基硫酸钠,室温孵育3-7分钟终止反应,获得片段化产物;
其中,所述打断缓冲液包括:终浓度为0.8-1.2U/μL RNA酶抑制剂,9-11mM,pH=7.0-8.0 的三羟甲基氨基甲烷盐酸缓冲液,4-6mM氯化镁,7-9%(w/v)聚乙二醇8000,以及4-6%(w/v) 的聚乙二醇200;所述RNA/DNA杂交链在打断缓冲液中的浓度为0.1-10ng/μL;所述Tn5转座酶复合体包含Tn5转座酶和SEQ ID No.1、SEQ ID No.2、SEQ ID No.3所示的引物;所述 Tn5转座酶复合体在打断缓冲液中的浓度为1-3ng/μL;所述十二烷基硫酸钠的终浓度为 0.03-0.05%(w/v);所述打断的反应条件为54-56℃,13-17分钟;
(3)将所述片段化产物进行链延伸以及PCR反应,获得宏转录组测序文库;其中,链延伸采用Bst 3.0DNA聚合酶;PCR采用热启动DNA聚合酶以及SEQ ID No.4和SEQ ID No.5所示的引物。
本申请第二方面提供了一种病原体宏转录组测序文库制备试剂盒,其包括:逆转录反应体系、Tn5转座酶复合体、RNA酶抑制剂、打断缓冲液、十二烷基硫酸钠、Bst 3.0DNA聚合酶、热启动DNA聚合酶、PCR反应体系以及SEQ ID No.4和SEQ ID No.5所示的引物;
其中,所述逆转录反应体系包含随机六聚体;
所述Tn5转座酶复合体包含Tn5转座酶和SEQ ID No.1、SEQ ID No.2、SEQ ID No.3所示的引物;
所述打断缓冲液包括:终浓度为0.8-1.2U/μL RNA酶抑制剂,9-11mM,pH7.0-8.0的三羟甲基氨基甲烷盐酸缓冲液,4-6mM氯化镁,7-9%(w/v)聚乙二醇8000,以及4-6%(w/v)的聚乙二醇200。
本申请第三方面提供了一种用于筛选感染病原体的生物信息分析方法,其包括:
(1)采用本申请第一方面提供的方法制备待测样品和对照样品的宏转录组测序文库;
(2)将所述宏转录组测序文库进行二代测序,获得测序结果的fastq文件;
(3)对fastq文件进行筛选,去除fastq文件中低质量碱基,测序接头序列及长度低于 20bp的序列和宿主核糖体RNA的序列;
(4)从步骤(3)的筛选后的序列中,获得待测样品与对照样品之间差异表达的宿主基因的功能富集分析结果;
(5)去掉步骤(4)中比对到宿主基因的序列,从剩余的序列中,鉴定待测样品与对照样品中已知微生物的相对丰度及其基因的表达差异;
(6)判定步骤(4)中得到的宿主基因功能富集分析结果中上调基因的功能,与步骤(5)中鉴定到的待测样品中丰度高于对照样品的微生物是否相关,如相关,则判定所述微生物为感染的病原体;
(7)如宿主基因功能富集分析结果中上调基因的功能与鉴定到的待测样品中丰度高于对照样品的微生物不相关,则判定存在未知微生物;
从头组装出未知微生物的基因组,在NCBI NT数据库中搜索与从头组装的基因组相近的物种基因组,以鉴定待测样品中的未知微生物种类,所述未知微生物即推测为感染的病原体。
本申请第四方面提供了一种用于筛选感染病原体的装置,其包括:RNA提取模块、逆转录模块、片段化模块、链延伸及PCR模块、测序模块、序列筛选模块、宿主响应检测模块、已知微生物鉴定模块、匹配判定模块以及未知微生物鉴定模块;
所述RNA提取模块,用于提取待测样品的总RNA;
所述逆转录模块,用于将RNA提取模块中获得的总RNA进行逆转录,从而获得 RNA/DNA杂交链;其中,所述逆转录的反应体系中包含2-3μM的随机六聚体;
所述片段化模块,用于在打断缓冲液中,采用Tn5转座酶复合体将所述RNA/DNA杂交链片段化并接上测序接头;其中,所述打断缓冲液包括:终浓度为0.8-1.2U/μL RNA酶抑制剂,9-11mM,pH7.0-8.0的三羟甲基氨基甲烷盐酸缓冲液,4-6mM氯化镁,7-9%(w/v) 聚乙二醇8000,以及4-6%(w/v)的聚乙二醇200;所述Tn5转座酶复合体包含Tn5转座酶和 SEQID No.1、SEQ ID No.2、SEQ ID No.3所示的引物;
所述链延伸及PCR模块,用于将片段化后的RNA/DNA杂交链进行链延伸和PCR扩增,以获得宏转录组测序文库;其中,所述链延伸采用Bst 3.0DNA聚合酶,PCR扩增采用热启动DNA聚合酶,所述PCR扩增的引物如SEQ ID No.4和SEQ ID No.5所示;
所述测序模块,用于对所述宏转录组测序文库进行二代测序,获得测序结果的fastq文件;
所述序列筛选模块用于去除fastq文件中低质量碱基,测序接头序列、长度低于20bp 的序列和人核糖体RNA的序列;
所述宿主响应检测模块用于从序列筛选模块筛选后的序列中,获得待测样品与对照样品之间差异表达的宿主基因的功能富集分析结果;
所述已知微生物鉴定模块,用于从去掉宿主响应检测模块中比对到的宿主基因序列后的剩余序列中,鉴定待测样品与对照样品中已知微生物的相对丰度及其基因的表达差异;
所述匹配判定模块,用于判定宿主响应检测模块中鉴定的宿主基因功能富集分析结果中上调基因的功能,与已知微生物鉴定模块中获得的已知微生物鉴定结果中丰度高于对照样品的微生物是否相关;
所述未知微生物鉴定模块用于,当宿主基因功能富集分析结果中上调基因的功能与鉴定到的待测样品中丰度高于对照样品的微生物不相关时,从头组装未知微生物的基因组,在NCBI NT数据库中搜索与从头组装的基因组相近的物种基因组,鉴定待测样品中的未知微生物种类。
本申请提供的病原体宏转录组测序文库的制备方法、试剂盒及筛选感染病原体的生物信息分析方法和装置,利用一次宏转录组测序反应,可同时进行多种潜在病原体的鉴定和宿主免疫响应的表征,综合多维度信息,筛选出可能感染的病原体,为后续临床诊断及用药提供有力指导。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1A显示了待测样品及对照样品中鉴定到的宿主基因的数目;
图1B显示了待测样品与对照样品中人源基因的表达差异;
图1C显示了待测样品C31与对照样品中人源基因的差异表达的基因数量;
图1D显示了待测样品C31中的上调基因的基因功能富集分析结果;
图1E显示了待测样品C10、C12、C14、C13、C26、C45、D22、D42与对照样品中人源基因的差异表达的基因数量;
图1F显示了待测样品C10、C12、C14、C13、C26、C45、D22、D42中的上调基因的基因功能富集分析结果;
图1G显示了与免疫响应相关的上调基因在待测样品C10、C12、C14、C13、C26、C45、D22、D42及对照样品NC1和NC2中的表达情况;
图2A显示了各样品中不同来源的序列比例;
图2B显示了每个样品鉴定到的微生物群落的相对丰度做主坐标分析;
图2C显示了每个样品中鉴定到的可能的呼吸道病原体的相对丰度的分析结果;
图2D显示了细菌抗生素抗性基因的表达谱;
图3A显示了从头组装的病原体基因组结构及注释结果;
图3B显示了各测序样品可比对到新鉴定到的病原体参考基因组(从C14样本从头组装得到)的覆盖度和测序深度情况;
图3C显示了各测序样品比对到新鉴定到的病原体参考基因组的序列(从C14样本从头组装得到)占各测序样品所有序列的比例、对于参考基因组的覆盖度、平均测序深度和测序深度中位数。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请第一方面提供了一种病原体宏转录组测序样品的制备方法,其包括以下步骤:
(1)提取待测样品的总RNA,通过逆转录获得含有RNA/DNA杂交链的逆转录产物;其中,所述逆转录的反应体系中包含2-3μM的随机六聚体;
(2)将所述RNA/DNA杂交链在打断缓冲液中,在Tn5转座酶复合体作用下打断并接上测序接头后,向反应体系中加入十二烷基硫酸钠,室温孵育3-7分钟终止反应,获得片段化产物;
其中,所述打断缓冲液包括:终浓度为0.8-1.2U/μL RNA酶抑制剂,9-11mM,pH7.0-8.0 的三羟甲基氨基甲烷盐酸缓冲液,4-6mM氯化镁,7-9%(w/v)聚乙二醇8000,以及4-6%(w/v) 的聚乙二醇200;所述RNA/DNA杂交链在打断缓冲液中的浓度为0.1-10ng/μL;所述Tn5 转座酶复合体包含Tn5转座酶和三段引物,所述引物包括Tn5ME-A: 5’-TCGTCGGCAGCGTCAGATGTGT ATAAGAGACAG-3’(SEQ ID No.1)、Tn5ME-B:5′-GTCTCGTGGGCTCGGAGA TGTGTATAAGAGACAG-3′(SEQ ID No.2)和Tn5MErev: 5'-phos-CTGTCTCTTATACACATCT-3'(SEQ ID No.3);所述Tn5转座酶复合体在打断缓冲液中的浓度为1-3ng/μL;所述十二烷基硫酸钠的终浓度为0.03-0.05%(w/v);所述打断的反应条件为54-56℃,13-17分钟;
(3)将所述片段化产物进行链延伸以及PCR反应,获得宏转录组测序文库;其中,链延伸采用Bst 3.0DNA聚合酶;PCR采用热启动DNA聚合酶以及引物N5: 5'-AATGATACGGCGACCACCGAGATCTACACTAGATCGCTCGTCGG CAGCGTC-3′(SEQ ID No.4,N代表标签序列)和引物N7:5'-CAAGCAGAAG ACGGCATACGAGATNNNNNNNNGTCTCGTGGGCTCGG-3′(SEQ ID No.5,N代表标签序列)。
本申请对步骤(1)中提取待测样品的总RNA的方法不做限定,只要能实现本发明的目的即可,可采用现有技术提取,例如Trizol法或采用市售的RNA提取试剂盒,例如RneasyMiNi Kit(50)总RNA提取试剂盒等。
逆转录体系的差异影响逆转录结果,发明人在研究中出人意料地发现,当逆转录体系中加入2-3μM的随机六聚体,有利于无偏好性地获得更完整的待测样品中病原体的宏转录组,进而基于本申请的方法制备的病原体宏转录组测序文库,对病原体进行鉴定,能够获得更准确的结果。
本申请对步骤(1)中逆转录体系中其他组分的含量不做限定,只要能实现本申请的目的即可,例如所述逆转录的体系中还包括总RNA、Oligo d(T)23VN引物、脱氧核苷三磷酸混合物(dNTP mix)、聚乙二醇8000、第一链合成缓冲液、二硫苏糖醇、Superase-In以及逆转录酶等。其中,所述第一链合成缓冲液为本领域常用第一链合成缓冲液例如可以包括终浓度为50mM三羟甲基氨基甲烷盐酸缓冲液(Tris-HCl,pH 8.3),75mM氯化钾,3mM氯化镁。
本申请对逆转录酶的种类不做限定,只要能够实现本发明的目的即可,例如可以采用 Thermofisher公司的Superscript IV逆转录酶。
本申请对步骤(1)中逆转录的反应条件不做限定,只要能够实现本发明的目的即可,例如,反应条件可以包括:23-25℃,4-6分钟;50-55℃,10-12分钟;78-82℃,8-12分钟。
在现有技术的宏转录组测序样品制备中,Tn5转座酶复合体可以用来打断DNA双链,发明人在研究中意外地发现,Tn5转座酶复合体能够以RNA/DNA杂交链为底物。由于Tn5转座酶复合体能够直接用于打断RNA/DNA杂交链,因此在RNA文库构建过程中不需要由RNA/DNA杂交链再生成DNA双链,反应步骤的减少,且所有反应可以在一个试管中进行,有利于减少样品损失,提高灵敏度,从而使样品通过测序获得更多的病原体信息。
更为重要的是,发明人还发现,在打断缓冲液中加入一定浓度的聚乙二醇200,能够明显提高Tn5转座酶复合体对RNA/DNA杂交链的打断效果,提高文库构建效率,进一步影响宏转录组的测序结果,避免由于大量信息的丢失,导致无法实现病原体的有效筛选。
发明人发现,在一些优选地实施方式中,打断缓冲液中聚乙二醇200浓度为4-6%时,能够获得更好的打断效果。
发明人在研究中还发现,对片段化后的RNA/DNA杂交链进行链延伸时,需要采用具有逆转录活性的DNA聚合酶,发明人发现,当采用Bst 3.0DNA聚合酶时,具有更好的链延伸效果。本申请中对链延伸的反应条件不做限定,由所用酶的最适反应条件决定,只要能够实现本发明的目的即可,例如使用Bst 3.0DNA聚合酶时,链延伸反应温度可以为71-73℃,反应9-11分钟;然后采用94-96℃,4-6分钟终止延伸。链延伸的反应缓冲液可以采用与PCR 过程采用的热启动DNA聚合酶相同的反应缓冲液,本申请对热启动DNA聚合酶的种类不做限定,只要能实现本发明的目的即可,例如可采用Q5 DNA聚合酶,此时,链延伸和PCR缓冲液可采用纽英伦的热启动超保真PCR预混液。
本申请中采用热启动DNA聚合酶,由此,在95℃链延伸终止时,可以同时激活DNA聚合酶活性,从而可以在同一个PCR管中继续进行PCR反应;减少样品转移造成的样品及文库信息的损失,有利于提高结果的灵敏度和准确性。PCR反应的引物可以在95℃,热启动DNA聚合酶被激活后加入。
PCR反应条件可采用本领域常规的PCR反应条件,本申请在此不做限定,例如可以为:①98℃,30秒;②98℃,10秒;65℃,60秒;③65℃,5分钟;扩增循环数(步骤②的循环次数)根据总RNA投入量确定,RNA投入量越多,循环数越少,例如以2ng总RNA起始时,扩增18个循环;以20ng总RNA起始时,扩增14个循环;以200ng总RNA起始时,扩增11 个循环。
在本申请第一方面的一些实施方式中,宏转录组测序文库的制备还包括将所述宏转录组测序文库进行XP磁珠纯化。
在本申请第一方面的一些实施方式中,所述病原体包括病毒、细菌、真菌、支原体、衣原体或寄生虫中的至少一种。
在本申请第一方面的一些实施方式中,所述待测样品包括被病原体感染的宿主的体液、分泌物、排泄物、痰液、肺泡灌洗液中的至少一种,具体地,可以选自血液、鼻咽拭子、口咽拭子、尿液、粪便、痰液、肺泡灌洗液等的至少一种。
本申请第二方面提供了一种病原体宏转录组测序文库制备试剂盒,其包括:逆转录反应体系、Tn5转座酶复合体、打断缓冲液、十二烷基硫酸钠、Bst 3.0DNA聚合酶、PCR反应体系以及SEQ ID No.4和SEQ ID No.5所示的引物;
其中,所述逆转录反应体系包含随机六聚体,在一些实施方式中,所述逆转录反应体系还可以包括Oligo d(T)23VN引物、脱氧核苷三磷酸混合物以及逆转录酶;
所述Tn5转座酶复合体包含Tn5转座酶和SEQ ID No.1、SEQ ID No.2、SEQ ID No.3所示的引物;所述打断缓冲液包括:终浓度为0.8-1.2U/μL RNA酶抑制剂,9-11mM,pH=7.0-8.0 的三羟甲基氨基甲烷盐酸缓冲液,4-6mM氯化镁,7-9%(w/v)聚乙二醇8000,以及4-6%(w/v) 的聚乙二醇200。
在本申请第二方面的一些实施方式中,所述病原体包括病毒、细菌、真菌、支原体、衣原体或寄生虫中的至少一种。
本申请第三方面提供了一种用于筛选感染病原体的生物信息分析方法,其包括:
(1)采用本申请第一方面提供的方法制备待测样品和对照样品的宏转录组测序文库;
(2)将所述宏转录组测序文库进行二代测序,获得测序结果的fastq文件;
(3)对fastq文件进行筛选,去除fastq文件中低质量碱基,测序接头序列、长度低于 20bp的序列和宿主核糖体RNA的序列;
(4)从步骤(3)的筛选后的序列中,获得待测样品与对照样品之间差异表达的宿主基因的功能富集分析结果;
(5)去掉步骤(4)中比对到宿主基因的序列,从剩余的序列中,鉴定待测样品与对照样品中已知微生物的相对丰度及其基因的表达差异;
(6)判定步骤(4)中得到的宿主基因功能富集分析结果中上调基因的功能,与步骤(5)中鉴定到的待测样品中丰度高于对照样品的微生物是否相关,如相关,则判定所述微生物为感染的病原体;
(7)如宿主基因功能富集分析结果中上调基因的功能与鉴定到的待测样品中丰度高于对照样品的微生物不相关,则判定存在未知微生物;
从头组装出未知微生物的基因组,在NCBI NT数据库中搜索与从头组装的基因组相近的物种基因组,以鉴定待测样品中的未知微生物种类,所述未知微生物即判定为感染的病原体。
所述二代测序为本领域的常规技术手段,可通过专业的测序公司或仪器实现,例如采用因美纳公司的Hiseq X10测序平台。
所述fastq文件是一种存储了生物序列以及相应的质量评价的文本格式,是高通量测序的标准格式,本申请在此不做赘述。
本申请的筛选感染病原体的方法中,步骤(3)、(4)、(5)、(7)可以通过专业软件完成,本申请在此不做限定,只要能实现本发明的目的即可,例如步骤(3)中可采用TrimGalore (v0.6.4_dev),去掉fastq文件中低质量的碱基以及测序接头序列,最低质量值设为20,处理后保留长度大于20bp的序列;例如当所述宿主为人时,可以采用bowtie2(v2.2.9)将比对到人核糖体RNA的序列去掉;步骤(4)中对待测样品和对照样品进行基因差异表达分析可以采用EdgeR(V3.28.1),基因功能富集分析可以采用DAVID(v6.8);步骤(5)中,已知微生物鉴定可以使用Kraken2(v2.0.8-beta);步骤(7)中从头组装可采用MEGAHIT(v1.2.9)等。
本申请中,“低质量碱基”是指Phred分数<20的碱基片段。
本申请筛选感染病原体的方法,首先采用本申请的宏转录组测序文库的制备方法制备测序样品,通过本申请特定的逆转录体系对待测样品的总RNA进行逆转录,获得RNA/DNA 杂交链;利用Tn5转座酶打断RNA/DNA杂交链,并同时将接头序列分别连接在RNA/DNA杂交链的两条链上的活性,再利用Bst 3.0DNA聚合酶进行链延伸后,PCR扩增富集连有测序接头的RNA/DNA杂交链,使得测序样品中保留了更多的待测样品的RNA信息,有助于对待测样品中含量较少的病原体,尤其是病原体中的RNA信息的检测。后续利用生信手段对测序数据进行分析,通过鉴定出待测样品与对照样品之间差异表达的基因,进而表征宿主的免疫响应,此外,鉴定出待测样品中潜在的病原体的序列及其相对丰度,结合宿主免疫响应结果,以判别可能存在的感染病原体;进一步,通过从头组装,得到未知病原体的基因组,从而实现对未知病原体的判定。即本申请通过病原体宏转录组测序文库的制备方法制备测序样品,通过一次宏转录组测序反应,可同时进行多种病原体的鉴定和宿主免疫响应的表征,提高对病原体感染的判别能力,可减少现有病原体培养、荧光PCR和抗体抗原检测,由于对感染的病原体没有预判,盲目检测和培养造成的时间和试剂耗材的浪费,提高了病原体的检测效率。
本申请的用于筛选感染病原体的生物信息分析方法的待测样品和对照样品可以为患有某种感染性疾病的人和未有感染症状的人,此时,本申请的用于筛选感染病原体的生物信息分析方法可以用于临床检测感染病原体。
在本申请第三方面的一些实施方式中,还包括将步骤(5)中,去掉步骤(4)中比对到宿主基因的序列,将剩余的序列与抗性基因数据库比对,表征抗性基因的表达情况。
本申请中的抗性基因数据库可以选自已知的任何一个抗性基因数据库,本申请在此不做限定,例如CARD抗性基因数据库,可通过RGI(v5.1.1)软件进行比对。本申请获得的抗性基因的表达情况可以用于表征微生物耐药基因的表达情况,进一步对于抗生素的使用具有指导作用。
在本申请第三方面的一些实施方式中,所述待测样品包括被病原体感染的宿主的体液、分泌物、排泄物、痰液、肺泡灌洗液中的至少一种;所述对照样品包括未被病原体感染的个体的体液、分泌物、排泄物、痰液、肺泡灌洗液中的至少一种;其中,所述“个体”表示与所述“宿主”相同的物种的其他个体,例如当检测人感染的病原体时,所述宿主为具有感染症状的患者,所述待测样品指来自所述患者的体液、分泌物、排泄物、痰液、肺泡灌洗液中的至少一种;所述对照样品指来自不具有感染症状的健康人的体液、分泌物、排泄物、痰液、肺泡灌洗液中的至少一种;其中,待测样品和对照样品分别采自患者和健康人的相同部位,例如均为鼻咽拭子等。本领域技术人员可根据与感染的相关程度具体选择待测样品的种类,本申请在此不做限定。
本申请第四方面提供了一种用于筛选感染病原体的装置,其包括:RNA提取模块、逆转录模块、片段化模块、链延伸及PCR模块、测序模块、序列筛选模块、宿主响应检测模块、已知微生物鉴定模块、匹配判定模块以及未知微生物鉴定模块;
所述RNA提取模块,用于提取待测样品的总RNA;
所述逆转录模块,用于将RNA提取模块中获得的总RNA进行逆转录,从而获得 RNA/DNA杂交链;其中,所述逆转录的反应体系中包含2-3μM的随机六聚体;
所述片段化模块,用于在打断缓冲液中,采用Tn5转座酶复合体将所述RNA/DNA杂交链片段化并接上测序接头;其中,所述打断缓冲液包括:终浓度为0.8-1.2U/μL RNA酶抑制剂,9-11mM,pH=7.0-8.0的三羟甲基氨基甲烷盐酸缓冲液,4-6mM氯化镁,7-9%(w/v) 聚乙二醇8000,以及4-6%(w/v)的聚乙二醇200;所述Tn5转座酶复合体包含Tn5转座酶和 SEQID No.1、SEQ ID No.2、SEQ ID No.3所示的引物;
所述链延伸及PCR模块,用于将片段化后的RNA/DNA杂交链进行链延伸和PCR扩增,以获得宏转录组测序文库;其中,所述链延伸采用Bst 3.0 DNA聚合酶,PCR扩增采用热启动DNA聚合酶,所述PCR扩增的引物如SEQ ID No.4和SEQ ID No.5所示;
所述测序模块,用于对所述宏转录组测序文库进行二代测序,获得测序结果的fastq文件;
所述序列筛选模块用于去除fastq文件中低质量碱基,测序接头序列、长度低于20bp 的序列和人核糖体RNA的序列;
所述宿主响应检测模块用于从序列筛选模块筛选后的序列中,获得待测样品与对照样品之间差异表达的宿主基因的功能富集分析结果;
所述已知微生物鉴定模块,用于从去掉宿主响应检测模块中比对到的宿主基因序列后的剩余序列中,鉴定待测样品与对照样品中已知微生物的相对丰度及其基因的表达差异;
所述匹配判定模块,用于判定宿主响应检测模块中鉴定的宿主基因功能富集分析结果中上调基因的功能,与已知微生物鉴定模块中获得的已知微生物鉴定结果中丰度高于对照样品的微生物是否相关;
所述未知微生物鉴定模块用于,当宿主基因功能富集分析结果中上调基因的功能与鉴定到的待测样品中丰度高于对照样品的微生物不相关时,从头组装未知微生物的基因组,在NCBI NT数据库中搜索与从头组装的基因组相近的物种基因组,鉴定待测样品中的未知微生物种类。
在本申请第四方面的一些实施方式中,所述装置还包括抗性基因检测模块,所述抗性基因检测模块用于将已知微生物鉴定模块中得到的,去掉宿主响应检测模块中比对到的宿主基因序列后的剩余序列,与抗性基因数据库比对,表征细菌抗性基因的表达情况。
以下,基于实施例对本申请进行具体地说明,但本申请并不限于这些实施例。
实施例1、待测样品全RNA提取
a)核酸提取
取人咽拭子样品11份(其中9份样品来自有上呼吸道感染症状的患者,2份样品来自无感染症状的健康人),按QIAGEN的QIAamp Viral RNA Mini Kit(#52904)试剂盒说明书操作,最后用40μl无核酸酶的水洗脱两次,得到15个样品的各80μl核酸溶液。
b)基因组去除
i.向步骤a)中的核酸溶液中加入1μl DNase I(无Rnase,纽英伦,#M0303S),10μl10 ×DNase反应缓冲液(纽英伦,#M0303S),9μl无核酸酶的水,37℃孵育10分钟。
ii.取一管phase lock gel light(天根,#WM5-2302820)于室温离心机中12,000g离心30 秒。
iii.将步骤i中得到的DNase I处理后的核酸溶液(100μl)转移至phase lock gellight 中,再加入100μl无核酸酶的水。
iv.加入200μl酚:氯仿:异戊醇(体积比25:24:1,pH<5.0,索莱宝,#P1011),用手剧烈摇晃15秒,室温静置2分钟。
v.12,000g,室温离心5分钟。
vi.加入200μl氯仿:异戊醇(体积比:24:1,索莱宝,#P1014),用手剧烈摇晃15秒,室温静置2分钟。
vii.最大转速,室温离心5分钟。
viii.转移上清至新的无RNase的1.5ml EP管中,加入1/10体积的3mol/L醋酸钠,4μl glycogen(赛默飞,#AM9510),2.5倍体积的100%乙醇,置于-20冰箱中至少1小时。
ix.12,000g,4℃离心30分钟。
x.弃上清,加入1ml 75%乙醇,上下颠倒几次,12,000g,4℃离心5分钟。
xi.重复步骤x。
xii.弃上清,室温晾干5分钟。
xiii.加入10μl无核酸酶的水,充分溶解,获得待测样品总RNA溶液。
实施例2、逆转录
i.于冰上在无RNA酶的PCR管中加入1.5μl待测样品总RNA溶液(RNA含量2 ng-200ng),0.25μl 50μM Oligo d(T)23VN引物(纽英伦,#S1327S),0.25μl 50μM随机六聚体(赛默飞,#N8080127),0.25μl 10mM脱氧核苷三磷酸混合物(dNTP mix,纽英伦,#N0447S),充分混匀后,置于PCR仪内,进行如下反应程序:65℃,5分钟,取出后立刻置于冰上1分钟。
ii.在上步的PCR管中加入0.75μl 50%聚乙二醇8000,1μl 5×第一链合成缓冲液(250 mM三羟甲基氨基甲烷盐酸缓冲液(Tris-HCl,pH 8.3),375mM氯化钾,15mM氯化镁),0.25μl 0.1M二硫苏糖醇,0.5μl Superase-In(赛默飞,#AM2694),0.25μl SuperScript IV逆转录酶(赛默飞,#18090010);充分混匀后,置于PCR仪内,进行如下反应程序:23℃,5 分钟;55℃,10分钟;80℃,10分钟,获得含有RNA/DNA杂交链的逆转录产物。
实施例3、Tn5转座酶复合体组装
i.使用退火缓冲液(10mM Tris-HCl(pH 7.0),10mM NaCl)将合成的引物粉末Tn5ME-A:5′-TCGTCGGCAGCGTCAGATGTGTATAAGAGACAG-3′(SEQ ID No.1); Tn5ME-B:5′-GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG-3′(SEQ ID No.2)和 Tn5Merev:5'-phos-CTGTCTCTTATACACATCT-3'(SEQ ID No.3)溶解至10μM;取10μl Tn5ME-A与10μl Tn5MErev混合,另取10μl的Tn5ME-B与10μl Tn5MErev混合,分别置于PCR仪内,进行如下反应程序:94℃,5min,以1℃/min的降温速度将温度降至10℃。
ii.反应结束后,将步骤i得到的两个反应物混合,混匀,记为接头混合物(AdapterMix),直接用于下步反应。
iii.在100μl反应体系中加入8μl Tn5转座酶(诺唯赞,#S601),14μl接头混合物,78μl组装缓冲液(55mM羟乙基哌秦乙硫磺酸缓冲液(pH 7.2),0.11mM乙二胺四乙酸,0.11mol/L氯化钠,0.11%Triton X-100,1.1mM二硫苏糖醇,55%甘油),混匀,置于PCR仪内, 30℃反应1小时,记为Tn5转座酶复合体,保存于-20℃。
实施例4、逆转录产物片段化
i.向实施例2的逆转录产物中加入1μl SUPERase-In RNA酶抑制剂(赛默飞,#AM2694), 8μl打断缓冲液(25mM三羟甲基氨基甲烷盐酸缓冲液(pH 7.5),25mM氯化镁,20%v/v 聚乙二醇8000,12.5%v/v聚乙二醇200),0.5μl-1.5μl Tn5转座酶复合体(以2ng总RNA起始时,加入0.5μl;以20ng总RNA起始时,加入1μl;以200ng总RNA起始时,加入 1.5μl),再加入相应体积的水使反应体系为20μl。充分混匀后,置于PCR仪内,进行如下反应程序:55℃,15分钟。
ii.反应结束后,加入5μl 0.2%(m/v)十二烷基硫酸钠溶液,室温静置孵育5分钟,获得片段化产物。
实施例5、链延伸及聚合酶链式反应
i.在实施例4中获得的片段化产物中加入2.4μl Bst 3.0DNA聚合酶(纽英伦,#M0374L), 30μl热启动超保真PCR预混液(纽英伦,#M0543L),充分混匀后,置于 PCR仪内,进行如下反应程序:72℃,10分钟;95℃,5分钟。
ii.在上步的PCR管中加入1.3μl 10μM N5 PCR引物 (5'-AATGATACGGCGACCACCGAGATCTACACTAGATCGCTCGTCGGCAGCGTC-3′,N 代表标签序列)和1.3μl 10μM N7 PCR引物(5'-CAAGCAGAAGACGGCATACGA GATNNNNNNNNGTCTCGTGGGCTCGG-3′,N代表标签序列),充分混匀后,置于PCR仪内,进行如下反应程序:98℃,30秒;98℃,10秒;65℃,60秒;65℃,5分钟。扩增循环数根据总RNA投入量确定,以2ng总RNA起始时,扩增18个循环;以20ng总RNA起始时,扩增14个循环;以200ng总RNA起始时,扩增11个循环,获得PCR产物。
实施例6、XP磁珠纯化
i.使用涡旋震荡仪彻底震荡AMPure XP磁珠(0.8×,贝克曼库尔特),室温孵育半小时。
ii.将48μl AMPure XP磁珠添加到实施例5的PCR产物中,用移液枪轻轻混合。
iii.室温孵育5分钟。
iv.将EP管转移到磁力架上,静置5分钟,至磁珠被吸引到磁力架一侧或混合液变澄清。
v.小心弃上清液,注意不要接触磁珠。
vi.加入200μl新配的80%v/v乙醇溶液。
vii.片刻后,小心地除去并丢弃乙醇,注意不要接触磁珠。
viii.重复一次vi和vii。
ix.打开试管盖,静置5分钟,或直到沉淀磁珠表面失去光泽。
x.将晾干的磁珠重悬于10μl水中,用移液枪轻轻混合,室温放置5分钟。
xi.将试管转移到磁力架上,静置5分钟,至磁珠被吸引到磁力架一侧或混合液变澄清。
xii.转移8μl上清到新的1.5mL EP管中,确保没有磁珠转移到该管中,即为文库样品。
实施例7、文库质量检测及测序
i.取实施例6获得的文库样品,使用Qubit 4荧光计(赛默飞,#Q33238)进行定量。
ii.取文库样品5ng(以DNA计)在Agilent 2100Bioanalyzer毛细电泳仪上进行文库 DNA片段大小分布检测,文库DNA片段平均大小为300bp为最佳。
iii.文库测序
文库采用双端150bp的测序策略,使用因美纳公司的Hiseq X10测序平台进行测序,获得测序结果的fastq文件。
实施例8.文库测序结果数据处理
i.使用Trim Galore(v0.6.4_dev)去掉fastq文件中低质量的碱基以及测序接头序列,最低质量值设为20,处理后保留长度大于20bp的序列。
ii.使用bowtie2(v2.2.9)将比对到人核糖体RNA的序列去掉。
iii.使用STAR(v2.7.1a)将步骤ii处理后的序列与人转录组(hg19)比对。
iv.使用HTSeq(v0.11.2)统计步骤iii比对到每个基因上的序列数,进而统计出每个样品中表达的宿主基因数,结果见图1A。
v.使用EdgeR(v3.28.1)对步骤iv中鉴定到的基因进行多维标度分析,并鉴定出患者和健康人样品之间差异表达的基因,结果见图1B,图1C,图1E,图1G。
vi.使用DAVID(v6.8)对患者和健康人样品之间差异表达的基因做基因功能富集分析,结果见图1D,图1F,图1G。
vii.将比对到人的序列去掉,剩余的序列使用Kraken2(v2.0.8-beta)鉴定出比对到已知细菌,病毒,真菌等微生物的序列,进而算出各种微生物的相对丰度,并进行主坐标分析,进一步表征多种常见的已知呼吸道病原体的相对丰度,结果见图2A-图2C。
viii.使用RGI(v5.1.1)将去掉人源序列的剩余序列与CARD抗性基因数据库比对,表征抗性基因的表达情况,结果见图2D。
ix.将步骤vi获得的基因功能富集分析结果与步骤vii获得的已知微生物的鉴定结果综合分析,其中样品C31宿主基因表达情况与其他患者明显不同,如图1B所示。对样品C31 和健康人样品之间进行基因差异表达分析,并对鉴定出的上调基因进行功能富集分析,发现上调基因最富集的前十个生物过程中存在“对细菌的响应”这一生物过程(图1D);与此同时,鉴定到的丰度极高的常见呼吸道疾病病原体为克雷伯氏肺炎菌(图2C),综合两者信息,可初步认为C31患者主要为克雷伯氏肺炎菌感染;样品C10、C12、C14、C13、 C26、C45、D22、D42宿主基因表达情况与健康人明显不同,如图1D所示,上调基因功能富集分析发现上调基因最富集的前十个生物过程中出现“病毒侵染过程”这一生物过程;然而从已知微生物数据库并未检出高丰度的已知病毒(图2C),暗示这些患者可能为未知病毒感染;
x.对于步骤ix中鉴定出的未知病原体感染的样品,采集其中的非人源序列(即步骤vii 中将比对到人的序列去掉后的剩余的序列,使用MEGAHIT(v1.2.9)从非人源序列中从头组装重叠群(contigs),将所有重叠群使用blastn在NCBI nt数据库中搜索,发现与数据库中匹配最长的序列长度有21,702碱基和21,697碱基,其与蝙蝠的SARS样冠状病毒同源性有89.1%,还没有达到种的相似性参考标准(90%),因此推断为新的病毒物种;这两条序列分别来源于样本C13和C14,其对应的contig长达29,856碱基和29,947碱基;使用Softberry 并参考蝙蝠的SARS样冠状病毒基因组对这两条contig进行注释结果见图3A。
xi.将步骤x中鉴定出的来自样本C14的潜在新病毒物种基因组作为参考序列,对每个样本使用bowtie2进行比对,得到的每个样本中含有该病毒的情况(覆盖度和测序深度)见图3B。
xii.根据步骤xi中来自样本C14的病毒基因参考序列设计引物(上游引物:GCCGCTGTTGATGCACTATG;下游引物:CTCCAAGCAGGGTTACGTGT)进行荧光实时定量聚合酶链式反应;对根据步骤xi中比对到参考基因组序列占总序列的比例、对于参考基因组的覆盖度、平均测序深度和测序深度中位数与荧光实时定量聚合酶链式反应得到的循环阈值进行相关性分析评估显示呈显著负相关,结果见图3C。
结果分析:
图1A-图1G的结果显示了患者的宿主响应情况,其中图1A显示了每个样品中鉴定到的宿主基因数目。对每个样品中鉴定到的人基因表达情况进行多维标度分析(multidimensional scaling,MDS),结果如图1B所示,其显示了患者样品中人源基因的表达情况与健康人明显不同;其中样品C31中人源基因的表达情况跟其他患者样品也存在显著差异。本申请对样品C31和健康人样品(NC1、NC2)之间进行差异基因表达分析,共鉴定出144个显著差异表达的基因,其中143个基因显著上调(图1C)。对这些显著上调的基因进行基因功能富集分析,结果如图1D所示,表明这些基因主要参与免疫响应、对生物刺激的响应和对细菌的响应等生物过程。接下来,本申请对表达相似的样品C10、C12、 C14、C13、C26、C45、D22、D42和健康人样品(NC1、NC2)之间进行差异基因表达分析,共鉴定出153个显著差异表达的基因,其中149个基因显著上调(图1E)。对这些显著上调的基因进行基因功能富集分析,结果如图1F所示,表明这些基因主要参与免疫响应、防御响应、病毒感染过程和对细胞因子的响应等生物过程。进一步探究免疫相关的上调基因,发现有一些上调基因(IL1B,IL8,IL36A,CXCR2,FOS,ANXA1,CASP4,KRT16,S100A8, S100A9)参与IL1B相关的促炎症响应,另一些上调基因(ISG15,EGR1,IFI27,IFIT2,IFIT3, IFITM1,IFITM2,IFITM3,HLA-B,HLA-C)参与I型干扰素信号通路(图1G),这些结果指示C10、C12、C14、C13、C26、C45、D22、D42号患者属于病毒感染,C31号患者大概率属于细菌感染。
图2A-2C显示了患者咽部微生物群落的鉴定情况。图2A显示了样品中不同来源的序列比例。图2B显示了对每个样品鉴定到的微生物群落的相对丰度做主坐标分析(principal coordinates analysis,PCoA)的结果,表明患者的咽部微生物群落组成与健康人的有明显差异,另外,患者C31与其他患者的咽部微生物群落组成又有较大的差异。图2C显示了进一步对每个样品中鉴定到的可能的呼吸道病原体的相对丰度的分析结果,其中C31样品中克雷伯氏肺炎菌比其他样品高很多,结合上步宿主响应情况,暗示C31患者与其他患者感染的病原体不同,C31的患者感染的主导病原体大概率为克雷伯氏肺炎菌。此外,在这些样品中也鉴定到了很多其他可能的呼吸道病原体,其中包括副流感嗜血杆菌、肺炎链球菌、鲍氏不动杆菌、铜绿假单胞菌和脑膜炎奈瑟菌等,表明可能存在共感染。
图2D显示了细菌抗生素抗性基因的表达谱,结果显示在各患者样品中鉴定到的抗生素抗性基因平均有84个,而在健康人样品中鉴定到的抗生素抗性基因平均有23个。综合来看,鉴定到的所有抗性基因共对23类抗生素产生抗性,其中β-内酰胺、氨基糖苷类、四环素、利胆醇、利福霉素、氟喹诺酮和大环内酯的抗性基因在患者样品中的表达丰度最高,而且显著高于健康人样品中的表达丰度。
综合咽部微生物群落的鉴定结果以及宿主响应结果发现,样品C10、C12、C14、C13、C26、C45、D22、D42宿主响应表明存在病毒感染,而通过与已知微生物数据库进行比对并没有鉴定到高丰度的已知病毒,由此说明样品C10、C12、C14、C13、C26、C45、D22、 D42可能存在未知病毒感染。
图3A-3C显示了从头组装出未知病原体的基因组的结果。图3A显示对于9个患者样品,去除低质量和人类来源的数据后,剩余数据使用MEGAHIT(v1.2.9)进行从头拼接后并将得到的330,084个重叠群使用blastn在NCBI blast nt数据库中进行搜索,发现的匹配到数据库中最长的两条序列进行注释的基因结构。图3B显示将所有样本以来自样本C14的基因组作为参考序列的比对覆盖度和测序深度情况。图3C显示在这9个患者样本中,各测序样品比对到参考基因组(从C14样本从头组装得到)的序列占各测序样品所有序列的比例、对于参考基因组的覆盖度、平均测序深度和测序深度中位数,与根据未知病原体基因组序列设计引物进行荧光实时定量聚合酶链式反应得到的各样本循环阈值(CT值)呈显著负相关(Spearman检验,p<0.05),说明对于未知病原的测序质量与样本中的病原丰度高度一致。此外,图3C显示了在Ct值高达32的样本中(n=4,44.44%)仍能基于比对的方法获得全基因组序列,平均测序深度可达131×。即使在Ct值达到35的样本中(n=7,77.78%),测序数据也能覆盖94%以上的基因组,说明此方法对于低丰度病原体的检出敏感度极高。
从实施例8的数据处理结果中可以看出:样品C31在已知微生物数据库中检测出高丰度的克雷伯氏肺炎菌感染,其结果与宿主免疫系统响应一致,说明样品C31的患者的感染病原体可能为克雷伯氏肺炎菌和人类疱疹病毒第四型;样品C10、C12、C14、C13、C26、 C45、D22、D42的宿主免疫系统响应与已知微生物数据库中检测病原体不一致,说明这些患者存在未知病原体感染,进一步通过从头组装获得未知病原体的基因组,在GenBank中比对发现这些样品的感染病原体为SARS-CoV-2,以上结果与实时定量荧光PCR检测样品 SARS-CoV-2基因结果一致,说明本申请的方案能够直接鉴定出未知病原体,为后续临床诊断提供有力指导。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
序列表
<110> 北京大学
中国科学院武汉病毒研究所
<120> 一种病原体宏转录组测序文库的制备方法、试剂盒及筛选感染病原体的方法和装置
<130> PP206328
<160> 5
<170> SIPOSequenceListing 1.0
<210> 1
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
tcgtcggcag cgtcagatgt gtataagaga cag 33
<210> 2
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
gtctcgtggg ctcggagatg tgtataagag acag 34
<210> 3
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
ctgtctctta tacacatct 19
<210> 4
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
aatgatacgg cgaccaccga gatctacact agatcgctcg tcggcagcgt c 51
<210> 5
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (25)..(32)
<223> n选自a、t、g或c
<400> 5
caagcagaag acggcatacg agatnnnnnn nngtctcgtg ggctcgg 47
Claims (11)
1.一种病原体宏转录组测序文库的制备方法,其包括以下步骤:
(1)提取待测样品的总RNA,通过逆转录获得含有RNA/DNA杂交链的逆转录产物;其中,所述逆转录的反应体系中包含2-3μM的随机六聚体;
(2)将所述RNA/DNA杂交链在打断缓冲液中,在Tn5转座酶复合体作用下打断并接上测序接头后,向反应体系中加入十二烷基硫酸钠,室温孵育3-7分钟终止反应,获得片段化产物;
其中,所述打断缓冲液包括:终浓度为0.8-1.2U/μL RNA酶抑制剂,9-11mM,pH=7.0-8.0的三羟甲基氨基甲烷盐酸缓冲液,4-6mM氯化镁,7-9%(w/v)聚乙二醇8000,以及4-6%(w/v)的聚乙二醇200;所述RNA/DNA杂交链在打断缓冲液中的浓度为0.1-10ng/μL;所述Tn5转座酶复合体包含Tn5转座酶和SEQ ID No.1、SEQ ID No.2、SEQ ID No.3所示的引物;所述Tn5转座酶复合体在打断缓冲液中的浓度为1-3ng/μL;所述十二烷基硫酸钠的终浓度为0.03-0.05%(w/v);所述打断的反应条件为54-56℃,13-17分钟;
(3)将所述片段化产物进行链延伸以及PCR反应,获得宏转录组测序文库;其中,链延伸采用Bst 3.0DNA聚合酶;PCR采用热启动DNA聚合酶以及SEQ ID No.4和SEQ ID No.5所示的引物。
2.根据权利要求1所述的方法,其还包括将所述宏转录组测序文库进行XP磁珠纯化。
3.根据权利要求1或2所述的方法,所述病原体包括病毒、细菌、真菌、支原体、衣原体或寄生虫中的至少一种。
4.根据权利要求1或2所述的方法,其中所述待测样品包括被病原体感染的宿主的体液、分泌物、排泄物、痰液、肺泡灌洗液中的至少一种。
5.一种病原体宏转录组测序文库制备试剂盒,其包括:逆转录反应体系、Tn5转座酶复合体、RNA酶抑制剂、打断缓冲液、十二烷基硫酸钠、Bst 3.0DNA聚合酶、PCR反应体系以及SEQ ID No.4和SEQ ID No.5所示的引物;
其中,所述逆转录反应体系包含随机六聚体;
所述Tn5转座酶复合体包含Tn5转座酶和SEQ ID No.1、SEQ ID No.2、SEQ ID No.3所示的引物;
所述打断缓冲液包括:终浓度为0.8-1.2U/μL RNA酶抑制剂,9-11mM,pH7.0-8.0的三羟甲基氨基甲烷盐酸缓冲液,4-6mM氯化镁,7-9%(w/v)聚乙二醇8000,以及4-6%(w/v)的聚乙二醇200。
6.根据权利要求5所述的试剂盒,其中,所述病原体包括病毒、细菌、真菌、支原体、衣原体或寄生虫中的至少一种。
7.一种用于筛选感染病原体的生物信息分析方法,其包括:
(1)采用权利要求1-4中任一项的方法制备待测样品和对照样品的宏转录组测序文库;
(2)将所述宏转录组测序文库进行二代测序,获得测序结果的fastq文件;
(3)对fastq文件进行筛选,去除fastq文件中低质量碱基、测序接头序列、长度低于20bp的序列以及宿主核糖体RNA的序列;
(4)从步骤(3)的筛选后的序列中,获得待测样品与对照样品之间差异表达的宿主基因及其功能富集分析结果;
(5)去掉步骤(4)中比对到宿主基因的序列,从剩余的序列中,鉴定待测样品与对照样品中已知微生物的相对丰度及其基因的表达差异;
(6)判定步骤(4)中得到的宿主基因功能富集分析结果中上调基因的功能,与步骤(5)中鉴定到的待测样品中丰度高于对照样品的微生物是否相关,如相关,则判定所述微生物为感染的病原体;
(7)如宿主基因功能富集分析结果中上调基因的功能与鉴定到的待测样品中丰度高于对照样品的微生物不相关,则判定存在未知微生物;
从头组装出未知微生物的基因组,在NCBI NT数据库中搜索与从头组装的基因组相近的物种基因组,以鉴定待测样品中的未知微生物种类,所述未知微生物即判定为感染的病原体。
8.根据权利要求7所述的方法,其还包括将步骤(5)中,去掉步骤(4)中比对到宿主基因的序列,将剩余的序列与抗性基因数据库比对,表征细菌抗性基因的表达情况。
9.根据权利要求7或8所述的方法,其中所述待测样品包括被病原体感染的宿主的体液、分泌物、排泄物、痰液、肺泡灌洗液中的至少一种;所述对照样品包括未被病原体感染的个体的体液、分泌物、排泄物、痰液、肺泡灌洗液中的至少一种。
10.一种用于筛选感染病原体的装置,其包括:RNA提取模块、逆转录模块、片段化模块、链延伸及PCR模块、测序模块、序列筛选模块、宿主响应检测模块、已知微生物鉴定模块、匹配判定模块以及未知微生物鉴定模块;
所述RNA提取模块,用于提取待测样品的总RNA;
所述逆转录模块,用于将RNA提取模块中获得的总RNA进行逆转录,从而获得RNA/DNA杂交链;其中,所述逆转录的反应体系中包含2-3μM的随机六聚体;
所述片段化模块,用于在打断缓冲液中,采用Tn5转座酶复合体将所述RNA/DNA杂交链片段化并接上测序接头;其中,所述打断缓冲液包括:终浓度为0.8-1.2U/μL RNA酶抑制剂,9-11mM,pH7.0-8.0的三羟甲基氨基甲烷盐酸缓冲液,4-6mM氯化镁,7-9%(w/v)聚乙二醇8000,以及4-6%(w/v)的聚乙二醇200;所述Tn5转座酶复合体包含Tn5转座酶和SEQ IDNo.1、SEQ ID No.2、SEQ ID No.3所示的引物;
所述链延伸及PCR模块,用于将片段化后的RNA/DNA杂交链进行链延伸和PCR扩增,以获得宏转录组测序文库;其中,所述链延伸采用Bst 3.0DNA聚合酶,PCR扩增采用热启动DNA聚合酶,所述PCR扩增的引物如SEQ ID No.4和SEQ ID No.5所示;
所述测序模块,用于对所述宏转录组测序文库进行二代测序,获得测序结果的fastq文件;
所述序列筛选模块用于去除fastq文件中低质量碱基,测序接头序列、长度低于20bp的序列和人核糖体RNA的序列;
所述宿主响应检测模块用于从序列筛选模块筛选后的序列中,获得待测样品与对照样品之间差异表达的宿主基因的功能富集分析结果;
所述已知微生物鉴定模块,用于从去掉宿主响应检测模块中比对到的宿主基因序列后的剩余序列中,鉴定待测样品与对照样品中已知微生物的相对丰度及其基因的表达差异;
所述匹配判定模块,用于判定宿主响应检测模块中鉴定的宿主基因功能富集分析结果中上调基因的功能,与已知微生物鉴定模块中获得的已知微生物鉴定结果中丰度高于对照样品的微生物是否相关;
所述未知微生物鉴定模块用于,当宿主基因功能富集分析结果中上调基因的功能与鉴定到的待测样品中丰度高于对照样品的微生物不相关时,从头组装未知微生物的基因组,在NCBINT数据库中搜索与从头组装的基因组相近的物种基因组,鉴定待测样品中的未知微生物种类。
11.根据权利要求10所述的装置,其还包括抗性基因检测模块,所述抗性基因检测模块用于将已知微生物鉴定模块中得到的,去掉宿主响应检测模块中比对到的宿主基因序列后的剩余序列,与抗性基因数据库比对,表征细菌抗性基因的表达情况。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011520074.XA CN114645330A (zh) | 2020-12-21 | 2020-12-21 | 一种病原体宏转录组测序文库的制备方法、试剂盒及筛选感染病原体的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011520074.XA CN114645330A (zh) | 2020-12-21 | 2020-12-21 | 一种病原体宏转录组测序文库的制备方法、试剂盒及筛选感染病原体的方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114645330A true CN114645330A (zh) | 2022-06-21 |
Family
ID=81989726
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011520074.XA Pending CN114645330A (zh) | 2020-12-21 | 2020-12-21 | 一种病原体宏转录组测序文库的制备方法、试剂盒及筛选感染病原体的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114645330A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116042800A (zh) * | 2022-10-08 | 2023-05-02 | 北京大学 | Rbbp6基因和ccdc91基因组合的分子标记物及其应用 |
CN116949154A (zh) * | 2023-08-28 | 2023-10-27 | 中国农业大学 | 一种非治疗目的的基于宏转录组的病原检测方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040132132A1 (en) * | 2001-02-22 | 2004-07-08 | Ugur Sahin | Method for identifying biologically active structures of microbial pathogens |
CN109280701A (zh) * | 2017-07-21 | 2019-01-29 | 深圳华大基因股份有限公司 | 用于地中海贫血检测的探针、基因芯片及制备方法和应用 |
CN111315884A (zh) * | 2017-09-08 | 2020-06-19 | 普梭梅根公司 | 测序文库的归一化 |
-
2020
- 2020-12-21 CN CN202011520074.XA patent/CN114645330A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040132132A1 (en) * | 2001-02-22 | 2004-07-08 | Ugur Sahin | Method for identifying biologically active structures of microbial pathogens |
CN109280701A (zh) * | 2017-07-21 | 2019-01-29 | 深圳华大基因股份有限公司 | 用于地中海贫血检测的探针、基因芯片及制备方法和应用 |
CN111315884A (zh) * | 2017-09-08 | 2020-06-19 | 普梭梅根公司 | 测序文库的归一化 |
Non-Patent Citations (1)
Title |
---|
CHEN CHEN ET AL: "MINERVA: A Facile Strategy for SARS-CoV-2 Whole-Genome Deep Sequencing of Clinical Samples", MOLECULAR CELL, no. 80, 17 December 2020 (2020-12-17), pages 1123 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116042800A (zh) * | 2022-10-08 | 2023-05-02 | 北京大学 | Rbbp6基因和ccdc91基因组合的分子标记物及其应用 |
CN116042800B (zh) * | 2022-10-08 | 2023-12-08 | 北京大学 | Rbbp6基因和ccdc91基因组合的分子标记物及其应用 |
CN116949154A (zh) * | 2023-08-28 | 2023-10-27 | 中国农业大学 | 一种非治疗目的的基于宏转录组的病原检测方法 |
CN116949154B (zh) * | 2023-08-28 | 2024-05-28 | 中国农业大学 | 一种非治疗目的的基于宏转录组的病原检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111188094B (zh) | 一种用于病原微生物检测的测序文库构建方法和试剂盒 | |
JP5116481B2 (ja) | シトシンの化学修飾により微生物核酸を簡素化するための方法 | |
CN111500781B (zh) | mNGS检测SARS-CoV-2的扩增引物组及其应用 | |
WO2017009693A1 (en) | 16s ribosomal rna universal primers and use thereof in microbiological analysis and diagnostics | |
CN114645330A (zh) | 一种病原体宏转录组测序文库的制备方法、试剂盒及筛选感染病原体的方法和装置 | |
CN113046475A (zh) | 一种快速检测突变型新型冠状病毒的引物组合物及试剂盒 | |
CN112725410A (zh) | 用于检测病原微生物的引物组 | |
CN109486912A (zh) | 一种用于数字pcr扩增的探针引物组合及设计方法 | |
US20110287965A1 (en) | Methods and compositions to detect clostridium difficile | |
CN109402274B (zh) | 一种鉴别a型和b型牛源多杀性巴氏杆菌的荧光定量rt-pcr方法 | |
CN114592097A (zh) | 鉴别新型冠状病毒Omicron株BA.1和/或BA.3亚系的引物、探针及其应用 | |
WO2020028718A1 (en) | Antibiotic susceptibility of microorganisms and related markers, compositions, methods and systems | |
CN112384608A (zh) | 细菌捕获测序平台及其设计、构建和使用方法 | |
CN113215235A (zh) | 一种高通量快速检测病原微生物的方法 | |
CN108866220B (zh) | 一种用于鼻腔菌群检测的方法及检测试剂盒 | |
CN112592992A (zh) | 一种基于荧光rma法联合检测肺炎支原体和肺炎衣原体的引物探针组、试剂盒 | |
CN110257556B (zh) | 一种性传播疾病致病病原的核酸检测试剂盒 | |
CN112593015B (zh) | 一种引物组合物、测序试剂盒及检测方法 | |
CN115029345A (zh) | 基于crispr的核酸检测试剂盒及其应用 | |
CN114107454A (zh) | 基于宏基因/宏转录组测序的呼吸道感染病原检测方法 | |
CN114561497B (zh) | 鉴别新型冠状病毒Omicron株BA.1亚系的引物、探针及其应用 | |
CN113151598B (zh) | 一种检测呼吸道病毒病原体的ngs引物组及试剂盒 | |
US20220380755A1 (en) | De-novo k-mer associations between molecular states | |
RU2762759C1 (ru) | Способ пробоподготовки образцов изолятов коронавируса SARS-CoV-2 и олигонуклеотидные праймеры для его реализации | |
WO2022057854A1 (zh) | 病原体特异性核酸片段及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |