CN116606910A - 一种适用于微生物群体的宏基因组GutHi-C建库方法及应用 - Google Patents
一种适用于微生物群体的宏基因组GutHi-C建库方法及应用 Download PDFInfo
- Publication number
- CN116606910A CN116606910A CN202310901421.0A CN202310901421A CN116606910A CN 116606910 A CN116606910 A CN 116606910A CN 202310901421 A CN202310901421 A CN 202310901421A CN 116606910 A CN116606910 A CN 116606910A
- Authority
- CN
- China
- Prior art keywords
- library
- guthi
- microbial
- dna
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 86
- 230000000813 microbial effect Effects 0.000 title claims abstract description 42
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 claims abstract description 40
- 239000011324 bead Substances 0.000 claims abstract description 33
- 244000005700 microbiome Species 0.000 claims abstract description 32
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 claims abstract description 30
- 238000003199 nucleic acid amplification method Methods 0.000 claims abstract description 24
- 230000003321 amplification Effects 0.000 claims abstract description 23
- 229960002685 biotin Drugs 0.000 claims abstract description 20
- 235000020958 biotin Nutrition 0.000 claims abstract description 20
- 239000011616 biotin Substances 0.000 claims abstract description 20
- 238000012165 high-throughput sequencing Methods 0.000 claims abstract description 20
- 239000012634 fragment Substances 0.000 claims abstract description 18
- 238000000746 purification Methods 0.000 claims abstract description 13
- 238000003908 quality control method Methods 0.000 claims abstract description 13
- 230000003993 interaction Effects 0.000 claims abstract description 12
- 102000004190 Enzymes Human genes 0.000 claims abstract description 10
- 108090000790 Enzymes Proteins 0.000 claims abstract description 10
- 230000002452 interceptive effect Effects 0.000 claims abstract description 10
- 238000005520 cutting process Methods 0.000 claims abstract description 9
- 238000000926 separation method Methods 0.000 claims abstract description 7
- 238000005406 washing Methods 0.000 claims abstract description 7
- 238000013467 fragmentation Methods 0.000 claims abstract description 6
- 238000006062 fragmentation reaction Methods 0.000 claims abstract description 6
- 238000007689 inspection Methods 0.000 claims abstract description 6
- 230000008439 repair process Effects 0.000 claims abstract description 6
- 125000004122 cyclic group Chemical group 0.000 claims abstract description 3
- 239000001963 growth medium Substances 0.000 claims abstract description 3
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 claims description 16
- 238000004132 cross linking Methods 0.000 claims description 15
- 230000009089 cytolysis Effects 0.000 claims description 14
- 102000016943 Muramidase Human genes 0.000 claims description 12
- 108010014251 Muramidase Proteins 0.000 claims description 12
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 claims description 12
- 239000004325 lysozyme Substances 0.000 claims description 12
- 229960000274 lysozyme Drugs 0.000 claims description 12
- 235000010335 lysozyme Nutrition 0.000 claims description 12
- 108010077544 Chromatin Proteins 0.000 claims description 11
- 210000003483 chromatin Anatomy 0.000 claims description 11
- 108010088751 Albumins Proteins 0.000 claims description 10
- 102000009027 Albumins Human genes 0.000 claims description 10
- 238000001976 enzyme digestion Methods 0.000 claims description 9
- 238000003776 cleavage reaction Methods 0.000 claims description 8
- 229940088598 enzyme Drugs 0.000 claims description 8
- 239000007788 liquid Substances 0.000 claims description 8
- 229910052757 nitrogen Inorganic materials 0.000 claims description 8
- 230000007017 scission Effects 0.000 claims description 8
- 230000001580 bacterial effect Effects 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 238000000227 grinding Methods 0.000 claims description 7
- 238000003801 milling Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 2
- 238000002604 ultrasonography Methods 0.000 claims description 2
- 238000011176 pooling Methods 0.000 claims 1
- 238000010276 construction Methods 0.000 abstract description 12
- 108020004414 DNA Proteins 0.000 description 35
- 238000012163 sequencing technique Methods 0.000 description 18
- 239000006228 supernatant Substances 0.000 description 18
- 239000000203 mixture Substances 0.000 description 17
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 15
- 238000012360 testing method Methods 0.000 description 15
- 230000008569 process Effects 0.000 description 14
- 230000000694 effects Effects 0.000 description 12
- 210000004027 cell Anatomy 0.000 description 11
- 210000002421 cell wall Anatomy 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 11
- 238000002156 mixing Methods 0.000 description 11
- 239000000872 buffer Substances 0.000 description 9
- 229910021642 ultra pure water Inorganic materials 0.000 description 9
- 239000012498 ultrapure water Substances 0.000 description 9
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 8
- 241000894006 Bacteria Species 0.000 description 7
- 238000011084 recovery Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 210000001035 gastrointestinal tract Anatomy 0.000 description 6
- 230000000968 intestinal effect Effects 0.000 description 6
- 239000000047 product Substances 0.000 description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- 239000003153 chemical reaction reagent Substances 0.000 description 5
- 238000011065 in-situ storage Methods 0.000 description 5
- 244000144972 livestock Species 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 4
- 102000012410 DNA Ligases Human genes 0.000 description 4
- 108010061982 DNA Ligases Proteins 0.000 description 4
- 241000282414 Homo sapiens Species 0.000 description 4
- 238000005119 centrifugation Methods 0.000 description 4
- 239000002244 precipitate Substances 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 239000002699 waste material Substances 0.000 description 4
- 108020004465 16S ribosomal RNA Proteins 0.000 description 3
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 3
- 108020004638 Circular DNA Proteins 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 244000144977 poultry Species 0.000 description 3
- 108091008146 restriction endonucleases Proteins 0.000 description 3
- 239000002689 soil Substances 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 241000287828 Gallus gallus Species 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 239000007983 Tris buffer Substances 0.000 description 2
- 238000007605 air drying Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000007664 blowing Methods 0.000 description 2
- 210000004534 cecum Anatomy 0.000 description 2
- 239000007795 chemical reaction product Substances 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000000975 co-precipitation Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000011068 loading method Methods 0.000 description 2
- 239000002096 quantum dot Substances 0.000 description 2
- 230000001954 sterilising effect Effects 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 2
- OZFAFGSSMRRTDW-UHFFFAOYSA-N (2,4-dichlorophenyl) benzenesulfonate Chemical compound ClC1=CC(Cl)=CC=C1OS(=O)(=O)C1=CC=CC=C1 OZFAFGSSMRRTDW-UHFFFAOYSA-N 0.000 description 1
- OCKGFTQIICXDQW-ZEQRLZLVSA-N 5-[(1r)-1-hydroxy-2-[4-[(2r)-2-hydroxy-2-(4-methyl-1-oxo-3h-2-benzofuran-5-yl)ethyl]piperazin-1-yl]ethyl]-4-methyl-3h-2-benzofuran-1-one Chemical compound C1=C2C(=O)OCC2=C(C)C([C@@H](O)CN2CCN(CC2)C[C@H](O)C2=CC=C3C(=O)OCC3=C2C)=C1 OCKGFTQIICXDQW-ZEQRLZLVSA-N 0.000 description 1
- 239000012591 Dulbecco’s Phosphate Buffered Saline Substances 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- 239000013504 Triton X-100 Substances 0.000 description 1
- 229920004890 Triton X-100 Polymers 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000012148 binding buffer Substances 0.000 description 1
- 238000003766 bioinformatics method Methods 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 210000003855 cell nucleus Anatomy 0.000 description 1
- 239000012295 chemical reaction liquid Substances 0.000 description 1
- 238000011278 co-treatment Methods 0.000 description 1
- 238000005336 cracking Methods 0.000 description 1
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 1
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 1
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 1
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000008367 deionised water Substances 0.000 description 1
- 229910021641 deionized water Inorganic materials 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 230000002550 fecal effect Effects 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 210000003736 gastrointestinal content Anatomy 0.000 description 1
- 229910017053 inorganic salt Inorganic materials 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 239000002655 kraft paper Substances 0.000 description 1
- 239000011259 mixed solution Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 229920000136 polysorbate Polymers 0.000 description 1
- 238000012257 pre-denaturation Methods 0.000 description 1
- 230000001376 precipitating effect Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 239000013049 sediment Substances 0.000 description 1
- 239000001632 sodium acetate Substances 0.000 description 1
- 235000017281 sodium acetate Nutrition 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- GPRLSGONYQIRFK-MNYXATJNSA-N triton Chemical compound [3H+] GPRLSGONYQIRFK-MNYXATJNSA-N 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 238000003260 vortexing Methods 0.000 description 1
- 239000011534 wash buffer Substances 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B50/00—Methods of creating libraries, e.g. combinatorial synthesis
- C40B50/06—Biochemical methods, e.g. using enzymes or whole viable microorganisms
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Analytical Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Microbiology (AREA)
- Wood Science & Technology (AREA)
- Immunology (AREA)
- Physics & Mathematics (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种适用于微生物群体的宏基因组GutHi‑C建库方法,包括如下步骤:1)微生物分离提纯:微生物样本洗涤,添加培养基并自然沉降,4000g离心力对微生物分离;2)微生物进行裂解及甲醛交联;3)对步骤2)中产物进行酶切,然后用混有生物素标记的碱基对酶切后黏性末端进行补平,并将互作DNA邻近连接;4)将步骤3)中获得产物纯化后,加入环状共沉淀DNA,互作DNA超声片段化;5)基于生物素富集邻近互作片段,在免疫磁珠上进行末端修复与加A并与接头连接;6)进行文库预扩增QC质量控制检验,再进行正式扩增即得到GutHi‑C文库。本发明构建的GutHi‑C文库在高通量测序时,各方面数据均优于现有技术,说明本申请的建库方法更有优势。
Description
技术领域
本发明涉及分子生物技术领域,特别涉及一种适用于微生物群体的宏基因组GutHi-C建库方法及应用。
背景技术
Hi-C技术是以3C技术“邻近连接”为基础,结合高通量测序,在全基因组范围捕获所有特异和非特异的染色质相互作用。通过生物信息学分析方法,可以研究获得全基因组范围内染色质一维互作连接图、二维相互作用频率热图、全基因组染色质相互作用调控网络和三维结构可视化信息(ErezLieberman-Aiden, 2009, Science; Luca Giorgetti,2016, Nature),还能进行基因组单体型分析(Jan O Korbel, 2013, NatureBiotechnology)和辅助基因组组装(Joshua N Burton et al., 2013, NatureBiotechnology)。
当前对人类、畜禽肠道微生物的鉴定,主要有两种方法,包括 16S rDNA 测序和宏基因组 Shotgun 二代测序。16S rDNA 测序能以较低的成本对人类、畜禽肠道菌群进行分析,不足之处是只能精确到细菌的属以及属以上的水平,对于种以及种以下水平无法分辨,而且只得到了菌群中每种微生物的16S rDNA 的序列,无法得到微生物的全部基因组信息。宏基因组 Shotgun 技术依赖二代测序,产生的大量短片段的冗余序列无法归类到物种和菌株水平 (Bickhart et al.,2021)(CN111909983A),这造成了测序数据资源的浪费并且丢失了许多菌株的基因组信息。Hi-C技术辅助基因组组装,并与 PacBio HiFi 三代测序技术结合,在高质量基因组组装中产生了非常好的效果 (Zhou et al., 2020a),在宏基因组组装中具有很大的应用潜力。如果在宏基因组组装中应用Hi-C技术,将取得很好的效果(与不同细胞/微生物相比,来源于同一个细胞/微生物内的DNA分子互作更强,基于此原理可将来自于同一种微生物的序列聚类到同一个簇群中,并对簇群进行物种/细胞鉴定。因此,可将宏基因组聚类到物种和菌株水平)。常规的Hi-C高通量测序建库以动物细胞系作为研究对象,细胞系细胞种类相同,染色质状态雷同,染色质互作模式和构象较为一致,更容易获得比较好的结果。微生物群体相较于细胞系,微生物群体内个体基因组染色质状态复杂多变,且微生物具有坚实的细胞壁,细胞不易裂解。因此,适用于细胞系的Hi-C技术无法直接用于复杂的微生物群体。
专利文件CN109056078A、CN111909983A分别公开了一种适用于单一细菌的Hi-C高通量测序建库方法、一种适用于微生物宏基因组Hi-C高通量测序建库方法。在专利文件CN109056078A中公开了单一细菌的Hi-C高通量测序建库方法,但是在复杂的现实环境中,基本不存在单一细菌的情况,现实微生物环境中,不仅包括泥沙、无机盐、土壤、种植物残留物等,需要分离出较为纯净的微生物都十分不易,而且分离出的微生物也包括了细菌、真菌等集合,更不用说分离出单一的细菌,就难度更大了,且研究宏基因组的时候更不能分离出一个个单一细菌进行研究,所以专利文件CN109056078A中公开的方法限制了其在实际操作和针对宏基因组研究中的应用。而在专利文件CN111909983A中虽然公开了一种适用于微生物宏基因组学Hi-C高通量测序建库方法,但是其微生物细胞内染色质交联效果欠佳,单一酶切针对微生物群体片段化效果欠佳,且建库效率中间过程中文库的损失和大量噪音的存在均限制了其应用,有待进一步优化,来提高建库效率、建库质量和测序数据质量,以获得更大范围的应用。
因此,有必要改良优化出一种更适用于微生物群体的宏基因组GutHi-C技术。
发明内容
本发明的目的是提供一种适用于微生物群体的宏基因组GutHi-C建库方法及应用,以解决上述问题。
根据本发明的第一个方面,提供了一种适用于微生物群体的宏基因组GutHi-C建库方法,该方法包括如下步骤:
1)微生物分离提纯:微生物样本洗涤,添加培养基并自然沉降,4000g离心力对微生物分离;
2)微生物进行裂解及甲醛交联;
3)对步骤2)中产物进行酶切,然后用混有生物素标记的碱基对酶切后黏性末端进行补平,并将互作DNA邻近连接;
4)将步骤3)中获得产物纯化后,加入环状共沉淀DNA,互作DNA超声片段化;
5)基于生物素富集邻近互作片段,在免疫磁珠上进行末端修复与加A并与接头连接;
6)进行文库预扩增QC质量控制检验,将检验筛选出的最优扩增条件进行正式扩增即得到GutHi-C文库。
本方法中引入环状共沉淀DNA控制步骤,可以将DNA处理过程可视化,减少建库中宏基因组DNA损失;同时DNA正式扩增前进行QC质量控制检验,可以获得最优的扩增条件,提高GutHi-C文库的准备比例和避免试剂浪费。更重要的,本方法是经过优化的GutHi-C文库构建方法,构建出来的GutHi-C文库在进行高通量测序时,其数据的比对率(指唯一比对率)、有效数据产出率、Hi-C试验目标序列比例、多重比对率、未比对率均优于期刊上发表的文章(Derek M. Bickhart et al,Nature Biotechnology,2022)中方法做出的数据,也优于CN111909983A专利中方法做出的数据,说明本申请的GutHi-C文库构建方法更有优势,构建的GutHi-C文库质量更好,具体表现在:GutHi-C引入了in situ Hi-C框架, 与传统Hi-C相比,保留了染色质原始微环境,拥有更高的接触频率和更低的背景噪音等优点,可以降低“反式互作”噪音,为提高有效数据的比例发挥作用;优化各个步骤,降低了Dangling_end比例,提高了有效数据的比例。即便在初始组装质量不好,产生较多的Contig情况下,本申请中GutHi-C技术依然可以产生较高的顺式互作,在完整宏基因组辅助组装中具有较大应用潜力。
在某些实施方式中,所述方法步骤2)中采用先微生物裂解,再甲醛交联的先后顺序,可以提高甲醛交联的效果,避免完整细胞壁的阻隔使得甲醛对微生物拟核染色质的交联反应不充分。由此,可以显著提高GutHi-C文库测序后数据的唯一比对率,且是期刊(Derek M. Bickhart et al,Nature Biotechnology,2022)文章中发布的数据的~5倍,证明了本方法的优越性。
在某些实施方式中,所述微生物裂解是采用液氮研磨和/或溶菌酶裂解的方法进行。由此,可以最大程度的对微生物细胞壁进行裂解,充分释放出DNA物质,减少建库中宏基因组DNA损失。
在某些实施方式中,所述微生物裂解仅采用溶菌酶裂解的方法进行时,可以降低文库损失,大大提高文库DNA浓度,更适于微生物群体量小时使用。由此,在微生物量极少的时候,可以采用仅溶菌酶裂解的方法进行,可以获得较高的DNA浓度。
在某些实施方式中,所述微生物裂解采用液氮研磨溶菌酶共同处理的方式,且所述步骤3)中采用双酶切的方式进行酶切,所述步骤6)中正式扩增的PCR切胶大小为400bp以上。由此,可以获得最优的建库条件和流程。
在某些实施方式中,所述双酶切的组合为DpnII与HpyCH4IV、MboI 与 HpyCh4IV、Sau3AI与HpyCh4IV中的任一组。由此,可以利用高效双酶切进行微生物宏基因组片段化,进一步提高酶切效率,增加可用于邻近连接的互作片段比例,提高建库有效数据和质量。
在某些实施方式中,所述步骤3)中,黏性末端补平标记物为生物素,且所述生物素用量仅需传统in situ Hi-C系统所需生物素含量的二分之一。在此优化条件下,不仅在可以保持原有效果不变甚至优于原有技术效果的前提下,还可以降低技术步骤中最贵的生物素试剂含量为标准in situ Hi-C使用量的一半,且在引入in situ Hi-C框架的同时省去了末端去除生物素的酶和体系,降低使用成本。
在某些实施方式中,所述步骤3)中邻位连接采用的连接反应液含重组白蛋白Recombinant Albumin。由此,在邻位连接反应液采用重组白蛋白Recombinant Albumin替代现有技术中的BSA,可以提高连接效率。
在某些实施方式中,所述邻位连接反应液由体积百分比10×NEB T4 DNA ligasebuffer,体积百分含量10% Triton X-100,质量百分含量20mg/ml重组白蛋白RecombinantAlbumin (rAlbumin),质量百分含量400U/µl T4 DNA Ligase和超纯水组成。
在某些实施方式中,所述步骤4)中还包括在互作DNA超声片段化后,对片段大小进行磁珠分选。该技术引入的片段大小分选步骤通过两次不同比例磁珠纯化方式进行,所述比例分别为0.55倍、0.15倍,该比例具体指第一次加入Ampure XP beads 磁珠的体积,是此时待加入的起始文库体积的0.55倍;第二次加入磁珠时,加入磁珠的体积是起始文库体积的0.15倍。由此,不仅可以得到更高的纯化浓度,还能保证更好的纯化质量。
在某些实施方式中,所述步骤6)中,将加好测序接头的文库进行PCR预扩增(质量控制QC),所述扩增体系体积为20μL,具体为体积百分比为2×PCR ReadyMix(包含扩增酶和所需离子添加剂的混合物)、体积百分比为10×PCR Primer Mix、超纯水和1μL测试文库。由此,在正式文库扩增前引入低至1μL微量文库一个循环数目预扩增并进行QC质量控制,可以使得正式文库扩增时条件达到最优,大大降低文库的浪费和损失。
根据本发明的第二个方面,提供了一种采用上述适用于微生物群体的宏基因组GutHi-C建库方法制备的GutHi-C文库。由此,该GutHi-C文库在进行高通量测序时,其数据的比对率(指唯一比对率)、有效数据产出率、Hi-C试验目标序列比例、多重比对率、未比对率均优于期刊上的文章(Derek M. Bickhart et al,Nature Biotechnology,2022)中方法做出的数据,也优于CN111909983A专利中方法做出的数据,说明本申请的GutHi-C文库构建方法更有优势,构建的GutHi-C文库质量更好。
根据本发明的第三个方面,提供了一种采用上述适用于微生物群体的宏基因组GutHi-C建库方法制备的微生物高通量测序试剂盒。该试剂盒可以适用于来自畜禽、人类等动物肠道、粪便的微生物群体,土壤微生物,和培养组微生物混合物等各种环境下的微生物宏基因组建库和高通量测序。
根据本发明的第四个方面,提供了一种GutHi-C文库在辅助完整宏基因组组装,以及揭示细菌染色质三维结构中的应用。
根据本发明的第五个方面,提供了一种GutHi-C文库在微生物宏基因组高通量测序中的应用。
根据本发明的第六个方面,提供了一种微生物高通量测序试剂盒在微生物宏基因组高通量测序中的应用。
在某些实施方式中,所述微生物样本取自岭南黄鸡肠道内容物,也可以是畜禽、人类粪便样品、土壤微生物和培养的多细菌混合溶液等。
本发明的有益效果:
1、本方法是经过优化的GutHi-C文库构建方法,构建出来的GutHi-C文库在进行高通量测序时,其数据的唯一比对率、有效数据产出率、Hi-C试验目标序列比例、多重比对率、未比对率均优于期刊上的文章(Derek M. Bickhart et al,Nature Biotechnology,2022)中方法做出的数据,也优于CN111909983A专利中方法做出的数据,说明本申请的GutHi-C文库构建方法更有优势。并且,本发明采用先富集嵌合DNA,再进行建库,整体大大降低建库试剂环节的整体试剂用量。正式文库扩增前引入1μL微量文库一个循环数目预扩增,大大降低文库的浪费和损失,使得正式文库扩增时条件达到最优。本发明优化条件后,保持原有效果甚至优于现有技术效果的情况下,降低技术步骤中最贵的生物素试剂含量为标准Hi-C使用量的一半,并省去了末端去除生物素的酶和体系,节约建库成本。
2、本发明以畜禽肠道为研究模型,利用GutHi-C技术进行多批次文库构建与测序,测序结果显示本申请的GutHi-C技术与该期刊(Derek M. Bickhart et al,NatureBiotechnology,2022)发表的宏基因组Hi-C技术相比,可以得到较高的有效数据(去除PCR重复)比例(是后者Derek M. Bickhart et al,Nature Biotechnology, 2022中公布数据的10倍,不去除PCR重复是2-5倍),且在本申请中得到了目前最优条件组合流程(先破壁后交联、液氮研磨和溶菌酶一起处理、双酶切、引入环状伴侣DNA、先生物素富集互作文库再免疫磁珠上进行建库、先文库PCR预扩增QC再进行正式扩增、PCR胶回收切胶范围400以上)。
附图说明
图1为GutHi-C技术路线图,左图实施例1,右图为实施例2;
图2为超声波打断后互作DNA打断质控胶图,左图为实施例1结果图,右图为实施例2结果图,其中样品序号与表1和表4中样品序号对应;
图3为实施例1和实施例2的PCR QC预实验12循环质控胶图(QC,质量控制),左图为实施例1结果图,右图为实施例2结果图,其中样品序号与表1和表4中样品序号对应;
图4为实施例1正式PCR 实验胶图,其中样品序号与表1中样品序号对应;
图5为实施例2正式PCR 实验胶图,其中样品序号与表4中样品序号对应;
图6为实施例1和2与现有技术的样本平均唯一比对率(Mapping_rate)比较结果图,其中:实施例1 GutHi-C(先裂解细胞壁后交联)表示采用实施例1中方法的做出结果数据、实施例2 GutHi-C(先交联后破细胞壁)表示采用实施例2中方法的做出结果数据、Sheep1(Nature Biotechnology,2022)表示期刊上发表文章(Derek M. Bickhart et al,Nature Biotechnology,2022)中方法的结果数据、CN111909983A ICE表示公布号为CN111909983A的专利中公布的方法的结果数据;
图7为实施例1和2与现有技术的各自处理组唯一比对率(Mapping_rate)比较结果图,其中:实施例1表示采用实施例1中方法的做出结果数据、实施例2表示采用实施例2中方法的做出结果数据、Nature Biotechnology,2022表示期刊上发表文章Derek M. Bickhartet al,Nature Biotechnology,2022中方法的结果数据、CN111909983A ICE表示公布号为CN111909983A的专利中公布的方法的结果数据;
图8为实施例1和2与各自处理组有效数据产出率(有效数据占总测序量比率)(Valid_interaction_rmdup/Total_pairs_processed)比较结果图,其中:实施例1表示采用实施例1中方法的做出结果数据、实施例2表示采用实施例2中方法的做出结果数据、Nature Biotechnology,2022表示期刊上发表文章Derek M. Bickhart et al,NatureBiotechnology,2022中方法的结果数据、CN111909983A ICE表示公布号为CN111909983A的专利中公布的方法的结果数据;
图9为实施例1和2与现有技术的各自处理组Hi-C试验目标序列比例(占双端唯一配对序列比率)(Valid_interaction_pairs/Unique_paired_ alignments)比较结果图,其中:实施例1表示采用实施例1中方法的做出结果数据、实施例2表示采用实施例2中方法的做出结果数据、Nature Biotechnology,2022表示期刊上发表文章Derek M. Bickhart etal,Nature Biotechnology,2022中方法的结果数据、CN111909983A ICE表示公布号为CN111909983A的专利中公布的方法的结果数据、CN109056078A链霉菌表示公布号为CN109056078A的专利中公布针对单一细菌Hi-C的方法的结果数据;
图10为实施例1和2与现有技术的各自处理组多重比对率(Multiple_pairs_alignments_rate)比较结果图,其中:实施例1表示采用实施例1中方法的做出结果数据、实施例2表示采用实施例2中方法的做出结果数据、Nature Biotechnology,2022表示期刊上发表文章Derek M. Bickhart et al,Nature Biotechnology,2022中方法的结果数据;
图11为实施例1和2与现有技术的各自处理组未比对率(Unmapped_pairs_rate)比较结果图,其中:实施例1表示采用实施例1中方法的做出结果数据、实施例2表示采用实施例2中方法的做出结果数据、Nature Biotechnology,2022表示期刊上发表文章Derek M.Bickhart et al,Nature Biotechnology,2022中方法的结果数据。
具体实施方式
下面结合附图对发明作进一步详细的说明。
实施例1以中国岭南黄鸡肠道微生物为研究对象,进行宏基因组学GutHi-C技术测试和分析,技术路线图参考图1(左图为实施例1技术线路图),步骤如下:
(一)肠道微生物分离
1)取新鲜肠道微生物宏基因组样本0.5g,进行冲洗和孵育:
孵育体系配制方法为:称取10 g蛋白胨、5 g 酵母提取物、10 g NaCl到1 L的大锥形瓶中,加950 ml去离子水,溶解后,加5M NaOH PH配至7.0-7.4,同时定容至1 L。配好后,用牛皮纸封好锥形瓶。高压蒸汽灭菌锅灭菌30 min。
2)样本孵育后,进行12000 g离心后,3mL预冷1×DPBS重悬细胞,每1mL样品分装于一个1.5mL离心管中(实际0.166 g),4℃2000 g离心5min,吸弃上清;
3)-80℃保存,或进行下一步。
(二)高效裂解透化细胞
用液氮研磨和溶菌酶并行裂解微生物细胞壁,各个样品分组如表1中分类及处理方式(表1中样品命名含义:以GUT3-ZM4为例,GUT代表肠道,3代表测试试验批次,Z代表试验人员,M代表盲肠段的微生物,4代表所有批次下的样本编号):
1)利用液氮研磨方法和溶菌酶化学孵育方法并行裂解微生物细胞壁;
2)或只通过液氮研磨处理;
3)或只溶酶菌处理(不用研磨)
(三)对微生物细胞核进行甲醛交联、酶切
1)对经过步骤(二)处理后的样品进行2000 g离心保留上清,用DPBS清洗沉淀后加入37%甲醛进行交联;
2)加入2.0M甘氨酸进行解交联;
3)2000g,常温离心5min,去上清,加入500μL 1×NEBuffer™ DpnII(NEB R0543S)重悬;
4)每管加20μL限制性内切酶DpnII(NEB R0543S,10,000 units/ml)和20μL限制性内切酶HpyCH4IV(NEB R0619L,10,000 units/ml),37℃酶切过夜。
(四)用生物素标记的酶切后片段并进行末端补平和钝端环化连接
1)对经过步骤(三)处理后的样品进行62℃孵育20分钟,2000g RT离心5min,弃上清;加265μL 1×Cutsmart(NEB B6004)缓冲液,混匀;
2)加25 μL fill-in master mix和25μL 1×Cutsmart缓冲液,并进行混匀;
按照50μL标准配制fill-in master mix 时,各组分如下:1.5μL 10mM dATP(Thermo Fisher)、1.5μL 10mM dGTP(Thermo Fisher)、1.5μL 10mM dTTP(ThermoFisher)、37.5μL 0.4mM biotin-14-dCTP(Thermo Fisher;19518018)和8μL 5U/μL Klenow(NEB);
在Dilution Hi-C、in situ Hi-C等常规Hi-C系统中,需要加50 μL fill-inmaster mix;而本实施例中只需要加25 μL fill-in master mix+25μL Cutsmart即可;而Cutsmart要比生物素便宜,且生物素添加量减少后,还可以省去末端去除生物素环节,节约建库时间和成本;
3)37℃震荡孵育1.5h;
4)加900μL ligation master mix(120μL 10×T4DNA ligase buffer (NEB),100μL 10%Triton X-100,6μL 20mg/ml Recombinant Albumin(重组白蛋白,NEB B9200S),5μL400U/μL T4 DNA Ligase (NEB)和669μL超纯水);
5)颠倒混匀,常温旋转4h。
(五)获得纯化的DNA
1)加50μL proteinase K(蛋白酶K)(20mg/ml)和120μL 10%SDS,55℃孵育30min;
2)加130μL 5M氯化钠,68℃孵育过夜;
3)试管放至常温;
4)样品等分750μL分别移至新的离心管中;加1.2mL无水乙醇和75μL 3M醋酸钠(pH5.5),颠倒混匀,-80℃孵育15min;
5)2℃21000g离心15min。离心后立即放冰上,弃上清;
6)加400μL 80%乙醇重悬沉淀,同一样品两管合成一管,800μL样品转至新的离心管中,4℃21000g离心10min;
7)加800μL 80%乙醇重悬沉淀,4℃21000g离心10min,弃上清,放4℃冰箱晾干1-3h;
8)加131μL 1×Tris buffer(10mM Tris-HCl, pH8)重悬沉淀,37℃孵育20min,常温3000g离心1.5min,吸上清至新的离心管中;
9)Qubit测DNA浓度,结果如表2所示,结果表明:序号3中只采用溶菌酶处理,不研磨时,DNA的纯化浓度最高
(六)引入环状共沉淀DNA并超声打断
1)将1.95μL环状共沉淀DNA(为了作为对照观察打断效果,保证200ng)加入到上述(五)得到的纯化后环状DNA中,得到加入质粒后的样品,加1×Tris buffer (pH 8.0)将体系补至130μL,混匀;
2)将130μL反应体系转移到microTUBE AFA(Covaris 220)管中;
3)按程序设定(Fill Level 10,Duty Cycle 15,PIP 500,Cycles per Burst200,Time 58s)打断环化DNA,得到片段化环状共沉淀和环状DNA混合物;
4)打断管样品全部转至新的离心管中。
(七)DNA纯化
1)转移130μL上述(六)得到的片段化环状共沉淀和环状DNA混合物到156μL (1.2倍) Ampure XP beads磁珠 (Beckman Coulter;A63881) 中(总体积286μL),混匀,常温静置5min;
2)将含有Ampure XP beads磁珠的样品放于磁力架上,静置5分钟,溶液变澄清,移液枪吸出上清液;
3)加入700μL新鲜制备的80%EtOH(乙醇,体积分数99.7%),清洗两次。添加时保证样品管始终在磁力架上,每次清洗时,常温孵育30秒;
4)第二次清洗时,略微旋转样品管,重新放回磁力架上,用10μL移液枪去除残余的EtOH,常温5min晾干;
5)加入300μL 1×Tris buffer混匀,常温静置5min,放回磁力架,约5min后溶液变澄清,将上清液转移到新的离心管中,得到纯化后的DNA;
6)Qubit测浓度,如表3所示,结果中序号3的纯化浓度最高;取10μL (~12ng) DNA跑2% E-gel,结果如图2所示,左边表示实施例1中序号1-3样品结果,结果表明打断效果理想
(八)基于生物素捕获,免疫磁珠抓取获得目的片段,并进行文库扩增和测序
1)向新的离心管中加400μL 1×Tween Washing Buffer(TWB:5mM Tris-HCl (pH7.5),0.5mM EDTA,1M NaCl,0.05% Tween20),然后加50μL Dynabeads MyOneStreptavidin T1 beads(Life technologies,10mg/ml,65602),混匀,放于磁力架上,静置3min,去除缓冲液;
2)加300μL 2×Binding Buffer(10mM Tris-HCl (pH 7.5),1mM EDTA,2M NaCl)重悬磁珠,然后将文库加到磁珠混合液中,吹打混匀,常温旋转15min;
3)放回磁力架,约5min后溶液变澄清,弃上清;
4)加600μL 1×TWB,混匀,55℃孵育2min,放回磁力架3min,弃上清;
5)重复第55步,常温晾干3min,加25μL超纯水溶解Beads,得到生物素标记DNA片段,去除了环状共沉淀相关片段;
之后步骤全伴随免疫磁珠进行。
(九)文库制备
9.1、末端修复和加尾反应
1)体系为:上述(八)得到的生物素标记DNA片段样品25μL,End Prep Mix4(VazymeND607-01)7.5μL;
2)轻轻涡旋震荡,转移到PCR仪上立即进行孵育(20℃15min;65℃15min;4℃∞),得到末端修复和加尾反应产物。
9.2、加接头
1)制备连接混合液(末端修复和加尾反应产物32.5μL,Adapter储存液1μL,超纯水1.5μL,连接缓冲液12.5μL,DNA连接酶2.5μL)。完全混匀,轻微离心。快速进行Adapter连接。20℃孵育15min,得到加接头后产物。
9.3、洗接头
1)加150μL 1×TE buffer,混匀,洗2遍,然后加150μL 1×B/W buffer,混匀,洗2遍,加40μL超纯水溶解。
9.4、PCR QC预扩增
1)制备PCR混合物(2× KAPA HiFi HotStart Ready预混液(KAPA Biosystems;KK8502)10μL,10× KAPA文库扩增引物预混液(KAPA Biosystems;KK8502)1μL,得到的洗接头后产物1μL,超纯水8μL,彻底混匀,简单离心。按如下程序设置PCR:预变性:98℃1min;12或18个循环(变性:98℃15s;退火:60℃30s;延伸:72℃30s);终延伸:72℃5min;保存:4℃∞min。得到PCR产物。瞬时离心,吸19μL进行E-gel检测,如图3左边实施例1中样品序号1-3结果所示,表明DNA文库质量控制成功。
9.5、PCR产物磁珠纯化
1)正式PCR为6个循环,PCR之后把Ampure XP beads磁珠(1:1)加到正式PCR反应溶液中,混匀,常温静置5min;
2)放到磁力架上5min,约5min后溶液变澄清,弃上清;
3)加500μL 80%乙醇洗2次,弃上清,晾干3min;
4)加20μL超纯水溶解,混匀,常温静置5min,放回磁力架5min,上清转至新的离心管中。
9.6、选择文库
1)纯化的正式PCR文库(~20μL)全部跑E胶,使用胶回收试剂盒(Zymoclean™ GelDNA Recovery Kit-D4008)回收大小420-1000 bp片段,即为GutHi-C测序文库,结果如图4所示:切胶范围420-1000 bp,文库回收浓度分别为2.6 ng/μL(序号1)、4.14 ng/μL(序号2)、3.66 ng/μL(序号3),每样送测序20ng;
2)将所有样本按1:1质量比,混匀后进行上机前质控,进行Real time-qPCR和NGS3K文库质检合格后进行Illumina Nova-seq PE150双端测序,将下机数据进行处理后通过HiC-Pro 软件进行评估。
实施例2 一种基于先交联后破细胞壁的微生物宏基因组GutHi-C技术
技术路线图,如图1中右图的实施例2路线图。
实施例2中除部分步骤调整外,其他步骤与实施例1一致,实施例2中部分流程或者结果如下:
实施例2中各个样品分组如表4中分类及处理方式(表4中样品命名含义:以GUT1-KM1为例,GUT代表肠道,1代表测试试验批次,K代表试验人员,M代表盲肠段的微生物,1代表所有批次下的样本编号)
而实施例2中邻近连接后互作文库DNA的纯化浓度检测,结果如表5所示,结果表明序号6中纯化浓度最高
实施例2中引入磁珠分选步骤后的样品DNA浓度如表6所示,结果表明序号6中纯化浓度最高
实施例2中超声波打断后互作DNA打断质控胶图,结果如图2所示,右边为实施例2中序号4-6样品,结果表明打断效果理想。
实施例2中PCR QC预实验12循环质控胶图,结果如图3所示,右边为实施例2中序号4-6样品,结果表明引入磁珠分选后PCR预扩增条带集中,扩增效果一致、理想。表明DNA文库质量控制成功。
在实施例2中除以下步骤与实施例1不同,其他步骤相同,不同步骤处理如下:
步骤(一)肠道微生物分离后直接进行甲醛交联,交联步骤同实施例1步骤(三);
然后,进行裂解细胞壁操作,步骤同实施例1步骤(二);
酶切步骤,每管加5μL限制性内切酶(DpnII,NEB R0543S,10,000 units/ml),37℃酶切过夜。生物素标记时候替换为biotin-14-dATP;
超声打断后,进行磁珠分选目的片段(替换实施例1步骤七),分选步骤具体为磁珠片段300-500 bp分选:
1)使用前将Ampure XP beads磁珠放至常温;加入超纯水进一步润洗打断管,继续转移至文库中,将文库体积配齐至200μL(磁珠分选的文库起始体积);
2)每个样品加入110μL Ampure XP beads磁珠(是文库起始体积的0.55倍)吹打混匀室温孵育5min;
3)置于磁力架5分钟,将上清转移到新的离心管,避免吸到磁珠;
4)再加入30μL Ampure XP beads磁珠(是文库起始体积的0.15倍)吹打混匀,室温孵育5分钟;
5)置于磁力架5分钟,去上清,保留磁珠;
6)用700µl 80% 新配酒精清洗两次,之后静置5分钟待酒精挥发;
7)为了洗脱DNA,加入300ul 1 x Tris buffer,温柔的吹打混匀,室温孵育5min,放置于磁力架5min,上清转移至新的1.5ml离心管。
接下来步骤,同实施例1中步骤八和九,最后进行文库制备,使用胶回收试剂盒(Zymoclean™ Gel DNA Recovery Kit-D4008)回收大小350-700 bp片段即为GutHi-C测序文库,如图5所示,该PCR设置6个循环,切胶范围350-700 bp,文库回收浓度分别为1.46 ng/ul、2.4 ng/ul、4.8 ng/ul,每样送测序10ng。
将下机数据进行处理后通过HiC-Pro 软件进行评估。
实施例3 实施例1和2中技术方法与现有技术效果比较
将实施例1和2中获得的文库进行上机测序,并将下机数据进行处理后通过HiC-Pro 软件进行评估,将最终获得的评估结果在实施例1方法、实施例2方法、期刊(Derek M.Bickhart et al,Nature Biotechnology,2022)公布的方法和数据、专利CN111909983A中方法和数据进行比较:
3.1 平均唯一比对率(Mapping_rate)比较
实施例1和2中GutHi-C数据的样本间平均唯一比对率(Mapping_rate)与发表在期刊(Derek M. Bickhart et al,Nature Biotechnology,2022)中公布的方法和数据和专利CN111909983A中公开的宏基因组Hi-C数据比较,结果如图6所示,结果表明:GutHi-C在平均比对率水平上优于期刊(Derek M. Bickhart et al,Nature Biotechnology,2022)公布的方法和数据,且实施例1中的平均比对率数据极显著优于实施例2的平均比对率数据,实施例是四组数据结果中最优的。
3.2 各自处理组唯一比对率(Mapping_rate)比较
实施例1和2中GutHi-C数据的各自处理组唯一比对率(Mapping_rate)与发表在(Derek M. Bickhart et al,Nature Biotechnology,2022)文章中和专利CN111909983A中公开的宏基因组Hi-C数据比较,结果如图7所示,结果表明:GutHi-C在各自处理组比对率水平上优于期刊(Derek M. Bickhart et al,Nature Biotechnology,2022)公布的方法和数据,且实施例1中的各自处理组比对率数据优于实施例2的数据,实施例是四组数据结果中最优的。
3.3 各自处理组有效数据产出率(有效数据占总测序量比率)(Valid_interaction_rmdup/Total_pairs_processed)比较
实施例1和2中GutHi-C数据的各自处理组有效数据产出率(有效数据占总测序量比率)(Valid_interaction_rmdup/Total_pairs_processed)与发表在期刊(Derek M.Bickhart et al,Nature Biotechnology,2022)文章中和专利CN111909983A中公开的宏基因组Hi-C数据比较,结果如图8所示,结果表明:GutHi-C在有效数据产出率水平上优于现有技术(Nature Biotechnology,2022、CN111909983A)。
3.4 各自处理组Hi-C试验目标序列比例(占双端唯一配对序列比率)(Valid_interaction_pairs/Unique_paired_alignments)比较
实施例1和2中GutHi-C数据的各自处理组Hi-C试验目标序列比例(占双端唯一配对序列比率)(Valid_interaction_pairs/Unique_paired_alignments)与发表在(DerekM. Bickhart et al,Nature Biotechnology,2022)文章中、专利CN111909983A中公开的宏基因组Hi-C数据和专利CN111909983A单一菌株Hi-C数据比较,结果如图9所示,结果表明当GutHi-C采用先裂解细胞壁后交联的方式(实施例1)时,Hi-C试验目标序列比例与已经发表(Nature Biotechnology,2022、CN111909983A、CN109056078A)的数据质量相当;当GutHi-C采用先交联后裂解细胞壁的方式(实施例2)时,在该参数的数据质量更佳,且优于已经发表(Nature Biotechnology,2022、CN111909983A、CN109056078A)的数据。
3.5 各自处理组多重比对率(Multiple_pairs_alignments_rate)比较
实施例1和2中GutHi-C数据的各自处理组多重比对率(Multiple_pairs_alignments_rate)与发表在(Derek M. Bickhart et al,Nature Biotechnology,2022)文章中的数据比较(专利CN111909983A、CN109056078A未给出对应参数的结果),结果如图10所示,结果表明GutHi-C在多重比对率水平上优于目前发表(Derek M. Bickhart et al,Nature Biotechnology,2022)的技术,其中数据比率越低说明越理想。
3.6 各自处理组未比对率(Unmapped_pairs_rate)比较
实施例1和2中GutHi-C数据的各自处理组未比对率(Unmapped_pairs_rate)与发表在(Derek M. Bickhart et al,Nature Biotechnology,2022)文章中的数据比较(专利CN111909983A、CN109056078A未给出对应参数的结果),结果如图11所示,结果表明GutHi-C在未比对率水平上优于目前发表(Derek M. Bickhart et al,Nature Biotechnology,2022)的技术,其中数据比率越低说明越理想。
综上所述,本实施例1和2中的GutHi-C技术方案获得微生物宏基因组Hi-C文库,在高通量测序时,其效果要优于现有技术,为微生物宏基因组建库和高通量测序时提供了高效的方法,应用前景可观。
以上所述的仅是本发明的一些实施方式。对于本领域的普通技术人员来说,在不脱离本发明创造构思的前提下,还可以做出若干变形和改进,这些都属于发明的保护范围。
Claims (10)
1.一种适用于微生物群体的宏基因组GutHi-C建库方法,其中,所述方法包括如下步骤:
1)微生物分离提纯:微生物样本洗涤,添加培养基并自然沉降,4000g离心力对微生物分离;
2)微生物进行裂解及甲醛交联;
3)对步骤2)中产物进行酶切,然后用混有生物素标记的碱基对酶切后黏性末端进行补平,并将互作DNA邻近连接;
4)将步骤3)中获得产物纯化后,加入环状共沉淀DNA,互作DNA超声片段化;
5)基于生物素富集邻近互作片段,在免疫磁珠上进行末端修复与加A并与接头连接;
6)进行文库预扩增QC质量控制检验,将检验筛选出的最优扩增条件进行正式扩增即得到GutHi-C文库。
2.根据权利要求1所述的方法,其中,所述方法步骤2)中采用先微生物裂解,再甲醛交联的先后顺序。
3.根据权利要求2所述的方法,其中,所述微生物裂解是采用液氮研磨和/或溶菌酶裂解的方法进行。
4.根据权利要求3所述的方法,其中,所述微生物裂解仅采用溶菌酶裂解的方法进行时,可以降低文库损失,提高文库DNA浓度,更适于微生物群体量小时使用。
5.根据权利要求3中所述的方法,其中,所述微生物裂解采用液氮研磨溶菌酶共同处理的方式,且所述步骤3)中采用双酶切的方式进行酶切,所述步骤6)中正式扩增的PCR切胶大小为400bp以上;所述双酶切的组合为DpnII与HpyCH4IV、MboI 与 HpyCh4IV、Sau3AI与HpyCh4IV中的任一组。
6.根据权利要求1中所述的方法,其中,所述步骤3)中邻位连接采用的连接反应液含重组白蛋白Recombinant Albumin。
7.根据权利要求1中所述的方法,其中,所述步骤4)中还包括在互作DNA超声片段化后,对片段大小进行磁珠分选。
8.采用权利要求1-7中任一项所述的方法制备的GutHi-C文库或制备的微生物高通量测序试剂盒。
9.权利要求8中所述的GutHi-C文库在辅助完整宏基因组组装,揭示细菌染色质三维结构中的应用。
10.权利要求8中所述的GutHi-C文库或微生物高通量测序试剂盒在微生物宏基因组高通量测序中的应用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310901421.0A CN116606910B (zh) | 2023-07-21 | 2023-07-21 | 一种适用于微生物群体的宏基因组GutHi-C建库方法及应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310901421.0A CN116606910B (zh) | 2023-07-21 | 2023-07-21 | 一种适用于微生物群体的宏基因组GutHi-C建库方法及应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116606910A true CN116606910A (zh) | 2023-08-18 |
CN116606910B CN116606910B (zh) | 2023-10-13 |
Family
ID=87682307
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310901421.0A Active CN116606910B (zh) | 2023-07-21 | 2023-07-21 | 一种适用于微生物群体的宏基因组GutHi-C建库方法及应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116606910B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118064551A (zh) * | 2024-04-16 | 2024-05-24 | 中国农业科学院农业基因组研究所 | 染色质构象捕获in situeHi-C 3.0测序文库制备方法及应用 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105121661A (zh) * | 2013-02-01 | 2015-12-02 | 加利福尼亚大学董事会 | 用于基因组组装及单体型定相的方法 |
CN107475394A (zh) * | 2017-08-31 | 2017-12-15 | 中国农业科学院农业基因组研究所 | 一种基于少量细胞全基因组染色质高分辨率构象技术eHi‑C2.0 |
CN109056078A (zh) * | 2018-09-18 | 2018-12-21 | 武汉菲沙基因信息有限公司 | 一种适用于细菌的Hi-C高通量测序建库方法 |
CN111073953A (zh) * | 2019-12-19 | 2020-04-28 | 中国农业科学院棉花研究所 | 一种适合植物的Hi-C高通量测序建库方法 |
CN111909983A (zh) * | 2020-08-25 | 2020-11-10 | 武汉菲沙基因信息有限公司 | 一种适用于微生物宏基因组学Hi-C高通量测序建库方法及应用 |
CN113215141A (zh) * | 2021-02-23 | 2021-08-06 | 华南农业大学 | 细菌hi-c基因组及质粒构象捕获方法 |
WO2022094474A1 (en) * | 2020-11-02 | 2022-05-05 | Duke University | Compositions for and methods of co-analyzing chromatin structure and function along with transcription output |
CN114891858A (zh) * | 2022-07-13 | 2022-08-12 | 广州国家实验室 | 染色质三维构象捕获方法及其应用 |
CN115109836A (zh) * | 2022-06-14 | 2022-09-27 | 华南农业大学 | 一种基于菌群的Hi-C检测方法 |
-
2023
- 2023-07-21 CN CN202310901421.0A patent/CN116606910B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105121661A (zh) * | 2013-02-01 | 2015-12-02 | 加利福尼亚大学董事会 | 用于基因组组装及单体型定相的方法 |
CN107475394A (zh) * | 2017-08-31 | 2017-12-15 | 中国农业科学院农业基因组研究所 | 一种基于少量细胞全基因组染色质高分辨率构象技术eHi‑C2.0 |
CN109056078A (zh) * | 2018-09-18 | 2018-12-21 | 武汉菲沙基因信息有限公司 | 一种适用于细菌的Hi-C高通量测序建库方法 |
CN111073953A (zh) * | 2019-12-19 | 2020-04-28 | 中国农业科学院棉花研究所 | 一种适合植物的Hi-C高通量测序建库方法 |
CN111733214A (zh) * | 2019-12-19 | 2020-10-02 | 中国农业科学院棉花研究所 | 一种能够高效捕获冷冻生物样本染色体三维构象的高通量测序建库技术 |
CN111909983A (zh) * | 2020-08-25 | 2020-11-10 | 武汉菲沙基因信息有限公司 | 一种适用于微生物宏基因组学Hi-C高通量测序建库方法及应用 |
WO2022094474A1 (en) * | 2020-11-02 | 2022-05-05 | Duke University | Compositions for and methods of co-analyzing chromatin structure and function along with transcription output |
CN113215141A (zh) * | 2021-02-23 | 2021-08-06 | 华南农业大学 | 细菌hi-c基因组及质粒构象捕获方法 |
CN115109836A (zh) * | 2022-06-14 | 2022-09-27 | 华南农业大学 | 一种基于菌群的Hi-C检测方法 |
CN114891858A (zh) * | 2022-07-13 | 2022-08-12 | 广州国家实验室 | 染色质三维构象捕获方法及其应用 |
Non-Patent Citations (3)
Title |
---|
AGNES THIERRY: "Generating High-Resolution Hi-C Contact Maps of Bacteria", METHODSINMOLECULARBIOLOGY, vol. 2301, pages 183 - 195 * |
EITAN YAFFE ET AL.: "Tracking microbial evolution in the human gut using Hi-C", BIORXIV, pages 1 - 67 * |
STEVEN WINGETT ET AL.: "HiCUP pipeline for mapping and processing Hi-C data", F1000RESEARCH, vol. 4, no. 1310, pages 1 - 12 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118064551A (zh) * | 2024-04-16 | 2024-05-24 | 中国农业科学院农业基因组研究所 | 染色质构象捕获in situeHi-C 3.0测序文库制备方法及应用 |
Also Published As
Publication number | Publication date |
---|---|
CN116606910B (zh) | 2023-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2016341198B2 (en) | Methods for genome assembly, haplotype phasing, and target independent nucleic acid detection | |
CN116606910B (zh) | 一种适用于微生物群体的宏基因组GutHi-C建库方法及应用 | |
CN111471676A (zh) | 一种宏基因组二代测序的建库样本的制备方法 | |
CN108624651B (zh) | 一种构建Ribo-seq测序文库的方法 | |
CN108251504A (zh) | 一种超快速构建基因组dna测序文库的方法和试剂盒 | |
WO2017193833A1 (zh) | 一种富集4000人类致病靶基因的方法及试剂盒 | |
WO2017066907A1 (zh) | 一种构建高可利用数据率的Hi-C文库的方法 | |
JP2007525982A5 (zh) | ||
CN114107289A (zh) | 粪便样本的核酸提取试剂盒、制备方法及提取方法 | |
CN110904098A (zh) | 一种裂解结合液及粪便磁珠法核酸提取 | |
CN106591285B (zh) | 一种构建高可利用数据率的Hi-C文库的方法 | |
CN112481254B (zh) | 一步法去宿主dna并富集微生物的方法及试剂盒 | |
US3444041A (en) | In vitro synthesis of ribonucleic acids and enzyme therefor | |
CN107904668A (zh) | 一种微生物多样性文库构建方法及其应用 | |
Bekele et al. | Functional metagenomics from the rumen environment—a review | |
CN116445634A (zh) | 牛乳房炎病原体多联检测试剂盒及其应用 | |
CN116121415A (zh) | 一种同时检测三种双歧杆菌的多重荧光定量pcr试剂盒、应用及检测方法 | |
CN118048436B (zh) | 用于微量细胞的靶向染色质互作捕获ULI-eHiChIP建库方法及应用 | |
CN111455021B (zh) | 去除宏基因组中宿主dna的方法及试剂盒 | |
CN114134204B (zh) | 一种用于微量标记核酸样本检测和测序的样品制备方法 | |
CN116162690B (zh) | 一管式靶向高通量测序方法 | |
CN113981042A (zh) | 饲用微生物产品中菌种及风险基因的高通量检测方法 | |
CN118064551A (zh) | 染色质构象捕获in situeHi-C 3.0测序文库制备方法及应用 | |
CN117106861A (zh) | 幽门螺杆菌的快速检测方法及试剂盒 | |
Oomen et al. | SisterC: A novel 3C-technique to detect chromatin interactions between and along sister chromatids |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |