CN116606910A

CN116606910A - 一种适用于微生物群体的宏基因组GutHi-C建库方法及应用

Info

Publication number: CN116606910A
Application number: CN202310901421.0A
Authority: CN
Inventors: 孔思远; 张玉波; 李晨莹; 卢宇曦; 杨金宝; 潘玮华
Original assignee: Agricultural Genomics Institute at Shenzhen of CAAS
Current assignee: Agricultural Genomics Institute at Shenzhen of CAAS
Priority date: 2023-07-21
Filing date: 2023-07-21
Publication date: 2023-08-18
Anticipated expiration: 2043-07-21
Also published as: CN116606910B

Abstract

本发明公开了一种适用于微生物群体的宏基因组GutHi‑C建库方法，包括如下步骤：1）微生物分离提纯：微生物样本洗涤，添加培养基并自然沉降，4000g离心力对微生物分离；2）微生物进行裂解及甲醛交联；3）对步骤2）中产物进行酶切，然后用混有生物素标记的碱基对酶切后黏性末端进行补平，并将互作DNA邻近连接；4）将步骤3）中获得产物纯化后，加入环状共沉淀DNA，互作DNA超声片段化；5）基于生物素富集邻近互作片段，在免疫磁珠上进行末端修复与加A并与接头连接；6）进行文库预扩增QC质量控制检验，再进行正式扩增即得到GutHi‑C文库。本发明构建的GutHi‑C文库在高通量测序时，各方面数据均优于现有技术，说明本申请的建库方法更有优势。

Description

一种适用于微生物群体的宏基因组GutHi-C建库方法及应用

技术领域

本发明涉及分子生物技术领域，特别涉及一种适用于微生物群体的宏基因组GutHi-C建库方法及应用。

背景技术

Hi-C技术是以3C技术“邻近连接”为基础，结合高通量测序，在全基因组范围捕获所有特异和非特异的染色质相互作用。通过生物信息学分析方法，可以研究获得全基因组范围内染色质一维互作连接图、二维相互作用频率热图、全基因组染色质相互作用调控网络和三维结构可视化信息(ErezLieberman-Aiden, 2009, Science; Luca Giorgetti,2016, Nature)，还能进行基因组单体型分析（Jan O Korbel, 2013, NatureBiotechnology）和辅助基因组组装(Joshua N Burton et al., 2013, NatureBiotechnology)。

当前对人类、畜禽肠道微生物的鉴定，主要有两种方法，包括 16S rDNA 测序和宏基因组 Shotgun 二代测序。16S rDNA 测序能以较低的成本对人类、畜禽肠道菌群进行分析，不足之处是只能精确到细菌的属以及属以上的水平，对于种以及种以下水平无法分辨，而且只得到了菌群中每种微生物的16S rDNA 的序列，无法得到微生物的全部基因组信息。宏基因组 Shotgun 技术依赖二代测序，产生的大量短片段的冗余序列无法归类到物种和菌株水平 (Bickhart et al.,2021)(CN111909983A)，这造成了测序数据资源的浪费并且丢失了许多菌株的基因组信息。Hi-C技术辅助基因组组装，并与 PacBio HiFi 三代测序技术结合，在高质量基因组组装中产生了非常好的效果 (Zhou et al., 2020a)，在宏基因组组装中具有很大的应用潜力。如果在宏基因组组装中应用Hi-C技术，将取得很好的效果（与不同细胞/微生物相比，来源于同一个细胞/微生物内的DNA分子互作更强，基于此原理可将来自于同一种微生物的序列聚类到同一个簇群中，并对簇群进行物种/细胞鉴定。因此，可将宏基因组聚类到物种和菌株水平）。常规的Hi-C高通量测序建库以动物细胞系作为研究对象，细胞系细胞种类相同，染色质状态雷同，染色质互作模式和构象较为一致，更容易获得比较好的结果。微生物群体相较于细胞系，微生物群体内个体基因组染色质状态复杂多变，且微生物具有坚实的细胞壁，细胞不易裂解。因此，适用于细胞系的Hi-C技术无法直接用于复杂的微生物群体。

专利文件CN109056078A、CN111909983A分别公开了一种适用于单一细菌的Hi-C高通量测序建库方法、一种适用于微生物宏基因组Hi-C高通量测序建库方法。在专利文件CN109056078A中公开了单一细菌的Hi-C高通量测序建库方法，但是在复杂的现实环境中，基本不存在单一细菌的情况，现实微生物环境中，不仅包括泥沙、无机盐、土壤、种植物残留物等，需要分离出较为纯净的微生物都十分不易，而且分离出的微生物也包括了细菌、真菌等集合，更不用说分离出单一的细菌，就难度更大了，且研究宏基因组的时候更不能分离出一个个单一细菌进行研究，所以专利文件CN109056078A中公开的方法限制了其在实际操作和针对宏基因组研究中的应用。而在专利文件CN111909983A中虽然公开了一种适用于微生物宏基因组学Hi-C高通量测序建库方法，但是其微生物细胞内染色质交联效果欠佳，单一酶切针对微生物群体片段化效果欠佳，且建库效率中间过程中文库的损失和大量噪音的存在均限制了其应用，有待进一步优化，来提高建库效率、建库质量和测序数据质量，以获得更大范围的应用。

因此，有必要改良优化出一种更适用于微生物群体的宏基因组GutHi-C技术。

发明内容

本发明的目的是提供一种适用于微生物群体的宏基因组GutHi-C建库方法及应用，以解决上述问题。

根据本发明的第一个方面，提供了一种适用于微生物群体的宏基因组GutHi-C建库方法，该方法包括如下步骤：

1）微生物分离提纯：微生物样本洗涤，添加培养基并自然沉降，4000g离心力对微生物分离；

2）微生物进行裂解及甲醛交联；

3）对步骤2）中产物进行酶切，然后用混有生物素标记的碱基对酶切后黏性末端进行补平，并将互作DNA邻近连接；

4）将步骤3）中获得产物纯化后，加入环状共沉淀DNA，互作DNA超声片段化；

5）基于生物素富集邻近互作片段，在免疫磁珠上进行末端修复与加A并与接头连接；

6）进行文库预扩增QC质量控制检验，将检验筛选出的最优扩增条件进行正式扩增即得到GutHi-C文库。

本方法中引入环状共沉淀DNA控制步骤，可以将DNA处理过程可视化，减少建库中宏基因组DNA损失；同时DNA正式扩增前进行QC质量控制检验，可以获得最优的扩增条件，提高GutHi-C文库的准备比例和避免试剂浪费。更重要的，本方法是经过优化的GutHi-C文库构建方法，构建出来的GutHi-C文库在进行高通量测序时，其数据的比对率（指唯一比对率）、有效数据产出率、Hi-C试验目标序列比例、多重比对率、未比对率均优于期刊上发表的文章（Derek M. Bickhart et al,Nature Biotechnology,2022）中方法做出的数据，也优于CN111909983A专利中方法做出的数据，说明本申请的GutHi-C文库构建方法更有优势，构建的GutHi-C文库质量更好，具体表现在：GutHi-C引入了in situ Hi-C框架，与传统Hi-C相比，保留了染色质原始微环境，拥有更高的接触频率和更低的背景噪音等优点，可以降低“反式互作”噪音，为提高有效数据的比例发挥作用；优化各个步骤，降低了Dangling_end比例，提高了有效数据的比例。即便在初始组装质量不好，产生较多的Contig情况下，本申请中GutHi-C技术依然可以产生较高的顺式互作，在完整宏基因组辅助组装中具有较大应用潜力。

在某些实施方式中，所述方法步骤2）中采用先微生物裂解，再甲醛交联的先后顺序，可以提高甲醛交联的效果，避免完整细胞壁的阻隔使得甲醛对微生物拟核染色质的交联反应不充分。由此，可以显著提高GutHi-C文库测序后数据的唯一比对率，且是期刊（Derek M. Bickhart et al,Nature Biotechnology,2022）文章中发布的数据的~5倍，证明了本方法的优越性。

在某些实施方式中，所述微生物裂解是采用液氮研磨和/或溶菌酶裂解的方法进行。由此，可以最大程度的对微生物细胞壁进行裂解，充分释放出DNA物质，减少建库中宏基因组DNA损失。

在某些实施方式中，所述微生物裂解仅采用溶菌酶裂解的方法进行时，可以降低文库损失，大大提高文库DNA浓度，更适于微生物群体量小时使用。由此，在微生物量极少的时候，可以采用仅溶菌酶裂解的方法进行，可以获得较高的DNA浓度。

在某些实施方式中，所述微生物裂解采用液氮研磨溶菌酶共同处理的方式，且所述步骤3）中采用双酶切的方式进行酶切，所述步骤6）中正式扩增的PCR切胶大小为400bp以上。由此，可以获得最优的建库条件和流程。

在某些实施方式中，所述双酶切的组合为DpnII与HpyCH4IV、MboI 与 HpyCh4IV、Sau3AI与HpyCh4IV中的任一组。由此，可以利用高效双酶切进行微生物宏基因组片段化，进一步提高酶切效率，增加可用于邻近连接的互作片段比例，提高建库有效数据和质量。

在某些实施方式中，所述步骤3）中，黏性末端补平标记物为生物素，且所述生物素用量仅需传统in situ Hi-C系统所需生物素含量的二分之一。在此优化条件下，不仅在可以保持原有效果不变甚至优于原有技术效果的前提下，还可以降低技术步骤中最贵的生物素试剂含量为标准in situ Hi-C使用量的一半，且在引入in situ Hi-C框架的同时省去了末端去除生物素的酶和体系，降低使用成本。

在某些实施方式中，所述步骤3）中邻位连接采用的连接反应液含重组白蛋白Recombinant Albumin。由此，在邻位连接反应液采用重组白蛋白Recombinant Albumin替代现有技术中的BSA，可以提高连接效率。

在某些实施方式中，所述邻位连接反应液由体积百分比10×NEB T4 DNA ligasebuffer，体积百分含量10％ Triton X-100，质量百分含量20mg/ml重组白蛋白RecombinantAlbumin (rAlbumin)，质量百分含量400U/µl T4 DNA Ligase和超纯水组成。

在某些实施方式中，所述步骤4）中还包括在互作DNA超声片段化后，对片段大小进行磁珠分选。该技术引入的片段大小分选步骤通过两次不同比例磁珠纯化方式进行，所述比例分别为0.55倍、0.15倍，该比例具体指第一次加入Ampure XP beads 磁珠的体积，是此时待加入的起始文库体积的0.55倍；第二次加入磁珠时，加入磁珠的体积是起始文库体积的0.15倍。由此，不仅可以得到更高的纯化浓度，还能保证更好的纯化质量。

在某些实施方式中，所述步骤6）中，将加好测序接头的文库进行PCR预扩增（质量控制QC），所述扩增体系体积为20μL，具体为体积百分比为2×PCR ReadyMix（包含扩增酶和所需离子添加剂的混合物）、体积百分比为10×PCR Primer Mix、超纯水和1μL测试文库。由此，在正式文库扩增前引入低至1μL微量文库一个循环数目预扩增并进行QC质量控制，可以使得正式文库扩增时条件达到最优，大大降低文库的浪费和损失。

根据本发明的第二个方面，提供了一种采用上述适用于微生物群体的宏基因组GutHi-C建库方法制备的GutHi-C文库。由此，该GutHi-C文库在进行高通量测序时，其数据的比对率（指唯一比对率）、有效数据产出率、Hi-C试验目标序列比例、多重比对率、未比对率均优于期刊上的文章（Derek M. Bickhart et al,Nature Biotechnology,2022）中方法做出的数据，也优于CN111909983A专利中方法做出的数据，说明本申请的GutHi-C文库构建方法更有优势，构建的GutHi-C文库质量更好。

根据本发明的第三个方面，提供了一种采用上述适用于微生物群体的宏基因组GutHi-C建库方法制备的微生物高通量测序试剂盒。该试剂盒可以适用于来自畜禽、人类等动物肠道、粪便的微生物群体，土壤微生物，和培养组微生物混合物等各种环境下的微生物宏基因组建库和高通量测序。

根据本发明的第四个方面，提供了一种GutHi-C文库在辅助完整宏基因组组装，以及揭示细菌染色质三维结构中的应用。

根据本发明的第五个方面，提供了一种GutHi-C文库在微生物宏基因组高通量测序中的应用。

根据本发明的第六个方面，提供了一种微生物高通量测序试剂盒在微生物宏基因组高通量测序中的应用。

在某些实施方式中，所述微生物样本取自岭南黄鸡肠道内容物，也可以是畜禽、人类粪便样品、土壤微生物和培养的多细菌混合溶液等。

本发明的有益效果：

1、本方法是经过优化的GutHi-C文库构建方法，构建出来的GutHi-C文库在进行高通量测序时，其数据的唯一比对率、有效数据产出率、Hi-C试验目标序列比例、多重比对率、未比对率均优于期刊上的文章（Derek M. Bickhart et al,Nature Biotechnology,2022）中方法做出的数据，也优于CN111909983A专利中方法做出的数据，说明本申请的GutHi-C文库构建方法更有优势。并且，本发明采用先富集嵌合DNA，再进行建库，整体大大降低建库试剂环节的整体试剂用量。正式文库扩增前引入1μL微量文库一个循环数目预扩增，大大降低文库的浪费和损失，使得正式文库扩增时条件达到最优。本发明优化条件后，保持原有效果甚至优于现有技术效果的情况下，降低技术步骤中最贵的生物素试剂含量为标准Hi-C使用量的一半，并省去了末端去除生物素的酶和体系，节约建库成本。

2、本发明以畜禽肠道为研究模型，利用GutHi-C技术进行多批次文库构建与测序，测序结果显示本申请的GutHi-C技术与该期刊（Derek M. Bickhart et al,NatureBiotechnology,2022）发表的宏基因组Hi-C技术相比，可以得到较高的有效数据（去除PCR重复）比例（是后者Derek M. Bickhart et al,Nature Biotechnology, 2022中公布数据的10倍，不去除PCR重复是2-5倍），且在本申请中得到了目前最优条件组合流程（先破壁后交联、液氮研磨和溶菌酶一起处理、双酶切、引入环状伴侣DNA、先生物素富集互作文库再免疫磁珠上进行建库、先文库PCR预扩增QC再进行正式扩增、PCR胶回收切胶范围400以上）。

附图说明

图1为GutHi-C技术路线图，左图实施例1，右图为实施例2；

图2为超声波打断后互作DNA打断质控胶图，左图为实施例1结果图，右图为实施例2结果图，其中样品序号与表1和表4中样品序号对应；

图3为实施例1和实施例2的PCR QC预实验12循环质控胶图（QC，质量控制），左图为实施例1结果图，右图为实施例2结果图，其中样品序号与表1和表4中样品序号对应；

图4为实施例1正式PCR 实验胶图，其中样品序号与表1中样品序号对应；

图5为实施例2正式PCR 实验胶图，其中样品序号与表4中样品序号对应；

图6为实施例1和2与现有技术的样本平均唯一比对率（Mapping_rate）比较结果图，其中：实施例1 GutHi-C(先裂解细胞壁后交联)表示采用实施例1中方法的做出结果数据、实施例2 GutHi-C(先交联后破细胞壁)表示采用实施例2中方法的做出结果数据、Sheep1(Nature Biotechnology,2022)表示期刊上发表文章（Derek M. Bickhart et al,Nature Biotechnology,2022）中方法的结果数据、CN111909983A ICE表示公布号为CN111909983A的专利中公布的方法的结果数据；

图7为实施例1和2与现有技术的各自处理组唯一比对率（Mapping_rate）比较结果图，其中：实施例1表示采用实施例1中方法的做出结果数据、实施例2表示采用实施例2中方法的做出结果数据、Nature Biotechnology,2022表示期刊上发表文章Derek M. Bickhartet al,Nature Biotechnology,2022中方法的结果数据、CN111909983A ICE表示公布号为CN111909983A的专利中公布的方法的结果数据；

图8为实施例1和2与各自处理组有效数据产出率（有效数据占总测序量比率）（Valid_interaction_rmdup/Total_pairs_processed）比较结果图，其中：实施例1表示采用实施例1中方法的做出结果数据、实施例2表示采用实施例2中方法的做出结果数据、Nature Biotechnology,2022表示期刊上发表文章Derek M. Bickhart et al,NatureBiotechnology,2022中方法的结果数据、CN111909983A ICE表示公布号为CN111909983A的专利中公布的方法的结果数据；

图9为实施例1和2与现有技术的各自处理组Hi-C试验目标序列比例（占双端唯一配对序列比率）（Valid_interaction_pairs/Unique_paired_ alignments）比较结果图，其中：实施例1表示采用实施例1中方法的做出结果数据、实施例2表示采用实施例2中方法的做出结果数据、Nature Biotechnology,2022表示期刊上发表文章Derek M. Bickhart etal,Nature Biotechnology,2022中方法的结果数据、CN111909983A ICE表示公布号为CN111909983A的专利中公布的方法的结果数据、CN109056078A链霉菌表示公布号为CN109056078A的专利中公布针对单一细菌Hi-C的方法的结果数据；

图10为实施例1和2与现有技术的各自处理组多重比对率（Multiple_pairs_alignments_rate）比较结果图，其中：实施例1表示采用实施例1中方法的做出结果数据、实施例2表示采用实施例2中方法的做出结果数据、Nature Biotechnology,2022表示期刊上发表文章Derek M. Bickhart et al,Nature Biotechnology,2022中方法的结果数据；

图11为实施例1和2与现有技术的各自处理组未比对率（Unmapped_pairs_rate）比较结果图，其中：实施例1表示采用实施例1中方法的做出结果数据、实施例2表示采用实施例2中方法的做出结果数据、Nature Biotechnology,2022表示期刊上发表文章Derek M.Bickhart et al,Nature Biotechnology,2022中方法的结果数据。

具体实施方式

下面结合附图对发明作进一步详细的说明。

实施例1以中国岭南黄鸡肠道微生物为研究对象，进行宏基因组学GutHi-C技术测试和分析，技术路线图参考图1（左图为实施例1技术线路图），步骤如下：

（一）肠道微生物分离

1）取新鲜肠道微生物宏基因组样本0.5g，进行冲洗和孵育：

孵育体系配制方法为：称取10 g蛋白胨、5 g 酵母提取物、10 g NaCl到1 L的大锥形瓶中，加950 ml去离子水，溶解后，加5M NaOH PH配至7.0-7.4，同时定容至1 L。配好后，用牛皮纸封好锥形瓶。高压蒸汽灭菌锅灭菌30 min。

2）样本孵育后，进行12000 g离心后，3mL预冷1×DPBS重悬细胞，每1mL样品分装于一个1.5mL离心管中(实际0.166 g)，4℃2000 g离心5min，吸弃上清；

3）-80℃保存，或进行下一步。

（二）高效裂解透化细胞

用液氮研磨和溶菌酶并行裂解微生物细胞壁，各个样品分组如表1中分类及处理方式（表1中样品命名含义：以GUT3-ZM4为例，GUT代表肠道，3代表测试试验批次，Z代表试验人员，M代表盲肠段的微生物，4代表所有批次下的样本编号）：

1）利用液氮研磨方法和溶菌酶化学孵育方法并行裂解微生物细胞壁；

2）或只通过液氮研磨处理；

3）或只溶酶菌处理（不用研磨）

（三）对微生物细胞核进行甲醛交联、酶切

1）对经过步骤（二）处理后的样品进行2000 g离心保留上清，用DPBS清洗沉淀后加入37％甲醛进行交联；

2）加入2.0M甘氨酸进行解交联；

3）2000g，常温离心5min，去上清，加入500μL 1×NEBuffer™ DpnII（NEB R0543S）重悬；

4）每管加20μL限制性内切酶DpnII（NEB R0543S，10,000 units/ml）和20μL限制性内切酶HpyCH4IV（NEB R0619L，10,000 units/ml），37℃酶切过夜。

（四）用生物素标记的酶切后片段并进行末端补平和钝端环化连接

1）对经过步骤（三）处理后的样品进行62℃孵育20分钟，2000g RT离心5min，弃上清；加265μL 1×Cutsmart（NEB B6004）缓冲液，混匀；

2）加25 μL fill-in master mix和25μL 1×Cutsmart缓冲液，并进行混匀；

按照50μL标准配制fill-in master mix 时，各组分如下：1.5μL 10mM dATP（Thermo Fisher）、1.5μL 10mM dGTP（Thermo Fisher）、1.5μL 10mM dTTP（ThermoFisher）、37.5μL 0.4mM biotin-14-dCTP（Thermo Fisher；19518018）和8μL 5U/μL Klenow（NEB）；

在Dilution Hi-C、in situ Hi-C等常规Hi-C系统中，需要加50 μL fill-inmaster mix；而本实施例中只需要加25 μL fill-in master mix+25μL Cutsmart即可；而Cutsmart要比生物素便宜，且生物素添加量减少后，还可以省去末端去除生物素环节，节约建库时间和成本；

3）37℃震荡孵育1.5h；

4）加900μL ligation master mix（120μL 10×T4DNA ligase buffer (NEB)，100μL 10%Triton X-100，6μL 20mg/ml Recombinant Albumin（重组白蛋白，NEB B9200S），5μL400U/μL T4 DNA Ligase (NEB)和669μL超纯水）；

5）颠倒混匀，常温旋转4h。

（五）获得纯化的DNA

1）加50μL proteinase K（蛋白酶K）(20mg/ml)和120μL 10%SDS，55℃孵育30min；

2）加130μL 5M氯化钠，68℃孵育过夜；

3）试管放至常温；

4）样品等分750μL分别移至新的离心管中；加1.2mL无水乙醇和75μL 3M醋酸钠（pH5.5），颠倒混匀，-80℃孵育15min；

5）2℃21000g离心15min。离心后立即放冰上，弃上清；

6）加400μL 80%乙醇重悬沉淀，同一样品两管合成一管，800μL样品转至新的离心管中，4℃21000g离心10min；

7）加800μL 80%乙醇重悬沉淀，4℃21000g离心10min，弃上清，放4℃冰箱晾干1-3h；

8）加131μL 1×Tris buffer（10mM Tris-HCl, pH8）重悬沉淀，37℃孵育20min，常温3000g离心1.5min，吸上清至新的离心管中；

9）Qubit测DNA浓度，结果如表2所示，结果表明：序号3中只采用溶菌酶处理，不研磨时，DNA的纯化浓度最高

（六）引入环状共沉淀DNA并超声打断

1）将1.95μL环状共沉淀DNA（为了作为对照观察打断效果，保证200ng）加入到上述(五)得到的纯化后环状DNA中，得到加入质粒后的样品，加1×Tris buffer (pH 8.0)将体系补至130μL，混匀；

2）将130μL反应体系转移到microTUBE AFA(Covaris 220)管中；

3）按程序设定(Fill Level 10，Duty Cycle 15，PIP 500，Cycles per Burst200，Time 58s)打断环化DNA，得到片段化环状共沉淀和环状DNA混合物；

4）打断管样品全部转至新的离心管中。

（七）DNA纯化

1）转移130μL上述(六)得到的片段化环状共沉淀和环状DNA混合物到156μL (1.2倍) Ampure XP beads磁珠 (Beckman Coulter；A63881) 中(总体积286μL)，混匀，常温静置5min；

2）将含有Ampure XP beads磁珠的样品放于磁力架上，静置5分钟，溶液变澄清，移液枪吸出上清液；

3）加入700μL新鲜制备的80％EtOH（乙醇，体积分数99.7％），清洗两次。添加时保证样品管始终在磁力架上，每次清洗时，常温孵育30秒；

4）第二次清洗时，略微旋转样品管，重新放回磁力架上，用10μL移液枪去除残余的EtOH，常温5min晾干；

5）加入300μL 1×Tris buffer混匀，常温静置5min，放回磁力架，约5min后溶液变澄清，将上清液转移到新的离心管中，得到纯化后的DNA；

6）Qubit测浓度，如表3所示，结果中序号3的纯化浓度最高；取10μL (~12ng) DNA跑2% E-gel，结果如图2所示，左边表示实施例1中序号1-3样品结果，结果表明打断效果理想

（八）基于生物素捕获，免疫磁珠抓取获得目的片段，并进行文库扩增和测序

1）向新的离心管中加400μL 1×Tween Washing Buffer（TWB：5mM Tris-HCl (pH7.5)，0.5mM EDTA，1M NaCl，0.05% Tween20），然后加50μL Dynabeads MyOneStreptavidin T1 beads（Life technologies，10mg/ml，65602），混匀，放于磁力架上，静置3min，去除缓冲液；

2）加300μL 2×Binding Buffer（10mM Tris-HCl (pH 7.5)，1mM EDTA，2M NaCl）重悬磁珠，然后将文库加到磁珠混合液中，吹打混匀，常温旋转15min；

3）放回磁力架，约5min后溶液变澄清，弃上清；

4）加600μL 1×TWB，混匀，55℃孵育2min，放回磁力架3min，弃上清；

5）重复第55步，常温晾干3min，加25μL超纯水溶解Beads，得到生物素标记DNA片段，去除了环状共沉淀相关片段；

之后步骤全伴随免疫磁珠进行。

（九）文库制备

9.1、末端修复和加尾反应

1）体系为：上述(八)得到的生物素标记DNA片段样品25μL，End Prep Mix4（VazymeND607-01）7.5μL；

2）轻轻涡旋震荡，转移到PCR仪上立即进行孵育（20℃15min；65℃15min；4℃∞），得到末端修复和加尾反应产物。

9.2、加接头

1）制备连接混合液（末端修复和加尾反应产物32.5μL，Adapter储存液1μL，超纯水1.5μL，连接缓冲液12.5μL，DNA连接酶2.5μL）。完全混匀，轻微离心。快速进行Adapter连接。20℃孵育15min，得到加接头后产物。

9.3、洗接头

1）加150μL 1×TE buffer，混匀，洗2遍，然后加150μL 1×B/W buffer，混匀，洗2遍，加40μL超纯水溶解。

9.4、PCR QC预扩增

1）制备PCR混合物（2× KAPA HiFi HotStart Ready预混液（KAPA Biosystems；KK8502）10μL，10× KAPA文库扩增引物预混液（KAPA Biosystems；KK8502）1μL，得到的洗接头后产物1μL，超纯水8μL，彻底混匀，简单离心。按如下程序设置PCR：预变性：98℃1min；12或18个循环（变性：98℃15s；退火：60℃30s；延伸：72℃30s）；终延伸：72℃5min；保存：4℃∞min。得到PCR产物。瞬时离心，吸19μL进行E-gel检测，如图3左边实施例1中样品序号1-3结果所示，表明DNA文库质量控制成功。

9.5、PCR产物磁珠纯化

1）正式PCR为6个循环，PCR之后把Ampure XP beads磁珠（1:1）加到正式PCR反应溶液中，混匀，常温静置5min；

2）放到磁力架上5min，约5min后溶液变澄清，弃上清；

3）加500μL 80%乙醇洗2次，弃上清，晾干3min；

4）加20μL超纯水溶解，混匀，常温静置5min，放回磁力架5min，上清转至新的离心管中。

9.6、选择文库

1）纯化的正式PCR文库（~20μL）全部跑E胶，使用胶回收试剂盒（Zymoclean™ GelDNA Recovery Kit-D4008）回收大小420-1000 bp片段，即为GutHi-C测序文库，结果如图4所示：切胶范围420-1000 bp，文库回收浓度分别为2.6 ng/μL（序号1）、4.14 ng/μL（序号2）、3.66 ng/μL（序号3），每样送测序20ng；

2）将所有样本按1:1质量比，混匀后进行上机前质控，进行Real time-qPCR和NGS3K文库质检合格后进行Illumina Nova-seq PE150双端测序，将下机数据进行处理后通过HiC-Pro 软件进行评估。

实施例2 一种基于先交联后破细胞壁的微生物宏基因组GutHi-C技术

技术路线图，如图1中右图的实施例2路线图。

实施例2中除部分步骤调整外，其他步骤与实施例1一致，实施例2中部分流程或者结果如下：

实施例2中各个样品分组如表4中分类及处理方式（表4中样品命名含义：以GUT1-KM1为例，GUT代表肠道，1代表测试试验批次，K代表试验人员，M代表盲肠段的微生物，1代表所有批次下的样本编号）

而实施例2中邻近连接后互作文库DNA的纯化浓度检测，结果如表5所示，结果表明序号6中纯化浓度最高

实施例2中引入磁珠分选步骤后的样品DNA浓度如表6所示，结果表明序号6中纯化浓度最高

实施例2中超声波打断后互作DNA打断质控胶图，结果如图2所示，右边为实施例2中序号4-6样品，结果表明打断效果理想。

实施例2中PCR QC预实验12循环质控胶图，结果如图3所示，右边为实施例2中序号4-6样品，结果表明引入磁珠分选后PCR预扩增条带集中，扩增效果一致、理想。表明DNA文库质量控制成功。

在实施例2中除以下步骤与实施例1不同，其他步骤相同，不同步骤处理如下：

步骤（一）肠道微生物分离后直接进行甲醛交联，交联步骤同实施例1步骤（三）；

然后，进行裂解细胞壁操作，步骤同实施例1步骤（二）；

酶切步骤，每管加5μL限制性内切酶(DpnII，NEB R0543S，10,000 units/ml)，37℃酶切过夜。生物素标记时候替换为biotin-14-dATP；

超声打断后，进行磁珠分选目的片段（替换实施例1步骤七），分选步骤具体为磁珠片段300-500 bp分选：

1）使用前将Ampure XP beads磁珠放至常温；加入超纯水进一步润洗打断管，继续转移至文库中，将文库体积配齐至200μL（磁珠分选的文库起始体积）;

2）每个样品加入110μL Ampure XP beads磁珠（是文库起始体积的0.55倍）吹打混匀室温孵育5min；

3）置于磁力架5分钟，将上清转移到新的离心管，避免吸到磁珠；

4）再加入30μL Ampure XP beads磁珠（是文库起始体积的0.15倍）吹打混匀，室温孵育5分钟；

5）置于磁力架5分钟，去上清，保留磁珠；

6）用700µl 80% 新配酒精清洗两次，之后静置5分钟待酒精挥发；

7）为了洗脱DNA，加入300ul 1 x Tris buffer，温柔的吹打混匀，室温孵育5min，放置于磁力架5min，上清转移至新的1.5ml离心管。

接下来步骤，同实施例1中步骤八和九，最后进行文库制备，使用胶回收试剂盒（Zymoclean™ Gel DNA Recovery Kit-D4008）回收大小350-700 bp片段即为GutHi-C测序文库，如图5所示，该PCR设置6个循环，切胶范围350-700 bp，文库回收浓度分别为1.46 ng/ul、2.4 ng/ul、4.8 ng/ul，每样送测序10ng。

将下机数据进行处理后通过HiC-Pro 软件进行评估。

实施例3 实施例1和2中技术方法与现有技术效果比较

将实施例1和2中获得的文库进行上机测序，并将下机数据进行处理后通过HiC-Pro 软件进行评估，将最终获得的评估结果在实施例1方法、实施例2方法、期刊（Derek M.Bickhart et al,Nature Biotechnology,2022）公布的方法和数据、专利CN111909983A中方法和数据进行比较：

3.1 平均唯一比对率（Mapping_rate）比较

实施例1和2中GutHi-C数据的样本间平均唯一比对率（Mapping_rate）与发表在期刊（Derek M. Bickhart et al,Nature Biotechnology,2022）中公布的方法和数据和专利CN111909983A中公开的宏基因组Hi-C数据比较，结果如图6所示，结果表明：GutHi-C在平均比对率水平上优于期刊（Derek M. Bickhart et al,Nature Biotechnology,2022）公布的方法和数据，且实施例1中的平均比对率数据极显著优于实施例2的平均比对率数据，实施例是四组数据结果中最优的。

3.2 各自处理组唯一比对率（Mapping_rate）比较

实施例1和2中GutHi-C数据的各自处理组唯一比对率（Mapping_rate）与发表在（Derek M. Bickhart et al,Nature Biotechnology,2022）文章中和专利CN111909983A中公开的宏基因组Hi-C数据比较，结果如图7所示，结果表明：GutHi-C在各自处理组比对率水平上优于期刊（Derek M. Bickhart et al,Nature Biotechnology,2022）公布的方法和数据，且实施例1中的各自处理组比对率数据优于实施例2的数据，实施例是四组数据结果中最优的。

3.3 各自处理组有效数据产出率（有效数据占总测序量比率）（Valid_interaction_rmdup/Total_pairs_processed）比较

实施例1和2中GutHi-C数据的各自处理组有效数据产出率（有效数据占总测序量比率）（Valid_interaction_rmdup/Total_pairs_processed）与发表在期刊（Derek M.Bickhart et al,Nature Biotechnology,2022）文章中和专利CN111909983A中公开的宏基因组Hi-C数据比较，结果如图8所示，结果表明：GutHi-C在有效数据产出率水平上优于现有技术（Nature Biotechnology,2022、CN111909983A）。

3.4 各自处理组Hi-C试验目标序列比例（占双端唯一配对序列比率）（Valid_interaction_pairs/Unique_paired_alignments）比较

实施例1和2中GutHi-C数据的各自处理组Hi-C试验目标序列比例（占双端唯一配对序列比率）（Valid_interaction_pairs/Unique_paired_alignments）与发表在（DerekM. Bickhart et al,Nature Biotechnology,2022）文章中、专利CN111909983A中公开的宏基因组Hi-C数据和专利CN111909983A单一菌株Hi-C数据比较，结果如图9所示，结果表明当GutHi-C采用先裂解细胞壁后交联的方式（实施例1）时，Hi-C试验目标序列比例与已经发表（Nature Biotechnology,2022、CN111909983A、CN109056078A）的数据质量相当；当GutHi-C采用先交联后裂解细胞壁的方式（实施例2）时，在该参数的数据质量更佳，且优于已经发表（Nature Biotechnology,2022、CN111909983A、CN109056078A）的数据。

3.5 各自处理组多重比对率（Multiple_pairs_alignments_rate）比较

实施例1和2中GutHi-C数据的各自处理组多重比对率（Multiple_pairs_alignments_rate）与发表在（Derek M. Bickhart et al,Nature Biotechnology,2022）文章中的数据比较（专利CN111909983A、CN109056078A未给出对应参数的结果），结果如图10所示，结果表明GutHi-C在多重比对率水平上优于目前发表（Derek M. Bickhart et al,Nature Biotechnology,2022）的技术，其中数据比率越低说明越理想。

3.6 各自处理组未比对率（Unmapped_pairs_rate）比较

实施例1和2中GutHi-C数据的各自处理组未比对率（Unmapped_pairs_rate）与发表在（Derek M. Bickhart et al,Nature Biotechnology,2022）文章中的数据比较（专利CN111909983A、CN109056078A未给出对应参数的结果），结果如图11所示，结果表明GutHi-C在未比对率水平上优于目前发表（Derek M. Bickhart et al,Nature Biotechnology,2022）的技术，其中数据比率越低说明越理想。

综上所述，本实施例1和2中的GutHi-C技术方案获得微生物宏基因组Hi-C文库，在高通量测序时，其效果要优于现有技术，为微生物宏基因组建库和高通量测序时提供了高效的方法，应用前景可观。

以上所述的仅是本发明的一些实施方式。对于本领域的普通技术人员来说，在不脱离本发明创造构思的前提下，还可以做出若干变形和改进，这些都属于发明的保护范围。

Claims

1.一种适用于微生物群体的宏基因组GutHi-C建库方法，其中，所述方法包括如下步骤：

2）微生物进行裂解及甲醛交联；

2.根据权利要求1所述的方法，其中，所述方法步骤2）中采用先微生物裂解，再甲醛交联的先后顺序。

3.根据权利要求2所述的方法，其中，所述微生物裂解是采用液氮研磨和/或溶菌酶裂解的方法进行。

4.根据权利要求3所述的方法，其中，所述微生物裂解仅采用溶菌酶裂解的方法进行时，可以降低文库损失，提高文库DNA浓度，更适于微生物群体量小时使用。

5.根据权利要求3中所述的方法，其中，所述微生物裂解采用液氮研磨溶菌酶共同处理的方式，且所述步骤3）中采用双酶切的方式进行酶切，所述步骤6）中正式扩增的PCR切胶大小为400bp以上；所述双酶切的组合为DpnII与HpyCH4IV、MboI 与 HpyCh4IV、Sau3AI与HpyCh4IV中的任一组。

6.根据权利要求1中所述的方法，其中，所述步骤3）中邻位连接采用的连接反应液含重组白蛋白Recombinant Albumin。

7.根据权利要求1中所述的方法，其中，所述步骤4）中还包括在互作DNA超声片段化后，对片段大小进行磁珠分选。

8.采用权利要求1-7中任一项所述的方法制备的GutHi-C文库或制备的微生物高通量测序试剂盒。

9.权利要求8中所述的GutHi-C文库在辅助完整宏基因组组装，揭示细菌染色质三维结构中的应用。

10.权利要求8中所述的GutHi-C文库或微生物高通量测序试剂盒在微生物宏基因组高通量测序中的应用。