WO2012089148A1

WO2012089148A1 - 单细胞基因组分析方法及试剂盒

Info

Publication number: WO2012089148A1
Application number: PCT/CN2011/084959
Authority: WO
Inventors: 殷旭阳; 鲍莉; 徐讯; 吴汉杰; 刘晓羽; 张秀清; 杨焕明
Original assignee: 深圳华大基因科技有限公司; 深圳华大基因研究院
Priority date: 2010-12-31
Filing date: 2011-12-29
Publication date: 2012-07-05
Also published as: CN102533960A; EP2660331A1; US20140017683A1; CN102533960B; EP2660331B1; US9238840B2; HK1169454A1; EP2660331A4

Description

单细胞基因组分析方法及试剂盒

优先权信息

本申请请求 2010 年 12 月 31 日向中国国家知识产权局提交的、专利申请号为 201010619689.8的专利申请的优先权和权益，并且通过参照将其全文并入此处。技术领域

本发明涉及分子细胞生物学领域，特别是高等生物单细胞基因组研究领域。具体地，本发明涉及单细胞基因组分析方法及试剂盒。背景技术

个体的不同组织之间，同一组织的不同部位间均存在异质性。同样，细胞之间也存在异质性，即使是体外培养遗传背景完全相同的细胞群体。因此，开发应用于单个细胞研究的技术方法，以便揭示细胞异质性的规律，对于更好地进行细胞生物学研究意义重大。由此，有学者提出了 "单细胞分析（SCA ) " 概念。而在单细胞分析中，对单细胞基因组的研究是现阶段的研究重点。

目前，微量 DNA和单细胞基因组研究已被广泛应用于考古学、微生物生态学、医学检测、法医学检测、临床诊断以及各种科学研究中（可参见 Zhang L.， Cui X.， Schmitt K.， Hubert R.， Navidi W.， Arnheim N. (1992) Whole genome amplification from a single cell: Implication for genetic analysis, Proc Natl Acad Sci USA: 5847-5851 , 通过参照将其全文并入本文）。其中，对高等动植物的单细胞基因组进行分析和研究，能够高效、方便地应用于临床诊断和治疗（如产前诊断、胚胎植入前遗传诊断、多点图谱制作、精子和卵子的分型、遗传病诊断等）、医学研究（如自闭症、神经系统疾病和自体免疫性疾病的研究、基因组变异率研究、干细胞研究等）、考古学研究以及法医学检测中，意义重大。然而，目前关于哺乳动物等高等生物的单细胞基因组的研究和报道很少。

因此，现阶段的单细胞基因组分析方法仍有待改进。发明内容

本发明是基于发明人的下列发现而完成的：

目前，主要通过对单细胞基因组进行测序来进行单细胞基因组分析。因为，常用的 DNA分析方法例如比较基因组杂交技术（ Comparative Genomic Hybridization , CGH )、聚合酶链式反应（ Polymerase Chain Reaction , PCR ) 、基因芯片（ DNA Micro array ) 、限制性片段长度多态性分析 ( Restricted Fragment Length Polymorphisms , RFLP ) 、单链构象多态性分析（ SSCP ) 、指纹技术和荧光原位杂交技术（Fluorescence in Situ Hybridization, FISH )等，只能对单细胞基因组的部分区域或已知位点进行研究，且缺乏对全新物种的基因组研究的有效策略，而对单细胞基因组进行测序可以有效避免这些不足。但是，单细胞基因组的 DNA量为皮克级水平，而目前的测序技术要求起始 DNA 量为微克级水平，因此，必须将单细胞基因组进行全基因组扩增（WGA ) 使之达到足够量。然而已知的全基因组扩增方法包括 PEP-PCR, DOP-PCR等基于 PCR的方法，以及多重链置换扩增（MDA, Multiple Displacement Amplification ) , 均容易受到较多因素干扰，无法保证扩增达到 100%的成功率。

本发明旨在至少解决现有技术中存在的技术问题之一。为此，本发明提供了一种单细胞基因组分析方法及一种试剂盒，以便在将单细胞基因组的全基因组扩增产物进行测序前，对该全基因组扩增产物进行检测和筛选，以去除未扩增成功的样本，保证后续单细胞基因组测序的合格率。

根据本发明的一个方面，本发明提供了一种单细胞基因组分析方法。根据本发明的实施例，该方法包括以下步骤：分离并裂解单细胞，以便获得该细胞的全基因组 DNA; 对全基因组 DNA进行单细胞全基因组扩增，以便获得全基因组扩增产物；釆用看家基因特异性引物，以全基因组扩增产物为模板进行 PCR扩增，以便对全基因组扩增产物进行看家基因检测；以及基于检测的结果，确定全基因组扩增产物是否符合测序要求，其中，扩增产物在每条染色体上均匀分布是扩增产物符合测序要求的指示。

发明人惊奇地发现，利用根据本发明实施例的单细胞基因组分析方法对高等生物的单细胞进行分析，能够有效地获得该待测单细胞的符合测序要求指示的全基因组扩增产物，进一步，该扩增产物能够有效地用于构建待测单细胞的基因组测序文库，并且所得测序文库能够有效地应用于高通量测序平台例如 Solexa测序平台，从而基于测序结果，能够准确有效地获得待测单细胞的基因组 DNA序列信息，进而基于这些信息能够有效地用于后续更深入的单细胞基因组分析和研究。

根据本发明的另一方面，本发明提供了一种试剂盒。根据本发明的实施例，该试剂盒包含看家基因特异性引物。发明人发现，利用根据本发明实施例的试剂盒能够有效地获得高等生物的单细胞的符合测序要求指示的全基因组扩增产物，进而通过利用该扩增产物构建测序文库，并将所得测序文库进行高通量测序，基于测序结果，能够准确有效地获得待测单细胞的基因组 DNA序列信息，从而基于这些信息，能够实现对待测单细胞的基因组分析。

本发明的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。附图说明

本发明的上述和 /或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解，其中：

图 1 : 显示了根据本发明一个实施例的人细胞系单细胞基因组测序数据在每条常染色体上的覆盖率情况。

图 2: 显示了根据本发明一个实施例的人细胞系单细胞基因组测序数据在每条常染色体上的平均测序深度情况。

图 3 : 显示了根据本发明一个实施例的以 1号染色体为例，评价人细胞系单细胞基因组测序深度的分布情况。

图 4: 显示了根据本发明一个实施例的人细胞系单细胞基因组测序数据中，覆盖率与测序深度间的关系图。

图 5 : 显示了根据本发明一个实施例的所得的人细胞系单细胞基因组测序数据与人细胞群体数据的偏向性分析图。

图 6: 显示了根据本发明一个实施例的人细胞系单细胞 1号染色体的测序深度 GC 含量的关系图。

图 7: 显示了根据本发明一个实施例的看家基因检测电泳结果图。发明详细描述

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。

需要说明的是，在本发明的描述中，除非另有说明， "多个" 的含义是两个或两个以上。

单细胞基因组分析方法

根据本发明的一个方面，本发明提供了一种单细胞基因组分析方法。根据本发明的实施例，该方法可以包括以下步骤：

首先，分离并裂解单细胞，以便获得该细胞的全基因组 DNA。

其次，对全基因组 DNA进行单细胞全基因组扩增，以便获得全基因组扩增产物。根据本发明的实施例，对全基因组 DNA进行单细胞全基因组扩增的方法不受特别限制。根据本发明的一个具体示例，可以釆用多重置换扩增 MDA或 DOP-PCR全基因组扩增进行单细胞全基因组扩增。

接着，釆用看家基因特异性引物，以全基因组扩增产物为模板进行 PCR扩增，以便对全基因组扩增产物进行看家基因检测。根据本发明的实施例，单细胞的来源不受特别限制。根据本发明的一个具体示例，单细胞可以为人单细胞，看家基因可以为选自 PRDX6、 RPL37a、 ADD1、 HLA-A、 RAD9A、 ARHGEF7、 EIF2B2、 PSMD7、 BCAT2及 ATP50中的至少一种。根据本发明的一些具体示例，针对 PRDX6,看家基因特异性引物分别具有 SEQ ID NO: 1和 SEQ ID NO: 2所示的核苷酸序列；针对 RPL37a, 看家基因特异性引物分别具有 SEQ ID NO: 3和 SEQ ID NO: 4所示的核苷酸序列；针对 ADD1 , 看家基因特异性引物分别具有 SEQ ID NO: 5和 SEQ ID NO: 6所示的核苷酸序列；针对 HLA-A, 看家基因特异性引物分别具有 SEQ ID NO: 7和 SEQ ID NO: 8所示的核苷酸序列；针对 RAD9A, 看家基因特异性引物分别具有 SEQ ID NO: 9和 SEQ ID NO: 10所示的核苷酸序列；针对 ARHGEF7, 看家基因特异性引物分别具有 SEQ ID NO: 11和 SEQ ID NO: 12所示的核苷酸序列；针对 EIF2B2, 看家基因特异性引物分别具有 SEQ ID NO: 13和 SEQ ID NO: 14 所示的核苷酸序列；针对 PSMD7,看家基因特异性引物分别具有 SEQ ID NO: 15和 SEQ ID NO: 16所示的核苷酸序列；针对 BCAT2, 看家基因特异性引物分别具有 SEQ ID NO: 17 和 SEQ ID NO: 18所示的核苷酸序列；或者针对 ATP50, 看家基因特异性引物分别具有 SEQ ID NO: 19和 SEQ ID NO: 20所示的核苷酸序列。

然后，基于检测的结果，确定全基因组扩增产物是否符合测序要求，其中，扩增产物在每条染色体上均勾分布是该扩增产物符合测序要求的指示。在本文中所使用的表达方式 "扩增产物在每条染色体上均匀分布是该扩增产物符合测序要求的指示" 是指，当釆用看家基因特异性引物，以全基因组扩增产物为模板进行 PCR扩增时，如果所有与看家基因特异性引物相对应的分布于不同染色体上的看家基因都能够得到有效地扩增，则表明前面获得的单细胞的全基因组扩增产物在每条染色体上是均匀分布的，从而能够表明全基因组扩增效果比较好，扩增产物能够符合后续的测序要求，因此，可以说扩增产物在每条染色体上均勾分布是该扩增产物符合测序要求的指示。根据本发明的具体示例，本发明的单细胞基因组分析方法可以进一步包括对符合测序要求的扩增产物构建 DNA测序文库。根据本发明的一些实施例，还可以进一步包括对 DNA测序文库进行测序。此外，根据本发明的一些实施例，可以对全基因组扩增产物进行看家基因定量检测。

具体地，根据本发明的一些实施例，本发明的单细胞基因组分析方法可以包括以下步骤：

a、分离并裂解单细胞，得到完整的细胞基因组 DNA;

b、对细胞基因组 DNA进行单细胞全基因组扩增，以便获得全基因组扩增产物； c、对全基因组扩增产物进行定量检测及定性检测，该定性检测是指，釆用看家基因 ( Housekeeping Gene )检测方法，对全基因组扩增产物进行检测，其中，扩增产物在每条染色体上均匀分布是扩增产物符合测序要求的指示。

根据本发明的实施例，该方法还可以包括步骤 d: 将检测合格的扩增产物进行 DNA测序文库构建并测序。

才艮据本发明的一些实施例，优选地，步骤 b 中的单细胞全基因组扩增釆用多重置换扩增 MDA或 DOP-PCR全基因组扩增进行。

根据本发明的实施例，在步骤 c中，釆用看家基因检测是指，釆用看家基因的特异性引物，以全基因组扩增产物为模板进行 PCR扩增。

根据本发明的一些具体示例，优选地，单细胞为人单细胞，看家基因为选自位于 1 号染色体的 PRDX6、位于 2号染色体的 RPL37a、位于 4号染色体的 ADD1、位于 6号染色体的 HLA-A、位于 11号染色体的 RAD9A、位于 13号染色体的 ARHGEF7、位于 14号染色体的 EIF2B2、位于 16号染色体的 PSMD7、位于 19号染色体的 BCAT2以及位于 21号染色体的 ATP50中的至少一种。

根据本发明的一些实施例，优选地，针对 PRDX6, 看家基因特异性引物分别具有 SEQ ID NO: 1和 SEQ ID NO: 2所示的核苷酸序列；针对 RPL37a, 看家基因特异性引物分别具有 SEQ ID NO: 3和 SEQ ID NO: 4所示的核苷酸序列；针对 ADD1 , 看家基因特异性引物分别具有 SEQ ID NO: 5和 SEQ ID NO: 6所示的核苷酸序列；针对 HLA-A, 看家基因特异性引物分别具有 SEQ ID NO: 7和 SEQ ID NO: 8所示的核苷酸序列；针对 RAD9A, 看家基因特异性引物分别具有 SEQ ID NO: 9和 SEQ ID NO: 10所示的核苷酸序列；针对 ARHGEF7, 看家基因特异性引物分别具有 SEQ ID NO: 11和 SEQ ID NO: 12所示的核苷酸序列；针对 EIF2B2, 看家基因特异性引物分别具有 SEQ ID NO: 13和 SEQ ID NO: 14 所示的核苷酸序列；针对 PSMD7,看家基因特异性引物分别具有 SEQ ID NO: 15和 SEQ ID NO: 16所示的核苷酸序列；针对 BCAT2, 看家基因特异性引物分别具有 SEQ ID NO: 17 和 SEQ ID NO: 18所示的核苷酸序列；或者针对 ATP50, 看家基因特异性引物分别具有 SEQ ID NO: 19和 SEQ ID NO: 20所示的核苷酸序列。

更具体地，才艮据本发明的一些实施例，本发明的单细胞基因组分析方法还可以包括以下步骤：

( 1 )分离单细胞：

可以釆用物理机械、化学或生物的方法，例如微流控、流式细胞仪、口吸分离、梯度稀释或低熔点琼脂糖固定等方法，分离得到包含完整基因组的单个细胞。

( 2 ) 裂解细胞：

可以釆用例如去污剂法、煮沸法、碱变性法、溶菌酶法或有机溶剂法等方法，对分离得到的单个细胞进行细胞核裂解，以便得到完整的细胞基因组 DNA。

( 3 )单细胞全基因组扩增（ WGA ):

对所得的细胞基因组 DNA进行单细胞全基因组扩增，以便获得全基因组扩增产物，以达到新一代测序技术所要求的 DNA起始量。目前，全基因组扩增有 2种策略，即基于 PCR 的扩增和线性 DNA扩增，前者主要有 DOP-PCR、 PEP-PCR、 T-PCR,后者主要有 OmniPlex WGA 、多重置换扩增（MDA )。根据本发明的实施例，优选釆用多重置换扩增 MDA或 DOP-PCR进行单细胞全基因组扩增。其中，釆用多重置换扩增 MDA进行单细胞全基因组扩增时， MDA中可使用完全由随机核苷酸组成的引物，引物长度可以是 5-20个核苷酸，引物的 GC含量可根据模板的性质进行选择。其中模板的性质主要受模板 DNA的 GC含量的限制，因此引物的 GC含量选择与模板接近或相同为宜，例如当以人基因组 DNA为模板进行 MDA时，可选用 GC含量为 40%-42%的随机引物。而全基因组扩增的偏向性受 GC含量影响，例如，如图 6所示，以人基因组 DNA为模板，釆用 GC为 50%的随机引物进行 MDA 扩增时，扩增拷贝数多的区域均为高 GC的区域。 ( 4 )全基因组扩增产物定量：

可以釆用例如凝胶电泳检测、 Agilent 2100 Bioanalyzer检测、 Quant-iT™ dsDNA BR检测试剂盒检测等方法对获得的全基因组扩增产物进行定量，结果显示为无降解、符合新一代测序技术所要求的 DNA起始量的全基因组扩增产物才可以继续 DNA文库构建以及上机测序。而新一代测序技术要求的 DNA起始量因不同建库策略而有所不同，一般 DNA小片段建库要求 DNA起始量大于 1微克。

( 5 )全基因组扩增产物检测：

釆用看家基因检测方法，对获得的全基因组扩增产物进行检测，结果显示为扩增产物在相应物种的染色体上均勾分布的扩增产物才可以继续 DNA文库构建以及上机测序。该步骤为单细胞全基因组扩增产物的筛选步骤，由此可去除大量不合格的扩增产物，从而能够控制下游上机测序文库的质量，进而能够从很大程度上避免不必要的浪费。

( 6 ) DNA文库构建及上机测序：

釆用常规的全基因组 DNA文库构建或外显子序列捕获技术，对检测合格的全基因组扩增产物进行 DNA文库构建。根据本发明的实施例，可以釆用本领域技术人员熟知的方法， 1"列 ^口 Illumina文库构建方法 (可参考 http://www.illumina.com/support/documentation.ilmn, 通过参照将其全文并入本文）进行 DNA文库构建。然后，对所得文库进行质检，包括 QPCR 检测和 Agilent 2100 Bioanalyzer检测。其中， Agilent 2100 Bioanalyzer检测，要求文库的片段大小与预期大小相差在 ±10bp以内，且没有拖带； QPCR检测文库的浓度，要求根据文库浓度计算的总量达到上机的要求。利用新一代测序技术对质检合格的文库进行单细胞基因组测序。才艮据本发明的实施例，可以利用选自 Illumina HiSeq 2000测序系统、 Illumina Genome Analyzer II测序系统、 AB SOLiD™4.0测序系统以及 Roche GS FLX Titanium系统的至少一种进行测序，以便获得测序结果。

( 7 )生物信息分析：

基于对测序结果的生物信息分析，进行对单细胞基因组的测序信息分析和研究，以得到相关基因的单核苷酸多态性位点（SNP )、少数碱基的插入和缺失（InDel )、 DNA拷贝数变异（CNV )、结构变异（SV )等单细胞基因组的遗传变异信息。

根据本发明的实施例，本发明的单细胞基因组分析方法，通过对高等生物单细胞基因组 DNA进行全基因组扩增，且在扩增后引入定量及定性检测步骤，使得检测合格的样品才能进入下一步文库构建及釆用新一代测序技术（NGS ) 的测序，以实现准确高效地对单细胞基因组进行分析。发明人惊奇地发现，本发明的单细胞基因组分析方法，操作简便、省时高效，利用该方法能够高效地对高等动植物的单细胞基因组进行分析和研究，而且能够全面完整地分析单细胞基因组的遗传变异信息，可以有效避免传统的 DNA分析方法只能对单细胞基因组的部分区域进行研究的不足，并且引入的定性及定量检测筛选步骤，可去除大量不合格的扩增产物，从而能够控制下游上机测序文库的质量，能够从很大程度上避免不必要的浪费。此外，本发明的单细胞基因组分析方法，还为全新物种的单细胞基因组研究提供了有效的研究策略。试剂盒

根据本发明的另一方面，本发明提供了一种试剂盒。根据本发明的实施例，该试剂盒包含看家基因特异性引物。根据本发明的一个具体示例，该看家基因可以为选自 PRDX6、 RPL37a、 ADD1、 HLA-A、 RAD9A、 ARHGEF7、 EIF2B2、 PSMD7、 BCAT2及 ATP50中的至少一种。根据本发明的一些实施例，本发明的试剂盒中包含的看家基因特异性引物可以分别为：针对 PRDX6, 看家基因特异性引物分别具有 SEQ ID NO: 1和 SEQ ID NO: 2 所示的核苷酸序列；针对 RPL37a, 看家基因特异性引物分别具有 SEQ ID NO: 3和 SEQ ID NO: 4所示的核苷酸序列；针对 ADD1 , 看家基因特异性引物分别具有 SEQ ID NO: 5和 SEQ ID NO: 6所示的核苷酸序列；针对 HLA-A,看家基因特异性引物分别具有 SEQ ID NO: 7和 SEQ ID NO: 8所示的核苷酸序列；针对 RAD9A,看家基因特异性引物分别具有 SEQ ID NO: 9和 SEQ ID NO: 10所示的核苷酸序列；针对 ARHGEF7, 看家基因特异性引物分别具有 SEQ ID NO: 11和 SEQ ID NO: 12所示的核苷酸序列；针对 EIF2B2, 看家基因特异性引物分别具有 SEQ ID NO: 13和 SEQ ID NO: 14所示的核苷酸序列；针对 PSMD7, 看家基因特异性引物分别具有 SEQ ID NO: 15和 SEQ ID NO: 16所示的核苷酸序列；针对 BCAT2, 看家基因特异性引物分别具有 SEQ ID NO: 17和 SEQ ID NO: 18所示的核苷酸序列；或者针对 ATP50, 看家基因特异性引物分别具有 SEQ ID NO: 19和 SEQ ID NO: 20 所示的核苷酸序列。根据本发明的具体示例，本发明的试剂盒中可以进一步包含适于通过多重置换扩增 MDA或 DOP-PCR进行单细胞全基因组扩增的试剂。

发明人发现，利用根据本发明实施例的试剂盒能够有效地获得高等生物的单细胞的符合测序要求指示的全基因组扩增产物，进而通过利用该扩增产物构建 DNA测序文库，并将所得 DNA测序文库进行高通量测序，基于测序结果，能够准确有效地获得待测单细胞的基因组 DNA序列信息，以及相关基因的单核苷酸多态性位点（SNP )、少数碱基的插入和缺失（InDel )、 DNA拷贝数变异（ CNV )、结构变异（ SV )等单细胞基因组的遗传变异信息，从而基于这些信息，能够有效地实现对待测单细胞基因组的深入分析。

发明人发现，利用本发明的单细胞基因组分析方法和试剂盒，能够高效地对高等动植物的单细胞基因组进行分析和研究，并且能够高效、方便地应用于临床诊断和治疗（如产前诊断、胚胎植入前遗传诊断、多点图语制作、精子和卵子的分型、遗传病诊断等）、医学研究（如自闭症、神经系统疾病和自体免疫性疾病的研究、基因组变异率研究、干细胞研究等）、考古学研究以及法医学检测中。

需要说明的是，根据本发明实施例的单细胞基因组分析方法和试剂盒，是本申请的发明人经过艰苦的创造性劳动和优化工作才完成的。下面将结合实施例对本发明的方案进行解释。本领域技术人员将会理解，下面的实施例仅用于说明本发明，而不应视为限定本发明的范围。实施例中未注明具体技术或条件的，按照本领域内的文献所描述的技术或条件（例如参考 J.萨姆布鲁克等著，黄培堂等译的《分子克隆实验指南》，第三版，科学出版社）或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者，均为可以通过市购获得的常规产品，例如可以釆购自 Illumina公司。

实施例 1: 人细胞系单细胞基因组研究

( 1 )分离及裂解单细胞：将永生化的人淋巴细胞系单细胞加到培养亚上的 PBS液滴中，适度稀释（即根据细胞系细胞的浓度进行稀释，直到在显微镜 200x视野内观察到细胞数目在 10-20 个之间），在显微镜下口吸分离单个细胞，所得单细胞放至含有 1.5-2 L ALB ( Alkaline Lysis Buffer, 具体配方为： 50mM DTT, 200mM KOH ) 的 PCR管中，置于 -20 °〇至-80°〇至少 30min。

将存有单细胞的 PCR管以 62°〇-68 °〇优选65 °〇加热 8-12min, 以便裂解细胞，释放细胞的全基因组 DNA。

( 2 )全基因组扩增 (WG A):

可以釆用下述多重置换扩增 MDA或 DOP-PCR全基因组扩增中的任一种方式进行细胞的全基因组扩增。

①多重置换扩增 (MDA):

按产品说明书的记载配制下列试剂：

緩冲液 Dl (Qiagen REP LI-g Mini试剂盒):

其中，向緩冲液 DLB中加入 500μ 无核酸水，摇匀并短暂离心，避免管壁上沾有液滴而使混合不均，得到重构緩冲液 DLB。緩冲液 DLB对 pH值敏感，应避免与空气中的 C0₂ 中和。重构后的緩冲液 DLB可在 -20°C保存 6个月。

緩冲液 Nl(Qiagen REP LI-g Mini试剂盒):

在上述步骤（ 1 )获得的细胞的全基因组 DNA 中加入 2.5 L緩冲液 D1 , 室温下放置 3-5min, 使 DNA变性。然后加入 5μΙ^緩冲液 N1中和緩冲液，终止变性反应，以便获得单细胞的 DNA模板，室温放置，备用。

MDA反应可以釆用下述两种产品中的其中一种进行：

上述体系可根据总体积大小的需要使各成分按相同比例增加或减少。

Qiagen公司 REPLI-g Mini试剂盒:

向已有单细胞 DNA模板的 PCR管中（上述经加入緩冲液 D1变性，并加入緩冲液 N1 终止变性反应后的产物）加入上述两个反应体系中的其中任一个，混合均勾后瞬时离心，防止管壁上沾有液滴而使混合不均。然后将 PCR管置于 PCR仪上，于 30°C下恒温孵育 10-16 小时，再于 65 °C下使 Phi29聚合酶失活。

② DOP-PCR全基因组扩增：

利用 Sigma公司的 GenomePlex单细胞全基因组扩增试剂盒对上述步骤（1 )获得的细胞的全基因组 DNA进行 DOP-PCR全基因组扩增。首先，在含有单细胞 DNA的 PCR管中加水至 9μ1,然后加 Ιμΐ 10x单细胞裂解、片段化緩冲液（ lOxSingle Cell Lysis & Fragmentation Buffer ), 混匀后置于 99°C下 4min以便打断细胞基因组 DNA。之后按照说明书操作，构建 OmniPlex文库，以及进行线性、等温的起始扩增和 PCR扩增。

或者，可以利用 Rubicon Genomics公司的 PicoPlex WGA试剂盒，按照说明书对上述步骤（ 1 )获得的细胞的全基因组 DNA进行 DOP-PCR全基因组扩增。

( 3 )全基因组扩增产物浓度检测

利用 Quant-iT™ dsDNA BR检测试剂盒，按照试剂盒说明书，检测全基因组扩增产物的浓度。当所得扩增产物的含量超过 2 g时，可以继续进行 DNA文库构建以及上机测序。

( 4 ) DNA文库构建及上机测序：

釆用常规的全基因组 DNA文库构建或外显子序列捕获 (Exon Capture)技术进行 DNA文库构建，然后利用 Illumina HiSeq 2000测序系统将质检合格的文库进行单细胞基因组测序。

( 5 )生物信息分析：

通过上述对人细胞系单细胞的 DNA测序文库用 Hiseq2000系统进行的全基因组深度测序，获得的测序结果中共 35Gb数据可比对上 NCBI人参考序列，平均测序深度 13.3x ( "测序深度" 指在基因组中每个碱基被测序到的次数），其中获得的人细胞系单细胞基因组测序数据在每条常染色体上的覆盖率和平均深度见图 1和图 2,在 1号常染色体上的深度分布见图 3 , 在人类基因组的覆盖率与测序深度间的关系见图 4。其中，图 3是以染色体 10k 长度为单位统计测序平均深度，并进行作图。由图 3可知，获得的人细胞系单细胞基因组测序数据在染色体不同区域的测序深度有很大差异。由图 4可知，随测序深度增加，覆盖率亦增加，但斜率变緩，逐渐到达一个平台期，当测序深度 7x时，覆盖率可达 90%; 测序深度 lOx时，覆盖率可达 95%。

此外，将所得的人细胞系单细胞基因组测序数据与人细胞群体数据一起分析作图，具体方法为：以 1号染色体为例，以 20kb为窗口，计算每个窗口 Tag数（标签的数目）再将窗口数对应 Tag数对应 Tag数作图，结果如图 5所示。一般在某个 Tag数范围其窗口数最多，因此可形成一个峰。由图 5可知，所得的人细胞系单细胞基因组测序数据的 Tag数峰值位置明显偏离细胞群体数据，说明单细胞基因组经扩增后存在偏向性。

然后，基于所得的人细胞系单细胞基因组测序数据，以 1 号染色体为例，以 10k 为窗口统计其平均深度，然后选取 2.5%的最高深度的窗口，以及 2.5%的最低深度的窗口，分别统计 2者的 GC%分布情况，再与整条染色体的 GC%对比作图，结果如图 6所示。由图 6可知，高深度区域的 GC%显著高于整体水平，低深度区域的 0〔％显著低于整体水平，表明单细胞基因组的测序深度受 GC含量的影响。

此外，通过对获得的人细胞系单细胞基因组测序数据的分析，亦可得到细胞系单细胞基因组的遗传变异信息，如单核苷酸多态性位点（SNP )、少数碱基的插入和缺失（InDel )、 DNA拷贝数变异（CNV ) 以及结构变异（SV )等。实施例 2: 利用人看家基因引物对单细胞 WGA产物进行看家基因检测

参照实施例 1所釆用的方法，从人体组织或血液中分离单细胞，并进行裂解和 WGA处理，以便获得单细胞 WGA产物。然后，釆用看家基因特异性引物，将获得的单细胞 WGA 产物进行 PCR扩增，从而实现看家基因检测。其中， PCR扩增体系中含：耐热并具 3'外切活性的 DNA聚合酶；单细胞 WGA产物 (模板 DNA); dNTP混合物； Mg²⁺; —价阳离子；看家基因特异性引物。具体地， PCR扩增反应体系如下：

Taq DNA聚合酶 O.lU/μΙ;

模板 DNA 15ng;

dNTP混合物 0.2ηηιο1/μ1;

10x扩增緩冲液 2μ1;

看家基因特异性引物 lOpmoL

其中，所选取的看家基因及看家基因特异性 I物的信息如下:

HLA-A-S 1： 5*-GGATTACATCGCCCTGAAC-3*(7)

6/ HLA-A

HLA-A-A1： 5*-CGTCTCCTTCCCGTTCTC-3*(8)

RAD9A-S1 : 5*-GGTGAAGGCTGAACCAAG-3*(9)

11/ RAD9A

RAD9A-A1： 5*-CTGAGGCTCAATGAGAAAT-3*(10)

13/ARHGEF7 ARHGEF7-S: 5*-AGTAGCCTTTCTCGTTTG-3*(l 1)

ARHGEF7-A: 5*-CACCACCTCCCTCCAATAGT-3*(12)

EIF2B2-S: 5*-GCACCTTCCTACATCTAC-3*(13)

14/ EIF2B2

EIF2B2-A: 5*-TAAGAGGCTCCAAAATCAAC-3*(14)

PSMD7-S: 5*-AAAGTCGCCACAGGCAAGC-3*(15)

16/ PSMD7

PSMD7-A: 5*-CGTAGCACCACAGCAAG-3*(16)

BCAT2-S1 : 5*-GGAATCAGAGCCCACGAGT-3*(17)

19/ BCAT2

BCAT2-A1： 5*-TATCCTTGACCGCACGAC-3*(18)

ATP50-S1 : 5*-GCACCACCAAGCCCTAAC-3*(19)

21/ATP50

ATP50-A1： 5*-TCTCCGCGATGGACACTC-3*(20)

注： S: 指正向引物； A:指反向引物； SI或 Al中的 1仅为了区分不同批次的引物。

其中，上述看家基因的具体信息可参见 Eli Eisenberg and Erez Y.Levanon, (2003)Human housekeeping genes are compact.Trends in Genetics.19(7) : 362-365. , 通过参照将其全文并入本文。本发明人研究发现，相对于其它染色体上的其它看家基因，上述表格所选取的看家基因及其引物能够更加方便准确地用于人细胞 WGA扩增产物的看家基因检测。

其中， PCR反应条件为：

95 °C 3min

72 °C lOmin

4°C oo

按照上述看家基因检测方法，对 50份人血液单细胞 WGA产物进行看家基因检测。其中所釆用的上述 10对看家基因特异性引物，分别对应 1、 2、 4、 6、 11、 13、 14、 16、 19、 21号染色体上的看家基因，看家基因检测结果以 8对引物出现目的条带为扩增产物合格的标准。检测结果显示， 50份人血液单细胞 WGA产物中有 34份合格。然后，釆用 Agilent SureSelect 系统的建库流程，将 50 份人血液单细胞 WGA产物均进行外显子捕获（ Exon Capture )建库，然后利用 Illumina Hiseq2000系统分别对获得的 50份文库进行测序。

测序结果显示，在看家基因检测合格的 34份人血液单细胞 WGA产物中，目标区域测序覆盖率均达 60%以上，成功率达 100%; 而在看家基因检测不合格的 16份人血液单细胞 WGA产物中，仅有 1份的目标区域测序覆盖率达 60%以上，成功率仅为 6.25%。具体结果统计如下:

注： *为检测合格的样品。

才艮据本发明的实施例，除了如实施例 1 中所示，选取 1、 2、 4、 6、 11、 13、 14、 16、 19、 21 号染色体上的看家基因外，发明人也针对其他染色体分别选取了一个看家基因，并设计了相应的看家基因特异性引物，其信息如下表所示：

基因名 HYAL2 UBE2D2 ACTB POLR2K ATP6V1G1 染色体号 10 12 15 17 18

基因名 TUBGCP2 TXNRD1 SRP14 PSMB6 MC2R 染色体号 20 22 X

基因名 CPNE1 EIF3D CETN2 多次险证的结果显示，上述表格中对应于除 1、 2、 4、 6、 11、 13、 14、 16、 19、 21号染色体外其余染色体的各看家基因。然后，釆用上表中的看家基因特异性引物，以上述相同的单细胞 WGA产物为模板进行 PCR扩增，即看家基因检测，所得的检测结果显示，相对于前面所述的分别对应 1、 2、 4、 6、 11、 13、 14、 16、 19、 21号染色体的看家基因的特异性引物，釆用其他染色体上的看家基因的特异性引物进行看家基因检测的效果较差，且不能真实反应出实际测序的准确性。这可能与单细胞 WGA扩增的复杂性有关。

由于从单一细胞释放的染色体 DNA极其微量，进行单细胞全基因组扩增时，环境中细微的污染很可能使扩增得到的产物并非目标产物。上述结果显示，釆用本发明的看家基因检测，特别是本发明所选取的针对人的看家基因及其特异性引物，能够对 WGA产物进行准确地定性检测。将产物定性检测符合要求后，再进行下一步建库和测序，能够控制下游上机测序文库的质量，提高测序的成功率，很大程度上避免了不必要的浪费。实施例 3: 白花蝴蝶兰（P.amabms )花粉细胞基因组研究

将本发明的单细胞基因组分析方法应用于白花蝴蝶兰（P.amabilis )花粉细胞基因组的研究，以便使基因组扩增后的产物量能够满足构建 Solexa DNA文库的需求，从而能够进行上机测序。

考虑到植物的花粉粒中有 3到 5个单细胞，所以先在倒置显 :镜下将花粉粒逐个分离，加入与花粉粒等体积的 4%纤维素酶和 2%果胶酶混合液，置于垂直混合仪上避光常温混匀 6 小时，以便裂解破细胞壁。然后，将同一花粉粒的裂解体系加到培养亚上的 PBS液滴中，在镜下分离单个细胞，所得单细胞放至含有 1.5 LALB(alkaline lysis buffer)的 PCR管中。

然后，按照以下步骤进行 MDA(multiple displacement amplification)反应：首先，于 65 °〇下裂解所得的花粉细胞 10min。接着，加入 2.5 L緩冲液 D1 (实施例 1制备）后于常温 3min, 使 DNA变性。然后加入 5μΙ^緩冲液 N1 (实施例 1制备）终止变性。其中， MDA 反应体系可釆用 Qiagen Mini Kit或 NEB的 phi29 DNA聚合酶产品。然后，于 30°C下孵育 16小时，再置于 65°C下使酶失活，以便获得 MDA产物。

利用 Quant-iT™技术对 MDA产物进行检测，结果显示 MDA产物的浓度大于 35ng^l 的，可以进行下一步的看家基因检测。然后，利用下述兰花的看家基因及其特异性引物对 MDA产物进行 PCR扩增，以便对 MDA产物进行看家基因检测：

注： F: 指正向引物； R:指反向引物。

其中，看家基因 PbGDPS与兰花的香味成份和散发味道有关， PeActin与植物的抗旱抗盐环境有关。

其中， PCR扩增的反应体系如下：

PCR反应条件为:

94 °C 5min 30个循环

94 °C 30s

55 °C 45s

72 °C lmin

72 °C 7min

4°C

然后，配制浓度为 1.2%的琼脂糖凝胶，将 PCR产物以 ΙΟΟν电压进行电泳 45min, 结果见图 7。其中，当目的条带都出现，表明样品扩增的效果很好。如图 7所示，其中各泳道分别代表： 1 : PbGDPS— SSU; 2: PbGDPS— LSU; 3 : PeActin 9; 4: PbGDPSp 1； 5 : Pe4 Cme Probe; 6: Pe4 -lex-5ex; 7: PbfMuta 1 ; 8: Pe6p。由图 7可知，扩增效果符合预期。工业实用性

本发明的单细胞基因组分析方法和试剂盒，能够有效地应用于单细胞 DNA测序文库的构建以及测序，进而能够高效地应用于高等动植物的单细胞基因组分析和研究。尽管本发明的具体实施方式已经得到详细的描述，本领域技术人员将会理解。根据已经公开的所有教导，可以对那些细节进行各种修改和替换，这些改变均在本发明的保护范围之内。本发明的全部范围由所附权利要求及其任何等同物给出。

在本说明书的描述中，参考术语 "一个实施例"、 "一些实施例"、 "示意性实施例"、 "示例"、 "具体示例"、或 "一些示例" 等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

Claims

权利要求书

1、一种单细胞基因组分析方法，其特征在于，包括以下步骤：

分离并裂解单细胞，以便获得所述细胞的全基因组 DNA;

对所述全基因组 DNA进行单细胞全基因组扩增，以便获得全基因组扩增产物；釆用看家基因特异性引物，以所述全基因组扩增产物为模板进行 PCR扩增，以便对所述全基因组扩增产物进行看家基因检测；以及

基于所述检测的结果，确定所述全基因组扩增产物是否符合测序要求，

其中，所述扩增产物在每条染色体上均匀分布是所述扩增产物符合测序要求的指示。

2、根据权利要求 1 所述的方法，其特征在于，所述全基因组扩增釆用多重置换扩增 MDA或 DOP-PCR全基因组扩增。

3、根据权利要求 2所述的方法，其特征在于，所述单细胞为人单细胞，所述看家基因为选自 PRDX6、 RPL37a、 ADD1、 HLA-A、 RAD9A、 ARHGEF7、 EIF2B2、 PSMD7、 BCAT2 及 ATP50中的至少一种。

4、根据权利要求 3所述的方法，其特征在于，

针对 PRDX6, 所述看家基因特异性引物分别具有 SEQ ID NO: 1和 SEQ ID NO: 2所示的核苷酸序列；

针对 RPL37a, 所述看家基因特异性引物分别具有 SEQ ID NO: 3和 SEQ ID NO: 4所示的核苷酸序列；

针对 ADD1 , 所述看家基因特异性引物分别具有 SEQ ID NO: 5和 SEQ ID NO: 6所示的核苷酸序列；

针对 HLA-A, 所述看家基因特异性引物分别具有 SEQ ID NO: 7和 SEQ ID NO: 8所示的核苷酸序列；

针对 RAD9A, 所述看家基因特异性引物分别具有 SEQ ID NO: 9和 SEQ ID NO: 10 所示的核苷酸序列；

针对 ARHGEF7 , 所述看家基因特异性 I物分别具有 SEQ ID NO: 11和 SEQ ID NO: 12所示的核苷酸序列；

针对 EIF2B2, 所述看家基因特异性引物分别具有 SEQ ID NO: 13和 SEQ ID NO: 14 所示的核苷酸序列；

针对 PSMD7, 所述看家基因特异性引物分别具有 SEQ ID NO: 15和 SEQ ID NO: 16 所示的核苷酸序列；

针对 BCAT2, 所述看家基因特异性引物分别具有 SEQ ID NO: 17和 SEQ ID NO: 18 所示的核苷酸序列；或者

针对 ATP50, 所述看家基因特异性引物分别具有 SEQ ID NO: 19和 SEQ ID NO: 20 所示的核苷酸序列。

5、根据权利要求 1所述的方法，其特征在于，对所述全基因组扩增产物进行看家基因定量检测。

6、根据权利要求 1所述的方法，其特征在于，进一步包括对符合测序要求的扩增产物构建 DNA测序文库。

7、根据权利要求 6所述的方法，其特征在于，进一步包括对所述 DNA测序文库进行测序。

8、一种试剂盒，其特征在于，包含看家基因特异性引物。

9、根据权利要求 8所述的试剂盒，其特征在于，所述看家基因为选自 PRDX6、 RPL37a、 ADD1、 HLA-A、 RAD9A、 ARHGEF7、 EIF2B2、 PSMD7、 BCAT2、及 ATP50中的至少一种。

10、根据权利要求 8所述的试剂盒，其特征在于，

11、根据权利要求 8-10任一项所述的试剂盒，其特征在于，进一步包含适于通过多重置换扩增 MDA或 DOP-PCR进行单细胞全基因组扩增的试剂。