CN104388426A

CN104388426A - 一种Oligo dT引物及构建cDNA文库的方法

Info

Publication number: CN104388426A
Application number: CN201410728545.4A
Authority: CN
Inventors: 盛司潼
Original assignee: Individual
Current assignee: Individual
Priority date: 2012-02-28
Filing date: 2012-02-28
Publication date: 2015-03-04
Anticipated expiration: 2032-02-28
Also published as: CN104388426B

Abstract

本发明涉及分子生物学领域，提供了一种Oligo dT引物，该Oligo dT引物含有连续的dT序列的单链DNA分子，其含有用于切割的识别位点；所述用于切割的识别位点为尿嘧啶核苷酸、脱氧肌苷或硫代磷酸酯键。本发明还提供了一种基于上述OligodT引物进行cDNA文库构建的方法。本发明的OligodT引物适用性好，可应用于多种不同的建库方案；还能准确的定位在mRNA分子polyA尾的起始位点；本发明的构建cDNA文库的方法能够保证样品中所有的mRNA分子在构建的cDNA文库中得到特异性的体现。

Description

一种Oligo dT引物及构建cDNA文库的方法

本案为2012年02月28日申请的，申请号为201210047909.3，发明名称为《一种Oligo dT引物及构建cDNA文库的方法》的分案申请。

技术领域

本发明涉及基因工程领域，更具体地说，涉及一种Oligo dT引物，以及基于这种Oligo dT引物进行cDNA文库构建的方法。

背景技术

基因表达水平的分析，对研究基因功能起着至关重要的作用。基因表达序列分析（serial analysis of gene expression，SAGE），是一种快速分析基因表达信息的技术，它通过快速和详细分析成千上万个表达序列标签（Expressed Sequenced Tags，EST）来寻找出表达丰度不同的SAGE标签序列，从而接近完整地获得基因组表达信息。SAGE技术与基因芯片一起为目前两种最常见的基因表达谱研究方法。随着第二代测序技术的发展，通过构建cDNA文库，然后利用第二代测序技术的高通量优势对mRNA文库进行测序，进而进行基因表达谱分析的方法在基因表达谱研究中占有越来越重要的地位。

真核生物的mRNA分子的5’端存在帽子结构，且往往还含有二级结构，因此，若要成功构建5’端cDNA文库（该文库中各分子携带的待测标签来源于5’各mRNA分子的5’端），必须克服5’端帽子结构和5’端存在的二级结构的影响，难度较大。此外，即使得到5’端cDNA文库，因为mRNA分子5’端GC含量较高，该文库中各分子携带的待测标签与各mRNA分子的对应关系较差，使得这种文库在多种科学研究中的应用难度较高，用于mRNA分子的表达谱分析时得到的结果不准确。还有，构建所得的5’端cDNA文库5’未端表现不足（underrepresentation）是目前技术的固有限制，且由许多因素引起。其中最重要的一种因素是由逆转录酶的延长过程的随机失效引起的。因为逆转录酶从mRNA的3’移动到5’末端，所以一定百分比的逆转录酶可能从RNA模板解离，从而引起cDNA合成过早终止。另一种起作用的因素是逆转录酶在mRNA二级结构区域暂停、减缓或停止。还有一种因素是由污染性的RNA酶引入的，如果在由mRNA分子逆转录成双链cDNA分子的过程中，有极微量的污染性RNA酶，那么，部分mRNA分子的5’未端会被污染性的RNA酶降解去除。上述情况对长mRNA分子的影响尤其严重。因此，目前构建cDNA文库的现有技术中，构建3’端cDNA文库是主流。而现有技术中常采用的Oligo dT引物为含有连续的dT序列的单链DNA分子，序列可简写为：5’-（dT）_n-3’，在整个文库的构建过程中仅具有分离纯化mRNA分子，将mRNA分子反转录成双链cDNA的作用，对形成双链cDNA后的后续操作限制较大，能应用的建库方法单一。

目前，构建3’端cDNA文库的方法大致如下：

（1）利用Oligo dT引物将mRNA反转录并合成dscDNA；

（2）锚定酶（anchoring enzyme，AE）NlaⅢ酶切dscDNA，收集dscDNA的poly A/T部分与最近的酶切位点之间的片段，得3’-cDNA；

（3）在3’-cDNA的5’端接上接头1，得含有接头1的cDNA，该接头1为双链DNA分子，包含MmeⅠ酶切识别序列，其3’端含有CATG四碱基突出末端；

（4）MmeⅠ酶切含有接头1的cDNA，并回收含有接头1的酶切产物；

（5）在含有接头1的酶切产物的3’端接上接头2，从而获得两端连有不同接头序列的cDNA文库，该接头2为双链DNA分子，其5’端为突出末端，含有两个通用碱基。

上述方法中的锚定酶为序列特异性的限制性内切酶，当某些mRNA分子上无该锚定酶的酶切位点时，这些mRNA分子在最终的cDNA文库中无法体现；又或者某些mRNA分子上锚定酶的酶切位点不合适，使得后续的Ⅱs型限制性内切酶MmeⅠ无法实现酶切，或者实现MmeⅠ酶切的位置在dscDNA的poly A/T部分，使得这些mRNA分子所形成的cDNA文库分子中包含的特异性序列太短，无法实现与这些mRNA分子特异性的对应。即，上述方法无法保证样品中所有的mRNA分子均能在cDNA文库中得到体现，进而使得后续的基因表达谱分析结果不准确。

因此需要一种新的Oligo dT引物，该引物适用性广，基于该引物形成的双链cDNA分子对后续操作的限制小，能够应用于多种建库方法中；此外还需要一种新的cDNA文库构建方法，该cDNA文库构建方法能够使样品中所有的mRNA分子在构建的cDNA文库中得到特异性的体现。

发明内容

本发明的目的在于提供一种Oligo dT引物，解决现有技术中的Oligo dT引物适用范围小，基于现有技术中的Oligo dT引物形成双链cDNA分子之后的操作限制大，应用其建库方法单一的问题。

为了实现发明目的，本发明提供了一种特殊设计的Oligo dT引物，该Oligo dT引物，适用性好，可应用于多种不同的建库方案；进一步的，该Oligo dT引物结构简单，能够准确的定位在mRNA分子poly A尾的起始位点；且利用该Oligo dT引物进行cDNA文库的构建，可避免部分mRNA分子在构建的cDNA文库中得不到特异性的体现的现象的出现。

一种Oligo dT引物，为含有连续的dT序列的单链DNA分子，其含有用于切割的识别位点。

其中，该用于切割的识别位点为尿嘧啶核苷酸、脱氧肌苷、硫代磷酸酯键或Ⅱs型限制性内切酶识别序列，所述Ⅱs型限制性内切酶识别序列在Oligo dT引物的5’端。

其中，该Oligo dT引物序列为：

5’-（dT）_xU（dT）_y-3’；或5’-（RERS）-（dT）_z-3’；

或5’-（dT）_α（P-S）（dT）_β-3’；或5’-（dT）_γ（I）（dT）_δ-3’；其中，x、y、z、α、β、γ、δ均为自然数，RERS为含有Ⅱs型限制性内切酶识别序列的核苷酸序列，P-S为硫代磷酸酯键，I为脱氧肌苷。

其中，该Oligo dT引物的3’末端为含通用碱基的核苷酸M，M为A或G或C。

进一步的，该Oligo dT引物的3’末端为两个含通用碱基的核苷酸，从5’端至3’端依次为M和N，N为A或G或C或T或U或I；所述Oligo dT引物序列为：

5’-（dT）_xU（dT）_yMN-3’；或5’-（RERS）-（dT）_zMN-3’；

或5’-（dT）_α（P-S）（dT）_βMN-3’；或5’-（dT）_γ（I）（dT）_δMN-3’；其中，x、y、z、α、β、γ、δ均为自然数，RERS为含有Ⅱs型限制性内切酶识别序列的核苷酸序列，P-S为硫代磷酸酯键，I为脱氧肌苷。

更进一步的，x+y≥14，z≥15，α+β≥14，γ+δ≥14。

其中，所述Oligo dT引物含有标记物，所述标记物采用生物素、抗原、抗体、受体、配体、多聚组氨酸中的至少一种。

本发明的另一个目的是提供一种新的cDNA文库构建方法，旨在解决现有技术不能保证样品中所有mRNA分子均能在cDNA文库中得到特异性体现的问题。

基于上述特殊设计的Oligo dT引物，本发明提供了一种cDNA文库构建方法，包括以下步骤：

A.利用Oligo dT引物反转录mRNA，形成第一条cDNA链，得RNA/DNA杂合分子；该Oligo dT引物为含有连续的dT序列的单链DNA分子，其含有用于切割的识别位点；

B.对RNA/DNA杂合分子中的第一条cDNA链进行扩增，得双链cDNA；

C.利用Ⅱs型限制性内切酶酶切双链cDNA，得含mRNA分子3’端对应序列的片段；

D.含mRNA分子3’端对应序列的片段与第一接头分子连接，得cDNA文库。

其中，该用于切割的识别位点为尿嘧啶核苷酸、硫代磷酸酯键或脱氧肌苷；该步骤C包括以下步骤：

C01.切割剂切割双链cDNA，得双链切割片段；

C02.将双链切割片段与第二接头分子连接，得第一连接产物；

C03.利用第一Ⅱs型限制性内切酶酶切第一连接产物，得含mRNA分子3’端对应序列的片段；

所述切割剂用于特异性切割尿嘧啶、硫代磷酸酯键或脱氧肌苷3’端的第二个磷酸二酯键。

进一步的，该Oligo dT引物序列为：

5’-（dT）_xU（dT）_y-3’；或5’-（dT）_α（P-S）（dT）_β-3’；

或5’-（dT）_γ（I）（dT）_δ-3’；其中，x、y、α、β、γ、δ均为自然数，14≤x+y≤17，14≤α+β≤17，14≤γ+δ≤17，P-S为硫代磷酸酯键，I为脱氧肌苷。

C11.切割剂切割双链cDNA，得双链切割片段；

C12.将双链切割片段与第二接头分子连接，得第一连接产物；

C13.利用第一Ⅱs型限制性内切酶酶切第一连接产物，得不含第二接头分子的酶切片段；

C14.将不含第二接头分子的酶切片段与第三接头分子连接，得第二连接产物；

C15.利用第二Ⅱs型限制性内切酶酶切第二连接产物，得含mRNA分子3’端对应序列的片段；

进一步的，该Oligo dT引物序列为：

或5’-（dT）_γ（I）（dT）_δ-3’；其中，x、y、α、β、γ、δ均为自然数，x+y≥14；3≤x≤9，α+β≥14，3≤α≤9，γ+δ≥14，3≤γ≤9。

其中，该用于切割的识别位点为Ⅱs型限制性内切酶识别序列，其位于Oligo dT引物的5’端；该步骤C具体为：

Ⅱs型限制性内切酶酶切双链cDNA，分离纯化出含有Oligo dT引物对应序列的酶切产物，得含mRNA分子3’端对应序列的片段。

进一步的，该Oligo dT引物序列为：

5’-（RERS）-（dT）_z-3’；其中，RERS为含有Ⅱs型限制性内切酶识别序列的核苷酸序列，z为自然数，10≤z≤17。

C21.Ⅱs型限制性内切酶酶切双链cDNA，分离纯化出无Ⅱs型限制性内切酶识别序列的酶切片段；

C22.将无Ⅱs型限制性内切酶识别序列的酶切片段与第四接头分子连接，得第三连接产物；

C23.利用第三Ⅱs型限制性内切酶酶切第三连接产物，得含mRNA分子3’端对应序列的片段。

进一步的，该Oligo dT引物序列为：

5’-（RERS）-（dT）_z-3’；其中，RERS为含有Ⅱs型限制性内切酶识别序列的核苷酸序列，z为自然数，15≤z≤30。

其中，在步骤A之前还包括步骤A’：利用Oligo dT引物从总RNA中分离纯化mRNA。

其中，上述任意方案中，所述Oligo dT引物的3’末端可为含通用碱基的核苷酸M，M为A或G或C。

进一步的，该Oligo dT引物的3’末端可为两个含通用碱基的核苷酸，从5’端至3’端依次为M和N，N为A或G或C或T或U或I；所述Oligo dT引物序列为：

5’-（dT）_xU（dT）_yMN-3’；

或5’-（RERS）-（dT）_zMN-3’；

或5’-（dT）_α（P-S）（dT）_βMN-3’；

或5’-（dT）_γ（I）（dT）_δMN-3’；

其中，x、y、z、α、β、γ、δ均为自然数，RERS为含有Ⅱs型限制性内切酶识别序列的核苷酸序列，P-S为硫代磷酸酯键，I为脱氧肌苷。

更进一步的，x+y≥14，z≥15，α+β≥14，γ+δ≥14。

其中，上述任意方案中，该Oligo dT引物在5’端含有标记物，该标记物采用生物素、抗原、抗体、受体、配体、多聚组氨酸中的至少一种；优选为生物素或多聚组氨酸。

其中，该接头分子含有标记物，该标记物采用生物素、抗原、抗体、受体、配体、多聚组氨酸中的至少一种；优选为生物素或多聚组氨酸。

其中，在步骤D之后还可包括步骤D’：利用与cDNA文库两端的已知序列相同或互补的引物对cDNA文库进行PCR扩增。

由上可知，本发明的Oligo dT引物，适用性好，可应用于多种不同的建库方案，其结构简单，基于其进行cDNA文库的构建，可避免样品中部分mRNA分子在构建的cDNA文库中得不到特异性的体现的现象出现，进一步的，还能够准确定位在mRNA分子3’端poly A的起始位点。基于本发明的Oligo dT引物进行的cDNA文库构建方法，能够使样品中所有的mRNA分子在构建的cDNA文库中得到特异性的体现，并能进一步降低起始mRNA分子量的需求，简化实验步骤，提高建库的成功率，所构建的cDNA文库中各分子携带的待测标签（即来源于各mRNA分子的特异性序列）在mRNA分子中位置的确定性高，有利于构建的cDNA文库在完成测序后的结果分析，从而可进一步提高根据构建的cDNA文库进行mRNA表达谱分析的准确性，通过本发明方法所得的cDNA文库可用于表达谱分析、mRNA分子3’端序列分析等。

附图说明

图1是本发明一个实施例中硫代磷酸脂键的结构示意图。

图2是本发明一个实施例中cDNA文库构建的方法流程图。

图3是本发明一个实施例中带茎环结构的接头的结构示意图。

图4是本发明一个实施例中单突出末端接头的结构示意图。

图5是本发明一个实施例中双突出末端的结构示意图。

图6是本发明一个实施例中得含mRNA分子3’端对应序列的片段的方法流程图。

图7是本发明另一个实施例中得含mRNA分子3’端对应序列的片段的方法流程图。

图8是本发明另一个实施例中得含mRNA分子3’端对应序列的片段的方法流程图。

图9是本发明一具体实施对照组的检测结果。

图10是本发明一具体实施实验组的检测结果。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。

本发明所述的Ⅱs型限制性内切酶为切割位点在识别序列之外的限制性内切酶，包括但不限于：AcuⅠ、AlwⅠ、BbsⅠ、BbVⅠ、BccⅠ、BceAⅠ、BciVⅠ、BfuAⅠ、BmrⅠ、BpmⅠ、BpuEⅠ、BsaⅠ、BseMⅡ、BseRⅠ、BsgⅠ、BsmAⅠ、BsmBⅠ、BsmFⅠ、BspCNⅠ、BspMⅠ、BspQⅠ、BtgZⅠ、EarⅠ、EciⅠ、EcoP15Ⅰ、FauⅠ、FokⅠ、HgaⅠ、HphⅠ、HpyAV、MboⅡ、MlyⅠ、MmeⅠ、MnlⅠ、NmeAⅢ、PleⅠ、SapⅠ、SfaNⅠ和TspDTⅠ，优选为AcuⅠ、BsgⅠ、EcoP15Ⅰ或MmeⅠ。

本发明所述的mRNA来源于真核生物，包括但不限于动物、植物、真菌和原生生物。

一种Oligo dT引物，该Oligo dT引物为含有连续的胸腺嘧啶脱氧核苷酸（thymidine deoxynucleotide，dT）序列的单链DNA分子，其含有用于切割的识别位点。

需要说明的是：利用用于切割的识别位点进行的切割可发生在识别位点上；也可发生在识别位点外，例如在该识别位点的3’端方向的特定位置。利用用于切割的识别位点进行的切割可发生在该Oligo dT引物上，也可发生在该Oligo dT引物扩增出的片段上。

本发明的Oligo dT引物，因为其含有用于切割的识别位点，在利用其进行cDNA文库构建的过程中，能够根据需要对基于其形成的双链cDNA分子进行各种处理，即，可根据客观条件的不同，采用多种不同的建库方案，从而达到最优设计，本发明的Oligo dT引物适用性广，能够应用于多种建库方案中；且利用该Oligo dT引物进行cDNA文库的构建，可避免样品中部分mRNA分子在构建的cDNA文库中得不到特异性的体现的现象的出现。

其中，该用于切割的识别位点包括但不限于尿嘧啶核苷酸（uridine，U）、脱氧肌苷（deoxyinosine，I）、硫代磷酸酯键（P-S）或Ⅱs型限制性内切酶识别序列，所述Ⅱs型限制性内切酶识别序列在Oligo dT引物的5’端。上述用于切割的识别位点均可在相应的物质的作用下发生特异性的切割。用于切割的识别位点与该相应的物质的对应关系包括但不限于：

U――USER酶或UDG酶；I——大肠杆菌核酸内切酶Ⅴ及其同源物或DNA糖基化酶；

P-S——含有Ag、Hg、Cu、Mn、Zn或Cd原子的切割剂；

Ⅱs型限制性内切酶识别序列——Ⅱs型限制性内切酶。

需要说明的是：上述方案中的硫代磷酸酯键是指磷酸二酯键的桥接氧原子之一被硫原子取代。硫代磷酸脂键可以是图1A所示的5’-S-硫代磷酸酯连接（3’-O-P-S-5’），也可以是图1B所示的3’-S-硫代磷酸酯连接（3’-S-P-O-5’）。

可用各种含金属的物质切割硫代磷酸酯键。所述金属可以是Ag、Hg、Cu、Mn、Zn或Cd。优选的，该物质是提供Ag⁺、Hg⁺⁺、Cu⁺⁺、Mn⁺⁺、Zn⁺或Cd⁺离子的可溶于水的盐（也可采用提供其它氧化状态的离子的盐）。特别优选含银盐如硝酸银（AgNO₃）或其它提供Ag⁺离子的盐。切割的条件包括例如50 mM AgNO₃，约22～37℃，10分钟或更长时间如30分钟。优选的，pH为4.0～10.0，更优选5.0～9.0，如约6.0～8.0，如约7.0。参见Mag, M.等，Nucleic Acids Res. , 19(7): 1437-1441, 1991。

进一步的，该Oligo dT引物序列为：

5’-（dT）_xU（dT）_y-3’；或5’-（RERS）-（dT）_z-3’；

或5’-（dT）_α（P-S）（dT）_β-3’；或5’-（dT）_γ（I）（dT）_δ-3’；

其中，上述所有方案中的Oligo dT引物的3’末端可为含通用碱基的核苷酸M，M为A或G或C。

通过该含通用碱基的核苷酸M，该Oliog dT引物在进行逆转录过程中能够准确定位在mRNA分子poly A尾的起始位点，从而消除在合成第一条cDNA链时Oligo dT引物可能与poly A尾的任意位置结合所造成的不利影响，保证了所构建的cDNA文库中各分子携带的待测标签（即来源于各mRNA分子的特异性序列）在mRNA分子中位置的确定性，有利于构建的cDNA文库在完成测序后的结果分析，进一步提高了根据构建的cDNA文库进行mRNA表达谱分析的准确性。

该Oligo dT引物的3’末端序列可用以下通式表示：

5’-M（N）_ε-3’；其中，ε为自然数，N为A或G或C或T或U或I。

其中，随着ε的增大，该Oligo dT引物在进行逆转录过程中定位在mRNA分子poly A尾的准确率提高。在综合考虑准确率和Oligo dT引物的制备成本后，ε优选为1或2。

进一步的，所述Oligo dT引物的3’末端为两个含通用碱基的核苷酸，从5’端至3’端依次为M和N，M为A或G或C，N为A或G或C或T或U或I；所述Oligo dT引物序列为：5’-（dT）_xU（dT）_yMN-3’；或5’-（RERS）-（dT）_zMN-3’；

或5’-（dT）_α（P-S）（dT）_βMN-3’；或5’-（dT）_γ（I）（dT）_δMN-3’；

更进一步的，x+y≥14，z≥15，α+β≥14，γ+δ≥14。本方案保证了Oligo dT引物与mRNA分子的poly A尾的结合强度，有利于后续逆转录反应的顺利进行。

其中，上述所有方案中的Oligo dT引物还可含有标记物，该标记物采用生物素、抗原、抗体、受体、配体、多聚组氨酸中的至少一种。通过与Oligo dT引物上的标记物适配的配合物，可进一步提高Oligo dT引物在使用过程中的易用性，提高实验效率。

图2示出了本发明的第一实施例中的cDNA文库构建方法流程，包括以下步骤：

S1.利用Oligo dT引物反转录mRNA，形成第一条cDNA链，得RNA/DNA杂合分子；

S2.对RNA/DNA杂合分子中的第一条cDNA链进行扩增，得双链cDNA；

S3.利用Ⅱs型限制性内切酶酶切双链cDNA，得含mRNA分子3’端对应序列的片段；

S4.含mRNA分子3’端对应序列的片段与第一接头分子连接，得cDNA文库。

其中，步骤S1所述的Oligo dT引物为本发明所述的任一种Oligo dT引物，即含有连续的dT序列的单链DNA分子，其含有用于切割的识别位点。

本实施例通过Oligo dT引物及相关设计，使得样品中所有的mRNA分子在构建的cDNA文库中均得到了特异性的体现，且所构建的cDNA文库中各分子携带的待测标签（即来源于各mRNA分子的特异性序列）均来源于mRNA分子的3’端。

需要说明的是：在本实施例中，步骤S1中的Oligo dT引物可包含有标记物，该标记物包括但不限于：生物素、抗原、抗体、受体、配体、多聚组氨酸；通过与Oligo dT引物上的标记物适配的配合物，可进一步提高Oligo dT引物在使用过程中的易用性，提高实验效率。例如，该标记物为生物素时，可利用与生物素特异性结合的链霉亲和素或亲和素，而实现对步骤S1中RNA/DNA产物的快速分离纯化，提高了实验效率；同样的，该标记物为抗原、抗体、受体或配体时，可利用与这些标记物适配的抗体、抗原、配体或受体，对由Oligo dT引物生成的产物完成快速的分离纯化。当然，这些标记物可能会对Oligo dT引物的延伸造成一定影响，但是通过对这些标记物在Oligo dT引物上位置的合理设计，可将这些影响降低到最低，甚至无影响；一般情况下，标记物设置在Oligo dT引物的5’端对其延伸都无明显影响。优选的，该标记物为生物素或多聚组氨酸。更优选的，该标记物位于Oligo dT引物的5’端。

其中，用于切割的识别位点包括但不限于尿嘧啶核苷酸、脱氧肌苷、硫代磷酸酯键或Ⅱs型限制性内切酶识别序列，所述Ⅱs型限制性内切酶识别序列在Oligo dT引物的5’端。

上述用于切割的识别位点均可在相应的物质的作用下发生特异性的切割。用于切割的识别位点与该相应的物质的对应关系包括但不限于：

P-S——含有Ag、Hg、Cu、Mn、Zn或Cd原子的切割剂；

Ⅱs型限制性内切酶识别序列——Ⅱs型限制性内切酶。

在上述列举的四种用于切割的识别位点中，硫代磷酸脂键的优点在于，在使用过程中，成本更低，完成切割的速度更快，操作也更为简便；但其对环境造成的污染较大，反应后的废液处理成本高，而另外三种用于切割的识别位点，均是通过特异性的酶完成的切割，不存在环境污染的问题。

进一步的，该Oligo dT引物序列为：5’-（dT）_xU（dT）_y-3’；

或5’-（RERS）-（dT）_z-3’；或5’-（dT）_α（P-S）（dT）_β-3’；

或5’-（dT）_γ（I）（dT）_δ-3’；其中，x、y、z、α、β、γ、δ均为自然数；RERS为含有Ⅱs型限制性内切酶识别序列的核苷酸序列，该核苷酸序列可为DNA或RNA，优选为DNA；P-S为硫代磷酸酯键；I为脱氧肌苷。

其中，对x+y、z、α+β、γ+δ的大小均无特殊限制。进一步的，9≤x+y≤44，9≤z≤44，9≤α+β≤45，9≤γ+δ≤44。

在步骤S1中，mRNA的来源无特殊限定。可采用各种现有技术从总RNA中分离纯化出mRNA，例如采用常规的Oligo dT引物从总RNA中捕获mRNA，该常规Oligo dT引物可固定在纤维柱上或带有生物素标记，以便于捕获的mRNA的回收纯化。

优选的，在步骤S1之前还包括步骤S1’:采用Oligo dT引物从总RNA中分离纯化mRNA。该Oligo dT引物优选为本发明所述的Oligo dT引物。

更优选的，该Oligo dT引物带有标记物，然后利用与该标记物适配的配合物对捕获的mRNA进行分离纯化；或者该Oligo dT引物被固定在介质上，从而在介质表面对总RNA中的mRNA分子进行捕获和纯化，该介质优选为纤维柱或凝胶柱。

更优选的，该标记物为生物素、抗原、抗体、受体、配体、多聚组氨酸中的至少一种。

例如，该Oligo dT引物在5’端带有标记物，该标记物为多聚组氨酸，所述步骤S1’大致如下：通过多聚组氨酸与镍离子（带有镍离子的凝胶柱）之间的结合，实现对捕获的mRNA的分离纯化。

又或者，该Oligo dT引物同时带有2种标记物，一种为在该引物5’端的多聚组氨酸，另一种为在该引物序列中部的生物素，所述步骤S1’大致如下：首先，利用带有镍离子的凝胶柱捕获Oligo dT引物，再利用Oligo dT引物捕获总RNA中的mRNA分子；然后，将Oligo dT引物和捕获的mRNA分子从凝胶柱上洗脱下来，并使它们保持结合状态；最后，再利用带有链霉亲和素的磁珠实现对mRNA分子的纯化。

在本实施例中，步骤S2可根据需要采用多种现有方法，包括但不限于自身引导法、置换合成法。自身引导法是先用氢氧化钠消化RNA/DNA杂合双链中的mRNA链，解离得到的第一条cDNA链的3’末端会自身形成一个发夹环，并引导依赖于DNA的聚合酶复制出第二链，此时形成的双链之间是连接在一起的，然后再利用S1核酸酶将连接处（仅该位点处为单链结构）切断形成平端结构的双链cDNA。置换合成法是这样实现的，RNA/DNA杂合双链中的mRNA链在RNA酶H的作用下先形成很多切口，mRNA链就被切割成喝多的小片段，这些小片段为依赖于RNA的聚合酶（如：大肠杆菌DNA聚合酶Ⅰ）提供了合成第二链DNA的引物。依赖于RNA的聚合酶以第一链cDNA为模板合成一段段互补的cDNA片段。这些cDNA片段进而在DNA连接酶的作用下连接成一条链，从而得到双链cDNA。但是自身引导法的反应较难控制，尤其是第一条cDNA链的3’末端形成发夹环这一反应很难控制，往往需要多次摸索实验条件，形成双链cDNA的失败率较高。优选的，步骤S2采用置换合成法，该方法的反应条件容易控制，成功率高。

在本实施例中，步骤S3中的Ⅱs型限制性内切酶对双链cDNA的酶切有多种实现方案，包括但不限于以下两种方式；第一，可以是由步骤S1中的Oligo dT引物将Ⅱs型限制性内切酶识别序列引入至双链cDNA中，从而使得步骤S3中可以用对应的Ⅱs型限制性内切酶直接对双链cDNA进行酶切；第二，也可以是在步骤S3中进行Ⅱs型限制性内切酶酶切步骤之前，利用Oligo dT引物上的用于切割的识别位点对双链cDNA进行切割，然后通过含有Ⅱs型限制性内切酶识别序列的接头分子与切割产物连接，从而引入Ⅱs型限制性内切酶识别序列，然后再用相应的Ⅱs型限制性内切酶对连接后的产物实现酶切。具体将在后续的实施例中进行一步详细阐述。

在本实施例中，步骤S4中的第一接头分子为至少含有一个突出末端的核酸分子，该突出末端与步骤S3中的Ⅱs型限制性内切酶酶切形成的末端相匹配。

该核酸分子可为单链核酸分子，即带茎环结构的接头（如图3所示），该单链核酸分子包括第一互补配对区1、茎环区2、第二互补配对区3和突出末端4，第一互补配对区1能够与第二互补配对区3互补配对，且它们形成的互补配对区包括至少一个限制性内切酶识别位点，该突出末端4的位置和序列与步骤S3中的Ⅱs型限制性内切酶酶切形成的末端相匹配。

例如，当步骤S3中的Ⅱs型限制性内切酶为AcuⅠ时，该第一接头分子的该突出末端位于单链核酸分子的3’末端，该突出末端含有2个含通用碱基N的核苷酸，N为A或G或C或T或U或I；当步骤S3中的Ⅱs型限制性内切酶为EcoP15Ⅰ时，该第一接头分子的该突出末端位于单链核酸分子的5’末端，该突出末端含有2个含通用碱基N的核苷酸，N为A或G或C或T或U或I；当步骤S3中的Ⅱs型限制性内切酶为MmeⅠ时，该第一接头分子的该突出末端位于单链核酸分子的3’末端，该突出末端含有2个含通用碱基N的核苷酸，N为A或G或C或T或U或I。

当第一接头分子为带茎环结构的接头时，第一接头分子与含mRNA分子3’端对应序列的片段连接生成连接产物，利用限制性内切酶切去连接产物的茎环结构（来源于带茎环结构的接头），进而形成cDNA文库。该限制性内切酶能够特异性的识别第一接头分子上的限制性内切酶识别位点。

该核酸分子还可以是双链核酸分子，该双链核酸分子至少包括一突出末端，该突出末端与步骤S3中的Ⅱs型限制性内切酶酶切形成的末端相匹配。根据该双链核酸分子的结构，可分成两类，分别是单突出末端接头、双突出末端接头。

该单突出末端接头（如图4所示）一端为平末端（图4a）或分叉结构（图4b），另一端为与步骤S3中的Ⅱs型限制性内切酶酶切形成的末端相匹配的突出末端。其中带有分叉接头的单突出末端接头能够防止接头自连。为了防止一端为平末端的单突出末端接头自连，可对平末端上的3’OH进行修饰（包括但不限于用氨基封闭羟基），或将平末端上的5’磷酸基团去除。

该双突出末端接头（如图5所示）含有两个突出末端，这两个突出末端可在一条核苷酸链上（图5a）或在不同的核苷酸链上（图5b），其中一个突出末端与步骤S3中的Ⅱs型限制性内切酶酶切形成的末端相匹配。当这两个突出末端在不同的核酸链上时，他们相互之间不互补，以防在连接时出现接头自连。

在本实施例中，步骤S4之后还可包括步骤S4’：利用与cDNA文库两端的已知序列相同或互补的引物对cDNA文库进行PCR扩增，得扩增后的cDNA文库。以满足第二代高通量测序方法中的单分子扩增步骤对测序文库的量的要求。该单分子扩增是指将测序文库中的多种文库分子，以极微量（甚至单分子）的形式在空间上隔离（但这些文库分子整体上还是属于同一个反应体系），并且在各自的空间内实现扩增，以提升各种分子在后续测序反应中的信号。

针对步骤S3，根据Oligo dT引物设计的不同，可有不同的具体实施方案。

其中，当用于切割的识别位点为尿嘧啶核苷酸、硫代磷酸酯键或脱氧肌苷时，可通过相应的切割剂切割双链cDNA，得双链切割片段，然后使双链切割片段与接头分子连接，从而引入Ⅱs型限制性内切酶识别序列，进而得到含mRNA分子3’端对应序列的片段。该切割剂用于特异性切割尿嘧啶、硫代磷酸酯键或脱氧肌苷3’端的第二个磷酸二酯键。随着Oligo dT引物长度（即x+y+1、α+β、γ+δ+1）的不同，本发明有多种实施方案。

如图6所示，在本发明的第二实施例中，步骤S3包括以下步骤：

S301.切割剂切割双链cDNA，得双链切割片段；

S302.将双链切割片段与第二接头分子连接，得第一连接产物；

S303.利用第一Ⅱs型限制性内切酶酶切第一连接产物，得含mRNA分子3’端对应序列的片段。

本实施例利用Oligo dT引物上的U或P-S或I，通过切割剂切割形成粘性末端，然后该粘性末端与相适应的第二接头分子连接，并利用第二接头分子上的第一Ⅱs型限制性内切酶识别序列，通过第一Ⅱs型限制性内切酶酶切形成含mRNA分子3’端对应序列的片段，该片段再与该片段相适应的第一接头分子连接形成cDNA文库。本实施例方案步骤简单，对步骤S1中mRNA的量的要求较低，且通过调整第二接头分子上的Ⅱs型限制性内切酶识别序列，可保证本实施例方案所构建的cDNA文库中各分子携带的待测标签长度大于等于9，使得每种cDNA分子与建库的初始材料mRNA混合物中的每一种mRNA保证理论上的一一对应。一个9碱基的序列能有4⁹=262144种不同的排列组合，因此理论上每一个9碱基的标签就能够作为代表一种mRNA分子的特征序列。当然，随着待测标签长度的增加，其与mRNA分子之间的对应关系越特异。

当x+y≤17时，本实施例方案尤其适用。

需要说明的是：步骤S302中的第二接头分子为至少含有一个突出末端的核苷酸分子，该核苷酸分子还含有双链区，该双链区含有第一Ⅱs型限制性内切酶识别序列；该突出末端由dT和/或U组成，该突出末端包含的核苷酸数a与Oligo dT引物中的U或P-S或I距离3’末端的碱基数b相关，a=b+1。例如，当U或P-S或I距离Oligo dT引物的3’末端3个碱基时，第二接头分子的突出末端包含的dT数为4；当U或P-S或I处于Oligo dT引物的3’末端时，第二接头分子的突出末端包含的dT数为1；当U或P-S或I距离Oligo dT引物的3’末端10个碱基时，第二接头分子的突出末端包含的dT数为11。

如图7所示，在本发明的第三实施例中，步骤S3包括以下步骤：

S311.切割剂切割双链cDNA，得双链切割片段；

S312.将双链切割片段与第二接头分子连接，得第一连接产物；

S313.利用第一Ⅱs型限制性内切酶酶切第一连接产物，得不含第二接头分子的酶切片段；

S314.将不含第二接头分子的酶切片段与第三接头分子连接，得第二连接产物；

S315.利用第二Ⅱs型限制性内切酶酶切第二连接产物，得含mRNA分子3’端对应序列的片段。

本实施例通过两次Ⅱs型限制性内切酶酶切，得到含mRNA分子3’端对应序列的片段。本实施例的方案与第二实施例相比，能够进一步降低对Oligo dT引物、第二接头分子的设计要求，第二接头分子中的Ⅱs型限制性内切酶识别序列的选择范围更广，Oligo dT引物序列长度可选择的范围也更广；进而放宽了步骤S1、步骤S3中对反应条件，尤其是反应温度的要求，使得相关反应能够在特异性与反应速度之间得到更好的平衡。当然，本发明还可参考本方案的设计，通过更多次的Ⅱs型限制性内切酶酶切，得到含mRNA分子3’端对应序列的片段。从而更进一步降低对Oligo dT引物、第二接头分子的设计要求。

需要说明的是：步骤S313中的第三接头分子为至少含有一个突出末端的核苷酸分子，该核苷酸分子还含有双链区，该双链区含有第二Ⅱs型限制性内切酶识别序列；该突出末端能够与第一Ⅱs型限制性内切酶酶切形成的末端匹配。

第一Ⅱs型限制性内切酶识别序列和第二Ⅱs型限制性内切酶识别序列可相同或不同。

为了保证Oligo dT引物与mRNA分子的poly A尾的结合强度，以利于后续逆转录反应的顺利进行，x+y≥14，即Oligo dT引物与mRNA分子的poly A尾相结合序列长度大于等于15；优选在15至30之间。进一步的，3≤x≤9，使得第二、第三实施例中的与Oligo dT引物设计相适应的第二接头分子结构更为合理，能够兼顾连接时的结合力、第二接头分子的成本和稳定性等因素。

其中，当用于切割的识别位点为Ⅱs型限制性内切酶酶切识别序列，其位于Oligo dT引物的5’端时，可直接利用该Ⅱs型限制性内切酶识别序列，得到mRNA分子3’端对应序列的片段。随着Oligo dT引物长度的不同，本发明有多种实施方案。

在本发明的第四实施例中，步骤S3具体如下：Ⅱs型限制性内切酶酶切双链cDNA，分离纯化出含有Oligo dT引物对应序列的酶切片段，得含mRNA分子3’端对应序列的片段。

本实施例方案与第二、第三实施例的方案相比，步骤更简单，实验效率高，且减少了各步骤之间可能存在的核酸纯化步骤，而核酸在纯化过程中存在回收效率的问题，因此，本方案能够进一步较低步骤S1中所需的mRNA量；此外，本方案通过Oligo dT引物引入Ⅱs型限制性内切酶识别序列，所有的cDNA分子上均含有Ⅱs型限制性内切酶识别序列，省去了连接试剂，例如：连接酶、接头分子等，且不存在连接效率的问题，因此，本方案构建cDNA文库的效率更高，成本更低。

需要说明的是：本发明的背景技术中的构建cDNA文库的方法所需的的起始mRNA量至少为200ng，一般以500ng至1μg为宜；经发明人验证，在本发明的第二、第三实施例中，所需的起始mRNA的量与本发明的背景技术所需的量基本一致；本发明的第四实施例中，所需的起始mRNA的量最低可降至50ng。

又因为步骤的减少，以及所需起始mRNA量的降低，本发明能够有效的提高建库的成功率，降低因为步骤繁杂和所需起始mRNA量步骤而导致建库失败的现象出现的可能性。

当z≤17时，本实施例方案尤其适用。

如图8所示，在本发明的第五实施例中，步骤S3包括以下步骤：

S321.Ⅱs型限制性内切酶酶切双链cDNA，分离纯化出无Ⅱs型限制性内切酶识别序列的酶切片段；

S322.将无Ⅱs型限制性内切酶识别序列的酶切片段与第四接头分子连接，得第三连接产物；

S323.利用第三Ⅱs型限制性内切酶酶切第三连接产物，得含mRNA分子3’端对应序列的片段。

需要说明的是：第四接头分子为至少含有一个突出末端的核苷酸分子，该核苷酸分子还含有双链区，该双链区含有第三Ⅱs型限制性内切酶识别序列；该突出末端能够与步骤S321中的Ⅱs型限制性内切酶酶切形成的末端匹配。

第三Ⅱs型限制性内切酶识别序列和步骤S321中的Ⅱs型限制性内切酶识别序列可相同或不同。

本实施例通过两次Ⅱs型限制性内切酶酶切，得到含mRNA分子3’端对应序列的片段。本实施例的方案能够进一步降低对Oligo dT引物、第四接头分子的设计要求，第四接头分子中的Ⅱs型限制性内切酶识别序列的选择范围更广，Oligo dT引物序列长度可选择的范围也更广；进而放宽了步骤S1、步骤S3中对反应条件，尤其是反应温度的要求，使得相关反应能够在特异性与反应速度之间得到更好的平衡。当然，本发明还可参考本方案的设计，通过更多次的Ⅱs型限制性内切酶酶切，得到含mRNA分子3’端对应序列的片段。从而更进一步降低对Oligo dT引物、第四接头分子的设计要求。

为了保证Oligo dT引物与mRNA分子的poly A尾的结合强度，以利于后续逆转录反应的顺利进行，z≥15，即Oligo dT引物与mRNA分子的poly A尾相结合序列长度大于等于15；优选在15至30之间，使得第四、第五实施例中的与Oligo dT引物设计相适应的第二接头分子结构更为合理，能够兼顾连接时的结合力、第二接头分子的成本和稳定性等因素。

上述所有方案中，Oligo dT引物和建库过程中所用到的接头分子均可包含有标记物，该标记物包括但不限于：生物素、抗原、抗体、受体、配体、多聚组氨酸；然后在构建cDNA文库过程中，通过标记物与相应物质的特异性结合（如：生物素与链酶亲和素、生物素与亲和素、抗原与抗体、受体与配体或多聚组氨酸与镍离子之间的特异性结合），简化实验步骤，提高建库效率，提高中间产物的回收效率、降低建库成本。

优选的，接头分子包含有标记物，该标记物为生物素或多聚组氨酸。

为了提高Oligo dT引物在逆转录过程中与mRNA分子结合位置的确定性，本发明可以通过提高步骤S1中反转录过程中的退火温度来实现，具体的优选退火温度范围可根据所使用的Oligo dT引物中与mRNA分子3’端的poly A尾互补的序列的长度，以及其它实际实验条件（如：Oligo dT引物所带有的标记类型、所使用的反转录酶等）来确定。

此外，本发明还可以通过在Oligo dT引物的3’末端设置含含通用碱基的核苷酸M来实现这一目的，M为A或G或C。该Oligo dT引物的3’末端序列可用以下通式表示：

5’-M（N）_ε-3’；其中，ε为自然数，N为A或G或C或T或U或I。

在本发明的一典型实施例中，Oligo dT引物的3’末端为两个含通用碱基的核苷酸，从5’端至3’端依次为M和N，M为A或G或C，N为A或G或C或T或U或I，其引物序列为：5’-（dT）_xU（dT）_yMN-3’；或5’-（RERS）-（dT）_zMN-3’；

本实施例通过Oligo dT引物最末端的两个含通用碱基的核苷酸，使得Oligo dT引物在逆转录过程中能够准确定位在mRNA分子poly A尾的起始位点，从而消除在合成第一条cDNA链时Oligo dT引物可能与poly A尾的任意位置结合所造成的不利影响，保证了所构建的cDNA文库中各分子携带的待测标签（即来源于各mRNA分子的特异性序列）在mRNA分子中位置的确定性，有利于构建的cDNA文库在完成测序后的结果分析，进一步提高了根据构建的cDNA文库进行mRNA表达谱分析的准确性。

下面将通过具体实施例对本发明的cDNA文库构建方法进行进一步详细说明。步骤如下。

一、带有Oligo dT引物的磁珠的制备。

1.吸取大约10 μL磁珠（invitrogen，Dynabeads MyOneTM Streptavidin C1）于0.6 mL EP管中，加入1% Triton X-100 0.6 μL（无RNA酶），混匀。用磁铁吸附磁珠，小心除去上清，注意不要吸到磁珠。用10 μL TE（10mM Tris-HCl，1mM EDTA，pH7.5）清洗2次，磁铁吸附磁珠，用移液器除去上清。

2.加入10 μL的Binding buffer悬浮磁珠，然后再加入1 μL浓度为100 μM的5’末端带有双生物素标记的Oligo dT引物，立即螺旋振荡均匀。

3.将震荡均匀后的EP管放于旋转转盘上低速转动，18至25℃孵育大约1小时，每10至15min轻弹管壁或短暂涡旋混匀磁珠，使生物素引物充分结合到磁珠上。注意：轻弹管壁混匀时不要将磁珠弹到管壁上。

4.利用磁铁吸附住磁珠，小心除去上清，然后用TE清洗磁珠3次。重新用10 μL TE悬浮磁珠，即得带有Oligo dT引物的磁珠（于4℃保存备用，至少能保存3个月）。

应当说明的是：Binding Buffer为含20mM Tris-HCl，1.0M LiCl，2mM EDTA，pH为7.5的水溶液。

步骤2中的5’末端带有双生物素标记的Oligo dT引物分为两类，一类为对照组的Oligo dT引物，其序列分别为：5’-（dT）₁₅-3’（SEQ ID NO:1）、5’-（dT）₁₉-3’ （SEQ ID NO:2）、5’-（dT）₂₅-3’（SEQ ID NO:3）、5’-（dT）₁₃-3’（SEQ ID NO:4）；另一类为实验组的Oligo dT引物，其序列分别为5’-（dT）₈U（dT）₆-3’（SEQ ID NO:5）、5’-（dT）₁₃U（dT）₃MN-3’（SEQ ID NO:6）、5’-AGAGCAGCAGC-（dT）₂₅-3’（SEQ ID NO:7）、5’-GAGCTGAAGATA-（dT）₁₁MN-3’（SEQ ID NO:8）；对应上述2类8种Oligo dT引物，得分别带有对应Oligo dT引物的磁珠。

二、从总RNA中分离mRNA。

分别提取酿酒酵母Haploid.fa（S288C）、Diploid.fa（BY4347）中的总RNA，提取方法可参照各种常规技术，例如Trizol法。

调整总RNA的浓度至0.5-1.0μg/μL，取20μL进行以下实验：

在65℃加热2分钟以破坏二级结构，然后置于冰上；同时，分别取出10μL带有Oligo dT引物的磁珠，并分别置于无RNA酶的管中；用磁铁吸附磁珠，吸附30秒后，吸走上清液；用10μL Binding Buffer洗磁珠一次，然后吸走上清液；将磁珠悬浮于10μL Binding Buffer中，加入10μl总RNA，充分混匀，并置于室温的旋转仪上退火10分钟；再用磁铁吸附磁珠，移走上清液；用20 μL Washing Buffer B洗磁珠，然后用磁铁吸附，移走上清液，重复三次，得含mRNA分子的磁珠；对应所使用的带Oligo dT引物的磁珠的不同，共有2类8种含mRNA分子的磁珠。

Washing Buffer B为10mM Tris-HCl，0.15M LiCl，1mM EDTA，pH为7.5的水溶液。

三、cDNA的合成。

1.cDNA第一链的合成。

用10 μL 1× First Strand Buffer 洗步骤二所得的含mRNA分子的磁珠，然后用磁铁吸附，移走上清液，重复四次。

在移走第四次洗脱的上清液之前，在冰上配置cDNA第一链合成反应液，反应液体系如下：5× First Strand Buffer，3.0 μL；RNase inhibitor（Takala D2310A），0.2 μL；

DEPC Water，9.05 μL；0.1 M DTT ，1.5 μL；dNTP Mix (10mM each)，0.75 μL；

Total Volume ，14.5 μL。

1× First Strand Buffer洗四次含mRNA分子的磁珠，然后用14.5 μL的第一链合成反应液悬浮含mRNA样品的磁珠，轻弹管壁或是轻轻旋涡振荡以混匀溶液（如有少量磁珠沉淀，不影响结果）。然后将管子置于37℃ 2分钟，以平衡试剂。加入0.5 μL Superscript II逆转录酶（200U/μL，Invitrogen，Cat#18064-014），轻轻混匀，42℃反应1小时，期间每10至15分钟轻弹管子或是低速旋涡振荡。在70℃加热15分钟以停止反应，然后在冰上降温2分钟。将反应产物储存于4℃。

2.cDNA第二链的合成。

将以下反应液加入15 μL cDNA第一链合成反应产物中：

DEPC Water ，43.3 μL；10× NEBuffer2，6 μL；10 mM ATP ，7.5μL；

E. coli DNA Ligase（10U/μL，NEB，Cat#M0205S），0.2 μL；

E. coli DNA Polymerase（10U/μL，NEB，Cat# M0209S），2.25 μL；

E. coli RNase H（60U/μL，Takara，Cat#D2150），0.75 μL。

其中，E.coli DNA Ligase，E.coli DNA Polymerase，E.coli RNase H最后加入。旋涡振荡混合反应液，使反应液中各成分充分混匀，然后低速离心，是反应液集中在管底。16℃反应2小时，每10到15分钟重新悬浮一下磁珠。反应期间，把Wash Buffer C放在75℃预热。反应完成后，将反应液置于冰上，加入7.5 μL 0.5 M EDTA终止反应。然后用磁铁吸附磁珠1至2分钟，小心移走上清液。加入已经预热的100 μL Wash Buffer C使E. coli DNA 聚合酶失活（此步非常重要）。混匀，将样品在75℃加热20分钟使DNA聚合酶完全失活。用磁铁吸附磁珠，去上清。用80 μL Wash Buffer C洗三次。加入100 μL LoTE悬浮磁珠。将管子中的磁珠悬浮液全部转移到一个新的离心管中，这样可以尽量避免大肠杆菌DNA聚合酶的外切酶活性。用磁铁吸附磁珠，去上清，然后用100μL LoTE洗磁珠一次，得含双链cDNA产物的磁珠。对应步骤二中所得含mRNA的磁珠的不同，共有2类8种双链cDNA产物的磁珠。

Wash Buffer C：含10mM Tris-HCl，50mM KCl，1mM EDTA，0.02% Triton X-100，pH为7.5的水溶液。

LoTE：含3.33mM Tris-HCl，0.33mM EDTA，pH为7.5的水溶液。

四、构建cDNA文库。

1.第一类双链cDNA文库的构建。

以对照组的4种Oligo dT引物所得的第一类双链cDNA产物为原材料，分别按下述步骤进行反应。

1）NlaⅢ酶切。

将含有双链cDNA产物的磁珠，用磁铁吸附，去除上清液；然后用100μL 1×NEBuffer 4洗磁珠一次，再在离心管中，按顺序加入以下试剂：

LoTE，17.2 μL；100×BSA，0.2 μL（终浓度为100μg/mL）；10×NEBuffer 4，2μL；

NlaⅢ（10U/μL，NEB，Cat#R0125S） 0.6 μL；

在37℃ 反应1小时，每10到15分钟轻弹离心管；反应完成后，用磁铁吸附磁珠，去除上清液，然后用100μL 1×T4 Ligation Buffer洗五次磁珠，得3’-cDNA。

2）连接接头分子1。

在含磁珠的离心管中加入以下试剂：接头分子1（20 μM），1 μL；LoTE，14 μL；10×T4 ligation buffer，2 μL；10×ATP（10 mM），1 μL；然后在50℃加热两分钟，在室温冷却15分钟，再加入2μL T4 DNA连接酶（400U/μL，NEB，Cat#M0202L），室温反应2小时；然后用磁铁吸附磁珠，去除上清液，再用100μL 1×NEBuffer4洗三次磁珠，得含有接头分子1的cDNA磁珠。

接头分子1：

5’-TAGCGTGTCCGACATG-3’（SEQ ID NO:9）

3’-TATCGCACAGGCT-5’（SEQ ID NO:10）。

3）MmeⅠ酶切。

用磁铁吸附离心管中的含有接头分子1的cDNA磁珠，小心去除上清液，并置于冰上，在离心管中加入以下试剂：

LoTE ，17.3 μL；10×NEBuffer 4 ，2 μL；SAM，0.3μL（终浓度50μM）；将离心管在65℃预热2分钟，加入0.4μL MmeⅠ（2U/μL，NEB，Cat#R0637S）轻弹混匀。在65℃反应1小时，并不时混匀；反应后，用磁铁吸附磁珠1~2分钟。不要丢弃上清液！小心把上清液移置一个新的离心管中。用LoTE将液体体积补至150μL。提取含有接头分子1的酶切产物，并将含有接头分子1的酶切产物溶解于14μL LoTE中。

4）连接接头分子2。

在离心管中混合以下试剂：

接头分子2（20μM），1μL；步骤3）所得含有接头分子1的酶切产物，14μL；10×T4 ligation buffer，2μL；10×ATP（10 mM），1μL；在50℃加热2分钟，室温冷15分钟；加入2μL T4 DNA 连接酶后室温反应2小时，得cDNA文库。

接头分子2：

5’-CGCCTCCCTGCAGTCCAG-3’（SEQ ID NO:11）

3’-NNGCGGAGGGACGTCAGGTC-5’（SEQ ID NO:12）。

2.第二类双链cDNA文库的构建。

1）5’-（dT）₈U（dT）₆-3’（SEQ ID NO:5）。

以Oligo dT引物：SEQ ID NO:5制备所得的双链cDNA为原材料，按下述步骤进行反应。

A.USER酶酶切。

将含有双链cDNA产物的磁珠，用磁铁吸附，去除上清液；然后用100μL LoTE悬浮磁珠，再在离心管中，按顺序加入以下试剂：USER酶（1U/μL，NEB，Cat#M5505S），10μL；10×USER Buffer ，20μL；ddH₂O up to 200μL。

37℃孵育1h，反应完成后用磁铁吸附磁珠，将上清转移至新的600 μL EP管中，然后用纯化试剂盒提纯回收双链USER酶酶切产物。

B.连接接头分子3。

连接反应体系如下：

双链USER酶酶切产物，2μg；接头分子3（10μM），1μL；T4 DNA连接酶，2μL；

10×T4连接酶缓冲液，2μL；加ddH₂O至100μL。

接头分子3：

5’-CTTCAGCTATGCCGAT-3’（SEQ ID NO:13）

3’-TTTTTTTGAAGTCGATACGGCTAAA-5’（SEQ ID NO:14），其中SEQ IN NO:14链上的5’末端含有生物素标记。

连接条件，14℃孵育2h。反应完成后，加入10μL带链霉亲和素标记的磁珠（invitrogen，Dynabeads MyOneTM Streptavidin C1）吸附连接产物，18至25℃孵育大约1小时，每10至15min轻弹管壁或短暂涡旋混匀磁珠，使带生物素的连接产物充分结合到磁珠上。反应完成后，用磁铁吸附磁珠，移除上清液；用100 μL 1×NEBuffer 4冲洗磁珠，然后再用磁体吸附磁珠，重复3次，移除上清，得连接产物。

C.AcuⅠ酶切。

将上述步骤B所得的连接产物在加入至下述反应体系中进行酶切：

10×NEBuffer 4，8μL；AcuⅠ（5U/μL，NEB，Cat# R0641S），2μL；

SAM（3.2mM），1.25μL（终浓度50μM）；ddH₂O up to 80 μL。

酶切条件：37℃孵育1h。反应完成后，用磁铁吸附磁珠，将上清液转移至新的200μL EP管中，回收得双链AcuⅠ酶切产物。

D.连接接头分子4。

连接反应体现如下：

双链AcuⅠ酶切产物，1μg；接头分子4（10μM），1μL；T4DNA连接酶，1μL；

10×T4连接酶缓冲液，2μL；加ddH₂O至100μL。

接头分子4：

5’-GGGCTTCTGAAGCG-3’（SEQ ID NO:15）

3’-TAGCCCGAAGACTTCGCNN-5’（SEQ ID NO:16），其中SEQ ID NO:16链上含有生物素标记。

E.AcuⅠ酶切。

将上述步骤D所得的连接产物加入至下述反应体系中进行酶切：

10×NEBuffer 4，8μL；AcuⅠ（5U/μL，NEB，Cat# R0641S），2μL；

SAM（3.2mM），1.25μL（终浓度50μM）；ddH₂O up to 80 μL。

酶切条件：37℃孵育1h。反应完成后，用磁铁吸附磁珠，去除上清液；然后用100 μL 1×T4连接酶缓冲液冲洗磁珠，然后再用磁体吸附磁珠，重复3次，移除上清，得AcuⅠ酶切产物。

F.连接接头分子5。

将步骤E所得AcuⅠ酶切产物加入下述反应体系中进行连接反应，连接体系如下：

接头分子5（10μM），1μL；10 T4DNA连接酶，2μL；10×T4连接酶缓冲液，2μL；

加ddH₂O至100μL。

连接条件，14℃孵育2h。反应完成后，用磁铁吸附磁珠，移除上清液；用100μL TE缓冲液冲洗磁珠，然后用磁铁吸附磁珠，移除上清液，重复三次，得cDNA文库。

接头分子5：

5’-TGACGCGCACGCGCTCG-3’（SEQ ID NO:17）

3’-NNACTGCGCATGCGCGAGC-5’（SEQ ID NO:18）。其中，SEQ ID NO:17的3’末端G为双脱氧碱基。

2）5’-（dT）₁₃U（dT）₃MN-3’（SEQ ID NO:6）。

以Oligo dT引物：SEQ ID NO:6制备所得的双链cDNA为原材料，参照上述1）里的步骤进行反应，只需根据SEQ ID NO:6对接头分子3进行相应的调整，得cDNA文库。

3）5’-AGAGCAGCAGC-（dT）₂₅-3’（SEQ ID NO:7）。

以Oligo dT引物：SEQ ID NO:7制备所得的双链cDNA为原材料，按下述步骤进行反应。

A.EcoP15Ⅰ酶切双链cDNA。

利用EcoP15Ⅰ（10U/μl，NEB Cat#R0646S）酶切步骤三所得的双链cDNA产物，反应液体系如下：100mM NaCl，50mM Tris-HCl，10mM MgCl2，1mM dithiothreitol，100μg/mL BSA，1mM ATP，pH7.9。37℃ 孵育1h。反应完后，用磁铁吸附磁珠，将上清转移至200 μL PCR管中，65℃孵育20分钟，灭活EcoP15Ⅰ，得EcoP15Ⅰ酶切产物。

B.连接接头分子6。

连接体系如下：

EcoP15Ⅰ酶切产物，2μg；接头分子6（10μM），1μL；T4DNA连接酶，1μL；

10×T4连接酶缓冲液，2μL；加ddH₂O至100μL。

接头分子6：

5’-ATCGTAGTGCCTGAAG-3’（SEQ ID NO:19）

3’-TAGCATCACGGACTTCNN-5’（SEQ ID NO:20），其中，SEQ ID NO:20的3’末端被羟基化，SEQ ID NO:19的5’末端含有生物素标记。

C.AcuⅠ酶切。

10×NEBuffer 4，8μL；AcuⅠ（5U/μL，NEB，Cat# R0641S），2μL；

SAM（3.2mM），1.25μL（终浓度50μM）；ddH₂O up to 80 μL。

酶切条件：37℃ 孵育1h。反应完成后，用磁铁吸附磁珠，移除上清液；然后用80 μL 1×T4连接酶缓冲液冲洗磁珠，然后用磁铁吸附磁珠，移除上清液，重复三次，得AcuⅠ酶切产物。

D.连接接头分子7。

接头分子7（10μM），1μL；10 T4DNA连接酶，2μL；

10×T4连接酶缓冲液，2μL；加ddH₂O至100μL。

接头分子7：

5’-CCTCCCTGCAGTCCTCTATGGGCT-3’（SEQ ID NO:21）

3’-NNGGAGGGACGTCAGGAGATACCCGA-5’（SEQ ID NO:22）。其中，SEQ ID NO:22的5’末端的A不带磷酸基团。

E.cDNA文库的扩增。

利用引物F（SEQ ID NO:67）和引物R（SEQ ID NO:68）对步骤4所得cDNA文库进行PCR扩增，反应体系如下：

cDNA文库，100μL；引物F（10μM），100μL；引物R（10μM），100μL；

10×Ex Taq Buffer，100μL；Ex Taq（5U/μL），8μL；dNTP（各2.5mM），80μL；

ddH₂O up to 1000μL。

PCR反应条件如下：

95℃ 3min；

94℃ 20s，58℃ 20s，72℃ 20s；重复15个循环；

72℃ 7min。

利用PCR清洁试剂盒，扩增产物进行清洁，除去未扩增的引物和dNTP，回收扩增后的产物，得扩增后的cDNA文库。

4）5’-GAGCTGAAGATA-（dT）₁₁MN-3’（SEQ ID NO:8）。

以Oligo dT引物：SEQ ID NO:8制备所得的双链cDNA为原材料，参照上述3）中步骤进行反应，并根据SEQ ID NO:8对接头分子6进行相应的调整，得cDNA文库。

五、cDNA文库的测序。

利用第二代高通量技术对步骤四所得的cDNA文库进行测序，测定的技术包括但不限于：基于聚合酶的合成测序法、基于连接酶的连接测序法。

基于聚合酶的合成测序法是基于带可去除标记的核苷酸进行的。在每次合成反应中，每个模板链至多只能延伸一次，基于聚合酶的合成测序法的大致流程如下。

a.测序引物通过互补配对结合在单分子扩增产物共有的已知序列上（该单分子扩增产物固定在引物-固相载体复合物上），在DNA聚合酶的作用下，以带可去除标记的核苷酸进行单碱基延伸合成反应，收集该次加入核苷酸的标记信号，即可得到与测序引物3’最末端碱基互补的单分子扩增产物（固定在引物-固相载体复合物上）的下一位的碱基序列信息。

b.切除可去除标记，然后在DNA聚合酶的作用下，以带可去除标记的核苷酸继续进行单碱基延伸合成反应，收集加入核苷酸的标记信号，即可得到与测序引物3’末端碱基互补的单分子扩增产物的下两位的碱基序列信息。

重复b步骤，直至不能继续进行合成反应为止，从而获得单分子扩增产物的全部序列信息。

基于连接酶的连接测序法是基于带荧光标记的寡核苷酸探针进行的。其中一种连接酶的连接测序法是基于在特定位置带有荧光标记的寡核苷酸探针进行的，该寡核苷酸探针带有n个碱基，从其5’端数起的第a位带有荧光标记，其中不同的碱基对应特定的荧光标记，因为该寡核苷酸探针的3’端进行了特定的修饰，寡核苷酸探针之间不能直接相互连接，每次连接反应，每个单分子扩增产物只能连接一个寡核苷酸探针。该连接测序法的大致流程如下。

A.测序引物通过互补配对结合在单分子扩增产物共有的已知序列上（该单分子扩增产物固定在引物-固相载体复合物上）上，利用上述的寡核苷酸探针，在连接酶的作用下，将核酸探针与上述寡核苷酸链连接，然后采集荧光信号，即可得到与单分子扩增产物共有的已知序列的3’末端后第a位碱基序列信息。

B.切除寡核苷酸上的荧光标记，在连接酶的作用下，以上述的寡核苷酸探针为原料，继续进行连接反应，然后采集荧光信号，从而得到单分子扩增产物共有的已知序列的3’末端后第2a位的碱基序列信息。

重复B步骤，直至不能继续进行连接反应为止，从而获得单分子扩增产物共有的已知序列的3’末端后第a、2a、3a、4a……位的碱基序列信息。

然后将测序引物及其所连接的寡核苷酸探针从单分子扩增产物上变性洗脱下来，换用与之前的测序引物相比3’末端少一个碱基的引物重复上述反应，从而获得单分子扩增产物共有的已知序列的3’末端后第a-1、2a-1、3a-1、4a-1……位的碱基序列信息。重复此步骤，最后获得单分子扩增产物共有的已知序列的3’末端后第a-（a-1）、2a-(a-1)、3a-(a-1)、4a-(a-1)……位的碱基序列信息，从而获得单链扩增产物的全部序列信息。

另一种连接酶的连接测序法同样也是基于带有荧光标记的寡核苷酸探针进行的，该寡核苷酸探针带有n个碱基，分为h（h≤n）组，同一组寡核苷酸探针的不同荧光标记对应同一特定位置的不同碱基序列，不同组之间的区别在于：不同荧光标记对应的特定位置不同，因为该寡核苷酸探针的3’端进行了特定的修饰，寡核苷酸探针之间不能直接相互连接，每次连接反应，每个单分子扩增产物只能连接一个寡核苷酸探针。该连接测序法的大致流程如下。

a.测序引物通过互补配对结合在单分子扩增产物共有的已知序列上（该单分子扩增产物固定在引物-固相载体复合物上）上，利用上述寡核苷酸探针中的一组（荧光标记对应的碱基位置为x，x≤h），在连接酶的作用下，将核酸探针与上述寡核苷酸链连接，然后采集荧光信号，即可得到与单链扩增产物共有的已知序列的3’末端后第x位碱基序列信息，将测序引物及其所连接的寡核苷酸探针从单分子扩增产物上变性洗脱下来。

b.然后重新将测序引物结合在单分子扩增产物上，换用与a步骤不同的寡核苷酸探针组（荧光标记对应的碱基位置为y，y≤h），在连接酶的作用下，将核酸探针与上述寡核苷酸链连接，然后采集荧光信号，即可得到与单链扩增产物共有的已知序列的3’末端后第y位碱基序列信息，将测序引物及其所连接的寡核苷酸探针从单分子扩增产物上变性洗脱下来。

c.重复步骤b，直至h组寡核苷酸探针均分别进行过一次连接反应，从而获得单分子扩增产物共有的已知序列的3’末端后第1、2……、h位的碱基序列信息。

换用与之前的测序引物相比3’末端多一个或各通用碱基的引物按上述原理进行反应，能够延长获得的单分子扩增产物共有的已知序列的3’末端碱基序列的读长。

这种基于连接酶的连接测序法的原理和具体实施方案可参考CN200710170507.1。优选采用深圳华因康基因科技有限公司开发的PStarⅡ高通量测序仪进行高通量测序，并对序列进行分析，进而得到测序结果。

六、实验结果。

1.对照组实验结果。

经相关文献查找，发现酿酒酵母Haploid.fa（S288C）、Diploid.fa（BY4347）的相关基因共有5720个。图9为对照组检测结果，图10为实验组检测结果。

图9、图10中的数据均是通过与参考基因的比对而得到的。

检测出的基因是指经高通量测序检测得到的基因。

活跃基因是指对应某样品的cDNA文库，在一次高通量测序过程中被检测出的次数超过300次的基因。

差异基因是指在Oligo dT引物、cDNA文库构建方法相同的情况下，某个基因在上述某一种酿酒酵母中的表达较另一种明显高的基因（其筛选原理见下）。

筛选原理：采用显著假设检验，原假设：gene A 在S288C和BY4347中表达没有显著差异，备择假设：geneA在S288C和BY4347中表达存在显著差异；相对整套的参考基因的表达，gene A的表达可以近似认为服从泊松分布，在此基础上进行公式推导得出如下Pvalue公式：

。

该公式用于计算gene A在S288C和BY4347中表达量的相似程度；参数说明：N1：唯一比对到S288C样本上的reads数；N2：唯一比对到BY4347样本上的reads数；x：在S288C中，唯一比对到gene A上的reads数；y:在BY4347中，唯一比对到gene A上的reads数。

计算出来的Pvalue再经过FDR（False discovery ratio）校正和差异表达倍数（log₂（Ratio））的筛选，才得到显著差异表达基因，校正和筛选公式分别如下：

；；

筛选条件如下：；

只有满足上述筛选条件的基因才能被认为是差异基因。

由图9、图10可知，随着与mRNA分子3’端的poly A尾互补区域长度的增加，检测出的基因数也增加；在与mRNA分子3’端的poly A尾互补区域长度相同的情况下，实验组检测出的基因数均较对照组高，说明基于本发明的Ologo dT引物制备的cDNA文库能够更加全面的反应样品中mRNA的种类，不会因为建库过程中的锚定酶导致样品中的部分mRNA分子无法在所得的cDNA文库中得到体现。

应当说明的是：上述实施例中，只要是涉及RNA的步骤，该步骤使用的试剂和材料均要求无RNA酶，即经过RNA酶灭活处理。

本实施例仅是本发明的一个具体实施例，对本发明无任何限定作用。本实施例中的Oligo dT引物可根据需要进行选择，包括但不限于：SEQ ID NO:23至SEQ ID NO:66中的任意一种。当用于切割的识别位点为I或P-S时，基于该Oligo dT引物进行cDNA文库的构建方法可参考上述实施例进行，尤其是基于上述用于切割的识别位点为U的Oligo dT引物进行的cDNA文库的构建。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

SEQUENCE LISTING

<110> 盛司潼

<120> 一种Oligo dT引物及构建cDNA文库的方法

<160> 68

<170> PatentIn version 3.3

<210> 1

<211> 15

<212> DNA

<213> 人工序列

<400> 1

tttttttttt ttttt 15

<210> 2

<211> 19

<212> DNA

<213> 人工序列

<400> 2

tttttttttt ttttttttt 19

<210> 3

<211> 25

<212> DNA

<213> 人工序列

<400> 3

tttttttttt tttttttttt ttttt 25

<210> 4

<211> 13

<212> DNA

<213> 人工序列

<400> 4

tttttttttt ttt 13

<210> 5

<211> 15

<212> DNA

<213> 人工序列

<400> 5

ttttttttut ttttt 15

<210> 6

<211> 21

<212> DNA

<213> 人工序列

<220>

<221> misc_feature

<222> (20)..(21)

<223> m is a, c or g, n is a, c, g, t, u or i

<400> 6

tttttttttt tttttutttm n 21

<210> 7

<211> 38

<212> DNA

<213> 人工序列

<220>

<221> misc_feature

<222> (37)..(38)

<223> m is a, c or g, n is a, c, g, t, u or i

<400> 7

agagcagcag cttttttttt tttttttttt ttttttmn 38

<210> 8

<211> 27

<212> DNA

<213> 人工序列

<220>

<221> misc_feature

<222> (26)..(27)

<223> m is a, c or g, n is a, c, g, t, u or i

<400> 8

gagctgaaga tatttttttt tttttmn 27

<210> 9

<211> 16

<212> DNA

<213> 人工序列

<400> 9

tagcgtgtcc gacatg 16

<210> 10

<211> 13

<212> DNA

<213> 人工序列

<400> 10

tcggacacgc tat 13

<210> 11

<211> 18

<212> DNA

<213> 人工序列

<400> 11

cgcctccctg cagtccag 18

<210> 12

<211> 20

<212> DNA

<213> 人工序列

<220>

<221> misc_feature

<222> (19)..(20)

<223> n is a, c, g, t, u or i

<400> 12

ctggactgca gggaggcgnn 20

<210> 13

<211> 16

<212> DNA

<213> 人工序列

<400> 13

cttcagctat gccgat 16

<210> 14

<211> 25

<212> DNA

<213> 人工序列

<400> 14

aaatcggcat agctgaagtt ttttt 25

<210> 15

<211> 14

<212> DNA

<213> 人工序列

<400> 15

gggcttctga agcg 14

<210> 16

<211> 19

<212> DNA

<213> 人工序列

<220>

<221> misc_feature

<222> (1)..(2)

<223> n is a, c, g, t, u or i

<400> 16

nncgcttcag aagcccgat 19

<210> 17

<211> 17

<212> DNA

<213> 人工序列

<400> 17

tgacgcgcac gcgctcg 17

<210> 18

<211> 19

<212> DNA

<213> 人工序列

<220>

<221> misc_feature

<222> (18)..(19)

<223> n is a, c, g, t, u or i

<400> 18

cgagcgcgta cgcgtcann 19

<210> 19

<211> 16

<212> DNA

<213> 人工序列

<400> 19

atcgtagtgc ctgaag 16

<210> 20

<211> 18

<212> DNA

<213> 人工序列

<220>

<221> misc_feature

<222> (1)..(2)

<223> n is a, c, g, t, u or i

<400> 20

nncttcaggc actacgat 18

<210> 21

<211> 24

<212> DNA

<213> 人工序列

<400> 21

cctccctgca gtcctctatg ggct 24

<210> 22

<211> 26

<212> DNA

<213> 人工序列

<220>

<221> misc_feature

<222> (25)..(26)

<223> n is a, c, g, t, u or i

<400> 22

agcccataga ggactgcagg gaggnn 26

<210> 23

<211> 12

<212> DNA

<213> 人工序列

<400> 23

ttttttttut tt 12

<210> 24

<211> 14

<212> DNA

<213> 人工序列

<400> 24

tttttttttu tttt 14

<210> 25

<211> 17

<212> DNA

<213> 人工序列

<400> 25

tttttttutt ttttttt 17

<210> 26

<211> 16

<212> DNA

<213> 人工序列

<400> 26

tttttttttt tttttu 16

<210> 27

<211> 26

<212> DNA

<213> 人工序列

<400> 27

tttttttttt tttttttttt uttttt 26

<210> 28

<211> 19

<212> DNA

<213> 人工序列

<400> 28

tttttttttt ttttutttt 19

<210> 29

<211> 45

<212> DNA

<213> 人工序列

<400> 29

tttttttttt tttttttttt tttttttttt tttttutttt ttttt 45

<210> 30

<211> 39

<212> DNA

<213> 人工序列

<400> 30

tttttttttt tttttttttt tttttttttt utttttttt 39

<210> 31

<211> 22

<212> DNA

<213> 人工序列

<400> 31

tttttttttt ttttttttut tt 22

<210> 32

<211> 14

<212> DNA

<213> 人工序列

<220>

<221> misc_feature

<222> (13)..(14)

<223> m is a, c or g, n is a, c, g, t, u or i

<400> 32

ttttttttut ttmn 14

<210> 33

<211> 23

<212> DNA

<213> 人工序列

<220>

<221> misc_feature

<222> (22)..(23)

<223> m is a, c or g, n is a, c, g, t, u or i

<400> 33

tttttttttt ttttttttut tmn 23

<210> 34

<211> 18

<212> DNA

<213> 人工序列

<220>

<221> misc_feature

<222> (17)..(18)

<223> m is a, c or g, n is a, c, g, t, u or i

<400> 34

tttttttttt tttttumn 18

<210> 35

<211> 26

<212> DNA

<213> 人工序列

<220>

<221> misc_feature

<222> (25)..(26)

<223> m is a, c or g, n is a, c, g, t, u or i

<400> 35

tttttttttt tttttttttt utttmn 26

<210> 36

<211> 16

<212> DNA

<213> 人工序列

<220>

<221> misc_feature

<222> (15)..(16)

<223> m is a, c or g, n is a, c, g, t, u or i

<400> 36

tttttttttt tuttmn 16

<210> 37

<211> 39

<212> DNA

<213> 人工序列

<220>

<221> misc_feature

<222> (38)..(39)

<223> m is a, c or g, n is a, c, g, t, u or i

<400> 37

tttttttttt tttttttttt tttttttttt uttttttmn 39

<210> 38

<211> 27

<212> DNA

<213> 人工序列

<220>

<221> misc_feature

<222> (26)..(27)

<223> m is a, c or g, n is a, c, g, t, u or i

<400> 38

tttttttttt ttttttttut tttttmn 27

<210> 39

<211> 22

<212> DNA

<213> 人工序列

<400> 39

agcctgaagc tatttttttt tt 22

<210> 40

<211> 26

<212> DNA

<213> 人工序列

<400> 40

gagctgaaga tatttttttt tttttt 26

<210> 41

<211> 35

<212> DNA

<213> 人工序列

<400> 41

tccaatccct gaagcttttt tttttttttt ttttt 35

<210> 42

<211> 38

<212> DNA

<213> 人工序列

<400> 42

gagactgaag tttttttttt tttttttttt tttttttt 38

<210> 43

<211> 54

<212> DNA

<213> 人工序列

<400> 43

cactccgaca tttttttttt tttttttttt tttttttttt tttttttttt tttt 54

<210> 44

<211> 39

<212> DNA

<213> 人工序列

<400> 44

gggcactccg acgatttttt tttttttttt ttttttttt 39

<210> 45

<211> 48

<212> DNA

<213> 人工序列

<400> 45

gccttgtccg acgaagcctt tttttttttt tttttttttt tttttttt 48

<210> 46

<211> 27

<212> DNA

<213> 人工序列

<400> 46

cgcggtccga catttttttt ttttttt 27

<210> 47

<211> 27

<212> DNA

<213> 人工序列

<400> 47

ctctcgtccg actttttttt ttttttt 27

<210> 48

<211> 38

<212> DNA

<213> 人工序列

<400> 48

taatatccga cggccttttt tttttttttt tttttttt 38

<210> 49

<211> 22

<212> DNA

<213> 人工序列

<400> 49

ggcagcagcc tttttttttt tt 22

<210> 50

<211> 40

<212> DNA

<213> 人工序列

<400> 50

aacccagcag tttttttttt tttttttttt tttttttttt 40

<210> 51

<211> 54

<212> DNA

<213> 人工序列

<400> 51

cgcctcccag cagttttttt tttttttttt tttttttttt tttttttttt tttt 54

<210> 52

<211> 35

<212> DNA

<213> 人工序列

<400> 52

gcagcgcagc agacattttt tttttttttt ttttt 35

<210> 53

<211> 27

<212> DNA

<213> 人工序列

<220>

<221> misc_feature

<222> (26)..(27)

<223> m is a, c or g, n is a, c, g, t, u or i

<400> 53

agcctgaagc tatttttttt tttttmn 27

<210> 54

<211> 29

<212> DNA

<213> 人工序列

<220>

<221> misc_feature

<222> (28)..(29)

<223> m is a, c or g, n is a, c, g, t, u or i

<400> 54

gagctgaaga tatttttttt tttttttmn 29

<210> 55

<211> 32

<212> DNA

<213> 人工序列

<400> 55

tccaatccct gaagcttttt tttttttttt tt 32

<210> 56

<211> 42

<212> DNA

<213> 人工序列

<220>

<221> misc_feature

<222> (41)..(42)

<223> m is a, c or g, n is a, c, g, t, u or i

<400> 56

gagactgaag tttttttttt tttttttttt tttttttttt mn 42

<210> 57

<211> 56

<212> DNA

<213> 人工序列

<220>

<221> misc_feature

<222> (55)..(56)

<223> m is a, c or g, n is a, c, g, t, u or i

<400> 57

cactccgaca tttttttttt tttttttttt tttttttttt tttttttttt ttttmn 56

<210> 58

<211> 38

<212> DNA

<213> 人工序列

<220>

<221> misc_feature

<222> (37)..(38)

<223> m is a, c or g, n is a, c, g, t, u or i

<400> 58

gggcactccg acgatttttt tttttttttt ttttttmn 38

<210> 59

<211> 53

<212> DNA

<213> 人工序列

<220>

<221> misc_feature

<222> (52)..(53)

<223> m is a, c or g, n is a, c, g, t, u or i

<400> 59

gccttgtccg acgaagcctt tttttttttt tttttttttt tttttttttt tmn 53

<210> 60

<211> 29

<212> DNA

<213> 人工序列

<220>

<221> misc_feature

<222> (28)..(29)

<223> m is a, c or g, n is a, c, g, t, u or i

<400> 60

cgcggtccga catttttttt tttttttmn 29

<210> 61

<211> 32

<212> DNA

<213> 人工序列

<220>

<221> misc_feature

<222> (31)..(32)

<223> m is a, c or g, n is a, c, g, t, u or i

<400> 61

ctctcgtccg actttttttt tttttttttt mn 32

<210> 62

<211> 44

<212> DNA

<213> 人工序列

<220>

<221> misc_feature

<222> (43)..(44)

<223> m is a, c or g, n is a, c, g, t, u or i

<400> 62

taatatccga cggccttttt tttttttttt tttttttttt ttmn 44

<210> 63

<211> 24

<212> DNA

<213> 人工序列

<220>

<221> misc_feature

<222> (23)..(24)

<223> m is a, c or g, n is a, c, g, t, u or i

<400> 63

ggcagcagcc tttttttttt ttmn 24

<210> 64

<211> 41

<212> DNA

<213> 人工序列

<220>

<221> misc_feature

<222> (40)..(41)

<223> m is a, c or g, n is a, c, g, t, u or i

<400> 64

aacccagcag tttttttttt tttttttttt tttttttttm n 41

<210> 65

<211> 51

<212> DNA

<213> 人工序列

<220>

<221> misc_feature

<222> (50)..(51)

<223> m is a, c or g, n is a, c, g, t, u or i

<400> 65

cgcctcccag cagttttttt tttttttttt tttttttttt tttttttttm n 51

<210> 66

<211> 37

<212> DNA

<213> 人工序列

<220>

<221> misc_feature

<222> (36)..(37)

<223> m is a, c or g, n is a, c, g, t, u or i

<400> 66

gcagcgcagc agacattttt tttttttttt tttttmn 37

<210> 67

<211> 20

<212> DNA

<213> 人工序列

<400> 67

atcgatcgta gtgcctgaag 20

<210> 68

<211> 20

<212> DNA

<213> 人工序列

<400> 68

agcccataga ggactgcagg 20

Claims

1.一种Oligo dT引物，其特征在于，所述Oligo dT引物为含有连续的dT序列的单链DNA分子，其含有用于切割的识别位点；所述用于切割的识别位点为尿嘧啶核苷酸、脱氧肌苷或硫代磷酸酯键。

2.根据权利要求1所述的Oligo dT引物，其特征在于，所述Oligo dT引物序列为：

或5’-（dT）_γ（I）（dT）_δ-3’；其中，x、y、α、β、γ、δ均为自然数，P-S为硫代磷酸酯键，I为脱氧肌苷。

3.根据权利要求1所述的Oligo dT引物，其特征在于，所述Oligo dT引物的3’末端为含通用碱基的核苷酸M，M为A或G或C。

4.根据权利要求3所述的Oligo dT引物，其特征在于，所述Oligo dT引物的3’末端为两个含通用碱基的核苷酸，从5’端至3’端依次为M和N，N为A或G或C或T或U或I；所述Oligo dT引物序列为：

5’-（dT）_xU（dT）_yMN-3’；或5’-（dT）_α（P-S）（dT）_βMN-3’；

或5’-（dT）_γ（I）（dT）_δMN-3’；其中，x、y、α、β、γ、δ均为自然数，I为脱氧肌苷。

5.根据权利要求1至4中任一项所述的Oligo dT引物，其特征在于，所述Oligo dT引物含有标记物，所述标记物采用生物素、抗原、抗体、受体、配体、多聚组氨酸中的至少一种。

6.一种cDNA文库构建方法，其特征在于，包括以下步骤：

A.利用Oligo dT引物反转录mRNA，形成第一条cDNA链，得RNA/DNA杂合分子；该Oligo dT引物为含有连续的dT序列的单链DNA分子，其含有用于切割的识别位点；所述用于切割的识别位点为尿嘧啶核苷酸、脱氧肌苷或硫代磷酸酯键；

B.对RNA/DNA杂合分子中的第一条cDNA链进行扩增，得双链cDNA；

7.根据权利要求6所述的cDNA文库构建方法，其特征在于，所述步骤C包括以下步骤：

C01.切割剂切割双链cDNA，得双链切割片段；

C02.将双链切割片段与第二接头分子连接，得第一连接产物；

8.根据权利要求7所述的cDNA文库构建方法，其特征在于，所述Oligo dT引物序列为：

9.根据权利要求6所述的cDNA文库构建方法，其特征在于，所述步骤C包括以下步骤：

C11.切割剂切割双链cDNA，得双链切割片段；

C12.将双链切割片段与第二接头分子连接，得第一连接产物；

10.根据权利要求9所述的cDNA文库构建方法，其特征在于，所述Oligo dT引物序列为：

或5’-（dT）_γ（I）（dT）_δ-3’；其中，x、y、α、β、γ、δ均为自然数，x+y≥14，3≤x≤9，α+β≥14，3≤α≤9，γ+δ≥14，3≤γ≤9。

11.根据权利要求6所述的cDNA文库构建方法，其特征在于，在步骤A之前还包括步骤A’：利用Oligo dT引物从总RNA中分离纯化mRNA。

12.根据权利要求6、7、9或11所述的cDNA文库构建方法，其特征在于，所述Oligo dT引物的3’末端为含通用碱基的核苷酸M，M为A或G或C。

13.根据权利要求12所述的cDNA文库构建方法，其特征在于，所述Oligo dT引物的3’末端为两个含通用碱基的核苷酸，从5’端至3’端依次为M和N，N为A或G或C或T或U或I；所述Oligo dT引物序列为：

14.根据权利要求6至11、13中任一项所述的cDNA文库构建方法，其特征在于，所述Oligo dT引物在5’端含有标记物，该标记物采用生物素、抗原、抗体、受体、配体、多聚组氨酸中的至少一种；和/或所述接头分子含有标记物，该标记物采用生物素、抗原、抗体、受体、配体、多聚组氨酸中的至少一种。