CN106414737A

CN106414737A - 维持拷贝数的rna分析方法

Info

Publication number: CN106414737A
Application number: CN201580015324.5A
Authority: CN
Inventors: P·默尔
Original assignee: Lexogen GmbH
Current assignee: Lexogen GmbH
Priority date: 2014-03-21
Filing date: 2015-03-20
Publication date: 2017-02-15
Also published as: CA2939056A1; US20180171384A1; EP3119886A1; AU2015233383B2; AU2015233383A1; EP3119886B1; NO3119886T3; EP2921556A1; ES2645423T3; DK3119886T3; KR102398479B1; PL3119886T3; US10597699B2; WO2015140307A1; KR20160138168A; JP2017507663A; LT3119886T; JP6608384B2

Abstract

本发明提供由产生模板RNA分子的扩增的核酸部分的方法，包含在获得模板RNA后，使第一寡核苷酸引物在模板RNA的预先选定的3'末端核酸区域退火，以模板特异性方式延伸第一寡核苷酸引物，由此获得第一延伸链，去除RNA模板，使一或多个另外的寡核苷酸引物与所述第一延伸链退火，以模板特异性方式延伸所述一或多个另外的寡核苷酸引物而不链置换与所述第一延伸链退火的多核苷酸，或使用破坏被置换的链的聚合酶，由此产生另外的延伸产物，分离和/或扩增所述另外的延伸产物的延伸产物，其包含与所述第一寡核苷酸引物互补的延伸的核酸部分；本发明还提供进行该方法的试剂盒。

Description

维持拷贝数的RNA分析方法

技术领域

本发明涉及RNA分析学方法，特别是转录子数量和类型估算测定。

背景技术

基因表达是来自基因的信息用于功能性基因产物合成的过程。这些产物是功能性RNA，其中很重要的一类由蛋白编码信使RNA，mRNA组成，在该过程中其翻译成各种蛋白，如酶、转运分子等。对mRNA内容及其在细胞和组织中的加工阶段的了解对于理解细胞起源、疾病发生、有机体的药物响应以及其他生物学过程至关重要。

细胞生物学过程受到各种内部和外部因素影响。其中完整RNA特别是mRNA库(转录组)起到重要作用。典型的哺乳动物细胞含有10-30pg总RNA，相当于平均3.6×10⁵个mRNA分子。目前的人类基因组数据库包含20769个编码基因注解，48461个Genescan基因预测。虽然基因注解和基因预测的数目非常稳定，但由于RNA分析学的改进[Ensembl release 73,Sept.2013]，注解的转录子数目(目前有195565个转录子)持续增加。许多研究主要集中在对蛋白编码RNA、mRNA或转录子的定量。单个基因能表达多种不同的转录子，称为剪接变体，其特征在于外显子区的不同，和/或对于调控过程至关重要的非翻译区起始和结尾位点的不同。

已经开发了具有不同准确程度的不同的方法测量mRNA或基因表达水平。

表达序列标签EST是cDNA的短子序列，来自克隆cDNA的单次测序。它们过去用于鉴定基因转录子。公共数据库中提供上百万的EST，其提供关于相应基因表达条件的信息。EST使得能够设计用于DNA微阵列的探针，测量基因表达。

例如微阵列杂交测定的经典的基因表达测量方法，或者更近一些的方法例如大量同步测序或下一代测序(NGS)受限于这些方法内在的不准确性，其当前只能通过更多的测量例如深度测序而在一定程度上弥补，对于无法在高通量样品规模上进行的分析，这不可避免地在一定程度上增加成本。然而，测量中的准确性以及成本是药理学研究和大的临床规模研究中的最重要的要求。微阵列仅能在外显子或序列水平检测基因，为此在实验前已经设计了预先确定的序列探针。有限数目的这些杂交探针和错误杂交经常给高分辨率基因表达实验带来含糊的结果。微阵列设计受限，因为它们仅能覆盖一定数目的不同的3’UTR(3’非翻译区)，而不能鉴定新的3’UTR。

1996年末开始出现不同于当时以Sanger命名的常规双脱氧法的新的高通量测序技术(WO 98/44151)，称为下一代测序(NGS)。新测序技术的发展使得有可能尝试对整个转录组进行测序。NGS使用微型化和平行放置的流动池对数百万短的(长50-400个碱基)单个或成对末端读段进行测序。对空间分隔的、克隆化扩增的DNA模板通过合成进行测序，由此在单个核苷酸添加到互补链时进行解码。不同的微流体平台中使用光扫描(Illuminasystems from Illumina,Inc.,US；SOLiD systems from Life Technologies,US；Roche454from 454Life Sciences,Roche Diagnostics Corp.,US)和通过排列的微芯片场效应晶体管(Ion Torrent from Life Technologies,US)的pH微弱变化的检测。数百万的短读段必须与已知序列匹配或从头组装。而对于RNA研究，情况更复杂，因为来自单个基因的序列在很大程度上重叠。之前发现的转录变体的注解提供框架，基于单个外显子、外显子-外显子连接和覆盖可能性指导后续转录子组装。只有正确的转录子组装允许将读段分配到其亲代RNA分子，以及进一步的计算各个拷贝的数目。

与NGS技术无关，同时确定序列和频率信息是研究复杂序列混合物的一个主要问题。因为仅其序列决定分子性质，看似重复测定与其丰度成比例的相同分子，计算其相应的拷贝数是不可避免的。六个数量级的动态范围要求对数百万相同的高峰度分子进行重复测序，以获得低丰度分子统计学可靠的数值。这些方式在测序和后续数据分析过程中消耗资源和时间。所需的读段深度严重依赖于样品的复杂性(Hopper,2010；Wendl,2009)。毕竟，一个主要的挑战是将重叠读段与各个基因中的多个重叠转录子注解匹配的纠结。读段深度和计算的努力和成本巨大。因此，已经开发出不同的方式，通过每个mRNA分子仅产生一个读段，消除匹配重叠读段的需求。对这些读段的分组和计数简化了mRNA和基因表达测量(WO02/059357)。

前体mRNA的聚腺苷酸化是真核基因表达和调控的一个重要步骤。许多基因产生具有可变聚腺苷酸化位点(APA)及不同的3’UTR的mRNA，所述mRNA可被差异化调控，或也可编码不同的蛋白亚型。因此，为了将通过每个mRNA仅产生一个读段来确定基因表达数值的简便与聚腺苷酸化位点的准确鉴定组合，开发了专门针对那些APA的方法。

一种该方法以基因组范围和链特异性方式鉴定polyA位点(Wilkening,2013)。其中，NGS测序文库如下制备：加热使RNA样品片段化，固相可逆化固定(SPRI)，通过缓冲液更换而纯化以防止进一步片段化，用生物素化且锚定的polyT(V)-引物-接合体引导(priming)后逆转录，SPRI纯化以去除所有不含polyA的片段并更换溶液，Rnase H处理降解RNA并用较小RNA片段作为第二链合成的随机起始序列，其使用DNA聚合酶，产生最长的可能的双链，因为所有其他内部延伸的引导位点将通过链置换被置换，SPRI纯化，链霉亲和素亲和纯合和结合，使得在后续3个步骤的每个之后进行溶液更换，酶促末端修复，单dA加尾，连接另一接合体，之后是富集PCR，以及SPRI纯化。

产生的NGS文库每个mRNA分子仅包含一个读段，尽管每个mRNA一个读段标记了理论最大值。实践中，由于文库产生的诸多反应步骤的每一步的效率均低于100％，结果是对转录子丰度的扭曲表示，并且是在期往实现中的等比例的扭曲表示。重要的是每个转录子种类的读段数目与其拷贝数目而非其长度或任意其他序列特异性偏倚成比例。该劳动力、化学制品及消费密集型方法有利于基因表达测量，因为其允许通过简单的读段计数对RNA丰度进行定量，因为每个转录子仅产生一个读段。该方法继之以具体的NGS方案，其在真正的测序开始前默默地读通引物-接合体的polyT区段。这部分名为3’T填充法。另外，polyA位点同种型的表达水平可以单核苷酸序列的分辨率，或在非常接近的polyA位点与相应簇重合后进行检测和定量。除了在读段产生中更好的质量之外，该方案主要的改进是引入所述3’T填充，其使得可以从转录子最末端进行测序。

其他polyA位点富集方法之前已被开发，但没有前述3’T填充。由于缺少转录子变体的内参，很难判断这些方法的不同质量。更简单的一个方法是polyA连接序列的多重分析，MAPS[Fox-Walsh,2011]。其中，生物素化的含有接头序列的oligo-dT(NV)用于引导cDNA合成。经固相选择，通过使用连接至另一接头序列的随机引物启动第二链的合成。最后，文库从链霉亲和素包被的珠释放，并使用带条码的引物以及通用引物进行扩增。该方法同样具有强力检测基因表达的能力。尽管阅读方向最初指向mRNA的3’端，并且仅有非常窄的大小的文库选择能读入polyA位点，但接头(引物)序列的更换以及与上述3’T填充方法的组合也允许所有读段的polyA位点的精确检测。

该方法有几个缺陷。其旨在合成全长cDNA，在cDNA与链霉亲和素-珠表面结合之前用双脱氧三磷酸核苷ddNTP保护cDNA的末端，通过这些方式纯化cDNA，引导并用Taq DNA聚合酶延伸第二链。Taq DNA聚合酶通过5’->3’外切核酸酶活性降解任何遇到的下游链，并且已被选择用于确保在通过上述亲和结合方法纯化双链产物之前，每个cDNA仅产生一条第二链，其已经从最远离polyA位点处引导。由于长cDNA，NGS文库趋势上较长，这会导致在后来的NGS簇产生中的长度偏倚。第二链合成发生在珠表面，其在朝向生物素化的第一引物序列的序列的界面区中尤其受阻。表面限定的反应辅助的多个纯合步骤在可靠的polyA位点读段产生中引入一系列长度和序列偏倚。

另一种基于深度测序的方法是定量polyA位点测序，PAS-测序[Shepard,2011]。该方法以片段化步骤起始，以产生期望大小范围的RNA片段。另外，第一接头序列是锚定的oligo-dT(NV)引物的一部分。该方法利用逆转录酶的末端转移酶活性。当到达mRNA片段的5’末端时，MMLV-V逆转录酶向cDNA的3’端添加一些非模板化的脱氧胞苷。那些末端与包含三个G的序列的第二接头杂交。逆转录酶持续转换(switch)模板并合成mRNA片段的拷贝，其如今通过两个接头序列延伸。

这一非常简单的方法的主要缺点是其仅1-10％的低效、模板转换的偏倚和不精确。低效将导致低丰度转录子的损失。模板转换并不专门与模板转换引物偶联，并且人工融合转录子可以通过转换到不同的RNA模板而产生。而且模板转换引物必须大量过剩地提供，这使得在后续文库扩增之前的纯化步骤成为必需。

Derti et al[2012]描述了另一种polyA-seq方法。该方案使用含有第一接头序列的锚定的polyT引物进行第一链合成，利用RNAse H处理消化RNA，之后用含有第二接头序列的随机引物引导，以及Klenow延伸进行第二链合成。尽管Klenow DNA聚合酶I片段缺少5’->3’外切核酸酶活性，但其含有持久的链置换活性。因此，每条第一链cDNA能产生几条随机引导的第二链。无法确保明确的一一映射的mRNA丰度和读段计数的关联。

US 6,406,891 B1涉及产生全长cDNA的方法，使用一种方法，包含在第一链合成期间在进行性RT酶和热稳定RT酶之间来回循环。

EP 1371726 A1涉及第一和第二链合成方法。第一链合成使用固定在珠上的引物，第二链合成使用随机六聚物。第二链合成使用Klenow混合物，其包含链置换活性。

Costa et al.[2010]涉及使用RNA-seq的转录组研究。

Mainul Hoque et al.[2012]涉及通过3’区域提取和深度测序对选择性切割和聚腺苷酸化的分析。

对于基因表达计数，存在对可靠、有效、简单和划算的产生NGS文库扩增子的方法的需求，所述方法具有mRNA丰度与读段计数之间的一一映射的关联。

发明概述

本发明提供一种产生模板RNA分子的核酸产物的方法，包含-在任选获得模板RNA之后-

a)使第一寡核苷酸引物在模板RNA的预先选定的核酸区域退火，

b)以模板特异性方式延伸第一寡核苷酸引物，由此获得第一延伸链，其通常在包含模板RNA的双链中，

c)至少从双链中去除RNA模板，

d)使一或多个另外的寡核苷酸引物与第一延伸链退火，

e)以模板特异性方式延伸一或多个另外的寡核苷酸引物，1)不置换与第一延伸链退火的引物，或2)使用破坏被置换的链的聚合酶，由此产生另外的延伸产物，

f)分离和/或扩增所述另外的延伸产物的延伸产物，其包含与所述第一寡核苷酸引物互补的延伸(或互补)的核酸部分。

本发明还涉及试剂盒，其包含逆转录酶，dNTP，聚合酶所需的辅因子例如金属离子优选Mg²⁺的盐，引物，优选poly-T引物，无链置换活性的DNA聚合酶例如T7、Q5或T4DNA聚合酶或破坏被置换链的聚合酶例如全长Bst，大肠杆菌I DNA聚合酶，以及随机寡核苷酸引物。所述试剂盒可适于根据任意实施方案以优选特征的任意一个或组合进行本发明的方法。

以下详细公开涉及本发明的所有方面和实施方案。方法描述还涉及试剂盒，其可包含适于进行所述方法的部分，试剂盒组件也可涉及方法，其可根据其功能实施或使用所述组件。

发明详述

本发明涉及每个RNA分子产生(仅)一个扩增产物的简便划算的方法，其通过如下实现：第一链合成期间的引导反应的3’端特异性(如果例如使用含有oligo-dT的引物)或者基因/转录子特异性(如果基因或转录子特异性序列被靶向)，以及后续分离、选择或扩增这些产物，旨在获得延伸产物，其包含与第一寡核苷酸引物互补的延伸(或互补)的核酸部分(例如通过选择序列标签或接头序列或选择引物的其他序列，例如与第一延伸链互补的序列)。通过防止与第一延伸链退火的引物的置换，或通过破坏被置换的链，仅获得一个产物，即由步骤d)的与模板的预先选择的区域结合最近的引物延伸，其满足步骤f)的选择、分离、扩增或通常处理的标准。因此每个RNA模板种类(具有预先选定的序列)的浓度或拷贝数与由本发明方法最终获得的延伸产物直接相关。该方法如上概述，并在权利要求中进一步描述。该方法可在一个逐渐增加的体积或容器中进行，特别是通过仅向反应混合物中添加另外的试剂，不必通过从步骤a)-e)的混合物中分离组分而纯化。另外的试剂某种程度上可中和或增加已经在流体中存在的组分。该方式不仅简化了处理而且增加了该方法的可靠性，因为所有中间反应产物总是保留在一贯的体相中。除了减轻手动制备中相互之间的任何纯化，这大大有助于该方法在适于自动化的芯片或微流控上的实施。

通过如下测量基因表达：将扩增产物或读段匹配和分组到基因注释以及这些读段的计数，无需将读段与转录子支架匹配，也不使用后续的转录子特异性标准化算法，其试图排除某些长度和序列特异性偏倚，这对每个RNA分子多于一个读段的方法是必需的。

本发明的方法的不足在于，其需要两个引导事件，两个聚合酶反应，一个中间体RNA水解，随后是一个最终分离、扩增或纯化，旨在选择对应于RNA模板的预先选定的核酸区域的产物。

已知每个转录子仅一个读段提供基因表达计数的更高准确性。本发明方法的一个新的方面是由于存在的长度标准化，所需读段深度的减少，因为仅部分被分析，与全长cDNA相比长度有限。

将基因表达信号限制到mRNA预先选定的核酸区域使相对测序成本较低，目前预计约为常规全长测序的1/5，并且基因表达数值更加准确，因为长度标准化发生在样品准备水平。因此，计算正确的FPKM值(每百万映射读段转录子的每千个碱基的片段)无需知晓转录子变体的长度。mRNA区域提供的信息内容足以在大规模分析中对样品进行分类，因为尽管其信息内容少于完整规模的转录子分析，但能够提供多于简单基因表达的信息内容。

产生的核酸产物也可被视为扩增产物，因为使用了核酸扩增反应，但当然模板RNA本身并不完整复制，因此不被该方法扩增。该方法旨在“扩增”或仅仅产生包含模板RNA区域的复制序列的多核苷酸。该复制序列是模板RNA的一部分，并位于用在引物结合步骤a)中的预先选定的核酸区域的5’方向。复制序列通常具有约25-2000个核苷酸，大约100、200、300、500或1000nt核苷酸的长度。精确值会有区别，并且受到操作者使用的参数和试剂的影响。实质上，操作者可以定制获得的区域长度，通过例如调整反应中使用的引物，尤其是步骤d)的引物的量和组成，其可以是随机引物。操作者可以定制对后续NGS或任意其他测序最优化的平均的区域长度。

根据本发明的一种可能，与沿着整个转录子的多个读段相比，当每个转录子(模板RNA分子)或靶序列(预先选定的核酸区域，也可以是每个转录子两个或更多个)仅产生一个读段，并且这些读段可以均以相同的核苷酸开始或终止时，可能会产生这些读段是否来自转录子的不同拷贝或者它们是否来自PCR复制事件的疑惑。因此任选地，在第一延伸反应期间可使用条码标记(加条码)每个引导事件，以区分来自克隆PCR复制事件的多转录子拷贝，从而确定重采样的真实程度(US 2011/0160078，并入本文作为参考)。理想情况下，这些条码作为随机条码引入接头序列。优选它们不参与引导反应。由此每个读段(或延伸产物)将具有与其他读段(延伸产物)不同的各自独特的条码。

成比例的PCR复制不会造成声称的更高的准确度，但表明应用的读段深度超出了NGS文库的复杂性，因此测序运行开始对相同的插入片段拷贝再次测序(阅读)。

PCR复制本身不是问题，但看到以相同序列起始和截止的读段会使使用者认为他测序太深，或文库复杂性太低。由于来自转录子的所有读段以临近polyA尾的相同序列(或其他靶序列)起始，并且经常在优选序列处截至，所述读段似乎更像是PCR复制子，尽管它们不是。

因此，在第一链合成期间导入特征例如随机条码使得能够区分真正的单个读段与复制子。

获得或提供模板RNA的初步步骤是提供包含任意RNA的样品，例如来自细胞的总RNA。还可以选择专门的RNA碎片，例如mRNA碎片或以下RNA类型之一。尽管RNA优选转录子或mRNA，特别优选其包含polyA-位点或polyA-尾，但当然可以使用和分析其他RNA分子，例如pre-miRNA、miRNA、pre-tRNA、tRNA、pre-rRNA或rRNA，其中任意一个，单独或与其他RNA类型组合均可包含在RNA中。优选地，模板RNA包含polyA-位点或polyA-尾。如果尾本身在RNA种类中并不存在，可通过加尾反应人工添加。当然也可添加除polyA之外的其他尾，例如通过使用例如WO2007/062445中所述连接酶(试剂盒的任选组分)的连接反应。步骤a)的第一引物继而会与该(人工)尾的序列退火。在后续步骤中，优选在本发明方法中通过使用DNA聚合酶，优选RNA依赖的DNA聚合酶产生cDNA。或者，在使用转录子特异性引物对RNA进行最初的引导期间，可以针对感兴趣的转录子，例如参与如癌症、免疫缺陷疾病的产生的转录子的特异性区域。

RNA模板可以是任意长度，但优选在20-100000nt(核苷酸)范围内，尤其优选30-50000nt，更优选50-25000nt，75-10000nt或100-8000nt。

优选使用末端转移酶(试剂盒的任选组分)进行3'末端的(任选)加尾。尽管还公开了其他加尾方法，比如尾序列连接，所述尾序列可例如是限定的预先选定的序列。末端转移酶可以添加一定数量的核苷酸，优选统一选自一种核苷酸类型。也可使用任何其他加尾、添加尾序列的方法，例如通过连接尾序列，其可以统一具有一种类型的核苷酸或具有不同核苷酸。该尾优选是5-500个核苷酸的序列，更优选少于400个、少于300个、少于200个、少于100个、少于50个或少于30个核苷酸。任意该尾(或其部分)可用作步骤a)中的预先选定的3’末端核酸区域，引物可与之退火。

本发明的方法特别适合分析具有不同核酸序列的不同RNA分子的复杂的混合物。优选地，本发明方法中获得和/或使用1、2、3、4、5、6、7、8、9、10或更多，尤其是至少20、至少30、至少40、至少50、至少75、至少100、至少200或更多的具有不同序列的不同RNA模板。

步骤a)，使第一寡核苷酸引物在模板RNA的预先选定的核酸区域退火，包括提供第一引物，其在杂交条件(低于双链的解链温度)下与预先选定的区域退火或杂交。因此其包含用于退火反应或杂交的足够长度的互补序列。互补区可以是现有技术中通常使用的任意一种，例如长6-40nt，优选至少6、7、8、9、10或更多nt。预先选定的区域是具有已知或预期序列的一个，例如真核mRNA共有的polyA-尾。可以使用任意其他已知序列，例如基因或转录子特异性序列，其为一或多个感兴趣的特异性靶标而选择。该一或多个靶序列可用于创建疾病特异性组，例如癌症或免疫缺陷特异性组。预先选定的核酸区域可存在于一或多个感兴趣的模板RNA上。这些感兴趣的模板可以具有相同的性能，例如与特异性疾病或状况相关。优选感兴趣的模板的组包含2、3、4、5、6、7、8、9、10或更多个，例如至少15、至少20和期间任意范围的模板，所述模板包含预先选定的核酸区域。在一个反应(多重)中，多个第一引物可用于与该组退火。

优选地，但不是必须地，其为模板RNA预先选定的3’末端区域，例如polyA-尾或上述加尾期间另外添加的尾。预先选定的区域可以具有感兴趣的RNA类型特定的序列(例如如上公开的)。而且如上所述，预先选定的区域可以人工附着于RNA模板，例如通过连接或加尾。

引物可以包含一个区域，其具有与RNA模板退火的序列，例如通过碱基配对杂交的互补序列，以及任选地并不结合的区域，例如通过具有非互补序列和/或被寡核苷酸封闭的序列，所述寡核苷酸与该区域杂交而阻止进一步的杂交。该非结合区域优选包括(优选随机)条码，使多个转录子拷贝与PCR复制事件区分。优选地，该条码位于被封闭区域。退火区域例如可以是oligo-dT₈至oligo-dT₃₅区域，优选oligo-dT₁₅至oligo-dT₃₀区域，例如oligo-dT₁₀或oligo-dT₂₅，其增加选择性并减少内部引导事件，其能在mRNA内的内部A富集位点发生，如果它们不是模板RNA的预期的预先选定的区域。

优选第一引物是DNA引物，优选如下述对随机引物进行修饰。

步骤b)，以模板特异性方式延伸第一寡核苷酸引物，由此获得第一延伸链，可用任意模板特异性寡核苷酸延伸反应来进行，优选使用核苷酸聚合酶，优选DNA聚合酶，尤其是以RNA为模板进行逆转录的逆转录酶。第一延伸链继而通常在包含作为互补链的模板RNA的双链中。第一延伸链是后续步骤中进一步引物延伸反应的模板。可以使用任意逆转录酶，如下进一步所述-有或无链置换活性-例如M-MLV RT进行逆转录反应。优选地，至少存在一些链置换，以允许聚合酶解开RNA二级结构。对于使用RNA模板的逆转录酶，在优选的实施方案中，逆转录反应在不允许RNA模板二级或三级结构(RNA:RNA杂交)形成的条件下进行，或在允许这些二级结构被逆转录酶进行链置换的条件下进行。在延伸反应期间使用的聚合酶可以是病毒聚合酶，并且可选自AMV RT(及其突变体例如Thermoscript RT)、M-MLV RT(及其突变体，包括但不限于Superscript I、II或III、Maxima RT、RevertAid、RevertAidPremium、Omniscript、GoScript)、HIV RT、RSV RT、EIAV RT、RAV2RT、Tth DNA聚合酶、C.hydrogenoformans DNA聚合酶、禽肉瘤白血病病毒(ASLV)及其RNase H-突变体。可使用任意这些聚合酶的混合物。特别地，可使用病毒聚合酶的混合物，例如M-MLV和ASLV的混合物，和/或可使用其RNase H减少或RNase H阴性的类似物。在任意这些方法和组合物中，可使用两个或更多个聚合酶，包括上述任意聚合酶。

步骤c)，至少从双链去除RNA模板，意味着第一延伸链，至少在3’末端区域从RNA模板释放。双链可被解链，RNA模板通过纯化去除或被消化，但该纯化并不优选，因为其增加额外的繁琐的步骤。消化可完全或部分进行。短RNA部分可保留在第一延伸链上，因为本发明的方法不要求全长接近第一延伸链。可使用RNase或加热进行消化，尤其是在另外的RNA去稳定剂，例如碱性条件或二价阳离子例如Mn²⁺存在下进行。优选地，去除RNA模板包含酶促RNA消化，优选通过RNase，碱性降解，优选通过NaOH处理，或在二价阳离子例如Mn²⁺或Mg²⁺存在下加热。

步骤e)中的反应通过以下确保仅产生一个延伸产物：通过使用无链置换的条件，或通过破坏，即解聚被置换的链，例如通过使用适合的聚合酶，在此情况下会发生链置换。无链置换时，仅预先选定区域的最3’-指向的引物成功延伸至对应于第一引物的位置。为了防止RNA模板干扰该反应，优选在逆转录后RNA被去除，优选被水解，完全或至少仅保留短片段，其比接下来在第二链合成期间的第二引物具有更低的解链温度。

如果二价阳离子存在，RNA在高温下进行自发降解。如果二价阳离子未被去除，其随后可被螯合剂例如EDTA或EGTA屏蔽。如果样品未通过沉淀或基于柱的纯化方法进一步纯化，螯合剂的终浓度应被平衡，以便防止降解任意之后的产品且不抑制后续酶促反应，该酶促反应的活性也需要二价阳离子(例如Mg²⁺之于聚合酶)。RNA的快速水解发生在例如二价阳离子存在下，温度至少70℃，例如75℃和/或不高于98℃。

RNA的水解优选使用MnCl₂和高温进行，其使得cDNA保持完整，但破坏RNA。该方法比使用RNase更为节约成本。碱性条件，例如通过NaOH添加也可用于水解RNA，但必须更加小心以防止cDNA也发生降解，例如使用较低温度或较小的碱性pH，经调整使得RNA降解，而cDNA不会。

步骤d)，将一或多个寡核苷酸引物与第一延伸链退火，要求至少一个引物与第一延伸链结合。该步骤本质上是根据与步骤a)中所述的第一引物退火相同的原则进行。另外的引物的序列可以是对于感兴趣的RNA模板已知或未知的序列。优选使用随机引物，其不要求知晓互补序列。对于上述步骤a)，多重是可能的。还是在步骤d)中，多个另外的寡核苷酸引物是一种选择，其任选与一或多个经选择的特定靶区域特异性退火，由此允许每一个另外的寡核苷酸引物特异性选择一个模板RNA或其上的基因序列。

在随机引导时，具有随机序列的寡核苷酸群，通常是随机的五聚体、六聚体、7-mer、8-mer、9-mer、10-mer、11-mer、12-mer或更长的寡聚体序列用于在模板核酸链(本文是第一延伸链)中的任意位置引导延伸反应。除了该随机寡核苷酸序列外，引物当然可以包含另外的核苷酸。任选地，额外的随机条码可用于区分多转录子拷贝与PCR复制事件。优选地，另外的引物是DNA，任选如下所述修饰。

“随机引物”应被理解为具有不同引物序列部分的不同引物的混合物，由于随机合成至少该引物序列的一部分而具有较高差异。随机引物有可能覆盖所述序列的完整的组合区。随机引物的随机序列引物部分可覆盖1、2、3、4、5、6、7、8或更多随机核苷酸或通用核苷酸。给定核苷酸位置的随机核苷酸随机选自A、G、C或T(U)。对于引物序列的杂交序列，T和U在本文中可互换使用。随机序列部分的组合可能性是mⁿ，其中m是所用的核苷酸类型的数目(优选所有4种A、G、C、T(U))，n是随机核苷酸的数目。因此，随机六聚体，其中每种可能的序列均有体现，由4⁶＝4096种不同的序列组成。随机引物也可包含一或多个核苷酸，其不像A、T、C或G那样特异性结合互补核苷酸。这些核苷酸也称为“摆动碱基”或“通用碱基”。可使用具有通用碱基的核苷酸，例如脱氧肌苷、3-硝基吡咯2'-脱氧核苷和5-硝基吲哚2'-脱氧核苷。通用碱基将与A、C、G、T(U)的任意一种核苷酸或其至少两种或三种核苷酸碱基配对。该随机引物不必囊括所有可能性。在某些实施方案中，随机引物包含至少一种随机核苷酸(如上所述在一个位置排列)和/或至少一种摆动核苷酸。对于随机引物或选择序列的引物，使用至少10种、优选至少20种、特别优选至少100种不同的引物。

随机引导的延伸中特别但不限于最优的情况，引物可以以10nM-100μM，更优选约1μM，但也可以是至少200nM的浓度存在。在优选实施方案中，引物与模板核酸的比率(w/w)介于5:1至1:1000，优选介于2:1至1:500，优选介于1:1至1:300，优选介于1:2至1:250，优选介于1:5至1:150，优选介于1:10至1:100，优选介于1:12至1:50。引物与模板核酸的摩尔比可以介于100:1至1000000:1，优选介于1000:1至1000000:1，介于10000:1至500000:1，或介于20000:1至300000:1。在一个实施例中，使用100ng的mRNA起始材料，并假定mRNA长度为500-5000nt，均值2000nt，添加1nmol引物，则引物以6800:1的摩尔过量存在。

另外的引物可以包含一个区域，其具有与第一延伸链退火的序列，以及任选并不结合的区域，例如通过具有非互补序列和/或被寡核苷酸封闭的序列，所述寡核苷酸与该区域杂交而阻止进一步的杂交。该非结合区域也可包括条码，优选随机条码，使多个转录子拷贝与PCR复制事件区分。

步骤e)以模板特异性方式延伸一或多个另外的寡核苷酸引物而不置换与所述第一延伸链退火的引物，或使用破坏被置换的链的聚合酶，由此产生另外的延伸产物，其与步骤b)构思类似。任何适于给定模板例如DNA的延伸方法均可使用。在优选实施方案中，使用(如果模板是DNA，则是DNA依赖的，如果模板是RNA，则是RNA依赖的)聚合酶，优选DNA聚合酶，如果另外的延伸产物将是DNA。

该步骤中防止引物置换可通过多种措施实现，例如选择无置换活性的聚合酶或提供对聚合酶置换具有抗性的引物，或使用破坏被置换的链的聚合酶。

由于DNA聚合酶可从DNA的模板链置换DNA寡核苷酸，至少与溶解二级或三级结构相当，可以增强寡核苷酸的杂交以防止聚合酶的链置换。链置换活性特别强的DNA聚合酶是Klenow聚合酶(Klenow片段)。可通过使用对寡核苷酸自身的修饰或通过使用稳定寡核苷酸杂交或阻止聚合酶的添加剂，实现防止置换。降低或抑制聚合酶链置换活性的寡核苷酸修饰例如2’氟核苷酸、PNA、ZNA、G-Clamps(US 6,335,439,a cytosine analogue capable ofClamp Binding to Guanine)或LNA(US 2003/0092905；US7,084,125)。与无修饰的相同的寡核苷酸相比，这些修饰通常通过增加该寡核苷酸与模板RNA或DNA链的局部杂交能以增加该寡核苷酸的解链温度，或使该寡核苷酸的糖-磷酸骨架变硬。有些还使糖-磷酸骨架变硬，其进一步抑制聚合酶引起的链置换。用于链置换停止(SDS)的方式在WO 2013/038010A1(通过引用并入本文)中公开。

另外，引物与模板(例如第一延伸产物)的杂交可通过使用结合或嵌入核酸中的不同的添加剂而改变。例如，可使用溴化乙锭、SybrGreen(US5,436,134；US 5,658,751；US 6,569,627)或acricidine，优选特异于RNA:DNA或DNA:DNA杂交的嵌入剂。可结合dsNA的其他化合物是放线菌素D和类似物、新霉素家族的氨基葡糖苷(新霉素、核糖霉素、巴龙霉素和弗氏菌丝素)。改变引物杂交性能的添加剂也可共价包含于引物结构中。

通过添加核酸结合蛋白例如单链结合蛋白如TtH SSB或Tth RecA，可改变杂交能和动力学以抑制聚合酶引起的链置换。

本领域技术人员知晓那些添加剂仅为示例，任意其他导致引物-模板杂交稳定性增加的化合物、碱基修饰或酶均可用于增加Tm，并由此抑制链置换或抑制涉及的酶的链置换能力。

Tm的增加应当足够强大以防止延伸聚合酶引起的与模板退火的引物区域的5’端核苷酸任意一个的置换。特别地，本发明的Tm增加防止与模板退火的引物区域的5’端下游的第三、第二和/或第一核苷酸置换(另外的非退火的5’核苷酸可能存在，例如接头区域或条码，其无需修饰)。

在本发明的某些实施方案中，链置换需要恰好停止在下游引物的第一5’核苷酸处。

因此，优选寡核苷酸引物的结合在其与模板退火的区域的5’端特异性地发生Tm增强，从而防止延伸聚合酶置换它们。修饰包括但不限于LNA、PNA、ZNA、吖啶或荧光团。

在其5’端具有增加的Tm的寡核苷酸例如LNA-修饰的寡核苷酸使得恰好在下一引物起始处停止。本发明涵盖了将以下进行组合：通过使用LNA-修饰的寡核苷酸的链置换停止与无链置换活性的聚合酶，降低反应温度，以及使用不同的添加剂增加引物与模板的结合。

优选地，C和/或G核苷酸被修饰。即便未被修饰，这些核苷酸具有比A或T更高的Tm，这缘于互补退火时增加的氢键形成。在优选实施方案中，寡核苷酸引物包含至少1个、至少2个、至少3个、至少4个、至少5个、至少6个选自G或C的修饰的核苷酸。这些修饰的核苷酸优选在引物序列的5’端，所述引物如上所述与模板退火。

最有效的链置换停止是由G或C碱基实现的，因为它们增加引物或停止子的局部Tm。因此半随机引物(六聚物、七聚物、八聚物、九聚物等)包含至少两个、更优选三个或更多个G或C或G和C的组合。最优选这些G或C经修饰以增加局部解链温度，使用LNA修饰碱基时正是如此。最优选至少1个、至少2个或至少3个LNA修饰的碱基用在退火的引物区域的5’端。因此，优选使用任选自G或C的至少2个、至少3个修饰的核苷酸。

有几种方式方法可确保当延伸反应到达与模板退火的额外引物位置时，延伸反应停止。该停止在本文中也被视为防止链置换。本发明防止聚合酶链置换已经复制的多核苷酸部分的后续引物的步骤确保多核苷酸分子已经复制的任意部分不再被复制，并且特别地，对应于原始RNA模板最3’部分的第一延伸链的最5’-面向部分不再被复制。因此，多核苷酸的复制部分在第二链合成中均不超量，特别是所述最5’-面向的复制部分从每个合成的第一链模板仅合成一次。这种对链置换的抑制可通过不同方式实现，例如降低反应温度、使用无链置换活性的聚合酶、增加引物：模板杂交的解链温度或杂交能，或增加RNA或引物的刚性或稳定螺旋。实际上，通常选择这些方式的组合以实现无链置换的最佳反应条件。本领域技术人员能够选择本文所述或本领域已知的适合的参数，以适用于具体的模板和反应条件。

一种选择是调整反应温度。通常37℃以上，特别是70℃以上的反应温度在延伸过程中有利，从而更好地使模板中的二级结构解散，其导致更有效的置换合成。在一个实施方案中，停止引物的链置换是通过降低反应温度实现的。低于37℃，以及低至25℃，并且进一步低至4℃的反应温度用于减少链置换。然而，当使用具有链置换活性的聚合酶和/或使用不具有改变其解链温度的修饰的简单停止子寡核苷酸时，即使在更低的反应温度，链置换停止也不完全。优选聚合在12℃-37℃进行。

在作为替代，或除降低反应温度以在另外的引物或终止子的所述位置实现更好的延伸停止(并减少链置换)之外的一个实施方案中，可以使用缺乏链置换的聚合酶。对于DNA，DNA聚合酶，优选T7、T4或Q5DNA聚合酶用于以模板特异性方式延伸一或多个寡核苷酸引物。T4DNA聚合酶尤其有效并在所有实施方案中优选。

聚合酶可以是嗜常温的或嗜热的聚合酶，尤其是DNA聚合酶。

缺乏链置换的突变聚合酶在后续引物未被修饰时能够置换多达3nt。本发明包括将通过降低反应温度的链置换停止与使用缺乏置换合成的突变体或链置换合成被破坏的任意其他聚合酶组合。

增加单价反离子的浓度也会稳定任意模板-引物杂交(以及二级结构)。单价阳离子的浓度优选至少20mM、至少30mM、至少40mM、至少50mM、至少60mM、至少70mM.

作为任意上述选项之一的替换或与其组合，群集剂优选PEG的存在可增加对链置换的阻止。群集剂是惰性分子，可以高浓度使用并且可用于模拟细胞内的大分子聚集的效果。实例有PEG(聚乙二醇)、PVP(聚乙烯吡咯烷酮)、海藻糖、聚蔗糖和右旋糖酐。群集剂例如在US 5,554,730或US8,017,339中公开。其他作为群集剂的添加剂是Tween-20、NP-40，可额外或替代PEG添加。在本发明的范围内，优选使用最终12％-25％的PEG-8000(v/v)。可以使用不同的PEG分子量和化合物，本领域技术人员知晓添加剂的种类和浓度可变以最优化结果。群集剂优选在步骤e)中存在，以降低链置换的风险。作为替换或组合，它们也可在任意其他步骤，例如在纯化，尤其是在沉淀步骤中存在。试剂盒可以包含群集剂，优选在用于反应步骤e)的缓冲液中，例如包含聚合酶的辅因子如Mg²⁺的缓冲液。之后，群集剂也可存在于沉淀缓冲液中，其中群集剂的浓度将增加到足以沉淀多核苷酸，尤其是延伸产物。

步骤f)，分离和/或扩增所述另外的延伸产物的延伸产物，其包含与所述第一寡核苷酸引物互补的延伸(或互补)的核酸部分，该步骤选择步骤e)正确的延伸产物，其对应于原始模板RNA预先选定的核酸区域。由于步骤e)中的链置换被阻碍或防止，本质上每个模板将仅有一个来自步骤e)的延伸产物(直接的第一延伸链，以及隐含的原始模板RNA)，因为其他退火引物将无法延伸至对应于预先选定的核酸区域的区域，这是因为可延伸至第一引物结合的所述预先选定的区域，并且可进一步延伸到所述第一引物的完整序列的最3’引物的封闭作用。其他封闭事件可以是因为RNA模板的剩余片段，如果步骤c)的去除留了一些与第一延伸链退火的短的降解产物，其应该通过完全的RNA模板去除而避免发生，否则成功使最后的最3’引物延伸至期望的预先选定的区域的可能性也会降低。

该正确的另外的延伸产物(每一模板)的“选择”可通过例如分离、纯化或扩增或通常任意特异于另外的延伸产物的处理来实现，所述另外的延伸产物包含与第一寡核苷酸引物互补的延伸的核酸部分。分离可例如包含与固定化探针的结合。扩增可用于获得另外的延伸产物的互补链，其使用引物，将另外的延伸产物作为模板而选择性产生。扩增可以是PCR循环，其包含另外的引物退火和链延伸反应。对于分离或扩增，已知序列可用作识别序列，尤其是用于寡核苷酸结合。该已知序列例如是与步骤a)的模板RNA的原始的预先选定的核酸区域相同的序列，因此对应于第一引物的选择性序列区域，或对应于包含在第一引物中的任意其他区域，例如以下进一步描述的接头或条码序列。

根据本发明任意实施方案的优选，步骤a)的第一寡核苷酸引物和/或步骤d)的另外的寡核苷酸引物包含非退火序列标签或接头序列。该序列标签或接头可用于另一延伸，尤其是PCR反应中的扩增引物结合。序列标签或接头也可包含每个引物或引物类型(尤其是对于随机引物)的独特的序列或普遍存在的序列标识，也称作条码或条码序列。序列身份或标识可确定特定实验或批次的引物(以及后续的延伸产物)，或单个延伸产物或延伸产物的组。序列标签允许通过大量同步测序进一步分析。“非退火”可如下实现：通过选择不与其杂交模板(RNA模板，第一或另外的延伸链)退火的序列，和/或通过将非退火序列与另一寡核苷酸杂交，由此封闭引物的该部分并防治与模板的杂交。

也有可能在第一引物退火(步骤a中)之前的模板RNA是片段化的RNA，即例如获自样品的RNA经处理进行片段化以提供模板RNA。该片段化可使用本领域已知的任意方式进行。片段化可以序列依赖性方式启动，例如通过内切核酸酶消化，或以序列非依赖性方式启动，例如通过物理方式如超声或剪切，或例如通过化学方式如水解。如果使用序列依赖性方法，例如限制性内切核酸酶消化或序列特异性扩增，片段末端会具有序列偏倚。一个优选实施方案是通过如上述步骤c)所述的限制性降解或水解进行片段化，例如在二价阳离子存在下加热或在碱性条件下，但时间有限和/或温度较低，以保留较大的RNA片段。此类片段例如可以具有约100-5000nt的平均长度，优选300-3000nt，尤其优选500-2000nt。片段需要保持多于50nt，优选多于100nt，尤其优选多于150nt的最小长度，以使被靶向的3’端片段中的选择性序列部分保持完整，为步骤e)中的随机引导提供足够长的序列，并且在互补的第一和第二引物序列之间保留足够长的序列插入，其可定位于基因组和/或转录组注释。优选序列插入多于10nt，多于15nt，优选多于20nt长，其经常被设定为生物信息NGS测序阅读比对算法的最小长度要求。

优选该方法包含在另外的延伸产物上使用特异于所述延伸产物的序列标签或接头序列的引物(或引物对)进行PCR。该接头或序列标签可通过步骤a)中的引物和/或步骤d)中的引物导入。

另外的PCR的这些额外的引物可包含额外的序列标签或接头序列，其可再次用于PCR扩增。这些标签或接头也可包含序列标识，例如用于首次提及的接头或序列标签的上述条码。

在优选方式中，本发明的方法在步骤f)中还包含纯化步骤e)的延伸产物。该纯化可以是选择具有对应于步骤e)的延伸产物的预期长度，例如150-500nt长度的多核苷酸。步骤e)延伸产物的长度可以通过例如调整随机引物的引物浓度来控制，即随机引物越多，会导致第一链上越多的引导事件，并且因此在步骤f)中选择的期望的延伸产物将更接近第一引导位点，因此长度更短。可通过沉淀延伸产物，使长度例如小于100nt的短的多核苷酸保留在溶液中并去除溶液中的多核苷酸而进行纯化。50-100nt是包括两个序列标签或接头(一边一个)的引物-引物产物的典型长度。在优选方式中，纯化是去除长70nt或更短，或50nt或更短，或40nt或更短，或30nt或更短的短的多核苷酸。40-70nt是引物以及包括序列标签或接头的引物的典型长度。优选地，该方法包含固相可逆固定，其向固相表面如具有羟基的部分的表面，以及从该固相表面选择性结合和释放具有限定尺寸范围的多核苷酸[Hawkins,1995]。尺寸依赖性多核苷酸沉淀可通过群集剂，优选通过PEG实施，使用包括限定的盐浓度和pH值的特异性缓冲条件。优选地，在期望的较长的多核苷酸释放到不包含或包含极少群集剂的新缓冲液中之前，待去除的短的多核苷酸不结合(例如沉淀)到包被的珠上，并随上清液被去除。优选此类珠包含磁核心[US 5705628]。其他纯化方法包括尺寸依赖性色谱法例如体积排阻色谱。

可与每个其他实施方案结合的本发明的一个优选实施方案是方法的步骤a)-e)在一个随后增加的流体体积，例如一个池、一个容器或一个管子中进行。所有反应步骤均在所述一个溶液中进行，自在分装溶液中提供RNA后开始，直到分离或扩增期望的延伸产物，所述延伸产物包含与第一寡核苷酸引物互补的延伸的核酸部分，逐渐地，其他反应成分通过添加另外的溶液而添加。在流体中添加进行本发明方法必需的试剂，例如起始物质、酶和辅因子构建了反应混合物。本质上，具有步骤a)-e)的方法可以没有额外的纯化步骤而进行。由此步骤a)-e)采取的行动本身不能被认为是纯化，尤其是步骤c)的RNA去除，因为RNA降解后的降解产物可保留在溶液中。特别地，在一个增加的流体体积或一个容器中进行的具有步骤a)-e)的本发明的方法优选是不从反应混合物去除流体的方法。该方法显著简化了处理过程。通过不纯化中间产物以及分割反应体积，其还有助于保留样品和后续反应产物。

本发明还提供试剂盒，其包含逆转录酶，dNTP，聚合酶所需辅因子或金属离子优选Mg²⁺的盐，引物，优选poly-T引物，无链置换活性的DNA聚合酶例如T7、Q5或T4DNA聚合酶，随机寡核苷酸引物。试剂盒可适于进行根据任意实施方案的本发明的方法，具有优选特征的任意一个或组合。引物，优选poly-T引物或多个基因或转录子特异性引物的一个或混合物适合步骤a)，随机引物适合用于步骤d)。这些引物或引物制备物的引物组成不同，优选在不同容器，例如小瓶中提供。

试剂盒还可包含用于升温RNA降解的RNA降解剂，例如酶或二价阳离子，和/或群集剂例如PEG。当然上述任意组分均可用于替换的或更优选的实施方案。

产生本发明的核酸产物所实现的另一个优势是长度标准化，所有另外的延伸产物获得相似的长度或较窄的长度分布，其释放了测序空间，由此可被读段使用，所述读段由完整且更长的转录子产生。被理解为节省测序空间但获得关于基因表达和转录末端位点分布的收获是转录子长度变化和样品中转录子动态或浓度范围之间的关系。当观察两个边界条件时，该关系得到最佳例证。i)如果所有转录子会具有相同的已知长度，例如所有转录子均1kb长并且所有产生的片段/读段均独特定位，则长度标准化，例如到100bp并无益处。因此，收获并不取决于平均长度的降低，而是长度分布的降低。ii)如果所有转录子会具有不同和未知的长度，例如转录子已知长500bp-10000kb，并且许多产生的片段/读段无法唯一确定，因为它们定位于外显子，其由来自相同基因的几个转录子变体共用，则长度标准化，例如到100bp会有利于明确计数读段，并确定与读段总数相关的正确的基因表达值。因此，浓度加权的长度分布、序列注释的正确性(预先了解)以及独特地定位读段(其可被毫无疑义地确定到正确的转录子)的能力是转录组复杂性的相关测量。该复杂性可被本发明的方法显著降低。

本发明方法的商业机会可见于替换微阵列基因表达谱并提供次于全部mRNA转录组分析的中间分析工具。毒物基因组学(Toxicogenomic)和药物基因组学是可能应用的实例。通过在步骤a)和/或步骤d)中使用区域、基因或转录子特异性引物，靶向测序组成为可能。靶向(序列特异性，预先选定的/预先确定的)和非靶向(例如针对遍在序列如所有感兴趣的RNA序列共有的序列，如polyA，或随机序列)第一和第二引物的任意组合是可能的，例如a)靶特异性(＝靶向)第一引物和非靶向第二引物；b)非靶向第一引物和靶向第二引物；c)靶向第一引物和靶向第二引物；d)非靶向第一引物和非靶向第二引物。当然，在一个后续增加的流体体积中进行本发明方法的益处适用于所有这些变体，尤其是无需流体去除/清洗。b)的用途例如是检测3’侧潜在的变异，例如选择性剪接事件、选择性的最后外显子、选择性PAA以及融合事件。a)的用途例如是检测5’侧潜在的变异，例如选择性剪接事件、选择性的第一外显子以及融合事件。

无意于被本发明的这些实施方案限制，本发明进一步在后续附图和实施例中例证。

附图

图1：本发明方法的概览。反应通过后续添加反应物进行，并分为以下阶段：a)cDNA合成通过引导至已经存在(此处是mRNA的Poly(A))或在之前反应中附着的已知区域或标签而起始。P1与所述已知区域互补并且在其5’端还包含作为通用标签的非互补特异性序列。b)RNA通过RNA依赖的聚合酶，即逆转录酶逆转录成cDNA。c)cDNA合成后，RNA模板被RNAse、pH变化(NaOH和加热)或二价阳离子(Mn²⁺,Mg²⁺和加热)水解或降解。d)然后单链cDNA被多个随机引物P(n)、P(n+1)...P(n+n)引导。e)使用无链置换的DNA依赖的聚合酶合成第二链。f)缺少链置换确保仅最3’片段会包含两个标签，一个来自cDNA合成引物，另一个来自第二链合成引物。该最3’片段被分离和/或扩增。

图2：在测定中存在的示例性核酸分子的示意图。两个寡核苷酸(Seq ID:2和SeqID:3)与单链DNA模板(Seq ID:9)杂交。无链置换的聚合酶将产生由Seq ID:3延伸导致的65nt长的片段(Seq ID:4)以及由Seq ID:2延伸导致的85nt长的片段(Seq ID:5)。有链置换的聚合酶将产生由Seq ID:2延伸以及Seq ID:3置换导致的150nt长的片段(Seq ID:6)。另外会产生由Seq ID:3延伸导致的65nt长的片段(Seq ID:4)，如果链置换效率低，会产生85nt(SeqID:5)和150nt(Seq ID:6)之间的产物。

图3：不同反应温度有无链置换活性的聚合酶的比较。三种不同的聚合酶，T7和T4DNA聚合酶(均无链置换)以及Klenow片段3’-5’外切核酸酶(有链置换)在不同反应温度进行测试。白色填充箭头代表部分置换的链置换停止产物。黑色箭头代表无变性步骤的单链模板的二级结构。

图4：有无链置换活性的聚合酶在不同反应温度的进一步比较。对于T4，25℃比37℃更为推荐，因为在37℃，内在的核酸外切酶主导反应。

图5：不同的RNA降解法的比较：使用MnCl₂，仅升高温度，NaOH处理或RNAse。分离自小鼠肝的总RNA掺入111nt的单链DNA(ssDNA)寡核苷酸(ID Seq ID:7)，参见第1和10泳道。于95℃在标准RT缓冲液50mM Tris-HCl(25℃时pH 8.3)，75mM KCl，3mM MgCl₂和10mM DTT中热处理30分钟，然后在98℃5分钟，98℃10分钟，98℃20分钟，以及98℃30分钟，导致RNA降解，但未完全去除RNA。将RNA/ssDNA混合物与RNase H/A/T1混合物在25℃或在37℃孵育30分钟，完全去除RNA而未降解单链DNA。在0.1N NaOH存在下于升高的温度孵育10分钟(55℃)降解RNA，尽管并不完全。在0.1N NaOH，95℃10分钟后，RNA完全被去除，然而ssDNA也开始降解(泳道7-10)。向RNA/ssDNA/RT缓冲液混合物中添加10mM MnCl₂并在98℃热处理5、10、20和30分钟导致RNA完全降解而未降解ssDNA。

图6：初始RNA片段化对文库大小和效率的影响。a)和b)在6mM MnCl₂存在下片段化并最终扩增14个PCR循环，而c)和d)在4mM MnCl₂存在下片段化并需要再多2个PCR循环。所有片段化均在85℃进行3分钟。

图7：RT引物浓度和第二链合成引物浓度对文库大小和产量的影响。a)50nM锚定的polydT(RT)引物(SEQ ID No:8)和1μM第二链合成寡核苷酸+rc(SEQ ID No:9和10)，b)25nM锚定的polydT(RT)引物和0.5μM第二链合成寡核苷酸+rc，文库在上样前1:3稀释，c)50nM锚定的polydT(RT)引物和0.5μM第二链合成寡核苷酸+rc,文库在上样前1:3稀释，d)25nM锚定的polydT(RT)引物和0.1μM第二链合成寡核苷酸+rc。

图8：RNA降解方法对NGS文库质量的影响。RNA通过以下降解：a)10mM MnCl₂于95℃10分钟，b)5000U RNAse H于37℃30分钟，c)逆转录缓冲液于95℃10分钟，d)100mM NaOH于95℃10分钟，以及e)200mM MnCl₂。ML，低分子量标志物；MH，高分子量标志物；P，剩余引物；LL，接头-接头片段。

图9：第二链合成后的硅胶柱和SPRI纯化的比较。a)SPRI纯化，使用羟基修饰的磁珠和盐-PEG缓冲液，以及b)硅胶柱纯化，使用pH缓冲液系统。

图10：核苷酸序列

实施例

实施例1：3’末端NGS文库产生，用于Illumina测序平台。

简言之，主文库产生如图1所述进行。a)cDNA合成通过引导至已经存在(此处是mRNA的Poly(A))或在之前反应中附着的已知区域或标签而起始。P1与所述已知区域互补并且在其5’端还包含作为通用标签的非互补特异性序列。b)RNA通过RNA依赖的聚合酶，即逆转录酶逆转录成cDNA。c)cDNA合成后，RNA模板被RNAse、pH变化(NaOH和加热)或二价阳离子(Mn₂₊、Mg₂₊和加热)水解或降解。d)然后单链cDNA被多个随机引物P(n)、P(n+1)...P(n+n)引导，以及e)使用无链置换的DNA依赖的聚合酶合成第二链。缺少链置换确保仅最3’片段会包含两个标签，一个来自cDNA合成引物，另一个来自第二链合成引物。

以下更为详细地描述各个反应步骤。

文库产生始于通过逆转录的第一链cDNA合成，其中在其5’端含有一个Illumina相容序列的oligodT引物与RNA杂交，之后发生逆转录。为此目的，对于一个单个的文库的制备，5μl RNA与5μl第一链cDNA合成Mix 1混合，其包含逆转录必需的所有成分，包括在PCR板的一个孔中，或者在8孔板条的一个孔中，或在任意其他热循环仪相容管中的oligo dT引物，但无酶。如果使用较小体积的RNA，则添加不含RNAse的水至总体积10μl。然后溶液孔通过用移液器吸取混合，并密封PCR板。密封紧密。板经向下旋转使所有液体汇集在孔的底部。然后在热循环仪中于85℃使RNA/RT混合物变性3min，之后冷却至37℃，允许RT引物a)杂交。在小心地移除密封膜之前向下旋转板，以确保所有液体汇集到孔底部。

之后在板被再次密封之前，10μl逆转录酶稀释液通过用移液器吸取混合至每个反应中。液体需要向下旋转，并且在步骤b)中，板在37℃孵育15分钟。

c)RNA模板被去除。在该步骤中，RNA模板被破坏，这对有效的第二链合成是必须的。在第一链合成反应之后去除密封膜之前，板迅速向下旋转以确保所有液体汇集在孔底部。将5μl RNA去除溶液直接添加至第一链合成反应并混匀，使用新鲜膜再次密封板。板必须于95℃孵育10分钟，之后冷却至25℃，向下旋转。现在小心地去掉密封膜，添加5μl去除溶液2(其基本上去除或中和随去除溶液1添加的组分)，再次将溶液混合均匀。

d)在后续的第二链合成期间，文库转变成dsDNA。第二链合成由在其5’端含有Illumina相容性接头序列的随机引物起始。反向补体防止接头序列参与杂交。在该阶段，推荐将纯化珠(SPRI珠)置于室温以给它们足够的平衡时间。添加15μl第二链合成Mix 1(包含DNA依赖的聚合反应必需的所有组分)，通过用移液器吸取混合均匀，并将板密封。现在，板在热循环仪中于98℃孵育1分钟，并通过设定每秒0.5℃的降温速度缓慢冷却至25℃，其对应于许多热循环仪最大降温速度的10％。反应于25℃孵育30分钟，快速向下旋转，之后从板上去除密封膜。

e)添加5μl DNA依赖的聚合酶稀释液。反应于25℃孵育15分钟。直至步骤e)，整个反应在一个持续增加的体积中进行。反应接着进入选择步骤f)。

f)使用磁珠纯化双链文库，其仍含有不期望的不包含P1序列的双链。纯化珠(PB)在使用前应当在室温平衡30分钟。PB可能已经沉淀，在加入到反应中之前必须适当重悬。之后，根据制造商(AMPure Beads；Agentcourt)的说明书进行SPRI纯化。文库在20μl水或10mMTris(pH 8.0)中洗脱，17μl具有文库的清澈上清转移至新的干净的PCR板中。必须当心不要将任意珠转移到新板中。文库可在-20℃储存，用于后续扩增。

通过PCR扩增分离最3’片段。文库也经扩增添加在NGS机器上进行簇生成所需的完整的接头，并产生用于质控和后续泳道混合的足够的材料。使用热稳定DNA聚合酶进行标准PCR反应，之后产物通过最终纯化(SPPRI纯化，根据制造商的说明书)再次纯化，其中形成的文库从任意残留的PCR组分中分离，其中所有输入的不包含序列P1和Pn的DNA材料通过PCR的相对稀释过程在整体上被完全置换。不含序列P1和Pn的剩余序列将无法在NGS过程中产生簇，因为簇产生使用从仅包含两个序列的单分子起始的PCR扩增。最终的文库在20μl添加的EB中洗脱，珠在室温下孵育2分钟之前于EB中适当重悬。板置于磁性板上收集珠5分钟，或直到上清彻底清澈。将上清转移至新的PCR板。此时，文库形成并可用于质控、富集、簇生成和进一步测序。

实施例2：在不同温度比较具有链置换活性的非停止聚合酶(Klenow)和无链置换活性的停止聚合酶(T4and T7)(图2、3和4)。

测定描述：

所建立测定的示意图如图2所示并描述。具有链置换(有和无破坏被置换的链的能力)的不同聚合酶和无链置换的聚合酶使用图2中所述测定进行评价。简言之，Seq ID:1、Seq ID:2和Seq ID:3在不同聚合酶的相应缓冲液中杂交。杂交后添加聚合酶(3U T4DNA聚合酶，10U T7DNA聚合酶，或5U Klenow片段(3'-5'外切核酸酶)，反应如图3和图4所示进行。在指定温度的反应时间为10分钟。之后通过硅胶柱纯化反应，去除缓冲液组分和酶，而无任何尺寸选择。将样品上样至10％PAA凝胶(与上样染料混合并于95℃变性2分钟)并在100V跑胶10分钟，然后于58℃在180V跑胶120分钟。用GYBR Gold染胶。

在图3中，变性和缓慢退火步骤(从95℃以较慢的降温梯度降至反应温度，耗时15分钟)的重要性经证实，因为对于无链置换的聚合酶，模板中的二级结构造成显著障碍。白色填充箭头代表部分被置换的链置换停止产物。黑色箭头代表无变性步骤的单链模板的二级结构。Klenow总是显示链置换(尤其在更高温度)，此处阻止cDNA中的二级结构的变性步骤并非必需，因为酶能用其内在的链置换消除那些二级结构(图2)。

图4证实5种不同的聚合酶的链置换。如上所述进行测定，使用相应的缓冲液、起始变性步骤，并在图4所示反应温度进行。具有链置换的聚合酶：8单位Bst DNA聚合酶，大片段，泳道2；5单位DNA聚合酶I，大(Klenow)片段，泳道7-8；200单位M-MLV，泳道11；以及无链置换的聚合酶，泳道3；3单位T4DNA聚合酶，泳道4-6；或破坏被置换的链的聚合酶例如5单位Bst DNA聚合酶，全长，泳道3；10单位E.coli DNA聚合酶I，泳道9-10。不同的反应温度如下：12℃，泳道4；25℃，泳道5、7、9；37℃，泳道2-3、6、8、10-11。T4DNA聚合酶含有外切核酸酶活性，该活性在37℃变得显著。Seq ID:1、Seq ID:5、Seq ID:2和Seq ID:3的降解产物可见。对于Bst DNA聚合酶，大片段，DNA聚合酶I，大(Klenow)片段和M-MlV，有链置换并且Seq ID 6(全长产物)可见。另外，对于那些由部分链置换产生的聚合酶，大于Seq ID:5的产物可见。对于其他链置换聚合酶例如Bst DNA聚合酶，全长(泳道3)和E.coli DNA聚合酶I(泳道9-10)，被置换的链也被破坏。T4DNA聚合酶并不包含链置换，且Seq ID 5清晰可见。对于T4，25℃比37℃更为推荐，因为在37℃，内在的核酸外切酶主导反应(图4)。

实施例3：MnCl₂、仅升高温度、NaOH处理或RNAse引起的RNA降解(图5)。RNA降解也依赖于缓冲液条件。

分离自小鼠肝的总RNA掺入111nt的单链DNA(ssDNA)寡核苷酸(IDSeq ID:7)，参见泳道1和10。总RNA很长，因此胶上仅较小的RNA条带可见，较长的RNA片段留在槽里。经片段化，较长的RNA片段被降解并在聚丙烯酰胺胶上以弥散可见。

在标准RT缓冲液50mM Tris-HCl(25℃时pH 8.3)、75mM KCl、3mMMgCl₂和10mM DTT于95℃热处理30分钟，然后在98℃5分钟，98℃10分钟，98℃20分钟，以及98℃30分钟，导致RNA降解，但未完全去除RNA。将RNA/ssDNA混合物与RNase H/A/T1混合物在25℃或在37℃孵育30分钟，完全去除RNA而未降解单链DNA。在0.1N NaOH存在下于升高的温度孵育10分钟(55℃)降解RNA，尽管并不完全。在0.1N NaOH95℃10分钟后，RNA完全被去除，然而ssDNA也开始降解(泳道7-10)。向RNA/ssDNA/RT缓冲液混合物中添加10mM MnCl₂并在98℃热处理5、10、20和30分钟导致RNA完全降解而未降解ssDNA。将样品上样至10％PAA凝胶，未进行纯化(与上样染料混合并于95℃变性2分钟)并在100V跑胶10分钟，然后于58℃在180V跑胶70分钟。用GYBR Gold染胶。

实施例4：RNA降解方法对用无链置换的聚合酶合成的NGS文库质量的影响(图6)。

500ng总RNA与Seq ID:8在20μl中的终浓度为25nM)并在10μl包含4μl 5x RT缓冲液的体积中加热至85℃持续3分钟。冷却至37℃后，添加1μl 1mM dNTP,200单位M-MLV并于37℃孵育15分钟。如图6所示，随后的RNA水解存在差异。在RT反应缓冲液中的生物素-链霉亲和素捕获进行20分钟(于25℃，1250rpm的摇床上)，使用NEB的5μg链霉亲和素珠。用清洗缓冲液洗涤珠两次，通过在10μl MB-H₂O中加热至80℃持续数分钟，使样品从珠释放。使用磁铁收集珠，清澈的上清转移至不同的管子，在其中进行第二链cDNA合成，使用3单位T4DNA聚合酶Seq ID:9和10(20μl中的终浓度为0.1μM)，8％PEG，10mM MgCl₂以及0.5mMdNTP，总体积为20μl。在添加聚合酶之前包括一个变性步骤，98℃，1分钟，缓慢退火(15分钟内梯度降温至25℃)。然后根据SENSE用户指南对样品进行硅胶纯化(第二链合成后的部分纯化)，并在25μl 10mM Tris pH 8中洗脱。10μl纯化产物继而根据SENSE mRNA Seq PCR进行18个循环的扩增，使用Seq ID:11和12作为PCR引物。然后根据SENSE用户指南对样品进行硅胶纯化(第二链合成后的部分纯化)，并在15μl 10mM Tris pH 8中洗脱。1μl纯化的PCR产物根据制造商的说明书上样于高灵敏度的DNA芯片(Agilent)上。

RNAse和MnCl₂对RNA的降解导致比NaOH水解更高的产量，NaOH水解损坏cDNA或导致碱基修饰，使得cDNA无法扩增。

实施例5：RNA在RT缓冲液中的初始片段化决定文库的大小和方案的效率(图6)。

RNA在其中变性的体积也影响变性期间存在的MgCl₂浓度，并且这也决定由轻微片段化RNA产生的cDNA会有多长。

500ng总RNA与Seq ID:8混合(在20μl中的终浓度为25nM)并在10μl(a和b)或15μl(c和d)包含4μl 5x RT缓冲液的体积中加热至85℃持续3分钟。在冷却至37℃后，添加1μl1mM dNTP，200单位M-MLV并在37℃孵育15分钟。在10mM MnCl₂存在下通过加热至98℃持续10分钟使RNA水解。之后添加10mM EDTA。第二链合成通过如下进行：向反应中添加第二链合成组分，至终浓度10mM MgCl₂，0.5mM dNTP，8％PEG，SEQ ID:9和10各100nM终浓度，以及3单位T4DNA聚合酶，总体积40μl。在加热至98℃，1分钟，缓慢退火(15分钟内梯度降温至25℃)之后再次添加聚合酶。如实施例4中所述进行纯化、PCR扩增和后续PCR纯化以及生物分析仪操作。

实施例6：通过RT引物浓度和第二链合成寡核苷酸浓度调节文库大小和产量(图7)。

所有文库进行17个循环。所有操作条件均根据实施例5，浓度可变：a)逆转录(RT)步骤中50nM Seq ID:8，在第二链合成(SSS)中0.1μM Seq ID:9和10，b)RT中25nM Seq ID:8，SSS中0.5μM Seq ID:9和10，上样前文库1:3稀释，c)RT中50nM Seq ID:8，SSS中0.5μMSeq ID:9和10，上样前文库1:3稀释，d)RT中25nM Seq ID:8，SSS中0.1μM Seq ID:9和10。

实施例7：硅胶vs.SPRI纯化(图8)。

所有步骤如实施例6(c)中所述，纯化方式不同。硅胶纯化如实施例5中所述进行，使用羟基修饰的磁珠和盐-PEG缓冲液的SPRI纯化根据制造商(来自Agentcourt的AMPureXP珠)的说明书进行。

参考文献

Costa V,et al.(2010)J Biomed Biotech 7(7):1299-20.

Derti A,et al.(2012)Genome Res.22(6):1173-83.

Fox-Walsh K,et al.(2011)Genomics.98(4):266-71.

Hawkins TL,et.al.(1995)Nucleic Acids Res.23:4742-4743.

Mainul Hoque et al.,(2012)Nature Methods 10(2):133-139.

Shepard PJ,et al.(2011)RNA 17:761-772.

Wendl MC and Wilson RK(2009)BMC Genomics 10:article 485.

Wilkening S,et al.(2013)Nucleic Acids Res.41(5):e65.

WO 98/044151

WO 02/059357

US 5705628

US 2011/0160078US 6406891 B1

EP 1371726 A1

WO 2013/038010 A2

Claims

1.从模板RNA分子产生核酸产物的方法，包含在获得模板RNA后

b)以模板特异性方式延伸所述第一寡核苷酸引物，由此获得第一延伸链，

c)去除RNA模板，

d)使一或多个另外的寡核苷酸引物与所述第一延伸链退火，

e)以模板特异性方式延伸所述一或多个另外的寡核苷酸引物而不置换与所述第一延伸链退火的引物，或使用破坏被置换的链的聚合酶，由此产生另外的延伸产物，

f)分离和/或扩增所述另外的延伸产物的延伸产物，其包含与所述第一寡核苷酸引物互补的延伸的核酸部分。

2.权利要求1的方法，其中所述预先选定的核酸区域是3’末端核酸区域，其优选包含poly-A尾。

3.权利要求1或2的方法，其中所述方法还包含将3’多核苷酸尾附着至模板RNA的3’末端的步骤，其中所述预先选定的3’末端核酸区域包含所述3’多核苷酸尾。

4.权利要求1-3任一项的方法，其中所述第一寡核苷酸引物和/或另外的寡核苷酸引物是DNA。

5.权利要求1-4任一项的方法，其中所述第一寡核苷酸引物和/或另外的寡核苷酸引物包含非退火序列标签或接头序列，其优选用于扩增引物的结合。

6.权利要求5的方法，其中所述非退火序列标签或接头序列包含条码，优选随机条码。

7.权利要求1-6任一项的方法，其中b)以模板特异性方式延伸第一寡核苷酸引物是通过逆转录，并且所述第一延伸链是DNA链。

8.权利要求1-7任一项的方法，其中c)去除RNA模板包含酶促RNA消化，优选通过RNase，碱性降解，优选通过NaOH处理，或在二价阳离子，优选Mn²⁺或Mg²⁺存在下加热。

9.权利要求1-8任一项的方法，其中所述一或多个另外的寡核苷酸引物包含随机引物和/或至少10个，优选至少20个，尤其优选至少100个不同的引物。

10.权利要求1-9任一项的方法，其中所述预先选定的核酸区域存在于一或多个感兴趣的模板RNA上。

11.权利要求1-10任一项的方法，其中所述一或多个另外的寡核苷酸引物每个均特异于一个模板RNA或其上的基因序列。

12.权利要求1-11任一项的方法，其中所述一或多个另外的寡核苷酸引物与一或多个感兴趣的RNA的特定区域退火。

13.权利要求1-12任一项的方法，其中e)以模板特异性方式延伸一或多个另外的寡核苷酸引物用缺少链置换活性的聚合酶，优选T7、T4或Q5DNA聚合酶进行，和/或使用对聚合酶引起的链置换具有抗性的引物，优选具有带有LNA或2’氟修饰的核苷酸的引物进行，和/或在群集剂，优选PEG存在下进行。

14.权利要求1-13任一项的方法，其中在第一引物退火前的模板RNA是片段化的。

15.权利要求1-14任一项的方法，其中步骤a)-e)在一个随后增加的流体体积或一个容器中进行。

16.权利要求1-15任一项的方法，还包含纯化步骤e)的延伸产物的步骤。

17.权利要求1-16任一项的方法，包含在另外的延伸产物上进行PCR，其使用特异于所述延伸产物的序列标签或接头序列的引物。

18.权利要求17的方法，其中至少一个PCR的引物包含另外的序列标签或接头序列。

19.试剂盒，适于进行权利要求1-18任一项的方法，包含逆转录酶，dNTP，聚合酶所需的辅因子或金属离子优选Mg²⁺的盐，引物，无链置换活性的DNA聚合酶例如T7、Q5或T4DNA聚合酶或破坏被置换的链的聚合酶，以及随机寡核苷酸引物。

20.权利要求19的试剂盒，还包含RNA降解剂和/或群集剂例如PEG。