CN116761885A

CN116761885A - 包含非天然核苷酸的多核苷酸的逆转录

Info

Publication number: CN116761885A
Application number: CN202180079118.6A
Authority: CN
Inventors: F·E·罗姆斯伯格; X·董; 周安晓珘
Original assignee: New Sox Co ltd; Scripps Research Institute
Current assignee: New Sox Co ltd; Scripps Research Institute
Priority date: 2020-10-23
Filing date: 2021-10-22
Publication date: 2023-09-15
Also published as: EP4232570A4; US20230392140A1; KR20230088898A; IL302243A; WO2022087475A1; TW202227100A; MX2023004690A; CA3196205A1; AU2021364920A9; JP2023547615A; AU2021364920A1; EP4232570A1

Abstract

本文公开了逆转录包含非天然核糖核苷酸的多核苷酸的方法，所述方法包括在存在包含非天然核碱基的非天然dNTP的情况下用逆转录酶逆转录所述多核苷酸，其中所述逆转录酶使其中掺入了所述非天然NTP的cDNA聚合。在一些实施方案中，所述多核苷酸以小于或等于约500nM的浓度存在，和/或所述多核苷酸是tRNA、mRNA、RNA适配体、或多种RNA适配体侯选物的成员。

Description

包含非天然核苷酸的多核苷酸的逆转录

相关申请的交叉引用

本申请要求2020年10月23日提交的美国临时专利申请号63/104,785的权益，将其通过引用以其整体并入本文以用于所有目的。

关于联邦资助研究的声明

本发明是在由美国国立卫生研究院授予的授权号GM118178下在美国政府支持下完成的。政府拥有本发明中的某些权利。

序列表

[0001.1]本申请含有已经以ASCII格式电子提交并且通过引用以其整体特此并入的序列表。2021年10月22日创建的所述ASCII副本命名为36271-812_601_SL.txt并且大小为12,499字节。

背景技术和发明内容

61个有义密码子/20个氨基酸遗传密码在其发现后被认为在所有生物体中是不变的、保守的。然而，深入的表征揭示了出乎意料的可塑性，其中密码子分配改变，甚至在极少数情况下扩展到包含非经典氨基酸(ncAA)硒代半胱氨酸或吡咯赖氨酸。(Yuan,J.等人FEBSLett.2010,584,342–349；Hao,B.等人Science 2002,296,1462–1466；Kryukov,G.V.等人Science 2003,300,1439–1443.)所有这些改变都是由天然密码子的重新分配引起的，并且类似的策略构成了重要努力的基础，所述重要努力是通过利用终止密码子和重新编码的阻抑tRNA/氨酰基tRNA合成酶(aaRS)的正交对来扩展密码子以包含目的ncAA。(Xiao,H.等人Cold Spring Harb.Perspect.Biol.2016,8；Wang,L.等人Annu.Rev.Biophys.Biomol.Struct.2006,35,225–249.)这些重新分配策略的替代方案是经由开发非天然碱基对(UBP)来聚焦于创造新的密码子。(Malyshev,D.A.等人,Nature 2014,509,385–388；Zhang,Y.等人Nature 2017,551,644–647.)最值得注意的是，包括(d)NaM-(d)TPT3 UBP(图1)在内的若干种UBP已被用于创建基于大肠杆菌(E.coli)的半合成生物体(SSO)，所述半合成生物体在其DNA中保留UBP，将它们转录至mRNA和tRNA中，并且当与用ncAA选择性地氨基酰化携带非天然反密码子的tRNA的aaRS一起提供时，利用它们翻译含有ncAA的蛋白质。

虽然(d)NaM-(d)TPT3 UBP能够产生非天然蛋白质，但掺入ncAA的效率取决于其序列背景，使得一些密码子比其他密码子更高效。通过检查序列背景，已经鉴定出许多密码子，所述密码子被有效地复制为DNA，然后被有效地转录为RNA并在核糖体上解码。(Fischer,E.C.等人Nat.Chem.Biol.2020,16,570–576.)由于对于在SSO的DNA中UBP的保留的测定是可用的，因此了解到几个效率较低的密码子的保真度降低是由较差的转录或较差的翻译引起的。然而，缺乏用于测量转录保真度的测定妨碍了对影响保真度的特定步骤的鉴定。此外，虽然清楚地知道不同的DNA聚合酶、T7 RNA聚合酶和大肠杆菌核糖体能够有效地识别UBP，但介导唯一其他常见的DNA/RNA转换的逆转录酶的能力尚未得到充分探索，并且唯一可用的数据表明它们可能无法有效地识别UBP。(Eggert等人,Towards ReverseTranscription with an Expanded Genetic Alphabet.Chembiochem2019,20,1642–1645.)因此，需要用于逆转录包含非天然核苷酸的多核苷酸的方法以及可以测定转录和逆转录的保真度的方法，后一种方法使得SSO ncAA掺入蛋白质中的保真度可以被理解为与转录和翻译的相对贡献有关。

此外，RNA寡核苷酸可以作为识别特定靶标(例如，用于抑制或检测靶标的目的)的适配体发挥作用。然而，从寡核苷酸文库(具有不同核苷酸序列的寡核苷酸的大型混合物)筛选和选择RNA适配体通常涉及将RNA转化为cDNA的逆转录步骤。因此，为了开发包含非天然核苷酸的RNA适配体，还需要逆转录包含非天然核酸的RNA的方法。

因此，提供了以下实施方案。实施方案1是一种逆转录包含非天然核糖核苷酸的多核苷酸的方法，所述方法包括在存在包含非天然核碱基的非天然dNTP的情况下用逆转录酶逆转录所述多核苷酸，

其中所述逆转录酶使cDNA聚合，所述非天然dNTP作为非天然核苷酸掺入所述cDNA中。

实施方案2是实施方案1所述的方法，其中：

所述多核苷酸以小于或等于约500nM的浓度存在。

实施方案2.1是前述实施方案中任一项所述的方法，其中所述逆转录酶是SuperScript III。

实施方案2.2是前述实施方案中任一项所述的方法，其中所述非天然dNTP不是dTPT3TP。

实施方案2.3是前述实施方案中任一项所述的方法，其中所述方法进一步包括使用识别所述非天然核苷酸的结合配偶体测量所述cDNA中的所述非天然核苷酸的量。

实施方案2.4是前述实施方案中任一项所述的方法，其中所述逆转录酶产生全长cDNA，并且至少25％的所述全长cDNA包含所述非天然核苷酸。

实施方案2.5是前述实施方案中任一项所述的方法，其中所述多核苷酸是tRNA、mRNA、RNA适配体、或多种RNA适配体侯选物的成员。

实施方案3是前述实施方案中任一项所述的方法，其中所述多核苷酸是RNA，任选地其中所述RNA是mRNA或tRNA。

实施方案4是实施方案1-3中任一项所述的方法，所述方法进一步包括测量所述cDNA中的所述非天然核苷酸的量。

实施方案5是一种测量非天然核苷酸的掺入的方法，所述方法包括：

a.在存在包含第一非天然核碱基的非天然NTP的情况下用RNA聚合酶转录包含非天然脱氧核糖核苷酸的多核苷酸以产生包含第一非天然核苷酸的RNA；

b.在存在包含第二非天然核碱基的非天然dNTP的情况下用逆转录酶逆转录所述RNA，其中所述逆转录酶使cDNA聚合，所述非天然NTP作为第二非天然核苷酸掺入所述cDNA中；以及

c.测量所述cDNA中的所述第二非天然核苷酸的量。

实施方案5.1是实施方案5所述的方法，所述方法是测量转录和逆转录的组合保真度的方法。

实施方案5.2是实施方案5所述的方法，所述方法是测量在转录和逆转录期间非天然核苷酸的保留的方法。

实施方案6是实施方案5-5.2中任一项所述的方法，其中所述转录步骤是在体内进行的。

实施方案7是前一项实施方案所述的方法，其中所述转录步骤是在原核生物或细菌中进行的。

实施方案8是前一项实施方案所述的方法，其中所述转录步骤是在大肠杆菌中进行的。

实施方案9是实施方案5所述的方法，其中所述转录步骤是在体外进行的。

实施方案10是实施方案5-9中任一项所述的方法，其中所述cDNA分子中的所述第二非天然核苷酸的量是相对于转录前所述多核苷酸中的所述非天然脱氧核糖核苷酸的量进行测量的。

实施方案11是实施方案5-10中任一项所述的方法，其中所述测量包括：

a.在转录前对所述多核苷酸进行生物素移位测定以测定转录前含有所述非天然核苷酸的多核苷酸的比例；以及

b.对所述cDNA进行生物素移位测定以测定含有所述非天然核苷酸的cDNA的比例。

实施方案12是实施方案4-10中任一项所述的方法，其中所述cDNA中的所述非天然核苷酸或所述第二非天然核苷酸的量是使用结合非天然核碱基的结合配偶体测量的。

实施方案13是实施方案4-10中任一项所述的方法，其中测量所述cDNA中的所述非天然核苷酸或所述第二非天然核苷酸的量包括凝胶移位测定或生物素移位测定。

实施方案14是前一项实施方案所述的方法，其中所述生物素移位测定包括：

a.在存在与所述cDNA中的所述非天然核苷酸配对的包含生物素化核碱基的非天然dNTP的情况下扩增所述cDNA；

b.将包含所述生物素化核苷酸的DNA扩增产物与不包含所述生物素化核苷酸的DNA扩增产物分离；以及

c.测量包含所述生物素化核苷酸的DNA扩增产物和不包含所述生物素化核苷酸的DNA扩增产物的量，或包含所述生物素化核苷酸的DNA扩增产物与不包含所述生物素化核苷酸的DNA扩增产物的比率，或含有所述非天然核苷酸的cDNA的比例。

实施方案15是前一项实施方案所述的方法，其中将包含所述生物素化核苷酸的DNA扩增产物与不包含所述生物素化核碱基的DNA扩增产物分离包括凝胶电泳，任选地其中所述凝胶电泳是聚丙烯酰胺凝胶电泳。

实施方案16是实施方案14-15中任一项所述的方法，其中将包含所述生物素化核苷酸的DNA扩增产物与不包含所述生物素化核苷酸的DNA扩增产物分离包括将所述扩增产物与链霉亲和素一起孵育。

实施方案17是前述实施方案中任一项所述的方法，其中所述RNA或多核苷酸在逆转录期间以小于或等于约1μM的浓度存在。

实施方案18是前述实施方案中任一项所述的方法，其中所述RNA或多核苷酸在逆转录期间以约1-10nM、约10-20nM、约20-30nM、约30-40nM、约40-50nM、约50-75nM、约75-100nM、约100-150nM、约150-200nM、约200-300nM、约300-400nM或约400-500nM范围内的浓度存在。

实施方案19是前述实施方案中任一项所述的方法，其中所述逆转录酶产生全长cDNA，并且其中至少25％的所述全长cDNA包含所述非天然核苷酸。

实施方案20是前一项实施方案所述的方法，其中至少50％、75％、80％、85％、90％、95％、97％、98％或99％的所述未截短的cDNA包含所述非天然核苷酸。

实施方案21是前述实施方案中任一项所述的方法，其中包含所述非天然核糖核苷酸的RNA或多核苷酸是mRNA。

实施方案22是实施方案20所述的方法，其中所述非天然核糖核苷酸(X或Y)位于所述mRNA的密码子的第一位置(X-N-N或Y-N-N)。

实施方案23是实施方案20所述的方法，其中所述非天然核糖核苷酸(X或Y)位于所述mRNA的密码子的中间位置(N-X-N或N-Y-N)。

实施方案24是实施方案20所述的方法，其中所述非天然核糖核苷酸(X或Y)位于所述mRNA的密码子的最后位置(N-N-X或N-N-Y)。

实施方案25是实施方案51-25中任一项所述的方法，其中所述mRNA中含有所述非天然核糖核苷酸的密码子是AXC、AYC、GXC、GYC、GXT、GYT、AXA、AXT、TXA或TXT。

实施方案26是实施方案1-20中任一项所述的方法，其中包含所述非天然核糖核苷酸的RNA或多核苷酸是tRNA。

实施方案27是实施方案26所述的方法，其中所述非天然核糖核苷酸(X或Y)位于所述tRNA的反密码子的第一位置(X-N-N或Y-N-N)。

实施方案28是实施方案26所述的方法，其中所述非天然核糖核苷酸(X或Y)位于所述tRNA的反密码子的中间位置(N-X-N或N-Y-N)。

实施方案29是实施方案26所述的方法，其中所述非天然核糖核苷酸(X或Y)位于所述tRNA的反密码子的最后位置(N-N-X或N-N-Y)。

实施方案30是实施方案26-29中任一项所述的方法，其中所述tRNA的反密码子是GYT、GXT、GYC、GXC、CYA、CXA、AYC或AXC。

实施方案31是实施方案1-30中任一项所述的方法，其中所述非天然核糖核苷酸是X，其中X包含作为所述非天然核糖核苷酸的核碱基(NaM)。

实施方案32是实施方案1-30中任一项所述的方法，其中所述非天然核糖核苷酸是Y，其中Y包含作为所述非天然核糖核苷酸的核碱基(TPT3)。

实施方案33是实施方案1-20或31-32中任一项所述的方法，其中所述RNA是RNA适配体。

实施方案34是一种筛选RNA适配体候选物的方法，所述方法包括：

a.将多种不同的RNA寡核苷酸与靶标一起孵育，其中所述RNA寡核苷酸包含至少一个非天然核苷酸；

b.对所述多种RNA寡核苷酸中与所述靶标结合的RNA寡核苷酸进行至少一轮选择；

c.分离与所述靶标结合的富集的RNA寡核苷酸，其中所述分离的富集的RNA寡核苷酸包含RNA适配体；以及

d.将所述RNA适配体中的一种或多种逆转录成cDNA，其中所述cDNA在与所述RNA适配体中的所述至少一个非天然核苷酸互补的位置处包含非天然脱氧核糖核苷酸，从而提供对应于所述RNA适配体的cDNA分子的文库。

实施方案35是前一项实施方案所述的方法，其中所述多种不同的RNA寡核苷酸包含随机化核苷酸区域。

实施方案36是前一项实施方案所述的方法，其中所述随机化核苷酸区域包含所述至少一个非天然核苷酸。

实施方案37是实施方案34-36中任一项所述的方法，其中所述RNA寡核苷酸包含条形码序列和/或引物结合序列。

实施方案38是实施方案34-37中任一项所述的方法，其中所述方法进一步包括对所述cDNA分子测序。

实施方案39是实施方案34-38中任一项所述的方法，其中进行至少一轮选择包括洗涤步骤以去除未结合或弱结合的RNA寡核苷酸。

实施方案40是实施方案34-39中任一项所述的方法，其中所述方法进一步包括使所述cDNA分子的序列突变以产生多个另外的序列。

实施方案41是前一项实施方案所述的方法，其中将所述多个另外的序列转录成RNA，并对与所述靶标结合的RNA适配体再进行至少一轮选择。

实施方案42是实施方案40-41中任一项所述的方法，其中使所述cDNA分子的序列突变包括易错PCR。

实施方案43是实施方案34-42中任一项所述的方法，其中所述方法进一步包括在另外一轮选择中增加与所述靶标结合的选择压力。

实施方案44是前一项实施方案所述的方法，其中增加选择压力包括在比前一轮更高的盐浓度下进行一个或多个洗涤步骤和/或在所述选择期间包括结合竞争物。

实施方案45是实施方案34-44中任一项所述的方法，所述方法进一步包括分析所述RNA适配体结合所述靶标的能力。

实施方案46是前一项实施方案所述的方法，其中分析所述RNA适配体结合所述靶标的能力包括测定K_d、k_on或k_off。

实施方案47是实施方案34-44中任一项所述的方法，所述方法进一步包括分析所述RNA适配体使所述靶标激动(agonize)的能力。

实施方案48是前一项实施方案所述的方法，其中分析所述RNA适配体使所述靶标激动的能力包括测定EC₅₀值。

实施方案49是实施方案34-44中任一项所述的方法，所述方法进一步包括分析所述RNA适配体拮抗所述靶标的能力。

实施方案50是前一项实施方案所述的方法，其中分析所述RNA适配体拮抗所述靶标的能力包括测定K_i或IC₅₀值。

实施方案51是前述实施方案中任一项所述的方法，其中至少一个非天然核苷酸包含：

实施方案52是前一项实施方案所述的方法，其中所述经历逆转录的多核苷酸中的至少一个非天然核苷酸包含：

实施方案53是实施方案51或52所述的方法，其中掺入cDNA中的至少一个非天然核苷酸包含：

并且任选地其中所述非天然核苷酸中的至少一个非天然核碱基不同于所述经历逆转录的多核苷酸中的至少一个非天然核碱基。

实施方案54是实施方案51-53中任一项所述的方法，其中所述至少一个非天然核苷酸包含：

实施方案55是实施方案51-53所述的方法，其中所述至少一个非天然核苷酸包含：

实施方案56是前述实施方案中任一项所述的方法，其中所述逆转录酶是禽成髓细胞瘤病毒(AMV)逆转录酶、莫洛尼氏鼠白血病病毒(MMLV)逆转录酶、Super Script II(SSII)逆转录酶、Super Script III(SS III)逆转录酶、Super Script IV(SS IV)逆转录酶或Volcano 2G(V2G)逆转录酶。

实施方案57是前述实施方案中任一项所述的方法，其中所述逆转录酶是SuperScript III。

实施方案58是前述实施方案中任一项所述的方法，其中所述非天然dNTP不是dTPT3TP。

实施方案59是前述实施方案中任一项所述的方法，其中所述逆转录发生在体外。

附图说明

本公开文本的不同方面在随附权利要求书中具体阐述。将通过参考陈述利用本公开文本原理的说明性实施方案的以下具体实施方式和附图获得对本公开文本的特征和优点的更好的理解，在所述附图中：

图1显示了dNAM与dTPT3之间以及NaM与TPT3之间的非天然碱基对。

图2显示了在不同逆转录(RT)反应条件下用于cDNA检测和cDNA的定性生物素移位的变性凝胶。

图3显示了使用SuperScript III获得的在RT反应中随RNA浓度而变的全长cDNA比率。

图4显示了用于测量非天然核苷酸保留的示例性转录-逆转录(T-RT)过程的示意图。

图5A-图5B显示了包含所指示密码子的序列在T-RT保留测定中的保真度水平。

图6显示了用于在不同密码子和反密码子情况下的cDNA检测的变性凝胶的图像。

图7A-图7B显示了来自包含所指示密码子的序列的体内翻译实验的mRNA的T-RT保留(其中先前报告的蛋白质移位值(如果有的话)显示在下方)。

图8A-图8B分别显示了在体内翻译实验中mRNA转录保真度对NaMTP浓度或TPT3TP浓度的依赖性。

具体实施方式

定义

除非另外定义，否则本文中使用的所有技术术语和科学术语具有与要求保护的主题所属领域的技术人员通常所理解的相同的含义。应理解，前述一般说明和以下具体实施方式只是示例性和解释性的，并且不限制要求保护的任何主题。在本申请中，除非另外明确陈述，否则单数的使用包括复数含义。必须指出，如在说明书和所附权利要求书中所用，单数形式“一个/一种(a)”、“一个/一种(an)”和“所述(the)”包括复数指示物，除非上下文另外清楚地规定。在本申请中，除非另外陈述，否则“或”的使用意指“和/或”。此外，术语“包括(including)”以及其他形式如“包括(include)”、“包括(includes)”和“包括(included)”的使用是非限制性的。

如本文所用，范围和数量可以表示为“约”特定值或范围。约也包括确切的量。因此，“约5μL”意指“约5μL”以及“5μL”。通常，术语“约”包括可预期在实验误差内的量。

如本文所用的术语化学结构的“类似物”是指与母体结构保持基本相似性但它可能不容易从母体结构合成得到的化学结构。在一些实施方案中，核苷酸类似物是非天然核苷酸。在一些实施方案中，核苷类似物是非天然核苷。容易从母体化学结构合成得到的相关化学结构称为“衍生物”。

核苷酸由核碱基、糖和至少一个磷酸组成。因此，核苷酸可以指三磷酸核苷即RNA和DNA聚合酶的底物、二磷酸核苷或组成DNA和RNA的单磷酸核苷。核苷酸包括天然存在的核苷酸或非天然核苷酸(即核苷酸类似物)。天然存在的核苷酸包括在天然存在的DNA或RNA中发现的核苷酸，包括天然存在的脱氧核糖核苷酸和核糖核苷酸。非天然核苷酸与天然核苷酸中的核碱基、糖和/或磷酸部分存在某种类型的差异。经修饰的核苷酸包含以下中的一种或多种的修饰：3'OH或5'OH基团、骨架、糖组分或核碱基，和/或非天然存在的接头分子的添加。非天然核苷酸包括DNA或RNA类似物(例如，含有核碱基类似物、糖类似物和/或非天然骨架等)

在一些实施方案中，核苷是包含核碱基部分和糖部分的化合物。核苷包括但不限于天然存在的核苷(对应于在DNA和RNA中发现的核苷酸)、经修饰的核苷和具有模拟核碱基和/或糖基团的核苷。核苷包括包含任何种类的取代基的核苷。核苷可以是通过核碱基与糖的还原基团之间的糖苷连接形成的糖苷化合物。

“核碱基”通常是核苷的杂环部分，并且可以是芳香族的或部分不饱和的。核碱基不包括核苷或核苷酸的糖组分(例如核糖、脱氧核糖或其类似物；也称为经修饰的糖的糖类似物的例子在本文其他地方描述)。核碱基可以是天然存在的，可以是修饰的，可以与天然核碱基没有相似性，和/或可以是合成的，例如通过有机合成而合成。在某些实施方案中，核碱基包含能够在使用或不使用氢键的情况下与另一核酸的核碱基相互作用的任何原子或原子组。在某些实施方案中，非天然核碱基不是源自天然核碱基。应注意的是，非天然核碱基不一定具有碱基特性；但是为了简单起见，它们称为核碱基。在一些实施方案中，当提及核碱基时，“(d)”指示核碱基可以附接至脱氧核糖或核糖。核碱基通常也被称为碱基。

在一些实施方案中，如本公开文本所述的非天然mRNA密码子和非天然tRNA反密码子可以按照它们的DNA编码序列来书写。例如，非天然tRNA反密码子可以书写为GYU或GYT。

如本文所用的术语，“多核苷酸”是指DNA、RNA、DNA样或RNA样聚合物(如肽核酸(PNA)、锁核酸(LNA)、硫代磷酸酯、非天然碱基等)，其例子是本领域熟知的。多核苷酸可以在自动合成仪中合成，例如，使用亚磷酰胺化学或适于合成仪使用的其他化学途径。

“DNA”包括但不限于cDNA和基因组DNA。DNA可以通过共价或非共价方式附接至另一个生物分子(包括但不限于RNA或肽)。“RNA”包括编码RNA，例如信使RNA(mRNA)。在一些实施方案中，RNA是rRNA、RNAi、snoRNA、微小RNA、siRNA、snRNA、exRNA、piRNA、长ncRNA或其任何组合或杂合体。在一些实例中，RNA是核酶的组分。DNA和RNA可以呈任何形式，包括但不限于线性、环状、超螺旋、单链和双链。

“mRNA”是包含能够被核糖体翻译的ORF的RNA。

“tRNA”是能够携带天然氨基酸或ncAA并参与通过核糖体翻译mRNA的RNA。

肽核酸(PNA)是合成的DNA/RNA类似物，其中肽样骨架替代了DNA或RNA的糖-磷酸酯骨架。PNA寡聚物在结合互补DNA时显示出更高的结合强度和更高的特异性，其中PNA/DNA碱基错配与DNA/DNA双链体中的类似错配相比导致更不稳定化。这种结合强度和特异性也适用于PNA/RNA双链体。PNA不容易被核酸酶或蛋白酶识别，使得它们对酶降解具有抗性。PNA在宽pH范围内也是稳定的。还参见Nielsen PE,Egholm M,Berg RH,Buchardt O(1991年12月).“Sequence-selective recognition of DNA by strand displacement with athymine-substituted polyamide”,Science 254(5037):1497–500.doi:10.1126/science.1962210.PMID 1962210；以及Egholm M,Buchardt O,Christensen L,Behrens C,Freier SM,Driver DA,Berg RH,Kim SK,Nordén B,和Nielsen PE(1993),"PNAHybridizes to Complementary Oligonucleotides Obeying the Watson-CrickHydrogen Bonding Rules".Nature 365(6446):566–8.doi:10.1038/365566a0.PMID7692304

锁核酸(LNA)是修饰的RNA核苷酸，其中LNA核苷酸的核糖部分用连接2'氧和4'碳的额外桥进行修饰。所述桥将核糖“锁定”在3'-内(北)构象中，这通常在A型双链体中发现。只要希望，LNA核苷酸可以与寡核苷酸中的DNA或RNA残基混合。此类寡聚物可以化学合成并且是可商购的。锁核糖构象增强了核碱基堆积和骨架预组织。参见例如，Kaur,H；Arora,A；Wengel,J；Maiti,S(2006),"Thermodynamic,Counterion,and Hydration Effects forthe Incorporation of Locked Nucleic Acid Nucleotides into DNA Duplexes",Biochemistry 45(23):7347–55.doi:10.1021/bi060307w.PMID 16752924；Owczarzy R.；You Y.,Groth C.L.,Tataurov A.V.(2011),"Stability and mismatch discriminationof locked nucleic acid-DNA duplexes.",Biochem.50(43):9352–9367.doi:10.1021/bi200904e.PMC 3201676.PMID 21928795；Alexei A.Koshkin；Sanjay K.Singh,PoulNielsen,Vivek K.Rajwanshi,Ravindra Kumar,Michael Meldgaard,Carl Erik Olsen,Jesper Wengel(1998),"LNA(Locked Nucleic Acids):Synthesis of the adenine,cytosine,guanine,5-methylcytosine,thymine and uracil bicyclonucleosidemonomers,oligomerisation,and unprecedented nucleic acid recognition",Tetrahedron 54(14):3607–30.doi:10.1016/S0040-4020(98)00094-5；以及SatoshiObika；Daishu Nanbu,Yoshiyuki Hari,Ken-ichiro Morio,Yasuko In,ToshimasaIshida,Takeshi Imanishi(1997),"Synthesis of 2'-O,4'-C-methyleneuridine and-cytidine.Novel bicyclic nucleosides having a fixed C3'-endo sugar puckering",Tetrahedron Lett.38(50):8735–8.doi:10.1016/S0040-4039(97)10322-7。

“适配体”是指可以特异性结合(例如以高亲和力)靶标的寡核苷酸。适配体可以包括RNA，并且可以包含天然或非天然核苷酸。

如本文所用，“全长”意指多核苷酸(如cDNA)相对于模板化其合成的互补序列(模板多核苷酸)是未截短的。当模板多核苷酸包含非天然核苷酸，全长多核苷酸包含与模板多核苷酸中非天然核苷酸互补的位置中的核苷酸及其3'端的其他核苷酸。全长多核苷酸与截短的多核苷酸形成对照，所述截短的多核苷酸是通过在完成之前(例如，在与模板多核苷酸中的非天然核苷酸互补的位置处或附近)终止合成而产生的。

本文所用的章节标题仅用于组织目的，而不应解释为限制所描述的主题。

逆转录包含非天然核糖核苷酸的多核苷酸的方法

本文公开了逆转录包含非天然核糖核苷酸的多核苷酸的方法。在此类方法中，可以在存在包含非天然核碱基的非天然dNTP的情况下用逆转录酶逆转录多核苷酸。逆转录酶使掺入了非天然NTP(例如，在cDNA中的与在多核苷酸中非天然核糖核苷酸的位置互补的位置中)的cDNA聚合。

在一些实施方案中，所述多核苷酸以小于或等于约500nM的浓度存在。在一些实施方案中，所述RNA或多核苷酸在逆转录期间以约1-10nM、约10-20nM、约20-30nM、约30-40nM、约40-50nM、约50-75nM、约75-100nM、约100-150nM、约150-200nM、约200-300nM、约300-400nM或约400-500nM范围内的浓度存在。在一些实施方案中，所述浓度是为或低于约100nM，例如约5-100nM，如约10-100nM。在一些实施方案中，所述浓度是为或低于约50nM，例如约5-50nM，如约10-50nM。在一些实施方案中，所述浓度是为或低于约30nM，例如约5-30nM，如约10-30nM。如实施例中所述，使用比先前尝试逆转录包含非天然核苷酸的多核苷酸时更低的浓度可以改善逆转录反应的性能。

在所公开的方法中可以使用可商购的逆转录酶。在一些实施方案中，所述逆转录酶是禽成髓细胞瘤病毒(AMV)逆转录酶、莫洛尼氏鼠白血病病毒(MMLV)逆转录酶、SuperScript II(SS II)逆转录酶、Super Script III(SS III)逆转录酶、Super Script IV(SSIV)逆转录酶或Volcano 2G(V2G)逆转录酶。在一些实施方案中，所述逆转录酶是SuperScript III(例如，可从ThermoFisher Scientific获得，目录号18080093)。SuperScript III是基因工程化MMLV逆转录酶，其是通过引入若干个突变以降低RNA酶H活性、增加半衰期和提高热稳定性而产生。

包含非天然核糖核苷酸的多核苷酸可以是用于逆转录酶的任何合适的底物，例如RNA、RNA-DNA融合物或DNA。已知除了RNA外，逆转录酶还接受DNA或RNA-DNA杂合体作为底物。在一些实施方案中，包含非天然核糖核苷酸的多核苷酸是RNA。例如，所述RNA可以是mRNA。在另一个例子中，所述RNA可以是tRNA。在又一个例子中，所述RNA可以是RNA适配体或多种适配体候选物(通常称为“文库”)的成员，例如，其中多种适配体候选物在相同或不同的反应容器或室中经历逆转录。任何前述实施方案中的多核苷酸可以除非天然核苷酸之外还包含其他修饰；例如，可以存在这样的非天然核苷酸，其包含非天然核碱基并且在相同和/或其他核苷酸位置包含对核碱基或一个或多糖和/或磷酸的修饰。

在RNA是mRNA的情况下，所述非天然核糖核苷酸可以位于密码子中。所述非天然核苷酸可以出现在密码子的第一、第二或第三位置。示例性密码子是AXC、AYC、GXC、GYC、GXT、GYT、AXA、AXT、TXA或TXT，其中非天然核糖核苷酸可以用X或Y表示。在一些实施方案中，X包含作为非天然核糖核苷酸的核碱基(NaM；为了清楚起见，在此处和全文仅显示了非天然脱氧或核糖核苷酸/核苷的核碱基部分)和/或Y包含作为非天然核糖核苷酸的核碱基(TPT3)。

在RNA是tRNA的情况下，所述非天然核糖核苷酸可以位于tRNA的反密码子中。所述非天然核苷酸可以出现在反密码子的第一、第二或第三位置。示例性反密码子是GYT、GXT、GYC、GXC、CYA、CXA、AYC或AXC，其中非天然核糖核苷酸可以由X或Y表示。在一些实施方案中，X包含作为非天然核糖核苷酸的核碱基(NaM)和/或Y包含作为不天然核糖核苷酸的核碱基(TPT3)。

各种非天然核碱基是已知的，并且可以用作dNTP和/或非天然核糖核苷酸中的非天然核碱基。在一些实施方案中，所述非天然核碱基独立地选自：

在一些实施方案中，所述非天然dNTP不是dTPT3TP。

在一些实施方案中，所述非天然核碱基选自以下所示的那些，其中波浪线或R标识与糖(例如，脱氧核糖或核糖)的附接点：

在一些实施方案中，所述核碱基包含以下结构：

其中每个X独立地是碳或氮；R₂是任选的并且当存在时独立地是氢、烷基、烯基、炔基；甲氧基、甲烷硫醇、甲烷硒基、卤素、氰基或叠氮基基团；其中每个Y独立地是硫、氧、硒或仲胺；其中每个E独立地是氧、硫或硒；并且其中波浪线指示与核糖基、脱氧核糖基或二脱氧核糖基部分或其类似物的键合点，其中所述核糖基、脱氧核糖基或二脱氧核糖基部分或其类似物呈游离形式、连接至单磷酸酯、二磷酸酯或三磷酸酯基团(任选地包含α-硫代三磷酸酯、β-硫代三磷酸酯或γ-硫代三磷酸酯基团)，或被包括在RNA或DNA中或在RNA类似物或DNA类似物中。在一些实施方案中，R₂是低级烷基(例如，C₁-C₆)、氢或卤素。在本文所述的核碱基的一些实施方案中，R₂是氟。在本文所述的核碱基的一些实施方案中，X是碳。在本文所述的核碱基的一些实施方案中，E是硫。在本文所述的核碱基的一些实施方案中，Y是硫。在本文所述的核碱基的一些实施方案中，核碱基具有结构：在本文所述的核碱基的一些实施方案中，E是硫并且Y是硫。在本文所述的核碱基的一些实施方案中，波浪线指示与核糖基或脱氧核糖基部分键合的点。在本文所述的核碱基的一些实施方案中，波浪线指示与核糖基或脱氧核糖基部分键合的点，所述核糖基或脱氧核糖基部分与三磷酸酯基团连接。

在一些实施方案中，所述核碱基是核酸聚合物的组分。在一些实施方案中，所述核碱基是tRNA的组分。在一些实施方案中，所述核碱基是tRNA中的反密码子的组分。在一些实施方案中，所述核碱基是mRNA的组分。在一些实施方案中，所述核碱基是mRNA的密码子的组分。在一些实施方案中，所述核碱基是RNA或DNA的组分。在一些实施方案中，所述核碱基是DNA中的密码子的组分。在一些实施方案中，所述核碱基与另一个互补核碱基形成核碱基对。

非天然核碱基的另外的例子包括2-硫尿嘧啶，2'-脱氧尿嘧啶，4-硫尿嘧啶，尿嘧啶-5-基，次黄嘌呤-9-基(I)，5-卤代尿嘧啶，5-丙炔基尿嘧啶，6-偶氮脲嘧啶，5-甲基氨基甲基尿嘧啶，5-甲氧基氨基甲基-2-硫尿嘧啶，假尿嘧啶，尿嘧啶-5-氧乙酸甲酯，尿嘧啶-5-氧乙酸，5-甲基-2-硫脲嘧啶，3-(3-氨基-3-N-2-羧丙基)尿嘧啶，5-甲基-2-硫尿嘧啶，4-硫尿嘧啶，5-甲基尿嘧啶，5'-甲氧基羧甲基尿嘧啶，5-甲氧基尿嘧啶，尿嘧啶-5-氧基乙酸，5-(羧基羟基甲基)尿嘧啶，5-羧甲基氨基甲基-2-硫尿嘧啶，5-羧甲基氨基甲基尿嘧啶，二氢尿嘧啶，5-羟甲基胞嘧啶，5-三氟甲基胞嘧啶，5-卤代胞嘧啶，5-丙炔基胞嘧啶，5-羟基胞嘧啶，环胞嘧啶，阿糖胞苷，5,6-二氢胞嘧啶，5-硝基胞嘧啶，6-偶氮胞嘧啶，氮杂胞嘧啶，N4-乙基胞嘧啶，3-甲基胞嘧啶，5-甲基胞嘧啶，4-乙酰基胞嘧啶，2-硫胞嘧啶，吩噁嗪胞苷([5,4-b][l,4]苯并噁嗪-2(3H)-酮)，吩噻嗪胞苷(1H-嘧啶并[5,4-b][l,4]苯并噻嗪-2(3H)-酮)，吩噁嗪胞苷(9-(2-氨基乙氧基)-H-嘧啶并[5,4-b][l,4]苯并噁嗪-2(3H)-酮)，咔唑胞苷(2H-嘧啶并[4,5-b]吲哚-2-酮)，吡啶并吲哚胞苷(H-吡啶并[3',2':4,5]吡咯并[2,3-d]嘧啶-2-酮)，2-氨基腺嘌呤，2-丙基腺嘌呤，2-氨基腺嘌呤，2-F-腺嘌呤，2-氨基丙基腺嘌呤，2-氨基-2'-脱氧腺苷，3-脱氮腺嘌呤，7-甲基腺嘌呤，7-脱氮腺嘌呤，8-氮杂腺嘌呤，8-卤代、8-氨基、8-硫醇、8-硫代烷基和8-羟基取代的腺嘌呤，N6-异戊烯基腺嘌呤，2-甲基腺嘌呤，2,6-二氨基嘌呤，2-甲基-N6-异戊烯基腺嘌呤，6-氮杂腺嘌呤，2-甲基鸟嘌呤，鸟嘌呤的2-丙基和烷基衍生物，3-脱氮鸟嘌呤，6-硫代鸟嘌呤，7-甲基鸟嘌呤，7-脱氮鸟氨酸，7-脱氮鸟苷，7-脱氮-8-氮杂鸟嘌呤，8-氮杂鸟氨酸，8-卤代、8-氨基、8-硫醇、8-硫代烷基和8-羟基取代的鸟嘌呤，1-甲基鸟嘌呤，2,2-二甲基鸟嘌呤，7-甲基鸟嘌呤，6-氮杂鸟嘌呤，次黄嘌呤，黄嘌呤，1-甲基肌苷，辫苷(queosine)，β-D-半乳糖基辫苷，肌苷，β-D-甘露糖基辫苷，怀丁氧苷(wybutoxosine)，羟基脲，(acp3)w，2-氨基吡啶或2-吡啶酮。

在一些实施方案中，所述非天然核碱基选自尿嘧啶-5-基、次黄嘌呤-9-基(I)、2-氨基腺嘌呤-9-基、5-甲基胞嘧啶(5-me-C)、5-羟甲基胞嘧啶、黄嘌呤、次黄嘌呤、2-氨基腺嘌呤、腺嘌呤和鸟嘌呤的6-甲基衍生物和其他烷基衍生物、腺嘌呤和鸟嘌呤的2-丙基衍生物和其他烷基衍生物、2-硫尿嘧啶、2-硫胸腺嘧啶和2-硫胞嘧啶、5-卤代尿嘧啶和胞嘧啶、5-丙炔基尿嘧啶和胞嘧啶、6-偶氮基尿嘧啶、胞嘧啶和胸腺嘧啶、5-尿嘧啶(假尿嘧啶)、4-硫尿嘧啶、8-卤代、8-氨基、8-巯基、8-硫烷基、8-羟基和其他8-取代的腺嘌呤和鸟嘌呤、5-卤素(具体地，5-溴)、5-三氟甲基和其他5-取代的尿嘧啶和胞嘧啶、7-甲基鸟嘌呤和7-甲基腺嘌呤、8-氮杂鸟嘌呤和8-氮杂腺嘌呤、7-脱氮鸟嘌呤和7-脱氮腺嘌呤以及3-脱氮鸟嘌呤和3-脱氮腺嘌呤。某些非天然核酸，如5-取代的嘧啶、6-氮杂嘧啶和N-2取代的嘌呤、N-6取代的嘌呤、O-6取代的嘌呤、2-氨基丙基腺嘌呤、5-丙炔基尿嘧啶、5-丙炔基胞嘧啶、5-甲基胞嘧啶、增加双链体形成的稳定性的那些、通用核酸、疏水核碱基、混杂核碱基、尺寸扩展的核碱基、氟化核碱基、5-取代的嘧啶、6-氮杂嘧啶以及N-2、N-6和O-6取代的嘌呤，包括2-氨基丙基腺嘌呤、5-丙炔基尿嘧啶和5-丙炔基胞嘧啶。5-甲基胞嘧啶(5-me-C)，5-羟甲基胞嘧啶，黄嘌呤，次黄嘌呤，2-氨基腺嘌呤，腺嘌呤和鸟嘌呤的6-甲基、其他烷基衍生物，腺嘌呤和鸟嘌呤的2-丙基和其他烷基衍生物，2-硫尿嘧啶，2-硫胸腺嘧啶和2-硫胞嘧啶，5-卤代尿嘧啶，5-卤代胞嘧啶，5-丙炔基(-C≡C-CH₃)尿嘧啶，5-丙炔基胞嘧啶，嘧啶核酸的其他炔基衍生物，6-偶氮基尿嘧啶，6-偶氮基胞嘧啶，6-偶氮基胸腺嘧啶，5-尿嘧啶(假尿嘧啶)，4-硫尿嘧啶，8-卤代、8-氨基、8-硫醇、8-硫烷基、8-羟基和其他8-取代的腺嘌呤和鸟嘌呤，5-卤代(特别是5-溴)、5-三氟甲基、其他5-取代的尿嘧啶和胞嘧啶，7-甲基鸟嘌呤，7-甲基腺嘌呤，2-F-腺嘌呤，2-氨基-腺嘌呤，8-氮杂鸟嘌呤，8-氮杂腺嘌呤，7-脱氮鸟嘌呤，7-脱氮腺嘌呤，3-脱氮鸟嘌呤，3-脱氮腺嘌呤，三环嘧啶，吩噁嗪胞苷([5,4-b][l,4]苯并噁嗪-2(3H)-酮)，吩噻嗪胞苷(1H-嘧啶并[5,4-b][l,4]苯并噻嗪-2(3H)-酮)，G-夹，吩噁嗪胞苷(例如9-(2-氨基乙氧基)-H-嘧啶并[5,4-b][l,4]苯并噁嗪-2(3H)-酮)，咔唑胞苷(2H-嘧啶并[4,5-b]吲哚-2-酮)，吡啶并吲哚胞苷(H-吡啶并[3',2':4,5]吡咯并[2,3-d]嘧啶-2-酮)，其中嘌呤或嘧啶核碱基被其他杂环替代的那些，7-脱氮-腺嘌呤，7-脱氮鸟嘌呤，2-氨基吡啶，2-吡啶酮，氮杂胞嘧啶，5-溴胞嘧啶，溴尿嘧啶，5-氯胞嘧啶，氯代胞嘧啶，环胞嘧啶，胞嘧啶阿拉伯糖苷，5-氟胞嘧啶，氟嘧啶，氟尿嘧啶，5,6-二氢胞嘧啶，5-碘胞嘧啶，羟基脲，碘尿嘧啶，5-硝基胞嘧啶，5-溴尿嘧啶，5-氯尿嘧啶，5-氟尿嘧啶和5-碘尿嘧啶，2-氨基-腺嘌呤，6-硫代-鸟嘌呤，2-硫代-胸腺嘧啶，4-硫代-胸腺嘧啶，5-丙炔基-尿嘧啶，4-硫代-尿嘧啶，N4-乙基胞嘧啶，7-脱氮鸟嘌呤，7-脱氮-8-氮杂鸟嘌呤，5-羟基胞嘧啶，2'-脱氧尿苷，2-氨基-2'-脱氧腺苷，以及描述于以下文献中的那些：美国专利号3,687,808；4,845,205；4,910,300；4,948,882；5,093,232；5,130,302；5,134,066；5,175,273；5,367,066；5,432,272；5,457,187；5,459,255；5,484,908；5,502,177；5,525,711；5,552,540；5,587,469；5,594,121；5,596,091；5,614,617；5,645,985；5,681,941；5,750,692；5,763,588；5,830,653和6,005,096；WO 99/62923；Kandimalla等人,(2001)Bioorg.Med.Chem.9:807-813；The ConciseEncyclopedia of Polymer Science and Engineering,Kroschwitz,J.I.编辑,JohnWiley&Sons,1990,858-859；Englisch等人,Angewandte Chemie,International Edition,1991,30,613；和Sanghvi,第15章,Antisense Research and Applications,Crooke和Lebleu编辑,CRC Press,1993,273-288。另外的核碱基修饰可以在例如以下文献中找到：美国专利号3,687,808；Englisch等人,Angewandte Chemie,International Edition,1991,30,613。

包含各种杂环核碱基和各种糖部分(和糖类似物)的非天然核酸是本领域中可获得的，并且在一些情况下，核酸包含除了天然存在的核酸的五种主要核碱基组分以外的一种或若干种杂环核碱基。例如，在一些情况下，所述杂环核碱基包括尿嘧啶-5-基、胞嘧啶-5-基、腺嘌呤-7-基、腺嘌呤-8-基、鸟嘌呤-7-基、鸟嘌呤-8-基、4-氨基吡咯并[2.3-d]嘧啶-5-基、2-氨基-4-氧代吡咯并[2,3-d]嘧啶5-基、2-氨基-4-氧代吡咯并[2.3-d]嘧啶-3-基，其中嘌呤经由9位置、嘧啶经由1位置、吡咯并嘧啶经由7位置且吡唑并嘧啶经由1位置附接至核酸的糖部分。

在一些实施方案中，核苷酸类似物还在磷酸酯部分被修饰。经修饰的磷酸酯部分包括但不限于在两个核苷酸之间的连接处被修饰的那些，并且含有例如，硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基和其他烷基膦酸酯(包括3'-亚烷基膦酸酯)和手性膦酸酯、次膦酸酯、氨基磷酸酯(包括3'-氨基氨基磷酸酯和氨基烷基氨基磷酸酯、硫羰氨基磷酸酯)、硫羰烷基膦酸酯、硫羰烷基磷酸三酯和硼烷磷酸酯。应理解，两个核苷酸之间的这些磷酸酯或修饰的磷酸酯连接是通过3'-5'连接或2'-5'连接，并且所述连接含有相反的极性，如3'-5'至5'-3'或2'-5'至5'-2'。还包括各种盐、混合盐和游离酸形式。许多美国专利传授了如何制备和使用含有经修饰的磷酸酯的核苷酸，并且包括但不限于3,687,808；4,469,863；4,476,301；5,023,243；5,177,196；5,188,897；5,264,423；5,276,019；5,278,302；5,286,717；5,321,131；5,399,676；5,405,939；5,453,496；5,455,233；5,466,677；5,476,925；5,519,126；5,536,821；5,541,306；5,550,111；5,563,253；5,571,799；5,587,361；和5,625,050。

在一些实施方案中，非天然核酸包括2',3'-二脱氧-2',3'-二脱氢-核苷(PCT/US2002/006460)、5'-取代的DNA和RNA衍生物(PCT/US2011/033961；Saha等人,J.OrgChem.,1995,60,788-789；Wang等人,Bioorganic&Medicinal Chemistry Letters,1999,9,885-890；以及Mikhailov等人,Nucleosides&Nucleotides,1991,10(1-3),339-343；Leonid等人,1995,14(3-5),901-905；以及Eppacher等人,Helvetica Chimica Acta,2004,87,3004-3020；PCT/JP2000/004720；PCT/JP2003/002342；PCT/JP2004/013216；PCT/JP2005/020435；PCT/JP2006/315479；PCT/JP2006/324484；PCT/JP2009/056718；PCT/JP2010/067560)或制成具有经修饰的核碱基的单磷酸酯的5'-取代的单体(Wang等人,NucleosidesNucleotides&Nucleic Acids,2004,23(1&2),317-337)。

在一些实施方案中，非天然核酸包括在糖环的5'位置和2'位置处的修饰(PCT/US94/02993)，如5'-CH₂-取代的2'-O-保护的核苷(Wu等人,Helvetica Chimica Acta,2000,83,1127-1143和Wu等人,Bioconjugate Chem.1999,10,921-924).在一些情况下，非天然核酸包括酰胺连接的核苷二聚体，其已经被制备用于掺入寡核苷酸中，其中二聚体中3'连接的核苷(5'至3')包含2'-OCH₃和5'-(S)-CH₃(Mesmaeker等人,Synlett,1997,1287-1290)。非天然核酸可以包括2'-取代的5'-CH₂(或O)修饰的核苷(PCT/US92/01020)。非天然核酸可以包括5'-亚甲基膦酸酯DNA和RNA单体以及二聚体(Bohringer等人,Tet.Lett.,1993,34,2723-2726；Collingwood等人,Synlett,1995,7,703-705；以及Hutter等人,Helvetica Chimica Acta,2002,85,2777-2806)。非天然核酸可以包括具有2'-取代基的5'-膦酸酯单体(US2006/0074035)和其他修饰的5'-膦酸酯单体(WO1997/35869)。非天然核酸可以包括5'-修饰的亚甲基膦酸酯单体(EP614907和EP629633)。非天然核酸可以包括在5'和/或6'位置包含羟基基团的5'或6'-膦酸核糖核苷的类似物(Chen等人,Phosphorus,Sulfur and Silicon,2002,777,1783-1786；Jung等人,Bioorg.Med.Chem.,2000,8,2501-2509；Gallier等人,Eur.J.Org.Chem.,2007,925-933；以及Hampton等人,J.Med.Chem.,1976,19(8),1029-1033)。非天然核酸可以包括5'-膦酸酯脱氧核糖核苷单体和具有5'-磷酸酯基团的二聚体(Nawrot等人,Oligonucleotides,2006,16(1),68-82)。非天然核酸可以包含具有6'-膦酸酯基团的核苷，其中5'或/和6'位置未被取代或被硫代叔丁基基团(SC(CH₃)₃)(及其类似物)、亚甲基氨基(CH₂NH₂)(及其类似物)或氰基基团(CN)(及其类似物)取代(Fairhurst等人,Synlett,2001,4,467-472；Kappler等人,J.Med.Chem.,1986,29,1030-1038；Kappler等人,J.Med.Chem.,1982,25,1179-1184；Vrudhula等人,J.Med.Chem.,1987,30,888-894；Hampton等人,J.Med.Chem.,1976,19,1371-1377；Geze等人,J.Am.Chem.Soc,1983,105(26),7638-7640；以及Hampton等人,J.Am.Chem.Soc,1973,95(13),4404-4414)。

在一些实施方案中，非天然核酸还包括糖部分的修饰。在一些情况下，核酸含有其中糖基团已被修饰的一种或多种核苷。此类糖修饰的核苷可以赋予增强的核酸酶稳定性、增加的结合亲和力或一些其他有益的生物学特性。在某些实施方案中，核酸包含化学修饰的呋喃核糖环部分。化学修饰的呋喃核糖环的例子包括而不限于添加取代基(包括5'和/或2'取代基；两个环原子桥接形成双环核酸(BNA)；用S、N(R)或C(R₁)(R₂)替代核糖基环氧原子(R＝H、C₁-C₁₂烷基或保护基团)；及其组合。化学修饰的糖的例子可以在WO 2008/101157、US2005/0130923和WO 2007/134181中发现。

在一些实例中，经修饰的核酸包含经修饰的糖或糖类似物。因此，除核糖和脱氧核糖之外，所述糖部分还可以是戊糖、脱氧戊糖、己糖、脱氧己糖、葡萄糖、阿拉伯糖、木糖、来苏糖或糖“类似物”环戊基。所述糖可以呈吡喃糖基或呋喃糖基形式。所述糖部分可以是核糖、脱氧核糖、阿拉伯糖或2'-O-烷基核糖的呋喃糖苷，并且所述糖可以以[α]或[β]异头构型附接至相应的杂环核碱基。糖修饰包括但不限于2'-烷氧基-RNA类似物、2'-氨基-RNA类似物、2'-氟-DNA和2'-烷氧基-或氨基-RNA/DNA嵌合体。例如，糖修饰可以包括2'-O-甲基-尿苷或2'-O-甲基-胞苷。糖修饰包括2'-O-烷基-取代的脱氧核糖核苷和2'-O-乙二醇样核糖核苷。这些糖或糖类似物以及其中此类糖或类似物附接至杂环核碱基(核酸碱基)的相应“核苷”的制备是已知的。还可以进行糖修饰并且将其与其他修饰组合。

糖部分的修饰包括核糖和脱氧核糖的天然修饰以及非天然修饰。糖修饰包括但不限于在2'位置处的以下修饰：OH；F；O-、S-或N-烷基；O-、S-或N-烯基；O-、S-或N-炔基；或O-烷基-O-烷基，其中烷基、烯基和炔基可以是经取代或未经取代的C₁至C₁₀烷基或C₂至C₁₀烯基和炔基。2'糖修饰还包括但不限于-O[(CH₂)_nO]_m CH₃、-O(CH₂)_nOCH₃、-O(CH₂)_nNH₂、-O(CH₂)_nCH₃、-O(CH₂)_nONH₂和-O(CH₂)_nON[(CH₂)n CH₃)]₂，其中n和m是1至约10。

2'位置处的其他修饰包括但不限于：C₁至C₁₀低级烷基、取代的低级烷基、烷芳基、芳烷基、O-烷芳基、O-芳烷基、SH、SCH₃、OCN、Cl、Br、CN、CF₃、OCF₃、SOCH₃、SO₂ CH₃、ONO₂、NO₂、N₃、NH₂、杂环烷基、杂环烷芳基、氨基烷基氨基、聚烷基氨基、取代的甲硅烷基、RNA切割基团、报告基团、嵌入剂、用于改善寡核苷酸药代动力学特性的基团或用于改善寡核苷酸药效学特性的基团，以及具有类似特性的其他取代基。还可以在所述糖的其他位置(特别是在3'末端核苷酸或2'-5'连接的寡核苷酸中糖的3'位置和5'末端核苷酸的5'位置)处进行类似的修饰。修饰的糖还包括在桥环氧处含有修饰(如CH₂和S)的那些糖。核苷酸糖类似物也可以具有糖模拟物，如环丁基部分代替戊呋喃糖基糖。许多美国专利传授了此类修饰的糖结构的制备，并且详述并描述了一系列的核碱基修饰，所述美国专利是如美国专利号4,981,957；5,118,800；5,319,080；5,359,044；5,393,878；5,446,137；5,466,786；5,514,785；5,519,134；5,567,811；5,576,427；5,591,722；5,597,909；5,610,300；5,627,053；5,639,873；5,646,265；5,658,873；5,670,633；4,845,205；5,130,302；5,134,066；5,175,273；5,367,066；5,432,272；5,457,187；5,459,255；5,484,908；5,502,177；5,525,711；5,552,540；5,587,469；5,594,121、5,596,091；5,614,617；5,681,941；和5,700,920，将其中的每一个均通过引用以其整体并入本文。

具有修饰的糖部分的核酸的例子包括而不限于包含5'-乙烯基、5'-甲基(R或S)、4'-S、2'-F、2'-OCH₃和2'-O(CH₂)₂OCH₃取代基的核酸。2'位置处的取代基还可以选自烯丙基、氨基、叠氮基、硫代、O-烯丙基、O-(C₁-C_1O烷基)、OCF₃、O(CH₂)₂SCH₃、O(CH₂)₂-O-N(R_m)(R_n)和O-CH₂-C(＝O)-N(R_m)(R_n)，其中R_m和R_n各自独立地是H或者取代或未取代的C₁-C₁₀烷基。

在某些实施方案中，本文所述的核酸包括一种或多种双环核酸。在某些此类实施方案中，双环核酸包含在4'核糖基环原子与2'核糖基环原子之间的桥。在某些实施方案中，本文提供的核酸包括一种或多种双环核酸，其中所述桥包含4'至2'双环核酸。此类4'至2'二环核酸的例子包括但不限于以下式中的一种：4'-(CH₂)-O-2'(LNA)；4'-(CH₂)-S-2'；4'-(CH₂)₂-O-2'(ENA)；4'-CH(CH₃)-O-2'和4'-CH(CH₂OCH₃)-O-2'及其类似物(参见，美国专利号7,399,845)；4'-C(CH₃)(CH₃)-O-2'及其类似物(参见WO 2009/006478、WO 2008/150729、US2004/0171570、美国专利号7,427,672；Chattopadhyaya等人,J.Org.Chem.,209,74,118-134；和WO 2008/154401)。还参见例如：Singh等人,Chem.Commun.,1998,4,455-456；Koshkin等人,Tetrahedron,1998,54,3607-3630；Wahlestedt等人,Proc.Natl.Acad.Sci.U.S.A.,2000,97,5633-5638；Kumar等人,Bioorg.Med.Chem.Lett.,1998,8,2219-2222；Singh等人,J.Org.Chem.,1998,63,10035-10039；Srivastava等人,J.Am.Chem.Soc.,2007,129(26)8362-8379；Elayadi等人,Curr.Opinion Invens.Drugs,2001,2,558-561；Braasch等人,Chem.Biol,2001,8,1-7；Oram等人,Curr.OpinionMol.Ther.,2001,3,239-243；美国专利号4,849,513；5,015,733；5,118,800；5,118,802；7,053,207；6,268,490；6,770,748；6,794,499；7,034,133；6,525,191；6,670,461；和7,399,845；国际公开号WO 2004/106356、WO 1994/14226、WO 2005/021570、WO 2007/090071和WO2007/134181；美国专利公开号US 2004/0171570、US 2007/0287831和US 2008/0039618；美国临时申请号60/989,574、61/026,995、61/026,998、61/056,564、61/086,231、61/097,787和61/099,844；以及国际申请号PCT/US2008/064591、PCT US2008/066154、PCT US2008/068922和PCT/DK98/00393。

在某些实施方案中，核酸包含连接的核酸。核酸可以使用任何核酸间连接而连接在一起。核酸间连接基团的两个主要类别是通过磷原子的存在或不存在来定义的。代表性的含磷的核酸间连接包括但不限于磷酸二酯、磷酸三酯、甲基膦酸酯、氨基磷酸酯和硫代磷酸酯(P＝S)。代表性的不含磷的核酸间连接基团包括但不限于亚甲基甲基亚氨基(-CH₂-N(CH₃)-O-CH₂-)、硫代二酯(-O-C(O)-S-)、硫代氨基甲酸酯(-O-C(O)(NH)-S-)；硅氧烷(-O-Si(H)₂-O-)；和N,N*-二甲基肼(-CH₂-N(CH₃)-N(CH₃))。在某些实施方案中，可以将具有手性原子的核酸间连接制备为外消旋混合物，作为单独的对映体，例如烷基膦酸酯和硫代磷酸酯。非天然核酸可以含有单个修饰。非天然核酸可以在所述部分之一内或不同部分之间含有多个修饰。

对核酸的骨架磷酸酯修饰包括但不限于甲基膦酸酯、硫代磷酸酯、氨基磷酸酯(桥连或非桥连)、磷酸三酯、二硫代磷酸酯、硫代磷酸酯和硼烷磷酸酯，并且可以以任何组合使用。还可以使用其他非磷酸酯连接。

在一些实施方案中，骨架修饰(例如，甲基膦酸酯、硫代磷酸酯、氨基磷酸酯和二硫代磷酸酯核苷酸间连接)可以赋予修饰的核酸免疫调节活性和/或增强其体内稳定性。

在一些情况下，磷衍生物(或经修饰的磷酸酯基团)附接至糖或糖类似物部分，并且可以是单磷酸酯、二磷酸酯、三磷酸酯、烷基膦酸酯、硫代磷酸酯、二硫代磷酸酯、氨基磷酸酯等。含有经修饰的磷酸键或非磷酸键的示例性多核苷酸可以在以下文献中找到：Peyrottes等人,1996,Nucleic Acids Res.24:1841-1848；Chaturvedi等人,1996,NucleicAcids Res.24:2318-2323；and Schultz等人,(1996)Nucleic Acids Res.24:2966-2973；Matteucci,1997,“Oligonucleotide Analogs:an Overview”in Oligonucleotides asTherapeutic Agents,(Chadwick and Cardew,ed.)John Wiley and Sons,New York,NY；Zon,1993,“Oligonucleoside Phosphorothioates”in Protocols for Oligonucleotidesand Analogs,Synthesis and Properties,Humana Press,第165-190页；Miller等人,1971,JACS 93:6657-6665；Jager等人,1988,Biochem.27:7247-7246；Nelson等人,1997,JOC 62:7278-7287；美国专利号5,453,496；以及Micklefield,2001,Curr.Med.Chem.8:1157-1179。

在一些情况下，骨架修饰包括用可替代部分如阴离子基团、中性基团或阳离子基团替代磷酸二酯连接。此类修饰的例子包括：阴离子核苷间连接；N3'至P5'氨基磷酸酯修饰；硼烷磷酸酯DNA；原寡核苷酸；中性核苷间连接，如甲基膦酸酯；酰胺连接的DNA；亚甲基(甲基亚氨基)连接；甲缩醛(formacetal)和硫代甲缩醛连接；含有磺酰基的骨架；吗啉代寡聚物；肽核酸(PNA)；以及带正电荷的脱氧核糖核酸胍(DNG)寡聚物(Micklefield,2001,Current Medicinal Chemistry 8:1157-1179)。修饰的核酸可以包含嵌合或混合的骨架，所述嵌合的或混合的骨架包含一种或多种修饰(例如，磷酸酯连接的组合，如磷酸二酯和硫代磷酸酯连接的组合)。

磷酸酯的取代基包括，例如，短链烷基或环烷基核苷间连接、混合的杂原子和烷基或环烷基核苷间连接，或一个或多个短链杂原子或杂环核苷间连接。这些包括具有以下的那些：吗啉代连接(部分地由核苷的糖部分形成)；硅氧烷骨架；硫化物、亚砜和砜骨架；甲酰乙酰基和硫代甲酰乙酰基骨架；亚甲基甲酰乙酰基和硫代甲酰乙酰基骨架；含烯烃的骨架；氨基磺酸酯骨架；亚甲基亚胺基和亚甲基肼基骨架；磺酸酯和磺酰胺骨架；酰胺骨架；以及具有混合N、O、S和CH₂组成部分的其他骨架。许多美国专利公开了如何制备和使用这些类型的磷酸酯替代品，并且包括但不限于美国专利号5,034,506；5,166,315；5,185,444；5,214,134；5,216,141；5,235,033；5,264,562；5,264,564；5,405,938；5,434,257；5,466,677；5,470,967；5,489,677；5,541,307；5,561,225；5,596,086；5,602,240；5,610,289；5,602,240；5,608,046；5,610,289；5,618,704；5,623,070；5,663,312；5,633,360；5,677,437；和5,677,439。还应理解，在核苷酸取代物中，核苷酸的糖和磷酸酯部分二者都可以被替代，例如被酰胺型连接(氨乙基甘氨酸)(PNA)替代。美国专利号5,539,082；5,714,331；和5,719,262传授了如何制备和使用PNA分子，每个专利通过引用并入本文。还参见Nielsen等人,Science,1991,254,1497-1500。还可以将其他类型的分子(缀合物)与核苷酸或核苷酸类似物连接，以增强例如细胞摄取。缀合物可以与所述核苷酸或核苷酸类似物化学连接。此类缀合物包括但不限于脂质部分，如胆固醇部分(Letsinger等人,Proc.Natl.Acad.Sci.USA,1989,86,6553-6556)、胆酸(Manoharan等人,Bioorg.Med.Chem.Let.,1994,4,1053-1060)、硫醚(例如，己基-S-三苯甲基硫醇)(Manoharan等人,Ann.KY.Acad.Sci.,1992,660,306-309；Manoharan等人,Bioorg.Med.Chem.Let.,1993,3,2765-2770)、巯基胆固醇(Oberhauser等人,Nucl.Acids Res.,1992,20,533-538)、脂肪链(例如，十二烷二醇或十一烷基残基)(Saison-Behmoaras等人,EM5OJ,1991,10,1111-1118；Kabanov等人,FEBSLett.,1990,259,327-330；Svinarchuk等人,Biochimie,1993,75,49-54)、磷脂(例如，二-十六烷基-rac-甘油或l-二-O-十六烷基-rac-丙三基-S-H-膦酸三乙铵)(Manoharan等人,Tetrahedron Lett.,1995,36,3651-3654；Shea等人,Nucl.Acids Res.,1990,18,3777-3783)、聚胺或聚乙二醇链(Manoharan等人,Nucleosides&Nucleotides,1995,14,969-973)或金刚烷乙酸(Manoharan等人,Tetrahedron Lett.,1995,36,3651-3654)、棕榈基部分(Mishra等人,Biochem.Biophys.Acta,1995,1264,229-237)或硬脂胺或己基氨基-羰基-羟胆固醇部分(Crooke等人,J.Pharmacol.Exp.Ther.,1996,277,923-937)。许多美国专利传授了此类缀合物的制备，并且包括但不限于美国专利号4,828,979；4,948,882；5,218,105；5,525,465；5,541,313；5,545,730；5,552,538；5,578,717、5,580,731；5,580,731；5,591,584；5,109,124；5,118,802；5,138,045；5,414,077；5,486,603；5,512,439；5,578,718；5,608,046；4,587,044；4,605,735；4,667,025；4,762,779；4,789,737；4,824,941；4,835,263；4,876,335；4,904,582；4,958,013；5,082,830；5,112,963；5,214,136；5,082,830；5,112,963；5,214,136；5,245,022；5,254,469；5,258,506；5,262,536；5,272,250；5,292,873；5,317,098；5,371,241、5,391,723；5,416,203、5,451,463；5,510,475；5,512,667；5,514,785；5,565,552；5,567,810；5,574,142；5,585,481；5,587,371；5,595,726；5,597,696；5,599,923；5,599,928和5,688,941。

在一些实施方案中，包含非天然核糖核苷酸的多核苷酸(也称为核酸)来自任何来源或组合物，例如DNA、cDNA、gDNA(基因组DNA)、RNA、siRNA(短抑制RNA)、RNAi、tRNA、mRNA或rRNA(核糖体RNA)，并且呈任何形式(例如，线性、环状、超螺旋、单链、双链等)。在一些实施方案中，核酸包含核苷酸、核苷或多核苷酸。在一些情况下，核酸包含天然核酸和非天然核酸。在一些情况下，核酸还包含非天然核酸，如DNA或RNA类似物(例如，含有核碱基类似物、糖类似物和/或非天然骨架等)。应理解，术语“核酸”并非是指或意指特定长度的多核苷酸链，因此多核苷酸和寡核苷酸也包括在定义内。核酸有时是载体、质粒、噬菌粒、自主复制序列(ARS)、着丝粒、人工染色体、酵母人工染色体(例如，YAC)或能够在宿主细胞中复制或被复制的其他核酸。在一些情况下，非天然核酸是核酸类似物。在另外的情况下，非天然核酸来自细胞外来源。在其他情况下，非天然核酸可用于本文所提供的生物体(例如基因修饰的生物体)的细胞内空间。在一些实施方案中，非天然核苷酸不是天然核苷酸。在一些实施方案中，不包含天然核碱基的核苷酸包含非天然核碱基。

在一些实施方案中，多核苷酸用作逆转录酶的底物，或由包含天然核苷酸以及至少一个非天然核苷酸的逆转录酶合成。示例性天然核苷酸包括而不限于ATP、UTP、CTP、GTP、ADP、UDP、CDP、GDP、AMP、UMP、CMP、GMP、dATP、dTTP、dCTP、dGTP、dADP、dTDP、dCDP、dGDP、dAMP、dTMP、dCMP和dGMP。示例性天然脱氧核糖核苷酸包括dATP、dTTP、dCTP、dGTP、dADP、dTDP、dCDP、dGDP、dAMP、dTMP、dCMP和dGMP。示例性天然核糖核苷酸包括ATP、UTP、CTP、GTP、ADP、UDP、CDP、GDP、AMP、UMP、CMP和GMP。可以理解，三磷酸形式的核苷酸是聚合的底物，并且在添加至新生的多核苷酸链时，核苷酸被转化为单磷酸形式的核苷酸。

一般而言，核苷酸类似物或非天然核苷酸包括含有对核碱基、糖或磷酸酯部分的某一类型修饰的核苷酸。在一些实施方案中，修饰包括化学修饰。在一些情况下，修饰发生在3'OH或5'OH基团处、在骨架处、在糖组分处或在核碱基处。在一方面，经修饰的核酸包括以下中的一种或多种的修饰：3'OH或5'OH基团、骨架、糖组分或核碱基，和/或非天然存在的接头分子的添加。在一方面，经修饰的骨架包括除了磷酸二酯骨架以外的骨架。在一方面，经修饰的糖包括除了脱氧核糖以外(在经修饰的DNA中)或除了核糖以外(经修饰的RNA)的糖。在一方面，经修饰的核碱基包括除了腺嘌呤、鸟嘌呤、胞嘧啶或胸腺嘧啶以外的核碱基(在修饰的DNA中)或除了腺嘌呤、鸟嘌呤、胞嘧啶或尿嘧啶以外的核碱基(在修饰的RNA中)。

在一些实施方案中，所述核酸包含至少一种经修饰的核碱基。在一些实例中，所述核酸包含2、3、4、5、6、7、8、9、10、15、20种或更多种经修饰的核碱基。在一些情况下，对核碱基部分的修饰包括A、C、G和T/U以及不同的嘌呤或嘧啶核碱基的天然修饰和合成修饰。在一些实施方案中，修饰是针对腺嘌呤、鸟嘌呤、胞嘧啶或胸腺嘧啶的修饰形式(在经修饰的DNA中)或腺嘌呤、鸟嘌呤、胞嘧啶或尿嘧啶的修饰形式(经修饰的RNA)。经修饰的核碱基可以是本文其他地方特别描述的任何经修饰的核碱基。

在一些实施方案中，所述逆转录酶产生全长cDNA。在一些实施方案中，所述逆转录酶产生cDNA，所述cDNA包含与在经历逆转录的多核苷酸中的非天然核糖核苷酸互补的位置中的核苷酸以及在与非天然核糖核苷酸互补的位置中的核苷酸的3'端的多个核苷酸(例如，至少2个、5个、10个或20个核苷酸)，并且包括与正在经历逆转录的多核苷酸完全互补的cDNA。在一些实施方案中，cDNA包含与正在经历逆转录的多核苷酸的至少90％、95％、97％或99％一样多的核苷酸。在一些实施方案中，所述cDNA与正在经历逆转录的多核苷酸完全互补。在一些实施方案中，至少25％的cDNA包含非天然核碱基。在一些实施方案中，至少30％、40％、50％、60％、70％、80％、90％、95％、97％、98％或99％的cDNA包含非天然核碱基。

非天然碱基对

在一些实施方案中，非天然核苷酸在掺入(例如通过逆转录酶)期间和/或之后与另一非天然核苷酸形成碱基对(非天然碱基对；UBP)。在一些实施方案中，稳定整合的非天然核苷酸是可以与另一核苷酸(例如，天然或非天然核苷酸)形成碱基对的非天然核苷酸。在一些实施方案中，稳定整合的非天然核苷酸是可以与另一非天然核苷酸形成碱基对(非天然碱基对(UBP))的非天然核苷酸。例如，第一非天然核苷酸可以与第二非天然核苷酸形成碱基对。例如，可以在掺入核酸期间和/或之后进行碱基配对的一对非天然核苷三磷酸包括(d)5SICS的三磷酸酯((d)5SICSTP)和(d)NaM的三磷酸酯((d)NaMTP)。其他例子包括但不限于：(d)CNMO的三磷酸酯((d)CNMOTP)和(d)TPT3的三磷酸酯((d)TPT3TP)。此类非天然核苷酸可以具有核糖或脱氧核糖糖部分(由“(d)”指示)。例如，可以在掺入核酸时进行碱基配对的一对非天然核苷三磷酸包括(d)TAT1的三磷酸酯((d)TAT1TP)和(d)NaM的三磷酸酯((d)NaMTP)。例如，可以在掺入核酸中时进行碱基配对的一对非天然核苷三磷酸包括(d)CNMO的三磷酸酯((d)CNMOTP)和(d)TAT1的三磷酸酯((d)TAT1TP)。例如，可以在掺入核酸中时进行碱基配对的一对非天然核苷三磷酸包括(d)TPT3的三磷酸酯((d)TPT3TP)和(d)NaM的三磷酸酯((d)NaMTP)。在一些实施方案中，非天然核苷酸基本上不与天然核苷酸(A、T、G、C)形成碱基对。在一些实施方案中，稳定整合的非天然核苷酸可以与天然核苷酸形成碱基对。

在一些实施方案中，稳定整合的非天然(脱氧)核糖核苷酸是可以形成UBP，但是基本上不与天然(脱氧)核糖核苷酸中的每任一种形成碱基对的非天然(脱氧)核糖核苷酸。在一些实施方案中，稳定整合的非天然(脱氧)核糖核苷酸是可以形成UBP，但是基本上不与一种或多种天然核酸形成碱基对的非天然(脱氧)核糖核苷酸。例如，稳定整合的非天然核苷酸可能基本上不与A、T和C形成碱基对，但是可以与G形成碱基对。例如，稳定整合的非天然核苷酸可能基本上不与A、T和G形成碱基对，但是可以与C形成碱基对。例如，稳定整合的非天然核苷酸可能基本上不与C、G和A形成碱基对，但是可以与T形成碱基对。例如，稳定整合的非天然核苷酸可能基本上不与C、G和T形成碱基对，但是可以与A形成碱基对。例如，稳定整合的非天然核苷酸可能基本上不与A和T形成碱基对，但是可以与C和G形成碱基对。例如，稳定整合的非天然核苷酸可能基本上不与A和C形成碱基对，但是可以与T和G形成碱基对。例如，稳定整合的非天然核苷酸可能基本上不与A和G形成碱基对，但是可以与C和T形成碱基对。例如，稳定整合的非天然核苷酸可能基本上不与C和T形成碱基对，但是可以与A和G形成碱基对。例如，稳定整合的非天然核苷酸可能基本上不与C和G形成碱基对，但是可以与T和G形成碱基对。例如，稳定整合的非天然核苷酸可能基本上不与T和G形成碱基对，但是可以与A和G形成碱基对。例如，稳定整合的非天然核苷酸可能基本上不与G形成碱基对，但是可以与A、T和C形成碱基对。例如，稳定整合的非天然核苷酸可能基本上不与A形成碱基对，但是可以与G、T和C形成碱基对。例如，稳定整合的非天然核苷酸可能基本上不与T形成碱基对，但是可以与G、A和C形成碱基对。例如，稳定整合的非天然核苷酸可能基本上不与C形成碱基对，但是可以与G、T和A形成碱基对。

能够形成非天然DNA或RNA碱基对(UBP)的示例性非天然核苷酸包括但不限于(d)5SICS、(d)5SICS、(d)NaM、(d)NaM、(d)TPT3、(d)MTMO、(d)CNMO、(d)TAT1及其组合。在一些实施方案中，非天然核苷酸碱基对包括但不限于：

在一些实施方案中，如在RNA已经经历逆转录的情况下，形成UBP，其中非天然核碱基如上文所示或本文其他地方所述，并且糖之一是核糖或其修饰形式(但不是脱氧核糖)。

测量寡核苷酸中的非天然核苷酸含量

在一些实施方案中，本文公开的方法包括测量例如在cDNA中的非天然核苷酸的量。当cDNA由从DNA分子转录的RNA产生时，这种方法可以用于独立于翻译来确定转录期间非天然核苷酸保留的保真度的下限。在一些实施方案中，所述方法用于测量转录和逆转录的组合保真度。在一些实施方案中，所述方法用于测量非天然核苷酸在转录和逆转录期间的保留。

在一些实施方案中，测量步骤可以使用识别非天然核碱基的结合配偶体。在非天然核碱基包含生物素部分的情况下，结合配偶体可以是生物素结合剂(例如，链酶亲和素、亲和素、中性亲和素或抗生物素抗体)。在一些实施方案中，所述生物素结合剂与固体支持物(如珠粒)缔合(例如，结合，如共价结合)。在一些实施方案中，所述结合配偶体是链霉亲和素。结合配偶体的结合可以在凝胶移位测定或迁移率移位测定中进行评估，因为与结合配偶体结合的多核苷酸(理解为包含非天然核碱基)将展现出与未结合的多核苷酸(理解为缺乏非天然核碱基)不同的电泳迁移率。在通过逆转录酶掺入的核苷酸的非天然核碱基本身不包含生物素部分或结合配偶体的其他靶标的情况下，仍然可以使用结合配偶体测量非天然核碱基的量，例如如下。可以由cDNA产生互补分子或扩增子(例如，如对于在实施例中进行的生物素移位测定所述)，其确实包含生物素化非天然核碱基，然后可以将其作为cDNA的替代物进行测定，并在计算中进行适当调整。在一些实施方案中，cDNA的扩增是通过PCR进行的。示例性生物素化非天然核碱基可以使用dMMO2bioTP(dNaMTP的生物素化类似物)和d5SICSTP(dTPT3TP的类似物，其在复制期间与dMMO2bio配对好于dTPT3TP自身)掺入互补分子或扩增子中。(Malyshev等人,A Semi-Synthetic Organism with an Expanded GeneticAlphabet.Nature 2014,509,385–388.)其中产生含有生物素化非天然核碱基的互补分子或扩增子的这种方法被认为包含在短语“使用识别非天然核苷酸的结合配偶体测量cDNA中的非天然核苷酸的量”等中。

在一些实施方案中，使用识别非天然核碱基的结合配偶体测量cDNA中的非天然核苷酸的量包括生物素移位测定。生物素移位测定包括任何这样的测定，其基于结合或不结合生物素结合剂(如链霉亲和素)的差异迁移率来区分生物素化与未生物素化产物。迁移率可以是例如电泳迁移率(例如，凝胶电泳迁移率或毛细管电泳迁移率)或色谱迁移率(例如，使用凝胶过滤、离子交换或疏水相互作用色谱法)。

当由从DNA分子转录的RNA产生cDNA时，转录可以在体外或体内进行。在一些实施方案中，转录在细菌或原核生物(如大肠杆菌)中进行。在一些实施方案中，转录RNA的DNA分子是ssDNA或dsDNA。

在一些实施方案中，所述方法包括计算转录-逆转录(T-RT)保真度(转录和逆转录步骤的总体保真度)。例如，T-RT保真度可以被测定为(a)含有非天然核苷酸的cDNA的比例与(b)转录前含有非天然核苷酸的DNA的比例的比率。在使用进一步合成步骤(如扩增)来制备生物素化DNA的情况下，可以通过因子来调节所述比率以补偿进一步合成步骤中的非天然碱基对损失。如实施例中所示，1.06是所述因子的示例性的值。

筛选RNA适配体侯选物的方法

本文还公开了筛选RNA适配体候选物的方法。在一些实施方案中，所述方法包括将多种不同的RNA寡核苷酸(“文库”)与靶标一起孵育，其中所述RNA寡核苷酸包含至少一个非天然核苷酸。在一些实施方案中，所述方法包括对所述多种RNA寡核苷酸中与所述靶标结合的RNA寡核苷酸进行至少一轮选择。在一些实施方案中，所述方法包括分离与所述靶标结合的富集的RNA寡核苷酸，其中所述分离的富集的RNA寡核苷酸包含RNA适配体。在一些实施方案中，所述方法包括将所述RNA适配体中的一种或多种逆转录成cDNA，其中所述cDNA在与所述RNA适配体中的所述非天然核碱基互补的位置处包含非天然脱氧核糖核苷酸，从而提供对应于所述RNA适配体的cDNA分子的文库。

在一些实施方案中，所述多种不同的RNA寡核苷酸包含随机化核苷酸区域。这可以通过以下方式来产生：例如，使用在核苷酸合成程序的某些周期中的核苷酸的混合池，或者在从DNA模板转录寡核苷酸之前进行诱变PCR。随机化核苷酸区域可以包含一个或多个随机化位置。在存在多个随机化位置的情况下，它们可以是连续的或被一个或多个非随机化核苷酸或非随机化核苷酸片段中断。在一些实施方案中，所述非天然核碱基在随机化区域内(例如，第一随机化位置的3'端和第二随机化位置的5'端)。在一些实施方案中，所述非天然核碱基在至少一个随机化位置的5个或10个核苷酸内。在一些实施方案中，所述非天然核碱基紧邻随机化位置，或紧邻两个随机化位置。

在一些实施方案中，所述RNA寡核苷酸包含条形码序列和/或引物结合序列。如实施例7所示，条形码序列可以用于识别非天然核碱基的位置，并且引物结合序列可以用于选择后活性序列的下游分析。

在一些实施方案中，对由RNA适配体产生的cDNA进行测序。在一些实施方案中，使由RNA适配体产生的cDNA突变以产生多个另外的序列，然后所述另外的序列可以被转录成RNA以进行至少一轮进一步的选择。可以例如通过易错PCR使cDNA突变。

在一些实施方案中，所述选择包括洗涤步骤以去除未结合或弱结合的RNA寡核苷酸。可以采用一系列洗涤步骤，其中随着方法的进行严格性增加，例如以提供更多的选择压力。

可以例如单独分析通过所述方法鉴定的RNA适配体结合、激动或拮抗靶标的能力。在一些实施方案中，分析所述RNA适配体结合所述靶标的能力包括测定K_d、k_on或k_off。在一些实施方案中，分析所述RNA适配体使所述靶标激动的能力包括测定EC₅₀值。在一些实施方案中，分析所述RNA适配体拮抗所述靶标的能力包括测定K_i或IC₅₀值。

多核苷酸的另外的特征

本文所描述的特征可以在可行的程度上与任何公开的实施方案相结合。在一些实施方案中，含有非天然核糖核苷酸的多核苷酸包含至少15个核苷酸。在一些实施方案中，多核苷酸包含至少20、25、30、35、40、50、60、70、80、90或100个核苷酸。在一些实施方案中，含有非天然核糖核苷酸的多核苷酸包含一个或多个ORF。ORF可以来自任何合适的来源，有时来自基因组DNA、mRNA、逆转录RNA或互补DNA(cDNA)或包含前述一种或多种的核酸文库，并且来自含有目的核酸序列、目的蛋白质或目的活性的任何生物体物种。可以从其获得ORF的生物体的非限制性例子包括例如细菌、酵母、真菌、人、昆虫、线虫、牛类、马类、犬类、猫类、大鼠或小鼠。在一些实施方案中，本文所述的核苷酸和/或核酸试剂或其他试剂是分离的或纯化的。可以通过已公布的体外方法创建包含非天然核苷酸的ORF。在一些情况下，核苷酸或核酸试剂包含非天然核碱基。

多核苷酸有时包含与ORF相邻的核苷酸序列，其与ORF结合翻译并编码氨基酸标签。编码标签的核苷酸序列位于核酸试剂中ORF的3'和/或5'，由此编码由ORF编码的蛋白质或肽的C末端或N末端的标签。可以利用不消除体外转录和/或翻译的任何标签，并且可以由技术人员适当地选择。标签可以促进从培养物或发酵培养基分离和/或纯化所需ORF产物。在一些实例中，将核酸试剂文库与本文所述的方法和组合物一起使用。例如，文库中存在至少100、1000、2000、5000、10,000或多于50,000种独特多核苷酸的文库，其中每种多核苷酸包含至少一种非天然核碱基。

多核苷酸可以包含通常根据核酸的计划用途选择的某些元件，例如，调节元件。核酸试剂中可以包括或排除以下元件中的任一种。例如，多核苷酸可以包括以下核苷酸元件中的一种或多种或全部：一种或多种启动子元件、一个或多个5'非翻译区(5'UTR)、一个或多个可以插入靶核苷酸序列的区域(“插入元件”)、一种或多种靶核苷酸序列、一个或多个3'非翻译区(3'UTR)以及一种或多种选择元件。多核苷酸可以提供有一种或多种此类元件，并且可以在将核酸引入所需生物体中之前将其他元件插入核酸中。在一些实施方案中，所提供的核酸试剂包含启动子、5'UTR、可选的3'UTR和一种或多种插入元件，通过所述插入元件将靶核苷酸序列插入(即，克隆)至核酸试剂中。在某些实施方案中，所提供的核酸试剂包含启动子、一种或多种插入元件和可选的3'UTR，并且用可选的3'UTR插入5'UTR/靶核苷酸序列。所述元件可以按适合于在所选表达系统中表达(例如，在所选生物体中的表达，或者例如在无细胞系统中的表达)的任何顺序排列，并且在一些实施方案中，核酸试剂在5'至3'方向上包含以下元件：(1)启动子元件、5'UTR和一种或多种插入元件；(2)启动子元件、5'UTR和靶核苷酸序列；(3)启动子元件、5'UTR、一种或多种插入元件和3'UTR；以及(4)启动子元件、5'UTR、靶核苷酸序列和3'UTR。在一些实施方案中，可以优化UTR以改变或增加完全天然或含有非天然核苷酸的ORF的转录或翻译。

多核苷酸(例如，表达盒和/或表达载体)可以包括多种调节元件，包括启动子、增强子、翻译起始序列、转录终止序列和其他元件。“启动子”通常是一个或多个DNA序列，其在位于关于转录起始位点的相对固定位置时发挥作用。例如，启动子可以位于核苷酸三磷酸转运蛋白核酸区段的上游。“启动子”含有RNA聚合酶与转录因子的基础相互作用所需的核心元件，并且可以含有上游元件和反应元件。“增强子”通常是指DNA序列，其不在转录起始位点的固定距离处发挥作用，并且可以位于转录单元的5'或3”。此外，增强子可以在内含子内以及在编码序列本身内。它们的长度通常在10与300个核苷酸之间，并且它们可以以顺式形式起作用。增强子发挥作用以增加来自附近启动子的转录。增强子像启动子一样，通常也含有介导转录调节的反应元件。增强子通常决定表达的调节，并且可以用于改变或优化ORF(包括完全天然或含有非天然核苷酸的ORF)表达。

如上所述，多核苷酸还可以包含一个或多个5'UTR以及一个或多个3'UTR。例如，真核宿主细胞(例如，酵母、真菌、昆虫、植物、动物、人或有核细胞)和原核宿主细胞(例如，病毒、细菌)中使用的表达载体可以含有针对转录终止进行信号传导的序列，所述序列可能影响mRNA表达。这些区域可以被转录为编码组织因子蛋白的mRNA的非翻译部分中的多腺苷酸化区段。3'非翻译区还包括转录终止位点。在一些优选实施方案中，转录单元包含多腺苷酸化区域。这个区域的一个益处在于，它增加像mRNA一样处理并转运所转录单元的可能性。表达构建体中的多腺苷酸化信号的鉴定和使用是众所周知的。在一些优选实施方案中，同源多腺苷酸化信号可以用于转基因构建体中。

5'UTR可以包含对于其所源自的核苷酸序列为内源的一种或多种元件，并且有时包括一种或多种外源元件。5'UTR可以源自任何合适的核酸，如基因组DNA、质粒DNA、RNA或mRNA，例如，源自任何合适的生物体(例如，病毒、细菌、酵母、真菌、植物、昆虫或哺乳动物)。技术人员可以基于所选表达系统(例如，在所选生物体中的表达，或者例如在无细胞系统中的表达)选择用于5'UTR的适当元件。5'UTR有时包含技术人员已知的以下元件中的一种或多种：增强子序列(例如，转录或翻译)、转录起始位点、转录因子结合位点、翻译调节位点、翻译起始位点、翻译因子结合位点、辅助蛋白结合位点、反馈调节剂结合位点、普里布诺框、TATA框、-35元件、E盒(螺旋-环-螺旋结合元件)、核糖体结合位点、复制子、内部核糖体进入位点(IRES)、沉默子元件等。在一些实施方案中，可以分离启动子元件，使得适当的条件性调节所需的所有5'UTR元件都含于启动子元件片段中，或者启动子元件片段的功能性子序列内。

多核苷酸中的5'UTR可以包含翻译增强子核苷酸序列。翻译增强子核苷酸序列通常位于多核苷酸中的启动子与靶核苷酸序列之间。翻译增强子序列通常结合至核糖体，有时是18S rRNA结合核糖核苷酸序列(即，40S核糖体结合序列)，并且有时是内部核糖体进入序列(IRES)。IRES通常形成具有精确放置的RNA三级结构的RNA支架，所述RNA三级结构经由多种特定分子间相互作用接触40S核糖体亚基。核糖体增强子序列的例子是已知的并且可以由技术人员鉴定(例如，Mignone等人,Nucleic Acids Research 33:D141-D146(2005)；Paulous等人,Nucleic Acids Research 31:722-733(2003)；Akbergenov等人,NucleicAcids Research 32:239-247(2004)；Mignone等人,Genome Biology 3(3):reviews0004.1-0001.10(2002)；Gallie,Nucleic Acids Research 30:3401-3411(2002)；Shaloiko等人,DOI:10.1002/bit.20267；和Gallie等人,Nucleic Acids Research 15:3257-3273(1987))。

翻译增强子序列有时是真核序列，如Kozak共有序列或其他序列(例如，水螅体序列，GenBank登录号U07128)。翻译增强子序列有时是原核序列，如Shine-Dalgarno共有序列。在某些实施方案中，翻译增强子序列是病毒核苷酸序列。翻译增强子序列有时来自植物病毒的5'UTR，所述植物病毒如例如烟草花叶病毒(TMV)、苜蓿花叶病毒(AMV)；烟草蚀纹病毒(ETV)；马铃薯Y病毒(PVY)；芜菁花叶(poty)病毒和豌豆种传花叶病毒。在某些实施方案中，在多核苷酸中包含来自TMV的长度约67个碱基的ω序列作为翻译增强子序列(例如，缺乏鸟苷核苷酸并且包括长度为25个核苷酸的聚(CAA)中心区域)。

3'UTR可以包含对于其所源自的核苷酸序列为内源的一种或多种元件，并且有时包括一种或多种外源元件。3'UTR可以源自任何合适的核酸，如基因组DNA、质粒DNA、RNA或mRNA，例如，源自任何合适的生物体(例如，病毒、细菌、酵母、真菌、植物、昆虫或哺乳动物)。技术人员可以基于所选表达系统(例如，在所选生物体中的表达)选择用于3'UTR的适当元件。3'UTR有时包含技术人员已知的以下元件中的一种或多种：转录调节位点、转录起始位点、转录终止位点、转录因子结合位点、翻译调节位点、翻译终止位点、翻译起始位点、翻译因子结合位点、核糖体结合位点、复制子、增强子元件、沉默子元件和聚腺苷尾。3'UTR通常包括聚腺苷尾并且有时不包括，并且如果存在聚腺苷尾，可以在其中添加或缺失一个或多个腺苷部分(例如，可以添加或减去约5、约10、约15、约20、约25、约30、约35、约40、约45或约50个腺苷部分)。

在一些实施方案中，使用5'UTR和/或3'UTR的修饰改变(例如，增加、添加、降低或基本上消除)启动子的活性。通过来自可操作地连接的包含修饰的5'或3'UTR的启动子元件的一个或多个目的核苷酸序列的转录的改变，启动子活性的改变又可以改变肽、多肽或蛋白质的活性(例如，酶活性)。例如，在某些实施方案中，微生物可以通过基因修饰来工程化以表达包含修饰的5'或3'UTR的多核苷酸，所述修饰的5'或3'UTR可以添加新型活性(例如，通常在宿主生物体中没有发现的活性)，或者通过增加来自与目的核苷酸序列(例如，目的同源或异源核苷酸序列)可操作地连接的同源或异源启动子的转录来增加现有活性的表达。在一些实施方案中，在某些实施方案中，微生物可以通过基因修饰来工程化以表达包含经修饰的5'UTR或3'UTR的核酸试剂，所述经修饰的5'UTR或3'UTR可以通过降低或基本上消除来自与目的核苷酸序列可操作地连接的同源或异源启动子的转录来降低活性的表达。

试剂盒和制品

在某些实施方案中，本文公开了与本文所述的一种或多种方法一起使用的试剂盒和制品。此类试剂盒包括载体、包装或容器，其被分隔以容纳一个或多个容器如小瓶、管等，所述一个或多个容器中的每一个包含有待在本文所述的方法中使用的单独要素之一。合适的容器包括例如瓶、小瓶、注射器和试管。在一个实施方案中，容器由各种材料(如玻璃或塑料)形成。

在一些实施方案中，试剂盒包括合适的包装材料来容纳试剂盒的内容物。在一些情况下，包装材料是通过熟知的方法来构建的，优选地以提供无菌无污染的环境。本文所用的包装材料可以包括例如通常用于出售用于与核酸测序系统一起使用的商业试剂盒中的那些。示例性包装材料包括而不限于能够将本文所述的组分保持在固定界限内的玻璃、塑料、纸、箔等。

包装材料可以包括指示组分具体用途的标签。标签所指示的试剂盒的用途可以是对于试剂盒中存在的特定组分组合适当的本文所述的一种或多种方法。例如，标签可以指示，试剂盒用于合成多核苷酸的方法中，或者用于确定核酸序列的方法中。

试剂盒中还可以包括所包装试剂或组分的使用说明。所述说明典型地将包括描述反应参数的有形表达，所述反应参数如要混合的试剂盒组分和样品的相对量、试剂/样品混合物的维持时间段、温度、缓冲条件等。

将理解，并非特定反应所需的所有组分都必须存在于特定试剂盒中。而是可以从其他来源提供一种或多种另外的组分。与试剂盒一起提供的说明可以标识要提供的一种或多种另外的组分以及可以从哪里获得所述组分。

在一些实施方案中，提供了一种试剂盒，所述试剂盒用于将非天然核酸稳定掺入细胞核酸中，例如，使用本公开文本提供的用于制备基因工程化细胞的方法。在一个实施方案中，本文所述的试剂盒包括基因工程化细胞以及一种或多种非天然核酸。

在另外的实施方案中，本文所述的试剂盒提供细胞和含有用于引入所述细胞中以由此提供基因工程化细胞的异源基因的核酸分子，如包含本段之前描述的任何实施方案的核酸的表达载体。

实施例

体外和体内转录和逆转录实验的材料、方法和实验程序

在实施例1至5中，在适用的情况下使用以下实验程序。

材料。表4和表5提供了这项工作中使用的质粒和引物的完整列表。引物和天然寡核苷酸购自IDT(爱荷华科勒尔维尔)。通过Genewiz(加利福尼亚州圣地亚哥)进行测序。使用商业化小量制备试剂盒(D4013，Zymo Research；加利福尼亚州欧文)纯化质粒。使用商业化DNA纯化试剂盒(D4054，Zymo Research)纯化PCR产物，并且使用Infinite M200 Pro读板仪(TECAN)通过A260/A280吸收来定量。所有涉及RNA种类的实验都是用无RNA酶试剂、移液管吸头、试管和手套进行的，以避免污染。

商业上合成了dNaM、dTPT3、NAM、TPT3、d5SICS和dMMO2^bio的核苷(WuXi AppTec；中国上海)并且使其三磷酸化(TriLink BioTechnologies LLC；加利福尼亚州圣地亚哥；和MyChem LLC；加利福尼亚州圣地亚哥)。合成所有非天然寡核苷酸，并将其通过BiosearchTechnologies(加利福尼亚州佩塔卢马)进行HPLC纯化。所有含有非天然碱基对的DNA样品均在-20℃下储存。所有RNA样品均在-80℃温度下储存。

表4.引物。表4按出现顺序分别公开了SEQ ID NO 1-12。

表5.寡核苷酸。表5按出现顺序分别公开了SEQ ID NO 13-34。

采用非天然碱基对的PCR反应。简言之，遵循制造商关于OneTaq的说明书(OneTaqDNA聚合酶，M0480L，New England Biolabs，(NEB))，其中添加各100nM dNaMTP和dTPT3TP。在所有情况下，将延伸步骤调整为4min。

EGFP和tRNA模板的构建。EGFP模板质粒pUCCS2_EGFP(NNN)和pUCCYBA_EGFP(NNN)通过使用EGFP序列背景的金门组装来制备。所有金门组装中使用的插入片段都是用合成的含dNaM的寡核苷酸和引物YZ73和YZ74产生的PCR产物(参见表6)。在金门组装后纯化质粒pUCCS2_EGFP(NNN)和pUCCYBA_EGFP(NNN)，并且使用Qubit(ThermoFisher)对其进行定量。将EGFP模板质粒(2ng)用于模板产生PCR反应中，其中对于pUCCS2_EGFP(NNN)，使用引物ED101和AZ38，并且对于pUCCYBA_EGFP(NNN)，使用引物ED101和AZ87。将PCR产物进行DpnI消化，然后纯化以产生用于体外转录的EGFP模板。

表6.引物使用

用引物AZ01和AZ67通过直接PCR从合成的含有dNaM的寡核苷酸制备tRNA模板。对PCR产物进行纯化以产生用于体外转录的tRNA模板。

通过金门组装制备用于SSO体内翻译实验的pSyn_sfGFP(NNN)_mm(NNN)。在所有金门组装中使用的插入片段均是使用用于mRNA密码子插入片段的引物集YZ73/YZ74或用于tRNA反密码子插入片段的引物集YZ435/YZ436用合成的含有dNaM的寡核苷酸产生的PCR产物。在金门组装后纯化质粒pSyn_sfGFP(NNN)_mm(NNN)，并且使用Qubit对其进行定量。

生物素移位测定。使用d5SICSTP和dMMO2bio-TP以及相应的引物集测定RNA种类的模板中非天然碱基对的保留。使用图像实验室(Bio-Rad)对条带强度进行定量。通过将每个样品的原始移位百分比除以当构建EGFP质粒时在金门组装中使用的合成的含dNaM寡核苷酸模板的原始移位百分比来将非天然碱基对保留归一化。生物素移位测定在以下文献中有更详细的讨论：Malyshev等人,A Semi-Synthetic Organism with an Expanded GeneticAlphabet.Nature 2014,509,385–388。

EGFP mRNA的体外转录。在相应地使用或不使用1.25mM非天然核糖核三磷酸的每个体外转录反应(HiScribe T7 ARCA，加尾，E2060S，New England Biolabs，(NEB))中使用模板(500-1000ng)，然后纯化(D7010，Zymo Research)。通过Qubit对mRNA产物进行定量，然后在-80℃下以5μg等分试样在溶液中储存。

tRNA的体外转录。在相应地使用或不使用2mM非天然核糖核苷三磷酸的每个体外转录反应(T7 RNA聚合酶，E0251L，NEB)中使用模板(500-1000ng)，然后纯化(D7010，Zymo)。通过Qubit对tRNA产物进行定量，然后进行重折叠(95℃持续1min，37℃持续1min，10℃持续2min)。所有tRNA均以1800ng等分试样在-80℃下储存。

逆转录。根据制造商对每种逆转录酶的说明书进行逆转录反应，并进行以下修改。在所有逆转录反应中，除非另有说明，否则每20μL反应使用1μg mRNA或20ng tRNA、0.5mMdNTP和0.2mM dNaMTP或dTPT3TP。对于SuperScript III(18080044，ThermoFisher)，将反应在55℃下孵育45min，在70℃下灭活15min，然后进行RNA酶H(M0297S，新英格兰生物实验室，(NEB))和RNA酶A(R1253，ThermoFisher)消化。对于SuperScript IV(18090010，ThermoFisher)，将反应在55℃下孵育20min，在80℃下灭活10min，然后进行RNA酶H、RNA酶A和蛋白酶K(P8107S，新英格兰生物实验室，(NEB))消化。对于AMV逆转录酶(M0277S，NewEngland Biolabs，(NEB))，将反应在42℃下孵育60min，在80℃下灭活5min，然后进行RNA酶H和RNA酶A消化。消化后，将10μL各反应混合物用RNA负载染料(B0363S，新英格兰生物实验室，(NEB))进行变性，并用8M尿素(CAS 57-13-6，Sigma-Aldrich)进行10％变性聚丙烯酰胺凝胶电泳以进行cDNA检测。使用商业化RNA纯化试剂盒(D7011，Zymo Research；加利福尼亚州尔湾)纯化另外的10μL反应混合物，并且使用Qubit对产物cDNA进行定量。

单链DNA分离。asDNA是从用于IVT反应的dsDNA模板用生物素化5'引物经由PCR扩增制备。根据制造商说明书使用Dynabeads^TM MyOne^TM链霉亲和素C1(65001，ThermoFisher)，使产物生物素化dsDNA(bio-dsDNA)经受亲和单链分离方案。简言之，用WB缓冲液预洗涤珠粒(20μL)3次，然后将其与纯化的bio-dsDNA(20μL，约50ng/μL)混合。将混合物在轻轻摇动下在37℃下孵育2h。使用磁性支架将珠粒从缓冲液分离出来。然后用WB缓冲液洗涤珠粒3次，并用100μL 0.1M NaOH洗脱未生物素化的链(洗涤时间<30s)。然后使用柱纯化来纯化洗脱的未生物素化的asDNA。

SSO体内翻译。将在补充有50mM磷酸钾(CAS 7778-77-0，Sigma-Aldrich)、5μg/mL氯霉素(CAS 56-75-7，Sigma Aldrich)和100μg/mL羧苄青霉素(C1613,Sigma Aldrich)的2×YT(Y2377，Sigma Aldrich)(在本部分的下文中称为“培养基”)中的YZ3+pGEX-MbPylRSTetR细胞的2mL过夜培养物在相同的培养基中稀释至0.03的OD600，并生长至0.3至0.4的OD600。将培养物在冰水浴中在摇动下快速冷却5min，然后在3,200×g下沉淀10min。接下来用一个培养体积的预冷高压灭菌Milli-Q H2O洗涤细胞两次。然后将细胞重悬于另外冷却的H₂O中，达到50-60的OD600。对于每个测试的样品，将50μL所得的电感受态细胞与0.5ng含有嵌入sfGFP和tRNA^Pyl基因中的UBP的金门组装的质粒组合，然后转移到预冷的电穿孔杯(0.2cm间距)。根据制造商关于细菌的说明书(25kV、2.5μF和200Ω电阻器)对细胞进行电穿孔(Gene Pulser II；Bio-Rad)，然后立即用950μL预热培养基稀释。然后用预热的培养基将10μL的该稀释液稀释至50μL的最终体积，并补充150mM dNaMTP和10μM dTPT3TP。使转化在37℃下恢复1h。将恢复培养物接种在补充有50μg/mL博来霉素(R25001，ThermoFisher)、150μM dNaMTP、10μM dTPT3TP和2％w/v琼脂的固体培养基上，然后在37℃下生长过夜。

分离单个菌落，并将其用于接种补充有50μg/mL博来霉素的300μL液体培养基(在本部分的下文中称为“生长培养基”)，并提供150μM dNaMTP和10μM dTPT3TP，然后使用带有590/20nm滤光片的Envision 2103多标记读板仪(Perkin Elmer)经由OD600监测细胞生长。在约0.7的OD600下收集细胞，然后对等分试样(100μL)进行小量制备。对分离的质粒进行生物素移位测定以测定UBP保留。然后，在补充有150μM dNaMTP和10μM dTPT3TP的300μL生长培养基中，将显示为保留UBP的菌落稀释回至约0.1-0.2的OD600。在0.4-0.6的OD600下，除非另有说明，否则用250μM NaMTP和30μM TPT3TP以及10mM的ncAA N6-(2-叠氮乙氧基)-羰基-L-赖氨酸(AzK)补充培养物。然后再培养20min，然后将IPTG(CAS 367-93-1，Sigma-Aldrich)添加至1mM的浓度，并生长1h以诱导T7 RNA聚合酶、tRNA^Pyl和PylRS的转录。每隔30min监测细胞的生长(OD600)和GFP荧光。然后用100ng/mL无水四环素(CAS 13803-65-1，Sigma-Aldrich)诱导sfGFP的表达。在另外生长3h后，收集细胞培养物并将其在冰上冷却。使用50μL的培养物进行质粒分离以测定UBP保留(生物素移位测定)；使用剩余的250μL培养物进行总RNA提取以测量T-RT保留。

总RNA提取。在体内翻译实验之后，收集大肠杆菌培养物并将其以10,000rpm离心(离心机5415C，Eppendorf)30秒，并丢弃上清液。然后向每个样品中添加1mL TRIzol(15596026，ThermoFisher)。将混合物均质化，并在室温下培养5min。向每个样品中添加200μL氯仿(CAS 67-66-3，Sigma-Aldrich)，将混合物涡旋以均质化，然后室温孵育3min以允许相分离。接下来，将样品在4℃下以12,000rpm离心15min，将无色水相收集到新管中，并向水相中添加500μL异丙醇(CAS 67-63-0，Sigma-Aldrich)。在室温下孵育10min后，将样品在4℃下以7,000rpm离心10min，并丢弃上清液。然后用1mL 75％乙醇洗涤样品2次。将管盖打开以使样品在室温下干燥30min，并将所得的总RNA用20μL不含RNA酶的水溶解。使用Qubit测量总RNA的浓度。

实施例1.依序体外转录(IVT)和逆转录

为了探索逆转录酶有效识别含有UBP的RNA的能力，用可商购的逆转录酶：SuperScript III、SuperScript IV和AMV逆转录酶进行了依序体外转录(IVT)和逆转录。对含有EGFP基因且dNaM或dTPT3位于编码密码子151的第二核苷酸的位置的DNA进行PCR扩增，并将其用作IVT反应的模板，所述IVT反应补充有相应非天然核糖核苷三磷酸，但在其他方面根据制造商说明书运行。将RNA纯化，然后用作RT反应的模板，所述RT反应在有或没有非天然脱氧核糖核苷三磷酸的情况下进行(此外，引物安装了3'延伸部以便于分析，参见下文)。1小时后，对RT反应的一半进行PAGE凝胶电泳以定性评估全长和截短的产物的存在，并对另一半进行纯化以随后表征非天然核苷酸的保留。

在AMV逆转录酶的情况下，含有NaM或TPT3的RNA模板在dTPT3TP或dNaMTP不存在时大部分仅产生截短的cDNA产物，并且在提供dTPT3TP或dNaMTP时大部分仅产生全长产物(图2)。相比之下，在SuperScript III或SuperScript IV的情况下，无论是否添加了非天然三磷酸，用任一模板均观察到全长cDNA产物(图2)。使用基本上如Malyshev等人,A Semi-Synthetic Organism with an Expanded Genetic Alphabet.Nature2014,509,385–388中所述进行的生物素移位测定来检测RT产物中非天然核苷酸的存在。在每种天然dNTP以及dMMO2bioTP(dNaMTP的生物素化类似物)和d5SICSTP(dTPT3TP的类似物，其在复制期间与dMMO2 bio配对好于dTPT3TP自身)存在的情况下，通过PCR扩增纯化的cDNA。使用退火至通过RT引物安装的序列的3'引物(参见上文)防止了原始IVT反应中剩余的任何DNA模板的扩增(图3)。然后将PCR产物与链霉亲和素一起孵育，并进行PAGE电泳，其中所得到的移位条带与未移位条带的比率指示含有非天然核苷酸的cDNA的百分比。正如预期的那样，当RT反应中不添加非天然三磷酸时，没有观察到移位产物。相反，当向RT反应中添加互补的非天然三磷酸时，观察到显著的移位，表明在所有三种逆转录酶的情况下，显著量的cDNA产物含有非天然核苷酸(图2)。

实施例2.tRNA模板浓度的影响的研究

使用通过来自在与反密码子的第二核苷酸对应的位置含有dNaM或dTPT3的合成寡核苷酸的PCR产物的IVT产生的tRNA模板来研究tRNA模板浓度对非天然核碱基的逆转录效率的影响。在最高tRNA浓度(25ng/μL)下，NaM或TPT3模板在存在其相应的非天然脱氧核糖三磷酸的情况下逆转录分别产生88％和44％全长产物。有趣的是，在较低的tRNA模板浓度下，全长产物的百分比增加。使用0.5μg/mL模板，使用NaM或TPT3模板逆转录分别产生97％和92％全长产物(图3、表1)。

表1.使用含有NaM或TPT3的RNA时SuperScript III RT反应全长cDNA产物比率的RNA浓度依赖性的原始数据。

实施例3.依序体外转录(IVT)和逆转录后UBP保留的测定

开发了一种测定以定量测量依序用T7 RNA聚合酶体外转录(IVT)和用以下可商购逆转录酶逆转录(RT)后的UBP保留：SuperScript III、SuperScript IV和AMV逆转录酶。为了仅关注在IVT和RT期间发生的非天然核苷酸损失(即，排除在IVT模板的PCR制备期间发生的任何损失)，所述测定还分析了反义DNA模板(R(asDNA))的非天然核苷酸含量(图4)。组合T-RT保真度计算如下：

其中包括常数α＝1.06以说明制备bio-dsDNA所需的另外的PCR步骤中UBP损失的贡献。由于T-RT保留对应于转录和逆转录期间的非天然核苷酸损失，因此它在T-RT反应的任一步骤中提供了非天然核苷酸保留的下限。

首先应用T-RT保真度测定来确定含有包括AXC、AYC、GXC、GYC、GXT或GYT(X＝NaM并且Y＝TPT3)的非天然第151个密码子的EGFP mRNA的IVT转录保真度的下限，所述密码子中的每一个已被用于在哺乳动物细胞中表达非天然蛋白质。值得注意的是，具有NaM或TPT3的所有序列产生全长cDNA作为主要产物，其中组合T-RT保留为90％至100％(图5A、图6)。至少在这种序列背景下，非天然碱基对在体外以合理的保真度进行转录(和逆转录)。

接下来，研究了具有反密码子GYT、GXT、GYC、GXC、CYA和CXA的马氏甲烷八叠球菌(M.mazei)tRNA的T-RT。每个tRNA基因，无论其是否含有NaM或TPT3，都再次产生全长cDNA作为主要产物，并且非天然核苷酸保留在90％至100％范围内(图5B、图6)。增加的tRNA结构并没有明显阻碍其体外转录和用非天然反密码子的逆转录。

先前报道，HEK293T细胞能够使用EGFP(GXC)mRNA和马氏甲烷八叠球菌tRNA(GYC)产生含有ncAA AzK的EGFP蛋白。(Zhou等人,Progress toward Eukaryotic SemisyntheticOrganisms:Translation of Unnatural Codons.J.Am.Chem.Soc.2019,141,20166–20170.)在这些先前的实验中，将HEK293T细胞与AzK一起提供，并且用分别含有非天然密码子和反密码子的mRNA和tRNA以及编码嵌合PylRS的DNA质粒转染，所述DNA质粒用AzK改变马氏甲烷八叠球菌tRNA。用于制备mRNA的DNA模板的80％含有非天然核苷酸，并且在体内表达的蛋白质的70％含有AzK。通过对EGFP(GXC)基因的最小转录保真度的上述分析，真核核糖体的翻译保真度估计为：

先前已在大肠杆菌SSO中鉴定出若干个非天然密码子，包括AXA、AXT、TXA和TXT，如在DNA复制期间很好地保留但只能低效产生具有ncAA的蛋白质。(Fischer等人,New Codonsfor Efficient Production of Unnatural Proteins in a SemisyntheticOrganism.Nat.Chem.Biol.2020,16,570–576.)这表明它们在SSO中没有被T7 RNAP很好地转录和/或它们在核糖体上没有被很好地解码。对单独含有每个密码子的DNA进行开发的体外T-RT测定。再次显示每个模板产生全长cDNA作为主要产物，其中非天然核苷酸保留为约90％(图5A)。这些数据证明转录是相对高效的，并表明这些密码子不能高效地参与翻译。

实施例4.在大肠杆菌SSO中体内转录的表征

使用实施例3中开发的T-RT保留测定表征从大肠杆菌SSO分离的RNA。用分别编码含有第151个密码子AXC、GXC或GXT的sfGFP基因和含有相应反密码子GYT、GYC或AYC的马氏甲烷八叠球菌tRNA基因的pSyn质粒转化ML2细胞。在每种情况下，SSO先前都显示出以高保真度产生非天然蛋白质(Fischer,E.C.等人,Nat.Chem.Biol.2020,16,570–576)。此处，如上所述分析asDNA中以及每个mRNA和tRNA内非天然核苷酸的保留。数据揭示，NaM密码子的转录在SSO中进行且几乎没有非天然核苷酸的损失。对于tRNA，TPT3反密码子的保留在85％至100％范围内(图7A-图7B、表2)。

表2.从SSO体内翻译实验提取的mRNA和tRNA的T-RT保留和标准偏差的原始数据。

(n＝3)。

数据表明，含有NaM的mRNA的转录保真度较高，并且含有TPT3的tRNA的转录保真度略低，这不会导致ncAA掺入的保真度降低。

与上述检查的密码子形成对照，大肠杆菌SSO先前显示出不能使用TPT3密码子AYC、GYC或GYT(也在密码子151处)和使用含有相应非天然反密码子的马氏甲烷八叠球菌tRNA高效地产生sfGFP蛋白(Fischer,E.C.等人,Nat.Chem.Biol.2020,16,570–576)。此处，检查了相应mRNA和tRNA的SSO转录(图7A-图7B、表2)。数据揭示，产生含有每一个功能较弱的密码子/反密码子对的mRNA和tRNA的效率和保真度与先前分析的介导高水平ncAA掺入的对难以区分。这表明SSO中的AYC、GYC或GYT密码子的较差性能是由于大肠杆菌核糖体降低翻译效率所致。也就是说，在大肠杆菌SSO中，相比于转录，翻译通常对UBP序列背景更敏感。

除了没有很好地翻译的TPT3密码子外，一个NaM密码子GXA产生了具有一定程度受损的ncAA掺入保真度(50％-60％)的sfGFP，尽管其在DNA中的保留很高。当检查在携带该密码子/反密码子对的SSO中产生的RNA时，发现tRNA、尤其是mRNA都以略低的保真度产生，其在两种情况下都为约80％(图7A-图7B、表2)。考虑到天然mRNA的非线性贡献的可能性(由于更高效的翻译)，该数据表明，与其他密码子相比，对SSO中GXA密码子的ncAA掺入保真度降低的显著贡献源于转录保真度降低。

实施例5.非天然核糖核苷酸三磷酸浓度对在SSO中转录的影响

进一步使用上述T-RT保真度测定探索转录保真度对非天然核糖核苷酸三磷酸浓度的依赖性。如上所述培养携带sfGFP(GXT)和马氏甲烷八叠球菌tRNA(AYC)的SSO，不同的是提供了不同量的NaMTP或TPT3TP。当TPT3TP的浓度在250mM下保持恒定并且NaMTP的浓度降低时，NaM在mRNA中的保留保持较高，直到浓度降至小于50μM(图8A-图8B、表3)。当NaMTP的浓度在250mM下保持恒定并且TPT3TP的浓度变化时，即使在检测的最低浓度(10μM)下，TPT3在tRNA中的保留也保持较高(图8A-图8B、表3)。因此，相比于NaMTP，SSO可以耐受更低浓度的TPT3TP。

表3.SSO体内翻译实验中T-RT保留对NaMTP或TPT3TP浓度的依赖性的原始数据。(n＝3)。

实施例7.使用转录和逆转录实现RNA适配体选择的扩展

为了开发靶向目的蛋白的RNA适配体，首先通过IVT由DNA产生RNA文库，对其进行选择以使文库富集所需的RNA，通过RT转化回DNA以用于PCR扩增，然后通过IVT分析或转化回RNA，并进行另外轮次的选择。因此，为了开发包含非天然核苷酸的RNA适配体，含有非天然核酸的DNA必须高效地逆转录成包含非天然寡核苷酸的RNA。在本实施例中，将一系列具有非天然核苷酸的相关DNA寡核苷酸转化为具有相应非天然核苷酸的RNA，然后针对抑制效力对其进行选择。寡核苷酸的长度可以是约100个碱基。将初始DNA寡核苷酸中约40个核苷酸的区域随机化，并将单个dNaM掺入所述区域的多个(例如，3个)不同位置处，两侧侧接条形码序列(用于鉴定非天然核苷酸位置)和引物结合序列。由此产生了多个(例如，3个)相关的DNA文库。在包括dTPT3TP和dNaMTP的反应中对多个随机化寡核苷酸文库的等摩尔混合物进行PCR扩增。引发dTPT3核苷酸合成的引物包含经由二硫键或其他可裂解部分附接至其5'端的生物素标签，所述生物素标签是可商购并且常用的。扩增后，通过以下方式纯化dsDNA：与链霉亲和素包被的磁珠结合，对磁珠进行缓冲液洗涤步骤，然后用0.1mM NaOH洗涤以洗脱含有dNaM的ssDNA文库。含有dTPT3的ssDNA文库可以通过使用30mM三(2-羧乙基)膦(TCEP)(或任何其他合适的试剂)的还原裂解从珠粒释放。然后，任一ssDNA文库可以用作用于补充有适当的非天然核糖三磷酸(TPT3TP或NaMTP)的由T7 RNA聚合酶介导的IVT反应的模板。对DNA进行核降解并且纯化文库(例如，用旋转柱如Zymo-ssDNA/RNA纯化试剂盒)。

文库是折叠的。然后针对与目的蛋白的结合对得到的折叠文库进行选择。将文库与目的靶蛋白一起孵育，例如固定在高蛋白吸附ELISA板上，洗涤，然后通过用甲酰胺洗涤三次来洗脱。通过各种方法增加对于与目的蛋白结合的选择压力，包括在随后轮次的选择中逐渐提高洗涤缓冲液中的盐浓度或在结合缓冲液中添加酵母tRNA作为结合竞争物。在每轮选择之后，分离与目的蛋白结合的RNA，并洗脱RNA寡核苷酸。根据本文所述的方法将RNA寡核苷酸逆转录成cDNA。用dTPT3TP和dNaMTP以及相同的生物素化引物对cDNA进行PCR扩增，并根据需要进行另外轮次的选择，从而提供一组富集的适配体。

在上述步骤后的若干轮选择之后，将富集的单独RNA适配体逆转录成cDNA，进行PCR扩增，并测序(例如，其中用天然核苷酸代替非天然核苷酸进行测序，并且依赖条形码序列来鉴定非天然核苷酸位置)。研究了富集的RNA寡核苷酸之间的序列同源性，并选择了序列子集以用于进一步表征。然后合成并折叠所选择的RNA适配体。然后单独分析每种适配体结合靶蛋白的能力(或者如果靶蛋白是酶，则分析抑制其活性的能力)。适配体的抑制效力被定量为K_d或K_i值。任选地，最有前景的RNA寡核苷酸可以被逆转录成cDNA，并经由易错PCR进一步随机化其序列，以产生另外的文库以用于进一步轮次的选择。

***

虽然已经在此示出并描述了本公开的优选实施方案，但是对本领域的普通技术人员而言应该显而易见的是这样的实施方案仅以举例方式提供。在不偏离本公开文本的情况下，本领域技术人员现将想到许多变化、改变和替换。应当理解，在此描述的本公开的实施方案的不同替代方案可以用于实施本公开。以下权利要求旨在限定本公开的范围，并且在这些权利要求及其等同物的范围内的方法和结构涵盖在其中。

SEQUENCE LISTING

<110> 斯克利普斯研究所

新索思股份有限公司

<120> 包含非天然核苷酸的多核苷酸的逆转录

<130> 36271-812.601

<140>

<141>

<150> 63/104,785

<151> 2020-10-23

<160> 34

<170> PatentIn version 3.5

<210> 1

<211> 49

<212> DNA

<213> Artificial Sequence

<220>

<223> Description of Artificial Sequence: Synthetic

primer

<400> 1

gacaaattaa tacgactcac tataggaaac ctgatcatgt agatcgaac 49

<210> 2

<211> 21

<212> DNA

<213> Artificial Sequence

<220>

<223> Description of Artificial Sequence: Synthetic

primer

<400> 2

ccccaggctt tacactttat g 21

<210> 3

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> Description of Artificial Sequence: Synthetic

oligonucleotide

<220>

<223> Description of Combined DNA/RNA Molecule: Synthetic

oligonucleotide

<400> 3

tggcggaaac cccgggaatc taacccggct gaacggatt 39

<210> 4

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> Description of Artificial Sequence: Synthetic

primer

<400> 4

ggaatctaac ccggctgaac 20

<210> 5

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<223> Description of Artificial Sequence: Synthetic

primer

<400> 5

ggaatctaac ccggctgaac cctcgatgtt gtggcggatc 40

<210> 6

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<223> Description of Artificial Sequence: Synthetic

primer

<400> 6

gattccattc ttttgtttgt ctgctggcgg aaaccccggg aatc 44

<210> 7

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<223> Description of Artificial Sequence: Synthetic

primer

<400> 7

ggaatctaac ccggctgaac gattccattc ttttgtttgt ctgc 44

<210> 8

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<223> Description of Artificial Sequence: Synthetic

primer

<400> 8

atgggtctca cacaaactcg agtacaactt taactcacac 40

<210> 9

<211> 33

<212> DNA

<213> Artificial Sequence

<220>

<223> Description of Artificial Sequence: Synthetic

primer

<400> 9

atgggtctcg attccattct tttgtttgtc tgc 33

<210> 10

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<223> Description of Artificial Sequence: Synthetic

primer

<400> 10

atgggtctcg aaacctgatc atgtagatcg aacgg 35

<210> 11

<211> 28

<212> DNA

<213> Artificial Sequence

<220>

<223> Description of Artificial Sequence: Synthetic

primer

<400> 11

atgggtctca tctaacccgg ctgaacgg 28

<210> 12

<211> 19

<212> DNA

<213> Artificial Sequence

<220>

<223> Description of Artificial Sequence: Synthetic

primer

<400> 12

taatacgact cactatagg 19

<210> 13

<211> 63

<212> DNA

<213> Artificial Sequence

<220>

<223> Description of Artificial Sequence: Synthetic

oligonucleotide

<400> 13

ctcgagtaca actttaactc acacaatgta tacatcacgg cagacaaaca aaagaatgga 60

atc 63

<210> 14

<211> 63

<212> DNA

<213> Artificial Sequence

<220>

<223> Description of Artificial Sequence: Synthetic

oligonucleotide

<400> 14

ctcgagtaca actttaactc acacaatgta gtaatcacgg cagacaaaca aaagaatgga 60

atc 63

<210> 15

<211> 63

<212> DNA

<213> Artificial Sequence

<220>

<223> Description of Artificial Sequence: Synthetic

oligonucleotide

<220>

<223> Description of Combined DNA/RNA Molecule: Synthetic

oligonucleotide

<220>

<221> modified_base

<222> (32)..(32)

<223> unnatural ribonucleotide NaM

<400> 15

ctcgagtaca actttaactc acacaatgta ancatcacgg cagacaaaca aaagaatgga 60

atc 63

<210> 16

<211> 63

<212> DNA

<213> Artificial Sequence

<220>

<223> Description of Artificial Sequence: Synthetic

oligonucleotide

<220>

<223> Description of Combined DNA/RNA Molecule: Synthetic

oligonucleotide

<220>

<221> modified_base

<222> (32)..(32)

<223> unnatural ribonucleotide TPT3

<400> 16

ctcgagtaca actttaactc acacaatgta ancatcacgg cagacaaaca aaagaatgga 60

atc 63

<210> 17

<211> 63

<212> DNA

<213> Artificial Sequence

<220>

<223> Description of Artificial Sequence: Synthetic

oligonucleotide

<220>

<223> Description of Combined DNA/RNA Molecule: Synthetic

oligonucleotide

<220>

<221> modified_base

<222> (32)..(32)

<223> unnatural ribonucleotide NaM

<400> 17

ctcgagtaca actttaactc acacaatgta gncatcacgg cagacaaaca aaagaatgga 60

atc 63

<210> 18

<211> 63

<212> DNA

<213> Artificial Sequence

<220>

<223> Description of Artificial Sequence: Synthetic

oligonucleotide

<220>

<223> Description of Combined DNA/RNA Molecule: Synthetic

oligonucleotide

<220>

<221> modified_base

<222> (32)..(32)

<223> unnatural ribonucleotide TPT3

<400> 18

ctcgagtaca actttaactc acacaatgta gncatcacgg cagacaaaca aaagaatgga 60

atc 63

<210> 19

<211> 63

<212> DNA

<213> Artificial Sequence

<220>

<223> Description of Artificial Sequence: Synthetic

oligonucleotide

<220>

<223> Description of Combined DNA/RNA Molecule: Synthetic

oligonucleotide

<220>

<221> modified_base

<222> (32)..(32)

<223> unnatural ribonucleotide NaM

<400> 19

ctcgagtaca actttaactc acacaatgta gntatcacgg cagacaaaca aaagaatgga 60

atc 63

<210> 20

<211> 63

<212> DNA

<213> Artificial Sequence

<220>

<223> Description of Artificial Sequence: Synthetic

oligonucleotide

<220>

<223> Description of Combined DNA/RNA Molecule: Synthetic

oligonucleotide

<220>

<221> modified_base

<222> (32)..(32)

<223> unnatural ribonucleotide TPT3

<400> 20

ctcgagtaca actttaactc acacaatgta gntatcacgg cagacaaaca aaagaatgga 60

atc 63

<210> 21

<211> 63

<212> DNA

<213> Artificial Sequence

<220>

<223> Description of Artificial Sequence: Synthetic

oligonucleotide

<220>

<223> Description of Combined DNA/RNA Molecule: Synthetic

oligonucleotide

<220>

<221> modified_base

<222> (32)..(32)

<223> unnatural ribonucleotide NaM

<400> 21

ctcgagtaca actttaactc acacaatgta anaatcacgg cagacaaaca aaagaatgga 60

atc 63

<210> 22

<211> 63

<212> DNA

<213> Artificial Sequence

<220>

<223> Description of Artificial Sequence: Synthetic

oligonucleotide

<220>

<223> Description of Combined DNA/RNA Molecule: Synthetic

oligonucleotide

<220>

<221> modified_base

<222> (32)..(32)

<223> unnatural ribonucleotide NaM

<400> 22

ctcgagtaca actttaactc acacaatgta antatcacgg cagacaaaca aaagaatgga 60

atc 63

<210> 23

<211> 63

<212> DNA

<213> Artificial Sequence

<220>

<223> Description of Artificial Sequence: Synthetic

oligonucleotide

<220>

<223> Description of Combined DNA/RNA Molecule: Synthetic

oligonucleotide

<220>

<221> modified_base

<222> (32)..(32)

<223> unnatural ribonucleotide NaM

<400> 23

ctcgagtaca actttaactc acacaatgta tnaatcacgg cagacaaaca aaagaatgga 60

atc 63

<210> 24

<211> 63

<212> DNA

<213> Artificial Sequence

<220>

<223> Description of Artificial Sequence: Synthetic

oligonucleotide

<220>

<223> Description of Combined DNA/RNA Molecule: Synthetic

oligonucleotide

<220>

<221> modified_base

<222> (32)..(32)

<223> unnatural ribonucleotide NaM

<400> 24

ctcgagtaca actttaactc acacaatgta tntatcacgg cagacaaaca aaagaatgga 60

atc 63

<210> 25

<211> 63

<212> DNA

<213> Artificial Sequence

<220>

<223> Description of Artificial Sequence: Synthetic

oligonucleotide

<220>

<223> Description of Combined DNA/RNA Molecule: Synthetic

oligonucleotide

<220>

<221> modified_base

<222> (32)..(32)

<223> unnatural ribonucleotide NaM

<400> 25

ctcgagtaca actttaactc acacaatgta gnaatcacgg cagacaaaca aaagaatgga 60

atc 63

<210> 26

<211> 52

<212> DNA

<213> Artificial Sequence

<220>

<223> Description of Artificial Sequence: Synthetic

oligonucleotide

<400> 26

cctgatcatg tagatcgaac ggactgtaaa tccgttcagc cgggttagat tc 52

<210> 27

<211> 52

<212> DNA

<213> Artificial Sequence

<220>

<223> Description of Artificial Sequence: Synthetic

oligonucleotide

<400> 27

cctgatcatg tagatcgaac ggactctaaa tccgttcagc cgggttagat tc 52

<210> 28

<211> 52

<212> DNA

<213> Artificial Sequence

<220>

<223> Description of Artificial Sequence: Synthetic

oligonucleotide

<220>

<223> Description of Combined DNA/RNA Molecule: Synthetic

oligonucleotide

<220>

<221> modified_base

<222> (27)..(27)

<223> unnatural ribonucleotide TPT3

<400> 28

cctgatcatg tagatcgaac ggactgntaa tccgttcagc cgggttagat tc 52

<210> 29

<211> 52

<212> DNA

<213> Artificial Sequence

<220>

<223> Description of Artificial Sequence: Synthetic

oligonucleotide

<220>

<223> Description of Combined DNA/RNA Molecule: Synthetic

oligonucleotide

<220>

<221> modified_base

<222> (27)..(27)

<223> unnatural ribonucleotide NaM

<400> 29

cctgatcatg tagatcgaac ggactgntaa tccgttcagc cgggttagat tc 52

<210> 30

<211> 52

<212> DNA

<213> Artificial Sequence

<220>

<223> Description of Artificial Sequence: Synthetic

oligonucleotide

<220>

<223> Description of Combined DNA/RNA Molecule: Synthetic

oligonucleotide

<220>

<221> modified_base

<222> (27)..(27)

<223> unnatural ribonucleotide TPT3

<400> 30

cctgatcatg tagatcgaac ggactgncaa tccgttcagc cgggttagat tc 52

<210> 31

<211> 52

<212> DNA

<213> Artificial Sequence

<220>

<223> Description of Artificial Sequence: Synthetic

oligonucleotide

<220>

<223> Description of Combined DNA/RNA Molecule: Synthetic

oligonucleotide

<220>

<221> modified_base

<222> (27)..(27)

<223> unnatural ribonucleotide NaM

<400> 31

cctgatcatg tagatcgaac ggactgncaa tccgttcagc cgggttagat tc 52

<210> 32

<211> 52

<212> DNA

<213> Artificial Sequence

<220>

<223> Description of Artificial Sequence: Synthetic

oligonucleotide

<220>

<223> Description of Combined DNA/RNA Molecule: Synthetic

oligonucleotide

<220>

<221> modified_base

<222> (27)..(27)

<223> unnatural ribonucleotide TPT3

<400> 32

cctgatcatg tagatcgaac ggactancaa tccgttcagc cgggttagat tc 52

<210> 33

<211> 52

<212> DNA

<213> Artificial Sequence

<220>

<223> Description of Artificial Sequence: Synthetic

oligonucleotide

<220>

<223> Description of Combined DNA/RNA Molecule: Synthetic

oligonucleotide

<220>

<221> modified_base

<222> (27)..(27)

<223> unnatural ribonucleotide NaM

<400> 33

cctgatcatg tagatcgaac ggactancaa tccgttcagc cgggttagat tc 52

<210> 34

<211> 52

<212> DNA

<213> Artificial Sequence

<220>

<223> Description of Artificial Sequence: Synthetic

oligonucleotide

<220>

<223> Description of Combined DNA/RNA Molecule: Synthetic

oligonucleotide

<220>

<221> modified_base

<222> (27)..(27)

<223> unnatural ribonucleotide TPT3

<400> 34

cctgatcatg tagatcgaac ggacttncaa tccgttcagc cgggttagat tc 52

Claims

1.一种逆转录包含非天然核糖核苷酸的多核苷酸的方法，所述方法包括在存在包含非天然核碱基的非天然dNTP的情况下用逆转录酶逆转录所述多核苷酸，

2.根据权利要求1所述的方法，其中：

(a)所述多核苷酸以小于或等于约500nM的浓度存在；

(b)所述逆转录酶是SuperScript III；

(c)所述非天然dNTP不是dTPT3TP；

(d)所述方法进一步包括使用识别所述非天然核苷酸的结合配偶体测量所述cDNA中的所述非天然核苷酸的量；

(e)所述逆转录酶产生全长cDNA，并且至少25％的所述全长cDNA包含所述非天然核苷酸；和/或

(f)所述多核苷酸是tRNA、mRNA、RNA适配体、或多种RNA适配体侯选物的成员。

3.根据权利要求1或2所述的方法，其中所述多核苷酸是RNA，任选地其中所述RNA是mRNA或tRNA。

4.根据权利要求1-3中任一项所述的方法，所述方法进一步包括测量所述cDNA中的所述非天然核苷酸的量。

5.一种测量非天然核苷酸的掺入的方法，所述方法包括：

c.测量所述cDNA中的所述第二非天然核苷酸的量。

6.根据权利要求5所述的方法，其中所述转录步骤是在体内进行的。

7.根据前一项权利要求所述的方法，其中所述转录步骤是在原核生物或细菌中进行的。

8.根据前一项权利要求所述的方法，其中所述转录步骤是在大肠杆菌(E.coli)中进行的。

9.根据权利要求5所述的方法，其中所述转录步骤是在体外进行的。

10.根据权利要求5-9中任一项所述的方法，其中所述cDNA分子中的所述第二非天然核苷酸的量是相对于转录前所述多核苷酸中的所述非天然脱氧核糖核苷酸的量进行测量的。

11.根据权利要求5-10中任一项所述的方法，其中所述测量包括：

12.根据权利要求4-10中任一项所述的方法，其中所述cDNA中的所述非天然核苷酸或所述第二非天然核苷酸的量是使用结合非天然核碱基的结合配偶体测量的。

13.根据权利要求4-10中任一项所述的方法，其中测量所述cDNA中的所述非天然核苷酸或所述第二非天然核苷酸的量包括凝胶移位测定或生物素移位测定。

14.根据前一项权利要求所述的方法，其中所述生物素移位测定包括：

15.根据前一项权利要求所述的方法，其中将包含所述生物素化核苷酸的DNA扩增产物与不包含所述生物素化核碱基的DNA扩增产物分离包括凝胶电泳，任选地其中所述凝胶电泳是聚丙烯酰胺凝胶电泳。

16.根据权利要求14-15中任一项所述的方法，其中将包含所述生物素化核苷酸的DNA扩增产物与不包含所述生物素化核苷酸的DNA扩增产物分离包括将所述扩增产物与链霉亲和素一起孵育。

17.根据前述权利要求中任一项所述的方法，其中所述RNA或多核苷酸在逆转录期间以小于或等于约1μM的浓度存在。

18.根据前述权利要求中任一项所述的方法，其中所述RNA或多核苷酸在逆转录期间以约1-10nM、约10-20nM、约20-30nM、约30-40nM、约40-50nM、约50-75nM、约75-100nM、约100-150nM、约150-200nM、约200-300nM、约300-400nM或约400-500nM范围内的浓度存在。

19.根据前述权利要求中任一项所述的方法，其中所述逆转录酶产生全长cDNA，并且其中至少25％的所述全长cDNA包含所述非天然核苷酸。

20.根据前一项权利要求所述的方法，其中至少50％、75％、80％、85％、90％、95％、97％、98％或99％的所述未截短的cDNA包含所述非天然核苷酸。

21.根据前述权利要求中任一项所述的方法，其中包含所述非天然核糖核苷酸的RNA或多核苷酸是mRNA。

22.根据权利要求20所述的方法，其中所述非天然核糖核苷酸(X或Y)位于所述mRNA的密码子的第一位置(X-N-N或Y-N-N)。

23.根据权利要求20所述的方法，其中所述非天然核糖核苷酸(X或Y)位于所述mRNA的密码子的中间位置(N-X-N或N-Y-N)。

24.根据权利要求20所述的方法，其中所述非天然核糖核苷酸(X或Y)位于所述mRNA的密码子的最后位置(N-N-X或N-N-Y)。

25.根据权利要求1-24中任一项所述的方法，其中所述mRNA中含有所述非天然核糖核苷酸的密码子是AXC、AYC、GXC、GYC、GXT、GYT、AXA、AXT、TXA或TXT。

26.根据权利要求1-20中任一项所述的方法，其中包含所述非天然核糖核苷酸的RNA或多核苷酸是tRNA。

27.根据权利要求26所述的方法，其中所述非天然核糖核苷酸(X或Y)位于所述tRNA的反密码子的第一位置(X-N-N或Y-N-N)。

28.根据权利要求26所述的方法，其中所述非天然核糖核苷酸(X或Y)位于所述tRNA的反密码子的中间位置(N-X-N或N-Y-N)。

29.根据权利要求26所述的方法，其中所述非天然核糖核苷酸(X或Y)位于所述tRNA的反密码子的最后位置(N-N-X或N-N-Y)。

30.根据权利要求26-29中任一项所述的方法，其中所述tRNA的反密码子是GYT、GXT、GYC、GXC、CYA、CXA、AYC或AXC。

31.根据权利要求1-30中任一项所述的方法，其中所述非天然核糖核苷酸是X，其中X包含作为所述非天然核糖核苷酸的核碱基(NaM)。

32.根据权利要求1-30中任一项所述的方法，其中所述非天然核糖核苷酸是Y，其中Y包含作为所述非天然核糖核苷酸的核碱基(TPT3)。

33.根据权利要求1-20或31-32中任一项所述的方法，其中所述RNA是RNA适配体。

34.一种筛选RNA适配体候选物的方法，所述方法包括：

35.根据前一项权利要求所述的方法，其中所述多种不同的RNA寡核苷酸包含随机化核苷酸区域。

36.根据前一项权利要求所述的方法，其中所述随机化核苷酸区域包含所述至少一个非天然核苷酸。

37.根据权利要求34-36中任一项所述的方法，其中所述RNA寡核苷酸包含条形码序列和/或引物结合序列。

38.根据权利要求34-37中任一项所述的方法，其中所述方法进一步包括对所述cDNA分子进行测序。

39.根据权利要求34-38中任一项所述的方法，其中进行至少一轮选择包括洗涤步骤以去除未结合或弱结合的RNA寡核苷酸。

40.根据权利要求34-39中任一项所述的方法，其中所述方法进一步包括使所述cDNA分子的序列突变以产生多个另外的序列。

41.根据前一项权利要求所述的方法，其中将所述多个另外的序列转录成RNA，并对与所述靶标结合的RNA适配体再进行至少一轮选择。

42.根据权利要求40-41中任一项所述的方法，其中使所述cDNA分子的序列突变包括易错PCR。

43.根据权利要求34-42中任一项所述的方法，其中所述方法进一步包括在另外一轮选择中增加与所述靶标结合的选择压力。

44.根据前一项权利要求所述的方法，其中增加选择压力包括在比前一轮更高的盐浓度下进行一个或多个洗涤步骤和/或在所述选择期间包括结合竞争物。

45.根据权利要求34-44中任一项所述的方法，所述方法进一步包括分析所述RNA适配体结合所述靶标的能力。

46.根据前一项权利要求所述的方法，其中分析所述RNA适配体结合所述靶标的能力包括测定K_d、k_on或k_off。

47.根据权利要求34-44中任一项所述的方法，所述方法进一步包括分析所述RNA适配体使所述靶标激动的能力。

48.根据前一项权利要求所述的方法，其中分析所述RNA适配体使所述靶标激动的能力包括测定EC₅₀值。

49.根据权利要求34-44中任一项所述的方法，所述方法进一步包括分析所述RNA适配体拮抗所述靶标的能力。

50.根据前一项权利要求所述的方法，其中分析所述RNA适配体拮抗所述靶标的能力包括测定K_i或IC₅₀值。

51.根据前述权利要求中任一项所述的方法，其中至少一个非天然核苷酸包含：

52.根据前一项权利要求所述的方法，其中经历逆转录的多核苷酸中的至少一个非天然核苷酸包含：

53.根据权利要求51或52所述的方法，其中掺入cDNA中的至少一个非天然核苷酸包含：

54.根据权利要求51-53中任一项所述的方法，其中所述至少一个非天然核苷酸包含：

55.根据权利要求51-53所述的方法，其中所述至少一个非天然核苷酸包含：

56.根据前述权利要求中任一项所述的方法，其中所述逆转录酶是禽成髓细胞瘤病毒(AMV)逆转录酶、莫洛尼氏鼠白血病病毒(MMLV)逆转录酶、Super Script II(SS II)逆转录酶、Super Script III(SS III)逆转录酶、Super Script IV(SS IV)逆转录酶或Volcano2G(V2G)逆转录酶。

57.根据前述权利要求中任一项所述的方法，其中所述逆转录酶是SuperScript III。

58.根据前述权利要求中任一项所述的方法，其中所述非天然dNTP不是dTPT3TP。

59.根据前述权利要求中任一项所述的方法，其中所述逆转录发生在体外。