CN102203292B - 通过质谱分析法测序核酸分子 - Google Patents

通过质谱分析法测序核酸分子 Download PDF

Info

Publication number
CN102203292B
CN102203292B CN200980143211.8A CN200980143211A CN102203292B CN 102203292 B CN102203292 B CN 102203292B CN 200980143211 A CN200980143211 A CN 200980143211A CN 102203292 B CN102203292 B CN 102203292B
Authority
CN
China
Prior art keywords
nucleic acid
acid molecule
fragment
modification
nucleotide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN200980143211.8A
Other languages
English (en)
Other versions
CN102203292A (zh
Inventor
J·图尔纳
J·胡斯
S·克鲁斯曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TME Pharma AG
Original Assignee
Noxxon Pharma AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Noxxon Pharma AG filed Critical Noxxon Pharma AG
Publication of CN102203292A publication Critical patent/CN102203292A/zh
Application granted granted Critical
Publication of CN102203292B publication Critical patent/CN102203292B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6872Methods for sequencing involving mass spectrometry
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10TTECHNICAL SUBJECTS COVERED BY FORMER US CLASSIFICATION
    • Y10T436/00Chemistry: analytical and immunological testing
    • Y10T436/14Heterocyclic carbon compound [i.e., O, S, N, Se, Te, as only ring hetero atom]
    • Y10T436/142222Hetero-O [e.g., ascorbic acid, etc.]
    • Y10T436/143333Saccharide [e.g., DNA, etc.]

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Physics & Mathematics (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Immunology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本发明涉及测定核酸分子的核苷酸序列的方法,包括下列步骤:a)提供具有至少一个修饰的核酸分子的多个分子;b)随机断裂多个修饰的核酸分子,因此提供修饰的核酸分子片段和未修饰核酸分子片段;c)分离所述修饰的核酸分子片段和所述未修饰核酸分子片段;d)根据其长度、质量和/或电荷分离或分辨所述修饰的核酸分子片段,其中这类分离或分辨生成修饰的核酸片段的模式;和e)任选地,可视化所述修饰的核酸片段的模式。

Description

通过质谱分析法测序核酸分子
本发明涉及分析和/或测定核酸分子的核苷酸序列的方法。
发明背景
核酸分子被用作诊断工具和/或治疗剂,由此,可以通过筛选部分或完全随机化的核酸分子文库鉴定核酸分子,或者根据计算机算法辅助的互补序列进行预测,如针对反义、siRNA和miRNA所进行的。核酸分子可以是单链或双链分子,它们可以被构造或不被构造,它们可以缀合至肽、蛋白质、多糖和其它较大分子,它们的糖主链(骨架)可以由核糖、脱氧核糖和/或其修饰的衍生物组成。
核酸分子的功能可以基于
a)以反义核酸分子、催化核酸分子、siRNA分子和微RNA分子形式与mRNA进行序列特异性杂交并且关闭mRNA(Couzin,2004;Crooke,2004;Hannon,2002;Juliano等人,2008;Scherer & Rossi,2003;Schlosser等人,2006;Usman & Blatt,2000;Weigand等人,2006;Zhang & Farwell,2008);
b)或者核酸分子与靶分子结合和/或通过核酸分子阻断靶分子的功能,其中核酸分子包括适配体、Spiegelmers和诱饵核酸(Carothers &Szostak,2006;Cload等人,2006;Eulberg等人,2006;Mann &Dzau,2000;Nimjee等人,2006;Realini等人,2006);
c)或者它们对免疫系统的刺激作用,例如,以CpG-DNA(Weiner,2000)和随机寡核苷酸形式。
这种核酸分子作为诊断工具和/或作为治疗剂的生产、开发和使用使验证核酸分子同一性的方法成为必要,其中对于灵敏、精确和可重复的分析存在需要。同一性的验证需要测定核酸分子的分子量和长度以及其碱基组成、序列、和糖部分和核苷酸内键合的同一性。使用的方法应是特异性的,允许鉴定修饰的碱基和修饰的糖部分,添加或缺失产物以及脱嘌呤产物。核苷酸序列的测定必须是完全的,并且其必须显示任何化学或酶促操作没有不利地影响碱基或主链。修饰的核酸分子的表征特别具有挑战性——如果它们是核酸酶稳定的。这种核酸酶稳定的核酸分子在糖主链的2’-位被修饰或者由镜像核苷酸组成。但是,已经开发了多种技术,包括例如电泳、酶促和化学分析、阵列技术和质谱分析法,以测定核酸分子的核苷酸序列。
通过酶促和化学分析进行核酸的核苷酸序列测定
在二十世纪70年代,开发了三种核酸分子测序技术,它们是在许多实验室中实践的普通并且相对快速的方法。
Maxam和Gilber的DNA测序方法。由Maxam和Gilbert描述的方法描述了这样的过程,其中末端标记的DNA分子以核碱基特异性的方式化学断裂。然后,核酸分子序列中的每一碱基位置从核碱基特异断裂产生的片段的分子量进行测定。单独的反应被设计以在鸟嘌呤、腺嘌呤、胞嘧啶和胸腺嘧啶、和单独的胞嘧啶处优先断裂。在这四种反应的产物经由不断增加片段大小的增加的负电荷通过分子量分辨时,例如使用聚丙烯酰胺凝胶电泳,可以从分辨凝胶上的片段的模式读取DNA分子的序列(Maxam & Gilbert,1977)。
Sanger的DNA测序方法。由Sanger等人开发的其它方法利用双脱氧核苷三磷酸(缩写ddNTPs)的链终止能力和DNA聚合酶并入具有与DNA聚合酶的天然底物——脱氧核苷三磷酸(缩写dNTPs)——几乎相等保真度的ddNTP的能力。简而言之,引物分子——通常为寡核苷酸分子,和模板DNA分子在有用浓度的所有四种dNTPs和有限量的单一ddNTP的存在下进行温育。DNA聚合酶偶尔将终止链延伸的双脱氧核苷酸并入增长中的扩增链中。因为双脱氧核苷酸没有3’-羟基,所以失去聚合酶的起始点。聚合产生不同大小的核酸分子片段的混合物,其全部具有相同的5’-末端。通过例如聚丙烯酰胺凝胶电泳进行的混合物的分部分离产生表示核酸分子中每一核苷酸存在和位置的模式(图案)。与四种ddNTP每一种的反应允许以与使用由Maxam和Gilbert开发的技术(Maxam&Gilbert,1977)所进行的相似的方式从分辨凝胶读取核酸分子序列(Sanger等人,1977)。
Peattie的RNA测序方法。由于RNA分子具有不同的化学特征以及与DNA分子相比RNA分子具有更大的不稳定性,Maxam和Gilbert的化学方法不适用于RNA分子。Peattie开发了测序RNA分子的化学方法,其中RNA分子被3’放射标记并且以核碱基特异性的方式化学断裂。然后,核酸分子的核酸序列中的每一核苷酸位置根据由核碱基特异性的断裂产生的核酸分子的分子量确定。单独的反应被设计以在鸟嘌呤、腺嘌呤或鸟嘌呤、在胞嘧啶和尿嘧啶以及在单独的尿嘧啶处优先断裂。当例用例如迁移率不同经由聚丙烯酰胺凝胶电泳通过分子量分辨这四种反应的产物时,可以从分辨凝胶上片段的模式读取RNA分子的序列(Peattie,1979)。
基于Sanger方法的RNA测序方法。最一般的RNA分子序列鉴定方法是如前面描述的Sanger方法。在RNA分子的情况下,双脱氧链终止反应由读取RNA分子模板并插入互补脱氧核苷酸的逆转录酶催化。与在DNA测序中使用的聚合酶相同,逆转录反应被双脱氧核苷酸抑制(Zimmern & Kaesberg,1978)。
RNA指纹分析。在RNA指纹法中,用两种或更多种内切核酸酶单独消化RNA分子,其中内切核酸酶特异性断裂。从每一断裂反应得到的RNA分子片段通过电荷(第一方向)和长度(第二方向)进行分离。电荷分离通过在醋酸纤维素条上使用高压电泳进行。此后,RNA分子片段被转移至DEAE纤维素纸用以在第二方向上进行分离。通过重叠来自单独的酶促消化反应的层析分辨(色谱分辨,chromatographically resolved)片段测定序列(Branch等人,1989)。
基于和/或对于Sanger、Maxam和Gilbert以及Peattie(Maxam & Gilbert,1977;Peattie,1979;Sanger等人,1977)的方法,对这些方法发展了几种改进和/或修改:荧光标记代替放射性标记、后标记技术(post-labeling techniques)、酶促切割代替化学断裂、分步漫游点方法(step-wise wandering spot method)、RNA和DNA的替代断裂反应(Donis-Keller等人,1977;Gupta等人,1976;Gupta & Randerath,1977;Lockard等人,1978;Proudnikov & Mirzabekov,1996;Stanley & Vassilenko,1978;Tanaka等人,1980;Waldmann等人,1987;Wu等人,1996)。
但是,每一种技术都具有固有的局限。例如Maxam和Gilbert(Maxam &Gilbert,1977)以及Peattie(Peattie,1979)公开了化学降解方法,而Sanger等人(Sanger等人,1977)公开了使用互补链引物延伸的链终止技术。这些技术中的每一种利用四种单独的反应混合物来产生在长度上具有单个核苷酸不同的片段的嵌套组(nested set),因而表示全部的核苷酸序列。基于其大小和终止核苷酸,通过聚丙烯酰胺凝胶电泳进行片段分辨以确定片段的次序并且因此测定核酸分子的核苷酸序列。凝胶的灌制和核酸分子的电泳分离是耗时的操作。使用凝胶电泳来测定核酸分子的序列是潜在的误差来源,这是由于带压缩效应,其中相邻的核酸分子片段是未分辨的,并且每一单独链的鉴定基于相对值即迁移时间的测量。潜在的误差来源是,例如,核酸分子和其片段的结构。例如,使用Thin LayerChromatography(薄层层析,缩写,TLC)的RNA指纹分析方法对于未知(修饰的)结构的表征是不适当的(Limbach,1996)。
因此,通过质谱分析法进行核酸分子的序列测定是克服这些限制的有希望的方法(Limbach,1996)。
通过质谱分析法进行核酸的核苷酸序列测定
质谱分析法(缩写MS)是分析化合物分子量的有利工具。对于核酸分子分析,MS可适用于核酸分子测序、核酸分子修饰检测和核酸分子片段测定。通过MS分析核酸主要受到离子化效率的限制以及受到几种适用的检测方法的分辨能力的限制。
只有带电的分子可以通过质量检测器(mass detector)分析。因此,在被引入质量分析器之前,待分析的分子需要被有效地离子化。为了在质谱分析之前有效地使核酸分子离子化,通常使用下述技术:电喷射离子化(缩写ESI)(Fenn等人,1989)和基质辅助激光解吸电离(matrix-assisted laser desorption/ionization)(缩写MALDI)(Karas & Hillenkamp,1988)。ESI将溶液中的分子或离子转化为蒸汽相中的离子,其主要通过蒸发带电的溶液小滴进行。ESI可以产生质荷比(质量-电荷比)在商业可得质谱分析器的线性范围内的多种带电荷离子的分布。尽管存在于溶液中的化合物的混合物可以通过ESI-MS直接分析,但是由于不同化合物的多种电荷、过多电荷的竞争以及盐加成物干扰,这种程序可能例如遭遇复杂的谱。因此,电喷射离子化通常直接在下游与分离机理结合。当多种关键参数如流速、离子化模式、缓冲液和溶剂添加剂被最优化时,这种程序促进有效的离子化。
尽管ESI-MS是灵敏的,只需要尘摩尔(毫微微摩尔,femtomole)量的样品,但是对于甚至简单的核酸分子来说,其依赖于多个电荷以获得有效的离子化并且产生复杂且难以解释的多个电荷的谱。因此,实际上,ESI-MS的应用依赖于能使数据“解卷积(去卷积,deconvolution)”软件包的可用性。解卷积包括使用基于算法的计算过程以确定来自多电荷质量-谱数据的分子未带电荷(中性)质量。
例如与飞行时间(缩写TOF)质量分析器联合使用的基质辅助激光解吸电离(缩写MALDI)具有大的测序核酸分子的潜力,这是因为其相对宽的质量范围和高的取样速率。对于大质量生物分子如核酸分子的常规分析,与ESI-MS相比,通常优选MALDI-MS,因为大质量的生物分子可以容易地被离子化和分析。此外,MALDI-MS主要产生单一带电的种类,其大大简化了谱特别是包含寡核苷酸的混合物的那些谱的解释。
但是,一般而言,核酸分子的MALDI-MS分析可能遭遇高分子量核酸分子片段分辨力缺乏、核酸不稳定性以及来自样品制备试剂的干扰。较长的核酸分子可能产生更宽、不太强的信号,因为MALDI将对较高分子量的离子赋予更大的动能。尽管可以用于分析高分子量核酸,但是MALDI-MS可能诱导核酸分子主链的断裂,其使得到的谱进一步复杂化。虽然与ESI相比,MALDI对于离子抑制不太灵敏,但是对于MALDI分析来说,离子抑制仍然是问题,并且必须使利用样品清洁策略,和/或色谱分离。然而,MALDI不易于与基于溶液的技术的直接结合,并且一般地以离线或在线模式进行操作。
用于测序的直接质谱法
不依赖于外部反应产生序列特异性离子的任何质谱法都被认为是直接的测序方法。前面提到的TAs、ESI和MALDI是用于核酸分子的选择的离子化方法(Limbach,1996)。这些方法的详细综述由Limbach和Nordhoff等人给出(Limbach,1996;Nordhoff等人,1996)。
解吸/离子化诱导的断裂。核酸分子的分裂(解离,dissociations)可以由于在解吸/离子化过程期间赋予核酸分子过多能量发生。该分裂以相对快的时间量程发生,导致产生通常难以精确鉴定的离子。ESI主要产生稳定的、完整的分子离子。解吸/离子化诱导的大多数分裂可在MALDI中见到,其中在MALDI-TOF-MS中,存在四种不同的时间量程用于解吸/离子化诱导的分裂:迅速、快速、快速亚稳定的和亚稳定的。理论上,在这些时间量程的任一期间发生的分裂将产生可被用于确定核酸分子序列的核酸分子片段离子。在实践中,分析者很少对断裂的程度进行控制。这些片段的大多数导致分子离子峰加宽,这导致分辨力和灵敏性的损失(Limbach,1996)。
串联质谱分析法。MS-MS(也称串联质谱分析法)包括在质谱仪内发生化学反应之前和之后测量离子的质荷比(m/z),其中包括m/z变化(Baker等人,1993;Boschenok & Sheil,1996;Kawase等人,1991;Limbach等人,1995;Little等人,1995;Marzilli等人,1999;Ni等人,1996;Wu等人,1998b,W.M.A.Niessen,2002)。在化学反应之前,在质谱仪的第一阶段中选择m/z值(该离子称为前体或母体离子)。然后,化学反应发生,其通常涉及与中性气体分子的碰撞(称为碰撞诱导分裂或CID的方法)。大多数情况下,氦或氩被用作碰撞气体。该反应可以发生在质谱仪的两个质量阶段之间的过渡区(碰撞间)。通过此反应,前体离子的分解可以产生多种产物离子(这些被称为子离子或产物离子)。然后可以通过质谱仪的第二阶段检测带电片段。可以以两种模式进行MS-MS:首先,“空间的(in space)”MS-MS,即,两个质谱分析仪可以空间上分开,例如通过QTOF(四极-飞行时间)器械分开。其次,“时间的”MS-MS,即,在同一空间内可以发生方法中的不同步骤,但是在时间上是分开的,例如在离子阱器械中。W.M.A.Niessen(2006)已经对CID过程进行了精确的描述。
用于核酸分子的序列鉴定的串联质谱分析法的适用性可以在Limbach和Nordhoff等人(Limbach,1996;Nordhoff等人,1996)的综述文章中查到。CID是在MS-MS中诱导断裂的最广泛应用的方法。基于多电荷阴离子核苷酸分裂,该方法利用从两个末端双向测序的概念,其假设寡核苷酸的主链沿着链顺序地分离(解离)。在成功应用时,得到的片段代表序列特异性的断裂模式。对于RNA断裂的最初报道之一由Cerny等人(1987)给出。根据现有知识,“双向”概念利用构造从5’→3’方向的序列的c系列离子和构造3’→5’方向的序列的y系列离子(Schürch等人,2002)。然而,可形成其它子离子,其可能使测序过程复杂化、支持测序过程或使测序过程能够进行。由于断裂可以发生在磷酸酯、糖和碱基位点的事实,对得到的谱的解释被复杂化并且所述方法被限于具有小于25个核苷酸的核酸(Alazard等人,2002)。该限制可以归于多种因素诸如中性损失(没有被离子化的子离子不能被检测到)、检测器的检测限制问题或有限的分辨力。碰撞能量也发挥了关键作用。低碰撞能量产生较少的序列相关离子,而较高的碰撞能量可以导致其它离子系列,其使得数据解释复杂化。与DNA的CID——其在近几年内已经被彻底地研究——相反,关于RNA的CID的方面仍旧没有被充分解决。
由于通过MS测序核酸分子的“直接方法”的局限性,已将发展了下述间接方法并且其被用于通过质谱分析法测定核酸分子的序列。
用于测序的间接质谱法
如本文优选使用的,用于测序的“间接质谱法”指在产生样品的气相离子之前进行核酸分子的制备,从其应该测定序列。
用于作为证实预测的核酸分子组成的工具的质量测量的间接质谱法在本文中不进行讨论。进一步的信息被提供在Limbach(Limbach,1996)的综述中。
依赖于连续主链断裂的任何质谱测序方法的应用取决于质量梯状物的形成。序列信息通过确定质谱中连续峰之间的质量差获得。在寡脱氧核苷酸的情况下,预期的连续峰之间的质量差与下述损使对应:dC=289.05、dT=304.05、dA=313.06和dG=329.05(精确的质量基值(exact massbased values))。对于寡核糖核苷酸,质量差是:C=305.04、U=306.03、A=329.05和dG=345.05(精确的质量基值)。由于核酸序列测定方法依赖于连续n-聚体(n-mer)的质量测量,所以由于在四种DNA分子残基之间存在相对大的质量差,与RNA分子相比,DNA分子更易于表征。由于核糖核苷酸U和C之间小的、仅1道尔顿单位的质量差,为了准确地区分U和C,测量需要的精确性更高。对于序列测定,质量梯状物方法具有一个明显的优势:导致期望信息的两个质量测量中的差异给出核苷酸残基的特征。
核酸酶消化后核酸分子梯状物的分析。通过使用5’-->3’磷酸二酯酶和/或3’-->5’磷酸二酯酶水解核苷酸产生DNA或RNA分子片段。通常地,使用两种酶的组合来鉴定所有的核苷酸。截短的和/或断裂的核酸分子通过MALDI-TOF-MS或ESI-MS进行分析。通过改进的技术如延迟提取,样品清洁,酶、缓冲液pH和基质的最优化(Bentzley等人,1998;Bentzley等人,1996;Faulstich等人,1997;Glover等人,1995;Kirpekar等人,1994;Owens等人,1998;Pieles等人,1993;Schuette等人,1995;Smirnov等人,1996;Wu & Aboleneen,2001;Wu等人,1998a)可以获得可达35个核苷酸的增强的分辨力(Alazard等人,2002)。
但是,酶法测序(enzymatic sequencing)限于不包括其糖主链修饰的核酸分子。而且,一些核酸酶是单链特异性的。一些核酸分子特别是长的寡核苷酸诸如适配体显示出双链序列部分,这导致对于核酸酶消化来说为更差底物的分子内和/或分子间结构。
化学消化后核酸分子梯状物的分析。除了外切核酸酶,化学试剂可以用于在质谱测量之前控制核酸分子降解。如果核酸分子被修饰,那么化学试剂是特别需要的,其中特异性选择修饰以增加核酸分子对酶促消化的稳定性。与酶促消化方法相当,化学断裂反应按照它们对DNA和RNA分子的特异性以及它们对不同核碱基的特异性进行分类。可以在MS分析之前使用的RNA和DNA分子的碱基特异性反应由Peattie和Maxam-Gilbert(Maxam & Gilbert,1977;Peattie,1979)描述。但是,DNA分子的磷酸二酯主链的非特异性(随机)断裂通过酸水解进行(Shapiro & Danzig,1972);RNA分子的磷酸二酯主链的非特异性(随机)断裂通过碱水解、使用酸(例如,甲酸)(Farand & Beverly,2008)、在生理pH下聚胺(Komiyama & Yoshinari,1997)进行。
利用DNA或RNA分子的磷酸二酯主链的非特异性(随机)断裂,产生的用于序列测定的核酸分子的质量梯状物可能是复杂的,因为任何连接位点都可能潜在地被化学试剂断裂。核碱基特异的化学断裂也可以随机地发生在各个核碱基所处的核酸分子内每一位置。如果产生单个断裂位点,则出现两个特定的片段:一个来自5’-末端而一个来自3’-末端。如果两个片段都可以在质谱中检测,那么存在比核酸分子序列测定所需要的更多的信息。这两种离子系列可能是混乱的来源。混乱的其它来源来自内部断裂。如以前指出的,沿着核酸分子主链的单个断裂产生两个片段——一个片段来源于5’-末端而另一个片段来源于3’-末端。沿着核酸分子主链的又一个断裂反应产生三个片段:第一片段是5’-末端,第二片段是3’-末端而第三片段将不包括任一末端。因为5’-或3’-末端被用作参考点,所以包含5’-或3’-末端的片段可以被用于构造质量梯状物。相反地,内部片段不能用于构造质量梯状物。此外,在内部片段和末端片段之一的质量相同的情况下,不正确的解释可能产生。而且,这些内部片段的存在可能导致期望的5’-或3’-末端片段的离子抑制。因此,化学消化的反应条件必须被仔细地调整为单一断裂条件(Limbach,1996),但是与随机断裂反应相同,控制此的能力是有限的。核酸测序可以通过化学断裂反应随后通过质谱分析法分析断裂反应进行(Farand &Beverly,2008)。Farrand和Berverly使用高度修饰的核酸分子,其包含2’脱氧核糖核苷酸、2’-氟核糖核苷酸、2’-O-甲基核糖核苷酸、无碱基核糖核苷酸和核糖核苷酸的混合物,其中甲酸被用于降解核糖核苷酸;氢氧化钠被用于降解核糖核苷酸、2’-氟核糖核苷酸、2’-O-甲基核糖核苷酸和无碱基残基;哌啶被用于核糖核苷酸、2’-氟核糖核苷酸和脱氧-鸟嘌呤。碱基特异的反应(如Peattie Maxam & Gilbert所报道的)也被用于获得片段。在精确质量分析期间,包含链的最后一个核苷酸的短片段(长度为1-3个核苷酸)难以被LC-MS保留。因此,需要串联质谱分析法以证实包含3’-末端羟基的最后两个或三个核苷酸(Farand & Beverly,2008)。内切核酸酶消化和化学消化后核酸分子梯状物的分析。RNA分子内U和C之间的小的质量差(1Da)使得利用部分外切核酸酶消化然后进行MALDI-TOF的明确分配(如DNA分子所显示的)变得困难。外切核酸酶消化导致不清楚的序列分配,其中嘧啶碱基C和U不能彼此区分。因此,Tolson和Nicholson发展了将序列特异性内切核酸酶和化学方法结合以分辨RNA分子的这些序列不清楚的方法(Tolson & Nicholson,1998)。因为酶促反应的特异性不是所期望的,因此作者使用肼/苯胺处理RNA,产生由在U处分裂形成的特征片段(Tolson & Nicholson,1998)。
Sanger双脱氧终止反应后核酸分子梯状物的分析。Sanger测序策略允许通过使用质谱分析法如MALDI或ESI质谱分析法,分析由核碱基特异的链终止获得的嵌套片段,根据其不同的分子量组合序列信息。该方法通过增加终止基团的量、使用循环测序、优化反应条件、纯化延伸产物、消除盐加成物以及利用延迟提取技术来进行改进以获得更好的分辨力(Fu等人,1998;Harksen等人,1999;Kirpekar等人,1998;Koster等人,1996;Monforte & Becker,1997;Mouradian等人,1996;Roskey等人,1996;Shaler等人,1995;Taranenko等人,1998;Taranenko等人,1997)。使用这种MALDI-TOF测序方法,可以分析由多于100个核苷酸组成的DNA分子的序列(Taranenko等人,1998)。
可选地,如在US 5,547,835中所示,上述方法之一已与其中模板用生物素标记并且结合到链亲和素包被磁珠上的固相测序方法结合。通过在寡核苷酸引物、链终止核苷三磷酸和/或在链延长核苷酸三磷酸中引入质量修饰以及使用允许通过与具有质量区别的分子量的标签特异性探针杂交倍增的整合标签序列,可以增加生产率(throughput)。但是,所有这些“Sanger-基”测序方法都需要靶序列的一些现有知识或引入已知序列作为引物结合位点。
因此,在本发明下的问题是提供测定核酸分子的核苷酸序列的方法,特别是在核酸分子包括L型核苷酸或由L型核苷酸组成的情况下。
在本发明下的另外的问题是提供测定核酸分子特别是包括L型核苷酸或由L型核苷酸组成的核酸分子的核苷酸序列,其中,这种方法克服了或避免了现有技术方法的至少一些缺点。
该问题通过独立权利要求的主旨解决。优选的实施方式可以取自从属权利要求。
在第一方面,通过测定核酸分子的核苷酸序列的方法,解决了本发明下的问题,其也是第一方面的第一实施方式,上述方法包括下述步骤:
d)提供具有至少一个修饰的核酸分子的多个分子;
b)随机地断裂多个修饰的核酸分子因而提供修饰的核酸分子片段和未修饰的核酸分子片段;
c)分离修饰核酸分子片段和未修饰的核酸分子片段;
d)根据其长度、质量和/或电荷分离或分辨所述修饰的核酸分子片段,其中这种分离或分辨生成修饰的核酸片段的模式;和
e)任选地,可视化所述修饰的核酸片段的模式。
在也是第一方面的第一实施方式的实施方式的第一方面的第二实施方式中,所述方法进一步包括下述步骤
f)从所述修饰的核酸片段的模式推断所述核酸分子的所述核苷酸序列。
在也是第一方面的第一和第二实施方式的实施方式的第一方面的第三实施方式中,所述多个分子的单个核酸分子在待测定核苷酸序列的所述核酸分子的所述核苷酸序列的5’端、3’端或其内部具有至少一个修饰。
在也是第一方面的第一、第二和第三实施方式的实施方式的第一方面的第四实施方式中,断裂通过化学断裂、酶促切割(酶促断裂)、通过加热断裂和/或利用二价离子断裂完成。
在也是第一方面的第一、第二、第三和第四实施方式的实施方式的第一方面的第五实施方式中,断裂是化学断裂,优选地是核苷酸非特异性的断裂。
在也是第一方面的第一、第二、第三、第四和第五实施方式的实施方式的第一方面的第六实施方式中,断裂是有限的断裂。
在也是第一方面的第一、第二、第三、第四、第五和第六实施方式的实施方式的第一方面的第七实施方式中,断裂是有限的随机断裂,优选地是有限的化学随机断裂。
在也是第一方面的第一、第二、第三、第四、第五、第六和第七实施方式的实施方式的第一方面的第八实施方式中,断裂的步骤提供片段——优选地修饰片段——的混合物,其中这种片段的混合物包括核酸分子的所有可能核苷酸序列片段。
在也是第一方面的第八实施方式的实施方式的第一方面的第九实施方式中,所述混合物包括其核苷酸序列待被测定的修饰的全长形式的核酸分子。。
在也是第一方面的第一、第二、第三、第四、第五、第六、第七、第八和第九实施方式的实施方式的第一方面的第十实施方式中,修饰的核酸分子片段通过所述修饰与相互作用配偶体相互作用分离修饰的核酸分子片段与未修饰的核酸分子片段,其中这类相互作用配偶体与支持物连接。
在也是第十实施方式的实施方式的第一方面的第十一实施方式中,支持物是固体支持物。
在也是第一方面的第十和第十一实施方式的实施方式的第一方面的第十二实施方式中,优选地通过洗涤,从与相互作用配偶体相互作用的修饰的核酸分子片段除去未修饰核酸分子片段。
在也是第一方面的第十、第十一和第十二实施方式的实施方式的第一方面的第十三实施方式中,修饰的核酸分子片段从支持物释放,优选地通过从相互作用配偶体释放所述修饰,通过从支持物释放相互作用配偶体或通过从核酸分子片段断裂所述修饰或其一部分或部分。
在也是第一方面的第一、第二、第三、第四、第五、第六、第七、第八和第九实施方式的实施方式的第一方面的第十四实施方式中,通过质量区分、大小区分、疏水性区分、电荷区分、离子区分、氢键合区分和/或液相介导提取的分离将修饰的核酸分子片段与未修饰的核酸分子分离,优选地除去未标记的核酸分子片段。
在也是第一方面的第一至第十四实施方式任一种的实施方式的第一方面的第十五实施方式中,修饰的核酸片段的模式包括修饰的核酸片段的梯状物。
在也是第一方面的第一至第十五实施方式任一种的实施方式的第一方面的第十六实施方式中,修饰的核酸片段的模式通过质谱分析法生成并且优选地推断核酸分子的核酸序列。
在也是第一方面的第一至第十六实施方式任一种的实施方式的第一方面的第十七实施方式中,修饰的核酸片段的模式被生成,并且单个片段的质量通过质谱分析法测定,并且优选地推断核酸分子的核酸序列。
在也是第一方面的第一至第十七实施方式任一种的实施方式的第一方面的第十八实施方式中,核酸分子的核苷酸序列是未知的。
在也是第一方面的第一至第十八实施方式任一种的实施方式的第一方面的第十九实施方式中,从修饰的核酸分子片段推断核酸分子的核苷酸序列的步骤包括下列步骤:
fa)测定最小修饰的核酸分子片段——n+x,其中x=0——的质量和/或核苷酸序列;
fb)测定与最小修饰的核酸分子片段——n+x,其中x=0——的质量有一个核苷酸差异的修饰的核酸分子片段——n+x,其中x=1——的质量;
fc)测定修饰的核酸分子片段——n+x,其中x=1——的质量与最小修饰的核酸分子片段——n+x,其中x=0——的质量之间的质量差;
fd)将该质量差归于不同的核苷酸种类,并通过将所述不同的核苷酸种类加至最小修饰的核酸分子片段——n+x,其中x=0——的序列生成修饰的核酸分子片段——n+x,其中x=1——的序列。
在也是第一方面的第十九实施方式的实施方式的第一方面的第二十实施方式中,重复步骤fb)到fd),其中对于每一重复,x增加加数1,并且对于第一次重复x是2,并且其中在步骤fb)中,测定与修饰的核酸分子片段n+(x-1)的质量有1个核苷酸差异的修饰的核酸分子片段n+x的质量,在步骤fc)中,测定修饰的核酸分子片段n+x的质量和修饰的核酸分子片段n+(x-1)的质量之间的质量差,和在步骤fd)中,将该质量差归于不同的核苷酸种类,并通过将所述不同的核苷酸种类加至所述修饰的核酸分子片段n+(x-1)的序列生成修饰的核酸分子片段n+x的序列。
在也是第一方面的第二十实施方式的实施方式的第一方面的第二十一实施方式中,对于步骤fb)至fd)的第m次重复,x如下:x=m+1。
在也是第一方面的第一至第十七实施方式任一种的实施方式的第一方面的第二十二实施方式中,核酸分子的核苷酸序列是已知的,并且优选地,所述方法是用于证实核酸分子的核苷酸序列。
在也是第一方面的第二十二实施方式的实施方式的第一方面的第二十三实施方式中,从修饰的核酸片段的模式推断核酸分子的核苷酸序列的步骤包括下列步骤:
fa)测定与最小修饰的核酸分子片段——n+x,其中x=0——的质量有一个核苷酸差异的修饰的核酸分子片段——n+x,其中x=1——的质量;
fb)测定修饰的核酸分子片段——n+x,其中x=1——的质量与最小修饰的核酸分子片段——n+x,其中x=0——的质量之间的质量差;
fc)将该质量差归于不同的核苷酸种类,并通过将所述不同的核苷酸种类加至最小修饰的核酸分子片段——n+x,其中x=0——的序列生成修饰的核酸分子片段——n+x,其中x=1——的序列。
在也是第一方面的第二十三实施方式的实施方式的第一方面的第二十四实施方式中,其中对于每一重复,x增加加数1,并且对于第一次重复x是2,并且其中在步骤fa)中,测定与修饰的核酸分子片段n+(x-1)的质量有1个核苷酸差异的修饰的核酸分子片段n+x的质量,在步骤fb)中,测定修饰的核酸分子片段n+x的质量和修饰的核酸分子片段n+(x-1)的质量之间的质量差,和在步骤fc)中,将该质量差归于不同的核苷酸种类,并通过将所述不同的核苷酸种类加至修饰的核酸分子片段n+(x-1)的序列生成修饰的核酸分子片段n+x的序列。
在也是第一方面的第二十四实施方式的实施方式的第一方面的第二十五实施方式中,对于步骤fa)至fc)的第m次重复,x如下:x=m+1。
在也是第一方面的第二十二、二十三、二十四和二十五实施方式的实施方式的第一方面的第二十六实施方式中,最小修饰的核酸分子片段——n+x,其中x=0——的质量和/或核苷酸序列是已知的。
在也是第一方面的第二十二实施方式的实施方式的第一方面的第二十七实施方式中,从修饰的核酸片段的模式推断核酸分子的核苷酸序列的步骤包括下列步骤:
fa)测定与最小修饰的核酸分子片段——n+x,其中x=0——的质量有一个核苷酸差异的修饰的核酸分子片段——n+x,其中x=1——的质量;
fb)将修饰的核酸分子片段——n+x,其中x=1——的质量归于其核苷酸序列已知的核酸分子的核酸分子片段——n+x,其中x=1——的计算质量,并通过将不同的核苷酸种类加至最小修饰的核酸分子片段——n+x,其中x=0——的序列生成修饰的核酸分子片段——n+x,其中x=1——的序列。
在也是第一方面的第二十七实施方式的实施方式的第一方面的第二十八实施方式中,重复步骤fa)到fb),其中对于每一重复,x增加加数1,并且对于第一次重复x是2,并且其中在步骤fa)中,测定与修饰的核酸分子片段n+(x-1)的质量有1个核苷酸差异的修饰的核酸分子片段n+x的质量,和在步骤fb)中,将修饰的核酸分子片段——n+x,其中x=1——的质量归于其核苷酸序列已知的核酸分子的核酸分子片段——n+x,其中x=1——的计算质量,并通过将所述不同的核苷酸种类加至所述修饰的核酸分子片段n+(x-1)的序列生成片段n+x的修饰的核酸分子序列。
在也是第一方面的第二十八实施方式的实施方式的第一方面的第二十九实施方式中,对于步骤fa)至fc)的第m次重复,x如下:x=m+1。
在也是第一方面的第十九至第二十九实施方式任一种的实施方式的第一方面的第三十实施方式中,所述修饰存在于核酸分子片段的5’端,和最小修饰的核酸分子片段包括全长核酸分子的末端5’核苷酸,或者其中所述修饰存在于核酸分子片段的3’端,和最小修饰的核酸分子片段包括全长核酸分子的末端3’核苷酸。在也是第一方面的第一至第三十实施方式任一种的实施方式的第一方面的第三十一实施方式中,修饰是包括一个部分(moiety)的未分修饰。。
在也是第一方面第三十一实施方式的实施方式的第一方面的第三十二实施方式中,所述部分被用于分离修饰的核酸分子片段和未修饰的核酸分子。
在也是第一方面第三十二实施方式的实施方式的第一方面的第三十三实施方式中,所述部分被用于在生成的模式中分离或分辨修饰的核酸分子片段。
在也是第一方面的第一至第三十实施方式任一种的实施方式的第一方面的第三十四实施方式中,修饰是包括至少第一部分和第二部分的多分修饰,其中任选地至少第一部分和第二部分通过连接体连接。
在也是第一方面第三十四实施方式的实施方式的第一方面的第三十五实施方式中,第一部分被用于分离修饰的核酸分子片段和未修饰的核酸分子,而第二部分被用于在生成的模式中分离或分辨修饰的核酸分子片段。
在也是第一方面的第三十一至第三十五实施方式任一种的实施方式的第一方面的第三十六实施方式中,用于分离修饰的核酸分子片段和未修饰的核酸分子的所述部分包括针对相互作用配偶体的配体,其中这类相互作用配偶体存在于支持物上,优选连接到这类支持物,和配体和相互作用配偶体之间的相互作用介导修饰的核酸分子片段在支持物上的固定。
在也是第一方面的第三十六实施方式的实施方式的第一方面的第三十七实施方式中,固定选自化学固定、亲和固定、磁固定。
在也是第一方面的第三十七实施方式的实施方式的第一方面的第三十八实施方式中,固定是亲和固定。
在也是第一方面的第三十八实施方式的实施方式的第一方面的第三十九实施方式中,介导核酸分子和核酸分子片段在支持物上的固定的相互作用选自生物素-抗生物素蛋白相互作用、生物素-中性抗生物素蛋白相互作用、生物素-链亲和素相互作用、抗原-抗体相互作用、两个寡核苷酸的相互作用——其中核酸分子由DNA、RNA、LNA、PNA或其组合组成,钙调蛋白和钙调蛋白结合肽的相互作用、白蛋白和汽巴蓝(Cibracon Blue)的相互作用、金属-螯合剂和金属-螯合支持物的相互作用。
在也是第一方面的第三十一至第三十九实施方式任一种的实施方式的第一方面的第四十实施方式中,用于分离修饰的核酸分子片段和未修饰的核酸分子的部分选自生物素、寡核苷酸、钙调蛋白结合肽、白蛋白和金属-螯合剂。
在也是第一方面的第一至第四十实施方式任一种的实施方式的第一方面的第四十一实施方式中,通过下列方法,将修饰的核酸分子片段与未修饰的核酸分子分离,所述方法选自:过滤、透析、层析、磁场、离心和沉淀。
在也是第一方面的第四十一实施方式的实施方式的第一方面的第四十二实施方式中,层析是大小排阻层析,其中根据大小或由于通过修饰所赋予的修饰片段的增加的大小,将修饰的核酸片段与未修饰的核酸分子分离。。
在也是第一方面的第三十一至第四十二实施方式任一种的实施方式的第一方面的第四十三实施方式中,被用于在生成的模式中分离或分辨修饰的核酸分子片段的部分选自质量标签或亲脂标签。
在也是第一方面的第一至第四十三实施方式任一种的实施方式的第一方面的第四十四实施方式中,通过针对质量或大小区分的方法分离或分辨修饰的核酸分子片段,所述方法优选地选自过滤、透析、层析和质谱分析法,优选地,这样的方法是MS、LCMS或ESI MS。
在也是第一方面的第一至第四十四实施方式任一种的实施方式的第一方面的第四十五实施方式中,通过基于疏水相互作用的方法分离或分辨修饰的核酸分子片段,所述方法优选为RP-HPLC。
在也是第一方面的第三十四至第四十五实施方式任一种的实施方式的第一方面的第四十六实施方式中,连接体是疏水连接体。
在也是第一方面的第三十四至第四十六实施方式任一种的实施方式的第一方面的第四十七实施方式中,连接体是可断裂(可切割)连接体。
在也是第一方面的第四十七实施方式的实施方式的第一方面的第四十八实施方式中,连接体是选择性可切割连接体,更优选地,所述选择性可断裂连接体是可酶切割的、可化学断裂的、可光致断裂的或可热断裂的。
在也是第一方面的第一至第四十八实施方式任一种的实施方式的第一方面的第四十九实施方式中,所述核酸分子选自RNA分子、DNA分子、核苷酸修饰的RNA分子和核苷酸修饰的DNA分子、PNA、LNA和其组合,优选RNA分子、DNA分子、核苷酸修饰的RNA分子和核苷酸修饰的DNA分子以及包含脱氧核糖核苷酸和核糖核苷酸的核酸分子。
在也是第一方面的第一至第四十九实施方式任一种的实施方式的第一方面的第五十实施方式中,核酸分子选自适配体、Spiegelmer、核糖核酸酶、Spiegelzyme、反义分子、siRNA分子和诱饵分子(decoy molecule),优选Spiegelmers。
在也是第一方面的第一至第五十实施方式任一种的实施方式的第一方面的第五十一实施方式中,核酸分子是RNA分子和/或核苷酸修饰的RNA分子。
在也是第一方面的第五十一实施方式的实施方式的第一方面的第五十二实施方式中,断裂是RNA分子和/或核苷酸修饰的RNA分子的化学化学断裂,其通过碱水解、胺或聚胺进行。
在也是第一方面的第五十一实施方式的实施方式的第一方面的第五十三实施方式中,断裂是RNA分子和/或核苷酸修饰的RNA分子的酶切割,其通过使用核酸酶,优选核糖核酸酶,和/或核酸基酶,优选核酸基酶进行。
在也是第一方面的第五十一实施方式的实施方式的第一方面的第五十四实施方式中,断裂是通过加热RNA分子和/或核苷酸修饰的RNA分子的断裂。
在也是第一方面的第五十一实施方式的实施方式的第一方面的第五十五实施方式中,断裂是通过使用二价阳离子的RNA分子和/或核苷酸修饰的RNA分子的断裂。
在也是第一方面的第一至第五十实施方式任一种的实施方式的第一方面的第五十六实施方式中,核酸是DNA分子和/或核苷酸修饰的RNA分子。
在也是第一方面的第五十六实施方式的实施方式的第一方面的第五十七实施方式中,断裂是DNA分子和/或核苷酸修饰的DNA分子的化学断裂,其通过使用酸水解进行。
在也是第一方面的第五十六实施方式的实施方式的第一方面的第五十八实施方式中,断裂是DNA分子和/或核苷酸修饰的DNA分子的酶切割,其通过使用核酸酶,优选脱氧核糖核酸酶,和/或核酸基酶,优选核酸基酶进行。
在也是第一方面的第十六至第五十八实施方式任一种的实施方式的第一方面的第五十九实施方式中,质谱分析法选自直接质谱分析法(direct massspectrometry)、LC-MS和MS/MS。
在也是第一方面的第一至第五十九实施方式任一种的实施方式的第一方面的第六十实施方式中,测定核酸分子的特定质量指纹。
在也是第一方面的第六十实施方式的实施方式的第一方面的第六十一实施方式中,特定质量指纹被用于核酸分子的鉴定和/或质量控制。
在也是第一方面的第一至第六十一实施方式任一种的实施方式的第一方面的第六十二实施方式中,核酸分子或核酸分子的多个分子的至少一个修饰在步骤a)或b)之前被加到核酸分子的5’端或3’端。
在也是第一方面的第一至第六十二实施方式任一种的实施方式的第一方面的第六十三实施方式中,核酸分子或核酸分子的多个分子包括非核酸部分。
在也是第一方面的第六十三实施方式的实施方式的第一方面的第六十四实施方式中,非核酸部分在步骤a)或b)之前从核酸分子或核酸分子的多个分子除去。。
在也是第一方面的第六十四实施方式的实施方式的第一方面的第六十五实施方式中,在步骤a)或b)之前,在第一步骤中,非核酸部分从核酸分子或核酸分子的多个分子除去,而在第二步骤中,核酸分子或核酸分子的多个分子的修饰被加到核酸分子或核酸分子的多个分子的核苷酸序列的5’端、3’端或内部的核苷酸。
在第二方面,通过测定核酸分子的核苷酸序列的方法,解决了本发明下的基本问题,其也是第二方面地第一实施方式,上述方法包括下列步骤:
a)提供具有至少一个修饰的核酸分子的多个分子;
b)随机断裂多个修饰的核酸分子因而提供修饰的核酸分子片段;
c)根据其长度、质量和/或电荷分离或分辨修饰的核酸分子片段,其中这种分离或分辨生成修饰的核酸片段的模式;和
d)任选地,可视化所述修饰的核酸片段的模式。
在也是第二方面的第一实施方式的实施方式的第二方面的第二实施方式中,在步骤b)或c)之后获得的反应混合物包含不具有所述至少一个修饰的一个或多个核酸分子或其片段。
在也是第二方面的第一和第二实施方式的实施方式的第二方面的第三实施方式中,可视化修饰的核酸片段的模式利用至少一个修饰,优选地所述修饰允许区分具有所述修饰的核酸分子和不具有所述修饰的核酸分子。
在也是第二方面的第一、第二和第三实施方式的实施方式的第二方面的第四实施方式中,修饰选自质量标签、在给定波长比核酸分子具有显著更多UV吸光度的部分、亲脂部分、具有限定分子量的聚合物、放射标记和赋予改变的离子迁移率的部分。
在也是第二方面的第四实施方式的实施方式的第二方面的第五实施方式中,在给定波长比核酸分子具有显著更多UV吸光度的部分选自发色团、染料和荧光标记。
在也是第二方面的第一至第五实施方式任一种的实施方式的第二方面的第六实施方式中,方法进一步包括下列步骤:
e)从修饰的核酸片段的模式推断核酸分子的核苷酸序列。
在也是第二方面的第一至第六实施方式任一种的实施方式的第二方面的第七实施方式中,多个分子的单个核酸分子在其核苷酸序列待测定的核酸分子的核苷酸序列的5’端、3’端或其内部具有至少一个修饰。
在也是第二方面的第一至第七实施方式任一种的实施方式的第二方面的第八实施方式中,断裂通过化学断裂、酶切割、通过加热断裂和/或通过使用二价阳离子断裂进行。
在也是第二方面的第一至第八实施方式任一种的实施方式的第二方面的第九实施方式中,断裂是化学断裂,优选核苷酸非特异性断裂。
在也是第二方面的第一至第九实施方式任一种的实施方式的第二方面的第十实施方式中,断裂是有限的断裂。
在也是第二方面的第一至第十实施方式任一种的实施方式的第二方面的第十一实施方式中,断裂是有限的随机断裂,优选有限的化学随机断裂。
在也是第二方面的第一至第十一实施方式任一种的实施方式的第二方面的第十二实施方式中,断裂步骤步骤提供片段的混合物,优选是修饰片段的混合物,其中这类片段的混合物包括核酸分子的所有可能核苷酸序列片段。
在也是第二方面的第十二实施方式的实施方式的第二方面的第十三实施方式中,混合物包括其核苷酸序列待被测定的修饰的全长形式的核酸分子。
在也是第二方面的第一至第十三实施方式任一种的实施方式的第二方面的第十四实施方式中,修饰的核酸片段的模式包括修饰的核酸片段的梯状物。
在也是第二方面的第一至第十四实施方式任一种的实施方式的第二方面的第十五实施方式中,修饰的核酸片段模式通过质谱分析法——优选地LC-MS——生成,并且优选地,推断核酸分子的核酸序列。
在也是第二方面的第一至第十四实施方式任一种的实施方式的第二方面的第十六实施方式中,修饰的核酸片段的模式被生成,并且单个片段的质量通过质谱分析法测定,并且优选地推断核酸分子的核酸序列。
在也是第二方面的第一至第十六实施方式任一种的实施方式的第二方面的第十七实施方式中,核酸分子的核苷酸序列是未知的。
在也是第二方面的第一至第十七实施方式任一种的实施方式的第二方面的第十八实施方式中,从修饰的核酸片段的模式推断核酸分子的核苷酸序列的步骤包括下列步骤:
fa)测定最小修饰的核酸分子片段n+x其中x=0的质量和/或核苷酸序列;
fb)测定与最小修饰的核酸分子片段n+x其中x=0的质量有一个核苷酸差异的修饰的核酸分子片段n+x其中x=1的质量;
fc)测定修饰的核酸分子片段n+x其中x=1的质量与最小修饰的核酸分子片段n+x其中x=0的质量之间的质量差;
fd)将该质量差归于不同的核苷酸种类,并通过将所述不同的核苷酸种类加至最小修饰的核酸分子片段n+x其中x=0的序列生成修饰的核酸分子片段n+x其中x=1的序列。
在也是第二方面的第十八实施方式的实施方式的第二方面的第十九实施方式中,重复步骤fb)到fd),其中对于每一重复,x增加加数1,并且对于第一次重复x是2,并且其中在步骤fb)中,测定与修饰的核酸分子片段n+(x-1)的质量有1个核苷酸差异的修饰的核酸分子片段n+x的质量,在步骤fc)中,测定修饰的核酸分子片段n+x的质量和修饰的核酸分子片段n+(x-1)的质量之间的质量差,和在步骤fd)中,将该质量差归于不同的核苷酸种类,并通过将所述不同的核苷酸种类加至修饰的核酸分子片段n+(x-1)的序列生成修饰的核酸分子片段n+x的序列。
在也是第二方面的第十九实施方式的实施方式的第二方面的第二十实施方式中,对于步骤fb)至fd)的第m次重复,x如下:x=m+1。
在也是第二方面的第一至第十六实施方式任一种的实施方式的第二方面的第二十一实施方式中,核酸分子的核苷酸序列是已知的,并且优选地,该方法用于证实核酸分子的核苷酸序列。
在也是第二方面的第二十一实施方式的实施方式的第二方面的第二十二实施方式中,从修饰的核酸片段的模式推断核酸分子的核苷酸序列的步骤包括下列步骤:
fa)测定与最小修饰的核酸分子片段n+x其中x=0的质量有一个核苷酸差异的修饰的核酸分子片段n+x其中x=1的质量;
fb)测定修饰的核酸分子片段n+x其中x=1的质量与最小修饰的核酸分子片段n+x其中x=0的质量之间的质量差;
fc)将该质量差归于不同的核苷酸种类,并通过将所述不同的核苷酸种类加至最小修饰的核酸分子片段n+x其中x=0的序列生成修饰的核酸分子片段n+x其中x=1的序列。
在也是第二方面的第二十二实施方式的实施方式的第二方面的第二十三实施方式中,重复步骤fa)至fc),其中对于每一重复,x增加加数1,并且对于第一次重复x是2,并且其中在步骤fa)中,测定与修饰的核酸分子片段n+(x-1)的质量有1个核苷酸差异的修饰的核酸分子片段n+x的质量,在步骤fb)中,测定修饰的核酸分子片段n+x的质量和修饰的核酸分子片段n+(x-1)的质量之间的质量差,和在步骤fc)中,将该质量差归于不同的核苷酸种类,并通过将所述不同的核苷酸种类加至修饰的核酸分子片段n+(x-1)的序列生成片段n+x的序列。
在也是第二方面的第二十三实施方式的实施方式的第二方面的第二十四实施方式中,对于步骤fa)至fb)的第m次重复,x如下:x=m+1。
在也是第二方面的第二十一至第二十四实施方式任一种的实施方式的第二方面的第二十五实施方式中,最小修饰的核酸分子片段n+x其中x=0的质量和/或核苷酸序列是已知的。
在也是第二方面的第二十一实施方式的实施方式的第二方面的第二十六实施方式中,从修饰的核酸片段的模式推断核酸分子的核苷酸序列的步骤包括下列步骤:
fa)测定与最小修饰的核酸分子片段n+x其中x=0的质量有一个核苷酸差异的修饰的核酸分子片段n+x其中x=1的质量;
fb)将修饰的核酸分子片段n+x其中x=1的质量归于其核苷酸序列已知的核酸分子的核酸分子片段n+x其中x=1的计算质量,并通过将不同的核苷酸种类加至最小修饰的核酸分子片段n+x其中x=0的序列生成修饰的核酸分子片段n+x其中x=1的序列。
在也是第二方面的第二十六实施方式的实施方式的第二方面的第二十七实施方式中,重复步骤fa)到fb),其中对于每一重复,x增加加数1,并且对于第一次重复x是2,并且其中在步骤fa)中,测定与修饰的核酸分子片段n+(x-1)的质量有1个核苷酸差异的修饰的核酸分子片段n+x的质量,和在步骤fb)中,将修饰的核酸分子片段n+x其中x=1的质量归于其核苷酸序列已知的核酸分子的核酸分子片段n+x其中x=1的计算质量,并通过将不同的核苷酸种类加至修饰的核酸分子片段n+(x-1)的序列生成片段n+x的修饰的核酸分子序列。
在也是第二方面的第二十七实施方式的实施方式的第二方面的第二十八实施方式中,对于步骤fa)至fc)的第m次重复,x如下:x=m+1。
在也是第二方面的第十八至第二十八实施方式任一种的实施方式的第二方面的第二十九实施方式中,修饰存在于核酸分子片段的5’端,和最小修饰的核酸分子片段包括全长核酸分子的末端5’核苷酸,或者其中修饰存在于核酸分子片段的3’端,和最小修饰的核酸分子片段包括全长核酸分子的末端3’核苷酸。
在也是第二方面的第一至第二十九实施方式任一种的实施方式的第二方面的第三十实施方式中,修饰被用于在生成的模式中分离或分辨修饰的核酸分子片段。
在也是第二方面的第一至第三十实施方式任一种的实施方式的第二方面的第三十一实施方式中,修饰是荧光标记,其波长吸光度不同于核酸分子的核碱基的波长吸光度。
在也是第二方面的第一至第三十一实施方式任一种的实施方式的第二方面的第三十二实施方式中,核酸分子选自RNA分子、DNA分子、核苷酸修饰的RNA分子、核苷酸修饰的DNA分子、PNA、LNA以及其组合,优选RNA分子、DNA分子、核苷酸修饰的RNA分子、核苷酸修饰的DNA分子以及包含脱氧核糖核苷酸和核糖核苷酸的核酸分子。
在也是第二方面的第一至第三十二实施方式任一种的实施方式的第二方面的第三十三实施方式中,核酸分子选自适配体、Spiegelmers、核糖核酸酶、Spiegelzyme、反义分子、siRNA分子和诱饵分子,优选Spiegelmers。
在也是第二方面的第一至第三十三实施方式任一种的实施方式的第二方面的第三十四实施方式中,核酸分子是RNA分子和/或核苷酸修饰的RNA分子。
在也是第二方面的第三十四实施方式的实施方式的第二方面的第三十五实施方式中,断裂是RNA分子和/或核苷酸修饰的RNA分子的化学断裂,并且这种断裂通过碱水解进行。
在也是第二方面的第三十四实施方式的实施方式的第二方面的第三十六实施方式中,断裂是RNA分子和/或核苷酸修饰的RNA分子的酶切割,其通过使用核酸酶,优选核糖核酸酶,和/或核酸基酶,优选核酸基酶进行。
在也是第二方面的第三十四实施方式的实施方式的第二方面的第三十七实施方式中,断裂是通过加热RNA分子和/或核苷酸修饰的RNA分子的断裂。
在也是第二方面的第三十四实施方式的实施方式的第二方面的第三十八实施方式中,断裂是通过使用二价阳离子的RNA分子和/或修饰的RNA分子的断裂,或是通过加热断裂和断裂剂(裂解剂,cleaving agent)的组合。
在也是第二方面的第一至第三十三实施方式任一种的实施方式的第二方面的第三十九实施方式中,核酸是DNA分子和/或核苷酸修饰的DNA分子。
在也是第二方面的第三十九实施方式的实施方式的第二方面的第四十实施方式中,断裂是DNA分子和/或核苷酸修饰的DNA分子的化学断裂,其通过使用酸水解进行。
在也是第二方面的第三十九实施方式的实施方式的第二方面的第四十一实施方式中,断裂是DNA分子和/或核苷酸修饰的DNA分子的酶切割,其通过使用核酸酶,优选脱氧核糖核酸酶,和/或核酸基酶,优选核酸基酶进行。
在也是第二方面的第一至第四十一实施方式任一种的实施方式的第二方面的第四十二实施方式中,测定核酸分子的特定质量指纹。
在也是第二方面的第四十二实施方式的实施方式的第二方面的第四十三实施方式中,特定质量指纹被用于核酸分子的鉴定和/或质量控制。
在也是第二方面的第一至第四十三实施方式任一种的实施方式的第二方面的第四十四实施方式中,核酸分子或核酸分子的多个分子的至少一个修饰在步骤a)或b)之前被加到核酸分子的5’端或3’端。
在也是第二方面的第一至第四十四实施方式任一种的实施方式的第二方面的第四十五实施方式中,核酸分子或核酸分子的多个分子包括非核酸部分。
在也是第二方面的第四十五实施方式的实施方式的第二方面的第四十六实施方式中,非核酸部分在步骤a)或b)之前从核酸分子或核酸分子的多个分子除去。
在也是第二方面的第四十六实施方式的实施方式的第二方面的第四十七实施方式中,在步骤a)或b)之前,在第一步骤中,非核酸部分从核酸分子或核酸分子的多个分子除去,而在第二步骤中,核酸分子或核酸分子的多个分子的修饰被加到核酸分子或核酸分子的多个分子的核苷酸序列的5’端、3’端或内部的核苷酸。
在第三方面,通过测定核酸分子的核苷酸序列的方法,解决了本发明下的基本问题,其也是第三方面的第一实施方式,所述方法包括下列步骤:
b)提供核酸分子的多个分子;
b)使核酸分子的多个分子进行核碱基选择性处理,其中形成核酸分子的核碱基种类的一个或数个被选择性地修饰,并且其中在这种核碱基选择性处理之后,核酸分子的一些可选择性处理的核碱基被修饰,并且核酸分子的一些可选择性处理的核苷酸或核碱基保持未修饰;
c)选择性地在修饰的核碱基的3’,化学断裂核酸磷酸主链,其中不是所有修饰的核碱基的核酸磷酸主链被断裂;
d)通过LC-MS和/或LC-MS-MS分析核酸分子片段;和
e)以增加的大小的顺序鉴定具有完整末端的核酸分子片段,并且从其生成核酸分子的序列,其中优选地,核酸分子片段具有相同的完整末端,更优选相同的完整3’末端。
在也是第三方面的第一实施方式的实施方式的第三方面的第二实施方式中,核酸分子选自RNA分子、DNA分子、核苷酸修饰的RNA分子和核苷酸修饰的DNA分子、PNA、LNA、包含脱氧核糖核苷酸和核糖核苷酸的核酸分子、以及其组合,优选RNA分子、DNA分子、核苷酸修饰的RNA分子和核苷酸修饰的DNA分子。
在也是第三方面的第一和第二实施方式的实施方式的第三方面的第三实施方式中,核酸分子选自适配体、Spiegelmers、核糖核酸酶、Spiegelzyme、反义分子、siRNA分子和诱饵分子,优选Spiegelmers。
在也是第三方面的第一、第二和第三实施方式的实施方式的第三方面的第四实施方式中,核酸分子是RNA分子和/或核酸修饰的RNA分子。
在也是第三方面的第一至第四实施方式的实施方式的第三方面的第五实施方式中,可选择性处理的核碱基选自鸟苷、腺苷、胞苷、胸苷和尿嘧啶。
在也是第三方面的第一至第五实施方式的实施方式的第三方面的第六实施方式中,使用肼、乙酸和苯胺的组合选择性处理所述核碱基U,导致5’磷酸酯附加的3’片段和苯胺修饰的核糖5’片段。
在也是第三方面的第六实施方式的实施方式的第三方面的第七实施方式中,5’磷酸酯附加的3’片段和完整核酸分子在权利要求113的步骤d)中比苯胺修饰的核糖5’片段更有效离子化。
在也是第三方面的第七实施方式的实施方式的第三方面的第八实施方式中,5’磷酸酯附加的3’片段在权利要求113的步骤d)中比苯胺修饰的核糖5’片段更有效离子化。
在也是第三方面的第八实施方式的实施方式的第三方面的第九实施方式中,5’磷酸酯附加的3’片段在权利要求113的步骤e)中使用。
在本发明的第一、第二和第三方面中任一方面的每一和任一实施方式的实施方式中,核酸分子包括多于25个核苷酸或核碱基。
在本发明的第一、第二和第三方面中任一方面的每一和任一实施方式的实施方式中,核酸分子包括多于35个的核苷酸或核碱基。
在本发明的第一、第二和第三方面中任一方面的每一和任一实施方式的实施方式中,核酸分子包括26至50个核碱基或36至50个核碱基,优选地包括26至45个核碱基或者36至45个核碱基。应认识到的是,术语核碱基和核苷酸在与本发明相关联的情况下可以互换使用。
在本发明的第一、第二和第三方面中任一方面的每一和任一实施方式的实施方式中,核酸分子或核酸分子的多个分子的聚集被减少。
在本发明的第一、第二和第三方面中任一方面的每一和任一实施方式的实施方式中,通过加入离液序列高的溶液至步骤a)到c)的任一步骤,优选a)和b)的任一步骤,减少聚集。本发明人惊奇地发现如此推断或测定核酸分子的核苷酸序列是可能的:通过随机地以不完全的方式断裂多个所述核酸分子并且分辨因此生成的所述核酸分子的片段的混合物,成为核酸分子的片段模式,其中从这样的片段模式可以推断或测定所述核酸分子的核酸序列。片段的混合物一般也包括修饰的核酸分子片段,其中所述修饰的核酸分子片段也通过所述随机和不完全断裂多个所述核酸分子生成,典型地,从一个或多个所述核酸分子生成,其中所述核酸分子包括修饰。核酸分子片段的模式通过修饰的核酸分子片段如此形成或展示。换句话说,直接或间接推断出核苷酸序列所基于的模式是修饰的核酸片段的模式。在与本方法有关的情况下,优选的是,不完全并且优选的随机断裂生成彼此有一个核苷酸差异的所述核酸的所有可能片段的表示。
在与本发明有关联的情况下,如果没有明确指示相反,术语核酸分子的片段(fragments of the nucleic acid molecule)与核酸分子片段(nucleic acid moleculefragments)以可互换的方式使用。
基于该原则,本发明包括三个基本过程。在经历根据第一方面的本发明的方法的第一过程中,分离修饰的核酸分子片段和未修饰的核酸分子片段。这种分离提供经历分离和/或分辨步骤的修饰的核酸分子片段的混合物,所述分离和/或辨别步骤提供修饰的核酸分子片段的模式。在第一过程中,修饰潜在地直接或间接地用于分离修饰的核酸分子片段和未修饰的核酸分子,等等。
在经历根据第二方面的本发明的方法的第二过程中,在断裂步骤后,修饰的核酸分子片段和未修饰的核酸分子片段没有被分离。相反地,修饰核酸分子片段和未修饰核酸分子片段的混合物经历分离和/或分辨步骤,所述分离和/或辨别步骤提供修饰的核酸分子片段的模式。在该第二过程中,修饰潜在地被直接或间接地用于指引过程(addressing process),等等。这种指引过程是允许靶向混合物的单个修饰的核酸分子片段的过程。靶向典型地是这样的:在提供模式的分离步骤或分辨步骤之后,只有修饰的核酸分子片段被显示,而未修饰的核酸分子不被显示,尽管它们仍然存在于混合物中。优选地,这种显示由至少一个修饰介导或由至少一个修饰产生。由于靶向,因而在该意义上,仅修饰的核酸分子片段实际上经历根据本发明的方法的进一步的步骤(一个或多个)。
在经历根据第三方面的本发明的方法的第三过程中,其核苷酸序列待测定的核酸分子的多个分子经历处理。基本上,这种处理以选择性的方式修饰形成核酸分子的核碱基一个种类。例如,处理是这样的:只有核酸分子中的U被选择性地修饰。但是,重要地不是所有核酸分子的U都被修饰。但是,如果考虑核酸分子的多个分子,则在统计学上,这种核酸分子的每一选择性修饰的核碱基(nucleobasis)都被修饰。结果,如此修饰的核酸分子或核酸分子的多个分子被断裂,优选地被化学断裂以致核酸的主链,优选地核酸磷酸主链以选择性方式在单个修饰的核碱基3’方向上被断裂。通过这样做,生成所有可能的片段,优选地,根据其长度,它们可经历直接或间接的分析。在优选的实施方式中,这种分析通过LC-MS和/或LC-MS-MS手段进行。
将会认识到的是,根据本发明的方法的可能的特征,更具体而言,分别与本发明的三个过程和方面之一相关联的特征——其与所述三个方面之一相关联在本文中概述,可以形成如本文所概述的测定本发明的核酸分子的核苷酸序列的任何方面,因而的本发明的过程以及任何方法的一部分。
如在本文优选使用的,分离是将物质的混合物转化、分开或分离(isolation)成两种或更多种不同的产物。在某些实施方式中,分离包括将5′片段、3′片段和内部片段的混合物转化成仅仅是5′片段或3′片段的混合物。在其它实施方式中,如进行的,分离包括将5′片段或3′片段的混合物例如用LC分开成更进一步的分开物(divisions),如单个组分,在LC中峰代表单个片段或小的片段组。在其它实施方式中,分离包括从5′片段、3′片段和内部片段的混合物分离(isolating)5′片段或3′片段,其中例如LC将进行上面的转化和分开步骤。本领域技术人员将会认识到,分离可能不是绝对的。相反地,分离的产品可以仍然包含也已包含在已经经历分离的原料中的化合物,尽管其处于降低的水平。
如本文优选使用的,分辨力是从物质混合物和/或彼此区分、检测或显示不同的产物的能力。在某些实施方式中,分辨将从未标记的片段中区别/检测/显示标记的片段。在其他的实施方式中,其将被用于使标记的片段彼此区分,例如,质谱,以及LC,以在与片段2不同的保留时间示出片段1。两种实施方式原则上可以在同一步骤中同时实现。
如本文优选使用的,“核酸分子(nucleic acid molecule)”和“多核酸分子(nucleic acid molecules)”是指多核苷酸或寡核苷酸如脱氧核糖核酸(缩写DNA)和核糖核酸(缩写RNA)。而且,术语“核酸分子(a nucleic acid molecule)”包括多个核酸分子。术语“核酸分子(nucleic acid molecule)”和“多核酸分子(nucleic acid molecules)”应该被理解为包括,作为等价物的,从核苷酸类似物、单链(正义或反义)和双链多核苷酸或寡核苷酸制得的RNA或DNA的变体或类似物。脱氧核糖核苷酸包括脱氧腺嘌呤、脱氧胞嘧啶、脱氧鸟嘌呤和脱氧胸腺嘧啶。核糖核苷酸包括腺嘌呤、胞嘧啶、鸟嘌呤和尿嘧啶。提及作为“多核苷酸”的核酸分子以其最宽的意义使用,以指通过共价键连接的两个或更多个核苷酸或核苷酸类似物,其包括单链或双链分子。术语“寡核苷酸”也在本文中使用以指通过共价键连接的两个或更多个核苷酸或核苷酸类似物,但是如本文定义的,寡核苷酸包括少于100个的核苷酸。
如本文所用的,在一个实施方式中,术语核酸分子包括脱氧核糖核苷酸和核糖核苷酸。这种核酸分子也称为杂化物(杂种,hybrid)、杂合核酸分子或嵌合核酸分子。
本领域技术人员将会认识到,按照如本文所述的本发明方法的核酸分子的测序也可以与其它技术组合以合成(synthesise)作为由RNA和下列任何或全部组成的杂化物的核酸分子:2′功能化RNA如2′-O-甲基、2’-氨基、2’-C-烯丙基、2’-氟、2’-O-烯丙基;DNA、LNA、D-和L-构象的核酸分子的组合、在磷位置具有修饰的核苷酸。例如DNA+RNA。可选地,用碱水解将得到一半片段,但是可以对的确要(do get)的片段使用MS/MS技术以测序整个分子。如果是DNA的一段序列,那么可以测序RNA,并且可以对DNA进行MS/MS等。也要认识到的是,就本发明而言,许多变化对于本领域技术人员来说将是明显的。
本领域技术人员也将认识到仍有按照如本文所述的本发明的方法测序核酸分子的可能性,在所述核酸分子中修饰不在3’或5’末端处,而且可以距离这样的末端多至25个核苷酸。这在例如标记是DNA-MOD-RNA的情况下是可能的。或者,例如,如果修饰距离端部为5个核苷酸,则能测序的最小的片段将是11聚体(11mer),其中11聚体的其余部分用MS/MS测序。最后,本领域技术人员也将认识到在本实施方式或任何其它实施方式中,修饰可以在核碱基上。
同样地,如本文优选使用的,经历本发明方法的核酸可以包括至少一个LNA核苷酸。在本发明方法的实施方式中,核酸由LNA核苷酸组成。
同样地,如本文优选使用的,经历本发明方法的核酸可以包括至少一个PNA核苷酸。在本发明方法的实施方式中,核酸由PNA核苷酸组成。
核酸分子的特征在于形成核酸分子的所有连续的核苷酸通过一个或多于一个共价键彼此连锁(linked)或彼此连接(connected)。更具体而言,这种核苷酸的每一个优选地通过磷酸二酯键或其它的键与两个其它的核苷酸连锁或连接,形成连续核苷酸的一段序列。然而,在这种排列中,两个末端核苷酸,即,优选地在5’端和3’端处的核苷酸,被各自与单个核苷酸连锁,这仅仅在这样的条件下:这种排列是线性排列并且不是环形排列,因而是线性而不是环形分子。
在本申请的另一实施方式中,核酸分子包括至少两组连续核苷酸,其中在每一组连续核苷酸内,每一核苷酸优选地通过磷酸二酯键或其它的键与两个其它的核苷酸连锁或连接,形成连续核苷酸的一段序列。然而,在这种排列中,两个末端核苷酸,即,优选地在5’端和3’端处的核苷酸,仅仅每个被与单个核苷酸连锁。然而,在这样的实施方式中,两组连续的核苷酸不通过这样的共价键彼此连锁或彼此连接:通过共价键——优选地在所述两个核苷酸的一个的糖部分和所述两个核苷酸或核苷的另一个的磷部分之间形成的共价键——将一组的一个核苷酸与另一组或其它组的一个核苷酸连锁。但是,在可选的实施方式中,两组连续的核苷酸通过这样的共价键彼此连锁或彼此连接:通过共价键——优选地在所述两个核苷酸的一个的糖部分和所述两个核苷酸或核苷的另一个的磷部分之间形成的共价键——将一组的一个核苷酸与另一组或其它组的一个核苷酸连锁。优选地,所述至少两组连续的核苷酸不通过任何共价键连锁。在另一优选的实施方式中,所述至少两组通过不同于磷酸二酯键的共价键连锁。
术语核酸分子优选地还包括D-核酸分子或L-核酸分子。优选地,核酸分子是L-核酸分子。此外,核酸分子的一个或几个部分作为D-核酸分子存在以及核酸分子的至少一个或几个部分是L-核酸分子是可能的。术语核酸分子的“部分”应当指小至一个核苷酸。这样的核酸分子在本文中一般分别称为D-和L-核酸分子。因此,在优选的实施方式中,根据本发明的核酸分子由L-核苷酸组成并且包括至少一种D-核苷酸。这种D-核苷酸优选地附着于不同于限定核酸分子的一段序列的部分,优选其这样的部分,在这氧的部分中涉及与核酸分子的其它部分的相互作用。优选地,这种D-核苷酸在任何一段序列和任何核酸的末端处被附着。
如本文所用,L-核酸是由L-核苷酸组成的核酸分子,优选地完全由L-核苷酸组成的核酸分子。
如本文所用,D-核酸是由D-核苷酸组成的核酸分子,优选地完全由D-核苷酸组成的核酸分子。
同样地,如果没有相反指示,任何核苷酸序列在本文中以5’→3’的方向提供。
不论核酸分子是否由D-核苷酸、L-核苷酸或两者的组合组成——其中组合是例如随机的组合或者由至少一种L-核苷酸和至少一种D-核酸组成的一段序列的限定序列,核酸分子可以由脱氧核糖核苷酸(一种或多种)、核糖核苷酸(一种或多种)或其组合组成。
不论核酸分子是否是D-核苷酸、L-核苷酸、它们的混合物、DNA、或RNA、或其每一和任意组合,如本文优选地使用的,术语核酸分子也应该包括单链核酸分子和双链核酸分子,其中优选地,经历根据本发明的方法的核酸分子是单链核酸。如果其核苷酸序列的待测序定的核酸分子是由两个独立的链即第一链和第二链组成的双链结构,那么这样的链优选被分离,并且每一分离的链然后经历根据本发明的方法。可选地,如果所述两个链中只有第一链显示修饰——根据本发明方法的第一过程,所述修饰被用于分离修饰的核酸分子片段与未修饰的核酸分子片段,并且根据本发明方法的第二过程,所述修饰被用于指引(address)过程中,则双链核酸的这种分离不是必须的。应该理解这种双链核酸分子的第二链的核苷酸序列可以被测定,因此优选地在平行的方法中,所述第二链显示这种修饰而第一链不显示。在进一步可选的方法中,第一链和第二链的修饰是不同的。
如本文中优选使用的,术语核酸分子也应包括具有内部间隔区的核酸分子。优选地,内部间隔区被用于连锁核酸分子的两个核苷酸序列。优选地,这种内部间隔区是包含至少一个,优选地多个乙二醇部分的亲水间隔区。对于本领域技术人类来说,多种内部间隔区各自是已知的并且可以使用如由Pils和Micura(Pils &Micura,2000)描述的下述标准进行选择。内部间隔区应该不干扰或不会干扰碱基对本身。由于包含芳香碳环的间隔区类型堆积在末端碱基对,因此其是不太适合的(Lewis等人,1999)。但是,由于基于乙二醇的或源于乙二醇的间隔区具有良好的水溶解性和高的构象柔性(Durand等人,1990;Ma等人,1993;Thomson等人,1993),因此,它们满足不干扰碱基对的要求。优选地,间隔区包括一个或几个乙二醇部分或由一个或几个乙二醇部分组成,其中氧被CH2、磷酸酯或硫置换或取代。
如本文中优选使用的,术语核酸分子也应该包括核苷酸修饰的核酸分子。核酸分子可以是核苷酸修饰的RNA或核苷酸修饰的DNA分子。其中通过用抗核酸酶基团例如,2’-氨基、2’-C-烯丙基、2’-氟、2’-O-甲基、2’-H在单个的核苷酸处大量修饰RNA或DNA分子以增加稳定性(参见综述,Usman & Cedergren,1992)。
具有核苷酸——包括碱基(一个或多个)、糖主链和/或磷酸酯键——修饰的化学合成核酸分子可以通过血清核糖核酸酶防止它们的降解,这可以增加核酸分子的体内效力:
在本领域中存在数个描述糖、碱基和磷酸酯修饰的实例,所述修饰可以被引入核酸分子,获得核酸酶稳定性和效力的显著增强。例如,核酸分子通过用抗核酸酶基团例如2’-氨基、2’-C-烯丙基、2’-氟、2’-O-甲基、2’-O-烯丙基、2’-H的修饰和核苷酸碱基修饰被修饰以增强稳定性和/或增强生物学活性(参见综述,Burgin等人,1996;Usman & Cedergren,1992)。在本领域内已将大量描述了核酸分子的糖修饰(参见国际专利申请WO 91/03162、WO 92/07065、WO93/15187、WO 97/26270;WO 98/13526;US专利US 5,334,711、US5,716,824;US 5,627,053;(Beigelman等人,1995;Pieken等人,1991;Usman &Cedergren,1992)。这些出版物描述了测定糖、碱基和/或磷酸酯修饰等并入核酸分子而不调节催化作用的位置的一般方法和策略,并且其通过引用并入本文。鉴于这样的教导,类似的修饰可以如本文描述的被使用以修饰本发明的核酸分子,只要这种核酸分子具有结合它们各自的靶的能力。
尽管用硫代磷酸酯、二硫代磷酸酯和/或5’-甲基膦酸酯键化学修饰寡核苷酸核苷酸间键提高了稳定性,但是过多的修饰可能引起一些毒性或降低的活性。因此,当设计核酸分子时,这些核苷酸间键的量应该被最少化。这些键浓度的减少应该降低毒性。
如本文中优选使用的,术语核酸分子也应该包括完全封闭(closed)的核酸分子。如果根据本发明的其核苷酸序列待被测定的核酸分子优选地通过共价键——其中更优选地,这种共价键在本文公开的核酸分子序列的5’端和3’端之间形成——封闭,则可以获得完全封闭的,即,环形的核酸分子结构。
如本文中优选使用的,术语核酸分子也应该包括包含非核酸分子部分的任何核酸分子。这种非核酸分子部分可以选自肽、寡肽、多肽、蛋白质、糖类、将在下述更详细概述的各种基团。因而,术语核酸分子也应该包括包含至少一个核酸部分和至少一个另外的部分——其可以被用于促进将核酸分子递送到生物学系统诸如细胞内——的啜合物和/或复合物。所提供的啜合物和复合物可以通过将治疗化合物转移通过细胞膜,改变药物动力学和/或调节本发明的核酸分子的定位而赋予治疗活性。优选地,这些种类的啜合物和复合物适于递送分子穿过细胞膜,所述分子包括但不限于小分子、脂类、磷脂、核苷、核苷酸、核酸、抗体、毒素、带负电荷聚合物和其他聚合物,例如蛋白质、肽、激素、糖类、聚乙二醇或聚胺。一般而言,所描述的转运蛋白被设计为单独使用或者作为多组分系统的部分使用,其具有或不具有可降解的连接体。这些化合物被期望提高在血清的存在与不存在下核酸分子到源于不同组织的多种细胞类型内的递送和/或定位(参见美国专利US 5,854,038)。本文描述的分子的啜合物可以经由生物可降解的连接体诸如生物可降解的核酸连接体分子附着于具有生物学活性的分子。
如在下面与其序列待被测定的核酸分子相关联详述的,非核酸部分可以是PEG部分,即,聚(乙二醇)部分,或HES部分,即,羟乙基淀粉部分。
非核酸部分,优选地PEG和/或HES部分可以直接或通过连接体附着(连接)于核酸分子。核酸分子包括一个或多个修饰,优选地一个或多个PEG和/或HES部分也在本发明的范围之内。在一个实施方式中,单个连接体分子将多于一个的PEG部分或HES部分附着到核酸分子。与本发明相关所使用的连接体本身可以是直链的或支链的。这些种类的连接体对于本领域技术人员来说是已知的并且在专利申请WO 2005/074993和WO 2003/035665中被进一步描述。
在优选的实施方式中,连接体是生物可降解的连接体。此外,由于从核酸分子释放修饰,生物可降解的连接体允许在动物体内优选地在人体内的停留时间方面等改变核酸分子的特征。生物可降解连接体的使用允许更好地控制核酸分子的停留时间。这种生物可降解连接体的优选实施方式是诸如在下述——但不限于下述——国际专利申请中描述的那些生物可降解连接体:WO 2006/052790、WO2008/034122、WO 2004/092191和WO 2005/099768,其中在国际申请WO2004/092191和WO 2005/099768中,连接体是聚合寡核苷酸前体药物——其由一个或两个本文描述的修饰、核酸分子和其间的生物可降解连接体的部分组成。
如本文优选使用的,“核苷酸”包括但不限于,天然存在的DNA核苷单、二和三磷酸:脱氧腺苷单、二和三磷酸;脱氧鸟苷单、二和三磷酸;脱氧胸苷单、二和三磷酸;和脱氧胞苷单、二和三磷酸(本文分别称为dA、dG、dT和dC或A、G、T和C)。术语核苷酸也包括天然存在的RNA核苷单、二和三磷酸:腺苷单、二和三磷酸;鸟苷单、二和三磷酸;尿苷单、二和三磷酸;和胞苷单、二和三磷酸(本文分别称为A、G、U和C),称为碱基-糖-磷酸酯组合,其是核酸分子即,DNA分子和RNA分子的单体单元。然而,也就是说,术语“核苷酸”指包含环状呋喃型糖(在RNA中为p-D/L-核糖,而在DNA中位P-D/L-2′-脱氧核糖)的任何化合物,所述化合物在5’位置处被磷酸化并且具有在C-l′糖位置经由-葡糖基(glycosol)C1′-N键连接的嘌呤或嘧啶型碱基。核苷酸可以是天然的或合成的,包括已被质量修饰的核苷酸,还包括具有带修饰碱基(例如,5-甲基胞苷)和修饰糖基团(例如2′-O-甲基核糖基、2′-O-甲氧基乙基核糖基、2′-氟核糖基、2′-氨基核糖基等)的修饰的核苷的核苷酸。
术语“核碱基(nucleobase)”包括天然存在的核酸碱基腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)、胸腺嘧啶(T)和尿嘧啶(U)乙基非天然存在的核碱基诸如黄嘌呤、二氨基嘌呤、8-氧-N6-甲基腺嘌呤、7-脱氮黄嘌呤、7-脱氮鸟嘌呤、N4,N4-乙烯基胞嘧啶(ethanocytosin)、N6,N6-乙烯基-2,6-二氨基嘌呤、5-甲基胞嘧啶、5~(C3-C6)-炔基-胞嘧啶、5-氟尿嘧啶、5-溴尿嘧啶、假异胞嘧啶、2-羟基-5-甲基-4-三唑吡啶、异胞嘧啶、异鸟嘌呤、肌苷以及在Freier & Altmann的出版物中美国专利US 5,432,272(Freier & Altmann,1997)中描述的“非天然存在的”核碱基。因此,术语“核碱基”不仅包括已知的嘌呤和嘧啶杂环,而且也包括其杂环类似物和互变异构体。
在第一步,提供其序列待被测定的多个核酸分子。该多个核酸分子优选地包括多个单个分子,其允许在随机断裂所述多个核酸分子之后,产生核酸分子的所有可能片段或所有相关片段的表示。如本文优选使用的,术语片段在狭义上指包括或由如此核苷酸序列组成的核酸分子,所述如此核苷酸序列与全长核酸分子相比,就核苷酸序列而言,比全长核酸分子短一个或多于一个核苷酸。
其序列待被测定的核酸分子在本文中也称为亲本(母本)核酸分子。
如本文优选使用的,术语5’片段指具有完整5’末端的片段,具体而言,是包括亲本核酸分子5’末端核苷酸的那些片段。相似地,如本文使用的,术语3’片段指具有完整3’末端的片段,即,包括亲本核酸分子3’末端核苷酸的那些片段。如本文使用的,术语内部片段指不包含完整末端并且因此同时缺少5’和3’末端核苷酸的那些片段。
如本文优选使用的,术语完整的在与5’末端和3’末端相关联的情况下,指如果是5’末端,优选地其核苷酸序列待被测定的核酸分子的5’末端核苷酸存在于核酸分子中,更优选地存在于核酸分子的多个分子或其片段(一个或多个)中,并且如果是3’末端,优选地其核苷酸序列待被测定的核酸分子的3’末端核苷酸存在于核酸分子中,更优选地存在于核酸分子的多个分子或其片段(一个或多个)中。
为了易于描述本发明,术语片段优选地也应包括全长核酸分子。因而,核酸分子的片段可以如一个核苷酸一样短,并且可以如全长核酸分子一样长。
本领域技术人员应理解多个片段不一定必须包括所有可能的核酸分子片段。取决于本文描述方法的进一步的目的,具有允许建立核酸分子指纹的有限数目的片段可能是足够的,其中这样的指纹对于鉴定核酸分子是足够的。
如本文优选使用的,术语“核酸分子的多个分子”指核酸分子的多个拷贝并且优选地表示亲本核酸分子的多个拷贝。优选地,与此相联系,多个拷贝指允许实践本发明方法的多个拷贝。需要拷贝的精确数目取决于本发明方法的具体实施方式和与这样的步骤和方法分别相联系所使用的技术。单个片段需要的拷贝数的下限优选地是仍然允许生成模式和推断所述片段的核酸序列的数目。拷贝的一般范围是1×10-18 to 1×10-3摩尔。
如本文优选使用的,核酸分子的拷贝是基本上具有相同核苷酸序列的核酸分子。更具体而言,核酸分子的拷贝在所述拷贝被制备的核酸分子的所有物理和化学性质上是相同的。
核酸分子的多个分子带有或具有修饰。在与本发明的第一和第二过程相联系的情况下,多个所述分子带有或具有修饰的程度为——如上面所概述的——在随机断裂所述多个分子之后,每一可能的片段或每一相关的片段带有或具有这样的修饰。本领域技术人员也将理解这样的片段是核酸分子的种类并且这样的种类典型地不仅作为单拷贝存在而且也作为多个单个拷贝或分子存在。也将理解的是,不是每一这种片段的单拷贝必须带有或具有这样的修饰。此外,存在具有或带有修饰的单个片段的多个拷贝。单个片段拷贝的最小数目取决于在根据本发明的方法的随后步骤中使用的方法,典型地在生成模式中使用的方法。单个片段需要的拷贝数的下限优选地是仍然允许生成模式并且推断所述片段的核酸序列的数目。
为了如所述的通过本文方法测序,通过如本文所述的测序方法的核酸分子在其核苷酸序列的5’或3’端处包含修饰或者在其核苷酸序列的5’或3’端处被修饰具有修饰。因此,未修饰的核酸分子必须被预先修饰,之后它们可以通过本文所述方法进行测序。
核酸分子的多个分子具有的修饰可以在合成期间或之前被直接并入寡核苷酸(例如美国专利US 5,736,626和US 5,141,813)。可选地,例如,亲核的官能团如脂肪族伯胺,被引入核酸分子上的修饰附着位点处,例如,在核酸分子的5’末端或3’末端处。在核酸分子的固相支持物合成(solid-support synthesis)完成后,核酸分子从支持物断裂并且除去保护基。尽管在合成过程之后,核酸分子包括修饰,但是在另一实施方式中,修饰可以用于添加另一修饰。合成的亲核-核酸分子与例如过量的包含亲电子部分的修饰试剂在均一溶液(homogeneoussolution)条件下反应。包含亲电子部分的修饰试剂是例如异硫氰酸酯或活化的酯如N-羟基琥珀酰亚胺(缩写NHS)(Hermanson,1996)。
核酸分子的多个分子具有的修饰在其合成后并且在通过本文描述的方法测序核酸分子之前可以被进一步并入寡核苷酸。用于将修饰装入未修饰核酸分子的方法的实例包括但不限于,酶的和化学操作。例如,使用连接酶,将附着于核苷酸的修饰连接到核酸分子是可能的。一个这样的实例使用T4 RNA连接酶将携带修饰的核苷酸或含有氨基官能团的核苷酸连接到核酸分子的5’端上(Kinoshita等人,1997)。使用化学连接例如通过使用溴化氰连接寡核苷酸也是已建立的技术(Dolinnaya等人,1991;Elov等人,1989)。最近已经开发了不使用这种毒性化学品修饰核酸分子的其它方法(Yoshimura等人,2007)。
已建立的将修饰引入RNA分子的3’端的技术是:用高碘酸钠氧化末端2’、3’顺式二醇以生成二醛,然后用二胺或标记官能化胺(label-functionalisedamine)使所述二醛经历双还原性胺化(Proudnikov & Mirzabekov,1996)。同前,使用得到的3’胺作为反应性修饰引入修饰。可选地,二醛可以与修饰的卡巴肼衍生物反应以装入修饰而不需要随后的反应(Wu等人,1996)。
关于其核苷酸序列待被测定的核酸分子的长度,基本上不存在限制。因此,核酸分子的长度可以如两个核苷酸一样短和如几千个核苷酸一样长。优选地,核酸分子的长度在15至120个核苷酸之间。本领域技术人员将会认识到,在15至120之间的任何整数都是可能的核酸分子长度。核酸分子长度更优选的范围为大约20至100个核苷酸、大约20至80个核苷酸、大约20至60个核苷酸、大约20至50个核苷酸以及大约30至50个核苷酸的长度。
修饰可以是适合于提供与在本发明相联系的情况下所需要的作用的任何修饰。更具体而言,在与本发明方法的第一过程相联系的情况下所需要的修饰允许分离修饰的核酸分子片段与未修饰的核酸分子片段。与其相反,在与本发明方法的第二过程相联系的情况下,所需要的修饰允许实践指引过程。也会认识到的是,在第一过程和第二过程中,修饰涉及分离或分辨修饰的核酸分子片段。修饰可以具有双重功能或提供两种功能在本发明之内。在这种情况下,修饰可以是未分修饰。可选地和特别地,在其中需要双重功能的那些情况下,修饰可以是,二分或多分修饰。二分或多分功能包括可以直接彼此连接或通过使用连接体连接的第一部分和第二部分。在这种情况下,第一部分或第二部分被用于分离修饰的核酸分子片段与未修饰的核酸分子片段,而第二或第一部分被用于分离或分辨修饰的核酸分子片段。
在进一步的步骤中,多个修饰的核酸分子被随机断裂。在这样的断裂之后,分别产生和提供修饰的核酸分子片段和未修饰的核酸分子片段。取决于其核酸序列待被测定的核酸分子的化学性质,多种技术是适用的,它们同样地在本领域内是已知的。断裂可以是下列技术或其组合的任一种:物理断裂、化学断裂、酶切割、通过加热断裂和/或通过使用二价阳离子断裂。这些不同的技术是适用的,只要它们在核酸分子内的特定和可预测位点提供断裂并且符合如本文概括的断裂步骤的另外的要求。
在核酸分子序列内特定位置处核酸分子的断裂取决于核酸分子的结构、核酸分子的特定核苷酸之间的共价键的物理化学性质、核酸分子的糖主链的物理化学性质、核酸分子的碱基的物理化学性质、核酸分子的特定碱基和糖主链之间的共价键的物理化学性质、核酸分子的特定原子;针对核酸分子的特定碱基和/或修饰碱基的断裂剂的特异性;或其组合。
核酸分子的物理断裂可以通过使用能够打破共价键的任何物理力实现,其中优选地,产生特定的并且可预测的断裂。这种物理力包括但不限于热、电离辐射诸如X-射线、UV-射线、γ射线。核酸分子片段的大小可以通过调节暴露于辐射的强度和持续时间进行调节。暴露的强度和持续时间也可以被调节以使辐射对核酸分子的不期望的作用最小化。
加热——优选达到水沸腾——也可产生核酸分子片段。通过加热核酸分子溶液断裂核酸分子优选在多种标准缓冲液中进行,例如但不限于伯烷基胺如TRIS(三(羟甲基)氨基甲烷);仲胺如Tricine(N-(三(羟甲基)甲基)甘氨酸);叔胺如三乙胺,Bis-Tris(二(2-羟乙基)-亚氨基-三(羟甲基)-甲烷)聚胺如亚精胺,HEPES(4-(2-羟乙基)-1-哌嗪乙磺酸)和PIPES(哌嗪-N,N′-二(2-乙磺酸);季盐离子如四丁铵和四乙铵。含有芳香胺例如咪唑的缓冲液在本领域也是已知的。这样的缓冲液可连同盐酸、氢氟酸、氢溴酸、磷酸、柠檬酸、苯二甲酸、酒石酸、硼酸和本领域已知的其他酸一起使用。包含碱金属的其他适当缓冲液/溶液在本领域也是已知的。其实例为氢氧化物、碳酸盐、碳酸氢盐(hydrogen carbonate)、磷酸盐、酞酸盐、酒石酸盐、硼酸盐和醋酸盐。优选的pH范围为pH-1到pH15,更优选为pH 4到pH 10。优选的浓度为0.01到100000 ODs/mL,更优选为10到1000 ODs/mL。进行反应0.1和5000分钟之间,更优选为5到100分钟。
核酸分子的化学断裂可通过核酸分子的磷酸二酯键的二阶阳离子催化断裂、通过烷基化和/或通过包括碱水解和酸水解在内的水解反应进行。
RNA的磷酸二酯键的二阶阳离子催化断裂优选在存在但不限于下列离子的情况下进行:Mg2+、Ca2+、Be2+、Ba2+、Fe2+、Zn2+、Cu2+、Mn2+、Cd2+、Sr2+、Ni2+、Co2+、Pb2+,其含量为0.000001到10M,更优选为0.00001到1M。反应温度为0℃到150℃,更优选为10到100℃。进行反应0.1到5000分钟,更优选为1分钟到120分钟。
RNA的磷酸二酯键的断裂也可使用含有伯烷基胺如TRIS(三(羟甲基)氨基甲烷);仲胺如Tricine(N-(三(羟甲基)甲基)甘氨酸);叔胺如三乙胺,Bis-Tris(二(2-羟乙基)-亚氨基-三(羟甲基)-甲烷)聚胺如亚精胺,HEPES(4-(2-羟乙基)-1-哌嗪乙磺酸)和PIPES(哌嗪-N,N′-二(2-乙磺酸);季盐离子如四丁铵和四乙铵的溶液进行。含有芳香胺例如咪唑的缓冲液在本领域也是已知的。在0.000001到10M之间,更优选0.00001到1M。反应温度为0℃到150℃,更优选为10到100℃。进行反应0.1到5000分钟,更优选为1分钟到120分钟。
核酸分子烷基化作为断裂核酸分子的方法由Browne和Gut & Beck(Browne,2002;Gut & Beck,1995)描述。
可以使用碱水解断裂RNA分子,这是因为RNA在碱性条件下是不稳定的(Nordhoff等人,1993)。RNA分子的碱水解优选在7.5到15的pH范围进行,更优选在9到15的pH范围进行。反应温度为0℃到150℃,更优选为50到150℃。进行反应0.1到5000分钟,更优选为1分钟到100分钟。
也可以使用酸水解断裂RNA分子,这是因为RNA在酸存在下——优选在强酸如无机酸像HCl和有机酸如对-Tolene-磺酸存在下——可被水解。RNA分子的酸水解优选在-1到6.5的pH范围进行,更优选在1到4的pH范围进行。反应温度为0℃到150℃,更优选为20到100℃。进行反应0.1到5000分钟,更优选为1分钟到100分钟。在严格条件下,水解可以断裂核糖和嘌呤以及嘧啶碱基之间的磷酸酯键和N-糖苷键两者。
可以使用酸水解断裂DNA分子,这是因为DNA在酸存在下——优选在强酸如无机酸像HCl和有机酸如对-Tolene-磺酸存在下——可被水解。DNA分子的酸水解优选在0到5.5的pH范围进行,更优选在1到2的pH范围进行。反应温度为0℃到150℃,更优选为20到100℃。反应进行0.1到5000分钟,更优选1分钟到100分钟。取决于条件和反应时间的长度,可将核酸分子断裂成包括一个核苷酸片段在内的各种大小。特别地,在严格条件下,水解可以断裂脱氧核糖和嘌呤以及嘧啶碱基之间的磷酸酯键和N-糖苷键两者。
基于酸和/或碱水解产生核酸分子片段的方案先前已经描述(Maxam & Gilbert,1977;Peattie,1979;Sargent,1988)。
酶可用于断裂核酸分子,并通常与通过MS的核酸测序结合使用(Alazard等人,2002;Bentzley等人,1998;Bentzley等人,1996;Faulstich等人,1997;Glover等人,1995;Kirpekar等人,1994;Owens等人,1998;Pieles等人,1993;Schuette等人,1995;Smirnov等人,1996;Wu & Aboleneen,2001;Wu等人,1998a)。切割核酸分子的这类酶在本领域是已知的(Sambrook,2001),并且是商业上可获得的。取决于使用的酶,核酸分子被非特异性切割或者在特定的核苷酸序列处切割。可以使用能够切割核酸分子的任何酶,其包括但不限内切核酸酶、外切核酸酶、核糖核酸酶和DNA酶。
内切核酸酶具有切割核酸分子链内键的能力,其中内切核酸酶可以对双链或单链核酸分子具有特异性。核酸分子的切割可以在核酸分子内随机进行,或者可以在核酸分子的特定序列处切割。核酸分子的特定断裂可以使用一种或多种酶以顺序反应或同时进行。限制性内切核酸酶是内切核酸酶的亚类,其识别双链核酸分子内的特定序列,并通常在识别序列内或近处切割两条链。内切核酸酶可以对某种类型的核酸分子具有特异性,优选对DNA或RNA分子是特异性的。RNA或DNA分子特异性内切核酸酶的实例是核糖核酸酶H、核糖核酸酶A、核糖核酸酶T1、核糖核酸酶U2、核糖核酸酶P和在国际专利申请WO2004/097369第43页第5行到第44页第4行讨论的核糖核酸酶。
为了减少序列测定的不定性,可以进行附加的限定的碱水解。因为在这些条件下,每个磷酸二酯键潜在地被切割,这样可以获得有关遗漏和/或特定切割的信息(Donis-Keller等人,1977)。
作为内切核酸酶的替代物,对于DNA分子断裂,可以使用DNA糖基化酶。DNA糖基化酶特异性地从给定DNA核酸分子除去某种类型的核碱基(nucleobase)。其中,这些酶可以在核酸分子的序列中产生脱碱基位点,其中脱碱基位点可以通过在脱碱基位点特异性切割暴露的磷酸盐主链并产生表现序列的一组核碱基特异性片段的另一切割酶识别,或者通过化学方法例如碱性溶液和/或加热识别。DNA糖基化酶和其靶核苷酸的一个组合应用将足以产生核酸分子的碱基特异性特征模式。大量DNA糖基化酶是已知的,并且在国际专利申请WO2004/097369第44页第13行到第45页第7行讨论。
DNA分子的碱基可以用特定化学品修饰,以便修饰的碱基被特异性DNA糖基化酶识别(参见国际专利申请WO2004/097369第45页第8行到第45页第26行)。通过糖基化酶处理和随后的脱碱基位点切割,产生核酸分子片段。
本文的核酸分子断裂也可通过本领域普通技术人员已知的二核苷酸特异性断裂试剂进行,并将其作为参考并入本文(WO 94/21663;Cannistraro & Kennell,1989)。
脱氧核糖核酸酶(简写为DNase)也可用于生成DNA分子片段(Anderson,1981)。DNase I是将双链DNA和单链DNA消化成多和单核苷酸的内切核酸酶。其他的DNAase是DNase II、DNase H、DNase IT、DNase IX等,其在国际专利申请WO2004/097369第46页第26行到第47页第6行讨论。
外切核酸酶是从单链或双链核酸分子例如DNA分子末端切割核苷酸的酶。具有5′外切核酸酶(从其5′端切割DNA分子)和3′外切核酸酶(从其3′端切割DNA)。
除了上面描述的基于蛋白质的酶,DNA酶和RNA酶在本领域是已知的,并且可用于切割核酸分子以产生核酸分子片段(Santoro & Joyce,1997;Schlosser等人,2008a;Schlosser等人,2008b);美国专利US 6,326,174、US 6,194,180、US6,265,167、US 6,096,715;US 5,646,020)。
离子化断裂核酸分子是又一选择,以便提供随机地断裂,并且例如在质谱分析期间通过在质谱仪的离子源中使用高电压以通过MS使用在离子阱中的碰撞诱导分辨进行片段化来完成(Biemann,1990)。使用发表的与MS中的单个核苷酸残基相关的质量,根据在所得到的核酸分子的MS断裂模式中观测到的分子量差异推断碱基序列。
可以使用断裂方法的任意组合,以及酶的任意组合形成核酸分子片段。因此,本领域普通技术人员将理解所有这些断裂反应的任意组合包括在本发明的方法中,所述断裂反应例如通过加热、碱性pH、二胺或甚至酸性pH,其可降解RNA——特别是在升高温度下、离子化和一种或多种酶以及上述组合。此外,产生核酸分子特定片段的方法可以与产生核酸分子随机片段的方法组合。另外,在特异性位点切割核酸分子的一种或多种酶可以与在不同位点特异性切割核酸分子的一种或多种酶组合使用。在另一实例中,切割特定种类核酸分子的酶可以组合使用。在另一实例中,随机切割核酸分子的酶可以与特异性切割核酸分子的酶组合使用。组合使用指在核酸分子上依次或同时进行一种或多种方法。
与本发明相关的,断裂或断裂步骤包括随机地断裂多个修饰的核酸分子。如本文优选使用的,术语随机地表示每个核酸分子在其核苷酸序列内及在其一级核酸结构内的一个或多个位点断裂。与本发明相关的,在已知的位点以可重复的方式进行断裂是必然的,尽管其是统计学上的。对于进行本发明,单独分子是否被断裂一次或多次是无关的,只要总的断裂提供核酸分子的所有可能片段和所有相关片段的显示(表现度,representation)。与所述断裂相关的,必须承认通常地并且如在在各自反应中存在,不但修饰的核酸分子种类将被断裂,而且那些不带有或不具有这些修饰的核酸分子种类也将被断裂。
至此,断裂不但为随机断裂,而且为限制性断裂,因为非限制性断裂或完全断裂将导致产生单个核苷酸或不适于提供这类显示的片段。
在进一步的步骤中,根据本发明的方法包括将修饰的核酸分子与未修饰的核酸分子片段分离的步骤。如本领域普通技术人员所了解的,该步骤优选地仅包括在根据本发明方法的第一过程中。
该分离步骤基于修饰核酸分子片段优选地在其整体中与未修饰片段——更优选的在其整体中——的区别原则进行。这类区别可基于质量、大小或疏水相互作用,其是固有的或由于修饰赋予修饰核酸分子片段的或由于修饰非核酸分子片段不具有的。允许这类分离的技术广义上包括过滤、透析和色谱(层析)等,即基于配体和所述配体的相互作用配偶体之间的相互作用的分离。必须承认优选地核酸分子的所有可能片段或所有相关片段的显示基本上在该分离步骤中得以保持。
将修饰核酸分子片段与未修饰核酸分子片段分离的特别优选的原则是利用配体作为修饰,包括其用作二分或多分修饰(multipartite modification)的第一或第二部分。
在优选的实施方式中,修饰的核酸分子的修饰是直接或间接连接于核酸分子的5’或3’-末端核苷酸的配体。本文间接连接指在配体和核酸分子的5’或3’-末端核苷酸之间,安装连接体。配体指结合的某些东西。如本文使用的配体是与核酸分子连接的部分,其中配体与允许配体与结合配偶体结合的结合配偶体相互作用,其中由于配体和结合配偶体的结合,与配体连接的核酸分子被固定。
在一个实施方式中,相互作用配偶体附着于相(phase),其中这种相与包括修饰的核酸分子片段和优选地也包括未修饰核酸分子片段的相不同。优选地,这种相是固相。这类固相例如通过固相支持物形成。固相支持物优选地选自包含聚合物的基,优选地塑料、玻璃、琼脂糖和金属。
由于配体和相互作用配偶体之间的相互作用,配体并因此修饰的核酸分子片段被固定于相互作用配偶体附着的相。根据配体和相互作用配偶体产生的相互作用的类型,固定优选地可以是化学固定、亲和固定或磁固定。
特别优选的固定形式是基于下列相互作用的化学固定,其中提供这类相互作用的要素之一是配体,而提供这类相互作用的另一个要素是相互作用配偶体。进行本领域普通技术人员已知的实践的实例包括但不限于:
胺和活化羧酸,
胺加活化氨基甲酸酯,
胺和异氰酸酯/异硫氰酸酯,
胺加卤化物,
胺加马来酰亚胺部分,
胺加醛/酮,
羟胺或酰肼加酮/醛,
肼衍生物和活化羧酸,
肼和异氰酸酯/异硫氰酸酯,
肼加卤化物,
肼加马来酰亚胺部分,
肼+醛/酮:
肼+醛/酮,然后还原胺化
硫醇加卤化物,
硫醇加马来酰亚胺,
硫醇加活化硫醇,
硫醇加乙烯砜和其他迈克尔加成反应物(Michael addition reactions)
叠氮化物加炔加Cu盐和其他“点击化学(click chemistry)”相互作用配偶体(Kolb等人,2001),
叠氮化物加活化羧酸经由斯托丁格尔反应(Staudinger reaction),利用烷基或芳基P(III)部分,
叠氮化物加附着于吸电子阱的三价膦(斯托丁格尔结扎(Staudingerligation)),
叠氮化物加膦基硫烃酯-无痕斯托丁格尔结扎(phosphinothiol ester-tracelessStaudinger ligation),
叠氮化物加醛/酮+PPh3(斯托丁格尔)以形成之后可被任选地还原为相应胺的亚胺,
胺加羧基-
羧酸官能团加氨基官能团,例如胺、肼,
顺式二醇(例如,在RNA分子的3’末端上所见的)被氧化为二醛,其之后例如在如硼氢化物介导的还原后,与胺或肼衍生物形成环胺,
硫酯加半胱氨酸-天然结扎和衍生物,
硫代磷酸酯(phosphothioate)+α-含卤代羰基的接合体(conjugants),
磷酸酯+胺至磷酰胺酯,例如经由磷酸酯活化
磷酸酯+醇至磷酸二酯,例如经由活化,
醛至形成仲胺(在用硼氢化物还原后),肼基至形成腙,氨基脲至形成缩氨基脲,
半胱氨酸衍生物+硫酯酞
环氧化物加胺
烯/炔+二烯/二炔,进行第尔斯-阿尔德反应(Diels Alder reaction)和其他的周环反应
通过将醛与羟胺反应形成肟
羟基或氨基+环氧化物
上述反应或至少其一些是Smith和March,2007和Hermanson,2008描述的,等等。
也应该知道标签/标记或配体的化学添加也可基于但不限于上述列出的官能团相互作用进行,其中提供这类相互作用的一个要素附于核酸分子,而提供这类相互作用的另一个要素附于标签,相互作用配偶体。
特别优选的固定形式是基于下列相互作用的亲和固定,其中提供这类相互作用的一个要素是配体,而提供这类相互作用的另一个要素是相互作用配偶体:生物素-抗生物素蛋白相互作用、生物素-中性抗生物素蛋白相互作用、生物素-链亲和素相互作用、抗体和抗原或半抗原的相互作用、两个寡核苷酸的相互作用——其中核酸分子由DNA、RNA、LNA、PNA或其组合组成,钙调蛋白和钙调蛋白结合肽的相互作用、清蛋白和Cibracon蓝的相互作用、金属-螯合剂和金属-螯合支持物的相互作用。
在修饰的核酸分子片段固定后,将未修饰核酸分子片段从修饰的核酸分子片段移出。这种移出是本领域普通技术人员已知的标准过程。优选地,通过洗涤或通过转移包含其上固定修饰的核酸分子片段的相至相互作用的配体附着的相,将未修饰核酸分子片段分别地从反应物和反应容器——在这里已经进行分离步骤——移出分别进入新的反应物和反应容器。
如本文使用的术语洗涤指应用液体介质,以便从其修饰片段被螯合的相除去未修饰片段或其他的化学本体。
在进一步的子步骤中,固定的修饰的核酸分子片段从相互作用配偶体附着的相移出,因此释放修饰的核酸分子片段。这种释放可以通过本领域普通技术人员已知的任何方法实现。更具体地说,这种释放可以通过加入过量的配体的相互作用配偶体——其与配体与附着于相的相互作用配偶体的结合进行竞争——得到实现。该方法的替代方法是将相互作用配偶体与相分离,以便释放的修饰的核酸分子片段也包括此刻从在这种释放以前附着的相释放的相互作用配偶体。在进一步实施方式中,相互作用配偶体和配体之间的相互作用通过共价键形成,并且相互作用配偶体从配体移出,其中共价键被化学地和/或酶切割或通过光断裂。在可选的实施方式中,相互作用配偶体和配体之间的相互作用通过非共价键形成,并且相互作用配偶体从配体移出,其中非共价结合通过pH、温度和/或离子力的变化,通过配体和/或相互作用配偶体的变性,通过用竞争分子洗脱,通过利用有机溶剂和离液剂进行断裂。在另一实施方式中,通过断裂用于将配体结合到(修饰的)核酸分子片段的连接体,从相互作用配偶体附着的相移出修饰的核酸分子片段。在这种实施方式中,必须确保修饰的核酸分子片段仍然包括允许修饰的核酸分子片段分离或分辨的修饰。
在根据本发明的方法的下一步骤——其适用于第一和第二方法——中,修饰的核酸分子片段根据它们的长度、质量和/或电荷被分离或分辨,其中这种分离或分辨产生修饰核酸片段的模式。这种分离通过使用作为修饰的核酸分子片段的部分的修饰进行。
在该分辨步骤中,必须使在从作为混合物的未修饰核酸分子片段分离后存在的修饰的核酸分子片段——单独的片段,即单独的片段种类——是可获得的(可引导的,addressable)。该使单独的片段种类为可获得的方法基于所述片段种类在其长度、质量和/或电荷方面的差异。因此,对修饰的核酸分子片段的混合物运用分辨混合物的技术,以便单独的种类彼此分离。这种分离可以是时间、空间、质量和/或质核比方面的分离。进行这种分离的方法是本领域普通技术人员已知的,并且也在本文进行描述,其包括将被并入说明书本部分以避免不必要重复的公开内容的介绍。如本文优选使用的,时间的分离是其中在显示器(display)上随时间一个种类的片段跟随另一个的分离。在时间上给定的时刻,则仅一种或有限数量的这些种类存在于显示器,这取决于时间窗的宽度和这种显示器包括的时间窗。如本文优选使用的,空间的分离是其中在显示器上在二维或三维空间的位置处布置或存在一个种类的片段,其中该位置对于修饰核酸分子的不同片段是不同的。取决于显示器包括(覆盖,covered)的空间,所有种类的片段或仅其部分可被包括,即被显示。
至此,本文优选使用的术语模式(pattern)指分辨步骤的结果,并且指示随时间优选地在显示器中示出的修饰的核酸分子片段的序列,或者在二维或三维空间中的修饰的核酸分子片段的序列布置或基于质量或质核比的修饰的核酸分子片段的序列的布置。至此,模式优选地为沿时间轴布置的修饰的核酸分子片段的梯状物,在二维或三维空间中布置的修饰的核酸分子片段的梯状物或者其组合。
在本发明的范围内,利用修饰的核酸分子片段的模式推断核酸分子的核苷酸序列的步骤实际上使用缺少在将修饰的核酸分子片段与未修饰核酸分子片段分离步骤中使用的所述修饰的修饰核酸分子片段。更具体地说,在修饰的核酸分子片段与未修饰核酸分子片段分离后,从修饰的核酸分子片段移出所述修饰,因此生成修饰的核酸分子片段的模式,其缺少被用于将修饰的核酸分子片段与未修饰核酸分子片段分离的修饰。这种缺少所述修饰的修饰的核酸分子片段可通过利用将该修饰附于修饰的核酸分子片段的无痕连接体(traceless linker)生成。这种无痕连接体是在断裂后留下该修饰和缺少曾经正形成无痕连接体的任何原子(一个或多个)、原子的基团(一个或多个)或一个/多个部分的核酸分子片段的连接体。因此,在无痕连接体已分别被断裂和移出后,该修饰和核酸分子片段在长度、质量和/或电荷方面没有显示任何改变。这种无痕连接体的实例在下式中示意性地描述:
在本发明的范围内,修饰的核酸分子片段的一个修饰或这类修饰的一部分可从修饰的核酸分子片段移出,优选在将修饰的核酸分子片段与未修饰的核酸分子片段分离之后,其中另外的修饰或所述修饰的部分仍然附着于核酸分子片段。在进一步的实施方式中,移出修饰留下将该修饰附着于核酸分子片段的连接体,或其附着于核酸分子片段的部分,其中由于该连接体或其部分的存在,这种核酸分子片段仍然可被认为是修饰的核酸分子片段,优选的存在这样的条件:这种连接体和其部分分别地适于赋予这类核酸分子修饰的核酸分子片段的特性。
本领域普通技术人员应了解,在根据本发明的方法的第一过程中,模式本质上仅由修饰的核酸分子片段组成。然而,不可能排除在进行分辨步骤的反应物中包含一些未修饰核酸分子片段,典型地为副产品,这是由于修饰的核酸分子片段与未修饰核酸分子片段的不完全分离。
本领域普通技术人员也应了解,与根据本发明方法的第二过程相关的,模式由修饰的核酸分子片段和未修饰核酸分子片段形成。然而,在该分辨修饰核酸分子片段步骤的意义中的模式仅仅由修饰的核酸分子片段组成,因为仅这些修饰的核酸分子片段包括可在引导(寻址,addressing)方法中使用的修饰。因此,只有修饰的核酸分子片段可以在时间、空间、质量和/或质核比方面显示,以生成修饰的核酸分子片段的模式。
允许分辨步骤的修饰,即用于分离或分辨修饰的核酸分子片段即种类的修饰,可以是如本文定义的未分(uni-partite)修饰或二分修饰或多分修饰的部分。
这类修饰优选为标记、质量标签、亲脂标签或亲和标签。
在优选的实施方式中,修饰的核酸分子的修饰是直接或间接连接于核酸分子的5’或3’-末端核苷酸的标记。在本文中,间接连接指在标记和核酸分子的5’或3’-末端核苷酸之间,安装连接体。如本文使用的,术语“标记”指可用于提供可检测的(优选地可定量的)信号并且可附着于核酸分子的核苷酸的任何原子、分子和/或部分。标记可提供通过荧光、化学发光、电化学发光、放射性、比色、X射线衍射或吸收、磁、酶活性等可检测的信号。检测标记包括但不限于,荧光基团[能吸收某种波长的电磁辐射例如光或X-射线并随后重发射吸收的能量为更长波长的辐射的基团;说明性的实例为DANSYL(5-二甲基氨基)-1-萘磺)、DOXYL(N-氧基-4,4-二甲基
Figure BPA00001354994000401
唑烷)、PROXYL(N-氧基-2,2,5,5-四甲基吡咯烷)、TEMPO(N-氧基-2,2,6,6-四甲基哌啶)、二硝基苯基、吖啶、香豆素、Cy3和Cy5、赤藓红、香豆酸、伞形酮、德克萨斯红、若丹明、四甲基若丹明、Rox、7-硝基苯并-2氧杂-1-二唑(NBD)、芘、荧光素、铕、钌、钐及其他稀土金属]、花青染料(国际专利申请WO1997/45539、美国专利US 5,366,860和US 5,18.934)以及化学发光染料(美国专利US 4,931,223;Bronstein等人,1994)、放射性同位素标记和化学发光标记(在化学反应期间经由光线发射可检测的标记,例如在美国专利US 4,931,223中示出的;Bronstein等人,1994)。
荧光素染料的实例包括6-羧基荧光素(6-FAM)、2′,4′,1,4-四氯荧光素(TET)、2′,4′,5′,7′,1,4-六氯荧光素(HEX)、2′,7′-二甲氧基-4′,5′-二氯-6-羧基若丹明(JOE)、2′-氯-5′-氟-7′,8′-稠合苯基-1,4-二氯-6-羧基荧光素(caroxyflurescein)(NED)和2′-氯-7′-苯基-1,4-二氯-6-羧基荧光素(VIC)。
本领域普通技术人员应该了解,这种修饰即标记在与根据本发明的方法的第二过程有关时是特别有用的。更优选地,这类标记显示与核酸分子通常的吸收或荧光特征不同的吸收或荧光特征。由于这种修饰,修饰的核酸分子片段可以与未修饰核酸分子相区别,并且优选地在显示器中显示,并且经历引导方法。
在优选的实施方式中,修饰的核酸分子的修饰是质量标签。在优选的实施方式中,修饰的核酸分子的修饰是直接或间接连接于核酸分子的5’或3’-末端核苷酸的质量标签。本文中,间接连接指在质量标签和核酸分子的5’或3’-末端核苷酸之间,安装连接体。质量标签指其分子量大于待测序核酸分子的分子量的标签。因此,与核酸分子连接的质量标签,即修饰的核酸分子——因而该修饰为质量标签,允许修饰的核酸分子与未修饰核酸分子分离。质量标签修饰的核酸分子与未修饰核酸分子的分离可通过过滤、透析和/或层析过程进行。
质量标签包括永久附着于核酸分子的部分,并且其带标签的片段是限定质量的,以便能够精确测定序列。这类标签的实例是限定的亲水聚合物,例如肽、DNA PNA。质量标签也可被仅仅用于促进带标签片段与未带标签片段的分离。在分离后,移出这些质量标签,仅仅留下期望的核酸分子片段。与未带标签片段分离后断裂的质量标签不必具有限定的质量。因此,可以使用亲水聚合物例如但不限于PEG、蛋白质、抗体、多糖,以及限定的聚合物例如DNA、PNA和肽。
质量标签也可被认为是通过其质量可区别的标签。这类区别可用于鉴定带标签片段。鉴定可以如此进行:使用MS/MS断裂释出独特质量的标签并因此指示母体分子带标签。该概念被称为‘子离子’质量标签方法。在进一步实施方式中,质量标签可由限定的同位素分布组成,以便进一步确定标签的特征。
在进一步优选的实施方式中,修饰是直接或间接连接于核酸分子的5’或3’-末端核苷酸的亲脂标签。本文中,间接连接指在亲脂标签和核酸分子的5’或3’-末端核苷酸之间,安装连接体。亲脂标签指比待测序核酸分子更亲脂的标签。因此,与核酸分子连接的亲脂标签,即修饰的核酸分子——因而该修饰为亲脂标签,允许修饰的核酸分子与未修饰核酸分子的分离。亲脂标签分离修饰的核酸分子与未修饰核酸分子的分离可通过过滤、透析和/或测序过程进行。
亲脂标签包括但不限于具有2到50个碳的脂族链、甾体、生物碱、芳环系统。如本文使用的,术语“脂族的”包括饱和的和不饱和的、直链(即不分枝的)、分枝的、无环的、环状的或多环的脂肪族烃,其任选地由一个或多个官能团取代。如本领域普通技术人员了解的,本文“脂族的”拟包括但不限于烷基、烯基、炔基、环烷基、环烯基和环炔基部分。因此,如本文使用的,术语“烷基”包括直链的、分枝的和环状的烷基。类似的约定应用于其他的通用术语,例如“烯基”、“炔基”等。此外,如本文使用的,术语″烷基″、″烯基″、″炔基″等包括取代的和未取代的基团。因此,说明性的脂族基包括但不限于例如甲基、乙基、正-丙基、异丙基、环丙基、-CH2-环丙基、乙烯基、烯丙基、正丁基、仲丁基、异丁基、叔丁基、环丁基、-CHb-环丁基、正戊基、仲戊基、异戊基、叔戊基、环戊基、-CH2-环戊基、正己基、仲己基、环己基、-CH2-环己基部分等,其也可带有一个或多个取代基。烯基包括但不限于乙烯基、丙烯基、丁烯基、1-甲基-2-丁烯-1-基等。代表性的炔基包括但不限于乙炔基、2-丙炔基(炔丙基)、1-丙炔基等。一般而言,如本文使用的,术语“芳基”和“杂芳基”指稳定的单或多环的、杂环的、多环的和多杂环的不饱和部分。取代基包括但不限于先前提到的任意取代基,即对于脂族部分或对于本文公开的其他部分陈述的、导致形成稳定化合物的取代基。在本发明的某些实施方式中,“芳基”指具有一个或二个芳环的单或二环的碳环系统,其包括但不限于苯基、萘基、四氢萘基、2,3-二氢化茚基、茚基等。在本发明的某些实施方式中,如本文使用的术语“杂芳基”指具有五到十个环原子的环状芳基,其中一个环原子选自S、O和N;零、一或两个环原子是独立地选自S、O和N的附加杂原子;并且剩余环原子是碳,和该基团经由任何环原子与分子的其余部分相连,例如吡啶基、吡嗪基、嘧啶基、吡咯基、吡唑基、咪唑基、噻唑基、
Figure BPA00001354994000411
唑基、异唑基、噻二唑基、
Figure BPA00001354994000413
二唑基、苯硫基、呋喃基、喹啉基、异喹啉基等。应该理解,芳基和杂芳基可以是未取代的或取代的,其中取代包括用下列部分的任意一个或多个独立地替换其上的一个、两个、三个或更多个氢原子,所述部分包括但不限于脂族的;杂脂族的;芳基;杂芳基;芳烷基;杂芳烷基;烷氧基;芳氧基;杂烷氧基;杂芳氧基;烷基硫代;芳基硫代;杂烷基硫代;杂芳基硫代;-F;-Cl;-Br;-I;-OH;-NO2;-CN;-CF3;-CH2CF3;-CHCl2;-CH2OH;-CH2CH2OH;-CH2NH2;-CH2SO2CH3;-C(O)Rx;-CO2(Rx);-CON(Rx)2;-OC(O)Rx;-OCO2Rx;-OCON(Rx)2;-N(Rx)2;-S(O)2Rx;-NRx(CO)Rx,其中对于Rx的每次出现,优选地,Rx为单独地并独立地选自脂族的、杂脂族的、芳基、杂芳基、芳烷基或杂芳烷基,其中上面和此处描述的脂族的、杂脂族的、芳烷基或杂芳烷基取代基的任一种可以是取代的或未取代的、分枝的或无枝的、环状的或无环的,并且其中上面和此处描述的芳基或杂芳基取代基的任一种可以是取代的或未取代的。如本文使用的术语“环烷基”具体地指具有三个到七个,优选地三个到十个碳原子的基团。适当的环烷基包括但不限于环丙基、环丁基、环戊基、环己基、环庚基等,其如同在其他的脂族的、杂脂族的或杂环部分的情况一样,可任选地用取代基取代,所述取代基包括但不限于脂族的;杂脂族的;芳基;杂芳基;芳烷基;杂芳烷基;烷氧基;芳氧基;杂烷氧基;杂芳氧基;烷基硫代;芳基硫代;杂烷基硫代;杂芳基硫代;-F;-CI;-Br;-I;-OH;-NO2;-CN;-CF3;-CH2CF3;-CHCl2;-CH2OH;-CH2CH2OH;-CH2NH2;-CH2SO2CH3;-C(O)Rx;-CO2(Rx);-CON(Rx)2;-OC(O)Rx;-OCO2Rx;-OCON(Rx)2;-N(RX)2;-S(O)2Rx;-NRx(CO)Rx,其中对于Rx的每次出现,优选地,Rx单独地并独立地选自脂族的、杂脂族的、芳基、杂芳基、芳烷基或杂芳烷基,其中上面和此处描述的任何脂族的、杂脂族的、芳烷基或杂芳烷基取代基可以是取代的或未取代的、分枝的或无枝的、环状的或无环的,并且其中上面和此处描述的任何芳基或杂芳基取代基可以是取代的或未取代的。一般合适的取代基的另外实例由在本文描述的实施例中示出的具体实施方式所说明。如本文使用的术语“杂脂族的”指包含一个或多个氧、硫、氮、磷或硅原子——例如代替碳原子——的脂族部分。杂脂族部分可以是分枝的、无枝的、环状的或无环的,并且包括饱和的和不饱和的杂环例如吗啉代、吡咯烷基等。在某些实施方式中,杂脂族部分通过用一个或多个部分独立地替换其上的一个或多个氢原子进行取代,所述部分包括但不限于脂族的;杂脂族的;芳基;杂芳基;芳烷基;杂芳烷基;烷氧基;芳氧基;杂烷氧基;杂芳氧基;烷基硫代;芳基硫代;杂烷基硫代;杂芳基硫代;-F;-CI;-Br;-I;-OH;-NO2;-CN;-CF3;-CH2CF3;-CHCl2;-CH2OH;-CH2CH2OH;-CH2NH2;-CH2SO2CH3;-C(O)Rx;-CO2(Rx);-CON(Rx)2;-OC(O)Rx;-OCO2Rx;-OCON(Rx)2;-N(RX)2;-S(O)2Rx;-NRx(CO)Rx,其中对于Rx的每次出现,优选地,Rx单独地并独立地选自脂族的、杂脂族的、芳基、杂芳基、芳烷基或杂芳烷基,其中上面和此处描述的任何脂族的、杂脂族的、芳烷基或杂芳烷基取代基可以是取代的或未取代的、分枝的或无枝的、环状的或无环的,并且其中上面和此处描述的任何芳基或杂芳基取代基可以是取代的或未取代的。
如本文定义的,允许分辨步骤——即被用于分离或分辨修饰的核酸分子片段即种类——的未分修饰可通过连接体与核酸分子连接。
如本文定义的,允许分辨步骤——即被用于分离或分辨修饰的核酸分子片段即种类——的二分或多分修饰可彼此相连接并通过连接体与核酸分子连接。
“连接体”指形成连接部分的一个或多个原子,所述连接部分将核酸分子与修饰或修饰的一部分/多个部分连接,或者分别形成对彼此和对核酸分子的修饰。连接体的功能是将所述部分或分子以永久的或非永久的方式连接。在一个实施方式中,非永久的键是可断裂的键。连接体在性质上可以是无环的、环状的、芳基、杂芳基或这些的组合。它可单独地包括碳原子主链或可以是如上面定义的杂脂族的。其可包含其他的部分,例如但不限于脂族的;杂脂族的;芳基;杂芳基;芳烷基;杂芳烷基;烷氧基;芳氧基;杂烷氧基;杂芳氧基;烷基硫代;芳基硫代;杂烷基硫代;杂芳基硫代;-F;-CI;-Br;-I;-OH;-NO2;-CN;-CF3;-CH2CF3;-CHCl2;-CH2OH;-CH2CH2OH;-CH2NH2;-CH2SO2CH3;-C(O)Rx;-CO2(Rx);-CON(Rx)2;-OC(O)Rx;-OCO2Rx;-OCON(Rx)2;-N(RX)2;-S(O)2Rx;-NRx(CO)Rx,其中对于Rx的每次出现,优选地,Rx单独地并独立地选自脂族的、杂脂族的、芳基、杂芳基、芳烷基或杂芳烷基,其中上面和此处描述的任何脂族的、杂脂族的、芳烷基或杂芳烷基取代基可以是取代的或未取代的、分枝的或无枝的、环状的或无环的,并且其中上面和此处描述的任何芳基或杂芳基取代基可以是取代的或未取代的。连接体可包含断裂位点或可断裂部分——优选地在其主链上,其允许分离分别地通过所述连接体连接(connected)或连接(linked)的分子和部分。例如,在一个实施方式中,断裂连接体将使修饰例如标记分别地与核酸分子和核酸分子片段分离。这类可断裂连接体可以在酸性、碱性或还原条件下断裂。它们也可酶切割或者通过光断裂。在后一种情况中,它们是可光致断裂的连接体。
与本发明相关的,多种核酸分子片段利用修饰根据其长度、质量或电荷进行分辨的分辨步骤,可使用至此适合的任何技术。这类技术包括但不限于层析和质谱分析法,并且可以与根据本发明的方法的第一和第二过程结合使用。特别优选的技术是质谱分析技术,其可与层析组合。
如本文使用的,提及质谱分析法包括本领域普通技术人员已知的任何适当的质谱仪形式。优选允许精确分析核酸分子的质谱分析技术。例如,由于核酸分子的过度断裂发生,所谓的“硬”电离技术,例如电子和快原子轰击(FAB)电离方法不适于核酸分子的分析。各种质谱仪形式(电离原理与不同的质量分析仪结合)是使用软电离技术的领域中的技术人员已知的。这类形式包括电喷射、大气压光致电离(缩写APPI)、大气压化学电离(缩写APCI)、基质辅助激光解吸电离(缩写MALDI)、基质辅助激光解吸电离飞行时间(缩写MALDI-TOF)、红外基质辅助激光解吸/电离质谱(缩写IR-MALDI)、正交-TOF(缩写O-TOF)、轴向-Tof(缩写A-TOF)、离子回旋共振(缩写ICR)、傅里叶变换直线/反射(Fourier TranformLinear/Reflecton)(缩写RETOF)、激光解吸电离(缩写LDI)、快原子轰击(缩写FAB)、解吸电喷射电离(缩写DESI)、二氧化硅上解吸电离(缩写DIOS)、液体二次离子质谱(缩写LSIMS)。
电喷射电离(缩写ESI)包括从施加高电压的毛细管的顶端喷射分析物的稀溶液。然后,喷射通过引起在液面电荷分离并因此使成滴(emerging drop)(Taylor锥)变形的静电力实现。这最终分解产生数千的微米大小的小滴,所述小滴进一步发展成之后分析的带电分子。由于该技术的温和性以及对极性和离子化合物的偏爱,发现其在生物聚合物分析领域容易应用。
大气压光致电离(缩写APPI)经常被用来电离难以电离的非极性本体例如甾体,但是该技术也适用于极性本体。其是LC/MS电离技术,其中使用加热器在大气压下蒸发LC洗脱液。所得到的气体被引导通过由电离气体分子的放电灯(例如UV灯)生成的光子束。
大气压化学电离(缩写APCI)包括加热包含溶液的分析物(一般地是来自HPLC的流动相)至超过400℃的温度,用高流速的氮气喷射,并且使所得到的气溶胶云状物经历电晕放电产生离子。其不同于ESI,因为其是气相电离方法,而不是液相电离方法。一般地,APCI比ESI产生更多的断裂。
快原子轰击(缩写FAB)包括利用高能中性原子束,一般为Xe或Ar,其撞击包含样品的固体基质,引起解吸和电离。其用于难以进入气相的大的生物分子。通过从离子源使离子加速通过电荷-交换室(charge-exchange cell)产生原子束。离子与中性原子相撞获得电子以形成高能量原子束。FAB谱一般包含较少的片段和假分子离子信号(例如,[M+H]+、[M+Na]+、加合物),使FAB可用于分子量测定。然而,基质贡献许多低m/Z信号,其重现性的缺乏使谱解释复杂化。此外,该方法易于被小杂质抑制效果。
基质辅助激光解吸电离(缩写MALDI)是激光介导的蒸发和电离大生物分子例如蛋白质或DNA片段的方法。生物分子分散在固体基质例如3-羟基吡啶羧酸(3-HPA)中。紫外激光器脉冲烧蚀携带一些大分子的基质成为电离形式的气相,所以它们可以被提取入质谱仪。大范围的MALDI允许测定上至500kDa的分子量,通常测定5到100kDa的分子量(即,例如聚合物、生物分子、复合物、酶),这取决于分析器。MALDI技术可以例如与飞行时间分析器或傅里叶变换质谱仪结合。前者具有低分辨率和准确度,而后者是非常精确的,但是具有低动态范围,并且其操作更复杂。
激光解吸电离(缩写LDI)是用高强度激光脉冲照射分子,形成之后分析的离子。该早期技术的限制是在大约5到10kDa质量的锐截止(sharp cut-off),并且需要将其与TOF质量分析器结合。
解吸电喷射电离(缩写DESI)是一种电离技术,其中电喷射源产生带电的小滴,其被引导在固体样品处数毫米到数厘米距离内。带电小滴通过与表面的相互作用获得样品,之后形成可以被提取入质谱仪的高度带电的离子。
二氧化硅上解吸电离(缩写DIOS)是沉积在多孔硅表面上的样品的激光解吸/电离。
表面增强的激光解吸/电离(缩写SELDI)是与MALDI相似的变体,但是使用生物化学亲和靶。
表面增强的净解吸(缩写SEND)是MALDI的变体,其中基质与靶表面共价连接。
表面辅助的激光解吸/电离(缩写SALDI)可被描述为使用液体加颗粒基质的MALDI。
二次离子质谱(缩写SIMS)包括用高能量一次离子轰击分析物涂布的表面以生成样品(二次)离子。能量转移引起样品分子解吸入气相,在那里它们经历离子/分子反应形成二次离子。形成后,通过对提取应用高电压并聚焦透镜,样品离子可被加速离开源。在该方法的普通变化中——被称为液体二次离子质谱(缩写LSIMS),分析物被溶于不挥发性液体基质中,然后被置于探针顶端。用一次离子轰击该混合物(通常35keV的Cs+)导致形成基质离子并导致间接的样品电离。在这方面,LSIMS与较老的被称为快原子轰击(缩写FAB)的技术非常相似,快原子轰击(缩写FAB)也使用基质。如其名称指示的,FAB电离使用快速中性原子(例如Ar)束,而不是离子束,但是FAB和LSIMS的电离机制是相同的,实际上两个术语经常被混淆。
如上所述的,这类离子源可以在一个时间段内提供有洗脱液,该洗脱液已通过液相色谱或毛细管电泳被从混合物分离。
串联质谱分析法也可用于提高描述的方法,以便充当片段特征的附加证实。串联质谱分析法——也称为MS/MS,包括多个质谱分析选择步骤,其中一些形式的断裂在阶段之间发生。对于核酸分子的序列鉴定,串联质谱的适用性可以在数篇综述文章(Limbach,1996;Nordhoff等人,1996;Wu & McLuckey,2004)中查阅,碰撞诱导分裂(CID)的气相断裂可使用应用例如离子阱、傅里叶变换、离子回旋共振和三重-四重分析器的串联质谱分析进行(Baker等人,1993;Boschenok & Sheil,1996;Kawase等人,1991;Limbach等人,1995;Little等人,1995;Marzilli等人,1999;Ni等人,1996)。在MALDI-MS后,经由源后衰减和迅速断裂,可生成未修饰的和修饰的核酸分子的这类片段(Juhasz等人,1996;Stemmler等人,1993;Talbo &Mann,1996)。
液相色谱-质谱(缩写LC-MS)允许分离不挥发性化合物的复杂混合物,然后引入质谱仪。对于具有高分子量或太敏感而不能加热来通过GC进行分析的化合物,其被广泛使用。在正负离子模式中,联接于LC的最常见的电离法是ESI和大气化学电离(缩写APCI)。LC在大多数情况下通过反相高效液相色谱(缩写RP-HPLC)进行。
也可用于分辨各种种类的修饰的核酸分子种类的傅里叶变换质谱法(缩写FTMS)的基础是允许通过这类技术如电子碰撞电离、化学电离、MALDI和ESI形成的离子积聚和储藏数分钟时期的离子阱(彭宁室(Penning cell))。在该时间期间,可继续(follow)离子与中性分子的反应。对于质量测量,该方法在质谱分析法中具有最高的分辨能力、高的质量上限、高灵敏度、无损检测和高准确度。因为其使用傅里叶变换检测,所以信号平均和同时宽质量检测是可能的。
在本发明的范围内,质谱指从通过质谱分析法分析核酸分子或其片段获得的数据显示(图形地或数字编码的)。质谱是在分离或分辨步骤中生成的模式的实施方式,也在本发明的范围内。
对于质谱,核酸分子的断裂模式指特性分布和信号标记(例如峰或其数字表示)。一般而言,如本文使用的,断裂模式指通过核酸分子特异性断裂生成的片段组。这类片段模式是在分离或分辨步骤中生成的模式的实施方式。
依赖于连续主链断裂的任何质谱仪测序方法的应用取决于质量梯状物的形成。序列信息通过测定质谱中连续峰之间的质量差获得。在寡脱氧核苷酸的情况下,连续峰之间期望的质量差相应于下列的损失:dC=289.05、dT=304.05、dA=313.06和dG=329.05(精确的质量基值)。对于寡核糖核苷酸,质量差为:C=305.04、U=306.03、A=329.05和dG=345.05(精确的质量基值)。
如本文使用的,在质谱法背景中的质量信号指输出数据,其是具有特定质量的分子的数量或相对数量。信号包括“峰”和其数字表示。公知的是,质谱仪测量“质核比”(m/z)而不是样品组分的实际“分子量”。使用的具体质谱仪的校准应该在试验之前进行。对于检测多个带电分子(例如当使用电喷射电离)的质谱仪,粗略估计的质量可以例如通过使获得的质核比值乘以分子上电荷的数量进行确定。在实践中,中性分子质量的计算通过应用使用称为解卷积(deconvolution)方法的软件包进行。因此,本领域已知的用于检测、确定和/或计算质量的每一方法可用于获得本文方法包括的质量。
如本文使用的,“解卷积质量”指平均分子量或单同位素的精确分子量。精确分子量的应用受到质量分析器分辨率的限制。当分析具有较高分子量的分子时,可能更难以阐明化合物的同位素模式(模式)。在此情况下,可使用平均质量来鉴定显示较高分子量的化合物。然而,当使用精确质量时,需要运用单同位素质量,这是因为这考虑到C和U之间的区别。然而,必须证实单同位素质量以适当的丰度存在,以便进行鉴定。
如本文使用的,术语“峰”指从质谱仪谱(“质谱”)的基线信号向上凸出的突出部分,其相应于片段的质量和强度。峰可以从质谱通过手工或自动“峰发现”程序提取出。
如本文使用的,质谱中峰的质量指通过“峰发现”程序计算的质量。
如本文使用的,质谱中峰的强度指通过“峰发现”程序计算的强度,其取决于参数,所述参数包括但不限于质谱中的峰高度和其信噪比。
如本文优选使用的,计算质量被定义为通过加和根据其分子式确定的分子包含的单个元素的质量贡献确定的分子或片段的理论质量。计算的质量可以是精确质量或分子量,这取决于是否使用元素的精确质量或平均质量。例如,具有C3H6O2分子式的分子的计算质量具有计算的74.037道尔顿的单同位素精确质量,如通过下式得到的:(3×12.000)+(6×1.0078)+(2×15.9949),而平均质量为74.079道尔顿,这考虑天然的最大丰度的同位素。
如本文优选使用的,观测质量是通过质谱仪实验上发现的质量值。
如本文优选使用的,精确质量是分子的精确分子量,其中每个原子的原子质量基于每种元素的单同位素形式的普通同位素。
如本文优选使用的,观测的精确质量是分子的精确单同位素分子量,如使用质谱仪实验上测定的。
如本文优选使用的,计算的精确质量是分子的精确单同位素分子量,如通过加和根据其分子式确定的分子包含的单个单同位素元素的质量贡献理论确定的。
如本文优选使用的,平均分子量是结构的平均分子量,其中原子质量基于元素的所有同位素的天然丰度。
如本文优选使用的,观测的平均分子量是分子的平均分子量,如使用质谱仪实验上测定的。
如本文优选使用的,计算的平均分子量是是分子的平均分子量,如通过使用根据其分子式确定的分子包含的所有元素的原子量理论确定的。
应该了解,根据本发明的方法也可与具体的核酸分子相关使用。这类具体的核酸分子是例如适配体、Spiegelmers、反义分子、核糖核酸酶、诱铒寡核苷酸和siRNA分子。在优选实施方式中,这种具体的核酸分子用于治疗、诊断和/或美容领域。
在本发明的范围内,单链核酸分子可以形成不同并稳定的三维结构并且特异性地与靶分子如抗体结合。这类由D-核苷酸组成的核酸分子被称为适配体。适配体可以针对数种靶分子例如小分子、蛋白质、核酸甚至细胞、组织和生物体进行鉴定,并且可以抑制特定靶分子的体外和/或体内功能。适配体通常通过靶直接选择方法——称为体外选择或通过指数富集的配体系统进化(缩写SELEX)——进行鉴定(Bock等人,1992;Ellington & Szostak,1990;Tuerk & Gold,1990)。未修饰适配体被从血流迅速地清除,其半衰期为数分钟到数小时,主要由于核酸酶降解和通过肾从身体清除,这是适配体固有的低分子量的结果。因此,为了治疗上使用适配体,其必须在糖(例如核糖)主链的2’位置进行修饰(Cload等人,2006)。
使适配体不稳定的普遍存在的核酸酶由手性构件(building block)即L-氨基酸组成。因此,核酸酶的结构也固有地是手性的,这产生立体特异性的底物识别。因此,这些酶仅仅接受恰当手性结构的底物分子。因为适配体和天然存在的核酸分子由D-核苷酸组成,所以L-寡核苷酸应该免于酶识别和随后的降解。由于相同的原理,不幸地在这种情况下,天然发展无酶活性以扩增这类镜像核酸。因此,L-核酸适配体不能直接地使用SELEX方法获得。尽管立体化学的原理显示最终导致期望的功能性L-核酸适配体的迂路(detour)。
如果体外选择的(D-)适配体结合其天然标靶,则该适配体的结构镜像具有相同的特性与天然靶的镜像结合。这里,相互作用配偶体具有相同的(非天然的)手性。由于生命和大部份生物化学化合物的纯手型,这类对映(enantio)-RNA配体当然将具有限的实际用途。另一方面,如果SELEX方法针对(非天然的)镜像靶进行,则将获得识别该(非天然的)靶的适配体。所述适配体的相应镜像结构——期望的L-适配体——又识别天然靶。生成生物稳定的核酸分子的该镜像选择过程在1996首先出版(Klussmann等人,1996;Nolte等人,1996),并且导致生成不但显示对给定靶分子的高亲和性和特异性而且同时也显示生物稳定性的功能性镜像核酸分子配体。单链核酸分子是这类配体结合L-核酸分子——其被称为′Spiegelmer′(来自德语单词′Spiegel′,镜子)在本发明的范围内(Eulberg等人,2006)。
本文公开的核酸分子——优选spiegelmer或适配体——包括如此部分,其优选为高分子量部分和/或优选允许就在动物体优选人体内停留时间等方面修饰核酸分子特性。这类修饰的特别优选实施方式是如本文使用的核酸分子的聚乙二醇化(PEGylation)和(HESylation),PEG代表聚(乙二醇(ethylene glycole))和HES代表羟乙基淀粉。如本文优选使用的,聚乙二醇化是核酸分子的修饰,其中这类修饰由附着于核酸分子的PEG部分组成。如本文优选使用的,羟乙基淀粉化是核酸分子的修饰,其中这类修饰由附着于核酸分子的HES部分组成。这些修饰以及使用这类修饰修饰核酸分子的方法在欧洲专利申请EP1 306 382中描述,其公开内容通过引用以其整体由此并入。
优选地,由高分子量部分组成或包括高分子量部分的修饰的分子量为大约2,000至250,000Da,优选地20,000至200,000Da。在PEG作为这类高分子量部分的情况中,分子量优选为20,000至120,000Da,更优选为40,000至80,000Da。在HES作为这类高分子量部分的情况中,分子量优选为20,000至200,000Da,更优选为40,000至150,000Da。HES修饰地方法在例如德国专利申请DE 12004 006 249.8中描述,其公开内容通过引用以其整体由此并入。
在本发明的范围内,如在专利申请WO 2005/074993和WO 2003/035665中进一步描述的,PEG和HES可以以直链或分枝形式使用。原则上,可以对核酸分子在其任何位置进行这类修饰。优选地,对核酸分子的5’-末端核苷酸、3’-末端核苷酸和/或5’核苷酸和3’核苷酸之间的任何核苷酸进行这类修饰。
修饰和优选地PEG和/或HES部分可以直接地或通过连接体附着于本发明的核酸分子。根据本发明的核酸分子包含一个或多个修饰,优选地一个或多个PEG和/或HES部分,也在本发明的范围内。在一个实施方式中,单独连接体分子将多于一个PEG部分或HES部分附着于根据本发明的核酸分子。与本发明联合使用的连接体本身可以是直链的或分枝的。这种连接体是本领域普通技术人员已知的,并且在专利申请WO2005074993和WO2003035665中被进一步描述。
在优选的实施方式中,连接体是生物可降解的连接体。生物可降解的连接体由于从根据本发明的核酸释放修饰,所以允许就在动物体优选人体内的停留时间等方面修饰根据本发明的核酸的特性。使用生物可降解的连接体可允许较好地控制根据本发明的核酸的停留时间。这类生物可降解的连接体的优选实施方式是在下述国际专利申请中描述的生物可降解的连接体,但不限于所述国际专利申请:WO2006/052790、WO2008/034122、WO2004/092191和WO2005/099768,其中在国际专利申请WO2004/092191和WO2005/099768中,连接体是由本文描述的一个或二个修饰、核酸分子和之间的生物可降解的连接体组成的聚合寡核苷酸前体药物的部分。
核酸分子的修饰是生物可降解的修饰在本发明的范围内,其中生物可降解的修饰直接地或通过连接体附着于核酸分子。生物可降解的修饰由于从核酸分子释放修饰,所以允许就在动物体优选人体内的停留时间等方面修饰核酸分子的特性。使用生物可降解的修饰可允许较好地控制核酸分子的停留时间。这类生物可降解的优选修饰的实施方式是生物可降解的,如在下述国际专利申请中描述的,但不限于所述国际专利申请:WO 2002/065963、WO 2003/070823、WO2004/113394和WO 2000/41647。
如本文使用的,术语“生物可降解的”指在生物系统中讲解,例如酶促降解或化学降解。
除了上述的修饰,可以使用其它的修饰来修饰根据本发明的核酸的特性,其中这类修饰选自蛋白质、脂类例如胆固醇和糖链例如淀粉酶、葡聚糖等。
反义核酸分子也是单链核酸分子。反义核酸分子特异性地与mRNA链结合,通过结合,mRNA被阻止将mRNA转录成基因产物。此外,mRNA被RNAseH消化降解(Scherer & Rossi,2003)。反义核酸分子由D-核酸分子如RNA、修饰的RNA、DNA、修饰的DNA、PNA、LNA和其组合组成。
核糖核酸酶是催化化学反应的单链D-核酸分子。许多天然核糖核酸酶催化其自身断裂或其它RNA例如mRNA的断裂。核糖核酸酶结合mRNA链并特异性将其切割。通过这种切割或降解靶特异性mRNA分子,避免靶分子的表达(Usman& Blatt,2000)。
由于基因表达中的改变已成为正常发育和疾病发病机理的更好理解部分,所以基因表达的转录因子和其它调节子已成为潜在治疗介入的愈加有吸引力的靶。一般地,转录因子是核蛋白,其在基因调控中起关键作用,并且可对基因表达施加正或负的作用。这些调节蛋白质结合在它们靶基因的启动子区域中发现的特定序列。这些结合序列的长度通常为6到10个碱基对,并且偶而发现多重重复。因为转录因子可以识别其相对短的结合序列——甚至在不存在周围基因组DNA情况下,所以短的带有共有结合位点的放射性标记的寡脱氧核苷酸(缩写ODN)可以在电泳迁移率变动分析(electrophoretic mobility shift assay)中用作探针,其鉴定并定量核提取物中的转录因子结合活性。近来,带有特定转录因子的共有结合序列的ODNs已被开发作为在活细胞中操作基因表达的工具。该策略包括这类“诱饵”ODNs的细胞内递送,然后其被靶因子识别并结合。诱铒占据转录因子的DNA结合位点使得蛋白质不能随后与靶基因的启动子区域结合(Mann & Dzau,2000)。诱铒ODN用于基因表达的治疗操作首先由Morishita等在1995年描述(Morishita等人,1995)。他们报告在气囊损伤时,使用带有E2F转录因子家族的共有结合位点的ODNs治疗大鼠颈动脉,并且发现对E2F-1特异的诱铒防止该上调,并阻断损伤血管中的平滑肌增殖和内膜增生(Morishita等人,1995)。除该最初的体内应用之外,转录因子诱铒还被用于阻断小鼠下颌下腺中肾素基因启动子中的负调节元件,这证明诱铒可被用于增加以及抑制体内基因活性(Tomita等人,1999)。
主要在大小上不同的siRNA分子、miRNA分子或RNAi分子的基础设计基本上如此:核酸分子包含双链结构。双链结构包含第一链和第二链。更优选地,第一链包含邻近核苷酸的第一序列(stretch),并且第二链包含邻近核苷酸的第二序列。至少第一序列和第二序列基本上是彼此互补的。这类互补性一般地基于Watson-Crick碱基配对或其它的本领域普通技术人员已知的碱基配对机制,其包括但不限于Hoogsteen碱基配对等。本领域普通技术人员明白取决于这类双链结构的长度,就碱基互补性而言,完全匹配不是必须要求的。然而,在一些实施方式中,这类完全互补性是优选的。错配也是可容忍的,主要地条件是双链结构仍然适合于启动RNA干涉机制,并且优选地,这类双链结构在如分别包含或原则上包含这类细胞、组织和器官的细胞、组织和生物体内主要存在(prevailing)的生理条件下仍然稳定地形成。更优选地,双链结构在生理缓冲液中、37℃下是稳定的。
第一序列一般地至少部分地与靶核酸互补,并且第二序列至少部分地与靶核酸相同——按照碱基互补,第一序列和第二序列之间的关系被具体给定。靶核酸优选为mRNA。尽管其它形式的RNA例如hnRNAs也适合于这类目标。这类siRNA分子、miRNA分子和RNAi分子分别地适合于启动RNA干涉响应——其导致靶分子mRNA的敲落(knock-down)。至此,这种核酸分子适合于通过减少mRNA水平的表达来降低靶分子的表达。
尽管RNA干涉可以在使用分别包含数打和有时甚至数百核苷酸和核苷酸对的长核酸分子时观测到,但是较短的siRNA分子、miRNA分子和RNAi分子通常是优选的。第一序列和/或第二序列长度的更优选范围为大约15到29个连续核苷酸,优选地19到25个连续核苷酸,以及更优选地19到23个连续核苷酸。更优选地,第一序列和第二序列都具有相同的长度。在进一步实施方式中,双链结构包含优选地15和29之间、优选地18到25、更优选为19到23和最优选地19到21个碱基对。
本领域普通技术人员明白,siRNA分子、miRNA分子、RNAi分子和介导RNAi的其它核酸的具体设计可以根据当前和未来设计原则分别改变。当前,分别存在一些siRNA分子、miRNA分子、RNAi分子和介导RNAi的其它核酸的设计原则。siRNA分子、miRNA分子、RNAi分子和介导RNAi的其它核酸的设计原则在国际专利申请WO/2008/052774中描述,其公开内容通过引用以其整体由此并入。
不管siRNA的这些不同设计如何,本领域普通技术人员明白,根据其来源或功能,三种类型的天然存在的小RNA已被描述:短的干涉RNA(缩写siRNA),重复关联的短干涉RNA(缩写rasiRNA)和microRNA(缩写miRNAs)。实际上,dsRNA可以通过以RNA为模板的RNA聚合(例如从病毒)或通过重叠转录物杂交(例如从重复序列例如转基因阵列或转座子)产生。这类dsRNA产生siRNA或rasiRNA,其通常指导mRNA降解和/或染色质修饰。另外,包含互补的或近似互补的20到50个碱基对的反向重复序列的内源转录物向后折叠到它们自身之上形成dsRNA发夹结构。这些dsRNA被加工成介导转录抑制的miRNA,尽管它们也可指导mRNA降解。最终,长dsRNA或siRNAs的人工引入已在培养的细胞和活体生物体中都被选定为失活基因表达的工具(Meister & Tuschl,2004)。
优选使用的术语质量分别(质量歧视效应,mass discrimination)指修饰的核酸分子片段与未修饰(unmodified)或非修饰(non-modified)的核酸分子片段的分离基于修饰的核酸分子片段和未修饰核酸片段之间的质量差异,并针对所述质量差异进行。
优选使用的术语大小分别指修饰的核酸分子片段与未修饰或非修饰的核酸分子片段的分离基于修饰的核酸分子片段和未修饰核酸片段之间的大小差异,并针对所述大小差异进行。
优选使用的术语疏水性分别指修饰的核酸分子片段与未修饰或非修饰的核酸分子片段的分离基于修饰的核酸分子片段和未修饰核酸片段之间的疏水性差异,并针对所述疏水性差异进行。
优选使用的术语电荷分别指修饰的核酸分子片段与未修饰或非修饰的核酸分子片段的分离基于修饰的核酸分子片段和未修饰核酸片段之间的电荷差异,并针对所述电荷差异进行。
优选使用的术语离子分别指修饰的核酸分子片段与未修饰或非修饰的核酸分子片段的分离基于修饰的核酸分子片段和未修饰核酸片段之间的离子强度差异,并针对所述离子强度差异进行。
优选使用的术语氢键合(氢键,hydrogen bonding)分别指修饰的核酸分子片段与未修饰或非修饰的核酸分子片段的分离基于修饰的核酸分子片段和未修饰核酸片段之间的氢键合差异——优选是这类氢键合程度的差异,并针对所述差异进行。
优选使用的术语质量分别(质量歧视效应,mass discrimination)指修饰的核酸分子片段与未修饰或非修饰的核酸分子片段的分离基于修饰的核酸分子片段和未修饰核酸片段之间的质量差异,并针对所述质量差异进行。
对于这种特定核酸分子用于治疗、诊断和/或美容领域的事实,根据本发明的方法不但可以用于确定核酸分子的核苷酸序列,而且可用于包含一个或数个这种特定核酸分子的制备物的质量控制。至此,本发明也涉及质量控制的方法,其包括确定根据本发明的核酸分子的核苷酸序列的步骤,其中这类核酸分子被包含在制备物或样品中,其中制备物和样品分别地已在前面的步骤中提供。
在本发明的范围内,其核苷酸序列待被测定的核酸分子不必是全长核酸分子。相反,这类全长核酸分子的仅仅一个或数个部分被用作其核苷酸序列待被根据本发明的方法测定的核酸分子可能是足够的。
本发明的方法是用于确定核酸分子的指纹的方法,也在本发明的范围内,如本文优选使用的,核酸分子的指纹是核酸分子片段的特征模式。换句话说,对于识别核酸分子或其指纹,有时不必知道精确的核苷酸序列,而是知道这类特征模式。在优选的实施方式中,这类特征模式是在根据本发明的方法的步骤中获得的,在所述步骤中分别分辨和分离修饰的核酸分子片段。也应该了解,对于鉴定或测定核酸分子的指纹,这类方法另外包含与根据本发明确定核苷酸序列的方法的相同步骤。
各个SEQ.ID.Nos.、本文使用的核酸分子的化学性质、其实际序列和内部参考数字在下表中总结。
Figure BPA00001354994000541
Figure BPA00001354994000551
Figure BPA00001354994000561
Figure BPA00001354994000571
Figure BPA00001354994000581
Figure BPA00001354994000591
Figure BPA00001354994000601
Figure BPA00001354994000611
Figure BPA00001354994000621
通过附图、实施例和序列表——从其可获得进一步的特征、实施方式和优点,进一步阐明本发明,其中
图1 该图显示在连续的肼然后乙酸/苯胺处理RNA分子后得到的断裂产物显示:尿苷部分易于修饰,导致在尿苷位置处磷酸主链断裂产生附带5’-磷酸酯的3’片段和5’片段与苯胺源席夫碱(Schiff’base)(“修饰的尿苷”,缩写Umod),如Ehresmann等提出的(Ehresmann等人,1987)。
图2A-B A:示出可以从连续的肼然后乙酸/苯胺处理NOX-E36中间产物(SEQ ID 2)生成的所有可能的3’末端片段(SEQ ID 4-10)。箭头描述一般地可用标准MS/MS测序技术实现的序列信息(10-15个核碱基)。当片段变得较短时,测序整个片段的能力增加。B.当肼处理未被仔细控制时,母体分子的完全断裂发生。片段不能用于测序,因为它们之间的关系被破坏了。
图3A 该图示出完整核酸分子Spiegelmer NOX-E36中间产物(SEQ.ID.2)的总离子色谱图(Total Ion Chromatogram)(缩写TIC);
图3B 该图示出从图3A中4.3分钟处主峰的质谱得到的完整核酸分子Spiegelmer NOX-E36中间产物(SEQ.ID.2)的解卷积质量。该质量与SEQ.ID.2的质量一致。
图4 该图示出反相HPLC柱色谱法可辨别的Spiegelmer NOX-E36中间产物的清楚限定的片段;
图5 该图示出片段5(可观测的精确质量=7494.03Da)、6(可观测的平均分子量=9738.83Da)和完整核酸分子NOX-E36中间产物(SEQ.ID 2,可观测的平均分子量=12995.84Da)表示的单独峰的解卷积质谱;
图6 示出表示通过肼-苯胺/乙酸处理(实施例2)生成的核酸分子NOX-E36中间产物(SEQ.ID 2)的片段的表,其包括来自用于鉴定片段的TIC(图4和5)的序列、计算质量和观测质量;
图7 示出在核酸分子和选择的其片段固定的情况下,核酸分子的测序;其中核酸分子和选择的片段具有亲和标记或标签:核酸分子或者具有用于附加亲和标记或标签的选择性反应性官能团(I),或者在一般标记/带标签的核酸结构(II)中已经具有所述的这类亲和标记。标记的核酸分子II通过化学断裂进行限制的随机断裂以产生代表随机链分裂的片段加未断裂的全长物质的混合物;标记的片段然后被固定在固体支持物上,在该实施例中通过与相互作用配偶体的相互作用进行,并且洗掉未标记的片段。然后将标记的片段从该固体支持物上释放,并且通过LCMS或其他适当的技术进行分析。
图8 该图示出在核酸分子固定情况下测序核酸分子的实例的方案,其中核酸分子是核酸分子Spiegelmer NOX-E36中间产物(SEQ.ID.2),Spiegelmer NOX-E36(SEQ ID.1)的5’-氨基-修饰的衍生物;在用生物素亲和标签修饰NOX-E36中间产物(SEQ.ID.2)的5’-氨基部分后,以随机方式使用碱溶液化学断裂生物素化的NOX-E36中间产物(SEQ.ID.63),其中仔细控制断裂以便不使断裂完成;从发生的产生生物素化的NOX-E36中间产物(SEQ.ID.64)的5’-片段、3’-片段和随机内部片段的随机断裂,NOX-E36中间产物的所有生物素化的5’片段和剩余的生物素化的NOX-E36中间产物(SEQ.ID.63)(即全长产物[简称FLP])经由亲和标签(在该情况中为生物素)使用用于固定的标签-特异性的固体支持物(在该情况中为中性抗生物素蛋白珠)被选择性地从混合物中拉出;未结合的片段,即不具有亲和标签的3’-片段和随机内部片段,可被洗掉并且随后通过还原性断裂连接体内连接生物素部分和核酸的二硫键,将结合的5’片段从珠释放。这些片段对应于每个核糖核苷位置之间的链分裂。使用式“R”-NH-(CH2)6-OP(O)(OH)-已经包括该图中的5’片段,其中“R”是结构上控制(strucurally drawn)的可断裂生物素亲和标签或断裂的片段,黑体并加下划线的字母分别表示核酸序列,X表示从序列5’-到3’-阅读的特定核苷酸(A、C、G、U)的特征,y表示在该片段中超过第一片段多少额外的核苷酸,例如片段2:y=1(一个额外的核苷酸)。超过第一片段的额外的核苷酸(一个或多个)X是一个(C),因此该片段——片段2——是“R”-NH-(CH2)6-OP(O)(OH)-
Figure BPA00001354994000642
相似地,片段15:y=14,因此,超过第一片段的额外的核苷酸X是14
Figure BPA00001354994000643
因此片段15的特征是“R”-NH-(CH2)6-OP(O)(OH)-
Figure BPA00001354994000644
释放的5’片段的进一步表示见于图13中;
图9 该图示出用于生物素化反应的粗NOX-E36中间产物(SEQ.ID.2)的阴离子交换HPLC色谱图;
图10 该图示出60分钟反应时间后粗生物素化反应的阴离子交换HPLC色谱图;
图11 该图示出在生物素标记的NOX-E36中间产物(SEQ.ID.63)已经经历在实施例3中示出的方案的步骤3.3.2-3.3.5后,从LCMS实验获得的总离子色谱图(缩写TIC);
图12 该图示出在片段31(图13D,[SEQ.ID.41])的情况中,片段的解卷积分子量(质量峰值=10237.1897Da)的实例,其中其2’,3’-环磷酸酯已被水解的片段29(图13C,SEQ.ID.39)的低丰度的解卷积分子量(质量峰值=9603.77)也可被检测;
图13A-E 该图示出释放的酰化的NOX-E36中间产物SEQ ID 50(Seq.ID.11-50)的所有预期的5’片段。该表可用于与观测的质量值进行比较,进行已知分子的序列证实;
图14A+B 该图示出序列证实表,其列出从TIC获得的解卷积可观测的质量和观测到的这些质量的保留时间,其中在图13A-E中描述的每种期望片段的精确质量或分子量被包括并且片段被识别;
图15 该图示出图11的注释版本,其中示出鉴定的环磷酸酯片段的和释放的酰化的NOX-E36中间产物的峰。对于每一片段,相应的2’,3’-环磷酸酯在相应的2’(3’)磷酸酯衍生物中占主导,因此极大地简化了色谱图,使能够较容易进行鉴定和测序;
图16 示出序列测定/证实的流程图。该流程图可用于序列鉴定而无需现有的序列知识。
图17 该图示出在NOX-E36错配对照01(SEQ.ID.3)已经经历实施例3中示出的方案的步骤3.3.1-3.3.5后从LCMS获得的总离子色谱图(缩写TIC);
图18A-C 该图示出序列测定表:运用如图16中描绘的流程图至从图17的TIC获得的观测质量。与亲本序列相比,变换C/U对,突出NOX-E36。
图19A-C 该图示出在碱介导的限制随机断裂后FITC标记的NOX-E36中间产物的LCMS,其中标记在495nm具有选择性波长吸光度;在图19A中,示出在495nm处提取的UV色谱图;在图19B中,示出在260nm处提取的UV色谱图;在图19C中,示出总离子色谱图(缩写TIC);
图20A 该图示出图19B的放大;
图20B 该图示出图19A的放大;
图21A+B 该图示出下列的解卷积精确质量:A,片段1(SEQ.ID 51,图23A);和B,片段2(SEQ.ID 52,图23A),其分别在6.31分钟和7.13分钟可见;
图22A-C 该图示出分别在5.54(4106.55Da)、6.53(4451.60Da)、7.77(4780.64Da)分钟可见的未标记片段的解卷积精确质量;
图25A-C 该图示出图19A-C(16.6-18.5分钟)的缩放图,其图解FITC-标记的和无-FITC-标记的片段共洗脱。A:495nm处提取的波长色谱图,其表示FITC标记的核酸片段。B:260nm处提取的波长色谱图,其表示所有核酸片段(标记的和未标记的)。C:TIC,其示出样品材料中的所有离子。清楚地看出在通过25A测定的标记片段的标定区域中(参见虚线)有产生离子(图25C)的其它种类存在(图25B)。
图26 该图示出图25中虚线之间的区域的原始质谱。
图27 该图示出相应原始质谱(图26)的解卷积平均质量谱。箭头指向的峰是标记的片段(4666.21Da,片段13,图23,SEQ.ID.73)。其它质量的值比根据测序梯状物的增加累加预期的那些显著地高(7693.26、9335.48、9664.90Da),因此可被忽视。
图23A+B 该图示出FITC-标记的片段(SEQ.ID.51-55,66-100)的序列证实的示例性表(与图13的表相类似);
图24 该图示出FITC-标记的RNA分子的序列证实的示例性流程图(与图16的流程图相类似)。
图28A-C 示出序列测定表,其列出从TIC获得的解卷积精确质量或分子量以及观测到的这些质量的保留时间(从495nm精确波色谱图获得);使用如图24中描述的流程图,使用观测的质量来测定该序列。
图29 该图示出用于生物素化反应的粗NOX-A12中间产物(SEQ.ID.65)的阴离子交换HPLC色谱图。更小物(shortmers)的存在不影响进行步骤5.3.1-5.3.5的能力,和测序NOX-A12中间产物(SEQ.ID.65)的能力。
图30 该图示出60分钟反应和脱盐后生物素化反应的阴离子交换HPLC色谱图。
图31 该图示出在生物素标记的NOX-A12中间产物已经经历步骤5.3.2-5.3.5后来自LCMS的总离子色谱图(缩写TIC)。
图32 该图示出片段的解卷积分子量(质量峰值=10910.65Da)的实例,在该情况中为片段33(图33C和34A,[SEQ.ID.133])
图33A-C 该图示出序列测定表,其列出从TIC获得的解卷积精确质量或分子量以及观测到的这些质量的保留时间。使用如图16中描述的流程图,使用观测的质量来测定序列。包括绝对误差,其注释了与提出片段特征的期望质量相关的误差。
图34A+B 该图示出序列证实表NOXA12:列出的是释放的酰化的NOX-A12中间产物SEQ ID 145(Seq.ID.101-145)的所有期望的5’片段。该表可被用于与观测质量值比较,用于其序列已知的核酸分子的序列证实。
图35 该图示出图31的注释版本,其中鉴定的环磷酸酯片段和释放的酰化的NOX-A12中间产物(SEQ.ID.145)的峰被指定其相应的片段数。
参考附图,在实施例3、4和5中更详细描述的两个特别优选的实施方式在下面部分中描述。
如在本说明书和实施例3(Spiegelmer NOX-E36)和实施例5(NOX-A12)中更详细概述的,其中在下面,仅参考实施例3,提供通过质谱分析法测序核酸分子的方法,其中核酸和选择的片段用序列测定的方法固定。根据本发明,在第一步骤中,核酸分子被赋予修饰(图7,I),例如可用于固定该核酸分子和其片段的亲和标记或标签。第二步骤是通过化学断裂有限的随机断裂核酸分子以产生表示随机链分裂的片段(原理上如图7所示)加未断裂的全长物质的混合物。使用与固体支持物结合的亲和标记或标签作为把手,从该随机混合物,将含有标记的那些片段和未断裂的全长材料的分子从混合物中拉出,固体支持物可以是在柱中、碎片上或珠形式。不包含标记的其他片段被洗掉。在第三步骤中,通过断裂或洗脱从固相释放固定的片段,并且提供片段以通过LCMS、直接注入MS或MALDI和本文描述的其他MS方法进行分析。结果是表示代表核酸分子每个核苷酸的3’断裂的所有可能片段的质量梯状物。如果修饰被加至5’末端,那么所得到的质量梯状物将仅由5’片段组成,相似地,如果修饰被加到3’末端,那么所得到的质量梯状物将仅由3′片段组成。所述质量梯状物实际上被形成或源自一排5’或3’片段。
为了测试该方法,使用Spiegelmer NOX-E36中间产物(SEQ.ID.2)——具有40个核苷酸长度的RNA分子(根据实施例1合成)。NOX-E36中间产物(SEQ.ID.2)是NOX-E36(SEQ.ID.1)的5’-氨基-修饰的衍生物。在用生物素亲和标签修饰NOX-E36中间产物(SEQ.ID.2)的5’-氨基部分后,使用碱溶液以随机方式化学断裂生物素化的NOX-E36中间产物(SEQ.ID.63)(如图8中所示的反应方案)。仔细控制断裂以便不使断裂完全。由于随机断裂发生,所以产生生物素化的NOX-E36中间产物(SEQ.ID.63)的5’-片段、3’-片段和随机内部片段。所有生物素化的5’片段(图8,系列1)和剩余的生物素化的NOX-E36中间产物(SEQ.ID.63)经由亲和标签(在该情况中为生物素)使用用于固定的标签-特异性的固体支持物被选择性地从混合物中拉出。未结合的片段,即,不具有亲和标签的3’-片段和随机内部片段被洗掉。随后通过还原性断裂连接体内连接生物素部分和NOX-E36中间产物的二硫键,将结合的5’片段和全长分子从珠释放。这些释放的片段对应于每个核糖核苷位置之间的链分裂(参见图8和13)。链分裂首先导致形成含有2′,3′-环磷酸酯的片段,其中环磷酸酯缓慢水解为2′(3′)磷酸酯。然后,通过LC-(ESI)MS分析释放的片段,并且分析总离子色谱图(缩写TIC)。样品色谱图显示不连续的峰,其相应于产生的所有5’-片段和完整释放的酰化的NOX-E36中间产物(SEQ.ID.50),如图11中所示。然后通过解卷积得到的关于每个不连续峰的质谱获得不连续峰中包含的质量(一种或多种)。然后,可使用该质量信息来测定亲本核酸序列的序列,亲本核酸有时也称为亲本寡核苷酸。
一般而言,所见的质量是2’,3’-环磷酸酯的质量,尽管在一些情况中,含有水解的2’(3’)磷酸酯的低丰度片段也可被检测到,其用于进一步证实生成的片段的特征。一般地,使用所述的分析参数(实施例3),这些水解的片段比亲本2’,3’-环磷酸酯更晚洗脱。
在第一情况中,生成的片段的质量可以与释放的NOX-E36中间产物(SEQ.ID.50)的计算5’片段的期望质量进行比较以证实该序列。可选地,可获得序列而无需该序列的现有知识,这是因为生成的片段之间存在差异。在这种情况中,可容易预测核酸分子的第一片段,因为修饰(HS-(CH2)2C(O)-NH(CH2)6-OP(O)(OH)-)是已知的,因此对于该片段仅有可能的有限的不连续质量值(例如4,对于未修饰的D-或L-RNA的A,C,G,U)。之后,后来片段的增加的差异可用于测定核酸分子的序列,如图16和实施例3中的‘序列测定/证实的流程图’中证明的。在已经鉴定片段1后,计算的精确质量和分子量被用于鉴定下一个片段——片段2。下一个片段——片段2——的特征和因此的序列源于片段2和片段1的计算的精确质量或分子量之间的质量差。对于每个核苷A、C、G、U质量差是不同的(如图16中所示)。在已经鉴定片段2后,计算的精确质量和分子量被用于鉴定下一个片段——片段3。以与用于鉴定片段2相同的程序,片段3的特征源于片段3和片段2的计算的精确质量或分子量之间的质量差。使用该迭代过程鉴定所有的5’片段。使用先前片段的计算质量值的需要产生潜在的累积误差,累积误差可在仅使用观测值时发生。例如,0.3Da的误差仍然能够明确鉴定片段,然而,不通过使用鉴定片段的计算值重置该误差的话,进一步0.3Da误差可以累积,由于C和U核苷之间的1Da的小质量差,使得明确鉴定不可能。
对于最后核苷的识别,使用相同的方法,其中利用完整释放的酰化NOX-E36中间产物(Seq.ID.50)和包含最后环磷酸酯的片段的计算质量之间的质量差来证实最后核苷酸的特征。当释放的酰化NOX-E36中间产物不具有2’,3’环磷酸酯时,质量差不与先前计算的那些片段相同。质量差相应于最后核苷的质量。
作为证明本方法效力的测试,NOX-E36错配对照01(SEQ.ID.3)——其在序列上与NOX-E36中间产物(SEQ.ID.2)相同,除了变换的胞嘧啶和尿苷的两个实例——使用实施例3中描述的方案进行处理,并且使用图16示出的‘序列测定/证实的流程图’鉴定序列。胞嘧啶/尿苷变换检测是最有挑战性的,因此选择该变换。所述的方法能够容易鉴定亲本序列的两个突变(参见实施例3、图17和18)。
如在权利要求和实施例4中更详细地描述的,本文提供通过质谱分析法测序核酸分子的可选方法,其中核酸不被固定。根据本发明,在第一步骤中,核酸分子被赋予修饰,在该实施例中,修饰为具有选择性波长吸光度的标记,核碱基在该波长不吸收。下一步骤是通过化学断裂有限的随机断裂核酸分子以产生表示随机链分裂的片段和完整全长物质的混合物。随后,通过LC-MS分析粗反应混合物。在标记的选择性波长吸光度,没有可归于分子或其片段的核酸组分的UV吸光度。因此,在该波长,描述表示核酸分子的每个核苷酸的3’断裂的所有可能片段的质量梯状物被选择性地观测。通过确定这些5’片段的保留时间,并且推断和解卷积在这些5’片段保留时间的质谱,可能证实核酸分子的序列或测定该序列,而无需序列的现有知识。因为没有分离标记的片段,所以TIC由于未标记片段的存在而是复杂的;而较小片段在柱上被良好分辨,并且标记片段与未标记片段的完全分离是可能的,较大的标记片段与未标记片段——其也生成质量信号——共洗脱,并且可因此干扰需要的5’片段的鉴定。然而,由于标记的亲脂性(lypophilicity),某些质量值的标记片段通常比相似质量值的未标记片段更晚洗脱。因而,通过上述理由可能清除从共洗脱未标记的片段获得假的质量,并鉴定意图标记的片段。
为了证明该方法的可行性,将荧光素-5-异硫氰酸酯(FITC异构体I)标记附着于NOX-E36中间产物(SEQ.ID.2)以给出FITC-NOX-E36(SEQ.ID.100)。NOX-E36中间产物(SEQ.ID.2)是NOX-E36(SEQ.ID.1)的5’-氨基修饰的衍生物。然后,使标记的NOX-E36中间产物经历碱介导的有限随机断裂,并且通过LCMS分析样品。标记具有选择性波长吸光度,其最大是在大约495nm处,因此仅含有完整5’端的核酸分子将在该波长吸光度处观测到。将在495nm处提取的UV色谱图(图19A)与在260nm处——在260nm波长处检测到所有核酸——提取的相应UV色谱图(图19B)进行比较,可以明显的看到在后一UV色谱图上,非核酸分子5’片段的许多片段在样品中存在。通过比较图19B和图19C(图19A和19B的相应TIC)可看到具有或不具有标记的核酸分子的所有片段产生质量数据。如通过在495nm处提取的色谱图所测定的,核酸分子的第一5’片段可以容易鉴定为在6.31分钟洗脱(图19A和放大图20B,解卷积精确质量图21A)。通过比较图19A和图19B(并且使用放大图20A和20B更容易)也可清楚地看出存在多个比该峰更早洗脱的未标记片段。然而,根据其观测质量所估计的,这些表示8和14个核苷酸长度之间的片段(对于1个这类峰的实例,参见图22A)。因此,由于提供给标记片段的亲脂性,所以与标记片段共洗脱的任何未标记片段可以由于质量上与特定片段大小希望的显著差异(大约2000-6000Da)而被消除(参见图25-27、实施例4)。减低假质量的能力,或换句话说,在标记片段与未标记片段共洗脱的情况中确定标记片段的质量的能力,允许用该方法进行核酸分子的序列证实(图24)和序列测定(图28A-C)。
因此,以与实施例3类似的方式,可以生成类似的序列证实表或类似的流程图(参见图23和24),以进行序列证实或测定,而无需该序列的现有知识(图28),因为通过片段之间的不连续质量差测定序列的原理与实施例3中运用的原理类似。
实施例5类似于实施例3,除了代替包含40个核苷酸的Spiegelmer NOX-E36,描述包含45个核苷酸的Spiegelmer NOX-A12的测序。
实施例1:Spiegelmers的合成和衍生化
1.1 小规模合成
使用ABI 394合成仪(Applied Biosystems,Foster City,CA,USA),用2’TBDMS RNA亚磷酰胺化学品(Damha and Ogilvie,1993)通过固相合成生产Spiegelmers。L-构型的rA(N-Bz)-、rC(Ac)-、rG(N-ibu)-和rU-亚磷酰胺购自ChemGenes,Wilmington,MA。Spiegelmers通过凝胶电泳纯化。
1.2 大规模合成加修饰
使用
Figure BPA00001354994000701
合成仪(Amersham Biosciences;General Electric Healthcare,Freiburg),用2’TBDMS RNA亚磷酰胺化学品(Damha & Ogilvie,1993)通过固相合成,生产Spiegelmers。L-rA(N-Bz)-、L-rC(Ac)-、L-rG(N-ibu)-和L-rU-亚磷酰胺购自ChemGenes(Wilmington,MA,USA)。5’-氨基-修饰剂购自AmericanInternational Chemicals Inc.(Framingham,MA,USA)。Spiegelmers的合成开始于L-riboG;L-riboC、L-riboA、L-riboU分别修饰的CPG孔径
Figure BPA00001354994000702
(Link Technology,Glasgow,UK)。为了结合(每循环15分钟),乙腈中的0.3M苄硫基四唑(AmericanInternational Chemicals Inc.,Framingham,MA,USA)和乙腈中的3.5当量的各自0.2M亚磷酰胺溶液被使用。使用氧化-帽化循环(oxidation-capping cycle)。用于寡核苷酸合成的其它标准溶剂和试剂购自Biosolve(Valkenswaard,NL)。Spiegelmers被合成DMT-ON;脱保护后,经过制备RP-HPLC(反相高效液相色谱)(Wincott等人,1995),使用Source15RPC介质(Amersham,Freiburg,Germany),对其纯化。5’DMT-基团用80%乙酸除去(室温下90分钟)。随后,加入2M NaOAc水溶液,并通过正切流动过滤,使用5K再生纤维素膜(Millipore,Bedford,MA)对Spiegelmer脱盐。
实施例2:在核酸分子未固定的情况下,使用核碱基特异性断裂反应测序核酸分子
2.1 方法的原理
在未固定核酸分子的情况下,测序核酸分子,进行下列步骤:
1)对核酸分子进行碱基选择性处理以修饰具体选择的核碱基(即A、C、G、T或U),然后进行第二步骤,其中核酸磷酸酯主链被选择性地化学断裂3’未修饰的核碱基。其中,必须形成这样的条件,其中不使断裂反应完全,以便仍然有包含未修饰核碱基(其不是修饰和/或化学断裂的点)的核酸分子片段存在。
2)分析通过LCMS和LC/MS/MS生成的核酸分子片段。
断裂的结果是表示修饰的核碱基的每种存在的3’断裂的核酸分子片段组。通过鉴定生成的期望片段(例如核酸分子的3’-或5’片段)组,可能对这些片段进行串联质谱分析法实验,并且依靠这些片段的重叠性质和它们与完整核酸分子(即全长分子)的关联,可能证实核酸分子的序列。其中,必须控制化学断裂的程度,以便保存该关联,并且必须鉴定特定的片段组,优选具有完整5’或3’端的——可对其进行MS/MS实验。
2.2 测序Spiegelmer NOX-E36
为了证实描述的方法,使用RNA-分子NOX-E36中间产物(SEQ.ID.2)。NOX-E36中间产物是Spiegelmer,其中NOX-E36中间产物是Spiegelmer NOX-E36(SEQ.ID.1)的5’-氨基-修饰的衍生物。选择尿苷核碱基进行选择性修饰。通过使用两步肼-乙酸/苯胺处理实现该修饰,所述处理导致在尿苷部分后化学断裂RNA分子提供RNA分子片段。一般而言,肼-乙酸/苯胺处理后的反应产物是5’-磷酸酯附加RNA分子的3’-片段和带有修饰的核糖部分的RNA分子的苯胺修饰的核糖5’片段[简称Umod以突出核碱基断裂位点],如图1和2B中所示。这类结构已被Ehresmann等提出(Ehresmann等人,1987)(参见图1)。使Spiegelmer NOX-E36中间产物(SEQ.ID.2)经历肼-乙酸/苯胺处理,并且断裂产物分析显示,令人吃惊地是,3’-片段和完整核酸分子(图2A)比5’-和内部片段更有效地被离子化,因此极大地简化了生成数据的解释并且鉴定感兴趣的片段(图4-6)。结果,代表在尿苷核苷酸的每次发生后的断裂物的含有5’-磷酸酯的重叠3’-片段和完整起始分子NOX-E36中间产物(SEQ.ID.2)可通过对得到的关于每个峰的质量数据解卷积(例如,参见图5)被容易地鉴定(图6)。解卷积是本领域普通技术人员公知的常用技术,其中对质谱运用算法以鉴定单种类的多个带电离子,并且将它们重新组成该种类的质量。该技术与ESI和观测作为多个带电离子分布的大分子的其它电离技术组合是高度有价值的。取决于运用的算法,获得同位素分辨的质量(以获得精确质量)或分子量。对于寡核苷酸,一般地,以5ppm校准的质谱仪能产生上至大约6-10kDa的分辨的同位素谱,这取决于电离效率。在该质量之上,一般地,使用算法例如Maxent算法进行解卷积以得到该种类的分子量(平均分子量(分子质量))。
通过利用本领域普通技术人员熟知的MS/MS技术(参见说明书),最小片段的序列证实可以实现。然后,使用生成的数据作为参考,可对核酸分子的以下片段使用“重叠原理”,以便仅仅需要附加序列信息——以下片段的未知部分——进行该片段的序列证实。用这样方法,可以使用该重叠原理来证实完整分子的序列,因为任何一个特定核碱基(RNA系列中位A、C、G、U)之间的缺口一般不超过10-15个核碱基(图2A)。此外,该重叠原理使核酸分子片段或完整的分子仅需要从其5’-极端测序(与从5’-和3’-极端两者相反),因此,使MS/MS分析更简单。为了使用该重叠原理,必须控制化学断裂的程度,以便片段的该重叠关联不被破坏。当使反应完全时(图2B),片段之间的关联不能被阐明,即片段的位置不能被证实,因此不能证实序列。因此,本文描述的方案表示Spiegelmer NOX-E36中间产物(SEQ.ID.2)的受控断裂。这些片段的MS/MS可以通过LC/MS/MS或通过经由标准液体色谱分离单独的3’片段,然后将它们直接注入质谱仪进行MS/MS实验完成。
2.3 方案
8μl(0.85OD/μl水)Spiegelmer NOX-E36中间产物(SEQ.ID.2),即具有5’氨基连接体的Spiegelmer NOX-E36(SEQ.ID.1)的衍生物,被置于500μl微量离心管中,并且在冰上冷却,随之加入24μl水合肼50-60%(22,581-9,Sigma Aldrich,Taufkirchen,Germany)。45分钟后,加入4μl 10M乙酸铵p.a.(Sigma Aldrich,Taufkirchen,Germany),简单地涡旋该溶液并加入冷乙醇(300μl)。再次涡旋该溶液,并且使其在-18℃的冰箱中冷却2小时,之后4℃下离心(12,000g)15分钟,并倒出上清液。用300μl冷乙醇通过涡旋洗涤沉淀,并离心(12,000g)5分钟。从溶液中移出上清并且在浓缩器5301(Eppendorf AG,Hamburg,Germany)中干燥沉淀,然后用170μl水、18μl苯胺(≥99.5%,242284 Sigma Aldrich,Taufkirchen,Germany)、11μl乙酸(≥99%A6283,Sigma Aldrich,Taufkirchen,Germany)的溶液在65℃下避光处理40分钟。然后,在浓缩器5301(Eppendorf AG,Hamburg,Germany)中干燥溶液,重新溶解在无菌水(70μl)中,并进行LCMS分析。LCMS分析:使用具有快速解析泵(Rapid Resolution Pump)和Acquity BEH C18柱(1.7μm,
Figure BPA00001354994000721
孔径,2.1×30mm,Waters,Eschenbronn,Germany)的6520Accurate Mass Q-TOF LCMS系统(Agilent Technologies,Waldbronn,Germany)分析从上述方案生成的片段的LCMS分析。梯度0-70%B,在7.7min内。缓冲液A:10mM三乙胺、100mM六氟异丙醇、10μM EDTA(NH4 +形式)、水中1%甲醇,缓冲液B:10mM三乙胺、100mM六氟异丙醇、10μM EDTA(NH4 +形式)、水中50%甲醇。柱温65℃,流速1.2ml/min。
2.4 结果
图3A示出完整核酸分子Spiegelmer NOX-E36中间产物(SEQ.ID.2)的总离子色谱图(缩写TIC),其显示一个主峰,具有12995.84Da的解卷积可观测质量(图3B)。如上方案(参见部分2.3)所述处理Spiegelmer NOX-E36中间产物(SEQ.ID.2),并使用LCMS分析,导致清楚限定的片段——其在通过反相-HPLC柱色谱与质谱分析法组合的第一实例中是可辨识的,如在TIC(图4)中证明的,并且随后通过单个峰的解卷积质量谱进行鉴定,如对片段5、6和完整核酸分子NOX-E36中间产物(SEQ.ID 2)(图5)所展示的。令人吃惊地,发现不管可能的(5’-、3’和内部片段)不同产物如何,观测到源自3’端的片段是主要产物,并且是可清楚区别的,尽管存在其它的片段,例如5’片段和内部片段。因此,所有期望的3’-片段,即由于尿苷部分的3’端的链分裂产生的那些,通过比较该质量值与从预测片段计算的质量值(图6)可容易被鉴定。因而,可能对3’片段进行串联MS/MS实验,如前所述,以获得如下序列证实:
本领域当前的质谱分析法机器例如ESI-MS机器一般地考虑使用确立的MS/MS技术对核酸分子每端的前10-15个核苷酸进行序列证实。因此,通过对最小的片段(片段1,SEQ.ID.4)进行MS/MS,该片段的序列可被容易地证实。接下来,片段2(SEQ.ID.5)的序列特征也可被证实。然而,对于片段2,仅仅必须获得3’片段的5’极端上的附加核苷酸的信息,因为它们在其3’极端上重叠(图2A)。片段3的序列可以以类似的方式证实。该迭代过程可用于证实完整SpiegelmerNOX-E36中间产物(SEQ.ID 2)的序列。
总之,使用诱导核碱基特异性链分裂的化学反应,可以表明以仔细控制的方式断裂核酸分子以便产生彼此具有清楚关联的片段,是可能的,其可用于遵循如上所述的“重叠原理”测序核酸分子。依靠如此令人吃惊的发现,可极大地促进进行此的能力:当通过LCMS分析粗混合物时,仅一组片段(3’片段)在TIC中占主导,而不管是否存在大量的5’和内部片段。
实施例3:在核酸分子固定情况下,测序核酸分子和选择的其片段
3.1 原理
为了在核酸分子固定的情况下,测序核酸分子和选择的其片段,进行下列步骤:用亲和标记或标签标记核酸分子(其中标记或标签尚未固定(affixed)),通过化学断裂有限随机断裂核酸分子以产生代表根据图7中示出的方案的随机链分裂的片段和未断裂的全长物质的混合物。从该随机混合物,使用与固体支持物结合的亲和标记作为把手,将含有标记的核酸分子的那些片段从混合物中拉出,固体支持物可以是在柱中、碎片上或珠形式,并洗掉其他片段。通过从固相断裂或洗脱核酸分子的期望片段进行的释放提供待被质谱分析的片段。该实施例证明使用LCMS作为质谱分析技术适合于测序核酸分子。获得的结果是表示代表核酸分子的所有可能片段的梯状物,更精确地是代表核酸分子的每个核苷酸的3’断裂的梯状物。该实施例中使用的分析方法能够首先通过液相色谱即LCMS的LC部分然后通过质谱分离这些片段。该二维方法促进单个片段的鉴定,其能够二维鉴定容易可分离的片段。
3.2 测序Spiegelmer NOX-E36
为了验证该方法,使用核酸分子Spiegelmer NOX-E36中间产物(SEQ.ID.2)。NOX-E36中间产物(SEQ.ID.2)是Spiegelmer NOX-E36(SEQ.ID.1)的5’-氨基修饰的衍生物。如在图8中所示,在用生物素亲和标签修饰NOX-E36中间产物(SEQ.ID.2)的5’-氨基部分后,使用碱溶液以随机方式化学断裂生物素化的NOX-E36中间产物(SEQ.ID.63)。仔细控制断裂以便不使断裂完全。从发生的产生NOX-E36中间产物(SEQ.ID.64)的5’-片段、3’-片段和随机内部片段的随机断裂,NOX-E36中间产物的所有生物素化的5’片段(图8,系列1)和剩余的生物素化的NOX-E36中间产物(即全长产物[简称FLP])经由亲和标签(在该情况中为生物素)使用用于固定的标签-特异性的固体支持物(在该情况中为中性抗生物素蛋白珠)被选择性地从混合物中拉出。未结合的片段,即不具有亲和标签的3’-片段和随机内部片段可被洗掉。随后,通过还原性断裂连接体内连接生物素部分和NOX-E36中间产物(SEQ.ID.2)的二硫键,将结合的Spiegelmer NOX-E36的5’片段和FLP(SEQ.ID.63)从珠释放。这些释放的片段对应于每个核糖核苷位置之间的链分裂(参见图8和13)。链分裂首先导致形成含有2′,3′-环磷酸酯的片段,其中环磷酸酯缓慢水解为2′(3′)磷酸酯。然后,通过LC-(ESI)MS分析释放的片段,并且分析总离子色谱图(缩写TIC)。样品色谱图显示不连续的峰,其相应于产生的所有5’-片段和完整释放的酰化的NOX-E36中间产物(SEQ.ID.50),如图11中所示。然后通过解卷积得到的关于每个不连续峰的质谱获得不连续峰中包含的质量(一种或多种)。
解卷积是本领域普通技术人员公知的常用技术,其中对质谱运用算法以识别单种类的多个带电离子,并且将它们重新组成该种类的质量。该技术与ESI和观测作为多个带电离子分布的大分子的其它电离技术组合是高度有用的。取决于运用的算法,获得单同位素分辨的质量(以获得精确质量)或分子量。对于寡核苷酸,一般地,以5ppm校准的质谱仪能产生上至大约6-10kDa的分辨的同位素谱。在该质量之上,一般地,使用算法例如Maxent算法,其解卷积得到该种类的分子量。
一般而言,所见的质量是2’,3’-环磷酸酯的质量,尽管在一些情况中,含有水解的2’(3’)磷酸酯的低丰度片段也可被检测到,其用于进一步证实生成的片段的特征。一般地,这些水解的片段比亲本2’,3’-环磷酸酯更晚洗脱。
在第一情况中,生成的片段的质量可以与释放的NOX-E36中间产物(SEQ.ID.50)的预测5’片段的计算质量进行比较以证实该序列(图13A-E)。可选地,可获得序列而无需该序列的现有知识,这是因为生成的片段之间存在差异。在这种情况中,可容易预测核酸分子的第一片段,并且可以使用随后片段的增加差异测定核酸分子的序列,如在‘序列测定/证实的流程图’(图16)中证明的。该流程图描述了一步步的过程,其中最小片段(指定为片段1)被首先识别。第一片段表示具有5’附着酰化氨基己基连接体和2’,3’-环磷酸酯的第一个5’核苷酸,如在图8(系列2,y=0)和图13A(SEQ.ID.11)描述的。因此,直接对第一片段计算所有可能的RNA变换(A、C、G或U)(图16)。鉴定该第一片段由下列知识促进:使用离子对反相HPLC(缩写IP RP-HPLC),片段1是最早洗脱的5’片段,如IP RP-HPLC技术领域普通技术人员已知的(Azarani等人,2001和该文引用的参考文献)。在已经鉴定片段1后,计算的精确质量和分子量被用于鉴定下一个片段——片段2。下一个片段——片段2——的特征和因此的序列源自于片段2和片段1的计算的精确质量或分子量之间的质量差。对于每个核苷A、C、G、U,质量差是不同的(图16)。在已经鉴定片段2后,计算的精确质量和分子量被用于识别下一个片段——片段3。以与用于识别片段2相同的过程,片段3的特征源自于片段3和片段2的计算的精确质量或分子量之间的质量差。使用该迭代过程鉴定所有的5’片段。使用先前片段的计算质量值的需要产生潜在的累积误差,在仅使用一个观测值的情况下,该累积误差可发生。例如,0.3Da的误差仍然能够明确鉴定片段,然而,不通过使用鉴定片段的计算值重置该误差的话,进一步0.3Da误差可以累积,由于C和U核苷之间的1Da的小质量差,使得明确鉴定不可能。
对于最后核苷的识别,使用相同的方法,其中使用完整释放的酰化NOX-E36中间产物(图8)和包含最后环磷酸酯的片段的计算质量之间的质量差(在长度40个核苷酸的寡核苷酸的情况中,X=39,系列2,图8)证实最后核苷酸的特征。当释放的酰化NOX-E36中间产物不具有2’,3’环磷酸酯时,质量差不与先前计算的那些片段相同。质量差相应于最后核苷的质量(图16)。
作为证明本方法效力的测试,NOX-E36错配对照01(SEQ.ID.3)——其在序列上与NOX-E36中间产物(SEQ.ID.2)相同,除了变换的胞嘧啶和尿苷的两个实例——使用该实施例中描述的方案进行处理,并且序列使用‘序列测定/证实的流程图’(图16)进行鉴定。胞嘧啶/尿苷变换对于检测是最有挑战性的,因此选择该变换。所述的方法能够容易鉴定对亲本序列的两个突变(参见图17的色谱图和18A-C的序列测定)。
3.3 方案
3.3.1 Spiegelmer NOX-E36中间产物的生物素化
将10mg(250ODs)粗Spiegelmer NOX-E36中间产物(SEQ.ID.2),即具有5’氨基连接体的Spiegelmer NOX-E36(SEQ.ID.1)衍生物,放置于反应管中,并溶解于260μl Theorell和Stenhagen’s通用缓冲液pH8.5(33mM柠檬酸钠、33nM磷酸钠、57mM硼酸钠,pH 8.5)中。向其中加入200μl N,N-二甲基甲酰胺(缩写DMF)。涡旋并旋转该溶液,随之加入在50μl DMF中预溶解的2.2mg二硫化生物素N-羟基-琥珀酰亚胺酯(Biotin disulfide N-hydroxy-succinimide ester)(SigmaB4531,Taufkirchen,Germany)。室温下温育该溶液60分钟,随之取等分试样并通过离子交换HPLC(Dionex DNA-Pac 200柱进行分析,缓冲液A:100mM Tris;在H2O中10%ACN;缓冲液B:1M NaCl、100mM Tris;25mM NaClO4;在H2O中10%ACN,梯度10-30%B,6分钟,然后30-70%B,35分钟,柱温80℃)进行分析,其确定反应完全。使用NAP25柱(Amersham Biosciences,Freibug,Germany)对反应混合物脱盐并冻干。
3.3.2 生物素标记的Spiegelmer NOX-E36中间产物的碱水解
室温下,向20μl生物素化Spiegelmer NOX-E36中间产物(SEQ.ID.2)(0.54OD/μl)中加入30μl无菌水和2.5μl 0.5M K2CO3。涡旋该溶液,然后在EppendorfThermomixer Comfort机(Eppendorf,Hamburg,Germany)上、在70℃、1350rpm下温育12.5分钟。随之,将其在液氮中冷冻,并使其解冻。然后,加入4μl 1MAcOH(大约pH 7)以猝灭反应,涡旋并旋转该溶液。
3.3.3 将生物素化片段与中性抗生物素蛋白珠结合
对中性抗生物素蛋白琼脂糖珠如下处理:将150μl的中性抗生物素蛋白珠浆(Pierce,Milwaukee,MI,USA)放入500μl反应管中。旋转珠,并小心移出上清。随之,加入300μl 1M Tris HCl pH 8.0(Ambion;Huntindon,UK)。涡旋、旋转该浆,并小心移出上清。然后用无菌H2O以相同方式洗涤珠2次,每次300μl。然后,将如上制备的猝灭的水解混合物加到珠,并在10℃下剧烈(1350rpm)混合所得到的浆2小时。然后使用旋转微量离心管(Ultrafree-MC GV,0,22μm,Millipore,Schwalbach,Germany)通过过滤分离该珠,并用2×300μl无菌H2O洗涤。
3.3.4 从中性抗生物素蛋白珠断裂生物素化片段
使用0.05M磷酸钠缓冲液(pH 8.5)——100μl加5μl 1M DTT溶液——断裂NOX-E36中间产物(SEQ.ID.2)的生物素标记片段的二硫键。在EppendorfThermomixer Comfort机上、25℃下将其剧烈混合2小时。使用旋转微量离心管(Ultrafree-MC GV,0,22μm,Millipore,Schwalbach,Germany)过滤该浆,并用另外50μl无菌水洗涤珠。进行UV测量以测定260nm下的光密度单位,并且通过LCMS分析0.25OD的光密度单位。
3.3.5 片段的LCMS分析
使用具有快速解析泵(Rapid Resolution Pump)和Acquity BEH C18柱(1.7μm,孔径,2.1×30mm,Waters,Eschenbronn,Germany)的6520Accurate Mass Q-TOF LCMS系统(Agilent Technologies,Waldbronn,Germany)分析从上述方案生成的NOX-E36中间产物(SEQ.ID.2)的5’片段的LCMS分析。梯度0-20%B,22分钟,20-30%B,40分钟。缓冲液A:10mM三乙胺、100mM六氟异丙醇、10μM EDTA(NH4 +形式)、水中1%甲醇,缓冲液B:10mM三乙胺、100mM六氟异丙醇、10μM EDTA(NH4 +形式)、水中50%甲醇。柱温65℃,流速0.2ml/min:对每个峰获得TIC的质谱,然后根据本领域普通技术人员已知的标准技术解卷积。
3.4 结果
用在实验部分中描述的可断裂生物素部分(图10)有效标记粗NOX-E36中间产物(SEQ.ID.2)(图9),如通过使用阴离子交换色谱较晚洗脱的峰(30.65min与原料的28.82min洗脱时间相比,图9)的外观测定的。从NOX-E36中间产物[SEQ.ID.2]的固相分析存在错误序列和其它杂质不影响进行步骤3.3.1-3.3.5的能力和测序核酸分子的能力。不纯化粗标记的混合物,节省了使用尺寸排阻纯化柱(NAP25,参见实验)的未成熟的脱盐步骤。然后,断裂该粗物质,固定、洗涤然后从固体支持物释放标记的片段,如所述(部分3.3.2-3.3.4)。然后,使用LCMS分析获得的反应混合物(部分3.3.5)。总离子色谱图(缩写TIC,图11)示出表示每个可能的5’片段(Seq.ID.11-50,图13A-E)的峰模式。对于在TIC中观测到的每个不连续峰,获得原始的质量数据和随后的相应解卷积质量。图12示出片段的解卷积分子量(质量峰值=10237.1897Da)的实例,在该情况中为片段31(图13D,[SEQ.ID.41])。其2’,3’-环磷酸酯已被水解的低丰度的片段29(图13C,SEQ.ID.39)的解卷积分子量(质量峰值=9603.77)也可被检测到。
通过比较获得/观测的质量与计算质量,如图13A-E中所述,确定NOX-E36的序列(图14)。
图15示出了通过将片段分配为图11的TIC中的峰,使用的二维(LC+MS)方法的效力。分配限于释放的酰化NOX-E36中间产物和相应的鉴定的环磷酸酯片段。对于每个片段,相应的2’,3’-环磷酸酯在相应的2’(3’)磷酸酯衍生物中占主导,因此极大地简化了色谱图,能够较容易地鉴定和测序。如可见的,随着保留时间增加,存在着明显的增加片段大小的趋势。通过在获得TIC工艺的实际质量之前进行片段大小的视觉估计,这种趋势有利于测序未知的分子。
为了测试该实施例中描述的测序方法的效力,NOX-E36错配对照01(SEQ.ID.3)——其与NOX-E36序列不同在两个特异的C/U变换——经历实验部分中对NOX-E36中间产物(SEQ.ID.2)描述的测序方案。与如上所述极其类似地进行步骤3.3.1-3.3.5,提供相应的总离子色谱图(图17)。如前所述,获得片段的质谱并解卷积,然而,此时,处理化合物当作未知的。通过遵循图16中描述的流程图,使用观测的质量明确测定序列并显示与亲本NOX-E36相比的该序列中的两个C/U变换(突出的,图18A-C),如在图18A-C中描绘的序列确定表中所示例的。包括绝对误差,其注释相对于提议的片段特征的期望质量的误差。
总之,通过运用如上所述的固定原理,容易确定NOX-E36中间产物(SEQ.ID.2)的序列,并且NOX-E36错配对照01(SEQ.ID.3)的序列容易测定,其误差适当地在明确测定的可接受界限内。
所示例4:在没有固定核酸分子的情况下,使用选择性波长吸光度标记测序核酸分子或其片段
4.1 原理
在核酸分子未固定的情况中,为了测序核酸分子,进行下列步骤:用具有选择性波长吸光度的标记——核碱基在该波长不吸收——标记核酸,通过化学断裂有限随机断裂核酸分子以产生表示随机链分裂的片段(与图7中描述的那些相似)和完整全长物质的混合物。通过LC-MS分析粗反应混合物。在标记的选择性波长吸光度,没有可归因于核酸分子或其片段的UV吸光度。因此,通过附着的标记的选择性波长吸光度,在该波长,描述表示核酸分子的每个核苷酸的3’断裂的所有可能片段的梯状物可被选择性地观测。通过确定这些5’片段的保留时间,并且推断和解卷积在这些5’片段保留时间的质谱,可能证实核酸分子的序列或测定该序列,而无需该序列的现有知识。因为没有分离标记的片段,所以未标记片段的存在使TIC复杂化:而较小片段在柱上被良好分辨,并且标记片段与未标记片段的完全分离(图19,A-C)是可能的,较大的标记片段与未标记片段——其也生成质量信号——共洗脱,并且可潜在地干扰期望的5’片段(图25-27)的鉴定。然而,由于标记的亲脂性,某些质量值的标记片段通常比相似质量值的未标记片段更晚洗脱(图21、22、26、27)。因而,通过由于理由可能清除共洗脱的某些质量并且鉴定意图的标记片段。
4.2 测序Spiegelmer NOX-E36
为了证明该方法的可行性,将荧光素-5-异硫氰酸酯(FITC异构体I)标记附着于NOX-E36中间产物(SEQ.ID.2)。然后,使标记的NOX-E36中间产物经历碱介导的有限随机断裂,并且通过LCMS分析样品。标记在495nm处具有选择性波长吸光度(由供应商提供的数据)。因此,在495nm处,仅含有完整5’端的核酸分子(核酸分子的5’片段和全长产物[简称ELP])被观测到。从图19A可见,色谱图看起来与从实施例3(图11)观测的非常相似。但是,将在495nm处提取的UV色谱图(图19A)与在260nm处提取的相应UV色谱图(图19B)进行比较,可以明显的看到存在不是核酸分子的5’片段的许多片段。在260nm处提取的UV色谱图与总离子色谱图(简称TIC)(图19C)的比较显示两个色谱图B和C非常相似。这表明具有或不具有标记的所有片段都产生质量数据。如通过在495nm处提取的色谱图所测定的,第一5’片段(在该实施例中表示FITC-NH-(CH2)6-OP(O)(OH)-Gcp,图23A,片段1,SEQ.ID.51)可以被容易鉴定为在6.31分钟洗脱(图19A和放大图20B)。通过比较图19A和图19B(并且使用放大图20A和20B更容易)也可清楚地看出,存在多个比该峰更早洗脱的未标记片段,然而,根据其观测质量所估计,这些表示8和14个核苷酸长度之间的片段。因此,由于提供给标记片段的亲脂性,所以与标记片段共洗脱的任何未标记片段可以由于质量上与特定片段大小希望的显著差异(大约2000-6000Da)而被消除(参见图25-27)。其图解在图25中描述,其中由于提取的495nm的波长,图25A表示FITC标记的核酸片段,由于提取的260nm的波长,图25B表示所有的核酸片段,如TIC表示的(图25C)。通过获得表示获得标记片段质谱的典型离子窗的两个虚线(图26)标志的范围内的离子的质谱,并解卷积该谱,可能观测到超过一个的峰。然而,峰的质量值变化很大,因此使仅一种——在这种情况中为4666.205Da的平均分子量解卷积值——可能为标记的片段。这种减低假质量的能力,或换句话说,在标记片段与未标记片段共洗脱的情况中确定标记片段的质量的能力,允许用该方法进行核酸分子的序列证实(图24)和序列测定(图28A-C)。因此,以与实施例3类似的方式,可以产生类似序列证实表或类似流程图(参见图23和图24),进行序列证实或测定,而无需序列的现有知识(参见图28A-C),因为通过片段之间的不连续质量差测定序列的原理与在实施例3中运用的相类似。
4.3 方案
4.6.1 Spiegelmer NOX-E36中间产物的荧光素-5-异硫氰酸酯标记
将848ODs的粗Spiegelmer NOX-E36中间产物(SEQ.ID.2),即具有5’氨基连接体的Spiegelmer NOX-E36(SEQ.ID.1)衍生物,放置于反应管中,并溶解于250μl H2O。向其中加入在250μl N,N-二甲基甲酰胺(缩写DMF)中预溶解的3mg荧光素-5-异硫氰酸酯(FITC异构体I)(Sigma,Taufkirchen,Germany)。涡旋并旋转该溶液,随之加入6mg碳酸氢钠(Merck,Darmstadt,Germany)。室温下温育该溶液6小时,随之使用NAP25柱(Amersham Biosciences,Freibug,Germany)通过尺寸排阻层析对反应混合物脱盐并冻干。将冻干物重新溶解在水中,并经由制备RP-HPLC(反相高效液相色谱)(Wincott等人,1995)使用Source15RPC介质(Amersham,Freiburg,Germany)纯化,并使用利用NAP25柱的尺寸排阻层析对其脱盐。
4.3.2 荧光素-5-异硫氰酸酯标记的Spiegelmer NOX-E36中间产物的有限随机碱水
室温下,向13.5μl(1OD)FITC标记的Spiegelmer NOX-E36中间产物(SEQ.ID.2)加入1.5μl 0.5M K2CO3。涡旋该溶液,然后在Eppendorf ThermomixerComfort机(Eppendorf,Hamburg,Germany)上、70℃、1350rpm下温育5分钟,随后,将其在液氮中冷冻并使其解冻。然后,加入2.5μl 1M AcOH(终pH≈7)以猝灭反应,涡旋、旋转该溶液,然后通过LCMS分析。
4.3.3 片段的LCMS分析
使用具有快速解析泵和Acquity BEH C18柱(1.7μm,
Figure BPA00001354994000791
孔径,2.1×30mm,Waters,Eschenbronn,Germany)的6520Accurate Mass Q-TOF LCMS系统(Agilent Technologies,Waldbronn,Germany)分析从上述方案生成的NOX-E36中间产物(SEQ.ID.2)的5’片段的LCMS分析。梯度0-20%B,22分钟,20-30%B,40分钟。缓冲液A:10mM三乙胺、100mM六氟异丙醇、10μM EDTA(NH4 +形式)、水中1%甲醇,缓冲液B:10mM三乙胺、100mM六氟异丙醇、10μMEDTA(NH4 +形式)、水中50%甲醇。柱温65℃,流速1.2ml/min:对从在495nm处提取的UV色谱图的每个峰获得TIC的质谱,然后解卷积。
4.4 结果
使NOX-E36中间产物(SEQ.ID.2)经历在步骤4.3.1-4.3.3中指出的测序方法,获得下列数据,如在图19A-C中描述的:
A)在495nm处提取的UV色谱图。
B)在260nm处提取的UV色谱图。
C)总离子色谱图(TIC)。
显示标记(5’-)片段在495nm处的位置/保留时间(图19,A),并且在6.31分钟处的第一5’片段的位置是明显可视的。在260nm处提取的相应UV色谱图(图19,B)示出所有片段:5’-(标记的)、3’-和内部片段。可见有许多比第一标记片段更早洗脱的片段存在。这些表示3’或内部片段。TIC(图19,C)显示在260nm UV色谱图中观测的所有片段在TIC中给出信号,或者换句话说,所有核酸片段给出质量数据。
如通过在495nm处提取的色谱图所测定的,第一5’片段可以容易被鉴定为在6.31分钟洗脱(图19A、图20B)。通过解卷积TIC(图21A)中的相应峰的质谱并比较其质量值与序列证实表(片段1,图23A)中的第一片段的期望质量值或通过遵循图24中描述的测序流程图(梯片段1,图28A),获得证实。在495nm处提取的色谱图中7.13分钟处观测的下一个5’片段以迭代方式处理来鉴定第二片段(图21B;片段2图23A和梯状物片段2图28A)。对所有其它5’-片段重复该方法,其中使用所述的流程图(图24)和成功测定序列的构建的序列测定表(图28A-C)测定序列。当序列已知时,也可使用序列证实表(如在图24中图解的)。如从图28A-C可见,与序列测定相关的误差优选在明确测定序列的范围内。如在该实施例先前讨论的,在共洗脱-未标记的片段的情况中——如在图25中描述的,这类未标记的片段具有比标记片段的质量值的期望范围显著高的质量值,这不管序列是否是已知的。如通过比较图21、22、26、27可见的,该质量差一般在3-6kDa范围内。总之,使用选择性修饰测序核酸分子,在该具体实施例中,具有选择性波长吸光度发热修饰已经通过经由其FITC衍生物(SEQ.ID.100)以再一次的方式测序NOX-E36中间产物(SEQ.ID.2)成功显示,其中实验适当在明确测定的可接受界限内。
实施例5:在核酸分子固定的情况下,测序核酸分子和选择的气片段NOX A12
5.1 原理
为了在核酸分子固定的情况下,测序核酸分子和选择的其片段,原理已经在先前的实施例3中描述。该附加的实施例使用不同的核酸序列,NOX-A12(SEQ.ID.64)的核酸序列。该附加的实施例也具有修改的洗涤步骤以确保完全除去由于寡核苷酸的聚集性质可与标记的片段共固定(参见步骤5.3.3)的未标记片段。为了实现这一点,在该实施例中,使用离液序列高的溶液,8M尿素。
5.2 测序Spiegelmer NOX-A12
为了测试该方法,使用核酸分子Spiegelmer NOX-A12中间产物(SEQ.ID.65)。NOX-A12中间产物(SEQ.ID.65)是Spiegelmer NOX-A12(SEQ.ID.64)的5’-氨基修饰的衍生物。如在图8中NOX-E36所示,在用生物素亲和标签修饰5’-氨基部分后,使用碱溶液以随机方式化学断裂生物素化的Spiegelmer。仔细控制断裂以便不使断裂完全。从发生的产生5’-片段、3’-片段和随机内部片段的随机断裂,NOX-A12中间产物的所有生物素化的5’片段和剩余的生物素化的NOX-A12中间产物(即全长产物[简称FLP])经由亲和标签(在该情况中为生物素)使用用于固定的标签-特异性的固体支持物(在该情况中为中性抗生物素蛋白珠)被选择性地从混合物中拉出。未结合的片段,即不具有亲和标签的3’-片段和随机内部片段可被洗掉。对于一些序列,特别是倾向于自聚集的那些序列,因为未标记的片段与固定的标记片段相结合,所以未标记的片段被共固定是可能的。为了确保除去它们,使用离液序列高的试剂洗涤结合的片段。随后,通过还原性断裂连接体内连接生物素部分和NOX-A12中间产物(SEQ.ID.65)的二硫键,将结合的Spiegelmer NOX-A12的5’片段和FLP从珠释放,以供应片段(101-145)。这些片段对应于每个核糖核苷位置之间的链分裂(参见图8的NOX-E36实例)。链分裂首先导致形成含有2′,3′-环磷酸酯的5’片段,其中环磷酸酯缓慢水解为2′(3′)磷酸酯。然后,通过LC-(ESI)MS分析释放的片段,并且分析总离子色谱图(缩写TIC)。所发现的是不连续的峰,其相应于产生的所有5’-片段和完整释放的酰化的NOX-A12中间产物(SEQ.ID.101-145)(参见图31的样品色谱图)。然后通过解卷积得到的关于每个不连续峰的质谱获得不连续峰中包含的质量(一种或多种)(例如参见图32)。解卷积是本领域普通技术人员公知的常用技术,其中对质谱运用算法以识别单种类的多个带电离子,并且将它们重新组成该种类的质量。该技术与ESI和观测作为多个带电离子分布的大分子的其它电离技术组合是高度有用的。取决于运用的算法,获得同位素分辨的质量(以获得精确质量)或分子量。对于寡核苷酸,一般地,以5ppm校准的质谱仪能产生上至大约6-10kDa的分辨的同位素谱。在该质量之上,一般地,使用算法例如Maxent算法,其解卷积得到该种类的分子量。
一般而言,所见的质量是2’,3’-环磷酸酯的质量,尽管在一些情况中,含有水解的2’(3’)磷酸酯的低丰度的片段也可被检测到,其用于进一步证实生成的片段的特征。一般地,这些水解的片段比亲本2’,3’-环磷酸酯更晚洗脱。
在第一情况中,生成的片段的质量可以与NOX-A12中间产物的预测5’片段的计算质量进行比较以证实该序列(图34A+B)(与NOC-E36的实例图13A-E相类似)。可选地,可获得该序列而无需序列的现有知识,这是因为生成的片段之间存在差异。在这种情况中,可容易预测核酸分子的第一片段,并且随后片段的增加差异可以被用于测定核酸分子的序列,如在‘序列测定/证实的流程图’(图16)中证明的。该流程图描述了一步步的过程,其中最小片段(指定为片段1)被首先识别。第一片段表示具有5’附着酰化氨基己基连接体和2’,3’-环磷酸酯的第一5’核苷酸,如在图34A描述的。因此,直接对第一片段计算所有可能的RNA变换(A、C、G或U)(图16)。鉴定该第一片段由下列知识促进:使用离子对反相HPLC(缩写IP RP-HPLC),片段1是最早洗脱的5’片段,如IP RP-HPLC技术领域普通技术人员已知的。在已经鉴定片段1后,计算的精确质量和分子量被用于识别下一个片段——片段2。下一个片段——片段2——的特征性和因此的序列源自于片段2和片段1的计算的精确质量或分子量之间的质量差。对于每个核苷A、C、G、U质量差是不同的(图16)。在已经鉴定片段2后,计算的精确质量和分子量被用于鉴定下一个片段——片段3。以与用于鉴定片段2相同的过程,片段3的特征源自于片段3和片段2的计算的精确质量或分子量之间的质量差。使用该迭代过程鉴定所有的5’片段。使用先前片段的计算质量值的需要产生潜在的累积误差,在仅使用一个观测值的情况下,该累积误差可发生。例如,0.3Da的误差仍然能够明确鉴定片段,然而,不通过使用鉴定片段的计算值重置该误差的话,进一步0.3Da误差可以累积,由于C和U核苷之间的1Da的小质量差,使得明确鉴定不可能。
对于最后核苷的鉴定,使用相同的方法,其中使用完整释放的酰化NOX-A12中间产物(SEQ.ID.145)和包含最后环磷酸酯的片段的计算质量之间的质量差证实最后核苷酸的特征。当释放的酰化NOX-E36中间产物不具有2’,3’环磷酸酯时,质量差不与先前计算的那些片段相同。质量差相应于最后核苷的质量(图16)。
NOX-A12是比NOX-E36更长的Spiegelmer,其被用作进一步检测以评估该测序技术。使用在该实施例中描述的方案处理NOX-A12。该序列使用‘序列测定/证实的流程图’(图16)进行鉴定,并将其结果汇编在该序列测定表(图33A-C)中。
5.3 方案
5.3.1 Spiegelmer NOX-A 12中间产物的生物素化
将10mg(250ODs)粗Spiegelmer NOX-A12中间产物(SEQ.ID.65),即具有5’氨基连接体的Spiegelmer NOX-A12(SEQ.ID.64)衍生物,放置于反应管中,并溶解于260μl Theorell和Stenhagen的通用缓冲液pH8.5(33mM柠檬酸钠、33nM磷酸钠、57mM硼酸钠,pH 8.5)中。向其中加入200μl N,N-二甲基甲酰胺(缩写DMF)。涡旋并旋转该溶液,随之加入在50μl DMF中预溶解的2.2mg二硫化生物素N-羟基-琥珀酰亚胺酯(Biotin disulfide N-hydroxy-succinimide ester)(SigmaB4531,Taufkirchen,Germany)。室温下温育该溶液60分钟,随之取等分试样并通过离子交换HPLC(Dionex DNA-Pac 200柱,缓冲液A:100mM Tris;在H2O中10%ACN;缓冲液B:1M NaCl、100mM Tris;25mM NaClO4;在H2O中10%ACN,梯度10-30%B,6分钟,然后30-70%B,35分钟,柱温80℃)进行分析,其确定反应完全。使用NAP25柱(Amersham Biosciences,Freibug,Germany)对反应混合物脱盐并冻干。
5.3.2 生物素标记的Spiegelmer NOX-E36中间产物的碱水解
室温下,向20μl生物素化Spiegelmer NOX-A12中间产物(SEQ.ID.65)(0.54OD/μl)中加入30μl无菌水和2.5μl 0.5M K2CO3。涡旋该溶液,然后在EppendorfThermomixer Comfort机(Eppendorf,Hamburg,Germany)上、70℃℃、1350rpm下温育20分钟。随之,将其在液氮中冷冻,并使其解冻。然后,加入4μl 1MAcOH(大约pH 7)以猝灭反应,涡旋并旋转该溶液。
5.3.3 将生物素化片段与中性抗生物素蛋白珠结合
将中性抗生物素蛋白琼脂糖珠如下处理:将150μl的中性抗生物素蛋白珠浆(Pierce,Milwaukee,MI,USA)放入500μl反应管中。旋转珠,并小心移出上清。随之,加入300μl 1M Tris HCl pH 8.0(Ambion;Huntindon,UK)。涡旋、旋转该浆,并小心移出上清。然后用无菌H2O以相同方式洗涤珠2次,每次300μl。然后,将如上制备的猝灭的水解混合物加到珠,并在10℃下剧烈(1350rpm)混合所得到的浆2小时。然后旋转珠,并移出上清。加入1×300μl 8M尿素,涡旋和旋转混合物。仔细移出上清,并用无菌水再洗涤珠4次。
5.3.4从中性抗生物素蛋白珠断裂生物素化片段
使用0.05M磷酸钠缓冲液(pH 8.5)——100μl加5μl 1M DTT溶液,断裂NOX-A12中间产物(SEQ.ID.65)的生物素标记片段的二硫键。在EppendorfThermomixer Comfort机上、25℃下将其剧烈混合2小时。使用旋转微量离心管(Ultrafree-MC GV,0,22μm,Millipore,Schwalbach,Germany)过滤该浆,并用另外50μl无菌水洗涤珠。进行UV测量以测定260nm下的光密度单位,并且LCMS分析0.25OD的光密度单位。
5.3.5 片段的LCMS分析
使用具有快速解析泵和Acquity BEH C18柱(1.7μm,
Figure BPA00001354994000831
孔径,2.1×30mm,Waters,Eschenbronn,Germany)的6520 Accurate Mass Q-TOF LCMS系统(Agilent Technologies,Waldbronn,Germany)分析从上述方案生成的NOX-A12中间产物(SEQ.ID.65)的5’片段的LCMS分析。梯度0-20%B,22分钟,20-30%B,40分钟。缓冲液A:10mM三乙胺、100mM六氟异丙醇、10μM EDTA(NH4 +形式)、水中1%甲醇,缓冲液B:10mM三乙胺、100mM六氟异丙醇、10μMEDTA(NH4 +形式)、水中50%甲醇。柱温65℃,流速0.2ml/min:对每个峰获得TIC的质谱,然后解卷积。
5.4 结果
用在实验部分中描述的可断裂生物素部分有效标记粗NOX-A12中间产物(SEQ.ID.65),如通过与原料(图29,28.21分钟)相比粗反应混合物中较晚洗脱的峰(图30,29.82分钟)的外观使用离子交换色谱测定的。从NOX-A12中间产物[SEQ.ID.65]的固相分析存在错误序列和其它杂质不影响进行标记和随后的步骤5.3.2-5.3.3的能力和测序核酸分子的能力。不纯化粗标记的混合物,节省了使用尺寸排阻纯化柱(NAP25,参见实验)的未成熟的脱盐步骤。然后,断裂该粗物质,固定、洗涤然后从固体支持物释放标记的片段,如所述(部分5.3.2-5.3.4)。然后,使用LCMS分析获得的反应混合物(部分5.3.5)。总离子色谱图(缩写TIC,图31)示出表示每个可能的5’片段(Seq.ID.101-145,图34)的峰模式。对于在TIC中观测到的每个不连续峰,获得原始的质量数据和随后的相应解卷积质量。图32示出片段的解卷积分子量(质量峰值=10910.65Da)的实例,在该情况中为片段33(图34A,[SEQ.ID.133])。通过遵循图16中描述的流程图,使用观测质量明确测定NOX-A12的序列(图33A-C)。图34A+B示出相应的序列证实表,和图35显示注释的TIC,其中峰在序列测定(图33A-C)表和序列证实(图34A+B)表中被分配相应的片段数字。
总之,通过运用如上所述的固定原理,容易测定NOX-A12中间产物(SEQ.ID.65)的序列,其误差适当地在明确测定的可接受界限内。
参考文献
本文引用的文件的完整目录资料如下,如果没有指示相反的化,其中所述参考文献的公开内容通过引用并入本文。
Alazard D,Filipowsky M,Raeside J,Clarke M,Majlessi M,Russell J,Weisburg W(2002)Sequencing of production-scale synthetic oligonucleotides by enriching forcoupling failures using matrix-assisted laser desorption/ionization time-of-flight massspectrometry.Anal Biochem 301(1):57-64
Anderson S(1981)Shotgun DNA sequencing using cloned DNase I-generatedfragments.Nucleic Acids Res 9(13):3015-3027
Azarani A,Hecker K.H(2001)RNA analysis by ion-pair reversed-phase highperformance liquid chromatography,Nucleic Acids Res.29(2):e7.
Baker TR,Keough T,Dobson RL,Riley TA,Hasselfield JA,Hesselberth PE(1993)Antisense DNA oligonucleotides.I:The use of ionspray tandem mass spectrometry forthe sequence verification of methylphosphonate oligodeoxyribonucleotides.RapidCommun Mass Spectrom 7(3):190-194
Beigelman L,McSwiggen JA,Draper KG,Gonzalez C,Jensen K,Karpeisky AM,Modak AS,Matulic-Adamic J,DiRenzo AB,Haeberli P,等人.(1995)Chemicalmodification of hammerhead ribozymes.Catalytic activity and nuclease resistance.JBiol Chem 270(43):25702-25708
Bentzley CM,Johnston MV,Larsen BS (1998)Base specificity of oligonucleotidedigestion by calf spleen phosphodiesterase with matrix-assisted laser desorptionionization analysis.Anal Biochem 258(1):31-37
Bentzley CM,Johnston MV,Larsen BS,Gutteridge S (1996)Oligonucleotide sequenceand composition determined by matrix-assisted laser desorption/ionization.Anal Chem68(13):2141-2146
Biemann K(1990)Sequencing of peptides by tandem mass spectrometry and high-energy collision-induced dissociation.Methods Enzymol 193:455-479
Bock LC,Griffin LC,Latham JA,Vermaas EH,Toole JJ (1992)Selection of single-stranded DNA molecules that bind and inhibit human thrombin.Nature 355(6360):564-566
Boschenok J,Sheil MM (1996)Electrospray tandem mass spectrometry of nucleotides.Rapid Commun Mass Spectrom 10(1):144-149
Branch AD,Benefeld BJ,Robertson HD (1989)RNA fingerprinting.MethodsEnzynology 180:130-154
Bronstein I,Fortin J,Stanley PE,Stewart GS,Kricka LJ (1994)Chemiluminescent andbioluminescent reporter gene assays.Anal Biochem 219(2):169-181
Browne KA(2002)Metal Ion-Catalyzed Nucleic Acid Alkylation and Fragmentation JAm Chem Soc 127(27):7950-7962
Burgin AB,Jr.,Gonzalez C,Matulic-Adamic J,Karpeisky AM,Usman N,McSwiggenJA,Beigelman L(1996)Chemically modified hammerhead ribozymes with improvedcatalytic rates.Biochemistry 35(45):14090-14097
Cannistraro VJ,Kennell D(1989)Purification and characterization of ribonuclease Mand mRNA degradation in Escherichia coli.Eur J Biochem 181(2):363-370
Carothers JM,Szostak JW(2006)In vitro Selection of Functional Oligonucleotides andthe Origins of Biochemical Activity.In The aptamer Handbook,Klussmann S(ed),1,pp 3-28.Weinheim:WILEY-VCH Verlag GmbH & Co.KgaA
Cerny RL,Tomer KB,Gross ML,Grotjahn L Fast Atom Bombardment Combined withTandem Mass Spectrometry for Determining Structures of Small Oligonucleotides(1987)Analytical Biochemistry 165,pp 175-182
Cload ST,McCauley TG,Keefe AD,Healy JM,Wilson C(2006)Properties ofTherapeutic Aptamers.In The Aptamer Handbook,Klussmann S(ed),17,pp 363-416.Weinheim:WILEY-VCH Verlag GmbH & Co.KGaA
Couzin J(2004)Molecular biology.RNAi shows cracks in its armor.Science 306(5699):1124-1125
Crooke ST(2004)Progress in antisense technology.Annu Rev Med 55:61-95Damha MJ,Ogilvie KK(1993)Oligoribonucleotide synthesis.The silyl-phosphoramidite method.Methods Mol Biol20:81-114
Dolinnaya NG,Sokolova NI,Ashirbekova DT,Shabarova ZA(1991)The use of BrCNfor assembling modified DNA duplexes and DNA-RNA hybrids;comparison withwater-soluble carbodiimide.Nucleic Acids Res 19(11):3067-3072
Donis-Keller H,Maxam AM,Gilbert W (1977)Mapping adenines,guanines,andpyrimidines in RNA.Nucleic Acids Res 4(8):2527-2538
Durand M,Chevrie K,Chassignol M,Thuong NT,Maurizot JC (1990)Circulardichroism studies of an oligodeoxyribonucleotide containing a hairpin loop made of ahexaethylene glycol chain:conformation and stability.Nucleic Acids Res 18(21):6353-6359
Ehresmann C,Baudin F,Mougel M,Romby P,Ebel JP,Ehresmann B (1987)Probingthe structure of RNAs in solution.Nucleic Acids Res 15(22):9109-9128
Ellington AD,Szostak JW(1990)In vitro selection of RNA molecules that bind specificligands.Nature 346(6287):818-822
Elov AA,Volkov EM,Reintamm TG,Oretskaia TS,Shabarova ZA (1989)[RNAsynthesis using T7 phage RNA polymerase:transcription of synthetic DNA templates insolution and on polymer support].Bioorg Khim 15(2):159-165
Eulberg D,Jarosch F,Vonhoff S,Klussmann S (2006)Spiegelmers for TherapeuticApplications -Use of Chiral Principles in Evolutionary Selection Techniques.In TheAptamer Handbook,Klussmann S(ed),18,pp 417-442.Weinheim:WILEY-VCHVerlag GmbH & Co.KGaA
Farand J,Beverly M(2008)Sequence Confirmation of Modified OligonucleotidesUsing Chemical Degradation,Electrospray Ionization,Time-of-Flight,and TandemMass Spectrometry.Anal Chem
Faulstich K,Worner K,Brill H,Engels JW(1997)A sequencing method for RNAoligonucleotides based on mass spectrometry.Anal Chem 69(21):4349-4353
Fenn JB,Mann M,Meng CK,Wong SF,Whitehouse CM (1989)Electrosprayionization for mass spectrometry of large biomolecules.Science 246(4926):64-71
Freier SM,Altmann KH(1997)The ups and downs of nucleic acid duplex stability:structure-stability studies on chemically-modified DNA:RNA duplexes.Nucleic AcidsRes 25(22):4429-4443
Fu DJ,Tang K,Braun A,Reuter D,Darnhofer-Demar B,Little DP,O′Donnell MJ,Cantor CR,Koster H(1998)Sequencing exons 5 to 8 of the p53 gene by MALDI-TOFmass spectrometry.Nat Biotechnol 16(4):381-384
Glover RP,Sweetman GM,Farmer PB,Roberts GC(1995)Sequencing ofoligonucleotides using high performance liquid chromatography and electrospray massspectrometry.Rapid Commun Mass Spectrom 9(10):897-901
Gupta RC,Randerath E,Randerath K(1976)A double-labeling procedure for sequenceanalysis of picomole amounts of nonradioactive RNA fragments.Nucleic Acids Res3(11):2895-2914
Gupta RC,Randerath K(1977)Use of specific endonuclease cleavage in RNAsequencing.Nucleic Acids Res 4(6):1957-1978
Gut IG,Beck S(1995)A procedure for selective DNA alkylation and detection by massspectrometry.Nucleic Acids Res 23(8):1367-1373
Hannon GJ(2002)RNA interference.Nature 418(6894):244-251
Harksen A,Ueland PM,Refsum H,Meyer K(1999)Four common mutations of thecystathionine beta-synthase gene detected by multiplex PCR and matrix-assisted laserdesorption/ionization time-of-flight mass spectrometry.Clin Chem 45(8Pt 1):1157-1161
Hermanson GT(2008)Bioconjugate Techniques,2nd Edition,San Diego:AcademicPress.
Juhasz P,Roskey MT,Smirnov IP,Haff LA,Vestal ML,Martin SA(1996)Applications of delayed extraction matrix-assisted laser desorption ionization time-of-flight mass spectrometry to oligonucleotide analysis.Anal Chem 68(6):941-946
Juliano R,Alam MR,Dixit V,Kang H (2008)Mechanisms and strategies for effectivedelivery of antisense and siRNA oligonucleotides.Nucleic Acids Res 36(12):4158-4171
Karas M,Hillenkamp F(1988)Laser desorption ionization of proteins with molecularmasses exceeding 10,000 daltons.Anal Chem 60(20):2299-2301
Kawase Y,Umeda Y,Kato I(1991)Analysis of nucleic acids by ion-spray massspectrometry.Nucleic Acids Symp Ser(25):127-128
Kinoshita Y,Nishigaki K,Husimi Y(1997)Fluorescence-,isotope-or biotin-labeling ofthe 5′-end of single-stranded DNA/RNA using T4 RNA ligase.Nucleic Acids Res25(18):3747-3748
Kirpekar F,Nordhoff E,Kristiansen K,Roepstorff P,Lezius A,Hahner S,Karas M,Hillenkamp F(1994)Matrix assisted laser desorption/ionization mass spectrometry ofenzymatically synthesized RNA up to 150kDa.Nucleic Acids Res 22(19):3866-3870Kirpekar F,Nordhoff E,Larsen LK,Kristiansen K,Roepstorff P,Hillenkamp F(1998)DNA sequence analysis by MALDI mass spectrometry.Nucleic Acids Res 26(11):2554-2559
Klussmann S,Nolte A,Bald R,Erdmann VA,Furste JP(1996)Mirror-image RNA thatbinds D-adenosine.Nat Biotechnol 14(9):1112-1115
Kolb HC,Finn MG,Sharpless KB(2001).Click Chemistry:Diverse Chemical Functionfrom a Few Good Reactions″.Angewandte Chemie International Edition 40(11):2004-2021
Komiyama M,Yoshinari K(1997)Kinetic Analysis of Diamine-Catalyzed RNAHydrolysis.J Org Chem 62(7):2155-2160
Koster H,Tang K,Fu DJ,Braun A,van den Boom D,Smith CL,Cotter RJ,Cantor CR(1996)A strategy for rapid and efficient DNA sequencing by mass spectrometry.NatBiotechnol 14(9):1123-1128
Lewis FD,Liu X,Wu Y,Miller SE,Wasielewski MR,Letsinger RL,Sanishvili R,Joachimiak A,Tereshko V,Egli M (1999)Structure and Photoinduced ElectronTransfer in Exceptionally Stable Synthetic DNA Hairpins with Stilbenediether Linkers.JAmChemSoc 121(41):9905-9906
Limbach PA(1996)Indirect Mass Spectrometric Methods for Characterizing andSequencing Oligonucleotides.Mass Spectrometry Reviews 15:297-336
Limbach PA,Crain PF,McCloskey JA(1995)Characterization of oligonucleotides andnucleic acids by mass spectrometry.Curr Opin Biotechnol 6(1):96-102
Little DP,Thannhauser TW,McLafferty FW (1995)Verification of 50-to 100-merDNA and RNA sequences with high-resolution mass spectrometry.Proc Natl Acad SciUSA 92(6):2318-2322
Lockard RE,Alzner-Deweerd B,Heckman JE,MacGee J,Tabor MW,RajBhandary UL(1978)Sequence analysis of 5′[32P]labeled mRNA and tRNA using polyacrylamide gelelectrophoresis.Nucleic Acids Res 5(1):37-56
Ma MY,Reid LS,Climie SC,Lin WC,Kuperman R,Sumner-Smith M,Barnett RW(1993)Design and synthesis of RNA miniduplexes via a synthetic linker approach.Biochemistry 32(7):1751-1758
Mann MJ,Dzau VJ (2000)Therapeutic applications of transcription factor decoyoligonucleotides.J Clin Invest 106(9):1071-1075
Marzilli LA,Barry JP,Sells T,Law SJ,Vouros P,Harsch A(1999)Oligonucleotidesequencing using guanine-specific methylation and electrospray ionization ion trap massspectrometry.J Mass Spectrom 34(4):276-280
Maxam AM,Gilbert W (1977)A new method for sequencing DNA.Proc Natl Acad SciUSA 74(2):560-564
Meister G,Tuschl T(2004)Mechanisms of gene silencing by double-stranded RNA.Nature 431(7006):343-349
Monforte JA,Becker CH (1997)High-throughput DNA analysis by time-of-flight massspectrometry.Nat Med 3(3):360-362
Morishita R,Gibbons GH,Horiuchi M,Ellison KE,Nakama M,Zhang L,Kaneda Y,Ogihara T,Dzau VJ(1995)A gene therapy strategy using a transcription factor decoy ofthe E2F binding site inhibits smooth muscle proliferation in vivo.Proc Natl Acad Sci USA 92(13):5855-5859
Mouradian S,Rank DR,Smith LM (1996)Analyzing sequencing reactions frombacteriophage M13 by matrix-assisted laser desorption/ionization mass spectrometry.Rapid Commun Mass Spectrom 10(12):1475-1478
Ni J,Pomerantz C,Rozenski J,Zhang Y,McCloskey JA(1996)Interpretation ofoligonucleotide mass spectra for determination of sequence using electrosprayionization and tandem mass spectrometry.Anal Chem 68(13):1989-1999
W.M.A.Niessen WMA The encyclopedia of Mass Spectrometry (2002),Volume 8,Elsevier,Amsterdam
Nimjee SM,Rusconi CP,Sullenger BA(2006)Aptamers to Proteins.In The AptamerHandbook,Klussmann S(ed),1,pp 131-166.Weinheim:WILEY-VCH Verlag GmbH& Co.KGaA
Nolte A,Klussmann S,Bald R,Erdmann VA,Furste JP(1996)Mirror-design of L-oligonucleotide ligands binding to L-arginine.Nat Biotechnol 14(9):1116-1119
Nordhoff E,Cramer R,Karas M,Hillenkamp F,Kirpekar F,Kristiansen K,Roepstorff P(1993)Ion stability of nucleic acids in infrared matrix-assisted laserdesorption/ionization mass spectrometry.Nucleic Acids Res 21(15):3347-3357
Nordhoff E,Kirpekar F,Roepstorff P(1996)Mass spectrometry of nucleic acids.MassSpectrometry Reviews 15:67-138
Owens DR,Bothner B,Phung Q,Harris K,Siuzdak G(1998)Aspects ofoligonucleotide and peptide sequencing with MALDI and electrospray massspectrometry.Bioorg Med Chem 6(9):1547-1554
Peattie DA(1979)Direct chemical method for sequencing RNA.Proc Natl Acad Sci USA 76(4):1760-1764
Pieken WA,Olsen DB,Benseler F,Aurup H,Eckstein F (1991)Kinetic characterizationof ribonuclease-resistant 2′-modified hammerhead ribozymes.Science 253(5017):314-317
Pieles U,Zurcher W,Schar M,Moser HE(1993)Matrix-assisted laser desorptionionization time-of-flight mass spectrometry:a powerful tool for the mass and sequenceanalysis of natural and modified oligonucleotides.Nucleic Acids Res 21(14):3191-3196
Pils W,Micura R(2000)Flexible non-nucleotide linkers as loop replacements in shortdouble helical RNAs.Nucleic Acids Res 28(9):1859-1863
Proudnikov D,Mirzabekov A(1996)Chemical methods of DNA and RNA fluorescentlabeling.Nucleic Acids Res 24(22):4535-4542
Realini T,Ng EWM,Adamis AP(2006)Applications in the Clinic:The Anti-VEGFAptamer.In The Apatmer Handbook,Klussmann S(ed),pp 443-460.Weinheim:WILEY-VCH Verlag GmbH & Co.KGaA
Roskey MT,Juhasz P,Smirnov IP,Takach EJ,Martin SA,Haff LA(1996)DNAsequencing by delayed extraction-matrix-assisted laser desorption/ionization time offlight mass spectrometry.Proc Natl Acad Sci USA 93(10):4724-4729
Sambrook J,Russell,D.W.,(2001)Molecular Cloning A Laboratory Manual,the thirdedition,,Cold Spring Harbor,New York,:Cold Spring Harbor Laboratory Press.
Sanger F,Nicklen S,Coulson AR(1977)DNA sequencing with chain-terminatinginhibitors.Proc Natl Acad Sci USA 74(12):5463-5467
Santoro SW,Joyce GF(1997)A general purpose RNA-cleaving DNA enzyme.ProcNatl Acad Sci USA 94(9):4262-4266
Sargent TD(1988)Isolation of differentially expressed genes Methods Enzymol 152:423-432
Scherer LJ,Rossi JJ(2003)Approaches for the sequence-specific knockdown of mRNA.Nat Biotechnol 21(12):1457-1465
Schlosser K,Gu J,Lam JC,Li Y(2008a)In vitro selection of small RNA-cleavingdeoxyribozymes that cleave pyrimidine-pyrimidine junctions.Nucleic Acids Res 36(14):4768-4777
Schlosser K,Gu J,Sule L,Li Y(2008b)Sequence-function relationships provide newinsight into the cleavage site selectivity of the 8-17 RNA-cleaving deoxyribozyme.Nucleic Acids Res 36(5):1472-1481
Schlosser K,McManus SA,Y.L(2006)Deoxyribozymes:Catalytically Active DNAMolecules.In The Aptamer Handbook,Klussmann S(ed),pp 228-264.Weinheim:WILEY-VCH Verlag GmbH & Co.KGaA
Schuette JM,Pieles U,Maleknia SD,Srivatsa GS,Cole DL,Moser HE,Afeyan NB(1995)Sequence analysis of phosphorothioate oligonucleotides via matrix-assisted laserdesorption ionization time-of-flight mass spectrometry.J Pharm Biomed Anal 13(10):1195-1203
Schürch S,Bernal-Méndez E,Leumann C.J,(2002)Electrospray Tandem MassSpectrometry of Mixed-Sequence RNA/DNA Oligonucleotides,Journal of theAmerican Society for Mass Spectrometry,13(8):pp936-945
Shaler TA,Tan Y,Wickham JN,Wu KJ,Becker CH(1995)Analysis of enzymaticDNA sequencing reactions by matrix-assisted laser desorption/ionization time-of-flightmass spectrometry.Rapid Commun Mass Spectrom 9(10):942-947
Shapiro R,Danzig M(1972)Acidic hydrolysis of deoxycytidine and deoxyuridinederivatives.The general mechanism of deoxyribonucleoside hydrolysis.Biochemistry11(1):23-29
Smirnov IP,Roskey MT,Juhasz P,Takach EJ,Martin SA,Haff LA(1996)Sequencingoligonucleotides by exonuclease digestion and delayed extraction matrix-assisted laserdesorption ionization time-of-flight mass spectrometry.Anal Biochem 238(1):19-25
Smith MB and March J(2007)March’s Advanced Organic Chemistry:Reactions,Mechanisms and Structure 6th Edition.Wiley Interscience-John Wiley & Sons,Inc.Hoboken,New Jersey,USA.
Stanley J,Vassilenko S(1978)A different approach to RNA sequencing.Nature274(5666):87-89
Stemmler EA,Hettich RL,Hurst GB,Buchanan MV(1993)Matrix-assisted laserdesorption/ionization Fourier-transform mass spectrometry ofoligodeoxyribonucleotides.Rapid Commun Mass Spectrom 7(9):828-836
Talbo G,Mann M(1996)Aspects of the sequencing of carbohydrates andoligonucleotides by matrix-assisted laser desorption/ionization post-source decay.RapidCommun Mass Spectrom 10(1):100-103
Tanaka Y,Dyer TA,Brownlee GG(1980)An improved direct RNA sequence method;its application to Vicia faba 5.8S ribosomal RNA.Nucleic Acids Res 8(6):1259-1272
Taranenko NI,Allman SL,Golovlev VV,Taranenko NV,Isola NR,Chen CH (1998)Sequencing DNA using mass spectrometry for ladder detection.Nucleic Acids Res26(10):2488-2490
Taranenko NI,Chung CN,Zhu YF,Allman SL,Golovlev VV,Isola NR,Martin SA,Haff LA,Chen CH (1997)Matrix-assisted laser desorption/ionization for sequencingsingle-stranded and double-stranded DNA.Rapid Commun Mass Spectrom 11(4):386-392
Thomson JB,Tuschl T,Eckstein F(1993)Activity of hammerhead ribozymescontaining non-nucleotidic linkers.Nucleic Acids Res 21(24):5600-5603
Tolson DA,Nicholson NH(1998)Sequencing RNA by a combination of exonucleasedigestion and uridine specific chemical cleavage using MALDI-TOF.Nucleic Acids Res26(2):446-451
Tomita S,Tomita N,Yamada T,Zhang L,Kaneda Y,Morishita R,Ogihara T,Dzau VJ,Horiuchi M(1999)Transcription factor decoy to study the molecular mechanism ofnegative regulation of renin gene expression in the liver in vivo.Circ Res 84(9):1059-1066
Tuerk C,Gold L(1990)Systematic evolution of ligands by exponential enrichment:RNA ligands to bacteriophage T4 DNA polymerase.Science 249(4968):505-510
Usman N,Blatt LM(2000)Nuclease-resistant synthetic ribozymes:developing a newclass of therapeutics.J Clin Invest 106(10):1197-1202
Usman N,Cedergren R (1992)Exploiting the chemical synthesis of RNA.TrendsBiochem Sci 17(9):334-339
Waldmann R,Gross HJ,Krupp G(1987)Protocol for rapid chemical RNA sequencing.Nucleic Acids Res 15(17):7209
Weigand BS,Zerressen A,Schlatterer JC,Helm M,Jaeschke A(2006)CatalyticallyActive RNA Molecules:Tools in Organic Chemistry.In The Aptamer Handbook,Klussmann S(ed),9,pp 211-225.Weinheim:WILEY-VCH Verlag GmbH & Co.KGaA
Weiner GJ(2000)The immunobiology and clinical potential of immunostimulatoryCpG oligodeoxynucleotides.J Leukoc Biol 68(4):455-463
Wincott F,DiRenzo A,Shaffer C,Grimm S,Tracz D,Workman C,Sweedler D,Gonzalez C,Scaringe S,Usman N(1995)Synthesis,deprotection,analysis andpurification of RNA and ribozymes.Nucleic Acids Res 23(14):2677-2684
Wu H,Aboleneen H(2001)Improved oligonucleotide sequencing by alkalinephosphatase and exonuclease digestions with mass spectrometry.Anal Biochem 290(2):347-352
Wu H,Chan C,Aboleneen H(1998a)Sequencing regular and labeled oligonucleotidesusing enzymatic digestion and ionspray mass spectrometry.Anal Biochem 263(2):129-138
Wu H,Morgan RL,Aboleneen H(1998b)Characterization of labeled oligonucleotidesusing enzymatic digestion and tandem mass spectrometry.J Am Soc Mass Spectrom9(7):660-667
Wu J,McLuckey SA(2004)Gas-phase fragmentation of oligonucleotide ionsInternational Journal of Mass Spectrometry 237(2-3):197-241
Wu TP,Ruan KC,Liu WY(1996)A fluorescence-labeling method for sequencing smallRNA on polyacrylamide gel.Nucleic Acids Res 24(17):3472-3473
Yoshimura Y,Noguchi Y,Fujimoto K(2007)Highly sequence specific RNA terminallabeling by DNA photoligation.Organic & Biomolecular Chemistry 5:139-142
Zhang B,Farwell MA(2008)microRNAs:a new emerging class of players for diseasediagnostics and gene therapy.J Cell Mol Med 12(1):3-21
Zimmern D,Kaesberg P(1978)3′-terminal nucleotide sequence ofencephalomyocarditis virus RNA determined by reverse transcriptase and chain-terminating inhibitors.Proc Natl Acad Sci USA 75(9):4257-4261
说明书中公开的本发明的特征、权利要求和/或附图可单独地和以其任何组合地为以其各种形式实现本发明的材料。
Figure IPA00001354993500011
Figure IPA00001354993500021
Figure IPA00001354993500031
Figure IPA00001354993500041
Figure IPA00001354993500051
Figure IPA00001354993500061
Figure IPA00001354993500071
Figure IPA00001354993500091
Figure IPA00001354993500101
Figure IPA00001354993500121
Figure IPA00001354993500131
Figure IPA00001354993500141
Figure IPA00001354993500151
Figure IPA00001354993500161
Figure IPA00001354993500171
Figure IPA00001354993500181
Figure IPA00001354993500191
Figure IPA00001354993500201
Figure IPA00001354993500221
Figure IPA00001354993500231
Figure IPA00001354993500241

Claims (62)

1.测定核酸分子的核苷酸序列的方法,包括下列步骤:
a)提供具有至少一个修饰的所述核酸分子的多个分子,其中所述多个分子的单个核酸分子在待测定核苷酸序列的所述核酸分子的5’端或3’端具有至少一个修饰;
b)随机断裂多个修饰的核酸分子,因此提供
b1)所有可能的修饰的核酸分子片段的混合物,其包括含有待测定核苷酸序列的所述核酸分子的5’端或3’端核苷酸的最小修饰的核酸分子片段,
其中所述修饰的核酸分子片段彼此有一个核苷酸差异;
其中所述修饰的核酸分子片段的修饰存在于修饰的核酸分子片段的5’端或3’端,
b2)未修饰核酸分子片段;
c)分离所述修饰的核酸分子片段和所述未修饰核酸分子片段;
d)根据其长度、质量和/或电荷分离或分辨所述修饰的核酸分子片段,其中这种分离或分辨生成修饰的核酸片段的模式;和
e)任选地,展示所述修饰的核酸片段的模式,
f)从所述修饰的核酸片段的模式推断所述核酸分子的所述核苷酸序列,
其中所述核酸分子的核苷酸序列是已知或未知的,并且从所述修饰的核酸片段的模式推断所述核酸分子的所述核苷酸序列的步骤包括下列步骤:
fa)测定最小修饰的核酸分子片段——n+x,其中x=0——的质量和/或核苷酸序列;
fb)测定与所述最小修饰的核酸分子片段——n+x,其中x=0——的质量有一个核苷酸差异的所述修饰的核酸分子片段——n+x,其中x=1——的质量;
fc)测定所述修饰的核酸分子片段——n+x,其中x=1——的质量与所述最小修饰的核酸分子片段——n+x,其中x=0——的质量之间的质量差;
fd)将所述质量差归于不同的核苷酸种类,并通过将所述不同的核苷酸种类加至所述最小修饰的核酸分子片段——n+x,其中x=0——的序列生成所述修饰的核酸分子片段——n+x,其中x=1——的序列,
其中重复步骤fb)到fd),由此对于每一重复,x增加加数1,并且对于第一次重复x是2,并且其中在步骤fb)中,测定与修饰的核酸分子片段n+(x-1)的质量有1个核苷酸差异的修饰的核酸分子片段n+x的质量,在步骤fc)中,测定所述修饰的核酸分子片段n+x的质量和所述修饰的核酸分子片段n+(x-1)的质量之间的质量差,和在步骤fd)中,将所述质量差归于不同的核苷酸种类,并通过将所述不同的核苷酸种类加至所述修饰的核酸分子片段n+(x-1)的序列生成所述修饰的核酸分子片段n+x的序列;或者
其中所述核酸分子的核苷酸序列是已知的,并且从所述修饰的核酸片段的模式推断所述核酸分子的所述核苷酸序列的步骤包括下列步骤:
fa)测定与所述最小修饰的核酸分子片段——n+x,其中x=0——的质量有一个核苷酸差异的所述修饰的核酸分子片段——n+x,其中x=1——的质量;
fb)确定所述修饰的核酸分子片段——n+x,其中x=1——的质量与所述最小修饰的核酸分子片段——n+x,其中x=0——的质量之间的质量差;
fc))将所述质量差归于不同的核苷酸种类,并通过将所述不同的核苷酸种类加至所述最小修饰的核酸分子片段——n+x,其中x=0——的序列生成所述修饰的核酸分子片段——n+x,其中x=1——的序列,
其中重复步骤fa)到fc),由此对于每一重复,x增加加数1,并且对于第一次重复x是2,并且其中在步骤fa)中,测定与修饰的核酸分子片段n+(x-1)的质量有1个核苷酸差异的修饰的核酸分子片段n+x的质量,在步骤fb)中,测定所述修饰的核酸分子片段n+x的质量和所述修饰的核酸分子片段n+(x-1)的质量之间的质量差,和在步骤fc)中,将所述质量差归于不同的核苷酸种类,并通过将所述不同的核苷酸种类加至所述修饰的核酸分子片段n+(x-1)的序列生成所述修饰的核酸分子片段n+x的序列;
或者
其中所述核酸分子的核苷酸序列是已知的,并且从所述修饰的核酸片段的模式推断所述核酸分子的所述核苷酸序列的步骤包括下列步骤:
fa)测定与所述最小修饰的核酸分子片段——n+x,其中x=0——的质量有一个核苷酸差异的所述修饰的核酸分子片段——n+x,其中x=1——的质量;
fb)将所述修饰的核酸分子片段——n+x,其中x=1——的质量归于其核苷酸序列已知的核酸分子的核酸分子片段——n+x,其中x=1——的计算质量,并通过将不同的核苷酸种类加至最小修饰的核酸分子片段——n+x,其中x=0——的序列生成所述修饰的核酸分子片段——n+x,其中x=1——的序列,
其中重复步骤fa)到fb),由此对于每一重复,x增加加数1,并且对于第一次重复x是2,并且其中在步骤fa)中,测定与修饰的核酸分子片段n+(x-1)的质量有1个核苷酸差异的所述修饰的核酸分子片段n+x的质量,和在步骤fb)中,将所述修饰的核酸分子片段——n+x,其中x=1——的质量归于其核苷酸序列已知的核酸分子的核酸分子片段——n+x,其中x=1——的计算质量,并通过将所述不同的核苷酸种类加至所述修饰的核酸分子片段n+(x-1)的序列生成片段n+x的所述修饰的核酸分子序列。
2.根据权利要求1所述的方法,其中所述断裂通过化学断裂、酶切割、通过加热断裂和/或通过使用二价阳离子断裂进行。
3.根据权利要求1到2任一项所述的方法,其中所述断裂是化学断裂。
4.根据权利要求3所述的方法,其中所述化学断裂是核苷酸非特异性断裂。
5.根据权利要求1-4任一项所述的方法,其中所述混合物包括其核苷酸序列待被测定的修饰的全长形式的核酸分子。
6.根据权利要求1到5任一项所述的方法,其中通过所述修饰与相互作用配偶体相互作用分离所述修饰的核酸分子片段与所述未修饰的核酸分子片段,其中这类相互作用配偶体与支持物连接。
7.根据权利要求6所述的方法,其中所述支持物是固体支持物。
8.根据权利要求6至7任一项所述的方法,其中从与所述相互作用配偶体相互作用的所述修饰的核酸分子片段除去所述未修饰核酸分子片段。
9.根据权利要求8所述的方法,其中通过洗涤从与所述相互作用配偶体相互作用的所述修饰的核酸分子片段除去所述未修饰核酸分子片段。
10.根据权利要求6到9任一项所述的方法,其中所述修饰的核酸分子片段从所述支持物释放。
11.根据权利要求10所述的方法,其中,通过从所述相互作用配偶体释放所述修饰,通过从所述支持物释放所述相互作用配偶体或通过从所述核酸分子片段断裂所述修饰或其一部分或部分,所述修饰的核酸分子片段从所述支持物释放。
12.根据权利要求1到5任一项所述的方法,其中通过由于质量分别、大小分别和/或疏水性分别、电荷分别、离子分别、氢键合分别或液相调节提取的分离将所述修饰的核酸分子片段与所述未修饰核酸分子分离。
13.根据权利要求1到12任一项所述的方法,其中所述修饰的核酸片段的模式包括修饰的核酸片段的梯状物。
14.根据权利要求1到13任一项所述的方法,其中所述修饰的核酸片段的模式通过质谱分析法生成。
15.根据权利要求1到13任一项所述的方法,其中所述修饰的核酸片段的模式被生成,并且所述单个片段的质量通过质谱分析法测定。
16.根据权利要求1到15任一项所述的方法,其中所述修饰包括一个部分。
17.根据权利要求16所述的方法,其中所述部分被用于分离所述修饰的核酸分子片段和所述未修饰核酸分子。
18.根据权利要求17所述的方法,其中所述部分被用于在所述模式的生成中分离或分辨所述修饰的核酸分子片段。
19.根据权利要求1到15任一项所述的方法,其中所述修饰是包括至少第一部分和第二部分的多分修饰,其中任选地所述至少第一部分和所述第二部分通过连接体连接。
20.根据权利要求19所述的方法,其中所述第一部分被用于分离所述修饰的核酸分子片段和所述未修饰核酸分子,而所述第二部分被用于在所述模式的生成中分离或分辨所述修饰的核酸分子片段。
21.根据权利要求16到20任一项所述的方法,其中用于分离所述修饰的核酸分子片段和所述未修饰核酸分子的所述部分包括针对相互作用配偶体的配体,其中这类相互作用配偶体存在于支持物上,和所述配体和所述相互作用配偶体之间的相互作用介导所述修饰的核酸分子片段在所述支持物上的固定。
22.根据权利要求21所述的方法,其中这类相互作用配偶体连接到这类支持物。
23.根据权利要求21和22任一项所述的方法,其中所述固定选自化学固定、亲和固定、磁固定。
24.根据权利要求23所述的方法,其中所述固定是亲和固定。
25.根据权利要求24所述的方法,其中介导所述核酸分子和所述核酸分子片段在所述支持物上的固定的相互作用选自生物素-抗生物素蛋白相互作用、生物素-中性抗生物素蛋白相互作用、生物素-链亲和素相互作用、抗原-抗体相互作用、两个寡核苷酸的相互作用——其中核酸分子由DNA、RNA、LNA、PNA或其组合组成、钙调蛋白和钙调蛋白结合肽的相互作用、白蛋白和Cibracon蓝的相互作用、金属-螯合剂和金属-螯合支持物的相互作用。
26.根据权利要求16到25任一项所述的方法,其中用于分离所述修饰的核酸分子片段和所述未修饰核酸分子的所述部分选自生物素、寡核苷酸、钙调蛋白结合肽、白蛋白和金属-螯合剂。
27.根据权利要求1到26任一项所述的方法,其中通过下列方法,将所述修饰的核酸分子片段与所述未修饰核酸分子分离,所述方法选自:过滤、透析、层析、磁场、离心和沉淀。
28.根据权利要求27所述的方法,其中层析是大小排阻层析,其中根据其大小或由于通过修饰所赋予的修饰片段的增加的大小,将所述修饰的核酸片段与所述未修饰核酸分子分离。
29.根据权利要求16到28任一项所述的方法,其中被用于在所述模式的生成中分离或分辨所述修饰的核酸分子片段的所述部分选自质量标签或亲脂标签。
30.根据权利要求1到29任一项所述的方法,其中通过针对质量或大小分别的方法分离或分辨所述修饰的核酸分子片段。
31.根据权利要求30所述的方法,其中所述针对质量或大小分别的方法选自过滤、透析、层析和质谱分析法。
32.根据权利要求31所述的方法,其中所述针对质量或大小分别的方法是MS、LCMS或ESI MS。
33.根据权利要求1到32任一项所述的方法,其中通过基于疏水相互作用的方法分离或分辨所述修饰的核酸分子片段。
34.根据权利要求33所述的方法,其中所述基于疏水相互作用的方法是RP-HPLC。
35.根据权利要求19到34任一项所述的方法,其中所述连接体是疏水连接体。
36.根据权利要求19到35任一项所述的方法,其中所述连接体是可断裂连接体。
37.根据权利要求36所述的方法,其中所述连接体是可选择断裂的连接体,其中所述可选择断裂的连接体是可酶切割的、可化学断裂的、可光致断裂的或可热断裂的。
38.根据权利要求1到37任一项所述的方法,其中所述核酸分子选自RNA分子、DNA分子、核苷酸修饰的RNA分子和核苷酸修饰的DNA分子、包含脱氧核糖核苷酸和核糖核苷酸的核酸分子、PNA、LNA和其组合。
39.根据权利要求1到38任一项所述的方法,其中所述核酸分子选自适配体、Spiegelmers、核糖核酸酶、Spiegelzymes、反义分子、siRNA分子和诱铒分子。
40.根据权利要求39所述的方法,其中所述核酸分子选自Spiegelmers。
41.根据权利要求1到40任一项所述的方法,其中所述核酸分子是RNA分子和/或核苷酸修饰的RNA分子。
42.根据权利要求41所述的方法,其中所述断裂是所述RNA分子和/或所述核苷酸修饰的RNA分子的化学断裂,其通过碱水解、胺或聚胺进行。
43.根据权利要求41所述的方法,其中所述断裂是所述RNA分子和/或所述核苷酸修饰的RNA分子的酶切割,其通过使用核酸酶和/或核酸基酶进行。
44.根据权利要求41所述的方法,其中所述断裂是通过加热所述RNA分子和/或所述核苷酸修饰的RNA分子的断裂。
45.根据权利要求41所述的方法,其中所述断裂是通过使用二价阳离子的所述RNA分子和/或所述核苷酸修饰的RNA分子的断裂。
46.根据权利要求1到40任一项所述的方法,其中所述核酸分子是DNA分子和/或核苷酸修饰的DNA分子。
47.根据权利要求46所述的方法,其中所述断裂是所述DNA分子和/或所述核苷酸修饰的DNA分子的化学断裂,其通过使用酸水解进行。
48.根据权利要求46所述的方法,其中所述断裂是所述DNA分子和/或所述核苷酸修饰的DNA分子的酶切割,其通过使用核酸酶,和/或核酸基酶进行。
49.根据权利要求14到48任一项所述的方法,其中所述质谱分析法选自直接质谱分析法、LC-MS和MS/MS。
50.根据权利要求1到49任一项所述的方法,其中测定核酸分子的特定质量指纹。
51.根据权利要求50所述的方法,其中所述特定质量指纹用于核酸分子的鉴定和/或质量控制。
52.根据权利要求1到51任一项所述的方法,其中所述核酸分子或所述核酸分子的多个分子的所述至少一个修饰在步骤a)或b)之前被加到所述核酸分子的5’端或3’端。
53.根据权利要求1到52任一项所述的方法,其中所述核酸分子或所述核酸分子的多个分子包括非核酸部分。
54.根据权利要求53所述的方法,其中所述非核酸部分在步骤a)或b)之前从所述核酸分子或所述核酸分子的多个分子移出。
55.根据权利要求54所述的方法,其中在步骤a)或b)之前,在第一步骤中,所述非核酸部分从所述核酸分子或所述核酸分子的多个分子移出,而在第二步骤中,所述核酸分子或所述核酸分子的多个分子的修饰被加到所述核酸分子或所述核酸分子的多个分子的核苷酸序列的5’端、3’端或内部的核苷酸。
56.根据权利要求1到55任一项所述的方法,其中所述核酸分子包括多于25个核苷酸或核碱基。
57.根据权利要求1到56任一项所述的方法,其中所述核酸分子包括多于35个核苷酸或核碱基。
58.根据权利要求1到57任一项所述的方法,其中所述核酸分子包括26到50个核碱基或36到50个核碱基。
59.根据权利要求58所述的方法,其中所述核酸分子包括26到45个核碱基或36到45个核碱基。
60.根据权利要求1到59任一项所述的方法,其中所述多个核酸分子的所述核酸分子的的聚集被减少。
61.根据权利要求60所述的方法,其中通过加入离液序列高的溶液至步骤a)到e)的任一步骤,减少所述聚集。
62.根据权利要求61所述的方法,其中通过加入离液序列高的溶液至a)和b)的任一步骤,减少所述聚集。
CN200980143211.8A 2008-10-29 2009-10-29 通过质谱分析法测序核酸分子 Expired - Fee Related CN102203292B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP08018916.0 2008-10-29
EP08018916 2008-10-29
PCT/EP2009/007754 WO2010049156A1 (en) 2008-10-29 2009-10-29 Sequencing of nucleic acid molecules by mass spectrometry

Publications (2)

Publication Number Publication Date
CN102203292A CN102203292A (zh) 2011-09-28
CN102203292B true CN102203292B (zh) 2014-06-25

Family

ID=41396442

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200980143211.8A Expired - Fee Related CN102203292B (zh) 2008-10-29 2009-10-29 通过质谱分析法测序核酸分子

Country Status (6)

Country Link
US (1) US20110229976A1 (zh)
EP (1) EP2350313B1 (zh)
JP (1) JP5766610B2 (zh)
CN (1) CN102203292B (zh)
CA (1) CA2741959C (zh)
WO (1) WO2010049156A1 (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102818867B (zh) * 2012-08-17 2014-08-20 吉林敖东药业集团延吉股份有限公司 一种鉴别注射用核糖核酸ⅱ的方法
JP6339787B2 (ja) * 2013-10-09 2018-06-06 株式会社日立ハイテクノロジーズ 核酸の分析方法
JP2017505619A (ja) * 2014-02-03 2017-02-23 ノクソン ファーマ エージー ポリアルコキシル化核酸分子の調製のための方法
CN106467910A (zh) * 2015-08-18 2017-03-01 清华大学 L-dna/l-rna聚合酶及其应用
CN109828068B (zh) * 2017-11-23 2021-12-28 株式会社岛津制作所 质谱数据采集及分析方法
WO2019193526A1 (en) * 2018-04-05 2019-10-10 Tsinghua University Methods of sequencing and producing nucleic acid sequences
EP3802818A4 (en) * 2018-05-25 2022-03-02 New York Institute of Technology METHOD AND SYSTEM FOR USE IN DIRECT RNA SEQUENCING
JP2021525507A (ja) * 2018-05-25 2021-09-27 ニューヨーク インスティチュート オブ テクノロジーNew York Institute Of Technology 直接核酸配列決定方法
CN113325185B (zh) * 2021-07-09 2024-04-19 重庆鼎润医疗器械有限责任公司 多水平质控品及其制备方法和在血栓弹力图检测上的应用
CN114540471B (zh) * 2022-01-28 2024-05-14 赛纳生物科技(北京)有限公司 一种利用缺失核酸测序信息进行比对的方法和系统
CN116660439B (zh) * 2023-07-28 2023-10-20 常州合全药业有限公司 一种磷酰二胺吗啉代寡核苷酸序列的高分辨质谱检测方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6566059B1 (en) * 1998-10-01 2003-05-20 Variagenics, Inc. Method for analyzing polynucleotides
WO2004097369A2 (en) * 2003-04-25 2004-11-11 Sequenom, Inc. Fragmentation-based methods and systems for de novo sequencing

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2385335T3 (es) * 2000-10-19 2012-07-23 Target Discovery, Inc. Marcaje de defecto de masa para la determinación de secuencias de oligómeros
EP1613723B1 (en) * 2002-11-27 2013-05-15 Sequenom, Inc. Fragmentation-based methods for sequence variation detection and discovery

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6566059B1 (en) * 1998-10-01 2003-05-20 Variagenics, Inc. Method for analyzing polynucleotides
WO2004097369A2 (en) * 2003-04-25 2004-11-11 Sequenom, Inc. Fragmentation-based methods and systems for de novo sequencing

Also Published As

Publication number Publication date
JP2012506709A (ja) 2012-03-22
EP2350313A1 (en) 2011-08-03
WO2010049156A1 (en) 2010-05-06
CN102203292A (zh) 2011-09-28
US20110229976A1 (en) 2011-09-22
JP5766610B2 (ja) 2015-08-19
CA2741959A1 (en) 2010-05-06
CA2741959C (en) 2019-06-25
EP2350313B1 (en) 2014-06-04

Similar Documents

Publication Publication Date Title
CN102203292B (zh) 通过质谱分析法测序核酸分子
US7160680B2 (en) Mutation analysis by mass spectrometry using photolytically cleavable primers
Pourshahian Therapeutic oligonucleotides, impurities, degradants, and their characterization by mass spectrometry
ES2763822T3 (es) Análisis exento de marcas de la eficacia de la adición de caperuzas al arn utilizando rnasa h, sondas y cromatografía líquida/espectrometría de masas
US20180312909A1 (en) Oligonucleotide detection method
Hofstadler et al. Analysis of nucleic acids by FTICR MS
US20010026918A1 (en) Reduction of nonspecific hybridization by using novel base-pairing schemes
US20030148293A1 (en) Mutation analysis by PCR and mass spectrometry
CN103917664B (zh) 核酸酶底物
JP2003230394A (ja) マススペクトロメトリーによるdna配列決定法
CN115552034A (zh) 液相色谱法和质谱法用于表征寡核苷酸的用途
Guimaraes et al. Characterization of mRNA therapeutics
WO2005021800A2 (en) Detection and quantitation of nucleic acid molecules in biological samples
Hannauer et al. Review of fragmentation of synthetic single‐stranded oligonucleotides by tandem mass spectrometry from 2014 to 2022
JP2024010243A (ja) 直接核酸配列決定方法
Keller et al. Electrospray ionization of nucleic acid aptamer/small molecule complexes for screening aptamer selectivity
CN109661466A (zh) 用于适配子对选择的方法
AU746443B2 (en) Characterising nucleic acid by mass spectrometry
Yoluç Absolute quantification of exogenous stimuli-induced nucleic acid modification dynamics with LC-MS
Frahm et al. Nucleic Acid analysis by fourier transform ion cyclotron resonance mass spectrometry at the beginning of the twenty-first century
WO2012137804A1 (ja) オリゴヌクレオチドの配列決定法
US20080207885A1 (en) Method for site-specific labeling of RNA using a deoxyribozyme
McIntyre Novel mass spectrometric approaches for deciphering the epitranscriptomic code
CN116973467A (zh) 一种经硫代磷酸化修饰的核酸序列的修饰鉴定方法
Banoub et al. Overview of recent developments in the mass spectrometry of nucleic acid and constituents

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140625