JP2021525507A

JP2021525507A - 直接核酸配列決定方法

Info

Publication number: JP2021525507A
Application number: JP2020565759A
Authority: JP
Inventors: シェンロンジャン，; ニンジャン，
Original assignee: New York Institute of Technology
Current assignee: New York Institute of Technology
Priority date: 2018-05-25
Filing date: 2019-05-24
Publication date: 2021-09-27
Also published as: JP2024010243A; EP3802821A4; WO2019226990A1; EP3802821A1; US20210198734A1

Abstract

本開示は、概して、核酸配列決定のための新規方法に関する。具体的には、本発明は、ｃＤＮＡなしにＲＮＡを直接配列決定するための液体クロマトグラフィー−質量分析（ＬＣ−ＭＳ）に基づく技術に関する。当業者であれば、この技術により、広範囲のＲＮＡ改変の存在、型および位置を決定しながら、単一ヌクレオチド分解能でＲＮＡ配列を同時に読み取ることができる。本開示は、予めのｃＤＮＡ合成を必要とすることなくＲＮＡを直接配列決定し、単一ヌクレオチド分解能でＲＮＡ分子のヌクレオチド配列を同時に決定し、ならびに、ＲＮＡ改変の存在、型、位置および量を示すために使用することのできる、直接的な、液体クロマトグラフィー−質量分析（本明細書ではＬＣ−ＭＳと称する）に基づくＲＮＡ配列決定方法に関する。

Description

関連出願の相互参照
本出願は、２０１８年５月２５日に出願された米国仮特許出願第６２／６７６，７０３号；２０１８年９月１３日に出願された同第６２／７３０，５９２号；２０１９年２月１日に出願された同第６２／８００，０５４号；および２０１９年４月１５日に出願された同第６２／８３３，９６４号の利益および優先権を主張し、それらは全てその全体が参照により本明細書に組み込まれる。

本開示は、概して、核酸配列決定のための新規方法に関する。具体的には、本発明は、予め相補的ＤＮＡ（ｃＤＮＡ）を合成することなくＲＮＡを直接配列決定するための液体クロマトグラフィー−質量分析（ＬＣ−ＭＳ）に基づく技術に関する。この技術により、広範囲の標的ＲＮＡ改変の存在、型、位置および量を検出しながら、単一ヌクレオチド分解能で標的ＲＮＡ配列を同時に読み取ることができる。

質量分析（ＭＳ）は、ペプチド断片化が、様々なアミノ酸改変の正体および位置を示す「ラダー」をもたらす、タンパク質改変（１）を研究するための必須の手段である。まだ今のところ、満足のいく配列カバレッジを提供するｉｎｓｉｔｕ断片化技術が存在しないため、核酸のための同様の手法はまだ実現可能ではない。いくつかの主要な課題は、そのような核酸配列決定方法と関連する。１つは、ＲＮＡ配列決定にとって必要とされる質量ラダーを調製するためのプロセスが、他の非質量ラダー断片および質量付加物の生成ももたらすということである−ＲＮＡ配列決定と関連しない不純物または他の分子またはその金属イオンは、ＲＮＡ質量ラダー断片を伴い、ラダー断片の真の質量を分かりにくくし得る。

理想的には、ラダーの切断は、配列選択性／特異性なしに、それぞれのＲＮＡ鎖上の１つの無作為な切断を伴って高度に均一であるべきである。しかしながら、前もって必要なＲＮＡ分解によって生成されたラダー配列の構造／切断均一性は、それぞれのＲＮＡ鎖上の複数の切断を含む望ましくない断片（内部断片）と混同されることが多く、下流のデータ分析を複雑にする。一本鎖ＲＮＡについてさえ、全質量データから配列決定にとって必要とされる所望のラダー断片を選抜することが非常に困難であるため、内部断片と質量付加物との両方の存在は、配列決定のためのデータ分析を妨害し得るデータ中の「ノイズ」をもたらす。したがって、現在の方法は、生体試料に由来するものなどのＲＮＡ分子の混合物の効率的な配列決定を効率的に可能にしない。

異常な核酸改変、特に、ＲＮＡにおけるメチル化およびシュードウリジン化は、それぞれ、世界中の数百万人が罹患する、乳がん、２型糖尿病、および肥満（２、３）のような主要な疾患の発症と相関している。それらの重要性にも関わらず、ＲＮＡ中の改変を確実に同定する、位置付ける、および定量するための利用可能な手段は、非常に限られている。結果として、多くのそのような改変の機能は、依然としてほとんど不明である。
したがって、例えば、ｔＲＮＡ、ｓｉＲＮＡ、薬物動態特性を有する治療的合成オリゴリボヌクレオチド、ＲＮＡ分子の混合物を含む、ＲＮＡ分子の効率的な配列決定、ならびにそのようなＲＮＡ分子の改変の検出を容易にするための方法が必要である。

Ｗａｒｒｅｎ，Ｅ．Ｎ．ら、ＡｎａｌＣｈｅｍ（２００４）７６，４０８２〜４０９２Ｌｕ，Ｌ．ら、ＢｒｅａｓｔＣａｎｃｅｒＲｅｓＴｒｅａｔ（２０１２）１３６、８７５〜８８３Ｊｉａｎｇ，Ｊ．ら、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ（２０１４）４２、３９７１〜３９８１

本開示は、予めのｃＤＮＡ合成を必要とすることなくＲＮＡを直接配列決定し、単一ヌクレオチド分解能でＲＮＡ分子のヌクレオチド配列を同時に決定し、ならびに、ＲＮＡ改変の存在、型、位置および量を示すために使用することのできる、直接的な、液体クロマトグラフィー−質量分析（本明細書ではＬＣ−ＭＳと称する）に基づくＲＮＡ配列決定方法に関する。開示される方法を使用して、ＲＮＡ試料内のそれぞれの改変の型、位置および量を決定することができる。任意の所与のＲＮＡ分子の生物学的機能と、その関連する改変とを相関させるため、およびＲＮＡに基づく治療剤の品質管理のために、そのような技術を有利に使用することができる。

本明細書に開示されるＬＣ−ＭＳに基づくＲＮＡ配列決定方法は、精製されたＲＮＡ試料、ならびに生体試料に由来するＲＮＡの混合物を含む、複数のＲＮＡ種を含有する試料の配列決定を可能にする方法を有利に提供する。この戦略を、カノニカルな、および構造的に非定型的なヌクレオシドの両方を担持するＲＮＡ配列のｄｅｎｏｖｏでの配列決定に適用することができる。方法は、ＲＮＡの３’および／または５’末端でのその効率的な標識化によってＬＣ−ＭＳに基づくデータを分析するための単純化された手段を提供し、したがって、ＭＳに基づく分析のための３’ラダーおよび５’ラダーＲＮＡプールの分離を可能にする。

ある実施形態では、一次ＲＮＡ配列およびＲＮＡ改変の存在／同定を決定するためのＲＮＡ配列決定方法であって、（ｉ）ＲＮＡの５’および／または３’末端の標識化ステップ；（ｉｉ）ＲＮＡの無作為分解ステップ；（ｉｉｉ）必要に応じて、５’および３’末端標識化に基づく得られたＲＮＡ断片の物理的分離ステップ；（ｉｖ）得られたＲＮＡ断片特性の分離および検出ステップ；および（ｖ）配列／改変同定をもたらすデータ分析ステップを含む、方法が提供される。

ある実施形態では、一次ＲＮＡ配列およびＲＮＡ改変の存在／同定を決定するためのＲＮＡ配列決定方法であって、（ｉ）Ｎ−シクロヘキシル−Ｎ’−（２−モルホリノエチル）−カルボジイミドメト−ｐ−トルエンスルホネート（ＣＭＣ）による、配列決定しようとするＲＮＡの処理ステップ；（ｉｉ）ＲＮＡの５’および／または３’末端の親和性標識化ステップ；（ｉｉｉ）ＲＮＡの質量ラダーへの無作為分解ステップ；（ｉｖ）必要に応じて、親和性相互作用に基づく得られたＲＮＡ断片の物理的分離ステップ；（ｖ）質量分析とカップリングした逆相高速液体クロマトグラフィー（ＨＰＬＣ）またはキャピラリー電気泳動（ＣＥ）または他の分離方法を使用する得られたＲＮＡ断片の測定ステップ；および（ｖ）配列／改変同定をもたらすＭＳデータ分析ステップを含む、方法が提供される。

特定の態様では、ＲＮＡの５’および３’末端は、親和性に基づく部分および／またはサイズシフト部分で標識化される。別の態様では、断片特性は、例えば、質量分析とカップリングした高速液体クロマトグラフィー、キャピラリー電気泳動を含む、１つまたは複数の分離方法の使用によって検出される。

ラダー同定のために２−Ｄ質量保持時間（ＲＴ）シフトを導入することによって、疎水性末端標識化戦略を使用した。具体的には、質量−ＲＴ標識を、配列決定しようとするＲＮＡの５’および／または３’末端に付加したところ、これらの部分の少なくとも１つは、より長い時間への保持時間のシフトをもたらし、全ての５’および／または３’ラダー断片が、ＲＴの顕著な遅延を引き起こし、５’ラダーを３’ラダーから明確に区別した。疎水性標識タグは、標識化されたラダーの質量−ＲＴシフトをもたらし、ＲＮＡのＬＣ−ＭＳ配列決定にとって必要とされるそれぞれの２−Ｄ質量ラダーの同定、したがって、塩基コール手順の単純化をはるかに容易にするだけでなく、標識化されたタグもまた、末端塩基を同定することができ、したがって、対形成した末端の読み取りデータを必要とするよりもむしろ、１つの単一ラダーからの配列の完全な読み取りを可能にするように、ＲＮＡラダー断片の質量を固有に増加させる。

本発明のある特定の態様では、ＲＮＡ配列決定方法は、後に、ＲＮＡ配列ならびにＲＮＡ改変の存在のＨＰＬＣおよびＭＳによる決定のためにＬＣ／ＭＳにかけられる、本明細書では５’および３’ラダープールと称される、分解されたＲＮＡ断片の２つのラダープールの形成および逐次的物理的分離に基づくものである。５’および３’ラダープールの物理的分離を、例えば、ビオチンのストレプトアビジンに対する親和性などの、様々な異なる分子親和性相互作用の使用によって達成することができる。

一態様では、本明細書に開示されるＲＮＡ配列決定方法は、（ｉ）ＲＮＡ分子の５’および／または３’末端の親和性標識化ステップ；（ｉｉ）標識化されたＲＮＡの無作為分解ステップ；（ｉｉｉ）親和性標識化に基づく５’および／または３’末端標識化された断片の分離ステップ；および（ｉｖ）配列／改変同定のための、液体クロマトグラフィーＨＰＬＣの、高分解能質量分析装置（ＭＳ）との逐次的実施ステップを含む。

特定の態様では、方法は、（ｉ）ビオチン／ストレプトアビジン親和性に基づくラダー断片の物理的分離のための５’および／または３’ＲＮＡ末端の化学的標識化、（ｉｉ）ギ酸媒介性ＲＮＡ分解、（ｉｉｉ）５’および／または３’標識化されたＲＮＡの物理的分離、（ｉｖ）断片の高速液体クロマトグラフィー（ＨＰＬＣ）による分離、（ｖ）逐次的ＥＳＩ−四重極−飛行時間（Ｑ−ＴＯＦ）−ＭＳに基づく質量検出、ならびに（ｖｉ）質量スペクトルから関連する質量ピークを抽出し、整列させ、プロセッシングする単純なコンピューターアルゴリズムに基づくデータ分析からなる。

別の特定の例では、方法は、（ｉ）保持時間を増加させるためにＲＮＡ断片のサイズを増加させるように設計された、Ｃｙ３のような嵩高い疎水性タグによるＲＮＡの５’末端の化学的標識化、およびビオチンのような親和性タグによる３’末端の標識化、またはその逆を行い、したがって、物理的分離の必要なしに配列同定を可能にすること、（ｉｉ）ギ酸媒介性ＲＮＡ分解、（ｉｉｉ）断片の高速液体クロマトグラフィー（ＨＰＬＣ）による分離および逐次的ＥＳＩ−四重極−飛行時間（Ｑ−ＴＯＦ）−ＭＳに基づく質量検出、ならびに（ｉｖ）質量スペクトルから関連する質量ピークを抽出し、整列させ、プロセッシングする単純なコンピューターアルゴリズムに基づくデータ分析からなる。

本開示の例示的実施形態のさらなる詳細および態様を、添付の図面を参照して以下でより詳細に説明する。本開示の上記態様および実施形態はいずれも、本開示の範囲から逸脱することなく組み合わせることができる。

ＲＮＡ配列決定および改変の同定のための本発明の方法の様々な実施形態を、図面を参照して本明細書に記載する。

図１は、それぞれ、ＲＮＡの３’末端および５’末端にビオチン標識を導入した後、ＬＣ−ＭＳによる直接配列決定のための質量ラダーを生成するために酸分解し、ビオチン／ストレプトアビジン捕捉放出するためのワークフローを示す。

図２は、酵母のＴ_１リボヌクレアーゼのみで切断された一本鎖ＲＮＡのＧ位置に由来するｔＲＮＡ^Ｐｈｅの二次クローバー葉構造を示す。

図３は、３つの重複する断片を生成するためのｔＲＮＡの部分的Ｔ_１リボヌクレアーゼ消化を示す。

図４は、基質としての５’−アデニル化ビオチン−メチル−ｄｄＣを用いたＴ_４リガーゼを使用する３’ｔＲＮＡ部分の標識化、ならびにその後の、ストレプトアビジンフィッシング、酸分解、およびＬＣ／ＭＳ後の３’ラダー形成を実証する。

図５は、Ｔ４ポリヌクレオチドキナーゼ（ＰＮＫ）を使用するｔＲＮＡの中央部分の標識化、次いで、ビオチン（長腕）マレイミドを用いたチオ移入、その後の、ストレプトアビジンフィッシング、酸分解、およびＬＣ／ＭＳ後の５’ラダー形成を示す。

図６は、以前の５’手順に従うラダー生成と共に、５’リン酸基を除去し、５’−ＯＨ基と置き換える５’ホスファターゼを使用する５’ｔＲＮＡ部分の標識化を実証する。

図７は、ビーズ分離された５’標識化されたＲＮＡのＬＣ／ＭＳ配列決定を示す。

図８は、その質量、クロマトグラフィーのＲＴおよび存在量によって定義されるコンピューターアルゴリズムを使用する単離前の５’ビオチン標識化された２１ｎｔのＲＮＡの直接ＬＣ−ＭＳ配列決定を実証する；分解時間は、１５分である。

図９は、それぞれ、ｍ／ｚ６７８４をもたらす出発分子２１ｎｔＲＮＡおよびｍ／ｚ７５４１をもたらす３’末端ビオチン標識２１ｎｔＲＮＡを用いた３’末端ビオチン標識反応生成物のＭＡＬＤＩ−ＴＯＦ質量スペクトルを示す。

図１０は、それぞれ、ｍ／ｚ６７８４をもたらす出発分子２１ｎｔＲＮＡおよびｍ／ｚ７３５３をもたらす３’末端ビオチン標識２１ｎｔＲＮＡを用いた５’末端ビオチン標識反応生成物のＭＡＬＤＩ−ＴＯＦ質量スペクトルを示す。

図１１は、ビーズ分離を用いない、その質量、クロマトグラフィーのＲＴおよび存在量によって定義されるコンピューターアルゴリズムを使用する５’ビオチン標識化された２１ｎｔのＲＮＡの直接ＬＣ−ＭＳ配列決定を示す；分解時間は、５分である。

図１２は、それぞれ、ビオチン標識をＲＮＡの３’末端に、疎水性Ｃｙ３タグを５’末端に導入した後、酸分解を行って、ＬＣ−ＭＳによる直接配列決定のための質量ラダーを生成することによるビーズ補助物理的分離を用いないワークフローを示す。

図１３は、改変リボヌクレオシドの公知の質量を記載する。図１３は、改変リボヌクレオシドの公知の質量を記載する。図１３は、改変リボヌクレオシドの公知の質量を記載する。図１３は、改変リボヌクレオシドの公知の質量を記載する。

図１４Ａは、５’−スルホ−Ｃｙ３を用いた２１ｎｔＲＮＡの高収率の標識化を示すＨＰＬＣプロファイルである。図１４Ｂは、より高い３’標識化効率を得るために合成されるＡ（５’）ｐｐ（５’）Ｃｐ−ＴＥＧ−ビオチン−３’の構造である。

図１５Ａは、３’末端でのビオチン標識化および５’末端でのスルホ−Ｃｙ３標識化の後の５種のＲＮＡの同時的配列決定を示す。図１５Ｂは、３’末端でのビオチン標識化および５’末端でのスルホ−Ｃｙ３標識化の後の１２種のＲＮＡの同時的配列決定を示す。^＊異なる配列読み取りデータのより良好な可視化のために各ラダーにつき２ｍｉｎを追加することによって、保持時間を調整した。図１５Ａは、３’末端でのビオチン標識化および５’末端でのスルホ−Ｃｙ３標識化の後の５種のＲＮＡの同時的配列決定を示す。図１５Ｂは、３’末端でのビオチン標識化および５’末端でのスルホ−Ｃｙ３標識化の後の１２種のＲＮＡの同時的配列決定を示す。^＊異なる配列読み取りデータのより良好な可視化のために各ラダーにつき２ｍｉｎを追加することによって、保持時間を調整した。

図１６Ａは、ビオチン標識をＲＮＡの３’末端に導入するための方法である。図１６Ｂは、ＲＮＡ＃１の３’ビオチン標識化された質量−ＲＴラダーのＲＴの体系的変化に基づく質量−保持時間（ＲＴ）プロット上での５’ラダーおよび他の望ましくない断片からの３’ラダーの分離を示す。配列を、ＳＩに記載のアルゴリズムによって自動的にｄｅｎｏｖｏで生成した。図１６Ｃは、５’ビオチン標識化後の異なる長さの２つのＲＮＡ（ＲＮＡ＃１およびＲＮＡ＃２）の同時的配列決定を示す。提示される配列を、自動的に生成されフィルタリングおよびプロセッシングされたデータから同定された質量−ＲＴラダーに基づいて手動で獲得した。

図１７Ａは、任意のＲＮＡの、それぞれ、５’末端に疎水性シアニン３（Ｃｙ３）を、３’末端にビオチンを導入することによって、２つの一連のラダー断片（５’対３’）を互いに区別するための一般的な戦略を示す。図１７Ｂは、５’−Ｃｙ３標識化された、および３’−ビオチン標識化されたＲＮＡ＃１から配列決定するのに必要とされる全てのラダー断片を含有する試料の質量−ＲＴプロットを示す；ラダーの区別は、２つのタグによって得られたＲＴの有意な変化に起因して起こり得る。自動的に生成された質量−ＲＴプロットに由来するフィルタリングおよびプロセッシングされたデータから同定された両方の質量−ＲＴラダーから、配列を手動で読み取った。

図１８Ａは、５’末端でのスルホ−Ｃｙ３によるＲＮＡ＃１１の高収率の標識化のためのＨＰＬＣプロファイルを示す。図１８Ｂは、Ａ（５’）ｐｐ（５’）Ｃｐ−ＴＥＧ−ビオチン−３’を使用する、３’末端でのビオチンによるＲＮＡ＃１１の高収率の標識化のためのＨＰＬＣプロファイルを示す。図１８Ｃは、それぞれ、５’および３’末端でのより高い標識化効率を達成するために適用された、スルホ−Ｃｙ３マレイミドおよびＡ（５’）ｐｐ（５’）Ｃｐ−ＴＥＧ−ビオチン−３’の構造を示す。図１８Ａは、５’末端でのスルホ−Ｃｙ３によるＲＮＡ＃１１の高収率の標識化のためのＨＰＬＣプロファイルを示す。図１８Ｂは、Ａ（５’）ｐｐ（５’）Ｃｐ−ＴＥＧ−ビオチン−３’を使用する、３’末端でのビオチンによるＲＮＡ＃１１の高収率の標識化のためのＨＰＬＣプロファイルを示す。図１８Ｃは、それぞれ、５’および３’末端でのより高い標識化効率を達成するために適用された、スルホ−Ｃｙ３マレイミドおよびＡ（５’）ｐｐ（５’）Ｃｐ−ＴＥＧ−ビオチン−３’の構造を示す。

図１９Ａは、ＣＭＣ−Ψを形成し、非変換Ψを含有する質量−ＲＴラダーと比較して、質量とＲＴの両方においてＣＭＣ−Ψ含有質量−ＲＴラダーをシフトさせる、Ｎ−シクロヘキシル−Ｎ’−（２−モルホリノエチル）−カルボジイミドメト−ｐ−トルエンスルホネート（ＣＭＣ）との反応によるシュードウリジン（Ψ）の化学的変換を示す。図１９Ｂは、１個のΨを含有する、ＲＮＡ＃１２の配列決定を示す。ＣＭＣ変換されたΨ（Ψ^＊として描かれる）は、ＲＴと質量の両方のシフトをもたらし、質量−ＲＴラダーにおける単一の劇的なジャンプのため、この位置でのΨの容易な同定および位置特定（ｌｏｃａｔｉｏｎ）を可能にする。図１９Ｃは、２個のΨを含有する、ＲＮＡ＃１３の配列決定を示す。ＣＭＣ変換されたΨ（Ψ^＊として描かれる）はそれぞれ、質量−ＲＴラダーの劇的なジャンプをもたらし、ＲＮＡ配列中のΨの位置に対応する。可視化を容易にするために、５’質量−ＲＴラダーの配列のみが提示される。

図２０は、それぞれのＲＮＡの３’末端の単一の図２０Ａのビオチン標識または５’末端の図２０Ｂのスルホ−Ｃｙ３標識のいずれかと共に１２種のＲＮＡを含有する混合試料の同時的配列決定を示す（ＲＮＡ＃１２は、３’−ビオチン標識化された試料混合物中にのみ存在し、したがって、図２０Ａは図２０Ｂと比較して１つのさらなる配列を含有する）。可視化を容易にするために、ＲＴを正規化した（方法）。

図２１は、ＬＣ／ＭＳ配列決定および定量を示す。図２１Ａは、２０％のｍ^５Ｃ改変ＲＮＡ（ＲＮＡ＃１４）と、８０％の非改変ＲＮＡ（ＲＮＡ＃３）とを含有する混合物の配列決定を示す。両曲線は、最初のＣに達するまで同一の配列を共有する；ｍ^５Ｃ末端ラダー断片のＲＴは、その非改変対応物と比較して、シフトアップし（メチル基に由来する疎水性の増大のため）、質量はわずかに増加した（さらなるメチル基に由来する１４Ｄａの質量の増加のため）。両配列を、アルゴリズムによりプロセッシングされたデータから同定された質量−ＲＴラダーから手動で読み取った。図２１Ｂは、改変を含むＲＮＡと、そのカノニカルな対応物ＲＮＡとの化学量論／パーセンテージの定量を示す。異なる標識生成物種の抽出イオン電流（ＥＩＣ）を積分することによって、相対パーセンテージを定量し、それらは、これらのＲＮＡ試料を標識化するために最初に使用される絶対量の比とよく一致する、すなわち、混合試料中のｍ^５Ｃ改変ＲＮＡのパーセンテージは、標識化するために最初に使用されたそのモル比から算出された、それぞれ、１０％、２０％、３０％、４０％、５０％および１００％であった。

図２２Ａは、ｉｎｓｉｌｉｃｏで生成された合成の非改変Ａ１０（１０マーのポリアデニン）配列の非標識３’および５’質量ラダーを示す。図２２Ｂは、ｉｎｓｉｌｉｃｏで生成された合成の５’−Ｃｙ３標識Ａ１０（１０マーのポリアデニン）配列の５’および３’質量ラダーを示す。

図２３は、フィルタリングおよびプロセッシングされたデータから同定された質量−ＲＴラダーを含有する自動的に生成された質量−ＲＴプロットに由来する手動で読み取った配列データを含有する、５’−スルホ−Ｃｙ３標識化されたＲＮＡ＃１に由来するラダー断片と、その３’非標識ラダー断片との完全なセットを含有する試料の質量−ＲＴプロットを示す。

図２４は、図２４Ａの１個のΨ塩基を含有する２０ｎｔのＲＮＡ（ＲＮＡ＃１２）および図２４Ｂの２個のΨ塩基を含有する２０ｎｔのＲＮＡ（ＲＮＡ＃１３）中の、シュードウリジン（Ψ）のそのＮ−シクロヘキシル−Ｎ’−（２−モルホリノエチル）−カルボジイミドメト−ｐ−トルエンスルホネート（ＣＭＣ）付加物への変換後の粗生成物のＨＰＬＣプロファイルを示す。

図２５は、２０ｎｔのＲＮＡの最終的な配列を報告する前に５’ラダー中のギャップを埋め、したがって、観測質量が提唱された配列に由来する理論質量の一覧と一致する、図２５Ａの５’ラダー、図２５Ｂの３’ラダー、および図２５Ｃの内部断片を含む３つの情報を合わせることによって方法の精度を増大させるための元の５’または３’末端のいずれかを有しない内部断片の利用を示す。

本開示を特定の実施形態に関して説明するが、本開示の精神から逸脱することなく、様々な改変、再配列、および置換を行うことができることが当業者には容易に明らかとなるであろう。本開示の範囲は、本明細書に添付される特許請求の範囲によって定義される。

本開示の原理の理解を促進するために、ここで、図面に例示される例示的実施形態を参照し、特定の用語を使用して、それを説明する。それにも関わらず、本開示の範囲の限定はそれによって意図されないことが理解されるであろう。関連する業界における当業者および本開示の所有権を有する当業者であれば想到するであろう、本明細書に例示される本発明の特徴の任意の変更およびさらなる改変、ならびに本明細書に例示される本開示の原理の任意のさらなる適用は、本開示の範囲内にあると考えられるべきである。

本開示は、ｃＤＮＡ合成なしにＲＮＡを直接配列決定する、単一ヌクレオチド分解能でＲＮＡ分子のヌクレオチド配列を同時に決定し、ならびに標的ＲＮＡ改変の存在を検出するために使用することができる、直接的な、液体クロマトグラフィー−質量分析（本明細書ではＬＣ−ＭＳと称される）に基づくＲＮＡ配列決定方法に関する。開示される方法を使用して、ＲＮＡ試料内の改変の型、位置および量を決定することができる。配列決定しようとするＲＮＡは、限られた多様性の精製されたＲＮＡ試料、および生体試料に由来するＲＮＡなどの、ＲＮＡの複雑な混合物を含有するＲＮＡの試料であってもよい。そのような技術を使用して、ＲＮＡ分子のヌクレオチド配列を決定し、任意の所与のＲＮＡ分子の生物学的機能と、その関連する改変とを有利に相関させることができる。

本明細書で使用される場合、リボ核酸（ＲＮＡ）とは、オリゴリボヌクレオチドまたはポリリボヌクレオチドならびに例えば、ヌクレオチドアナログから作製されるＲＮＡのアナログを指す。ＲＮＡは、典型的には、アデニン（Ａ）、グアニン（Ｇ）、シトシン（Ｃ）およびウラシル（Ｕ）の塩基部分、リボースの糖部分ならびにリン酸結合のリン酸部分を有する。ＲＮＡ分子は、天然ＲＮＡと、人工ＲＮＡアナログとの両方を含む。ＲＮＡは、合成のものであってもよく、または特定の選択される手順が、特定の生体試料にとって適切である、当業界で周知であるいくつもの手順を使用して特定の生体試料から単離してもよい。ＲＮＡ試料は、例えば、数例を挙げると、ｍＲＮＡ、ｔＲＮＡ、アンチセンスＲＮＡ、およびｓｉＲＮＡを含む。ＲＮＡの塩基長には制限は課されない。本明細書に開示されるＬＣ−ＭＳに基づく配列決定方法は、精製されたＲＮＡ試料だけでなく、異なるＲＮＡの混合物を含有するより複雑なＲＮＡ試料の配列決定をも可能にする。

特定の実施形態では、治療的に有用な合成オリゴリボヌクレオチドの構造を、本明細書に開示される配列決定方法を使用して決定することができる。そのような方法は、ＲＮＡに基づく治療剤の研究、製造、および品質管理に従事する者、ならびに規制当局にとって特に有用であろう。合成オリゴリボヌクレオチドへの構造改変の組込みは、ポリマーの物理特性および薬物動態パラメーターを改善するための証明された戦略であった。しかしながら、合成オリゴヌクレオチドおよび高度に改変されたオリゴヌクレオチドの特性評価および構造解明は、依然として大きな障害である。

ＲＮＡの配列決定に加えて、本明細書で開示される方法を使用して、ＤＮＡの配列を決定することができる。本明細書で使用される場合、デオキシ核酸（ＤＮＡ）とは、オリゴヌクレオチドまたはポリヌクレオチドならびに例えば、ヌクレオチドアナログから作製されるＤＮＡのアナログを指す。ＤＮＡは、典型的には、アデニン（Ａ）、グアニン（Ｇ）、シトシン（Ｃ）およびチミン（Ｔ）の塩基部分、デオキシリボースの糖部分ならびにリン酸結合のリン酸部分を有する。ＤＮＡ分子は、天然ＤＮＡと、人工ＤＮＡアナログとの両方を含む。ＤＮＡは、合成のものであってもよく、または特定の選択される手順が、特定の生体試料にとって適切である、当業界で周知であるいくつもの手順を使用して特定の生体試料から単離してもよい。ＤＮＡ試料は、例えば、数例を挙げると、ゲノムＤＮＡおよびミトコンドリアＤＮＡを含む。ＤＮＡの塩基長には制限は課されない。適切な酵素的および／または化学的分解があれば、本明細書に開示されるＬＣ−ＭＳに基づく配列決定方法は、精製されたＤＮＡ試料だけでなく、異なるＤＮＡの混合物を含有するより複雑なＤＮＡ試料の配列決定をも可能にする。本発明の非限定的な実施形態では、ＤＮＡの酵素的分解を、ＤＮＡ制限エンドヌクレアーゼを使用して達成することができる。

一態様では、本発明の配列決定方法は、（ｉ）５’および３’末端標識化されたＲＮＡプールのその後の分離を容易にするためのＲＮＡ試料の５’および３’末端の親和性標識化ステップ；（ｉｉ）ＲＮＡの無作為な非特異的切断ステップ；（ｉｉｉ）親和性に基づく相互作用を使用した得られた標的ＲＮＡ断片の物理的分離ステップ；（ｉｖ）液体クロマトグラフィー（ＬＣ）および高分解能質量分析（ＭＳ）を用いた得られた質量ラダーのＬＣ／ＭＳ測定ステップ；ならびに（ｖ）配列生成および改変分析ステップを含む。

ある実施形態では、一次ＲＮＡ配列およびＲＮＡ改変の存在／同定を決定するためのＲＮＡ配列決定方法であって、（ｉ）ＲＮＡの５’および／または３’末端の標識化ステップ；（ｉｉ）ＲＮＡの無作為分解ステップ；（ｉｉｉ）必要に応じて、５’および３’末端標識化に基づく得られたＲＮＡ断片の物理的分離ステップ；（ｉｖ）得られたＲＮＡ断片特性の分離および検出ステップ；ならびに（ｖ）配列／改変同定をもたらすデータ分析ステップを含む、方法が提供される。

ある実施形態では、一次ＲＮＡ配列およびＲＮＡ改変の存在／同定を決定するためのＲＮＡ配列決定方法であって、（ｉ）Ｎ−シクロヘキシル−Ｎ’−（２−モルホリノエチル）−カルボジイミドメト−ｐ−トルエンスルホネート（ＣＭＣ）による、配列決定しようとするＲＮＡの処理ステップ；（ｉｉ）ＲＮＡの５’および３’末端の親和性標識化ステップ；（ｉｉｉ）ＲＮＡの無作為分解ステップ；（ｉｖ）必要に応じて、親和性相互作用に基づく得られたＲＮＡ断片の物理的分離ステップ；（ｖ）質量分析とカップリングした逆相高速液体クロマトグラフィー（ＨＰＬＣ）またはキャピラリー電気泳動（ＣＥ）または他の分離方法を使用する得られたＲＮＡ断片の測定ステップ；および（ｖ）配列／改変同定をもたらすＭＳデータ分析ステップを含む、方法が提供される。

特定の態様では、方法は、（ｉ）ビオチン／ストレプトアビジン親和性に基づくラダー断片の物理的分離のための５’および３’ＲＮＡの化学的標識化、（ｉｉ）ギ酸媒介性ＲＮＡ分解、（ｉｉｉ）５’および３’標識化されたＲＮＡの物理的分離、（ｉｖ）断片の高速液体クロマトグラフィー（ＨＰＬＣ）による分離、（ｖ）逐次的ＥＳＩ−四重極−飛行時間（Ｑ−ＴＯＦ）−ＭＳに基づく質量検出、ならびに（ｖｉ）質量スペクトルから関連する質量ピークを抽出し、整列させ、プロセッシングする単純なコンピューターアルゴリズムに基づくデータ分析からなる。

本発明の実施において使用することができるそのような非限定的なコンピューターアルゴリズムとしては、例えば、その全体が参照により本明細書に組み込まれる２０１９年５月２４日に出願されたＰＣＴ／ＵＳ１９／３３８９５に開示されたものが挙げられる。

本明細書に開示される配列決定方法は一般に、ＭＳ分析のための分解された標的ＲＮＡ断片の２つの５’および３’ラダープールの形成および逐次的物理的分離に基づくものであるが、標識ＲＮＡ分解断片は、非標識ＲＮＡ分解断片と比較して、保持時間シフトを有し、ＬＣ／ＭＳステップ後に２次元質量−保持時間プロットにおいて区別することができるため、ラダープールの物理的分離は必要なステップではない。

本明細書に開示される配列決定方法における１つのステップとして、配列決定しようとするＲＮＡは、無作為の制御された分解にかけられる。本明細書で使用される場合、分解および切断という用語は、互換的に使用することができる。ＲＮＡの分解、または切断とは、ＲＮＡの２つまたはそれより多い断片への断片化をもたらすＲＮＡ鎖の破壊を指すことが理解される。一般に、本開示の目的のためのそのような断片化は、無作為である。しかしながら、部位特異的断片化を用いることもできる。分解しようとするＲＮＡの天然の性質を有利に使用して、液体クロマトグラフィー−質量分析（ＬＣ−ＭＳ）によるその後の配列決定のための、配列ラダー、すなわち、質量ラダーを生成することができる。分解試薬への曝露のタイミングを制御することによって、標的ＲＮＡ分子の骨格に沿った単一であるが、無作為化された切断を達成し、したがって、下流のＭＳデータ分析を単純化することができる。

一態様では、標的ＲＮＡ分子は、分解された標的ＲＮＡ断片のラダープールを形成させるために、無作為な化学的切断に曝露される。好ましい実施形態では、化学的切断は、ギ酸の使用によって達成される。ギ酸の沸点は水と同様、約１００℃であり、ギ酸は例えば、凍結乾燥機またはＳｐｅｅｄｖａｃによってそれを容易に除去することができるため、ギ酸分解が好ましい。そのような切断は、分子を通してその５’リボース位置でＲＮＡ分子を切断するように設計される。ギ酸分解に加えて、アルカリ分解を使用することもできる。例えば、以下のアルカリ緩衝液を使用して、ＲＮＡ試料を分解することができる：１Ｘアルカリ加水分解緩衝液（例えば、５０ｍＭ炭酸ナトリウム［ＮａＨＣＯ_３／Ｎａ_２ＣＯ_３］ｐＨ９．２、１ｍＭＥＤＴＡ；またはＡｍｂｉｏｎのＲＮＡ等級リボヌクレアーゼを添加したアルカリ加水分解緩衝液）。化学的切断に加えて、ＲＮＡを酵素的分解にかけることができる。ＲＮＡを分解するために使用することができる酵素としては、例えば、ＣｒｏｔａｌｕｓのホスホジエステラーゼＩ、ウシ脾臓ホスホジエステラーゼＩＩおよびＸＲＮ−１エキソリボヌクレアーゼ（exoribonucease）が挙げられる。そのようなＲＮＡ分解処理は、所望の単一切断事象がＲＮＡ分子上で起こり、示差的に切断されたＲＮＡ断片のプールをもたらし、完全なラダーをもたらす条件下で行われる。

本明細書に開示される配列決定方法におけるさらなるステップとして、ＲＮＡ断片の末端は、切断混合物内での断片化された５’または３’標識断片プールの分離のための手段を提供するために利用することができる親和性相互作用をもたらすための標識化である。そのような親和性相互作用は、当業者には周知であり、例えば、数例を挙げると、抗原と抗体との間、酵素と基質との間、受容体とリガンドとの間、またはタンパク質と核酸との間のものなどの親和性に基づく相互作用を含む。親和性分離における使用のための断片化されたＲＮＡの５’および３’末端の標識化を、当業者には周知の様々な異なる方法を使用して達成することができる。そのような標識化は、その後のＭＳ分析のための断片化されたＲＮＡの分離を達成するように設計される。ＲＮＡ末端標識化を、ＲＮＡの化学的切断の前または後に実施することができる。

好ましい実施形態では、ビオチン／ストレプトアビジン相互作用を利用して、ラダーＲＮＡ断片について富化することができる。さらに別の好ましい実施形態では、ポリ（Ａ）オリゴヌクレオチド／ｄＴ相互作用を使用して、断片化されたＲＮＡを分離することができる。ＲＮＡの末端がビオチン部分で標識化される例では、ストレプトアビジンビーズを使用して、所望のＲＮＡラダー断片を精製することができる。あるいは、ＲＮＡがポリ（Ａ）ＤＮＡオリゴヌクレオチドで標識化されている場合、（ｄＴ）２５−セルロースビーズ（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）などのオリゴポリ（ｄＴ）固定ビーズを使用して、ＲＮＡ断片について富化することができる。クロマトグラフィー材料の選択は、使用される５’および３’ＲＮＡの標識化に依存し、そのようなクロマトグラフィー／分離材料の選択は、当業者には周知である。

一例として、３’および５’ＲＮＡ末端を、ストレプトアビジンビーズの使用によるビオチン／ストレプトアビジン相互作用に基づくその後のＲＮＡ断片の分離のために、ビオチンで標識化することができる。さらに別の態様では、短いＤＮＡアダプターを、ＲＮＡ試料のそれぞれの末端にライゲーションすることができる。ＲＮＡの３’末端を、Ｔ４ＲＮＡリガーゼを用いて５’リン酸末端ペンタマーキャップ付光切断性ポリ（Ａ）ＤＮＡオリゴヌクレオチドにライゲーションして、ホスホジエステル結合したＲＮＡ−ＤＮＡハイブリッドを形成させることができる。次いで、ＲＮＡ−ＤＮＡハイブリッドの５’末端を、Ｔ４ＲＮＡリガーゼを使用するＴ４ポリヌクレオチドキナーゼによるリン酸化の後に５’ビオチン化ＤＮＡにライゲーションすることができる。

特定の実施形態では、２つの短いＤＮＡアダプターを、ＲＮＡ試料のそれぞれの末端にライゲーションして、粗分解生成物混合物中の１つより多いホスホジエステル結合が切断された望ましくない断片に由来する５’または３’ラダープールのいずれかにおいて所望の断片を物理的に選択した後、その多くが完全な配列ラダーを得るのに必要とされる所望の断片に変化する、多くのＲＮＡ試料の分解をもたらすギ酸分解時間を長くする。ＲＮＡ試料の３’末端を、Ｔ４ＲＮＡリガーゼ１（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）を用いて５’リン酸末端ペンタマーキャップ付光切断性ポリ（Ａ）ＤＮＡオリゴヌクレオチドにライゲーションして、ホスホジエステル結合したＲＮＡ−ＤＮＡハイブリッドを形成させる。同様に、ＲＮＡ−ＤＮＡハイブリッドの５’末端を、同じリガーゼを用いるＴ４ポリヌクレオチドキナーゼによるリン酸化の後に５’−ビオチン化ＤＮＡにライゲーションする。得られた５’ＤＮＡ−ＲＮＡ−ＤＮＡ−３’ハイブリッドを、約５〜１５分間ギ酸で処理する。ギ酸処理後、ストレプトアビジン結合ビーズ（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ）を使用して、５’ラダー断片プールを単離した後、その後のＬＣ／ＭＳ分析のためにオリゴマーを放出させることができる。同様に、（ｄＴ）２５−セルロースビーズ（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）などのオリゴポリ（ｄＴ）固定ビーズを使用して、５’ラダーを富化した後、ＵＶ光（３００〜３５０ｎｍ）による光切断後にＬＣ／ＭＳ分析のために溶出させることができる。ハイブリッドのＲＮＡセクションのみが加水分解されるが、ＤＮＡは２’−ＯＨ基を欠くため、ＤＮＡセクションは無傷のままであろう。特定の実施形態では、ＲＮＡ試料のそれぞれの末端に、２ステップ反応によってビオチンタグが付加される。第１のステップとして、Ｔ４ポリヌクレオチドキナーゼと、アデノシン５’−［γ−チオ］三リン酸（ＡＴＰ−γ−Ｓ）とを反応させて、配列決定しようとするＲＮＡの５’ヒドロキシル基にチオホスフェートを付加することによって、チオール含有ホスフェートを５’末端に導入した後、得られたチオールリン酸化されたＲＮＡと、１つまたは複数のチオール基を含有するタンパク質、核酸、または他の分子をビオチン化するために設計される、ビオチン（ＬｏｎｇＡｒｍ）マレイミド（ＶｅｃｔｏｒＬａｂｏｒａｔｏｒｉｅｓ、米国）との間でコンジュゲーション付加を行う。次いで、得られた５’ビオチン化ＲＮＡを、以前の手順と同様、ギ酸で処理する（１３）。酸分解の後、ストレプトアビジン結合ビーズ（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、米国）を使用して、ビオチン−ストレプトアビジン相互作用を破壊した後、その後のＬＣ／ＭＳ分析のために放出されるであろう、５’ラダープールを選抜する。本明細書に開示される配列決定方法は一般に、ＭＳ分析のための分解された標的ＲＮＡ断片の５’および３’ラダープールの形成および逐次的物理的分解に基づくものであるが、ラダープールの物理的分離は必要なステップではない。標識ＲＮＡ分解断片は、ＬＣ／ＭＳステップによって区別することができる非標識ＲＮＡ分解断片と比較して、保持時間シフトを有するであろう。特定の実施形態では、保持時間シフトを増加させるために、ＲＮＡを、例えば、疎水性Ｃｙ３もしくはＣｙ５タグまたは他の蛍光タグなどの嵩高い部分で標識化してもよい。そのようなタグは、ＲＮＡ試料の５’末端に、２ステップ反応によって付加される。第１のステップとして、Ｔ４ポリヌクレオチドキナーゼと、アデノシン５’−［γ−チオ］三リン酸（ＡＴＰ−γ−Ｓ）とを反応させて、配列決定しようとするＲＮＡの５’ヒドロキシル基にチオホスフェートを付加することによって、チオール含有ホスフェートを５’末端に導入した後、得られたチオールリン酸化されたＲＮＡと、１つまたは複数のチオール基を含有するタンパク質、核酸、または他の分子をビオチン化するために設計される、Ｃｙ３またはＣｙ５マレイミド（ＴｅｎｏｖａＰｈａｒｍａｃｅｕｔｉｃａｌｓ、米国）との間でコンジュゲーション付加を行う。３’末端ビオチン標識化および酸分解の後、得られた２つの末端標識化されたＲＮＡを、いかなる親和性に基づく物理的分離も用いずにＬＣ／ＭＳに直接かける。

３’末端標識化のために、親和性タグを使用した場合に５’ラダープール（ＬＣ／ＭＳによって分析される）を単離した後、元の３’−ヒドロキシル基の全てと共に３’ラダープールを含有する、残りの残留物を、３’末端標識化にかける。この目的のために、ビオチン化シチジンビスリン酸（ｐＣｐ−ビオチン）を、ＡＴＰおよびＭｔｈＲＮＡリガーゼを使用するアデニル化によって活性化して、ＡｐｐＣｐ−ビオチンを産生する。次いで、遊離３’末端ヒドロキシルを含む３’ラダープールのメンバーを、Ｔ４ＲＮＡリガーゼによって活性化された５’−ビオチン化ＡｐｐＣｐにライゲーションし、したがって、３’ラダープール中の各配列の３’末端がビオチン標識化されるようになる。同様に、ストレプトアビジン結合ビーズを使用して、ビオチン−ストレプトアビジン相互作用を破壊した後にその後のＬＣ／ＭＳ分析のために放出される（５’ラダープールから分離される）３’ラダープールを単離する。

ＲＮＡ断片プールの分離を実施したら、質量分析とカップリングした液体クロマトグラフィー、または質量分析とカップリングしたキャピラリー電気泳動または当業界で公知の他の方法を含む様々な手段のいずれかによって、ＲＮＡ断片を分析することができる。好ましい質量分析装置の形式としては、連続またはパルス電子スプレー（ＥＳＩ）および関連する方法またはＭＡＬＤＩ−ＭＳのようなＲＮＡ断片を検出することができる他の質量分析装置が挙げられる。高分解能飛行時間または５ｐｐｍ未満の質量精度を有するＯｒｂｉｔｒａｐ質量分析装置を使用して、ＨＰＬＣ−ＭＳ測定を実施することができる。そのような質量分析装置の使用は、ＲＮＡ配列中のシトシン塩基とウリジン塩基との間の正確な識別を容易にする。本発明の一態様では、質量分析装置は、ＷａｔｅｒｓＸＢｒｉｄｇｅＣ１８カラム（３．５μｍ、１ｘ１００ｍｍ）を備えたＡｇｉｌｅｎｔ６５５０および１２００シリーズのＨＰＬＣである。移動相Ａは、水性２００ｍＭのＨＦＩＰ（１，１，１，３，３，３−ヘキサフルオロ−２−プロパノール）および１〜３ｍＭのＴＥＡ（トリエチルアミン）、ｐＨ７．０であってよく、移動相Ｂはメタノールであってよい。特定の非限定的な実施形態では、２０μＬの１０μＭ試料溶液のためのＨＰＬＣ法は、０．１ｍＬ／分で２０〜４０分にわたる２％〜５％から２０％〜４０％のＢへの直線的増加であり、カラムは５０または６０℃に加熱した。試料の溶出を、２６０ｎｍの吸光度によってモニタリングし、溶出液を、８．０Ｌ／ｍｉｎの窒素ガス流、３５ｐｓｉｇのネブライザー圧およびネガティブモードで３５００Ｖのキャピラリー電圧を用いて３２５℃で乾燥しながらＥＳＩ源に直接通過させた。

ＬＣ−ＭＳデータは、ＲＮＡ配列情報に変換される。ＲＮＡ分子上のそれぞれのカノニカルなリボヌクレオチドおよびその関連する改変のユニークな質量タグにより、ＲＮＡの一次ヌクレオチド配列を決定するだけでなく、ＲＮＡ改変の存在、型および位置も決定することができる。

ＤＮＡの事象では、ＬＣ−ＭＳデータは、ＤＮＡ配列情報に変換される。ＤＮＡ分子上のそれぞれのカノニカルなデオキシヌクレオチドおよびその関連する改変のユニークな質量タグにより、ＤＮＡの一次ヌクレオチド配列を決定するだけでなく、ＤＮＡ改変の存在、型および位置も決定することができる。特定の実施形態では、所望の断片および／または望ましくない断片のＬＣ／ＭＳデータを含有する、ＬＣ−ＭＳに由来する生データは、その後、配列アラインメントおよび塩基改変の検出のために使用される。質量および保持時間に依拠した２次元データ分析に加えて、例えば、配列決定のために質量と一緒に使用することができるユニークな電気シグナルまたは光学的シグネチャシグナルなどの、ＲＮＡ断片の他のユニークな特性に基づいて、さらなる型の２次元またはさらには３次元データ分析を実施することができることが理解される。

解析データから質量付加物を除去し、質量と保持時間データとの両方を使用して、配列を推測／生成することができる。断片に関する保持時間とカップリングした質量データを分析して、どのデータポイントが「有効」であり、その後の配列決定のために使用するべきかを決定し、どのデータポイントがフィルタリングアウトされるべきかを決定する。データ整理ステップの後、２つの隣接するＲＮＡ断片間の質量差（ｍ）［ｍ＝ｍ（ｉ）−ｍ（ｉ−１）、１＜ｉ＜ｎ、ｎ＝ＲＮＡの長さ］（式中、ｍ（ｉ）は任意のラダー断片の質量であり、ｍ（ｉ−１）は先行するより下の質量ラダー断片である）は、そのような質量差を、公知のヌクレオチド断片の正確な質量と一致させて、質量差に基づいて誘導されるＲＮＡ配列決定情報を相関させ、ＲＮＡ配列およびその改変を決定する。ＲＮＡヌクレオシド上の構造改変が質量を変更するものである限り、開示される配列決定方法は、ＲＮＡ配列の同定およびその改変の同定を可能にするであろう。あらゆる公知の改変リボヌクレオシドの質量を、公知のＲＮＡ改変データベース（１２）から、または添付される図１３の使用によって都合良く回収することができる。

本明細書で提供される実施例および実施形態は、例示的な実施形態例であることが理解されるべきである。当業者であれば、本明細書の開示の範囲と一致する実施例および実施形態の様々な改変を想定するであろう。そのような改変は、特許請求の範囲によって包含されることが意図される。本明細書で提供される実施例は、単に本明細書の開示を増補するために含まれるのであり、いかなる点でも限定であると考えられるべきではない。

材料および方法
以下に列挙されるＲＮＡオリゴヌクレオチドは、ＩｎｔｅｇｒａｔｅｄＤＮＡＴｅｃｈｎｏｌｏｇｉｅｓ（Ｃｏｒａｌｖｉｌｌｅ、ＩＡ、米国）から得られたものである。ＲＮＡ鎖の配列は以下の通りである：

ビオチン化シチジンビスリン酸（ｐＣｐ−ビオチン）、｛Ｐｈｏｓ（Ｈ）｝Ｃ｛ＢｉｏＢＢ｝は、ＴｒｉＬｉｎｋＢｉｏＴｅｃｈｎｏｌｏｇｉｅｓ（ＳａｎＤｉｅｇｏ、ＣＡ、米国）から得た。Ｔ４ＤＮＡリガーゼ１、Ｔ４ＤＮＡリガーゼ緩衝液（１０ｘ）、反応緩衝液（１０ｘ）、１ｍＭＡＴＰ、およびＭｔｈＲＮＡリガーゼを含むアデニル化キットは、ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ（Ｉｐｓｗｉｃｈ、ＭＡ、米国）から得た。５’末端タグ核酸標識化システムキットおよびビオチンマレイミドは、ＶｅｃｔｏｒＬａｂｏｒａｔｏｒｉｅｓ（Ｂｕｒｌｉｎｇａｍｅ、ＣＡ、米国）から購入した。ストレプトアビジン磁気ビーズは、ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ（Ｗａｌｔｈａｍ、ＭＡ、米国）から得た。

３’末端標識化法
アデニル化：ＲＮａｓｅを含有しない薄壁の０．５ｍＬＰＣＲチューブ中、１０μＬの合計反応容量を用いて、以下の反応を設定した：１ｘアデニル化反応緩衝液、１００μＭのＡＴＰ、５．０μＭのＭｔｈＲＮＡリガーゼ、１０．０μＭのｐＣｐ−ビオチン、およびヌクレアーゼ非含有脱イオン水（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、米国）。反応物を、ＧｅｎｅＡｍｐ（商標）ＰＣＲＳｙｓｔｅｍ９７００（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、米国）中、６５℃で１時間インキュベートした後、８５℃で５分間、ＭｔｈＲＮＡリガーゼ酵素を不活化した。

ライゲーション：３０μＬの反応溶液は、アデニル化ステップに由来する１０μＬの反応溶液、１０ｘ反応緩衝液、５μＭのＲＮＡ（それぞれ、１９ｎｔ、２０ｎｔまたは２１ｎｔ）、１０％（ｖ／ｖ）のＤＭＳＯ（無水ジメチルスルホキシド、９９．９％、Ｓｉｇｍａ−Ａｌｄｒｉｃｈ、米国）、Ｔ４ＲＮＡリガーゼ（１０ユニット）、およびヌクレアーゼ非含有脱イオン水を含有していた。反応物を、１６℃で一晩インキュベートした後、以下のようにカラム精製した。

カラム精製：ＯｌｉｇｏＣｌｅａｎ＆Ｃｏｎｃｅｎｔｒａｔｏｒ（ＺｙｍｏＲｅｓｅａｒｃｈ、Ｉｒｖｉｎｅ、ＣＡ、米国）を使用して、酵素、遊離ビオチン、および短いオリゴを除去した。１００μＬのオリゴ結合緩衝液を、５０μＬの試料に添加した（２０μＬのヌクレアーゼ非含有水を添加して、試料の総量を５０μＬにした）。４００μＬのエタノールを添加し（２００プルーフ、１００％、ＤｅｃｏｎＬａｂｓ、米国）、ピペッティングにより溶液を簡単に混合し、混合物を、収集チューブ中の提供されたカラムに移した。次いで、試料を１０，０００ｒｃｆで３０秒間遠心分離し、フロースルーを廃棄し、７５０μＬのＤＮＡ洗浄緩衝液をカラムに添加した。次いで、試料を再度１０，０００ｒｃｆで３０秒間遠心分離し、フロースルーを廃棄した後、最大速度で１分間、遠心分離した。カラムをマイクロ遠心チューブに移し、１５μＬのヌクレアーゼ非含有水をカラムマトリックスに直接添加し（１分のインキュベーション時間で）、試料を１０，０００ｒｃｆで３０秒間遠心分離して、オリゴヌクレオチドを溶出させた。

（ｎｇ／μＬ）で報告された精製ＲＮＡの濃度を、ＮａｎｏＤｒｏｐ１０００分光光度計（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃＷａｌｔｈａｍ、ＭＡ、米国）によって測定した。

％で表したＲＮＡオリゴの３’または５’末端へのビオチン標識化の効率を、出発材料の質量（ｍ／ｚ）および標識化された生成物の質量（ｍ／ｚ）でのピーク強度の算出に基づいて、Ｖｏｙａｇｅｒ−ＤＥＢｉｏｓｐｅｃｔｒｏｍｅｔｒｙＷｏｒｋｓｔａｔｉｏｎ（ＪｅｔＰｒｏｐｕｌｓｉｏｎＬａｂｏｒａｔｏｒｙ、米国）によるマトリックス支援レーザー脱離イオン化飛行時間質量分析（ＭＡＬＤＩ−ＴＯＦＭＳ）によって測定した。

５’末端標識化法
ＲＮＡの５’末端へのビオチンの標識化には、２つのステップが必要である：Ｔ４ポリヌクレオチドキナーゼ（ＮＥＢ、米国）により、ＡＴＰγＳから標的ＲＮＡの５’ヒドロキシル基にチオホスフェートを移す；ビオチンマレイミドの添加後、チオール反応性標識を、標的ＲＮＡの５’末端に化学的にカップリングする。実験プロトコールは、以下の通りである。反応液の総量を、ヌクレアーゼ非含有脱イオン水を用いて１０μＬにしながら、以下のもの：１０ｘ反応緩衝液、３０μＭのＲＮＡ（それぞれ、１９ｎｔ、２０ｎｔ、または２１ｎｔ）、０．１ｍＭのＡＴＰγＳ、１０ユニットのＴ４ポリヌクレオチドキナーゼを、ＲＮａｓｅを含まない、薄壁の０．５ｍＬＰＣＲチューブ中で混合した。この試料を混合し、３７℃で３０分間インキュベートした。次いで、５μＬのビオチンマレイミドまたはＣｙ３マレイミド（３１２μＬの無水ＤＭＦ（無水ジメチルスルホキシド、９９．９％、Ｓｉｇｍａ−Ａｌｄｒｉｃｈ、米国）に溶解）を添加し、混合し、試料を６５℃で３０分間インキュベートした。上記手順によると、同様にカラム精製が必要であった。

酸加水分解による分解
直接ＲＮＡ配列決定は、分解性生成物の生成を利用し、単一の切断事象によって産生されるＲＮＡ断片を、化合物質量間の質量差の観察によって直接配列決定することができる。酸加水分解は、任意の出発材料からの複数の切断事象によって内部断片を迅速に生成することができ、したがって、特に、ギ酸は沸点が低く、したがって、凍結乾燥によって容易に除去することができるため、それはＭＳにおいて広く使用されている弱く揮発性の有機酸である。ＲＮＡ試料は、ある時点でビオチン化されるか、またはそれぞれのＲＮＡ試料溶液を３つのより小さいものに等しく分割する。１つは２分間、１つは５分間、および１つは１５分間、４０℃の５０％（ｖ／ｖ）ギ酸を使用する酸分解によってアリコートを分解した後、それらを１回のＬＣ／ＭＳ測定のために全て一緒に混合する。反応混合物を、ドライアイス上ですぐに凍結した後、乾燥するまで凍結乾燥し、典型的には、１ｈ以内に完了させた。その後のビオチン／ストレプトアビジン捕捉／放出ステップのために、乾燥した試料を、２０μＬのヌクレアーゼ非含有脱イオン水中にすぐに懸濁したか、または−２０℃で保存した。

ＬＣ−ＭＳ配列決定ラダーを生成するためのビオチン／ストレプトアビジン捕捉／放出ステップ
ビオチン／ストレプトアビジン捕捉は、ストレプトアビジンで被覆された磁気ビーズを使用して、ビオチン標識ＲＮＡに結合させるが、それらはストレプトアビジンで被覆された磁気ビーズ上に固定され、磁石に引き寄せられる。したがって、結合したＲＮＡを、非ビオチン標識ＲＮＡおよび不純物から単離するべきであり、後にＬＣ−ＭＳ配列決定分析のためにビーズから溶出させることができる。

等量の１ｘＢ＆Ｗ緩衝液を最初に添加することによって、２００μＬのＤｙｎａｂｅａｄｓ（商標）ＭｙＯｎｅ（商標）ストレプトアビジンＣ１ビーズ（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、米国）を調製した。この溶液をボルテックスし、２分間磁石上に置いた後、上清を廃棄した。ビーズを、２００μＬの溶液Ａ（ＤＥＰＣ処理された０．１ＭのＮａＯＨおよびＤＥＰＣ処理された０．０５ＭのＮａＣｌ）で２回、溶液Ｂ（ＤＥＰＣ処理された０．１ＭＮａＣｌ）中で１回洗浄した。最後に１００μＬの２ｘＢ＆Ｗ緩衝液を添加して、ビーズの濃度を２０ｍｇ／ｍＬにした。等量のビオチン化ＲＮＡを１ｘＢ＆Ｗ緩衝液中に添加し、穏やかに回転させながら室温で１５分間試料をインキュベートし、チューブを磁石中に２分間入れ、上清を廃棄した。被覆されたビーズを、１ｘＢ＆Ｗ緩衝液中で３回洗浄し、それぞれの洗浄ステップの上清の最終濃度を、回収分析のためにＮａｎｏｄｒｏｐによって測定した。固定されたビオチン化ＲＮＡを放出させるために、ビーズを、９５％ホルムアミド（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、米国）を含む１０ｍＭＥＤＴＡ（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、米国）、ｐＨ８．２中、６５℃で５分間インキュベートした。最後に、この試料チューブを、磁石中に２分間入れ、本発明者らは、ピペッティングにより上清を収集する。

ＬＣ−ＭＳ分析
ＭｉｃｒｏＡＳオートサンプラーおよびＳｕｒｖｅｙｏｒＭＳＰｕｍｐＰｌｕｓＨＰＬＣシステムを装備したＡｇｉｌｅｎｔ１２９０ＩｎｆｉｎｉｔｙＬＣシステム（ＡｇｉｌｅｎｔＴｅｃｈｎｏｌｏｇｉｅｓ、ＳａｎｔａＣｌａｒａ、ＣＡ、米国）に連結されたｉＦｕｎｎｅｌＡｇｉｌｅｎｔ６５５０Ｑ−ＴＯＦ上で、試料を分離および分析した。全ての分離を、１．７μｍの粒径を有する５０ｍｍｘ２．１ｍｍＸｂｒｉｄｇｅＣ１８カラム（Ｗａｔｅｒｓ、Ｍｉｌｆｏｒｄ、ＭＡ、米国）をわたる、１０ｍＭジイソプロピルアミン（ＤＩＰＡ）（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、米国）、ｐＨ７．０を含む２５ｍＭヘキサフルオロ−２−プロパノール（ＨＦＩＰ）（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、米国）としての水性移動相（Ａ）およびメタノールとしての有機移動相（Ｂ）を使用して実施した。流量は０．３ｍＬ／分であり、全ての分離を、６０℃に維持したカラム温度を用いて実施した。注入体積は２０μＬであり、試料の量は１５〜４００ｐｍｏｌのＲＮＡであった。データを、負の極性で記録した。試料データを、ＡｇｉｌｅｎｔＴｅｃｈｎｏｌｏｇｉｅｓＭａｓｓＨｕｎｔｅｒＬＣ／ＭＳＡｃｑｕｉｓｉｔｉｏｎソフトウェアを使用して獲得した。ＬＣ−ＭＳ実験から関連するスペクトルおよびクロマトグラフィー情報を抽出するために、ＭａｓｓＨｕｎｔｅｒＱｕａｌｉｔａｔｉｖｅＡｎａｌｙｓｉｓ（ＡｇｉｌｅｎｔＴｅｃｈｎｏｌｏｇｉｅｓ）中のＭｏｌｅｃｕｌａｒＦｅａｔｕｒｅＥｘｔｒａｃｔｉｏｎワークフローを使用した。この分子特性抽出アルゴリズムは、質量および保持時間の次元で非標的特性の発見を実行する。原理的には、化合物を同定することができる任意のソフトウェアを使用することができる。ソフトウェアの設定は、実験で使用されたＲＮＡの量に応じて変化した。一般に、できるだけ多くの同定された化合物が含まれていた。プロファイルのスペクトルピークを、低濃度の試料については、５のシグナル対ノイズ比（ＳＮＲ）閾値、より濃縮された試料については、最大で２０のＳＮＲ閾値を使用してフィルタリングした。他のアルゴリズム設定は、以下の通りであった：「低分子（クロマトグラフィー）」抽出アルゴリズム、電荷状態−１〜−１５、水素（−Ｈ）イオンのみ損失、「一般有機分子」アイソトープモデル、最小品質スコア７０（０〜１００の範囲）、および最小イオン計数５００。
結果
ＲＮＡ断片の２つのラダーの物理的分離に基づくＲＮＡ分子の配列を決定するための方法が提供される。この方法は、２つのラダーの物理的分離によって、どの断片がどのラダーに属するかに関していかなる混同も防止するように設計され、出力物は、第１世代の方法における２つのＳ字形曲線（分析がはるかにより難しい）よりもむしろ、ただ１つのＳ字形曲線を含有すると予想される。２つのラダーの逐次的分離の別の利益は、ラダー分離後、それぞれの得られたＬＣ／ＭＳデータセットサイズが分離されていない前駆体のデータセットのサイズの半分未満になるため、塩基コール手順の単純化である。これらの２つの好ましい因子の助力を得て、当業者であれば、１つより多い鎖を含むより複雑なＲＮＡ試料を、その関連する改変を同時に分析しながら、配列決定することができる。実験を、図１に示されるように設計して、所望の断片を、５’または３’ラダープールのいずれかに物理的に分離した。ビオチンタグを、２ステップ反応によって、ＲＮＡ試料のそれぞれの末端に付加した：（ｉ）Ｔ４ポリヌクレオチドキナーゼと、アデノシン５’−［γ−チオ］三リン酸（ＡＴＰ−γ−Ｓ）とを反応させて、配列決定しようとするＲＮＡの５’ヒドロキシル基にチオホスフェートを付加することによる、チオール含有ホスフェートの５’末端への導入、次いで、（ｉｉ）得られたチオールリン酸化されたＲＮＡと、１つまたは複数のチオール基を含有するタンパク質、核酸、または他の分子をビオチン化するために設計される、ビオチン（ＬｏｎｇＡｒｍ）マレイミド（ＶｅｃｔｏｒＬａｂｏｒａｔｏｒｉｅｓ、米国）との間でのコンジュゲーション付加。次いで、得られた５’ビオチン化ＲＮＡを、以前の手順（６）と同様、ギ酸で処理する。酸分解の後、ストレプトアビジン結合ビーズ（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、米国）を使用して、ビオチン−ストレプトアビジン相互作用を破壊した後、その後のＬＣ／ＭＳ分析のために放出されるであろう、５’ラダープールを選抜する。

５’ラダープール（ＬＣ／ＭＳによって分析される）を単離した後、元の３’−ヒドロキシル基の全てと共に３’ラダープールを含有する、残りの残留物を、３’末端標識化にかける。この目的のために、ビオチン化シチジンビスリン酸（ｐＣｐ−ビオチン）を、ＡＴＰおよびＭｔｈＲＮＡリガーゼを使用するアデニル化によって活性化して、ＡｐｐＣｐ−ビオチンを産生する。次いで、遊離３’末端ヒドロキシルを含む３’ラダープールのメンバーを、Ｔ４ＲＮＡリガーゼによって活性化された５’−ビオチン化ＡｐｐＣｐにライゲーションし、したがって、３’ラダープール中の各配列の３’末端がビオチン標識化されるようになる。同様に、ストレプトアビジン結合ビーズを使用して、ビオチン−ストレプトアビジン相互作用を破壊した後にその後のＬＣ／ＭＳ分析のために放出させることができる、３’ラダープールを単離する（５’ラダープールから分離する）。

一連の合成ＲＮＡオリゴ（１９ｎｔ、２０ｎｔ、および２１ｎｔのＲＮＡ；配列に関する方法を参照されたい）を設計し、個別試験および群試験のためのモデルＲＮＡオリゴヌクレオチドとして合成した。ビオチン標識化された５’末端を、上記の２ステップ反応を使用して取得した。ＬＣ／ＭＳ分析のための５’ラダープールの酸分解およびビーズ分離の後、残りの残留物を、３’標識化にかけた。次いで、３’配列ラダーのメンバーも、ビオチン末端標識化し、ストレプトアビジン捕捉した後、上記のＬＣ／ＭＳ分析のために放出させた。

ｔＲＮＡはタンパク質合成において非常に重要であり、その発現および変異は神経病理およびがん発症などの様々な疾患に大きく影響するため（７〜１０）、実験はｔＲＮＡ配列決定を重視して実施した。しかしながら、効率的なｔＲＮＡ配列決定方法の欠如は、生物学的および生化学的プロセスにおけるｔＲＮＡの構造および機能研究を妨げてきた。ｔＲＮＡは、標準的な配列決定方法をまだ効率的に適用することができない小さい細胞ＲＮＡの１つのクラスである（１１）；ｔＲＮＡの配列決定に関する大きな障害物は、ｃＤＮＡ合成およびアダプターライゲーションを阻害し得る、いくつかの転写後改変の存在およびその安定かつ広範な二次構造を含む。しかしながら、ｔＲＮＡの長さは６０〜９５ｎｔの範囲であり、平均の長さは７６ｎｔであるため、それは、本明細書に開示されるＬＣ／ＭＳに基づく直接配列決定において使用するための非常に良好なシステムである。

ＬＣ／ＭＳに基づく方法を用いてｔＲＮＡを直接配列決定するために、配列決定の成功のためにＴ_１リボヌクレアーゼを使用して、完全なｔＲＮＡをより小さい断片に部分消化した。グアノシン残基の後ろの一本鎖ＲＮＡホスホジエステル結合を特異的に切断し、３’−リン酸化された末端を産生する部分Ｔ_１リボヌクレアーゼ消化（図２）を、フェニルアラニン特異的ｔＲＮＡを４〜１０℃で３０〜６０分間インキュベートして、３つの部分の重複断片：５’と３’末端の両方にリン酸基を含有する配列によって特徴付けられる５’部分（５’−ＰＯ_４＿３’ＰＯ_４）、５’末端にヒドロキシル基および３’末端にリン酸基を含有する配列によって特徴付けられる内部部分（５’−ＯＨ＿３’ＰＯ_４）、ならびに５’と３’位置の両方にヒドロキシル基を含有する配列によって特徴付けられる３’部分（５’−ＯＨ＿３’ＯＨ）を得ることによって実施する（図３）。ｔＲＮＡのクローバー葉二次構造は、酵素に切断を作らせるための露出したグアノシン残基に富む領域を提供することによって、この消化ステップを容易にする。

３’および５’末端のそれぞれにＯＨ基を有する３’ｔＲＮＡ部分を、Ｔ_４ＲＮＡリガーゼおよび基質としての５’−アデニル化ビオチン−メチル−ｄｄＣを使用して標識化する。ストレプトアビジン磁気ビーズを使用して、ビオチン化ｔＲＮＡ断片を単離し、その断片に対して酸分解を行って、ＬＣ／ＭＳを使用する配列決定分析のための３’ラダーを作出する（図４）。上記の３’−ｔＲＮＡ部分の単離後に５’−ＯＨを有する唯一の配列である、ｔＲＮＡの内部部分（図５）について、Ｔ４ポリヌクレオチドキナーゼによってチオホスフェートを５’ヒドロキシル基に導入した後、ビオチンマレイミドの、ＲＮＡオリゴの５’末端への化学的カップリング反応により開始させた２ステップ反応によって、５’標識化を実施する。ストレプトアビジン磁気ビーズを使用する単離ステップを再度使用して、酸分解の前に内部部分を選抜する。酸分解およびＬＣ／ＭＳの後、これらの内部部分のラダー断片の配列を、配列生成およびアラインメントによって取得することができる。次に、ｔＲＮＡ断片の５’部分（図６）で、５’ホスファターゼは５’リン酸基を除去し、アルカリホスファターゼによってそれをヒドロキシル基に変化させ、５’末端を、上記の５’末端標識化法を使用して標識化することができる。単離および酸分解ステップの後、ＬＣ／ＭＳを使用して、ｔＲＮＡ断片の５’部分のためのラダーを取得する。

短いオリゴヌクレオチドに由来するＬＣ／ＭＳデータにより、その質量を保持時間（ｔ_Ｒ）に対してプロットした場合に予想されるように、それぞれの特定のラダーに対応する正確に１つのＳ字形曲線を観察することができることが示された（図７）。５’−ビオチン化ＲＮＡおよび非ビオチン化ＲＮＡからなる混合物中に複数のＲＮＡが存在する場合であっても、３つの異なる別々のＳ字形曲線が観察され、その配列読み取りが容易になる（図８）。

ビオチン末端標識化効率
標識化効率を決定するために、ＭＡＬＤＩ−ＴＯＦＭＳを適用して、それぞれ、ＲＮＡの３’および５’末端でのビオチン化の効率を見積もった（図９および図１０、代表データとして２１ｎｔのＲＮＡ）。標識化反応の効率は、実験セクションに記載のように使用される条件下で、出発材料の質量（ｍ／ｚ）および標識化された生成物の質量（ｍ／ｚ）のピーク強度の算出に基づいて、３’末端および５’末端について、それぞれ４４％および９１％であると見積もられた。ビオチン標識化された材料は、ＬＣ／ＭＳによる直接配列決定のための質量ラダーを生成するための酸分解およびビオチン／ストレプトアビジン捕捉／放出のためにすぐに使用できる。

配列ラダーのクロマトグラフィー分離は、同じ配向の読み取りデータの同定を単純化した。配列決定読み取りデータを、その質量、ＲＴ、および存在量によって定義した。ヌクレオチド（Ａ、Ｇ、Ｕ、Ｃ）を、２つの隣接するラダー断片の質量差によって決定した。したがって、配列を、非常に容易に読み取ることができる。例えば、配列ＣＧＧＡＵＵＵＡＧＣＵＣＡＧＵを、５’末端ビオチン標識化された２１ｎｔのＲＮＡについて５’から３’末端に向かって自動的に読み取ることができる（図１１）。部分非標識ＲＮＡに由来するラダーと一緒に、２１ヌクレオチドの完全な配列を読み取ることができる。ビオチン／ストレプトアビジン捕捉／放出ステップなどの実験条件の最適化を含む、標識ＲＮＡのラダーについてのみ、完全な配列を読み取るためのさらなる努力が為されてきた。

図１２は、それぞれ、ビオチン標識をＲＮＡの３’末端に、疎水性Ｃｙ３タグを５’末端に導入した後、酸分解を行って、ＬＣ−ＭＳによる直接配列決定のための質量ラダーを生成することによるビーズ補助物理的分離を用いないワークフローを実証する。

本明細書に記載される配列決定方法は、他のものからの物理的分離の後にＬＣ／ＭＳデータ分析を単純化し、それぞれのラダー（５’ラダーまたは３’ラダーのいずれか）から配列を読み取るのに役立ち得る、それぞれ、ビオチン標識断片を２つの末端から単離するその能力によるＲＮＡ配列分析のための手段を提供する。この戦略により、当業者であれば、１つより多いＲＮＡ鎖ならびにｔＲＮＡを含むより複雑なＲＮＡ試料を配列決定し、続いて、その関連する改変を同時に分析することができる。

（７．実施例）
ＲＮＡ標識化効率の増強。ビオチンまたは蛍光色素のようなタグを、高収率でＲＮＡ上に導入することはいまだ課題である。しかしながら、選択されたタグによるＲＮＡの２つの末端の標識化は、本明細書に開示される直接ＲＮＡ配列決定方法のステップである。標識化効率は、試料要件の低減をもたらすより高い標識化効率で、ＭＳシグナルを生成するために、どれぐらい多くのＲＮＡ試料を使用することができるかと直接関連する。標識化効率を増大させるために、新しい標識化戦略を最適化し続けた。２ステップ反応を用いてＲＮＡの５’末端を標識化した場合、高い標識化効率（約９０％）が最近観察された（図１４Ａ）。最適化された反応条件としては、（ｉ）水溶解度を増大させるためにＣｙ３をスルホ−Ｃｙ３で置き換えること、（ｉｉ）溶液のｐＨを７．５に調整すること、および（ｉｉｉ）一定の撹拌を維持しながら、反応時間を長くすることが挙げられる。ＲＮＡの５’末端での標識化効率を改善する努力が続いているが、公開された方法（Cole K (2004) Nucleic Acids Res 32(11):e86-e86.1）によれば３’末端標識化についても同様の高収率を観察することが予想される。この高い効率を達成するために、アデニル化ステップの除去を可能にするであろう、ビオチン化ｐＣｐの活性型であるＡ（５’）ｐｐ（５’）Ｃｐ−ＴＥＧ−ビオチン−３’（図１４Ｂ）を化学的に合成した。当業者であれば、そのような戦略の使用により、両方の末端で標識化効率をほぼ定量的な収率に有意に改善することができる。

配列決定読み取りデータ長の増強。読み取りデータ長を増大させるために、ＡｇｉｌｅｎｔＭａｓｓＨｕｎｔｅｒＱｕａｌｉｔａｔｉｖｅＡｎａｌｙｓｉｓに関する分子特性抽出（ＭＦＥ）設定を最適化した。ＡｇｉｌｅｎｔソフトウェアからエクスポートされたＭＦＥデータから、配列決定アルゴリズムを使用して３０ｎｔまでのより長いＲＮＡを自動的に読み取ることが可能であり、約２０ｎｔのＲＮＡと比較して、読み取りデータ長の有意な増大が得られた。また、利用可能なソフトウェアに関して、分子のサイズに応じて、２つのモード：（ｉ）現在利用可能なＲＮＡ試料によって判断される、約３０ｎｔまたは約１０，０００Ｄａでのみ動作する、同定のためのモノアイソトピック質量の正確な決定に依存する低分子モード；および（ｉｉ）約３０ｎｔよりも大きい分子についてのみ動作する、同定のための平均質量の正確な決定を要する高分子モードの同定が存在することも発見された。

５種および１２種のＲＮＡの複数のＲＮＡ鎖配列決定に対する配列決定スループットの増強。ＬＣ／ＭＳに基づく方法は、精製された一本鎖ＲＮＡの配列決定だけでなく、複数のＲＮＡ鎖を含むＲＮＡ試料も配列決定することができることが実証されている。本明細書に記載の新規試料調製プロトコールおよびビーズ分離を用いて、１つは１９ｎｔ、１つは２０ｎｔの２つの異なるＲＮＡを同時に読み取ることができる。５種および１２種のＲＮＡを含有する混合物を含有する試料を試験した。上記の標識化効率および読み取りデータ長の改善に関して、これらの混合物中の全てのＲＮＡの完全な配列を読み取るのに必要とされる全てのラダー断片を検出することが可能であった。これは、（ｉ）Ａｇｉｌｅｎｔ６５５０イオンファネルＱ−ＴＯＦＬＣ／ＭＳ上で測定値を取得すること、および（ｉｉ）ＡｇｉｌｅｎｔＭａｓｓＨｕｎｔｅｒＱｕａｌｉｔａｔｉｖｅＡｎａｌｙｓｉｓに関するＭＦＥ設定を最適化することによって達成された。３０ｎｔのＲＮＡ（図１５Ｂ）を含む５種および１２種のＲＮＡ混合物（図１５Ａ〜Ｂ）中の配列を手動で読み取ることができた。これらの結果は、本明細書に記載の直接ＲＮＡ法が、多数のＲＮＡを含む複雑なＲＮＡ試料を配列決定し、様々な生体ＲＮＡ試料を取り扱うのに必要される必須のスループットをもたらすことができることを実証している。

（８．実施例）
複数のＲＮＡ鎖を含む混合ＲＮＡ試料の配列決定を可能にするＭＳに基づく配列決定方法のスループットおよび堅牢性を増大させるために、本明細書に記載のように、概念実証研究としてカノニカルな塩基と改変塩基との両方を含有する様々な長さの一連の合成ＲＮＡオリゴヌクレオチド上で新しい戦略の有効性を試験しながら、配列決定にとって必要とされるラダーを同定するために実験ワークフローを最適化し、２ＤＬＣ／ＭＳデータ分析を有意に単純化するための新しい戦略が開発された。単一塩基分解能で同時にシュードウリジン（Ψ）および５−メチルシトシン（ｍ^５Ｃ）を配列決定することができた。記載の末端標識化戦略と一緒に、単一の精製されたＲＮＡ鎖だけでなく、１２種の異なるＲＮＡ配列を含有する試料混合物中でも完全なＲＮＡを正確に配列決定しながら、これらの複数の塩基改変を同定し、位置決定し、定量することができた。

結果
質量分析のための標識ＲＮＡ分解断片の生成
本明細書に記載の実験手法では、いずれか一方のＲＮＡ末端を標識化し、他方の末端は非標識のままにしたか、またはＲＮＡの２つの末端を異なるタグで標識化して、２ＤＬＣ／ＭＳ法においてそれらをより良好に識別した。１つの標識化戦略では、ＬＣ／ＭＳ分析の前にＲＮＡの３’末端または５’末端のいずれかにビオチンタグを導入して、正確に１つの質量ラダーにＲＴおよび質量シフトを導入した（１４）。この方法は、ＬＣ／ＭＳデータ分析を単純化し、混合ＲＮＡ試料を配列決定する場合にどの断片がどのラダーに属するかに関する混同を防止するのに役立ち得る。それは、末端塩基を同定し、複数に切断された内部断片からモノヌクレオチドおよびジヌクレオチドを区別するのが難しい場合に厄介な低質量領域を回避することができるように、ＲＮＡラダーの質量を増加させる；対形成した末端の読み取りデータを必要とするよりもむしろ、１つの単一のラダーから完全な配列を読み取ることによって配列決定の精度を改善する；選択的ＲＴシフトのため、ラダー成分の同定を容易にする塩基コール手順を単純化する；および以前に報告されたもの（５分）よりも長い分解時点（１５分）を可能にすることによって試料効率を改善する（１４）。これらの改善は、第１世代の方法と比較して、最小ＲＮＡ試料負荷要件を低減するのに役立ち、稀なＲＮＡ改変を含む内因性ＲＮＡ試料を配列決定する可能性を増大させ得る。

その３’末端でＲＮＡを標識化するために（図１６Ａ）、ビオチン化シチジンビスリン酸（ｐＣｐ−ビオチン）を、ＡＴＰおよびＭｔｈＲＮＡリガーゼを使用するアデニル化によって活性化して、ＡｐｐＣｐ−ビオチンを産生した。次いで、遊離３’末端ヒドロキシルを含む３’ラダープールのメンバーを、Ｔ４ＲＮＡリガーゼによって、活性化されたＡｐｐＣｐ−ビオチンにライゲーションした。ストレプトアビジン結合ビーズを使用して、３’−ビオチン標識化されたＲＮＡを単離し、ビオチン−ストレプトアビジン相互作用を破壊した後、これを酸分解およびその後のＬＣ／ＭＳ分析のために放出させた。また、これを、５’末端標識化についても同様に実施した（図２４〜２５）。

試験例として、短いＲＮＡオリゴヌクレオチド（１９ｎｔおよび２０ｎｔのＲＮＡ：それぞれ、ＲＮＡ＃１およびＲＮＡ＃２）を設計し、個別試験および群試験のためのモデルＲＮＡオリゴヌクレオチドとして合成した。第１に、ＲＮＡ＃１を３’−ビオチン標識化し、それをストレプトアビジンビーズ捕捉および放出による物理的分離にかけた。図１６Ｂでは、ＲＮＡ＃１の非標識５’ラダーからの３’−ビオチン標識質量ラダーのＲＴシフトを使用するその後の分離は、どの断片がどのラダーに属するかに関する混合を回避し、出力物中の単離された曲線は、第１世代の方法の２つの隣接する曲線よりも分析するのがはるかに単純である。改変バージョンの公開されたアルゴリズム（１４）により、ｄｅｎｏｖｏでの配列決定プロセスを実施した。このアルゴリズムは、化合物強度を増大させるために質量付加物の階層的クラスタリングを使用する。その積分した強度が主要ピークのものと組み合わされるように、同時に溶出する中性の付加物および電荷を担持する付加物を再帰的にクラスター化した。これは、ラダー断片化合物の強度を増加させ、配列決定読み取りデータを生成するのに重要な領域のデータの複雑性を低減させた。

図１６Ｂでは、ビオチン標識はＲＴの増加を引き起こし、ＲＮＡ＃１の完全な配列を上の青色の曲線のみから読み取ることができるため、３’ラダー曲線はシフトアップする（ｙ軸に関して）。同様に、完全なＲＮＡ＃１の逆配列を、最初のヌクレオチドを除いて、非標識５’ラダー曲線（ＲＴのシフトを有しない）から直接読み取ることができる。この戦略がなければ、以前に報告されたように（１４）、完全な配列を読み取るためには、末端対形成が必要である。この進歩があれば、それぞれのＲＮＡを１つの曲線から完全に読み取ることができ、５’ビオチン標識でそれぞれ標識化された複数のＲＮＡを含有する混合試料を配列決定することができる（図１６Ｃ）。それぞれの試料に関する３’および５’ラダーの分離は、得られたＬＣ／ＭＳデータの複雑性を有意に低減させ、したがって、配列決定にとって必要とされるラダー成分の完全なセットを発見することが以前の方法（１４）よりもはるかに容易になり、したがって、塩基コール手順の複雑性を低減させる。

この末端標識化のため、１つが１９ｎｔ（ＲＮＡ＃１）であり、１つが２０ｎｔ（ＲＮＡ＃２）である２つのＲＮＡの混合物中の両方の完全な配列を、ＲＮＡ鎖あたり正確に１つの曲線から読み取ることができる。この試料の場合、配列決定にとって必要とされる質量ラダー成分の完全なセットを発見するためにデータをさらに単純化するために、重要な質量付加物クラスタリングを実行するアルゴリズムを使用した。単純化された２Ｄ質量−ＲＴプロットにおける全ての質量ラダー成分からなるＳ字形曲線から（図１６Ｃ）、試料ＲＮＡ鎖の配列を、単に２つの隣接するラダー成分の質量差を算出することによって手動で決定することができる（図１６Ｄ）。試料は全て合成試料であり、目的の試料を他のＲＮＡ鎖から物理的に分離するためにビオチン−ストレプトアビジン結合−切断を使用することは必要ではなかったが（ビオチン標識化と関連するＲＴシフトを実際に必要としたものだけ）、ビオチン標識の組込みはまた、現実の生体試料を配列決定するのに有用であり得る特定の試料の物理的分離の可能性も提供する。

末端標識化によって得られた観測ＲＴシフトをさらに増加させるために、ＲＮＡ試料を、疎水性シアニン３（Ｃｙ３）またはシアニン５（Ｃｙ５）などの他の嵩高い部分で標識化して、そのＲＴ差を拡大することができる。配列決定しようとする元のＲＮＡ鎖の５’末端に、嵩高く、ビオチンよりも大きいＲＴシフトを引き起こし得る（１４）、Ｃｙ３などの異なるタグを導入した；以前に記載されたように、ＲＮＡの３’末端にビオチン部分を導入した。これらの末端標識は、配列決定のために２つのラダー曲線を区別するように全ての５’および３’ラダー断片のＲＴに体系的に影響するはずであり、これをｉｎｓｉｌｉｃｏでの研究によって確認した（図２２Ａおよび図２２Ｂ）。図１７Ａに示されるように、Ｃｙ３タグを、ＲＮＡ試料の５’末端に２ステップ反応によって付加した。５’−ビオチン化法と同様、第１のステップでのチオリン酸化の後、Ｃｙ３マレイミドをＲＮＡにコンジュゲートした。二重の末端標識化されたＲＮＡの酸分解の後、得られた断片を、親和性に基づく物理的分離なしにＬＣ／ＭＳに直接かけた。予備データにより、質量−ＲＴ２Ｄグラフにおいて、疎水性タグが多いほど、大きいＲＴシフトを惹起するため、５’Ｃｙ３標識化されたラダー断片が５’ビオチン標識化されたラダーからさらに離れて曲線を形成する（図１７Ｂ）ことが示された。事実、Ｃｙ３標識化された５’ラダーのＲＴ傾向は、質量−ＲＴプロットにおけるように方向を変え、配列曲線は、質量の増加と共にＲＴが上がるビオチン標識化された３’ラダーと比較して（また、全ての以前のビオチン標識化された、および非改変の質量ラダー試料においても観察されるように）、Ｃｙ３部分の疎水性のため、質量の増加と共にＲＴが下がる。これは、２−Ｄ分析の間により分離可能／識別可能である２つの曲線をもたらし、物理的分離を用いなくてもラダーの配列を塩基コールを行うのをより容易にする。二方向配列決定を用いて、方法の読み取りデータ長を倍加し、３’ラダーと５’ラダーの両方から完全な配列を読み取ることによって、その精度を有意に改善することができる。

ＲＮＡ標識化効率
様々なＲＮＡ標識化法が報告されたにも関わらず、ビオチンまたは蛍光色素のようなタグを高収率でＲＮＡ上に導入することは依然として課題である。しかしながら、選択されたタグによるＲＮＡの２つの末端の標識化は、本明細書に開示される直接ＲＮＡ配列決定方法のステップである。標識化効率は、試料要件の低減をもたらすより高い標識化効率で、ＭＳシグナルを生成するために、どれぐらい多くのＲＮＡ試料を使用することができるかを直接もたらす。標識化効率を増大させるために、新しい標識化戦略が探索され、高い標識化効率が５’末端と３’末端の両方で実証された（図１８Ａ）。５’末端標識については、１）タグの水溶解度を増大させるためにＣｙ３の代わりにスルホ−Ｃｙ３（図１８Ｃ）を使用すること、２）溶液のｐＨを７．５に調整すること、および３）一定の撹拌を維持しながら、反応時間を長くすることを含む、改変された反応プロトコールを使用することによって、完全長ＲＮＡの標識化効率は、約６０％（図１７Ｂ）から約９０％（図１８Ａ）まで改善された。スルホ−Ｃｙ３標識化されたＲＮＡ＃１の酸分解の後でも、非標識断片は軽いフィルタリング後にプロット上に出現しないため、標識化されたラダー成分は、絶対的な強度に関して非標識ラダー成分の数を大きく上回ることが見られる（図２３）。３’末端でのより良好な標識化効率のために、アデニル化ステップを除去する、活性型のビオチン化ｐＣｐである、Ａ（５’）ｐｐ（５’）Ｃｐ−ＴＥＧ−ビオチン−３’（図１８Ｃ）を合成した（１５）。この方法を使用して２１ｎｔのＲＮＡ（ＲＮＡ＃１１）を標識化する場合、３’末端標識化に関する高収率（約９５％）が観察された（図１８Ｂ）。両方の最適化された末端標識化戦略を試料調製プロトコールに組み込むことにより、最少試料負荷量の要件は、ここで全体の配列決定ワークフローにとってはそれほどの障害ではない。

シュードウリジン（Ψ）のＬＣ／ＭＳ配列決定
次いで、新しい末端標識化ＬＣ／ＭＳ配列決定戦略を、改変核酸塩基を含有する合成試料に適用した。シュードウリジン（Ψ）は、ＲＮＡ中に見出される全ての改変ヌクレオチドのうちで最も豊富であり、普及している。それは、あらゆる種およびコードＲＮＡ（ｍＲＮＡ）と非コードＲＮＡとの両方を含む、多くの異なる型のＲＮＡに存在する（１６）。しかしながら、ΨとＵとをＭＳによって直接識別することは、それらが同一の質量を有するため、不可能である。ＣＭＣ−Ψ付加物を形成させるためのＮ−シクロヘキシル−Ｎ’−（２−モルホリノエチル）−カルボジイミドメト−ｐ−トルエンスルホネート（ＣＭＣ）を用いた求核付加を利用する、確立された化学標識手法が、ΨとＵとを識別するために以前に開発された（１７）。ＣＭＣ−Ψ付加物は、逆転写を失速させ、ｃＤＮＡを、３’末端に向かって１ヌクレオチド下流で終結させ、現在、単一塩基分解能で様々なＲＮＡ中のΨ部位を検出するために使用されている（１８）。ここで、同じ化学を適応させて、本発明者らのシステムにおいて同じＣＭＣ−Ψ付加物を形成させる（図１９Ａ）。付加物は、Ｕの質量よりも大きいユニークな質量２５２．２０７６ダルトンを有するだけでなく、Ｕよりも疎水性であり、ＲＴのシフトももたらす。したがって、ＣＭＣ−Ψ付加物は、任意のＲＮＡ鎖中のΨを同定し、位置を決定するのに役立つであろう、質量−ＲＴプロットにおいて、ＣＭＣ−Ψ付加物を含有する全てのラダー断片の質量とＲＴの両方を有意にシフトさせるであろう。

図２４Ａおよび図２４Ｂは、報告された条件（１８）を使用して２つのＲＮＡ中でΨをそのＣＭＣ付加物に変換する粗生成物のＨＰＬＣプロファイルを示す。これらの２つのＲＮＡは、それぞれ、１個のΨおよび２個のΨ部分を含有する（ＲＮＡ＃１２および＃１３）。ＵＶクロマトグラムに由来するピークを積分することによって算出されたΨの変換パーセンテージは、それぞれ、約４２％および約６４％であった。２個のΨヌクレオチドを含有するＲＮＡ鎖については、そのＣＭＣ変換は、完全（両方のΨヌクレオチドがΨ−ＣＭＣ付加物に変換された）または部分的（２個のΨヌクレオチドのうちの一方のみが変換された）であってもよい。したがって、図２４Ｂでは、約１６分のピークは、完全な変換を示したＲＮＡ鎖（約２４％）を指し、約１４分の２つの隣接するピークは、いずれかのΨの部分的変換を反映する（合計で約４０％）。

ギ酸による酸分解の後、ＲＮＡ＃１２および＃１３に自動化配列決定を適用した。単一のΨを含有するＲＮＡ（ＲＮＡ＃１２）の配列決定を表す２Ｄ質量−ＲＴプロット（図１９Ｂ）において、ＣＭＣ−Ψ付加物を含む断片は、その対応する未反応のものよりも２５２．２０７６ダルトン大きい質量および大きいＲＴを有するため、２−Ｄ質量−ＲＴプロットにおいて上方かつ右にシフトする、全てのＣＭＣ−Ψ付加物を含有するラダー断片を含む配列の部分に対応して、新しい曲線（赤色）が、Ψにおいて元のＳ字形曲線（灰色）から離れて上に分岐した。図１９Ｃは、二重のΨを含有するＲＮＡ（ＲＮＡ＃１３）の配列決定を表す２Ｄ質量−ＲＴプロットを示す。同様に、両方のΨがそのＣＭＣ−Ψ付加物に変換された配列の部分に対応して、１つの新しい曲線（赤色）が第２のΨで離れて分岐した。可視化を容易にするために、５’質量−ＲＴラダーの配列のみが提示される。２つのさらなる曲線（紫色および橙色）が、２個のΨヌクレオチドのうちの一方のみが変換されたことを示す、Ψヌクレオチドの２つの位置のそれぞれにおいて別々に元の非変換５’ラダー（灰色の曲線）から離れて上方に分岐した。そのため、Ψを含有するＲＮＡ中の塩基改変Ψを、その完全な配列を読み取りながら、同定し、位置を決定し、定量することができるだけでなく、質量ラダー強度プロファイルを組み込むさらなる計算をしながら、所与の試料中のＣＭＣ含有ＲＮＡの、非ＣＭＣ含有ＲＮＡに対するパーセンテージを直接定量することもできる。この戦略を他の配列にも適用すると、この方法により、当業者であれば、任意の質量が変更された改変を有するＲＮＡの、その対応する非改変対応物に対するパーセンテージを正確に決定することができる。この考えをΨに拡張すると、この方法により、当業者であれば、Ψを含むＣＭＣ化学の収率で因数分解できる場合、Ψ含有ＲＮＡの非Ψ含有ＲＮＡに対するパーセンテージを見積もることができる。

複数の改変を有するＲＮＡ混合物の配列決定
最後に、手持ちの末端標識化およびΨ塩基改変法を用いて、複数の改変を有するＲＮＡ鎖を含有する多重ＲＮＡ試料を配列決定（複数の異なるＲＮＡ配列を含有する混合試料の同時的配列決定）するために、方法のスループットを増大させることが次に求められた。１１種の非改変ＲＮＡと、１個のΨおよび１個のｍ^５Ｃを含有する１種の多重改変ＲＮＡとを含有する、異なる配列を有する１２種のＲＮＡを含有する試料混合物を、プロトコールにかけた。最初に、全てのＲＮＡ試料の３’末端をビオチンで化学的に標識化したが、５’末端にはスルホ−Ｃｙ３を付加した（塩基改変を含有するＲＮＡ鎖を除く）。ＬＣ／ＭＳによる測定後、ＭＦＥ設定が最適化されたＡｇｉｌｅｎｔＭａｓｓＨｕｎｔｅｒＱｕａｌｉｔａｔｉｖｅＡｎａｌｙｓｉｓソフトウェアを使用してデータを分析して、配列生成のためのデータを抽出した。上記の標識化効率の改善があれば、混合物中の全てのＲＮＡの完全な配列を正確に読み取るのに必要とされる全てのラダー断片を検出することができた。多重化された試料の分析では、典型的な塩基コールアルゴリズム（全ての以前の図面において使用されたもの）は使用しなかった。これらの配列を手動で塩基コールを行い、全ての配列を読み取ることができた（図２０Ａおよび図２０Ｂ）。その結果、一本鎖ＲＮＡ試料と混合ＲＮＡ試料との両方におけるその質量をマッピングすることによって、４つのカノニカルなヌクレオシド（Ａ、Ｃ、ＧおよびＵ）を配列決定することができるだけでなく、Ψおよびｍ^５Ｃなどの、単一塩基分解能で複数の改変塩基、または任意の他の改変塩基を再度同定し、位置を決定し、定量することもできることが示された。同様に、Ψを配列決定するために、ＲＮＡを前述のようにＣＭＣで処理し、したがって、新しい曲線は、Ψでその対応する非ＣＭＣ含有ラダー曲線から離れて分岐した（ピンク色）。これらの研究においては、自動化塩基コール適用の使用と反対に、配列を手動で読み取ったが、これらの研究は、システムの試料調製および質量分析の側面で実験的限界も物理的限界もないことを示している；ＬＣ／ＭＳから抽出されたＭＦＥファイルにより生成された質量−ＲＴプロットにより、混合物のそれぞれの成分の質量ラダーを、適切に生成し、正確に配列決定し、塩基コールを行うことができる。これらの結果は、本明細書に記載の直接ＲＮＡ法が、以前に公開（１４）されたような１個の非カノニカルな塩基を含有する精製された一本鎖ＲＮＡだけに限ったことではなく、改変塩基を含有する複数のＲＮＡを含むより複雑なＲＮＡ試料を配列決定することができることを示している。それは、様々な複雑な生体ＲＮＡ試料のＭＳ配列決定に関する大きな前進である。

内部断片の利用による試料使用の増加
以前のＭＳに基づくＲＮＡ配列決定方法は、複数に切断された断片の望ましくない出現（１４）とは反対に、配列決定のために単一の切断を含む明確に定義された質量ラダーを生成するための分解条件を制御した。そのため、５分のギ酸処理を実施して、約１０％の２０ｎｔ（ＲＮＡ＃３）試料を、その対応する５’および３’配列決定ラダーに消化して、１つより多い切断を含む内部ＲＮＡ断片の形成を最小化させた（１４）。したがって、出発材料の約９０％は、無傷のままであり、いかなる配列情報も得ることができなかった。存在量が少ない現実の生体試料については、試料の約９０％が配列決定のために使用できないという事実により、前記方法は、これらの低存在量の試料を正確に配列決定するのに十分なシグナルを生成することができない。使用可能な試料のパーセンテージを増大させるためには、より長い分解ステップが必要である。しかしながら、より長い化学的／酵素的分解ステップにおいて多くの所望のラダー断片を生成するプロセスは、所与の配列上の１つより多い切断部位のため、元のＲＮＡ配列に由来する５’または３’末端を有しない大量の内部断片の産生をもたらすであろう（これは確率的に制御されたプロセスである）。以前の方法（１４）は、内部断片は塩基配列の決定および改変分析において実際に使用されたＲＮＡラダーの一部ではなかったため、それらを単なる「ノイズ」として無視した。これらの内部断片には依然として固有の情報が存在するが、内部断片に由来する情報を効率的に利用することは、これらの配列が、特に、２０００ダルトン（Ｄａ）未満の質量を有するより低い質量領域中の断片については、所望のラダー化合物と混合されているため、困難である。この低い質量領域では、所与のＲＮＡ鎖の任意の部分に由来するモノマー、ダイマー、およびトリマーヌクレオチドを、ＬＣ／ＭＳのＬＣ段階で容易に分離することができず、正確な配列の同定および分析に困難をもたらす。しかしながら、酸分解の前に元の試料の二重末端標識化により内部断片から所望のラダー断片を分離すれば、以前には使用されなかった内部断片を実際に利用することが可能となる。６０分の分解ステップにかけられたＲＮＡ試料の２−Ｄ質量−ＲＴプロットの配列曲線において観察されたように１個より多い塩基が失われた報告された配列中にギャップがある場合（皮肉にも内部断片を生成する同じ長い酸分解ステップから生成される）、配列生成／アラインメントに対して１つより多い切断を有する内部断片から情報を収集し、適用することが提唱される。図２５に示されるように、３つの情報：（ａ）５’ラダー、（ｂ）３’ラダー、および（ｃ）両方の末端がない内部断片を組み合わせることにより、完全に除去することができる可能性がある長い分解時間によって引き起こされる質量−ＲＴラダーにおけるギャップ（割り当てることができない塩基）としてＲＮＡ配列決定の精度を有意に増大させることができる。

２Ｄ−質量−ＲＴ直接ＲＮＡ配列決定方法の開発は、ＭＳに基づくラダー化技術の力をＲＮＡに集め、ＲＮＡ改変研究の広い分野における長く続く満たされない必要性に対処する。それは、ｃＤＮＡ中間体の必要なしにＲＮＡ配列決定のための直接的な方法を提供するだけでなく、１回の単一の実験において複数のＲＮＡ鎖上の複数の塩基改変を配列決定するための一般的方法も提供する。開発された方法は、合成ＲＮＡ（約２０ヌクレオチド）の短い一本鎖を配列決定するのに成功したことが分かっている（図１７）。末端標識化があれば、以前のように完全な配列カバレッジのためにペアエンド配列決定を行う必要はもはやない；３’または５’末端のいずれかから所与のＲＮＡ鎖の完全な配列を読み取ることができるため、データ分析のスループットおよび容易性を向上させる。末端標識化を使用することにより、典型的には、未知の配列の混合ＲＮＡからなる細胞性ＲＮＡ試料のＭＳに基づく配列決定における重要な前進である、多重化されたＲＮＡ混合物を直接配列決定するための方法を拡張することができる（図２０）。さらに、シュードウリジンおよびｍ^５Ｃを含む、本研究における複数の改変塩基の配列決定方法の力により、当業者であれば、１２種のＲＮＡ鎖を含む混合試料中、単一塩基分解能でこれらのＲＮＡ改変のそれぞれを同定し、位置決定し、定量することができる。

したがって、本明細書に開示される配列決定方法は、例えば、ｔＲＮＡ、ｓｉＲＮＡ、薬学的特性を有する治療的合成オリゴリボヌクレオチド、ＲＮＡ分子の混合物などの、改変ＲＮＡ分子の効率的な配列決定、ならびにそのようなＲＮＡ分子の改変の検出を容易にすることができる。この手法は、内因性ｔＲＮＡおよびｍＲＮＡなどの、公知の化学的改変を有する細胞性ＲＮＡを配列決定するのに拡大して、読み取りデータ長における方法の有効性および広範な改変の同定をベンチマークすることができる。この直接ＭＳに基づくＲＮＡ配列決定方法は、他の確立された配列決定方法が現在では行うことができない、より多くの未知の改変と共に、その位置および存在量の情報の探索を容易にすると予想される。読み取りデータ長の継続的改善と共に、この直接配列決定戦略を、ｍＲＮＡおよび長い非コードＲＮＡなどの、より長いＲＮＡを配列決定し、ヌクレオチド改変の化学的正体および位置を指摘するために拡大することができる。

方法
化学的材料
以下のＲＮＡオリゴヌクレオチドは、ＩｎｔｅｇｒａｔｅｄＤＮＡＴｅｃｈｎｏｌｏｇｉｅｓから入手し、さらに精製することなく使用した（Ｃｏｒａｌｖｉｌｌｅ、ＩＡ、米国）。

ギ酸（９８〜１００％）は、Ｍｅｒｃｋ（Ｄａｒｍｓｔａｄｔ、Ｇｅｒｍａｎｙ）から購入した。ビオチン化シチジンビスリン酸（ｐＣｐ−ビオチン）、｛Ｐｈｏｓ（Ｈ）｝Ｃ｛ＢｉｏＢＢ｝は、ＴｒｉＬｉｎｋＢｉｏＴｅｃｈｎｏｌｏｇｉｅｓ（ＳａｎＤｉｅｇｏ、ＣＡ、米国）から得た。アデノシン−５’−５’−二リン酸−｛５’−（シチジン−２’−Ｏ−メチル−３’−リン酸−ＴＥＧ｝−ビオチン、Ａ（５’）ｐｐ（５’）Ｃｐ−ＴＥＧ−ビオチン−３’は、ＣｈｅｍＧｅｎｅｓ（Ｗｉｌｍｉｎｇｔｏｎ、ＭＡ、米国）によって合成した。Ｔ４ＤＮＡリガーゼ１、Ｔ４ＤＮＡリガーゼ緩衝液（１０ｘ）、反応緩衝液（１０ｘ）、１ｍＭＡＴＰ、およびＭｔｈＲＮＡリガーゼを含むアデニル化キットは、ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ（Ｉｐｓｗｉｃｈ、ＭＡ、米国）から得た。ＡＴＰγＳおよびＴ４ポリヌクレオチドキナーゼ（３’−ホスファターゼ非含有）は、Ｓｉｇｍａ−Ａｌｄｒｉｃｈ（Ｓｔ．Ｌｏｕｉｓ、Ｍｉｓｓｏｕｒｉ、米国）から得た。ビオチンマレイミドは、ＶｅｃｔｏｒＬａｂｏｒａｔｏｒｉｅｓ（Ｂｕｒｌｉｎｇａｍｅ、ＣＡ、米国）から購入した。シアニン３マレイミド（Ｃｙ３）およびスルホン化シアニン３マレイミド（スルホ−Ｃｙ３）は、Ｌｕｍｉｐｒｏｂｅ（ＨｕｎｔＶａｌｌｅｙ、Ｍａｒｙｌａｎｄ、米国）から得た。ストレプトアビジン磁気ビーズは、ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ（Ｗａｌｔｈａｍ、ＭＡ、米国）から得た。ＣＭＣ（Ｎ−シクロヘキシル−Ｎ’−（２−モルホリノエチル）−カルボジイミドメト−ｐ−トルエンスルホネート）、ビシン、尿素、ＥＤＴＡおよびＮａ_２ＣＯ_３緩衝液を含むシュードウリジンの変換に必要な化学物質は、Ｓｉｇｍａ−Ａｌｄｒｉｃｈ（Ｓｔ．Ｌｏｕｉｓ、ＭＯ、米国）から得た。

ワークフロー
（１）シュードウリジンの化学的変換を、シュードウリジンとウリジンとを区別するために適用した。（２）最適化された実験手順を用いて、ＲＮＡ鎖の一方または両方の末端に標識を付加した。（３）単一のＲＮＡ鎖またはＲＮＡ鎖の混合物を、理想的には、２’−ＯＨ支援酸加水分解メカニズムによる、それぞれのＲＮＡ鎖の全長にわたるその上のホスホジエステル結合の、無作為の配列状況非依存的な、単一切断によって、一連の短い、明確に定義された断片（配列ラダー）に分解した。（４）必要に応じて、ストレプトアビジン被覆磁気ビーズを使用して非標識ＲＮＡからビオチン化ＲＮＡを物理的に分離した。（５）次いで、消化された断片を、ＬＣ／ＭＳ分析にかけ、デコンボリューションされた質量およびＲＴを分析して、それぞれのラダー断片を同定した。（６）データプロセッシングおよび配列生成プロセスを自動化するアルゴリズムを適用した。

３’末端標識化法
２ステッププロトコールを使用する。（１）アデニル化：ＲＮａｓｅを含有しない薄壁の０．５ｍＬＰＣＲチューブ中、１０μＬの合計反応容量を用いて、以下の反応を設定した：１ｘアデニル化反応緩衝液（５’アデニル化キット）、１００μＭのＡＴＰ、５．０μＭのＭｔｈＲＮＡリガーゼ、１０．０μＭのｐＣｐ−ビオチン、およびヌクレアーゼ非含有脱イオン水（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、米国）。反応物を、ＧｅｎｅＡｍｐ（商標）ＰＣＲＳｙｓｔｅｍ９７００（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、米国）中、６５℃で１時間インキュベートした後、８５℃で５分間、ＭｔｈＲＮＡリガーゼ酵素を不活化した。（２）ライゲーション：３０μＬの反応溶液は、アデニル化ステップに由来する１０μＬの反応溶液、１ｘ反応緩衝液、５μＭの標的ＲＮＡ試料、１０％（ｖ／ｖ）のＤＭＳＯ（無水ジメチルスルホキシド、９９．９％、Ｓｉｇｍａ−Ａｌｄｒｉｃｈ、米国）、Ｔ４ＲＮＡリガーゼ（１０ユニット）、およびヌクレアーゼ非含有脱イオン水を含有していた。反応物を、１６℃で一晩インキュベートした後、カラム精製した。

１ステッププロトコールについて。Ａ（５’）ｐｐ（５’）Ｃｐ−ＴＥＧ−ビオチン−３’を適用して、標識化法を単純化しながら、アデニル化ステップを除去することによって標識化効率を改善した。ライゲーションステップを、１ｘ反応緩衝液、５μＭの標的ＲＮＡ試料、１０μＭのＡ（５’）ｐｐ（５’）Ｃｐ−ＴＥＧ−ビオチン−３’、１０％（ｖ／ｖ）ＤＭＳＯ、Ｔ４ＲＮＡリガーゼ（１０ユニット）、およびヌクレアーゼ非含有脱イオン水を含有する３０μＬの反応溶液によって達成した。反応物を、１６℃で一晩インキュベートした後、カラム精製した。ＯｌｉｇｏＣｌｅａｎ＆Ｃｏｎｃｅｎｔｒａｔｏｒ（ＺｙｍｏＲｅｓｅａｒｃｈ、Ｉｒｖｉｎｅ、ＣＡ、米国）を使用して、酵素、遊離ビオチン、および短いオリゴヌクレオチドを除去した。

５’末端標識化法
５’末端でのビオチン標識化は、２つのステップを要した。ヌクレアーゼ非含有脱イオン水で合計反応容量を１０μＬにした、１０ｘ反応緩衝液、９０μＭのＲＮＡ、１ｍＭのＡＴＰγＳ、および１０ユニットのＴ４ポリヌクレオチドキナーゼを含有するＲＮａｓｅを含まない、薄壁のＰＣＲチューブ（０．５ｍＬ）中、３７℃で３０分間にわたってインキュベーションを実行した。次いで、３１２μＬの無水ＤＭＦ（無水ジメチルスルホキシド、９９．９％、Ｓｉｇｍａ−Ａｌｄｒｉｃｈ、米国）に溶解した５μＬのビオチンマレイミドを添加し、ボルテックスによって混合し、６５℃で３０分間、試料をインキュベートした。ＯｌｉｇｏＣｌｅａｎ＆Ｃｏｎｃｅｎｔｒａｔｏｒを使用するカラム精製を、上記のように行った。

疎水性Ｃｙ３（シアニン３）またはＣｙ５（シアニン５）タグなどの異なるタグを、上記と同じ方法（ビオチンマレイミドのＣｙ３−マレイミドまたはスルホ−Ｃｙ３マレイミド置換えによることを除く）によって５’末端に導入して、そのラダーと、３’ビオチン化ラダーとを区別した。上記の２ステッププロトコールと比較して、反応条件の最適化を実施して、以下の様式で高い標識化効率を得た：１）５０：１の反応物のモル比（スルホ−Ｃｙ３の、ＲＮＡに対する）で高い水溶解度を得るために、スルホ−Ｃｙ３を使用した；２）反応溶液のｐＨを、Ｔｒｉｓ−ＨＣｌ緩衝液（１Ｍ）で７．５に調整し、５０ｍＭの最終濃度にした；および３）一定に撹拌しながら、反応時間を一晩（１６時間）に延長した。

酸加水分解による分解
別途指示しない限り、質量ラダーを産生するために完全長ＲＮＡ試料を分解するためにギ酸を適用した^{３０、３１}。それぞれのＲＮＡ試料溶液を、４０℃で５０％（ｖ／ｖ）のギ酸を使用するギ酸分解のために３つの等量のアリコートに分割し、１つの反応は２分間、１つは５分間、および１つは１５分間実行した。内部断片の生成に関する実験のために（図Ｓ４）、６０分のギ酸処理をＲＮＡ＃３上で行った。反応混合物を、ドライアイス上ですぐに凍結した後、乾燥するまで凍結乾燥し、典型的には、３０分以内に完了させた。乾燥した試料を合わせ、その後のビオチン／ストレプトアビジン捕捉／放出ステップのために２０μＬのヌクレアーゼ非含有脱イオン水中に懸濁したか、またはＬＣ／ＭＳ測定のために−２０℃で保存した。図２０では、ＬＣ／ＭＳに注入する前に、１つは３’−ビオチン標識を用い、１つは５’−スルホ−Ｃｙ３標識を用いた、同じ１１種の配列（ＲＮＡ＃１〜ＲＮＡ＃１１）の２つの別々の試料、および３’−ビオチン標識化されたＲＮＡ＃１２を含有する試料と共に混合されたこれらの試料を用いて、実験を開始した。

ビオチン／ストレプトアビジン捕捉／放出ステップ
ビオチン／ストレプトアビジン捕捉は、ストレプトアビジンで被覆された磁気ビーズを使用して、ビオチン標識ＲＮＡに結合させるが、それらはストレプトアビジンで被覆された磁気ビーズ上に選択的に固定され、磁石に引き寄せられる。したがって、結合したＲＮＡを、非ビオチン標識ＲＮＡおよび不純物（溶液中に残存し、洗浄除去されるであろう）から単離するべきであり、後にＬＣ−ＭＳ配列決定分析のためにビーズから溶出させることができる。図１６Ｂ中の試料について（他の試料はこのステップを必要としない）、２００μＬのＤｙｎａｂｅａｄｓ（商標）ＭｙＯｎｅ（商標）ストレプトアビジンＣ１ビーズを、最初に等量の１ｘＢ＆Ｗ緩衝液を添加することによって調製した。この溶液をボルテックスし、２分間磁石上に置いた後、上清を廃棄した。ビーズを、２００μＬの溶液Ａ（ＤＥＰＣ処理された０．１ＭのＮａＯＨおよびＤＥＰＣ処理された０．０５ＭのＮａＣｌ）で２回、溶液Ｂ（ＤＥＰＣ処理された０．１ＭＮａＣｌ）中で１回洗浄した。最後に１００μＬの２ｘＢ＆Ｗ緩衝液を添加して、ビーズの濃度を２０ｍｇ／ｍＬにした。次いで、１ｘＢ＆Ｗ緩衝液中の等容量のビオチン化ＲＮＡを添加し、試料を、穏やかな回転を使用して室温で１５分間インキュベートした後、２分間チューブを磁石上に置き、上清を廃棄した。被覆されたビーズを１ｘＢ＆Ｗ緩衝液中で３回洗浄し、それぞれの洗浄ステップの上清の最終濃度を、回収分析のためにＮａｎｏｄｒｏｐによって測定して、標的ＲＮＡ分子がビーズ上に残存していることを確認した。固定されたビオチン化ＲＮＡを放出させるために、ビーズを、６５℃で５分間、９５％ホルムアミド（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、Ｗａｌｔｈａｍ、ＭＡ、米国）を含む１０ｍＭＥＤＴＡ（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、米国）、ｐＨ８．２中でインキュベートした。最後に、この試料チューブを、２分間磁石上に置き、上清（標的ＲＮＡ分子を含有する）をピペットによって収集した。

シュードウリジンとウリジンとを区別するための化学
Bakin and Ofengand (Bakin, A.; Ofengand, J.. Biochemistry 1993, 32 (37), 9754-62)による報告に従って、シュードウリジンを改変するための実験手法を実施した。それぞれのＲＮＡ試料（１ｎｍｏｌ）を、９０μＬの総反応容量中、３７℃で２０分間５０ｍＭビシン、ｐＨ８．３、４ｍＭＥＤＴＡ、および７Ｍ尿素中の０．１７ＭＣＭＣで処理した。６０μＬの１．５ＭＮａＯＡｃおよび０．５ｍＭＥＤＴＡ、ｐＨ５．６（緩衝液Ａ）を用いて、反応を停止させた。ＯｌｉｇｏＣｌｅａｎ＆Ｃｏｎｃｅｎｔｒａｔｏｒを使用する精製後、６０μＬの０．１ＭＮａ_２ＣＯ_３緩衝液、ｐＨ１０．４を溶液に添加し、１２０μＬの反応容量にし、３７℃で２時間インキュベートした。緩衝液Ａを用いて反応を停止させ、ＯｌｉｇｏＣｌｅａｎ＆Ｃｏｎｃｅｎｔｒａｔｏｒにより精製した。

ＬＣ−ＭＳ分析
ＭｉｃｒｏＡＳオートサンプラーおよびＳｕｒｖｅｙｏｒＭＳＰｕｍｐＰｌｕｓＨＰＬＣシステム（ＡｇｉｌｅｎｔＴｅｃｈｎｏｌｏｇｉｅｓ、ＳａｎｔａＣｌａｒａ、ＣＡ、米国）（ＨｕｎｔｅｒＭａｓｓＳｐｅｃｔｒｏｍｅｔｒｙ、ＮＹ、米国）を装備した１２９０ＩｎｆｉｎｉｔｙＬＣシステムに連結された６５５０Ｑ−ＴＯＦ質量分析装置上で、試料を分離および分析した。全ての分離を、１．７μｍの粒径を有する５０ｍｍｘ２．１ｍｍＸｂｒｉｄｇｅＣ１８カラム（Ｗａｔｅｒｓ、Ｍｉｌｆｏｒｄ、ＭＡ、米国）をわたる、水性移動相（Ａ）、１０ｍＭジイソプロピルアミン（ＤＩＰＡ）（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、ＵＳＡ）をｐＨ９．０で含む２５ｍＭヘキサフルオロ−２−プロパノール（ＨＦＩＰ）（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、ＵＳＡ）および有機移動相（Ｂ）、メタノールを使用する逆相ＨＰＬＣで実施した。流量は０．３ｍＬ／分であり、全ての分離を、３５℃に維持したカラム温度を用いて実施した。注入容量は２０μＬであり、試料の量は１５〜４００ｐｍｏｌのＲＮＡであった。データを、負の極性で記録した。ＭａｓｓＨｕｎｔｅｒＡｃｑｕｉｓｉｔｏｎソフトウェア（ＡｇｉｌｅｎｔＴｅｃｈｎｏｌｏｇｉｅｓ、米国）を使用して、試料データを獲得した。ＬＣ−ＭＳ実験から関連するスペクトルおよびクロマトグラフィー情報を抽出するために、ＭａｓｓＨｕｎｔｅｒＱｕａｌｉｔａｔｉｖｅＡｎａｌｙｓｉｓ（ＡｇｉｌｅｎｔＴｅｃｈｎｏｌｏｇｉｅｓ、米国）中のＭｏｌｅｃｕｌａｒＦｅａｔｕｒｅＥｘｔｒａｃｔｉｏｎワークフローを使用した。この特許で守られた分子特性抽出アルゴリズムは、質量および保持時間の次元で非標的特性の発見を実行する。原理的には、化合物を同定することができる任意のソフトウェアを使用することができた。ソフトウェアの設定は、実験で使用されたＲＮＡの量に応じて変化した。一般に、目標は、最大で１０００までの、できるだけ多くの同定された化合物を含むことであった。プロファイルのスペクトルピークを、低濃度の試料については、５のシグナル対ノイズ比（ＳＮＲ）閾値、より濃縮された試料については、最大で２０のＳＮＲ閾値を使用してフィルタリングした。他のアルゴリズム設定は、以下の通りであった：「低分子（クロマトグラフィー）」抽出アルゴリズム、電荷状態−１〜−１５、水素（−Ｈ）イオンのみ損失、「一般有機分子」アイソトープモデル、最小品質スコア７０（０〜１００の範囲）、および最小イオン計数５００。

配列生成の自動化に加えて、ＲＮＡ配列の手動による読み取りも使用して、自動化配列決定の精度を確認した。これらの配列を、ＭａｓｓＨｕｎｔｅｒＱｕａｌｉｔａｔｉｖｅＡｎａｌｙｓｉｓのＡｇｉｌｅｎｔのソフトウェア中に統合されたＭｏｌｅｃｕｌａｒＦｅａｔｕｒｅＥｘｔｒａｃｔｉｏｎ（ＭＦＥ）アルゴリズムにより抽出されたデータから手動で読み取った。表Ｓ１〜Ｓ３８中に、各断片の理論質量（ＣｈｅｍＤｒａｗにより得られる）、塩基質量、塩基名、観測質量、ＲＴ、体積（ピーク強度）、品質スコア、およびｐｐｍでの質量差が提供される。提示される全ての図面は、複数の実験（ｎ≧３）の代表データである。可視化を容易にするために、５’−スルホ−Ｃｙ３標識化された質量ラダーおよび３’−ビオチン化質量ラダーを別々にプロットした（すなわち、３’−ビオチン化質量ラダーは全て図２０Ａにプロットし、５’−スルホ−Ｃｙ３標識化された質量ラダーは全て図２０Ｂにプロットした）。次いで、それぞれの配列曲線（所与のプロット上で最大１２）について、出発ＲＴ値を正規化して、４分間隔で開始させた（８分間隔のギャップを使用した図２０Ａ中のＲＮＡ＃１２の場合を除く）。任意の単一の所与の曲線の出発ＲＴ値とその後のＲＴ値との間の絶対差は未変化のままである；それぞれの曲線がプロットされる視覚的な「高さ」のみが変化した。図２０に関するプロットを、市販の写真作製ソフトウェアであるＯｒｉｇｉｎＬａｂを用いて作成した。図２０Ａ〜Ｂを除く全ての図面において、質量−ＲＴプロットを、いずれのＲＴ値も正規化せずに生成した。元の試料中の失われている塩基割り当てのため、２つの試料を組み合わせて、分析し、組み合わせたデータを図１７Ｂに可視化した。１つの試料は５’−Ｃｙ３標識と３’−ビオチン標識の両方を含むＲＮＡ＃１を含有したが、第２の組み合わせた試料は５’−Ｃｙ３標識のみを含むＲＮＡ＃１を含有していた（表Ｓ６）。

自動化ＲＮＡ配列決定および可視化アルゴリズム
ＬＣ／ＭＳデータ分析の第１のステップは、データの予備プロセッシングおよびデータ整理を行うことであり、ＬＣ／ＭＳデータが低ノイズになり、その結果、次のステップにおいてデータからＲＮＡ配列を読み取ることがより容易になる。多次元ＬＣ／ＭＳデータから、保持時間（ＲＴ）、強度（体積）、および品質スコア（ＱＳ）などの、データを予備プロセッシングし、その容量を低減させるために使用することができるいくつかの次元が存在する。データプロセッシングおよび配列決定アルゴリズムに対する改変に関する詳細については、補足情報を参照されたい。修正アルゴリズムのソースコードは利用可能である。当業者であれば、アルゴリズムのさらなる改善により、より複雑な細胞性ＲＮＡを配列決定する場合に塩基コールおよび改変同定を自動化することができる。

部分改変ＲＮＡ試料中の改変ＲＮＡの化学量論／パーセンテージの定量
塩基改変は細胞または試料中の全ての同一のＲＮＡ配列の１００％に存在するわけではないため、細胞性ＲＮＡ改変の動力学の理解（２０、２１）には、部位特異的改変を有するＲＮＡの、そのカノニカルな対応物ＲＮＡに対する化学量論／パーセンテージを定量する方法が必要である。上記定量戦略を他の配列にも適用すると、この方法により、当業者であれば、任意の質量が変更された改変を有するＲＮＡの、その対応する非改変対応物に対するパーセンテージを正確に決定することができる。図２１に示されるように、改変ＲＮＡと非改変ＲＮＡとの両方を含有する混合物から、ｍ５Ｃを含む完全な配列を正確に読み取ることができるだけでなく（図２１Ａ）、抽出されたイオンクロマトグラフからの情報に基づいて、ｍ５Ｃ改変ＲＮＡ（２０％）の、その非改変対応物（８０％）に対する相対パーセンテージを定量することもできる（図２１Ｂ）（２１）。３’−ビオチン標識化されたメチル化ＲＮＡおよび非改変ＲＮＡの抽出イオン電流（ＥＩＣ）ピークを、そのギ酸分解前に積分することによって、異なる生成物種の相対量を定量した。配列決定に加えて、他の異なる比を有するＲＮＡ混合物も同様に定量した（図２１Ｂ）。これらの相対パーセンテージは、５％未満の差でＲＮＡ標識化のために最初に使用されるＲＮＡの絶対量の比と良好に一致するが、これは、ＥＩＣに基づく積分が、同じ配列を有する全てのＲＮＡが改変されなかった場合の改変ＲＮＡの相対的定量のための正確な方法であることを示している。この考えをΨに拡張すると、この方法により、当業者であれば、Ψを含むＣＭＣ化学の収率で因数分解できる場合、Ψ含有ＲＮＡの非Ψ含有ＲＮＡに対するパーセンテージを見積もることができる。

保持時間（ＲＴ）の質量に対するプロット上の空間的に別々のラダーに５’タグを付加して、合成の非改変Ａ１０（１０マーのポリアデニン）配列の５’と３’の両方のラダーに関するシミュレートされた質量スペクトルピークセットを、最初にｉｎｓｉｌｉｃｏで生成した。各行は、所与の質量ラダーピークを表し、各ピークに、無単位の保持時間（ＲＴ）および１０００の任意の一定の無単位ピーク体積を割り当てた。各ラダーに割り当てられたＲＴは、０から出発し、０．１単位の増分で増加して、質量の増大と共に体系的に増大した。シミュレートされたＡ１０の質量スペクトルに関するピークの一覧は、以下の通りであった：
Ａ１０−非改変ＭＳピークの一覧

３４７．０６３０６５から出発する質量ラダーは、５’質量ラダーを表すが、２６７．０９６７３２から出発する質量ラダーは、３’質量ラダーを表す。

次に、合成の、５’−シアニン３（Ｃｙ３）標識化されたＡ１０（１０マーのポリアデニン）配列の５’と３’の両方のラダーに関するシミュレートされた質量スペクトルピークセットを、ｉｎｓｉｌｉｃｏで生成した。上のデータセットを取り、データセット中の５’ラダーの各メンバーに、５’−Ｃｙ３標識（６１４．３０６１）により得られたさらなる質量を加えることにより、これを行った。ピーク体積は変化しなかった。この新しいＣｙ３標識化された５’ラダーに関する関連するＲＴを、ここで１０のＲＴから出発することにより生成し、質量の増加と共に０．２の増分で減少させた。これを行って、両方の絶対ＲＴ値、ＲＴ傾向（例えば、単調に減少する曲線に対する単調に増加する曲線）、および絶対質量値における任意の末端標識化されたラダー（この場合、５’−Ｃｙ３標識化された）のＲＴの質量スペクトルに対する潜在的な変化をシミュレートした。勿論、現実のシステムにおけるこれらの値の全てにおける現実の変化をｉｎｓｉｌｉｃｏで絶対的に予測することはできず、したがって、これは原理証明例としてのみ取られるべきである。シミュレートされた５’−Ｃｙ３標識化されたＡ１０質量スペクトルに関するピークの一覧は以下の通りであった：
Ａ１０−５’−Ｃｙ３標識化されたＭＳピークの一覧

９６１．３６９１６５から出発する質量ラダーは、５’−Ｃｙ３標識化された質量ラダーを表すが、２６７．０９６７３２から出発する質量ラダーは、３’質量ラダーを表す。

これらの２つのＲＴと質量のプロットを比較すると、当業者であれば、２つの質量ラダー曲線が、末端標識がない場合、ほぼ重ね合わせられ（図２２Ａ）、下流の塩基コールおよび配列同定における配列決定の誤りの可能性をもたらすが、５’−Ｃｙ３標識化された試料は、２つの異なる別々の質量ラダー曲線を有し（図２２Ｂ）、配列決定にとって必要とされる全てのラダー成分の可視化をより容易にし、下流の塩基コールおよび配列同定における精度をより高くすることを見ることができる。

配列生成の自動化に加えて、当業者であれば、自動化配列決定の精度を確認するために、ＭａｓｓＨｕｎｔｅｒＱｕａｌｉｔａｔｉｖｅＡｎａｌｙｓｉｓ（ＡｇｉｌｅｎｔＴｅｃｈｎｏｌｏｇｉｅｓ）中のＭｏｌｅｃｕｌａｒＦｅａｔｕｒｅＥｘｔｒａｃｔｉｏｎ（ＭＦＥ）ワークフローにより質量ラダーについて手動で検索することもできる。表Ｓ１〜Ｓ３８に、それぞれの断片の理論質量（ＣｈｅｍＤｒａｗにより得られた）、塩基質量、塩基名、観測質量、ＲＴ、体積（ピーク強度）、品質スコア、およびｐｐｍとして表される誤差（以下の式により算出）が提供される。合理的な品質スコアを示すだけでなく、できるだけ多くの同定された化合物を抽出するために、ＭＦＥ設定を最適化した。適用されるＭＦＥ設定は以下の通りである：「重心データ形式、低分子（クロマトグラフィー）、５００以上の高さを有するピーク、７０以上の品質スコア」。しかしながら、必要に応じて、データ整理を実施して、配列決定アルゴリズムを単純化した。例えば、２０ｎｔのＲＮＡのためのビオチン標識化された試料については、６〜１０分の保持時間を選択することができる。また、アルゴリズム分析のために使用される入力化合物の数は一般に、別途指示しない限り、完全な配列を生成するのに必要とされるラダー断片の数よりも一桁多い；これらの入力化合物は、典型的には、より高い体積および／またはより良好な品質スコアを有する全てのＭＦＥ抽出された化合物から選別される。

以下の式を使用して、実施例８に記載されたＰＰＭを算出した：
ｐｐｍ＝１０^−６×（質量_理論−質量_観測）／質量_理論
表S1. ストレプトアビジンビーズによる単離、次いで、化学的分解後の3'ビオチン標識化されたRNA#1(3'標識質量ラダー成分、RNA#1)のLC/MS分析。

表S2. ストレプトアビジンビーズによる単離、次いで、化学的分解後の3'ビオチン標識化されたRNA#1(5'非標識質量ラダー成分、RNA#1)のLC/MS分析。

*NA:分析せず。溶出緩衝液に由来するバックグラウンドイオンを最小化するために、350Daの閾値を設定した。そうでなければ、HFIPおよびDPAイオンが主に検出されるであろう。したがって、350Da未満の質量は検出されなかった。
表S3. 5'ビオチン標識化されたRNA#1(5'標識質量ラダー成分、RNA#1)のLC/MS分析

表S4. 5'ビオチン標識化されたRNA#2(5'標識質量ラダー成分、RNA#2)のLC/MS分析。

表S5. 3'ビオチン標識化されたRNA#1(3'標識質量ラダー成分、RNA#1)のLC/MS分析。

表S6. 5'Cy3標識化されたRNA#1(5'標識質量ラダー成分、RNA#1)のLC/MS分析。

表S7. 1個のΨを含有するRNA#12(5'から3'までのΨ非変換質量ラダー成分、RNA#12)のLC/MS分析。

表S8. 1個のΨを含有するRNA#12(3'から5'までのΨ非変換質量ラダー成分、RNA#12)のLC/MS分析。

表S9. 1個のΨを含有するRNA#12(5'から3'までのCMC変換されたΨを含む質量ラダー成分、20ntのRNA)のLC/MS分析

表S10. 1個のΨを含有するRNA#12(3'から5'までのCMC変換されたΨを含む質量ラダー成分、RNA#12)のLC/MS分析

表S11. 2個のΨを含有するRNA#13(5'から3'までのΨ非変換質量ラダー成分、RNA#13)のLC/MS分析。

表S12. 2個のΨを含有するRNA#13(5'から3'までの1個のCMC変換されたΨを含む質量ラダー成分、20ntのRNA#13)のLC/MS分析。

表S13 .2個のΨを含有するRNA#13(5'から3'までの1個のCMC変換されたΨを含む質量ラダー成分、RNA#13)のLC/MS分析。

表S14. 2個のΨを含有するRNA#13(5'からの2個のCMC変換されたΨを含む質量ラダー成分、RNA#13)のLC/MS分析。

表S15. その質量ラダー成分を示す、3'ビオチン標識化されたRNA#1のLC/MS分析。

表S16. その質量ラダー成分を示す、3'ビオチン標識化されたRNA#2のLC/MS分析。

表S17. その質量ラダー成分を示す、3'ビオチン標識化されたRNA#3のLC/MS分析。

表S18. その質量ラダー成分を示す、3'ビオチン標識化されたRNA#4のLC/MS分析。

表S19. その質量ラダー成分を示す、3'ビオチン標識化されたRNA#5のLC/MS分析。

表S20. その質量ラダー成分を示す、3'ビオチン標識化されたRNA#6のLC/MS分析。

表S21. その質量ラダー成分を示す、3'ビオチン標識化されたRNA#7のLC/MS分析。

表S22. その質量ラダー成分を示す、3'ビオチン標識化されたRNA#8のLC/MS分析。

表S23. その質量ラダー成分を示す、3'ビオチン標識化されたRNA#9のLC/MS分析。

表S24. その質量ラダー成分を示す、3'ビオチン標識化されたRNA#10のLC/MS分析。

表S25. その質量ラダー成分を示す、3'ビオチン標識化されたRNA#11のLC/MS分析。

表S26. その質量ラダー成分を示す、5'スルホ-Cy3標識化されたRNA#1のLC/MS分析。

表S27. その質量ラダー成分を示す、5'スルホ-Cy3標識化されたRNA#2のLC/MS分析。

表S28. その質量ラダー成分を示す、5'スルホ-Cy3標識化されたRNA#3のLC/MS分析。

表S29. その質量ラダー成分を示す、5'スルホ-Cy3標識化されたRNA#4のLC/MS分析。

表S30. その質量ラダー成分を示す、5'スルホ-Cy3標識化されたRNA#5のLC/MS分析。

表S31. その質量ラダー成分を示す、5'スルホ-Cy3標識化されたRNA#6のLC/MS分析。

表S32. その質量ラダー成分を示す、5'スルホ-Cy3標識化されたRNA#7のLC/MS分析。

表S33. その質量ラダー成分を示す、5'スルホ-Cy3標識化されたRNA#8のLC/MS分析。

表S34. その質量ラダー成分を示す、5'スルホ-Cy3標識化されたRNA#9のLC/MS分析。

表S35. その質量ラダー成分を示す、5'スルホ-Cy3標識化されたRNA#10のLC/MS分析。

表S36. その質量ラダー成分を示す、5'スルホ-Cy3標識化されたRNA#11のLC/MS分析。

表S37. そのΨ-CMC変換された質量ラダー成分を示す、3'ビオチン標識化されたRNA#12のLC/MS分析。

表S38. そのΨ非変換質量ラダー成分を示す、3'ビオチン標識化されたRNA#12のLC/MS分析。

データを、以下のようにプロセッシングした：
図１６Ｂについて：最大プロッティングウィンドウＲＴ、２０に設定：ａｘ．ｓｅｔ＿ｙｌｉｍ（ｍｉｎ＿ｔｉｍｅ、１５）；最大質量＜７０００。体積で上位５００を取る（３４８６を含むそれより上）。
図１６Ｃ：プロッティングウィンドウＲＴ、５．５〜１２に設定：ａｘ．ｓｅｔ＿ｙｌｉｍ（５．５、１２）。
最大質量＜７５００。
体積で上位５００を取る（１２１９を含むそれより上）。
図１７Ｂ：最大質量＜７０００。
体積で上位１０００を取る（３３６９３を含むそれより上）。
図１９Ａ：最大質量＜８０００。
体積で上位５００を取る（２４１６９８を含むそれより上）。
図１９Ｂ：最大質量＜８０００。
ＣＭＣ標識化効率がある程度低かったため、体積で上位１０００を取る（６３１１０を含むそれより上）。
図Ｓ２：最大質量＜８０００。
体積で上位３００を取る（１２１２３０を含むそれより上）。
第２のステップは、ＬＣ／ＭＳデータを分析し、ＲＮＡ配列を自動的に認識することである。［ＪＡＣＳ２０１５］からのアルゴリズムの改変バージョンを使用した。
最初に、デフォルトのｃｆｇファイルに改変を加えた：
前

後

１）厳密に単調に増加または減少する配列プロットの要件を削除した
コメントアウト：

２）質量フィルタリングステップを無効にした：

３）図１６Ｃ以降について、コードの以下の領域を、標識を除去するためのプロッティングを容易にするためにコメントアウトした。

特定の図面に関するさらなる変更を、以下に従って行った：
図１６Ｂについて：最大プロッティングウィンドウＲＴ、２０に設定：ａｘ．ｓｅｔ＿ｙｌｉｍ（ｍｉｎ＿ｔｉｍｅ、２０）。
最大質量＜７０００。
体積で上位５００を取る（３４８６を含むそれより上）。
プロッティングの方向もフリップした（変更は太字）：

本明細書を通して引用される全ての特許、特許出願および参考文献は、参照により明示的に組み込まれる。
参考文献

Claims

一次ＲＮＡ配列およびＲＮＡ改変の存在／同定／位置を決定するためのＲＮＡ配列決定方法であって、（ｉ）ＲＮＡの５’および／または３’末端の標識化ステップ；（ｉｉ）前記ＲＮＡの無作為分解ステップ；（ｉｉｉ）必要に応じて、５’および３’末端標識化に基づく得られたＲＮＡ断片の物理的分離ステップ；（ｉｖ）得られたＲＮＡ断片特性の分離および検出ステップ；ならびに（ｖ）配列／改変同定をもたらすデータ分析ステップを含む、方法。
前記ステップ（ｉｖ）の得られたＲＮＡ断片の分離が、高速液体クロマトグラフィーによって達成される、請求項１に記載の方法。
前記高速液体クロマトグラフィーが、逆相高速液体クロマトグラフィーである、請求項２に記載の方法。
前記ステップ（ｉｖ）の得られたＲＮＡ断片の分離が、キャピラリー電気泳動によって達成される、請求項１に記載の方法。
前記ステップ（ｉｖ）の得られたＲＮＡ断片特性の検出が、質量分析によって達成される、請求項１に記載の方法。
ＲＮＡ分子の５’および／または３’末端の親和性標識化が、ビオチンのような疎水性標識またはＣＹ３もしくはＣＹ５などの蛍光色素によるものである、請求項１に記載のＲＮＡ配列決定方法。
ＲＮＡ分子の５’および／または３’末端の親和性標識化が、チオール基によるものである、請求項１に記載のＲＮＡ配列決定方法。
ＲＮＡ分子の５’および／または３’末端の親和性標識化が、任意のビオチン化ｐＣｐによるものである、請求項１に記載のＲＮＡ配列決定方法。
ＲＮＡ分子の５’および／または３’末端の親和性標識化が、ＤＮＡアダプターによるものである、請求項１に記載のＲＮＡ配列決定方法。
ＲＮＡ分子の５’および／または３’末端の親和性標識化が、ポリ（Ａ）オリゴヌクレオチドによるものである、請求項１に記載のＲＮＡ配列決定方法。
前記ＲＮＡの化学的分解が、化学的分解によって行われる、請求項１に記載のＲＮＡ配列決定方法。
前記化学的分解が、ギ酸またはアルカリ加水分解を用いて行われる、請求項１１に記載のＲＮＡ配列決定方法。
前記ＲＮＡの分解が、酵素的分解によって行われる、請求項１に記載のＲＮＡ配列決定方法。
前記酵素的分解が、Ｃｒｏｔａｌｕｓａｄａｍａｎｔｅｕｓ毒のホスホジエステラーゼＩ、ウシ脾臓ホスホジエステラーゼＩＩ、およびＸＲＮ−１エキソリボヌクレアーゼからなる群からの酵素を使用して行われる、請求項１３に記載のＲＮＡ配列決定方法。
化学的分解が、ＲＮＡ分子の５’および３’末端の親和性標識化の前に行われる、請求項１に記載のＲＮＡ配列決定方法。
化学的分解が、ＲＮＡ分子の５’および３’末端の親和性標識化の後に行われる、請求項１に記載のＲＮＡ配列決定方法。
ＲＮＡ試料が、限られた多様性の精製されたＲＮＡ試料を含む、請求項１に記載のＲＮＡ配列決定方法。
ＲＮＡ試料が、ＲＮＡの混合物を含む、請求項１に記載のＲＮＡ配列決定方法。
ＲＮＡ試料が、治療的ＲＮＡ分子を含む、請求項１に記載のＲＮＡ配列決定方法。
ＲＮＡヌクレオチド配列が、ＭＳデータ出力と、既知および／または未知のリボヌクレオチドの質量との相関によって決定される、請求項１に記載のＲＮＡ配列決定方法。
改変リボヌクレオチドの存在が、ＭＳデータ出力と、既知および／または未知の改変リボヌクレオチドの質量との相関によって決定される、請求項１に記載のＲＮＡ配列決定方法。
（ｉ）ＲＮＡ断片の疎水性を増大させることによって、分解されたＲＮＡ断片の保持時間を増加させる部分を用いた、ＲＮＡの５’および／または３’末端の標識化ステップ；（ｉｉ）前記ＲＮＡの無作為分解ステップ；（ｉｉｉ）得られたＲＮＡ断片特性の分離および検出ステップ；ならびに（ｉｖ）配列／改変同定をもたらすデータ分析ステップを含む、ＲＮＡ配列決定方法。
前記ステップ（ｉｖ）の得られたＲＮＡ断片の分離が、高速液体クロマトグラフィーによって達成される、請求項２２に記載の方法。
前記高速液体クロマトグラフィーが、逆相高速液体クロマトグラフィーである、請求項２２に記載の方法。
前記ステップ（ｉｖ）の得られたＲＮＡ断片の分離が、キャピラリー電気泳動によって達成される、請求項２２に記載の方法。
前記ステップ（ｉｖ）の得られたＲＮＡ断片特性の検出が、質量分析によって達成される、請求項２２に記載の方法。
（ｉ）前記ＲＮＡの３’末端がビオチン部分で標識化され、前記ＲＮＡの５’末端が疎水性Ｃｙ３タグで標識化されるか、または（ｉｉ）前記ＲＮＡの５’末端がビオチン部分で標識化され、前記ＲＮＡの３’末端が疎水性Ｃｙ３タグで標識化される、請求項２２に記載の方法。
（ｉ）ＤＮＡの５’および／または３’末端の親和性標識化ステップ；（ｉｉ）前記ＤＮＡの質量ラダーへの無作為分解ステップ；（ｉｉｉ）必要に応じて、親和性相互作用に基づく得られたＤＮＡ断片の物理的分離ステップ；（ｉｖ）質量分析とカップリングした、逆相高速液体クロマトグラフィー（ＨＰＬＣ）またはキャピラリー電気泳動（ＣＥ）または他の分離方法を使用する得られたＤＮＡ断片の測定ステップ；ならびに（ｖ）配列／改変同定をもたらすＭＳデータ分析ステップを含む、ＤＮＡ配列決定方法。
ＤＮＡ分子の５’および／または３’末端の前記親和性標識化が、ビオチン標識によるものである、請求項２８に記載のＤＮＡ配列決定方法。
前記ＤＮＡの分解が、酵素的分解によって行われる、請求項２８に記載のＤＮＡ配列決定方法。
前記酵素的分解が、ＤＮＡ制限エンドヌクレアーゼを使用して行われる、請求項３０に記載のＤＮＡ配列決定方法。
データ分析が、質量および保持時間に依拠した２次元分析である、請求項１に記載のＤＮＡ配列決定方法。
データ分析が、前記ＲＮＡ配列から得られたＲＮＡ断片のユニークな特性に基づいて行われる、請求項１に記載のＤＮＡ配列決定方法。
ＲＮＡ断片の前記ユニークな特性が、電気シグナルまたは光学的シグネチャシグナルである、請求項３３に記載のＤＮＡ配列決定方法。
改変ヌクレオシドであるシュードウリジン（Ψ）を含有するＲＮＡが、ウリジン（Ｕ）と比較してΨと優先的に反応し、ＣＭＣ−Ψ付加物の形成をもたらすＣＭＣで処理され、前記付加物が２−Ｄ質量−ＲＴプロットにおいてＵを含むＣＭＣ変換されていないΨと比較して質量およびＲＴのシフトをもたらす、請求項１または２８に記載のＲＮＡ配列決定方法。
ＲＮＡがΨ含有ＲＮＡであるＲＮＡ配列決定方法であって、（ｉ）配列決定しようとするＲＮＡのＣＭＣによる処理ステップ；（ｉｉ）前記ＲＮＡの５’および３’末端の親和性標識化ステップ；（ｉｉｉ）前記ＲＮＡの無作為分解ステップ；（ｉｖ）必要に応じて、親和性相互作用に基づく得られたＲＮＡ断片の物理的分離ステップ；（ｖ）質量分析とカップリングした、逆相高速液体クロマトグラフィー（ＨＰＬＣ）またはキャピラリー電気泳動（ＣＥ）または他の分離方法を使用する得られたＲＮＡ断片の測定ステップ；ならびに（ｖ）配列／改変同定をもたらすＭＳデータ分析ステップを含む、方法。
前記ＲＴおよび質量のシフトが、Ｕと比較してΨと優先的に反応することができるＣＭＣまたは化学部分によって引き起こされ得る、請求項３５に記載の方法。
改変核酸塩基を含むＲＮＡ配列が、改変ＲＮＡと非改変ＲＮＡとの両方を含有する混合物から決定され、改変核酸塩基の非改変核酸塩基に対する相対パーセンテージを定量することができる、請求項１または２８に記載のＲＮＡ配列決定方法。
改変核酸塩基の非改変核酸塩基に対する前記相対パーセンテージの定量を、抽出イオンクロマトグラフに基づく部分改変ＲＮＡ試料中で定量することができる、請求項３８に記載の方法。
ＲＮＡ試料が、ＲＮＡ分子のアナログを含む、請求項１に記載のＲＮＡ配列決定方法。
前記ＲＮＡ分子の前記アナログが、Ｎ３’−Ｐ５’結合ホスホロアミデートＤＮＡまたはＲＮＡである、請求項４０に記載のＲＮＡ配列決定方法。