JP2021525507A - 直接核酸配列決定方法 - Google Patents

直接核酸配列決定方法 Download PDF

Info

Publication number
JP2021525507A
JP2021525507A JP2020565759A JP2020565759A JP2021525507A JP 2021525507 A JP2021525507 A JP 2021525507A JP 2020565759 A JP2020565759 A JP 2020565759A JP 2020565759 A JP2020565759 A JP 2020565759A JP 2021525507 A JP2021525507 A JP 2021525507A
Authority
JP
Japan
Prior art keywords
rna
mass
ladder
sequencing
labeling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020565759A
Other languages
English (en)
Inventor
シェンロン ジャン,
シェンロン ジャン,
ニン ジャン,
ニン ジャン,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New York Institute of Technology
Original Assignee
New York Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by New York Institute of Technology filed Critical New York Institute of Technology
Publication of JP2021525507A publication Critical patent/JP2021525507A/ja
Priority to JP2023192920A priority Critical patent/JP2024010243A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6872Methods for sequencing involving mass spectrometry
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1003Extracting or separating nucleic acids from biological samples, e.g. pure separation or isolation methods; Conditions, buffers or apparatuses therefor
    • C12N15/1006Extracting or separating nucleic acids from biological samples, e.g. pure separation or isolation methods; Conditions, buffers or apparatuses therefor by means of a solid support carrier, e.g. particles, polymers
    • C12N15/101Extracting or separating nucleic acids from biological samples, e.g. pure separation or isolation methods; Conditions, buffers or apparatuses therefor by means of a solid support carrier, e.g. particles, polymers by chromatography, e.g. electrophoresis, ion-exchange, reverse phase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/351Conjugate
    • C12N2310/3517Marker; Tag

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Immunology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本開示は、概して、核酸配列決定のための新規方法に関する。具体的には、本発明は、cDNAなしにRNAを直接配列決定するための液体クロマトグラフィー−質量分析(LC−MS)に基づく技術に関する。当業者であれば、この技術により、広範囲のRNA改変の存在、型および位置を決定しながら、単一ヌクレオチド分解能でRNA配列を同時に読み取ることができる。本開示は、予めのcDNA合成を必要とすることなくRNAを直接配列決定し、単一ヌクレオチド分解能でRNA分子のヌクレオチド配列を同時に決定し、ならびに、RNA改変の存在、型、位置および量を示すために使用することのできる、直接的な、液体クロマトグラフィー−質量分析(本明細書ではLC−MSと称する)に基づくRNA配列決定方法に関する。

Description

関連出願の相互参照
本出願は、2018年5月25日に出願された米国仮特許出願第62/676,703号;2018年9月13日に出願された同第62/730,592号;2019年2月1日に出願された同第62/800,054号;および2019年4月15日に出願された同第62/833,964号の利益および優先権を主張し、それらは全てその全体が参照により本明細書に組み込まれる。
本開示は、概して、核酸配列決定のための新規方法に関する。具体的には、本発明は、予め相補的DNA(cDNA)を合成することなくRNAを直接配列決定するための液体クロマトグラフィー−質量分析(LC−MS)に基づく技術に関する。この技術により、広範囲の標的RNA改変の存在、型、位置および量を検出しながら、単一ヌクレオチド分解能で標的RNA配列を同時に読み取ることができる。
質量分析(MS)は、ペプチド断片化が、様々なアミノ酸改変の正体および位置を示す「ラダー」をもたらす、タンパク質改変(1)を研究するための必須の手段である。まだ今のところ、満足のいく配列カバレッジを提供するin situ断片化技術が存在しないため、核酸のための同様の手法はまだ実現可能ではない。いくつかの主要な課題は、そのような核酸配列決定方法と関連する。1つは、RNA配列決定にとって必要とされる質量ラダーを調製するためのプロセスが、他の非質量ラダー断片および質量付加物の生成ももたらすということである−RNA配列決定と関連しない不純物または他の分子またはその金属イオンは、RNA質量ラダー断片を伴い、ラダー断片の真の質量を分かりにくくし得る。
理想的には、ラダーの切断は、配列選択性/特異性なしに、それぞれのRNA鎖上の1つの無作為な切断を伴って高度に均一であるべきである。しかしながら、前もって必要なRNA分解によって生成されたラダー配列の構造/切断均一性は、それぞれのRNA鎖上の複数の切断を含む望ましくない断片(内部断片)と混同されることが多く、下流のデータ分析を複雑にする。一本鎖RNAについてさえ、全質量データから配列決定にとって必要とされる所望のラダー断片を選抜することが非常に困難であるため、内部断片と質量付加物との両方の存在は、配列決定のためのデータ分析を妨害し得るデータ中の「ノイズ」をもたらす。したがって、現在の方法は、生体試料に由来するものなどのRNA分子の混合物の効率的な配列決定を効率的に可能にしない。
異常な核酸改変、特に、RNAにおけるメチル化およびシュードウリジン化は、それぞれ、世界中の数百万人が罹患する、乳がん、2型糖尿病、および肥満(2、3)のような主要な疾患の発症と相関している。それらの重要性にも関わらず、RNA中の改変を確実に同定する、位置付ける、および定量するための利用可能な手段は、非常に限られている。結果として、多くのそのような改変の機能は、依然としてほとんど不明である。
したがって、例えば、tRNA、siRNA、薬物動態特性を有する治療的合成オリゴリボヌクレオチド、RNA分子の混合物を含む、RNA分子の効率的な配列決定、ならびにそのようなRNA分子の改変の検出を容易にするための方法が必要である。
Warren,E.N.ら、Anal Chem(2004)76,4082〜4092 Lu,L.ら、Breast Cancer Res Treat(2012)136、875〜883 Jiang,J.ら、Nucleic Acids Res(2014)42、3971〜3981
本開示は、予めのcDNA合成を必要とすることなくRNAを直接配列決定し、単一ヌクレオチド分解能でRNA分子のヌクレオチド配列を同時に決定し、ならびに、RNA改変の存在、型、位置および量を示すために使用することのできる、直接的な、液体クロマトグラフィー−質量分析(本明細書ではLC−MSと称する)に基づくRNA配列決定方法に関する。開示される方法を使用して、RNA試料内のそれぞれの改変の型、位置および量を決定することができる。任意の所与のRNA分子の生物学的機能と、その関連する改変とを相関させるため、およびRNAに基づく治療剤の品質管理のために、そのような技術を有利に使用することができる。
本明細書に開示されるLC−MSに基づくRNA配列決定方法は、精製されたRNA試料、ならびに生体試料に由来するRNAの混合物を含む、複数のRNA種を含有する試料の配列決定を可能にする方法を有利に提供する。この戦略を、カノニカルな、および構造的に非定型的なヌクレオシドの両方を担持するRNA配列のde novoでの配列決定に適用することができる。方法は、RNAの3’および/または5’末端でのその効率的な標識化によってLC−MSに基づくデータを分析するための単純化された手段を提供し、したがって、MSに基づく分析のための3’ラダーおよび5’ラダーRNAプールの分離を可能にする。
ある実施形態では、一次RNA配列およびRNA改変の存在/同定を決定するためのRNA配列決定方法であって、(i)RNAの5’および/または3’末端の標識化ステップ;(ii)RNAの無作為分解ステップ;(iii)必要に応じて、5’および3’末端標識化に基づく得られたRNA断片の物理的分離ステップ;(iv)得られたRNA断片特性の分離および検出ステップ;および(v)配列/改変同定をもたらすデータ分析ステップを含む、方法が提供される。
ある実施形態では、一次RNA配列およびRNA改変の存在/同定を決定するためのRNA配列決定方法であって、(i)N−シクロヘキシル−N’−(2−モルホリノエチル)−カルボジイミドメト−p−トルエンスルホネート(CMC)による、配列決定しようとするRNAの処理ステップ;(ii)RNAの5’および/または3’末端の親和性標識化ステップ;(iii)RNAの質量ラダーへの無作為分解ステップ;(iv)必要に応じて、親和性相互作用に基づく得られたRNA断片の物理的分離ステップ;(v)質量分析とカップリングした逆相高速液体クロマトグラフィー(HPLC)またはキャピラリー電気泳動(CE)または他の分離方法を使用する得られたRNA断片の測定ステップ;および(v)配列/改変同定をもたらすMSデータ分析ステップを含む、方法が提供される。
特定の態様では、RNAの5’および3’末端は、親和性に基づく部分および/またはサイズシフト部分で標識化される。別の態様では、断片特性は、例えば、質量分析とカップリングした高速液体クロマトグラフィー、キャピラリー電気泳動を含む、1つまたは複数の分離方法の使用によって検出される。
ラダー同定のために2−D質量保持時間(RT)シフトを導入することによって、疎水性末端標識化戦略を使用した。具体的には、質量−RT標識を、配列決定しようとするRNAの5’および/または3’末端に付加したところ、これらの部分の少なくとも1つは、より長い時間への保持時間のシフトをもたらし、全ての5’および/または3’ラダー断片が、RTの顕著な遅延を引き起こし、5’ラダーを3’ラダーから明確に区別した。疎水性標識タグは、標識化されたラダーの質量−RTシフトをもたらし、RNAのLC−MS配列決定にとって必要とされるそれぞれの2−D質量ラダーの同定、したがって、塩基コール手順の単純化をはるかに容易にするだけでなく、標識化されたタグもまた、末端塩基を同定することができ、したがって、対形成した末端の読み取りデータを必要とするよりもむしろ、1つの単一ラダーからの配列の完全な読み取りを可能にするように、RNAラダー断片の質量を固有に増加させる。
本発明のある特定の態様では、RNA配列決定方法は、後に、RNA配列ならびにRNA改変の存在のHPLCおよびMSによる決定のためにLC/MSにかけられる、本明細書では5’および3’ラダープールと称される、分解されたRNA断片の2つのラダープールの形成および逐次的物理的分離に基づくものである。5’および3’ラダープールの物理的分離を、例えば、ビオチンのストレプトアビジンに対する親和性などの、様々な異なる分子親和性相互作用の使用によって達成することができる。
一態様では、本明細書に開示されるRNA配列決定方法は、(i)RNA分子の5’および/または3’末端の親和性標識化ステップ;(ii)標識化されたRNAの無作為分解ステップ;(iii)親和性標識化に基づく5’および/または3’末端標識化された断片の分離ステップ;および(iv)配列/改変同定のための、液体クロマトグラフィーHPLCの、高分解能質量分析装置(MS)との逐次的実施ステップを含む。
特定の態様では、方法は、(i)ビオチン/ストレプトアビジン親和性に基づくラダー断片の物理的分離のための5’および/または3’RNA末端の化学的標識化、(ii)ギ酸媒介性RNA分解、(iii)5’および/または3’標識化されたRNAの物理的分離、(iv)断片の高速液体クロマトグラフィー(HPLC)による分離、(v)逐次的ESI−四重極−飛行時間(Q−TOF)−MSに基づく質量検出、ならびに(vi)質量スペクトルから関連する質量ピークを抽出し、整列させ、プロセッシングする単純なコンピューターアルゴリズムに基づくデータ分析からなる。
別の特定の例では、方法は、(i)保持時間を増加させるためにRNA断片のサイズを増加させるように設計された、Cy3のような嵩高い疎水性タグによるRNAの5’末端の化学的標識化、およびビオチンのような親和性タグによる3’末端の標識化、またはその逆を行い、したがって、物理的分離の必要なしに配列同定を可能にすること、(ii)ギ酸媒介性RNA分解、(iii)断片の高速液体クロマトグラフィー(HPLC)による分離および逐次的ESI−四重極−飛行時間(Q−TOF)−MSに基づく質量検出、ならびに(iv)質量スペクトルから関連する質量ピークを抽出し、整列させ、プロセッシングする単純なコンピューターアルゴリズムに基づくデータ分析からなる。
本開示の例示的実施形態のさらなる詳細および態様を、添付の図面を参照して以下でより詳細に説明する。本開示の上記態様および実施形態はいずれも、本開示の範囲から逸脱することなく組み合わせることができる。
RNA配列決定および改変の同定のための本発明の方法の様々な実施形態を、図面を参照して本明細書に記載する。
図1は、それぞれ、RNAの3’末端および5’末端にビオチン標識を導入した後、LC−MSによる直接配列決定のための質量ラダーを生成するために酸分解し、ビオチン/ストレプトアビジン捕捉放出するためのワークフローを示す。
図2は、酵母のTリボヌクレアーゼのみで切断された一本鎖RNAのG位置に由来するtRNAPheの二次クローバー葉構造を示す。
図3は、3つの重複する断片を生成するためのtRNAの部分的Tリボヌクレアーゼ消化を示す。
図4は、基質としての5’−アデニル化ビオチン−メチル−ddCを用いたTリガーゼを使用する3’tRNA部分の標識化、ならびにその後の、ストレプトアビジンフィッシング、酸分解、およびLC/MS後の3’ラダー形成を実証する。
図5は、T4ポリヌクレオチドキナーゼ(PNK)を使用するtRNAの中央部分の標識化、次いで、ビオチン(長腕)マレイミドを用いたチオ移入、その後の、ストレプトアビジンフィッシング、酸分解、およびLC/MS後の5’ラダー形成を示す。
図6は、以前の5’手順に従うラダー生成と共に、5’リン酸基を除去し、5’−OH基と置き換える5’ホスファターゼを使用する5’tRNA部分の標識化を実証する。
図7は、ビーズ分離された5’標識化されたRNAのLC/MS配列決定を示す。
図8は、その質量、クロマトグラフィーのRTおよび存在量によって定義されるコンピューターアルゴリズムを使用する単離前の5’ビオチン標識化された21ntのRNAの直接LC−MS配列決定を実証する;分解時間は、15分である。
図9は、それぞれ、m/z6784をもたらす出発分子21nt RNAおよびm/z7541をもたらす3’末端ビオチン標識21nt RNAを用いた3’末端ビオチン標識反応生成物のMALDI−TOF質量スペクトルを示す。
図10は、それぞれ、m/z6784をもたらす出発分子21nt RNAおよびm/z7353をもたらす3’末端ビオチン標識21nt RNAを用いた5’末端ビオチン標識反応生成物のMALDI−TOF質量スペクトルを示す。
図11は、ビーズ分離を用いない、その質量、クロマトグラフィーのRTおよび存在量によって定義されるコンピューターアルゴリズムを使用する5’ビオチン標識化された21ntのRNAの直接LC−MS配列決定を示す;分解時間は、5分である。
図12は、それぞれ、ビオチン標識をRNAの3’末端に、疎水性Cy3タグを5’末端に導入した後、酸分解を行って、LC−MSによる直接配列決定のための質量ラダーを生成することによるビーズ補助物理的分離を用いないワークフローを示す。
図13は、改変リボヌクレオシドの公知の質量を記載する。 図13は、改変リボヌクレオシドの公知の質量を記載する。 図13は、改変リボヌクレオシドの公知の質量を記載する。 図13は、改変リボヌクレオシドの公知の質量を記載する。
図14Aは、5’−スルホ−Cy3を用いた21nt RNAの高収率の標識化を示すHPLCプロファイルである。図14Bは、より高い3’標識化効率を得るために合成されるA(5’)pp(5’)Cp−TEG−ビオチン−3’の構造である。
図15Aは、3’末端でのビオチン標識化および5’末端でのスルホ−Cy3標識化の後の5種のRNAの同時的配列決定を示す。図15Bは、3’末端でのビオチン標識化および5’末端でのスルホ−Cy3標識化の後の12種のRNAの同時的配列決定を示す。異なる配列読み取りデータのより良好な可視化のために各ラダーにつき2minを追加することによって、保持時間を調整した。 図15Aは、3’末端でのビオチン標識化および5’末端でのスルホ−Cy3標識化の後の5種のRNAの同時的配列決定を示す。図15Bは、3’末端でのビオチン標識化および5’末端でのスルホ−Cy3標識化の後の12種のRNAの同時的配列決定を示す。異なる配列読み取りデータのより良好な可視化のために各ラダーにつき2minを追加することによって、保持時間を調整した。
図16Aは、ビオチン標識をRNAの3’末端に導入するための方法である。図16Bは、RNA#1の3’ビオチン標識化された質量−RTラダーのRTの体系的変化に基づく質量−保持時間(RT)プロット上での5’ラダーおよび他の望ましくない断片からの3’ラダーの分離を示す。配列を、SIに記載のアルゴリズムによって自動的にde novoで生成した。図16Cは、5’ビオチン標識化後の異なる長さの2つのRNA(RNA#1およびRNA#2)の同時的配列決定を示す。提示される配列を、自動的に生成されフィルタリングおよびプロセッシングされたデータから同定された質量−RTラダーに基づいて手動で獲得した。
図17Aは、任意のRNAの、それぞれ、5’末端に疎水性シアニン3(Cy3)を、3’末端にビオチンを導入することによって、2つの一連のラダー断片(5’対3’)を互いに区別するための一般的な戦略を示す。図17Bは、5’−Cy3標識化された、および3’−ビオチン標識化されたRNA#1から配列決定するのに必要とされる全てのラダー断片を含有する試料の質量−RTプロットを示す;ラダーの区別は、2つのタグによって得られたRTの有意な変化に起因して起こり得る。自動的に生成された質量−RTプロットに由来するフィルタリングおよびプロセッシングされたデータから同定された両方の質量−RTラダーから、配列を手動で読み取った。
図18Aは、5’末端でのスルホ−Cy3によるRNA#11の高収率の標識化のためのHPLCプロファイルを示す。図18Bは、A(5’)pp(5’)Cp−TEG−ビオチン−3’を使用する、3’末端でのビオチンによるRNA#11の高収率の標識化のためのHPLCプロファイルを示す。図18Cは、それぞれ、5’および3’末端でのより高い標識化効率を達成するために適用された、スルホ−Cy3マレイミドおよびA(5’)pp(5’)Cp−TEG−ビオチン−3’の構造を示す。 図18Aは、5’末端でのスルホ−Cy3によるRNA#11の高収率の標識化のためのHPLCプロファイルを示す。図18Bは、A(5’)pp(5’)Cp−TEG−ビオチン−3’を使用する、3’末端でのビオチンによるRNA#11の高収率の標識化のためのHPLCプロファイルを示す。図18Cは、それぞれ、5’および3’末端でのより高い標識化効率を達成するために適用された、スルホ−Cy3マレイミドおよびA(5’)pp(5’)Cp−TEG−ビオチン−3’の構造を示す。
図19Aは、CMC−Ψを形成し、非変換Ψを含有する質量−RTラダーと比較して、質量とRTの両方においてCMC−Ψ含有質量−RTラダーをシフトさせる、N−シクロヘキシル−N’−(2−モルホリノエチル)−カルボジイミドメト−p−トルエンスルホネート(CMC)との反応によるシュードウリジン(Ψ)の化学的変換を示す。図19Bは、1個のΨを含有する、RNA#12の配列決定を示す。CMC変換されたΨ(Ψとして描かれる)は、RTと質量の両方のシフトをもたらし、質量−RTラダーにおける単一の劇的なジャンプのため、この位置でのΨの容易な同定および位置特定(location)を可能にする。図19Cは、2個のΨを含有する、RNA#13の配列決定を示す。CMC変換されたΨ(Ψとして描かれる)はそれぞれ、質量−RTラダーの劇的なジャンプをもたらし、RNA配列中のΨの位置に対応する。可視化を容易にするために、5’質量−RTラダーの配列のみが提示される。
図20は、それぞれのRNAの3’末端の単一の図20Aのビオチン標識または5’末端の図20Bのスルホ−Cy3標識のいずれかと共に12種のRNAを含有する混合試料の同時的配列決定を示す(RNA#12は、3’−ビオチン標識化された試料混合物中にのみ存在し、したがって、図20Aは図20Bと比較して1つのさらなる配列を含有する)。可視化を容易にするために、RTを正規化した(方法)。
図21は、LC/MS配列決定および定量を示す。図21Aは、20%のmC改変RNA(RNA#14)と、80%の非改変RNA(RNA#3)とを含有する混合物の配列決定を示す。両曲線は、最初のCに達するまで同一の配列を共有する;mC末端ラダー断片のRTは、その非改変対応物と比較して、シフトアップし(メチル基に由来する疎水性の増大のため)、質量はわずかに増加した(さらなるメチル基に由来する14Daの質量の増加のため)。両配列を、アルゴリズムによりプロセッシングされたデータから同定された質量−RTラダーから手動で読み取った。図21Bは、改変を含むRNAと、そのカノニカルな対応物RNAとの化学量論/パーセンテージの定量を示す。異なる標識生成物種の抽出イオン電流(EIC)を積分することによって、相対パーセンテージを定量し、それらは、これらのRNA試料を標識化するために最初に使用される絶対量の比とよく一致する、すなわち、混合試料中のmC改変RNAのパーセンテージは、標識化するために最初に使用されたそのモル比から算出された、それぞれ、10%、20%、30%、40%、50%および100%であった。
図22Aは、in silicoで生成された合成の非改変A10(10マーのポリアデニン)配列の非標識3’および5’質量ラダーを示す。図22Bは、in silicoで生成された合成の5’−Cy3標識A10(10マーのポリアデニン)配列の5’および3’質量ラダーを示す。
図23は、フィルタリングおよびプロセッシングされたデータから同定された質量−RTラダーを含有する自動的に生成された質量−RTプロットに由来する手動で読み取った配列データを含有する、5’−スルホ−Cy3標識化されたRNA#1に由来するラダー断片と、その3’非標識ラダー断片との完全なセットを含有する試料の質量−RTプロットを示す。
図24は、図24Aの1個のΨ塩基を含有する20ntのRNA(RNA#12)および図24Bの2個のΨ塩基を含有する20ntのRNA(RNA#13)中の、シュードウリジン(Ψ)のそのN−シクロヘキシル−N’−(2−モルホリノエチル)−カルボジイミドメト−p−トルエンスルホネート(CMC)付加物への変換後の粗生成物のHPLCプロファイルを示す。
図25は、20ntのRNAの最終的な配列を報告する前に5’ラダー中のギャップを埋め、したがって、観測質量が提唱された配列に由来する理論質量の一覧と一致する、図25Aの5’ラダー、図25Bの3’ラダー、および図25Cの内部断片を含む3つの情報を合わせることによって方法の精度を増大させるための元の5’または3’末端のいずれかを有しない内部断片の利用を示す。
本開示を特定の実施形態に関して説明するが、本開示の精神から逸脱することなく、様々な改変、再配列、および置換を行うことができることが当業者には容易に明らかとなるであろう。本開示の範囲は、本明細書に添付される特許請求の範囲によって定義される。
本開示の原理の理解を促進するために、ここで、図面に例示される例示的実施形態を参照し、特定の用語を使用して、それを説明する。それにも関わらず、本開示の範囲の限定はそれによって意図されないことが理解されるであろう。関連する業界における当業者および本開示の所有権を有する当業者であれば想到するであろう、本明細書に例示される本発明の特徴の任意の変更およびさらなる改変、ならびに本明細書に例示される本開示の原理の任意のさらなる適用は、本開示の範囲内にあると考えられるべきである。
本開示は、cDNA合成なしにRNAを直接配列決定する、単一ヌクレオチド分解能でRNA分子のヌクレオチド配列を同時に決定し、ならびに標的RNA改変の存在を検出するために使用することができる、直接的な、液体クロマトグラフィー−質量分析(本明細書ではLC−MSと称される)に基づくRNA配列決定方法に関する。開示される方法を使用して、RNA試料内の改変の型、位置および量を決定することができる。配列決定しようとするRNAは、限られた多様性の精製されたRNA試料、および生体試料に由来するRNAなどの、RNAの複雑な混合物を含有するRNAの試料であってもよい。そのような技術を使用して、RNA分子のヌクレオチド配列を決定し、任意の所与のRNA分子の生物学的機能と、その関連する改変とを有利に相関させることができる。
本明細書で使用される場合、リボ核酸(RNA)とは、オリゴリボヌクレオチドまたはポリリボヌクレオチドならびに例えば、ヌクレオチドアナログから作製されるRNAのアナログを指す。RNAは、典型的には、アデニン(A)、グアニン(G)、シトシン(C)およびウラシル(U)の塩基部分、リボースの糖部分ならびにリン酸結合のリン酸部分を有する。RNA分子は、天然RNAと、人工RNAアナログとの両方を含む。RNAは、合成のものであってもよく、または特定の選択される手順が、特定の生体試料にとって適切である、当業界で周知であるいくつもの手順を使用して特定の生体試料から単離してもよい。RNA試料は、例えば、数例を挙げると、mRNA、tRNA、アンチセンスRNA、およびsiRNAを含む。RNAの塩基長には制限は課されない。本明細書に開示されるLC−MSに基づく配列決定方法は、精製されたRNA試料だけでなく、異なるRNAの混合物を含有するより複雑なRNA試料の配列決定をも可能にする。
特定の実施形態では、治療的に有用な合成オリゴリボヌクレオチドの構造を、本明細書に開示される配列決定方法を使用して決定することができる。そのような方法は、RNAに基づく治療剤の研究、製造、および品質管理に従事する者、ならびに規制当局にとって特に有用であろう。合成オリゴリボヌクレオチドへの構造改変の組込みは、ポリマーの物理特性および薬物動態パラメーターを改善するための証明された戦略であった。しかしながら、合成オリゴヌクレオチドおよび高度に改変されたオリゴヌクレオチドの特性評価および構造解明は、依然として大きな障害である。
RNAの配列決定に加えて、本明細書で開示される方法を使用して、DNAの配列を決定することができる。本明細書で使用される場合、デオキシ核酸(DNA)とは、オリゴヌクレオチドまたはポリヌクレオチドならびに例えば、ヌクレオチドアナログから作製されるDNAのアナログを指す。DNAは、典型的には、アデニン(A)、グアニン(G)、シトシン(C)およびチミン(T)の塩基部分、デオキシリボースの糖部分ならびにリン酸結合のリン酸部分を有する。DNA分子は、天然DNAと、人工DNAアナログとの両方を含む。DNAは、合成のものであってもよく、または特定の選択される手順が、特定の生体試料にとって適切である、当業界で周知であるいくつもの手順を使用して特定の生体試料から単離してもよい。DNA試料は、例えば、数例を挙げると、ゲノムDNAおよびミトコンドリアDNAを含む。DNAの塩基長には制限は課されない。適切な酵素的および/または化学的分解があれば、本明細書に開示されるLC−MSに基づく配列決定方法は、精製されたDNA試料だけでなく、異なるDNAの混合物を含有するより複雑なDNA試料の配列決定をも可能にする。本発明の非限定的な実施形態では、DNAの酵素的分解を、DNA制限エンドヌクレアーゼを使用して達成することができる。
一態様では、本発明の配列決定方法は、(i)5’および3’末端標識化されたRNAプールのその後の分離を容易にするためのRNA試料の5’および3’末端の親和性標識化ステップ;(ii)RNAの無作為な非特異的切断ステップ;(iii)親和性に基づく相互作用を使用した得られた標的RNA断片の物理的分離ステップ;(iv)液体クロマトグラフィー(LC)および高分解能質量分析(MS)を用いた得られた質量ラダーのLC/MS測定ステップ;ならびに(v)配列生成および改変分析ステップを含む。
ある実施形態では、一次RNA配列およびRNA改変の存在/同定を決定するためのRNA配列決定方法であって、(i)RNAの5’および/または3’末端の標識化ステップ;(ii)RNAの無作為分解ステップ;(iii)必要に応じて、5’および3’末端標識化に基づく得られたRNA断片の物理的分離ステップ;(iv)得られたRNA断片特性の分離および検出ステップ;ならびに(v)配列/改変同定をもたらすデータ分析ステップを含む、方法が提供される。
ある実施形態では、一次RNA配列およびRNA改変の存在/同定を決定するためのRNA配列決定方法であって、(i)N−シクロヘキシル−N’−(2−モルホリノエチル)−カルボジイミドメト−p−トルエンスルホネート(CMC)による、配列決定しようとするRNAの処理ステップ;(ii)RNAの5’および3’末端の親和性標識化ステップ;(iii)RNAの無作為分解ステップ;(iv)必要に応じて、親和性相互作用に基づく得られたRNA断片の物理的分離ステップ;(v)質量分析とカップリングした逆相高速液体クロマトグラフィー(HPLC)またはキャピラリー電気泳動(CE)または他の分離方法を使用する得られたRNA断片の測定ステップ;および(v)配列/改変同定をもたらすMSデータ分析ステップを含む、方法が提供される。
特定の態様では、方法は、(i)ビオチン/ストレプトアビジン親和性に基づくラダー断片の物理的分離のための5’および3’RNAの化学的標識化、(ii)ギ酸媒介性RNA分解、(iii)5’および3’標識化されたRNAの物理的分離、(iv)断片の高速液体クロマトグラフィー(HPLC)による分離、(v)逐次的ESI−四重極−飛行時間(Q−TOF)−MSに基づく質量検出、ならびに(vi)質量スペクトルから関連する質量ピークを抽出し、整列させ、プロセッシングする単純なコンピューターアルゴリズムに基づくデータ分析からなる。
別の特定の例では、方法は、(i)保持時間を増加させるためにRNA断片のサイズを増加させるように設計された、Cy3のような嵩高い疎水性タグによるRNAの5’末端の化学的標識化、およびビオチンのような親和性タグによる3’末端の標識化、またはその逆を行い、したがって、物理的分離の必要なしに配列同定を可能にすること、(ii)ギ酸媒介性RNA分解、(iii)断片の高速液体クロマトグラフィー(HPLC)による分離および逐次的ESI−四重極−飛行時間(Q−TOF)−MSに基づく質量検出、ならびに(iv)質量スペクトルから関連する質量ピークを抽出し、整列させ、プロセッシングする単純なコンピューターアルゴリズムに基づくデータ分析からなる。
本発明の実施において使用することができるそのような非限定的なコンピューターアルゴリズムとしては、例えば、その全体が参照により本明細書に組み込まれる2019年5月24日に出願されたPCT/US19/33895に開示されたものが挙げられる。
本明細書に開示される配列決定方法は一般に、MS分析のための分解された標的RNA断片の2つの5’および3’ラダープールの形成および逐次的物理的分離に基づくものであるが、標識RNA分解断片は、非標識RNA分解断片と比較して、保持時間シフトを有し、LC/MSステップ後に2次元質量−保持時間プロットにおいて区別することができるため、ラダープールの物理的分離は必要なステップではない。
本明細書に開示される配列決定方法における1つのステップとして、配列決定しようとするRNAは、無作為の制御された分解にかけられる。本明細書で使用される場合、分解および切断という用語は、互換的に使用することができる。RNAの分解、または切断とは、RNAの2つまたはそれより多い断片への断片化をもたらすRNA鎖の破壊を指すことが理解される。一般に、本開示の目的のためのそのような断片化は、無作為である。しかしながら、部位特異的断片化を用いることもできる。分解しようとするRNAの天然の性質を有利に使用して、液体クロマトグラフィー−質量分析(LC−MS)によるその後の配列決定のための、配列ラダー、すなわち、質量ラダーを生成することができる。分解試薬への曝露のタイミングを制御することによって、標的RNA分子の骨格に沿った単一であるが、無作為化された切断を達成し、したがって、下流のMSデータ分析を単純化することができる。
一態様では、標的RNA分子は、分解された標的RNA断片のラダープールを形成させるために、無作為な化学的切断に曝露される。好ましい実施形態では、化学的切断は、ギ酸の使用によって達成される。ギ酸の沸点は水と同様、約100℃であり、ギ酸は例えば、凍結乾燥機またはSpeedvacによってそれを容易に除去することができるため、ギ酸分解が好ましい。そのような切断は、分子を通してその5’リボース位置でRNA分子を切断するように設計される。ギ酸分解に加えて、アルカリ分解を使用することもできる。例えば、以下のアルカリ緩衝液を使用して、RNA試料を分解することができる:1Xアルカリ加水分解緩衝液(例えば、50mM炭酸ナトリウム[NaHCO/NaCO]pH9.2、1mM EDTA;またはAmbionのRNA等級リボヌクレアーゼを添加したアルカリ加水分解緩衝液)。化学的切断に加えて、RNAを酵素的分解にかけることができる。RNAを分解するために使用することができる酵素としては、例えば、CrotalusのホスホジエステラーゼI、ウシ脾臓ホスホジエステラーゼIIおよびXRN−1エキソリボヌクレアーゼ(exoribonucease)が挙げられる。そのようなRNA分解処理は、所望の単一切断事象がRNA分子上で起こり、示差的に切断されたRNA断片のプールをもたらし、完全なラダーをもたらす条件下で行われる。
本明細書に開示される配列決定方法におけるさらなるステップとして、RNA断片の末端は、切断混合物内での断片化された5’または3’標識断片プールの分離のための手段を提供するために利用することができる親和性相互作用をもたらすための標識化である。そのような親和性相互作用は、当業者には周知であり、例えば、数例を挙げると、抗原と抗体との間、酵素と基質との間、受容体とリガンドとの間、またはタンパク質と核酸との間のものなどの親和性に基づく相互作用を含む。親和性分離における使用のための断片化されたRNAの5’および3’末端の標識化を、当業者には周知の様々な異なる方法を使用して達成することができる。そのような標識化は、その後のMS分析のための断片化されたRNAの分離を達成するように設計される。RNA末端標識化を、RNAの化学的切断の前または後に実施することができる。
好ましい実施形態では、ビオチン/ストレプトアビジン相互作用を利用して、ラダーRNA断片について富化することができる。さらに別の好ましい実施形態では、ポリ(A)オリゴヌクレオチド/dT相互作用を使用して、断片化されたRNAを分離することができる。RNAの末端がビオチン部分で標識化される例では、ストレプトアビジンビーズを使用して、所望のRNAラダー断片を精製することができる。あるいは、RNAがポリ(A)DNAオリゴヌクレオチドで標識化されている場合、(dT)25−セルロースビーズ(New England Biolabs)などのオリゴポリ(dT)固定ビーズを使用して、RNA断片について富化することができる。クロマトグラフィー材料の選択は、使用される5’および3’RNAの標識化に依存し、そのようなクロマトグラフィー/分離材料の選択は、当業者には周知である。
一例として、3’および5’RNA末端を、ストレプトアビジンビーズの使用によるビオチン/ストレプトアビジン相互作用に基づくその後のRNA断片の分離のために、ビオチンで標識化することができる。さらに別の態様では、短いDNAアダプターを、RNA試料のそれぞれの末端にライゲーションすることができる。RNAの3’末端を、T4 RNAリガーゼを用いて5’リン酸末端ペンタマーキャップ付光切断性ポリ(A)DNAオリゴヌクレオチドにライゲーションして、ホスホジエステル結合したRNA−DNAハイブリッドを形成させることができる。次いで、RNA−DNAハイブリッドの5’末端を、T4 RNAリガーゼを使用するT4ポリヌクレオチドキナーゼによるリン酸化の後に5’ビオチン化DNAにライゲーションすることができる。
特定の実施形態では、2つの短いDNAアダプターを、RNA試料のそれぞれの末端にライゲーションして、粗分解生成物混合物中の1つより多いホスホジエステル結合が切断された望ましくない断片に由来する5’または3’ラダープールのいずれかにおいて所望の断片を物理的に選択した後、その多くが完全な配列ラダーを得るのに必要とされる所望の断片に変化する、多くのRNA試料の分解をもたらすギ酸分解時間を長くする。RNA試料の3’末端を、T4 RNAリガーゼ1(New England Biolabs)を用いて5’リン酸末端ペンタマーキャップ付光切断性ポリ(A)DNAオリゴヌクレオチドにライゲーションして、ホスホジエステル結合したRNA−DNAハイブリッドを形成させる。同様に、RNA−DNAハイブリッドの5’末端を、同じリガーゼを用いるT4ポリヌクレオチドキナーゼによるリン酸化の後に5’−ビオチン化DNAにライゲーションする。得られた5’DNA−RNA−DNA−3’ハイブリッドを、約5〜15分間ギ酸で処理する。ギ酸処理後、ストレプトアビジン結合ビーズ(ThermoFisher Scientific)を使用して、5’ラダー断片プールを単離した後、その後のLC/MS分析のためにオリゴマーを放出させることができる。同様に、(dT)25−セルロースビーズ(New England Biolabs)などのオリゴポリ(dT)固定ビーズを使用して、5’ラダーを富化した後、UV光(300〜350nm)による光切断後にLC/MS分析のために溶出させることができる。ハイブリッドのRNAセクションのみが加水分解されるが、DNAは2’−OH基を欠くため、DNAセクションは無傷のままであろう。特定の実施形態では、RNA試料のそれぞれの末端に、2ステップ反応によってビオチンタグが付加される。第1のステップとして、T4ポリヌクレオチドキナーゼと、アデノシン5’−[γ−チオ]三リン酸(ATP−γ−S)とを反応させて、配列決定しようとするRNAの5’ヒドロキシル基にチオホスフェートを付加することによって、チオール含有ホスフェートを5’末端に導入した後、得られたチオールリン酸化されたRNAと、1つまたは複数のチオール基を含有するタンパク質、核酸、または他の分子をビオチン化するために設計される、ビオチン(Long Arm)マレイミド(Vector Laboratories、米国)との間でコンジュゲーション付加を行う。次いで、得られた5’ビオチン化RNAを、以前の手順と同様、ギ酸で処理する(13)。酸分解の後、ストレプトアビジン結合ビーズ(Thermo Fisher Scientific、米国)を使用して、ビオチン−ストレプトアビジン相互作用を破壊した後、その後のLC/MS分析のために放出されるであろう、5’ラダープールを選抜する。本明細書に開示される配列決定方法は一般に、MS分析のための分解された標的RNA断片の5’および3’ラダープールの形成および逐次的物理的分解に基づくものであるが、ラダープールの物理的分離は必要なステップではない。標識RNA分解断片は、LC/MSステップによって区別することができる非標識RNA分解断片と比較して、保持時間シフトを有するであろう。特定の実施形態では、保持時間シフトを増加させるために、RNAを、例えば、疎水性Cy3もしくはCy5タグまたは他の蛍光タグなどの嵩高い部分で標識化してもよい。そのようなタグは、RNA試料の5’末端に、2ステップ反応によって付加される。第1のステップとして、T4ポリヌクレオチドキナーゼと、アデノシン5’−[γ−チオ]三リン酸(ATP−γ−S)とを反応させて、配列決定しようとするRNAの5’ヒドロキシル基にチオホスフェートを付加することによって、チオール含有ホスフェートを5’末端に導入した後、得られたチオールリン酸化されたRNAと、1つまたは複数のチオール基を含有するタンパク質、核酸、または他の分子をビオチン化するために設計される、Cy3またはCy5マレイミド(Tenova Pharmaceuticals、米国)との間でコンジュゲーション付加を行う。3’末端ビオチン標識化および酸分解の後、得られた2つの末端標識化されたRNAを、いかなる親和性に基づく物理的分離も用いずにLC/MSに直接かける。
3’末端標識化のために、親和性タグを使用した場合に5’ラダープール(LC/MSによって分析される)を単離した後、元の3’−ヒドロキシル基の全てと共に3’ラダープールを含有する、残りの残留物を、3’末端標識化にかける。この目的のために、ビオチン化シチジンビスリン酸(pCp−ビオチン)を、ATPおよびMth RNAリガーゼを使用するアデニル化によって活性化して、AppCp−ビオチンを産生する。次いで、遊離3’末端ヒドロキシルを含む3’ラダープールのメンバーを、T4 RNAリガーゼによって活性化された5’−ビオチン化AppCpにライゲーションし、したがって、3’ラダープール中の各配列の3’末端がビオチン標識化されるようになる。同様に、ストレプトアビジン結合ビーズを使用して、ビオチン−ストレプトアビジン相互作用を破壊した後にその後のLC/MS分析のために放出される(5’ラダープールから分離される)3’ラダープールを単離する。
RNA断片プールの分離を実施したら、質量分析とカップリングした液体クロマトグラフィー、または質量分析とカップリングしたキャピラリー電気泳動または当業界で公知の他の方法を含む様々な手段のいずれかによって、RNA断片を分析することができる。好ましい質量分析装置の形式としては、連続またはパルス電子スプレー(ESI)および関連する方法またはMALDI−MSのようなRNA断片を検出することができる他の質量分析装置が挙げられる。高分解能飛行時間または5ppm未満の質量精度を有するOrbitrap質量分析装置を使用して、HPLC−MS測定を実施することができる。そのような質量分析装置の使用は、RNA配列中のシトシン塩基とウリジン塩基との間の正確な識別を容易にする。本発明の一態様では、質量分析装置は、Waters XBridge C18カラム(3.5μm、1x100mm)を備えたAgilent 6550および1200シリーズのHPLCである。移動相Aは、水性200mMのHFIP(1,1,1,3,3,3−ヘキサフルオロ−2−プロパノール)および1〜3mMのTEA(トリエチルアミン)、pH7.0であってよく、移動相Bはメタノールであってよい。特定の非限定的な実施形態では、20μLの10μM試料溶液のためのHPLC法は、0.1mL/分で20〜40分にわたる2%〜5%から20%〜40%のBへの直線的増加であり、カラムは50または60℃に加熱した。試料の溶出を、260nmの吸光度によってモニタリングし、溶出液を、8.0L/minの窒素ガス流、35psigのネブライザー圧およびネガティブモードで3500Vのキャピラリー電圧を用いて325℃で乾燥しながらESI源に直接通過させた。
LC−MSデータは、RNA配列情報に変換される。RNA分子上のそれぞれのカノニカルなリボヌクレオチドおよびその関連する改変のユニークな質量タグにより、RNAの一次ヌクレオチド配列を決定するだけでなく、RNA改変の存在、型および位置も決定することができる。
DNAの事象では、LC−MSデータは、DNA配列情報に変換される。DNA分子上のそれぞれのカノニカルなデオキシヌクレオチドおよびその関連する改変のユニークな質量タグにより、DNAの一次ヌクレオチド配列を決定するだけでなく、DNA改変の存在、型および位置も決定することができる。特定の実施形態では、所望の断片および/または望ましくない断片のLC/MSデータを含有する、LC−MSに由来する生データは、その後、配列アラインメントおよび塩基改変の検出のために使用される。質量および保持時間に依拠した2次元データ分析に加えて、例えば、配列決定のために質量と一緒に使用することができるユニークな電気シグナルまたは光学的シグネチャシグナルなどの、RNA断片の他のユニークな特性に基づいて、さらなる型の2次元またはさらには3次元データ分析を実施することができることが理解される。
解析データから質量付加物を除去し、質量と保持時間データとの両方を使用して、配列を推測/生成することができる。断片に関する保持時間とカップリングした質量データを分析して、どのデータポイントが「有効」であり、その後の配列決定のために使用するべきかを決定し、どのデータポイントがフィルタリングアウトされるべきかを決定する。データ整理ステップの後、2つの隣接するRNA断片間の質量差(m)[m=m(i)−m(i−1)、1<i<n、n=RNAの長さ](式中、m(i)は任意のラダー断片の質量であり、m(i−1)は先行するより下の質量ラダー断片である)は、そのような質量差を、公知のヌクレオチド断片の正確な質量と一致させて、質量差に基づいて誘導されるRNA配列決定情報を相関させ、RNA配列およびその改変を決定する。RNAヌクレオシド上の構造改変が質量を変更するものである限り、開示される配列決定方法は、RNA配列の同定およびその改変の同定を可能にするであろう。あらゆる公知の改変リボヌクレオシドの質量を、公知のRNA改変データベース(12)から、または添付される図13の使用によって都合良く回収することができる。
本明細書で提供される実施例および実施形態は、例示的な実施形態例であることが理解されるべきである。当業者であれば、本明細書の開示の範囲と一致する実施例および実施形態の様々な改変を想定するであろう。そのような改変は、特許請求の範囲によって包含されることが意図される。本明細書で提供される実施例は、単に本明細書の開示を増補するために含まれるのであり、いかなる点でも限定であると考えられるべきではない。
材料および方法
以下に列挙されるRNAオリゴヌクレオチドは、Integrated DNA Technologies(Coralville、IA、米国)から得られたものである。RNA鎖の配列は以下の通りである:
Figure 2021525507
ビオチン化シチジンビスリン酸(pCp−ビオチン)、{Phos(H)}C{BioBB}は、TriLink BioTechnologies(San Diego、CA、米国)から得た。T4 DNAリガーゼ1、T4 DNAリガーゼ緩衝液(10x)、反応緩衝液(10x)、1mM ATP、およびMth RNAリガーゼを含むアデニル化キットは、New England Biolabs(Ipswich、MA、米国)から得た。5’末端タグ核酸標識化システムキットおよびビオチンマレイミドは、Vector Laboratories(Burlingame、CA、米国)から購入した。ストレプトアビジン磁気ビーズは、Thermo Fisher Scientific(Waltham、MA、米国)から得た。
3’末端標識化法
アデニル化:RNaseを含有しない薄壁の0.5mL PCRチューブ中、10μLの合計反応容量を用いて、以下の反応を設定した:1xアデニル化反応緩衝液、100μMのATP、5.0μMのMth RNAリガーゼ、10.0μMのpCp−ビオチン、およびヌクレアーゼ非含有脱イオン水(Thermo Fisher Scientific、米国)。反応物を、GeneAmp(商標)PCR System 9700(Thermo Fisher Scientific、米国)中、65℃で1時間インキュベートした後、85℃で5分間、Mth RNAリガーゼ酵素を不活化した。
ライゲーション:30μLの反応溶液は、アデニル化ステップに由来する10μLの反応溶液、10x反応緩衝液、5μMのRNA(それぞれ、19nt、20ntまたは21nt)、10%(v/v)のDMSO(無水ジメチルスルホキシド、99.9%、Sigma−Aldrich、米国)、T4 RNAリガーゼ(10ユニット)、およびヌクレアーゼ非含有脱イオン水を含有していた。反応物を、16℃で一晩インキュベートした後、以下のようにカラム精製した。
カラム精製:Oligo Clean & Concentrator(Zymo Research、Irvine、CA、米国)を使用して、酵素、遊離ビオチン、および短いオリゴを除去した。100μLのオリゴ結合緩衝液を、50μLの試料に添加した(20μLのヌクレアーゼ非含有水を添加して、試料の総量を50μLにした)。400μLのエタノールを添加し(200プルーフ、100%、Decon Labs、米国)、ピペッティングにより溶液を簡単に混合し、混合物を、収集チューブ中の提供されたカラムに移した。次いで、試料を10,000rcfで30秒間遠心分離し、フロースルーを廃棄し、750μLのDNA洗浄緩衝液をカラムに添加した。次いで、試料を再度10,000rcfで30秒間遠心分離し、フロースルーを廃棄した後、最大速度で1分間、遠心分離した。カラムをマイクロ遠心チューブに移し、15μLのヌクレアーゼ非含有水をカラムマトリックスに直接添加し(1分のインキュベーション時間で)、試料を10,000rcfで30秒間遠心分離して、オリゴヌクレオチドを溶出させた。
(ng/μL)で報告された精製RNAの濃度を、NanoDrop 1000分光光度計(Thermo Fisher Scientific Waltham、MA、米国)によって測定した。
%で表したRNAオリゴの3’または5’末端へのビオチン標識化の効率を、出発材料の質量(m/z)および標識化された生成物の質量(m/z)でのピーク強度の算出に基づいて、Voyager−DE Biospectrometry Workstation(Jet Propulsion Laboratory、米国)によるマトリックス支援レーザー脱離イオン化飛行時間質量分析(MALDI−TOF MS)によって測定した。
5’末端標識化法
RNAの5’末端へのビオチンの標識化には、2つのステップが必要である:T4ポリヌクレオチドキナーゼ(NEB、米国)により、ATPγSから標的RNAの5’ヒドロキシル基にチオホスフェートを移す;ビオチンマレイミドの添加後、チオール反応性標識を、標的RNAの5’末端に化学的にカップリングする。実験プロトコールは、以下の通りである。反応液の総量を、ヌクレアーゼ非含有脱イオン水を用いて10μLにしながら、以下のもの:10x反応緩衝液、30μMのRNA(それぞれ、19nt、20nt、または21nt)、0.1mMのATPγS、10ユニットのT4ポリヌクレオチドキナーゼを、RNaseを含まない、薄壁の0.5mL PCRチューブ中で混合した。この試料を混合し、37℃で30分間インキュベートした。次いで、5μLのビオチンマレイミドまたはCy3マレイミド(312μLの無水DMF(無水ジメチルスルホキシド、99.9%、Sigma−Aldrich、米国)に溶解)を添加し、混合し、試料を65℃で30分間インキュベートした。上記手順によると、同様にカラム精製が必要であった。
酸加水分解による分解
直接RNA配列決定は、分解性生成物の生成を利用し、単一の切断事象によって産生されるRNA断片を、化合物質量間の質量差の観察によって直接配列決定することができる。酸加水分解は、任意の出発材料からの複数の切断事象によって内部断片を迅速に生成することができ、したがって、特に、ギ酸は沸点が低く、したがって、凍結乾燥によって容易に除去することができるため、それはMSにおいて広く使用されている弱く揮発性の有機酸である。RNA試料は、ある時点でビオチン化されるか、またはそれぞれのRNA試料溶液を3つのより小さいものに等しく分割する。1つは2分間、1つは5分間、および1つは15分間、40℃の50%(v/v)ギ酸を使用する酸分解によってアリコートを分解した後、それらを1回のLC/MS測定のために全て一緒に混合する。反応混合物を、ドライアイス上ですぐに凍結した後、乾燥するまで凍結乾燥し、典型的には、1h以内に完了させた。その後のビオチン/ストレプトアビジン捕捉/放出ステップのために、乾燥した試料を、20μLのヌクレアーゼ非含有脱イオン水中にすぐに懸濁したか、または−20℃で保存した。
LC−MS配列決定ラダーを生成するためのビオチン/ストレプトアビジン捕捉/放出ステップ
ビオチン/ストレプトアビジン捕捉は、ストレプトアビジンで被覆された磁気ビーズを使用して、ビオチン標識RNAに結合させるが、それらはストレプトアビジンで被覆された磁気ビーズ上に固定され、磁石に引き寄せられる。したがって、結合したRNAを、非ビオチン標識RNAおよび不純物から単離するべきであり、後にLC−MS配列決定分析のためにビーズから溶出させることができる。
等量の1xB&W緩衝液を最初に添加することによって、200μLのDynabeads(商標)MyOne(商標)ストレプトアビジンC1ビーズ(Thermo Fisher Scientific、米国)を調製した。この溶液をボルテックスし、2分間磁石上に置いた後、上清を廃棄した。ビーズを、200μLの溶液A(DEPC処理された0.1MのNaOHおよびDEPC処理された0.05MのNaCl)で2回、溶液B(DEPC処理された0.1M NaCl)中で1回洗浄した。最後に100μLの2xB&W緩衝液を添加して、ビーズの濃度を20mg/mLにした。等量のビオチン化RNAを1xB&W緩衝液中に添加し、穏やかに回転させながら室温で15分間試料をインキュベートし、チューブを磁石中に2分間入れ、上清を廃棄した。被覆されたビーズを、1xB&W緩衝液中で3回洗浄し、それぞれの洗浄ステップの上清の最終濃度を、回収分析のためにNanodropによって測定した。固定されたビオチン化RNAを放出させるために、ビーズを、95%ホルムアミド(Thermo Fisher Scientific、米国)を含む10mM EDTA(Thermo Fisher Scientific、米国)、pH8.2中、65℃で5分間インキュベートした。最後に、この試料チューブを、磁石中に2分間入れ、本発明者らは、ピペッティングにより上清を収集する。
LC−MS分析
MicroASオートサンプラーおよびSurveyor MS Pump Plus HPLCシステムを装備したAgilent 1290 Infinity LCシステム(Agilent Technologies、Santa Clara、CA、米国)に連結されたiFunnel Agilent 6550 Q−TOF上で、試料を分離および分析した。全ての分離を、1.7μmの粒径を有する50mm x 2.1mm Xbridge C18カラム(Waters、Milford、MA、米国)をわたる、10mMジイソプロピルアミン(DIPA)(Thermo Fisher Scientific、米国)、pH7.0を含む25mMヘキサフルオロ−2−プロパノール(HFIP)(Thermo Fisher Scientific、米国)としての水性移動相(A)およびメタノールとしての有機移動相(B)を使用して実施した。流量は0.3mL/分であり、全ての分離を、60℃に維持したカラム温度を用いて実施した。注入体積は20μLであり、試料の量は15〜400pmolのRNAであった。データを、負の極性で記録した。試料データを、Agilent Technologies MassHunter LC/MS Acquisitionソフトウェアを使用して獲得した。LC−MS実験から関連するスペクトルおよびクロマトグラフィー情報を抽出するために、MassHunter Qualitative Analysis(Agilent Technologies)中のMolecular Feature Extractionワークフローを使用した。この分子特性抽出アルゴリズムは、質量および保持時間の次元で非標的特性の発見を実行する。原理的には、化合物を同定することができる任意のソフトウェアを使用することができる。ソフトウェアの設定は、実験で使用されたRNAの量に応じて変化した。一般に、できるだけ多くの同定された化合物が含まれていた。プロファイルのスペクトルピークを、低濃度の試料については、5のシグナル対ノイズ比(SNR)閾値、より濃縮された試料については、最大で20のSNR閾値を使用してフィルタリングした。他のアルゴリズム設定は、以下の通りであった:「低分子(クロマトグラフィー)」抽出アルゴリズム、電荷状態−1〜−15、水素(−H)イオンのみ損失、「一般有機分子」アイソトープモデル、最小品質スコア70(0〜100の範囲)、および最小イオン計数500。
結果
RNA断片の2つのラダーの物理的分離に基づくRNA分子の配列を決定するための方法が提供される。この方法は、2つのラダーの物理的分離によって、どの断片がどのラダーに属するかに関していかなる混同も防止するように設計され、出力物は、第1世代の方法における2つのS字形曲線(分析がはるかにより難しい)よりもむしろ、ただ1つのS字形曲線を含有すると予想される。2つのラダーの逐次的分離の別の利益は、ラダー分離後、それぞれの得られたLC/MSデータセットサイズが分離されていない前駆体のデータセットのサイズの半分未満になるため、塩基コール手順の単純化である。これらの2つの好ましい因子の助力を得て、当業者であれば、1つより多い鎖を含むより複雑なRNA試料を、その関連する改変を同時に分析しながら、配列決定することができる。実験を、図1に示されるように設計して、所望の断片を、5’または3’ラダープールのいずれかに物理的に分離した。ビオチンタグを、2ステップ反応によって、RNA試料のそれぞれの末端に付加した:(i)T4ポリヌクレオチドキナーゼと、アデノシン5’−[γ−チオ]三リン酸(ATP−γ−S)とを反応させて、配列決定しようとするRNAの5’ヒドロキシル基にチオホスフェートを付加することによる、チオール含有ホスフェートの5’末端への導入、次いで、(ii)得られたチオールリン酸化されたRNAと、1つまたは複数のチオール基を含有するタンパク質、核酸、または他の分子をビオチン化するために設計される、ビオチン(Long Arm)マレイミド(Vector Laboratories、米国)との間でのコンジュゲーション付加。次いで、得られた5’ビオチン化RNAを、以前の手順(6)と同様、ギ酸で処理する。酸分解の後、ストレプトアビジン結合ビーズ(Thermo Fisher Scientific、米国)を使用して、ビオチン−ストレプトアビジン相互作用を破壊した後、その後のLC/MS分析のために放出されるであろう、5’ラダープールを選抜する。
5’ラダープール(LC/MSによって分析される)を単離した後、元の3’−ヒドロキシル基の全てと共に3’ラダープールを含有する、残りの残留物を、3’末端標識化にかける。この目的のために、ビオチン化シチジンビスリン酸(pCp−ビオチン)を、ATPおよびMth RNAリガーゼを使用するアデニル化によって活性化して、AppCp−ビオチンを産生する。次いで、遊離3’末端ヒドロキシルを含む3’ラダープールのメンバーを、T4 RNAリガーゼによって活性化された5’−ビオチン化AppCpにライゲーションし、したがって、3’ラダープール中の各配列の3’末端がビオチン標識化されるようになる。同様に、ストレプトアビジン結合ビーズを使用して、ビオチン−ストレプトアビジン相互作用を破壊した後にその後のLC/MS分析のために放出させることができる、3’ラダープールを単離する(5’ラダープールから分離する)。
一連の合成RNAオリゴ(19nt、20nt、および21ntのRNA;配列に関する方法を参照されたい)を設計し、個別試験および群試験のためのモデルRNAオリゴヌクレオチドとして合成した。ビオチン標識化された5’末端を、上記の2ステップ反応を使用して取得した。LC/MS分析のための5’ラダープールの酸分解およびビーズ分離の後、残りの残留物を、3’標識化にかけた。次いで、3’配列ラダーのメンバーも、ビオチン末端標識化し、ストレプトアビジン捕捉した後、上記のLC/MS分析のために放出させた。
tRNAはタンパク質合成において非常に重要であり、その発現および変異は神経病理およびがん発症などの様々な疾患に大きく影響するため(7〜10)、実験はtRNA配列決定を重視して実施した。しかしながら、効率的なtRNA配列決定方法の欠如は、生物学的および生化学的プロセスにおけるtRNAの構造および機能研究を妨げてきた。tRNAは、標準的な配列決定方法をまだ効率的に適用することができない小さい細胞RNAの1つのクラスである(11);tRNAの配列決定に関する大きな障害物は、cDNA合成およびアダプターライゲーションを阻害し得る、いくつかの転写後改変の存在およびその安定かつ広範な二次構造を含む。しかしながら、tRNAの長さは60〜95ntの範囲であり、平均の長さは76ntであるため、それは、本明細書に開示されるLC/MSに基づく直接配列決定において使用するための非常に良好なシステムである。
LC/MSに基づく方法を用いてtRNAを直接配列決定するために、配列決定の成功のためにTリボヌクレアーゼを使用して、完全なtRNAをより小さい断片に部分消化した。グアノシン残基の後ろの一本鎖RNAホスホジエステル結合を特異的に切断し、3’−リン酸化された末端を産生する部分Tリボヌクレアーゼ消化(図2)を、フェニルアラニン特異的tRNAを4〜10℃で30〜60分間インキュベートして、3つの部分の重複断片:5’と3’末端の両方にリン酸基を含有する配列によって特徴付けられる5’部分(5’−PO_3’PO)、5’末端にヒドロキシル基および3’末端にリン酸基を含有する配列によって特徴付けられる内部部分(5’−OH_3’PO)、ならびに5’と3’位置の両方にヒドロキシル基を含有する配列によって特徴付けられる3’部分(5’−OH_3’OH)を得ることによって実施する(図3)。tRNAのクローバー葉二次構造は、酵素に切断を作らせるための露出したグアノシン残基に富む領域を提供することによって、この消化ステップを容易にする。
3’および5’末端のそれぞれにOH基を有する3’tRNA部分を、T RNAリガーゼおよび基質としての5’−アデニル化ビオチン−メチル−ddCを使用して標識化する。ストレプトアビジン磁気ビーズを使用して、ビオチン化tRNA断片を単離し、その断片に対して酸分解を行って、LC/MSを使用する配列決定分析のための3’ラダーを作出する(図4)。上記の3’−tRNA部分の単離後に5’−OHを有する唯一の配列である、tRNAの内部部分(図5)について、T4ポリヌクレオチドキナーゼによってチオホスフェートを5’ヒドロキシル基に導入した後、ビオチンマレイミドの、RNAオリゴの5’末端への化学的カップリング反応により開始させた2ステップ反応によって、5’標識化を実施する。ストレプトアビジン磁気ビーズを使用する単離ステップを再度使用して、酸分解の前に内部部分を選抜する。酸分解およびLC/MSの後、これらの内部部分のラダー断片の配列を、配列生成およびアラインメントによって取得することができる。次に、tRNA断片の5’部分(図6)で、5’ホスファターゼは5’リン酸基を除去し、アルカリホスファターゼによってそれをヒドロキシル基に変化させ、5’末端を、上記の5’末端標識化法を使用して標識化することができる。単離および酸分解ステップの後、LC/MSを使用して、tRNA断片の5’部分のためのラダーを取得する。
短いオリゴヌクレオチドに由来するLC/MSデータにより、その質量を保持時間(t)に対してプロットした場合に予想されるように、それぞれの特定のラダーに対応する正確に1つのS字形曲線を観察することができることが示された(図7)。5’−ビオチン化RNAおよび非ビオチン化RNAからなる混合物中に複数のRNAが存在する場合であっても、3つの異なる別々のS字形曲線が観察され、その配列読み取りが容易になる(図8)。
ビオチン末端標識化効率
標識化効率を決定するために、MALDI−TOF MSを適用して、それぞれ、RNAの3’および5’末端でのビオチン化の効率を見積もった(図9および図10、代表データとして21ntのRNA)。標識化反応の効率は、実験セクションに記載のように使用される条件下で、出発材料の質量(m/z)および標識化された生成物の質量(m/z)のピーク強度の算出に基づいて、3’末端および5’末端について、それぞれ44%および91%であると見積もられた。ビオチン標識化された材料は、LC/MSによる直接配列決定のための質量ラダーを生成するための酸分解およびビオチン/ストレプトアビジン捕捉/放出のためにすぐに使用できる。
配列ラダーのクロマトグラフィー分離は、同じ配向の読み取りデータの同定を単純化した。配列決定読み取りデータを、その質量、RT、および存在量によって定義した。ヌクレオチド(A、G、U、C)を、2つの隣接するラダー断片の質量差によって決定した。したがって、配列を、非常に容易に読み取ることができる。例えば、配列CGGAUUUAGCUCAGUを、5’末端ビオチン標識化された21ntのRNAについて5’から3’末端に向かって自動的に読み取ることができる(図11)。部分非標識RNAに由来するラダーと一緒に、21ヌクレオチドの完全な配列を読み取ることができる。ビオチン/ストレプトアビジン捕捉/放出ステップなどの実験条件の最適化を含む、標識RNAのラダーについてのみ、完全な配列を読み取るためのさらなる努力が為されてきた。
図12は、それぞれ、ビオチン標識をRNAの3’末端に、疎水性Cy3タグを5’末端に導入した後、酸分解を行って、LC−MSによる直接配列決定のための質量ラダーを生成することによるビーズ補助物理的分離を用いないワークフローを実証する。
本明細書に記載される配列決定方法は、他のものからの物理的分離の後にLC/MSデータ分析を単純化し、それぞれのラダー(5’ラダーまたは3’ラダーのいずれか)から配列を読み取るのに役立ち得る、それぞれ、ビオチン標識断片を2つの末端から単離するその能力によるRNA配列分析のための手段を提供する。この戦略により、当業者であれば、1つより多いRNA鎖ならびにtRNAを含むより複雑なRNA試料を配列決定し、続いて、その関連する改変を同時に分析することができる。
(7.実施例)
RNA標識化効率の増強。ビオチンまたは蛍光色素のようなタグを、高収率でRNA上に導入することはいまだ課題である。しかしながら、選択されたタグによるRNAの2つの末端の標識化は、本明細書に開示される直接RNA配列決定方法のステップである。標識化効率は、試料要件の低減をもたらすより高い標識化効率で、MSシグナルを生成するために、どれぐらい多くのRNA試料を使用することができるかと直接関連する。標識化効率を増大させるために、新しい標識化戦略を最適化し続けた。2ステップ反応を用いてRNAの5’末端を標識化した場合、高い標識化効率(約90%)が最近観察された(図14A)。最適化された反応条件としては、(i)水溶解度を増大させるためにCy3をスルホ−Cy3で置き換えること、(ii)溶液のpHを7.5に調整すること、および(iii)一定の撹拌を維持しながら、反応時間を長くすることが挙げられる。RNAの5’末端での標識化効率を改善する努力が続いているが、公開された方法(Cole K (2004) Nucleic Acids Res 32(11):e86-e86.1)によれば3’末端標識化についても同様の高収率を観察することが予想される。この高い効率を達成するために、アデニル化ステップの除去を可能にするであろう、ビオチン化pCpの活性型であるA(5’)pp(5’)Cp−TEG−ビオチン−3’(図14B)を化学的に合成した。当業者であれば、そのような戦略の使用により、両方の末端で標識化効率をほぼ定量的な収率に有意に改善することができる。
配列決定読み取りデータ長の増強。読み取りデータ長を増大させるために、Agilent MassHunter Qualitative Analysisに関する分子特性抽出(MFE)設定を最適化した。AgilentソフトウェアからエクスポートされたMFEデータから、配列決定アルゴリズムを使用して30ntまでのより長いRNAを自動的に読み取ることが可能であり、約20ntのRNAと比較して、読み取りデータ長の有意な増大が得られた。また、利用可能なソフトウェアに関して、分子のサイズに応じて、2つのモード:(i)現在利用可能なRNA試料によって判断される、約30ntまたは約10,000Daでのみ動作する、同定のためのモノアイソトピック質量の正確な決定に依存する低分子モード;および(ii)約30ntよりも大きい分子についてのみ動作する、同定のための平均質量の正確な決定を要する高分子モードの同定が存在することも発見された。
5種および12種のRNAの複数のRNA鎖配列決定に対する配列決定スループットの増強。LC/MSに基づく方法は、精製された一本鎖RNAの配列決定だけでなく、複数のRNA鎖を含むRNA試料も配列決定することができることが実証されている。本明細書に記載の新規試料調製プロトコールおよびビーズ分離を用いて、1つは19nt、1つは20ntの2つの異なるRNAを同時に読み取ることができる。5種および12種のRNAを含有する混合物を含有する試料を試験した。上記の標識化効率および読み取りデータ長の改善に関して、これらの混合物中の全てのRNAの完全な配列を読み取るのに必要とされる全てのラダー断片を検出することが可能であった。これは、(i)Agilent 6550イオンファネルQ−TOF LC/MS上で測定値を取得すること、および(ii)Agilent MassHunter Qualitative Analysisに関するMFE設定を最適化することによって達成された。30ntのRNA(図15B)を含む5種および12種のRNA混合物(図15A〜B)中の配列を手動で読み取ることができた。これらの結果は、本明細書に記載の直接RNA法が、多数のRNAを含む複雑なRNA試料を配列決定し、様々な生体RNA試料を取り扱うのに必要される必須のスループットをもたらすことができることを実証している。
(8.実施例)
複数のRNA鎖を含む混合RNA試料の配列決定を可能にするMSに基づく配列決定方法のスループットおよび堅牢性を増大させるために、本明細書に記載のように、概念実証研究としてカノニカルな塩基と改変塩基との両方を含有する様々な長さの一連の合成RNAオリゴヌクレオチド上で新しい戦略の有効性を試験しながら、配列決定にとって必要とされるラダーを同定するために実験ワークフローを最適化し、2D LC/MSデータ分析を有意に単純化するための新しい戦略が開発された。単一塩基分解能で同時にシュードウリジン(Ψ)および5−メチルシトシン(mC)を配列決定することができた。記載の末端標識化戦略と一緒に、単一の精製されたRNA鎖だけでなく、12種の異なるRNA配列を含有する試料混合物中でも完全なRNAを正確に配列決定しながら、これらの複数の塩基改変を同定し、位置決定し、定量することができた。
結果
質量分析のための標識RNA分解断片の生成
本明細書に記載の実験手法では、いずれか一方のRNA末端を標識化し、他方の末端は非標識のままにしたか、またはRNAの2つの末端を異なるタグで標識化して、2D LC/MS法においてそれらをより良好に識別した。1つの標識化戦略では、LC/MS分析の前にRNAの3’末端または5’末端のいずれかにビオチンタグを導入して、正確に1つの質量ラダーにRTおよび質量シフトを導入した(14)。この方法は、LC/MSデータ分析を単純化し、混合RNA試料を配列決定する場合にどの断片がどのラダーに属するかに関する混同を防止するのに役立ち得る。それは、末端塩基を同定し、複数に切断された内部断片からモノヌクレオチドおよびジヌクレオチドを区別するのが難しい場合に厄介な低質量領域を回避することができるように、RNAラダーの質量を増加させる;対形成した末端の読み取りデータを必要とするよりもむしろ、1つの単一のラダーから完全な配列を読み取ることによって配列決定の精度を改善する;選択的RTシフトのため、ラダー成分の同定を容易にする塩基コール手順を単純化する;および以前に報告されたもの(5分)よりも長い分解時点(15分)を可能にすることによって試料効率を改善する(14)。これらの改善は、第1世代の方法と比較して、最小RNA試料負荷要件を低減するのに役立ち、稀なRNA改変を含む内因性RNA試料を配列決定する可能性を増大させ得る。
その3’末端でRNAを標識化するために(図16A)、ビオチン化シチジンビスリン酸(pCp−ビオチン)を、ATPおよびMth RNAリガーゼを使用するアデニル化によって活性化して、AppCp−ビオチンを産生した。次いで、遊離3’末端ヒドロキシルを含む3’ラダープールのメンバーを、T4 RNAリガーゼによって、活性化されたAppCp−ビオチンにライゲーションした。ストレプトアビジン結合ビーズを使用して、3’−ビオチン標識化されたRNAを単離し、ビオチン−ストレプトアビジン相互作用を破壊した後、これを酸分解およびその後のLC/MS分析のために放出させた。また、これを、5’末端標識化についても同様に実施した(図24〜25)。
試験例として、短いRNAオリゴヌクレオチド(19ntおよび20ntのRNA:それぞれ、RNA#1およびRNA#2)を設計し、個別試験および群試験のためのモデルRNAオリゴヌクレオチドとして合成した。第1に、RNA#1を3’−ビオチン標識化し、それをストレプトアビジンビーズ捕捉および放出による物理的分離にかけた。図16Bでは、RNA#1の非標識5’ラダーからの3’−ビオチン標識質量ラダーのRTシフトを使用するその後の分離は、どの断片がどのラダーに属するかに関する混合を回避し、出力物中の単離された曲線は、第1世代の方法の2つの隣接する曲線よりも分析するのがはるかに単純である。改変バージョンの公開されたアルゴリズム(14)により、de novoでの配列決定プロセスを実施した。このアルゴリズムは、化合物強度を増大させるために質量付加物の階層的クラスタリングを使用する。その積分した強度が主要ピークのものと組み合わされるように、同時に溶出する中性の付加物および電荷を担持する付加物を再帰的にクラスター化した。これは、ラダー断片化合物の強度を増加させ、配列決定読み取りデータを生成するのに重要な領域のデータの複雑性を低減させた。
図16Bでは、ビオチン標識はRTの増加を引き起こし、RNA#1の完全な配列を上の青色の曲線のみから読み取ることができるため、3’ラダー曲線はシフトアップする(y軸に関して)。同様に、完全なRNA#1の逆配列を、最初のヌクレオチドを除いて、非標識5’ラダー曲線(RTのシフトを有しない)から直接読み取ることができる。この戦略がなければ、以前に報告されたように(14)、完全な配列を読み取るためには、末端対形成が必要である。この進歩があれば、それぞれのRNAを1つの曲線から完全に読み取ることができ、5’ビオチン標識でそれぞれ標識化された複数のRNAを含有する混合試料を配列決定することができる(図16C)。それぞれの試料に関する3’および5’ラダーの分離は、得られたLC/MSデータの複雑性を有意に低減させ、したがって、配列決定にとって必要とされるラダー成分の完全なセットを発見することが以前の方法(14)よりもはるかに容易になり、したがって、塩基コール手順の複雑性を低減させる。
この末端標識化のため、1つが19nt(RNA#1)であり、1つが20nt(RNA#2)である2つのRNAの混合物中の両方の完全な配列を、RNA鎖あたり正確に1つの曲線から読み取ることができる。この試料の場合、配列決定にとって必要とされる質量ラダー成分の完全なセットを発見するためにデータをさらに単純化するために、重要な質量付加物クラスタリングを実行するアルゴリズムを使用した。単純化された2D質量−RTプロットにおける全ての質量ラダー成分からなるS字形曲線から(図16C)、試料RNA鎖の配列を、単に2つの隣接するラダー成分の質量差を算出することによって手動で決定することができる(図16D)。試料は全て合成試料であり、目的の試料を他のRNA鎖から物理的に分離するためにビオチン−ストレプトアビジン結合−切断を使用することは必要ではなかったが(ビオチン標識化と関連するRTシフトを実際に必要としたものだけ)、ビオチン標識の組込みはまた、現実の生体試料を配列決定するのに有用であり得る特定の試料の物理的分離の可能性も提供する。
末端標識化によって得られた観測RTシフトをさらに増加させるために、RNA試料を、疎水性シアニン3(Cy3)またはシアニン5(Cy5)などの他の嵩高い部分で標識化して、そのRT差を拡大することができる。配列決定しようとする元のRNA鎖の5’末端に、嵩高く、ビオチンよりも大きいRTシフトを引き起こし得る(14)、Cy3などの異なるタグを導入した;以前に記載されたように、RNAの3’末端にビオチン部分を導入した。これらの末端標識は、配列決定のために2つのラダー曲線を区別するように全ての5’および3’ラダー断片のRTに体系的に影響するはずであり、これをin silicoでの研究によって確認した(図22Aおよび図22B)。図17Aに示されるように、Cy3タグを、RNA試料の5’末端に2ステップ反応によって付加した。5’−ビオチン化法と同様、第1のステップでのチオリン酸化の後、Cy3マレイミドをRNAにコンジュゲートした。二重の末端標識化されたRNAの酸分解の後、得られた断片を、親和性に基づく物理的分離なしにLC/MSに直接かけた。予備データにより、質量−RT 2Dグラフにおいて、疎水性タグが多いほど、大きいRTシフトを惹起するため、5’Cy3標識化されたラダー断片が5’ビオチン標識化されたラダーからさらに離れて曲線を形成する(図17B)ことが示された。事実、Cy3標識化された5’ラダーのRT傾向は、質量−RTプロットにおけるように方向を変え、配列曲線は、質量の増加と共にRTが上がるビオチン標識化された3’ラダーと比較して(また、全ての以前のビオチン標識化された、および非改変の質量ラダー試料においても観察されるように)、Cy3部分の疎水性のため、質量の増加と共にRTが下がる。これは、2−D分析の間により分離可能/識別可能である2つの曲線をもたらし、物理的分離を用いなくてもラダーの配列を塩基コールを行うのをより容易にする。二方向配列決定を用いて、方法の読み取りデータ長を倍加し、3’ラダーと5’ラダーの両方から完全な配列を読み取ることによって、その精度を有意に改善することができる。
RNA標識化効率
様々なRNA標識化法が報告されたにも関わらず、ビオチンまたは蛍光色素のようなタグを高収率でRNA上に導入することは依然として課題である。しかしながら、選択されたタグによるRNAの2つの末端の標識化は、本明細書に開示される直接RNA配列決定方法のステップである。標識化効率は、試料要件の低減をもたらすより高い標識化効率で、MSシグナルを生成するために、どれぐらい多くのRNA試料を使用することができるかを直接もたらす。標識化効率を増大させるために、新しい標識化戦略が探索され、高い標識化効率が5’末端と3’末端の両方で実証された(図18A)。5’末端標識については、1)タグの水溶解度を増大させるためにCy3の代わりにスルホ−Cy3(図18C)を使用すること、2)溶液のpHを7.5に調整すること、および3)一定の撹拌を維持しながら、反応時間を長くすることを含む、改変された反応プロトコールを使用することによって、完全長RNAの標識化効率は、約60%(図17B)から約90%(図18A)まで改善された。スルホ−Cy3標識化されたRNA#1の酸分解の後でも、非標識断片は軽いフィルタリング後にプロット上に出現しないため、標識化されたラダー成分は、絶対的な強度に関して非標識ラダー成分の数を大きく上回ることが見られる(図23)。3’末端でのより良好な標識化効率のために、アデニル化ステップを除去する、活性型のビオチン化pCpである、A(5’)pp(5’)Cp−TEG−ビオチン−3’(図18C)を合成した(15)。この方法を使用して21ntのRNA(RNA#11)を標識化する場合、3’末端標識化に関する高収率(約95%)が観察された(図18B)。両方の最適化された末端標識化戦略を試料調製プロトコールに組み込むことにより、最少試料負荷量の要件は、ここで全体の配列決定ワークフローにとってはそれほどの障害ではない。
シュードウリジン(Ψ)のLC/MS配列決定
次いで、新しい末端標識化LC/MS配列決定戦略を、改変核酸塩基を含有する合成試料に適用した。シュードウリジン(Ψ)は、RNA中に見出される全ての改変ヌクレオチドのうちで最も豊富であり、普及している。それは、あらゆる種およびコードRNA(mRNA)と非コードRNAとの両方を含む、多くの異なる型のRNAに存在する(16)。しかしながら、ΨとUとをMSによって直接識別することは、それらが同一の質量を有するため、不可能である。CMC−Ψ付加物を形成させるためのN−シクロヘキシル−N’−(2−モルホリノエチル)−カルボジイミドメト−p−トルエンスルホネート(CMC)を用いた求核付加を利用する、確立された化学標識手法が、ΨとUとを識別するために以前に開発された(17)。CMC−Ψ付加物は、逆転写を失速させ、cDNAを、3’末端に向かって1ヌクレオチド下流で終結させ、現在、単一塩基分解能で様々なRNA中のΨ部位を検出するために使用されている(18)。ここで、同じ化学を適応させて、本発明者らのシステムにおいて同じCMC−Ψ付加物を形成させる(図19A)。付加物は、Uの質量よりも大きいユニークな質量252.2076ダルトンを有するだけでなく、Uよりも疎水性であり、RTのシフトももたらす。したがって、CMC−Ψ付加物は、任意のRNA鎖中のΨを同定し、位置を決定するのに役立つであろう、質量−RTプロットにおいて、CMC−Ψ付加物を含有する全てのラダー断片の質量とRTの両方を有意にシフトさせるであろう。
図24Aおよび図24Bは、報告された条件(18)を使用して2つのRNA中でΨをそのCMC付加物に変換する粗生成物のHPLCプロファイルを示す。これらの2つのRNAは、それぞれ、1個のΨおよび2個のΨ部分を含有する(RNA#12および#13)。UVクロマトグラムに由来するピークを積分することによって算出されたΨの変換パーセンテージは、それぞれ、約42%および約64%であった。2個のΨヌクレオチドを含有するRNA鎖については、そのCMC変換は、完全(両方のΨヌクレオチドがΨ−CMC付加物に変換された)または部分的(2個のΨヌクレオチドのうちの一方のみが変換された)であってもよい。したがって、図24Bでは、約16分のピークは、完全な変換を示したRNA鎖(約24%)を指し、約14分の2つの隣接するピークは、いずれかのΨの部分的変換を反映する(合計で約40%)。
ギ酸による酸分解の後、RNA#12および#13に自動化配列決定を適用した。単一のΨを含有するRNA(RNA#12)の配列決定を表す2D質量−RTプロット(図19B)において、CMC−Ψ付加物を含む断片は、その対応する未反応のものよりも252.2076ダルトン大きい質量および大きいRTを有するため、2−D質量−RTプロットにおいて上方かつ右にシフトする、全てのCMC−Ψ付加物を含有するラダー断片を含む配列の部分に対応して、新しい曲線(赤色)が、Ψにおいて元のS字形曲線(灰色)から離れて上に分岐した。図19Cは、二重のΨを含有するRNA(RNA#13)の配列決定を表す2D質量−RTプロットを示す。同様に、両方のΨがそのCMC−Ψ付加物に変換された配列の部分に対応して、1つの新しい曲線(赤色)が第2のΨで離れて分岐した。可視化を容易にするために、5’質量−RTラダーの配列のみが提示される。2つのさらなる曲線(紫色および橙色)が、2個のΨヌクレオチドのうちの一方のみが変換されたことを示す、Ψヌクレオチドの2つの位置のそれぞれにおいて別々に元の非変換5’ラダー(灰色の曲線)から離れて上方に分岐した。そのため、Ψを含有するRNA中の塩基改変Ψを、その完全な配列を読み取りながら、同定し、位置を決定し、定量することができるだけでなく、質量ラダー強度プロファイルを組み込むさらなる計算をしながら、所与の試料中のCMC含有RNAの、非CMC含有RNAに対するパーセンテージを直接定量することもできる。この戦略を他の配列にも適用すると、この方法により、当業者であれば、任意の質量が変更された改変を有するRNAの、その対応する非改変対応物に対するパーセンテージを正確に決定することができる。この考えをΨに拡張すると、この方法により、当業者であれば、Ψを含むCMC化学の収率で因数分解できる場合、Ψ含有RNAの非Ψ含有RNAに対するパーセンテージを見積もることができる。
複数の改変を有するRNA混合物の配列決定
最後に、手持ちの末端標識化およびΨ塩基改変法を用いて、複数の改変を有するRNA鎖を含有する多重RNA試料を配列決定(複数の異なるRNA配列を含有する混合試料の同時的配列決定)するために、方法のスループットを増大させることが次に求められた。11種の非改変RNAと、1個のΨおよび1個のmCを含有する1種の多重改変RNAとを含有する、異なる配列を有する12種のRNAを含有する試料混合物を、プロトコールにかけた。最初に、全てのRNA試料の3’末端をビオチンで化学的に標識化したが、5’末端にはスルホ−Cy3を付加した(塩基改変を含有するRNA鎖を除く)。LC/MSによる測定後、MFE設定が最適化されたAgilent MassHunter Qualitative Analysisソフトウェアを使用してデータを分析して、配列生成のためのデータを抽出した。上記の標識化効率の改善があれば、混合物中の全てのRNAの完全な配列を正確に読み取るのに必要とされる全てのラダー断片を検出することができた。多重化された試料の分析では、典型的な塩基コールアルゴリズム(全ての以前の図面において使用されたもの)は使用しなかった。これらの配列を手動で塩基コールを行い、全ての配列を読み取ることができた(図20Aおよび図20B)。その結果、一本鎖RNA試料と混合RNA試料との両方におけるその質量をマッピングすることによって、4つのカノニカルなヌクレオシド(A、C、GおよびU)を配列決定することができるだけでなく、ΨおよびmCなどの、単一塩基分解能で複数の改変塩基、または任意の他の改変塩基を再度同定し、位置を決定し、定量することもできることが示された。同様に、Ψを配列決定するために、RNAを前述のようにCMCで処理し、したがって、新しい曲線は、Ψでその対応する非CMC含有ラダー曲線から離れて分岐した(ピンク色)。これらの研究においては、自動化塩基コール適用の使用と反対に、配列を手動で読み取ったが、これらの研究は、システムの試料調製および質量分析の側面で実験的限界も物理的限界もないことを示している;LC/MSから抽出されたMFEファイルにより生成された質量−RTプロットにより、混合物のそれぞれの成分の質量ラダーを、適切に生成し、正確に配列決定し、塩基コールを行うことができる。これらの結果は、本明細書に記載の直接RNA法が、以前に公開(14)されたような1個の非カノニカルな塩基を含有する精製された一本鎖RNAだけに限ったことではなく、改変塩基を含有する複数のRNAを含むより複雑なRNA試料を配列決定することができることを示している。それは、様々な複雑な生体RNA試料のMS配列決定に関する大きな前進である。
内部断片の利用による試料使用の増加
以前のMSに基づくRNA配列決定方法は、複数に切断された断片の望ましくない出現(14)とは反対に、配列決定のために単一の切断を含む明確に定義された質量ラダーを生成するための分解条件を制御した。そのため、5分のギ酸処理を実施して、約10%の20nt(RNA#3)試料を、その対応する5’および3’配列決定ラダーに消化して、1つより多い切断を含む内部RNA断片の形成を最小化させた(14)。したがって、出発材料の約90%は、無傷のままであり、いかなる配列情報も得ることができなかった。存在量が少ない現実の生体試料については、試料の約90%が配列決定のために使用できないという事実により、前記方法は、これらの低存在量の試料を正確に配列決定するのに十分なシグナルを生成することができない。使用可能な試料のパーセンテージを増大させるためには、より長い分解ステップが必要である。しかしながら、より長い化学的/酵素的分解ステップにおいて多くの所望のラダー断片を生成するプロセスは、所与の配列上の1つより多い切断部位のため、元のRNA配列に由来する5’または3’末端を有しない大量の内部断片の産生をもたらすであろう(これは確率的に制御されたプロセスである)。以前の方法(14)は、内部断片は塩基配列の決定および改変分析において実際に使用されたRNAラダーの一部ではなかったため、それらを単なる「ノイズ」として無視した。これらの内部断片には依然として固有の情報が存在するが、内部断片に由来する情報を効率的に利用することは、これらの配列が、特に、2000ダルトン(Da)未満の質量を有するより低い質量領域中の断片については、所望のラダー化合物と混合されているため、困難である。この低い質量領域では、所与のRNA鎖の任意の部分に由来するモノマー、ダイマー、およびトリマーヌクレオチドを、LC/MSのLC段階で容易に分離することができず、正確な配列の同定および分析に困難をもたらす。しかしながら、酸分解の前に元の試料の二重末端標識化により内部断片から所望のラダー断片を分離すれば、以前には使用されなかった内部断片を実際に利用することが可能となる。60分の分解ステップにかけられたRNA試料の2−D質量−RTプロットの配列曲線において観察されたように1個より多い塩基が失われた報告された配列中にギャップがある場合(皮肉にも内部断片を生成する同じ長い酸分解ステップから生成される)、配列生成/アラインメントに対して1つより多い切断を有する内部断片から情報を収集し、適用することが提唱される。図25に示されるように、3つの情報:(a)5’ラダー、(b)3’ラダー、および(c)両方の末端がない内部断片を組み合わせることにより、完全に除去することができる可能性がある長い分解時間によって引き起こされる質量−RTラダーにおけるギャップ(割り当てることができない塩基)としてRNA配列決定の精度を有意に増大させることができる。
2D−質量−RT直接RNA配列決定方法の開発は、MSに基づくラダー化技術の力をRNAに集め、RNA改変研究の広い分野における長く続く満たされない必要性に対処する。それは、cDNA中間体の必要なしにRNA配列決定のための直接的な方法を提供するだけでなく、1回の単一の実験において複数のRNA鎖上の複数の塩基改変を配列決定するための一般的方法も提供する。開発された方法は、合成RNA(約20ヌクレオチド)の短い一本鎖を配列決定するのに成功したことが分かっている(図17)。末端標識化があれば、以前のように完全な配列カバレッジのためにペアエンド配列決定を行う必要はもはやない;3’または5’末端のいずれかから所与のRNA鎖の完全な配列を読み取ることができるため、データ分析のスループットおよび容易性を向上させる。末端標識化を使用することにより、典型的には、未知の配列の混合RNAからなる細胞性RNA試料のMSに基づく配列決定における重要な前進である、多重化されたRNA混合物を直接配列決定するための方法を拡張することができる(図20)。さらに、シュードウリジンおよびmCを含む、本研究における複数の改変塩基の配列決定方法の力により、当業者であれば、12種のRNA鎖を含む混合試料中、単一塩基分解能でこれらのRNA改変のそれぞれを同定し、位置決定し、定量することができる。
したがって、本明細書に開示される配列決定方法は、例えば、tRNA、siRNA、薬学的特性を有する治療的合成オリゴリボヌクレオチド、RNA分子の混合物などの、改変RNA分子の効率的な配列決定、ならびにそのようなRNA分子の改変の検出を容易にすることができる。この手法は、内因性tRNAおよびmRNAなどの、公知の化学的改変を有する細胞性RNAを配列決定するのに拡大して、読み取りデータ長における方法の有効性および広範な改変の同定をベンチマークすることができる。この直接MSに基づくRNA配列決定方法は、他の確立された配列決定方法が現在では行うことができない、より多くの未知の改変と共に、その位置および存在量の情報の探索を容易にすると予想される。読み取りデータ長の継続的改善と共に、この直接配列決定戦略を、mRNAおよび長い非コードRNAなどの、より長いRNAを配列決定し、ヌクレオチド改変の化学的正体および位置を指摘するために拡大することができる。
方法
化学的材料
以下のRNAオリゴヌクレオチドは、Integrated DNA Technologiesから入手し、さらに精製することなく使用した(Coralville、IA、米国)。
Figure 2021525507
ギ酸(98〜100%)は、Merck(Darmstadt、Germany)から購入した。ビオチン化シチジンビスリン酸(pCp−ビオチン)、{Phos(H)}C{BioBB}は、TriLink BioTechnologies(San Diego、CA、米国)から得た。アデノシン−5’−5’−二リン酸−{5’−(シチジン−2’−O−メチル−3’−リン酸−TEG}−ビオチン、A(5’)pp(5’)Cp−TEG−ビオチン−3’は、ChemGenes(Wilmington、MA、米国)によって合成した。T4 DNAリガーゼ1、T4 DNAリガーゼ緩衝液(10x)、反応緩衝液(10x)、1mM ATP、およびMth RNAリガーゼを含むアデニル化キットは、New England Biolabs(Ipswich、MA、米国)から得た。ATPγSおよびT4ポリヌクレオチドキナーゼ(3’−ホスファターゼ非含有)は、Sigma−Aldrich(St.Louis、Missouri、米国)から得た。ビオチンマレイミドは、Vector Laboratories(Burlingame、CA、米国)から購入した。シアニン3マレイミド(Cy3)およびスルホン化シアニン3マレイミド(スルホ−Cy3)は、Lumiprobe(Hunt Valley、Maryland、米国)から得た。ストレプトアビジン磁気ビーズは、Thermo Fisher Scientific(Waltham、MA、米国)から得た。CMC(N−シクロヘキシル−N’−(2−モルホリノエチル)−カルボジイミドメト−p−トルエンスルホネート)、ビシン、尿素、EDTAおよびNaCO緩衝液を含むシュードウリジンの変換に必要な化学物質は、Sigma−Aldrich(St.Louis、MO、米国)から得た。
ワークフロー
(1)シュードウリジンの化学的変換を、シュードウリジンとウリジンとを区別するために適用した。(2)最適化された実験手順を用いて、RNA鎖の一方または両方の末端に標識を付加した。(3)単一のRNA鎖またはRNA鎖の混合物を、理想的には、2’−OH支援酸加水分解メカニズムによる、それぞれのRNA鎖の全長にわたるその上のホスホジエステル結合の、無作為の配列状況非依存的な、単一切断によって、一連の短い、明確に定義された断片(配列ラダー)に分解した。(4)必要に応じて、ストレプトアビジン被覆磁気ビーズを使用して非標識RNAからビオチン化RNAを物理的に分離した。(5)次いで、消化された断片を、LC/MS分析にかけ、デコンボリューションされた質量およびRTを分析して、それぞれのラダー断片を同定した。(6)データプロセッシングおよび配列生成プロセスを自動化するアルゴリズムを適用した。
3’末端標識化法
2ステッププロトコールを使用する。(1)アデニル化:RNaseを含有しない薄壁の0.5mL PCRチューブ中、10μLの合計反応容量を用いて、以下の反応を設定した:1xアデニル化反応緩衝液(5’アデニル化キット)、100μMのATP、5.0μMのMth RNAリガーゼ、10.0μMのpCp−ビオチン、およびヌクレアーゼ非含有脱イオン水(Thermo Fisher Scientific、米国)。反応物を、GeneAmp(商標)PCR System 9700(Thermo Fisher Scientific、米国)中、65℃で1時間インキュベートした後、85℃で5分間、Mth RNAリガーゼ酵素を不活化した。(2)ライゲーション:30μLの反応溶液は、アデニル化ステップに由来する10μLの反応溶液、1x反応緩衝液、5μMの標的RNA試料、10%(v/v)のDMSO(無水ジメチルスルホキシド、99.9%、Sigma−Aldrich、米国)、T4 RNAリガーゼ(10ユニット)、およびヌクレアーゼ非含有脱イオン水を含有していた。反応物を、16℃で一晩インキュベートした後、カラム精製した。
1ステッププロトコールについて。A(5’)pp(5’)Cp−TEG−ビオチン−3’を適用して、標識化法を単純化しながら、アデニル化ステップを除去することによって標識化効率を改善した。ライゲーションステップを、1x反応緩衝液、5μMの標的RNA試料、10μMのA(5’)pp(5’)Cp−TEG−ビオチン−3’、10%(v/v)DMSO、T4 RNAリガーゼ(10ユニット)、およびヌクレアーゼ非含有脱イオン水を含有する30μLの反応溶液によって達成した。反応物を、16℃で一晩インキュベートした後、カラム精製した。Oligo Clean & Concentrator(Zymo Research、Irvine、CA、米国)を使用して、酵素、遊離ビオチン、および短いオリゴヌクレオチドを除去した。
5’末端標識化法
5’末端でのビオチン標識化は、2つのステップを要した。ヌクレアーゼ非含有脱イオン水で合計反応容量を10μLにした、10x反応緩衝液、90μMのRNA、1mMのATPγS、および10ユニットのT4ポリヌクレオチドキナーゼを含有するRNaseを含まない、薄壁のPCRチューブ(0.5mL)中、37℃で30分間にわたってインキュベーションを実行した。次いで、312μLの無水DMF(無水ジメチルスルホキシド、99.9%、Sigma−Aldrich、米国)に溶解した5μLのビオチンマレイミドを添加し、ボルテックスによって混合し、65℃で30分間、試料をインキュベートした。Oligo Clean & Concentratorを使用するカラム精製を、上記のように行った。
疎水性Cy3(シアニン3)またはCy5(シアニン5)タグなどの異なるタグを、上記と同じ方法(ビオチンマレイミドのCy3−マレイミドまたはスルホ−Cy3マレイミド置換えによることを除く)によって5’末端に導入して、そのラダーと、3’ビオチン化ラダーとを区別した。上記の2ステッププロトコールと比較して、反応条件の最適化を実施して、以下の様式で高い標識化効率を得た:1)50:1の反応物のモル比(スルホ−Cy3の、RNAに対する)で高い水溶解度を得るために、スルホ−Cy3を使用した;2)反応溶液のpHを、Tris−HCl緩衝液(1M)で7.5に調整し、50mMの最終濃度にした;および3)一定に撹拌しながら、反応時間を一晩(16時間)に延長した。
酸加水分解による分解
別途指示しない限り、質量ラダーを産生するために完全長RNA試料を分解するためにギ酸を適用した30、31。それぞれのRNA試料溶液を、40℃で50%(v/v)のギ酸を使用するギ酸分解のために3つの等量のアリコートに分割し、1つの反応は2分間、1つは5分間、および1つは15分間実行した。内部断片の生成に関する実験のために(図S4)、60分のギ酸処理をRNA#3上で行った。反応混合物を、ドライアイス上ですぐに凍結した後、乾燥するまで凍結乾燥し、典型的には、30分以内に完了させた。乾燥した試料を合わせ、その後のビオチン/ストレプトアビジン捕捉/放出ステップのために20μLのヌクレアーゼ非含有脱イオン水中に懸濁したか、またはLC/MS測定のために−20℃で保存した。図20では、LC/MSに注入する前に、1つは3’−ビオチン標識を用い、1つは5’−スルホ−Cy3標識を用いた、同じ11種の配列(RNA#1〜RNA#11)の2つの別々の試料、および3’−ビオチン標識化されたRNA#12を含有する試料と共に混合されたこれらの試料を用いて、実験を開始した。
ビオチン/ストレプトアビジン捕捉/放出ステップ
ビオチン/ストレプトアビジン捕捉は、ストレプトアビジンで被覆された磁気ビーズを使用して、ビオチン標識RNAに結合させるが、それらはストレプトアビジンで被覆された磁気ビーズ上に選択的に固定され、磁石に引き寄せられる。したがって、結合したRNAを、非ビオチン標識RNAおよび不純物(溶液中に残存し、洗浄除去されるであろう)から単離するべきであり、後にLC−MS配列決定分析のためにビーズから溶出させることができる。図16B中の試料について(他の試料はこのステップを必要としない)、200μLのDynabeads(商標)MyOne(商標)ストレプトアビジンC1ビーズを、最初に等量の1xB&W緩衝液を添加することによって調製した。この溶液をボルテックスし、2分間磁石上に置いた後、上清を廃棄した。ビーズを、200μLの溶液A(DEPC処理された0.1MのNaOHおよびDEPC処理された0.05MのNaCl)で2回、溶液B(DEPC処理された0.1M NaCl)中で1回洗浄した。最後に100μLの2xB&W緩衝液を添加して、ビーズの濃度を20mg/mLにした。次いで、1xB&W緩衝液中の等容量のビオチン化RNAを添加し、試料を、穏やかな回転を使用して室温で15分間インキュベートした後、2分間チューブを磁石上に置き、上清を廃棄した。被覆されたビーズを1xB&W緩衝液中で3回洗浄し、それぞれの洗浄ステップの上清の最終濃度を、回収分析のためにNanodropによって測定して、標的RNA分子がビーズ上に残存していることを確認した。固定されたビオチン化RNAを放出させるために、ビーズを、65℃で5分間、95%ホルムアミド(Thermo Fisher Scientific、Waltham、MA、米国)を含む10mM EDTA(Thermo Fisher Scientific、米国)、pH8.2中でインキュベートした。最後に、この試料チューブを、2分間磁石上に置き、上清(標的RNA分子を含有する)をピペットによって収集した。
シュードウリジンとウリジンとを区別するための化学
Bakin and Ofengand (Bakin, A.; Ofengand, J.. Biochemistry 1993, 32 (37), 9754-62)による報告に従って、シュードウリジンを改変するための実験手法を実施した。それぞれのRNA試料(1nmol)を、90μLの総反応容量中、37℃で20分間50mMビシン、pH8.3、4mM EDTA、および7M尿素中の0.17M CMCで処理した。60μLの1.5M NaOAcおよび0.5mM EDTA、pH5.6(緩衝液A)を用いて、反応を停止させた。Oligo Clean & Concentratorを使用する精製後、60μLの0.1M NaCO緩衝液、pH10.4を溶液に添加し、120μLの反応容量にし、37℃で2時間インキュベートした。緩衝液Aを用いて反応を停止させ、Oligo Clean & Concentratorにより精製した。
LC−MS分析
MicroASオートサンプラーおよびSurveyor MS Pump Plus HPLCシステム(Agilent Technologies、Santa Clara、CA、米国)(Hunter Mass Spectrometry、NY、米国)を装備した1290 Infinity LCシステムに連結された6550 Q−TOF質量分析装置上で、試料を分離および分析した。全ての分離を、1.7μmの粒径を有する50mm x 2.1mm Xbridge C18カラム(Waters、Milford、MA、米国)をわたる、水性移動相(A)、10mMジイソプロピルアミン(DIPA)(Thermo Fisher Scientific、USA)をpH9.0で含む25mMヘキサフルオロ−2−プロパノール(HFIP)(Thermo Fisher Scientific、USA)および有機移動相(B)、メタノールを使用する逆相HPLCで実施した。流量は0.3mL/分であり、全ての分離を、35℃に維持したカラム温度を用いて実施した。注入容量は20μLであり、試料の量は15〜400pmolのRNAであった。データを、負の極性で記録した。MassHunter Acquisitonソフトウェア(Agilent Technologies、米国)を使用して、試料データを獲得した。LC−MS実験から関連するスペクトルおよびクロマトグラフィー情報を抽出するために、MassHunter Qualitative Analysis(Agilent Technologies、米国)中のMolecular Feature Extractionワークフローを使用した。この特許で守られた分子特性抽出アルゴリズムは、質量および保持時間の次元で非標的特性の発見を実行する。原理的には、化合物を同定することができる任意のソフトウェアを使用することができた。ソフトウェアの設定は、実験で使用されたRNAの量に応じて変化した。一般に、目標は、最大で1000までの、できるだけ多くの同定された化合物を含むことであった。プロファイルのスペクトルピークを、低濃度の試料については、5のシグナル対ノイズ比(SNR)閾値、より濃縮された試料については、最大で20のSNR閾値を使用してフィルタリングした。他のアルゴリズム設定は、以下の通りであった:「低分子(クロマトグラフィー)」抽出アルゴリズム、電荷状態−1〜−15、水素(−H)イオンのみ損失、「一般有機分子」アイソトープモデル、最小品質スコア70(0〜100の範囲)、および最小イオン計数500。
配列生成の自動化に加えて、RNA配列の手動による読み取りも使用して、自動化配列決定の精度を確認した。これらの配列を、MassHunter Qualitative AnalysisのAgilentのソフトウェア中に統合されたMolecular Feature Extraction(MFE)アルゴリズムにより抽出されたデータから手動で読み取った。表S1〜S38中に、各断片の理論質量(ChemDrawにより得られる)、塩基質量、塩基名、観測質量、RT、体積(ピーク強度)、品質スコア、およびppmでの質量差が提供される。提示される全ての図面は、複数の実験(n≧3)の代表データである。可視化を容易にするために、5’−スルホ−Cy3標識化された質量ラダーおよび3’−ビオチン化質量ラダーを別々にプロットした(すなわち、3’−ビオチン化質量ラダーは全て図20Aにプロットし、5’−スルホ−Cy3標識化された質量ラダーは全て図20Bにプロットした)。次いで、それぞれの配列曲線(所与のプロット上で最大12)について、出発RT値を正規化して、4分間隔で開始させた(8分間隔のギャップを使用した図20A中のRNA#12の場合を除く)。任意の単一の所与の曲線の出発RT値とその後のRT値との間の絶対差は未変化のままである;それぞれの曲線がプロットされる視覚的な「高さ」のみが変化した。図20に関するプロットを、市販の写真作製ソフトウェアであるOriginLabを用いて作成した。図20A〜Bを除く全ての図面において、質量−RTプロットを、いずれのRT値も正規化せずに生成した。元の試料中の失われている塩基割り当てのため、2つの試料を組み合わせて、分析し、組み合わせたデータを図17Bに可視化した。1つの試料は5’−Cy3標識と3’−ビオチン標識の両方を含むRNA#1を含有したが、第2の組み合わせた試料は5’−Cy3標識のみを含むRNA#1を含有していた(表S6)。
自動化RNA配列決定および可視化アルゴリズム
LC/MSデータ分析の第1のステップは、データの予備プロセッシングおよびデータ整理を行うことであり、LC/MSデータが低ノイズになり、その結果、次のステップにおいてデータからRNA配列を読み取ることがより容易になる。多次元LC/MSデータから、保持時間(RT)、強度(体積)、および品質スコア(QS)などの、データを予備プロセッシングし、その容量を低減させるために使用することができるいくつかの次元が存在する。データプロセッシングおよび配列決定アルゴリズムに対する改変に関する詳細については、補足情報を参照されたい。修正アルゴリズムのソースコードは利用可能である。当業者であれば、アルゴリズムのさらなる改善により、より複雑な細胞性RNAを配列決定する場合に塩基コールおよび改変同定を自動化することができる。
部分改変RNA試料中の改変RNAの化学量論/パーセンテージの定量
塩基改変は細胞または試料中の全ての同一のRNA配列の100%に存在するわけではないため、細胞性RNA改変の動力学の理解(20、21)には、部位特異的改変を有するRNAの、そのカノニカルな対応物RNAに対する化学量論/パーセンテージを定量する方法が必要である。上記定量戦略を他の配列にも適用すると、この方法により、当業者であれば、任意の質量が変更された改変を有するRNAの、その対応する非改変対応物に対するパーセンテージを正確に決定することができる。図21に示されるように、改変RNAと非改変RNAとの両方を含有する混合物から、m5Cを含む完全な配列を正確に読み取ることができるだけでなく(図21A)、抽出されたイオンクロマトグラフからの情報に基づいて、m5C改変RNA(20%)の、その非改変対応物(80%)に対する相対パーセンテージを定量することもできる(図21B)(21)。3’−ビオチン標識化されたメチル化RNAおよび非改変RNAの抽出イオン電流(EIC)ピークを、そのギ酸分解前に積分することによって、異なる生成物種の相対量を定量した。配列決定に加えて、他の異なる比を有するRNA混合物も同様に定量した(図21B)。これらの相対パーセンテージは、5%未満の差でRNA標識化のために最初に使用されるRNAの絶対量の比と良好に一致するが、これは、EICに基づく積分が、同じ配列を有する全てのRNAが改変されなかった場合の改変RNAの相対的定量のための正確な方法であることを示している。この考えをΨに拡張すると、この方法により、当業者であれば、Ψを含むCMC化学の収率で因数分解できる場合、Ψ含有RNAの非Ψ含有RNAに対するパーセンテージを見積もることができる。
保持時間(RT)の質量に対するプロット上の空間的に別々のラダーに5’タグを付加して、合成の非改変A10(10マーのポリアデニン)配列の5’と3’の両方のラダーに関するシミュレートされた質量スペクトルピークセットを、最初にin silicoで生成した。各行は、所与の質量ラダーピークを表し、各ピークに、無単位の保持時間(RT)および1000の任意の一定の無単位ピーク体積を割り当てた。各ラダーに割り当てられたRTは、0から出発し、0.1単位の増分で増加して、質量の増大と共に体系的に増大した。シミュレートされたA10の質量スペクトルに関するピークの一覧は、以下の通りであった:
A10−非改変MSピークの一覧
Figure 2021525507
347.063065から出発する質量ラダーは、5’質量ラダーを表すが、267.096732から出発する質量ラダーは、3’質量ラダーを表す。
次に、合成の、5’−シアニン3(Cy3)標識化されたA10(10マーのポリアデニン)配列の5’と3’の両方のラダーに関するシミュレートされた質量スペクトルピークセットを、in silicoで生成した。上のデータセットを取り、データセット中の5’ラダーの各メンバーに、5’−Cy3標識(614.3061)により得られたさらなる質量を加えることにより、これを行った。ピーク体積は変化しなかった。この新しいCy3標識化された5’ラダーに関する関連するRTを、ここで10のRTから出発することにより生成し、質量の増加と共に0.2の増分で減少させた。これを行って、両方の絶対RT値、RT傾向(例えば、単調に減少する曲線に対する単調に増加する曲線)、および絶対質量値における任意の末端標識化されたラダー(この場合、5’−Cy3標識化された)のRTの質量スペクトルに対する潜在的な変化をシミュレートした。勿論、現実のシステムにおけるこれらの値の全てにおける現実の変化をin silicoで絶対的に予測することはできず、したがって、これは原理証明例としてのみ取られるべきである。シミュレートされた5’−Cy3標識化されたA10質量スペクトルに関するピークの一覧は以下の通りであった:
A10−5’−Cy3標識化されたMSピークの一覧
Figure 2021525507
961.369165から出発する質量ラダーは、5’−Cy3標識化された質量ラダーを表すが、267.096732から出発する質量ラダーは、3’質量ラダーを表す。
これらの2つのRTと質量のプロットを比較すると、当業者であれば、2つの質量ラダー曲線が、末端標識がない場合、ほぼ重ね合わせられ(図22A)、下流の塩基コールおよび配列同定における配列決定の誤りの可能性をもたらすが、5’−Cy3標識化された試料は、2つの異なる別々の質量ラダー曲線を有し(図22B)、配列決定にとって必要とされる全てのラダー成分の可視化をより容易にし、下流の塩基コールおよび配列同定における精度をより高くすることを見ることができる。
配列生成の自動化に加えて、当業者であれば、自動化配列決定の精度を確認するために、MassHunter Qualitative Analysis(Agilent Technologies)中のMolecular Feature Extraction(MFE)ワークフローにより質量ラダーについて手動で検索することもできる。表S1〜S38に、それぞれの断片の理論質量(ChemDrawにより得られた)、塩基質量、塩基名、観測質量、RT、体積(ピーク強度)、品質スコア、およびppmとして表される誤差(以下の式により算出)が提供される。合理的な品質スコアを示すだけでなく、できるだけ多くの同定された化合物を抽出するために、MFE設定を最適化した。適用されるMFE設定は以下の通りである:「重心データ形式、低分子(クロマトグラフィー)、500以上の高さを有するピーク、70以上の品質スコア」。しかしながら、必要に応じて、データ整理を実施して、配列決定アルゴリズムを単純化した。例えば、20ntのRNAのためのビオチン標識化された試料については、6〜10分の保持時間を選択することができる。また、アルゴリズム分析のために使用される入力化合物の数は一般に、別途指示しない限り、完全な配列を生成するのに必要とされるラダー断片の数よりも一桁多い;これらの入力化合物は、典型的には、より高い体積および/またはより良好な品質スコアを有する全てのMFE抽出された化合物から選別される。
以下の式を使用して、実施例8に記載されたPPMを算出した:
ppm=10−6×(質量理論−質量観測)/質量理論
表S1. ストレプトアビジンビーズによる単離、次いで、化学的分解後の3'ビオチン標識化されたRNA#1(3'標識質量ラダー成分、RNA#1)のLC/MS分析。
Figure 2021525507

表S2. ストレプトアビジンビーズによる単離、次いで、化学的分解後の3'ビオチン標識化されたRNA#1(5'非標識質量ラダー成分、RNA#1)のLC/MS分析。
Figure 2021525507

*NA:分析せず。溶出緩衝液に由来するバックグラウンドイオンを最小化するために、350Daの閾値を設定した。そうでなければ、HFIPおよびDPAイオンが主に検出されるであろう。したがって、350Da未満の質量は検出されなかった。
表S3. 5'ビオチン標識化されたRNA#1(5'標識質量ラダー成分、RNA#1)のLC/MS分析
Figure 2021525507

表S4. 5'ビオチン標識化されたRNA#2(5'標識質量ラダー成分、RNA#2)のLC/MS分析。
Figure 2021525507

表S5. 3'ビオチン標識化されたRNA#1(3'標識質量ラダー成分、RNA#1)のLC/MS分析。
Figure 2021525507

表S6. 5'Cy3標識化されたRNA#1(5'標識質量ラダー成分、RNA#1)のLC/MS分析。
Figure 2021525507

表S7. 1個のΨを含有するRNA#12(5'から3'までのΨ非変換質量ラダー成分、RNA#12)のLC/MS分析。
Figure 2021525507

表S8. 1個のΨを含有するRNA#12(3'から5'までのΨ非変換質量ラダー成分、RNA#12)のLC/MS分析。
Figure 2021525507

表S9. 1個のΨを含有するRNA#12(5'から3'までのCMC変換されたΨを含む質量ラダー成分、20ntのRNA)のLC/MS分析
Figure 2021525507

表S10. 1個のΨを含有するRNA#12(3'から5'までのCMC変換されたΨを含む質量ラダー成分、RNA#12)のLC/MS分析
Figure 2021525507

表S11. 2個のΨを含有するRNA#13(5'から3'までのΨ非変換質量ラダー成分、RNA#13)のLC/MS分析。
Figure 2021525507

表S12. 2個のΨを含有するRNA#13(5'から3'までの1個のCMC変換されたΨを含む質量ラダー成分、20ntのRNA#13)のLC/MS分析。
Figure 2021525507

表S13 .2個のΨを含有するRNA#13(5'から3'までの1個のCMC変換されたΨを含む質量ラダー成分、RNA#13)のLC/MS分析。
Figure 2021525507

表S14. 2個のΨを含有するRNA#13(5'からの2個のCMC変換されたΨを含む質量ラダー成分、RNA#13)のLC/MS分析。
Figure 2021525507

表S15. その質量ラダー成分を示す、3'ビオチン標識化されたRNA#1のLC/MS分析。
Figure 2021525507

表S16. その質量ラダー成分を示す、3'ビオチン標識化されたRNA#2のLC/MS分析。
Figure 2021525507

表S17. その質量ラダー成分を示す、3'ビオチン標識化されたRNA#3のLC/MS分析。
Figure 2021525507

表S18. その質量ラダー成分を示す、3'ビオチン標識化されたRNA#4のLC/MS分析。
Figure 2021525507

表S19. その質量ラダー成分を示す、3'ビオチン標識化されたRNA#5のLC/MS分析。
Figure 2021525507

表S20. その質量ラダー成分を示す、3'ビオチン標識化されたRNA#6のLC/MS分析。
Figure 2021525507
表S21. その質量ラダー成分を示す、3'ビオチン標識化されたRNA#7のLC/MS分析。
Figure 2021525507

表S22. その質量ラダー成分を示す、3'ビオチン標識化されたRNA#8のLC/MS分析。
Figure 2021525507

表S23. その質量ラダー成分を示す、3'ビオチン標識化されたRNA#9のLC/MS分析。
Figure 2021525507

表S24. その質量ラダー成分を示す、3'ビオチン標識化されたRNA#10のLC/MS分析。
Figure 2021525507

表S25. その質量ラダー成分を示す、3'ビオチン標識化されたRNA#11のLC/MS分析。
Figure 2021525507

表S26. その質量ラダー成分を示す、5'スルホ-Cy3標識化されたRNA#1のLC/MS分析。
Figure 2021525507

表S27. その質量ラダー成分を示す、5'スルホ-Cy3標識化されたRNA#2のLC/MS分析。
Figure 2021525507

表S28. その質量ラダー成分を示す、5'スルホ-Cy3標識化されたRNA#3のLC/MS分析。
Figure 2021525507

表S29. その質量ラダー成分を示す、5'スルホ-Cy3標識化されたRNA#4のLC/MS分析。
Figure 2021525507

表S30. その質量ラダー成分を示す、5'スルホ-Cy3標識化されたRNA#5のLC/MS分析。
Figure 2021525507

表S31. その質量ラダー成分を示す、5'スルホ-Cy3標識化されたRNA#6のLC/MS分析。
Figure 2021525507

表S32. その質量ラダー成分を示す、5'スルホ-Cy3標識化されたRNA#7のLC/MS分析。
Figure 2021525507

表S33. その質量ラダー成分を示す、5'スルホ-Cy3標識化されたRNA#8のLC/MS分析。
Figure 2021525507

表S34. その質量ラダー成分を示す、5'スルホ-Cy3標識化されたRNA#9のLC/MS分析。
Figure 2021525507

表S35. その質量ラダー成分を示す、5'スルホ-Cy3標識化されたRNA#10のLC/MS分析。
Figure 2021525507

表S36. その質量ラダー成分を示す、5'スルホ-Cy3標識化されたRNA#11のLC/MS分析。
Figure 2021525507

表S37. そのΨ-CMC変換された質量ラダー成分を示す、3'ビオチン標識化されたRNA#12のLC/MS分析。
Figure 2021525507

表S38. そのΨ非変換質量ラダー成分を示す、3'ビオチン標識化されたRNA#12のLC/MS分析。
Figure 2021525507

データを、以下のようにプロセッシングした:
図16Bについて:最大プロッティングウィンドウRT、20に設定:ax.set_ylim(min_time、15);最大質量<7000。体積で上位500を取る(3486を含むそれより上)。
図16C:プロッティングウィンドウRT、5.5〜12に設定:ax.set_ylim(5.5、12)。
最大質量<7500。
体積で上位500を取る(1219を含むそれより上)。
図17B:最大質量<7000。
体積で上位1000を取る(33693を含むそれより上)。
図19A:最大質量<8000。
体積で上位500を取る(241698を含むそれより上)。
図19B:最大質量<8000。
CMC標識化効率がある程度低かったため、体積で上位1000を取る(63110を含むそれより上)。
図S2:最大質量<8000。
体積で上位300を取る(121230を含むそれより上)。
第2のステップは、LC/MSデータを分析し、RNA配列を自動的に認識することである。[JACS 2015]からのアルゴリズムの改変バージョンを使用した。
最初に、デフォルトのcfgファイルに改変を加えた:

Figure 2021525507


Figure 2021525507

1)厳密に単調に増加または減少する配列プロットの要件を削除した
コメントアウト:
Figure 2021525507

2)質量フィルタリングステップを無効にした:
Figure 2021525507

3)図16C以降について、コードの以下の領域を、標識を除去するためのプロッティングを容易にするためにコメントアウトした。
Figure 2021525507
Figure 2021525507
Figure 2021525507

特定の図面に関するさらなる変更を、以下に従って行った:
図16Bについて:最大プロッティングウィンドウRT、20に設定:ax.set_ylim(min_time、20)。
最大質量<7000。
体積で上位500を取る(3486を含むそれより上)。
プロッティングの方向もフリップした(変更は太字):
Figure 2021525507
本明細書を通して引用される全ての特許、特許出願および参考文献は、参照により明示的に組み込まれる。
参考文献
Figure 2021525507
Figure 2021525507

Claims (41)

  1. 一次RNA配列およびRNA改変の存在/同定/位置を決定するためのRNA配列決定方法であって、(i)RNAの5’および/または3’末端の標識化ステップ;(ii)前記RNAの無作為分解ステップ;(iii)必要に応じて、5’および3’末端標識化に基づく得られたRNA断片の物理的分離ステップ;(iv)得られたRNA断片特性の分離および検出ステップ;ならびに(v)配列/改変同定をもたらすデータ分析ステップを含む、方法。
  2. 前記ステップ(iv)の得られたRNA断片の分離が、高速液体クロマトグラフィーによって達成される、請求項1に記載の方法。
  3. 前記高速液体クロマトグラフィーが、逆相高速液体クロマトグラフィーである、請求項2に記載の方法。
  4. 前記ステップ(iv)の得られたRNA断片の分離が、キャピラリー電気泳動によって達成される、請求項1に記載の方法。
  5. 前記ステップ(iv)の得られたRNA断片特性の検出が、質量分析によって達成される、請求項1に記載の方法。
  6. RNA分子の5’および/または3’末端の親和性標識化が、ビオチンのような疎水性標識またはCY3もしくはCY5などの蛍光色素によるものである、請求項1に記載のRNA配列決定方法。
  7. RNA分子の5’および/または3’末端の親和性標識化が、チオール基によるものである、請求項1に記載のRNA配列決定方法。
  8. RNA分子の5’および/または3’末端の親和性標識化が、任意のビオチン化pCpによるものである、請求項1に記載のRNA配列決定方法。
  9. RNA分子の5’および/または3’末端の親和性標識化が、DNAアダプターによるものである、請求項1に記載のRNA配列決定方法。
  10. RNA分子の5’および/または3’末端の親和性標識化が、ポリ(A)オリゴヌクレオチドによるものである、請求項1に記載のRNA配列決定方法。
  11. 前記RNAの化学的分解が、化学的分解によって行われる、請求項1に記載のRNA配列決定方法。
  12. 前記化学的分解が、ギ酸またはアルカリ加水分解を用いて行われる、請求項11に記載のRNA配列決定方法。
  13. 前記RNAの分解が、酵素的分解によって行われる、請求項1に記載のRNA配列決定方法。
  14. 前記酵素的分解が、Crotalus adamanteus毒のホスホジエステラーゼI、ウシ脾臓ホスホジエステラーゼII、およびXRN−1エキソリボヌクレアーゼからなる群からの酵素を使用して行われる、請求項13に記載のRNA配列決定方法。
  15. 化学的分解が、RNA分子の5’および3’末端の親和性標識化の前に行われる、請求項1に記載のRNA配列決定方法。
  16. 化学的分解が、RNA分子の5’および3’末端の親和性標識化の後に行われる、請求項1に記載のRNA配列決定方法。
  17. RNA試料が、限られた多様性の精製されたRNA試料を含む、請求項1に記載のRNA配列決定方法。
  18. RNA試料が、RNAの混合物を含む、請求項1に記載のRNA配列決定方法。
  19. RNA試料が、治療的RNA分子を含む、請求項1に記載のRNA配列決定方法。
  20. RNAヌクレオチド配列が、MSデータ出力と、既知および/または未知のリボヌクレオチドの質量との相関によって決定される、請求項1に記載のRNA配列決定方法。
  21. 改変リボヌクレオチドの存在が、MSデータ出力と、既知および/または未知の改変リボヌクレオチドの質量との相関によって決定される、請求項1に記載のRNA配列決定方法。
  22. (i)RNA断片の疎水性を増大させることによって、分解されたRNA断片の保持時間を増加させる部分を用いた、RNAの5’および/または3’末端の標識化ステップ;(ii)前記RNAの無作為分解ステップ;(iii)得られたRNA断片特性の分離および検出ステップ;ならびに(iv)配列/改変同定をもたらすデータ分析ステップを含む、RNA配列決定方法。
  23. 前記ステップ(iv)の得られたRNA断片の分離が、高速液体クロマトグラフィーによって達成される、請求項22に記載の方法。
  24. 前記高速液体クロマトグラフィーが、逆相高速液体クロマトグラフィーである、請求項22に記載の方法。
  25. 前記ステップ(iv)の得られたRNA断片の分離が、キャピラリー電気泳動によって達成される、請求項22に記載の方法。
  26. 前記ステップ(iv)の得られたRNA断片特性の検出が、質量分析によって達成される、請求項22に記載の方法。
  27. (i)前記RNAの3’末端がビオチン部分で標識化され、前記RNAの5’末端が疎水性Cy3タグで標識化されるか、または(ii)前記RNAの5’末端がビオチン部分で標識化され、前記RNAの3’末端が疎水性Cy3タグで標識化される、請求項22に記載の方法。
  28. (i)DNAの5’および/または3’末端の親和性標識化ステップ;(ii)前記DNAの質量ラダーへの無作為分解ステップ;(iii)必要に応じて、親和性相互作用に基づく得られたDNA断片の物理的分離ステップ;(iv)質量分析とカップリングした、逆相高速液体クロマトグラフィー(HPLC)またはキャピラリー電気泳動(CE)または他の分離方法を使用する得られたDNA断片の測定ステップ;ならびに(v)配列/改変同定をもたらすMSデータ分析ステップを含む、DNA配列決定方法。
  29. DNA分子の5’および/または3’末端の前記親和性標識化が、ビオチン標識によるものである、請求項28に記載のDNA配列決定方法。
  30. 前記DNAの分解が、酵素的分解によって行われる、請求項28に記載のDNA配列決定方法。
  31. 前記酵素的分解が、DNA制限エンドヌクレアーゼを使用して行われる、請求項30に記載のDNA配列決定方法。
  32. データ分析が、質量および保持時間に依拠した2次元分析である、請求項1に記載のDNA配列決定方法。
  33. データ分析が、前記RNA配列から得られたRNA断片のユニークな特性に基づいて行われる、請求項1に記載のDNA配列決定方法。
  34. RNA断片の前記ユニークな特性が、電気シグナルまたは光学的シグネチャシグナルである、請求項33に記載のDNA配列決定方法。
  35. 改変ヌクレオシドであるシュードウリジン(Ψ)を含有するRNAが、ウリジン(U)と比較してΨと優先的に反応し、CMC−Ψ付加物の形成をもたらすCMCで処理され、前記付加物が2−D質量−RTプロットにおいてUを含むCMC変換されていないΨと比較して質量およびRTのシフトをもたらす、請求項1または28に記載のRNA配列決定方法。
  36. RNAがΨ含有RNAであるRNA配列決定方法であって、(i)配列決定しようとするRNAのCMCによる処理ステップ;(ii)前記RNAの5’および3’末端の親和性標識化ステップ;(iii)前記RNAの無作為分解ステップ;(iv)必要に応じて、親和性相互作用に基づく得られたRNA断片の物理的分離ステップ;(v)質量分析とカップリングした、逆相高速液体クロマトグラフィー(HPLC)またはキャピラリー電気泳動(CE)または他の分離方法を使用する得られたRNA断片の測定ステップ;ならびに(v)配列/改変同定をもたらすMSデータ分析ステップを含む、方法。
  37. 前記RTおよび質量のシフトが、Uと比較してΨと優先的に反応することができるCMCまたは化学部分によって引き起こされ得る、請求項35に記載の方法。
  38. 改変核酸塩基を含むRNA配列が、改変RNAと非改変RNAとの両方を含有する混合物から決定され、改変核酸塩基の非改変核酸塩基に対する相対パーセンテージを定量することができる、請求項1または28に記載のRNA配列決定方法。
  39. 改変核酸塩基の非改変核酸塩基に対する前記相対パーセンテージの定量を、抽出イオンクロマトグラフに基づく部分改変RNA試料中で定量することができる、請求項38に記載の方法。
  40. RNA試料が、RNA分子のアナログを含む、請求項1に記載のRNA配列決定方法。
  41. 前記RNA分子の前記アナログが、N3’−P5’結合ホスホロアミデートDNAまたはRNAである、請求項40に記載のRNA配列決定方法。
JP2020565759A 2018-05-25 2019-05-24 直接核酸配列決定方法 Pending JP2021525507A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023192920A JP2024010243A (ja) 2018-05-25 2023-11-13 直接核酸配列決定方法

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201862676703P 2018-05-25 2018-05-25
US62/676,703 2018-05-25
US201862730592P 2018-09-13 2018-09-13
US62/730,592 2018-09-13
US201962800054P 2019-02-01 2019-02-01
US62/800,054 2019-02-01
US201962833964P 2019-04-15 2019-04-15
US62/833,964 2019-04-15
PCT/US2019/033920 WO2019226990A1 (en) 2018-05-25 2019-05-24 Direct nucleic acid sequencing method

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2023192920A Division JP2024010243A (ja) 2018-05-25 2023-11-13 直接核酸配列決定方法

Publications (1)

Publication Number Publication Date
JP2021525507A true JP2021525507A (ja) 2021-09-27

Family

ID=68617230

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2020565759A Pending JP2021525507A (ja) 2018-05-25 2019-05-24 直接核酸配列決定方法
JP2023192920A Pending JP2024010243A (ja) 2018-05-25 2023-11-13 直接核酸配列決定方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2023192920A Pending JP2024010243A (ja) 2018-05-25 2023-11-13 直接核酸配列決定方法

Country Status (4)

Country Link
US (1) US20210198734A1 (ja)
EP (1) EP3802821A4 (ja)
JP (2) JP2021525507A (ja)
WO (1) WO2019226990A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4139043A4 (en) * 2020-04-20 2024-09-11 New York Institute Of Tech DIRECT RNA SEQUENCING METHODS

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008512129A (ja) * 2004-09-10 2008-04-24 セクエノム,インコーポレイティド 核酸の広範囲配列分析法
US20170253911A1 (en) * 2013-12-05 2017-09-07 New England Biolabs, Inc. Methods for Enriching for a Population of RNA Molecules
WO2017149139A1 (en) * 2016-03-03 2017-09-08 Curevac Ag Rna analysis by total hydrolysis
US20180080018A1 (en) * 2010-06-18 2018-03-22 The University Of North Carolina At Chapel Hill Methods and Compositions for Synthetic RNA Endonucleases

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NZ501919A (en) * 1997-07-22 2001-11-30 Qiagen Genomics Inc Methods for analyzing nucleic acid molecules utilizing mass spectroscopy readable tags
DK1210357T3 (da) * 1999-09-10 2008-07-21 Geron Corp Oligonukleotid-N3' -P5' -thiophosphoramidater: syntese og anvendelse deraf
US7635562B2 (en) * 2004-05-25 2009-12-22 Helicos Biosciences Corporation Methods and devices for nucleic acid sequence determination
WO2010049156A1 (en) * 2008-10-29 2010-05-06 Noxxon Pharma Ag Sequencing of nucleic acid molecules by mass spectrometry
WO2013016712A2 (en) * 2011-07-27 2013-01-31 The Rockefeller University Methods for fixing and detecting rna
US9290807B2 (en) * 2011-07-29 2016-03-22 Cambridge Epigenetix Limited Methods for detection of nucleotide modification

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008512129A (ja) * 2004-09-10 2008-04-24 セクエノム,インコーポレイティド 核酸の広範囲配列分析法
US20180080018A1 (en) * 2010-06-18 2018-03-22 The University Of North Carolina At Chapel Hill Methods and Compositions for Synthetic RNA Endonucleases
US20170253911A1 (en) * 2013-12-05 2017-09-07 New England Biolabs, Inc. Methods for Enriching for a Population of RNA Molecules
WO2017149139A1 (en) * 2016-03-03 2017-09-08 Curevac Ag Rna analysis by total hydrolysis

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
J. AM. CHEM. SOC., vol. 137, JPN6023019101, 2015, pages 14430 - 14438, ISSN: 0005056679 *
NUCLEIC ACIDS RESEARCH, vol. 29, no. 10, JPN6023019102, 2001, pages 1 - 7, ISSN: 0005056680 *

Also Published As

Publication number Publication date
EP3802821A1 (en) 2021-04-14
JP2024010243A (ja) 2024-01-23
US20210198734A1 (en) 2021-07-01
WO2019226990A1 (en) 2019-11-28
EP3802821A4 (en) 2022-06-08

Similar Documents

Publication Publication Date Title
Pourshahian Therapeutic oligonucleotides, impurities, degradants, and their characterization by mass spectrometry
Grozhik et al. Antibody cross-reactivity accounts for widespread appearance of m1A in 5’UTRs
Jora et al. Detection of ribonucleoside modifications by liquid chromatography coupled with mass spectrometry
Baronti et al. A guide to large-scale RNA sample preparation
Kellner et al. Detection of RNA modifications
Ross et al. Sequence mapping of transfer RNA chemical modifications by liquid chromatography tandem mass spectrometry
Yoluç et al. Instrumental analysis of RNA modifications
Beverly et al. Label-free analysis of mRNA capping efficiency using RNase H probes and LC-MS
Wetzel et al. Mass spectrometry of modified RNAs: recent developments
Schmidt et al. Investigation of protein–RNA interactions by mass spectrometry—Techniques and applications
Giessing et al. Mass spectrometry in the biology of RNA and its modifications
Zhang et al. A general LC-MS-based RNA sequencing method for direct analysis of multiple-base modifications in RNA mixtures
WO2016145416A2 (en) Proteomic analysis with nucleic acid identifiers
JP5766610B2 (ja) 質量分析法による核酸分子の配列決定
KR20160078989A (ko) 시티딘-5-카르복스아미드 변형된 뉴클레오티드 조성물 및 그와 관련된 방법들
EP3387150A1 (en) Label-free analysis of rna capping efficiency using rnase h, probes and liquid chromatography/mass spectrometry
EA032438B1 (ru) Способы мечения днк-кодированных библиотек
JP2014014369A (ja) 質量分析法を用いた生体分子の検出および定量
Beverly Applications of mass spectrometry to the study of siRNA
JP2024010243A (ja) 直接核酸配列決定方法
Banoub et al. Mass spectrometry of nucleosides and nucleic acids
Fourmy et al. Protein–RNA footprinting: an evolving tool
Pomerantz et al. Deconvolution of combinatorial oligonucleotide libraries by electrospray ionization tandem mass spectrometry
Martella et al. Simultaneous RNA and DNA Adductomics Using Single Data-Independent Acquisition Mass Spectrometry Analysis
Lenz et al. Detection of protein-RNA crosslinks by NanoLC-ESI-MS/MS using precursor ion scanning and multiple reaction monitoring (MRM) experiments

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220427

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230512

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20230810

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20231005

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240110

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20240404

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20240606

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20240730