JP2023548857A

JP2023548857A - ヘアピンオリゴヌクレオチド及びその使用

Info

Publication number: JP2023548857A
Application number: JP2023526975A
Authority: JP
Inventors: パン、タオ; ディー．カタンスキ、クリストファー; ピー．ワトキンス、クリストファー
Original assignee: ザユニヴァーシティーオヴシカゴ
Priority date: 2020-11-06
Filing date: 2021-11-05
Publication date: 2023-11-21
Also published as: WO2022099010A3; CN116829713A; AU2021376394A1; EP4240863A2; CA3197283A1; IL302555A; WO2022099010A2; WO2022099010A9; MX2023005263A; KR20230104207A; US20230416727A1; AU2021376394A9

Abstract

いくつかの態様において、本発明は、３’－末端ヌクレオチドを含むヘアピンオリゴヌクレオチドであって、該３’－末端ヌクレオチドの糖成分が２’－ヒドロキシル及び３’－リン酸を含むヘアピンオリゴヌクレオチドを提供する。いくつかの態様において、本発明は、３’末端ヌクレオチドを含むヘアピンオリゴヌクレオチドであって、該３’末端ヌクレオチドの糖位置が糖の２’，３’－ジアルデヒド酸化生成物を含むヘアピンオリゴヌクレオチドを提供する。いくつかの態様において、本発明は、バイオマーカーの開発におけるヘアピンオリゴヌクレオチドの使用を提供する。いくつかの態様において、本発明は、リガンド部分及びヘアピンオリゴヌクレオチドを含む固体支持体であって、ヘアピンオリゴヌクレオチドの親和性部分が固体支持体のリガンド部分に結合することを介して該オリゴヌクレオチドが固体支持体に固定化される固体支持体を提供する。いくつかの態様において、本発明はまた、（ａ）ＲＮＡ配列をヘアピンオリゴヌクレオチドにライゲーションしてコンストラクトを形成することと、（ｂ）ＲＮＡ配列をｃＤＮＡ配列として逆転写することと、（ｃ）ＰＣＲを用いてｃＤＮＡ配列を増幅することと、を含むＲＮＡ配列ライブラリを調製する方法を提供する。【選択図】図１

Description

関連出願の相互参照
この特許出願は、その全体が参照により本明細書に援用される、２０２０年１１月６日出願の米国仮特許出願第６３／１１０，６０５号の利益を主張する。

連邦支援の研究又は開発に関する記述
本発明は、米国国立衛生研究所によって与えられた助成金番号ＨＧ００８９３５の下で政府の支援を受けて成された。政府は、本発明において一定の権利を有する。

電子的に提出された文献の参照による援用
本明細書と同時に提出され、以下の通り特定されるコンピュータ可読ヌクレオチド配列表は、その全体が参照により本明細書に援用される：２０２１年１１月５日に作成された「７５７１５４＿ＳＴ２５．ＴＸＴ」という名称の３２，８４７バイトのＡＳＣＩＩ（テキスト）ファイル。

ＲＮＡシーケンシング（ＲＮＡ－ｓｅｑ）で行われる典型的な酵素的及び化学的処理は、特に低分子ＲＮＡの場合、サンプル回収において大きな障害となることがある。更に、ｔＲＮＡの存在量が極めて多いことから、シーケンシングライブラリを構築する前にｔＲＮＡと他のＲＮＡとをサイズによって分離することにより低分子ＲＮＡ－ｓｅｑを行うことが多く、この分離により、ｔＲＮＡと他の低分子ＲＮＡとのデータの関連性が切り離され、貴重な生物学的情報が失われることがある。また、ライブラリを構築する前に、そして、ライブラリ構築中に再度ｔＲＮＡをゲル精製する必要があるプロトコルに基づくＲＮＡ－ｓｅｑ手順は、効率が悪く、大量のインプット材料を必要とする。

最も一般的に使用されている市販のＲＮＡ－ｓｅｑキットは、転写後修飾も含む低分子ＲＮＡ（約２００ヌクレオチド未満）の研究には適合しない。低分子ＲＮＡ－ｓｅｑキットは、多くの場合、逆転写の前に逐次アダプターをライゲーションすることに依存するため、修飾により失敗した逆転写産物が生物学的情報及び解釈を歪めてしまう可能性がある。また、従来のＲＮＡ－ｓｅｑ手順及びキットは、多数のサンプルを取り扱うために必要なマルチプレックス化のレベルも不足している。

新規のＲＮＡ－ｓｅｑライブラリ調製戦略及びそれに使用するためのヘアピンオリゴヌクレオチドが必要とされている。

いくつかの態様において、本発明は、３’末端ヌクレオチドを含むヘアピンオリゴヌクレオチドであって、該３’末端ヌクレオチドの糖成分が２’－ヒドロキシル及び３’－リン酸を含むヘアピンオリゴヌクレオチドを提供する。

いくつかの態様において、本発明は、３’末端ヌクレオチドを含むヘアピンオリゴヌクレオチドであって、該３’末端ヌクレオチドの糖位置が糖の２’，３’－ジアルデヒド酸化生成物を含むヘアピンオリゴヌクレオチドを提供する。

いくつかの態様において、本発明は、バイオマーカーの開発におけるヘアピンオリゴヌクレオチドの使用であって、該オリゴヌクレオチドが親和性部分及び３’末端ヌクレオチドを含み、該３’末端ヌクレオチドの糖成分が２’－ヒドロキシル及び３’－リン酸を含む使用を提供する。

いくつかの態様において、本発明は、リガンド部分及びヘアピンオリゴヌクレオチドを含む固体支持体であって、該オリゴヌクレオチドが、親和性部分及び３’末端ヌクレオチドを含み、該３’末端ヌクレオチドの糖成分が２’－ヒドロキシル及び３’－リン酸を含み、該ヘアピンオリゴヌクレオチドの該親和性部分の該固体支持体の該リガンド部分への結合を通じて該オリゴヌクレオチドが該固体支持体に固定化される固体支持体を提供する。

いくつかの態様において、本発明は、（ａ）ＲＮＡ配列をヘアピンオリゴヌクレオチドにライゲーションしてコンストラクトを形成することであって、該オリゴヌクレオチドが３’末端ヌクレオチドを含み、該３’末端ヌクレオチドの糖成分が２’－ヒドロキシル及び３’－リン酸を含むことと、（ｂ）ＲＮＡ配列をｃＤＮＡ配列として逆転写することと、（ｃ）ＰＣＲを用いて該ｃＤＮＡ配列を増幅させることと、を含むＲＮＡ配列ライブラリを調製する方法を提供する。

追加の態様は、本明細書に記載の通りである。

図１は、本発明の態様に係るＲＮＡシーケンシング（ＲＮＡ－ｓｅｑ）ライブラリの調製を表し、非生産的な最初のライゲーション後にオリゴヌクレオチドヘアピンが受けるプロセスを示す。図２Ａは、本発明の態様に係るＲＮＡ－ｓｅｑライブラリの調製の概略図である。図２Ｂは、本発明に係る捕捉ヘアピンオリゴ（ＣＨＯ）の特徴を表し、説明が埋め込まれている。図２Ｃは、脱メチル化酵素処理の有り無し両方での、全ＲＮＡ－ｓｅｑライブラリからの最終ＰＣＲ産物を示す。ＤＮＡサイズマーカーをゲルの左側に示す。ヒトｔＲＮＡにおけるｍ１Ａ５８及びｍ１Ｇ３７の修飾によって引き起こされる主なＲＴ（逆転写酵素）の停止をゲルの右側に示す。ＴｄＴは、ＲＴの異常な末端転移酵素活性に由来する生成物に対応する。図２Ｄは、脱メチル化酵素処理の有り無し両方での、様々な量のインプット全ＲＮＡの量を用いて作製したライブラリの最終ＰＣＲ産物を示す。図２Ｅは、脱メチル化酵素及び／又は過ヨウ素酸塩の処理の有り無し両方での、ＨＥＫ２９３Ｔ全ＲＮＡ（対照）及びヒトの便の全核酸で出発したライブラリの最終ＰＣＲ産物を示す。図２Ｆは、脱メチル化酵素処理の有り無し両方での、マルチプレックス化口腔（舌擦過物）マイクロバイオームライブラリの最終ＰＣＲ産物を示す。図３Ａは、合成オリゴヌクレオチドのヘアピンオリゴヌクレオチドへのライゲーションの結果を示す。図３Ｂは、脱メチル化酵素及び／又は過ヨウ素酸塩の処理の有り無し両方での、ライゲーションされたオリゴヌクレオチドが固体支持体ビーズに固定化されている逆転写実験の結果を示す。図３Ｃは、２回目のライゲーションで追加のプライマーを付加した後に実施したＰＣＲの生成物を示し、インプットＲＮＡが３’－Ａ又は３’－Ｃで終端した場合、最終生成物にほとんど偏りがないことを示す。図３Ｄは、脱リン酸化工程の効率を示す。図３Ｅは、過ヨウ素酸塩処理の有り無し両方での、末端ヌクレオチドが異なるヘアピンオリゴヌクレオチドのライゲーション産物を示す。図３Ｆは、ワンポットシーケンシングにおけるｔＲＮＡ荷電の測定の概略図を表す。図３Ｇは、図３Ｆに示した処理の有り（＋，＋）無し（－，－）両方での最終ＰＣＲ産物を示す。図４Ａは、大腸菌ゲノムにマッピングされたＲＮＡ－ｓｅｑ結果を表し、様々な種類のＲＮＡの存在が明らかになった。図４Ｂは、シーケンシング又はマイクロアレイハイブリダイゼーションによって測定されたｔＲＮＡ^Ａｒｇ又はｔＲＮＡ^Ｌｅｕイソ受容体の相対存在量の比較を表し；各対の左側の薄い色のドットはマイクロアレイデータ、各対の右側の濃い色のドットはＲＮＡ－ｓｅｃデータである。図４Ｃは、脱メチル化酵素処理の有り無し両方での、ＲＮＡから作製したライブラリの比較を表す。図４Ｄは、個々のｔＲＮＡに沿った変異率のヒートマップである。図４Ｅは、脱メチル化酵素の有り無し両方での、ｒｐｍ（毎分リード数）＞１における非コードＲＮＡ転写物の存在量を表す。図５Ａは、１０分間の３つの急性ストレス条件の有り無し両方での、ＬＢで成長させた大腸菌（Ｅ．ｃｏｌｉ）からの全ＲＮＡの生物学的複製間のＲＮＡ転写物の存在量の相関を示す。図５Ｂは、脱メチル化酵素で処理したサンプル及び未処理のサンプルの転写物の存在量間の関係を示す。図５Ｃは、脱メチル化酵素処理の有り無し両方でのライブラリからのｔＲＮＡ^Ｐｒｏ（ＧＧＧ）に沿った変異率を示す。図５Ｄは、脱メチル化酵素処理の有り無し両方でのｔＲＮＡ^Ｐｒｏ（ＧＧＧ）に沿ったリード密度を示す。図５Ｅは、異なるストレス中及び非ストレス対照の３つのストレス応答性低分子非コードＲＮＡ及び非応答性対照ＲＮＡＳＲＰ（シグナル認識粒子ＲＮＡ、ｆｆｓとしても知られている）の存在量を表す。図５Ｅで解析したストレス応答性配列は、ＯｘｙＳ（＋）、酸化ストレスに応答；ｒｈｙＢ（三角）、鉄飢餓に応答；ｓｇｒＳ（四角）、グルコース飢餓に応答；及びｆｆｓ（ＳＲＰ；丸）、非応答性対照配列。図５Ｆは、ストレス中及び非ストレス対照（なし）の３つのストレス応答性低分子非コードＲＮＡ及び対照ＲＮＡＳＲＰ（ｆｆｓ）のカバレッジ密度を表す。図５Ｇは、ストレス中の大腸菌ＲＮＡの存在量の変化及び修飾を示す。図６Ａは、ヒトゲノムにマッピングされたリードがいかに様々な種類のＲＮＡを明らかにするかを表す。図６Ｂは、シーケンシング又はマイクロアレイハイブリダイゼーションによって測定されたｔＲＮＡ^Ａｒｇイソ受容体の相対存在量の比較を表し；各対の左側の薄い色のドットはマイクロアレイデータ、各対の右側の濃い色のドットはＲＮＡ－ｓｅｃｑデータである。図６Ｃは、１μｇ、１００ｎｇ、又は１０ｎｇの全ＲＮＡで出発したライブラリからのｔＲＮＡ存在量の結果の相関を表す。図６Ｄは、ｒｐｍ＞１０における低分子非コードＲＮＡ転写物の存在量を表す。図７Ａは、異なるＲＮＡクラスからの転写物の存在量と脱メチル化酵素処理との相関を示す。図７Ｂは、各クラス内の異なるＲＮＡクラスの生物学的複製の相関を表す。図７Ｃは、従来の方法を用いて作製した脱メチル化酵素処理したｔＲＮＡライブラリの研究に対する、本発明のＲＮＡ－ｓｅｑ法を用いた脱メチル化酵素処理したライブラリからのｔＲＮＡ存在量の相関を表す。図７Ｄは、脱メチル化酵素処理の有り無し両方で作製したライブラリからのｔＲＮＡ^Ａｒｇ（ＡＣＧ）に沿った変異率を表す。図７Ｅは、ｔＲＮＡ^Ａｒｇ（ＡＣＧ）に沿ったリード密度を示す。図７Ｆは、ｒｐｍ＞２で検出されたマイクロＲＮＡの存在量を表す。図７Ｇは、ポリ（Ａ）選択されたＲＮＡから作製したＲＮＡシーケンシングライブラリのリード解析を表す。図７Ｈは、大部分のリードがｍＲＮＡにマッピングされ、生物学的複製間の相関が良好であることを示す。図８Ａは、ＲＮＡ－ｓｅｑにおけるＣＭＣ反応の取り込みの概略図を表す。図８Ｂは、生物学的複製間でのヒトｒＲＮＡの各ヌクレオチド位置における変異率及び停止率を表す。図８Ｃは、１８ＳｒＲＮＡのΨリッチ領域の変異率及び停止率を表す。図８Ｄは、２８ＳｒＲＮＡのΨリッチ領域の変異率及び停止率を表す。図８Ｅは、１８ＳｒＲＮＡの長さに沿った各ヌクレオチド部位におけるリードの変異率を示す。図８Ｆは、図８Ｅと同様に解析したリードの停止率を示す。図９Ａは、ヒトの舌擦過物からの主なＲＮＡクラスへのリードの割り当てを示す。図９Ｂは、様々な細菌の分類学的分類からのＳＲＰＲＮＡと５ＳｒＲＮＡとの相関を示す。値は、ｌｏｇ１０存在量のＺスコアとして計算される。図９Ｃは、９Ｂと同様に、細菌の分類学的分類ごとのＳＲＰＲＮＡの存在量と全ての同定されたｔＲＮＡの総和との相関を示す。図９Ｄは、９Ｂと同様に細菌の分類学的分類ごとの５ＳｒＲＮＡと全ての同定されたｔＲＮＡの総和との相関を示す。図９Ｅは、プレボテラ・メラニノゲニカ（Ｐｒｅｖｏｔｅｌｌａｍｅｌａｎｉｎｏｇｅｎｉｃａ）のＳＲＰにマッピングされたリードを示し；リードは、遺伝子のアノテーション付き５’末端（上）にマッピングされるが（大文字）、転写物の３’末端（下）は、遺伝子のアノテーションを１～３塩基超えてゲノム配列に入り（小文字）；伸長された３’末端は、ＳＲＰ構造コンテキストと一致している（中央）。図９Ｆは、ロシア・ムシラジノーサ（Ｒｏｔｈｉａｍｕｃｉｌａｇｉｎｏｓａ）のＳＲＰにマッピングされたリードを示し；リードは、遺伝子のアノテーション付き５’末端（上）の２～５塩基下流にマッピングされるが、３’末端（下）は、アノテーション付き末端から４～８ｎｔ短い３’末端を有する個体間の異質性を示す。図１０Ａは、ｔＲＮＡ、５ＳｒＲＮＡ、ＳＲＰＲＮＡのいずれかを用いて算出した又は１６Ｓアンプリコン遺伝子シーケンシングによって測定した、ヒト舌擦過物からの微生物の分類学的組成を示す。図１０Ｂは、ｔＲＮＡ、５ＳｒＲＮＡ、ＳＲＰＲＮＡ、及び１６Ｓアンプリコンシーケンシングによって測定したときの、４名の異なる個体の連続する２日間の舌の微生物存在量の倍率変化を示す。図１０Ｃは、ヒトの便からの異なる主なＲＮＡクラスへのリードの割り当てを示す。図１０Ｄは、ｔＲＮＡ、５ＳｒＲＮＡ、ＳＲＰＲＮＡのいずれかを用いて算出した又は１６Ｓアンプリコン遺伝子シーケンシングによって測定した、２つのヒト便サンプルからの微生物の分類学的組成を示す。図１１Ａは、ｔＲＮＡ、５ＳｒＲＮＡ、ＳＲＰＲＮＡのいずれかを用いて算出した又は１６Ｓアンプリコン遺伝子シーケンシングによって測定した、４つの異なるヒト舌擦過物からの微生物の分類学的組成を示す。図１１Ｂは、アンチコドン「ＴＴＴ」又は「ＣＴＴ」のいずれかを有するｔＲＮＡを用いて算出した、ヒト舌擦過物からの微生物の分類学的組成を示す。図１２Ａは、ヒト舌擦過物からのロシア（Ｒｏｔｈｉａ）属の細菌の個々のｔＲＮＡに沿った変異率のヒートマップを示す。図１２Ｂは、Ａと同様にヒートマップを示すが、脱メチル化酵素処理に対して感受性である変異を同定する。図１２Ｃは、属からの選択されたｔＲＮＡの３７位及びその周辺の塩基の変異率を示す。図１２Ｄは、脱メチル化酵素処理の有り無し両方での、ヒト舌からの幾つかの細菌分類群における選択されたｔＲＮＡの２２位における変異率を示す。図１２Ｅは、Ｄと同様のヒト舌からの放線菌綱（Ａｃｔｉｎｏｂａｃｔｅｒｉａ）の５８位におけるＮ１－メチアデノシン（ｍ１Ａ）（ｍ１Ａ５８）を同定する。図１２Ｆは、連続する２日間の４つのヒト舌擦過物からの脱メチル化酵素処理無しでの選択された細菌綱ごとの２２位における変異率を示す。図１２Ｇは、連続する２日間の４つのヒト舌擦過物からの脱メチル化酵素処理無しでの放線菌綱の５８位における変異率を示す。図１２Ｈは、ヒトの便からのＤと同様の選択された細菌綱におけるｍ１Ａ２２を同定する。図１２Ｉは、ヒトの便からのＥと同様の放線菌綱におけるｍ１Ａ５８を同定する。図１３は、ＳＡＲＳ－ＣｏＶ－２感染個体の鼻から得られたサンプルで検出されたｔＲＮＡのヒストグラムを表す。図１４は、健常対照、及びインフルエンザ感染患者、及びＳＡＲＳＣｏＶ－２感染患者の鼻咽頭ぬぐい液から得られたサンプルのｔＲＮＡ分析結果を表す。図１４Ａは、３つの患者群ごとのｔＲＮＡ配列に沿った連続領域におけるｔＲＮＡ断片化パターンを示す。図１４Ｂは、３つの患者群間での特定のｔＲＮＡの５’半断片におけるｔＲＮＡリードの割合を示す；ｎｓ、有意ではない、Ｐ値：^＊＜０．０５；^＊＊＜０．０１；^＊＊＊＜１０^－３、及び^＊＊＊＊＜１０^－４。図１４Ｃは、３つの患者群間での同一サンプルにおける低分子ｒＲＮＡに対する特異的ｔＲＮＡの相対存在量を示す。図１４Ｄは、サンプル間での特定のｔＲＮＡ塩基修飾プロファイルのパターンを示す。図１５は、結腸直腸がん（ＣＲＣ）患者６名の腫瘍及び隣接組織におけるｔＲＮＡ－ｓｅｑの存在量、修飾、及び断片化の尺度を表す。図１５Ａは、ｔＲＮＡ^Ａｌａ（ＴＧＣ）の存在量が、隣接組織よりも腫瘍において一貫して高いことを示す（左図）。対照的に、ｔＲＮＡ^Ｌｅｕ（ＡＡＧ）のレベルはばらついており、異なる腫瘍の異質性が強調されている（右図）。図１５Ｂの上図は、特定のｔＲＮＡにおける修飾をシーケンシングにおける誤取り込み（変異）によって検出できることを示す。下図は、サンプルを脱メチル化酵素で処理すると、ある種の塩基修飾（ｍ１Ａ）は除去できるが、別の種（Ｉ）には影響がないことを示す。図１５Ｃは、異なる細胞条件に応答する細胞性ヌクレアーゼ切断から生成されるｔＲＮＡ断片を示す。図１６は、個々の患者におけるミトコンドリアｔＲＮＡの腫瘍発現パターンを表す。図１６Ａは、６名中４名の患者について、腫瘍におけるミトコンドリアｔＲＮＡの発現が隣接組織と比較して低いことを示す。図１６Ｂは、ミトコンドリアｔＲＮＡ発現データのより大きなデータセットを含めることにより、高ＢＭＩ（ボティマスインデックス）患者からの腫瘍では、低ＢＭＩ患者からの腫瘍と比較してミトコンドリアｔＲＮＡ遺伝子発現が高いことが明らかになったことを示す。図１７は、ＣＲＣ患者における５ＳｒＲＮＡの発現によって測定された微生物群の組成を表す。図１８は、ある患者からのフェカリス菌（Ｅ．ｆａｅｃａｌｉｓ）ｔＲＮＡ^Ｔｙｒデータを表し、亜種の検出を実証する。図１８Ａは、シーケンシング中の塩基の誤取り込み事象が、ｔＲＮＡの修飾（ｍ１Ａ）又はマイクロバイオームサンプルにおける遺伝的多様性（ＳＮＰ）に起因する可能性があることを示す。７位における誤取り込みは、近縁の細菌種間の遺伝的多様性を反映しており、図１８Ｂは、手術後に種の組成が大きく変化することを示す。２３位における誤取り込みは、塩基修飾を反映しており、図１８Ｃは、この修飾の割合が手術後に変化することを示す。

いくつかの態様において、本発明は、３’末端ヌクレオチドを含むヘアピンオリゴヌクレオチドであって、該３’末端ヌクレオチドの糖成分が２’－ヒドロキシル及び３’－リン酸を含むヘアピンオリゴヌクレオチドを提供する。いくつかの態様において、３’末端ヌクレオチドの糖成分はペントースであり得、ペントースはリボースであり得る。

本明細書で使用するとき、「オリゴヌクレオチド」は、ポリヌクレオチド鎖であり、典型的には２００ヌクレオチド未満長であり、いくつかの態様において１０～８０ヌクレオチド（例えば、１０ヌクレオチド、２０ヌクレオチド、３０ヌクレオチド、４０ヌクレオチド、５０ヌクレオチド、６０ヌクレオチド、７０ヌクレオチド、又は８０ヌクレオチド）である。オリゴヌクレオチドは、一本鎖であっても二本鎖であってもよく、ＤＮＡ、ＲＮＡ、又はその両方を含み得る。「ヘアピンオリゴヌクレオチド」とは、ポリヌクレオチドを折り返して一本鎖ループと共に二本鎖のステムを有する構造を形成することができるように自己相補的な配列を有するポリヌクレオチドの種類である（例えば、図１及び２を参照）。

いくつかの態様において、本明細書に記載の任意のヘアピンオリゴヌクレオチドは、５’末端リボヌクレオチドを更に含んでいてもよい。５’末端リボヌクレオチドは、５’－リン酸を含み得る。

いくつかの態様において、本明細書に記載の任意のヘアピンオリゴヌクレオチドは、（ｉ）バーコード配列；（ｉｉ）親和性部分タグ付きヌクレオチド；及び（ｉｉｉ）プライマー結合部位を更に含んでいてもよい。図２Ｂに描かれている通り、バーコード及びプライマー結合部位の配列は、本発明のいくつかの態様において、ヘアピンオリゴヌクレオチドのステム領域を形成する一続きのポリヌクレオチド配列内に埋め込まれていてよいが、親和性部分タグ付きヌクレオチドは、本発明のいくつかの態様において、ヘアピンヌクレオチドのループの内部であってよい。

いくつかの態様において、ヘアピンオリゴヌクレオチドは、式（Ｉ）：５’－Ｐｈｏｓ－ｒＡＣＴ－Ｘ－ＡＧＡＴＣＧＧＡＡＧＡＧＣＡＣＡＣＧＡＴ（配列番号８６）－ＬＴ－ＡＧＡＣＧＴＧＴＧＣＴＣＴＴＣＣＧＡＴＣＴ（配列番号８７）－Ｚ－ＡＧｒＵ－３’－Ｐｈｏｓ（式中、Ｘは、少なくとも３ヌクレオチド、４ヌクレオチド、５ヌクレオチド、又は６ヌクレオチドのバーコードであり、ＬＴは、親和性部分でタグ付けされたチミンヌクレオチドであり、Ｚは、バーコード配列の逆相補鎖であるヌクレオチドの配列である）のヌクレオチド配列を含み得る。いくつかの態様において、式（ＩＩ）のヌクレオチド配列は、５’－Ｐｈｏｓ－ｒＡＣＴ－Ｘ－ＧＡＴＣＧＴＣＧＧＡＣＴＧＴＡＧＡＡＣＡＴ（配列番号８８）－ＬＴ－ＡＧＡＧＴＴＣＴＡＣＡＧＴＣＣＧＡＣＧＡＴＣ（配列番号８９）－Ｚ－ＡＧｒＵ－３’－Ｐｈｏｓ（式中、Ｘは、少なくとも３ヌクレオチド、４ヌクレオチド、５ヌクレオチド、又は６ヌクレオチドのバーコードであり、ＬＴは、親和性部分でタグ付けされたチミンヌクレオチドであり、Ｚは、バーコード配列の逆相補鎖であるヌクレオチドの配列である）を含み得る。

以下の表に、上記の例示的なヘアピンオリゴヌクレオチドの完全長ＤＮＡ配列を提示する：

本明細書で使用するとき、「バーコード」という用語は、そのバーコードが会合しているポリヌクレオチドの何らかの特徴を識別することを可能にする既知の核酸配列を指す。多くの場合、識別されるポリヌクレオチドの特徴は、そのポリヌクレオチドが由来するサンプルである。いくつかの態様において、バーコードは、少なくとも３、４、５、６、又はそれ以上のヌクレオチド長である。いくつかの態様において、バーコードは、３ヌクレオチド長以上である。いくつかの態様において、複数のバーコードを含有する混合物中の各バーコードは、少なくとも２つのヌクレオチド位置、例えば、少なくとも２つ、３つ、４つ、５つ、又はそれ以上の位置が、該複数のバーコードにおける他の全てのバーコードと異なっている。好ましくは、混合物中のバーコードは、少なくとも３つのヌクレオチド位置が互いに異なっている。一般に、バーコードは十分な長さであり、会合しているバーコードに基づいてサンプルを識別できるようにするのに十分に異なる配列を含む。

本明細書で使用するとき、「プライマー」という用語は、相補的ヌクレオチド配列とハイブリダイズすることができ、ＤＮＡ合成の出発点を提供することができるヌクレオチド配列を指す。プライマーは、その相補的なヌクレオチド配列に特異的に結合するのに十分な長さである。プライマーは、６、７、８、９、１０、又はそれ以上の塩基長、典型的には１５ヌクレオチド長、１６ヌクレオチド長、１７ヌクレオチド長、１８ヌクレオチド長、１９ヌクレオチド長、又は２０ヌクレオチド長であってよい。プライマーは、例えば、より長い一本鎖ポリヌクレオチド配列内の配列であってよい。あるいは、プライマーは、一本鎖オリゴヌクレオチドであってもよい。

いくつかの態様において、本明細書に記載の任意のヘアピンオリゴヌクレオチドを固体支持体上に固定化してもよい。固体支持体は、カラムクロマトグラフィー等の生化学的プロセスで使用するのに好適な任意の固体支持体であってよい。例えば、固体支持体は、制御多孔質ガラス、又はポリスチレン支持体等の高分子支持体であってよい。好適な固体支持体は、多くの場合高分子であり、様々な形態及び組成を有し得る。一部の固体支持体は、天然に存在する材料に由来し、その他は、合成的に改質された天然に存在する材料に由来し、その他は、合成材料である。好適な支持体材料の例としては、アガロース及びデキストラン等の多糖類、ポリアクリルアミド、ポリスチレン、ポリビニルアルコール、ヒドロキシエチルメタクリレートとメチルメタクリレートとのコポリマー、シリカ、テフロン、ガラス等が挙げられるが、これらに限定されない。いくつかの態様において、固体支持体は、ビーズを含んでいてもよい。いくつかの態様において、ビーズは、実質的に均一な球状ビーズであってよい。

いくつかの態様において、本明細書に記載の任意のヘアピンオリゴヌクレオチドを、ＲＮＡ配列ライブラリの調製に使用することができる。いくつかの態様において、ヘアピンオリゴヌクレオチドは、ＲＮＡ配列ライブラリを調製するマルチプレックス法において使用される。本明細書で使用するとき、「マルチプレックス化」という用語は、多数のサンプルをプールし、プールしたサンプルを同時に１つ以上の生化学的プロセスに供することを指す。以下に例示的な方法を記載する。

いくつかの態様において、本発明は、リガンド部分及びヘアピンオリゴヌクレオチドを含む固体支持体であって、該オリゴヌクレオチドが、親和性部分及び３’末端ヌクレオチドを含み、該３’末端ヌクレオチドの糖成分が、２’－ヒドロキシル及び３’－リン酸を含み、該ヘアピンオリゴヌクレオチドの該親和性部分の該固体支持体の該リガンド部分への結合を通じて、該オリゴヌクレオチドが該固体支持体に固定化される固体支持体を提供する。

オリゴヌクレオチドにおける親和性部分及び固体支持体におけるリガンド部分は、親和性対を形成する。「親和性対」は、例えば、疎水性、親水性、水素結合、極性、電荷、親フッ素性等の固有の特性を介して互いに特異的に結合する親和性部分及びリガンド部分を含む。「親和性部分」及び「リガンド部分」という用語は、それら部分自体の同一性を限定することなく親和性対を形成することができると特定される（例えば、リガンド部分が親和性部分よりも小さい必要はない）。１つの周知の種類の親和性対は、タンパク質及びそのリガンドである。親和性部分及びリガンド部分はそれぞれ、直接又は間接的に、オルトエステルリンカーを介してオリゴヌクレオチド及び固体支持体に別々に結合することができる。いくつかの態様において、親和性部分は、ビオチンタグ、マルトースタグ、グルタチオンタグ、アダマンタンタグ、アリールボロン酸タグ、ポリヒスチジンペプチドタグ、ポリスルフヒドリルタグ、マレイミドタグ、アジドタグ等である。これらのいくつかの態様において、対応するリガンド部分は、アビジン又はストレプトアビジン、マルトース結合タンパク質、グルタチオンＳ－トランスフェラーゼ（ＧＳＴ）、ククルビツリル又はシクロデキストリン、ジオール含有分子、固定化金属親和性クロマトグラフィー（ＩＭＡＣ）マトリックス、スルフヒドリル含有化合物、アルキン又はシクロオクチン等である。いくつかの態様において、親和性部分はビオチンであってよく、リガンド部分はストレプトアビジンであってよい（例えば、図２Ａ～Ｂを参照）。当業者であれば、親和性対のどのメンバーをオリゴヌクレオチドに結合させ、どのメンバーを固体支持体に結合させるかを決めることができる。上述した通り、いくつかの態様において、固体支持体は、ビーズであってよい。いくつかの態様において、ビーズは、実質的に均一な球状ビーズであってよい。

固体支持体は、本明細書に記載の任意のヘアピンオリゴヌクレオチドを含んでいてよい。例えば、オリゴヌクレオチドは、（ａ）リボヌクレオチドとしての５’末端ヌクレオチド、（ｂ）バーコード配列、（ｃ）ヘアピンのループ内部の親和性部分でタグ付けされたヌクレオチド、及び（ｄ）プライマー結合部位を更に含んでいてもよい。

いくつかの態様において、本発明は、
（ａ）ＲＮＡ配列をヘアピンオリゴヌクレオチドにライゲーションしてコンストラクトを形成することであって、該オリゴヌクレオチドが３’末端ヌクレオチドを含み、該３’末端ヌクレオチドの糖成分が２’－ヒドロキシル及び３’－リン酸を含むことと、
（ｂ）該ＲＮＡ配列をｃＤＮＡ配列として逆転写することと、
（ｃ）ＰＣＲを用いて該ｃＤＮＡ配列を増幅させることと、
を含むＲＮＡ配列ライブラリを調製する方法を提供する。

いくつかの態様において、方法は、（ｉ）リボヌクレオチドとしての５’末端ヌクレオチド、（ｉｉ）バーコード配列、（ｉｉｉ）ヘアピンのループ内部の親和性部分タグ付きヌクレオチド、及び（ｉｖ）プライマー結合部位を更に含むヘアピンオリゴヌクレオチドを含み得る。

図２Ａは、ＲＮＡ－ｓｅｑライブラリの調製において使用される本発明のヘアピンオリゴヌクレオチドの非限定的な態様を概略的に表す。このプロセスは、調製された捕捉ヘアピンオリゴヌクレオチド（ＣＨＯ）をＲＮＡ分子にライゲーションすることから始まり得、該ＣＨＯは３’末端ヌクレオチドを含み、該３’末端ヌクレオチドの糖成分は２’－ヒドロキシル及び３’－リン酸を含む。ヘアピンオリゴヌクレオチドは、「オンビーズ（ｏｎ－ｂｅａｄ）」ＲＮＡシーケンシングライブラリの調製を可能にするように設計してよい。例示的なＣＨＯとして、図２Ｂに表されるＣＨＯの特徴は、（１）効率的なライゲーションのための５’－リン酸；（２）効率的なＲＮＡ－ＲＮＡライゲーションのための５’末端リボヌクレオチド；（３）複数サンプルのマルチプレックス化／混合を可能にするバーコード配列；（４）固定化を可能にするためのＣＨＯのループ内部の親和性部分タグ付きヌクレオチド；（５）プライマー結合部位；（６）伸長されていないヘアピンオリゴヌクレオチドへのライゲーションを防ぎ、非生産的ライゲーション産物の酸化を可能にするために糖成分が２’－ヒドロキシルを含む３’末端ヌクレオチド；及び（７）ＣＨＯの自己ライゲーションを防ぐための３’－リン酸である。いくつかの態様において、３’末端ヌクレオチドの糖成分はペントースであり得、ペントースはリボースであり得る。

ＲＮＡ分子は、任意の好適なＲＮＡ配列であってよい。いくつかの態様において、ＲＮＡ配列は、全ＲＮＡ（例えば、サンプル中の異なる種類のＲＮＡにヘアピンオリゴヌクレオチドがライゲーションすることによって形成される幾つかの異なるコンストラクト）を含み得る。別のいくつかの態様において、ＲＮＡ配列は、低分子ＲＮＡであってよい。低分子ＲＮＡとしては、ｔＲＮＡ、マイクロＲＮＡ、ｐｉＲＮＡ、ｔＲＮＡの断片、ｒＲＮＡ、長鎖非コードＲＮＡ（ｌｎｃＲＮＡ）、スプライセオソームＲＮＡ（ｓｎＲＮＡ）、低分子核小体ＲＮＡ（ｓｎｏＲＮＡ）等が挙げられる。いくつかの態様において、使用されるＲＮＡ配列は、ｔＲＮＡであってよい。

態様として、図１及び２Ａは、バーコードを有するＣＨＯのＲＮＡリガーゼを用いたｔＲＮＡへのライゲーションを示す。例えば、Ｔ４ＲＮＡリガーゼ１又は２等の任意の好適なＲＮＡリガーゼを使用してよい。いくつかの態様において、使用されるリガーゼは、Ｔ４ＲＮＡリガーゼ１であってよい。５’末端リボヌクレオチドは、５’－リン酸を含み、ライゲーション効率を促進することができる。３’－リン酸は、第１のライゲーションにおけるヘアピンオリゴヌクレオチドの自己ライゲーションをブロックし、それにより、ヘアピンオリゴヌクレオチドのＲＮＡへのライゲーションの効率を向上させる。

バーコードライゲーション反応後、ｔＲＮＡを有するＣＨＯを固体支持体上に固定化した後に後続の全ての反応を行うことができる。ヘアピンオリゴヌクレオチドの親和性部分が固体支持体のリガンド部分に結合することを介してオリゴヌクレオチドを固体支持体に固定化してよい。これにより、全ての工程で過剰の試薬を簡単な洗浄で除去することが容易になり、各工程でのサンプルの喪失が大幅に低減される。

方法のいくつかの態様において、固体支持体は、リガンド部分及びヘアピンオリゴヌクレオチドを含み、該オリゴヌクレオチドは、親和性部分及び３’末端ヌクレオチドを含み、該３’末端ヌクレオチドの糖成分は、２’－ヒドロキシル及び３’－リン酸を含み、該オリゴヌクレオチドは、該ヘアピンオリゴヌクレオチドの該親和性部分の該固体支持体の該リガンド部分への結合を通じて該固体支持体に固定化される。いくつかの態様において、親和性部分はビオチンであってよく、リガンド部分はストレプトアビジンであってよい（例えば、図２Ａ～Ｂを参照）。

方法のいくつかの態様において、固体支持体は、ビーズであってよい。いくつかの態様において、固体支持体は、（ａ）リボヌクレオチドとしての５’末端ヌクレオチド、（ｂ）バーコード配列、（ｃ）ヘアピンのループ内部の親和性部分でタグ付けされたヌクレオチド、及び（ｄ）プライマー結合部位を更に含むオリゴヌクレオチドを固定化する。いくつかの態様において、固体支持体は、ＲＮＡ配列ライブラリの調製において使用することができる。他のいくつかの態様において、固体支持体は、ＲＮＡ配列ライブラリを調製するマルチプレックス法において使用することができる。バーコード付きＣＨＯを固体支持体に固定化した後、サンプルをプールしてよく、それによってマルチプレックス化が可能になる。

ｔＲＮＡを有するＣＨＯを固体支持体に結合させた後、ＲＮＡの修飾をプロファイリングしたりＲＮＡ構造をマッピングしたりするために、任意でＲＮＡを酵素的又は化学的に処理してもよい。例えば、脱メチル化酵素処理により、ｔＲＮＡ及びｔＲＮＡ断片のシーケンシングにおける効率及び定量性が向上し、マイクロバイオームｔＲＮＡ又はｍＲＮＡにおけるＮ１－メチルアデノシン（ｍ１Ａ）等の新たなＲＮＡ修飾を見つけるための検証を提供する。多くのＲＮＡ構造マッピングは、例えば、２’－ＯＨ（ＳＨＡＰＥ）については２－メチルニコチン酸イミダゾリドを又は塩基の高次構造についてはジメチル硫酸／ケトキサールを用いた化学反応を伴う。ＲＮＡ修飾研究では、シュードウリジン（Ψ）又は５－メチルシトシン（ｍ５Ｃ）の部位の同定において化学反応が使用される。例えば、図２Ａは、ｔＲＮＡのワトソン－クリック面のメチル化を除去するための、ｔＲＮＡを含むビーズに固定化されたＣＨＯの脱メチル化酵素による処理を表す。いくつかの態様において、脱メチル化酵素は、ＡｌｋＢ脱メチル化酵素混合物であってよい。

図１及び２Ａは、更に、ＲＮＡ－ｓｅｑライブラリの調製において使用することができる他の手順の例を表す。脱メチル化後、アルカリホスファターゼで３’－リン酸基を除去してよい。いくつかの態様において、アルカリホスファターゼは、子ウシの腸（ＣＩＰ）に由来する。

脱リン酸化後、ＣＨＯの３’－ＯＨを逆転写酵素によって伸長させて、ＲＮＡのｃＤＮＡコピーを作製する。例えば、ＴＧＩＲＴ、ＡＭＶＲＴ、ＴｈｅｒｍｏＳｃｒｉｐｔ（商標）ＲＴ（Ｉｎｖｉｔｒｏｇｅｎ（商標））、ＭＭＬＶＲＴ、ＳｕｐｅｒＳｃｒｉｐｔ（商標）ＩＶＲＴ（Ｉｎｖｉｔｒｏｇｅｎ（商標））等の任意の好適な逆転写酵素（ＲＴ）を使用してよい。いくつかの態様において、逆転写酵素は、ＳｕｐｅｒＳｃｒｉｐｔ（商標）ＩＶＲＴ（Ｉｎｖｉｔｒｏｇｅｎ（商標））であってよい。

逆転写後、ｔＲＮＡ配列をＲＮａｓｅで消化してよい。ＲＮａｓｅＨ等のＤＮＡ／ＲＮＡ二重鎖におけるＲＮＡ鎖を分解することができるエンドヌクレアーゼＲＮａｓｅが望ましい。いくつかの態様において、ＲＮａｓｅはＲＮａｓｅＨであってよい。

ＲＮａｓｅ消化後、過ヨウ素酸塩、好ましくは過ヨウ素酸ナトリウム（ＮａＩＯ_４）でＣＨＯを酸化してよい。図１に示すように、過ヨウ素酸塩で処理したときにＣＨＯの一部だけが酸化されやすくなるように、ＣＨＯは最初のライゲーション工程後に異なる運命を有し得る。

全てのＣＨＯが脱リン酸化を受けることができるが、脱リン酸化の最終生成物は異なることがある。ＲＮＡへのライゲーションに成功したＣＨＯは、３’－ＯＨから逆転写酵素による鎖伸長を受ける。次いで、これらＣＨＯは、３’末端デオキシリボヌクレオチドを有する、すなわち、末端３’－ＯＨ及び２’－Ｈを有する。これらＣＨＯは、過ヨウ素酸塩酸化に必要な２’，３’－ジオール構造を有しない。従って、２’－及び３’－ＯＨの両方で終端するＣＨＯ、すなわち、ライゲーションを受けず、ｃＤＮＡで伸長されていないＣＨＯのみが過ヨウ素酸塩によって酸化される（例えば、図１Ｂを参照）。酸化されたＣＨＯの末端ジアルデヒド（例えば、図１Ｂを参照）は、これらＣＨＯが次の第２のライゲーションを受けるのを防ぐので、下流の反応における技術的ノイズを低減する。

続いて第２のライゲーションを行って（例えば、図１及び２Ａを参照）、ＰＣＲ中に両方の相補的なＤＮＡ鎖が生成されるように、ＰＣＲ増幅の前に２番目の「逆」プライマー結合部位を付加する。第２のライゲーションオリゴヌクレオチドは、５’末端にＵｎｉｍｏｌｅｃｕｌａｒＩｎｄｅｘ（ＵＭＩ）配列を、３’末端にジデオキシヌクレオチドを含み得る（例えば、図１を参照）。３’末端ジデオキシヌクレオチドは、オリゴヌクレオチドの自己ライゲーションをブロックする。ＵＭＩは、サンプルライブラリにおける各分子に一意的にタグ付けするために使用される短い配列である。それは、シーケンシング中のエラー補正及び精度向上を提供し、ＲＮＡシーケンシング中のＰＣＲアーチファクトの重複排除を可能にする分子バーコード付けの一種である。第２のライゲーション工程で使用するための例示的なオリゴヌクレオチドは、式（ＩＩＩ）のオリゴヌクレオチド：５’－Ｐｈｏｓ－ＮＮＮＮＮＮＧＡＴＣＧＴＣＧＧＡＣＴＧＴＡＧＡＡ－３ｄｄＣ（配列番号２２）及び式（ＩＶ）のオリゴヌクレオチド：５’－Ｐｈｏｓ－ＮＮＮＮＮＮＡＧＡＴＣＧＧＡＡＧＡＧＣＡＣＡＣＧ－３ｄｄＣ（配列番号２３）（式中、一連のＮは、６ヌクレオチド長のＵＭＩ配列を表す）である。

ＲＮＡ－ｓｅｑライブラリの調製後、ｃＤＮＡで伸長されたＣＨＯはＰＣＲ増幅を受けることができる。ＰＣＲには、任意の好適なＰＣＲ試薬系及びサーモサイクラー装置を使用することができる。ＰＣＲ産物は溶液中で遊離し、容易にＤＮＡシーケンシングに使用することができる。

上記に示した通り、方法は、幾つかの態様を含み得る。いくつかの態様において、方法は、ライゲーション後に３’－リン酸を脱リン酸化し、逆転写後に２’，３’－ジオールを含む３’末端ヌクレオチドを過ヨウ素酸塩で酸化することを更に含み得る。いくつかの態様において、方法は、ライゲーション後かつ脱リン酸化前に、ＲＮＡ配列のヌクレオチドにおけるワトソン－クリック面のメチル化を脱メチル化することを含んでいてもよい。いくつかの態様において、方法は、逆転写後にＲＮＡ配列を消化し、増幅前に第２のプライマー結合部位を付加するために第２のライゲーションを行うことも含み得る。いくつかの態様において、方法は、第１のライゲーション後に、コンストラクトを固体支持体上に固定化することを更に含み得る。いくつかの態様において、方法は、固定化後に３’－リン酸を脱リン酸化し、逆転写後に２’，３’－ジオールを含む３’末端ヌクレオチドを過ヨウ素酸塩で酸化することも更に含み得る。いくつかの態様において、方法は、固定化後かつ脱リン酸化前に、ＲＮＡ配列のヌクレオチドにおけるワトソン－クリック面のメチル化を脱メチル化することも含み得る。いくつかの態様において、方法は、逆転写後にＲＮＡ配列を消化し、増幅前に第２のプライマー結合部位を付加するために第２のライゲーションを行うことも含み得る。いくつかの態様において、方法は、全ＲＮＡ、低分子ＲＮＡ、ｔＲＮＡ、マイクロＲＮＡ、ｐｉＲＮＡ、又はそれらの任意の組み合わせを含むＲＮＡを使用することができる。いくつかの態様において、方法は、マルチプレックス法を含み得る。いくつかの態様において、本発明は、バーコードアダプターのライゲーション、固定化、及び逆転写、続いて、第２のアダプターのライゲーション、及びオンビーズＰＣＲに使用される親和性部分タグ付きオリゴヌクレオチドを必要とし得る。ＲＮＡ－ｓｅｑライブラリの構築における複数の工程を統一することにより、同一反応で多くのサンプルをマルチプレックス化することが可能となるので、時間、試薬、及びテクニカルノイズが減少し、スループットが大幅に増加する。また、この設計により、オンビーズでＲＮＡの効率的な酵素的及び化学的処理を含めることも可能にする。

固体支持体をベースとするＲＮＡ－ｓｅｑ法の開発により、マルチプレックス化シーケンシングライブラリの調製、オンビーズの酵素的及び化学的処理、ワンポットｔＲＮＡの存在量、修飾、及び荷電の測定、並びにＤＮＡの干渉を受けない全核酸マイクロバイオームサンプルの解析が可能になる。

シーケンシングライブラリの構築におけるほとんどの手順を固体支持体上で実施することができる利点は、各手順間のバッファ及び試薬の迅速な交換、夾雑物質の徹底的な除去、並びにサイズ選択又はアダプター／ＲＴプライマーの除去を必要とする全ての手順の省略が可能になることである。また、固体支持プラットフォームにより、ＲＮＡのワトソン－クリック面のメチル化を除去するために用いられる脱メチル化酵素等の酵素でＲＮＡをオンビーズ処理することができるようになり、効率的かつ定量的なｔＲＮＡシーケンシング及びマイクロバイオームのｔＲＮＡ修飾の検証が可能になる。

いくつかの態様において、本発明のヘアピンオリゴヌクレオチドは、バイオマーカーの開発において使用することができる。いくつかの態様において、バイオマーカーの開発は、ｔＲＮＡ断片化プロファイルを作成することを含む。いくつかの態様において、バイオマーカーは、固形生検から又は液体生検から開発することができる。いくつかの態様において、バイオマーカーは、液体生検から開発することができる。「液体生検」という用語は、流体生検又は流体相生検としても知られており、血液、血漿、唾液、尿、鼻汁等から採取した物質等の非固体生物学的物質のサンプリング及び分析を指す。いくつかの態様において、バイオマーカーは、ウイルス性疾患の重症度又はがんに関するバイオマーカーであり得る。

本明細書で言及する本発明のヘアピンオリゴヌクレオチド、全ＲＮＡ、ｃＤＮＡ、プライマー、核酸、タンパク質、ポリペプチド、及び細胞（それらの集団を含む）は、単離及び／又は精製することができる。「単離された」という用語は、本明細書で使用するとき、その天然環境から取り出されていることを意味する。「精製された」という用語は、本明細書で使用するとき、純度が増大していることを意味し、「純度」は相対的な用語であり、必ずしも絶対純度と解釈される訳ではない。例えば、純度は、少なくとも約５０％であってよく、約６０％超、約７０％超、約８０％超、約９０％超、約９５％超であってもよく、約１００％であってもよい。

以下は、本発明の特定の態様を含む。

１．３’末端ヌクレオチドを含むヘアピンオリゴヌクレオチドであって、該３’末端ヌクレオチドの糖成分が２’－ヒドロキシル及び３’－リン酸を含むヘアピンオリゴヌクレオチド。

２．該３’末端ヌクレオチドの糖成分がペントースであり、該ペントースがリボースである、態様１に記載のヘアピンオリゴヌクレオチド。

３．３’末端ヌクレオチドを含むヘアピンオリゴヌクレオチドであって、該３’末端ヌクレオチドの糖位置が糖の２’，３’－ジアルデヒド酸化生成物を含むヘアピンオリゴヌクレオチド。

４．５’末端リボヌクレオチドを更に含む、態様１～３のいずれか１つに記載のヘアピンオリゴヌクレオチド。

５．
（ａ）バーコード配列、
（ｂ）ヘアピンのループ内部の親和性部分タグ付きヌクレオチド、及び
（ｃ）プライマー結合部位
を更に含む、態様１～４のいずれか１つに記載のヘアピンオリゴヌクレオチド。

６．配列：
５’－Ｐｈｏｓ－ｒＡＣＴ－Ｘ－ＡＧＡＴＣＧＧＡＡＧＡＧＣＡＣＡＣＧＡＴ（配列番号８６）－ＬＴ－ＡＧＡＣＧＴＧＴＧＣＴＣＴＴＣＣＧＡＴＣＴ（配列番号８７）－Ｚ－ＡＧｒＵ－３’－Ｐｈｏｓ
（式中、Ｘは、少なくとも３ヌクレオチド、４ヌクレオチド、５ヌクレオチド、又は６ヌクレオチドのバーコードであり、ＬＴは、親和性部分タグ付きチミンヌクレオチドであり、Ｚは、バーコード配列の逆相補鎖であるヌクレオチドの配列である）
を含む、態様５に記載のヘアピンヌクレオチド。

７．配列：
５’－Ｐｈｏｓ－ｒＡＣＴ－Ｘ－ＧＡＴＣＧＴＣＧＧＡＣＴＧＴＡＧＡＡＣＡＴ（配列番号８８）－ＬＴ－ＡＧＡＧＴＴＣＴＡＣＡＧＴＣＣＧＡＣＧＡＴＣ（配列番号８９）－Ｚ－ＡＧｒＵ－３’－Ｐｈｏｓ
（式中、Ｘは、少なくとも３ヌクレオチド、４ヌクレオチド、５ヌクレオチド、又は６ヌクレオチドのバーコードであり、ＬＴは、親和性部分タグ付きチミンヌクレオチドであり、Ｚは、バーコード配列の逆相補鎖であるヌクレオチドの配列である）
を含む、態様５に記載のヘアピンヌクレオチド。

８．固体支持体に固定化された、態様１～７のいずれか１つに記載のヘアピンオリゴヌクレオチド。

９．ＲＮＡ配列ライブラリの調製における、態様１～８のいずれか１つに記載のヘアピンオリゴヌクレオチドの使用。

１０．ＲＮＡ配列ライブラリを調製するマルチプレックス法における、態様１～８のいずれか１つに記載のヘアピンオリゴヌクレオチドの使用。

１１．バイオマーカーの開発における、態様１～８のいずれか１つに記載のヘアピンオリゴヌクレオチドの使用。

１２．該バイオマーカーが、液体生検から開発される、態様１１に記載の使用。

１３．該バイオマーカーの開発が、ｔＲＮＡ断片化プロファイルを作成することを含む、態様１１又は１２に記載の使用。

１４．ウイルス疾患の重症度についてのバイオマーカーの開発における、態様１～８のいずれか１つに記載のヘアピンオリゴヌクレオチドの使用。

１５．癌についてのバイオマーカーの開発における、態様１～８のいずれか１つに記載のヘアピンオリゴヌクレオチドの使用。

１６．リガンド部分及びヘアピンオリゴヌクレオチドを含む固体支持体であって、該オリゴヌクレオチドが、親和性部分及び３’末端ヌクレオチドを含み、該３’末端ヌクレオチドの糖成分が、２’－ヒドロキシル及び３’－リン酸を含み、
該ヘアピンオリゴヌクレオチドの該親和性部分が該固体支持体の該リガンド部分に結合することを介して、該オリゴヌクレオチドが固体支持体に固定化される固体支持体。

１７．該親和性部分がビオチンであり、該リガンド部分がストレプトアビジンである、態様１６に記載の固体支持体。

１８．ビーズである、態様１６又は１７に記載の固体支持体。

１９．該オリゴヌクレオチドが、
（ａ）リボヌクレオチドとしての５’末端ヌクレオチド、
（ｂ）バーコード配列、
（ｃ）ヘアピンのループ内部の親和性部分でタグ付けされたヌクレオチド、及び
（ｄ）プライマー結合部位
を更に含む、態様１６～１８のいずれか１つに記載の固体支持体。

２０．ＲＮＡ配列ライブラリの調製における、態様１６～１９のいずれか１つに記載の固体支持体の使用。

２１．ＲＮＡ配列ライブラリを調製するマルチプレックス法における、態様１６～１９のいずれか１つに記載の固体支持体の使用。

２２．
（ａ）ＲＮＡ配列をヘアピンオリゴヌクレオチドにライゲーションしてコンストラクトを形成することであって、該オリゴヌクレオチドが３’末端ヌクレオチドを含み、該３’末端ヌクレオチドの糖成分が２’－ヒドロキシル及び３’－リン酸を含むことと、
（ｂ）該ＲＮＡ配列をｃＤＮＡ配列として逆転写することと、
（ｃ）ＰＣＲを用いて該ｃＤＮＡ配列を増幅させることと、
を含むＲＮＡ配列ライブラリを調製する方法。

２３．該ヘアピンオリゴヌクレオチドが、
（ｉ）リボヌクレオチドとしての５’末端ヌクレオチド、
（ｉｉ）バーコード配列、
（ｉｉｉ）ヘアピンのループ内部の親和性部分タグ付きヌクレオチド、及び
（ｉｖ）プライマー結合部位
を更に含む、態様２２に記載の方法。

２４．ライゲーション後に３’－リン酸を脱リン酸化し、逆転写後に２’，３’－ジオールを含む３’末端ヌクレオチドを過ヨウ素酸塩で酸化することを更に含む、態様２２又は態様２３に記載の方法。

２５．ライゲーション後かつ脱リン酸化前に、ＲＮＡ配列のヌクレオチドにおけるワトソン－クリック面のメチル化を脱メチル化することを更に含む、態様２４に記載の方法。

２６．逆転写後にＲＮＡ配列を消化し、増幅前に第２のプライマー結合部位を付加するために第２のライゲーションを行うことを更に含む、態様２２～２５のいずれか１つに記載の方法。

２７．ライゲーション後に該コンストラクトを固体支持体に固定化することを更に含む、態様２２又は態様２３に記載の方法。

２８．固定化後に３’－リン酸を脱リン酸化し、逆転写後に２’，３’－ジオールを含む３’末端ヌクレオチドを過ヨウ素酸塩で酸化することを更に含む、態様２７に記載の方法。

２９．固定化後かつ脱リン酸化前に、ＲＮＡ配列のヌクレオチドにおけるワトソン－クリック面のメチル化を脱メチル化することを更に含む、態様２８に記載の方法。

３０．逆転写後にＲＮＡ配列を消化し、増幅前に第２のプライマー結合部位を付加するために第２のライゲーションを行うことを更に含む、態様２７～２９のいずれか１つに記載の方法。

３１．該ＲＮＡ配列が、全ＲＮＡ、低分子ＲＮＡ、ｔＲＮＡ、マイクロＲＮＡ、ｐｉＲＮＡ、又はそれらの任意の組み合わせを含む、態様２２～３０のいずれか１つに記載の方法。

３２．マルチプレックス法を含む、態様２２～３１のいずれか１つに記載の方法。

なお、上記は態様の単なる例であるものとする。他の例示的な態様は、本明細書における記載の全体から明らかになる。また、これらの態様の各々を本明細書で提供される他の態様と様々に組み合わせて用いることができることも、当業者であれば理解するであろう。

以下の実施例は、本発明を更に説明するが、無論、いかなる方法でもその範囲を限定すると解釈されるべきではない。

実施例１
方法
本発明の態様に従って、ＲＮＡ－ｓｅｑライブラリ調製において以下の方法を使用した。

ＲＮＡの調製
ｔＲＮＡの脱アシル化
まず１００ｍＭＴｒｉｓＨＣｌ、ｐＨ９．０の溶液中において３７℃で３０分間脱アシル化し、次いで、最終濃度１８０ｍＭの酢酸ナトリウム、ｐＨ４．８を添加することにより中和することによって、ライブラリ構築のために全ＲＮＡを調製した。次いで、脱アシル化されたＲＮＡをエタノール沈殿し、水に再懸濁させるか又はＺｙｍｏＯｌｉｇｏＣｌｅａｎ－ａｎｄ－Ｃｏｎｃｅｎｔｒａｔｏｒ（商標）スピンカラムを使用して脱塩した。

ｔＲＮＡ荷電のためのワンポット脱アシル化及びβ脱離
ライブラリを構築する前に任意でワンポットβ脱離するために、７μＬ中最大５００ｎｇの全ＲＮＡを使用した。まず、７μＬのインプットＲＮＡに１μＬの９０ｍＭ酢酸ナトリウムバッファ、ｐＨ４．８を添加した。次に、１μＬの新たに調製した１５０ｍＭ過ヨウ素酸ナトリウム溶液を添加し、混合した；反応条件は、１６ｍＭＮａＩＯ_４、１０ｍＭＮａＯＡｃ、ｐＨ４．８であった。室温で３０分間、過ヨウ素酸塩酸化を進行させた。最終６０ｍＭの０．６Ｍリボース１μＬを添加して酸化をクエンチし、５分間インキュベートした。次に、最終濃度が３３ｍＭになるように、新たに調製した１００ｍＭ四ホウ酸ナトリウム、ｐＨ９．５を５μＬ添加した。この反応物を４５℃で３０分間インキュベートした。β脱離及び３’末端修復を停止させるために、５μＬのＴ４ＰＮＫミックス（２００ｍＭＴｒｉｓＨＣｌｐＨ６．８、４０ｍＭＭｇＣｌ_２、ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ（ＮＥＢ）製の４Ｕ／μＬＴ４ＰＮＫ）を反応に添加し、３７℃で２０分間インキュベーションした。次いで、６５℃で１０分間インキュベートすることによってＴ４ＰＮＫを熱失活させた。合計２０μＬのこの反応混合物は、以下に記載するライゲーションマスターミックスを３０μＬ添加することにより、第１のバーコードライゲーションでそのまま使用することができる。

ＲＮＡ－ｓｅｑの一般的なプロトコル
第１のバーコードライゲーション
インプット材料は、脱アシル化されていたか、又は上記のようにβ脱離及び末端修復を受けていた。最大１μｇの全ＲＮＡインプットを、以下の成分と共に５０μＬのライゲーション反応で使用した：１Ｕ／μＬＴ４ＲＮＡリガーゼＩ（ＮＥＢ）、１×ＮＥＢＴ４ＲＮＡリガーゼＩバッファ、１５％ＰＥＧ８０００、５０μＭＡＴＰ、１ｍＭヘキサアミンコバルト塩化物、及び５％ＤＭＳＯ。ライゲーションミックスをサンプルに添加した後、ヘアピンを最終濃度１μＭとなるように添加し、１６℃で一晩（１２＋時間）サンプルをインキュベートした。

ダイナビーズへの結合
溶液の粘度を下げるために、等体積の水を添加することによって、ライゲーション混合物を希釈した。次に、ストレプトアビジンでコーティングしたＤｙｎａｂｅａｄｓ（商標）ＭｙＯｎｅ（商標）Ｃ１（ＴｈｅｒｍｏＦｉｓｈｅｒ）を、ヘアピンオリゴ対して１．２：１過剰になるように各サンプルに添加した（例えば、５０μＬの反応は５０ｐｍｏｌのヘアピンオリゴを有しており；ビーズは１０ｍｇ／ｍＬで供給され、１ｍｇあたり５００ｐｍｏｌのビオチン化オリゴの結合能を有していたので、１２μＬのスラリーを添加した）。ビーズサンプル混合物を室温で１５分インキュベートした。結合後、上清を除去し、ビーズを高塩洗浄バッファ（１ＭＮａＣｌ、２０ｍＭＴｒｉｓＨＣｌ、ｐＨ７．４）で１回、低塩洗浄バッファ（１００ｍＭＮａＣｌ、２０ｍＭＴｒｉｓＨＣｌ、ｐＨ７．４）で１回洗浄した。
洗浄後、下流の工程のために、複数の個別にバーコードが付けられたサンプルを組み合わせてもよい。この段階で、ＡｌｋＢ脱メチル化酵素反応又はＣＭＣ処理等の酵素的又は化学的処理をライブラリ調製プロトコルに組み込んでもよい（下記の方法を参照）。

脱リン酸化
以下を含有する５０μＬの脱リン酸化ミックスを、オンビーズのマルチプレックス化サンプルに添加した：０．０４Ｕ／μＬ子ウシ腸ホスファターゼ（Ｒｏｃｈｅ）、１０ｍＭＭｇＣｌ_２、０．５ｍＭＺｎＣｌ_２、２０ｍＭＨＥＰＥＳ、ｐＨ７．３。サンプルを、３７℃で３０分間インキュベートした。次いで、サンプルを高塩洗浄バッファで１回、低塩洗浄バッファで１回洗浄し、次いで、２０μＬの水に再懸濁させた。

逆転写
５μＬのＳｕｐｅｒＳｃｒｉｐｔ（商標）ＩＶＶＩＬＯ５×マスターミックス（ＴｈｅｒｍｏＦｉｓｈｅｒ）を、脱リン酸化されたサンプルに最終体積が２５μＬになるように添加し、次いで、５５℃で１０分間インキュベートした。次いで、サンプルを高塩洗浄バッファで１回、低塩洗浄バッファで１回洗浄した。

ＲＮａｓｅＨ消化
０．４Ｕ／ｕＬＲＮａｓｅＨ（ＮＥＢ）及び１×ＮＥＢＲＮａｓｅＨバッファを含有するＲＮａｓｅＨマスターミックス５０μＬにビーズを再懸濁させ、３７℃で１５分間インキュベートした。次いで、サンプルを高塩洗浄バッファで１回、低塩洗浄バッファで１回洗浄した。次いで、サンプルを４０μＬの水に再懸濁させた。

過ヨウ素酸塩酸化
新たに調製した０．５Ｍ酢酸ナトリウム、ｐＨ５中１０μＬの２５０ｍＭ過ヨウ素酸ナトリウムの５×溶液を、ＲＮａｓｅＨで消化したサンプルに添加し、室温で３０分間インキュベートした。その後、最終濃度１６７ｍＭになるようにリボースを添加し、室温で５分間過剰の過ヨウ素酸塩をクエンチした。次いで、サンプルを高塩洗浄バッファで１回、低塩洗浄バッファで１回洗浄した。

第２のライゲーション
ビーズを以下の成分と共に５０μＬのライゲーションマスターミックスに再懸濁させた：２Ｕ／μＬＴ４ＲＮＡリガーゼＩ（ＮＥＢ）、１×ＮＥＢＴ４ＲＮＡリガーゼＩバッファ、２μＭ第２のライゲーションオリゴ、２５％ＰＥＧ８０００、５０μＭＡＴＰ、７．５％ＤＭＳＯ、及び１ｍＭヘキサアミンコバルト塩化物。反応物を室温で一晩（１２時間以上）インキュベートした。次いで、粘度を下げるために反応を１体積の水で希釈し、高塩洗浄バッファで１回、低塩洗浄バッファで１回洗浄し、次いで、ビーズを約１０～２０ｍｇ／ｍＬで水に再懸濁させた（最初のライゲーション反応あたり６～１２μＬ）。サンプルは４℃で保存してもよく、－２０℃で凍結させてもよく、凍結はビーズに損傷を与える場合があるが、次のＰＣＲ工程に使用することは可能である。

ＰＣＲ
Ｑ５ＤＮＡポリメラーゼ（ＮＥＢ）を使用し、製造者の指示に従って、第２のライゲーション反応からのビーズスラリー生成物のうちの５～１０％を用いて、５０μＬのＰＣＲ反応を行った：０．０２Ｕ／μＬＱ５ＤＮＡポリメラーゼ、１×Ｑ５反応バッファ、０．２ｍＭｄＮＴＰ、０．５μＭＩｌｌｕｍｉｎａインデックスプライマー、及び０．５μＭＩｌｌｕｍｉｎａマルチプレックスプライマー。典型的なＰＣＲサイクルは、９８℃で１０秒間、５５℃で１５秒間、及び７２℃で２０秒間を９サイクル、１２サイクル、及び１５サイクルであり、次いで、最適な条件を選択した。次いで、ＰＣＲ反応物をＤＮＡＣｌｅａｎａｎｄＣｏｎｃｅｎｔｒａｔｅキット（Ｚｙｍｏ）によって処理した。

ＴＢＥ－ＰＡＧＥゲル抽出
脱塩後、ＰＣＲ産物をｄｓＤＮＡサイズマーカーと共に１０％非変性ＴＢＥゲルに流した。所望の産物サイズに応じてレーンをカットし、ピペットチップで潰した後、ｃｒｕｓｈ－ａｎｄ－ｓｏａｋバッファ（５００ｍＭ酢酸ナトリウム、ｐＨ５．０）に再懸濁させた。ゲル断片を一晩抽出し、次いで、エタノール沈殿させた。

オリゴヌクレオチド配列
本明細書に記載の実験に使用したオリゴヌクレオチド配列は、以下の表にみられる。

表１～３は、本発明に係る例示的なヘアピンオリゴヌクレオチドを提供する。配列には、ＩｎｔｅｇｒａｔｅｄＤＮＡＴｅｃｈｎｏｌｏｇｙ，Ｉｎｃ．（ＩＤＴ）からの発注に適合するフォーマットでアノテーションが付けられている。例えば、「／５Ｐｈｏｓ／」は、５’－リン酸を示す。各表の最終行に列挙されている短いオリゴヌクレオチド配列（Ｌ２）は、ＲＮＡ－ｓｅｑ法の第２のライゲーション工程で、表の前の方に列挙されているヘアピンオリゴヌクレオチド配列と一緒に使用されるオリゴヌクレオチドである。各Ｌ２のＵＭＩは「Ｎ」残基によって表され；ＵＭＩは、サンプルの複雑さを最大化するためにｈｅｘＮ（６ヌクレオチド長）である。ＲＮＡ－ｓｅｑにおける特定のオリゴヌクレオチドの使用から得られた本明細書に示されるデータは、図番号によって識別される。

オリゴヌクレオチドは、ペアエンド又はシングルエンドのＤＮＡシーケンシング・バイ・シンセシス法で使用できるように設計される。ペアエンドシーケンシングでは、ＤＮＡ断片の両端からシーケンシングが行われる。最初のプライマーがアニーリングし、成長している鎖に後続の塩基が付加されるごとに決定される。これが、フォワード鎖の「リード１」シーケンシングである。次に、ＵＭＩ配列を含有する別のプライマーがアニーリングし、インデックスを測定する「インデキシングリード（indexing read）」において伸長する。最後に、第３のプライマーがアニーリングし、伸長し、リバース鎖を「リード２」としてシーケンシングする。対照的に、シングルエンドシーケンスでは、リード１及びインデキシングリードのみが行われる。様々なＤＮＡシーケンシング機器及びプラットフォームが市販されている。ＤＮＡシーケンシングを実施するための好ましいシステムは、Ｉｌｌｕｍｉｎａ，Ｉｎｃ．の次世代シーケンシング（ＮＧＳ）システムである。

２種類のヘアピンオリゴヌクレオチドが設計されており、一方は、バーコードが「リード１」シーケンシングの最初に読まれ、他方は、バーコードが「リード２」シーケンシングの最初に読まれる。一般に、バーコードが「リード２」の先頭である設計が好ましいが、その理由は、ランの開始時における「複雑さ」又は測定される配列の多様性を最大化するためである。リード１のシーケンシングのために設計されたヘアピンオリゴヌクレオチドの配列は、／５Ｐｈｏｓ／ｒＡＣＴＸＸＸＸＧＡＴＣＧＴＣＧＧＡＣＴＧＴＡＧＡＡＣＡＴ／ｉＢｉｏｄＴ／ＡＧＡＧＴＴＣＴＡＣＡＧＴＣＣＧＡＣＧＡＴＣＺＺＺＺＡＧｒＵ／３Ｐｈｏｓ／（配列番号１９）（式中、「Ｘ」は、バーコード配列であり（これは少なくとも３ヌクレオチド長であり；本明細書には４ヌクレオチドのバーコードを示す）、「Ｚ」は、「Ｘ」バーコードヌクレオチドの逆相補鎖である配列である）である。リード２シーケンシングのために設計されたヘアピンオリゴヌクレオチドの配列は、／５Ｐｈｏｓ／ｒＡＣＴＸＸＸＸＡＧＡＴＣＧＧＡＡＧＡＧＣＡＣＡＣＧＡＴ／ｉＢｉｏｄＴ／ＡＧＡＣＧＴＧＴＧＣＴＣＴＴＣＣＧＡＴＣＴＺＺＺＺＡＧｒＵ／３Ｐｈｏｓ／（配列番号１５）（式中、「Ｘ」は、バーコード配列であり（これは少なくとも３ヌクレオチド長であり；本明細書には４ヌクレオチドのバーコードを示す）、「Ｚ」は、「Ｘ」バーコードヌクレオチドの逆相補鎖である配列である）である。インデキシングリードに使用した対応するＬ２オリゴヌクレオチドを表１～３の最後の行に示す。バーコードの配列は依然として測定されるので、「リード１」設計は、ペアエンド又はシングルエンドのシーケンシングのいずれにも適合する。この形態では、複雑さに関して特別な注意を払うことができ、これは、複数のバーコードを使用するか又はＩｌｌｕｍｉｎａが推奨するスパイクインコントロール（例えば、Ｐｈｉ－ＸコントロールＤＮＡ）を使用することによって支援することができる。

同じ長さの任意の２つの配列を比較する場合、ハミング距離は、対応する記号が異なる配列位置の数である。バーコードのハミング距離は、バーコードを読み取っている間にシーケンサーでエラーが発生した場合、１つのエラーを識別することができ、正しいバーコードを割り当てることができるように選択される。例えば、ハミング距離が１である場合、１つのエラーで１つのバーコードが別のバーコードに変わってしまい、エラーが決して検出されないことになる。ハミング距離が２である場合、１つのエラーを検出することはできるが、誤ったリードが２つのバーコードから同様に発生する可能性があるので、エラーを容易に補正することはできない。ハミング距離が３である場合、１つのエラーを検出し、補正することができる。ハミング距離が３を超えると、複数のエラーを検出することが可能になるが、シーケンサーのエラーは稀であり、二重エラーは二重に稀であるため、無視できる程度であると予測される。小さなバーコード、例えば３ヌクレオチドの場合、わずか４つの異なるバーコードのみでハミング距離３を維持することが可能である。従って、３ヌクレオチド設計（表２）では、少なくとも２のハミング距離が使用されるので、１２種のバーコードが存在し得る。

表５は、ＲＮＡ－ｓｅｑプロセスの最後のＰＣＲ工程で使用されるオリゴヌクレオチド配列を提供する。これらオリゴヌクレオチドは、ＩｌｌｕｍｉｎａＴｒｕＳｅｑ（商標）ＳｍａｌｌＲＮＡＩｎｄｅｘプライマーを約５塩基超えて伸長する。プライマーは、Ｉｌｌｕｍｉｎａシーケンスプラットフォームに適合するライブラリを作成するために使用される。

３２Ｐ標識
５’末端標識：５’－リン酸化オリゴヌクレオチド（最終濃度１．２５μＭ）の溶液に^３２ＰＴ４ＰＮＫミックス（最終濃度１Ｕ／μＬＴ４ＰＮＫ、３０ｍＭイミダゾール－ＨＣｌバッファ、２．５μＭ［１５μＣｉ／μＬ］γ－^３２ＰＡＴＰ、１ｍＭＡＤＰ）を添加することによって、放射性標識反応を行った。サンプルを３７℃で３０分間インキュベートし；次いで、６５℃で１０分間インキュベートすることによって、Ｔ４ＰＮＫを熱失活させた。

ｄＴＴＰの取り込み：１×ＳｕｐｅｒＳｃｒｉｐｔ（商標）ＩＶＶＩＬＯミックス中のサンプル５μＬを除去し、これに１０μＣｉ／μＬ α－^３２ＰｄＴＴＰを１μＬ添加したことを除いて、ＲＮＡ－ｓｅｑの章に記載した通り逆転写を実施した。インキュベーション後、ゲル電気泳動によって分析する前に、サンプルを１８ｍｇ／ｍＬプロテイナーゼＫ（Ｒｏｃｈｅ）２μＬで処理した。

結果に記載されるＲＮＡ－ｓｅｑライブラリの用途のうちの１つ以上において、以下の方法を使用した。

大腸菌の成長、ストレス、ＲＮＡ抽出
大腸菌ＭＧ１６５５細胞をＡ６００が０．４になるまでＬＢ中で成長させた後、ストレス条件に供した。モック処理した細胞２５ｍＬを１０分間放置して成長させた。過酸化水素ストレスは、最終濃度が０．５％になるように２５ｍＬの細胞に１０分間Ｈ_２Ｏ_２を添加することによって誘導した。グルコースリン酸ストレスは、最終濃度が１ｍＭになるように２５ｍＬの細胞に１０分間α－メチルグルコシド－６－ホスフェート（αＭＧ）を添加することによって誘導した。鉄飢餓ストレスは、最終濃度が２５０μＭになるように２５ｍＬの細胞に１０分間２，２’－ジピリジル（ＤＩＰ）を添加することによって誘導した。２５ｍＬの培養液を１２０００ｒｃｆで１分間遠心分離し、培地をデカントすることによって細胞を収集した。細胞を０．５ｍＬの氷冷溶解バッファ（１５０ｍＭＫＣｌ、２ｍＭＥＤＴＡ、２０ｍＭＨＥＰＥＳｐＨ７．５）に再懸濁させ、次いで、液体窒素中で急速冷凍した。熱酸フェノールプロトコルによってＲＮＡを抽出した。簡潔に説明すると、０．５ｍＬの酸バッファフェノール（ｐＨ４．５クエン酸塩）を凍結サンプルに添加した。５０℃で３０分間振盪しながらヒートブロックでサンプルをインキュベートした。もう１ラウンドのフェノール抽出及び２ラウンドのクロロホルム抽出のために水相を抽出した後、最終的にグリコブルー、３００ｍＭ酢酸ナトリウム、及び３体積のエタノールで沈殿させた。サンプルを－８０℃で１時間インキュベートし、次いで、最高速度（２０ｋＲＣＦ）で４５分間遠心分離してＲＮＡをペレット化した。ペレットを７０％エタノールで２回洗浄し、次いで、水に再懸濁させた。

ＨＥＫ細胞の培養及びＲＮＡ抽出
標準的な条件下において完全ＤＭＥＭ培地でＨＥＫ２９３Ｔ細胞を培養した。簡潔に説明すると、１０％ＦＢＳ及び１％Ｐｅｎ－Ｓｔｒｅｐ（ペニシリン－ストレプトマイシン）を含むＨｙｃｌｏｎｅ（商標）ＤＭＥＭ培地（ＧＥＨｅａｌｔｈｃａｒｅＬｉｆｅＳｃｉｅｎｃｅｓ、ＳＨ３００２２．０１）中で８０％コンフルエントになるまでＨＥＫ２９３Ｔ細胞を成長させ、継代した。細胞が８０～９０％コンフルエントに達した時点で細胞を回収し、ＴＲＩｚｏｌ（商標）（ＴｈｅｒｍｏＦｉｓｈｅｒ、１５５９６０２６）を用いて製造者のプロトコルに従って全ＲＮＡを抽出した。

ＭＣＦ７の成長及びＲＮＡ抽出
１０％ＦＢＳ（ＴｈｅｒｍｏＦｉｓｈｅｒ、１００８２１４７）、０．０１ｍｇ／ｍＬウシインスリン（Ｓｉｇｍａ－Ａｌｄｒｉｃｈ、Ｉ０５１６）、及び１０ｎＭβ－エストラジオール（Ｓｉｇｍａ－Ａｌｄｒｉｃｈ、Ｅ２７５８）を含むＥＭＥＭ培地（ＡＴＣＣ、３０－２００３）で８０％コンフルエントになるまでＭＣＦ７細胞を培養し、１：３の比で継代した。ＴＲＩｚｏｌ（商標）を用いて全ＲＮＡを抽出した。

便及び口腔サンプルの回収並びにＲＮＡ抽出
口腔：女性１名及び男性３名のボランティアから、２日間連続で舌の背側の擦過物を採取した（ボランティア１名につき２サンプル）［Ａ及びＢサンプル］。サンプル採取にはＢｒｅａｔｈＲｘＧｅｎｔｌｅＴｏｎｇｕｅＳｃｒａｐｅｒ（ＰｈｉｌｉｐｓＳｏｎｉｃａｒｅ）を使用し、飲食又は口腔衛生を実施する前に行った。舌のできる限り奥の方から出発して、スクレーパーを３回連続で前方に向かって表面全体を通過させた。擦過物を５００μＬのＲＮＡｌａｔｅｒ（商標）Ｓｔａｂｉｌｉｚａｔｉｏｎ溶液（Ｉｎｖｉｔｒｏｇｅｎ）と合わせ、抽出まで－８０℃で保存した。

消化管：便検体は、女性１名及び男性１名のボランティアによって自己採取された。ボランティアには、市販の「トイレハット型」便検体採取キット（ＦｉｓｈｅｒｂｒａｎｄＣｏｍｍｏｄｅＳｐｅｃｉｍｅｎＣｏｌｌｅｃｔｉｏｎＳｙｓｔｅｍ；ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ）が提供された。検体は直ちに検査室に運ばれ（＜１時間）、十分にホモジナイズされた。滅菌スパチュラを用いて１００ｍｇの便をクライオバイアルに移し、次いで、７００μＬのＲＮＡｌａｔｅｒＳｔａｂｉｌｉｚａｔｉｏｎ溶液を添加した。抽出まで、検体を－８０℃で保存した。

全ＲＮＡ抽出：その後、４℃で１０分間、１７，２００ｒｃｆで遠心分離することによって舌の背側及び便のサンプルからＲＮＡを除去した。ペレット化した材料を、等体積の酢酸飽和フェノールクロロホルムｐＨ４．８を含む４００μＬの０．３ＭＮａＯＡｃ／ＨＯＡｃ、１０ｍＭＥＤＴＡ、ｐＨ４．８中で溶解させた。１：１の比（ビーズ：サンプルの重量）で１．０ｍｍガラス溶解ビーズ（Ｂｉｏ－ＳｐｅｃＰｒｏｄｕｃｔｓ（Ｂａｒｔｌｅｓｖｉｌｌｅ，ＯＫ））を添加した後、最大強度の往復ビーズビーター（Ｍｉｎｉ－Ｂｅａｄｂｅａｔｅｒ－１６、Ｂｉｏ－ＳｐｅｃＰｒｏｄｕｃｔｓ）にサンプルを１分間隔で２回入れた。サンプルを、４℃で１５分間、１７，２００ｒｃｆで遠心分離した後、全ＲＮＡの再抽出及びイソプロパノール沈殿を行った。ペレットを７５％エタノールで洗浄した後、酸緩衝溶出バッファ（１０ｍＭＮａＯＡｃ、１ｍＭＥＤＴＡ、ｐＨ４．８）に再懸濁させた。

ＡｌｋＢ及びＡｌｋＢＤ１３５Ｓの精製
これらプロトコルは、既述のＤＭ－ｔＲＮＡ－ｓｅｑのプロトコル（Ｚｈｅｎｇｅｔａｌ．，ＮａｔｕｒｅＭｅｔｈｏｄｓ１２，８３５，２０１５）を応用した。簡潔に説明すると、ＮＥＢＴ７Ｅｘｐｒｅｓｓｉｏｎ細胞を、３７℃、５０μＭカナマイシンの存在下でＡ６００が０．６～０．８になるまでＬＢ培地で成長させた。細胞が所望の密度に達したら、ＩＰＴＧ及び硫酸鉄をそれぞれ最終濃度が１ｍＭ及び５μＭになるように添加した。誘導後、細胞を３０℃で一晩インキュベートした。細胞を回収し、ペレット化し、次いで、溶解バッファ（１０ｍＭＴｒｉｓ、ｐＨ７．４、５％グリセロール、２ｍＭＣａＣｌ_２、１０ｍＭＭｇＣｌ_２、１０ｍＭ２－メルカプトエタノール）＋３００ｍＭＮａＣｌに再懸濁させた。超音波処理によって細胞を溶解させ、次いで、１７，４００×ｇで２０分間遠心分離した。可溶性タンパク質を、まずＮｉ－ＮＴＡスーパーフローカートリッジ（Ｑｉａｇｅｎ）を用いて、バッファＡ（溶解バッファ＋洗浄用１ＭＮａＣｌ）及びＢ（溶解バッファ＋溶出用１ＭＮａＣｌ及び５００ｍＭイミダゾール）で精製し、次いで、バッファＡ（溶解バッファ＋カラムロード用１００ｍＭＮａＣｌ）及びＢ（溶解バッファ＋溶出用１．５ＭＮａＣｌ）でイオン交換（ＭｏｎｏＳＧＬ、ＧＥＨｅａｌｔｈｃａｒｅ）することによって更に精製した。

ポリ（Ａ）選択
製造者の指示に従って、ＮＥＢＮｅｘｔ（登録商標）Ｐｏｌｙ（Ａ）ｍＲＮＡＭａｇｎｅｔｉｃＩｓｏｌｏａｔｉｏｎＭｏｄｕｌｅ（カタログ番号：Ｅ７４９０Ｓ）を用いて、ＨＥＫｍＲＮＡシーケンシングのためのポリ（Ａ）選択を行った。

ＡｌｋＢ処理条件
脱メチル化酵素バッファ条件は、公開されているもの（Ｌｉｅｔａｌ．，ＮａｔＳｔｒｕｃｔＭｏｌＢｉｏｌ２５，１０４７，ｄｏｉ：１０．１０３８／ｓ４１５９４－０１８－０１４２－５，２０１８）から改変した。反応直前に３種の原液を新たに作製した：２００ｍＭＬ－アスコルビン酸、３ｍＭ２－ケトグルテラート、及び５ｍＭ硫酸アンモニウム鉄。最終反応バッファは、２ｍＭＬ－アスコルビン酸、１ｍＭ２－ケトグルテラート、０．３ｍＭ硫酸アンモニウム鉄、１００ｍＭＫＣｌ、５０ｍＭＭＥＳｐＨ６、５０ｎｇ／μＬＢＳＡ、４μＭ野生型ＡｌｋＢ、及び４μＭＡｌｋＢ－Ｄ１３５Ｓを含有していた。ライゲーション、固定化、及び洗浄後にデカントしたストレプトアビジンビーズスラリー５～２０μＬに反応混合物５０μＬを添加した。３７℃で３０分間反応を継続した。反応後、ビーズを高塩洗浄バッファ（２０ｍＭＴｒｉｓＨＣｌｐＨ７．４、１ＭＮａＣｌ、０．１％Ｔｗｅｅｎ２０）で１回、低塩洗浄バッファ（２０ｍＭＴｒｉｓＨＣｌｐＨ７．４、１００ｍＭＮａＣｌ）で１回洗浄した。

ＣＭＣ処理／ライブラリの構築
ＭＣＦ７全ＲＮＡシーケンシングライブラリを以下の通り構築した。まず、スピンカラム（ＺｙｍｏＲＮＡＣｌｅａｎ＆Ｃｏｎｃｅｎｔｒａｔｏｒ（商標）－５、Ｒ１０１６）を用いて１μｇＭＣＦ７全ＲＮＡから低分子ＲＮＡ（＜２００ｎｔ）を除去し、微量遠心管において１８μＬの滅菌Ｈ_２Ｏで高分子ＲＮＡ（＞２００ｎｔ）を溶出した。ＲＮＡをＰＣＲチューブに移し、２μＬのＭａｇｎｅｓｉｕｍＲＮＡ断片化バッファ（ＮＥＢ、Ｅ６１５０Ｓ）を各チューブに添加し、チューブをサーモサイクラーにおいて９４℃で５分間インキュベートしてＲＮＡを約２００ｎｔに断片化した。次いで、２μＬのＲＮＡ断片化停止溶液を各チューブに添加した。サンプルをＨ２Ｏで５０μＬに希釈し、断片化したＲＮＡをＺｙｍｏスピンカラムを用いて精製し；マイクロ遠心管において１６μＬの滅菌Ｈ_２ＯでＲＮＡを溶出した。ＲＮＡ断片の３’末端修復のため、１０×Ｔ４ＰＮＫバッファ２μＬ及び１０Ｕ／μＬＴ４ＰＮＫ（ＴｈｅｒｍｏＦｉｓｈｅｒ、ＥＫ００３２）２μＬを添加し、混合物を３７℃で３０分間インキュベートした。断片化され、末端修復されたＲＮＡを使用して、以下を改変した上記のＲＮＡ－ｓｅｑプロトコルを用いてシーケンシングライブラリを構築した。断片化したＲＮＡをバーコード付きヘアピンオリゴヌクレオチドにライゲーションし、ストレプトアビジンビーズに結合させた。次いで、サンプルをプールし、混合し、±ＣＭＣ（Ｎ－シクロヘキシル－Ｎ’－（２－モルホリノエチル）カルボジイミド）処理用に２つに分割した（＋ＣＭＣ：－ＣＭＣ＝１．５：１比）。まず１２μＬの滅菌Ｈ２Ｏ及び２４μＬのＴＥＵバッファ（５０ｍＭＴｒｉｓ－ＨＣｌ（ｐＨ８．３）、４ｍＭＥＤＴＡ、７Ｍ尿素）を各チューブに添加し、次いで、新たに調製したＴＥＵバッファ中１ＭＣＭＣ４μＬを＋ＣＭＣサンプルに添加し、滅菌Ｈ_２Ｏ４μＬを－ＣＭＣサンプルに添加した。ＥｐｐｅｎｄｏｒｆＴｈｅｒｍｏＭｉｘｅｒにおいて、３０℃で１６時間、１４００ｒｐｍ（毎分回転数）でサンプルをインキュベートした。サンプルを高塩バッファで２回、低塩バッファで１回洗浄した。次いで、４０μＬの５０ｍＭ炭酸ナトリウム及び２ｍＭＥＤＴＡ（ｐＨ１０．４）バッファでサンプルを再懸濁させ、３７℃で６時間、１４００ｒｐｍでインキュベートした。ビーズを高塩バッファで２回、低塩バッファで１回洗浄し、次いで、ホスファターゼ処理及び逆転写等のＲＮＡ－ｓｅｑ工程に進めた。

ｔＲＮＡマイクロアレイ
ｔＲＮＡマイクロアレイは、ｃＤＮＡ合成を必要としない精製ｔＲＮＡ又は全ＲＮＡから出発する４つのプロセスからなる：（ｉ）脱アシル化、（ｉｉ）全ｔＲＮＡの３’－ＣＣＡへのＴ４ＤＮＡリガーゼによるオリゴヌクレオチドのライゲーションを用いたｔＲＮＡの選択的フルオロフォア標識、（ｉｉｉ）ハイブリダイゼーション、及び（ｉｖ）データ解析。大腸菌及びヒトｔＲＮＡマイクロアレイ法の再現性及び結果の検証については、これまでに広く述べられている（Ｄｉｔｔｍａｒｅｔａｌ．，ＥＭＢＯＲｅｐ６，１５１，２００５；Ｐａｖｏｎ－Ｅｔｅｒｎｏｄｅｔａｌ．，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ３７，７２６８，ｄｏｉ：ｇｋｐ７８７［ｐｉｉ］１０．１０９３／ｎａｒ／ｇｋｐ７８７，２００９）。

リード処理及びマッピング
ＩｌｌｕｍｉｎａＨｉ－Ｓｅｑ又はＮＥＸＴ－ｓｅｑプラットフォームでライブラリをシーケンシングした。ＪＧＩＢＢｔｏｏｌｓツールセットのｂｂｍｅｒｇｅでペアエンドリードを組み合わせた。サンプルバーコードがリードの開始点に配置されるようにリードをマージした：リード２バーコードを用いて構築されたライブラリでは、ｂｂｍｅｒｇｅインプットのためにリード１及びリード２の順序を反対にした。次に、ｆａｓｔＸツールキットバーコードスプリッタを用いて、マージされたリードを各インデックスにつき１ファイルずつバーコードによって分割した。カスタムｐｙｔｈｏｎスクリプト（ＧｉｔＨｕｂで入手可能）を使用して、バーコード配列（最初の７ｎｔ）を除去し、ＵＭＩを使用してリードを崩壊させ、次いで、ＵＭＩ（最後の６塩基）を除去した。次のリードを、ｂｏｗｔｉｅ２を使用して「ｌｏｃａｌ」パラメータでマッピングした。ヒトのサンプルは、４０を超えるスコアを有し、必要に応じて「ＣＣＡ」末端を付加して増強されたｔＲＮＡ－ｓｃａｎＳＥから予測された成熟ｔＲＮＡの精選リスト、又はアンサンブルＨＧ１９ｏｒｆ、ｎｃＲＮＡ、及び精選ｔＲＮＡを組み合わせたゲノムのいずれかにマッピングした。大腸菌サンプルは、＞４０のスコアを有し、必要に応じてＣＣＡが付加されたｔＲＮＡ－ｓｃａｎＳＥからの非冗長ｔＲＮＡの精選リスト、又はアンサンブルＯＲＦ及びｔＲＮＡ遺伝子を含むアンサンブルｎｃＲＮＡを含む複合大腸菌ゲノムのいずれかにマッピングした。Ｂｏｗｔｉｅ２アウトプットｓａｍファイルをｂａｍファイルに変換し、次いで、ｓａｍｔｏｏｌｓでソートした。次に、ＩＧＶを使用して、リードを１ｎｔのウィンドウに崩壊させた。カスタムＰｙｔｈｏｎスクリプト（ＧｉｔＨｕｂで入手可能）を使用して、ＩＧＶｏｕｔｐｕｔ．ｗｉｇファイルを再フォーマットした。また、ｐａｃｈｔｅｒｌａｂのｅＸｐｒｅｓｓでｂｏｗｔｉｅ２アウトプットＳａｍファイルを使用して、各遺伝子にマッピングされた全てのリードを合計した。カスタムＲスクリプト（ＧｉｔＨｕｂ）を用いてデータを可視化した。

リードカウント及びマッピングレートを表６に提供する。

ＣＭＣ反応からのリード処理
ＩｌｌｕｍｉｎａＨｉ－Ｓｅｑｐｌａｔｆｏｒｍから生の１００ｂｐペアエンドシーケンシングリードを入手した。カスタムｐｙｔｈｏｎスクリプトを使用して、ペアになったリード２のリードにバーコード配列でバーコードを付けることによって、リード１のリードを分離した。ｆａｓｔｘ＿ｂａｒｃｏｄｅ＿ｓｐｌｉｔｔｅｒ（ｆａｓｔｘ＿ｔｏｏｌｋｉｔ、ｈｔｔｐ：／／ｈａｎｎｏｎｌａｂ．ｃｓｈｌ．ｅｄｕ／ｆａｓｔｘ＿ｔｏｏｌｋｉｔ／）を用いてバーコードを付けることによって、リード２のリードを分離した。リード１のリードについては、リードの先頭のランダムな６ヌクレオチドの固有の分子識別子（ＵＭＩ）配列及びリードの末尾のバーコード付きアダプター配列を、１５ｎｔカットオフのシングルエンドモードを用いてＴｒｉｍｏｍａｔｉｃを使用して除去した。リード２のリードについては、リードの先頭の７ｎｔのバーコード配列並びにリードの末尾のＵＭＩ及びアダプター配列を、１５ｎｔカットオフのペアエンドモードを用いてＴｒｉｍｏｍａｔｉｃによって除去した。次いで、ｂｏｗｔｉｅ２を用いてリードをヒトｒＲＮＡ転写物にマッピングした。アウトプットｓａｍファイルをｂａｍファイルに変換し、次いで、ｓａｍｔｏｏｌｓを用いてソートし、インデックスを付けた。コマンドラインバージョンの「ｉｇｖｔｏｏｌｓｃｏｕｎｔ」（ＩＧＶ、ｈｔｔｐ：／／ｓｏｆｔｗａｒｅ．ｂｒｏａｄｉｎｓｔｉｔｕｔｅ．ｏｒｇ／ｓｏｆｔｗａｒｅ／ｉｇｖ／ｄｏｗｎｌｏａｄ）を用いて、１塩基の分解能でヌクレオチドの組成、挿入、及び欠失をカウントした。「Ｂｅｄｔｏｏｌｓｇｅｎｏｍｅｃｏｖ」（ｂｅｄｔｏｏｌｓ、ｈｔｔｐｓ：／／ｂｅｄｔｏｏｌｓ．ｒｅａｄｔｈｅｄｏｃｓ．ｉｏ／ｅｎ／ｌａｔｅｓｔ／）を使用して、各位置における全リードの先頭及び末尾をカウントした。全てのアウトプットファイル及び参照配列を各サンプルにつき１つのファイルにまとめ、カスタムｐｙｔｈｏｎスクリプトによって変異率及び停止率を計算した。アウトプットファイルを解析して、標的シュードウリジン部位を同定した。

マイクロバイオームｔＲＮＡ解析
これらは、既刊のパイプラインに大幅な変更を加えたものであった。７５又は１００ヌクレオチドの生のペアエンド配列リードをＩｌｌｕｍｉｎａ－ｕｔｉｌｓ（ｈｔｔｐｓ：／／ｇｉｔｈｕｂ．ｃｏｍ／ｍｅｒｅｎｌａｂ／ｉｌｌｕｍｉｎａ－ｕｔｉｌｓで入手可能）によって処理した。インサートには、７ヌクレオチドのサンプルバーコード及びランダムな６ヌクレオチドの固有の分子識別子（ＵＭＩ）が含まれていた。ｔＲＮＡ分子が７４～９６ヌクレオチド長の範囲であることに鑑みて、フォワード及びリバースの１００ヌクレオチドリードは、一部のｔＲＮＡ配列を完全にカバーしており、他の配列では部分的に重複していた。Ｉｌｌｕｍｉｎａ－ｕｔｉｌｓの「ｉｕ－ｍｅｒｇｅ－ｐａｉｒｓ」コマンドをアップグレードして、完全に重複するリード及び部分的に重複するリードの両方をマージしたが、完全な重複を超える場合は、突出しているアダプター配列をトリミングした（ｆｌａｇ、「－－ｍａｒｋｅｒ－ｇｅｎｅ－ｓｔｒｉｎｇｅｎｔ」は、部分的な重複に加えて完全な重複を検討することを可能にする）。重複領域におけるミスマッチがゼロである一致するリードを保持することによって、修飾によって誘導される変異の解析に重要な誤った塩基コールを最小化した（オプション「－ｍａｘ－ｎｕｍ－ｍｉｓｍａｔｃｈｅｓ０」）。

以下の多くの工程を自動化するためのＳｎａｋｅｍａｋｅワークフローを含む、リードからｔＲＮＡ配列を同定するためのツールをＡｎｖｉ’ｏマルチオミクスプラットフォームにおいて開発した（ｈｔｔｐｓ：／／ｇｉｔｈｕｂ．ｃｏｍ／ｍｅｒｅｎｌａｂ／ａｎｖｉｏで入手可能）。コマンド「ａｎｖｉ－ｇｅｎ－ｔＲＮＡｓｅｑ－ｄａｔａｂａｓｅ」によって、ダイナミックプログラミングアルゴリズム（モジュール「ｔｒｎａｉｄｅｎｔｉｆｉｅｒ」）を実行して、リードにおけるｔＲＮＡの特徴をプロファイリングし、それによって、成熟及び断片的なｔＲＮＡをプレｔＲＮＡ等の他の関連種と共に選択する。この方法における全てのリードは３’－ＣＣＡから始まるので、アクセプターヌクレオチド及びＴアームにおける保存ヌクレオチドまでの正確な長さを含む、ｔＲＮＡ選択のための一連の最低基準を定義した（７つのうちの５つがみつけられるはずである）。アルゴリズムは、リードの５’末端に向かってアンチコドンループを含む特徴を検索し続け、完全長リードは、塩基が対合しているアクセプターステム及び中間に全ての特徴を含有する。このアルゴリズムは、可変（Ｖ）ループ等の可変長であり得る特徴に遭遇したときに、各可能な配列を検索し、標準的には保存されている位置における「保存されていない」ヌクレオチド及びステムにおける塩基対のミスマッチの最小和を有する特徴プロファイルを返す。

ＥｎｓｅｍｂｌＧｅｎｏｍｅｓ２０１６データベースに保存されている４，２３５個の金標準細菌ゲノム（アセンブリレベルが「染色体」である非内部共生体ゲノム）からｔＲＮＡｓｃａｎ－ＳＥ（ｖ１．３．１）によって同定された参照ｔＲＮＡ配列のセットを検索するためにＧＡＳＴツールを用いることによって、ｔＲＮＡ配列に分類学的にアノテーションを付けた。

修飾解析のために、ｔＲＮＡ配列から特定のヌクレオチド位置を選択した。Ａｎｖｉ’ｏによってプロファイリングされた特徴に関して位置を同定した。例えば、多くのｔＲＮＡ種でｍ１Ａ修飾の部位である標準位置２２は、アンチコドンステムの５’－ヌクレオチドである標準位置２７から５ヌクレオチド離れていると同定されている。Ａｎｖｉ’ｏワークフローによって、各分類群における対象となる位置のヌクレオチドの分布を解析し、ｔＲＮＡ種をアンチコドンによってグループ化した。脱メチル化及び未処理の両サンプル分割物において少なくとも５０リードで表されるｔＲＮＡ種を選択した。未処理の分割物からのリードの少なくとも５％における３つの異なるヌクレオチドを含むｔＲＮＡ種のみを考慮することによって、一塩基多型を有する関連ｔＲＮＡ配列等のヌクレオチドバリアントの他のソースから、修飾によって引き起こされた可能性がある変異を分離した。脱メチル化された分割物における変異シグネチャーの有意な減少により、推定上の修飾が確認された（χ^２ｐ値＜０．００１、脱メチル化実験における４ヌクレオチドの実測数を、未処理実験からの分布に鑑みた４ヌクレオチドの予測数と比較するχ^２検定による）。

結果
ＲＮＡ－ｓｅｑプロセス
図２Ｃ～Ｆ及び図３Ａ～Ｇは、ＲＮＡ－ｓｅｑプラットフォームの様々な態様について調べるために実施した実験及びＲＮＡ－ｓｅｑライブラリの調製におけるプラットフォームの使用の結果を表す。実験のインプット材料は、特に断りのない限り、ＨＥＫ２９３Ｔ細胞からの全ＲＮＡであった。図は、反応生成物を分析した電気泳動ゲルの画像を示す。ＤＮＡサイズマーカーを左側に示す。ヒトｔＲＮＡにおけるｍ１Ａ５８及びｍ１Ｇ３７の修飾によって引き起こされる主なＲＴ（逆転写酵素）の停止を右側に示す。ＴｄＴは、ＲＴの異常な末端転移酵素活性に由来する生成物に対応する。

Ｔ４ＲＮＡリガーゼＩによるライゲーションは、ＣＨＯの二重鎖構造に適合し、３’－Ａ又は３’－Ｃの末端を有するＲＮＡ基質間で偏りがないことを示し（図３Ａ）、これは、後述の荷電ｔＲＮＡの測定に必要な特性である。

一部はインプットＲＮＡがライゲーションされており、その他はされていない全てのＣＨＯをストレプトアビジンビーズに結合させた後、任意で酵素処理するために、サンプルを２つに分割してもよい。この場合、一方のサンプルをＡｌｋＢ脱メチル化酵素混合物に曝露してｔＲＮＡのワトソン－クリック面のメチル化を除去し、他方を対照として未処理のままにした。それぞれｔＲＮＡサンプル中のｍ１Ａ５８及びｍ１Ｇ３７のバンドの除去及び減少によって示される通り、オンビーズ酵素反応は高度に効率的であった（図２Ｃ）。

ビーズへの固定化によって、耐熱性Ｓｕｐｅｒｓｃｒｉｐｔ（商標）ＩＶＲＴを用いた逆転写は阻害されなかった（図３Ｂ）。ｃＤＮＡ産物にオンビーズで第２のアダプターをライゲーションした後、ＰＣＲをそのままオンビーズで行って、シーケンシングの準備が整ったオフビーズ産物を作製した（図３Ｃ）。後に３’－ＯＨから逆転写することを可能にするため、アルカリホスファターゼを用いてオンビーズで３’－リン酸を除去した（図３Ｄ）。図３Ｅに示す通り、過ヨウ素酸塩処理により、３’末端にリボースを有するＣＨＯへのライゲーションは阻止されるが、３’末端にデオキシリボースを有する同じオリゴヌクレオチドには影響がないことが確認された。

第１のバーコードライゲーション反応以外は全てオンビーズで実施した。これにより、簡単な洗浄で全ての工程において過剰の試薬を除去することが容易になり、各工程でのサンプル喪失が大幅に減少し、わずか１０ｎｇの全ＲＮＡインプットでＲＮＡ－ｓｅｑライブラリを構築することが可能になった（図２Ｄ）。

また、このＲＮＡ－ｓｅｑプロトコルによって、ヒトの便（図２Ｅ）又はヒトの舌（図２Ｆ）等の複雑なサンプルから単離された全核酸から高品質のＲＮＡ－ｓｅｑライブラリが作製された。これらサンプル中に存在するかなりの量のＤＮＡは、ＤＮａｓｅ処理の追加の有無にかかわらず、ライブラリの構築には干渉しなかった（図２Ｅ）。便サンプルＳ１^＊は、第１のライゲーション工程の前にまずＤＮａｓｅＩで処理したが、Ｓ１及びＳ２は、ＤＮａｓｅ処理を行っていない同じサンプルを使用した。サンプル（＋）過ヨウ素酸塩は、第１のライゲーション工程の前に過ヨウ素酸塩酸化を行い、これによってＲＮＡ－ＣＨＯのライゲーションが阻止された。ＨＥＫ２９３Ｔライブラリではみられたｍ１Ａ５８バンドが便サンプルライブラリにはほとんど存在しないことから、ヒトｔＲＮＡはマイクロバイオームシーケンシングライブラリ中に少量しか存在しないことが示唆された。

ｔＲＮＡ荷電試験の設計目標として、図３Ｆに概略的に示した通り、反応中間体が沈殿せず、精製もされないように、１本のチューブでこれら試薬を逐次添加できるように酸化及びβ脱離のプロトコルを改変した。最終的な混合物を、ＣＨＯライゲーションにおいてそのまま使用した。図３Ｇは、図３Ｆに示した処理の有り（＋，＋）無し（－，－）両方での最終ＰＣＲ産物を示す。

全大腸菌ＲＮＡ
大腸菌の全ＲＮＡの研究におけるＲＮＡ－ｓｅｑの使用を本明細書に示す。当初はｔＲＮＡを想定して設計されたが、ＲＮＡ－ｓｅｑシステムは、原理上他の種類のＲＮＡを検出することもできる。大腸菌の全ＲＮＡからライブラリを構築した。シーケンシングのために、１５～１５０ヌクレオチドのｃＤＮＡインサートについて最終ＰＣＲ産物をサイズ選択した。

図４及び５は、大腸菌の全ＲＮＡのシーケンシングからの幾つかの解析結果を表す。
図４Ａでは、ＲＮＡ－ｓｅｑの結果を大腸菌ゲノムにマッピングした。予想通り、リードの大部分は成熟ｔＲＮＡにアラインされたが（９２％）、残りのリードはｒＲＮＡ、非コードＲＮＡ（ｎｃＲＮＡ）、及びｍＲＮＡにアラインされた。リードのごく一部が非コードＲＮＡにマッピングされる。ストレスの非存在下では、ｎｃＲＮＡのリードは、十分に特性評価されているｆｆｓ（ＳＲＰＲＮＡ）、ｓｓｒＳ（６ＳＲＮＡ）、及びｒｎｐＢ（ＲＮａｓｅＰＲＮＡ）を含む幾つかの豊富なＲＮＡ種に大部分が分配された（図４Ａ）。リードの比率は、各カテゴリーにおける細胞ＲＮＡ転写物のモル比をほぼ反映しており、ｔＲＮＡがモルベースで８０～９０％を構成する。ストレスの非存在下では、ｎｃＲＮＡのリードは、十分に特性評価されているｆｆｓ（ＳＲＰＲＮＡ）、ｓｓｒＳ（６ＳＲＮＡ）、及びｒｎｐＢ（ＲＮａｓｅＰＲＮＡ）を含む幾つかの豊富なＲＮＡ種に大部分が分配された（図４Ａ）。転写物のカバレッジに大きな差があることに鑑みて、生物学的複製からの存在量は、ｔＲＮＡ（ｒ２＞０．９５）、ｒＲＮＡ（ｒ２＞０．８５）、及びｎｃＲＮＡ（ｒ２＞０．７５）についてはよく相関していたが、ｍＲＮＡでは低かった（図４Ｃ）。ｔＲＮＡＡｒｇ及びｔＲＮＡＬｅｕのイソ受容体ファミリーについてマイクロアレイハイブリダイゼーションによって得られたデータと比較することにより、シーケンシングで得られたｔＲＮＡ存在量の測定値の定量性を検証した（図４Ｂ；各対の左側の薄い色のドットがマイクロアレイデータ、各対の右側の濃い色のドットがＲＮＡ－ｓｅｃのデータである）。

ｔＲＮＡは細菌において高度に修飾されているため、ヒトｔＲＮＡにおけるＮ１－メチルアデノシン（ｍ１Ａ）、Ｎ１－メチルグアノシン（ｍ１Ｇ）、及びＮ３－メチルシトシン（ｍ３Ｃ）のワトソン－クリック面のメチル化を効率的に除去するＡｌｋＢ脱メチル化酵素混合物でＲＮＡサンプルをオンビーズ処理した。ｍ１Ａ及びｍ３Ｃは大腸菌のｔＲＮＡには存在しないので、脱メチル化酵素処理はｍ１Ｇ２０を含有する７つの大腸菌ｔＲＮＡにしか影響しない可能性がある。予想通り、ｔＲＮＡの存在量は、ＡｌｋＢ脱メチル化酵素の混合物による処理の有り無し両方でグローバルレベルにおいてよく相関していた（ｒ２＞０．９５）が、ＲＮＡクラスｒＲＮＡ、ｎｃＲＮＡ、及びｍＲＮＡの相関は、生物学的複製と同じ範囲内であった（図４Ｃ）。ｍＲＮＡの相関が低いのは、リード数が少ないことに起因する。

図４Ｄは、個々のｔＲＮＡに沿った変異率のヒートマップを表し、少数の変異率の高い部位が明らかになった。ワトソン－クリック面のＲＮＡ修飾は、ＲＴの読み過ごしによりｃＤＮＡに頻繁に変異シグネチャーを残すことが確立されている。ＲＴは修飾されたヌクレオチドで停止することもある。修飾の化学的性質及びシーケンシングに使用される特定のＲＴに依存して、個々の修飾部位における変異率及び停止率が広く変動する可能性がある。部位のほとんどは、イノシン（Ｉ）、２－チオシトシン（ｓ２Ｃ）、４－チオウリジン（ｓ４Ｕ）、Ｎ１－メチルグアノシン（ｍ１Ｇ）、及び３－（３－アミノ－３－カルボキシプロピル）ウリジン（ａｃｐ３Ｕ）等の既知の修飾に対応する。まず、脱メチル化酵素処理に対して感受性であるｍ１Ｇ修飾を解析した（図５Ｃ～Ｄ）。Ｓｕｐｅｒｓｃｒｉｐｔ（商標）ＩＶＲＴは、時にはｍ１Ｇを読み過ごすが、高い頻度で停止した。脱メチル化酵素処理によりメチル化が除去され、その結果、変異率及び停止率が大幅に低下した。従来法によって調製されたＲＮＡ－ｓｅｑライブラリの解析に用いられたＴＧＩＲＴ（Ｚｈｅｎｇｅｔａｌ．，ＮａｔｕｒｅＭｅｔｈｏｄｓ１２，８３５，２０１５）と比較して、ＳｕｐｅｒＳｃｒｉｐｔ（商標）ＩＶＲＴは、変異率は低いが、ｍ^１Ｇでの停止率が高い。

ワトソン－クリック面の他の大腸菌ｔＲＮＡ修飾としては、８位の４－チオウリジン（ｓ４Ｕ）、３２位の２－チオシトシン（ｓ２Ｃ）、並びにアンチコドンゆらぎ３４位のリジジン、３７位の２－メチルチオ－Ｎ６－イソペンテニルアデノシン（ｍｓ２ｉ６Ａ）、及び４７位の３－（３－アミノ－３－カルボキシプロピル）ウリジン（ａｃｐ３Ｕ）等の嵩高い修飾が挙げられる。これら修飾は、変異率及び停止率に非常に大きな差があった（図４Ｄ及び５Ｃ）。嵩高い３４及び３７の修飾が最も高い停止率を有していた。ａｃｐ３Ｕ及びｍ１Ｇはいずれも同等の変異率を有し、実質的な停止を伴っていた。ｓ４Ｕ及びｓ２Ｃはいずれも全く停止することなく変異によって検出された（図４Ｄ及び５Ｃ）。ｓ４Ｕ８については、異なるｔＲＮＡ間で変異率が大きく変動しており、これは、この生物学的条件下における修飾率の差を反映している可能性がある。ｓ２Ｃ３２修飾では、はるかに高い変異レベルが観察されたが、これは、修飾レベルの高さ及びＳｕｐｅｒｓｃｒｉｐｔ（商標）ＩＶＲＴのイディオシンクラティックな特性の両方を反映している可能性がある。好熱性グループＩＩのイントロン３とは異なるＲＴを用いた以前の研究では、ｓ２Ｃ３２は大腸菌のｔＲＮＡにおいて検出されなかった。

発現レベルが２，０００倍程度ばらついている約５０種の非コードＲＮＡが大腸菌で観察された（図４Ｅ）。ストレスの非存在下では、ＳＲＰＲＮＡ（ｆｆｓ）、ｔｍＲＮＡ（ｓｓｒＡ）、及びＲＮａｓｅＰＲＮＡ（ｒｎｐＢ）等の幾つかの保存された細菌ＲＮＡ種が優勢であったが、大多数は、ストレス応答におけるその予測される役割と一致して、はるかに低いレベルで発現していた。図４Ｅは、ｒｐｍ＞１における非コードＲＮＡ転写物の存在量を表す。このデータは、脱メチル化酵素処理による効果がほんのわずかであることを示す。

この実験及び以下の実験は、ｔＲＮＡ及び低分子非コードＲＮＡの同時解析を示す。ｔＲＮＡのレベルが極めて高いため、低分子ＲＮＡシーケンシングは一般的にｔＲＮＡからＲＮＡをサイズ選択することによって行われていた。全ＲＮＡで出発することによって、このアプローチでは、全てのＲＮＡ種をそれぞれのおおよそのモル比に応じて１つのライブラリに組み込む。

大腸菌のストレス応答
大腸菌を３つの急性ストレス条件に曝すことによる生体応答の研究におけるＲＮＡ－ｓｅｑの用途をここに示す。Ｈ_２Ｏ_２の添加は酸化ストレスに、２，２’－ジピリジル（ＤＩＰ）は鉄飢餓に、α－メチルグルコシド－６－リン酸（ａＭＧ）はグルコース飢餓に対応する。

図５Ａ～Ｇは、３つの急性ストレス条件に曝した大腸菌の全ＲＮＡをシークエンシングした結果を表す。

図５Ａは、１０分間の３つの急性ストレス条件の有り無し両方での、ＬＢで成長させた大腸菌の全ＲＮＡの生物学的複製間のＲＮＡ転写量の相関を示す。存在量の相関は、ｔＲＮＡ、ｒＲＮＡ、及びｎｃＲＮＡではよく一致するが、ｍＲＮＡではカバレッジが非常に低いため一致しない。図５Ｂは、脱メチル化酵素で処理したサンプル及び未処理のサンプルの転写物の存在量間の関係を示す。図５Ｃは、脱メチル化酵素処理の有り無し両方でのライブラリのｔＲＮＡ^Ｐｒｏ（ＧＧＧ）に沿った変異率を示す。未処理のサンプルは、既知のｍ^１Ｇ３７及びｓ^４Ｕ８の修飾に変異ピークを示す。ｍ^１Ｇ３７変異は脱メチル化酵素処理によって阻止されるが、ｓ^４Ｕ８変異は影響を受けない。図５Ｄは、脱メチル化酵素処理の有り無し両方でのｔＲＮＡ^Ｐｒｏ（ＧＧＧ）に沿ったリード密度を示し、ｍ１^Ｇ３７での強力な停止が脱メチル化酵素処理によってほとんど排除されることを実証する。ストレス条件下で成長させた大腸菌についての図５Ａ～Ｄに示す結果は、先に述べたストレスなしの大腸菌の結果に酷似している（図４Ａ～Ｄ）。

ストレスに対する主な細菌の応答は、特定の非コードＲＮＡのアップレギュレーションである。図５Ｅで解析したストレス応答性配列は、ＯｘｙＳ（＋）、酸化ストレスに応答；ｒｈｙＢ（三角）、鉄飢餓に応答；ｓｇｒＳ（四角）、グルコース飢餓に応答；及びｆｆｓ（ＳＲＰ；丸）、非応答性対照配列。図５Ｆは、ストレス中の３つのストレス応答性低分子非コードＲＮＡ及び対照ＲＮＡＳＲＰ（ｆｆｓ）並びに対照としてのストレス無負荷（なし）のカバレッジ密度を表す。各ストレスについて、特定のＲＮＡの発現の劇的な増加が検出された：酸化ストレスではｏｘｙＳが約７５倍増加し、鉄飢餓ではｒｙｈＢが約１０倍増加し、グルコース飢餓ではｓｇｒＳが約６０倍増加した（図５Ｅ～Ｇ）。対照配列であるｆｆｓ（ＳＲＰＲＮＡ）のレベルは、全ての条件下で変化しなかった（図５Ｅ～Ｆ）。

図５Ｇは、脱メチル化酵素処理無しのライブラリから検出された全ての低分子非コードＲＮＡの存在量の倍率変化を表すが、文献と一致して個々のストレスに応答した転写物はごく少数であった。

また、酸化ストレス、鉄飢餓、及びグルコース飢餓という同じストレス条件下で、ｔＲＮＡの存在量、荷電、及び修飾の変化について調べた。これら急性ストレス条件（１０分）下におけるｔＲＮＡ存在量の変化は、１．３倍以内であった。個々のｔＲＮＡに沿って変異率を解析すると、αＭＧ及びＤＩＰのストレスのみの後には８位における広範な高修飾が観察されたが、ＤＩＰストレスのみでは３２位が低修飾となった。

また、セリン及びグリシンのｔＲＮＡを除いてほとんどのｔＲＮＡの荷電レベルの変化は小さく、バルク範囲内であった。３つのストレス条件全てにおいて、ｔＲＮＡ^Ｓｅｒの荷電レベルは最大１．８倍増加し、４つのｔＲＮＡ^Ｓｅｒイソ受容体は全て同じ傾向に追従した。この結果は、ストレス前に使用した培養条件下においてｔＲＮＡ^Ｓｅｒの荷電レベルが低いことが知られていることと一致している。反対に、ｔＲＮＡ^Ｇｌｙのイソ受容体の荷電レベルの変化は、最大１．７倍バルク範囲を下回った。

これら結果は、ｔＲＮＡを介した急性大腸菌ストレス応答は、ｔＲＮＡの存在量の変化よりもｔＲＮＡの荷電を介してより迅速に生じることを示唆している。しかし、ストレスが持続するとｔＲＮＡの存在量の大きな変化が引き継がれる可能性がある。

また、ストレスがｔＲＮＡ修飾にどのように影響を与えるかについても調べた。各ストレスと非ストレス対照との間の比較変異率を用いて高い信頼性で解析することができた４つの修飾のうち、ｍ１Ｇ３７レベルはストレス下でほとんど変化しないが、ａｃｐ３Ｕ４７レベルは３つのストレス条件全てで増加することが判明した。対照的に、ｓ２Ｃ３２及びｓ４Ｕ８レベルの大幅な変化はストレス条件に依存する。Ｓ２Ｃ３２レベルは、鉄飢餓下でのみ低下した。Ｓ４Ｕ８レベルは、鉄飢餓及びグルコース飢餓では増加したが、酸化的ストレスでは増加しなかった。これら変化の正確な役割及び機序は、直ちには明らかにならない。

ＨＥＫ２９３ＴＲＮＡ
ＨＥＫ２９３ＴＲＮＡからヒトの全ＲＮＡの研究におけるＲＮＡ－ｓｅｑの用途をここに示す。

図６及び７は、ヒトの全ＲＮＡのシーケンシングからの幾つかの解析結果を表す。

ヒトの全ＲＮＡを用いてＲＮＡ－ｓｅｑライブラリを構築した（図６Ａ）。予想通り、ほとんどのリードはｔＲＮＡ（９５％）からであり、残りはｎｃＲＮＡ（２．９％）、ｒＲＮＡ（２％）、及びｍＲＮＡ（０．１％）からであった。ｎｃＲＮＡのリードには、ｌｎｃＲＮＡ、ｓｎＲＮＡ、ｓｎｏＲＮＡ等が含まれ、ほとんどがｌｎｃＲＮＡ及びｓｎＲＮＡであった。ｔＲＮＡ^Ａｒｇのイソ受容体ファミリーについてマイクロアレイハイブリダイゼーションによって得られたデータと比較することにより、脱メチル化酵素処理されたライブラリによって得られたｔＲＮＡ存在量の定量性を検証した（図６Ｂ；各対の左側の薄い色のドットがマイクロアレイデータ、各対の右側の濃い色のドットがＲＮＡ－ｓｅｃのデータである）。

ヒトのｔＲＮＡは、多くのｔＲＮＡ種で複数のワトソン－クリック面のメチル化を有する。これらは、５８位におけるｍ１Ａ、３７位におけるｍ１Ｇ、３２位におけるｍ３Ｃ、２６位における２，２－ジメチルグアノシン（ｍ２２Ｇ）、及び９位におけるｍ１Ｇが含まれる。従って、脱メチル化酵素処理は、ｔＲＮＡの存在量の測定値に大きな影響を与える可能性がある。実際、脱メチル化酵素処理の有り無し両方でのシーケンシング結果を比較すると、脱メチル化酵素処理の有り無し両方での生物学的複製の優れた相関（図７Ｂ、ｒ２＞０．９５）にもかかわらず、ｔＲＮＡの全存在量は中程度しか相関していなかった（図７Ａ、ｒ２約０．６８）。この矛盾は、特定のヒトｔＲＮＡへのリードの割り当ての曖昧性が増大したこと及び／又は未処理サンプルにおいて低修飾ｔＲＮＡが過剰に出現することに部分的に起因している可能性がある。

ＲＮＡ－ｓｅｑのシーケンシング結果を既刊のＤＭ－ｔＲＮＡ－ｓｅｑの結果（Ｚｈｅｎｇｅｔａｌ．，ＮａｔｕｒｅＭｅｔｈｏｄｓ１２，８３５，２０１５）と比較すると、良好な相関を示した（図７Ｃ）。本発明のＲＮＡ－ｓｅｑと以前のＤＭ－ｔＲＮＡ－ｓｅｑとの主な違いは、異なるＲＴ酵素の使用、ライブラリ構築に含まれる工程、インプットがＲＮＡ－ｓｅｑでは全ＲＮＡであるのに対してＤＭ－ｔＲＮＡ－ｓｅｑではゲル精製されたｔＲＮＡであることであった。

１０ｎｇ、１００ｎｇ、及び１０００ｎｇの全ＲＮＡで出発するライブラリを構築することによって、ＲＮＡ－ｓｅｑ法のロバスト性を試験した（図２Ｄ及び６Ｃ）。図６Ｃは、１μｇ、１００ｎｇ、又は１０ｎｇの全ＲＮＡで出発したライブラリからのｔＲＮＡ存在量の結果の相関を表す。１０ｎｇの全ＲＮＡインプットでさえも、ｔＲＮＡの存在量はこれらのライブラリ間でｒ２約０．９４と良好に相関していた。

個々のｔＲＮＡに沿った変異率の解析によって広範なｔＲＮＡ修飾の全容が明らかになり、変異率の高い部位が多数明らかになった。変異部位の多くは、５８位におけるＮ１－メチルアデノシン（ｍ１Ａ）、３７位におけるＮ１－メチルグアノシン（ｍ１Ｇ）、３２位におけるＮ３－メチルシトシン（ｍ３Ｃ）、２６位におけるＮ２，２－ジメチルグアノシン（ｍ２２Ｇ）、及び９位におけるｍ１Ｇ／ｍ１Ａ等の既知の修飾に対応していた。ｍ１Ｇ３７を除いて、ワトソン－クリック面における本質的に全てのメチル化によって、ｔＲＮＡ配列全体にわたって高い変異率がもたらされた（図７Ｄ）。

脱メチル化酵素処理後のｔＲＮＡにおける変異率を解析した。予想通り、主な変化は全て、ｍ１Ａ、ｍ１Ｇ、及びｍ３Ｃ等の脱メチル化酵素感受性修飾部位からであった（図７Ｅ参照）。脱メチル化酵素処理により、核にコードされているｔＲＮＡ及びミトコンドリアにコードされているｔＲＮＡの両方において、これら修飾に関連する変異及び停止が消失又は減少したが、多くのｔＲＮＡのゆらぎアンチコドン位置におけるイノシン（Ｉ）修飾は影響を受けなかった。

ｔＲＮＡに加えて、多くの低分子非コードＲＮＡも同定された（図６Ｄ）。その存在量は２，０００倍程度ばらついていた。図６Ｄは、ｒｐｍ＞１０における低分子非コードＲＮＡ転写物の存在量を表す。予想通り、これらの大部分はスプライセオソームＲＮＡ及びｓｎｏＲＮＡであり、それに加えて、図７Ｆに示す幾つかの豊富なマイクロＲＮＡも存在していた。ｔＲＮＡ断片については、ここでは解析していなかったので、このカテゴリーから除外した。

ＲＮＡ－ｓｅｑは、当初低分子ＲＮＡを研究するために設計されたが、原理的にはｍＲＮＡの研究にも使用できる。また、ポリ（Ａ）選択され、次いで、断片化されたＲＮＡをインプットして用いて、シーケンシングライブラリを調製した。この場合、リードのほとんどは、実際ｍＲＮＡ及びポリアデニル化ｎｃＲＮＡにマッピングされ（９７％）、ｔＲＮＡ（２％）及びｒＲＮＡ（０．６％）にはごくわずかしかマッピングされなかった（図７Ｇ）。ｍＲＮＡについては複製がよく相関し（ｒ２＝０．９１）、トランスクリプトームシーケンシングのためのＲＮＡ－ｓｅｑ法の有用性が裏付けられた（図７Ｈ）。

化学的処理によるシュードウリジン（Ψ）サイトマッピング
ＲＮＡの過酷な化学的処理を伴う用途についてのオンビーズプロトコルのロバスト性をここに示す。

図８は、ヒトｒＲＮＡにおけるΨ部位を探索するためのＲＮＡ－ｓｅｑの使用を表す。

ＲＮＡの化学的処理は、ＲＮＡ構造のマッピング又はＲＮＡ修飾の同定等の多くの用途を有する。Ψ部位を同定するための十分に確立されている方法は、Ｎ－シクロヘキシル－Ｎ’－β－（４－メチルモルホリニウム）エチルカルボジイミド（ＣＭＣ）を用いた反応である。Ψは、ＣＭＣ処理したサンプルを未処理対照と比較した際にみられるＲＴの停止及び／又はΨ部位の変異の増加によって検出される

ヒトのｒＲＮＡは、約１００個の既知のΨ部位を有する。それをマッピングするために、全ＲＮＡを化学的に断片化し、３’末端を修復し、次いで、ヘアピンオリゴヌクレオチドにライゲーションした。シーケンシングライブラリの構築において、オンビーズ脱メチル化工程をＣＭＣ反応に置き換えた（図８Ａ）。各ｒＲＮＡの位置に停止率及び変異率を割り当てたところ、生物学的複製間で良好な相関がみられた（ｒ２＞０．９５）（図８Ｂ）。１８Ｓ（図８Ｃ）及び２８Ｓ（図８Ｄ）ｒＲＮＡにおけるΨ部位リッチであることが知られている領域に加えて、完全長１８ＳｒＲＮＡについても調べた（図８Ｅ～Ｆ）。既知のΨ部位は全て、図８Ｃ～Ｆ中にアスタリスクで示されている。既知のΨ部位において、ＣＭＣ処理したサンプルでは停止率及び／又は変異率において強いシグナルが同定され、このアプローチの有用性が検証された。

この例は、ストレプトアビジンビーズが、ｐＨ８～１０で行われる２つの工程及び３０～３７℃で数時間のインキュベーションを伴うＣＭＣ反応等の過酷な化学的処理に耐え得ることを示す。

マイクロバイオームｔＲＮＡシーケンシング
マイクロバイオーム等の複雑なサンプルの研究におけるＲＮＡ－ｓｅｑアプローチの有用性をここに示す。

図９～１２は、ヒトの便及び舌のマイクロバイオーム探索するためのＲＮＡ－ｓｅｑの使用を表す。

ほとんどのマイクロバイオーム特性評価技術は、ＤＮＡの配列を決定するものであり、群のメンバーを決定することはできるが、微生物の活性を求めることはできない。以前の研究によって、マウスの盲腸におけるｔＲＮＡ発現及びｔＲＮＡ修飾を測定するマイクロバイオームｔＲＮＡ－ｓｅｑアプローチ（Ｓｃｈｗａｒｔｚｅｔａｌ．，ＮａｔＣｏｍｍｕｎ９，５３５３，ｄｏｉ：１０．１０３８／ｓ４１４６７－０１８－０７６７５－ｚ，２０１８）が開発されている。しかし、従来の方法には、大量のインプット材料が必要である、及びライブラリの構築前にｔＲＮＡを、構築中にｃＤＮＡ産物をゲル精製する必要があることを含む多くの制約があった。

以前の研究で使用された大腸菌及びヒトの細胞株は、規定の培養から得られたものであり、インプットサンプルの量は事実上無制限であり、各サンプルを単一の参照ゲノムにアラインすることができたのでデータの複雑性が低かった。対照的に、ヒトの便及び舌からのサンプルは、はるかにより複雑である。これらサンプルからのＲＮＡ－ｓｅｑライブラリが良質であることが証明されたので（図２Ｅ～Ｆ参照）、ＲＮＡ－ｓｅｑライブラリをシーケンシングに用い、既に開発されているデノボｔＲＮＡ－ｓｅｑパイプラインを用いてｔＲＮＡの存在量及び修飾についてデータを解析した。便及び舌のサンプルでは、全てのｔＲＮＡ適合性リードの＞９５％が細菌に割り当てられ、これは、この手順がマイクロバイオームの特性評価について高価値の結果をもたらすことを示す。

図９Ａは、ヒトの舌擦過物からの異なる主なＲＮＡクラスへのリードの割り当てを示す。図９Ｂは、様々な細菌の分類学的分類からのＳＲＰＲＮＡと５ＳｒＲＮＡとの相関を示す。値は、ｌｏｇ１０存在量のＺスコアとして計算される。図９Ｃは、Ｂと同様に、細菌の分類学的分類ごとのＳＲＰＲＮＡの存在量と全ての同定されたｔＲＮＡの総和との相関を示す。図９Ｄは、Ｂと同様に細菌の分類学的分類ごとの５ＳｒＲＮＡと全ての同定されたｔＲＮＡの総和との相関を示す。図９Ｅは、プレボテラ・メラニノゲニカ（Ｐｒｅｖｏｔｅｌｌａｍｅｌａｎｉｎｏｇｅｎｉｃａ）のＳＲＰにマッピングされたリードを示し；リードは、遺伝子のアノテーション付き５’末端（上）にマッピングされるが（大文字）、転写物の３’末端（下）は、遺伝子のアノテーションを１～３塩基超えてゲノム配列に入り（小文字）；伸長された３’末端は、ＳＲＰ構造コンテキストと一致している（中央）。図９Ｆは、ロシア・ムシラジノーサ（Ｒｏｔｈｉａｍｕｃｉｌａｇｉｎｏｓａ）のＳＲＰにマッピングされたリードを示し；リードは、遺伝子のアノテーション付き５’末端（上）の２～５塩基下流にマッピングされるが、３’末端（下）は、アノテーション付き末端から４～８ｎｔ短い３’末端を有する個体間の異質性を示す。

図１０Ａは、ｔＲＮＡ、５ＳｒＲＮＡ、ＳＲＰＲＮＡのいずれかを用いて算出した又は１６Ｓアンプリコン遺伝子シーケンシングによって測定した、ヒト舌擦過物からの微生物の分類学的組成を示す。放線菌綱は、１６Ｓアンプリコンシーケンシングによる検出を回避することが知られており、これによりＲＮＡシーケンシング技術と１６ＳＤＮＡシーケンシング技術との間の差異が説明される。図１０Ｂは、ｔＲＮＡ、５ＳｒＲＮＡ、ＳＲＰＲＮＡ、及び１６Ｓアンプリコンシーケンシングによって測定したときの、４名の異なる個体の連続する２日間の舌の微生物存在量の倍率変化を示す。図１０Ｃは、ヒトの便からの異なる主なＲＮＡクラスへのリードの割り当てを示す。図１０Ｄは、ｔＲＮＡ、５ＳｒＲＮＡ、ＳＲＰＲＮＡのいずれかを用いて算出した又は１６Ｓアンプリコン遺伝子シーケンシングによって測定した、２つのヒトの便サンプルからの微生物の分類学的組成を示す。

図１１Ａは、ｔＲＮＡ、５ＳｒＲＮＡ、ＳＲＰＲＮＡのいずれかを用いて算出した又は１６Ｓアンプリコン遺伝子シーケンシングによって測定した、４つの異なるヒト舌擦過物からの微生物の分類学的組成を示す。図１１Ｂは、「ＴＴＴ」又は「ＣＴＴ」のいずれかのアンチコドンを有するｔＲＮＡを用いて算出した、ヒト舌擦過物からの微生物の分類学的組成を示す。

ｔＲＮＡの修飾についても解析した。図１２Ａは、ヒト舌擦過物からのロシア（Ｒｏｔｈｉａ）属の細菌の個々のｔＲＮＡに沿った変異率のヒートマップを示す。図１２Ｂは、Ａと同様にヒートマップを示すが、脱メチル化酵素処理に対して感受性である変異を同定し、この属に豊富に存在するｍ１Ａ５８修飾を同定する。図１２Ｃは、ロシア属からの選択されたｔＲＮＡの３７位及びその周辺の塩基の変異率を示し、ｍ１Ｇ３７を脱メチル化酵素感受性修飾として同定する。図１２Ｄは、脱メチル化酵素処理の有り無し両方での、ヒト舌の幾つかの細菌分類群における選択されたｔＲＮＡの２２位における変異率を示し、これによって修飾ｍ１Ａ２２が同定される。図１２Ｅは、Ｄと同様にヒト舌からの放線菌綱におけるｍ１Ａ５８を同定する。図１２Ｆは、連続する２日間の４つのヒト舌擦過物からの脱メチル化酵素処理無しでの選択された細菌分類ごとの２２位における変異率を示す。図１２Ｇは、２における４つのヒト舌擦過物からの脱メチル化酵素処理無しでの放線菌綱の５８位における変異率を示す。図１２Ｈは、ヒトの便から、Ｄと同様に選択された細菌綱におけるｍ１Ａ２２を同定する。図１２Ｉは、ヒトの便から、Ｅと同様に放線菌綱におけるｍ１Ａ５８を同定する。

ＲＮＡ－ｓｅｑは、一度に多くのサンプルを取り扱う能力、インプットサンプル量の非常に大幅な低減、全てのサイズ選択工程の排除、及びオンビーズ脱メチル化酵素反応を含む幾つかの点でマイクロバイオームｔＲＮＡ－ｓｅｑの用途を改善する。

実施例２
ＳＡＲＳ－ＣｏＶ－２
以下の実施例は、本発明の態様に従って有望なＳＡＲＳ－ＣｏＶ－２バイオマーカーを開発するための、実施例１に一般的に記載され、本明細書に記載のヘアピンオリゴヌクレオチドを使用する、ＲＮＡライブラリ調製のＲＮＡ－ｓｅｑ法の使用を実証する。

図１３は、ＳＡＲＳ－ＣｏＶ－２感染個体の鼻から得られたサンプルで検出されたｔＲＮＡのヒストグラムを表す。

既にＳＡＲＳ－ＣｏＶ－２と診断されている個体から１０個の鼻腔ぬぐい液サンプルを入手した。ＲＮＡ－ｓｅｑ法を適用して、サンプル中のヒト及び微生物のｔＲＮＡを検出した。検出されたｔＲＮＡに基づいて盲検クラスタリング解析を実施し、入院期間によって判定される患者の転帰と比較した。主なクラスターは、重度の症状（入院＞１５日）及び軽度／超軽度の症状（＜３日）によく対応する。

ＳＡＲＳ－ＣｏＶ－２患者及び対照としての健常個体からの鼻咽頭ぬぐい液をシーケンシングして、ＣＯＶＩＤ１９検査に用いられる鼻咽頭ぬぐい液から得ることができるシーケンシングデータの質を判定した。これらサンプルは低バイオマスであり、少量のＲＮＡしか含有していないので、標準的なＵＶ吸光度測定では検出できないことが多い。ｑＰＣＲベースの診断では、サンプルが低バイオマスであることは問題にならないが、ほとんどのＲＮＡシーケンシング技術では障害となる。

ｔＲＮＡの断片化は、全てのサンプルで広範囲に生じた。健常対照（ｎ＝５）、インフルエンザ感染個体（ｎ＝４）、及びＳＡＲＳ－ＣｏＶ－２感染個体（ｎ＝５７）について、ｔＲＮＡに沿った連続領域にマッピングされたリードの割合を示す（図１４Ａ）。ｔＲＮＡの断片化は、患者群ごとに一貫した固有のパターンを示す。断片の切断は、ほとんどがアンチコドン領域で起こる。

特定のｔＲＮＡの断片化により、非感染個体、インフルエンザ感染個体、及びＳＡＲＳ－ＣｏＶ－２感染個体を識別することができる（図１４Ｂ）；ｎｓ、有意ではない、Ｐ値：^＊＜０．０５；^＊＊＜０．０１；^＊＊＊＜１０^－３、^＊＊＊＊＜１０^－４。５．８ＳｒＲＮＡに対して正規化した特定の完全長ｔＲＮＡの存在量の差により、異なるウイルス感染（すなわち、インフルエンザとＳＡＲＳＣｏｖ－２）を区別することができ、更には、軽度（ｎ＝３６）又は重度（ｎ＝２１）の症状へと移行したＳＡＲＳ－ＣｏＶ－２患者を区別することができる（図１４Ｃ）。症状が軽度の患者は、高い比率の断片化したｔＲＮＡを示し、これは、ロバストな自然免疫応答によるＲＮａｓｅの分泌が多いことと一致している。

同じシークエンシングデータで調べた別のパラメータは、ＲＴ変異シグネチャーを通じたＲＮＡ修飾の定量的比較である。特異的なｔＲＮＡ修飾により、健常患者をウイルス感染及びＳＡＲＳ－ＣｏＶ－２感染の症状発現のいずれとも区別することができた（図１４Ｄ）。

この結果は、ＲＮＡ－ｓｅｑ技術が、保存された鼻咽頭ぬぐい液から高品質のｔＲＮＡシーケンシング結果を作成できることを実証する。ヒト鼻咽頭領域におけるｔＲＮＡ断片化プロファイルは、呼吸器ウイルス感染による合併症のリスクが高い患者を特定することによって感染症の転帰を予測するバイオマーカーとなる可能性を有する。

実施例３
結腸直腸がん
以下の実施例は、本発明の態様に従って有望な結腸直腸がん（ＣＲＣ）バイオマーカーの開発のために、実施例１に一般的に記載され、本明細書に記載のヘアピンオリゴヌクレオチドを使用する、ＲＮＡライブラリ調製のＲＮＡ－ｓｅｑ法の使用を示す。

ＣＲＣ患者６名の腫瘍及び隣接組織からのｔＲＮＡをシーケンシングした。この実験では、これらサンプルからｔＲＮＡを試験することの実現可能性について調べ、腫瘍が均質であるかどうか又は患者の人口統計学的データ（すなわち、肥満度、ＢＭＩ）に関連したｔＲＮＡレベルの変動を示すかどうかを判定した。

これらサンプルから得られたＲＮＡデータの大部分は、予想通りｔＲＮＡ（７１％）であった。残りのＲＮＡは、ｒＲＮＡ（７．３％）、ｍｔ＿ｔＲＮＡ（２．７％）、及び他のＲＮＡ（１９％）であった。

高解像度データにより、＞３００個の染色体にコードされているｔＲＮＡ遺伝子（図１５）及び２２個のミトコンドリアにコードされているｔＲＮＡ遺伝子（図１６）について様々な特性を調べることが可能になった。

図１５は、結腸直腸がん（ＣＲＣ）患者６名の腫瘍及び隣接組織におけるｔＲＮＡ－ｓｅｑの存在量、修飾、及び断片化の尺度を表す。発現レベル（図１５Ａ）：ｔＲＮＡの存在量から、患者間の著しい異質性が明らかになった。例えば、アミノ酸アラニンのコドンを読むｔＲＮＡの発現は患者間で比較的一定であり、腫瘍では隣接組織よりも２倍程度高いレベルで発現する（左図）。対照的に、アミノ酸ロイシンのコドンを読むｔＲＮＡは、ＢＭＩ又はｔＲＮＡ^Ａｌａの発現レベルにかかわらず、各患者において異なる発現パターンを示す（右図）。修飾（図１５Ｂ）：ｔＲＮＡ－ｓｅｑによって、シーケンシングライブラリの構築中にヌクレオチドの誤取り込みを生じさせる転写後メチル化修飾が検出された（上図）。メチル化を除去する脱メチル化酵素でサンプルを処理することによって特定の修飾を検証し、それによって、誤取り込みはなくなった（ｍ^１Ａ）が、異なる修飾（Ｉ）は影響を受けなかった（下図）。断片化（図１５Ｃ）：ｔＲＮＡ断片は、様々な細胞条件に応答して細胞ヌクレアーゼによる切断によって生成され、制御性非コードＲＮＡのそれぞれのファミリーに属している。ＲＮＡ－ｓｅｑ解析により、異なる３’末端を有するｔＲＮＡが区別され、ｔＲＮＡ二次構造領域（例えば、Ｄループ、アンチコドンループ、Ｔループ）における切断部位の位置に基づいてグループ化することができる。予想通り、ｔＲＮＡ断片が全ｔＲＮＡリードの１～１０％を占め、アンチコドンループでの切断（３０～３９）が最も一般的である。予想外なことに、Ｔループ（５０～５９）における切断は腫瘍と隣接組織とで著しく異なることから、ｔＲＮＡ断片のプロファイルが有用なバイオマーカーとなり得ることが示唆された。

図１６は、個々の患者におけるミトコンドリアｔＲＮＡの腫瘍発現パターンを表す。ミトコンドリアｔＲＮＡは、患者６名中４名について隣接組織と比べて腫瘍では有意に発現が少なく（図１６Ａ）、これはワールブルク効果及びがんにおけるミトコンドリアの機能不全と一致する所見である。これらサンプルでは、低ＢＭＩ患者からのサンプルと高ＢＭＩ患者からのサンプルとの間に強いパターンの差は存在しなかった。ＴｈｅＣａｎｃｅｒＧｅｎｏｍｅＡｔｌａｓ（ＴＣＧＡ）における数百個のサンプルを含めるように解析を広げたところ、データは、低ＢＭＩ患者の腫瘍では、高ＢＭＩ患者と比較してミトコンドリア遺伝子の発現が有意に低いことを示す（図１６Ｂ）。

また、ＲＮＡ－ｓｅｑ技術では、ｔＲＮＡに加えて微生物からの低分子ＲＮＡも捕捉されるため、微生物の５ＳｒＲＮＡを用いて個々の患者における微生物群の組成を解析することが可能になった（図１７）。患者のうち３名は、高い放線菌門率を示す。３名の患者のうち２名はＣＲＣが再発したことが確認されており、３人目の患者のＣＲＣの状態に変化があるかどうかを確認するために試験を延長している。

また、個々の患者における染色体ｔＲＮＡの結果を用いて、高分解能で塩基修飾及び種間多型を通して種の違いを同定することもできる。最初の解析では、ＣＲＣの再発に関連することが知られている常在性腸内細菌であるフェカリス菌に焦点を当てた。誤取り込みは、ｔＲＮＡの塩基修飾（ｍ１Ａ）又はマイクロバイオームサンプルにおける遺伝的多様性を反映する塩基多様性（ＳＮＰ）に起因する可能性がある。手術前、手術中、及び手術後の患者から採取したサンプルにおけるフェカリス菌のｔＲＮＡ^Ｔｙｒに沿った誤取り込みの結果（図１８Ａ）から幾つかの知見が得られる。まず、７位及び７４位は、誤取り込みの経時的な変化を示す。ｔＲＮＡの構造及び修飾、並びに脱メチル化酵素処理に対する変異の非感受性に関する確立された知識に基づき、これら変化は、手術後のエンテロコッカス（ｅｎｔｅｒｏｃｏｃｃｕｓ）属の近縁種の差分蓄積に起因する遺伝的多様性を表すと特定された（図１８Ｂ）。多様性の減少がみられることは、手術後に種の組成が大きく変化したことを示す。対照的に、２３位における誤取り込みは脱メチル化酵素処理に対して感受性であり、このことは、それがｔＲＮＡ、この場合はＮ１－メチルアデノシンにおける塩基修飾に起因していることを示す（図１８Ｃ）。誤取り込みの割合は手術後に２０％程度増加し、これは、腸内のエンテロコッカス属のこの修飾が治療状態の効果を反映していることを示唆している。

この結果は、ＲＮＡ－ｓｅｑ技術によって可能になった解析により、腫瘍におけるＲＮＡの変動について多くの異なる知見が得られることを実証する。

本明細書に引用した刊行物、特許出願、及び特許を含む全ての参照文献は、各参照文献が個々にかつ具体的に参照によって援用されると示されており、かつその全体が本明細書に記載されているかのように、参照によって本明細書に援用される。

本発明の説明に関連して（特に以下の特許請求の範囲に関連して）用語「ａ」及び「ａｎ」及び「ｔｈｅ」及び「少なくとも１つ」、並びに類似の参照対象の使用は、本明細書において他の指定がない限り又は文脈から明らかに矛盾していない限り、単数形及び複数形の両方を網羅すると解釈されるべきである。１つ以上の項目を列挙した後の用語「少なくとも１つ」の使用（例えば、「Ａ及びＢのうちの少なくとも１つ」）は、本明細書において他の指定がない限り又は文脈から明らかに矛盾していない限り、列挙された項目から選択される１つの項目（Ａ又はＢ）又は列挙された項目のうちの２つ以上の任意の組み合わせ（Ａ及びＢ）を意味すると解釈される。用語「含む（ｃｏｍｐｒｉｓｉｎｇ）」、「有する（ｈａｖｉｎｇ）」、「含む（ｉｎｃｌｕｄｉｎｇ）」、及び「含有する（ｃｏｎｔａｉｎｉｎｇ）」は、特に断らない限り、オープンエンドな用語である（すなわち、「含むがこれらに限定されない」を意味する）と解釈される。本明細書における値の範囲の列挙は、本明細書において他の指定がない限り、単に範囲内の各別個の値を個々に参照する省略法として機能することを意図し、各別個の値は、本明細書に個々に列挙されているかのように明細書に援用される。本明細書に記載される全ての方法は、本明細書において他の指定がない限り又は文脈から明らかに矛盾していない限り、任意の好適な順序で実施することができる。本明細書に提供される任意の及び全ての例又は例示的な表現（例えば、「等」）の使用は、特に主張しない限り、単に本発明をより深く解明することを意図し、本発明の範囲の限定を提起するものではない。明細書中の表現はいずれも、任意の請求されていない要素が本発明の実施に必須であることを示すと解釈されるべきではない。

本発明を実施するための本発明者らに公知の最良の形態を含む本発明の好ましい態様が、本明細書に記載される。好ましい態様の変形は、前述の記載を読んだときに当業者に明らかになり得る。本発明者らは、当業者がこのような変形を適宜使用すると予想し、そして、本発明者らは、本明細書に具体的に記載されているのとは別の方法で本発明が実施されることを意図している。従って、本発明は、準拠法によって認められている通り、本明細書に添付される特許請求の範囲に列挙される発明主題の全ての変形及び等価物を含む。更に、その全ての可能な変形における上記要素の任意の組み合わせは、本明細書において他の指定がない限り又は文脈から明らかに矛盾していない限り、本発明によって包含される。

Claims

３’末端ヌクレオチドを含むヘアピンオリゴヌクレオチドであって、前記３’末端ヌクレオチドの糖成分が２’－ヒドロキシル及び３’－リン酸を含むヘアピンオリゴヌクレオチド。
前記３’末端ヌクレオチドの糖成分がペントースであり、前記ペントースがリボースである、請求項１に記載のヘアピンオリゴヌクレオチド。
３’末端ヌクレオチドを含むヘアピンオリゴヌクレオチドであって、前記３’末端ヌクレオチドの糖位置が糖の２’，３’－ジアルデヒド酸化生成物を含むヘアピンオリゴヌクレオチド。
５’末端リボヌクレオチドを更に含む、請求項１～３のいずれか一項に記載のヘアピンオリゴヌクレオチド。
（ａ）バーコード配列、
（ｂ）ヘアピンのループ内部の親和性部分タグ付きヌクレオチド、及び
（ｃ）プライマー結合部位
を更に含む、請求項１～４のいずれか一項に記載のヘアピンオリゴヌクレオチド。
配列：
５’－Ｐｈｏｓ－ｒＡＣＴ－Ｘ－ＡＧＡＴＣＧＧＡＡＧＡＧＣＡＣＡＣＧＡＴ（配列番号８６）－ＬＴ－ＡＧＡＣＧＴＧＴＧＣＴＣＴＴＣＣＧＡＴＣＴ（配列番号８７）－Ｚ－ＡＧｒＵ－３’－Ｐｈｏｓ、
（式中、Ｘは、少なくとも３ヌクレオチド、４ヌクレオチド、５ヌクレオチド、又は６ヌクレオチドのバーコードであり、ＬＴは、親和性部分タグ付きチミンヌクレオチドであり、Ｚは、バーコード配列の逆相補鎖であるヌクレオチドの配列である）
を含む、請求項５に記載のヘアピンヌクレオチド。
配列：
５’－Ｐｈｏｓ－ｒＡＣＴ－Ｘ－ＧＡＴＣＧＴＣＧＧＡＣＴＧＴＡＧＡＡＣＡＴ（配列番号８８）－ＬＴ－ＡＧＡＧＴＴＣＴＡＣＡＧＴＣＣＧＡＣＧＡＴＣ（配列番号８９）－Ｚ－ＡＧｒＵ－３’－Ｐｈｏｓ
（式中、Ｘは、少なくとも３ヌクレオチド、４ヌクレオチド、５ヌクレオチド、又は６ヌクレオチドのバーコードであり、ＬＴは、親和性部分タグ付きチミンヌクレオチドであり、Ｚは、バーコード配列の逆相補鎖であるヌクレオチドの配列である）
を含む、請求項５に記載のヘアピンヌクレオチド。
固体支持体に固定化された、請求項１～７のいずれか一項に記載のヘアピンオリゴヌクレオチド。
ＲＮＡ配列ライブラリの調製における、請求項１～８のいずれか一項に記載のヘアピンオリゴヌクレオチドの使用。
ＲＮＡ配列ライブラリを調製するマルチプレックス法における、請求項１～８のいずれか一項に記載のヘアピンオリゴヌクレオチドの使用。
バイオマーカーの開発における、請求項１～８のいずれか一項に記載のヘアピンオリゴヌクレオチドの使用。
前記バイオマーカーが、液体生検から開発される、請求項１１に記載の使用。
前記バイオマーカーの開発が、ｔＲＮＡ断片化プロファイルを作成することを含む、請求項１１又は１２に記載の使用。
ウイルス疾患の重症度についてのバイオマーカーの開発における、請求項１～８のいずれか一項に記載のヘアピンオリゴヌクレオチドの使用。
癌についてのバイオマーカーの開発における、請求項１～８のいずれか一項に記載のヘアピンオリゴヌクレオチドの使用。
リガンド部分及びヘアピンオリゴヌクレオチドを含む固体支持体であって、前記オリゴヌクレオチドが、親和性部分及び３’末端ヌクレオチドを含み、前記３’末端ヌクレオチドの糖成分が、２’－ヒドロキシル及び３’－リン酸を含み、
前記ヘアピンオリゴヌクレオチドの前記親和性部分が前記固体支持体の前記リガンド部分に結合することを介して、前記オリゴヌクレオチドが前記固体支持体に固定化される固体支持体。
前記親和性部分がビオチンであり、前記リガンド部分がストレプトアビジンである、請求項１６に記載の固体支持体。
ビーズである、請求項１６又は１７に記載の固体支持体。
前記オリゴヌクレオチドが、
（ａ）リボヌクレオチドとしての５’末端ヌクレオチド、
（ｂ）バーコード配列、
（ｃ）ヘアピンのループ内部の親和性部分でタグ付けされたヌクレオチド、及び
（ｄ）プライマー結合部位
を更に含む、請求項１６～１８のいずれか一項に記載の固体支持体。
ＲＮＡ配列ライブラリの調製における、請求項１６～１９のいずれか一項に記載の固体支持体の使用。
ＲＮＡ配列ライブラリを調製するマルチプレックス法における、請求項１６～１９のいずれか一項に記載の固体支持体の使用。
（ａ）ＲＮＡ配列をヘアピンオリゴヌクレオチドにライゲーションしてコンストラクトを形成することであって、前記オリゴヌクレオチドが３’末端ヌクレオチドを含み、前記３’末端ヌクレオチドの糖成分が２’－ヒドロキシル及び３’－リン酸を含むことと、
（ｂ）前記ＲＮＡ配列をｃＤＮＡ配列として逆転写することと、
（ｃ）ＰＣＲを用いて前記ｃＤＮＡ配列を増幅させることと、
を含むＲＮＡ配列ライブラリを調製する方法。
前記ヘアピンオリゴヌクレオチドが、
（ｉ）リボヌクレオチドとしての５’末端ヌクレオチド、
（ｉｉ）バーコード配列、
（ｉｉｉ）ヘアピンのループ内部の親和性部分タグ付きヌクレオチド、及び
（ｉｖ）プライマー結合部位
を更に含む、請求項２２に記載の方法。
ライゲーション後に３’－リン酸を脱リン酸化し、逆転写後に２’，３’－ジオールを含む３’末端ヌクレオチドを過ヨウ素酸塩で酸化することを更に含む、請求項２２又は２３に記載の方法。
ライゲーション後かつ脱リン酸化前に、ＲＮＡ配列のヌクレオチドにおけるワトソン－クリック面のメチル化を脱メチル化することを更に含む、請求項２４に記載の方法。
逆転写後にＲＮＡ配列を消化し、増幅前に第２のプライマー結合部位を付加するために第２のライゲーションを行うことを更に含む、請求項２２～２５のいずれか一項に記載の方法。
ライゲーション後に前記コンストラクトを固体支持体に固定化することを更に含む、請求項２２又は２３に記載の方法。
固定化後に３’－リン酸を脱リン酸化し、逆転写後に２’，３’－ジオールを含む３’末端ヌクレオチドを過ヨウ素酸塩で酸化することを更に含む、請求項２７に記載の方法。
固定化後かつ脱リン酸化前に、ＲＮＡ配列のヌクレオチドにおけるワトソン－クリック面のメチル化を脱メチル化することを更に含む、請求項２８に記載の方法。
逆転写後にＲＮＡ配列を消化し、増幅前に第２のプライマー結合部位を付加するために第２のライゲーションを行うことを更に含む、請求項２７～２９のいずれか一項に記載の方法。
前記ＲＮＡ配列が、全ＲＮＡ、低分子ＲＮＡ、ｔＲＮＡ、マイクロＲＮＡ、ｐｉＲＮＡ、又はそれらの任意の組み合わせを含む、請求項２２～３０のいずれか一項に記載の方法。
マルチプレックス法を含む、請求項２２～３１のいずれか一項に記載の方法。