JP2023551072A

JP2023551072A - Ｒｎａおよびｄｎａ修飾の多重プロファイリング

Info

Publication number: JP2023551072A
Application number: JP2023555121A
Authority: JP
Inventors: シュテンゲル，グドルン; ファン－フー，ユー－シエン; サントス，ジェローム; パース，バイロン
Original assignee: Alida Biosciences Inc
Current assignee: Alida Biosciences Inc
Priority date: 2020-11-25
Filing date: 2021-11-24
Publication date: 2023-12-06
Also published as: US20240110222A1; CA3199189A1; AU2021385367A1; WO2022115608A1; WO2022115608A9; US20220298542A1; EP4251760A1; AU2021385367A9; US20220298543A1; US11773425B2

Abstract

本発明は、トランスクリプトームおよびゲノムにわたるＲＮＡおよびＤＮＡ修飾の多重プロファイリングのための組成物および方法を提供する。本方法は、標的核酸の非古典的特徴（例えば、塩基修飾、骨格修飾、損傷および／または構造的要素）の分子認識、およびこの認識事象からの情報をバーコードを用いて標的核酸の隣接遺伝子配列に書き込む工程を組み合わせる。得られたバーコード化核酸は、次に配列決定ライブラリーに変換され、ＤＮＡ／ＲＮＡ配列決定法によって読み取られる。この工程により、バーコードの配列が明らかになり、標的核酸中の非古典的特徴と相関する。本明細書に記載のハイスループット・プロファイリング法は、標的核酸中の１以上の修飾の局在化を可能にする。この方法はまた、複数またはすべてのＤＮＡ／ＲＮＡ修飾の性質および位置を並行して同定することを可能にする。【選択図】図４Ａ

Description

関連出願の相互参照
本出願は、２０２１年５月２６日に出願された米国仮特許出願第６３／１９３，４０２号および２０２０年１１月２５日に出願された米国仮特許出願第６３／１１８，４０９号に対して優先権の利益を主張するものであり、これらの各出願は、あらゆる目的のために、引用によりその全体が本明細書に組み込まれる。

技術分野
本開示は、一般に、ＲＮＡおよびＤＮＡを含む核酸の構造または非古典的特徴に対するエピトランスクリプトーム、エピジェネティック、その他の修飾の同定および解析に関する。

連邦政府資金援助条項
本発明は、米国国立ヒトゲノム研究所から授与された助成金番号1R43HG012170-01による米国政府の支援を受けて行われた。米国政府は発明に対して一定の権利を有する。

配列一覧
本出願には、ＡＳＣＩＩフォーマットで電子的に提出された配列表リストが含まれており、引用によりその全体が本明細書中に包含される。２０２１年１１月２４日に作成された当該ＡＳＣＩＩコピーは、ALID_001_02WO_SeqList_ST25.txtと名付けられ、サイズは４０キロバイトである。

背景
ヌクレオチドの化学変化を含むエピジェネティックな変化は広範囲に及び、遺伝子発現、遺伝子サイレンシング、ＤＮＡ損傷への応答などの生物学的プロセスにおいて重要な役割を果たしている。同様に、エピトランスクリプトーム修飾として知られるＲＮＡの化学修飾は、転写中あるいは転写後に細胞内で頻繁に起こる。

ほとんどすべてのタイプの癌、認知機能障害、呼吸器系、循環器系、生殖器系、自己免疫系、神経行動系の病気など、多様な疾患、行動、その他の健康指標が、ＤＮＡのエピジェネティックな変化と相関している。しかし、ゲノム全体におけるエピジェネティックな変化の分布、特に健康および疾患との関連については、ほとんど知られていない。エピトランスクリプトーム修飾の機能はいくつか知られているが、細胞内ＲＮＡ全体におけるこれらの修飾位置を特定し定量化する分析法がないため、多くは知られていない。現在のところ、エピトランススクリプトームＲＮＡ修飾の相関レベルおよびそれらの細胞内での変化についてはほとんど何もわかっていない。

化学的誘導体化法、分子認識法（通常、濃縮および検出の両方に抗体を使用）、逆転写による塩基配列決定法を組み合わせることで、限られた数のＤＮＡおよびＲＮＡの修飾に対するプロファイリング法が提供されていた。しかし、これらの方法は感度が高くなく、核酸の分解／フラグメント化を引き起こし、一塩基分解能で修飾の位置を同定できないことが多い。さらに、これらの方法は多重化には適していない。一般的なエピトランスクリプトームＲＮＡ修飾の塩基配列を決定する既存の方法は、検出された修飾の数（一桁以上異なる）および修飾位置の両方において、しばしば相反する所見を与える。

従って、ＤＮＡおよびＲＮＡの修飾を同定、分析、定量、位置特定するための改良された組成物および方法が当技術分野で必要とされている。このような進歩は、健康および疾患における生物学の重要な制御メカニズムの発見、ならびに医学における新たな治療パラダイムの開発に道を開き得る。

概要
本発明は、ＲＮＡおよびＤＮＡを含む核酸の構造に対するエピトランスクリプトーム、エピジェネティック、その他の化学的修飾を同定および分析するための組成物および方法を提供する。本発明は、潜在的に無制限の数のＤＮＡおよび／またはＲＮＡ修飾を一分子レベルで同時にプロファイリングするための、高度に並列化された、高感度、高精度、高スループットの方法を提供する。

いくつかの態様において、本発明は、結合ドメインおよびアダプターを含む核酸結合分子を提供し、ここで、結合ドメインは、ＤＮＡまたはＲＮＡの非古典的特徴に特異的に結合し、かつアダプターは、結合ドメインによって特異的に結合される非古典的特徴に特異的な核酸バーコード配列を含む。

いくつかの態様において、本発明は、核酸結合分子を作製する方法を提供し、この方法は、アダプターを結合ドメインに結合させて、アダプター－結合ドメインコンジュゲートを形成することを含む。

いくつかの態様において、本発明は、複数の標的核酸を分析するための方法を提供し、該方法は、標的核酸を、本明細書に記載の核酸結合分子と接触させる工程；（ｉ）バーコード化核酸のオフターゲット生成を実質的に阻止する環境下で、核酸バーコードを標的核酸にトランスファーしてバーコード化標的核酸を生成する工程、または（ｉｉ）標的核酸のバーコード化コピーを生成する工程のいずれか；非古典的特徴の位置がバーコード化標的核酸またはバーコード化標的核酸コピーの一次核酸配列に基づいて同定可能であるように、バーコード化標的核酸またはバーコード化標的核酸コピーを改変する工程；ならびに、バーコード化標的核酸の塩基配列を決定する工程、を含む。

いくつかの態様において、本発明は、複数の標的核酸中の２以上の非古典的特徴を検出および／または定量するための方法を提供し、該方法は、標的核酸を少なくとも２つの核酸結合分子と接触させる工程であって、各核酸結合分子が結合ドメインおよびアダプターを含み、各核酸結合分子の結合ドメインが、ＤＮＡまたはＲＮＡの異なる非古典的特徴に結合し、アダプターが、各結合ドメインによって特異的に結合される非古典的特徴に特異的な核酸バーコード配列を含む工程；（ｉ）バーコード化核酸のオフターゲット生成を実質的に阻止する環境下で、バーコード化標的核酸を生成するために、核酸バーコードを標的核酸にトランスファーする、または（ｉｉ）標的核酸のバーコード化コピーを生成する工程；非古典的特徴の位置がバーコード化標的核酸またはバーコード化標的核酸コピーの一次核酸配列に基づいて同定できるように、バーコード化標的核酸またはバーコード化標的核酸コピーを改変する工程のいずれか；ならびに、バーコード化標的核酸の塩基配列を決定する工程、を含む。

いくつかの態様において、本発明は、標的核酸中の非古典的特徴を検出するための方法を提供し、該方法は、標的核酸を、本明細書に記載の核酸結合分子と接触させる工程；バーコード化核酸のオフターゲット生成を実質的に阻止する環境下で、（ｉ）核酸バーコードを標的核酸にトランスファーしてバーコード化標的核酸を生成する工程、または（ｉｉ）標的核酸のバーコード化コピーを生成する工程のいずれか；ならびに、標的核酸またはそのコピー中のバーコードの存在を検出する工程、を含む。

いくつかの態様において、本開示は、標的核酸中の非古典的特徴の位置を一塩基分解能で決定するための方法を提供し、該方法は以下の工程を含む：標的核酸を、本明細書に記載の核酸結合分子に接触させる工程；（ｉ）バーコード化核酸のオフターゲット生成を実質的に防止する環境下で、核酸バーコードを標的核酸に転写してバーコード化標的核酸を生成する工程、または（ｉｉ）標的核酸のバーコード化コピーを生成する工程のいずれか；ならびに、標的核酸またはそのコピー中のバーコードの存在を検出する工程；ここで、核酸結合分子は、以下の１以上が可能な結合ドメインを含む：標的核酸に変異を誘導すること、またはポリメラーゼバイパスを防止することにより、標的核酸のコピー間に切断を引き起こすこと。

いくつかの態様において、本発明は、塩基編集酵素を含む核酸結合分子を提供し、ここで塩基編集酵素はデアミナーゼである。

また本明細書では、標的核酸に結合した核酸結合分子を含む複合体も提供する。

また、本明細書で提供されるのは、本明細書に記載の核酸結合分子に結合した基質である。

また、本明細書には、本明細書に記載の核酸結合分子に結合したポリマーも提供される。

本発明のこれらの面および他の面は、以下の詳細な説明、特許請求の範囲、態様、方法、化合物、および／または組成物、ならびに関連する背景情報および参考文献を参照することにより明らかとなり得る。

図１Ａ－１Ｄは、本明細書に記載の種々の分子の機能要素を示す概略図である。図１Ａは二本鎖核酸および塩基修飾（すなわち非古典的特徴）を示す。図１Ｂは塩基修飾された一本鎖核酸を示す。図１Ｃは、構造的要素（すなわち非古典的特徴）を有する一本鎖核酸を示す。図１Ｄは、アダプター（例えば、バーコード配列を含む、またはバーコード配列からなるアダプター）に結合した結合ドメインを示す。図１Ｅ－１Ｇは、標的核酸に結合した本明細書に記載の異なる核酸結合分子を含む複合体を示す概略図である。図１Ｅは、二本鎖バーコードを含む核酸結合分子および修飾を有する二本鎖核酸との結合を示す。図１Ｆは、一本鎖バーコードを含む核酸結合分子と、修飾を有する一本鎖核酸との結合を示す。図１Ｇは、非古典的構造的要素を有する一本鎖核酸への構造特異的核酸結合分子の結合を示す。図２Ａ－２Ｇは、種々のＤＮＡアダプターの構造を示す概略図である。図２Ａは、ＵＦＰまたはＵＲＰの何れかを含むアダプターを示す。図２Ｂは、環化によるライブラリー調製に用い得るアダプターを示す。図２Ｃは、ライゲーションによるバーコードトランスファーに用い得るアダプターを示す。図２Ｄは、プライマー伸長による単一または複数のバーコードトランスファーに用い得るアダプターを示す。図２Ｅは、ランダムフィートまたは標的化フィート、ならびに内部プライミングおよびロングリード構築のためのステム領域を含むアダプターを示す。図２Ｆは、内部プライミングおよびショートリードの構築に用い得るアダプターを示す。図２Ｇは、プライマー伸長およびＤＮＡアドレスへのハイブリダイゼーションを介した結合ドメインへのＤＮＡ編集酵素の標的化によって、バーコード化に用い得るアダプターを示す。凡例に示すように、“ＵＦＰ”はユニバーサルフォワードプライマーの略称であり、“ＵＲＰ”はユニバーサルリバースプライマーの略称であり、“ＭＢＣ”は修飾エンコードバーコードの略称であり、“ＵＭＩ”はユニーク分子識別子の略称であり、“ＣＬＳ”は切断部位の略称である。“ＳＰ”はスペーサーの略である。図３Ａ－３Ｅは、一本鎖ライゲーション（図３Ａ）、スプリントライゲーション（図３Ｂ）、プライマーまたはスプリント伸長（図３Ｃ）、テンプレート伸長（図３Ｄ）、二本鎖ライゲーション（図３Ｅ）を含む、異なるアダプター導入スキームを示す概略図である。図４Ａ－４Ｄは、認識エレメントの表面固定化（図４Ａ）、ポリＡテイルを介したＲＮＡ捕捉（図４Ｂ）、ハイブリダイゼーションプローブを介したＤＮＡまたはＲＮＡ捕捉（図４Ｃ）、および核酸標的の直接的な表面結合（図４Ｄ）を含む、複合体内アダプタートランスファーのための異なるフォーマットを示す概略図である。図５Ａ－５Ｃは、ビーズ上の複合体内アダプタートランスファーの異なるフォーマットおよび関連するビーズプールの組成を示す概略図である。ビーズは、単一のタイプの核酸結合分子（図５Ａ）で装飾（decorate）されていてもよいし、複数のタイプの核酸結合分子（図５Ｂ）で装飾されていてもよい。あるいは、ビーズはハイブリダイゼーションによってＲＮＡ分子を捕捉するためのオリゴヌクレオチドを提示することもできる（図５Ｃ）。図６Ａ－６Ｄは、核酸修飾酵素（この例ではデアミナーゼ）を核酸修飾部位に標的化するための異なる構造（architectures）を示す概略図である。このアプローチには、一次抗体に結合する二次抗体にデアミナーゼを結合させること（図６Ａ）、核酸結合ドメインに結合した相補的オリゴヌクレオチド（ＤＮＡアドレス）にハイブリダイズするオリゴヌクレオチドにデアミナーゼを結合させること（図６Ｂ）、核酸結合ドメインに結合したペプチドＳｐｙＴａｇと共有結合を自発的に形成するＳｐｙＣａｔｃｈｅｒタンパク質にデアミナーゼを遺伝子的に融合させること（図６Ｃ）などが含まれる。あるいは、デアミナーゼは一次抗体に結合するプロテインＧに結合させることもできる（図６Ｄ）。ヌクレオチド配列は、例示的なバーコード部位として提供される（配列番号５２－５４）。

図７は、ＲＮＡ修飾の化学量論および存在量の測定を目的とした、修飾解析を伴う例示的なＲＮＡｓｅｑワークフローを示す概略図である。図８は、バーコードライゲーションおよびｃＤＮＡ切断によるＲＮＡプロファイリングの例示的な方法を示す概略図である。ｃＤＮＡ切断後、サンプルをＰＣＲで増幅し、配列決定のために準備する。図９は、バーコードライゲーションおよびシトシンデアミナーゼによる塩基編集によるＤＮＡプロファイリングの例示的な方法を示す概略図である。図１０は、アデノシンデアミナーゼによる塩基編集およびサンプル分割によるＲＮＡプロファイリングの例示的な方法を示す概略図である。図１１は、二次抗体－アデノシンデアミナーゼ結合体を用いたバーコードライゲーションおよび塩基編集によるＲＮＡプロファイリングの例示的な方法を示す概略図であり、鎖情報を保存している。図１２は、ＲＮＡプロファイリングのための例示的な方法を示す概略図であり、ここで標的ＲＮＡフラグメントは２以上の修飾を含む。ｃＤＮＡを溶出した後、サンプルをＰＣＲ増幅し、分析用に準備する。図１３は、複数のＲＮＡ修飾の周期的プロファイリングのための例示的な方法を示す概略図である。図示した工程を実施した後、得られたＤＮＡ構築物を逆転写し、ライブラリー調製に用い得る。図１４Ａは、プライマー伸長および塩基編集によるバーコード化を組み合わせた、周期的プロファイリングのための例示的な方法を示す概略図である。図１４Ｂはまた、異なるＤＮＡアドレス（アドレス１、アドレス１’、アドレス２、アドレス２’）によって指示される差動塩基編集を使用する、周期的プロファイリングのための例示的な方法を示す。図１５Ａ－１５Ｄは、タグメンテーション（Tagmentation）によるＲＮＡプロファイリングの例示的な方法を示す一連の概略図である。図１６は、ロングリード構築によるＲＮＡプロファイリングの例示的な方法を示す概略図である。図１７Ａは、ナノ抗体のサイズと、二次抗体に結合した一次抗体のサイズを比較した概略図である。図１７Ｂはナノボディの三次元構造を示す。ＤＮＡアダプター、デアミナーゼ、表面のカップリング部位を図中に示す。図１７Ｃは、アダプターの部位特異的カップリング（すなわち、ＤＮＡバーコード標識）および抗体の基質表面への固定化のための例示的な方法を示す。図１８Ａ－１８Ｂは、モデルシステムにおいてバーコードのクロストークを測定するための例示的な方法を示す概略図である。図１９は、ＥＬＩＳＡによって得られた、いくつかの例示的なＲＮＡ修飾特異的抗体およびその標的の結合曲線である。ビオチン化ＲＮＡ標的をストレプトアビジンプレートに高密度に固定化し、抗体を様々な濃度で結合させる。結合曲線は解離定数（Ｋ_Ｄ）を導き出すために１：１結合モデルで適合させる。ＲＮＡ標的は、一本鎖ＲＮＡ（ｓｓ－ＲＮＡ）か、縮重配列に挟まれた１つの修飾を含む二本鎖ＲＮＡ／ＤＮＡヘテロ二本鎖（ｄｓＲＮＡ／ＤＮＡ）である。変性していない配列を陰性対照として用いる（変性なし）。Ａｂ０１からＡｂ１９は抗体ＩＤであり、抗体源は実施例１に示されている。抗体はＲＮＡ標的に高い親和性および特異性で結合する。

図２０Ａおよび図２０Ｂは、核酸結合分子を生成するための実験データを示す。ＲＮＡ修飾特異的抗体をＨｙＮｉｃ（ヒドラジノニコチンアミド）化合物を用いてＤＮＡアダプターで無作為に標識する。図２０Ａでは、例示的な抗体を、抗体に対して１０～５０倍モル過剰のＨｙＮｉｃで標識する。非還元ＳＤＳゲル電気泳動による分析では、関連する標識化学量論が示された。図２０Ｂは２０倍過剰のＨｙＮｉｃで同じＤＮＡアダプターでいくつかのＲＮＡ修飾特異的抗体を標識した結果を示す。得られた標識化学量は抗体のアイソタイプによって変化した。図２１Ａ－２１Ｅは、異なる抗体標識法および標識化学量論の機能的影響を示す。図２１Ａ－２１ＣはＨｙＮｉｃ化合物で抗体を無作為に標識する前または後のＥＬＩＳＡ結合曲線を示す。核酸結合分子の親和性は、非標識抗体に比べて１０－１５倍低下する。図２１Ｄ－２１ＥはランダムＨｙＮｉｃ化合物あるいは部位選択的糖鎖化学による抗ｍ６Ａ抗体の標識化を比較している。図２１Ｄは核酸結合分子のＳＤＳゲルを示し、抗体への１または２アダプターの付着を示す。図２１ＥはＥＬＩＳＡで測定した糖鎖標識による結合活性の保持を示す。図２２は、異なる抗体による修飾または非修飾（Ｎ３０）ＲＮＡ標的のプルダウンに関する実験データである。この実験では、抗体をプロテインＧビーズに固定化し、４種類のＲＮＡ標的の混合物と共にインキュベートする。各抗体はそれぞれの標的を好み、特異性はＮ３０対照に対して３から４４の範囲である。特異性は配列に依存する。図２３Ａ－２３Ｄは、３’末端にユニバーサル配列を付加することによるプライマー伸長によって、バーコーディング用のＲＮＡライブラリーを調製するための実験的アプローチを示す。図２３Ａは、ホモポリマーテイリングまたはライゲーションによって、既知の配列のスペーサー（例えば、配列番号５５）を導入する方法の概要を提供する。図２３Ｂ－２３ＣはＲＮＡ標的の酵素的Ａ－テイリングに関する実験結果を提供する。図２３Ｂは、ポリｄＴ競合体オリゴヌクレオチド（（ｄＴ）_２０）を反応に加えることによって、Ａ－テイルのサイズを調節するというコンセプトを示す。ポリｄＴ競合体がない場合、Ａ－テイルは１００～２００ｂの間で幅広いサイズ分布を有する。ポリｄＴ競合体では、Ａ－テイルの長さは約２５ｂである。図２３Ｃは、異なる温度、異なる長さのポリｄＴ競合体（（ｄＴ）_１０＝１０ｂ、（ｄＴ）_２０＝２０ｂ、（ｄＴ）_３０＝３０ｂ）でのＡ－テイリングの実験結果を示す。図２３Ｄは、一本鎖ライゲーションによってＲＮＡの３’末端にユニバーサル配列を付加するデータを示す。３０ｂの縮重ＲＮＡライブラリーを１０ｂ、２０ｂ、３０ｂ、５０ｂのユニバーサル配列にライゲーションする。ライゲーション産物の形成を時間関数としてプロットすると、中間の長さのユニバーサル配列（２０および３０ｂ）の方が反応速度が速いことがわかる。図２３Ｅ－２３Ｆは、核酸結合分子の不存在下でのプライマー伸長によるバーコーディングの実験例を示す。スペーサーの長さ（ユニバーサル配列）、標的核酸の二次構造、反応条件がバーコードの完全性に影響かどうかを試験する。図２３Ｅは、８ｂ（ａｄａｐｉｄ－ＳＰ８）、１０ｂ（ａｄａｐｉｄ－ＳＰ１０）、または１２ｂ（ａｄａｐｉｄ－ＳＰ１２）のスペーサーを有するＤＮＡアダプターを用いたバーコーディング収率を比較する。５０ｂのＲＮＡ標的（長いＲＮＡ）ではスペーサーの長さに関係なくバーコーディング収率は低いが、５０ｂのＤＮＡ標的および１５ｂのＲＮＡ標的は８ｂのスペーサー（ａｄａｐｔ－ＳＰ８）で容易に伸長する。この発見は、バーコーディングの収量は標的スペーサーのアクセス性によって変わり、長いＲＮＡに一般的な安定した二次構造がアクセスを妨げる可能性があることを示唆している。スペーサーの長さを８ｂから１２ｂに増やしても、分子内二次構造と競合するには十分ではない。図２３Ｆは、より高い反応温度および時間、ならびにＤＭＳＯの添加で、一般的に改善されたバーコーディング収率を示した。１８ｂスペーサーアダプター（ａｄａｐｔ－１８ＳＰ）を用いれば、ほぼ完全なバーコーディングが可能である。図２４Ａ－２４Ｃは、核酸結合分子を用いてＤＮＡおよびＲＮＡ標的をバーコード化する実験結果を示す。核酸結合分子は、実施例１に記載のＲＮＡ特異的抗体を含み、バーコード化ＤＮＡアダプターと結合している。核酸結合分子はプロテインＧビーズに固定化され、２種の核酸標的の等モル混合物と共にインキュベートされる。図２４Ａ－２４Ｂでは、核酸結合分子がその同種標的を沈降させ、プライマー伸長ミックスの添加によりバーコードトランスファーが誘発される。この結果は、核酸結合分子を用いた場合の方が、遊離アダプターを用いた場合よりも、バーコード化の効率がよいことを示す。図２４Ａは適当なスペーサーの長さの重要性を強調している。Ａｂ０５およびＡｂ１０は標識によって機能的に影響を受けるので、結合活性を回復させるには１２ｂスペーサーが必要である。ランダム標識ｍ６Ａ抗体（Ａｂ０５）では、１２ｂスペーサーが正しい標的のバーコード化を支持するが、間違った標的は抗イノシン抗体（Ａｂ１０）でバーコード化される。図２４Ｂは、両抗体が部位選択的に標識された場合、８ｂスペーサーを介してオンターゲット・バーコーディングが可能であることを示している。図２４Ｃは、プロテインＧビーズアッセイ形式を用いたライゲーションによるバーコーディングの例を示す。ｍ６Ａ抗体（Ａｂ０１）をアダプターで部位特異的に標識し、核酸結合分子（ＢＡＣ０１）を得る。ＢＡＣ０１によるバーコーディングは、遊離アダプターのライゲーションよりも効率的である。

図２５は、捕捉分子（例えば、捕捉プローブ）の密度を調節できるビーズの調製について記載する。捕捉分子を１分子間隔で配置したビーズは、自由に拡散する核酸結合分子を用いたバーコーディングのためのアッセイ形式を提供する。核酸ハイブリダイゼーションプローブ（捕捉分子）は、不動態化分子（passivating molecule）と共固定化される。グラフは、ｑＰＣＲによって決定された、グラフト分子（grafting molecule）とパシベーション分子の比率を変えて得られたビーズあたりの分子数を示す。図２６Ａ－２６Ｃは、溶液中および一分子ビーズ上でのバーコード化の結果を示し（図２５参照)、分子間距離を制御することの重要性を強調している。図２６Ａは、ストレプトアビジンおよびビオチン化ＤＮＡアダプターからなる核酸結合分子の調製を示す。ストレプトアビジンとアダプターの比率によって、天然ゲル電気泳動で同定されるように、１、２、３または４アダプター形態を有する核酸結合分子が形成される。ストレプトアビジン：アダプターの比率が１：２の核酸分子をバーコード化実験用に選択する。図２６Ｂは溶液中のバーコード化の結果を示す。ビオチン特異的核酸結合分子は、ビオチンおよびｍ６Ａ修飾ＲＮＡの混合物と共にインキュベートされる。ライゲーションによるバーコーディングは、Ｔ４ＲＮＡリガーゼＩ（Ｔ４Ｒｎｌ１）を添加することで開始される。０－２５％のポリエチレングリコール（ＰＥＧ８ｋ）を添加することで、分子間間隔は徐々に小さくなる。バーコーディングは低濃度のＰＥＧ８ｋでは特異的であるが、高濃度になると分子間クロストークのために次第に非特異的になる。図２６Ｃは同じアッセイ構成成分の反応であるが、配列特異的ハイブリダイゼーションによってＲＮＡ標的をビーズに固定化したものである。この実験では、グラフト分子：不動態化分子の比率が異なるビーズを用いて分子間距離を変化させた（図２５参照）。このデータは、グラフト分子：不動態化分子の比が１：１００のビーズではクロストークを示すが、１：１，０００の比ではビオチンに特異的であることを示す。図２７は、標的化脱アミノ化によるＲＮＡ修飾の位置標識のために設計された融合タンパク質のタンパク質ドメイン構成の概略図である。ＡＰＯＢＥＣ１＝シチジンデアミナーゼ、ＹＴＨ＝ｍ６Ａリーダータンパク質、Ｓｐｙｔａｇ＝共有結合標的化用ペプチド、Ｓｐｙｃａｔｃｈｅｒ＝共有結合標的化用タンパク質、ＴＥＶ＝ＴＥＶプロテアーゼの切断部位、Ｈｉｓ－ｔａｇ＝精製用アフィニティタグ、ＭＢＤ＝マルトース結合ドメイン、タンパク質の溶解性を向上させるアフィニティ精製用タグ。図２８は、異なる融合タンパク質の発現産物のサイズ、量、細胞局在をＳＤＳゲル電気泳動で分析した結果を示す。図２９Ａ－２９Ｂは、ＭＢＤ－ＴＥＶ－ＡＰＯＢＥＣ１－Ｓｐｙｃａｔｃｈｅｒ融合タンパク質のＮｉ－カラムによる精製（図２９Ａ）およびＭＢＤ－カラムによる精製（図２９Ｂ）の成功結果を示す。図３０は、標的化脱アミドによる核酸修飾の位置標識のために設計された融合タンパク質（配列番号４２および４３）のタンパク質ドメイン組成およびアミノ酸配列の概略図である。図３１は、インビトロ翻訳で発現されたＡＰＯＢＥＣ融合タンパク質の脱アミノ化活性を示す。上図：ＡＰＯＢＥＣ活性試験に用いたＵＳＥＲアッセイの概略図。下図：ＡＰＯＢＥＣ酵素を含む無細胞抽出物の連続希釈液（１：１、１：２、１：４、１：８、１：１６）による脱アミノ化活性のデータ。最初の２レーンは、ＵＳＥＲ切断による１００％シチジンまたは１００％ウラシルの検出を示す対照である。図３２は被毒プライマーアッセイ（ＰＰＡ）の概略図である。ＰＰＡアッセイは、デアミナーゼ活性ウィンドウの大きさを測定するように設計されている。デアミナーゼ活性のプローブに使われる鋳型には、ＡＧＡＡ配列で区切られた一連のシチジンが含まれている。“Ｕ”＝ウラシルは脱アミノによって生成される。灰色の破線＝プライマーオリゴから伸長した重合または逆転写産物。“ｄｄＡ”＝ジデオキシアデノシン（反応終結物質）。模式図ゲル中の濃いグレーのバンドは、予想されるゲル分析結果を示す。図３３は、市販のＡＰＯＢＥＣ３Ａ酵素の活性を測定するためにＰＰＡアッセイを用いた例を示す。ＰＰＡ実験を、逆転写酵素（ＭｕＬＶ）およびＤＮＡポリメラーゼ（Ｋｌｅｎｏｗｅｘｏ－）をそれぞれＰＰＡ酵素として用い、ＲＮＡ標的およびＤＮＡ標的の両方に対して行った。ＡＰＯＢＥＣ３ＡはＤＮＡに対しては高い活性を示すが、ＲＮＡに対しては弱い活性を示す。図３４は、Ｓｐｙｔａｇペプチドで酵素を標的化した後、デアミナーゼ活性ウィンドウの大きさを測定するために用いたＰＰＡアッセイを示す。ＳｐｙｔａｇはＳｐｙｃａｔｃｈｅｒと速やかに反応し、ＡＰＯＢＥＣ３Ａ－Ｓｐｙｃａｔｃｈｅｒ融合タンパク質をＤＮＡ鋳型の特定の部位につなぎとめる（例えば配列番号５０）。上図：アッセイデザインの概略図。“Ｃ”＝編集部位としてのシチジン。矢印＝異なる部位に対する脱アミノ活性。色が濃いほど脱アミノ活性が強く、薄いほど脱アミノ活性が弱いことを示す。下図：アッセイに用いたターゲットオリゴ配列および解析に用いたＦＡＭ標識プライマー（配列番号５１）。ＳｐｙＴａｇ標識部位（遠位および近位、それぞれ配列番号４８および４９）を示す。

図３５は、ｈＡＰＯＢＥＣ３Ａ（Ｅ１０９Ｑ）－ＳｐｙＣａｔｃｈｅｒによる標的化脱アミノ化を示す。Ｓｐｙｔａｇの存在下では、好ましくはＳｐｙｔａｇに最も近いシチジンが編集され、ターゲティングが成功したことを示す。ｈＡＰＯＢＥＣ３Ａ（Ｅ１０９Ｑ）単独、またはＳｐｙＴａｇ対照なしのｈＡＰＯＢＥＣ３Ａ（Ｅ１０９Ｑ）－ＳｐｙＣａｔｃｈｅｒは、利用可能なすべての部位で非特異的な編集を示した。Ｄ：最初のシチジンから遠位部位にＳｐｙＴａｇを有するオリゴ。Ｐ：最初のシチジンから近位部位にＳｐｙＴａｇを有するオリゴ。ゲルの下部付近に現れるバンド（すなわち小さいバンド）は最初のシチジンでの編集を表し、ゲルの上部に現れるバンド（すなわち大きいバンド）は後のシチジンでの編集を表す。図３６は、標的化タグメンテーションによって促進されるバーコード化を示す概略図である。配列特異的ハイブリダイゼーションプローブを介して配列が磁気ビーズに捕捉される（工程Ａ）。捕捉したＲＮＡを逆転写する（工程Ｂ）。固定化されたＲＮＡ／ＤＮＡ二重鎖に、個別または異なるバーコードが付されたｉ５－ＭＥ抗体結合体のプールを添加し、飽和結合に達するまでインキュベートする（工程Ｃ）。次に、機能的トランスポソームがインサイチュウで構成される。最初の工程では、表面に結合したｉ５－ＭＥ－抗体結合体に遊離Ｔｎ５トランスポザーゼおよびＭＥ’オリゴを加えることで、抗体結合ｉ５－Ｔｎ５モノマーが生成される（工程Ｄ）。Ｔｎ５は二本鎖ｉ５－ＭＥ／ＭＥ’アダプターに結合する。第二ステップでは、ｉ７－ＭＥ／ＭＥ’アダプターを予め付加したＴｎ５を添加し、ｉ５－／ｉ７－Ｔｎ５二量体を得る（工程Ｅ）。トランスポソームのアセンブリー後、ＭｇＣｌ_２含有バッファーを加えることでタグメンテーションが開始され（工程Ｆ）、バーコード化アダプターを有する産物が形成される。

詳細な説明
本発明は、トランスクリプトームおよびゲノムのそれぞれにわたるＲＮＡおよびＤＮＡ修飾の多重プロファイリングのための組成物および方法を提供する。この方法は、標的核酸の非古典的特徴（例えば、塩基修飾、骨格修飾、損傷、および／または構造的要素）の分子認識と、この認識事象からの情報をバーコードを用いて標的核酸の隣接遺伝子配列に書き込む工程とを組み合わせている。得られたバーコード化核酸は、次に配列決定ライブラリーに変換され、例えばＤＮＡ／ＲＮＡ配列決定法または他の方法によって読み取られる。この工程により、バーコードの配列が明らかになり、標的核酸の非古典的特徴と相関する。塩基配列決定により、標的核酸中の非古典的特徴の局在を確認することもできる。本明細書に記載のハイスループット・プロファイリング法は、複数またはすべてのＤＮＡ／ＲＮＡ修飾の性質および位置を並行して同定することを可能にする。これらの方法では、ＤＮＡ／ＲＮＡ修飾の存在量および化学量論も決定できる。

いくつかの態様では、本明細書に記載の方法は、標的核酸上の修飾を同定するだけでなく、標的核酸上の修飾を１塩基ほどの高分解能で局在化するためにも用いられる。

本発明は、以下に、例示的かつ限定されない態様で、かつ添付図面を用いてより詳細に説明される。しかしながら、本発明は、多くの異なる形態で具体化され得るものであり、以下に示す態様に限定して解釈されるべきではない。むしろ、これらの態様は、本明細書の記載を完全にし、当業者に本明細書に記載された範囲を伝えるために提供される。

別段の定義がない限り、本明細書で用いるすべての技術用語および科学用語は、本発明が属する技術分野における当業者によって一般的に理解されるのと同じ意味を有する。本明細書の詳細な説明で用いられる用語は、特定の態様を説明するためだけのものであり、限定を意図するものではない。

すべての刊行物、特許出願、特許、ＧｅｎＢａｎｋ／Ｕｎｉｐｒｏｔまたは他の受託番号、および本明細書に記載される他の参考文献は、すべての目的のために引用によりその内容全体が本明細書に包含される。

定義
以下の用語は、本明細書および添付の特許請求の範囲において用いられる。

単数形の“ａ”、“ａｎ”、および“ｔｈｅ”は、文脈上そうでないことが明らかな場合を除き、複数形も含むものとする。

さらに、ポリヌクレオチドまたはポリペプチド配列の長さの量、用量、時間、温度などの測定可能な値に言及するとき、本明細書で用いる用語“約”とは、規定量の±２０％、±１０％、±５％、±１％、±０．５％、またはさらに±０．１％の変動を包含することを意味する。

また、本明細書で用いる“および／または”は、関連する列挙された項目の１以上の何れかの可能な組み合わせ、ならびに代替的に解釈されるとき、組み合わせの欠失(“または”)を意味し、それらを包含する。

他にこれと異なる記載がない限り、本明細書に記載される種々の特徴は、何れかの組み合わせで使用できることが特に意図されている。さらに、いくつかの態様では、本明細書に記載の特徴または特徴の組み合わせのいずれかを除外または省略できる。さらに説明すると、例えば、本明細書において、特定のＤＮＡ塩基がＡ、Ｔ、Ｇおよび／またはＣから選択され得ることが示されている場合、この用語は、その塩基がこれらの塩基の何れかのサブセット、例えばＡ、Ｔ、ＧまたはＣ；Ａ、ＴまたはＣ；ＴまたはＧ；Ｃのみ等から選択され得ることも示しており、かかるサブコンビネーションがそれぞれ本明細書において明示的に記載されているかのように記載される。さらに、かかる用語は、指定された塩基の１以上が除外されうることも示している。例えば、いくつかの態様では、核酸はＡ、ＴまたはＧではない；Ａではない；ＧまたはＣではない等、そのような可能性のある各除外が本明細書に明示されているかのように記載される。

本明細書で用いる用語“減少”、“低減”、“低下”および類似の用語は、少なくとも約１０％、約１５％、約２０％、約２５％、約３５％、約５０％、約７５％、約８０％、約８５％、約９０％、約９５％、約９７％またはそれ以上の減少を意味する。

本明細書で用いる用語“増加”、“改善”、“増強”、“強化”、および類似の用語は、少なくとも約１０％、約１５％、約２０％、約２５％、約５０％、約７５％、約１００％、約１５０％、約２００％、約３００％、約４００％、約５００％またはそれ以上の増加を示す。

用語“エピジェネティック変化”とは、本明細書では、その細胞または生物のＤＮＡの一次配列（すなわち、Ａ、Ｔ、ＣおよびＧ）にコードされていない、生細胞、生物などにおける表現型の変化を意味するために用いられる。エピジェネティックな変化には、例えば、ヌクレオチドおよび／またはヒストン（すなわち、核内のＤＮＡのコイル化およびパッケージングに関与するタンパク質）の化学的変化が含まれ得る。例示的なＤＮＡヌクレオチド修飾には、一般的なエピジェネティックマーカーである５－メチルシチジン（５ｍＣ）およびその酸化産物である５－ヒドロキシメチルシチジン（５ｈｍＣ）、５－ホルミルシチジン（５ｆＣ）、５－カルボキシメチルシチジン（５ｃａＣ）などが含まれる。５ｍＣは遺伝子サイレンシングにおけるその役割でよく知られているが、５ｍＣの脱メチル化経路における酸化中間体５ｈｍＣ、５ｆＣおよび５ｃａＣの代謝機能を示唆する証拠が増えている。さらに代謝的に関連するＤＮＡ修飾には、酸化、アルキル化、二量体化、架橋、その他ＤＮＡ損傷に関連する化学修飾ヌクレオチドがある。このようなＤＮＡ修飾は毒性を理解する上で重要であるが、損傷が生じた際のゲノム全体におけるその分布はよくわかっていない。ＤＮＡ修飾は、例えばプロモーターおよびゲノムの他の領域におけるＧ－四重鎖の動態に関与するなど、さらなる制御的役割を担っている可能性がある。

本明細書で用いる用語“エピトランスクリプトーム変化”とは、転写中または転写後に起こるＲＮＡの化学修飾を意味する。核酸塩基、リボース、ホスホジエステル骨格への化学変化を含め、１７０以上の異なるＲＮＡ修飾が知られている。ＲＮＡ修飾は、ｍＲＮＡ、ｔＲＮＡ、ｒＲＮＡ、ｌｎｃＲＮＡ、ｍｉＲＮＡなど、全てのＲＮＡタイプに見出だされ、ＲＮＡの構造および動態を変化させたり、タンパク質など他の生体分子によるＲＮＡの分子認識を変化させたりすることによって、細胞の表現型を変化させ得る。エピトランスクリプトームの天然化学ＲＮＡ修飾は、ＲＮＡプロセシング、スプライシング、ポリアデニル化、編集、構造、安定性、局在化、翻訳開始、遺伝子発現など、ＲＮＡ代謝における幅広い機能を制御している。エピトランススクリプトームは、細胞タイプ、代謝状態、健康状態によって異なり、細胞の表現型および機能の分化に重要な役割を果たし（しかし、あまり理解されていない）、同一の一次遺伝配列を有する同一生物の細胞間の劇的な表現型の違いを説明するのに役立っている。エピトランススクリプトームの変化は疾患と相関する。例えば、ｍＲＮＡおよびｎｃＲＮＡの修飾は、がん幹細胞の分化過程において、時空間的な遺伝子発現の変化を制御することが知られており、それによって疾患の進行に組織化した役割を果たしている。さらに、ＲＮＡ修飾は、ＲＮＡウイルス（例えば、コロナウイルス科およびフラビウイルス科）が宿主を裏切り、自然免疫系を回避する重要な機序であることが強く予期される。

用語“ゲノム”とは、細胞または細胞集団に含まれるすべてのＤＮＡ、あるいは特定のタイプのＤＮＡ分子（例えば、コーディングＤＮＡ、非コーディングＤＮＡ、ミトコンドリアＤＮＡ、または葉緑体ＤＮＡ）の選択を意味する。用語“トランスクリプトーム”とは、１つの細胞または細胞集団で産生されるすべてのＲＮＡ分子、あるいは完全なトランスクリプトームに含まれる特定の種類のＲＮＡ分子の選択（例えば、ｍＲＮＡ対ｎｃＲＮＡ、またはｍＲＮＡトランスクリプトーム内の特定のｍＲＮＡ）を意味する。いくつかの態様では、トランスクリプトームは、コーディングＲＮＡ（すなわち、タンパク質に翻訳されるＲＮＡ、例えばｍＲＮＡ）および非コーディングＲＮＡなどの複数の異なるタイプのＲＮＡを含む。トランスクリプトーム中に見出される様々なタイプのＲＮＡ分子の限定されないリストには、修飾ヌクレオシドを含み得るものが含まれる：７ＳＫＲＮＡ、シグナル認識粒子ＲＮＡ、アンチセンスＲＮＡ、ＣＲＩＳＰＲＲＮＡ、ガイドＲＮＡ、ロング非コーディングＲＮＡ、マイクロＲＮＡ、メッセンジャーＲＮＡ、ｐｉｗｉ相互作用ＲＮＡ、リピート関連ｓｉＲＮＡ、レトロトランスポゾン、リボヌクレアーゼＭＲＰ、リボヌクレアーゼＰ、リボソームＲＮＡ、カハール小体（small Cajal body）特異的ＲＮＡ、小干渉ＲＮＡ、ｓｍＹＲＮＡ、小核ＲＮＡ、およびトランス作用ｓｉＲＮＡ。

本明細書で用いる用語、核酸の“非古典的特徴”とは、その一次配列とは別個の核酸の特徴を意味する。例えば、非古典的特徴とは、ＤＮＡまたはＲＮＡ塩基、あるいはＤＮＡまたはＲＮＡ骨格に対する化学的修飾であり得るる。いくつかの態様では、非古典的特徴は、ヘアピンまたはループのような構造配列であってもよい。いくつかの態様では、非古典的特徴は、ＤＮＡまたはＲＮＡ損傷のような核酸損傷であり得る。他の例示的な非古典的構造としては、Ｚ－ＤＮＡ構造、Ｇ－四重鎖、ｉ－モチーフ、バルジ、脱塩基部位、三重鎖、三方向結合、十字形構造、四重ループ、リボースジッパー、シュードノットなどが挙げられるが、これらに限定されない。ＤＮＡおよびＲＮＡを含む核酸は、多くの非古典的特徴を含む。これらの修飾の頻度はＲＮＡおよび特徴の種類によって大きく異なるが、修飾のクラスターが発生することもある。いくつかの態様では、非古典的特徴はＤＮＡおよび／またはＲＮＡの損傷に起因し得る。本明細書で用いる用語“非古典的特徴”および“改変”とは、当業者であれば文脈上理解されるように、互換的に使用できる。

本明細書で用いる用語“標的核酸”とは、１以上の非古典的特徴を含む核酸を意味する。本明細書に記載の核酸結合分子は、分子の結合ドメインが非古典的特徴を認識するとき、標的核酸に結合できる。

本明細書で用いる用語“基質”とは、何れかの固体支持体を意味するために用いられる。例えば、基質はビーズ、チップ、プレート、スライド、ディッシュ、3次元マトリックスなどである。本明細書に記載されているように、本明細書に記載されている核酸結合分子は、１以上の基質に結合してもよく、基質は１以上の核酸結合分子に結合してもよい。基質は種々の材料で形成できる。いくつかの態様では、基質は樹脂、膜、繊維、ポリマーである。いくつかの態様において、基質は、セファロース、アガロース、セルロース、ポリスチレン、ポリメタクリレート、および／またはポリアクリルアミドを含む。いくつかの態様では、基質は合成ポリマーなどのポリマーを含む。合成ポリマーの限定されないリストには、ポリ（エチレン）グリコール、ポリイソシアノペプチドポリマー、ポリ乳酸－コ－グリコール酸、ポリ（ε－カプロラクトン）（ＰＣＬ）、ポリ乳酸、ポリ（３－ヒドロキシ酪酸－コ－３－ヒドロキシバレレート）（ＰＨＢＶ）、キトサンおよびセルロースが含まれる。

本明細書で用いる用語“バーコード”とは、合成産生された核酸を意味する。固有のバーコードを特定の核酸修飾に割り当てて、本明細書に記載の方法においてそれらの修飾を特異的に同定できるようにしてもよい。したがって、バーコードは、本明細書に記載される１以上の方法において、その改変を同定するために特別に用いられるとき、非古典的改変に対して“ユニーク”である。バーコードは、固相オリゴヌクレオチド合成など、当技術分野で知られている方法を用いて製造できる。ある態様では、バーコードはＤＮＡバーコードであってもよい（すなわち、ＤＮＡ配列を含んでいてもよい）。いくつかの態様において、バーコードは、ペプチド核酸（ＰＮＡ）またはロック核酸（ＬＮＡ）などの合成ＤＮＡ構造を含んでいてもよい。いくつかの態様では、合成ＤＮＡ構造は、１以上の修飾塩基を含んでいてもよい。ある態様では、バーコードはＲＮＡバーコードであってもよい（すなわち、ＲＮＡ配列を含んでいてもよい）。バーコードはどのような長さであってもよく、例えば、約４から約１５０ヌクレオチド長の範囲であり得る。いくつかの態様において、バーコードは、約４～約２０ヌクレオチド長、例えば、約４ヌクレオチド長、約５ヌクレオチド長、約６ヌクレオチド長、約７ヌクレオチド長、約８ヌクレオチド長、約９ヌクレオチド長、約１０ヌクレオチド長、約１１ヌクレオチド長、約１２ヌクレオチド長、約１３ヌクレオチド長、約１４ヌクレオチド長、約１５ヌクレオチド長、約１６ヌクレオチド長、約１７ヌクレオチド長、約１８ヌクレオチド長、約１９ヌクレオチド長、または約２０ヌクレオチド長である。通常、バーコードは、既知の生物のゲノムにはない、合理的に設計された配列を含み得る。しかしながら、いくつかの態様では、バーコードは既知の配列を含み得る。例えば、バーコード配列は、病原体または他の生物学的物質に関連するシグネチャーを含み得る。ある態様では、バーコードは、配列決定反応を促進するように構成された配列を含んでいてもよい。用語“バーコード”および“アダプター”とは、本明細書で互換的に用いられ得る。当技術分野で理解されるように、アダプターは、いくつかの態様では、バーコードで構成される。いくつかの態様では、アダプターは、以下に説明され、図２Ａ－２Ｇに示されるように、バーコードおよび１以上の追加要素を含み得る。

用語“増幅”とは、核酸に関して使われるとき、その核酸のコピーを生成することを意味する。核酸は、例えばポリメラーゼ連鎖反応（ＰＣＲ）を用いて増幅できる。核酸増幅の代替法としては、ヘリカーゼ依存性増幅（ＨＡＤ）、リコンビナーゼポリメラーゼ増幅（ＲＰＡ）、ループ介在等温増幅（ＬＡＭＰ）、核酸配列ベース増幅（ＮＡＳＢＡ）、自家持続配列複製法（３ＳＲ）およびローリングサークル増幅（ＲＣＡ）などが含まれる。

本明細書で用いる用語“複合体内アダプタートランスファー”または“複合体内バーコードトランスファー”とは、核酸結合分子がそれに結合している間に、アダプターおよび／またはバーコードが標的核酸（例えば、ＤＮＡまたはＲＮＡ）にトランスファーすることを意味する。したがって、本明細書中、用語“複合体”とは、標的核酸とその同族核酸結合タンパク質との間に形成される複合体を意味する。

本明細書で用いる用語“クロストーク”、“バーコードクロストーク”、および類似の用語は、核酸バーコードの標的外トランスファーを意味する。例えば、バーコードのクロストークは、核酸結合分子のバーコードが、核酸結合分子の結合ドメインに結合していない核酸にトランスファーされるときに起こり得る。

用語“ＤＮＡアドレス”とは、プログラム可能な結合エレメントとして用いられ、特定の結合事象を促進するＤＮＡまたはＲＮＡ配列および／またはその相補体を意味する。例えば、デアミナーゼは、標的ＤＮＡまたはＲＮＡ配列（例えば、第２のＤＮＡアドレス）に結合するＤＮＡまたはＲＮＡ配列（すなわち、第１のＤＮＡアドレス）に結合し、デアミナーゼをそこに誘導できる。第１のＤＮＡアドレスと第２のＤＮＡアドレスとの結合が、例えば図１４Ｂに示されている（例えば、アドレス１およびアドレス１’）。

“ＤＮＡ損傷”または“ＲＮＡ損傷”などの“核酸損傷”は、内因性プロセスおよび／または外因性薬剤の結果として起こりうる核酸の化学的修飾である。例えば、ＤＮＡ損傷は、酸化的損傷（８－オキソグアニンなど）、炭化した肉およびタバコの煙に含まれるような親電子物質およびアルキル化剤との反応（ベンゾ［ａ］ピレン付加物およびアルキル化核酸塩基）、紫外線損傷（シクロブタンピリミジン二量体および６－４ピリミジン－ピリミジン光生成物）、金属錯体形成（水銀錯体およびプラチナ架橋）などによって引き起こされる。内因性プロセスによって生じるＤＮＡ損傷は頻繁に起こる。ＤＮＡ損傷は通常、様々な修復酵素によって修復されるか、遺伝暗号の複製中に損傷バイパスポリメラーゼによってバイパスされる。不自然な細胞増殖および成長をもたらす突然変異は、がん発生を駆動する。変異は通常のＤＮＡ配列決定で容易に検出できるが、損傷自体は標準的なＤＮＡ配列決定ワークフローでは検出できない。損傷はゲノム全体に一様に分布しているわけではなく、修復の効果はＤＮＡ遺伝子座および細胞状態に関連している。さらに、最も一般的ながん化学療法薬（シスプラチン、ゲムシタビンなど）はＤＮＡ損傷を誘発し、そのため、ヒトゲノム全体のＤＮＡ損傷をマッピングすることは、老化と癌の病因を理解し、癌化学治療薬の有効性を向上させ、毒性を低下させるための大きな可能性を提供する。

核酸結合分子およびその製造方法
本明細書で提供されるのは、結合ドメインおよびアダプターを含む核酸結合分子であり、それぞれについて以下にさらに詳しく説明する。

アダプター
本明細書で用いる用語“アダプター”とは、ＤＮＡまたはＲＮＡ分子の末端に結合でき、何らかの機能を付与する何れかの短い核酸配列を意味する。例えば、いくつかの態様では、アダプターはＤＮＡまたはＲＮＡ分子の配列決定および／または同定を容易にできる。

ある態様では、アダプターは５’リン酸を含む。いくつかの態様では、アダプターは３’リン酸を含む。ある態様では、アダプターは５’リン酸および３’リン酸を含む。いくつかの態様では、アダプターは一本鎖である。いくつかの態様では、アダプターは二本鎖である。いくつかの態様では、二本鎖アダプターは、相補的オリゴヌクレオチドにハイブリダイズした一本鎖アダプターを含み得る。

いくつかの態様では、アダプターは切断可能である。例えば、アダプターは１以上の切断部位を含んでいてもよい。開裂部位は、例えば、１個以上のウラシル塩基、酵素（例えば、制限酵素または他のヌクレアーゼ）によって認識される配列、または合成化学部分を含み得る。

いくつかの態様では、アダプターはユニバーサルフォワードプライマー（ＵＦＰ）を含む。いくつかの態様において、アダプターはユニバーサルリバースプライマー（ＵＲＰ）を含む。いくつかの態様では、アダプターはＵＦＰおよびＵＲＰを含む。いくつかの態様では、アダプターはＵＦＰまたはＵＲＰで構成される。ＵＦＰおよびＵＲＰ配列は、天然には存在しないＤＮＡ配列であり、標的核酸（またはそのコピー）に導入された配列のみを選択的に増幅できる。配列決定中、ＵＦＰおよび／またはＵＲＰはＤＮＡ標的にアニールされ、新しいＤＮＡ分子（すなわち、そのコピー）の伸長のための開始部位を提供する。例示的なＵＦＰおよびＵＲＰのリストは、lslabs.com/resources/universal-primer-listのワールドワイドウェブアドレスで見ることができる。いくつかの態様において、アダプターに用いられる（そして標的核酸にトランスファーされる）ユニバーサルプライマー配列は、確立されたＤＮＡ配列決定プラットフォームと互換性があり、下流のＰＣＲ反応においてＩｌｌｕｍｉｎａＰ５およびＰ７のような表面アダプターを導入するために用いられ得る。

いくつかの態様では、アダプターは、改変コード化バーコード（ＭＢＣ）などのバーコードを含んでいてもよい。ＭＢＣは短いユニークな核酸配列である。各ＭＢＣは、特定のエピジェネティック修飾またはエピトランススクリプトーム修飾に関連して用いられ、その同定および／または解析に役立つ。例えば、ＭＢＣは、特定の非古典的特徴に特異的な結合ドメインに結合したアダプターに用いられ得る。いくつかの態様では、アダプターはバーコードで構成され得る。いくつかの態様では、アダプターはＭＢＣで構成され得る。

ある態様では、アダプターはユニークな分子識別子（ＵＭＩ）を含み得る。ＵＭＩは、４ ^{[UMIの長さ]} 個のユニークな変異体を有する短いランダム配列で構成されている。例えば、１０塩基長のＵＭＩは１，０４８，５７６（４^１０）のユニークな分子をコードできる。ＵＭＩは、ＰＣＲ増幅バイアスおよびエラーを補正するために、配列決定リードの絶対的定量に用いられる。例えば、ＲＮＡサンプルは１００コピーの転写産物Ａおよび１００コピーの転写産物Ｂを含み得る。転写産物Ｂの方がより効率的に増幅するため、ＰＣＲ増幅後、１Ｍコピーの転写産物Ａおよび２Ｍコピーの転写産物Ｂが検出され得る。転写産物Ａに対してＵＭＩを使用するとき、１００ＵＭＩ変異体の１０，０００コピーが検出され、転写産物Ｂに対しては１００ＵＭＩ変異体の２０，０００コピーが検出される。リード数を数える代わりにＵＭＩ変異体の数を数えることで、分子の絶対数がわかる。

通常、ＵＭＩの長さはＵＭＩの衝突（collision）を避けるために選択される。ＵＭＩの衝突とは、同じ配列および同じＵＭＩを有するが、２つの異なるゲノム分子に由来する２つのリードを観察する事象と定義される。ＵＭＩの衝突は、用いられるＵＭＩの数、ユニーク対立遺伝子の数、および集団における各対立遺伝子の頻度の関数である。ＵＭＩの理想的な長さは、配列決定プラットフォームのエラー率および配列決定深度によっても変わる。エラー率の高い配列決定プラットフォームでは、ＵＭＩのエラーが偶発的なＵＭＩの衝突を引き起こす可能性があるため、より長いＵＭＩが必要となる。選択した遺伝子座の配列決定深度が全ゲノム配列決定よりも深い評定配列では、異なるゲノム分子からの多くの対立遺伝子が同じ配列を共有するため、より長いＵＭＩも使用される。過剰に長いＵＭＩは、より多くの配列決定サイクル数を必要とするため、実際の標的配列のリードが短くなるために避けられる。また、長いＵＭＩはＰＣＲ反応においてミスプライミングを引き起こし、配列決定の乱れを生じる可能性がある。ＵＭＩは通常、約３から約２５ヌクレオチド長の範囲である。いくつかの態様において、ＵＭＩは、約３～約２０ヌクレオチド長、例えば、約３ヌクレオチド長、約４ヌクレオチド長、約５ヌクレオチド長、約６ヌクレオチド長、約７ヌクレオチド長、約８ヌクレオチド長、約９ヌクレオチド長、約１０ヌクレオチド長、約１１ヌクレオチド長、約１２ヌクレオチド長、約１３ヌクレオチド長、約１４ヌクレオチド長、約１５ヌクレオチド長、約１６ヌクレオチド長、約１７ヌクレオチド長、約１８ヌクレオチド長、約１９ヌクレオチド長、または約２０ヌクレオチド長である。いくつかの態様では、ＵＭＩは８ヌクレオチド長であってもよい。いくつかの態様では、UMIは１０ヌクレオチド長であってもよい。

図２Ａ－２Ｇは、例示的な核酸アダプターの構造を示しており、凡例はそこで用いられている各要素の説明を示す。これらのアダプターには、参照しやすいようにタイプＡ、タイプＢ、タイプＣ、タイプＤ、タイプＥ、タイプＦおよびタイプＧのラベルが付けられている。

図２Ａに示したアダプター（タイプＡ）は、ＵＦＰ配列またはＵＲＰ配列のいずれかを含み得る最小限のアダプターを表す。タイプＡアダプターは、非古典的核酸特徴の同定または分析に用いられ得る配列を含まず、代わりにライブラリー構築に使用される。いくつかの態様では、タイプＡアダプターは非古典的特徴を含まない核酸分子に結合される。いくつかの態様では、タイプＡアダプターは、標的核酸の他端にバーコード化アダプターを導入した後、非古典的特徴を含む核酸分子に結合される。例えば、タイプＡアダプターは、１以上のバーコードが付加された後、ＰＣＲ増幅のために核酸をキャップし、調製するために使用できる。

図２Ｂ－２Ｇに示したアダプターはそれぞれ、非古典的ＤＮＡ／ＲＮＡ特徴（例えば、修飾塩基）の１つに特異的なＭＢＣを含む。図２Ｂに示すように、タイプＢアダプターは、ｃＤＮＡの環化を伴うライブラリー調製ワークフローに使用できる。これらは切断部位（ＣＬＳ）を含む。タイプＢアダプターの切断はＰＣＲ増幅前に行ってもよい。図２Ｃに示すように、タイプＣアダプターはＣＬＳを欠き、ユニバーサルプライマー領域を１つだけ含んでいる。タイプＣアダプターは、例えばライゲーション反応によるバーコード導入に使用できる。これらは、Ｓｍａｒｔ－Ｓｅｑ技術による鋳型スイッチングオリゴヌクレオチドまたは他のアダプターライゲーションなどの第二鎖合成法と組み合わせてもよい。図２Ｄに示すように、タイプＤアダプターはプライマー伸長によるエンコード用に特別に設計されている。タイプＤアダプターは、３’末端スペーサー（ＳＰ）を１つ、あるいは両端に２つのスペーサー領域（例えばＳＰ１、ＳＰ２）を有する。反応は、短いスペーサー領域（ＳＰ）を標的核酸の３’末端にライゲーションし、相補的スペーサーを有するタイプＤアダプターを結合させることによって開始される。スペーサーは、すべての核酸結合分子およびサイクルにわたって普遍的であってもよく、核酸結合分子の各タイプに固有であってもよく、またはバーコード化の各サイクルに固有であってもよい。いくつかの態様では、アダプターは、１つ、２つ、３つ、または４つのスペーサーを含む。いくつかの態様では、アダプターは１つのスペーサーを含む。いくつかの態様では、アダプターは２つのスペーサーを含む。いくつかの態様において、スペーサーは、３ヌクレオチド長、４ヌクレオチド長、５ヌクレオチド長、６ヌクレオチド長、７ヌクレオチド長、８ヌクレオチド長、９ヌクレオチド長、１０ヌクレオチド長、１１ヌクレオチド長、１２ヌクレオチド長、１３ヌクレオチド長、１４ヌクレオチド長、１５ヌクレオチド長、１６ヌクレオチド長、１７ヌクレオチド長、１８ヌクレオチド長、１９ヌクレオチド長または２０ヌクレオチド長である。いくつかの態様において、スペーサーは６ヌクレオチド長である。いくつかの態様において、スペーサーは７ヌクレオチド長である。いくつかの態様では、スペーサーは８ヌクレオチド長である。いくつかの態様において、スペーサーは配列番号１９を含む。タイプＤアダプターは、例えば、プライマー伸長反応による１回のバーコード転写、または複数の連続したバーコード転写に使用できる。複数サイクルのバーコーディングは、各サイクルにおいて１つだけ、または非古典的特徴のサブセットだけを調べるために使用できる。例えば、第１のコード化サイクルでは、ｍ５Ｃに特異的な核酸結合分子を用いることができる。第２のコード化サイクルでは、ｍ６Ａに特異的な核酸結合分子を用いることができる。第３のコード化サイクルは、イノシンなどに特異的な核酸結合分子を用いることができる。別の態様では、第１サイクルはｍ５Ｃおよびｍ６Ａを試用し、第２サイクルはイノシンを試用してもよい。別の態様では、第１のエンコード化サイクルはすべての非古典的特徴を試用し、第２のエンコード化サイクルはすべての非古典的特徴を２回目に試用し得る。図２Ｅに示すように、タイプＥアダプターは、アダプターを含む核酸結合分子を介して配置されたとき、修飾部近傍の標的核酸に結合するランダムな足(feet)を有するヘアピンの形をとる。足はランダムな配列でも、目的の領域でもよい。さらに、核酸二重鎖の融解温度を上昇させ、逆転写酵素およびＤＮＡポリメラーゼによる鎖置換に対する修飾塩基を含んでいることもある。いくつかの態様では、ヘアピンのステム領域は安定にアニールし、冗長な配列決定内容を最小限にするために可能な限り短い。スペーサーと同様に、ステムはすべての核酸結合分子に普遍的であるか、または多様である。いくつかの態様では、ループ領域は切断可能である。タイプＥアダプターは、例えば、内部プライミングやロングリード構築に用いられ得る。図２Ｆに示すように、タイプＦはタイプＥアダプターを改良したもので、切断されたループで構成されている。タイプＦアダプターの全体的な構造は、Ｙ字型、Ｌ字型、またはそれらの組み合わせである。図２Ｇに示すように、タイプＧアダプターはＤＮＡアドレスを含むことによってタイプＤアダプターに由来する。ＤＮＡアドレスは、何れのアダプター・アーキテクチャにも含めることができる。

いくつかの態様では、アダプターはＵＦＰ、ＵＲＰ、またはＵＦＰおよびＵＲＰを含む。いくつかの態様では、アダプターはＵＦＰおよび／またはＵＲＰを含み、さらにＭＢＣも含む。いくつかの態様では、アダプターは、ＵＦＰおよび／またはＵＲＰ、ＭＢＣ、およびＵＭＩを含む。いくつかの態様では、アダプターは、ＵＦＰおよび／またはＵＲＰ、ＭＢＣ、ＵＭＩおよびＣＬＳを含む。いくつかの態様では、アダプターは、ＵＦＰおよび／またはＵＲＰ、ＭＢＣ、ＵＭＩ、ＣＬＳ、およびＳＰを含む。いくつかの態様では、アダプターは、ＵＦＰ、ＣＬＳ、ＵＲＰ、ＵＭＩ、およびＭＢＣを含む。いくつかの態様では、アダプターは、ＵＦＰ、ＵＭＩ、およびＭＢＣを含む。いくつかの態様では、アダプターは、ＵＲＰ、ＵＭＩ、およびＭＢＣを含む。いくつかの態様では、アダプターは、第１のＳＰ、ＭＢＣ、ＵＭＩ、および第２のＳＰを含む。

いくつかの態様では、アダプターはヘアピン形状を有する。いくつかの態様では、ＭＢＣを含むアダプターはヘアピン形状を有する。いくつかの態様では、ＭＢＣを含むアダプターはヘアピン形状を有し、ヘアピンは、４～２０塩基対の長さのステム領域、および２つのランダムなまたは標的化された足とからなり、各足の長さは約４～１０塩基対である。

いくつかの態様では、アダプターはＬ字型、Ｙ字型、またはそれらの組み合わせを有する。いくつかの態様では、Ｌ字形状またはＹ字形状を有するアダプターは、ＵＦＰ、ＭＢＣ、およびＵＲＰを含む。いくつかの態様において、Ｌ字形状またはＹ字形状を有するアダプターは、ＵＦＰ、ＭＢＣ、およびＵＲＰを含み、アダプターは、約４～約２０塩基対の長さを有するステム領域を含み、さらに、ランダムまたは標的化された足を含み、各足は、約４～１０塩基対の長さを有する。

本明細書に記載のアダプターは、いくつかの態様では、結合ドメインとアダプターの連結を補助するリンカーなど、１以上のリンカーを含んでいてもよい。リンカーとしては、ポリエチレングリコール、炭化水素、ペプチド、ＤＮＡまたはＲＮＡが挙げられる。リンカーの長さは様々である。ＤＮＡまたはＲＮＡの非古典的特徴が核酸配列の５’末端または３’末端から離れた場所にある場合には、より長いリンカーを使用できる。より短いリンカーは、ＤＮＡまたはＲＮＡの非古典的特徴が核酸配列の５’末端または３’末端に比較的近い位置にある場合に使用される。

いくつかの態様では、アダプター、またはその中に含まれるリンカー配列は切断可能である。例えば、アダプターは１以上の切断部位を含んでいてもよい。アダプターは化学的、光化学的、酵素的に切断可能であってもよい。開裂部位は、例えば、１個または数個のウラシル塩基、酵素（例えば、制限酵素または他のヌクレアーゼ）によって認識される配列、または合成化学部分、例えば、ジスルフィド、炭酸エステル、ヒドラゾン、シス－アコニチル、または（β－グルクロニド）を含み得る。

以下にさらに詳しく述べるように、アダプターは、バーコードトランスファー反応を用いて、一本鎖または二本鎖の標的核酸（例えば、ＤＮＡまたはＲＮＡ）に融合させることができる。

いくつかの態様において、プライマー伸長は、ＲＮＡ標的に３’ポリ－ｒＡテイルを付加することを含む。いくつかの態様では、プライマー伸長は、図２３Ａに示されているように、ＲＮＡ標的に３’ポリ－ｒＡテイルを付加することを含む。３’ポリ－ｒＡテイルは、何れかの公知のポリ（Ａ）ポリメラーゼ（例えば、大腸菌ポリ（Ａ）ポリメラーゼ）を用いたポリアデニル化によって付加される。いくつかの態様では、ＲＮＡ標的はポリ（Ａ）ポリメラーゼおよび競合ポリｄＴオリゴヌクレオチドと共にインキュベートされる。ポリ（Ａ）ポリメラーゼと競合するポリｄＴオリゴヌクレオチドとの共処理は、付加された３’ポリ－ｒＡテイルの長さを制御する。通常、ポリアデニル化によって、平均３’ポリ－ｒＡテイル長は約１５０塩基となる。いくつかの態様において、３’ポリ－ｒＡテイルの長さは、約５塩基長、約１０塩基長、約１５塩基長、約２０塩基長、約２５塩基長、約３０塩基長、約３５塩基長、約４０塩基長、約４５塩基長、約５０塩基長、約５５塩基長、または約６０塩基長である。

いくつかの態様において、プライマー伸長は、３’ポリ－Ｕテイル、３’ポリ－Ｇテイル、３’ポリ－Ａテイルまたは３’ポリ－ＧテイルをＲＮＡ標的に付加することを含む。ホモポリマーテイルは、公知のポリ（Ｕ）ポリメラーゼ（例えば、分裂酵母；Schizosaccharomyces pombe Ｃｉｄ１）を用いて付加される。いくつかの態様では、ＲＮＡ標的をポリ（Ｕ）ポリメラーゼ、ＧＴPおよび競合ポリｄＣオリゴヌクレオチドと共にインキュベートする。ポリ（Ｕ）ポリメラーゼおよび競合するポリｄＣオリゴヌクレオチドとの共処理は、付加された３’ポリＧテイルの長さを制御する。いくつかの態様において、３’ポリＧテイルの長さは、約５塩基長、約１０塩基長、約１５塩基長、約２０塩基長、約２５塩基長、約３０塩基長、約３５塩基長、約４０塩基長、約４５塩基長、約５０塩基長、約５５塩基長、または約６０塩基長である。

いくつかの態様では、アダプターは配列番号５６を含む。いくつかの態様では、アダプターは配列番号５７を含む。いくつかの態様では、アダプターは配列番号６を含む。いくつかの態様では、スペーサーを含むアダプターは配列番号２５を含む。いくつかの態様では、スペーサーを含むアダプターは配列番号２６を含む。いくつかの態様では、スペーサーを含むアダプターは配列番号２７を含む。いくつかの態様では、スペーサーを含むアダプターは配列番号３８を含む。いくつかの態様において、ビオチンアダプターは配列番号３３を含む。いくつかの態様では、ＤＢＣＯ標識アダプターは配列番号２２を含む。いくつかの態様では、環状（clicked）アダプターは配列番号３９を含む。

結合ドメイン
本明細書で用いる用語“結合ドメイン”とは、修飾ヌクレオシドのような標的核酸の非古典的特徴に結合する核酸、ポリペプチドなどを意味する。用語“結合ドメイン”は、当業者には文脈から理解され得るように、本明細書中、“結合剤”、“認識エレメント”、“抗体”などの用語と互換的に用いられ得る。いくつかの態様では、結合ドメインは標的核酸の非古典的特徴に結合する。いくつかの態様では、結合ドメインは、非古典的特徴に隣接する何れかの核酸特徴にも結合しない。いくつかの態様において、結合ドメインは、（ｉ）標的核酸の非古典的特徴、および（ｉｉ）非古典的特徴に隣接する１以上の核酸特徴（例えば、核酸塩基、糖、リン酸、またはそれらの組み合わせ）の両方に結合する。いくつかの態様では、結合ドメインは保存配列モチーフに結合し得る。例えば、ｍ^６Ａはしばしば以下のモチーフに生じる：ＧＧ（ｍ^６Ａ）ＣＴ。したがって、結合ドメインがｍ^６Ａに結合するとき、それに隣接する１以上の核酸（例えば、ＧＧまたはＣＴ）にも結合し得る。別の例として、結合ドメインはｔＲＮＡのアンチコドンループの全部または一部に結合できる。いくつかの態様において、結合ドメインはｔＲＮＡと結合し、ここで、結合ドメインはｔＲＮＡ上の修飾および既知の配列と結合する。

本明細書に記載の核酸結合分子は、１以上の結合ドメインを含み、結合ドメインはＤＮＡまたはＲＮＡの非古典的特徴に特異的に結合する。本明細書に記載される結合ドメインは、標的核酸の非古典的特徴を認識して結合できるタンパク質、核酸、またはそのフラグメントもしくは誘導体である。例えば、いくつかの態様において、結合ドメインは、抗体、アプタマー、リーダータンパク質、ライタータンパク質、イレイサータンパク質、人工高分子スキャフォールド、人工タンパク質スキャフォールド、または選択的共有結合キャプチャー試薬、またはそれらのフラグメントもしくは誘導体を含む。いくつかの態様において、結合ドメインは、ＩｇＧ抗体、抗原結合フラグメント（Ｆａｂ）、一本鎖可変フラグメント（ｓｃＦｖ）、または重鎖もしくは軽鎖単一ドメイン（Ｖ_ＨおよびＶ_Ｌ）を含む。いくつかの態様において、結合ドメインは、重鎖抗体（ｈｃＡｂ）またはｈｃＡｂのＶ_ＨＨドメイン（ナノボディ）を含む。いくつかの態様において、結合ドメインは、アデクチン、アフィボディ、アフィリン、アンチカリン、アトリマー、アビマー、二環式ペプチド、センチリン、シスノット、ダーピン、フィノマー、クニッツドメイン、オボディまたはプロネクチンなどの人工タンパク質スキャフォールドを含む。

ＩｇＧ抗体は免疫グロブリンの主なアイソタイプである。ＩｇＧは２本の同一の重鎖および２本の同一の軽鎖を含み、共有結合でジスルフィド結合を介して安定化されている。ＩｇＧは、重鎖（Ｖ_Ｈ）および軽鎖（Ｖ_Ｌ）の可変Ｎ末端ドメインおよび６つの相補性決定領域（ＣＤＲ）を介して抗原を認識する。いくつかの修飾ＤＮＡおよびＲＮＡ塩基に結合する抗体は市販されている。例えば、Active MotifおよびSigma社など、いくつかのものがｈｍ^５Cに特異的な抗体を販売している。ユーロジェンテック社。(Belgium)はm⁵Cに結合するモノクローナル抗体を販売している。Megabase Research Products社(米国)は、m⁵C 6-メチルアデノシンおよび7-メチルグアノシンに結合するウサギのポリクローナル血清を販売している。Abcam社(米国)は、RNA修飾m6 A、ac4 C、m1 A、m2,2 G、m4 C、m2 A、m6,6 Aおよびm8 Aに対する組み換え抗体を販売している。

修飾塩基に結合する抗体もまた、当業者に公知の方法に従って開発できる。いくつかの態様では、抗体はモノクローナル抗体、ポリクローナル抗体、またはそれらの機能的フラグメントもしくは変異体である。本明細書で用いる用語“抗体”と語は、必要な特異性を有する結合ドメインを有するあらゆる特異的結合物質を対象とする。したがって、この用語は、天然か合成か、モノクローナルかポリクローナルかを問わず、免疫グロブリン結合ドメインを含むあらゆるポリペプチドを含む、抗体フラグメント、誘導体、機能的等価物、抗体のホモログをカバーする。免疫グロブリン結合ドメイン、またはそれと同等のものと他のポリペプチドとの融合体からなるキメラ分子も含まれる。

いくつかの態様では、結合ドメインはナノボディを含んでいてもよい。ナノボディは、ラクダ類およびいくつかの軟骨魚類が産生するように、重鎖抗体の単一の可変ドメイン（Ｖ_ＨＨ）を含む。Ｖ_ＨＨドメインは、ＩｇＧ抗体のＣＤＲに比べて拡大された３つのＣＤＲからなり、ＩｇＧと同程度の大きさ（すなわち、約８００Å２）の抗原相互作用表面を提供する。ナノボディは、ＩｇＧ抗体と同様の親和性で抗原と結合するが、それに対していくつかの利点がある：小さい（１５ｋＤａ）、ジスルフィド結合が少ないため還元環境に弱い、より可溶性である、翻訳後グリコシル化がない。ナノボディは細菌発現系で生産できるため、ファージおよびその他のディスプレイ技術によって親和性および特異性を成熟させることができる。その他の利点としては、熱安定性および溶解性の向上、部位特異的標識への容易なアプローチが挙げられる。ナノボディはサイズが小さいため、凸状のパラトープを形成でき、アクセスしにくい抗原との結合に適している。ナノボディを産生するための例示的な方法には、それぞれの動物（例えば、ラクダ）を目的の抗原で免疫すること、既存のナイーブライブラリーをさらに進化させること、またはそれらの組み合わせが含まれる。

いくつかの態様では、結合ドメインは、リーダータンパク質、ライタータンパク質、またはイレイサータンパク質を含む。“リーダータンパク質”とは、ＤＮＡまたはＲＮＡ上の特定の化学修飾を選択的に認識して結合するタンパク質である。“ライタータンパク質”とは、ＤＮＡまたはＲＮＡに特定の化学修飾を加えるタンパク質である。“イレイサータンパク質”とは、ＤＮＡまたはＲＮＡから特定の化学修飾を取り除く酵素である。いくつかの態様では、結合ドメインは、リーダータンパク質、ライタータンパク質、またはイレイサータンパク質のフラグメントまたは誘導体を含む。いくつかの態様では、結合ドメインは、核酸結合を保持するが酵素活性を欠くように操作された形態などの、リーダー、ライター、またはイレイサータンパク質の操作された形態を含む。本明細書に記載の結合ドメインに用いられ得る、例示的なリーダータンパク質、ライタータンパク質、イレイサータンパク質を表１および表２に示す。その他のリーダータンパク質、ライタータンパク質、イレイサータンパク質は、以下のワールド・ワイド・ウェブ・アドレスに掲載されている:rnawre.bio2db.com。

凡例：Ｗ：ライター、Ｅ：イレーサー、Ｒ：リーダー、ＴＳ：腫瘍抑制因子、Ｏｎｃ：癌遺伝子。
RNA修飾：ｍ１Ａ：１－メチルアデノシン、ｍｓ２ｉ６Ａ：２－メチルチオ－Ｎ６－イソペンテニルアデノシン，ｉ６Ａ：Ｎ６－イソペンテニルアデノシン，ｍ６Ａ：Ｎ６－メチルアデノシン，ｍ３Ｃ：３－メチルシトシン、ｍ５Ｃ：５－メチルシトシン、ａｃ４Ｃ：Ｎ４－アセチルシトシン、ｍ７Ｇｐｐ（ｐＮ）：７－メチルグアノシンキャップ、ｍ７Ｇ：７－メチルグアノシン内部、ｍ２，２Ｇ：Ｎ２，Ｎ２，－ジメチルグアノシン、ｍ２Ｇ：Ｎ２－メチルグアノシン、Ｑ：ケウオシン、ｙＷｅｔａｌ：ウィブトシンおよび誘導体、ｍ５Ｕ：５－メチルウリジン、ｎｃｍ５Ｕ：５－カルバモイル－メチルウリジン、ｍｃｍ５Ｕ：５－メトキシカルボニル－メチルウリジン、ｍｃｍ５ｓ２Ｕ：５－メトキシカルボニルメチル－２－チオウリジン、Ｄ．ジヒドロウリジン、Ψ：シュードウリジン、Ｎｍ：２’－Ｏ－メチルヌクレオチド、ｍ（ｐＮ）：５’リン酸モノメチル化、Ａ－ｔｏ－Ｉ：アデノシンの脱アミノ化、Ｃ－ｔｏ－Ｕ：シトシンの脱アミノ化。RNA修飾酵素：ＡＤＡＲ１－３：アデノシンデアミナーゼＲＮＡ特異的1-3、ＡＬＫＢＨ１／３／５／８：ＡｌｋＢホモログ１／３／５／８，ＡＰＯＢＥＣ１／３Ｇ：アポリポタンパク質ＢｍＲＮＡ編集触媒サブユニット１／３Ｇ，ＢＣＤＩＮ３Ｄ：ＢＣＤＩＮ３ドメイン含有ＲＮＡメチルトランスフェラーゼ，ＢＵＤ２３：ＲＲＮＡメチルトランスフェラーゼおよびリボソーム成熟因子，ＣＤＫ５ＲＡＰ１：ＣＤＫ５調節サブユニット関連タンパク質１，ＣＭＴＲ１／２：キャップメチルトランスフェラーゼ１／２，ＣＴＵ１／２：細胞質チオウリジラーゼサブユニット１／２，ＤＫＣ１：ジスケリンシュードウリジンシンターゼ１，ＤＮＭＴ２：ｔＲＮＡアスパラギン酸メチルトランスフェラーゼ１，ＤＵＳ２：ジヒドロウリジンシンターゼ２，ＥＬＰ３：エロンゲーターアセチルトランスフェラーゼ複合体サブユニット３，ＦＴＯ：ＦＴＯα－ケトグルタル酸依存性ジオキシゲナーゼ、ＨＥＮＭＴ１：ＨＥＮメチルトランスフェラーゼ１、ＭＥＴＴＬ１／２／３／６／８／１４／１６：メチルトランスフェラーゼライク－１／２／３／６／８／１６、ＮＡＴ１０：Ｎ－アセチルトランスフェラーゼ１０、ＮＳＵＮ１－５：ＮＯＰ２／ＳｕｎＲＮＡメチルトランスフェラーゼ１－５，ＮＵＤＴ１６：Ｎｕｄｉｘヒドロラーゼ１６，ＲＮＭＴ：ＲＮＡグアノシン－７メチルトランスフェラーゼ，ＴＧＴ：ＱｕｅｕｉｎｅＴＲＮＡ－リボシルトランスフェラーゼ触媒サブユニット１，ＴＲＩＴ１：ｔＲＮＡイソペンテニル転移酵素１、ＴＲＭＴ１／２Ａ／２Ｂ１／５／６／１０Ｃ／１１／６１Ａ／６１Ｂ／１１２：ｔＲＮＡメチルトランスフェラーゼサブユニット、ＴＹＷ２：ｔＲＮＡ－ＹＷ合成タンパク質２ホモログ。

いくつかの態様では、結合ドメインはリーダータンパク質を含む。いくつかの態様において、結合ドメインは、は、ＮＵＤＴおよび予備ＹＴＨＤから選択されるリーダータンパク質を含む。ＮＵＤＴはＵ８ｓｎｏＲＮＡデキャッピング酵素である（例えば、Uniprotアクセッション番号Q96DE0を参照)。ＹＴＨＤＣ２は３’－５’ＲＮＡヘリカーゼである（例えば、Uniprotアクセッション番号Q9H6S0を参照)。いくつかの態様において、結合ドメインは、ＮＵＤＴ１６またはＹＴＨＤＣ２のフラグメントまたは誘導体を含む。

いくつかの態様では、結合ドメインはライタータンパク質を含む。いくつかの態様において、結合ドメインは、ＤＮＴＭ１、ＤＮＴＭ３Ａ／Ｂ、ＮＡＴ１０、ＭＥＴＴＬ３、ＭＥＴＴＬ８、ＭＥＴＴＬ１５、ＴＲＭ、ＢＭＴ、ＤＵＳ２、ＰＵＳ、およびＮＳＵＮ２から選択されるライタータンパク質を含む。ＤＮＭＴ１およびＤＮＴＭ３Ａ／ＢはＤＮＡ（シトシン－５）メチルトランスフェラーゼである。ＮＡＴ１０はＲＮＡシチジンアセチルトランスフェラーゼである（例えば、Uniprotアクセッション番号Q9H0A0を参照)。ＭＥＴＴＬ３は、Ｎ６－アデノシン-メチルトラスフェラーゼ触媒サブユニットである（例えば、Uniprotアクセッション番号Q86U44を参照）。ＮＳＵＮ２はＲＮＡシトシンＣ（５）－メチルトランスフェラーゼである（例えば、Uniprotアクセッション番号Q08J23を参照）。いくつかの態様において、結合ドメインは、ＮＡＴ１０、ＭＥＴＴＬ３、またはＮＳＵＮ２のフラグメントまたは誘導体であるライタータンパク質を含む。

いくつかの態様では、結合ドメインはイレイサータンパク質を含む。いくつかの態様において、結合ドメインは、ＦＴＯ、ＡＬＫＢＨ３、およびＡＬＫＢＨ５から選択される操作されたイレイサータンパク質を含む。ＦＴＯはα-ケトグルタル酸依存性ジオキシゲナーゼである（例えば、Uniprotアクセッション番号Q9C0B1を参照）。ＡＬＫＢＨ３は、α-ケトグルタル酸依存性ジオキシゲナーゼａｌｋＢホモログ３である（例えば、Uniprotアクセッション番号Q96Q83を参照）。ＡＬＫＢＨ５はＲＮＡ脱メチル化酵素である(例えば、Uniprotアクセッション番号Q6P6C2を参照)。いくつかの態様において、結合ドメインは、ＦＴＯ、ＡＬＫＢＨ３、またはＡＬＫＢＨ５のフラグメントまたは誘導体であるライタータンパク質を含む。

結合ドメインは、ＤＮＡまたはＲＮＡの非古典的特徴に結合するように選択および／または操作され得る。例えば、非古典的特徴は、修飾された塩基、ＤＮＡ損傷、修飾された骨格、または構造的要素である。いくつかの態様では、結合ドメインは２以上の非古典的能に結合し得る。いくつかの態様では、結合ドメインは同じ結合モチーフを有する変異ファミリーと結合する。例えば、いくつかの態様では、結合ドメインは、５－メチルシチジン（５ｍＣ）およびその酸化生成物である５－ヒドロキシメチルシチジン（５ｈｍＣ）、５－ホルミルシチジン（５ｆＣ）と結合する。

いくつかの態様では、結合ドメインは修飾塩基および／またはヌクレオシドに結合する。いくつかの態様において、結合ドメインは、少なくとも１つ、少なくとも２つ、または少なくとも３つの修飾ヌクレオシドと接触する。いくつかの態様において、結合ドメインは、少なくとも１つの修飾ヌクレオシドと接触する。いくつかの態様において、結合ドメインは、少なくとも１つの修飾ヌクレオシドおよびそれに隣接する１以上のヌクレオチドと接触する。ヒトおよび他の生物で生じ得る例示的な修飾ヌクレオシドを表３Ａに示す。ヒトにおいて発現することが知られている修飾ヌクレオシドを表３Ｂに示す。その他の修飾塩基およびヌクレオシドは、genesilico.pl/modomics/modificationsのワールドワイドウェブアドレスに掲載されている。

*当業者には理解されるであろうが、一般的にはＲＮＡ中に存在する修飾塩基／ヌクレオシドがＤＮＡ中に存在することがあり、一般的にはＤＮＡ中に存在する修飾塩基／ヌクレオシドがＲＮＡ中に存在することがある。

いくつかの態様において、結合ドメインは、以下の修飾ヌクレオシドの１以上に結合する：３－メチルシチジン（ｍ３Ｃ）、５－メチルシチジン（ｍ５Ｃ）、Ｎ^４－アセチルシチジン（ａｃ４Ｃ）、シュードウリジン（Ψ）、１－メチルアデノシン（ｍ１Ａ）、Ｎ^６－メチルアデノシン（ｍ６Ａ）、イノシン（Ｉ）、７－メチルグアノシン（ｍ７Ｇ）、ジヒドロウリジン（Ｄ）、３－メチルウリジン（ｍ３Ｕ）、５－メチルウリジン（ｍ５Ｕ）、１－メチルグアノシン（ｍ１Ｇ）、Ｎ^２－メチルグアノシン（ｍ２Ｇ）、５－メチルデオキシシチジン（ｍ５ｄＣ）、Ｎ^４－メチルデオキシシチジン、５－ヒドロキシメチルシチジン（５－ｈｍＣ）、５－ヒドロキシメチルデオキシシチジン（５ｈｍｄＣ）、５－カルボキシデオキシシチジン（５ｃａｄＣ）、５－ホルミルシチジン（５ｆＣ）、５－ホルミルデオキシシチジン（５ｆｄＣ）、６－メチルデオキシアデノシン、Ｎ^７－メチルグアノシン（ｍ７Ｇ）、２，７，２’－メチルグアノシン、またはリボースメチル化（Ｎｍ）。

いくつかの態様において、非古典的特徴は、以下である：３－メチルシチジン（ｍ３Ｃ）、５－メチルシチジン（ｍ５Ｃ）、Ｎ^４－アセチルシチジン（ａｃ４Ｃ）、シュードウリジン（Ψ）、１－メチルアデノシン（ｍ１Ａ）、Ｎ^６－メチルアデノシン（ｍ６Ａ）、イノシン（Ｉ）、７－メチルグアノシン（ｍ７Ｇ）、ジヒドロウリジン（Ｄ）、３－メチルウリジン（ｍ３Ｕ）、５－メチルウリジン（ｍ５Ｕ）、１－メチルグアノシン（ｍ１Ｇ）、Ｎ^２－メチルグアノシン（ｍ２Ｇ）、５－メチルデオキシシチジン（ｍ５ｄＣ）、Ｎ^４－メチルデオキシシチジン、５－ヒドロキシメチルシチジン（５－ｈｍＣ）、５－ヒドロキシメチルデオキシシチジン（５ｈｍｄＣ）、５－カルボキシデオキシシチジン（５ｃａｄＣ）、５－ホルミルシチジン（５ｆＣ）、５－ホルミルデオキシシチジン（５ｆｄＣ）、６－メチルデオキシアデノシン、Ｎ^７－メチルグアノシン（ｍ７Ｇ）、２，７，２ ’－メチルグアノシン、またはリボースメチル化（Ｎｍ）。

いくつかの態様において、結合ドメインは、天然に生じる酸化的もしくは紫外線誘発性損傷、または外因性薬剤による大きな付加体形成もしくは塩基アルキル化に起因する核酸損傷に結合する。いくつかの態様において、核酸損傷は、該損傷が、８－オキソグアニン（８－ｏｘｏＧ）、１以上の脱塩基部位、シス－プラチン架橋、ベンゾ（ａ）ピレンジオールエポキシド（ＢＰＤＥ）付加物、シクロブテンピリミジン二量体（ＣＰＤ）、ピリミジン－ピリミドン（６－４）光生成物（６－４ＰＰ）、６－Ｏ－メチルグアニン（Ｏ^６－ＭｅｄＧ）、またはＯ６－（カルボキシメチル）－２’－デオキシグアノシン（Ｏ６－ＣＭｄＧ）である。いくつかの態様において、非古典的特徴は、天然に生じる酸化的もしくは紫外線誘発性損傷、または外因性薬剤による大きな付加体形成もしくは塩基アルキル化に起因する核酸損傷である。いくつかの態様において、核酸損傷は、該損傷が、８－オキソグアニン（８－ｏｘｏＧ）、１つ以上の脱塩基部位、シス－プラチン架橋、ベンゾ（ａ）ピレンジオールエポキシド（ＢＰＤＥ）付加物、シクロブテンピリミジン二量体（ＣＰＤ）、ピリミジン－ピリミドン（６－４）光生成物（６－４ＰＰ）、６－Ｏ－メチルグアニン（Ｏ^６－ＭｅｄＧ）、またはＯ６－（カルボキシメチル）－２’－デオキシグアノシン（Ｏ６－ＣＭｄＧ）である。

いくつかの態様では、結合ドメインは構造的要素に結合する。構造的要素は、例えばヘアピンやループであってもよい。他の例示的な構造的要素としては、Z-DNA構造、G-四重鎖、i-モチーフ、バルジ、三重鎖、三方向結合、十字形構造、四重鎖ループ、リボースジッパー、シュードノットなどが挙げられるが、これらに限定されるものではない。

核酸結合分子およびその製造方法
本発明は、結合ドメインおよびアダプターを含む核酸結合分子を提供する。本明細書に記載の核酸結合分子の例示的な構造を図１Ｄに示す。結合ドメインは、ＤＮＡまたはＲＮＡの非古典的特徴に特異的に結合する。アダプターは、結合ドメインによって特異的に結合される非古典的特徴に特有の核酸バーコード配列を含む。

いくつかの態様において、本明細書に記載の核酸結合分子は、１以上の付加的な特徴をさらに含み得る。例えば、いくつかの態様では、結合ドメインおよびアダプターを含む核酸結合分子は、酵素またはその触媒フラグメントをさらに含んでいてもよい。いくつかの態様では、結合ドメインおよびアダプターを含む核酸結合分子は、触媒活性を欠く酵素（またはそのフラグメント）をさらに含み得る。いくつかの態様において、酵素はＤＮＡＮ－グリコシラーゼもしくはＲＮＡＮ－グリコシラーゼ、またはそれらの触媒フラグメントもしくは変異体である。これらの酵素は、逆転写を停止させる脱塩基部位を作り出す。

いくつかの態様では、核酸結合分子は塩基編集酵素を含んでいてもよい。いくつかの態様では、酵素はＤＮＡメチラーゼ、ＲＮＡメチラーゼ、またはシュードウリジン合成酵素である。塩基編集酵素は、例えば、ＡＰＯＢＥＣファミリーのシチジンデアミナーゼ、ＡＤＡＲファミリーのアデノシンデアミナーゼ、またはそれらの触媒フラグメントもしくは変異体であってもよい。いくつかの態様では、塩基編集酵素はＡＰＯＢＥＣ１である。いくつかの態様において、ベースとなる編集酵素はＡＰＯＢＥＣ３Ａである。いくつかの態様において、シチジンデアミナーゼは、デアミナーゼの溶解性を高めるためにマルトース結合ドメインを含む。いくつかの態様において、シチジンデアミナーゼは、デアミナーゼの溶解性を高めるためにスパイキャッチャー（SpyCatcher）ペプチドを含む。いくつかの態様において、シチジンデアミナーゼは、デアミナーゼの溶解性を高めるために、マルトース結合ドメインおよびスパイキャッチャーペプチドを含む。いくつかの態様において、核酸結合分子はトランスポザーゼを含んでいてもよい。トランスポザーゼは、例えば、ＤＤＥトランスポザーゼ、チロシン（Ｙ）トランスポザーゼ、セリン（Ｓ）トランスポザーゼ、Ｙ２トランスポザーゼまたはＹ１トランスポザーゼであってもよい。いくつかの態様において、トランスポザーゼはＴｎ５トランスポザーゼ、またはそのフラグメントもしくは誘導体である。いくつかの態様において、トランスポザーゼはSleeping Beautyトランスポザーゼ、またはそのフラグメントもしくは誘導体である。いくつかの態様では、核酸結合分子は、ＨＩＶインテグラーゼなどのインテグラーゼを含んでいてもよい。

本明細書に記載の核酸結合分子は、ＲＮＡと特異的に結合することもあれば、ＤＮＡと特異的に結合することもある。いくつかの態様では、核酸結合分子はＲＮＡおよびＤＮＡの両方に結合できる。いくつかの態様では、核酸結合分子は、図１Ａに示す修飾ヌクレオシドのような、１以上の非古典的特徴を有する二本鎖核酸に特異的に結合できる。いくつかの態様では、核酸結合分子は、図１Ｂに示す修飾ヌクレオシド、または図１Ｃに示す構造的特徴のような、１以上の非古典的特徴を有する一本鎖核酸に特異的に結合できる。

いくつかの態様では、核酸結合分子が標的核酸の非古典的特徴に結合することで、ＤＮＡアダプターが標的核酸の５’または３’末端に近接して配置される。例えば、図１Ｅは、二本鎖標的核酸上の修飾ヌクレオシドへの核酸結合分子の結合を描いており、これにより二本鎖バーコードが標的核酸の３’末端に近接して配置される。図１Ｆは、一本鎖標的核酸上の修飾ヌクレオシドへの核酸結合分子の結合を描いており、これにより標的核酸の３’末端に近接して一本鎖バーコードが配置される。図１Ｇは、核酸結合分子が標的核酸の構造的特徴に結合し、バーコードをその３’末端に近接させる様子を示す。

核酸結合分子は、標準的な分子生物学的および／または化学的技術を用いて作製できる。例えば、いくつかの態様では、結合ドメインはアダプターに結合され、結合ドメイン－アダプター結合体を形成する。いくつかの態様では、ＤＮＡアダプターはリンカーを含み、結合ドメインはリンカーを介してアダプターに結合される。カップリング工程は、いくつかの態様において、共有結合的であっても非共有結合的であってもよい。

アダプター（例えば、リンカーを含むアダプター）は、いくつかの異なる方法を用いて結合ドメインに結合させることができる。いくつかの態様では、アダプターは、ランダムなタグ付けによって結合ドメインに共有結合できる。例えば、アダプター上のＮＨＳで活性化された残基は、結合ドメインの表面に露出したタンパク質リジン残基の１以上のアミン基と反応し得る。同様に、マレイミドで活性化されたアダプターは、結合ドメインの天然または人工のシステインと反応し得る。当業者には理解されるように、結合ドメインに連結されるアダプターの数は、それぞれ反応性リジン残基またはシステイン残基の数、および反応条件の選択によって変化し得る。

部位選択的カップリング法も使用できる。部位特異的カップリングは、結合ドメインの機能への影響を回避し、再現性のある材料製造を可能にする。結合ドメインの部位選択的な内部タグ付けは、アミノアシルｔＲＮＡ合成酵素／ｔＲＮＡ対を操作した細胞株を用いて、非天然アミノ酸を遺伝子的に組み込むことで達成できる。組み込まれた非天然アミノ酸は、生体直交型反応を起こし得る部位を示す。一般的に用いられるのは、銅触媒によるアジドアルキン環化付加反応（ＣｕＡＡＣ）、光活性化１，３－双極性環化付加反応、歪み促進アジドアルキン環化付加反応（ＳＰＡＡＣ）、または逆電子要求型ディールス・アルダー環化付加反応（ＩＥＤＤＡ）を起こしうる部位を有するアミノ酸である。結合ドメインのＣ末端またはＮ末端タグ付けのための例示的で汎用性のある方法は、タンパク質タグまたはペプチドタグの使用を含む。ＳＮＡＰ－ｔａｇ、Ｈａｌｏ－ｔａｇ、Ｓｐｙ－ｔａｇ、Ｓｎｏｏｐ－ｔａｇ、Ｉｓｏｐｅｐｔａｇ、Ｄｏｇ－ｔａｇ、Ｓｄｙ－ｔａｇ、Ｃｌｉｐ－ｔａｇなどのタンパク質タグは、結合ドメインを発現する遺伝子にクローニングすることで、結合ドメインをタンパク質タグ融合タンパク質として発現させることができる小さなタンパク質またはペプチドである。このようなタンパク質タグは、特定のペプチドまたは基質との共有結合形成を自己触媒し得る。例えば、スパイキャッチャーは１１３残基のタンパク質で、あらゆるＤＮＡ配列に容易に結合できる１３残基のペプチドSpyTagを認識する。いくつかの態様では、スパイキャッチャーは配列番号１２を含む。いくつかの態様において、SpyTagは配列番号１０を含む。結合ドメインの分子量によっては、より小さなペプチドタグが好ましい場合もある。ペプチドタグは通常１０－１２アミノ酸長で、酵素を介したカップリング反応で作用する。いくつかの態様において、Ｃ末端へのタグのためのペプチドは、配列番号１１（ＬＣｘＰｘＲ、ｘは何れかのアミノ酸である）を含む。結合ドメインおよびアダプターを結合させるための酵素を介する反応の例としては、（ａ）ＡＰ－ペプチド標識結合およびビオチン－ＤＮＡを連結するためのビオチン－リガーゼの使用（例えば、ビオチンリンカー）、（ｂ）ＬＡＰ－ペプチド標識結合ドメインおよびリポ酸－ＤＮＡを連結するためのリポ酸リガーゼの使用（例えば、リポ酸リンカー）、（ｃ）Ｔｕｂ－ｔａｇ標識結合ドメインおよびチロシン修飾ＤＮＡを連結するためのチューブリンチロシンリガーゼの使用（例えば、チロシン修飾リンカー）、（ｄ）ＬＰｘＴＧペプチドおよびグリシン修飾ＤＮＡと反応するソルターゼ－Ａの使用（例えば、グリシン修飾リンカー）などが挙げられるが、これらに限定されない。さらに、一群の金属イオン認識タグおよび低分子結合モチーフを用いることもできる。ペプチドタグ付けのもう一つの方法は、内因性の細胞機構をリダイレクトして、組換えタンパク質にアルデヒドを導入することである。この方法は、保存された１３残基のコンセンサス配列内でシステインをホルミルグリシン（ＦＧｌｙ）に共翻訳的に変換するホルミルグリシン生成酵素（ＦＧＥ）を利用する。得られたアルデヒドタグは、ＤＮＡに結合する反応性アミンで容易に修飾できる。

いくつかの態様では、アダプターは生体直交型化学反応を介して結合ドメインに結合される。いくつかの態様では、結合ドメインは、バーコードの結合を促進するＤＮＡオリゴヌクレオチドを含む。ＤＮＡオリゴヌクレオチドは、アミノ、アジド、ビオチン、アルキンで修飾されたものが容易に市販されている。アルキンおよびアジドオリゴは、銅触媒を用いたアジド－アルキン環化付加反応、またはストレインプロモートを用いたアジド－アルキン環化付加反応において、非天然アミノ酸と結合させることができる。アミノオリゴヌクレオチドはホルミルグリシンと反応し、ホルミルグリシン生成酵素（ＦＧＥ）によって１３ａａの保存配列内の結合ドメインに導入される。

本明細書に記載の核酸結合分子が標的核酸に結合すると、複合体が形成される。いくつかの態様において、複合体の核酸結合分子は、標的核酸に共有結合していてもよい。例えば、核酸結合分子は標的核酸と化学的および／または光化学的に結合していてもよい。

アダプター／バーコード転送反応
本明細書に記載の核酸結合分子は、バーコードを含むアダプターのような、アダプターを標的核酸にトランスファーさせるために使用できる。したがって、いくつかの態様では、本明細書に記載の核酸結合分子は、標的核酸にバーコードをトランスファーするために使用され得る。バーコードは、ＭＢＣ、すなわち、核酸結合分子の結合ドメインによって特異的に結合される非古典的機能に固有のバーコードであってもよい。アダプターが導入された標的核酸は、本明細書では“標識標的核酸”、“標識標的”または類似の用語で呼ばれる。バーコードが転写された標的核酸は、本明細書では“バーコード化標的核酸”、“バーコード化標的”または類似の用語で呼ばれる。アダプターが標的核酸に転移される反応を、本明細書では“アダプター転移反応”と呼ぶ。同様に、バーコードが標的核酸にトランスファーされる反応を、本明細書では“バーコード転移反応”と呼ぶ。

アダプター／バーコードトランスファーの目的は、アダプター／バーコードを標的核酸分子に共有結合させることである。例えば、いくつかの態様では、バーコードを標的核酸の５’末端または３’末端に共有結合させることにより、バーコードを標的核酸にトランスファーする。いくつかの態様において、バーコードは、バーコードまたはその相補体を標的核酸の５’末端または３’末端に共有結合させることによって標的核酸にトランスファーされる。標識／バーコード化された核酸分子は、いくつかの態様では、下流の工程で配列決定されることがある。いくつかの態様では、標識標的核酸のコピーを配列決定できる。図３Ａ－３Ｅはアダプター／バーコード転移反応の例を示す。

アダプター転移に用いられる酵素はＤＮＡおよびＲＮＡの標的核酸で異なり、アダプターの構造によって変わる。標的ＤＮＡへのアダプター／バーコードの導入は、Ｔ４ＤＮＡリガーゼ、CircLigase、Klenowフラグメント、ＢｓｕＤＮＡポリメラーゼなどの１以上の酵素を用いて行うことができる。標的ＲＮＡへのアダプター／バーコードの導入は、例えばＴ４ＲＮＡリガーゼ、Ｔ４ＲＮＡリガーゼ２、ＲｔｃＢリガーゼなどを用いて行うことができる。例えば、図３Ａは、一本鎖ＤＮＡアダプター（例えば、バーコードを含む、またはバーコードを含むアダプター）と一本鎖標的核酸とのライゲーションを示している。標的核酸がＲＮＡであるいくつかの態様では、アダプターは５’リン酸を含み、Ｔ４ＲＮＡリガーゼによって触媒される。あるいは、アダプターを５’－プレアデニル化し、Ｔ４ＲＮＡリガーゼ２によってトランスファーさせ、ＡＴＰの必要性をなくし、反応を１回のターンオーバーに制限することもできる。あるいは、リン酸化されていないアダプターを用いてもよく、ＲｔｃＢリガーゼを用いて３’－リン酸化ＲＮＡにトランスファーさせてもよい。標的核酸がＤＮＡであるいくつかの態様では、アダプター／バーコードはCircLigaseによって触媒される反応でトランスファーされ得る。

スプリント（splint）ライゲーションは、アダプター／バーコードを標的核酸に導入するためにも使用できる。スプリントライゲーションでは、架橋するＤＮＡまたはＲＮＡオリゴヌクレオチドを用いて２つの核酸を結合させる。例えば、２つのＲＮＡ（例えば、標的ＲＮＡおよびアダプター／バーコード）のスプリントライゲーションは、Ｔ４リガーゼと、ＲＮＡに相補的な橋渡しRNAオリゴヌクレオチドを用いて行うことができる。例えば、図３Ｂに示すスプリント核酸構築物は、スプリントライゲーションを用いて作成できる。SplintRリガーゼは、ＲＮＡの３’末端を５’ｐＤＮＡに接続するために使用される。標的分子がＤＮＡのとき、Ｔ４ＤＮＡリガーゼ、Ｔ３ＤＮＡリガーゼ、Ｔ７ＤＮＡリガーゼ、大腸菌ＤＮＡリガーゼなどの酵素を用いて、スプリントＤＮＡライゲーションを行うことができる。

スプリント伸長およびプライマー伸長は、アダプター／バーコードの標的核酸への導入に使用できる他の方法である。“スプリント”とは、ライゲーションジャンクションにまたがる配列のことである。プライマーが用いられるとき、プライマーは一般的に、ライゲーションジャンクションをまたがない。図３Ｃは、スプリント伸長によるアダプタートランスファーを示しており、アダプター配列をスプリントとして用いて、標的核酸分子の配列のコピーが作られる。標的核酸分子がＲＮＡのとき、この反応はトリ骨髄芽球症ウイルス（Avian Myeloblastosis Virus (AMV)）リバーストランスクリプターゼおよびモロニ－マウス白血病ウイルス（M-MuLV、MMLV）のような逆転写酵素により、ＤＮＡアダプターの３’末端が完全または部分的に一致したものによって触媒される。したがって、スプリントの３’末端には、ランダム塩基または乱雑に（promiscuously）塩基対を形成する合成ユニバーサル塩基が含まれ得る。標的分子がＤＮＡであるとき、プライマーは、３’→５’エキソヌクレアーゼ活性を有するか有しないかに関わらず、何れかの適切なＤＮＡポリメラーゼによって伸長され得る。

いくつかの態様では、アダプター／バーコードを標的核酸にトランスファーするために、テンプレート伸長を用い得る。図３Ｄはプライマー伸長による直接アダプタートランスファーを示し、アダプターは結合したアダプターのコピーを鋳型として標的核酸にポリメラーゼによってコピーされる。いくつかの態様では、ポリメラーゼは短いスペーサー配列を可能にする温度で働き、３’から５’へのエキソヌクレアーゼ活性および３’テイリング活性を有さない。ＤＮＡアダプター／バーコードの場合、この反応はＤＮＡポリメラーゼ、例えばクレノウ（Klenow）フラグメント、Ｔ７、Ｔ４またはＢｓｕＤＮＡポリメラーゼによって触媒される。図３Ｄは、マルチサイクルのエンコーディングプロセスの一部として実行することも、シングルサイクルとして実行することもできる。いくつかの態様では、生成されたバーコード化核酸は、最終工程としてユニバーサルプライマーでキャップされる。ユニバーサルプライマーは逆転写の開始部位となる。いくつかの態様において、逆転写プライマーは、配列番号８を含む。

さらに、二本鎖ライゲーションも、アダプター／バーコードを標的核酸にトランスファーさせるために用い得る。例えば、図３Ｅは、アダプター／バーコードトランスファーのための二本鎖ライゲーションを示す。いくつかの態様では、標的核酸分子は二本鎖ＤＮＡ、またはＲＮＡ／ＤＮＡハイブリッドであってもよく、平滑末端または粘着末端のいずれかを有していてもよい。二本鎖ＤＮＡの平滑末端および粘着末端のライゲーションは、Ｔ４、Ｔ３、Ｔ７または大腸菌リガーゼによって触媒される。

いくつかの態様では、アダプター／バーコードを標的核酸に導入するために、化学的ライゲーションが用いられ得る。

空間的分離による複合体内アダプター／バーコードトランスファーの促進方法
アダプター／バーコードの複合体内トランスファーは、反応に関与する分子を空間的に分離することで促進され得る。具体的には、核酸結合分子が、それが結合している標的核酸としか相互作用できないように、核酸結合分子、標的核酸、および／または標的核酸に結合した核酸結合分子を含む複合体を分離することによって、トランスファーを促進できる。

バーコードトランスファーは、空間的な分離が可能ないくつかの異なる環境で行われることがある。空間的分離は、例えば、溶液中で標的核酸に結合した核酸結合分子を含む複合体を高希釈することによって達成できる。溶液は、そこに存在する標的核酸に結合した核酸結合分子を含む複合体を空間的に分離できるように、十分に希釈されていなければならない。このような空間的分離は、複合体内のバーコードトランスファーを促進し、核酸結合分子複合体間のバーコードトランスファーを実質的に防止する。いくつかの態様において、希釈溶液中の複合体の濃度は、１０ｎＭ未満、１ｎＭ未満、０.１ｎＭ未満、０．０１ｎＭ未満、または０．００１ｎＭ未満である。

いくつかの態様では、空間的分離は表面固定化によって達成できる。例えば、本明細書に記載の核酸結合分子は、基質と結合させることによって固定化できる。各基質は、１種の核酸結合分子のみを含んでいてもよいし（図５Ａ）、少なくとも２種、少なくとも３種、少なくとも４種、少なくとも５種、またはそれ以上の種類の核酸結合分子を含んでいてもよい（図５Ｂ）。核酸結合分子のそれぞれの“タイプ”は、異なる非古典的特徴に結合し、かつ／または異なるバーコードを構成する。いくつかの態様において、第１の核酸結合分子は、基質の表面上で第２の核酸結合分子から空間的に分離されている。表面結合能および形式は、標的分子および修飾の絶対的または相対的定量を可能にするように調整できる。

核酸結合分子が結合され得る例示的な基質としては、例えば、ビーズ、チップ、プレート、スライド、皿、または三次元マトリックスが挙げられる。いくつかの態様では、基質は、樹脂、膜、繊維、ポリマーである。いくつかの態様において、基質は、セファロース、アガロース、セルロース、ポリスチレン、ポリメタクリレート、および／またはポリアクリルアミドを含むビーズなどのビーズである。いくつかの態様では、支持体は磁気ビーズである。いくつかの態様では、支持体は合成ポリマーなどのポリマーである。合成ポリマーの限定されないリストには、ポリスチレン、ポリ(エチレン)グリコール、ポリイソシアノペプチドポリマー、ポリ乳酸－コ－グリコール酸、ポリ（ε－カプロラクトン）（ＰＣＬ）、ポリ乳酸、ポリ（３－ヒドロキシ酪酸－コ－３－ヒドロキシバレレート）（ＰＨＢＶ）、キトサン、セルロースなどが含まれる。

核酸結合分子は、基質表面に直接結合させることができる。例えば、分子は１以上の共有結合または非共有結合によって基質に直接結合できる。基質が３Ｄマトリックスまたは他の３Ｄ構造である態様では、核酸結合分子は基質の複数の表面に結合していてもよい。

いくつかの態様では、核酸結合分子は基質の表面に間接的に結合され得る。例えば、核酸結合分子は捕捉分子を介して間接的に基質表面に結合させることができ、捕捉分子は基質に直接結合される。捕捉分子は、基質と核酸結合分子および／または標的核酸の両方に結合または連結できる核酸、タンパク質、糖、化学リンカーなどであってよい。いくつかの態様では、捕捉分子は核酸結合分子に結合する。いくつかの態様では、捕捉分子は、核酸結合分子の結合ドメインまたはアダプター（例えば、アダプターのリンカー）に結合する。いくつかの態様では、捕捉分子は標的核酸に結合する。いくつかの態様では、捕捉分子は標的核酸の配列または構造的特徴に結合する(図５Ｃ）。例えば、いくつかの態様では、捕捉分子は標的核酸のポリＡテイルまたは特定のＤＮＡもしくはＲＮＡ配列に結合できる。

いくつかの態様では、標的核酸は、反応性化学基を介して基質の表面に直接結合され得る。例えば、核酸標的をアジド基で修飾し、アルキン装飾ビーズおよびＣｕ触媒クリックケミストリーを行う。他の例は、トランス－シクロオクテン（ＴＣＯ）／メチル－テトラジン、ＤＢＣＯ／アジドである。

いくつかの態様では、各核酸結合分子が１つの標的核酸としか相互作用できないように、基質表面上で第１の核酸結合分子を第２の核酸結合分子から分離する。いくつかの態様において、第１の核酸結合分子は、第２の核酸結合分子から少なくとも５０ｎｍ離れている。例えば、第１の核酸結合分子と第２の核酸結合分子は、約５０ｎｍ～約５００ｎｍ、例えば、約５０ｎｍ～約１００ｎｍ、約１００ｎｍ～約１５０ｎｍ、約１５０ｎｍ～約２００ｎｍ、約２００ｎｍ～約２５０ｎｍ、約２５０ｎｍ～約３００ｎｍ、約３００ｎｍ～約３５０ｎｍ、約３５０ｎｍ～約４００ｎｍ、約４００ｎｍ～約４５０ｎｍ、または約４５０ｎｍ～約５００ｎｍだけ離れていてもよい。いくつかの態様では、第１および第２の核酸結合分子は約５００ｎｍ以上離れていてもよい。

一般に、核酸結合分子（または標的核酸）を基質に結合させる目的は、アダプターおよび／またはバーコードの複合体内トランスファーを確実にすることである。空間的に分離した２以上の核酸結合分子を含む基質は、当業者に公知の方法を用いて製造できる。図４Ａ－４Ｄは、核酸結合分子または標的核酸を基質に結合させ、基質上に固定化する方法の限定されない例を提供する。これらの例を以下に詳しく説明する。図５Ａ－５Ｃは、核酸結合分子または標的核酸をビーズに固定化する方法の限定されない例を示す。

核酸結合分子と基質との結合
図４Ａは、基質に直接的または間接的に結合した核酸結合分子を示す。いくつかの態様において、複数の核酸結合分子は、部位特異的化学を用いて基質上に固定化され得る。例えば、いくつかの態様では、核酸結合分子の結合ドメインは、基質上に固定化できる部位、およびＤＮＡアダプターを繋ぎとめるための部位を含んでいてもよい。結合ドメインの基質表面への結合は、結合ドメインの末端に自己触媒タンパク質タグ（例えば、スパイキャッチャー、ソルターゼＡ、ＳＮＡＰタグ、Ｈａｌｏタグ、ＣＬＩＰタグ）を融合させることによって促進される。結合ドメイン上のこれらのタンパク質タグは、基質表面上の同族反応性部位と共有結合で反応させることができる。例えば、スパイキャッチャータンパク質を結合ドメインに人工的に組み込むことができる。スパイタグはスパイタグタンパク質（１３ａａペプチド）と共有結合を形成する。スパイタグが基質表面に結合している場合、スパイキャッチャーに結合した結合ドメインおよびスパイタグの反応は、結合ドメインを基質に共有結合させる役割を果たす。同様に、結合ドメインをソルターゼＡタグと融合させ、基質表面に結合したペンタグリシンと反応させることもできる。別の例として、結合ドメインをＳＮＡＰタグと融合させ、基質表面に結合したＯ６－ベンジルグアニンと反応させることもできる。いくつかの態様では、結合ドメインはＣＬＩＰタグと融合され、基質表面に結合したＯ２－ベンジルシトシンと反応するために使用され得る。いくつかの態様では、結合ドメインは、基質表面に存在するハロゲン化アルキルと反応するために使用され得るＨａｌｏタグと融合され得る。

いくつかの態様では、結合分子はビオチン部分を含んでいてもよい。このような結合分子は、ビオチンと結合する捕捉分子（例えば、ストレプトアビジン）によって基質表面に固定化できる。

図１７Ａ－Ｂは、ナノボディサイズ（図１７Ａ）および３つの相補性決定領域（ＣＤＲ）を含む分子構造（図１７Ｂ）を示す。図１７Ｂは、チオール－マレイミド化学を介してＮ末端に部位特異的に結合したＤＮＡアダプターを示す。脱アミナーゼスパイキャッチャー融合タンパク質は、Ｃ末端スパイタグペプチドに部位特異的に結合されている。核酸結合分子の表面固定化は、アミノオキシ官能基化表面と、ホルミルグリシン生成酵素（ＦＧＥ）によって共翻訳的にホルミルグリシンに変換される内部１３ａａペプチドとの反応によって達成される。図１７Ｃは、（ｉ）抗体を含む結合ドメインをバーコード標識して核酸結合分子を形成し、（ｉｉ）核酸結合分子を基質表面に部位特異的に固定化する例を示す。この例では、ＤＮＡバーコードは、核酸結合分子を形成するために、ホルミルグリシン生成酵素（ＦＧＥ）によって共翻訳的にホルミルグリシンに変換される内部１３アミノ酸ペプチドを介して、抗体軽鎖のＣ末端ドメインに部位特異的に結合される。核酸結合分子の表面固定化は、スパイタグおよびスパイキャッチャーの反応によって達成される。スパイタグは１３ａａの短いペプチドで、抗体重鎖のＣ末端上に作製される。基質表面にはスパイキャッチャータンパク質が適切な密度で提示されている。スパイタグのＣ末端とスパイキャッチャーのＮ末端は自発的に反応し、イソペプチド結合を形成する。

標的核酸と基質との結合
図４Ｂは、捕捉分子を介して間接的に基質に結合した核酸結合分子を示す。この例では、捕捉分子は標的核酸のポリＡテイルに結合する核酸配列を含むが、標的核酸上の他のユニークな塩基配列を用いてもよい。図４Ｃは、捕捉分子を介して基質に間接的に結合した標的核酸を示し、捕捉分子は標的核酸に結合する（すなわち、標的核酸の一次配列、または二次構造に特異的である）ハイブリダイゼーションプローブである。図４Ｄは、共有結合を介して基質に直接結合した標的核酸を示す。

したがって、いくつかの態様では、基質は、標的核酸の特徴にハイブリダイズするオリゴヌクレオチド捕捉分子で装飾され得る。例えば、ｍＲＮＡは、ポリｄＴオリゴヌクレオチドまたは遺伝子特異的配列を含むキャプチャー分子へのハイブリダイゼーションによって捕捉できる。いくつかの態様では、捕捉分子は、核酸結合分子を物理的に分離するために低い表面密度で存在する。例えば、図４Ｂ、図４Ｃおよび図４Ｄに示す基質結合スキームでは、一般的に低表面密度が用いられる。標的核酸は、該標的核酸が核酸結合分子に結合する前または後に、捕捉分子にハイブリダイズできる。核酸結合分子から標的核酸へのバーコードトランスファーは、いくつかの態様では、表面結合状態（すなわち、標的核酸が基質に結合しているとき）で起こり得る。

ハイブリダイゼーションによる標的核酸捕捉用のビーズは、表面活性化ビーズに５’－アミノ修飾オリゴヌクレオチドを直接結合させることによって調製できる。表面活性化ビーズは、共有結合のためにエポキシ基、トシル基、カルボン酸基、またはアミン基を提示し得る。カルボキシビーズは通常、ペプチド結合形成を促進するためにカルボジイミドと反応させる必要があり、アミンビーズは通常、二官能性ＮＨＳ－リンカーを必要とする。いくつかの態様では、ビーズの表面は非特異的結合を防ぐために不動態化（passivated）されている。不動態化(passivation)は、いくつかの態様では、同じ連結化学を有するポリエチレングリコール（ＰＥＧ）分子を共移植することによって達成できる。例えば、５’－アミノ修飾オリゴヌクレオチドおよびアミノ末端ポリエチレングリコール（ＰＥＧ）は、平均して、ほとんどの基質部位がオリゴヌクレオチドを空間的に分離させる役割を果たすＰＥＧ分子によって占有されるように用いられる。オリゴヌクレオチドとＰＥＧ分子の比率を変えることで、捕捉分子の表面密度を調整できる。

いくつかの態様では、ビーズはｍＴｅｔ（テトラジン）およびカルボキシ－ＰＥＧで作られたセファロースビーズである。ｍＴｅｔとカルボキシＰＥＧの比率を下げると、標的核酸間の架橋が減少する。いくつかの態様において、ｍＴｅｔ：カルボキシ－ＰＥＧ比は、１：５００、１：６００、１：７００、１：８００、１：９００、１：１０００、１：１１００、１：１２００、１：１３００、１：１４００、１：５００、１：１０００、１：２０００、１：３０００、１：４０００、１：５０００、１：６０００、１：７０００、１：８０００、１：９０００、または１：１００００である。いくつかの態様において、ｍＴｅｔ：カルボキシ－ＰＥＧ比は１：１０００である。

結合ドメイン－酵素コンジュゲート
本発明はまた、酵素またはそのフラグメントに結合した結合ドメインを含むコンジュゲートも提供する。酵素またはそのフラグメントは、触媒的に活性であっても触媒的に不活性であってもよい。いくつかの態様において、酵素またはそのフラグメントは、結合ドメインに共有結合的または非共有結合的に結合され得る。例えば、酵素またはフラグメントを結合ドメインに合成的に結合させたり、遺伝的に結合ドメインに融合させたりできる。いくつかの態様において、結合ドメインと酵素（またはフラグメント）は、単一の転写産物として発現され得る（例えば、融合タンパク質として）。いくつかの態様では、結合ドメインはリンカーを介して酵素（またはフラグメント）に結合される。

いくつかの態様では、酵素は核酸塩基編集酵素（本明細書では塩基編集酵素とも呼ばれる）であってもよい。塩基編集酵素は、例えば、アデノシンデアミナーゼ、シトシンデアミナーゼ、グリコシラーゼ、メチラーゼ、デメチラーゼ、ジオキシゲナーゼ、またはＤＮＡもしくはＲＮＡの１以上の核酸塩基を修飾する他の酵素であってもよい。

ある態様では、酵素はトランスポザーゼであってもよい。いくつかの態様では、酵素はＴｎ５トランスポザーゼである。トランスポザーゼは原核生物および真核生物の両方に存在し、'カット・アンド・ペースト’メカニズムで、定義されたＤＮＡエレメント（トランスポゾン）をゲノムの別の部分に移動させる触媒となる。トランスポザーゼは多くの生物医学的適用に広く用いられている。例えば、大腸菌由来の高活性Ｔｎ５トランスポザーゼは、二本鎖の合成１９ｂｐモザイク末端（ＭＥ）認識配列に結合でき、この配列はあらゆる配列決定アダプターに付加できる。いくつかの態様において、ＭＥ－アダプターは、ＣＴＧＴＣＴＣＴＴＡＴＡＣＡＣＡＴＣＴ；配列番号５８を含む。いくつかの態様において、ＭＥ－アダプターは、ＡＧＡＴＧＴＧＴＡＴＡＡＧＡＧＡＣＡＧ；配列番号５９を含む。いくつかの態様において、ＭＥ－アダプターは、ＴＴＴＧＴＧＡＵＧＣＧＡＴＧＡＡＣＴＣＡＧＡＧＴＧＣＴＴＮＮＮＮＮＮＮＮＮＮＮＮＡＧＡＴＧＴＧＴＡＴＡＡＧＡＧＡＣＡＧ；配列番号６０を含み、ここで、Ｎはバーコードである。いくつかの態様において、配列番号５８を含むモザイク末端は、配列番号６０を含むＭＥ－アダプターにハイブリダイズされる。各トランスポザーゼ分子は同時に２つのＭＥタグ付きアダプターを付加する。Ｔｎ５トランスポザーゼは、二本鎖ＤＮＡまたはＲＮＡ／ＤＮＡヘテロ二本鎖を基質とするインビトロタグメンテーション反応（標的配列をフラグメント化し、配列決定アダプターで同時にタグ付けする）に利用されてきた。タグメンテーションの大きな利点は、使用する核酸の量を減らし、アッセイワークフローを大幅に簡略化できることである。タグメンテーションは一般的にピコグラム単位のＤＮＡまたはＲＮＡを用いて行われ、単一細胞アプローチに成功している。

いくつかの態様において、結合ドメイン－酵素コンジュゲートは、ＲＮＡ修飾、ＤＮＡ修飾、またはＲＮＡおよびＤＮＡ修飾の両方と特異的に結合し、トランスポザーゼを標的核酸に誘導する結合ドメインを含む。修飾特異的結合ドメインに結合したトランスポザーゼは、ＲＮＡ／ＤＮＡ二重鎖に特異的バーコードを挿入し、ユニバーサルプライマー部位およびリバースプライマー部位を付加する。タグメンテーションはマグネシウムイオンに依存しており、マグネシウムイオンの添加によってタグメンテーションが引き起こされ得る。タグ付けされた二重鎖の長さは反応条件によって異なり、３０塩基対という短さに最適化できる。したがって、標的化タグメンテーションは、ＤＮＡまたはＲＮＡ修飾を最大３０塩基対の塩基分解能で検出できる。

いくつかの態様では、トランスポザーゼはＤＮＡ／ＲＮＡ修飾を認識する結合ドメインに直接テザー結合または融合されないことがある。いくつかの態様において、トランスポザーゼは、ＤＮＡ／ＲＮＡ修飾を認識する結合ドメインの構造的要素に共有結合的または非共有結合的に結合するペプチドまたはタンパク質ドメインにテザー結合または融合され得る。いくつかの態様では、結合ドメイン、例えば抗体はスパイタグペプチドと遺伝子融合しており、一方トランスポザーゼはスパイキャッチャータンパク質と遺伝子融合している。スパイタグおよびスパイキャッチャーは自発的に共有結合を形成し、トランスポザーゼを修飾部位に標的化する。いくつかの態様では、トランスポザーゼはプロテインＡ、Ｇ、またはＬに遺伝的に融合している。いくつかの態様では、トランスポザーゼはプロテインＧに遺伝的に融合している。いくつかの態様では、トランスポザーゼはプロテインＬに遺伝的に融合している。プロテインＡ、Ｇ、またはＬは、ＩｇＧ抗体の特定の領域に結合し、ＤＮＡまたはＲＮＡ修飾結合抗体にトランスポザーゼ活性を向ける。

いくつかの態様では、トランスポザーゼは結合ドメインに共有結合したＭＥタグ付きアダプターに結合できる。アダプターはＭＥタグのついた一本鎖として存在し、ＭＥ相補体のハイブリダイゼーションがトランスポザーゼのインサイチュウ付加の引き金となる。結合ドメインは２以上のＭＥアダプター分子を提示し、トランスポザーゼに２つのアダプターを付加できるようにできる。いくつかの態様では、ＭＥ－アダプター分子は同じ配列を有する。いくつかの態様では、ＭＥアダプター分子は異なる配列を有する。いくつかの態様では、ＭＥ－アダプターはＤＮＡまたはＲＮＡ修飾に特異的なバーコードを含む。

シトシンデアミナーゼは、シトシンのウラシルへの加水分解的脱アミノ化を触媒し、Ｃ－Ｇ塩基対をＴ－Ａ塩基対に変異させる。ＡＰＯＢＥＣ（アポリポタンパク質ＢｍＲＮＡ編集触媒ポリペプチド様）ファミリーのシトシンデアミナーゼは、ヒトの健康および疾患において多様で重要な機能を有する。すべてのＡＰＯＢＥＣ酵素は一本鎖ＤＮＡおよびＲＮＡに結合するが、ＲＮＡ塩基を脱アミド化するのは一部の酵素だけである。特にＡＰＯＢＥＣ１およびＡＰＯＢＥＣ３ＡはＤＮＡおよびＲＮＡを修飾する。大腸菌のシトシンデアミナーゼＣｏｄＡは、５－フルオロシトシン（５Ｆｃ）から５－フルオロウラシル（５ＦＵ）への変換を触媒する。この活性により、細胞毒性のない前駆体から細胞毒性のある化学療法剤が形成される。ＡＰＯＢＥＣ酵素は二本鎖ＤＮＡを処理するように設計されている。

ＲＮＡに作用するアデノシンデアミナーゼ（ＡＤＡＲ）は、アデノシンからイノシンへの加水分解的脱アミノ化を触媒する。イノシンは細胞機構においてグアニンのように作用するため、これはＡ－Ｔ塩基対をＧ－Ｃ塩基対に変異させることに等しい。ヒトのアデノシン脱アミノ化には２種の酵素が関与している：ＡＤＡＲ１およびＡＤＡＲ２である。ＡＤＡＲタンパク質は、二本鎖ＲＮＡ結合ドメインおよびＣ末端デアミナーゼドメインを含むモジュール構造を有する。ＡＤＡＲ活性には二本鎖ＲＮＡが必要であるが、最近の報告では、ＲＮＡ／ＤＮＡヘテロ二本鎖のＤＮＡ鎖上でのＡＤＡＲ活性が示されている。最近、ＡＤＡＲ２はアデノシンからイノシンへの変換に加え、シトシンからウラシルへの変換も行うように設計された。

いくつかの態様において、結合ドメイン－酵素コンジュゲートは、ＲＮＡおよび／またはＤＮＡ修飾に特異的に結合し、シトシンおよびアデノシンデアミナーゼを標的核酸に誘導する結合ドメインを含む。標的部位において、脱アミナーゼ酵素はＤＮＡ／ＲＮＡの非古典的特徴の位置を示すシングルポイント位置（single point location）を導入する。塩基編集は、修飾を局在化させるためのもう一つの方法であり、この目的のためにタンパク質および核酸を光架橋することによって切断型ｃＤＮＡを生成することに代わるものである。いくつかの態様では、切断部位を導入するために、シトシンからウラシルへの編集が用いられ得る。

いくつかの態様では、塩基編集酵素は、ＤＮＡ／ＲＮＡ修飾を認識する結合ドメインに直接テザー結合または融合していない場合がある。その代わりに、塩基編集酵素は、図６Ａ－６Ｃに示すように、ＤＮＡ／ＲＮＡ修飾を認識する結合ドメインの構造的要素に共有結合的または非共有結合的に結合するペプチドまたはタンパク質ドメインにテザー結合または融合させ得る。例えば、ＲＮＡ／ＤＮＡ修飾を認識する結合ドメインは一次抗体であり、デアミナーゼ酵素は二次抗体に繋留または融合される（図６Ａ）。いくつかの態様では、結合ドメイン、例えばナノボディは、ＤＮＡアドレス、リンカー、バーコードを含むＤＮＡアダプターを示す。デアミナーゼはＤＮＡアドレスに相補的な配列で標識され、ＤＮＡハイブリダイゼーションによって酵素を修飾部位に標的化する（図６Ｂ）。いくつかの態様では、結合ドメイン、例えばナノボディはスパイタグペプチドと遺伝子融合しており、一方、脱アミナーゼはスパイキャッチャータンパク質と遺伝子融合している。スパイタグおよびスパイキャッチャーは自発的に共有結合を形成し、脱アミナーゼを修飾部位に誘導する（図６Ｃ）。いくつかの態様において、デアミナーゼは、一次抗体に結合するプロテインＧに融合される（図６Ｄ）。いくつかの態様において、酵素は、プロテインＡ（UniProtアクセッション番号Ｐ３８５０７＆Ｐ０２９７６）、プロテインＧ（UniProtionアクセッション番号Ｑ５４１８１＆Ｐ１９９０９）、またはプロテインＬ（UniProtionアクセッション番号Ｑ５１９１８）に融合した塩基編集酵素である。いくつかの態様では、酵素は、プロテインＡに融合した塩基編集酵素である。いくつかの態様では、酵素は、プロテインＧに融合した塩基編集酵素である。いくつかの態様では、酵素は、プロテインＬに融合した塩基編集酵素である。

いくつかの態様において、コンジュゲートは、（ｉ）核酸結合分子およびペプチドタグ、ならびに（ｉｉ）ペプチドタグおよび共有結合反応ができるタンパク質に融合した酵素またはそのフラグメントを含む。いくつかの態様において、コンジュゲートは、（ｉ）ペプチドタグを含む酵素またはそのフラグメント、および（ｉｉ）ペプチドタグと共有結合反応し得るタンパク質に融合した核酸結合分子を含む。いくつかの態様において、コンジュゲートは、（ｉ）核酸結合分子およびタンパク質タグ、ならびに（ｉｉ）タンパク質タグと共有結合反応できるペプチドタグに融合した酵素またはそのフラグメントを含む。いくつかの態様では、コンジュゲートは、（ｉ）核酸結合分子と、（ｉｉ）結合ドメインの特定領域に高親和性で結合できるタンパク質に融合した酵素またはそのフラグメントとを含む。いくつかの態様において、ペプチドタグはスパイタグである。いくつかの態様では、酵素はデアミナーゼである。いくつかの態様において、ペプチドタグと共有結合的に反応し得るタンパク質は、スパイキャッチャータンパク質である。

いくつかの態様において、コンジュゲートは、（ｉ）核酸結合分子およびペプチドタグ、ならびに（ｉｉ）ペプチドタグと共有結合反応できるタンパク質タグに融合した酵素またはそのフラグメントを含む。いくつかの態様において、コンジュゲートは、（ｉ）ペプチドタグを含む酵素またはそのフラグメント、および（ｉｉ）ペプチドタグと共有結合反応し得るタンパク質タグに融合した核酸結合分子を含む。いくつかの態様において、コンジュゲートは、（ｉ）核酸結合分子およびタンパク質タグ、および（ｉｉ）タンパク質タグと共有結合的に反応できるペプチドタグに融合した酵素またはそのフラグメントを含む。いくつかの態様では、コンジュゲートは、（ｉ）核酸結合分子と、（ｉｉ）結合ドメインの特定領域に高親和性で結合できるタンパク質タグと融合した酵素またはそのフラグメントとを含む。いくつかの態様において、ペプチドタグはスパイタグである。いくつかの態様では、酵素はデアミナーゼである。いくつかの態様において、ペプチドタグと共有結合反応し得るタンパク質は、スパイキャッチャータンパク質である。

いくつかの態様において、コンジュゲートは共有結合である。いくつかの態様において、コンジュゲートは非共有結合である。

標的核酸修飾または編集による非古典的特徴の局在化を含む核酸分析法
上記のような複合体内バーコードトランスファーが可能な本明細書に記載の核酸結合分子は、核酸を分析する種々の方法、特に標的核酸上の非古典的特徴を認識するために用いられ得る。従って、本発明は、トランスクリプトームおよびゲノムにわたるＲＮＡおよびＤＮＡ修飾の多重プロファイリング法を含む、標的核酸上の非古典的特徴を分析する方法を提供する。これらの方法では、核酸結合分子の結合ドメインによって、RNAまたはDNAの非古典的特徴が認識される。その後、アダプターまたはその一部（例えば、バーコード）が核酸結合分子から標的核酸に転移される(すなわち、標識/バーコード化標的核酸が生成される）。バーコードは標的核酸によって結合される特定の非古典的特徴に固有であるため、この工程は認識イベントからの情報を標的核酸の核酸配列に書き込む役割を果たす。バーコード化された標的核酸は、配列決定ライブラリーに変換され、ＤＮＡ／ＲＮＡ配列決定法で読み取られる。この工程により、バーコードの配列が明らかになり、標的核酸の非古典的特徴と相関する。塩基配列決定により、標的核酸中の非古典的徴の局在を確認することもできる。本明細書に記載されているハイスループット・プロファイリング法は、複数またはすべてのＤＮＡ／ＲＮＡ修飾の性質と位置を並行して同定することを可能にする。

本明細書に記載の方法は、以下に記載の一連の工程を含む。当業者には理解され得るように、いくつかの態様では、様々な工程が省略され、および／または異なる順序で実行されてもよい。

核酸結合分子と標的核酸との接触
いくつかの態様において、本明細書に記載の方法は、１以上の核酸結合分子を１以上の標的核酸と接触させる工程を含む。標的核酸は、ＤＮＡ、ＲＮＡ、またはＤＮＡおよびＲＮＡの組み合わせを含む。標的核酸は、例えば、生物の細胞や組織から単離できる。いくつかの態様では、標的核酸はフラグメント化されていてもよい。

核酸結合分子と標的核酸との接触は、溶液中で起こりうる。例えば、１以上の標的核酸を含む組成物を、１以上の核酸結合分子を含む組成物と接触させることができる。いくつかの態様では、接触は希薄溶液中で起こり、１つの核酸結合分子のみが各標的核酸と相互作用しうる。

いくつかの態様では、接触は基質上で起こる。例えば、１以上の標的核酸を基質に結合させ、１以上の核酸結合分子を基質に結合した標的核酸に接触させることができる。いくつかの態様では、１以上の核酸結合分子を基質に結合させてもよく、１以上の標的核酸を、基質に結合した核酸結合分子と接触させてもよい。核酸結合分子を含む基質、およびその製造方法は、上述し、図４Ａ－４Ｄおよび図５Ａ－５Ｃに示す。

標的核酸は、１種の核酸結合タンパク質のみと接触させてもよく（すなわち、１種の非古典的特徴を検出するため）、またはいくつかの態様では、標的核酸は、複数の非古典的特徴を検出するために、２種以上の核酸結合分子と接触させてもよい。例えば、標的核酸は、少なくとも１種、少なくとも２種、少なくとも３種、少なくとも４種、少なくとも５種、少なくとも６種、少なくとも７種、少なくとも８種、少なくとも９種、少なくとも１０種、またはそれ以上の異なるタイプの核酸結合分子と接触させることができる。いくつかの態様において、標的核酸は、１～５、５～１０、１０～２５、２５～５０、５０～１００、１００～１５０、１５０～１７５、１７５～２００、またはそれ以上の異なるタイプの核酸結合分子と接触させることができる。複数種類の核酸結合分子を用いる場合、接触は同時に行ってもよいし（すなわち、標的核酸は、異なる非古典的特徴を認識する複数の核酸結合分子と同時に接触させられる）、順次行ってもよい（すなわち、標的核酸を、第１の非古典的特徴を認識する第１の核酸結合分子と接触させ、その後、第２の非古典的特徴を認識する第２の核酸結合分子と接触させる)。

いくつかの態様では、標的核酸は、核酸結合分子の第１のプールと接触され、その後核酸結合分子の第２のプールと接触される。いくつかの態様において、プールは、異なるタイプの核酸結合分子（すなわち、異なるタイプの非古典的特徴を認識する）を含み得る。いくつかの態様において、プールはそれぞれ、１～５、５～１０、１０～２５、２５～５０、５０～１００、１００～１５０、１５０～１７５、１７５～２００、またはそれ以上の異なるタイプの核酸結合分子を含み得る。

バーコードトランスファー
各核酸結合分子は、標的核酸の非古典的特徴と特異的に結合し、核酸のアダプターを標的核酸の３’末端または５’末端のいずれかに近接させる。その後、アダプター（例えば、バーコードを含む、またはバーコードを含むアダプター）を標的核酸に移すことができる。いくつかの態様では、転写は、バーコード化核酸のオフターゲット生成を実質的に防止する環境下で行われる。このような環境は、例えば、標的核酸が互いに相互作用できない(すなわち、１つの核酸結合分子のみが各標的核酸と相互作用しうる)環境であってもよい。これは、例えば、バーコード転写反応を希薄な溶液中で行うことによって、あるいは標的核酸または核酸結合分子のいずれかを基質上に固定化し、それらの空間的分離を達成することによって、達成できる。いくつかの態様では、トランスファーは標的核酸をコピーすることによって行われ、標的核酸の標識／バーコード化コピーを生成する。例えば、バーコードが標的核酸に転写された場合、または標的核酸に近接された場合、ポリメラーゼ連鎖反応（ＰＣＲ）を用いて標的核酸のバーコード化コピーを生成できる。

バーコードトランスファー反応および空間的分離は上記の通りであり、図３Ａ－３Ｅに記載されている。

標的核酸(またはそのコピー)の改変
いくつかの態様において、本方法は、バーコード化標的核酸（複数可）またはバーコード化コピー（複数可）を改変する工程を含み得る。この修飾は、核酸結合分子が非古典的特徴に結合した後に起こる可能性があり、いくつかの態様では、バーコードが標的核酸にトランスファーされた（または標的核酸のバーコード化コピーが生成された）後に起こり得る。

修飾は、非古典的特徴の位置がバーコード化標的核酸またはそのバーコード化コピーの一次核酸配列に基づいて識別可能であり、したがって下流の配列決定工程で検出され得るように行われる。この目的のために、多くの異なるタイプの改変が行われる。例えば、いくつかの態様において、修飾は、標的核酸（またはそのバーコード化コピー）のコピー中のポリメラーゼバイパスを防止し得る。

いくつかの態様において、修飾は、部分的には、核酸結合分子の結合ドメインを化学的に修飾することによって達成される。これは、いくつかの態様では、結合ドメインが結合している間、標的核酸のコピー中に切断を誘導し得る。

いくつかの態様において、修飾は、核酸結合分子（または結合ドメインなどのそのフラグメント）を標的核酸（またはそのバーコード化コピー）に光化学的に連結することを含む。核酸およびタンパク質を光化学的に連結する方法は当業者に知られている。例えば、光化学的結合は、核酸結合分子と標的核酸を含む複合体を紫外線（ＵＶ）に曝すことによって誘導できる。

いくつかの態様において、修飾は、核酸結合分子が標的核酸に結合する部位またはその近傍の塩基を編集することを含む。例えば、シトシンデアミナーゼまたはアデノシンデアミナーゼを用いて塩基を編集できる。塩基編集分子は、要すれば、核酸結合分子またはその一部と結合してもよいし、核酸結合分子を認識する結合剤、例えば一次抗体－ＤＮＡアダプター結合体に結合する二次抗体と結合してもよい（図６Ａ－６Ｃ）。アデノシンデアミナーゼはアデノシン（Ａ）をイノシン（Ｉ）に変換し、増幅酵素はシトシン（Ｃ）と塩基対を作り、チミン（Ｔ）からシトシン（Ｃ）への変異を導入する。シトシンデアミナーゼは、修飾部位の近くにあるシトシン（Ｃ）をウラシル（Ｕ）に変換し、グアニン（Ｇ）からアデノシン（Ａ）への変異を導入する。非古典的特徴を局在化するもう一つの方法は、ＮＥＢ^{（登録商標）}社のＵＳＥＲ^（商標）(ウラシル脱グリコシラーゼおよびエンドヌクレアーゼＶＩＩＩの混合酵素）によってウラシル（Ｕ）を切断することであり、これにより切断されたリードが生成される。

増幅および配列決定
標的核酸（またはそのバーコード化コピー）が改変された後、それを増幅し、配列決定できる。この工程によってバーコードの配列が明らかになり、標的核酸中の核酸結合分子がもともと結合していた非古典的特徴と相関する。塩基配列の決定により、切断フラグメントの長さも明らかになり、標的核酸中の非古典的特徴を局在化できる。塩基配列の決定によって、非古典的特徴の近くに変異が見つかることもあり、そこから非古典的特徴の位置が情報的に導き出されることもある。変異は、脱アミナーゼ酵素による塩基編集の結果であり得るか、核酸標的をコピーするために用いられる酵素（標的がＤＮＡの場合はＤＮＡポリメラーゼ、標的がＲＮＡの場合は逆転写酵素）の塩基挿入エラー率が増加した結果かもしれない。非古典的特徴は、酵素的バイパスエラー率を自然に増加させるかもしれないし、非古典的特徴を化学的に修飾することによって効果を増幅させるかもしれない。

したがって、ある態様では、本明細書に記載の方法は、バーコード化標的核酸またはそのコピーを配列決定する工程を含み得る。配列決定工程は、当技術分野で知られている何れかの適切な方法を用いて実施できる。例えば、配列決定は、次世代シーケンシング（ＮＧＳ）法、超並列シーケンシング法、またはディープシーケンシング法を用いて実施できる。本発明の方法で使用できるＮＧＳプラットフォームは多数ある。例えば、Illumina^{(登録商標）} (Solexa^{(登録商標）})のシーケンシングは、各塩基が蛍光シグナルを発すると同時にＤＮＡ塩基を識別し、核酸鎖に加えることで機能する。Roche^{(登録商標）} 454シークエンシングは、ポリメラーゼによってヌクレオチドがＤＮＡの新しい鎖に組み込まれた後、蛍光を用いてピロリン酸の遊離を検出する技術であるパイロシーケンシングに基づく。Ion Torrent（プロトン／ＰＧＭシーケンス）は、ＤＮＡポリメラーゼによる個々のヌクレオチドの組み込みからプロトン（Ｈ＋）の直接放出を測定する。

いくつかの態様では、標的核酸を検出するために配列決定は必須ではない。例えば、ＰＣＲを用いて標的核酸を検出できる。例えば、ＰＣＲは、標的核酸（例えば、バーコード）が存在するかどうかを検出するために使用できる。いくつかの態様では、標的核酸は、蛍光プローブ（例えば、蛍光標識ハイブリダイゼーションプローブ）を用いて検出される。いくつかの態様では、マイクロアレイまたは他の核酸アレイを用いて標的核酸を検出する。本明細書に記載の標的核酸を検出する方法の何れかから得られた配列決定結果またはデータを解析する方法は、当業者に公知である。例えば、配列決定結果の解析には標準的なバイオインフォマティクス手法が用いられる。

いくつかの態様では、核酸結合分子を介する反応によるバーコードの付加を検出するために、配列決定は必要とされない。例えば、ＤＮＡ／ＲＮＡ修飾の存在は、核酸電気泳動、蛍光ハイブリダイゼーションプローブ、ＰＣＲ、またはバーコードによって誘発され得る他の核酸増幅法を用いて、関連するバーコードを検出することによって確認され得る。

標的核酸上の非古典的特徴の同定、定量、または局在化のための例示的方法
いくつかの態様において、本明細書に記載の方法は、標的核酸上の修飾（すなわち、非古典的特徴）を同定するだけでなく、修飾を定量化し、標的核酸上の修飾を１塩基ほどの高分解能で局在化するために用いられ得る（例えば、図８参照）。いくつかの態様では、この方法は、２塩基、３塩基、４塩基、５塩基、６塩基、７塩基、８塩基、９塩基または１０塩基という高分解能での修飾の局在化を可能にする。

いくつかの態様では、図７に概説した二重ワークストリーム（dual-workstream）アプローチに示すように、修飾および非修飾ＲＮＡ転写物を含むＲＮＡサンプルが提供される。この図では、修飾されていないＲＮＡ転写物は“転写物Ａ”と表示され、タイプ１およびタイプ２のＲＮＡ修飾はあらゆるタイプの修飾を表している。ＲＮＡサンプルの各転写物は、非古典的特徴を含んでいても、含んでいなくてもよい。

次に、ＲＮＡ転写物をビーズと接触させ、ビーズを非古典的特徴（すなわち、図７のタイプ１および／またはタイプ２のＲＮＡ修飾）に特異的な核酸結合分子と直接的または間接的に結合させる。修飾されたＲＮＡ分子はビーズに結合し、未修飾のＲＮＡは上清に残る。ＲＮＡ修飾のレベルを定量するために、両画分（基質結合画分および上清画分）を処理し、配列決定ライブラリーに変換できる。未修飾ＲＮＡ分子は、ＵＦＰおよびＵＲＰを含むアダプターで両端をキャップされ、一方、修飾ＲＮＡ分子は、その修飾を示す（すなわち、それに結合した核酸結合分子から転写される）バーコードを受け取る。

図７に示すように、正規化プローブ（対照）は、相対定量を可能にするために、両方のワークストリーム（表面結合、上清）にスパイクできる。さらに、核酸結合分子のアダプターに存在する可能性のあるユニークな分子識別子をカウントすることによって、絶対定量を達成できる。多くのＲＮＡ修飾は低いコピー数で起こる。従って、スプリットワークフローには、所定のシーケンス深度で低コピー数の転写産物に対して最適な感度を提供する比率で、修飾画分および非修飾画分を組み合わせることができるという利点がある。このスプリットワークフローにより、ＲＮＡ修飾の化学量論および存在量を測定できる。“化学量論”は相対数であり、非古典的特徴を含む特定の遺伝子座のコピー数を、その遺伝子座の全コピー数で割ったものとして計算される。“存在量”とは、ある遺伝子座における核酸の非古典的特徴の絶対的出現数のことである。

いくつかの態様では、複数の標的核酸を分析する方法は、ライゲーションによるバーコードトランスファーによるＲＮＡプロファイリングと、ｃＤＮＡ切断による非古典的特徴の局在化（例えば、図８を参照）とを含み得る。いくつかの態様において、本方法は、例えば、ＲＮＡ修飾を保存する条件を用いてＲＮＡを物理的または化学的に断片化することにより、ＲＮＡサンプルを枯渇または濃縮することを含む（図８、工程Ａを参照）。その後、１以上の核酸結合分子をＲＮＡサンプルに加えることができる。核酸結合分子の結合ドメインはＲＮＡ修飾を認識し、アダプター（例えば、ＤＮＡバーコードを含むアダプター）をＲＮＡ標的（図８の工程Ｂを参照）の末端に並置する。いくつかの態様において、逆転写酵素が認識エレメントを越えてコピーすることを防止するマーク（すなわち、修飾）を生成するために、標的ＲＮＡおよび核酸結合分子の結合ドメインは架橋（例えば、光化学的に架橋）され得る。いくつかの態様では、ポリメラーゼ－ＲＮＡ相互作用を破壊する、および／または同じ目的のために関与できる付加的な反応性基を提示する認識エレメントを選択し、操作することによって、架橋することなく停止点を作成できる（図８、工程Ｄを参照）。その後、一本鎖アダプターライゲーションを使って逆転写のためのプライマー結合部位を提供し、プライマー伸長によってｃＤＮＡを合成できる（図８、工程Ｆを参照）。ｃＤＮＡは、転写物の末端がＲＮＡ修飾の位置を示すように合成される。修飾が局在化する分解能は、切断メカニズムの性質に依存する。

ｃＤＮＡ分子は環化されていてもよい。例えば、タイプＢアダプターを有するｃＤＮＡ分子は、Circligaseによって環化できる（図８、工程Ｈを参照）。環化されたｃＤＮＡを切断すると、鎖特異的な直鎖状ｃＤＮＡフラグメントが得られ、ＰＣＲ増幅を用いて配列決定ライブラリーに容易に変換できる（図８、工程Ｉを参照）。プライマーは、配列決定などの下流工程に有用なアダプターピースを導入するために使用され得る。

図９は、切断部位を作るためのバーコーディングおよび酵素的塩基編集（例えば、ウラシルの付加）によるＤＮＡ修飾を分析する方法を示す。ＤＮＡは二本鎖であり、デアミナーゼ酵素による塩基編集は一本鎖の核酸を必要とするため、最初の工程はＤＮＡ鎖を分離することである。これは、標準的なプロトコール（すなわち、末端修復、Ａ－テイリング、アダプターライゲーション）に従って、ＤＮＡフラグメントの末端にＹ字型アダプターをライゲーションすることによって行うことができる。いくつかの態様では、Ｙ字型アダプターの一方のアームは、化学的ハンドルとして５’アジド基を含む。二本鎖ＤＮＡを９５％ホルムアミドで変性させた後、磁気ビーズなどのビーズに結合させることができる。例えば、表面に露出したアルキン基（１００ｎｍ^２あたり１個のアルキン基密度）を有する磁気ビーズを添加できる。Ｃｕ（Ｉ）の添加は、核酸のビーズへの共有結合を誘発する。相補的ＤＮＡ鎖はビーズ表面にランダムに付着し、互いに空間的に離れているため、生理的緩衝液条件下ではハイブリダイズできない。ビーズに結合した一本鎖ＤＮＡは、核酸結合分子およびＤＮＡ修飾を示すバーコードと接触できる。その後、ライゲーションによってバーコードを一本鎖標的核酸にトランスファーできる。次に、例えば核酸結合分子の結合ドメインに特異的な抗体（例えば、抗マウス抗体）と塩基編集酵素（例えば、シトシンデアミナーゼ）を含む結合ドメイン－酵素結合体を添加する。結合ドメイン－酵素結合体が核酸結合分子の結合ドメインと接触すると、酵素（シトシンデアミナーゼ）は一本鎖標的核酸の塩基を編集する（例えば、修飾部近傍のシトシン（Ｃ）をウラシル（Ｕ）に変化させる）。脱アミナーゼは不活性化され、ＵＳＥＲ（ウラシル脱グリコシラーゼおよびエンドヌクレアーゼＶＩＩＩの混合物）の添加によってＤＮＡ鎖が切断される。ＤＮＡポリメラーゼによるプライマー伸長は、ＤＮＡ修飾の位置を示す切断リードを生成する。リードはライブラリーに変換され、標準的な方法で塩基配列を決定できる。

いくつかの態様では、複数の標的核酸を分析する方法を用いて、反応ごとに１種のＤＮＡまたはＲＮＡ修飾を検出／定量できる。いくつかの態様では、複数の標的核酸を分析する方法は、図１０に示すように、サンプル分割によって複数のＤＮＡまたはＲＮＡ修飾を検出するために適合させ得る。例えば、アデニンデアミナーゼのような塩基編集酵素と結合した結合ドメインを各反応に導入できる。アデニンデアミナーゼはアデニン（Ａ）をイノシン（Ｉ）に変換し、Ｔ→Ｃ変異を誘発し、ＲＮＡ修飾部位を示す。図１０に示す分割スキームでは、テザーアダプターのない結合ドメインが用いられる。各パーティションには１種の結合ドメイン－デアミナーゼ結合体のみが含まれ、免疫沈降後にタイプＣアダプターが各パーティションに加えられ、濃縮された標的にライゲーションされる。タイプＣバーコードを付けると、ＲＮＡＳｅｑライブラリー調製前にスプリット反応をプールできる。

いくつかの態様では、多重修飾プロファイリングおよび塩基編集を組み合わせることができる。図１１は、バーコードライゲーションおよびアデノシンデアミナーゼによる塩基編集を用いたＲＮＡプロファイリングの方法を示す。工程は、結合ドメイン－酵素結合体がアデノシンデアミナーゼを含むことを除けば、図９に示したワークフローと同様である。アデノシン（Ａ）をイノシン（Ｉ）に変換して修飾の位置を示し、逆転写によって第１鎖を合成した後、鎖情報を保持する方法で第２鎖のｃＤＮＡを合成する。第２鎖にウラシルのみを組み込むことによって、第２鎖はＵＳＥＲ切断によって除去できる。鎖ＲＮＡライブラリー調製は、編集された鎖のみが増幅されるため、塩基編集を行う場合に有利である。

本明細書に記載の方法は、２以上の修飾（すなわち、非古典的特徴）を含むＤＮＡまたはＲＮＡを分析するためにも用いられ得る。例えば、図１２に示すように、標的ＲＮＡの５’末端および３’末端にそれぞれリバースアダプターおよびフォワードアダプターを付加するために、２サイクルのプロファイリングを採用できる。最初の工程は、標的ＲＮＡフラグメントのリン酸化された５’末端に、遊離３’ＯＨを有するリバースアダプターをライゲーションすることである。アダプターは５’末端を介して核酸結合分子に結合しており、３’末端は自由である。５’末端に最も近い核酸結合分子は、３’末端に近い認識要素よりも有利である可能性が高い。バーコードは核酸結合分子からトランスファーされ、核酸結合分子の残りは５’末端に化学的に結合したままである。その後、アダプターの構造が異なる核酸結合分子を追加し、５’末端が遊離したフォワードアダプターに結合させることができる。アダプターは３’末端を介して核酸結合分子に結合しており、５’末端は遊離のリン酸化末端である。最初のサイクルで用いた核酸結合分子を除去するための条件によっては、その結合ドメインが再び結合し、すでにコードされている部位へのアクセスをブロックする可能性があり、二重プロファイリングの可能性が低くなる。第２サイクルの核酸結合分子からのバーコードトランスファーは、スプリントオリゴを伸長することによって（例えば、逆転写酵素によって）達成され得る。この方法では、ＰＣＲで増幅可能なフォワードプライマーおよびリバースプライマーを有するｃＤＮＡフラグメントが得られ、塩基配列決定の準備が整う。

図１３は、任意の数のＲＮＡ修飾（例えば、２、３、４、５、６、７、８、９、１０、またはそれ以上のＲＮＡ修飾）をプロファイリングするための例示的な反応スキームを提供する。最初の工程では、一本鎖スペーサーを標的核酸にライゲーションする。次に、タイプＤアダプターを有する核酸結合分子を加える。一致するＲＮＡ修飾が存在すれば、核酸結合分子の結合ドメインが結合し、タイプＤアダプターのスペーサー領域がアニールする。バーコードおよびスペーサーは、Ｋｌｅｎｏｗフラグメント、Ｂｓｕポリメラーゼ、Ｔ４およびＴ７ポリメラーゼ、ＢｓｔポリメラーゼなどのＤＮＡポリメラーゼによってコピーされる。次に、核酸結合分子を除去し、標的核酸を第２の核酸結合分子（すなわち、結合特異性の異なる核酸結合分子）と接触させ、３’末端に別のバーコードを付加する。最後のサイクルでは、３’末端をユニバーサルプライマー（ＵＦＰまたはＵＲＰなど）でキャップし、逆転写酵素のプライマーとして用いる。

図１４Ｂは、修飾分析の各サイクルにおいて、標的ＲＮＡ鎖に沿って同じタイプの修飾のコピーが複数存在し、デアミナーゼが相補的ＤＮＡアドレスのハイブリダイゼーションを介して結合ドメインに標的化される状況に対処する方法を示す。１以上の同じ修飾の存在は、図１３に記載されているように、タイプＤアダプターから生じたタイプＧアダプターによるバーコード転写によって示される。この方法で用いられる結合ドメイン－タイプＧアダプター結合体には、ＤＮＡアドレスであるアドレス１が含まれている。この結合ドメインの結合に続いて、プライマー伸長によるバーコード導入が開始される。各修飾の位置をマークするために、シチジンデアミナーゼおよび相補的ＤＮＡアドレス（アドレス１’）を含むコンジュゲートが添加され、結合ドメイン－タイプＤアダプターコンジュゲートのアドレス（アドレス１）に結合する。デアミナーゼは、サイクル１ですべての修飾部位を編集できる。第２サイクルでは、もう一方のＲＮＡ修飾に特異的な、アドレス２を含む異なる結合ドメイン－タイプＤアダプター結合体が導入される。プライマーの伸長が開始され、続いて適合するシチジンデアミナーゼおよびアドレス２’が添加され、２番目の修飾タイプの位置をマークするために編集が許可される。

図１５Ａ－１５Ｄは、タグメンテーションを用いたバーコードの方法を示している。この方法は、トランスポザーゼに結合した結合ドメインを含む二量体核酸結合分子を用いる。トランスポザーゼ分子には、特定のＲＮＡ修飾を示す二本鎖ＤＮＡアダプターが付加されている。トランスポザーゼは二本鎖ＤＮＡアダプターに結合し、二本鎖ＤＮＡ基質の５’末端にライゲーションすることによって、アダプターを切断し挿入する。３’末端にはタグを付けず、生じたギャップはポリメラーゼ反応によって埋めることができる。いくつかの態様では、トランスポザーゼはＤＮＡ／ＲＮＡヘテロ二重鎖を基質として用い得る。タグメンテーション反応は通常２００－３００ｎｔの長さのフラグメントを生成し、サンプルインプット（input）によって最適化できる。いくつかの態様では、核酸結合分子－トランスポザーゼ結合体を、フラグメント化されていない全ＲＮＡまたは濃縮／欠失したＲＮＡに添加する。修飾されたＲＮＡ塩基を認識すると、トランスポザーゼは特定のバーコードをＲＮＡ／ＤＮＡ二重鎖に挿入し、ユニバーサルプライマー部位およびリバースプライマー部位を付加する。適切なポリメラーゼを用いてギャップを埋めることで、ライブラリー調製は完了する。タグメンテーションは、特定のバーコードによってＲＮＡ修飾部位をフレーミングし、位置情報は、位置分解能を最適化する長さにトランスポザーゼ・リンカーを作製することによって得られる。

図１６は、タイプＥアダプターを用いたロングリード構築と組み合わせた多重修飾のプロファイリング法を示す。タイプＥアダプターは、バーコードおよび修飾の近傍でハイブリダイズする短いランダムフィートを含む。適切なリンカーおよびフィートの設計により、それらはＲＮＡ上に配列し、ＲＮＡ修飾の順序および種類を表す。ギャップは逆転写酵素で埋められ、ライゲーションで結合される。鋳型スイッチングにsmart-Seqアプローチを用いることで、鎖情報は保持される。Smart-Seqは、短いポリＣ配列で平滑末端をテイリングする逆転写酵素の特性を利用している。ポリＣテイルは短いＬＮＡ－ＧＧＧプライマーでプライミングされ、２本目の鎖合成を開始する。

いくつかの態様において、複数の標的核酸を分析する方法は、（ｉ）標的核酸を、本明細書に記載の核酸結合分子と接触させる工程；（ｉｉ）（ａ）バーコード化核酸のオフターゲット生成を実質的に防止する環境において、核酸バーコードを標的核酸に転写してバーコード化標的核酸を生成する工程、または（ｂ）標的核酸のバーコード化コピーを生成する工程；（ｉｉｉ）非古典的特徴の位置がバーコード化標的核酸またはそのバーコード化コピーの一次核酸配列に基づいて同定可能であるように、バーコード化標的核酸またはそのバーコード化コピーを改変する工程；および（ｖｉ）バーコード化標的核酸を配列決定する工程、を含む。いくつかの態様において、工程（ｉ）～（ｉｉｉ）は、少なくとも１回（例えば、少なくとも２回、少なくとも３回、少なくとも４回、少なくとも５回、少なくとも６回、少なくとも７回、少なくとも８回、少なくとも９回、少なくとも１０回、またはそれ以上）繰り返される。いくつかの態様では、工程（ｉ）～（ｉｉｉ）を繰り返すたびに異なる核酸結合分子を用いる。いくつかの態様では、工程（ｉ）～（ｉｉｉ）を繰り返すたびに、同じ核酸結合分子を使用する。いくつかの態様において、本方法は、配列決定前にバーコード化標的核酸またはそのコピーを増幅することを含む。

いくつかの態様において、複数の標的核酸中の２以上の非古典的特徴を検出し、または定量するための方法は、（ｉ）標的核酸を少なくとも２つの核酸結合分子と接触させる工程であって、各核酸結合分子が結合ドメインおよびアダプターを含み；ここで、各核酸結合分子の結合ドメインが、ＤＮＡまたはＲＮＡの異なる非古典的特徴に結合し；ここで、アダプターが、各結合ドメインによって特異的に結合される非古典的特徴に特異的な核酸バーコード配列を含む、工程；（ｉｉ）（ａ）バーコード化核酸の標的外生成を実質的に防止する環境下で、バーコード化標的核酸を生成するために、核酸バーコードを標的核酸にトランスファーさせるか、または（ｂ）標的核酸のバーコード化コピーを生成する；（ｉｉｉ）非古典的特徴の位置がバーコード化標的核酸またはそのバーコード化コピーの一次核酸配列に基づいて同定可能であるように、バーコード化標的核酸またはそのバーコード化コピーを改変する工程；および（ｖｉ）バーコード化標的核酸を配列決定する工程、を含む。いくつかの態様において、本方法は、配列決定前にバーコード化標的核酸またはそのコピーを増幅することを含む。

いくつかの態様において、標的核酸中の非古典的特徴を検出する方法は、（ｉ）標的核酸を、本明細書に記載されるような核酸結合分子と接触させる工程；（ｉｉ）（ａ）バーコード化核酸のオフターゲット生成を実質的に防止する環境において、核酸バーコードを標的核酸に転写してバーコード化標的核酸を生成するか、または（ｂ）標的核酸のバーコード化コピーを生成する工程；および（ｉｉｉ）標的核酸またはそのコピー中のバーコードの存在を検出する工程、を含む。

標的核酸中の非古典的特徴の位置を１塩基分解能で決定する方法であって、該方法は、（ｉ）標的核酸を、本明細書に記載の核酸結合分子と接触させる工程；（ｉｉ）バーコード化核酸のオフターゲット生成を実質的に防止する環境において、核酸バーコードを標的核酸にトランスファーして、バーコード化標的核酸を生成する工程；および（ｉｉｉ）標的核酸またはそのコピー中のバーコードの存在を検出する工程、を包含し、ここで、核酸結合分子は、以下の１以上が可能な結合ドメインを含む：標的核酸に変異を誘導する；またはポリメラーゼバイパスを防止し、従って標的核酸のコピーの間に切断を引き起こす。いくつかの態様では、工程（ｉ）～（ｉｉｉ）を少なくとも１回繰り返す。いくつかの態様では、工程（ｉ）～（ｉｉｉ）を繰り返すたびに異なる核酸結合分子を用いる。いくつかの態様では、工程（ｉ）～（ｉｉｉ）を繰り返すたびに、同じ核酸結合分子を用いる。

本明細書に記載の方法は、疾患、障害または状態を診断するために使用できる。例えば、いくつかの態様において、本方法は、それを必要とする対象において癌を診断するために用いられ得る。いくつかの態様では、キットは、１以上の治療に対する反応など、疾患、障害または状態を経時的にモニタリングするために用いられ得る。例えば、本キットは、がんの治療（すなわち、化学療法、放射線療法など）を受けている対象におけるエピジェネティックおよび／またはエピトランススクリプトームの経時的変化をモニタリングするために使用できる。いくつかの態様では、本方法は、それを必要とする対象からの細胞または組織を分析するために用いられ得る。例えば、血液サンプル、生検サンプル、剖検サンプルなどから単離された細胞や組織における非古典的特徴を検出するために、本方法を用い得る。

いくつかの態様において、本方法は、工業的発酵に用いられる細胞など、１以上の製品の生産に商業的に用いられる細胞におけるエピジェネティックな変化を検出および／またはモニタリングするために用いられ得る。いくつかの態様において、本方法は、植物細胞または組織におけるエピジェネティックな変化を検出および／またはモニタリングするために用いられ得る。

核酸結合分子を含む組成物
本発明はまた、本明細書に記載の１以上の核酸結合分子を含む組成物も提供する。いくつかの態様では、組成物は１種以上の核酸結合分子を含む。例えば、組成物は、第１の非古典的特徴に結合する第１の核酸結合分子、および第２の非古典的特徴に結合する第２の核酸結合分子を含み得る。いくつかの態様において、組成物は、１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、または２５以上の異なるタイプの核酸結合分子を含み得る。

また、本明細書には、１以上の複合体を含む組成物が提供され、各複合体は標的核酸に結合した核酸結合分子を含む。

いくつかの態様において、本明細書に記載の組成物は、１以上の担体、賦形剤、緩衝剤などを含む。組成物は、約０．５、約１．０、約１．５、約２．０、約２．５、約３．０、約３．５、約４．０、約４．５、約５．０、約５．５、約６．０、約６．５、約７．０、約７．５、約８．０、約８．５、約９．０、約９．５、約１０．０、約１０．５、約１１．０、約１１．５、約１２．０、約１２．５、約１３．０、約１３．５、または約１４．０のｐＨを有し得る。いくつかの態様において、組成物は医薬組成物である。

核酸分析用キット
本明細書に記載の核酸結合分子は、キットで（例えば、キットの成分として）提供できる。例えば、キットは、核酸結合分子、またはその１以上の成分、および情報資料を含み得る。情報資料は、例えば、本明細書に記載の方法および／または核酸結合分子の使用に関する説明資料、教示資料、販売資料、またはその他の資料であり得る。キットの情報資料の形式は限定されない。いくつかの態様において、情報提供物質は、核酸結合分子の生産に関する情報、分子量、濃度、有効期限、バッチまたは生産地情報などを含み得る。いくつかの態様では、情報資料は、キットを用いて診断または評価され得る障害および／または病状のリストを含み得る。

いくつかの態様において、核酸結合分子は、本明細書に記載の方法に使用するのに適切な方法（例えば、使いやすいチューブ、適切な濃度など）で提供され得る。いくつかの態様では、キットは使用前に核酸結合分子の何らかの調製または操作を必要とする場合がある。いくつかの態様において、核酸結合分子は、液体、乾燥、または凍結乾燥の形態で提供される。いくつかの態様では、核酸結合分子は水溶液で提供される。いくつかの態様では、核酸結合分子は、滅菌された核酸遊離溶液で提供される。いくつかの態様では、核酸結合分子は、分子自体を構成し得る核酸以外に核酸を実質的に含まない組成物中で提供される。

いくつかの態様において、キットは、１以上のシリンジ、チューブ、アンプル、ホイルパッケージ、またはブリスターパックを含み得る。キットの容器は、気密性、防水性（すなわち、水分または蒸発の変化を防ぐ）、および／または遮光性を備え得る。

いくつかの態様では、キットは、標的核酸の集団を分析する方法など、本明細書に記載の方法の１以上を実施するために用いられ得る。いくつかの態様において、キットは疾患、障害または病状を診断するために使用できる。例えば、いくつかの態様では、キットは癌の診断に使用できる。いくつかの態様では、キットは、１以上の治療に対する反応など、疾患、障害、または状態を経時的にモニタリングするために用いられ得る。例えば、本キットは、癌の治療を受けている対象のエピジェネティックおよび／またはエピトランススクリプトームの経時的変化をモニタリングするために使用できる。

実施例
以下の限定されない例は、本発明の組成物および方法の態様をさらに例示する。

実施例１：結合ドメインの設計、選択、特性評価
結合ドメインは、Ｎ６－メチルアデノシン（ｍ６Ａ）、シュードウリジン（Ψ）、イノシン（Ｉ）および５－メチルシトシン（ｍ５Ｃ）に結合する核酸結合分子（ＢＡＣ（＝結合ドメインアダプター結合体）とも呼ばれる）に使用するために設計されている。最初に、市販の抗体のスクリーニングが行われた。有利な特性を有する抗体（モノクローナル抗体など）を選択した。

最初の抗体特性化はプレートＥＬＩＳＡによって行われた。表４に示すｍ６Ａ（配列番号１）、Ψ（配列番号２）、Ｉ（配列番号３）またはｍ５Ｃ（配列番号４）を含むビオチン化ＲＮＡオリゴヌクレオチド(Horizon Discovery)、および非修飾対照オリゴヌクレオチド（配列番号５）を、ストレプトアビジンでコートした９６ウェルプレート（Thermo Fisher, カタログ番号１５１２５）に４℃で添加し、リン酸緩衝生理食塩水（ＰＢＳ）で洗浄した。別の実験では、オリゴヌクレオチドを逆転写によってＲＮＡ／ＤＮＡヘテロ二重鎖に変換する（Protoscript II, NEB カタログ番号M0368L）ことにより、二重鎖ＲＮＡ修飾に結合する抗体の能力を評価した。ＲＮＡ配列は安定した二次構造をとるため、ＲＮＡ修飾の提示はしばしば二重鎖になり、塩基対の状態とは無関係に修飾を認識する抗体が優れていると考えられている。抗体をプレートに加え、２２℃で６０分間インキュベートした。結合していない抗体を洗浄し、アルカリホスファターゼ（ＡＰ）標識検出抗体（Thermo Fisher, カタログ番号３１４３０および３１４６０）。未結合の検出抗体を洗浄した後、ＡＰ基質をプレートに添加し（Thermo Fisher, カタログ番号３４０２８）、４５０ｎｍでの吸光度検出で結合抗体の有無を判定した。

抗体結合の親和性は、アッセイに使用する抗体の量を滴定し、得られた曲線を結合モデルに当てはめることで評価した。図１９は、ｍ６Ａに対する良好な結合特性を有する抗体のサブセット（Thermo Fisher, カタログ番号61755 (Ab01)、MA5-33030 (Ab02)（Synaptic Systems カタログ番号345E11 (Ab05)）、ｍ５Ｃ（Thermo Fisher, カタログ番号MA5-24694(Ab16)）、Ｉ（Diagenode、カタログ番号C15200251(Ab10)）およびΨ（Diagenode、カタログ番号C15200247(Ab11)、MBL、カタログ番号D347-3(Ab19)）の結合曲線を示す。シュードウリジン抗体以外のすべての抗体は、一本鎖ＲＮＡ中の抗原とサブナノモル解離定数Ｋ_Ｄ (親和性の指標)で結合し、１００倍以上の特異性を示した。シュードウリジン抗体はナノモル程度の親和性しかなく、特異性は約１０倍であった。Ａｂ０２、Ａｂ０５、Ａｂ１６は、ＲＮＡ／ＤＮＡヘテロ二重鎖に強い結合を示すため、特に望ましい。このＥＬＩＳＡ形式から得られる解離定数はアビディティ（avidity）の結果であり、表面上のＲＮＡ鎖の密度が高いため、両抗体アームは修飾塩基に結合できる。この二座結合様式（bidentate binding mode）は解離速度を遅くし、全体的な親和性を高めることが知られている。本明細書で示したデータに基づけば、１分子１：１複合体における親和性は低くなると予想される。Ａｂ０５、Ａｂ１０、Ａｂ１６、Ａｂ１９がさらなる分析のために選ばれた。

実施例２：結合ドメインの変異プロファイルおよび切断パターンの決定
変異プロファイルおよび切断パターンは、（１）実施例１で同定された抗体、または（２）その誘導体（例えば、実施例１の抗体のＣＤＲ配列を含むｓｃＦｖ）のいずれかについて特徴付けられ得る。具体的には、実施例１に記載される結合ドメインが核酸標的に結合する。結合ドメインおよびヌクレオチドは架橋されている。標的ヌクレオチドをアダプター結合させた後、逆転写を用いてｃＤＮＡを作製し、ＰＣＲ増幅して配列決定し、標的ヌクレオチドの変異および切断プロファイルを評価する。

最初に、抗体結合ＲＮＡ鎖の逆転写から生じる突然変異パターンを、インビトロで転写されたＲＮＡを用いて評価する。まず、AmpliScribe^（商標）T7 High Yield Transcription Kit (Lucigen)を用いて、修飾および非修飾ヌクレオチド三リン酸（ＮＴＰ）(TriLink)の比率を変化させながら、５００ヌクレオチドのＲＮＡをインビトロで転写することにより、１以上の修飾（ｍ６Ａ、Ψ、および／またはｍ５Ｃ）を含むＲＮＡを生成する。転写産物は、ＲＮＡフラグメント化試薬(Thermo)を用いて５０から１５０ヌクレオチドのサイズに断片化され、各候補抗体と共にインキュベートされる。

ＵＶ架橋が修飾部位での逆転写の切断を誘導するかどうかを調べるために、各抗体－ＲＮＡ複合体溶液にＵＶ光（例えば、約０．１５Ｊ／ｃｍ^２、２５４ｎｍ）を照射する。架橋後、抗体－ＲＮＡ複合体は、プロテインＡ／Ｇダイナビーズ（Thermo）に捕捉される。プロテインＡ／Ｇは抗体のＦｃ領域と高い親和性で結合する。その後、ＲＮＡの３’末端をポリヌクレオチドキナーゼ（ＮＥＢ）で脱リン酸化し、ＤＮＡアダプターをＴ４ＲＮＡリガーゼ（ＮＥＢ）でライゲーションする。アダプターは５’末端でプレアデニル化されている：５ｒＡｐｐ／ＡＧＡＴＣＧＧＡＡＧＡＧＣＧＧＴＴＣＡＧ／３ｄｄＣ、ここで５ｒＡｐｐは５’プレアデニル化を意味し、３ｄｄｃは３’ジデオキシ－Ｃを意味する（配列番号６）。

アダプターをライゲーションしたＲＮＡはビーズから溶出され、精製され、ライゲーションしたアダプターと相補的なオリゴヌクレオチド（すなわち逆転写酵素プライマー）でプライミングされる。逆転写酵素プライマーは、下流での環化を可能にするために５’リン酸化されており、縮重塩基でフレーム化された４文字のバーコード、ＢａｍＨＩ制限部位（gatc、配列番号７）、ならびにフォワードおよびリバースプライマー結合部位：５’Ｐ－ＮＮＡＡＣＣＮＮＮＡＧＡＴＣＧＧＡＡＧＡＧＣＧＴＣＧＴＧｇａｔｃＣＴＧＡＡＣＣＧＣ－３’（配列番号８）を含む。

逆転写を行い、ｃＤＮＡを作製する。逆転写は、各酵素の変異パターンおよび切断パターンを比較できるように、例えばSuperscript III(Thermo社)を含む逆転写酵素のパネルを用いて行われる。AMPureビーズ(Agencourt)を用いてｃＤＮＡのサイズ選択を行った後、CircLigase II(Lucigen)を用いて６０℃で環化し、ＢａｍＨＩ制限酵素で切断する。ライブラリーは適切な配列決定アダプターでＰＣＲ増幅され、MiSeq装置(Illumina)で配列決定される。リードは参照ＲＮＡ配列に対してアラインメントされ、突然変異および切断のパターンが評価される。

実施例３：結合ドメインのランダム標識による核酸結合分子の調製
核酸結合分子は、実施例１に記載の抗体にＤＮＡオリゴヌクレオチドをアミン反応性化学で結合させることにより調製した。アミノ修飾ＤＮＡオリゴヌクレオチドは、オリゴヌクレオチド結合キット（Oligonucleotide Conjugation Kit）(Vector Labs, カタログ番号S-9011-1）を用いて抗体にランダムに結合させた。最初の工程は、アミノ末端ＤＮＡオリゴヌクレオチドを４ＦＢ架橋剤で修飾し、抗体のリジン残基をＨｙＮｉｃ試薬で修飾することであった。活性化されたオリゴヌクレオチドと抗体を単純に混合するだけで、両者の間に共有結合が形成される。

標識の化学量論はＳＤＳゲル電気泳動で評価し、機能は実施例１に記載したようにプレートＥＬＩＳＡで確認した。図２０ＡはＡｂ０１のオリゴヌクレオチド標識の効率がＨｙＮｉｃ濃度（すなわち０、１０、２５、５０倍モル過剰）に反応してどのように変化したかを示している。１０倍モル過剰のＨｙＮｉｃでは、０、１または２個のオリゴヌクレオチドを有する抗体結合体が存在したが、５０倍モル過剰のＨｙＮｉｃではオリゴヌクレオチドの数は１～７個であった。

バーコードアッセイに使用するには、機能に重要なリジン残基の標識を避けながら、非標識抗体の量を最小にするＨｙＮｉｃ濃度が好ましい。実際には、最適なＨｙＮｉｃ比はＩｇＧアイソタイプおよびパラトープ（paratope）の配列によって変わった（図２０Ｂ）。Ａｂ０５は抗体あたり最大８個、Ａｂ１０は最大５個、Ａｂ１６は最大３個、Ａｂ１９は最大１個のオリゴヌクレオチドを示した。図２０Ｂのすべての標識反応に用いられたアダプターは同じであり、プライマー伸長によるバーコード化のために設計され（タイプ２Ｄアダプター）、結合ドメインに結合するためのＰＥＧリンカー（ｉＳｐ１８）、ブロックされた３’末端（３ＳｐＣ３）および５’アミン（５ＡｍＭＣ６）を含む（／５ＡｍＭＣ６／Ｔ／ｉＳｐ１８／ＴＡＴＡＡＧＡＧＡＣＡＧＡＣＡＣＡＧＧＣＣＡＣＴＣＡＧＴＣＴＡＴ／３ＳｐＣ３／；配列番号９）。プライマー伸長によるバーコーディングおよびシーケンシングにおける一般的な使用のためのアダプターは、以下の構造を有する：

配列番号５６（5AmMC6 ＝５’アミン、iSp18 ＝PEGリンカー, イタリック体＝ Illuminaアダプター、NNN ＝ＵＭＩ、下線＝７ｂＭＢＣ（修飾エンコードバーコード）、太字＝８ｂスペーサー、3SpC3 ＝３’ブロッキング基）。ＰＥＧリンカーは、効率的なバーコード転送のための空間的柔軟性を付加する。オリゴヌクレオチドの配列、可能な末端修飾、およびテザリングの方向は、各核酸結合分子の特定の必要性に基づいて変更できる。

オリゴヌクレオチドで標識した後の抗体結合活性を確認するために、実施例１に記載したＥＬＩＳＡ実験を行った。標識前と標識後の同じ抗体の結合曲線を比較すると、Ａｂ０５、Ａｂ１６、Ａｂ１０はすべて活性を失ったが、Ａｂ０５はＫ_Ｄが１５倍以上失われ、最も悪いヒットであった（図２１Ａ－２１Ｃ）。しかしながら、これらの実験は、ヌクレオチド修飾の同定に用いる結合ドメインとしての抗体の検出可能な結合を証明している。

実施例４：抗体の糖鎖ドメインの部位特異的標識を用いた核酸結合分子の調製
結合活性の阻害を避けるため、Ａｂ０５を部位特異的にSiteClick 抗体アジド修飾キット（Thermo Fisher, カタログ番号S20026）を用いて部位特異的に標識した。SiteClick標識は、酵素を用いてＩｇＧ抗体の重鎖にアジド部分を特異的に結合させ、抗原結合ドメインが抗原標的に結合するために変化しないことを保証する。この部位選択性は、アイソタイプおよび宿主種に関係なく、本質的にすべてのＩｇＧ抗体に存在する糖鎖ドメインを標的とすることで達成された。ガラクトシダーゼは、β－１,４－ガラクトシル転移酵素を用いて、β－１,４結合Ｄ－ガラクトピラノシル残基の加水分解と、その後のアジド－ガラクトピラノシルの結合を触媒する。一旦アジド修飾されると、ＤＢＣＯ（ジベンゾシクロオクチル）標識アダプター（例えば、ＤＢＣＯ／５ＡｍＭＣ６／Ｔ／ｉＳｐ１８／ＴＡＴＡＡＧＡＧＡＣＡＧＡＣＡＧＧＣＣＡＣＴＣＡＧＴＣＴＡＴ／３ＳｐＣ３／；配列番号２２）がＦｃ領域に結合され、１つまたは２つのアダプターを示す抗体が得られたが、いくつかの非標識抗体も得られた（図２１Ｄ）。ＥＬＩＳＡアッセイでは、部位特異的標識抗体の結合親和性が変化していないことが確認された（図２１Ｅ）。

実施例５：遺伝子工学による部位特異的標識を利用した核酸結合分子の調製およびビーズへの固定化
核酸結合分子をビーズベースのアッセイに用いるとき、分子は結合活性を維持する向きで表面に固定化される。このようなアッセイで用いる核酸結合分子を再現性よく調製するために、結合ドメイン（例えば、抗体またはそのフラグメント）の部位特異的標識が用いられる。以下の方法は、あらゆるタンパク質結合ドメインに適応可能であり、抗体に限定されるものではない。

最初に、抗体は次のように設計される。Ｓｐｙｔａｇペプチド（ＡＨＩＶＭＶＤＡＹＫＰＴＫ、配列番号１０）を、抗体重鎖のＣ末端に融合させる。抗体軽鎖のＣ末端は、ＬＣｘＰｘＲ（式中、ｘは何れかのアミノ酸であり得る）という短いペプチドで修飾されている（配列番号１１）。このペプチドはホルミルグリシン生成酵素（ＦＧＥ）の基質である。こうして、抗体は２つのペプチド融合タグを含んで発現および精製される（図１７Ｃ）。

ＦＧＥを発現する細菌発現系が選択される。この酵素はホルミルグリシンを共翻訳的に導入する。ホルミルグリシンのアルデヒド基は反応性の化学ハンドルであり、アミノ基をオキシムまたはヒドラゾンに変換した後、アミノＤＮＡを結合させるために用いられる。

核酸結合分子をビーズに固定化するために、ビーズはスパイキャッチャータンパク質で装飾されている。スパイキャッチャーのＮ末端は、核酸結合分子の結合ドメインが示すＣ末端のスパイタグと迅速かつ完全に反応し、共有結合のイソペプチド結合を形成する。天然のスパイキャッチャーは１３９アミノ酸タンパク質であり、システインを含まない：ｍｓｙｙｈｈｈｈｈｈｄｙｄｉｐｔｔｅｎｌｙｆｑｇａｍｖｄｔｌｓｇｌｓｓｅｑｇｑｓｇｄｍｔｉｅｅｄｓａｔｈｉｋｆｓｋｒｄｅｄｇｋｅｌａｇａｔｍｅｌｒｄｓｓｇｋｔｉｓｔｗｉｓｄｇｑｖｋｄｆｙｌｙｐｇｋｙｔｆｖｅｔａａｐｄｇｙｅｖａｔａｉｔｆｔｖｎｅｑｇｑｖｔｖｎｇｋａｔｋｇｄａｈｉ（配列番号１２）。マレイミド化学による表面カップリングを可能にするために、Ｃ末端にシステイン変異が１つ導入されている（実施例９を参照）。

実施例６：プロテインＧビーズへの核酸結合分子の固定化および核酸標的沈降
核酸修飾の多重検出のための最も単純なアッセイ形式を図５Ａに示す。ビーズには、１種の核酸結合分子のみが添加され、“ビーズタイプ”を表す。複数の核酸修飾を同時に調べるために、いくつかのタイプのビーズを組み合わせ、核酸標的と混合する。ビーズタイプの核酸結合分子はすべて同じ標的を免疫沈降させるので、その表面密度を厳密に制御する必要はない。ある核酸結合ドメインに結合しているが、隣接する核酸結合分子によってバーコード化されている標的は、正しく同定される。

ＩｇＧ抗体を固定化するユニバーサルな方法は、市販のプロテインＧビーズを用いることである。プロテインＧは、Ｃ群およびＧ群溶連菌に発現する免疫グロブリン結合タンパク質である。６５ｋＤａ（Ｇ１４８プロテインＧ）および５８ｋＤａ（Ｃ４０プロテインＧ）の細胞表面タンパク質で、ほとんどのＩｇＧアイソタイプのＦａｂおよびＦｃ領域に結合する。この実施例では、ランダムにアダプター標識した核酸結合分子をプロテインＧビーズに固定化し、修飾ＲＮＡ配列を特異的に沈降することを説明する。

ｍ６Ａ（Ａｂ０５）、ｍ５Ｃ（Ａｂ１６）およびＩ（Ａｂ１０）に対する非標識抗体を磁性プロテインＧダイナビーズ（Thermo Fisher, カタログ番号10009D）上に添加した。５０μＬのダイナビーズを洗浄し、ＰＢＳＴ（０．１% Tween^{(登録商標）}20界面活性剤入りＰＢＳ）中２００μＬの抗体（０．０５μｇ／μＬ）と共にインキュベートした。抗体を２２℃で２０分間結合させた後、２００μＬのＰＢＳＴでビーズを洗浄した。ロードしたビーズを２２℃で１時間、合成ＲＮＡ標的の混合物に暴露した。各標的は、表５に示すように、単一の修飾（ｍ６Ａ（配列番号１３）、ｍ５Ｃ（配列番号１８）、Ｉ（イノシン）（配列番号１６）、または修飾なし）を示す。標的はフルオレセイン（ＦＡＭ）で５’修飾され、ゲル上でのレシオメトリック検出（ratiometric detection）を可能にした。ＰＢＳＴで洗浄後、免疫沈降したＲＮＡを２ｘＴＢＵサンプルローディングバッファー（Thermo Fisher, カタログ番号LC6876）を用いて７０℃で２分間リカバーさせた。標的を１５％ＴＢＵゲル（Thermo Fisher, カタログ番号EC62755BOX）で定量した（図２２）。すべての抗体は、特異性のレベルに差はあれ、同種の標的に対して明確な選好性を示した。後者はほとんどの抗体と標的の組み合わせで１０倍と同等かそれ以上であり、ＥＬＩＳＡ測定で予測された値よりも低かった（実施例１）。この所見は、ＲＮＡ標的ではなく抗体を固定化したインバーテッドフォーマット（inverted format）ではアビディティがないこと、および洗浄手順のストリンジェンシーの違いに起因する。

実施例７：プライマー伸長によるランダムなＲＮＡ配列プールのバーコード化
プライマー伸長によるバーコード化には、標的ＲＮＡの３’末端に合理的に設計された配列（スペーサー、ＳＰ；図２Ｄおよび３Ｄを参照）の存在が必要である。プライマー伸長によるバーコード用のアダプターは、スペーサーに相補的な配列を含む。アダプターを標的スペーサーにハイブリダイズさせると、ＤＮＡポリメラーゼまたは逆転写酵素によって伸長可能な凹型３’末端が形成され、バーコード配列が標的ＲＮＡにコピーされる。以下の例は、テイリング反応またはライゲーション反応を用いて、ＲＮＡ配列の無作為なプールにスペーサーでタグを付ける方法を提供する（図２３Ａ）。

最初の方法は、ＲＮＡ標的に３’ポリｒＡテイルを付加するものであった。変性３０ｂＲＮＡ配列（ｒＮ_３０）を、１ｍＭのＡＴＰ存在下で大腸菌ポリ（Ａ）ポリメラーゼ（ＮＥＢ, カタログ番号M0276 L）を用いてポリアデニル化した。ランダムな３０ｂＲＮＡ分子（５’－ＦＡＭ－（ｒＮ）_３０；配列番号２３）のプールに付加されたＡの数は、平均１５０ｂ付近の広いガウス分布を有する。Ａ－テイルのサイズ調整は、所望の長さの競合ポリ（ｄＴ）オリゴヌクレオチドを過剰に反応に加えることによって得られた。競合体はＡ－テイルに結合し、ポリメラーゼの位置をずらし、反応を中止させた。図２３Ｂは、ポリ（ｄＴ）_２０オリゴヌクレオチドをテイリング反応に加えることによる２０ｂスペーサーの生成を示す。図２３Ｃは、対応する長さのポリ（ｄＴ）オリゴヌクレオチドをテイリング反応に加えることによって、１０、２０および３０ｂのスペーサーを生成し、温度の影響を調べたものである。２０ｂおよび３０ｂのポリ（ｄＴ）競合体は望ましいスペーサー長をもたらしたが、１０ｂ競合体はスペーサー長をコントロールできなかった。これは、１０ｂＡ／Ｔ二重鎖が試験した反応温度では安定でないためと思われる。より短いホモポリマーテイルは、ＧＴＰまたはＣＴＰと相補的な１０ｂ競合体オリゴヌクレオチドの存在下で、ポリ（Ｕ）ポリメラーゼを用いて作成できる。このアプローチは、所定の反応温度で競合体をホモポリマーテイルにハイブリダイズさせることができる何れかのスペーサー長に伸長可能である。

メッセンジャーＲＮＡ（ｍＲＮＡ）には３’－Ａ-テイルがあり、このテイルは固定化ポリｄＴプローブにｍＲＮＡ分子を選択的にハイブリダイズさせるために広く利用されている。スペーサー結合方法を提供することはさておき、この方法で何れかのＲＮＡ集団をＡ－テイル化し、図４Ｂに記載のハイブリダイゼーションによってビーズに固定化できる。

２つ目の方法は、酵素ライゲーションを用いた。何れかの塩基配列を含むスペーサーは、Ｔ４ＲＮＡリガーゼＩ（NEB, カタログ番号M0204L）により触媒される３’ライゲーションにより導入された。この反応には、脱リン酸化されたＲＮＡの３’末端および５’－リン酸化ＤＮＡスペーサーが必要である。図２３Ｄは、１０ｂ、２０ｂ、３０ｂおよび５０ｂのサイズの５’－リン酸化ＤＮＡ配列（それぞれ配列番号２８－３１、表６参照）と３０ｂの縮重ＲＮＡライブラリー（配列番号２３）とのライゲーションを示す。サイズ範囲は、スペーサーの導入（一般的なスペーサーサイズは約１０ｂである）および図３Ａに記載のライゲーションによるバーコード化（一般的なアダプターサイズは２５ｂ以上である）に有用な情報を提供するために選択された。スペーサーまたはアダプターをライゲーションする標準的な条件は同じである：反応は、最適化されたライゲーションバッファー（５００ｎＭＲＮＡ標的、２．５μＭ５’リン酸化ＤＮＡ、５０ｍＭＴｒｉｓｐＨ７．５、１０ｍＭＭｇＣｌ_２、１ｍＭＤＴＴ、０．５ｍＭＡＴＰ、２０％ＰＥＧ－８０００および０．５ユニット／μＬＴ４ＲＮＡリガーゼＩ）を用いて、室温で１時間インキュベートした。ライゲーション産物を変性ゲル電気泳動で分析した。ゲルの定量から、中程度の長さのＤＮＡ配列（２０ｂおよび３０ｂ）では反応が最も速く進み、とても短い配列（１０ｂ）および長い配列（５０ｂ）では反応が遅くなることが示された（図２３Ｄ）。したがって、一般的なスペーサーライゲーションは、変換を最大化するために一晩行い、同じライゲーション反応によるバーコーディング用のアダプターは５０ｂを超えないように設計した。

プライマー伸長によるバーコード化のためのアダプターを示す核酸結合分子は、非古典的特徴を介して特異的に、かつスペーサーを介して非特異的に、標的ＲＮＡと接触する。ライゲーションによるバーコーディングと比較すると、結合様式が一価から二価に変化するため、設計されたアビディティが追加される。これは結合親和性を高めるチャンスである一方、結合特異性を低下させるリスクを有している。特異性に悪影響を与えないためには、スペーサーの相互作用は、非古典的特徴がない場合には維持できないほど弱い必要がある。したがって、スペーサーはできるだけ短いが、ポリメラーゼの結合を可能にし、特にＲＮＡによって形成される分子内二次構造と効果的に競合するのに十分な長さが必要である。

核酸結合分子がない場合のプライマー伸長に対するスペーサーの長さの影響（遊離アダプターの相補体の合成とも言う）を、一般的な構造の複雑さを有する５０ｂＲＮＡ配列（配列番号１３）を用いて、図２３Ｅに示す。表６に示した５０ｂＤＮＡ標的（配列番号１５）および１８ｂＲＮＡ標的（配列番号２４）を並行して試験し、構造の複雑さから生じ得る差異を決定した。すべての標的は、配列ＡＣＴＧＡＧＴＧ（配列番号１９）の３’ＤＮＡスペーサーを示した。標的に対して１倍または５倍過剰に溶液中に適用されたアダプターは、８ｂ、１０ｂまたは１２ｂの相補的スペーサー（表５に示す配列番号２５－２７および３８）を含んだ。一般的なプライマー伸長反応には、１０ｍＭＴｒｉｓｐＨ７．９、２ｍＭＭｇＣｌ_２、１００ｕＭｄＮＴＰ、０．１％Ｔｗｅｅｎ－２０、１μＭの標的、１μＭまたは５μＭのアダプター、０．２５ユニット／μＬのＫｌｅｎｏｗフラグメント（３’→５’エキソ）、および要すれば６％ＤＭＳＯが含まれる。標準反応条件は、２２℃で５分間のプライマー伸長であった。その結果、スペーサーの長さに関係なく、長いＲＮＡはＤＮＡおよび短いＲＮＡに比べて伸長性が低いことが示された。高温（３７℃で５分）、ＤＭＳＯの存在、および高いアダプター濃度（標的より５倍過剰）などの分子内二次構造を不安定にする条件では、長いスペーサーが有利であった（図２３Ｆ）。この発見は、スペーサーのアクセスはＲＮＡの二次構造によって妨げられ、１２ｂスペーサーでさえも、付加的な手段によって構造が不安定化されない限り、安定なＲＮＡの二次構造には容易に侵入できないことを示唆している。以下の実施例８は、核酸結合分子が介在するとプライマー伸長がより容易になることを示している。ここで、結合ドメインによる抗原認識は、アダプターをＲＮＡ標的の直ぐ近くに固定し、アダプターの局所的な高濃度を引き起こし、その結果酵素反応が加速される（“近接効果（proximity effect）”）。

実施例８：免疫沈降ＲＮＡへのバーコードトランスファー
本実施例は実施例６の拡張形であり、非標識抗体の代わりにランダムアダプター標識抗体をプロテインＧビーズに添加し、プライマー伸長またはライゲーションによって免疫沈降核酸標的へのバーコードトランスファーを誘導した。

プロテインＧビーズに、ｍ６Ａ核酸結合分子（８ｂまたは１２ｂスペーサープライマー伸長アダプター付きＡｂ０５）、ｍ５Ｃ核酸結合分子（８ｂスペーサープライマー伸長アダプター付きＡｂ１６）またはＩ核酸結合分子（８ｂまたは１２ｂスペーサープライマー伸長アダプター付きＡｂ０５およびＡｂ１０）を個別に添加した。

それぞれのビーズを、２種のＲＮＡ標的またはＤＮＡ標的の混合物と共にインキュベートした。Ａｂ０５およびＡｂ１６ビーズを表７に示すｍ６Ａおよびｍ５ＣＲＮＡ標的（配列番号１３および１４）と共にインキュベートした。Ａｂ１０ビーズをｍ５ＣおよびＩＤＮＡ標的（配列番号１５および１６）と共にインキュベートした。ＲＮＡ鎖をビーズに結合させ、リン酸緩衝生理食塩水（ＰＢＳ）を用いて未結合の核酸を除去するために洗浄した。その後、ビーズをKlenowフラグメントを含むプライマー伸長バッファーに懸濁させた。

得られた産物（すなわち、バーコードにより伸長された標的ＲＮＡ）を１５％ＴＢＵゲルで可視化し、産物の長さおよび量を分析した（図２４Ａ）。８ｂスペーサープライマー伸長アダプターを用いたＡｂ１６は、ｍ５ＣＲＮＡ標的を正しくバーコード化した。ｍ６Ａ標的のバックグラウンドバーコードは検出されず、反応の特異性が証明された。１２ｂスペーサーのＡｂ０５はｍ６ＡＲＮＡ標的を正しくバーコード化したが、８ｂスペーサーバージョンはどの標的も沈降できなかった。非標識のＡｂ０５はｍ６Ａ標的を容易に沈降したことから、１２ｂスペーサーのさらなる安定化が結合に必要な程度まで標識が結合親和性を弱めたことが示唆された。Ａｂ１０も同じ現象を示した。１２ｂスペーサー版は標的を沈降させたが、８ｂスペーサー版は沈降させなかった。しかしながら、Ａｂ１０は完全に特異性を失い、スペーサー相互作用が抗体の選択性を上回っていた。図２４Ｂは、Ａｂ０５の活性およびＡｂ１０の特異性が８ｂスペーサーを用いて回復し、抗体部位を選択的に標識することで結合ドメインの障害を回避できることを示している。まとめると、プライマー伸長反応は抗体を介した形式では高い効率で機能するが、ランダム標識は、１２ｂスペーサーの存在下で、結合親和性を弱め得る（例えば、Ａｂ０５）、あるいは特異性に悪影響を与え得る（例えば、Ａｂ１０）。実施例７のプライマー伸長は、１２ｂスペーサーがＲＮＡ伸長には必要かもしれないことを示唆しているが、このデータセットは、近接効果が反応を加速させ、１２ｂスペーサーは長すぎ、特異性の欠如につながり得ることを明確に示している。したがって、将来の核酸結合分子は、図２４Ｂで示したように、８ｂスペーサーアダプターで標識され得る。

プライマーライゲーションによるバーコーディングでは、安定化スペーサー相互作用は見られなかった。図２４Ｃは、環状アダプター（配列番号３９）で標識されたＡｂ０１による、ｍ６Ａ標識ＲＮＡ標的（配列番号１７）のバーコード化を示す。ライゲーションによるバーコーディングおよび配列による解析のためのアダプター配列は、以下の構造を有した：

配列番号５７（5Phos=５’リン酸、太字＝ＭＢＣ、ＮＮＮ＝ＵＭＩ、イタリック体＝イルミナアダプター、iSP18=ＰＥＧリンカー、3AmMO=３’アミン）。ライゲーション条件は実施例６に記載したものと同じであった。反応収率は、遊離アダプターのライゲーションより約１０％高く、やはり近接による加速が証明された。

実施例９：核酸結合分子を１分子間隔で含むビーズの調製
プロテインＡ／Ｇダイナビーズに固定化した抗体による核酸標的の沈降がCHIP-Seqの標準的な方法であるが、本実施例で用いるビーズは、複数の利点を提供するためにカスタム化されている：（ｉ）改善された表面不動態化によって偽陽性が回避される（不動態化された表面はビーズへの非特異的結合を回避するので、修飾核酸の結合は実質的に核酸結合分子との相互作用を介する）；（ｉｉ）ビーズ表面上の核酸結合分子の密度は、例えば図５Ｂのバーコード化に必要な表面上の分子間の適切な空間的分離を提供するために、調節可能である；（ｉｉｉ）ビーズは、抗体Ｆｃ領域以外の他の認識要素の捕捉および／または共移植を容易にするように設計できる；（ｉｖ）核酸結合分子は共有結合しており、ワークフロー工程中に共溶出しない；および（ｖ）複数のタイプの核酸結合分子を表面上に存在させることができ、これはいくつかの用途に関連する。

カルボキシル化ダイナビーズ（Thermo）は、アミノ－ＰＥＧ４－アルコール（Broadpharm、ＢＰ－２０５８９）およびＭａｌ（マレイミド）－ＰＥＧ２－アミン（Broadpharm、ＢＰ－２３３１３）の二元系混合物で表面コーティングされている。Ｍａｌ（マレイミド）－ＰＥＧ２－アミンはシステインで修飾されたスパイキャッチャーを結合させるために用いられ、アミノ－ＰＥＧ－アルコールは核酸結合分子を空隙化し、非特異的結合に対してビーズ表面を不動態化する。アミノ－ＰＥＧ４－アルコールとＭａｌ－ＰＥＧ２－アミン（すなわち、不動態化分子：活性化分子）の比率は、約１００ｎｍ^２ごとに１つのスパイキャッチャー分子を固定化するように調整される。これにより、核酸結合分子は空間的に分離され、標的ＲＮＡに結合したときに他の分子から隔離されるため、分子内バーコードトランスファーが確実に行われる。

２５ｍＭのＭＥＳｐＨ５（２－（Ｎ－モルホリノ）エタンスルホン酸）でダイナビーズを洗浄した後、１００μＬのビーズの懸濁液に、２５ｍＭのＭＥＳｐＨ５で５０μＬの新鮮なＥＤＣ（Ｎ－（３－ジメチルアミノプロピル）－Ｎ’－エチルカルボジイミド塩酸塩）および５０μＬのＮＨＳ（Ｎ－ヒドロキシスクシンイミド）を添加する。室温で３０分間反応させる。その後、上清を除去し、ビーズを再度洗浄する。ＥＤＣ／ＮＨＳ工程後、ダイナビーズをアミノ－ＰＥＧ４－アルコールおよびＭＡＬ－ＰＥＧ２－アミンの二元系混合物でコーティングする。マレイミド基は次の工程でスパイキャッチャーに共有結合される。スパイキャッチャーを２０ｍＭＴｒｉｓｐＨ７に溶解させ、システイン基をＴＣＥＰ（トリス（２－カルボキシエチル）ホスフィン）で還元する。マレイミド活性化ビーズおよびスパイキャッチャータンパク質を混合し、室温で２時間反応させる。ビーズを洗浄した後、スパイタグＤＮＡコンジュゲートおよびスパイキャッチャータンパク質を反応させ、コンジュゲートをｑＰＣＲで定量することにより、ビーズあたりのスパイキャッチャータンパク質の数を算出する。スパイキャッチャー装飾ビーズを、実施例４に記載のスパイタグ－バインダー－バーコード結合体と反応させる。

実施例１０：捕捉プローブ密度を調整可能な不動態化ビーズの調製
図４Ｃに記載の標的化核酸修飾分析では、ビーズ上に目的の核酸配列を捕捉し、その後に非古典的特徴をコード化する。コード化複合体の表面密度を精密に制御することで分離させ、隣接する分子間の架橋を防ぐ。以下の方法は、種々の捕捉プローブ密度のビーズの調製について記載する。

多孔性ＮＨＳ活性化セファロースビーズ（Cytiva, カタログ番号17071601）を１００％イソプロパノールおよび１ｍＭＨＣｌで洗浄した。ビーズを不動態化し化学的機能化するために、０．２５Ｍ炭酸水素ナトリウム緩衝液ｐＨ８、０．５ＭＮａＣｌ、４０ｍＭＣＯＯＨ－ＰＥＧ４－アミン（不動態化分子；Broadpharm、カタログ番号BP-20423）および可変量のｍＴｅｔ（テトラジン）－ＰＥＧ４－アミン（官能基化分子;Broadpharm,カタログ番号BP-22435）中、室温で１６時間インキュベートした。mTet-PEG：カルボキシ-PEG比が１：１，０００、１：１０，０００、１：１００，０００のビーズを、４０μＭ、４００μＭ、４，０００μＭのmTet-PEGを用いて調製した。１００％カルボキシ-PEGビーズを作製し、バックグラウンドを測定した。ＤＮＡ捕捉プローブ（ＣＡＴＣＴＧＡＣＧＣＴＧＣＣＧＡＣＧＡＴＴＴＴＴＴ／３ＡｍＭＯ／；配列番号２０）の３’アミンをＮＨＳ－ＰＥＧ－ＴＣＯ（trans-cyclooctene）（Broadpharm, カタログ番号BP-22418）で活性化させ、１ｘＰＢＳＴ（１３７ｍＭＮａＣｌ、２．７ｍＭＫＣｌ、１０ｍＭＮａ_２ＨＰＯ_４、１．８ｍＭＫＨ_２ＰＯ_４、０．１％ Tween^{(登録商標)} 20界面活性剤）中、２２℃で１６時間、ｍＴｅｔと共に反応させることによりビーズ上に固定した。ｍＴｅｔ／ＴＣＯ対は、生理的条件下で８００Ｍ^－１ｓ^－１以上の速度で起こり、ジヒドロピリダジン結合を形成する、よく研究された逆需要型ディールス・アルダー付加環化反応である。

増幅可能なトレーサーオリゴヌクレオチド(ＴＣＧＴＣＧＧＣＡＧＣＧＴＣＡＧＡＴＧＡＴＴＧＴＧＴＴＡＧＧＣＴＡＧＴＡＡＧＴＡＧＡＴＧＧＡＴＴＡＧＡＣＣＧＴＣＧＡＧＴＧＡＧＴＡＧＡＧＴＡＣＧＴＡＧＴＧＣＡ、配列番号２１）をビーズ上の捕捉プローブにハイブリダイズさせた後、ｑＰＣＲにより捕捉プローブ密度を決定した。閾値サイクル（Ｃｔ）値は、検量線に基づいて１ビーズあたりのＤＮＡ分子数に変換された（図２５）。ｍＴｅｔ－ＰＥＧが１０倍増加するごとに、１０倍多くのトレーサー・オリゴヌクレオチドを捕捉でき、理論予測と一致した。近傍相互作用を防ぐ距離でコード化複合体を間隔をあけるｍＴｅｔ濃度を実験的に決定した（実施例１２参照）。バックグラウンドは低く、ｍＴｅｔ不含有ビーズで検出されたＤＮＡ鎖の数は、最高密度のビーズで検出された分子の０．１％に相当した。

実施例１１：モデル核酸結合ドメインおよびライゲーションを用いた溶液中での近接バーコーディング
ストレプトアビジンおよびビオチンの解離定数は約１０^－１４ｍｏｌ／Ｌのオーダーであり、自然界で知られている最も強い親和性相互作用の一つであり、修飾ＲＮＡ塩基に対する抗体の一般的な親和性よりも桁違いに強い。結合ドメインとしてのストレプトアビジンおよびビオチン化ライゲーションアダプターを含む単純な核酸結合分子が設計された。この方法の目的は、非常に高い親和性および特異性を有する結合ドメインを用いて、核酸結合分子のバーコードを、その分子が結合している標的ＲＮＡにのみトランスファーすることである。このようなモデル系は、プロセス制御として、また核酸結合分子の親和性が準無限である場合のバーコーディングの上限を探る上で有用である。

ストレプトアビジンおよびビオチンアダプター（配列番号３３）を低イオン強度緩衝液（１０ｍＭＴｒｉｓｐＨ７．５、５０ｍＭＮａＣｌ、１ｍＭＥＤＴＡ、０．０５％ Tween-20）中で１：１、１：２、１：３、１：４の比率で混合し、得られた複合体を天然の８％ＴＢＥゲルを用いた電気泳動で分析した（図２６Ａ）。ストレプトアビジンの４つのビオチン結合ポケットのうち３つは、ビオチンアダプターの濃度を増加させると埋まった。１：２の比率は、非標識ストレプトアビジンが存在せず、ビオチン化ＲＮＡ標的の結合に利用可能な結合ポケットがあるため、コード化に最適である。

溶液中での近接性コード化を証明するために、ストレプトアビジン核酸結合分子をｍ６Ａ修飾ＲＮＡ（オフターゲット；配列番号３２）およびビオチンＲＮＡ（オンターゲット；配列番号４０）の等モル混合物と混合した。ＲＮＡ鎖は色素標識され、ゲル電気泳動によってオンターゲットおよびオフターゲットのコード化を区別するためにサイズが異なっていた。ライゲーションは、５０ｍＭＴｒｉｓ－ＨＣｌｐＨ７．５、１０ｍＭＭｇＣｌ_２、１ｍＭＤＴＴ、０．５ｍＭＡＴＰ、４００ｎＭ１：２ストレプトアビジン－ビオチン－アダプター結合体、および１００ｎＭの各ＲＮＡ標的を用い、２２℃で１時間行った。ライゲーション反応中のＰＥＧ－８０００濃度は、分子クラウディングによって平均分子間間隔を調節するために０から２５％まで変化させた。ライゲーション後、ストレプトアビジンは、ゲル解析を容易にするために、ＵＳＥＲ（NEB, カタログ番号M5505L）を用いてアダプターをウラシル１個で切断することにより、アダプターから切り離された。分子クラウディングは生体分子が利用できる体積を減少させ、濃度を効果的に増加させた。この結果は、分子間の間隔が大きい低ＰＥＧ濃度では特異的なバーコード化が予測されるのに対し、高ＰＥＧ濃度では分子が凝縮され、架橋が誘発されるという理論と一致した（図２６Ｂ）。本実施例で観察された架橋は、ストレプトアビジン結合体が正しいビオチン－ＲＮＡに結合しているにもかかわらず、近接しているが結合していない別のｍ６ＡＲＮＡをバーコード化したときに生じた。本実施例は、溶液中でオンターゲットバーコーディングが可能であることを示している。

実施例１２：１分子ビーズ上のＲＮＡの配列特異的捕捉によるバーコードトランスファーおよびモデル核酸結合ドメインを用いたバーコード化
この実施例では、ストレプトアビジン由来の同じモデル結合ドメイン、および実施例１１に記載したのと同じ実験デザインを用いる。しかしながら、ライゲーション反応は、実施例１０に記載したように調製した固定化ビーズ上で行った。ビーズは、ｍＴｅｔ：カルボキシ－ＰＥＧの比が１：１００のセファロースビーズ、またはｍＴｅｔ：カルボキシ－ＰＥＧの比が１：１０００のセファロースビーズ、の２種類用いた。

各反応は、２，０００個の１：１００ｍＴＥＴ／カルボキシビーズまたは２０，０００個の１：１，０００ｍＴＥＴ/カルボキシビーズを捕捉ＤＮＡ（配列番号２０）で装飾したものを含む。ビーズをビオチン（配列番号３１）およびｍ６ＡＲＮＡ（配列番号３２）の混合物（１．５μＭ）と共に、０．１％ Tween20を含む８０μＬの５ＸＳＳＣバッファー中、３７℃で１時間インキュベートした。両ＲＮＡ標的は、ビーズ上の捕捉プローブと相補的な２１ｂ領域を示した。ハイブリダイゼーション終了後、２００μＬの高塩ＰＢＳＴ（０．１％ Tween20および３６０ｍＭＮａＣｌを含むＰＢＳ）で２回、１００μＬのＰＢＴ（０．１％ Tween20および３６０ｍＭＮａＣｌを含むＰＢＳ）で１回洗浄し、結合していない標的を除去した。ビーズを高塩ＰＢＳＴ中でストレプトアビジン－アダプター結合体と共に２０分間インキュベートした。過剰量のコンジュゲートを、ＲＮＡ標的について記載のように洗浄した。ライゲーションおよび分析を実施例１１と同様に行った。図２６Ｂは、１：１，０００ｍＴＥＴ／カルボキシビーズを用いたビオチン標的の特異的バーコーディング、および１：１００ｍＴＥＴ／カルボキシビーズを用いた架橋を示す。この実施例では、架橋は、１:１００ｍＴＥＴ／カルボキシビーズの密度が高いほど、ＲＮＡ標的が表面に密着した結果であった。

実施例１３：ライゲーションおよびＰＣＲによって測定されるプライマー伸長を用いる溶液中でのバーコードトランスファー
以下の方法の目的は、核酸結合タンパク質（すなわち、実施例３および４に記載の核酸結合タンパク質）のバーコードを、その分子が結合している標的ＲＮＡに排他的にトランスファーさせることである。

ｍ６Ａおよびｍ５Ｃ修飾を有する標的ＲＮＡ（図１８Ａおよび１８Ｂ）およびそれらの同族核酸結合分子を混合し、結合させる。バーコードトランスファー反応は溶液中で行われ、バーコードトランスファー機構はライゲーションまたはプライマー伸長のいずれかである。ライゲーションによるバーコードトランスファーの場合、バーコードは５’末端を介して核酸結合分子（すなわち抗体）の結合ドメインに結合され、バーコードの３’末端はあらかじめアデニル化されている。ライゲーションは、Ｔ４ＲＮＡリガーゼＩＩの添加によって開始される。プライマー伸長によるバーコードトランスファーでは、標的ＲＮＡの３’末端に短いスペーサー配列が付加され、バーコードはスペーサーに相補的な領域を含む。スペーサー伸長は、KlenowフラグメントなどのＤＮＡポリメラーゼおよびｄＮＴＰ（デオキシリボヌクレオチド三リン酸）を用いて、３７℃で５分間行う。

バーコードトランスファー効率、およびオフターゲットバーコードは、モデルオリゴヌクレオチド系を用いたＰＣＲによって測定される。正しいバーコードおよび誤ったバーコードの対形成は、図１８Ａおよび１８Ｂに記載されているように、ＰＣＲ産物の長さに基づいて決定される。具体的には、バーコードトランスファー反応の完了後、反応産物をＰＣＲ増幅し、産物のサイズをゲル電気泳動によって可視化する。予想外のサイズのバンドは、オフターゲットバーコード転移の発生を示す。この反応スキームは、最大のバーコードトランスファー効率および最小のオフターゲット活性のために、アダプターの構造、酵素の選択および反応条件を最適化するために用いられる。

実施例１４：ＲＮＡの配列特異的捕捉によるバーコードトランスファー
標的ＲＮＡそのものをビーズの表面に結合させるときにも、バーコードトランスファーを行うことができる（図４Ｃ）。標的ＲＮＡは、核酸ハイブリダイゼーションによってビーズ表面に捕捉される（すなわち、ビーズ表面への標的ＲＮＡの捕捉は、核酸結合分子による標的ＲＮＡの修飾の認識によって変わらない）。核酸ハイブリダイゼーションによる標的捕捉は、目的のゲノムまたはトランスクリプトーム領域の選択的濃縮を可能にする。

システイン修飾スパイキャッチャーの代わりに、チオール化ＤＮＡオリゴヌクレオチドが固定化されており、このチオール化ＤＮＡオリゴヌクレオチドの配列は標的ＲＮＡの領域に相補的である。これらの捕捉オリゴヌクレオチドは、分子内バーコード転移反応の特異性を確保するために、ビーズ表面上に１００ｎｍ^２あたり１分子以下で存在する。ｍ６Ａおよびｍ５Ｃモデルオリゴヌクレオチド（図１８Ａおよび１８Ｂ）は、ハイブリダイゼーションバッファー中に捕捉される。洗浄後、ｍ６Ａおよびｍ５Ｃに結合できる核酸結合分子のプールを加える。次に、実施例６および７に記載のように、ライゲーションまたはプライマー伸長によってバーコード転写反応を行う。バーコード導入効率および特異性をＰＣＲによって測定する。

実施例１５：結合ドメイン－シトシンデアミナーゼ結合体の調製および塩基編集の測定
シトシンデアミナーゼは、シトシンのウラシルへの加水分解的脱アミノ化（Ｃ－ｔｏ－Ｕ変異）を触媒する。この酵素は遺伝子編集に用いられており、触媒的に不活性なＣａｓ９－ガイドＲＮＡ複合体への融合によって目的の遺伝子領域に標的化される。この実施例では、シトシンデアミナーゼは結合ドメイン（例えば、抗体結合）によってＲＮＡ修飾に標的化された。その目的は、デアミナーゼ活性をＲＮＡ修飾に近接した数塩基のウィンドウに制限する結合ドメイン－デアミナーゼ結合体を設計することであった。

ほとんどのシトシンデアミナーゼは一本鎖ＤＮＡに作用する。ＡＰＯＢＥＣ１およびＡＰＯＢＥＣ３Ａは、ＲＮＡ編集活性を有することが知られている唯一の酵素であり、ラットＡＰＯＢＥＣ１（Uniprotアクセッション番号P38483）は、触媒的に不活性なＣａｓ９－ガイドＲＮＡ複合体を介する標的化ＲＮＡ編集に成功裏に用いられている。ヒトＹＴＨＤＦ２（Uniprotアクセッション番号Q9Y5A9）は、天然のｍ６Ａリーダータンパク質であり、配列によってＫ_Ｄ＝１５０－１２００ｎＭの範囲の解離定数でｍ６Ａと結合する。ｍ６Ａ標的結合ドメイン－デアミナーゼ結合体を得るために、２つのアプローチを用いた。１つは、ＡＰＯＢＥＣ１をＹＴＨＤＦ２に直接融合させるアプローチであった（Meyer, K. Nature Methods 16, 1275-1280 (2019)）。もう１つのアプローチは、スパイタグをＡＰＯＢＥＣ１に、スパイキャッチャーをＹＴＨＤＦ２に融合させ、アッセイワークフローの一部として共有結合体を形成するように反応させることであった。

初めに、３つの融合構築物を大腸菌細胞で発現させた：（１）ラットＡＰＯＢＥＣ１（ａａ１～２２９およびＹＴＨＤＦ２の結合ドメイン（ａａ３８５～５７９）を含むＡＰＯＢＥＣ１－ＹＴＨ－Ｈｉｓ（図２７および配列番号３４）、（２）同じＡＰＯＢＥＣ１およびスパイタグ００２を含むＡＰＯＢＥＣ１－スパイタグ－Ｈｉｓ（図２７および配列番号３５）、（３）表６に提供されるのと同じＹＴＨＤＦ２フラグメントおよびスパイキャッチャー００２（図２７および配列番号３６）を含むスパイキャッチャー－ＹＴＨ－Ｈｉｓ、（４）マルトース結合ドメイン（ＭＢＤ）、ＴＥＶプロテアーゼ切断部位（ＴＥＶ）、および上記のＡＰＯＢＥＣ１およびスパイキャッチャーを含むＭＢＤ－ＴＥＶ－ＡＰＯＢＥＣ１－スパイキャッチャー－Ｈｉｓ。スパイタグ００２およびスパイキャッチャー００２は、共有結合ペプチドタグとしてはこれまでに報告された中で最速の反応速度を示すＳｐｙシステムの最新版である。遺伝子はコドン最適化され、合成され、Ｃ－末端ｈｉｓ－タグを有するフレーム中でｐＥＴ－３０ａベクターにクローン化され、ＢＬ２１細胞で発現された。図２８は、１５℃で１６時間後および３７℃で４時間後に同様の誘導を示した。しかしながら、可溶性画分にはスパイキャッチャー－ＹＴＨ－Ｈｉｓのみが存在し、ＡＰＯＢＥＣ含有タンパク質はほとんど不溶性であった。ＡＰＯＢＥＣの溶解性の問題を解決するために、ＭＢＤ－ＴＥＶ－ＡＰＯＢＥＣ１－スパイキャッチャー－Ｈｉｓを作製した。このタンパク質は、ＡＰＯＢＥＣの両端に、優れた溶解性で知られるマルトース結合ドメイン（ＭＢＤ）およびスパイキャッチャーを配したものである。ＭＢＤの除去を可能にするためにＴＥＶ切断部位を導入した。この構築物は、特に１５℃で１６時間発現させると可溶性タンパク質を産生した（図２８）。核酸との静電的相互作用を破壊するため、細胞を高塩緩衝液で溶解し、ヌクレアーゼ（５０ｍＭＴｒｉｓ、５００ｍＭＮａＣｌ、１ｍＭＴＣＥＰ、ｐＨ８．０、ヌクレアーゼ（Thermo Fisher, カタログ番号８８７００）で処理した。ＭＢＤまたはＮｉカラムへの結合はいずれも中程度で、どちらのアフィニティタグも十分にアクセスできないことが示された。溶出した画分をプールし、サイズ排除精製（Superdex 200 カラム）にかけた（図２９Ａおよび２９Ｂ）。開発された最初のデアミナーゼ結合体は溶解性に欠けるが、これらのデータは、目的のヌクレオチド修飾に近接してデアミナーゼ活性を制限する適用のための、可溶性タンパク質タグ－デアミナーゼ結合体の作成を証明している。

実施例１６：バーコード、ｃＤＮＡ切断および環化によるＲＮＡプロファイリング
この実施例では、標的ＲＮＡ上の修飾は、核酸結合分子による認識と、それに続くＲＮＡ標的へのバーコードの転写によって同定される。修飾の位置は、逆転写の間のｃＤＮＡの切断によって明らかにされる(図８)。これは、核酸結合分子の結合ドメインの架橋によって誘導されるか、またはそれに応じて操作された結合ドメインによって誘導される。

Total Human Reference RNA(Thermo社製)を、リボＲＮＡを枯渇させ、マグネシウム（Ｍｇ^２＋）イオンと共に９５℃でインキュベートすることにより、平均１００～１５０ヌクレオチドのサイズに断片化する。ＲＮＡの３’末端は、Ｔ４ポリヌクレオチドキナーゼ（ＮＥＢ）およびエビアルカリホスファターゼ（ＮＥＢ）を用いて脱リン酸化する。Ｎ６－メチルアデノシン(ｍ６Ａ)、シュードウリジン(Ψ)、５－メチルシトシン(ｍ５Ｃ)を含む対照ＲＮＡオリゴヌクレオチド、および修飾のない類似オリゴヌクレオチドを陽性対照として既知濃度でＲＮＡサンプルにスパイクする。

ＲＮＡ修飾ｍ６Ａ、またはｍ５Ｃを認識する核酸結合分子を表示するビーズは、実施例４および５に記載の方法を用いて作製される。各ビーズタイプは、単一種の核酸結合分子を表示する。アダプターの設計は図２Ｂに記載した通りである。ビーズを混合し、結合バッファー中でＲＮＡサンプルと共にインキュベートし、その後０．１５Ｊｃｍ^－２（２５４ｎｍ）のＵＶ光で架橋する。上清には未修飾ＲＮＡが含まれるが、修飾ＲＮＡはビーズに結合している。

ＲＮＡ修飾の存在量および化学量論を測定するために、非修飾ＲＮＡ画分および修飾ＲＮＡ画分を、分割（split）ワークフローを用いてＲＮＡ－Ｓｅｑライブラリーに変換する（図７参照）。非修飾ＲＮＡ画分のバーコード化を以下のように行う：タイプＢアダプター（図２Ｂ）を上清に加え、Ｔ４ＲＮＡリガーゼを用いてＲＮＡの３’末端にライゲーションする。アダプターは核酸結合分子には結合しておらず、すべての未修飾ＲＮＡ鎖は同じアダプターおよびバーコードを受け取る。必要に応じて、ＲＮＡはエタノール入りＲＬＴバッファー（Qiagen）中で、Dynabeads^(商標) MyOne^(商標) 生理食塩水（Thermo Fisher）への物理的吸着を用いてアッセイ工程中に精製される。修飾ＲＮＡの場合、バーコードはビーズ固定化核酸結合分子からＲＮＡ分子にトランスファーされる。ＲＮＡ分子は核酸結合分子を介してビーズに結合したままである。この工程後、すべてのプロトコール工程は、非修飾ＲＮＡおよび修飾ＲＮＡで同一である。ユニバーサルプライマーが添加され、Superscript III（Thermo社）によって伸長され、ｃＤＮＡは修飾部位で切断される。環状ｃＤＮＡを形成するために、CircLigase II（Lucigen）と共に６０℃でインキュベートすることにより、分子内ライゲーションが開始される。制限酵素でアダプターをＵＦＰ領域とＵＲＰ領域の間で切断した後（図２Ｂ）、ｃＤＮＡを、配列決定アダプターを用いたＰＣＲによってライブラリーに変換する。修飾画分および非修飾画分を配列決定前に合わせ、２０００万リードで配列決定する。ｍ６Ａ、Ψ、ｍ５Ｃのタイプ、数および位置は、以下のように情報提供される。対照オリゴヌクレオチドを、並列ライブラリー調製中の非効率性を考慮するための対照として用いる。

実施例１７：バーコーディングおよび塩基編集による修飾プロファイリングを伴う標的捕捉および鎖ＲＮＡライブラリー調製
この実施例では、特定のＲＮＡ配列がハイブリダイゼーションによって濃縮され、ライブラリー調製中に鎖情報が保持される。単一分子間隔の捕捉プローブを有するビーズを、実施例１０に記載したように調製する。各ビーズタイプは、特定のＲＮＡ遺伝子座に対する捕捉プローブを表示し、ビーズタイプは、何れかの数のＲＮＡ遺伝子座に対応するようにプールされる。

断片化したＲＮＡを、ハイブリダイゼーションバッファー（５×クエン酸生理食塩水（ＳＳＣ）、４０％ホルムアミド、０．１％Tween-20洗剤）中、ビーズプールとともに３７℃で１６時間インキュベートする。ＲＮＡ鎖は修飾状態に関係なく捕捉プローブに結合する。１０種の修飾に対して核酸結合分子のプールを加える。核酸結合分子は、スパイタグ（配列番号１０）を軽鎖のＣ末端に遺伝子工学的に導入した修飾特異的ＩｇＧ抗体を含む。修飾の位置標識のために、デアミナーゼ－スパイキャッチャー融合タンパク質を添加し、このタンパク質はスパイタグと迅速に反応し、Ｃ－ｔｏ－Ｕ変異で修飾の位置を標識する。タンパク質コンジュゲートを除去した後、遊離アダプターを用いた２回目のライゲーション工程で、ＲＮＡの修飾されていない部分をバーコード化する。ある遺伝子座について、修飾化学量論は修飾バーコードの数を全バーコードで割ったものに相当する。その後、第一鎖ｃＤＮＡ合成を標準的方法を用いて行い、第２鎖をｄＵＴＰの存在下で合成した。得られたライブラリーをＵＳＥＲ酵素（NEB）で処理して、２本目の鎖を除去し、そうして鎖情報を保存する。その後、ＤＮＡシークエンシングにより、ＲＮＡサンプル中のすべての部位におけるＲＮＡ修飾の位置を同定する。

実施例１８：鎖分離、バーコード化および塩基編集によるＤＮＡ修飾のプロファイリング
この実施例では、アダプター結合ＤＮＡのビーズへの共有結合固定化を用いて、鎖分離の保持を強制し、非古典的特徴の正確な位置をマーキングするための一本鎖特異的シトシンデアミナーゼによる塩基編集を可能にする（図９）。

ＤＮＡサンプルは、せん断力または当業者に知られている他の一般的な方法を用いて断片化される。ＤＮＡ鎖の末端修復およびＡ－テイリングの後、Ｙ字型アダプターが両末端にライゲーションされる。これらのアダプターは、合成オリゴヌクレオチドの広く利用されている修飾である３’－アジド修飾を特徴とする。二重鎖ＤＮＡの変性（鎖分離）に適した条件下（例えば、エタノールやアセトニトリルのような極性有機溶媒中、あるいはホルムアミドの９５％水溶液中）で、クリック反応を用いて一本鎖ＤＮＡを基質に一分子間隔で共有結合させる。このクリック反応は、Ｃｕ（Ｉ）触媒によるアジド－ＤＮＡと低密度の表面結合アルキンとの間のアジド－アルキン環化付加反応、歪み促進アジド－アルキン環化付加反応、またはこのハウステン化学の他の変形であり得る。

固定化後、変性条件を除去し（例えば、溶媒交換または溶媒蒸発によって）、そのバーコードに連結された核酸結合分子とともに緩衝水溶液を導入する。その後、非古典的特徴を特異的に認識することによって決定されるように、Ｔ４ＤＮＡリガーゼによって触媒されるスプリントＤＮＡライゲーションによって、バーコードトランスファーが行われる。

バーコードトランスファーの完了後、シトシンデアミナーゼと結合した二次抗体を導入し、非古典的特徴の部位に近接してＣ－ｔｏ－Ｕ塩基編集を行う。塩基編集後、ＤＮＡ鎖はＵＳＥＲ切断を用いて基質から切断される。次にプライマーが導入されアダプターに結合し、ＤＮＡポリメラーゼがウラシルの部位で切断されたｃＤＮＡ合成に用いられる。ライブラリー調製およびＤＮＡ配列決定により、ＤＮＡサンプル中のすべての部位における非古典的特徴の位置が同定される。

実施例１９：２サイクルのＲＮＡ修飾プロファイリングおよび塩基編集を伴うＤＮＡライブラリー調製
この実施例では、複数の修飾およびその発生が、同じＲＮＡ標的鎖上で検出される。これは、核酸結合分子による修飾認識と、それに続くプライマー伸長によるバーコード転写の２ラウンドによって達成される（図１４Ａおよび１４Ｂに示される）。各プライマー伸長後、同じタイプの複数の修飾の存在が塩基編集によって記録される。

編集サイクルを区別するために、最初のサイクルではアデノシンデアミナーゼによる塩基編集（Ａ－ｔｏ－Ｉ変異）が行われ、２番目のｃｙＲＮＡは化学的に平均２００－３００ｂｐのサイズに断片化される。プライマー伸長によるバーコード導入を可能にするため、短い８塩基のスペーサーがＲＮＡの３’末端にライゲーションされる。このスペーサーは、入ってくるバーコードおよびユニバーサルプライマーのハイブリダイゼーション部位として機能する。ライゲーションされたＲＮＡ断片は、１種のビーズを用いて免疫沈降され、約２時間結合させる。ビーズを洗浄した後、KlenowフラグメントおよびｄＮＴＰを用いて、３７℃で約５分間インキュベートすることにより、バーコードトランスファーを行う。この工程で、ＤＮＡ標的が結合しているビーズのタイプをマークする。

修飾の位置は、修飾部位の近くにＡからＩへの変異を導入することによってコードされる。この目的のために、二次抗体－アデノシンデアミナーゼ結合体を添加し、反応させる。

編集が完了したら、ＲＮＡを溶出し、第２のビーズタイプで免疫沈降させる。バーコードトランスファーおよび塩基編集を繰り返すが、今回はＣからＵへの変異を導入したシトシンデアミナーゼで塩基編集が行われる。２回目のサイクルで転写されるバーコードには、ＤＮＡ標的を増幅可能にするためのユニバーサルプライマーキャップが含まれている。ウラシル修飾を許容するＤＮＡポリメラーゼを用いたアダプターＰＣＲにより、塩基配列決定のためのライブラリーが作製される。

実施例２０：インビトロ翻訳および機能試験のためのＡＰＯＢＥＣ－スパイキャッチャー融合タンパク質の設計
この実施例では、標的化脱アミノ化のために設計された脱アミナーゼ酵素の発現に、無細胞のインビトロ翻訳系を用いる。大腸菌でのＡＰＯＢＥＣ１の発現で観察された溶解性およびタンパク質のフォールディングの問題は、ＡＰＯＢＥＣのＤＮＡ編集活性が宿主細胞のゲノムを損傷するため、細胞毒性に起因すると考えられる。インビトロ翻訳系は、毒性があり発現が困難なタンパク質によく用いられる。図３０は、ＸＴＥＮリンカーを介してスパイキャッチャーに融合したＡＰＯＢＥＣ１およびＡＰＯＢＥＣ３Ａ（Ｅ１０９Ａ）のアミノ酸配列を示す（それぞれ配列番号４２および４３）。実施例１５で用いた遺伝子とは対照的に、親和性精製のためのhisタグおよび不要なＧＳリンカーは、酵素の構造的障害を最小限にするために省略した。ＡＰＯＢＥＣ１融合タンパク質については、Ｔ７プロモーター領域を有するプライマーを用いて、配列番号３７を発現するプラスミドから遺伝子をＰＣＲ増幅した。ＡＰＯＢＥＣ３Ａ酵素は、ＡＰＯＢＥＣ３Ａ（Ｅ１０９Ａ）配列（ＩＤＴ）を有するｇｂｌｏｃｋにクローニングすることにより、同じプラスミドから構築した。両酵素は、PURExpress^{(登録商標)} インビトロタンパク質合成キット（New England Biolabs）を用いて、スパイキャッチャー融合を用いて発現させた。各ＰＣＲ増幅遺伝子５００ｎｇをインプットとして、製造業者のプロトコールに従って反応を組み立てた。３７℃で５時間、タンパク質を発現させた。

酵素活性は、ＦＡＭで標識したＤＮＡオリゴヌクレオチドに、目的の酵素を含む未精製の無細胞抽出物を加えて測定した。シチジンデアミナーゼ活性はＣをＵに変換し、次いでＵＳＥＲ酵素（NEB）によって切断された。図３１は、３７℃で３０分間インキュベートした後、無細胞抽出液の濃度を下げながら観察された切断産物を示す。最も濃縮された反応は、１０μＬの反応液（１００ｎＭＦＡＭ－ＤＮＡ、１０ｍＭビス－トリス－プロパン－ＨＣｌｐＨ７、１０ｍＭＭｇＣｌ_２、１００μｇ／ｍＬＢＳＡ）中に１．２５μＬの無細胞抽出物を含んだ。無細胞抽出液をさらに１：２、１：４、１:８、１:１６に希釈した。ＡＰＯＢＥＣ１Ａは弱い脱アミノ化活性を示し、これはスパイキャッチャータンパク質存在下で増強された。比較すると、ＡＰＯＢＥＣ３ＡはＡＰＯＢＥＣ１Ａよりも少なくとも１０倍活性が高かったが、スパイキャッチャー融合体を添加すると、穏やかに阻害された。

これらの結果は、触媒的に活性なＡＰＯＢＥＣ１およびＡＰＯＢＥＣ３Ａ融合酵素をインビトロ翻訳系で発現させることが可能であることを確認するものである。

実施例２１：ＡＰＯＢＥＣ－スパイキャッチャー融合タンパク質による標的化脱アミノ化
この実施例は、ＡＰＯＢＥＣ－スパイキャッチャー融合タンパク質が、スパイキャッチャーおよびスパイタグの相互作用を介してＤＮＡ鎖の特定の部位に標的化できることを示す。共有結合性のスパイキャッチャー／スパイタグ反応により、デアミナーゼ活性が付着部位近傍の領域に限定される。

図３２は、デアミナーゼ活性ウィンドウのサイズを測定するために用いた被毒プライマーアッセイ（ＰＰＡ）を記載する。複数のＣを一定の間隔で含むＤＮＡまたはＲＮＡ鋳型を、ＦＡＭ標識プライマーとハイブリダイズさせた。プライマーの伸長は、ＤＮＡ鋳型をデアミナーゼで処理した後、ｄＣＴＰ、ｄＴＴＰ、ｄＧＴＰおよびｄｄＡＴＰとＤＮＡポリメラーゼ（ＤＮＡ鋳型の場合はKlenowフラグメント）または逆転写酵素（ＲＮＡ鋳型の場合はＭ－ＭＬＶ）の存在下で行った。Ｃ－ｔｏ－Ｕ編集の存在はｄｄＡＴＰの取り込みを促し、プライマーの終結を引き起こした。伸長産物のサイズ分布を変性ゲル電気泳動で分析し、塩基編集部位を特定した。

最初に、ＰＰＡアッセイを市販のＡＰＯＢＥＣ３Ａ（New England Biolabs）を用いて試験した。図３３は、ＡＰＯＢＥＣ３ＡがＤＮＡ鋳型（ＵおよびＣ鋳型は、それぞれ配列番号４４および４５である）上では高活性であったが、ＲＮＡ（ＵおよびＣ鋳型は、それぞれ配列番号４６および４７である）上では弱活性を有していたことを示す。従って、この酵素は、ＤＮＡ中の非古典的特徴の位置をマークするのに適した候補である。

デアミナーゼを図６Ｃに示すような非古典的特徴に標的化する能力を試験するために、簡略化したモデル系を用いた（図３４）。スパイタグ標識結合ドメインを用いるのではなく、スパイタグペプチドをＤＮＡ鎖（例えば配列番号５０）にチミン位置で直接結合させた。スパイタグペプチドは、チミンにおける最初のＣ（配列番号４８）から２６ｂ離れた遠位側、またはチミンにおける最初のＣ（配列番号４９）から２ｂ離れた近位側に結合した。

図３５は、ＡＰＯＢＥＣ３Ａ融合タンパク質を用いて実施した標的化脱アミノ化アッセイの結果を示す。１００ｎＭのＤＮＡ鋳型（スパイタグ有無下）を、脱アミノ化バッファー（１０ｍＭビス－トリス－プロパン－ＨＣｌｐＨ７、１０ｍＭＭｇＣｌ_２、１００μｇ／ｍＬＢＳＡ）中、４２μＬの総反応容量中で、ＡＰＯＢＥＣ３ＡおよびＡＰＯＢＥＣ３Ａ－スパイキャッチャーを含む７．６μＬの無細胞抽出物と共にインキュベートした。１分、３分、８分、１５分後に８μＬの時間点を採取し、脱アミナーゼを直ちに９５℃で熱失活させた。Klenow ＤＮＡポリメラーゼミックス１μＬを反応液に加え、終濃度１０μＭｄＴＴＰ、１０μＭｄＣＴＰ、１０μＭｄＧＴＰ、２００μＭｄｄＡＴＰおよび０．２ユニット／μＬのKlenow ＤＮＡポリメラーゼｅｘｏ（－）を得た。ＰＰＡ反応を３７℃で１０分間進行させ、変性ゲル電気泳動で分析した。ＦＡＭ標識プライマー（配列番号５１）を用いて、編集の位置を特定した。

図３５は、スパイキャッチャーを融合したＡＰＯＢＥＣ３Ａと融合していないＡＰＯＢＥＣ３Ａで観察されたゲルバンディングパターンの明確な違いを示している。スパイキャッチャーおよびスパイタグがない場合、様々な大きさの編集された（停止した）バンドによって示されるように、７つのＣのそれぞれが等しく編集されている。両者の存在下では、プライマー＋２および＋７のバンドのみが時間とともに蓄積し、酵素の到達範囲が狭いことを示している。これらの失敗に終わった生成物の蓄積は、スパイタグが近位に付着している場合により顕著であった。

この実施例は、スパイタグ／スパイキャッチャーを介してＡＰＯＢＥＣ３Ａを反応部位に繋ぎ止めることにより、部位特異的脱アミノ化を強制した最初の例を示す。

実施例２２：ＤＮＡ／ＲＮＡヘテロ二重鎖の２プレックス標的タグメンテーション
この実施例では、ＲＮＡ修飾特異的バーコーディングは、標的化タグメンテーションによって促進される。これは、タグメンテーションが可能なモザイクエンド（ＭＥ）アダプターをＲＮＡ特異的抗体に結合させることにより達成される。抗体をＲＮＡ修飾に結合させた後、Ｔｎ５トランスポザーゼを抗体結合ＭＥアダプターにロードすることにより、活性トランスポソームがインサイチュウで組み立てられる。これにより、トランスポザーゼが修飾部位に標的化され、部位特異的タグメンテーションが可能になり、修飾部位に隣接してバーコード化されたアダプターが挿入される。

ｍ６Ａ特異的抗体を２つのバーコード化ｉ５－ＭＥ配列(ｉ５－ＭＥ－ＢＣ１）で修飾し、ｍ５Ｃ特異的抗体をサイトクリックケミストリーを用いて他の２つのｉ５－ＭＥ配列(ｉ５－ＭＥ－ＢＣ２)に結合させる(実施例４)。改変対照ＲＮＡ鋳型は、プラスミドＤＮＡをＴ７ＲＮＡポリメラーゼでインビトロ転写することにより作製する。ＰｈｉＸゲノムの２０００ｂｐのＰＣＲアンプリコン(NEB, カタログ番号Ｎ３０２３Ｓ)をｍ６Ａ三リン酸存在下で転写し、Ｍ１３ｍｐ１８一本鎖ＤＮＡの２０００ｂｐのＰＣＲアンプリコン(NEB, カタログ番号Ｎ４０４０Ｓ)をｍ５Ｃ三リン酸存在下で転写する。両配列は配列特異的ハイブリダイゼーションプローブを介して磁気ビーズ上に捕捉される（図３６、工程Ａ）。捕捉されたＲＮＡは、SuperScript IIリバーストランスクリプターゼのためのプライマーとして捕捉プローブを用いて逆転写される（図３６、工程Ｂ）。固定化されたＲＮＡ／ＤＮＡ二重鎖に個別または異なるバーコード化ｉ５－ＭＥ－抗体結合体のプールを添加し、飽和結合に達するまでインキュベートする（図３６、工程Ｃ）。次に、機能的トランスポソームがインサイチュウで組み立てられる：最初の工程では、表面に結合したｉ５－ＭＥ－抗体結合体に遊離のＴｎ５およびＭＥ’オリゴを加えることにより、抗体結合ｉ５－Ｔｎ５モノマーが生成される（図３６、工程Ｄ）。Ｔｎ５は、今、二本鎖となったｉ５－ＭＥ／ＭＥ’アダプターに結合する。第２の工程では、ｉ７－ＭＥ/ＭＥ’アダプターをあらかじめ付加したＴｎ５が付加され、ｉ５－/ｉ７－Ｔｎ５二量体が生じる（図３６、工程Ｅ）。トランスポソームのアセンブリー後、ＭｇＣｌ_２含有バッファーを添加することによりタグメンテーションが開始され（図３６、工程Ｆ）、図１５Ａ－１５Ｄに示すように、バーコード化されたアダプターを有する生成物が形成される。タグメンテーションによりＲＮＡ／ＤＮＡ断片がビーズから放出され、上清のサイズプロファイルがＰＣＲの前後でキャピラリー電気泳動により分析される。得られたリードの配列決定およびＰｈｉＸまたはＭ１３ゲノムへのアラインメントにより、Ｍ１３リードにはｍ５Ｃ特異的バーコードが、ＰｈｉＸリードにはｍ６Ａ特異的バーコードが正しく割り当てられていることが確認された。このように、このプロセスでは、標的化タグメンテーションによって、１回の反応で１以上のＲＮＡ修飾を検出することができる。

種々の態様
添付の特許請求の範囲にかかわらず、以下の番号付けされた態様も本発明の一部を構成する。
１．ｉ）結合ドメイン、および
ｉｉ）アダプター、
を含む核酸結合分子であって、前記結合ドメインは、ＤＮＡまたはＲＮＡの非古典的特徴に特異的に結合し、前記アダプターは、結合ドメインによって特異的に結合される非古典的特徴に特有の核酸バーコード配列を含む、核酸結合分子
２．結合ドメインが、抗体、ナノボディ、アプタマー、リーダータンパク質、ライタータンパク質、イレイサータンパク質、人工高分子スキャフォールド、人工タンパク質スキャフォールド、または選択的共有結合キャプチャー試薬、またはそれらのフラグメントもしくは誘導体を含む、態様１に記載の核酸結合分子。
３．リーダータンパク質が、ＮＵＤＴ１６またはＹＴＨＤＣ２、またはそれらのフラグメントもしくは誘導体である、態様２に記載の核酸結合分子。
４．ライタータンパク質が、ＤＮＴＭ１、ＤＮＴＭ３Ａ／Ｂ、ＮＡＴ１０、ＭＥＴＴＬ３、ＭＥＴＴＬ８、ＭＥＴＴＬ１４、ＭＥＴＴＬ１６、ＴＲＭ、ＢＭＴ、ＤＵＳ２、ＰＵＳ、またはＮＳＵＮ２、またはそれらのフラグメントもしくは誘導体である、態様２に記載の核酸結合分子。
５．イレイサータンパク質が、ＦＴＯ、ＡＬＫＢＨ３またはＡＬＫＢＨ５、またはそれらのフラグメントもしくは誘導体である、態様２に記載の核酸結合分子。
６．結合ドメインが触媒活性を有さない、態様２に記載の核酸結合分子。
７．アダプターが切断可能である、態様１～６のいずれか１つに記載の核酸結合分子。
８．アダプターが、ユニバーサルフォワードプライマー（ＵＦＰ）およびユニバーサルリバースプライマー（ＵＲＰ）の少なくとも１つを含む、態様１～７のいずれか１つに記載の核酸結合分子。
９．アダプターがユニーク分子識別子（ＵＭＩ）を含む、態様１～８のいずれか１つに記載の核酸結合分子。
１０．非古典的特徴が修飾ヌクレオシドである、態様１～９のいずれか１つに記載の核酸結合分子。
１１．修飾ヌクレオシドが、３－メチルシチジン（ｍ３Ｃ）、５－メチルシチジン（ｍ５Ｃ）、Ｎ４－アセチルシチジン（ａｃ４Ｃ）、シュードウリジン（Ψ）、１－メチルアデノシン（ｍ１Ａ）、Ｎ６－メチルアデノシン（ｍ６Ａ）、イノシン（Ｉ）、７－メチルグアノシン（ｍ７Ｇ）、ジヒドロウリジン（Ｄ）、３－メチルウリジン（ｍ３Ｕ）、５－メチルウリジン（ｍ５Ｕ）、１－メチルグアノシン（ｍ１Ｇ）、Ｎ２－メチルグアノシン（ｍ２Ｇ）、５－メチルデオキシシチジン（ｍ５ｄＣ）、Ｎ４－メチルデオキシシチジン、５－ヒドロキシメチルシチジン（５－ｈｍＣ）、５－ヒドロキシメチルデオキシシチジン（５ｈｍｄＣ）、５－カルボキシデオキシシチジン（５ｃａｄＣ）、５－ホルミルシチジン（５ｆＣ）、５－ホルミルデオキシシチジン（５ｆｄＣ）、６－メチルデオキシアデノシン、Ｎ７－メチルグアノシン（ｍ７Ｇ）、２，７，２’－メチルグアノシン、またはリボースメチル化（Ｎｍ）である、態様１０に記載の核酸結合分子。
１２．非古典的特徴が核酸損傷である、態様１～９のいずれか１つ記載の核酸結合分子。
１３．核酸損傷が、酸化プロセスまたは紫外線との接触に起因するものである、態様１２に記載の方法。
１４．核酸損傷が、外因性薬剤による大きい付加体形成または塩基アルキル化に起因する、態様１２に記載の方法。
１５．損傷が、８－オキソグアニン（８－ｏｘｏＧ）、１以上の脱塩基部位、シス－プラチン架橋、ベンゾ（ａ）ピレンジオールエポキシド（ＢＰＤＥ）付加体、シクロブテンピリミジン二量体（ＣＰＤ）、ピリミジン－ピリミドン（６－４）光生成物（６－４ＰＰ）、６－Ｏ－メチルグアニン（Ｏ^６－ＭｅｄＧ）、またはＯ６－（カルボキシメチル）－２’－デオキシグアノシン（Ｏ６－ＣＭｄＧ）である、請求項１２に記載の核酸結合分子。
１６．非古典的特徴が構造的要素である、態様１～９のいずれか１つに記載の核酸結合分子。
１７．構造的要素が、ヘアピン、ループ、Ｚ－ＤＮＡ構造、Ｇ－四重鎖、ｉ－モチーフ、バルジ、三重鎖、三叉結合、十字形構造、四重鎖、リボースジッパー、またはシュードノットである、態様１６に記載の核酸結合分子。
１８．結合ドメインが、少なくとも１つの修飾ヌクレオシドと接触している、態様１～１７のいずれか１つに記載の核酸結合分子。
１９．結合ドメインが、修飾ヌクレオシドおよびそれに隣接する１以上のヌクレオチドと接触している、態様１～１８のいずれか１つに記載の核酸結合分子。
２０．アダプターがリンカーを含み、結合ドメインがリンカーに結合している、態様１～１９のいずれか１つに記載の核酸結合分子。
２１．核酸結合分子が、酵素またはその触媒フラグメントもしくは誘導体をさらに含む、態様１～２０のいずれか１つに記載の核酸結合分子。
２２．酵素が塩基編集酵素である、態様２１に記載の核酸結合分子。
２３．塩基編集酵素がシトシンデアミナーゼまたはアデノシンデアミナーゼである、態様２２に記載の核酸結合分子。
２４．塩基編集酵素において、ＡＰＯＢＥＣ１もしくはＡＰＯＢＥＣ３Ａ、またはそれらの触媒フラグメントもしくは誘導体である、態様２３に記載の核酸結合分子。
２５．酵素が、ＤＮＡもしくはＲＮＡメチラーゼ、またはシュードウリジン合成酵素、またはそれらの触媒フラグメントもしくは誘導体である、態様２３に記載の核酸結合分子。
２６．酵素がＤＮＡＮ－グリコシラーゼまたはＲＮＡＮ－グリコシラーゼである、態様２１に記載の核酸結合分子。
２７．酵素がトランスポザーゼまたはインテグラーゼである、態様２１に記載の核酸結合分子。
２８．酵素が触媒活性を欠く、態様２１に記載の核酸結合分子。
２９．結合ドメインおよび酵素またはそのフラグメントを含むコンジュゲートであって、結合ドメインが態様１～２８のいずれか１つに記載の核酸結合分子に結合する、コンジュゲート。
３０．結合ドメインとそのフラグメントの酵素とが共有結合している、態様２９に記載のコンジュゲート。
３１．結合ドメインおよび酵素またはそのフラグメントが非共有結合している、態様２９に記載のコンジュゲート。
３２．酵素がＴｎ５トランスポザーゼである、態様２９～３１のいずれか１つに記載のコンジュゲート。
３３．タグメンターゼ（tagmentase）がプロテインＡ、Ｇ、またはＬと融合している、態様３２に記載のコンジュゲート。
３４．ｉ）ペプチドタグをさらに含む、態様１～２８のいずれか１つに記載の核酸結合分子、および（ｉｉ）ペプチドタグと共有結合的に反応し得るタンパク質タグに融合した酵素またはそのフラグメント、を含むコンジュゲート。
３５．ｉ）タンパク質タグをさらに含む、態様１～２８のいずれか１つに記載の核酸結合分子、および（ｉｉ）タンパク質タグと共有結合的に反応し得るペプチドタグに融合した酵素またはそのフラグメント、を含むコンジュゲート。
３６．ペプチドタグがＳｐｙｔａｇである、態様３４～３５のいずれか一項に記載のコンジュゲート。
３７．酵素がデアミナーゼであり、スパイキャッチャータンパク質に融合される、態様３４～３６のいずれか１つに記載のコンジュゲート。
３８．ｉ）態様１～２８のいずれか１つに記載の核酸結合分子と、（ｉｉ）結合ドメインの特定の領域に高親和性で結合し得るタンパク質に融合した酵素またはそのフラグメントとを含むコンジュゲート。
３９．結合ドメインがＩｇＧ抗体またはそのフラグメントである、態様３８に記載のコンジュゲート。
４０．酵素が、プロテインＡ、ＧまたはＬに融合したデアミナーゼである、態様３９に記載のコンジュゲート。
４１．ｉ）核酸タグをさらに含む、態様１～２８のいずれか１つに記載の核酸結合分子、および（ｉｉ）核酸結合分子の核酸タグにハイブリダイズし得る相補的核酸タグに融合した酵素またはそのフラグメント、を含むコンジュゲート。
４２．標的核酸に結合した、態様１～２８のいずれか１つに記載の核酸結合分子を含む複合体。
４３．核酸結合分子および標的核酸が共有結合している、態様４２に記載の複合体。
４４．態様１～２８のいずれか１つに記載の核酸結合分子に結合した基質。
４５．基質が、ビーズ、チップ、プレート、スライド、ディッシュ、または３次元マトリックスである、態様４４に記載の基質。
４６．核酸結合分子が基質の表面に結合している、態様４５に記載の基質。
４７．核酸結合分子が、捕捉分子を介して間接的に基質の表面に結合され、前記捕捉分子が基質に直接結合される、態様４６に記載の基質。
４８．捕捉分子が核酸結合分子を結合する、態様４７に記載の基質。
４９．捕捉分子が標的核酸と結合している、態様４７に記載の基質。
５０．核酸結合分子が、捕捉分子に結合している標的核酸に結合する、態様４７に記載の基質。
５１．核酸結合分子が、基質の表面上で第２の核酸結合分子から空間的に分離されている、態様４４～５０のいずれか１つに記載の基質。
５２．態様１～２８のいずれか１つに記載の核酸結合分子に結合したポリマー。
５３．態様１～２８のいずれか１つに記載の核酸結合分子の製造方法であって、結合ドメインをアダプターにカップリングさせて、結合ドメイン－アダプターコンジュゲートを形成することを含む、製造方法。
５４．複数の標的核酸を分析する方法であって、
（ｉ）標的核酸を、態様１～２８のいずれか１つに記載の核酸結合分子と接触させる工程；
（ｉｉ）（ａ）バーコード化核酸のオフターゲット生成を実質的に阻止する環境下で、核酸バーコードを標的核酸に転写してバーコード化標的核酸を生成するか、または（ｂ）標的核酸のバーコード化コピーを生成する工程；
（ｉｉｉ）非古典的特徴の位置がバーコード化標的核酸またはそのバーコード化コピーの一次核酸配列に基づいて識別可能であるように、バーコード化標的核酸またはそのバーコード化コピーを改変する工程；および
（ｉｖ）バーコード化標的核酸の塩基配列を決定する工程
を含む、分析方法。
５５．バーコード転写を容易にするために、工程（ｉ）の前に、標的核酸の３’末端に短い核酸配列を付加することを含む、態様５４に記載の方法。
５６．工程（ｉ）～（ｉｉｉ）を少なくとも１回繰り返す、態様５４に記載の方法。
５７．工程（ｉ）～（ｉｉｉ）を繰り返すたびに、異なる核酸結合分子を使用する、態様５６に記載の方法。
５８．工程（ｉ）～（ｉｉｉ）を繰り返すたびに、同じ核酸結合分子を使用する、態様５６に記載の方法。
５９．核酸バーコードが、一本鎖ライゲーション、スプリントライゲーション、プライマー伸長、または二本鎖ライゲーションによって酵素的に標的核酸にトランスファーされる、態様２１に記載の方法。
６０．核酸バーコードが、プライマー伸長によって標的核酸にトランスファーされ、ここで、プライマー伸長が、標的核酸の３’末端へのユニバーサル配列を有する核酸のライゲーションによって始まる、態様５９に記載の方法。
６１．核酸バーコードが、プライマー伸長によって標的ＲＮＡにトランスファーされ、ここで、プライマー伸長が、１種のリボヌクレオチドおよび競合する相補的なポリ－ｄＴ、ポリ－ｄＡ、ポリ－ｄＧ、またはポリ－ｄＣオリゴヌクレオチドと組み合わせて、大腸菌ポリ（Ａ）ポリメラーゼまたはシゾサッカロマイセス・ポンビーＣｉｄ１のポリ（Ｕ）ポリメラーゼを用いて、標的核酸の３’末端を酵素的にテイル付加することによって始まる、態様６０に記載の方法。
６２．配列決定前に、バーコード化標的核酸またはそのコピーを増幅することを含む、態様５４～６１のいずれか１つに記載の方法。
６３．標的核酸が、ＤＮＡ、ＲＮＡ、またはそれらの混合物を含む、態様５４～６１のいずれか１つに記載の方法。
６４．標的核酸が少なくとも１つの非古典的特徴を含む、態様５４～６３のいずれか１つに記載の方法。
６５．非古典的特徴が修飾ヌクレオシドである、態様６４に記載の方法。
６６．修飾ヌクレオシドが、３－メチルシチジン（ｍ３Ｃ）、５－メチルシチジン（ｍ５Ｃ）、Ｎ４－アセチルシチジン（ａｃ４Ｃ）、シュードウリジン（Ψ）、１－メチルアデノシン（ｍ１Ａ）、Ｎ^６－メチルアデノシン（ｍ６Ａ）、イノシン（Ｉ）、７－メチルグアノシン（ｍ７Ｇ）、ジヒドロウリジン（Ｄ）、３－メチルウリジン（ｍ３Ｕ）、５－メチルウリジン（ｍ５Ｕ）、１－メチルグアノシン（ｍ１Ｇ）、Ｎ^２－メチルグアノシン（ｍ２Ｇ）、５－メチルデオキシシチジン（ｍ５ｄＣ）、Ｎ^４－メチルデオキシシチジン、５－ヒドロキシメチルシチジン（５－ｈｍＣ）、５－ヒドロキシメチルデオキシシチジン（５ｈｍｄＣ）、５－カルボキシデオキシシチジン（５ｃａｄＣ）、５－ホルミルシチジン（５ｆＣ）、５－ホルミルデオキシシチジン（５ｆｄＣ）、６－メチルデオキシアデノシン、Ｎ^７－メチルグアノシン（ｍ７Ｇ）、２，７，２’－メチルグアノシン、またはリボースメチル化（Ｎｍ）である、態様６１に記載の方法。
６７．非古典的特徴が核酸損傷である、態様６４に記載の方法。
６８．核酸損傷が、酸化プロセスまたは紫外線との接触に起因する、態様６７に記載の方法。
６９．核酸損傷が、外因性薬剤による大きい付加体形成または塩基アルキル化に起因する、態様６７に記載の方法。
７０．損傷が、８－オキソグアニン（８－ｏｘｏＧ）、１以上の脱塩基部位、シス－プラチン架橋、ベンゾ（ａ）ピレンジオールエポキシド（ＢＰＤＥ）付加体、シクロブテンピリミジン二量体（ＣＰＤ）、ピリミジン－ピリミドン（６－４）光生成物（６－４ＰＰ）、６－Ｏ－メチルグアニン（Ｏ^６－ＭｅｄＧ）、またはＯ６－（カルボキシメチル）－２’－デオキシグアノシン（Ｏ６－ＣＭｄＧ）である、態様６４に記載の核酸結合分子。
７１．非古典的特徴が構造的要素である、態様６４に記載の方法。
７２．構造的要素が、ヘアピン、ループ、Ｚ－ＤＮＡ構造、Ｇ－四重鎖、ｉ－モチーフ、バルジ、三重鎖、三叉結合、十字形構造、テトラループ、リボースジッパー、またはシュードノットである、態様７１に記載の方法。
７３．核酸結合分子が基質の表面に結合され、他の核酸結合分子から空間的に分離され、各標的核酸が１つの標的核酸結合分子としか接触できないようにする、態様５４～７２のいずれか１つに記載の方法。
７４．核酸バーコードが、該バーコードまたはその相補体を標的核酸の５’末端または３’末端に共有結合させることによって標的核酸にトランスファーされる、態様５４～７３のいずれか一項に記載の方法。
７５．核酸バーコードが、一本鎖ライゲーション、スプリントライゲーション、プライマー伸長、または二本鎖ライゲーションによって酵素的に標的核酸にトランスファーされる、態様５４～７３のいずれか１つに記載の方法。
７６．核酸バーコードが、化学ライゲーションによって標的核酸にトランスファーされる、態様５４～７３のいずれか１つに記載の方法。
７７．修飾が、核酸結合分子を標的核酸に光化学的または化学的に連結することを含む、態様５４～７６のいずれか１つに記載の方法。
７８．結合ドメインが、核酸標的との共有結合反応を促進する配向で化学架橋部分を提示する、態様５４～７７のいずれか１つに記載の方法。
７９．修飾が、核酸結合分子が標的核酸に結合する部位またはその近傍の塩基を編集することを含む、態様５４～７７のいずれか一項に記載の方法。
８０．複数の標的核酸中の２以上の非古典的特徴を検出する方法および／または定量する方法であって、
（ｉ）標的核酸を少なくとも２つの核酸結合分子と接触させる工程であって、各核酸結合分子は結合ドメインおよびアダプターを含み、各核酸結合分子の結合ドメインがＤＮＡまたはＲＮＡの異なる非古典的特徴に結合し、アダプターは各結合ドメインによって特異的に結合される非古典的特徴に特異的な核酸バーコード配列を含む、工程；
（ｉｉ）（ａ）バーコード化核酸のオフターゲット生成を実質的に防止する環境下で、核酸バーコードを標的核酸にトランスファーしてバーコード化標的核酸を生成するか、または（ｂ）標的核酸のバーコード化コピーを生成する、工程；
（ｉｉｉ）非古典的特徴の位置がバーコード化標的核酸またはそのバーコード化コピーの一次核酸配列に基づいて同定可能であるように、バーコード化標的核酸またはそのバーコード化コピーを改変する工程；および
（ｖｉ）バーコード化された標的核酸の塩基配列を決定する工程
を含む、方法。
８１．配列決定の前に、バーコード化標的核酸またはそのコピーを増幅することを含む、態様８０に記載の方法。
８２．標的核酸が、ＤＮＡ、ＲＮＡ、またはそれらの混合物を含む、態様８０または８１に記載の方法。
８３．非古典的特徴の少なくとも１つが修飾ヌクレオシドである、態様８０～８２のいずれか１つに記載の方法。
８４．修飾ヌクレオシドが、３－メチルシチジン（ｍ３Ｃ）、５－メチルシチジン（ｍ５Ｃ）、Ｎ^４－アセチルシチジン（ａｃ４Ｃ）、シュードウリジン（Ψ）、１－メチルアデノシン（ｍ１Ａ）、Ｎ^６－メチルアデノシン（ｍ６Ａ）、イノシン（Ｉ）、７－メチルグアノシン（ｍ７Ｇ）、ジヒドロウリジン（Ｄ）、３－メチルウリジン（ｍ３Ｕ）、５－メチルウリジン（ｍ５Ｕ）、１－メチルグアノシン（ｍ１Ｇ）、Ｎ^２－メチルグアノシン（ｍ２Ｇ）、５－メチルデオキシシチジン（ｍ５ｄＣ）、Ｎ^４－メチルデオキシシチジン、５－ヒドロキシメチルシチジン（５－ｈｍＣ）、５－ヒドロキシメチルデオキシシチジン（５ｈｍｄＣ）、５－カルボキシデオキシシチジン（５ｃａｄＣ）、５－ホルミルシチジン（５ｆＣ）、５－ホルミルデオキシシチジン（５ｆｄＣ）、６－メチルデオキシアデノシン、Ｎ^７－メチルグアノシン（ｍ７Ｇ）、２，７，２’－メチルグアノシン、またはリボースメチル化（Ｎｍ）である、態様８３に記載の方法。
８５．非古典的特徴が核酸損傷である、態様８２に記載の方法。
８６．核酸損傷が、酸化プロセスまたは紫外線との接触に起因する、態様８５に記載の方法。
８７．核酸損傷が、外因性薬剤による大きい付加体形成または塩基アルキル化に起因する、態様８５に記載の方法。
８８．損傷が、８－オキソグアニン（８－ｏｘｏＧ）、１以上の脱塩基部位、シス－プラチン架橋、ベンゾ（ａ）ピレンジオールエポキシド（ＢＰＤＥ）付加体、シクロブテンピリミジン二量体（ＣＰＤ）、ピリミジン－ピリミドン（６－４）光生成物（６－４ＰＰ）、６－Ｏ－メチルグアニン（Ｏ^６－ＭｅｄＧ）、またはＯ６－（カルボキシメチル）－２’－デオキシグアノシン（Ｏ６－ＣＭｄＧ）である、態様８２に記載の核酸結合分子。
８９．非古典的特徴の少なくとも１つが構造的要素である、態様８０～８２のいずれか１つに記載の方法。
９０．構造的要素が、ヘアピン、ループ、Ｚ－ＤＮＡ構造、Ｇ－四重鎖、ｉ－モチーフ、バルジ、三重鎖、三叉結合、十字形構造、四重ループ、リボースジッパー、または偽結合である、態様８９に記載の方法。
９１．核酸結合分子が基質の表面に結合され、各標的核酸が１つの標的核酸結合分子のみに接触できるように空間的に分離されている、態様８０～９０のいずれか１つに記載の方法。
９２．核酸バーコードが、バーコードまたはその相補体を標的核酸の５’末端または３’末端に共有結合させることによって標的核酸に転移される、態様８０～９１のいずれか１つに記載の方法。
９３．核酸バーコードが、一本鎖ライゲーション、スプリントライゲーション、プライマー伸長、または二本鎖ライゲーションによって酵素的に標的核酸に転移される、態様８０～９１のいずれか１つに記載の方法。
９４．核酸バーコードが、化学ライゲーションによって標的核酸に転写される、態様８０～９０のいずれか一項に記載の方法。
９５．修飾が、核酸結合分子を標的核酸に光化学的に連結することを含む、態様８０～９４のいずれか１つに記載の方法。
９６．修飾が、核酸結合分子が標的核酸に結合する部位またはその近傍の塩基を編集することを含む、態様８０～９４のいずれか１つに記載の方法。
９７．標的核酸中の非古典的特徴を検出する方法であって、
（ｉ）標的核酸を、態様１～２８のいずれか１つに記載の核酸結合分子と接触させる工程；
（ｉｉ）（ａ）バーコード化標的核酸のオフターゲット生成を実質的に防止する環境下で、核酸バーコードを標的核酸にトランスファーしてバーコード化標的核酸を生成する工程；および
（ｉｉｉ）標的核酸またはそのコピー中のバーコードの存在を検出する工程
を含む、方法。
９８．非古典的特徴が修飾ヌクレオシドである、態様９７に記載の方法。
９９．修飾ヌクレオシドが、３－メチルシチジン（ｍ３Ｃ）、５－メチルシチジン（ｍ５Ｃ）、Ｎ^４－アセチルシチジン（ａｃ４Ｃ）、シュードウリジン（Ψ）、１－メチルアデノシン（ｍ１Ａ）、Ｎ^６－メチルアデノシン（ｍ６Ａ）、イノシン（Ｉ）、７－メチルグアノシン（ｍ７Ｇ）、ジヒドロウリジン（Ｄ）、３－メチルウリジン（ｍ３Ｕ）、５－メチルウリジン（ｍ５Ｕ）、１－メチルグアノシン（ｍ１Ｇ）、Ｎ^２－メチルグアノシン（ｍ２Ｇ）、５－メチルデオキシシチジン（ｍ５ｄＣ）、Ｎ^４－メチルデオキシシチジン、５－ヒドロキシメチルシチジン（５－ｈｍＣ）、５－ヒドロキシメチルデオキシシチジン（５ｈｍｄＣ）、５－カルボキシデオキシシチジン（５ｃａｄＣ）、５－ホルミルシチジン（５ｆＣ）、５－ホルミルデオキシシチジン（５ｆｄＣ）、６－メチルデオキシアデノシン、Ｎ^７－メチルグアノシン（ｍ７Ｇ）、２，７，２’－メチルグアノシン、またはリボースメチル化（Ｎｍ）である、態様９８に記載の方法。
１００．非古典的特徴が核酸損傷である、態様９７に記載の方法。
１０１．核酸損傷が、酸化プロセスまたは紫外線との接触に起因する、態様１００に記載の方法。
１０２．核酸損傷が、外因性薬剤による大きい付加体形成または塩基アルキル化に起因する、態様１００に記載の方法。
１０３．損傷が、８－オキソグアニン（８－ｏｘｏＧ）、１以上の脱塩基部位、シス－プラチン架橋、ベンゾ（ａ）ピレンジオールエポキシド（ＢＰＤＥ）付加体、シクロブテンピリミジン二量体（ＣＰＤ）、ピリミジン－ピリミドン（６－４）光生成物（６－４ＰＰ）、６－Ｏ－メチルグアニン（Ｏ^６－ＭｅｄＧ）、またはＯ６－（カルボキシメチル）－２’－デオキシグアノシン（Ｏ６－ＣＭｄＧ）である、態様１００に記載の方法。
１０４．非古典的特徴が構造的要素である、態様１００に記載の方法。
１０５．構造的要素が、ヘアピン、ループ、Ｚ－ＤＮＡ構造、Ｇ－四重鎖、ｉ－モチーフ、バルジ、三重鎖、三叉結合、十字形構造、四重鎖、リボースジッパー、または偽結合である、請求項１０４に記載の方法。
１０６．トランスファーが、バーコードまたはその相補体を標的核酸の５’末端または３’末端に共有結合させることを含む、態様９７～１０５のいずれか一項に記載の方法。
１０７．核酸バーコードが、一本鎖ライゲーション、スプリントライゲーション、スプリント伸長、テンプレート伸長、または二本鎖ライゲーションによって標的核酸にトランスファーされる、態様９７～１０５のいずれか１つに記載の方法。
１０８．核酸バーコードが、化学ライゲーションによって標的核酸にトランスファーされる、態様９７～１０５のいずれか１つに記載の方法。
１０９．工程（ｉ）～（ｉｉｉ）を少なくとも１回繰り返す、態様９７～１０８のいずれか１つに記載の方法。
１１０．バーコードの存在を検出することが、バーコード化標的核酸またはそのバーコード化コピーを改変することを含む、態様９７～１０９のいずれか１つに記載の方法。
１１１．バーコードの存在を検出することが、バーコード化標的核酸またはそのコピーを増幅することを含む、態様９７～１０９のいずれか１つに記載の方法。
１１２．バーコードの存在を検出することが、バーコード化標的核酸を配列決定することを含む、態様９７～１０９のいずれか１つに記載の方法。
１１３．標的核酸中の非古典的特徴の位置を、一塩基分解能の近傍または一塩基分解能で決定する方法であって
（ｉ）標的核酸を、態様１～２８のいずれか１つに記載の核酸結合分子と接触させる工程；
（ｉｉ）バーコード化された標的核酸のオフターゲット生成を実質的に防止する環境下で、バーコード化された標的核酸を生成するために、核酸バーコードを標的核酸にトランスファーする工程；および
（ｉｉｉ）標的核酸またはそのコピー中のバーコードの存在を検出する工程；
ここで、核酸結合分子は、以下のうちの１以上が可能な結合ドメインを含む：
（ａ）標的核酸に変異を誘導する；または
（ｂ）ポリメラーゼのバイパスを防ぎ、標的核酸のコピー中に切断を引き起こす工程
を含む、方法。
１１４．ポリメラーゼバイパスを防止することが、核酸結合分子を標的核酸に化学的または光化学的に連結することを含む、態様１１３に記載の方法。
１１５．ポリメラーゼバイパスを防止することが、標的核酸のコピーの間に切断を誘導するように結合ドメインを化学的に改変することを含む、態様１１３に記載の方法。
１１６．非古典的特徴が修飾ヌクレオシドである、態様１１３～１１５のいずれか１つに記載の方法。
１１７．修飾ヌクレオシドが、３－メチルシチジン（ｍ３Ｃ）、５－メチルシチジン（ｍ５Ｃ）、Ｎ^４－アセチルシチジン（ａｃ４Ｃ）、シュードウリジン（Ψ）、１－メチルアデノシン（ｍ１Ａ）、Ｎ^６－メチルアデノシン（ｍ６Ａ）、イノシン（Ｉ）、７－メチルグアノシン（ｍ７Ｇ）、ジヒドロウリジン（Ｄ）、３－メチルウリジン（ｍ３Ｕ）、５－メチルウリジン（ｍ５Ｕ）、１－メチルグアノシン（ｍ１Ｇ）、Ｎ^２－メチルグアノシン（ｍ２Ｇ）、５－メチルデオキシシチジン（ｍ５ｄＣ）、Ｎ^４－メチルデオキシシチジン、５－ヒドロキシメチルシチジン（５－ｈｍＣ）、５－ヒドロキシメチルデオキシシチジン（５ｈｍｄＣ）、５－カルボキシデオキシシチジン（５ｃａｄＣ）、５－ホルミルシチジン（５ｆＣ）、５－ホルミルデオキシシチジン（５ｆｄＣ）、６－メチルデオキシアデノシン、Ｎ^７－メチルグアノシン（ｍ７Ｇ）、２，７，２’－メチルグアノシン、またはリボースメチル化（Ｎｍ）である、態様１１６に記載の方法。
１１８．非古典的特徴が核酸損傷である、態様１１３～１１５のいずれか１つに記載の方法。
１１９．核酸損傷が、酸化的過程または紫外線との接触に起因する、態様１１８に記載の方法。
１２０．核酸損傷が、外因性薬剤による大きい付加体形成または塩基アルキル化に起因する、態様１１８に記載の方法。
１２１．損傷が、８－オキソグアニン（８－ｏｘｏＧ）、１以上の脱塩基部位、シス－プラチン架橋、ベンゾ（ａ）ピレンジオールエポキシド（ＢＰＤＥ）付加体、シクロブテンピリミジン二量体（ＣＰＤ）、ピリミジン－ピリミドン（６－４）光生成物（６－４ＰＰ）、６－Ｏ－メチルグアニン（Ｏ^６－ＭｅｄＧ）、またはＯ６－（カルボキシメチル）－２’－デオキシグアノシン（Ｏ６－ＣＭｄＧ）であ、態様１１８に記載の方法。
１２２．非古典的特徴が構造的要素である、態様１１３～１１５のいずれか１つに記載の方法。
１２３．構造的要素が、ヘアピン、ループ、Ｚ－ＤＮＡ構造、Ｇ－四重鎖、ｉモチーフ、バルジ、三重鎖、三叉結合、十字形構造、四重ループ、リボースジッパー、または偽結合である、態様１２２に記載の方法。
１２４．トランスファーが、バーコードまたはその相補体を標的核酸の５’末端または３’末端に共有結合させることを含む、態様１１３～１２３のいずれか１つに記載の方法。
１２５．工程（ｉ）～（ｉｉｉ）を少なくとも１回繰り返す、態様１１３～１２３のいずれか１つに記載の方法。
１２６．工程（ｉ）～（ｉｉｉ）を繰り返すたびに、異なる核酸結合分子を使用する、態様１２４に記載の方法。
１２７．工程（ｉ）～（ｉｉｉ）を繰り返すたびに、同じ核酸結合分子を使用する、態様１２４に記載の方法。
１２８．バーコードの存在を検出することが、バーコード化標的核酸またはそのバーコード化コピーを改変することを含む、態様１１３～１２７のいずれか１つに記載の方法。
１２９．バーコードの存在を検出することが、バーコード化標的核酸またはそのコピーを増幅することを含む、態様１１３～１２７のいずれか１つに記載の方法。
１３０．バーコードの存在を検出することが、バーコード化標的核酸を配列決定することを含む、態様１１３～１２７のいずれか１つに記載の方法。
１３１．バーコードの存在を検出することが、核酸および核酸結合分子のアダプターを配列決定することを含む、態様１１３～１２７のいずれか１つに記載の方法。
１３２．核酸バーコードを標的核酸にトランスファーさせることが、バーコードまたはその相補体を標的核酸の５’末端または３’末端に共有結合させることを含む、態様１１３～１３１のいずれか一項に記載の方法。

Claims

ｉ）結合ドメイン、および
ｉｉ）アダプター、
を含む核酸結合分子であって、前記結合ドメインは、ＤＮＡまたはＲＮＡの非古典的特徴に特異的に結合し、前記アダプターは、結合ドメインによって特異的に結合される非古典的特徴に特有の核酸バーコード配列を含む、核酸結合分子。
結合ドメインが、抗体、ナノボディ、アプタマー、リーダータンパク質、ライタータンパク質、イレイサータンパク質、人工高分子スキャフォールド、人工タンパク質スキャフォールド、または選択的共有結合キャプチャー試薬、またはそれらのフラグメントもしくは誘導体を含む、請求項１に記載の核酸結合分子。
リーダータンパク質が、ＮＵＤＴ１６またはＹＴＨＤＣ２、またはそれらのフラグメントもしくは誘導体である、請求項２に記載の核酸結合分子。
ライタータンパク質が、ＤＮＴＭ１、ＤＮＴＭ３Ａ／Ｂ、ＮＡＴ１０、ＭＥＴＴＬ３、ＭＥＴＴＬ８、ＭＥＴＴＬ１４、ＭＥＴＴＬ１６、ＴＲＭ、ＢＭＴ、ＤＵＳ２、ＰＵＳ、またはＮＳＵＮ２、またはそれらのフラグメントもしくは誘導体である、請求項２に記載の核酸結合分子。
イレイサータンパク質が、ＦＴＯ、ＡＬＫＢＨ３またはＡＬＫＢＨ５、またはそれらのフラグメントもしくは誘導体である、請求項２に記載の核酸結合分子。
結合ドメインが触媒活性を有さない、請求項２に記載の核酸結合分子。
アダプターが切断可能である、請求項１から６のいずれか一項に記載の核酸結合分子。
アダプターがユニバーサルフォワードプライマー（ＵＦＰ）およびユニバーサルリバースプライマー（ＵＲＰ）の少なくとも１つを含む、請求項１から７のいずれか一項に記載の核酸結合分子。
アダプターがユニーク分子識別子（ＵＭＩ）を含む、請求項１から８のいずれか一項に記載の核酸結合分子。
非古典的特徴が修飾ヌクレオシドである、請求項１から９のいずれか一項に記載の核酸結合分子。
修飾ヌクレオシドが、３－メチルシチジン（ｍ３Ｃ）、５－メチルシチジン（ｍ５Ｃ）、Ｎ４－アセチルシチジン（ａｃ４Ｃ）、シュードウリジン（Ψ）、１－メチルアデノシン（ｍ１Ａ）、Ｎ６－メチルアデノシン（ｍ６Ａ）、イノシン（Ｉ）、７－メチルグアノシン（ｍ７Ｇ）、ジヒドロウリジン（Ｄ）、３－メチルウリジン（ｍ３Ｕ）、５－メチルウリジン（ｍ５Ｕ）、１－メチルグアノシン（ｍ１Ｇ）、Ｎ２－メチルグアノシン（ｍ２Ｇ）、５－メチルデオキシシチジン（ｍ５ｄＣ）、Ｎ４－メチルデオキシシチジン、５－ヒドロキシメチルシチジン（５－ｈｍＣ）、５－ヒドロキシメチルデオキシシチジン（５ｈｍｄＣ）、５－カルボキシデオキシシチジン（５ｃａｄＣ）、５－ホルミルシチジン（５ｆＣ）、５－ホルミルデオキシシチジン（５ｆｄＣ）、６－メチルデオキシアデノシン、Ｎ７－メチルグアノシン（ｍ７Ｇ）、２，７，２’－メチルグアノシン、またはリボースメチル化（Ｎｍ）である、請求項１０に記載の核酸結合分子
非古典的特徴が核酸損傷である、請求項１から９のいずれか一項に記載の核酸結合分子。
核酸損傷が酸化プロセスまたは紫外線との接触に起因するものである、請求項１２記載の方法。
核酸損傷が外因性薬剤による大きい付加体形成または塩基アルキル化に起因する、請求項１２に記載の方法。
損傷が、８－オキソグアニン（８－ｏｘｏＧ）、１以上の脱塩基部位、シス－プラチン架橋、ベンゾ（ａ）ピレンジオールエポキシド（ＢＰＤＥ）付加体、シクロブテンピリミジン二量体（ＣＰＤ）、ピリミジン－ピリミドン（６－４）光生成物（６－４ＰＰ）、６－Ｏ－メチルグアニン（Ｏ^６－ＭｅｄＧ）、またはＯ６－（カルボキシメチル）－２’－デオキシグアノシン（Ｏ６－ＣＭｄＧ）である、請求項１２に記載の核酸結合分子。
非古典的特徴が構造的要素である、請求項１から９のいずれか一項に記載の核酸結合分子。
構造的要素が、ヘアピン、ループ、Ｚ－ＤＮＡ構造、Ｇ－四重鎖、三重鎖、ｉ－モチーフ、バルジ、三重鎖、三叉結合、十字形構造、四重鎖、リボースジッパー、またはシュードノットである、請求項１６に記載の核酸結合分子。
結合ドメインが少なくとも１つの修飾ヌクレオシドと接触している、請求項１から１７のいずれか一項に記載の核酸結合分子。
結合ドメインが修飾ヌクレオシドおよびそれに隣接する１以上のヌクレオチドと接触している、請求項１から１８のいずれか一項に記載の核酸結合分子。
アダプターがリンカーを含み、結合ドメインがリンカーに結合している、請求項１から１９のいずれか一項に記載の核酸結合分子。
核酸結合分子が、酵素またはその触媒フラグメントもしくは誘導体をさらに含む、請求項１から２０のいずれか一項に記載の核酸結合分子。
酵素が塩基編集酵素である、請求項２１に記載の核酸結合分子。
塩基編集酵素がシトシンデアミナーゼまたはアデノシンデアミナーゼである、請求項２２に記載の核酸結合分子。
塩基編集酵素が、ＡＰＯＢＥＣ１またはＡＰＯＢＥＣ３Ａ、またはそれらの触媒フラグメントもしくは誘導体である、請求項２３に記載の核酸結合分子。
塩基編集酵素が、ＤＮＡもしくはＲＮＡメチラーゼ、またはシュードウリジン合成酵素、またはそれらの触媒フラグメントもしくは誘導体である、請求項２３に記載の核酸結合分子。
酵素が、ＤＮＡＮ－グリコシラーゼまたはＲＮＡＮ－グリコシラーゼである、請求項２１に記載の核酸結合分子。
酵素がトランスポザーゼまたはインテグラーゼである、請求項２１に記載の核酸結合分子。
酵素が触媒活性を欠く、請求項２１に記載の核酸結合分子。
結合ドメインおよび酵素またはそのフラグメントを含むコンジュゲートであって、前記結合ドメインが請求項１から２８のいずれか一項に記載の核酸結合分子に結合する、コンジュゲート。
結合ドメインおよびそのフラグメントの酵素が共有結合している、請求項２９に記載のコンジュゲート。
結合ドメインおよび酵素またはそのフラグメントが非共有結合している、請求項２９に記載のコンジュゲート。
酵素がＴｎ５トランスポザーゼである、請求項２９から３１のいずれか一項に記載のコンジュゲート。
タグメンターゼがプロテインＡ、ＧまたはＬと融合している、請求項３２に記載のコンジュゲート。
（ｉ）ペプチドタグをさらに含む、請求項１から２８のいずれか一項に記載の核酸結合分子、および（ｉｉ）ペプチドタグと共有結合反応し得るタンパク質タグに融合した酵素またはそのフラグメント、を含むコンジュゲート。
（ｉ）タンパク質タグをさらに含む、請求項１から２８のいずれか一項に記載の核酸結合分子、および（ｉｉ）タンパク質タグと共有結合反応し得るペプチドタグに融合した酵素またはそのフラグメント、を含むコンジュゲート。
ペプチドタグがＳｐｙｔａｇである、請求項３４から３５のいずれか一項に記載のコンジュゲート。
酵素がデアミナーゼであり、Ｓｐｙｃａｔｃｈｅｒタンパク質に融合している、請求項３４から３６のいずれか一項に記載のコンジュゲート。
（ｉ）請求項１から２８のいずれか一項に記載の核酸結合分子、および（ｉｉ）結合ドメインの特定領域に高親和性で結合し得るタンパク質に融合した酵素またはそのフラグメント、を含むコンジュゲート。
結合ドメインがＩｇＧ抗体またはそのフラグメントである、請求項３８に記載のコンジュゲート。
酵素がプロテインＡ、ＧまたはＬに融合したデアミナーゼである、請求項３９に記載のコンジュゲート。
（ｉ）核酸タグをさらに含む、請求項１から２８のいずれか一項に記載の核酸結合分子、および（ｉｉ）核酸結合分子の核酸タグにハイブリダイズし得る相補的核酸タグに融合した酵素またはそのフラグメント、を含むコンジュゲート。
標的核酸に結合した請求項１から２８のいずれか一項に記載の核酸結合分子を含む複合体。
核酸結合分子および標的核酸が共有結合している、請求項４２に記載の複合体。
請求項１から２８のいずれか一項に記載の核酸結合分子に結合した基質。
基質が、ビーズ、チップ、プレート、スライド、ディッシュ、または３次元マトリックスである、請求項４４に記載の基質。
核酸結合分子が基質の表面に結合している、請求項４５に記載の基質。
核酸結合分子が、捕捉分子を介して間接的に基質の表面に結合され、前記捕捉分子が基質に直接結合されている、請求項４６に記載の基質。
捕捉分子が核酸結合分子に結合している、請求項４７に記載の基質。
捕捉分子が標的核酸と結合している、請求項４７に記載の基質。
核酸結合分子が、捕捉分子に結合している標的核酸に結合する、請求項４７に記載の基質。
核酸結合分子が、基質の表面上で第２の核酸結合分子から空間的に分離されている、請求項４４から５０のいずれか一項に記載の基質。
請求項１から２８のいずれか一項に記載の核酸結合分子に結合したポリマー。
請求項１から２８のいずれか一項に記載の核酸結合分子の製造方法であって、結合ドメインをアダプターに結合させて、結合ドメイン－アダプターコンジュゲートを形成することを含む、製造方法。
複数の標的核酸を分析する方法であって、
（ｉ）標的核酸を請求項１から２８のいずれか一項に記載の核酸結合分子と接触させる工程；
（ｉｉ）（ａ）バーコード化核酸のオフターゲット生成を実質的に阻止する環境下で、核酸バーコードを標的核酸へと移してバーコード化標的核酸を生成するか、または（ｂ）標的核酸のバーコード化コピーを生成する、工程；
（ｉｉｉ）非古典的特徴の位置がバーコード化標的核酸またはそのバーコード化コピーの一次核酸配列に基づいて同定可能であるように、バーコード化標的核酸またはそのバーコード化コピーを改変する工程；および
（ｉｖ）バーコード化標的核酸の配列を決定する工程
を含む、分析方法。
バーコードの転写を容易にするために、工程（ｉ）の前に標的核酸の３’末端に短い核酸配列を付加することを含む、請求項５４に記載の方法。
工程（ｉ）～（ｉｉｉ）を少なくとも１回繰り返す、請求項５４に記載の方法。
工程（ｉ）～（ｉｉｉ）を反復するたびに異なる核酸結合分子を用いる、請求項５６に記載の方法。
工程（ｉ）～（ｉｉｉ）を反復するたびに同じ核酸結合分子を用いる、請求項５６に記載の方法。
核酸バーコードが、一本鎖ライゲーション、スプリントライゲーション、プライマー伸長、または二本鎖ライゲーションにより酵素的に標的核酸にトランスファーされる、請求項２１に記載の方法。
核酸バーコードが、プライマー伸長によって標的核酸に移され、ここでプライマー伸長が、標的核酸の３’末端へのユニバーサル配列を有する核酸のライゲーションによって始まる、請求項５９に記載の方法。
核酸バーコードが、プライマー伸長によって標的ＲＮＡに移され、ここでプライマー伸長が、１種のリボヌクレオチドおよび競合する相補的なポリ－ｄＴ、ポリ－ｄＡ、ポリ－ｄＧ、またはポリ－ｄＣオリゴヌクレオチドとともに、大腸菌ポリ（Ａ）ポリメラーゼまたはシゾサッカロマイセス・ポンビーＣｉｄ１のポリ（Ｕ）ポリメラーゼを用いて、標的核酸の３’末端を酵素的にテイル付加することによって始まる、請求項６０に記載の方法。
配列決定前に、バーコード化標的核酸またはそのコピーを増幅することを含む、請求項５４から６１のいずれか一項に記載の方法。
標的核酸がＤＮＡ、ＲＮＡまたはそれらの混合物を含む、請求項５４から６１のいずれか一項に記載の方法。
標的核酸が少なくとも１つの非古典的特徴を含む、請求項５４から６３のいずれか一項に記載の方法。
非古典的特徴が修飾ヌクレオシドである、請求項６４に記載の方法。
修飾ヌクレオシドが、３－メチルシチジン（ｍ３Ｃ）、５－メチルシチジン（ｍ５Ｃ）、Ｎ４－アセチルシチジン（ａｃ４Ｃ）、シュードウリジン（Ψ）、１－メチルアデノシン（ｍ１Ａ）、Ｎ^６－メチルアデノシン（ｍ６Ａ）、イノシン（Ｉ）、７－メチルグアノシン（ｍ７Ｇ）、ジヒドロウリジン（Ｄ）、３－メチルウリジン（ｍ３Ｕ）、５－メチルウリジン（ｍ５Ｕ）、１－メチルグアノシン（ｍ１Ｇ）、Ｎ^２－メチルグアノシン（ｍ２Ｇ）、５－メチルデオキシシチジン（ｍ５ｄＣ）、Ｎ^４－メチルデオキシシチジン、５－ヒドロキシメチルシチジン（５－ｈｍＣ）、５－ヒドロキシメチルデオキシシチジン（５ｈｍｄＣ）、５－カルボキシデオキシシチジン（５ｃａｄＣ）、５－ホルミルシチジン（５ｆＣ）、５－ホルミルデオキシシチジン（５ｆｄＣ）、６－メチルデオキシアデノシン、Ｎ^７－メチルグアノシン（ｍ７Ｇ）、２，７，２’－メチルグアノシン、またはリボースメチル化（Ｎｍ）である、請求項６１に記載の方法。
非古典的特徴が核酸損傷である、請求項６４に記載の方法。
核酸損傷が酸化プロセスまたは紫外線との接触に起因する、請求項６７記載の方法。
核酸損傷が、外因性薬剤による大きい付加体形成または塩基アルキル化に起因する、請求項６７に記載の方法。
損傷が、８－オキソグアニン（８－ｏｘｏＧ）、１以上の脱塩基部位、シス－プラチン架橋、ベンゾ（ａ）ピレンジオールエポキシド（ＢＰＤＥ）付加体、シクロブテンピリミジン二量体（ＣＰＤ）、ピリミジン－ピリミドン（６－４）光生成物（６－４ＰＰ）、６－Ｏ－メチルグアニン（Ｏ^６－ＭｅｄＧ）、またはＯ６－（カルボキシメチル）－２’－デオキシグアノシン（Ｏ６－ＣＭｄＧ）である、請求項６４に記載の核酸結合分子。
非古典的特徴が構造的要素である、請求項６４に記載の方法。
構造的要素が、ヘアピン、ループ、Ｚ－ＤＮＡ構造、Ｇ－四重鎖、三重鎖、ｉ－モチーフ、バルジ、三重鎖、三叉結合、十字形構造、四重ループ、リボースジッパー、またはシュードノットである、請求項７１に記載の方法。
核酸結合分子が基質の表面に結合され、他の核酸結合分子から空間的に分離され、各標的核酸が１つの標的核酸結合分子にのみ接触できるようにする、請求項５４から７２のいずれか一項に記載の方法。
核酸バーコードが、該バーコードまたはその相補体を標的核酸の５’末端または３’末端に共有結合させることにより標的核酸に転写される、請求項５４から７３のいずれか一項に記載の方法。
核酸バーコードが、一本鎖ライゲーション、スプリントライゲーション、プライマー伸長、または二本鎖ライゲーションによって酵素的に標的核酸にトランスファーされる、請求項５４から７３のいずれか一項に記載の方法。
核酸バーコードが、化学的ライゲーションによって標的核酸にトランスファーされる、請求項５４～７３のいずれか一項に記載の方法。
修飾が、核酸結合分子を標的核酸に光化学的または化学的に連結することを含む、請求項５４から７６のいずれか一項に記載の方法。
結合ドメインが、核酸標的との共有結合反応を促進する配向で化学架橋部分を提示する、請求項５４から７７のいずれか一項に記載の方法。
修飾が、核酸結合分子が標的核酸に結合する部位またはその近傍の塩基を編集することを含む、請求項５４から７７のいずれか一項に記載の方法。
複数の標的核酸における２以上の非古典的特徴を検出する方法および／または定量する方法であって、
（ｉ）標的核酸を少なくとも２つの核酸結合分子と接触させる工程であって、各核酸結合分子が結合ドメインおよびアダプターを含み、各核酸結合分子の結合ドメインがＤＮＡまたはＲＮＡの異なる非古典的特徴に結合し、アダプターが各結合ドメインによって特異的に結合される非古典的特徴に特異的な核酸バーコード配列を含む、工程；
（ｉｉ）（ａ）バーコード化核酸のオフターゲット生成を実質的に阻止する環境下で、バーコード化標的核酸を生成するために、核酸バーコードを標的核酸にトランスファーさせるか、または（ｂ）標的核酸のバーコード化コピーを生成する、工程；
（ｉｉｉ）非古典的特徴の位置がバーコード化標的核酸またはそのバーコード化コピーの一次核酸配列に基づいて同定可能であるように、バーコード化標的核酸またはそのバーコード化コピーを改変する工程；および
（ｖｉ）バーコード化標的核酸を配列決定する工程
を含む、方法。
配列決定の前に、バーコード化標的核酸またはそのコピーを増幅することを含む、請求項８０に記載の方法。
標的核酸がＤＮＡ、ＲＮＡまたはそれらの混合物を含む、請求項８０または８１に記載の方法。
非古典的特徴の少なくとも１つが修飾ヌクレオシドである、請求項８０から８２のいずれか一項に記載の方法。
修飾ヌクレオシドが、３－メチルシチジン（ｍ３Ｃ）、５－メチルシチジン（ｍ５Ｃ）、Ｎ^４－アセチルシチジン（ａｃ４Ｃ）、シュードウリジン（Ψ）、１－メチルアデノシン（ｍ１Ａ）、Ｎ^６－メチルアデノシン（ｍ６Ａ）、イノシン（Ｉ）、７－メチルグアノシン（ｍ７Ｇ）、ジヒドロウリジン（Ｄ）、３－メチルウリジン（ｍ３Ｕ）、５－メチルウリジン（ｍ５Ｕ）、１－メチルグアノシン（ｍ１Ｇ）、Ｎ^２－メチルグアノシン（ｍ２Ｇ）、５－メチルデオキシシチジン（ｍ５ｄＣ）、Ｎ^４－メチルデオキシシチジン、５－ヒドロキシメチルシチジン（５－ｈｍＣ）、５－ヒドロキシメチルデオキシシチジン（５ｈｍｄＣ）、５－カルボキシデオキシシチジン（５ｃａｄＣ）、５－ホルミルシチジン（５ｆＣ）、５－ホルミルデオキシシチジン（５ｆｄＣ）、６－メチルデオキシアデノシン、Ｎ^７－メチルグアノシン（ｍ７Ｇ）、２，７，２’－メチルグアノシン、またはリボースメチル化（Ｎｍ）である、請求項８３に記載の方法。
非古典的特徴が核酸損傷である、請求項８２に記載の方法。
核酸損傷が酸化プロセスまたは紫外線との接触に起因する、請求項８５に記載の方法。
核酸損傷が、外因性薬剤による大きい付加体形成または塩基アルキル化に起因する、請求項８５に記載の方法。
損傷が、８－オキソグアニン（８－ｏｘｏＧ）、１以上の脱塩基部位、シス－プラチン架橋、ベンゾ（ａ）ピレンジオールエポキシド（ＢＰＤＥ）付加体、シクロブテンピリミジン二量体（ＣＰＤ）、ピリミジン－ピリミドン（６－４）光生成物（６－４ＰＰ）、６－Ｏ－メチルグアニン（Ｏ^６－ＭｅｄＧ）、またはＯ６－（カルボキシメチル）－２’－デオキシグアノシン（Ｏ６－ＣＭｄＧ）である、請求項８２に記載の核酸結合分子。
非古典的特徴の少なくとも１つが構造的要素である、請求項８０から８２のいずれか一項に記載の方法。
構造的要素が、ヘアピン、ループ、Ｚ－ＤＮＡ構造、Ｇ－四重鎖、三重鎖、ｉ－モチーフ、バルジ、三重鎖、三叉結合、十字形構造、四重ループ、リボースジッパー、またはシュードノットである、請求項８９に記載の方法。
核酸結合分子が基質の表面に結合され、各標的核酸が１つの標的核酸結合分子のみに接触できるように空間的に分離されている、請求項８０から９０のいずれか一項に記載の方法。
核酸バーコードが、バーコードまたはその相補体を標的核酸の５’末端または３’末端に共有結合させることにより標的核酸にトランスファーされる、請求項８０から９１のいずれか一項に記載の方法。
核酸バーコードが、一本鎖ライゲーション、スプリントライゲーション、プライマー伸長、または二本鎖ライゲーションにより酵素的に標的核酸にトランスファーされる、請求項８０から９１のいずれか一項に記載の方法。
核酸バーコードが、化学的ライゲーションによって標的核酸にトランスファーされる、請求項８０から９０のいずれか一項に記載の方法。
修飾が、核酸結合分子を標的核酸に光化学的に連結することを含む、請求項８０から９４のいずれか１項に記載の方法。
修飾が、核酸結合分子が標的核酸に結合している部位またはその近傍の塩基を編集することを含む、請求項８０から９４のいずれか一項に記載の方法。
標的核酸における非古典的特徴を検出する方法であって、
（ｉ）標的核酸を請求項１から２８のいずれか一項に記載の核酸結合分子と接触させる工程；
（ｉｉ）バーコード化核酸のオフターゲット生成を実質的に阻止する環境下で、（ａ）核酸バーコードを標的核酸にトランスファーしてバーコード化標的核酸を生成する工程；および
（ｉｉｉ）標的核酸またはそのコピー中のバーコードの存在を検出する工程
を含む、方法。
非古典的特徴が修飾ヌクレオシドである、請求項９７に記載の方法。
修飾ヌクレオシドが、３－メチルシチジン（ｍ３Ｃ）、５－メチルシチジン（ｍ５Ｃ）、Ｎ^４－アセチルシチジン（ａｃ４Ｃ）、シュードウリジン（Ψ）、１－メチルアデノシン（ｍ１Ａ）、Ｎ^６－メチルアデノシン（ｍ６Ａ）、イノシン（Ｉ）、７－メチルグアノシン（ｍ７Ｇ）、ジヒドロウリジン（Ｄ）、３－メチルウリジン（ｍ３Ｕ）、５－メチルウリジン（ｍ５Ｕ）、１－メチルグアノシン（ｍ１Ｇ）、Ｎ^２－メチルグアノシン（ｍ２Ｇ）、５－メチルデオキシシチジン（ｍ５ｄＣ）、Ｎ^４－メチルデオキシシチジン、５－ヒドロキシメチルシチジン（５－ｈｍＣ）、５－ヒドロキシメチルデオキシシチジン（５ｈｍｄＣ）、５－カルボキシデオキシシチジン（５ｃａｄＣ）、５－ホルミルシチジン（５ｆＣ）、５－ホルミルデオキシシチジン（５ｆｄＣ）、６－メチルデオキシアデノシン、Ｎ^７－メチルグアノシン（ｍ７Ｇ）、２，７，２’－メチルグアノシン、またはリボースメチル化（Ｎｍ）である、請求項９８に記載の方法。
非古典的特徴が核酸損傷である、請求項９７に記載の方法。
核酸損傷が酸化的過程または紫外線との接触に起因する、請求項１００に記載の方法。
核酸損傷が、外因性薬剤による大きい付加体形成または塩基アルキル化に起因する、請求項１００に記載の方法。
損傷が、８－オキソグアニン（８－ｏｘｏＧ）、１以上の脱塩基部位、シス－プラチン架橋、ベンゾ（ａ）ピレンジオールエポキシド（ＢＰＤＥ）付加体、シクロブテンピリミジン二量体（ＣＰＤ）、ピリミジン－ピリミドン（６－４）光生成物（６－４ＰＰ）、６－Ｏ－メチルグアニン（Ｏ^６－ＭｅｄＧ）、またはＯ６－（カルボキシメチル）－２’－デオキシグアノシン（Ｏ６－ＣＭｄＧ）である、請求項１００に記載の方法。
非古典的特徴が構造的要素である、請求項１００に記載の方法。
構造的要素が、ヘアピン、ループ、Ｚ－ＤＮＡ構造、Ｇ－四重鎖、三重鎖、ｉ－モチーフ、バルジ、三重鎖、三叉結合、十字形構造、四重ループ、リボースジッパー、またはシュードノットである、請求項１０４に記載の方法。
トランスファーが、バーコードまたはその相補体を標的核酸の５’末端または３’末端に共有結合させることを含む、請求項９７から１０５のいずれか一項に記載の方法。
核酸バーコードが、一本鎖ライゲーション、スプリントライゲーション、スプリント伸長、テンプレート伸長、または二本鎖ライゲーションによって標的核酸に転移される、請求項９７から１０５のいずれか一項に記載の方法。
核酸バーコードが、化学ライゲーションによって標的核酸に転写される、請求項９７から１０５のいずれか一項に記載の方法。
工程（ｉ）～（ｉｉｉ）を少なくとも１回反復する、請求項９７から１０８のいずれか一項に記載の方法。
バーコードの存在を検出することが、バーコード化標的核酸またはそのバーコード化コピーを改変することを含む、請求項９７から１０９のいずれか一項に記載の方法。
バーコードの存在を検出することが、バーコード化標的核酸またはそのコピーを増幅することを包含する、請求項９７から１０９のいずれか一項に記載の方法。
バーコードの存在を検出することが、バーコード化標的核酸を配列決定することを包含する、請求項９７から１０９のいずれか一項に記載の方法。
標的核酸中の非古典的特徴の位置を、一塩基分解能付近または一塩基分解能で決定するための方法であって、
（ｉ）標的核酸を請求項１から２８のいずれか一項に記載の核酸結合分子と接触させる工程；
（ｉｉ）バーコード化核酸のオフターゲット生成を実質的に阻止する環境下で、核酸バーコードを標的核酸にトランスファーしてバーコード化標的核酸を生成する工程；および
（ｉｉｉ）標的核酸またはそのコピー中のバーコードの存在を検出する工程；
ここで、核酸結合分子は、以下のうち１以上が可能な結合ドメインを含む：
（ｃ）標的核酸に変異を誘発する；または
（ｄ）ポリメラーゼバイパスを阻止することにより、標的核酸のコピー間に切断を引き起こす、
を含む、方法。
ポリメラーゼバイパスを阻止することが、核酸結合分子を標的核酸に化学的または光化学的に連結することを含む、請求項１１３に記載の方法。
ポリメラーゼバイパスを防止することが、標的核酸のコピー間に切断を誘発するように結合ドメインを化学的に改変することを含む、請求項１１３に記載の方法。
非古典的特徴が修飾ヌクレオシドである、請求項１１３から１１５のいずれか一項に記載の方法。
修飾ヌクレオシドが、３－メチルシチジン（ｍ３Ｃ）、５－メチルシチジン（ｍ５Ｃ）、Ｎ^４－アセチルシチジン（ａｃ４Ｃ）、シュードウリジン（Ψ）、１－メチルアデノシン（ｍ１Ａ）、Ｎ^６－メチルアデノシン（ｍ６Ａ）、イノシン（Ｉ）、７－メチルグアノシン（ｍ７Ｇ）、ジヒドロウリジン（Ｄ）、３－メチルウリジン（ｍ３Ｕ）、５－メチルウリジン（ｍ５Ｕ）、１－メチルグアノシン（ｍ１Ｇ）、Ｎ^２－メチルグアノシン（ｍ２Ｇ）、５－メチルデオキシシチジン（ｍ５ｄＣ）、Ｎ^４－メチルデオキシシチジン、５－ヒドロキシメチルシチジン（５－ｈｍＣ）、５－ヒドロキシメチルデオキシシチジン（５ｈｍｄＣ）、５－カルボキシデオキシシチジン（５ｃａｄＣ）、５－ホルミルシチジン（５ｆＣ）、５－ホルミルデオキシシチジン（５ｆｄＣ）、６－メチルデオキシアデノシン、Ｎ^７－メチルグアノシン（ｍ７Ｇ）、２，７，２’－メチルグアノシン、またはリボースメチル化（Ｎｍ）である、請求項１１６に記載の方法。
非古典的特徴が核酸損傷である、請求項１１３から１１５のいずれか一項に記載の方法。
核酸損傷が酸化的過程または紫外線との接触に起因する、請求項１１８に記載の方法。
核酸損傷が、外因性薬剤による大きい付加体形成または塩基アルキル化に起因する、請求項１１８に記載の方法。
前記損傷が、８－オキソグアニン（８－ｏｘｏＧ）、１以上の脱塩基部位、シス－プラチン架橋、ベンゾ（ａ）ピレンジオールエポキシド（ＢＰＤＥ）付加体、シクロブテンピリミジン二量体（ＣＰＤ）、ピリミジン－ピリミドン（６－４）光生成物（６－４ＰＰ）、６－Ｏ－メチルグアニン（Ｏ^６－ＭｅｄＧ）、またはＯ６－（カルボキシメチル）－２’－デオキシグアノシン（Ｏ６－ＣＭｄＧ）である、請求項１１８に記載の方法。
非古典的特徴が構造的要素である、請求項１１３から１１５のいずれか一項に記載の方法。
構造的要素が、ヘアピン、ループ、Ｚ－ＤＮＡ構造、Ｇ－四重鎖、三重鎖、ｉ－モチーフ、バルジ、三重鎖、三方結合、十字形構造、四重鎖、リボースジッパー、またはシュードノットである、請求項１２２に記載の方法。
トランスファーが、バーコードまたはその相補体を標的核酸の５’末端または３’末端に共有結合させることを含む、請求項１１３から１２３のいずれか一項に記載の方法。
工程（ｉ）～（ｉｉｉ）を少なくとも１回反復する、請求項１１３から１２３のいずれか一項に記載の方法。
工程（ｉ）～（ｉｉｉ）を反復する毎に、異なる核酸結合分子が用いられる、請求項１２４に記載の方法。
工程（ｉ）～（ｉｉｉ）を反復する毎に、同じ核酸結合分子を用いる、請求項１２４に記載の方法。
バーコードの存在を検出することが、バーコード化標的核酸またはそのバーコード化コピーを改変することを含む、請求項１１３から１２７のいずれか一項に記載の方法。
バーコードの存在を検出することが、バーコード化標的核酸またはそのコピーを増幅することを包含する、請求項１１３から１２７のいずれか一項に記載の方法。
バーコードの存在を検出することが、バーコード化標的核酸を配列決定することを包含する、請求項１１３から１２７のいずれか一項に記載の方法。
バーコードの存在を検出することが、核酸および核酸結合分子のアダプターを配列決定することを包含する、請求項１１３から１２７のいずれか一項に記載の方法。
核酸バーコードを標的核酸にトランスファーさせることが、バーコードまたはその相補体を標的核酸の５’末端または３’末端に共有結合させることを含む、請求項１１３から１３１のいずれか一項に記載の方法。