本明細書において具体的に定義されていない用語には、本開示および文脈を踏まえて当業者によって与えられる意味が与えられるべきである。しかし、本明細書で使用される場合、それに反する指定がなければ、用語は示されている意味を有する。
本出願において参照される特許文書、科学論文およびデータベースを含めた刊行物は全て、各個々の刊行物が個別に参照により組み込まれたものと同じ程度に、あらゆる目的に関してその全体が参照により組み込まれる。本明細書に記載の定義が、参照により本明細書に組み込まれる特許、出願、公開出願および他の刊行物に記載の定義に反するまたは他の点で相反する場合、本明細書に記載の定義が参照により本明細書に組み込まれる定義よりも優先される。
本明細書で使用される節の表題は、単に構成目的のものであり、記載の主題を限定するものとは解釈されない。
I.緒言および概要
ポリペプチド(例えば、タンパク質)の高度に並行な高分子特徴付けおよび認識は、いくつかの理由で困難である。親和性に基づくアッセイの使用は、多くの場合、いくつかの重要な難題に起因して難しい。1つの重要な難題は、親和性作用物質の集合の読み取りを同類の巨大分子の集合に多重化することである。別の難題は、親和性作用物質とオフターゲットの巨大分子との交差反応性を最小化することである。第3の難題は、効率的なハイスループットな読み取りプラットフォームを開発することである。この問題の例は、試料中のタンパク質の大多数または全てを識別および定量化することが1つの目標であるプロテオミクスにおいて生じる。さらに、タンパク質の種々の翻訳後修飾(PTM)を単一分子レベルで特徴付けることが望ましい。現在、これは、ハイスループットなやり方で実現することが大変な課題である。
タンパク質またはポリペプチド分析物の分子認識および特徴付けは、一般には、イムノアッセイを使用して実施される。ELISA、マルチプレックスELISA(例えば、スポッテッド抗体アレイ(spotted antibody array)、液体粒子ELISAアレイ)、デジタルELISA(例えば、Quanterix、Singulex)、逆相タンパク質アレイ(RPPA)、および多くの他のものを含めた、多くの異なるイムノアッセイ形式が存在する。これらの異なるイムノアッセイプラットフォームは全て、高親和性および高度に特異的な(または選択的な)抗体(結合性物質)の開発、試料レベルおよび分析物レベルのどちらにおいても多重化能力が限られていること、感度およびダイナミックレンジが限られていること、ならびに交差反応性およびバックグラウンドシグナルを含めた、同様の難題に直面する。ペプチド配列決定(エドマン分解または質量分析)による直接タンパク質特徴付けなどの、結合性物質にとらわれない手法により有用な代替的手法がもたらされる。しかし、これらの手法はいずれも、非常に並行またはハイスループットなものではない。
エドマン分解に基づくペプチド配列決定は、1950年にPehr Edmanによって最初に提唱されたものであり、言い換えると、ペプチドのN末端アミノ酸の、一連の化学修飾による段階的分解および下流のHPLC分析(後に質量分析に置き換えられた)である。第1のステップにおいて、N末端アミノ酸を穏やかな塩基性条件下(NMP/メタノール/H2O)でフェニルイソチオシアネート(PITC)を用いて修飾して、フェニルチオカルバモイル(PTC)誘導体を形成させる。第2のステップでは、PTCで修飾されたアミノ基を酸(無水トリフルオロ酢酸、TFA)で処理して、切断された環状ATZ(2−アニリノ−5(4)−チアゾリノン(thiozolinone)修飾アミノ酸を創出し、新しいN末端をペプチド上に残す。切断された環状ATZアミノ酸をフェニルチオヒダントイン(PTH)アミノ酸誘導体に変換し、逆相HPLCによって分析する。このプロセスを、ペプチド配列を構成するアミノ酸の全てまたは部分的な数がN末端から除去され識別されるまで反復的に継続する。一般に、エドマン分解ペプチド配列決定法という技術は、時間がかかり、1日当たりほんの数ペプチドとスループットが限られている。
ここ10〜15年で、MALDI、エレクトロスプレー質量分析(MS)、およびLC−MS/MSを使用したペプチド解析が大きくエドマン分解に取って代わっている。MS器械使用(Riley et al., 2016、Cell Syst 2: 142-143)における最近の進歩にもかかわらず、MSにはなお、計器費用が高いこと、洗練された使用者が求められること、数量化能力が不十分であること、およびプロテオームのダイナミックレンジ全体にわたって測定を行う能力が限られていることを含めたいくつかの欠点がある。例えば、タンパク質は異なる効率レベルでイオン化するので、試料間の絶対的な定量化およびさらには相対的な定量化も困難である。質量タグの実装が相対的な定量化の改善に役立っているが、プロテオームの標識が必要になる。試料中のタンパク質の濃度が非常に大きな範囲にわたって(血漿に関しては10桁にわたって)変動し得るダイナミックレンジがさらなる複雑化の要因である。一般には、MSではより豊富な種のみが分析され、豊富さが低いタンパク質の特徴付けは困難になる。最後に、試料スループットは、一般には、実行当たり数千ペプチドに限られ、データ非依存性解析(DIA)に関して、このスループットは真のボトムアップ式のハイスループットなプロテオーム解析には不十分である。さらに、各試料について記録された何千もの複雑なMSスペクトルをデコンボリューションするために著しいコンピュータ処理の必要性がある。
したがって、タンパク質配列決定および/または解析に適用される巨大分子配列決定および/または解析に関する改善された技法、ならびに、それを実現するための製品、方法およびキットが当技術分野において依然として必要とされている。高度に並行化された、正確な、感度の高い、かつハイスループットなプロテオミクス技術が必要とされている。本発明のこれらおよび他の態様は、以下の詳細な説明を参照すれば明らかになろう。この目的のために、ある特定のバックグラウンド情報、手順、化合物および/または組成物がより詳細に記載されている種々の参考文献が本明細書に記載され、これらはそれぞれが、これにより全体が参照により本明細書に組み込まれる。
本開示は、一部において、タンパク質およびペプチドの特徴付けおよび配列決定に直接適用される、高度に並行な、ハイスループットなデジタル巨大分子特徴付けおよび定量化の方法を提供する(例えば、図1B、図2Aを参照されたい)。本明細書に記載の方法では、識別情報を核酸分子または配列決定可能なポリマーの形態で有するコーディングタグを含む結合性物質を使用し、ここで、結合性物質は、目的の巨大分子と相互作用するものである。多数の連続的な結合サイクルを実施し、各サイクルは、例えばプールされた試料を表すものである、固体支持体に固定化した複数の巨大分子を複数の結合性物質に曝露させることを含む。各結合サイクル中、巨大分子に結合する各結合性物質の同一性、および必要に応じて結合サイクル数を、結合性物質コーディングタグから巨大分子と共局在する記録タグに情報を移行させることによって記録する。代替の実施形態では、付随する巨大分子に関する識別情報を含む記録タグからの情報を、結合した結合性物質のコーディングタグ(例えば、伸長コーディングタグを形成するため)または第3の「ジタグ」構築物に移行させることができる。多数サイクルの結合事象により、巨大分子と共局在する記録タグに関する歴史的な結合情報が構築され、それにより、多数のコーディングタグを含む伸長記録タグが、所与の巨大分子についての時間的な結合履歴を表す共直線的な順序で生じる。さらに、サイクル特異的コーディングタグを使用して各サイクルからの情報を追跡することができ、したがって、あるサイクルが何らかの理由でスキップされた場合に、伸長記録タグがその後のサイクルで情報を収集し続け、情報が欠如したサイクルを識別することができる。
あるいは、コーディングタグから記録タグに情報を書き込むまたは移行させる代わりに、付随する巨大分子に関する識別情報を含む記録タグから、伸長コーディングタを形成するコーディングタググまたは第3のジタグ構築物に情報を移行させることができる。得られた伸長コーディングタグまたはジタグを、その後の配列解析のために各結合サイクル後に収集することができる。バーコード(例えば、分配タグ、コンパートメントタグ、試料タグ、画分タグ、UMI、またはこれらの任意の組合せ)を含む記録タグ上の識別情報を使用して、伸長コーディングタグまたはジタグ配列読み取りを元の巨大分子にマッピングし戻すことができる。このように、巨大分子の結合履歴の核酸コードライブラリー表示を生成する。この核酸コードライブラリーを、非常にハイスループットな次世代デジタルシーケンシング法を使用して増幅させ、解析し、実行当たり数百万〜数十億の分子を解析することができる。結合情報に関する核酸コードライブラリーの創出は、ハイブリダイゼーションを使用するDNAに基づく技法による濃縮、サブトラクション、および正規化が可能になるという点で、別のように有用である。これらのDNAに基づく方法は、容易におよび迅速に大規模化可能かつカスタマイズ可能であり、タンパク質ライブラリーなどの他の型の巨大分子ライブラリーの直接操作のために利用可能なものよりも費用効果が大きい。したがって、結合情報に関する核酸コードライブラリーを配列決定前に1つまたは複数の技法によって処理して、配列の表示を濃縮および/またはサブトラクションおよび/または正規化することができる。これにより、最大の目的の情報が、個々のメンバーの豊富さが多数の桁にわたって最初に変動し得る非常に大きなライブラリーから、はるかに効率的に、迅速に、かつ大きな費用効果で抽出される。重要なことに、ライブラリー表示を操作するためのこれらの核酸に基づく技法は、より慣習的な方法と直交性のものであり、それらと組み合わせて使用することができる。例えば、アルブミンなどの、一般的な、非常に豊富なタンパク質を、望ましくないタンパク質の全てではないが大多数を除去することができるタンパク質に基づく方法を使用してサブトラクションすることができる。その後、伸長記録タグライブラリーのアルブミン特異的メンバーもサブトラクションし、したがって、より徹底的な全体的サブトラクションを実現することができる。
一態様では、本開示は、DNA記録タグで標識されたペプチドの大きな集団(例えば、数百万〜数十億)からの配列決定を可能にする、エドマン様分解手法を使用した、ペプチド配列決定のための高度に並行化された手法を提供する。これらの記録タグで標識されたペプチドは、タンパク質試料のタンパク質分解による消化または限定された加水分解に由来するものであり、記録タグで標識されたペプチドは、配列決定基板(例えば、多孔質ビーズ)に、基板上の適切な分子間間隔でランダムに固定化される。NTAA切断反応を触媒するまたは動員する、フェニルチオカルバモイル(PTC)、ジニトロフェノール(DNP)、スルホニル ニトロフェノール(SNP)、ダンシル、7−メトキシクマリン、アセチル、またはグアニジニルなどの小さな化学的部分を用いたペプチドのN末端アミノ酸(NTAA)残基の修飾により、エドマン様分解プロセスの周期的制御が可能になる。修飾用化学的部分により、同類のNTAA結合性物質に対する結合親和性の増強をもたらすこともできる。各固定化されたペプチドの修飾されたNTAAを、コーディングタグを含む同類のNTAA結合性物質の結合、および、コーディングタグ情報(例えば、結合性物質に関する識別情報をもたらすエンコーダー配列)のコーディングタグからペプチドの記録タグへの移行(例えば、プライマー伸長またはライゲーション)によって識別する。その後、修飾されたNTAAを化学的方法または酵素的手段によって除去する。ある特定の実施形態では、修飾されたNTAAの除去を触媒させるために酵素(例えば、エドマナーゼ)を工学的に操作する。他の実施形態では、アミノペプチダーゼまたはアシルペプチドヒドロラーゼなどの天然に存在するエキソペプチダーゼを、適切な化学修飾の存在下でのみ末端アミノ酸を切断するように工学的に操作することができる。
II.定義
以下の説明では、種々の実施形態の詳細な理解をもたらすために、ある特定の具体的詳細を記載する。しかし、これらの詳細を伴わずに本化合物を作製および使用できることが当業者には理解されよう。他の場合では、実施形態の説明が不必要に不明瞭になるのを回避するために、周知の構造は詳細に示されていないまたは記載されていない。文脈上異なる解釈を要する場合を除き、本明細書およびそれが従う特許請求の範囲全体を通して、「含む(comprise)」という単語ならびに「含む(comprises)」および「含む(comprising)」などのその変形は、制限のない、包括的な意味で、すなわち、「含むが、これだけに限定されない(including,but not limited to)」と解釈されるべきである。さらに、「含む(comprising)」という用語(および「含む(comprise)」または「含む(comprises)」または「有する(having)」または「含む(including)」などの関連する用語)は、他のある特定の実施形態では、例えば、本明細書に記載の任意の組成物(composition of matter)、組成物(composition)、方法、またはプロセスなどのある実施形態が、記載されている特徴「からなる(consist of)」または「から本質的になる(consist essentially of)」ものであり得ることを排除するものではない。本明細書で提示される表題は単に便宜上のものであり、特許請求された実施形態の範囲または意味であるとは解釈されない。
本明細書全体を通して、「一実施形態」または「ある実施形態」への言及は、当該実施形態に関連して記載されている特定の特徴、構造または特性が少なくとも1つの実施形態に含まれることを意味する。したがって、本明細書全体を通して各所での「一実施形態では」または「ある実施形態では」という句の出現は、必ずしも全てが同じ実施形態について言及しているのではない。さらに、特定の特徴、構造、または特性を任意の適切な様式で組み合わせて1つまたは複数の実施形態にすることができる。
本明細書で使用される場合、単数形「1つの(a)」、「1つの(an)」、および「その(the)」は、文脈により明確に別段の規定がなされない限り、複数の指示対象を包含する。したがって、例えば、「1つのペプチド(a peptide)」への言及は、1つもしくは複数のペプチド、またはペプチドの混合物を含む。また、特に明記されていないまたは文脈から明らかでない限り、本明細書で使用される場合、「または(or)」という用語は、包括的であり、「または(or)」と「および(and)」の両方を包含するものと理解される。
本明細書で使用される場合、「巨大分子」という用語は、より小さなサブユニットで構成される大きな分子を包含する。巨大分子の例としては、これだけに限定されないが、ペプチド、ポリペプチド、タンパク質、核酸、炭水化物、脂質、大環状分子が挙げられる。巨大分子は、共有結合により連結した2つまたはそれよりも多くの型の巨大分子の組合せで構成されるキメラ巨大分子(例えば、核酸と連結したペプチド)も含む。巨大分子は、2つまたはそれよりも多くの巨大分子の非共有結合性の複合体で構成される「巨大分子集合体」も含み得る。巨大分子集合体は、同じ型の巨大分子で構成されるもの(例えば、タンパク質−タンパク質)であってもよく、2つまたはそれよりも多くの異なる型の巨大分子で構成されるもの(例えば、タンパク質−DNA)であってもよい。
本明細書で使用される場合、「ポリペプチド」という用語は、ペプチドおよびタンパク質を包含し、ペプチド結合によって接合した2つまたはそれよりも多くのアミノ酸の鎖を含む分子を指す。一部の実施形態では、ポリペプチドまたはペプチドは、2〜50個のアミノ酸を含み、例えば、20〜30個よりも多くのアミノ酸を有する。一部の実施形態では、ペプチドは、二次、三次、またはより高次の構造を含まない。一部の実施形態では、タンパク質は、30個またはそれよりも多くのアミノ酸を含み、例えば、50個よりも多くのアミノ酸を有する。一部の実施形態では、一次構造に加えて、タンパク質は、二次、三次、またはより高次の構造を含む。ポリペプチドのアミノ酸は、最も典型的にはL−アミノ酸であるが、D−アミノ酸、非天然アミノ酸、修飾されたアミノ酸、アミノ酸類似体、アミノ酸模倣物、またはこれらの任意の組合せであってもよい。ポリペプチドは、天然に存在するものであってもよく、合成的に作製されたものであってもよく、組換えによって発現させたものであってもよい。ポリペプチドは、アミノ酸の鎖を修飾する追加的な基、例えば、翻訳後修飾によって付加された官能基も含んでよい。ポリマーは、直鎖状であっても分岐状であってもよく、修飾されたアミノ酸を含んでもよく、また、非アミノ酸によって中断されていてもよい。この用語は、天然にまたは介入によって修飾されたアミノ酸ポリマー;例えば、ジスルフィド結合の形成、グリコシル化、脂質付加、アセチル化、リン酸化、または標識成分とのコンジュゲーションなどの任意の他の操作もしくは修飾も包含する。
本明細書で使用される場合、「アミノ酸」という用語は、ペプチドの単量体サブユニットとして機能する、アミン基、カルボン酸基、および各アミノ酸に特異的な側鎖を含む有機化合物を指す。アミノ酸は、20種の標準の天然に存在するまたは正規のアミノ酸ならびに非標準アミノ酸を含む。標準の天然に存在するアミノ酸としては、アラニン(AまたはAla)、システイン(CまたはCys)、アスパラギン酸(DまたはAsp)、グルタミン酸(EまたはGlu)、フェニルアラニン(FまたはPhe)、グリシン(GまたはGly)、ヒスチジン(HまたはHis)、イソロイシン(IまたはIle)、リシン(KまたはLys)、ロイシン(LまたはLeu)、メチオニン(MまたはMet)、アスパラギン(NまたはAsn)、プロリン(PまたはPro)、グルタミン(QまたはGln)、アルギニン(RまたはArg)、セリン(SまたはSer)、トレオニン(TまたはThr)、バリン(VまたはVal)、トリプトファン(WまたはTrp)、およびチロシン(YまたはTyr)が挙げられる。アミノ酸は、L−アミノ酸であってもD−アミノ酸であってもよい。非標準アミノ酸は、天然に存在するまたは化学的に合成された修飾されたアミノ酸、アミノ酸類似体、アミノ酸模倣物、非標準タンパク質新生性アミノ酸、または非タンパク質新生性アミノ酸であり得る。非標準アミノ酸の例としては、これだけに限定されないが、セレノシステイン、ピロリジン、およびN−ホルミルメチオニン、β−アミノ酸、ホモアミノ酸、プロリンおよびピルビン酸誘導体、3−置換アラニン誘導体、グリシン誘導体、環置換フェニルアラニンおよびチロシン誘導体、直鎖コアアミノ酸、N−メチルアミノ酸が挙げられる。
本明細書で使用される場合、「翻訳後修飾」という用語は、リボソームによるペプチドの翻訳が完了した後に当該ペプチド上で生じる修飾を指す。翻訳後修飾は、共有結合性修飾または酵素的修飾であり得る。翻訳後修飾の例としては、これだけに限定されないが、アシル化、アセチル化、アルキル化(メチル化を含む)、ビオチン化、ブチリル化、カルバミル化、カルボニル化、脱アミド化、脱イミノ化、ジフタミド形成、ジスルフィド架橋形成、エリミニル化、フラビン付着、ホルミル化、ガンマ−カルボキシル化、グルタミル化、グリシル化、グリコシル化、グリコシルホスファチジルイノシトール付加(glypiation)、ヘムC付着、ヒドロキシル化、ハイプシン形成、ヨウ素化、イソプレニル化、脂質付加、リポイル化、マロニル化、メチル化、ミリストイル化、酸化、パルミトイル化、ペグ化、ホスホパンテテイニル化、リン酸化、プレニル化、プロピオニル化、レチニリデンシッフ塩基形成、S−グルタチオン化、S−ニトロシル化、S−スルフェニル化、セレン化、サクシニル化、スルフィン化、ユビキチン化、およびC末端アミド化が挙げられる。翻訳後修飾は、ペプチドのアミノ末端および/またはカルボキシル末端の修飾を含む。末端アミノ基の修飾としては、これだけに限定されないが、デスアミノ、N−低級アルキル、N−ジ−低級アルキル、およびN−アシル修飾が挙げられる。末端カルボキシ基の修飾としては、これだけに限定されないが、アミド、低級アルキルアミド、ジアルキルアミド、および低級アルキルエステル修飾(例えば、低級アルキルはC1〜C4アルキルである)が挙げられる。翻訳後修飾は、例えば、これだけに限定されないが、アミノ末端とカルボキシ末端の間にあるアミノ酸、上記のものなどの修飾も含む。翻訳後修飾という用語は、1つまたは複数の検出可能な標識を含むペプチド修飾も含み得る。
本明細書で使用される場合、「結合性物質」という用語は、分析物、例えば、巨大分子または巨大分子の成分もしくは特徴に結合する、結び付く、それと合体する、それを認識する、またはそれと組み合わさる核酸分子、ペプチドまたはペプチドの模倣物、ポリペプチド、タンパク質、炭水化物、ペプチド模倣物(例えば、ペプトイド、β−ペプチド、またはD−ペプチドのペプチド模倣物)、多糖、または小分子を指す。結合性物質は、分析物、例えば、巨大分子または巨大分子の成分もしくは特徴と共有結合性の結び付きまたは非共有結合性の結び付きを形成し得る。結合性物質はまた、核酸分子−ペプチドキメラ結合性物質または炭水化物−ペプチドキメラ結合性物質などの、2つまたはそれよりも多くの型の分子で構成されるキメラ結合性物質であってもよい。結合性物質は、天然に存在する分子であってもよく、合成的に作製された分子であってもよく、組換えによって発現させた分子であってもよい。結合性物質は、巨大分子の単一の単量体もしくはサブユニット(例えば、ペプチドの単一のアミノ酸)に結合し得る、または巨大分子の複数の連結したサブユニット(例えば、より長いペプチド、ポリペプチド、またはタンパク質分子のジ−ペプチド、トリ−ペプチド、もしくはより高次のペプチド)に結合し得る。結合性物質は、直鎖状分子または三次元構造(コンフォメーションとも称される)を有する分子に結合し得る。例えば、抗体結合性物質は、直鎖ペプチド、ポリペプチド、もしくはタンパク質に結合し得る、または、コンフォメーションペプチド、ポリペプチド、もしくはタンパク質に結合し得る。結合性物質は、ペプチド、ポリペプチド、またはタンパク質分子のN末端ペプチド、C末端ペプチド、または介在するペプチドに結合し得る。結合性物質は、ペプチド分子のN末端アミノ酸、C末端アミノ酸、または介在するアミノ酸に結合し得る。例えば、結合性物質は、化学修飾されたまたは標識されたアミノ酸に、修飾されていないまたは標識されていないアミノ酸よりも優先して結合し得る。例えば、結合性物質は、アセチル部分、グアニル部分、ダンシル部分、PTC部分、DNP部分、SNP部分などで修飾されたアミノ酸に、前記部分を保有しないアミノ酸よりも優先して結合し得る。結合性物質は、ポリペプチド分子の翻訳後修飾に結合し得る。結合性物質は、巨大分子などの分析物の成分または特徴への選択的結合を示し得る(例えば、結合性物質は、20種の可能性のある天然のアミノ酸残基の1種に選択的に結合し得、他の19種の天然のアミノ酸残基には非常に低い親和性で結合するまたは全く結合しない)。結合性物質は、結合性物質が巨大分子などの分析物の複数の成分または特徴に結合することが可能な場合、より低い選択的結合を示し得る(例えば、結合性物質は、2つまたはそれよりも多くの異なるアミノ酸残基に同様の親和性で結合し得る)。結合性物質は、コーディングタグを含み、これは、リンカーによって結合性物質に接合されていてよい。
一部の実施形態では、「小分子」という用語は、複数の反復単位で構成されているポリヌクレオチド、ポリペプチド、多糖、または合成ポリマーではない、分子量が約2kDa未満の有機金属化合物を含めた有機化合物を指す。
一部の実施形態では、「ペプチド模倣物」という用語は、ペプチドを模倣するように設計された小さなタンパク質様鎖を含む。一部の実施形態では、ペプチド模倣物は、既存のペプチド(例えば、環状ペプチドなど)を修飾することから、またはペプトイドおよびβ−ペプチドなどの、ペプチドを模倣する同様の系を設計することによるのいずれかによって生じさせることができる。一部の実施形態では、変更された化学構造は、安定性または生物学的活性などの分子の性質が有利に調整されるように設計されている。これには、既存のペプチドからの薬物様化合物の開発における役割があり得る。一部の実施形態では、これらの修飾は、天然には生じないペプチドへの変化(例えば、骨格の変更および非天然アミノ酸の組み入れ)を伴う。ペプチド模倣物は、それらの前駆体ペプチドとの類似性に基づいて、4つのクラス(A〜D)に群分けすることができ、Aが最も高い類似性を特徴とし、Dが最も低い類似性を特徴とする。クラスAおよびBはペプチド様足場を含む、クラスCおよびDは小分子を含む。
一部の実施形態では、「ペプトイド」という用語は、側鎖がペプチド骨格のα炭素(アミノ酸における場合)ではなく窒素原子に付属しているペプチド模倣物のクラスであるポリ−N−置換グリシンを含む。一部の実施形態では、「β−ペプチド」という用語は、β−アラニン(天然に存在するβアミノ酸であり、アミノ基がα炭素ではなくβ炭素に結合している)などのβアミノ酸を含む。β−ペプチドは、より大きな生物活性分子の成分として使用されるが、一般に、天然には出現しないことだけがよく知られている。
一部の実施形態では、「作用物質」および「試薬」という用語は、互換的に使用される。例えば、結合性物質は作用物質と称されるが、そのコーディングタグは、情報を移行させるために、記録タグ上のスペーサー配列または反応性末端と反応する反応性部分、例えば、スペーサー配列または反応性末端を有し得る。反応は、ライゲーションおよび/またはアニーリング、その後のプライマー伸長を含み得る。
本明細書で使用される場合、「リンカー」という用語は、2つの分子を接合するために使用されるヌクレオチド、ヌクレオチド類似体、アミノ酸、ペプチド、ポリペプチド、または非ヌクレオチド化学的部分の1つまたは複数を指す。リンカーは、結合性物質とコーディングタグ、記録タグと巨大分子(例えば、ペプチド)、巨大分子と固体支持体、記録タグと固体支持体などを接合させるために使用することができる。ある特定の実施形態では、リンカーは、2つの分子を酵素反応または化学反応(例えば、クリックケミストリー)によって接合させる。
本明細書で使用される場合、「プロテオミクス」という用語は、プロテオーム、例えば、細胞(複数可)、組織(複数可)、および体液(複数可)内のプロテオーム、ならびに対応する細胞内および組織内のプロテオームの空間的分布の分析(例えば、定量的分析)を指す。さらに、プロテオミクス試験は、生物学および定義された生物学的または化学的刺激に応じて継続的に時間変化するプロテオームの動的状態を含む。
本明細書で使用される場合、「プロテオーム」という用語は、ある特定の時間に、任意の生物体の標的、例えば、ゲノム、細胞、組織、または生物体によって発現されるタンパク質、ポリペプチド、またはペプチドの全セット(そのコンジュゲートまたは複合体を含む)を含み得る。一態様では、プロテオームは、所与の細胞型または生物体において、所与の時間に規程された条件下で発現されるタンパク質のセットである。プロテオミクスは、プロテオームに関する試験である。例えば、「細胞プロテオーム」は、ホルモン刺激への曝露などの特定の環境条件のセットの下で特定の細胞型において見出されるタンパク質の集合を含み得る。生物体の完全なプロテオームは、種々の細胞プロテオームの全てからのタンパク質の完全なセットを含み得る。プロテオームは、ある特定の細胞内生物系におけるタンパク質の集合も含み得る。例えば、ウイルスにおけるタンパク質の全てをウイルスプロテオームと称することができる。本明細書で使用される場合、「プロテオーム」という用語は、これだけに限定されないが、カイノーム;セクレトーム;レセプトーム(例えば、GPCRome);免疫プロテオーム;栄養プロテオーム;翻訳後修飾(例えば、リン酸化、ユビキチン化、メチル化、アセチル化、グリコシル化、酸化、脂質付加、および/またはニトロシル化)によって規程されるプロテオームサブセット、例えば、リン酸化プロテオーム(例えば、ホスホチロシン−プロテオーム、チロシン−カイノーム、およびチロシン−ホスファトーム)、グリコプロテオームなど;組織もしくは臓器、発生段階、または生理的もしくは病的状態に関連するプロテオームサブセット;細胞周期、分化(または脱分化)、細胞死、老化、細胞遊走、形質転換、または転移などの細胞プロセスに関連するプロテオームサブセット;あるいはこれらの任意の組合せを含めたプロテオームのサブセットを含む。
本明細書で使用される場合、「非同類結合性物質」という用語は、特定の結合サイクル反応において調査される巨大分子の特徴、成分、またはサブユニットに、対応する巨大分子の特徴、成分、またはサブユニットに高親和性で結合する「同類結合性物質」と比較して、結合することができないまたは低親和性で結合する結合性物質を指す。例えば、ペプチド分子のチロシン残基を結合反応において調査する場合、非同類結合性物質は、チロシン残基に低親和性で結合するまたは全く結合しないものであり、したがって、非同類結合性物質では、コーディングタグ情報を同類結合性物質から記録タグに移行させるために適した条件下でコーディングタグ情報が記録タグに効率的に移行されない。あるいは、ペプチド分子のチロシン残基を結合反応において調査する場合、非同類結合性物質は、チロシン残基に低親和性で結合するまたは全く結合しないものであり、したがって、伸長記録タグではなく伸長コーディングタグを伴う実施形態に適した条件下で、記録タグ情報がコーディングタグに効率的に移行されない。
本明細書で使用される場合、「特異的結合」という用語は、結合物質、例えば、抗体、ClpSタンパク質、またはアンチカリンの、ポリペプチド抗原などの標的に優先的に結合するような特異性を指す。結合パートナー、例えば、タンパク質、核酸、抗体または他の親和性捕捉剤などについて言及する場合、「特異的結合」は、指定のアッセイ条件下での選択的ハイブリダイゼーションを確実にするための2つまたはそれよりも多くの結合パートナーとの高親和性および/または相補性での結合反応を含み得る。一般には、特異的結合は、バックグラウンドシグナルの少なくとも3倍の標準偏差になる。したがって、指定の条件下で、結合パートナーは、その特定の標的分子に結合し、試料中に存在する他の分子には顕著な量では結合しない。他の潜在的な干渉物質の存在下で結合物質または抗体によって特定の標的が認識されることが、そのような結合の1つの特性である。例えば、標的に特異的であるまたは特異的に結合する結合物質、抗体または抗体断片は、標的に、他の非標的物質への結合よりも高い親和性で結合する。例えば、標的に特異的であるまたは特異的に結合する結合物質、抗体または抗体断片は、有意なパーセンテージの非標的物質、例えば、試験試料中に存在する非標的物質への結合を回避する。一部の実施形態では、本開示の結合物質、抗体または抗体断片は、非標的物質の約90%よりも多くの結合を回避するが、より高いパーセンテージが明白に企図されており、好ましい。例えば、本開示の結合物質、抗体または抗体断片は、非標的物質の約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、約99%、および約99%またはそれよりも多くの結合を回避する。他の実施形態では、本開示の結合物質、抗体または抗体断片は、非標的物質の約10%、20%、30%、40%、50%、60%、もしくは70%よりも多く、または約75%よりも多く、または約80%よりも多く、または約85%よりも多くの結合を回避する。
本明細書で使用される場合、ポリヌクレオチド、タンパク質またはポリペプチドバリアント、変異体、ホモログ、または改変バージョンは、参照ポリヌクレオチド、タンパク質またはポリペプチドと、核酸またはアミノ酸配列同一性、例えば、約10%の配列同一性、約15%の配列同一性、約20%の配列同一性、約25%の配列同一性、約30%の配列同一性、約35%の配列同一性、約40%の配列同一性、約45%の配列同一性、約50%の配列同一性、約55%の配列同一性、約60%の配列同一性、約65%の配列同一性、約70%の配列同一性、約75%の配列同一性、約80%の配列同一性、約85%の配列同一性、約90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性、または約100%の配列同一性を共有するタンパク質またはポリペプチドを含む。
参照ポリヌクレオチド配列に対する「パーセント(%)核酸配列同一性」は、配列をアラインメントし、最大のパーセント配列同一性を実現するために必要であればギャップを導入した後、いかなる保存的置換も配列同一性の一部とみなさずに、参照ポリヌクレオチド配列内の核酸残基と同一である、候補配列内の核酸残基のパーセンテージと定義される。参照ポリペプチド配列に対する「パーセント(%)アミノ酸配列同一性」は、配列をアラインメントし、最大のパーセント配列同一性を実現するために必要であればギャップを導入した後、いかなる保存的置換も配列同一性の一部とみなさずに、参照ポリペプチド配列内のアミノ酸残基と同一である、候補配列内のアミノ酸残基のパーセンテージと定義される。パーセントアミノ酸配列同一性および/またはパーセント核酸配列を決定するためのアラインメントは、当技術分野の技術の範囲内である種々のやり方で、例えば、BLAST、BLAST−2、ALIGNまたはMegalign(DNASTAR)ソフトウェアなどの公的に入手可能なコンピュータソフトウェアを使用して実現することができる。当業者は、比較される配列の全長にわたって最大のアラインメントを実現するために必要な任意のアルゴリズムを含めた配列をアラインメントするための適切なパラメーターを決定することができる。
例えば、本明細書に開示されているClpSタンパク質またはポリペプチドは、A.tumefaciens ClpS2(例えば、配列番号198)、E.coli ClpS(例えば、配列番号199)、および/またはC.crescentus ClpS(例えば、配列番号200)などの参照ClpSタンパク質またはポリペプチドと配列同一性を、約10%の配列同一性、約15%の配列同一性、約20%の配列同一性、約25%の配列同一性、約30%の配列同一性、約35%の配列同一性、約40%の配列同一性、約45%の配列同一性、約50%の配列同一性、約55%の配列同一性、約60%の配列同一性、約65%の配列同一性、約70%の配列同一性、約75%の配列同一性、約80%の配列同一性、約85%の配列同一性、約90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性、または約100%の配列同一性で共有するバリアント、変異体、ホモログ、または改変バージョンを含む。
遊離のアミノ基を有する、ペプチド鎖の一方の末端の末端アミノ酸は、本明細書では、「N末端アミノ酸」(NTAA)と称される。遊離のカルボキシル基を有する、鎖の他方の末端の末端アミノ酸は、本明細書では、「C末端アミノ酸」(CTAA)と称される。ペプチドを構成するアミノ酸には、順番に番号を付すことができ、ペプチドは「n」アミノ酸長になる。本明細書で使用される場合、NTAAは、n番目のアミノ酸と考えられる(本明細書では「n番目のNTAA」とも称される)。この命名法を使用すると、N末端からC末端までのペプチドの長さを下方に次のアミノ酸は(n−1)番目のアミノ酸、次いで(n−2)番目のアミノ酸などである。ある特定の実施形態では、NTAA、CTAA、またはその両方を化学的部分で修飾または標識することができる。
本明細書で使用される場合、「バーコード」という用語は、巨大分子(例えば、タンパク質、ポリペプチド、ペプチド)、結合性物質、結合サイクルからの結合性物質のセット、試料巨大分子、試料のセット、コンパートメント(例えば、液滴、ビーズ、または分離された位置)内の巨大分子、コンパートメントのセット内の巨大分子、巨大分子の画分、巨大分子画分のセット、空間的領域もしくは空間的領域のセット、巨大分子のライブラリー、または結合性物質のライブラリーについての一意の識別子タグまたは起源情報をもたらす約2〜約30塩基(例えば、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29または30塩基)の核酸分子を指す。バーコードは、人工的な配列であっても天然に存在する配列であってもよい。ある特定の実施形態では、バーコードの集団内の各バーコードは異なるものである。他の実施形態では、バーコードの集団内のバーコードの一部が異なる、例えば、バーコードの集団内のバーコードの少なくとも約10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、または99%が異なる。バーコードの集団は、ランダムに生成することもでき、非ランダムに生成することもできる。ある特定の実施形態では、バーコードの集団は、エラー訂正バーコードである。バーコードは、多重化された配列決定データをコンピュータによりデコンボリューションし、個々の巨大分子、試料、ライブラリーなどに由来する配列読み取りを識別するために使用することができる。バーコードはまた、マッピングを増強するための小さなコンパートメント中に分布させた巨大分子の集合のデコンボリューションのために使用することもできる。例えば、ペプチドをプロテオームにマッピングし戻すのではなく、ペプチドをその起源であるタンパク質分子またはタンパク質複合体にマッピングし戻す。
「試料バーコード」は、「試料タグ」とも称され、巨大分子がいずれの試料に由来するかを識別するものである。
「空間バーコード」は、巨大分子が2Dまたは3D組織切片のいずれの領域に由来するかを識別するものである。空間バーコードは、組織切片に関する分子病理学のために使用することができる。空間バーコードにより、組織切片(複数可)由来の複数の試料またはライブラリーのマルチプレックス配列決定が可能になる。
本明細書で使用される場合、「コーディングタグ」という用語は、それに付随する結合性物質に関する識別情報を含む、任意の適切な長さのポリヌクレオチド、例えば、2および100ならびにその間のあらゆる整数を含めて約2塩基〜約100塩基の核酸分子を指す。「コーディングタグ」は、「配列決定可能なポリマー」で作られたものであってもよい(例えば、それぞれ、その全体が参照により組み込まれるNiu et al., 2013、Nat. Chem. 5: 282-292;Roy et al., 2015, Nat.Commun. 6: 7237; Lutz, 2015, Macromolecules 48: 4759-4767を参照されたい)。コーディングタグは、必要に応じて片側に1つのスペーサーが隣接するまたは両側にスペーサーが隣接するエンコーダー配列(例えば、バーコード識別子)を含んでよい。コーディングタグはまた、必要に応じたUMIおよび/または必要に応じた結合サイクル特異的バーコードで構成されていてもよい。コーディングタグは、一本鎖であっても二本鎖であってもよい。二本鎖コーディングタグは、平滑末端、突出末端、またはその両方を含んでよい。コーディングタグとは、結合性物質、結合性物質に直接付着したコーディングタグとハイブリダイズした相補配列(例えば、二本鎖コーディングタグに関して)、または伸長記録タグに存在するコーディングタグ情報に直接付着したコーディングタグを指し得る。ある特定の実施形態では、コーディングタグは、結合サイクル特異的スペーサーまたはバーコード、一意の分子識別子、ユニバーサルプライミング部位、またはこれらの任意の組合せをさらに含んでよい。
本明細書で使用される場合、「エンコーダー配列」または「エンコーダーバーコード」という用語は、それに付随する結合性物質に関する識別情報をもたらす、約2塩基〜約30塩基(例えば、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29または30塩基)の長さの核酸分子を指す。エンコーダー配列は、それに付随する結合性物質を一意的に識別することができるものである。ある特定の実施形態では、エンコーダー配列により、それに付随する結合性物質および結合性物質が使用される結合サイクルに関する識別情報がもたらされる。他の実施形態では、エンコーダー配列をコーディングタグ内の別の結合サイクル特異的バーコードと組み合わせる。あるいは、エンコーダー配列により、それに付随する結合性物質を2種またはそれよりも多くの異なる結合性物質のセットのメンバーに属するものと識別することができる。一部の実施形態では、解析のためにはこの識別のレベルで十分である。例えば、アミノ酸に結合する結合性物質を伴う一部の実施形態では、ペプチドの特定の位置におけるアミノ酸残基を決定的に識別するのではなく、ペプチドがその位置において2つの可能性のあるアミノ酸の1つを含むことを知ることで十分であり得る。別の例では、タンパク質標的の1種よりも多くのエピトープを認識し、様々な特異性を有する抗体の混合物を含むポリクローナル抗体に共通のエンコーダー配列を使用する。他の実施形態では、エンコーダー配列により可能性のある結合性物質のセットが識別される場合、逐次的な脱コーディング手法を使用して、各結合性物質の一意の識別をもたらすことができる。これは、繰り返される結合のサイクルにおいて所与の結合性物質に対するエンコーダー配列を変動させることによって実現される(Gunderson et al., 2004, Genome Res. 14: 870-7を参照されたい)。各結合サイクルからのコーディングタグ情報を部分的に識別することにより、他のサイクルからのコーディング情報と組み合わせると、結合性物質についての一意の識別子がもたらされ、例えば、個々のコーディングタグ(またはエンコーダー配列)ではなく、コーディングタグの特定の組合せにより、結合性物質に関する一意的識別情報がもたらされる。例えば、結合性物質のライブラリー内のエンコーダー配列は同じまたは同様の数の塩基を有する。
本明細書で使用される場合、「結合サイクル特異的タグ」、「結合サイクル特異的バーコード」、または「結合サイクル特異的配列」という用語は、特定の結合サイクル内で使用される結合性物質のライブラリーを識別するために使用される一意の配列を指す。結合サイクル特異的タグは、約2塩基〜約8塩基(例えば、2、3、4、5、6、7、または8塩基)の長さを含み得る。結合サイクル特異的タグは、結合性物質のコーディングタグ内に、スペーサー配列の一部として、エンコーダー配列の一部として、UMIの一部として、またコーディングタグ内の別の成分として組み入れることができる。
本明細書で使用される場合、「スペーサー」(Sp)という用語は、記録タグまたはコーディングタグの末端に存在する約0塩基〜約20塩基(例えば、0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20塩基)の長さの核酸分子を指す。ある特定の実施形態では、スペーサー配列は、一方の末端または両方の末端におけるコーディングタグのエンコーダー配列に隣接する。結合性物質の巨大分子への結合後、それらに付随するコーディングタグおよび記録タグ上の相補的なスペーサー配列間のアニーリングにより、それぞれ、結合情報の、プライマー伸長反応またはライゲーションによる記録タグ、コーディングタグ、またはジタグ構築物への移行が可能になる。Sp’は、Spに相補的なスペーサー配列を指す。例えば、結合性物質のライブラリー内のスペーサー配列は、同じ数の塩基を有する。共通する(共有されるまたは同一の)スペーサーを結合性物質のライブラリーにおいて使用することができる。スペーサー配列は、特定の結合サイクルにおいて使用される結合性物質を追跡するために、「サイクル特異的」配列を有してよい。スペーサー配列(Sp)は、結合サイクル全てにわたって一定のものであってもよく、特定のクラスの巨大分子に特異的なものであってもよく、結合サイクル数に特異的なものであってもよい。巨大分子クラス特異的スペーサーにより、完了した結合/伸長サイクルからの同類結合性物質の伸長記録タグに存在するコーディングタグ情報が、その後の結合サイクルにおいて同じクラスの巨大分子を認識する別の結合性物質のコーディングタグとクラス特異的スペーサーを介してアニーリングすることが可能になる。正確な同類の対の逐次的な結合によってのみ、相互作用するスペーサーエレメントおよび有効なプライマー伸長がもたらされる。スペーサー配列は、記録タグ内の相補的なスペーサー配列とアニーリングしてプライマー伸長(ポリメラーゼ伸長とも称される)反応を開始させる、またはライゲーション反応のための「副子」をもたらす、または「粘着末端」ライゲーション反応を媒介するために十分な数の塩基を含み得る。スペーサー配列は、コーディングタグ内のエンコーダー配列よりも少ない数の塩基を含み得る。
本明細書で使用される場合、「記録タグ」という用語は、それにコーディングタグの識別情報を移行することができる、またはそこから記録タグに付随する巨大分子に関する識別情報(例えば、UMI情報)をコーディングタグに移行することができる部分、例えば、化学的カップリング部分、核酸分子、または配列決定可能なポリマー分子を指す(例えば、それぞれ、その全体が参照により組み込まれるNiu et al., 2013、Nat. Chem. 5: 282-292;Roy et al., 2015、Nat. Commun.6: 7237; Lutz, 2015, Macromolecules 48: 4759-4767を参照されたい)。識別情報は、分子が由来する試料、画分、分配、空間的位置、相互作用、近隣の分子(複数可)、サイクル数などに関する情報などの、分子を特徴付ける任意の情報を含み得る。さらに、UMI情報の存在も識別情報に分類することができる。ある特定の実施形態では、結合性物質がポリペプチドに結合した後、結合性物質がポリペプチドに結合している間に、結合性物質と連結しているコーディングタグからの情報をポリペプチドに付随する記録タグに移行させることができる。他の実施形態では、結合性物質がポリペプチドに結合した後、結合性物質がポリペプチドに結合している間に、ポリペプチドに付随する記録タグからの情報を結合性物質と連結しているコーディングタグに移行させることができる。記録タグは、ポリペプチドに直接連結していてもよく、ポリペプチドに多機能性リンカーを介して連結していてもよく、固体支持体において近傍にある(または共局在する)ことによってポリペプチドに付随していてもよい。記録タグは、連結がコーディングタグ情報を記録タグに移行させるまたはその逆のために使用される方法に適合するものである限りは、5’末端または3’末端に連結していてもよく、内部の部位に連結していてもよい。記録タグは、他の機能的成分、例えば、ユニバーサルプライミング部位、一意の分子識別子、バーコード(例えば、試料バーコード、画分バーコード、空間バーコード、コンパートメントタグなど)、コーディングタグのスペーサー配列と相補的なスペーサー配列、またはこれらの任意の組合せをさらに含んでよい。コーディングタグ情報を記録タグに移行させるためにポリメラーゼ伸長を使用する実施形態では、記録タグのスペーサー配列は、記録タグの3’末端にあることが好ましい。
本明細書で使用される場合、「プライマー伸長」という用語は、「ポリメラーゼ伸長」とも称され、核酸ポリメラーゼ(例えば、DNAポリメラーゼ)によって触媒される反応であって、相補鎖とアニーリングする核酸分子(例えば、オリゴヌクレオチドプライマー、スペーサー配列)を、相補鎖を鋳型として使用してポリメラーゼによって伸長させる反応を指す。
本明細書で使用される場合、「一意の分子識別子」または「UMI」という用語は、UMIが連結された各巨大分子(例えば、ペプチド)または結合性物質についての一意の識別子タグをもたらす、約3〜約40塩基(3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、または40塩基の長さの核酸分子を指す。巨大分子UMIは、複数の伸長記録タグからの配列決定データをコンピュータによりデコンボリューションして個々の巨大分子を起源とする伸長記録タグを識別するために使用することができる。結合性物質UMIは、特定の巨大分子に結合する個々の結合性物質それぞれを識別するために使用することができる。例えば、UMIを使用して、特定のペプチド分子に存在する単一のアミノ酸に特異的な結合性物質についての個々の結合事象の数を識別することができる。結合性物質または巨大分子に関してUMIおよびバーコードの両方に言及される場合、バーコードは、個々の結合性物質または巨大分子についてのUMI以外の識別情報(例えば、試料バーコード、コンパートメントバーコード、結合サイクルバーコード)を指すことが理解される。
本明細書で使用される場合、「ユニバーサルプライミング部位」または「ユニバーサルプライマー」または「ユニバーサルプライミング配列」という用語は、ライブラリー増幅のためおよび/または配列決定反応のために使用することができる核酸分子を指す。ユニバーサルプライミング部位としては、これだけに限定されないが、PCR増幅のためのプライミング部位(プライマー配列)、一部の次世代シーケンシングプラットフォームにおいてブリッジ増幅を可能にする、フローセル表面上の相補的なオリゴヌクレオチドとアニーリングするフローセルアダプター配列、配列決定プライミング部位、またはこれらの組合せを挙げることができる。ユニバーサルプライミング部位は、次世代デジタルシーケンシングと併せて一般に使用されるものを含めた他の型の増幅のために使用することができる。例えば、伸長記録タグ分子を環状化し、ローリングサークル増幅にユニバーサルプライミング部位を使用して、配列決定鋳型として使用することができるDNAナノボールを形成することができる(Drmanac et al., 2009、Science 327: 78-81)。あるいは、記録タグ分子を環状化し、ユニバーサルプライミング部位からのポリメラーゼ伸長によって直接配列決定することができる(Korlachet al., 2008、Proc. Natl. Acad. Sci. 105: 1176-1181)。「フォワード」という用語は、「ユニバーサルプライミング部位」または「ユニバーサルプライマー」に関連して使用される場合、「5’」または「センス」と称される場合もある。「リバース」という用語は、「ユニバーサルプライミング部位」または「ユニバーサルプライマー」に関連して使用される場合、「3’」または「アンチセンス」と称される場合もある。
本明細書で使用される場合、「伸長記録タグ」という用語は、結合性物質が分析物、例えば、巨大分子に結合した後に少なくとも1つの結合性物質のコーディングタグ(またはその相補配列)の情報が移行された記録タグを指す。コーディングタグの情報は、記録タグに直接移行させることもでき(例えば、ライゲーション)、間接的に移行させることもできる(例えば、プライマー伸長)。コーディングタグの情報は、記録タグに酵素的に移行させることもでき、化学的に移行させることもできる。伸長記録タグは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200またはそれよりも多くのコーディングタグの結合性物質情報を含み得る。伸長記録タグの塩基配列は、それらのコーディングタグによって識別される結合性物質の結合の時間的および逐次的順序を反映する場合もあり、コーディングタグによって識別される結合性物質の結合の部分的な逐次的順序を反映する場合もあり、コーディングタグによって識別される結合性物質の結合のいかなる順序も反映しない場合もある。ある特定の実施形態では、伸長記録タグ中に存在するコーディングタグ情報は、解析される巨大分子配列を少なくとも25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の同一性で表す。解析される巨大分子配列が伸長記録タグによって100%の同一性で表されないある特定の実施形態では、エラーは、結合性物質によるオフターゲットの結合、または「飛ばされた」結合サイクル(例えば、結合サイクル中に結合性物質が巨大分子に結合できないことが原因で、プライマー伸長反応の失敗が原因で)、またはその両方に起因する可能性がある。
本明細書で使用される場合、「伸長コーディングタグ」という用語は、コーディングタグが接合している結合性物質の、記録タグが付随している巨大分子への結合後に少なくとも1つの記録タグ(またはその相補配列)の情報が移行されたコーディングタグを指す。記録タグの情報は、コーディングタグに直接移行させることもでき(例えば、ライゲーション)、間接的に移行させることもできる(例えば、プライマー伸長)。記録タグの情報は、酵素的に移行させることもでき、化学的に移行させることもできる。ある特定の実施形態では、伸長コーディングタグは、1つの結合事象を反映する1つの記録タグの情報を含む。本明細書で使用される場合、「ジタグ」または「ジタグ構築物」または「ジタグ分子」という用語は、コーディングタグが接合している結合性物質の、記録タグが付随している巨大分子への結合後に少なくとも1つの記録タグ(またはその相補配列)の情報および少なくとも1つのコーディングタグ(またはその相補配列)が移行された核酸分子を指す(例えば、図11Bを参照されたい)。記録タグの情報およびコーディングタグは、ジタグに間接的に移行させることができる(例えば、プライマー伸長)。記録タグの情報は、酵素的に移行させることもでき、化学的に移行させることもできる。ある特定の実施形態では、ジタグは、記録タグのUMI、記録タグのコンパートメントタグ、記録タグのユニバーサルプライミング部位、コーディングタグのUMI、コーディングタグのエンコーダー配列、結合サイクル特異的バーコード、コーディングタグのユニバーサルプライミング部位、またはこれらの任意の組合せを含む。
本明細書で使用される場合、「固体支持体」、「固体表面」、または「固体基板」または「基板」という用語は、巨大分子(例えば、ペプチド)を、共有結合性の相互作用および非共有結合性の相互作用またはこれらの任意の組合せを含めた当技術分野で公知の任意の手段によって直接または間接的に結び付けることができる、多孔質材料および非多孔質材料を含めた任意の固体材料を指す。固体支持体は、2次元(例えば、平面)であってもよく、3次元(例えば、ゲルマトリックスまたはビーズ)であってもよい。固体支持体は、これだけに限定されないが、ビーズ、マイクロビーズ、アレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フロースルーチップ、フローセル、信号変換電子機器を含むバイオチップ、チャネル、マイクロタイターウェル、ELISAプレート、スピン干渉ディスク、ニトロセルロースメンブレン、ニトロセルロースに基づくポリマー表面、ポリマーマトリックス、ナノ粒子、またはマイクロスフェアを含めた任意の支持体表面であってよい。固体支持体用の材料としては、これだけに限定されないが、アクリルアミド、アガロース、セルロース、ニトロセルロース、ガラス、金、石英、ポリスチレン、ポリエチレン酢酸ビニル、ポリプロピレン、ポリメタクリレート、ポリエチレン、ポリエチレンオキシド、ポリシリケート、ポリカーボネート、テフロン(登録商標)、フルオロカーボン、ナイロン、シリコンゴム、ポリ酸無水物、ポリグリコール酸、ポリ乳酸(polyactic acid)、ポリオルトエステル、官能化シラン、ポリプロピルフメレート、コラーゲン、グリコサミノグリカン、ポリアミノ酸、デキストラン、またはこれらの任意の組合せが挙げられる。固体支持体は、薄膜、膜、ビン、ディッシュ、繊維、織られた繊維、チューブなどの成形ポリマー、粒子、ビーズ、マイクロスフェア、微小粒子、またはこれらの任意の組合せをさらに含む。例えば、固体表面がビーズである場合、ビーズは、これだけに限定されないが、セラミックビーズ、ポリスチレンビーズ、ポリマービーズ、メチルスチレンビーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズを含み得る。ビーズは、球状であっても不規則な形状であってもよい。ビーズのサイズは、ナノメートル、例えば、100nmから、ミリメートル、例えば、1mmまでにわたり得る。ある特定の実施形態では、ビーズのサイズは、約0.2ミクロンから約200ミクロンまで、または約0.5ミクロンから約5ミクロンまでにわたる。一部の実施形態では、ビーズは、直径約1μm、約1.5μm、約2μm、約2.5μm、約2.8μm、約3μm、約3.5μm、約4μm、約4.5μm、約5μm、約5.5μm、約6μm、約6.5μm、約7μm、約7.5μm、約8μm、約8.5μm、約9μm、約9.5μm、約10μm、約10.5μm、約15μm、または約20μmであり得る。ある特定の実施形態では、「ビーズ(a bead)」固体支持体とは、個々のビーズを指す場合もあり、複数のビーズを指す場合もある。本明細書で使用される場合、「基板」という用語は、機械的機能性であるか、生物学的機能性であるか、光学的機能性であるか、化学的機能性であるかまたは他の機能性であるかにかかわらず、機能性がもたらされるように材料を配置することができる機械的な支持体を含む。基板は、パターンを有さないものであってもパターンを有するものであってもよく、分配されていても分配されていなくてもよい。基板上の分子は、特徴的に配置されていてもよく、基板表面に均一に配置されていてもよい。
本明細書で使用される場合、「核酸分子」または「ポリヌクレオチド」という用語は、3’−5’リン酸ジエステル結合で連結されたデオキシリボヌクレオチドまたはリボヌクレオチドを含有する一本鎖または二本鎖ポリヌクレオチド、ならびにポリヌクレオチド類似体を指す。核酸分子としては、これだけに限定されないが、DNA、RNA、およびcDNAが挙げられる。ポリヌクレオチド類似体は、天然のポリヌクレオチドにおいて見出される標準のリン酸ジエステル連結以外の骨格、および必要に応じて、修飾された糖部分またはリボースもしくはデオキシリボース以外の部分を有し得る。ポリヌクレオチド類似体は、標準のポリヌクレオチド塩基とワトソン・クリック塩基対合によって水素結合することが可能な塩基を含有し、類似体骨格は、当該塩基を、そのような水素結合がオリゴヌクレオチド類似体分子と標準のポリヌクレオチド内の塩基との間で配列特異的に可能になるように提示する。ポリヌクレオチド類似体の例としては、これだけに限定されないが、異種核酸(xeno nucleic acid)(XNA)、架橋核酸(BNA)、グリコール核酸(GNA)、ペプチド核酸(PNA)、γPNA、モルホリノポリヌクレオチド、ロックド核酸(LNA)、トレオース核酸(TNA)、2’−O−メチルポリヌクレオチド、2’−O−アルキルリボシル置換ポリヌクレオチド、ホスホロチオエートポリヌクレオチド、およびボロノホスフェートポリヌクレオチドが挙げられる。ポリヌクレオチド類似体は、例えば、7−デアザプリン類似体、8−ハロプリン類似体、5−ハロピリミジン類似体、または、ヒポキサンチン、ニトロアゾール、イソカルボスチリル類似体、アゾールカルボキサミド、および芳香族トリアゾール類似体を含めた、任意の塩基と対合することができるユニバーサル塩基類似体、または、親和性結合のためのビオチン部分などの追加的な機能性を有する塩基類似体を含めたプリンまたはピリミジン類似体を有し得る。
本明細書で使用される場合、「核酸配列決定」とは、核酸分子内または核酸分子の試料中のヌクレオチドの順序を決定することを意味する。
本明細書で使用される場合、「次世代シーケンシング」は、数百万〜数十億の分子を並行して配列決定することを可能にするハイスループットな配列決定法を指す。次世代シーケンシング法の例としては、合成による配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、ポロニーシーケンシング、イオン半導体シーケンシング、およびパイロシーケンシングが挙げられる。プライマーを固体基板および核酸分子に対する相補配列に付着させることにより、核酸分子を固体基板にプライマーを介してハイブリダイズさせることができ、次いで、固体基板上の別個の領域においてポリメラーゼを使用することによって多数のコピーを生成させて、増幅させることができる(これらの群分けは、時にはポリメラーゼコロニーまたはポロニーと称される)。したがって、配列決定プロセス中、特定の位置にあるヌクレオチドについて多数回配列決定することができる(例えば、数百回または数千回)−このカバレッジの深さは、「ディープシーケンシング」と称される。ハイスループットな核酸配列決定技術の例としては、Service(Science 311: 1544-1546、2006)によって概説されている通り、並行のビーズアレイ、合成による配列決定、ライゲーションによる配列決定、キャピラリー電気泳動、電子マイクロチップ、「バイオチップ」、マイクロアレイ、並行マイクロチップ、および単一分子アレイなどの形式を含めた、Illumina、BGI、Qiagen、Thermo−Fisher、およびRocheにより提供されるプラットフォームが挙げられる。
本明細書で使用される場合、「単一分子シーケンシング」または「第3世代シーケンシング」とは、単一分子シーケンシング装置からの読み取りがDNAの単一分子の配列決定によって生成される次世代シーケンシング法を指す。段階的な手法で配列決定するために増幅に依拠して多くのDNA分子を並行してクローニングする次世代シーケンシング法とは異なり、単一分子シーケンシングでは、DNAの単一分子を調査し、増幅または同期化の必要はない。単一分子シーケンシングは、各塩基の組み入れ後に配列決定反応を休止する必要のある(「wash−and−scan」サイクル)方法、および読み取りステップ間の停止を必要としない方法を含む。単一分子シーケンシング方法の例としては、単一分子リアルタイムシーケンシング(Pacific Biosciences)、ナノポアに基づく配列決定(Oxford Nanopore)、DI(duplex interrupted)ナノポアシーケンシング、および先端顕微鏡を使用したDNAのダイレクトイメージングが挙げられる。
本明細書で使用される場合、分析物、例えば、巨大分子の「解析」とは、分析物または巨大分子の成分の全部または一部を数量化すること、特徴付けること、区別すること、またはこれらの組合せを意味する。例えば、ペプチド、ポリペプチド、またはタンパク質の解析は、ペプチドのアミノ酸配列(連続したまたは連続していない)の全部または一部を決定することを含む。巨大分子の解析は、巨大分子の成分の部分的な識別も含む。例えば、巨大分子タンパク質配列内のアミノ酸の部分的な識別により、タンパク質のアミノ酸を、可能性のあるアミノ酸のサブセットに属するものと識別することができる。解析は、一般にはn番目のNTAAの解析で開始され、次いで、ペプチドの次のアミノ酸(すなわち、n−1、n−2、n−3など)に進行する。これは、n番目のNTAAが切断され、それにより、ペプチドの(n−1)番目のアミノ酸がN末端アミノ酸(本明細書では、「(n−1)番目のNTAA」と称される)に変わることによって実現される。ペプチドの解析は、ペプチド上の翻訳後修飾の存在および頻度を決定することも含み得、これは、ペプチド上の翻訳後修飾の逐次的順序に関する情報を含む場合もあり、含まない場合もある。ペプチドの解析は、ペプチドにおけるエピトープの存在および頻度を決定することも含み得、これは、ペプチド内のエピトープの逐次的順序または位置に関する情報を含む場合もあり、含まない場合もある。ペプチドの解析は、異なる型の解析を組み合わせること、例えば、エピトープ情報、アミノ酸配列情報、翻訳後修飾情報、またはこれらの任意の組合せを得ることを含み得る。
本明細書で使用される場合、「コンパートメント」という用語は、巨大分子のサブセットを巨大分子の試料から分離または隔離する物理的な領域または容積を指す。例えば、コンパートメントにより、個々の細胞を他の細胞から分離すること、または試料のプロテオームのサブセットを試料の残りのプロテオームから分離することができる。コンパートメントは、水性コンパートメント(例えば、マイクロ流体液滴)、固体コンパートメント(例えば、プレート上のピコタイターウェルまたはマイクロタイターウェル、チューブ、バイアル、ゲルビーズ)、または表面上の分離された領域であってよい。コンパートメントは、巨大分子を固定化することができる1つまたは複数のビーズを含んでよい。
本明細書で使用される場合、「コンパートメントタグ」または「コンパートメントバーコード」という用語は、1つまたは複数のコンパートメント(例えば、マイクロ流体液滴)内の、構成物(例えば、単一の細胞のプロテオーム)に関する識別情報を含む、約4塩基〜約100塩基(4塩基、100塩基、およびその間の任意の整数を含む)の一本鎖または二本鎖核酸分子を指す。コンパートメントバーコードにより、複数(例えば、数百万〜数十億)のコンパートメントから同じ物理的コンパートメントまたはコンパートメントの群に分離された試料中の巨大分子のサブセット、例えば、タンパク質試料のサブセットが識別される。したがって、コンパートメントタグを使用して、同じコンパートメントタグを有する1つまたは複数のコンパートメントに由来する構成物と、異なるコンパートメントタグを有する別のコンパートメント内の構成物を、これらの構成物が一緒にプールされた後であっても区別することができる。各コンパートメント内または2つもしくはそれよりも多くのコンパートメントの群内のタンパク質および/またはペプチドを一意のコンパートメントタグで標識することにより、個々のコンパートメントまたはコンパートメントの群内の同じタンパク質、タンパク質複合体、または細胞に由来するペプチドを識別することができる。コンパートメントタグは、必要に応じて片側または両側にスペーサー配列が隣接するバーコード、および必要に応じたユニバーサルプライマーを含む。スペーサー配列は、記録タグのスペーサー配列に相補的なものであってよく、それにより、コンパートメントタグ情報の記録タグへの移行が可能になる。コンパートメントタグは、特に、コンパートメントタグが、本明細書に記載の下流のペプチド解析方法に使用される記録タグを含む実施形態に関しては、ユニバーサルプライミング部位、一意の分子識別子(それに付着したペプチドに関する識別情報をもたらす)、またはその両方も含んでよい。コンパートメントタグは、ペプチドとのカップリングのための機能的部分(例えば、アルデヒド、NHS、mTet、アルキンなど)を含んでよい。あるいは、コンパートメントタグは、コンパートメントタグと目的のペプチドのライゲーションを可能にするためのタンパク質リガーゼの認識配列を含むペプチドを含んでよい。コンパートメントは、単一のコンパートメントタグ、必要に応じたUMI配列を保存する複数の同一のコンパートメントタグ、または2つもしくはそれよりも多くの異なるコンパートメントタグを含んでよい。ある特定の実施形態では、各コンパートメントは、一意のコンパートメントタグを含む(1対1のマッピング)。他の実施形態では、より大きなコンパートメントの集団からの多数のコンパートメントは、同じコンパートメントタグを含む(多対1のマッピング)。コンパートメントタグは、コンパートメント内の固体支持体(例えば、ビーズ)に接合していてもよく、コンパートメント自体の表面(例えば、ピコタイターウェルの表面)に接合していてもよい。あるいは、コンパートメントタグは、コンパートメント内の溶液中に遊離していてよい。
本明細書で使用される場合、「分配」という用語は、試料内の巨大分子の集団に由来する巨大分子の亜集団への一意のバーコードのランダムな割り当てを指す。ある特定の実施形態では、分配は、巨大分子をコンパートメントに区分することによって実現することができる。分配は、単一のコンパートメント内の巨大分子で構成されるものであってもよく、コンパートメントの集団に由来する多数のコンパートメント内の巨大分子で構成されるものであってもよい。
本明細書で使用される場合、「分配タグ」または「分配バーコード」とは、分配に関する識別情報を含む、約4塩基〜約100塩基(4塩基、100塩基、およびその間の任意の整数を含む)の一本鎖または二本鎖核酸分子を指す。ある特定の実施形態では、巨大分子に関する分配タグは、巨大分子を同じバーコードで標識されたコンパートメント(複数可)に分配することにより生じる同一のコンパートメントタグを指す。
本明細書で使用される場合、「画分」という用語は、サイズ、疎水性、等電点、親和性などによる分画などの物理的または化学的分離方法を使用して残りの試料または細胞小器官から選別された試料内の巨大分子のサブセット(例えば、タンパク質)を指す。分離方法としては、HPLC分離、ゲル分離、アフィニティー分離、細胞分画、細胞小器官分画、組織分画などが挙げられる。流体の流れ、磁性、電流、質量、密度などの物理特性も分離のために使用することができる。
本明細書で使用される場合、「画分バーコード」という用語は、画分内の巨大分子に関する識別情報を含む、約4塩基〜約100塩基(4塩基、100塩基、およびその間の任意の整数を含む)の一本鎖または二本鎖核酸分子を指す。
本明細書で使用される場合、本明細書の「多重化」または「多重アッセイ」という用語は、それぞれが少なくとも1つの異なる検出特性、例えば、蛍光特性(例えば、励起波長、発光波長、発光強度、FWHM(ピークの高さの半値全幅)、または蛍光の寿命)または一意の核酸もしくはタンパク質配列特性を有する1つよりも多くの捕捉プローブコンジュゲートを使用することによって多数の標的、例えば、多数の核酸配列の存在および/または量を同時にアッセイすることができるアッセイまたは他の解析方法を含み得る。
III.巨大分子を含む分析物を解析するための方法およびキット
A.概要
本明細書に記載の方法およびキットは、分析物、例えば、巨大分子を解析するための高度に並行化された手法を提供する。高度に多重化された分析物巨大分子結合アッセイは、次世代シーケンシングによる読み取りのために核酸分子ライブラリーに変換される。本明細書において提示されるキットおよびキット成分は、タンパク質またはペプチド配列決定に特に有用である。
好ましい実施形態では、タンパク質試料を、バーコード(例えば、試料バーコード、コンパートメントバーコード)および必要に応じた一意の分子識別子を含む少なくとも1つの核酸記録タグを用いて単一分子レベルで標識する。タンパク質試料にタンパク質分解による消化を行って、記録タグで標識されたペプチドの集団(例えば、数百万〜数十億)を生成する。これらの記録タグで標識されたペプチドをプールし、固体支持体(例えば、多孔質ビーズ)上にランダムに固定化する。プールされ、固定化され、記録タグで標識されたペプチドを、多数の連続的な結合サイクルに供し、各結合サイクルは、付随する結合性物質を識別するエンコーダー配列を含むコーディングタグで標識された複数の結合性物質(例えば、天然に存在するアミノ酸20種全てに対する結合性物質)への曝露を含む。各結合サイクル中、結合性物質のペプチドへの結合に関する情報を、結合性物質のコーディングタグ情報を記録タグに移行させること(または記録タグ情報をコーディングタグに移行させることもしくは記録タグ情報およびコーディングタグ情報の両方を別のジタグ構築物に移行させること)によって捕捉する。結合サイクルが完了したら、アッセイされたペプチドの結合履歴を表す伸長記録タグ(または伸長コーディングタグまたはジタグ構築物)のライブラリーを生成し、これを、非常にハイスループットな次世代デジタルシーケンシング法を使用して解析することができる。記録タグに核酸バーコードを使用することにより、例えば、ペプチド配列の起源である試料、細胞、プロテオームのサブセット、またはタンパク質を識別するために、大量のペプチド配列決定データをデコンボリューションすることが可能になる。
一態様では、巨大分子を解析するための方法であって、(a)固体支持体に接合した巨大分子および付随するまたは共局在する記録タグを用意するステップと;(b)巨大分子を、巨大分子に結合することが可能な第1の結合性物質と接触させるステップであって、第1の結合性物質が、第1の結合性物質に関する識別情報を有する第1のコーディングタグを含む、ステップと;(c)第1のコーディングタグの情報を記録タグに移行させて、一次伸長記録タグを生成するステップと;(d)巨大分子を、巨大分子に結合することが可能な第2の結合性物質と接触させるステップであって、第2の結合性物質が、第2の結合性物質に関する識別情報を有する第2のコーディングタグを含む、ステップと;(e)第2のコーディングタグの情報を一次伸長記録タグに移行させて、二次伸長記録タグを生成するステップと;(f)二次伸長タグを解析するステップと(例えば、図2A〜Dを参照されたい)を含む方法において使用するためのキットおよびキット成分が本明細書において提示される。
ある特定の実施形態では、接触させるステップ(b)および(d)を逐次的に実施する、例えば、第1の結合性物質と第2の結合性物質を、別々の結合サイクル反応で巨大分子と接触させる。他の実施形態では、接触させるステップ(b)および(d)を同時に、例えば、第1の結合性物質、第2の結合性物質、および必要に応じて追加的な結合性物質を含む単一の結合サイクル反応などで実施する。好ましい実施形態では、接触させるステップ(b)および(d)は、それぞれ、巨大分子を複数の結合性物質と接触させることを含む。これらのステップを実施するためのキット成分が提供される。
ある特定の実施形態では、方法は、ステップ(e)と(f)の間に、(x)第2の結合性物質を巨大分子に結合することが可能な第3の(またはより高次の)結合性物質であって、第3の(またはより高次の)結合性物質に関する識別情報を有する第3の(またはより高次の)コーディングタグを含む第3の(またはより高次の)結合性物質に置き換えることにより、ステップ(d)および(e)を1回または複数回繰り返すステップと;(y)第3の(またはより高次の)コーディングタグの情報を第2の(またはより高次の)伸長記録タグに移行させて、第3の(またはより高次の)伸長記録タグを生成するステップと;(z)第3の(またはより高次の)伸長記録タグを解析するステップとをさらに含む。これらのステップを実施するためのキット成分が提供される。
第3の(またはより高次の)結合性物質を第1の結合性物質および第2の結合性物質とは別の結合サイクル反応で巨大分子と接触させることができる。一実施形態では、n回目の結合サイクルにおいてn番目の結合性物質を分析物(例えば、巨大分子)と接触させ、さらなる伸長記録タグ(n番目の伸長記録タグ)を形成するためにn番目のコーディングタグ(n番目の結合性物質のもの)から(n−1)回目の結合サイクルにおいて形成された伸長記録タグに情報を移行させ、ここで、nは、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、または約50、約100、約150、約200、またはそれよりも大きな整数である。同様に、(n+1)回目の結合サイクルにおいて(n+1)番目の結合性物質を分析物と接触させるなどである。
あるいは、第3の(またはより高次の)結合性物質を、第1の結合性物質、および第2の結合性物質と一緒に単一の結合サイクル反応で巨大分子と接触させることができる。この場合、結合サイクル特異的コーディングタグなどの結合サイクル特異的配列を使用することができる。例えば、コーディングタグは、結合サイクル特異的スペーサー配列を含んでよく、したがって、n番目のコーディングタグから(n−1)番目の伸長記録タグに情報が移行してn番目の伸長記録タグが形成されて初めて、(n+1)番目の結合性物質(分析物にすでに結合していてもよく結合していなくてもよい)により(n+1)番目の結合タグの情報がn番目の伸長記録タグに移行することができるようになる。
第2の態様では、(a)固体支持体に接合した巨大分子、付随する第1の記録タグおよび付随する第2の記録タグを用意するステップと;(b)巨大分子を、巨大分子に結合することが可能な第1の結合性物質と接触させるステップであって、第1の結合性物質が、第1の結合性物質に関する識別情報を有する第1のコーディングタグを含む、ステップと;(c)第1のコーディングタグの情報を第1の記録タグに移行させて、第1の伸長記録タグを生成するステップと;(d)巨大分子を、巨大分子に結合することが可能な第2の結合性物質と接触させるステップであって、第2の結合性物質が、第2の結合性物質に関する識別情報を有する第2のコーディングタグを含む、ステップと;(e)第2のコーディングタグの情報を第2の記録タグに移行させて、第2の伸長記録タグを生成するステップと;(f)第1の伸長記録タグおよび第2の伸長記録タグを解析するステップとを含む方法において使用するためのキットおよびキット成分が本明細書において提示される。
ある特定の実施形態では、接触させるステップ(b)および(d)を逐次的に実施する、例えば、第1の結合性物質および第2の結合性物質を、別々の結合サイクル反応で巨大分子と接触させる。他の実施形態では、接触させるステップ(b)および(d)を同時に、例えば、第1の結合性物質、第2の結合性物質、および必要に応じて追加的な結合性物質を含む単一の結合サイクル反応などで実施する。これらのステップを実施するためのキット成分が提供される。
ある特定の実施形態では、ステップ(a)は、固体支持体に接合した付随する第3の(またはより高次の)記録タグを用意するステップをさらに含む。さらなる実施形態では、方法は、ステップ(e)と(f)の間に、(x)第2の結合性物質を巨大分子に結合することが可能な第3の(またはより高次の)結合性物質であって、第3の(またはより高次の)結合性物質に関する識別情報を有する第3の(またはより高次の)コーディングタグを含む第3の(またはより高次の)結合性物質に置き換えることにより、ステップ(d)および(e)を1回または複数回繰り返すステップと;(y)第3の(またはより高次の)コーディングタグの情報を第3の(またはより高次の)記録タグに移行させて、第3の(またはより高次の)伸長記録タグを生成するステップと、(z)第1の伸長記録タグ、第2の伸長記録タグおよび第3の(またはより高次の)伸長記録タグを解析するステップとをさらに含む。これらのステップを実施するためのキット成分が提供される。
第3の(またはより高次の)結合性物質を第1の結合性物質および第2の結合性物質とは別の結合サイクル反応で巨大分子と接触させることができる。あるいは、第3の(またはより高次の)結合性物質を、第1の結合性物質、および第2の結合性物質と一緒に単一の結合サイクル反応で巨大分子と接触させることができる。
キットのある特定の実施形態では、第1のコーディングタグ、第2のコーディングタグ、および任意のより高次のコーディングタグはそれぞれ、結合サイクル特異的配列を有する。
第3の態様では、(a)固体支持体に接合したペプチドおよび付随する記録タグを用意するステップと;(b)ペプチドのN末端アミノ酸(NTAA)を化学的部分で修飾して、修飾されたNTAAを生成するステップと;(c)ペプチドを、修飾されたNTAAに結合することが可能な第1の結合性物質と接触させるステップであって、第1の結合性物質が、第1の結合性物質に関する識別情報を有する第1のコーディングタグを含む、ステップと;(d)第1のコーディングタグの情報を記録タグに移行させて、伸長記録タグを生成するステップと;(e)伸長記録タグを解析するステップと(例えば、図3を参照されたい)を含む方法において使用するためのキットおよびキット成分が本明細書において提示される。
ある特定の実施形態では、ステップ(c)が、ペプチドを、第2の(またはより高次の)結合性物質に関する識別情報を有する第2の(またはより高次の)コーディングタグを含む第2の(またはより高次の)結合性物質であって、ステップ(b)の修飾されたNTAA以外の修飾されたNTAAに結合することが可能である第2の(またはより高次の)結合性物質と接触させるステップをさらに含む。さらなる実施形態では、ペプチドの第2の(またはより高次の)結合性物質との接触を、ペプチドの第1の結合性物質との接触後に逐次的に行う、例えば、第1の結合性物質および第2の(またはより高次の)結合性物質を別々の結合サイクル反応でペプチドと接触させる。他の実施形態では、ペプチドの第2の(またはより高次の)結合性物質との接触を、ペプチドの第1の結合性物質との接触と同時に、例えば、第1の結合性物質および第2の(またはより高次の)結合性物質)を含む単一の結合サイクル反応などで行う。これらのステップを実施するためのキット成分が提供される。
ある特定の実施形態では、化学的部分をNTAAに化学反応または酵素反応を介して付加する。
ある特定の実施形態では、NTAAを修飾するために使用される化学的部分は、フェニルチオカルバモイル(PTC)、ジニトロフェノール(DNP)部分;スルホニルオキシニトロフェニル(SNP)部分、ダンシル部分;7−メトキシクマリン部分;チオアシル部分;チオアセチル部分;アセチル部分;グアニジニル部分;またはチオベンジル部分である。
化学的部分は、化学薬剤を使用してNTAAに付加することができる。ある特定の実施形態では、NTAAをPTC部分で修飾するための化学薬剤は、フェニルイソチオシアネートまたはその誘導体である;NTAAをDNP部分で修飾するための化学薬剤は、2,4−ジニトロベンゼンスルホン酸(DNBS)または1−フルオロ−2,4−ジニトロベンゼン(DNFB)などのハロゲン化アリールである;NTAAをスルホニルオキシニトロフェニル(SNP)部分で修飾するための化学薬剤は、4−スルホニル−2−ニトロフルオロベンゼン(SNFB)である;NTAAをダンシル基で修飾するための化学薬剤は、ダンシルクロリドなどのスルホニルクロリドである;NTAAを7−メトキシクマリン部分で修飾するための化学薬剤は、7−メトキシクマリン酢酸(MCA)である;NTAAをチオアシル部分で修飾するための化学薬剤は、チオアシル化試薬である;NTAAをチオアセチル部分で修飾するための化学薬剤は、チオアセチル化試薬である;NTAAをアセチル部分で修飾するための化学薬剤は、アセチル化試薬(例えば、無水酢酸)である;NTAAをグアニジニル(アミジニル)部分で修飾するための化学薬剤は、グアニジニル化試薬である、またはNTAAをチオベンジル部分で修飾するための化学薬剤は、チオベンジル化試薬である。これらの化学的部分および化学薬剤のいずれかを本明細書に開示されているキットの成分として提供することができる。
第4の態様では、本開示は、(a)固体支持体に接合したペプチドおよび付随する記録タグを用意するステップと;(b)ペプチドのN末端アミノ酸(NTAA)を化学的部分で修飾して、修飾されたNTAAを生成するステップと;(c)ペプチドを、修飾されたNTAAに結合することが可能な第1の結合性物質と接触させるステップであって、第1の結合性物質が、第1の結合性物質に関する識別情報を有する第1のコーディングタグを含む、ステップと;(d)第1のコーディングタグの情報を記録タグに移行させて、第1の伸長記録タグを生成するステップと;(e)修飾されたNTAAを除去して、新しいNTAAを露出させるステップと;(f)ペプチドの新しいNTAAを化学的部分で修飾して、新しく修飾されたNTAAを生成するステップと;(g)ペプチドを、新しく修飾されたNTAAに結合することが可能な第2の結合性物質と接触させるステップであって、第2の結合性物質が、第2の結合性物質に関する識別情報を有する第2のコーディングタグを含む、ステップと;(h)第2のコーディングタグの情報を第1の伸長記録タグに移行させて、第2の伸長記録タグを生成するステップと;(i)第2の伸長記録タグを解析するステップとを含む方法において使用するためのキットおよびキット成分を提供する。
ある特定の実施形態では、接触させるステップ(c)および(g)を逐次的に実施する、例えば、第1の結合性物質および第2の結合性物質を別々の結合サイクル反応でペプチドと接触させる。これらのステップを実施するためのキット成分が提供される。
ある特定の実施形態では、方法は、ステップ(h)と(i)の間に、(x)第2の結合性物質を修飾されたNTAAに結合することが可能である第3の(またはより高次の)結合性物質であって、第3の(またはより高次の)結合性物質に関する識別情報を有する第3の(またはより高次の)コーディングタグを含む第3の(またはより高次の)結合性物質に置き換えることにより、ステップ(e)、(f)、および(g)を1回または複数回繰り返すステップと;(y)第3の(またはより高次の)コーディングタグの情報を第2の(またはより高次の)伸長記録タグに移行させて、第3の(またはより高次の)伸長記録タグを生成するステップと;(z)第3の(またはより高次の)伸長記録タグを解析するステップとをさらに含む。これらのステップを実施するためのキット成分が提供される。
ある特定の実施形態では、化学的部分をNTAAに化学反応または酵素反応を介して付加する。
ある特定の実施形態では、化学的部分は、フェニルチオカルバモイル(PTC)、ジニトロフェノール(DNP)部分;スルホニルオキシニトロフェニル(SNP)部分、ダンシル部分;7−メトキシクマリン部分;チオアシル部分;チオアセチル部分;アセチル部分;グアニル部分;またはチオベンジル部分である。
化学的部分は、化学薬剤を使用してNTAAに付加することができる。ある特定の実施形態では、NTAAをPTC部分で修飾するための化学薬剤は、フェニルイソチオシアネートまたはその誘導体である;NTAAをDNP部分で修飾するための化学薬剤は、2,4−ジニトロベンゼンスルホン酸(DNBS)または1−フルオロ−2,4−ジニトロベンゼン(DNFB)などのハロゲン化アリールである;NTAAをスルホニルオキシニトロフェニル(SNP)部分で修飾するための化学薬剤は、4−スルホニル−2−ニトロフルオロベンゼン(SNFB)である;NTAAをダンシル基で修飾するための化学薬剤は、ダンシルクロリドなどのスルホニルクロリドである;NTAAを7−メトキシクマリン部分で修飾するための化学的試薬は、7−メトキシクマリン酢酸(MCA)である;NTAAをチオアシル部分で修飾するための化学薬剤は、チオアシル化試薬である;NTAAをチオアセチル部分で修飾するための化学薬剤は、チオアセチル化試薬である;NTAAをアセチル部分で修飾するための化学薬剤は、アセチル化剤(例えば、無水酢酸)である;NTAAをグアニル部分で修飾するための化学薬剤は、グアニジニル化試薬である、またはNTAAをチオベンジル部分で修飾するための化学薬剤は、チオベンジル化試薬である。これらの化学的部分および化学薬剤のいずれかを本明細書に開示されているキットの成分として提供することができる。
第5の態様では、ポリペプチドを解析するための方法であって、(a)固体支持体に接合したペプチドおよび付随する記録タグを用意するステップと;(b)ペプチドを、ペプチドのN末端アミノ酸(NTAA)に結合することが可能な第1の結合性物質と接触させるステップであって、第1の結合性物質が、第1の結合性物質に関する識別情報を有する第1のコーディングタグを含む、ステップと;(c)第1のコーディングタグの情報を記録タグに移行させて、伸長記録タグを生成するステップと;(d)伸長記録タグを解析するステップとを含む方法において使用するためのキットおよびキット成分が提供される。
ある特定の実施形態では、ステップ(b)が、ペプチドを、第2の(またはより高次の)結合性物質に関する識別情報を有する第2の(またはより高次の)コーディングタグを含む第2の(またはより高次の)結合性物質と接触させるステップであって、第2の(またはより高次の)結合性物質が、ペプチドのNTAA以外のNTAAに結合することが可能である、ステップをさらに含む。さらなる実施形態では、ペプチドの第2の(またはより高次の)結合性物質との接触を、ペプチドの第1の結合性物質との接触後に逐次的に行う、例えば、第1の結合性物質および第2の(またはより高次の)結合性物質を別々の結合サイクル反応でペプチドと接触させる。他の実施形態では、ペプチドの第2の(またはより高次の)結合性物質との接触をペプチドの第1の結合性物質との接触と同時に、例えば、第1の結合性物質および第2の(またはより高次の)結合性物質を含む単一の結合サイクル反応などで行う。
第6の態様では、(a)固体支持体に接合したペプチドおよび付随する記録タグを用意するステップと;(b)ペプチドを、ペプチドのN末端アミノ酸(NTAA)に結合することが可能な第1の結合性物質と接触させるステップであって、第1の結合性物質が、第1の結合性物質に関する識別情報を有する第1のコーディングタグを含む、ステップと;(c)第1のコーディングタグの情報を記録タグに移行させて、第1の伸長記録タグを生成するステップと;(d)NTAAを除去して、ペプチドの新しいNTAAを露出させるステップと;(e)ペプチドを、新しいNTAAに結合することが可能な第2の結合性物質と接触させるステップであって、第2の結合性物質が、第2の結合性物質に関する識別情報を有する第2のコーディングタグを含む、ステップと;(f)第2のコーディングタグの情報を第1の伸長記録タグに移行させて、第2の伸長記録タグを生成するステップと;(g)第2の伸長記録タグを解析するステップとを含む方法において使用するためのキットおよびキット成分が提供される。
ある特定の実施形態では、方法は、ステップ(f)と(g)の間に、(x)第2の結合性物質を巨大分子に結合することが可能な第3の(またはより高次の)結合性物質であって、第3の(またはより高次の)結合性物質に関する識別情報を有する第3の(またはより高次の)コーディングタグを含む第3の(またはより高次の)結合性物質に置き換えることにより、ステップ(d)、(e)、および(f)を1回または複数回繰り返すステップと;(y)第3の(またはより高次の)コーディングタグの情報を第2の(またはより高次の)伸長記録タグに移行させて、第3の(またはより高次の)伸長記録タグを生成するステップとをさらに含み、ステップ(g)において第3の(またはより高次の)伸長記録タグを解析する。これらのステップを実施するためのキット成分が提供される。
ある特定の実施形態では、接触させるステップ(b)および(e)を逐次的に実施する、例えば、第1の結合性物質および第2の結合性物質を別々の結合サイクル反応でペプチドと接触させる。
本明細書において提示される実施形態のいずれかでは、方法は、複数の巨大分子を並行して解析することを含む。好ましい実施形態では、方法は、複数のペプチドを並行して解析することを含む。
本明細書において提示される実施形態のいずれかでは、巨大分子(またはペプチド)を結合性物質と接触させるステップは、巨大分子(またはペプチド)を複数の結合性物質と接触させることを含む。
本明細書において提示される実施形態のいずれかでは、巨大分子は、タンパク質、ポリペプチド、またはペプチドであってよい。さらなる実施形態では、ペプチドは、生体試料に由来するタンパク質またはポリペプチドを断片化することによって得ることができる。
本明細書において提示される実施形態のいずれかでは、巨大分子は、炭水化物、脂質、核酸、もしくは大環状分子であるまたはそれを含んでよい。
本明細書において提示される実施形態のいずれかでは、記録タグは、DNA分子、修飾塩基を有するDNA分子、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子(Dragulescu-Andrasi et al., 2006、J. Am. Chem. Soc. 128: 10258-10267)、GNA分子、またはこれらの任意の組合せであってよい。
本明細書において提示される実施形態のいずれかでは、記録タグは、ユニバーサルプライミング部位を含んでよい。さらなる実施形態では、ユニバーサルプライミング部位は、増幅、ライゲーション、配列決定、またはこれらの組合せのためのプライミング部位を含む。
本明細書において提示される実施形態のいずれかでは、記録タグは、一意の分子識別子、コンパートメントタグ、分配バーコード、試料バーコード、画分バーコード、スペーサー配列、またはこれらの任意の組合せを含んでよい。
本明細書において提示される実施形態のいずれかでは、コーディングタグは、一意の分子識別子(UMI)、エンコーダー配列、結合サイクル特異的配列、スペーサー配列、またはこれらの任意の組合せを含んでよい。
本明細書において提示される実施形態のいずれかでは、コーディングタグ内の結合サイクル特異的配列は、結合サイクル特異的スペーサー配列であってよい。
ある特定の実施形態では、結合サイクル特異的配列は、エンコーダー配列とは別のバーコードとしてコードされる。他の実施形態では、エンコーダー配列および結合サイクル特異的配列は、結合性物質に対しておよび各結合サイクルに対して一意である単一のバーコードに記載される。
ある特定の実施形態では、スペーサー配列は、多数の結合サイクルからの結合性物質の間で共有される共通の結合サイクル配列を含む。他の実施形態では、スペーサー配列は、同じ結合サイクルからの結合性物質の間で共有される一意の結合サイクル配列を含む。
本明細書において提示される実施形態のいずれかでは、記録タグは、バーコードを含んでよい。
本明細書において提示される実施形態のいずれかでは、巨大分子および付随する記録タグ(複数可)は、固体支持体に共有結合により接合していてよい。
本明細書において提示される実施形態のいずれかでは、固体支持体は、ビーズ、多孔質ビーズ、多孔質マトリックス、拡張可能なゲルビーズもしくはマトリックス、アレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、マイクロタイターウェル、ELISAプレート、スピン干渉ディスク、ニトロセルロースメンブレン、ニトロセルロースに基づくポリマー表面、ナノ粒子、またはマイクロスフェアであってよい。
本明細書において提示される実施形態のいずれかでは、固体支持体は、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズであってよい。
本明細書において提示される実施形態のいずれかでは、複数の巨大分子および付随する記録タグを固体支持体に接合することができる。さらなる実施形態では、固体支持体上で複数の分析物(例えば、巨大分子)の間に平均距離>50nm、>100nm、または>200nmの間隔をあける。
本明細書において提示される実施形態のいずれかでは、結合性物質は、ポリペプチドまたはタンパク質であり得る。さらなる実施形態では、結合性物質は、改変もしくはバリアントアミノペプチダーゼ、改変もしくはバリアントアミノアシルtRNA合成酵素、改変もしくはバリアントアンチカリン、または改変もしくはバリアントClpSである。
本明細書において提示される実施形態のいずれかでは、結合性物質は、巨大分子に選択的に結合することが可能なものであってよい。
本明細書において提示される実施形態のいずれかでは、コーディングタグは、DNA分子、修飾塩基を有するDNA分子、RNA分子、BNA分子、XNA分子、LNA分子、GNA分子、PNA分子、γPNA分子、またはこれらの組合せであってよい。
本明細書において提示される実施形態のいずれかでは、結合性物質とコーディングタグは、リンカーによって接合されていてよい。
本明細書において提示される実施形態のいずれかでは、結合性物質とコーディングタグは、SpyTag/SpyCatcherまたはSnoopTag/SnoopCatcherペプチド−タンパク質対(それぞれ、その全体が参照によって組み込まれるZakeri、et al., 2012、Proc Natl Acad Sci U S A 109(12): E690-697;Veggianiet al., 2016、Proc. Natl. Acad. Sci. USA 113: 1202-1207)によって接合されていてよい。SpyTag/SpyCatcher相互作用は、自発性イソペプチド結合の形成によってそれ自体をしっかりとロックするStreptococcus pyogenes由来のタンパク質ドメインに基づく不可逆的なタンパク質−ペプチド相互作用である。
本明細書において提示される実施形態のいずれかでは、結合性物質とコーディングタグは、SpyLigase、例えば、SpyTag−KTag/SpyLigaseによって接合されていてよい(この場合、接合される2つの部分がSpyTag/KTag対を有し、SpyLigaseによりSpyTagとKTagが接合され、したがって2つの部分が接合される)。SpyLigaseは、不可逆的なペプチド−ペプチド相互作用を形成するために2つのペプチドタグを互いとライゲーションするタンパク質ドメインである。その全体が参照によって組み込まれるFierer et al., (2014), "SpyLigase peptide-peptide ligationpolymerizes affibodies to enhance magnetic cancer cell capture," PNAS 111(13): E1176-E1181。
ソルターゼを使用して結合性物質とコーディングタグを接合することもできる。例えば、ソルターゼにより、LPXTG Tag(Xは任意のアミノ酸を表す)をGGGなどのポリG部分に選択的に接合させることができる。例えばActiveMotif、San Diegoからの、またはUS9,267,127 B2に開示されているソルターゼA5を使用することができる。別の例では、Staphylococcus aureus(S.aureus)Sortase Aのアミノ酸配列と少なくとも約50%、少なくとも約60%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%、または100%同一であるアミノ酸配列を含むソルターゼを使用することができる。
本明細書において提示される実施形態のいずれかでは、コーディングタグの情報の記録タグへの移行は、DNAリガーゼ、例えば、一本鎖DNA(ssDNA)リガーゼなどのリガーゼによって媒介される。一態様では、ライゲーションされる2つの一本鎖ポリヌクレオチドの一方の5’末端をブロッキングして、5’末端におけるライゲーションを防止する。前述の実施形態のいずれかでは、ssDNAリガーゼは、バクテリオファージTS2126 RNAリガーゼ(例えば、CircLigase(商標)およびCircLigase II(商標))もしくはそのバリアント、ホモログ、変異体、もしくは改変バージョンなどのThermusバクテリオファージRNAリガーゼ、またはMethanobacterium thermoautotrophicum RNAリガーゼ1もしくはそのバリアント、ホモログ、変異体、もしくは改変バージョンなどの古細菌RNAリガーゼであってよい。他の態様では、ssDNAリガーゼは、T4 RNAリガーゼ、例えば、T4 RNAリガーゼ2、T4 RNAリガーゼ2、切断型、T4 RNAリガーゼ2、切断型KQ、またはT4 RNAリガーゼ2、切断型K227QなどのRNAリガーゼである。一態様では、PEG 4000などの密集剤を使用することによってライゲーション反応を最適化することができる。ライゲーションされるDNA末端を相補的DNA配列上で互いに隣接してアニーリングする場合には、T4 DNAリガーゼおよびAmpligase(登録商標)DNAリガーゼも使用することができる。
あるいは、コーディングタグの情報の記録タグへの移行は、DNAポリメラーゼまたは化学的ライゲーションによって媒介される。
本明細書において提示される実施形態のいずれかでは、伸長記録タグを解析するステップは、核酸配列決定を含んでよい。さらなる実施形態では、核酸配列決定は、合成による配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、ポロニーシーケンシング、イオン半導体シーケンシング、またはパイロシーケンシングである。他の実施形態では、核酸配列決定は、単一分子リアルタイムシーケンシング、ナノポアに基づく配列決定、ナノギャップトンネリングシーケンシング、または先端顕微鏡を使用したDNAのダイレクトイメージングである。
本明細書において提示される実施形態のいずれかでは、伸長記録タグを解析前に増幅させることができる。
本明細書において提示される実施形態のいずれかでは、伸長記録タグに含有されるコーディングタグ情報の順序により、結合性物質による巨大分子への結合の順序、したがって、結合性物質によって検出される分析物の配列に関する情報を提供することができる。
本明細書において提示される実施形態のいずれかでは、伸長記録タグに含有される特定のコーディングタグ情報(例えば、エンコーダー配列)の頻度により、特定の結合性物質による巨大分子への結合の頻度、したがって、結合性物質によって検出される巨大分子内の分析物の頻度に関する情報を提供することができる。
本明細書に開示されている実施形態のいずれかでは、多数の巨大分子(例えば、タンパク質)試料であって、各試料内の巨大分子の集団が試料特異的バーコードを含む記録タグで標識されている試料をプールすることができる。そのような巨大分子試料のプールを単一の反応チューブ内での結合サイクルに供することができる。
本明細書において提示される実施形態のいずれかでは、複数の巨大分子を表す複数の伸長記録タグを並行して解析することができる。
本明細書において提示される実施形態のいずれかでは、複数の巨大分子を表す複数の伸長記録タグを多重化アッセイで解析することができる。
本明細書において提示される実施形態のいずれかでは、複数の伸長記録タグに対して、解析前に標的濃縮アッセイを行うことができる。
本明細書において提示される実施形態のいずれかでは、複数の伸長記録タグに対して、解析前にサブトラクションアッセイを行うことができる。
本明細書において提示される実施形態のいずれかでは、複数の伸長記録タグに対して、非常に豊富な種を減少させるために解析前に正規化アッセイを行うことができる。
本明細書において提示される実施形態のいずれかでは、NTAAを、改変アミノペプチダーゼ、改変アミノ酸tRNA合成酵素、穏やかなエドマン分解、エドマナーゼ酵素、または無水TFAによって除去することができる。
本明細書において提示される実施形態のいずれかでは、少なくとも1つの結合性物質は、末端アミノ酸残基に結合し得る。ある特定の実施形態では、末端アミノ酸残基は、N末端アミノ酸またはC末端アミノ酸である。
本明細書に記載の実施形態のいずれかでは、少なくとも1つの結合性物質は、翻訳後修飾されたアミノ酸に結合し得る。
上述の実施形態の特徴を以下の節でさらに詳細に提示する。
B.例示的なキットおよび方法
一態様では、(a)分析物に直接または間接的に付随するように構成されている記録タグと;(b)(i)分析物に結合することが可能な結合性部分に関する識別情報を含み、結合性部分に直接もしくは間接的に付随して結合性物質を形成するように構成されているコーディングタグ、ならびに/または(ii)記録タグおよびコーディングタグが、結合性物質と分析物との間の結合時に記録タグおよびコーディングタグとの間の情報の移行を可能にするように構成されている、標識と;必要に応じて(c)結合性部分とを含むキットが本明細書に開示される。
一実施形態では、記録タグおよび/または分析物は、支持体に直接または間接的に固定化されるように構成されている。さらなる実施形態では、記録タグは、支持体に固定化され、それにより、記録タグに付随する分析物が固定化されるように構成されている。別の実施形態では、分析物は、支持体に固定化され、それにより、分析物に付随する記録タグが固定化されるように構成されている。さらに別の実施形態では、記録タグと分析物のそれぞれは、支持体に固定化されるように構成されている。さらに別の実施形態では、記録タグと分析物は、両方が支持体に固定化された時に共局在するように構成されている。一部の実施形態では、記録タグと分析物に結合した結合性物質のコーディングタグとの間の情報の移行のための(i)分析物と(ii)記録タグとの間の距離は、約10−6nm未満、約10−6nm、約10−5nm、約10−4nm、約0.001nm、約0.01nm、約0.1nm、約0.5nm、約1nm、約2nm、約5nm、または約5nmよりも大きい、または上記の範囲の間の任意の値のものである。
前述の実施形態のいずれかでは、キットは、(i)支持体に直接または間接的に固定化され、かつ(ii)記録タグおよび/または分析物に直接または間接的に付随するように構成されている固定化リンカーをさらに含んでよい。一実施形態では、固定化リンカーは、記録タグおよび分析物に付随するように構成されている。
前述の実施形態のいずれかでは、固定化リンカーは、支持体に直接固定化され、それにより、固定化リンカーに付随する記録タグおよび/または分析物が固定化されるように構成されていてよい。
前述の実施形態のいずれかでは、キットは、支持体をさらに含んでよい。
前述の実施形態のいずれかでは、キットは、結合性物質と分析物との間の結合時にコーディングタグと記録タグとの間で情報を移行させるための1つまたは複数の試薬をさらに含んでよい。一実施形態では、1つまたは複数の試薬は、コーディングタグから記録タグに情報を移行し、それにより、伸長記録タグを生成するように構成されている。別の実施形態では、1つまたは複数の試薬は、記録タグからコーディングタグに情報を移行し、それにより、伸長コーディングタグを生成するように構成されている。さらに別の実施形態では、1つまたは複数の試薬は、コーディングタグからの情報と記録タグからの情報とを含むジタグ構築物を生成するように構成されている。
前述の実施形態のいずれかでは、キットは、記録タグの少なくとも2つを含んでよい。前述の実施形態のいずれかでは、キットは、それに付随する結合性部分に関する識別情報をそれぞれが含むコーディングタグの少なくとも2つを含んでよい。特定の実施形態では、各分析物は、その分析物に結合した結合性物質が利用可能な複数の記録タグ(例えば、少なくとも約2、約5、約10、約20、約50、約100、約200、約500、約1000、約2000、約5000、またはそれよりも多く)を有する。特定の実施形態では、キットは、複数の記録タグ、例えば、少なくとも約2、約5、約10、約20、約50、約100、約200、約500、約1000、約2000、約5000、またはそれよりも多くの記録タグを含む。
前述の実施形態のいずれかでは、キットは、結合性物質の少なくとも2つを含んでよい。一実施形態では、キットは、(i)第1の結合性物質と分析物との間の結合時に第1の結合性物質の第1のコーディングタグから記録タグに情報を移行させて、一次伸長記録タグを生成するための1つもしくは複数の試薬、および/または(ii)第2の結合性物質と分析物との間の結合時に第2の結合性物質の第2のコーディングタグから一次伸長記録タグに情報を移行させて、二次伸長記録タグを生成するための1つもしくは複数の試薬を含み、(i)の1つもしくは複数の試薬および(ii)の1つもしくは複数の試薬は同じであっても異なってもよい。特定の実施形態では、各分析物は、分析物に関する記録タグが利用可能な複数の、例えば、少なくとも約2、約5、約10、約20、約50、約100、約200、約500、約1000、約2000、約5000、またはそれよりも多くの結合性物質および/またはコーディングタグを有し、複数の結合性物質は、逐次的にまたは並行して付加させることができる。特定の実施形態では、キットは、複数の、例えば、少なくとも約2、約5、約10、約20、約50、約100、約200、約500、約1000、約2000、約5000、またはそれよりも多くの結合性物質および/またはコーディングタグを含む。
前述の実施形態のいずれかでは、キットは、(iii)第3の(またはより高次の)結合性物質と分析物との間の結合時に第3の(またはより高次の)結合性物質の第3の(またはより高次の)コーディングタグから二次伸長記録タグに情報を移行させて、三次(またはより高次の)伸長記録タグを生成するための1つまたは複数の試薬をさらに含んでよい。一実施形態では、キットは、(i)第1の結合性物質と分析物との間の結合時に第1の結合性物質の第1のコーディングタグから第1の記録タグに情報を移行させて、第1の伸長記録タグを生成するための1つもしくは複数の試薬、(ii)第2の結合性物質と分析物との間の結合時に第2の結合性物質の第2のコーディングタグから第2の記録タグに情報を移行させて、第2の伸長記録タグを生成するための1つもしくは複数の試薬、および/または(iii)第3の(またはより高次の)結合性物質と分析物との間の結合時に第3の(またはより高次の)結合性物質の第3の(またより高次の)コーディングタグから第3の(またはより高次の)記録タグに情報を移行させて、第3の(またはより高次の)伸長記録タグを生成するための1つもしくは複数の試薬を含み、(i)、(ii)、および/または(iii)の1つまたは複数の試薬は同じであっても異なってもよい。
前述の実施形態のいずれかでは、キットは、(iii)第3の(またはより高次の)結合性物質と分析物との間の結合時に第3の(またはより高次の)結合性物質の第3の(またはより高次の)コーディングタグから第3の(またはより高次の)記録タグに情報を移行させて、第3の(またはより高次の)伸長記録タグを生成するための1つまたは複数の試薬をさらに含んでよい。
前述の実施形態のいずれかでは、第1の記録タグ、第2の記録タグ、および/または第3の(またはより高次の)記録タグは、分析物に直接または間接的に付随するように構成されていてよい。
前述の実施形態のいずれかでは、第1の記録タグ、第2の記録タグ、および/または第3の(またはより高次の)記録タグは、支持体に固定化されるように構成されていてよい。
前述の実施形態のいずれかでは、第1の記録タグ、第2の記録タグ、および/または第3の(またはより高次の)記録タグは、例えば、第1の、第2の、または第3の(またはより高次の)結合性物質と分析物との間の結合時に第1の、第2の、または第3の(またはより高次の)コーディングタグと第1の、第2の、または第3の(またはより高次の)記録タグとの間の情報の移行が可能になるように、それぞれ分析物と共局在するように構成されていてよい。
前述の実施形態のいずれかでは、第1のコーディングタグ、第2のコーディングタグ、および/または第3の(またはより高次の)コーディングタグのそれぞれは、結合サイクル特異的スペーサー配列Cn、および/またはコーディングタグ特異的スペーサー配列Cnなどの結合サイクル特異的バーコードを含んでよく、nは整数であり、Cnはn番目の結合性物質とポリペプチドとの間の結合を示す。あるいは、結合サイクルタグCnは外因的に付加されてよい、例えば、結合サイクルタグCnはコーディングタグ(複数可)に対して外因性であってよい。
前述の実施形態のいずれかでは、分析物は、ポリペプチドを含んでよい。一実施形態では、キットの結合性部分は、ポリペプチドの1つもしくは複数のN末端、内部、もしくはC末端のアミノ酸に結合することが可能である、または官能化試薬によって修飾された1つもしくは複数のN末端、内部、もしくはC末端のアミノ酸に結合することが可能である。
前述の実施形態のいずれかでは、キットは、官能化試薬の1つまたは複数をさらに含んでよい。
前述の実施形態のいずれかでは、キットは、ポリペプチドの1つもしくは複数のN末端、内部、もしくはC末端のアミノ酸を(例えば、化学的切断または酵素的切断によって)除去するため、または官能化N末端、内部、もしくはC末端のアミノ酸(複数可)を除去するための排除試薬をさらに含んでよく、必要に応じて、排除試薬は、カルボキシペプチダーゼまたはアミノペプチダーゼまたはそのバリアント、変異体、もしくは改変タンパク質;ヒドロラーゼまたはそのバリアント、変異体、もしくは改変タンパク質;穏やかなエドマン分解試薬;エドマナーゼ酵素;無水TFA、塩基;またはこれらの任意の組合せを含む。
前述の実施形態のいずれかでは、1つまたは複数のN末端、内部、またはC末端のアミノ酸は、(i)N末端アミノ酸(NTAA);(ii)N末端ジペプチド配列;(iii)N末端トリペプチド配列;(iv)内部アミノ酸;(v)内部ジペプチド配列;(vi)内部トリペプチド配列;(vii)C末端アミノ酸(CTAA);(viii)C末端ジペプチド配列;または(ix)C末端トリペプチド配列、またはこれらの任意の組合せを含んでよく、必要に応じて、(i)〜(ix)内のアミノ酸残基の任意の1つまたは複数は修飾または官能化されている。
別の態様では、少なくとも(a)(i)解析されるポリペプチドのN末端アミノ酸(NTAA)または官能化NTAAに結合することが可能な第1の結合性部分および(ii)第1の結合性部分に関する識別情報を含む第1のコーディングタグを含む第1の結合性物質、必要に応じて(b)ポリペプチドに直接または間接的に付随するように構成されている記録タグ、ならびに、さらに必要に応じて(c)ポリペプチドの第1のNTAAを修飾して第1の官能化NTAAを生成することが可能な官能化試薬を含むキットであって、記録タグおよび第1の結合性物質が、第1の結合性物質とポリペプチドとの間の結合時に第1のコーディングタグと記録タグとの間の情報の移行が可能になるように構成されている、キットが本明細書に開示される。一実施形態では、キットは、第1のコーディングタグから記録タグに情報を移行させ、それにより、一次伸長記録タグを生成するための1つまたは複数の試薬をさらに含む。
前述の実施形態のいずれかでは、官能化試薬は、化学薬剤、酵素、および/または生物学的薬剤、例えば、イソチオシアネート誘導体、2,4−ジニトロベンゼンスルホン酸(DNBS)、4−スルホニル−2−ニトロフルオロベンゼン(SNFB)1−フルオロ−2,4−ジニトロベンゼン、ダンシルクロリド、7−メトキシクマリン酢酸、チオアシル化試薬、チオアセチル化試薬、またはチオベンジル化試薬を含んでよい。
前述の実施形態のいずれかでは、キットは、第1の官能化NTAAを(例えば、化学的切断または酵素的切断によって)除去して、すぐ隣のアミノ酸残基を第2のNTAAとして露出させるための排除試薬をさらに含んでよい。一実施形態では、第2のNTAAは、同じまたは異なる官能化試薬によって官能化して第1の官能化NTAAと同じであっても異なってもよい第2の官能化NTAAを生成することが可能である。別の実施形態では、キットは、(d)(i)第2の官能化NTAAに結合することが可能な第2の(またはより高次の)結合性部分および(ii)第2の(またはより高次の)結合性部分に関する識別情報を含む第2の(またはより高次の)コーディングタグを含む第2の(またはより高次の)結合性物質をさらに含み、第1のコーディングタグおよび第2の(またはより高次の)コーディングタグは同じであっても異なってもよい。さらに別の実施形態では、第1の官能化NTAAおよび第2の官能化NTAAは、互いに独立して、官能化N末端アラニン(AまたはAla)、システイン(CまたはCys)、アスパラギン酸(DまたはAsp)、グルタミン酸(EまたはGlu)、フェニルアラニン(FまたはPhe)、グリシン(GまたはGly)、ヒスチジン(HまたはHis)、イソロイシン(IまたはIle)、リシン(KまたはLys)、ロイシン(LまたはLeu)、メチオニン(MまたはMet)、アスパラギン(NまたはAsn)、プロリン(PまたはPro)、グルタミン(QまたはGln)、アルギニン(RまたはArg)、セリン(SまたはSer)、トレオニン(TまたはThr)、バリン(VまたはVal)、トリプトファン(WまたはTrp)、およびチロシン(YまたはTyr)からなる群から、これらの任意の組合せで選択される。
前述の実施形態のいずれかでは、キットは、第2の(またはより高次の)コーディングタグから一次伸長記録タグに情報を移行させ、それにより、二次(またはより高次の)伸長記録タグを生成するための1つまたは複数の試薬をさらに含んでよい。
さらなる態様では、少なくとも(a)それぞれが(i)解析されるポリペプチドのN末端アミノ酸(NTAA)もしくは官能化NTAAに結合することが可能な結合性部分および(ii)結合性部分に関する識別情報を含むコーディングタグを含む、1つもしくは複数の結合性物質、ならびに/または(b)ポリペプチドに直接もしくは間接的に付随するように構成されている1つもしくは複数の記録タグ、ならびに必要に応じて(c)ポリペプチドの第1のNTAAを修飾して第1の官能化NTAAを生成することが可能な官能化試薬を含むキットであって、1つまたは複数の記録タグおよび1つまたは複数の結合性物質が、各結合性物質とポリペプチドとの間の結合時にコーディングタグと記録タグとの間の情報の移行が可能になるように構成されているキットが本明細書に開示される。一実施形態では、キットは、第1の官能化NTAAを(例えば、化学的切断または酵素的切断によって)除去して、すぐ隣のアミノ酸残基を第2のNTAAとして露出させるための排除試薬をさらに含む。別の実施形態では、第2のNTAAは、同じまたは異なる官能化試薬によって官能化して第1の官能化NTAAと同じであっても異なってもよい第2の官能化NTAAを生成することが可能である。さらに別の実施形態では、第1の官能化NTAAおよび第2の官能化NTAAは、互いに独立して、官能化N末端アラニン(AまたはAla)、システイン(CまたはCys)、アスパラギン酸(DまたはAsp)、グルタミン酸(EまたはGlu)、フェニルアラニン(FまたはPhe)、グリシン(GまたはGly)、ヒスチジン(HまたはHis)、イソロイシン(IまたはIle)、リシン(KまたはLys)、ロイシン(LまたはLeu)、メチオニン(MまたはMet)、アスパラギン(NまたはAsn)、プロリン(PまたはPro)、グルタミン(QまたはGln)、アルギニン(RまたはArg)、セリン(SまたはSer)、トレオニン(TまたはThr)、バリン(VまたはVal)、トリプトファン(WまたはTrp)、およびチロシン(YまたはTyr)からなる群から、これらの任意の組合せで選択される。
前述の実施形態のいずれかでは、キットは、(i)第1の結合性物質とポリペプチドとの間の結合時に第1の結合性物質の第1のコーディングタグから第1の記録タグに情報を移行させて、第1の伸長記録タグを生成するための1つもしくは複数の試薬、および/または(ii)第2の結合性物質とポリペプチドとの間の結合時に第2の結合性物質の第2のコーディングタグから第2の記録タグに情報を移行させて、第2の伸長記録タグを生成するための1つもしくは複数の試薬を含んでよく、(i)の1つもしくは複数の試薬および(ii)の1つもしくは複数の試薬は同じであっても異なってもよい。一態様では、キットは、(iii)第3の(またはより高次の)結合性物質とポリペプチドとの間の結合時に第3の(またはより高次の)結合性物質の第3の(またはより高次の)コーディングタグから第3の(またはより高次の)記録タグに情報を移行させて、第3の(またはより高次の)伸長記録タグを生成するための1つまたは複数の試薬をさらに含む。
前述の実施形態のいずれかでは、第1の記録タグ、第2の記録タグ、および/または第3の(またはより高次の)記録タグは、ポリペプチドに直接または間接的に付随するように構成されていてよい。
前述の実施形態のいずれかでは、第1の記録タグ、第2の記録タグ、および/または第3の(またはより高次の)記録タグは、支持体に固定化されるように構成されていてよい。
前述の実施形態のいずれかでは、第1の記録タグ、第2の記録タグ、および/または第3の(またはより高次の)記録タグは、例えば、第1の、第2の、または第3の(またはより高次の)結合性物質とポリペプチドとの間の結合時に第1の、第2の、または第3の(またはより高次の)コーディングタグと第1の、第2の、または第3の(またはより高次の)記録タグとの間の情報の移行が可能になるように、それぞれポリペプチドと共局在するように構成されていてよい。
前述の実施形態のいずれかでは、支持体上の第1の記録タグ、第2の記録タグ、および/または第3の(またはより高次の)記録タグの間の距離は、約10nmと等しいもしくはそれよりも大きい、約15nmと等しいもしくはそれよりも大きい、約20nmと等しいもしくはそれよりも大きい、約50nmと等しいもしくはそれよりも大きい、約100nmと等しいもしくはそれよりも大きい、約150nmと等しいもしくはそれよりも大きい、約200nmと等しいもしくはそれよりも大きい、約250nmと等しいもしくはそれよりも大きい、約300nmと等しいもしくはそれよりも大きい、約350nmと等しいもしくはそれよりも大きい、約400nmと等しいもしくはそれよりも大きい、約450nmと等しいもしくはそれよりも大きい、または約500nmと等しいもしくはそれよりも大きいものであってよく、各記録タグおよびその対応する分析物は、両方が支持体に固定化された時に共局在するように構成されている、または各記録タグとその対応する分析物との間の距離は、約10−6nm未満、約10−6nm、約10−5nm、約10−4nm、約0.001nm、約0.01nm、約0.1nm、約0.5nm、約1nm、約2nm、約5nm、または約5nmよりも大きい、または上記の範囲の間の任意の値のものである。
前述の実施形態のいずれかでは、第1のコーディングタグ、第2のコーディングタグ、および/または第3の(またはより高次の)コーディングタグのそれぞれは、結合サイクル特異的スペーサー配列Cn、および/またはコーディングタグ特異的スペーサー配列Cnなどの結合サイクル特異的バーコードを含んでよく、nは整数であり、Cnはn番目の結合性物質とポリペプチドとの間の結合を示す。あるいは、結合サイクルタグCnは外因的に付加されてよい、例えば、結合サイクルタグCnはコーディングタグ(複数可)に対して外因性であってよい。
前述の実施形態のいずれかでは、分析物またはポリペプチドは、タンパク質またはポリペプチド鎖またはその断片、脂質、炭水化物、または大環状分子、またはその組合せもしくは複合体を含んでよい。
前述の実施形態のいずれかでは、分析物またはポリペプチドは、巨大分子またはその複合体、例えば、タンパク質複合体またはそのサブユニットを含んでよい。
前述の実施形態のいずれかでは、記録タグは、核酸、オリゴヌクレオチド、修飾されたオリゴヌクレオチド、DNA分子、偽相補的塩基を有するDNA、1つもしくは複数の保護された塩基を有するDNAもしくはRNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、またはモルホリノ、またはこれらの組合せを含んでよい。
前述の実施形態のいずれかでは、記録タグは、ユニバーサルプライミング部位を含んでよい。
前述の実施形態のいずれかでは、記録タグは、増幅、配列決定、またはその両方のためのプライミング部位を含んでよく、例えば、ユニバーサルプライミング部位は、増幅、配列決定、またはその両方のためのプライミング部位を含む。
前述の実施形態のいずれかでは、記録タグおよび/またはコーディングタグは、一意の分子識別子(UMI)を含んでよい。
前述の実施形態のいずれかでは、記録タグおよび/またはコーディングタグは、ニッキングエンドヌクレアーゼ部位(例えば、dsDNAニッキングエンドヌクレアーゼ部位)などのバーコードおよび/またはヌクレアーゼ部位を含んでよい。
前述の実施形態のいずれかでは、記録タグおよび/またはコーディングタグは、その3’末端および/またはその5’末端にスペーサーを含み、例えば、記録タグは、その3’末端にスペーサーを含む。
前述の実施形態のいずれかでは、記録タグおよび/またはコーディングタグは、エンドヌクレアーゼ部位、ホーミングエンドヌクレアーゼ部位、制限酵素消化部位、ニッキングエンドヌクレアーゼ部位、またはこれらの組合せなどの1つまたは複数のヌクレアーゼ部位を含んでよい。一部の実施形態では、ヌクレアーゼ部位を、コーディングタグ内、例えば、スペーサー配列内またはスペーサー配列とエンコーダー配列との間にもたらすことができる。一部の実施形態では、ヌクレアーゼ部位を、記録タグ内、例えば、ユニバーサルプライマー配列と支持体との間にもたらすことができる(例えば、記録タグを支持体から切り離すために)。
前述の実施形態のいずれかでは、キットは、剛性固体支持体、可撓性固体支持体、または軟性固体支持体などの固体支持体を含んでよく、多孔質支持体または非多孔質支持体を含む。
前述の実施形態のいずれかでは、キットは、ビーズ、多孔質ビーズ、多孔質マトリックス、アレイ、表面、ガラス表面、シリコン表面、プラスチック表面、スライド、フィルター、ナイロン、チップ、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、ウェル、マイクロタイターウェル、プレート、ELISAプレート、ディスク、スピン干渉ディスク、膜、ニトロセルロースメンブレン、ニトロセルロースに基づくポリマー表面、ナノ粒子(例えば、磁気ナノ粒子(Fe3O4)、金ナノ粒子、および/または銀ナノ粒子などの金属を含む)、量子ドット、ナノシェル、ナノケージ、マイクロスフェア、またはこれらの任意の組合せを含む支持体を含んでよい。一実施形態では、支持体は、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズ、またはこれらの任意の組合せを含む。
前述の実施形態のいずれかでは、キットは、支持体を含んでよく、かつ/または複数の分析物(例えば、ポリペプチド)を逐次的な反応、並行した反応で、または逐次的な反応と並行した反応の組合せで解析するために使用することができる。一実施形態では、支持体上で、分析物の間に、約10nmと等しいもしくはそれよりも大きい、約15nmと等しいもしくはそれよりも大きい、約20nmと等しいもしくはそれよりも大きい、約50nmと等しいもしくはそれよりも大きい、約100nmと等しいもしくはそれよりも大きい、約150nmと等しいもしくはそれよりも大きい、約200nmと等しいもしくはそれよりも大きい、約250nmと等しいもしくはそれよりも大きい、約300nmと等しいもしくはそれよりも大きい、約350nmと等しいもしくはそれよりも大きい、約400nmと等しいもしくはそれよりも大きい、約450nmと等しいもしくはそれよりも大きい、または約500nmと等しいもしくはそれよりも大きい平均距離で間隔をあける。
前述の実施形態のいずれかでは、結合性部分は、ポリペプチドもしくはその断片、タンパク質もしくはポリペプチド鎖もしくはその断片、またはタンパク質複合体もしくはそのサブユニット、例えば、抗体またはその抗原結合性断片を含んでよい。
前述の実施形態のいずれかでは、結合性部分は、カルボキシペプチダーゼもしくはアミノペプチダーゼもしくはそのバリアント、変異体、もしくは改変タンパク質;アミノアシルtRNA合成酵素もしくはそのバリアント、変異体、もしくは改変タンパク質;アンチカリンもしくはそのバリアント、変異体、もしくは改変タンパク質;ClpSもしくはそのバリアント、変異体、もしくは改変タンパク質;UBRボックスタンパク質もしくはそのバリアント、変異体、もしくは改変タンパク質;アミノ酸(複数可)を結合する改変小分子、すなわち、バンコマイシンもしくはそのバリアント、変異体、もしくは改変分子;またはこれらの任意の組合せを含んでよい、あるいは各結合性物質において、結合性部分が小分子を含み、コーディングタグが小分子を識別するポリヌクレオチドを含み、それにより、複数の結合性物質は、DNAにコードされる小分子ライブラリーなどのコードされる小分子ライブラリーを形成する。
前述の実施形態のいずれかでは、結合性部分は、小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β−ペプチド、またはD−ペプチドのペプチド模倣物)、多糖、またはアプタマー(例えば、DNAアプタマーなどの核酸アプタマー、またはペプチドアプタマー)を含んでよく、コーディングタグは、小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β−ペプチド、またはD−ペプチドのペプチド模倣物)、多糖、またはアプタマーを識別するポリヌクレオチドを含み、それにより、複数の結合性物質が、コードされる小分子ライブラリー、ペプチドおよび/またはペプチドの模倣物ライブラリー、ペプチド模倣物ライブラリー(例えば、ペプトイドライブラリー、β−ペプチドライブラリー、またはD−ペプチドのペプチド模倣物ライブラリー)、多糖ライブラリー、またはDNAにコードされる小分子ライブラリー、DNAにコードされるペプチドおよび/もしくはペプチドの模倣物ライブラリー、DNAにコードされるペプチド模倣物ライブラリー(例えば、DNAにコードされるペプトイドライブラリー、DNAにコードされるβ−ペプチドライブラリー、またはDNAにコードされるD−ペプチドのペプチド模倣物ライブラリー)、DNAにコードされる多糖ライブラリー、もしくはDNAにコードされるアプタマーライブラリーなどのアプタマーライブラリーを形成する。
前述の実施形態のいずれかでは、結合性部分は、分析物またはポリペプチドに選択的かつ/または特異的に結合し得る。
前述の実施形態のいずれかでは、コーディングタグは、核酸、オリゴヌクレオチド、修飾されたオリゴヌクレオチド、DNA分子、偽相補的塩基を有するDNA、1つもしくは複数の保護された塩基を有するDNAもしくはRNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、またはモルホリノ、またはこれらの組合せを含んでよい。
前述の実施形態のいずれかでは、コーディングタグは、バーコード配列、例えば、エンコーダー配列、例えば、結合性部分を識別するものを含んでよい。
前述の実施形態のいずれかでは、コーディングタグは、スペーサー、結合サイクル特異的配列、一意の分子識別子(UMI)、ユニバーサルプライミング部位、またはこれらの任意の組合せを含んでよい。一実施形態では、各結合サイクル後に結合サイクル特異的配列が記録タグに付加される。
前述の実施形態のいずれかでは、結合性部分とコーディングタグをリンカーまたは結合対によって接合することができる。
前述の実施形態のいずれかでは、結合性部分とコーディングタグをSpyTag−KTag/SpyLigase(この場合、接合される2つの部分がSpyTag/KTag対を有し、SpyLigaseによりSpyTagとKTagが接合され、したがって2つの部分が接合される)、SpyTag/SpyCatcher、SnoopTag/SnoopCatcherペプチド−タンパク質対、ソルターゼ、またはHaloTag/HaloTagリガンド対、またはこれらの任意の組合せによって接合することができる。
前述の実施形態のいずれかでは、キットは、鋳型反応または非鋳型反応においてコーディングタグと記録タグとの間で情報を移行させるための試薬をさらに含んでよく、必要に応じて、試薬は、(i)化学的ライゲーション試薬または生物学的ライゲーション試薬、例えば、一本鎖核酸もしくは二本鎖核酸をライゲーションするための、DNAリガーゼもしくはRNAリガーゼなどのリガーゼ、または(ii)一本鎖核酸もしくは二本鎖核酸のプライマー伸長のための試薬であり、必要に応じて、キットは、少なくとも2つのリガーゼまたはそのバリアント(例えば、少なくとも2つのDNAリガーゼ、または少なくとも2つのRNAリガーゼ、または少なくとも1つのDNAリガーゼおよび少なくとも1つのRNAリガーゼ)を含むライゲーション試薬をさらに含み、少なくとも2つのリガーゼまたはそのバリアントは、アデニル化リガーゼおよび構成的にアデニル化されていないリガーゼを含む、または必要に応じて、キットは、DNAもしくはRNAリガーゼおよびDNA/RNAデアデニラーゼを含むライゲーション試薬をさらに含む。
前述の実施形態のいずれかでは、キットは、コーディングタグと記録タグとの間で情報を移行させるための、DNAポリメラーゼまたはRNAポリメラーゼまたは逆転写酵素などのポリメラーゼをさらに含んでよい。
前述の実施形態のいずれかでは、キットは、核酸配列解析のための1つまたは複数の試薬をさらに含んでよい。一実施形態では、核酸配列解析は、合成による配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、ポロニーシーケンシング、イオン半導体シーケンシング、パイロシーケンシング、単一分子リアルタイムシーケンシング、ナノポアに基づく配列決定、または先端顕微鏡を使用したDNAのダイレクトイメージング、またはこれらの任意の組合せを含む。
前述の実施形態のいずれかでは、キットは、核酸増幅のため、例えば、1つまたは複数の伸長記録タグを増幅させるための1つまたは複数の試薬をさらに含んでよく、必要に応じて、核酸増幅は、指数関数的な増幅反応(例えば、鋳型スイッチングを低減または排除するためのエマルジョンPCRなどのポリメラーゼ連鎖反応(PCR))および/または線形増幅反応(例えば、in vitro転写、または等温キメラプライマー開始核酸増幅(ICAN)による等温増幅)を含む。例えば、全てがあらゆる目的に関して参照により本明細書に組み込まれる。Uemori et al., (2007), "Investigation of the molecularmechanism of ICAN、a novel gene amplification method," J Biochem 142 (2):283-292; Mukai et al., (2007), "Highly efficient isothermal DNAamplification system using three elements of 5'-DNA-RNA-3' chimeric primers,RNaseH and strand-displacing DNA polymerase," J Biochem 142 (2): 273-281;Ma et al., (2013), "Isothermal amplification method for next-generationsequencing," Proc Natl Acad Sci U S A. 110 (35): 14320-14323を参照されたい。
前述の実施形態のいずれかでは、キットは、コーディングタグ情報を記録タグに移行させて伸長記録タグを形成するための1つまたは複数の試薬を含んでよく、伸長記録タグ上のコーディングタグ情報の順序および/または頻度により、結合性物質が分析物またはポリペプチドに結合する順序および/または頻度が示される。
前述の実施形態のいずれかでは、キットは、標的濃縮のため、例えば、1つまたは複数の伸長記録タグの濃縮のための1つまたは複数の試薬をさらに含んでよい。
前述の実施形態のいずれかでは、キットは、サブトラクションのため、例えば、1つまたは複数の伸長記録タグのサブトラクションのための1つまたは複数の試薬をさらに含んでよい。
前述の実施形態のいずれかでは、キットは、例えば、1つまたは複数の分析物またはポリペプチドなどの非常に豊富な種を減少させるための正規化のための1つまたは複数の試薬をさらに含んでよい。
前述の実施形態のいずれかでは、キットの少なくとも1つの結合性物質は、末端アミノ酸残基、末端2アミノ酸残基、または末端3アミノ酸残基に結合し得る。
前述の実施形態のいずれかでは、キットの少なくとも1つの結合性物質は、翻訳後修飾されたアミノ酸に結合し得る。
前述の実施形態のいずれかでは、キットは、試料中の複数の分析物またはポリペプチドを複数のコンパートメントに分配するための1つまたは複数の試薬または手段をさらに含んでよく、各コンパートメントは、必要に応じて支持体(例えば、固体支持体)に接合した複数のコンパートメントタグを含み、複数のコンパートメントタグは、個々のコンパートメント内では同じであり、他のコンパートメントのコンパートメントタグとは異なる。一実施形態では、キットは、複数の分析物またはポリペプチド(例えば、複数のタンパク質複合体、タンパク質、および/またはポリペプチド)を複数のポリペプチド断片に断片化するための1つまたは複数の試薬または手段をさらに含む。
前述の実施形態のいずれかでは、キットは、複数のポリペプチド断片を複数のコンパートメントのそれぞれ内のコンパートメントタグとアニーリングまたは接合し、それにより、複数のコンパートメントタグ付きポリペプチド断片を生成するための1つまたは複数の試薬または手段をさらに含んでよい。
前述の実施形態のいずれかでは、複数のコンパートメントは、マイクロ流体液滴、マイクロウェル、または表面上の分離された領域、またはこれらの任意の組合せを含んでよい。
前述の実施形態のいずれかでは、複数のコンパートメントのそれぞれは、平均して単一の細胞を含んでよい。
前述の実施形態のいずれかでは、キットは、試料中の複数の分析物またはポリペプチドを標識するための1つまたは複数のユニバーサルDNAタグをさらに含んでよい。
前述の実施形態のいずれかでは、キットは、試料中の複数の分析物またはポリペプチドを1つまたは複数のユニバーサルDNAタグで標識するための1つまたは複数の試薬をさらに含んでよい。
前述の実施形態のいずれかでは、キットは、プライマー伸長またはライゲーションのための1つまたは複数の試薬をさらに含んでよい。
前述の実施形態のいずれかでは、支持体は、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズ、またはこれらの任意の組合せなどのビーズを含んでよい。
前述の実施形態のいずれかでは、コンパートメントタグは、一本鎖または二本鎖核酸分子を含んでよい。
前述の実施形態のいずれかでは、コンパートメントタグは、バーコード、および必要に応じてUMIを含んでよい。前述の実施形態のいずれかでは、支持体はビーズであってよく、コンパートメントタグはバーコードを含んでよい。
前述の実施形態のいずれかでは、支持体はビーズを含んでよく、複数のコンパートメントタグが接合したビーズは、スプリット・アンド・プール合成、個々の合成、または固定化、またはこれらの任意の組合せによって形成することができる。
前述の実施形態のいずれかでは、キットは、スプリット・アンド・プール合成、個々の合成、または固定化のための1つまたは複数の試薬、またはこれらの任意の組合せをさらに含んでよい。
前述の実施形態のいずれかでは、コンパートメントタグは、記録タグ内の成分であってよく、記録タグは、必要に応じて、スペーサー、バーコード配列、一意の分子識別子、ユニバーサルプライミング部位、またはこれらの任意の組合せをさらに含んでよい。
前述の実施形態のいずれかでは、コンパートメントタグは、複数の分析物またはポリペプチド(例えば、タンパク質複合体、タンパク質、またはポリペプチド)の内部アミノ酸、ペプチド骨格、またはN末端アミノ酸と反応することが可能な機能的部分をさらに含んでよい。一実施形態では、機能的部分は、アルデヒド、アジド/アルキン、マレイミド/チオール、エポキシ/求核試薬、逆電子要請型ディールス−アルダー(iEDDA)基、クリック試薬、またはこれらの任意の組合せを含んでよい。
前述の実施形態のいずれかでは、コンパートメントタグは、タンパク質リガーゼ認識配列などのペプチドをさらに含んでよく、必要に応じて、タンパク質リガーゼは、ブテラーゼIまたはそのホモログであってよい。
前述の実施形態のいずれかでは、キットは、複数の分析物またはポリペプチドを断片化するための化学的または生物学的試薬、例えば、酵素、例えば、プロテアーゼ(例えば、メタロプロテアーゼ)をさらに含んでよい。
前述の実施形態のいずれかでは、キットは、コンパートメントタグを支持体から遊離させるための1つまたは複数の試薬をさらに含んでよい。
前述の実施形態のいずれかでは、キットは、伸長コーディングタグまたはジタグ構築物を形成するための1つまたは複数の試薬をさらに含んでよい。一実施形態では、記録タグの3’末端をブロッキングしてポリメラーゼによる記録タグの伸長を防止する。前述の実施形態のいずれかでは、コーディングタグは、エンコーダー配列、UMI、ユニバーサルプライミング部位、その3’末端のスペーサー、結合サイクル特異的配列、またはこれらの任意の組合せを含んでよい。
前述の実施形態のいずれかでは、ジタグ構築物は、ギャップ充填、プライマー伸長、またはこれらの組合せによって生成することができる。
前述の実施形態のいずれかでは、ジタグ分子は、記録タグに由来するユニバーサルプライミング部位、記録タグに由来するコンパートメントタグ、記録タグに由来する一意の分子識別子、記録タグに由来する必要に応じたスペーサー、コーディングタグに由来するエンコーダー配列、コーディングタグに由来する一意の分子識別子、コーディングタグに由来する必要に応じたスペーサー、およびコーディングタグに由来するユニバーサルプライミング部位を含んでよい。
前述の実施形態のいずれかでは、結合性物質は、ポリペプチドまたはタンパク質であってよい。
前述の実施形態のいずれかでは、結合性物質は、アミノペプチダーゼまたはそのバリアント、変異体、もしくは改変タンパク質;アミノアシルtRNA合成酵素またはそのバリアント、変異体、もしくは改変タンパク質;アンチカリンまたはそのバリアント、変異体、もしくは改変タンパク質;ClpSまたはそのバリアント、変異体、もしくは改変タンパク質;あるいははアミノ酸(複数可)を結合する改変小分子、すなわち、バンコマイシンまたはそのバリアント、変異体、もしくは改変分子;あるいは抗体またはその結合性断片;あるいはこれらの任意の組合せを含んでよい。
前述の実施形態のいずれかでは、結合性物質は、分析物またはポリペプチドの単一のアミノ酸残基(例えば、N末端アミノ酸残基、C末端アミノ酸残基、または内部アミノ酸残基)、ジペプチド(例えば、N末端ジペプチド、C末端ジペプチド、または内部ジペプチド)、トリペプチド(例えば、N末端トリペプチド、C末端トリペプチド、または内部トリペプチド)、または翻訳後修飾に結合し得る。
前述の実施形態のいずれかでは、結合性物質は、N末端ポリペプチド、C末端ポリペプチド、または内部ポリペプチドに結合し得る。
前述の実施形態のいずれかでは、コーディングタグおよび/または記録タグは、1つまたは複数のエラー訂正コード、1つまたは複数のエンコーダー配列、1つまたは複数のバーコード、1つまたは複数のUMI、1つまたは複数のコンパートメントタグ、1つまたは複数のサイクル特異的配列、またはこれらの任意の組合せを含んでよい。一部の実施形態では、エラー訂正コードは、Hammingコード、Lee距離コード、非対称Lee距離コード、Reed−Solomonコード、およびLevenshtein−Tenengoltsコードから選択される。
前述の実施形態のいずれかでは、コーディングタグおよび/または記録タグは、サイクル標識を含んでよい。
前述の実施形態のいずれかでは、キットは、コーディングタグおよび/または記録タグに依存しないサイクル標識をさらに含んでよい。
前述の実施形態のいずれかでは、キットは、(a)細胞溶解物もしくはタンパク質試料を生成するための試薬;(b)システインのアルキル化もしくはリシンのブロッキングによってなどでアミノ酸の側鎖をブロッキングするための試薬;(c)トリプシン、LysN、もしくはLysCなどのプロテアーゼ;(d)核酸で標識されたポリペプチド(例えば、DNAで標識されたタンパク質)を支持体に固定化するための試薬;(e)分解に基づくポリペプチド配列決定のための試薬;および/または(f)核酸配列決定のための試薬をさらに含んでよい。
前述の実施形態のいずれかでは、キットは、(a)細胞溶解物もしくはタンパク質試料を生成するための試薬;(b)システインのアルキル化もしくはリシンのブロッキングによってなどでアミノ酸の側鎖をブロッキングするための試薬;(c)トリプシン、LysN、もしくはLysCなどのプロテアーゼ;(d)ポリペプチド(例えば、タンパク質)を、固定化された記録タグを含む支持体に固定化するための試薬;(e)分解に基づくポリペプチド配列決定のための試薬;および/または(f)核酸配列決定のための試薬を含んでよい。
前述の実施形態のいずれかでは、キットは、(a)細胞溶解物もしくはタンパク質試料を生成するための試薬;(b)変性試薬;(c)システインのアルキル化もしくはリシンのブロッキングによってなどでアミノ酸の側鎖をブロッキングするための試薬;(d)ユニバーサルDNAプライマー配列;(e)ポリペプチドをユニバーサルDNAプライマー配列で標識するための試薬;(f)標識されたポリペプチドをプライマーによってアニーリングするためのバーコードが付されたビーズ;(g)ビーズから標識されたポリペプチドにバーコードを書き込むためのポリメラーゼ伸長のための試薬;(h)トリプシン、LysN、もしくはLysCなどのプロテアーゼ;(i)核酸で標識されたポリペプチド(例えば、DNAで標識されたタンパク質)を支持体に固定化するための試薬;(j)分解に基づくポリペプチド配列決定のための試薬;および/または(k)核酸配列決定のための試薬を含んでよい。
前述の実施形態のいずれかでは、キットは、(a)架橋試薬;(b)細胞溶解物もしくはタンパク質試料を生成するための試薬;(c)システインのアルキル化もしくはリシンのブロッキングによってなどでアミノ酸の側鎖をブロッキングするための試薬;(d)ユニバーサルDNAプライマー配列;(e)ポリペプチドをユニバーサルDNAプライマー配列で標識するための試薬;(f)標識されたポリペプチドをプライマーによってアニーリングするためのバーコードが付されたビーズ;(g)ビーズから標識されたポリペプチドにバーコードを書き込むためのポリメラーゼ伸長のための試薬;(h)トリプシン、LysN、もしくはLysCなどのプロテアーゼ;(i)核酸で標識されたポリペプチド(例えば、DNAで標識されたタンパク質)を支持体に固定化するための試薬;(j)分解に基づくポリペプチド配列決定のための試薬;および/または(k)核酸配列決定のための試薬を含んでよい。
キットの前述の実施形態のいずれかでは、1つまたは複数の成分は、溶液中または支持体、例えば固体支持体上に提供することができる。
キット成分は、以下の例示的な方法において開示および/または使用される任意の分子、分子複合体またはコンジュゲート、試薬(例えば、化学的または生物学的)、作用物質、構造(例えば、支持体、表面、粒子、またはビーズ)、反応中間体、反応産物、結合複合体、または任意の他の製造品も含んでよい。本キットを、任意の適切な分析物、例えば、巨大分子またはポリペプチドを解析するために使用することができる。一部の実施形態では、本キットを、高度に並行な、ハイスループットなデジタル解析(例えば、巨大分子解析)、特にポリペプチド解析のために使用することができる。一部の実施形態では、本キットを、分析物、例えば、巨大分子またはポリペプチドを解析するための以下の例示的な方法において使用することができる。
第1の例は、分析物、例えば、巨大分子またはポリペプチドを解析するための方法であって、(a)固体支持体に接合した分析物および付随する記録タグを用意するステップと;(b)分析物を、分析物に結合することが可能な第1の結合性物質と接触させるステップであって、第1の結合性物質が、第1の結合性物質に関する識別情報を有する第1のコーディングタグを含む、ステップと;(c)第1のコーディングタグの情報を記録タグに移行させて、一次伸長記録タグを生成するステップと;(d)分析物を、分析物に結合することが可能な第2の結合性物質と接触させるステップであって、第2の結合性物質が、第2の結合性物質に関する識別情報を有する第2のコーディングタグを含む、ステップと;(e)第2のコーディングタグの情報を一次伸長記録タグに移行させて、二次伸長記録タグを生成するステップと;(f)二次伸長記録タグを解析するステップとを含む方法である。
第2の例は、接触させるステップ(b)および(d)を逐次的に実施する、第1の例に記載の方法である。
第3の例は、接触させるステップ(b)および(d)を同時に実施する、第1の例に記載の方法である。
第4の例は、ステップ(e)と(f)の間に、(x)第2の結合性物質を、分析物に結合することが可能な第3の(またはより高次の)結合性物質であって、第3の(またはより高次の)結合性物質に関する識別情報を有する第3の(またはより高次の)コーディングタグを含む第3の(またはより高次の)結合性物質に置き換えることにより、ステップ(d)および(e)を1回または複数回繰り返すステップと;(y)第3の(またはより高次の)コーディングタグの情報を第2の(またはより高次の)伸長記録タグに移行させて、第3の(またはより高次の)伸長記録タグを生成するステップとをさらに含み、ステップ(f)において第3の(またはより高次の)伸長記録タグを解析する、第1の例に記載の方法である。
第5の例は、分析物、例えば、巨大分子またはポリペプチドを解析するための方法であって、(a)固体支持体に接合した分析物、付随する第1の記録タグおよび付随する第2の記録タグを用意するステップと;(b)分析物を、分析物に結合することが可能な第1の結合性物質と接触させるステップであって、第1の結合性物質が、第1の結合性物質に関する識別情報を有する第1のコーディングタグを含む、ステップと;(c)第1のコーディングタグの情報を第1の記録タグに移行させて、第1の伸長記録タグを生成するステップと;(d)分析物を、分析物に結合することが可能な第2の結合性物質と接触させるステップであって、第2の結合性物質が、第2の結合性物質に関する識別情報を有する第2のコーディングタグを含む、ステップと;(e)第2のコーディングタグの情報を第2の記録タグに移行させて、第2の伸長記録タグを生成するステップと;(f)第1の伸長記録タグおよび第2の伸長記録タグを解析するステップとを含む方法である。
第6の例は、接触させるステップ(b)および(d)を逐次的に実施する、第5の例に記載の方法である。
第7の例は、接触させるステップ(b)および(d)を同時に実施する、第5の例に記載の方法である。
第8の例は、ステップ(a)が、固体支持体に接合した付随する第3の(またより高次の)記録タグを用意するステップをさらに含む、第5の例に記載の方法である。
第9の例は、ステップ(e)と(f)の間に、(x)第2の結合性物質を、分析物に結合することが可能な第3の(またはより高次の)結合性物質であって、第3の(またはより高次の)結合性物質に関する識別情報を有する第3の(またはより高次の)コーディングタグを含む第3の(またはより高次の)結合性物質に置き換えることにより、ステップ(d)および(e)を1回または複数回繰り返すステップと;(y)第3の(またはより高次の)コーディングタグの情報を第3の(またはより高次の)記録タグに移行させて、第3の(またはより高次の)伸長記録タグを生成するステップとをさらに含み、ステップ(f)において第1の伸長記録タグ、第2の伸長記録タグおよび第3の(またはより高次の)伸長記録タグを解析する、第8の例に記載の方法である。
第10の例は、第1のコーディングタグ、第2のコーディングタグ、および任意のより高次のコーディングタグが、結合サイクル特異的スペーサー配列を含む、第5から第9までの例のいずれか1つに記載の方法である。
第11の例は、ペプチドを解析するための方法であって、
(a)固体支持体に接合したペプチドおよび付随する記録タグを用意するステップと;
(b)前記ペプチドのN末端アミノ酸(NTAA)を化学薬剤で修飾するステップと;
(c)前記ペプチドを、修飾された前記NTAAに結合することが可能な第1の結合性物質と接触させるステップであって、前記前記第1の結合性物質が、前記第1の結合性物質に関する識別情報を有する第1のコーディングタグを含む、ステップと;
(d)前記第1のコーディングタグの情報を前記記録タグに移行させて、伸長記録タグを生成するステップと;
(e)前記伸長記録タグを解析するステップと
を含む方法である。
第12の例は、ステップ(c)が、前記ペプチドを、前記第2の(またはより高次の)結合性物質に関する識別情報を有する第2の(またはより高次の)コーディングタグを含む第2の(またはより高次の)結合性物質と接触させるステップであって、前記第2の(またはより高次の)結合性物質が、ステップ(b)の前記修飾されたNTAA以外の修飾されたNTAAに結合することが可能である、ステップをさらに含む、例11に記載の方法である。
第13の例は、前記ペプチドの前記第2の(またはより高次の)結合性物質との接触を、前記ペプチドの前記第1の結合性物質との接触後に逐次的に行う、第12の例に記載の方法である。
第14の例は、前記ペプチドの前記第2の(またはより高次の)結合性物質との接触を、前記ペプチドの前記第1の結合性物質との接触と同時に行う、第12の例に記載の方法である。
第15の例は、前記化学薬剤が、イソチオシアネート誘導体、2,4−ジニトロベンゼンスルホン酸(dinitrobenzenesulfonic)(DNBS)、4−スルホニル−2−ニトロフルオロベンゼン(SNFB)1−フルオロ−2,4−ジニトロベンゼン、ダンシルクロリド、7−メトキシクマリン酢酸、チオアシル化試薬、チオアセチル化試薬、またはチオベンジル化試薬である、例11から14までのいずれか1つに記載の方法である。
第16の例は、ペプチドを解析するための方法であって、
(a)固体支持体に接合したペプチドおよび付随する記録タグを用意するステップと;
(b)前記ペプチドのN末端アミノ酸(NTAA)を化学薬剤で修飾して、修飾されたNTAAを得るステップと;
(c)前記ペプチドを、前記修飾されたNTAAに結合することが可能な第1の結合性物質と接触させるステップであって、前記第1の結合性物質が、前記第1の結合性物質に関する識別情報を有する第1のコーディングタグを含む、ステップと;
(d)前記第1のコーディングタグの情報を前記記録タグに移行させて、第1の伸長記録タグを生成するステップと;
(e)前記修飾されたNTAAを除去して、新しいNTAAを露出させるステップと;
(f)前記ペプチドの前記新しいNTAAを化学薬剤で修飾して、新しく修飾されたNTAAを得るステップと;
(g)前記ペプチドを、前記新しく修飾されたNTAAに結合することが可能な第2の結合性物質と接触させるステップであって、前記第2の結合性物質が、前記第2の結合性物質に関する識別情報を有する第2のコーディングタグを含む、ステップと;
(h)前記第2のコーディングタグの情報を前記第1の伸長記録タグに移行させて、第2の伸長記録タグを生成するステップと;
(i)前記第2の伸長記録タグを解析するステップと
を含む方法である。
第17の例は、ペプチドを解析するための方法であって、
(a)固体支持体に接合したペプチドおよび付随する記録タグを用意するステップと;
(b)前記ペプチドを、前記ペプチドのN末端アミノ酸(NTAA)に結合することが可能な第1の結合性物質と接触させるステップであって、前記第1の結合性物質が、前記第1の結合性物質に関する識別情報を有する第1のコーディングタグを含む、ステップと;
(c)前記第1のコーディングタグの情報を前記記録タグに移行させて、伸長記録タグを生成するステップと;
(d)前記伸長記録タグを解析するステップと
を含む方法である。
第18の例では、ステップ(b)が、前記ペプチドを、前記第2の(またはより高次の)結合性物質に関する識別情報を有する第2の(またはより高次の)コーディングタグを含む第2の(またはより高次の)結合性物質と接触させるステップであって、前記第2の(またはより高次の)結合性物質が、前記ペプチドの前記NTAA以外のNTAAに結合することが可能である、ステップをさらに含む、第17の例に記載の方法である。
第19の例は、前記ペプチドの前記第2の(またはより高次の)結合性物質との接触を、前記ペプチドの前記第1の結合性物質との接触後に逐次的に行う、第18の例に記載の方法である。
第20の例は、前記ペプチドの前記第2の(またはより高次の)結合性物質との接触を、前記ペプチドの前記第1の結合性物質との接触と同時に行う、第18の例に記載の方法である。
第21の例は、ペプチドを解析するための方法であって、(a)固体支持体に接合したペプチドおよび付随する記録タグを用意するステップと;(b)ペプチドを、ペプチドのN末端アミノ酸(NTAA)に結合することが可能な第1の結合性物質と接触させるステップであって、第1の結合性物質が、第1の結合性物質に関する識別情報を有する第1のコーディングタグを含む、ステップと;(c)第1のコーディングタグの情報を記録タグに移行させて、第1の伸長記録タグを生成するステップと;(d)NTAAを除去して、ペプチドの新しいNTAAを露出させるステップと;(e)ペプチドを、新しいNTAAに結合することが可能な第2の結合性物質と接触させるステップであって、第2の結合性物質が、第2の結合性物質に関する識別情報を有する第2のコーディングタグを含む、ステップと;(f)第2のコーディングタグの情報を第1の伸長記録タグに移行させて、第2の伸長記録タグを生成するステップと;(g)第2の伸長記録タグを解析するステップとを含む方法である。
第22の例は、分析物が、タンパク質、ポリペプチドまたはペプチドである、第1から第10までの例のいずれか1つに記載の方法である。
第23の例は、分析物が、ペプチドである、第1から第10までの例のいずれか1つに記載の方法である。
第24の例は、ペプチドが、生体試料由来のタンパク質を断片化することによって得られる、第11から第23までの例のいずれか1つに記載の方法である。
第25の例は、分析物が、脂質、炭水化物、または大環状分子である、第1から第10までの例のいずれか1つに記載の方法である。
第26の例は、記録タグが、DNA分子、偽相補的塩基を有するDNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、またはこれらの組合せである、第1から第25までの例のいずれか1つに記載の方法である。
第27の例は、記録タグが、ユニバーサルプライミング部位を含む、第1から第26までの例のいずれか1つに記載の方法である。
第28の例は、ユニバーサルプライミング部位が、増幅、配列決定、またはその両方のためのプライミング部位を含む、第27の例に記載の方法である。
第29の例は、記録タグが、一意の分子識別子(UMI)を含む、第1から第28までの例に記載の方法である。
第30の例は、記録タグが、バーコードを含む、第1から第29までの例のいずれか1つに記載の方法である。
第31の例は、記録タグが、その3’末端にスペーサーを含む、第1から第30までの例のいずれか1つに記載の方法である。
第32の例は、分析物および付随する記録タグを、固体支持体に共有結合により接合させる、第1から第31までの例のいずれか1つに記載の方法である。
第33の例は、固体支持体が、ビーズ、多孔質ビーズ、多孔質マトリックス、アレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、マイクロタイターウェル、ELISAプレート、スピン干渉ディスク、ニトロセルロースメンブレン、ニトロセルロースに基づくポリマー表面、ナノ粒子、またはマイクロスフェアである、第1から第32までの例のいずれか1つに記載の方法である。
第34の例は、固体支持体が、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズである、第33の例に記載の方法である。
第35の例は、複数の分析物(例えば、同じ分析物の分子または異なる分析物の分子)および付随する記録タグを固体支持体に接合させる、第1から第34までの例のいずれか1つに記載の方法である。
第36の例は、固体支持体上の複数の分析物(例えば、同じ分析物の分子または異なる分析物の分子)の間に平均距離>50nmの間隔をあける、第35の例に記載の方法である。
第37の例は、結合性物質が、ポリペプチドまたはタンパク質である、第1から第36までの例のいずれか1つに記載の方法である。
第38の例は、結合性物質が、改変アミノペプチダーゼ、改変アミノアシルtRNA合成酵素、改変アンチカリン、または改変ClpSである、第37の例に記載の方法である。
第39の例は、結合性物質が、分析物に選択的に結合することが可能である、第1から第38までの例のいずれか1つに記載の方法である。
第40の例は、コーディングタグが、DNA分子、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、またはこれらの組合せである、第1から第39までの例のいずれか1つに記載の方法である。
第41の例は、コーディングタグが、エンコーダー配列を含む、第1から第40までの例のいずれか1つに記載の方法である。
第42の例は、コーディングタグが、スペーサー、結合サイクル特異的配列、一意の分子識別子、ユニバーサルプライミング部位、またはこれらの任意の組合せをさらに含む、第1から第41までの例のいずれか1つに記載の方法である。
第43の例は、結合性物質とコーディングタグが、リンカーによって接合されている、第1から第42までの例のいずれか1つに記載の方法である。
第44の例は、結合性物質とコーディングタグが、SpyTag−KTag/SpyLigase(この場合、接合される2つの部分がSpyTag/KTag対を有し、SpyLigaseによりSpyTagとKTagが接合され、したがって2つの部分が接合される)、ソルターゼ、SpyTag/SpyCatcherまたはSnoopTag/SnoopCatcherペプチド−タンパク質対によって接合されている、第1から第42までの例のいずれか1つに記載の方法である。
第45の例は、コーディングタグの情報の記録タグへの移行が、DNAリガーゼによって媒介される、第1から第44までの例のいずれか1つに記載の方法である。
第46の例は、コーディングタグの情報の記録タグへの移行が、DNAポリメラーゼによって媒介される、第1から第44までの例のいずれか1つに記載の方法である。
第47の例は、コーディングタグの情報の記録タグへの移行が、化学的ライゲーションによって媒介される、第1から第44までの例のいずれか1つに記載の方法である。
第48の例は、伸長記録タグを解析するステップが、核酸配列決定法を含む、第1から第47までの例のいずれか1つに記載の方法である。
第49の例は、核酸配列決定法が、合成による配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、ポロニーシーケンシング、イオン半導体シーケンシング、またはパイロシーケンシングである、第48の例に記載の方法である。
第50の例は、核酸配列決定法が、単一分子リアルタイムシーケンシング、ナノポアに基づく配列決定、または先端顕微鏡を使用したDNAのダイレクトイメージングである、第48の例に記載の方法である。
第51の例は、伸長記録タグを解析前に増幅する、第1から第50までの例のいずれか1つに記載の方法である。
第52の例は、伸長記録タグに含有されるコーディングタグ情報の順序により、結合性物質による分析物への結合の順序に関する情報が提供される、第1から第51までの例のいずれか1つに記載の方法である。
第53の例は、伸長記録タグに含有されるコーディングタグ情報の頻度により、結合性物質による分析物への結合の頻度に関する情報が提供される、第1から第52までの例のいずれか1つに記載の方法である。
第54の例は、複数の分析物(例えば、同じ分析物の分子または異なる分析物の分子)を表す複数の伸長記録タグを並行して解析する、第1から第53までの例のいずれか1つに記載の方法である。
第55の例は、複数の分析物(例えば、同じ分析物の分子または異なる分析物の分子)を表す複数の伸長記録タグを多重化アッセイで解析する、第54の例に記載の方法である。
第56の例は、複数の伸長記録タグが、解析前に標的濃縮アッセイを受ける、第1から第55までの例のいずれか1つに記載の方法である。
第57の例は、複数の伸長記録タグが、解析前にサブトラクションアッセイを受ける、第1から第56までの例のいずれか1つに記載の方法である。
第58の例は、複数の伸長記録タグが、非常に豊富な種を減少させるために解析前に正規化アッセイを受ける、第1から第57までの例のいずれか1つに記載の方法である。
第59の例は、NTAAを、改変アミノペプチダーゼ、改変アミノ酸tRNA合成酵素、穏やかなエドマン分解、エドマナーゼ酵素、または無水TFAによって除去する、第1から第58までの例のいずれか1つに記載の方法である。
第60の例は、少なくとも1つの結合性物質が末端アミノ酸残基に結合する、第1から第59までの例のいずれか1つに記載の方法である。
第61の例は、少なくとも1つの結合性物質が翻訳後修飾されたアミノ酸に結合する、第1から第60までの例のいずれか1つに記載の方法である。
第62の例は、複数のタンパク質複合体、タンパク質、またはポリペプチドを含む試料由来の1つまたは複数のペプチドを解析するための方法であって、(a)試料中の複数のタンパク質複合体、タンパク質、またはポリペプチドを複数のコンパートメントに分配するステップであって、各コンパートメントが、必要に応じて固体支持体に接合した複数のコンパートメントタグを含み、複数のコンパートメントタグが、個々のコンパートメント内では同じであり、他のコンパートメントのコンパートメントタグとは異なる、ステップと;(b)複数のタンパク質複合体、タンパク質、および/またはポリペプチドを複数のペプチドに断片化するステップと;(c)複数のペプチドと複数のコンパートメントタグを、複数のペプチドと複数のコンパートメント内の複数のコンパートメントタグとのアニーリングまたは接合を可能にするのに十分な条件下で接触させ、それにより、複数のコンパートメントタグ付きペプチドを生成するステップと;(d)コンパートメントタグ付きペプチドを複数のコンパートメントから収集するステップと;(e)1つまたは複数のコンパートメントタグ付きペプチドを、第1から第21までの例および第26から第61までの例のいずれか1つに記載の方法に従って解析するステップとを含む方法である。
第63の例は、コンパートメントがマイクロ流体液滴である、第62の例に記載の方法である。
第64の例は、コンパートメントがマイクロウェルである、第62の例に記載の方法である。
第65の例は、コンパートメントが表面上の分離された領域である、第62の例に記載の方法である。
第66の例は、各コンパートメントが、平均して単一の細胞を含む、第62から第65までの例のいずれか1つに記載の方法である。
第67の例は、複数のタンパク質複合体、タンパク質、またはポリペプチドを含む試料由来の1つまたは複数のペプチドを解析するための方法であって、(a)複数のタンパク質複合体、タンパク質、またはポリペプチドを複数のユニバーサルDNAタグで標識するステップと;(b)試料中の複数の標識されたタンパク質複合体、タンパク質、またはポリペプチドを複数のコンパートメントに分配するステップであって、各コンパートメントが、複数のコンパートメントタグを含み、複数のコンパートメントタグが、個々のコンパートメント内では同じであり、他のコンパートメントのコンパートメントタグとは異なる、ステップと;(c)複数のタンパク質複合体、タンパク質、またはポリペプチドと複数のコンパートメントタグを、複数のタンパク質複合体、タンパク質、またはポリペプチドと複数のコンパートメント内の複数のコンパートメントタグとのアニーリングまたは接合を可能にするのに十分な条件下で接触させ、それにより、複数のコンパートメントタグ付きタンパク質複合体、タンパク質またはポリペプチドを生成するステップと;(d)コンパートメントタグ付きタンパク質複合体、タンパク質、またはポリペプチドを複数のコンパートメントから収集するステップと;(e)必要に応じて、コンパートメントタグ付きタンパク質複合体、タンパク質、またはポリペプチドをコンパートメントタグ付きペプチドに断片化するステップと;(f)1つまたは複数のコンパートメントタグ付きペプチドを、第1〜第21までの例および第26から第61までの例のいずれか1つに記載の方法に従って解析するステップとを含む方法である。
第68の例は、コンパートメントタグ情報を、ペプチドに付随する記録タグにプライマー伸長またはライゲーションによって移行させる、第62から第67までの例のいずれか1つに記載の方法である。
第69の例は、固体支持体がビーズを含む、第62から第68までの例のいずれか1つに記載の方法である。
第70の例は、ビーズが、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズである、第69の例に記載の方法である。
第71の例は、コンパートメントタグが、一本鎖または二本鎖核酸分子を含む、第62から第70までの例のいずれか1つに記載の方法である。
第72の例は、コンパートメントタグが、バーコードおよび必要に応じてUMIを含む、第62から第71までの例のいずれか1つに記載の方法である。
第73の例は、固体支持体がビーズであり、コンパートメントタグがバーコードを含み、さらに、複数のコンパートメントタグが接合したビーズを、スプリット・アンド・プール合成によって形成する、第72の例に記載の方法である。
第74の例は、固体支持体がビーズであり、コンパートメントタグがバーコードを含み、さらに、複数のコンパートメントタグが接合したビーズを、個々の合成または固定化によって形成する、第72の例に記載の方法である。
第75の例は、コンパートメントタグが記録タグ内の成分であり、記録タグが必要に応じてスペーサー、一意の分子識別子、ユニバーサルプライミング部位、またはこれらの任意の組合せをさらに含む、第62から第74までの例のいずれか1つに記載の方法である。
第76の例は、コンパートメントタグが、複数のタンパク質複合体、タンパク質、またはポリペプチドの内部アミノ酸またはN末端アミノ酸と反応することが可能な機能的部分をさらに含む、第62から第75までの例のいずれか1つに記載の方法である。
第77の例は、機能的部分がNHS基である、第76の例に記載の方法である。
第78の例は、機能的部分がアルデヒド基である、第76の例に記載の方法である。
第79の例は、複数のコンパートメントタグが、コンパートメントタグをコンパートメントに印刷、スポッティング、インク噴射すること、またはこれらの組合せによって形成されたものである、第62から第78までの例のいずれか1つに記載の方法である。
第80の例は、コンパートメントタグが、ペプチドをさらに含む、第62から第79までの例のいずれか1つに記載の方法である。
第81の例は、コンパートメントタグペプチドが、タンパク質リガーゼ認識配列を含む、第80の例に記載の方法である。
第82の例は、タンパク質リガーゼが、ブテラーゼIまたはそのホモログである、第81の例に記載の方法である。
第83の例は、複数のポリペプチドをプロテアーゼで断片化する、第62から第82までの例のいずれか1つに記載の方法である。
第84の例は、プロテアーゼがメタロプロテアーゼである、第83の例に記載の方法である。
第85の例は、メタロプロテアーゼの活性が金属カチオンの光活性化放出によってモジュレートされる、第84の例に記載の方法である。
第86の例は、複数のポリペプチドを複数のコンパートメントに分配する前に1つまたは複数の豊富なタンパク質を試料からサブトラクションすることをさらに含む、第62から第85までの例のいずれか1つに記載の方法である。
第87の例は、複数のペプチドとコンパートメントタグを接合する前にコンパートメントタグを固体支持体から遊離させることをさらに含む、第62から第86までの例のいずれか1つに記載の方法である。
第88の例は、ステップ(d)の後に、コンパートメントタグ付きペプチドを固体支持体に記録タグを伴って接合させることをさらに含む、第62の例に記載の方法である。
第89の例は、コンパートメントタグ付きペプチド上のコンパートメントタグの情報を付随する記録タグに移行させることをさらに含む、第88の例に記載の方法である。
第90の例は、ステップ(e)の前にコンパートメントタグをコンパートメントタグ付きペプチドから除去することをさらに含む、第89の例に記載の方法である。
第91の例は、解析されるペプチドが由来する単一の細胞の同一性を解析されるペプチドのコンパートメントタグ配列に基づいて決定することをさらに含む、第62から第90までの例のいずれか1つに記載の方法である。
第92の例は、解析されるペプチドが由来するタンパク質またはタンパク質複合体の同一性を解析されるペプチドのコンパートメントタグ配列に基づいて決定することをさらに含む、第62から第90までの例のいずれか1つに記載の方法である。
第93の例は、複数の分析物(例えば、同じ分析物の分子または異なる分析物の分子)を解析するための方法であって、(a)固体支持体に接合した複数の分析物および付随する記録タグを用意するステップと;(b)複数の分析物を、複数の分析物に結合することが可能な複数の結合性物質と接触させるステップであって、各結合性物質が結合性物質に関する識別情報を有するコーディングタグを含む、ステップと;(c)(i)分析物に付随する記録タグの情報を分析物に結合した結合性物質のコーディングタグに移行させて、伸長コーディングタグを生成するステップ;または(ii)分析物に付随する記録タグおよび分析物に結合した結合性物質のコーディングタグの情報をジタグ構築物に移行させるステップと;(d)伸長コーディングタグまたはジタグ構築物を収集するステップと;(e)必要に応じてステップ(b)〜(d)を1回または複数回の結合サイクルにわたって繰り返すステップと;(f)伸長コーディングタグまたはジタグ構築物の収集物を解析するステップとを含む方法である。
第94の例は、分析物がタンパク質である、第93の例に記載の方法である。
第95の例は、分析物がペプチドである、第93の例に記載の方法である。
第96の例は、ペプチドが、生体試料由来のタンパク質を断片化することによって得られる、第95の例に記載の方法である。
第97の例は、記録タグが、DNA分子、RNA分子、PNA分子、BNA分子、XNA分子、LNA分子、γPNA分子、またはこれらの組合せである、第93から第96までの例のいずれか1つに記載の方法である。
第98の例は、記録タグが、一意の分子識別子(UMI)を含む、第93から第97までの例のいずれか1つに記載の方法である。
第99の例は、記録タグが、コンパートメントタグを含む、例93から98までのいずれか1つに記載の方法である。
第100の例は、記録タグが、ユニバーサルプライミング部位を含む、例93から99までのいずれか1つに記載の方法である。
第101の例は、記録タグが、その3’末端にスペーサーを含む、例93から100までのいずれか1つに記載の方法。
第102の例は、記録タグの3’末端をブロッキングしてポリメラーゼによる記録タグの伸長を防止し、分析物に付随する記録タグおよび分析物に結合している結合性物質のコーディングタグの情報をジタグ構築物に移行させる、例93から101までのいずれか1つに記載の方法である。
第103の例は、コーディングタグが、エンコーダー配列を含む、例93から102までのいずれか1つに記載の方法である。
第104の例は、コーディングタグが、UMIを含む、例93から103までのいずれか1つに記載の方法である。
第105の例は、コーディングタグが、ユニバーサルプライミング部位を含む、例93から104までのいずれか1つに記載の方法である。
第106の例は、コーディングタグが、その3’末端にスペーサーを含む、例93から105までのいずれか1つに記載の方法である。
第107の例は、コーディングタグが、結合サイクル特異的配列を含む、例93から106までのいずれか1つに記載の方法である。
第108の例は、結合性物質とコーディングタグが、リンカーによって接合されている、例93から107までのいずれか1つに記載の方法である。
第109の例は、記録タグの情報のコーディングタグへの移行が、プライマー伸長によってもたらされる、例93から108までのいずれか1つに記載の方法である。
第110の例は、記録タグの情報のコーディングタグへの移行が、ライゲーションによってもたらされる、例93から108までのいずれか1つに記載の方法である。
第111の例は、ジタグ構築物が、ギャップ充填、プライマー伸長、またはその両方によって生成される、例93から108までのいずれか1つに記載の方法である。
第112の例は、ジタグ分子が、記録タグに由来するユニバーサルプライミング部位、記録タグに由来するコンパートメントタグ、記録タグに由来する一意の分子識別子、記録タグに由来する必要に応じたスペーサー、コーディングタグに由来するエンコーダー配列、コーディングタグに由来する一意の分子識別子、コーディングタグに由来する必要に応じたスペーサー、およびコーディングタグに由来するユニバーサルプライミング部位を含む、例93から97まで、107、108、および111のいずれか1つに記載の方法である。
第113の例は、分析物および付随する記録タグを、固体支持体に共有結合により接合させる、例93から112までのいずれか1つに記載の方法である。
第114の例は、固体支持体が、ビーズ、多孔質ビーズ、多孔質マトリックス、アレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、マイクロタイターウェル、ELISAプレート、スピン干渉ディスク、ニトロセルロースメンブレン、ニトロセルロースに基づくポリマー表面、ナノ粒子、またはマイクロスフェアである、例113に記載の方法である。
第115の例は、固体支持体が、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズである、例114に記載の方法である。
第116の例は、結合性物質が、ポリペプチドまたはタンパク質である、例93から115までのいずれか1つに記載の方法である。
第117の例は、結合性物質が、改変アミノペプチダーゼ、改変アミノアシルtRNA合成酵素、改変アンチカリン、または抗体もしくはその結合性断片である、例116に記載の方法である。
第118の例は、結合性物質が、単一のアミノ酸残基、ジペプチド、トリペプチドまたはペプチドの翻訳後修飾に結合する、例95〜117のいずれか1つに記載の方法である。
第119の例は、結合性物質が、N末端アミノ酸残基、C末端アミノ酸残基、または内部アミノ酸残基に結合する、例118に記載の方法である。
第120の例は、結合性物質が、N末端ペプチド、C末端ペプチド、または内部ペプチドに結合する、例118に記載の方法である。
第121の例は、結合性物質がN末端アミノ酸残基に結合し、N末端アミノ酸残基が各結合サイクル後に切断される、例119に記載の方法である。
第122の例は、結合性物質がC末端アミノ酸残基に結合し、C末端アミノ酸残基が各結合サイクル後に切断される、例119に記載の方法である。
例123.N末端アミノ酸残基がエドマン分解によって切断される、例121に記載の方法。
例124.結合性物質が、アミノ酸または翻訳後修飾の部位特異的な共有結合性標識である、例93に記載の方法。
例125.ステップ(b)の後に、分析物および付随する結合性物質を含む複合体を固体支持体から解離させ、液滴またはマイクロ流体液滴のエマルジョン中に分配する、例93から124までのいずれか1つに記載の方法。
例126.各マイクロ流体液滴が、平均して、分析物および結合性物質を含む複合体を1つ含む、例125に記載の方法。
例127.伸長コーディングタグまたはジタグ構築物を生成する前に記録タグを増幅する、例125または126に記載の方法。
例128.エマルジョン融合PCRを使用して、記録タグ情報をコーディングタグに移行させる、またはジタグ構築物の集団を創出する、例125から127までのいずれか1つに記載の方法。
例129.伸長コーディングタグまたはジタグ構築物の収集物を解析前に増幅させる、例93から128までのいずれか1つに記載の方法。
例130.伸長コーディングタグまたはジタグ構築物の収集物を解析するステップが、核酸配列決定法を含む、例93から129までのいずれか1つに記載の方法。
例131.核酸配列決定法が、合成による配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、ポロニーシーケンシング、イオン半導体シーケンシング、またはパイロシーケンシングである、例130に記載の方法。
例132.核酸配列決定法が、単一分子リアルタイムシーケンシング、ナノポアに基づく配列決定、または先端顕微鏡を使用したDNAのダイレクトイメージングである、例130に記載の方法。
例133.分析物の部分的組成を、一意のコンパートメントタグおよび必要に応じてUMIを使用する複数の伸長コーディングタグまたはジタグ構築物の解析によって決定する、例130に記載の方法。
例134.解析ステップを、塩基当たりのエラー率が>5%、>10%、>15%、>20%、>25%、または>30%である配列決定法を用いて実施する、例1から133までのいずれか1つに記載の方法。
例135.コーディングタグ、記録タグ、またはその両方の識別成分が、エラー訂正コードを含む、例1から134までのいずれか1つに記載の方法。
例136.識別成分が、エンコーダー配列、バーコード、UMI、コンパートメントタグ、サイクル特異的配列、またはこれらの任意の組合せから選択される、例135に記載の方法。
例137.エラー訂正コードが、Hammingコード、Lee距離コード、非対称Lee距離コード、Reed−Solomonコード、およびLevenshtein−Tenengoltsコードから選択される、例135または136に記載の方法。
例138.コーディングタグ、記録タグ、またはその両方の識別成分が、一意の電流またはイオンフラックスまたは光学的シグネチャを生成することが可能であり、解析ステップが、識別成分を識別するために一意の電流またはイオンフラックスまたは光学的シグネチャを検出することを含む、例1から134までのいずれか1つに記載の方法。
例139. 識別成分が、エンコーダー配列、バーコード、UMI、コンパートメントタグ、サイクル特異的配列、またはこれらの任意の組合せから選択される、例138に記載の方法。
例140.複数の分析物(例えば、同じ分析物の分子または異なる分析物の分子)を解析するための方法であって、(a)固体支持体に接合した複数の分析物および付随する記録タグを用意するステップと;(b)複数の分析物を、同類の分析物に結合することが可能な複数の結合性物質と接触させるステップであって、各結合性物質が結合性物質に関する識別情報を有するコーディングタグを含む、ステップと;(c)第1の結合性物質の第1のコーディングタグの情報を第1の分析物に付随する第1の記録タグに移行させて、一次伸長記録タグを生成するステップであって、第1の結合性物質が第1の分析物に結合する、ステップと;(d)複数の分析物を、同類の分析物に結合することが可能な複数の結合性物質と接触させるステップと;(e)第2の結合性物質の第2のコーディングタグの情報を一次伸長記録タグに移行させて、二次伸長記録タグを生成するステップであって、第2の結合性物質が第1の分析物に結合する、ステップと;(f)必要に応じて、ステップ(d)〜(e)を「n」回の結合サイクルにわたって繰り返すステップであって、第1の分析物に結合する各結合性物質の各コーディングタグの情報を前の結合サイクルで生成した伸長記録タグに移行させて、第1の分析物を表すn次伸長記録タグを生成する、ステップと;(g)n次伸長記録タグを解析するステップとを含む方法。
例141.複数の分析物を表す複数のn次伸長記録タグを生成し、解析する、例140に記載の方法。
例142.分析物が、タンパク質である、例140または141に記載の方法。
例143.分析物が、ペプチドである、例142に記載の方法。
例144.ペプチドが、生体試料由来のタンパク質を断片化することによって得られる、例143に記載の方法。
例145.複数の分析物が、多数のプールされた試料由来の分析物(例えば、ポリペプチド、タンパク質、タンパク質複合体などの巨大分子)を含む、例140から144までのいずれか1つに記載の方法。
例146.記録タグが、DNA分子、RNA分子、PNA分子、BNA分子、XNA分子、LNA分子、γPNA分子、またはこれらの組合せである、例140から145までのいずれか1つに記載の方法。
例147.記録タグが、一意の分子識別子(UMI)を含む、例140から146までのいずれか1つに記載の方法。
例148.記録タグが、コンパートメントタグを含む、例140から147までに記載の方法。
例149.記録タグが、ユニバーサルプライミング部位を含む、例140から148までのいずれか1つに記載の方法。
例150.記録タグが、その3’末端にスペーサーを含む、例140から149までのいずれか1つに記載の方法。
例151.コーディングタグが、エンコーダー配列を含む、例140から150までのいずれか1つに記載の方法。
例152.コーディングタグが、UMIを含む、例140から151までのいずれか1つに記載の方法。
例153.コーディングタグが、ユニバーサルプライミング部位を含む、例140から152までのいずれか1つに記載の方法。
例154.コーディングタグが、その3’末端にスペーサーを含む、例140から153までのいずれか1つに記載の方法。
例155.コーディングタグが、結合サイクル特異的配列を含む、例140から154までのいずれか1つに記載の方法。
例156.コーディングタグが、一意の分子識別子を含む、例140から155までのいずれか1つに記載の方法。
例157.結合性物質とコーディングタグが、リンカーによって接合されている、例140から156までのいずれか1つに記載の方法。
例158.記録タグの情報のコーディングタグへの移行が、プライマー伸長によって媒介される、例140から157までのいずれか1つに記載の方法。
例159.記録タグの情報のコーディングタグへの移行が、ライゲーションによって媒介される、例140から158までのいずれか1つに記載の方法。
例160.複数の分析物、付随する記録タグ、またはその両方が、固体支持体に共有結合により接合されている、例140から159までのいずれか1つに記載の方法。
例161.固体支持体が、ビーズ、多孔質ビーズ、多孔質マトリックス、アレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、マイクロタイターウェル、ELISAプレート、スピン干渉ディスク、ニトロセルロースメンブレン、ニトロセルロースに基づくポリマー表面、ナノ粒子、またはマイクロスフェアである、例140から160までのいずれか1つに記載の方法。
例162.固体支持体が、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズである、例161に記載の方法。
例163.結合性物質が、ポリペプチドまたはタンパク質である、例140から162までのいずれか1つに記載の方法。
例164.結合性物質が、改変アミノペプチダーゼ、改変アミノアシルtRNA合成酵素、改変アンチカリン、または抗体もしくはその結合性断片である、例163に記載の方法。
例165.結合性物質が、単一のアミノ酸残基、ジペプチド、トリペプチドまたはペプチドの翻訳後修飾に結合する、例142から164までのいずれか1つに記載の方法。
例166.結合性物質が、N末端アミノ酸残基、C末端アミノ酸残基、または内部アミノ酸残基に結合する、例165に記載の方法。
例167.結合性物質が、N末端ペプチド、C末端ペプチド、または内部ペプチドに結合する、例165に記載の方法。
例168.結合性物質が、修飾されたN末端アミノ酸残基、修飾されたC末端アミノ酸残基、または修飾された内部アミノ酸残基の化学標識に結合する、例142から164までのいずれか1つに記載の方法。
例169.結合性物質がN末端アミノ酸残基または修飾されたN末端アミノ酸残基の化学標識に結合し、N末端アミノ酸残基が各結合サイクル後に切断される、例166または168に記載の方法。
例170.結合性物質がC末端アミノ酸残基または修飾されたC末端アミノ酸残基の化学標識に結合し、C末端アミノ酸残基が各結合サイクル後に切断される、例166または168に記載の方法。
例171.N末端アミノ酸残基がエドマン分解、エドマナーゼ、改変アミノペプチダーゼ、または改変アシルペプチドヒドロラーゼによって切断される、例169に記載の方法。
例172.結合性物質が、アミノ酸または翻訳後修飾の部位特異的な共有結合性標識である、例163に記載の方法。
例173.複数のn次伸長記録タグを解析前に増幅させる、例140から172までのいずれか1つに記載の方法。
例174.n次伸長記録タグの解析が、核酸配列決定法を含む、例140から173までのいずれか1つに記載の方法。
例175.複数の分析物を表す複数のn次伸長記録タグを並行して解析する、例174に記載の方法。
例176.核酸配列決定法が、合成による配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、ポロニーシーケンシング、イオン半導体シーケンシング、またはパイロシーケンシングである、例174または175に記載の方法。
例177.核酸配列決定法が、単一分子リアルタイムシーケンシング、ナノポアに基づく配列決定、または先端顕微鏡を使用したDNAのダイレクトイメージングである、例174または175に記載の方法。
上記のキット成分、および例示的なキットおよび方法において開示および/もしくは使用されている任意の分子、分子複合体もしくはコンジュゲート、試薬(例えば、化学的または生物学的試薬)、作用物質、構造(例えば、支持体、表面、粒子、またはビーズ)、反応中間体、反応産物、結合複合体、または任意の他の製造品のいずれかを、キットを形成するために別々にまたは任意の適切な組合せで提供することができる。キットは、必要に応じて、例えば、高度に並行な、ハイスループットなデジタル解析(例えば、巨大分子解析)、特に、ポリペプチド解析における使用のための説明書を含んでよい。
C.巨大分子
一態様では、本開示は、巨大分子の解析に関する。巨大分子は、より小さなサブユニットで構成される大きな分子である。ある特定の実施形態では、巨大分子は、タンパク質、タンパク質複合体、ポリペプチド、ペプチド、核酸分子、炭水化物、脂質、大環状分子、またはキメラ巨大分子である。
本明細書に開示されているキットおよび方法に従って解析される巨大分子(例えば、タンパク質、ポリペプチド、ペプチド)は、これだけに限定されないが、細胞(初代細胞および培養細胞株の両方)、細胞溶解物または抽出物、エキソソームを含めた細胞小器官または小胞、組織および組織抽出物などの生体試料;生検材料;排泄物;事実上あらゆる生物体の体液(例えば、血液、全血、血清、血漿、尿、リンパ液、胆汁、脳脊髄液、間質液、眼房水または硝子体液、初乳、痰、羊水、唾液、肛門のおよび膣分泌物、汗および精液、漏出液、滲出液(例えば、膿瘍または任意の他の感染もしくは炎症の部位から得られる流体)または関節(正常な関節または関節リウマチ、変形性関節症、痛風もしくは化膿性関節炎などの疾患の影響を受けている関節)から得られる流体)(マイクロバイオームを含有する試料を含めた哺乳動物由来試料であることが好ましく、マイクロバイオームを含有する試料を含めたヒト由来試料であることが特に好ましい);環境試料(例えば、空気、農業、水および土壌試料);微生物バイオフィルムおよび/また微生物群、ならびに微生物の胞子に由来する試料を含めた微生物試料;細胞外液、細胞培養物からの細胞外上清、細菌内の封入体、ミトコンドリア区画を含めた細胞区画、および細胞ペリプラズムを含めた研究試料を含めた適切な供給源または試料から得ることができる。
ある特定の実施形態では、巨大分子は、タンパク質、タンパク質複合体、ポリペプチド、またはペプチドである。ペプチド、ポリペプチド、またはタンパク質のアミノ酸配列情報および翻訳後修飾を、次世代シーケンシング法によって解析することができる核酸コードライブラリーに変換する。ペプチドは、L−アミノ酸、D−アミノ酸、またはその両方を含んでよい。ペプチド、ポリペプチド、タンパク質、またはタンパク質複合体は、標準の、天然に存在するアミノ酸、修飾されたアミノ酸(例えば、翻訳後修飾)、アミノ酸類似体、アミノ酸模倣物、またはそれらの任意の組合せを含んでよい。一部の実施形態では、ペプチド、ポリペプチド、またはタンパク質は、天然に存在するもの、合成的に作製されたもの、または組換えによって発現させたものである。上述のペプチド実施形態のいずれかでは、ペプチド、ポリペプチド、タンパク質、またはタンパク質複合体は、翻訳後修飾をさらに含んでよい。
標準の、天然に存在するアミノ酸としては、アラニン(AまたはAla)、システイン(CまたはCys)、アスパラギン酸(DまたはAsp)、グルタミン酸(EまたはGlu)、フェニルアラニン(FまたはPhe)、グリシン(GまたはGly)、ヒスチジン(HまたはHis)、イソロイシン(IまたはIle)、リシン(KまたはLys)、ロイシン(LまたはLeu)、メチオニン(MまたはMet)、アスパラギン(NまたはAsn)、プロリン(PまたはPro)、グルタミン(QまたはGln)、アルギニン(RまたはArg)、セリン(SまたはSer)、トレオニン(TまたはThr)、バリン(VまたはVal)、トリプトファン(WまたはTrp)、およびチロシン(YまたはTyr)が挙げられる。非標準アミノ酸としては、セレノシステイン、ピロリジン、およびN−ホルミルメチオニン、β−アミノ酸、ホモアミノ酸、プロリンおよびピルビン酸誘導体、3−置換アラニン誘導体、グリシン誘導体、環置換フェニルアラニンおよびチロシン誘導体、直鎖コアアミノ酸、およびN−メチルアミノ酸が挙げられる。
ペプチド、ポリペプチド、またはタンパク質の翻訳後修飾(PTM)は、共有結合性修飾であっても酵素的修飾であってもよい。翻訳後修飾の例としては、これだけに限定されないが、アシル化、アセチル化、アルキル化(メチル化を含む)、ビオチン化、ブチリル化、カルバミル化、カルボニル化、脱アミド化、脱イミノ化、ジフタミド形成、ジスルフィド架橋形成、エリミニル化、フラビン付着、ホルミル化、ガンマ−カルボキシル化、グルタミル化、グリシル化、グリコシル化(例えば、N結合、O結合、C結合、ホスホグリコシル化)、グリコシルホスファチジルイノシトール付加(glypiation)、ヘムC付着、ヒドロキシル化、ハイプシン形成、ヨウ素化、イソプレニル化、脂質付加、リポイル化、マロニル化、メチル化、ミリストイル化、酸化、パルミトイル化、ペグ化、ホスホパンテテイニル化、リン酸化、プレニル化、プロピオニル化、レチニリデンシッフ塩基形成、S−グルタチオン化、S−ニトロシル化、S−スルフェニル化、セレン化、サクシニル化、スルフィン化、ユビキチン化、およびC末端アミド化が挙げられる。翻訳後修飾は、ペプチドのアミノ末端および/またはカルボキシル末端、ポリペプチド、またはタンパク質の修飾を含む。末端アミノ基の修飾としては、これだけに限定されないが、デスアミノ、N−低級アルキル、N−ジ−低級アルキル、およびN−アシル修飾が挙げられる。末端カルボキシ基の修飾としては、これだけに限定されないが、アミド、低級アルキルアミド、ジアルキルアミド、および低級アルキルエステル修飾(例えば、低級アルキルは、C1〜C4アルキルである)が挙げられる。翻訳後修飾は、例えば、これだけに限定されないが、ペプチド、ポリペプチド、またはタンパク質のアミノ末端とカルボキシ末端の間にあるアミノ酸の、上記のものなどの修飾も含む。翻訳後修飾により、細胞内のタンパク質の「生物学的性質」、例えば、その活性、構造、安定性、または局在を調節することができる。リン酸化は最も一般的な翻訳後修飾であり、タンパク質の調節、特に細胞シグナル伝達において重要な役割を果たす(Prabakaranら、2012年、Wiley Interdiscip Rev Syst Biol Med、4巻:565〜583頁)。グリコシル化などの、タンパク質への糖の付加により、タンパク質のフォールディングが促進されること、安定性が改善されること、および調節機能が修飾されることが示されている。タンパク質に脂質を付着させるにより、細胞膜へのターゲティングが可能になる。翻訳後修飾は、1つまたは複数の検出可能な標識を含めるための、ペプチド、ポリペプチド、またはタンパク質の修飾も含み得る。
ある特定の実施形態では、ペプチド、ポリペプチド、またはタンパク質を断片化することができる。例えば、生体試料などの試料に由来するタンパク質を断片化することにより、断片化されたペプチドを得ることができる。ペプチド、ポリペプチド、またはタンパク質を、プロテアーゼまたはエンドペプチダーゼによる断片化を含めた当技術分野で公知の任意の手段によって断片化することができる。一部の実施形態では、ペプチド、ポリペプチド、またはタンパク質の断片化を、特異的なプロテアーゼまたはエンドペプチダーゼを使用することによって標的化する。特異的なプロテアーゼまたはエンドペプチダーゼは、特異的なコンセンサス配列に結合し、そこで切断する(例えば、ENLYFQ\Sコンセンサス配列に対して特異的なTEVプロテアーゼ)。他の実施形態では、ペプチド、ポリペプチド、またはタンパク質の断片化を、非特異的プロテアーゼまたはエンドペプチダーゼを使用することにより、標的化しないまたはランダムなものにする。非特異的プロテアーゼは、コンセンサス配列ではなく特定のアミノ酸残基に結合し、そこで切断することができる(例えば、プロテイナーゼKは、非特異的セリンプロテアーゼである)。プロテイナーゼおよびエンドペプチダーゼは当技術分野で周知であり、タンパク質またはポリペプチドを切断してより小さなペプチド断片にするために使用することができるものの例としては、プロテイナーゼK、トリプシン、キモトリプシン、ペプシン、サーモリシン、トロンビン、第Xa因子、フューリン、エンドペプチダーゼ、パパイン、ペプシン、スブチリシン、エラスターゼ、エンテロキナーゼ、Genenase(商標)I、エンドプロテアーゼLysC、エンドプロテアーゼAspN、エンドプロテアーゼGluCなどが挙げられる(Granvoglら、2007年、Anal Bioanal Chem、389巻:991〜1002頁)。ある特定の実施形態では、ペプチド、ポリペプチド、またはタンパク質を、プロテイナーゼKによって、または、任意選択で、迅速な不活化を可能にするために熱不安定性型のプロテイナーゼKによって、断片化する。プロテイナーゼKは、尿素およびSDSなどの変性試薬中で非常に安定であり、それにより、完全に変性したタンパク質を消化することが可能になる。タンパク質およびポリペプチドのペプチドへの断片化は、DNAタグまたはDNA記録タグを付着させる前に実施することもでき、その後に実施することもできる。
化学試薬を使用してタンパク質をペプチド断片に消化することもできる。化学試薬により、特定のアミノ酸残基において切断することができる(例えば、臭化シアンにより、メチオニン残基のC末端においてペプチド結合が加水分解される)。ポリペプチドまたはタンパク質をより小さなペプチドに断片化するための化学試薬としては、臭化シアン(CNBr)、ヒドロキシルアミン、ヒドラジン、ギ酸、BNPS−スカトール[2−(2−ニトロフェニルスルフェニル)−3−メチルインドール]、ヨードソ安息香酸、・NTCB+Ni(2−ニトロ−5−チオシアノ安息香酸)などが挙げられる。
ある特定の実施形態では、酵素的切断または化学的切断の後、得られるペプチド断片は、ほぼ同じ所望の長さ、例えば、約10アミノ酸から約70アミノ酸まで、約10アミノ酸から約60アミノ酸まで、約10アミノ酸から約50アミノ酸まで、約10アミノ酸から約40アミノ酸まで、約10アミノ酸から約30アミノ酸まで、約20アミノ酸から約70アミノ酸まで、約20アミノ酸から約60アミノ酸まで、約20アミノ酸から約50アミノ酸まで、約20アミノ酸から約40アミノ酸まで、約20アミノ酸から約30アミノ酸まで、約30アミノ酸から約70アミノ酸まで、約30アミノ酸から約60アミノ酸まで、約30アミノ酸から約50アミノ酸まで、または約30アミノ酸から約40アミノ酸までである。切断反応は、タンパク質またはポリペプチド試料に、プロテイナーゼまたはエンドペプチダーゼ切断部位を含有するペプチド配列を含む短い試験FRET(蛍光共鳴エネルギー移動)ペプチドをスパイクすることにより、例えばリアルタイムで、モニターすることができる。インタクトなFRETペプチドでは、蛍光基およびクエンチャー基が切断部位を含有するペプチド配列のいずれかの末端に付着しており、クエンチャーとフルオロフォアの間の蛍光共鳴エネルギー移動により、低い蛍光が生じる。試験ペプチドがプロテアーゼまたはエンドペプチダーゼによって切断されると、クエンチャーおよびフルオロフォアが分離し、それにより、蛍光の大きな増大がもたらされる。切断反応は、ある特定の蛍光強度が実現された時に停止させることができ、これにより、再現性のある切断エンドポイントを実現することが可能になる。
巨大分子(例えば、ペプチド、ポリペプチド、またはタンパク質)の試料に対して、固体支持体に付着させる前にタンパク質分画法を行うことができ、ここで、タンパク質またはペプチドを細胞内の位置、分子量、疎水性、もしくは等電点などの1つもしくは複数の性質、またはタンパク質濃縮法によって分離する。その代わりにまたはそれに加えて、特定のタンパク質またはペプチドを選択するため(例えば、その全体が参照により組み込まれる、Whiteakerら、2007年、Anal. Biochem.、362巻:44〜54頁を参照されたい)または特定の翻訳後修飾を選択するため(例えば、その全体が参照により組み込まれる、Huangら、2014年、J. Chromatogr. A、1372巻:1〜17頁を参照されたい)に、タンパク質濃縮法を使用することができる。あるいは、免疫グロブリンなどの特定のクラス(複数可)のタンパク質、またはIgGなどの免疫グロブリン(Ig)アイソタイプを、解析のために親和性により濃縮または選択することができる。免疫グロブリン分子の場合では、親和性結合に関与する超可変配列の配列および豊富さまたは頻度を解析することが特に興味深く、これは、特に、これらが疾患の進行に応答して変動するまたは健康、免疫、および/もしくは疾患表現型と相関するからである。過度に豊富なタンパク質を、標準の免疫親和性方法を使用して試料からからサブトラクションすることもできる。豊富なタンパク質の枯渇は、タンパク質構成物の80%よりも多くがアルブミンおよび免疫グロブリンである血漿試料に関して有用であり得る。例えばPROTIAおよびPROT20(Sigma−Aldrich)など、血漿試料の過度に豊富なタンパク質の枯渇のために、いくつかの市販品が入手可能である。
ある特定の実施形態では、巨大分子は、タンパク質またはポリペプチドで構成される。一実施形態では、タンパク質またはポリペプチドを標準のアミンカップリング化学によってDNA記録タグで標識する(例えば、図2B、2C、28、29、31、40)を参照されたい。ε−アミノ基(例えばリシン残基の)およびN末端アミノ基は、反応のpHに応じて、アミン反応性カップリング剤で特に標識しやすい(MendozaおよびVachet、2009年)。特定の実施形態では(例えば、図2Bおよび図29を参照されたい)、記録タグは、反応性部分(例えば、固体表面、多機能性リンカー、または巨大分子へのコンジュゲーションのための部分)、リンカー、ユニバーサルプライミング配列、バーコード(例えば、コンパートメントタグ、分配バーコード、試料バーコード、画分バーコード、またはそれらの任意の組合せ)、任意選択のUMI、およびコーディングタグへの/からの情報移行を容易にするためのスペーサー(Sp)配列で構成される。別の実施形態では、タンパク質を、まず、ユニバーサルDNAタグで標識し、その後で、酵素的または化学的カップリングステップによってバーコード−Sp配列(試料、コンパートメント、スライド上の物理的位置を表すなど)をタンパク質に付着させることができる(例えば、図20、30、31、40を参照されたい)。ユニバーサルDNAタグは、タンパク質またはポリペプチド巨大分子を標識するために使用され、バーコード(例えば、コンパートメントタグ、記録タグなど)の付着点として使用することができるヌクレオチドの短い配列を含む。例えば、記録タグは、その末端に、ユニバーサルDNAタグと相補的な配列を含んでよい。ある特定の実施形態では、ユニバーサルDNAタグは、ユニバーサルプライミング配列である。標識されたタンパク質上のユニバーサルDNAタグが記録タグ(例えば、ビーズに結合させたもの)内の相補配列とハイブリダイズしたら、アニーリングされたユニバーサルDNAタグをプライマー伸長によって伸長させ、それにより、DNAタグが付されたタンパク質に記録タグ情報を移行させることができる。特定の実施形態では、タンパク質を、プロテイナーゼにより消化してペプチドにする前に、ユニバーサルDNAタグで標識する。次いで、消化物に由来する標識されたペプチド上のユニバーサルDNAタグを、情報価値があり、有効な記録タグに変換することができる。
ある特定の実施形態では、タンパク質巨大分子を親和性捕捉試薬によって固体支持体に固定化すること(および任意選択で共有結合により架橋結合させること)ができ、ここで、記録タグは、親和性捕捉試薬に直接付随している、あるいは、タンパク質を固体支持体に記録タグと共に直接固定化することができる(例えば、図2Cを参照されたい)。
D.固体支持体などの支持体
本開示の巨大分子を固体支持体の表面(「基板表面」とも称される)に接合する。固体支持体は、これだけに限定されないが、ビーズ、マイクロビーズ、アレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フローセル、フロースルーチップ、信号変換電子機器を含むバイオチップ、マイクロタイターウェル、ELISAプレート、スピン干渉ディスク、ニトロセルロースメンブレン、ニトロセルロースに基づくポリマー表面、ナノ粒子、またはマイクロスフェアを含めた任意の多孔質または非多孔質支持体表面であってよい。固体支持体用の材料としては、これだけに限定されないが、アクリルアミド、アガロース、セルロース、ニトロセルロース、ガラス、金、石英、ポリスチレン、ポリエチレン酢酸ビニル、ポリプロピレン、ポリメタクリレート、ポリエチレン、ポリエチレンオキシド、ポリシリケート、ポリカーボネート、テフロン(登録商標)、フルオロカーボン、ナイロン、シリコンゴム、ポリ酸無水物、ポリグリコール酸、ポリ乳酸、ポリオルトエステル、官能化シラン、ポリプロピルフメレート、コラーゲン、グリコサミノグリカン、ポリアミノ酸、またはそれらの任意の組合せが挙げられる。固体支持体は、薄膜、膜、ビン、ディッシュ、繊維、織られた繊維、チューブなどの成形ポリマー、粒子、ビーズ、微小粒子、またはそれらの任意の組合せをさらに含む。例えば、固体表面がビーズである場合、ビーズとしては、これだけに限定されないが、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズを挙げることができる。
ある特定の実施形態では、固体支持体は、フローセルである。フローセルの形態は、異なる次世代シーケンシングプラットフォームの間で変動し得る。例えば、Illuminaフローセルは、その表面に一連のオリゴヌクレオチドアンカーが結合した、顕微鏡スライドと同様の平面の光学的に透明な表面である。鋳型DNAは、末端にフローセル表面上のオリゴヌクレオチドと相補的なアダプターがライゲーションしている。アダプター付加した一本鎖DNAをフローセルに結合させ、固相「ブリッジ」PCRによって増幅した後、配列決定する。454フローセル(454 Life Sciences)は、75ピコリットルのウェルを約160万個有する光ファイバースライドである「ピコタイター」プレートを支持するものである。せん断された鋳型DNAの個々の分子をそれぞれ別々のビーズに捕捉し、各ビーズを油エマルジョン中の水性PCR反応混合物の個々の液滴中に区画化する。鋳型をビーズ表面上でPCRによってクローン的に増幅し、次いで、鋳型がローディングされたビーズを配列決定反応のためにピコタイタープレートのウェル中に、理想的には1ウェル当たり1個またはそれ未満のビーズに分布させる。Applied BiosystemsからのSOLiD(Supported Oligonucleotide Ligation and Detection)計器では、454システムと同様に、鋳型分子をエマルジョンPCRによって増幅する。増幅した鋳型を含有しないビーズを選別するステップの後、ビーズに結合した鋳型がフローセル上に蓄積する。フローセルは、TWIST(商標)DNA合成カラム(Glen Research)などの単純なフィルターフリットであってもよい。
ある特定の実施形態では、固体支持体はビーズであり、これは、個々のビーズを指す場合もあり複数のビーズを指す場合もある。一部の実施形態では、ビーズは、下流の解析のために使用される選択された次世代シーケンシングプラットフォーム(例えば、SOLiDまたは454)に適合するものである。一部の実施形態では、固体支持体は、アガロースビーズ、常磁性ビーズ、ポリスチレンビーズ、ポリマービーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、ガラスビーズ、または制御ポアビーズである。さらなる実施形態では、ビーズは、巨大分子への結合を容易にするために、結合機能性(例えば、アミン基、ビオチン標識された巨大分子、抗体との結合用のストレプトアビジンなどの親和性リガンド)でコーティングすることができる。
タンパク質、ポリペプチド、またはペプチドは、固体支持体に、直接または間接的に、共有結合性の相互作用および非共有結合性の相互作用またはそれらの任意の組合せを含めた当技術分野で公知の任意の手段によって接合させることができる(例えば、それぞれ、これによってその全体が参照により組み込まれる、Chanら、2007年、PLoS One、2巻:e1164頁;Cazalisら、Bioconj. Chem.、15巻:1005〜1009頁;Soellnerら、2003年、J. Am. Chem. Soc.、125巻:11790〜11791頁;Sunら、2006年、Bioconjug. Chem.、17巻、52〜57頁;Decreauら、2007年、J. Org. Chem.、72巻:2794〜2802頁;Camareroら、2004年、J. Am. Chem. Soc.、126巻:14730〜14731頁;Girishら、2005年、Bioorg. Med. Chem. Lett.、15巻:2447〜2451頁;Kaliaら、2007年、Bioconjug. Chem.、18巻:1064〜1069頁;Watzkeら、2006年、Angew Chem. Int. Ed. Engl.、45巻:1408〜1412頁;Parthasarathyら、2007年、Bioconjugate Chem.、18巻:469〜476頁;およびBioconjugate Techniques、G. T. Hermanson、Academic Press(2013年)を参照されたい)。例えば、ペプチドを固体支持体にライゲーション反応によって接合させることができる。あるいは、固体支持体は、直接または間接的にペプチドを固体支持体に接合することを容易にするための作用物質またはコーティングを含んでよい。タンパク質、核酸、炭水化物および小分子を含めた任意の適切な分子または材料をこの目的のために使用することができる。例えば、一実施形態では、作用物質は、親和性分子である。別の例では、作用物質は、別の分子のアルキニル基と反応して固体支持体と他の分子の間の結び付きまたは結合を容易にすることができる、アジド基である。
タンパク質、ポリペプチド、またはペプチドは、固体支持体に、「クリックケミストリー」と称される方法を使用して接合させることができる。この目的のために、迅速かつ実質的に不可逆的である任意の反応を使用してタンパク質、ポリペプチド、またはペプチドを固体支持体に付着させることができる。例示的な反応としては、トリアゾールが形成される、アジドとアルキンの銅により触媒される反応(ヒュスゲン1,3−双極子付加環化)、歪み促進型アジド−アルキン付加環化(SPAAC)、ジエンと求ジエン体の反応(ディールス・アルダー)、歪み促進型アルキン−ニトロン付加環化、歪アルケンとアジド、テトラジンまたはテトラゾールの反応、アルケン−アジド[3+2]付加環化、アルケン−テトラジン逆電子要請型ディールス・アルダー(IEDDA)反応(例えば、m−テトラジン(mTet)−trans−シクロオクテン(TCO))、アルケン−テトラゾール光化学反応、アジド−ホスフィンのシュタウディンガーライゲーション、ならびに、求電子原子に対する求核攻撃による脱離基の置換(Horisawa 2014年、Knall、Hollaufら、2014年)などの種々の置換反応が挙げられる。例示的な置換反応としては、アミンと活性化エステルの反応;アミンとN−ヒドロキシスクシンイミドエステルの反応;アミンとイソシアネートの反応;アミンとイソチオシアネートの反応などが挙げられる。
一部の実施形態では、巨大分子および固体支持体を、2つの相補的な反応性基の反応によって形成することができる官能基、例えば、前述の「クリック」反応のうちの1つの生成物である官能基によって接合する。種々の実施形態では、官能基は、アルデヒド、オキシム、ヒドラゾン、ヒドラジド、アルキン、アミン、アジド、アシルアジド、ハロゲン化アシル、ニトリル、ニトロン、スルフヒドリル、ジスルフィド、ハロゲン化スルホニル、イソチオシアネート、イミドエステル、活性化エステル(例えば、N−ヒドロキシスクシンイミドエステル、ペンチン酸STPエステル)、ケトン、α,β−不飽和カルボニル、アルケン、マレイミド、α−ハロイミド、エポキシド、アジリジン、テトラジン、テトラゾール、ホスフィン、ビオチンまたはチイラン官能基と、相補的な反応性基との反応によって形成することができる。例示的な反応は、アミン(例えば、第一級アミン)とN−ヒドロキシスクシンイミドエステルまたはイソチオシアネートの反応である。
さらに他の実施形態では、官能基は、アルケン、エステル、アミド、チオエステル、ジスルフィド、炭素環式、複素環式またはヘテロアリール基を含む。さらなる実施形態では、官能基は、アルケン、エステル、アミド、チオエステル、チオ尿素、ジスルフィド、炭素環式、複素環式またはヘテロアリール基を含む。他の実施形態では、官能基は、アミドまたはチオ尿素を含む。一部のより具体的な実施形態では、官能基は、トリアゾリル官能基、アミド、またはチオ尿素官能基である。
好ましい実施形態では、迅速かつ低インプット濃度で高収率がもたらされるので、iEDDAクリックケミストリーを巨大分子(例えば、タンパク質、ポリペプチド、ペプチド)を固体支持体に固定化するために使用する。別の好ましい実施形態では、テトラジンではなくm−テトラジンをiEDDAクリックケミストリー反応に使用し、これは、m−テトラジンが改善された結合安定性を有するからである。
好ましい実施形態では、基板表面をTCOで官能化し、記録タグで標識したタンパク質、ポリペプチド、ペプチドを、TCOでコーティングした基板表面に、付着したm−テトラジン部分を介して固定化する(例えば図34を参照されたい)。
タンパク質、ポリペプチド、またはペプチドは、そのC末端、N末端、または内部アミノ酸により、例えば、アミン基、カルボキシル基、またはスルフィドリル基を介して、固体支持体の表面に固定化することができる。アミン基へのカップリングに使用される標準の活性化された支持体としては、CNBrで活性化された支持体、NHSで活性化された支持体、アルデヒドで活性化された支持体、アズラクトンで活性化された支持体、およびCDIで活性化された支持体が挙げられる。カルボキシルカップリングに使用される標準の活性化された支持体としては、アミン支持体にカップリングするカルボジイミドで活性化されたカルボキシル部分が挙げられる。システインカップリングでは、マレイミド、ヨードアセチル、およびピリジルジスルフィドで活性化された支持体を使用することができる。ペプチドカルボキシ末端固定化の代替方式では、C末端にリシンまたはアルギニン残基を含有するペプチドに、それらを切断することなく結合する、触媒として不活性なトリプシンの誘導体であるアンヒドロトリプシンを使用する。
ある特定の実施形態では、タンパク質、ポリペプチド、またはペプチドを固体支持体に、固体表面に結合させたリンカーをタンパク質、ポリペプチド、またはペプチドのリシン基に共有結合により付着させることによって固定化する。
固体支持体への固定化前または固定化後に、タンパク質、ポリペプチド、またはペプチドに記録タグを付着させることができる。例えば、タンパク質、ポリペプチド、またはペプチドを、まず記録タグで標識し、次いで、カップリングのための2つの機能的部分を含む記録タグを介して固体表面に固定化することができる(例えば図28を参照されたい)。記録タグの一方の機能的部分をタンパク質とカップリングさせ、他方の機能的部分により、記録タグで標識したタンパク質を固体支持体に固定化する。
あるいは、タンパク質、ポリペプチドまたはペプチドを記録タグで標識する前に、タンパク質、ポリペプチド、またはペプチドを固体支持体に固定化する。例えば、タンパク質をまずクリックケミストリー部分などの反応性基で誘導体化することができる。次いで、活性化されたタンパク質分子を適切な固体支持体に付着させ、次いで、相補的なクリックケミストリー部分を使用して記録タグで標識することができる。例として、アルキンおよびmTet部分で誘導体化したタンパク質を、アジドおよびTCOで誘導体化したビーズに固定化し、アジドおよびTCOで標識された記録タグに付着させることができる。
巨大分子(例えば、タンパク質、ポリペプチド、またはペプチド)を固体支持体に付着させるための本明細書において提示される方法はまた、記録タグを固体支持体に付着させるまたは記録タグを巨大分子(例えば、タンパク質、ポリペプチド、またはペプチド)に付着させるためにも使用することができることが理解される。
ある特定の実施形態では、結合性物質への非特異的吸収を最小限にするために、固体支持体の表面を不動態化(ブロッキング)する。「不動態化」された表面とは、結合性物質の非特異的結合を最小限にするために材料の外層で処理された表面を指す。表面を不動態化する方法としては、表面を、ポリエチレングリコール(PEG)(Panら、2015年、Phys. Biol.、12巻:045006頁)、ポリシロキサン(例えば、Pluronic F−127)、星型ポリマー(例えば、星型PEG)(Grollら、2010年、Methods Enzymol.、472巻:1〜18頁)、疎水性ジクロロジメチルシラン(DDS)+自己組織化Tween(登録商標)−20(Huaら、2014年、Nat. Methods、11巻:1233〜1236頁)、およびダイヤモンド様炭素(DLC)、DLC+PEG(Stavisら、2011年、Proc. Natl. Acad. Sci. USA、108巻:983〜988頁)のようなポリマーで不動態化することを含めた、蛍光単一分子解析の文献からの標準の方法が挙げられる。共有結合性の表面修飾に加えて、Tween(登録商標)−20のような界面活性物質、溶液中ポリシロキサン(Pluronicシリーズ)、ポリビニルアルコール(PVA)、ならびにBSAおよびカゼインのようなタンパク質を含めたいくつもの不動態化剤を同様に使用することができる。あるいは、固体基板の表面上または容積内のタンパク質、ポリペプチド、またはペプチドの密度を、タンパク質、ポリペプチドまたはペプチドを固体基板に固定化する際に競合剤または「ダミー」反応性分子をスパイクすることによって調整することができる(例えば図36Aを参照されたい)。
ある特定の実施形態では、多数の巨大分子を同じ固体支持体上に固定化する場合、例えば、結合性物質が第1の巨大分子に結合し、そのコーディングタグ情報が第1の巨大分子に付随する記録タグではなく近隣の巨大分子に付随する記録タグに移行する交差結合または分子間事象の発生を低減するまたはそれを防止するために、巨大分子の間に適切に間隔をあけることができる。固体支持体上の巨大分子の間隔(例えば、タンパク質、ポリペプチド、またはペプチドの間隔)を制御するために、基板表面上の機能的カップリング基(例えば、TCO)の密度を調整することができる(例えば図34を参照されたい)。一部の実施形態では、固体支持体(例えば、多孔質支持体)の表面上または容積内で多数の巨大分子の間に約50nm〜約500nm、または約50nm〜約400nm、または約50nm〜約300nm、または約50nm〜約200nm、または約50nm〜約100nmの距離で間隔をあける。一部の実施形態では、固体支持体の表面上で多数の巨大分子の間に少なくとも50nm、少なくとも60nm、少なくとも70nm、少なくとも80nm、少なくとも90nm、少なくとも100nm、少なくとも150nm、少なくとも200nm、少なくとも250nm、少なくとも300nm、少なくとも350nm、少なくとも400nm、少なくとも450nm、または少なくとも500nmの平均距離で間隔をあける。一部の実施形態では、固体支持体の表面上で多数の巨大分子の間に少なくとも50nmの平均距離で間隔をあける。一部の実施形態では、固体支持体の表面上または容積内で巨大分子の間に、経験的に分子内事象に対する分子間事象の相対的な頻度が<1:10;<1:100;<1:1,000;または<1:10,000になるように間隔をあける。適切な間隔頻度は、機能アッセイを使用して経験的に決定することができ(実施例23を参照されたい)、希釈によっておよび/または基板表面上の部位への付着について競合する「ダミー」スペーサー分子をスパイクすることによって実現することができる。
例えば、図34に示されている通り、PEG−5000(MW約5000)を使用して、基板表面(例えば、ビーズ表面)上のペプチド間の間隙の空間をブロッキングする。さらに、ペプチドを同じくPEG−5000分子に付着させた機能的部分とカップリングさせる。好ましい実施形態では、これは、NHS−PEG−5000−TCO+NHS−PEG−5000−メチルの混合物をアミン誘導体化ビーズにカップリングすることによって実現される(例えば、図34を参照されたい)。2つのPEG間(TCO対メチル)の化学量論比を調整して、基板表面上の機能的カップリング部分(TCO基)の適切な密度を生じさせる;メチル−PEGはカップリングに対して不活性である。TCO基間の有効な間隔は、表面上のTCO基の密度を測定することによって算出することができる。ある特定の実施形態では、固体表面上のカップリング部分(例えば、TCO)間の平均間隔は、少なくとも50nm、少なくとも100nm、少なくとも250nm、または少なくとも500nmである。ビーズをPEG5000−TCO/メチルで誘導体化した後、表面上の過剰なNH2基を反応性無水物(例えば、無水酢酸のまたは無水コハク酸)阻害剤でクエンチする。
特定の実施形態では、分析物分子および/または記録タグを基板または支持体に、(i)第1の分析物に結合したコーディング物質(特に、その結合したコーディング物質内のコーディングタグ)と(ii)第2の分析物および/またはその記録タグと間の相互作用が低減する、最小限になる、または完全に排除されるような密度で固定化する。したがって、「分子間」会合に起因する偽陽性アッセイシグナルが低減され、最小限にされ、または排除され得る。
ある特定の実施形態では、基板上の分析物分子および/または記録タグの密度を各型の分析物について決定する。例えば、「分子間」相互作用を防止するために、変性ポリペプチド鎖が長いほど密度を低くすべきである。ある特定の態様では、分析物分子および/または記録タグの間の間隔を増大させること(すなわち、密度を低下させること)により、本開示のアッセイのシグナルのバックグラウンドに対する比が増大する。
一部の実施形態では、分析物分子および/または記録タグを基板上に約0.0001分子/μm2、0.001分子/μm2、0.01分子/μm2、0.1分子/μm2、1分子/μm2、約2分子/μm2、約3分子/μm2、約4分子/μm2、約5分子/μm2、約6分子/μm2、約7分子/μm2、約8分子/μm2、約9分子/μm2、または約10分子/μm2の平均密度で蓄積または固定化する。他の実施形態では、分析物分子および/または記録タグを、基板上に約15、約20、約25、約30、約35、約40、約45、約50、約55、約60、約65、約70、約75、約80、約85、約90、約95、約100、約105、約110、約115、約120、約125、約130、約135、約140、約145、約150、約155、約160、約165、約170、約175、約180、約185、約190、約195、約200、または約200分子/μm2の平均密度で蓄積または固定化する。他の実施形態では、分析物分子および/または記録タグを、約1分子/mm2個、約10分子/mm2、約50分子/mm2、約100分子/mm2、約150分子/mm2、約200分子/mm2、約250分子/mm2、約300分子/mm2、約350分子/mm2、400分子/mm2、約450分子/mm2、約500分子/mm2、約550分子/mm2、約600分子/mm2、約650分子/mm2、約700分子/mm2、約750分子/mm2、約800分子/mm2、約850分子/mm2、約900分子/mm2、約950分子/mm2、または約1000分子/mm2の平均密度で蓄積または固定化する。さらに他の実施形態では、分析物分子および/または記録タグを基板上に約1×103〜約0.5×104分子/mm2の間、約0.5×104〜約1×104分子/mm2の間、約1×104〜約0.5×105分子/mm2の間、約0.5×105〜約1×105分子/mm2の間、約1×105〜約0.5×106分子/mm2の間、または約0.5×106〜約1×106分子/mm2の間の平均密度で蓄積または固定化する。他の実施形態では、基板上に蓄積または固定化される分析物分子および/または記録タグの平均密度は、例えば、約1分子/cm2〜約5分子/cm2の間、約5〜約10分子/cm2の間、約10〜約50分子/cm2の間、約50〜約100分子/cm2の間、約100〜約0.5×103分子/cm2の間、約0.5×103〜約1×103分子/cm2の間、1×103〜約0.5×104分子/cm2の間、約0.5×104〜約1×104分子/cm2の間、約1×104〜約0.5×105分子/cm2の間、約0.5×105〜約1×105分子/cm2の間、約1×105〜約0.5×106分子/cm2の間、または約0.5×106〜約1×106分子/cm2の間であってよい。
ある特定の実施形態では、アッセイのバックグラウンドおよび/または偽陽性の結果を低減するために、溶液中の結合性物質の濃度を制御する。
一部の実施形態では、結合性物質の濃度は、約0.0001nM、約0.001nM、約0.01nM、約0.1nM、約1nM、約2nM、約5nM、約10nM、約20nM、約50nM、約100nM、約200nM、約500nM、または約1000nMである。他の実施形態では、アッセイにおいて使用される可溶性コンジュゲートの濃度は、約0.0001nM〜約0.001nMの間、約0.001nM〜約0.01nMの間、約0.01nM〜約0.1nMの間、約0.1nM〜約1nMの間、約1nM〜約2nMの間、約2nM〜約5nMの間、約5nM〜約10nMの間、約10nM〜約20nMの間、約20nM〜約50nMの間、約50nM〜約100nMの間、約100nM〜約200nMの間、約200nM〜約500nMの間、約500nM〜約1000nMの間である、または約1000nMよりも高い。
一部の実施形態では、可溶性結合性物質分子と固定化された分析物分子および/または記録タグとの間の比は、約0.00001:1、約0.0001:1、約0.001:1、約0.01:1、約0.1:1、約1:1、約2:1、約5:1、約10:1、約15:1、約20:1、約25:1、約30:1、約35:1、約40:1、約45:1、約50:1、約55:1、約60:1、約65:1、約70:1、約75:1、約80:1、約85:1、約90:1、約95:1、約100:1、約104:1、約105:1、約106:1、またはそれよりも大きい、または上に列挙した比の間の任意の比である。可溶性結合性物質分子と固定化された分析物分子および/または記録タグとの間のより大きな比を使用して、結合および/またはコーディングタグ/記録タグ情報の移行が完了するように駆動することができる。これは、試料中の豊富さが低いタンパク質分析物の検出および/または解析するために特に有用であり得る。
E.記録タグ
一部の実施形態では、少なくとも1つの記録タグを巨大分子に直接または間接的に付随または共局在させ、固体支持体に接合させる(例えば、図5を参照されたい)。記録タグは、DNA、RNA、PNA、γPNA、GNA、BNA、XNA、TNA、ポリヌクレオチド類似体、またはこれらの組合せを含んでよい。記録タグは、一本鎖であってもよく、部分的にまたは完全に二本鎖であってもよい。記録タグは、平滑末端を有してもよく突出末端を有してもよい。ある特定の実施形態では、結合性物質が巨大分子に結合したら、結合性物質のコーディングタグの識別情報を記録タグに移行させて、伸長記録タグを生成する。その後の結合サイクルにおいて伸長記録タグに対するさらなる伸長を行うことができる。
記録タグは、固体支持体に、共有結合性の相互作用および非共有結合性の相互作用、またはそれらの任意の組合せを含めた当技術分野で公知の任意の手段によって直接または間接的に(例えば、リンカーを介して)接合させることができる。例えば、記録タグを固体支持体にライゲーション反応によって接合させることができる。あるいは、固体支持体は、記録タグを固体支持体に直接または間接的に接合させることを容易にするための作用物質またはコーティングを含んでよい。核酸分子を固体支持体(例えば、ビーズ)に固定化するための戦略は、それぞれ、その全体が参照により本明細書に組み込まれる、米国特許第5,900,481号;Steinbergら(2004年、Biopolymers、73巻:597〜605頁);Lundら、1988年(Nucleic Acids Res.、16巻:10861〜10880頁);およびSteinbergら(2004年、Biopolymers、73巻:597〜605頁)に記載されている。
ある特定の実施形態では、巨大分子(例えば、ペプチド)と付随する記録タグの共局在は、巨大分子および記録タグを、固体支持体表面に直接付着させた二機能性リンカーとコンジュゲートすることによって実現される。Steinbergら(2004年、Biopolymer、73巻:597〜605頁)。さらなる実施形態では、三機能性部分を使用して固体支持体(例えば、ビーズ)を誘導体化し、得られた二機能性部分を巨大分子および記録タグの両方とカップリングさせる。
巨大分子および固体支持体の付着に関して記載されているものなどの方法および試薬(例えば、クリックケミストリー試薬および光親和性標識試薬)を記録タグの付着にも使用することができる。
特定の実施形態では、単一の記録タグを巨大分子(例えば、ペプチド)に、例えば脱ブロッキングしたN末端アミノ酸またはC末端アミノ酸に付着させることによって付着させる。別の実施形態では、多数の記録タグを巨大分子(例えば、タンパク質、ポリペプチド、またはペプチド)に、例えばリシン残基またはペプチド骨格に付着させる。一部の実施形態では、多数の記録タグで標識した巨大分子(例えば、タンパク質またはポリペプチド)を、それぞれが平均して1つの記録タグで標識された、より小さなペプチドに断片化または消化する。
ある特定の実施形態では、記録タグは、任意選択の、UMIが付随する各巨大分子(例えば、タンパク質、ポリペプチド、ペプチド)についての一意の識別子タグをもたらす一意の分子識別子(UMI)を含む。UMIは、約3〜約40塩基、約3〜約30塩基、約3〜約20塩基、または約3〜約10塩基、または約3〜約8塩基であってよい。一部の実施形態では、UMIは、約3塩基、4塩基、5塩基、6塩基、7塩基、8塩基、9塩基、10塩基、11塩基、12塩基、13塩基、14塩基、15塩基、16塩基、17塩基、18塩基、19塩基、20塩基、25塩基、30塩基、35塩基、または40塩基の長さである。UMIを使用して、複数の伸長記録タグからの配列決定データをデコンボリューションして個々の巨大分子からの配列読み取りを識別することができる。一部の実施形態では、巨大分子のライブラリー内で、各巨大分子に単一の記録タグを付随させ、各記録タグが一意のUMIを含む。他の実施形態では、記録タグの多数のコピーを単一の巨大分子に付随させ、記録タグの各コピーは同じUMIを含む。一部の実施形態では、UMIは、結合性物質のコーディングタグ内のスペーサーまたはエンコーダー配列と、これらの成分を配列解析中に区別することを容易にするために、異なる塩基配列を有する。
ある特定の実施形態では、記録タグは、例えば、存在する場合、UMI以外のバーコードを含む。バーコードは、約3〜約30塩基、約3〜約25塩基、約3〜約20塩基、約3〜約10塩基、約3〜約10塩基、約3〜約8塩基の長さの核酸分子である。一部の実施形態では、バーコードは、約3塩基、4塩基、5塩基、6塩基、7塩基、8塩基、9塩基、10塩基、11塩基、12塩基、13塩基、14塩基、15塩基、20塩基、25塩基、または30塩基の長さである。一実施形態では、バーコードにより、複数の試料またはライブラリーのマルチプレックス配列決定が可能になる。バーコードを使用して、分配、画分、コンパートメント、試料、空間的位置、または巨大分子(例えば、ペプチド)が由来するライブラリーを識別することができる。バーコードを使用して、多重化された配列データをデコンボリューションし、個々の試料またはライブラリーからの配列読み取りを識別する。例えば、バーコードが付されたビーズは、試料のエマルジョンおよび分配を伴う方法に、例えば、プロテオームを分配するために、有用である。
バーコードは、例えば液滴、マイクロウェル、固体支持体上の物理的領域などのコンパートメントに一意のバーコードが割り当てられたコンパートメントタグを表し得る。コンパートメントと特異的なバーコードの結び付きは、例えば、単一のバーコードが付されたビーズをコンパートメントに封入することによって、例えば、バーコードが付された液滴をコンパートメントに直接混合させるまたは添加することによって、バーコード試薬をコンパートメントに直接プリントまたは注射することによってなどの任意の数のやり方で実現することができる。コンパートメント内のバーコード試薬を使用して、コンパートメント特異的バーコードをコンパートメント内の巨大分子またはその断片に付加する。コンパートメント内へのタンパク質の分配に適用すると、バーコードを使用して、解析されるペプチドをコンパートメント内のそれらの起源であるタンパク質分子にマッピングし戻すことができる。これにより、タンパク質識別が著しく容易になる。コンパートメントバーコードを使用してタンパク質複合体を識別することもできる。
他の実施形態では、コンパートメントの集団のサブセットを表す多数のコンパートメントにそのサブセットを表す一意のバーコードを割り当てることができる。
あるいは、バーコードは、試料識別バーコードであってよい。試料バーコードは、単一反応容器中のまたは単一の固体基板または固体基板の集合(例えば、平面スライド、単一のチューブまたは容器などに含有されるビーズの集団)に固定化された試料のセットの多重化解析に有用である。多くの異なる試料由来の巨大分子を、試料特異的バーコードを有する記録タグで標識することができ、次いで、全ての試料を、固体支持体への固定化、周期的結合、および記録タグ解析の前に一緒にプールすることができる。あるいは、DNAによりコードされるライブラリー作成後まで試料を別々に保持し、DNAによりコードされるライブラリーのPCR増幅中に試料バーコードを付着させ、次いで、配列決定前に混合することができる。この手法は、豊富さのクラスが異なる分析物(例えば、タンパク質)をアッセイする場合に有用であり得る。例えば、試料を分割し、バーコードを付し、一方の部分を豊富さが低い分析物に対する結合性物質を使用して処理し、他方の部分を豊富さがより高い分析物に対する結合性物質を使用して処理することができる。特定の実施形態では、この手法は、特定のタンパク質分析物アッセイのダイナミックレンジをタンパク質分析物の標準の発現レベルの「スイートスポット」に入るように調整するのに役立つ。
ある特定の実施形態では、多数の異なる試料に由来するペプチド、ポリペプチド、またはタンパク質を、試料特異的バーコードを含有する記録タグで標識する。多試料バーコードが付されたペプチド、ポリペプチド、またはタンパク質を周期的結合反応前に混合することができる。このように、デジタル逆相タンパク質アレイ(RPPA)に対する高度に多重化された代替物が有効に創出される(Guo、Liuら、2012年、Assadi、Lamerzら、2013年、Akbani、Beckerら、2014年、CreightonおよびHuang、2015年)。デジタルRPPA様アッセイの創出には、翻訳研究、バイオマーカー検証、薬物発見、臨床、および高精度の医療における多数の適用がある。
ある特定の実施形態では、記録タグは、ユニバーサルプライミング部位、例えば、フォワードまたは5’ユニバーサルプライミング部位を含む。ユニバーサルプライミング部位は、ライブラリー増幅反応をプライミングするためおよび/または配列決定のために使用することができる核酸配列である。ユニバーサルプライミング部位としては、これだけに限定されないが、PCR増幅のためのプライミング部位、フローセル表面上の相補的なオリゴヌクレオチドとアニーリングするフローセルアダプター配列(例えば、Illumina次世代シーケンシング)、配列決定プライミング部位、またはこれらの組合せを挙げることができる。ユニバーサルプライミング部位は、約10塩基〜約60塩基であってよい。一部の実施形態では、ユニバーサルプライミング部位は、Illumina P5プライマー(5’−AATGATACGGCGACCACCGA−3’−配列番号133)またはIllumina P7プライマー(5’−CAAGCAGAAGACGGCATACGAGAT−3’−配列番号134)を含む。
ある特定の実施形態では、記録タグは、その末端、例えば3’末端にスペーサーを含む。本明細書で使用される場合、記録タグに関してスペーサー配列への言及は、その同類結合性物質に付随するスペーサー配列、またはその同類結合性物質に付随するスペーサー配列と相補的なスペーサー配列と同一のスペーサー配列を含む。記録タグ上の末端、例えば3’スペーサーにより、第1の結合サイクル中に同類結合性物質の識別情報をそのコーディングタグから記録タグに移行させることが可能になる(例えば、プライマー伸長または粘着末端ライゲーションのための相補的なスペーサー配列のアニーリングによって)。
一実施形態では、スペーサー配列は、約1〜20塩基の長さ、約2〜12塩基の長さ、または5〜10塩基の長さである。スペーサーの長さは、コーディングタグ情報を記録タグに移行させるためのプライマー伸長反応の温度および反応条件などの因子に依存し得る。
好ましい実施形態では、記録タグ内のスペーサー配列を、記録タグ内の他の領域に対して最小の相補性を有するように設計する;同様に、コーディングタグ内のスペーサー配列はコーディングタグ内の他の領域に対して最小の相補性を有するべきである。言い換えれば、記録タグおよびコーディングタグのスペーサー配列は、記録タグまたはコーディングタグ内に存在する一意の分子識別子、バーコード(例えば、コンパートメント、分配、試料、空間的位置)、ユニバーサルプライマー配列、エンコーダー配列、サイクル特異的配列などの成分に対して最小の配列相補性を有するべきである。
結合性物質スペーサーについて記載されている通り、一部の実施形態では、巨大分子のライブラリーに付随する記録タグは、共通のスペーサー配列を共有する。他の実施形態では、巨大分子のライブラリーに付随する記録タグは、それらの同類結合性物質の結合サイクル特異的スペーサー配列と相補的な結合サイクル特異的スペーサー配列を有し、これは、非連鎖状伸長記録タグを使用する場合に有用であり得る(例えば図10を参照されたい)。
伸長記録タグの収集物は、事後に連鎖状にすることができる(例えば、図10を参照されたい)。結合サイクルが完了した後、ビーズ固体支持体であって、各ビーズが平均してビーズ当たり1つまたは1つ未満の巨大分子を有し、各巨大分子が巨大分子の部位に共局在する伸長記録タグの収集物を有するビーズ固体支持体をエマルジョン中に入れる。エマルジョンは、各液滴が平均して最大で1ビーズによって占められるように形成する。任意選択のアセンブリPCR反応をエマルジョン中で実施してビーズ上の巨大分子と共局在する伸長記録タグを増幅し、それらを別の伸長記録タグの異なるサイクル特異的配列間のプライミングによって共直線的な順序でアセンブルさせる(Xiong、Pengら、2008年)。その後、エマルジョンを破壊し、アセンブルした伸長記録タグを配列決定する。
別の実施形態では、DNA記録タグは、第1の結合サイクルに特異的なユニバーサルプライミング配列(U1)、1つまたは複数のバーコード配列(BCs)、およびスペーサー配列(Sp1)で構成される。第1の結合サイクルでは、結合性物質はSp1相補的スペーサー、エンコーダーバーコード、および任意選択のサイクルバーコード、および第2のスペーサーエレメント(Sp2)で構成されるDNAコーディングタグを使用する。少なくとも2つの異なるスペーサーエレメントを使用することの有用性は、第1の結合サイクルにより潜在的に複数のDNA記録タグのうちの1つが選択され、単一のDNA記録タグが伸長し、その結果、伸長DNA記録タグの最後に新しいSp2スペーサーエレメントがもたらされることである。第2の結合サイクルおよびその後の結合サイクルでは、結合性物質は、Sp1’ではなくSp2’スペーサーだけを含有する。このように、第1のサイクルからの単一の伸長記録タグのみがその後のサイクルで伸長する。別の実施形態では、第2のサイクルおよびその後のサイクルに結合性物質特異的スペーサーを使用することができる。
一部の実施形態では、記録タグは、5’から3’の方向に、ユニバーサルフォワード(または5’)プライミング配列、UMI、およびスペーサー配列を含む。一部の実施形態では、記録タグは、5’から3’の方向に、ユニバーサルフォワード(または5’)プライミング配列、任意選択のUMI、バーコード(例えば、試料バーコード、分配バーコード、コンパートメントバーコード、空間バーコード、またはそれらの任意の組合せ)、およびスペーサー配列を含む。一部の他の実施形態では、記録タグは、5’から3’の方向に、ユニバーサルフォワード(または5’)プライミング配列、バーコード(例えば、試料バーコード、分配バーコード、コンパートメントバーコード、空間バーコード、またはそれらの任意の組合せ)、任意選択のUMI、およびスペーサー配列を含む。
改変DNAおよびPNAからUMIを生成するためにコンビナトリアル手法を使用することができる。一実施例では、UMIは、互いに直交性になるように設計された短いワード配列(4〜15mer)のセットの「化学的ライゲーション」によって構築することができる(SpiropulosおよびHeemstra、2012年)。「ワード」ポリマーの化学的ライゲーションを導くためにDNA鋳型を使用する。DNA鋳型は、単に溶液中で副成分を一緒に混合することによってコンビナトリアル鋳型構造をアセンブルすることを可能にするハイブリダイズアームを用いて構築する(例えば図12Cを参照されたい)。ある特定の実施形態では、この設計には「スペーサー」配列は存在しない。ワードスペースのサイズは、10ワードから10,000またはそれよりも多くのワードまで変動し得る。ある特定の実施形態では、ワードは、交差ハイブリダイズはしないように互いとは異なるが、それでも比較的均一なハイブリダイゼーション条件が保たれるように選択する。一実施形態では、ワードの長さは、およそ10塩基であり、サブセット内に約1000ワードを有する(これは、全10merワードスペースのたった0.1%である、約410=百万ワード)。これらのワードのセット(サブセット内に1000)を連鎖状にして、複雑さ=1000nパワーの最終的なコンビナトリアルUMIを生成することができる。連鎖状にした4つのワードに関しては、これにより、1012種の異なるエレメントのUMI多様性が生じる。これらのUMI配列を巨大分子(ペプチド、タンパク質など)に単一分子レベルで付加する。一実施形態では、UMIの多様性は、UMIを付着させる巨大分子の分子数を超える。このように、UMIにより、目的の巨大分子が一意的に識別される。コンビナトリアルワードUMIの使用により、多数塩基長のワードを読み取るために一塩基分解能は必要ないので、エラー率が高いシーケンサー(例えば、ナノポアシーケンサー、ナノギャップトンネリングシーケンシングなど)での読み取りが容易になる。コンビナトリアルワード手法は、コンパートメントタグ、分配バーコード、空間バーコード、試料バーコード、エンコーダー配列、サイクル特異的配列、およびバーコードなどの、他の同一性に関する情報価値のある記録タグまたはコーディングタグの成分を生成するためにも使用することができる。ナノポアシーケンシングに関する方法およびエラー許容性ワード(コード)を有する情報をコードするDNAは、当技術分野で公知である(例えば、それぞれ、その全体が参照により組み込まれる、Kiahら、2015年、Codes for DNA sequence profiles. IEEE International Symposium on Information Theory (ISIT);Gabrysら、2015年、Asymmetric Lee distance codes for DNA−based storage. IEEE Symposium on Information Theory (ISIT);Laureら、2016年、Coding in 2D: Using Intentional Dispersity to Enhance the Information Capacity of Sequence−Coded Polymer Barcodes. Angew. Chem. Int. Ed. doi:10.1002/anie.201605279;Yazdiら、2015年、IEEE Transactions on Molecular, Biological and Multi−Scale Communications、1巻:230〜248頁;およびYazdiら、2015年、Sci Rep、5巻:14138頁を参照されたい)。したがって、ある特定の実施形態では、本明細書に記載の実施形態のいずれかにおける伸長記録タグ、伸長コーディングタグ、またはジタグ構築物は、エラー訂正コードである識別成分(例えば、UMI、エンコーダー配列、バーコード、コンパートメントタグ、サイクル特異的配列など)で構成される。一部の実施形態では、エラー訂正コードは、Hammingコード、Lee距離コード、非対称Lee距離コード、Reed−Solomonコード、およびLevenshtein−Tenengoltsコードから選択される。ナノポアシーケンシングに関しては、電流またはイオンフラックスプロファイルおよび非対称の塩基呼び出しエラーは使用されるナノポアの型および生化学的性質に内因するものであり、上述のエラー訂正手法を使用してよりロバストなDNAコードを設計するためにこの情報を使用することができる。ロバストなDNAナノポアシーケンシングバーコードの使用に対する代替として、バーコード配列の電流またはイオンフラックスシグネチャを直接使用し(その全体が参照により組み込まれる、米国特許第7,060,507号)、それによりDNA塩基呼び出しを完全に回避し、バーコード配列を、Laszloら(2014年、Nat. Biotechnol.、32巻:829〜833頁、その全体が参照により組み込まれる)に記載されている通り、予測される電流/フラックスシグネチャにマッピングし戻すことによってすぐに識別することができる。この論文において、Laszloらは、生物学的ナノポア、MspAから、異なるワードのつながりをナノポアを通過させた時に生じる電流シグネチャ、ならびに、得られた電流シグネチャを配列のユニバースからの可能性のある電流シグネチャのin silico予測にマッピングし戻すことによってDNA鎖をマッピングおよび識別する能力について記載している(2014年、Nat. Biotechnol.、32巻:829〜833頁)。同様の概念を、DNAコードおよびナノギャップトンネル電流に基づくDNA配列決定によって生じる電気信号に適用することができる(Ohshiroら、2012年、Sci Rep、2巻:501頁)。
したがって、ある特定の実施形態では、コーディングタグ、記録タグ、またはその両方の識別成分は、一意の電流またはイオンフラックスまたは光学的シグネチャを生成することが可能であり、本明細書において提示される方法のいずれかの解析ステップは、識別成分を識別するために一意の電流またはイオンフラックスまたは光学的シグネチャを検出することを含む。一部の実施形態では、識別成分は、エンコーダー配列、バーコード、UMI、コンパートメントタグ、サイクル特異的配列、またはそれらの任意の組合せから選択される。
ある特定の実施形態では、試料中の巨大分子(例えば、タンパク質、ポリペプチド、またはペプチド)の全量または実質的な量(例えば、少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、または100%)を記録タグで標識する。巨大分子の標識は、巨大分子を固体支持体に固定化する前に行うこともでき、その後に行うこともできる。
他の実施形態では、試料中の巨大分子のサブセット(例えば、タンパク質、ポリペプチド、またはペプチド)を記録タグで標識する。特定の実施形態では、試料由来の巨大分子のサブセットに記録タグを用いて標的化(分析物特異的)標識を行う。タンパク質の標的化記録タグ標識は、相補的な標的特異的ベイト配列、例えば記録タグ内の分析物特異的バーコードとアニーリングする短い標的特異的DNA捕捉用プローブ、例えば分析物特異的バーコードと連結した標的タンパク質特異的結合性物質(例えば、抗体、アプタマーなど)を使用して実現することができる(例えば図28Aを参照されたい)。記録タグは、標的タンパク質上に存在する同類の反応性部分(例えば、クリックケミストリー標識、光親和性標識)に対する反応性部分を含む。例えば、記録タグは、アルキンで誘導体化されたタンパク質と相互作用させるためのアジド部分を含んでよい、または、記録タグは、ネイティブなタンパク質で相互作用させるためのベンゾフェノンを含んでよい、などである(例えば図28A〜Bを参照されたい)。標的タンパク質に標的タンパク質特異的結合性物質を結合させたら、記録タグおよび標的タンパク質をそれらの対応する反応性部分を介してカップリングさせる(例えば図28B〜Cを参照されたい)。標的タンパク質を記録タグで標識した後、標的タンパク質特異的結合性物質を、標的タンパク質特異的結合性物質に連結したDNA捕捉用プローブの消化によって除去することができる。例えば、DNA捕捉用プローブをウラシル塩基が含有されるように設計することができ、次いでこれを、ウラシル特異的切除試薬(例えば、USER(商標))を用いた消化の標的とし、標的タンパク質特異的結合性物質を標的タンパク質から解離させることができる。
一実施例では、標的タンパク質のセットに特異的な抗体を、相補的なベイト配列(例えば、図28の分析物バーコードBCAの)を用いて設計した記録タグとハイブリダイズするDNA捕捉用プローブ(例えば、図28の分析物バーコードBCA)で標識することができる。タンパク質の試料特異的標識は、試料特異的バーコードを含む記録タグ上の相補的なベイト配列とハイブリダイズするDNA捕捉用プローブで標識された抗体を使用することによって実現することができる。
別の例では、標的タンパク質特異的アプタマーを試料中のタンパク質のサブセットの標的化記録タグ標識のために使用する。標的特異的アプタマーを、記録タグ内の相補的なベイト配列とアニーリングするDNA捕捉用プローブに連結する。記録タグは、対応する反応性部分を有する標的タンパク質とカップリングするための反応性化学プローブまたは光反応性化学プローブ(例えば、ベンゾフェノン(BP))を含む。アプタマーがその標的タンパク質分子に結合し、記録タグが標的タンパク質の極めて近傍になり、その結果、記録タグと標的タンパク質がカップリングする。
小分子タンパク質親和性リガンドに付着させた光反応性化学プローブを使用した光親和性(PA)タンパク質標識は以前記載されている(Park, Kohら、2016年)。典型的な光反応性化学プローブとしては、以前に記載されている照射波長の下で活性化されたベンゾフェノンに基づくプローブ(反応性ジラジカル、365nm)、フェニルジアジリンに基づくプローブ(反応性炭素、365nm)、およびアジ化フェニルに基づくプローブ(反応性ニトレンフリーラジカル、260nm)が挙げられる(SmithおよびCollins、2015年)。好ましい実施形態では、タンパク質試料中の標的タンパク質を、Liらにより開示された、ベンゾフェノンで標識した記録タグ内のベイト配列を同類結合性物質(例えば、核酸アプタマー(例えば図28を参照されたい))に付着させたDNA捕捉用プローブとハイブリダイズさせる方法(Li、Liuら、2013年)を使用して試料バーコードを含む記録タグで標識する。光親和性標識されたタンパク質標的に関しては、光親和性部分により標的タンパク質ではなく抗体が自己標識される可能性があるので、抗体よりもDNA/RNAアプタマーを標的タンパク質特異的結合性物質として使用することが好ましい。対照的に、光親和性標識は、核酸に対してはタンパク質よりも効率が低く、それにより、DNA指向性化学標識または光標識についてはアプタマーがより良好なビヒクルになる。光親和性標識と同様に、Rosenら(Rosen、Kodalら、2014年、Kodal、Rosenら、2016年)記載されているものと同様に、アプタマー結合性部位の近傍にある反応性リシン(または他の部分)のDNA指向性化学標識を使用することもできる。
上述の実施形態では、標的特異的結合性物質と記録タグを連結するために、ハイブリダイゼーションに加えて他の型の連結を使用することができる(例えば図28Aを参照されたい)。例えば、図28Bに示されている通り、2つの部分を、捕捉された標的タンパク質(または他の巨大分子)が記録タグと共有結合したら、切断され、結合性物質を放出するように設計されたリンカーを使用して共有結合により連結することができる。適切なリンカーを記録タグの様々な位置、例えば、3’末端、または記録タグの5’末端に付着させたリンカー内などに付着させることができる。
F.結合性物質およびコーディングタグ
一態様では、本明細書に記載のキットは、分析物、例えば、巨大分子に結合することが可能な結合性物質を含む。結合性物質は、巨大分子の成分または特徴に結合することが可能な任意の分子であってよい(例えば、ペプチド、ポリペプチド、タンパク質、核酸、炭水化物、小分子など)。結合性物質は、天然に存在する分子であってもよく、合成的に作製された分子であってもよく、組換えによって発現させた分子であってもよい。結合性物質は、巨大分子の単一の単量体またはサブユニット(例えば、ペプチドの単一のアミノ酸)に結合し得る、または巨大分子の多数の連結したサブユニット(例えば、より長いペプチド分子のジペプチド、トリペプチド、またはより高次のペプチド)に結合し得る。
ある特定の実施形態では、結合性物質を、共有結合により結合するように設計することができる。共有結合は、正確な部分への結合が条件付けられるまたはそれが有利になるように設計することができる。例えば、NTAAおよびその同類のNTAA特異的結合性物質はそれぞれ、NTAA特異的結合性物質が同類のNTAAに結合したらカップリング反応が行われてこれら2つの間に共有結合性の連結が生じるように、反応性基を用いて修飾することができる。同類の反応性基を欠く他の位置への結合性物質の非特異的結合では共有結合による付着はもたらされない。結合性物質とその標的の間の共有結合により、非特異的に結合した結合性物質を除去するためによりストリンジェントな洗浄を使用することが可能になり、したがって、アッセイの特異度が増大する。
ある特定の実施形態では、結合性物質は、選択的結合性物質であってよい。本明細書で使用される場合、選択的結合とは、結合性物質が、特異的なリガンド(例えば、アミノ酸またはアミノ酸のクラス)に、異なるリガンド(例えば、アミノ酸またはアミノ酸のクラス)への結合と比べて優先的に結合できることを指す。選択性は、一般に、結合性物質との複合体において1つのリガンドが別のリガンドで置換される反応についての平衡定数とされる。一般には、そのような選択性は、リガンドの空間的な幾何学的形状ならびに/またはリガンドが結合性物質に結合する様式および程度、例えば、水素結合またはファンデルワールス力(非共有結合性の相互作用)によるもしくは可逆的または非可逆的な共有結合による、結合性物質への付着などに関連付けられる。選択性は、絶対的なものとは対照的に相対的なものであってよいこと、および、リガンド濃度を含めた種々の因子が選択性に影響を及ぼし得ることも理解されるべきである。したがって、一実施例では、結合性物質は、20種の標準のアミノ酸のうちの1種に選択的に結合する。非選択的結合の例では、結合性物質は、20種の標準のアミノ酸のうちの2種またはそれよりも多くに結合し得る。
本明細書に開示されているキットおよび方法の実施において、結合性物質の、巨大分子の特徴または成分に選択的に結合する能力は、結合性物質のコーディングタグ情報の巨大分子に付随する記録タグへの移行、記録タグ情報のコーディングタグへの移行、またはコーディングタグ情報および記録タグ情報のジタグ分子への移行を可能にするために十分なものであればよい。したがって、選択的とは、巨大分子が暴露される他の結合性物質に対して相対的なものであればよい。結合性物質の選択性は、特定のアミノ酸に対して絶対的なものである必要はなく、非極性もしくは非極性側鎖を有するアミノ酸、または電気的に(正にもしくは負に)荷電した側鎖を有するアミノ酸、または芳香族側鎖を有するアミノ酸などのアミノ酸のクラス、または一部の特異的なクラスまたはサイズの側鎖などに選択的なものであってよいことも理解されるべきである。
特定の実施形態では、結合性物質は、目的の巨大分子に対して高い親和性および高い選択性を有する。特に、低い解離速度で高い結合親和性を有することがコーディングタグと記録タグとの間の情報の移行に効果的である。ある特定の実施形態では、結合性物質のKdは、約50nMもしくはそれ未満、約10nMもしくはそれ未満、約5nMもしくはそれ未満、約1nMもしくはそれ未満、約0.5nMもしくはそれ未満、または約0.1nMもしくはそれ未満である。特定の実施形態では、結合性物質を巨大分子に、結合が完了するように駆動するために、結合性物質のKdの>10×、>100×、または>1000×の濃度で添加する。抗体の単一のタンパク質分子への結合カイネティクスに関する詳細な考察は、Changら(Chang, Rissin et al. 2012)に記載されている。
結合性物質の、ペプチドの小さなN末端アミノ酸(NTAA)に対する親和性を増大させるために、NTAAを、ジニトロフェノール(DNP)などの「免疫原性」ハプテンで修飾することができる。これは、DNP基をNTAAのアミン基に付着させるサンガー試薬であるジニトロフルオロベンゼン(DNFB)を使用して周期的な配列決定手法で実行することができる。商業的な抗DNP抗体は、低nM範囲(約8nM、LO−DNP−2)で親和性を有する(Bilgicer, Thomasら、2009年);そのように、DNPで(DNFBを介して)修飾されたいくつものNTAAに対して親和性が高いNTAA結合性物質を工学的に操作し、同時に特定のNTAAに対する良好な結合選択性を実現することが可能であるはずなのは当然である。別の例では、NTAAを、4−スルホニル−2−ニトロフルオロベンゼン(SNFB)を使用してスルホニルニトロフェノール(SNP)で修飾することができる。アセチル基またはアミジニル(グアニジニル)基などの代替的なNTAA修飾因子を用いて同様の親和性の増強を実現することもできる。
ある特定の実施形態では、結合性物質は、ペプチド分子のNTAA、CTAA、介在するアミノ酸、ジペプチド(2つのアミノ酸の配列)、トリペプチド(3つのアミノ酸の配列)、またはより高次のペプチドに結合し得る。一部の実施形態では、結合性物質のライブラリー内の各結合性物質は、特定のアミノ酸、例えば、20種の標準の天然に存在するアミノ酸のうちの1種に選択的に結合する。標準の、天然に存在するアミノ酸としては、アラニン(AまたはAla)、システイン(CまたはCys)、アスパラギン酸(DまたはAsp)、グルタミン酸(EまたはGlu)、フェニルアラニン(FまたはPhe)、グリシン(GまたはGly)、ヒスチジン(HまたはHis)、イソロイシン(IまたはIle)、リシン(KまたはLys)、ロイシン(LまたはLeu)、メチオニン(MまたはMet)、アスパラギン(NまたはAsn)、プロリン(PまたはPro)、グルタミン(QまたはGln)、アルギニン(RまたはArg)、セリン(SまたはSer)、トレオニン(TまたはThr)、バリン(VまたはVal)、トリプトファン(WまたはTrp)、およびチロシン(YまたはTyr)が挙げられる。
ある特定の実施形態では、結合性物質は、アミノ酸の翻訳後修飾に結合し得る。一部の実施形態では、ペプチドは、1つまたは複数の翻訳後修飾を含み、これは、同じものであっても異なるものであってもよい。ペプチドのNTAA、CTAA、介在するアミノ酸、またはこれらの組合せを翻訳後に修飾することができる。アミノ酸に対する翻訳後修飾としては、アシル化、アセチル化、アルキル化(メチル化を含む)、ビオチン化、ブチリル化、カルバミル化、カルボニル化、脱アミド化、脱イミノ化、ジフタミド形成、ジスルフィド架橋形成、エリミニル化、フラビン付着、ホルミル化、ガンマ−カルボキシル化、グルタミル化、グリシル化、グリコシル化、グリコシルホスファチジルイノシトール付加(glypiation)、ヘムC付着、ヒドロキシル化、ハイプシン形成、ヨウ素化、イソプレニル化、脂質付加、リポイル化、マロニル化、メチル化、ミリストイル化、酸化、パルミトイル化、ペグ化、ホスホパンテテイニル化、リン酸化、プレニル化、プロピオニル化、レチニリデンシッフ塩基形成、S−グルタチオン化、S−ニトロシル化、S−スルフェニル化、セレン化、サクシニル化、スルフィン化、ユビキチン化、およびC末端アミド化が挙げられる(SeoおよびLee、2004年、J. Biochem. Mol. Biol.、37巻:35〜44頁も参照されたい)。
ある特定の実施形態では、タンパク質、ポリペプチド、またはペプチドのグリコシル化の状態を検出するための結合性物質としてレクチンを使用する。レクチンは、遊離の炭水化物または糖タンパク質のグリカンエピトープを選択的に認識することができる炭水化物−結合性タンパク質である。種々のグリコシル化の状態(例えば、コア−フコース、シアル酸、N−アセチル−D−ラクトサミン、マンノース、N−アセチル−グルコサミン)を認識するレクチンの一覧は、A、AAA、AAL、ABA、ACA、ACG、ACL、AOL、ASA、BanLec、BC2L−A、BC2LCN、BPA、BPL、Calsepa、CGL2、CNL、Con、ConA、DBA、Discoidin、DSA、ECA、EEL、F17AG、Gal1、Gal1−S、Gal2、Gal3、Gal3C−S、Gal7−S、Gal9、GNA、GRFT、GS−I、GS−II、GSL−I、GSL−II、HHL、HIHA、HPA、I、II、Jacalin、LBA、LCA、LEA、LEL、Lentil、Lotus、LSL−N、LTL、MAA、MAH、MAL_I、Malectin、MOA、MPA、MPL、NPA、Orysata、PA−IIL、PA−IL、PALa、PHA−E、PHA−L、PHA−P、PHAE、PHAL、PNA、PPL、PSA、PSL1a、PTL、PTL−I、PWM、RCA120、RS−Fuc、SAMB、SBA、SJA、SNA、SNA−I、SNA−II、SSA、STL、TJA−I、TJA−II、TxLCI、UDA、UEA−I、UEA−II、VFA、VVA、WFA、WGAを含む(Zhangら、2016年、MABS、8巻:524〜535頁を参照されたい)。
ある特定の実施形態では、結合性物質は、修飾または標識されたNTAAに結合し得る。修飾または標識されたNTAAは、PITC、1−フルオロ−2,4−ジニトロベンゼン(サンガー試薬、DNFB)、ダンシルクロリド(DNS−Cl、もしくは1−ジメチルアミノナフタレン−5−スルホニルクロリド)、4−スルホニル−2−ニトロフルオロベンゼン(SNFB)、アセチル化試薬、グアニジニル化試薬、チオアシル化試薬、チオアセチル化試薬、またはチオベンジル化試薬で標識されたものであってよい。
ある特定の実施形態では、結合性物質は、アプタマー(例えば、ペプチドアプタマー、DNAアプタマー、またはRNAアプタマー)、抗体、アンチカリン、ATP依存性Clpプロテアーゼアダプタータンパク質(ClpS)、抗体結合性断片、抗体模倣物、ペプチド、ペプチド模倣物、タンパク質、またはポリヌクレオチド(例えば、DNA、RNA、ペプチド核酸(PNA)、γPNA、架橋核酸(BNA)、異種核酸(XNA)、グリセロール核酸(GNA)、またはトレオース核酸(TNA)、またはそのバリアント)であってよい。
本明細書で使用される場合、抗体(antibody)および抗体(antibodies)という用語は、広範な意味で使用され、インタクトな抗体分子、例えば、これだけに限定されないが、免疫グロブリンA、免疫グロブリンG、免疫グロブリンD、免疫グロブリンE、および免疫グロブリンMだけでなく、少なくとも1つのエピトープに免疫特異的に結合する抗体分子の任意の免疫反応性成分(複数可)も含む。抗体は、天然に存在するものであってもよく、合成的に作製されたものであってもよく、組換えによって発現させたものであってもよい。抗体は、融合タンパク質であってよい。抗体は、抗体模倣物であってよい。抗体の例としては、これだけに限定されないが、Fab断片、Fab’断片、F(ab’)2断片、単鎖抗体断片(scFv)、ミニボディ(miniantibody)、ダイアボディ(diabody)、架橋結合した抗体断片、Affibody(商標)、ナノボディ、単一ドメイン抗体、DVD−Ig分子、アルファボディ、アフィマー(affimer)、アフィチン(affitin)、サイクロチド、分子などが挙げられる。抗体工学またはタンパク質工学技法を使用して得られる免疫反応性産物もまた、明白に抗体という用語の意味の範囲内に入る。関連するプロトコールを含めた抗体および/またはタンパク質工学の詳細な説明は、他の場所の中でも、J. MaynardおよびG. Georgiou、2000年、Ann. Rev. Biomed. Eng.、2巻:339〜76頁;Antibody Engineering、R. KontermannおよびS. Dubel編、Springer Lab Manual、Springer Verlag(2001年);米国特許第5,831,012号;およびS. Paul、Antibody Engineering Protocols、Humana Press(1995年)において見いだすことができる。
抗体と同様に、ペプチドを特異的に認識する核酸およびペプチドアプタマーは、公知の方法を使用して作製することができる。アプタマーは、標的分子に、高度に特異的な、コンフォメーション依存性様式で結合し、一般には、非常に高い親和性を有するが、より低い結合親和性を有するアプタマーも所望であれば選択することができる。アプタマーは、標的間を、メチル基またはヒドロキシル基が存在するかしないかなどの非常に小さな構造的差異に基づいて区別することが示されており、また、ある特定のアプタマーは、D−鏡像異性体とL−鏡像異性体を区別することができる。薬物、金属イオン、および有機色素、ペプチド、ビオチン、ならびに、これだけに限定されないが、ストレプトアビジン、VEGF、およびウイルスタンパク質を含めたタンパク質を含めた小分子標的に結合するアプタマーが得られている。アプタマーは、ビオチン化の後、フルオレセイン標識の後、ならびにガラス表面およびマイクロスフェアに付着した際に機能活性を保持することが示されている(Jayasena、1999年、Clin Chem、45巻:1628〜50頁;Kusser、2000年、J. Biotechnol.、74巻:27〜39頁;Colas、2000年、Curr Opin Chem Biol、4巻:54〜9頁を参照されたい)。アルギニンおよびAMPに特異的に結合するアプタマーも記載されている(PatelおよびSuri、2000年、J. Biotech.、74巻:39〜60頁を参照されたい)。特定のアミノ酸に結合するオリゴヌクレオチドアプタマーがGoldら(1995年、Ann. Rev. Biochem.、64巻:763〜97頁)に開示されている。アミノ酸に結合するRNAアプタマーも記載されている(AmesおよびBreaker、2011年、RNA Biol.、8巻;82〜89頁;Mannironiら、2000年、RNA、6巻:520〜27頁;Famulok、1994年、J. Am. Chem. Soc.、116巻:1698〜1706頁)。
結合性物質は、天然に存在するまたは合成的に作製されたタンパク質を、アミノ酸配列内に1つまたは複数の変異が導入されるように遺伝子工学によって修飾して、特定の巨大分子の成分または特徴(例えば、NTAA、CTAA、または翻訳後修飾されたアミノ酸もしくはペプチド)に結合する工学的に操作されたタンパク質を生じさせることによって作出することができる。例えば、エキソペプチダーゼ(例えば、アミノペプチダーゼ、カルボキシペプチダーゼ)、エキソプロテアーゼ、変異エキソプロテアーゼ、変異アンチカリン、変異ClpS、抗体、またはtRNA合成酵素を改変して、特定のNTAAに選択的に結合する結合性物質を創出することができる。別の例では、カルボキシペプチダーゼを改変して、特定のCTAAに選択的に結合する結合性物質を創出することができる。結合性物質はまた、修飾されたNTAAもしくは修飾されたCTAA、例えば、翻訳後修飾(例えば、リン酸化NTAAまたはリン酸化CTAA)を有するもの、または標識(例えば、PTC、1−フルオロ−2,4−ジニトロベンゼン(サンガー試薬、DNFBを使用して)、ダンシルクロリド(DNS−Cl、または1−ジメチルアミノナフタレン−5−スルホニルクロリドを使用して)、またはチオアシル化試薬、チオアセチル化試薬、アセチル化試薬、アミジン化(グアニジニル化)試薬、もしくはチオベンジル化試薬を使用して)で修飾されたものを特異的に結合するように設計または改変し、利用することができる。タンパク質の定向進化のための戦略は、当技術分野で公知であり(例えば、Yuan et al., 2005、Microbiol. Mol. Biol. Rev. 69: 373-392によって概説されている)、それらとして、ファージディスプレイ、リボソームディスプレイ、mRNAディスプレイ、CISディスプレイ、CADディスプレイ、エマルジョン、細胞表面ディスプレイ法、酵母表面ディスプレイ、細菌表面ディスプレイなどが挙げられる。
一部の実施形態では、修飾されたNTAAに選択的に結合する結合性物質を利用することができる。例えば、NTAAをフェニルイソチオシアネート(PITC)と反応させてフェニルチオカルバモイル−NTAA誘導体を形成することができる。このように、結合性物質をフェニルチオカルバモイル部分のフェニル基ならびにNTAAのアルファ炭素R基のどちらにも選択的に結合するように適合させることができる。このように、PITCを使用することにより、以下に考察する通り、その後の、NTAAのエドマン分解による切断が可能になる。別の実施形態では、NTAAをサンガー試薬(DNFB)と反応させて、DNPで標識されたNTAAを生成することができる(例えば図3を参照されたい)。任意選択で、DNFBを、DNFBが高度に可溶性である1−エチル−3−メチルイミダゾリウムビス[(トリフルオロメチル)スルホニル]イミド([エミン][Tf2N])などのイオン性液体と共に使用する。このように、結合性物質を、DNPとNTAAのR基の組合せに選択的に結合するように工学的に操作することができる。DNP部分の付加により、結合性物質とNTAAの相互作用に対するより大きな「ハンドル」がもたらされ、より高い親和性相互作用が導かれるはずである。さらに別の実施形態では、結合性物質は、DNPで標識されたNTAAを認識し、それによりペプチドのアミノペプチダーゼ分解の周期的制御がもたらされるように工学的に操作されたアミノペプチダーゼであってよい。DNPで標識されたNTAAが切断されたら、新しく露出したNTAAへの結合およびその切断のためにDNFB誘導体化の別のサイクルを実施する。好ましい特定の実施形態では、アミノペプチダーゼは、単量体メタロ−プロテアーゼであり、そのようなアミノペプチダーゼは亜鉛によって活性化される(CalcagnoおよびKlein、2016年)。別の例では、結合性物質は、例えば4−スルホニル−2−ニトロフルオロベンゼン(SNFB)を使用することによってスルホニルニトロフェノール(SNP)で修飾されたNTAAに選択的に結合し得る。さらに別の実施形態では、結合性物質は、アセチル化されたまたはアミジン化されたNTAAに選択的に結合し得る。
NTAAを修飾するために使用することができる他の試薬としては、トリフルオロエチルイソチオシアネート、イソチオシアン酸アリル、およびジメチルアミノアゾベンゼンイソチオシアネートが挙げられる。
結合性物質を、修飾されたNTAAに対する高い親和性、修飾されたNTAAに対する高い特異性、またはその両方のために工学的に操作することができる。一部の実施形態では、結合性物質を、ファージディスプレイを使用した有望な親和性足場の定向進化によって開発することができる。中程度〜低い親和性の結合性物質に関しては、同時結合/エンコーディングステップを使用することによって効率的な情報の移行をもたらすことができる、あるいは、エンコーディングまたは情報書き込みステップの温度を低下させて結合性物質の解離速度を遅らせることができる。一部の実施形態では、同時結合/エンコーディングステップをエンコーディングまたは情報書き込みステップの温度の低下と組み合わせることができる。
個々のまたは小さな群の標識(ビオチン化)されたNTAAに結合し、それを切断する工学的に操作されたアミノペプチダーゼ変異体が記載されている(その全体が参照により組み込まれる、PCT公開第WO2010/065322号を参照されたい)。アミノペプチダーゼは、タンパク質またはペプチドのN末端からアミノ酸を切断する酵素である。天然のアミノペプチダーゼは、非常に限られた特異性を有し、一般的に、N末端アミノ酸を前進的に切断し、アミノ酸を次々に切断する(Kishorら、2015年、Anal. Biochem.、488巻:6〜8頁)。しかし、残基特異的アミノペプチダーゼが同定されている(Eriquezら、J. Clin. Microbiol.、1980年、12巻:667〜71頁;Wilceら、1998年、Proc. Natl. Acad. Sci. USA、95巻:3472〜3477頁;Liaoら、2004年、Prot. Sci.、13巻:1802〜10頁)。アミノペプチダーゼを、特定の部分(例えば、PTC、DNP、SNPなど)で標識された、標準のアミノ酸を表す20種の異なるNTAAに特異的に結合するように工学的に操作することができる。ペプチドのN末端の段階的分解の制御は、標識の存在下でのみ活性な(例えば、結合活性または触媒活性)、工学的に操作されたアミノペプチダーゼを使用することによって実現される。別の例では、Havranakら(米国特許公開第2014/0273004号)が、アミノアシルtRNA合成酵素(aaRS)を特異的なNTAA結合物質として工学的に操作することに関して記載している。aaRSのアミノ酸結合ポケットは、同類のアミノ酸に結合する内因性の能力を有するが、一般に、不十分な結合親和性および特異性を示す。さらに、これらの天然のアミノ酸結合物質はN末端標識を認識しない。aaRS足場の定向進化を使用して、N末端標識に関してN末端アミノ酸を認識する、親和性がより高く、特異性がより高い結合性物質を生成することができる。
別の例では、高度に選択的な工学的に操作されたClpSも文献に記載されている。Emiliらは、E.coli ClpSタンパク質のファージディスプレイによる定向進化の結果、NTAAをアスパラギン酸、アルギニン、トリプトファン、およびロイシン残基に対して選択的に結合する能力を有する4つの異なるバリアントがもたらされることを記載している(米国特許第9,566,335号、その全体が参照により組み込まれる)。一実施形態では、結合性物質の結合性部分は、天然のN末端タンパク質認識および結合に関与するアダプタータンパク質の進化的に保存されたClpSファミリーのメンバーまたはそのバリアントを含む。細菌におけるアダプタータンパク質のClpSファミリーは、Schuenemann et al., (2009), "Structural basis of N-end rulesubstrate recognition in Escherichia coli by the ClpAP adaptor proteinClpS," EMBO Reports 10 (5)、およびRoman-Hernandez et al., (2009),"Molecular basis of substrate selection by the N-end rule adaptor proteinClpS," PNAS 106 (22): 8888-93に記載されている。Guo et al., (2002), JBC 277 (48):46753-62、およびWang et al., (2008), "The molecular basis of N-end rulerecognition," Molecular Cell 32: 406-414も参照されたい。一部の実施形態では、Schuenemannらに同定されたClpS疎水性結合ポケットに対応するアミノ酸残基を、所望の選択性を有する結合性部分を生成するために修飾する。ClpSファミリーメンバーとしては、ClpS1 RPA1203、ClpS2 bll5154、ClpS2 RPA3148、ClpS BAV2091、ClpS BP2756、ClpS ECP_0896、ClpS ECSE_0939、ClpS SG1101、ClpS SCO2916、SCE19A.16c、ClpS Sputw3181_1781、ClpS VC_1143、ClpS WS0336、ClpS XCC1966、ClpS Tcr_1111、ClpS TDE_2123、ClpS ZMO1725、ClpS1 bll2636、ClpS BCAN_A1188、ClpS BamMC406_2437、ClpS Bamb_2567、ClpS BMA10247_2157、ClpS BMASAVP1_A0575、ClpS BURPS1106A_0963、ClpS Bcep1808_2597、ClpS CCNA_02552、およびそれらの断片、バリアント、変異体、ホモログ、または改変バージョンが挙げられ、これらに限定されない。
一実施形態では、結合性物質の結合性部分は、Stein et al., (2016),"Structural Basis of an N-Degron Adaptor with More StringentSpecificity," Structure 204(2): 232-242.に開示されているものなどのClpS2タンパク質またはポリペプチドまたはその断片を含む。一部の実施形態では、本明細書に開示されているClpSタンパク質またはポリペプチドは、A.tumefaciens ClpS2(例えば、配列番号198)、E.coli ClpS(例えば、配列番号199)、および/またはC.crescentus ClpS(例えば、配列番号200)などの参照ClpSタンパク質またはポリペプチドと配列同一性を共有するバリアント、変異体、ホモログ、または改変バージョンを含む。一態様では、結合性物質の結合性部分は、配列番号198と、配列番号199と、および/または配列番号200と、約10%の配列同一性、約15%の配列同一性、約20%の配列同一性、約25%の配列同一性、約30%の配列同一性、約35%の配列同一性、約40%の配列同一性、約45%の配列同一性、約50%の配列同一性、約55%の配列同一性、約60%の配列同一性、約65%の配列同一性、約70%の配列同一性、約75%の配列同一性、約80%の配列同一性、約85%の配列同一性、約90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性、または約100%の配列同一性を有するポリペプチド配列を含む。
一実施形態では、結合性部分は、UBRボックス認識配列ファミリーのメンバー、またはUBRボックス認識配列ファミリーのバリアントを含む。UBR認識ボックスは、Tasaki et al., (2009), JBC 284 (3): 1884-95に記載されている。例えば、結合性部分は、UBR1、UBR2、またはその変異体、バリアント、もしくはホモログを含んでよい。
ある特定の実施形態では、結合性物質は、結合性部分に加えて、1つまたは複数の検出可能な標識、例えば蛍光標識をさらに含む。一部の実施形態では、結合性物質は、コーディングタグなどのポリヌクレオチドを含まない。必要に応じて、結合性物質は、合成または天然の抗体を含む。一部の実施形態では、結合性物質は、アプタマーを含む。一実施形態では、結合性物質は、アダプタータンパク質のClpSファミリーの改変メンバーなどのポリペプチド、例えば、E.coli ClpS結合性ポリペプチドのバリアント、および検出可能な標識を含む。一実施形態では、検出可能な標識は、光学的に検出可能なである。一部の実施形態では、検出可能な標識は、蛍光性部分、色分けされたナノ粒子、量子ドットまたはこれらの任意の組合せを含む。一実施形態では、標識は、FluoSphere(商標)、Nile Red、フルオレセイン、ローダミン、TAMRAなどの誘導体化ローダミン色素、リン光体、ポリメタジン色素、蛍光ホスホラミダイト、TEXAS RED、緑色蛍光タンパク質、アクリジン、シアニン、シアニン5色素、シアニン3色素、5−(2’−アミノエチル)−アミノナフタレン−1−スルホン酸(EDANS)、BODIPY、120 ALEXAまたは前述のもののいずれかの誘導体もしくは改変などのコア色素分子を包含するポリスチレン色素を含む。一実施形態では、検出可能な標識は、光退色に抵抗性である一方で、特有の容易に検出可能な波長において高い信号対雑音比で多数のシグナル(例えば、光子)を生じさせる。
特定の実施形態では、アンチカリンを、標識されたNTAA(例えば、DNP、SNP、アセチル化など)に対する高い親和性および高い特異性の両方について工学的に操作する。アンチカリン足場のある特定の変形は、ベータバレル構造に起因して、単一のアミノ酸への結合に適した形状を有する。N末端アミノ酸(修飾を伴うまたは伴わない)は、この「ベータバレル」バケットに潜在的に適合し、認識され得る。工学的に操作された新規の結合活性を有する親和性が高いアンチカリンが記載されている(Skerra、2008年、FEBS J.、275巻:2677〜2683頁によって概説されている)。例えば、フルオレセインおよびジゴキシゲニンに対して親和性が高い結合性(低nM)を有するアンチカリンが工学的に操作されている(GebauerおよびSkerra、2012年)。新しい結合機能のために代替的足場を工学的に操作することについては、Bantaら(2013年、Annu. Rev. Biomed. Eng.、15巻:93〜113頁)によっても概説されている。
所与の一価の結合性物質の機能的親和性(結合活性)を、一価の結合性物質の二価またはより高次の多量体を使用することによって少なくとも1桁分だけ増大させることができる(VauquelinおよびCharlton、2013年)。結合活性とは、多数の同時に存在する非共有結合性の相互作用の蓄積された強度を指す。個々の結合相互作用は容易に解離し得る。しかし、多数の結合相互作用が同時に存在する場合、単一の結合相互作用の一過性の解離では結合性タンパク質は発散せず、結合相互作用は回復する可能性がある。結合性物質の結合活性を増大させるための代替的方法は、結合性物質に付着させるコーディングタグと巨大分子に付随させる記録タグに相補配列を含めることである。
一部の実施形態では、修飾されたC末端アミノ酸(CTAA)に選択的に結合する結合性物質を利用することができる。カルボキシペプチダーゼは、遊離のカルボキシル基を含有する末端アミノ酸を切断するプロテアーゼである。いくつものカルボキシペプチダーゼがアミノ酸の優先性を示し、例えば、カルボキシペプチダーゼBは、アルギニンおよびリシンなどの塩基性アミノ酸において優先的に切断する。カルボキシペプチダーゼを改変して、特定のアミノ酸に選択的に結合する結合性物質を創出することができる。一部の実施形態では、カルボキシペプチダーゼを、修飾部分ならびにCTAAのアルファ炭素R基のどちらにも選択的に結合するように工学的に操作することができる。したがって、工学的に操作されたカルボキシペプチダーゼは、C末端標識に関連して標準のアミノ酸を表す20種の異なるCTAAを特異的に認識し得る。ペプチドのC末端からの段階的分解の制御は、標識の存在下でのみ活性な(例えば、結合活性または触媒活性)工学的に操作されたカルボキシペプチダーゼを使用することによって実現される。一実施例では、CTAAをパラ−ニトロアニリド基または7−アミノ−4−メチルクマリニル基によって修飾することができる。
本明細書に記載の方法において使用するための結合物質を生成するために工学的に操作することができる他の潜在的な足場としては、アンチカリン、アミノ酸tRNA合成酵素(aaRS)、ClpS、Affilin(登録商標)、Adnectin(商標)、T細胞受容体、ジンクフィンガータンパク質、チオレドキシン、GST A1−1、DARPin、アフィマー、アフィチン、アルファボディ(alphabody)、アビマー(avimer)、クニッツドメインペプチド、モノボディ(monobody)、単一ドメイン抗体、EETI−II、HPSTI、細胞内抗体、リポカリン、PHD−フィンガー、V(NAR)LDTI、エビボディ(evibody)、Ig(NAR)、ノッチン、マキシボティ(maxibody)、ネオカルジノスタチン、pVIII、テンダミスタット、VLR、プロテインA足場、MTI−II、エコチン、GCN4、Im9、クニッツドメイン、ミクロボディ、PBP、トランスボディ(trans−body)、テトラネクチン(tetranectin)、WWドメイン、CBM4−2、DX−88、GFP、iMab、Ldl受容体ドメインA、Min−23、PDZ−ドメイン、トリ膵臓ポリペプチド、カリブドトキシン/10Fn3、ドメイン抗体(Dab)、a2p8アンキリンリピート、昆虫防御Aペプチド、設計されたARタンパク質、C型レクチンドメイン、ブドウ球菌ヌクレアーゼ、Src相同性ドメイン3(SH3)、またはSrc相同性ドメイン2(SH2)が挙げられる。
結合性物質を、より高い温度および穏やかな変性条件(例えば、尿素、グアニジンチオシアネート、イオン溶液の存在など)に耐えるように工学的に操作することができる。変性剤の使用は、結合性物質の直鎖ペプチドエピトープへの結合に干渉する可能性がある、表面に結合したペプチドの二次構造、例えば、α−ヘリックス構造、β−ヘアピン、β−鎖、および他のこのような構造などを低減するのに役立つ。一実施形態では、結合サイクル中にペプチド二次構造を低減するために1−エチル−3−メチルイミダゾリウムアセテート([EMIM]+[ACE])などのイオン性液体を使用する(Lesch、Heuerら、2015年)。
記載されている任意の結合性物質はまた、結合性物質に関する識別情報を含有するコーディングタグも含む。コーディングタグは、それが付随する結合性物質に関する一意の識別情報をもたらす約3塩基〜約100塩基の核酸分子である。コーディングタグは、約3〜約90塩基、約3〜約80塩基、約3〜約70塩基、約3〜約60塩基、約3塩基〜約50塩基、約3塩基〜約40塩基、約3塩基〜約30塩基、約3塩基〜約20塩基、約3塩基〜約10塩基、または約3塩基〜約8塩基を含み得る。一部の実施形態では、コーディングタグは、約3塩基、4塩基、5塩基、6塩基、7塩基、8塩基、9塩基、10塩基、11塩基、12塩基、13塩基、14塩基、15塩基、16塩基、17塩基、18塩基、19塩基、20塩基、25塩基、30塩基、35塩基、40塩基、55塩基、60塩基、65塩基、70塩基、75塩基、80塩基、85塩基、90塩基、95塩基、または100塩基の長さである。コーディングタグは、DNA、RNA、ポリヌクレオチド類似体、またはこれらの組合せで構成されるものであってよい。ポリヌクレオチド類似体は、PNA、ガンマPNA、BNA、GNA、TNA、LNA、モルホリノポリヌクレオチド、2’−O−メチルポリヌクレオチド、アルキルリボシル置換ポリヌクレオチド、ホスホロチオエートポリヌクレオチド、および7−デアザプリン類似体を含む。
コーディングタグは、付随する結合性物質に関する識別情報をもたらすエンコーダー配列を含む。エンコーダー配列は、約3塩基〜約30塩基、約3塩基〜約20塩基、約3塩基〜約10塩基、または約3塩基〜約8塩基である。一部の実施形態では、エンコーダー配列は、約3塩基、4塩基、5塩基、6塩基、7塩基、8塩基、9塩基、10塩基、11塩基、12塩基、13塩基、14塩基、15塩基、20塩基、25塩基、または30塩基の長さである。エンコーダー配列の長さにより、生成され得る一意のエンコーダー配列の数が決定される。コード配列が短いほど、生成される一意のコード配列の数が少なくなり、これは、少数の結合性物質を使用する場合に有用であり得る。巨大分子の集団を解析する場合にはより長いエンコーダー配列が望ましい可能性がある。例えば、5塩基のエンコーダー配列は式5’−NNNNN−3’(配列番号135)(式中、Nは任意の天然に存在するヌクレオチドまたは類似体であってよい)を有する。4種の天然に存在するヌクレオチドA、T、C、およびGを使用すると、5塩基の長さを有する一意のエンコーダー配列の総数は1,024になる。一部の実施形態では、例えば、塩基が全て同一であるか、少なくとも3つの連続した塩基が同一であるか、またはその両方であるエンコーダー配列を除くことにより、一意のエンコーダー配列の総数を減らすことができる。特定の実施形態では、≧50種の一意のエンコーダー配列のセットを結合性物質ライブラリーに使用する。
一部の実施形態では、コーディングタグまたは記録タグの識別成分、例えば、エンコーダー配列、バーコード、UMI、コンパートメントタグ、分配バーコード、試料バーコード、空間的領域バーコード、サイクル特異的配列またはそれらの任意の組合せを、Hamming距離、Lee距離、非対称Lee距離、Reed−Solomon、Levenshtein−Tenengolts、または同様のエラー訂正方法に供する。Hamming距離は、長さが等しい2つのつながりの間の異なる位置の数を指す。Hamming距離により、1つのつながりを他のつながりに変えるために必要な置換の最小数が測定される。Hamming距離は、妥当な距離があいたエンコーダー配列を選択することによってエラーを訂正するために使用することができる。したがって、エンコーダー配列が5塩基である例では、使用できるエンコーダー配列の数は256種の一意のエンコーダー配列に減少する(1→44エンコーダー配列のHamming距離=256種のエンコーダー配列)。別の実施形態では、エンコーダー配列、バーコード、UMI、コンパートメントタグ、サイクル特異的配列、またはそれらの任意の組合せを、周期的な脱コーディングプロセスによって容易に読み取られるように設計する(Gunderson、2004年、Genome Res.、14巻:870〜7頁)。別の実施形態では、エンコーダー配列、バーコード、UMI、コンパートメントタグ、分配バーコード、空間バーコード、試料バーコード、サイクル特異的配列、またはそれらの任意の組合せを、一塩基分解能が必要なのではなく、多数の塩基のワード(約5〜20塩基の長さ)を読み取る必要があるので、正確度の低いナノポアシーケンシングによって読み取られるように設計する。本開示の方法において使用することができる15merのエラー訂正Hammingバーコードのサブセットは配列番号1〜65に記載されており、それらの対応する逆相補的な配列は配列番号66〜130に記載されている。
一部の実施形態では、結合性物質のライブラリー内の一意の結合性物質のそれぞれが一意のエンコーダー配列を有する。例えば、20種の一意のエンコーダー配列を20種の標準のアミノ酸に結合する20種の結合性物質のライブラリーに使用することができる。修飾されたアミノ酸(例えば、翻訳後修飾されたアミノ酸)を識別するために追加的なコーディングタグ配列を使用することができる。別の例では、30種の一意のエンコーダー配列を20種の標準のアミノ酸および10種の翻訳後修飾されたアミノ酸(例えば、リン酸化アミノ酸、アセチル化アミノ酸、メチル化アミノ酸)に結合する30種の結合性物質のライブラリーに使用することができる。他の実施形態では、2種またはそれよりも多くの異なる結合性物質が同じエンコーダー配列を共有してよい。例えば、それぞれが異なる標準のアミノ酸に結合する2種の結合性物質が同じエンコーダー配列を共有してよい。
ある特定の実施形態では、コーディングタグは、一方の末端または両方の末端にスペーサー配列をさらに含む。スペーサー配列は、約1塩基〜約20塩基、約1塩基〜約10塩基、約5塩基〜約9塩基、または約4塩基〜約8塩基である。一部の実施形態では、スペーサーは、約1塩基、2塩基、3塩基、4塩基、5塩基、6塩基、7塩基、8塩基、9塩基、10塩基、11塩基、12塩基、13塩基、14塩基、15塩基または20塩基の長さである。一部の実施形態では、コーディングタグ内のスペーサーは、エンコーダー配列よりも短い、例えば、エンコーダー配列よりも少なくとも1塩基、2塩基、3塩基、4塩基、5塩基、6、塩基、7塩基、8塩基、9塩基、10塩基、11塩基、12塩基、13塩基、14塩基、15塩基、20塩基、または25塩基短い。他の実施形態では、コーディングタグ内のスペーサーは、エンコーダー配列と同じ長さである。ある特定の実施形態では、スペーサーは、結合性物質特異的であり、したがって、前の結合サイクルからのスペーサーは現行の結合サイクルにおいて適切な結合性物質からのスペーサーとのみ相互作用する。例は、両方の抗体が巨大分子に逐次的に結合する場合にのみ情報移行を可能にするスペーサー配列を含有する同類の抗体の対である。スペーサー配列は、プライマー伸長反応のためのプライマーアニーリング部位、またはライゲーション反応における副子もしくは粘着末端として使用することができる。コーディングタグ上の5’スペーサー(例えば図5A、「*Sp’」を参照されたい)は、Tmを上昇させるために、記録タグ上の3’スペーサーに対する偽性相補的塩基を任意選択で含有してよい(Lehoudら、2008年、Nucleic Acids Res.、36巻:3409〜3419頁)。
一部の実施形態では、結合性物質の集合内のコーディングタグは、アッセイに使用される共通のスペーサー配列を共有する(例えば、多数の結合サイクル方法に使用される結合性物質のライブラリー全体がそれらのコーディングタグに共通のスペーサーを有する)。別の実施形態では、コーディングタグは、特定の結合サイクルを識別する結合サイクルタグで構成される。他の実施形態では、結合性物質のライブラリー内のコーディングタグは、結合サイクル特異的スペーサー配列を有する。一部の実施形態では、コーディングタグは、結合サイクル特異的スペーサー配列を1つ含む。例えば、第1の結合サイクルで使用される結合性物質に対するコーディングタグは「サイクル1」特異的スペーサー配列を含み、第2の結合サイクルで使用される結合性物質に対するコーディングタグは「サイクル2」特異的スペーサー配列を含み、「n」回の結合サイクルまで同様である。さらなる実施形態では、第1の結合サイクルで使用される結合性物質に対するコーディングタグは「サイクル1」特異的スペーサー配列および「サイクル2」特異的スペーサー配列を含み、第2の結合サイクルで使用される結合性物質に対するコーディングタグは「サイクル2」特異的スペーサー配列および「サイクル3」特異的スペーサー配列を含み、「n」回の結合サイクルまで同様である。この実施形態は、結合サイクルが完了した後の非連鎖状伸長記録タグのPCRアセンブリに有用である(例えば図10を参照されたい)。一部の実施形態では、スペーサー配列は、プライマー伸長反応または粘着末端ライゲーション反応を開始するために記録タグまたは伸長記録タグ内の相補的なスペーサー配列とアニーリングするのに十分な数の塩基を含む。
記録タグの集団が巨大分子に付随する場合、サイクル特異的スペーサー配列を使用してコーディングタグの情報を単一の記録タグ上に連鎖状にすることもできる。第1の結合サイクルでコーディングタグからランダムに選択された記録タグに情報を移行させ、その後の結合サイクルではサイクル依存性スペーサー配列を使用して伸長記録タグのみをプライミングすることができる。より詳細には、第1の結合サイクルで使用される結合性物質に対するコーディングタグは「サイクル1」特異的スペーサー配列および「サイクル2」特異的スペーサー配列を含み、第2の結合サイクルで使用される結合性物質に対するコーディングタグは「サイクル2」特異的スペーサー配列および「サイクル3」特異的スペーサー配列を含み、「n」回の結合サイクルまで同様である。第1の結合サイクルからの結合性物質のコーディングタグは、相補的なサイクル1特異的スペーサー配列を介して記録タグとアニーリングすることが可能である。コーディングタグ情報が記録タグに移行したら、結合サイクル1の最後に、サイクル2特異的スペーサー配列が伸長記録タグの3’末端に位置する。第2の結合サイクルからの結合性物質のコーディングタグは、相補的なサイクル2特異的スペーサー配列を介して伸長記録タグとアニーリングすることが可能である。コーディングタグ情報が伸長記録タグに移行したら、結合サイクル2の最後に、サイクル3特異的スペーサー配列が伸長記録タグの3’末端に位置し、「n」回の結合サイクルまで同様である。この実施形態は、多数の結合サイクルの中で特定の結合サイクルにおける結合情報の移行が前の結合サイクルを経た(伸長)記録タグ上でのみ起こるものとする。しかし、時には、結合性物質は同類の巨大分子に結合し損ねる。「追跡」ステップとして各結合サイクル後に結合サイクル特異的スペーサーを含むオリゴヌクレオチドを使用して、結合サイクルの事象が失敗したとしても結合サイクルを同期させたままにすることができる。例えば、同類結合性物質が結合サイクル1の間に巨大分子に結合し損ねた場合、結合サイクル1後に、サイクル1特異的スペーサー、サイクル2特異的スペーサーの両方、および「ヌル」エンコーダー配列を含むオリゴヌクレオチドを使用する追跡ステップを追加する。「ヌル」エンコーダー配列は、エンコーダー配列、または、例えば、「ヌル」結合サイクルを正に識別する特異的なバーコードが存在しないことであってよい。「ヌル」オリゴヌクレオチドは、記録タグとサイクル1特異的スペーサーを介してアニーリングすることが可能であり、サイクル2特異的スペーサーが記録タグに移行される。したがって、結合サイクル1事象の失敗にもかかわらず、結合サイクル2からの結合性物質が伸長記録タグとサイクル2特異的スペーサーを介してアニーリングすることが可能である。「ヌル」オリゴヌクレオチドにより、伸長記録タグ内で結合サイクル1に結合事象失敗の印が付けられる。
好ましい実施形態では、結合サイクル特異的エンコーダー配列をコーディングタグに使用する。結合サイクル特異的エンコーダー配列は、完全に一意の分析物(例えば、NTAA)−結合サイクルエンコーダーバーコードを使用することによって、または分析物(例えば、NTAA)エンコーダー配列とサイクル特異的バーコードを接合させた組合せ使用によってのいずれかで実現することができる(例えば図35を参照されたい)。組合せ手法を使用することの有利な点は、設計する必要がある総バーコードがより少なくなることである。10サイクルにわたって使用する20種の分析物結合性物質のセットに対しては、20種の分析物エンコーダー配列バーコードおよび10種の結合サイクル特異的バーコードのみを設計する必要がある。対照的に、結合サイクルが結合性物質エンコーダー配列に直接埋め込まれる場合には、合計200種の独立したエンコーダーバーコードを設計する必要があり得る。結合サイクル情報をエンコーダー配列に直接埋め込むことの利点は、ナノポア読み取りにエラー訂正バーコードを使用する場合にコーディングタグの全長を最小化することができることである。エラー耐性バーコードの使用により、配列決定プラットフォームおよびよりエラーが生じやすい手法を使用して高度に正確なバーコード識別が可能になるが、迅速な解析スピード、低費用、および/またはよりポータブルな器械使用などの他の利点がある。そのような例の1つは、ナノポアに基づく配列決定読み取りである。
一部の実施形態では、コーディングタグは、結合性物質の近位にある第2の(3’)スペーサー配列内の切断可能なまたはニッキング可能なDNA鎖を含む(例えば図32を参照されたい)。例えば、3’スペーサーは、ウラシル特異的切除試薬(USER)によってニッキングすることができる1つまたは複数のウラシル塩基を有してよい。USERにより、ウラシルの位置に一ヌクレオチドギャップが生成される。別の例では、3’スペーサーは、2重鎖の一方の鎖のみを加水分解するニッキングエンドヌクレアーゼの認識配列を含んでよい。例えば、3’スペーサー配列を切断またはニッキングするために使用する酵素は、一方のDNA鎖のみ(コーディングタグの3’スペーサー)に作用し、したがって、(伸長)記録タグに属する2重鎖内の他方の鎖はインタクトなまま残される。これらの実施形態は、プライマー伸長が起こった後に結合性物質を(伸長)記録タグから変性によらずに除去し、その後の結合サイクルに利用可能な一本鎖DNAスペーサー配列を伸長記録タグ上に残すことが可能になるので、タンパク質をそれらのネイティブなコンフォメーションで解析するアッセイにおいて特に有用である。
コーディングタグは、パリンドローム配列を含有するように設計することもできる。コーディングタグにパリンドローム配列を含めることにより、新生の成長している伸長記録タグが、コーディングタグ情報が移行するに従ってそれ自体でフォールディングすることが可能になる。伸長記録タグはより緻密な構造にフォールディングし、望ましくない分子間結合およびプライマー伸長事象が有効に減少する。
一部の実施形態では、コーディングタグは、同じ分析物を認識する結合性物質を用いて以前に伸長した記録タグ上でのみプライミング伸長することが可能な分析物特異的スペーサーを含む。伸長記録タグは、分析物特異的スペーサーおよびエンコーダー配列を含むコーディングタグを使用して一連の結合事象から組み立てることができる。一実施形態では、第1の結合事象では、一般的な3’スペーサープライマー配列および次の結合サイクルで使用するための5’末端の分析物特異的スペーサー配列で構成されるコーディングタグを伴う結合性物質を使用する;次いで、その後の結合サイクルでは、コードされる分析物特異的3’スペーサー配列を伴う結合性物質を使用する。この設計により、正確な一連の同類結合事象のみから創出される増幅可能なライブラリーエレメントがもたらされる。オフターゲットのおよび交差反応性結合相互作用により、増幅可能でない伸長記録タグが導かれる。一実施例では、同類結合性物質と特定の巨大分子分析物の対を2つの結合サイクルに使用して分析物を識別する。第1の同類結合性物質は、一般的な記録タグのスペーサー配列上でのプライミング伸長のための一般的なスペーサー3’配列および次の結合サイクルで使用される5’末端のコードされる分析物特異的スペーサーで構成されるコーディングタグを含有する。対応する同類結合性物質対に関しては、第2の結合性物質の3’分析物特異的スペーサーと第1の結合性物質の5’分析物特異的スペーサーを対応させる。このように、結合性物質の同類の対の正確な結合によってのみ、増幅可能な伸長記録タグがもたらされる。交差反応性結合性物質は記録タグ上でプライミング伸長することができず、増幅可能な伸長記録タグ産物は生成しない。この手法では、本明細書に開示されている方法の特異性が著しく増強される。同じ原理を、3つの結合サイクルを使用するトリプレット結合性物質セットに適用することができる。第1の結合サイクルでは、記録タグ上の一般的な3’Sp配列と結合性物質コーディングタグ上の一般的なスペーサーを相互作用させる。プライマー伸長により、分析物特異的5’スペーサーを含めたコーディングタグ情報を記録タグに移行させる。その後の結合サイクルでは、結合性物質のコーディングタグ上の分析物特異的スペーサーを使用する。
ある特定の実施形態では、コーディングタグは、コーディングタグが連結した結合性物質についての一意の分子識別子をさらに含んでよい。結合性物質についてのUMIは、配列決定読み取りのために伸長コーディングタグまたはジタグ分子を利用し、エンコーダー配列と組み合わせて、結合性物質の同一性および巨大分子に対する一意の結合事象の数に関する情報をもたらす実施形態において有用であり得る。
別の実施形態では、コーディングタグは、ランダム化配列(Nのセット、ここで、N=A、C、G、Tからのランダムな選択、またはワードのセットからのランダムな選択である)を含む。一連の「n」回の結合サイクルおよびコーディングタグ情報の(伸長)記録タグへの移行の後、最終的な伸長記録タグ産物は、一連のこれらのランダム化配列で構成され、これは、最終的な伸長記録タグについての「複合性の」一意の分子識別子(UMI)を集合的に形成する。例えば、各コーディングタグが(NN)配列(4*4=16の可能性のある配列)を含有する場合、10回の配列決定サイクル後に、分布した2merの組合せセットが10種形成され、可能性のある伸長記録タグ産物についての複合性のUMI配列1610〜1012種という総多様性が創出される。ペプチド配列決定実験で約109個の分子を使用するとすれば、この多様性は、配列決定実験のための有効なUMIのセットを創出するために十分すぎるほどである。多様性の増大は、単にコーディングタグ内により長いランダム化領域(NNN、NNNNなど)を使用することによって実現することができる。
コーディングタグは、3’スペーサー配列の3’末端に組み入れられたターミネーターヌクレオチドを含んでよい。結合性物質が巨大分子およびそれらの対応するコーディングタグに結合し、記録タグが相補的なスペーサー配列を介してアニーリングした後、情報をコーディングタグから記録タグに移行させるため、または情報を記録タグからコーディングタグに移行させるためにプライマー伸長することが可能になる。コーディングタグの3’末端にターミネーターヌクレオチドを付加することにより、記録タグ情報のコーディングタグへの移行が防止される。伸長コーディングタグの生成を伴う本明細書に記載の実施形態に関しては、例えば、コーディングタグ情報の記録タグへの移行を防止するために、記録タグの3’末端にターミネーターヌクレオチドを含める場合があることが理解される。
コーディングタグは、一本鎖分子であってもよく、二本鎖分子であってもよく、部分的に二本鎖であってもよい。コーディングタグは、平滑末端、突出末端、またはその一方を含んでよい。一部の実施形態では、コーディングタグは、部分的に二本鎖であり、それにより、コーディングタグが成長している伸長記録タグの内部のエンコーダーおよびスペーサー配列にアニーリングすることが防止される。
コーディングタグは、結合性物質に、共有結合性の相互作用および非共有結合性の相互作用を含めた当技術分野で公知の任意の手段を使用して直接または間接的に接合される。一部の実施形態では、コーディングタグを結合性物質に酵素的にまたは化学的に接合することができる。一部の実施形態では、コーディングタグを結合性物質にライゲーションによって接合することができる。他の実施形態では、コーディングタグを結合性物質に親和性結合対(例えば、ビオチンおよびストレプトアビジン)を介して接合する。
一部の実施形態では、結合性物質とコーディングタグをSpyCatcher−SpyTag相互作用によって接合する(例えば図43Bを参照されたい)。SpyTagペプチドは、SpyCatcherタンパク質と自発的なイソペプチド連結によって不可逆的な共有結合を形成し、それにより、力および厳しい条件に対して抵抗性であるペプチド相互作用を創出するための遺伝子によりコードされたやり方がもたらされる(Zakeriら、2012年、Proc. Natl. Acad. Sci.、109巻:E690〜697頁;Liら、2014年、J. Mol. Biol.、426巻:309〜317頁)。結合性物質を、SpyCatcherタンパク質を含む融合タンパク質として発現させることができる。一部の実施形態では、SpyCatcherタンパク質を結合性物質のN末端またはC末端に付加する。SpyTagペプチドとコーディングタグを標準のコンジュゲーション化学を使用してカップリングすることができる(Bioconjugate Techniques、G. T. Hermanson、Academic Press(2013年))。
他の実施形態では、結合性物質とコーディングタグをSnoopTag−SnoopCatcherペプチド−タンパク質相互作用によって接合する。SnoopTagペプチドは、SnoopCatcherタンパク質とイソペプチド結合を形成する(Veggianiら、Proc. Natl. Acad. Sci. USA、2016年、113巻:1202〜1207頁)。結合性物質を、SnoopCatcherタンパク質を含む融合タンパク質として発現させることができる。一部の実施形態では、SnoopCatcherタンパク質を結合性物質のN末端またはC末端に付加する。SnoopTagペプチドとコーディングタグを標準のコンジュゲーション化学を使用してカップリングすることができる。
さらに他の実施形態では、結合性物質とコーディングタグをHaloTag(登録商標)タンパク質融合タグとその化学的リガンドによって接合する。HaloTagは、合成リガンド(HaloTagリガンド)と共有結合するように設計された改変ハロアルカンデハロゲナーゼである(Losら、2008年、ACS Chem. Biol.、3巻:373〜382頁)。合成リガンドは、種々の有用な分子に付着したクロロアルカンリンカーを含む。HaloTagとクロロアルカンリンカーの間に、高度に特異的であり、生理的条件下で迅速に起こり、基本的に不可逆的である共有結合が形成される。
ある特定の実施形態では、巨大分子を非同類結合性物質とも接触させる。本明細書で使用される場合、非同類結合性物質とは、考察されている特定の巨大分子とは異なる巨大分子の特徴または成分に対して選択的である結合性物質を指す。例えば、n NTAAがフェニルアラニンであり、ペプチドを、それぞれフェニルアラニン、チロシン、およびアスパラギンに対して選択的な3種の結合性物質と接触させる場合、フェニルアラニンに対して選択的な結合性物質がn番目のNTAA(すなわち、フェニルアラニン)に選択的に結合することが可能な第1の結合性物質ということになり、一方、他の2種の結合性物質はそのペプチドに対して非同類結合性物質ということになる(フェニルアラニン以外のNTAAに対して選択的であるので)。しかし、チロシン結合性物質およびアスパラギン結合性物質は、試料中の他のペプチドに対して同類結合性物質になり得る。次いで、n番目のNTAA(フェニルアラニン)をペプチドから切断し、それにより、ペプチドの(n−1)番目のアミノ酸を(n−1)番目のNTAA(例えば、チロシン)に変換し、次いで、ペプチドを同じ3種の結合性物質と接触させると、チロシンに対して選択的な結合性物質が、(n−1)番目のNTAA(すなわち、チロシン)に選択的に結合することが可能な第2の結合性物質ということになり、一方、他の2種の結合性物質は非同類結合性物質ということになる(チロシン以外のNTAAに対して選択的であるので)。
したがって、作用物質が結合性物質であるか非同類結合性物質であるかは、結合のために現在利用可能な特定の巨大分子の特徴または成分の性質に依存することが理解されるべきである。また、多数の巨大分子を多重化反応において解析する場合、1つの巨大分子に対する結合性物質は別の巨大分子に対しては非同類結合性物質であり得、逆もまた同じである。したがって、結合性物質に関する以下の説明は本明細書に記載されているあらゆる型の結合性物質(すなわち、同類結合性物質および非同類結合性物質のどちらにも)に適用可能であることが理解されるべきである。
G.コーディングタグ情報の記録タグへの周期的移行のための方法およびキット
本明細書に記載のキットおよび方法では、結合性物質が巨大分子に結合したら、その連結したコーディングタグの識別情報を巨大分子に付随する記録タグに移行させ、それにより、「伸長記録タグ」を生成する。伸長記録タグは、実施された各結合サイクルを表す、結合性物質のコーディングタグからの情報を含み得る。しかし、伸長記録タグはまた、例えば、結合性物質が巨大分子に結合し損ねたことが原因で、コーディングタグが見落とされた、損傷を受けた、または欠陥があることが原因で、プライマー伸長反応が失敗したことが原因で、「飛ばされた」結合サイクルを経る可能性もある。結合事象が起こったとしても、例えば、コーディングタグが損傷を受けたまたは欠陥があることが原因で、プライマー伸長反応にエラーが導入されたことが原因で、コーディングタグから記録タグへの情報の移行が不完全なであるまたは100%未満の正確さになる可能性がある)。したがって、伸長記録タグは、その付随する巨大分子において起こった結合事象の100%、または最大で95%、90%、85%、80%、75%、70%、65%、60%、65%、55%、50%、45%、40%、35%、30%を表す可能性がある。さらに、伸長記録タグ中に存在するコーディングタグ情報は、対応するコーディングタグに対して少なくとも30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、または100%の同一性を有する可能性がある。
ある特定の実施形態では、伸長記録タグは、多数の連続的な結合事象を表す、多数のコーディングタグからの情報を含む可能性がある。これらの実施形態では、単一の連鎖状の伸長記録タグは単一の巨大分子を表す可能性がある(例えば図2Aを参照されたい)。本明細書で言及される通り、コーディングタグ情報の記録タグへの移行は、多数の連続的な結合事象を伴う方法において起こると思われる伸長記録タグへの移行も含む。
ある特定の実施形態では、結合事象情報をコーディングタグから記録タグに周期的に移行させる(例えば図2Aおよび2Cを参照されたい)。交差反応性結合事象を、配列決定後に、少なくとも2つの異なるコーディングタグを要求し、2つまたはそれよりも多くの独立した結合事象を識別し、同じ結合性物質のクラス(特定のタンパク質と同類)にマッピングすることにより、情報科学的にフィルターにかけて除去することができる。任意選択の試料バーコードまたはコンパートメントバーコードを記録タグに含めることができ、同じく任意選択のUMI配列も含めることができる。コーディングタグは、任意選択のUMI配列をエンコーダーおよびスペーサー配列と一緒に含有してもよい。ユニバーサルプライミング配列(U1およびU2)も増幅およびNGS配列決定のために伸長記録タグに含めることもできる(例えば図2Aを参照されたい)。
特定の結合性物質に付随するコーディングタグ情報を記録タグに種々の方法を使用して移行させることができる。ある特定の実施形態では、コーディングタグの情報を記録タグに、プライマー伸長によって移行させる(Chan、McGregorら、2015年)。記録タグまたは伸長記録タグの3’末端のスペーサー配列をコーディングタグの3’末端の相補的なスペーサー配列とアニーリングさせ、ポリメラーゼ(例えば、鎖置換ポリメラーゼ)により、アニーリングしたコーディングタグを鋳型として使用して記録タグ配列を伸長させる(例えば図5〜7を参照されたい)。一部の実施形態では、コーディングタグと伸長記録タグに存在する内部のエンコーダーおよびスペーサー配列のハイブリダイゼーションを防止するために、コーディングタグエンコーダー配列および5’スペーサーと相補的なオリゴヌクレオチドをコーディングタグとプレアニーリングさせることができる。例えば、一本鎖のままのコーディングタグ上の3’末端スペーサーを記録タグ上の末端3’スペーサーと結合させる。他の実施形態では、コーディングタグと内部の部位とのアニーリングを防止するために、新生記録タグを一本鎖結合性タンパク質でコーティングすることができる。あるいは、完全に二本鎖のコーディングタグへの3’末端の侵入を容易にするために、新生記録タグをRecA(またはuvsXなどの関連する相同体)でコーティングすることもできる(Bellら、2012年、Nature、491巻:274〜278頁)。この形態により、二本鎖のコーディングタグが内部の記録タグエレメントと相互作用することが防止されるが、それでも、伸長記録タグのRecAコーティングされた3’尾部による鎖の侵入は起こりやすい(Bellら、2015年、Elife、4巻:e08646頁)。一本鎖結合性タンパク質が存在することにより、鎖置換反応が容易になり得る。
好ましい実施形態では、プライマー伸長のために使用されるDNAポリメラーゼは、鎖置換活性を有し、3’−5エキソヌクレアーゼ活性が限られているまたはそれを欠く。そのようなポリメラーゼの多数の例のいくつかとして、クレノウexo−(DNA Pol 1のクレノウ断片)、T4 DNAポリメラーゼexo−、T7 DNAポリメラーゼexo(シーケナーゼ2.0)、Pfu exo−、Vent exo−、Deep Vent exo−、Bst DNAポリメラーゼ大断片exo−、Bca Pol、9°N Pol、およびPhi29 Pol exo−が挙げられる。好ましい実施形態では、DNAポリメラーゼは、室温および最大45℃までで活性である。別の実施形態では、「ウォームスタート」バージョンの好熱性ポリメラーゼを使用し、したがって、ポリメラーゼを約40℃〜50℃で活性化し、使用する。例示的なウォームスタートポリメラーゼは、Bst 2.0ウォームスタートDNAポリメラーゼ(New England Biolabs)である。
鎖置換複製に有用な添加剤としては、E.coliのSSBタンパク質、ファージT4遺伝子32産物、ファージT7遺伝子2.5タンパク質、ファージPf3 SSB、複製タンパク質A RPA32およびRPA14サブユニット(Wold、1997年)などの、細菌起源、ウイルス起源、または真核生物起源のいくつもの一本鎖DNA結合性タンパク質(SSBタンパク質)のいずれか;アデノウイルスDNA結合性タンパク質、単純ヘルペスタンパク質ICP8、BMRF1ポリメラーゼアクセサリーサブユニット、ヘルペスウイルスUL29 SSB様タンパク質などの他のDNA結合性タンパク質;ファージT7ヘリカーゼ/プライマーゼ、ファージT4遺伝子41ヘリカーゼ、E.coli Repヘリカーゼ、E.coli recBCDヘリカーゼ、recA、E.coliおよび真核生物トポイソメラーゼ(Champoux、2001年)などの、DNA複製に関与することが公知のいくつもの複製複合体タンパク質のいずれかが挙げられる。
記録タグの末端スペーサー配列により伸長自己伸長がプライミングされる場合などのミスプライミングまたは自己プライミング事象は、一本鎖結合性タンパク質(T4遺伝子32、E.coli SSBなど)、DMSO(1〜10%)、ホルムアミド(1〜10%)、BSA(10〜100μg/ml)、TMACl(1〜5mM)、硫酸アンモニウム(10〜50mM)、ベタイン(1〜3M)、グリセロール(5〜40%)、またはエチレングリコール(5〜40%)をプライマー伸長反応に含めることによって最小化することができる。
大多数のA型ポリメラーゼは、3’エキソヌクレアーゼ活性を欠き(内因的または工学的除去)、例えば、クレノウexo−、T7 DNAポリメラーゼexo−(シーケナーゼ2.0)、およびTaqポリメラーゼは、2重鎖増幅産物の3’平滑末端へのヌクレオチド、例えばアデノシン塩基(より低い程度でG塩基、配列の状況に依存する)の非鋳型付加を触媒する。Taqポリメラーゼに関しては、3’ピリミジン(C>T)により、非鋳型アデノシン付加が最小限になり、一方、3’プリンヌクレオチド(G>A)では非鋳型アデノシン付加が有利になる。プライマー伸長のためにTaqポリメラーゼを使用する実施形態では、コーディングタグにおいて、結合性物質から遠位のスペーサー配列と隣接するバーコード配列(例えば、エンコーダー配列またはサイクル特異的配列)との間にチミジン塩基を置くことにより、記録タグのスペーサー配列の3’末端上の非鋳型アデノシンヌクレオチドの散在的包含に適応させる(例えば図43A)。このように、伸長記録タグ(非鋳型アデノシン塩基を有するまたは有さない)は、コーディングタグとアニーリングし、プライマー伸長を受けることが可能である。
あるいは、特にO−へリックス領域における1つまたは複数の点変異によって非鋳型ターミナルトランスフェラーゼ活性を著しく低下させた変異ポリメラーゼ(中温性または好熱性)を使用することにより、非鋳型塩基の付加を減少させることができる(例えば米国特許第7,501,237号を参照されたい)(Yang、Astatkeら、2002年)。3’エキソヌクレアーゼが欠損しており、鎖置換能を有するPfu exo−も非鋳型ターミナルトランスフェラーゼ活性を有さない。
別の実施形態では、最適なポリメラーゼ伸長緩衝液は、40〜120mMの、例えばTris−酢酸、Tris−HCl、HEPESなどの緩衝剤、pH6〜9で構成される。
伸長記録タグの末端スペーサー配列と伸長記録タグの内部の領域の自己アニーリングによって開始される自己プライミング/ミスプライミング事象は、記録/伸長記録タグに偽相補的塩基を含めることによって最小化することができる(Lahoud、Timoshchukら、2008年)、(Hoshika、Chenら、2010年)。偽相補的塩基は、化学修飾が存在することに起因する互いとの2重鎖の形成に対する有意に低下したハイブリダイゼーション親和性を示す。しかし、多くの偽相補的修飾塩基は、天然のDNAまたはRNA配列と強い塩基対を形成し得る。ある特定の実施形態では、コーディングタグスペーサー配列は、多数のA塩基およびT塩基で構成され、ホスホラミダイトオリゴヌクレオチド合成を使用して市販の偽相補的塩基2−アミノアデニンおよび2−チオチミンを記録タグに組み入れる。追加的な偽相補的塩基を、プライマー伸長中に、偽相補的ヌクレオチドを反応に添加することによって伸長記録タグに組み入れることができる(Gamper、Ararら、2006年)。
溶液中のコーディングタグで標識された結合性物質と固定化されたタンパク質の記録タグとの非特異的な相互作用を最小限にするために、記録タグスペーサー配列と相補的な競合剤オリゴヌクレオチド(遮断オリゴヌクレオチドとも称される)を結合反応に添加して、非特異的な相互作用を最小限にする(例えば図32A〜Dを参照されたい)。遮断オリゴヌクレオチドは、比較的短いものである。プライマー伸長前に過剰な競合オリゴヌクレオチドを結合反応から洗い流し、これにより、特にわずかな温度の上昇(例えば、30〜50℃)に曝露させると、アニーリングした競合オリゴヌクレオチドが記録タグから有効に解離する。遮断オリゴヌクレオチドは、プライマー伸長を防止するために3’末端にターミネーターヌクレオチドを含んでよい。
ある特定の実施形態では、記録タグ上のスペーサー配列とコーディングタグ上の相補的なスペーサー配列のアニーリングは、プライマー伸長反応条件下(すなわち、アニーリングTmが反応温度と同様である)で準安定である。これにより、コーディングタグのスペーサー配列で記録タグのスペーサー配列とアニーリングした任意の遮断オリゴヌクレオチドを置き換えることが可能になる。
特定の結合性物質に付随するコーディングタグ情報は、ライゲーションによって記録タグに移行させることもできる(例えば、図6および図7を参照されたい)。ライゲーションは、平滑末端ライゲーションであってもよく、粘着末端ライゲーションであってもよい。ライゲーションは、酵素的ライゲーション反応であってよい。リガーゼの例としては、これだけに限定されないが、T4 DNAリガーゼ、T7 DNAリガーゼ、T3 DNAリガーゼ、Taq DNAリガーゼ、E.coli DNAリガーゼ、9°N DNAリガーゼ、Electroligase(登録商標)が挙げられる。あるいは、ライゲーションは、化学的ライゲーション反応であってよい(例えば、図7を参照されたい)。図において、スペーサーを欠くライゲーションは、「記録ヘルパー」配列とコーディングタグ上のアームのハイブリダイゼーションを使用することによって実現される。アニーリングした相補配列を、標準の化学的ライゲーションまたは「クリックケミストリー」を使用して化学的にライゲーションする(Gunderson, Huang et al. 1998、Peng, Li et al. 2010, El-Sagheer,Cheong et al. 2011、El-Sagheer, Sanzone et al. 2011、Sharma, Kent et al. 2012、Roloffand Seitz 2013、Litovchick, Clark et al. 2014、Roloff, Ficht et al. 2014)。一態様では、「スペーサーを欠く」ライゲーションは、例えば図46に示されている通り、CircLigase(商標)IまたはII(例えば、Lucigenからのもの)などのssDNAリガーゼを使用して実現することもできる。「スペーサーを欠く」ライゲーションの使用は、ライブラリーエレメントの全長さを著しく低減すること、および/またはライブラリー増幅中の鋳型スイッチングを低減もしくは最小限にすることにおいて有利である。
一実施形態では、キットは、一本鎖DNA(ssDNA)リガーゼを含む。ssDNAリガーゼは、相補配列の不在下でssDNAの末端とライゲーションすることが可能である。例えば、CircLigase(商標)ssDNAリガーゼおよびCircLigase(商標)II ssDNAリガーゼはどちらも、5’−リン酸および3’−ヒドロキシル基を有するssDNA鋳型の分子内ライゲーション(すなわち、環状化)触媒させるために一般に使用される熱安定性リガーゼである。相補DNA配列上で互いに隣接してアニーリングするDNA末端をライゲーションさせるT4 DNAリガーゼおよびAmpligase(登録商標)DNAリガーゼとは対照的に、ssDNAリガーゼは、ssDNAの末端を相補配列の不在下でライゲーションさせる。したがって、酵素は、直鎖状ssDNAから環状ssDN分子を作出するために有用である。環状ssDNA分子は、ローリングサークル複製またはローリングサークル転写のための基質として使用することができる。CircLigase(商標)酵素は、ssDNAに対する活性に加えて、3’−ヒドロキシルリボヌクレオチドおよび5’−リン酸化リボヌクレオチドまたはデオキシリボヌクレオチドを有する一本鎖核酸のライゲーションに関しても活性を有する。
CircLigase(商標)ssDNAリガーゼまたはCircLigase(商標)II ssDNAリガーゼのいずれも本開示において使用することができる。2つの酵素は、CircLigase(商標)IはCircLigase(商標)IIよりもアデニル化がはるかに少なく、また、最良の活性のためにATPを必要とするという点で異なる。CircLigase(商標)Iは、ATPの存在下でssDNAを再環状化させる。CircLigase(商標)IIは、ほぼ100%アデニル化されており、したがって、反応緩衝剤にATPを添加する必要がない。CircLigase(商標)IIは化学量論反応として働き、この酵素が酵素活性部位内のアデニル化されているオリゴの5’末端を結合し、次いで、オリゴをライゲーションさせ、停止する。反応はATPを含有しないので、CircLigase(商標)IIは1:1の酵素:オリゴ構成で働く。特定の実施形態では、本明細書のキットは、バクテリオファージTS2126 RNAリガーゼ(例えば、CircLigase(商標)およびCircLigase II(商標))などのThermusバクテリオファージRNAリガーゼ、またはMethanobacterium thermoautotrophicum RNAリガーゼ1などの古細菌RNAリガーゼを含む。前述の実施形態のいずれかでは、キットは、T4 RNAリガーゼ、例えば、T4 RNAリガーゼ2、T4 RNAリガーゼ2、切断型、T4 RNAリガーゼ2、切断型KQ、またはT4 RNAリガーゼ2、切断型K227QなどのRNAリガーゼを含んでよい。
別の実施形態では、PNAの移行は、公開された技法を使用した化学的ライゲーションで実現することができる。PNAの構造は、5’N末端アミン基および非反応性3’C末端アミドを有するようなものである。PNAの化学的ライゲーションには、末端を化学的に活性になるように修飾することが必要である。これは、一般には、5’N末端をシステイニル部分で誘導体化し、3’C末端をチオエステル部分で誘導体化することによってなされる。そのような修飾されたPNAは、標準のネイティブな化学的ライゲーション条件を使用することで容易にカップリングする(Roloffら、2013年、Bioorgan. Med. Chem.、21巻:3458〜3464頁)。
一部の実施形態では、コーディングタグ情報を、トポイソメラーゼを使用して移行させることができる。トポイソメラーゼを使用して、記録タグ上のトポ荷電3’リン酸とコーディングタグまたはその相補物の5’末端とライゲーションすることができる(Shumanら、1994年、J. Biol. Chem.、269巻:32678〜32684頁)。
本明細書に記載の通り、結合性物質は、翻訳後修飾されたアミノ酸に結合し得る。したがって、ペプチド巨大分子を伴うある特定の実施形態では、伸長記録タグは、アミノ酸配列および翻訳後修飾に関するコーディングタグ情報を含む。一部の実施形態では、内部の翻訳後修飾されたアミノ酸(例えば、リン酸化、グリコシル化、サクシニル化、ユビキチン化、S−ニトロシル化、メチル化、N−アセチル化、脂質付加など)の検出は、末端アミノ酸(例えば、NTAAまたはCTAA)の検出および切断の前に実現される。一実施例では、ペプチドをPTM修飾のために結合性物質と接触させ、付随するコーディングタグ情報を上記の通り記録タグに移行する(例えば図8Aを参照されたい)。アミノ酸修飾に関するコーディングタグ情報の検出および移行が完了したら、一次アミノ酸配列に関するコーディングタグ情報の検出および移行の前に、N末端またはC末端分解法を使用してPTM修飾基を除去することができる。したがって、得られた伸長記録タグにより、ペプチド配列における翻訳後修飾の存在が、逐次的順序ではないが、一次アミノ酸配列情報と併せて示される(例えば図8Bを参照されたい)。
一部の実施形態では、内部の翻訳後修飾されたアミノ酸の検出は、一次アミノ酸配列の検出と並行して行うことができる。一実施例では、NTAA(またはCTAA)を、単独でまたは結合性物質のライブラリー(例えば、20種の標準のアミノ酸および選択された翻訳後修飾されたアミノ酸に対する結合性物質で構成されるライブラリー)の一部としての、翻訳後修飾されたアミノ酸に対して特異的な結合性物質と接触させる。末端アミノ酸切断および結合性物質(または結合性物質のライブラリー)との接触の連続的なサイクルを後に続ける。したがって、得られた伸長記録タグにより、一次アミノ酸配列に関して、翻訳後修飾の存在および順序が示される。
ある特定の実施形態では、コーディングタグ情報移行の全体的な頑強性および効率を改善するために、巨大分子ごとに記録タグのアンサンブルを使用することができる(例えば、図9を参照されたい)。単一の記録タグではなく、所与の巨大分子に付随する記録タグのアンサンブルを使用することにより、コーディングタグと記録タグのカップリング収率が潜在的に高いこと、およびライブラリーの全収率が高いことに起因して、ライブラリー構築の効率が改善される。単一の連鎖状の伸長記録タグの収率は、連鎖の段階的収率に直接依存し、一方、コーディングタグ情報を受容することが可能な多数の記録タグの使用では、指数関数的な連鎖の喪失を受けない。
そのような実施形態の例が図9および10に示されている。図9Aおよび図10Aでは、固体支持体上で単一の巨大分子に多数の記録タグが付随している(空間的共局在または単一の巨大分子の単一のビーズへの限局によって)。結合性物質を固体支持体に周期的に曝露させ、各サイクルにおいて、それらの対応するコーディングタグにより、共局在する多数の記録タグのうちの1つに情報が移行される。図9Aに示されている例では、結合サイクル情報は、コーディングタグ上に存在するスペーサーにコードされている。各結合サイクルについて、結合性物質のセットに設計されたサイクル特異的スペーサー配列で印をつける(例えば図9Aおよび9Bを参照されたい)。例えば、NTAA結合性物質の場合では、同じアミノ酸残基に対する結合性物質を異なるコーディングタグで標識する、またはサイクル特異的情報をスペーサー配列に含めて、両方の結合性物質の同一性およびサイクル数を示す。
図9Aにおいて例示されている通り、第1の結合サイクル(サイクル1)において、複数のNTAA結合性物質を巨大分子と接触させる。サイクル1で使用する結合性物質は、記録タグのスペーサー配列と相補的な共通のスペーサー配列を有する。サイクル1で使用する結合性物質は、サイクル1特異的配列を含む3’−スペーサー配列も有する。結合サイクル1の間に、第1のNTAA結合性物質が巨大分子の遊離末端に結合し、第1のコーディングタグおよび記録タグ内の共通のスペーサー配列の相補配列がアニーリングし、第1のコーディングタグの情報が同類の記録タグに共通のスペーサー配列からのプライマー伸長を介して移行する。NTAAを除去して、新しいNTAAを露出させた後、結合サイクル2により、記録タグのスペーサー配列と相補的な共通のスペーサー配列を有する複数のNTAA結合性物質を接触させる。サイクル2で使用する結合性物質は、サイクル2特異的配列を含む3’−スペーサー配列も有する。第2のNTAA結合性物質が巨大分子のNTAAに結合し、第2のコーディングタグの情報が記録タグにプライマー伸長を介して移行する。これらのサイクルを最大「n」回の結合サイクルまで繰り返し、単一の巨大分子と共局在する複数の伸長記録タグを生成し、ここで、各伸長記録タグは、1つの結合サイクルからのコーディングタグ情報を有する。連続的な結合サイクルのそれぞれで使用される結合性物質の各セットは、コーディングタグ内のサイクル特異的スペーサー配列を有するので、結合サイクル情報を、得られた伸長記録タグ内の結合性物質情報と関連づけることができる。
代替の実施形態では、図9Aと同様に、固体支持体(例えば、ビーズ)上で単一の巨大分子に多数の記録タグが付随しているが、この場合、特定の結合サイクルで使用される結合性物質は、今の結合サイクルに対するサイクル特異的スペーサーおよび次の結合サイクルに対するサイクル特異的スペーサーが隣接するコーディングタグを有する(例えば図10Aおよび10Bを参照されたい」)。この設計は、伸長記録タグの集団を単一の共直線性の伸長記録タグに変換するための最終的なアセンブリPCRステップを支持するためのものである(例えば図10Cを参照されたい)。単一の共直線性の伸長記録タグのライブラリーを配列決定前に濃縮、サブトラクションおよび/または正規化方法に供すことができる。第1の結合サイクル(サイクル1)では、第1の結合性物質が結合すると、サイクル1特異的スペーサー(C’1)を含むコーディングタグの情報が、末端に相補的なサイクル1特異的スペーサー(C1)を含む記録タグに移行する。第2の結合サイクル(サイクル2)では、第2の結合性物質が結合すると、サイクル2特異的スペーサー(C’2)を含むコーディングタグの情報が、末端に相補的なサイクル2特異的スペーサー(C2)を含む異なる記録タグに移行する。このプロセスを第nの結合サイクルまで続ける。一部の実施形態では、伸長記録タグ内の第nのコーディングタグにユニバーサルリバースプライミング配列を用いてキャップ形成する、例えば、ユニバーサルリバースプライミング配列を第nのコーディングタグ設計の一部として組み入れることもでき、ユニバーサルリバースプライミング配列を第nの結合サイクルの後に続く反応、例えば尾部を有するプライマーを使用した増幅反応などに添加することもできる。一部の実施形態では、各結合サイクル時に、巨大分子を、それらの対応する結合性物質に関する識別情報および結合サイクル情報を含むコーディングタグと接合した結合性物質の集合に曝露させる(例えば図9および図10を参照されたい)。特定の実施形態では、第nの結合サイクルが完了した後、伸長記録タグでコーティングしたビーズ基板を油乳剤に平均して液滴当たり1ビーズ未満またはそれとほぼ同等になるように入れる。次いで、アセンブリPCRを使用して、伸長記録タグをビーズから増幅し、多数の別々の記録タグを、別々の伸長記録タグ内のサイクル特異的スペーサー配列を介してプライミングすることによって共直線的な順序でアセンブルさせる(例えば図10Cを参照されたい)(Xiongら、2008年、FEMS Microbiol. Rev.、32巻:522〜540頁)。あるいは、結合性物質のコーディングタグを有するサイクル特異的スペーサーを使用する代わりに、各結合サイクル中または各結合サイクル後に、サイクル特異的スペーサーを別々に伸長記録タグに付加することができる。単一の巨大分子を集合的に表すものである伸長記録タグの集団を使用することの、単一の巨大分子を表すものである単一の連鎖状の伸長記録タグに対する1つの利点は、より高濃度の記録タグにより、コーディングタグ情報の移行の効率が上昇し得ることである。さらに、結合サイクルを数回繰り返して同類結合事象の完了を確実にすることができる。さらに、伸長記録タグの表面増幅により、情報移行の重複性をもたらすことができる(例えば図4Bを参照されたい)。コーディングタグ情報が必ずしも移行されない場合、ほとんどの場合、それでも、コーディングタグ情報の不完全な集合を、タンパク質などの、情報含有量が非常に高い巨大分子を識別するために使用することが可能であるはずである。短いペプチドであっても、非常に多数の可能性のあるタンパク質配列を具体化し得る。例えば、10merのペプチドは、2010種の可能性のある配列を有する。したがって、欠失および/または多義性を含有する可能性がある部分的または不完全な配列を、それでも、多くの場合、一意的にマッピングすることができる。
タンパク質のネイティブなコンフォメーションが照会される一部の実施形態では、結合性物質の近位のスペーサーエレメント内の切断可能なまたはニッキング可能なDNA鎖で構成されるコーディングタグを有する結合性物質を用いて周期的結合アッセイを実施する(例えば図32を参照されたい)。例えば、結合性物質の近位のスペーサーは、ウラシル特異的切除試薬(USER)によってニッキングすることができる1つまたは複数のウラシル塩基を有してよい。別の例では、結合性物質の近位のスペーサーは、2重鎖の一方の鎖のみを加水分解するニッキングエンドヌクレアーゼの認識配列を含んでよい。この設計により、結合性物質を伸長記録タグから変性によらずに除去し、その後のイムノアッセイサイクルのための遊離の一本鎖DNAスペーサーエレメントを創出することが可能になる。好ましい実施形態では、プライマー伸長ステップ後の結合性物質の酵素的USER除去を可能にするために、コーディングタグにウラシル塩基を組み入れる(例えば図32E〜Fを参照されたい)。ウラシルによるUSER切除後、結合性物質および切り詰められたコーディングタグを、タンパク質−結合性物質相互作用を破壊するための、高塩濃度(4MのNaCl、25%ホルムアミド)および穏やかな熱を含めた種々の穏やかな条件下で除去することができる。記録タグとアニーリングしたままの他の切り詰められたコーディングタグDNAの残り(例えば図32Fを参照されたい)は、わずかに温度を上昇させると容易に解離する。
結合性物質の近位のスペーサーエレメント内の切断可能なまたはニッキング可能なDNA鎖で構成されるコーディングタグにより、多数の結合した結合性物質からコーディングタグ情報を移行させるための単一の均一なアッセイも可能になる(例えば図33を参照されたい)。好ましい実施形態では、結合性物質の近位のコーディングタグはニッキングエンドヌクレアーゼ配列モチーフを含み、これは、dsDNAに関して規定された配列モチーフにおいてニッキングエンドヌクレアーゼにより認識され、ニッキングされる。多数の結合性物質の結合後、複合ポリメラーゼ伸長(鎖置換活性を欠く)+ニッキングエンドヌクレアーゼ試薬混合物を使用して、コーディングタグの近位の記録タグまたは伸長記録タグへの反復移行を生じさせる。各移行ステップ後、得られた伸長記録タグ−コーディングタグ2重鎖をニッキングエンドヌクレアーゼによってニッキングし、それにより、結合性物質に付着した切り詰められたスペーサーを放出させ、追加的な近位の結合した結合性物質のコーディングタグとアニーリングすることが可能な伸長記録タグ3’スペーサー配列に曝露させる(例えば図33B〜Dを参照されたい)。コーディングタグスペーサー配列内へのニッキングモチーフの配置は、切断されていないコーディングタグスペーサー配列と容易に交換することができる、準安定ハイブリッドが創出されるように設計する。このように、2種またはそれよりも多くの結合性物質が同じタンパク質分子に同時に結合する場合、多重に結合した結合性物質からのコーディングタグ情報の記録タグ上への連鎖による結合情報は、単一反応混合物において、いかなる周期的な試薬交換も伴わずに生じる(例えば図33C〜Dを参照されたい)。この実施形態は、次世代タンパク質アッセイ(NGPA)、特に、タンパク質上の多価エピトープに対するポリクローナル抗体(またはモノクローナル抗体の混合集団)を用いるものに特に有用である。
変性したタンパク質、ポリペプチド、およびペプチドの解析を伴う実施形態に関しては、結合した結合性物質およびアニーリングしたコーディングタグを、プライマー伸長後に、高度変性条件(例えば、0.1〜0.2NのNaOH、6Mの尿素、2.4Mのグアニジニウムイソチオシアネート、95%ホルムアミドなど)を使用することによって除去することができる。
H.記録タグ情報のコーディングタグまたはジタグ構築物への周期的移行のための方法およびキット
別の態様では、結合性物質が巨大分子に結合した後にコーディングタグから記録タグに情報を書き込むのではなく、任意選択のUMI配列(例えば、特定のペプチドまたはタンパク質分子を識別する)および少なくとも1つのバーコード(例えば、コンパートメントタグ、分配バーコード、試料バーコード、空間的位置バーコードなど)を含む記録タグからコーディングタグに情報を移行させ、それにより、伸長コーディングタグを生成することができる(例えば図11Aを参照されたい)。ある特定の実施形態では、結合性物質および付随する伸長コーディングタグを、各結合サイクル後、および任意選択でエドマン分解化学ステップの前に収集する。ある特定の実施形態では、コーディングタグは、結合サイクル特異的タグを含む。周期的なエドマン分解におけるNTAAの検出などの全ての結合サイクルが完了した後、伸長コーディングタグの完全な収集物を増幅し、配列決定し、ペプチド上の情報を、UMI(ペプチド同一性)、エンコーダー配列(NTAA結合性物質)、コンパートメントタグ(単一の細胞またはプロテオームのサブセット)、結合サイクル特異的配列(サイクル数)、またはそれらの任意の組合せの間の関連性から決定することができる。同じコンパートメントタグ/UMI配列を有するライブラリーエレメントを同じ細胞、プロテオームのサブセット、分子などにマッピングし戻し、ペプチド配列を再構築することができる。この実施形態は、記録タグがエドマン分解プロセス中に過度の損傷を保持する場合に有用であり得る。
複数の巨大分子を解析するための方法であって、(a)固体支持体に接合した複数の巨大分子および付随する記録タグを用意するステップと;(b)複数の巨大分子を複数の巨大分子に結合することが可能な複数の結合性物質と接触させるステップであって、各結合性物質が結合性物質に関する識別情報を有するコーディングタグを含む、ステップと;(c)(i)巨大分子に付随する記録タグの情報を巨大分子に結合した結合性物質のコーディングタグに移行させて、伸長コーディングタグを生成するステップ(例えば図11Aを参照されたい);または(ii)巨大分子に付随する記録タグおよび巨大分子に結合した結合性物質のコーディングタグの情報をジタグ構築物に移行するステップと(例えば図11Bを参照されたい);(d)伸長コーディングタグまたはジタグ構築物を収集するステップと;(e)任意選択でステップ(b)〜(d)を1回または複数回の結合サイクルにわたって繰り返すステップと;(f)伸長コーディングタグまたはジタグ構築物の収集物を解析するステップとを含む方法が本明細書において提示される。
ある特定の実施形態では、記録タグからコーディングタグへの情報移行は、記録タグのプライマー伸長を防止するために記録タグの3’末端を任意選択でブロッキングする(例えば、図11Aを参照されたい)プライマー伸長ステップを使用して実現することができる。得られた伸長コーディングタグおよび付随する結合性物質を各結合事象の後および情報移行の完了後に収集することができる。図11Bに例示されている例では、記録タグは、ユニバーサルプライミング部位(U2’)、バーコード(例えば、コンパートメントタグ「CT」)、任意選択のUMI配列、および共通のスペーサー配列(Sp1)で構成される。ある特定の実施形態では、バーコードは、個々のコンパートメントを表すコンパートメントタグであり、また、UMIを使用して、配列読み取りを照会されている特定のタンパク質またはペプチド分子にマッピングし戻すことができる。図11Bの例において例示されている通り、コーディングタグは、共通のスペーサー配列(Sp2’)、結合性物質エンコーダー配列、およびユニバーサルプライミング部位(U3)で構成される。コーディングタグで標識した結合性物質の導入前に、記録タグのU2’ユニバーサルプライミング部位と相補的であり、ユニバーサルプライミング配列U1およびサイクル特異的タグを含むオリゴヌクレオチド(U2)を記録タグU2’とアニーリングさせる。さらに、アダプター配列Sp1’−Sp2を記録タグSp1とアニーリングさせる。このアダプター配列は、コーディングタグ上のSp2’配列とも相互作用することができ、それにより、記録タグとコーディングタグが互いと近傍になる。結合事象の前または後のいずれかにギャップ充填伸長ライゲーションアッセイを実施する。ギャップ充填を結合サイクルの前に実施する場合、結合サイクル後のプライマー伸長ステップを使用してジタグ形成を完了させる。いくつもの結合サイクルにわたってジタグを収集した後、ジタグの収集物を配列決定し、UMI配列を介して元のペプチド分子にマッピングし戻す。有効性を最大にするために、UMI配列の多様性はUMIでタグが付された単一分子の数の多様性を超えるものでなければならないことが理解される。
ある特定の実施形態では、巨大分子は、タンパク質またはペプチドである。ペプチドは生体試料由来のタンパク質を断片化することによって得ることができる。
記録タグは、DNA分子、RNA分子、PNA分子、BNA分子、XNA分子、LNA分子、γPNA分子、またはこれらの組合せであってよい。記録タグは、それが付随する巨大分子(例えば、ペプチド)を識別するUMIを含む。ある特定の実施形態では、記録タグは、コンパートメントタグをさらに含む。記録タグは、ユニバーサルプライミング部位も含んでよく、これを下流の増幅に使用することができる。ある特定の実施形態では、記録タグは、3’末端にスペーサーを含む。スペーサーは、コーディングタグ内のスペーサーと相補的であってよい。記録タグの3’末端をブロッキングして(例えば、光不安定性3’ブロッキング基)ポリメラーゼによる記録タグの伸長を防止し、それにより、巨大分子に付随する記録タグの情報のコーディングタグへの移行または巨大分子に付随する記録タグおよびコーディングタグの情報のジタグ構築物への移行を容易にすることができる。
コーディングタグは、コーディング物質が連結した結合性物質を識別するエンコーダー配列を含む。ある特定の実施形態では、コーディングタグは、コーディングタグが連結した各結合性物質に対する一意の分子識別子(UMI)をさらに含む。コーディングタグは、下流の増幅のために使用することができるユニバーサルプライミング部位を含んでよい。コーディングタグは、3’末端にスペーサーを含んでよい。スペーサーは、記録タグ内のスペーサーに相補的であってよく、記録タグ情報をコーディングタグに移行させるためのプライマー伸長反応を開始するために使用することができる。コーディングタグは、伸長コーディングタグまたはジタグの起源である結合サイクルを識別するための結合サイクル特異的配列も含んでよい。
記録タグの情報のコーディングタグへの移行は、プライマー伸長またはライゲーションによってもたらすことができる。記録タグおよびコーディングタグの情報のジタグ構築物への移行は、ギャップ充填反応、プライマー伸長反応、またはその両方で生じさせることができる。
ジタグ分子は、伸長記録タグのものと同様の機能的成分を含む。ジタグ分子は、記録タグに由来するユニバーサルプライミング部位、記録タグに由来するバーコード(例えば、コンパートメントタグ)、記録タグに由来する任意選択の一意の分子識別子(UMI)、記録タグに由来する任意選択のスペーサー、コーディングタグに由来するエンコーダー配列、コーディングタグに由来する任意選択の一意の分子識別子、結合サイクル特異的配列、コーディングタグに由来する任意選択のスペーサー、およびコーディングタグに由来するユニバーサルプライミング部位を含んでよい。
ある特定の実施形態では、記録タグを、バーコードのコンビナトリアル連鎖をコードするワードを使用して生成することができる。コンビナトリアルをコードするワードの使用により、アニーリングおよび化学的ライゲーションを使用して情報をPNA記録タグからコーディングタグまたはジタグ構築物に移行させることができる方法がもたらされる(例えば、図12A〜Dを参照されたい)。本明細書に開示されているペプチドを解析する方法がエドマン分解による末端アミノ酸の切断を伴うある特定の実施形態では、PNAなどの、エドマン分解の厳しい条件に対して抵抗性の記録タグを使用することが望ましい可能性がある。エドマン分解プロトコールにおける1つの厳しいステップは、N末端アミノ酸を切断するための無水TFA処理である。このステップにより、一般には、DNAが破壊される。PNAは、DNAとは対照的に、酸加水分解に対して高度に抵抗性である。PNAでの問題は、情報移行の酵素的方法がより難しくなる、すなわち、好ましい様式が化学的ライゲーションによる情報移行になることである。図11Bにおいて、記録タグおよびコーディングタグ情報は酵素的ギャップ充填伸長ライゲーションステップによって書き込まれるが、これは、現在、PNA鋳型を用いると、PNAを使用するポリメラーゼが開発されなければ、都合がよくない。化学的ライゲーションが必要であり、その産物は容易には増幅されないので、PNA記録タグからコーディングタグへのバーコードおよびUMIの書き込みには問題がある。化学的ライゲーションの方法は、文献に広範囲にわたって記載されている(Gundersonら、1998年、Genome Res.、8巻:1142〜1153頁;Pengら、2010年、Eur. J. Org. Chem.、4194〜4197頁;El−Sagheerら、2011年、Org. Biomol. Chem.、9巻:232〜235頁;El−Sagheerら、2011年、Proc. Natl. Acad. Sci. USA、108巻:11338〜11343頁;Litovchickら、2014年、Artif. DNA PNA XNA、5巻:e27896頁;Roloffら、2014年、Methods Mol. Biol.、1050巻:131〜141頁)。
コンビナトリアルPNAバーコードおよびUMI配列を創出するために、n−merのライブラリーからのPNAワードのセットをコンビナトリアルにライゲーションすることができる。各PNAワードが1,000ワードの空間に由来する場合、4つの組合せ配列により、1,0004=1012コードのコーディング空間が生じる。このように、4,000種の異なるDNA鋳型配列の出発セットから、1012を超えるPNAコードを生成することができる(例えば図12Aを参照されたい)。連鎖状のワードの数を調整すること、または基本のワードの数を調整することにより、より小さなまたはより大きなコーディング空間を生成することができる。そのように、PNA記録タグとハイブリダイズさせたDNA配列を使用した情報移行は、DNAワードアセンブリハイブリダイゼーションおよび化学的ライゲーションを使用して完了させることができる(例えば図12Bを参照されたい)。PNA鋳型上のDNAワードのアセンブリおよびDNAワードの化学的ライゲーションの後、得られた中間体を使用して、情報をコーディングタグに/から移行させることができる(例えば図12Cおよび図12Dを参照されたい)。
ある特定の実施形態では、巨大分子および付随する記録タグは、固体支持体に共有結合により接合している。固体支持体は、ビーズ、アレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、マイクロタイターウェル、ELISAプレート、スピン干渉ディスク、ニトロセルロースメンブレン、ニトロセルロースに基づくポリマー表面、ナノ粒子、またはマイクロスフェアであってよい。固体支持体は、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズであってよい。
ある特定の実施形態では、結合性物質は、タンパク質またはポリペプチドである。一部の実施形態では、結合性物質は、改変またはバリアントアミノペプチダーゼ、改変またはバリアントアミノアシルtRNA合成酵素、改変またはバリアントアンチカリン、改変またはバリアントClpS、または改変またはバリアント抗体またはその結合性断片である。ある特定の実施形態では、結合性物質は、単一のアミノ酸残基、ジペプチド、トリペプチド、またはペプチドの翻訳後修飾に結合する。一部の実施形態では、結合性物質は、N末端アミノ酸残基、C末端アミノ酸残基、または内部アミノ酸残基に結合する。一部の実施形態では、結合性物質は、N末端ペプチド、C末端ペプチド、または内部ペプチドに結合する。一部の実施形態では、結合性物質は、ペプチドの翻訳後修飾のアミノ酸の部位特異的な共有結合性標識である。
ある特定の実施形態では、ステップ(b)において複数の巨大分子を複数の結合性物質と接触させた後、巨大分子および付随する結合性物質を含む複合体を固体支持体から解離させ、液滴またはマイクロ流体液滴のエマルジョン中に分配する。一部の実施形態では、各マイクロ流体液滴は、巨大分子および結合性物質を含む複合体を最大で1つ含む。
ある特定の実施形態では、伸長コーディングタグまたはジタグ構築物を生成する前に前記記録タグを増幅する。巨大分子および付随する結合性物質を含む複合体を液滴またはマイクロ流体液滴に液滴当たりの複合体が最大で1つになるように分配する実施形態では、記録タグの増幅により、情報をコーディングタグまたはジタグ構築物に移行させるための鋳型として追加的な記録タグがもたらされる(例えば図13および図14を参照されたい)。エマルジョン融合PCRを使用して、記録タグ情報をコーディングタグに移行させるか、またはジタグ構築物の集団を創出することができる。
生成された伸長コーディングタグまたはジタグ構築物の収集物を解析前に増幅させることができる。伸長コーディングタグまたはジタグ構築物の収集物の解析は、核酸配列決定法を含んでよい。合成による配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、ポロニーシーケンシング、イオン半導体シーケンシング、またはパイロシーケンシング。核酸配列決定法は、単一分子リアルタイムシーケンシング、ナノポアに基づく配列決定、または先端顕微鏡を使用したDNAのダイレクトイメージングであってよい。
エドマン分解およびPITC、サンガー薬剤(DNFB)、SNFB、アセチル化試薬、アミジン化(グアニジニル化)試薬などのN末端アミンを化学的に標識する方法により、アデニン、グアニン、およびシトシンなどの標準の核酸またはPNA塩基の内部アミノ酸および環外アミンを修飾することもできる。ある特定の実施形態では、ペプチドのリシン残基のε−アミンを、配列決定の前に酸無水物、グアニジン化剤、または同様のブロッキング試薬でブロッキングする。DNA塩基の環外アミンはペプチドのN末端第一級アミンよりもはるかに反応性が低いが、DNA塩基の内部アミノ酸および環外アミンに対する非標的活性を低下させる、アミン反応性作用物質のN末端アミンに対する反応性の制御が、配列決定アッセイにとって重要である。修飾反応の選択性は、pH、溶媒(水性対有機、非プロトン性、非極性、極性非プロトン性、イオン性液体など)、塩基および触媒、共溶媒、温度、ならびに時間などの反応条件を調整することによってモジュレートすることができる。さらに、DNA塩基の環外アミンの反応性は、DNAがssDNAの形態であるかdsDNAの形態であるかによってモジュレートされる。修飾を最小限にするために、NTAA化学修飾の前に、記録タグを相補DNAプローブ:P1’、{試料BCs}’、{Sp−BC}’などとハイブリダイズさせることができる。別の実施形態では、保護された環外アミンを有する核酸の使用も使用することができる(Ohkubo, Kasuya et al. 2008)。さらに別の実施形態では、SNFBなどの「反応性が低い」アミン標識化合物により、DNAの内部アミノ酸および環外アミンに対するオフターゲットの標識が軽減される(Cartyand Hirs 1968)。SNFBは、パラスルホニル基がパラニトロ基よりも電子求引性であり、それにより、DNFBよりも活性が低いSNFBでのフッ素置換が導かれるという事実に起因してDNFBよりも反応性が低い。
NTAA α−アミン修飾を最適化し、オフターゲットのアミノ酸修飾またはDNA修飾を最小限にするためのカップリング条件およびカップリング試薬の調整は、化学および反応条件(濃度、温度、時間、pH、溶媒の型など)を慎重に選択することによって可能である。例えば、DNFBは、二級アミンと、水中よりもアセトニトリルなどの非プロトン性溶媒中の方が容易に反応することが公知である。環外アミンが軽度に修飾されてもなお相補的なプローブが配列とハイブリダイズすることが可能になるが、ポリメラーゼに基づくプライマー伸長を妨害する可能性がある。環外アミンを保護しながら、それでも水素結合を可能にすることも可能である。これは、保護された塩基がなお目的の標的とハイブリダイズすることが可能であるという最近の刊行物に記載された(Ohkubo、Kasuyaら、2008年)。一実施形態では、工学的に操作されたポリメラーゼを使用して、DNAコーディングタグ鋳型上の記録タグの伸長中に、保護された塩基を有するヌクレオチドを組み入れる。別の実施形態では、工学的に操作されたポリメラーゼを使用して、PNA記録タグ鋳型上のコーディングタグの伸長中に記録タグPNA鋳型(w/またはw/o保護された塩基)上のヌクレオチドを組み入れる。別の実施形態では、情報を、外因性オリゴヌクレオチドをPNA記録タグとアニーリングさせることによって記録タグからコーディングタグに移行させることができる。ハイブリダイゼーションの特異性は、n−merのワードのアセンブリに基づく設計などの配列空間が別個であるUMIを選択することによって容易にすることができる(Gerry、Witowskiら、1999年)。
エドマン様N末端ペプチド分解配列決定を使用してペプチドの直鎖状アミノ酸配列を決定することができるが、代替的な実施形態を使用して、伸長記録タグ、伸長コーディングタグ、およびジタグを利用する方法を用いたペプチドの部分的な組成分析を実施することができる。結合性物質または化学標識を使用してペプチド上のN末端および内部の両方のアミノ酸またはアミノ酸修飾を識別することができる。化学薬剤により、アミノ酸(例えば、標識)を部位特異的に共有結合により修飾することができる(SlettenおよびBertozzi、2009年、Basle、Joubertら、2010年)(SpicerおよびDavis、2014年)。部位特異的に標識されたアミノ酸のコーディングおよびその後の識別を容易にするために、単一のアミノ酸を標的とする化学標識剤にコーディングタグを付着させることができる(例えば図13を参照されたい)。
ペプチド組成分析にはペプチドの環状分解は必要なく、したがって、DNAを含有するタグを厳しいエドマン化学に曝露することの問題が回避される。環状結合様式では、組成情報(アミノ酸またはジペプチド/トリペプチド情報)、PTM情報、および一次アミノ酸配列をもたらすために伸長コーディングタグまたはジタグを使用することもできる。一実施形態では、この組成情報は、本明細書に記載の伸長コーディングタグまたはジタグ手法を使用して読み取ることができる。UMIおよびコンパートメントタグ情報と組み合わせると、伸長コーディングタグまたはジタグの収集物により、ペプチドおよびそれらの起源であるコンパートメントのタンパク質(複数可)に関する組成情報がもたらされる。同じコンパートメントタグ(および表面上起源であるタンパク質分子)にマッピングし戻された伸長コーディングタグまたはジタグの収集物は、部分的な組成情報を有するペプチドをマッピングするための強力なツールである。プロテオーム全体にマッピングし戻すのではなく、コンパートメントタグ付きペプチドの集合を限られたタンパク質分子のサブセットにマッピングし戻し、これにより、マッピングの一意性が著しく増大する。
本明細書で使用される結合性物質は、単一のアミノ酸、ジペプチド、トリペプチド、またはさらに長いペプチド配列モチーフを認識し得る。Tessler(2011年、Digital Protein Analysis: Technologies for Protein Diagnostics and Proteomics through Single Molecule Detection. Ph.D.、Washington University in St. Louis)は、荷電したジペプチドエピトープのサブセットに対して比較的選択的なジペプチド抗体を生成することができることを実証した(Tessler、2011年)。代替のタンパク質足場(例えば、aaRS、アンチカリン、ClpSなど)およびアプタマーへの定向進化の適用を使用して、ジペプチド/トリペプチド結合性物質のセットを増大させることができる。単一のタンパク質分子にマッピングし戻すことと併せたジペプチド/トリペプチド組成分析からの情報は、各タンパク質分子を一意的に識別し、定量化するために十分なものであり得る。最大で、合計400種の可能性のあるジペプチドの組合せがある。しかし、最も頻度が高く、かつ最も抗原性が高い(荷電、親水性、疎水性)ジペプチドのサブセットが、結合性物質を生成するために十分なものであるはずである。この数は、40〜100種の異なる結合性物質のセットを構成し得る。40種の異なる結合性物質のセットに関して、平均10merのペプチドに少なくとも1種の結合性物質が結合する見込みは約80%である。この情報を同じタンパク質分子に由来する全てのペプチドと組み合わせることにより、タンパク質分子の識別が可能になり得る。ペプチドおよびその起源であるタンパク質に関するこの情報全てを組み合わせて、より正確かつ的確なタンパク質配列特徴付けをもたらすことができる。
部分的なペプチド配列情報を使用する最近のデジタルタンパク質特徴付けアッセイが提唱された(Swaminathanら、2015年、PLoS Comput. Biol.、11巻:e1004080頁)(Yao、Docterら、2015年)。すなわち、当該手法では、システイン、リシン、アルギニン、チロシン、アスパラギン酸/グルタミン酸などの、標準の化学を使用して容易に標識されるアミノ酸の蛍光標識を使用する(Basle、Joubertら、2010年)。部分的なペプチド配列情報を用いることの問題は、プロテオームにマッピングし戻すことが一対多数の関連であり、一意のタンパク質が識別されないことである。この一対多数のマッピング問題は、プロテオーム全体空間を、ペプチドがマッピングし戻される限られたタンパク質分子のサブセットに減少させることによって解決することができる。本質的に、単一の部分的なペプチド配列を100種または1000種の異なるタンパク質配列にマッピングし戻すことができるが、いくつかのペプチド(例えば、単一のタンパク質分子の消化に由来する10ペプチド)のセットを全て、コンパートメント内のタンパク質分子のサブセットに含有される単一のタンパク質分子にマッピングし戻した場合、タンパク質分子の同一性を推定することが容易であることが公知である。例えば、同じ分子に由来する全てのペプチドに関するペプチドプロテオームマップの交差により、可能性のあるタンパク質同一性のセットが著しく制限される(例えば図15を参照されたい)。
特に、部分的なペプチド配列または組成のマッピング可能性は、コンパートメントのタグおよびUMIの革新的使用を行うことによって有意に増強される。すなわち、プロテオームを最初にバーコードが付されたコンパートメントに分配し、ここで、コンパートメントバーコードはUMI配列にも付着している。コンパートメントバーコードはコンパートメントに一意の配列であり、UMIはコンパートメント内のバーコードが付された分子それぞれに一意の配列である(例えば図16を参照されたい)。一実施形態では、この分配は、その全体が参照により組み込まれる、PCT公開第WO2016/061517号に開示されているものと同様の方法を使用して、ビーズに付着したDNAコンパートメントバーコードとのハイブリダイゼーションによる、DNAタグで標識されたポリペプチドとビーズの表面との直接相互作用によって実現される(例えば図31を参照されたい)。プライマー伸長ステップにより、ビーズに連結されたコンパートメントバーコードからポリペプチド上のDNAタグに情報を移行させる(例えば図20を参照されたい)。別の実施形態では、この分配は、UMIを含有する、バーコードが付されたビーズおよびタンパク質分子をエマルジョンの液滴中に共封入することによって実現される。さらに、液滴は、任意選択でタンパク質をペプチドに消化するプロテアーゼを含有する。いくつものプロテアーゼを、レポータータグが付されたポリペプチドを消化するために使用することができる(Switzar、Gieraら、2013年)。ブテラーゼIなどの酵素的リガーゼとプロテアーゼの共封入では、酵素をプロテアーゼ消化に対して抵抗性にするために、ペグ化などの酵素の修飾が必要になり得る(FrokjaerおよびOtzen、2005年、Kang、Wangら、2010年)。消化後、ペプチドをバーコード−UMIタグとライゲーションする。好ましい実施形態では、下流の生化学的操作を容易にするために、バーコード−UMIタグをビーズ上に保持する(例えば図13を参照されたい)。
バーコード−UMIとペプチドのライゲーション後、エマルジョンを破壊し、ビーズを回収する。バーコードが付されたペプチドを、それらの一次アミノ酸配列、またはそれらのアミノ酸組成によって特徴付けることができる。ペプチドに関するどちらの型の情報も、プロテオームのサブセットにマッピングし戻すために使用することができる。一般に、配列情報は、組成情報よりもはるかに小さいプロテオームのサブセットにマッピングし戻される。それにもかかわらず、多数のペプチド(配列または組成)からの情報を同じコンパートメントバーコードと組み合わせることにより、ペプチドの起源であるタンパク質(複数可)を一意的に識別することが可能である。このように、プロテオーム全体を特徴付け、定量化することができる。ペプチド上の一次配列情報は、ペプチド配列を表すDNAにコードされるライブラリー(DNA Encoded Library)(DEL)の伸長記録タグ創出を伴うペプチド配列決定反応を実施することによって引き出すことができる。好ましい実施形態では、記録タグは、コンパートメントバーコードおよびUMI配列で構成される。この情報を、コーディングタグから移行された一次またはPTMアミノ酸情報と共に使用して、最終的なマッピングされたペプチド情報を生成する。
ペプチド配列情報に対する代替は、コンパートメントバーコードおよびUMIと連結したペプチドアミノ酸またはジペプチド/トリペプチド組成情報を生成することである。これは、UMI−バーコードが付されたペプチドを伴うビーズを、各ペプチド上の選択されたアミノ酸(内部)をアミノ酸コード情報および別のアミノ酸UMI(AA UMI)を含むDNAタグで部位特異的に標識するアミノ酸標識ステップに供することによって実現される(例えば図13を参照されたい)。最も化学標識しやすいアミノ酸(AA)は、リシン、アルギニン、システイン、チロシン、トリプトファン、およびアスパラギン酸/グルタミン酸であるが、他のAAに対する標識スキームを同様に展開することも実行可能であり得る(MendozaおよびVachet、2009年)。所与のペプチドは、同じ型のAAをいくつか含有し得る。同じ型の多数のアミノ酸の存在は、付着したAA UMI標識によって区別することができる。各標識分子は、DNAタグ内に異なるUMIを有し、それによりアミノ酸の計数が可能になる。化学標識に対する代替は、AAを結合性物質で「標識」することである。例えば、AAコード情報およびAA UMIを含むコーディングタグで標識されたチロシン特異的抗体を使用して、ペプチドの全てのチロシンに印を付けることができる。この手法に伴う注意事項は、大きなかさのある抗体では立体的な障害が生じることであり、この目的のためには、より小さなscFv、アンチカリン、またはClpSバリアントを使用することが理想的である。
一実施形態では、AAへのタグ付け後、情報を、記録タグと、ペプチド上の結合したまたは共有結合によりカップリングした結合性物質に付随する多数のコーディングタグとの間で、液滴当たり単一のペプチドが含有されるようにペプチド複合体を区画化し、エマルジョン融合PCRを実施して、区画化されたペプチドのアミノ酸組成を特徴付ける伸長コーディングタグまたはジタグのセットを構築することによって移行させる。ジタグの配列決定後、同じバーコードを有するペプチド上の情報を単一のタンパク質分子にマッピングし戻すことができる。
特定の実施形態では、タグが付されたペプチド複合体をビーズから解離させ(例えば図13を参照されたい)、小さなミニコンパートメント(例えば、マイクロエマルジョン)に、平均して単一の標識された/結合した結合性物質ペプチド複合体のみが所与のコンパートメント内に存在するように分配する。特定の実施形態では、この区画化は、マイクロエマルジョン液滴の生成によって実現される(Shim、Ranasingheら、2013年、Shembekar、Chaipanら、2016年)。ペプチド複合体に加えて、PCR試薬も、液滴中に3種のプライマー(U1、Sp、およびU2tr)と共封入することができる。液滴形成後、U1およびSpのみがアニーリングし、記録タグ産物が増幅するように、高いアニーリング温度でエマルジョンPCRを数サイクル実施する(約5〜10サイクル)(例えば図13を参照されたい)。この最初の5〜10サイクルのPCRの後、アミノ酸コードタグ上のU2trおよびSptrが増幅に加わるようにアニーリング温度を低下させ、さらに約10ラウンドを実施する。3プライマーエマルジョンPCRにより、ペプチドUMI−バーコードとAAコードタグの全てが有効に組み合わされ、それにより、ペプチドおよびそのアミノ酸組成のジタグライブラリー表示が生成する。3プライマーPCRおよびタグの連鎖を実施する他のモダリティを使用することもできる。別の実施形態は、光デブロッキング、または不安定なブロッキングされた3’ヌクレオチドの3’デブロッキングを開始するための油可溶性還元体の添加によって活性化される、3’ブロッキングされたU2プライマーの使用である。エマルジョンPCR後、NGS配列決定のためのライブラリーエレメントをフォーマットするための一般的なプライマーを用いて別のラウンドのPCRを実施することができる。
このように、ライブラリーエレメントの異なる配列成分を計数および分類のために使用する。所与のペプチド(コンパートメントバーコード−UMIの組合せによって識別される)について、多くのライブラリーエレメントが存在し、それぞれが識別用AAコードタグおよびAA UMIを有する(例えば図13を参照されたい)。AAコードおよび付随するUMIを使用して、所与のペプチド内の所与のアミノ酸型の存在を計数する。したがって、ペプチド(おそらくGluC、LysC、またはEndo AsnN消化物)を、そのアミノ酸組成(例えば、Cysが2つ、Lysが1つ、Argが1つ、Tyrが2つなど)によって、空間的順序は考慮せず、特徴付ける。それにもかかわらず、これにより、ペプチドをプロテオームのサブセットにマッピングするため、また、同じタンパク質分子に由来する他のペプチドと組み合わせて使用した場合には、タンパク質を一意的に識別および定量化するための、十分なシグネチャがもたらされる。
I.末端アミノ酸(TAA)標識のための方法およびキット
ある特定の実施形態では、本明細書に記載の方法においてペプチドを結合性物質と接触させる前に、ペプチドの末端アミノ酸(例えば、NTAAまたはCTAA)を修飾または標識する。そのような修飾および/または標識のためのキットおよびキット成分が本明細書に記載されている。
一部の実施形態では、NTAAをフェニルイソチオシアネート(PITC)と反応させて、フェニルチオカルバモイル(PTC)−NTAA誘導体を生成する。エドマン分解では、一般には、フェニルイソチオシアネート(PITC)を使用してN末端を標識する。PITCは、本明細書に開示されている方法に十分に適する2つの性質を有する:(1)PITCはN末端アミン基を高い効率で標識する;および(2)得られるPTC誘導体化NTAAは、酸処理されると自己異性化を受け、それにより当該アミノ酸が残りのペプチドから切断される。
NTAAを標識するために使用することができる他の試薬としては、4−スルホフェニルイソチオシアネート、3−ピリジルイソチオシアネート(PYITC)、2−ピペリジノエチルイソチオシアネート(PEITC)、3−(4−モルホリノ)プロピルイソチオシアネート(MPITC)、3−(ジエチルアミノ)プロピルイソチオシアネート(DEPTIC)(Wang et al., 2009, Anal Chem 81: 1893-1900)、(1−フルオロ−2,4−ジニトロベンゼン(サンガー試薬、DNFB)、ダンシルクロリド(DNS−Cl、または1−ジメチルアミノナフタレン−5−スルホニルクロリド)、4−スルホニル−2−ニトロフルオロベンゼン(SNFB)、アセチル化試薬、アミジン化(グアニジニル化)試薬、2−カルボキシ−4,6−ジニトロクロロベンゼン、7−メトキシクマリン酢酸、チオアシル化試薬、チオアセチル化試薬、およびチオベンジル化試薬が挙げられる。NTAAを標識するためにブロッキングする場合、例えば、N−アセチルブロッキングをアシルペプチドヒドロラーゼ(APH)で除去することなど、末端をアンブロッキングするための手法がいくつも存在する(Farries,Harris et al., 1991、Eur. J. Biochem. 196: 679-685)。ペプチドのN末端をアンブロッキングする方法は、当技術分野で公知である(例えば、それぞれその全体が参照により本明細書に組み込まれるKrishnaet al., 1991、Anal. Biochem. 199: 45-50; Leone et al., 2011、Curr. Protoc.Protein Sci., Chapter 11: Unit 11.7; Fowler et al., 2001, Curr. Protoc. ProteinSci.、Chapter 11 : Unit 11.7を参照されたい)。
ダンシルクロリドは、ペプチドの遊離のアミン基と反応して、NTAAのダンシル誘導体をもたらす。DNFBおよびSNFBはペプチドのε−アミン基と反応して、それぞれDNP−NTAA、およびSNP−NTAAを生成させる。さらに、DNFBおよびSNFBはどちらも、リシン残基のε−アミンとも反応する。DNFBはまた、チロシンおよびヒスチジンアミノ酸残基とも反応する。SNFBは、DNFBよりも良好なアミン基に対する選択性を有し、NTAA修飾に好ましい(Carty and Hirs 1968)。ある特定の実施形態では、ポリペプチドをプロテアーゼ消化してペプチドにする前に、リシンε−アミンを有機無水物でプレブロッキングする。
別の有用なNTAA修飾因子はアセチル基であり、その理由は、アセチル化NTAAを除去する公知の酵素、すなわち、N末端アセチル化アミノ酸を切断し、それによりペプチドを単一のアミノ酸だけ有効に短縮するアシルペプチドヒドロラーゼ(APH)が存在するからである{Chang, 2015 #373;Friedmann, 2013 #374}。NTAAは、無水酢酸を用いて化学的にアセチル化することもでき、N末端アセチルトランスフェラーゼ(NAT)を用いて酵素的にアセチル化することもできる{Chang,2015 #373;Friedmann, 2013 #374}。さらに別の有用なNTAA修飾因子はアミジニル(グアニジニル)部分であり、その理由は、アミジン化NTAAの証明された切断化学、すなわち、N末端アミジン化ペプチドを0.5〜2%NaOHと一緒に穏やかにインキュベートすることにより、N末端アミノ酸の切断がもたらされることが文献で知られているからである{Hamada,2016 #383}。これにより、穏やかなエドマン様化学的N末端分解ペプチド配列決定プロセスが有効にもたらされる。さらに、ある特定のアミジン化(グアニジニル化)試薬および下流のNaOH切断は、DNAエンコーディングに非常に適合性である。
NTAAにDNP/SNP基、アセチル基、またはアミジニル(グアニジニル)基が存在することにより、工学的に操作された結合性物質との相互作用のより良好な取り扱いがもたらされ得る。低nMの親和性を有する商業的なDNP抗体がいくつも存在する。他のNTAA標識方法としては、トリプリガーゼ(trypligase)を用いた標識(Liebscherら、2014年、Angew Chem Int Ed Engl、53巻:3024〜3028頁)、およびアミノアシルトランスフェラーゼを用いた標識(Wagnerら、2011年、J Am Chem Soc、133巻:15139〜15147頁)が挙げられる。
イソチオシアネートは、イオン性液体の存在下では、第一級アミンに対して増強された反応性を有することが示されている。イオン性液体は、有機化学反応における優れた溶媒であり(また、触媒として作用する)、チオ尿素を形成する、イソチオシアネートとアミンの反応を増強することができる。例は、フェニルイソチオシアネート(PITC)による芳香族および脂肪族アミンの迅速かつ効率的な標識のためにイオン性液体1−ブチル−3−メチル−イミダゾリウムテトラフルオロボレート[Bmim][BF4]を使用することである(Le, Chen et al. 2005)。エドマン分解は、PITCなどのイソチオシアネートとペプチドのアミノN末端の反応を伴う。そのように、一実施形態では、より穏やかな標識および分解条件をもたらすことによってエドマン分解プロセスの効率を改善するためにイオン性液体を使用する。例えば、イオン性液体[Bmim][BF4]中5%(vol./vol.)PITCを25℃で10分間使用することは、ピリジン、エタノール、およびddH2Oを含有する溶液(1:1:1 vol./vol./vol.)中5%(vol./vol.)PITCを55℃で60分間使用する標準のエドマンPITC誘導体化条件下で標識することよりも効率的である(Wang,Fang et al. 2009)。好ましい実施形態では、ポリペプチドの内部のリシン、チロシン、ヒスチジン、およびシステインアミノ酸を、ペプチドへの断片化の前にブロッキングする。このように、ペプチド配列決定反応中、NTAAのペプチドα−アミン基のみが修飾に利用可能になるようにする。これは、特に、DNFB(サンガー試薬)およびダンシルクロリドを使用する場合に適切である。
ある特定の実施形態では、NTAAは、NTAA標識ステップの前にブロッキングされている(特にタンパク質の元のN末端)。その場合、例えば、N−アセチルブロッキングをアシルペプチドヒドロラーゼ(APH)で除去することなど、N末端をアンブロッキングするための手法がいくつも存在する(Farries、Harrisら、1991年)。ペプチドのN末端をアンブロッキングする他の方法がいくつも当技術分野で公知である(例えば、それぞれ、その全体が参照により本明細書に組み込まれる、Krishnaら、1991年、Anal. Biochem.、199巻:45〜50頁;Leoneら、2011年、Curr. Protoc. Protein Sci.、第11章:ユニット11.7;Fowlerら、2001年、Curr. Protoc. Protein Sci.、第11章:ユニット11.7を参照されたい)。
CTAAは、Hermanson(Hermanson、2013年)に記載されている通り、いくつもの異なるカルボキシル反応性試薬を用いて修飾することができる。別の例では、CTAAを混合無水物およびイソチオシアネートで修飾して、チオヒダントインを生成する((LiuおよびLiang、2001年)および米国特許第5,049,507号)。チオヒダントインで修飾されたペプチドは、基剤中上昇した温度で切断されて、最後から2番目のCTAAが露出し、それにより、C末端に基づくペプチド分解配列決定手法を有効に生成することができる(LiuおよびLiang、2001年)。CTAAに対して行うことができる他の修飾としては、パラ−ニトロアニリド基の付加および7−アミノ−4−メチルクマリニル基の付加が挙げられる。
J.末端アミノ酸切断のための方法およびキット
ペプチドの解析に関するある特定の実施形態では、末端アミノ酸(N末端またはC末端)への結合性物質の結合、およびコーディングタグ情報の記録タグへの移行、記録タグ情報のコーディングタグへの移行、記録タグ情報およびコーディングタグ情報のジタグ構築物への移行の後、末端アミノ酸をペプチドから除去または切断して、新しい末端アミノ酸を露出させる。一部の実施形態では、末端アミノ酸は、NTAAである。他の実施形態では、末端アミノ酸は、CTAAである。
末端アミノ酸の切断は、化学的切断および酵素的切断を含めた、任意の数の公知の技法によって実現することができる。化学的切断の例は、エドマン分解である。ペプチドのエドマン分解中、n NTAAをフェニルイソチオシアネート(PITC)と弱アルカリ性条件下で反応させて、フェニルチオカルバモイル−NTAA誘導体を形成する。次に、酸性条件下で、フェニルチオカルバモイル−NTAA誘導体を切断し、それにより、遊離のチアゾリノン誘導体を生成し、それにより、ペプチドの(n−1)番目のアミノ酸をN末端アミノ酸((n−1)番目のNTAA)に変換する。このプロセスのステップを以下に例示する。
典型的なエドマン分解では、上記の通り、長いインキュベーション時間にわたって厳しい高温の化学的条件(例えば、無水TFA)の発生が必要になる。これらの条件は、一般に、巨大分子の核酸エンコーディングには適合しない。
化学的エドマン分解を核酸エンコーディングに好都合の手法に変換するために、厳しい化学的ステップを穏やかな化学的分解または効率的な酵素的ステップで置き換える。一実施形態では、化学的エドマン分解を、元々記載された条件よりも穏やかな条件を使用して利用することができる。アセトニトリル中無水TFAを酢酸トリエチルアミンで置き換えること(例えば、その全体が参照により組み込まれる、Barrett、1985年、Tetrahedron Lett.、26巻:4375〜4378頁を参照されたい)を含め、エドマン分解のための穏やかな切断条件がいくつか文献に記載されている。NTAAの切断は、エドマン分解と比較して穏やかな切断条件を使用するチオアシル化分解を使用することによって実現することもできる(米国特許第4,863,870号を参照されたい)。
別の実施形態では、無水TFAによる切断を、穏やかな条件下で切れやすいペプチド結合のカルボニル基のチオ尿素硫黄原子の求核攻撃によるPITC誘導体化N末端アミノ酸の除去を触媒する、工学的に操作された酵素である「エドマナーゼ(Edmanase)」で置き換えることができる(その全体が参照により組み込まれる、米国特許公開第US2014/0273004号を参照されたい)。エドマナーゼは、Trypanosoma cruziに由来するシステインプロテアーゼであるクルザイン(cruzain)を改変することによって作出された(Borgo、2014年)。C25G変異により触媒性システイン残基が除去されたと同時に、エドマン試薬(PITC)のフェニル部分との立体的な適合を創出するための3つの変異(G65S、A138C、L160Y)が選択された。
NTAAの酵素的切断は、アミノペプチダーゼによって実現することもできる。アミノペプチダーゼは、単量体酵素および多量体酵素として天然に存在し、金属またはATP依存性であり得る。天然のアミノペプチダーゼは、非常に限られた特異性を有し、一般的に、N末端アミノ酸を前進的に切断し、それにより、アミノ酸を次々に切断する。本明細書に記載の方法に関しては、アミノペプチダーゼを、NTAAに対して、N末端標識で修飾されている場合にのみ特異的な結合活性または触媒活性を有するように工学的に操作することができる。例えば、アミノペプチダーゼを、N末端アミノ酸がDNP/SNP、PTC、ダンシルクロリド、アセチル、アミジニルなどの基によって修飾されている場合にN末端アミノ酸のみを切断するように工学的に操作することができる。このように、アミノペプチダーゼは、一度にN末端から単一のアミノ酸だけ切断し、分解サイクルの制御を可能にする。一部の実施形態では、改変アミノペプチダーゼは、アミノ酸残基同一性に関しては非選択的である一方で、N末端標識に関しては選択的である。他の実施形態では、改変アミノペプチダーゼは、アミノ酸残基同一性とN末端標識の両方に関して選択的である。酵素的NTAA分解の修飾特異性のモデルの例は、BorgoおよびHavranekにより例示されており、そこでは、構造−機能補助設計を通じて、メチオニンアミノペプチダーゼがロイシンアミノペプチダーゼに変換された(BorgoおよびHavranek、2014年)。DNP/SNPで修飾されたNTAAなどの修飾されたNTAAに同様の手法をとることができ、ここで、アミノペプチダーゼを、DNP/SNP基が存在するN末端アミノ酸のみを切断するように工学的に操作する(構造−機能に基づく設計および定向進化の両方を使用する)。個々のまたは小さな群の標識した(ビオチン化した)NTAAに結合し、それを切断する工学的に操作されたアミノペプチダーゼ変異体が記載されている(PCT公開第WO2010/065322号を参照されたい)。
ある特定の実施形態では、緻密な単量体金属酵素的アミノペプチダーゼを、DNPで標識されたNTAAを認識し、切断するように工学的に操作する。単量体メタロ−アミノペプチダーゼの使用には、重要な利点が2つある:1)緻密な単量体タンパク質は、ファージディスプレイを使用してディスプレイおよびスクリーニングするのがはるかに容易である;2)メタロ−アミノペプチダーゼは、適切な金属カチオンを添加または除去することによってその活性をオン/オフにすることができるという点で、独特の利点を有する。例示的なアミノペプチダーゼとしては、Streptomyces sp.KK506(SKAP)(Yoo、Ahnら、2010年)、Streptomyces griseus(SGAP)、Vibrio proteolyticus(VPAP)、(SpunginおよびBlumberg、1989年、Ben−Meir、Spunginら、1993年)などの、アミノペプチダーゼのM28ファミリーが挙げられる。これらの酵素は、室温およびpH8.0で安定であり、ロバストであり、かつ活性であり、したがって、ペプチド解析に好ましい穏やかな条件に適合する。
別の実施形態では、アミノペプチダーゼを、N末端アミノ酸標識の存在下でのみ活性になるように工学的に操作することにより、周期的切断が達成される。さらに、アミノペプチダーゼを、非特異的になるように、したがって、1つの特定のアミノ酸を別のアミノ酸に対して選択的に認識するのではなく、単に標識されたN末端を認識するように、工学的に操作することができる。好ましい実施形態では、メタロペプチダーゼ単量体アミノペプチダーゼ(例えば、Vibroロイシンアミノペプチダーゼ)(Hernandez−Moreno、Villasenorら、2014年)を、修飾されたNTAA(例えば、PTC、DNP、SNP、アセチル化された、アシル化されたなど)のみを切断するように工学的に操作する。
さらに別の実施形態では、アセチル化NTAAを切断するように工学的に操作されたアシルペプチドヒドロラーゼ(APH)を使用することによって周期的切断を達成する。APHは、ブロッキングされたペプチドからのNα−アセチル化アミノ酸の除去を触媒することができるセリンペプチダーゼであり、真核細胞、細菌細胞および古細菌細胞において、N末端がアセチル化されたタンパク質の重要な調節因子である。ある特定の実施形態では、APHは、二量体であり、エキソペプチダーゼ活性のみを有する(Gogliettino、Balestrieriら、2012年、Gogliettino、Riccioら、2014年)。工学的に操作されたAPHは、内因性または野生型APHよりも高い親和性および低い選択性を有し得る。
さらに別の実施形態では、NTAAのアミジン化(グアニジニル化)を使用して、標識されたNTAAのNaOHを使用した穏やかな切断を可能にする(Hamada、2016年、その全体が参照により組み込まれる)。S−メチルイソチオ尿素、3,5−ジメチルピラゾール−1−カルボキサミジン、S−エチルチオウロニウムブロミド、S−エチルチオウロニウムクロリド、O−メチルイソ尿素、O−メチルイソウロニウム硫酸塩、O−メチルイソ尿素硫化水素塩、2−メチル−1−ニトロイソ尿素、アミノイミノメタンスルホン酸、シアナミド、シアノグアニド、ジシアンジアミド、3,5−ジメチル−1−グアニルピラゾール硝酸塩および3,5−ジメチルピラゾール、N,N’−ビス(オルト−クロロ−Cbz)−S−メチルイソチオ尿素およびN,N’−ビス(オルト−ブロモ−Cbz)−S−メチルイソチオ尿素を含めたいくつものアミジン化(グアニジニル化)試薬が当技術分野で公知である(Katritzky、2005年、その全体が参照により組み込まれる)。
NTAAの標識、結合、および分解ワークフローの例は以下の通りである(例えば図41および図42を参照されたい):タンパク質分解による消化に由来する、記録タグで標識されたペプチドの大きな集団(例えば、5千万〜10億)を単一分子シーケンシング基板(例えば、多孔質ビーズ)に適切な分子内間隔でランダムに固定化する。周期的に、各ペプチドのN末端アミノ酸(NTAA)を小さな化学的部分(例えば、DNP、SNP、アセチル)で修飾して、NTAA分解プロセスの周期的制御をもたらし、同類結合性物質による結合親和性を増強する。各固定化ペプチドの修飾されたN末端アミノ酸(例えば、DNP−NTAA、SNP−NTAA、アセチル−NTAA)に同類のNTAA結合性物質を結合させ、結合したNTAA結合性物質に付随するコーディングタグからの情報を固定化されたペプチドに付随する記録タグに移行させる。NTAAの認識、結合、およびコーディングタグ情報の記録タグへの移行の後、標識されたNTAAを、標識の存在下でのみNTAAを切断することができる工学的に操作されたアミノペプチダーゼ(例えば、DNP−NTAAもしくはSNP−NTAAに対して)または工学的に操作されたAPH(例えば、アセチル−NTAAに対して)に曝露させることによって除去する。他のNTAA標識(例えば、PITC)も、適切に工学的に操作されたアミノペプチダーゼとともに使用することもできる。特定の実施形態では、単一の工学的に操作されたアミノペプチダーゼまたはAPHは、N末端アミノ酸標識を有する全ての可能性のあるNTAA(翻訳後修飾バリアントを含む)を普遍的に切断する。別の特定の実施形態では、2種、3種、4種、またはそれよりも多くの工学的に操作されたアミノペプチダーゼまたはAPHを使用して、標識されたNTAAのレパートリーを切断する。
DNPまたはSNPで標識されたNTAAに対する活性を有するアミノペプチダーゼは、ベンジルペニシリンに対するメタロ−ベータ−ラクタマーゼ酵素の工学的操作におけるPonsardらにより記載されている手法(Ponsard、Galleniら、2001年、Fernandez−Gacio、Uguenら、2003年)のような、アポ酵素(金属補助因子の不在下では不活性)に対する密接結合の選択、その後の機能的触媒の選択ステップを組み合わせるスクリーニングを使用して選択することができる。この二段階選択は、Zn2+イオンの添加によって活性化されたメタロ−APの使用を伴う。固定化されたペプチド基板への密接結合選択の後、Zn2+を導入し、DNPまたはSNPで標識されたNTAAを加水分解することが可能な、触媒として活性なファージにより、結合したファージの上清中への放出が導かれる。DNPまたはSNPで標識されたNTAAを切断するための活性なAPを濃縮するために、選択ラウンドを繰り返し実施する。
本明細書において提示される実施形態のいずれかでは、NTAAの切断試薬のNTAAへの動員は、キメラ切断酵素およびキメラNTAA修飾因子によって増強することができ、ここで、キメラ切断酵素およびキメラNTAA修飾因子は、それぞれ、互いと密接結合反応することが可能な部分を含む(例えば、ビオチン−ストレプトアビジン)(例えば図39を参照されたい)。例えば、NTAAをビオチン−PITCで修飾し、キメラ切断酵素(ストレプトアビジン−エドマナーゼ)を修飾されたNTAAにストレプトアビジン−ビオチン相互作用によって動員し、それにより切断酵素の親和性および効率を改善することができる。修飾されたNTAAが切断され、付随する切断酵素と共にペプチドから発散する。キメラエドマナーゼの例では、この手法により、親和性KDがμMからサブピコモルまで有効に増大する。記録タグと相互作用する切断剤上のDNAタグを使用した係留により、同様の切断の増強も実現することができる(例えば図44を参照されたい)。
NTAAの切断のための代替として、ジペプチジルアミノペプチダーゼ(DAP)を使用して、最後の2つのN末端アミノ酸をペプチドから切断することができる。ある特定の実施形態では、単一のNTAAを切断することができる(例えば図45を参照されたい):図45は、ブテラーゼIペプチド基板のN末端ライゲーションによりTEVエンドペプチダーゼ基板をペプチドのN末端に付着させる、N末端分解のための手法を示す。付着後、TEVエンドペプチダーゼにより、新しくライゲーションされたペプチドが照会ペプチド(配列決定を受けているペプチド)から切断され、NTAAに付着した単一のアスパラギン(N)が残る。N末端から2つのアミノ酸を切断するDAPと一緒にインキュベートすることにより、元のNTAAの最終的な除去がもたらされる。このプロセス全体をN末端分解プロセスとして周期的に繰り返すことができる。
CTAA結合性物質に関する実施形態に関しては、CTAAをペプチドから切断する方法も当技術分野で公知である。例えば、米国特許第6,046,053号には、ペプチドまたはタンパク質をアルキル酸無水物と反応させて、カルボキシ末端をオキサゾロンに変換させ、酸およびアルコールまたはエステルを用いた反応によってC末端アミノ酸を遊離させる方法が開示されている。CTAAの酵素的切断はまた、カルボキシペプチダーゼによっても実現することができる。いくつかのカルボキシペプチダーゼは、アミノ酸の優先性を示し、例えば、カルボキシペプチダーゼBは、アルギニンおよびリシンなどの塩基性アミノ酸において優先的に切断する。上記の通り、カルボキシペプチダーゼをアミノペプチダーゼと同じように改変して、C末端標識を有するCTAAに特異的に結合するカルボキシペプチダーゼを工学的に作製することもできる。このように、カルボキシペプチダーゼは、C末端から一度に単一のアミノ酸のみを切断し、分解サイクルの制御を可能にする。一部の実施形態では、改変カルボキシペプチダーゼは、アミノ酸残基同一性に関しては非選択的であるが、C末端標識については選択的である。他の実施形態では、改変カルボキシペプチダーゼは、アミノ酸残基同一性およびC末端標識の両方に関して選択的である。
K.伸長記録タグ、伸長コーディングタグ、またはジタグを処理および解析するための方法およびキット
目的の巨大分子(複数可)を表す伸長記録タグ、伸長コーディングタグ、およびジタグライブラリーを、種々の核酸配列決定法を使用して処理および解析することができる。配列決定法の例としては、これだけに限定されないが、連鎖停止配列決定(サンガー配列決定);合成による配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、ポロニーシーケンシング、イオン半導体シーケンシング、およびパイロシーケンシングなどの次世代シーケンシング法;および単一分子リアルタイムシーケンシング、ナノポアに基づく配列決定、DI(duplex interrupted)シーケンシング、および先端顕微鏡を使用したDNAのダイレクトイメージングなどの第3世代シーケンシング法が挙げられる。
伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーを様々なやり方で増幅することができる。伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーに、例えば、PCRまたはエマルジョンPCRによって指数関数的な増幅を行うことができる。エマルジョンPCRにより、より均一な増幅がもたらされることが公知である(Hori, Fukano et al. 2007)。一部の実施形態では、反復のバーコードまたはスペーサー配列を有する配列の場合、PCR鋳型スイッチングのリスクが高く、そのリスクを低減するためにエマルジョンPCRまたは線形増幅を使用してもよい。例えば、米国特許第9,593,375(B2)号に開示されているようなエマルジョンPCRを使用することができる。この文献は、あらゆる目的のために参照により本明細書に組み込まれる。
あるいは、伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーに、例えば、T7 RNAポリメラーゼおよび逆転写(RT)ポリメラーゼを使用した鋳型DNAのin vitro転写による線形増幅を行って、cDNAへとコピーし戻すことができる。また、一態様では、直鎖増幅は、鋳型スイッチングを低減または排除する。伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーは、それに含有されるユニバーサルフォワードプライミング部位およびユニバーサルリバースプライミング部位に適合するプライマーを使用して増幅することができる。伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーは、伸長記録タグ、伸長コーディングタグ、またはジタグの5’末端、3’末端または両末端のいずれかに配列を付加するための尾部を有するプライマーを使用して増幅することもできる。伸長記録タグ、伸長コーディングタグ、またはジタグの末端に付加することができる配列としては、多数のライブラリーを単一の配列決定の実行に多重化することを可能にするライブラリー特異的指数配列、アダプター配列、読み取りプライマー配列、または配列決定プラットフォームに適合する伸長記録タグ、伸長コーディングタグ、もしくはジタグのライブラリーを作出するための任意の他の配列が挙げられる。次世代シーケンシングのための調製におけるライブラリー増幅の例は以下の通りである:ビーズ(約10ng)約1mgから溶出した伸長記録タグライブラリー、200μMのdNTP、1μMの各フォワードおよびリバース増幅プライマー、0.5μl(1U)のPhusion Hot Start酵素(New England Biolabs)を使用してPCR反応体積20μlをセットアップし、以下のサイクル条件に供する:98℃で30秒、その後、98℃で10秒、60℃で30秒、72℃で30秒を20サイクル、その後、72℃で7分、次いで、4℃で保持。
ある特定の実施形態では、増幅前、増幅中または増幅後のいずれかにおいて、伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーに標的濃縮を行うことができる。標的濃縮は、配列決定前に、伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーから、目的の巨大分子を表す伸長記録タグを選択的に捕捉または増幅するために使用することができる。タンパク質配列に対する標的濃縮は、費用が高く、また、標的タンパク質に対して高度に特異的な結合性物質を作製することが難しいので、困難である。抗体は、非特異的であり、何千ものタンパク質にわたる規模生産が難しいことが周知である。本開示の方法では、タンパク質コードを核酸コードに変換し、次いで、DNAライブラリーに利用可能な広範囲の標的化DNA濃縮戦略を使用することによってこの問題を回避する。目的のペプチドを、それらの対応する伸長記録タグを濃縮することによって試料中で濃縮することができる。標的化濃縮の方法が当技術分野で公知であり、それらとして、ハイブリッド捕捉アッセイ、PCRに基づくアッセイ、例えば、TruSeq custom Amplicon(Illumina)、padlockプローブ(分子反転プローブとも称される)などが挙げられる(それぞれ、その全体が参照により本明細書に組み込まれる、Mamanovaら、2010年、Nature Methods、7巻:111〜118頁;Bodiら、J. Biomol. Tech.、2013年、24巻:73〜86頁;Ballesterら、2016年、Expert Review of Molecular Diagnostics、357〜372頁;Mertesら、2011年、Brief Funct. Genomics、10巻:374〜386頁;Nilssonら、1994年、Science、265巻:2085〜8頁を参照されたい)。
一実施形態では、伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーをハイブリッド捕捉に基づくアッセイによって濃縮する(例えば、図17Aおよび図17Bを参照されたい)。ハイブリッド−捕捉に基づくアッセイでは、伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーを、アフィニティータグ(例えば、ビオチン)で標識した標的特異的オリゴヌクレオチドまたは「ベイトオリゴヌクレオチド」とハイブリダイズさせる。標的特異的オリゴヌクレオチドとハイブリダイズさせた伸長記録タグ、伸長コーディングタグ、またはジタグを、親和性リガンド(例えば、ストレプトアビジンでコーティングしたビーズ)を使用してそれらの親和性タグを介して「プルダウン」し、バックグラウンド(非特異的な)伸長記録タグを洗い流す(例えば、図17を参照されたい)。次いで、濃縮された伸長記録タグ、伸長コーディングタグ、またはジタグを正の濃縮のために得る(例えば、ビーズから溶出する)。
アレイに基づく「in situ」オリゴヌクレオチド合成およびその後のオリゴヌクレオチドプールの増幅によって合成されたベイトオリゴヌクレオチドに関しては、所与のオリゴヌクレオチドアレイ内でユニバーサルプライマーのいくつかのセットを使用することにより、競合するベイトを工学的に操作してプールにすることができる。それぞれの型のユニバーサルプライマーについて、ビオチン化プライマーと非ビオチン化プライマーの比により、濃縮比を制御する。いくつかのプライマー型の使用により、いくつかの濃縮比を設計して最終的なオリゴヌクレオチドベイトプールにすることができる。
ベイトオリゴヌクレオチドを目的の巨大分子を表す伸長記録タグ、伸長コーディングタグ、またはジタグと相補的になるように設計することができる。伸長記録タグ、伸長コーディングタグ、またはジタグ内のスペーサー配列に対するベイトオリゴヌクレオチドの相補性の程度は、0%から100%まで、およびその間の任意の整数にすることができる。このパラメーターは、少しの濃縮実験によって容易に最適化することができる。一部の実施形態では、コーディングタグ設計においてエンコーダー配列に対するスペーサーの長さを最小化する、または、スペーサーを、ベイト配列とのハイブリダイゼーションに利用できないように設計する。1つの手法は、補助因子の存在下で二次構造を形成するスペーサーを使用することである。そのような二次構造の例は、互いの上に積み重なった2つまたはそれよりも多くのグアニンカルテットによって形成される構造である、G−4重鎖である(Bochman、Paeschkeら、2012年)。グアニンカルテットは、フーグスティーン水素結合によって結びついた4つのグアニン塩基によって形成される平面正方形構造である。G−4重鎖構造は、カチオン、例えば、K+イオン対Li+イオンの存在下で安定化される。
使用するベイトオリゴヌクレオチドの数を最小限にするために、各タンパク質に由来する比較的一意のペプチドのセットをバイオインフォマティクスにより識別することができ、目的のペプチドの対応する伸長記録タグライブラリー表示と相補的なベイトオリゴヌクレオチドのみをハイブリッド捕捉アッセイに使用する。同じまたは異なるベイトセットを用いて逐次的なラウンドまたは濃縮を行うこともできる。
その断片(例えば、ペプチド)を表す伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリー中の巨大分子(例えば、タンパク質またはポリペプチド)の全長を濃縮するために、「タイルド」ベイトオリゴヌクレオチドをタンパク質の核酸表示全体にわたって設計することができる。
別の実施形態では、プライマー伸長およびライゲーションに基づき媒介される増幅濃縮(AmpliSeq、PCR、TruSeq TSCAなど)を使用して、巨大分子のサブセットを表すライブラリーエレメントを選択し、モジュール画分を濃縮することができる。競合するオリゴを使用して、プライマー伸長、ライゲーション、または増幅の程度を調整することもできる。最も単純な実行では、これは、ユニバーサルプライマー尾部を含む標的特異的プライマーと5’ユニバーサルプライマー尾部を欠く競合プライマーの混合物によって実現することができる。最初のプライマー伸長の後、5’ユニバーサルプライマー配列を有するプライマーのみを増幅することができる。ユニバーサルプライマー配列を有するプライマーとユニバーサルプライマー配列を有さないプライマーの比により、増幅する標的の分率を制御する。他の実施形態では、ハイブリダイズするが伸長しないプライマーを含めることを使用して、プライマー伸長、ライゲーション、または増幅を受けるライブラリーエレメントの分率をモジュレートすることができる。
配列決定前に伸長記録タグ、伸長コーディングタグ、またはジタグをライブラリーから選択的に除去するために標的化濃縮法を負の選択形式で使用することもできる。したがって、ビオチン化ベイトオリゴヌクレオチドおよびストレプトアビジンでコーティングしたビーズを使用する上記の例において、上清を配列決定のために保持する一方で、ビーズに結合したベイト−オリゴヌクレオチド:伸長記録タグ、伸長コーディングタグ、またはジタグハイブリッドは解析しない。除去することができる望ましくない伸長記録タグ、伸長コーディングタグ、またはジタグの例は、豊富な巨大分子種、例えば、タンパク質、アルブミン、免疫グロブリンなどを表すものである。
標的とハイブリダイズするがビオチン部分を欠く競合オリゴヌクレオチドベイトをハイブリッド捕捉ステップに使用して、濃縮しようとする任意の特定の遺伝子座の分率をモジュレートすることもできる。競合オリゴヌクレオチドベイトは、標的とのハイブリダイゼーションについて、濃縮中の標的プルダウンの分率を有効にモジュレートする標準のビオチン化ベイトと競合する(例えば図17を参照されたい)。特にアルブミンなどの過度に豊富な種に関して、この競合的な抑制手法を使用することで10桁のタンパク質発現のダイナミックレンジを何桁か圧縮することができる。したがって、所与の遺伝子座に関して、標準のハイブリッド捕捉に対する捕捉されるライブラリーエレメントの分率を100%から0%濃縮までモジュレートすることができる。
さらに、ライブラリー正規化技法を使用して、過度に豊富な種を伸長記録タグ、伸長コーディングタグ、またはジタグライブラリーから除去することができる。この手法は、トリプシン、LysC、GluCなどの部位特異的プロテアーゼ消化によって生成されたペプチドを起源とする規程された長さのライブラリーに対して最良に機能する。一実施例では、正規化は、二本鎖ライブラリーを変性させ、ライブラリーエレメントを再アニーリングさせることによって実現することができる。豊富なライブラリーエレメントは、2分子ハイブリダイゼーションカイネティクスの二次速度定数に起因して、豊富さがより低いエレメントよりも迅速に再アニーリングする(Bochman、Paeschkeら、2012年)。ヒドロキシアパタイトカラムでのクロマトグラフィー(VanderNootら、2012年、Biotechniques、53巻:373〜380頁)またはライブラリーを、dsDNAライブラリーエレメントを破壊するタラバガニ由来の2重鎖特異的ヌクレアーゼ(DSN)で処理すること(Shaginら、2002年、Genome Res.、12巻:1935〜42頁)などの当技術分野で公知の方法を使用して、ssDNAライブラリーエレメントを豊富なdsDNAライブラリーエレメントから分離することができる。
固体支持体に付着させる前の巨大分子および/または得られた伸長記録タグライブラリーの分画、濃縮、およびサブトラクション方法の任意の組合せにより、配列決定読み取りを節約し、豊富さが低い種の測定を改善することができる。
一部の実施形態では、伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーをライゲーションまたは末端相補的PCRによって連鎖状にして、それぞれ多数の異なる伸長記録タグ、伸長コーディングタグ、またはジタグを含む長いDNA分子を創出する(それぞれ、その全体が参照により組み込まれる、Duら、2003年、BioTechniques、35巻:66〜72頁;Mueckeら、2008年、Structure、16巻:837〜841頁;米国特許第5,834,252号)。この実施形態は、例えば、長鎖のDNAをナノポアシーケンシングデバイスによって解析するナノポアシーケンシングである。
一部の実施形態では、伸長記録タグ、伸長コーディングタグ、またはジタグに対して直接単一分子解析を実施する(例えば、Harrisら、2008年、Science、320巻:106〜109頁を参照されたい)。伸長記録タグ、伸長コーディングタグ、またはジタグを、フローセル表面(任意選択でマイクロセルパターン)へのローディングに適合するフローセルまたはビーズなどの固体支持体上で直接解析することができ、ここで、フローセルまたはビーズは、単一分子シーケンサーまたは単一分子脱コーディング計器に組み込むことができる。単一分子脱コーディングに関しては、プールした蛍光標識した脱コーディングオリゴヌクレオチドの数ラウンドのハイブリダイゼーション(Gundersonら、2004年、Genome Res.、14巻:970〜7頁)を使用して、伸長記録タグ内のコーディングタグの同一性および順序の両方を確認することができる。コーディングタグの結合の順序をデコンボリューションするために、結合性物質を上記のサイクル特異的コーディングタグで標識することができる(Gundersonら、2004年、Genome Res.、14巻:970〜7頁も参照されたい)。サイクル特異的コーディングタグは、単一の巨大分子を表す単一の連鎖状の伸長記録タグ、または単一の巨大分子を表す伸長記録タグの集合のどちらに対しても機能する。
伸長レポータータグ、伸長コーディングタグ、またはジタグライブラリーの配列決定後、得られた配列をそれらのUMIにより崩壊させ、次いで、それらの対応する巨大分子(例えば、ペプチド、タンパク質、タンパク質複合体)に付随させ、細胞内の巨大分子型全体(例えば、ペプチド、ポリペプチド、タンパク質巨大分子についてのプロテオーム)とアラインメントすることができる。得られた配列をそれらのコンパートメントタグにより崩壊させ、特定の実施形態では、単一のタンパク質分子のみまたは非常に限られた数のタンパク質分子を含有する、それらの対応するコンパートメントのプロテオームに付随させることもできる。タンパク質の識別および数量化はどちらも、このデジタルペプチド情報から容易に引き出すことができる。
一部の実施形態では、コーディングタグ配列を特定の配列決定解析プラットフォームに対して最適化することができる。特定の実施形態では、配列決定プラットフォームは、ナノポアシーケンシングである。一部の実施形態では、配列決定プラットフォームの塩基当たりのエラー率は、>5%、>10%、>15%、>20%、>25%、または>30%である。例えば、ナノポアシーケンシング装置を使用して伸長記録タグを解析する場合、バーコード配列(例えば、エンコーダー配列)を、ナノポアを通過時に最適に電気的に区別可能になるように設計することができる。本明細書に記載の方法に従ったペプチド配列決定は、ナノポアシーケンシングの一塩基正確度はまだ幾分低いが(75%〜85%)、「エンコーダー配列」の決定は、はるかにより正確であるはずである(>99%)ことを考慮すると、ナノポアシーケンシングによく適し得る。さらに、DI(duplex interrupted)ナノポアシーケンシングと称される技法を、システム設計を著しく単純化する分子モーターを必要とせずに、ナノポア鎖シーケンシングと共に使用することができる(Derrington、Butlerら、2010年)。DIナノポアシーケンシングによる伸長記録タグの読み取りには、連鎖状の伸長記録タグライブラリー内のスペーサーエレメントを相補的なオリゴヌクレオチドとアニーリングする必要がある。本明細書で使用されるオリゴヌクレオチドは、得られる2重鎖の有効なTmを上昇させるために、LNA、または他の改変された核酸または類似体を含んでよい。これらの2重鎖スペーサー領域で装飾された一本鎖伸長記録タグがポアを通過するに従い、2本鎖領域が狭窄域で一過性にストールし、それにより、2重鎖領域に隣接する約3塩基の電流読み取りが可能になる。特定の実施形態では、DIナノポアシーケンシングのために、エンコーダー配列を、スペーサーエレメントに隣接する3塩基により最大限に電気的に区別可能なナノポアシグナルが生じるように設計する(Derringtonら、2010年、Proc. Natl. Acad. Sci. USA、107巻:16060〜5頁)。モーターフリーDIシーケンシングの代替として、スペーサーエレメントを、ナノポアを通過するに従い、伸長記録タグ、伸長コーディングタグ、またはジタグを一過性にストールし、それにより、隣接するエンコーダー配列の読み取りを可能にするG−カルテットなどの二次構造をとるように設計することができる(Shim、Tanら、2009年、Zhang、Zhangら、2016年)。ストールを過ぎて進んだ後、次のスペーサーにより一過性のストールが創出され、それにより、次のエンコーダー配列の読み取りが可能になる、などである。
本明細書に開示されている方法は、複数の巨大分子(例えば、ペプチド)の同時(多重化)検出、定量化および/または配列決定を含めた解析のために使用することができる。多重化とは、本明細書で使用される場合、複数の巨大分子を同じアッセイで解析することを指す。複数の巨大分子は、同じ試料に由来するものであってもよく、異なる試料に由来するものであってもよい。複数の巨大分子は、同じ対象に由来するものであってもよく、異なる対象に由来するものであってもよい。解析される複数の巨大分子は、異なる巨大分子(例えば、ペプチド)であってもよく、異なる試料に由来する同じ巨大分子(例えば、ペプチド)であってもよい。複数の巨大分子は、2またはそれよりも多くの巨大分子、5またはそれよりも多くの巨大分子、10またはそれよりも多くの巨大分子、50またはそれよりも多くの巨大分子、100またはそれよりも多くの巨大分子、500またはそれよりも多くの巨大分子、1000またはそれよりも多くの巨大分子、5,000またはそれよりも多くの巨大分子、10,000またはそれよりも多くの巨大分子、50,000またはそれよりも多くの巨大分子、100,000またはそれよりも多くの巨大分子、500,000またはそれよりも多くの巨大分子、または1,000,000またはそれよりも多くの巨大分子を含む。
試料多重化は、記録タグで標識された巨大分子試料を予めバーコーディングすることによって実現することができる。各バーコードは異なる試料を表し、試料を周期的結合アッセイまたは配列解析前にプールすることができる。このように、多くのバーコードで標識した試料を単一のチューブ内で同時に処理することができる。この手法は、逆相タンパク質アレイ(RPPA)で実施するイムノアッセイに対する有意な改善である(Akbani、Beckerら、2014年、CreightonおよびHuang、2015年、NishizukaおよびMills、2016年)。このように、本開示は、基本的に、単純なワークフローを用いるRPPAアッセイの代わりに、多重化された高度にデジタルの試料および分析物を提供する。
L. NTAAの認識、記録タグ伸長、およびNTAAの切断の周期的ラウンドにより巨大分子を特徴付けるための方法およびキット
ある特定の実施形態では、本開示において提示される巨大分子を解析するための本キットを使用する方法は、多数の結合サイクルを有し、ここで巨大分子を複数の結合性物質と接触させ、連続的な結合性物質の結合により、履歴的な結合情報が核酸に基づくコーディングタグの形態で少なくとも1つの巨大分子に付随する記録タグに移行する。このように、多数の結合事象に関する情報を含有する履歴的記録を核酸形式で生成する。
N末端分解に基づく手法を使用してペプチド巨大分子を解析する方法に関する実施形態では(例えば、図3、図4、図41、および図42を参照されたい)、第1の結合性物質をnアミノ酸のペプチドのn番目のNTAAに接触させ、結合させ、第1の結合性物質のコーディングタグ情報をペプチドに付随する記録タグに移行させ、それにより、一次伸長記録タグを生成した後、n番目のNTAAを本明細書に記載の通り切断する。n番目のNTAAの切断により、ペプチドの(n−1)番目のアミノ酸がN末端アミノ酸に変わり、これは、本明細書では(n−1)番目のNTAAと称される。本明細書に記載の通り、n番目のNTAAは、必要に応じて、部分(例えば、PTC、DNP、SNP、アセチル、アミジニルなど)で標識することができ、これは、標識された形態のNTAAに結合するように工学的に操作された切断酵素と併せて特に有用である。n番目のNTAAを標識した場合、次いで、(n−1)番目のNTAAも同じ部分を用いて標識する。第2の結合性物質をペプチドと接触させ、(n−1)番目のNTAAに結合させ、第2の結合性物質のコーディングタグ情報を一次伸長記録タグに移行させ、それにより、二次伸長記録タグ(例えば、ペプチドを表す連鎖状のn次伸長記録タグを生成するため)、または異なる記録タグ(例えば、ペプチドを集合的に表す多数の伸長記録タグを生成するため)を生成する。(n−1)番目のNTAAの切断により、ペプチドの(n−2)番目のアミノ酸がN末端アミノ酸に変わり、これは、本明細書では(n−2)番目のNTAAと称される。追加的な結合、移行、切断、および必要に応じてNTAA標識を、上記の通り、最大nアミノ酸まで行って、ペプチドを集合的に表す、n次伸長記録タグまたはn個の別々の伸長記録タグを生成することができる。本明細書で使用される場合、結合性物質、コーディングタグ、または伸長記録タグに関して使用される際のn「次」は、結合性物質およびその付随するコーディングタグが使用されるn回目の結合サイクル、または伸長記録タグが創出されるn回目の結合サイクルを指す。
一部の実施形態では、第1の結合性物質および第2の結合性物質、ならびに任意選択で任意のさらなる結合性物質(例えば、第3の結合性物質、第4の結合性物質、第5の結合性物質など)の巨大分子への接触を同時に実施する。例えば、第1の結合性物質および第2の結合性物質、ならびに任意選択で任意のさらなる次数の結合性物質を、例えば結合性物質のライブラリーを形成するために、一緒にプールすることができる。別の例では、第1の結合性物質および第2の結合性物質、ならびに任意選択で任意のさらなる次数の結合性物質を、一緒にプールするのではなく、巨大分子に同時に添加する。一実施形態では、結合性物質のライブラリーは、20種の標準の天然に存在するアミノ酸に選択的に結合する少なくとも20種の結合性物質を含む。
他の実施形態では、第1の結合性物質および第2の結合性物質、ならびに任意選択で任意のさらなる次数の結合性物質をそれぞれ別々の結合サイクルで巨大分子をと接触させ、逐次的に添加する。ある特定の実施形態では、多数の結合性物質を同時に使用することが好ましく、その理由は、並行手法により時間が節約されるから、および、結合性物質が競合状態になり、それにより、同類結合性物質が結合する部位への非同類結合性物質による非特異的結合が低減するからである。
本明細書に記載の方法によって生成される最終的な伸長記録タグの長さは、コーディングタグ(例えば、エンコーダー配列およびスペーサー)の長さ、記録タグ(例えば、一意の分子識別子、スペーサー、ユニバーサルプライミング部位、バーコード)の長さ、実施される結合サイクルの数、および各結合サイクルからのコーディングタグが同じ伸長記録タグに移行されるか多数の伸長記録タグに移行されるかを含めた多数の因子に依存する。ペプチドを表し、エドマン分解様切断方法によって作製される連鎖状の伸長記録タグの例では、コーディングタグが、両側に5塩基のスペーサーが隣接する5塩基のエンコーダー配列を有する場合、ペプチドの結合性物質履歴を示す最終的な伸長記録タグ上のコーディングタグ情報は、10塩基×エドマン分解サイクルの数になる。20サイクルの実行に関しては、伸長記録は、少なくとも200塩基である(最初の記録タグ配列は含めない)。この長さは、標準の次世代シーケンシング計器に適合する。
最終的な結合サイクルおよび最終的な結合性物質のコーディングタグ情報の伸長記録タグへの移行の後、記録タグに、ユニバーサルリバースプライミング部位をライゲーション、プライマー伸長または当技術分野で公知の他の方法によって付加することによってキャップ形成することができる。一部の実施形態では、記録タグ内のユニバーサルフォワードプライミング部位は最終的な伸長記録タグに付属するユニバーサルリバースプライミング部位に適合する。一部の実施形態では、ユニバーサルリバースプライミング部位は、Illumina P7プライマー(5’−CAAGCAGAAGACGGCATACGAGAT−3’−配列番号134)またはIllumina P5プライマー(5’−AATGATACGGCGACCACCGA−3’−配列番号133)である。記録タグの鎖のセンスに応じてセンスまたはアンチセンスP7を付属させることができる。伸長記録タグライブラリーを固体支持体(例えば、ビーズ)からから直接切断または増幅し、従来の次世代シーケンシングアッセイおよびプロトコールに使用することができる。
一部の実施形態では、プライマー伸長反応を一本鎖伸長記録タグのライブラリーに対して実施して、その相補鎖をコピーする。
NGPSペプチドシーケンシングアッセイは、いくつかの化学的ステップおよび酵素的ステップを周期的進行で含む。NGPSシーケンシングは単一分子であるという事実により、いくつかの重要な利点がプロセスに付与される。単一分子アッセイの第1の重要な利点は、種々の周期的化学的/酵素的ステップにおける非能率に対する頑強性である。これは、コーディングタグ配列内に存在するサイクル特異的バーコードを使用することによって可能になる。
サイクル特異的コーディングタグを使用して、各サイクルからの情報を追跡する。これは単一分子シーケンシング手法であるので、配列決定プロセスの各結合/移行サイクルにおける70%の効率でさえ、マッピング可能な配列情報を生成するために十分すぎるほどである。例として、10塩基ペプチド配列「CPVQLWVDST」(配列番号169)は、我々の配列プラットフォームでは「CPXQXWXDXT」(配列番号170)と読み取られる可能性がある(X=任意のアミノ酸;アミノ酸の存在はサイクル数追跡によって推定される)。この部分的なアミノ酸配列読み取りは、BLASTPを使用してそれをヒトp53タンパク質に一意的にマッピングし戻すために十分すぎるほどである。そのように、我々のプロセスはいずれも完全にロバストにする必要はない。さらに、サイクル特異的バーコードを我々の分配概念と組み合わせれば、どのペプチドのセットが元のタンパク質分子にマッピングされるかが(コンパートメントバーコードによって)わかるので、10カ所の位置のうちの数アミノ酸を識別するだけでタンパク質の絶対的な識別を実現することができる。
分画、区画化、および結合能が限定された樹脂によるタンパク質正規化
プロテオミクス解析の重要な問題の1つは、試料中のタンパク質の豊富さの大きなダイナミックレンジに取り組むことである。タンパク質は、血漿中で10桁を超えるダイナミックレンジにわたる(「上位20種」が枯渇した血漿でさえ)。ある特定の実施形態では、解析前に、試料からのある特定のタンパク質種(例えば、極めて豊富なタンパク質)のサブトラクションを実施する。これは、例えば、上位20種の血漿タンパク質を枯渇させるSigmaのPROT20免疫枯渇キットなどの市販のタンパク質枯渇試薬を使用して実現することができる。さらに、ダイナミックレンジを管理可能な3〜4桁までさらに著しく低下させる手法をとることが有用であると思われる。ある特定の実施形態では、タンパク質試料のダイナミックレンジは、電気泳動および液体クロマトグラフィーを含めた標準の分画法を使用してタンパク質試料を分画するか(Zhou, Ning et al. 2012)、または、画分を、限られた能力のタンパク質結合性ビーズ/樹脂(例えば、ヒドロキシル化シリカ粒子)をローディングしたコンパートメント(例えば、液滴)に分配し(McCormick1989)、結合したタンパク質を溶出することによってモジュレートすることができる。各区画化された画分中の過剰なタンパク質を洗い流す。
電気泳動による方法の例としては、キャピラリー電気泳動(CE)、キャピラリー等電点電気泳動(CIEF)、キャピラリー等速電気泳動(CITP)、フリーフロー電気泳動、ゲル溶出分画液相封入電気泳動(GELFrEE)が挙げられる。液体クロマトグラフィータンパク質の分離方法の例としては、逆相(RP)、イオン交換(IE)、サイズ排除(SE)、親水性相互作用などが挙げられる。コンパートメント分配の例としては、エマルジョン、液滴、マイクロウェル、平らな基板上の物理的に分離された領域などが挙げられる。例示的なタンパク質結合性ビーズ/樹脂としては、フェノール基またはヒドロキシル基で誘導体化されたシリカナノ粒子(例えば、StrataClean Resin(Agilent Technologies製)、RapidClean(LabTech製)など)が挙げられる。ビーズ/樹脂の結合能を限定することにより、所与の画分中に溶出する高度に豊富なタンパク質は部分的にビーズに結合するだけになり、過剰なタンパク質は除去される。
M. 単一の細胞のプロテオームを分配するためのまたは分子サブサンプリングするための方法およびキット
別の態様では、本開示は、バーコーディングおよび分配技法を使用して試料中のタンパク質を大規模並列解析するためのキットおよび方法を提供する。タンパク質解析の現行の手法は、タンパク質巨大分子をペプチド配列決定に適したより短いペプチド分子に断片化することを伴う。したがって、そのような手法を使用して得られる情報は、断片化ステップによって限定され、例えば、各試料中に生じる翻訳後修飾、タンパク質間相互作用、試料中に存在するタンパク質集団の組成、または特定の細胞もしくは細胞の集団に由来するなどタンパク質巨大分子の起源を含めた、タンパク質の広範な連続した情報は排除される。タンパク質分子内の翻訳後修飾に関する広範な情報(例えば、プロテオフォーム特徴付け)により、より徹底的な生物学的像がもたらされ、どのペプチドがどのタンパク質分子に属するかに関する広範な情報により、ペプチド配列の、基礎をなすタンパク質配列へのよりロバストなマッピングがもたらされる(例えば、図15Aを参照されたい)。これは、ペプチド配列決定技術が、わずか5種のアミノ酸型からの情報など、不完全なアミノ酸配列情報しかもたらさない場合に特に意義がある。本明細書に開示されている分配方法を使用することにより、同じタンパク質分子に由来するいくつかのペプチドからの情報と組み合わせて、タンパク質分子の同一性(例えば、プロテオフォーム)をより正確に評価することができる。コンパートメントタグを同じコンパートメント(複数可)に由来するタンパク質およびペプチドに付随させることにより、分子および細胞情報の再構成が容易になる。典型的なプロテオーム解析では、細胞を溶解し、タンパク質を短いペプチドに消化するため、どのタンパク質がどの細胞または細胞型に由来するか、およびどのペプチドがどのタンパク質またはタンパク質複合体に由来するかに関する全体的な情報が破壊される。この全体的な情報は、細胞および組織内の生物学および生化学を理解するために重要である。
分配とは、試料内の巨大分子の集団に由来する巨大分子の亜集団への一意のバーコードのランダムな割り当てを指す。分配は、巨大分子をコンパートメントに区分することによって実現することができる。分配は、単一のコンパートメント内の巨大分子で構成されるものであってもよく、コンパートメントの集団に由来する多数のコンパートメント内の巨大分子で構成されるものであってもよい。
複数(例えば、数百万〜数十億)のコンパートメントから同じ物理的コンパートメントまたはコンパートメントの群に、またはそれにおいて分離された巨大分子のサブセットまたはタンパク質試料のサブセットを一意のコンパートメントタグによって識別する。したがって、コンパートメントタグを使用して、同じコンパートメントタグを有する1つまたは複数のコンパートメントに由来する構成物と、異なるコンパートメントタグを有する別のコンパートメント(またはコンパートメントの群)内の構成物を、これらの構成物が一緒にプールされた後であっても区別することができる。
本開示は、複雑なプロテオーム試料(例えば、複数のタンパク質複合体、タンパク質、またはポリペプチド)または複雑な細胞試料を複数のコンパートメントに分配することによってタンパク質解析を増強する方法であって、各コンパートメントが、個々のコンパートメント内では同じであり(任意選択のUMI配列は除いて)、他のコンパートメントのコンパートメントタグとは異なる複数のコンパートメントタグを含む、方法を提供する(例えば図18〜20を参照されたい)。コンパートメントは、任意選択で、複数のコンパートメントタグが接合した固体支持体(例えば、ビーズ)を含む。複数のタンパク質複合体、タンパク質、またはポリペプチドを複数のペプチドに断片化し、次いで、それを複数のコンパートメントタグと、複数のコンパートメント内で複数のペプチドと複数のコンパートメントタグとのアニーリングまたは接合を可能にするのに十分な条件下で接触させ、それにより、複数のコンパートメントタグ付きペプチドを生成する。あるいは、複数のタンパク質複合体、タンパク質、またはポリペプチドに、複数のコンパートメントタグを、複数のタンパク質複合体、タンパク質またはポリペプチドと複数のコンパートメント内の複数のコンパートメントタグのアニーリングまたは接合を可能にするために十分な条件下で接合し、それにより、複数のコンパートメントタグ付きタンパク質複合体、タンパク質、ポリペプチドを生成する。次いで、コンパートメントタグ付きタンパク質複合体、タンパク質、またはポリペプチドを複数のコンパートメントから収集し、任意選択で複数のコンパートメントタグ付きペプチドに断片化する。1つまたは複数のコンパートメントタグ付きペプチドを本明細書に記載の方法のいずれかに従って解析する。
ある特定の実施形態では、コンパートメントタグ情報を、プライマー伸長(例えば、図5および図48を参照されたい)またはライゲーション(例えば、図6、図46、および図47を参照されたい)により、巨大分子(例えば、ポリペプチド)などの分析物に付随する記録タグへと移行させる。
一部の実施形態では、コンパートメントタグは、コンパートメント内で溶液中に遊離している。他の実施形態では、コンパートメントタグをコンパートメントの表面(例えば、マイクロタイタープレートもしくはピコタイタープレートのウェルの底)またはビーズもしくはコンパートメント内のビーズに直接接合させる。
コンパートメントは、水性コンパートメント(例えば、マイクロ流体液滴)であっても固体コンパートメントであってもよい。固体コンパートメントとしては、例えば、ナノ粒子、マイクロスフェア、マイクロタイターウェルもしくはピコタイターウェル、またはアレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フローセル、フロースルーチップ、信号変換電子機器を含むバイオチップ、ELISAプレート、スピン干渉ディスク、ニトロセルロースメンブレン、もしくはニトロセルロースに基づくポリマー表面上の分離された領域が挙げられる。ある特定の実施形態では、各コンパートメントは、平均して、単一の細胞を含有する。
固体支持体は、これだけに限定されないが、ビーズ、マイクロビーズ、アレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フローセル、フロースルーチップ、信号変換電子機器を含むバイオチップ、マイクロタイターウェル、ELISAプレート、スピン干渉ディスク、ニトロセルロースメンブレン、ニトロセルロースに基づくポリマー表面、ナノ粒子、またはマイクロスフェアを含めた任意の支持体表面であってよい。固体支持体用の材料としては、これだけに限定されないが、アクリルアミド、アガロース、セルロース、ニトロセルロース、ガラス、金、石英、ポリスチレン、ポリエチレン酢酸ビニル、ポリプロピレン、ポリメタクリレート、ポリエチレン、ポリエチレンオキシド、ポリシリケート、ポリカーボネート、テフロン(登録商標)、フルオロカーボン、ナイロン、シリコンゴム、ポリ酸無水物、ポリグリコール酸、ポリ乳酸、ポリオルトエステル、官能化シラン、ポリプロピルフメレート、コラーゲン、グリコサミノグリカン、ポリアミノ酸、またはそれらの任意の組合せが挙げられる。ある特定の実施形態では、固体支持体は、ビーズ、例えば、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズである。
コンパートメントタグを付けたビーズを伴うコンパートメントに試料を分配する種々の方法は、Shembekarらにより概説されている(Shembekar、Chaipanら、2016年)。一実施例では、プロテオームをエマルジョンにより液滴中に分配して、タンパク質分子およびタンパク質複合体に関する全体的な情報を本明細書に開示されている方法を使用して記録することを可能にする(例えば、図18および図19を参照されたい)。ある特定の実施形態では、プロテオームをコンパートメント(例えば、液滴)に、コンパートメントタグを付けたビーズ、活性化可能なプロテアーゼ(直接または間接的に熱、光などによって)、およびプロテアーゼ抵抗性になるように工学的に操作された(例えば、修飾リシン、ペグ化など)ペプチドリガーゼと一緒に分配する。ある特定の実施形態では、プロテオームを変性剤で処理して、タンパク質またはポリペプチドのペプチド構成物を評価することができる。タンパク質のネイティブな状態に関する情報が望まれる場合、相互作用するタンパク質複合体を、それに由来するペプチドのその後の分析のためにコンパートメントに分配することができる。
コンパートメントタグは、任意選択で片側または両側にスペーサーまたはユニバーサルプライマー配列が隣接するバーコードを含む。プライマー配列は、記録タグの3’配列に対して相補的であってよく、それにより、プライマー伸長反応によるコンパートメントタグ情報の記録タグへの移行が可能になる(例えば図22A〜Bを参照されたい)。バーコードは、固体支持体もしくはコンパートメントに付着した一本鎖核酸分子または固体支持体もしくはコンパートメントとハイブリダイズしたその相補配列、または両方の鎖で構成されるものであってよい(例えば、図16を参照されたい)。コンパートメントタグは、ペプチドとのカップリングのための、例えばスペーサーに付着した、機能的部分を含んでよい。一実施例では、機能的部分(例えば、アルデヒド)は、複数のペプチド上のN末端アミノ酸残基と反応することが可能である。別の例では、機能的部分は、複数のペプチド上の内部アミノ酸残基(例えば、リシンまたは「クリック」反応性部分で標識されたリシン)と反応することが可能である。別の実施形態では、機能的部分は、単に、DNAタグで標識されたタンパク質とハイブリダイズすることが可能な相補DNA配列であってよい。あるいは、コンパートメントタグは、コンパートメントタグの目的のペプチドへのライゲーションを可能にするために、タンパク質リガーゼ(例えば、ブテラーゼIまたはそのホモログ)の認識配列を含むペプチドをさらに含むキメラ分子であってよい(例えば図22Aを参照されたい)。コンパートメントタグは、より大きな核酸分子内の成分であってよく、当該核酸分子は、それに接合したペプチドに関する識別情報をもたらすための一意の分子識別子、スペーサー配列、ユニバーサルプライミング部位、またはそれらの任意の組合せを任意選択でさらに含む。このUMI配列は、一般に、コンパートメント内のコンパートメントタグの集団の間で異なる。ある特定の実施形態では、コンパートメントタグは、記録タグ内の成分であり、したがって、個々のコンパートメント情報をもたらすために使用する同じタグを、それが付着したペプチドに関する個々のペプチド情報を記録するためにも使用する。
ある特定の実施形態では、コンパートメントタグは、コンパートメントタグをコンパートメントにプリント、スポッティング、インク噴射することによって形成することができる。ある特定の実施形態では、複数のコンパートメントタグを付けたビーズであって、ビーズ当たり1つのバーコード型が存在するビーズを、Kleinら、2015年、Cell、161巻:1187〜1201頁;Macoskoら、2015年、Cell、161巻:1202〜1214頁;およびFanら、2015年、Science、347巻:1258367頁に記載されている通り、スプリット・アンド・プール(split−and−pool)オリゴヌクレオチドライゲーションまたは合成によって形成する。コンパートメントタグを付けたビーズは、個々の合成または固定化によって形成することもできる。ある特定の実施形態では、コンパートメントタグを付けたビーズは、一方の部分が記録タグを含むコンパートメントタグを含み、他方の部分が消化されたペプチドをカップリングすることができる機能的部分を含む二機能性記録タグをさらに含む(例えば図19および図20を参照されたい)。
ある特定の実施形態では、複数のコンパートメント内の複数のタンパク質またはポリペプチドを、プロテアーゼを用いて複数のペプチドに断片化する。プロテアーゼは、メタロプロテアーゼであってよい。ある特定の実施形態では、メタロプロテアーゼの活性が金属カチオンの光活性化放出によってモジュレートされる。使用することができるエンドペプチダーゼの例としては、トリプシン、キモトリプシン、エラスターゼ、サーモリシン、ペプシン、クロストリパン、グルタミルエンドペプチダーゼ(GluC)、エンドペプチダーゼArgC、ペプチジル−aspメタロ−エンドペプチダーゼ(AspN)、エンドペプチダーゼLysCおよびエンドペプチダーゼLysNが挙げられる。それらの活性化の形式は、緩衝液および二価カチオンの必要性に応じて変動する。任意選択で、タンパク質またはポリペプチドをペプチド断片に十分に消化した後、プロテアーゼを不活性化する(例えば、熱、フルオロ油またはシリコーン油可溶性阻害剤、例えば、二価カチオンキレート化剤など)。
コンパートメントタグを用いたペプチドバーコーディングのある特定の実施形態では、タンパク質分子(任意選択で、変性ポリペプチド)を、DNAタグを用いて、DNAタグをタンパク質のリシン基のε−アミン部分とのコンジュゲーションによって、またはアルキンなどの反応性クリック部分で予め標識したタンパク質/ポリペプチドに付着させるクリックケミストリーによって間接的に標識する(例えば図2Bおよび図20Aを参照されたい)。次いで、DNAタグで標識したポリペプチドを、コンパートメントタグ(例えば、液滴内に含有されるビーズに結合したDNAバーコード)を含むコンパートメントに分配し(例えば図20Bを参照されたい)、ここで、コンパートメントタグは、各コンパートメントを識別するバーコードを含有する。一実施形態では、ビーズに付随する単一のタンパク質/ポリペプチド分子と単一の種のDNAバーコードを共封入する(例えば図20Bを参照されたい)。別の実施形態では、PCT公開第WO2016/061517号(その全体が参照により組み込まれる)に記載されているものと、DNAではなくタンパク質に適用されること以外は同様に、コンパートメントは、付着したコンパートメント(ビーズ)タグと共にビーズの表面を構成し得る。コンパートメントタグは、バーコード(BC)配列、ユニバーサルプライミング部位(U1’)、UMI配列、およびスペーサー配列(Sp)を含んでよい。一実施形態では、分配と同時にまたはその後に、コンパートメントタグをビーズから切断し、ポリペプチドに付着したDNAタグと、例えば、それぞれDNAタグおよびコンパートメントタグ上の相補的なU1配列およびU1’配列を介してハイブリダイズさせる。ビーズへの分配に関しては、DNAタグで標識したタンパク質をビーズ表面上のコンパートメントタグと直接ハイブリダイズさせることができる(例えば図20Cを参照されたい)。このハイブリダイゼーションステップ後、DNAタグとハイブリダイズしたポリペプチドをコンパートメントから抽出し(例えば、エマルジョン「分解」、またはビーズからのコンパートメントタグの切断)、ポリメラーゼに基づくプライマー伸長ステップを使用して、バーコードおよびUMI情報をポリペプチド上のDNAタグに書き込んでコンパートメントバーコードが付された記録タグをもたらす(例えば図20Dを参照されたい)。ポリペプチドを、C末端リシンにおいてユニバーサルプライミング配列を含有する記録タグ、コンパートメントタグ、およびUMIで標識されたペプチドに切断するために、LysCプロテアーゼ消化を使用することができる(例えば図20Eを参照されたい)。一実施形態では、LysCプロテアーゼを、DNAタグが付されたリシン残基が許容されるように工学的に操作する。得られる記録タグで標識されたペプチドを、固体基板(例えば、ビーズ)に、記録タグが付されたペプチド間の分子間相互作用を最小限にするために適した密度で固定化する(例えば図20Eおよび20Fを参照されたい)。
ペプチドのコンパートメントタグへの付着(または逆もまた同じ)は、固定化されたコンパートメントタグへの直接付着であってもよく、その相補配列(二本鎖の場合)への付着であってもよい。あるいは、コンパートメントタグを固体支持体またはコンパートメントの表面から引き離し、ペプチドおよび液相コンパートメントタグをコンパートメント内に接合させることができる。一実施形態では、コンパートメントタグ(例えば、オリゴヌクレオチドの末端)上の機能的部分は、ペプチドのN末端のアミンにシッフ塩基を通じて直接カップリングしたアルデヒドである(例えば図16を参照されたい)。別の実施形態では、コンパートメントタグを、タンパク質リガーゼに対するペプチドモチーフ(n−X・・・XXCGSHV−c)を含む核酸−ペプチドキメラ分子として構築する。核酸−ペプチドコンパートメントタグ構築物を、消化されたペプチドと、ブテラーゼIまたはそのホモログなどのペプチドリガーゼを使用してコンジュゲートする。ブテラーゼI、および他のアスパラギニルエンドペプチダーゼ(AEP)相同体を使用して、オリゴヌクレオチド−ペプチドコンパートメントタグ構築物のC末端と消化されたペプチドのN末端をライゲーションすることができる(Nguyen、Wangら、2014年、Nguyen、Caoら、2015年)。この反応は、速く、高度に効率的である。得られたコンパートメントタグ付きペプチドを、その後、本明細書に記載の核酸ペプチド解析のために固体支持体に固定化することができる。
ある特定の実施形態では、コンパートメントタグと複数の断片化されたペプチドを接合させる前に、固体支持体またはコンパートメントの表面に接合しているコンパートメントタグを放出させる(例えば図18を参照されたい)。一部の実施形態では、コンパートメントタグ付きペプチドを複数のコンパートメントから収集した後、コンパートメントタグ付きペプチドを、記録タグを伴って固体支持体に接合する。次いで、コンパートメントタグ情報をコンパートメントタグ付きペプチド上のコンパートメントタグから付随する記録タグに移行させることができる(例えば、記録タグおよびコンパートメントタグ内の相補的なスペーサー配列からプライミングされるプライマー伸長反応によって)。一部の実施形態では、次いで、本明細書に記載の方法に従ったペプチド解析の前に、コンパートメントタグをコンパートメントタグ付きペプチドから除去する。さらなる実施形態では、最初に複数のタンパク質を消化するために使用した配列特異的プロテアーゼ(例えば、Endo AspN)を、コンパートメントタグ情報を付随する記録タグに移行した後、ペプチドのN末端からのコンパートメントタグの除去にも使用する(例えば図22Bを参照されたい)。
コンパートメントに基づく分配のための手法は、Tジャンクションおよびフローフォーカシング、撹拌または小さな穴を有する膜(例えば、エッチング飛跡膜)を通じた押出しを使用したエマルジョン生成などを使用するマイクロ流体デバイスによる液滴形成などを含む(例えば図21を参照されたい)。区画化に伴う問題は、コンパートメントの内部の取扱いである。ある特定の実施形態では、コンパートメント内で一連の異なる生化学的ステップを行うことは、流体成分の交換が困難であるので、難しい場合がある。以前に記載されている通り、液滴内部の限られた特徴、例えば、pH、キレート化剤、還元剤などは、エマルジョンのフルオロ油に試薬を添加することによって改変することができる。しかし、水性相と有機相両方の溶解性を有する化合物の数は限られている。1つの手法は、コンパートメント内の反応を、基本的に目的の分子へのバーコードの移行に限定することである。
タンパク質/ペプチドをコンパートメントタグ(バーコード)で構成される記録タグで標識した後、タンパク質/ペプチドを、固体支持体に、結合した同類結合性物質のコーディングタグから結合したペプチドまたはタンパク質分子に付着した対応する記録タグ/タグへの情報の分子内移行を有利にするために適した密度で固定化する。分子間情報移行は、固体支持体の表面上の分子の分子間間隔を制御することによって最小化される。
ある特定の実施形態では、コンパートメントタグは、コンパートメントの集団内の各コンパートメントに対して一意である必要はない。コンパートメントの集団内のコンパートメントのサブセット(2つ、3つ、4つ、またはそれよりも多く)は、同じコンパートメントタグを共有してよい。例えば、各コンパートメントは、試料から巨大分子の亜集団を捕捉するように作用するビーズ表面の集団で構成されてよい(ビーズ当たり多くの分子が捕捉される)。さらに、ビーズは、捕捉される巨大分子に付着させることができるコンパートメントバーコードを含む。各ビーズは、単一のコンパートメントバーコード配列のみを含むが、このコンパートメントバーコードは、コンパートメント内の他のビーズ上で複製され得る(多くのビーズが同じバーコードにマッピングされる)。物理的コンパートメントとコンパートメントバーコードの間で多対1のマッピングをなすことができ(必要ではないが)、さらに、コンパートメント内の巨大分子間で多対1のマッピングをなすことができる(必要ではないが)。分配バーコードは、試料内の巨大分子の集団から巨大分子をサブサンプリングするための一意のバーコードの割り当てと定義される。この分配バーコードは、同じバーコードで標識されたコンパートメント内の巨大分子の分配から生じる同一のコンパートメントバーコードで構成されてよい。物理的コンパートメントの使用により、元の試料が有効にサブサンプリングされて、分配バーコードの割り当てがもたらされる。例えば、10,000種の異なるコンパートメントバーコードで標識されたビーズのセットがもたらされる。さらに、所与のアッセイにおいて、ビーズ百万個の集団をアッセイに使用されると仮定する。平均で、コンパートメントバーコード当たり100個のビーズが存在する(ポアソン分布)。さらに、ビーズにより巨大分子1千万個の凝集体が捕捉されると仮定する。平均で、ビーズ当たり10個の巨大分子が存在し、コンパートメントバーコード当たりのコンパートメントは100個であり、分配バーコード(100個の別個の物理的コンパートメント当たり100個のコンパートメントバーコードで構成される)当たり有効に1000個の巨大分子が存在する。
別の実施形態では、ポリペプチドの単一分子分配および分配バーコーディングは、ポリペプチドを、N末端またはC末端またはその両方において、増幅可能なDNA UMIタグ(例えば、記録タグ)を用いて標識すること(化学的にまたは酵素的に)によって実現される(例えば図37を参照されたい)。DNAタグをポリペプチドのボディ(内部アミノ酸)に非特異的な光標識または図2Bにおいて例示されている通りリシンなどの反応性アミノ酸への特異的な化学的付着によって付着させる。ペプチドの末端に付着させた記録タグからの情報をDNAタグに酵素的エマルジョンPCR(Williams、Peisajovichら、2006年、Schutze、Rubeltら、2011年)またはエマルジョンin vitro転写/逆転写(IVT/RT)ステップによって移行させる。好ましい実施形態では、ナノエマルジョンを使用し、その結果、平均して、50nm〜1000nmのサイズのエマルジョン液滴当たり単一のポリペプチド未満が存在するようにする(Nishikawa、Sunamiら、2012年、Gupta、Eralら、2016年)。さらに、プライマー、dNTP、Mg2+、ポリメラーゼ、およびPCR緩衝液を含めたPCRの全ての成分を水性エマルジョン混合物に含める。IVT/RTを使用する場合には、記録タグを、T7/SP6 RNAポリメラーゼプロモーター配列を用い、ポリペプチドのボディに付着したDNAタグにハイブリダイズする転写物が生成されるように設計する(Ryckelynck、Baudreyら、2015年)。逆転写酵素(RT)により、ハイブリダイズしたRNA分子からDNAタグに情報がコピーされる。このように、エマルジョンPCRまたはIVT/RTを使用して、末端記録タグからポリペプチドのボディに付着させた多数のDNAタグに情報を有効に移行させることができる。
細胞内容物のビーズへのゲル化による封入は、単一の細胞を解析するために有用な手法である(TamminenおよびVirta 2015、Spencer、Tamminenら、2016年)。単一の細胞液滴のバーコーディングにより、単一の細胞に由来する成分を全て同じ識別子で標識することが可能になる(Klein、Mazutisら、2015年、Gunderson、Steemersら、2016年、Zilionis、Nainysら、2017年)。コンパートメントバーコーディングは、一意のバーコードを、各液滴に、液滴接合によって(Raindance)、バーコードが付されたビーズを液滴に導入することによって(10× Genomics)、または、その全体が参照により組み込まれる、Gundersonら(Gunderson、Steemersら、2016年)およびPCT公開第WO2016/130704号に記載されている通り、封入およびゲル化後にスプリット・プール(split−pool)コンビナトリアルバーコーディングを使用して液滴の成分をコンビナトリアルバーコーディングすることによって、直接組み入れることを含めた、いくつものやり方で実現することができる。Adeyら(Vitak、Torkenczyら、2017年)に記載されている通り、同様のコンビナトリアル標識スキームを核にも適用することができる。
上記の液滴バーコーディング手法は、DNA解析には使用されているが、タンパク質解析には使用されていない。上記の液滴バーコーディングプラットフォームをタンパク質を用いた研究に適合させるには、いくつかの革新的なステップが必要である。まず第1は、バーコードは主にDNA配列で構成され、このDNA配列情報をタンパク質分析物に付与する必要があることである。DNA分析物の場合では、DNA情報をDNA分析物に移行させることは比較的簡単である。対照的に、DNA情報をタンパク質に移行させることは、特に、下流の解析のためにタンパク質を変性させ、消化してペプチドにする場合には、より困難である。これにより、各ペプチドをコンパートメントバーコードで標識することが必要になる。問題は、細胞が液滴に封入されたら、タンパク質を変性させ、得られたポリペプチドをプロテアーゼ消化し、同時にペプチドをDNAバーコードで標識するのが難しいことである。細胞をポリマー形成液滴に封入し、それらを重合(ゲル化)して、水性緩衝液にすることができる多孔質ビーズにすることにより、液滴中の細胞とは異なり、多数の異なる反応ステップを実施するためのビヒクルがもたらされる(TamminenおよびVirta、2015年、Spencer、Tamminenら、2016年)(Gunderson、Steemersら、2016年)。封入されたタンパク質がその後ゲルビーズから拡散することを防止するために、封入されたタンパク質をゲルマトリックスと架橋結合させることが好ましい。このゲルビーズ形式により、ゲル中に閉じ込められたタンパク質を化学的にまたは酵素的に変性させ、DNAタグで標識し、プロテアーゼ消化し、いくつもの他の介入に供すことが可能になる。図38は、例示的な単一の細胞のゲルマトリックスへの封入および溶解を示す。
N. 組織および単一細胞空間的プロテオミクスの方法およびキット
バーコードの別の使用は、空間的に分布したDNAバーコード配列のアレイ表面上での組織の空間的分割である。組織タンパク質を、アレイ表面に乗せた細胞組織内のタンパク質の空間的位置を反映するバーコードを含むDNA記録タグで標識すれば、Stahlら(2016年、Science、353巻(6294号):78〜82頁)およびCrosettoら(Corsetto、Bienkoら、2015年)に記載されている空間的トランスクリプトームと同様に、組織スライス内のタンパク質分析物の空間的分布を配列解析後に再構築することができる。空間バーコードの付着は、アレイに結合させたバーコードをアレイから放出させ、それらを組織切片中に拡散させることによって実現することができる、あるいは、組織切片中のタンパク質をDNA記録タグで標識し、次いで、タンパク質をプロテアーゼで消化して、拡散し、アレイ上の空間バーコードとハイブリダイズする標識されたペプチドを放出させることができる。次いで、バーコード情報をペプチドに付着させた記録タグに移行させることができる(酵素的にまたは化学的に)。
組織内のタンパク質の空間的バーコーディングは、DNA記録タグで化学的に標識された、固定/透過処理した組織スライスを、空間的にコードされたDNAアレイであって、アレイ上の各特徴が空間的に識別可能なバーコードを有する、DNAアレイに置くことによって実現することができる(例えば図23を参照されたい)。アレイバーコードをDNAタグに付着させるために、組織スライスをプロテアーゼで消化し、それにより、拡散し、組織スライスに隣接する近位のアレイ特徴にハイブリダイズすることができるDNAタグで標識されたペプチドを放出させることができる。アレイバーコード情報は、化学的/酵素的ライゲーションまたはポリメラーゼ伸長によってDNAタグに移行させることができる。あるいは、標識されたペプチドをアレイ表面に拡散させる代わりに、アレイ上のバーコード配列を切断し、組織スライス上の近位の領域に拡散させ、その中のDNAタグで標識されたタンパク質にハイブリダイズさせることができる。再度、バーコーディング情報は、化学的/酵素的ライゲーションまたはポリメラーゼ伸長によって移行させることができる。この第2の場合には、バーコード情報の移行後にプロテアーゼ消化を実施することができる。いずれの手法の結果も、記録タグで標識されたタンパク質またはペプチドの収集であり、ここで、記録タグは、元の組織内のタンパク質/ペプチドの位置に関する2−D空間的情報を有するバーコードを含む。さらに、翻訳後修飾の空間的分布を特徴付けることができる。この手法により、感度が高く、高度に多重化されたin situデジタル免疫組織化学的アッセイがもたらされ、また、現代の分子病理学の基礎が形成され、それによりはるかに正確な診断および予後判定が導かれるはずである。
別の実施形態では、細胞小器官および細胞区画内のタンパク質構成物/PTMを識別するために、細胞内に空間的バーコーディングを使用することができる(Christoforouら、2016年、Nat. Commun.、7巻:8992頁、その全体が参照により組み込まれる)。近位のタンパク質に付着させることができる細胞内空間バーコードをもたらすために、いくつもの手法を使用することができる。一実施形態では、細胞または組織を構成物細胞小器官中に細胞内分画し、異なるタンパク質細胞小器官画分バーコードを付すことができる。空間的な細胞標識の他の方法は、その全体が参照により組み込まれる、Marx、2015年、Nat Methods、12巻:815〜819頁による総説に記載されている;同様の手法を本明細書で使用することができる。
O. 単一サイクルアッセイ法およびキット
一態様では、本明細書には、ポリペプチドなどの分析物を解析するための単一サイクル法が提供される。解析は、定性的もしくは定量的分析物検出(例えば、試料中の存在/非存在またはレベルまたは量)、分析物識別、所望の特性(治療剤もしくは治療剤候補、例えば小分子治療剤、ペプチドもしくはペプチドの模倣物治療剤、またはアプタマー治療剤との結合など)のスクリーニング、ポリペプチド配列決定、またはこれらの任意の組合せのためであってもよい。一部の実施形態では、タンパク質/ポリペプチドを、記録タグ(DNA記録タグなど)で標識し、「まばらな」単一分子密度で基材上に固定化し、コーディングタグ(DNAコーディングタグなど)でコードされた単一結合事象で検出する。これらの例では、まばらな単一分子分布を使用することにより、分子内複合体内での情報移行のみが可能になる。一態様では、これにより多重化が容易になる。さらに、ペプチドmRNA/cDNAディスプレイの標準的方法(例えば、米国特許出願公開第2013/0225426号に開示されているような)と比較して、本明細書で開示されている分析物−タグ構築物では、必要に応じて、分析物の結合性部分を識別する「コード」配列と無関係なバーコードを含む機能性記録タグが使用される。
別の態様では、本明細書には、NGLA(次世代リガンドアッセイ)および単一サイクル標的−リガンド結合アッセイが開示される。この点に関して、候補小分子またはペプチド治療剤(またはペプチド模倣物治療剤、例えばペプトイド治療剤、β−ペプチド治療剤、もしくはD−ペプチドペプチド模倣物治療剤、または多糖治療剤)のタンパク質標的を迅速にスクリーニングおよび識別する能力は、効果的な創薬パイプラインを高度に可能にする。さらに、オフターゲット結合活性を識別する能力は、治療剤毒性の理解に重要である。本明細書では、核酸(例えば、DNA)タグでバーコード付与された105〜109個の異なる小分子タイプを含む、DNAにコードされるライブラリー(DEL)などの高度多様性ライブラリーを、キナーゼ、GPCRなどの、全プロテオームまたはプロテオームのサブセットに対してスクリーニングすることができる方法が開示される。一部の実施形態では、本明細書で開示された方法および/またはキットを使用して、プロテオーム×DELライブラリーの完全結合マトリックスを創出することができる。一部の実施形態では、固定化されたタンパク質−記録タグ複合体を、支持体(例えば、GPCRを含む膜タンパク質)に繋留されたナノディスクまたはリポディスク(lipodisc)構造内に埋め込む。一態様では、ナノディスクまたはリポディスク内でのタンパク質の再構成は、膜タンパク質の解析に有用である。例えば、Rue et al., (2016), “Co-translational formation and pharmacologicalcharacterization of beta1-adrenergic receptor/nanodisc complexes with differentlipid environments," Biochim Biophys Acta 1858 (6): 1306-1316;およびFiori etal., (2017), “Polymer-encased nanodiscs with improved buffercompatibility," Sci Rep 7 (1): 7432を参照されたい。これら文献は両方とも、参照により本明細書に組み込まれる。
一部の実施形態では、これは、2つの機能性エレメントによって達成される。第1の機能性エレメントは、全プロテオームの固定化DNAタグ付き単一タンパク質分子表示である。固定化プロテオーム表示は、個々のタンパク質を発現、精製、およびDNAバーコード標識することにより創出することができ、各タンパク質は、その付随するDNAバーコードによって識別される。膜タンパク質は、必要に応じてナノディスク/リポディスク内に再構成することができる。一部の実施形態では、これらのバーコード−タンパク質複合体(必要に応じてナノディスク/リポディスク)は、分子内DNA情報移行が、分子間移行よりも非常に有利になるような分子間間隔で基材に取り付けられる。間隔の例示的な距離は、約20nmと等しいかもしくはそれよりも大きく、約50nmと等しいかもしくはそれよりも大きく、約100nmと等しいかもしくはそれよりも大きく、約150nmと等しいかもしくはそれよりも大きく、約200nmと等しいかもしくはそれよりも大きく、約250nmと等しいかもしくはそれよりも大きく、約300nmと等しいかもしくはそれよりも大きく、約350nmと等しいかもしくはそれよりも大きく、約400nmと等しいかもしくはそれよりも大きく、約450nmと等しいかもしくはそれよりも大きく、約500nmと等しいかもしくはそれよりも大きく、約550nmと等しいかもしくはそれよりも大きく、約600nmと等しいかもしくはそれよりも大きく、約650nmと等しいかもしくはそれよりも大きく、約700nmと等しいかもしくはそれよりも大きく、約750nmと等しいかもしくはそれよりも大きく、約800nmと等しいかもしくはそれよりも大きく、約850nmと等しいかもしくはそれよりも大きく、約900nmと等しいかもしくはそれよりも大きく、約950nmと等しいかもしくはそれよりも大きく、または約1μmと等しいかもしくはそれよりも大きくともよい。
一部の実施形態では、DNAバーコード付き小分子またはペプチド/ペプチドの模倣物ライブラリー(またはペプチド模倣物ライブラリー、例えばペプトイドライブラリー、β−ペプチドライブラリー、もしくはD−ペプチドペプチド模倣物ライブラリー、または多糖ライブラリー)を提供することができ、バーコードは特定のペプチドまたは小分子エレメントを識別する。このライブラリーは、>103、>104、>105、>106、>107、>108、または>109の複雑性を有することができる。一部の実施形態では、小分子とタンパク質標的との結合は、DNAタグ付き小分子ライブラリーを、固定化DNAタグ付きプロテオーム(またはサブプロテオーム)に導入し、結合反応が続いて起こることを可能にすることによりもたらされる。一部の実施形態では、小分子と標的タンパク質との結合は、近接効果により、小分子のコーディングタグからタンパク質の記録タグへのまたはその逆の効率的な情報移行を可能にする。一部の実施形態では、この情報移行は、ポリメラーゼ伸長、ライゲーション(酵素的または化学的)、または代替方法を使用して達成することができる。
上述の実施形態のいずれかでは、ライブラリーは、コンビナトリアルライブラリー、例えば、試薬などのいくつかの化学的「構造単位」を組み合わせることによる化学合成または生物学的合成のいずれかによって生成された多様な化学化合物のコレクションであってもよい。例えば、ポリペプチド(例えば、ムテイン)ライブラリーなどの線形コンビナトリアル化学ライブラリーは、所与の化合物長(つまり、ポリペプチド化合物中のアミノ酸の数)のありとあらゆる様式のアミノ酸と呼ばれる1セットの化学的構造単位を組み合わせることによって形成される。多数の化学化合物が、化学的構造単位のそのようなコンビナトリアル混合により合成される(Gallop et al., J. Med. Chem. 37(9): 1233-1251 (1994))。
コンビナトリアルライブラリーの調製およびスクリーニングは、当業者に周知である。そのようなコンビナトリアル化学ライブラリーとしては、これらだけに限定されないが、以下のものが挙げられる:ペプチドライブラリー(例えば、米国特許第5,010,175号;Furka, Pept. Prot. Res. 37:487-493 (1991);Houghton et al., Nature,354:84-88 (1991);ペプトイド(PCT公開第WO91/19735号);コード付きペプチド(PCT公開第WO93/20242号);ランダムバイオ−オリゴマー(PCT公開第WO92/00091号);ベンゾジアゼピン(米国特許第5,288,514号);ヒダントイン、ベンゾジアゼピン、およびジペプチドなどのダイバーソマー(diversomer)(Hobbset al., Proc. Nat. Acad. Sci. USA 90:6909-6913 (1993))、ビニル性ポリペプチド(Hagihara etal., J. Amer. Chem. Soc. 114:6568 (1992))、ベータ−D−グルコーススキャホールドを有する非ペプチド性ペプチド模倣物(Hirschmannet al., J. Amer. Chem. Soc. 114:9217-9218 (1992))、小化合物ライブラリーのアナロガス有機合成(analogous organic syntheses)(Chenet al., J. Amer. Chem. Soc. 116:2661 (1994))、オリゴカルバルネート(oligocarbarnate)(Cho,et al., Science 261:1303 (1993))、および/またはペプチジルホスホネート(Campbell et al., J. Org.Chem. 59:658 (1994))。一般に、以下のものを参照されたい:Gordon et al., J. Med. Chem. 37:1385(1994)、核酸ライブラリー(例えば、Stratagene,Corp.を参照されたい)、ペプチド核酸ライブラリー(例えば、米国特許第5,539,083号を参照されたい)、抗体ライブラリー(例えば、Vaughnet al., Nature Biotechnology 14(3): 309-314 (1996)、およびPCT/US96/10287を参照されたい)、炭水化物ライブラリー(例えば、Lianget al., Science 274:1520-1522 (1996)、および米国特許第5,593,853号を参照されたい)、ならびに小有機分子ライブラリー(例えば、ベンゾジアゼピン、Baum,C&EN, January 18, page 33 (1993);イソプレノイド、米国特許第5,569,588号;チアゾリジノンおよびメタチアザノン(metathiazanone)、米国特許第5,549,974号;ピロリジン、米国特許第5,525,735号および第5,519,134号;モルホリノ化合物、米国特許第5,506,337号;ならびにベンゾジアゼピン、米国特許第5,288,514号など)。
一部の実施形態では、このアッセイの最終結果は、小分子−タンパク結合マトリックスを創出することである。一部の実施形態では、これは、109個の多様性を有する小分子ライブラリーを、固定化ヒトプロテオーム全体(2×104個)と共にインキュベートした場合でさえ、かなり大きなマトリックスであり得る。マトリックスサイズは、109×2×104個であり、2×1013回の異なる測定となるであろう。一部の実施形態では、高親和性結合相互作用(<低nM)は、洗浄ステップ後でさえ上記の手法で容易に記録することができるが、中〜低親和性相互作用は、失われる可能性が高いであろう。一部の実施形態では、低親和性相互作用(約μM)を記録するために、結合およびそれと同時に情報移行が生じる均質な反応が望ましい。一部の実施形態では、これには、重合またはライゲーションステップが、結合占有時間と比べて迅速な動力学を有する必要があることが求められる。重合時間の尺度は、秒の単位であり、μM濃度での結合占有時間(約10〜100秒)と適合する。ライゲーション時間の尺度は、同様に秒の単位であり得る(例えば、迅速化学ライゲーションの場合、例えば、Abe et al., (2008), “Rapid DNA chemical ligation for amplificationof RNA and DNA signal," Bioconjug Chem 19(1): 327-333を参照されたい)。一部の実施形態では、リガーゼまたはポリメラーゼを、特に低親和性相互作用を解析または検出するために、1つまたは複数の結合物質と共に反応ミックスに含ませてもよい。あるいは、記録タグ内の部位と相互作用するDNAタグによるハイブリダイゼーションを使用して、リガーゼまたはポリメラーゼを作用物質部位に共局在化させてもよい。結合および「書き込み」(つまり、情報移行)ステップを組み合わせることにより、低親和性相互作用を「記録する」ことがより容易になる。
一実施形態では、DNAタグと、タンパク質標的またはペプチドもしくは小分子リガンド(またはペプチド模倣物リガンド、例えばペプトイドリガンド、β−ペプチドリガンド、もしくはD−ペプチドペプチド模倣物リガンド、または多糖リガンド)のいずれかとの付着は、バーコード付きDNAタグを、個々に産生されたタンパク質標的または個々に産生された小分子/ペプチド標的に個々に付着させることにより達成することができる。別の実施形態では、DNAタグとタンパク質との付着は、リボソームまたはmRNA/cDNAディスプレイにより生じ、mRNA配列内にDNAバーコードが含まれている。mRNA/cDNAディスプレイのプロセスでは、in vitro翻訳反応を使用してmRNAをタンパク質に翻訳する。mRNAは、リンカーを介してmRNAの3’末端に付着されたピューロマイシン分子を有するように構成されている(例えば、Liu et al., (2000), “Optimized synthesis of RNA-protein fusions forin vitro protein selection," In Methods in Enzymology, Academic Press,318:268-293を参照されたい)。チロシル−tRNAの類似体であるピューロマイシンを、mRNA転写物の3’末端に係留し、リボソームが3’末端付近で翻訳を終了させる際に成長中のポリペプチド鎖に組み込み、mRNA−タンパク質融合体を効率的に創出して、RNA/DNA転写物および付随するバーコードをその対応する翻訳されたタンパク質に連結する(例えば、米国特許出願公開第2012/0258871(A1)号、米国特許出願公開第2017/0107566(A1)号、またはKozlovet al., (2012), PLoS One 7(6): e37441に開示されている。これら文献はすべて、参照により本明細書に組み込まれる)。
一実施形態では、下流における情報移行のためのユニバーサルプライマー部位およびスペーサー配列などのバーコード配列および付随するDNA記録タグ機能性エレメントを、mRNA転写物の3’末端に遺伝子操作する。また、一実施形態では、DNAバーコードおよびDNA記録タグ機能性エレメントのまさに5’に一意の制限部位も含まれる。mRNA−タンパク質融合体をin vitroで翻訳および創出した後、mRNAをcDNAに逆翻訳する。外因性オリゴをアニーリングさせ、制限酵素と共にインキュベーションすることによって、バーコードの5’でcDNAを切断する。これにより、その後のアッセイの記録タグとしての役目を果たすDNAタグが残る(例えば、図50を参照されたい)。
別の態様では、本明細書には、単一サイクルによる次世代タンパク質アッセイが開示されている。一部の実施形態では、このアッセイでは、NTAA結合物質(例えば、N末端のモノ−、ジ−、またはトリ−アミノ酸)などのアミノ酸結合物質が使用される。
ボトムアップ質量分析法(MS)による典型的なタンパク識別では、各タンパク質から1セットのペプチド(約20〜40個のペプチド)を生成するために、トリプシン消化などのプロテアーゼ消化ステップが使用される。単一のペプチド種は、LC−MS/MSで分析し、タンパク質種全体の識別を提供することができる。また、参照により本明細書に組み込まれるWO2015/042506号には、単一分子レベルでのタンパク識別方法が開示されている。WO2015/042506号の試薬および方法ステップを、本開示と組み合わせてもよい。
単一分子レベルでタンパクを識別するための代替手法は、タンパク質分子を数百万〜数十億個の区分(例えば、コンパートメントバーコードを含む区分)に分配し、分配バーコードを有する試料中の分子すべてにバーコードを付けることである。一態様では、所与のコンパートメント(例えば、個々のビーズ表面)は、そのコンパートメント内の分子がすべて同じバーコードで標識されている。別の態様では、区分は、同じバーコードを共有するコンパートメントをすべて含む。例えば、108個のビーズに106個のバーコードが存在する場合、ビーズの一部は、同じバーコードを有するであろう。この例では、個々のビーズ表面は各々がコンパートメントであってもよく、同じバーコードを共有するコンパートメントは、バーコードが異なることに基づき他の区分から区別可能な区分を形成する。好ましい実施形態では、タンパク質を、まず変性およびアルキル化し、その後ポリペプチドの全体にわたって「クリック」化学ハンドルで標識する。「クリック」ハンドルを付着させた後、クリック化学を使用してユニバーサルDNAプライマーを「クリック」ハンドルに付着させる。このDNAプライマーは、DNA記録タグの初期部分を形成することになる。ポリペプチドを、過剰なDNAプライマーから精製する。ポリペプチドをDNAプライマーで標識した後、ポリペプチドを、コンパートメントバーコード、およびポリペプチドのものと相補的なユニバーサルプライマーを有するDNAバーコード付きビーズの集団に曝露させる(例えば、図51を参照されたい)。個々のポリペプチド分子は、特定のビーズと相互作用し、ユニバーサルプライマー配列を介したハイブリダイゼーションによりビーズ上に本質的に「ジップアップ(zip−up)」する。1つよりも多くの分子が、任意の所与のビーズに付随してもよいが、理想的には分子の数は最小限に維持される。ポリペプチドがビーズ上に「ジップ(zip)」したら、プライマー伸長またはライゲーション反応を使用して、ビーズのバーコード情報を、ポリペプチドに付着した多数のユニバーサルプライマーに移行させる。このように、ポリペプチドは、今や、プロテオームの分配の基盤を形成するバーコード付きの「コンパートメント」である。ポリペプチド分子の伸長DNAタグは、アッセイのその後のステップのための記録タグを構成する。次に、ビーズ上のポリペプチド(最初に取り外してもよい)を、プロテアーゼ消化ステップ(例えば、トリプシン消化)を使用して断片化する。消化した後、記録タグ標識ペプチドをビーズから溶出する。標識ペプチドを、単一分子密度(例えば、固定化ペプチド間の平均距離が情報移行をおおむね分子内結合事象のみに制限するようなペプチド間距離)で基材に固定化する。間隔の例示的な距離は、約20nmと等しいかもしくはそれよりも大きく、約50nmと等しいかもしくはそれよりも大きく、約100nmと等しいかもしくはそれよりも大きく、約150nmと等しいかもしくはそれよりも大きく、約200nmと等しいかもしくはそれよりも大きく、約250nmと等しいかもしくはそれよりも大きく、約300nmと等しいかもしくはそれよりも大きく、約350nmと等しいかもしくはそれよりも大きく、約400nmと等しいかもしくはそれよりも大きく、約450nmと等しいかもしくはそれよりも大きく、約500nmと等しいかもしくはそれよりも大きく、約550nmと等しいかもしくはそれよりも大きく、約600nmと等しいかもしくはそれよりも大きく、約650nmと等しいかもしくはそれよりも大きく、約700nmと等しいかもしくはそれよりも大きく、約750nmと等しいかもしくはそれよりも大きく、約800nmと等しいかもしくはそれよりも大きく、約850nmと等しいかもしくはそれよりも大きく、約900nmと等しいかもしくはそれよりも大きく、約950nmと等しいかもしくはそれよりも大きく、または約1μmと等しいかもしくはそれよりも大きくともよい。
一実施形態では、ペプチドは、トリプシン消化物に由来する。ヒトプロテオームでは、およそ500,000個の異なるトリプシンペプチドが存在し、1タンパク質当たりのトリプシンペプチドは約20〜30個である。試料中のタンパク質分子を定量化および特徴付けるために、タンパク質を、分配バーコード付き記録タグで標識された1セットのペプチドに変換する。結合から所与の分子に由来するトリプシンペプチドへの情報はすべて、分配バーコードによって分子(または分子の小さなサブセット)にマッピングし戻すことができる。好ましい実施形態では、結合物質を識別するバーコード情報を含むDNAコーディングタグで標識されたN末端ジペプチドおよび/またはトリペプチド(N末端ジアミノ酸/トリアミノ酸とも呼ばれる)結合性物質を、固定化されたペプチド(N末端が遊離するように)と共にインキュベートする。結合時にまたは結合後に、情報は、ポリメラーゼ伸長またはライゲーションによってコーディングタグから記録タグに(またはその逆に)移行する。このプロセスを、複数サイクル繰り返して、交差反応性結合事象に由来するエラーを低減することができる。N末端ジペプチド結合物質の完全なセットは、各々が異なる識別バーコードで標識されている1セットの400個の異なる結合物質で構成されるであろう。単一の結合サイクルは、分配の概念を使用してヒトプロテオーム全体を識別するのに十分であることを優に超えているべきである。例えば、所与のタンパク質分子に由来する1セットの20個のペプチドのうち5つのトリプシンペプチドのみが検出された場合でさえ、トリプシン消化情報と組み合わせたN末端ジアミノ酸情報は、タンパク質を一意に識別するのに十分であることを優に超えている。
まずポリペプチドを分配バーコード付きビーズに固定化し、分析基材に再固定化する代わりに、変性ペプチドを、共有結合または非共有結合相互作用により、ビーズ全体が同一のバーコード付き記録タグの集団で覆われているDNAバーコード付きビーズに直接固定化することができる(例えば、図52を参照されたい)。ポリペプチドをビーズ上で消化して、トリプシン消化物などの断片にする。プロテアーゼ消化後、N末端ジペプチド結合物質と、バーコード付きビーズ上のポリペプチドの露出N−末端との結合が続いて起こる。ジペプチド結合物質のコーディングタグとビーズに付着した記録タグのいずれかと間に、情報移行が生じる。以前の「距離をおいて間隔があけられている」ペプチドモデル(例えば、図51を参照されたい)とは異なり、ペプチド複合体は、単一結合サイクルのみが実施される限り、以前の実施形態のように間隔をあける必要はない。結合および情報移行の後、得られた伸長記録タグを、線形増幅またはPCRを使用して、ビーズ表面から溶液中へと直接増幅することができる。
一部の実施形態では、上記で開示されたアッセイは、コーディングタグと記録タグとの間のサイクル情報移行を必要としない。したがって、これらのアッセイは、単一結合サイクルで実施することができる。
P. 結合物質/リガンドダウン手法
現代的創薬は、標的タンパク質との結合について非常に多様な小分子化合物を初期にスクリーニングし、後に治療有効性を試験することによって可能になる。DNAにコードされたライブラリー(DEL)は、標的分子に結合すると、付随するDNAタグまたはバーコード配列によりアレイまたは次世代シーケンシングで読み出すことができる多様な小分子を生成するために手法を提供する。DNAにコードされたライブラリーを創出するためのいくつかの戦略が開発されている(参照により組み込まれる(Shi, Zhou et al. 2017))。1つの戦略は、各ビーズが、識別DNAバーコードタグに付随した単一タイプの小分子化合物の集団で埋め尽くされるように、ビーズ上に化合物のコンビナトリアルセットを創出することを含む。DNAコード化固相合成法(DESPS、DNA−encoded solid−phase synthesis)と称されるこの手法では、単一タイプの小分子化合物の集団およびその付随するDNAバーコードタグ情報が両方とも単一ビーズ上に創出される、つまり1ビーズ1化合物手法(OBOC)である(参照により組み込まれる(MacConnell,McEnaney et al. 2015))。
このOBOC手法を使用してリガンド結合アッセイを生成するために、小分子結合物質の付随するコーディングタグは、コンビナトリアルライブラリーの形成中に創出されるDNAバーコードタグを含む。単一のビーズが、ビーズに付着された小分子の単一集団を表わす、すべてが同じバーコードを含むDNAコーディングタグの集団を有する。単一集団のバーコードのみを有するビーズを用いる単一サイクルアッセイでは、ビーズ上の小分子間の間隔要件はもはや必要ではない。
以下の例示的な実施形態が例示として提供される。
1.
(a)
(i)生物学的標的(例えば、タンパク質またはポリペプチド)のセットであって、各生物学的標的に、生物学的標的を識別するエンコーディングバーコードを必要に応じて含む記録タグが直接または間接的に付随している、生物学的標的(例えば、タンパク質またはポリペプチド)のセットを、
(ii)作用物質のライブラリーであって、各作用物質が、少なくとも1つの別々の支持体に固定化されており、別々の支持体のそれぞれが、支持体に固定化された作用物質に関する識別情報を含むコーディングタグをさらに含む、作用物質のライブラリーと
接触させるステップと;
(b)
(i)作用物質の1つまたは複数と(直接または間接的に)結合および/または(直接または間接的に)反応する各生物学的標的に付随する記録タグと、
(ii)1つまたは複数の作用物質のコーディングタグと
の間の情報の移行を可能にするステップであって、
情報の移行により、伸長記録タグおよび/または伸長コーディングタグが生成する、ステップと;
(c)伸長記録タグおよび/または伸長コーディングタグを解析し、それにより、生物学的標的のセットと作用物質のライブラリーとの間の相互作用(複数可)をアッセイするステップと
を含む方法。
2.別々の支持体のそれぞれにおいて、同じ作用物質の多数の分子および/または同じコーディングタグの多数の分子が固定化されている、実施形態1に記載の方法。
3.別々の支持体のそれぞれにおいて、固定化された作用物質と固定化されたコーディングタグが、コンジュゲートまたは複合体を形成している、実施形態1または2に記載の方法。
4.固定化された作用物質および/または固定化されたコーディングタグが、支持体に直接固定化されている、実施形態3に記載の方法。
5.別々の支持体のそれぞれにおいて、固定化された作用物質および固定化されたコーディングタグが、支持体に(直接または間接的に)独立に固定化されている、実施形態1または2に記載の方法。
6.別々の支持体のそれぞれにおいて、固定化された作用物質と固定化されたコーディングタグがリンカーによって(直接または間接的に、共有結合によりまたは非共有結合により)接続されており、リンカーが支持体に(直接または間接的に)固定化されている、実施形態1または2に記載の方法。
7.作用物質のライブラリーが、小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β−ペプチド、またはD−ペプチドのペプチド模倣物)、多糖、またはアプタマー(例えば、DNAアプタマーなどの核酸アプタマー、またはペプチドアプタマー)、またはこれらの任意の組合せを含む、実施形態1から6までのいずれか1つに記載の方法。
8.別々の支持体のそれぞれにおいて、コーディングタグの固定化された分子の密度が、作用物質の固定化された分子の密度と等しいまたはそれよりも大きい、実施形態1から7までのいずれか1つに記載の方法。
9.コーディングタグの固定化された分子の密度が、作用物質の固定化された分子の密度の少なくとも約2倍、少なくとも約3倍、少なくとも約4倍、少なくとも約5倍、少なくとも約6倍、少なくとも約7倍、少なくとも約8倍、少なくとも約9倍、少なくとも約10倍、少なくとも約20倍、少なくとも約50倍、少なくとも約100倍、またはそれよりも大きい、実施形態8に記載の方法。
10.少なくとも1つのコーディングタグから少なくとも1つの記録タグに情報が移行され、それにより、少なくとも1つの伸長記録タグを生成する、実施形態1から9までのいずれか1つに記載の方法。
11.少なくとも1つの記録タグから少なくとも1つのコーディングタグに情報が移行され、それにより、少なくとも1つの伸長コーディングタグを生成する、実施形態1から9までのいずれか1つに記載の方法。
12.コーディングタグからの情報と記録タグからの情報とを含む少なくとも1つのジタグ構築物が生成される、実施形態1から11までのいずれか1つに記載の方法。
13.生物学的標的の少なくとも1つが、作用物質の2つまたはそれよりも多くと結合および/または反応する、実施形態1から12までのいずれか1つに記載の方法。
14.伸長記録タグまたは伸長コーディングタグが、2つまたはそれよりも多くの作用物質に関する識別情報を含む、実施形態13に記載の方法。
15.生物学的標的の少なくとも1つに2つまたはそれよりも多くの記録タグが付随しており、2つまたはそれよりも多くの記録タグが同じであっても異なってもよい、実施形態1から14までのいずれか1つに記載の方法。
16.少なくとも1つの別々の支持体が、同じ作用物質についての2つまたはそれよりも多くのコーディングタグを含み、2つまたはそれよりも多くのコーディングタグが同じであっても異なってもよい、実施形態1から15までのいずれか1つに記載の方法。
17.情報の移行が、ライゲーション(例えば、酵素的もしくは化学的ライゲーション、副子ライゲーション、粘着末端ライゲーション、ssDNAライゲーションなどの一本鎖(ss)ライゲーション、またはこれらの任意の組合せ)、ポリメラーゼ媒介性反応(例えば、一本鎖核酸または二本鎖核酸のプライマー伸長)、またはこれらの任意の組合せによって達成される、実施形態1から16までのいずれか1つに記載の方法。
18.生物学的標的のセットが、プロテオームまたはそのサブセットを含み、必要に応じて、タンパク質のセットが、ゲノムもしくはそのサブセットのin vitro転写/翻訳、その後のin vitro翻訳を使用して作製される、またはトランスクリプトームもしくはそのサブセットのin vitro翻訳を使用して作製される、実施形態1から17までのいずれか1つに記載の方法。
19.プロテオームのサブセットが、カイノーム;セクレトーム;レセプトーム(例えば、GPCRome);免疫プロテオーム;栄養プロテオーム;翻訳後修飾(例えば、リン酸化、ユビキチン化、メチル化、アセチル化、グリコシル化、酸化、脂質付加、および/またはニトロシル化)によって規程されるプロテオームサブセット、例えば、リン酸化プロテオーム(例えば、ホスホチロシン−プロテオーム、チロシン−カイノーム、およびチロシン−ホスファトーム)、グリコプロテオームなど;組織もしくは臓器、発生段階、または生理的もしくは病的状態に関連するプロテオームサブセット;細胞周期、分化(または脱分化)、細胞死、老化、細胞遊走、形質転換、または転移などの細胞プロセスに関連するプロテオームサブセット;あるいはこれらの任意の組合せを含む、実施形態18に記載の方法。
20.生物学的標的のセットが、ヒトなどの哺乳動物、非ヒト動物、魚、無脊椎動物、節足動物、昆虫、または植物、例えば、酵母、細菌、例えば、E.coli、ウイルス、例えば、HIVもしくはHCV、またはこれらの組合せに由来する、実施形態1から19までのいずれか1つに記載の方法。
21.生物学的標的のセットが、タンパク質複合体またはそのサブユニットを含む、実施形態1から20までのいずれか1つに記載の方法。
22.記録タグが、核酸、オリゴヌクレオチド、修飾されたオリゴヌクレオチド、DNA分子、偽相補的塩基を有するDNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、またはモルホリノ、またはこれらの組合せを含む、実施形態1から21までのいずれか1つに記載の方法。
23.記録タグが、ユニバーサルプライミング部位を含む、実施形態1から22までのいずれか1つに記載の方法。
24.記録タグが、増幅、配列決定、またはその両方のためのプライミング部位を含み、例えば、ユニバーサルプライミング部位が、増幅、配列決定、またはその両方のためのプライミング部位を含む、実施形態1から23までのいずれか1つに記載の方法。
25.記録タグが、一意の分子識別子(UMI)を含む、実施形態1から24までのいずれか1つに記載の方法。
26.記録タグが、生物学的標的を識別するエンコーディングバーコード、試料バーコード、コンパートメントバーコード、分配バーコード、エラー訂正バーコード、またはこれらの任意の組合せなどのバーコードを含む、実施形態1から25までのいずれか1つに記載の方法。
27.記録タグが、その3’末端にスペーサーを含む、実施形態1から26までのいずれか1つに記載の方法。
28.別々の支持体が、剛性固体支持体、可撓性固体支持体、または軟性固体支持体などの固体支持体であり、多孔質支持体または非多孔質支持体を含む、実施形態1から27までのいずれか1つに記載の方法。
29.別々の支持体が、ビーズ、多孔質ビーズ、磁気ビーズ、常磁性ビーズ、多孔質マトリックス、アレイ、表面、ガラス表面、シリコン表面、プラスチック表面、スライド、フィルター、ナイロン、チップ、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、ウェル、マイクロタイターウェル、プレート、ELISAプレート、ディスク、スピン干渉ディスク、膜、ニトロセルロースメンブレン、ニトロセルロースに基づくポリマー表面、ナノ粒子(例えば、磁気ナノ粒子(Fe3O4)、金ナノ粒子、および/または銀ナノ粒子などの金属を含む)、量子ドット、ナノシェル、ナノケージ、マイクロスフェア、またはこれらの任意の組合せを含む、実施形態1から28までのいずれか1つに記載の方法。
30.支持体が、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、磁気ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズ、またはこれらの任意の組合せを含む、実施形態29に記載の方法。
31.生物学的標的−作用物質結合マトリックスを創出するために、生物学的標的のセットと作用物質のライブラリーとの間の相互作用を並行解析するための、実施形態1から42までのいずれか1つに記載の方法。
32.マトリックスのサイズが、約102、約103、約104、約105、約106、約107、約108、約109、約1010、約1011、約1012、約1013、約1014、またはそれよりも大きい、例えば、約2×1013である、実施形態31に記載の方法。
33.コーディングタグが、核酸、オリゴヌクレオチド、修飾されたオリゴヌクレオチド、DNA分子、偽相補的塩基を有するDNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、またはモルホリノ、またはこれらの組合せを含む、実施形態1から32までのいずれか1つに記載の方法。
34.コーディングタグが、作用物質を識別するエンコーダー配列を含む、実施形態1から33までのいずれか1つに記載の方法。
35.コーディングタグが、スペーサー、一意の分子識別子(UMI)、ユニバーサルプライミング部位、またはこれらの任意の組合せを含む、実施形態1から34までのいずれか1つに記載の方法。
36.作用物質とコーディングタグが、リンカーまたは結合対によって接合されている、実施形態1から35までのいずれか1つに記載の方法。
37.作用物質とコーディングタグが、別々の支持体上に共局在している、実施形態1から35までのいずれか1つに記載の方法。
38.別々の支持体のそれぞれにおいて、同じ作用物質の多数の分子および/または同じコーディングタグの多数の分子が固定化されており、分子が、共局在していてよく、互いに低密度に間隔をあける必要はない、実施形態1から37までのいずれか1つに記載の方法。
39.
(a)
(i)生物学的標的(例えば、タンパク質またはポリペプチド)のセットであって、各生物学的標的が、少なくとも1つの別々の支持体に固定化されており、別々の支持体のそれぞれが、支持体に固定化された生物学的標的に関する識別情報を含む記録タグをさらに含む、生物学的標的(例えば、タンパク質またはポリペプチド)のセットを
(ii)作用物質のライブラリーであって、各作用物質に作用物質に関する識別情報を含むコーディングタグが直接または間接的に付随している、作用物質のライブラリーと
接触させるステップと;
(b)
(i)作用物質の1つまたは複数と(直接または間接的に)結合および/または(直接または間接的に)反応する各生物学的標的に付随する記録タグと、
(ii)1つまたは複数の作用物質のコーディングタグと
の間の情報の移行を可能にするステップであって、
情報の移行により、伸長記録タグおよび/または伸長コーディングタグが生成する、ステップと;
(c)伸長記録タグおよび/または伸長コーディングタグを解析し、それにより、生物学的標的のセットと作用物質のライブラリーとの間の相互作用(複数可)をアッセイするステップと
を含む方法。
40.別々の支持体のそれぞれにおいて、同じ生物学的標的の多数の分子および/または同じ記録タグの多数の分子が固定化されている、実施形態39に記載の方法。
41.別々の支持体のそれぞれにおいて、固定化された生物学的標的と固定化された記録タグがコンジュゲートまたは複合体を形成している、実施形態39または40に記載の方法。
42.固定化された生物学的標的および/または固定化された記録タグが、支持体に直接固定化されている、実施形態41に記載の方法。
43.別々の支持体のそれぞれにおいて、固定化された生物学的標的および固定化された記録タグが支持体に(直接または間接的に)独立に固定化されている、実施形態39または40に記載の方法。
44.別々の支持体のそれぞれにおいて、固定化された生物学的標的と固定化された記録タグがリンカーによって(直接または間接的に、共有結合によりまたは非共有結合により)接続されており、リンカーが支持体に(直接または間接的に)固定化されている、実施形態39または40に記載の方法。
45.作用物質のライブラリーが、小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β−ペプチド、またはD−ペプチドのペプチド模倣物)、多糖、またはアプタマー(例えば、DNAアプタマーなどの核酸アプタマー、またはペプチドアプタマー)、またはこれらの任意の組合せを含む、実施形態39から44までのいずれか1つに記載の方法。
46.別々の支持体のそれぞれにおいて、固定化された記録タグの分子の密度が、固定化された生物学的標的の分子の密度と等しいまたはそれよりも大きい、実施形態39から45までのいずれか1つに記載の方法。
47.固定化された記録タグの分子の密度が、固定化された生物学的標的の分子の密度の少なくとも約2倍、少なくとも約3倍、少なくとも約4倍、少なくとも約5倍、少なくとも約6倍、少なくとも約7倍、少なくとも約8倍、少なくとも約9倍、少なくとも約10倍、少なくとも約20倍、少なくとも約50倍、少なくとも約100倍、またはそれよりも大きい、実施形態46に記載の方法。
48.少なくとも1つのコーディングタグから少なくとも1つの記録タグに情報が移行され、それにより、少なくとも1つの伸長記録タグを生成する、実施形態39から47までのいずれか1つに記載の方法。
49.少なくとも1つの記録タグから少なくとも1つのコーディングタグに情報が移行され、それにより、少なくとも1つの伸長コーディングタグを生成する、実施形態39から47までのいずれか1つに記載の方法。
50.コーディングタグからの情報と記録タグからの情報とを含む少なくとも1つのジタグ構築物が生成される、実施形態39から49までのいずれか1つに記載の方法。
51.生物学的標的の少なくとも1つが、作用物質の2つまたはそれよりも多くと結合および/または反応する、実施形態39から50までのいずれか1つに記載の方法。
52.伸長記録タグまたは伸長コーディングタグが、2つまたはそれよりも多くの作用物質に関する識別情報を含む、実施形態51に記載の方法。
53.生物学的標的の少なくとも1つに2つまたはそれよりも多くの記録タグが付随しており、2つまたはそれよりも多くの記録タグが同じであっても異なってもよい、実施形態39から52までのいずれか1つに記載の方法。
54.少なくとも1つの別々の支持体が、同じ生物学的標的についての2つまたはそれよりも多くの記録タグを含み、2つまたはそれよりも多くの記録タグが同じであっても異なってもよい、実施形態39から53までのいずれか1つに記載の方法。
55.情報の移行が、ライゲーション(例えば、酵素的もしくは化学的ライゲーション、副子ライゲーション、粘着末端ライゲーション、ssDNAライゲーションなどの一本鎖(ss)ライゲーション、またはこれらの任意の組合せ)、ポリメラーゼ媒介性反応(例えば、一本鎖核酸または二本鎖核酸のプライマー伸長)、またはこれらの任意の組合せによって達成される、実施形態39から54までのいずれか1つに記載の方法。
56.生物学的標的のセットが、プロテオームまたはそのサブセットを含み、必要に応じて、タンパク質のセットが、ゲノムもしくはそのサブセットのin vitro転写/翻訳、その後のin vitro翻訳を使用して作製される、またはトランスクリプトームもしくはそのサブセットのin vitro翻訳を使用して作製される、実施形態39から55までのいずれか1つに記載の方法。
57.プロテオームのサブセットが、カイノーム;セクレトーム;レセプトーム(例えば、GPCRome);免疫プロテオーム;栄養プロテオーム;翻訳後修飾(例えば、リン酸化、ユビキチン化、メチル化、アセチル化、グリコシル化、酸化、脂質付加、および/またはニトロシル化)によって規程されるプロテオームサブセット、例えば、リン酸化プロテオーム(例えば、ホスホチロシン−プロテオーム、チロシン−カイノーム、およびチロシン−ホスファトーム)、グリコプロテオームなど;組織もしくは臓器、発生段階、または生理的もしくは病的状態に関連するプロテオームサブセット;細胞周期、分化(または脱分化)、細胞死、老化、細胞遊走、形質転換、または転移などの細胞プロセスに関連するプロテオームサブセット;あるいはこれらの任意の組合せを含む、実施形態56に記載の方法。
58.生物学的標的のセットが、ヒトなどの哺乳動物、非ヒト動物、魚、無脊椎動物、節足動物、昆虫、または植物、例えば、酵母、細菌、例えば、E.coli、ウイルス、例えば、HIVもしくはHCV、またはこれらの組合せに由来する、実施形態39から57までのいずれか1つに記載の方法。
59.生物学的標的のセットが、タンパク質複合体またはそのサブユニットを含む、実施形態39から58までのいずれか1つに記載の方法。
60.記録タグが、核酸、オリゴヌクレオチド、修飾されたオリゴヌクレオチド、DNA分子、偽相補的塩基を有するDNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、またはモルホリノ、またはこれらの組合せを含む、実施形態39から59までのいずれか1つに記載の方法。
61.記録タグが、ユニバーサルプライミング部位を含む、実施形態39から60までのいずれか1つに記載の方法。
62.記録タグが、増幅、配列決定、またはその両方のためのプライミング部位を含み、例えば、ユニバーサルプライミング部位が、増幅、配列決定、またはその両方のためのプライミング部位を含む、実施形態39から61までのいずれか1つに記載の方法。
63.記録タグが、一意の分子識別子(UMI)を含む、実施形態39から62までのいずれか1つに記載の方法。
64.記録タグが、生物学的標的を識別するエンコーディングバーコード、試料バーコード、コンパートメントバーコード、分配バーコード、エラー訂正バーコード、またはこれらの任意の組合せなどのバーコードを含む、実施形態39から63までのいずれか1つに記載の方法。
65.記録タグが、その3’末端にスペーサーを含む、実施形態39から64までのいずれか1つに記載の方法。
66.別々の支持体が、剛性固体支持体、可撓性固体支持体、または軟性固体支持体などの固体支持体であり、多孔質支持体または非多孔質支持体を含む、実施形態39から65までのいずれか1つに記載の方法。
67.別々の支持体が、ビーズ、多孔質ビーズ、磁気ビーズ、常磁性ビーズ、多孔質マトリックス、アレイ、表面、ガラス表面、シリコン表面、プラスチック表面、スライド、フィルター、ナイロン、チップ、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、ウェル、マイクロタイターウェル、プレート、ELISAプレート、ディスク、スピン干渉ディスク、膜、ニトロセルロースメンブレン、ニトロセルロースに基づくポリマー表面、ナノ粒子(例えば、磁気ナノ粒子(Fe3O4)、金ナノ粒子、および/または銀ナノ粒子などの金属を含む)、量子ドット、ナノシェル、ナノケージ、マイクロスフェア、またはこれらの任意の組合せを含む、実施形態39から66までのいずれか1つに記載の方法。
68.支持体が、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、磁気ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズ、またはこれらの任意の組合せを含む、実施形態67に記載の方法。
69.生物学的標的−作用物質結合マトリックスを創出するために、生物学的標的のセットと作用物質のライブラリーとの間の相互作用を並行解析するための、実施形態39から68までのいずれか1つに記載の方法。
70.マトリックスのサイズが、約102、約103、約104、約105、約106、約107、約108、約109、約1010、約1011、約1012、約1013、約1014、またはそれよりも大きい、例えば、約2×1013である、実施形態69に記載の方法。
71.コーディングタグが、核酸、オリゴヌクレオチド、修飾されたオリゴヌクレオチド、DNA分子、偽相補的塩基を有するDNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、またはモルホリノ、またはこれらの組合せを含む、実施形態39から70までのいずれか1つに記載の方法。
72.コーディングタグが、作用物質を識別するエンコーダー配列を含む、実施形態39から71までのいずれか1つに記載の方法。
73.コーディングタグが、スペーサー、一意の分子識別子(UMI)、ユニバーサルプライミング部位、またはこれらの任意の組合せを含む、実施形態39から72までのいずれか1つに記載の方法。
74.作用物質とコーディングタグが、リンカーまたは結合対によって接合されている、実施形態39から73までのいずれか1つに記載の方法。
75.生物学的標的と記録タグが、別々の支持体上に共局在している、実施形態39から74までのいずれか1つに記載の方法。
76.別々の支持体のそれぞれにおいて、同じ生物学的標的の多数の分子および/または同じ記録タグの多数の分子が固定化されており、分子が、共局在していてよく、互いに低密度に間隔をあける必要はない、実施形態39から75までのいずれか1つに記載の方法。
77.
(a)(i)第1のユニバーサルプライマー配列を含む記録タグが直接または間接的に付随する生物学的標的(例えば、タンパク質またはポリペプチド)を、(ii)第1の支持体に固定化された作用物質と接触させるステップであって、第1の支持体が、支持体に固定化された作用物質に関する識別情報を含むコーディングタグをさらに含む、ステップと;
(b)生物学的標的と固定化された作用物質との間の結合および/または反応時に記録タグとコーディングタグとの間の情報の移行を可能にするステップであって、情報の移行により、生物学的標的に付随する伸長記録タグが生成する、ステップと;
(c)伸長記録タグを、サイクル特異的タグおよび第2のユニバーサルプライマー配列と接触させるステップであって、サイクル特異的タグおよび第2のユニバーサルプライマー配列の両方が第2の支持体に固定化されており、第1のユニバーサルプライマー配列および第2のユニバーサルプライマー配列の全部または一部が互いと相補的である、ステップと;
(d)固定化されたサイクル特異的タグと伸長記録タグとの間の情報の移行を可能にするステップであって、情報の移行により、生物学的標的に付随するさらなる伸長記録タグが生成する、ステップと;
(e)コーディングタグおよびサイクル特異的タグからの情報を含むさらなる伸長記録タグを解析するステップと
を含み、ステップ(e)の前にステップ(a)〜(d)を複数回繰り返すことができる方法。
78.
(a)(i)記録タグが直接または間接的に付随した生物学的標的(例えば、タンパク質またはポリペプチド)を、(ii)支持体に固定化された作用物質と接触させるステップであって、支持体が、支持体に固定化された作用物質に関する識別情報を含むコーディングタグをさらに含む、ステップと;
(b)生物学的標的と固定化された作用物質との間の結合および/または反応時に記録タグとコーディングタグとの間の情報の移行を可能にするステップであって、情報の移行により、支持体に固定化された伸長コーディングタグが生成する、ステップと;
(c)伸長コーディングタグをサイクル特異的タグと接触させるステップと;
(d)伸長コーディングタグとサイクル特異的タグとの間の情報の移行を可能にするステップであって、情報の移行により、支持体に固定化されたさらなる伸長コーディングタグが生成する、ステップと;
(e)記録タグおよびサイクル特異的タグからの情報を含むさらなる伸長コーディングタを解析するステップと;
を含み、ステップ(e)の前にステップ(a)〜(d)を複数回繰り返すことができる方法。
79.情報の移行が、ライゲーション(例えば、酵素的もしくは化学的ライゲーション、副子ライゲーション、粘着末端ライゲーション、ssDNAライゲーションなどの一本鎖(ss)ライゲーション、またはこれらの任意の組合せ)、ポリメラーゼ媒介性反応(例えば、一本鎖核酸または二本鎖核酸のプライマー伸長)、またはこれらの任意の組合せによって達成される、実施形態77または78に記載の方法。
80.実施形態1から79までのいずれかに記載の方法において開示および/もしくは使用されている任意の分子、分子複合体もしくはコンジュゲート、試薬(例えば、化学的または生物学的)、作用物質、構造(例えば、支持体、表面、粒子、またはビーズ)、反応中間体、反応産物、結合複合体、または任意の他の製造品、またはこれらの任意の組合せを含むキット。
上述の実施形態のいずれかでは、記録タグは、ポリペプチドなどの生物学的標的を識別するエンコーディングバーコードをさらに含んでいてもよい。あるいは、リガンドアッセイ(例えば、本明細書で開示されているようなNGLA)を実施し、後に本明細書で開示されるようなNGPAアッセイにて生物学的標的の同一性をデコンボリューションしてもよい。
上述の実施形態のいずれかでは、作用物質は、小分子、ペプトイド、ペプチド、ポリマーなどを含んでいてもよい。上述の実施形態のいずれかでは、作用物質は、例えばスプリット・プール手法を使用してコンビナトリアル的に合成することができる。上述の実施形態のいずれかでは、作用物質は、支持体上でコンビナトリアル的に合成することができる。
上述の実施形態のいずれかでは、ポリペプチドなどの生物学的標的のセットは、合成遺伝子のin vitro転写/翻訳(IVTT)を使用して準備することができる。一部の態様では、個々の遺伝子または合成遺伝子のプールのいずれかをIVTTに供して、コーディング情報を有する記録タグ標識タンパク質を創出することができる。したがって、記録タグを有する生物学的標的のセットは、例えば、IVTTを使用することによって、溶液中で生成することができる(例えば、結合物質ダウン手法で使用するために)。あるいは、記録タグを有する生物学的標的のセットは、ビーズなどの支持体に固定化されたセットの各メンバーを用いて、例えばIVTTを使用することによって生成され得る(例えば、分析物ダウン手法で使用するために)。
IV. 例示的な実施形態
実施形態1A.(a)各タンパク質に記録タグが直接または間接的に付随しているタンパク質のセットを、作用物質のライブラリーであって、各作用物質が、(i)小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β−ペプチド、またはD−ペプチドのペプチド模倣物)、多糖、またはアプタマー(例えば、DNAアプタマーなどの核酸アプタマー、またはペプチドアプタマー)、および(ii)小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β−ペプチド、またはD−ペプチドのペプチド模倣物)、多糖、またはアプタマーに関する識別情報を含むコーディングタグを含む、作用物質のライブラリーと接触させるステップであって、各タンパク質および/もしくはそれに付随する記録タグ、または各作用物質が支持体に直接または間接的に固定化されている、ステップと;(b)(i)1つまたは複数の作用物質の小分子(複数可)、ペプチド(複数可)もしくはペプチドの模倣物(複数可)、ペプチド模倣物(複数可)(例えば、ペプトイド(複数可)、β−ペプチド(複数可)、またはD−ペプチドのペプチド模倣物(複数可))、多糖(複数可)、またはアプタマー(複数可)と結合および/または反応する各タンパク質に付随する記録タグと(ii)1つまたは複数の作用物質のコーディングタグとの間の情報の移行を可能にして、伸長記録タグおよび/または伸長コーディングタグを生成するステップと;(c)伸長記録タグおよび/または伸長コーディングタグを解析するステップとを含む方法。
実施形態2A.支持体上で各タンパク質と他のタンパク質との間に約20nmと等しいもしくはそれよりも大きい、約50nmと等しいもしくはそれよりも大きい、約100nmと等しいもしくはそれよりも大きい、約150nmと等しいもしくはそれよりも大きい、約200nmと等しいもしくはそれよりも大きい、約250nmと等しいもしくはそれよりも大きい、約300nmと等しいもしくはそれよりも大きい、約350nmと等しいもしくはそれよりも大きい、約400nmと等しいもしくはそれよりも大きい、約450nmと等しいもしくはそれよりも大きい、約500nmと等しいもしくはそれよりも大きい、約550nmと等しいもしくはそれよりも大きい、約600nmと等しいもしくはそれよりも大きい、約650nmと等しいもしくはそれよりも大きい、約700nmと等しいもしくはそれよりも大きい、約750nmと等しいもしくはそれよりも大きい、約800nmと等しいもしくはそれよりも大きい、約850nmと等しいもしくはそれよりも大きい、約900nmと等しいもしくはそれよりも大きい、約950nmと等しいもしくはそれよりも大きい、または約1μmと等しいもしくはそれよりも大きい平均距離で間隔をあける、実施形態1Aに記載の方法。
実施形態3A.支持体上で各タンパク質およびそれに付随する記録タグと他のタンパク質およびそれらに付随する記録タグとの間に約20nmと等しいもしくはそれよりも大きい、約50nmと等しいもしくはそれよりも大きい、約100nmと等しいもしくはそれよりも大きい、約150nmと等しいもしくはそれよりも大きい、約200nmと等しいもしくはそれよりも大きい、約250nmと等しいもしくはそれよりも大きい、約300nmと等しいもしくはそれよりも大きい、約350nmと等しいもしくはそれよりも大きい、約400nmと等しいもしくはそれよりも大きい、約450nmと等しいもしくはそれよりも大きい、約500nmと等しいもしくはそれよりも大きい、約550nmと等しいもしくはそれよりも大きい、約600nmと等しいもしくはそれよりも大きい、約650nmと等しいもしくはそれよりも大きい、約700nmと等しいもしくはそれよりも大きい、約750nmと等しいもしくはそれよりも大きい、約800nmと等しいもしくはそれよりも大きい、約850nmと等しいもしくはそれよりも大きい、約900nmと等しいもしくはそれよりも大きい、約950nmと等しいもしくはそれよりも大きい、または約1μmと等しいもしくはそれよりも大きい平均距離で間隔をあける、実施形態1Aまたは2Aに記載の方法。
実施形態4A. タンパク質および/またはそれらの付随する記録タグの1つまたは複数が、共有結合で支持体に固定化されているか(例えば、リンカーを介して)、または非共有結合で支持体に固定化されている(例えば、結合対を介して)、実施形態1Aから3Aまでのいずれか1つに記載の方法。
実施形態5A. タンパク質および/またはそれらの付随する記録タグのサブセットが、共有結合で支持体に固定化されており、タンパク質および/またはそれらの付随する記録タグの別のサブセットが、非共有結合で支持体に固定化されている、実施形態1Aから4Aまでのいずれか1つに記載の方法。
実施形態6A. 記録タグの1つまたは複数が、支持体に固定化されており、それにより付随するタンパク質が固定化される、実施形態1A〜5aのいずれか1つに記載の方法。
実施形態7A. タンパク質の1つまたは複数が、支持体に固定化されており、それにより付随する記録タグが固定化される、実施形態1A〜6Aのいずれか1つに記載の方法。
実施形態8A. 少なくとも1つのタンパク質が、その付随する記録タグと共局在化しており、各々が独立して支持体に固定されている、実施形態1Aから7Aまでのいずれか1つに記載の方法。
実施形態9A. 少なくとも1つのタンパク質および/またはその付随する記録タグが、固定用リンカーに直接的または間接的に付随し、固定用リンカーが、支持体に直接的または間接的に固定化されており、それにより少なくとも1つのタンパク質および/またはその付随する記録タグが支持体に固定化される、実施形態1Aから8Aまでのいずれか1つに記載の方法。
実施形態10A. 固定化された記録タグの密度が、固定化されたタンパク質の密度と等しいかまたはそれより大きい、実施形態1Aから9Aまでのいずれか1つに記載の方法。
実施形態11A. 固定化された記録タグの密度が、固定化されたタンパク質の密度の少なくとも約2倍、少なくとも約3倍、少なくとも約4倍、少なくとも約5倍、少なくとも約6倍、少なくとも約7倍、少なくとも約8倍、少なくとも約9倍、少なくとも約10倍、少なくとも約20倍、少なくとも約50倍、少なくとも約100倍であるか、またはそれよりも大きい、実施形態10Aに記載の方法。
実施形態12A.各作用物質と支持体に固定化された他の作用物質との間に約20nmと等しいもしくはそれよりも大きい、約50nmと等しいもしくはそれよりも大きい、約100nmと等しいもしくはそれよりも大きい、約150nmと等しいもしくはそれよりも大きい、約200nmと等しいもしくはそれよりも大きい、約250nmと等しいもしくはそれよりも大きい、約300nmと等しいもしくはそれよりも大きい、約350nmと等しいもしくはそれよりも大きい、約400nmと等しいもしくはそれよりも大きい、約450nmと等しいもしくはそれよりも大きい、約500nmと等しいもしくはそれよりも大きい、約550nmと等しいもしくはそれよりも大きい、約600nmと等しいもしくはそれよりも大きい、約650nmと等しいもしくはそれよりも大きい、約700nmと等しいもしくはそれよりも大きい、約750nmと等しいもしくはそれよりも大きい、約800nmと等しいもしくはそれよりも大きい、約850nmと等しいもしくはそれよりも大きい、約900nmと等しいもしくはそれよりも大きい、約950nmと等しいもしくはそれよりも大きい、または約1μmと等しいもしくはそれよりも大きい平均距離で間隔をあける、実施形態1Aに記載の方法。
実施形態13A.作用物質の1つまたは複数を支持体に共有結合により固定化する(例えば、リンカーを介して)、または支持体に非共有結合により固定化する(例えば、結合対を介して)、実施形態12Aに記載の方法。
実施形態14A. 作用物質のサブセットが、共有結合で支持体に固定化されており、作用物質の別のサブセットが非共有結合で支持体に固定されている、実施形態12Aまたは13Aに記載の方法。
実施形態15A. 作用物質の1つまたは複数では、小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β−ペプチド、もしくはD−ペプチドペプチド模倣物)、多糖、またはアプタマーが、支持体に固定化されており、それによりコーディングタグが固定化される、実施形態12A〜14aのいずれか1つに記載の方法。
実施形態16A. 作用物質の1つまたは複数では、コーディングタグが支持体に固定化されており、それにより小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β−ペプチド、もしくはD−ペプチドペプチド模倣物)、多糖、またはアプタマーが固定化される、実施形態12A〜15Aのいずれか1つに記載の方法。
実施形態17A. 少なくとも1つのコーディングタグから少なくとも1つの記録タグに情報が移行し、それにより、少なくとも1つの伸長記録タグが生成する、実施形態1Aから16Aまでのいずれか1つに記載の方法。
実施形態18A. 少なくとも1つの記録タグから少なくとも1つのコーディングタグに情報が移行し、それにより、少なくとも1つの伸長記録タグが生成する、実施形態1Aから17Aまでのいずれか1つに記載の方法。
実施形態19A. コーディングタグからの情報と記録タグからの情報とを含む少なくとも1つのジタグ構築物が生成する、実施形態1Aから18Aまでのいずれか1つに記載の方法。
実施形態20A. タンパク質の少なくとも1つが、2つまたはそれよりも多くの作用物質の小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β−ペプチド、もしくはD−ペプチドペプチド模倣物)、多糖、またはアプタマーと結合および反応する、実施形態1Aから19Aまでのいずれか1つに記載の方法。
実施形態21A. 伸長記録タグまたは伸長コーディングタグが、2つまたはそれよりも多くの作用物質の低分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β−ペプチド、もしくはD−ペプチドペプチド模倣物)、多糖、またはアプタマーに関する識別情報を含む、実施形態20Aに記載の方法。
実施形態22A. タンパク質の少なくとも1つに、2つまたはそれよりも多くの記録タグが付随しており、2つまたはそれよりも多くの記録タグは、同じであっても異なってもよい、実施形態1Aから21Aまでのいずれか1つに記載の方法。
実施形態23A. 作用物質の少なくとも1つが、2つまたはそれよりも多くの記録タグを含み、2つまたはそれよりも多くの記録タグは、同じであっても異なってもよい、実施形態1Aから22Aまでのいずれか1つに記載の方法。
実施形態24A.情報の移行を、ライゲーション(例えば、酵素的もしくは化学的ライゲーション、副子ライゲーション、粘着末端ライゲーション、ssDNAライゲーションなどの一本鎖(ss)ライゲーション、またはこれらの任意の組合せ)、ポリメラーゼ媒介性反応(例えば、一本鎖核酸または二本鎖核酸のプライマー伸長)、またはこれらの任意の組合せによって達成する、実施形態1Aから23Aまでのいずれか1つに記載の方法。
実施形態25A. ライゲーションおよび/またはポリメラーゼ媒介性反応が、タンパク質と小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β−ペプチド、またはD−ペプチドのペプチド模倣物)、多糖、またはアプタマーとの間の結合占有時間または反応時間と比べて速いカイネティクスを有し、必要に応じて、ライゲーションおよび/またはポリメラーゼ媒介性反応用の試薬が、タンパク質と小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β−ペプチド、またはD−ペプチドのペプチド模倣物)、多糖、またはアプタマーとの間の結合または反応と同じ反応体積で存在し、さらに必要に応じて、情報の移行が、同時結合/エンコーディングステップを使用することによって、および/または、結合性物質の解離速度を遅くするために低下させるエンコーディングまたは情報書き込みステップの温度を使用することによってもたらされる、実施形態24Aに記載の方法。
実施形態26A. 各タンパク質は、個々の付着によりその記録タグに付随し、および/あるいは各低分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β−ペプチド、もしくはD−ペプチドペプチド模倣物)、多糖、またはアプタマーは、個々の付着によりそのコーディングタグに付随する、実施形態1Aから25Aまでのいずれか1つに記載の方法。
実施形態27A. 付着が、リボソームまたはmRNA/cDNAディスプレイにより生じ、記録タグおよび/またはコーディングタグ配列情報がmRNA配列に含まれている、実施形態26Aに記載の方法。
実施形態28A. 記録タグおよび/またはコーディングタグが、mRNA配列の3’末端にユニバーサルプライマー配列、バーコード、および/またはスペーサー配列を含む、実施形態27Aに記載の方法。
実施形態29A. 記録タグおよび/またはコーディングタグが、3’末端に制限酵素消化部位をさらに含む、実施形態28Aに記載の方法。
実施形態30A. タンパク質のセットが、プロテオームまたはそのサブセットであり、必要に応じて、タンパク質のセットが、ゲノムもしくはそのサブセットのin vitro転写、その後、in vitro翻訳を使用して作製されるか、またはトランスクリプトームもしくはそのサブセットのin vitro翻訳によって作製される、実施形態1Aから29Aまでのいずれか1つに記載の方法。
実施形態31A. プロテオームのサブセットが、カイノーム;セクレトーム;レセプトーム(例えば、GPCRome);免疫プロテオーム;栄養プロテオーム;翻訳後修飾(例えば、リン酸化、ユビキチン化、メチル化、アセチル化、グリコシル化、酸化、脂質付加、および/もしくはニトロシル化)によって規程されるプロテオームサブセット、例えば、リン酸化プロテオーム(例えば、ホスホチロシン−プロテオーム、チロシン−カイノーム、およびチロシン−ホスファトーム)、グリコプロテオームなど;組織もしくは器官、発生段階、または生理的もしくは病的状態に関連するプロテオームサブセット;細胞周期、分化(もしくは脱分化)、細胞死、老化、細胞遊走、形質転換、または転移などの細胞プロセスに関連するプロテオームサブセット;またはこれらの任意の組合せを含む、実施形態30Aに記載の方法。
実施形態32A. タンパク質のセットが、ヒトなどの哺乳動物、非ヒト動物、魚、無脊椎動物、節足動物、昆虫、または植物、例えば、酵母、細菌、例えば、E.coli、ウイルス、例えば、HIVもしくはHCV、またはこれらの組合せに由来する、実施形態1Aから31Aまでのいずれか1つに記載の方法。
実施形態33A. タンパク質のセットが、タンパク質複合体またはそのサブユニットを含む、実施形態1Aから32Aまでのいずれか1つに記載の方法。
実施形態34A. 記録タグが、核酸、オリゴヌクレオチド、修飾されたオリゴヌクレオチド、DNA分子、偽相補的塩基を有するDNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、またはモルホリノ、またはこれらの組合せを含む、実施形態1Aから33Aまでのいずれか1つに記載の方法。
実施形態35A. 記録タグが、ユニバーサルプライミング部位を含む、実施形態1Aから34Aまでのいずれか1つに記載の方法。
実施形態36A. 記録タグが、増幅、配列決定、またはその両方のためのプライミング部位を含み、例えば、ユニバーサルプライミング部位が、増幅、配列決定、またはその両方のためのプライミング部位を含む、実施形態1Aから35Aまでのいずれか一項に記載の方法。
実施形態37A. 記録タグが、一意の分子識別子(UMI)を含む、実施形態1Aから36Aまでのいずれか1つに記載の方法。
実施形態38A. 記録タグが、バーコードを含む、実施形態1Aから37Aまでのいずれか1つに記載の方法。
実施形態39A. 記録タグが、その3’末端にスペーサーを含む、実施形態1Aから38Aまでのいずれか1つに記載の方法。
実施形態40A.支持体が、剛性固体支持体、可撓性固体支持体、または軟性固体支持体などの固体支持体であり、多孔質支持体または非多孔質支持体を含む、実施形態1Aから39Aまでのいずれか1つに記載の方法。
実施形態41A.支持体が、ビーズ、多孔質ビーズ、磁気ビーズ、常磁性ビーズ、多孔質マトリックス、アレイ、表面、ガラス表面、シリコン表面、プラスチック表面、スライド、フィルター、ナイロン、チップ、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、ウェル、マイクロタイターウェル、プレート、ELISAプレート、ディスク、スピン干渉ディスク、膜、ニトロセルロースメンブレン、ニトロセルロースに基づくポリマー表面、ナノ粒子(例えば、磁気ナノ粒子(Fe3O4)、金ナノ粒子、および/または銀ナノ粒子などの金属を含む)、量子ドット、ナノシェル、ナノケージ、マイクロスフェア、またはこれらの任意の組合せを含む、実施形態1Aから40Aまでのいずれか1つに記載の方法。
実施形態42A.支持体が、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、磁気ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズ、またはこれらの任意の組合せを含む、実施形態41Aに記載の方法。
実施形態43A. 小分子−タンパク質結合マトリックス、および/またはペプチド/ペプチドの模倣物−タンパク質結合マトリックス、および/またはペプチド模倣物−タンパク質結合マトリックス(例えば、ペプトイド−タンパク質結合マトリックス、β−ペプチド−タンパク質結合マトリックス、もしくはD−ペプチドペプチド模倣物−タンパク質結合マトリックス)、および/または多糖−タンパク質結合マトリックス、および/またはアプタマー−タンパク質結合マトリックスを創出するために、タンパク質のセットと、小分子、および/またはペプチドもしくはペプチドの模倣物、および/またはペプチド模倣物(例えば、ペプトイド、β−ペプチド、もしくはD−ペプチドペプチド模倣物)、および/または多糖、および/またはアプタマーのライブラリーとの間の相互作用の並行解析のための、実施形態1Aから42Aまでのいずれか1つに記載の方法。
実施形態44A. マトリックスのサイズが、約102、約103、約104、約105、約106、約107、約108、約109、約1010、約1011、約1012、約1013、約1014であるか、またはそれよりも大きい、例えば、約2×1013である、実施形態43Aに記載の方法。
実施形態45A. コーディングタグが、核酸、オリゴヌクレオチド、修飾されたオリゴヌクレオチド、DNA分子、偽相補的塩基を有するDNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、またはモルホリノ、またはこれらの組合せを含む、実施形態1Aから44Aまでのいずれか1つに記載の方法。
実施形態46A. コーディングタグが、小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β−ペプチド、もしくはD−ペプチドペプチド模倣物)、多糖、またはアプタマーを識別するエンコーダー配列を含む、実施形態1Aから45Aまでのいずれか1つに記載の方法。
実施形態47A. コーディングタグが、スペーサー、一意の分子識別子(UMI)、ユニバーサルプライミング部位、またはこれらの任意の組合せを含む、実施形態1Aから46Aまでのいずれか1つに記載の方法。
実施形態48A. 小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β−ペプチド、もしくはD−ペプチドペプチド模倣物)、多糖、またはアプタマーおよびコーディング配列が、リンカーまたは結合対によって接合されている、実施形態1Aから47Aまでのいずれか1つに記載の方法。
実施形態49A. 小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β−ペプチド、もしくはD−ペプチドペプチド模倣物)、多糖、またはアプタマーおよびコーディング配列が、SpyTag−KTag/SpyLigase(接合しようとする2つの部分がSpyTag/KTag対を有し、SpyLigaseが、SpyTagをKTagに接合し、したがって2つの部分が接合される)、SpyTag/SpyCatcher、SnoopTag/SnoopCatcherペプチド−タンパク質対、ソルターゼ、またはHaloTag/HaloTagリガーゼ対、またはこれらの任意の組合せによって接合されている、実施形態1Aから48Aまでのいずれか1つに記載の方法。
実施形態50A.ポリペプチドを解析するための方法であって、(a)(i)各断片に記録タグが直接または間接的に付随している、ポリペプチドの断片のセットを、(ii)各結合性物質が、結合性部分および結合性部分に関する識別情報を含むコーディングタグを含み、結合性部分が、断片の1つもしくは複数のN末端、内部、もしくはC末端のアミノ酸に結合することが可能である、または官能化試薬によって修飾された1つもしくは複数のN末端、内部、もしくはC末端のアミノ酸に結合することが可能である、結合性物質のライブラリーと接触させるステップであって、各断片および/もしくはそれに付随する記録タグ、または各結合性物質が、支持体に直接または間接的に固定化されている、ステップと;(b)結合性部分と断片の1つまたは複数のN末端、内部、またはC末端のアミノ酸との間の結合時に(i)各断片に付随する記録タグと(ii)コーディングタグとの間の情報の移行を可能にして、伸長記録タグおよび/または伸長コーディングタグを生成するステップと;(c)伸長記録タグおよび/または伸長コーディングタグを解析するステップとを含む方法。
実施形態51A.1つまたは複数のN末端、内部、またはC末端のアミノ酸が、(i)N末端アミノ酸(NTAA);(ii)N末端ジペプチド配列;(iii)N末端トリペプチド配列;(iv)内部アミノ酸;(v)内部ジペプチド配列;(vi)内部トリペプチド配列;(vii)C末端アミノ酸(CTAA);(viii)C末端ジペプチド配列;または(ix)C末端トリペプチド配列、またはこれらの任意の組合せを含み、必要に応じて、(i)〜(ix)内のアミノ酸残基の任意の1つまたは複数が修飾または官能化されている、実施形態50Aに記載の方法。
実施形態52A.1つまたは複数のN末端、内部、またはC末端のアミノ酸が、各残基において独立に、アラニン(AまたはAla)、システイン(CまたはCys)、アスパラギン酸(DまたはAsp)、グルタミン酸(EまたはGlu)、フェニルアラニン(FまたはPhe)、グリシン(GまたはGly)、ヒスチジン(HまたはHis)、イソロイシン(IまたはIle)、リシン(KまたはLys)、ロイシン(LまたはLeu)、メチオニン(MまたはMet)、アスパラギン(NまたはAsn)、プロリン(PまたはPro)、グルタミン(QまたはGln)、アルギニン(RまたはArg)、セリン(SまたはSer)、トレオニン(TまたはThr)、バリン(VまたはVal)、トリプトファン(WまたはTrp)、およびチロシン(YまたはTyr)からなる群から、これらの任意の組合せで選択される、実施形態51Aに記載の方法。
実施形態53A. 結合性部分が、ポリペプチドもしくはその断片、タンパク質もしくはポリペプチド鎖もしくはその断片、または抗体もしくはその抗原結合性断片などのタンパク質複合体もしくはそのサブユニットを含む、実施形態50Aから52Aまでのいずれか1つに記載の方法。
実施形態54A. 結合性部分が、アンチカリンまたはその変異体、突然変異体、もしくは修飾タンパク質;アミノアシル−tRNAシンテターゼまたはその変異体、突然変異体、もしくは修飾タンパク質;アンチカリンまたはその変異体、突然変異体、もしくは修飾タンパク質;ClpSまたはその変異体、突然変異体、もしくは修飾タンパク質;UBRボックスタンパク質またはその変異体、突然変異体、もしくは修飾タンパク質;あるいはアミノ酸に結合する修飾小分子、つまりバンコマイシンまたはその変異体、突然変異体、もしくは修飾タンパク質;あるいはこれらの任意の組合せを含む、実施形態50Aから53Aまでのいずれか1つに記載の方法。
実施形態55A. 結合性部分が、機能化N−末端アミノ酸(NTAA)、N末端ジペプチド配列、またはN末端トリペプチド配列、またはこれらの任意の組合せに選択的におよび/または特異的に結合することが可能である、実施形態50Aから54Aまでのいずれか1つに記載の方法。
実施形態56A.複数のポリペプチドを解析するための方法であって、(a)複数のポリペプチドの各分子を複数のユニバーサルタグで標識するステップと;(b)複数のポリペプチドと複数のコンパートメントタグを、複数のユニバーサルタグと複数のコンパートメントタグのアニーリングまたは接合に適した条件下で接触させ、それにより、複数のポリペプチドを複数のコンパートメント(例えば、ビーズ表面、マイクロ流体液滴、マイクロウェル、または表面上の分離された領域、またはこれらの任意の組合せ)に分配するステップであって、複数のコンパートメントタグが、各コンパートメント内では同じであり、他のコンパートメントのコンパートメントタグとは異なる、ステップと;(c)各コンパートメント内のポリペプチド(複数可)を断片化し、それにより、それぞれに少なくとも1つのユニバーサルポリヌクレオチドタグおよび少なくとも1つのコンパートメントタグを含む記録タグに付随するポリペプチド断片のセットを生成するステップと;(d)ポリペプチド断片のセットを支持体に直接または間接的に固定化するステップと;(e)固定化されたポリペプチド断片のセットを、各結合性物質が、結合性部分および結合性部分に関する識別情報を含むコーディングタグを含み、結合性部分が、断片の1つもしくは複数のN末端、内部、もしくはC末端のアミノ酸に結合することが可能である、または官能化試薬によって修飾された1つもしくは複数のN末端、内部、もしくはC末端のアミノ酸に結合することが可能である、結合性物質のライブラリーと接触させるステップと;(f)結合性部分と断片の1つまたは複数のN末端、内部、またはC末端のアミノ酸との間の結合時に(i)各断片に付随する記録タグと(ii)コーディングタグとの間の情報の移行を可能にして、伸長記録タグおよび/または伸長コーディングタグを生成するステップと;(g)伸長記録タグおよび/または伸長コーディングタグを解析するステップとを含む方法。
実施形態57A.同じコンパートメントタグを有する複数のポリペプチドが、同じタンパク質に属する、実施形態56Aに記載の方法。
実施形態58A.同じコンパートメントタグを有する複数のポリペプチドが、異なるタンパク質、例えば、2種、3種、4種、5種、6種、7種、8種、9種、10種、またはそれよりも多くのタンパク質に属する、実施形態56Aに記載の方法。
実施形態59A. 複数のコンパートメントタグが、複数の基材に固定化されており、各基材がコンパートメントを画成する、実施形態56Aから58Aまでのいずれか1つに記載の方法。
実施形態60A. 複数の基材が、ビーズ、多孔質ビーズ、磁気ビーズ、常磁性ビーズ、多孔質マトリックス、アレイ、表面、ガラス表面、シリコン表面、プラスチック表面、スライド、フィルター、ナイロン、チップ、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、ウェル、マイクロタイターウェル、プレート、ELISAプレート、ディスク、スピン干渉ディスク、膜、ニトロセルロースメンブレン、ニトロセルロースに基づくポリマー表面、ナノ粒子(例えば、磁気ナノ粒子(Fe3O4)、金ナノ粒子、および/または銀ナノ粒子などの金属を含む)、量子ドット、ナノシェル、ナノケージ、マイクロスフェア、またはこれらの任意の組合せからなる群から選択される、実施形態59Aに記載の方法。
実施形態61A. 複数の基材の各々が、バーコード付きビーズ、例えば、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、磁気ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズ、またはこれらの任意の組合せなどのバーコード付き粒子を含む、実施形態59Aまたは60Aに記載の方法。
実施形態62A.支持体が、ビーズ、多孔質ビーズ、磁気ビーズ、常磁性ビーズ、多孔質マトリックス、アレイ、表面、ガラス表面、シリコン表面、プラスチック表面、スライド、フィルター、ナイロン、チップ、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、ウェル、マイクロタイターウェル、プレート、ELISAプレート、ディスク、スピン干渉ディスク、膜、ニトロセルロースメンブレン、ニトロセルロースに基づくポリマー表面、ナノ粒子(例えば、磁気ナノ粒子(Fe3O4)、金ナノ粒子、および/または銀ナノ粒子などの金属を含む)、量子ドット、ナノシェル、ナノケージ、マイクロスフェア、またはこれらの任意の組合せからなる群から選択される、実施形態59Aから61Aまでのいずれか1つに記載の方法。
実施形態63A.支持体が、配列決定ビーズ、例えば、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、磁気ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズ、またはこれらの任意の組合せを含む、実施形態62Aに記載の方法。
実施形態64A.支持体上で各断片およびそれに付随する記録タグと他の断片およびそれらに付随する記録タグとの間に約20nmと等しいもしくはそれよりも大きい、約50nmと等しいもしくはそれよりも大きい、約100nmと等しいもしくはそれよりも大きい、約150nmと等しいもしくはそれよりも大きい、約200nmと等しいもしくはそれよりも大きい、約250nmと等しいもしくはそれよりも大きい、約300nmと等しいもしくはそれよりも大きい、約350nmと等しいもしくはそれよりも大きい、約400nmと等しいもしくはそれよりも大きい、約450nmと等しいもしくはそれよりも大きい、約500nmと等しいもしくはそれよりも大きい、約550nmと等しいもしくはそれよりも大きい、約600nmと等しいもしくはそれよりも大きい、約650nmと等しいもしくはそれよりも大きい、約700nmと等しいもしくはそれよりも大きい、約750nmと等しいもしくはそれよりも大きい、約800nmと等しいもしくはそれよりも大きい、約850nmと等しいもしくはそれよりも大きい、約900nmと等しいもしくはそれよりも大きい、約950nmと等しいもしくはそれよりも大きい、または約1μmと等しいもしくはそれよりも大きい平均距離で間隔をあける、実施形態56Aから63Aまでのいずれか1つに記載の方法。
実施形態65A.複数のポリペプチドを解析するための方法であって、(a)複数のポリペプチドを複数の基板に固定化するステップであって、各基板が、それぞれがコンパートメントタグを含む複数の記録タグを含み、必要に応じて、各コンパートメントが、ビーズ、マイクロ流体液滴、マイクロウェル、または表面上の分離された領域、またはこれらの任意の組合せである、ステップと;(b)各基板に固定化されたポリペプチド(複数可)を断片化し(例えば、プロテアーゼ消化によって)、それにより、基板に固定化されたポリペプチド断片のセットを生成するステップと;(c)固定化されたポリペプチド断片のセットを、各結合性物質が、結合性部分および結合性部分に関する識別情報を含むコーディングタグを含み、結合性部分が、断片の1つもしくは複数のN末端、内部、もしくはC末端のアミノ酸に結合することが可能である、または官能化試薬によって修飾された1つもしくは複数のN末端、内部、もしくはC末端のアミノ酸に結合することが可能である、結合性物質のライブラリーと接触させるステップと;(d)(i)結合性部分と各断片の1つまたは複数のN末端、内部、またはC末端のアミノ酸との間の結合時に記録タグと(ii)コーディングタグとの間の情報の移行を可能にして、伸長記録タグおよび/または伸長コーディングタグを生成するステップと;(e)伸長記録タグおよび/または伸長コーディングタグを解析するステップとを含む方法。
実施形態66A.同じコンパートメントタグを有する複数のポリペプチドが、同じタンパク質に属する、実施形態65Aに記載の方法。
実施形態67A.同じコンパートメントタグを有する複数のポリペプチドが、異なるタンパク質、例えば、2種、3種、4種、5種、6種、7種、8種、9種、10種、またはそれよりも多くのタンパク質に属する、実施形態65Aに記載の方法。
実施形態68A.各基板によりコンパートメントが規程される、実施形態65Aから67Aまでのいずれか1つに記載の方法。
実施形態69A.複数の基板が、ビーズ、多孔質ビーズ、多孔質マトリックス、アレイ、表面、ガラス表面、シリコン表面、プラスチック表面、スライド、フィルター、ナイロン、チップ、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、ウェル、マイクロタイターウェル、プレート、ELISAプレート、ディスク、スピン干渉ディスク、膜、ニトロセルロースメンブレン、ニトロセルロースに基づくポリマー表面、ナノ粒子(例えば、磁気ナノ粒子(Fe3O4)、金ナノ粒子、および/または銀ナノ粒子などの金属を含む)、量子ドット、ナノシェル、ナノケージ、マイクロスフェア、またはこれらの任意の組合せからなる群から選択される、実施形態65Aから68Aまでのいずれか1つに記載の方法。
実施形態70A.複数の基板はそれぞれが、バーコードが付された粒子、例えば、バーコードが付されたビーズ、例えば、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、磁気ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズ、またはこれらの任意の組合せなどを含む、実施形態65Aから69Aまでのいずれか1つに記載の方法。
実施形態71A.官能化試薬が、化学薬剤、酵素、および/または生物学的薬剤、例えば、イソチオシアネート誘導体、2,4−ジニトロベンゼンスルホン酸(DNBS)、4−スルホニル−2−ニトロフルオロベンゼン(SNFB)1−フルオロ−2,4−ジニトロベンゼン、ダンシルクロリド、7−メトキシクマリン酢酸、チオアシル化試薬、チオアセチル化試薬、またはチオベンジル化試薬を含む、実施形態50Aから70Aまでのいずれか1つに記載の方法。
実施形態72A.記録タグが、核酸、オリゴヌクレオチド、修飾されたオリゴヌクレオチド、DNA分子、偽相補的塩基を有するDNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、またはモルホリノ、またはこれらの組合せを含む、実施形態50Aから71Aまでのいずれか1つに記載の方法。
実施形態73.記録タグが、ユニバーサルプライミング部位;増幅、配列決定、またはその両方のためのプライミング部位;必要に応じて、一意の分子識別子(UMI);バーコード;必要に応じて、その3’末端のスペーサー;またはこれらの組合せを含む、実施形態50Aから72Aまでのいずれか1つに記載の方法。
実施形態74A. ポリペプチドまたは複数のポリペプチドの配列を決定するためである、実施形態50Aから73Aまでのいずれか1つに記載の方法。
実施形態75A. コーディングタグが、核酸、オリゴヌクレオチド、修飾オリゴヌクレオチド、DNA分子、偽相補的塩基を有するDNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子、またはモルホリノ、またはこれらの組合せを含む、実施形態50Aから74Aまでのいずれか1つに記載の方法。
実施形態76A. コーディングタグが、エンコーダー配列、必要に応じたスペーサー、必要に応じた一意の分子識別子(UMI)、ユニバーサルプライミング部位、またはこれらの任意の組合せを含む、実施形態50Aから75Aまでのいずれか1つに記載の方法。
実施形態77A. 結合性部分およびコーディングタグが、リンカーまたは結合対により接合されている、実施形態50Aから76Aまでのいずれか1つに記載の方法。
実施形態78A. 結合性部分およびコーディングタグが、SpyTag−KTag/SpyLigase(接合しようとする2つの部分がSpyTag/KTag対を有し、SpyLigaseが、SpyTagをKTagに接合し、したがって2つの部分が接合される)、SpyTag/SpyCatcher、SnoopTag/SnoopCatcherペプチド−タンパク質対、ソルターゼ、またはHaloTag/HaloTagリガーゼ対、またはこれらの任意の組合せにより接合されている、実施形態50Aから77Aまでのいずれか1つに記載の方法。
実施形態79A. コーディングタグおよび/または記録タグが、1つもしくは複数のエラー訂正コード、1つもしくは複数のエンコーダー配列、1つもしくは複数のバーコード、1つもしくは複数のUMI、1つもしくは複数のコンパートメントタグ、またはこれらの任意の組合せを含む、実施形態1Aから78Aまでのいずれか1つに記載の方法。
実施形態80A. エラー訂正コードが、Hammingコード、Lee距離コード、非対称Lee距離コード、Reed−Solomonコード、およびLevenshtein−Tenengoltsコードから選択される、実施形態79Aに記載の方法。
実施形態81A. 伸長記録タグおよび/または伸長コーディングタグの解析が核酸配列解析を含む、実施形態1Aから80Aまでのいずれか1つに記載の方法。
実施形態82A. 核酸配列解析が、合成による配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、ポロニーシーケンシング、イオン半導体シーケンシング、またはパイロシーケンシング、またはこれらの任意の組合せを含む、実施形態81Aに記載の方法。
実施形態83A. 核酸配列決定法が、単一分子リアルタイムシーケンシング、ナノポアに基づく配列決定、または先端顕微鏡を使用したDNAのダイレクトイメージングである、実施形態82Aに記載の方法。
実施形態84A. 1つまたは複数の洗浄ステップをさらに含む、実施形態1Aから83Aのいずれか1つに記載の方法。
実施形態85A. 伸長記録タグおよび/または伸長コーディングタグが、解析前に増幅される、実施形態1Aから84Aまでのいずれか1つに記載の方法。
実施形態86A. 伸長記録タグおよび/または伸長コーディングタグが、解析前に標的濃縮アッセイを受ける、実施形態1Aから85Aまでのいずれか1つに記載の方法。
実施形態87A. 伸長記録タグおよび/または伸長コーディングタグが、解析前にサブトラクションアッセイを受ける、実施形態1Aから86Aまでのいずれか1つに記載の方法。
実施形態88A.(a)作用物質のライブラリーであって、各作用物質が、(i)小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β−ペプチド、またはD−ペプチドのペプチド模倣物)、多糖、および/またはアプタマー、ならびに(ii)小分子、ペプチドもしくはペプチドの模倣物、ペプチド模倣物(例えば、ペプトイド、β−ペプチド、またはD−ペプチドのペプチド模倣物)、多糖、またはアプタマーに関する識別情報を含むコーディングタグを含む作用物質のライブラリーと、必要に応じて(b)各タンパク質に記録タグが直接または間接的に付随している、タンパク質のセットとを含み、各タンパク質および/もしくはそれに付随する記録タグ、または各作用物質が支持体に直接または間接的に固定化されており、タンパク質のセット、記録タグ、および作用物質のライブラリーが、(i)1つまたは複数の作用物質の小分子(複数可)、ペプチド(複数可)もしくはペプチドの模倣物(複数可)、ペプチド模倣物(複数可)(例えば、ペプトイド(複数可)、β−ペプチド(複数可)、またはD−ペプチドのペプチド模倣物(複数可))、多糖(複数可)、またはアプタマー(複数可)と結合および/または反応する、各タンパク質に付随する記録タグと(ii)1つまたは複数の作用物質のコーディングタグとの間の情報の移行を可能にして、伸長記録タグおよび/または伸長コーディングタグを生成するように構成されているキット。
実施形態89A.ポリペプチドを解析するためのキットであって、(a)各結合性物質が、結合性部分および結合性部分に関する識別情報を含むコーディングタグを含み、結合性部分が、断片の1つもしくは複数のN末端、内部、もしくはC末端のアミノ酸に結合することが可能である、または官能化試薬によって修飾された1つもしくは複数のN末端、内部、もしくはC末端のアミノ酸に結合することが可能である、結合性物質のライブラリーと、必要に応じて(b)各断片に記録タグが直接または間接的に付随しているポリペプチドの断片のセット、または(b’)プロテアーゼなどの、ポリペプチドを断片化するための手段とを含み、各断片および/もしくはそれに付随する記録タグ、または各結合性物質が、支持体に直接または間接的に固定化されており、ポリペプチドの断片のセット、記録タグ、および結合性物質のライブラリーが、結合性部分と断片の1つまたは複数のN末端、内部、またはC末端のアミノ酸との間の結合時に(i)各断片に付随する記録タグと(ii)コーディングタグとの間の情報の移行を可能にして、伸長記録タグおよび/または伸長コーディングタグを生成するように構成されているキット。
実施形態90A.複数のポリペプチドを解析するためのキットであって、(a)各結合性物質が、結合性部分および結合性部分に関する識別情報を含むコーディングタグを含み、結合性部分が、断片の1つもしくは複数のN末端、内部、もしくはC末端のアミノ酸に結合することが可能である、または官能化試薬によって修飾された1つもしくは複数のN末端、内部、もしくはC末端のアミノ酸に結合することが可能である、結合性物質のライブラリーと、(b)複数のポリペプチドが必要に応じて固定化された複数の基板であって、各基板が、それぞれがコンパートメントタグを含む複数の記録タグを含み、必要に応じて、各コンパートメントが、ビーズ、マイクロ流体液滴、マイクロウェル、または表面上の分離された領域、またはこれらの任意の組合せであり、各基板に固定化されたポリペプチド(複数可)が、断片化されて(例えば、プロテアーゼ切断によって)、基板に固定化されたポリペプチド断片のセットを生成するように構成されている、複数の基板とを含み、複数のポリペプチド、記録タグ、および結合性物質のライブラリーが、結合性部分と各断片の1つまたは複数のN末端、内部、またはC末端のアミノ酸との間の結合時に(i)記録タグと(ii)コーディングタグとの間の情報の移行を可能にして、伸長記録タグおよび/または伸長コーディングタグを生成するように構成されているキット。
V. 実施例
以下の例は、説明のために含まれているに過ぎず、本発明の範囲を限定することは意図されていない。これらの方法の関連背景情報および実施可能性は周知であり、WO2018/089641 A2号の、およびLam, K.S., M. Lebl and V. Krchnak (1997), "The"One-Bead-One-Compound" Combinatorial Library Method," Chem Rev97(2): 411-448の情報を含む。これらの文献の各々は、その全体が参照により本明細書に組み込まれる。
(実施例1)
プロテイナーゼKによるタンパク質試料の消化
ペプチドのライブラリーを、トリプシン、プロテイナーゼKなどのプロテアーゼで消化することによりタンパク質試料から調製する。トリプシンは、例えば、リシンおよびアルギニンのような正電荷のアミノ酸のC末端側を切断するが、プロテイナーゼKは、タンパク質の全体にわたって非選択的に切断する。そのため、プロテイナーゼK消化は、短鎖ペプチド(約30個のアミノ酸)を生成するのに十分なタンパク質分解を提供するが、試料が過剰消化されないような好ましい酵素対ポリペプチドの比を使用して、注意深くタイトレーションすることが必要である。一般的に、所与のプロテイナーゼKロット毎に、機能活性のタイトレーションを実施することが必要である。この例では、タンパク質試料を、1×PBS/1mM EDTA/0.5mM CaCl2/0.5%SDS(pH8.0)中で1:10〜1:100(w/w)の酵素:タンパク質比にてプロテイナーゼKを用いて、1時間37℃にて消化する。インキュベーション後、PMSFを、終濃度が5mMになるように添加して、さらなる消化を阻害する。
プロテイナーゼKの特異的活性は、「化学的基質」ベンゾイルアルギニン−p−ニトロアニリドをプロテイナーゼKと共にインキュベートし、約410nmで吸収を示す黄色p−ニトロアニリン産物の発色を測定することにより、測定することができる。酵素活性は、1単位が毎分1μモルのp−ニトロアニリドの産生と等しい単位で測定し、特異的活性は、酵素活性/mg総タンパク質の単位で測定する。その後、溶液中のタンパク質の総量で酵素活性を除算することにより、特異的活性を算出する。
(実施例2)
SP3オンビーズプロテアーゼ消化および標識を使用した試料調製
Hughesら(2014年、Mol Syst Biol、10巻:757頁)により記載されているようなSP3試料調製プロトコールを使用して、タンパク質を抽出し、変性させる。抽出した後、タンパク質ミックス(およびビーズ)を、0.02%SDSで補完された1mM EDTAを有する50mMホウ酸緩衝液(pH8.0)中で1時間37℃で溶解した。タンパク質溶解後、ジスルフィド結合を、終濃度が5mMになるようにDTTを添加し、試料を50℃で10分間インキュベートすることにより還元する。終濃度が10mMになるようにヨードアセトアミドを添加することによりシステインをアルキル化し、室温で20分間、暗所でインキュベートする。反応を、50mMホウ酸緩衝液で2倍に希釈し、Glu−CまたはLys−Cを、1:50(w/w)の最終プロテイナーゼ:タンパク質比で添加する。試料を37℃で一晩(約16時間)インキュベートして、消化を完了した。Hughesら(上記)により記載されているように試料を消化した後、8分間のインキュベーション中、アセトニトリルの終濃度が95%になるように100%アセトニトリルを添加することによりペプチドをビーズに結合させ、アセトニトリルで洗浄する。洗浄した後、5分間のピペット混合ステップにより、10μlの2%DMSO中でビーズからペプチドを溶出する。
(実施例3)
記録タグとペプチドとのカップリング
DNA記録タグを、いくつかの方法でペプチドにカップリングする(Aslam etal., 1998, Bioconjugation: Protein Coupling Techniques for the BiomedicalSciences, Macmillan Reference LTD;Hermanson GT, 1996, Bioconjugate Techniques,Academic Press Inc., 1996を参照)。1つの手法では、カルボジイミド化学を使用してペプチドのC末端にカップリングされる5’アミン、およびクリック化学を使用してアジドビーズにカップリングされる内部歪みアルキンDBCO−dT(Glen Research、VA)を用いて、オリゴヌクレオチド記録タグを構築する。カルボジイミドカップリングを完了へと駆動し、ペプチド間カップリングを制限するために、大幅に過剰なモル濃度の記録タグを使用して、溶液中で記録タグをペプチドにカップリングする。あるいは、5’歪みアルキン(DBCO−dT)を用いてオリゴヌクレオチドを構築し、アジド誘導体化ペプチドにカップリングし(ペプチドのC末端にカップリングするアジド−PEG−アミンおよびカルボジイミドにより)、その後アルデヒド反応性HyNicヒドラジンビーズにカップリングする。この目的のために、記録タグオリゴヌクレオチドを、内部アルデヒドホルミルインドール(Trilink)基で容易に標識することができる。あるいは、C末端アミンにカップリングするのではなく、その代わりに、記録タグを、内部リシン残基にカップリングしてもよい(例えば、Lys−C消化後に、またはその代わりにGlu−C消化後に)。1つの手法では、これは、NHS−アジド(またはNHS−PEG−アジド)基を用いてリシンアミンを活性化し、その後5’アミン標識記録タグにカップリングすることにより達成することができる。別の手法では、5’アミン標識記録タグを、DSSなどの過剰なNHSホモ二機能性架橋試薬と反応させて、5’NHS活性化記録タグを創出することができる。この5’NHS活性化記録タグは、ペプチドのリシン残基のε−アミノ基に直接カップリングすることができる。
(実施例4)
ペプチドのアミノ酸の部位特異的標識
アミノ酸は、DNAタグで直接的または間接的のいずれかにより部位選択的に修飾することができる。直接標識の場合、DNAタグを部位選択的化学で活性化することができ、またはその代わりに間接標識の場合、ヘテロ二機能性化学を使用して、特定のアミノ酸反応性部分を、DNAタグを後に付着させることができるユニバーサルクリック化学に変換することができる(Lundblad 2014)。1つの場合では、5つの異なるアミノ酸を部位特異的に標識する例が記載される。タンパク質またはペプチドのアミノ酸の5つの異なる例を、活性化DNAタグで直接的に(ヘテロ二機能性アミノ酸部位特異的試薬による活性化を使用して)、またはDNAタグの同種クリック部分に付着させるために後に使用されるクリック部分でアミノ酸を部位特異的に標識するクリック化学ヘテロ二機能性試薬により間接的に修飾することができる。
典型的なタンパク質入力は、0.1%RapiGest(商標)SF界面活性剤および5mM TCEPを含む50μlの適切な水性緩衝液中に1μgのタンパク質を含む。RapiGest(商標)SDは、標識または消化を向上させるためにタンパク質をポリペプチドへと変性させるための酸分解性界面活性剤として有用である。以下のアミノ酸標識戦略を使用することができる:マレイミド化学を使用したシステイン−−−200μMのスルホ−SMCC活性化DNAタグを使用して、システインを、100mM MES緩衝液(pH6.5)+1%TX−100中で1時間、部位特異的に標識する;NHS化学を使用したリシン−−−200μMのDSSまたはBS3活性化DNAタグを使用して、溶液相タンパク質またはビーズ結合ペプチドのリシンを、室温にて1時間、ホウ酸緩衝液(50mM、pH8.5)+1%TX−100中で部位特異的に標識する;チロシンは、4−フェニル−3H−1,2,4−トリアゾリン−3,5(4H)−ジオン(PTAD)で修飾する;またはジアゾニウム化学−−−ジアゾニウム化学の場合、DNAタグを、EDCおよび4−カルボキシルベンゼンジアゾニウムテトラフルオロボレート(Aikon International、China)で活性化する。タンパク質またはビーズ結合ペプチドを、ホウ酸緩衝液(50mM、pH8.5)+1%TX−100中で、200μMのジアゾニウム誘導体化DNAタグと共に1時間氷上にてインキュベートすることにより、チロシンとのジアゾ連結を創出する(Nguyen、Caoら、2015年)。EDC化学を使用してアスパラテート/グルタメートを修飾する−−−アミン標識DNAタグを、pH6.5のMES中でビーズ結合ペプチドおよび100mM EDC/50mMイミダゾールと共に、室温で1時間にわたってインキュベートする(Basleら、2010年、Chem. Biol.、17巻:213〜227頁)。標識の後、過剰な活性化DNAタグを、C4レジンZipTips(Millipore)からのタンパク結合溶出を使用して除去する。溶出したタンパク質を、1×PBS緩衝液で50μlにする。
(実施例5)
歪みアルキン記録タグ標識ペプチドのアジド活性化ビーズへの固定化
市販のアミンDynabeads(登録商標)M−270を、アジドPEG NHSエステルヘテロ二機能性リンカー(JenKem Technology、Tx)と反応させることにより、アジド誘導体化Dynabeads(登録商標)M−270ビーズを生成する。さらに、メトキシまたはヒドロキシルPEG NHSエステルと適切な比で混合することにより、アジドの表面密度をタイトレーションすることができる。所与のペプチド試料毎に、1〜2mgのアジド誘導体化Dynabeads(登録商標)M−270ビーズ(約1.3×108個のビーズ)を、100μlのホウ酸緩衝液(50mMホウ酸ナトリウム、pH8.5)で希釈し、1ngの記録タグペプチドを添加し、23〜37℃で1時間インキュベートする。200μlのホウ酸緩衝液で3回洗浄する。
(実施例6)
ホルミルインドール反応性HyNicビーズの創出
アミンビーズのHyNic誘導体化により、ホルミルインドール反応性ビーズを創出する。20mgのDynabeads(登録商標)M−270アミンビーズ(2.8μm)のアリコートを、200μlのホウ酸緩衝液に懸濁する。短時間の超音波処理後、1〜2mgのスルホ−S−HyNic(スクシンイミジル6−ヒドラジノニコチネートアセトンヒドラゾン、SANH)(カタログ#S−1002、Solulink、San Diego)を添加し、反応混合物を室温で1時間にわたって振とうする。その後、ビーズを、ホウ酸緩衝液で2回およびクエン酸緩衝液(200mMクエン酸ナトリウム)で1回洗浄する。ビーズを、終濃度が10mg/mlになるようにクエン酸緩衝液に懸濁する。
(実施例7)
記録タグホルミルインドール(formlindole)標識ペプチドの活性化ビーズへの固定化
1〜2mgのHyNic活性化Dynabeads(登録商標)M−270ビーズのアリコート(約1.3×108個ビーズ)を、50mMアニリンで補完された100μlのクエン酸緩衝液で希釈し、約1ngの記録タグペプチドコンジュゲートを添加し、37℃で1時間にわたってインキュベートする。ビーズを、200μlのクエン酸緩衝液で3回洗浄し、100μlのホウ酸緩衝液に再懸濁した。
(実施例8)
オリゴヌクレオチドモデル系−コーディングタグの識別情報をサイクル様式で記録タグへと移行させることによる結合性物質履歴の記録
核酸コーディングタグおよび記録タグの場合、標準的核酸酵素学を使用したライゲーションまたはプライマー伸長により、結合されている結合性物質のコーディングタグから近位の記録タグへと、情報を移行させることができる。これは、結合性物質標的を表す5’部分および記録タグを表す3’部分を有するオリゴヌクレオチドで構成される単純なモデル系で実証することができる。オリゴヌクレオチドの内部部位を、dT−アルキン修飾(DBCO−dT、Glen Research)によるクリック化学を使用して固定化することができる。図24Aに示されている例では、固定化されたオリゴヌクレオチド(AB標的)は、同種オリゴヌクレオチド「結合性物質」であるAオリゴおよびBオリゴが結合することができる、AおよびBと標識されている2つの標的結合領域を含む。AオリゴおよびBオリゴヌクレオチドは、共通スペーサー(Sp)を介して記録タグと相互作用して、プライマー伸長(またはライゲーション)を開始するコーディングタグ(配列および長さが異なる)に連結されている。Spの長さは、結合性物質結合中の非特異的相互作用を最小限に抑えるために、短く(例えば、6〜9塩基)しておくべきである。この特定の例では、コーディングタグの長さは、「A」オリゴ結合事象(10塩基エンコーダー配列)と「B」オリゴ結合事象(20塩基エンコーダー配列)がゲル解析で容易に区別されるように設計されている。
PAGEゲルを単に解析することにより、AまたはBコーディングタグ移行の効率を測定することが可能であり、実験パラメーターの容易な最適化が可能である。AB標的配列に加えて、CおよびDが、AおよびBと相互作用しない異なるハイブリダイゼーション配列であることを除いて、同様のオリゴヌクレオチドCD標的配列が用いられる(例えば図24Bを参照されたい)。さらに、CおよびDは、それぞれ30塩基DNAコードおよび40塩基DNAコードを含む、異なる配列および長さのコーディングタグを含む。第2の標的配列CDの目的は、ABおよびCD標的分子間の交差相互作用を評価することである。特定のハイブリダイゼーションを考慮すると、AB標的に結合されたオリゴに接続されているAまたはBコーディングタグ間に分子間交差が生じない限り、CD標的の伸長記録タグが、AまたはBコーディングタグ情報を含むことはない。同様に、AB標的の伸長記録タグは、CまたはDコーディングタグ情報を含むはずがない。ABおよびCD標的が物理的近傍に接近している状況では(つまり<50nm)、掛け合い応答が起こる可能性が高い。したがって、表面の標的巨大分子を適切に離間させることが重要である。
このオリゴヌクレオチドモデル系は、結合性物質履歴の記録能力の十分な特徴付けを可能にする。図25は、プライマー伸長ではなくライゲーションによる情報移行を示す。まずゲルで最適化した後、種々の結合およびアッセイプロトコールを実施し、配列決定により評価する。一意の分子識別子(UMI)配列は、計数のために使用され、単一の巨大分子に由来するリードの識別を可能にし、元の試料中の総合的で全体的な巨大分子複雑性の尺度を提供する。例示的な履歴結合プロトコールとしては、A−B−C−B−A、A−B−A−A−B−A、A−B−C−D−A−Cなどが挙げられる:得られる最終産物は、それぞれ、UMI−Sp−A−Sp−B−Sp−B−Sp−A−Sp+UMI−Sp−C−Sp;UMI−Sp−A−Sp−B−Sp−A−Sp−A−Sp−B−Sp−A;UMI−A−Sp−B−Sp−A+UMI−Sp−C−Sp−D−Sp−C−Spと読み取られるはずである。この解析の結果は、さらなる最適化を可能にする。
(実施例9)
オリゴヌクレオチド−ペプチドモデル系−コーディングタグの識別情報をサイクル様式で記録タグへと移行させることによる結合性物質履歴の記録
オリゴヌクレオチドモデル系を検証した後、例示的な標的オリゴヌクレオチド配列の5’末端にペプチドエピトープタグをコンジュゲートすることにより、オリゴヌクレオチド系からペプチドモデル系を構築する(例えば図26Aおよび26Bを参照されたい)。例示的なペプチドエピトープタグとしては以下のものが挙げられる:FLAG(DYKDDDDK)(配列番号171)、V5(GKPIPNPLLGLDST)(配列番号172)、c−Myc(EQKLISEEDL)(配列番号173)、HA(YPYDVPDYA)(配列番号174)、V5(GKPIPNPLLGLDST)(配列番号175)、StrepTag II(NWSHPQFEK)(配列番号176)など。ペプチドエピトープタグをオリゴヌクレオチドにカップリングするための、任意選択のCys−Ser−Glyリンカーが含まれていてもよい。実施例7のABオリゴヌクレオチド鋳型を、A_オリゴヌクレオチド−cMycペプチド構築物に取り替え、実施例7のCDオリゴヌクレオチド鋳型を、C_オリゴヌクレオチド−HAペプチド構築物に取り替える(例えば図26を参照されたい)。また、A_オリゴヌクレオチド−cMycペプチド構築物は、CSGリンカーおよびN末端ホスホチロシンを含む。同様に、同種ペプチド結合性物質であるcMyc抗体およびHA抗体を、それぞれBオリゴヌクレオチドコーディングタグおよびDオリゴヌクレオチドコーディングタグでタグ化する。ホスホチロシン特異的抗体は、別の「E」コーディングタグでタグ化する。このように、ペプチドモデル系は、オリゴヌクレオチド系と対応しており、オリゴ結合および抗体結合の両方が、このモデル系で試験される。
抗c−myc抗体(2G8D5、マウスモノクローナル、GenScript)、抗HA抗体(5E11D8、マウスモノクローナル、GenScript)、strep−タグII抗体(5A9F9、マウスモノクローナル、GenScript)、または抗FLAG抗体(5AE85、マウスモノクローナル、GenScript)を使用した固定化DNAペプチド構築物の抗体染色を、0.1〜1μg/mlの1×PBST(PBS+0.1%Tween(登録商標)20)を使用して実施する。インキュベーションを、典型的には室温で30分間実施する。また、1×PBST中1%のPVPを使用した標準的プレブロッキングおよび染色後洗浄を実施する。抗体脱染色は、高濃度塩(1M NaCl)および低pH(グリシン、pH2.5)または高pH(トリエチルアミン、pH11.5)のいずれかで洗浄することにより効果的に達成される。
標的オリゴヌクレオチドは、アジドビーズに付着させるための内部アルキン標識を含み、5’末端は、Williamsら(2010年、Curr Protoc Nucleic Acid Chem. 第4章:4.41項)に記載されているように、ペプチドのC末端システインにSMCC媒介性付着させるためのアミノ基を含む。あるいは、標準的カルボジイミドカップリングを、オリゴヌクレオチドおよびペプチドのコンジュゲーション反応に使用する(Luら、2010年、Bioconjug. Chem.、21巻:187〜202頁)。この場合、過剰なオリゴを使用して、カルボジイミド反応を駆動し、ペプチド間カップリングを最小限に抑える。コンジュゲーション後、PAGEゲルから切除し、溶出することにより、最終産物を精製する。
(実施例10)
DNA/PNAコーディングタグ相補体を記録タグにライゲーションさせることによるコーディングタグ移行
コーディングタグを、ライゲーションにより直接的または間接的のいずれかで記録タグに移行させて、伸長記録タグを生成する。一実行例では、アニーリングされたコーディングタグの相補体を、記録タグにライゲーションさせる(例えば図25を参照されたい)。このコーディングタグ相補体は、核酸(DNAまたはRNA)であってもよく、ペプチド核酸(PNA)であってもよく、または成長中の記録タグにライゲーションすることが可能ないくつかの他のコードディング分子であってもよい。ライゲーションは、DNAおよびRNAの場合、標準的なATP依存性およびNADH依存性リガーゼを使用して酵素的であってもよく、またはライゲーションは、DNA/RNAおよび特にペプチド核酸PNAの両方の場合、化学媒介性であってもよい。
DNAの酵素的ライゲーションの場合、アニーリングされたコーディングタグは、記録タグの3’ヒドロキシルとライゲーションするために、5’リン酸塩を必要とする。例示的な酵素的ライゲーション条件は、以下の通りである(Gunderson、Huangら、1998年)。標準的T4 DNAライゲーション反応は、50mM Tris−HCl(pH7.8)、10mM MgCl2、10mM DTT、1mM ATP、50μg/ml BSA、100mM NaCl、0.1%TX−100、および2.0U/μl T4 DNAリガーゼ(New England Biolabs)を含む。E.coli DNAリガーゼ反応は、40mM Tris−HCl(pH8.0)、10mM MgCl2、5mM DTT、0.5mM NADH、50μg/ml BSA、0.1%TX−100、および0.025U/μl E.coli DNAリガーゼ(Amersham)を含む。Taq DNAライゲーション反応は、20mM Tris−HCl(pH7.6)、25mM酢酸カリウム、10mM酢酸マグネシウム、10mM DTT、1mM NADH、50μg/ml BSA、0.1%Triton X−100、10%PEG、100mM NaCl、および1.0U/μl Taq DNAリガーゼ(New England Biolabs)を含む。T4およびE.coli DNAリガーゼ反応は、室温で1時間にわたって実施し、Taq DNAリガーゼ反応は、40℃で1時間にわたって実施する。
DNA/PNAコーディングタグ移行の場合、鋳型化DNA/PNAの化学的ライゲーションのいくつかの方法を用いることができる。そうした方法としては、標準的な化学的ライゲーションおよびクリック化学手法が挙げられる。鋳型DNAライゲーションの例示的な化学的ライゲーション条件は、以下の通りである(Gunderson、Huangら、1998年):鋳型3’リン酸塩リポータータグと5’リン酸塩コーディングタグとのライゲーションは、50mM 2−[N−モルホリノ]エタンスルホン酸(MES)(KOHでpH6.0)、10mM MgCl2、0.001%SDS、新しく調製した200mM EDC、50mMイミダゾール(HClでpH6.0)または50mM HOBt(HClでpH6.0)、および3.0〜4.0M TMACl(Sigma)を含む反応中で、室温にて1時間以内に生じる。
PNAの鋳型依存性ライゲーションの例示的な条件としては、NH2−PNA−CHOポリマー(例えば、コーディングタグ相補体および伸長記録タグ)のライゲーションが挙げられ、Brudnoら(Brudno、Birnbaumら、2010年)により記載されている。PNAは、5’アミン等価物および3’アルデヒド等価物を有しており、化学的ライゲーションにより2つの部分がカップリングされてシッフ塩基が創出され、シッフ塩基は、その後シアノ水素化ホウ素ナトリウムで還元される。このカップリングの典型的な反応条件は、以下の通りである:100mM TAPS(pH8.5)、80mM NaCl、および80mMシアノ水素化ホウ素ナトリウム、室温で60分間。5’アミノ末端1,2−アミノチオール修飾および3’C末端チオエステル修飾を含む機能化PNAを使用する未変性化学的ライゲーションの例示的な条件は、Roloffら(2014年、Methods Mol. Biol.、1050巻:131〜141頁)により記載されている。また、他のN−およびC−末端PNA部分を、ライゲーションに使用することができる。別の例は、クリック化学を使用したPNAの化学的ライゲーションを含む。Pengら(2010年、European J. Org. Chem.、2010年:4194〜4197頁)の手法を使用して、PNAを、5’アジドおよび3’アルキンで誘導体化し、クリック化学を使用してライゲーションすることができる。「クリック」化学ライゲーションの例示的な反応条件は、10mMリン酸カリウム緩衝液、100mM KCl、5mM THPTA(tris−ヒドロキシプロピルトリゾリル(trizolyl)アミン)、0.5mM CuSO4、および2.5mM Na−アスコルビン酸塩を含む100μlの反応ミックス中での、1〜2mgビーズとの鋳型化PNA−PNAである。化学的ライゲーション反応は、室温で1時間インキュベートされる。PNAライゲーションの他の例示的な方法は、Sakuraiら(Sakurai、Snyderら、2005年)により記載されている。
(実施例11)
DNAへのPNA変換
PNA鋳型にアニーリングされたDNAオリゴヌクレオチドのクリック化学媒介性重合を使用して、PNAをDNAへと変換する。DNAオリゴは、DNAポリメラーゼにより複製することが可能なヌクレオチド間トリアゾール連結を創出するために、反応性5’アジドおよび3’アルキンを含む(El−Sagheerら、2011年、Proc. Natl. Acad. Sci. USA 108巻:11338〜11343頁)。PNAのあらゆる考え得るコーディングタグに相補的なDNAオリゴの完全なセット(10nM、1×ハイブリダイゼーション緩衝液中:10mM Na−ホウ酸塩(pH8.5)、0.2M NaCl)を、固相に結合されているPNA分子と共に30分間インキュベートする(23〜50℃)。アニーリングの後、固相に結合されているPNA−DNA構築物を、アスコルビン酸ナトリウム緩衝液(10mMアスコルビン酸ナトリウム、200mM NaCl)で1回洗浄する。「クリック化学」反応条件は、以下の通りである:ビーズ上のPNA−DNAを、新たなアスコルビン酸ナトリウム緩衝液中でインキュベートし、10mM THPTA+2mM CuSO4のミックスと1:1で組み合わせて、室温で1時間インキュベートする。その後、ビーズを、ハイブリダイゼーション緩衝液で1回、およびPCR緩衝液で2回洗浄する。化学的ライゲーションの後、得られたライゲーションDNA産物を、El−Sagheerら(2011年、Proc. Natl. Acad. Sci. USA 108巻:11338〜11343頁)により記載されているような条件下でPCRにより増幅する。
(実施例12)
核酸記録およびコーディングタグと適合性の穏やかなN末端エドマン分解
N末端エドマン分解とDNAコーディングとの適合性は、この手法が、ペプチド配列決定で機能することを可能にする。無水TFAが用いられるN末端エドマン分解の標準的条件では、DNAは破壊される。しかしながら、この効果は、より穏やかな切断条件を開発し、より高い酸耐性を有する修飾DNAを開発することにより緩和される。N末端エドマン分解のより穏やかな条件を、フェニルチオカルバモイル(PTC)−ペプチドの切断を最適化すること、および切断条件下でDNA/PNAコード付きライブラリーの安定性を測定することの組合せを使用して開発する。さらに、天然DNAは、低pHでの脱プリンを低減する7−デアザプリンなどの塩基修飾、および脱ピリミジン化を低減する5’メチル修飾シトシンを使用することにより、酸加水分解に対して安定化させることができる(Schneider and Chait, 1995, Nucleic Acids Res. 23:1570-1575)。チミンが酸断片化に対して最も安定した塩基であることを考慮すると、T豊富なコーディングタグも有用であり得る。穏やかなN末端エドマン分解の条件は、無水TFA切断の代わりに、Barrettet al.(その全体が参照により組み込まれる、1985, Tetrahedron Lett. 26:4375-4378)に記載されているように、アセトニトリル中のトリエチルアミンアセテートを60℃で使用する穏やかな10分間の塩基切断を使用することである。こうした穏やかな条件は、ほとんどのタイプのDNA記録タグおよびコーディングタグと適合性である。代替選択肢として、PNAは完全に酸安定性であるため、PNAをコーディングタグに使用する(Rayand Norden, 2000, FASEB J. 14:1041-1060)。上記の手法に加えて、エドマン標識および切断の両方を生き残るDNAバーコードをスクリーニングにより経験的に選択することができる。
NTAA結合物質の同一性をコードするためにDNAコーディングタグ/記録タグを使用することと、穏やかなN末端エドマン分解反応を実施することとの適合性を、以下のアッセイを使用して実証する。抗ホスホチロシンおよび抗cMyc抗体の両方を使用して、モデルペプチドを読み取る。単一のエドマン分解ステップを使用した、C−MycおよびN末端ホスホチロシン検出、コーディングタグ書き込み、およびN末端ホスホチロシンの除去。このステップの後、ペプチドを、抗ホスホチロシンおよび抗cMyc抗体で再び染色する。N末端分解に対する記録タグの安定性を、qPCRにより評価する。ホスホチロシンの効果的な除去は、配列決定、qPCR、またはゲル電気泳動により解析して、最終記録タグ配列にE−オリゴヌクレオチドコーディングタグ情報が存在しないことにより示される。
(実施例13)
コンパートメントタグ付きビーズの調製。
コンパートメントタグ付きビーズを調製するには、ホスホラミダイト合成またはスプリット・アンド・プールライゲーションのいずれかが使用されるスプリット・アンド・プール合成手法を使用して、ビーズに固定化されているオリゴヌクレオチドにバーコードを組み込む。コンパートメントタグは、コンパートメントタグがそれに接合される各ペプチドまたはタンパク質分子を一義的に標識するための一意の分子識別子(UMI)をさらに含む。例示的なコンパートメントタグ配列は、以下の通りである:5’−NH2−GCGCAATCAG−XXXXXXXXXXXX−NNNNN−TGCAAGGAT−3’(配列番号177)。XXXXXXXXXXXX(配列番号178)バーコード配列は、スプリット−プールオンビーズ合成により生成されるビーズ毎の核酸塩基配列の固定集団であり、この固定配列は、ビーズ毎に異なる。NNNNN(配列番号179)配列は、その後それに接合されるペプチド分子の一意の分子識別子(UMI)としての役目を果たすように、ビーズ内で無作為化される。バーコード配列は、Macoskoら(その全体が参照により組み込まれる、2015年、Cell、161巻:1202〜1214頁)により記載されているようなスプリット・アンド・プール手法を使用して、ビーズ上で合成することができる。UMI配列は、縮重塩基混合物(各カップリングステップに存在する4つのホスホラミダイト塩基すべての混合物)を使用して、オリゴヌクレオチドを合成することにより創出することができる。5’−NH2を、スクシンイミジル4−(N−マレイミドメチル)シクロヘキサン−1−カルボキシレート(SMCC)およびN末端からC末端への配列「CGGSSGSNHV」(配列番号180)を有するシステイン含有ブテラーゼIペプチド基質で活性化し、Williamsら(2010年、Curr Protoc Nucleic Acid Chem. 第4章:4.41項)により記載されているような修飾プロトコールを使用して、SMCC活性化コンパートメントタグ付きビーズにカップリングする。すなわち、200μlの磁気ビーズ(10mg/ml)を、1.5mlのEppendorfチューブに入れる。1mlのカップリング緩衝液(5mM EDTA、0.01%Tween(登録商標)20、pH7.4を有する100mM KH2PO4緩衝液、pH7.2)をチューブに添加し、短時間ボルテックスする。新たに調製した40μlのスルホ−SMCC(DMSO中50mg/ml、ThermoFisher)を、磁気ビーズに添加し、混合する。反応を、室温にて1時間、ロータリーミキサーでインキュベートする。インキュベーション後、磁石でビーズを上清から分離し、500μlのカップリング緩衝液で3回洗浄する。ビーズを、400μlのカップリング緩衝液に再懸濁する。1mLのCGGSSGSNHV(配列番号180)ペプチドを磁気ビーズに添加する(TCEP還元(5mM)および氷冷アセトン沈殿後、カップリング緩衝液中1mg/mL)。反応を、室温にて2時間、ロータリーミキサーでインキュベートする。反応を、カップリング緩衝液で1回洗浄する。400μlのクエンチング緩衝液(10mg/mLのメルカプトコハク酸、pH7.4を有する100mM KH2PO4緩衝液、pH7.2)を反応混合物に添加し、ロータリーミキサーで2時間インキュベートする。反応混合物を、カップリング緩衝液で3回洗浄する。得られたビーズを、保管緩衝液(0.02%NaN3、0.01%Tween(登録商標)20、pH7.4を含む10mM KH2PO4緩衝液、pH7.2)に再懸濁し、4℃で保管する。
(実施例14)
封入ビーズおよびタンパク質の生成
コンパートメントタグ付きビーズおよびタンパク質を、エンドプロテアーゼAspN(Endo AspN)などの亜鉛メタロ−エンドペプチダーゼ、任意選択の光ケージ化Znキレート剤(例えば、ZincCleav I)、および遺伝子操作された耐熱性ブテラーゼIホモログ(Bandara、Kennedyら、2009年、Bandara、Walshら、2011年、Cao、Nguyenら、2015年)と組み合わせる。実施例12のコンパートメントタグ付きビーズをタンパク質と混合し、T字路型マイクロ流体または流動フォーカスデバイス(例えば図21を参照されたい)で乳化する。二水流構成では、一方の流動中のタンパク質およびZn2+を、他方の流動からのメタロ−エンドペプチダーゼと組み合わせて、液滴形成時に直ちに消化を開始させることができる。一流動構成では、すべての試薬を予め混合し、一緒に乳化する。これには、任意選択の光ケージ化Znキレート剤(例えば、ZincCleav I)を使用して、液滴形成後に、UV光への曝露によりタンパク質消化を開始させることが必要である。濃度および流動条件は、1液滴当たりのビーズが平均で1つ未満になるように調整する。最適化された実験では、108個のフェムト液滴を、液滴の約10%がビーズを含有する含有率で製作することができる(Shimら、2013年、ACS Nano、7巻:5955〜5964頁)。一流動手法では、液滴を形成した後、エマルジョンをUV−365nmの光に曝露して光ケージ化Zn2+を放出させ、Endo AspNプロテアーゼを活性化することにより、プロテアーゼを活性化する。エマルジョンを、37℃で1時間インキュベートして、タンパク質をペプチドへと消化する。消化した後、エマルジョンを80℃で15分間加熱することにより、Endo AspNを不活化する。二流動調合では、2つの流動の組み合わせ中に、Zn2+を液滴内に導入する。この場合、Endo AspNは、キレート剤がUV光への曝露時に活性化される光活性化Zn2+ケージ分子を使用することにより、または2−アルキルマロン酸もしくはEDTA−MOなどの両親媒性Zn2+キレート作用剤を、油相に添加することにより不活化することができる。両親媒性EDTA分子の例としては、EDTA−MO、EDTA−BO、EDTA−BP、DPTA−MO、DPTA−BO、DPTA−BPなど(Ojha、Singhら 2010年、Moghaddam、de Campoら 2012年)が挙げられる。また、エマルジョン油に両親媒性の酸または塩基を添加することにより液滴のpHを変更することを含む、他のモダリティを使用して、液滴内部の反応を制御することができる。例えば、液滴pHは、水/油に可溶性である酢酸を使用して低下させることができる。フルオロ−エマルジョンへの酢酸の添加は、酢酸分子が両親媒性の性質を持つため、液滴コンパートメント内のpHの低下に結び付く(Mashaghiおよびvan Oijen、2015年、Sci Rep、5巻:11837頁)。同様に、塩基であるプロピルアミンを添加すると、液滴内部はアルカリ化される。同様の手法を、油/水に可溶性の酸化還元試薬、還元剤、キレート剤、および触媒などの他のタイプの両親媒性分子に使用することができる。
コンパートメント化されたタンパク質をペプチドへと消化した後、ブテラーゼIまたは化学的ライゲーション(例えば、アルデヒド−アミノなど)を使用して、ペプチドを、ビーズ上のコンパートメントタグにライゲーションする(オリゴヌクレオチドペプチドバーコードキメラ)(例えば図16および図22Aを参照されたい)。任意選択の手法では、オリゴ−チオデプシペプチド「化学的基質」を用いて、ブテラーゼIライゲーションを不可逆的にする(Nguyen、Caoら、2015年)。ライゲーションの後、エマルジョンを「クラック」し、コンパートメントタグ付きペプチド構築物が固定化されているビーズをバルクで収集するか、またはコンパートメント付きペプチドをビーズから切断し、バルクで収集する。コンパートメントタグ付きペプチドが固定化されているビーズが記録タグを含む場合、これらビーズは、本明細書に記載されている核酸コーディングに基づくペプチド解析法に直接使用することができる。対照的に、コンパートメントタグ付きペプチドをビーズ基材から切断した場合、コンパートメントタグ付きペプチドを、コンパートメントタグ付きペプチドのC末端へのコンジュゲーションにより記録タグに付随させ、その後、本明細書に記載のように、コーディングタグ付き結合性物質との結合サイクルおよび配列決定解析を行うために、固体支持体に固定化する。記録タグとコンパートメントタグ付きペプチドとの付随は、三機能性リンカー分子を使用して達成することができる。サイクルシーケンシング解析を行うために、付随する記録タグを有するコンパートメントタグ付きペプチドを固体支持体に固定化した後、コンパートメント情報を、プライマー伸長またはライゲーションを使用して、付随する記録タグへと移行させる(例えば図22Bを参照されたい)。コンパートメントタグ情報を記録タグに移行させた後、元のペプチド消化で使用されたものと同じ酵素を使用して、コンパートメントタグをペプチドから切断することができる(例えば図22Bを参照されたい)。これにより、ペプチドの元のN末端が回復されるため、本明細書に記載のようなN末端分解ペプチド配列決定法が可能になる。
(実施例15)
3プライマー融合エマルジョンPCRにより、アミノ酸特異的コーディングタグで共有結合的に修飾されたペプチドの記録タグを付随させることによるジタグ生成
コンパートメントタグおよび分子UMIで構成される記録タグを有するペプチドを、コーディングタグ部位特異的化学標識で化学的に修飾する。また、コーディングタグは、修飾ペプチド内の所与のタイプのアミノ酸の数を計数することが可能になるようにUMIを含む。TysonおよびArmor(TysonおよびArmour、2012年)の改変プロトコールを使用して、エマルジョンPCRを、1×PHUSION(商標)GC反応緩衝液(Thermo Fisher Scientific)、200μMの各dNTP(New England Biolabs)、1μMプライマーU1、1μMプライマーU2tr、25nMプライマーSp、14単位のPHUSION(商標)高フィデリティーDNAポリメラーゼ(Thermo Fisher Scientific)を含む100μlの総水性容積中で調製する。10μlの水相を、TurnerおよびHurles(2009年、Nat. Protoc.、4巻:1771〜1783頁)により以前に記載されているように、2mlクライオバイアル中の軽油(Sigma)に溶解した200μlの油相(4.5%vol/vol)Span80、0.4%vol/volのTween(登録商標)80、および0.05%Triton X−100に、合計5分間にわたって1000rpmで撹拌しながら、5〜10秒ごとに添加する。得られたエマルジョンの平均液滴サイズは、約5ミクロンだった。T字路および流動フォーカスの使用などのエマルジョンを生成するための他の方法も用いることができる(Brouzes、Medkovaら、2009年)。エマルジョン生成後、100μlの水/油混合物を0.5mlのPCRチューブに移し、第1ラウンドの増幅を、以下の条件で実施する:98℃で30秒間;98℃で10秒間、70℃で30秒間、および72℃で30秒間を40サイクル;その後72℃で5分間の伸長。第2ラウンドの増幅反応を、以下の条件で実施する:98℃で30秒間;98℃で10秒間、55℃で30秒間、および72℃で30秒間を40サイクル;その後4℃で維持。PCRの最終サイクル後できるだけ早く、200μlのヘキサン(Sigma)をPCRチューブに直接添加し、20秒間ボルテックスし、13,000gで3分間遠心分離することにより、エマルジョンを崩壊させる。
(実施例16)
伸長記録タグ、伸長コーディングタグ、またはジタグ構築物の配列決定
記録タグまたはコーディングタグのスペーサー(Sp)またはユニバーサルプライミング部位は、配列の本体に3つの塩基のみ(例えばA、C、およびT)および配列の5’末端に第4の塩基(例えば、G)を使用して設計することができる。合成による配列決定(SBS)の場合、これにより、標準的非発光性(dark)(未標識および非終端化)ヌクレオチド(dATP、dGTP、およびdTTP)および単一ffC色素標識可逆的ターミネーター(例えば、完全に機能的なシトシン三リン酸塩)のミックスを使用して、スペーサー配列全体にわたって非発光性塩基を迅速に組み込むことが可能になる。このようにすると、関連するエンコーダー配列、一意の分子識別子、コンパートメントタグ、伸長リポータータグの結合サイクル配列、伸長コーディングタグ、またはジタグのみがSBS配列決定され、無関連のスペーサーまたはユニバーサルプライミング配列は「スキップ」される。スペーサーの塩基および配列の5’末端の第4の塩基の同一性は、変更してもよく、上記の同一性は、例示のために提供されているに過ぎない。
(実施例17)
タンパク質ライセートの調製。
種々の試料タイプからタンパク質ライセートを製作するための幅広く様々なプロトコールが、当技術分野で公知である。プロトコールの相違点の多くは、細胞タイプ、およびライセート中の抽出されたタンパク質が未変性状態で解析されるかまたは変性状態で解析されるかに依存する。NGPAアッセイの場合、天然コンフォメーションのタンパク質または変性タンパク質のいずれも、固体基材に固定化することができる(例えば図32を参照されたい)。さらに、未変性タンパク質を固定化した後、基材の表面に固定化されたタンパク質を変性させてもよい。変性タンパク質を用いる利点は2つある。第1に、多数の抗体試薬は、線形エピトープ(例えば、ウエスタンブロットAb)に結合し、変性タンパク質は、線形エピトープへのより良好な接近を提供する。第2に、NGPAアッセイワークフローは、変性タンパク質を使用すると単純化される。それは、固定化されているタンパク質が既に変性されているため、アルカリ性(例えば、0.1NaOH)剥離条件を使用して、アニーリングされたコーディングタグを伸長記録タグから剥離することができるためである。これは、結合事象および情報移行後に、アニーリングされているコーディングタグを酵素的に除去することが必要とされる、天然コンフォメーションのタンパク質を含むアッセイを使用して、アニーリングされているコーディングタグを除去する場合と対照的である。
未変性タンパク質溶解緩衝液の例としては、50mm HEPES(pH7.4)、150mM NaCl、1%Triton X−100、1.5mM MgCl2、10%グリセロールで構成されるRPPA緩衝液;およびM−PER哺乳動物タンパク質抽出試薬(Thermo Fisher)などの市販の緩衝液が挙げられる。変性溶解緩衝液は、50mm HEPES(pH8.)、1%SDSを含む。尿素(1M〜3M)またはグアニジンHCl(1〜8M)の添加も、タンパク質試料の変性に使用することができる。溶解緩衝液の上記成分に加えて、一般的には、プロテアーゼおよびホスファターゼ阻害剤も含まれている。プロテアーゼ阻害剤および典型的な濃度の例としては、アプロチニン(aptrotinin)(2μg/ml)、ロイペプチン(5〜10μg/ml)、ベンズアミジン(15μg/ml)、ペプスタチンA(1μg/ml)、PMSF(1mM)、EDTA(5mM)、およびEGTA(1mM)が挙げられる。ホスファターゼ阻害剤の例としては、Naピロリン酸塩(10mM)、フッ化ナトリウム(5〜100mM)、およびオルトバナジン酸ナトリウム(1mM)が挙げられる。追加の添加剤としては、タンパク質試料からDNAを除去するためのDNAaseI、およびジスルフィド結合を還元するためのDTTなどの還元剤を挙げることができる。
組織培養細胞から調製される未変性タンパク質ライセートプロトコールの一例は、以下の通りである。接着細胞をトリプシン処理し(PBS中0.05%トリプシン−EDTA)、遠心分離(200gで5分間)により収集し、氷冷PBSで2回洗浄する。プロテアーゼ/ホスファターゼ阻害剤および添加剤(例えば、EDTA非含有完全阻害剤(Roche)およびPhosStop(Roche)で補完された氷冷M−PER哺乳動物抽出試薬(107細胞/100mm皿または150cm2フラスコ当たり約1mL)を添加する。得られた細胞懸濁液を、4℃にて20分間にわたって回転振とう器でインキュベートし、その後、4℃にて20分間、約12,000rpm(細胞タイプに依存する)で遠心分離して、タンパク質上清を単離する。BCAアッセイを使用してタンパク質を定量化し、PBSに1mg/mlで再懸濁する。タンパク質ライセートは、直ちに使用してもよく、または液体窒素で瞬間凍結して、−80℃で保管してもよい。
HughsらのSP3プロトコールに基づく、組織培養細胞から調製される変性タンパク質ライセートプロトコールの一例は、以下の通りである。接着細胞をトリプシン処理し(PBS中0.05%トリプシン−EDTA)、遠心分離(200gで5分間)により収集し、氷冷PBSで2回洗浄する。プロテアーゼ/ホスファターゼ阻害剤および添加剤(例えば、1×cOmpleteプロテアーゼ阻害剤カクテル(Roche))で補完された氷冷変性溶解緩衝液(107細胞/100mm皿または150cm2フラスコ当たり約1mL)を添加する。得られた細胞懸濁液を、95℃で5分間インキュベートし、5分間氷上に置く。ベンゾナーゼヌクレアーゼ(500U/ml)をライセートに添加し、37℃で30分間インキュベートしてDNAおよびRNAを除去する。
ライセート100μl当たり5μLの200mM DTTを添加することによりタンパク質を還元し、45℃で30分間インキュベートする。タンパク質システイン基のアルキル化(alklylation)は、ライセート100μl当たり10μlの400mMヨードアセトアミドを添加することにより達成し、24°で30分間、暗所でインキュベートする。ライセート100μl当たり10μlの200mM DTTを添加することにより、反応をクエンチする。必要に応じて、ライセート100μl当たり2μlの酸無水物および100μlの1M Na2CO3(pH8.5)を添加することにより、タンパク質をアシル化する。室温で30分間インキュベートする。「in vivo」でアセチル化されたリシンと、アシル化によるリシン基の「in situ」ブロッキングとの区別が可能になるように、無水酢酸ではなく、吉草酸無水物、安息香酸無水物、およびプロピオン酸無水物が推奨される(Sidoli,Yuan et al. 2015)。5mgのTris(2−アミノエチル)アミン、ポリマー(Sigma)を添加し、室温で30分間インキュベーションすることにより反応をクエンチする。ポリマー樹脂は、ライセートを2000gで1分間遠心分離して、0.45μm酢酸セルロースSpin−Xチューブ(Corning)を通過させることにより除去する。BCAアッセイを使用してタンパク質を定量化し、PBSに1mg/mlで再懸濁する。
追加の例では、タンパク質閉じ込め、アルキル化、およびペプチダーゼ消化に、MWCO濾過デバイスが使用される、Erdeらに記載のフィルター支援試料調製(FASP)プロトコールを使用して標識ペプチドを生成する(Erde、Looら 2014年、FeistおよびHummon 2015年)。
(実施例18)
分配タグ付きペプチドの生成。
DNAタグ(任意選択の試料バーコードおよび直交性付着部分を有する)を、標準的バイオコンジュゲーション法(Hermanson、2013年)を使用して、変性ポリペプチドのリシンのε−アミノ基を標識するために使用するか、またはその代わりにベンゾフェノンなどの光親和性標識(PAL)法を使用して、ポリペプチドに付着させる(Li、Liuら、2013年)。ポリペプチドのリシン基をまたは無作為にCH基(PALにより)をDNAタグで標識し、アシル無水物でのアシル化により未標識基をブロッキングした後、DNAタグ標識アシル化ポリペプチドを、ユニバーサルプライミング配列、コンパートメントバーコード、任意選択のUMI、およびポリペプチドに付着したDNAタグの部分に相補的なプライマー配列を含むDNAオリゴヌクレオチドが付着しているコンパートメントビーズにアニーリングさせる(例えば図31を参照されたい)。複数のDNAハイブリダイゼーションタグには協同性があるため、単一のポリペプチド分子は、主に単一のビーズと相互作用し、同じコンパートメントバーコードを、ポリペプチド分子のすべてのDNAタグに書き込むことが可能である。アニーリング後、ポリペプチド結合DNAタグは、アニーリングされたビーズ結合DNA配列のポリメラーゼ伸長反応にプライミングする。このように、コンパートメントバーコードおよび他の機能的エレメントは、結合されているポリペプチドに付着したDNAタグに書き込まれる。このステップの完了時には、複数の記録タグがポリペプチドに付着しており、記録タグは、共通スペーサー配列、バーコード配列(例えば、試料、画分、コンパートメント、空間など)、任意選択のUMI、および他の機能的エレメントを有する。この標識ポリペプチドは、トリプシン、GluC、プロテイナーゼKなどの標準的エンドプロテアーゼを使用して、ペプチド断片へと消化することができる。注:リシン標識ポリペプチドの消化にトリプシンを使用する場合、ポリペプチドは、Arg残基でのみ切断され、Lys残基では切断されない(Lys残基は標識されているため)。プロテアーゼ消化は、ビーズ上で直接実施してもよく、または標識ポリペプチドをバーコード付きビーズから除去した後で実施してもよい。
(実施例19)
モデル系のDNA記録タグ−ペプチドコンジュゲートの調製
5’NH2基および後にビーズにカップリングするための内部mTetrazine基を有する記録タグオリゴヌクレオチドを合成する(mTet−PEG−N3ヘテロ二機能性架橋剤により、アルキン−dTをmTetrazine−dTに変換する)。オリゴヌクレオチドの5’NH2を、Williams et al.(Williams and Chaput 2010)に記載されているように、LC−SMCC(ThermoFisher Scientific)などのNHS/マレイミドヘテロ二機能性架橋剤を使用して、ペプチドの反応性システインにカップリングする。特に、20nmolの5’NH2標識オリゴヌクレオチドをエタノール沈殿し、シリコーン処理チューブ中の180μlリン酸カップリング緩衝液(0.1Mリン酸カリウム緩衝液、pH7.2)に再懸濁する。5mgのLC−SMCCを、1mLのDMF(5mg/ml)に再懸濁する(アリコートにして−20で保管)。20μlのLC−SMCC(5mg/ml)のアリコートを、180μlの再懸濁したオリゴヌクレオチドに添加し、混合し、室温で1時間インキュベートする。混合物を2回エタノール沈殿する。得られたマレイミド(malemide)誘導体化オリゴヌクレオチドを、200μlのリン酸カップリング緩衝液に再懸濁する。システイン残基を含むペプチド(>95%純度、脱塩)を、1mg/ml(約0.5mM)でDMSOに再懸濁する。およそ50nmolのペプチド(100μl)を、反応ミックスに添加し、室温で一晩インキュベートする。得られたDNA記録タグ−ペプチドコンジュゲートを、Williamset al.(Williams and Chaput 2010)に記載されているように、未変性PAGEを使用して精製する。コンジュゲートを、100μM濃度でシリコーン処理チューブ中のリン酸カップリング緩衝液に再懸濁する。
(実施例20)
DNA−ペプチド固定化用の基材の開発。
一部の実験において、M−270アミン磁気Dynabeadsを、それぞれアルキンまたはメチルテトラジン標識オリゴ−ペプチドコンジュゲートにカップリングすることが可能なアジド誘導体化ビーズまたはTCO誘導体化ビーズのいずれかに変換することにより、クリック化学固定化に好適な磁気ビーズを創出する(例えば、図29D〜29E;図30D〜30Eを参照されたい)。すなわち、10mgのM−270ビーズを、500μlのホウ酸緩衝液(100mMホウ酸ナトリウム、pH8.5)で洗浄および再懸濁する。TCO−PEG(12−120)−NHS(Nanocs)およびメチル−PEG(12−120)−NHSの混合物を、1mMでDMSOに再懸濁し、M−270アミンビーズと共に室温で一晩インキュベートする。メチルのTCO PEGに対する比をタイトレーションして、TCO部分が<100個/um2で存在するように、ビーズの最終TCO表面密度を調整する(例えば、図31E、図34を参照されたい)。未反応アミン基を、DMF中の0.1M無水酢酸および0.1M DIEAの混合物を用いて(10mgビーズ毎に500μl)、室温で2時間キャッピングする。キャッピングし、DMFで3回洗浄した後、ビーズを、10mg/mlでリン酸カップリング緩衝液に再懸濁する。
1つの実験では、5’アミノ基修飾および内部アルキン基修飾を含んでいた合計で10nmolの記録タグを、0.1M Hepes、pH7.5、5mMメチルテトラジン−PEG4−アジド(BroadPharm)、2.5mM CuSO4、5mM Tris(3−ヒドロキシプロピルトリアゾリルメチル)アミン(Glen Research)、8mMアスコルビン酸ナトリウムで室温にてインキュベートした。16時間インキュベーションした後、記録タグを、LiClO4および83%アセトンで沈殿させ、その後50μlの150mM NaCl/NaPhos、pH7.4、1mM EDTAに溶解した。nanodrop分光光度計(Thermo Fisher)でA260を測定することにより記録タグ濃度を推定し、100μMに調整した。
TCO(trans−シクロオクテン)ビーズを、Dynabeads M−270アミン(Thermo Fisher)から調製した。合計で0.45mgのDynabeads M−270アミンを、150μlの150mM NaCl/NaPhos pH7.4で2回洗浄し、150μlの150mM NaCl/NaPhos pH7.4に再懸濁した。一方で、TCO−PEG12−NHSエステル(BroadPharm)/DMFを、mPEG−SCM、MW550(Creative PEGWorks)/DMFに対して1:102、1:103、および1:104の比でタイトレーションすることにより、TCO−PEG12−NHS/mPEG−SCM混合物のDMF溶液を調製した。合計で10μlの個々のTCO−PEG12−NHS/mPEG−SCM混合物を、150ulの予洗浄ビーズ懸濁物に添加し、室温で30分間インキュベートして、ビーズを異なる分布のTCOでコーティングした。TCOコーティングビーズを、150μLの150mM NaCl/NaPhos pH7.4で2回洗浄し、150ulの150mM NaCl/NaPhos pH7.4に再懸濁した。6.7μM NHSアセテート(TCI)で15分間室温にてインキュベーションすることにより、ビーズの残留アミン基をブロッキングした。得られたビーズを、150uLの150mM NaCl/NaPhos pH7.4で2回洗浄した。
合計で0.45mgの個々のTCO修飾ビーズを、10μlの100uMメチルテトラジン修飾記録タグ溶液に再懸濁し、30分間室温でインキュベートし、150μlの150mM NaCl/NaPhos pH7.4で2回洗浄した。記録タグ固定化ビーズを、75μlの150mM NaCl/NaPhos、pH7.4、1mM EDTAに再懸濁した。
システイン含有ペプチドを、ビーズ上の記録タグの5’アミン基にSM(PEG)8(Thermo Fisher)を介して付着させた。合計で5μlの100mM SM(PEG)/DMF溶液を、150μlのビーズ懸濁物に添加し、室温で30分間インキュベートした。得られたビーズを、150μlの150mM NaCl/NaPhos pH7.4で2回洗浄し、20μlの150mM NaCl/NaPhos pH7.4、1mM EDTAに再懸濁した。合計で6μlの8mMペプチド/DMF溶液を、20μLのビーズ懸濁物に添加し、室温で2時間、その後4℃で16時間インキュベートした。ビーズを、150μlの150mM NaCl/NaPhos pH7.4で2回洗浄し、150μlの10μg/ml L−システイン(Sigma−Aldrich)溶液に再懸濁し、室温で2時間インキュベートして、残留マレイミド基を除去した。ビーズを、150μlの150mM NaCl/NaPhos pH7.4で2回洗浄し、75μlの150mM NaCl/NaPhos pH7.4、1mM EDTAに再懸濁した。
(実施例21)
記録タグ標識ペプチドの基材への固定化。
解析のため、記録タグ標識ペプチドを、記録タグのmTet基および活性化ビーズまたは基材の表面のTCO基を使用してIEDDAクリック化学反応により、基材に固定化する。この反応は、反応物の入力濃度が低い場合でさえ、迅速および効率的である。さらに、メチルテトラジンを使用することにより、より大きな安定性が結合に付与される(Selvaraj and Fox 2013, Knall, Hollauf et al. 2014, Wu and Devaraj2016)。約50μg〜約200μgのM−270 TCOビーズを、100μlのリン酸カップリング緩衝液に再懸濁する。記録タグにmTet部分を含む5pmolのDNA記録タグ標識ペプチドを、終濃度が約50nMになるようにビーズに添加する。反応を、室温にて1時間インキュベートする。固定化した後、基材の未反応TCO基を、リン酸カップリング緩衝液中の1mMメチルテトラジン酸で室温にて1時間クエンチする。
ペプチドビーズのバルク調製。5’アミノ基修飾および内部アルキン基修飾を含んでいた合計で10nmolの記録タグを、0.1M Hepes、pH7.5、5mMメチルテトラジン−PEG4−アジド(BroadPharm)、2.5mM CuSO4、5mM Tris(3−ヒドロキシプロピルトリアゾリルメチル)アミン(Glen Research)、8mMアスコルビン酸ナトリウムで室温にてインキュベートした。16時間インキュベーションした後、記録タグを、LiClO4および83%アセトンで沈殿させ、その後50μlの150mM NaCl/NaPhos、pH7.4、1mM EDTAに溶解した。nanodrop分光光度計(Thermo Fisher)でA260を測定することにより記録タグ濃度を推定し、100μMに調整した。TCO(trans−シクロオクテン)ビーズを、Dynabeads M−270アミン(Thermo Fisher)から調製した。合計で0.45mgのDynabeads M−270アミンを、150μlの150mM NaCl/NaPhos pH7.4で2回洗浄し、150μlの150mM NaCl/NaPhos pH7.4に再懸濁した。一方で、TCO−PEG12−NHSエステル(BroadPharm)/DMFを、mPEG−SCM、MW550(Creative PEGWorks)/DMFに対して1:102、1:103、および1:104の比でタイトレーションすることにより、TCO−PEG12−NHS/mPEG−SCM混合物のDMF溶液を調製した。合計で10μlの個々のTCO−PEG12−NHS/mPEG−SCM混合物を、150μlの予洗浄ビーズ懸濁物に添加し、室温で30分間インキュベートして、ビーズを異なる分布のTCOでコーティングした。TCOコーティングビーズを、150μLの150mM NaCl/NaPhos pH7.4で2回洗浄し、150μlの150mM NaCl/NaPhos pH7.4に再懸濁した。6.7μM NHSアセテート(TCI)で15分間室温にてインキュベーションすることにより、ビーズの残留アミン基をブロッキングした。得られたビーズを、150μLの150mM NaCl/NaPhos pH7.4で2回洗浄した。合計で0.45mgの個々のTCO修飾ビーズを、10μlの100μMメチルテトラジン修飾記録タグ溶液に再懸濁し、30分間室温でインキュベートし、150μlの150mM NaCl/NaPhos pH7.4で2回洗浄した。記録タグ固定化ビーズを、75μlの150mM NaCl/NaPhos、pH7.4、1mM EDTAに再懸濁した。システイン含有ペプチドを、SM(PEG)8(Thermo Fisher)を介してビーズの記録タグの5’アミン基に付着させた。合計で5μlの100mM SM(PEG)/DMF溶液を、150μlのビーズ懸濁物に添加し、室温で30分間インキュベートした。得られたビーズを、150μlの150mM NaCl/NaPhos pH7.4で2回洗浄し、20μlの150mM NaCl/NaPhos pH7.4、1mM EDTAに再懸濁した。合計で6μlの8mMペプチド/DMF溶液を、20μLのビーズ懸濁物に添加し、室温で2時間、その後4℃で16時間インキュベートした。ビーズを、150μlの150mM NaCl/NaPhos pH7.4で2回洗浄し、150μlの10μg/ml L−システイン(Sigma−Aldrich)溶液に再懸濁し、室温で2時間インキュベートして、残留マレイミド基を除去した。ビーズを、150μlの150mM NaCl/NaPhos pH7.4で2回洗浄し、75μlの150mM NaCl/NaPhos pH7.4、1mM EDTAに再懸濁した。
(実施例22)
N末端アミノ酸(NTAA)修飾
化学的NTAAアセチル化:
ペプチドのNTAAを、有機または水性溶液(スルホ−NHS−アセテート)中で、無水酢酸またはNHS−アセテートのいずれかを使用してアセチル化する。無水酢酸誘導体化の場合、DMF中10mMの無水酢酸を、ペプチドと共に室温で30分間インキュベートする(Halpin、Leeら、2004年)。あるいは、100mMの2−(N−モルホリノ)エタンスルホネート(MES)緩衝液(pH6.0)中50mMの無水酢酸および1MのNaClを使用して、室温で30分間、ペプチドを水溶液中でアセチル化する(Tse、Snyderら、2008年)。NHS−アセテート誘導体化の場合、スルホ−NHS−アセテートのストック溶液(DMSO中100mM)を調製し、100mMリン酸ナトリウム緩衝液(pH8.0)または100mMホウ酸緩衝液(pH9.4)に、終濃度が5〜10mMになるように添加し、室温で10〜30分間インキュベートする(Goodnow、2014年)。
酵素的NTAAアセチル化:
以下の条件を使用して、N−アセチルトランスフェラーゼ(Sulfolobus solfataricusに由来するSsArd1)に曝露することにより、ペプチドのNTAAを酵素的にアセチル化する。ペプチドを、2μMのSsArd1と共に、NAT緩衝液(20mM Tris−HCl、pH8.0、100mM NaCl、1mM EDTA、1mMアセチル−CoA)中で、10分間60℃にてインキュベートする(ChangおよびHsu、2015年)。
化学的NTAAアミジン化(グアニジニル化):
ペプチドを、10mM N,N−ビス(tert−ブトキシカルボニル)チオ尿素、20mMトリメチルアミン、および12mM向山試薬(2−クロロ−1−メチルピリジニウムヨージド)のDMF溶液で、30分間室温にてインキュベートする。あるいは、ペプチドを、10mM 1H−ピラゾール−1−カルボキサミジン塩酸塩、10mM DIEAのDMF溶液で、30分間室温にてインキュベートする。標準的脱ブロッキング法を使用して、保護基を除去する。あるいは、ペプチドを、PBS緩衝液(pH8.0)または100mMホウ酸緩衝液(pH8.0)中10mM S−メチルイソチオ尿素で、30分間10℃にてインキュベートする(Tse、Snyderら、2008年)。
PITC標識:
ペプチドを、イオン性液体[Bmim][BF4]中5%(vol/vol)のPITCで、5分間室温にてインキュベートする。伸長DNA記録タグに存在するヌクレオチド塩基の環外アミンの異所標識を最小限に抑えつつ、NTAAが定量的にPITCで標識されるように、反応時間を最適化する。
DNFB標識:
2,4−ジニトロフルオロベンゼン(DNFB)を、メタノール中5mg/mlのストックとして調製する。溶液は、光から保護し、毎日新しく調製する。10mMホウ酸緩衝液(pH8.0)中0.5〜5.0ug/mlのDNFBで、5〜30分間37℃にてインキュベーションすることにより、ペプチドを標識する。
SNFB標識:
4−スルホニル−2−ニトロ−フルオロベンゼン(SNFB)を、メタノール中5mg/mlのストックとして調製する。溶液は、光から保護し、毎日新しく調製すべきである。10mMホウ酸緩衝液(pH8.0)中0.5〜5.0μg/mlのDNFBで、5〜30分間37℃にてインキュベーションすることにより、ペプチドを標識する。
アセチル化NTAAペプチドの切断:
25mM Tris−HCl(pH7.5)中で10uMのアシルペプチドヒドロラーゼ(APH)酵素(Sulfolobus solfataricus由来、SSO2693)と共に、10分間90℃にてインキュベーションすることにより、アセチル化NTAAをペプチドから切断する(Gogliettino、Balestrieriら、2012年)。
アミジン化NTAAペプチドの切断:
アミジン化(グアニジニル化)NTAAを、約0.1N〜約0.5N NaOH中で10分間37℃にてインキュベーションすることにより、ペプチドから切断する(Hamada 2016)。
(実施例23)
モデル系によるコーディングタグ情報の記録タグへの分子内移行の実証
DNAモデル系を使用して、ビーズに固定化されている記録タグへのコーディングタグ情報の「分子内」移行を試験した(図36Aを参照されたい)。2つの異なるタイプの記録タグオリゴヌクレオチドを使用した。saRT_Abc_v2(配列番号141)は、「A」DNA捕捉配列(配列番号153)(「A’」結合性物質の模倣エピトープ)および対応する「A」バーコード(rtA_BC)を含んでいた。saRT_Bbc_V2(配列番号142)は、「B」DNA捕捉配列(配列番号154)(「B’」結合性物質の模倣エピトープ)および対応する「B」バーコード(rtB_BC)を含んでいた。これらバーコードは、基本的な65セットの15merバーコード(配列番号1〜65)およびそれらのリバース相補的配列(配列番号66〜130)の組合せだった。rtA_BCは、2つのバーコード、BC_1およびBC_2の同鎖上の組合せであり、rtB_BCは、1つのバーコード、BC_3のみである。同様に、コーディングタグのバーコード(エンコーダー配列)も、65個の15merバーコード(配列番号1〜65)の基本的なセットに由来するバーコードで構成されていた。CT_A’−bc_1PEG(配列番号144)およびCT_B’−bc(配列番号147)コーディングタグは、それぞれ相補的捕捉配列A’およびB’で構成され、それぞれ15merバーコードBC_5、およびBC_5&BC_6と割り当てた。記録タグおよびコーディングタグのこの設計設定により、容易なゲル解析が可能になる。所望の「分子内」プライマー伸長は、類似サイズのオリゴヌクレオチド産物を生成するが、望ましくない「分子間」伸長は、「分子内」産物よりも15塩基大きな1つのオリゴ産物および15塩基短い別のオリゴ産物を生成する(図36B)。
「分子内」対「分子間」情報移行に対する記録タグ密度の効果を評価した。正しい情報移行のためには、「分子間」情報移行(A’コーディングタグはA記録タグと結合するが、情報はB記録タグへと移行されること、およびその逆)ではなく、「分子内」情報移行(「A’」コーディングタグからA記録タグ;B’コーディングタグからB記録タグ)が観察されなければならない。ビーズ表面の記録タグ間隔の効果を試験するために、ビオチン化記録タグオリゴヌクレオチドsaRT_Abc_v2(配列番号141)およびsaRT_Bbc_v2(配列番号142)を1:1の比で混合し、その後、1:0、1:10、1:102、1:103、および1:104の比で、saDummy−T10オリゴヌクレオチド(配列番号143)に対してタイトレーションした。合計で20pmolの記録タグオリゴヌクレオチドを、50μlの固定化緩衝液(5mM Tris−Cl(pH7.5)、0.5mM EDTA、1M NaCl)中で5μlのM270ストレプトアビジンビーズ(Thermo)と共に、37℃にて15分間インキュベートした。ビーズを、100μlの固定化緩衝液で3回、室温にて洗浄した。ほとんどのその後の洗浄ステップでは、100μlの容積を使用した。ビーズを25μlの5×アニーリング緩衝液(50mM Tris−Cl(pH7.5)、10mM MgCl2)に再懸濁し、コーディングタグミックスを添加することにより、コーディングタグ(後のサイクルには、DupCT配列との二本鎖アニーリングが必要である)を、ビーズに固定化されている記録タグとアニーリングさせる。65℃で1分間加熱し、その後室温へと徐々に冷却する(0.2℃/秒)ことにより、コーディングタグを記録タグにアニーリングさせる。あるいは、コーディングタグを、37℃にてPBST緩衝液中でアニーリングさせてもよい。ビーズを、室温にてPBST(PBS+0.1%Tween(登録商標)−20)で洗浄し、37℃にて5分間PBSTで2回洗浄し、室温にてPBSTで1回洗浄し、1×アニーリング緩衝液で最終洗浄した。ビーズを、19.5μlの伸長緩衝液(50mM Tris−Cl(pH7.5)、2mM MgSO4、125μM dNTP、50mM NaCl、1mMジチオトレイトール、0.1%Tween(登録商標)−20、および0.1mg/ml BSA)に再懸濁し、37℃で15分間インキュベートした。クレノウexo−DNAポリメラーゼ(NEB、5U/μl)を、0.125U/μlの終濃度でビーズに添加し、37℃で5分間インキュベートした。プライマー伸長後、ビーズを、PBSTで2回、および50μlの0.1NaOHで1回室温にて5分間、およびPBSTで3回、およびPBSで1回洗浄した。下流PCRアダプター配列R1’を付加するために、EndCap2Tオリゴ(R1(配列番号152)で構成される)を、コーディングタグオリゴヌクレオチドで実施したのと同様に、ハイブリダイズさせ、ビーズ上で伸長させた。アダプター配列を付加した後、最終伸長記録タグオリゴヌクレオチドを、95%ホルムアミド/10mM EDTA中で5分間65℃にてインキュベーションすることにより、ストレプトアビジンビーズから溶出した。溶出産物のおよそ1/100を、20μlにて18サイクルでPCR増幅し、PCR産物の1μlを、10%変性PAGEゲルで解析した。得られたゲルは、コーディングタグ情報がポリメラーゼ伸長により記録タグに書き込まれるという原理の証明を示し(例えば、図36Cを参照)、ビーズ表面の記録タグ密度を希釈すると、「分子間」伸長事象よりも「分子内」伸長事象を主に生成することができることを示した。
このモデル系では、対応するエンコーダー配列およびユニバーサルリバースプライマー部位を含む記録タグRT_ABCおよびRT_BBCからのPCR産物のサイズは、100塩基対(例えば図36Cを参照されたい)であるが、saRT_ABC(配列番号141)/CT_B’BC(配列番号147)およびsaRT_BBC(配列番号142)/CT_A’BC(配列番号144)の誤対合による産物は、それぞれ115塩基対および85塩基対である。図36Dに示されているように、ビーズにsaRT_ABC(配列番号141)およびsaRT_BBC(配列番号142)が高密度で存在する場合、3つのバンドが観察された。高密度では、記録タグは、それ自体に結合する近位のコーディングタグ(分子内事象)または近隣の記録タグ(分子間事象)で伸長することが予想された。しかしながら、誤対合による産物のバンドは、ダミーオリゴヌクレオチドの記録タグを希釈することにより減少し、1:10000の比では消失した。この結果は、記録タグがビーズ表面に低密度で離間されていたため、分子間事象が減少したことを実証した。
/3SpC3/=3'C3(3個炭素)スペーサー
/5Biosg/=5'ビオチン
/iSP18/=18個原子ヘキサ-エチレングリコールスペーサー
(実施例24)
ナノポアシーケンサーでの伸長記録タグ、伸長コーディングタグ、またはジタグ構築物の配列決定
DNAバーコードは、現在の塩基コールエラー率が10%台またはそれよりも高いナノポアに基づくシーケンサーなどの、非常にエラーを起こしやすいNGSシーケンサーでの使用に耐えるように設計することができる。いくつかのエラー訂正コード系が文献に記載されている。こうしたエラー訂正コード系としては、Hammingコード、Reed−Solomonコード、Levenshteinコード、Leeコードなどが挙げられる。エラー耐性バーコードは、選択した設計パラメーターに応じて、挿入エラー、欠失エラー、および置換エラーを訂正することが可能なR Bioconductorパッケージ「DNAbarcodes」を使用した、HammingおよびLevenshteinコードに基づいていた(BuschmannおよびBystrykh、2013年)。65個の異なる15mer Hammingバーコードのセットが、図27Aに示されている(配列番号1〜65に示されており、それらのリバース相補的配列はそれぞれ配列番号66〜130に示されている)。これらのバーコードは、最小Hamming距離が10であり、4つの置換エラーおよび2つのインデルエラーまでを自己訂正する。これは、10%のエラー率でのナノポアシーケンサーの正確な読み出しに十分過ぎる程である。さらに、これらのバーコードは、予測ナノポア電流シグネチャを使用して、77個のオリジナルバーコードのセットから濾過されている(例えば図27Bを参照されたい)。これらのバーコードは、バーコード全体にわたって大きな電流レベル差を示し、そのセットの他のバーコードと極力相関しないように濾過した。このようにすると、これらバーコードを使用したアッセイからの実際の生ナノポア電流レベルプロットを、塩基コールアルゴリズムを使用せずに、予測バーコードシグネチャに対して直接的にマッピングすることができる(Laszlo、Derringtonら、2014年)。
ナノポアシーケンシングを使用した伸長記録タグ、伸長コーディングタグ、またはジタグ構築物の解析を模倣するために、4つのフォワードプライマー(DTF1(配列番号157)、DTF2(配列番号158)、DTF3(配列番号159)、DTF4(配列番号160))および4つのリバースプライマー(DTR9(配列番号161)、DTR10(配列番号162)、DTR11(配列番号163)、DTR12(配列番号164))を使用した15merバーコードの小さなサブセットで構成されるPCR産物を生成した(例えば図27Cを参照されたい)。この8個プライマーのセットを、隣接するフォワードプライマーF1(配列番号165)およびリバースプライマーR1(配列番号166)と共にPCR反応に含めた。DTFおよびDTRプライマーは、相補的15merスペーサー配列(Sp15)(配列番号167)を介してアニーリングした。4つのDTFフォワードプライマーおよび4つのDTRリバースプライマーの組合せは、16個の考え得るPCR産物をもたらす。
PCR後、アンプリコンを、平滑末端ライゲーション(例えば、図27Cを参照)により、以下のように鎖状化した:20μlのPCR産物を、20μlのQuick Ligase Mix(NEB)と直接混合し、室温で一晩インキュベートした。長さが約0.5〜2kbの得られたライゲーション産物を、Zymo精製カラムを使用して精製し、20μlの水に溶出した。この精製ライゲーション産物の約7μlを、MinIon Library Rapid Sequencing Prepキット(SQK−RAD002)に直接使用し、MinION Mk 1B(R9.4)デバイスで解析した。品質スコアが7.2(正確性が約80%)の734bpナノポアリードの一例が、図27Dに示されている。配列決定の正確性が不良であるにもかかわらず、MinIon配列リードに対するバーコードのlalignに基づくアラインメントにより示されているように、配列中の多数のバーコードは容易に読み取り可能である(図27Dは、伸長記録タグ構築物の配列である配列番号168を示す)。
(実施例25)
ゲルビーズへの単一細胞の封入
単一細胞を、標準的技法(TamminenおよびVirta 2015年、Spencer、Tamminenら 2016年)を使用して、液滴(約50μm)に封入する(例えば図38を参照されたい)。ポリアクリルアミド(アクリルアミド:ビスアクリルアミド(29:1)(30%w/vol))、ベンゾフェノンメタクリルアミド(BM)、およびAPSを、細胞と共に不連続相に含有させて、連続油相にTEMEDを添加する(液滴内に拡散する)と重合を起こすことが可能な液滴を創出する。ベンゾフェノンを、ポリアクリルアミドゲル液滴のマトリックスに架橋させる。これは、その後のタンパク質とポリアクリルアミドマトリックスとの光親和性架橋を可能にする(Hughes、Spelkeら 2014年、Kang、Yamauchiら 2016年)。得られた単一細胞ゲルビーズ内に固定化されたタンパク質を、様々な方法を使用して単一細胞バーコード化することができる。一実施形態では、DNAタグを、以前に記載されているようなアミン反応性作用剤または光活性ベンゾフェノンDNAタグを使用して化学的にまたは光化学的に、単一細胞ゲルビーズ内の固定化されているタンパク質に付着させる。単一細胞ゲルビーズは、以前に記載されているようなバーコード付きビーズとの同時封入により、バーコードを含む液滴に封入することができ、タンパク質に移行されたDNAバーコードタグまたはその代わりに単一細胞ゲルビーズ内のタンパク質を、Amini、Cusanovich、およびGundersonら(Amini、Pushkarevら 2014年、Cusanovich、Dazaら 2015年)(Gunderson、Steemersら 2016年)により記載されているような一連のプール・アンド・スプリットステップによりコンビナトリアル的にインデックス化することができる。最も単純な実行例では、単一細胞ゲルビーズ内のタンパク質を、まず「クリック化学」部分で標識し(例えば図40を参照されたい)、その後コンビナトリアルDNAバーコードを、プール・アンド・スプリット手法を使用して、タンパク質試料にクリックする。
(実施例26)
DNAに基づくモデル系を使用した一本鎖DNAライゲーションによる情報移行の実証
DNAモデル系を使用して、ビーズに固定化されている記録タグへのコーディングタグ情報の移行を試験した(例えば、図46Aを参照)。2つの異なるタイプの記録タグオリゴヌクレオチドを使用した:5’リン酸化および3’ビオチン化されており、一意の6塩基DNAバーコードBCa、ユニバーサルフォワードプライマー配列、および標的結合性「B」配列を含むsaRT_Bbca_ssLig(配列番号181)ssDNA構築物;5’リン酸化および3’ビオチン化されており、一意の6塩基DNAバーコードBCa、ユニバーサルフォワードプライマー配列、および標的結合性「A」配列を含むsaRT_Abca_ssLig(配列番号182)ssDNA構築物。コーディングタグオリゴヌクレオチドCT_B’bcb_ssLig(配列番号183)は、B’配列を含む。記録タグおよびコーディングタグおよび付随する結合性エレメントのこの設計により、容易なゲル解析が可能になる。所望の一本鎖DNAライゲーション産物を、CircLigase(商標)II(Lucigen)で生成し、コーディングタグのB’配列を、固体表面に固定されている記録タグのB配列とアニーリングさせることより、記録タグの5’リン酸基およびコーディングタグの3’ヒドロキシル基が近接近する。
BコーディングタグとB記録タグとの特異的な相互作用による情報移行を、ゲル解析により評価した。mPEG−ビオチン、MW550(Creative PEGWorks)を1:10の比でビオチン化記録タグオリゴヌクレオチドsaRT_Bbc_ssLigまたはsaRT_Abc_ssLigでタイトレーションすることにより、表面の記録タグの密度を調整した。合計で2pmolの記録タグオリゴヌクレオチドを、50μlの固定化緩衝液(5mM Tris−Cl、pH7.5、0.5mM EDTA、1M NaCl)中で5μlのM270ストレプトアビジンビーズ(Thermo)と共に、37℃で15分間インキュベートし、150μlの固定化緩衝液で1回洗浄し、150μlのPBST+40%ホルムアミドで1回洗浄した。モデルアッセイでは、合計で40pmolのCT_B’bcb_ssLigを、5μlの記録タグ固定化ビーズと共に50μlのPBST中で15分間37℃にてインキュベートした。ビーズを、室温にて150μlのPBST+40%ホルムアミドで2回洗浄した。ビーズを、10μlのCircLigase(商標)II反応ミックス(0.033M Tris−アセテート、pH7.5、0.066M酢酸カリウム、0.5mM DTT、2mM MnCl2、0.5Mベタイン、および4U/μL CircLigase(商標)II ssDNAリガーゼ)に再懸濁し、2時間45℃でインキュベートした。ライゲーション反応後、ビーズを、固定化緩衝液+40%ホルムアミドで1回、およびPBST+40%ホルムアミドで1回洗浄した。10μlの95%ホルムアミド/10mM EDTA中で5分間65℃にてインキュベーションすることより、最終伸長記録タグオリゴヌクレオチドをストレプトアビジンビーズから溶出し、2.5μlの溶出物を15%PAGE−尿素ゲルにローディングした。
このモデル系では、47塩基記録タグに由来するライゲーション産物のサイズは96塩基である(例えば、図46Bを参照)。saRT_Bbca_ssLigの存在下ではライゲーション産物バンドが観察されたが、saRT_Abcb_ssLigの存在下では産物バンドは観察されなかった。この結果は、特異的なB/B’seq結合事象が、記録タグへのコーディングタグの情報移行によりコードされたことを実証した。さらに、第1のサイクルライゲーション産物を、USER酵素で処理し、第2の情報移行に使用した。これらの事象は、ゲル解析により観察された(例えば、図46Cを参照)。
/5Phos/=5'リン酸化
/3Bio/=3'ビオチン化
/iSP18/=18個原子ヘキサ-エチレングリコールスペーサー
(実施例27)
DNAに基づくモデル系を使用した二本鎖DNAライゲーションによる情報移行の実証
DNAモデル系を使用して、ビーズに固定化されている記録タグへのコーディングタグ情報の移行を試験した(図47Aを参照)。記録タグオリゴヌクレオチドは2本の鎖で構成される。saRT_Abc_dsLig(配列番号184)は、標的結合性物質A配列、ユニバーサルフォワードプライマー配列、2つの一意の15塩基DNAバーコードBC1およびBC2、ならびに4塩基突出を含む5’ビオチン化DNAであり、Blk_RT_Abc_dsLig(配列番号185)は、2つの一意の15塩基DNAバーコードBC2’およびBC1’、ユニバーサルフォワードプライマー配列を含む5’リン酸化された3’C3スペーサー修飾DNAである。二本鎖コーディングタグオリゴヌクレオチドは、2本の鎖で構成される。dU、一意のBC5、および突出を含む一方の鎖CT_A’bc5_dsLig(配列番号186)は、ポリエチレングリコールリンカーを介して標的指向性物質A’配列に連結する。コーディングタグの他方の鎖は、5’ホスフェート、dU、および一意のバーコードBC5’を含むDup_CT_A’bc5(配列番号187)である。記録タグおよびコーディングタグのこの設計設定により、容易なゲル解析が可能になる。コーディングタグの標的指向性物質A’が、固体表面に固定化されている記録タグの標的結合性物質Aとハイブリダイゼーションすることにより両タグの5’リン酸基および3’ヒドロキシル基が互いに接近すると、所望の二本鎖DNAライゲーション産物がT4DNAリガーゼ(NEB)によりライゲーションされる。
標的結合性物質Aと標的指向性物質A’との間の特異的相互作用による情報移行を評価した。ビーズ表面の記録タグの間隔をあけるために、ビオチン化記録タグオリゴヌクレオチド、Blk_RT_Abc_dsLigにハイブリダイズされた合計で2pmolのsaRT_Abc_dsLigを、mPEG−SCM、MW550(Creative PEGWorks)に対して1:10の比でタイトレーションし、5μlのM270ストレプトアビジンビーズ(Thermo)と共に、50μlの固定化緩衝液(5mM Tris−Cl、pH7.5、0.5mM EDTA、1M NaCl)中で15分間37℃にてインキュベートした。記録タグ固定化ビーズを、150μlの固定化緩衝液で1回洗浄し、150μlの固定化緩衝液+40%ホルムアミドで1回洗浄した。第1のサイクルアッセイでは、合計で40pmolの二本鎖コーディングタグCT_A’bc5_dsLig:Dup_CT_A’bc5を、5μlの記録タグ固定化ビーズと共に、50μlのPBST中で15分間37℃にてインキュベートした。ビーズを、室温にて150μlのPBST+40%ホルムアミドで2回洗浄した。ビーズを、10μlのT4DNAリガーゼ反応ミックス(50mM Tris−HCl、pH7.5、10mM MgCl2、1mM DTT、1mM ATP、7.5%PAG8000、0.1μg/μl BSA、および20U/μl T4DNAリガーゼ)に再懸濁し、r.t.で60分間インキュベートした。ライゲーション反応後、ビーズを、固定化緩衝液+40%ホルムアミドで1回、およびPBST+40%ホルムアミドで1回洗浄した。ビーズをUSER酵素(NEB)で処理して、二本鎖コーディングタグを除去し、CT_A’bc13−R_dsLig:Dup_CT_A’bc13−R_dsLig(それぞれ、配列番号188および配列番号189)を用いた第2のサイクルライゲーションアッセイに使用した。各処理の後、10μlの95%ホルムアミド/10mM EDTA中で5分間65℃にてインキュベーションすることより、二本鎖記録タグをストレプトアビジンビーズから溶出し、2.5μlの溶出物を15%PAGE−尿素ゲルにローディングした。
このモデル系では、76塩基および54塩基の記録タグと二本鎖コーディングタグとのライゲーション産物のサイズは、それぞれ116塩基および111塩基である(例えば、図47Bを参照)。第1のサイクルライゲーション産物をUSER酵素(NEB)消化で完全に消失させ、第2のサイクルアッセイで使用した。第2のサイクルライゲーション産物バンドが、150塩基付近で観察された。これらの結果は、特異的Aseq/A’seq結合事象が、第1のサイクル二本鎖ライゲーションアッセイおよび第2のサイクル二本鎖ライゲーションアッセイでコードされたことを実証した。
/3SpC3/=3'C3(3個炭素)スペーサー
/5Phos/=5'リン酸化
/iSP18/=18個原子ヘキサ-エチレングリコールスペーサー
(実施例28)
ペプチドおよびDNAに基づくモデル系を使用した連続情報移行サイクルの実証
ペプチドモデル系を使用して、ビーズに固定化されている記録タグ複合体へのコーディングタグ情報の第1のサイクル移行を試験した(例えば、図48Aを参照)。PAペプチド配列(配列番号195)を、ビーズに固定化されている記録タグオリゴヌクレオチドamRT_Abc(配列番号190)に付着させた。amRT_Abc配列は、「A」DNA捕捉配列(「A’」結合性物質の模倣エピトープ)および対応する「A」バーコード(rtA−BC)を含む。rtA_BC配列は、2つのバーコードBC_1およびBC_2(配列番号1〜65)の同鎖上の組合せである。結合性物質については、抗PA抗体を、15merのバーコードBC5(配列番号66〜130)を含むコーディングタグオリゴヌクレオチドamCT_bc5(配列番号191)に付着させた。さらに、DNAモデル系を使用して、記録タグへのコーディングタグ情報の第2のサイクル移行を試験した(例えば、図48Bを参照)。CT_A’_bc13は相補的捕捉配列A’を含み、15merのバーコードBC5(配列番号:66〜130)を割り当てた。この設計は、特異的プライマーセットを用いたPCR増幅後の容易なゲル解析を可能にする。
内部アルキン修飾記録タグオリゴヌクレオチドamRT_Abc(配列番号190)を、メチルテトラジン−PEG4−アジド(BroadPharm)で修飾した。ビーズ表面の記録タグの密度を制御するため、TCO−PEG12−NHSエステル(BroadPharm)をmPEG−SCM、MW550(Creative PEGWorks)に対して1:102、1:103、および1:104の比でタイトレーションすることにより誘導体化(derivitized)されたM−270アミンDynabeads(Thermo Fisher)から、種々の密度の機能性カップリング部位(trans−シクロオクテン、TCO)を有するビーズを調製した。メチルテトラジン修飾amRT_Abc記録タグを、trans−シクロオクテン(TCO)−誘導体化ビーズに付着させた。Cys含有ペプチドを、SM(PEG)8(Thermo Fisher)を介してビーズ上のamRT_Abcの5’アミン基に付着させた。抗PA抗体(Wako Chemicals)とamCT_bc5コーディングタグとのコンジュゲーションは、タンパク質−オリゴヌクレオチドコンジュゲーションキット(Solulink)を使用して達成した。手短に言えば、amCT_bc5の5’アミン基をS−4FBで修飾し、その後0.5mLのZebaカラムで脱塩した。抗PA抗体をS−HyNicで修飾し、その後0.5mLのZebaカラムで脱塩した。最後に、4FB修飾amCT_bc5およびHyNic修飾抗PA抗体を混合して、抗体−コーディングタグコンジュゲートを調製し、その後Bio−Gel P100(Bio−Rad)を使用してサイズ排除を行った。
第1のサイクル結合アッセイでは、5μlのペプチド−記録タグ(RT)固定化ビーズを、SuperBlock T20(TBS)ブロッキング緩衝液(Thermo Fisher)で15分間r.t.にてインキュベートして、ビーズをブロッキングした。合計で2pmolの抗体−コーディングタグコンジュゲートを、5μlのペプチド−記録タグ固定化ビーズと共に、50μlのPBST中で30分間37℃にてインキュベートした。ビーズを、室温にて1000μlのPBST+30%ホルムアミドで2回洗浄した。ビーズを、50μlの伸長反応マスターミックス(50mM Tris−Cl(pH7.5)、2mM MgSO4、125μM dNTP、50mM NaCl、1mMジチオトレイトール、0.1% Tween(登録商標)−20、0.1mg/ml BSA、および0.05U/μLクレノウexo−DNAポリメラーゼ)に再懸濁し、5分間37℃でインキュベートした。プライマー伸長後、ビーズを、固定化緩衝液(5mM Tris−Cl(pH7.5)、0.5mM EDTA、1M NaCl、30%ホルムアミド)で1回、50μlの0.1N NaOHで5分間室温にて1回、およびPBST+30%ホルムアミドで1回、およびPBSで1回洗浄した。第2の結合サイクルアッセイでは、CT_A’_bc13を使用して、記録タグ内のその同種A配列に結合させ、第1のサイクル伸長記録タグの伸長が、第2のサイクルコーディングタグ配列上で伸長することを可能にした。伸長させた後、最終伸長記録タグオリゴヌクレオチドを、特異的プライマーを有する20μlのPCR混合物中でPCR増幅し、PCR産物の1μlを10%PAGEゲルで解析した。得られたゲルは、コーディングタグ情報がポリメラーゼ伸長により記録タグに書き込まれるという原理の証明を示す(図48C〜E)。
図48Aに示されているモデル系では、プライマーセットP1_F2およびSp/BC2を使用した、記録タグamRT_Abcに由来するPCR産物のサイズは、56塩基対である。図48Cに示されているように、amRT_Abc密度依存性バンド強度が観察された。抗PA抗体−amCT_bc5コンジュゲートによる第1のサイクル結合アッセイでは、同種PAタグ固定化ビーズをアッセイに使用した場合、80塩基対PCR産物の強いバンドが観察されたが、非同種アミロイドベータ(Aβ16〜27)またはナノタグ固定化ビーズを使用した場合、PCR産物収量は最小限だったことが観察された(例えば、図48Dを参照)。CT_A’_bc13コーディングタグに付着されたA’DNAタグを用いた第2の結合アッセイでは(例えば、図48Bを参照)、ペプチド記録タグコンジュゲートの3つ変種はすべて、アニーリングされたCT_A’_bc13配列上で伸長する。図48Eに示されているように、ペプチド固定化ビーズすべてで、元の記録タグ(BC1+BC2+BC13)の第2のサイクル伸長にのみに対応する、PCR産物の比較的強いバンドが117塩基対で観察された。PA−タグ固定化ビーズをアッセイに使用した場合にのみ、第1の伸長記録タグの第2の伸長(BC1+BC2+BC5+BC13)に対応するバンドが、93塩基対で観察された。こうした結果は、特異的ペプチド/抗体およびAseq/A’seq結合事象が、それぞれ第1のサイクルアッセイおよび第2のサイクルアッセイでコードされたことを実証した。
/3SpC3/=3'C3(3個炭素)スペーサー
/i5OctdU/=5'-オクタジイニルdU
/iSP18/=18個原子ヘキサ-エチレングリコールスペーサー
(実施例29)
mRNAディスプレイを使用した、DNA記録タグによるタンパク質またはペプチドの標識
PCRにより、各DNAコード付きタンパク質の3’末端に個々のバーコードを設置し、バーコード付きDNAをプールする。増幅したDNAプールを、AmpliScribe T7 Flash(Lucigen)を使用して転写する。転写反応物を、RNeasyミニキット(Qiagen)を使用してクリーンアップし、NanoDrop 3000(Fisher Scientific)で定量化する。DNAアダプターを、T4DNAリガーゼ(NEB)を使用して、mRNAの3’末端に付着させる。ライゲーションしたmRNA分子を、10%TBE−尿素変性ゲルを使用して精製する。mRNA−ピューロマイシン分子を、PURExpressキット(NEB)を使用して、in vitroで翻訳する。in vitro翻訳中、リボソームの停止により、ピューロマイシン残基が、リボソームA部位に進入し、タンパク質のC末端に付着して、タンパク質−mRNA融合体を創出することが可能になる。タンパク質−mRNA融合を、シリカビーズに付着された相補的オリゴヌクレオチドで捕捉する。mRNA部分を、ProtoScript II逆転写酵素(NEB)を使用してcDNAに変換する。タンパク質−cDNA/RNAプールを、RNase H(NEB)およびRNaseカクテル(Thermo Fisher)で処理して、タンパク質−cDNAを生成し、その後カットアウトフィルターで精製する。cDNAのII型制限部位に相補的な配列を添加して二本鎖を形成させ、制限酵素と共にインキュベートして、cDNAの3’末端にスペーサー配列(Sp)を生成する。プールの一部を、開始タンパク質−cDNAプール中のタンパク質表示を特徴付けるための配列決定に使用する。
(実施例30)
リボソームディスプレイに基づくタンパク質バーコード付与
比較的小規模のタンパク質ライブラリー(例えば、この研究では<200個)の場合、バーコード付きプライマーを用いて個々のPCR反応を実施することにより、バーコード付与配列をDNA鋳型に導入することができる。バーコード付き線形DNA鋳型をプールし、HiScribe T7キット(NEB)を使用してin vitro転写する。転写したmRNAを、DNA−freeキット(Ambion)で処理し、RNeasyミニキット(Qiagen)で精製し、Nanodrop 1000(Thermo Scientific)で定量化する。mRNA−cDNAハイブリッドを生成するために、緩衝液(50mM Tris−HCl、pH8.3、75mM KCl、および5mM MgCl2)中で0.10μM mRNA、1μM 5’−アクリダイト(acrydite)およびデスチオビオチン修飾プライマー、0.5mMの各dNTP、10U/μL Superscript III、2U/μL RNaseOUT(Invitrogen)、および5mMジチオトレイトール(DTT)を30分間50℃でインキュベートすることにより、cDNAを合成する。得られたmRNA−cDNAハイブリッドを、イソプロパノール沈殿により濃縮し、ストレプトアビジンコーティング磁気ビーズ(Dynabeads M−270ストレプトアビジン、Life Technologies)で精製する。PURExpressΔリボソームキット(NEB)を適用して、E.coliリボソームにタンパク質を提示させる。典型的には、0.40μM mRNA−cDNAハイブリッドおよび0.30μMリボソームを有する250μLのIVT反応を30分間37℃にてインキュベートし、250μLの氷冷緩衝液HKM(50mM HEPES、pH7.0、250mM KOAc、25mM Mg(OAc)2、0.25U/mL RNasin(Promega)、0.5mg/mLクロラムフェニコール、5mM 2−メルカプトエタノール、および0.1%(v/v)Tween(登録商標)20)を添加することによりクエンチし、10分間遠心分離(14,000g、4℃)して不溶性成分を除去する。常に氷上でまたはコールドルームで維持したPRMC複合体を、2段階Flagタグおよびデスチオビオチンタグ親和性精製に供して、全長のバーコード付き標的タンパク質を濃縮する。したがって、タンパク質は、100μg/mL酵母tRNAおよび10mg/mL BSAで補完された緩衝液HKMでブロッキングされている抗Flag M2(Sigma−Aldrich)およびストレプトアビジン磁気ビーズを使用して逐次的に精製する。結合したタンパク質を、100g/ml Flagペプチドまたは5mMビオチンを含む緩衝液HKMで溶出し、それらのバーコード付きDNAをリアルタイムPCRで定量化する。
(実施例31)
コード付きOBOC手法を使用したリガンド結合アッセイ
図54は、付随するコーディングタグと共にビーズに固定化されている小分子リガンドを、記録タグ標識タンパク質(例えば、IVTT生成タンパク質−記録タグ複合体)のプールと接触させ、コーディングタグと記録タグとの間の情報移行により結合情報が記録されるリガンド結合アッセイを示す。図54Aは、MacConnell et al.(MacConnell, McEnaney et al. 2015)に記載のように作製したDNAコード付き1ビーズ1化合物(ODBC)ビーズの構築を示す。コーディングタグは、ユニバーサルプライマー部位R1’、DNAにコードされるライブラリーバーコード(DEL BC)、および情報移行を容易にするためのスペーサー配列(Sp’)で構成される。図54Bは、タンパク質(または他の巨大分子)が、固体支持体(例えばビーズ)に付着されているリガンド結合性物質と結合した後の、コーディングタグ(または記録タグ)から記録タグ(またはコーディングタグ)への情報の書き込みの概要を示す。図54Cは、プライマー伸長を使用して、リガンド結合性物質のコーディングタグの識別情報を、タンパク質に付随する記録タグへと移行して伸長記録タグを生成するための、伸長記録タグの例示的な構築を示す。記録タグは、相補的スペーサー配列(Sp)を介してコーディングタグにアニーリングし、プライマー伸長反応は、スペーサー(Sp)をプライミング部位として使用してコーディングタグ情報の記録タグへの移行を媒介し、それにより伸長記録タグを生成する。一意のDNAにコードされるライブラリーエンコーダー配列または結合性物質に関する識別情報を有するバーコードを含むコーディングタグは、ユニバーサルプライミング部位R1’により隣接されており、必要に応じて一方の末端が情報移行に有用な共通スペーサー配列(Sp’)により隣接されている。あるいは、巨大分子が結合性物質/リガンドに結合した後にコーディングタグから記録タグに情報を書き込むのではなく、図54Dは、UMI配列(例えば、特定のペプチドまたはタンパク質分子を識別する)および少なくとも1つのバーコード(例えば、コンパートメントタグ、分配バーコード、試料バーコード、空間的位置バーコードなど)を含む記録タグからコーディングタグへと情報を移行させ、それにより伸長コーディングタグを生成するための例示的な構築を示す。
(実施例32)
コーディングタグから記録タグへと情報を書き込むことによる結合物質ダウンNGPSアッセイ
図55A〜55Cは、巨大分子を結合性物質に結合させ、固体支持体(例えば、ビーズ)に付着されている単一の結合性物質の部位に共局在化されている複数のコーディングタグのうちの個々のコーディングタグの情報を、巨大分子に付着されている記録タグへと移行させ、それにより所与の巨大分子の時間的結合履歴を表す、コーディングタグを含む伸長記録タグを産生する複数サイクルのプロセスを示す。この図では、例示のために過ぎないが、巨大分子は、ペプチドであり、各ラウンドは、ペプチドのN末端アミノ酸(NTAA)を結合性物質に結合させること、コーディングタグ情報を記録タグに移行させることにより結合事象を記録すること、サイクル特異的タグ情報を記録タグに移行させることにより結合事象順序を記録し、その後そのNTAAを除去して、新しいNTAAを露出させることを含む。図55Aは、結合性物質と共にビーズに共局在化されている複数のコーディングタグ(エンコーダを含む)を示す。ペプチドは、記録タグ(ユニバーサルフォワードプライミング配列およびUMIを含む)に付着されている。個々のコーディングタグは、伸長反応をプライミングして、コーディングタグ情報を記録タグへと移行するために使用することができる、結合性物質のコーディングタグ内の共通スペーサー配列(Sp)に相補的な共通スペーサー配列(Sp’)を有する。結合サイクル1中に、ペプチドの第1の遊離NTAAが、NTAA結合性物質に結合し、第1のコーディングタグの情報が、プライマー伸長により記録タグに移行する。結合サイクル1後に、伸長記録タグに付着されたペプチドが、サイクル1タグ付与に使用される。記録タグ内のユニバーサルフォワードプライミング部位(U1)が、相補的配列(U1’)に結合し、固体支持体(例えば、ビーズ)に付着されたU1’の部位に共局在化されている複数のサイクル1特異的配列のうちの個々のサイクル1特異的配列の情報が、ペプチドに付着されている記録タグへと移行し、それにより所与の巨大分子の時間的結合順序を表す、サイクル1特異的配列を含む伸長記録タグが産生される。NTAAを除去して、新しいNTAAを露出させると、ペプチドの第2の遊離NTAAがNTAA結合性物質に結合し、第2のコーディングタグの情報がプライマー伸長により記録タグに移行する。こうしたサイクルを「n」結合サイクルまで繰り返し、最後の伸長記録タグを、ユニバーサルリバースプライミング配列でキャッピングする。各エンコーディングステップの後でサイクル特異的タグ付与が行われるため、結合サイクル情報を、得られる伸長記録タグの結合性物質情報と関連付けることができる。図55Bは、各NTAA結合物質および各サイクルタグ付与のDNAエンコーディングのための複数カラムの全体的なワークフローの例を示す。図55Cは、結合(「...」は、伸長記録タグに示されていないその間の結合サイクルを表わす)、およびコーディングタグ情報の移行、および3’末端へのユニバーサルプライミング部位の付加の「n」回のサイクル後に産生される最終伸長記録タグを示す。
(実施例33)
記録タグからコーディングタグへと情報を書き込むことによる結合物質ダウンNGPSアッセイ
図56A〜56Cは、巨大分子を結合性物質に結合させ、巨大分子に付着されている記録タグの情報を、固体支持体(例えば、ビーズ)に付着されている単一の結合性物質の部位に共局在化されている複数のコーディングタグのうちの個々のコーディングタグに移行させ、それにより結合性物質を集合的に表す複数の伸長コーディングタグを生成する複数サイクルのプロセスを示す。この図では、例示のために過ぎないが、結合性物質は、N末端アミノ酸(NTAA)結合性物質であり、各ラウンドは、ペプチドのNTAAを結合性物質に結合させること、記録タグ情報をコーディングタグに移行させることにより結合事象を記録すること、サイクル特異的タグ情報をコーディングタグに移行させることにより結合事象順序を記録し、その後そのNTAAを除去して、新しいNTAAを露出させることを含む。図56Aは、結合性物質と共に固体支持体に共局在化されている複数のコーディングタグ(ユニバーサルフォワードプライミング配列およびエンコーダーを含む)を示す。巨大分子は、記録タグ(UMIおよびサイクルタグ付与のためのスペーサー配列を含む)に付着されている。個々のコーディングタグは、伸長反応をプライミングして、記録タグ情報をコーディングタグへと移行するために使用することができる、結合性物質のコーディングタグ内のスペーサー配列(Sp’)に相補的なスペーサー配列(Sp)を有する。結合サイクル1中に、ペプチドの第1の遊離NTAAが、NTAA結合性物質に結合し、第1の記録タグの情報およびSp2配列が、相補的Sp1スペーサー配列とハイブリダイズしたSp1’配列からプライマー伸長によりコーディングタグへと移行する。結合サイクル1の後、サイクル1特異的配列が、相補的Sp2スペーサー配列とハイブリダイズしたSp2’配列からプライマー伸長によりコーディングタグへと移行し、それにより所与の巨大分子の時間的結合順序を表す、サイクル1特異的配列を含む伸長コーディングタグが産生される。NTAAを除去して、新しいNTAAを露出させると、ペプチドの第2のNTAAがNTAA結合性物質に結合し、第2の記録タグの情報がプライマー伸長によりコーディングタグに移行する。こうしたサイクルを、「n」結合サイクルまで繰り返す。各エンコーディングステップの後でサイクル特異的タグ付与が行われるため、結合サイクル情報を、得られる伸長コーディングタグの結合性物質情報と関連付けることができる。図56Bは、各NTAA結合物質および各サイクル付与のDNAエンコーディングのための複数のカラムの全体的なワークフローの例を示す。図56Cは、「n」サイクルの結合後に産生される伸長記録タグを示し、それを、エンコーダー、サイクル特異的配列、およびUMIを含む伸長コーディングタグ情報に基づいて組み立てると、巨大分子の順序付けられた配列を提供することができる。
(実施例34)
複数サイクル結合/エンコーディングアッセイ
ペプチドモデル系を使用して、コーディングタグに由来する情報が、ビーズに固定化されている記録タグに移行される3サイクルのエンコーディングを試験した(図57)。PAペプチド配列(配列番号195)を、ビーズに固定化されている記録タグオリゴヌクレオチドamRT_Bbc(配列番号213)に付着させた。amRT_Bbc配列は、BC_3(配列番号:66〜130)を含む。結合性物質の場合、抗PA抗体(Wako Chemical)を、それぞれ15merのバーコードBC4、BC5、およびBC13R1(配列番号:66〜130)を含むコーディングタグオリゴヌクレオチドamCT_bc4、amCT_bc5、およびamCT_bc13r1(配列番号208〜210)に付着させた。この設計は、特異的プライマーセットを用いたPCR増幅後のゲル解析を容易にする。
磁気アッセイビーズの生成−2段階プロセス。
DNA記録タグ−ペプチドキメラを、キメラを単一ユニットとしてカップリングするのではなく、記録タグを固定化した後にペプチドをカップリングすること以外は、図34に記載の1段階アッセイビーズプロセスと同様の2段階固定化プロセスを使用して、制御された密度で磁気ビーズに固定化した。すなわち、TCO−PEG12−NHSエステル(BroadPharm)を、mPEG−SCM、MW550(Creative PEGWorks)に対して1:103の比でタイトレーションすることにより、M−270アミンDynabeadsビーズ(Thermo Fisher)をtrans−シクロオクテン(TCO)基でまばらに表面機能化した。過剰なアミン基を、NHS−アセテートでキャッピングした。2段階キメラ固定化プロセスでは、内部アルキン修飾および5’アミン修飾を含む二機能性DNA記録タグを、まず内部アルキンオリゴヌクレオチド修飾因子をmTetに変換し、その後TCOビーズに直接カップリングすることによりTCOビーズに固定化し、その後ペプチドを記録タグオリゴの5’アミンにカップリングした。具体的には、内部アルキン修飾記録タグオリゴヌクレオチドを、mTet−PEG4−アジド(BroadPharm)で修飾し、その後TCO誘導体化ビーズに付着させる。ペプチドをビーズ上の5’アミン記録タグにカップリングするために、システイン含有ペプチドを、固定化された記録タグの5’アミン基にNHS−PEG8−Mal(Thermo Fisher)を介して付着させる。
コーディングタグ標識PA抗体の生成
抗PA抗体とコーディングタグ(amCT_bc4、またはamCT_bc5、またはamCT_bc13r1オリゴヌクレオチド)とのコンジュゲーションは、タンパク質−オリゴヌクレオチドコンジュゲーションキット(Solulink)を使用して達成した。手短に言えば、コーディングタグの5’アミン基をS−4FBで修飾し、その後0.5mLのZebaカラムで脱塩した。抗PA抗体をS−HyNicで修飾し、その後0.5mLのZebaカラムで脱塩した。最後に、4FB修飾コーディングタグおよびHyNic修飾抗PA抗体を混合して、抗体−コーディングタグコンジュゲートを調製し、その後0.5mLのZebaカラムを使用して脱塩した。
抗体に基づく結合/エンコーディングアッセイ:
PAペプチド−記録タグamRT_Bbc(配列番号213)ビーズを、上記に記載のように調製した。第1のサイクル結合アッセイでは、100万個のビーズを、まず、SuperBlock T20(TBS)ブロッキング緩衝液(Thermo Fisher)で15分間室温(r.t.)にてインキュベートすることによりブロッキングした。40nMのコーディングタグ(BC4)標識PA抗体を、アッセイビーズと共に50ulのPBST(1×PBS、0.1%Tween(登録商標)−20)中で30分間37℃にてインキュベートした。ビーズを、10%ホルムアミドを含む1mlのPBSTで1回r.t.にて洗浄した。ビーズを、50ulの伸長反応マスターミックス(50mM Tris−Cl(pH7.5)、2mM MgSO4、125uM dNTP、50mM NaCl、1mMジチオトレイトール、0.1% Tween(登録商標)−20、0.1mg/ml BSA、および0.05U/uLクレノウexo−DNAポリメラーゼ)に再懸濁し、5分間37℃でインキュベートした。プライマー伸長後、ビーズを、150ulのPBST/10%ホルムアミドで1回、150ulの0.1N NaOHで1回5分間、150ulのPBST/10%ホルムアミドで1回、および50ulのPBSTで1回洗浄した(r.t.にて)。第2および第3の結合サイクルアッセイでは(図57を参照)、コーディングタグ(BC5)標識PA抗体およびコーディングタグ(BC13)標識PA抗体を、それぞれ結合/エンコーディングアッセイに使用した。第3のエンコーディングサイクル伸長の後、最終伸長記録タグを、バーコード特異的プライマーを有する20ulのPCR混合物でPCR増幅し、1ulのPCR産物を10%PAGEゲルで解析した。得られたゲルは、結合、およびポリメラーゼ伸長によるコーディングタグ情報の記録タグへの書き込みの3サイクルの原理の証明を示す(図57Bを参照)。ゲル解析に加えて、第3の結合アッセイ後に生成された伸長記録タグをプライマーで増幅して、NGSシーケンシングライブラリーを生成した。得られたライブラリーをIllumina MiSeq装置で配列決定した。結果は図57Cに示されている。78%よりも多くの伸長記録タグが3つのバーコードを含んでいた。これは、段階的エンコーディングが比較的効率的だったことを示す。
(実施例35)
アッセイブロッキングオリゴによるエンコーディングの増強(図3および図36Aも参照されたい)
様々なDNAブロッカーを3サイクルエンコーディングアッセイに使用して、エンコーディング効率に対する効果を評価し、結合およびエンコーディングのオリゴモデル系を評価した(図58)。記録タグオリゴヌクレオチドamRT_Bbc(配列番号213)を、以前に記載のようにビーズに固定化した。この記録タグ配列は、「B」DNA捕捉配列(「B’」結合性物質の模倣エピトープ)およびBC_3バーコード(配列番号1〜65)を含む。このモデル系では、結合物質−コーディングタグは、DNAコーディングタグに追加されたB相補的配列(B’)を有するオリゴヌクレオチドを用いる。3つのタイプのDNAブロッカーを試験した(図58A)。CTブロッカーは、コーディングタグ5’Sp’領域およびバーコード配列とハイブリダイズする。3’Sp’配列は、アニーリングのために空いている。記録タグでは、Sp’ブロッカーおよびRTブロッカーは、それぞれ記録タグのSpスペーサー配列およびSp−バーコードにハイブリダイズする。エンコーディング後、伸長記録タグをPCR増幅し、PAGEを使用して解析した。図58Bに示されているように、CTブロッカーの存在下での3サイクルに由来するPCR産物では、第3のサイクルでエンコードされたバンドが観察されたが、Sp’ブロッカーまたはRTブロッカー単独の存在下では観察されなかった。このデータは、CTブロッカーが、コーディングタグ情報の記録タグへの効率的な移行を容易にすることを示した。
(実施例36)
伸長記録タグ増幅中の鋳型スイッチングの最小化
PCR中の鋳型スイッチングを、2つの伸長記録タグオリゴヌクレオチドモデル鋳型TS_Ctrl1(配列番号211)およびTS_Ctrl4(配列番号212)を使用して評価した(図59A)。こうしたモデル鋳型は、共通Sp配列およびバーコード配列を共有し、伸長記録タグ鋳型構造を模倣するように設計した。図59Aに示されているモデル鋳型を1:1比で混合し、種々の温度で異なるポリメラーゼを用いてPCRにより増幅した。鋳型スイッチング率を、10%PAGEゲルを使用したPCR産物の解析により、またNGS読み出し(図示せず)により評価した。
詳しくは、上記の2つの鋳型の10fmol 1:1混合物を、図59に示されているようなFwdプライマーおよびRevプライマーを使用して10ulのPCR反応中で増幅し、10%PAGEでゲルを解析し、またMiSeq DNAシーケンサー(Illumina)を使用してNGSにより解析した。以下のポリメラーゼの鋳型スイッチング率を、50〜68℃のアニーリング温度窓にわたってアッセイした:Q5ホットスタート(New England Biolabs)、Taq(New England Biolabs)、Deep Vent(exo−)(New England Biolabs)、KOD Xtremeホットスタート(EMD Millipore)、およびHerculase II融合DNAポリメラーゼ(Agilent)。図59に示されているように、TS_Ctrl1およびTS_Ctrl4に由来するPCR産物に対応する2つの主要バンド(125bpおよび173bp)が観察された。鋳型スイッチング副産物バンドは、ゲルのより低い分子量のバンドにより示されるように、Deep Vent exo−を含む複数のポリメラーゼで観察されたが(図59Bを参照)、Taq DNAポリメラーゼ(図59Bを参照)およびKOD XtremeホットスタートDNAポリメラーゼ(データは示さず)では最小化された。その後これらのポリメラーゼを、NGSでより詳細に解析した。NGSは、TaqおよびKOD XtremeホットスタートDNAポリメラーゼでは、鋳型スイッチングを示すマッピングされたリード割合がそれぞれ5.6%および2.4%だったことを示した。
(実施例37)
完全サイクルProteoCodeペプチド配列決定アッセイの実証。
1サイクルProteoCode NGPSアッセイの実証が図60に記載されている。本発明者らのN末端機能化およびN末端除去(NTF/NTE)試薬によるペプチドのN末端アミノ酸の除去を、2サイクルのF−結合物質結合アッセイにより検出した(図60を参照)。内部PAペプチド配列を有するN末端FA、AF、およびAペプチド(配列番号201、202、および203)を、実施例1に記載の2段階プロセスを使用して、ビーズに固定化されている記録タグオリゴヌクレオチドamRT_Cbc(配列番号214)に個々に付着させた。
F−結合物質と、コーディングタグamCT_bc4およびamCT_bc5(配列番号208、209)とのコンジュゲーションを、以前に記載のようなSpyTag/SpyCatcherタンパク質カップリング法を使用して達成した。手短に言えば、SpyCatcherと融合したF−結合物質を、E.coliで発現させ、Ni−NTAカラムで精製し、PBSで透析した。Cys含有ペプチドSpyTag(配列番号198)を、SM(PEG)24(Thermo Fisher)を介してamCT_bc4およびamCT_bc5の5’アミンに付着させた。最後に、SpyTag修飾コーディングタグおよびSpyCatcher融合F−結合物質を混合して、F−結合物質−コーディングタグコンジュゲートを調製した。
2サイクルのF結合およびエンコーディング、プレNTF/NTE化学、およびポストNTF/NTE化学を実施した。結合およびエンコーディングアッセイを実施例1に記載のように実施した。第1のサイクルF−結合物質結合/エンコーディングアッセイの後、アッセイビーズをNTF/NTE試薬による処理に供して、NTAAを除去した。NTF処理の場合、アッセイビーズを、150ulの15mM N−Boc−N’−TFA−ピラゾール−1−カルボキサミジン(Sigma)と共に0.5Mトリエチルアンモニウムアセテート、pH8.5/アセトニトリル(1:1)、0.05%F−127中で1時間50℃にてインキュベートした。ビーズを、200ulの0.5Mトリエチルアンモニウムアセテート、pH8.5/アセトニトリル(1:1)、0.05%F−127で3回洗浄した。NTE処理は、アッセイビーズを、0.05%Tween(登録商標)20を含む150ulの0.5M NaOHで1時間40℃にてインキュベートすることにより実施した。ビーズを、10%ホルムアミドを含む1mlのPBSTで洗浄し、F−結合物質−コーディングタグでの第2のサイクルF−結合物質結合アッセイに使用した。F−結合物質を、プレ化学対ポスト化学結合/エンコーディングサイクルのために、異なるサイクル特異的バーコードコーディングタグとコンジュゲートした。アッセイの伸長記録タグをNGSで解析した。NGS結果は、第1のサイクルでは、F−結合物質によりFAペプチドが検出されるが、AFペプチドの検出は最小限であり、対照的に、第2のサイクルでは、NTF/NTE処理後、F−結合物質によりAFペプチドがより高い効率で検出されるが、FAペプチドの検出は不良であることを示す。要約すると、化学処理の前後でF−結合物質エンコーディングがおよそ4倍増加したことがAFペプチド−記録タグで検出され、一方では、化学処理前後でFAペプチドにおけるF−結合物質エンコーディングがおよそ4分の1に減少したことは、DNAエンコーディングを使用した単一サイクルペプチド配列決定の原理の証明を効果的に示す。
(実施例38)
掛け合い応答測定
図36は、ビーズ上のDNAモデル系キメラ密度を使用する効果および分子間掛け合い応答を示す。本発明者らは、mTet誘導体化カルボキシルM270−Dynalビーズ上のペプチド−RTキメラの表面タイトレーションを使用して、4−plexペプチド−記録タグ(RT)掛け合い応答モデル系を発生した。ビーズ表面上のペプチド−RTキメラの密度を制御するために、機能性カップリング部位(メチルテトラジン、mTet)を有するビーズを、NH2−PEG4−メチルテトラジン(BroadPharm)を、1:100、1:1000、1:10000、および1:100000の比で、m−PEG4アミン(BroadPharm)に対してタイトレーションすることにより、活性化M−270カルボキシルDynabeads(Thermo Fisher)から誘導体化した。TCO/mTetカップリングにより、4−plex、無ペプチド、FA、AA、およびAFペプチド付着記録タグを、1:100、1:1000、1:10000、および1:100000の比でビーズに固定化した。
1セットのペプチド−RTキメラを、まず、TCO−PEG12−NHSエステル(Click Chemistry Tools)にカップリングすることによってRTオリゴヌクレオチドの5’アミンを「活性化する」ことにより創出した。TCO活性化後、内部アルキン基を用いて設計されたRTオリゴヌクレオチドを、アジド含有FA、AA、およびAFペプチドにカップリングした。N末端FA、AA、およびAFアミノ酸配列ならびに内部PAエピトープを有するペプチド(配列番号195)を、それぞれ記録タグオリゴヌクレオチドamRT_Cs2、amRT_Cs4、およびamRT_Cs5(配列番号216〜218)に個々に付着させた。第4の記録タグamRT_Cs1(配列番号215)は、無ペプチド対照として含まれていた。F−結合物質結合性物質を、8merのバーコードBC_s7(配列番号220)を含むコーディングタグオリゴヌクレオチドamCT_s7(配列番号219)にコンジュゲートした。4つのキメラ(FAペプチド、AAペプチド、AFペプチド、および無ペプチド)を、iEDDA TCO−mTet化学を使用して、mTetビーズと組み合わせ、固定化した。F−結合物質コーディングタグ構築物を実施例4に記載のように創出した。
記録タグ間の掛け合い応答アッセイシグナルを、4−plexアッセイビーズでの1サイクルF−結合/エンコーディングアッセイにより検出した(図61を参照)。アッセイ条件は、200nM F−結合物質結合性物質を用いたこと以外は、実施例1に記載の通りだった。4つの異なるキメラの絶対ローディング量を、ユニバーサルPA抗体を用いた結合/エンコーディングの第2のサイクルにより測定し、3つのペプチドタイプすべてがPA抗原配列を含んでいた。図61Aは、4つのキメラがすべて、ほぼ等しい量でビーズにローディングされたことを示す。特異的エンコーディングは、伸長記録タグのバーコードのNGS読み出しにより決定される、N末端F−ペプチド記録タグのF−結合物質エンコーディングにより識別した。掛け合い応答は、N末端非F(AAペプチド、AFペプチド、および無ペプチド)ペプチド記録タグのF−結合物質エンコーディングにより識別した。図61Bに示されているように、1:100および1:1000活性部位ビーズでは、キメラ記録タグはすべてF−結合物質バーコードを受け取ったが、1:10000および1:100000ビーズでは、FA記録タグのみがF−結合物質バーコードを受け取った。データは、高記録タグ密度ビーズ(1:100および1:1000)では分子間ならびに分子内エンコーディングが生じ、より低密度ビーズ(1:10,000および1:100,000)では分子内エンコーディングのみが生じたことを示した。結論として、このモデル系は、密度がまばらなビーズでの分子内単一分子結合およびエンコーディングを実証した。なお、この例の密度タイトレーションは、異なるビーズ化学を用いたため、実施例36のDNAモデル系とは直接相関しない。
(実施例39)
塩基が保護されたDNAでのエンコーディング
また、本発明者らのNTF/NTEエドマン様化学の課題は、高反応性NTF試薬が、ペプチドのN末端アミンの修飾に加えて、DNAの核酸塩基の環外および他のアミン基も修飾する場合があるということである。DNA修飾は、アッセイのDNAのエンコーディング機能を損なう場合がある。DNAの修飾は、核酸塩基が保護されたDNAを使用することにより大幅に低減することができる。この手法は、NTAA基の迅速な修飾を容易にする非常に幅広いセットの化学反応および反応条件の使用を可能にする。
核酸塩基が保護されたDNAを用いた上記の手法を実施するための1つ課題は、ほとんどの核酸塩基保護基が、プライマー伸長および複数のライゲーションエンコーディングアッセイに有用な前提条件であるDNAのハイブリッド形成能力を低減させることである。
驚くべきことに、DNAエンコーディングプロセスにおける保護ssDNAの使用は、完全に保護されたオリゴヌクレオチドを共にライゲーションするssDNAリガーゼCircLigaseを使用することにより可能になる。本発明者らは、CircLigaseが、ライゲーション接合部のいずれかの側(3’または5’)に天然「T」オリゴヌクレオチドスペーサー配列を有する完全に保護されたオリゴヌクレオチドをライゲーションする能力を試験した。本発明者らは、5’側のTスペーサーの非存在下で、ライゲーション接合部に直に隣接する保護G塩基を使用して、効率的なライゲーションを達成することができたことを見出した。3’側には天然Tスペーサーを使用した。
オリゴモデル系を使用して、ビーズに固定化されている記録タグ複合体へのコーディングタグ情報の第1のサイクル移行を試験した(図62を参照)。PRT_0T_B’_bioを、ストレプトアビジン機能化ビーズに対する強力なビオチンストレプトアビジン相互作用を使用してビーズに固定化した。PRT_0T_B’_bio配列は、「B’」DNA捕捉配列(「B」結合性物質の模倣エピトープ)ならびに保護dA、dG、およびdCを含む対応する「B’」バーコードを含有する。結合性物質では、相補的「B」結合配列CT_B_thio(配列番号206)を、ヘテロ二機能性リンカーを介して、保護dA、dG、およびdCを含むコーディングタグオリゴヌクレオチドPCT_1T(配列番号207)にカップリングした。CircLigase IIを使用した一本鎖ライゲーションにより特異的Bseq/B’seq結合事象をエンコーディングし、ゲル解析で確認した。
チオール含有「B’」配列RT_thio_B’_bio(配列番号204)を、SM(PEG)8(Thermo Fisher)を介してPRT_0T(dU)(配列番号205)の5’アミン基に付着させ、得られた記録タグPRT_0T_B’bioを15%変性PAGEで精製した。mPEG−ビオチン、MW1000(Creative PEGWorks)に対して1:10の比でタイトレーションすることにより誘導体化されたM−270ストレプトアビジンDynabeads(Thermo Fisher)に記録タグを固定化した。ビーズをUSER酵素(New England Biolabs)で処理して、記録タグ−5’ホスフェートGの5’末端にリン酸化部位を生成した。「B」結合配列B_thioとPCT_1Tとのコンジュゲーションを、SM(PEG)8(Thermo Fisher)を介して連結し、コーディングタグコンジュゲートを、15%変性PAGEで精製した。
第1のサイクル結合アッセイは、800nMのコーディングタグコンジュゲートを、5’リン酸化記録タグ固定化ビーズと共に50ulのPBST中で30分間37℃にてインキュベートした以外は、以前に記載したものと同様であった。ビーズを、40%ホルムアミドを含む50ulのPBSTで2回、および50ulの33mM Tris−HCl緩衝液、pH7.5で1回、室温にて洗浄した。ビーズを、50ulのCircLigase IIライゲーション反応マスターミックス(33mM Tris−アセテート、pH7.5、66mM酢酸カリウム、0.5mM DTT、2.5mM MnCl2、1Mベタイン、および0.25U CircLigase II ssDNAリガーゼ(Illumina))に再懸濁し、30分間37℃でインキュベートした。ライゲーション反応後、ビーズを、固定化緩衝液(5mM Tris−Cl(pH7.5)、0.5mM EDTA、1M NaCl、40%ホルムアミド)で1回、40%ホルムアミドを含むPBSTで1回洗浄した。95%ホルムアミド/10mM EDTA中で5分間65℃にてインキュベートすることにより、記録タグをビーズから溶出した。溶出したコンジュゲートを、PAGEゲルで解析した。得られたゲルでは、図62のレーン4のバンドがシフトしており、これは、一本鎖DNAライゲーションを使用して保護dA、dC、およびdG塩基を含む記録タグにコードタグ情報を書き込む原理の証明を示す(図62を参照)。
(実施例40)
DNAビーズとのハイブリダイゼーションおよびライゲーションを使用した、DNAタグ付きペプチドの固定化
ビーズに対するペプチド−記録タグDNAキメラの効率的な固定化は、ProteoCodeアッセイの重要な部分であり、化学的に達成することができるが、ハイブリダイゼーション捕捉および酵素的または化学的ライゲーションにより実施することもできる。本発明者らは、ハイブリダイゼーションに基づく捕捉が、化学カップリングよりも約10,000倍効率的であることを見出した。このように、本発明者らは、DNA捕捉ビーズに対するDNAタグ付きペプチドのハイブリダイゼーションおよび酵素的ライゲーション固定化の有用性を実証した。
DNA−ペプチドキメラを、磁気ビーズに化学的に固定化されたヘアピン捕捉DNAにハイブリダイズおよびライゲーションさせた(図63を参照)。捕捉DNAを、trans−シクロオクテン(TCO)およびメチルテトラジン(mTet)に基づくクリック化学を使用してビーズにコンジュゲートした。TCO修飾短鎖ヘアピンDNA(16塩基対ステム、24塩基5突出)を、mTetコーディング磁気ビーズと反応させた。リン酸化DNA−ペプチドキメラ(1nM)を、5×SSC、0.02%SDS中でヘアピンDNAビーズとアニーリングさせ、30分間37℃にてインキュベートした。ビーズを、PBSTで1回洗浄し、T4DNAリガーゼを有するおよび有していない1×Quickライゲーション溶液(NEB)に再懸濁した。25℃で30分間インキュベーションした後、ビーズを、PBSTで1回洗浄し、20ulのPBSTに再懸濁した。全捕捉DNA、DNAタグ付きペプチド、およびライゲーションDNAタグ付きペプチドを、特異的なプライマーセットを使用してqPCRで定量化した(図63D)。図63Eに示されているように、ビーズ/DNAペプチドハイブリッドを用いたqPCRでは、リガーゼの存在下でのみ低Ct値が得られた。これは、DNAタグ付きペプチドが、ビーズに効果的にライゲーションおよび固定化されたことを示す。
/3SpC3/=3'C3(3個炭素)スペーサー
/i5OctdU/=5'-オクタジイニルdU
/iSP18/=18個原子ヘキサ-エチレングリコールスペーサー
5ProtP=5'シアノエチル保護ホスフェート
3ProtP=3'シアノエチル保護ホスフェート
*=保護された塩基(Bz-dA、ibu-dG、Ac-dC)
本開示は、特定の開示された実施形態の範囲に限定されないことが意図されている。そうした実施形態は、例えば本発明の種々の態様を例示するために提供されている。記載されている組成物および方法の種々の改変は、本明細書の説明および教示から明白になるであろう。そのような変異は、本開示の真の範囲および趣旨から逸脱せずに実施することができ、本開示の範囲以内に入ることが意図されている。上記の詳細な説明に照らして、これらおよび他の変更を実施形態に対してなすことができる。一般的に、以下の特許請求の範囲においては、使用されている用語は、特許請求の範囲を、本明細書および本特許請求の範囲で開示されている特定の実施形態に限定するものとは解釈されるべきでなく、考え得るすべての実施形態ならびにそのような特許請求の範囲が権利を有する等価物の完全な範囲を含むと解釈されるべきである。したがって、特許請求の範囲は、本開示により限定されない。