化学的履歴をコードする手段として化学的ライゲーションを利用する一方で、同時にタグ配列と関連情報を直接回復させるポリメラーゼの能力をも保持する、利用可能な1つの戦略は、野生型ホスホジエステルリンケージを生成させる方法で化学的ライゲーションを行うことである。こうした方法は、一般的に、二本鎖または鋳型にした状況で、5'-リン酸オリゴヌクレオチドおよび3'-ヒドロキシルオリゴヌクレオチドと一緒に、臭化シアンなどの縮合剤を利用する。同様に、臭化シアンはまた、5'-ヒドロキシルおよび3'-リン酸である基質オリゴヌクレオチドの対をも化学的にライゲーションさせることが示されている。しかし、これらの方法は効率が悪く、DNAコード化ライブラリーをタグ付けするなどの反復プロセスで使用するには不向きである。
本発明者らは、シアノイミダソールおよびZn2+を用いて、比較的高い収率で、5'-モノホスホ末端および3'-ヒドロキシ末端を有するオリゴヌクレオチド対から、ならびに5'-ヒドロキシ末端および3'-モノホスホ末端を有するオリゴヌクレオチド対からも誘導される、野生型リンケージ(例えば、ホスホジエステルリンケージ)を利用する、オリゴヌクレオチドタグ付け戦略を開発した。この化学的ライゲーション法は鋳型依存性であり、かつオルソゴナル(orthogonal)な3'-リン酸と5'-リン酸の使用を可能にするので、低い誤取込率または誤コーディング率での、コード用オリゴヌクレオチドの逐次ライゲーションに対する高度制御が、例えば二本鎖の状況で、もたらされる。
したがって、第1の局面において、本発明は、コード化された化学物質を生成する方法を特徴とする。この方法は、(a)第1官能基と第2官能基とを含むヘッドピースを準備する工程;(b)該ヘッドピースの第1官能基を化学物質の構成成分に結合させる工程であって、該ヘッドピースは該構成成分に直接接続されるか、または該ヘッドピースは二官能性スペーサーによって該構成成分に間接的に接続される、工程;および(c)該ヘッドピースの第2官能基を第1オリゴヌクレオチドタグに化学的ライゲーションを介してライゲーションさせて、コード化された化学物質を形成する工程であって、該化学的ライゲーションはホスホジエステルリンケージ、ホスホネートリンケージまたはホスホロチオエートリンケージを生成する、工程を含み、前記工程(b)および(c)は任意の順序で実施することができ、前記第1オリゴヌクレオチドタグは工程(b)の結合反応をコードしており、それによって、コード化された化学物質を生成する。
別の局面において、本発明は、コード化された化学物質を生成するさらなる方法を特徴とする。この方法は、(a)第1官能基と第2官能基とを含むヘッドピースを準備する工程;(b)該ヘッドピースの第1官能基を化学物質の構成成分に結合させる工程であって、該ヘッドピースは該構成成分に直接接続されるか、または該ヘッドピースは二官能性スペーサーによって該構成成分に間接的に接続される、工程;(c)該ヘッドピースの第2官能基を第1オリゴヌクレオチドタグに化学的ライゲーションを介してライゲーションさせて複合体を形成する工程であって、該化学的ライゲーションはホスホジエステルリンケージ、ホスホネートリンケージまたはホスホロチオエートリンケージを生成する、工程;(d)コード化された化学物質のnc個の追加の構成成分を結合させる工程であって、ここでncは1〜10の整数である、工程;および(e)nt個のリンケージを有するnt個の追加のオリゴヌクレオチドタグをライゲーションさせてコード化された化学物質を形成する工程であって、ここでntは1〜10の整数であり、前記リンケージのそれぞれは2つの隣接するタグの間にあり、各タグは前記構成成分の少なくとも1つの正体(identity)をコードする、工程を含み、前記工程(b)および(c)は任意の順序で実施することができ、前記第1オリゴヌクレオチドタグは工程(b)の結合反応をコードしており、前記工程(d)および(e)は任意の順序で実施することができ、各追加のタグは工程(d)の各追加の構成成分の結合反応をコードしており、それによって、コード化された化学物質を生成する。
いくつかの態様では、nt個のリンケージの少なくとも1つのライゲーションは、ホスホジエステルリンケージ、ホスホネートリンケージまたはホスホロチオエートリンケージを生成する化学的ライゲーションを介するものではない(例えば、nt個のリンケージの少なくとも1つのライゲーションは、酵素的ライゲーション、または読み取り可能もしくは読み取り不能なリンケージを生成する化学的ライゲーションによる)。
いくつかの態様では、ncおよびntは、それぞれ独立して、1〜2、1〜3、1〜4、1〜5、1〜6、1〜7、1〜8、1〜9、1〜10、2〜3、2〜4、2〜5、2〜6、2〜7、2〜8、2〜9、2〜10、3〜4、3〜5、3〜6、3〜7、3〜8、3〜9、3〜10、4〜5、4〜6、4〜7、4〜8、4〜9、4〜10の整数である。特定の態様では、ncは1、2、3、4、5、6、7、8、9、または10である。いくつかの態様では、ntは1、2、3、4、5、6、7、8、9、または10である。
いくつかの態様では、化学的ライゲーションはホスホジエステルリンケージを生成する。特定の態様では、化学的ライゲーションはホスホネートリンケージを生成する。いくつかの態様では、化学的ライゲーションはホスホロチオエートリンケージを生成する。
いくつかの態様では、前記ヘッドピースは、二本鎖オリゴヌクレオチド、一本鎖オリゴヌクレオチド、またはヘアピンオリゴヌクレオチドを含む。特定の態様では、前記ヘッドピースは、二本鎖オリゴヌクレオチドまたはヘアピンオリゴヌクレオチドを含む。
いくつかの態様では、前記ヘッドピースは第3官能基を含む。特定の態様では、前記方法は、(d)該ヘッドピースの第3官能基を第2オリゴヌクレオチドタグに化学的ライゲーションを介してライゲーションさせる工程であって、該化学的ライゲーションはホスホジエステルリンケージ、ホスホネートリンケージまたはホスホロチオエートリンケージを生成する、工程をさらに含む。
いくつかの態様では、前記方法は、(d)該ヘッドピースの第3官能基を第2オリゴヌクレオチドタグにライゲーションさせる工程であって、該ライゲーションは、ホスホジエステルリンケージ、ホスホネートリンケージまたはホスホロチオエートリンケージを生成する化学的ライゲーションを介するものではない(例えば、該ライゲーションは酵素的ライゲーション、または読み取り可能もしくは読み取り不能なリンケージをもたらす化学的ライゲーションによる)、工程をさらに含む。
特定の態様では、前記ヘッドピースは、5'末端および/または3'末端にリン酸を含む(例えば、該ヘッドピースは、5'末端もしくは3'末端にリン酸を含むか、または該ヘッドピースが二本鎖もしくはヘアピンオリゴヌクレオチドである場合には、5'末端と3'末端の両方にリン酸を含んでもよい)。
いくつかの態様では、化学的ライゲーションは、前記ヘッドピース上の5'-または3'-リン酸を5'-または3'-ヒドロキシルオリゴヌクレオチドにライゲーションすることを含む。いくつかの態様では、化学的ライゲーションは、該ヘッドピース上の5'末端のリン酸を5'-ヒドロキシルオリゴヌクレオチドまたは3'-ヒドロキシルオリゴヌクレオチドにライゲーションすることを含む。特定の態様では、化学的ライゲーションは、該ヘッドピースの3'末端のリン酸を5'-ヒドロキシルオリゴヌクレオチドまたは3'-ヒドロキシルオリゴヌクレオチドにライゲーションすることを含む。
いくつかの態様では、化学的ライゲーションは、前記ヘッドピース上の5'-リン酸を3'-ヒドロキシルオリゴヌクレオチドに、および/または前記ヘッドピースの3'-リン酸を5'-ヒドロキシルオリゴヌクレオチドにライゲーションすることを含む。いくつかの態様では、化学的ライゲーションは、該ヘッドピース上の5'末端のリン酸を3'-ヒドロキシルオリゴヌクレオチドにライゲーションし、かつ該ヘッドピースの3'末端のリン酸を5'-ヒドロキシルオリゴヌクレオチドにライゲーションすることを含む。
特定の態様では、化学的ライゲーションは、前記ヘッドピース上の5'-リン酸を3'-ヒドロキシルオリゴヌクレオチドに、および前記ヘッドピースの3'-リン酸を5'-ヒドロキシルオリゴヌクレオチドに、同時にライゲーションすることを含む。
いくつかの態様では、化学的ライゲーションはシアノイミダゾールの使用を含む。特定の態様では、化学的ライゲーションは、二価金属源(例えば、可溶性二価金属源)、例えば、Zn2+源(例:ZnF2、ZnCl2、ZnBr2、ZnI2、Zn(NO3)2、Zn(ClO3)2、ZnSO4、Zn(O2CCH3)2などの可溶性Zn2+源またはその場で酸化される元素状亜鉛)、Mn2+源(例:MnSO4、MnCl2などの可溶性Mn2+源)、またはCo2+源(例:CoF2、CoCl2、CoBr2、CoI2などの可溶性Co2+源)の使用をさらに含む。
いくつかの態様では、前記ヘッドピースは、二官能性スペーサー(例えば、直鎖または分枝鎖、例えば、C1-10アルキル、原子数1〜10のヘテロアルキル、C2-10アルケニル、C2-10アルキニル、C5-10アリール、原子数3〜20の環系または多環系、ホスホジエステル、ペプチド、オリゴ糖、オリゴヌクレオチド、オリゴマー、ポリマー、またはポリアルキルグリコール、例えば-(CH2CH2O)nCH2CH2-(ここでnは1〜50の整数である)のようなポリエチレングリコール)によって化学物質の構成成分に間接的に接続される。
特定の態様では、前記ヘッドピースは、コード化された化学物質の構成成分に直接接続される。
特定の態様では、前記化学物質はさらに、1つ以上の第1ライブラリー識別タグ、使用タグ、および/または起源タグを含む。
いくつかの態様では、前記化学物質は2〜20のタグ(例えば、2〜17のビルディングブロックまたは足場タグ、1つの第1ライブラリー識別タグ、1つの任意使用タグ、および1つの起源タグ)を含む。いくつかの態様では、これらのタグの各々は1〜75ヌクレオチド(例えば、本明細書に記載されるように、約6〜12ヌクレオチドなど)を含む。特定の態様では、個々のタグセット内のタグの各々は、ほぼ同じ質量を含む。
いくつかの態様では、コード化された化学物質には、RNA、DNA、修飾DNA、および/または修飾RNAが含まれる。特定の態様では、修飾DNAまたは修飾RNAは、PNA、LNA、GNA、TNA、または同じオリゴヌクレオチド内のこれらの混合物である。
特定の態様では、コード化された化学物質は、可逆的固定化のための部位を含む。いくつかの態様では、可逆的固定化のための部位は、少なくとも1つの結合工程の後に固定化されて、後続の結合工程の前に解放される。いくつかの態様では、可逆的固定化のための部位は、複数の結合工程の後に固定化されて、後続の結合工程の前に解放される。
いくつかの態様では、可逆的固定化のための部位は、結合対の一方のメンバー、例えば、ハイブリダイゼーション適格性(hybridization-competent)オリゴヌクレオチド(例:ハイブリダイゼーション適格性の一本鎖オリゴヌクレオチド)などの核酸、ペプチド、または小分子を含む。
別の局面において、本発明は、前述の方法のいずれかによって生成された1つ以上の化学物質を含むライブラリーを特徴とする。
特定の態様では、前記ライブラリーは複数のヘッドピースを含む。いくつかの態様では、複数のヘッドピースの各ヘッドピースは、同一の配列領域(例えば、プライマー結合領域)および異なるコード領域(例えば、ライブラリーの使用、ライブラリーの起源、ライブラリーの正体、ライブラリーの履歴、リンケージ、スペーサー、もしくは第1構成成分の付加をコードする第1タグ;またはハイブリダイゼーション、増幅、クローニングもしくは配列決定技術を容易にするオリゴヌクレオチド配列)を含む。
特定の態様では、前記ライブラリーは約102〜1020の化学物質(例えば、約102〜103、102〜104、102〜105、102〜106、102〜107、102〜108、102〜109、102〜1010、102〜1011、102〜1012、102〜1013、102〜1014、102〜1015、102〜1016、102〜1017、102〜1018、102〜1019、104〜105、104〜106、104〜107、104〜108、104〜109、104〜1010、104〜1011、104〜1012、104〜1013、104〜1014、104〜1015、104〜1016、104〜1017、104〜1018、104〜1019、104〜1020、105〜106、105〜107、105〜108、105〜109、105〜1010、105〜1011、105〜1012、105〜1013、105〜1014、105〜1015、105〜1016、105〜1017、105〜1018、105〜1019、または105〜1020の複合体)を含む。該ライブラリーの特定の態様では、各化学物質は異なるものである。
別の局面において、本発明は、複数のコード化された化学物質をスクリーニングする方法を特徴とする。この方法は、(a)標的を、前述の方法のいずれかにより調製されたコード化された化学物質および/または前述のライブラリーのいずれかと接触させる工程;ならびに(b)対照と比較して、該標的に対して所定の特性を有する1つ以上のコード化された化学物質を選択する工程を含み、それによって複数のコード化された化学物質をスクリーニングする。
いくつかの態様では、前記所定の特性には、対照と比較した、該標的への結合の増加が含まれる。特定の態様では、前記所定の特性には、対照と比較した、該標的の阻害の増加が含まれる。いくつかの態様では、前記所定の特性には、対照と比較した、該標的の活性の増加が含まれる。
上記の態様のいずれにおいても、オリゴヌクレオチド(例えば、ヘッドピース、第1タグ、および/または、存在する場合、1つ以上の追加のタグ)は、ライブラリーのアイデンティティをコードする。いくつかの態様では、オリゴヌクレオチド(例えば、ヘッドピース、第1タグ、および/または、存在する場合、1つ以上の追加のタグ)は、第1ライブラリー識別配列を含み、ここで、該配列は第1ライブラリーのアイデンティティをコードする。特定の態様では、オリゴヌクレオチドは第1ライブラリー識別タグである。いくつかの態様では、前記方法は、第1ライブラリーをコードする配列を含む第1ライブラリー識別タグを準備すること、および/または第1ライブラリー識別タグを複合体に結合させることを含む。いくつかの態様では、前記方法は、第2ライブラリーを準備すること、および第1ライブラリーを第2ライブラリーと組み合わせることを含む。さらなる態様では、前記方法は、第2ライブラリーをコードする配列を含む第2ライブラリー識別タグを準備することを含む。いくつかの態様では、3つ以上のライブラリー(例えば、3、4、5、6、7、8、9、10、またはそれ以上のライブラリー)が組み合わされる。
上記の態様のいずれにおいても、コード化情報は、1つ以上のタグで、または複数のタグの組み合わせで提供される。いくつかの態様では、コード化情報は、複数のタグ(例えば、2、3、4、5、6、7、8、9、10、またはそれ以上のタグ)によって表される。いくつかの態様では、コード化情報は複数のタグによって表され、この場合、全部のコードタグが(例えば、情報をコードするために特定のタグの組み合わせを用いることによって)コード配列内に含まれる。いくつかの態様では、コード化情報は複数のタグによって表され、この場合、全コードタグよりも少ないコードタグが(例えば、個々のコード配列内にコードするために、複数の個々のタグのセットから1つのタグを用いることによって)コード配列内に含まれる。いくつかの態様では、コード化情報はオルソゴナルに表され、この場合、コード化情報は複数のタグの組み合わせによって表され、コード情報の全部未満が個々のライブラリーメンバー内に含まれ、その結果、複数の対応するライブラリーメンバーはコード化情報をデコンボリューションするために配列決定される必要がある。いくつかの態様では、複数の化学的ビルディングブロックは単一のタグによって表される(例えば、ラセミ体のビルディングブロックでは、2、3、4、5、6、7、8、9、10、またはそれ以上のビルディングブロックが単一のタグで表される)。
上記の態様のいずれにおいても、オリゴヌクレオチド(例えば、ヘッドピースおよび/または1つ以上のビルディングブロック)は、ライブラリーのメンバーの使用(例えば、本明細書に記載されるような、選択工程または結合工程での使用)をコードする。いくつかの態様では、オリゴヌクレオチド(例えば、ヘッドピース、第1タグ、および/または、存在する場合、1つ以上の追加のタグ)は使用配列を含み、ここで、該配列は1つ以上の工程(例えば、選択工程および/または結合工程)でのライブラリー内のメンバーのサブセットの使用をコードする。特定の態様では、オリゴヌクレオチドは使用配列を含む使用タグである。いくつかの態様では、オリゴヌクレオチド(例えば、ヘッドピースおよび/または1つ以上のオリゴヌクレオチドタグ)は、(例えば、ライブラリーの特定部分における)ライブラリーのメンバーの起源をコードする。いくつかの態様では、オリゴヌクレオチド(例えば、ヘッドピース、第1タグ、および/または、存在する場合、1つ以上の追加のタグ)は、起源配列(例えば、約10、9、8、7または6ヌクレオチドの長さを有するランダムまたは縮重配列)を含み、ここで、該配列は、他の点では同一であるライブラリーメンバーの同じまたは異なる段階に由来する増幅産物の間の識別を可能にする。特定の態様では、オリゴヌクレオチドは起源配列を含む起源タグである。いくつかの態様では、前記方法はさらに、使用タグおよび/または起源タグを複合体に接合する、結合する、または機能的に結び付けることを含む。
本明細書中の態様のいずれにおいても、前記方法、組成物および複合体は、任意で、テイルピースを含み、その際、テイルピースは、本明細書に記載されるように、ライブラリー識別配列、使用配列、または起源配列の1つ以上を含む。特定の態様では、前記方法はさらに、テイルピース(例えば、ライブラリー識別配列、使用配列、または起源配列の1つ以上を含む)を複合体に接合する、結合する、または機能的に結び付けることを含む。
上記の態様のいずれにおいても、前記方法、組成物および複合体、またはそれらの部分(例えば、ヘッドピース、第1タグ、および/または、存在する場合、1つ以上の追加のタグ)は、半水性、低水性、または非水性(例えば、有機)条件における溶解性を促進する修飾を含んでもよい。いくつかの態様では、二官能性スペーサー、ヘッドピース、または1つ以上のタグは、前記DNAコード化された化合物ライブラリーのメンバーの有機条件における溶解性を高めるように修飾される。いくつかの態様では、修飾は、アルキル鎖、ポリエチレングリコール単位、正電荷を有する分岐種、または疎水性環構造の1つ以上である。いくつかの態様では、修飾は、疎水性部分を有する1つ以上の修飾ヌクレオチド(例えば、TまたはC塩基のC5位置で脂肪族鎖により修飾されたもの、例えば、5'-ジメトキシトリチル-N4-ジイソブチルアミノメチリデン-5-(1-プロピニル)-2'-デオキシシチジン,3'-[(2-シアノエチル)-(N,N-ジイソプロピル)]-ホスホルアミダイト;5'-ジメトキシトリチル-5-(1-プロピニル)-2'-デオキシウリジン,3'-[(2-シアノエチル)-(N,N-ジイソプロピル)]-ホスホルアミダイト;5'-ジメトキシトリチル-5-フルオロ-2'-デオキシウリジン,3'-[(2-シアノエチル)-(N,N-ジイソプロピル)]-ホスホルアミダイト;および5'-ジメトキシトリチル-5-(ピレン-1-イル-エチニル)-2'-デオキシウリジン,3'-[(2-シアノエチル)-(N,N-ジイソプロピル)]-ホスホルアミダイト)または疎水性部分(例えば、アゾベンゼン)を有する挿入物を含む。いくつかの態様では、ライブラリーのメンバーは、約1.0〜約2.5のオクタノール:水係数(例えば、約1.0〜約1.5、約1.0〜約2.0、約1.3〜約1.5、約1.3〜約2.0、約1.3〜約2.5、約1.5〜約2.0、約1.5〜約2.5、または約2.0〜約2.5)を有する。
上記の態様のいずれにおいても、ポリメラーゼは、参照により本明細書に組み入れられる国際出願PCT/US13/50303に記載されるように、コード化された化学物質のリンケージの少なくとも1つを読み通すまたは通過して移動する能力が低下していてもよい。いくつかの態様では、該ポリメラーゼは、コード化された化学物質のリンケージの少なくとも約10%(例えば、対照と比較して、約20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、または100%さえも)を読み通すまたは通過して移動する能力が低下している。特定の態様では、該ポリメラーゼは、コード化された化学物質のリンケージの約10%〜約100%(例えば、対照と比較して(例えば、該リンケージを欠く対照オリゴヌクレオチドと比較して)、20%〜100%、25%〜100%、50%〜100%、75%〜100%、90%〜100%、95%〜100%、10%〜95%、20%〜95%、25%〜95%、50%〜95%、75%〜95%、90%〜95%、10%〜90%、20%〜90%、25%〜90%、50%〜90%、または75%〜90%)を読み通すまたは通過して移動する能力が低下している。
いくつかの態様では、コード化された化学物質のリンケージの約10%未満(例えば、約10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、または95%)は酵素的リンケージを含む。いくつかの態様では、コード化された化学物質のリンケージは、0%〜90%の酵素的リンケージを含む(例えば、約0%〜40%、0%〜45%、0%〜50%、0%〜55%、0%〜60%、0%〜65%、0%〜70%、0%〜75%、0%〜80%、0%〜85%、0%〜90%、0%〜95%、0%〜96%、0%〜97%、0%〜98%、0%〜99%、5%〜40%、5%〜45%、5%〜50%、5%〜55%、5%〜60%、5%〜65%、5%〜70%、5%〜75%、5%〜80%、5%〜85%、5%〜90%、5%〜95%、5%〜96%、5%〜97%、5%〜98%、5%〜99%、10%〜40%、10%〜45%、10%〜50%、10%〜55%、10%〜60%、10%〜65%、10%〜70%、10%〜75%、10%〜80%、10%〜85%、10%〜90%、10%〜95%、10%〜96%、10%〜97%、10%〜98%、10%〜99%、15%〜40%、15%〜45%、15%〜50%、15%〜55%、15%〜60%、15%〜65%、15%〜70%、15%〜75%、15%〜80%、15%〜85%、15%〜90%、15%〜95%、15%〜96%、15%〜97%、15%〜98%、15%〜99%、20%〜40%、20%〜45%、20%〜50%、20%〜55%、20%〜60%、20%〜65%、20%〜70%、20%〜75%、20%〜80%、20%〜85%、20%〜90%、20%〜95%、20%〜96%、20%〜97%、20%〜98%、または20%〜99%)。
いくつかの態様では、コード化された化学物質のリンケージの少なくとも1つは、化学的リンケージ(例えば、化学反応基、光反応基、インターカレート成分、または架橋性オリゴヌクレオチド)を含む。特定の態様では、少なくとも1つ(例えば、2つ、3つ、4つ、5つまたはそれ以上)の化学反応基、光反応基、またはインターカレート成分は、タグの5'末端にあるもしくは5'末端に近接する5'-コネクタ中に存在し、かつ/またはタグの3'末端にあるもしくは3'末端に近接する3'-コネクタ中に存在する。他の態様では、5'-コネクタの少なくとも1つの配列は、隣接する3'-コネクタの配列に相補的であるか、または相補的オリゴヌクレオチドへのハイブリダイゼーションを可能にするために同一であるかもしくは十分に類似する。いくつかの態様では、コード化された化学物質のリンケージの少なくとも10%(例えば、約20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、または100%)は、化学的リンケージである。他の態様では、コード化された化学物質のリンケージの約10%〜約100%(例えば、20%〜100%、25%〜100%、50%〜100%、75%〜100%、90%〜100%、95%〜100%、10%〜95%、20%〜95%、25%〜95%、50%〜95%、75%〜95%、90%〜95%、10%〜90%、20%〜90%、25%〜90%、50%〜90%、または75%〜90%)は、化学的リンケージである。
いくつかの態様では、化学反応基は、以下から選択される:置換されてもよいアルキニル基と、置換されてもよいアジド基の対;4π電子系を有する置換されてもよいジエンと、2π電子系を有する置換されてもよいジエノフィルもしくは置換されてもよいヘテロジエノフィルの対;求核剤とひずみのあるヘテロシクリル求電子剤の対;置換されてもよいアミノ基とアルデヒドもしくはケトン基の対;置換されてもよいアミノ基とカルボン酸基の対;置換されてもよいヒドラジンとアルデヒドもしくはケトン基の対;置換されてもよいヒドロキシルアミンとアルデヒドもしくはケトン基の対;求核剤と置換されてもよいハロゲン化アルキルの対;白金錯体;アルキル化剤;またはフラン修飾ヌクレオチド。
いくつかの態様では、光反応基には、以下が含まれる:インターカレート成分、ソラレン誘導体、置換されてもよいシアノビニルカルバゾール基(例えば、3-シアノビニルカルバゾール-1'-β-デオキシリボシド-5'-三リン酸などの3-シアノビニルカルバゾール基)、置換されてもよいビニルカルバゾール基(例えば、本明細書に記載されるような、アミドビニルカルバゾール基、カルボキシビニルカルバゾール基、またはC2-7アルコキシカルボニルビニルカルバゾール基)、置換されてもよいシアノビニル基、置換されてもよいアクリルアミド基、置換されてもよいジアジリン基、置換されてもよいベンゾフェノン、または置換されてもよいアジド基。
いくつかの態様では、インターカレート成分は、以下のものである:ソラレン誘導体(例えば、ソラレン、8-メトキシソラレン、または4-ヒドロキシメチル-4,5,8-トリメチル-ソラレン(HMT-ソラレン))、アルカロイド誘導体(例えば、ベルベリン、パルマチン、コラリン、サンギナリン(例えば、そのイミニウムもしくはアルカノールアミン形態、またはアリストロラクタム-β-D-グルコシド)、エチジウムカチオン(例えば、臭化エチジウム)、アクリジン誘導体(例えば、プロフラビン、アクリフラビン、またはアムサクリン)、アントラサイクリン誘導体(例えば、ドキソルビシン、エピルビシン、ダウノルビシン(ダウノマイシン)、イダルビシン、およびアクラルビシン)、またはサリドマイド。
いくつかの態様では、化学的リンケージは架橋性オリゴヌクレオチドを含み、ここで、架橋性オリゴヌクレオチドの5'末端の少なくとも5個のヌクレオチドの配列は、1つ以上のタグの3'末端の少なくとも5個のヌクレオチドの配列に相補的であるか、または相補的オリゴヌクレオチドへのハイブリダイゼーションを可能にするために同一であるかもしくは十分に類似し、かつ架橋性オリゴヌクレオチドの3'末端の少なくとも5個のヌクレオチドの配列は、1つ以上のタグの5'末端の少なくとも5個のヌクレオチドの配列に相補的であるか、または相補的オリゴヌクレオチドへのハイブリダイゼーションを可能にするために同一であるかもしくは十分に類似する。特定の態様では、1つ以上のタグの3'末端は3'-コネクタを含む。特定の態様では、1つ以上のタグの5'末端は5'-コネクタを含む。
いくつかの態様では、架橋性オリゴヌクレオチドの5'末端および/または3'末端は、可逆的な共反応基(例えば、本明細書に記載されるような、シアノビニルカルバゾール基、シアノビニル基、アクリルアミド基、チオール基、またはビニルスルホン基)を含む。
いくつかの態様では、3'-コネクタおよび/または5'-コネクタは、可逆的な共反応基(例えば、本明細書に記載されるような、シアノビニルカルバゾール基、シアノビニル基、アクリルアミド基、チオール基、またはビニルスルホン基)を含む。
上記の態様のいずれにおいても、ヘッドピース、テイルピース、第1タグ、1つ以上の追加のタグ、ライブラリー識別タグ、使用タグ、および/または起源タグは、存在する場合、約5〜約75ヌクレオチド(例えば、5〜7ヌクレオチド、5〜8ヌクレオチド、5〜9ヌクレオチド、5〜10ヌクレオチド、5〜11ヌクレオチド、5〜12ヌクレオチド、5〜13ヌクレオチド、5〜14ヌクレオチド、5〜15ヌクレオチド、5〜16ヌクレオチド、5〜17ヌクレオチド、5〜18ヌクレオチド、5〜19ヌクレオチド、5〜20ヌクレオチド、5〜30ヌクレオチド、5〜40ヌクレオチド、5〜50ヌクレオチド、5〜60ヌクレオチド、5〜70ヌクレオチド、6〜7ヌクレオチド、6〜8ヌクレオチド、6〜9ヌクレオチド、6〜10ヌクレオチド、6〜11ヌクレオチド、6〜12ヌクレオチド、6〜13ヌクレオチド、6〜14ヌクレオチド、6〜15ヌクレオチド、6〜16ヌクレオチド、6〜17ヌクレオチド、6〜18ヌクレオチド、6〜19ヌクレオチド、6〜20ヌクレオチド、7〜8ヌクレオチド、7〜9ヌクレオチド、7〜10ヌクレオチド、7〜11ヌクレオチド、7〜12ヌクレオチド、7〜13ヌクレオチド、7〜14ヌクレオチド、7〜15ヌクレオチド、7〜16ヌクレオチド、7〜17ヌクレオチド、7〜18ヌクレオチド、7〜19ヌクレオチド、7〜20ヌクレオチド、8〜9ヌクレオチド、8〜10ヌクレオチド、8〜11ヌクレオチド、8〜12ヌクレオチド、8〜13ヌクレオチド、8〜14ヌクレオチド、8〜15ヌクレオチド、8〜16ヌクレオチド、8〜17ヌクレオチド、8〜18ヌクレオチド、8〜19ヌクレオチド、8〜20ヌクレオチド、9〜10ヌクレオチド、9〜11ヌクレオチド、9〜12ヌクレオチド、9〜13ヌクレオチド、9〜14ヌクレオチド、9〜15ヌクレオチド、9〜16ヌクレオチド、9〜17ヌクレオチド、9〜18ヌクレオチド、9〜19ヌクレオチド、9〜20ヌクレオチド、10〜11ヌクレオチド、10〜12ヌクレオチド、10〜13ヌクレオチド、10〜14ヌクレオチド、10〜15ヌクレオチド、10〜16ヌクレオチド、10〜17ヌクレオチド、10〜18ヌクレオチド、10〜19ヌクレオチド、10〜20ヌクレオチド、10〜30ヌクレオチド、10〜40ヌクレオチド、10〜50ヌクレオチド、10〜60ヌクレオチド、10〜70ヌクレオチド、10〜75ヌクレオチド、11〜12ヌクレオチド、11〜13ヌクレオチド、11〜14ヌクレオチド、11〜15ヌクレオチド、11〜16ヌクレオチド、11〜17ヌクレオチド、11〜18ヌクレオチド、11〜19ヌクレオチド、11〜20ヌクレオチド、12〜13ヌクレオチド、12〜14ヌクレオチド、12〜15ヌクレオチド、12〜16ヌクレオチド、12〜17ヌクレオチド、12〜18ヌクレオチド、12〜19ヌクレオチド、12〜20ヌクレオチド、13〜14ヌクレオチド、13〜15ヌクレオチド、13〜16ヌクレオチド、13〜17ヌクレオチド、13〜18ヌクレオチド、13〜19ヌクレオチド、13〜20ヌクレオチド、14〜15ヌクレオチド、14〜16ヌクレオチド、14〜17ヌクレオチド、14〜18ヌクレオチド、14〜19ヌクレオチド、14〜20ヌクレオチド、15〜16ヌクレオチド、15〜17ヌクレオチド、15〜18ヌクレオチド、15〜19ヌクレオチド、15〜20ヌクレオチド、16〜17ヌクレオチド、16〜18ヌクレオチド、16〜19ヌクレオチド、16〜20ヌクレオチド、17〜18ヌクレオチド、17〜19ヌクレオチド、17〜20ヌクレオチド、18〜19ヌクレオチド、18〜20ヌクレオチド、19〜20ヌクレオチド、20〜30ヌクレオチド、20〜40ヌクレオチド、20〜50ヌクレオチド、20〜60ヌクレオチド、20〜70ヌクレオチド、20〜75ヌクレオチド、30〜40ヌクレオチド、30〜50ヌクレオチド、30〜60ヌクレオチド、30〜70ヌクレオチド、30〜75ヌクレオチド、40〜50ヌクレオチド、40〜60ヌクレオチド、40〜70ヌクレオチド、40〜75ヌクレオチド、50〜60ヌクレオチド、50〜70ヌクレオチド、50〜75ヌクレオチド、60〜70ヌクレオチド、60〜75ヌクレオチド、および70〜75ヌクレオチド)を含むことができる。特定の態様では、ヘッドピース、第1タグ、第2タグ、1つ以上の追加のタグ、ライブラリー識別タグ、使用タグ、および/または起源タグは、存在する場合、20ヌクレオチド未満(例えば、19ヌクレオチド未満、18ヌクレオチド未満、17ヌクレオチド未満、16ヌクレオチド未満、15ヌクレオチド未満、14ヌクレオチド未満、13ヌクレオチド未満、12ヌクレオチド未満、11ヌクレオチド未満、10ヌクレオチド未満、9ヌクレオチド未満、8ヌクレオチド未満、または7ヌクレオチド未満)の長さを有する。
上記の態様のいずれにおいても、コード配列(例えば、ヘッドピース、テイルピース、第1タグ、存在する場合、1つ以上の追加のタグ、ライブラリー識別タグ、使用タグ、および/または起源タグ)は、20ヌクレオチド超(例えば、25、30、35、40、45、50、55、60、65、70、または75ヌクレオチド超)を含むことができる。
定義
「約」とは、列挙された値の+/-10%を意味する。
「二官能性」とは、2つの化学部分の結合を可能にする2つの反応基をもつことを意味する。
「二官能性スペーサー」とは、複合体の化学物質とコード情報の結合を可能にする2つの反応基を有するスペーシング部分を意味する。1つの非限定的な例では、二官能性スペーサーは化学物質とタグの間に提供される。別の非限定的な例では、二官能性スペーサーは化学物質とヘッドピースの間に提供される。例示的な二官能性スペーサーは本明細書において提供される。
「結合」とは、共有結合または非共有結合で取り付けることを意味する。非共有結合には、ファンデルワールス力、水素結合、イオン結合、封入(entrapment)もしくは物理的カプセル化、吸収、吸着、および/または他の分子間力によって形成されるものが含まれる。結合は、酵素的結合(例えば、酵素的リンケージを提供するための酵素的ライゲーション)または化学的結合(例えば、化学的リンケージを提供するための化学的ライゲーション)などの、任意の有用な手段によって達成され得る。「ライゲーション」とは、共有結合で取り付けることを意味する。
「ビルディングブロック」とは、化学物質の構造単位を意味し、ここで、該単位は他の化学構造単位に直接連結されるか、または足場を介して間接的に連結される。化学物質がポリマーまたはオリゴマーである場合、ビルディングブロックはそのポリマーまたはオリゴマーのモノマー単位である。ビルディングブロックは、1つ以上の他のビルディングブロックまたは足場の付加を可能にする1つ以上の多様性ノード(diversity node)をもつことができる。ほとんどの場合、各多様性ノードは、化学物質を形成するために1つ以上のビルディングブロックまたは足場と反応することが可能な官能基である。一般的に、ビルディングブロックは少なくとも2つの多様性ノード(または反応性官能基)を有するが、一部のビルディングブロックは1つの多様性ノード(または反応性官能基)を有してもよい。あるいは、コード化された化学的または結合工程は、いくつかの化学成分を含むことができる(例えば、多成分縮合反応または多段階プロセス)。2つの異なるビルディングブロック上の反応基は、相補的であるべきであり、すなわち、共有結合または非共有結合を形成するために一緒に反応することが可能であるべきである。
「化学物質」とは、1つ以上のビルディングブロック、1つ以上の足場、または可逆的固定化のための1つの部位を含む、化合物を意味する。化学物質は、1つ以上の所望の特性、例えば、生物学的標的に結合する能力、溶解性、水素結合供与体および受容体の利用可能性、結合の回転自由度、正電荷、負電荷、または可逆的固定化のための部位など、を有するように設計または構築された、任意の小分子、ペプチド、核酸、ペプチド薬物または薬物候補であり得る。特定の態様では、化学物質は、二官能性または三官能性(またはそれ以上)の物質としてさらに反応させることができる。
「化学反応基」とは、モジュール反応に関与し、したがってリンケージをもたらす、反応基を意味する。例示的な反応および反応基には、以下から選択されるものが含まれる:置換されてもよいアルキニル基と置換されてもよいアジド基の対によるHuisgen 1,3-双極子環化付加反応;4π電子系を有する置換されてもよいジエンと2π電子系を有する置換されてもよいジエノフィルまたは置換されてもよいヘテロジエノフィルの対によるDiels-Alder反応;求核剤と歪のあるヘテロシクリル求電子剤との開環反応;ホスホロチオエート基とヨード基とのスプリントライゲーション反応;および本明細書に記載されるような、アルデヒド基とアミノ基との還元的アミノ化反応。
「相補的」とは、二次構造(核酸分子の二重鎖または二本鎖部分)を形成するために、本明細書で定義されるように、ハイブリダイズすることが可能な配列を意味する。相補性は完全である必要はなく、1、2、3個、またはそれ以上のヌクレオチドに1つ以上のミスマッチを含んでもよい。例えば、相補的な配列は、ワトソン-クリック塩基対合則(例えば、GとC、AとTまたはAとU)に従う水素結合または他の水素結合モチーフ(例えば、ジアミノプリンとT、5-メチルCとG、2-チオチミジンとA、イノシンとC、プソイドイソシトシンとG)を形成することができる核酸塩基を含みうる。配列およびその相補的配列は、同じオリゴヌクレオチド中または異なるオリゴヌクレオチド中に存在することができる。
「複合体」または「ライゲーションされた複合体」とは、共有結合または非共有結合によって化学物質および/または1つ以上のオリゴヌクレオチドタグと機能的に結び付いているヘッドピースを意味する。複合体は、任意で、化学物質とヘッドピースの間に二官能性スペーサーを含んでもよい。
化学物質の「構成成分」とは、足場またはビルディングブロックのいずれかを意味する。
オリゴヌクレオチドタグの「コネクタ」とは、固定された配列を有する、5'もしくは3'末端にあるまたは該末端に近接したタグの部分を意味する。5'-コネクタはオリゴヌクレオチドの5'末端にまたはそれに近接して配置され、3'-コネクタはオリゴヌクレオチドの3'末端にまたはそれに近接して配置される。複合体中に存在する場合、各5'-コネクタは同じでも異なってもよく、かつ各3'-コネクタは同じでも異なってもよい。複数のタグを有する例示的で非限定的な複合体では、各タグは5'-コネクタと3'-コネクタを含むことができ、その場合、各5'-コネクタは同じ配列を有し、各3'-コネクタは同じ配列を有する(例えば、その場合、5'-コネクタの配列は3'-コネクタの配列と同じでも異なってもよい)。別の例示的で非限定的な複合体では、5'-コネクタの配列は、本明細書で定義されるように、3'-コネクタの配列に相補的であるように(例えば、5'-および3'-コネクタ間のハイブリダイゼーションを可能にするように)設計される。コネクタは、任意で、リンケージ(例えば、ポリメラーゼが読み通すまたは通過して移動する能力が低下しているリンケージ、例えば化学的リンケージ)を可能にする1個以上の基を含んでいてもよい。
「定常」または「固定された定常」配列とは、情報をコードしないオリゴヌクレオチドの配列を意味する。定常配列を有する複合体の非限定的で例示的な部分には、プライマー結合領域、5'-コネクタ、または3'-コネクタが含まれる。本発明のヘッドピースは、情報をコードするもの(つまり、タグ)、あるいは情報をコードしないもの(つまり、定常配列)であり得る。同様に、本発明のテイルピースは、情報をコードしても、コードしなくてもよい。
「架橋性オリゴヌクレオチド」とは、複合体中の2つの隣接するタグ間の特定の接合部で、本明細書で定義されるように、機能的に結び付くオリゴヌクレオチドを意味する。非限定的な例では、架橋性オリゴヌクレオチドの一端は、第1タグの3'-コネクタにハイブリダイズし、架橋性オリゴヌクレオチドの他端は、第1タグに隣接する第2タグの5'-コネクタにハイブリダイズする。架橋性オリゴヌクレオチドの例示的で非限定的な態様は、隣接するタグまたは隣接するタグのコネクタと機能的に結び付く1つ以上の反応基(例えば、化学反応基、光反応基、インターカレート部分、もしくは可逆的共反応基、または本明細書に記載のいずれか)を有するものを含む。
「多様性ノード」とは、別のビルディングブロックの付加を可能にする、足場またはビルディングブロック内の位置にある官能基を意味する。
「ヘッドピース」とは、第1化学物質の構成成分に、タグ、例えば出発オリゴヌクレオチドに、および、可逆的固定化のための部位を含む第2化学物質に、機能的に連結される、ライブラリー合成のための化学構造を意味する。任意で、ヘッドピースはヌクレオチドをほとんどまたは全く含まなくてよいが、機能的に結び付くことができる個所を提供し得る。任意で、二官能性スペーサーがヘッドピースを構成成分に接続する。
「ハイブリダイズする」とは、さまざまなストリンジェンシー条件下で、相補的オリゴヌクレオチドまたはその部分間で二本鎖分子を形成するために対合することを意味する。(例えば、Wahl, G. M. and S. L. Berger (1987) Methods Enzymol. 152:399; Kimmel, A. R. (1987) Methods Enzymol. 152:507を参照されたい。)例えば、高ストリンジェンシーハイブリダイゼーションは、通常は約750mM NaClおよび75mMクエン酸三ナトリウムより低い、約500mM NaClおよび50mMクエン酸三ナトリウムより低い、または約250mM NaClおよび25mMクエン酸三ナトリウムより低い塩濃度により得ることができる。低ストリンジェンシーハイブリダイゼーションは、有機溶媒、例えばホルムアミドの非存在下で得られるが、高ストリンジェンシーハイブリダイゼーションは、少なくとも約35%のホルムアミドまたは少なくとも約50%のホルムアミドの存在下で得られる。高ストリンジェンシーハイブリダイゼーションの温度条件には、通常、少なくとも約30℃、37℃、または42℃の温度が含まれる。例えば、ハイブリダイゼーション時間、ドデシル硫酸ナトリウム(SDS)などの界面活性剤の濃度、およびキャリアDNAの包含または除外などの、追加のパラメータを変化させることは、当業者に周知である。ストリンジェンシーのさまざまなレベルは、必要に応じて、これらの種々の条件を組み合わせることによって達成される。一態様では、ハイブリダイゼーションは、750mM NaCl、75mMクエン酸三ナトリウム、および1%SDS中で30℃にて起こる。他の態様では、ハイブリダイゼーションは、500mM NaCl、50mM クエン酸三ナトリウム、1%SDS、35%ホルムアミド、および100μg/ml変性サケ精子DNA(ssDNA)中で37℃にて起こる。さらに他の態様では、ハイブリダイゼーションは、250mM NaCl、25mM クエン酸三ナトリウム、1%SDS、50%ホルムアミド、および200μg/ml ssDNA中で42℃にて起こる。これらの条件の有用な変更は、当業者には容易に明らかであろう。
ほとんどの適用では、ハイブリダイゼーションに続く洗浄工程もまた、ストリンジェンシーの点で異なってくる。洗浄のストリンジェンシー条件は塩濃度と温度によって規定され得る。上記のように、洗浄ストリンジェンシーは、塩濃度を低下させることによって、または温度を上昇させることによって高めることができる。例えば、洗浄工程のための高ストリンジェンシーの塩濃度は、例えば、約30mM NaClおよび3mMクエン酸三ナトリウムより低い、または約15mM NaClおよび1.5mMクエン酸三ナトリウムより低くてよい。洗浄工程のための高ストリンジェンシーの温度条件には、通常、例えば、少なくとも約25℃、42℃、または68℃の温度が含まれる。一態様では、洗浄工程は、30mM NaCl、3mMクエン酸三ナトリウム、および0.1%SDS中で25℃にて起こる。他の態様では、洗浄工程は、15mM NaCl、1.5mMクエン酸三ナトリウム、および0.1%SDS中で42℃にて起こる。さらに他の態様では、洗浄工程は、15mM NaCl、1.5mMクエン酸三ナトリウム、および0.1%SDS中で68℃にて起こる。これらの条件のさらなる変更は、当業者には容易に明らかであろう。ハイブリダイゼーション技術は当業者に周知であり、例えば、以下に記載されている:Benton and Davis (Science 196:180, 1977); Grunstein and Hogness (Proc. Natl. Acad. Sci., USA 72:3961, 1975); Ausubel et al. (Current Protocols in Molecular Biology, Wiley Interscience, New York, 2001); Berger and Kimmel (Guide to Molecular Cloning Techniques, 1987, Academic Press, New York); およびSambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, New York。
「インターカレート部分(intercalating moiety)」とは、2つ以上のヌクレオチド間への部分(moiety)の介在をもたらす反応基を意味する。非限定的な例では、インターカレート部分は1つ以上のヌクレオチドと反応して、二重鎖または三重鎖オリゴヌクレオチド間に鎖間または鎖内架橋を形成する。例示的で非限定的なインターカレート部分は本明細書に記載される。
「接合部」とは、複合体中の2つの隣接するタグ間のニック(ヌクレオチド間結合の欠如)またはギャップ(1つ以上のヌクレオチドの欠失)を意味する。接合部はまた、2つの隣接するタグ中に存在する2つの隣接するコネクタ間(例えば、第1タグの3'-コネクタと、第1タグに隣接する第2タグの5'-コネクタの間)であり得る。
「ライブラリー」とは、分子または化学物質のコレクションを意味する。任意で、分子または化学物質は、分子または化学物質の部分をコードする1つ以上のオリゴヌクレオチドに結合される。
「リンケージ」とは、2つ以上の化学構造を機能的に結び付けることを可能にする化学的接続要素を意味し、その場合、リンケージは、ヘッドピースと1つ以上のタグの間、2つのタグの間、またはタグとテイルピースの間に存在する。化学的接続要素は、非共有結合(例えば、本明細書に記載される)、共有結合、または2つの官能基間の反応生成物であり得る。「化学的リンケージ」とは、一リン酸とヒドロキシル基のような2つの官能基間の非酵素的な化学反応により形成されるリンケージを意味する。例示的で非限定的な官能基には、化学反応基、光反応基、インターカレート部分、または架橋性オリゴヌクレオチド(例えば、本明細書に記載のもの)が含まれる。「酵素的リンケージ」とは、酵素によって形成されるヌクレオチド間またはヌクレオシド間リンケージを意味する。例示的で非限定的な酵素には、キナーゼ、ポリメラーゼ、リガーゼ、またはこれらの組み合わせが含まれる。「ポリメラーゼが読み通すまたは通過して移動する能力が低下している」リンケージとは、該リンケージを欠く対照オリゴヌクレオチドと比較して、該リンケージが、オリゴヌクレオチド鋳型中に存在するとき、ポリメラーゼによる伸長産物および/または増幅産物の減量をもたらすことを意味する。そのようなリンケージを決定するための例示的で非限定的な方法には、PCR分析(例えば、定量PCR)、RT-PCR分析、液体クロマトグラフィー-質量分析、配列デモグラフィックス(sequence demographics)、または他の方法により評価されるプライマー伸長が含まれる例示的で非限定的なポリメラーゼとしては、以下が挙げられる:DNAポリメラーゼおよびRNAポリメラーゼ、例えばDNAポリメラーゼI、DNAポリメラーゼII、DNAポリメラーゼIII、DNAポリメラーゼVI、Taq DNAポリメラーゼ、Deep VentR(商標) DNAポリメラーゼ(New England Biolabs社から入手可能な高忠実度好熱性DNAポリメラーゼ)、T7 DNAポリメラーゼ、T4 DNAポリメラーゼ、RNAポリメラーゼI、RNAポリメラーゼII、RNAポリメラーゼIII、またはT7 RNAポリメラーゼ。
「多価カチオン」とは、複数のリガンドまたはアニオンと複数の結合を形成することが可能なカチオンを意味する。多価カチオンは、イオン性錯体または配位錯体のいずれかを形成することができる。例示的な多価カチオンには、アルカリ土類金属(例:マグネシウム)および遷移金属(例:マンガン(II)もしくはコバルト(III))からのもの、ならびに1つ以上のアニオンおよび/または1つ以上の1価もしくは多座配位子、例えば塩化物、アミンおよび/またはエチレンジアミンなど、と任意に結合されるものが含まれる。
「オリゴヌクレオチド」とは、5'末端、3'末端、および5'末端と3'末端の間の内部位置に1個以上のヌクレオチドを有するヌクレオチドのポリマーを意味する。オリゴヌクレオチドは、DNA、RNA、または合成することが可能で、塩基対認識のために使用することが可能な、当技術分野で知られたそれらの誘導体を含むことができる。オリゴヌクレオチドは連続した塩基をもつ必要はなく、リンカー部分が介在してもよい。オリゴヌクレオチドポリマーおよびヌクレオチド(例えば、修飾DNAまたはRNA)は、以下を含むことができる:天然の塩基(例えば、アデノシン、チミジン、グアノシン、シチジン、ウリジン、デオキシアデノシン、デオキシチミジン、デオキシグアノシン、デオキシシチジン、イノシン、またはジアミノプリン)、塩基アナログ(例えば、2-アミノアデノシン、2-チオチミジン、イノシン、ピロロピリミジン、3-メチルアデノシン、C5-プロピニルシチジン、C5-プロピニルウリジン、C5-ブロモウリジン、C5-フルオロウリジン、C5-ヨードウリジン、C5-メチルシチジン、7-デアザアデノシン、7-デアザグアノシン、8-オキソアデノシン、8-オキソグアノシン、O(6)-メチルグアニン、および2-チオシチジン)、修飾塩基(例えば、2'-置換ヌクレオチド、例えば2'-O-メチル化塩基および2'-フルオロ塩基)、インターカレートされた塩基、修飾された糖(例えば、2'-フルオロリボース、リボース、2'-デオキシリボース、アラビノース、ヘキソース、アンヒドロヘキシトール、アルトリトール、マンニトール、シクロヘキサニル、シクロヘキセニル、オスホルアミデート骨格をも有するモルホリノ、ロックド核酸(LNA、例えば、この場合、リボースの2'-ヒドロキシルは同じリボース糖の4'-炭素にC1-6アルキレンまたはC1-6ヘテロアルキレン橋によって接続されており、ここで、例示的な橋には、メチレン、プロピレン、エーテル、またはアミノ橋が含まれる)、グリコール核酸(GNA、例えばR-GNAまたはS-GNA、この場合、リボースはホスホジエステル結合に結合されたグリコール単位により置き換えられる)、トレオース核酸(TNA、この場合、リボースはα-L-トレオフラノシル-(3'→2')で置き換えられる)、および/またはリボース中の酸素の(例えば、S、Se、またはアルキレン、例えばメチレンもしくはエチレンとの)交換、修飾された骨格(例えば、ペプチド核酸(PNA)、この場合、2-アミノ-エチル-グリシンリンケージがリボースおよびホスホジエステル骨格に取って代わる)、および/または修飾リン酸基(例えば、ホスホロチオエート、5'-N-ホスホルアミダイト、ホスホロセレネート、ボラノリン酸、ボラノリン酸エステル、水素ホスホネート、ホスホルアミデート、ホスホロジアミデート、アルキルまたはアリールホスホネート、ホスホトリエステル、架橋ホスホルアミデート、架橋ホスホロチオエート、および架橋メチレン-ホスホネート)。オリゴヌクレオチドは、一本鎖(例えば、ヘアピン)、二本鎖であってよく、または他の二次もしくは三次構造(例えば、ステム-ループ構造、二重らせん、三重らせん、四重らせんなど)をもつことができる。オリゴヌクレオチドはまた、1つ以上の3'-3'リンケージもしくは5'-5'リンケージ、または1つ以上の逆方向ヌクレオチドを含むことができる。これは、それらが2つの3'末端または2つの5'末端を含むことを意味し得る。オリゴヌクレオチドはまた、1回以上分岐していてもよく、この場合には、それらは3つ以上の末端を含むことができる。オリゴヌクレオチドはまた、環状化されていてもよく、この場合には、それらは2つより少ない末端を含み、末端を全く含まなくてもよい。
「結合対の一方のメンバー」とは、可逆的固定化のための別の相補的化学物質と対を形成することができる化学物質を意味する(例えば、核酸、ペプチド、または小分子)。
「機能的に連結された」または「機能的に結び付いた」とは、2つ以上の化学構造が、それらが受けると予想される各種の操作を介して連結されたままであるような方法で、直接または間接的に一緒に連結されることを意味する。典型的には、化学物質とヘッドピースは間接的な方法で(例えば、適切なスペーサーを介して共有結合で)機能的に結び付いている。例えば、スペーサーは、化学物質のための結合部位とヘッドピースのための結合部位を有する二官能性の部分であり得る。
「ホスホジエステルリンケージ」とは、構造:
を含むリンケージを意味する。
「ホスホネートリンケージ」とは、構造:
を含むリンケージを意味する。
「ホスホロチオエートリンケージ」とは、構造:
を含むリンケージを意味する。
「光反応基」とは、紫外線、可視光線、または赤外線の吸収によって引き起こされる反応に関与し、したがってリンケージを生成する、反応基を意味する。例示的で非限定的な光反応基は本明細書に記載される。
「保護基」とは、オリゴヌクレオチドコード化ライブラリーを作成し、タグ付けし、または使用する1つ以上の結合工程において望ましくない反応からオリゴヌクレオチドの3'末端もしくは5'末端を保護すること、または化学物質、足場、もしくはビルディングブロックの1つ以上の官能基を保護することを意図した基を意味する。一般的に使用される保護基は、Greene, "Protective Groups in Organic Synthesis," 第4版(John Wiley & Sons, New York, 2007)に開示されており、これは参照により本明細書に組み入れられる。オリゴヌクレオチドのための例示的な保護基としては、以下が挙げられる:不可逆的な保護基、例えば、ジデオキシヌクレオチドおよびジデオキシヌクレオシド(ddNTPまたはddN)、より好ましくは、ヒドロキシル基のための可逆的な保護基、例えば、エステル基(例:O-(α-メトキシエチル)エステル、O-イソバレリルエステル、およびO-レブリニルエステル)、トリチル基(例:ジメトキシトリチルおよびモノメトキシトリチル)、キサンテニル基(例:9-フェニルキサンテン-9-イルおよび9-(p-メトキシフェニル)キサンテン-9-イル)、アシル基(例:フェノキシアセチルおよびアセチル)、ならびにシリル基(例:t-ブチルジメチルシリル)。化学物質、足場、およびビルディングブロックのための例示的で非限定的な保護基としては、以下が挙げられる:合成手順中の望ましくない反応からアミノ基を保護するためのN-保護基(例えば、アシル;アリーロイル(aryloyl);カルバミル基、例えばホルミル、アセチル、プロピオニル、ピバロイル、t-ブチルアセチル、2-クロロアセチル、2-ブロモアセチル、トリフルオロアセチル、トリクロロアセチル、フタリル、o-ニトロフェノキシアセチル、α-クロロブチリル、ベンゾイル、4-クロロベンゾイル、4-ブロモベンゾイル、4-ニトロベンゾイル、およびキラル補助基、例えば保護または非保護D、LまたはD,L-アミノ酸、例えばアラニン、ロイシン、フェニルアラニン;スルホニル含有基、例えばベンゼンスルホニル、p-トルエンスルホニル;カルバメート形成基、例えばベンジルオキシカルボニル、p-クロロベンジルオキシカルボニル、p-メトキシベンジルオキシカルボニル、p-ニトロベンジルオキシカルボニル、2-ニトロベンジルオキシカルボニル、p-ブロモベンジルオキシカルボニル、3,4-ジメトキシベンジルオキシカルボニル、3,5-ジメトキシベンジルオキシカルボニル、2,4-ジメトキシベンジルオキシカルボニル、4-メトキシベンジルオキシカルボニル、2-ニトロ-4,5-ジメトキシベンジルオキシカルボニル、3,4,5-トリメトキシベンジルオキシカルボニル、1-(p-ビフェニリル)-1-メチルエトキシカルボニル、α,α-ジメチル-3,5-ジメトキシベンジルオキシカルボニル、ベンズヒドリルオキシカルボニル、t-ブチルオキシカルボニル、ジイソプロピルメトキシカルボニル、イソプロピルオキシカルボニル、エトキシカルボニル、メトキシカルボニル、アリルオキシカルボニル、2,2,2,-トリクロロエトキシカルボニル、フェノキシカルボニル、4-ニトロフェノキシカルボニル、フルオレニル-9-メトキシカルボニル、シクロペンチルオキシカルボニル、アダマンチルオキシカルボニル、シクロヘキシルオキシカルボニル、フェニルチオカルボニル;アルカリル基、例えばベンジル、トリフェニルメチル、ベンジルオキシメチル;およびシリル基、例えばトリメチルシリル;ここで、好ましいN-保護基はホルミル、アセチル、ベンゾイル、ピバロイル、t-ブチルアセチル、アラニル、フェニルスルホニル、ベンジル、t-ブチルオキシカルボニル(Boc)、およびベンジルオキシカルボニル(Cbz)である);合成手順中の望ましくない反応からヒドロキシル基を保護するためのO-保護基(例えば、アルキルカルボニル基、例えばアシル、アセチル、ピバロイル;置換されてもよいアリールカルボニル基、例えばベンゾイル;シリル基、例えばトリメチルシリル(TMS)、tert-ブチルジメチルシリル(TBDMS)、トリイソプロピルシリルオキシメチル(TOM)、トリイソプロピルシリル(TIPS);ヒドロキシルとのエーテル形成基、例えばメチル、メトキシメチル、テトラヒドロピラニル、ベンジル、p-メトキシベンジル、トリチル;アルコキシカルボニル、例えばメトキシカルボニル、エトキシカルボニル、イソプロポキシカルボニル、n-プロポキシカルボニル、n-ブチロキシカルボニル、イソブチロキシカルボニル、sec-ブチロキシカルボニル、t-ブチロキシカルボニル、2-エチルヘキシルオキシカルボニル、シクロヘキシルオキシカルボニル、メチルオキシカルボニル;アルコキシアルコキシカルボニル基、例えばメトキシメトキシカルボニル、エトキシメトキシカルボニル、2-メトキシエトキシカルボニル、2-エトキシエトキシカルボニル、2-ブトキシエトキシカルボニル、2-メトキシエトキシメトキシカルボニル、アリルオキシカルボニル、プロパルギルオキシカルボニル、2-ブテノキシカルボニル、3-メチル-2-ブテノキシカルボニル;ハロアルコキシカルボニル、例えば2-クロロエトキシカルボニル、2-クロロエトキシカルボニル、2,2,2-トリクロロエトキシカルボニル;置換されてもよいアリールアルコキシカルボニル基、例えばベンジルオキシカルボニル、p-メチルベンジルオキシカルボニル、p-メトキシベンジルオキシカルボニル、p-ニトロベンジルオキシカルボニル、2,4-ジニトロベンジルオキシカルボニル、3,5-ジメチルベンジルオキシカルボニル、p-クロロベンジルオキシカルボニル、p-ブロモベンジルオキシカルボニル;および置換されてもよいアリールオキシカルボニル基、例えばフェノキシカルボニル、p-ニトロフェノキシカルボニル、o-ニトロフェノキシカルボニル、2,4-ジニトロフェノキシカルボニル、p-メチルフェノキシカルボニル、m-メチルフェノキシカルボニル、o-ブロモフェノキシカルボニル、3,5-ジメチルフェノキシカルボニル、p-クロロフェノキシカルボニル、2-クロロ-4-ニトロフェノキシカルボニル);カルボニル保護基(例えば、アセタールおよびケタール基、例えばジメチルアセタール、1,3-ジオキソラン;アシラール(acylal)基;およびジチアン基、例えば1,3-ジチアン、1,3-ジチオラン);カルボン酸保護基(例えば、エステル基、例えばメチルエステル、ベンジルエステル、t-ブチルエステル、オルトエステル;シリル基、例えばトリメチルシリル、ならびに本明細書に記載されるいずれか;およびオキサゾリン基);およびリン酸保護基(例えば、置換されてもよいエステル基、例えばメチルエステル、イソプロピルエステル、2-シアノエチルエステル、アリルエステル、t-ブチルエステル、ベンジルエステル、フルオレニルメチルエステル、2-(トリメチルシリル)エチルエステル、2-(メチルスルホニル)エチルエステル、2,2,2-トリクロロエチルエステル、3',5'-ジメトキシベンゾインエステル、p-ヒドロキシフェナシルエステル)。
オリゴヌクレオチドの末端に「近接」または「近接する」とは、他の残りの末端よりも記載した末端に近いまたは接近していることを意味する。例えば、オリゴヌクレオチドの3'末端に近接する部分または基は、5'末端よりも3'末端に近いか、接近している。特定の態様では、オリゴヌクレオチドの3'末端に近接する部分または基は、3'末端から1、2、3、4、5、6、7、8、9、10、15個、またはそれ以上のヌクレオチドである。他の態様では、オリゴヌクレオチドの5'末端に近接する部分または基は、5'末端から1、2、3、4、5、6、7、8、9、10、15個、またはそれ以上のヌクレオチドである。
「精製」とは、連続した工程で使用される化学物質または生物学的物質の活性を低下させうる、反応混合物中に存在する未反応生成物または剤を除去することを意味する。精製は、除去すべき未反応生成物または試薬のクロマトグラフィー分離、電気泳動分離、および沈殿の1つ以上を含むことができる。精製はまた、溶媒の除去を含んでもよい。
「可逆的共反応基」とは、可逆的反応に関与する反応基を意味する。例示的で非限定的な反応基には光反応基が含まれ、この場合、特定の吸収放射線への暴露は、結果的に光反応基間のリンケージをもたらし、異なる特定の吸収放射線への暴露は、形成されたリンケージの開裂をもたらす(例えば、シアノビニルカルバゾール基、シアノビニル基、およびアクリルアミド基)。別の例示的で非限定的な反応基には、レドックス反応基が含まれ、この場合には、そのような基が可逆的に還元または酸化され得る(例えば、チオール基)。
「可逆的固定化」とは、穏和な条件下で支持体からの脱着を可能にする様式(例えば、吸着、イオン結合、親和性結合、キレート化、ジスルフィド結合形成、オリゴヌクレオチドハイブリダイゼーション、小分子-小分子相互作用、可逆的化学、タンパク質-タンパク質相互作用、および疎水性相互作用)で複合体を固定化することを意味する。
「足場」(scaffold)とは、特有の幾何学的配置で1つ以上の多様性ノードを表示する化学的部分(chemical moiety)を意味する。多様性ノードは、典型的には、ライブラリー合成中に足場に取り付けられるが、場合によって、1つの多様性ノードはライブラリー合成(例えば、1つ以上のビルディングブロックおよび/または1つ以上のタグの付加)の前に足場に取り付けてもよい。いくつかの態様では、足場は誘導体化されており、その結果、それはライブラリー合成中にオルソゴナルに脱保護され、続いて異なる多様性ノードと反応させることができる。
「小分子」薬物または「小分子」薬物候補とは、約1,000ダルトン未満の分子量を有する分子を意味する。小分子は、有機もしくは無機であってよく、(例えば、化合物ライブラリーもしくは天然源から)単離することができるか、または既知化合物の誘導体化によって得ることができる。
「実質的な同一性」または「実質的に同一」とは、参照配列と同じポリペプチドもしくはポリヌクレオチド配列を有するか、または2つの配列が最適にアライメントされたときに参照配列内の対応する位置で同一であるアミノ酸残基またはヌクレオチドの特定の割合を有する、それぞれ、ポリペプチドまたはポリヌクレオチド配列を意味する。例えば、参照配列に「実質的に同一」であるアミノ酸配列は、参照アミノ酸配列に対して少なくとも50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、または100%の同一性を有する。ポリペプチドについて、比較配列の長さは、一般に、少なくとも5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個連続するアミノ酸、より好ましくは、少なくとも25、50、75、90、100、150、200、250、300、または350個連続するアミノ酸、最も好ましくは、完全長のアミノ酸配列であろう。核酸については、比較配列の長さは、一般に、少なくとも5個連続するヌクレオチド、好ましくは、少なくとも10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25個連続するヌクレオチド、最も好ましくは、完全長のヌクレオチド配列であろう。配列同一性は、配列解析ソフトウェアをデフォルト設定で用いて測定することができる(例えば、Genetics Computer Group (University of Wisconsin Biotechnology Center, 1710 University Avenue, Madison, WI 53705)の配列解析ソフトウェアパッケージ)。このようなソフトウェアは、種々の置換、欠失、および他の改変に対して相同性の程度を割り当てることによって、類似の配列を照会することができる。
「実質的に」とは、対象となる特性または性質の全体的またはほぼ全体的な範囲もしくは程度を示す質的状態を意味する。生物学分野の当業者であれば、生物学的および化学的現象が完了まで進むことおよび/または完全性へと向かうこと、あるいは絶対的な結果を達成または回避することは、皆無ではないにしても、めったにないことを理解していよう。したがって、本明細書では、用語「実質的に」は、多くの生物学的および化学的現象に本来備わっている潜在的な完全性の欠如を捕捉するために使用される。
「タグ」または「オリゴヌクレオチドタグ」とは、ライブラリーのオリゴヌクレオチド部分を意味し、その少なくとも一部が情報をコードする。このような情報の非限定的な例には、構成成分(すなわち、足場またはビルディングブロック、それぞれ、足場タグまたはビルディングブロックタグと同様)の付加(例えば、結合反応による)、ライブラリー内のヘッドピース、ライブラリーのアイデンティティ(すなわち、アイデンティティタグと同様)、ライブラリーの使用(すなわち、使用タグと同様)、および/またはライブラリーメンバーの起源(すなわち、起源タグと同様)が含まれる。タグセットは任意で、等しいまたはほぼ等しい質量のタグで構成されていてもよく、それによって、質量分析によるライブラリーの分析的評価が促進される。
「テイルピース」とは、先行するタグのすべてを付加した後に複合体に取り付けられ、かつライブラリーのアイデンティティ、ライブラリーの使用、および/またはライブラリーメンバーの起源をコードする、ライブラリーのオリゴヌクレオチド部分を意味する。
「プライマー」とは、オリゴヌクレオチド鋳型にアニーリングすることが可能で、その後鋳型依存的にポリメラーゼにより伸長され得る、オリゴヌクレオチドを意味する。
本発明の他の特徴および利点は、以下の詳細な説明および特許請求の範囲から明らかになるであろう。
詳細な説明
コード化された化学物質
本発明は、化学物質と、1つ以上のタグと、該第1化学物質および1つ以上のタグに機能的に結び付いたヘッドピースとを含むコード化された化学物質を生成する方法を特徴とする。化学物質、ヘッドピース、タグ、リンケージ、および二官能性スペーサーは、以下でさらに説明される。
化学物質
本発明の化学物質またはメンバー(例えば、小分子またはペプチド)は1つ以上のビルディングブロックを含むことができ、任意で1つ以上の足場を含んでもよい。
足場Sは、単原子または分子足場とすることができる。例示的な単原子足場としては、炭素原子、ホウ素原子、窒素原子、またはリン原子などが挙げられる。例示的な多原子足場としては、シクロアルキル基、シクロアルケニル基、ヘテロシクロアルキル基、ヘテロシクロアルケニル基、アリール基、またはヘテロアリール基が挙げられる。ヘテロアリール足場の特定の例としては、以下が挙げられる:トリアジン、例えば1,3,5-トリアジン、1,2,3-トリアジン、もしくは1,2,4-トリアジン;ピリミジン;ピラジン;ピリダジン;フラン;ピロール;ピロリン;ピロリジン;オキサゾール;ピラゾール;イソオキサゾール;ピラン;ピリジン;インドール;インダゾール;またはプリン。
足場Sは、いずれかの有用な方法でタグに機能的に連結され得る。一例では、Sはヘッドピースに直接連結されるトリアジンである。この例示的な足場を得るために、トリクロロトリアジン(すなわち、3個の塩素を有するトリアジンの塩素化前駆体)をヘッドピースの求核基と反応させる。この方法を用いると、Sには、置換のために利用可能な塩素を有する3つの位置があり、そのうち2つの位置は多様性ノードに利用され、1つの位置はヘッドピースに取り付けられる。次に、ビルディングブロックAnが足場の多様性ノードに付加され、ビルディングブロックAnをコードするタグAn(「タグAn」)がヘッドピースにライゲーションされ、その際、これらの2工程は任意の順序で実施することができる。その後、ビルディングブロックBnが残りの多様性ノードに付加され、ビルディングブロックBnをコードするタグBnがタグAnの末端部にライゲーションされる。別の例では、Sはタグに機能的に連結されるトリアジンであり、この場合は、トリクロロトリアジンをタグのPEG、脂肪族、または芳香族リンカーの求核基(例えば、アミノ基)と反応させる。ビルディングブロックおよび関連するタグは、上記のように付加することができる。
さらに別の例では、SはビルディングブロックAnに機能的に連結されるトリアジンである。この足場を得るために、2つの多様性ノード(例えば、求電子基と求核基、Fmoc-アミノ酸など)を有するビルディングブロックAnをリンカーの求核基(例えば、ヘッドピースに取り付けられる、PEG、脂肪族、または芳香族リンカーの末端基)と反応させる。その後、トリクロロトリアジンをビルディングブロックAnの求核基と反応させる。この方法を用いると、Sの3つすべての塩素位置が、ビルディングブロックのための多様性ノードとして使用される。本明細書に記載されるように、追加のビルディングブロックおよびタグを付加することができ、また、追加の足場Snを付加することができる。
例示的なビルディングブロックAnには、例えば、アミノ酸(例:α-、β-、γ-、δ-、およびε-アミノ酸、ならびに天然および非天然アミノ酸の誘導体)、アミンと化学反応性の反応物(例:アジドまたはアルキン鎖)、チオール反応物、またはこれらの組み合わせが含まれる。ビルディングブロックAnの選択は、例えば、リンカー中で用いられる反応基の性質、足場部分の性質、および化学合成に用いられる溶媒に依存する。
例示的なビルディングブロックBnおよびCnとしては、例えば以下のような、化学物質の有用な構造単位が挙げられる:置換されてもよい芳香族基(例:置換されてもよいフェニルまたはベンジル)、置換されてもよいヘテロシクリル基(例:置換されてもよいキノリニル、イソキノリニル、インドリル、イソインドリル、アザインドリル、ベンズイミダゾリル、アザベンズイミダゾリル、ベンズイソオキサゾリル、ピリジニル、ピペリジニル、またはピロリジニル)、置換されてもよいアルキル基(例:置換されてもよい直鎖もしくは分岐鎖C1-6アルキル基または置換されてもよいC1-6アミノアルキル基)、または置換されてもよいカルボシクリル基(例:置換されてもよいシクロプロピル、シクロヘキシル、もしくはシクロヘキセニル)。特に有用なビルディングブロックBnおよびCnには、1つ以上の反応基をもつもの、例えば、反応基であるかまたは反応基を形成するように化学的に改変され得る1つもしくは任意の置換基を有する、置換されてもよい基(例えば、本明細書に記載のいずれか)が含まれる。例示的な反応基としては、以下の1つ以上が挙げられる:アミン(-NR2、ここで各Rは、独立して、Hまたは置換されてもよいC1-6アルキル)、ヒドロキシ、アルコキシ(-OR、ここでRは置換されてもよいC1-6アルキルである、例えばメトキシなど)、カルボキシ(-COOH)、アミド、または化学反応性の置換基。制限部位が、例えばタグBnまたはCnに、導入されてもよく、その場合、複合体は、PCRおよび対応する制限酵素の1つによる制限消化を行うことによって同定され得る。
可逆的固定化のための部位
いくつかの態様では、コード化された化学物質は、可逆的固定化のための部位を任意に含む。可逆的固定化は、コード化ライブラリーのスプリット・アンド・ミックス合成の間の緩衝液交換および試薬/混入物の除去を容易にするために利用され得る。例えば、最初の化学物質にビルディングブロックを付加する化学反応の後、その複合体を可逆的に固定化する。次いで、過剰の試薬と溶媒を除去し、ライゲーション反応用の試薬と溶媒を加え、その後、該複合体を支持体から脱着することができる。この方法は、精製の容易さおよび/または後続の工程に適合しない溶媒と試薬の除去といった、固相合成(solid supported synthesis)の利点を取り入れる一方で、該ライブラリーおよびオリゴヌクレオチドタグの構築に使用される工程を溶液中で、あるいは新生ライブラリーが可逆的に固定されている間に、実施することを可能にする。
典型的な可逆的固定化戦略には、以下が含まれる:二本鎖および三本鎖を含めて、置換オリゴヌクレオチド(2'-修飾、PNA、LNAなど)を含むオリゴヌクレオチドのハイブリダイゼーション;オリゴヌクレオチド-イオン交換相互作用(例えば、DEAE-セルロースによる);小分子-小分子相互作用(例えば、アダマンタン-シクロデキストリン);可逆的化学(例えば、ジスルフィド結合の形成);可逆的光化学(例えば、シアノビニルウリジン光架橋);可逆的化学架橋(例えば、外部から加えられる反応性物質を使用);固定化金属アフィニティークロマトグラフィー(例えば、His6を用いる固定化Ni-NTA);抗体-エピトープ相互作用(例えば、固定化抗FLAG抗体およびFLAGペプチド);タンパク質-タンパク質相互作用;タンパク質-小分子相互作用(例えば、固定化ストレプトアビジンとイミノビオチンまたは固定化マルトース結合タンパク質とマルトース);可逆的オリゴヌクレオチドライゲーション(例えば、制限されたdsDNAのライゲーションとその後の制限);および疎水性相互作用(例えば、フルオラス(fluorous)タグと疎水性表面)。いくつかの態様では、可逆的固定化のための部位は、本明細書に記載の可逆的固定化戦略のいずれかの結合対の一方のメンバー、例えば、核酸、ペプチド、または小分子を含む。
ヘッドピース
コード化された化学物質では、ヘッドピースは、各化学物質をそのコードオリゴヌクレオチドタグに機能的に連結する。一般に、ヘッドピースは、さらに誘導体化され得る少なくとも2つの官能基を有する出発オリゴヌクレオチドであり、ここで、第1官能基は第1化学物質(またはその構成成分)をヘッドピースに機能的に連結し、第2官能基は1つ以上のタグをヘッドピースに機能的に連結する。ヘッドピースと化学物質の間のスペーシング部分として、任意で、二官能性スペーサーを用いることができる。
ヘッドピースの官能基は、化学物質の構成成分と共有結合を形成し、かつタグと別の共有結合を形成するために使用され得る。その構成成分は、小分子の任意の部分、例えば、多様性ノードを有する足場またはビルディングブロックとすることができる。あるいは、ヘッドピースは、官能基(例えば、ヒドロキシル、アミン、カルボキシル、スルフヒドリル、アルキニル、アジド、またはリン酸基)で終わるスペーサー(例えば、ライブラリー内に形成される小分子からヘッドピースを隔離するスペーシング部分)を提供するように誘導体化することができ、該官能基は、化学物質の構成成分と共有結合を形成するために用いられる。スペーサーは、ヘッドピースの5'末端に、内部位置のいずれかに、または3'末端に取り付けることができる。スペーサーが内部位置の1つに取り付けられる場合、スペーサーは誘導体化された塩基(例えば、ウリジンのC5位置)に機能的に連結され得るか、または当技術分野で公知の標準的な技術を用いてオリゴヌクレオチドに内部的に配置され得る。例示的なスペーサーは本明細書に記載される。
ヘッドピースは任意の有用な構造をもつことができる。ヘッドピースは、例えば、1〜100ヌクレオチド長、好ましくは、5〜20ヌクレオチド長、最も好ましくは、5〜15ヌクレオチド長であり得る。ヘッドピースは一本鎖または二本鎖であってよく、天然のヌクレオチドまたは本明細書に記載されるような修飾ヌクレオチドで構成され得る。例えば、化学部分は、ヘッドピースの3'末端または5'末端に機能的に連結することができる。特定の態様では、ヘッドピースは配列内の相補的な塩基によって形成されたヘアピン構造を含む。例えば、化学部分は、ヘッドピースの内部位置、3'末端、または5'末端に機能的に連結することができる。
一般に、ヘッドピースは5'末端または3'末端に非自己相補的な配列を含み、該配列は重合、酵素的ライゲーション、または化学反応によるオリゴヌクレオチドタグの結合を可能にする。ヘッドピースはオリゴヌクレオチドタグのライゲーションならびに任意の精製およびリン酸化工程を可能にする。最後のタグを付加した後、追加のアダプター配列を最後のタグの5'末端に付加することができる。例示的なアダプター配列には、プライマー結合配列または標識(例えば、ビオチン)を有する配列が含まれる。多くのビルディングブロックおよび対応するタグが用いられる場合(例えば、100)、必要な数のタグを生成するためにオリゴヌクレオチド合成工程の間にミックス・アンド・スプリット戦略が採用され得る。DNA合成のためのこのようなミックス・アンド・スプリット戦略は当技術分野で知られている。得られたライブラリーメンバーは、関心対象の標的に対する結合物質について選択した後で、PCRにより増幅することができる。
ヘッドピースまたは複合体は、任意で、1つ以上のプライマー結合配列を含むことができる。例えば、ヘッドピースは、ヘアピンのループ領域に、増幅のためのプライマー結合領域として機能する配列を有し、この場合に、そのプライマー結合領域は、ヘッドピース内の配列に対してよりも、その相補的なプライマー(例えば、隣接する識別子領域を含むことができる)に対して高い融解温度を有する。他の態様において、複合体は、1つ以上のビルディングブロックをコードする1つ以上のタグの両側に、(例えば、PCR反応を可能にするために)2つのプライマー結合配列を含む。あるいは、ヘッドピースは、5'または3'末端に1つのプライマー結合配列を含んでもよい。他の態様では、ヘッドピースはヘアピンであって、ループ領域がプライマー結合部位を形成するか、またはプライマー結合部位がループの3'側でヘッドピースへのオリゴヌクレオチドのハイブリダイゼーションを介して導入される。ヘッドピースの3'末端に相同な領域を含みかつ(例えば、PCR反応を可能にするために)その5'末端にプライマー結合領域を有する、プライマーオリゴヌクレオチドは、ヘッドピースにハイブリダイズすることができ、かつビルディングブロックまたはビルディングブロックの付加をコードするタグを含むことができる。プライマーオリゴヌクレオチドは、バイオインフォマティクス分析のために含まれる、ランダム化されたヌクレオチドの領域(例えば2〜16ヌクレオチド長)などの、追加の情報を含んでもよい。
ヘッドピースは、任意で、ヘアピン構造を含むことができ、この構造は任意の有用な方法によって達成することができる。例えば、ヘッドピースは、ワトソン・クリックのDNA塩基対形成(例えば、アデニン-チミンおよびグアニン-シトシン)および/またはゆらぎ塩基対形成(例えば、グアニン-ウラシル、イノシン-ウラシル、イノシン-アデニン、およびイノシン-シトシン)などによって、分子間塩基対形成パートナーを形成する相補的な塩基を含むことができる。別の例において、ヘッドピースは、非修飾ヌクレオチドと比較して、より高い親和性の二重鎖形成を形成し得る修飾ヌクレオチドまたは置換ヌクレオチドを含むことができ、こうした修飾または置換ヌクレオチドは当技術分野で公知である。さらに別の例では、ヘッドピースは、ヘアピン構造を形成するために1つ以上の架橋された塩基を含む。例えば、一本鎖内の塩基または異なる二本鎖内の塩基は、例えばソラレンを用いることによって、架橋され得る。
ヘッドピースまたは複合体は、任意で、検出を可能にする1つ以上の標識を含んでもよい。例えば、ヘッドピース、1つ以上のオリゴヌクレオチドタグ、および/または1つ以上のプライマー配列は、アイソトープ、放射性イメージング剤、マーカー、トレーサー、蛍光標識(例:ローダミンもしくはフルオレセイン)、化学発光標識、量子ドット、およびレポーター分子(例:ビオチンもしくはhisタグ)を含むことができる。
他の態様において、ヘッドピースまたはタグは、半水性、低水性、または非水性(例えば、有機)条件での溶解性を促進するように修飾することができる。ヘッドピースまたはタグのヌクレオチド塩基は、それらの相補的塩基に水素結合する能力を有意に破壊することなく、例えば、TまたはC塩基のC5位置を脂肪族鎖で修飾することによって、より疎水性にすることができる。例示的な修飾または置換ヌクレオチドは、5'-ジメトキシトリチル-N4-ジイソブチルアミノメチリデン-5-(1-プロピニル)-2'-デオキシシチジン,3'-[(2-シアノエチル)-(N,N-ジイソプロピル)]-ホスホルアミダイト;5'-ジメトキシトリチル-5-(1-プロピニル)-2'-デオキシウリジン,3'-[(2-シアノエチル)-(N,N-ジイソプロピル)]-ホスホルアミダイト;5'-ジメトキシトリチル-5-フルオロ-2'-デオキシウリジン,3'-[(2-シアノエチル)-(N,N-ジイソプロピル)]-ホスホルアミダイト;および5'-ジメトキシトリチル-5-(ピレン-1-イル-エチニル)-2'-デオキシウリジン,3'-[(2-シアノエチル)-(N,N-ジイソプロピル)]-ホスホルアミダイトである。
また、ヘッドピースオリゴヌクレオチドには、有機溶媒中での溶解性を促進する修飾を組み入れることができる。例えば、アゾベンゼンホスホルアミダイトは、ヘッドピースの設計に疎水性部分を導入し得る。ヘッドピースへの疎水性アミダイトのそうした挿入は、分子内のどこにでも行うことができる。しかし、挿入は、ライブラリー合成時の追加のDNAタグを用いた後続のタグ付け、または選択が完了した時点でのその後のPCR、またはタグのデコンボリューションのために使用する場合はマイクロアレイ分析、を妨害すべきでない。本明細書に記載のヘッドピースの設計へのこのような追加は、例えば15%、25%、30%、50%、75%、90%、95%、98%、99%、または100%の有機溶媒中にヘッドピースを可溶性にするだろう。したがって、ヘッドピースの設計への疎水性残基の追加は、オリゴヌクレオチドタグ付けに対してヘッドピースを適格にしつつ、半水性または非水性(例えば、有機)条件での溶解性の向上を可能にする。さらに、ライブラリーにその後導入されるDNAタグは、TまたはC塩基のC5位置で修飾することができ、その結果、それらもまた、ライブラリーをより疎水性にし、後続のライブラリー合成工程のために有機溶媒中により可溶性にする。
特定の態様において、ヘッドピースおよび第1タグは、同じ物質とすることができ、すなわち、複数のヘッドピース-タグ物質は、すべてが共通の部分(例えば、プライマー結合領域)を共有し、かつすべてが他の部分(コード領域)で異なるように構築され得る。これらは「スプリット」工程で利用され、それらがコードしている事象が起こった後にプールされ得る。
特定の態様において、ヘッドピースは、例えば、第1スプリット工程をコードする配列を含めることによって、または特定のライブラリーに関連した特定の配列を用いるなどして、ライブラリーのアイデンティティをコードする配列を含めることによって、情報をコードすることができる。
オリゴヌクレオチドタグ
本明細書に記載されるオリゴヌクレオチドタグ(例えば、タグまたはヘッドピースの一部またはテイルピースの一部)は、例えば以下のような、有用な情報をコードするために使用することができる:分子、化学物質の一部、構成成分(例えば、足場もしくはビルディングブロック)の付加、ライブラリー内のヘッドピース、ライブラリーのアイデンティティ、1つ以上のライブラリーメンバーの使用(例えば、ライブラリーのアリコート内のメンバーの使用)、および/またはライブラリーメンバーの起源(例えば、起源配列の使用による)。
オリゴヌクレオチド中の任意の配列は、任意の情報をコードするために使用することができる。したがって、1つのオリゴヌクレオチド配列は、2つ以上のタイプの情報をコードするため、または1つ以上のタイプの情報をもコードする出発オリゴヌクレオチドを提供するためなど、複数の目的を果たすことができる。例えば、第1タグは、第1ビルディングブロックの付加ならびにライブラリーの識別をコードすることができる。別の例では、ヘッドピースは、化学物質をタグに機能的に連結する出発オリゴヌクレオチドを提供するために使用することができ、この場合、該ヘッドピースはライブラリーのアイデンティティをコードする配列(すなわち、ライブラリー識別配列)をさらに含む。したがって、本明細書に記載の情報はどれも、別個のオリゴヌクレオチドタグ中にコード化されてもよいし、同じオリゴヌクレオチド配列(例えば、タグなどのオリゴヌクレオチドタグ、もしくはヘッドピース)中に組み合わせて、コード化されてもよい。
ビルディングブロック配列は、ビルディングブロックのアイデンティティおよび/またはビルディングブロックを用いて実施される結合反応のタイプをコードする。このビルディングブロック配列はタグに含まれ、該タグは、任意で、以下に記載する配列の1つ以上のタイプ(例えば、ライブラリー識別配列、使用配列、および/または起源配列)を含んでもよい。
ライブラリー識別配列は特定のライブラリーのアイデンティティをコードする。2つ以上のライブラリーの混合を可能にするために、ライブラリーメンバーは、例えば、ライブラリー識別タグ(すなわち、ライブラリー識別配列を含むオリゴヌクレオチド)内に、ライゲーションされるタグ内に、ヘッドピース配列の一部内に、またはテイルピース配列内に、1つ以上のライブラリー識別配列を含み得る。これらのライブラリー識別配列は、コードする関係を推定するために使用することができ、この場合には、タグの配列が翻訳され、化学的(合成)履歴情報と相関される。したがって、これらのライブラリー識別配列は、選択、増幅、精製、配列決定などのために2つ以上のライブラリーを一緒に混合することを可能にする。
使用配列は、ライブラリーの個々のアリコート中の1つ以上のライブラリーメンバーの履歴(すなわち、使用)をコードする。例えば、別個のアリコートは、異なる反応条件、ビルディングブロック、および/または選択工程を用いて処理され得る。特に、この配列を用いると、そのようなアリコートを識別し、かつそれらの履歴(使用)を推定することができ、それによって、選択、増幅、精製、配列決定などのためにサンプルを一緒に混合することを目的として、異なる履歴(使用)(例えば、明確に区別される選択実験)を有する同じライブラリーのアリコートを一緒に混合することが可能になる。こうした使用配列は、ヘッドピース、テイルピース、タグ、使用タグ(すなわち、使用配列を含むオリゴヌクレオチド)、または本明細書に記載される他のタグ(例えば、ライブラリー識別タグもしくは起源タグ)内に含めることができる。
起源配列は、ライブラリーメンバーの起源をコードする、任意の有効な長さ(例えば、約6オリゴヌクレオチド)の縮重(ランダムな、確率的に生成された)オリゴヌクレオチド配列である。この配列は、さもなければすべての点で同一であるライブラリーメンバーを、配列情報によって識別可能な物質へと確率的に細分するのに役立ち、その結果として、ユニークな祖先鋳型(例えば、選択されたライブラリーメンバー)に由来する増幅産物の観察を、同じ祖先鋳型(例えば、選択されたライブラリーメンバー)に由来する多数の増幅産物の観察から識別できるようになる。例えば、ライブラリーの形成後であって選択工程の前に、各ライブラリーメンバーは、例えば起源タグ内に、異なる起源配列を含むことができる。選択の後、選択されたライブラリーメンバーを増幅して増幅産物を生成させ、起源配列を(例えば、起源タグ内に)含んでいると予想されるライブラリーメンバーの部分を観察して、他のライブラリーメンバーの各々における起源配列と比較することができる。起源配列は縮重しているので、各ライブラリーメンバーの各増幅産物は異なる起源配列をもつはずである。しかし、増幅産物での同じ起源配列の観察は、同じ鋳型分子に由来する多数のアンプリコンを示す可能性がある。増幅後に対して、増幅前にコードタグの集団の統計およびデモグラフィックスを決定することが所望される場合は、起源タグを使用することができる。こうした起源配列は、ヘッドピース、テイルピース、タグ、起源タグ(すなわち、起源配列を含むオリゴヌクレオチド)、または本明細書に記載される他のタグ(例えば、ライブラリー識別タグもしくは使用タグ)内に含めることができる。
本明細書に記載される配列のタイプはどれも、ヘッドピースに含めることができる。例えば、ヘッドピースは、ビルディングブロック配列、ライブラリー識別配列、使用配列、または起源配列の1つ以上を含むことができる。
本明細書に記載されるこれらの配列のどれも、テイルピースに含めることができる。例えば、テイルピースは、ライブラリー識別配列、使用配列、または起源配列の1つ以上を含むことができる。
本明細書に記載されるタグはどれも、5'もしくは3'末端に、または該末端に近接して、固定された配列を有するコネクタを含むことができる。コネクタは、反応基(例えば、化学反応基または光反応基)を提供することによって、またはリンケージを可能にする剤(例えば、インターカレート部分またはコネクタもしくは架橋性オリゴヌクレオチド中の可逆的反応基の剤)のための部位を提供することによって、リンケージ(例えば、化学的リンケージ)の形成を容易にする。各5'-コネクタは同じでも異なってもよく、各3'-コネクタは同じでも異なってもよい。複数のタグを有する例示的で非限定的な複合体では、各タグは5'-コネクタと3'-コネクタを含み、ここで、各5'-コネクタは同じ配列を有し、各3'-コネクタは同じ配列を有する(例えば、この場合、5'-コネクタの配列は3'-コネクタの配列と同じでも異なってもよい)。コネクタは、1つ以上のリンケージのために使用することができる配列を提供する。リレープライマーの結合または架橋性オリゴヌクレオチドのハイブリダイゼーションを可能にするために、コネクタは、リンケージ(例えば、ポリメラーゼが読み通すまたは通過して移動する能力が低下しているリンケージ、例えば化学的リンケージ)を可能にする1つ以上の官能基を含むことができる。
これらの配列は、オリゴヌクレオチドについて本明細書で記載した任意の修飾を含むことができ、例えば、有機溶媒中での溶解性を促進する修飾(例えば、ヘッドピースについてなど、本明細書で記載したいずれか)、天然のホスホジエステル結合のアナログ(例えば、ホスホロチオエートアナログ)を提供する修飾、または1つ以上の非天然オリゴヌクレオチド(例えば、2'-O-メチル化ヌクレオチドおよび2'-フルオロヌクレオチドなどの2'-置換ヌクレオチド、または本明細書で記載したいずれか)を提供する修飾の1つ以上を含むことができる。
これらの配列は、オリゴヌクレオチドについて本明細書で記載した任意の特徴を含むことができる。例えば、これらの配列は、(例えば、本明細書に記載されるような)20ヌクレオチド未満であるタグ内に含めることができる。他の例では、これらの配列の1つ以上を含むタグは、ほぼ同じ質量を有する(例えば、各タグは、特定の可変要因をコードするタグの特定のセット内の平均質量から+/-約10%の質量を有する);プライマー結合(例えば、定常)領域を欠く;定常領域を欠く;または短縮された長さ(例えば、30ヌクレオチド未満、25ヌクレオチド未満、20ヌクレオチド未満、19ヌクレオチド未満、18ヌクレオチド未満、17ヌクレオチド未満、16ヌクレオチド未満、15ヌクレオチド未満、14ヌクレオチド未満、13ヌクレオチド未満、12ヌクレオチド未満、11ヌクレオチド未満、10ヌクレオチド未満、9ヌクレオチド未満、8ヌクレオチド未満、もしくは7ヌクレオチド未満の長さ)の定常領域を有する。
この長さのライブラリーおよびオリゴヌクレオチドについての配列決定戦略は、任意で、それぞれ、読み忠実度または配列決定の深さを増加させるためにコンカテネーション(concatenation)またはカテネーション(catenation)戦略を含むことができる。特に、プライマー結合領域を欠くコード化ライブラリーの選択は、SELEXについての文献に記載されており、例えば、Jarosch et al., Nucleic Acids Res. 34: e86 (2006)に記載され、これは参照により本明細書に組み入れられる。例えば、ライブラリーメンバーは、複合体の5'末端に第1アダプター配列および複合体の3'末端に第2アダプター配列を含むように(例えば、選択工程の後で)修飾することができ、ここで、第1配列は第2配列に実質的に相補的であって、二重鎖の形成をもたらす。収率をさらに向上させるためには、2つの固定されたダングリング(dangling)ヌクレオチド(例えば、CC)が5'末端に付加される。
リンケージ
本発明のリンケージは、情報をコードするオリゴヌクレオチド間(例えば、ヘッドピースとタグ間、2つのタグ間、またはタグとテイルピース間など)に存在する。例示的なリンケージには、ホスホジエステル、ホスホネート、およびホスホロチオエートが含まれる。いくつかの態様では、ポリメラーゼが1つまたは複数のリンケージを読み通すまたは通過して移動する能力が低下している。特定の態様では、化学的リンケージには、一リン酸および/またはヒドロキシル基のような化学反応基、光反応基、インターカレート部分、架橋性オリゴヌクレオチド、または可逆的共反応基の1つ以上が含まれる。
リンケージは、そのリンケージを読み通すまたは通過して移動するポリメラーゼの能力が低下しているかどうかを判定するために試験され得る。この能力は、液体クロマトグラフィー-質量分析、RT-PCR分析、配列デモグラフィックス、および/またはPCR分析などの、いずれかの有用な方法で試験することができる。
いくつかの態様では、化学的ライゲーションは、一リン酸とヒドロキシルのような、リンケージを提供する1つ以上の化学反応性の対の使用を含む。本明細書に記載されるように、読み取り可能なリンケージは、化学的ライゲーションによって、例えば、シアノイミダゾールと二価金属源(例えば、ZnCl2)の存在下で5'または3'末端上の一リン酸、モノホスホチオエートまたはモノホスファネートと5'または3'末端上のヒドロキシル基とを反応させることによって、合成され得る。
他の例示的な化学反応性の対は、以下を含む対である:Huisgen 1,3-双極子環化付加反応を介してトリアゾールを形成するための、置換されてもよいアルキニル基と置換されてもよいアジド基;Diels-Alder反応を介してシクロアルケニルを形成するための、4π電子系を有する置換されてもよいジエン(例えば、置換されてもよい1,3-不飽和化合物、例えば、置換されてもよい1,3-ブタジエン、1-メトキシ-3-トリメチルシリルオキシ-1,3-ブタジエン、シクロペンタジエン、シクロヘキサジエン、またはフラン)と2π電子系を有する置換されてもよいジエノフィルまたは置換されてもよいヘテロジエノフィル(例えば、置換されてもよいアルケニル基または置換されてもよいアルキニル基);開環反応を介してヘテロアルキルを形成するための、求核剤(例えば、置換されてもよいアミンまたは置換されてもよいチオール)と歪を有するヘテロシクリル求電子剤(例えば、置換されてもよいエポキシド、アジリジン、アジリジニウムイオン、またはエピスルホニウムイオン);5'-ヨードdTを含むオリゴヌクレオチドと3'-ホスホロチオエートオリゴヌクレオチドとのスプリント化ライゲーションにおけるなどの、ホスホロチオエート基とヨード基;3'-アルデヒド修飾オリゴヌクレオチド(必要に応じて、市販の3'-グリセリル修飾オリゴヌクレオチドを酸化することによって得ることができる)と5'-アミノオリゴヌクレオチド(すなわち、還元的アミノ化反応)または5'-ヒドラジドオリゴヌクレオチドとの反応のような、置換されてもよいアミノ基とアルデヒド基またはケトン基;置換されてもよいアミノ基とカルボン酸基またはチオール基の対(例えば、trans-4-(マレイミジルメチル)シクロヘキサン-1-カルボン酸スクシンイミジル(SMCC)または1-エチル-3-(3-ジメチルアミノプロピル)カルボジイミド(EDAC)を使用するまたは使用しない);置換されてもよいヒドラジンとアルデヒドまたはケトン基の対;置換されてもよいヒドロキシルアミンとアルデヒドまたはケトン基の対;または求核剤と置換されてもよいハロゲン化アルキルの対。
白金錯体、アルキル化剤、またはフラン修飾ヌクレオチドもまた、鎖間または鎖内リンケージを形成するための化学反応基として使用することができる。このような剤は2つのオリゴヌクレオチド間で使用することができ、任意で架橋性オリゴヌクレオチド中に存在してもよい。
例示的で非限定的な白金錯体としては、以下が挙げられる:シスプラチン(cis-ジアミンジクロロ白金(II)、例えば、GG鎖内リンケージを形成する)、トランスプラチン(trans-ジアミンジクロロ白金(II)、例えば、GXG鎖間リンケージを形成する、ここでXは任意のヌクレオチドである)、カルボプラチン、ピコラチン(picolatin)(ZD0473)、オルマプラチン、またはオキサリプラチン(例えば、GC、CG、AGまたはGGリンケージを形成する)。これらのリンケージはどれも、鎖間または鎖内リンケージであり得る。
例示的で非限定的なアルキル化剤としては、以下が挙げられる:ナイトロジェンマスタード(メクロレタミン、例えば、GGリンケージを形成する)、クロラムブシル、メルファラン、シクロホスファミド、シクロホスファミドのプロドラッグ形態(例えば、4-ヒドロペルオキシシクロホスファミドおよびイホスファミド))、1,3-ビス(2-クロロエチル)-1-ニトロソウレア(BCNU、カルムスチン)、アジリジン(例えば、マイトマイシンC、トリエチレンメラミン、またはトリエチレンチオホスホルアミド(チオテパ)、GGまたはAGリンケージを形成する)、ヘキサメチルメラミン、アルキルスルホネート(例えば、ブスルファン、GGリンケージを形成する)、またはニトロソウレア(例えば、2-クロロエチルニトロソウレア、GGまたはCGリンケージを形成する、例えばカルムスチン(BCNU)、クロロゾトシン、ロムスチン(CCNU)、およびセムスチン(メチル-CCNU))。これらのリンケージはどれも、鎖間または鎖内リンケージであり得る。
フラン修飾ヌクレオチドもまた、リンケージを形成するために使用することができる。インサイチュ(in situ)酸化(例えば、N-ブロモスクシンイミド(NBS)による)の際に、フラン部分は反応性オキソ-エナール誘導体を形成し、これは相補的塩基と反応して鎖間リンケージを形成する。いくつかの態様では、フラン修飾ヌクレオチドは相補的AまたはCヌクレオチドとのリンケージを形成する。例示的で非限定的なフラン修飾ヌクレオチドには、任意の2'-(フラン-2-イル)プロパノイルアミノ修飾ヌクレオチド;または2-(フラン-2-イル)エチルグリコール核酸の非環式修飾ヌクレオチドが含まれる。
光反応基もまた、反応基として使用することができる。例示的で非限定的な光反応基としては、以下が挙げられる:インターカレート部分、ソラレン誘導体(例:ソラレン、HMT-ソラレン、または8-メトキシソラレン)、置換されてもよいシアノビニルカルバゾール基、置換されてもよいビニルカルバゾール基、置換されてもよいシアノビニル基、置換されてもよいアクリルアミド基、置換されてもよいジアジリン基、置換されてもよいベンゾフェノン(例:4-ベンゾイル安息香酸のスクシンイミジルエステルまたはベンゾフェノンイソチオシアネート)、置換されてもよい5-(カルボキシ)ビニル-ウリジン基(例:5-(カルボキシ)ビニル-2'-デオキシウリジン)、または置換されてもよいアジド基(例:アリールアジドまたはハロゲン化アリールアジド、例えば4-アジド-2,3,5,6-テトラフルオロ安息香酸(ATFB)のスクシンイミジルエステル)。
インターカレート部分もまた、反応基として使用することができる。例示的で非限定的なインターカレート部分としては、以下が挙げられる:ソラレン誘導体、アルカロイド誘導体(例:ベルベリン、パルマチン、コラリン、サンギナリン(例:そのイミニウムまたはアルカノールアミン形態)、またはアリストロラクタム-β-D-グルコシド)、エチジウムカチオン(例:臭化エチジウム)、アクリジン誘導体(例:プロフラビン、アクリフラビン、またはアムサクリン)、アントラサイクリン誘導体(例:ドキソルビシン、エピルビシン、ダウノルビシン(ダウノマイシン)、イダルビシン、およびアクラルビシン)、またはサリドマイド。
架橋性オリゴヌクレオチドでは、有用な反応基(例えば、本明細書に記載される反応基)はどれも、鎖間または鎖内リンケージを形成するために使用することができる。例示的な反応基には、化学反応基、光反応基、インターカレート部分、および可逆的共反応基が含まれる。架橋性オリゴヌクレオチドとともに使用するための架橋剤には、限定するものではないが、以下が挙げられる:アルキル化剤(例えば、本明細書に記載のもの)、シスプラチン(cis-ジアミンジクロロ白金(II))、trans-ジアミンジクロロ白金(II)、ソラレン、HMT-ソラレン、8-メトキシソラレン、フラン修飾ヌクレオチド、2-フルオロ-デオキシイノシン(2-F-dI)、5-ブロモ-デオキシシトシン(5-Br-dC)、5-ブロモデオキシウリジン(5-Br-dU)、5-ヨード-デオキシシトシン(5-I-dC)、5-ヨード-デオキシウリジン(5-I-dU)、trans-4-(マレイミジルメチル)シクロヘキサン-1-カルボン酸スクシンイミジル、SMCC、EDAC、またはアセチルチオ酢酸スクシンイミジル(SATA)。
オリゴヌクレオチドはまた、チオール部分を含むように修飾することができ、チオール部分は、マレイミド、ハロゲン、およびヨードアセトアミドなどの、種々のチオール反応基と反応することができ、したがって2つのオリゴヌクレオチドを架橋するために使用することができる。チオール基は、オリゴヌクレオチドの5'または3'末端に連結することができる。
二重鎖オリゴヌクレオチドをピリミジン(例えば、チミジン)位置で鎖間架橋する場合は、インターカレートする光反応部分ソラレンが選択され得る。ソラレンは、紫外線(約254nm)照射時に、二重鎖にインターカレートして、ピリミジンと、優先的には5'-TpA部位で、共有結合による鎖間架橋を形成する。ソラレン部分は、(例えば、アルカン鎖(例:C1-10アルキル)、またはポリエチレングリコール基(例:-(CH2CH2O)nCH2CH2-、ここでnは1〜50の整数である)によって)修飾オリゴヌクレオチドに共有結合で取り付けることができる。例示的なソラレン誘導体も使用することができ、非限定的な誘導体としては、4'-(ヒドロキシエトキシメチル)-4,5',8-トリメチルソラレン(HMT-ソラレン)および8-メトキシソラレンが挙げられる。
架橋性オリゴヌクレオチドの種々の部分は、リンケージを導入するために修飾することができる。例えば、オリゴヌクレオチドの末端ホスホロチオエートはまた、2つの隣接したオリゴヌクレオチドを連結するために使用することができる。ハロゲン化ウラシル/シトシンもまた、オリゴヌクレオチド中の架橋剤修飾として使用することができる。例えば、2-フルオロ-デオキシイノシン(2-F-dI)修飾オリゴヌクレオチドは、ジスルフィド含有ジアミンまたはチオプロピルアミンと反応して、ジスルフィドリンケージを形成することができる。
以下に記載するように、可逆的共反応基には、シアノビニルカルバゾール基、シアノビニル基、アクリルアミド基、チオール基、またはスルホニルチオエーテルから選択されるものが含まれる。置換されてもよいシアノビニルカルバゾール(CNV)基はまた、相補鎖中のピリミジン塩基(例えば、シトシン、チミン、およびウラシル、ならびにそれらの修飾塩基)に架橋させるために、オリゴヌクレオチド中で使用することができる。CNV基は、366nmで照射すると、隣接ピリミジン塩基との[2+2]環化付加を促進し、結果的に鎖間架橋をもたらす。312nmでの照射はその架橋を逆転させ、したがって、オリゴヌクレオチド鎖を可逆的に架橋するための方法を提供する。非限定的なCNV基は3-シアノビニルカルバゾールであり、これはカルボキシビニルカルバゾールヌクレオチドとして(例えば、3-カルボキシビニルカルバゾール-1'-β-デオキシリボシド-5'-三リン酸として)含めることができる。
CNV基は、置換されてもよいビニルカルバゾール基を提供するために、反応性シアノ基を別の反応基と置換するように改変することができる。ビニルカルバゾール基のための例示的非限定的な反応基には、以下が含まれる:-CONRN1RN2のアミド基(ここで各RN1およびRN2は同じでも異なってもよく、独立してHおよびC1-6アルキルである)、例えば-CONH2;-CO2Hのカルボキシル基;またはC2-7アルコキシカルボニル基(例:メトキシカルボニル)。さらに、反応基はビニル基のαまたはβ炭素上に位置することができる。例示的なビニルカルバゾール基としては、以下が挙げられる:本明細書に記載されるシアノビニルカルバゾール基;アミドビニルカルバゾール基(例えば、アミドビニルカルバゾールヌクレオチド、例えば3-アミドビニルカルバゾール-1'-β-デオキシリボシド-5'-三リン酸など);カルボキシビニルカルバゾール基(例えば、カルボキシビニルカルバゾールヌクレオチド、例えば3-カルボキシビニルカルバゾール-1'-β-デオキシリボシド-5'-三リン酸など);およびC2-7アルコキシカルボニルビニルカルバゾール基(例えば、アルコキシカルボニルビニルカルバゾールヌクレオチド、例えば3-メトキシカルボニルビニルカルバゾール-1'-β-デオキシリボシド-5'-三リン酸など)。置換されてもよいビニルカルバゾール基およびこのような基を有するヌクレオチドのさらなる例は、米国特許第7,972,792号およびYoshimura and Fujimoto, Org. Lett. 10:3227-3230 (2008)に記載される化学式で提供され、これらは両方ともその全体が参照により本明細書に組み入れられる。
他の可逆的反応基として、ジスルフィドを形成するチオール基と別のチオール基、ならびにスルホニルエチルチオエーテルを形成するチオール基とビニルスルホン基が挙げられる。チオール-チオール基は、任意で、ビス-((N-ヨードアセチル)ピペラジニル)スルホンローダミンとの反応により形成されたリンケージを含むことができる。その他の可逆的反応基(例えば、いくつかの光反応基)としては、置換されてもよいベンゾフェノン基が挙げられる。非限定的な例はベンゾフェノンウラシル(BPU)であり、これはBPU含有オリゴヌクレオチド二重鎖の鎖間架橋の部位-および配列-選択的形成に使用することができる。この架橋は加熱時に逆転させることができ、2つのオリゴヌクレオチド鎖の可逆的架橋方法を提供する。
他の態様において、化学的ライゲーションは、例えば、選択後のPCR分析および配列決定のために、ホスホジエステル結合のアナログを導入することを含む。例示的なホスホジエステルのアナログには、ホスホロチオエートリンケージ(例えば、ホスホロチオエート基と、ヨード基などの脱離基の使用により導入される)、ホスホルアミドリンケージ、またはホスホロジチオエートリンケージ(例えば、ホスホロジチオエート基と、ヨード基などの脱離基の使用により導入される)が含まれる。
本明細書に記載した基(例えば、化学反応基、光反応基、インターカレート部分、架橋性オリゴヌクレオチド、または可逆的共反応基)のいずれについても、その基は、オリゴヌクレオチドの末端に、もしくはそれに近接して、または5'末端と3'末端の間に組み込むことができる。さらに、1つ以上の基が各オリゴヌクレオチド中に存在し得る。反応基の対が必要とされる場合、オリゴヌクレオチドは、それらの基の対の反応を促進するように設計することができる。ピリミジン塩基と共反応するシアノビニルカルバゾール基の非限定的な例では、第1オリゴヌクレオチドは5'末端に、またはそれに近接して、シアノビニルカルバゾール基を含むように設計される。この例では、第2オリゴヌクレオチドは、第1オリゴヌクレオチドに相補的となるように、かつ第1および第2オリゴヌクレオチドがハイブリダイズするとき、シアノビニルカルバゾール基と整列する位置に共反応性のピリミジン塩基が含まれるように設計される。本明細書に記載の基および1つ以上の基を有するオリゴヌクレオチドはどれも、基同士の反応を促進して1つ以上のリンケージを形成するように設計することができる。
二官能性スペーサー
ヘッドピースと化学物質の間の二官能性スペーサーは、適切なスペーシング部分を提供するために、および/または有機溶媒中のヘッドピースの溶解性を増大させるために、変化させることができる。ヘッドピースを小分子ライブラリーと連結することができる、多種多様なスペーサーが市販されている。スペーサーは典型的には直鎖または分岐鎖からなり、以下を含むことができる:C1-10アルキル、1〜10原子のヘテロアルキル、C2-10アルケニル、C2-10アルキニル、C5-10アリール、3〜20原子の環式もしくは多環式系、ホスホジエステル、ペプチド、オリゴサッカライド、オリゴヌクレオチド、オリゴマー、ポリマー、ポリアルキルグリコール(例えば、ポリエチレングリコール、-(CH2CH2O)nCH2CH2-など、ここでnは1〜50の整数である)、またはこれらの組み合わせ。
二官能性スペーサーは、ヘッドピースとライブラリーの化学物質の間に適切なスペーシング部分を提供することができる。特定の態様では、二官能性スペーサーは3つの部分を含む。部分1は、DNAと共有結合を形成する反応基とすることができ、例えば、カルボン酸、好ましくはDNA上のアミノ基(例えば、アミノ修飾dT)と反応するようにN-ヒドロキシスクシンイミド(NHS)エステルにより活性化されたもの、一本鎖ヘッドピースの5'または3'末端を改変するためのアミダイト(標準的なオリゴヌクレオチド化学を用いて達成される)、化学反応性の対(例えば、Cu(I)触媒の存在下でのアジド-アルキン環化付加、または本明細書に記載されるもの)、またはチオール反応基であり得る。部分2もまた、化学物質、ビルディングブロックAnまたは足場のいずれかと共有結合を形成する反応基とすることができる。こうした反応基は、例えば、アミン、チオール、アジド、またはアルキンであり得る。部分3は、部分1と部分2の間に導入される、可変長の化学的に不活性なスペーシング部分とすることができる。こうしたスペーシング部分は、エチレングリコール単位の鎖(例えば、さまざまな長さのPEG)、アルカン、アルケン、ポリエン鎖、またはペプチド鎖であり得る。スペーサーは、有機溶媒中のヘッドピースの溶解性を改善するための疎水性部分(例えば、ベンゼン環など)、ならびにライブラリーの検出のために使用される蛍光部分(例えば、フルオレセインもしくはCy-3)を有する分岐部または挿入部を含むことができる。ヘッドピース設計における疎水性残基は、有機溶媒中でのライブラリー合成を容易にするためにスペーサー設計によって変えることができる。例えば、ヘッドピースとスペーサーの組み合わせは、オクタノール:水係数(Poct)が例えば1.0〜2.5となる、適切な残基をもつように設計される。
スペーサーは、ライブラリーを有機溶媒中で、例えば、15%、25%、30%、50%、75%、90%、95%、98%、99%、または100%の有機溶媒中で、合成することができるように、所与の小分子ライブラリー設計のために経験的に選択され得る。スペーサーは、有機溶媒中にヘッドピースを可溶化する適切な鎖長を選択するために、ライブラリー合成の前にモデル反応を用いて変化させることができる。例示的なスペーサーには、増大したアルキル鎖長、増加したポリエチレングリコール単位、正電荷をもつ分岐鎖種(ヘッドピース上の負のリン酸電荷を中和するため)、または増加した疎水性量(例えば、ベンゼン環構造の追加)を有するスペーサーが含まれる。
市販のスペーサーの例としては、以下が挙げられる:アミノ-カルボン酸スペーサー、例えば、ペプチド(例:Z-Gly-Gly-Gly-Osu(N-α-ベンジルオキシカルボニル-(グリシン)3-N-スクシンイミジルエステル)もしくはZ-Gly-Gly-Gly-Gly-Gly-Gly-Osu(N-α-ベンジルオキシカルボニル-(グリシン)6-N-スクシンイミジルエステル、SEQ ID NO: 1))、PEG(例:Fmoc-アミノPEG2000-NHSもしくはアミノ-PEG(12-24)-NHS)、またはアルカン酸鎖(例:Boc-ε-アミノカプロン酸-Osu)であるもの;化学反応対スペーサー、例えば、ペプチド部分(例:アジドホモアラニン-Gly-Gly-Gly-OSu(SEQ ID NO: 2)もしくはプロパルギルグリシン-Gly-Gly-Gly-OSu(SEQ ID NO: 3))、PEG(例:アジド-PEG-NHS)、またはアルカン酸鎖部分(例:5-アジドペンタン酸、(S)-2-(アジドメチル)-1-Boc-ピロリジン、4-アジドアニリン、もしくは4-アジド-ブタン-1-酸N-ヒドロキシスクシンイミドエステル)と組み合わせた、本明細書に記載の化学反応性の対であるもの;チオール反応性スペーサー、例えば、PEG(例:SM(PEG)n NHS-PEG-マレイミド)、アルカン鎖(例:3-(ピリジン-2-イルジスルファニル)-プロピオン酸-Osuもしくはスルホスクシンイミジル6-(3'-[2-ピリジルジチオ]-プロピオンアミド)ヘキサノエート))であるもの;およびオリゴヌクレオチド合成用のアミダイト、例えば、アミノ修飾剤(例:6-(トリフルオロアセチルアミノ)-ヘキシル-(2-シアノエチル)-(N,N-ジイソプロピル)-ホスホルアミダイト)、チオール修飾剤(例:S-トリチル-6-メルカプトヘキシル-1-[(2-シアノエチル)-(N,N-ジイソプロピル)]-ホスホルアミダイト)、または化学反応性の対の修飾剤(例:6-ヘキシン-1-イル-(2-シアノエチル)-(N,N-ジイソプロピル)-ホスホルアミダイト、3-ジメトキシトリチルオキシ-2-(3-(3-プロパルギルオキシプロパンアミド)プロパンアミド)プロピル-1-O-スクシノイル,長鎖アルキルアミノCPG、もしくは4-アジド-ブタン-1-酸N-ヒドロキシスクシンイミドエステル))。さらなるスペーサーは当技術分野で公知であり、ライブラリー合成中に使用できるスペーサーは、限定するものではないが、以下が挙げられる:5'-O-ジメトキシトリチル-1',2'-ジデオキシリボース-3'-[(2-シアノエチル)-(N,N-ジイソプロピル)]-ホスホルアミダイト;9-O-ジメトキシトリチル-トリエチレングリコール,1-[(2-シアノエチル)-(N,N-ジイソプロピル)]-ホスホルアミダイト;3-(4,4'-ジメトキシトリチルオキシ)プロピル-1-[(2-シアノエチル)-(N,N-ジイソプロピル)]-ホスホルアミダイト;および18-O-ジメトキシトリチルヘキサエチレングリコール,1-[(2-シアノエチル)-(N,N-ジイソプロピル)]-ホスホルアミダイト。本明細書に記載のスペーサーはどれも、異なる所望の長さのスペーサーを生成するために、異なる組み合わせで相互に縦一列に付加することができる。
スペーサーはまた、分岐していてもよく、分岐スペーサーは当技術分野で周知であり、例は対称もしくは非対称ダブラー(doubler)または対称トレブラー(trebler)からなることができる。例えば、Newcome et al., Dendritic Molecules: Concepts, Synthesis, Perspectives, VCH Publishers (1996); Boussif et al., Proc. Natl. Acad. Sci. USA 92:7297-7301 (1995); およびJansen et al., Science 266: 1226 (1994)を参照されたい。
酵素的ライゲーションおよび化学的ライゲーション技術
さまざまなライゲーション技術を用いて、タグをヘッドピースに付加して複合体を形成することができる。したがって、本明細書に記載の結合工程はどれも、例えば、酵素的ライゲーションおよび/または化学的ライゲーションなどの、有用なライゲーション技術を含むことができる。こうした結合工程は、ヘッドピースまたは複合体への1つ以上のタグの付加を含むことができる。特定の態様において、任意のオリゴヌクレオチドに使用されるライゲーション技術は、その結果として得られる生成物を提供するが、こうした生成物は、ライブラリーの解読(decoding)を可能にするために、および/または1種以上のDNAもしくはRNAポリメラーゼによる鋳型依存的重合を可能にするために、転写および/または逆転写され得る。
一般的に、酵素的ライゲーションは、転写および/または逆転写され得る天然のホスホジエステル結合を有するオリゴヌクレオチドを生成する。例示的な酵素的ライゲーション方法は本明細書に提供され、以下のような1種以上のRNAまたはDNAリガーゼの使用を含む:T4 RNAリガーゼ1または2、T4 DNAリガーゼ、CircLigase(商標)ssDNAリガーゼ、CircLigase(商標)II ssDNAリガーゼ、およびThermoPhage(商標)ssDNAリガーゼ(Prokazyme社, Reykjavik, アイスランド)。
化学的ライゲーションはまた、転写または逆転写され得るか、あるいは鋳型依存性ポリメラーゼの鋳型として使用され得るオリゴヌクレオチドを生成するために使用することができる。転写または逆転写することが可能なオリゴヌクレオチドを提供する化学的ライゲーション技術の有効性は、試験する必要があり得る。この有効性は、液体クロマトグラフィー-質量分析、RT-PCR分析、PCR分析、電気泳動および/または配列決定などの、任意の有用な方法により試験することができる。特定の態様では、化学的ライゲーションは、転写または逆転写され得るスペース部分を提供するための1つ以上の化学反応性の対の使用を含む。本発明の方法の一例は、図1に概説されており、そこでは、二本鎖ヘアピン構造が二官能性ヘッドピースオリゴヌクレオチドとして利用され、該二官能性ヘッドピースは、コードオリゴヌクレオチドタグの両方の化学的ライゲーションのための部位と、共有結合型コード化小分子の合成のための保護された一級アミンとを提供する。このヘッドピースは3'-リン酸基と5'-リン酸基の両方を有し、その各々は、シアノイミダゾールおよびZn2+などの二価金属イオンを用いて、対応する相補的非リン酸化オリゴヌクレオチドにライゲーションされ得る。同じ構築物は、T4 DNAリガーゼによる酵素的ライゲーションを用いると、片側(hemi-)ライゲーションされるにすぎないが、それは、図1に示されるように、この酵素が5'-リン酸の3'-ヒドロキシルオリゴヌクレオチドへのライゲーションを支持するだけで、3'-リン酸の5'-ヒドロキシルオリゴヌクレオチドへのライゲーションを支持しないからである。保護されていない一級アミンはシアノイミダゾールと反応してグアニジン付加物を生成することが観察されたが、このアミンのFmoc保護は、それが起こるのを防止することができ、また、保護されたアミンは、化学的ライゲーションの反応条件下で脱保護されることはない。Fmocはピペリジンにより容易に除去される。
酵素的ライゲーションまたは化学的ライゲーションを促進するための反応条件
本明細書に記載の方法は、ヘッドピースとタグの間または2つのタグの間の酵素的または化学的ライゲーションを促進する1つ以上の反応条件を含み得る。こうした反応条件としては、以下が挙げられる:本明細書に記載するように、タグ内で修飾ヌクレオチドを使用すること;異なる長さを有するドナータグとアクセプタータグを使用すること、およびそれらのタグの濃度を変化させること;異なるタイプのリガーゼと、それらの組み合わせ(例えば、CircLigase(商標)DNAリガーゼおよび/またはT4 RNAリガーゼ)を使用すること、およびそれらの濃度を変化させること;異なる分子量を有するポリエチレングリコール(PEG)を使用すること、およびそれらの濃度を変化させること;非PEGクラウディング剤(例えば、ベタインまたはウシ血清アルブミン)を使用すること;ライゲーションのための温度および持続時間を変化させること;ATP、Co(NH3)6Cl3、および酵母無機ピロリン酸を含めて、さまざまな剤の濃度を変えること;酵素的または化学的にリン酸化されたオリゴヌクレオチドタグを使用すること;3'-保護されたタグを使用すること;ならびにプレアデニル化されたタグを使用すること。これらの反応条件はまた、化学的ライゲーションを含む。
ヘッドピースおよび/またはタグは、1つ以上の修飾または置換されたヌクレオチドを含むことができる。好ましい態様では、ヘッドピースおよび/またはタグは、酵素的ライゲーションを促進する1つ以上の修飾または置換ヌクレオチドを含み、例えば、2'-O-メチルヌクレオチド(例:2'-O-メチルグアニンもしくは2'-O-メチルウラシル)、2'-フルオロヌクレオチド、またはライゲーションの基質として利用される他の修飾ヌクレオチドを含む。あるいは、ヘッドピースおよび/またはタグは、化学的ライゲーションを促進する1つ以上の化学反応基(例えば、置換されてもよいアルキニル基および置換されてもよいアジド基)を含むように修飾される。任意で、タグオリゴヌクレオチドは両末端で化学反応基により官能化され、必要に応じて、これらの末端の一方は保護される。その結果として、これらの基は独立して対処することができ、かつ副反応が低減され得る(例えば、重合副反応の低減)。
本明細書に記載されるように、ホスホジエステルリンケージ、ホスホネートリンケージまたはホスホロチオエートリンケージをもたらす化学的ライゲーションは、シアノイミダゾールおよびZn2+などの二価金属イオンの存在下で5'-または3'-リン酸、ホスホネートもしくはホスホロチオエートと5'-または3'-ヒドロキシル基とを反応させることによって、実施することができる。
酵素的ライゲーションは1種以上のリガーゼを含むことができる。例示的なリガーゼとしては、以下が挙げられる:CircLigase(商標)ssDNAリガーゼ(EPICENTRE Biotechnologies社, Madison, WI)、CircLigase(商標)II ssDNAリガーゼ(同様にEPICENTRE Biotechnologies社から)、ThermoPhage(商標)ssDNAリガーゼ(Prokazyme社, Reykjavik, アイスランド)、T4 RNAリガーゼ、およびT4 DNAリガーゼ。好ましい態様では、ライゲーションはRNAリガーゼまたはRNAリガーゼとDNAリガーゼの組み合わせの使用を含む。ライゲーションはさらに、1種以上のリガーゼとの組み合わせで、Co(NH3)6Cl3などの1種以上の可溶性多価カチオンを含むことができる。
ライゲーション工程の前または後に、複合体またはコード化された化学物質を精製することができる。いくつかの態様では、交差反応を生じて、コードプロセスに「ノイズ」を導入する可能性がある、未反応のヘッドピースまたはタグを除去するために、複合体またはコード化された化学物質を精製することができる。いくつかの態様では、リガーゼのライゲーション活性を阻害するまたは低下させる可能性がある、試薬類または未反応出発物質を除去するために、複合体またはコード化された化学物質を精製することができる。例えば、オルトリン酸はライゲーション活性の低下を招く可能性がある。特定の態様では、化学的またはライゲーション工程に導入された物質を、後続の化学的またはライゲーション工程を可能にするために除去する必要があるかもしれない。複合体またはコード化された化学物質を精製する方法は本明細書に記載される。複合体の精製は、複合体の可逆的固定化に続く精製および、後続の工程の前の解放によって、実施され得る。
酵素的および化学的ライゲーションは、300ダルトンを超える平均分子量(例えば、600ダルトン超、3,000ダルトン、4,000ダルトン、5,000、6,000、7,000、8,000、9,000、10,000、15,000、20,000、25,000、30,000、35,000、40,000、または45,000ダルトン)を有するポリエチレングリコールを含むことができる。特定の態様では、ポリエチレングリコールは約3,000ダルトン〜9,000ダルトン(例えば、3,000ダルトン〜8,000ダルトン、3,000ダルトン〜7,000ダルトン、3,000ダルトン〜6,000ダルトン、および3,000ダルトン〜5,000ダルトン)の平均分子量を有する。好ましい態様では、ポリエチレングリコールは約3,000ダルトン〜約6,000ダルトン(例えば、3,300ダルトン〜4,500ダルトン、3,300ダルトン〜5,000ダルトン、3,300ダルトン〜5,500ダルトン、3,300ダルトン〜6,000ダルトン、3,500ダルトン〜4,500ダルトン、3,500ダルトン〜5,000ダルトン、3,500ダルトン〜5,500ダルトン、および3,500ダルトン〜6,000ダルトン、例えば4,600ダルトン)の平均分子量を有する。ポリエチレングリコールは、例えば約25%(w/v)〜約35%(w/v)などの、任意の有用な量で、例えば30%(w/v)の量で、存在することができる。
複合体のヌクレオチド配列を決定するための方法
本発明は、コードする関係が集合タグ配列の配列と化学物質の構造単位(またはビルディングブロック)との間に確立され得るように、複合体のヌクレオチド配列を決定するための方法を特徴とする。特に、化学物質のアイデンティティおよび/または履歴は、オリゴヌクレオチドの塩基配列から推論することが可能である。この方法を使用して、多様な化学物質またはメンバー(例えば、小分子またはペプチド)を含むライブラリーは、特定のタグ配列によりアドレス指定され得る。
本明細書に記載のリンケージはどれも、可逆的または不可逆的であり得る。可逆的リンケージには、光反応性リンケージ(例えば、シアノビニルカルバゾール基とチミジン)およびレドックスリンケージが含まれる。さらなるリンケージは本明細書に記載される。
他の態様では、「読み取り不能」リンケージは、読み取り可能または少なくとも移動可能(translocatable)リンケージを生成するために、酵素的に修復され得る。酵素的修復プロセスは当業者によく知られており、限定するものではないが、以下が含まれる:ピリミジン(例:チミジン)二量体修復機構(例えば、フォトリアーゼまたはグリコシラーゼ(例:T4ピリミジン二量体グリコシラーゼ(PDG))を使用)、塩基除去修復機構(例えば、グリコシラーゼ、脱プリン/脱ピリミジン(AP)エンドヌクレアーゼ、フラップ(Flap)エンドヌクレアーゼ、またはポリADPリボースポリメラーゼ(例:ヒト脱プリン/脱ピリミジン(AP)エンドヌクレアーゼ、APE 1;エンドヌクレアーゼIII(Nth)タンパク質;エンドヌクレアーゼIV;エンドヌクレアーゼV;ホルムアミドピリミジン[fapy]-DNAグリコシラーゼ(Fpg);ヒト8-オキソグアニングリコシラーゼ1(αイソ型)(hOGG1);ヒトエンドヌクレアーゼVIII様1(hNEIL1);ウラシル-DNAグリコシラーゼ(UDG);ヒト一本鎖選択的単官能性ウラシルDNAグリコシラーゼ(SMUG1);およびヒトアルキルアデニンDNAグリコシラーゼ(hAAG))を使用、任意で、修復用の1種以上のエンドヌクレアーゼ、DNAもしくはRNAポリメラーゼ、および/またはリガーゼと組み合わせてもよい)、メチル化修復機構(例えば、メチルグアニンメチルトランスフェラーゼを使用)、AP修復機構(例えば、脱プリン/脱ピリミジン(AP)エンドヌクレアーゼ(例:APE 1;エンドヌクレアーゼIII;エンドヌクレアーゼIV;エンドヌクレアーゼV;Fpg;hOGG1;およびhNEIL1)を使用、任意で、修復用の1種以上のエンドヌクレアーゼ、DNAもしくはRNAポリメラーゼ、および/またはリガーゼと組み合わせてもよい)、ヌクレオチド除去修復機構(例えば、除去修復交差相補性(cross-complementing)タンパク質または切除ヌクレアーゼを使用、任意で、修復用の1種以上のエンドヌクレアーゼ、DNAもしくはRNAポリメラーゼ、および/またはリガーゼと組み合わせてもよい)、ならびにミスマッチ修復機構(例えば、エンドヌクレアーゼ(例:T7エンドヌクレアーゼI;MutS、MutH、および/またはMutL)を使用、任意で、修復用の1種以上のエキソヌクレアーゼ、エンドヌクレアーゼ、ヘリカーゼ、DNAもしくはRNAポリメラーゼ、および/またはリガーゼと組み合わせてもよい)。これらの種類の修復機構を容易に提供するために市販の酵素混合物、例えばPreCR(登録商標)修復ミックス(New England Biolabs社, Ipswich MA)が利用可能であり、これは、Taq DNAリガーゼ、エンドヌクレアーゼIV、Bst DNAポリメラーゼ、Fpg、ウラシル-DNAグリコシラーゼ(UDG)、T4 PDG (T4エンドヌクレアーゼV)、およびエンドヌクレアーゼVIIIを含む。
コード化されたライブラリーをタグ付けするための方法
本発明は、コードする関係がタグの配列と化学物質の構造単位(またはビルディングブロック)の間に確立され得るように、オリゴヌクレオチドタグを化学物質と機能的に結び付けるための方法を特徴とする。特に、化学物質のアイデンティティおよび/または履歴をオリゴヌクレオチドの塩基配列から推測することが可能である。この方法を用いて、多様な化学物質またはメンバー(例えば、小分子もしくはペプチド)を含むライブラリーは、特定のタグ配列によりコード化され得る。
一般に、これらの方法はヘッドピースの使用を含み、該ヘッドピースは化学的に合成され得る少なくとも1つの官能基と、オリゴヌクレオチドタグが結合(またはライゲーション)され得る少なくとも1つの官能基とを有する。結合は、任意の有用な手段によって、例えば、酵素的結合(例えば、RNAリガーゼおよび/またはDNAリガーゼの1種以上によるライゲーション)によって、または化学的結合(例えば、求核剤と脱離基などの、2つの官能基の間の置換反応)によって、達成することができる。
ライブラリー内の多数の化学物質を生成するには、ヘッドピースを含む溶液を複数のアリコートに分割し、次いで、マルチウェルプレートのウェルのような、物理的に隔離された多数の区画の中に配置する。一般的に、これは「スプリット」(split)の工程である。各区画またはウェル内で、各アリコート内のオリゴヌクレオチドタグを用いて連続的な化学反応およびライゲーション工程を実施する。化学反応条件とタグの配列間の関係は関連している。反応およびライゲーション工程は任意の順序で行うことができる。その後、反応してライゲーションされたアリコートを組み合わせて、つまり「プール」して、任意にこの時点で精製を行ってもよい。精製は、複合体の可逆的固定化、溶媒および任意の試薬/混入物の除去、ならびに、後続の工程の前の複合体の解放によって行ってもよい。これらのスプリット・アンド・プール工程は、必要に応じて、繰り返すことができる。
次に、ライブラリーは、本明細書に記載されるように、特性もしくは機能について試験および/または選択され得る。例えば、タグ付けした化学物質の混合物は、第1集団が特定の生物学的標的に結合するメンバーに関して濃縮され、第2集団がより濃縮されていない(例えば、負の選択または正の選択による)、少なくとも2つの集団に分離することができる。次に、第1集団を(例えば、関心対象の標的を提供するカラムで溶出することにより、またはアリコートを関心対象の標的とインキュベートすることにより)選択的に捕捉し、必要に応じて、任意の洗浄、精製、負の選択、正の選択、または分離の工程などにより、さらに分析または試験することができる。
最後に、選択した集団内の1つ以上のメンバー(または化学物質)の化学的履歴を、機能的に連結されたオリゴヌクレオチドの配列によって決定することが可能である。その配列をコード化されたライブラリーメンバーの化学的履歴と相関させることで、この方法は、所定の特性を有する(例えば、標的タンパク質に結合し、それによって治療効果を誘発する傾向が高い)ライブラリーの個々のメンバーを同定することができる。さらなる試験と最適化のために、治療用の候補化合物はその後、それらに結び付いたオリゴヌクレオチドタグの有無にかかわらず、同定したライブラリーメンバーを合成することによって、調製され得る。
本明細書に記載の方法は、ライブラリーを多様化するために、またはライブラリーのメンバーを照合するために、任意の工程をいくつでも含むことができる。本明細書に記載される任意のタグ付け方法の場合、連続する「n」個の数のタグを、追加の「n」の数のライゲーション、分離、および/またはリン酸化工程により付加することができる。例示的な任意の工程には、以下が含まれる:1種以上の制限エンドヌクレアーゼを用いた、ライブラリーメンバーと結び付いたコードオリゴヌクレオチドの制限;結び付いたコードオリゴヌクレオチドの、例えば本明細書に記載されるような、任意の修復酵素による、修復;ライブラリーメンバーと結び付いたコードオリゴヌクレオチドの末端の一方または両方への1つ以上のアダプター配列(例えば、増幅および配列決定のためのプライミング配列を提供する、または配列の固定化のためのビオチンなどの標識を提供する1つ以上のアダプター配列)のライゲーション;逆転写酵素、転写酵素、または他の鋳型依存性ポリメラーゼを用いた複合体中の集合タグの逆転写または転写、任意でその後の逆転写;複合体中の集合タグの、例えばPCRを用いた、増幅;例えば、細菌の形質転換、エマルジョン形成、希釈、表面捕捉技術などによる、複合体中の集合タグの1つ以上の集団のクローン単離物の生成;例えば、ヌクレオチドの鋳型依存的重合のための鋳型としてクローン単離物を用いることによる、複合体中の集合タグの1つ以上の集団のクローン単離物の増幅;ならびに、例えば、可逆的終結化学による蛍光標識ヌクレオチドを用いた鋳型依存的重合のための鋳型としてクローン単離物を用いることによる、複合体中の集合タグの1つ以上の集団のクローン単離物の配列決定。オリゴヌクレオチドタグを増幅し、配列決定するためのさらなる方法は、本明細書に記載される。
これらの方法は、特性または機能を備えたいくつもの化学物質を、例えば選択工程で、同定および発見するために使用することができる。望ましい特性または機能は、所望の機能を有するライブラリー中のメンバーまたは関連するメンバーの少なくとも1つの同時濃縮により、ライブラリーを少なくとも2つの部分に分割するためのベースとして使用することができる。特定の態様では、この方法は、治療上関心のあるタンパク質と結合する、または該タンパク質を不活性化する、小さい薬物様ライブラリーメンバーを同定することを含む。別の態様では、規定された化学的条件下での所定のビルディングブロックの反応がコンビナトリアルな複数の分子(または分子のライブラリー)を生成し、その際に1つ以上の分子が特定のタンパク質のための治療薬としての有用性をもち得るように、一連の化学反応が設計され、かつビルディングブロックのセットが選択される。例えば、化学反応およびビルディングブロックは、キナーゼ阻害剤に共通して存在する構造グループを有するライブラリーを作成するように選択される。これらの場合のいずれにおいても、オリゴヌクレオチドタグはライブラリーメンバーの化学的履歴をコードしており、それぞれの場合に、化学的可能性のコレクションは特定のタグの組み合わせによって表され得る。
一態様では、化学物質のライブラリーまたはその一部を、生物学的標的と、該ライブラリーの少なくとも1つのメンバーが該標的に結合するのに適した条件下で接触させ、続いて該標的に結合しないライブラリーメンバーを除去し、標的と結び付いた1つ以上のオリゴヌクレオチドタグを解析する。この方法は、任意で、当技術分野で公知の方法によりタグを増幅することを含み得る。例示的な生物学的標的としては、酵素(例えば、キナーゼ、ホスファターゼ、メチラーゼ、デメチラーゼ、プロテアーゼ、およびDNA修復酵素)、タンパク質:タンパク質相互作用に関与するタンパク質(例えば、受容体のためのリガンド)、受容体標的(例えば、GPCRおよびRTK)、イオンチャンネル、細菌、ウイルス、寄生虫、DNA、RNA、プリオン、および炭水化物が挙げられる。
別の態様では、標的に結合する化学物質は、増幅に供することなく、直接解析される。例示的な解析方法としては、エバネッセント共鳴フォトニック結晶解析を含む、マイクロアレイ解析;タグをデコンボリューションするためのビーズベースの方法(例えば、hisタグを用いることによる);ラベルフリーのフォトニック結晶バイオセンサー分析(例えば、SRU Biosystems社(Woburn, MA)製のBIND(登録商標)Reader);またはハイブリダイゼーションに基づくアプローチ(例えば、タグのライブラリー中に存在する配列に相補的な固定化オリゴヌクレオチドのアレイを用いることによる)が挙げられる。
さらに、化学反応性の対(または官能基)は、固相オリゴヌクレオチド合成スキームに容易に含めることができ、オリゴヌクレオチドの効率的な化学的ライゲーションを支持するであろう。また、その結果得られるライゲーションされたオリゴヌクレオチドは、1種以上のポリメラーゼを用いた鋳型依存的重合のための鋳型として働くことができる。したがって、コード化されたライブラリーをタグ付けするための、本明細書に記載の結合工程はどれも、酵素的ライゲーションおよび/または化学的ライゲーション技術の1つ以上を含むように改変することができる。例示的なライゲーション技術には、例えば1種以上のRNAリガーゼおよび/またはDNAリガーゼの使用などの、酵素的ライゲーション;ならびに、例えば化学反応性の対(例えば、置換されてもよいアルキニルおよびアジド官能基を含む対)の使用などの、化学的ライゲーションが含まれる。
さらに、1つ以上のライブラリーは、スプリット・アンド・ミックス工程で組み合わせることができる。2つ以上のライブラリーの混合を可能にするために、ライブラリーメンバーは、例えば、ライブラリー識別タグ中に、ライゲーションされるタグ中に、または本明細書に記載されるような、ヘッドピース配列の一部として、1つ以上のライブラリー識別配列を含むことができる。
ライブラリー内の化学物質をコードするための方法
本発明の方法は、オリゴヌクレオチドタグでコード化された多様な多数の化学物質を有するライブラリーを合成するために使用することができる。ビルディングブロックおよびコードDNAタグの例は米国特許出願公開第2007/0224607号に見出され、係るビルディングブロックおよびタグは参照により本明細書に組み入れられる。
各化学物質は、1つ以上のビルディングブロックおよび任意で足場から形成される。足場は、特定の配置(例えば、ヘテロアリール環のまわりに空間的に配置された3つのノードを提供するトリアジンまたは線形配置)で1つ以上の多様性ノードを提供するのに役立つ。
ビルディングブロックおよびそれらのコードタグは、複合体を形成するためにヘッドピースに直接または(例えば、スペーサーを介して)間接的に付加され得る。ヘッドピースがスペーサーを含む場合、ビルディングブロックまたは足場はスペーサーの末端部に付加される。スペーサーが存在しない場合、ビルディングブロックはヘッドピースに直接付加され得るか、またはビルディングブロックそれ自体が、ヘッドピースの官能基と反応するスペーサーを含むことができる。例示的なスペーサーおよびヘッドピースは本明細書に記載される。
足場は、任意の有用な方法で付加することができる。例えば、足場は、スペーサーまたはヘッドピースの末端部に付加され、連続するビルディングブロックが足場の利用可能な多様性ノードに付加され得る。別の例では、ビルディングブロックAnが最初にスペーサーまたはヘッドピースに付加され、その後、足場Sの多様性ノードがビルディングブロックAnの官能基と反応する。特定の足場をコードするオリゴヌクレオチドタグを、任意で、ヘッドピースまたは複合体に付加してもよい。例えば、Snはn個の反応容器(ここでnは2以上の整数である)内で複合体に付加され、タグSn(すなわち、タグS1、S2、...Sn-1、Sn)は複合体の官能基に結合される。
ビルディングブロックは複数の合成工程で付加することができる。例えば、ヘッドピース(任意で、結合されたスペーサーを有する)のアリコートをn個の反応容器に分離する(ここでnは2以上の整数である)。第1工程で、ビルディングブロックAnをn個の反応容器のそれぞれに添加する(すなわち、ビルディングブロックA1、A2、...An-1、Anを反応容器1、2、...n-1、nに添加する)(ここでnは整数であり、各ビルディングブロックAnは唯一である)。第2工程では、足場Sを各反応容器に添加してAn-S複合体を形成する。任意で、足場Snを各反応容器に添加してAn-Sn複合体を形成することができる(ここでnは2を超える整数であり、各足場Snは唯一であり得る)。第3工程では、ビルディングブロックBnを、An-S複合体を含有するn個の反応容器のそれぞれに添加する(すなわち、ビルディングブロックB1、B2、...Bn-1、Bnを、A1-S、A2-S、... An-1-S、An-S複合体を含有する反応容器1、2、...n-1、nに添加する)(ここで各ビルディングブロックBnは唯一である)。さらなる工程で、ビルディングブロックCnを、Bn-An-S複合体を含有するn個の反応容器のそれぞれに添加することができる(すなわち、ビルディングブロックC1、C2、...Cn-1、Cnを、B1-A1-S ... Bn-An-S複合体を含有する反応容器1、2、...n-1、nに添加する)(ここで各ビルディングブロックCnは唯一である)。結果として得られるライブラリーは、n3個のタグを有するn3個の複合体を含むだろう。このようにして、追加の合成工程を用いて追加のビルディングブロックを結合させることにより、ライブラリーをさらに多様化することができる。
ライブラリーを形成した後、得られた複合体は、必要に応じて精製し、重合または、例えばテイルピースへの、ライゲーション反応に供することができる。この一般的な戦略は、追加の多様性ノードおよびビルディングブロック(例えば、D、E、Fなど)を含むように拡張することができる。例えば、第1多様性ノードをビルディングブロックおよび/またはSと反応させて、オリゴヌクレオチドタグでコードする。次に、追加のビルディングブロックを得られた複合体と反応させ、後続の多様性ノードを追加のビルディングブロックで誘導体化して、これを重合またはライゲーション反応に用いられるプライマーでコードする。
コード化されたライブラリーを形成するために、オリゴヌクレオチドタグは各合成工程の後または前に複合体に付加される。例えば、ビルディングブロックAnを各反応容器に添加する前または後に、タグAnをヘッドピースの官能基に結合させる(すなわち、タグA1、A2、...An-1、Anを、ヘッドピースを含有する反応容器1、2、...n-1、nに添加する)。各タグAnは、唯一の各ビルディングブロックAnと相関する固有の配列を有し、タグAnの配列を決定することは、ビルディングブロックAnの化学構造を提供する。このように、追加のタグは、追加のビルディングブロックまたは追加の足場をコードするために使用される。
さらに、複合体に付加された最後のタグは、プライマー結合配列を含むか、またはプライマー結合配列の(例えば、ライゲーションによる)結合を可能にするための官能基を提供することができる。プライマー結合配列は、複合体のオリゴヌクレオチドタグの増幅および/または配列決定のために使用され得る。例示的な増幅および配列決定方法には、ポリメラーゼ連鎖反応(PCR)、直鎖増幅(LCR)、ローリングサークル増幅(RCA)、または核酸配列の増幅もしくは決定のために当技術分野で知られている他の方法が含まれる。
これらの方法を使用して、多数のコード化された化学物質を有する大規模ライブラリーを形成することが可能である。例えば、ヘッドピースを、スペーサーおよび1,000の異なる変異体を含むビルディングブロックAn(すなわち、n=1,000)と反応させる。各ビルディングブロックAnにつき、DNAタグAnをヘッドピースにライゲーションさせるか、またはプライマー伸長させる。これらの反応は1,000ウェルプレートまたは10×100ウェルプレートで行うことができる。すべての反応をプールし、必要に応じて精製し、第2セットのプレートに分割することができる。次に、同じ手順をビルディングブロックBnで実施することができ、ビルディングブロックBnもまた1,000の異なる変異体を含む。DNAタグBnをAn-ヘッドピース複合体にライゲーションさせて、すべての反応をプールする。得られたライブラリーは、タグの1,000,000の異なる組み合わせによってタグ付けされたAn×Bnの1,000×1,000の組み合わせ(すなわち、1,000,000の化合物)を含んでいる。同じアプローチは、ビルディングブロックCn、Dn、Enなどを付加するように拡張することができる。その後、作成されたライブラリーは、標的に結合する化合物を同定するために使用され得る。ライブラリーに結合する化学物質の構造は、必要に応じて、DNAタグのPCRおよび配列決定により評価して、濃縮された化合物を同定することができる。
この方法は、各ビルディングブロックの付加後のタグ付けを回避するように、またはプールする(もしくは混合する)ことを回避するように、改変され得る。例えば、この方法は、ビルディングブロックAnをn個の反応容器に添加し(ここでnは2以上の整数である)、同一のビルディングブロックB1を各反応ウェルに添加することによって、改変することができる。ここで、B1は各化学物質について同一であり、したがって、このビルディングブロックをコードするオリゴヌクレオチドタグは必要とされない。ビルディングブロックを付加した後、複合体をプールしても、プールしなくてもよい。例えば、ライブラリーはビルディングブロック付加の最終工程の後にプールされず、標的に結合する化合物を同定するためにプールが個別にスクリーニングされる。合成後に反応のすべてをプールすることを避けるために、例えば、結合アッセイ、例えばELISA、SPR、ITC、Tmシフト、SECなどを用いて、ハイスループット形式(例えば、384ウェルプレートおよび1,536ウェルプレート)でセンサー表面上の結合をモニターすることができる。例えば、ビルディングブロックAnはDNAタグAnによりコードされ得、ビルディングブロックBnはウェルプレート内のその位置によってコードされ得る。その後、候補化合物は、結合アッセイ(例えば、ELISA、SPR、ITC、Tmシフト、SECなど)を用いることによって、かつ配列決定、マイクロアレイ解析および/または制限消化解析でAnタグを解析することによって、同定することができる。この解析は、望ましい分子をもたらすビルディングブロックAnおよびBnの組み合わせの同定を可能にする。
増幅の方法は、任意で、複数の水性マイクロリアクターを作成するために油中水型エマルジョンを形成することを含み得る。反応条件(例えば、複合体の濃度およびマイクロリアクターのサイズ)は、平均して、化合物ライブラリーの少なくとも1つのメンバーを有するマイクロリアクターを提供するように、調整することができる。各マイクロリアクターはまた、標的と、複合体もしくは複合体の一部(例えば、1つ以上のタグ)に結合することが可能なおよび/または標的に結合することが可能な単一のビーズと、核酸増幅を実施するために必要な1種以上の試薬を含有する増幅反応液とを含むことができる。マイクロリアクター内でタグを増幅した後、タグの増幅コピーはマイクロリアクター中のビーズに結合するだろう。被覆されたビーズは任意の有用な方法で識別することができる。
関心対象の標的に結合する第1ライブラリーからのビルディングブロックが同定されたら、第2ライブラリーを反復様式で調製することができる。例えば、1つまたは2つの追加の多様性のノードを付加することができ、第2ライブラリーを本明細書に記載するように作成して、サンプリングする。このプロセスは、所望の分子的および薬学的特性を有する分子を作成するために、必要に応じて何回でも繰り返すことができる。
さまざまなライゲーション技術が足場、ビルディングブロック、スペーサー、リンケージ、およびタグを付加するために使用され得る。したがって、本明細書に記載の結合工程はどれも、1つ以上の有用なライゲーション技術を含むことができる。例示的なライゲーション技術としては、本明細書に記載されるような、1種以上のRNAリガーゼおよび/またはDNAリガーゼの使用などの、酵素的ライゲーション;ならびに、本明細書に記載されるような、化学反応性の対の使用などの、化学的ライゲーションが挙げられる。
実施例1:化学的ライゲーションのための構成成分の調製(二本鎖ヘッドピースおよび二本鎖タグ)
5'末端が化学的にリン酸化されたヘッドピースHP006
(ZはC6-アミノdT修飾を表す)は、Biosearch社から入手した。次に、以下の手順を用いて、Fmoc-NH-PEG4-CH2CH2COOH (Chem Pep社)を使用するDMT-MMアシル化により、HP006を修飾した。
50当量のFmoc-NH-PEG4-CH2CH2COOH (Chem Pep社)をDMA(ジメチルアセトアミド, Acros社)に溶解し、新たに水に溶解した50当量のDMT-MM (4-(4,6-ジメトキシ-1,3,5-トリアジン-2-イル)-4-メチルモルホリニウムクロリド, Acros社)と共に、0.5Mホウ酸緩衝液pH9.5に溶解した1当量のHP006に加えた。この反応を2〜4時間進行させ、続いて50当量のFmoc-NH-PEG4-CH2CH2COOHおよび50当量のDMT-MMの2回目の添加を行い、その後反応を一晩進行させた。LCMSで反応の完了を追跡した。
生成物をエタノール沈殿させ、3,000MWカットオフの遠心式スピンフィルター(Millipore社)を用いたサイズ排除スピンろ過により脱塩した。生成物のLCMSから、分子量(MW)は6,803.3 (計算値6,802.5)と確認された。
オリゴヌクレオチドTagZA1+_deltaC_5OH:
と、TagZB_CNIm_bot3OH:
(5'末端が化学的にリン酸化されている)と、PrA_CNIm_bot5P:
(5'末端が化学的にリン酸化されている)と、PrA_top_extraC_3P:
(5'末端と3'末端の両方が化学的にリン酸化されている)をIDT DNAから入手した。
次に、オリゴ類tagZA1+_deltaCおよびTagZB_CNIm_bot3OHを水に溶解して2mMの最終濃度とし、等モル比で一緒に混合して二本鎖TagZAの1mM溶液を作った。
オリゴ類PrA_CNIm_bot5PおよびPrA_top_extraC_3Pもまた、水に溶解して2mMの最終濃度とし、等モル比で一緒に混合して二本鎖「CNIm-PrA」の1mM溶液を作った。
次に、Fmoc-アミノ-PEG4-HP006を、T4 DNAリガーゼおよび標準的なライゲーションプロトコルを用いて、1当量の二本鎖CNIm-PrAに酵素的にライゲーションさせた。得られたオリゴ(Fmoc-アミノ-PEG4-HP013)をエタノール沈殿させ、Illustra NAP-5カラム(GE Healthcare Life Science社)を用いて脱塩した。LCMSにより分子量13,772 (計算値13,770.7)を確認した。
実施例2:二本鎖ヘッドピースの二本鎖タグへの化学的ライゲーション
Fmoc-アミノ-PEG4-HP013および二本鎖TagZAオリゴヌクレオチドを、800mM NaClと8mM ZnCl2を含有する80mM MES緩衝液pH6.0中に溶解して0.33mMの最終濃度とした。1-シアノイミダゾールをDMF中1Mの濃度に新たに溶解し、この反応に12時間にわたって1〜2回添加して1-シアノイミダゾールの最終濃度を150mMとした。その後、この反応を4℃で一晩インキュベートした。
完了した反応を変性ゲル電気泳動ならびにLCMSによって分析した。次いで、サンプルを15%変性分析用TBE-8M尿素ゲル上で分離し、蛍光色素(254nm)を含むTLCプレート上でのUVシャドウイング(shadowing)によって可視化した。LCMSによって、分子量25,417.3 (計算値25,415.3)を有するライゲーションさせた二本鎖生成物の形成が約70%の転化率で確認された。分子量20,254.7および18,935.4を有するさらなる生成物が観察されたが、これは(片側ライゲーションさせた)トップ鎖またはボトム鎖ライゲーション生成物のいずれかに相当した。
15%TBE-8M尿素変性ゲルを用いた化学的ライゲーション生成物の分析用ゲル電気泳動を図2に示す:
1 - 出発物質 - Fmoc-アミノ-PEG4-HP013;
2 - ds Tag ZA、これはtagZA1_deltaC_5OHとTagZA1+_CNIm_bot3OHの等モル混合物である;
3、4、5 - シアノイミダゾールライゲーション反応;
6 - 酵素的ライゲーション対照(T4 DNAリガーゼ)は、ボトム鎖のみ、つまり3'OHと5'リン酸間の接合部をライゲーションさせる;3'リン酸と5'OH間の接合部はこの酵素ではライゲーションされない。
化学的ライゲーション生成物のLCMSを図3に示す(各パネルにおいて、上 - UV (260nm) LCトレース、中間 - TIC、下 - 質量スペクトル)。
A - 出発物質:二本鎖TagZAの混合物(MW 5,182および6,500.2Da)ならびにFmoc-アミノ-PEG4-HP013 (13,772)。
B - 化学的ライゲーション反応の生成物:二重にライゲーションさせた生成物:MW 25,417.3 (計算値25,415.3)。片側ライゲーションさせた(トップ鎖またはボトム鎖のいずれかの)生成物:MW 20,254.7および18,935.4。
実施例3:化学的ライゲーション反応生成物のFmoc脱保護
1-シアノイミダゾールライゲーション反応の生成物をエタノール沈殿させ、水に溶解し、10%ピペリジン中で室温にて2時間インキュベートすることにより脱保護した。この脱保護工程の後、この物質を15%TBE-8M尿素ゲルで精製した。精製済みサンプルに対して実施したLC-MSによって、脱保護されたアミノ-PEG4-HP013-TagZA (MW 25,192.4;計算値25,193.2)ならびに2つの脱保護された片側ライゲーション生成物(MW 18,738.6および20,029.3)の存在が確認された。
LCトレースの積分から、全長生成物の相対収率は64%であり、一方片側ライゲーション生成物はそれぞれ約18%である。鎖あたりのライゲーションの効率は、83%と概算することができる。
ピペリジンによるアミノ脱保護の模式図を図4Aに示す。ライゲーション反応生成物のゲル精製:15%TBE-尿素ゲル、UVシャドウイングを図4Bに示す。精製された物質のLCMS分析を図4Cに示す。MW 25,192.4Daでの全長ライゲーション生成物、MW 18,738.6および20,029.3Daでの片側ライゲーション生成物。
実施例4:Fmocによるアミノ基保護の必要性の説明
HP006は、上記のように、ループ中のTでのアミノ-C6リンカーを特徴とするが、そのHP006を1-シアノイミダゾールを含む反応混合物中で4℃にて12時間インキュベートした。インキュベーション後、HP006をエタノール沈殿させ、10%ピペリジン中で室温にて2時間インキュベートし、再度エタノール沈殿させた。
この物質のLCMS分析は、混合物中に2つの生成物、MW 6,333.4DaのHP006およびMW 6,426.4の反応生成物(30〜40%の転化率)が存在することを示した。94Daの増加分は、HP006のN-イミダゾールグアニジン誘導体の形成に相当する。アミノ基のFmoc保護は、この望ましくない反応を完全に排除する。
HP006と1-シアノイミダゾールとの反応生成物のデコンボリューションした質量スペクトルを図5Aに示す。MW 6,333.4Daは非修飾HP006に対応し、MW 6,426.4はHP006のN-イミダゾールグアニジン誘導体に対応する。
HP006のN-イミダゾールグアニジン誘導体の生成の模式図を図5Bに示す。
実施例5:代替二価金属イオンによる化学的ライゲーション
シアノイミダゾール媒介化学的ライゲーションを、8mMの代替二価金属に置き換えて、上記のように実施した。かなりのライゲーション収率が、CoCl2 (30%の全長生成物、70%の片側ライゲーション生成物)、MnCl2 (75%の全長生成物、25%の片側ライゲーション生成物)およびZnCl2 (60%の全長生成物、30%の片側ライゲーション生成物)を用いて観察された。鉛、マグネシウム、スズおよび銅の可溶性二価塩は有意なライゲーションをもたらさなかった。
実施例6:代替隣接ヌクレオチドを用いた化学的ライゲーション
以下の化学的にリン酸化されたオリゴヌクレオチドをIDT DNAから入手した。
トップ鎖、ペア1:
PrA_top:
Tag_ZA1+:
トップ鎖、ペア2:
PrA_top_extraC_3P:
tagZA1_deltaC_5OH:
(太字はオーバーラップ配列)
ボトム鎖、ペアA:
PrA_CNIm_bot5P:
TagZB_CNIm_bot3OH:
ボトム鎖、ペアB:
PrA_CNIm_bot5OH:
TagZB_CNIm_bot3P:
オリゴヌクレオチドの4つの組み合わせを、表2に示すように、1-シアノイミダゾールライゲーションの効率について試験した。ボトム鎖は、6ヌクレオチドと7ヌクレオチドの両方のオーバーラップ(80%を超える)で、隣接するヌクレオチドの両方の試験した組み合わせ(CとCおよびCとT)において、一貫して高いライゲーション収率を示した一方で、トップ鎖のライゲーションは隣接するヌクレオチドの正体に明らかに依存しており、例えば、CのGへのライゲーションは非効率的であったが、CとCの接合部は高収率でライゲーションされた。
(表2)ライゲーション接合部設計の概要と化学的ライゲーションの収率
他の態様
本発明の記載された方法およびシステムのさまざまな修飾および変更は、本発明の範囲および精神から逸脱することなく、当業者には明らかであろう。本発明は、特定の所望の態様に関連して説明してきたが、特許請求の範囲に記載の本発明は、そのような特定の態様に不当に限定されるべきではない、ことを理解すべきである。実際に、医学、薬理学、または関連分野の当業者には明らかである、本発明を実施するための前記方法のさまざまな改変は、本発明の範囲内にあることが意図される。