JP2022542756A - 既存の化合物ライブラリーのタグ付け及びコード付けのための方法 - Google Patents

既存の化合物ライブラリーのタグ付け及びコード付けのための方法 Download PDF

Info

Publication number
JP2022542756A
JP2022542756A JP2021573160A JP2021573160A JP2022542756A JP 2022542756 A JP2022542756 A JP 2022542756A JP 2021573160 A JP2021573160 A JP 2021573160A JP 2021573160 A JP2021573160 A JP 2021573160A JP 2022542756 A JP2022542756 A JP 2022542756A
Authority
JP
Japan
Prior art keywords
group
groups
headpiece
library
oligonucleotide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021573160A
Other languages
English (en)
Inventor
アンソニー ディー. キーフ
ゼン チェン
Original Assignee
エックス-ケム インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by エックス-ケム インコーポレイテッド filed Critical エックス-ケム インコーポレイテッド
Publication of JP2022542756A publication Critical patent/JP2022542756A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1068Template (nucleic acid) mediated chemical library synthesis, e.g. chemical and enzymatical DNA-templated organic molecule synthesis, libraries prepared by non ribosomal polypeptide synthesis [NRPS], DNA/RNA-polymerase mediated polypeptide synthesis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • C07K1/13Labelling of peptides
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/04Methods of creating libraries, e.g. combinatorial synthesis using dynamic combinatorial chemistry techniques
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/50Physical structure
    • C12N2310/53Physical structure partially self-complementary or closed
    • C12N2310/531Stem-loop; Hairpin

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Microbiology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Saccharide Compounds (AREA)
  • Medicinal Preparation (AREA)

Abstract

本開示は、既存の化合物をオリゴヌクレオチドタグでコード付けする方法に関する。特に、識別情報をコード付けするために、既存の化合物のライブラリーをオリゴヌクレオチドでタグ付けし、それによって、所望の特性を有する化合物をスクリーニング及び識別する方法を改善する。

Description

配列表
本出願は、ASCII形式で電子的に提出された配列表を含み、参照によりその全体が本明細書に組み込まれる。2020年7月23日に作成されたそのASCIIコピーは、50719-060WO2_Sequence_Listing_07.23.20_ST25と命名され、3,747バイトの大きさである。
発明の背景
一般に、本発明は、化合物のDNAコード付けされたライブラリーならびにそのようなライブラリーを使用及び作成する方法に関する。本発明はまた、そのようなライブラリーで使用するための組成物に関する。
既存の化合物ライブラリーは、多数の多様な化合物を提供することができ、創薬に有益であり得る。そのようなライブラリーをDNAタグでコード付けすることは、多数の標的に対する多数の既存の化合物の迅速なスクリーニング及び問い合わせを可能にし得る。
本発明は、既存の化合物の大きなライブラリーに、ライブラリーの各メンバーを識別情報でコード付けするオリゴヌクレオチドタグでタグ付けする方法を特徴とする。本方法は任意に、既存の化合物を効率的にコード付けするために、オリゴヌクレオチドタグの直交組み合わせを使用することを含む。既存の化合物は、例えば、コード化オリゴヌクレオチドタグの導入前に合成される。オリゴヌクレオチドタグは共有結合している。既存の化合物のライブラリーは、架橋基を意図的に導入することなく合成することができる。既存の化合物は、二官能性リンカーへの結合によってコード付けされ、二官能性リンカーはその後、化合物の同一性をコード付けするオリゴヌクレオチドタグに結合されるヘッドピースに結合される。タグ組み合わせ同一性が確立されるとき、それを使用して、コード付けされた分子の同一性を決定し得る。
コード化DNA配列上の単一のビルディングブロックの表示と、少なくとも1つのさらなる化学工程、及びさらなるコード化オリゴヌクレオチドへの少なくとも1つのさらなる結合による後続の多様化とによって作製される化学合成した小分子を含む、DNAコード付けされた化学ライブラリー。そのようなライブラリーは、コード化オリゴヌクレオチドの対応する組み合わせ集合体によってコード付けされる化学合成ビルディングブロック組み合わせの組み合わせ集合体を含有する。コード化オリゴヌクレオチドの個々の組み合わせの配列を決定することにより、それらが結合されるコード付けされた化学物質の化学履歴を決定することができ、したがって、複雑な混合物に由来する場合でも、個々のコード付けされた化学構造の決定が可能になる。そのようなライブラリーを親和性媒介性発見プロセスと組み合わせて利用することは、疾患関連タンパク質等の治療関連標的を含む標的に対する組み合わせで生成されたリガンドの発見に関連して非常に有用である。
しかし、すべての化学構造が、組み合わせプロセスに適応可能な化学工程を使用して容易にアクセスできるわけではない。例えば、すべての化学合成可能な分子が、コード化オリゴヌクレオチドの酵素的完全性を維持することに適合する方法で容易に生成されるわけではない。さらに、潜在的な目的の多くの分子は、従来の(例えば、コード付けされていない)スクリーニングコレクション中に既に存在し、結合可能な形態でのそれらの再合成は、面倒で時間がかかり、かつ高価であり得る。
本発明は、既存の化合物のコレクションから開始し、大量の有用な情報をコード付けするプロセスにおいてコード化オリゴヌクレオチドの組み合わせを使用して、コレクションの各メンバーをコード付けする手段を提供する。次いで、このようなコード付けされた分子のライブラリーを、混合物として標的に対してスクリーニングすることができる。標的(例えば、タンパク質等の治療標的)へのリガンドを見つけるための化合物の既存のライブラリーの結合バージョンをスクリーニングすることにより、ヒット化合物(例えば、薬物リード、薬物候補、及び/またはツール化合物)を発見するための堅牢な方法が可能になる。
第1の態様において、本発明は、コード付けされた化学物質の生成方法を特徴とし、本方法は、(a)化学物質を、カルベン前駆体基及び第1の架橋基を含む二官能性リンカーと、化学物質及び第1の架橋基を含む第1の複合体を生成するのに十分な条件下で反応させる工程、(b)第1の複合体を、オリゴヌクレオチドヘッドピース及び第2の架橋基を含む第2の複合体と、化学物質及びオリゴヌクレオチドヘッドピースを含む第3の複合体を生成するのに十分な条件下で反応させる工程、ならびに(c)第1のオリゴヌクレオチドタグを第3の複合体のオリゴヌクレオチドヘッドピースにライゲーションする工程であって、それによって、コード付けされた化学物質が生成される、工程を含む。
いくつかの実施形態において、二官能性リンカーは、揮発性である。
いくつかの実施形態において、二官能性リンカーは、以下の構造
Figure 2022542756000001
を有し、
式中、Aは、カルベン前駆体基であり、Lは、リンカーであり、Rは、第1の架橋基である。
いくつかの実施形態において、カルベン前駆体基は、光反応性カルベン前駆体基である。
いくつかの実施形態において、光反応性カルベン前駆体基は、ジアジリンである。
いくつかの実施形態において、カルベン前駆体基は、以下の構造
Figure 2022542756000002
を含む。
いくつかの実施形態において、Lは、C~Cアルキレンである。特定の実施形態において、Lは、Cアルキレンである。
いくつかの実施形態において、第1の架橋基は、スルフヒドリル反応性架橋基、アミノ反応性架橋基、カルボキシル反応性架橋基、カルボニル反応性架橋基、またはトリアゾール形成架橋基である。
いくつかの実施形態において、第1の架橋基は、トリアゾール形成架橋基である。
いくつかの実施形態において、第1の架橋基は、アジドである。
いくつかの実施形態において、二官能性リンカーは、以下の構造
Figure 2022542756000003
を有する。
いくつかの実施形態において、第2の複合体は、以下の構造
Figure 2022542756000004
を有し、
式中、Bは、オリゴヌクレオチドヘッドピースであり、Lは、リンカーであり、Rは、第2の架橋基である。
いくつかの実施形態において、オリゴヌクレオチドヘッドピースは、ヘアピン構造を含む。
いくつかの実施形態において、第2の架橋基は、スルフヒドリル反応性架橋基、アミノ反応性架橋基、カルボキシル反応性架橋基、カルボニル反応性架橋基、またはトリアゾール形成架橋基である。
いくつかの実施形態において、第2の架橋基は、トリアゾール形成架橋基である。
いくつかの実施形態において、第2の架橋基はジベンゾシクロオクチン基を含む。
いくつかの実施形態において、第2の架橋基は、以下の構造
Figure 2022542756000005
を含む。
いくつかの実施形態において、この方法は、第2の複合体を生成するのに十分な条件下で、オリゴヌクレオチドヘッドピース及び架橋基を含む第4の複合体を式IIIの構造を有する第5の複合体と反応させることによって、第2の複合体を生成する工程をさらに含み、
Figure 2022542756000006
式中、R及びRは、独立して架橋基であり、Lは、リンカーである。
いくつかの実施形態において、Rは、トリアゾール形成架橋基である。特定の実施形態において、Rは、ジベンゾシクロオクチン基を含む。さらに他の実施形態において、Rは、以下の構造
Figure 2022542756000007
を含む。
いくつかの実施形態において、Rは、スルフヒドリル反応性架橋基、アミノ反応性架橋基、カルボキシル反応性架橋基、カルボニル反応性架橋基、またはトリアゾール形成架橋基である。特定の実施形態において、Rは、アミノ反応性架橋基である。さらに他の実施形態において、Rは、N-ヒドロキシスクシンイミド基を含む。
いくつかの実施形態において、第2の複合体は、以下の構造
Figure 2022542756000008
を有し、
式中、Bは、オリゴヌクレオチドヘッドピースであり、Lは、リンカーであり、Rは、第2の架橋基である。
いくつかの実施形態において、反応性基は、アミノ基である。
いくつかの実施形態において、方法は、工程(c)の前に、ヘッドピース伸長配列、例えば、PCRのためのプライマー結合配列を添加するための定常配列のライゲーションをさらに含む。
いくつかの実施形態において、方法は、工程(c)の後に、コード付けされた化学物質に1つ以上のさらなるタグをライゲーションする工程をさらに含む。
いくつかの実施形態において、方法は、工程(c)の後に、コード付けされた化学物質に少なくとも3つのさらなるタグをライゲーションする工程をさらに含む。
いくつかの実施形態において、方法は、ワンポットライゲーションを含む。いくつかの実施形態において、ワンポットライゲーションは、ヘッドピースへのヘッドピース伸長配列のライゲーションと、コード付けされた化学物質への少なくとも3つのさらなるタグのライゲーションとを含む。
いくつかの実施形態において、第1のオリゴヌクレオチドタグ及び1つ以上のさらなるタグは、直交重複アーキテクチャを含む。
いくつかの実施形態において、方法は、任意に、テールピースを複合体またはコード付けされた化学物質にライゲーションする工程を含む。いくつかの実施形態において、方法は、テールピースを複合体またはコード付けされた化学物質にライゲーションする工程をさらに含む。
いくつかの実施形態において、テールピースは、本明細書に記載のように、ライブラリー識別配列、使用配列、または起源配列のうちの1つ以上を含む。
いくつかの実施形態において、化学物質は、N-H結合もO-H結合も含まない。
いくつかの実施形態において、工程(b)の条件は、金属触媒を含まない。
いくつかの実施形態において、方法は、工程(c)の後に、コード付けされた化学物質を精製する工程をさらに含む。
いくつかの実施形態において、精製は、高性能液体クロマトグラフィー(HPLC)を含む。
いくつかの実施形態において、工程(a)の条件は、照射を含む。
別の態様において、本発明は、前述の方法のいずれかによって生成される複数の化学物質を含むライブラリーを特徴とする。
いくつかの実施形態において、複数の化学物質は物理的に分離されていない。
いくつかの実施形態において、複数の化学物質は、少なくとも1,000,000個の異なる化合物を含む。いくつかの実施形態において、複数の化学物質は、少なくとも5,000,000個の異なる化合物を含む。いくつかの実施形態において、複数の化学物質は、少なくとも10,000,000個の異なる化合物を含む。
いくつかの実施形態において、複数の化学物質は、約500,000~約1,000,000個の異なる化合物を含む。いくつかの実施形態において、複数の化学物質は、約1,000,000~約5,000,000個の異なる化合物を含む。いくつかの実施形態において、複数の化学物質は、約1,000,000~約10,000,000個の異なる化合物を含む。いくつかの実施形態において、複数の化学物質は、約5,000,000~約10,000,000個の異なる化合物を含む。いくつかの実施形態において、複数の化学物質は、約5,000,000~約15,000,000個の異なる化合物を含む。
さらに別の態様において、本発明は、複数の化学物質をスクリーニングする方法を特徴とし、本方法は、標的を、前述の方法のいずれかによって調製されるコード付けされた化学物質及び/または前述のライブラリーのいずれかと接触させる工程、ならびに、対照と比較して、標的に対して所定の特徴を有する1つ以上のコード付けされた化学物質を選択する工程であって、それによって、複数の化学物質がスクリーニングされる、工程を含む。
いくつかの実施形態において、所定の特徴は、対照と比較して、標的に対する結合の増加を含む。
いくつかの実施形態において、方法は、任意に、テールピースを複合体またはコード付けされた化学物質にライゲーションする工程を含む。いくつかの実施形態において、方法は、テールピースを複合体またはコード付けされた化学物質にライゲーションする工程をさらに含む。
いくつかの実施形態において、テールピースは、本明細書に記載のように、ライブラリー識別配列、使用配列、または起源配列のうちの1つ以上を含む。
定義
当業者は、本明細書に記載の特定の化合物が、1つ以上の異なる異性体(例えば、立体異性体、幾何異性体、互変異性体)及び/または同位体(例えば、1つ以上の原子が、例えば、重水素に置換された水素等の原子の異なる同位体で置換されている)形態で存在することができることを理解するであろう。別途示されない限り、または文脈から明らかでない限り、描写される構造は、任意のそのような異性体または同位体形態を個別にまたは組み合わせて表すと理解され得る。
本明細書に記載の化合物は、不斉であり得る(例えば、1つ以上の立体中心を有する)。別途示されない限り、鏡像異性体及びジアステレオマー等のすべての立体異性体が意図される。非対称に置換された炭素原子を含有する本開示の化合物は、光学活性体、またはラセミ体で単離され得る。光学活性出発物質から光学活性体を調製する方法は、ラセミ混合物の分割による、または立体選択合成による等、当技術分野で知られている。オレフィン、C=N二重結合等の多くの幾何異性体もまた、本明細書に記載の化合物中に存在することができ、すべてのそのような安定した異性体が本開示において企図される。本開示の化合物のシス及びトランス幾何異性体が記載されており、異性体の混合物として、または分離された異性体型として単離され得る。
いくつかの実施形態において、本明細書に描写される1つ以上の化合物は、異なる互変異性体型で存在し得る。文脈から明らかになるように、明示的に除外されない限り、そのような化合物への言及は、そのようなすべての互変異性体型を包含する。いくつかの実施形態において、互変異性体型は、単結合の隣接する二重結合との交換及びプロトンの同時移動から生じる。ある特定の実施形態において、互変異性体型は、基準形と同じ実験式及び総電荷を有する異性体プロトン化状態であるプロトトロピック互変異性体であってもよい。プロトトロピック互変異性体型を有する部分の例は、ケトン-エノール対、アミド-イミド酸対、ラクタム-ラクチン対、アミド-イミド酸対、エナミン-イミン対、及びプロトンが複素環系の2つ以上の位置を占めることができる環状形態、例えば、1H-及び3H-イミダゾール、1H-、2H-及び4H-1,2,4-トリアゾール、1H-及び2H-イソインドール、ならびに1H-及び2H-ピラゾールである。いくつかの実施形態において、互変異性体型は、平衡状態にあるか、または適切な置換によって1つの型に立体的に固定され得る。ある特定の実施形態において、互変異性体型は、アセタール相互変換、例えば、以下のスキームに示される相互変換から生じる。
Figure 2022542756000009
一部の実施形態において、本明細書に記載の化合物の同位体が、本発明に従って調製及び/または利用され得ることを当業者は理解するであろう。「同位体」は、同じ原子番号を有するが、核内の異なる数の中性子から生じる異なる質量数を有する原子を指す。例えば、水素の同位体は、トリチウム及び重水素を含む。いくつかの実施形態において、同位体置換(例えば、水素を重水素で置換すること)は、キラル中心の代謝及び/またはラセミ化速度等の分子の物理化学的特性を変化させ得る。
当技術分野で知られているように、多くの化学物質(特に多くの有機分子及び/または多くの小分子)は、例えば、非晶形及び/または結晶形(例えば、多形、水和物、及び溶媒和物)等の様々な異なる固体形態を採用することができる。いくつかの実施形態において、そのような実体は、あらゆる固体形態を含むあらゆる形態において利用され得る。いくつかの実施形態において、そのような実体は、特定の形態、例えば、特定の固体形態で利用される。
いくつかの実施形態において、本明細書に記載及び/または描写される化合物は、塩形態で提供及び/または利用され得る。ある特定の実施形態において、本明細書に記載及び/または描写される化合物は、水和物または溶媒和物形態で提供及び/または利用され得る。
本明細書内の様々な場所で、本開示の化合物の置換基は、群または範囲で開示されている。本開示が、このような群及び範囲のメンバーのそれぞれ1つ1つの個別の部分的組み合わせを含むことが具体的に意図される。例えば、「C1~6アルキル」という用語は、メチル、エチル、Cアルキル、Cアルキル、Cアルキル、及びCアルキルを個別に開示することを特に意図している。さらに、化合物が、置換基が群または範囲内で開示される複数の位置を含む場合、別途示されない限り、本開示は、各位置にメンバーのそれぞれ1つ1つの個別の部分的組み合わせを含む個々の化合物及び化合物の群(例えば、属及び亜属)を網羅することが意図される。
本明細書において、「任意に置換されたX」(例えば、任意に置換されたアルキル)の形態の語句は、「X(ここで、Xは任意に置換されている)」(例えば、「アルキル(ここで、該アルキルは任意に置換されている)」)と同等であることが意図される。特徴「X」(例えば、アルキル)自体が任意であることを意味するものではない。
「約」は、列挙される値の+/-10%を意味する。
本明細書で使用される場合、「アルキル」という用語は、1~20(例えば、1~10または1~6)の炭素を含む飽和炭化水素基を指す。いくつかの実施形態において、アルキル基は分岐していない(すなわち、直鎖状である)。いくつかの実施形態において、アルキル基は分岐している。アルキル基は、メチル、エチル、n-プロピル及びイソプロピル、n-ブチル、sec-ブチル、イソブチル及びtert-ブチル、ネオペンチル等によって例示され、任意に、1つ、2つ、3つ、または2つ以上の炭素のアルキル基の場合には、以下からなる群から独立して選択される4つの置換基で置換され得る:(1)C1~6アルコキシ;(2)C1~6アルキルスルフィニル;(3)本明細書で定義されるアミノ(例えば、非置換アミノ(すなわち、-NH)または置換アミノ(すなわち、-N(RN1、式中、RN1は、アミノについて定義されているとおりである);(4)C6~10アリール-C1~6アルコキシ;(5)アジド;(6)ハロ;(7)(C2~9ヘテロシクリル)オキシ;(8)ヒドロキシル、任意にO-保護基で置換される;(9)ニトロ;(10)オキソ(例えば、カルボキシアルデヒドまたはアシル);(11)C1~7スピロシクリル;(12)チオアルコキシ;(13)チオール;(14)-COA’、任意にO-保護基で置換され、RA’は、以下からなる群から選択される(a)C1~20アルキル(例えば、C1~6アルキル)、(b)C2~20アルケニル(例えば、C2~6アルケニル)、(c)C6~10アリール、(d)水素、(e)C1~6アルク-C6~10アリール、(f)アミノ-C1~20アルキル、(g)-(CHs2(OCHCHs1(CHs3OR’のポリエチレングリコール、式中、s1は、1~10の整数(例えば、1~6または1~4)であり、s2及びs3のそれぞれは、独立して、0~10の整数(例えば、0~4、0~6、1~4、1~6、または1~10)であり、R’は、HまたはC1~20アルキルであり、及び(h)-NRN1(CHs2(CHCHO)s1(CHs3NRN1のアミノ-ポリエチレングリコール、式中、s1は1~10の整数(例えば、1~6または1~4)であり、s2及びs3のそれぞれは、独立して0~10の整数(例えば、0~4、0~6、1~4、1~6、または1~10)であり、各RN1は、独立して、水素または任意に置換されたC1~6アルキルである;(15)-C(O)NR’R’、式中、R’及びR’のそれぞれは、独立して、(a)水素、(b)C1~6アルキル、(c)C6~10アリール、及び(d)C1~6アルク-C6~10アリールからなる群から選択される;(16)-SO’、式中、R’は、(a)C1~6アルキル、(b)C6~10アリール、(c)C1~6アルク-C6~10アリール、及び(d)ヒドロキシルからなる群から選択される;(17)-SONR’R’、式中、R’及びR’のそれぞれは、独立して、(a)水素、(b)C1~6アルキル、(c)C6~10アリール、及び(d)C1~6アルク-C6~10アリールからなる群から選択される;(18)-C(O)R’、式中、R’は、(a)C1~20アルキル(例えば、C1~6アルキル)、(b)C2~20アルケニル(例えば、C2~6アルケニル)、(c)C6~10アリール、(d)水素、(e)C1~6アルク-C6~10アリール、(f)アミノ-C1~20アルキル、(g)-(CHs2(OCHCHs1(CHs3OR’のポリエチレングリコール、式中、s1は、1~10の整数(例えば、1~6または1~4)であり、s2及びs3のそれぞれは、独立して、0~10の整数(例えば、0~4、0~6、1~4、1~6、または1~10)であり、R’は、HまたはC1~20アルキルであり、(h)-NRN1(CHs2(CHCHO)s1(CHs3NRN1のアミノ-ポリエチレングリコール、式中、s1は、1~10の整数(例えば、1~6または1~4)であり、s2及びs3のそれぞれは、独立して、0~10の整数(例えば、0~4、0~6、1~4、1~6、または1~10)であり、各RN1は、独立して、水素または任意に置換されたC1-6アルキルである;(19)-NR’C(O)R’、式中、R’は、(a1)水素及び(b1)C1~6アルキルからなる群から選択され、R’は(a2)C1~20アルキル(例えば、C1~6アルキル)、(b2)C2~20アルケニル(例えば、C2~6アルケニル)、(c2)C6~10アリール、(d2)水素、(e2)C1~6アルク-C6-10アリール、(f2)アミノ-C1~20アルキル、(g2)-(CHs2(OCHCHs1(CHs3OR’のポリエチレングリコール、式中、s1は、1~10の整数(例えば、1~6または1~4)であり、s2及びs3のそれぞれは、独立して、0~10の整数(例えば、0~4、0~6、1~4、1~6、または1~10)であり、R’は、HまたはC1~20アルキルであり、(h2)-NRN1(CHs2(CHCHO)s1(CHs3NRN1のアミノ-ポリエチレングリコール、式中、s1は、1~10の整数(例えば、1~6または1~4)であり、s2及びs3のそれぞれは、独立して、0~10の整数(例えば、0~4、0~6、1~4、1~6、または1~10)であり、各RN1は、独立して、水素または任意に置換されたC1~6アルキルである;(20)-NR’C(O)OR’、式中、R’は、(a1)水素及び(b1)C1~6アルキルからなる群から選択され、R’は、(a2)C1~20アルキル(例えば、C1~6アルキル)、(b2)C2~20アルケニル(例えば、C2~6アルケニル)、(c2)C6~10アリール、(d2)水素、(e2)C1~6アルク-C6~10アリール、(f2)アミノ-C1~20アルキル、(g2)-(CHs2(OCHCHs1(CHs3OR’のポリエチレングリコール、式中、s1は、1~10の整数(例えば、1~6または1~4)であり、s2及びs3のそれぞれは、独立して、0~10の整数(例えば、0~4、0~6、1~4、1~6、または1~10)であり、R’は、HまたはC1~20アルキルであり、(h2)-NRN1(CHs2(CHCHO)s1(CHs3NRN1のアミノ-ポリエチレングリコール、式中、s1は、1~10の整数(例えば、1~6または1~4)であり、s2及びs3のそれぞれは、独立して、0~10の整数(例えば、0~4、0~6、1~4、1~6、または1~10)であり、各RN1は、独立して、水素または任意に置換されたC1~6アルキルである;(21)アミジン;ならびに(22)トリメチルシリル、t-ブチルジメチルシリル、及びトリイソプロピルシリル等のシリル基。いくつかの実施形態において、これらの基のそれぞれは、本明細書に記載のようにさらに置換され得る。例えば、C-アルカリルのアルキレン基は、オキソ基でさらに置換され、それぞれのアリーロイル置換基を得ることができる。
本明細書で使用される場合、「アルキレン」という用語、及び「アルク-」という接頭語は、2つの水素原子の除去によって直鎖または分岐鎖飽和炭化水素から導出される、飽和二価炭化水素基を表し、メチレン、エチレン、イソプロピレン等によって例示される。「Cx~yアルキレン」という用語、及び「Cx~yアルク-」という接頭語は、x~y個の炭素を有するアルキレン基を表す。xの例示的な値は、1、2、3、4、5、及び6であり、yの例示的な値は、2、3、4、5、6、7、8、9、10、12、14、16、18、または20である(例えば、C1~6、C1~10、C2~20、C2~6、C2~10、またはC2~20アルキレン)。いくつかの実施形態において、アルキレンは、アルキル基について本明細書で定義されるように、1、2、3、または4個の置換基でさらに置換され得る。
本明細書で使用される場合、「アルケニル」という用語は、別途指定がない限り、1つ以上の炭素-炭素二重結合を含有する、2~20個の炭素(例えば、2~6または2~10の炭素)の一価直鎖基または分岐鎖基を表し、エテニル、1-プロペニル、2-プロペニル、2-メチル-1-プロペニル、1-ブテニル、2-ブテニル等によって例示される。アルケニルは、シス及びトランス異性体の両方を含む。アルケニル基は、本明細書で定義される、アミノ、アリール、シクロアルキル、またはヘテロシクリル(例えば、ヘテロアリール)、または本明細書に記載の例示的なアルキル置換基のいずれかから独立して選択される、1、2、3、または4個の置換基で任意に置換され得る。
本明細書で使用される場合、「アルキニル」という用語は、炭素-炭素三重結合を含有する、2~20個の炭素原子(例えば、2~4、2~6、または2~10の炭素)の一価直鎖基または分岐鎖基を表し、エチニル、1-プロピニル等によって例示される。アルキニル基は、本明細書で定義されるように、独立して、アリール、シクロアルキル、またはヘテロシクリル(例えば、ヘテロアリール)、または本明細書に記載の例示的なアルキル置換基のいずれかから選択される、1、2、3、または4個の置換基で任意に置換され得る。
本明細書で使用される場合、「アミノ」という用語は、-N(RN1を表し、各RN1は、独立して、H、OH、NO、N(RN2、SOORN2、SON2、SORN2、N-保護基、アルキル、アルケニル、アルキニル、アルコキシ、アリール、アルカリル、シクロアルキル、アルクシクロアルキル、カルボキシアルキル(例えば、任意に置換されたアリールアルコキシカルボニル基、または本明細書に記載の任意の基等のO-保護基で置換されている)、スルホアルキル、アシル(例えば、アセチル、トリフルオロアセチル、または本明細書に記載の他の基)、アルコキシカルボニルアルキル(例えば、任意に置換されたアリールアルコキシカルボニル基、または本明細書に記載の任意の基等のO-保護基で置換されている)、ヘテロシクリル(例えば、ヘテロアリール)、またはアルクヘテロシクリル(例えば、アルクヘテロアリール)であり、ここで、これらの列挙されたRN1基のそれぞれは、各基について本明細書に定義されるように、任意に置換され得、または2つのRN1は、結合してヘテロシクリルまたはN-保護基を形成し、各RN2は、独立してH、アルキル、またはアリールである。アミノ基は、非置換アミノ(すなわち、-NH)または置換アミノ(すなわち、-N(RN1)であり得る。好ましい実施形態において、アミノは、-NHまたは-NHRN1であり、式中、RN1は、独立して、OH、NO、NH、NRN2 2、SOORN2 SON2、SORN2、アルキル、カルボキシアルキル、スルホアルキル、アシル(例えば、アセチル、トリフルオロアセチル、または本明細書に記載の他のもの)、アルコキシカルボニルアルキル(例えば、t-ブトキシカルボニルアルキル)またはアリールであり、各RN2は、H、C1~20アルキル(例えば、C1~6アルキル)、またはC6~10アリールであり得る。
本明細書に記載のように、「アミノ酸」という用語は、側鎖、アミノ基、及び酸基(例えば、-COHのカルボキシ基または-SOHのスルホ基)を有する分子を指し、アミノ酸は、側鎖、アミノ基、または酸基(例えば、側鎖)によって親分子基に結合される。本明細書で使用される場合、「アミノ酸」という用語は、その最も広義では、例えば、1つ以上のペプチド結合の形成を通じて、ポリペプチド鎖に組み込むことができる任意の化合物及び/または物質を指す。いくつかの実施形態において、アミノ酸は、一般構造HN-C(H)(R)-COOHを有する。いくつかの実施形態において、アミノ酸は、天然アミノ酸である。いくつかの実施形態において、アミノ酸は、合成アミノ酸であり、いくつかの実施形態において、アミノ酸は、D-アミノ酸であり、いくつかの実施形態において、アミノ酸は、L-アミノ酸である。「標準アミノ酸」は、天然に存在するペプチド中に一般に見られる20個の標準的なL-アミノ酸のいずれかを指す。「非標準アミノ酸」は、合成的に調製されるか、または天然源から得られるかにかかわらず、標準アミノ酸以外の任意のアミノ酸を指す。いくつかの実施形態において、ポリペプチド中のカルボキシ及び/またはアミノ末端アミノ酸を含むアミノ酸は、上記の一般的な構造と比較して、構造変容を含有し得る。例えば、いくつかの実施形態において、アミノ酸は、一般的な構造と比較して、メチル化、アミド化、アセチル化、及び/または置換によって修飾され得る。いくつかの実施形態において、そのような修飾は、例えば、その他の点では同様の非修飾アミノ酸を含有するポリペプチドと比較して、修飾アミノ酸を含有するポリペプチドの循環半減期を変化させ得る。いくつかの実施形態において、そのような修飾は、その他の点では同様の非修飾アミノ酸を含有するポリペプチドと比較して、修飾アミノ酸を含有するポリペプチドの関連する活性を大幅に変化させない。文脈から明らかになるように、いくつかの実施形態において、「アミノ酸」という用語は、遊離アミノ酸を指すために使用され、いくつかの実施形態においてポリペプチドのアミノ酸残基を指すために使用される。いくつかの実施形態において、アミノ酸はカルボニル基によって親分子基に結合され、側鎖またはアミノ基は、カルボニル基に結合される。いくつかの実施形態において、アミノ酸は、α-アミノ酸である。ある特定の実施形態において、アミノ酸は、β-アミノ酸である。いくつかの実施形態において、アミノ酸は、γ-アミノ酸である。例示的な側鎖としては、任意に置換されたアルキル、アリール、ヘテロシクリル、アルカリル、アルクヘテロシクリル、アミノアルキル、カルバモイルアルキル、及びカルボキシアルキルが挙げられる。例示的なアミノ酸としては、アラニン、アルギニン、アスパラギン、アスパラギン酸、システイン、グルタミン酸、グルタミン、グリシン、ヒスチジン、ヒドロキシノルバリン、イソロイシン、ロイシン、リジン、メチオニン、ノルバリン、オルニチン、フェニルアラニン、プロリン、ピロリジン、セレノシステイン、セリン、タウリン、トレオニン、トリプトファン、チロシン、及びバリンが挙げられる。アミノ酸基は、任意に、以下からなる群から独立して選択される1個、2個、3個、または2個以上の炭素のアミノ酸基の場合には4個の置換基で置換され得る:(1)C1~6アルコキシ;(2)C1~6アルキルスルフィニル;(3)本明細書で定義されるアミノ(例えば、非置換アミノ(すなわち、-NH)または置換アミノ(すなわち、-N(RN1、式中、RN1は、アミノについて定義されているとおりである);(4)C6~10アリール-C1~6アルコキシ;(5)アジド;(6)ハロ;(7)(C2~9ヘテロシクリル)オキシ;(8)ヒドロキシル;(9)ニトロ;(10)オキソ(例えば、カルボキシアルデヒドまたはアシル);(11)C1~7スピロシクリル;(12)チオアルコキシ;(13)チオール;(14)-COA’、RA’は、以下からなる群から選択される(a)C1~20アルキル(例えば、C1~6アルキル)、(b)C2~20アルケニル(例えば、C2~6アルケニル)、(c)C6~10アリール、(d)水素、(e)C1~6アルク-C6~10アリール、(f)アミノ-C1~20アルキル、(g)-(CHs2(OCHCHs1(CHs3OR’のポリエチレングリコール、式中、s1は、1~10の整数(例えば、1~6または1~4)であり、s2及びs3のそれぞれは、独立して、0~10の整数(例えば、0~4、0~6、1~4、1~6、または1~10)であり、R’は、HまたはC1~20アルキルであり、及び(h)-NRN1(CHs2(CHCHO)s1(CHs3NRN1のアミノ-ポリエチレングリコール、式中、s1は、1~10の整数(例えば、1~6または1~4)であり、s2及びs3のそれぞれは、独立して0~10の整数(例えば、0~4、0~6、1~4、1~6、または1~10)であり、各RN1は、独立して、水素または任意に置換されたC1~6アルキルである;(15)-C(O)NR’R’、式中、R’及びR’のそれぞれは、独立して、(a)水素、(b)C1~6アルキル、(c)C6~10アリール、及び(d)C1~6アルク-C6~10アリールからなる群から選択される;(16)-SO’、式中、R’は、(a)C1~6アルキル、(b)C6~10アリール、(c)C1~6アルク-C6~10アリール、及び(d)ヒドロキシルからなる群から選択される;(17)-SONR’R’、式中、R’及びR’のそれぞれは、独立して、(a)水素、(b)C1~6アルキル、(c)C6~10アリール、及び(d)C1~6アルク-C6~10アリールからなる群から選択される;(18)-C(O)R’、式中、R’は、(a)C1~20アルキル(例えば、C1~6アルキル)、(b)C2~20アルケニル(例えば、C2~6アルケニル)、(c)C6~10アリール、(d)水素、(e)C1~6アルク-C6~10アリール、(f)アミノ-C1~20アルキル、(g)-(CHs2(OCHCHs1(CHs3OR’のポリエチレングリコール、式中、s1は、1~10の整数(例えば、1~6または1~4)であり、s2及びs3のそれぞれは、独立して、0~10の整数(例えば、0~4、0~6、1~4、1~6、または1~10)であり、R’は、HまたはC1~20アルキルであり、(h)-NRN1(CHs2(CHCHO)s1(CHs3NRN1のアミノ-ポリエチレングリコール、式中、s1は、1~10の整数(例えば、1~6または1~4)であり、s2及びs3のそれぞれは、独立して、0~10の整数(例えば、0~4、0~6、1~4、1~6、または1~10)であり、各RN1は、独立して、水素または任意に置換されたC1~6アルキルである;(19)-NR’C(O)R’、式中、R’は、(a1)水素及び(b1)C1~6アルキルからなる群から選択され、R’は(a2)C1~20アルキル(例えば、C1~6アルキル)、(b2)C2~20アルケニル(例えば、C2~6アルケニル)、(c2)C6~10アリール、(d2)水素、(e2)C1~6アルク-C6~10アリール、(f2)アミノ-C1~20アルキル、(g2)-(CHs2(OCHCHs1(CHs3OR’のポリエチレングリコール、式中、s1は、1~10の整数(例えば、1~6または1~4)であり、s2及びs3のそれぞれは、独立して、0~10の整数(例えば、0~4、0~6、1~4、1~6、または1~10)であり、R’は、HまたはC1~20アルキルであり、(h2)-NRN1(CHs2(CHCHO)s1(CHs3NRN1のアミノ-ポリエチレングリコール、式中、s1は、1~10の整数(例えば、1~6または1~4)であり、s2及びs3のそれぞれは、独立して、0~10の整数(例えば、0~4、0~6、1~4、1~6、または1~10)であり、各RN1は、独立して、水素または任意に置換されたC1~6アルキルである;(20)-NR’C(O)OR’、式中、R’は、(a1)水素及び(b1)C1~6アルキルからなる群から選択され、R’は、(a2)C1~20アルキル(例えば、C1~6アルキル)、(b2)C2~20アルケニル(例えば、C2~6アルケニル)、(c2)C6~10アリール、(d2)水素、(e2)C1~6アルク-C6~10アリール、(f2)アミノ-C1~20アルキル、(g2)-(CHs2(OCHCHs1(CHs3OR’のポリエチレングリコール、式中、s1は、1~10の整数(例えば、1~6または1~4)であり、s2及びs3のそれぞれは、独立して、0~10の整数(例えば、0~4、0~6、1~4、1~6、または1~10)であり、R’は、HまたはC1~20アルキルであり、(h2)-NRN1(CHs2(CHCHO)s1(CHs3NRN1のアミノ-ポリエチレングリコール、式中、s1は、1~10の整数(例えば、1~6または1~4)であり、s2及びs3のそれぞれは、独立して、0~10の整数(例えば、0~4、0~6、1~4、1~6、または1~10)であり、各RN1は、独立して、水素または任意に置換されたC1~6アルキルである;ならびに(21)アミジン。いくつかの実施形態において、これらの基のそれぞれは、本明細書に記載のようにさらに置換され得る。
「アミノ反応性」または「アミン反応性」とは、アミノ基(例えば、一級アミノ基、二級アミノ基、または三級アミノ基)との反応性を示す基を意味する。例示的、非限定的なアミノ反応性基としては、ハロアルカン、アルケン(例えば、α、β不飽和カルボニルまたはビニルスルホン)、エポキシド、アルデヒド、ケトン、エステル(例えば、N-ヒドロキシスクシンイミド(NHS)エステル)、カルボン酸、イソシアネート、塩化スルホニル、アシルアジド、無水物、カルボジイミド、炭酸塩、イミドエステル、ペンタフルオロフェニルエステル、及びヒドロキシメチルホスフィンが挙げられる。
本明細書で使用される場合、「アリール」という用語は、1つまたは2つの芳香族環を有する単環式、二環式、または多環式炭素環系を表し、フェニル、ナフチル、1,2-ジヒドロナフチル、1,2,3,4-テトラヒドロナフチル、アントラセニル、フェナントレニル、フルオレニル、インダニル、インデニル等によって例示され、任意に、以下からなる群から独立して選択される1、2、3、4、または5個の置換基で置換され得る。(1)C1~7アシル(例えば、カルボキシアルデヒド);(2)C1~20アルキル(例えば、C1~6アルキル、C1~6アルコキシ-C1~6アルキル、C1~6アルキルスルフィニル-C1~6アルキル、アミノ-C1~6アルキル、アジド-C1~6アルキル、(カルボキシアルデヒド)-C1~6アルキル、ハロ-C1~6アルキル(例えば、ペルフルオロアルキル)、ヒドロキシ-C1~6アルキル、ニトロ-C1~6アルキル、またはC1~6チオアルコキシ-C1~6アルキル);(3)C1~20アルコキシ(例えば、C1~6アルコキシ、例えば、ペルフルオロアルコキシ);(4)C1~6アルキルスルフィニル;(5)C6~10アリール;(6)アミノ;(7)C1~6アルク-C6~10アリール;(8)アジド;(9)C3~8シクロアルキル;(10)C1~6アルク-C3~8シクロアルキル;(11)ハロ;(12)C1~12ヘテロシクリル(例えば、C1~12ヘテロアリール);(13)(C1~12ヘテロシクリル)オキシ;(14)ヒドロキシル;(15)ニトロ;(16)C1~20チオアルコキシ(例えば、C1~6チオアルコキシ);(17)-(CHCOA’(式中、qは、0~4の整数であり、R’は、(a)C1~6アルキル、(b)C6~10アリール、(c)水素、及び(d)C1~6アルク-C6~10アリールからなる群から選択される;(18)-(CHCONR’R’(式中、qは、0~4の整数であり、R’及びR’は独立して(a)水素、(b)C1~6アルキル、(c)C6~10アリール、及び(d)C1~6アルク-C6~10アリールからなる群から選択される;(19)-(CHSO’(式中、qは、0~4の整数であり、R’は、(a)アルキル、(b)C6~10アリール、及び(c)アルク-C6~10アリールからなる群から選択される;(20)-(CH2)SONR’R’(式中、qは、0~4の整数であり、R’及びR’のそれぞれは、独立して、(a)水素、(b)C1~6アルキル、(c)C6~10アリール、及び(d)C1~6アルク-C6~10アリールからなる群から選択される;(21)チオール;(22)C6~10アリールオキシ;(23)C3~8シクロアルコキシ;(24)C6~10アリール-C1~6アルコキシ;(25)C1~6アルク-C1~12ヘテロシクリル(例えば、C1~6アルク-C1~12ヘテロアリール);(26)C2~20アルケニル;ならびに(27)C2~20アルニキル。いくつかの実施形態において、これらの基のそれぞれは、本明細書に記載のようにさらに置換され得る。例えば、C-アルカリルまたはC-アルクヘテロシクリルのアルキレン基は、オキソ基とさらに置換して、それぞれのアリーロイル及び(ヘテロシクリル)オイル置換基を得ることができる。
本明細書で使用される場合、「アリールアルキル」基とは、本明細書で定義されるアルキレン基を介して親分子基に付着した、本明細書で定義されるアリール基を表す。例示的な非置換アリールアルキル基は、7~30個の炭素(例えば、C1~6アルク-C6~10アリール、C1~10アルク-C6~10アリール、またはC1~20アルク-C6~10アリール等の7~16または7~20炭素)である。いくつかの実施形態において、アルキレン及びアリールはそれぞれ、各基について本明細書で定義されるように、1、2、3、または4個の置換基でさらに置換され得る。接頭辞「アルク-」が先行する他の基は、同じ様式で定義され、「アルク」は、別途記述されない限り、C1~6アルキレンを指し、示した化学構造は、本明細書で定義されるとおりである。
「アジド」という用語は、-N基を表し、-N=N=Nとして表すこともできる。
「二官能性」とは、2つの化学部分の結合を可能にする2つの反応性基を有することを意味する。
本明細書で使用される場合、「二官能性リンカー」とは、(i)化学物質(例えば、既存の化合物)、及び(ii)オリゴヌクレオチドヘッドピース及び架橋基を含む複合体に結合する、2つの反応性基(例えば、カルベン前駆体基及び架橋基)を有するリンカーを意味する。例示的な二官能性リンカーが本明細書で提供される。
「結合」とは、共有結合または非共有結合によって結合することを意味する。非共有結合には、ファンデルワールス力、水素結合、イオン結合、捕捉または物理的カプセル化、吸収、吸着、及び/または他の分子間力によって形成されるものが含まれる。結合は、任意の有用な手段、例えば、酵素結合(例えば、酵素結合を提供するための酵素的ライゲーション)によって、または化学結合(例えば、化学結合を提供するための化学ライゲーション)によって実現され得る。
「カルベン」とは、2つの価電子及び2つの非共有価電子を有する中性炭素原子を意味する。カルベン基を含む構造の一般式は以下のとおりである。
Figure 2022542756000010
式中、RC1及びRC2のそれぞれは、Hであり、任意に置換されたC~C12アルキル(例えば、非置換C~C12アルキル、または、ハロ、オキソのうちの1つ以上で置換されたC~C12アルキル、C~C12アルキル、C~C12ヘテロアルキル、C~C10カルボシクリル、C~C10アリール、C~Cヘテロシクリル、もしくはC~Cヘテロアリール)または任意に置換されたC~C12ヘテロアルキル(例えば、非置換C~C12ヘテロアルキル、またはハロ、オキソのうちの1つ以上で置換されたC~C12ヘテロアルキル、C~C12アルキル、C~C12ヘテロアルキル、C~C10カルボシクリル、C~C10アリール、C~Cヘテロシクリル、もしくはC~Cヘテロアリール)。
「カルベン前駆体基」とは、化学反応を起こしてカルベン基を生成する官能基を意味する。カルベン前駆体基は、当技術分野で知られており、例えば、ジアジリンがある。
本明細書で使用される場合、「炭素環式」及び「カルボシクリル」という用語は、環が炭素原子によって形成される、任意に置換されたC3~12単環式、二環式、または三環式の非芳香族環構造を指す。炭素環式構造としては、シクロアルキル、シクロアルケニル、及びシクロアルキニル基が挙げられる。
本明細書で使用される場合、「カルボシクリルアルキル」基は、本明細書で定義されるようなアルキレン基を通して親分子基に付着した、本明細書で定義されるようなカルボシクリル基を表す。例示的な非置換カルボシクリルアルキル基は、7~30個の炭素(例えば、C1~6アルク-C6~10カルボシクリル、C1~10アルク-C6~10カルボシクリル、またはC1~20アルク-C6~10カルボシクリル等の7~16または7~20個の炭素)である。いくつかの実施形態において、アルキレン及びカルボシクリルはそれぞれ、各基について本明細書で定義されるように、1、2、3、または4個の置換基とさらに置換することができる。接頭辞「アルク-」が先行する他の基は、同じ様式で定義され、「アルク」は、別途記述されない限り、C1~6アルキレンを指し、示した化学構造は、本明細書で定義されるとおりである。
本明細書で使用される場合、「カルボニル」という用語は、C=Oとして表すこともできる、C(O)基を表す。
「カルボニル反応性」とは、カルボニル基、すなわち、-C(O)-(例えば、アルデヒド、ケトン、及びハロゲン化アシル)を含有する基との反応性を示す基を意味する。例示的、非限定的なカルボニル反応性基は、ヒドラジド、アミン(例えば、アルコキシアミン)、及びヒドロキシルを含む。
「カルボキシル反応性」とは、カルボキシル基、すなわち、-COOHとの反応性を示す基を意味する。例示的、非限定的なカルボキシル反応性基としては、カルボジイミド、アミン、及びヒドロキシルが挙げられる。
本明細書で使用される場合、「カルボキシ」という用語は、-COHを意味する。
「化学物質」とは、1つ以上のビルディングブロック及び任意に1つ以上の足場を含む化合物を意味する。化学物質は、1つ以上の所望の特徴、例えば、生物学的標的に結合する能力、溶解度、水素結合ドナー及びアクセプターの可用性、結合の回転自由度、正電荷、負電荷等を有するように設計または構築された任意の小分子またはペプチド薬物または薬物候補であり得る。ある特定の実施形態において、化学物質は、二官能性または三官能性(またはそれ以上)の物質としてさらに反応させることができる。
「化学反応性基」とは、モジュール反応に関与する反応性基を意味し、したがって結合を生成する。例示的な反応及び反応性基としては、任意に置換されたアルキニル基及び任意に置換されたアジド基のトリアゾール形成対を有するHuisgen1,3-二極環化反応;任意に置換された4π電子系を有するジエン及び任意に置換されたジエノフィルまたは任意に置換された2π電子系を有するヘテロジエノフィルの対によるDiels-Alder反応;求核剤及びひずみ型ヘテロシクリル求電子剤による開環反応;ホスホロチオエート基及びヨード基によるスプリントライゲーション反応;ならびに本明細書に記載のように、アルデヒド基及びアミノ基による還元的アミノ化反応から選択される反応が挙げられる。
「相補的」とは、本明細書で定義されるように、二次構造(核酸分子の二本鎖または二本鎖部分)を形成するようにハイブリダイズ可能な配列を意味する。相補性は完全である必要はないが、1つ、2つ、3つ、またはそれ以上のヌクレオチドにおける1つ以上のミスマッチを含み得る。例えば、相補配列は、Watson-Crick塩基対合規則に従って水素結合を形成することができる核酸塩基(例えば、GはCとともに、AはTとともに、またはAはUとともに)または他の水素結合モチーフ(例えば、ジアミノプリンはTとともに、5-メチルCはGとともに、2-チオチミジンはAとともに、イノシンはCとともに、プソイドイソシトシンはGとともに)を含有してよい。配列及びその相補配列は、同じオリゴヌクレオチド中に、または異なるオリゴヌクレオチド中に存在し得る。
オリゴヌクレオチドタグの「コネクタ」とは、固定配列を有する5’末端または3’末端に、またはその近くにあるタグの一部を意味する。5’コネクタは、オリゴヌクレオチドの5’末端に、またはその近くに位置し、3’コネクタは、オリゴヌクレオチドの3’末端に、またはその近くに位置する。複合体またはコード付けされた化学物質中に存在する場合、各5’コネクタは、同じであっても異なる場合もあり、各3’コネクタは、同じであっても異なる場合もある。2つ以上のタグを有する例示的、非限定的な複合体またはコード付けされた化学物質において、各タグは、5’コネクタ及び3’コネクタを含むことができ、各5’コネクタは、同じ配列を有し、各3’コネクタは、同じ配列を有する(例えば、5’コネクタの配列は、3’コネクタの配列と同じであり得るか、または異なることがあり得る)。別の例示的、非限定的な複合体またはコード付けされた化学物質において、5’コネクタの配列は、本明細書で定義されるように、3’コネクタの配列に対して相補的であるように設計される(例えば、5’コネクタと3’コネクタとの間のハイブリダイゼーションを可能にするように)。コネクタは、任意に、結合を可能にする1つ以上の基(例えば、ポリメラーゼが、化学結合等の読み取りまたは転座する能力が低下している結合)を含み得る。
「定常」配列または「固定された定常」配列とは、情報をコードしないオリゴヌクレオチドの配列を意味する。定常配列を有する、複合体またはコード付けされた化学物質の非限定的な例示的な部分には、プライマー結合領域、5’コネクタ、または3’コネクタが含まれる。ヘッドピースは、情報をコードすることができ(したがって、タグ)、または代替的に情報をコードしないことができる(したがって、定常配列)。同様に、テールピースは、情報をコードすることも、コードしないこともできる。
本明細書で使用される場合、「架橋基」という用語は、タンパク質または他の分子上の特定の官能基(例えば、一級アミン、スルフヒドリル)に化学的に結合することができる反応性官能基を含む基を指す。本明細書で使用される場合、「アミノ酸との化学選択的反応が可能な部分」とは、天然または非天然アミノ酸の官能基(例えば、第一級及び第二級アミン、スルフヒドリル、アルコール、カルボキシル基、カルボニル、またはトリアゾール形成官能基、例えば、アジドまたはアルキン)に化学的に結合可能な反応性官能基を含む部分を指す。架橋基の例としては、スルフヒドリル反応性架橋基(例えば、マレイミド、ハロアセチル、ピリジルジスルフィド、チオスルホナート、またはビニルスルホンを含む基)、アミン反応性架橋基(例えば、NHSエステル、イミドエステル、及びペンタフルオロフェニルエステル、またはヒドロキシメチルホスフィン等のエステルを含む基)、カルボキシル反応性架橋基(例えば、一級または二級アミン、アルコール、またはチオールを含む基)、カルボニル反応性架橋基(例えば、ヒドラジドまたはアルコキシアミンを含む基)、及びトリアゾール形成架橋基(例えば、アジドまたはアルキンを含む基)が挙げられる。
本明細書で使用される場合、「シアノ」という用語は、-CN基を表す。
本明細書で使用される場合、「シクロアルキル」という用語は、別途指定がない限り、3~8個の炭素からなる一価の飽和または不飽和非芳香族環状炭化水素基を表し、シクロプロピル、シクロブチル、シクロペンチル、シクロヘキシル、シクロヘプチル、二環式ヘプチル等によって例示される。シクロアルキル基が1つの炭素-炭素二重結合を含む場合、シクロアルキル基は「シクロアルケニル」基と称され得る。例示的なシクロアルケニル基は、シクロペンテニル、シクロヘキセニル等を含む。本発明のシクロアルキル基は任意に、以下の基で置換され得る:(1)C1~7アシル(例えば、カルボキシアルデヒド);(2)C1~20アルキル(例えば、C1~6アルキル、C1~6アルコキシ-C1~6アルキル、C1~6アルキルスルフィニル-C1~6アルキル、アミノ-C1~6アルキル、アジド-C1~6アルキル、(カルボキシアルデヒド)-C1~6アルキル、ハロ-C1~6アルキル(例えば、ペルフルオロアルキル)、ヒドロキシ-C1~6アルキル、ニトロ-C1~6アルキル、またはC1~6チオアルコキシ-C1~6アルキル);(3)C1~20アルコキシ(例えば、C1~6アルコキシ、例えば、ペルフルオロアルコキシ);(4)C1~6アルキルスルフィニル;(5)C6~10アリール;(6)アミノ;(7)C1~6アルク-C6~10アリール;(8)アジド;(9)C3~8シクロアルキル;(10)C1~6アルク-C3~8シクロアルキル;(11)ハロ;(12)C1~12ヘテロシクリル(例えば、C1~12ヘテロアリール);(13)(C1~12ヘテロシクリル)オキシ;(14)ヒドロキシル;(15)ニトロ;(16)C1~20チオアルコキシ(例えば、C1~6チオアルコキシ);(17)-(CHCO’(式中、qは、0~4の整数であり、R’は、(a)C1~6アルキル、(b)C6~10アリール、(c)水素、及び(d)C1~6アルク-C6~10アリールからなる群から選択される);(18)-(CHCONR’R’(式中、qは、0~4の整数であり、R’及びR’は、独立して(a)水素、(b)C6~10アルキル、(c)C6~10アリール、及び(d)C1~6アルク-C6~10アリールからなる群から選択される);(19)-(CHSO’(式中、qは、0~4の整数であり、R’は、(a)C6~10アルキル、(b)C6~10アリール、及び(c)C1~6アルク-C6~10アリールからなる群から選択される);(20)-(CHSONR’R’(式中、qは、0~4の整数であり、R’及びR’のそれぞれは、独立して、(a)水素、(b)C6~10アルキル、(c)C6~10アリール、及び(d)C1~6アルク-C6~10アリールからなる群から選択される);(21)チオール;(22)C6~10アリールオキシ;(23)C3~8シクロアルコキシ;(24)C6~10アリール-C1~6アルコキシ;(25)C1~6アルク-C1~12ヘテロシクリル(例えば、C1~6アルク-C1~12ヘテロアリール);(26)オキソ;(27)C2~20アルケニル;及び(28)C2~20アルキニル)。いくつかの実施形態において、これらの基のそれぞれは、本明細書に記載のようにさらに置換できる。例えば、C-アルカリルまたはC-アルクヘテロシクリルのアルキレン基は、オキソ基とさらに置換して、それぞれのアリーロイル及び(ヘテロシクリル)オイル置換基を得ることができる。
本明細書で使用される場合、「シクロアルキルアルキル」基という用語は、本明細書で定義されるアルキレン基(例えば、1~4、1~6、1~10、または1~20の炭素からなるアルキレン基)を介して親分子基に付着した、本明細書で定義されるシクロアルキル基を表す。いくつかの実施形態において、アルキレン及びシクロアルキルは、それぞれの基について本明細書で定義されるように、1、2、3、または4個の置換基とさらに置換され得る。
本明細書で使用される場合、「ジアステレオマー」という用語は、互いの鏡像ではなく、互いに重ね合わせることができない立体異性体を意味する。
本明細書で使用される場合、「鏡像異性体」という用語は、少なくとも80%(すなわち、1つの鏡像異性体の少なくとも90%、及び他の鏡像異性体の最大10%)、好ましくは少なくとも90%、より好ましくは少なくとも98%の光学的純度または(当技術分野で標準的な方法によって決定されるような)鏡像体過剰率を有する、化合物の各個々の光学的に活性な形態を意味する。
本明細書で使用される場合、「ハロ」という用語は、臭素、塩素、ヨウ素、またはフッ素から選択されるハロゲンを表す。
「ヘアピン構造」とは、一本鎖オリゴヌクレオチドの2つの領域(通常、反対方向に読み取られたときのヌクレオチド配列において相補的)が塩基対を形成して、非対合ループで終わる二重らせんを形成するときに形成される構造を意味する。
「ヘッドピース」とは、化学物質の構成成分及びタグ、例えば出発オリゴヌクレオチドに作動可能に結合されたライブラリー合成のための化学構造を意味する。任意に、ヘッドピースは、ほとんどまたは全くヌクレオチドを含有しなくてもよいが、それらが作動可能に結合し得る点を提供してもよい。任意に、二官能性リンカーは、ヘッドピースを構成成分に結合する。
本明細書で使用される場合、「ヘテロアルキル」という用語は、構成炭素原子のうちの1つまたは2つが、それぞれ窒素、酸素、または硫黄で置き換えられている、本明細書で定義されるようなアルキル基を指す。いくつかの実施形態において、ヘテロアルキル基は、アルキル基について本明細書に記載のように、1、2、3、または4個の置換基でさらに置換され得る。本明細書で使用される場合、「ヘテロアルケニル」及び「ヘテロアルキニル」という用語は、構成炭素原子のうちの1つまたは2つが、それぞれ窒素、酸素、または硫黄で置き換えられている、本明細書で定義されるようなアルケニル基及びアルキニル基を指す。いくつかの実施形態において、ヘテロアルケニル基及びヘテロアルキニル基は、アルキル基について本明細書に記載のように、1、2、3、または4個の置換基でさらに置換することができる。
本明細書で使用される場合、「ヘテロアリール」という用語は、芳香族である、本明細書で定義されるようなヘテロシクリルの一部を表し、すなわち、それらは、単または多環式環系内に4n+2pi電子を含有する。例示的な非置換ヘテロアリール基は、1~12(例えば、1~11、1~10、1~9、2~12、2~11、2~10、または2~9)の炭素のものである。いくつかの実施形態において、ヘテロアリールは、ヘテロシクリル基について定義されているように、1、2、3、または4個の置換基で置換される。
本明細書で使用されるような「ヘテロアリールアルキル」という用語は、本明細書で定義されるアルキレン基を介して親分子基に付着した、本明細書で定義されるヘテロアリール基を表す。例示的な非置換ヘテロアリール基は、2~32の炭素(例えば、C1~6アルク-C1~12ヘテロアリール、C1~10アルク-C1~12ヘテロアリール、またはC1~20アルク-C1~12ヘテロアリール等の2~22、2~18、2~17、2~16、3~15、2~14、2~13、または2~12の炭素)である。いくつかの実施形態において、アルキレン及びヘテロアリールはそれぞれ、各基について本明細書で定義されるように、1、2、3、または4個の置換基とさらに置換され得る。ヘテロアリールアルキル基は、ヘテロシクリルアルキル基のサブセットである。
本明細書で使用される場合、「ヘテロシクリル」という用語は、別途指定がない限り、窒素、酸素、及び硫黄からなる群から独立して選択される、1、2、3、または4個のヘテロ原子を含有する、5、6、または7員環を表す。5員環は、0~2個の二重結合を有し、6及び7員環は、0~3個の二重結合を有する。例示的な非置換ヘテロシクリル基は、1~12(例えば、1~11、1~10、1~9、2~12、2~11、2~10、または2~9)の炭素のものである。「ヘテロシクリル」という用語はまた、1つ以上の炭素及び/またはヘテロ原子が単環式環の2つの非隣接メンバー、例えば、キヌクリジニル基と架橋する架橋多環式構造を有する複素環式化合物を表す。「ヘテロシクリル」という用語は、任意の上記の複素環が1、2、または3つの炭素環、例えば、アリール環、シクロヘキサン環、シクロヘキセン環、シクロペンタン環、シクロペンテン環、または、例えば、インドリル、キノリル、イソキノリル、テトラヒドロキノリル、ベンゾフリル、ベンゾチエニル等の別の単環式複素環と縮合する二環式、三環式、及び四環式基を含む。縮合ヘテロシクリルの例としては、トロパン及び1,2,3,5,8,8a-ヘキサヒドロインドリジンが挙げられる。ヘテロ環式としては、ピロリル、ピロリニル、ピロリジニル、ピラゾリル、ピラゾリニル、ピラゾリジニル、イミダゾリル、イミダゾリニル、イミダゾリジニル、ピリジル、ピペリジニル、ホモピペリジニル、ピラジニル、ピペラジニル、ピリミジニル、ピリダジニル、オキサゾリル、オキサゾリジニル、イソオキサゾリル、イソオキサゾリジニル、モルホリニル、チオモルホリニル、チアゾリル、チアゾリジニル、イソチアゾリル、イソチアゾリジニル、インドリル、インダゾリル、キノリル、イソキノリル、キノキサリニル、ジヒドロキサリニル、キナゾリル、シンノリニル、フタラジニル、ベンズイミダゾリニル、ベンゾチアゾリル、ベンゾキアゾリル、ベンゾチアジアゾリル、フリル、チエニル、チアゾリジニル、イソチアゾリル、トリアゾリル、テトラゾリル、オキサジアゾリル(例えば、1,2,3-オキサジアゾリル)、プリニル、チアジアゾリル(例えば、1,2,3-チアジアゾリル)、テトラヒドロフラニル、ジヒドロフラニル、テトラヒドロチエニル、ジヒドロチエニル、ジヒドロインドリル、ジヒドロキノリル、テトラヒドロキノリル、テトラヒドロイソキノリル、ジヒドロイソキノリル、ピラニル、ジヒドロピラニル、ジチアゾリル、ベンゾフラニル、イソベンゾフラニル、ベンゾチエニル等が挙げられ、ならびにそれらのジヒドロ体及びテトラヒドロ体が含まれ、ここでは、1つ以上の二重結合が還元され、水素と置き換わっている。さらに他の例示的なヘテロシクリルとしては、以下が挙げられる:2,3,4,5-テトラヒドロ-2-オキソ-オキサゾリル;2,3-ジヒドロ-2-オキソ-1H-イミダゾリル;2,3,4,5-テトラヒドロ-5-オキソ-1H-ピラゾリル(例えば、2,3,4,5-テトラヒドロ-2-フェニル-5-オキソ-1H-ピラゾリル);2,3,4,5-テトラヒドロ-2,4-ジオキソ-1H-イミダゾリル(例えば、2,3,4,5-テトラヒドロ-2,4-ジオキソ-5-メチル-5-フェニル-1H-イミダゾリル);2,3-ジヒドロ-2-チオキソ-1,3,4-オキサジアゾリル(例えば、2,3-ジヒドロ-2-チオキソ-5-フェニル-1,3,4-オキサジアゾリル);4,5-ジヒドロ-5-オキソ-1H-トリアゾリル(例えば、4,5-ジヒドロ-3-メチル-4-アミノ5-オキソ-1H-トリアゾリル);1,2,3,4-テトラヒドロ-2,4-ジオキソピリジニル(例えば、1,2,3,4-テトラヒドロ-2,4-ジオキソ-3,3-ジエチルピリジニル);2,6-ジオキソ-ピペリジニル(例えば、2,6-ジオキソ-3-エチル-3-フェニルピペリジニル);1,6-ジヒドロ-6-オキソピリミジニル;1,6-ジヒドロ-4-オキソピリミジニル(例えば、2-(メチルチオ)-1,6-ジヒドロ-4-オキソ-5-メチルピリミジン-1-イル);1,2,3,4-テトラヒドロ-2,4-ジオキソピリミジニル(例えば、1,2,3,4-テトラヒドロ-2,4-ジオキソ-3-エチルピリミジニル);1,6-ジヒドロ-6-オキソ-ピリダジニル(例えば、1,6-ジヒドロ-6-オキソ-3-エチルピリダジニル);1,6-ジヒドロ-6-オキソ-1,2,4-トリアジニル(例えば、1,6-ジヒドロ-5-イソプロピル-6-オキソ-1,2,4-トリアジニル);2,3-ジヒドロ-2-オキソ-1H-インドリル(例えば、3,3-ジメチル-2,3-ジヒドロ-2-オキソ-1H-インドリル及び2,3-ジヒドロ-2-オキソ-3,3′-スピロプロパン-1H-インドール-1-イル);1,3-ジヒドロ-1-オキソ-2H-イソ-インドリル;1,3-ジヒドロ-1,3-ジオキソ-2H-イソ-インドリル;1H-ベンゾピラゾリル(例えば、1-(エトキシカルボニル)-1H-ベンゾピラゾリル);2,3-ジヒドロ-2-オキソ-1H-ベンゾイミダゾリル(例えば、3-エチル-2,3-ジヒドロ-2-オキソ-1H-ベンズイミダゾリル);2,3-ジヒドロ-2-オキソ-ベンゾオキサゾリル(例えば、5-クロロ-2,3-ジヒドロ-2-オキソ-ベンゾオキサゾリル);2,3-ジヒドロ-2-オキソ-ベンゾオキサゾリル;2-オキソ-2H-ベンゾピラニル;1,4-ベンゾジオキサニル;1,3-ベンゾジオキサニル;2,3-ジヒドロ-3-オキソ,4H-1,3-ベンゾチアジニル;3,4-ジヒドロ-4-オキソ-3H-キナゾリニル(例えば、2-メチル-3,4-ジヒドロ-4-オキソ-3H-キナゾリニル);1,2,3,4-テトラヒドロ-2,4-ジオキソ-3H-キナゾリル(例えば、1-エチル-1,2,3,4-テトラヒドロ-2,4-ジオキソ-3H-キナゾリル;1,2,3,6-テトラヒドロ-2,6-ジオキソ-7H-プリニル(例えば、1,2,3,6-テトラヒドロ-1,3-ジメチル-2,6-ジオキソ-7H-プリニル);1,2,3,6-テトラヒドロ-2,6-ジオキソ-1H-プリニル(例えば、1,2,3,6-テトラヒドロ-3,7-ジメチル-2,6-ジオキソ-1H-プリニル);2-オキソベンゾ[c,d]インドリル;1,1-ジオキソ-2H-ナフト[1,8-c,d]イソチアゾリル;及び1,8-ナフチレンジカルボキアミド。さらなる複素環としては、3,3a,4,5,6,6a-ヘキサヒドロ-ピロロ[3,4-b]ピロール-(2H)-イル、及び2,5-ジアザビシクロ[2.2.1]ヘプタン-2-イル、ホモピペラジニル(またはジアゼパニル)、テトラヒドロピラニル、ジチアゾリル、ベンゾフラニル、ベンゾチエニル、オキセパニル、チエパニル、アゾカニル、オキセカニル、及びチオカニルが挙げられる。複素環式基はまた、以下の式の基を含み
Figure 2022542756000011
式中、E′は、-N-及び-CH-からなる群から選択され、F′は、-N=CH-、-NH-CH-、-NH-C(O)-、-NH-、-CH=N-、-CH-NH-、-C(O)-NH-、-CH=CH-、-CH-、-CHCH-、-CHO-、-OCH-、-O-、及び-S-からなる群から選択され、G′は、-CH-及び-N-からなる群から選択される。本明細書で言及されるヘテロシクリル基のいずれかは、任意に、以下からなる群から独立して選択される1、2、3、4または5個の置換基で置換され得る:(1)C1~7アシル(例えば、カルボキシアルデヒド);(2)C1~20アルキル(例えば、C1~6アルキル、C1~6アルコキシ-C1~6アルキル、C1~6アルキルスルフィニル-C1~6アルキル、アミノ-C1~6アルキル、アジド-C1~6アルキル、(カルボキシアルデヒド)-C1~6アルキル、ハロ-C1~6アルキル(例えば、ペルフルオロアルキル)、ヒドロキシ-C1~6アルキル、ニトロ-C1~6アルキル、またはC1~6チオアルコキシ-C1~6アルキル);(3)C1~20アルコキシ(例えば、C1~6アルコキシ、例えば、ペルフルオロアルコキシ);(4)C1~6アルキルスルフィニル;(5)C6~10アリール;(6)アミノ;(7)C1~6アルク-C6~10アリール;(8)アジド;(9)C3~8シクロアルキル;(10)C1~6アルク-C3~8シクロアルキル;(11)ハロ;(12)C1~12ヘテロシクリル(例えば、C2~12ヘテロアリール);(13)(C1~12ヘテロシクリル)オキシ;(14)ヒドロキシル;(15)ニトロ;(16)C1~20チオアルコキシ(例えば、C1~6チオアルコキシ);(17)-(CHCO’(式中、qは、0~4の整数であり、R’は、(a)C1~6アルキル、(b)C6~10アリール、(c)水素、及び(d)C1~6アルク-C6~10アリールからなる群から選択される);(18)-(CHCONR’R’(式中、qは、0~4の整数であり、R’及びR’は、独立して(a)水素、(b)C1~6アルキル、(c)C6~10アリール、及び(d)C1~6アルク-C6~10アリールからなる群から選択される);(19)-(CHSO’(式中、qは、0~4の整数であり、R’は、(a)C1~6アルキル、(b)C6~10アリール、及び(c)C1~6アルク-C6~10アリールからなる群から選択される);(20)-(CHSONR’R’(式中、qは、0~4の整数であり、R’及びR’のそれぞれは、独立して、(a)水素、(b)C1~6アルキル、(c)C6~10アリール、及び(d)C1~6アルク-C6~10アリールからなる群から選択される);(21)チオール;(22)C6~10アリールオキシ;(23)C3~8シクロアルコキシ;(24)アリールアルコキシ;(25)C1~6アルク-C1~12ヘテロシクリル(例えば、C1~6アルク-C1~12ヘテロアリール);(26)オキソ;(27)(C1~12ヘテロシクリル)イミノ;(28)C2~20アルケニル;及び(29)C2~20アルキニル。いくつかの実施形態において、これらの基のそれぞれは、本明細書に記載のようにさらに置換できる。例えば、C-アルカリルまたはC-アルクヘテロシクリルのアルキレン基は、オキソ基とさらに置換して、それぞれのアリーロイル及び(ヘテロシクリル)オイル置換基を得ることができる。
本明細書で使用される場合、「ヘテロシクリルアルキル」基は、本明細書で定義されるようなアルキレン基を通して親分子基に付着した、本明細書で定義されるようなヘテロシクリル基を表す。例示的な非置換ヘテロシクリルアルキル基は、2~32個の炭素(例えば、2~22、2~18、2~17、2~16、3~15、2~14、2~13、または2~12個の炭素、例えば、C1~6アルク-C1~12ヘテロシクリル、C1~10アルク-C1~12ヘテロシクリル、またはC1~20アルク-C1~12ヘテロシクリル)である。いくつかの実施形態において、アルキレン及びヘテロシクリルはそれぞれ、各基について本明細書で定義されるように、1、2、3、または4個の置換基とさらに置換することができる。
「ハイブリダイズする」とは、ストリンジェンシーの様々な条件下で、相補的なポリヌクレオチド、またはその複数分の間で二本鎖分子を形成するように対合することを意味する(例えば、Wahl,G.M.and S.L.Berger(1987)Methods Enzymol.152:399、Kimmel,A.R.(1987)Methods Enzymol.152:507を参照のこと。)例えば、高ストリンジェンシーハイブリダイゼーションは、通常、約750mMNaCl及び75mMクエン酸三ナトリウム未満、約500mMNaCl及び50mMクエン酸三ナトリウム未満、または約250mMNaCl及び25mMクエン酸三ナトリウム未満の塩濃度で得られる。有機溶媒、例えば、ホルムアミドがない場合に、低ストリンジェンシーハイブリダイゼーションを得ることができる一方で、少なくとも約35%のホルムアミドまたは少なくとも約50%のホルムアミドの存在下で、高ストリンジェンシーハイブリダイゼーションを得ることができる。高ストリンジェンシーハイブリダイゼーション温度条件は、通常、少なくとも約30℃、37℃、または42℃の温度を含むであろう。ハイブリダイゼーション時間、界面活性剤、例えば、ドデシル硫酸ナトリウム(SDS)の濃度、及びキャリアDNAの包含または除外等のさらなるパラメータを変化させることは、当業者に周知である。必要に応じてこれらの様々な条件を組み合わせることによって、様々なレベルのストリンジェンシーが達成される。一実施形態において、ハイブリダイゼーションは、750mMNaCl、75mMクエン酸三ナトリウム、及び1%SDS中、30℃で起こるであろう。代替的な実施形態において、ハイブリダイゼーションは、500mMNaCl、50mMクエン酸三ナトリウム、1%SDS、35%ホルムアミド、及び100μg/mL変性サーモン精子DNA(ssDNA)中、37℃で起こるであろう。さらなる代替的実施形態において、ハイブリダイゼーションは、250mMNaCl、25mMクエン酸三ナトリウム、1%SDS、50%ホルムアミド、及び200μg/mLのssDNA中、42℃で起こるであろう。これらの条件における有用な変更は、当業者には容易に明らかであろう。
ほとんどの用途において、ハイブリダイゼーション後の洗浄工程もまた、ストリンジェンシーにおいて変化するであろう。洗浄ストリンジェンシー条件は、塩濃度及び温度によって定義することができる。上記のように、洗浄ストリンジェンシーは、塩濃度を低下させることによって、または温度を上昇させることによって増加させることができる。例えば、洗浄工程の高ストリンジェンシーの塩濃度は、例えば、約30mMNaCl及び3mMクエン酸三ナトリウム未満、または約15mMNaCl及び1.5mMクエン酸三ナトリウム未満であってよい。洗浄工程のための高ストリンジェンシー温度条件は、通常、例えば、少なくとも約25℃、42℃、または68℃の温度を含む。一実施形態において、洗浄工程は、30mMNaCl、3mMクエン酸三ナトリウム、及び0.1%SDS中、25℃で起こるであろう。代替的な実施形態において、洗浄工程は、15mMNaCl、1.5mMクエン酸三ナトリウム、及び0.1%SDS中、42℃で起こるであろう。さらなる代替の実施形態において、洗浄工程は、15mMNaCl、1.5mMクエン酸三ナトリウム、及び0.1%SDS中、68℃で起こるであろう。これらの条件におけるさらなる変更が、当業者には容易に明らかになろう。ハイブリダイゼーション技術は、当業者に周知であり、例えば、Benton and Davis(Science 196:180,1977)、Grunstein and Hogness(Proc.Natl.Acad.Sci.,USA 72:3961,1975)、Ausubel et al.(Current Protocols in Molecular Biology,Wiley Interscience,New York,2001)、Berger and Kimmel(Guide to Molecular Cloning Techniques,1987,Academic Press,New York)、及びSambrook et al.,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Laboratory Press,New Yorkに記載されている。
本明細書で使用される場合、「炭化水素」という用語は、炭素及び水素原子のみからなる基を表す。
本明細書で使用される場合、「ヒドロキシル」という用語は、-OH基を表す。いくつかの実施形態において、ヒドロキシル基は、アルキルについて本明細書で定義されるように、1、2、3、または4個の置換基(例えば、O-保護基)で置換され得る。
本明細書で使用される場合、「異性体」という用語は、任意の化合物の任意の互変異性体、立体異性体、鏡像異性体、またはジアステレオマーを意味する。化合物は、1つ以上のキラル中心及び/または二重結合を有することができ、したがって、二重結合異性体(すなわち、幾何学的E/Z異性体)またはジアステレオマー(例えば、鏡像異性体(すなわち、(+)または(-))またはシス/トランス異性体)等の立体異性体として存在することが認識される。本発明によれば、本明細書に描写される化学構造、したがって化合物は、対応する立体異性体、すなわち、立体異性体的に純粋な形態(例えば、幾何学的に純粋な、鏡像異性的に純粋な、またはジアステレオマー的に純粋な)及び鏡像異性混合物及び立体異性混合物、例えば、ラセミ体の両方をすべて包含する。化合物の鏡像異性混合物及び立体異性混合物は、典型的には、キラル相ガスクロマトグラフィー、キラル相高性能液体クロマトグラフィー、キラル塩錯体として化合物を結晶化すること、またはキラル溶媒中で化合物を結晶化すること等の周知の方法によって、それらの成分鏡像異性体または立体異性体に分解することができる。鏡像異性体及び立体異性体は、既知の不斉合成法によって、立体異性体的または鏡像異性的に純粋な中間体、試薬、及び触媒から得ることもできる。
「ライブラリー」とは、分子または化学物質のコレクションを意味する。任意に、分子または化学物質は、化学物質の分子または部分についてコード付けする1つ以上のオリゴヌクレオチドに結合する。ライブラリーは、少なくとも2つのメンバーを含み、少なくとも1,000のメンバー、少なくとも10,000のメンバー、少なくとも100,000のメンバー、少なくとも1,000,000のメンバー、少なくとも5,000,000のメンバー、少なくとも10,000,000のメンバー、少なくとも100,000,000のメンバー、少なくとも1,000,000,000のメンバー、少なくとも10,000,000,000のメンバー、または少なくとも100,000,000,000のメンバーを含み得る。
「結合」とは、例えば、結合がヘッドピースと1つ以上のタグとの間、2つのタグとの間、またはタグとテールピースとの間に存在する場合に、2つ以上の化学構造を作動可能に結合させることを可能にする化学的結合実体を意味する。化学的結合実体は、非共有結合(例えば、本明細書に記載のように)、共有結合、または2つの官能基間の反応生成物であり得る。「化学結合」とは、2つの官能基の間の非酵素的化学反応によって形成される結合を意味する。例示的、非限定的な官能基としては、化学反応性基、光反応性基、インターカレート部分、または架橋オリゴヌクレオチド(例えば、本明細書に記載のように)が挙げられる。「酵素結合」とは、酵素によって形成されるヌクレオチド間またはヌクレオシド間結合を意味する。例示的、非限定的な酵素としては、キナーゼ、ポリメラーゼ、リガーゼ、またはこれらの組み合わせが挙げられる。「ポリメラーゼが読み取り能力または転座能力を低下させた結合」とは、オリゴヌクレオチドテンプレート中に存在する場合、結合を欠く対照オリゴヌクレオチドと比較して、ポリメラーゼによる細長い生成物及び/または増幅生成物の量を減少させる結合を意味する。そのような結合を決定するための例示的、非限定的な方法は、PCR分析(例えば、定量的PCR)、RT-PCR分析、液体クロマトグラフィー-質量分析、配列デモグラフィックス、または他の方法によって評価されるプライマー伸長を含む。例示的、非限定的ポリメラーゼとしては、DNAポリメラーゼ及びRNAポリメラーゼ、例えば、DNAポリメラーゼI、DNAポリメラーゼII、DNAポリメラーゼIII、DNAポリメラーゼVI、Taq DNAポリメラーゼ、DeepVentR(商標)DNAポリメラーゼ(New England Biolabsから入手可能名な高適合度好熱性DNAポリメラーゼ)、T7 DNAポリメラーゼ、T4 DNAポリメラーゼ、RNAポリメラーゼI、RNAポリメラーゼII、RNAポリメラーゼIII、またはT7 RNAポリメラーゼが挙げられる。
本明細書で使用される場合、「N-保護アミノ」という用語は、本明細書で定義されるような1つまたは2つのN-保護基が付着している、本明細書で定義されるようなアミノ基を指す。
本明細書で使用される場合、「N-保護基」という用語は、合成手順中の望ましくない反応からアミノ基を保護することを目的としている基を表す。一般的に使用されているN-保護基は、Greene,“Protective Groups in Organic Synthesis,”3rd Edition(John Wiley & Sons,New York,1999)で開示されており、これを参照することにより本明細書に組み込む。N-保護基としては、以下が挙げられる:アシル、アリーロイル、またはカルバミル基、例えば、ホルミル、アセチル、プロピオニル、ピバロイル、t-ブチルアセチル、2-クロロアセチル、2-ブロモアセチル、トリフルオロアセチル、トリクロロアセチル、フタリル、o-ニトロフェノキシアセチル、α-クロロブチリル、ベンゾイル、4-クロロベンゾイル、4-ブロモベンゾイル、4-ニトロベンゾイル、及び保護または非保護D、L、もしくはD、L-アミノ酸等のキラル補助基、例えば、アラニン、ロイシン、フェニルアラニン等;スルホニル含有基、例えば、ベンゼンスルホニル、p-トルエンスルホニル等;カルバミン酸塩形成基、例えば、ベンジルオキシカルボニル、p-クロロベンジルオキシカルボニル、p-メトキシベンジルオキシカルボニル、p-ニトロベンジルオキシカルボニル、2-ニトロベンジルオキシカルボニル、p-ブロモベンジルオキシカルボニル、3,4-ジメトキシベンジルオキシカルボニル、3,5-ジメトキシベンジルオキシカルボニル、2,4-ジメトキシベンジルオキシカルボニル、4-メトキシベンジルオキシカルボニル、2-ニトロ-4,5-ジメトキシベンジルオキシカルボニル、3,4,5-トリメトキシベンジルオキシカルボニル、1-(p-ビフェニルイル)-1-メチルエトキシカルボニル、α,α-ジメチル3,5-ジメトキシベンジルオキシカルボニル、ベンズヒドリルオキシカルボニル、t-ブチルオキシカルボニル、ジイソプロピルメトキシカルボニル、イソプロピルオキシカルボニル、エトキシカルボニル、メトキシカルボニル、アリールオキシカルボニル、2,2,2,-トリクロロエトキシカルボニル、フェノキシカルボニル、4-ニトロフェノキシカルボニル、フルオレニル-9-メトキシカルボニル、シクロペンチルオキシカルボニル、アダマンチルオキシカルボニル、シクロヘキシルオキシカルボニル、フェニルチオカルボニル等、アルカリル基、例えば、ベンジル、トリフェニルメチル、ベンジルオキシメチル等、シリル基、例えば、トリメチルシリル等。好ましいN-保護基は、ホルミル、アセチル、ベンゾイル、ピバロイル、t-ブチルアセチル、アラニル、フェニルスルホニル、ベンジル、t-ブチルオキシカルボニル(Boc)、及びベンジルオキシカルボニル(Cbz)である。
本明細書で使用される場合、「ニトロ」という用語は、-NO基を表す。
「オリゴヌクレオチド」とは、5’末端、3’末端、及び5’末端と3’末端との間の内部位置に1つ以上のヌクレオチドを有するヌクレオチドのポリマーを意味する。オリゴヌクレオチドは、合成され、塩基対認識に使用され得るDNA、RNA、または当技術分野で知られている任意の誘導体を含んでよい。オリゴヌクレオチドは、連続した塩基を有する必要はないが、リンカー部分と散在することができる。オリゴヌクレオチドポリマー及びヌクレオチド(例えば、修飾DNAまたはRNA)は、以下を含み得る:天然塩基(例えば、アデノシン、チミジン、グアノシン、シチジン、ウリジン、デオキシアデノシン、デオキシチミジン、デオキシグアノシン、デオキシシチジン、イノシン、またはジアミノプリン)、塩基類似体(例えば、2-アミノアデノシン、2-チオチミジン、イノシン、ピロロ-ピリミジン、3-メチルアデノシン、C5-プロピニルシチジン、C5-プロピニルウリジン、C5-ブロモウリジン、C5-フルオロウリジン、C5-ヨードウリジン、C5-メチルシチジン、7-デアザアデノシン、7-デアザグアノシン、8-オキソアデノシン、8-オキソグアノシン、O(6)-メチルグアニンシン、及び2-チオキシチジン)、修飾塩基(例えば、2’-O-メチル化塩基及び2’-フルオロ塩基等の2’-置換ヌクレオチド)、インターカレートされた塩基、修飾糖(例えば、2’-フルオロリボース;リボース;2’-デオキシリボース;アラビノース;ヘキソース;アンヒドロヘキシトール;アルトリトール;マンニトール;シクロヘキサニル;シクロヘキセニル;ホスホロアミダート骨格も有するモリフォリノ;ロック核酸(LNA、例えば、リボースの2’-ヒドロキシルがC1~6アルキレンまたはC1~6ヘテロアルキレン架橋によって同じリボース糖の4’炭素に結合され、例示的な架橋はメチレン、プロピレン、エーテル、またはアミノ架橋を含む);グリコール核酸(GNA、例えば、R-GNAまたはS-GNA、リボースがホスホジエステル結合に結合したグリコール単位に置き換えられる);トレオース核酸(TNA、リボースがα-L-スレオフラノシル-(3’→2’)に置き換えられ、及び/またはリボース中の酸素の置換(例えば、S、Se、またはメチレンもしくはエチレン等のアルキレン))、修飾骨格(例えば、ペプチド核酸(PNA)、2-アミノ-エチルグリシン結合はリボース及びホステル骨格を置き換える、)ならびに/または修飾リン酸基(例えば、ホスホロチオエート、5’-N-ホスホロアミダイト、ホスホロセレン酸塩、ボラノリン酸塩、ボラノリン酸エステル、水素ホスホナート、ホスホロアミダート、ホスホロジアミダート、アルキルホスホナートまたはアリールホスホナート、ホスホトリエステル、架橋ホスホロアミダート、架橋ホスホロチオエート、及び架橋メチレン-ホスホナート)。オリゴヌクレオチドは、一本鎖(例えば、ヘアピン)、二本鎖、または他の二次もしくは三次構造(例えば、ステムループ構造、二重らせん、三重らせん、四重らせん等)を有することができる。
「ワンポットライゲーション」とは、少なくとも2つの連続したライゲーション(例えば、2つのライゲーション、3つのライゲーション、4つのライゲーション、5つのライゲーション、6つのライゲーション、7つのライゲーション、8つのライゲーション、9つのライゲーション、10個のライゲーション、または10個を超えるライゲーション)が、1つの反応器または1つの反応容器内で一緒に行われるライゲーション方法を意味する。典型的には、ワンポットライゲーションは、分離プロセス工程及び中間体の精製を回避する。
「作動可能に結合されている」または「作動可能に結合した」とは、2つ以上の化学構造が、それらが受けると予測される様々な操作を通じて結合されたままであるような方法で一緒に直接的または間接的に結合されていることを意味する。典型的には、化学物質及びヘッドピースは、間接的な方法で(例えば、適切なリンカーを介して共有結合的に)作動可能に結合する。例えば、リンカーは、化学物質の結合部位及びヘッドピースの結合部位を有する二官能性部分であってもよい。
本明細書で使用される場合、「O-保護基」という用語は、合成手順中の望ましくない反応から酸素含有基(例えば、フェニル、ヒドロキシル、またはカルボニル)を保護することを目的としている基を表す。一般的に使用されているO-保護基は、Greene,“Protective Groups in Organic Synthesis,”3rd Edition(John Wiley&Sons,New York,1999)で開示されており、これを参照により本明細書に組み込む。例示的なO-保護基としては、以下が挙げられる:アシル、アリーロイル、またはカルバミル基、例えば、ホルミル、アセチル、プロピオニル、ピバロイル、t-ブチルアセチル、2-クロロアセチル、2-ブロモアセチル、トリフルオロアセチル、トリクロロアセチル、フタリル、o-ニトロフェノキシアセチル、α-クロロブチリル、ベンゾイル、4-クロロベンゾイル、4-ブロモベンゾイル、t-ブチルジメチルシリル、トリ-イソ-プロピルシリルオキシメチル、4,4’-ジメトキシトリチル、イソブチリル、フェノキシアセチル、4-イソプロピルフェノキシアセチル、ジメチルホルミジノ、及び4-ニトロベンゾイル;アルキルカルボニル基、例えばアシル、アセチル、プロピオニル、ピバロイル等;任意に置換されたアリールカルボニル基、例えば、ベンゾイル;シリル基、例えば、トリメチルシリル(TMS)、tert-ブチルジメチルシリル(TBDMS)、トリ-イソ-プロピルシリルオキシメチル(TOM)、トリイソプロピルシリル(TIPS)等;ヒドロキシルとのエーテル形成基、例えば、メチル、メトキシメチル、テトラヒドロピラニル、ベンジル、p-メトキシベンジル、トリチル等;アルコキシカルボニル基、例えば、メトキシカルボニル、エトキシカルボニル、イソプロポキシカルボニル、n-イソプロポキシカルボニル、n-ブチルオキシカルボニル、イソブチルオキシカルボニル、sec-ブチルオキシカルボニル、t-ブチルオキシカルボニル、2-エチルヘキシルオキシカルボニル、シクロヘキシルオキシカルボニル、メチルオキシカルボニル等;アルコキシアルコキシカルボニル基、例えば、メトキシメトキシカルボニル、エトキシメトキシカルボニル、2-メトキシエトキシカルボニル、2-エトキシエトキシカルボニル、2-ブトキシエトキシカルボニル、2-メトキシエトキシメトキシカルボニル、アリールオキシカルボニル、プロパルギルオキシカルボニル、2-ブテンオキシカルボニル、3-メチル-2-ブテンオキシカルボニル等;ハロアルコキシカルボニル基、例えば、2-クロロエトキシカルボニル、2-クロロエトキシカルボニル、2,2,2-トリクロロエトキシカルボニル等;任意に置換されたアリールアルコキシカルボニル基、例えば、ベンジルオキシカルボニル、p-メチルベンジルオキシカルボニル、p-メトキシベンジルオキシカルボニル、p-ニトロベンジルオキシカルボニル、2,4-ジニトロベンジルオキシカルボニル、3,5-ジメチルベンジルオキシカルボニル、p-クロロベンジルオキシカルボニル、p-ブロモベンジルオキシ-カルボニル、フルオレニルメチルオキシカルボニル等;及び任意に置換されたアリールオキシカルボニル基、例えば、フェノキシカルボニル、p-ニトロフェノキシカルボニル、o-ニトロフェノキシカルボニル、2,4-ジニトロフェノキシカルボニル、p-メチル-フェノキシカルボニル、m-メチルフェノキシカルボニル、o-ブロモフェノキシカルボニル、3,5-ジメチルフェノキシカルボニル、p-クロロフェノキシカルボニル、2-クロロ-4-ニトロフェノキシ-カルボニル等;置換されたアルキル、アリール、及びアルカリルエーテル(例えば、トリチル、メチルチオメチル、メトキシメチル、ベンジルオキシメチル、シロキシメチル、2,2,2-トリクロロエトキシメチル、テトラヒドロピラニル、テトラヒドロフラニル、エトキシエチル、1-[2-(トリメチルシリル)エトキシ]エチル、2-トリメチルシリルエチル、t-ブチルエーテル、p-クロロフェニル、p-メトキシフェニル、p-ニトロフェニル、ベンジル、p-メトキシベンジル、及びニトロベンジル);シリルエーテル(例えば、トリメチルシリル、トリエチルシリル、トリイソプロピルシリル、ジメチルイソプロピルシリル、t-ブチルジメチルシリル,t-ブチルジフェニルシリル、トリベンジルシリル、トリフェニルシリル、及びジフェニルメチルシリル);炭酸塩(例えば、メチル、メトキシメチル、9-フルオレニルメチル、エチル、2,2,2-トリクロロエチル、2-(トリメチルシリル)エチル、ビニル、アリール、ニトロフェニル;ベンジル;メトキシベンジル;3,4-ジメトキシベンジル、及びニトロベンジル);カルボニル保護基(例えば、アセタール及びケタール基、例えば、ジメチルアセタール、1,3-ジオキソラン等;アシラール基;及びジチアン基、例えば、1,3-ジチアン、1,3-ジチオラン等);カルボン酸保護基(例えば、エステル基、例えば、メチルエステル、ベンジルエステル、t-ブチルエステル、オルトエステル等;ならびにオキサゾリン基。
「直交重複アーキテクチャ」とは、各二本鎖オリゴヌクレオチドの各重複領域が、他の二本鎖オリゴヌクレオチドの重複領域のみに相補的である、一対の二本鎖オリゴヌクレオチドを意味する。相補的な重複領域は、ライゲーション選択性及び効率を増加させるために、2つのオリゴヌクレオチドのライゲーションのための鋳型としての役割を果たすことができる。特に、このアーキテクチャは、複数のタグが、ライゲーション選択性をもたらす相補的なオーバーラップ領域を有するタグのみの間のライゲーション事象のオーバーラップ領域鋳型と同じ反応容器(例えば、ワンポットライゲーション)に添加されることを可能にすることができる。
本明細書で使用される場合、「オキソ」という用語は、=Oを表す。
本明細書で使用される場合、接頭辞「ペルフルオロ」は、アルキル基に結合した各水素ラジカルがフッ化物ラジカルによって置き換えられている、本明細書で定義されるようなアルキル基を表す。例えば、ペルフルオロアルキル基は、トリフルオロメチル、ペンタフルオロエチル等によって例示される。
本明細書で使用される場合、「保護されたヒドロキシル」という用語は、O-保護基に結合された酸素原子を指す。
「光反応性基」とは、紫外線、可視光線、または赤外線の吸収によって引き起こされる反応に関与する反応性基を意味し、したがって結合を生成する。例示的、非限定的な光反応性基を本明細書に記載する。
「プライマー」とは、オリゴヌクレオチド鋳型にアニーリングし、次いで鋳型依存的様式でポリメラーゼによって伸長することができるオリゴヌクレオチドを意味する。
「保護基」とは、オリゴヌクレオチドの3’末端または5’末端を保護すること、またはオリゴヌクレオチドコード付けされたライブラリーを作製、タグ付け、もしくは使用する1つ以上の結合工程中の望ましくない反応から化学物質、足場、もしくはビルディングブロックの1つ以上の官能基を保護することを目的とする基を意味する。一般的に使用されている保護基は、Greene“Protective Groups in Organic Synthesis,”4th Edition(John Wiley&Sons,New York,2007)で開示されており、これを参照により本明細書に組み込む。オリゴヌクレオチドの例示的な保護基としては、ジデオキシヌクレオチド及びジデオキシヌクレオシド(ddNTPまたはddN)等の不可逆的保護基、より好ましくは、エステル基(例えば、O-(α-メトキシエチル)エステル、O-イソバレリルエステル、及びO-レブリニルエステル)、トリチル基(例えば、ジメトキシトリチル及びモノメトキシトリチル)、キサンテニル基(例えば、9-フェニルキサンテン-9-イル及び9-(p-メトキシフェニル)キサンテン-9-イル)、アシル基(例えば、フェノキシアセチル及びアセチル)、ならびにシリル基(例えば、t-ブチルジメチルシリル)等のヒドロキシル基の可逆的保護基が挙げられる。化学物質、足場、及びビルディングブロックの例示的、非制限な保護基としては、以下が挙げられる:合成手順中の望ましくない反応からアミノ基を保護するためのN-保護基(例えば、アシル、アリーロイル、カルバミル基、例えば、ホルミル、アセチル、プロピオニル、ピバロイル、t-ブチルアセチル、2-クロロアセチル、2-ブロモアセチル、トリフルオロアセチル、トリクロロアセチル、フタリル、o-ニトロフェノキシアセチル、α-クロロブチリル、ベンゾイル、4-クロロベンゾイル、4-ブロモベンゾイル、4-ニトロベンゾイル、及び保護または非保護D、L、もしくはD、L-アミノ酸等のキラル補助基、例えば、アラニン、ロイシン、フェニルアラニン等;スルホニル含有基、例えば、ベンゼンスルホニル、p-トルエンスルホニル等;カルバミン酸塩形成基、例えば、ベンジルオキシカルボニル、p-クロロベンジルオキシカルボニル、p-メトキシベンジルオキシカルボニル、p-ニトロベンジルオキシカルボニル、2-ニトロベンジルオキシカルボニル、p-ブロモベンジルオキシカルボニル、3,4-ジメトキシベンジルオキシカルボニル、3,5-ジメトキシベンジルオキシカルボニル、2,4-ジメトキシベンジルオキシカルボニル、4-メトキシベンジルオキシカルボニル、2-ニトロ-4,5-ジメトキシベンジルオキシカルボニル、3,4,5-トリメトキシベンジルオキシカルボニル、1-(p-ビフェニルイル)-1-メチルエトキシカルボニル、α,α-ジメチル3,5-ジメトキシベンジルオキシカルボニル、ベンズヒドリルオキシカルボニル、t-ブチルオキシカルボニル、ジイソプロピルメトキシカルボニル、イソプロピルオキシカルボニル、エトキシカルボニル、メトキシカルボニル、アリールオキシカルボニル、2,2,2,-トリクロロエトキシカルボニル、フェノキシカルボニル、4-ニトロフェノキシカルボニル、フルオレニル-9-メトキシカルボニル、シクロペンチルオキシカルボニル、アダマンチルオキシカルボニル、シクロヘキシルオキシカルボニル、フェニルチオカルボニル等、アルカリル基、例えば、ベンジル、トリフェニルメチル、ベンジルオキシメチル等、シリル基、例えば、トリメチルシリル等:好ましいN-保護基は、ホルミル、アセチル、ベンゾイル、ピバロイル、t-ブチルアセチル、アラニル、フェニルスルホニル、ベンジル、t-ブチルオキシカルボニル(Boc)、及びベンジルオキシカルボニル(Cbz)である);合成手順中の望ましくない反応からヒドロキシル基を保護するためのO-保護基(例えば、アルキルカルボニル基、例えば、アシル、アセチル、ピバロイル等;任意に置換されたアリールカルボニル基、例えば、ベンゾイル;シリル基、例えば、トリメチルシリル(TMS)、tert-ブチルジメチルシリル(TBDMS)、トリ-イソ-プロピルシリルオキシメチル(TOM)、トリイソプロピルシリル(TIPS)等;ヒドロキシルとのエーテル形成基、例えば、メチル、メトキシメチル、テトラヒドロピラニル、ベンジル、p-メトキシベンジル、トリチル等;アルコキシカルボニル基、例えば、メトキシカルボニル、エトキシカルボニル、イソプロポキシカルボニル、n-イソプロポキシカルボニル、n-ブチルオキシカルボニル、イソブチルオキシカルボニル、sec-ブチルオキシカルボニル、t-ブチルオキシカルボニル、2-エチルヘキシルオキシカルボニル、シクロヘキシルオキシカルボニル、メチルオキシカルボニル等;アルコキシアルコキシカルボニル基、例えば、メトキシメトキシカルボニル、エトキシメトキシカルボニル、2-メトキシエトキシカルボニル、2-エトキシエトキシカルボニル、2-ブトキシエトキシカルボニル、2-メトキシエトキシメトキシカルボニル、アリールオキシカルボニル、プロパルギルオキシカルボニル、2-ブテンオキシカルボニル、3-メチル-2-ブテンオキシカルボニル等;ハロアルコキシカルボニル基、例えば、2-クロロエトキシカルボニル、2-クロロエトキシカルボニル、2,2,2-トリクロロエトキシカルボニル等;任意に置換されたアリールアルコキシカルボニル基、例えば、ベンジルオキシカルボニル、p-メチルベンジルオキシカルボニル、p-メトキシベンジルオキシカルボニル、p-ニトロベンジルオキシカルボニル、2,4-ジニトロベンジルオキシカルボニル、3,5-ジメチルベンジルオキシカルボニル、p-クロロベンジルオキシカルボニル、p-ブロモベンジルオキシ-カルボニル等;任意に置換されたアリールオキシカルボニル基、例えば、フェノキシカルボニル、p-ニトロフェノキシカルボニル、o-ニトロフェノキシカルボニル、2,4-ジニトロフェノキシカルボニル、p-メチル-フェノキシカルボニル、m-メチルフェノキシカルボニル、o-ブロモフェノキシカルボニル、3,5-ジメチルフェノキシカルボニル、p-クロロフェノキシカルボニル、2-クロロ-4-ニトロフェノキシ-カルボニル等;カルボニル保護基(例えば、アセタール及びケタール基、例えば、ジメチルアセタール、1,3-ジオキソラン等;アシル基;及びジチアン基、例えば、1,3-ジチアン、1,3-ジチオラン等);カルボン酸保護基(例えば、エステル基、例えば、メチルエステル、ベンジルエステル、t-ブチルエステル、オルトエステル等;シリル基、例えば、トリメチルシリル、本明細書に記載のいずれのシリル基、ならびにオキサゾリン基);ならびにリン酸保護基(例えば、任意に置換されたエステル基、例えば、メチルエステル、イソプロピルエステル、2-シアノエチルエステル、アリルエステル、t-ブチルエステル、ベンジルエステル、フルオレニルメチルエステル、2-(トリメチルシリル)エチルエステル、2-(メチルスルホニル)エチルエステル、2,2,2-トリクロロエチルエステル,3’5’-ジメトキシベンゾインエステル、p-ヒドロキシフェナシルエステル等)。
オリゴヌクレオチドの末端への「近接」または「近接」とは、他の残りの末端よりも記載された末端の近くまたはそれに近いことを意味する。例えば、オリゴヌクレオチドの3’末端に近接する部分または基は、5’末端よりも3’末端に近接するか、またはそれに近接する。特定の実施形態において、オリゴヌクレオチドの3’末端に近接する部分または基は、3’末端から1、2、3、4、5、6、7、8、9、10、15、またはそれ以上のヌクレオチド内にある。他の実施形態において、オリゴヌクレオチドの5’末端に近接する部分または基は、5’末端から1、2、3、4、5、6、7、8、9、10、15、またはそれ以上のヌクレオチド内にある。
「精製する」とは、連続工程で使用する化学または生物学的剤の活性を低下させ得る反応混合物中に存在する任意の未反応生成物または任意の薬剤を除去することを意味する。精製は、除去される未反応生成物または試薬のクロマトグラフィー分離、電気泳動分離、及び沈殿のうちの1つ以上を含み得る。
「リレープライマー」とは、プライマーがハイブリダイズされる鋳型の領域において、ポリメラーゼの読み取りまたは転座の能力を低下させる少なくとも1つのヌクレオチド間結合を含有する、オリゴヌクレオチド鋳型にアニーリングすることができるオリゴヌクレオチドを意味する。ハイブリダイゼーションに際して、1つ以上のリレープライマーが、鋳型依存的様式でポリメラーゼによる伸長を可能にする。
本明細書で使用される場合、「組換え」とは、少なくとも2つの異なるハイブリダイゼーション事象の結果としてのポリメラーゼ生成物の生成を意味する。
「可逆的固定化」とは、穏やかな条件(例えば、吸着、イオン結合、親和性結合、キレート化、ジスルフィド結合形成、オリゴヌクレオチドハイブリダイゼーション、小分子-小分子相互作用、可逆的化学、タンパク質間相互作用、及び疎水性相互作用)下での支持体からの脱離を可能にする方法での、複合体またはコード付けされた化学物質の固定化を意味する。
「小分子」薬物または「小分子」薬物候補とは、約1,000ダルトン未満の分子量を有する分子を意味する。小分子は、有機または無機であってもよく、(例えば、化合物ライブラリーまたは天然源から)単離されていてもよく、または既知の化合物の誘導体化によって得られていてもよい。
本明細書で使用される場合、「スピロシクリル」という用語は、両端が親基の同じ炭素原子に結合してスピロシクリル基を形成しているC2~7アルキレンジラジカル、及び両端が同じ原子に結合しているC1~6ヘテロアルキレンジラジカルを表す。スピロシクリル基を形成しているヘテロアルキレンラジカルは、窒素、酸素、及び硫黄からなる群から独立して選択される、1つ、2つ、3つ、または4つのヘテロ原子を含有し得る。いくつかの実施形態において、スピロシクリル基は、ジラジカルが結合している炭素原子を除く、1~7個の炭素を含む。スピロシクリル基は、シクロアルキル及び/またはヘテロシクリル基の任意の置換基として、本明細書で提供する1、2、3、または4個の置換基と任意に置換することができる。
本明細書で使用される場合、「立体異性体」という用語は、化合物が有することができるすべての可能な異なる異性体及び立体構造形態(例えば、本明細書に記載の任意の式の化合物)、特に、基本分子構造のすべての可能な立体化学的異性体型及び立体構造的異性体型、すべてのジアステレオマー、鏡像異性体、及び/または立体構造異性体を指す。本発明のいくつかの化合物は、異なる互変異性体型で存在し得、後者のすべてが本発明の範囲内に含まれる。
「実質的に」は、目的の特徴または特性の総またはほぼ総の範囲または程度を示す定性的条件を意味する。生物学的分野の当業者は、生物学的及び化学的現象が、稀に、かつてない限り、完全性に達すること及び/または完全性に進むこと、または絶対的な結果を達成または回避することを理解するであろう。したがって、「実質的に」という用語は、多くの生物学的及び化学的現象に内在する潜在的な完全性の欠如を捕捉するために本明細書で使用される。
「実質的同一性」または「実質的に同一」とは、それぞれ、参照配列と同一のポリペプチドまたはポリヌクレオチド配列を有するか、または2つの配列が最適に整合させられたときに、参照配列内の対応する場所で同一である、それぞれ、特定割合のアミノ酸残基またはヌクレオチドを有する、ポリペプチドまたはポリヌクレオチド配列を意味する。例えば、参照配列と「実質的に同一」であるアミノ酸配列は、参照アミノ酸配列と少なくとも50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、または100%の同一性を有する。ポリペプチドについては、比較配列の長さは、概して、少なくとも5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個の連続アミノ酸、より好ましくは、少なくとも25、50、75、90、100、150、200、250、300、または350個の連続アミノ酸、最も好ましくは、全長アミノ酸配列となるであろう。核酸については、比較配列の長さは、概して、少なくとも5個の連続ヌクレオチド、好ましくは、少なくとも10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25個の連続ヌクレオチド、最も好ましくは、全長ヌクレオチド配列となるであろう。デフォルト設定で配列分析ソフトウェア(例えば、Genetics Computer Group,University of Wisconsin Biotechnology Center,1710 University Avenue,Madison,WI 53705のSequence Analysis Software Package)を使用して、配列同一性が測定されてもよい。そのようなソフトウェアは、様々な置換、欠失、及び他の修飾に相同性の程度を割り当てることによって類似配列を合致させてもよい。
「スルフヒドリル反応性」とは、スルフヒドリル基、すなわち、-SHとの反応性を示す基を意味する。例示的、非限定的なスルフヒドリル反応性基としては、ハロアセチル、マレイミド、アジリジン、アクリロイル、アルケン(例えば、α、β不飽和カルボニルまたはビニルスルホン)、及びジスルフィド(例えば、ピリジルジスルフィド)が挙げられる。
本明細書で使用される場合、「スルホニル」という用語は、-S(O)-基を表す。
「タグ」または「オリゴヌクレオチドタグ」とは、その少なくとも一部が情報をコードするオリゴヌクレオチドを意味する。そのような情報の非限定的な例としては、構成成分(すなわち、足場タグまたはビルディングブロックタグのように、それぞれ足場またはビルディングブロック)の(例えば、結合反応による)追加、ライブラリー内のヘッドピース、ライブラリーの同一性(すなわち、同一性タグのように)、ライブラリーの使用(すなわち、使用タグのように)、及び/またはライブラリーメンバーの起源(すなわち、起源タグのように)が挙げられる。
「テールピース」とは、ライブラリーの同一性、ライブラリーの使用、及び/またはライブラリーメンバーの起源のための先行するタグ及びコードのすべての添加後に、複合体またはコード付けされた化学物質に結合されるライブラリーのオリゴヌクレオチド部分を意味する。
本明細書で使用される場合、「チオール」という用語は、-SH基を表す。
「トリアゾール形成」とは、反応(例えば、Huisgen1,3-二極環化)において第2のトリアゾール形成基(例えば、任意に置換されたアジド基)と反応してトリアゾール基を形成する基(例えば、任意に置換されたアルキニル基)を意味する。
「揮発性」とは、約25℃(例えば、約20~30℃)、大気圧、または大気圧未満の圧力で容易に蒸発することを意味する。揮発性化合物の例は、15℃~100℃(例えば、15℃~50℃、20℃~50℃、25℃~50℃、または30℃~50℃)の沸点を有する化合物である。揮発性化合物を含む混合物は、揮発性の低い化合物(単数または複数)を残したまま、揮発性化合物を蒸発させることによって分離することができる。
本発明の他の特徴及び利点は、以下の発明を実施するための形態及び特許請求の範囲から明らかになるであろう。
精製したDBCO-H006のLCMSを示す。 精製したDBCO-H006のLCMSを示す。 リンカー1及びDBCO-HP006に結合したタモキシフェンのLCMSを示す。 リンカー1及びDBCO-HP006に結合したタモキシフェンのLCMSを示す。 リンカー1及びDBCO-HP006に結合したエラセストラント(RAD1901)のLCMSを示す。 リンカー1及びDBCO-HP006に結合したエラセストラント(RAD1901)のLCMSを示す。 リンカー1及びDBCO-HP006に結合したバゼドキシフェンのLCMSを示す。 リンカー1及びDBCO-HP006に結合したバゼドキシフェンのLCMSを示す。 リンカー1及びDBCO-HP006に結合した17β-エストラジオールのLCMSを示す。 リンカー1及びDBCO-HP006に結合した17β-エストラジオールのLCMSを示す。 リンカー1及びDBCO-HP006に結合した(Z)-4-ヒドロキシタモキシフェンのLCMSを示す。 リンカー1及びDBCO-HP006に結合した(Z)-4-ヒドロキシタモキシフェンのLCMSを示す。 リンカー1及びDBCO-HP006に結合した1,3,5-トリス(4-ヒドロキシフェニル)-4-プロピル-1H-ピラゾール(PPT)のLCMSを示す。 リンカー1及びDBCO-HP006に結合した1,3,5-トリス(4-ヒドロキシフェニル)-4-プロピル-1H-ピラゾール(PPT)のLCMSを示す。 リンカー1及びDBCO-HP006に結合した1,3-ビス(4-ヒドロキシフェニル)-4-メチル-5-[4-(2-ピペリジニルエトキシ)フェノール]-1H-ピラゾール(MPP)のLCMSを示す。 リンカー1及びDBCO-HP006に結合した1,3-ビス(4-ヒドロキシフェニル)-4-メチル-5-[4-(2-ピペリジニルエトキシ)フェノール]-1H-ピラゾール(MPP)のLCMSを示す。 リンカー1及びDBCO-HP006に結合したWAY200070のLCMSを示す。 リンカー1及びDBCO-HP006に結合したWAY200070のLCMSを示す。 リンカー1及びDBCO-HP006に結合したエストリオールのLCMSを示す。 リンカー1及びDBCO-HP006に結合したエストリオールのLCMSを示す。 リンカー1及びDBCO-HP006に結合したジアリールプロピオニトリル(DPN)のLCMSを示す。 リンカー1及びDBCO-HP006に結合したジアリールプロピオニトリル(DPN)のLCMSを示す。 オリゴヌクレオチドヘッドピース、ヘッドピース伸長、及び4つのタグのワンポットライゲーションの生成物を示し、該生成物のゲル画像を示す。
詳細な説明
本開示は、ライブラリーの各メンバーを識別情報でコード付けするために、既存の化合物の大きなライブラリー、例えば、数百万個の個々の化合物を含有するライブラリーを、オリゴヌクレオチドタグでタグ付けする方法を特徴とする。次いで、得られたコード付けされたライブラリーを、個々のコード付けされた化合物の混合物として標的(例えば、タンパク質等の治療標的)に対してスクリーニングすることができる。これにより、目的の化合物(例えば、薬物リード、薬物候補、及び/またはツール化合物)を識別するための堅牢かつ迅速な方法が可能になる。
コード付けされた化学物質
本発明は、化学物質(例えば、既存の化学物質)、二官能性リンカー、1つ以上のオリゴヌクレオチドタグ、ならびに(i)二官能性リンカーを介する化学物質、及び(ii)1つ以上のオリゴヌクレオチドタグと作動可能に結合するヘッドピースを含むコード付けされた化学物質を特徴とする。化学物質、二官能性リンカー、1つ以上のオリゴヌクレオチドタグ、及びヘッドピースを含むコード付けされた化学物質のライブラリーを以下にさらに記載する。
化学物質
既存の化学物質(例えば、化合物)またはメンバーのライブラリーは、1つ以上の独自の化合物を含み得る。
二官能性リンカー
ヘッドピースと化学物質との間の二官能性リンカーを変化させて、適切な結合部分を提供し、及び/または有機溶媒中のヘッドピースの溶解度を増加させることができる。ヘッドピースを小分子ライブラリーと結合させることができる、多種多様なリンカーが市販されている。二官能性リンカーは、典型的には、直鎖または分岐鎖からなり、C1~10アルキル、1~10原子のヘテロアルキル、C2~10アルケニル、C2~10アルキニル、C5~10アリール、3~20原子の環状または多環式系、ホスホジエステル、ペプチド、オリゴ糖、オリゴヌクレオチド、オリゴマー、ポリマー、またはポリアルキルグリコール(例えば、ポリエチレングリコール、例えば、-(CHCHO)CHCH-、式中、nは1~50の整数である)、またはそれらの組み合わせを含み得る。
二官能性リンカーは、ヘッドピースとライブラリーの化学物質との間に適切な結合部分を提供し得る。ある特定の実施形態において、二官能性リンカーは、3つの部分を含む。部分1は、DNAと共有結合を形成する反応性基、例えば、好ましくはN-ヒドロキシスクシンイミド(NHS)エステルによって活性化されてDNA上のアミノ基と反応するカルボン酸(例えば、アミノ修飾dT)、一本鎖ヘッドピースの5’末端または3’末端を修飾するアミダイト(標準的なオリゴヌクレオチド化学によって達成される)、化学反応性対(例えば、任意にCu(I)触媒の存在下でのアジド-アルキン環状付加、または本明細書に記載の任意のもの)、またはチオール反応性基であってもよい。部分2も、反応性基であってもよく、これは、ビルディングブロックAまたは足場のいずれかで、化学物質と共有結合を形成する。そのような反応性基は、例えば、アミン、チオール、アジド、またはアルキンである。部分3は、部分1と2との間に導入された、可変長の化学的に不活性な結合部分であり得る。そのような結合部分は、エチレングリコール単位の鎖(例えば、異なる長さのPEG)、アルカン、アルケン、ポリエン鎖、またはペプチド鎖であってもよい。リンカーは、有機溶媒中のヘッドピースの溶解度を向上させるための疎水性部分(例えば、ベンゼン環等)、ならびにライブラリー検出目的で使用される蛍光部分(例えば、フルオレセインまたはCy-3)を有する分岐部分または挿入物を含有することができる。ヘッドピース設計における疎水性残基は、有機溶媒中のライブラリー合成を容易にするために、リンカー設計とともに変化させることができる。例えば、ヘッドピース及びリンカーの組み合わせは、適切な残基を有するように設計され、オクタノール:水の係数(Poct)は、例えば、1.0~2.5である。
リンカーは、所与の小分子ライブラリー設計に対して経験的に選択することができ、その結果、該ライブラリーは、有機溶媒中、例えば、15%、25%、30%、50%、75%、90%、95%、98%、99%、または100%有機溶媒中で合成することができる。リンカーは、ライブラリー合成前のモデル反応を使用して変化させて、ヘッドピースを有機溶媒中に可溶化する適切な鎖長を選択することができる。例示的なリンカーとしては、アルキル鎖長の増加、ポリエチレングリコール単位の増加、正電荷を有する分岐型種(ヘッドピース上の負のリン酸電荷を中和するため)、または疎水性量の増加(例えば、ベンゼン環構造の追加)を有するリンカーが挙げられる。
リンカーはまた、分岐していてもよく、分岐型リンカーは当技術分野で知られており、例は、対称または非対称ダブラーまたは対称トレブラーからなり得る。例えば、Newcome et al.,Dendritic Molecules:Concepts,Synthesis,Perspectives,VCH Publishers(1996)、Boussif et al.Proc.Natl.Acad.Sci.USA 92:7297-7301(1995)、及びJansen et al.Science,266:1226(1994)を参照のこと。
リンカーは任意に、1つ以上の架橋基を含む。架橋基の例としては、アジド、カルベン前駆体基、及びアルキンが挙げられる。
架橋基
架橋基は、タンパク質または他の分子上の特定の官能基(例えば、一級アミン、スルフヒドリル)に化学的に結合することができる反応性官能基を含む基を指す。架橋基の例としては、スルフヒドリル反応性架橋基(例えば、マレイミド、ハロアセチル、ピリジルジスルフィド、チオスルホナート、またはビニルスルホンを含む基)、アミン反応性架橋基(例えば、NHSエステル、イミドエステル、及びペンタフルオロフェニルエステル、またはヒドロキシメチルホスフィン等のエステルを含む基)、カルボキシル反応性架橋基(例えば、一級または二級アミン、アルコール、またはチオールを含む基)、カルボニル反応性架橋基(例えば、ヒドラジドまたはアルコキシアミンを含む基)、トリアゾール形成架橋基(例えば、アジドまたはアルキンを含む基)、またはアジリジン等のカルベン発生基が挙げられる。
架橋基と反応し得る化学反応性官能基の例としては、アミノ、ヒドロキシル、スルフヒドリル、カルボキシル、カルボニル、炭水化物基、ビシナルジオール、チオエーテル、2-アミノアルコール、2-アミノチオール、グアニジニル、イミダゾリル、及びフェノール基が挙げられるが、これらに限定されない。
スルフヒドリル反応性である部分の例としては、スルフヒドリル基に対して特定の反応性を示すが、Gurd,Methods Enzymol.11:532(1967)に記載されているように、イミダゾリル、チオエーテル、フェノール、及びアミノ基を修飾するためにも使用することができる、タイプXCHCO-(式中、X=Br、Cl、またはI)のα-ハロアセチル化合物が挙げられる。N-マレイミド誘導体はまた、スルフヒドリル基に対して選択的であると考えられるが、ある特定の条件下でアミノ基へのカップリングにおいてさらに有用であり得る。アミノ基の変換を介してチオール基を導入する2-イミノチオラン等の試薬(Traut et al.Biochemistry 12:3266(1973))は、結合がジスルフィド架橋の形成を介して起こる場合、スルフヒドリル試薬として考慮され得る。
アミノ反応性である反応性部分の例として、例えば、アルキル化剤及びアシル化剤が挙げられる。代表的なアルキル化剤としては、以下が挙げられる:
(i)反応性チオール基の非存在下でアミノ基に対する特異性を示し、例えば、Wong Biochemistry 24:5337(1979)に記載されているように、XCHCO-(式中、X=Br、Cl、またはI)型であるα-ハロアセチル化合物;
(ii)例えばSmyth et al.,J.Am.Chem.Soc.82:4600(1960)及びBiochem.J.91:589(1964)に記載されているように、Michael型反応または環カルボニル基への付加によるアシル化のいずれかを介してアミノ基と反応し得るN-マレイミド誘導体、
(iii)反応性ニトロハロ芳香族化合物等のハロゲン化アリール、
(iv)例えば、McKenzie et al.,J.Protein Chem.7:581(1988)に記載のハロゲン化アルキル、
(v)アミノ基とのSchiff塩基形成が可能なアルデヒド及びケトン、形成される付加物は通常、還元によって安定化されて安定したアミンを得る、
(vi)アミノ、スルフヒドリル、またはフェノール性ヒドロキシル基と反応し得るエピクロロヒドリン及びビソキシラン等のエポキシド誘導体、
(vii)アミノ、スフヒドリル、及びヒドロキシル基等の求核剤に対して非常に反応性である、s-トリアジンの塩素含有誘導体、
(viii)例えば、Ross,J.Adv.Cancer Res.2:1(1954)に記載されているように、開環によってアミノ基等の求核剤と反応する、上記に詳述されるs-トリアジン化合物に基づくアジリジン、
(ix)Tietze,Chem.Ber 124:1215(1991)に記載されているスクアリン酸ジエチルエステル、及び
(x)Benneche et al.Eur.,J.Med.Chem.28:463(1993)に記載されているように、活性化がエーテル酸素原子によって起こるために、通常のハロゲン化アルキルよりも反応性が高いα-ハロアルキルエーテル。
代表的なアミノ反応性アシル化剤としては、以下が挙げられる:
(i)安定した尿素誘導体及びチオ尿素誘導体をそれぞれ形成する、イソシアネート及びイソチオシアネート、特に芳香族誘導体、
(ii)Herzig et al.Biopolymers,2:349(1964)に記載されている塩化スルホニル、
(iii)酸ハロゲン化物、
(iv)ニトロフェニルエステルまたはN-ヒドロキシスクシンイミジルエステル等の活性エステル、
(v)混合された、対称的な酸無水物、またはN-カルボキシ無水物の酸無水物、
(vi)例えば、M.Bodansky,Principles of Peptide Synthesis,Springer-Verlag,1984に記載されているように、アミド結合形成に有用な他の試薬、
(vii)例えば、Wetz et al.,Anal.Biochem.58:347(1974)に記載されているように、アジド基が、亜硝酸ナトリウムを使用して行われたヒドラジド誘導体から予め形成される、アシルアジド、
(viii)例えば、Hunter and Ludwig,J.Am.Chem.Soc.84:3491(1962)に記載されているように、アミノ基との反応で安定したアミジンを形成するイミドエステル、及び
(ix)ハロピリジンまたはハロピリミジン等のハロヘテロアリール基。
アルデヒド及びケトンをアミンと反応させて、シッフ塩基を形成してもよく、これは、還元的アミノ化によって有利に安定化されてもよい。アルコキシルアミノ部分は、例えば、Biocongugate Chem.1:96(1990)に記載されているように、ケトン及びアルデヒドと容易に反応して、安定したアルコキシアミンを生成する。
「カルボキシル反応性」である反応性部分の例として、例えば、Herriot,Adv.Protein Chem.3:169(1947)に記載されているように、高特異性で反応してエステル基を生成するジアゾ酢酸エステル及びジアゾアセトアミド等のジアゾ化合物が挙げられる。O-アシル尿素形成に続いてアミド結合形成を介して反応するカルボジイミド等のカルボキシル修飾試薬も使用してよい。
例示的な架橋基としては、2’-ピリジルジスルフィド、4’-ピリジルジスルフィドヨードアセチル、マレイミド、チオエステル、アルキルジスルフィド、アルキルアミンジスルフィド、ニトロ安息香酸ジスルフィド、無水物、NHSエステル、アルデヒド、塩化アルキル、アルキン、及びアジドが挙げられる。
ヘッドピース
ライブラリーにおいて、ヘッドピースは、各化学物質をそのコード化オリゴヌクレオチドタグに作動可能に結合する。一般に、ヘッドピースは、さらに誘導体化することができる2つの官能基を有する出発オリゴヌクレオチドであり、第1の官能基は、化学物質(またはその構成成分)をヘッドピースに作動可能に結合し、第2の官能基は、1つ以上のタグをヘッドピースに作動可能に結合する。二官能性リンカーは任意に、ヘッドピースと化学物質との間の結合部分として使用することができる。
ヘッドピースの官能基を使用して、化学物質の構成成分との共有結合及びタグとの別の共有結合を形成することができる。構成成分は、小分子の任意の部分、例えば、多様性ノードまたはビルディングブロックを有する足場等であり得る。あるいは、ヘッドピースを誘導体化して、官能基(例えば、ヒドロキシル、アミン、カルボキシル、スルフヒドリル、アルキニル、アジド、またはリン酸基)で終結するリンカー(すなわち、ヘッドピースを、ライブラリー内に形成される小分子から分離する結合部分)を提供することができ、これを使用して、化学物質の構成成分と共有結合を形成する。リンカーは、5’末端に、内部位置の1つに、またはヘッドピースの3’末端に結合することができる。リンカーが内部位置の1つに結合されるとき、リンカーは、当技術分野で知られている標準的な技術を使用して、誘導体化塩基(例えば、ウリジンのC5位)に作動可能に結合されるか、またはオリゴヌクレオチド内に配置され得る。例示的なリンカーを本明細書に記載する。
ヘッドピースは、任意の有用な構造を有することができる。ヘッドピースは、例えば、1~100ヌクレオチド長、好ましくは5~20ヌクレオチド長、及び最も好ましくは5~15ヌクレオチド長であり得る。ヘッドピースは、本明細書に記載のように、一本鎖または二本鎖であり得、天然または修飾ヌクレオチドからなり得る。例えば、化学部分は、ヘッドピースの3’末端または5’末端に作動可能に結合され得る。特定の実施形態において、ヘッドピースは、配列内の相補的な塩基によって形成されるヘアピン構造を含む。例えば、化学部分は、ヘッドピースの内部位置、3’末端、または5’末端に作動可能に結合され得る。
一般に、ヘッドピースは、重合、酵素的ライゲーション、または化学反応によってオリゴヌクレオチドタグと結合することを可能にする、5’末端または3’末端上の非自己相補的配列を含む。ヘッドピースは、オリゴヌクレオチドタグのライゲーション、ならびに任意の精製及びリン酸化工程を可能にすることができる。最後のタグを追加した後、さらなるアダプター配列を最後のタグの5’末端に付加することができる。例示的なアダプター配列としては、プライマー結合配列または標識(例えば、ビオチン)を有する配列が挙げられる。多くのビルディングブロック及び対応するタグが使用される場合(例えば、100)、必要な数のタグを作製するために、オリゴヌクレオチド合成工程の間に、ミックス・アンド・スプリット戦略が用いられ得る。DNA合成のためのこのようなミックス・アンド・スプリット戦略は、当技術分野で知られている。結果として生じるライブラリーメンバーは、目的の標的(複数可)に対する結合体の選択後のPCRによって増幅することができる。
コード付けされた化学物質のオリゴヌクレオチドヘッドピースは、任意に、1つ以上のプライマー結合配列を含み得る。例えば、ヘッドピースは、増幅のためのプライマー結合領域として機能するヘアピンのループ領域内に配列を有し、プライマー結合領域は、ヘッドピース内の配列よりもその相補的プライマー(例えば、隣接する識別子領域を含み得る)についてより高い融解温度を有する。他の実施形態において、コード付けされた化学物質は、1つ以上のビルディングブロックをコード付けする1つ以上のタグのいずれかの側に、2つのプライマー結合配列(例えば、PCRを可能にするために)を含む。あるいは、ヘッドピースは、5’末端または3’末端上に1つのプライマー結合配列を含有してもよい。他の実施形態において、ヘッドピースはヘアピンであり、ループ領域はプライマー結合部位を形成するか、またはプライマー結合部位は、ループの3’側のヘッドピースへのオリゴヌクレオチドのハイブリダイゼーションによって導入される。ヘッドピースの3’末端に相同な領域を含有し、その5’末端にプライマー結合領域を担持する(例えば、PCR反応を可能にするために)プライマーオリゴヌクレオチドは、ヘッドピースにハイブリダイズされてよく、ビルディングブロックまたはビルディングブロックの追加をコード付けするタグを含有してもよい。プライマーオリゴヌクレオチドは、バイオインフォマティクス分析のために含まれる、ランダム化ヌクレオチド、例えば、2~16ヌクレオチド長の領域等のさらなる情報を含有し得る。
ヘッドピースは、任意にヘアピン構造を含むことができ、この構造は、任意の有用な方法によって達成することができる。例えば、ヘッドピースは、例えば、Watson-Crick DNA塩基対合(例えば、アデニン-チミン及びグアニン-シトシン)による、及び/またはゆらぎ塩基対合(例えば、グアニン-ウラシル、イノシン-ウラシル、イノシン-アデニン、及びイノシン-シトシン)による、分子間塩基対合パートナーを形成する相補的な塩基を含み得る。別の例において、ヘッドピースは、非修飾ヌクレオチドと比較して、より高い親和性の二本鎖形成を形成することができる修飾または置換ヌクレオチドを含むことができ、こうした修飾または置換ヌクレオチドは、当技術分野で知られている。
コード付けされた化学物質のオリゴヌクレオチドヘッドピースは、検出を可能にする1つ以上の標識を任意に含み得る。例えば、ヘッドピース、1つ以上のオリゴヌクレオチドタグ、及び/または1つ以上のプライマー配列は、同位体、放射線造影剤、マーカー、トレーサー、蛍光標識(例えば、ローダミンまたはフルオレセイン)、化学発光標識、量子ドット、及びレポーター分子(例えば、ビオチンまたはHisタグ)を含み得る。
他の実施形態において、ヘッドピースまたはタグは、半水性、還元水性、または非水性(例えば、有機)条件下で溶解性を支持するように改変され得る。ヘッドピースまたはタグのヌクレオチド塩基は、例えば、相補的な塩基に水素結合するそれらの能力を著しく破壊することなく、脂肪族鎖でTまたはC塩基のC5位を修飾することによって、より疎水性にすることができる。例示的な修飾または置換ヌクレオチドは、5’-ジメトキシトリチル-N4-ジイソブチルアミノメチリデン-5-(1-プロピニル)-2’-デオキシシチジン、3’-[(2-シアノエチル)-(N,N-ジイソプロピル)]-ホスホラミダイト;5’-ジメトキシトリチル-5-(1-プロピニル)-2’-デオキシウリジン、3’-[(2-シアノエチル)-(N,N-ジイソプロピル)]-ホスホラミダイト;5’-ジメトキシトリチル-5-フルオロ-2’-デオキシウリジン、3’-[(2-シアノエチル)-(N,N-ジイソプロピル)]-ホスホラミダイト;及び5’ジメトキシトリチル-5-(ピレン-1-イル-エチニル)-2’-デオキシウリジン、または3’-[(2-シアノエチル)-(N,N-ジイソプロピル)-ホスホラミダイトである。
加えて、ヘッドピースオリゴヌクレオチドは、有機溶媒中の溶解性を促進する修飾を散在することができる。例えば、アゾベンゼンホスホラミダイトは、疎水性部分をヘッドピース設計に導入することができる。このような疎水性アミダイトのヘッドピースへの挿入は、分子内のどこにでも起こり得る。しかし、挿入は、ライブラリー合成中のさらなるDNAタグを使用する後続のタグ付け、または選択が完了したらその後のPCR、またはタグのデコンボリューションのために使用する場合はマイクロアレイ分析を妨げることはできない。本明細書に記載のヘッドピース設計へのそのような付加により、ヘッドピースは、例えば、15%、25%、30%、50%、75%、90%、95%、98%、99%、または100%の有機溶媒中で可溶性になる。したがって、疎水性残基をヘッドピース設計に添加することにより、半水性または非水性(例えば、有機的)条件下での溶解性の向上を可能にすると同時に、ヘッドピースをオリゴヌクレオチドのタグ付けが可能となるようにする。さらに、続いてライブラリーに導入されるDNAタグは、TまたはC塩基のC5位でも修飾することができ、これにより、ライブラリーは、ライブラリー合成の後続工程のために、有機溶媒中でより疎水性かつ可溶性にもなる。
特定の実施形態において、ヘッドピース及び第1のタグは、同一の実体であり得、すなわち、すべての共通の部分(例えば、プライマー結合領域)を共有し、すべて別の部分(例えば、コード化領域)において異なる複数のヘッドピースタグ実体を構築し得る。これらは、「スプリット」工程で利用され、それらがコードする事象が起こった後にプールされ得る。
特定の実施形態において、ヘッドピースは、例えば、特定のライブラリーに関連する特定の配列を使用することによって等、第1のスプリット(複数可)工程をコードする配列、またはライブラリーの同一性をコードする配列を含むことによって、情報をコードすることができる。
オリゴヌクレオチドタグ
本明細書に記載のオリゴヌクレオチドタグ(例えば、タグ、またはヘッドピースの一部、またはテールピースの一部)を使用して、分子、化学物質の一部、構成成分(例えば、足場またはビルディングブロック)の追加、ライブラリー内のヘッドピース、ライブラリーの同一性、1つ以上のライブラリーメンバーの使用(例えば、ライブラリーのアリコート内のメンバーの使用)、及び/またはライブラリーメンバーの起源(例えば、起源配列の使用によって)等の任意の有用な情報をコードすることができる。
オリゴヌクレオチド中の任意の配列を使用して、任意の情報をコードすることができる。したがって、1つのオリゴヌクレオチド配列は、2つ以上の種類の情報をコードする、または1つ以上の種類の情報もコードする出発オリゴヌクレオチドを提供する等、2つ以上の目的に役立つことができる。例えば、第1のタグは、第1のビルディングブロックの追加、ならびにライブラリーの識別をコードすることができる。別の例において、ヘッドピースを使用して、化学物質をタグに作動可能に結合する出発オリゴヌクレオチドを提供することができ、ヘッドピースは、ライブラリーの同一性をコードする配列(すなわち、ライブラリー識別配列)をさらに含む。したがって、本明細書に記載される情報のいずれかは、別々のオリゴヌクレオチドタグにコードされ得るか、または同じオリゴヌクレオチド配列(例えば、タグまたはヘッドピース等のオリゴヌクレオチドタグ)に組み合わせてコードされ得る。
ビルディングブロック配列は、ビルディングブロックの同一性及び/またはビルディングブロックで行われる結合反応の種類をコードする。このビルディングブロック配列は、タグに含まれ、タグは、任意に、以下に記載される1つ以上の種類の配列(例えば、ライブラリー識別配列、使用配列、及び/または起源配列)を含み得る。
ライブラリー識別配列は、特定のライブラリーの同一性をコードする。2つ以上のライブラリーの混合を可能にするために、ライブラリーメンバーは、ライブラリー識別タグ(すなわち、ライブラリー識別配列を含むオリゴヌクレオチド)において、ライゲーションされたタグにおいて、ヘッドピース配列の一部において、またはテールピース配列において、1つ以上のライブラリー識別配列を含有してもよい。これらのライブラリー識別配列を使用して、タグの配列が翻訳され、化学(合成)履歴情報と相関する、コード化関係を推定することができる。したがって、これらのライブラリー識別配列は、選択、増幅、精製、配列決定等のために2つ以上のライブラリーを一緒に混合することを可能にする。
使用配列は、ライブラリーの個々のアリコートにおける1つ以上のライブラリーメンバーの履歴(すなわち、使用)をコードする。例えば、別々のアリコートは、異なる反応条件、ビルディングブロック、及び/または選択工程で処理し得る。特に、この配列を使用して、そのようなアリコートを識別し、それらの履歴(使用)(例えば、異なる選択実験)を推定し、それによって、選択、増幅、精製、配列決定等のために試料を一緒に混合する目的で、異なる履歴(使用)を有する同じライブラリーのアリコートを一緒に混合することを可能にし得る。これらの使用配列は、ヘッドピース、テールピース、タグ、使用タグ(すなわち、使用配列を含むオリゴヌクレオチド)、または本明細書に記載の任意の他のタグ(例えば、ライブラリー識別タグまたは起源タグ)に含まれ得る。
起源配列は、ライブラリーメンバーの起源をコードする任意の有用な長さ(例えば、約6個のオリゴヌクレオチド)の縮退した(ランダム、確率的に生成された)オリゴヌクレオチド配列である。この配列は、独自の前駆体テンプレートに由来する増幅産物(例えば、選択されたライブラリーメンバー)の観察を、同じ前駆体テンプレートに由来する複数の増幅産物(例えば、選択されたライブラリーメンバー)の観察から区別することができるように、すべての点において同一であるライブラリーメンバーを、配列情報によって区別可能なエンティティに確率的に細分化する役割を果たす。例えば、ライブラリー形成後、及び選択工程の前に、各ライブラリーメンバーは、起源タグ等の異なる起源配列を含み得る。選択後、選択されたライブラリーメンバーを増幅して増幅産物を作製することができ、起源配列を含むと予想されるライブラリーメンバーの部分(例えば、起源タグ内)を観察し、他のライブラリーメンバーのそれぞれにおける起源配列と比較することができる。起源配列が縮退しているため、各ライブラリーメンバーの各増幅産物は、異なる起源配列を有するはずである。しかし、増幅産物中の同一起源配列の観察は、同一鋳型分子に由来する複数の単位複製配列を示すことができる。増幅後とは対照的に、増幅前のコード化タグの集団の統計及び人口統計を決定することが所望される場合、起源タグを使用し得る。これらの起源配列は、ヘッドピース、テールピース、タグ、起源タグ(すなわち、起源配列を含むオリゴヌクレオチド)、または本明細書に記載の任意の他のタグ(例えば、ライブラリー識別タグまたは使用タグ)に含まれ得る。
本明細書に記載される配列の種類のいずれかは、ヘッドピースに含まれ得る。例えば、ヘッドピースは、ビルディングブロック配列、ライブラリー識別配列、使用配列、または起源配列のうちの1つ以上を含み得る。
本明細書に記載されるこれらの配列のいずれかは、テールピースに含まれ得る。例えば、テールピースは、ライブラリー識別配列、使用配列、または起源配列のうちの1つ以上を含み得る。
本明細書に記載されるタグのいずれかは、固定配列を有する5’末端または3’末端に、またはそれに近接してコネクタを含み得る。コネクタは、反応性基(例えば、化学反応性基または光反応性基)を提供することによって、または結合を可能にする薬剤(例えば、コネクタ(複数可)または架橋オリゴヌクレオチド中のインターカレート部分または可逆的反応性基の薬剤)の部位を提供することによって、結合(例えば、化学結合)の形成を促進する。各5’コネクタは、同じであっても異なっていてもよく、各3’コネクタは、同じであっても異なっていてもよい。2つ以上のタグを有する例示的、非限定的な複合体またはコード付けされた化学物質において、各タグは、5’コネクタ及び3’コネクタを含むことができ、各5’コネクタは、同じ配列を有し、各3’コネクタは、同じ配列を有する(例えば、5’コネクタの配列は、3’コネクタの配列と同じであり得るか、または異なり得る)。コネクタは、1つ以上の結合に使用できる配列を提供する。リレープライマーの結合を可能にするか、または架橋オリゴヌクレオチドをハイブリダイズするために、コネクタは、結合を可能にする1つ以上の官能基(例えば、ポリメラーゼが読み取り能力または転座能力を低下させる結合、例えば化学結合)を含み得る。
これらの配列は、オリゴヌクレオチドについて本明細書に記載の任意の修飾を含むことができ、例えば、有機溶媒中での溶解性を促進する修飾(例えば、ヘッドピースについて等、本明細書に記載のいずれか)、天然ホスホジエステル結合の類似体(例えば、ホスホロチオエート類似体)を提供する修飾、または1つ以上の非天然オリゴヌクレオチド(例えば、2’-置換ヌクレオチド、例えば、2’-O-メチル化ヌクレオチド及び2’-フルオロヌクレオチド等、または本明細書に記載のずれか)を提供する修飾の1つ以上を含み得る。
これらの配列は、オリゴヌクレオチドについて本明細書に記載の任意の特徴を含み得る。例えば、これらの配列は、(例えば、本明細書に記載のように)20ヌクレオチド未満であるタグに含まれ得る。他の例において、これらの配列のうちの1つ以上を含むタグは、ほぼ同じ質量を有する(例えば、各タグは、特定の変数をコードするタグの特定のセット内の平均質量から約+/-10%の質量を有する);プライマー結合領域(例えば、定常領域)を欠く;定常領域を欠く;または短縮された長さ(例えば、30ヌクレオチド未満、25ヌクレオチド未満、20ヌクレオチド未満、19ヌクレオチド未満、18ヌクレオチド未満、17ヌクレオチド未満、16ヌクレオチド未満、15ヌクレオチド未満、14ヌクレオチド未満、13ヌクレオチド未満、12ヌクレオチド未満、11ヌクレオチド未満、10ヌクレオチド未満、9ヌクレオチド未満、8ヌクレオチド未満、または7ヌクレオチド未満の長さ)定常領域を有する。
この長さのライブラリー及びオリゴヌクレオチドの配列決定戦略は、それぞれ、読み取り忠実度または配列決定の深度を増加させるための連結またはカテネーション戦略を任意に含んでよい。特に、プライマー結合領域を欠くコード付けされたライブラリーの選択は、SELEXについての文献に記載されており、例えば、Jarosch et al.,Nucleic Acids Res 34:e86(2006)に記載され、これを参照により本明細書に組み込む。例えば、ライブラリーメンバーは、複合体またはコード付けされた化学物質の5’末端上の第1のアダプター配列と、複合体またはコード付けされた化学物質の3’末端上の第2のアダプター配列とを含むように(例えば、選択工程の後)修飾することができ、第1の配列は、第2の配列に実質的に相補的であり、二本鎖を形成する。収率をさらに向上させるために、2つの固定されたダングリングヌクレオチド(例えば、CC)を5’末端に付加する。特定の実施形態において、第1のアダプター配列は、5’-GTGCTGC-3’(配列番号1)であり、第2のアダプター配列は、5’-GCAGCACC-3’(配列番号2)である。
酵素的ライゲーション及び化学ライゲーション技術
様々なライゲーション技術を使用して、タグをヘッドピースに付加して、コード付けされた化学物質を生成することができる。したがって、本明細書に記載される結合工程のいずれかは、酵素的ライゲーション及び/または化学ライゲーション等の任意の有用なライゲーション技術を含み得る。これらの結合工程は、コード付けされた化学物質のオリゴヌクレオチドヘッドピースへの1つ以上のタグの付加を含み得る。特定の実施形態において、任意のオリゴヌクレオチドに使用されるライゲーション技術は、ライブラリーのデコードを可能にする、または1つ以上のDNAもしくはRNAポリメラーゼとの鋳型依存性重合を可能にするために転写及び/または逆転写することができる終局産物を提供する。
一般に、酵素的ライゲーションは、転写及び/または逆転写され得る天然ホスホジエステル結合を有するオリゴヌクレオチドを生成する。酵素的ライゲーションの例示的な方法は、本明細書に提供され、T4 RNAリガーゼ1または2、T4 DNAリガーゼ、CircLigase(商標)ssDNAリガーゼ、CircLigase(商標)II ssDNAリガーゼ、及びThermoPhage(商標)ssDNAリガーゼ(Prokazyme Ltd.、Reykyavik,Icland)等の1つ以上のRNAまたはDNAリガーゼの使用を含む。
化学ライゲーションを使用して、転写または逆転写が可能なオリゴヌクレオチドを生成することもでき、またはそうでなければ、鋳型依存性ポリメラーゼの鋳型として使用することもできる。転写または逆転写が可能なオリゴヌクレオチドを提供するための化学ライゲーション技術の有効性は、試験する必要があり得る。この有効性は、液体クロマトグラフィー-質量分析、RT-PCR分析、PCR分析、電気泳動、及び/または配列決定等の任意の有用な方法によって試験することができる。
酵素的ライゲーションまたは化学ライゲーションを促進するための反応条件
本明細書に記載の方法は、ヘッドピースとタグとの間または2つのタグとの間の酵素的または化学ライゲーションを促進する1つ以上の反応条件を含み得る。これらの反応条件は、本明細書に記載のように、タグ内で修飾ヌクレオチドを使用すること、異なる長さを有し、タグの濃度を変化させるドナータグ及びアクセプタータグを使用すること、異なる種類のリガーゼを使用すること、ならびにそれらの組み合わせ(例えば、CircLigase(商標)DNAリガーゼ及び/またはT4 RNAリガーゼ)を使用すること、及びそれらの濃度を変化させること、異なる分子量を有し、それらの濃度を変化させるポリエチレングリコール(PEG)を使用すること、非PEGクラウディング剤(例えば、ベタインまたはウシ血清アルブミン)を使用すること、ライゲーションの温度及び期間を変化させること、ATP、Co(NHCl、及び酵母無機ピロホスフェートを含む様々な薬剤の濃度を変化させること、酵素的または化学的にリン酸化されたオリゴヌクレオチドタグを使用すること、3’保護タグを使用すること、及び予備アデニル化タグを使用することを含む。これらの反応条件には、化学ライゲーションも含まれる。
ヘッドピース及び/またはタグは、1つ以上の修飾または置換ヌクレオチドを含み得る。好ましい実施形態において、ヘッドピース及び/またはタグは、2’-O-メチルヌクレオチド(例えば、2’-O-メチルグアニンまたは2’-O-メチルウラシル)、2’-フルオロヌクレオチド、またはライゲーションの基質として利用される任意の他の修飾ヌクレオチド等の、酵素的ライゲーションを促進する1つ以上の修飾または置換ヌクレオチドを含む。あるいは、ヘッドピース及び/またはタグは、化学ライゲーションを支持するために1つ以上の化学反応性基を含むように修飾される(例えば、任意に置換されたアルキニル基及び任意に置換されたアジド基)。任意に、タグオリゴヌクレオチドは、化学反応性基を有する両方の末端で官能化され、任意に、これらの末端のうちの1つが保護され、その結果、基が独立して対処され得、副反応が低減され得る(例えば、重合副反応が低減される)。
本明細書に記載のように、ホスホジエステル、ホスホネート、またはホスホロチオエート結合をもたらす化学ライゲーションは、シアノイミダゾール及びZn2+等の二価金属イオンの存在下で、5’-または3’-ホスフェート、ホスホネート、またはホスホロチオエートと5’-または3’-ヒドロキシル基との反応によって行われ得る。
酵素的ライゲーションは、1つ以上のリガーゼを含み得る。例示的なリガーゼとしては、CircLigase(商標)ssDNAリガーゼ(EPICENTRE Biotechnologies、Madison,WI)、CircLigase(商標)II ssDNAリガーゼ(同じくEPICENTRE Biotechnologiesから)、ThermoPhage(商標)ssDNAリガーゼ(Prokazyme Ltd.、Reykjavik,Iceland)、T4 RNAリガーゼ、及びT4 DNAリガーゼが挙げられる。好ましい実施形態において、ライゲーションは、RNAリガーゼ、またはRNAリガーゼとDNAリガーゼとの組み合わせの使用を含む。ライゲーションは、1つ以上のリガーゼと組み合わせて、Co(NHCl等の1つ以上の可溶性多価カチオンをさらに含み得る。
ライゲーション工程の前後に、複合体またはコード付けされた化学物質を精製することができる。いくつかの実施形態において、複合体またはコード付けされた化学物質を精製して、交差反応をもたらし得る未反応のヘッドピースまたはタグを除去し、「ノイズ」をコード化プロセスに導入することができる。いくつかの実施形態において、複合体またはコード付けされた化学物質を精製して、リガーゼのライゲーション活性を阻害または低下させ得る任意の試薬または未反応の出発物質を除去することができる。例えば、オルトリン酸塩は、ライゲーション活性の低下をもたらし得る。ある特定の実施形態において、化学またはライゲーション工程に導入される実体は、後続の化学またはライゲーション工程を可能にするために除去される必要があり得る。複合体またはコード付けされた化学物質を精製する方法は、本明細書に記載される。複合体またはコード付けされた化学物質の精製は、複合体またはコード付けされた化学物質の可逆的固定化、続いて後続の工程の前に精製及び放出によって行われ得る。
酵素的及び化学ライゲーションは、300ダルトン超(例えば、600ダルトン超、3,000ダルトン超、4,000ダルトン、5,000、6,000、7,000、8,000、9,000、10,000、15,000、20,000、25,000、30,000、35,000、40,000、または45,000ダルトン)の平均分子量を有するポリエチレングリコールを含み得る。特定の実施形態において、ポリエチレングリコールは、約3,000ダルトン~9,000ダルトン(例えば、3,000ダルトン~8,000ダルトン、3,000ダルトン~7,000ダルトン、3,000ダルトン~6,000ダルトン、及び3,000ダルトン~5,000ダルトン)の平均分子量を有する。好ましい実施形態において、ポリエチレングリコールは、約3,000ダルトン~約6,000ダルトン(例えば、3,300ダルトン~4,500ダルトン、3,300ダルトン~5,000ダルトン、3,300ダルトン~5,500ダルトン、3,300ダルトン~6,000ダルトン、3,500ダルトン~4,500ダルトン、3,500ダルトン~5,000ダルトン、3,500ダルトン~5,500ダルトン、及び3,500ダルトン~6,000ダルトン、例えば4,600ダルトン)の平均分子量を有する。ポリエチレングリコールは、約25%(w/v)~約35%(w/v)、例えば30%(w/v)等、任意の有用な量で存在し得る。
コード付けされたライブラリーにタグを付ける方法
本明細書に記載の方法を使用して、オリゴヌクレオチドタグによってコード付けされる多様な数の化学物質を有するライブラリーを合成することができる。本発明は、タグの配列と化学物質の同一性との間でコード化関係が確立され得るように、オリゴヌクレオチドタグを化学物質(例えば、既存の化合物等の化合物)と作動可能に結合させるための方法を特徴とする。特に、化学物質の同一性は、オリゴヌクレオチド中の塩基の配列から推定することができる。この方法を使用して、多様な化学物質を含むライブラリーを、特定セットのタグでコード付けすることができる。
一般に、これらの方法は、i)化学物質、ii)カルベン前駆体基及び架橋基を含む二官能性リンカー、iii)オリゴヌクレオチドヘッドピース及び架橋基を含む複合体、ならびにiv)オリゴヌクレオチドタグまたは互いにライゲーションするように設計されたタグの独自の組み合わせの使用を含む。1つのオリゴヌクレオチドタグがオリゴヌクレオチドヘッドピースに結合する。結合は、酵素結合(例えば、RNAリガーゼ及び/またはDNAリガーゼのうちの1つ以上とのライゲーション)または化学結合(例えば、求核剤及び脱離基等の2つの官能基間の置換反応)等の任意の有用な手段によって実現され得る。
本発明は、オリゴヌクレオチドをコード付けする独自の組み合わせを使用して、数百万の個々の化学物質(例えば、既存の化合物)をコード付けする実用的な方法を記載する。一例として、各最終連結されたタグセットが設計化合物-リンカー-ヘッドピース-TagA-TagB-TagC-TagD-テールピースを有するコード化戦略は、1つのオリゴヌクレオチドヘッドピース、50個の独自のオリゴヌクレオチドTagA、50個の独自のオリゴヌクレオチドTagB、50個の独自のオリゴヌクレオチドTagC、50個のオリゴヌクレオチドTagD、及び1個のオリゴヌクレオチドTailpieceで625万個(50×50×50×50)の化合物を独自にコード付けすることができる。これは、200個の独自のオリゴヌクレオチドタグ、1個のオリゴヌクレオチドヘッドピース、及び1個のオリゴヌクレオチドテールピースを総計する。ヘッドピース及びテールピースは、定常的なプライマー結合配列を含有してもよく、または増幅のために使用され、クラスター形成及び配列決定のために任意に利用されるプライマー結合配列の結合(例えばライゲーションによる)を可能にする官能基を提供してもよい。プライマー結合配列は、複合体またはコード付けされた化学物質のオリゴヌクレオチドタグを増幅及び/または配列決定するために使用することができる。増幅及び配列決定のための例示的な方法としては、ポリメラーゼ連鎖反応(PCR)、直鎖増幅反応(LCR)、ローリングサークル増幅(RCA)、または核酸配列を増幅もしくは決定するための当技術分野で知られている任意の他の方法が挙げられる。これらのオリゴヌクレオチドタグの適切な特定の組み合わせを、それらがコード付けする個々の化合物と一緒に分配することは容易に自動化される。
オリゴヌクレオチドタグは、一本鎖または二本鎖であってもよく、すべてのオリゴヌクレオチドが「ワンポット」反応混合物に同時に導入されても、正確な空間順序でライゲーションすることを可能にする直交ライゲーション重複を含有してもよい。オリゴヌクレオチドは、ライゲーションのために適切に修飾される(例えば、5’ホスホリラトンによって)。
コード付けされたライブラリーをスクリーニングする方法
次に、ライブラリーは、本明細書に記載のように、特徴または機能について試験及び/または選択され得る。例えば、タグ付けされた化学物質の混合物は、少なくとも2つの集団に分離することができ、(例えば、陰性選択または陽性選択によって)第1の集団は、特定の生物学的標的に結合するメンバーについて濃縮され、第2の集団は、濃縮されない。次いで、第1の集団を選択的に捕捉することができ(例えば、目的の標的を提供するカラムから溶出させることによって、または目的の標的とともにアリコートをインキュベートし、続いて結合したライブラリーメンバーとともにタンパク質を捕捉し、続いてライブラリーメンバーを溶出させることによって)、任意に、洗浄、精製、陰性選択、陽性選択、もしくは分離工程等を用いて、さらに分析または試験することができる。これらの方法の適応は、ライブラリーメンバーとマトリックスのコード化タグ内またはマトリックスとの間で、または標的タンパク質内で、例えば、制限エンドヌクレアーゼまたはプロテアーゼを使用して、少なくとも1つの共有結合を切断するライブラリー溶出工程が含まれる場合、可逆的または不可逆的な共有結合標的修飾因子を得ることができる。
目的の標的に結合する第1のライブラリーからの既存の化合物が同定されると、既存の化合物の第2のライブラリーをコード付けし、目的の標的に対してスクリーニングし得る。
コード付けされたライブラリーをデコードする方法
最後に、選択された集団内のコード付けされた化学物質の同一性は、オリゴヌクレオチドタグの配列によって決定することができる。この方法は、配列を、コード付けされたライブラリーメンバーとタグ付け履歴と相関させると、ライブラリーの個々のメンバーを、選択された特徴(例えば、標的タンパク質と結合し、それによって治療効果を誘発する傾向の増加)とともに識別することができる。次いで、さらなる試験及び最適化のために、候補の治療用化合物は、識別されたライブラリーメンバーを、それらが結合したオリゴヌクレオチドタグを用いてもしくは用いずに合成することによって、または、反応性または光反応性リンカー構成要素による修飾の有無にかかわらず、ライブラリーを構築するために使用された個々の既存の化合物に直接アクセスすることによって、調製されてもよい。
本明細書に記載の方法は、ライブラリーを多様化するか、またはライブラリーのメンバーを問い合わせるための任意の数の任意の工程を含み得る。本明細書に記載の任意のタグ付け方法では、連続した「n」数のタグを、さらなる「n」数のライゲーション、分離、及び/またはリン酸化工程とともに、あるいは代替的に、「単一ポット」反応で起こる「連続した」ライゲーションとともに付加して、独自の組み合わせの連続したタグセットを提供することができる。例示的な任意の工程としては、1つ以上の制限エンドヌクレアーゼを使用する、コード化オリゴヌクレオチドに結合したライブラリーメンバーの制限;例えば、本明細書に記載のもの等の任意の修復酵素による、結合したコード化オリゴヌクレオチドの修復;コード化オリゴヌクレオチドに結合したライブラリーメンバーの末端の一方または両方への1つ以上のアダプター配列(例えば、増幅及び配列決定のためのプライミング配列を提供するか、または配列の固定化のためのビオチン等の標識を提供するための1つ以上のアダプター配列)のライゲーション;逆転写酵素、転写酵素、または別の鋳型依存性ポリメラーゼを使用して、複合体またはコード付けされた化学物質中の組み立てられたタグの逆転写、もしくは任意に逆転写に続く転写;例えば、PCRを使用して、複合体またはコード付けされた化学物質中の組み立てられたタグの増幅;例えば、細菌形質転換、エマルション形成、希釈、表面捕捉技術等の使用による、複合体またはコード付けされた化学物質中の組み立てられたタグの1つ以上の集団のクローン単離物の生成;例えば、ヌクレオチドの鋳型依存性重合のための鋳型としてクローン単離物を使用することによる、複合体またはコード付けされた化学物質中の組み立てられたタグの1つ以上の集団のクローン単離物の増幅;ならびに例えば、可逆的ターミネーター化学反応を有する蛍光標識ヌクレオチドとの鋳型依存性重合のための鋳型としてクローン単離物を使用することによる、複合体またはコード付けされた化学物質中の組み立てられたタグの1つ以上の集団のクローン単離物の配列決定が挙げられる。オリゴヌクレオチドタグを増幅及び配列決定するためのさらなる方法を本明細書に記載する。
これらの方法を使用して、例えば、選択工程において、特定の特徴または機能を有する任意の数の化学物質を識別し、発見することができる。所望の特徴または機能は、所望の機能を有するライブラリー内のメンバーまたは関連メンバーのうちの少なくとも1つの付随する濃縮により、ライブラリーを少なくとも2つの部分に分割するための基礎として使用され得る。特定の実施形態において、本方法は、治療上の目的のタンパク質に結合するか、または該タンパク質を不活性化する小さい薬物様ライブラリーメンバーを同定することを含む。これらの場合のいずれにおいても、オリゴヌクレオチドタグは、ライブラリーメンバーの化学履歴をコードし、各場合において、化学的可能性のコレクションは、任意の特定のタグの組み合わせによって表され得る。
一実施形態において、化学物質のライブラリー、またはその一部を、ライブラリーの少なくとも1つのメンバーが標的に結合するのに好適な条件下で生物学的標的と接触させ、続いて、標的に結合しないライブラリーメンバーを除去し、標的に結合した1つ以上のオリゴヌクレオチドタグを分析する。この方法は、任意に、当技術分野で知られている方法によってタグを増幅することを含み得る。例示的な生物学的標的としては、酵素(例えば、キナーゼ、ホスファターゼ、メチラーゼ、デメチラーゼ、プロテアーゼ、及びDNA修復酵素)、タンパク質間相互作用に関与するタンパク質(例えば、受容体のリガンド)、受容体標的(例えば、GPCR及びRTK)、イオンチャネル、細菌、ウイルス、寄生虫、DNA、RNA、プリオン、及び炭水化物が挙げられる。
別の実施形態において、標的に結合するコード付けされた化学物質は、増幅に供されないが、直接分析される。例示的な分析方法としては、エバネッセント共鳴フォトニック結晶解析を含む、マイクロアレイ解析、タグを分解するためのビーズベースの方法(例えば、hisタグを使用することによる)、無標識フォトニック結晶バイオセンサー分析(例えば、SRU Biosystems,Inc.、Woburn,MAからのBIND(登録商標)Reader)、またはハイブリダイゼーションベースのアプローチ(例えば、タグのライブラリーに存在する配列に相補的な固定化オリゴヌクレオチドのアレイを使用することによる)が挙げられる。
加えて、化学反応性対は、固相オリゴヌクレオチド合成スキームに容易に含まれ得、オリゴヌクレオチドの効率的な化学ライゲーションを支持する。加えて、得られたライゲーションされたオリゴヌクレオチドは、1つ以上のポリメラーゼによる鋳型依存性重合のための鋳型として機能することができる。したがって、コード付けされたライブラリーにタグを付けるための本明細書に記載の結合工程のいずれかは、酵素的ライゲーション及び/または化学ライゲーション技術のうちの1つ以上を含むように修飾され得る。例示的なライゲーション技術としては、酵素的ライゲーション、例えば、1つ以上のRNAリガーゼ及び/またはDNAライガーゼの使用、ならびに化学ライゲーション、例えば、化学反応性対(例えば、任意に置換されたアルキニル及びアジド官能基を含む対)が挙げられる。
いくつかの実施形態において、増幅は、油中水エマルションを形成して複数の水性マイクロリアクターを作製することを任意に含み得る。反応条件(例えば、複合体またはコード付けされた化学物質の濃度及びマイクロリアクターのサイズ)は、平均して、化合物ライブラリーの少なくとも1つのメンバーを有するマイクロリアクターを提供するように調整することができる。各マイクロリアクターはまた、標的、コード付けされた化学物質またはコード付けされた化学物質の一部(例えば、1つ以上のタグ)に結合可能な及び/または標的に結合可能な単一のビーズ、ならびに核酸増幅を行うために必要な1つ以上の試薬を有する増幅反応溶液を含有することができる。マイクロリアクター内のタグを増幅した後、タグの増幅コピーはマイクロリアクター内のビーズに結合し、コーティングされたビーズは、任意の有用な方法によって識別され得る。
既存の化学物質のコード付けされたライブラリーのタグ付け、スクリーニング、及びデコードのための一般的な戦略
本明細書に記載の方法は、アッセイ準備プレートの生成のための一般的に利用されるプロセスと同様に、個々の化学物質(例えば、化合物)としての化学物質のライブラリー全体(例えば、化合物コレクション)を、1つの化合物、1つのウェルベースで各ウェルに導入することを含み得る。続いて、高相対濃度の二官能性リンカー(例えば、3-(2-アジドエチル)-3-メチル-3H-ジアジリン)を有機溶媒中に導入し、続いて照射して、アジリジン基を活性化し、二官能性リンカーとコード付けされる化合物との間の共有結合の形成を可能にすることができる。その後の圧力の低下は、過剰の未反応の二官能性リンカー、及び任意に、有機溶媒のすべてまたは一部を除去し得る。次の工程では、二官能性ヘッドピースオリゴヌクレオチドを、コード化タグ、リガーゼ酵素、及びリガーゼ能のある緩衝液の十分に特異的な組み合わせとともに、各ウェルに導入してもよい。コード化タグは、それらのライゲーション接合部を慎重に設計することによって、正確に決定された順序でヘッドピース及び互いにライゲーションするように設計される。ヘッドピースはまた、銅がライゲーション効率または特異性を妨げる可能性があるため、銅フリークリック反応においてコード付けされる化合物に接続されるアジドと反応するひずみアルキンを含有する。
続いて、個々のウェルの内容物をクエンチし、結合し、次いでさらに精製し、混合物として濃縮してから、所望の他のタグ配列とともにコード化配列を識別するライブラリーを含有するテールピースにライゲーションすることができる。一旦生成されたライブラリーのアリコートが、他のコード付けされたライブラリーと組み合わされるか、または組み合わされないかのいずれかの親和性媒介スクリーニングのために使用され得る。
タグのウェル特異的な組み合わせのワンポットライゲーションは、既存の化合物のより大きなライブラリー(例えば、数千の化合物のライブラリーではなく、数百万の化合物のライブラリー)のタグ付けを可能にする。さらに、本発明は、既存の化合物を揮発性ジアジリン-アジドリンカーでインキュベートすることを可能にし、照射すると、得られたカルベンを化合物上の潜在的に複数の反応部位に挿入することができる。さらに、この方法は、未反応の架橋剤を低圧で除去し、続いてアジドのヘッドピースへの結合によって可能にする。既存の化合物のライブラリーのHTS準備プレートは、単一のライゲーションを介して、オリゴヌクレオチドタグのウェル特異的な組み合わせでコード付けされる。
従来のHTSは、生化学的(例えば、基質の酵素的形質転換)、生物物理的(例えば、標識プローブ置換)、または生物学的(例えば、細胞ベース)に由来する読み出しを用いたアッセイに対するそれらの影響を検出することによって、標的調節分子の活性ベースの発見を利用する。概して、これらのアッセイは、低濃度の標的(例えば、タンパク質)及び高濃度の推定標的調節分子(例えば、既存の化合物のライブラリーの一部である小分子化合物)で実施される。このようなスクリーニングは、凝集媒介性または不溶性媒介性シグナル等の小分子の高濃度から生じるアーチファクトによって大部分が混同される。
オリゴヌクレオチドタグによってコード付けされる化合物の同じライブラリーで親和性媒介スクリーニングを実行する機会は、完全に異なるアッセイ環境下で(例えば、個々の化合物濃度が低い)、どの化合物コレクションメンバーが標的タンパク質と相互作用するかを決定する機会を提供する。さらに、溶解性は、結合したオリゴヌクレオチドによって付与され、それによって、元のスクリーニングからの本物のヒットの同定を助ける直交アッセイデータを提供する。多くの場合、既存の組み合わせで生成されたDNAコード付けされた化学ライブラリーを利用するプロジェクトのタイムラインの半分以上は、親和性媒介ライブラリースクリーンで富化された分子のオフDNAバージョンの再合成に特化している。したがって、すべての化合物が元のライブラリーまたはコレクション内に既存であるため、スクリーニング内で同定された濃縮化合物の再合成は必要でないため、既存の化合物のライブラリーのコード化は、プロジェクトタイムラインを加速する。
既存の化合物のライブラリーは、標的タンパク質の調節物質を発見するために製薬会社によって利用される化合物のコレクションであり得る。コレクションの個々のメンバーは、別々の区画(例えば、多壁プレートの個々のウェル(例えば、96ウェルプレート、384ウェルプレート、または1536ウェルプレート))に等分することができる。各ウェル内の各化合物は、リンカー、例えば、揮発性二官能性リンカーとのインキュベーションによって反応させてもよい。揮発性二官能性リンカーの例は、ジアジレン基(カルベン前駆体)及びアジド基(架橋基)を含む小分子量化合物である。ジアジレン官能基は、好適な反応条件下(例えば、照射を介した光化学的条件)で化合物と反応させる。照射はジアジリン基を活性化し、カルベンに変換する。光化学的に活性化されたジアジリンは、それ自体を共有結合の範囲に挿入することができ、それによって、結合を念頭に置いて設計されていない分子と共有結合を形成し、それらが個々の分子内の複数の遺伝子座で反応することができるため、それらを複数のベクターから表示することができ、いくつかの位置での結合によって不活性化される分子の発見を可能にする。次に、低減された圧力を使用して、揮発性未反応の二官能性リンカーを除去することができ、残留官能化HTS化合物を次に、アジド反応性オリゴヌクレオチドに結合され、次に、互いに、及びアジド反応性オリゴヌクレオチドに、定義された順序でライゲーションするように設計されたオリゴヌクレオチドの組み合わせの導入によってコード付けして、増幅可能な連結されたオリゴヌクレオチドタグ及びプライマー結合配列のセットを生成することができる。好適な揮発性二官能性架橋剤の例は、3-(2-アジドエチル)-3-メチル-3H-ジアジリンである。
個々の増幅可能なコード付けされたオリゴヌクレオチド-HTSデッキ化合物を組み合わせ、任意にさらに精製し、混合物として濃縮し、親和性媒介スクリーニングに続いてポリメラーゼ媒介性増幅及び配列決定を行い、濃縮されたライブラリーメンバーを識別することができる。次いで、個々の濃縮されたHTSデッキ化合物の標的調節活性の確認は、適切な活性アッセイにおいてオフDNA形態の個々のHTSデッキ化合物を試験することによって確立してもよい。タグがない化合物は既に存在するため、再合成する必要はない。
実施例1-既存の化合物にタグを付ける
化学物質を、カルベン前駆体基及び第1の架橋基を含む二官能性リンカーと反応させて、第1の複合体を生成すること
化学物質は、既存の化合物のライブラリーから供給され、ウェル当たり1つの化合物でマルチウェルプレートに等分される。これらは、溶液中であっても乾燥していてもよく、96ウェル、384ウェル、または1536ウェル、または他の空間的に分離された区画に配置されてもよい。
二官能性リンカー(例えば、揮発性二官能性リンカー(VBL))は、合成されるか、または商業的に得られる。VBLの1つの反応性基を光化学反応させてカルベンを生成することができる。他方の反応性基は、クリック化学に好適なアジド架橋基である。VBLの一例は次のとおりである。
Figure 2022542756000012
リンカー1(3-(2-アジドエチル)-3-メチル-3H-ジアジリン)の合成は、Liang et al.Angew.Chem.Int.Ed.Engl.56(10):2744-2748(2017)に報告されている。
次いで、リンカー1及びジメチルスルホキシド(DMSO)を、連続するマルチウェルプレート、または他の空間的にアドレス指定可能な区画の各ウェルに添加し、365nmで30分間照射する。各ウェルにおける得られた第1の複合体は、減圧下(例えば、約400torr)及び上昇した温度(例えば、約25~30℃)での蒸発によって未反応のリンカー1を除去することによって精製される。
各第1の複合体は、以下の構造を有し、
Figure 2022542756000013
式中、CEは、化学物質を含む構造を表す。
オリゴヌクレオチドヘッドピース及び架橋基を含む第2の複合体の合成
オリゴヌクレオチドヘッドピース及び架橋基を含む第2の複合体は、一級アミン末端オリゴヌクレオチドヘッドピース、及びジベンゾシクロオクチンアミノ(DBCO)基を含むリンカーから合成される。アミン末端オリゴヌクレオチドヘッドピースの例は、以下の構造を有するヘッドピース1(配列番号3)である。
Figure 2022542756000014
DBCO基を含むリンカーの例としては、以下の構造を有するリンカー2が挙げられる。
Figure 2022542756000015
ヘッドピース1及びリンカー2を一緒に反応させることにより、リンカー2のNHSエステル基がヘッドピース1のアミン基と反応して、オリゴヌクレオチドヘッドピース及びDBCO架橋基を含む複合体(複合体2、配列番号4)を生成する。
Figure 2022542756000016
複合体2を、HPLCを使用して精製する。
第1の複合体と第2の複合体を反応させて第3の複合体を生成すること
次いで、各ウェルに緩衝液中の複合体2を添加し、得られた混合物をインキュベートして、複合体1のアジドと複合体2のひずみアルキンとの間の反応(例えば、クリック化学)を可能にし、以下の構造を有する複合体3(配列番号5)を生成する。
Figure 2022542756000017
本明細書で使用される、複合体3の簡略化された例示を以下に示す。
Figure 2022542756000018
第3の複合体のオリゴヌクレオチドヘッドピースへのオリゴヌクレオチドタグのライゲーション
続いて、直交重複アーキテクチャの慎重な設計によってライゲーションの1つの順序のみを可能にするように設計された、十分に特異的、したがって化合物特異的なDNAタグのコレクションの水溶液を付加する。
コード化戦略の一例を以下に示す。
Figure 2022542756000019
この例では、化合物のコレクションは、化合物(例えば、既存の化合物)がプレート内に提示され、タグAが各プレートの行の同一性をコードし、タグBが各プレートの列の同一性をコードし、タグCが各プレートの同一性をコードし、タグDの変更が先行するタグがその後異なる文脈で再利用されることを可能にする、4レジスタタグシステムを使用してコード付けされる。各レジスタ間で均等に分割された合計400個のタグが利用可能である場合、合計1億個の化合物がそれぞれ独自にコード付けされ得る。
ライゲーションインキュベーションが完了した後、各ウェルの内容物を組み合わせて、例えばEDTAでクエンチし、それによってライブラリー全体を含む個々のコード付けされた化合物を一緒にプールする。ライブラリーを、沈殿によって濃縮し、HPLCによって精製する。次いで、ライブラリーは、増幅中にプライマー結合のためのライブラリー識別配列及び定常配列を導入し、クラスター形成及び配列決定を含む下流操作に役立つ他のタグ及び/または配列を任意に含有してよい、終了タグまたはテールピースのさらなるライゲーションによって閉鎖される。
コード付けされたライブラリーのスクリーニング
次いで、このライブラリーを使用して、目的の標的とインキュベートすること、標的の捕捉、非結合ライブラリーメンバーの洗い流しによって、及びタンパク質変性、タグ切断、または特異的溶出のいずれかによるタンパク質結合メンバーの溶出によって、タンパク質または目的の他の標的に結合することができる個々のメンバーを発見する。次いで、出力集団のコード化DNAを増幅、配列決定し、入力集団に由来する対応する試料と比較して、出力を濃縮した化合物を識別する。次いで、目的の化合物を既存のコレクションから供給し、標的調節アッセイにおいて試験して、どの化合物がヒットとみなされ得るかを決定する。
実施例2-オリゴヌクレオチドヘッドピース及び架橋基を含む複合体DBCO-HP006の合成
配列が(p)CCTGTGTTZTTCACAGGCCT(配列番号6)(式中Zは、mdC(TEG-アミノ)修飾を表す)であり、その5’末端で化学的にリン酸化されたヘッドピースHP006を利用した。
HP006(10mM)の水溶液300μLに、水8μL、Pierce 1Mホウ酸緩衝液pH8.5(Thermo Fisher)25μL、及びDMSO中のDBCO-PEG4-NHSエステル(BrodPharm)(30mM)溶液167μLを添加した。混合物を室温で2日間静置させた。この混合物の62μLの画分にエタノール(560μL)を添加し、遠心分離後に沈殿物を収集した。沈殿物を80%エタノール(650μL)で洗浄した。洗浄した沈殿物を空気に曝露して乾燥させた後、水(125μL)中で再構成した。生成物DBCO-HP006の濃度を、ナノドロップUV分光光度計で2.7mM(90%)と決定した。
生成物DBCO-HP006のLCMSを図1A及び図1Bに示す。質量スペクトルにより、生成物の同一性が確認された(負イオンモードでの観察値m/z:857.2、979.7、1143.0;計算値m/z:[M-8H]8-:857.2、[M-7H]7-:979.8、[M-6H]6-:1143.2)。
実施例3-既存の化合物をリンカー1及びDBCO-HP006に結合すること
96ウェル天然色ポリプロピレンPCRプレートの各ウェルの底部に、18mMまたは6mM既存の化合物及び200mMリンカー1を含有するDMSO溶液を添加した。プレートをAlpha Innotech AIML-26 Transilluminator上365nm(6×8W)で10分間照射した。次いで、各反応混合物の2μL画分を、1×T4 DNAリガーゼ緩衝液(Thermo Fisherの10倍リガーゼ緩衝液から作製)中の25μMのDBCO-HP006の20μLに混合し、室温で一晩静置させた。
12個の既存の化合物を、この結合手順に供した(表1)。粗結合混合物をLCMSによって分析した。12個の出発化合物のうち10個について、予想されるmz値を有する結合生成物を検出することが可能であった。結果を表1に要約する。LCMSデータを図2A、図2B、図3A、図3B、図4A、図4B、図5A、図5B、図6A、図6B、図7A、図7B、図8A、図8B、図9A、図9B、図10A、図10B、図11A、及び図11Bに示す。
(表1)既存の化合物をリンカー1及びDBCO-HP006に結合するためのLCMS分析結果の要約
Figure 2022542756000020
実施例4-オリゴヌクレオチドヘッドピース、ヘッドピース伸長、及び化合物の同一性をコード付けするために使用し得る4つのタグのワンポットライゲーション
配列が(p)TGGCTATCCTGGCTGAGG(配列番号7)及び(p)CAGCCAGGATAG(配列番号8)である、それぞれの5’末端で化学的にリン酸化された2つのDNAオリゴヌクレオチドを等モル比で組み合わせて、二本鎖EXT00001の1mM溶液を作製した。
配列が(p)CCAAAGAGTGGAGCTAAG(配列番号9)及び(p)AGCTCCACTCTT(配列番号10)である、それぞれの5’末端で化学的にリン酸化された2つのDNAオリゴヌクレオチドを、二本鎖TagAの予め混合された1mM溶液として使用した。
配列が(p)GCTATGGAGCCACTACTT(配列番号11)及び(p)TAGTGGCTCCAT(配列番号12)である、それぞれの5’末端で化学的にリン酸化された2つのDNAオリゴヌクレオチドを、二本鎖TagBの予め混合された1mM溶液として使用した。
配列が(p)AGCGATCTAGCAATGC(配列番号13)及び(p)TTGGCTAGATCC(配列番号14)である、それぞれの5’末端で化学的にリン酸化された2つのDNAオリゴヌクレオチドを、二本鎖TagCの予め混合された1mM溶液として使用した。
配列が(p)CATACATACGCGACTGCA(配列番号15)及び(p)AGTCGCGTATGT(配列番号16)である、それぞれの5’末端で化学的にリン酸化された2つのDNAオリゴヌクレオチドを、二本鎖TagDの予め混合された1mM溶液として使用した。
1×リガーゼ緩衝液(Thermo Fisherの10×リガーゼ緩衝液を使用)中、6つの二本鎖オリゴヌクレオチド成分(最終濃度:20μMのHP006、1.05モル当量のEXT0001、1.1モル当量のTagA、1.15モル当量のTagB、1.2モル当量のTagC、1.25モル当量のTagD)の50μL混合物に、1.5μlのT4DNAリガーゼ(Thermo Fisher)を添加した。各陰性対照反応において、二本鎖オリゴヌクレオチド成分のうちの1つが等量の水によって置き換えられたことを除いて、6つの陰性対照反応を同じ手順で設定した。反応物をサーマルサイクラー中、16℃で2日間インキュベートした。反応混合物を、臭化エチジウムを含有する4%E-ゲル高分解能アガロースゲル上で電気泳動によって分析した。ゲル像を図12に示す。
ワンポットライゲーション反応は、すべての陰性対照反応によって生成される主要な生成物よりも長い1つの主要なDNAライゲーション生成物を生成し、ワンポットライゲーション反応が、定義された配列中のすべてのオリゴヌクレオチド成分をライゲーションしたことを証明した。
他の実施形態
上記明細書に記載のすべての刊行物、特許出願、及び特許は、参照により本明細書に組み込まれる。
本明細書に記載の方法及びシステムの様々な改変及び変更は、本発明の範囲及び趣旨から逸脱することなく、当業者には明らかとなるであろう。本発明を特定の所望の実施形態に関連して記載してきたが、特許請求の範囲に記載される本発明は、そのような特定の実施形態に過度に限定されるべきではないことが理解されよう。実際に、医学、薬学の分野、または関連する分野において当業者に明らかである本発明を実行するための記載の形態の様々な改変は、本発明の範囲内であることが意図される。

Claims (48)

  1. 以下の工程を含む、コード付けされた化学物質を生成する方法:
    (a)化学物質を、カルベン前駆体基及び第1の架橋基を含む二官能性リンカーと、前記化学物質及び前記第1の架橋基を含む第1の複合体を生成するのに十分な条件下で反応させる工程、
    (b)前記第1の複合体を、オリゴヌクレオチドヘッドピース及び第2の架橋基を含む第2の複合体と、前記化学物質及び前記オリゴヌクレオチドヘッドピースを含む第3の複合体を生成するのに十分な条件下で反応させる工程、ならびに
    (c)第1のオリゴヌクレオチドタグを前記第3の複合体の前記オリゴヌクレオチドヘッドピースにライゲーションする工程であって、それによって、コード付けされた化学物質が生成される、前記工程。
  2. 前記二官能性リンカーが揮発性である、請求項1に記載の方法。
  3. 前記二官能性リンカーが以下の構造
    Figure 2022542756000021
    を有し、
    式中、Aは、前記カルベン前駆体基であり、
    は、リンカーであり、
    は、前記第1の架橋基である、
    請求項1または2に記載の方法。
  4. 前記カルベン前駆体基が光反応性カルベン前駆体基である、請求項1~3のいずれか1項に記載の方法。
  5. 前記光反応性カルベン前駆体基がジアジリンである、請求項4に記載の方法。
  6. 前記カルベン前駆体基が以下の構造
    Figure 2022542756000022
    を含む、請求項1~5のいずれか1項に記載の方法。
  7. が、C~Cアルキレンである、請求項3~6のいずれか1項に記載の方法。
  8. が、Cアルキレンである、請求項7に記載の方法。
  9. 前記第1の架橋基が、スルフヒドリル反応性架橋基、アミノ反応性架橋基、カルボキシル反応性架橋基、カルボニル反応性架橋基、またはトリアゾール形成架橋基である、請求項1~8のいずれか1項に記載の方法。
  10. 前記第1の架橋基がトリアゾール形成架橋基である、請求項9に記載の方法。
  11. 前記第1の架橋基がアジドである、請求項1~10のいずれか1項に記載の方法。
  12. 前記二官能性リンカーが以下の構造
    Figure 2022542756000023
    を有する、請求項1~11のいずれか1項に記載の方法。
  13. 前記第2の複合体が以下の構造
    Figure 2022542756000024
    を有し、
    式中、Bは、前記オリゴヌクレオチドヘッドピースであり、
    は、リンカーであり、
    は、前記第2の架橋基である、
    請求項1~12のいずれか1項に記載の方法。
  14. 前記オリゴヌクレオチドヘッドピースがヘアピン構造を含む、請求項1~13のいずれか1項に記載の方法。
  15. 前記第2の架橋基が、スルフヒドリル反応性架橋基、アミノ反応性架橋基、カルボキシル反応性架橋基、カルボニル反応性架橋基、またはトリアゾール形成架橋基である、請求項13または14に記載の方法。
  16. 前記第2の架橋基がトリアゾール形成架橋基である、請求項15に記載の方法。
  17. 前記第2の架橋基がジベンゾシクロオクチン基を含む、請求項16に記載の方法。
  18. 前記第2の架橋基が以下の構造
    Figure 2022542756000025
    を含む、請求項17に記載の方法。
  19. 前記方法が、前記第2の複合体を生成するのに十分な条件下で、オリゴヌクレオチドヘッドピース及び架橋基を含む第4の複合体を式IIIの第5の複合体と反応させることによって、前記第2の複合体を生成する工程をさらに含み、
    Figure 2022542756000026
    式中、R及びRは、独立して架橋基であり、
    は、リンカーである、
    請求項1~18のいずれか1項に記載の方法。
  20. が、トリアゾール形成架橋基である、請求項19に記載の方法。
  21. が、ジベンゾシクロオクチン基を含む、請求項20に記載の方法。
  22. が、以下の構造
    Figure 2022542756000027
    を含む、請求項20に記載の方法。
  23. が、スルフヒドリル反応性架橋基、アミノ反応性架橋基、カルボキシル反応性架橋基、カルボニル反応性架橋基、またはトリアゾール形成架橋基である、請求項19~22のいずれか1項に記載の方法。
  24. が、アミノ反応性架橋基である、請求項23に記載の方法。
  25. が、N-ヒドロキシスクシンイミド基を含む、請求項24に記載の方法。
  26. 前記第2の複合体が以下の構造
    Figure 2022542756000028
    を有し、
    式中、Bは、前記オリゴヌクレオチドヘッドピースであり、
    は、リンカーであり、
    は、前記第2の架橋基である、
    請求項19~25のいずれか1項に記載の方法。
  27. 前記第2の架橋基がアミノ基である、請求項26に記載の方法。
  28. 工程(c)の前に、ヘッドピース伸長配列を前記ヘッドピースにライゲーションする工程をさらに含む、請求項1~27のいずれか1項に記載の方法。
  29. 工程(c)の後に、前記コード付けされた化学物質に1つ以上のさらなるタグをライゲーションする工程をさらに含む、請求項1~28のいずれか1項に記載の方法。
  30. 工程(c)の後に、前記コード付けされた化学物質に少なくとも3つのさらなるタグをライゲーションする工程をさらに含む、請求項29に記載の方法。
  31. ワンポットライゲーションを含む、請求項30に記載の方法。
  32. 前記ワンポットライゲーションが、前記ヘッドピースへの前記ヘッドピース伸長配列のライゲーションと、前記コード付けされた化学物質への前記少なくとも3つのさらなるタグのライゲーションとを含む、請求項31に記載の方法。
  33. 前記第1のオリゴヌクレオチドタグ及び前記1つ以上のさらなるタグが、直交重複アーキテクチャを含む、請求項29~32のいずれか1項に記載の方法。
  34. テールピースを前記コード付けされた化学物質にライゲーションする工程をさらに含む、請求項1~33のいずれか1項に記載の方法。
  35. 前記化学物質が、N-H結合もO-H結合も含まない、請求項1~34のいずれか1項に記載の方法。
  36. 工程(b)の前記条件が金属触媒を含まない、請求項1~35のいずれか1項に記載の方法。
  37. 工程(c)の後に、前記コード付けされた化学物質を精製する工程をさらに含む、請求項1~36のいずれか1項に記載の方法。
  38. 前記精製する工程が、高速液体クロマトグラフィー(HPLC)を含む、請求項37に記載の方法。
  39. 工程(a)の前記条件が、照射を含む、請求項1~38のいずれか1項に記載の方法。
  40. 請求項1~39のいずれか1項に記載の方法により生成された複数のコード付けされた化学物質を含む、ライブラリー。
  41. 前記複数のコード付けされた化学物質が、物理的に分離されていない、請求項40に記載のライブラリー。
  42. 前記複数のコード付けされた化学物質が、少なくとも1,000,000個の異なる化学物質を含む、請求項40または41に記載のライブラリー。
  43. 前記複数のコード付けされた化学物質が、少なくとも5,000,000個の異なる化学物質を含む、請求項40~42のいずれか1項に記載のライブラリー。
  44. 前記複数のコード付けされた化学物質が、少なくとも10,000,000個の異なる化学物質を含む、請求項40~43のいずれか1項に記載のライブラリー。
  45. 前記複数のコード付けされた化学物質が、約1,000,000~約5,000,000個の異なる化学物質を含む、請求項40または41に記載のライブラリー。
  46. 前記複数のコード付けされた化学物質が、約5,000,000~約10,000,000個の異なる化学物質を含む、請求項40または41に記載のライブラリー。
  47. 以下の工程を含む、複数の化学物質をスクリーニングする方法:
    (a)標的を、請求項1~39のいずれか1項に記載の方法によって調製されたコード付けされた化学物質及び/または請求項40~46のいずれか1項に記載のライブラリーと接触させる工程、ならびに
    (b)対照と比較して、前記標的に対して所定の特徴を有する1つ以上のコード付けされた化学物質を選択する工程であって、それによって、複数の前記化学物質がスクリーニングされる、前記工程。
  48. 前記所定の特徴が、対照と比較して、前記標的に対する結合の増加を含む、請求項47に記載の方法。
JP2021573160A 2019-07-25 2020-07-24 既存の化合物ライブラリーのタグ付け及びコード付けのための方法 Pending JP2022542756A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962878563P 2019-07-25 2019-07-25
US62/878,563 2019-07-25
PCT/US2020/043419 WO2021016525A1 (en) 2019-07-25 2020-07-24 Methods for tagging and encoding of pre-existing compound libraries

Publications (1)

Publication Number Publication Date
JP2022542756A true JP2022542756A (ja) 2022-10-07

Family

ID=74194298

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021573160A Pending JP2022542756A (ja) 2019-07-25 2020-07-24 既存の化合物ライブラリーのタグ付け及びコード付けのための方法

Country Status (6)

Country Link
US (1) US20220275362A1 (ja)
EP (1) EP4004202A1 (ja)
JP (1) JP2022542756A (ja)
CN (1) CN114144522A (ja)
CA (1) CA3144759A1 (ja)
WO (1) WO2021016525A1 (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112014005205A2 (pt) * 2011-09-07 2017-03-21 X-Chem Inc métodos para etiquetar bibliotecas codificadas com dna

Also Published As

Publication number Publication date
CN114144522A (zh) 2022-03-04
EP4004202A1 (en) 2022-06-01
US20220275362A1 (en) 2022-09-01
CA3144759A1 (en) 2021-01-28
WO2021016525A1 (en) 2021-01-28

Similar Documents

Publication Publication Date Title
JP6906492B2 (ja) ポリメラーゼによって読み取れないコードオリゴヌクレオチドリンケージを有するdnaコード化ライブラリー
ES2675111T3 (es) Métodos para etiquetar bibliotecas con codificación de ADN
US10730906B2 (en) Multi-step synthesis of templated molecules
AU2015374309B2 (en) Methods for tagging DNA-encoded libraries
WO2008141799A1 (en) Oligophosphoramidates
JP2022542756A (ja) 既存の化合物ライブラリーのタグ付け及びコード付けのための方法
US20050123932A1 (en) Nucleic acid-chelating agent conjugates
JP4738741B2 (ja) テンプレートされた分子を合成するための改良法
TW202340479A (zh) Dna編碼化資料庫之評價方法
TW202212568A (zh) 可切斷之dna編碼化文庫
DK1539980T3 (en) Library of complexes comprising small non-peptide molecules and double-stranded oligonucleotides that identify the molecules
JP2005521365A6 (ja) テンプレートされた分子を合成するための改良法