JP2003502007A - ジンクフィンガークラスのdna結合タンパク質の設計方法 - Google Patents

ジンクフィンガークラスのdna結合タンパク質の設計方法

Info

Publication number
JP2003502007A
JP2003502007A JP2000532426A JP2000532426A JP2003502007A JP 2003502007 A JP2003502007 A JP 2003502007A JP 2000532426 A JP2000532426 A JP 2000532426A JP 2000532426 A JP2000532426 A JP 2000532426A JP 2003502007 A JP2003502007 A JP 2003502007A
Authority
JP
Japan
Prior art keywords
dbp
dna
binding
amino acids
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000532426A
Other languages
English (en)
Inventor
ジョージ, エス. マイケルズ,
ライク − ヒイオ ミケルサール,
リチャード, ジェー. フェルドマン,
Original Assignee
ゲノム ダイナミクス, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ゲノム ダイナミクス, インコーポレイテッド filed Critical ゲノム ダイナミクス, インコーポレイテッド
Publication of JP2003502007A publication Critical patent/JP2003502007A/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Analytical Chemistry (AREA)
  • Toxicology (AREA)
  • Zoology (AREA)
  • Peptides Or Proteins (AREA)
  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)

Abstract

(57)【要約】 本発明は、あらゆる予定標的二本鎖DNA配列との結合の可能性を有するDNA結合タンパク質(DBP)の設計に向けられる。タンパク質の設計のための規則、最適DBPに関するスクリーニングのための算法、その規則および算法を用いるコンピューターシステム、タンパク質を包含する一般式、ならびにタンパク質の使用方法が開示される。

Description

【発明の詳細な説明】
【0001】 [発明の背景] 潜在的な核酸結合タンパク質をコードする真核生物遺伝子の超科は、Cys2
−His2(C22)クラスのジンクフィンガー(ZF)ドメインを含有する。
これらの特徴的構造特色を有するタンパク質は、遺伝子発現の調節に重要な役割
を演じる[1-4]。配列比較、突然変異分析および近年の結晶学的研究は、各フィ
ンガードメインが、原則として、DNAトリプレット内のいくつかのまたはすべ
ての3塩基対との接触によりB型DNAの主溝と相互作用することを明示してい
る。これらの塩基特異性相互作用は、タンパク質ドメインのa−ヘリックス領域
[5-10]の特定位置のアミノ酸(AA)側鎖により媒介される。
【0002】 1,300より大きいZFモチーフのAA配列が同定されているが、しかし、正確
なDNA結合部位は2〜3のタンパク質に関してのみ知られている。DNA接触
領域に関する利用可能な情報は、主に富グアニン−シトシン鎖[5-9]と、より少
ない富アデニン−チミン部位[11、12]に関する。実験データに基づいて、ZF配
列を好ましいDNA結合部位と関連させる規則に関する最初の提案が成されてい
る[13、14]。しかしながら、ZFタンパク質−DNA認識に関する一般規則は提
案されていない。これは、コンピューターモデリング[2、3、5]も結晶学的分析[
7]もZF−DNA接触領域における全体的構造変異性に関する十分な情報を提供
していない、という事実のためであると思われる。
【0003】 異なるZF−DNA相互作用に関する特定の接触位置における立体条件を特性
化するための物理的原子−分子モデルを用いる場合、本発明に至る研究の目的は
、ZFドメインのC22クラスに関するZF−DNA認識のための一般規則を確
定することであった。この目的が達成されれば、本発明の計画の仕事は、有効な
ジンクフィンガーDNA結合ポリペプチドを設計するための算法、ならびに算法
を用いるコンピューターシステムを開発することであった。これらの目標の達成
は、Rebar等やBeerli等[15、16]の開示により特性化された知識である本分野の
知識の大きな進展を表す。これら2つの開示は、新規のDNA結合特異性を有す
る特定のジンクフィンガーの、ファージ表示系を用いた選択に関する。他方、本
発明の開示は、あらゆる所定のDNA配列のためのDNA結合タンパク質の設計
に関する。
【0004】 [発明の概要] 本発明はC22ジンクフィンガーモチーフを介して結合するDNA結合タンパ
ク質(複数のDBPまたは個々のDBP)の設計および明細に向けられる。本明
細書中に記載した研究を基礎にして、このような結合を最適化する一般規則が確
定され、そして最適DNA結合特性を有するDBPのクラスを説明する式が構築
されている。さらに、あらゆる所定のDNA配列に対する高結合親和性を有する
DBPの設計をもたらす規則に基づいて、プログラムが開発されてきた。最後に
、最適結合を有さないけれども、十分且つ有用なDNA結合特性を有するDBP
の設計のための規則が確定されている。
【0005】 [発明の詳しい説明] C22ZFモチーフのDNAとの結合を支配する一般規則は、1851の考え得る
ZFドメインと、64の考え得る塩基対トリプレットのすべてを含有するDNA
モデルとのDBPモデルの相互作用の物理的分子モデリングとの間の相同につい
てのデータベース分析の組合せを用いることにより発展された。DBPモデルは
、牛乳の半ガロン水差しのサイズおよび形状に近似する。DNAモデルは、長さ
約4フィート、直径1フィートである。DNAモデルの軸は水平であり、回転し
て64の塩基対トリプレットの各々を観察し得る。DNAモデルに関して出たり
入ったりしてDBPモデルを動かすことにより、アミノ酸および核酸接触を観察
し得る。
【0006】 以下の説明において本発明の化学的先例を詳述するが、しかしDBP−DNA
相互作用を支配する一連の規則の完全性は、発明期間中のデータベース分析と物
理的モデリングとの連続した、派生的交錯によってのみ得られた。ZFモチーフ
の種々の場所でのアミノ酸の保存および可変性に関する観察は、先ず、ZFモチ
ーフの物理的モデルを構築することにより、そして次に、特定のDBPと指定D
NAbpトリプレットとの相互作用を物理的にモデリングすることにより実施され
た。物理的モデリングは、データベースのさらなる分析に通じるアミノ酸および
核酸相互作用のパターンを示した。データベース分析と物理的モデリングとの間
のこの交錯の反復は、接触パターンの性質の概念上の改善および展開を可能にし
た。これらのパターンが出現した時、ZFモチーフ中のアミノ酸の系統的変異が
、64の塩基対トリプレットの各々に関して約束された。DBPとDNA間の相
互作用の物理的モデリングは、代替アミノ酸がZFモチーフ中に容易に導入され
、その結果生じるタンパク質がDNAに対して物理的にモデリングするため、有
効であった。水素結合、ならびに水および疎水性物質接触が次にモデリングされ
、明白に確定され、そして非常に迅速に計数され得る。この物理的モデリングか
ら、DNAと特異的に相互作用するDBPの設計のための判定基準を組み入れた
一連の一般規則が展開された。
【0007】 ZF配列の分析および列の有用性を、図1に示す。TFIIIAタンパク質は
、物理的測定および修飾、ならびに理論的データ分析の両方に関して、ZFタン
パク質のためのモデルとして広範に用いられる。9ジンクフィンガードメインの
各々に関して、この図のTFIIIAアミノ酸配列は、亜鉛結合アミノ酸、2つ
のシステイン(CYS)および2つのヒスチジン(HIS)が4縦列で整列され
るように並べられた。この整列を成し遂げるためには、種々の場所の配列中にダ
ッシュを挿入して、付加的アミノ酸を有するドメインを提供しなければならない
。同型の整列がZFタンパク質MKR2およびKruppelタンパク質に関して成さ
れている。MKR2配列整列は、非常に密集している。そのZFドメインが同一
サイズのものであるため、いかなる挿入も必要ない。TFIIIAと比較して、
MKR2は、特定の二本鎖DNAの塩基とのタンパク質のアミノ酸の相互作用を
研究するためのなおさらに均一なモデルとして作用する。本発明に到達するため
に、MKR2は、DBP−DNA相互作用を支配する一般規則を演繹するための
配列基本として専ら用いられてきた。
【0008】 ZFタンパク質Zif268からの3つのZFおよびコンセンサスDNA結合
部位を含有する錯体の結晶学的分析は、ZF−B−DNA認識サブサイトの局在
化を同定するのに役立った。突然変異誘発および配列研究結果も結晶構造データ
に適合するため、同一の接触領域が他のZF−DNA錯体の相互作用に関与する
ことを期待するのは、合理的である[5、6、8-10]。したがって、ZFタンパク質
の以下のZF構成成分は、逆平行DNA読み取り工程において重要な役割を演じ
る、と考えられる:1)タンパク質のa−ヘリックス領域の直前のAA、2)a
−ヘリックス領域内の三番目残基、即ち定常ロイシンの直前のもの、および3)
この領域の6番目の残基、即ち不変ヒスチジンの直前のもの、である。
【0009】 これらの構成成分は、式1で示された一般化ZF配列(a−ヘリックスおよび
b−構造領域に下線を施してある)中のそれぞれZ3、Z2およびZ1として下記
に示される:
【0010】
【式1】Y/FXCX2-4CG/D K/RXFXZ3 XXZ2LXZ1HX3-5HT/SG/EX0-2EK/RP β/構造領域 α−ヘリックス (式中、Xはアミノ酸であり、X2-4は2〜4アミノ酸長のペプチドであり、X3 -5 は3〜5アミノ酸長のペプチドであり、X0-2は0〜2アミノ酸長のペプチド
であり、そしてC、D、E、F、G、H、K、L、P、R、S、TおよびYは標
準一文字コードによる特定のアミノ酸を示す)。「/」により分けられた文字の
対は、その位置が指定された2つの特定のアミノ酸のいずれかにより満たされ得
ることを示す。
【0011】 前記の式を記憶に留めて、以下のような3つ(第一、第二および第三)の接触
位置を有する逆平行トリヌクレオチド−ペプチド錯体の生成を心に描くことがで
きる。
【0012】 5’−N1−N2−N3−3’ COOH−Z1−Z2−Z3−NH2 Zif268−DNA錯体の結晶学的研究も、接触基が相互作用する方法の指
標を示した。PavletichとPabo[7]は、Zif268が主溝中のコードDNA鎖の
塩基との11の重要な水素結合(H結合)を形成する、と推論した。最初の接触
位置(前記の位置の指示を参照)の2つのアルギニン残基は、グアニンのN7お
よびO6原子と水素結合を作る。3つのアルギニン残基は、同一方法で、第三接
触位置のグアニンと水素結合する。さらに、この位置の各アルギニン残基は、a
−ヘリックスの第二残基として生じるアスパラギン酸のカルボキシレート基との
水素結合、塩橋相互作用を生成する。Zif268の第二ZFの中央接触位置の
ヒスチジン残基のNδ原子は、グアニンのN7またはO6原子に水素結合を与え
る。ZFポリペプチド−DNA錯体中のグアニンとの相互作用におけるアルギニ
ンおよびヒスチジン残基の役割は、特定部位の突然変異誘発の実験により確証さ
れる[5、6、9、14]。対応するオペレーター部位と錯化されるラムダおよびファ
ージ434リプレッサーのDNA結合ドメインの結晶学的研究は、グアニンはリシ
ン、アスパラギン、グルタミンおよびセリン残基によってもH結合され得る、と
いうことを明示した[17、18]。おそらく、残りの極性AA(トレオニンおよびチ
ロシン)は、グアニンと類似の結合を形成し得る。
【0013】 Zif268−DNA錯体のフィンガー1および3では、第二(中央)の重要
な位置が、DNAの対応する領域のシトシンと接触しないグルタミン酸により占
められる[7]。しかしながら、ZFタンパク質−DNA結合検定は、天然結合部
位において、この相互作用がグルタミン酸とアスパラギン酸に関しては生じない
ことを示している[5、6、9、14、19]。DesjarlaisとBerg[14]は、シトシンとア
スパラギン酸との間の相互作用に関するH結合式を提案した。その著者等は、シ
トシンとの相互作用におけるアスパラギン酸またはグルタミン酸に対する選択が
第三接触位置(Z3)におけるグルタミンまたはアルギニンの、そして第二位置
(Z2)におけるセリンまたはアスパラギン酸の存在による、と強調した。Narde
lli等[5]の突然変異誘発実験は、シトシンがグルタミン残基と相互作用し得る、
ということを明示する。これは、同様の極性基を有するアスパラギンに関しても
言える。シトシンは、セリンおよびトレオニン残基中のヒドロキシル酸素原子と
も当然H結合を作り得る。
【0014】 Zif268−DNA錯体中のチミンは、認識工程に関与するとは思えない。
しかしながら、ラムダリプレッサー、DNA結合ドメインDNAおよびエングレ
イルドホメオドメイン−DNA錯体の結晶構造研究、ならびにZFタンパク質−
DNA結合検定は、チミンが非極性残基(アラニン、ロイシン、イソロイシン、
バリン)との疎水性接触および極性AA(リシン、アルギニン、グルタミン)と
のH結合の両方を成し得ることを実証する[8、11、14、17、20]。
【0015】 ラムダおよびファージ434リプレッサー、対応するオペレーター部位を有する
DNA結合ドメイン錯体のX線結晶学的試験は、アデニン塩基がグルタミンとの
2つのH結合を形成する、即ち、1)グルタミン側鎖のアミドNH2基はアデニ
ンのN7原子にH結合を供与し、そして2)アミドO原子はN6原子からH結合
を受け入れることを明示した[17、18]。同様のH結合は、2つのホメオドメイ
ン錯体のアデニンおよびアスパラギン残基間に見出されている[20、21]。ZF
タンパク質−DNA結合検定も、ZF接触位置において、アデニンがグルタミン
およびアスパラギンとの強い相互作用を作ることを示す[8、11、12、14]。グル
タミン酸およびアスパラギン酸のカルボン酸基がグルタミンおよびアスパラギン
アミドO原子の場合と同様にH結合を受容し得るO原子を有することを考慮する
と、アデニンはグルタミンおよびアスパラギン酸と単一水素結合を形成し得ると
考えてもよい。実際、LetovskyとDynan[19]は、部位特異的突然変異誘発研究に
おいて、ZFの中央接触位置にグルタミン酸残基を含有する転写因子Sp1は、野
生型コンセンサス認識部位(−GCG−)より3倍だけまたはそれより弱くアデ
ニン置換変異体(−GAG−)と結合する、ということを示している。さらに、
DesjarlaisとBerg[14]およびBerg[8]は、アデニンは(Zif268−DNA錯
体中のグアニンと同様に)、ヒスチジン残基と1つのH結合を作り得ると考えて
いる。ヒスチジンだけでなくその他の極性アミノ酸(アルギニン、リシン、チロ
シン、セリンおよびトレオニン)もアデニンの原子N7とH結合を形成し得ると
おもわれる。
【0016】 1,851の登録を含有する潜在的なZFタンパク質ドメインのデータベースが集
められている。このデータベースをコンピューターで用いて、ZFドメイン間の
相同を観察し得る。
【0017】 数年前、Seeman等[22]は、単一H結合は、多数の縮重を生じるので、あらゆる
特定の塩基対を独自に同定するためには不適切であると結論した。アスパラギン
またはグルタミンがアデニンと結合し、そしてアルギニンがグアニンと結合する
場合、主溝で生じるように、認識の忠実性は2つのH結合を用いて達成され得る
、と彼等は提案した。
【0018】 前記の結果に基づいて、本明細書中に記載したモデルを用いて、以下のAAの
ZF接触位置での塩基認識を検査することは合理的であった: 1)グアニン−R、H、K、Y、Q、N、S、T 2)シトシン−E、D、Q、N、S、T 3)チミン−I、L、V、A、R、H、K、Y、Q、N、S、T 4)アデニン−Q、N、E、D、H、R、K、Y、S、T プラスチック空間充填原子−分子およびイオンモデル[23、24]が、ZF−DN
A錯体模造物を築造するために用いられてきた。これらの分子モデルは、高分子
物質のモデリングに非常に適したそれらのコネクター、それらの便宜な尺度(1c
m=1Å=0.1nm)およびそれらの改良された理論的パラメーターの並外れた堅固さ
のために、選択された。100°および105°の結合角を有する四面体炭素原子、二
面体酸素原子(120°)および四面体リン原子(102°および118°)の新モジュ
ールは、B−DNAモデルにおけるデオキシリボース縮みおよび糖−リン酸塩鎖
配座の正確なモデリングを保持した。DBPモデル中のペプチド結合は、炭素原
子(結合角116°、120.5°および123.5°)および窒素原子(122°および119°
)の特定のモジュールを互いに固定することにより模造された。亜鉛イオンは、
ZFヒスチジンおよびシステイン残基のNおよびS原子モジュールに四面体的に
固定される球(R=0.85cm)によりモデル中に表された。側方固定DBPモデル
を伴う長水平34塩基B型DNAモデルが、ドッキング実験のために用いられた
【0019】 対象研究の第一段階では、Zif268フィンガー1、2および3のモデルが
組み立てられ、ZF−B−DNA錯体の一般的空間配向が観察された。第二段階
では、ZF−DNA錯体の重要な位置における前記のAAの異なる組合せに対す
る64のヌクレオチドトリプレットのすべての立体適合性がモデル化された。
【0020】 Zif268ペプチド−DNA錯体のプラスチック分子モデルが、結晶学的デ
ータを基礎にして組み立てられた[7]。ZF−DNA主鎖接触物および主溝中の
AAおよび塩基間のH結合の模造後、Zif268の全体的整列はDNA鎖と逆
平行である、ということが確証された。最も安定なZF−DNA非特異的相互作
用は、ホスホジエステル酸素原子と、Zn2+イオンに固定された最初の不変ヒス
チジン残基との間のH結合であると思われる。二次b鎖上の保存アルギニンも、
一次DNA鎖上のホスホジエステル酸素原子と接触する。しかしながら、Zif
268のフィンガー2および3は、3−bpサブサイトに関する等価リン酸塩と
接触するが、一方、フィンガー1H結合は一ヌクレオチドによりシフトされる。
アルギニンおよびセリン残基により作られる別の4つのZF−DNA主鎖接触は
、ZFモジュール構造に関してより不規則である。
【0021】 Zif268−DNA結晶錯体中に見出される11の重要なH結合はすべて、
プラスチックモデルで観察されている。予測通り、第二フィンガーの最初の接触
位置のトレオニン残基はチミンから遠すぎて、H結合を作れない。しかしながら
、結晶構造分析の結果とは異なって、モデル研究は、フィンガー1および3の第
二接触位置におけるグルタミン酸残基とシトシンとの間の水素結合の可能性を明
らかに示した。
【0022】 Zif268−DNA結晶構造中に観察された認識位置の6つのグアニン−A
A接触のうち、5つがアルギニンにより作られ、1つだけがヒスチジンにより作
られた、ということは注目に値する。このヒスチジン−グアニン相互作用が中心
特定位置の1つだけであった、ということは、一層興味深い。アルギニンと比較
してヒスチジンのサイズがより小さいことを考慮すると、中央位置がグアニンと
より大きいアルギニン残基との間の接触を妨げる立体的束縛を有するが、しかし
2つのH結合を形成するその能力のために、後者の対合はエネルギー的に好都合
であるに違いないと考えられ得る。 異なる認識位置の空間的状態を調べるために、一次鎖中に、1)トリプレットG
GGおよび2)a)第一のZn結合ヒスチジンの側基、およびb)重要なAAト
リプレットR123およびR123に関する基を有するZFα−ヘリックスタ
ンパク質断片(α−ヘリックス直前のAAを含む)のモデルを含有するB−DN
Aモデルが築造された。α−ヘリックス断片のモデルは、ホスホジエステル酸素
原子をヒスチジン残基と接合するH結合の模造によりB−DNAモデルに固定さ
れた。次に、特定の塩基−AA接触がこれらの錯体で検査された。錯体GGG−
123のみが、Zif268−DNA結晶構造に見出される重要なH結合の
距離に対応する位置に接触基を含有する、ということが明らかにされた。錯体G
GG−R123は立体的に望ましくなく、外側接触位置ではグアニンおよびア
ルギニンが2つのH結合により接合され得るが、しかし中央位置では、このよう
な対は、限定空間のために含有され得ない、ということを分子モデリングは明示
する。 物理的モデルから得られる観察は、中心接触位置におけるいくつかのAA−塩基
接触に対する立体的束縛の想定を確証した。錯体G123−R123の場合、
グアニンN7およびO6原子から対応するAAのCa原子までの以下の概算距離
が確定されている:G1N7−R1=7Å、G1O6−R1=8Å、G2N7−H2
5.5Å、G2O6H2=6.5Å、G3N7−R3=8ÅおよびG3O6−R3=7
Å。
【0023】 モデルを用いて、B−DNAおよびα−ヘリックス塩基構造の研究は、第二Z
F−DNA認識位置における立体束縛に関する分子的基礎を明らかにした。主溝
中のDNAトリプレットの第一および第三塩基の類似原子基(例えば、グアニン
のN7原子)を、直線でつなぎ合わせると、この線から約1.5Å離れた中央(
第二)塩基の対応する基が生じる。同様に、このような線によりZFの第一およ
び第三接触位置のAAのCα原子を接合すると、これも約1.5Åの距離にある
中央位置にCα原子を生じる。したがって、中央接触位置の重要なAAを考慮し
た空間は、約1.5Å両側から圧縮される。
【0024】 ZF−DNA主鎖接触に関する前記のデータの分析、ならびにモデルから得ら
れた観察は、第一および第三ZF−DNA認識位置間の空間状態にはかなりの差
がある、という結論を導き出した。第一位置では、AAのCα原子はホスホジエ
ステル酸素原子から約6.5Åの距離であって、この場合、ZFタンパク質は、
不変ヒスチジン残基によりDNA主鎖に固定される。ヒスチジンによるこのZF
α−ヘリックス部分の安定固定のために、第一の接触位置での配座再配列の自由
が制限される。Cα原子は、対応する側鎖に関して、それが一次DNA鎖中に局
在される塩基の平面で2〜3Å「上下」に動かされるか、あるいは、この平面に
垂直に1〜2Å動かされうる。
【0025】 他方で、ZFα−ヘリックス領域のN末端のDNA主鎖への固定は、むしろ緩
く且つ可変性で、したがって、第三接触位置のCα原子および対応するAAに関
する比較的大きい再配列を可能にする。後者接触位置は、この位置のCα原子が
主固定場所からより遠く(ヒスチジン残基に結合されるホスホジエステル原子か
ら約10,5Å)、この位置における対応するAAはα−ヘリックスの一部ではない
、という事実によって望ましい。最も重要な知見は、前記の環境のために、第三
接触部位の重要なAAは明らかに、対応する塩基対平面において非常に異なる位
置を占め得る、というものである。これは、この残基が、ある錯体中で、相補的
DNA鎖の塩基と非常に密接し得ることを意味する。このような幾何学的形状の
外見に関する理由の1つは、B−DNAの典型的右手らせんねじれが、一次鎖上
の主塩基よりさらに接近可能な第三接触部位の核酸第二鎖上に相補的塩基を作る
ためである。分子モデルは明らかに、第三の、そして部分的には第二の接触位置
でも、このDNA鎖がZF−核酸認識工程に関与し得る、ということを示す。Z
if268−DNA結晶錯体では、DNA一次鎖のみに結合される各ZFドメイ
ンのα−ヘリックスは、塩基対の平面に関して約45°の角度で傾けられる[7]
。第二DNA鎖が、第三および第二接触位置を包含する重要なH結合を介して、
読み取り工程に関与する場合、α−ヘリックス軸の方向は、塩基対平面に対して
さらに垂直である必要がある。
【0026】 したがって、物理的分子モデルの使用によるZF−DNA錯体模造のこのより
詳細な研究は、3つの接触領域の各々における立体条件が異なることを示す。こ
れらの立体条件は、ZF−DNA認識規則に反映される。
【0027】 ZF−DNA認識工程の立体条件についての一般的観察を生じる前記で得られ
た情報に基づいて、重要な接触位置における種々のAA−塩基組合せの広範なモ
デル試験が試みられた。この検査結果を、ZF−DNA読取りコードおよび認識
に関する主規則として示す(表1、2および3)。規則は、結晶学的特定部位の
突然変異誘発、DNA結合および配列分析データと良好に一致する。 式Iの配列および図2(ジンクフィンガードメインおよびDNA鎖とのその相互
作用の模式的表現を提供する)の二次元構造略図を参照しながら、本研究は、以
下のような所定のジンクフィンガードメイン中の3つの重要な接触位置の同一性
を確証した: 1)トリプレット中の第一ヌクレオチドとα−ヘリックスのCOOH末端の定
常ヒスチジンの前の第一AAとの間; 2)トリプレット中の第二ヌクレオチドとα−ヘリックスのCOOH末端の定
常ヒスチジンの前の第四AAとの間; 3)トリプレット中の第三ヌクレオチドとα−ヘリックスのCOOH末端の定
常ヒスチジンの前の第七AAとの間。
【0028】 ZF−DNA認識錯体の3つの接触部位の立体条件は異なる。第一接触位置は
比較的大きく且つ厳密に固定され、これが、より長いAAの、十分な特異性およ
び親和性を有する一次DNA鎖上の塩基との結合を可能にする。第二位置は圧縮
され、若干低い特異性および親和性を有する、より小さいAAを収容し得る。第
三位置は、相補的DNA鎖との接触を含めたかなりの配座的再配列を可能にする
【0029】 表1では、一次鎖上の所定のDNAトリプレットの各ヌクレオチドに関して、
主(カラムA)および代替的(カラムB)塩基結合AAが示されている。特異性
および親和性はともに、カラムA中に残基を含入する際に考慮された。Seeman等
[22]によりすでに提案されたように、認識の忠実度は、それらが主溝のより大き
い位置を占め、そしてピリミジンより多くの水素結合部位を提供するために、プ
リン塩基(グアニンおよびアデニン)の場合に、より良好に保持される。したが
って、最強のAA相互作用は、各々が2つの水素結合によりグアニンまたはアデ
ニンに結合する、アルギニン、グルタミンおよびアスパラギンの相互作用である
と考えられる。アスパラギン酸、グルタミン酸、アスパラギンおよびグルタミン
の親和性は、しばしば、カルボキシレートまたはアミド酸素原子とDNA主鎖、
ホスホジエステル酸素原子との間の水橋の形成により増強された。ファンデルワ
ールス相互作用は比較的弱いが、しかしそれらは、疎水性AA(アラニン、バリ
ン、ロイシンおよびイソロイシン)によるチミンメチル基の認識にある役割を演
じ得る。
【0030】 表1に示したように、多数のZF−DNA錯体において、一次DNA鎖のヌク
レオチドトリプレットにおける塩基認識は、一次鎖を介して完全に起こり得るわ
けではなく、一次および相補的DNA鎖の両方との同時結合によるか、あるいは
専ら相補的鎖による。相補的DNA鎖からの「助け」を用いない場合、いくつか
のトリプレットの場合には、認識工程を実現するためには、重要なAAの一次D
NA鎖のヌクレオチドとの結合は非常に弱い。考え得るすべてのAA置換が、Z 1 −Z3位置における相互作用の強度に関して検査された。一次鎖上の2つより少
ない水素結合を有するドメインは、不安定であると考えられた。
【0031】 表2は、対応するDNAトリプレットとの相互作用に関する最高親和性を有す
るZFAAトリプレットを示す。これらのZFトリプレットは、表1のカラムA
に示された主要残基のみを含有する。表2は、特定の接触領域におけるZF−D
NA認識工程を保持する結合エネルギー構成成分(H結合、水橋、ファンデルワ
ールス相互作用)も示す。
【0032】 表2から分かるように、3つの接触領域において考え得る相互作用(H結合、
水橋およびファンデルワールス相互作用)の数と組合される、ZF結合の工程に
おける相補的DNA鎖の関与は、最適組合せが用いられた場合、64のすべての
DNAトリプレットを用いた錯体形成が達成され得ることを示すのを可能にする
。表2は、最大数のH結合、最強の3つの型の相互作用が、トリプレットの第一
ヌクレオチドがグアニンまたはアデニンである場合に得られる、ということを示
す。
【0033】 考え得るH結合の数が最大より少ないヌクレオチドトリプレットでは、欠乏は
しばしば、重要なAAおよび糖−リン酸塩主鎖間の有意量の水架橋により部分的
に補償される。
【0034】 トリプレットの第一ヌクレオチドがチミンであり、そしてH結合の数が最低で
ある場合でも、1)Z3位置のAAと第三接触位置におけるアデニンおよび相補
的チミンとの間の2つのH結合の形成、ならびに2)おそらくは、第二接触位置
におけるチミンとセリンまたはトレオニンとの間の単一H結合は、TTNトリプ
レットでも十分な親和性を有するZFタンパク質を結合し得ることを意味する。
【0035】 いずれの場合においても、最大効力のDBPを得るためには、フランキング接
触点(1および3)において最強相互作用を有することに注意が払われるべきで
ある。弱い組合せを用いなければならない場合には、それらは、中心接触点(2
)に位置する場合には、より低い作用を有する。しかしながら、接触点における
弱い結合でも、特異性を確立するためには重要である、ということに留意するこ
とは重要である。
【0036】 表3は、表2の主ZFAAトリプレット、ならびに所定のDNAトリプレット
のそれぞれの塩基との有効な結合を提供すると予測される代替的AA(表1のカ
ラムBに示した)を示す。表3は、特定の接触領域におけるZF−DNA認識工
程を保持する結合エネルギー構成成分(H結合、水橋、ファンデルワールス相互
作用)も示す。
【0037】
【表1】
【0038】
【表2】
【0039】 コドンZ1 Z1 水素結合 水接触 疎水性接触 カラムA カラムB 凡例 表中、/は、代替的アミノ酸を分け、 下付文字を有さないXは、一次鎖とのそのすべての相互作用を有し、 X1は、一次鎖との多少の相互作用および相補的鎖との多少の相互作用を有
し、 X2は、相補的鎖と相互作用を有し、 X3は、一次および相補的鎖の両方との相互作用を有し、 −は、アミノ酸と塩基との間の1つの水素結合であり、 =は、アミノ酸と塩基との間の2つの水素結合であり、 *は、アミノ酸と、主鎖のホスホジエステル酸素原子との間の水橋を介した
1つの水素結合であり、 #は、アミノ酸と塩基との間の1つ又はそれ以上のファンデルワールス接触
であって、 ()中のアミノ酸は、1つまたは2つのその他の考え得るタンパク質−DN
A認識相互作用が存在しない場合の一次鎖の塩基との相互作用を有する。
【0040】
【表3】
【0041】
【表4】
【0042】 凡例 表中、/は、代替的アミノ酸を分け、 下付文字を有さないXは、一次鎖とのそのすべての相互作用を有し、 X1は、一次鎖との多少の相互作用および相補的鎖との多少の相互作用を有
し、 X2は、相補的鎖と相互作用を有し、 X3は、一次および相補的鎖の両方との相互作用を有し、 −は、アミノ酸と塩基との間の1つの水素結合であり、 =は、アミノ酸と塩基との間の2つの水素結合であり、 *は、アミノ酸と、主鎖のホスホジエステル酸素原子との間の水橋を介した
1つの水素結合であり、 #は、アミノ酸と塩基との間の1つ又はそれ以上のファンデルワールス接触
であって、 ()中のアミノ酸は、1つまたは2つのその他の考え得るタンパク質−DN
A認識相互作用が存在しない場合の一次鎖の塩基との相互作用を有する。
【0043】
【表5】
【0044】
【表6】
【0045】 凡例 表中、/は、代替的アミノ酸を分け、 下付文字を有さないXは、一次鎖とのそのすべての相互作用を有し、 X1は、一次鎖との多少の相互作用および相補的鎖との多少の相互作用を有
し、 X2は、相補的鎖と相互作用を有し、 X3は、一次および相補的鎖の両方との相互作用を有し、 −は、アミノ酸と塩基との間の1つの水素結合であり、 =は、アミノ酸と塩基との間の2つの水素結合であり、 *は、アミノ酸と、主鎖のホスホジエステル酸素原子との間の水橋を介した
1つの水素結合であり、 #は、アミノ酸と塩基との間の1つ又はそれ以上のファンデルワールス接触
であって、 ()中のアミノ酸は、1つまたは2つのその他の考え得るタンパク質−DN
A認識相互作用が存在しない場合の一次鎖の塩基との相互作用を有する。
【0046】
【表7】
【0047】
【表8】
【0048】 表中、/は、代替的アミノ酸を分ける。
【0049】
【表9】
【0050】
【表10】
【0051】 64の異なるDNAトリプレット(表1、2および3)を有する種々のZFα
−ヘリックス錯体の分子モデリング分析の結果、ならびに3つの接触位置におけ
る空間的特殊性についての知見は、ZF−DNA認識規則に反映される。表1、
2および3に記載した規則に基づいて、あらゆる標的DNA配列に対して最適な
結合親和性を有するDBPが設計され得る。表1〜3中の「カラムA」の表示、
即ち「A規則」は、所定コドン(トリプレット)に対する最適結合を有するアミ
ノ酸を示す。表1〜3の「カラムB」の表示、即ち「B規則」は、所定のトリプ
レットに対する二次的な、しかし依然として有意の結合親和性を有するアミノ酸
を示す。
【0052】 カラムA規則は、6個のH結合、0個の水接触および0個の疎水性接触を有し
、評価エネルギー(5x6)+(2x0)+(1x0)=30の最強トリプレッ
ト認識から、2個の水素結合、0個の水接触および2個の疎水性接触を有し、評
価エネルギー(5x2)+(2x0)+(1x2)=12までの範囲である。カ
ラムA規則は普通は、位置Z1、Z2およびZ3におけるちょうど1または2個の
アミノ酸の選択を有する。カラムB規則は、比較すると、位置Z1、Z2およびZ 3 の各々における3個の考え得るアミノ酸から、位置Z1、Z2およびZ3の各々に
おいて異なる接触配列で、18個という多くのアミノ酸までを有する。カラムB
エネルギーの評価において、位置Z1、Z2およびZ3における3つのアミノ酸の
多数の異なる群分けが認められる。最小エネルギーは、3個の水素結合、0個の
水接触および0個の疎水性接触を有し、評価エネルギー(5x3)+(2x0)
+(1x0)=15である。これらの組合せに関する最大エネルギー評価は、平
均で、3個の水素結合および2個の水接触または2個の疎水性接触であり、評価
エネルギー(5x3)+(2x2)+(1x0)=19から(5x3)+(2x
0)+(1x2)=17まで下がる。したがって、カラムB規則は、エネルギー
範囲が30から下がって12までのカラムA規則より狭いエネルギー範囲(即ち
19から下がって15まで)を有する。カラムB規則に関する狭エネルギー範囲
は、64の異なる規則が64のカラムA規則と同様にはエネルギーを基礎にして
識別しないことを意味する。
【0053】 例えば、表2に記載したように、DNA塩基トリプレットグアニン−シトシン
−シトシン(GCC)と最適に結合するDBPは、トリプレットとの結合を生じ
させるタンパク質の部分が、配列Z3XXZ2LXZ1H(式中、Z1はDNAトリ
プレットの位置1と相互作用するアルギニンであり、Z2はDNAトリプレット
の位置2と相互作用するグルタミンまたはグルタミン酸であり、Z3はDNAト
リプレットの位置3と相互作用するアルギニンであり、Xは任意のアミノ酸であ
り、Lはロイシンであり、そしてHはヒスチジンである)を有するセグメントを
その中に含有するZFドメインであるものである。
【0054】 表1または3に記載したように(所定のコドンに関するZ1、Z2およびZ3
置のための「カラムB」登録を参照)、DNA塩基トリプレットグアニン−シト
シン−シトシン(GCC)と、最適にでない場合、有効に結合するDBPは、ト
リプレットとの結合を生じさせるタンパク質の部分が、配列Z3XXZ2LXZ1
H(式中、Z1はDNAトリプレットの位置1と相互作用するヒスチジン、リシ
ン、グルタミン、アスパラギン、チロシン、セリンおよびトレオニンから成る群
から選択されるアミノ酸であり、Z2はDNAトリプレットの位置2と相互作用
するグルタミン、アスパラギン、アスパラギン酸、セリン、トレオニン、アルギ
ニン、ヒスチジンおよびリシンから成る群から選択されるアミノ酸であり、Z3
はDNAトリプレットの位置3と相互作用するグルタミン、アスパラギン、グル
タミン酸、アスパラギン酸、ヒスチジン、リシン、チロシン、セリンおよびトレ
オニンから成る群から選択されるアミノ酸であり、Xは任意のアミノ酸であり、
Lはロイシンであり、そしてHはヒスチジンである)を有するセグメントをその
中に含有するZFドメインであるものである。
【0055】 もちろん、中間体親和性のDBP、即ち、Z1、Z2およびZ3接触アミノ酸が
「A」および「B」規則の組合せにより選択されるものが設計され得ることが理
解される。例えば、トリプレットGCCとの結合のためのZFドメイン内のセグ
メントZ3XXZ2LXZ1H中では、Z1はアルギニンであり、Z2はグルタミン
またはグルタミン酸であり、そしてZ3はグルタミン、アスパラギン、グルタミ
ン酸、アスパラギン酸、ヒスチジン、リシン、チロシン、セリンおよびトレオニ
ンから成る群から選択され得る。
【0056】 このようなタンパク質のための基本的築造ブロックは、次式で表される:
【0057】
【式2】 NH2−ZiFc−COOH (式中、ZiFcは次式: Y/FXCX2-4CG/DK/RXFXZ3XXZ2LXZ1HX3-5H(ここで、Z1、Z2およびZ3はDNAト
リプレットの3つの塩基に対応するために表1、2または3から選択されるアミ
ノ酸であり、式の残りの構成成分は式Iの説明中で前記されたのと同様である)
の形態のZFドメインである)。
【0058】 本発明の好ましい実施態様では、所定のDNAトリプレットとの結合のための
ジンクフィンガードメインは、表2における、あるいは表1または表3のカラム
Aにおける適切なAAの選択により設計される。本発明の別の実施態様では、Z
Fドメインは、表1または3のカラムBにおける所定のDNAトリプレットに関
して記載されたAAの中からの選択により設計される。
【0059】 このような一ドメインは、標的配列の各トリプレットに必要である;3塩基の
みの標的列に関しては、前記の式はタンパク質を定義する。
【0060】 DNAの標的列が6塩基である場合、DBP設計は以下のように延長される:
【0061】
【式3】 NH2−ZiF1−{リンカー}−ZiF2−COOH (式中、ZiF1およびZiF2は、6つの塩基の第一および第二トリプレットと
結合するよう、ZiFcに関して上に示されているのと同様に、設計されたZF
ドメインであり、そして{リンカー}は以下のパターン: T/SG/EX0-2EK/RP (式中、構成成分は式1に前記したのと同様である) に一致するアミノ酸配列である)。
【0062】 1)DNAの標的列が9、12またはそれより多くの3の倍数個の塩基を含有
し、2)3n+3塩基のためにDBPを設計する必要があり、そして、3)最初
の3n個の塩基が以下の配列:
【0063】
【式4】 NH2−ZiF1−{リンカー}−ZiF2−{リンカー}−…−{リンカー}−
ZiFn−COOH により示される場合には、DBP設計は回帰的に延長され、そして必要なDBP
は以下の配列:
【0064】
【式5】 NH2−ZiF1−{リンカー}−ZiF2−{リンカー}−…−{リンカー}−
ZiFn−{リンカー}− ZiFn+1−COOH (式中、ZiFn+1は、塩基対の標的配列のn番目+1トリプレットと結合する
ために、ZiFcに関して前記したのと同様に、設計されるZFドメインである
)により特定される。
【0065】 図3は、n=3であるZFタンパク質、即ち、リンカー配列により連結される
3つのZFドメイン(即ちn=3)を有し、9(3n)塩基の標的DNA列と結
合するよう設計されるものを図式的に示す。
【0066】 前記の規則は、あらゆる所定のDNAトリプレットとの結合のための最適アミ
ノ酸(単数または複数)の容易な確定を可能にし、したがってDNAトリプレッ
トとの結合のためのDBPの理想的構成成分であり得るZFドメイン中の3個の
アミノ酸の同定および位置決定を可能にする。
【0067】 規則の適用は、次に、ZFドメインの一組の数ndを含有するDBPの設計に
拡張され得るが、この場合、DPBは所定のDNA配列内の3ndヌクレオチド
の標的伸長物と結合する。ヌクレオチドの標的3nd伸長、ならびにDBP中の
dドメインの収集および序列は、DPBおよび標的DNA配列に関する結合エ
ネルギーが、スクリーニングされる全DNA分子内の3ndヌクレオチドのあら
ゆる伸長を有する組数ndのZFドメインを含有するDBPのあらゆる対合に関
して考え得る最高であるようなものである。
【0068】 したがって、第一に重要な本発明の実施態様は、あらゆる長さのDNA配列に
関するこのようなDBPの設計方法である。該方法は、前記の規則を、所望の特
性を有する独特のDBPを確定するためのndZFドメインを含有するDBPに
対するそれらの親和性により配列内の3ndヌクレオチドの考え得るすべてのセ
グメントをスクリーニングし、等級付けする手段と組合せて用いる。
【0069】 さらに特に、本発明は、所定の遺伝子内の標的DNA配列と選択的に結合する
リンカー配列により連結される多ZFドメインを有するDBPの設計方法であっ
て、前記ZFドメインの各々が次式: A1XCX2-4CA2A3XFXZ3XXZ2LXZ1HX3-5H を、そして前記リンカーの各々が次式: A4A5X0-2EA6P (式中、(i)Xはあらゆるアミノ酸であり、(ii)X2-4は2〜4アミノ酸
長のペプチドであり、(iii)X3-5は3〜5アミノ酸長のペプチドであり、
(iv)X0-2は0〜2アミノ酸長のペプチドであり、(iv)A1はフェニルア
ラニンおよびチロシンから成る群から選択され、(v)A2はグリシンおよびア
スパラギン酸から成る群から選択され、(vi)A3はリシンおよびアルギニン
から成る群から選択され、(vii)A4はトレオニンおよびセリンから成る群
から選択され、(viii)A5はグリシンおよびグルタミン酸から成る群から
選択され、(ix)A6はリシンおよびアルギニンから成る群から選択され、(
x)Cはシステインであり、(xi)Fはフェニルアラニンであり、(xii)
Lはロイシンであり、(xiii)Hはヒスチジンであり、(xiv)Eはグル
タミン酸であり、(xv)Pはプロリンであり、そして(xvi)Z1、Z2およ
びZ3は塩基接触アミノ酸である) を有する方法であって、以下の: (a)スクリーニングされるゲノムを決定する工程と、 (b)結合のためのゲノム中の標的DNA配列を選択する工程と、 (c)ジンクフィンガードメインの数をndに決定する工程と、 (d)nzが以下の関係: nz=3nd を用いて確定される第一のルーチンを用いて、標的DNA配列を、各々のブロッ
クがnzヌクレオチドを含有するヌクレオチドブロックに分ける工程と、 (e)本明細書の表1〜3に記載したA規則および/またはB規則により、
標的遺伝子配列の最初の5’ヌクレオチドから数えた場合に工程(d)からの最
初のヌクレオチドブロックと結合して、ブロック特異的DBPを生じるDBPの
各ZFドメインに Z1、Z2およびZ3の塩基接触アミノ酸を割り当てて、そして
各々次式: 結合エネルギート゛メイン=(5x水素結合数)+(2xH2O接触数)+(疎 水性接触数) を用いて確定される結合エネルギー、即ち結合エネルギーの生成物としてのこの
ような各ブロック特異的DBPの各ZFドメインの「結合エネルギーフ゛ロック」、 ポリペプチドの全ジンクフィンガードメインの「結合エネルギート゛メイン」を計算 する工程と、 (f)第二のルーチンを用いて工程(d)からのDBPをさらに分けて、3
つのZFドメインを有するさらに分割されたDBPを生成する工程と、 (g)第三のルーチンを用いてゲノムに対して工程(f)からのさらに分割
されたDBPをスクリーニングして、ゲノム中の各々のさらに分割されたDBP
に関するゲノム中の結合部位の数を確定して、そして以下の式: 結合エネルギー部位 n=(5x水素結合数)+(2xH2O接触数)+(疎
水性接触数) を用いて、このような部位の各々に関して結合エネルギーを割り当てる工程と、 (h)以下の式: Rb=結合エネルギーフ゛ロック/工程(g)からの全てのさらに分割されたD BPに関する全結合エネルギー部位 nの和 を用いて、工程(e)からの各ヌクレオチドブロック特異的DBPに関して第四
のルーチンを用いて結合エネルギーの比Rbを計算する工程と、 (i)nd≧4である場合の各々のさらに分割されたDBPに関して工程(
f)〜(h)を反復する工程と、 (j)nzヌクレオチドを含有する標的DNA配列中の各ヌクレオチドブロ
ックに関して工程(d)〜(i)を反復する工程と、 (k)工程(h)から得られたRb数値を順位化する工程と、 (l)許容可能なRb値を有するDBPを選択する工程と から成る算法を包含する方法に関する。
【0070】 本発明のこの観点の好ましい実施態様を以下に示す。
【0071】 1)DBPのRb数値が標的DNA配列と結合する工程(h)の全DBPに関
して最高数値である前記の設計方法。
【0072】 2)工程(h)で確定されるDBP Rb数値が少なくとも10,000である前記
の方法。
【0073】 3)ZFドメインの数ndが9である前記の方法。
【0074】 4)工程(e)の各ヌクレオチドブロックに関して Z1、Z2およびZ3に塩基
接触アミノ酸を割り当てるための規則が規則組Aから選択される前記の方法。
【0075】 本発明は、所定の遺伝子内の標的DNA配列と選択的に結合するリンカー配列
により連結される多ZFドメインを有するDBPを設計するためのコンピュータ
ーシステムであって、前記ZFドメインの各々が次式: A1XCX2-4CA2A3XFXZ3XXZ2LXZ1HX3-5H を、そして前記リンカーの各々が次式: A4A5X0-2EA6P (式中、(i)Xはあらゆるアミノ酸であり、(ii)X2-4は2〜4アミノ酸
長のペプチドであり、(iii)X3-5は3〜5アミノ酸長のペプチドであり、
(iv)X0-2は0〜2アミノ酸長のペプチドであり、(iv)A1はフェニルア
ラニンおよびチロシンから成る群から選択され、(v)A2はグリシンおよびア
スパラギン酸から成る群から選択され、(vi)A3はリシンおよびアルギニン
から成る群から選択され、(vii)A4はトレオニンおよびセリンから成る群
から選択され、(viii)A5はグリシンおよびグルタミン酸から成る群から
選択され、(ix)A6はリシンおよびアルギニンから成る群から選択され、(
x)Cはシステインであり、(xi)Fはフェニルアラニンであり、(xii)
Lはロイシンであり、(xiii)Hはヒスチジンであり、(xiv)Eはグル
タミン酸であり、(xv)Pはプロリンであり、そして(xvi)Z1、Z2およ
びZ3は塩基接触アミノ酸である) を有する方法であって、以下の: (a)スクリーニングされるゲノムを決定する工程と、 (b)結合のためのゲノム中の標的DNA配列を選択する工程と、 (c)ZFフィンガードメインの数をndに決定する工程と、 (d)nzが以下の関係: nz=3nd を用いて確定される第一のルーチンを用いて、標的DNA配列を、各々のブロッ
クがnzヌクレオチドを含有するヌクレオチドブロックに分ける工程と、 (e)本明細書の表1〜3に記載したA規則および/またはB規則により、
標的遺伝子配列の最初の5’ヌクレオチドから数えた場合に工程(d)からの最
初のヌクレオチドブロックと結合して、ブロック特異的DBPを生じるDBPの
各ZFドメインに Z1、Z2およびZ3の塩基接触アミノ酸を割り当てて、そして
各々次式: 結合エネルギート゛メイン=(5x水素結合数)+(2xH2O接触数)+(疎 水性接触数) を用いて確定される結合エネルギー、即ち結合エネルギーの生成物としてのこの
ような各ブロック特異的DBPの各ZFドメインの「結合エネルギーフ゛ロック」、 DBPの全ドメインの「結合エネルギート゛メイン」を計算する工程と、 (f)第二のルーチンを用いて工程(d)からのDBPをさらに分けて、3
つのZFドメインを有するさらに分割されたDBPを生成する工程と、 (g)第三のルーチンを用いてゲノムに対して工程(f)からのさらに分割
されたDBPをスクリーニングして、ゲノム中の各々のさらに分割されたDBP
に関するゲノム中の結合部位の数を確定して、そして以下の式: 結合エネルギー部位 n=(5x水素結合数)+(2xH2O接触数)+(疎
水性接触数) を用いて、このような部位の各々に関して結合エネルギーを割り当てる工程と、 (h)以下の式: Rb=結合エネルギーフ゛ロック/工程(g)からの全てのさらに分割されたD BPに関する全結合エネルギー部位 nの和 を用いて、工程(e)からの各ヌクレオチドブロック特異的DBPに関して第四
のルーチンを用いて結合エネルギーの比Rbを計算する工程と、 (i)nd≧4である場合の各々のさらに分割されたDBPに関して工程(
f)〜(h)を反復する工程と、 (j)nzヌクレオチドを含有する標的DNA配列中の各ヌクレオチドブロ
ックに関して工程(d)〜(i)を反復する工程と、 (k)工程(h)から得られたRb数値を順位化する工程と、 (l)許容可能なRb値を有するDBPを選択する工程と から成る算法を含む設計手段を包含するコンピューターシステムにも関する。
【0076】 本発明において、設計方法とコンピューターシステムとの両方について前述の
(h)で定められたRbは、10,000の下限を有する。好ましくはRbは10 6 より大きい。
【0077】 本発明のこの観点の好ましい実施態様を以下に示す: 1)DBPのRb数値が標的DNA配列と結合する工程(h)の全DBPに関
して最高数値である前記のコンピューターシステム。
【0078】 2)工程(h)で確定されるDBP Rb数値が少なくとも10,000である前記
のコンピューターシステム。
【0079】 3)ZFドメインの数ndが9である前記のコンピューターシステム。
【0080】 4)工程(e)の各ヌクレオチドブロックに関して Z1、Z2およびZ3の塩基
接触アミノ酸を割り当てるための規則が規則組Aから選択される前記のコンピュ
ーターシステム。
【0081】 本発明の方法およびコンピューターシステムはさらに、図4〜9のブロック流
れ図により説明される。
【0082】 図4は、DBP設計工程が実行されるコンピューターシステムの構成成分を示
す。任意の製造者の中央処理装置デジタルコンピューター(1)が、本発明者等
により書かれたコンピュータープログラム(2)とともに提示される。コンピュ
ータープログラム(2)は、DNA−トリプルエネルギー規則(6)、ゲノム記
述子(9)、ゲノムDNA配列(10)および遺伝子特徴(5)として記載され
た一連のファイルを読み取る。中央処理機(1)は、この情報をDBPブロッキ
ング断片ファイル(7)およびゲノムのための最適DBP設計(8)に変換する
【0083】 図5は、図4中のコンピュータープログラム(2)が2つの部分を有すること
を示す。ゲノムデータは先ず、ゲノム処理によりブロッキング断片ファイルファ
ンクション(2)に変換される。これらのファイルは次に、ゲノムファンクショ
ンのためのDBP設計(3)により用いられる。
【0084】 図5のブロッキング断片へのゲノム処理ファイルブロック(2)を、図6に詳
細に示す。11から下って3までのすべてのndに関して、ゲノム説明体ファイ
ル(12)およびゲノムDNA配列ファイル(32)が読み取られ、非分類化断
片ファイル(7)に変換される。この同一非分類化断片ファイル(14)は、コ
ンピューター製造者により提供される分類ファンクション(13)により分類化
断片ファイル(15)に変換される。同一分類化断片ファイル(30)は読み取
られ、そして最終的にDBPサイズブロッキングファイル(22)に変換される
【0085】 図5のゲノムのためのDBP設計ブロック(3)を、図7でより詳細に示す。
11から下って3までのndに対応するゲノム説明体ファイル(3)、遺伝子特
徴ファイル(7)、ゲノムDNA配列ファイル(9)およびDBPサイズブロッ
クファイル(37)は読み取られ、ゲノムDNAを先ず遺伝子に、次にゲノムの
ための最適DBP設計のファイル(38)に変換されるために用いられる。変換
および設計工程は、ゲノム中のすべての遺伝子に関して成される。
【0086】 図7の「カレント−サブ−ウインドウがカレント−ブロッキング−ファイル中
にあるか否かを確定する」ブロック(22)を、図8でより詳細に詳述する。
【0087】 図7の「ブロック断片の結合エネルギーを計算する」ブロック(24)を、図
9でより詳細に詳述する。 種々のndの種々のDBPに算法を適用することにより、ndが9である値が算法
の最良の出発点であり、即ち、その工程は9フィンガーDBPに関する探索を用
いて開始されるべきであることが、実験的に決定された。これは、種々のDBP
を評価するのに用いられる選択判定基準Rbに関してより良好に理解され得る。
短いDBP、例えばnd=4または5のものでは、すべての結合エネルギート゛メイン の生成物として幾何学的に増大する結合エネルギーフ゛ロックは有意に低く、そして 結合エネルギー部位 nは比較的大きい。しかしながら、ndが増大すると、Rb
分子は劇的に増大するが、一方、「バックグラウンド」または「ノイズ」を表す
分母は有意に変化しないことが観測された。したがって、nd=9の場合は、不
適当なコンピューターニーズの可能性を生じることなく、結合の高親和性および
特異性の保証を提供する。
【0088】 しかし、本発明は、nd≦9のDBPの設計に限定されない、ということが強
調されるべきである。そのことに関しては、nd=9は最良の出発点であること
が見出されているが、しかし所定の状況に関する最良のDBPは、標的DNA配
列の長さにもかかわらず、nd<9であるものにし得るとも考えられる。本発明
の概念は、必要な場合には、あらゆる長さのDBPの設計に適用され得る。
【0089】 いかなる場合にも、Nヌクレオチドの所定のDNA配列に関しては、N−27
、9−フィンガーDBP配列が存在する。これらの各々は、前に開示した設計法
の(e)部に記載した3−ヌクレオチドセグメントの各々に関してエネルギー関
数を評価することにより、結合の強度に関して等級付けされ得る。
【0090】 初期コンピューター実験では、選択可能配列は8、7、6、5および4−フィ
ンガーサブサイトを有し得なかった。しかしながら、本発明のシステムに関して
は、サブサイト結合エネルギーの和だけは最小にする必要がある。その結果、サ
ブサイト結合エネルギーが3−フィンガーサブサイトから来るか、4−フィンガ
ーサブサイトからか、または(一般原則として)さらに大きいサブサイトからさ
え来るかは問題ではない。論理的排除からエネルギー的排除へのこの単純変化は
、酵母菌ゲノムの検査によってはそれほど多くはないが、しかし虫ゲノムの検査
によってより多く発せられた。
【0091】 当該算法の中心部分は、許容可能なnd−フィンガー部位(例えば、9−フィ
ンガーDBPに関しては27−塩基セグメント)を見出す場合、類似部位が存在
するかを知るための全ゲノム中のすべての他のnd−フィンガー部位に対する探
索である。これが実際に成される場合には、最高Rb値を有するDBPが選択さ
れる。さらに、算法は、所定の9−フィンガー部位に対して全ゲノム中に等価の
8−フィンガー、7−フィンガー、6−フィンガー、5−フィンガーおよび4−
フィンガーサブサイトが存在するかを知るために点検する。許容可能でない9−
フィンガー部位が見出された場合には、算法は、適切な8−フィンガー部位に関
して探索する。必要な場合には、探索は、7−フィンガー部位等に関して、許容
可能DBP結合部位が見つかるまで、続けられる。
【0092】 9−フィンガーDBPに関する探索内で、算法は、「フレーム」と呼ばれる2
7塩基配列のすべてを調べる。各フレームは、DNAとのその相互作用、および
3−フィンガーサブサイトまで下がって他のすべてのサブフレームの相互作用を
確定するために評価される。ゲノム中の各フレームおよびサブフレームの実例数
が、ソフトウェアの遂行のゲノム処理段階中に記録されている。フレームまたは
サブフレームの配列は、各ZFの結合エネルギーの生成物として評価される。各
ZFドメインは、3つのDNA塩基を認識する。ZFが認識する根元的DNA配
列は、ZFとDNAとの間にどれだけ多くの水素結合、水接触および疎水性接触
が存在するかを確定する。
【0093】 所定のnz−塩基部位がゲノム中の他の場所に生じるか否かを算法が検出する
方法は、部位に関してB木を調べることによる。全ゲノムは、nd−フィンガー
部位の各々に関して処理される。本算法は、無数の断片を分類し、併合するため
の手段を含有し、最後に、すべての異なるフィンガーサイズに関してブロック断
片のすべての等級化一覧が生成される。
【0094】 実施例1 DBPに関する典型的探索およびその設計方法の例を、以下に示す。それは、
100ヌクレオチド(即ち、N=100)の標的DNA配列を結合するための9
−フィンガーDBP(即ち、nd=9)に関するスクリーニングを包含する。配
列は、全100ヌクレオチド配列において、すべての27−ヌクレオチド配列に
関して、位置1から開始して、即ち、1−27、2−28、3−29等で、スク
リーニングされる。これが成されたら、9−フィンガーを3−フィンガーセクシ
ョンに、即ち1−3、2−4、3−5等に分解する。算法は、結合の相対強度に
関して精査し、それを探す。その考えは、DBP結合対サブサイト結合の比、R b を最大にし、したがって最大数のサブサイトと相互作用する9量体のものを排
除する。
【0095】 本発明の算法を、以下の実施例で説明するように、エス・セレビシエ(S. cerv
isiae)およびシー・エレガンス(C. elegans)のゲノムに適用した。
【0096】 実施例2 本算法を、酵母菌ゲノムのスクリーニングに適用した。それぞれ110および
447遺伝子を含有する酵母菌の2本の染色体をプロセッシングした。各遺伝子
に関して、算法は、サブサイト結合エネルギーの最低合計を有するnd−フィン
ガー配列を選択した。酵母菌では、3−フィンガーブロック断片の数は、ほとん
ど最大(即ち、最大412に対して49)である。虫ゲノム(実施例3参照)では
、3−フィンガーブロック配列は、無条件に最大である。酵母菌では、4−フィ
ンガーブロック配列は数が大きいが、しかし5−フィンガーブロック配列の集団
は比較的小さい。虫では、4−フィンガーブロック配列は5−フィンガーブロッ
ク配列より数が大きいが、しかし後者は酵母菌と比較して、数がより大きい。将
来、虫からヒトに進行する場合、4−フィンガーブロック配列は飽和に近く(即
ち、412に近く)なり得る、と予測され得る。
【0097】 算法分析は、酵母菌の16本の染色体のうちの2本に関して実施した。最初の
2本の染色体中の557遺伝子は、酵母菌ゲノムにおける全染色体の特性の現実
に即した像を示すと思われる。標本計算を全酵母菌ゲノムに関して実行したが、
しかしこれらの結果は、遺伝子のちょうど2本の染色体分の特性を計算すること
により生成されたものと異ならない。酵母菌ゲノムの分析全体の知見の典型であ
る、100酵母菌遺伝子の分析の結果を、表4に示す。
【0098】 本算法の力はさらに、図10〜14に示した結果で実証される。図は、試験が
集中された2本の酵母菌染色体の557遺伝子のすべてに関して得られた結果を
示す。
【0099】 許容可能な9−フィンガーDBPの各々の強度が計算され得る。図10は、許
容可能な9−フィンガーDBPのすべての結合強度が均一に分布されることを示
す。この曲線が下方に曲がる場合には、より強いフレームがより好ましい。この
曲線が上方に曲がる場合には、より弱いフレームが好ましい。
【0100】 図11は、許容可能な9フィンガーDBPの結合エネルギー(結合エネルギー フ゛ロック )が1011〜1013結合単位間で均一に分布されることを示す。
【0101】 図12は、擬似サブサイト結合エネルギー(結合エネルギー部位)の合計の分
布が、106〜108結合単位の範囲でそれ自体均一であることをを示す。
【0102】 図13は、図12の非対数バージョンである。それは、許容可能な9−フィン
ガーDBPのほとんどが5x106未満の擬似サブサイト結合エネルギーを有す
ることを示す。
【0103】 図14は、図11の値対図12の値の比を出すことにより作成された、9フィ
ンガーDBPに関するRbのグラフである。このチャートは、許容可能な9フィ
ンガーDBPのDBP結合強度対擬似サブサイト相互作用の結合エネルギーの合
計の比が104から106まで変わることを示す。
【0104】 本発明の分析道具は、単一酵母菌遺伝子YAR073の、特にコード領域のすぐ上流
のプロモーターの300bp領域のさらなる分析にも用いた。遺伝子のこの部分
の各27塩基フレームに関するサブサイト結合エネルギー(SBE)の全合計を
確定した。結果を、図15にグラフで示す。一次結合エネルギー(BE)も確定
し、相関が、SBE値とBE:SBEの比(Rb)の値との間に見出された。さ
らに(図16)、Rb値のプロットのピークが同一遺伝子の転写因子の足跡(別
個の試験で確定)に対応する、ということも分かった。
【0105】 実施例3 C. elegansの100遺伝子への本発明の算法の適用は、本システムがS. cerev
isiaeに対すると同様にC. elegansに対してもうまく適用し得ることを示した。
100C. elegans遺伝子の分析結果を、表5に示す。
【0106】 図17では、分析したC. elegans遺伝子の1つに関して、5−フィンガーDB
Pだけが設計され得ることが分かる。別の遺伝子に関しては、7−フィンガーD
BPだけが設計され得た。これら2つの遺伝子、2および32は、9−量体が設
計され得るものに対してそれらの遺伝子(100のうち98を除外した)に関し
てだけの分析結果を示すため、表5には示していない。あらゆる場合に、図17
に示した結果は、全C. elegansゲノムの分析に関する予測と一致し、即ち、5−
から9−フィンガーDBPの分布はS. cerevisiaeとは多少異なる。
【0107】 図18は、S. cerevisiaeに関して図14で示したのと同一の、C. elegansに
関する分析を示す。図18は、図14で観察されたのと同様のRb値分布を示す
【0108】 実施例2および3は、2つの広範に亘って全く異なる生物のゲノムに関するD
BPの設計に対する本発明の適用可能性を実証する。酵母菌ゲノムへの、そして
特に虫ゲノムへの本算法の適用の種々の結果は、算法道具の力を示し、そして実
はその基礎を、即ち、それは単に無作為および/または理論的分析を提供するだ
けではないことを、実証する。これらの分析に基づいて、本発明の算法は、ヒト
のゲノムを含めたあらゆる当該生物のゲノムのあらゆる所望のセグメントに関す
るDBPの設計にまで及び得る、と予測される。
【0109】 本発明の算法は生物体の全ゲノムに対する探索を包含するが、しかし、本発明
の試験結果は、所定の生物のゲノムについての完全知識の欠如が、その生物に関
するDBPの設計に対する本発明の適用への障害とはならないことを、強く示し
ている。S. cerevisiae(単細胞生物)およびC. elegans(多細胞生物)に関し
て本明細書中に示した試験で得られたブロック配列の知識を用いて、高等真核生
物の系に許容される配列の妥当な見積もりを成し得る、と予測できる。
【0110】 例えば、酵母菌および虫に関する本発明の試験は、ゲノム「ノイズ」、この状
況においては擬似結合部位エネルギーが、比較的一定であり、これは、より高等
な、より複雑な生物に同様に投影され得る、ということを示す。言い換えれば、
推定または拡張し得るDNA配列の実証済の組合せから、より複雑なゲノムの分
析に対する本発明の算法により、しかしながら、有効なDBPの設計の目的をと
もなって、その中の特定の配列を知ることができる。さらに、大型生物、例えば
ディー・メラノガステル(D. melanogaster)の全ゲノムが分かれば、それらはさ
らに、ヒトを含めた高等生物のゲノムの分析のための鍵を提供する。
【0111】 前記のようにDBPは、標準タンパク質合成技術を用いて築造し得るし、また
は標準遺伝子コードを用いて、その発現がDBPである遺伝子を特殊化し、構築
するための基礎として用い得る。
【0112】 そのようにして設計されるタンパク質は、DNA標的配列との正確且つ緊密な
結合を必要とするあらゆる適用に用い得る。例えば、DBPは、本発明によれば
、DNAエンドヌクレアーゼ活性と結合され得る。その結果生じた分子を標的D
NAと結合すると、前記のDNAを、DBP結合部位から固定置換で切断し得る
【0113】 同様に、標的DNA配列がプロモーターである場合には、結合すると所定の遺
伝子、あるいはそのプロモーターの制御下の遺伝子の発現を変える(即ち、増強
し、減衰し、または終結さえする)よう作用するプロモーター特異的DBPを生
成し得る。
【0114】 別の適用としては、DBPは、固体支持体に結合される場合は、特定のDNA
配列を結合するよう設計し得る。このような固体支持体としては、スチレンビー
ズ、アクリルアミドウエルプレートまたはガラス基質が挙げられる。
【0115】 前記の特定の適用を、ならびに本発明により考え得る全範囲の適用を実現する
ために、DBPは、任意の長さの前および/または後ドメインアミノ酸配列の付
加的特徴を含むよう前記した設計を行うことができる。この例としては、例えば
塩基性DBPとエンドヌクレアーゼとの、またはレポーターとの、またはDPB
が固体支持体に結合され得る配列との結合が挙げられる。 したがって、本発明は、以下の形態の長さの3n(ここで、n≧1)塩基対の予
定標的二本鎖DNA配列と結合するDBPを含む: NH2−X0-m−ZiF1−[{リンカー}−ZiFi]…−[{リンカー}−Zi
n]−X0-p−COOH (式中、ZiF1〜ZiFnのそれぞれは、前記の形態のZFドメインであり、{
リンカー}は前記のようなアミノ酸配列であり、X0-mは0〜mのアミノ酸の配
列を表し、 X0-pは0〜pのアミノ酸の配列を表す)。mおよびpに関する値、
およびアミノ酸の同定は、所定の適用のためにDBPと結合される特定のタンパ
ク質(単数または複数)またはアミノ酸配列(単数または複数)により確定され
る。
【0116】 本発明のさらに別の実施態様では、特定のZFモチーフ内の2つのシステイン
および2つのヒスチジンアミノ酸と錯体を形成するZn+2原子は、Co+2または
Cd+2原子により置換され得るので、したがって、「コバルトフィンガー」また
は「カドミウムフィンガー」を作る。
【0117】 表2に示した規則(「規則組A」)は、ZF−DNA認識における最適組合せ
のための「第一選択」規則とみなされる。しかしながら、表1または表3のカラ
ムB(「規則組B」)に示したように、有用なZF−DNA錯体を生成し得るD
NA結合タンパク質の設計に重要であると予測される多数の代替的AA組合せが
存在することは、強調されるべきである。
【0118】
【表11】
【0119】
【表12】
【0120】 論争のための完全S. cerevisiaeゲノムの精査−各遺伝子のコード領域に対し
て設計されるDBP 染色体 遺伝子 遺伝子中の最適DNA配列 DBP中の特定アミノ酸 DBP結合エネルギー 結合エネルギー対擬似結合エネルギーの比
【0121】
【表13】
【0122】
【表14】
【0123】 論争のための完全C. elegans ゲノムの精査−各遺伝子のコード領域に対して
設計されるDBP 染色体 遺伝子 遺伝子中の最適DNA配列 DBP中の特定アミノ酸 DBP結合エネルギー 結合エネルギー対擬似結合エネルギーの比
【0124】 参考文献 1. Miller, J., McLachlan, A.D. and Klug, A. (1985) EMBO J. 4, 1609-1614.
2. Berg, J.M. (1988) Proc. Natl. Acad. Sci. USA 85, 99-102. 3. Gibson, T.J., Postma, J.P.M., Brown, R.S. and Argos, P. (1988) Protei
n Eng. 2, 209-218. 4. Lee, M.S., Gippert, G.P., Soman, K.V., Case, D.A. and Wright, P.E. (1
989) Science 245, 635-637. 5. Nardelli, J., Gibson, T.J., Vesque, C. and Charnay, P. (1991) Nature
349, 175-178. 6. Thiesen, H.J. and Bach, C. (1991) FEBS Lett. 283, 23-26. 7. Pavletich, N.P. and Pabo, C.O. (1991) Science 252, 809-817. 8. Berg, J.M. (1992) Proc. Natl. Acad. Sci. USA 89, 11109-11110. 9. Kriwacki, R.W., Schultz, T.A. and Caradonna, J.P. (1992) Proc. Ntl. A
cad. Sci. USA 89, 9759-9763. 10. Jacobs, G.H. (1992) EMBO J. 11, 4507-4517. 11. Gogos, J.A., Hsu, T., Bolton, J. and kafatos, F.C. (1992) Science 25
7, 1951-1955. 12. Fairall, L., Harrison, S.D., Travers, A.A. and Rhodes, D. (1992) J.
Mol. Biol. 226, 349-366. 13. Klevit, R.E. (1991) Science 253, 1367 and 1393. 14. Desjarlais, J.R. and Berg, J.M. (1992) Proc. Natl. Acad. Sci. USA 89
, 7345-7349. 15. Rebar, E.J., and Pabo, C.O., U.S. Patent No. 5,789,538, August 4, 19
98. 16. Beerli, R.R., Segal, D.J., Dreier, B., and Barbas, C.F. (1998) Proc.
Natl. Acad. Sci. U.S.A. 95, 14628-14633. 17. Jordan, S.R. and Pabo, C.O. (1988) Science 242, 893-899. 18. Aggarwal, A.K., Rodgers, D.W., Drottar, M., Ptashne, M. and Harrison
S.C. (1988) Science 242, 899-907. 19. Letovsky, J., Dyran, W.S. (1989) Nucleic Acids Res. 17,2639-2653. 20. Kissinger, C.R., Liu, B., Martin-Blanco, E., Kornberg, T.B. and Pabo
, C.O. (1990) Cell 63,579-590. 21. Woberger, C., Vershon, A.K., Liu, B., Johnson, A.D. and Pabo, C.O. (
1991) Cell 67,517-528. 22. Seeman, N.C., Rosenberg, J.M. and Rich, A. (1976) Proc. Natl. Acad.
Sci USA 73, 804-808. 23. Mikelaar, R.-H., Bruskov, V.I. and Poltev, V.I. (1985) New precision
space-filling atomic-molecular models, Pushchino. 24. Mikelsaar, R. (1986) Trends in Biotechnology 4, 162-163.
【図面の簡単な説明】
【図1】 種々の既知のDBP中のZFドメインの列を示す図である。
【図2】 標的DNAトリプレットと単一ZFドメインとの間の相互作用を示す模式図で
ある。
【図3】 9塩基の標的DNA列と3ドメインDBPとの間の相互作用を示す模式図であ
る。
【図4】 即時DBP設計工程が実行されるコンピューターシステムのブロック流れ図で
ある。
【図5】 図4のコンピュータープログラムブロック(2)がさらに分解されるブロック
流れ図である。
【図6A】 図5のブロッキング断片へのゲノム処理ファイルブロック(2)がさらに分解
されるブロック流れ図である。
【図6B】 図5のブロッキング断片へのゲノム処理ファイルブロック(2)がさらに分解
されるブロック流れ図である。
【図6C】 図5のブロッキング断片へのゲノム処理ファイルブロック(2)がさらに分解
されるブロック流れ図である。
【図6D】 図5のブロッキング断片へのゲノム処理ファイルブロック(2)がさらに分解
されるブロック流れ図である。
【図7A】 図5のゲノムブロック(3)に関する設計DBPがさらに分解されるブロック
流れ図である。
【図7B】 図5のゲノムブロック(3)に関する設計DBPがさらに分解されるブロック
流れ図である。
【図7C】 図5のゲノムブロック(3)に関する設計DBPがさらに分解されるブロック
流れ図である。
【図7D】 図5のゲノムブロック(3)に関する設計DBPがさらに分解されるブロック
流れ図である。
【図7E】 図5のゲノムブロック(3)に関する設計DBPがさらに分解されるブロック
流れ図である。
【図8】 図7のブロック(22)がさらに分解されるブロック流れ図である。
【図9A】 図7のブロック(24)がさらに分解されるブロック流れ図である。
【図9B】 図7のブロック(24)がさらに分解されるブロック流れ図である。
【図10】 分析した酵母菌遺伝子中の許容可能な9フィンガーDBPの結合強度の分布を
示すグラフである。
【図11】 分析した酵母菌遺伝子に関して見出された許容可能な9フィンガーDBPの結
合エネルギーの値を示すグラフである。
【図12】 分析した酵母菌遺伝子中のDBPサブサイト(擬似)結合エネルギーの分布を
示すグラフである。
【図13】 図12に示した分布を非対数様式で示すグラフである。
【図14】 許容可能な9フィンガーDBPに関して、分析した酵母菌遺伝子中の結合エネ
ルギー対サブサイト(擬似)結合エネルギーの比を示すグラフである。
【図15】 酵母菌遺伝子YAR073の300bpプロモーター領域の27塩基対(bp)フレームの
各々に関する擬似結合エネルギーの値を示すグラフである。
【図16】 酵母菌遺伝子YAR073の300bpプロモーター領域の27塩基対(bp)フレームの
各々に関する結合エネルギー対サブサイト(擬似)結合エネルギーの比を示すグ
ラフである。
【図17】 分析したC. elegans遺伝子中の許容可能なDBPのサイズの分布を示すグラフ
である。
【図18】 許容可能なDBPに関する分析したC. elegans遺伝子中の結合エネルギー対サ
ブサイト(擬似)結合エネルギーの比を示すグラフである。
【手続補正書】特許協力条約第34条補正の翻訳文提出書
【提出日】平成11年6月30日(1999.6.30)
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【発明の名称】 ジンクフィンガークラスのDNA結合タンパク質の設計方法
【特許請求の範囲】
【発明の詳細な説明】
【0001】 [発明の背景] 潜在的な核酸結合タンパク質をコードする真核生物遺伝子の超科は、Cys −His(C)クラスのジンクフィンガー(ZF)ドメインを含有する
。これらの特徴的構造特色を有するタンパク質は、遺伝子発現の調節に重要な役
割を演じる[1−4]。配列比較、突然変異分析および近年の結晶学的研究は、
各フィンガードメインが、原則として、DNAトリプレット内のいくつかのまた
はすべての3塩基対との接触によりB型DNAの主溝と相互作用することを明示
している。これらの塩基特異性相互作用は、タンパク質ドメインのa−ヘリック
ス領域[5−10]の特定位置のアミノ酸(AA)側鎖により媒介される。
【0002】 1,300より大きいZFモチーフのAA配列が同定されているが、しかし、
正確なDNA結合部位は2〜3のタンパク質に関してのみ知られている。DNA
接触領域に関する利用可能な情報は、主に富グアニン−シトシン鎖[5−9]と
、より少ない富アデニン−チミン部位[11、12]に関する。実験データに基
づいて、ZF配列を好ましいDNA結合部位と関連させる規則に関する最初の提
案が成されている[13、14]。しかしながら、ZFタンパタ質−DNA認識
に関する一般規則は提案されていない。これは、コンピューターモデリング[2
、3、5]も結晶学的分析[7]もZF−DNA接触領域における全体的構造変
異性に関する十分な情報を提供していない、という事実のためであると思われる
【0003】 異なるZF−DNA相互作用に関する特定の接触位置における立体条件を特性
化するための物理的原子−分子モデルを用いる場合、本発明に至る研究の目的は
、ZFドメインのCクラスに関するZF−DNA認識のための一般規則を
確定することであった。この目的が達成されれば、本発明の計画の仕事は、有効
なジンクフィンガーDNA結合ポリペプチドを設計するための算法、ならびに算
法を用いるコンピューターシステムを開発することであった。これらの目標の達
成は、Rebar等やBeerli等[15、16]の開示により特性化された
知識である本分野の知識の大きな進展を表す。これら2つの開示は、新規のDN
A結合特異性を有する特定のジンクフィンガーの、ファージ表示系を用いた選択
に関する。他方、本発明の開示は、あらゆる所定のDNA配列のためのDNA結
合タンパク質の設計に関する。
【0004】 [発明の概要] 本発明はCジンクフィンガーモチーフを介して結合するDNA結合タン
パク質(複数のDBPまたは個々のDBP)の設計および明細に向けられる。本
明細書中に記載した研究を基礎にして、このような結合を最適化する一般規則が
確定され、そして最適DNA結合特性を有するDBPのクラスを説明する式が構
築されている。さらに、あらゆる所定のDNA配列に対する高結合親和性を有す
るDBPの設計をもたらす規則に基づいて、プログラムが開発されてきた。最後
に、最適結合を有さないけれども、十分且つ有用なDNA結合特性を有するDB
Pの設計のための規則が確定されている。
【0005】 [発明の詳しい説明] CZFモチーフのDNAとの結合を支配する一般規則は、1851の考
え得るZFドメインと、64の考え得る塩基対トリプレットのすべてを含有する
DNAモデルとのDBPモデルの相互作用の物理的分子モデリングとの間の相同
についてのデータベース分析の組合せを用いることにより発展された。DBPモ
デルは、牛乳の半ガロン水差しのサイズおよび形状に近似する。DNAモデルは
、長さ約4フィート、直径1フィートである。DNAモデルの軸は水平であり、
回転して64の塩基対トリプレットの各々を観察し得る。DNAモデルに関して
出たり入ったりしてDBPモデルを動かすことにより、アミノ酸および核酸接触
を観察し得る。
【0006】 以下の説明において本発明の化学的先例を詳述するが、しかしDBP−DNA
相互作用を支配する一連の規則の完全性は、発明期間中のデータベース分析と物
理的モデリングとの連続した、派生的交錯によってのみ得られた。ZFモチーフ
の種々の場所でのアミノ酸の保存および可変性に関する観察は、先ず、ZFモチ
ーフの物理的モデルを構築することにより、そして次に、特定のDBPと指定D
NAbpトリプレットとの相互作用を物理的にモデリングすることにより実施さ
れた。物理的モデリングは、データベースのさらなる分析に通じるアミノ酸およ
び核酸相互作用のパターンを示した。データベース分析と物理的モデリングとの
間のこの交錯の反復は、接触パターンの性質の概念上の改善および展開を可能に
した。これらのパターンが出現した時、ZFモチーフ中のアミノ酸の系統的変異
が、64の塩基対トリプレットの各々に関して約束された。DBPとDNA間の
相互作用の物理的モデリングは、代替アミノ酸がZFモチーフ中に容易に導入さ
れ、その結果生じるタンパク質がDNAに対して物理的にモデリングするため、
有効であった。水素結合、ならびに水および疎水性物質接触が次にモデリングさ
れ、明白に確定され、そして非常に迅速に計数され得る。この物理的モデリング
から、DNAと特異的に相互作用するDBPの設計のための判定基準を組み入れ
た一連の一般規則が展開された。
【0007】 ZF配列の分析および列の有用性を、図1に示す。TFIIIAタンパク質は
、物理的測定および修飾、ならびに理論的データ分析の両方に関して、ZFタン
パク質のためのモデルとして広範に用いられる。9ジンクフィンガードメインの
各々に関して、この図のTFIIIAアミノ酸配列は、亜鉛結合アミノ酸、2つ
のシステイン(CYS)および2つのヒスチジン(HIS)が4縦列で整列され
るように並べられた。この整列を成し遂げるためには、種々の場所の配列中にダ
ッシュを挿入して、付加的アミノ酸を有するドメインを提供しなければならない
。同型の整列がZFタンパク質MKR2およびKruppelタンパク質に関し
て成されている。MKR2配列整列は、非常に密集している。そのZFドメイン
が同一サイズのものであるため、いかなる挿入も必要ない。TFIIIAと比較
して、MKR2は、特定の二本鎖DNAの塩基とのタンパク質のアミノ酸の相互
作用を研究するためのなおさらに均一なモデルとして作用する。本発明に到達す
るために、MKR2は、DBP−DNA相互作用を支配する一般規則を演繹する
ための配列基本として専ら用いられてきた。
【0008】 ZFタンパク質Zif268からの3つのZFおよびコンセンサスDNA結合
部位を含有する錯体の結晶学的分析は、ZF−B−DNA認識サブサイトの局在
化を同定するのに役立った。突然変異誘発および配列研究結果も結晶構造データ
に適合するため、同一の接触領域が他のZF−DNA錯体の相互作用に関与する
ことを期待するのは、合理的である[5、6、8−10]。したがって、ZFタ
ンパク質の以下のZF構成成分は、逆平行DNA読み取り工程において重要な役
割を演じる、と考えられる:1)タンパク質のa−ヘリックス領域の直前のAA
、2)a−ヘリックス領域内の三番目残基、即ち定常ロイシンの直前のもの、お
よび3)この領域の6番目の残基、即ち不変ヒスチジンの直前のもの、である。
【0009】 これらの構成成分は、式1で示された一般化ZF配列(a−ヘリックスおよび
b−構造領域に下線を施してある)中のそれぞれZ、ZおよびZとして下
記に示される:
【0010】 (配列番号1)式1Y/FXCX2−4CG/D K/RXFXZ XXZLXZ3−5HT
/SG/EX0−2EK/RP β/構造領域 α−ヘリックス (式中、Xはアミノ酸であり、X2−4は2〜4アミノ酸長のペプチドであり、
3−5は3〜5アミノ酸長のペプチドであり、X0−2は0〜2アミノ酸長の
ペプチドであり、そしてC、D、E、F、G、H、K、L、P、R、S、Tおよ
びYは標準一文字コードによる特定のアミノ酸を示す)。「/」により分けられ
た文字の対は、その位置が指定された2つの特定のアミノ酸のいずれかにより満
たされ得ることを示す。
【0011】 前記の式を記憶に留めて、以下のような3つ(第一、第二および第三)の接触
位置を有する逆平行トリヌクレオチド−ペプチド錯体の生成を心に描くことがで
きる。
【0012】 5’−N−N−N−3’ COOH−Z−Z−Z−NH Zif268−DNA錯体の結晶学的研究も、接触基が相互作用する方法の指
標を示した。PavletichとPabo[7]は、Zif268が主溝中の
コードDNA鎖の塩基との11の重要な水素結合(H結合)を形成する、と推論
した。最初の接触位置(前記の位置の指示を参照)の2つのアルギニン残基は、
グアニンのN7およびO6原子と水素結合を作る。3つのアルギニン残基は、同
一方法で、第三接触位置のグアニンと水素結合する。さらに、この位置の各アル
ギニン残基は、a−ヘリックスの第二残基として生じるアスパラギン酸のカルボ
キシレート基との水素結合、塩橋相互作用を生成する。Zif268の第二ZF
の中央接触位置のヒスチジン残基のNδ原子は、グアニンのN7またはO6原子
に水素結合を与える。ZFポリペプチド−DNA錯体中のグアニンとの相互作用
におけるアルギニンおよびヒスチジン残基の役割は、特定部位の突然変異誘発の
実験により確証される[5、6、9、14]。対応するオペレーター部位と錯化
されるラムダおよびファージ434リプレッサーのDNA結合ドメインの結晶学
的研究は、グアニンはリシン、アスパラギン、グルタミンおよびセリン残基によ
ってもH結合され得る、ということを明示した[17、18]。おそらく、残り
の極性AA(トレオニンおよびチロシン)は、グアニンと類似の結合を形成し得
る。
【0013】 Zif268−DNA錯体のフィンガー1および3では、第二(中央)の重要
な位置が、DNAの対応する領域のシトシンと接触しないグルタミン酸により占
められる[7]。しかしながら、ZFタンパク質−DNA結合検定は、天然結合
部位において、この相互作用がグルタミン酸とアスパラギン酸に関しては生じな
いことを示している[5、6、9、14、19]。DesjarlaisとBe
rg[14]は、シトシンとアスパラギン酸との間の相互作用に関するH結合式
を提案した。その著者等は、シトシンとの相互作用におけるアスパラギン酸また
はグルタミン酸に対する選択が第三接触位置(Z)におけるグルタミンまたは
アルギニンの、そして第二位置(Z)におけるセリンまたはアスパラギン酸の
存在による、と強調した。Nardelli等[5]の突然変異誘発実験は、シ
トシンがグルタミン残基と相互作用し得る、ということを明示する。これは、同
様の極性基を有するアスパラギンに関しても言える。シトシンは、セリンおよび
トレオニン残基中のヒドロキシル酸素原子とも当然H結合を作り得る。
【0014】 Zif268−DNA錯体中のチミンは、認識工程に関与するとは思えない。
しかしながら、ラムダリプレッサー、DNA結合ドメインDNAおよびエングレ
イルドホメオドメイン−DNA錯体の結晶構造研究、ならびにZFタンパク質−
DNA結合検定は、チミンが非極性残基(アラニン、ロイシン、イソロイシン、
バリン)との疎水性接触および極性AA(リシン、アルギニン、グルタミン)と
のH結合の両方を成し得ることを実証する[8、11、14、17、20]。
【0015】 ラムダおよびファージ434リプレッサー、対応するオペレーター部位を有す
るDNA結合ドメイン錯体のX線結晶学的試験は、アデニン塩基がグルタミンと
の2つのH結合を形成する、即ち、1)グルタミン側鎖のアミドNH基はアデ
ニンのN7原子にH結合を供与し、そして2)アミドO原子はN6原子からH結
合を受け入れることを明示した[17、18]。同様のH結合は、2つのホメオ
ドメイン錯体のアデニンおよびアスパラギン残基間に見出されている[20、2
1]。ZFタンパク質−DNA結合検定も、ZF接触位置において、アデニンが
グルタミンおよびアスパラギンとの強い相互作用を作ることを示す[8、11、
12、14]。グルタミン酸およびアスパラギン酸のカルボン酸基がグルタミン
およびアスパラギンアミドO原子の場合と同様にH結合を受容し得るO原子を有
することを考慮すると、アデニンはグルタミンおよびアスパラギン酸と単一水素
結合を形成し得ると考えてもよい。実際、LetovskyとDynan[19
]は、部位特異的突然変異誘発研究において、ZFの中央接触位置にグルタミン
酸残基を含有する転写因子Sp1は、野生型コンセンサス認識部位(−GCG−
)より3倍だけまたはそれより弱くアデニン置換変異体(−GAG−)と結合す
る、ということを示している。さらに、DesjarlaisとBerg[14
]およびBerg[8]は、アデニンは(Zif268−DNA錯体中のグアニ
ンと同様に)、ヒスチジン残基と1つのH結合を作り得ると考えている。ヒスチ
ジンだけでなくその他の極性アミノ酸(アルギニン、リシン、チロシン、セリン
およびトレオニン)もアデニンの原子N7とH結合を形成し得るとおもわれる。
【0016】 1,851の登録を含有する潜在的なZFタンパク質ドメインのデータベース
が集められている。このデータベースをコンピューターで用いて、ZFドメイン
間の相同を観察し得る。
【0017】 数年前、Seeman等[22]は、単一H結合は、多数の縮重を生じるので
、あらゆる特定の塩基対を独自に同定するためには不適切であると結論した。ア
スパラギンまたはグルタミンがアデニンと結合し、そしてアルギニンがグアニン
と結合する場合、主溝で生じるように、認識の忠実性は2つのH結合を用いて達
成され得る、と彼等は提案した。
【0018】 前記の結果に基づいて、本明細書中に記載したモデルを用いて、以下のAAの
ZF接触位置での塩基認識を検査することは合理的であった: 1)グアニン−R、H、K、Y、Q、N、S、T 2)シトシン−E、D、Q、N、S、T 3)チミン−I、L、V、A、R、H、K、Y、Q、N、S、T 4)アデニン−Q、N、E、D、H、R、K、Y、S、T プラスチック空間充填原子−分子およびイオンモデル[23、24]が、ZF
−DNA錯体模造物を築造するために用いられてきた。これらの分子モデルは、
高分子物質のモデリングに非常に適したそれらのコネクター、それらの便宜な尺
度(1cm=1Å=0.1nm)およびそれらの改良された理論的パラメーター
の並外れた堅固さのために、選択された。100°および105°の結合角を有
する四面体炭素原子、二面体酸素原子(120°)および四面体リン原子(10
2°および118°)の新モジュールは、B−DNAモデルにおけるデオキシリ
ボース縮みおよび糖−リン酸塩鎖配座の正確なモデリングを保持した。DBPモ
デル中のペプチド結合は、炭素原子(結合角116°、120.5°および12
3.5°)および窒素原子(122°および119°)の特定のモジュールを互
いに固定することにより模造された。亜鉛イオンは、ZFヒスチジンおよびシス
テイン残基のNおよびS原子モジュールに四面体的に固定される球(R=0.8
5cm)によりモデル中に表された。側方固定DBPモデルを伴う長水平34塩
基B型DNAモデルが、ドッキング実験のために用いられた。
【0019】 対象研究の第一段階では、Zif268フィンガー1、2および3のモデルが
組み立てられ、ZF−B−DNA錯体の一般的空間配向が観察された。第二段階
では、ZF−DNA錯体の重要な位置における前記のAAの異なる組合せに対す
る64のヌクレオチドトリプレットのすべての立体適合性がモデル化された。
【0020】 Zif268ペプチド−DNA錯体のプラスチック分子モデルが、結晶学的デ
ータを基礎にして組み立てられた[7]。ZF−DNA主鎖接触物および主溝中
のAAおよび塩基間のH結合の模造後、Zif268の全体的整列はDNA鎖と
逆平行である、ということが確証された。最も安定なZF−DNA非特異的相互
作用は、ホスホジエステル酸素原子と、Zn2+イオンに固定された最初の不変
ヒスチジン残基との間のH結合であると思われる。二次b鎖上の保存アルギニン
も、一次DNA鎖上のホスホジエステル酸素原子と接触する。しかしながら、Z
if268のフィンガー2および3は、3−bpサブサイトに関する等価リン酸
塩と接触するが、一方、フィンガー1H結合は一ヌクレオチドによりシフトされ
る。アルギニンおよびセリン残基により作られる別の4つのZF−DNA主鎖接
触は、ZFモジュール構造に関してより不規則である。
【0021】 Zif268−DNA結晶錯体中に見出される11の重要なH結合はすべて、
プラスチックモデルで観察されている。予測通り、第二フィンガーの最初の接触
位置のトレオニン残基はチミンから遠すぎて、H結合を作れない。しかしながら
、結晶構造分析の結果とは異なって、モデル研究は、フィンガー1および3の第
二接触位置におけるグルタミン酸残基とシトシンとの間の水素結合の可能性を明
らかに示した。
【0022】 Zif268−DNA結晶構造中に観察された認識位置の6つのグアニン−A
A接触のうち、5つがアルギニンにより作られ、1つだけがヒスチジンにより作
られた、ということは注目に値する。このヒスチジン−グアニン相互作用が中心
特定位置の1つだけであった、ということは、一層興味深い。アルギニンと比較
してヒスチジンのサイズがより小さいことを考慮すると、中央位置がグアニンと
より大きいアルギニン残基との間の接触を妨げる立体的束縛を有するが、しかし
2つのH結合を形成するその能力のために、後者の対合はエネルギー的に好都合
であるに違いないと考えられ得る。 異なる認識位置の空間的状態を調べるために、一次鎖中に、1)トリプレットG
GGおよび2)a)第一のZn結合ヒスチジンの側基、およびb)重要なAAト
リプレットRおよびRに関する基を有するZFα−ヘリッ
クスタンパク質断片(α−ヘリックス直前のAAを含む)のモデルを含有するB
−DNAモデルが築造された。α−ヘリックス断片のモデルは、ホスホジエステ
ル酸素原子をヒスチジン残基と接合するH結合の模造によりB−DNAモデルに
固定された。次に、特定の塩基−AA接触がこれらの錯体で検査された。錯体G
GG−Rのみが、Zif268−DNA結晶構造に見出される重要な
H結合の距離に対応する位置に接触基を含有する、ということが明らかにされた
。錯体GGG−Rは立体的に望ましくなく、外側接触位置ではグアニ
ンおよびアルギニンが2つのH結合により接合され得るが、しかし中央位置では
、このような対は、限定空間のために含有され得ない、ということを分子モデリ
ングは明示する。 物理的モデルから得られる観察は、中心接触位置におけるいくつかのAA−塩基
接触に対する立体的束縛の想定を確証した。錯体G−R
場合、グアニンN7およびO6原子から対応するAAのC原子までの以下の概
算距離が確定されている:GN7−R=7Å、GO6−R=8Å、G N7−H=5.5Å、GO6H=6.5Å、GN7−R=8Åおよび
O6−R=7Å。
【0023】 モデルを用いて、B−DNAおよびα−ヘリックス塩基構造の研究は、第二Z
F−DNA認識位置における立体束縛に関する分子的基礎を明らかにした。主溝
中のDNAトリプレットの第一および第三塩基の類似原子基(例えば、グアニン
のN7原子)を、直線でつなぎ合わせると、この線から約1.5Å離れた中央(
第二)塩基の対応する基が生じる。同様に、このような線によりZFの第一およ
び第三接触位置のAAのCα原子を接合すると、これも約1.5Åの距離にある
中央位置にCα原子を生じる。したがって、中央接触位置の重要なAAを考慮し
た空間は、約1.5Å両側から圧縮される。
【0024】 ZF−DNA主鎖接触に関する前記のデータの分析、ならびにモデルから得ら
れた観察は、第一および第三ZF−DNA認識位置間の空間状態にはかなりの差
がある、という結論を導き出した。第一位置では、AAのCα原子はホスホジエ
ステル酸素原子から約6.5Åの距離であって、この場合、ZFタンパク質は、
不変ヒスチジン残基によりDNA主鎖に固定される。ヒスチジンによるこのZF
α−ヘリックス部分の安定固定のために、第一の接触位置での配座再配列の自由
が制限される。Cα原子は、対応する側鎖に関して、それが一次DNA鎖中に局
在される塩基の平面で2〜3Å「上下」に動かされるか、あるいは、この平面に
垂直に1〜2Å動かされうる。
【0025】 他方で、ZFα−ヘリックス領域のN末端のDNA主鎖への固定は、むしろ緩
く且つ可変性で、したがって、第三接触位置のCα原子および対応するAAに関
する比較的大きい再配列を可能にする。後者接触位置は、この位置のCα原子が
主固定場所からより遠く(ヒスチジン残基に結合されるホスホジエステル原子か
ら約10,5Å)、この位置における対応するAAはα−ヘリックスの一部では
ない、という事実によって望ましい。最も重要な知見は、前記の環境のために、
第三接触部位の重要なAAは明らかに、対応する塩基対平面において非常に異な
る位置を占め得る、というものである。これは、この残基が、ある錯体中で、相
補的DNA鎖の塩基と非常に密接し得ることを意味する。このような幾何学的形
状の外見に関する理由の1つは、B−DNAの典型的右手らせんねじれが、一次
鎖上の主塩基よりさらに接近可能な第三接触部位の核酸第二鎖上に相補的塩基を
作るためである。分子モデルは明らかに、第三の、そして部分的には第二の接触
位置でも、このDNA鎖がZF−核酸認識工程に関与し得る、ということを示す
。Zif268−DNA結晶錯体では、DNA一次鎖のみに結合される各ZFド
メインのα−ヘリックスは、塩基対の平面に関して約45°の角度で傾けられる
[7]。第二DNA鎖が、第三および第二接触位置を包含する重要なH結合を介
して、読み取り工程に関与する場合、α−ヘリックス軸の方向は、塩基対平面に
対してさらに垂直である必要がある。
【0026】 したがって、物理的分子モデルの使用によるZF−DNA錯体模造のこのより
詳細な研究は、3つの接触領域の各々における立体条件が異なることを示す。こ
れらの立体条件は、ZF−DNA認識規則に反映される。
【0027】 ZF−DNA認識工程の立体条件についての一般的観察を生じる前記で得られ
た情報に基づいて、重要な接触位置における種々のAA−塩基組合せの広範なモ
デル試験が試みられた。この検査結果を、ZF−DNA読取りコードおよび認識
に関する主規則として示す(表1、2および3)。規則は、結晶学的特定部位の
突然変異誘発、DNA結合および配列分析データと良好に一致する。 式Iの配列および図2(ジンクフィンガードメインおよびDNA鎖とのその相互
作用の模式的表現を提供する)の二次元構造略図を参照しながら、本研究は、以
下のような所定のジンクフィンガードメイン中の3つの重要な接触位置の同一性
を確証した: 1)トリプレット中の第一ヌクレオチドとα−ヘリックスのCOOH末端の定
常ヒスチジンの前の第一AAとの間; 2)トリプレット中の第二ヌクレオチドとα−ヘリックスのCOOH末端の定
常ヒスチジンの前の第四AAとの間; 3)トリプレット中の第三ヌクレオチドとα−ヘリックスのCOOH末端の定
常ヒスチジンの前の第七AAとの間。
【0028】 ZF−DNA認識錯体の3つの接触部位の立体条件は異なる。第一接触位置は
比較的大きく且つ厳密に固定され、これが、より長いAAの、十分な特異性およ
び親和性を有する一次DNA鎖上の塩基との結合を可能にする。第二位置は圧縮
され、若干低い特異性および親和性を有する、より小さいAAを収容し得る。第
三位置は、相補的DNA鎖との接触を含めたかなりの配座的再配列を可能にする
【0029】 表1では、一次鎖上の所定のDNAトリプレットの各ヌクレオチドに関して、
主(カラムA)および代替的(カラムB)塩基結合AAが示されている。特異性
および親和性はともに、カラムA中に残基を含入する際に考慮された。Seem
an等[22]によりすでに提案されたように、認識の忠実度は、それらが主溝
のより大きい位置を占め、そしてピリミジンより多くの水素結合部位を提供する
ために、プリン塩基(グアニンおよびアデニン)の場合に、より良好に保持され
る。したがって、最強のAA相互作用は、各々が2つの水素結合によりグアニン
またはアデニンに結合する、アルギニン、グルタミンおよびアスパラギンの相互
作用であると考えられる。アスパラギン酸、グルタミン酸、アスパラギンおよび
グルタミンの親和性は、しばしば、カルボキシレートまたはアミド酸素原子とD
NA主鎖、ホスホジエステル酸素原子との間の水橋の形成により増強された。フ
ァンデルワールス相互作用は比較的弱いが、しかしそれらは、疎水性AA(アラ
ニン、バリン、ロイシンおよびイソロイシン)によるチミンメチル基の認識にあ
る役割を演じ得る。
【0030】 表1に示したように、多数のZF−DNA錯体において、一次DNA鎖のヌク
レオチドトリプレットにおける塩基認識は、一次鎖を介して完全に起こり得るわ
けではなく、一次および相補的DNA鎖の両方との同時結合によるか、あるいは
専ら相補的鎖による。相補的DNA鎖からの「助け」を用いない場合、いくつか
のトリプレットの場合には、認識工程を実現するためには、重要なAAの一次D
NA鎖のヌクレオチドとの結合は非常に弱い。考え得るすべてのAA置換が、Z
−Z位置における相互作用の強度に関して検査された。一次鎖上の2つより
少ない水素結合を有するドメインは、不安定であると考えられた。
【0031】 表2は、対応するDNAトリプレットとの相互作用に関する最高親和性を有す
るZFAAトリプレットを示す。これらのZFトリプレットは、表1のカラムA
に示された主要残基のみを含有する。表2は、特定の接触領域におけるZF−D
NA認識工程を保持する結合エネルギー構成成分(H結合、水橋、ファンデルワ
ールス相互作用)も示す。
【0032】 表2から分かるように、3つの接触領域において考え得る相互作用(H結合、
水橋およびファンデルワールス相互作用)の数と組合される、ZF結合の工程に
おける相補的DNA鎖の関与は、最適組合せが用いられた場合、64のすべての
DNAトリプレットを用いた錯体形成が達成され得ることを示すのを可能にする
。表2は、最大数のH結合、最強の3つの型の相互作用が、トリプレットの第一
ヌクレオチドがグアニンまたはアデニンである場合に得られる、ということを示
す。
【0033】 考え得るH結合の数が最大より少ないヌクレオチドトリプレットでは、欠乏は
しばしば、重要なAAおよび糖−リン酸塩主鎖間の有意量の水架橋により部分的
に補償される。
【0034】 トリプレットの第一ヌクレオチドがチミンであり、そしてH結合の数が最低で
ある場合でも、1)Z位置のAAと第三接触位置におけるアデニンおよび相補
的チミンとの間の2つのH結合の形成、ならびに2)おそらくは、第二接触位置
におけるチミンとセリンまたはトレオニンとの間の単一H結合は、TTNトリプ
レットでも十分な親和性を有するZFタンパク質を結合し得ることを意味する。
【0035】 いずれの場合においても、最大効力のDBPを得るためには、フランキング接
触点(1および3)において最強相互作用を有することに注意が払われるべきで
ある。弱い組合せを用いなければならない場合には、それらは、中心接触点(2
)に位置する場合には、より低い作用を有する。しかしながら、接触点における
弱い結合でも、特異性を確立するためには重要である、ということに留意するこ
とは重要である。
【0036】 表3は、表2の主ZFAAトリプレット、ならびに所定のDNAトリプレット
のそれぞれの塩基との有効な結合を提供すると予測される代替的AA(表1のカ
ラムBに示した)を示す。表3は、特定の接触領域におけるZF−DNA認識工
程を保持する結合エネルギー構成成分(H結合、水橋、ファンデルワールス相互
作用)も示す。
【0037】
【表1】
【0038】
【表2】
【0039】 コドンZ1 Z1 水素結合 水接触 疎水性接触 カラムA カラムB 凡例 表中、/は、代替的アミノ酸を分け、 下付文字を有さないXは、一次鎖とのそのすべての相互作用を有し、 Xは、一次鎖との多少の相互作用および相補的鎖との多少の相互作用を有
し、 Xは、相補的鎖と相互作用を有し、 Xは、一次および相補的鎖の両方との相互作用を有し、 −は、アミノ酸と塩基との間の1つの水素結合であり、 =は、アミノ酸と塩基との間の2つの水素結合であり、 は、アミノ酸と、主鎖のホスホジエステル酸素原子との間の水橋を介した
1つの水素結合であり、 #は、アミノ酸と塩基との間の1つ又はそれ以上のファンデルワールス接触
であって、 ()中のアミノ酸は、1つまたは2つのその他の考え得るタンパク質−DN
A認識相互作用が存在しない場合の一次鎖の塩基との相互作用を有する。
【0040】
【表3】
【0041】
【表4】
【0042】 凡例 表中、/は、代替的アミノ酸を分け、 下付文字を有さないXは、一次鎖とのそのすべての相互作用を有し、 Xは、一次鎖との多少の相互作用および相補的鎖との多少の相互作用を有
し、 Xは、相補的鎖と相互作用を有し、 Xは、一次および相補的鎖の両方との相互作用を有し、 −は、アミノ酸と塩基との間の1つの水素結合であり、 =は、アミノ酸と塩基との間の2つの水素結合であり、 は、アミノ酸と、主鎖のホスホジエステル酸素原子との間の水橋を介した
1つの水素結合であり、 #は、アミノ酸と塩基との間の1つ又はそれ以上のファンデルワールス接触
であって、 ()中のアミノ酸は、1つまたは2つのその他の考え得るタンパク質−DN
A認識相互作用が存在しない場合の一次鎖の塩基との相互作用を有する。
【0043】
【表5】
【0044】
【表6】
【0045】 凡例 表中、/は、代替的アミノ酸を分け、 下付文字を有さないXは、一次鎖とのそのすべての相互作用を有し、 Xは、一次鎖との多少の相互作用および相補的鎖との多少の相互作用を有
し、 Xは、相補的鎖と相互作用を有し、 Xは、一次および相補的鎖の両方との相互作用を有し、 −は、アミノ酸と塩基との間の1つの水素結合であり、 =は、アミノ酸と塩基との間の2つの水素結合であり、 は、アミノ酸と、主鎖のホスホジエステル酸素原子との間の水橋を介した
1つの水素結合であり、 #は、アミノ酸と塩基との間の1つ又はそれ以上のファンデルワールス接触
であって、 ()中のアミノ酸は、1つまたは2つのその他の考え得るタンパク質−DN
A認識相互作用が存在しない場合の一次鎖の塩基との相互作用を有する。
【0046】
【表7】
【0047】
【表8】
【0048】 表中、/は、代替的アミノ酸を分ける。
【0049】
【表9】
【0050】
【表10】
【0051】 64の異なるDNAトリプレット(表1、2および3)を有する種々のZFα
−ヘリックス錯体の分子モデリング分析の結果、ならびに3つの接触位置におけ
る空間的特殊性についての知見は、ZF−DNA認識規則に反映される。表1、
2および3に記載した規則に基づいて、あらゆる標的DNA配列に対して最適な
結合親和性を有するDBPが設計され得る。表1〜3中の「カラムA」の表示、
即ち「A規則」は、所定コドン(トリプレット)に対する最適結合を有するアミ
ノ酸を示す。表1〜3の「カラムB」の表示、即ち「B規則」は、所定のトリプ
レットに対する二次的な、しかし依然として有意の結合親和性を有するアミノ酸
を示す。
【0052】 カラムA規則は、6個のH結合、0個の水接触および0個の疎水性接触を有し
、評価エネルギー(5x6)+(2x0)+(1x0)=30の最強トリプレッ
ト認識から、2個の水素結合、0個の水接触および2個の疎水性接触を有し、評
価エネルギー(5x2)+(2x0)+(1x2)=12までの範囲である。カ
ラムA規則は普通は、位置Z、ZおよびZにおけるちょうど1または2個
のアミノ酸の選択を有する。カラムB規則は、比較すると、位置Z、Zおよ
びZの各々における3個の考え得るアミノ酸から、位置Z、ZおよびZ の各々において異なる接触配列で、18個という多くのアミノ酸までを有する。
カラムBエネルギーの評価において、位置Z、ZおよびZにおける3つの
アミノ酸の多数の異なる群分けが認められる。最小エネルギーは、3個の水素結
合、0個の水接触および0個の疎水性接触を有し、評価エネルギー(5x3)+
(2x0)+(1x0)=15である。これらの組合せに関する最大エネルギー
評価は、平均で、3個の水素結合および2個の水接触または2個の疎水性接触で
あり、評価エネルギー(5x3)+(2x2)+(1x0)=19から(5x3
)+(2x0)+(1x2)=17まで下がる。したがって、カラムB規則は、
エネルギー範囲が30から下がって12までのカラムA規則より狭いエネルギー
範囲(即ち19から下がって15まで)を有する。カラムB規則に関する狭エネ
ルギー範囲は、64の異なる規則が64のカラムA規則と同様にはエネルギーを
基礎にして識別しないことを意味する。
【0053】 例えば、表2に記載したように、DNA塩基トリプレットグアニン−シトシン
−シトシン(GCC)と最適に結合するDBPは、トリプレットとの結合を生じ
させるタンパク質の部分が、配列ZXXZLXZH(配列番号2)(式中
、ZはDNAトリプレットの位置1と相互作用するアルギニンであり、Z
DNAトリプレットの位置2と相互作用するグルタミンまたはグルタミン酸であ
り、ZはDNAトリプレットの位置3と相互作用するアルギニンであり、Xは
任意のアミノ酸であり、Lはロイシンであり、そしてHはヒスチジンである)を
有するセグメントをその中に含有するZFドメインであるものである。
【0054】 表1または3に記載したように(所定のコドンに関するZ、ZおよびZ 位置のための「カラムB」登録を参照)、DNA塩基トリプレットグアニン−シ
トシン−シトシン(GCC)と、最適にでない場合、有効に結合するDBPは、
トリプレットとの結合を生じさせるタンパク質の部分が、配列ZXXZLX
H(式中、ZはDNAトリプレットの位置1と相互作用するヒスチジン、
リシン、グルタミン、アスパラギン、チロシン、セリンおよびトレオニンから成
る群から選択されるアミノ酸であり、ZはDNAトリプレットの位置2と相互
作用するグルタミン、アスパラギン、アスパラギン酸、セリン、トレオニン、ア
ルギニン、ヒスチジンおよびリシンから成る群から選択されるアミノ酸であり、
はDNAトリプレットの位置3と相互作用するグルタミン、アスパラギン、
グルタミン酸、アスパラギン酸、ヒスチジン、リシン、チロシン、セリンおよび
トレオニンから成る群から選択されるアミノ酸であり、Xは任意のアミノ酸であ
り、Lはロイシンであり、そしてHはヒスチジンである)を有するセグメントを
その中に含有するZFドメインであるものである。
【0055】 もちろん、中間体親和性のDBP、即ち、Z、ZおよびZ接触アミノ酸
が「A」および「B」規則の組合せにより選択されるものが設計され得ることが
理解される。例えば、トリプレットGCCとの結合のためのZFドメイン内のセ
グメントZXXZLXZH(配列番号2)中では、Zはアルギニンであ
り、Zはグルタミンまたはグルタミン酸であり、そしてZはグルタミン、ア
スパラギン、グルタミン酸、アスパラギン酸、ヒスチジン、リシン、チロシン、
セリンおよびトレオニンから成る群から選択され得る。
【0056】 このようなタンパク質のための基本的築造ブロックは、次式で表される:
【0057】
【式2】 NH−ZiF−COOH (式中、ZiFは次式: Y/FXCX2−4CG/DK/RXFXZXXZLXZHX3−5H(
配列番号1の部位1〜20)(ここで、Z、ZおよびZはDNAトリプレ
ットの3つの塩基に対応するために表1、2または3から選択されるアミノ酸で
あり、式の残りの構成成分は式Iの説明中で前記されたのと同様である) の形態のZFドメインである)。
【0058】 本発明の好ましい実施態様では、所定のDNAトリプレットとの結合のための
ジンクフィンガードメインは、表2における、あるいは表1または表3のカラム
Aにおける適切なAAの選択により設計される。本発明の別の実施態様では、Z
Fドメインは、表1または3のカラムBにおける所定のDNAトリプレットに関
して記載されたAAの中からの選択により設計される。
【0059】 このような一ドメインは、標的配列の各トリプレットに必要である;3塩基の
みの標的列に関しては、前記の式はタンパク質を定義する。
【0060】 DNAの標的列が6塩基である場合、DBP設計は以下のように延長される:
【0061】
【式3】 NH−ZiF−{リンカー}−ZiF−COOH (式中、ZiFおよびZiFは、6つの塩基の第一および第二トリプレット
と結合するよう、ZiFに関して上に示されているのと同様に、設計されたZ
Fドメインであり、そして{リンカー}は以下のパターン: T/SG/EX0−2EK/RP(配列番号1の部位21〜26) (式中、構成成分は式1に前記したのと同様である) に一致するアミノ酸配列である)。
【0062】 1)DNAの標的列が9、12またはそれより多くの3の倍数個の塩基を含有
し、2)3n+3塩基のためにDBPを設計する必要があり、そして、3)最初
の3n個の塩基が以下の配列:
【0063】
【式4】 NH−ZiF−{リンカー}−ZiF−{リンカー}−…−{リンカー}
−ZiF−COOH により示される場合には、DBP設計は回帰的に延長され、そして必要なDBP
は以下の配列:
【0064】
【式5】 NH−ZiF−{リンカー}−ZiF−{リンカー}−…−{リンカー}
−ZiF−{リンカー}−ZiFn+1−COOH (式中、ZiFn+1は、塩基対の標的配列のn番目+1トリプレットと結合す
るために、ZiFに関して前記したのと同様に、設計されるZFドメインであ
る)により特定される。
【0065】 図3は、n=3であるZFタンパク質、即ち、リンカー配列により連結される
3つのZFドメイン(即ちn=3)を有し、9(3n)塩基の標的DNA列と結
合するよう設計されるものを図式的に示す。
【0066】 前記の規則は、あらゆる所定のDNAトリプレットとの結合のための最適アミ
ノ酸(単数または複数)の容易な確定を可能にし、したがってDNAトリプレッ
トとの結合のためのDBPの理想的構成成分であり得るZFドメイン中の3個の
アミノ酸の同定および位置決定を可能にする。
【0067】 規則の適用は、次に、ZFドメインの一組の数nを含有するDBPの設計に
拡張され得るが、この場合、DPBは所定のDNA配列内の3nヌクレオチド
の標的伸長物と結合する。ヌクレオチドの標的3n伸長、ならびにDBP中の
ドメインの収集および序列は、DPBおよび標的DNA配列に関する結合エ
ネルギーが、スクリーニングされる全DNA分子内の3nヌクレオチドのあら
ゆる伸長を有する組数nのZFドメインを含有するDBPのあらゆる対合に関
して考え得る最高であるようなものである。
【0068】 したがって、第一に重要な本発明の実施態様は、あらゆる長さのDNA配列に
関するこのようなDBPの設計方法である。該方法は、前記の規則を、所望の特
性を有する独特のDBPを確定するためのnZFドメインを含有するDBPに
対するそれらの親和性により配列内の3nヌクレオチドの考え得るすべてのセ
グメントをスクリーニングし、等級付けする手段と組合せて用いる。
【0069】 さらに特に、本発明は、所定の遺伝子内の標的DNA配列と選択的に結合する
リンカー配列により連結される多ZFドメインを有するDBPの設計方法であっ
て、前記ZFドメインの各々が次式: AXCX2−4CAXFXZXXZLXZHX3−5H(
配列番号3) を、そして前記リンカーの各々が次式: A0−2EAP(配列番号4) (式中、(i)Xはあらゆるアミノ酸であり、(ii)X2−4は2〜4アミノ
酸長のペプチドであり、(iii)X3−5は3〜5アミノ酸長のペプチドであ
り、(iv)X0−2は0〜2アミノ酸長のペプチドであり、(iv)Aはフ
ェニルアラニンおよびチロシンから成る群から選択され、(v)Aはグリシン
およびアスパラギン酸から成る群から選択され、(vi)Aはリシンおよびア
ルギニンから成る群から選択され、(vii)Aはトレオニンおよびセリンか
ら成る群から選択され、(viii)Aはグリシンおよびグルタミン酸から成
る群から選択され、(ix)Aはリシンおよびアルギニンから成る群から選択
され、(x)Cはシステインであり、(xi)Fはフェニルアラニンであり、(
xii)Lはロイシンであり、(xiii)Hはヒスチジンであり、(xiv)
Eはグルタミン酸であり、(xv)Pはプロリンであり、そして(xvi)Z 、ZおよびZは塩基接触アミノ酸である) を有する方法であって、以下の: (a)スクリーニングされるゲノムを決定する工程と、 (b)結合のためのゲノム中の標的DNA配列を選択する工程と、 (c)ジンクフィンガードメインの数をnに決定する工程と、 (d)nが以下の関係: n=3n を用いて確定される第一のルーチンを用いて、標的DNA配列を、各々のブロッ
クがnヌクレオチドを含有するヌクレオチドブロックに分ける工程と、 (e)本明細書の表1〜3に記載したA規則および/またはB規則により、
標的遺伝子配列の最初の5’ヌクレオチドから数えた場合に工程(d)からの最
初のヌクレオチドブロックと結合して、ブロック特異的DBPを生じるDBPの
各ZFドメインにZ、ZおよびZの塩基接触アミノ酸を割り当てて、そし
て各々次式: 結合エネルギードメイン=(5x水素結合数)+(2xHO接触数)+
(疎水性接触数) を用いて確定される結合エネルギー、即ち結合エネルギーの生成物としてのこの
ような各ブロック特異的DBPの各ZFドメインの「結合エネルギーブロック
、ポリペプチドの全ジンクフィンガードメインの「結合エネルギードメイン」を
計算する工程と、 (f)第二のルーチンを用いて工程(d)からのDBPをさらに分けて、3
つのZFドメインを有するさらに分割されたDBPを生成する工程と、 (g)第三のルーチンを用いてゲノムに対して工程(f)からのさらに分割
されたDBPをスクリーニングして、ゲノム中の各々のさらに分割されたDBP
に関するゲノム中の結合部位の数を確定して、そして以下の式: 結合エネルギー部位n=(5x水素結合数)+(2xHO接触数)+(
疎水性接触数) を用いて、このような部位の各々に関して結合エネルギーを割り当てる工程と、 (h)以下の式: R=結合エネルギーブロック/工程(g)からの全てのさらに分割され
たDBPに関する全結合エネルギー部位nの和 を用いて、工程(e)からの各ヌクレオチドブロック特異的DBPに関して第四
のルーチンを用いて結合エネルギーの比Rを計算する工程と、 (i)n≧4である場合の各々のさらに分割されたDBPに関して工程(
f)〜(h)を反復する工程と、 (j)nヌクレオチドを含有する標的DNA配列中の各ヌクレオチドブロ
ックに関して工程(d)〜(i)を反復する工程と、 (k)工程(h)から得られたR数値を順位化する工程と、 (l)許容可能なR値を有するDBPを選択する工程と から成る算法を包含する方法に関する。
【0070】 本発明のこの観点の好ましい実施態様を以下に示す。
【0071】 1)DBPのR数値が標的DNA配列と結合する工程(h)の全DBPに関
して最高数値である前記の設計方法。
【0072】 2)工程(h)で確定されるDBP R数値が少なくとも10,000であ
る前記の方法。
【0073】 3)ZFドメインの数nが9である前記の方法。
【0074】 4)工程(e)の各ヌクレオチドブロックに関してZ、ZおよびZに塩
基接触アミノ酸を割り当てるための規則が規則組Aから選択される前記の方法。
【0075】 本発明は、所定の遺伝子内の標的DNA配列と選択的に結合するリンカー配列
により連結される多ZFドメインを有するDBPを設計するためのコンピュータ
ーシステムであって、前記ZFドメインの各々が次式: AXCX2−4CAXFXZXXZLXZHX3−5H(
配列番号3) を、そして前記リンカーの各々が次式: A0−2EAP(配列番号4) (式中、(i)Xはあらゆるアミノ酸であり、(ii)X2−4は2〜4アミノ
酸長のペプチドであり、(iii)X3−5は3〜5アミノ酸長のペプチドであ
り、(iv)X0−2は0〜2アミノ酸長のペプチドであり、(iv)Aはフ
ェニルアラニンおよびチロシンから成る群から選択され、(v)Aはグリシン
およびアスパラギン酸から成る群から選択され、(vi)Aはリシンおよびア
ルギニンから成る群から選択され、(vii)Aはトレオニンおよびセリンか
ら成る群から選択され、(viii)Aはグリシンおよびグルタミン酸から成
る群から選択され、(ix)Aはリシンおよびアルギニンから成る群から選択
され、(x)Cはシステインであり、(xi)Fはフェニルアラニンであり、(
xii)Lはロイシンであり、(xiii)Hはヒスチジンであり、(xiv)
Eはグルタミン酸であり、(xv)Pはプロリンであり、そして(xvi)Z 、ZおよびZは塩基接触アミノ酸である) を有する方法であって、以下の: (a)スクリーニングされるゲノムを決定する工程と、 (b)結合のためのゲノム中の標的DNA配列を選択する工程と、 (c)ZFフィンガードメインの数をnに決定する工程と、 (d)nが以下の関係: n=3n を用いて確定される第一のルーチンを用いて、標的DNA配列を、各々のブロッ
クがnヌクレオチドを含有するヌクレオチドブロックに分ける工程と、 (e)本明細書の表1〜3に記載したA規則および/またはB規則により、
標的遺伝子配列の最初の5’ヌクレオチドから数えた場合に工程(d)からの最
初のヌクレオチドブロックと結合して、ブロック特異的DBPを生じるDBPの
各ZFドメインにZ、ZおよびZの塩基接触アミノ酸を割り当てて、そし
て各々次式: 結合エネルギードメイン=(5x水素結合数)+(2xHO接触数)+
(疎水性接触数) を用いて確定される結合エネルギー、即ち結合エネルギーの生成物としてのこの
ような各ブロック特異的DBPの各ZFドメインの「結合エネルギーブロック
、DBPの全ドメインの「結合エネルギードメイン」を計算する工程と、 (f)第二のルーチンを用いて工程(d)からのDBPをさらに分けて、3
つのZFドメインを有するさらに分割されたDBPを生成する工程と、 (g)第三のルーチンを用いてゲノムに対して工程(f)からのさらに分割
されたDBPをスクリーニングして、ゲノム中の各々のさらに分割されたDBP
に関するゲノム中の結合部位の数を確定して、そして以下の式: 結合エネルギー部位n=(5x水素結合数)+(2xHO接触数)+(
疎水性接触数) を用いて、このような部位の各々に関して結合エネルギーを割り当てる工程と、 (h)以下の式: R=結合エネルギーブロック/工程(g)からの全てのさらに分割され
たDBPに関する全結合エネルギー部位nの和 を用いて、工程(e)からの各ヌクレオチドブロック特異的DBPに関して第四
のルーチンを用いて結合エネルギーの比Rを計算する工程と、 (i)n≧4である場合の各々のさらに分割されたDBPに関して工程(
f)〜(h)を反復する工程と、 (j)nヌクレオチドを含有する標的DNA配列中の各ヌクレオチドブロ
ックに関して工程(d)〜(i)を反復する工程と、 (k)工程(h)から得られたR数値を順位化する工程と、 (l)許容可能なR値を有するDBPを選択する工程と から成る算法を含む設計手段を包含するコンピューターシステムにも関する。
【0076】 本発明において、設計方法とコンピューターシステムとの両方について前述の
(h)で定められたRは、10,000の下限を有する。好ましくはRは1
より大きい。
【0077】 本発明のこの観点の好ましい実施態様を以下に示す: 1)DBPのR数値が標的DNA配列と結合する工程(h)の全DBPに関
して最高数値である前記のコンピューターシステム。
【0078】 2)工程(h)で確定されるDBP R数値が少なくとも10,000であ
る前記のコンピューターシステム。
【0079】 3)ZFドメインの数nが9である前記のコンピューターシステム。
【0080】 4)工程(e)の各ヌクレオチドブロックに関してZ、ZおよびZの塩
基接触アミノ酸を割り当てるための規則が規則組Aから選択される前記のコンピ
ューターシステム。
【0081】 本発明の方法およびコンピューターシステムはさらに、図4〜9のブロック流
れ図により説明される。
【0082】 図4は、DBP設計工程が実行されるコンピューターシステムの構成成分を示
す。任意の製造者の中央処理装置デジタルコンピューター(1)が、本発明者等
により書かれたコンピュータープログラム(2)とともに提示される。コンピュ
ータープログラム(2)は、DNA−トリプルエネルギー規則(6)、ゲノム記
述子(9)、ゲノムDNA配列(10)および遺伝子特徴(5)として記載され
た一連のファイルを読み取る。中央処理機(1)は、この情報をDBPブロッキ
ング断片ファイル(7)およびゲノムのための最適DBP設計(8)に変換する
【0083】 図5は、図4中のコンピュータープログラム(2)が2つの部分を有すること
を示す。ゲノムデータは先ず、ゲノム処理によりブロッキング断片ファイルファ
ンクション(2)に変換される。これらのファイルは次に、ゲノムファンクショ
ンのためのDBP設計(3)により用いられる。
【0084】 図5のブロッキング断片へのゲノム処理ファイルブロック(2)を、図6に詳
細に示す。11から下って3までのすべてのnに関して、ゲノム説明体ファイ
ル(12)およびゲノムDNA配列ファイル(32)が読み取られ、非分類化断
片ファイル(7)に変換される。この同一非分類化断片ファイル(14)は、コ
ンピューター製造者により提供される分類ファンクション(13)により分類化
断片ファイル(15)に変換される。同一分類化断片ファイル(30)は読み取
られ、そして最終的にDBPサイズブロッキングファイル(22)に変換される
【0085】 図5のゲノムのためのDBP設計ブロック(3)を、図7でより詳細に示す。
11から下って3までのnに対応するゲノム説明体ファイル(3)、遺伝子特
徴ファイル(7)、ゲノムDNA配列ファイル(9)およびDBPサイズブロッ
クファイル(37)は読み取られ、ゲノムDNAを先ず遺伝子に、次にゲノムの
ための最適DBP設計のファイル(38)に変換されるために用いられる。変換
および設計工程は、ゲノム中のすべての遺伝子に関して成される。
【0086】 図7の「カレント−サブ−ウインドウがカレント−ブロッキング−ファイル中
にあるか否かを確定する」ブロック(22)を、図8でより詳細に詳述する。
【0087】 図7の「ブロック断片の結合エネルギーを計算する」ブロック(24)を、図
9でより詳細に詳述する。 種々のnの種々のDBPに算法を適用することにより、nが9である値が算
法の最良の出発点であり、即ち、その工程は9フィンガーDBPに関する探索を
用いて開始されるべきであることが、実験的に決定された。これは、種々のDB
Pを評価するのに用いられる選択判定基準Rに関してより良好に理解され得る
。短いDBP、例えばn=4または5のものでは、すべての結合エネルギー メイン の生成物として幾何学的に増大する結合エネルギーブロックは有意に低く
、そして結合エネルギー部位nは比較的大きい。しかしながら、nが増大する
と、Rの分子は劇的に増大するが、一方、「バックグラウンド」または「ノイ
ズ」を表す分母は有意に変化しないことが観測された。したがって、n=9の
場合は、不適当なコンピューターニーズの可能性を生じることなく、結合の高親
和性および特異性の保証を提供する。
【0088】 しかし、本発明は、n≦9のDBPの設計に限定されない、ということが強
調されるべきである。そのことに関しては、n=9は最良の出発点であること
が見出されているが、しかし所定の状況に関する最良のDBPは、標的DNA配
列の長さにもかかわらず、n<9であるものにし得るとも考えられる。本発明
の概念は、必要な場合には、あらゆる長さのDBPの設計に適用され得る。
【0089】 いかなる場合にも、Nヌクレオチドの所定のDNA配列に関しては、N−27
、9−フィンガーDBP配列が存在する。これらの各々は、前に開示した設計法
の(e)部に記載した3−ヌクレオチドセグメントの各々に関してエネルギー関
数を評価することにより、結合の強度に関して等級付けされ得る。
【0090】 初期コンピューター実験では、選択可能配列は8、7、6、5および4−フィ
ンガーサブサイトを有し得なかった。しかしながら、本発明のシステムに関して
は、サブサイト結合エネルギーの和だけは最小にする必要がある。その結果、サ
ブサイト結合エネルギーが3−フィンガーサブサイトから来るか、4−フィンガ
ーサブサイトからか、または(一般原則として)さらに大きいサブサイトからさ
え来るかは問題ではない。論理的排除からエネルギー的排除へのこの単純変化は
、酵母菌ゲノムの検査によってはそれほど多くはないが、しかし虫ゲノムの検査
によってより多く発せられた。
【0091】 当該算法の中心部分は、許容可能なn−フィンガー部位(例えば、9−フィ
ンガーDBPに関しては27−塩基セグメント)を見出す場合、類似部位が存在
するかを知るための全ゲノム中のすべての他のn−フィンガー部位に対する探
索である。これが実際に成される場合には、最高R値を有するDBPが選択さ
れる。さらに、算法は、所定の9−フィンガー部位に対して全ゲノム中に等価の
8−フィンガー、7−フィンガー、6−フィンガー、5−フィンガーおよび4−
フィンガーサブサイトが存在するかを知るために点検する。許容可能でない9−
フィンガー部位が見出された場合には、算法は、適切な8−フィンガー部位に関
して探索する。必要な場合には、探索は、7−フィンガー部位等に関して、許容
可能DBP結合部位が見つかるまで、続けられる。
【0092】 9−フィンガーDBPに関する探索内で、算法は、「フレーム」と呼ばれる2
7塩基配列のすべてを調べる。各フレームは、DNAとのその相互作用、および
3−フィンガーサブサイトまで下がって他のすべてのサブフレームの相互作用を
確定するために評価される。ゲノム中の各フレームおよびサブフレームの実例数
が、ソフトウェアの遂行のゲノム処理段階中に記録されている。フレームまたは
サブフレームの配列は、各ZFの結合エネルギーの生成物として評価される。各
ZFドメインは、3つのDNA塩基を認識する。ZFが認識する根元的DNA配
列は、ZFとDNAとの間にどれだけ多くの水素結合、水接触および疎水性接触
が存在するかを確定する。
【0093】 所定のn−塩基部位がゲノム中の他の場所に生じるか否かを算法が検出する
方法は、部位に関してB木を調べることによる。全ゲノムは、n−フィンガー
部位の各々に関して処理される。本算法は、無数の断片を分類し、併合するため
の手段を含有し、最後に、すべての異なるフィンガーサイズに関してブロック断
片のすべての等級化一覧が生成される。
【0094】 実施例1 DBPに関する典型的探索およびその設計方法の例を、以下に示す。それは、
100ヌクレオチド(即ち、N=100)の標的DNA配列を結合するための9
−フィンガーDBP(即ち、n=9)に関するスクリーニングを包含する。配
列は、全100ヌクレオチド配列において、すべての27−ヌクレオチド配列に
関して、位置1から開始して、即ち、1−27、2−28、3−29等で、スク
リーニングされる。これが成されたら、9−フィンガーを3−フィンガーセクシ
ョンに、即ち1−3、2−4、3−5等に分解する。算法は、結合の相対強度に
関して精査し、それを探す。その考えは、DBP結合対サブサイト結合の比、R
を最大にし、したがって最大数のサブサイトと相互作用する9量体のものを排
除する。
【0095】 本発明の算法を、以下の実施例で説明するように、エス・セレビシエ(S.c
ervisiae)およびシー・エレガンス(C.elegans)のゲノムに
適用した。
【0096】 実施例2 本算法を、酵母菌ゲノムのスクリーニングに適用した。それぞれ110および
447遺伝子を含有する酵母菌の2本の染色体をプロセッシングした。各遺伝子
に関して、算法は、サブサイト結合エネルギーの最低合計を有するn−フィン
ガー配列を選択した。酵母菌では、3−フィンガーブロック断片の数は、ほとん
ど最大(即ち、最大412に対して4)である。虫ゲノム(実施例3参照)で
は、3−フィンガーブロック配列は、無条件に最大である。酵母菌では、4−フ
ィンガーブロック配列は数が大きいが、しかし5−フィンガーブロック配列の集
団は比較的小さい。虫では、4−フィンガーブロック配列は5−フィンガーブロ
ック配列より数が大きいが、しかし後者は酵母菌と比較して、数がより大きい。
将来、虫からヒトに進行する場合、4−フィンガーブロック配列は飽和に近く(
即ち、412に近く)なり得る、と予測され得る。
【0097】 算法分析は、酵母菌の16本の染色体のうちの2本に関して実施した。最初の
2本の染色体中の557遺伝子は、酵母菌ゲノムにおける全染色体の特性の現実
に即した像を示すと思われる。標本計算を全酵母菌ゲノムに関して実行したが、
しかしこれらの結果は、遺伝子のちょうど2本の染色体分の特性を計算すること
により生成されたものと異ならない。酵母菌ゲノムの分析全体の知見の典型であ
る、100酵母菌遺伝子の分析の結果を、表4に示す。
【0098】 本算法の力はさらに、図10〜14に示した結果で実証される。図は、試験が
集中された2本の酵母菌染色体の557遺伝子のすべてに関して得られた結果を
示す。
【0099】 許容可能な9−フィンガーDBPの各々の強度が計算され得る。図10は、許
容可能な9−フィンガーDBPのすべての結合強度が均一に分布されることを示
す。この曲線が下方に曲がる場合には、より強いフレームがより好ましい。この
曲線が上方に曲がる場合には、より弱いフレームが好ましい。
【0100】 図11は、許容可能な9フィンガーDBPの結合エネルギー(結合エネルギー
ブロック)が1011〜1013結合単位間で均一に分布されることを示す。
【0101】 図12は、擬似サブサイト結合エネルギー(結合エネルギー部位)の合計の分
布が、10〜10結合単位の範囲でそれ自体均一であることをを示す。
【0102】 図13は、図12の非対数バージョンである。それは、許容可能な9−フィン
ガーDBPのほとんどが5x10未満の擬似サブサイト結合エネルギーを有す
ることを示す。
【0103】 図14は、図11の値対図12の値の比を出すことにより作成された、9フィ
ンガーDBPに関するRのグラフである。このチャートは、許容可能な9フィ
ンガーDBPのDBP結合強度対擬似サブサイト相互作用の結合エネルギーの合
計の比が10から10まで変わることを示す。
【0104】 本発明の分析道具は、単一酵母菌遺伝子YAR073の、特にコード領域のす
ぐ上流のプロモーターの300bp領域のさらなる分析にも用いた。遺伝子のこ
の部分の各27塩基フレームに関するサブサイト結合エネルギー(SBE)の全
合計を確定した。結果を、図15にグラフで示す。一次結合エネルギー(BE)
も確定し、相関が、SBE値とBE:SBEの比(R)の値との間に見出され
た。さらに(図16)、R値のプロットのピークが同一遺伝子の転写因子の足
跡(別個の試験で確定)に対応する、ということも分かった。
【0105】 実施例3 C.elegansの100遺伝子への本発明の算法の適用は、本システムが
S.cerevisiaeに対すると同様にC.elegansに対してもうま
く適用し得ることを示した。100C.elegans遺伝子の分析結果を、表
5に示す。
【0106】 図17では、分析したC.elegans遺伝子の1つに関して、5−フィン
ガーDBPだけが設計され得ることが分かる。別の遺伝子に関しては、7−フィ
ンガーDBPだけが設計され得た。これら2つの遺伝子、2および32は、9−
量体が設計され得るものに対してそれらの遺伝子(100のうち98を除外した
)に関してだけの分析結果を示すため、表5には示していない。あらゆる場合に
、図17に示した結果は、全C.elegansゲノムの分析に関する予測と一
致し、即ち、5−から9−フィンガーDBPの分布はS.cerevisiae
とは多少異なる。
【0107】 図18は、S.cerevisiaeに関して図14で示したのと同一の、C
.elegansに関する分析を示す。図18は、図14で観察されたのと同様
のR値分布を示す。
【0108】 実施例2および3は、2つの広範に亘って全く異なる生物のゲノムに関するD
BPの設計に対する本発明の適用可能性を実証する。酵母菌ゲノムへの、そして
特に虫ゲノムへの本算法の適用の種々の結果は、算法道具の力を示し、そして実
はその基礎を、即ち、それは単に無作為および/または理論的分析を提供するだ
けではないことを、実証する。これらの分析に基づいて、本発明の算法は、ヒト
のゲノムを含めたあらゆる当該生物のゲノムのあらゆる所望のセグメントに関す
るDBPの設計にまで及び得る、と予測される。
【0109】 本発明の算法は生物体の全ゲノムに対する探索を包含するが、しかし、本発明
の試験結果は、所定の生物のゲノムについての完全知識の欠如が、その生物に関
するDBPの設計に対する本発明の適用への障害とはならないことを、強く示し
ている。S.cerevisiae(単細胞生物)およびC.elegans(
多細胞生物)に関して本明細書中に示した試験で得られたブロック配列の知識を
用いて、高等真核生物の系に許容される配列の妥当な見積もりを成し得る、と予
測できる。
【0110】 例えば、酵母菌および虫に関する本発明の試験は、ゲノム「ノイズ」、この状
況においては擬似結合部位エネルギーが、比較的一定であり、これは、より高等
な、より複雑な生物に同様に投影され得る、ということを示す。言い換えれば、
推定または拡張し得るDNA配列の実証済の組合せから、より複雑なゲノムの分
析に対する本発明の算法により、しかしながら、有効なDBPの設計の目的をと
もなって、その中の特定の配列を知ることができる。さらに、大型生物、例えば
ディー・メラノガステル(D.melanogaster)の全ゲノムが分かれ
ば、それらはさらに、ヒトを含めた高等生物のゲノムの分析のための鍵を提供す
る。
【0111】 前記のようにDBPは、標準タンパク質合成技術を用いて築造し得るし、また
は標準遺伝子コードを用いて、その発現がDBPである遺伝子を特殊化し、構築
するための基礎として用い得る。
【0112】 そのようにして設計されるタンパク質は、DNA標的配列との正確且つ緊密な
結合を必要とするあらゆる適用に用い得る。例えば、DBPは、本発明によれば
、DNAエンドヌクレアーゼ活性と結合され得る。その結果生じた分子を標的D
NAと結合すると、前記のDNAを、DBP結合部位から固定置換で切断し得る
【0113】 同様に、標的DNA配列がプロモーターである場合には、結合すると所定の遺
伝子、あるいはそのプロモーターの制御下の遺伝子の発現を変える(即ち、増強
し、減衰し、または終結さえする)よう作用するプロモーター特異的DBPを生
成し得る。
【0114】 別の適用としては、DBPは、固体支持体に結合される場合は、特定のDNA
配列を結合するよう設計し得る。このような固体支持体としては、スチレンビー
ズ、アクリルアミドウエルプレートまたはガラス基質が挙げられる。
【0115】 前記の特定の適用を、ならびに本発明により考え得る全範囲の適用を実現する
ために、DBPは、任意の長さの前および/または後ドメインアミノ酸配列の付
加的特徴を含むよう前記した設計を行うことができる。この例としては、例えば
塩基性DBPとエンドヌクレアーゼとの、またはレポーターとの、またはDPB
が固体支持体に結合され得る配列との結合が挙げられる。 したがって、本発明は、以下の形態の長さの3n(ここで、n≧1)塩基対の予
定標的二本鎖DNA配列と結合するDBPを含む: NH−X0−m−ZiF−[{リンカー}−ZiF]…−[{リンカー}
−ZiF]−X0−p−COOH (式中、ZiF〜ZiFのそれぞれは、前記の形態のZFドメインであり、
{リンカー}は前記のようなアミノ酸配列であり、X0−mは0〜mのアミノ酸
の配列を表し、X0−pは0〜pのアミノ酸の配列を表す)。mおよびpに関す
る値、およびアミノ酸の同定は、所定の適用のためにDBPと結合される特定の
タンパク質(単数または複数)またはアミノ酸配列(単数または複数)により確
定される。
【0116】 本発明のさらに別の実施態様では、特定のZFモチーフ内の2つのシステイン
および2つのヒスチジンアミノ酸と錯体を形成するZn+2原子は、Co+2
たはCd+2原子により置換され得るので、したがって、「コバルトフィンガー
」または「カドミウムフィンガー」を作る。
【0117】 表2に示した規則(「規則組A」)は、ZF−DNA認識における最適組合せ
のための「第一選択」規則とみなされる。しかしながら、表1または表3のカラ
ムB(「規則組B」)に示したように、有用なZF−DNA錯体を生成し得るD
NA結合タンパク質の設計に重要であると予測される多数の代替的AA組合せが
存在することは、強調されるべきである。
【0118】
【表11】
【0119】
【表12】
【0120】 論争のための完全S.cerevisiaeゲノムの精査−各遺伝子のコード
領域に対して設計されるDBP 染色体 遺伝子 遺伝子中の最適DNA配列 DBP中の特定アミノ酸 DBP結合エネルギー 結合エネルギー対擬似結合エネルギーの比
【0121】
【表13】
【0122】
【表14】
【0123】 論争のための完全C.elegansゲノムの精査−各遺伝子のコード領域に
対して設計されるDBP 染色体 遺伝子 遺伝子中の最適DNA配列 DBP中の特定アミノ酸 DBP結合エネルギー 結合エネルギー対擬似結合エネルギーの比
【0124】 参考文献 1.Miller,J.,McLachlan,A.D.and Klug,A
.(1985)EMBO J.4,1609−1614. 2.Berg,J.M.(1988)Proc.Natl.Acad.Sci.
USA 85,99−102. 3.Gibson,T.J.,Postma,J.P.M.,Brown,R.
S.and Argos,P.(1988)Protein Eng.2,20
9−218. 4.Lee,M.S.,Gippert,G.P.,Soman,K.V.,C
ase,D.A.and Wright,P.E.(1989)Science
245,635−637. 5.Nardelli,J.,Gibson,T.J.,Vesque,C.a
nd Charnay,P.(1991)Nature 349,175−17
8. 6.Thiesen,H.J.and Bach,C.(1991)FEBS
Lett.283,23−26. 7.Pavletich,N.P.and Pabo,C.O.(1991)S
cience 252,809−817. 8.Berg,J.M.(1992)Proc.Natl.Acad.Sci.
USA 89,11109−11110. 9.Kriwacki,R.W.,Schultz,T.A.and Cara
donna,J.P.(1992)Proc.Ntl.Acad.Sci.US
A 89,9759−9763. 10.Jacobs,G.H.(1992)EMBO J.11,4507−4
517. 11.Gogos,J.A.,Hsu,T.,Bolton,J.and ka
fatos,F.C.(1992)Science 257,1951−195
5. 12.Fairall,L.,Harrison,S.D.,Travers,
A.A.and Rhodes,D.(1992)J.Mol.Biol.22
6,349−366. 13.Klevit,R.E.(1991)Science 253,1367
and 1393. 14.Desjarlais,J.R.and Berg,J.M.(1992
)Proc.Natl.Acad.Sci.USA 89,7345−7349
. 15.Rebar,E.J.,and Pabo,C.O.,U.S.Pate
nt No.5,789,538,August 4,1998. 16.Beerli,R.R.,Segal,D.J.,Dreier,B.,
and Barbas,C.F.(1998)Proc.Natl.Acad.
Sci.U.S.A.95,14628−14633. 17.Jordan,S.R.and Pabo,C.O.(1988)Sci
ence 242,893−899. 18.Aggarwal,A.K.,Rodgers,D.W.,Drotta
r,M.,Ptashne,M.and Harrison S.C.(198
8)Science 242,899−907. 19.Letovsky,J.,Dyran,W.S.(1989)Nucle
ic Acids Res.17,2639−2653. 20.Kissinger,C.R.,Liu,B.,Martin−Blan
co,E.,Kornberg,T.B.and Pabo,C.O.(199
0)Cell 63,579−590. 21.Woberger,C.,Vershon,A.K.,Liu,B.,J
ohnson,A.D.and Pabo,C.O.(1991)Cell 6
7,517−528. 22.Seeman,N.C.,Rosenberg,J.M.and Ric
h,A.(1976)Proc.Natl.Acad.Sci USA 73,
804−808. 23.Mikelaar,R.−H.,Bruskov,V.I.and Po
ltev,V.I.(1985)New precision space−f
illing atomic−molecular models,Pushc
hino. 24.Mikelsaar,R.(1986)Trends in Biote
chnology 4,162−163.
【図面の簡単な説明】
【図1】 種々の既知のDBP中のZFドメインの列を示す図である。TFIIIAフィ
ンガー1〜9は、それぞれ、配列表中の配列番号207〜215として示される
。Xenopus Xfinフィンガー31は、配列番号216として示される
。ADR 1フィンガーは、配列番号217として示される。MKR2フィンガ
ー1〜9は、それぞれ配列番号218〜226として示され、そしてKrupp
elフィンガー1〜5は、それぞれ配列番号227〜231として示される。
【図2】 標的DNAトリプレットと単一ZFドメインとの間の相互作用を示す模式図で
ある。
【図3】 9塩基の標的DNA列と3ドメインDBPとの間の相互作用を示す模式図であ
る。
【図4】 即時DBP設計工程が実行されるコンピューターシステムのブロック流れ図で
ある。
【図5】 図4のコンピュータープログラムブロック(2)がさらに分解されるブロック
流れ図である。
【図6A】 図5のブロッキング断片へのゲノム処理ファイルブロック(2)がさらに分解
されるブロック流れ図である。
【図6B】 図5のブロッキング断片へのゲノム処理ファイルブロック(2)がさらに分解
されるブロック流れ図である。
【図6C】 図5のブロッキング断片へのゲノム処理ファイルブロック(2)がさらに分解
されるブロック流れ図である。
【図6D】 図5のブロッキング断片へのゲノム処理ファイルブロック(2)がさらに分解
されるブロック流れ図である。
【図7A】 図5のゲノムブロック(3)に関する設計DBPがさらに分解されるブロック
流れ図である。
【図7B】 図5のゲノムブロック(3)に関する設計DBPがさらに分解されるブロック
流れ図である。
【図7C】 図5のゲノムブロック(3)に関する設計DBPがさらに分解されるブロック
流れ図である。
【図7D】 図5のゲノムブロック(3)に関する設計DBPがさらに分解されるブロック
流れ図である。
【図7E】 図5のゲノムブロック(3)に関する設計DBPがさらに分解されるブロック
流れ図である。
【図8】 図7のブロック(22)がさらに分解されるブロック流れ図である。
【図9A】 図7のブロック(24)がさらに分解されるブロック流れ図である。
【図9B】 図7のブロック(24)がさらに分解されるブロック流れ図である。
【図10】 分析した酵母菌遺伝子中の許容可能な9フィンガーDBPの結合強度の分布を
示すグラフである。
【図11】 分析した酵母菌遺伝子に関して見出された許容可能な9フィンガーDBPの結
合エネルギーの値を示すグラフである。
【図12】 分析した酵母菌遺伝子中のDBPサブサイト(擬似)結合エネルギーの分布を
示すグラフである。
【図13】 図12に示した分布を非対数様式で示すグラフである。
【図14】 許容可能な9フィンガーDBPに関して、分析した酵母菌遺伝子中の結合エネ
ルギー対サブサイト(擬似)結合エネルギーの比を示すグラフである。
【図15】 酵母菌遺伝子YAR073の300bpプロモーター領域の27塩基対(bp
)フレームの各々に関する擬似結合エネルギーの値を示すグラフである。
【図16】 酵母菌遺伝子YAR073の300bpプロモーター領域の27塩基対(bp
)フレームの各々に関する結合エネルギー対サブサイト(擬似)結合エネルギー
の比を示すグラフである。
【図17】 分析したC.elegans遺伝子中の許容可能なDBPのサイズの分布を示
すグラフである。
【図18】 許容可能なDBPに関する分析したC.elegans遺伝子中の結合エネル
ギー対サブサイト(擬似)結合エネルギーの比を示すグラフである。
【手続補正2】
【補正対象書類名】図面
【補正対象項目名】図1B
【補正方法】追加
【補正の内容】
【図1B】
【手続補正書】
【提出日】平成13年10月24日(2001.10.24)
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】0118
【補正方法】変更
【補正の内容】
【0118】
【表11】
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0119
【補正方法】変更
【補正の内容】
【0119】
【表12】
【手続補正3】
【補正対象書類名】明細書
【補正対象項目名】0121
【補正方法】変更
【補正の内容】
【0121】
【表13】
【手続補正4】
【補正対象書類名】明細書
【補正対象項目名】0122
【補正方法】変更
【補正の内容】
【0122】
【表14】
【手続補正5】
【補正対象書類名】図面
【補正対象項目名】図1
【補正方法】変更
【補正の内容】
【図1】
【手続補正6】
【補正対象書類名】図面
【補正対象項目名】図2
【補正方法】変更
【補正の内容】
【図2】
【手続補正7】
【補正対象書類名】図面
【補正対象項目名】図3
【補正方法】変更
【補正の内容】
【図3】
【手続補正8】
【補正対象書類名】図面
【補正対象項目名】図4
【補正方法】変更
【補正の内容】
【図4】
【手続補正9】
【補正対象書類名】図面
【補正対象項目名】図5
【補正方法】変更
【補正の内容】
【図5】
【手続補正10】
【補正対象書類名】図面
【補正対象項目名】図6A
【補正方法】変更
【補正の内容】
【図6A】
【手続補正11】
【補正対象書類名】図面
【補正対象項目名】図6B
【補正方法】変更
【補正の内容】
【図6B】
【手続補正12】
【補正対象書類名】図面
【補正対象項目名】図6C
【補正方法】変更
【補正の内容】
【図6C】
【手続補正13】
【補正対象書類名】図面
【補正対象項目名】図6D
【補正方法】変更
【補正の内容】
【図6D】
【手続補正14】
【補正対象書類名】図面
【補正対象項目名】図7A
【補正方法】変更
【補正の内容】
【図7A】
【手続補正15】
【補正対象書類名】図面
【補正対象項目名】図7B
【補正方法】変更
【補正の内容】
【図7B】
【手続補正16】
【補正対象書類名】図面
【補正対象項目名】図7C
【補正方法】変更
【補正の内容】
【図7C】
【手続補正17】
【補正対象書類名】図面
【補正対象項目名】図7D
【補正方法】変更
【補正の内容】
【図7D】
【手続補正18】
【補正対象書類名】図面
【補正対象項目名】図7E
【補正方法】変更
【補正の内容】
【図7E】
【手続補正19】
【補正対象書類名】図面
【補正対象項目名】図8
【補正方法】変更
【補正の内容】
【図8】
【手続補正20】
【補正対象書類名】図面
【補正対象項目名】図9A
【補正方法】変更
【補正の内容】
【図9A】
【手続補正21】
【補正対象書類名】図面
【補正対象項目名】図9B
【補正方法】変更
【補正の内容】
【図9B】
【手続補正22】
【補正対象書類名】図面
【補正対象項目名】図10
【補正方法】変更
【補正の内容】
【図10】
【手続補正23】
【補正対象書類名】図面
【補正対象項目名】図11
【補正方法】変更
【補正の内容】
【図11】
【手続補正24】
【補正対象書類名】図面
【補正対象項目名】図12
【補正方法】変更
【補正の内容】
【図12】
【手続補正25】
【補正対象書類名】図面
【補正対象項目名】図13
【補正方法】変更
【補正の内容】
【図13】
【手続補正26】
【補正対象書類名】図面
【補正対象項目名】図14
【補正方法】変更
【補正の内容】
【図14】
【手続補正27】
【補正対象書類名】図面
【補正対象項目名】図15
【補正方法】変更
【補正の内容】
【図15】
【手続補正28】
【補正対象書類名】図面
【補正対象項目名】図16
【補正方法】変更
【補正の内容】
【図16】
【手続補正29】
【補正対象書類名】図面
【補正対象項目名】図17
【補正方法】変更
【補正の内容】
【図17】
【手続補正30】
【補正対象書類名】図面
【補正対象項目名】図18
【補正方法】変更
【補正の内容】
【図18】
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06F 17/50 638 C12N 15/00 ZNAA (72)発明者 フェルドマン, リチャード, ジェー. アメリカ合衆国 20855−1019 メリーラ ンド, ダーウッド, ミル クリーク ドライヴ 17800 Fターム(参考) 4B024 AA01 AA11 BA80 CA05 HA01 4H006 AA02 AC90 4H045 AA10 AA20 BA17 CA10 CA20 CA30 CA40 CA50 EA50 5B046 AA00

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】 所定の遺伝子内の標的DNA配列と選択的に結合するリンカ
    ー配列により連結される多ZFドメインを有するDBPの設計方法であって、前
    記ZFドメインの各々が次式: A1XCX2-4CA2A3XFXZ3XXZ2LXZ1HX3-5H を、そして前記リンカーの各々が次式: A4A5X0-2EA6P (式中、(i)Xはあらゆるアミノ酸であり、(ii)X2-4は2〜4アミノ酸
    長のペプチドであり、(iii)X3-5は3〜5アミノ酸長のペプチドであり、
    (iv)X0-2は0〜2アミノ酸長のペプチドであり、(iv)A1はフェニルア
    ラニンおよびチロシンから成る群から選択され、(v)A2はグリシンおよびア
    スパラギン酸から成る群から選択され、(vi)A3はリシンおよびアルギニン
    から成る群から選択され、(vii)A4はトレオニンおよびセリンから成る群
    から選択され、(viii)A5はグリシンおよびグルタミン酸から成る群から
    選択され、(ix)A6はリシンおよびアルギニンから成る群から選択され、(
    x)Cはシステインであり、(xi)Fはフェニルアラニンであり、(xii)
    Lはロイシンであり、(xiii)Hはヒスチジンであり、(xiv)Eはグル
    タミン酸であり、(xv)Pはプロリンであり、そして(xvi)Z1、Z2およ
    びZ3は塩基接触アミノ酸である) を有する方法であって、以下の: (a)スクリーニングされるゲノムを決定する工程と、 (b)結合のためのゲノム中の標的DNA配列を選択する工程と、 (c)ZFドメインの数をndに決定する工程と、 (d)nzが以下の関係: nz=3nd を用いて確定される第一のルーチンを用いて、標的DNA配列を、各々のブロッ
    クがnzヌクレオチドを含有するヌクレオチドブロックに分ける工程と、 (e)本明細書の表1〜3に記載したA規則および/またはB規則により、
    標的遺伝子配列の最初の5’ヌクレオチドから数えた場合に工程(d)からの最
    初のヌクレオチドブロックと結合して、ブロック特異的DBPを生じるDBPの
    各ZFドメインに Z1、Z2およびZ3の塩基接触アミノ酸を割り当てて、そして
    各々次式: 結合エネルギート゛メイン=(5x水素結合数)+(2xH2O接触数)+(疎 水性接触数) を用いて確定される結合エネルギー、即ち結合エネルギーの生成物としてのこの
    ような各ブロック特異的DBPの各ZFドメインの「結合エネルギーフ゛ロック」、 DBPの全ZFドメインの「結合エネルギート゛メイン」を計算する工程と、 (f)第二のルーチンを用いて工程(d)からのDBPをさらに分けて、3
    つのZFドメインを有するさらに分割されたDBPを生成する工程と、 (g)第三のルーチンを用いてゲノムに対して工程(f)からのさらに分割
    されたDBPをスクリーニングして、ゲノム中の各々のさらに分割されたDBP
    に関するゲノム中の結合部位の数を確定して、そして以下の式: 結合エネルギー部位 n=(5x水素結合数)+(2xH2O接触数)+(疎
    水性接触数) を用いて、このような部位の各々に関して結合エネルギーを割り当てる工程と、 (h)以下の式: Rb=結合エネルギーフ゛ロック/工程(g)からの全てのさらに分割されたD BPに関する全結合エネルギー部位 nの和 を用いて、工程(e)からの各ヌクレオチドブロック特異的DBPに関して第四
    のルーチンを用いて結合エネルギーの比Rbを計算する工程と、 (i)nd≧4である場合の各々のさらに分割されたDBPに関して工程(
    f)〜(h)を反復する工程と、 (j)nzヌクレオチドを含有する標的DNA配列中の各ヌクレオチドブロ
    ックに関して工程(d)〜(i)を反復する工程と、 (k)工程(h)から得られたRb数値を順位化する工程と、 (l)許容可能なRb値を有するDBPを選択する工程と から成る算法を包含する方法。
  2. 【請求項2】 選択されたDBPが、そのRb数値が標的DNA配列と結合
    する工程(h)の全DBPに関して最高数値であるものである請求項1記載の方
    法。
  3. 【請求項3】 工程(h)で確定されるDBP Rb数値が少なくとも10,00
    0である請求項1記載の方法。
  4. 【請求項4】 ZFドメインの数ndが9である請求項1記載の方法。
  5. 【請求項5】 工程(e)の各ヌクレオチドブロックに関してZ1、Z2およ
    びZ3の塩基接触アミノ酸を割り当てるための規則が規則組Aから選択される請
    求項1記載の方法。
  6. 【請求項6】 工程(e)の各ヌクレオチドブロックに関してZ1、Z2およ
    びZ3の塩基接触アミノ酸を割り当てるための規則が規則組Bから選択される請
    求項1記載の方法。
  7. 【請求項7】 工程(e)の各ヌクレオチドブロックに関してZ1、Z2およ
    びZ3の塩基接触アミノ酸を割り当てるための規則が規則組AおよびBから選択
    される結合である請求項1記載の方法。
  8. 【請求項8】 所定の遺伝子内の標的DNA配列と選択的に結合するリンカ
    ー配列により連結される多ZFドメインを有するDBPを設計するためのコンピ
    ューターシステムであって、前記ZFドメインの各々が次式: A1XCX2-4CA2A3XFXZ3XXZ2LXZ1HX3-5H を、そして前記リンカーの各々が次式: A4A5X0-2EA6P (式中、(i)Xはあらゆるアミノ酸であり、(ii)X2-4は2〜4アミノ酸
    長のペプチドであり、(iii)X3-5は3〜5アミノ酸長のペプチドであり、
    (iv)X0-2は0〜2アミノ酸長のペプチドであり、(iv)A1はフェニルア
    ラニンおよびチロシンから成る群から選択され、(v)A2はグリシンおよびア
    スパラギン酸から成る群から選択され、(vi)A3はリシンおよびアルギニン
    から成る群から選択され、(vii)A4はトレオニンおよびセリンから成る群
    から選択され、(viii)A5はグリシンおよびグルタミン酸から成る群から
    選択され、(ix)A6はリシンおよびアルギニンから成る群から選択され、(
    x)Cはシステインであり、(xi)Fはフェニルアラニンであり、(xii)
    Lはロイシンであり、(xiii)Hはヒスチジンであり、(xiv)Eはグル
    タミン酸であり、(xv)Pはプロリンであり、そして(xvi)Z1、Z2およ
    びZ3は塩基接触アミノ酸である) を有する方法であって、以下の: (a)スクリーニングされるゲノムを決定する工程と、 (b)結合のためのゲノム中の標的DNA配列を選択する工程と、 (c)ZFドメインの数をndに決定する工程と、 (d)nzが以下の関係: nz=3nd を用いて確定される第一のルーチンを用いて、標的DNA配列を、各々のブロッ
    クがnzヌクレオチドを含有するヌクレオチドブロックに分ける工程と、 (e)本明細書の表1〜3に記載したA規則および/またはB規則により、
    標的遺伝子配列の最初の5’ヌクレオチドから数えた場合に工程(d)からの最
    初のヌクレオチドブロックと結合して、ブロック特異的DBPを生じるDBPの
    各ZFドメインに Z1、Z2およびZ3の塩基接触アミノ酸を割り当てて、そして
    各々次式: 結合エネルギート゛メイン=(5x水素結合数)+(2xH2O接触数)+(疎 水性接触数) を用いて確定される結合エネルギー、即ち結合エネルギーの生成物としてのこの
    ような各ブロック特異的DBPの各ZFドメインの「結合エネルギーフ゛ロック」、 DBPの全ZFドメインの「結合エネルギート゛メイン」を計算する工程と、 (f)第二のルーチンを用いて工程(d)からのDBPをさらに分けて、3
    つのZFドメインを有するさらに分割されたDBPを生成する工程と、 (g)第三のルーチンを用いてゲノムに対して工程(f)からのさらに分割
    されたDBPをスクリーニングして、ゲノム中の各々のさらに分割されたDBP
    に関するゲノム中の結合部位の数を確定して、そして以下の式: 結合エネルギー部位 n=(5x水素結合数)+(2xH2O接触数)+(疎
    水性接触数) を用いて、このような部位の各々に関して結合エネルギーを割り当てる工程と、 (h)以下の式: Rb=結合エネルギーフ゛ロック/工程(g)からの全てのさらに分割されたD BPに関する全結合エネルギー部位 nの和 を用いて、工程(e)からの各ヌクレオチドブロック特異的DBPに関して第四
    のルーチンを用いて結合エネルギーの比Rbを計算する工程と、 (i)nd≧4である場合の各々のさらに分割されたDBPに関して工程(
    f)〜(h)を反復する工程と、 (j)nzヌクレオチドを含有する標的DNA配列中の各ヌクレオチドブロ
    ックに関して工程(d)〜(i)を反復する工程と、 (k)工程(h)から得られたRb数値を順位化する工程と、 (l)許容可能なRb値を有するDBPを選択する工程と から成る算法を含む設計手段を包含するコンピューターシステム。
  9. 【請求項9】 選択されたDBPが、そのRb数値が標的DNA配列と結合
    する工程(h)の全DBPに関して最高数値であるものである請求項8記載のコ
    ンピューターシステム。
  10. 【請求項10】 工程(h)で確定されるDBP Rb数値が少なくとも10,
    000である請求項8記載のコンピューターシステム。
  11. 【請求項11】 ZFドメインの数ndが9である請求項8記載のコンピュ
    ーターシステム。
  12. 【請求項12】 工程(e)の各ヌクレオチドブロックに関してZ1、Z2
    よびZ3の塩基接触アミノ酸を割り当てるための規則が規則組Aから選択される
    請求項8記載のコンピューターシステム。
  13. 【請求項13】 工程(e)の各ヌクレオチドブロックに関してZ1、Z2
    よびZ3の塩基接触アミノ酸を割り当てるための規則が規則組Bから選択される
    請求項8記載のコンピューターシステム。
  14. 【請求項14】 工程(e)の各ヌクレオチドブロックに関してZ1、Z2
    よびZ3の塩基接触アミノ酸を割り当てるための規則が規則組AおよびBから選
    択される結合である請求項8記載のコンピューターシステム。
JP2000532426A 1998-02-20 1999-02-19 ジンクフィンガークラスのdna結合タンパク質の設計方法 Pending JP2003502007A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US7546698P 1998-02-20 1998-02-20
US60/075,466 1998-02-20
PCT/US1999/003692 WO1999042474A2 (en) 1998-02-20 1999-02-19 Method for designing dna-binding proteins of the zinc-finger class

Publications (1)

Publication Number Publication Date
JP2003502007A true JP2003502007A (ja) 2003-01-21

Family

ID=22125943

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000532426A Pending JP2003502007A (ja) 1998-02-20 1999-02-19 ジンクフィンガークラスのdna結合タンパク質の設計方法

Country Status (8)

Country Link
US (1) US6205404B1 (ja)
EP (1) EP1062227A2 (ja)
JP (1) JP2003502007A (ja)
KR (1) KR20010041088A (ja)
AU (1) AU758728B2 (ja)
CA (1) CA2321088A1 (ja)
IL (1) IL137952A0 (ja)
WO (1) WO1999042474A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005529158A (ja) * 2002-05-28 2005-09-29 ザ・トラスティーズ・オブ・ザ・ユニバーシティ・オブ・ペンシルベニア 両親媒性ポリマーのコンピュータ分析および設計のための方法、システムおよびコンピュータプログラム製品

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9824544D0 (en) 1998-11-09 1999-01-06 Medical Res Council Screening system
USRE45795E1 (en) 1994-08-20 2015-11-10 Gendaq, Ltd. Binding proteins for recognition of DNA
GB9710809D0 (en) 1997-05-23 1997-07-23 Medical Res Council Nucleic acid binding proteins
US6410248B1 (en) 1998-01-30 2002-06-25 Massachusetts Institute Of Technology General strategy for selecting high-affinity zinc finger proteins for diverse DNA target sites
AU746454B2 (en) 1998-03-02 2002-05-02 Massachusetts Institute Of Technology Poly zinc finger proteins with improved linkers
JP2002506640A (ja) 1998-03-17 2002-03-05 ジェンダック・リミテッド 核酸結合タンパク質
US6534261B1 (en) 1999-01-12 2003-03-18 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
GB2360285B (en) * 1999-01-12 2002-02-27 Sangamo Biosciences Inc Selection of sites for targeting by zinc finger proteins and methods of designing zinc finger proteins to bind to preselected sites
US7070934B2 (en) 1999-01-12 2006-07-04 Sangamo Biosciences, Inc. Ligand-controlled regulation of endogenous gene expression
US6453242B1 (en) 1999-01-12 2002-09-17 Sangamo Biosciences, Inc. Selection of sites for targeting by zinc finger proteins and methods of designing zinc finger proteins to bind to preselected sites
US7013219B2 (en) 1999-01-12 2006-03-14 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
US6599692B1 (en) 1999-09-14 2003-07-29 Sangamo Bioscience, Inc. Functional genomics using zinc finger proteins
US7030215B2 (en) 1999-03-24 2006-04-18 Sangamo Biosciences, Inc. Position dependent recognition of GNN nucleotide triplets by zinc fingers
US6794136B1 (en) 2000-11-20 2004-09-21 Sangamo Biosciences, Inc. Iterative optimization in the design of binding proteins
US20030104526A1 (en) 1999-03-24 2003-06-05 Qiang Liu Position dependent recognition of GNN nucleotide triplets by zinc fingers
ATE309536T1 (de) 1999-12-06 2005-11-15 Sangamo Biosciences Inc Methoden zur verwendung von randomisierten zinkfingerprotein-bibliotheken zur identifizierung von genfunktionen
CA2398155C (en) * 2000-01-24 2011-07-19 Sangamo Biosciences, Inc. Methods and compositions for linking binding domains in nucleic acid binding proteins
AU2001278496A1 (en) * 2000-07-21 2002-02-05 Syngenta Participations Ag Zinc finger domain recognition code and uses thereof
US20020061510A1 (en) * 2000-10-16 2002-05-23 Jonathan Miller Method and system for designing proteins and protein backbone configurations
US7026462B2 (en) 2000-12-07 2006-04-11 Sangamo Biosciences, Inc. Regulation of angiogenesis with zinc finger proteins
US7067317B2 (en) 2000-12-07 2006-06-27 Sangamo Biosciences, Inc. Regulation of angiogenesis with zinc finger proteins
EP1353941B1 (en) 2001-01-22 2013-03-13 Sangamo BioSciences, Inc. Modified zinc finger binding proteins
US7947469B2 (en) 2001-01-22 2011-05-24 Gendaq, Ltd. Modulation of HIV infection
US20040224385A1 (en) * 2001-08-20 2004-11-11 Barbas Carlos F Zinc finger binding domains for cnn
US7262054B2 (en) 2002-01-22 2007-08-28 Sangamo Biosciences, Inc. Zinc finger proteins for DNA binding and gene regulation in plants
US7361635B2 (en) 2002-08-29 2008-04-22 Sangamo Biosciences, Inc. Simultaneous modulation of multiple genes
EP3878961A1 (en) 2017-06-06 2021-09-15 Zymergen, Inc. A htp genomic engineering platform for improving escherichia coli

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5096815A (en) * 1989-01-06 1992-03-17 Protein Engineering Corporation Generation and selection of novel dna-binding proteins and polypeptides
US5331573A (en) * 1990-12-14 1994-07-19 Balaji Vitukudi N Method of design of compounds that mimic conformational features of selected peptides
AU5445296A (en) * 1995-04-12 1996-10-30 Cheng Cheng Methods for preparing dna-binding proteins

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005529158A (ja) * 2002-05-28 2005-09-29 ザ・トラスティーズ・オブ・ザ・ユニバーシティ・オブ・ペンシルベニア 両親媒性ポリマーのコンピュータ分析および設計のための方法、システムおよびコンピュータプログラム製品

Also Published As

Publication number Publication date
EP1062227A2 (en) 2000-12-27
AU758728B2 (en) 2003-03-27
US6205404B1 (en) 2001-03-20
WO1999042474A3 (en) 1999-10-21
AU2871199A (en) 1999-09-06
CA2321088A1 (en) 1999-08-26
KR20010041088A (ko) 2001-05-15
WO1999042474A2 (en) 1999-08-26
IL137952A0 (en) 2001-10-31

Similar Documents

Publication Publication Date Title
JP2003502007A (ja) ジンクフィンガークラスのdna結合タンパク質の設計方法
Cheng et al. Recognition of nucleic acid bases and base-pairs by hydrogen bonding to amino acid side-chains
Beamer et al. Refined 1.8 Å crystal structure of the λ repressor-operator complex
Luscombe et al. Protein–DNA interactions: amino acid conservation and the effects of mutations on binding specificity
Elrod-Erickson et al. High-resolution structures of variant Zif268–DNA complexes: implications for understanding zinc finger–DNA recognition
CA2322700C (en) Selection of sites for targeting by zinc finger proteins and methods of designing zinc finger proteins to binds to preselected sites
Choo et al. Selection of DNA binding sites for zinc fingers using rationally randomized DNA reveals coded interactions.
Gilligan et al. Fugu and human sequence comparison identifies novel human genes and conserved non-coding sequences
JPS58130000A (ja) HLA型判定法とそれに使用するcDNAプロ−ブ
Martin et al. Human GABABR genomic structure: evidence for splice variants in GABABR1 but not GABABR2
WO2007008951A1 (en) Compositions and methods for design of non-immunogenic proteins
Wei et al. Inhibition of nutlin-resistant HDM2 mutants by stapled peptides
Dlakić et al. DNA sequence-dependent folding determines the divergence in binding specificities between Maf and other bZIP proteins
McCormack et al. Mutational screen identifies critical amino acid residues of β-actin mediating interaction between its folding intermediates and eukaryotic cytosolic chaperonin CCT
Worrall The 2001 PTO utility examination guidelines and DNA patents
Komazin-Meredith et al. The human cytomegalovirus UL44 C clamp wraps around DNA
Imanishi et al. Design of novel zinc finger proteins: towards artificial control of specific gene expression
JP2005512161A (ja) ペプチドおよびタンパク質の立体配座アンサンブルの列挙およびリガンド親和性分析のためのコンピュータベースのストラテジー
Nachman et al. Conformational determinants of phosphotyrosine peptides complexed with the Src SH2 domain
Desai et al. Heterogeneous distribution of genetic mutations in myosin binding protein-C paralogs
Kim et al. Analysis of indel variations in the human disease-associated genes CDKN2AIP, WDR66, USP20 and OR7C2 in a Korean population
Celis et al. Comprehensive, human cellular protein databases and their implication for the study of genome organization and function
CN113151288B (zh) 突变的HoxA10基因及应用
Moran et al. Structural features of the full-length adaptor protein GADS in solution determined using small-angle X-ray scattering
Karyagina et al. Analysis of conserved hydrophobic cores in proteins and supramolecular complexes