JP2002510966A - 自動蛋白質デザインのための装置および方法 - Google Patents

自動蛋白質デザインのための装置および方法

Info

Publication number
JP2002510966A
JP2002510966A JP54410998A JP54410998A JP2002510966A JP 2002510966 A JP2002510966 A JP 2002510966A JP 54410998 A JP54410998 A JP 54410998A JP 54410998 A JP54410998 A JP 54410998A JP 2002510966 A JP2002510966 A JP 2002510966A
Authority
JP
Japan
Prior art keywords
protein
sequence
rotamers
residues
rotamer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
JP54410998A
Other languages
English (en)
Inventor
マヨ,スティーブン
ダハイヤット,バシル・アイ
ゴードン,ディ・ベンジャミン
ストリート,アーサー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
California Institute of Technology CalTech
Original Assignee
California Institute of Technology CalTech
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by California Institute of Technology CalTech filed Critical California Institute of Technology CalTech
Publication of JP2002510966A publication Critical patent/JP2002510966A/ja
Ceased legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1089Design, preparation, screening or analysis of libraries using computer algorithms
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • C07K1/003General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length by transforming the C-terminal amino acid to amides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/001Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof by chemical synthesis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/20Protein or domain folding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/50Mutagenesis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Theoretical Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Medical Informatics (AREA)
  • Zoology (AREA)
  • Evolutionary Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Peptides Or Proteins (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 本発明は、定量的蛋白質デザインおよび最適化のための装置および方法に関する。

Description

【発明の詳細な説明】 自動蛋白質デザインのための装置および方法 本出願は1997年4月11日に出願された米国特許出願第60/043,4 64号、1997年8月4日に出願された第60/054,678号および19 97年10月3日に出願された60/061,097号の継続出願である。 発明の分野 本発明は定量的蛋白質デザインおよび最適化のための装置および方法に関する 。 発明の背景 ドォノボ(de novo)蛋白質のデザインは最近かなり注目を受けており、新規 配列を持つ安定でよく折り畳まれた蛋白質を生産する目標に向けてかなり進歩が なされてきた。蛋白質をデザインする努力は、配列中の疎水性および親水性残基 のパターン、塩ブリッジおよび水素結合、およびアミノ酸の二次構造選択性のご とき、蛋白質構造を決定する物理的特性の知識に頼るものである。これらの原理 を適用する種々のアプローチが試みられてきた。例えば、天然様配列を持つα− ラセンおよびβ−シート蛋白質の構築は、標的折り畳みにおける各位置で必要な 残基を個々に選択することによって試みられた(Hechtら、Science,249:884-891 (1990);Quinnら、Proc.Natl.Acad.Sci USA 91:8747-8751(1994))。あ るいは、ミニマリストアプローチを用いて、ラセン蛋白質をデザインし、ここに 、折り畳まれた構造と合致すると考えられる最も単純な可能な配列が創製され(R eganら、Science,241:976-978(1988);DeGradoら、Science,243:622-628(19 89);Handelら、Science,261:879-885(1993))、種々の程度成功している。配列 の疎水性で極性(HP)のパターンに頼る実験方法が開発され、そこでは、4つ のラセン束についての正しいパターンを持つ配列のライブラリーが、ランダム突 然変異誘発によって創製された(Kamtekarら、Science,262:1680-1685(1993)) 。非ドォノボ(non de novo)アプローチの中で、天然に生じる蛋白質 のドメインは修飾され一緒にカップリングされて、所望の三次組織を達成する(P essiら、Nature,362:367-369(1993);Pomerantzら、Science,267:93-96(1995)) 。 正しい二次構造および総じての三次組織は前記技術のうちいくつかによって達 成されたが、多くのデザインされた蛋白質は天然蛋白質の構造特異性を欠くよう である。折り畳まれた蛋白質におけるアミノ酸の相補的幾何学的配置はこの特異 性の根本であり、配列中にコードされている。 いくつかのグループは系統的で定量的方法を、一般的デザインアルゴリズムを 開発する目標を持つ蛋白質デザインに適用し、実験的にテストしてきた(Helling aら、J.Mol.Biol.222:763-785(1991);Hurleyら、J.Mol.Biol.224:1143-1 154(1992);Desjartaislら、Protein Science 4:2006-2018(1995);Harburyら、 Proc.Natl.Acad.Sci USA 92:8408-8412(1995);Klembaら、Nat.Struc.Biol .2:368-373(1995);Nautiyalら、Biochemistry 34:11645-11651(1995);Betzo ら、Biochemistry 35:6955-6962(1996);Dahiyatら、Protein Science 5:895-90 3(1996);Jones,Protein Science 3:567-574(1994);Konoiら、Proteins:Struc ture,Function and Genetics 19:244-255(1994))。これらのアルゴリズムは、 考慮下にある原子配列を明示的にモデル化することによって、側鎖の空間的位置 決定および立体的相補性を考慮する。今日、かかる技術は、典型的には、蛋白質 のコアをデザインすることに焦点を当て、配列をファンデルワールスおよび時々 は疎水性溶媒和ポテンシャルでもって評価してきた。 加えて、多くのデザインアプローチの定量的性質が改良された二次生成蛋白質 の開発を妨げてきた。何故ならば、過去のデザインの成功および失敗から学ぶ客 観的な方法がないからである。 従って、汎用コンピューターで実行される客観的定量的デザイン技術蛋白質の コンピューターデザインおよびその最適化を提供するのが本発明の目的である。 発明の概要 前記概説の目的で、本発明は、プログラムの制御下でコンピューターによって 実行される方法を提供し、該コンピューターはプログラムを貯蔵するメモリーを 含む。該方法は可変残基位置を持つ蛋白質骨格構造を受け取り、可変残基位置の 各々につき可能なロタマーの群を確立し、ここに、少なくとも1つの可変残基は 少なくとも2つの異なるアミノ酸側鎖からのロタマーを有し、次いで、ロタマー の各々と蛋白質骨格構造の残りの全てまたは一部との相互作用を分析して最適化 蛋白質配列の組を創製する工程を含む。該方法は、さらに、各可変蛋白質をコア 、表面または境界残基いずれかとして分類することを含む。該分析工程は、デッ ドエンド除去(DEE)計算を含み得る。一般に、該分析工程はファンデルワー ルスポテンシャルスコアリング機能、水素結合ポテンシャルスコアリング機能、 原子溶媒和スコアリング機能、二次構造性質スコアリング機能および静電スコア リング機能よりなる群から選択される少なくとも1つのスコアリング機能の使用 を含む。該方法は、さらに、全体的最適蛋白質配列からのさらなる最適配列のラ ンク付けリストを生成させることを含む。順序付けリストからの蛋白質配列のい くつかまたは全てをテストして、可能なエネルギーテスト結果を得ることができ る。 さらなる態様において、本発明は、本発明の方法によって創製された蛋白質配 列をコードする核酸配列、および該核酸を含有する発現ベクターおよび宿主細胞 を提供する。 さらなる態様において、本発明は、蛋白質骨格モデルの残基部分用の可能なロ タマーの群を相関させるための側鎖モジュール、および該ロタマーの各々と該蛋 白質の残りの全てまたは一部との相互作用を分析して、最適化蛋白質配列の組を 得るためのランキングモジュールを含む、特異的に機能するようにコンピュータ ーに指令するためのコンピューターリーダブルメモリーを提供する。該メモリー は、さらに、ポテンシャルエネルギーテスト結果および理論的ポテンシャルエネ ルギーデータの間の対応を評価するための評価モジュールをさらに含むことがで きる。 図面の簡単な説明 図1は、本発明の実施例に従って構成した汎用コンピューターを示す。 図2は、本発明の実施例に関連するプロセッシング工程を示す。 図3は、本発明の実施例に関するランキングモジュールに関連するプロセッシ ング工程を示す。いずれかのDEE工程後に、以前のDEE工程のうちのいずれ か1つを反復することができる。加えて、該DEE工程のうちのいずれか1つを 排除することができる;例えば、オリジナルの単一DEE(工程74)は実行す る必要がない。 図4は、蛋白質デザイン自動化サイクルを示す。 図5は、コイルドコイルのラセンホイール流れ図である。1つのヘプタド反復 が、ラセンの主要軸から下方に示される。aおよびd位置は分子の溶媒が接近で きないコアを規定する(Cohen & Parry,1990,Proteins,Structure,Function and Genetics 7:1-15)。 図6Aおよび6Bは、実験Tmに対するシミュレーションコスト機能の比較を 示す。図6Aは最初のコスト機能を示し、これは8つのPDAペプチドについて のファンデルワールス項のみを含有する。図6Bは、QSAR分析に由来する原 子溶媒和パラメーターによって重みを付けられた極性および非極性表面積項を含 有する改良されたコスト機能を示す:16cal/モル/Å2が疎水性表面埋も れに好都合である。 図7は、シミュレーションモジュール対λリプレッサー突然変異体の組合せ活 性スコアによって示されたエネルギーのランク相関を示す(Limら、J.Mol.Bio l.219:359−376(1991);Hellingaら、Proc.Natl.Acad.Sci.USA 91:5803-580 7(1994))。 図8は、Zif268の第2亜鉛フィンガーと整列させたpda8dの配列を 示す。箱の位置は配列選択アルゴリズムを用いて設計した。残基33−60から のPDB記録1zaaの座標(Paveletchら、Science 252:809-817(1991))を構造 鋳型として使用した。我々のナンバリングでは、位置1は1zaa位置33に対 応する。 図9Aおよび9Bは、実施例3からのpda8dのNMRスペクトルおよび溶 液二次構造を示す。図9Aは、pda8dのTOCSY Hα−HNフィンガー プリントである。図9Bは、pda8dのNMR NOE結合性である。棒は明 確な結合性を表し、順次の結合の棒の太さは共鳴の強度の指標である。 図10Aおよび10Bは、α90、α85、α70およびα107の二次構造 含有量および熱的安定性を示す。図10Aは遠紫外スペクトルを示す(円二色性 )。図10BはCDによってモニターされた熱的変性を示す。 図11は、Zif268の第2亜鉛フィンガーと整列させた実施例5のFSD −1の配列を示す。図の頂部の棒は残基位置の分類を示し、実線棒はコア位置を 示し、ハッチングを施した棒は境界位置を示し、塗っていない棒は表面位置を示 す。整列はZif268の対応する骨格鋳型位置にFSD−1をマッチさせる。 FSD−1およびZif268の間の6つの同一位置(21%)のうち、4つが 埋もれている(Ile7、Phe12、Leu18およびI1e22)。Zif 268の亜鉛結合残基は箱に入れる。モンテカルロシミュレートアニーリングプ ロトコルを用いて決定された代表的な非最適配列溶液をそれらのランクと共に示 す。垂直線はFSD−1との同一性を示す。図の底部の記号は、頂部1000配 列を横切って計算された各残基位置についての配列保存性の程度を示す;塗りつ ぶした丸は99%を超える保存を示し、半分塗りつぶした丸は90および99% の間の保存を示し、塗りつぶしていない丸は50および90%の間の保存を示し 、記号の不存在は50%未満の保存を示す。各位置における最高の出現を持つア ミノ酸を選択することによって決定されたコンセンサス配列はFSD−1の配列 と同一である。 図12は、スピード強化を構築するのに使用される最小および最大量(方程式 24ないし27で定義)の模式図である。/iujvmb対を見出すために、および 極値の比較に、最小および最大を直接使用する。矢印で示した量の間の差異を用 いて、qrsおよびquvメトリックスを構築する。 図13A、13B、13C、13D、13Eおよび13Fは、方程式18およ び19の埋もれたおよび露出された面積を計算するに関与する面積を示す。ダッ シュ線の箱印は蛋白質鋳型であり、より肉太の実線は3つの異なる残基位置にお ける3つのロタマーに対応し、肉太度がより低い実線は表面積に対応する。a) 重線によって示される。方程式18によって計算された埋もれた面積は(c)で 示された鋳型によって埋もれた面積に、(f)で表されたロタマー間で埋もれた 面積をs倍したものを加えたものである。計数逓減率sは(f)における二重線 によって示された過剰計数を説明する。方程式19によって計算された露出面積 は、(b)で表された鋳型の存在下のものであり、(f)で表されたロタマーの 間で埋もれた面積をs倍したものを引いたものである。 発明の詳細な説明 本発明は、所望の構造についての最適配列を求める、「逆蛋白質折り畳み」ア プローチを用いる、アミノ酸配列の定量的デザインおよび最適化に指向される。 逆折り畳みは蛋白質デザインに同様であり、それは所望の構造に折り畳まれる配 列または配列の組を求める。これらのアプローチは、所与の配列によって採られ る構造を予測するのを試みる「蛋白質結合」アプローチと対照することができる 。 本発明の一般的な好ましいアプローチは以下の通りであるが、別の具体例は後 記する。既知の蛋白質構造を出発点として使用する。対で、最適化すべき残基を 同定し、これは完全配列またはそのサブセットであり得る。対で、変化させるベ きいずれかの位置の側鎖を除去する。蛋白質骨格および残りの側鎖よりなる得ら れた構造は鋳型と呼ばれる。次いで、各可変残基位置を好ましくはコア残基、表 面残基、または境界残基として分類され;各分類は該位置についての可能なアミ ノ酸残基のサブセットを定義する(例えば、コア残基は一般に疎水性残基のセッ トから選択され、表面残基は一般に親水性残基から選択され、および境界残基は いずれかであり得る)。各アミノ酸はロタマーと呼ばれる、各側鎖全ての許され るコンフォーマーの区別されるセットによって表すことができる。かくして、骨 格についての最適配列に到達するには、ロタマーの可能な配列をスクリーニング しなければならず、ここに、各骨格位置は、全てのその可能なロタマー状態にお ける各アミノ酸、またはアミノ酸のサブセット、およびかくしてロタマーのサブ セットいずれかによって占めることができる。 次いで、相互作用の2セットを各々の位置において各ロタマーにつき計算する :ロタマー側鎖の骨格の全てまたは一部との相互作用(「シングル」エネルギー 、ロタマー/鋳型またはロタマー/骨格エネルギーとも呼ばれる)、およびロタ マー側鎖と各々の他の位置または他の位置のサブセットにおける全ての他の可能 なロタマーとの相互作用(「ダブル」エネルギー、ロタマー/ロタマーエネルギ ーとも呼ばれる)。これらの相互作用の各々のエネルギーは、種々のスコアリン グ機能の使用を介して計算され、これはファンデルワールス力のエネルギー、水 素結合のエネルギー、二次構造傾向のエネルギー、表面積溶媒和のエネルギーお よび静電エネルギーを含む。従って、骨格および他のロタマーに関する、各ロタ マー相互作用の合計エネルギーが計算され、マトリックス形態で貯蔵される。 ロタマーセットの区別される性質はテストすべきロタマー配列の数の単純な計 算を可能とする。位置当たりm個の可能なロタマーの長さnの骨格はmn個の可能 なロタマー配列を有し、これは配列の長さと共に指数関数的に増加し、計算をリ アルタイムでは扱いにくいまたは不可能とする数である。従って、この組合せサ ーチ問題を解決するには、「デッドエンド除去」(DEE)計算が好ましい。D EE計算は、もし最初のロタマーの最悪の合計相互作用が依然として第2ロタマ ーの最良合計相互作用よりも良好であるならば、第2ロタマーは全体的最適解決 の一部とはなり得ないという事実に基づいている。全てのロタマーのエネルギー は既に計算されているので、DEEアプローチはロタマーをテストし除去するた めに配列長さにわたっての合計を必要とするに過ぎず、これは、計算をかなりス ピードアップさせる。DEEを再実行してロタマーの対またはロタマーの組合せ を比較することができ、これは、結局は全体的最適エネルギーを表す単一配列の 決定となる。 一旦全体的解決が見出されたならば、モンテカルロサーチを行って、DEE解 決の隣の配列のランク付けリストを得ることができる。DEE解決で出発し、ラ ンダムな位置を他のロタマーに変え、新しい配列エネルギーを計算する。もし新 しい配列が許容の基準に適合すると、それをもう1つのジャンプ用の出発点とし て用いる。所定数のジャンプの後、配列のランク付けリストが得られる。 次いで、1以上の蛋白質配列を物理的に創製させ、続いて実験的にテストする ことによって、結果が実験的に証明することができる。次いで、テストから得ら れた情報を分析にフィードバックして、要すれば手法を修正することができる。 かくして、本発明は、蛋白質をデザインするコンピューター支援方法を提供す る。該方法は、可変側鎖位置を持つ蛋白質骨格構造を供し、次いで、残基位置の 各々につき可能なロタマーの群を確立することを含む。本明細書で用いる骨格ま たは鋳型は、骨格原子およびいずれの固定された側鎖も含む。蛋白質骨格および 可能なロタマーの間の相互作用、および可能なロタマーの対の間の相互作用を次 いで加工して、最適化蛋白質配列のセット、好ましくは単一全体的最適を得、次 いでこれを用いて他の関連配列を創製することができる。 図1は本発明の具体例に関する自動蛋白質デザインアプローチ20を示す。装 置20はメモリー24およびバス28を通じてのインプット/アウトプットデバ イスセット(例えば、キイボード、マウス、モニター、プリンター等)26と連 絡する中央プロセッシングユニット22を含む。中央プロセッシングユニット2 2、メモリー24、インプット/アウトプットデバイス26、およびバス28の 間の一般的相互作用は当該分野で知られている。本発明はメモリー24に貯蔵さ れた自動蛋白質デザインプログラム30に指向される。 自動蛋白質デザインプログラム30は側鎖モジュール32で実行することがで きる。後記で詳細に記載するごとく、側鎖モジュールは選択された蛋白質骨格構 造についての可能なロタマーの群を確立する。蛋白質デザインプログラム30は ランキングモジュール34で実行することもできる。後記で詳細に記載するごと く、ランキングモジュール34は、ロタマーと蛋白質骨格構造との間の相互作用 を分析して、最適化蛋白質配列を創製する。また、蛋白質デザインプログラム3 0は、最適化蛋白質配列に関して、サーチ、例えば後記するモンテカルロサーチ を実行するサーチモジュール36を含むこともできる。最後に、評価モジュール 38を用いて、さらに後記する誘導された蛋白質に関連する物理的パラメーター を評価することもできる。 また、メモリー24はインプット/アウトプットデバイス26を介してユーザ ーによってダウンロードされた、蛋白質後記構造40を貯蔵する。また、メモリ ー24は側鎖モジュール32によって誘導された可能なロタマーに関する情報を 貯蔵する。加えて、メモリー24はランキングモジュール34によって創製され た蛋白質配列44を貯蔵する。蛋白質配列44はインプット/アウトプットデバ イス26への出力として通過させることもできる。 自動蛋白質デザイン装置20の操作は、図2を参照してより十分に認識される 。図2は、本発明の方法に関して実行されたプロセッシング工程を示す。後記す るごとく、プロセッシング工程の多くは蛋白質デザインプログラム30によって 実行される。図2に示された第1のプロセッシング工程は蛋白質骨格構造を供す るものである(工程50)。前記したごとく、蛋白質骨格構造は標準的技術を用 いインプット/アウトプットデバイス26を介してダウンロードされる。 蛋白質骨格構造は選択された蛋白質に対応する。本明細書中で「蛋白質」とは 、ペプチド結合によって一緒に連結した少なくとも2個のアミノ酸を意味する。 本明細書で用いるごとく、蛋白質は、蛋白質、オリゴペプチドおよびペプチドを 含む。ペプチジル基は天然に生じるアミノ酸およびペプチド結合、または合成ペ プチドミメティックス構造、すなわち、ペプトイドのごとき「アナログ」を含む ことができる(Simonら、PNAS USA 89(20):9367(1992)参照)。当業者によって認 識されるごとく、アミノ酸は天然に生じるまたは天然に生じないものであり得、 ロタマーのセットが知られている、または生じさせることができるいずれの構造 もアミノ酸として用いることができる。側鎖は(R)または(S)立体配置いず れかであり得る。好ましい具体例において、アミノ酸は(S)またはL−立体配 置である。 選択された蛋白質は、三次元構造が知られている、または創製することができ る、すなわち、蛋白質の各原子につき三次元座標があるいずれの蛋白質でもあり 得る。一般に、これは、X線結品学的技術、NMR技術、de novoモデリング、 相同性モデリング等を用いて決定することができる。一般に、もしX線構造を用 いれば、2Å以上の分解能における構造が好ましいが、必要ではない。 蛋白質は原核生物および真核生物を含めたいずれの生物からのものであっても よく、細菌、菌類、古細菌のごとき好極限性細菌、昆虫、魚類、動物(特に、哺 乳動物、特にヒト)および鳥類からの酵素は全て可能である。 適当な蛋白質は、限定されるものではないが、リガンド、細胞表面受容体、抗 原、抗体、サイトカイン、ホルモンおよび酵素を含めた産業的および医薬蛋白質 を含む。適当なクラスの酵素は限定されるものではないが、プロテアーゼ、カル ボヒドラーゼ、リパーゼのごときヒドロラーゼ;ラセマーゼ、エピメラーゼ、タ ウロメラーゼ、またはムターゼのごときイソメラーゼ;トランスフェラーゼ、キ ナーゼ、オキシドレダクターゼ、およびホスファターゼを含む。適当な酵素はSw iss-Prot酵素データベースにリストされている。 適当な蛋白質骨格は限定されるものではないがBrookhaven National Lab.によ って編集され供給される蛋白質データ中に見出されるものを全て含む。 特に、 「蛋白質」には、酵素ドメイン、結合ドメイン等のごとき機能的ドメ イン、およびターン、ループ等のごときより小さい断片を含めた公知の蛋白質の 断片およびドメインが含まれる。すなわち、蛋白質の一部も同様に使用すること ができる。 一旦蛋白質が選択されたならば、蛋白質骨格構造をコンピューターにインプッ トする。本明細書における「蛋白質骨格構造」または文法的同等物とは、特定の 蛋白質の三次元構造を規定する三次元座標を意味する。(天然に生じる蛋白質の )蛋白質骨格構造を含む構造は、β−炭素に対するα−炭素からのベクターの方 向に沿った、窒素、カルボニル炭素、α−炭素、およびカルボニル酸素である。 コンピューターにインプットされる蛋白質骨格構造は、骨格およびアミノ酸側 鎖双方についての、または丁度骨格についての座標(すなわち、アミノ酸側鎖の 座標は除かれる)いずれかを含む。もし前者を行えば、蛋白質構造の各アミノ酸 の側鎖原子は当該分野で知られているように蛋白質の構造から「奪われる」また は除かれ、「骨格」原子(窒素、カルボニル炭素および酸素、およびα−炭素、 および該窒素およびα−炭素に結合した水素)についての座標のみが残る。 蛋白質構造骨格をインプットした後、構造に含まれていないならば、顕在的水 素を付加する(例えば、構造がX線結晶学によって創製されたならば、水素を付 加しなければならない)。水素付加の後、構造のエネルギー最小化を行って、水 素ならびに他の原子、結合角および結合長さを解放する。好ましい具体例におい て、これは、原子座標位置のコンジュゲート最小化の多数の工程(Mayoら、J.Ph ys.Chem.94:8897(1990))を行って、静電気のないドレイディング力場を最小化 することによって行われる。一般に、約10ないし約250工程が好ましく、約 50が最も好ましい。 蛋白質骨格構造は少なくとも1つの可変残基位置を含有する。当該分野で知ら れているように、蛋白質の残基またはアミノ酸は、蛋白質のN−末端で出発して 順次にナンバリングされる。従って、そのN−末端にメチオニンを有する蛋白質 は、残基またはアミノ酸位置1のメチオニンを有すると言われ、次の残基は2、 3、4等である。各位置において、野性型(すなわち、天然に生じる)蛋白質は 、いずれかの数のロタマーにおいて、少なくとも20個のアミノ酸のうちの1つ を有することができる。本明細書における「可変残基位置」とは、特異的残基ま たはロタマー、一般的には野性型残基またはロタマーとしてデザイン方法で固定 されないデザインすべき蛋白質のアミノ酸位置を意味する。 好ましい具体例において、蛋白質の残基位置の全ては可変である。すなわち、 各々のアミノ酸側鎖は本発明の方法において変更することができる。これは特に より小さい蛋白質で望ましいが、本発明の方法は同様により大きい蛋白質のデザ インを可能とする。このようにしてデザインすることができる蛋白質の長さに理 論的限定はないが、現実的な電算機限界がある。 別の好ましい具体例において、蛋白質の残基位置のうちいくつかのみが可変で あり、残りは「固定されている」。すなわち、それはセット立体配座におけるご とく3次元構造において同定される。いくつかの具体例において、固定された位 置はその元の立体配座で残る(これは、使用されるロタマーライブラリーの特異 的ロタマーに対して相関するものであってもなくてもよい)。別法として、残基 は、例えば、公知の部位特異的突然変異誘発技術が特定の残基は(例えば、蛋白 質分解部位を排除するために、または酵素の基質特異性を変更するのに)望まし いことが示された場合には、残基は非野性型残基として固定することができ、残 基は特定のアミノ酸として固定することができる。別法として、本発明の方法を 用いて、後記するごとく、ドォノボ(de novo)で突然変異を評価することがで きる。別の好ましい具体例において、固定された位置は「浮いている」ものであ ってもよく、その位置におけるアミノ酸は固定されているが、そのアミノ酸の異 なるロタマーがテストされる。この具体例において、可変残基は少なくとも1つ であるか、あるいは残基の合計数の0.1%ないし99.9%のどこかであって よい。かくして、例えば、数個(または1個)の残基のみ、または残基のほとん どを変化させることができ、その間に全ての可能性がある。 好ましい具体例において、固定することができる残基は、限定されるものでは ないが、構造的または生物学的に機能的残基を含む。例えば、酵素の活性部位、 酵素の基質結合部位、結合パートナー用の結合部位(リガンド/受容体、抗原/ 抗体等)、生物学的機能にとって非常に重要であるリン酸化またはグリコシル化 部位のごとき生物学的活性に非常に重要であることが知られている残基、または ジスルフィド架橋、金属結合部位、臨界的水素結合残基、プロリンまたはグリシ ンのごとき骨格の立体配座に非常に重要な残基、パッキング相互作用に非常に重 要な残基のような構造的に重要な残基等を、全て、立体配座を固定し、または単 ーロタマーとして固定し、あるいは「浮かす」ことができる。 同様に、可変残基として選択することができる残基は、蛋白質分解、脱重合化 または凝集部位、免疫応答に導き得るグリコシル化部位、望まない結合活性、望 まないアロステリー、望まない酵素活性のごとき望まない生物学的属性を付与す るが結合の保存等と共に付与するものであり得る。 当業者によって認識されるごとく、本発明の方法は、突然変異体を現実に作成 することなく、または突然変異体を作成するに先立って、「部位特異的突然変異 誘発」標的の電算機テストを可能とする。すなわち、少数の残基が変化する配列 の素早い分析を行って、提案された変化が望ましいものか否かを評価することが できる。加えて、これは公知の蛋白質で、または本明細書に記載したごとくに最 適化した蛋白質で行うことができる。 当業者によって認識されるごとく、より大きい蛋白質のドメインは小さな独立 した蛋白質として実質的にテストすることができる、すなわち、大きな蛋白質の 構造的もしくは機能的ドメインは該蛋白質の残りとの最小相互作用を有すること ができるか、あるいはそれが自律的であるかのごとく実質的に処理することがで きる。この具体例において、ドメインの残基の全てまたは一部は変化し得るもの でよい。 たとえ位置が可変位置として選択されても、本発明の方法は、該可変位置にお ける野性型残基を選択するように、配列を最適化することが可能であろうことに 注意すべきである。これは、一般に、コア残基で頻繁に起こり、表面残基では正 規には起こりにくい。加えて、同様に非野性型アミノ酸として残基を固定するこ とができる。 一旦蛋白質骨格構造が選択されインプットされ、かつ可変残基位置が選択され たならば、可変残基位置の各々についての可能なロタマーの群が確立される。こ の操作は図2の工程52に示す。この工程は側鎖モジュール32を用いて実行す ることができる。本発明の1つの具体例において、側鎖モジュール32は後記す るごとく少なくとも1つのロタマーライブラリー、および選択された蛋白質骨格 構造を該ロタマーライブラリーにおける対応する情報と関係付けるプログラムコ ードを含む。別法として、側鎖モジュール32を省略することができ、選択され た蛋白質骨格構造についての可能なロタマー42はインプット/アウトプットデ バイス26を通じてダウンロードすることができる。 当該分野で知られているように、各アミノ酸側鎖はロタマーと呼ばれる可能な コンフォーマーのセットを有する。引用によってその全てを明示的に一体化させ る、Ponderら、Acad.Press Inc.(London)Ltd.,775-791頁(1987);Dunbrackら 、Struc.Biol.1(5):334-340(1994);Desmetら、Nature 356:539-542(1992)を参 照。かくして、各々のアミノ酸側鎖についての区別されるロタマーのセットを用 いる。ロタマーライブラリーの2つの一般的タイプがある:骨格依存的および骨 格依存的なもの。骨格依存的ロタマーライブラリーは、骨格における残基の位置 に依存して異なるロタマーを可能とし、かくして、例えば、もし位置がαラセン 内にあるならばある種のロイシンロタマーが可能であり、位置がα−ラセン内に ないならば、異なるロイシンロタマーが可能である。骨格非依存的ロタマーラセ ンは各々の位置においてアミノ酸の全てのロタマーを利用する。一般に、骨格非 依存的ライブラリーがコア残基の考慮で好ましい。というのは、コアにおけるフ レキシビリティーは重要だからである。しかしながら、骨格非依存的ライブラリ ーは計算ではより費用がかかり、かくして、表面および境界位置では、 骨格依存的ライブラリーが好ましい。しかしながら、いずれかのタイプのライブ ラリーはいずれかの位置で用いることができる。 加えて、好ましい具体例は、ライブラリーの区別性から生起し得る可能な誤差 を最小化するために、平均値の周りのプラスおよびマイナスの1標準偏差(また はそれ以上)により可能なχ(カイ)角度を広げることによってロタマーライブ ラリーの「微細テューニング」のタイプを有する。これは、特に芳香族残基で重 要であり、コアにおけるフレキシビリティーおよび芳香族環における合成のため の増大した要件のため、疎水性残基でかなり重要であり、他の残基については重 要ではない。かくして、好ましい具体例はMet、ArgおよびLysを除き、 全てのアミノ酸につきχ1およびχ2角を広げる。 ロタマーの数を粗く説明するために、Dunbrack & Karplus骨格−依存的ロタマ ーライブラリーの1つのバージョンにおいて、アラニンは1つのロタマーを有し 、グリシンは1つのロタマーを有し、アルギニンは55のロタマーを有し、スレ オニンは9つのロタマーを有し、リシンは57のロタマーを有し、グルタミン酸 は69のロタマーを有し、アスパラギンは54のロタマーを有し、アスパラギン 酸は27のロタマーを有し、トリプトファンは54のロタマーを有し、チロシン は36のロタマーを有し、システインは9つのロタマーを有し、グルタミンは6 9のロタマーを有し、ヒスチジンは54のロタマーを有し、バリンは9つのロタ マーを有し、イソロイシンは45のロタマーを有し、ロイシンは36のロタマー を有し、メチオニンは21のロタマーを有し、セリンは9つのロタマーを有し、 およびフェニルアラニンは36のロタマーを有する。 一般に、プロリンは一般的には使用されない。というのは、プロリンは所望で あれば含めることができるものの、いずれかの位置につき稀にしか選択されない だろうからである。同様に、好ましい具体例は、所望であればシステインを含め ることができるものの、可能なジスルフィド問題を避けるためのみで、考慮の結 果としてシステインを省略する。 当業者によって認識されるように、全ての食い違い二平面角を持つ他のロタマ ーライブラリーを使用するか創製することができる。 好ましい具体例において、最小、少なくとも1つの可変位置は少なくとも2つ の異なるアミノ酸側鎖からのロタマーを有し、すなわち、配列は構造よりもむし ろ最適化される。 好ましい具体例において、全てのアミノ酸(またはシステイン、グリシンおよ びプロリンを除くアミノ酸の全て)からのロタマーを各可変残基位置で使用し、 すなわち、各可変位置における可能なロタマーの群またはセットは各アミノ酸の 全ての可能なロタマーである。これは、分析のタイプが計算的に費用がかかり得 るにつれて可変位置の数が高くはならない場合に特に好ましい。 好ましい具体例において、各々の可変位置はコア、表面または境界残基位置い ずれかとして分類されるが、ある場合には、後記で説明するごとく、可変位置を グリシンにセットして骨格ひずみを最小化することができる。 本発明に先立っての定量的蛋白質デザインまたは最適化研究はコア残基にほと んど専ら焦点を当ててきたことは理解されるべきである。しかしながら、本発明 は、コア、表面および境界位置を含有する蛋白質をデザインする方法を提供する 。別の具体例は、コアおよび表面残基、コアおよび境界残基、および表面および 境界残基、ならびにコア残基単独(本発明のスコアリング機能を使用)、表面残 基単独、または境界残基単独を含有する蛋白質をデザインする方法を利用する。 コア、表面または境界としての残基位置の分類は当業者に認識されるごとくい くつかの方法で行うことができる。好ましい具体例において、分類は、側鎖を含 み、蛋白質モデリングの分野の当業者の主題評価に基づいて帰属させ、元の蛋白 質骨格構造を介して行う。別法として、好ましい具体例は鋳型Cα原子のみを用 いて計算した溶媒接近可能表面に対するCα−Cβベクトルの向きの評価を利用 する。好ましい具体例において、標的折り畳みのCα原子のみについての溶媒接 近可能表面は、約4ないし約12Å(約6ないし約10Åが好ましく、約8Åが 特に好ましい)のプローブ半径にてConnollyアルゴリズムを用いて創製される。 使用するCα半径は約1.6Åないし約2.3Åであり、約1.8ないし約2. 1Åが好ましく、1.95Åが特に好ましい。残基は、もしa)溶媒接近可能表 面に対するCα−Cβベクトルに沿ったそのCαについての距離が約4−6Åよ り大であり(約5.0Åより大であるのが特に好ましい)、およびb)最も近い 表面点に対するそのCβについての距離が約1.5−3Åより大であれば(約2 . 0Åが特に好ましい)、コア蛋白質として分類される。残りの残基は、もし溶媒 接近可能表面に対するそれらのCα−Cβベクトルに沿ったそれらのCαからの 距離の合計に最も近い表面点に対するそれらのCβからの距離を加えたものが約 2.5−4Å未満であれば(約2.7Å未満が特に好ましい)、表面蛋白質とし て分類される。全ての残りの残基は境界位置として分類される。 一旦各可変位置がそれらのコア、表面または境界として分類されたならば、ア ミノ酸側鎖のセット、かくしてロタマーのセットが各位置に帰属される。すなわ ち、特定の位置においてプログラムが考慮する可能なアミノ酸側鎖のセットが選 択される。引き続いて、一旦可能なアミノ酸側鎖が選択されたならば、特定の位 置において評価されるであろうロタマーのセットが決定することができる。従っ て、コア残基は一般的にアラニン、バリン、イソロイシン、ロイシン、フェニル アラニン、チロシン、トリプトファンおよびメチオニン(ある具体例では、後記 するファンデルワールススコアリング機能についてのαスケーリング因子が低い 場合には、メチオニンは該セットから除かれる)よりなる疎水性残基の群から選 択され、各コア位置についてのロタマーセットはこれらの8つのアミノ酸側鎖に ついてのロタマーを含む(もし骨格非依存的ライブラリーを用いるならば全ての ロタマー、およびもしロタマー依存的骨格を用いるならばサブセット)。同様に 、表面蛋白質は一般にはアラニン、セリン、スレオニン、アスパラギン酸、アス パラギン、グルタミン、グルタミン酸、アルギニン、リシンおよびヒスチジンよ りなる親水性残基の群から選択される。各表面位置についてのロタマーセットは 、かくして、これらの10の残基についてのロタマーを含む。最後に、境界位置 は一般にアラニン、セリン、スレオニン、アスパラギン酸およびアスパラギン、 グルタミン、グルタミン酸、アルギニン、リシン、ヒスチジン、バリン、イソロ イシン、ロイシン、フェニルアラニン、チロシン、トリプトファンおよびメチオ ニンから選択される。かくして、各境界位置についてのロタマーセットは潜在的 にはこれらの17残基についての各々のロタマーを含む(システイン、グリシン およびプロリンは使用されないが、それらは使用できると仮定する)。 かくして、当業者によって認識されるように、計算の数を減少させるにつれて 残基位置を分類する計算上の利益がある。また、コア、境界および表面残基は前 記したものから変化する状況があり得ることに注意すべきである。例えば、ある 状況下では、1以上のアミノ酸は許容されるアミノ酸のセットに付加され、また はそれから差し引かれる。例えば、脱重合するまたはマルチ重合する、あるいは リガンド結合部位を有するいくつかの蛋白質は、疎水性表面残基を含有すること ができる。加えて、ラセンの「キャッピング」またはα−ラセン二極との好都合 な相互作用を可能としない残基は許容される残基のセットから差し引くことがで きる。アミノ酸群のこの修飾は半径ベースに基づいて行われる。 好ましい具体例において、プロリン、システインおよびグリシンは可能なアミ ノ酸側鎖のリストには含まれず、かくして、これらの側鎖についてのロタマーは 使用されない。しかしながら、好ましい具体例において、可変残基位置がφ角( すなわち、1)これまでのアミノ酸のカルボニル炭素、2)現在の残基の窒素原 子、3)現在の残基のα−炭素、および4)現在の残基のカルボニル炭素によっ て定義される二面角が0°より大)を有する場合、該位置はグリシンにセットさ れて骨格歪みを最小化する。 一旦可能なロタマーの群が各可変残基位置につき帰属決定されたならば、図2 の工程54にプロセッシングを進行させる。このプロセッシング工程は、ロタマ ー相互との、および最適化蛋白質配列を創製するための蛋白質骨格との相互作用 を分析することを含む。ランキングモジュール34を用いて、これらの操作を行 うことができる。すなわち、コンピューターコードを書き込んで、以下の機能を 実行する。単純化すると、一般的に概説されるごとく、プロセッシングは、まず 、後記する多数のスコアリング機能を使用して、骨格自体または他のロタマーい ずれかに対する、ロタマーの相互作用のエネルギーを計算することを含む。 スコアリング機能は、ファンデルワールスポテンシャルスコアリング機能、水 素結合ポテンシャルスコアリング機能、原子溶媒和スコアリング機能、二次構造 ポテンシャルスコアリング機能および静電的スコアリング機能を含む。さらに後 記するごとく、少なくとも1つのスコアリング機能を用いて、各機能をスコアリ ングするが、該スコアリング機能は、α−ラセン二極との好都合な相互作用のよ うな位置分類または他の考慮に依存して異なり得る。後記にて概説するごとく、 計算で使用される合計エネルギーは方程式1で一般的に示されるごとく、特定の 位置で使用される各スコアリング機能のエネルギーの合計である。 方程式1では、合計エネルギーはファンデルワールスポテンシャル(Evdw)、 原子溶媒和のエネルギー(Eas)、水素結合のエネルギー(Eh-bonding)、二次 構造のエネルギー(Ess)および静電的相互作用のエネルギー(Eelec)の合計で ある。項nは、後記でより十分に概説するごとく、該項が特定の残基位置につき 考慮されるべきか否かに応じて0または1のいずれかである。 好ましい具体例において、ファンデルワールススコアリング機能が使用される 。当該分野で知られているように、ファンデルワールス力は、原子および分子の 間の弱い、非共有結合性および非イオン性の力、すなわち、誘導された二極およ び電子反発(パウリ則)力である。 ファンデルワールススコアリング機能はファンデルワールスポテンシャルエネ ルギーに基づく。ドレイディング力場からの半径および井戸の深さのパラメータ ーにてのレナード−ジョーンズ12/6ポテンシャル、出典明示して本明細書に 一体化させるMayoら、J.Prot.Chem.,1990、または指数関数6ポテンシャルを 含めた、多数のファンデルワールスポテンシャルエネルギー計算がある。以下に 示す方程式2は好ましいレナード−ジョーンズポテンシャルである。 R0は考慮している2つの原子のファンデルワールス半径の幾何平均であり、D0 は考慮している2つの原子の井戸深さの幾何平均である。EvdwおよびRは、考慮 している2つの原子の間のエネルギーおよび分子間距離であり、後記にてより十 分に記載する。 好ましい具体例において、ファンデルワールス力は、実施例4に記載したごと くスケーリング因子αを用いて、評価する。方程式3はファンデルワールスレナ ード−ジョーンズ方程式におけるαの使用を示す。 αスケーリング因子の役割は、いずれかの特定の蛋白質の計算およびデザイン におけるパッキング効果の重要性に対する変化である。実施例で議論するごとく 、異なる値αの結果、本方法によって創製される異なる配列となる。特に、減少 したファンデルワールス立体拘束は当該シミュレーションにおける固定された骨 格および区別される側鎖ロタマーの制限的効果を補償することができ、所望され る折り畳みに適合する配列のより広いサンプリングを可能とすることができる。 好ましい具体例において、α値は約0.70ないし約1.10の範囲の値を使用 することができ、約0.8ないし約1.05の値が好ましく、約0.85ないし 約1.0が特に好ましい。好ましい特別のα値は0.80、0.85、0.90 、0.95、1.00および1.05である。 一般的に、ファンデルワールススケール因子αの変化の結果、4つの方法のパ ッキング特異性がもたらされる:0.9≦α≦1.05であって、パッキング拘 束が配列選択を支配する方法1;0.8≦α<0.9であって、疎水性溶媒和ポ テンシャルはパッキング力と競合を始める方法2;α<0.8であって、疎水性 溶媒和がデザインを支配する方法3;およびα>1.05であって、ファンデル ワールス分解が余りにもひどくて、意味のある配列選択ができない方法4。特に 、異なるα値をコア、表面および境界ポテンシャルで使用することができ、方法 1および2がコア残基に好ましく、方法1は表面残基で好ましく、方法1および 2は境界残基で好ましい。 好ましい具体例において、ファンデルワールススケーリング因子は、コア、表 面および境界残基を含めた、各可変残基位置についての合計エネルギー計算で使 用される。 好ましい具体例において、原子溶媒和ポテンシャルスコアリング機能を用いる 。当業者によって認識されるごとく、蛋白質の溶媒相互作用は蛋白質の安定性に おいて意味のある因子であり、残基/蛋白質疎水性は蛋白質折り畳みにおいて主 要な駆動力であることが示されてきた。かくして、誤折り畳みまたは凝集に対す るポテンシャルに加えて、溶媒和疎水性表面に対するエントロピーコストがある 。 従って、蛋白質構造内の疎水性表面の包埋は折り畳みおよび安定性双方に対して 便宜である。同様に、親水性残基を包埋する不利があり得る。蛋白質原子の接近 可能な表面積は、一般に、この原子とのファンデルワールス接触を行い、いずれ かの他の蛋白質原子に貫通せずに、水分子をその上に置くことができる表面の面 積として定義される。かくして、好ましい具体例において、溶媒和ポテンシャル は、一般に、参照面積であって「埋もれた」面積から差し引く、部位または2つ の独立した部位(ロタマーまたは第1ロタマーおよび第2ロタマー)の合計した 可能な露出表面積、すなわち、骨格または他のロタマーいずれかに関する相互作 用により溶媒暴露されていない面積を採用することによってスコア取りされる。 かくして、これは露出された表面積を与える。 別法として、好ましい具体例は「埋もれた」部分に基づいてスコアリング機能 を計算する。すなわち、合計した可能な露出表面積が計算され、次いで、部位の 相互作用後の計算した表面積を差し引き、埋もれた表面積が得られる。特に好ま しい方法はこれらの計算の双方を行う。 後記にてより十分に記載されるごとく、これらの方法の双方は種々の方法で行 うことができる。出典明示して本明細書に一体化させる、Eisenbergら、Nature ,319:199-203(1986);Connolly,Science 221:709-713(1983);およびWodakら、P roc.Natl.Acad.Sci USA 77(4):1736-1740(1980)を参照。当業者によって認識 されるごとく、この溶媒和スコアリング機能は、立体配座非依存的というよりも むしろ立体配座依存的である。 好ましい具体例において、後記にてより十分に記載されるごとく、対の溶媒和 ポテンシャルは2つの成分「シングル」(ロタマー/鋳型)および「ダブル」( ロタマー/ロタマー)にて実行される。ロタマー/鋳型埋もれ面積では、参照状 態は残基i−1、iおよびi+1の骨格原子のみを持つ残基位置iにおける問題 のロタマーと定義されるが、いくつかの場合には、丁度iを使用することができ る。かくして、好ましい具体例において、溶媒和ポテンシャルは各骨格原子と特 定のロタマーとの相互作用では計算されないが、要すればより多くをなすことが できる。側鎖の面積は、該面積では計数されない溶媒を排除する骨格原子に関し て計算される。折り畳まれた状態は残基iにおける問題のロタマーの面積とし て定義されるが、今や、非最適化側鎖、すなわち、各他の固定位置残基を含めた 全鋳型構造の意味においてである。ロタマー/鋳型埋もれ面積は参照および折り 畳まれた状態の間の差異である。ロタマー/ロタマー参照面積は2つの方法で行 うことができる。単離されたロタマーの面積を単に合計することを使用すること による1つの方法。第2のものは全骨格を含む。折り畳まれた状態は、鋳型原子 が存在しない蛋白質スカフォールド上のそれらの相対的位置に置かれた2つのロ タマーの面積である。好ましい具体例において、溶媒接近可能表面積のリチャー ド定義(出典明示して本明細書に一体化させる、LeeおよびRichards,J.Mol.B iol.55:379-400,1971)を用い、プローブ半径は0.8ないし1.6Åの範囲 であり、1.4Åが好ましく、ドリーディングファンデルワールス半径は0.8 ないし1.0のスケールである。炭素および硫黄、および全ての結合水素は非極 性であると考えられる。窒素および酸素、および全ての結合水素は極性であると 考えられる。表面積は、10Å−2のドット密度を用い、Connollyアルゴリズム で計算される(出典明示して本明細書に一体化させるConnolly,(1983)(前掲) )。 好ましい具体例において、2つのロタマーの間の相互作用(ロタマーと骨格と の相互作用ではない)のエネルギーの計算に存在し得る埋もれた表面積の可能な 過剰評価についての修正がある。一般的に後記にて概説するごとく、ロタマーは 対においてのみ考慮され、すなわち、第1のロタマーは「ダブル」計算の間は第 2のロタマーに対して比較されるのみであるので、これは、2を超えるロタマー が相互作用する、すなわち、3を超える残基位置が一緒になる位置における埋も れた表面積の量を過剰評価し得る。かくして、修正またはスケーリング因子は後 記にて概説するごとく使用される。 溶媒和の一般的エネルギーは方程式4: 式中、Esaは溶媒和のエネルギーであり、fは表面積およびエネルギーを修正す るのに使用される定数であて、SAは表面積である。この方程式はいずれのパラ メーターが評価されているかに依存して、分類される。かくして、疎水性の埋も れた表面積を使用する場合、方程式5が適当である。 式中、f1は約10ないし50cal/モル/Å2の範囲の定数であり、23また は26cal/モル/Å2が好ましい。親水性埋もれについてのペナルティが考 慮される場合、該方程式は方程式6で示される: 式中、f2は−50ないし−250cal/モル/Å2の範囲の定数であり、−8 6または−100cal/モル/Å2が好ましい。同様に、もし疎水性暴露につ いてのペナルティが使用されれば、方程式7または8を使用することができる。 好ましい具体例において、f3=-f1である。 1つの具体例において、骨格原子は表面積の計算に含まれ、23cal/モル /Å2(f1)および−86cal/モル/Å2(f2)の値が決定される。 好ましい具体例において、この過剰計算問題は、過剰計数に付される対面積に ついての表現の一部のみにつき補償するスケーリング因子を用いてアドレスされ る。この具体例において、−26cal/モル/Å2(f1)および100cal /モル/Å2(f2)が決定される。 原子溶媒和エネルギーは、計算の時間およびソースの点では費用がかかる。従 って、好ましい具体例において、溶媒和エネルギーはコアおよび/または境界残 基につき計算され、表面残基については計算されず、コアおよび境界残基につい ての計算が好ましいが、3つのいずれかの組合せが可能である。 好ましい具体例において、水素結合ポテンシャルスコアリング機能が使用され る。水素結合ポテンシャルは、予測された水素結合がデザインされた蛋白質の安 定性に寄与するように使用される(共に出典明示して本明細書に一体化させる、 Stickleら、J.Mol.Biol.226:1143(1992);Huyghues-Despointesら、Biochem. 34:13267(1995)参照)。前記にて概説したように、明示的水素は蛋白質の骨格構 造で生じる。 好ましい具体例において、水素結合ポテンシャルは、方程式9に示すごとく、 距離−依存的項および角度−依存的項よりなる。 式中、R0(2.8Å)およびD0(8kcal/mol)は、各々、水素−結合平 衡距離および井戸深さであり、Rはアクセプター距離に対するドナーである。こ の水素結合ポテンシャルは、不都合な水素結合幾何学の発生を制限するより制限 的角度−依存的項でもってドレイディングで使用される。角度項は、方程式10 、11、12および13で示されるように、ドナーおよびアクセプターの混成状 態に依存して変化する。方程式10はsp3ドナー対sp3アクセプターで使用され、 方程式11はsp3ドナー対sp2アクセプターで使用され、方程式12はsp2ドナー 対sp3アクセプターで使用され、方程式13はsp2ドナー対sp2アクセプターで使 用される。 方程式10〜13において、θはドナー−水素−アクセプター角度であり、φ は水素−アクセプター−ベース角度であり(該ベースはアクセプターに結合した 原子であり、例えば、カルボニル炭素カルボニル酸素アクセプターについてのベ ースであり)、ψはsp2中心に結合した6つの原子によって規定される面の法線 間の角度である(ψの補足はψが90°未満である場合に使用される)。水素結 合機能は、sp3ドナー−sp3アクセプターの場合では2.6Å≦R≦3.2Å、θ >90°、φ−109.5°<90°であり、sp3ドナー対sp2アクセプターの場 合にはφ>90°であり、好ましくは、スイッチング機能が使用される。鋳型− 鋳型水素結合に関与する鋳型ドナーおよびアクセプターが好ましく、ドナーおよ びアクセプターのリストに含まれていない。排除目的では、鋳型−鋳型結合は2 .5Å≦R≦3.3Åであってθ≧135°である場合に存在すると考えられる 。 また、水素結合ポテンシャルは40Rの距離−依存的誘電定数(ここに、Rは 原子間距離である)を誘導する弱いクローン項と組み合わされまたはそれと共に 使用することができる。部分的原子電荷が好ましくは、極性官能基に適用される のみである。+1の正味の形式電荷がArgおよびLysで使用され、−1の正 味の形式電荷がAspおよびGluで使用される。Gasteigerら、Tetrahedron 3 6:3219-3288(1980);Rappeら、J.Phys.Chem.95:3358-3363(1991)。 好ましい具体例において、もう1つの原子に水素結合していない埋もれた極性 水素結合に明示的ペナルティーが与えられる。出典明示して本明細書に一体化さ せる、Eisenbergら(1986)(前掲)参照。好ましい具体例において、極性水素埋 もれについてのこのペナルティーは約0ないし3kcal/モルであり、約1な いし3が好ましく、2kcal/モルが特に好ましい。このペナルティーは、水 素結合に関与しない埋もれた極性水素にのみ適用される。水素結合は、EHBが約 1ないし約4kcal/モルの範囲にある場合に存在すると考えられ、−2kc al/モル未満のEHBが好ましい。加えて、好ましい具体例において、ペナルテ ィーは鋳型水素、すなわち、骨格の不対の埋もれた水素には適用されない。 好ましい具体例において、第1のロタマーおよび骨格の間の水素結合のみがス コアリングされ、ロタマー−ロタマー水素結合はスコアリングされない。別の具 体例において、第1のロタマーおよび骨格の間の水素結合はスコアリングされ、 ロタマー−ロタマー水素結合は0.5だけ評価される。 好ましい具体例において、水素結合スコアリング機能は、コア、表面および境 界位置を含めた全ての位置で使用される。別の具体例において、水素結合スコア リング機能はこれらのうちの1つまたは2つのみに対して使用することができる 。 好ましい具体例において、二次構造性質スコアリング機能が使用される。これ は特異的アミノ酸側鎖に基づく。すなわち、各アミノ酸は、φおよびψ角度に基 づいて、二次構造(α−ラセンまたはβ−シート)を取るある特性を有する。出 Biotech 6:382(1995);Minorら、Nature 367:660-663(1994);Padmanabhanら、 (1996);およびChakrabarttyら、Protein Sci.3:843(1994)参照。かくして、骨 格中の認識可能な二次構造にある可変残基位置では、二次構造特性スコアリング 機能は好ましく使用される。すなわち、可変残基位置は骨格のα−ラセン領域に ある場合、後記するα−ラセン特性スコアリング機能が計算される。位置が骨格 のα−ラセンにあるか否かは、当業者に認識されるように、一般的には、φおよ びψ角度に基づいて決定される;α−ラセンでは、−2ないし−70のφ角度お よび−30ないし−100のψ角度は一般的に骨格のα−ラセン領域を記載する 。 同様に、可変残基位置がβ−シート骨格立体配座にある場合、β−シート特性 スコアリング機能が使用される。β−シート骨格立体配座が一般的に−30およ び−100のφ角度および+40ないし+180のχ角度によって記載される。 別の好ましい具体例において、β−シートまたはα−ラセン構造に帰属されない 骨格の領域内にある可変残基位置もまた二次構造特性計算に付すことができる。 好ましい具体例において、二次特性に伴うエネルギーは方程式14を用いて計 算される。 方程式14において、Eα(またはEβ)はα−ラセンのエネルギーであり、 ΔGo aaはアミノ酸のラセン成長の標準自由エネルギーであって、ΔGo alaは、共 に文献で手に入るアミノ酸のβ−シート形成の標準または標準自由エネルギーと して使用されるアラニンのラセン成長の標準自由エネルギーであり(Chakrabartt yら(1994)(前掲)、およびMunozら、Folding & Design 1(3):167-178(1996)参 照)、Nssは1ないし4に設定される特性スケール因子であり、3.0が好まし い。このポテンシャルを好ましくは選択して、スコアリング機能における他の項 と同様の範囲に対する特性エネルギーを評価する。 好ましい具体例において、β−シート特性は好ましくはi−1およびi+1残 基もまたβ−シート立体配座である場合のみ計算される。 好ましい具体例において、二次構造特性スコアリング機能は、表面可変残基位 置につきエネルギー計算でのみ使用する。別の具体例において、二次構造特性ス コアリングは同様にコアおよび境界残基についての計算でのみ使用される。 好ましい具体例において、方程式15で以下に示すごとく、静電スコアリング 機能を用いる。 この方程式において、qは原子1の電荷であり、q'は原子2の電荷であり、 rは相互作用距離である。好ましい具体例において、少なくとも1つのスコアリ ング機能は各可変残基位置で使用される。好ましい具体例において、2、3また は4つのスコアリング機能を各可変残基位置で使用される。 一旦使用すべき各可変位置につきスコアリング機能が同一であれば、計算解析 における好ましい第1工程は、各可能なロタマーと蛋白質の残りの全てまたは一 部との相互作用の決定を含む。すなわち、骨格または他のロタマーに関する各可 変残基位置におけるその各可能なロタマーの、1以上のスコアリング機能によっ て測定された相互作用のエネルギーが計算される。好ましい具体例において、各 ロタマーと蛋白質の全残り、すなわち、鋳型および全ての他のロタマーの双方と の相互作用がなされる。しかしながら、前記で概説したごとく、蛋白質の一部、 例えば、より大きい蛋白質のドメインを作成できるに過ぎず、かくしてある場合 には蛋白質の全てが考慮される必要はない。 好ましい具体例において、計算プロセッシングの最初の工程は、その位置が変 化されていようが浮いていようが、各々の位置における各ロタマーについての2 組の相互作用:ロタマー側鎖と鋳型または骨格との相互作用(「シングル」エネ ルギー)、およびロタマー側鎖と各々の他の位置における他の可能なロタマーと の相互作用(「ダブル」エネルギー)を計算することによってなされる(図3の 工程70)この場合における骨格は蛋白質構造骨格の原子、ならびにいずれかの 固定された残基(ここに、固定された残基はアミノ酸の特定の立体配座として定 義される)を共に含むことが理解されるべきである。 従って、「シングル」(ロタマー/鋳型)エネルギーは、スコアリング機能の いくつかまたは全てを用い、各々の可変残基位置における各々の可能なロタマー と骨格との相互作用につき計算される。かくして、水素結合スコアリング機能に ついては、ロタマーの水素結合原子および骨格の各々の水結合原子が計算され、 各々の可変位置における各可能なロタマーにつきEHBが計算される。同様に、フ ァンデルワールススコアリング機能については、ロタマーの各々の原子を鋳型の 各々の原子と比較し(一般に、それ自体の残基の骨格原子を除く)、Evdwが各々 の可変残基位置における各可能なロタマーにつき計算される。加えて、一般に、 もし原子が3つ以下の結合によって結合されているならば、ファンデルワールス エネルギーは計算されない。原子溶媒和スコアリング機能については、ロタマー の表面が鋳型の表面に対して測定され、各々の可変残基位置における各可能なロ タマーに対するEasが計算される。二次構造特性スコアリング機能もまたシング ルエネルギーとして考慮され、かくして、合計シングルエネルギーはEss項を含 有し得る。当業者によって認識されるように、これらのエネルギー項の多くは、 ロタマーおよび鋳型位置との間の物理的距離に応じて、ゼロに近いであろう。す なわち、2つの部位が遠ければ遠いほど、エネルギーは低い。 従って、前記で概説したように、合計シングルエネルギーは、ロタマー位置で その特定のスコアリング機能が使用されるかに応じて、方程式1(ここに、nは 1またはゼロである)で示されるごとく特定の位置で使用された各スコアリング 機能のエネルギーの合計である。 一旦計算されたならば、後記で概説するごとく、各可能なロタマーについての 各シングルEtotalを、それが引き続いての計算で使用できるように、コンピュー ター内のメモリー24に保存する。 「ダブル」エネルギー(ロタマー/ロタマー)の計算については、各可能なロ タマーの相互作用エネルギーを、全ての他の可変残基位置における各々の可能な ロタマーと比較する。かくして、「ダブル」エネルギーは、いくつかのまたは全 てのスコアリング機能を用い、各々の可変残基位置における各可能なロタマーと 各々の他の可変残基位置における各々の可能なロタマーとの相互作用につき計算 される。かくして、水素結合スコアリング機能については、第1ロタマーの各々 の水素結合原子および各々の可能な第2ロタマーの各々の水素結合原子を計算し 、いずれかの2つの可変位置につき各可能なロタマー対につきEHBが計算される 。同様に、ファンデルワールススコアリング機能については、第1ロタマーの各 々の原子を各々の可能な第2ロタマーの各々の原子と比較し、各々の2つの可変 残基位置における各々の可能なロタマー対につきEvdwが計算される。原子溶媒和 スコアリング機能については、最初のロタマーの表面を各々の可能な第2ロタマ ーの表面に対して測定され、各々の2つの可変残基位置における各々の可能なロ タマー対についてのEasが計算される。二次構造特性スコアリング機能は、それ が「シングル」エネルギーの成分として考えれるので、「ダブル」エネルギーと して実行される必要はない。当業者によって認識されるように、第1ロタマーお よび第2ロタマーの間の物理的距離に応じて、これらのダブルエネルギー項の多 くは、ゼロに近いであろう。すなわち、2つの位置が離れればそれだけエネルギ ーは低い。 従って、前記で概説したごとく、合計ダブルエネルギーは、ロタマー位置でそ の特定のスコアリング機能が使用されたかに応じて、方程式16(ここに、nは 1またはゼロである)に示されるごとく、ロタマーの各々の可能な対を評価する のに使用される各スコアリング機能のエネルギーの合計である。 例を説明する。第1の可変位置iはia、ibおよびicと表示される3つの (非現実的に低い数)可能なロタマー(これは、単一アミノ酸または異なるアミ ノ酸いずれかである)を有する。第2可変位置jもまたjd、jeおよびjfと 表示される3つの可能なロタマーを有する。かくして、9つのダブルエネルギー (Etotal)が全てにおいて計算される:Etotal(ia,jd)、Etotal(ia, je)、Etotal(ia,jf)、Etotal(ib,jd)、Etotal(ib,je) 、Etotal(ib,jf)、Etotal(ic,jd)、Etotal(ic,je)、およ びEtotal(ic,jf)。 一旦計算すれば、後記で概説するごとく、各可能なロタマー対についての各ダ ブルEtotalを、それが引き続いての計算で使用できるように、コンピューター内 のメモリー24に保存する。 一旦シングルおよびダブルエネルギーが計算され保存されれば、計算プロセッ シングの次の工程が起こり得る。一般に、計算プロセッシングの目標は最適化さ れた蛋白質配列のセットを決定することである。「最適化された蛋白質配列」と は、本明細書における数学方程式に最良にフィットする配列を意味する。当業者 に認識されるように、全体最適化配列は方程式1に最良にフィットする1つの配 列、すなわち、いずれかの可能な配列の最低エネルギーを有する配列である。し かしながら、全体最小ではなく低いエネルギーを有するいずれかの数の配列があ る。 好ましい具体例において、セット成分は最適立体配座における全体最適配列、 すなわち、各々の可変位置における最適ロタマーを含む。すなわち、計算プロセ ッシングを、シミュレーションプログラムが全体最適である単一配列に収束する まで実行する。 好ましい具体例において、該セットは少なくとも2つの最適化蛋白質配列を含 む。かくして、例えば、計算プロセッシング工程は多数の不都合な計算を排除で きるが、収束に先立って停止できるであろうし、これは、全体的に最適なものが 1つである配列のセットを供する。加えて、例えば異なる方法を用い、さらなる 計算解析を該セットに対して実行して、配列をさらに排除し、それらを異なって ランク付けすることができる。別法として、後記にてより十分に記載されるごと く、全体最適化が達成でき、次いで、計算プロセッシングが起こり得るのであり 、これは全体最適化配列の近くにさらなる最適化配列を生じる。 もし1を超える最適化蛋白質配列のセットが得られたならば、後記にて十分に 記載されるごとく、それらは理論的量的安定性の点で順序付けてランキングする ことができる。 好ましい具体例において、計算プロセッシング工程は、まず、時々は「カット オフの適用」と呼ばれる排除工程(シングル排除またはダブル排除)を含む。シ ングル排除は、いずれかの計算に先立って、約10kcal/モルを超える鋳型 相互作用エネルギーを持つ全てのロタマーの排除を含み、約15kcal/モル を超える排除エネルギーが好ましく、約25kcal/モルを超えるのが特に好 ましい。同様に、ロタマーが第2残基位置において約10kcal/モルを超え る相互作用エネルギーを有する場合にダブル排除がなされ、約15を超えるエネ ルギーが好ましく、約25kcal/モルを超えるのが特に好ましい。 好ましい具体例において、計算プロセッシングは全体配列エネルギーの直接的 決定、続いての全体最適化を確認し、所望であれば他の可能な配列をランク付け するための全体配列の比較を含む。全体配列のエネルギーは方程式17において 以下に示す。 かくして、骨格−骨格(時々は、鋳型−鋳型と本明細書ではいう)エネルギー (骨格は一定に保たれるので本明細書における全ての配列にわたって一定である E(b-b))、各ロタマーについてのシングルエネルギー(これは既に計算され保存 されている)、および各ロタマー対についてのダブルエネルギー(これは、既に 計算され貯蔵されている)を付加することによって、ロタマーの各々の可能な組 合せを評価することができる。次いで、各可能なロタマー配列の各全体配列が、 最良から最悪まで、または最悪から最良までランク付けできる。これは明らかに 計算上高価であって、蛋白質の長さが増加するにつれて非実用的になる。 好ましい具体例において、計算プロセッシングは1以上のデットエンド排除( DEE)計算工程を含む。該DEE理論は、既知の配列を持つ固定化された骨格 に蛋白質側鎖をパッキングするように設計された非常に速い区別されるサーチプ ログラムについての基礎である。全て出典明示して本明細書に一体化させる、De smetら、Nature 356:539-542(1992);Desmetら、The Protein Folding Problem a nd Tertiary Structure Prediction,Ch.10:1-49(1994);Goldstein, Biophys.Jour.66:1335-1340(1994)参照。DEEは、もしロタマーが特定の位 置における考慮からはずすことができれば、すなわち、特定のロタマーが明らか に全体最適立体配座の一部ではないと判断するならば、該サーチのサイズは減少 される。これは、単一可変位置における最初のロタマーの最悪相互作用(すなわ ち、エネルギーまたはEtotal)と同一可変位置における第2ロタマーの最良相互 作用とを比較することによってなされる。もし最初のロタマーの最悪ロタマーが 依然として第2ロタマーの最良相互作用よりも良好であれば、第2ロタマーは恐 らくは配列の最適立体配座にあり得る。オリジナルのDEE理論は方程式18で 示される。 方程式18において、ロタマーiaはロタマーibと比較される。不等式の左 側は蛋白質の残りに関するiaの最良の可能な相互作用エネルギー(Etotal)で ある。すなわち、「min over t」は、ロタマーiaとの最良の相互作 用を有する位置jについてのロタマーtを見出すことを意味する。同様に、不等 式の右側は蛋白質の残りに関するロタマーibの最悪可能(最大)相互作用エネ ルギーである。この不等式が真実であれば、ロタマーはデッドエンディングであ り、排除できる。DEEのスピードは、該理論がロタマーをテストし、排除する ための配列長さにわたっての合計を要するという事実に由来する。 好ましい具体例において、DEEの変形が実行される。ここに明示して本明細 書に一体化されるGoldstein(1994)(前掲)に基づくGoldstein DEEは、方程 式19で示されるごとく、DEE計算の変形である。 エッセンスを述べれば、Goldstein方程式19は、特定位置iの最初のロタマ ー(ロタマーia)は、もしiaに関する立体配座のエネルギーが、その位置に おけるロタマーをibに丁度変化させ、他の残基を同等に保持することによって 常に低下させることができれば、局所的エネルギー最小に寄与しないであろうと いうことを示す。もしその不等式が真実であれば、ロタマーはデッド−エンディ ングであって、排除することができる。 かくして、好ましい具体例において、最初のDEE計算が行われ、ここに、単 一可変位置におけるロタマーが比較されて(「シングル」DEE)、単一位置に おけるロタマーを排除する。この解析を各々の可変位置につき反復させて、出来 る限り多くの単一ロタマーを排除する。加えて、ロタマーがDEEを介して考慮 することからはずされる毎に、いずれのDEE変形が使用されるかに応じて、方 程式18または19の最小および最大計算が変化し、かくして、概念的にはさら なるロタマーの排除が可能である。従って、シングルDEE計算を、もはやロタ マーが排除できないまで、(すなわち、それらの全てが概念的に全体最適化で見 出されるように不等式がもはや成立しない場合)反復することができる。 好ましい具体例において、「ダブル」DEEがさらに行われる。ダブルDEE おいて、ロタマーの対が評価される。すなわち、オリジナルのまたはGoldstein DEEを用い、最初の位置における最初のロタマーおよび第2の位置における第 2のロタマーを、最初の位置における第3ロタマーおよび第2位置における第4 ロタマーと比較する。次いで、単一ロタマーは排除できないが、対でありさえす れば対は許容されないとして標識される。再度、シングルDEEに関しては、ロ タマー対が許容されないと標識される毎に、方程式18または19の最小計算は (いずれのDEE変化が使用されるかに応じて)変化し、かくして、概念的にさ らなるロタマーの標識化が可能である。従って、ダブルDEE計算を、もはやロ タマー対が標識できないまで反復することができる。すなわち、ここに、ロタマ ー対のエネルギーは、それらの全てが概念的に全体最適で見出すことができるよ うに重複する。 加えて、好ましい具体例において、ロタマー対を最初にプレスクリーニングし て、DEEに先立ってロタマー対を排除する。これは、比較的計算上安価な計算 を行って、フロントまである対を排除することによってなされる。これは、後記 にて概説されるごとく、いくつかの方法でなすことができる。 好ましい具体例において、系の残りとの最小相互作用エネルギーを持つロタマ ー対が見出される。試料マトリックスにおけるエネルギー分布の洞察は、特定の irjsをデッド−エンド排除するiujvもまた他のirjs対を排除できることを明らか とした。事実、しばしば、かなりの数のirjs対を排除する、「マジックブレット 」と我々が呼ぶ少数のiujv対がある。我々は、ほとんどの優れたマジックブレッ トのうちの1つが、最大相互作用エネルギーtmax([iujv])ktがそれに対して最小 である対であることを見出した。この対を[iujv]mbという。もしこのロタマー対 を第1ラウンドのダブルDEEで使用すれば、それは対をより速く排除する傾向 にある。 我々の最初の高速化は、[iujv]mb対に対応する列におけるマトリックス要素の みについての一次のダブル計算を評価することである。[iujv]mbの発見はn2計算 であり(n=位置当たりのロタマーの数)、このロタマー対に対応するマトリッ クスの単一列への方程式19の適用はもう1つのn2計算であり、そこで、全一次 ダブル計算と比較して計算時間は短い。実際的には、この計算は非常に多数のデ ッド−エンディング対を生じ、しばしば、ダブルマトリックスのいずれのさらな るサーチングもなくして、シングル排除の次の繰り返しに進行するのに十分であ る。 また、マジックブレット一次計算は、方程式18または19によって発見され るであろう全てのデツド−エンディング対を発見し、それによりそれを不必要と するであろう。これは、方程式18または19によって、εmax([iujv]mb)が、 対を首尾よく排除するであろういずれのεmax([iujv])よりも小であるまたはそ れと等しくなければならないという事実に由来する。 いずれかの所与の対の最小および最大は本明細書に概説したごとくに予備計算 されたので、第2のスピード−増強予備計算が行える。極値を比較することによ って、デッド−エンドされない対を同定し、かくして、跳躍し、DEE計算の時 間を減少させることができる。かくして、以下の基準のうちのいずれか1つを満 足させる対が跳躍される。 これらの計算を含むマトリックスは対象であるゆえに、この要素の半分は最初 の不等式方程式20を満足し、残りの半分は他の不等式方程式21を満足するで あろう。マトリックスのこれらの3/4は方程式18または19の評価に付す必 要がなく、その結果、4つの因子の理論的スピード増強がもたらされる。 最後のDEEスピード増強は、マトリックスの残りの1/4のサーチを優れた ものとする。これは、予め計算された極値からメトリックを構築して、マトリッ クス要素を検出し、その結果デツド−エンディング対が得られるようであること によってなされる。 メトリックは異なる試料最適化からマトリックスの解析を介して見出された。 我々は、マトリックス要素がデツド−エンディング対を生じるであろう尤度を予 測する極値の組合せにつきサーチした。各対についての間隔サイズ(図12参照 )を、極値の差から計算した。jrjsおよびjujv間隔の重複のサイズも、最小間の 差および最大間の最として同様に計算した。これらの質、ならびに孤立極値の組 合せを、デツド−エンディング対の発生を予測するそれらの能力につきテストし た。最大のうちいくつかは非常に大きいので、質も対数的に比較した。 組合せのほとんどは、種々の程度にデツド−エンディングマトリックス要素を 予測することができた。最良のメトリックはqrsおよびquvとここではいう、各対 に関する間隔重複分率であった。 これらの値は最小および最大方程式24、25、26および27を用いて計算 される(図14参照)。 これらのメトリックはテストした他のメトリックのいずれよりも高い、要素の 全発生に対するデッド−エンディングマトリックス要素の発生の比率を生じるゆ えに選択した。例えば、qrs>0.98であるマトリックス要素はほとんどない (〜2%)が、これらの要素はデッド−エンディング対の全ての30〜40%を 生じる。 従って、一次ダブル基準はqrs>0.98およびquv>0.99であるダブルに 対してのみ適用される。試料データ解析は、これらの2つのメトリックを用いる ことによって、デッド−エンディング要素の半分と同数が、2ないし5パーセン トにすぎない減少したマトリックスを評価することによって見出すことができる ことょ予測する。 一般に、後記にてより詳細に記載するごとく、オリジナルのおよびGoldstein DEEのいずれかまたは双方を用いるシングルおよびダブルDEEを、さらなる 排除が可能でなくなるまで反復する。通常、収束は完全ではなく、さらなる排除 が起こって収束を達成しなければならない。これは一般に「スーパー残基」DE Eを用いてなされる。 好ましい具体例において、さらなるDEE計算は、一般に、Desmet,Nature 3 56:539-542(1992);Desmetら、The Protein Folding Problem and Tertiary Stru cture Prediction,Ch.19:1-49(1994);Goldsteinら、前掲に記載されているご とくに、「スーパー残基」または「単一化」の基準によってなされる。スーパー 残基は、次いで、単一単一残基位置として処理される2以上の可変残基の組合せ である。次いで、スーパー残基は、他の残基位置またはスーパー残基いず れかと共に、シングルDEEおよびダブルDEEで評価される。スーパー残基の 不利は、評価しなければならない多くのロタマーがある。すなわち、もし最初の 可変残基位置が5つの可能なロタマーを有し、第2の可変残基位置が4つの可能 なロタマーを有すれば、評価しなければならない20の可能なスーパー残基ロタ マーがあることである。しかしながら、これらのスーパー残基はシングルと同様 に排除することができ、むしろ対のように標識される。 スーパー残基に組み合わせるべきその位置の選択は種々の方法で行うことがで きる。一般に、スーパー残基についてのランダム選択の結果、不十分な排除とな るが、それは行うことができるものの、これは好ましくはない。好ましい具体例 において、最初の評価はスーパー残基についての位置の選択であり、当該位置に おけるロタマー数である。もし該位置が余りにも多くのロタマーを有するならば 、計算が余りにも実用的でなくなるので、それは決してスーパー残基に単一化さ れない。かくして、約100,000未満のロタマーに関する位置のみが選択さ れ、約50,000未満が好ましく、約10,000未満が特に好ましい。 好ましい具体例において、スーパー残基を形成すべきか否かの評価は以下の通 りになされる。全ての可能なロタマー対を方程式28を用いてランク付けし、最 高数を持つロタマー対が単一化のために選択される。 方程式28は最小数のスーパーロタマーを除き標識化された対の最高分率また はパーセントを有する位置の対を探すものである。すなわち、方程式28につき 最高値を与える対が好ましくは選択される。かくして、もし位置の対が最高数の 標識化対を有するが非常に多数のスーパーロタマー(すなわち、位置jにおける ロタマーの数に位置iにおけるロタマーの数を掛けたもの)も有するならば、少 数のスーパー残基を除いて低いパーセントの標識化対にわたって、この対は(選 択できるとしても)選択されないであろう。 別の好ましい具体例において、最高平均エネルギーを有するスーパー残基につ き位置が選択される。すなわち、位置iおよびjについては、iについての全て のロタマーおよびjについての全てのロタマーの平均エネルギーが計算され、最 高平均エネルギーを持つ対がスーパー残基として選択される。 スーパー残基は好ましくは一度に1つとされる。スーパー残基を選択した後、 シングルおよびダブルDEE計算を反復し、ここに、スーパー残基はあたかもレ ギュラー残基であるかのごとく処理される。シングルおよびダブルDEEに関し ては、スーパー残基DEEにおけるロタマーの排除はDEEの最小エネルギー計 算を変化させるであろう。かくして、シングルおよび/またはダブルDEEの反 復の結果、ロタマーのさらなる排除がもたらされる。 図3は、本発明のランキングモジュール34に関連するプロセッシング操作の 詳細な説明である。シングルおよびダブルエネルギー70の計算および保存は最 初の工程であるが、これらの毎回再計算することができる。工程72はカットオ フの任意の適用であり、ここに、高すぎるシングルまたはダブルエネルギーはさ らなる工程に先がけて除かれる。オリジナルのシングルDEE74とGoldstein シングルDEE76のいずれかまたは双方をなすことができ、オリジナルのシン グルDEE74の排除が一般的に好ましい。一旦シングルDEEが実行されると 、オリジナルのダブル(76)および/またはGoldsteinダブル(80)DEE が実行される。次いで、スーパー残基DEEが一般的に実行される(オリジナル (82)またはGoldstein(84)スーパー残基DEE)。この結果、好ましく は、全体最適化配列における収束がもたらされる。図3に示すごとく、いずれか の工程の後、前記工程のいずれかまたは全部をいずれかの順序で再度行うことが できる。 以前のDEE工程の反復を伴う、計算プロセッシングに対するスーパー残基D EEの付加は、一般に、その結果、全体最適化において収束をもたらす。全体最 適化への収束は、もしカットオフ適用がなされないならば保証されるが、一般的 には、全体最適化はこれらの工程で達成される。好ましい具体例において、DE Eを全体最適配列が見出されるまで実行する。すなわち、最適化蛋白質配列のセ ットは単一メンバー、全体最適化配列を含有する。 好ましい具体例において、管理可能な数の配列が見出される、すなわち、さら なるプロセッシングが必要ないというまで種々のDEE工程が実行される。これ らの配列は最適化蛋白質配列のセットを表し、管理可能な数の配列は配列の長さ に依存するが、一般的には、約1ないし約1015の可能なロタマー配列の範囲であ る。 あるいは、DEEはポイント的に実行し、その結果、最適化配列のセット(こ の意味では、残りの配列のセット)がもたらされ、次いで、異なるタイプのさら なる計算プロセッシングを実行することができる。例えば、1つの具体例におい て、前記で概説した配列エネルギーの直接的計算は残りの可能な配列につき行わ れる。別法として、モンテカルロサーチを実行することができる。 好ましい具体例において、計算プロセッシングはDEE計算工程を含む必要が ない。この具体例において、当該分野で知れているように、モンテカルロサーチ が実行される。出典明示して本明細書に一体化させる、Metropolisら、J.Chem .Phys.21:1087(1953)参照。この具体例において、ランダムロタマーを含むラ ンダム配列が出発点として選択される。1つの具体例において、可変残基位置は コア、境界または表面残基として分類され、各位置における利用可能な残基のセ ットがかくして定義される。次いで、ランダム配列を生じさせ、各アミノ酸につ いてのランダムロタマーを選択する。これは、モンテカルロサーチの出発配列と して働く。次いで、モンテカルロサーチは1つの位置において、同一アミノ酸の 異なるロタマーまたは異なるアミノ酸のロタマーへとジャンプを行い、次いで、 新しい配列エネルギー(Etotal sequence)が計算され、もし新しい配列エネル ギーが許容性についてのボルツマン基準に適合すれば、それをもう1つのジャン プ用の出発点として使用する。もしボルツマンテストが失敗すれば、もう1つの ランダムジャンプが以前の配列から試みられる。このようにして、低および低エ ネルギーを持つ配列が見出され、低いエネルギー配列のセットが創製される。 もし計算プロセッシングの結果、単一全体最適配列が得られたならば、ランク 付けすることができる全体解決エネルギー隣接においてさらなる配列を創製する のがしばしば好ましい。これらのさらなる配列もまた最適化蛋白質配列である。 さらなる最適化配列の創製は、一般に、配列の理論エネルギーおよび実際のエネ ルギーの間の差異を評価するのに好ましい。一般に、好ましい具体例において、 配列のセットは相互に少なくとも約75%相同であり、少なくとも約80%相同 が好ましく、少なくとも約85%相同が特に好ましく、少なくとも約90%が特 別に好ましい。いくつかの場合、95%ないし98%もと高い相同性が望ましい 。この意味での相同性は配列同様性または同一性を意味し、同一性が好ましい。 この意味で同一とは、比較すべき2つの配列における対応する位置での同一アミ ノ酸を意味する。この意味における相同性は、同一であるアミノ酸および同様で あるアミノ酸(機能的に同等)を含む。この相同性は、好ましくは、相互に欠陥 設定を用いる、Devereuxら、Nucl.Acid.Res.12:387-395(1984)によって記載 されているベスト・フィット配列プログラム、またはBLASTXプログラム(Altschul ら、J.Mol.Biol.215:403-410(1990))のごとき、当該分野で知られている標準 的技術を用いて決定されるであろう。整列は整列させるべき配列へのギャップの 導入を含むことができる。加えて、最適配列よりも多いまたは少ないアミノ酸を 含有する配列については、相同性のパーセンテージはアミノ酸の合計数に対する 相同アミノ酸の数に基づいて決定されるであろうことが理解される。かくして、 例えば、最適より短い配列の相同性は、より短い配列におけるアミノ酸の数を用 いて決定されるであろう。 一旦最適化蛋白質配列が同定されたならば、図2のプロセッシングは所望によ り蛋白質配列をサーチすることを含む工程56まで進行させる。このプロセッシ ングはサーチモジュール36で実行することができる。例えばサーチモジュール 36は書き込んで、前記したごとくにモンテカルロサーチを実行することができ る。全体解決で出発し、ランダム位置を特定位置で許容される他のロタマー(同 一アミノ酸からのロタマーおよび異なるアミノ酸からのロタマー双方)まで変化 させる。新しい配列エネルギー(Etotal sequence)が計算され、もし該新しい 配列エネルギーが許容性についてのボルツマン基準に適合すれば、それをもう1 つのジャンプのための出発点として用いる。出典明示して本明細書に一体化させ る、Metropolisら、1953,前掲参照。もしボルツマンテストが失敗すれば、もう 1つのランダムジャンプが以前の配列から試みられる。配列およびそれらのエネ ルギーのリストがサーチの間維持される。所定数のジャンプの後、最良のスコア リング配列がランク付けリストとしてアウトプットされる。好ましくは、少なく とも約106のジャンプがなされ、少なくとも約107のジャンプが好ましく、少なく とも 約108のジャンプが特に好ましい。好ましくは、少なくとも約100ないし10 00配列がセーブされ、少なくとも約100,000の配列が好ましく、少なく とも約10,000ないし1,000,000配列が特に好ましい。サーチの間 、温度は好ましくは1000Kに設定される。 一旦モンテカルロサーチが終了すれば、温度をOKまで変化させ、次いで、各 位置においてアミノ酸同一性を固定することによって、セーブされた配列の全て をクエンチする。好ましくは、各々の位置における特定のアミノ酸についての各 々の可能なロタマージャンプを次いで試みる。 計算プロセッシングの結果、最適化蛋白質配列のセットが得られる。これらの 最適化蛋白質配列は一般的に、しかし常ではないが、骨格がそれから取られた野 性型配列とはかなり異なる。すなわち、各最適化蛋白質配列は好ましくは出発ま たは野性がて配列からの約5〜10変異体アミノ酸を含み、少なくとも約15〜 20%変化が好ましく、少なくとも約30%変化が特に好ましい。 これらの配列は多数の方法で使用することができる。好ましい具体例において 、最適化蛋白質配列の1つ、いくつかまたは全てを、図2の工程58で示すごと くにデザインされた蛋白質に構築される。しかる後、蛋白質配列を、図2の工程 60で示すごとくにテストすることができる。一般に、これは2つの方法のうち 1つで行うことができる。 好ましい具体例において、デザインされた蛋白質は当該分野で知られているご とく化学的に合成される。これは、デザインされた蛋白質が短い、好ましくは長 さが150アミノ酸未満の場合に有用であり、100アミノ酸未満が好ましく、 50アミノ酸が特に好ましいが、当該分野で知られているように、より長い蛋白 質を化学的または酵素的に作成することもできる。 好ましい具体例において、特に、より長い蛋白質または大きな試料が所望され る蛋白質については、最適化配列を用いて、最適化配列をコードし、次いで、宿 主細胞にクローン化し、発現できるDNAのような核酸を創製する。かくして、 核酸、特に各最適化蛋白質配列をコードする核酸を作成することができる。これ はよく知られた手法を用いてなすことができる。コドン、適当な発現ベクトルお よび適当な宿主細胞の選択は、因子の数に応じて変化し、要すれば容易に最適化 することができる。 一旦作成すれば、デザインされた蛋白質を実験的に評価し、要すれば、構造、 機能および安定性につきテストする。これは当該分野で知られているようになさ れ、蛋白質骨格がそれから取られたオリジナルの蛋白質に部分的に依存するであ ろう。好ましくは、デザインされた蛋白質は、出発点として使用された公知の蛋 白質よりも安定であるが、ある場合には、もしいくつかの拘束が当該方法に置か れれば、デザインされた蛋白質は安定性が低いであろう。かくして、例えば、改 変された生物学的活性用にある残基を固定し、最も安定な配列を見出すことがで きるが、野性型蛋白質よりも依然として安定性が低いであろう。この意味におい て安定性とは、新しい蛋白質が、親分子がそうした地点を通過した生物学的活性 または立体配座いずれかを保有することを意味する。安定性は限定されるもので はないが、熱安定性、すなわち、可逆的または不可逆的変性が起こり始める温度 の上昇;蛋白質分解安定性、すなわち、特定のプロテアーゼの存在下で不可逆的 に開裂される蛋白質の量の減少(自己分解を含む)、pHまたは酸化的条件にお ける変化に対する安定性;キレーター安定性;金属イオンに対する安定性;有機 溶媒、界面活性剤、処方化学物質等のごとき溶媒に対する安定性を含む。 好ましい具体例において、作成された蛋白質は元の蛋白質よりも少なくとも約 5%安定であり、より好ましくは少なくとも約10%、さらに好ましくは少なく とも約20〜50%である。 テスト操作の結果は、図2の工程62で示すごとく、計算機で評価される。評 価モジュール38はこの操作で用いられる。すなわち、コンピューターコードを 調製して、いずれかの数のメトリックに関してテストデータを解析することがで きる。 プロセッシング接合において、もし蛋白質が選択されたならば(ブロック64 のイエス分岐)、該蛋白質を後記するごとくに利用する(工程66)。もし蛋白 質が選択されなければ、蓄積された情報を用いて、ランキングモジュール34を 変化させ、および/または工程56を反復し、より多くの配列がサーチされる。 好ましい具体例において、実験結果がデザインフィードバックおよびデザイン 最適化で使用される。 一旦作成すれば、本発明の蛋白質は、当業者によって認識されるように、蛋白 質に応じて、産業ないし薬理学的使用の範囲の、非常に多くの応用が見出される 。かくして、例えば、増大した熱安定性を呈する蛋白質および酵素を、上昇した 温度でしばしば実行される産業プロセス、例えば、炭水化物加工(高フルクトー スコーンシロップおよび他の甘味剤を生成するための澱粉の糖化および液化を含 む)、蛋白質加工(例えば、洗濯洗剤におけるプロテアーゼの使用、食品加工、 飼料ストック加工、パン焼き)等で使用することができる。同様に、本発明の方 法は、より熱安定性で、より蛋白質分解の感受性が低く、または他の所望の変化 を含む公知の蛋白質性薬物のアナログのごとき、有用な医薬蛋白質の創製を可能 とする。 以下の実施例は、前記本発明を用いる様式をより十分に記載し、ならびに本発 明の種々の態様を実施するために考えられるベストモードを記載するように供す る。これらの実施例は本発明の真の範囲を断じて制限するものではなく、むしろ 例示的目的で提示する。全ての引用文献は出典明示して本明細書に一体化させる 。 実施例 実施例1 DEEと共にファンデルワールスおよび 原子溶媒和スコアリング機能を用いる蛋白質デザイン 理論、計算および実験テストをカップリングさせて特異性および学習の問題に 立ち向かわせる循環的デザイン戦略を開発した(図4)。我々の蛋白質デザイン 自動化(PDA)サイクル4つの成分はデザイン凡例、シミュレーションモジュ ール、実験テストおよびデータ解析より構成される。デザイン凡例は逆折り畳み (Pabo,Nature,301:200(1983);Bowieら、Science 253:164-170(1991))の概念に 基づき、これは、側鎖ロタマーの配列をその上に置くことができる固定化骨格の 使用よりなり、ここに、ロタマーはアミノ酸側鎖の許容された立体配座である(P onderら、(1987)(前掲))。原子の三次元併置に基づく特異的三次相互作用を用 いて、標的折り畳みに潜在的に最良に適合する配列を決定する。インプット として各残基位置につき許容された骨格幾何学および可能なロタマーが与えられ れば、シミュレーションは、アウトプットとして、種々のロタマーにおいて原子 位置を明示的に考慮するコスト機能に基づいて解決のランク付けリストを生じな ければならない。原理的障害は、固定化された骨格が残基当たりn個の残基およ びm個の可能なロタマーよりなり(全ての許容されるアミノ酸の全てのロタマー )、その結果、系のmn個の可能な配列(小さなデザイン問題にしても巨大な数) となることである。例えば、15個の位置において50個のロタマーを考慮する ことは、1025個にわたる配列の結果となり、これは、1秒当たり109個の配列の 評価速度において(現行の能力をはるかに超える)、全体最小について網羅して サーチするのに109年要するであろう。シミュレーションモジュールによって提 示されたアミノ酸配列のサブセットの合成および特徴付けは、解析モジュール用 の実験データを生じる。解析セクションは、シミュレートされた構造の計算可能 な特性および実験観察の間の修正を発見する。該解析の目標は、シミュレーショ ンに対する、ある場合には、デザイン凡例のガイドに対する定量的修正を示唆す ることである。換言すれば、シミュレーションモジュールで使用されたコスト機 能は、その水平軸が問題に対する手近な全ての可能な解決を含む理論的可能なエ ネルギー表面を記載する。この可能なエネルギー表面は、実験データから決定さ れた現実の可能なエネルギー表面にマッチするとは保証されない。これに徴すれ ば、解析の目標は、理論的および現実的ポテンシャルエネルギーの間に良好な一 致を生じさせるためのシミュレーションコストとなる。もしそのような修正を見 出すことができれば、引き続いてのシミュレーションのアウトプットは、標的特 性を良好に達成するアミノ酸配列であろう。このデザインサイクルは、一般に、 主題のヒト成分を除去することによって、いずれの蛋白質系にも適用でき、蛋白 質デザイン、すなわち、蛋白質デザイン自動化に対する大いに片寄りのないアプ ローチを可能とする。 PDA側鎖選択アルゴリズムは、インプットとして、所望の折り畳みを規定す る骨格構造を必要とする。この折り畳みを取る配列をデザインする仕事は、所与 の骨格に対するアミノ酸側鎖の配置を発見するものとして総括することができる 。配列を評価する場合に、アミノ酸の同定のみを考慮するのは十分ではない。側 鎖 置換の幾何学的特異性を正しく説明するには、各側鎖の全ての可能な立体配座も 調べなければならない。蛋白質構造データベースの統計学的概観(Ponderら、前 掲)は、各アミノ酸側鎖につき、ロタマーと呼ばれる許容された立体配座の区別 されるセットを規定した。我々は、PDAにおける側鎖について許容された立体 配座を規定するためにPonderおよびRichardsライブラリーに基づいてロタマーラ イブラリーを使用する。 側鎖のロタマー記載を用い、ロタマーの全ての可能な配列をスクリーニングす ることによって、骨格についての最適配列を見出すことができ、ここに、各骨格 位置は全てのその可能なロタマー状態における各アミノ酸によって占められるこ とができる。ロタマーセットの区別される性質は、テストすべきロタマー配列の 数の単純な計算を可能とする。位置当たりm個の可能なロタマーを持つ長さnの 骨格はmn個の可能なロタマー配列を有するであろう。サーチスペースのサイズは 、nおよびmの典型的な値については、網羅的サーチを取り扱いにくいものとす る配列長さで指数関数的に増大する。この計算「爆発」はPDAのシミュレーシ ョン相で克服すべき主要な障害である。 シミュレーションアルゴリズム:計算サーチ問題を解決するためにデッドエン ド排除(DEE)理論の拡張が開発された(Desmetら、1992(前掲),Desmetら、 (1994)(前掲);Goldstein,(1994)(前掲))。DEE理論は、既知の配列を持 つ固定化骨格に蛋白質側鎖をパッキングするようにデザインされた非常に速く区 別されるサーチアルゴリズムのための基礎である。側鎖はロタマーによって記載 され、原子論的力の場を用いて、ロタマー配置をスコアリングする。DEE理論 は、もしアルゴリズムが収束すれば、全体最適化パッキングが見出されることで ある。DEE法は、位置が単一アミノ酸のロタマーに限定される制限を解放する ことによって、我々の逆折り畳みデザイン凡例に容易に拡大される。DEEのこ の拡大は、各位置におけるロタマーの数を大いに増大させ、本明細書でさらに十 分に記載されるごとく、収束を保証するにはかなり修正された実行を要する。全 体最適化のみが見出されるという保証は依然として有効であり、我々の拡張にお いては、全体的最適配列がその最適収束で見出されることを意味する。 DEEはGoldstein(Goldstein,(1994)(前掲))によって示唆された改良への 新規に付加で実行された。記載したごとく、R=1ロタマー排除およびR=0ロ タマー対標識化方程式の網羅的適用およびR=1ロタマー対標識化方程式の制限 的適用は全体解決を見出すのにルーチン的に失敗する。この問題は、「スーパー 残基」へ残基を単一化することによって克服することができる(Desmetら、(199 2)(前掲);Desmetら、(1994)(前掲);Goldstein(1994)(前掲)。しかしながら 、単一化はスーパー残基当たりのスーパーロタマーの数の管理できない増加を引 き起こし得、取り扱いにくく、遅い効率に導きかねない。というのは、R=1ロ タマー対標識化方程式を適用する計算時間はロタマーの数の第4のパワーと共に 増加するからである。残基当たりの非常に多数のロタマーについての要件が与え られれば、蛋白質デザイン適用にこれらの問題は特に重要である。メモリーサイ ズを限定し、効率を増加させるには、我々は、いずれの残基が単一化されるか、 およびR=1ロタマー対標識化方程式に含まれるロタマー(またはスーパー残基 )対の数を支配する発見的方法を開発した。PDA_SETUPからのロタマー エネルギーのリストを採用し、そのエネルギーを持つ最適立体配座における全体 最小配列をアウトプットするPDA_DEEと呼ばれるプログラムを書き込んだ 。 スコアリング機能:使用したロタマーライブラリーは、Desmetおよび共同研究 者(Desmetら、(1992)(前掲))によって使用されたものと同様であった。Met 、ArgおよびLysを除く全てのアミノ酸についてのロタマーのχ1およびχ2 角を、PonderおよびRichardsライブラリー(前掲)からの平均値の周りに±1標 準偏差拡張して、ライブラリーの不連続性から生起し得る可能な誤差を最小化し た。データベース統計からは決定されていないc3およびc4角は、Glnについて は0°および180°の値が割り当てられ、Met、LysおよびArgでは、 −60°および1800が割り当てられた。アミノ酸当たりのロタマーの数はG ly、1;Ala、1;Val、9;Ser、9;Cys、9;Thr、9;L eu、36;Ile、45;Phe、36;Tyr、36;Trp、54;Hi s、54;Asp、27;Asn、54;Glu、69;Gln、90;Met 、21;Lys、57;Arg、55である。環状アミノ酸Proは該ライブラ リーには含まれない。さらに、該ライブラリーにおける全てのロタマーは明示 的水素原子を含有した。ロタマーはドレイディング力場(Mayoら、J.Phys.Chem .94:8897(1990))からの結合長さおよび角度で作成された。 サーチで使用された配列配置のための最初のスコアリング機能は、原子ファン デルワールスポテンシャルであった。ファンデルワールスポテンシャルは、蛋白 質側鎖の特異的三次元配置の重要な決定基である排除された容量および立体的パ ッキング相互作用を反映する。ドレイディング力場からの半径および井戸深さパ ラメーターを持つLennard-Jones 12-6ポテンシャルをファンデルワールス相互作 用で使用した。1または2個の結合によって結合された原子についての非総合相 互作用は考慮しなかった。3個で結合された原子についてのファンデルワールス 半径は0.5だけ評価された。ロタマー/ロタマー対エネルギーおよびロタマー /鋳型エネルギーは、公表されたDEEアルゴリズムに合致するように計算され た(Desmetら、(1992)(前掲))。該鋳型は、蛋白質骨格および最適化されるべき でない残基位置の側鎖よりなるものであった。側鎖内ポテンシャルは計算されな かった。このスキームは、パッキング幾何学をスコアリングし、ロタマー内部エ ネルギーからの偏りを排除した。DEEに先立って、25kcal/モルより大 きい鋳型相互作用エネルギーを持つ全てのロタマーを排除した。また、その相互 作用が、もう1つの残基位置における全ての他のロタマーでの25kcal/モ ルを超える全てのロタマーを排除した。インプットとして、最適化されない位置 についての側鎖、ロタマーライブラリー、最適化されるべき位置のリストおよび 各位置において考慮すべきアミノ酸のリストを含めた骨格座標を採用するPDA _SETUPと呼ばれるプログラムを書き込んだ。PDA_SETUPはロタマ ー/鋳型およびロタマー/ロタマーエネルギーのリストをアウトプットする。 対の溶媒和ポテンシャルをDEE方法と依然として合致する2つの成分:ロタ マー/鋳型およびロタマー/ロタマー埋もれにおいて関係付けた。ロタマー/鋳 型埋もれ面積については、残基i-1、iおよびi+1のみの骨格原子を持つ残基iに おける問題のロタマーとして参照状態が規定された。側鎖の面積は、溶媒を排除 するが当該面積には計数されない骨格原子にて計算した。折り畳まれた状態は、 残基iにおける、しかし今や非最適化側鎖を含めた全鋳型構造の意味における問 題のロタマーの面積と定義された。ロタマー/鋳型埋もれ面積は参照および折り 畳まれた状態の間の差異である。ロタマー/ロタマー参照面積は、単純に、単離 されたロタマーの面積の合計である。折り畳まれた状態は、鋳型原子が存在しな い蛋白質スカフォールド上のそれらの相対的位置に置かれた2つのロタマーの面 積である。1.4Åのプローブ半径およびドレイディングファンデルワールス半 径と共に溶媒接近可能表面積のRichards定義(LeeおよびRichards,1971,前掲 )を使用した。炭素および硫黄、および全ての結合した水素を非極性とみなした 。窒素および酸素、および全ての結合水素を極性とみなした。表面積は、10Å-2 のドット密度を用いるConnollyアルゴリズムで計算した(Connolly,(1983)( 前掲))。PDA_SETUPのより最近の実行では、ScheragaのMSEEDアル ゴリズムをConnollyアルゴリズムと共に使用して、計算をスピードアップした(P errotら、J.Comput.Chem.,13:1-11(1992))。 モンテカルロサーチ:DEE最適化に従い、DEE解決の近くにモンテカルロ サーチによって配列のランク付けリストを生成させた。配列のこのリストは、理 論および現実の可能な表面間の可能な差異のため必要であった。モンテカルロサ ーチはDEEによって見出された全体最小配列において始める。側鎖はランダム に拾い、その部位において許容されるものから選択されたランダムロタマーに変 化させた。新しい配列エネルギーを計算し、もしそれが許容性についてのボルツ マン基準に適合すれば、新しい配列をもう1つのジャンプのための出発点として 使用した。もしボルツマンテストが失敗すれば、もう1つのランダムジャンプを 以前の配列から試みた。見出された最良の配列およびそれらのエネルギーのリス トをサーチを通じて維持した。典型的には、106個のジャンプがなされ、100 の配列がセーブされ、温度は1000Kに設定された。サーチが終了した後、セ ーブされた配列の全てを、温度を0Kに変化させ、アミノ酸同一性を固定し、各 々の位置における各々の可能なロタマージャンプを試みることによってクエンチ した。該サーチは、そのインプットがPDA_DEEからの全体最適解決および PDA_SETUPからのロタマーエネルギーであるPDA_MONTEと呼ば れるプログラムで実行された。アウトプットはそれらのスコアによってランク付 けされた最良配列のリストであった。PDA_SETUP、PDA_DEEおよ びPDA_MONTEはCERIUS2ソフトウェア開発環境 (Biosym/Molecular Simulation,San Diego,CA)で実行された。 モデル系および実験テスト:αラセンのホモダイマーコイルドコイルを、最初 のデザイン標的で選択した。コイルドコイルは固相技術ならびにそれらのラセン 二次構造およびダイマー三次組織化ケース特徴付けによって容易に合成される。 それの配列は、ヘプタド反復(a・b・c・d・e・f・g)と呼ばれる7残基周期的 HPパタンーンを呈する(CohenおよびParry,Proteins Struc.Func.Genet.7 :1-15(1990))。aおよびd位置は、通常疎水性であって、ダイマー界面に埋 もれ、他方、他の位置は通常は極性であって溶媒に暴露されている(図5)。シ ミュレーションインモジュールへのプットに必要な骨格は、GCN4−p1の結 晶構造から採用した(O'Sheaら、Science 254:539(1991))。該16の疎水性aお よびd位置は、蛋白質の残りの結晶学的に決定された固定化場において最適化さ れた。ホモダイマー配列対称が実施され、疎水性アミノ酸(A、V、L、I、M 、F、YおよびW)からのロタマーのみが考慮され、a位置、Asn16におけ るアスパラギンは最適化されなかった。 ホモダイマーコイルドコイルがGCN4−p1、PDB確認コード2ZTAの 骨格座標で作成された(Bernsteinら、J.Mol.Biol.112:535(1977);O'Shea ら、前掲)。最適化されていない全ての側鎖をそれらの結晶学的に決定された位 置に残した。プログラムBIOGRAF(Biosym/Molecular Simulations,San Diego,CA)を用いて、構造上の明示的水素を創製し、次いで、これをドレイデ ィング力場を用いる50工程のためにコンジュゲート勾配最小化した。最適化a およびd位置のためのロタマー基に疎水性アミノ酸を許容することのみによって 、HPパターンが実施された。該疎水性基は位置当たり238ロタマーの合計に つきAla、Val、Leu、Ile、Met、Phe、TyrおよびTrpよ りなるものであった。配列対称を侵す100kcal/モルのロタマーにペナル ティーを課すことによってホモダイマー対称が実施された。同一アミノ酸の異な るロタマーが対称関連位置で許容された。残基16でa位置を占めるアスパラギ ンが最適化されていない鋳型に残された。106工程のモンテカルロサーチを10 00Kの温度で行って、これらのスコアによってランク付けされた候補配列のリ ストを生じた。再現性をテストするために、異なるランダム数のシードで該サー チ を3回反復し、および全てのトライアルは実質的に同一の結果を供した。該モン テカルロサーチは約90分を要した。この仕事における全ての計算はSilicon Gr aphics 200MHz R4400プロセッサーで行った。 各々が238の可能な疎水性ロタマーを持つ16のaおよびd位置を最適化し た結果、23816または1038個のロタマー配列が得られた。DEEアルゴリズムは 3分以内に、ロタマーエネルギー計算時間を含めた全体最適を見出した。DEE 解決は16位置の全てについてのaおよびd残基の天然に生じるGCN4−p1 配列にマッチした。1000Kの温度で実行した100万の工程のモンテカルロ サーチは、それらのスコアによってランク付けされた配列のリストを生じた。再 現性をテストするために、該サーチは異なるランク数シードで3回反復し、全て のトライアルは実質的に同一の結果を生じた。第2の最良の配列はVal30な いしAla突然変異体であり、基底状態配列の3kcal/モル上にある。頂部 の15配列ないし基底状態配列からの6つの突然変異体が許容され、種々のパッ キング配置が小さなコイルドコイルでさえ利用できることを示す。頂部15およ びさらに2つの約15kcal/モルエネルギーが高いものからの6つを含めた (リスト中56番目および70番目)(表1)、一定の安定性の範囲を持つ8つ の配列が実験的テストで選択された。 表1 Fmoc化学、HBTU活性化およびNovanbiochemからの修正されたアミド樹 脂を用い、33残基のペプチドがApplied Biosystemsモデル433Aペプチド 合成器で合成された。標準0.1ミリモルのカップリングサイクルを使用し、ア ミノ末端をアセチル化した。スカベンジャーとしてほぼ200mgの樹脂を2m Lのトリフルオロ酢酸(TFA)および100μLの水、100μLのチオアニ ソール、50μLのエタンジオールおよび150mgのフェノールで処理するこ とによって、ペプチドを樹脂から切断した。ペプチドを単離し、沈殿によって精 製し、冷メチルtert−ブチルエーテルで反復洗浄し、続いて、0.1%TF Aを含有する直線アセトニトリル−水グラジエントを用いるVydac C8カ ラム(25cm×22mm)上で逆相HPLCを行った。次いで、ペプチドを凍 結乾燥し、使用するまで−20℃で保存した。血漿脱着マススペクトロスコピー は全ての分子量が予測された質量の1単位内であることを見出した。 円二色性CDスペクトルは、50mMリン酸、150mM NaClおよび4 0μMペプチド中にて、pH7.0で、Aviv 62DSスペクトロメーター で測定した。1mm路長のセルを使用し、熱電対によって温度を制御した。10 秒の平均時間および90秒の平衡時間にての2度温度増分を用い、同一緩衝液中 で熱融解を行った。d[θ]222/dT-1対Tプロットの最小を評価することによって 、Tm値を222nm([θ]222)における楕円率から求めた(CantorおよびSchimmel,Bi ophysical Chemistry,New York:W.H.Freemant and Company,1980)。Tmは1 度以内で再現性であった。ペプチド濃度を275nmにおけるチロシン吸光度か ら決定した(Huyghues-Despointesら、前掲)。 サイズ排除クロマトグラフィー:サイズ排除クロマトグラフィーは、0℃にて 50mMリン酸および150mM NaCl中、pH7.0でSynchropak GP C100カラム(25cm×4.6mm)で行った。GCN4−p1およびp− L1(Harburyら、Science 262:1401(1993))をサイズ標準として使用した。1m Mペプチド溶液の10μl注入を0.20ml/分でクロマトグラフィーに付し 、275nmでモニターした。ペプチド濃度はピーク高から見積もってほぼ60 μMであった。試料は三連で行った。 指名されたaおよびd配列を、b・cおよびe・f・g位置についてのGCN4 −p1配列を用い、前記したごとくに合成した。標準的な固相技術を用い、HP LC精製に続き、ペプチドの同一性を質量分析によって確認した。円二色スペク トロスコピー(CD)を用いて、二次構造および指名されたペプチドの熱安定性 をアッセイした。1℃における全てのペプチドのCDスペクトルおよび40mM の濃度は208および222nmにおいて最小を呈し、195nmで最大を呈し 、これはαラセンについての診断となる(データは示さず)。222nmにおけ る楕円率は、ペプチドの全てが>85%ラセンであり(ほぼ−28000度cm2 /dモル)であることを示し、40mMで75%ラセンであるが、170nMで 90%まで増加するPDA−3Cが例外である(表2)。 表2 PDAペプチドのCDデータおよび計算された構造特性* EMCはモンテカルロエネルギーである;ΔAnpおよびΔApは、各々、折り畳み に際しての溶媒接近可能非極性および極性表面積の変化である;ECQは平衡化さ れた電荷を用いる静電エネルギーである;ECGはGasteiger電荷を用いる静電エネ ルギーである;Evdwはファンデルワールスエネルギーである;Volは側鎖ファン デルワールス容量である;回転結合は側鎖回転可能結合の数である(メチル回転 子を除く);NpbおよびPbは、各々、埋もれた非極性および極性原子の数である 。 溶融温度(Tm)は広い範囲の値を示し(データは示さず)、8つのペプチドの うち6つは生理学的温度よりも高い温度で溶融する。また、TmはGCN4−p1 からの配列差異の数に関係付けられなかった。単一アミノ酸変化の結果、最も安 定なおよび最も安定性の低いペプチドのいくつかが得られ、これは、配列選択に おける特異性の重要性を示す。 サイズ排除クロマトグラフィーは、これらの指名されたペプチドのダイマー性 質を確認した。標準として既知のオリゴマー化状態のコイルドコイルペプチドを 用い、PDAペプチドはダイマーとして移動した。この結果は、a位置における β−分子残基およびd位置におけるロイシンの出現と一致し、これは、他の可能 なオリゴマー化状態にわたっての二量体化に好都合であることが以前に示されて いる(Harburyら、前掲)。 PDAペプチドの特徴付けは、いくつかの安定なダイマーラセンコイルドコイ ルの成功したデザインを示す。配列は、蛋白質構造のHPパターン化および立体 的特異性を明示的に考慮するよく規定されたインプットを用いるシミュレーショ ンモジュールによってデザイン凡例の意味で自動的に生じた。三次パッキングの 特異性をプローブすることを狙った2つの二次元核磁気共鳴実験は、これらのペ プチドに対するさらなる研究の焦点である。最初の実験は、GCN4−p1に匹 敵する化学的交換および化学シフト分散からのアミドプロトンの有意な保護を示 30:11615(1991))。 データ分析およびデザインフィードバック:理論的および実験的な可能な表面 の間の対応性の詳細な分析、および従って、シミュレーションコスト機能の正確 性の見積もりは、実験データの収集によって可能となった。デザイン効率の尺度 として熱安定性を用い、PDAペプチドの溶融温度を、モンテカルロサーチで見 出された配列スコアに対してプロットした(図6)。該プロットにおける適度の 修正0.67は、専らファンデルワールススコアリング機能が安定な配列につき スクリーニングできる一方で、それは相対的安定性を正確には予測しないことを 示す。この論点に向かうために、計算された構造特性およびTmの間の修正を、構 造ベースの薬物デザインで通常は使用される統計学である定量的構造活性相関を 用いて系統的に調べた(Hopfinger,J.Med.Chem.,28:1133(1985))。 表2は、ファンデルワールスベースのモンテカルロスコアおよび実験的に決定 されたTmに加えて、PDAペプチドの種々の分子特性をリストする。静電エネル ギーのごとき分子メカニックス成分、および容量のごとき幾何学的尺度を含めた 広い範囲の特性を調べた。QSARの目標は、実験的性質、この場合は計算され た特性の関数としてのTmを密接に近似する方程式の生成である。かかる方程式は 、 改良されたコスト機能でいずれの特性を使用することができるかを示唆する。P DA分析モジュールは遺伝子機能近似(GFA)(RogersおよびHopfinger,J.C hem.Inf.Comput.Scie,34:854(1994))、いずれの特性を含めるべきかを選択 するQSAR方程式および遺伝アルゴリズムを用いる特性の相対的重み付けを最 適化する新規の方法を使用する。GFAは可能な方程式のスペースの効果的なサ ーチを達成し、データに対するそれらの修正によってランク付けされた方程式の リストを精力的に生成させる。 方程式はフィットの欠如(LOF)、方程式により多い項を課すことによって 過剰フィッティングに抵抗する重み付けした最小二乗誤差によってスコアリング する(RogersおよびHopfinger,前掲)。GFAは方程式の長さおよび成分双方 を最適化し、QSAR方程式のセットを生じさせることによって、よくフィット する特性および多くの方程式で繰り返される特性の組合せを明瞭とする。シミュ レーションエネルギー(EMC)を修正する頂部の5つの方程式の全ては、非極性 表面積の埋もれΔAnpを含有する(表3)。 表3 LOFでのGFAによって生成した頂部5つのQSAR方程式、修正 計数および交差有効化スコア ΔAnpおよびΔApは、各々、折り畳みに際して埋もれた非極性および極性表面 である。Volは側鎖容量であり、Npbは埋もれた非極性原子の数であり、Ro tは埋もれた回転可能結合の数である。 EMCおよびΔAnpのみを含有するQSARの低いLOFに加えて、頂部方程式の 全てにおけるΔAnpの存在は、ペプチド安定性を予測するための臨界的特性とし ての非極性表面埋もれを強力に意味する。この結論は、蛋白質エネルギーにおけ る疎水性効果の役割を仮定すれば驚くべきことではない(Dill,Biochem, 29:7133(1990))。 特性はBIOGRAFおよびドライディングカ場を用いて計算された。溶媒接 近可能表面積は、1.4Åのプローブ半径および10Å-2のドット密度を用いる 、Connollyアルゴリズム(Connolly,(1983)(前掲))で計算した。容量は最適 化された側鎖のファンデルワールス容量の合計として計算した。埋もれた極性お よび非極性の重い原子の数は、表面積計算において5Å2未満露出される、それ らの結合水素を持つ原子として定義される。静電エネルギーは、1つの誘電体を 用いて計算し、カットオフは非極性エネルギーの計算で設定しなかった。電荷平 衡電荷(RappeおよびGoddard III,J.Phys.Chem.95:3358(1991))およびGastei ger(GasteigerおよびMarsili,Tetrahedron 36:3219(1980))電荷を用いて、静電 エネルギーを生成させた。電荷平衡電荷は手動的に調整して、中性骨格および中 性側鎖を供し、偽の単極効果を防止した。特性の選択は、特性を高度に修正する ことができない要件によって制限された。修正された特性はQSAR技術によっ て区別することができず、誘導された関係における豊富さを生じるに過ぎない。 遺伝機能近似(GFA)はCERIUS2シミュレーションパッケージバージ ョン1.6(Biosym/Molecular Simulations,San Diego,CA)で行った。3つ の特性のランダム組合せよりなる300方程式の最初の集団を生成させた。直線 項のみを使用し、特性の各セットにつき最小二乗回帰によって最初の係数を決定 した。冗長な方程式を排除し、ランダムな交差突然変異の1000生成を行った 。もし子供が集団において最悪の方程式よりも良好なスコアを有するならば、最 悪方程式を当該子供に置き換えた。また、項を付加しまたは除去する突然変異操 作者は、各生成が適用される50%確率を有するが、これらの突然変異は、スコ アが改良された場合にのみ、許容される。3項を超える方程式は許容されなかっ た。フィットの欠如(LOF)パラメーター、方程式により多くの項を課し、従 って、過剰フィッティングに抵抗するスケーリングした最小二乗誤差(LSE) 尺度を用い、進化の間方程式をスコアリングした。LOFは以下のごとくに定義 される: ここに、cは方程式における項の数であって、Mはデータ点の数である。5つの 異なるランダム化された実行を行い、最終方程式集団をプールした。シミュレー ションエネルギーEMCを含有する方程式のみを考慮し、その結果、それらのLO Fによってランク付けされた108の方程式が得られた。 これらのQSAR方程式の予測されるパワー、ならびにそれらの粗野性を評価 するために、交差有効化を行った。各ペプチドを順次データセットから除去し、 問題の方程式の係数を再度フィットさせた。次いで、この新しい方程式を用いて 、許されないデータ点を予測した。データ点の全てがこのようにして予測された ならば、測定されたTmに対するそれらの修正を計算した(表3)。EMC/ΔAnp QSARおよびEMC/ΔAnp/ΔAp QSARのみが交差有効化で実行された。該 EMC/ΔAnp方程式は、データを3つの項を持つQSARに出来る限りスムーズに フィットさせるとは予測できず、よって、より低い交差有効化r2を有した。しか しながら、全ての他の2つの項QSARは48を超えるLOFスコアを有し、交 差有効化相関は0.55未満であった(データは示さず)。該QSAR解析は、 非極性および極性表面積埋もれがシミュレーションを改良するのに必要であるこ とを実質的偏りなくして独立して予測した。この結果は原子溶媒和ポテンシャル についての以前の研究と合致する(Eisenbergら、(1986)(前掲);Wessonら、Pr otein Sci.1:227(1992))。さらに、疎水性溶媒和のごとき基礎となる原理を反 映する、埋もれた原子の数のごとき、より単純な構造尺度(Chanら、Science 267 :1463(1995))はQSAR解析によって有意とはみなされなかった。これらの結果 は現実の表面積のコストを調整するが、ある研究では、より単純なポテンシャル がよく実行されることが示されている(van Gunsterenら、J.Mol.Biol.227:3 89(1992))。 ΔanpおよびΔApをシミュレーションモジュールに導入して、コスト機能を修 正した。ロタマー/鋳型およびロタマー/ロタマー接触らの表面埋もれに対する 寄与を計算し、相互作用ポテンシャルで使用した。DEEで必要な、異なるロタ マー対からの独立計数埋もれ表面は、溶媒接近可能表面の半径がファンデルワー ル ス接触半径よりもかなり大きく、よって、密にパックされた蛋白質コアにおいて 重複できるゆえに埋もれの過剰評価に導く。この矛盾を説明するために、QSA Rで使用した面積を、対の面積方法を用いて再度計算し、新しいEMC/ΔAnp/Δ ApQSAR方程式を生成させた。ΔAnpおよびΔAp係数に対するEMC係数の比率は 、埋もれた表面積をエネルギーに変換するためにシミュレーションモジュールで 使用されるスケール因子、すなわち、原子溶媒和パラメーターである。熱安定性 はこのコスト機能によってよく予測される(図6B)。加えて、改良されたコス ト機能は、基底状態としての天然に生じるGCN4−p1配列を依然として予測 する。エネルギースケール因子に対する表面積、16cal/モル/Å2好都合 非極性面積埋もれおよび86cal/モル/Å2対向極性面積埋もれは小さな分 子移動データに山来する溶媒和ポテンシャルパラメーターに対する徴候、スケー ルおよび相対的大きさにおいて同様である(WessonおよびEisenberg,前掲)。 λリプレッサー突然変異体:コスト機能の一般性を証明するために、シミュレ ーションモジュールを用いて他の蛋白質を調べた。DNA結合蛋白質λリプレッ サーのコア突然変異体のライブラリーは、Sauerおよび共同研究者によって広く 特徴付けられている(LimおよびSauer,J.Mol.Biol.219:358(1991))。鋳型の 座標はPDBファイル1LMBから採用した(BeamerおよびPabo,J.Mol.Biol .227:177(1992))。該PDBファイルにおけるサブセット指名鎖4は(サブユ ニットおよびDNAを伴う)構造の残りから除去され、BIOGRAFを用い、 明示的水素が付加された。3つの突然変異体部位(V36 M40 V47)の 5Å内の側鎖を持つ疎水性残基はY22、L31、A37、M42、L50、F 51、L64、L65、168およびL69である。これらの残基の全ては、6 5%埋もれであるM42および45%埋もれであるL64を除き、80%を超え る埋もれである。A37のみが1つの可能なロタマーを有し、よって、最適化さ れなかった。5Å球中の他の9つの残基は、それらのアミノ酸(「浮いたもの」 )のいずれかのロタマー立体配座を採ることを可能とした。突然変異部位は、問 題のアミノ酸配列のいずれかのロタマーを可能とした。突然変異体配列に応じて 、5×1016ないし7×1018立体配座が可能であった。ロタマーエネルギーおよび DEE計算時間は2ないし4分であった。組み合わせた活性スコアは HellingaおよびRichards(Hellingaら、(1994)(前掲))のものである。125個 の可能な組み合わせのうち78個が生成された。また、このデータセットを用い て、いくつかの計算されたスキームがテストされており、異なる力場を比較する ための基礎として働くことができる(LeeおよびLevitt,Nature 352:448(1991); van GunsterenおよびMark,前掲;Hellingaら、(1994)(前掲))。QSARによっ て見出されたコスト機能を用い、シミュレーションモジュールを用いて、各突然 変異体配列についての最適立体配座およびエネルギーを見出した。3つの突然変 異体部位の5Å内の全ての疎水性残基もまた、自由にされて、該アルゴリズムに よって緩和された。この5Å球は12の残基を含有し、以前の努力よりもかなり 大きな問題であり(LeeおよびLevitt,前掲,Hellinga(1994)(前掲))、これはシ ミュレーションモジュールのDEE成分によって迅速に最適化された。Hellinga およびRichardsによって提案された組み合わせた活性スコアに対する予測された エネルギーのランク修正は図7に示す。野生型は125の可能な配列の最低エネ ルギーを有し、修正は、QSAR修正したコスト機能がコイルドコイルに特異的 ではなく、他の特性を適当に作成できることを示す以前に公表された結果と実質 的に同等である。 実施例2 蛋白質ラセンの表面位置の自動デザイン GCN4−p1、ホモダイマーコイルドコイルは、固相技術によって容易に合 成することができ、そのラセン二次構造およびダイマーの三次組織は容易に特徴 付けられるので、モデル系として再度選択した。ホモダイマーコイルドコイルの 配列は、ヘプタド反復と呼ばれる7つの残基周期的疎水性および極性パターン( a・b・c・d・e・f・g)を呈する(CohenおよびParry、前掲)。aおよびd位置は ダイマー界面に埋もれ、通常は疎水性であるが、b、c、e、fおよびg位置は 溶媒に暴露され、通常は極性である(図5)。GCN4−p1の結晶構造の調査 (O'Sheaら、前掲)は、b、cおよびf側鎖が溶媒まで拡張され、それらの表面積 の少なくとも55%露出されることを示す。対照的に、eおよびg残基は、対向 するラセンのaおよびb残基に対してパッキングすることによって、そされ らの表面積の50ないし60%埋もれる。我々は、表面配列デザインのために1 2のb、cおよびf残基を選択した:PDBエントリー2ztaを用い位置3、 4、7、10、11、14、17、18、21、24、25および28(Bernst einら、J.Mol.Biol.112:535(1977))。全ての他の側鎖および骨格を含めた 蛋白質構造の残りを、配列選択計算のために鋳型として使用した。ダイマーの対 称およびサブユニット間の表面残基の相互作用の欠如は各サブユニットの独立し たデザインを可能とし、それにより、配列最適化蛋白質のサイズをかなり減少さ せる。 12の表面位置のための疎水性アミノ酸(D、E、N、Q、K、R、S、T、 AおよびH)の全ての可能な配列は、我々のデザインアルゴリズムによってスク リーニングした。アミノ酸側鎖のトーション柔軟性は、ロタマーと呼ばれる、各 側鎖の許容されたコンフォーマーの区別されるセットを考慮することによって説 明された(Ponderら、1987,(前掲);Dunbrackら、Struc.Biol.Vol.1(5):334-3 40(1994))。各々10個の可能なアミノ酸を持つ12のb、cおよびf位置を最 適化する結果、DunbrackおよびKarplus骨格-依存性ロタマーライブラリーを用い る場合、〜1028ロタマー配列に対応する1012の可能な配列が得られる。ロタマー 配列最適化によって提示される巨大なサーチ問題はデッドエンド排除(DEE) 理論(Desmetら、(1992)(前掲);Desmetら、(1994)(前掲);Goldstein(1994)(前 掲))の適用によって克服される。DEE理論の我々の実行は配列デザインのそ の利用性まで拡大され、その最適立体配座における全体最適配列を迅速に見出す 。 我々は、表面配列をスコアリングするにおけるそれらの有効性のためにポテン シャルエネルギー機能を調べた。各候補スコアリング機能を用いて、モデルコイ ルドコイルのb、cおよびf位置をデザインし、得られたペプチドを合成し、特 徴付けて、デサイン効率を評価した。水素結合ポテンシャルを用いて、蛋白質お よびペプチドにおける水素結合の実験から予測されるように(Stickleら、前掲;H uyghues-Despointesら、前掲),予測された水素結合がデザインされた蛋白質安 定性に寄与できるかをチェックした。しかしながら、水素結合についての配列の 最適化は、水素結合に関与しない極性ドナーをしばしば埋もれさせる。この補償 されない、水に対する可能な水素結合ポテンシャルの喪失は、極性プロトンの埋 もれに対するペナルティーと組み合わせた水素結合ポテンシャルよりなる第2ス コアリングスキームの調査を促進した(Eisenberg,(1986)(前掲))。Baldwin および共同研究者の経験的に誘導されたラセン特性を持つ水素結合ポテンシャル を増加させる第3のスコアリングスキームをテストした(Chakrabarttyら、前掲) 。ラセン特性の物理的基礎は不明瞭であるが、それらは蛋白質安定性に対して有 意な効果を有することができ、蛋白質デザインを改良するために潜在的に使用す ることができる(O’NeilおよびDeGrado,1990;Zhangら、Biochem,30:2012(199 1);Blaberら、Science 260:1637(1993);O'sheaら、1993;Villegasら、Folding a nd Design 1:29(1996))。ファナデルワールスポテンシャルを全ての場合に使 用してパッキング相互作用および排除された容量を説明した。 また、b、cおよびf位置に対するいくつかの他の配列を合成し、特徴付けて 、水素結合およびラセン特性ポテンシャルの相対的重要性を認識するのを助力し た。水素結合ポテンシャルでデザインした配列をランダムに掻き混ぜ、それによ り、デザインした相互作用を破壊するが、配列のラセン特性は変化させない。ま た、最大可能ラセン特性、アラニンに対して設定された全ての位置を持つ配列を 作成した。最後に、デザインされていない対照として供するために、天然に生じ るGCN4−p1配列および疎水性アミノ酸セットからランダムに選択された配 列を合成し、実験した。 配列デザイン:スコアリング機能およびDEE:GCN4−p1、PDB記録 2ztaの骨格座標に対して蛋白質構造を作成した(Bernsteinら、前掲;O'Shea ら、前掲))。最適化されなかった全ての側鎖の原子は、それらの結晶学的に決 定された位置に残した。プログラムBIOGRAF(Molecular Simulations In corporated,San Diego,CA)を用いて、構造上に明示的水素を生じさせ、次い で、これを、ドレイディング力場を用いる50工程につきコンジュゲート勾配最 小化した(Mayoら、1990,前掲)。ダイマーの対称およびサブユニット間の表面 残基の相互作用の欠如は、各サブユニットの独立したデザインを可能とした。全 ての計算は、2ztaに出現する最初のモノマーを用いて行った(鎖A)。骨格 −依存性ロタマーライブラリーを用いた(Dunbrackら、 (1993)(前掲))。データベース統計学から決定されないc3角は以下の値を割り当 てた;Arg、−60°、60°および180°;Gln、−120°、−60 °、0°、60°、120°、および180°;Glu、0°、60°および1 20°;Lys、−60°、60°および180°。データベース統計学から決 定されないC4角は以下の値を割り当てた:Arg、−120°、−60°、6 0°、120°および180°;Lys、−60°、60°および180°。逐 次g+/g-角またはg-/g+の結果となるc3およびc4の組合せを持つロタマーを 排除した。未荷電Hisロタマーを使用した。0.9のスケールとしたファンデ ルワールス半径でのLennard-Jones 12−6ポテンシャル(Dahiyatら、First f ully automatic design of a protein achieved by Caltech scientists,new p ress release(1997))をファンデルワールス相互作用で使用した。水素結合ポ テンシャルは、前記方程式9に示されるごとく、距離−依存性項および角度−依 存性項よりなるものであった。この水素結合ポテンシャルはドレイディングで使 用されるポテンシャルに基づくものであり、不都合な水素結合幾何学の発生を制 限するより制限的角度−依存性項を持つ。該角度項は、前記方程式10に示すよ うに、ドナーおよびアクセプターの混成状態に応じて変化する。 方程式10〜13において、θはドナー−水素−アクセプター角であり、φは 水素−アクセプター−ベース角(該ベースはアクセプターに結合した原子である 、例えば、カルボニル原子はカルボニル酸素アクセプターについてのベースであ る)であり、ψはsp2中心に結合した6つの原始によって規定される平面の法線 間の角度である(ψが90°未満である場合、ψの補角を用いる)。水素結合機 能は、sp3ドナー−sp3アクセプターの場合に2.6Å<R<3.2Å、φ>90 °、f−109.5°<90°であって、sp3ドナー−sp2アクセプターの場合に φ>90°であれば評価するに過ぎない;スイッチング機能は使用しなかった。 鋳型−鋳型水素結合に関与する鋳型ドナーおよびアクセプターはドナーおよびア クセプターのリストに含めなかった。排除の目的では、鋳型−鋳型水素結合は、 2.5Å≧R≧3.3Åであってθ≧135°である場合に存在するとみなした 。使用する場合、極性水素埋もれについての2kcal/モルのペナルティーを 水素結合に関与しない埋もれた極性水素に適用したに過ぎず、ここに、水素結合 は EHBは−2kcal/モル未満である場合に存在するとみなした。このペナルテ ィーは鋳型水素には適用しなかった。水素結合ポテンシャルには40Rの距離− 依存性誘電定数を含んだ弱いクーロン項を補足し、ここに、Rは原子間距離であ る。部分的原子電荷は極性官能基のみに適用した。+1の正味の形式電荷をAr gおよびLysで使用し、−1の正味の形式電荷をAspおよびGluで使用し た。α−ラセン特性に関するエネルギーは前記方程式14を用いて計算した。方 程式14において、Eαはα−ラセン特性のエネルギーであり、ΔG0 aaはアミノ 酸のラセン成長の標準自由エネルギーであって、Nssは3.0に設定した特性ス ケール因子である。このポテンシャルは、特性エネルギーをスコアリング機能に おける他の項と同様の範囲までのスケールとするために選択した。該DEE最適 化は我々の以前の方法に従った(Dahiyatら、(1996)(前掲))。計算は12プ ロセッサー、R10000−ベースのSilicon Graphics Power Challengeまたは 512 node Intel Deltaいずれかで行った。 ペプチドの合成および精製ならびにCD解析は実施例1におけるものと同様で あった。NMRスペクトルは90/10H2O/D2OおよびpH7.0の50mMリン酸ナ トリウム緩衝液中で調製した。スペクトルは25℃においてVarian Unityplus 600MHzスペクトロメーターで獲得した。32の過渡電流は水抑止で使用さ れる溶媒プレ飽和の1.5秒で獲得した。試料は〜1mMであった。サイズ排除 クロマトグラフィーは0℃にて50mMリン酸および150mM NaCl中、 pH7.0にて、PolyLCヒドロキシエチルAカラム(20cm×9mm)で行 った。GCN4−p1およびp−L1(Harburyら、前掲)は、各々、ダイマー およびテトラマー用のサイズ標準として使用した。〜1mMペプチド溶液の5μ l注入を0.50ml/分でクロマトグラフィーに付し、214nmにてモニタ ーした。試料は三連で実行した。 この実験で調べたペプチドの全ての表面配列を表4に示す。 表4 合成されたペプチドの配列および特性明瞭性のため、デザインされた表面残基のみを示し、それらを位置(b、cおよ びf)によってグループ分けした。デザインされた位置の配列数は3、4、7、 10、11、14、17、18、21、24、25および28である。融点(Tm )は円二色性によって測定し、オリゴマー化状態(N)はサイズ排除クロマトグ ラフィーによって決定した。ΣΔG°は12b、cおよびf位置のラセン成長の 標準自由エネルギーの合計である(Chakrabarttyら、1994)。デザイン方法の略 語は:水素結合(HB)、極性水素埋もれペナルティー(PB)、およびラセン 特性(HP)である。 水素結合ポテンシャルでデザインした配列6Åは、相互に多数の水素結合を形 成することが予測されるArgおよびGlu残基を有する。これらの長鎖アミノ 酸は、相互と、および骨格と相互作用するラセンのターンを横切って伸びること ができるので好都合である。掻き混ぜた6A配列の6Dの最適幾何学がDEEで 見い出されたならば、非常に少ない水素結合相互作用しか存在せず、そのスコア は6Aよりもかなり悪い。水素結合ポテンシャルに加えて極性水素埋もれペナル ティーでデザインした6Bは、Lys、GluおよびGlnのごとき長い残基に よって依然として支配されているが、Argはより少ない。Argは他のアミノ 酸よりも極性の水素を有しているゆえに、それは非水素結合プロトンをよりしば しば埋もれさせ、従って、このポテンシャル機能を使用する場合不都合である。 6Cは水素結合ポテンシャルおよびスコアリング機能におけるラセン特性でデザ インし、全部がAlaおよびArg残基(最高のラセン特性を持つアミノ酸)よ りなる(Chakrabarttyら、前掲)。Arg残基は近くのeおよびg位置のGlu残 基とで水素結合を形成する。ランダム親水性配列6Eは水素結合を保有せず、使 用するポテンシャル機能の全てで非常に貧弱なスコアである。 ペプチドの二次構造および熱安定性は円二色性(CD)スペクトロスコピーに よって評価した。1℃および40μMにおけるペプチドのCDスペクトルは、ラ ンダム表面配列ペプチド6Eを除いてαラセンに特徴的であり、208nmおよ び222nmで最小である。6Eは、−12000度cm2/dモルの[θ]222を持 つαラセンおよびランダムコイルの混合物を示唆するスペクトルを有する。デザ インされたペプチドの融点(Tm)は、15℃のTmを有する6Eを除いて、GCN 4−p1のTmよりも12〜16℃高い。溶融の前および後に取ったCDスペクト ルは同一であり、これは、可逆的熱変性を示す。このコイルドコイルの表面位置 のデザインは野生型GCN4−p1よりもかなり安定した構造を生じる一方で、 ランダム親水性配列はペプチド安定性を大いに破壊する。 サイズ排除クロマトグラフィー(SEC)は、全てのペプチドが6Fを除いて ダイマーであり(全てのAla表面配列)、これはテトラマーとして移動したこ とを示した。これらのデータは、表面デザインが、いくつかのコア再デザインと は対照的に、これらのペプチドの三次構造を変化させなかったことを示す(Harb uryら、前掲)。加えて、〜1mMにおけるペプチドの核磁気共鳴(NMR)ス ペクトルは、GCN4−p1と同様の化学シフト分散を示した(データは示さず )。 水素結合ポテンシャルでデザインしたペプチド6AはGCN4−p1について の57℃に対して71℃で溶融し、これは、表面残基の合理的デザインが天然に 生じるコイルドコイルよりも顕著に安定した構造を生じ得ることを示す。安定性 のこの獲得は、恐らくは、改良された水素結合によるものではない。というのは 、掻き混ぜた配列を除いて6Aと同一の表面アミノ酸組成を有し、予測された水 素結合を有しない6Dもまた71℃で溶融するからである。さらに、6Bは異な るスコアリング機能でデザインし、予測される水素結合のセットを有するが、7 2℃の非常に似たTmを有する。 GCN4−p1に対するこれらの配列の増大した安定性についての別の説明は これらのより高いラセン特性である。水素結合ポテンシャルによって選択された 長い極性残基Lys、Glu、ArgおよびGlnもまた最良のラセンフォーマ ーの中にある(Chakrabarttyら、前掲)。ラセン特性の効果は、特にラセン末端 から離れれば、水素結合のそれと同程度には配列位置に依存しないので、6Aの 配列の掻き混ぜからはほとんど効果が予測されないであろう。表面配列のラセン 特性の粗い尺度である、ラセン成長の標準自由エネルギー(ΣΔG°)(Chakra bartyら、前掲)は、ペプチドの熱安定性に対応する(表4)。ΣΔG°はペプ チド安定性における傾向にマッチするが、それはこれらのコイルドコイルの増大 した安定性に定量的には相関しない。 ペプチド6Cはスコアリング機能の一部としてのラセン特性でデザインし、そ れは−2.041kcal/モルのΣΔG°を有する。6CはGCN4−p1よ りも安定であるが、69℃のTmは、6Cのより高いラセン特性にも拘わらず、 6Aおよび6Bよりもわずかに低い。同様に、6Fは全てのAla配列および− 3.096kcal/モルで可能な最高のラセン特性を有するが、73℃のTmは 6Aまたは6Bのそれよりもわずかに高いに過ぎない。また、6Fは、恐らくはそのポ リ(Ala)表面が会合を媒介し得る大きな疎水性パッチを露出しているため、SEC の間、ダイマーとしではなくテトラマーとして移動する。6Cおよび6Fについての 結果は、ラセン特性が表面デザインに重要であるという結論を支持するが、それ は専ら特性を使用するにおいて可能な制限を指摘する。増大する特性は、恐らく は、他の因子が不都合に影響されているゆえに、構造に対して最大の安定性を必 ずしも付与しない。また、6Fから明らかなように、蛋白質の三次構造の変化が起 こり得る。 これらのペプチドの特徴は、表面残基がα−ラセンコイルドコイルの安定性に 対して劇的なインパクトを有することを明瞭に示す。異なる表面デザインによっ て呈される安定性の広い範囲が顕著であり、ランダム親水性配列(Tm 15℃) およびデザインされた配列(Tm 69〜72℃)の間に50℃を超えて広がる。 この結果は、溶媒暴露残基の重要性を証明する他の蛋白質についての研究(O'Nei l & DeGrado,1990;Zhangら、1991;Minorら(1994)(前掲);Smithら、Science 270:980-982(1995))と合致する。さらに、これらのデザインは野生型 GCN4−p1配列よりもかなり高いTmを有し、これは、表面残基が蛋白質デザ インにおいて安定性を改良するのに使用できることを示す(O'sheaら、前掲)。 ラセン特性はデザインされたコイルドコイルを安定化するにおいて水素結合より も重要であるようであるが、水素結合は他のタイプの二次構造のデザインおよび 安定化で重要であり得る。 実施例3 ファンデルワールス、H−結合、二次構造および溶媒和スコアリング機能を 用いるコア、表面および境界残基を含有する蛋白質のデザイン 本実施例では、コア、境界および表面残基の仕事を組み合わせた。我々のデザ イン方法の統合をテストするためのモチーフを選択するにおいて、我々は、計算 上および実験上取り扱いやすいのに十分な位小さいが、ジスルフィド結合または 金属結合部位の不存在下で独立して折り畳まれた構造を形成するのに十分な位大 きい蛋白質折り畳みを求めた。我々は、亜鉛フィンガーDNA結合モジュールに よって典型化されたββαモチーフを選択した(Pavletichら、(1991)(前掲) )。それは30未満の残基よりなるが、このモチーフはシート、ラセン、および ターン構造を含む。さらに、この構造を採る、異常アミノ酸(D−プロリン)お よび非天然アミノ酸(3−(1,10−フェナントロール−2−イル)−L−ア ラニン)を含有する、23残基ペプチドをデザインしたImperialおよび共同研究 者による最近の仕事は、金属イオンの不存在下で形成されるこの折り畳みの能力 を証明した(Struthersら、1996a)。Brookhaven Protein Data Bank(PDB)(B ernsteinら、1977)は、ββαモチーフの高い分解構造について調べ、DNA結 合蛋白質Zif268(PDBコード1zaa)の第2亜鉛フィンガーモチーフ が我々のデザイン鋳型として選択された(Pavletichら、(1991)(前掲))。第 2のモジュールの骨格は、Zif268中の他の2つの亜鉛フィンガーと、およ び他の蛋白質中の亜鉛フィンガーと密接に整列し、従って、この折り畳みクラス の代表的なものである。我々の位置1に対応するPDBエントリー1zaaのナ ンバリングにおいて、リシン33で開始する結晶構造から28の残基が採られた 。第1の12残基は第6および第7位置におけるきついターンを持つ βシートを含む。2つの残基は該シートをラセンに結合させ、これは、位置26 を通って伸び、最後の2つの残基によってキャップを付されている。 コア、表面または境界クラスに鋳型構造における残基位置を割り当てるために 、Zif268における側鎖埋もれの程度およびCα−Cβベクトルの方向を調 べた。小さいサイズのこのモチーフはコアに明瞭に割り当てることができる残基 の数を1つに制限し(位置5)、他方、6つの残基(位置3、12、18、21 、22および25)を境界として分類した。これらの残基のうちの3つはシート (位置3、5および12)からのものであり、4つはラセン(位置18、21、 22および25)からのものである。Zif268の亜鉛結合残基のうちの1つ はコアにあり、2つは境界にあるが、第4の位置8は蛋白質の幾何学的中心から 離れた方向のCα−Cβベクトルを有し、従って、表面位置として分類される。 デザインアルゴリズムによって考慮された他の表面位置はシートからの4、9お よび11、ラセンからの15、16、17、19、20および23であり、ラセ ン末端をキャップする14、27および28である。ターンにある残りの露出位 置は不規則な骨格二面を有するか、あるいは部分的に埋もれ、この最初の研究の ためには配列選択に含めなかった。我々の以前の研究におけるごとく、配列選択 の間にコア位置において考慮されたアミノ酸はA、V、L、I、F、YおよびW であり;表面位置で考慮されたアミノ酸はA、S、T、H、D、N、E、Q、K およびRであり;組み合わせたコアおよび表面アミノ酸(16アミノ酸)は境界 位置で考慮された。 全体として、鋳型の28位置うちの20は配列選択の間に最適化された。アル ゴリズムは、まず、0°を超えるφ角を持つ全ての位置につきGlyを選択して 骨格歪みを最小化する(残基9および27)。18の残りの残基は2つのセット に分け、別途に最適化して計算を速めた。1つのセットは1のコア、6の境界位 置および位置8を含み、この結果、4.3×1019ロタマー配列に対応する1.2 ×109の可能なアミノ酸配列となる。他のセットは、1010の可能なアミノ酸配列 および4.1×1023のロタマー配列を有する残りの10表面残基を含んだ。各群 内には強い相互作用があるものの、2つの群は相互に強くは相互作用せず、配列 最適化を相互に独立したものとする。各最適化は、結晶学的座標に当てられた鋳 型中の非最適化位置で行った。 2つの計算から見出された最適配列を組合せ、Zif268の第2亜鉛フィン ガーからの配列と整列させて図8に示す。親水性アミノ酸の全ては境界位置にお いて考慮されたが、非極性アミノ酸のみが選択された。計算された7つのコアお よび境界位置は十分にパッキングされた埋もれたクラスターを形成する。亜鉛結 合His位置、21および25においてアルゴリズムによって選択されたPhe 側鎖は80%埋もれ、5におけるAlaは100%埋もれ、他方、8におけるL ysは溶媒に対して60%暴露されている。他の境界位置は、Zif268と同 様の配置中に同様な側鎖をパッキングすることによる埋もれた残基に対する強力 な立体的拘束を示す。計算された最適立体配座は非極性表面に〜830Å2埋も れ、Phe12(96%埋もれ)およびLeu18(83%埋もれ)が該クラス ターに係留されている。ラセン表面では、アルゴリズムは、その側鎖カルボニル 酸素および残基16の骨格アミドプロトンの間の水素結合を持つラセンN−キャ ップとしてAsn14を位置させる。該ラセン上の6つの荷電残基は3対の水素 結合を形成するが、我々のコイルドコイルデザインでは、ラセン表面水素結合は 配列の総じてのラセン特性よりも重要性は低いようである。露出されたシート表 面の位置4および11はThr(最良β−シート形成残基のうちの1つ)(Kim & Berg,1993;Minorら、(1994)(前掲);Smithら、(1995)(前掲))であるよう に選択される。 20のデザインされた位置を残りの8部位におけるZif268アミノ酸と組 み合わせた結果、Zif268に対して総じて39%(11/28)相同性を持 つペプチドが得られ、これは、デザインされた位置のみが考慮される場合、15 %(3/20)相同性まで低下する。National Center for Biotechnology Info rmationの非豊富蛋白質配列データベースのBLAST(Altschulら、1990)サー チは、いくつかの亜鉛フィンガー蛋白質および他の関係しない蛋白質の断片に対 して40%未満の弱い相同性を見いだす。0.26未満の有意性値を有するアル ゴリズムはない。Zif268鋳型上の28残基のうちの20を目的的に選択す ることによって、公知の蛋白質に対してほとんど相同性を持たず、亜鉛結合部位 を持たないペプチドがデザインされた。 実験的特徴付け:デザインされたモジュールの遠紫外円二色性(CD)スペク トルpda8dは、折り畳まれた構造の指標である、195nmにおける極大お よび218nmおよび208nmにおける極小を示す。熱溶融は39℃における 屈曲点とは弱く協働し、完全に可逆的である。ブロードな溶融は、小さな疎水性 コアを持つモチーフに予測される折り畳みのエントロピーと合致する。この挙動 は他の短いペプチドで観察された非協働的転移とは対照的である(Weiss & Keut mann,1990;Scholtzら、PNAS USA 88:2854(1991);Struthersら、J.Am.Chem.S oc.118:3073(1996b))。 100μMおよび7℃および25℃における沈降平衡は、3490の分子質量 を与え、これは3362の計算された質量と良好に一致し、該ペプチドはモノマ ーであることを示す。しかしながら、500μMを超える濃度では、データは、 理想的な単一種モデルと良好にはフィットしない。データがモノマーダイマーテ トラマーに良好にフィットする場合、モノマー対ダイマーにつき0.5〜1.5 mMの、ダイマー対テトラマーにつき4mMを超える解離定数が見いだされたが 、相互作用は余りにも低くてこれらの値を正確には測定できなかった。水−sL EDプラス配列(Altieriら、1995)を用いる拡散係数測定は沈降結果と一致し ;100μMにおいて、pda8dはモノマー亜鉛フィンガー対照のそれに近い 拡散係数を有し、他方、1.5mMにおいては、拡散係数は蛋白質Gβ1、56 残基蛋白質と同様である。pda8dのCDスペクトルは、10μMないし2. 6mMでは濃度非依存的である。2.1mMおよび100μMで採られたNMR COSYスペクトルは、0.1ppm未満シフトしたHα−HNクロスピークの 5とほとんど同一であり、クロスピークの残りは変化しないままである。これら のデータは、pda8dが高濃度では弱い会合を受けるが、この会合はペプチド 構造に対しては実質的に効果を有しないことを示す。 pda8dのNMR化学シフトはよく分散しており、当該蛋白質が折り畳まれ 、より配向していることを示唆する。TOCSYスペクトルのHα−HNフィン ガープリント領域はよく分解され、重複する共鳴はなく(図(9a))、Hαお よびHN共鳴の全ては帰属決定された。NMRデータは、自己シールドz−グラ ジエントでのNalorac逆相を備えたVarian Unityplus 600MHzスペ ク トロメーターで収集した。NMR試料はpH5.0の50mMリン酸ナトリウム を含む90/10H2O/D2Oまたは99.9%D2O中で調製した。試料のpHはガラス電 極を用いて調整し、測定されたpHに対するD2Oの効果については修正しなかっ た。帰属決定のための全てのスペクトルは7℃で収集した。試料濃度はほぼ2m Mであった。NMR帰属決定は、DQF−COSY、NOESYおよびTOCS Yスペクトルを用い、標準的等核方法に基づいた(Wuthrich,NMR of Proteins and Nucleic Acids(John Wiley & Sons,New York,1986))。NOESYおよ びTOCSYスペクトルはF1における2K点およびF1における512増分で 獲得し、DQF−COSYスペクトルはF2における4K点およびF1における 1024増分で獲得した。全てのスペクトルは7500Hzのスペクトル幅およ び32過渡電流で獲得した。NOESYスペクトルは100および200ミリ秒 のミキシング時間で記録し、DQF−COSYスペクトルは80ミリ秒の等方性 ミキシング時間で記録した。TOCSYおよびDAF−COSYスペクトルにお いては、水抑止は、各々、1.5および2.0秒の緩和遅れの間にプレ飽和によ って達成された。NOESYスペクトルにおける水抑止は、WATERGATE プラス配列(Piottoら、1992)で達成された。化学シフトはHOD共鳴に対して 参照した。スペクトルはF2およびF1双方においてゼロを満たし、F2におけ るシフトしたガウスおよびF1における余弦ベル(NOESYおよびTOCSY )またはF2における30°シフトした正弦ベルおよびF1におけるシフトした ガウス(DQF−COSY)でアポダイズ(apodize)した。 Water−sLED実験(Altieriら、1995)はpH5.0の50mMリン酸 ナトリウムを含む99.9%D2O中、1.5mM、400μMおよび100μ Mにて25℃で実行した。軸方向勾配場強度は3.26ないし53.1G/cm で変化し、50ミリ秒の拡散時間を使用した。スペクトルは2Hz直線ブロード ニングおよび芳香族の積分で処理し、高場脂肪族プロトンを計算し、共鳴増幅を 勾配強度に関連付ける方程式にフィットさせて、拡散係数を抽出した(Altieri ら、1995)。拡散係数は、各々、1.5mM、400μMおよび100μMにお いて1.48×10-7、1.62×10-7および1.73×10-7cm2/sであ った。亜鉛フィンガーモノマー対照についての拡散定数は1.72×10-7cm2 /s であり、蛋白質Gb1については1.49×10-7cm2/sであった。 全ての明瞭な配列および中程度−範囲NOEを図9Aに示す。Hα−HNおよ び/またはHN−HN NOEはR6−17およびK16−E17(共に、縮重 HN化学シフトを有する)、および縮重Hα化学シフトを有するP2−Y3を除 いて、残基の全ての対について見いだされた。しかしながら、NOEが、逐次H pda8dの構造は共有結合構造が豊富でない354NOE拘束(残基当たり 12.6拘束)を用いて決定された。32構造のアンサンブル(データは示さず )は、混成距離幾何学でシミュレートしたアニーリングのための標準的プロトコ ルにて、X−PLOR(Brunger,1992)を用いて得られた。該アンサンブルに おける構造は良好な共有結合幾何学を有し、0.3Åを超えるNOE拘束侵害は なかった。表5に示すごとく、骨格は、無秩序末端(残基1、2、27および2 8)を排除した場合、0.55Åの平均からの根平均二乗(rms)偏差でよく 規定された。骨格(3−26)+埋もれた側鎖(残基3、5、7、12、21、 22および25)のためのrms偏差は1.05Åであった。 表5 pda8dのNMR構造決定:距離拘束、構造拘束、原子の根平均二乗( rms)偏差、およびデザイン標的との比較。<SA>は32のシミュレートし たアニーリング構造であり、SAは平均構造であり、SDは標準偏差である。デ ザイン標的はZif268の骨格である。*原子rms偏差は、包括的に、残基3ないし26である。末端、残基1、2、 27および28は高度に乱れ、非逐次または非残基内接触は非常に少なかった。 pda8dのNMR解決構造は、それが、デザイン標的にマッチするよく規定 された二次構造要素および三次組織化を持つbbaモチーフへ折り畳まれること を示す。pda8d解決構造に対するデザイン鋳型、Zif268の第2亜鉛フ ィンガーの骨格に対する直接的比較は、それらの類似性を強調する(データは示 さず)。デザイン標的に対するpda8d骨格の整列は優れており、原子rms 偏差は1.04Åである(表5)。pda8dおよびデザイン標的は、二次構造 要素を結合させるターンを含めた、それらの全構造を通して対応する。 結論において、pda8dの実験的特徴付けは、それが折り畳まれ、よく秩序 だっており、弱く協働する熱転移であり、およびその構造がデザイン標的に対す るすぐれたマッチであることを示す。我々の知識では、pda8dは、金属結合 、オリゴマー化またはジスルフィド結合形成なくしてユニークな構造に折り畳ま れる天然に生じるアミノ酸の最も短い配列である(McKnightら、Nature Struc.B iol.4:180(1996))。pda8dの成功したデザインは、蛋白質デザインのため の目的的定量的配列選択アルゴリズムの使用を支持する。この粗野性は、当該プ ログラムがドオノボ(de novo)骨格についての配列をデザインするのに使用で きることを示唆する。 実施例4 コア領域におけるスケーリングしたファンデルワールス スコアリング機能を用いる蛋白質のデザイン コアパッキングを実験するための理想的なモデル系はストレプトコッカス蛋白 質G(Gβ1)のβ1免疫グロブリン−結合ドメインである(Gronenbornら、Sci ence 253:657(1991);Alexanderら、Biochem.31:3597(1992);Barchiら、Protein Sci.3:15(1994);Gallagherら、1994;Kuszewskiら、1994;Orbanら、1995)。そ の小さいサイズ56残基は計算および実験を取り扱いやすくする。恐らくは、コ アパッキング研究で最も臨界的なものは、Gβ1がジスルフィド結合を含まず、 折り畳みに対して共因子または金属イオンを必要としないことである。さらに、 Gβ1はシート、ラセンおよびターン構造を含み、コイルドコイルまたはいくつ かのラセン束で見いだされる反復側鎖パッキングパターンがないことである。周 期性のこの欠如は特定の二次または三次構造からの偏りを減少させ、パッキング 効果を調べるために目的的側鎖選択プログラムの使用を必要とする。 コアを構成する配列位置は、Gβ1の側鎖溶媒接近可能表面領域を調べること によって選択した。その表面の10%未満のいずれかの側鎖露出は埋もれたとみ なした。11の残基がこの基準に適合し、7つはβシートからのものであり(位 置3、5、7、20、43、52および54)、3つはラセンからのものであり (位置26、30および34)、および1つは不規則二次構造からのものである (位置39)。これらの位置は連続的コアを形成する。全ての他の側鎖および骨 格を含めた、蛋白質構造の残りは、11のコア位置における配列選択計算のため の鋳型として用いた。 アラニン、バリン、ロイシン、イソロイシン、フェニルアラニン、チロシンま たはトリプトファン(A、V、L、I、F、YまたはW)よりなる全ての可能な コア配列を考慮した。我々のロタマーライブラリーはDesmetおよび共同研究者に よって使用されたものと同様であった(Desmetら、(1992)(前掲))。全ての1 1位置における217の可能な疎水性ロタマーを持つGb1のコアの配列を最適 化する結果、21711または5×1025のロタマー配列が得られる。我々のスコ アリング機能は2つの成分:ファンデルワールスエネルギー項および疎水性表面 積の埋もれを好都合とする原子溶媒和項よりなるものであった。シミュレーショ ンにおける全ての原子のファンデルワールス半径は因子αを掛けて(方程式3) パッキング効果の重要性を変化させた。半径は埋もれた表面積計算では掛けなか った。種々の半径スケーリングでコア配列を予測し、次いで、得られた蛋白質を 実験的に特徴付けることによって、蛋白質デザインに対するパッキング効果の重 要性の厳格な研究が可能である。 Gβ1、PDB記録1pgaの骨格座標上に蛋白質構造を作成した(Bernstein ら、前掲;Gallagherら、1994)。最適化されていない全ての側鎖の原子をそれら の結晶学的に決定された位置に残した。プログラムBIOGRAF(Molecular S imulations Incorporated,San Diego,CA)を用いて、構造上に明示的水素を生 成させ、次いで、ドライディング力場を用い、50工程のためにこれをコンジュ ゲート勾配最小化した(Mayoら、1990,前掲)。ロタマーライブラリー、DEE最 適化およびモンテカルロサーチは前記で概説した通りであった。Lennard-Jones 12−6ポテンシャルをファンデルワールス相互作用で用い、原子半径は本明細 書に記載したごとくに種々の場合にスケーリングした。溶媒接近可能表面積のRi chards定義(LeeおよびRichards,前掲)を用い、Connollyアルゴリズム(Conolly ,(1983)(前掲))で計算した。23cal/モル/Å2の、我々の以前の仕事か ら得られた原子溶媒和パラメーターを用いて、疎水性埋もれを好 都合とし、溶媒暴露にペナルティーを課した。我々の最適化仕事における側鎖非 極性露出を計算するために、我々はまずロタマーによって露出された全疎水性領 域を単離において考慮する。この露出はロタマー/鋳型接触で埋もれた領域、お よび対のロタマー/ロタマー接触で埋もれた領域の合計によって減少する。 半径スケーリング因子αの種々の値についての全体最適配列は、デッドエンド 排除理論を用いて見いだされた(表6)。最適配列およびそれらの対応する蛋白 質は、それらのデザインで使用された半径スケール因子によって命名される。例 えば、α=0.90の半径スケール因子で命名された配列はα90と呼ばれる。 表6 Gβ1配列 表6において、Gβ1配列および位置番号は頂部で示される。volはGβ1 配列に対するコア側鎖容量である。垂直棒線はGβ1配列との同一性を示す。 α100はα=1.0で命名され、よって、立体効果の十分な取り込みのため のベースラインとして働く。たとえ天然に生じる配列についての情報が側鎖選択 アルゴリズムで使用されなかったとしても、α100配列はGb1のコア配列に 非常に似ている(表6)。0.90ないし1.05のαの変動は最適配列の変化 をほとんど引き起こさず、これは従たるパラメーターの摂動に対するアルゴリズ ムの粗野性を示す。さらに、α=0.90−1.05で予測されたパッキング配 置は、結晶構造から4°のみ平均χ角が相違してGβ1に密接にマッチする。G β1に対する高い同一性および立体配座同様性は、パッキング拘束が使用された 場合、骨格立体配座がよくパッキングされたコアデザインの単一ファミリーを強 く決定する。それにも拘わらず、コアパッキングに対する拘束は、他の低いエネ ルギー配列のためのモンテカルロサーチによって示されるごとくαによって変調 されつつある。いくつかの別の配列およびパッキング配置は、α=0.90であ る場合、モンテカルロ手法によって見いだされた20の最良配列にある。これら の別の配列はα=0.95である場合、悪くスコアリングされ、α=1.0また は1.05である場合、厳格に保存的なパッキング幾何学のみが低いエネルギー を有する。従って、α=1.05およびα=0.90は、パッキング特異性が配 列デザインを支配する範囲の、各々、高および低末端を規定する。 α<0.90については、パッキングの役割は、疎水性表面ポテンシセルが支 配を始めるのに十分な位低下し、それにより、コアに選択された残基のサイズを 減少させる(表6)。最適配列における有意な変化は、a=0.90および0. 85の間で出現し、a85およびa80は共にa90に対して3つのさらなる突 然変異を含む。また、a85およびa80はGb1にたいして全側鎖容量の15 %増加を有する。0.80未満に降下するにつれて、側鎖容量はさらに10%増 加し、多数の突然変異が起こり、これはパッキング拘束が非極性表面を埋もれさ せる駆動によって圧倒させることを示す。容量におけるジャンプおよびパッキン グ配置におけるシフトは最適配列では突然に起こるようであるが、モンテカルロ サンプリングによる最適化エネルギー配列の調査は、変化は突然ではないこと を証明する。例えば、α=0.90である場合、a85最適配列は11番目の最 良の配列であり、α=0.85である場合、a90最適配列は9番目の最良配列 である。 a>1.05では、原子ファンデルワールス反発が余りにもひどくて、ほとん どのアミノ酸はいずれかの許容されたパッキング配置を見いだすことができず、 その結果、多くの蛋白質につきアラニンが選択される。この厳格性は大きな原子 半径の人工物のようであり、増大したパッキング特異性を正確には反映しない。 むしろ、a=1.05は我々のモデリング仕事内のファンデルワールススケール の使用できない範囲についての上方限界である。 コアデザインの実験的特徴付け。ファンデルワールススケール因子aの変動の 結果、パッキング特異性の4つの方法がもたらされる:方法1、ここでは0.9 ≦α≦1.05であって、パッキング拘束は配列選択を支配し;方法2、ここで は、0.8≦α<0.9であって、疎水性溶媒和ポテンシャルはパッキング力と 競合し始める;方法3、ここではα<0.8であって疎水性溶媒和がデザインを 支配し;方法4、ここではα>1.05であって、ファンデルワールス反発は余 りにもひどくて意味のある配列選択ができない。最適デザインである配列は合成 および特徴付けのための方法の各々から選択した。それらは、方法1からのα9 0、方法2からのα85、方法3からのα70、および方法4からのα107で ある。これらの配列の各々につき、11のコア位置の計算されたアミノ酸同一性 が表6に示される;蛋白質配列の残りはGβ1にマッチする。目標は、コアデザ インで使用されるパッキング特異性の程度および得られた蛋白質における天然様 特徴の程度の間の関係を研究することであった。 ペプチド合成および精製。配列選択アルゴリズムによってデザインされた11 のコア位置を例外として、合成された配列はProtein Data Bankエントリー1p gaにマッチする。標準的なFmoc化学を用いてペプチドを合成し、逆相HP LCによって精製した。マトリックス助力レーザー脱着質量分析は全ての分子量 が予測された質量の1単位内にあることを見いだした。 CDおよび蛍光スペクトロスコピーおよびサイズ排除クロマトグラフィー。全 ての実験についての溶液条件は、特記しない限り、pH5.5および25℃にお ける50mMリン酸ナトリウム緩衝液であった。円二色性スペクトルは、熱電対 を備えたAviv62DSスペクトロメーターで獲得した。ペプチド濃度はほぼ 20μMであった。熱溶融は120秒の平衡時間で2°の増分を用いて218n mでモニターした。Tmは融解曲線の微分の極大として定義される。各蛋白質の可 逆性は、加熱の前後からの室温CDスペクトルを比較することによって確認した 。公表されている方法に従って塩化グアニジニウム変性を測定する(Pace,Meth ods Enzymol.131:266(1986))。蛋白質濃度はUV分光によって測定した。蛍 光実験は1cm路長セル中で日立F−4500で行った。ペプチドおよびANS 濃度は50μMであった。励起波長は370nmであり、発光は400ないし6 00nmでモニターした。サイズ排除クロマトグラフィーは、0℃にて、50m Mリン酸ナトリウム中、pH5.5でPo1yLC ヒドロキシエチルAカラムで行っ た。リボヌクレアーゼA、カルボニックアンヒドラーゼおよびGβ1を分子量標 準として使用した。分離の間のペプチド濃度は、275nmでモニターしたピー ク高さから見積もって〜15μMであった。 核磁気共鳴スペクトロスコピー。試料はpH5.5の90/10H2O/D2Oおよび50 mMリン酸緩衝液中で調製した。スペクトルは25℃においてVarian Unityplus 600MHzスペクトロメーターで獲得した。限定された溶解度(100μM )を有するα70を除き、試料はほぼ1mMであった。水素交換実験では、NM R試料を調製し、pHを5.5に調整し、スペクトルは未交換参照として働かせ るために獲得した。この試料を凍結乾燥し、D2O中で復元し、スペクトルの反復 獲得をスペクトル当たり75秒の速度で直ちに開始した。データ獲得は〜20時 間継続し、次いで、試料を3分間で99℃まで加熱して、全てのプロトンを十分 に交換した。25℃まで冷却した後、最終スペクトルを獲得して、十分交換され た参照として供した。全ての交換可能なアミドピークの面積は非交換脂肪族ピー クのセットによって正規化した。同位体効果については修正していないpH値は 、データ獲得後に全ての試料について測定し、時間軸はpHにおける微小差異に つき修正するように正規化した(Rohlら、Biochem.31:1263(1992))。 α90およびα85はGb1と非常に似た楕円率およびスペクトルを有し(示 さず)、これは、これらの二次構造含有量がGb1のそれと匹敵することを示唆 する(図10)。逆に、α70はかなり弱い楕円率および乱れたスペクトルを有 し、これは、Gb1に対する二次構造の喪失を意味する。α107はランダムコ イルに特徴的なスペクトルを有する。CDによってモニターした熱溶融を図10 Bに示す。α85およびα90は共に、各々、83℃および92℃の溶融温度( Tm)にて協働的転移を有する。α107は熱転移、すなわち、十分に折り畳みが 解除されたポリペプチドから予測される挙動を示さず、α70は、部分的に折り 畳まれた構造に特徴的な、〜40℃で生じるブロードで狭い転移を有する。87 ℃のTmを有するGb1に対して(Alexanderら、前掲)、α85はわずかに熱安 定性が低く、α90はより安定である。25℃における折り畳み解除の自由エネ ルギー(ΔGu)の化学変性測定はTmにおける傾向にマッチする。 α90はGβ1で報告されたもの(Alexanderら、前掲)よりも大きなΔGuを 有し、他方、α85はわずかに安定性が低い。α70およびα107は認識可能 な転移を欠如するゆえに、それらにつきΔGuを測定することは可能ではなかった 。 各蛋白質のプロトンNMRスペクトルにおける化学シフト分散の程度を評価し て、天然−様特徴の各蛋白質の程度を判断した(データは示さず)。α90は高 度に分散したスペクトル(よく配向した天然蛋白質のホールマーク)を保有する 。α85はα90に対して幾分ブロードとなった化学シフト分散およびピークを 減少し、これは、それにも拘わらず区別される折り畳みを維持する中程度に動き 得る構造を示唆する。α70のNMRスペクトルはほとんど分散を有しなかった 。ブロードなピークは崩壊したが秩序を乱しかつ動揺する構造の指標である。α 107は鋭い直線を持つスペクトルを有するが分散を有さず、これは折り畳み解 除された蛋白質の指標である。 アミド水素交換速度論は、プロトンNMRスペクトルの調査から到達した結論 と合致する。デザインした蛋白質の各々についての時間の関数としての未交換ア ミドプロトンの平均数を測定するのは、以下の結果となる(データは示さず): α90はpH5.5および25℃における交換の20時間にわたり〜13プロト ンを保護する。α90交換曲線はGβ1のものから区別できない(示さず)。ま た、α85はアミドプロトンのよく保護されたセット(秩序だった天然様蛋白質 の区別される特徴)を維持する。しかしながら、保護されたプロトンの数はα9 0の約半分に過ぎない。相違はα85構造のいくつかの部分におけるより高い柔 軟性によるようである。対照的に、α70およびα107は実験の3分の死時間 内に十分に交換され、これは高度に動的な構造を示す。 近紫外線CDスペクトルおよび8−アニリノ−1−ナフタレンスルホン酸(A NS)結合を用いて、蛋白質の構造秩序立てを評価した。α85およびα90の 近紫外線スペクトルは、ユニークな三次構造に固定された芳香族残基を持つ蛋白 質で予測されるように強いピークを有し、他方、α70およびα107は、非天 然の崩壊した状態または折り畳み解除された蛋白質のごとき、動的芳香族残基を 持つ蛋白質の指標である特徴的スペクトルを有する。ANS発光スペクトルの3 倍の強度増加および青色シフトによって示されるごとく、α70はANSに結合 する。この強い結合は、α70が、ANSに接近可能な疎水性残基のゆるくパッ キングされたまたは部分的に露出されたクラスターを保有することを示唆する。 ANSは、いくつかの天然蛋白質で観察される会合と同様に、α85に弱く結合 し、発光強度は25%増加するに過ぎない(Semisotnovら、Biopolymers 31:119 (1991))。α90およびα107はANS蛍光において変化を引き起こさない 。蛋白質の全てはサイズ排除クロマトグラフィーの間モノマーとして移動した。 要約すると、α90は全ての基準によるとよくパッキングされた天然様蛋白質 であり、それは、恐らくは、増大した疎水性表面埋もれのために、天然に生じる Gb1配列よりも安定である。また、α85は、そのNMRスペクトルおよび水 素交換挙動によって示されるごとく、α90よりも大きな移動柔軟性を持つにも 拘わらず、安定で、秩序だった蛋白質である。α70は無秩序の崩壊した球状蛋 白質の特徴の全てを有する:非協働的熱転移、NMRスペクトル分散またはアミ ドプロトン保護無し、減少した二次構造含有量および強いANS結合。α107 は、恐らくはコアを一緒に保持する大きな疎水性残基の欠如のため、完全に折り 畳み解除された鎖である。明瞭な傾向は、αが0.90未満に減少するにつれて の蛋白質秩序の喪失である。 蛋白質デザインについての異なるパッキング方法を実験データに徴して評価す ることができる。方法1においては、0.9≦α≦1.05であり、該デザイン はよく秩序立った蛋白質の結果となるパッキング特異性によって支配されている 。 方法2においては、0.8≦α<0.9であり、パッキング力は、疎水性力がよ り大きな残基をコアに駆動させるのに十分な位弱くなっており、これは、幾分増 大した構造の動きを持つ安定なよくパッキングされた蛋白質を生じる。方法3に おいては、α<0.8であり、パッキング力は疎水性力が支配する程度まで低下 しており、その結果、安定なコアパッキングを持たない動揺する、部分的に折り 畳まれた構造が得られる。方法4において、α>1.05であり、パッキング特 異性を実行するのに使用される立体力が余りにも高くスケーリングされていて、 合理的な配列選択ができず、よって、折り畳み解除された蛋白質を生じる。これ らの結果は、効果的な蛋白質デザインがパッキング効果の考慮を有することを示 す。蛋白質デザインアルゴリズムの意味内で、我々は、成功したデザインに必要 なパッキング力の範囲を定量的に規定した。また、我々は、低下した特異性を用 いて、別のパッキングを持つ蛋白質コアをデザインできることを証明した。 減少したパッキング拘束の利点を利用するために、蛋白質コアは、その結果依 然として構造的に秩序立った蛋白質となる最小のαでデザインされるべきである 。方法2からの最適蛋白質配列α85は安定であってよくパッキングされており 、これは、良好な範囲として0.8≦α<0.9を示唆する。しかしながら、N MRスペクトルおよび水素交換速度論は、α85がα90程は構造的に秩序立っ ていないことを明瞭に示す。α85およびα90におけるW43のための我々の プログラムによって予測されるパッキング配置は可能な説明を提示する。α90 については、W43はGβ1の結晶構造におけると同一の立体配座を持つコアに パッキングされることが予測される。α85においては、α90におけるアラニ ンおよびバリンと比較して、位置34および54、各々、ロイシンおよびフェニ ルアラニンにおける大きな側鎖がW43をしてα90における19Å2と比較し て非極性表面の91Å2を露出させる。この露出を駆動する疎水性力はW43を 埋もれさせる別の立体配座を安定化させるようであり、それにより、α85の立 体配座柔軟性に寄与し得る(Dill,1985;Onuchiら、1966)。他のコア位置とは 対照的に、位置43における残基は、側鎖立体配座に応じて、ほとんど露出され 、またはほとんど埋もれる。我々は、この特徴を持つ位置を境界位置と命名し、 これは、蛋白質のコアとまたは溶媒と強く相互作用するそれらのポリペプチドの た め、蛋白質デザインについての困難な問題を持ち出す。 疎水性表面領域の露出にペナルティーを課すスコアリング機能は、境界残基の デザインで助力するかも知れない。Dillおよび共同研究者は露出ペナルティーを 用いて、理論的研究において蛋白質デザインを改良した(Sunら、Protein Eng.8 (12)1205-1213(1995))。 非極性露出ペナルティーは、コアに大きな側鎖を埋めるか、または露出された アミノ酸をより小さいまたはより極性のものと置換するパッキング配置に好都合 であろう。我々は、我々の最適化仕事において側鎖非極性露出ペナルティーを実 施し、疎水性埋もれパラメーターと同程度の大きさのペナルティング溶媒和パラ メーターを使用した。 我々のスコアリング機能に疎水性表面露出ペナルティーを付加する結果を表7 に示す。 表7 α=0.85 表7は、露出ペナルティーなくしてα=0.85を用いるコア位置についての 15の最良配列を示す。AnpはÅ2で表した露出された非極性表面積である。 α=0.85である場合、非極性露出ペナルティーは低エネルギー配列の秩序 を劇的に変える。α85配列、前者の基底状態は、7番目に降下し、15の最良 の配列露出の残りは疎水性領域をほとんど露出させない。何故ならば、それらは α90におけると同様の立体配座にW43を埋もれさせるからである(モデルは 示さず)。例外は8番目および14番目の配列であり、これは、W43をイソロ イシンで置き換えることによって露出された境界残基のサイズを低下させ、また 、13番目の最良配列であり、これはW43をバリンで置き換える。新しい基底 状態配列は、単一のバリンからイソロイシンへの突然変異を持ち、α90に非常 に似ており、α90の安定性および構造的突如を有するはずである。対照的に、 α=0.90である場合、最適配列は変化せず、モンテカルロサンプリングによ って見出された次の14の最良配列はほとんど変化しない。この小さい効果は驚 くべきことではない。というのは、α=0.90では立体力が依然として支配し ており、これらの構造のほとんどは表面領域をほとんど露出させないからである 。W43を埋もれさせるのは、コアにおける配列選択を幾分制限するが、α=0 .85につき減少したパッキング力はα0.90よりも配列多様性を依然として 生じる。露出ペナルティーは、コアの境界が破壊された場合に生じる正味の過剰 パッキングおよび溶媒暴露を制限することによって、減少したパッキング特異性 の使用を補足する。この拘束を付加することは、より低いパッキング力が蛋白質 デザインで使用されることを可能とし、その結果、より広い範囲の高いスコアリ ング配列ならびに固定された骨格および区別されるロタマーからの低下した偏り がもたらされる。 境界位置におけるより小さい残基を置換する効果を調べるために、我々は、露 出ペナルティーでのα=0.85最適化の13番目の最良配列を合成し、特徴付 けた(表8)。 表8 α=0.85露出ペナルティー 表8は露出ペナルティーにてα=0.85を用いてGβ1のコア位置の15の 最良配列を示す。AnpはÅ2で表した露出された非極性表面積である。 この配列α85W43VはW43をバリンで置き換えるが、そうでなければα 85と同一である。また、8番目および14番目の配列は位置43におけるより 小さな側鎖を有するが、α85に対するそれらの配列のさらなる変化が境界位置 変化の効果の解釈を複雑にするであろう。また、α85W43Vは、11位置の うち7つが改変され、Gβ1と比較して有意に異なるパッキング配置を有するが 、側鎖容量は8%増加に過ぎない。よって、α85W43Vは異なるがほとんど 容量が保存されるコアに対するこの折り畳みの許容性のテストである。α85W 43Vの遠紫外線CDスペクトルはGβ1のそれと非常に似ており、218nm における楕円率は−14000度cm2/dモルである。α85W43Vの二次構 造含有量は天然様であるが、そのTmは65℃であり、α85よりもほとんど20 ℃低い。α85W43Vの減少した安定性とは対照的に、そのNMRスペクトル はα85よりも大きい化学シフト分散を有する(データは示さず)。アミド水素 交換速度論は20時間後において約4つのプロトンのよく保護されたセットを示 す(データは示さず)。α85に対するこのより速い交換は、α85W43Vの 有意に低い安定性によって説明される(Mayo & Baldwin,1993)。α85W43 Vは安定性を犠牲にして改良された構造特異性を有するようであり、これはコイ ルドコイルで以前に観察された現象である(Harburyら、1993)。露出ペナルティ ーを用いることによって、デザインアルゴリズムはより大きな天然様特性を持つ 蛋白質を生じさせた。 我々は、蛋白質デザインにおけるパッキング特異性の役割を定量的に規定し、 我々のデザインプログラムにおける立体力の役割についての現実的境界を供した 。この研究は、デザインの間にパッキング力を変化させるための目的的定量的プ ログラムの使用のため、以前の仕事とは異なっており、これは我々が我々の結論 を異なる蛋白質系に適用することを可能とした。さらに、立体力の最小の効果的 レベルを用いることによって、我々は所与の折り畳みと適合する種々のパッキン グ配置をデザインすることができた。最後に、我々は、蛋白質のコアおよび表面 の間の境界にある側鎖のデザインで困難性を認め、我々は、この問題に立ち向か う我々の配列デザインスコアリング機能において非極性表面露出ペナルティーを 実行した。 実施例5 十分な蛋白質のデザイン 蛋白質モチーフの全アミノ酸配列は計算されている。実施例4におけるごとく 、DNA結合蛋白質Zif268の第2亜鉛フィンガーモジュールをデザイン標 的として選択した。鋳型構造における残基位置をコア、表面または境界クラスに 割り当てるために、鋳型Cα原子のみを用いて計算された溶媒接近可能表面に対 して、Cα−Cβベクトルの向きを評価した。標的折り畳みのCα原子のみにつ いての溶媒接近可能表面は、8.0Åのプローブ半径、10Å2のドット密度、 および1.95ÅのCα半径にてConnollyアルゴリズムを用いて生成させた。も しそのCα−Cβベクトルに沿って、そのCαから溶媒接近可能表面への距離が 5Åより大であり、およびそのCβから最も近い表面点までの距離が2.0Åよ り大であれば、残基はコア位置として分類された。もしそれらのCα−Cβベク トルに沿ったそれらのCαから溶媒接近可能表面までの距離+それらのCβから 最も近い表面点までの距離の合計が2.7Å未満であると、残りの残基は表面位 置として分類された。すべての残りの残基は境界位置として分類された。Zif 268についての分類は、位置1、17および23が境界クラスから表面クラス 変換された以外は計算されたものとして使用して、三次構造における鎖末端の近 接からこれらの残基への末端効果および帰属決定における不正確性を説明した。 このモチーフの小さなサイズは、コアに明瞭に割り当てることができる残基の 下図を1つ(位置5)に制限し、他方、7つの残基(位置3、7、12、18、 21、22および25)は境界として分類され、残りの20の残基は表面に帰属 された。興味深いことには、Zif268の亜鉛結合位置の3つは境界またはコ アにあり、1つの残基位置8は蛋白質の幾何学的中心から離れて向いたCα−C βベクトルを有し、表面位置として分類される。我々の以前の研究におけるごと く、配列選択の間にコア位置にあると考えられたアミノ酸はA、V、L、I、F 、YおよびWであり;表面位置にあると考えられたアミノ酸はA、S、T、H、 D、N、E、Q、KおよびRであり;組み合わせたコアおよび表面アミノ酸セッ ト(16アミノ酸)は境界位置にあると考えられた。残基位置の2つ(9および 27)は0°を超えるφ角を有し、骨格歪みを最小化するための配列選択アルゴ リズムによってGlyに設定された。 デザインアルゴリズムによって考慮されなければならないアミノ酸配列の合計 数は、各残基位置における可能なアミノ酸タイプの数の生成物である。前記した ββαモチーフ残基分類の結果、1.9×1027の実質的組合せライブラリーが 得られる(7つの可能なアミノ酸を持つ1つのコア位置、16の可能なアミノ酸 を持つ7つの境界位置、10の可能なアミノ酸を持つ18の表面位置および0° より大のφ角を持ち1つの可能なアミノ酸を各々が持つ2つの位置)。各28残 基配列についての単一分子のみからなる対応するペプチドライブラリーは11. 6メトリックトンの質量を有するであろう。側鎖置換の幾何学的特異性を正確に 作成するために、我々は、ロタマーと呼ばれる、許容される立体配座の区別され るセットを持つ各アミノ酸を表すことによって、我々の配列スコアリングにおい てアミノ酸側鎖のトーション柔軟性を明示的に考慮する。前記したごとく、骨格 依存性ロタマーライブラリーを使用し(DunbrackおよびKarplus,前掲)、疎水 性残基のχ1およびχ2角を調整した。その結果、デザインアルゴリズムは各残基 位置における各可能なアミノ酸についての全てのロタマーを考慮しなければなら ない。ββαモチーフについてのサーチスペースの合計サイズは、従って、1. 1×1062の可能なロタマー配列である。ββαモチーフについてのロタマー最 適化問題は最適配列を見出すのに90CPU時間を要した。 図11に示された最適配列はFull Sequence Design-1(FSD−1)と呼ばれ る。たとえ親水性アミノ酸の全てが境界位置の各々で考慮されても、該アルゴリ ズムは非極性アミノ酸のみを選択した。8つのコアおよび境界位置はよくパッキ ングされた埋もれたクラスターを形成すると予測された。Zif268の亜鉛結 合His位置、位置21および25におけるアルゴリズムによって選択されたP he側鎖は80%以上埋もれており、位置5におけるAlaは100%埋もれて おり、他方、位置8におけるLysは60%を超えて溶媒に暴露されている。他 の境界位置は、Zif268のそれと同様の配置に同様の側鎖をパッキングする ことによって、埋もれた残基に対する強力な立体的拘束を証明した。コアおよび 境界残基についての計算された最適立体配座は非極性表面積を〜1150Å2埋 もれさせた。ラセン表面については、水素結合を持つラセンN−キャップとして のAsn14を、その側鎖カルボニル酸素および残基16の骨格アミドプロトン の間に位置させる。ラセン上の8つの荷電した残基は水素結合の3対を形成する が、我々のコイルドコイルデザインにおいては、ラセン表面水素結合は配列の総 じてのラセン特性よりも重要ではないようである(Dahiyatら、Science(1997) 。露出されたシート表面上の位置4および11はThr(最良のβ−シート形成 性残基のうちの1つ)であるように選択された(Kimら、1993)。 図11はFSD−1およびZif268についての配列の整列を示す。28残 基のうち6のみ(21%)が同一であって、11のみ(39%)が同様である。 同一のうち4つが埋もれたクラスターにあり、これは、埋もれた残基は所与のモ チーフにつての溶媒暴露残基よりも保存されているという例外と合致する(Bowi eら、Science 247:1306-1310(1990))。National Center for Biotechnology Informationの非豊富蛋白質配列データベースに対するFSD−1配列のBLA ST(Altschulら、前掲)サーチは、いずれの亜鉛フィンガー蛋白質配列も見出 さなかった。さらに、該BLASTサーチは種々の関係しない蛋白質の断片に対 する弱い統計学的有意性の低い同一性マッチを見出したに過ぎなかった。最高の 同一性マッチは10残基(36%)であり、p値は0.63〜1.0の範囲であ る。前記したββα位置分類で許容されたアミノ酸よりなるランダムな28残基 配列は同様のBLASTサーチ結果を生じ、10または11の残基同一性であり (36〜39%)、p値は0.35〜1.0の範囲であり、さらに、FSD−1 で見出されたマッチは統計学的に有意であることを示唆する。いずれかの公知の 蛋白質配列に対する非常に低い同一性はFSD−1の新規性を証明し、いずれか の蛋白質モチーフからの配列情報は我々の配列スコアリング機能でされなかった ことを過小スコアリングする。 計算された配列の粗野性を調べるために、FSD−1の配列をモンテカルロシ ミュレートしたアニーリング実行の出発点として使用した。モンテカルロサーチ は、最適解決の隣において高スコアリング最適下配列を見出す(Dahiyatら(199 6)(前掲))。1000番目の最も安定な配列への基底状態解決からのエネル ギー拡大は約5kcal/モルであり、状態の密度が高いことを示す。位置7を 例外として、分子のコアを含むアミノ酸は実質的に非変異体である(図11)。 ほとんど全ての配列変異は表面位置で起こり、典型的には、保存的変化を含む。 ラセンN−キャップを形成すると予測されるAsn14は、最も保存され た表面位置の内にある。分子の臨界的領域で観察された強力な配列保存は、もし 代表的な配列がデザイン標的構造に折り畳まれたならば、恐らくは、その変異が 臨界的相互作用を破壊しない数千の配列が同等の能力であり得ることを示唆する 。たとえ10億の配列が成功して標的折り畳みを達成しても、それらは1027の可 能な配列の極めて僅かな部分を表すに過ぎない。 実験的有効化。FSD−1を合成してその構造を特徴付け、デザインアルゴリ ズムの効率を評価した。FSD−1の遠紫外線円二色性(CD)スペクトルは2 20nmおよび207nmで極小を示し、これは折り畳まれた構造の指標である (データは示さず)。熱融解は弱く協働的であり、39℃に屈曲点であり、完全 に可逆的である(データは示さず)。ブロードな融解は、小さな疎水性コアを持 つモチーフで予測される折り畳みの低エントロピーに合致する。この挙動は他の 折り畳まれた短いペプチドで観察された非協働的熱折り畳み解除転移とは対照的 である(Scholtzら、1991)。FSD−1は高度に可溶性であり(3mMより大 )、100μM、500μMおよび1mMにおける平衡沈降研究は蛋白質がモノ マーであることを示す。沈降データは単一種(1mMで3630の分子量を持つ モノマーモデル)によくフィットし、3488の計算されたモノマー質量と良好 に一致する。また、遠紫外線スペクトルは50μMないし2mMで濃度依存性を 示さず、100μMおよび2mMで採られた核磁気共鳴(NMR)COSYスペ クトルは実質的に同一であった。 FSD−1の解決構造は、等核2D 1H NMRスペクトロスコピーを用いて解 かれた(Piantiniら、1982)。NMRスペクトルはよく分散し、秩序立った蛋白 質構造および容易な共鳴帰属決定を示す。プロトン化学シフト帰属決定は、標準 的に等核方法で決定された(Wuthrich,1986)。明瞭な順次の短い範囲のNOE は、デザイン標的と合致する残基15ないし26のラセン二次構造を示す。 FSD−1の構造は、アミドプロトンをゆっくりと交換することに関与する2 74のNOE距離拘束および10の水素結合拘束を含めた共有結合構造が豊富で ない284の実験的拘束(残基当たり10.1の拘束)を用いて決定した。構造 計算は、混成距離幾何学でシミュレートしたアニーリング(Nilgesら、FEBS Lett .229:317(1988))用の標準的プロトコルでのX−PLOR(Brunger, 1992)を用いて実行した。41構造のアンサンブルは良好な共有結合幾何学をも って、0.3Åより大の距離拘束侵害なくして収束した(表9)。 表9 NMR構造決定:距離拘束、構造拘束および原子根平均二乗(rms)偏 差。<SA>は41のシミュレートしたアニーリング構造である。SAはエネル ギー最小化前の平均構造であり、(SA)rは拘束されたエネルギー最小化平均 構造であり、SDは標準偏差である。 *原子rms偏差は、包括的に、残基3ないし26のためである。残基1、2、 27および28は乱雑化され(φ、ψ角秩序パラメーター(34)<0.78) 、逐次および |i-j|=2のNOEを有するに過ぎなかった。非極性側鎖は残基3、5、7 、12、18、21、22および25からのものであり、これは蛋白質のコアを 形 成する。 FSD−1の骨格は0.54Åの平均からの根平均二乗(rms)でよく規定 される(残基3〜26)。骨格に加えて埋もれた側鎖(残基3、5、7、12、 18、21、22および25)を考慮すると、0.99Åのrmsが与えられ、 これは分子のコアがよく秩序だっていることを示す。構造のアンサンブルの立体 化学的性質をPROCHECK(Laskowskiら、J.Appl.Crystallogr.26:283 (1993))を用いて調べた。無秩序末端およびグリシン残基を含めないと、残基 の87%が最も好都合の領域に入り、残りはφ、ψスペースの許容された領域に 入る。中程度の不均一性が、<S>=0.98±0.02を持つ第2鎖(残基9 〜12)および<S>=0.99±0.01を持つラセン(残基15〜26)と 比較して<S>=0.96±0.04の平均骨格角度秩序パラメーター(Hybert sら、1992)を有する第1鎖(残基3〜6)に存在する。総じて、FSD−1は 顕著によく秩序だっており、我々の知識では、金属結合、オリゴマー化またはジ スルフィド結合形成(McKnightら、1997)なくしてユニークな構造に折り畳まれる 天然に生じるアミノ酸より実質的により最も短い配列である。 FSD−1のNMR構造アンサンブルの疎水性コアのパッキングパターン(T yr3、Ile7、Phe12、Leu18、Phe21、Ile22、および Phe25)は計算されたパッキング配置と同様である。7つの残基のうちの5 つはデザイン標的としての同一のゴーシュ+、ゴーシュ-またはトランス範疇にあ るχ1角を有し、3つの残基はχ1およびχ2角にマッチする。それらの計算され たχ1角にマッチしない2つの残基はIle7およびPhe25であり、これは 分子の拘束が低い開放された末端のそれらの位置と合致する。Ala5はその予 測される高価なパッキング相互作用に関与せず、替わりに、デザイン鋳型に対し て鎖1骨格の置換のためその表面の約45%を露出する。逆に、Lys8はその 溶媒暴露(60%)にてアルゴリズムによって予測されるように挙動し、χ1お よびχ2角は計算された構造にマッチする。溶媒暴露残基のほとんどは無秩序で あり、これは予測される表面残基水素結合の調査を排除する。しかしながら、A sn14は予測されるごとくその側鎖カルボニル酸素からラセンN−キャップを 形成するが、デザインから予測されるようにGlu17のアミドに対してであり 、Lys16に対してではない。この水素結合は構造アンサンブルの95%に存 在し、2.6±0.06Åのドナーアクセプター距離を有する。一般に、FSD −1の側鎖はデザインプログラムの予測によく対応する。 FSD−1の平均拘束化最小化構造およびデザイン標的の比較を行った(デー タは示さず)。デザイン標的からのFSD−1の総じての骨格rms偏差は残基 3〜26につき1.98Åであり、残基8〜26については0.98Åに過ぎな い(表10)。 表10 FSD−1の実験的に決定された構造およびデザイン標的構造の比較。 FSD−1構造はNMR構造決定からの拘束されたエネルギー最小化平均である 。デザイン標的構造は亜鉛フィンガ−Zif268(9)の第2のDNA結合モ ジュールである。 *h、θおよびΩは、以前に記載されているごとくに計算される(36、37) 。hはラセンCα座標(残基15〜26)の中心およびシート(残基3〜12) のCα座標にフィットする最小二乗面の間の距離である。θはシートの平面に関 するラセンCα原子の主要モーメントの指標である。Ωは、シートへのラセンの 主要モーメントの投影およびシートへの鎖Cα座標(残基3〜6および9〜12 )に立てする平均最小二乗フィット直線の間の角度である。 FSD−1および標的構造の間の最大の差異は残基4〜7で起こり、鎖1の骨 格原子位置が3.0〜3.5Å変位している。鎖2、ラセンターンに対する鎖、 およびラセンについての一致が顕著であり、差異は構造決定のほとんど精度内に ある。構造のこの領域では、FSD−1およびデザイン標的の間のφ、ψ角のr ms差異は14±9°に過ぎない。標的の全体折り畳みに対するFSD−1の同 様性を定量的に評価するために、我々は、蛋白質における二次構造ユニットの相 対的配向を記載する、それらの超二次構造パラメーターを計算した(表9)(Ja nin & Chothia,J.Mol.Biol.143:95(1980);Su & Mayo,Protein Sci.in pre ss,1997)。θの値(シートに対するラセンの傾き)、およびΩ(ラセン軸およ び鎖軸の間の二面角)はほとんど同一である。シート上のラセンの高さhはFS D−1では1Å大きいに過ぎない。Gb1変異体についてのラセン高さの関数と しての蛋白質コアデザインの研究は、ラセン高さにおける1.5Åまでの変動は 配列選択に対してほとんど効果を有しないことを示した(Su & Mayo,前掲,199 7)。二次構造パラメーター値および骨格座標の比較は、FSD−1の実験的に 決定された構造およびデザイン標的の間の優れた一致を強調し、このββαモチ ーフについての配列を計算するにおける我々のアルゴリズムの成功を証明する。 FSD−1およびデザイン標的の間のマッチの質は、蛋白質の3つの主要に二 次構造:シート、ラセンおよびターンを含有する折り畳みについての配列をデザ インする我々のプログラムの能力を証明する。ββα折り畳みは配列選択方法を 開発するのに使用されたものとは異なるので、FSD−1のデザインは我々のプ ログラムの新しいモチーフへの成功した移動を表す。 実施例6 溶媒接近可能表面積スケーリング因子の計算 以前の仕事とは対照的に、骨格原子は表面積の計算に含まれる。かくして、ス ケーリング因子の計算は以下のごとくに行われる。 プログラムBIOGRAF(Molecular Simulations Incorporated,San Diego ,California)を用いて、構造上に明示的水素を生成させ、次いで、これを、D REIDING力場を用いる50工程のためにコナジュゲート勾配最小化した。 表面積は、ゼロのプローブ半径および1.4Åのアッド−オン半径およびDRE IDING力場からの原子半径を用い、10Å−2のドット密度でのConnollyア ルゴリズムを用いて計算した。疎水性表面積に寄与する原子は炭素、硫黄および 炭素および硫黄に結合した水素原子である。 局所トリ−ペプチド骨格t3を持つ残基位置iにおける各側鎖ロタマーrについ ては、我々は、局所トリ−ペプチド骨格の存在下におけるロタマーおよびその骨 についての鋳型によって埋もれた全面積である。残基位置iおよびjおよび、各 々、iおよびj上のロタマーrおよびsの各対については、全鋳型の存在下に の間の差異は残基iおよびjの間の埋もれた面積であり、鋳型によるその面積を 排除する。全埋もれた表面積に対する対の近似は: である。 図13に示すごとく、方程式29における第2の合計は埋もれた面積を過剰計 数する。我々は、従って、第2の合計に、その値が経験的に決定されるべきであ るスケール因子fを掛けた。fの予測される値は後記する。 埋もれたおよび露出された面積は全面積に加えるべきことに注意されたし。溶 である。 方程式30の最初の合計は、他のロタマーとの相互作用を無視する蛋白質鋳型 の意味において各ロタマーの全露出面積を表す。方程式30の第2の合計はロタ マー間の埋もれた面積を差し引き、方程式29におけるのと同一パラメーターf を掛ける。 fの予測される値へのいくつかの洞察が、球または半径rの最密充填面心立方 格子の考慮から得ることができる。半径がrからRに増加すると、隣の球によっ て埋もれた1つの球上の表面積は2nR(R-r)である。我々はrが炭素半径(1.9 5Å)であって、Rが1.4Å大であるように採用した。次いで、 を用い、各球が12の隣接物を有することに注意し、結果は以下のようになる。 これによりf=0.40が得られる。最密充填面心立方格子は74%の充填率 を有する。蛋白質内部は同様の充填率を有するが、多くの原子が共有結合するの で、密な充填は過大視される。従って、fのこの値は現実の蛋白質コアではより 低いはずである。充填率がより低い非コア残基では、fの幾分大きな値が予測さ れる。 我々は、54ないし289残基のサイズ範囲の10の蛋白質から残基を以下の ようにコアまたは非コアに分類した。我々は、1.95Åの炭素半径、8Åのプ ローブ半径を持つがアッド−オン半径は持たない鋳型Cα原子のみを用いて計算 された表面に対する各側鎖のCα−Cβベクトルの方向を考慮するアルゴリズム を用いて残基をコアおよび非コアに分類した。もし表面に対する(そのCα−C βベクトルに沿った)そのCα原子からの距離が5.0Åより大であり、かつそ のCβ原子から最も近い表面上の点までの距離が2.0Åより大であると、残基 はコア位置と分類した。かかるアルゴリズムの利点は、各残基位置に現実に存在 するアミノ酸タイプの知識が必要ないということである。蛋白質は表1に示され 、これは、選択された蛋白質、残基の合計数および各蛋白質のコアおよび非コア における残基の数を示す(GlyおよびProは考慮しなかった)。 コア残基は非コア残基よりも相互に強く相互作用するゆえにコアおよび非コア への分類をなした。これは、コア残基についての埋もれた表面積のより大きな過 剰計数に導く。 コアおよび非コアの場合を別々に考慮し、真のLeeおよびRichards表面積を最 も密接に再現するfの値を10個の蛋白質から計算した。対の近似は真の埋もれ た表面積に非常に密接にマッチする(データは示さず)。また、それは非コア残 基の露出された疎水性表面積で非常によく実行される(データは示さず)。蛋白 質の全コアの露出された表面積の計算は、2つの大きいおよびほとんど等しい面 積の差異を含む;しかしながら、示されるように、コアおよび非コア残基の混合 物がある場合、高い精度が依然として達成できる。これらの計算は、コア残基に ついては、fは0.42であり、非コア残基についてはfは0.79であること を示す。 残基をコアおよび非コアに分類するのが十分であるか否かをテストするために 、我々は、コアおよび非コア位置における相互作用性残基のサブセットを調べ、 各サブセットの真の埋もれた面積を計算されたそれと比較した(fの前記の値を 使用)。コアおよび非コアの両サブセットでは、修正が高いままであり(R2=1 .00)、さらなる分類が必要でないことを示す(データは示さず)。(サブセ ットは以下のごとくに生じさせた:シード残基が与えられれば、最も近い残基を 付加することによって、サイズ2のサブセットを生じさせた:次の最も近い残基 はサイズ3のサブセットのために付加した、そしてこれを蛋白質のサイズまで反 復 した。さらなるサブセットは異なるシード残基を選択することによって生じさせ た)。 蛋白質中の相互作用性コアおよび非コア残基の任意の選択の埋もれたまたは露 出された表面積を計算にこのアプローチが依然として適用される。コア残基およ び非コア残基が相互作用する場合、我々は、方程式29を: で置き換え、方程式30を方程式32: で置き換える。ここに、fiおよびfjは、各々、残基iおよびjに適当なfの値で あり、f{ij}は中間の値を取る。1pgaの全体からのサブセットを用い、fijの最 適値は0.74であることが判明した。次いで、この値は他のテスト蛋白質に適 当であることが示された(データは示さず)。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) C12N 15/09 C12N 15/00 A G06F 17/50 638 5/00 A (31)優先権主張番号 60/061,097 (32)優先日 平成9年10月3日(1997.10.3) (33)優先権主張国 米国(US) (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,ML,MR, NE,SN,TD,TG),AP(GH,GM,KE,L S,MW,SD,SZ,UG,ZW),EA(AM,AZ ,BY,KG,KZ,MD,RU,TJ,TM),AL ,AM,AT,AU,AZ,BA,BB,BG,BR, BY,CA,CH,CN,CU,CZ,DE,DK,E E,ES,FI,GB,GE,GH,GM,GW,HU ,ID,IL,IS,JP,KE,KG,KP,KR, KZ,LC,LK,LR,LS,LT,LU,LV,M D,MG,MK,MN,MW,MX,NO,NZ,PL ,PT,RO,RU,SD,SE,SG,SI,SK, SL,TJ,TM,TR,TT,UA,UG,UZ,V N,YU,ZW (72)発明者 ダハイヤット,バシル・アイ アメリカ合衆国90024カリフォルニア州ロ サンゼルス、ナンバー409、ロチェスタ ー・アベニュー10933番 (72)発明者 ゴードン,ディ・ベンジャミン アメリカ合衆国91106カリフォルニア州パ サディナ、ナンバー103、サウス・カタリ ーナ442番 (72)発明者 ストリート,アーサー アメリカ合衆国90027カリフォルニア州ロ サンゼルス、ナンバー7、グリーンウッ ド・プレイス4602番

Claims (1)

  1. 【特許請求の範囲】 1.プログラムの制御下でコンピューターによって実行される方法であって、 該コンピューターは該プログラムを保存するためのメモリーを含み、該方法は、 (A)可変残基位置を持つ蛋白質骨格構造を受領し; (B)該可変残基位置の各々について可能なロタマーの群を確立し、ここに、 少なくとも1つの可変残基位置は少なくとも2つの異なるアミノ酸側鎖からのロ タマーを有し;次いで、 (C)該ロタマーの各々と該蛋白質骨格構造の残りの全てまたは一部との相互 作用を解析して、最適化蛋白質配列のセットを生成させ、ここに、該分析工程は デッドエンド排除(DEE)計算を含む; 工程を含むことを特徴とする該方法。 2.プログラムの制御下でコンピューターによって実行される方法であって、 該コンピューターは該プログラムを保存するためのメモリーを含み、該方法は、 (A)可変残基位置を持つ蛋白質骨格構造を受領し; (B)各可変残基位置をコア、表面または境界残基に分類し、 (C)該可変残基位置の各々について可能なロタマーの群を確立し、ここに、 少なくとも1つの可変残基位置は少なくとも2つの異なるアミノ酸側鎖からのロ タマーを有し;次いで、 (D)該ロタマーの各々と該蛋白質骨格構造の残りの全てまたは一部との相互 作用を解析して、最適化蛋白質配列のセットを生成させる; 工程を含むことを特徴とする該方法。 3.該解析工程がDEE計算を含む請求項2記載の方法。 4.最適化蛋白質配列の該セットが全体最適蛋白質配列を含む請求項1または 2記載の方法。 5.該DEE計算がオリジナルのDEEおよびゴールドシュティン(Goldstei n)DEEよりなる群から選択される請求項1または3記載の方法。 6.該解析工程が少なくとも1つのスコアリング機能の使用を含む請求項1ま たは2記載の方法。 7.該スコアリング機能がファンデルワールスポテンシャルスコアリング機能 、水素結合ポテンシャルスコアリング機能、原子溶媒和スコアリング機能、静電 スコアリング機能および二次構造特性スコアリング機能よりなる群から選択され る請求項6記載の方法。 8.該解析工程が少なくとも2つのスコアリング機能を含む請求項6記載の方 法。 9.該解析工程が少なくとも3つのスコアリング機能を含む請求項6記載の方 法。 10.該解析工程が少なくとも4つのスコアリング機能を含む請求項6記載の 方法。 11.さらに、少なくとも1つの数の該セットをテストして、実験結果を生じ させることを含む請求項1または2記載の方法。 12.さらに、(D)該全体最適蛋白質配列からさらなる最適配列のランク付 けされたリストを生成させることを含む請求項4記載の方法。 13.該生成がモンテカルロサーチの使用を含む請求項12記載の方法。 14.該解析工程がモンテカルロ計算を含む請求項2記載の方法。 15.さらに、(E)該ランク付けリストからの該蛋白質配列のいくつかまた は全てをテストして、ポテンシャルエネルギーテスト結果を得ることを含む請求 項12記載の方法。 16.さらに、(F)該ポテンシャルエネルギーテスト結果および理論的ポテ ンシャルエネルギーデータの間の対応性を解析することを含む請求項15記載の 方法。 17.請求項1または2の方法によって生成した最適化蛋白質。 18.請求項17記載の蛋白質配列をコードする核酸配列。 19.請求項18記載の核酸を含む発現ベクトル。 20.請求項18記載の核酸を含む宿主細胞。 21.公知の蛋白質配列から少なくとも約5%異なり、公知の蛋白質配列より も少なくとも20%安定である配列を有する蛋白質。 22.蛋白質骨格モデルの残基位置についての潜在的ロタマーの群を修正する ための側鎖モジュール; 該ロタマーの各々と該蛋白質の残りの全てまたは一部との相互作用を解析して 最適化蛋白質配列のランキングモジュール; を含むコンピューターを指令して特異的に機能させるコンピューター解読可能な メモリー。 23.該ランキングモジュールがファンデルワールススコアリング機能成分を 含む請求項22記載のコンピューター解読可能メモリー。 24.該ランキングモジュールが原子溶媒和スコアリング機能成分を含む請求 項22記載のコンピューター解読可能メモリー。 25.該ランキングモジュールが水素結合スコアリング機能成分を含む請求項 22記載のコンピューター解読可能メモリー。 26.該ランキングモジュールが二次構造スコアリング機能成分を含む請求項 22記載のコンピューター解読可能メモリー。 27.さらに、ポテンシャルエネルギーテスト結果および理論的ポテンシャル エネルギーデータの間の対応性を評価するための接近可能モジュールを含む請求 項22記載のコンピューター解読可能メモリー。
JP54410998A 1997-04-11 1998-04-10 自動蛋白質デザインのための装置および方法 Ceased JP2002510966A (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US4346497P 1997-04-11 1997-04-11
US60/043,464 1997-04-11
US5467897P 1997-08-04 1997-08-04
US60/054,678 1997-08-04
US6109797P 1997-10-03 1997-10-03
US60/061,097 1997-10-03
PCT/US1998/007254 WO1998047089A1 (en) 1997-04-11 1998-04-10 Apparatus and method for automated protein design

Publications (1)

Publication Number Publication Date
JP2002510966A true JP2002510966A (ja) 2002-04-09

Family

ID=27366337

Family Applications (1)

Application Number Title Priority Date Filing Date
JP54410998A Ceased JP2002510966A (ja) 1997-04-11 1998-04-10 自動蛋白質デザインのための装置および方法

Country Status (8)

Country Link
US (11) US6188965B1 (ja)
EP (1) EP0974111B1 (ja)
JP (1) JP2002510966A (ja)
AU (1) AU751331B2 (ja)
CA (1) CA2286262A1 (ja)
DE (1) DE69810603T2 (ja)
DK (1) DK0974111T3 (ja)
WO (1) WO1998047089A1 (ja)

Families Citing this family (190)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060277017A1 (en) * 1993-11-04 2006-12-07 Sproch Norman K Method for the characterization of the three-dimensional structure of proteins employing mass spectrometric analysis and computational feedback modeling
US7047171B1 (en) * 1995-12-08 2006-05-16 Sproch Norman K Method for the characterization of the three-dimensional structure of proteins employing mass spectrometric analysis and computational feedback modeling
EP0974111B1 (en) * 1997-04-11 2003-01-08 California Institute Of Technology Apparatus and method for automated protein design
US20030049654A1 (en) * 1998-10-16 2003-03-13 Xencor Protein design automation for protein libraries
US20020048772A1 (en) * 2000-02-10 2002-04-25 Dahiyat Bassil I. Protein design automation for protein libraries
US7315786B2 (en) * 1998-10-16 2008-01-01 Xencor Protein design automation for protein libraries
CA2347214A1 (en) * 1998-10-16 2000-04-27 Klaus M. Fiebig Protein design automation for protein libraries
US6403312B1 (en) 1998-10-16 2002-06-11 Xencor Protein design automatic for protein libraries
US7208473B2 (en) 1999-01-06 2007-04-24 Xencor, Inc. Nucleic acids and protein variants of hG-CSF with granulopoietic activity
US6627186B1 (en) 1999-01-06 2003-09-30 Xencor Nucleic acids and protein variants of hG-CSF with granulopoietic activity
US6917882B2 (en) * 1999-01-19 2005-07-12 Maxygen, Inc. Methods for making character strings, polynucleotides and polypeptides having desired characteristics
US6376246B1 (en) 1999-02-05 2002-04-23 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
EP1151409A1 (en) * 1999-01-18 2001-11-07 Maxygen, Inc. Methods of populating data stuctures for use in evolutionary simulations
US7702464B1 (en) 2001-08-21 2010-04-20 Maxygen, Inc. Method and apparatus for codon determining
EP1130093A1 (en) 1999-01-19 2001-09-05 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
US20070065838A1 (en) * 1999-01-19 2007-03-22 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
US6961664B2 (en) 1999-01-19 2005-11-01 Maxygen Methods of populating data structures for use in evolutionary simulations
US7873477B1 (en) 2001-08-21 2011-01-18 Codexis Mayflower Holdings, Llc Method and system using systematically varied data libraries
US8457903B1 (en) 1999-01-19 2013-06-04 Codexis Mayflower Holdings, Llc Method and/or apparatus for determining codons
US7024312B1 (en) 1999-01-19 2006-04-04 Maxygen, Inc. Methods for making character strings, polynucleotides and polypeptides having desired characteristics
US6864359B1 (en) 1999-02-11 2005-03-08 Xencor Structure-based screening techniques for drug discovery
AU2880800A (en) * 1999-02-11 2000-08-29 Xencor, Inc. Structure-based screening techniques for drug discovery
JP3892167B2 (ja) * 1999-03-19 2007-03-14 富士通株式会社 粒子集団の配置を生成する生成装置および方法
US6343257B1 (en) 1999-04-23 2002-01-29 Peptor Ltd. Identifying pharmacophore containing combinations of scaffold molecules and substituents from a virtual library
CA2372871A1 (en) * 1999-05-12 2000-11-16 Xencor, Inc. Novel nucleic acids and proteins with growth hormone activity
US6946265B1 (en) 1999-05-12 2005-09-20 Xencor, Inc. Nucleic acids and proteins with growth hormone activity
US6514729B1 (en) * 1999-05-12 2003-02-04 Xencor, Inc. Recombinant interferon-beta muteins
US6682923B1 (en) 1999-05-12 2004-01-27 Xencor Thermostable alkaliphilic xylanase
JP2002543791A (ja) * 1999-05-12 2002-12-24 ゼンコー 新規な熱安定性の親アルカリ性キシラナーゼ
US6334099B1 (en) * 1999-05-25 2001-12-25 Digital Gene Technologies, Inc. Methods for normalization of experimental data
AU8037200A (en) * 1999-09-01 2001-03-26 California Institute Of Technology Methods and compositions utilizing a branch and terminate algorithm for protein design
US7430477B2 (en) 1999-10-12 2008-09-30 Maxygen, Inc. Methods of populating data structures for use in evolutionary simulations
US8229721B1 (en) 1999-11-03 2012-07-24 Lonza Biologics Plc Apparatus and method for structure-based prediction of amino acid sequences
ATE341793T1 (de) * 1999-11-03 2006-10-15 Algonomics N V Verfahren zum generieren von informationen in zusammenhang mit der molekularstruktur eines biomoleküls
EP1266337A2 (en) * 1999-11-22 2002-12-18 Yissum Research Development Company of the Hebrew University of Jerusalem System and method for searching a combinatorial space
JP3964087B2 (ja) * 1999-12-24 2007-08-22 株式会社カネカ 多重変異蛋白質アミノ酸配列の最適化解を算出する方法、装置、およびこの方法の処理を実行するプログラムを記憶する記憶媒体
US7462354B2 (en) * 1999-12-28 2008-12-09 Pharmexa Inc. Method and system for optimizing minigenes and peptides encoded thereby
EP1621617A1 (en) * 2000-02-10 2006-02-01 Xencor, Inc. Protein design automation for protein libraries
AU5168701A (en) * 2000-02-10 2001-08-20 Xencor Protein design automation for protein libraries
US7687461B2 (en) 2000-03-02 2010-03-30 Xencor, Inc. Treatment of TNF-α related disorders with TNF-α variant proteins
US7244823B2 (en) * 2000-03-02 2007-07-17 Xencor TNF-alpha variants proteins for the treatment of TNF-alpha related disorders
US7056695B2 (en) 2000-03-02 2006-06-06 Xencor TNF-α variants
US7662367B2 (en) * 2000-03-02 2010-02-16 Xencor, Inc. Pharmaceutical compositions for the treatment of TNF-α related disorders
US20070172449A1 (en) * 2000-03-02 2007-07-26 Xencor, Inc. TNF-alpha VARIANT FORMULATIONS FOR THE TREATMENT OF TNF-alpha RELATED DISORDERS
EP1259616A2 (en) * 2000-03-02 2002-11-27 Xencor Tnf-alpha variants for the treatment of tnf-alpha related disorders
US7446174B2 (en) 2001-03-02 2008-11-04 Xencor, Inc. Protein based TNF-α variants for the treatment of TNF-α related disorders
US7101974B2 (en) * 2000-03-02 2006-09-05 Xencor TNF-αvariants
US6983233B1 (en) 2000-04-19 2006-01-03 Symyx Technologies, Inc. Combinatorial parameter space experiment design
EP1314111A2 (en) * 2000-05-24 2003-05-28 California Institute Of Technology Methods for protein design
US6586207B2 (en) * 2000-05-26 2003-07-01 California Institute Of Technology Overexpression of aminoacyl-tRNA synthetases for efficient production of engineered proteins containing amino acid analogues
DE10028875A1 (de) * 2000-06-10 2001-12-20 Hte Gmbh Rechnergestützte Optimierung von Substanzbibliotheken
AU2001282880A1 (en) * 2000-07-07 2002-01-21 California Institute Of Technology Proteins with integrin-like activity
WO2002005146A2 (en) * 2000-07-10 2002-01-17 Xencor, Inc. Method for disigning protein libraries with altered immunogenicity
WO2002014875A2 (en) * 2000-08-16 2002-02-21 Ramot University Authority For Applied Research & Industrial Development Ltd. Method and system for predicting amino acid sequence
IL137886A0 (en) 2000-08-16 2001-10-31 Univ Ramot A novel algorithm for de novo protein design
WO2002038746A2 (en) * 2000-11-10 2002-05-16 Xencor Novel thermostable alkaliphilic xylanase
CA2431066C (en) * 2000-12-15 2007-05-15 Youqi Wang Methods and apparatus for designing high-dimensional combinatorial experiments
US7231328B2 (en) * 2001-02-06 2007-06-12 The Penn State Research Foundation Apparatus and method for designing proteins and protein libraries
US20030036854A1 (en) * 2001-02-06 2003-02-20 The Penn State Research Foundation Apparatus and method for designing proteins and protein libraries
US20020183937A1 (en) * 2001-02-09 2002-12-05 Stephen Mayo Method for the generation of proteins with new enzymatic function
US20030032065A1 (en) * 2001-03-12 2003-02-13 Vince Hilser Ensemble-based strategy for the design of protein pharmaceuticals
JP2005512161A (ja) * 2001-03-12 2005-04-28 ボード オブ レジェンツ,ザ ユニバーシティー オブ テキサス システム ペプチドおよびタンパク質の立体配座アンサンブルの列挙およびリガンド親和性分析のためのコンピュータベースのストラテジー
JP2005505250A (ja) * 2001-05-04 2005-02-24 ゼンコー 核酸およびチオレドキシンレダクターゼ活性を有するタンパク質
US20030211511A1 (en) * 2001-05-04 2003-11-13 Briggs Steven P. Nucleic acids and proteins with thioredoxin reductase activity
US20030049680A1 (en) * 2001-05-24 2003-03-13 Gordon D. Benjamin Methods and compositions utilizing hybrid exact rotamer optimization algorithms for protein design
US7110525B1 (en) 2001-06-25 2006-09-19 Toby Heller Agent training sensitive call routing system
US20030022285A1 (en) * 2001-07-10 2003-01-30 Chirino Arthur J. Protein design automation for designing protein libraries with altered immunogenicity
EP1510959A3 (en) * 2001-08-10 2006-07-26 Xencor, Inc. Protein design automation for protein libraries
WO2003014325A2 (en) * 2001-08-10 2003-02-20 Xencor Protein design automation for protein libraries
CA2458919A1 (en) * 2001-08-31 2003-03-13 Optimum Power Technology, L.P. Design optimization
US6822073B2 (en) * 2001-12-20 2004-11-23 Kimberly-Clark Worldwide, Inc. Modular peptide-based reagent
US7381792B2 (en) * 2002-01-04 2008-06-03 Xencor, Inc. Variants of RANKL protein
WO2003073238A2 (en) * 2002-02-27 2003-09-04 California Institute Of Technology Computational method for designing enzymes for incorporation of amino acid analogs into proteins
US20040110226A1 (en) * 2002-03-01 2004-06-10 Xencor Antibody optimization
US20070148171A1 (en) * 2002-09-27 2007-06-28 Xencor, Inc. Optimized anti-CD30 antibodies
US7662925B2 (en) 2002-03-01 2010-02-16 Xencor, Inc. Optimized Fc variants and methods for their generation
US8188231B2 (en) 2002-09-27 2012-05-29 Xencor, Inc. Optimized FC variants
US20080260731A1 (en) * 2002-03-01 2008-10-23 Bernett Matthew J Optimized antibodies that target cd19
US20040132101A1 (en) * 2002-09-27 2004-07-08 Xencor Optimized Fc variants and methods for their generation
US20080254027A1 (en) * 2002-03-01 2008-10-16 Bernett Matthew J Optimized CD5 antibodies and methods of using the same
US7317091B2 (en) * 2002-03-01 2008-01-08 Xencor, Inc. Optimized Fc variants
JP4209334B2 (ja) * 2002-03-26 2009-01-14 カウンシル・オブ・サイエンティフィック・アンド・インダストリアル・リサーチ 3次元分子構造の最適モデルを構築する方法及びシステム
AU2003220559A1 (en) * 2002-03-26 2003-10-13 Carnegie Mellon University Methods and systems for molecular modeling
WO2003087310A2 (en) * 2002-04-04 2003-10-23 California Institute Of Technology Directed protein docking algorithm
US7272545B2 (en) * 2002-05-22 2007-09-18 General Electric Company Method and apparatus for designing and locating chemical structures
JP2006507562A (ja) * 2002-05-23 2006-03-02 ザ ボード オブ レジェンツ−ザ ユニバーシティー オブ テキサス システム アンサンブルベースの構造エネルギーを使用した一塩基多型(snps)の意義の予測
WO2004003683A2 (en) * 2002-07-01 2004-01-08 3-Dimensional Pharmaceuticals, Inc. Conformational sampling by self-organization
DE10233047A1 (de) * 2002-07-19 2004-02-26 Amaxa Gmbh Verfahren zur Herstellung eines künstlichen Polypeptids und nach diesem Verfahren hergestelltes künstliches Protein
US20040082783A1 (en) * 2002-08-06 2004-04-29 Schafmeister Christian E. Bis (amino acid) molecular scaffolds
US20060235208A1 (en) * 2002-09-27 2006-10-19 Xencor, Inc. Fc variants with optimized properties
ES2562177T3 (es) 2002-09-27 2016-03-02 Xencor Inc. Variantes de Fc optimizadas y métodos para su generación
US20040175359A1 (en) * 2002-11-12 2004-09-09 Desjarlais John Rudolph Novel proteins with antiviral, antineoplastic, and/or immunomodulatory activity
US20050130892A1 (en) * 2003-03-07 2005-06-16 Xencor, Inc. BAFF variants and methods thereof
US7553930B2 (en) * 2003-01-06 2009-06-30 Xencor, Inc. BAFF variants and methods thereof
US20050221443A1 (en) * 2003-01-06 2005-10-06 Xencor, Inc. Tumor necrosis factor super family agonists
US20060014248A1 (en) * 2003-01-06 2006-01-19 Xencor, Inc. TNF super family members with altered immunogenicity
AU2004204942A1 (en) * 2003-01-08 2004-07-29 Xencor, Inc Novel proteins with altered immunogenicity
WO2004066168A1 (en) * 2003-01-20 2004-08-05 Cambridge University Technical Services Limited Computational method and apparatus for predicting polypeptide aggregation or solubility
WO2004065363A2 (en) * 2003-01-21 2004-08-05 The Trustees Of The University Of Pennsylvania Computational design of a water-soluble analog of a protein, such as phospholamban and potassium channel kcsa
US9818136B1 (en) 2003-02-05 2017-11-14 Steven M. Hoffberg System and method for determining contingent relevance
US20040176585A1 (en) * 2003-02-27 2004-09-09 Carter Richard J. Method and system for determining optimal sequences
US20090010920A1 (en) 2003-03-03 2009-01-08 Xencor, Inc. Fc Variants Having Decreased Affinity for FcyRIIb
US8084582B2 (en) 2003-03-03 2011-12-27 Xencor, Inc. Optimized anti-CD20 monoclonal antibodies having Fc variants
US8388955B2 (en) * 2003-03-03 2013-03-05 Xencor, Inc. Fc variants
US20070275460A1 (en) * 2003-03-03 2007-11-29 Xencor.Inc. Fc Variants With Optimized Fc Receptor Binding Properties
US7610156B2 (en) * 2003-03-31 2009-10-27 Xencor, Inc. Methods for rational pegylation of proteins
US7642340B2 (en) 2003-03-31 2010-01-05 Xencor, Inc. PEGylated TNF-α variant proteins
AU2004227937B2 (en) * 2003-03-31 2007-09-20 Xencor, Inc Methods for rational pegylation of proteins
US9051373B2 (en) 2003-05-02 2015-06-09 Xencor, Inc. Optimized Fc variants
US20040229290A1 (en) * 2003-05-07 2004-11-18 Duke University Protein design for receptor-ligand recognition and binding
US20050064555A1 (en) * 2003-07-09 2005-03-24 Xencor, Inc. Ciliary neurotrophic factor variants
WO2005052839A2 (en) * 2003-07-29 2005-06-09 California Institute Of Technology Systems and methods for predicting transmembrane domains in membrane proteins and mining the genome for recognizing g-protein coupled receptors
WO2005017805A2 (en) * 2003-08-13 2005-02-24 California Institute Of Technology Systems and methods for predicting the structure and function of multipass transmembrane proteins
US7765175B2 (en) * 2003-09-18 2010-07-27 Optimum Power Technology, L.P. Optimization expert system
US20050065879A1 (en) * 2003-09-18 2005-03-24 Convergys Information Management Group, Inc. System and method for web service billing
US9714282B2 (en) 2003-09-26 2017-07-25 Xencor, Inc. Optimized Fc variants and methods for their generation
US8101720B2 (en) 2004-10-21 2012-01-24 Xencor, Inc. Immunoglobulin insertions, deletions and substitutions
CA2542353A1 (en) 2003-10-10 2005-04-21 Xencor, Inc. Protein based tnf-alpha variants for the treatment of tnf-alpha related disorders
WO2005038596A2 (en) * 2003-10-14 2005-04-28 Verseon Method and apparatus for estimation of the electrostatic affinity between molecules using a basis expansion
US20070149496A1 (en) * 2003-10-31 2007-06-28 Jack Tuszynski Water-soluble compound
GB0325817D0 (en) * 2003-11-05 2003-12-10 Univ Cambridge Tech Method and apparatus for assessing polypeptide aggregation
WO2005044087A2 (en) * 2003-11-05 2005-05-19 The Regents Of The University Of California Methods for the determination of protein three-dimensional structure employing hydrogen exchange analysis to refine computational structure prediction
WO2005047520A2 (en) * 2003-11-07 2005-05-26 Dna Software, Inc. System and methods for three dimensional molecular structural analysis
US7574306B1 (en) * 2003-11-20 2009-08-11 University Of Washington Method and system for optimization of polymer sequences to produce polymers with stable, 3-dimensional conformations
EP1697741A4 (en) 2003-12-04 2008-02-13 Xencor Inc PROCESS FOR PRODUCING PROTEIN VARIANTS WITH INCREASED HOST STRUCTURE CONTENT AND COMPOSITIONS THEREOF
US20060122783A1 (en) * 2004-08-24 2006-06-08 Ishikawa Muriel Y System and method for heightening a humoral immune response
US20060003412A1 (en) * 2003-12-08 2006-01-05 Xencor, Inc. Protein engineering with analogous contact environments
US20070249809A1 (en) * 2003-12-08 2007-10-25 Xencor, Inc. Protein engineering with analogous contact environments
US20050249723A1 (en) * 2003-12-22 2005-11-10 Xencor, Inc. Fc polypeptides with novel Fc ligand binding sites
WO2005092925A2 (en) * 2004-03-24 2005-10-06 Xencor, Inc. Immunoglobulin variants outside the fc region
US20050260711A1 (en) * 2004-03-30 2005-11-24 Deepshikha Datta Modulating pH-sensitive binding using non-natural amino acids
WO2005109158A2 (en) * 2004-05-05 2005-11-17 Massachusetts Institute Of Technology Methods and systems for generating peptides
US20050287639A1 (en) 2004-05-17 2005-12-29 California Institute Of Technology Methods of incorporating amino acid analogs into proteins
WO2005113599A1 (en) * 2004-05-21 2005-12-01 Xencor, Inc. C1q family member proteins with altered immunogenicity
US20150010550A1 (en) 2004-07-15 2015-01-08 Xencor, Inc. OPTIMIZED Fc VARIANTS
US20060074225A1 (en) * 2004-09-14 2006-04-06 Xencor, Inc. Monomeric immunoglobulin Fc domains
US20060136139A1 (en) * 2004-10-12 2006-06-22 Elcock Adrian H Rapid computational identification of targets
US10755905B2 (en) * 2004-10-28 2020-08-25 Cerno Bioscience Llc Qualitative and quantitative mass spectral analysis
CN102746404B (zh) 2004-11-12 2016-01-20 赞科股份有限公司 对FcRn的结合被改变的Fc变体
US8546543B2 (en) 2004-11-12 2013-10-01 Xencor, Inc. Fc variants that extend antibody half-life
US8367805B2 (en) * 2004-11-12 2013-02-05 Xencor, Inc. Fc variants with altered binding to FcRn
US20070135620A1 (en) * 2004-11-12 2007-06-14 Xencor, Inc. Fc variants with altered binding to FcRn
US8802820B2 (en) 2004-11-12 2014-08-12 Xencor, Inc. Fc variants with altered binding to FcRn
AU2006204791A1 (en) * 2005-01-12 2006-07-20 Xencor, Inc Antibodies and Fc fusion proteins with altered immunogenicity
WO2006094234A1 (en) * 2005-03-03 2006-09-08 Xencor, Inc. Methods for the design of libraries of protein variants
US20080207467A1 (en) * 2005-03-03 2008-08-28 Xencor, Inc. Methods for the design of libraries of protein variants
BRPI0614695A2 (pt) 2005-07-29 2011-04-12 Targeted Growth Inc proteção de proteìna krp mutante negativa dominante de inibição de complexo ciclina-cdk ativo por krp do tipo silvestre
WO2007030426A2 (en) * 2005-09-07 2007-03-15 Board Of Regents, The University Of Texas System Methods of using and analyzing biological sequence data
US20070072226A1 (en) * 2005-09-27 2007-03-29 Indiana University Research & Technology Corporation Mining protein interaction networks
EP1931709B1 (en) * 2005-10-03 2016-12-07 Xencor, Inc. Fc variants with optimized fc receptor binding properties
CA2625998C (en) 2005-10-06 2015-12-01 Xencor, Inc. Optimized anti-cd30 antibodies
JP2009514535A (ja) * 2005-11-03 2009-04-09 レッドポイント バイオ コーポレイション Trpm5イオンチャネルのためのハイスループットスクリーニングアッセイ
WO2007061850A2 (en) * 2005-11-17 2007-05-31 Massachusetts Institute Of Technology Methods and systems for generating and evaluating peptides
JP5808882B2 (ja) 2006-03-03 2015-11-10 カリフォルニア インスティテュート オブ テクノロジー 分子へのアミノ酸の部位特異的な組み込み
US20070208411A1 (en) * 2006-03-06 2007-09-06 Boston Scientific Scimed, Inc. Bifurcated stent with surface area gradient
US20070254307A1 (en) * 2006-04-28 2007-11-01 Verseon Method for Estimation of Location of Active Sites of Biopolymers Based on Virtual Library Screening
US20080096819A1 (en) * 2006-05-02 2008-04-24 Allozyne, Inc. Amino acid substituted molecules
EP2581450B1 (en) 2006-05-02 2018-08-15 MedImmune Limited Non-natural amino acid substituted polypeptides
EP2031528A4 (en) * 2006-05-26 2009-06-17 Univ Kyoto ESTIMATING A PROTEIN-COMPOUND INTERACTION AND RATIONAL DESIGN OF A LIBRARY OF COMPOUNDS BASED ON CHEMICAL GENOMIC INFORMATION
US7674594B2 (en) * 2006-07-27 2010-03-09 Redpoint Bio Corporation Screening assay for inhibitors of TRPA1 activation by a lower alkyl phenol
AU2007285976B2 (en) 2006-08-14 2011-08-18 Xencor, Inc Optimized antibodies that target CD19
CA2660795C (en) * 2006-09-18 2014-11-18 Xencor, Inc. Optimized antibodies that target hm1.24
AU2008247815B2 (en) 2007-05-02 2012-09-06 Ambrx, Inc. Modified interferon beta polypeptides and their uses
US7580304B2 (en) * 2007-06-15 2009-08-25 United Memories, Inc. Multiple bus charge sharing
CA2707840A1 (en) * 2007-08-20 2009-02-26 Allozyne, Inc. Amino acid substituted molecules
US7875452B2 (en) * 2007-10-01 2011-01-25 Redpoint Bio Corporation Non-desensitizing mutant of the transient receptor potential TRPM5 ion channel
MX338336B (es) 2007-11-20 2016-04-07 Ambrx Inc Polipeptidos de insulina modificados y sus usos.
PL2235059T3 (pl) 2007-12-26 2015-08-31 Xencor Inc Warianty FC o zmodyfikowanym wiązaniu do FCRN
WO2009149218A2 (en) * 2008-06-03 2009-12-10 Codon Devices, Inc. Novel proteins and methods of designing and using same
PT2318029T (pt) 2008-07-23 2018-01-10 Ambrx Inc Polipéptidos de g-csf bovino modificados e suas utilizações
WO2010080720A2 (en) 2009-01-12 2010-07-15 Nektar Therapeutics Conjugates of a lysosomal enzyme moiety and a water soluble polymer
EP2467398B1 (en) 2009-08-20 2019-10-09 Poseida Therapeutics, Inc. Trpc4 inhibitors and uses thereof
US9493578B2 (en) 2009-09-02 2016-11-15 Xencor, Inc. Compositions and methods for simultaneous bivalent and monovalent co-engagement of antigens
US20120283171A1 (en) 2009-12-21 2012-11-08 Ambrx, Inc. Modified bovine somatotropin polypeptides and their uses
SG181769A1 (en) 2009-12-21 2012-07-30 Ambrx Inc Modified porcine somatotropin polypeptides and their uses
WO2011091078A2 (en) 2010-01-19 2011-07-28 Xencor, Inc. Antibody fc variants with enhanced complement activity
PL2605789T3 (pl) 2010-08-17 2019-11-29 Ambrx Inc Zmodyfikowane polipeptydy relaksyny i ich zastosowania
AR083006A1 (es) 2010-09-23 2013-01-23 Lilly Co Eli Formulaciones para el factor estimulante de colonias de granulocitos (g-csf) bovino y variantes de las mismas
EP3485889B1 (en) 2011-12-16 2023-09-06 Poseida Therapeutics, Inc. Trpc4 modulators for use in the treatment or prevention of pain
US20130252280A1 (en) * 2012-03-07 2013-09-26 Genformatic, Llc Method and apparatus for identification of biomolecules
WO2014144963A1 (en) 2013-03-15 2014-09-18 Alexandre Zanghellini Automated method of computational enzyme identification and design
WO2014201566A1 (en) * 2013-06-21 2014-12-24 Zymeworks Inc. Systems and methods for physical parameter fitting on the basis of manual review
US10381326B2 (en) 2014-05-28 2019-08-13 Invensas Corporation Structure and method for integrated circuits packaging with increased density
EP3436470A4 (en) 2016-04-01 2019-11-20 University of Washington POLYPEPTIDES CAPABLE OF FORMING HOMO-OLIGOMERS HAVING SPECIFICITY MEDIATED BY MODULAR HYDROGEN BOND NETWORKS AND THEIR DESIGN
SG11202005732XA (en) 2017-12-19 2020-07-29 Xencor Inc Engineered il-2 fc fusion proteins
US20190325986A1 (en) * 2018-04-24 2019-10-24 Samsung Electronics Co., Ltd. Method and device for predicting amino acid substitutions at site of interest to generate enzyme variant optimized for biochemical reaction
CA3111576A1 (en) 2018-09-11 2020-03-19 Ambrx, Inc. Interleukin-2 polypeptide conjugates and their uses
AU2019361206A1 (en) 2018-10-19 2021-06-03 Ambrx, Inc. Interleukin-10 polypeptide conjugates, dimers thereof, and their uses
AU2021233909A1 (en) 2020-03-11 2022-09-29 Ambrx, Inc. Interleukin-2 polypeptide conjugates and methods of use thereof
CN114495243B (zh) * 2022-04-06 2022-07-05 第六镜科技(成都)有限公司 图像识别模型训练及图像识别方法、装置、电子设备

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4939666A (en) * 1987-09-02 1990-07-03 Genex Corporation Incremental macromolecule construction methods
US5527681A (en) 1989-06-07 1996-06-18 Affymax Technologies N.V. Immobilized molecular synthesis of systematically substituted compounds
US5265030A (en) * 1990-04-24 1993-11-23 Scripps Clinic And Research Foundation System and method for determining three-dimensional structures of proteins
US5241470A (en) * 1992-01-21 1993-08-31 The Board Of Trustees Of The Leland Stanford University Prediction of protein side-chain conformation by packing optimization
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US5878373A (en) * 1996-12-06 1999-03-02 Regents Of The University Of California System and method for determining three-dimensional structure of protein sequences
GB9701425D0 (en) 1997-01-24 1997-03-12 Bioinvent Int Ab A method for in vitro molecular evolution of protein function
EP0974111B1 (en) * 1997-04-11 2003-01-08 California Institute Of Technology Apparatus and method for automated protein design
US7315786B2 (en) * 1998-10-16 2008-01-01 Xencor Protein design automation for protein libraries
US20020048772A1 (en) * 2000-02-10 2002-04-25 Dahiyat Bassil I. Protein design automation for protein libraries
US20030049654A1 (en) * 1998-10-16 2003-03-13 Xencor Protein design automation for protein libraries
CA2347214A1 (en) 1998-10-16 2000-04-27 Klaus M. Fiebig Protein design automation for protein libraries
US6403312B1 (en) * 1998-10-16 2002-06-11 Xencor Protein design automatic for protein libraries
JP2002543791A (ja) 1999-05-12 2002-12-24 ゼンコー 新規な熱安定性の親アルカリ性キシラナーゼ
AU5168701A (en) 2000-02-10 2001-08-20 Xencor Protein design automation for protein libraries
WO2003014325A2 (en) * 2001-08-10 2003-02-20 Xencor Protein design automation for protein libraries

Also Published As

Publication number Publication date
US20050038610A1 (en) 2005-02-17
DE69810603D1 (de) 2003-02-13
US6188965B1 (en) 2001-02-13
US20070032961A1 (en) 2007-02-08
US6269312B1 (en) 2001-07-31
US20060259247A1 (en) 2006-11-16
US6950754B2 (en) 2005-09-27
US20010032052A1 (en) 2001-10-18
EP0974111A1 (en) 2000-01-26
WO1998047089A1 (en) 1998-10-22
US20020106694A1 (en) 2002-08-08
US20010039480A1 (en) 2001-11-08
US6804611B2 (en) 2004-10-12
EP0974111B1 (en) 2003-01-08
US6801861B2 (en) 2004-10-05
US6708120B1 (en) 2004-03-16
AU6965498A (en) 1998-11-11
US20020004706A1 (en) 2002-01-10
US20060019316A1 (en) 2006-01-26
US6792356B2 (en) 2004-09-14
CA2286262A1 (en) 1998-10-22
AU751331B2 (en) 2002-08-15
DE69810603T2 (de) 2003-11-13
DK0974111T3 (da) 2003-04-22

Similar Documents

Publication Publication Date Title
JP2002510966A (ja) 自動蛋白質デザインのための装置および方法
EP1255209A2 (en) Apparatus and method for automated protein design
Pallaghy et al. Solution structure of contryphan-R, a naturally occurring disulfide-bridged octapeptide containing D-tryptophan: comparison with protein loops
Dalton et al. Homology-modelling protein–ligand interactions: allowing for ligand-induced conformational change
Roe et al. Folding cooperativity in a three-stranded β-sheet model
Durdagi et al. Atomistic models for free energy evaluation of drug binding to membrane proteins
Worth et al. Use of multiple molecular dynamics trajectories to study biomolecules in solution: the YTGP peptide
Polydorides et al. Proteus and the design of ligand binding sites
Gong et al. A holistic molecular docking approach for predicting protein-protein complex structure
Dwevedi Protein folding: Examining the challenges from synthesis to folded form
Wang et al. An atomic radii set and Generalized Born implicit solvation model trained using explicit water solvation free energy data
Roitberg A molecular dynamics study of Fe2S2 putidaredoxin: multiple conformations of the C-terminal region
AU2002302138B2 (en) Apparatus and method for automated protein design
AU2005211654B2 (en) Apparatus and method for automated protein design
Karpusenka Free Energy and Structure of Helix-forming Peptides: A theoretical investigation
Godwin Binding Nemo: Adventures in Molecular Dynamics
Mokoena Computational studies of the folding patterns of small and medium-size polypeptides
Li Computational protein design: assessment and applications
Leis Impact of Protein conformational Changes on Molecular Docking-Design of a Docking Approach including Receptor Flexibility
Stultz et al. Fragment docking to proteins with the multi-copy simultaneous search methodology
Eisenman et al. Structure and selectivity of Ca-binding sites in proteins: the 5-fold site in an icosahedral virus
Samsonov Protein-protein interactions: impact of solvent and effects of fluorination
Falconi et al. Molecular modeling and dynamics of copper proteins
Denison A minimal model for the hydrophobic and hydrogen bonding effects on secondary and tertiary structure formation in proteins
Feng New statistical potentials for improved protein structure prediction

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070925

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20071218

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080204

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20080325

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20080526

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080603

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090707

AA92 Notification that decision to refuse application was cancelled

Free format text: JAPANESE INTERMEDIATE CODE: A971092

Effective date: 20090721

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090804

A313 Final decision of rejection without a dissenting response from the applicant

Free format text: JAPANESE INTERMEDIATE CODE: A313

Effective date: 20091123

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100105