JP2006507562A - アンサンブルベースの構造エネルギーを使用した一塩基多型(snps)の意義の予測 - Google Patents

アンサンブルベースの構造エネルギーを使用した一塩基多型(snps)の意義の予測 Download PDF

Info

Publication number
JP2006507562A
JP2006507562A JP2004508244A JP2004508244A JP2006507562A JP 2006507562 A JP2006507562 A JP 2006507562A JP 2004508244 A JP2004508244 A JP 2004508244A JP 2004508244 A JP2004508244 A JP 2004508244A JP 2006507562 A JP2006507562 A JP 2006507562A
Authority
JP
Japan
Prior art keywords
protein
database
single nucleotide
data
residue
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2004508244A
Other languages
English (en)
Inventor
ヒルサー、ヴィンス
フォックス、ロバート、オウ.
Original Assignee
ザ ボード オブ レジェンツ−ザ ユニバーシティー オブ テキサス システム
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ザ ボード オブ レジェンツ−ザ ユニバーシティー オブ テキサス システム filed Critical ザ ボード オブ レジェンツ−ザ ユニバーシティー オブ テキサス システム
Publication of JP2006507562A publication Critical patent/JP2006507562A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/20Protein or domain folding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction

Abstract

本発明は、タンパク質データベースおよびタンパク質機能に関連する同定された一塩基多型を含むタンパク質データベースの開発方法に関する。なおさらに、本発明は、至適化された薬学的特性を有するタンパク質医薬品をデザインするためのタンパク質データベースの利用に関する。

Description

本出願は、2002年5月23日提出の米国特許仮出願60/382,784号(本明細書中で参考として援用される)の優先権を主張する。
本研究は、合衆国政府の助成金によって援助された。合衆国政府は、本発明に一定の権利を有し得る。
本発明は、構造生物学分野に関する。より詳細には、本発明は、タンパク質データベースおよびタンパク質機能に関連する同定された一塩基多型を含むタンパク質データベースの開発方法に関する。なおさらに、本発明は、至適化された薬学的特性を有するタンパク質医薬品をデザインするためのタンパク質データベースの利用に関する。
種の各メンバー間のDNAの同一のゲノム領域で天然のDNA配列の変化が存在する。このような情報は罹患状態に対する感受性に関連する配列の同定の一助となり、遺伝物質の特徴についての遺伝情報を獲得して分析することができるので、このようなDNAのゲノム領域の類似性および相違を同定することは興味深い。
細胞が再生する場合、そのDNA分子が複製され、正確なコピーがその子孫に伝えられる。相補性DNA塩基対合によって、複製中にDNA分子の線状塩基配列が維持される。時折、DNA複製中に不正確な塩基対合が起こり、新規の鎖のさらなる複製後、親DNA分子と遺伝性の一塩基相違を含む配列を有する二本鎖DNA子孫が得られる。このような遺伝性の変化は、「遺伝子多型」、「遺伝子変異」、「一塩基対変異」、「点変異」、または単純に「DNAミスマッチ」と呼ばれる。DNA複製時の無作為な変異に加えて、生物はDNAに被害または損傷を与える内因性および外因性の遺伝毒性因子から常に攻撃を受けている。このようなDNAの損傷または被害により、DNAミスマッチまたはDNA変異(挿入または欠失など)を形成し得る。
天然のDNA配列の変化、DNA変異、DNAミスマッチ、およびDNA損傷の影響は、DNAによってコードされる遺伝情報に関する配列の変化の位置および影響に依存して、ごく僅かなものから致命的なものまでの範囲にわたる。いくつかの例では、天然のDNA配列の変化、DNA変異、DNAミスマッチ、およびDNA損傷は、早期検出が治療に重要な癌および他の疾患を引き起こし得る。
したがって、個体間のDNA配列の相違を迅速に同定することができることが非常に必要である。さらに、癌および他の疾患の早期検出のためにDNA変異、DNAミスマッチ、およびDNA損傷を同定することが必要である。
現在、バイオインフォマティクスアルゴリズムは、個体の全ゲノムをデータベースに入力することによって一塩基多型(SNP)と病態とを相関させて、これらの疾患について、ジェノチピカリ(genotypically)に陽性であるかどうかを決定することを試みる。このプロセスは、所与の疾患を担うSNPもしくはSNPsが、重要度が低い相違のバックグラウンドに存在するという事実によって複雑になる。このバックグラウンドの「ノイズ」は、なぜこのようなアプローチが特定の疾患を担うSNPを固有に同定できないのかということの理由の1つである。
本発明は、上記アプローチの有効性を増大させるシグナルからの「ノイズ」の同定を伴わない機能的に関連するSNPsを同定するアルゴリズムのセットを使用する始めてのものである。
本発明は、データベースおよびタンパク質機能に関連する同定された一塩基多型を含むデータベースの開発方法に関する。このデータベースを使用して、至適化された薬学的特性(結合親和性など)を有するタンパク質医薬品をデザインすることができる。
本発明の実施形態は、タンパク質機能(例えば、結合親和性)に関連する同定された一塩基多型を有する非相同タンパク質を含むタンパク質データベースである。
データベースは、式:
Figure 2006507562
によるタンパク質中の残基間の残基特異的結合性を決定する工程を含む計算方法によって決定される。
データベースは、式:
Figure 2006507562
によるタンパク質の結合部位とタンパク質中の各残基との間の機能的結合性を決定する工程を含む計算方法によって決定される。
本発明の別の実施形態は、タンパク質の活性部位を妨害する関連一塩基多型を有するサブセットを決定するために本発明に記載のデータベースを使用する工程を含む、薬学的組成物の副作用を起こす危険性がある集団のサブセットを予測する方法である。
なおさらに、別の実施形態は、一塩基多型とタンパク質の活性部位との相互作用を決定するために本発明のデータベースを使用する工程と、薬学的組成物が前記タンパク質の活性部位に結合するように一塩基多型の相互作用を克服するように薬学的組成物をデザインする工程とを含む、タンパク質の活性部位に薬学的組成物をターゲティングする方法である。
別の実施形態では、本発明は、タンパク質の高分解能構造を入力する工程と、各タンパク質の全ての可能な組み合わせ中の所定の折りたたみ単位のセットの組み合わせ非折り畳みによって漸増的に異なる高次構造状態のアンサンブルを得る工程と、前記各高次構造状態の確率を決定する工程と、前記各高次構造状態の残基特異的結合性を計算する工程と、前記各高次構造状態の機能的結合性を計算する工程とを含む、タンパク質データベースの開発方法を提供する。
特定の実施形態は、タンパク質データのデータ構造を有するタンパク質データベースと、前記データ構造が関連する一塩基多型のデータフィールドを含むことと、前記データベースのタンパク質データを同定するためのコンピュータベースのプログラムと、前記プログラムが、1つまたは複数のタンパク質の高解像度構造データを受信するための入力モジュールと、1つまたは複数のタンパク質の活性部位中の一塩基多型の関連を決定し、前記タンパク質データベースのデータフィールドに前記データを保存するための処理モジュールとを含むこととを含むタンパク質機能に関連する同定された一塩基多型を有するタンパク質データベースの開発システムである。コンピュータプログラムは、スクリーニングまたはプリントアウトするための1つまたは複数の画像レポートを作成するためのディスプレイモジュールをさらに含む。
本発明の別の実施形態は、アミノ酸名またはアミノ酸略語の値を保存するフィールドと、関連一塩基多型の数値を示す値を保存するための1つまたは複数の分類フィールドを含む、関連一塩基多型群を定義する情報を保存するデータ構造を有するデータベースを含む。
なおさらに、別の実施形態は、タンパク質医薬品の変異型の試験データセットを得る工程と、前記変異型が一塩基多型を含むことと、コンピュータベースの方法を使用して試験データセットについてのアンサンブル由来の特性のライブラリを準備する工程と、前記試験データセット内の各タンパク質変異型についての所与の特性の実験データを得る工程と、前記実験データおよび前記アンサンブル由来の特性のライブラリを使用して助変数方程式を導く工程と至適化された薬学的特性を得るために上記工程によって得られた情報を使用してタンパク質医薬品を作製する工程とを含む、至適化された薬学的特性を示すタンパク質医薬品をデザインする方法である。至適化された特性により結合親和性が増大する。
本発明の別の実施形態は、タンパク質の高解像度構造を入力する工程と、各タンパク質の全ての可能な組み合わせ中の所定の折りたたみ単位のセットの組み合わせ非折り畳みによって漸増的に異なる高次構造状態のアンサンブルを得る工程と、前記各高次構造状態の確率を決定する工程と、前記各高次構造状態の残基特異的結合性を計算する工程と、前記各高次構造状態の機能的結合性を計算する工程とを含む、関連一塩基多型を同定する方法である。
上記は、以下の本発明の詳細な説明をより深く理解することができるように、本発明の特徴および技術的利点をやや広範に概説した。本発明のさらなる特徴および利点を以後に記載し、これは本発明の特許請求の範囲の主題を形成する。本発明のこの目的を実施するための他の構造の修正またはデザインの基本として開示の概念および特定の実施形態を容易に利用することができることが当業者に認識されるべきである。このような等価な構造が添付の特許請求の範囲に記載の本発明の精神および範囲を逸脱しないことも当業者に認識されるべきである。その機構および操作方法の両方に関して本発明に特有であると考えられる新規の特徴は、さらなる目的および利点と共に、添付の図面と併せて考慮した場合、以下の説明からより深く理解される。しかし、各図は例示および説明のみを目的として提供され、本発明の制限の定義を意図しないことが明らかに理解されるべきである。
本発明のより完全な理解のために、添付の図面と併せて以下の説明を参照する。
本発明は、高分解能結晶学またはNMR構造からの非常に多数のタンパク質の部分折りたたみ状態を作成するためのCOREXアルゴリズム(Hilser & Freire,1996; Hilser & Freire,1997; Hilser etal.,1997)を使用する。COREXを使用して、タンパク質中の残基特異的および機能的結合性を計算する(Pan et al.,2000)。残基特異的および機能的結合性の決定が、タンパク質の1つの領域での変化が他の領域へどのように伝えられるのかを決定する。SNP同定の目的のために、全ての他の残基上の各残基の変化の効果をマッピングする能力により、遺伝病に関連することが公知の特定のタンパク質の活性部位または調節部位に影響を与える可能性の高い遺伝子の変化の目録を作成する手段が得られる。
I.定義
本明細書中で使用される、「a」または「an」は、1つまたは複数を意味し得る。用語「comprising」と共に使用される場合、特許請求の範囲で使用される、用語「a」または「an」は、1つまたは1つを超える複数を意味し得る。
本明細書中で使用される、「another」は、少なくとも第2またはそれ以上を意味し得る。
本明細書中で使用される、「自己タンパク質、ポリペプチド、またはペプチド」は、生物由来または生物から得たタンパク質、ポリペプチド、またはペプチドをいう。
本明細書中で使用される、「三次構造に基づく」は、基本とする元の構造と類似の骨格構造を保有する構造をいう。
本明細書中で使用される、「立体配置(Configuration)」は、原子の同一のキラリティを有するタンパク質分子の異なる立体構造をいう。
本明細書中で使用される、「立体構造(Conformation)」または「配座異性体(conformer)」は、共有結合を破壊することなく相互変換可能な原子の種々の重複不可能な三次元配置をいう。
本明細書中で使用される、「コンピュータモデリング」は、コンピュータを使用したオブジェクトまたはオブジェクトの相互作用をシミュレートするための生データを使用したパターンの構築をいう。例えば、コンピュータモデリングを使用して、特定の疾患に関連する治療を開発するために、ある化合物のサイズ、形状、および相互作用を決定する。
本明細書中で使用される、「コンピュータシミュレーション」は、科学者による現象の概念的および数学的理解に基づくいくつかの現象のシミュレーションを試みる任意のサイズのコンピュータを作動させるソフトウェアプログラムをいう。科学者の概念の理解をアルゴリズムまたは数学的論理に換算し、その後、多数のプログラミング言語の1つでプログラミングし、コンパイルしてコンピュータで作動するバイナリコードを作成する。また、このようなコードをコンピュータ上で作動させる。
本明細書中で使用される、「強制された(Constrained)」は、ペプチドを導入することができる高次構造空間の制限をいう。
本明細書中で使用される、「データベース」は、タンパク質の実験データと分析データとの関係に関する情報の任意の編集物をいう。使用したデータベースは、公的に利用可能であるか、市販されているか、本発明者らによって作成されたものであり得る。したがって、データベースは、コンピュータによる検索を容易にするように配置されたデータの集合体である。既存のデータセットと容易に比較される様式でデータは保存される。
本明細書中で使用される、「ジスルフィド架橋またはジスルフィド結合」は、2つのシステインの硫黄原子の間の共有結合をいう。
本明細書中で使用される、「作製する」または「作製」は、1つまたは複数の操作の使用による定義または創造する行為をいう。本発明を使用して、当業者は事項(the matter)またはデータ自体を作製するか、事項またはデータをいずれかに位置付けるか、本発明の実施で利用することができる。当業者は、本発明では、全ての試験データまたは実験データが市販されているか、公的に得ることができるか、本明細書中に定義の手順および技術によって作成することができることを理解する。本明細書中で使用される、用語「作成する」および「得る」は、互いを含められる。
本明細書中で使用される、「相同タンパク質、ポリペプチド、またはペプチド」は、類似の生物または祖先が共通の生物に由来するか、もしくはこれらから得られるタンパク質、ポリペプチド、またはペプチドをいう。
本明細書中で使用される、「リガンド」は、タンパク質性または非タンパク質性化合物をいう。リガンドは、受容体、酵素、補酵素、または非タンパク質性化合物であり得るが、これらに限定されない。
本明細書中で使用される、「ループ」は、分子表面上でポリペプチド鎖の方向を逆にするポリペプチド鎖をいう。
本明細書中で使用される、「変異」は、タンパク質中の1つまたは複数のアミノ酸の変化をいう。
本明細書中で使用される、「非相同タンパク質、ポリペプチド、またはペプチド」は、類似しない別の生物または祖先が共通でない生物に由来するか、もしくはこれらから得られたタンパク質、ポリペプチド、またはペプチドをいう。
本明細書中で使用される、「助変数方程式」は、所与の変異型の存在する高次構造状態に関連する変数を含む式をいう。この式は、各変異型について得た実験データおよびアンサンブル由来の特性のライブラリを使用する。
本明細書中で使用される、「ペプチド」は、その物理的特性がそのアミノ酸残基の和から予想される特性であり、且つ固定された三次元構造が存在しないものと定義された配列を有するアミノ酸鎖をいう。
本明細書中で使用される、「薬学的特性」は、結合親和性、凝集、溶解度、および免疫原性効果をいうが、これらに限定されない。
本明細書中で使用される、「タンパク質」は、通常、定義された配列、長さ、および三次元構造のアミノ酸残基の鎖をいう。タンパク質が産生される重合反応により、各アミノ酸から1つの水分子が喪失する。タンパク質は、しばしば、アミノ酸残基から構成されると言われる。天然のタンパク質分子は、20種もの異なるアミノ酸残基型を含むことができ、それぞれ特有の側鎖を含む。タンパク質は、複数のペプチドから構成され得る。
本明細書中で使用される、「タンパク質機能」は、タンパク質の寄与および/または作用をいう。例えば、タンパク質機能には、タンパク質結合(例えば、代謝の調節、シグナル伝達、遺伝子調節などのためのタンパク質と別のタンパク質、核酸、または小分子との結合)が含まれる。タンパク質機能には、タンパク質の公知の生物学的役割(例えば、酵素(すなわち、ペプシン)、輸送(すなわち、ヘモグロビン)、構造(コラーゲン)、保存(すなわち、カゼイン)、ホルモン(すなわち、インスリン)、受容体、収縮(すなわち、アクチン)、および防御(すなわち、抗体))も含まれ得る。
本明細書中で使用される、「回転異性体」は、低エネルギーのアミノ酸側鎖情報をいう。
本明細書中で使用される、「一塩基多型またはSNPもしくはSNPs」は、個体間の共通のDNA配列の変化をいう。DNA配列の変化は、典型的には、個体間で遺伝子が変化する1塩基の変化または点変異である。
本明細書中で使用される、「溶解度」は、所与の溶媒体積に溶解することができるタンパク質量をいう。
本明細書中で使用される、「構造の特徴」は、コンピュータ支援プログラムを使用して決定される特徴をいい、折りたたみの特徴、ジスルフィド結合、結合親和性、凝集、溶解度、免疫原性、安定性などが含まれるが、これらに限定されない。したがって、当業者は、本発明を使用してタンパク質の任意の構造の特徴を決定し、この特徴を適用に依存して増減することができることを認識する。
本明細書中で使用される、「テンプレート分子」は、修飾タンパク質が結合するタンパク質をいう。
本明細書中で使用される、「変異型(Variant)」は、所与の変異のセットを有するタンパク質(すなわち、SNPs)をいう。
II.COREXモデリングストラテジー
局所側鎖を含み且つ骨格が動く剛体としてのタンパク質のモデリングと対照的に、COREXアルゴリズムは、105を超える高次構造状態のアンサンブルとしての天然の状態のタンパク質をモデリングする。アンサンブルベースのアプローチの威力は、以下の組み合わせ様式において状態をモデリングすることである:所与の状態について、高分解能構造にしたがって折りたたまれた領域をモデリングし、高次構造エントロピーを有する非折りたたみ領域をモデリングする(非常に多数の特異的微視的高次構造としてのモデリングと対照的)。エントロピーの変化(ΔS)が、高次構造状態の数の相違に関連するので(すなわち、ΔS=RlnΩであり、式中、Ωは、関連のもしくは完全に折りたたまれた状態の自由度と関連して、特定の巨視的状態における自由度の比(または微視的状態の数)である)、1つの巨視的状態によって非常に多数の微視的状態を示すことができる。この二重モデリング手順の意味は、10残基の非折りたたみ(残基あたり最低4つの高次構造を有する)を有する巨視的状態は、100万個を超える明らかな微視的高次構造状態のモデリングを必要とすることである。計算の最終結果は、アンサンブル中の100,000個の巨視的状態を使用して、アプローチにより1060種を超える異なる微視的状態のエネルギー特性が有効に捕捉されることである。本明細書中で使用されたCOREXプログラムは、例えば、米国特許公開US20030032065A1および米国特許出願10/096,178号(その全体が本明細書中で参考として援用される)に記載されている。
A.COREXアルゴリズムによる部分的折りたたみ状態の作成
分配関数(Q=

Figure 2006507562
)は、全てのタンパク質状態の和である。これは、小タンパク質についてでさえも天文学的数字である。例えば、100残基のタンパク質の各アミノ酸が10個の可能な高次構造を有する場合、全状態数は10100個であり、コンピュータでも処理が困難な数である。幸運なことに、タンパク質折りたたみは、非常に協力的なプロセスであり、ほとんどの状態の確率はほとんどゼロであり、分配関数に寄与しない。この事実により、列挙に関する問題は有意に単純にすることが可能である。分配関数に寄与する状態のみを含むサブセットを作製可能な選択規則のセットを開発することが望ましい。
特定のタンパク質の中間状態のアンサンブルを作製するためのアプローチは、テンプレートとして天然状態の高分解能の構造を使用し、系統的方法で全ての可能な組み合わせの分子の所定の領域を折りたたまないためにコンピュータを使用することである。結果の解決は、部分的に折りたたまれた状態の作製のために使用された領域(折りたたみ単位と呼ばれる)のサイズおよび数に依存する。このアルゴリズムにおいて以下の2つの仮定が存在する:(1)部分的に折りたたまれた状態中の折りたたみ領域が天然に類似すること、および(2)非折りたたみ領域が構造を欠くと予想されること。
COREXアルゴリズムは、タンパク質の異なる単位への分配に使用されるNwアミノ酸残基毎のウィンドウブロックを使用する。各タンパク質分配は、Nu折りたたみ単位(NuはNres/Nwの上限に等しい)からなる。Nresは、全残基数であり、Nwはウィンドウあたりのアミノ酸残基数である。タンパク質の第1の分配を、第1の残基から出発するタンパク質の全配列上のウィンドウブロックの移動によって定義する。Nres/Nwが整数でない場合、最後の単位中の残基数は、残りと等しいセットである。この分配により、全ての可能な組み合わせ中の単位の折りたたみおよび非折りたたみによって作成された部分的に折りたたまれた中間体(2Nu,i−2)が得られる。一旦第1の分配が行われると、ウィンドウブロックを配列中の1アミノ酸残基毎にスライドさせることによって第2の分配を定義する。全配列が終了するまでこのプロセスを継続する。この手順の使用によって作成された異なる状態の全数は、2+Σ(2Nu,i−2)(式中、和は全分配であり、Nu,iは分配iにおける折り畳み単位数である)に等しい。
B.ギブスエネルギーの計算
各高次構造状態の自由エネルギーを、アンサンブル中の各高次構造状態の自由エネルギーの実験パラメータ化を使用して計算する(D'Aquino et al.,1996; Gomez & Freire,1995;Gomez et al.,1995;Xie & Freire,1994a,b)。この手順は、所望の温度での各状態の相対熱容量(ΔCp)、エンタルピー(ΔH)、およびエントロピー(ΔS)計算を含む。
高次構造エントロピーを、各アミノ酸についての以下の3つの寄与を明確に考慮することによって評価する:(1)ΔSbuex、タンパク質の内部に埋め込まれた側鎖のその表面への移動に関連するエントロピーの変化、(2)ΔSexu、ペプチド骨格が折りたたまれない場合の表面に露呈した側鎖によって増加したエントロピーの変化、および(3)ΔSbb、非折りたたみ時の骨格自体によって増加したエントロピーの変化。各アミノ酸残基についてのこれらの項の大きさを、二平面角およびねじれ角の関数としての異なる配座異性体の確率の計算分析によって評価する(D'Aquino et al.,1996; Lee etal.,1994)。ジスルフィド架橋の存在によるさらなるエントロピーの寄与を、Pace et al.(1988)に記載のように評価した。概して、これらの寄与は、タンパク質の完全な非折りたたみについてのエントロピー変化の約95%を占める。残りの説明されない寄与(主に、プロトン化効果)を、特定の実験条件下且つ全ての残基間で平等に分布する完全な非折りたたみについての推定ギブスエネルギーと実験ギブスエネルギーとの間の相違から評価する。
C.水素交換保護因子
いわゆるEX2レジメに従う実験条件下で、以下の反応の平衡定数を、水素交換実験(例えば、Bai et al.,1995を参照のこと)によって測定する。:
Figure 2006507562
この反応に従って、Kop,jは、残基jが開いているのでプロトンと溶媒とを交換することができる全高次構造の濃度の和と残基jが閉じている全高次構造の濃度の和との間の比に等しい。標準的な解釈は、局所、部分的、または全体的な非折りたたみの結果として溶媒に曝露された後のみでプロトンが溶媒とゆっくり交換されることである。部分的に折りたたまれた状態における折りたたまれていない残基は、溶媒に曝露されるようになる唯一の残基ではない。いわゆる相補領域中に存在する残基も溶媒に曝露されるようになる(すなわち、折りたたまれたままであるが折りたたまれなくなるタンパク質領域に構造的に相補的なタンパク質部分に存在する残基)(Freire et al.,1993)。一般的に報告された水素交換保護因子PFjは、Kop,j定数の逆数に等しい。
残基安定度定数は全残基について定義された純粋な熱力学量であり、保護因子はまた非熱力学的寄与を含み、残基のサブセットについてのみ定義される。プロリン残基は交換可能なアミドプロトンを欠き、含まれない。天然の状態で溶媒に露呈したアミド基を有する残基を排除する(Pedersen et al.,1991)。統計学的見地から、任意の所与の残基jについての保護因子を、残基jが閉じている状態の確率の和と残基jが開いている状態の確率の和との比として定義することができる。
Figure 2006507562
保護因子の統計学的定義は、安定度定数のそれと同一の形態を有し、以下のように折りたたみの確率に関して示すことができる:
Figure 2006507562
修正項Pf,xc,jは、残基jが折りたたまれているが交換可能な全ての状態の確率の和である。水素交換保護因子PFjは、Pf,xc,j項が小さい場合のみに残基あたりの安定度定数Kf,jに等しいことが明らかである。残基が折りたたまれているが、溶媒に露呈している最も一般的な状況は、以下の場合に起こる:(1)残基のアミド基が天然の状態で露呈している場合、および(2)非折りたたみ領域に対して、構造的に相補的であるタンパク質の領域の、その位置によって残基のアミド基が露呈するようになる場合。
PFjおよびKf,jが2つの異なる状態の間の化学反応よりもむしろ高次構造のアンサンブルに関する統計的に定義された量であることが上記処置から明らかである。
III.タンパク質中の協力的相互作用の構造分布
協力的相互作用は、タンパク質分子内の異なるアミノ酸残基の挙動に関連する。結果として、任意の所与の残基への化学的または物理的摂動の効果は、相互作用の複雑なネットワークによって他の残基に広がる。頻繁に、アミノ酸は、タンパク質分子中の非常に離れた位置で生じる摂動効果を「察知する」。協力的相互作用は本質的に二方向ではなく、タンパク質中に存在する相互作用の複雑なネットワーク内で異なる残基が異なる役割を果たす。残基kに対する残基jへの摂動効果は、残基jに対する残基kへの同一の摂動の効果と必ずしも等しくない。したがって、本発明は、タンパク質内の協力的相互作用ネットワークのマッピングのためにCOREXを使用する(Pan et al.,2000)。
A.残基特異的結合性
残基特異性結合性(RSC)を使用して、2残基間の結合を説明する。相関関数を以下のように定義する:
Figure 2006507562
SjおよびSkが残基jおよびkの折りたたみ状態を示す場合(残基が特定の状態で折りたたまれている場合はS=1であり、残基が折りたたまれていない場合はS=−1)、そして、<Sj>および<Sk>はアンサンブルにわたる残基jおよびkの平均折りたたみ状態を示す。RSCの正の値は、残基jまたはkの安定化により残基kまたはjが安定化することを示し(すなわち、正の協力性を示す)、負の値は残基jまたはkの安定化により残基kまたはjが不安定化することを示す(すなわち、負の協力性を示す)。ゼロは相関性なしを意味し、残基がエネルギー的に結合しない。
RSCにより各残基の他の各残基での摂動に対する相互感受性が得られるので、RSCを使用してタンパク質中の熱力学的ドメイン構造を探索することができる(Hilser et al.,1998; Pan et al.,2000)。なおさらに、熱力学的ドメインの配置の提供に加えて、RSCを使用して、どのようにしてその起点から変異効果が広められるのかを調査することもできる。したがって、RSCは、SNPのその起点からの広がり方およびそのタンパク質の活性部位との関連を決定することができることが想定される。
B.機能的結合性
RSCによって説明される二つ一組の相関に加えて、全体としての結合部位と残りのタンパク質との間の連結相関を同定する必要がある。従って、本発明のさらなる態様は、所与のリガンドxについての全結合部位とタンパク質中の各残基との間の結合性としての機能的結合性(FC)を定義する:
Figure 2006507562
2つの方法のうちの1つにおいてjおよびkを定義する。リガンドxの結合ポケットに関与しない全ての残基(jおよびk)について、RSC式においてSj =SjおよびSk =Skである。しかし、リガンドxの結合部位中の残基について、Sj および/またはSk は、リガンドxの結合部位中の全nx残基にわたる平均折りたたみ状態である:
Figure 2006507562
RSCsとFCsとの間の相違は注目に値する。他の残基の折りたたみ状態から独立した2つの特定の残基が折りたたまれている状態の確率の相関によってRSCsを決定する。他方では、FCsは残基が折りたたまれる確率と残基群が折りたたまれる確率とを相関させる。したがって、FCsによりしばしばRSCs分析で認められない結合性情報が有効に詳述される。
IV.MPMOD
MPMODは、ラマチャンドラン図の許容領域中の高次構造空間の無作為な調査の組み合わせを利用する。これらの高次構造空間の無作為調査の使用により、小環状ペプチドの挙動を研究するための簡単且つ有用なツールが得られる。立体化学的に許容可能な配座異性体を作製するための簡単な剛体球モデルおよび可動性ジスルフィド結合モデリングの使用によってこれを行う。Nc/No(Ncはジスルフィド結合を潜在的に形成することができる配座異性体数であり、Noはジスルフィド結合を形成することができないが、ファンデルワールスチェックをパスした配座異性体数である)によって定義されたSS結合ループの閉鎖の「比率」は、アンサンブルが1000個を超える配座異性体を有する場合に飽和する。ペプチドのCXCおよびCXXC系について、ループ閉鎖確率のモデリングは、4つ全ての小ペプチド型についての実験的に決定された平衡定数Kcと同一の方法で挙動する。共通のスケール因子を適用後、両者を十分に比較する。ファンデルワールス相互作用は、小ペプチドCXCおよびCXXCについてループ閉鎖で支配的役割を果たす。
MPMODは、ジスルフィド結合した配座異性体を作成するための有効な方法である。Pentium(商標)III450のLinuxシステムを使用して4000個のジスルフィド結合した配座異性体CXXCを得るために約10〜20CPU分かかる。配座異性体CXCは不一致の可能性が高いので、CXXCの作成時間よりも約3倍のCPU時間を費やす。しかし、消費CPU時間は、配座異性体の作成に使用した基準に強く依存していた。本発明で使用したMPMODプログラムは、例えば、米国特許出願公開US20030032065A1号および米国特許出願10/096,178号(その全体が本明細書中で参考として援用される)に記載されている。
図1に示す流れ図は、MPMODの一般的なプログラムを示す。ペプチド配列およびジスルフィド結合の結合性などの入力パラメータ(工程101)をロードし、4つのマップ中に高次構造角(φ、ψ、ω)を作成する(工程102)。角度に基づいて主鎖および側鎖の原子を作成する。骨格原子および側鎖原子について個別にファンデルワールスチェックを行う(工程103)。ファンデルワールスに違反する場合、配座異性体は拒絶される。いかなる原子の不一致も無くペプチドが終了するまで別の高次構造角組を得るために回帰する。その後、ペプチドの座標を記録し、溶媒接触可能表面積(SAS)ベースのエネルギーを計算する(工程104)。2つの残基対でジスルフィド結合が可能であるかどうかを調査するためにジスルフィド結合をモデリングする(工程105)。ジスルフィド結合が可能な場合、この配座異性体についてのSASエネルギーを計算する。ジスルフィド結合が可能でない場合、別の高次構造角組を試行し、ジスルフィド結合を有する配座異性体が得られるまで手順を繰り返す。最後に、この配座異性体についてのSASエネルギーを再度計算する(工程106)。
V.関連SNPsを決定するためのBEST/MPMOD
本明細書中で使用される、「BEST」は、組み合わせ様式で状態をモデリングするテクノロジーをいう。所与の状態について、高分解能構造に従って折りたたみ領域をモデリングし、高次構造エントロピーを有する非折りたたみ領域をモデリングする(非常に多数の微視的高次構造のモデリングと対照的)。より詳細には、COREXおよびBESTを使用して、熱力学的空間を決定する。例えば、エントロピーの変化(ΔS)が完全に折りたたまれた状態の基準における自由度と比較した特定の巨視的状態における高次構造状態数の相違に関連するので、1つの巨視的状態によって非常に多数の微視的状態を示すことができる。この二重モデリング手順の意味は、折りたたまれていない10残基を有する巨視的状態(残基あたり最低4つの高次構造を有する)が100万を超える明白な微視的高次構造状態をモデリングする必要があるということである。計算の最終結果は、アンサンブル中の100,000種の巨視的状態を使用して、本発明は1060種を超える異なる微視的状態のエネルギーを有効に捕捉することである。本発明のジスルフィドの小タンパク質モデリング(MPMOD)部分は、BESTによって不安定であることが示されたタンパク質の小領域についての高次構造を明白にモデリングするので、MPMODを使用して分子レベルで構造空間または詳細を決定する。BESTを使用して一旦不安定領域が同定されると、不安定領域の2つの隣接残基を、高分解能構造中で見出された高次構造中の残基の固定により固定する。MPMODに記載のようにループをプロジェクトする(projecting)ことによって、高次構造を作成する。BEST/MPMODと呼ばれるBESTプログラムとMPMODプログラムとの組み合わせにより、任意のサイズのタンパク質の高次構造が明確にモデリングされる。従って、図2に示すように、工程200は、タンパク質−リガンド複合体の三次元構造の入力を含む。構造を直接入力することができるか、周知で当業者によって使用される任意のデータベースから得ることができる。次に、工程201は、折りたたみ単位のウィンドウサイズおよび折りたたみ単位あたりの最小残基の定義付けを含む。工程202は、領域安定性を決定するためのCOREX分析の実施を含む。工程203は、工程203(タンパク質のアンサンブルを作成するためのBEST/MPMODモジュール)にリンクしたMPMODである工程205にリンクしている。次に、工程204は、各アンサンブル対の結合親和性の決定および巨視的結合定数の計算を含み、結合試験モジュールである工程206にリンクしている。結合試験モジュールは、MPMOD(すなわち、工程205)にリンクしている。本発明で使用したBEST/MPMODプログラムは、例えば、米国特許出願公開US20030032065A1号および米国特許出願10/096,178号(その全体が本明細書中で参考として援用される)に記載されている。
本発明のコンピュータ支援プログラムを、憶測を排除するか、もしくはプログラム実行に必要な時間を減少させる種々のデータベースと組み合わせることができる。使用することができる1つのこのようなデータベースは、アミノ酸の熱力学的特性を定義するデータベースである(すなわち、米国特許出願公開US20020193566A1号(その全体が本明細書中で参考として援用される)を参照のこと)。
なおさらに、本発明の特定の実施形態は、データベースが非相同タンパク質を含むことを提供する。任意のタンパク質データベース(例えば、Protein Data Bankに制限されない)から非相同タンパク質を得ることができる。当業者は、SNP関連データを含む任意のデータベースを本発明で使用することができることを認識する。実際、タンパク質機能に関連するSNPを含むデータベースを開発するためにこれらのデータベースを本発明におけるコンピュータモデリングプログラムで使用する。
特定の実施形態では、本発明の計算方法は、残基特異的結合性および機能的結合性の決定による異なる構造エレメント間のエネルギー的結合性を決定する。この情報を使用して、タンパク質機能に関連するSNPsを含むデータベースを開発する。
次いで、本発明のデータベースを使用して、薬学的組成物の副作用の危険性を示す集団中のサブセットを予想することができる。なおさらに、データベースを使用して、タンパク質の活性部位に薬学的組成物をターゲティングすることができる。詳細には、データベースを使用して、SNPのタンパク質の活性部位との相互作用を決定し、薬学的組成物がタンパク質の活性部位に結合するようにSNPの相互作用を克服するように薬学的組成物をデザインする。
なおさらに、本発明は、タンパク質の高分解能構造を入力する工程と、高次構造状態のアンサンブルを作成する工程と、各高次構造状態の確率を決定する工程と、各高次構造状態の残基特異的結合性および機能的結合性を計算する工程とを含む、タンパク質データベースの開発方法を含む。
全ての可能な組み合わせ中の所定の折りたたみ単位のセットの組み合わせ非折り畳みによる漸増的に異なる高次構造状態のアンサンブルの作成は、タンパク質の全配列上にウィンドウブロックを置いて、一度に1残基ずつウィンドウブロックをスライドさせることによってタンパク質を折りたたみ単位に分ける工程を含む。
各高次構造状態の確率の決定は、アンサンブル中の各高次構造状態の自由エネルギー(Gi)を決定する工程と、各状態のボルツマン重率[Ki=exp(−Gi/RT)]を決定する工程と、式:
Figure 2006507562
を使用して各状態の確率を決定する工程とを含む。
一旦熱力学的空間が決定されると、MPMODを使用して構造空間を決定することができることが意図される。MPMODの全元素計算アプローチは、ラマチャンドラン図の許容領域中の高次構造空間を検索する工程と、剛体球接近によってとても起こり得そうもない配座異性体を排除する工程と、可動性ジスルフィド結合モデルを検索する工程と、溶媒接触可能表面積(SAS)ベースのエネルギーを計算する工程を含む。本方法は、アンサンブルがジスルフィド結合を形成する確率を計算する工程をさらに含み得る。
さらなる実施形態では、BEST/MPMOD法を使用して、最適な薬学的特性(すなわち、結合親和性の増大)を示すタンパク質医薬品をデザインする。この方法は、タンパク質医薬品の変異型の試験データセットを得る工程と、前記変異型が一塩基多型を含むことと、コンピュータベースの方法を使用して試験データセットについてのアンサンブル由来の特性のライブラリを準備する工程と、前記試験データセット内の各タンパク質変異型についての所与の特性の実験データを得る工程と、前記実験データおよび前記アンサンブル由来の特性のライブラリを使用して助変数方程式を導く工程と、至適化された薬学的特性を得るために上記工程によって得られた情報を使用してタンパク質医薬品を作製する工程とを含む。特定の実施形態では、至適化された薬学的特性は結合親和性である。
結合親和性は、タンパク質とリガンドとの間の相互作用の全自由エネルギーの大きさである。親和性の大きさにより、所与の条件下で特定の相互作用が関連するかどうかが決定される。リガンドに対するタンパク質の任意の特定の親和性が有意であるかどうかは、タンパク質が遭遇するリガンドの存在濃度に依存する。結合親和性を決定するためのアッセイには、表面プラズモン共鳴、ウェスタンブロット、ELISA、DNアーゼフットプリント法、および電気泳動度移動アッセイ(gel mobility shift assays)が含まれるが、これらに限定されない。リガンドは、タンパク質もしくは非タンパク質であるかもしれない。リガンドは、受容体、補酵素、または非タンパク質性化合物であり得るが、これらに限定されない。タンパク質とリガンドとの間の結合親和性を、タンパク質とリガンドとの間の結合の結合定数または解離定数によって測定することができる。タンパク質とリガンドとの間の結合エントロピーを、リガンドとの結合状態におけるタンパク質構造に類似の構造の安定化によって減少させることができる。高次構造の結合が立体的に許容されるかを決定するためにタンパク質およびリガンドを使用してファンデルワールス計算を行うことができる。
特定の例では、至適化された薬学的特性を示すためのタンパク質医薬品のBEST/MPMODデザイン方法を図3Aおよび3Bに示す。工程300は、コンピュータ支援モデリングプログラムへのタンパク質医薬品の高分解能構造の入力である。工程301は、折りたたみ単位のためのウィンドウサイズの定義づけを含む。工程302でCOREX分析を行い、工程304でMPMODを行う。これらのプログラムの組み合わせにより、工程305で試験データセットが作成される。試験データは、SNPを含む変異型を含む。以下の工程によってデータを得る:所定の折りたたみ単位のセットの組み合わせ非折り畳みによって漸増的に異なる高次構造のアンサンブルを得る工程と、タンパク質医薬品の各構造状態の確率を決定する工程と、タンパク質内の残基の保護因子を計算する工程と、タンパク質の異なる構造エレメント間のエネルギー結合性を決定する工程と、不安定なタンパク質領域を同定する工程と、平均値から幾何学的パラメータが逸脱するφ/ψ(phi/psi)およびねじれ角の無作為な選択によって容易になる全原子のコンピュータアプローチを使用して不安定な領域の配座異性体のアンサンブルを得る工程と、至適化された薬学的特性を示すタンパク質の高次構造の一部を決定する工程。工程307では、工程は、変異型を得るためにタンパク質医薬品のアミノ酸配列を変異する工程と、各変異型のアンサンブル由来の特性のライブラリを調製するために、高次構造の一部の決定による薬学的特性の決定由来の工程を所与のサイクル数で繰り返す工程を含む。工程308は、各変異型およびアンサンブル由来の特性のライブラリの薬学的特性を使用した助変数方程式の誘導である。次に、最初に誘導された変異型を工程309で同定する。工程310では、制約セットを初期化する。工程309に基づいて、工程311で非常に多数の変異型を得る。次に、工程32では、データベースに基づいてリードSNP組(a lead SNP set)を選択するために変異型を試験する。工程314は、助変数方程式中のリードの試験である。次に、工程315は、リードが以前に試験したリードを超える至適化された薬学的送達特性を有するかを決定することである。工程319では、変異型を、各特性の目的(目的A(220)または目的B(222))と比較する。工程321は、至適化された薬学的送達特性を提供するための上記工程によって見出された構造の特徴を有するタンパク質医薬品の変異型を作製することである。任意選択的に、リードが至適化されたかどうかの決定によって非常に多数の変異型を得る工程を、その意図する薬学的用途のためのタンパク質の薬学的特性を十分に至適化するために繰り返すことができる。薬学的特性には、結合親和性の増加が含まれ得るが、これに限定されない。当業者は、タンパク質のBEST/MPMODデザイン方法はタンパク質医薬品に限定されないことを理解している。
任意の論理型を使用して、データセットを作製するための変異を決定する。論理型には、モンテカルロ加重選択法(Monte Carlo weighted selection procedure)およびニューロンネットワーク法が含まれるが、これらに限定されない。
本発明では、任意の市販のデータ分析型を使用して、計算データと実験データとの間の関係を得ることができる。本発明を行うためには重複決定されたデータセットが必要である。目的の任意の薬学的特性について変異の任意のセット数(タンパク質依存性)を試験してデータセットを獲得し、データセットに対して実行されるかについて「ジャックナイフ」分析を行う。「ジャックナイフ分析」では、データセットの一部を除去し、データを再分析する。分析が統計的に異ならない場合、データセットは重複決定されている。データセットが重複決定されているかの任意の他の統計学的試験方法を本発明で使用することができる。データ分析に使用することができる統計学的方法の例は、主成分分析および特異値分解である。1つの薬学的特性についてのデータセットを重複決定することができる一方で、別の薬学的特性についてのデータセットを不十分に決定する可能性がある。データセットが不十分に決定される場合、データセットにより多数の変異型を付加する必要がある。
VI.変異誘発
使用する場合、変異誘発を種々の標準的な変異誘発手順によって行う。変異は、生物の量または構造中に生じる変化によるプロセスである。変化は、DNA配列内の1ヌクレオチド塩基の除去、付加、または置換を含む点変異の結果であるか、多数のヌクレオチドの挿入または欠失を含む変化の結果であり得る。
構造誘導部位特異的変異誘発は、タンパク質相互作用の詳細な分析および操作のための強力なツールの代表である(Wells、1996)。この技術は、1つまたは複数ヌクレオチド配列変化の選択されたDNAへの移入によって配列変異型を調製および試験する。
部位特異的変異誘発は、所望の変異DNA配列をコードする特定のオリゴヌクレオチド配列および十分な数の隣接する非修飾ヌクレオチドを使用する。この方法では、横断する欠失接合点(the deletion junction)の両側上に安定な二重鎖を形成させるための十分なサイズおよび複雑さのプライマー配列が得られる。配列の接合点(the junction)の両側上の約5〜10残基が変化した、約17〜25ヌクレオチド長のプライマーが好ましい。
この技術は、典型的には、一本鎖および二本鎖形態の両方で存在するバクテリオファージベクターを使用する。部位特異的変異誘発に有用なベクターには、M13ファージなどのベクターが含まれる。これらのファージベクターは市販されており、その使用は一般に当業者に周知である。二本鎖プラスミドはまた、部位特異的変異誘発で日常的に使用されており、ファージからプラスミドへの目的の遺伝子の導入工程が排除される。
一般に、最初に一本鎖ベクターを獲得するか、その配列内に所望のタンパク質または遺伝要素をコードするDNA配列を含む二本鎖ベクターの2つの鎖を融解する。次いで、合成した所望の変異配列を保有するオリゴヌクレオチドプライマーを、ハイブリッド形成条件の選択の際のミスマッチ度を考慮して一本鎖DNA調製物にアニーリングする。ハイブリッド形成産物を、E.coliポリメラーゼI(Klenowフラグメント)などのDNAポリメラーゼ酵素に供して、変異を有する鎖の合成を完了する。したがって、ヘテロ二本鎖が形成され、第1の鎖は元の非変異配列をコードし、第2の鎖は所望の変異を保有する。次いで、このヘテロ二本鎖ベクターを使用して、E.coli細胞などの適切な宿主細胞を形質転換し、変異した配列配置を保有する組換えベクターを含むクローンを選択する。
部位特異的変異誘発の他の方法は、米国特許第5,220,007号、同第5,284,760号、同第5,354,670号、同第5,366,878号、同第5,389,514号、同第5,635,377号、および同第5,789,166号に開示されている。
VII.実施例
以下の実施例は、本発明の好ましい実施形態を示すことを含む。本発明の実施で十分に機能することが本発明者らによって発見された代表的技術に従う実施例で技術が開示されているので、その実施のための好ましい様式を構成するとみなすことができることが当業者に認識されるべきである。しかし、当業者は、本発明の開示に照らして、開示された特定の実施形態で、多数の変更形態を得ることができ、本発明の概念、精神および範囲から逸脱することなく依然として類似の結果が得られることを認識すべきである。
関連SNPを同定するためのCOREX、BEST、およびMPMODの使用
関連SNPを同定するためのCOREX、BEST、およびMPMODの使用を説明するために、ヒト多発性腫瘍抑制タンパク質であるサイクリン依存性キナーゼ4インヒビターA(タンパク質名:CDK4I、遺伝子名:CDKN2A、SWISSPLOTエントリー:CDN2_HUMAN)の計算を実施した(preformed)。
CDK4Iは、細胞増殖の負の調節因子として作用する。これは、細胞分裂に重要であるサイクリン依存性キナーゼ4および6と相互作用し、サイクリンDとの相互作用を阻害する。CDKN2Aは、分子量16.5kDaの156残基のタンパク質をコードする。CDK4Iはα+β構造であり、アンキリン反復タンパク質(Ankyrin repeat proteins)ファミリーに属する(PDBコード:1BI7、1A5E、1DC2)。このタンパク質に関連するいくつかの点変異により、黒色腫、リ−フラウメニ症候群、神経癌、膵臓癌、肺癌、および食道癌のような異常な表現型が得られる。
簡単に述べれば、サイクリン依存性キナーゼ6(CDK6)と複合体形成したCDK4I(PDBコード1B17)のX線結晶学実験構造を、Protein Data Bankからダウンロードした。CDKN2A遺伝子中の29個のミスセンスおよび3個のナンセンスヌクレオチド置換変異のリストを、Human Gene Mutation Databaseから得た。CDK4IのNMR構造を使用して、8残基の折りたたみウィンドウサイズの定義付けによって状態のアンサンブルを作成した。LnKfとして示す領域または残基特異的安定性の分析のためにCOREXを使用した。
図4Aは、25℃の温度で1.049のエントロピー重み係数を使用するCOREXを使用したCDK4Iの各残基について計算した熱力学安定性プロットである。6.0を超える安定性因子LnKfによって得られた残基によって高安定性領域を定義した。高安定性領域中で、全部で86個の残基が見出され、31個の認められたSNPの77%およびCDK6と接触することが見出された39個の残基の85%を含んでいた。接触した39個の残基中でSNPは10個しか見出されず(32%)、高安定性領域でSNPを生じる疾患の77%が認められた。したがって、COREXを使用したアンサンブルベースの計算の第1工程で、本発明者らは、タンパク質−タンパク質接触のみに基づく簡単な予測と比較してSNPを生じる疾患の2.5倍の予測を得ることができる。異常な表現型が得られる変異が、高安定性領域に集中して見出された(図4Aの縦の矢印によって示す)。
参照文献
明細書中に記載の全ての特許および刊行物は、本発明に属する当業者のレベルを示す。全ての特許および刊行物は、各刊行物が明確且つ個別に参考として援用されるように示されることと同一の範囲で本明細書中に参考として援用される。
米国特許第4,554,101号
米国特許第5,220,007号
米国特許第5,284,760号
米国特許第5,354,670号
米国特許第5,366,878号
米国特許第5,389,514号
米国特許第5,440,013号
米国特許第5,446,128号
米国特許第5,475,085号
米国特許第5,618,914号
米国特許第5,635,377号
米国特許第5,670,155号
米国特許第5,672,681号
米国特許第5,674,976号
米国特許第5,789,166号
米国特許第5,929,237号
Akke,M.,et al.,(1993)Biochemistry 32,9832−9844.
Alberts etal.(1994)Molecular Biology of the Cell,p 57.
Bai,Y.et al.,(1995).Science,269,192−197.
Baldwin,R.L.(1986).Proc.Natl.Acad.Sci.USA,83,8069−8072.
Bolin,J.T.,et al.,(1982)J.Biol.Chem.257,13650−13662.
Bruccoleri,R.E.and Karplus,M.(1987),Biopolymers,Vol.26,137−168.
Bystroff,C.&Kraut,J.(1991)Biochemistry 30,2227−2239.
Bystroff,C.,Oatley,S.J.&Kraut,J.(1990)Biochemistry 29,3263−3277.
Cameron,C.E.&Benkovic,S.J.Biochemistry 36,15792−15800.
D'Aquino,J.A.,et al.,(1996).Proteiins:Struct.Funct.Genet.25,143−156.
Fierke,C.A.&Benkovic,S.J.(1989)Biochemistry 28,478−486.
Fierke,C.A.,et al.,(1987)Biochemistry 26,4085−4092.
Freire E.&Xie,D.(1994).Biophys.Chem.51,243−251.
Freire,E.(1995).Annu.Rev.Biophys.Biomol.Struct.24,141−165.
Freire,E.(1999)Proc.Natl.Acad.Sci.USA 96,10118−10122.
Freire,E.et al.,(1993).Proteins:Struct.Funct.Genet.17,111−123.
Gomez J.&Friere,E.(1995).J.Mol.Biol.252,337−350.
Gomez,J.,et al.,(1995).Proteins:Struct.Funct.Genet.22,404−412.
Griko,Y.,et al.,(1994).Biochemistry,33,1889−1899.
Griko,Y.V.,et al.,(1995).J.Mol.Biol.252,447−459.
Haynie,D.T.&Freire,E.(1993).Proteins:Struct,Funct.Genet.16,115−140.
Hilser,V.J.&Freire,E.(1996)J.Mol.Bio 262,756−772.
Hilser,V.J.&Freire,E.(1997)Proteins Struct.Funct.Genet.27,171−183.
Hilser,V.J.,et al.,(1998)Proc.Natl.Acad.Sci.USA 95,9903−9908.
Hilser,V.J.,et al.,(1996)Proteins 26,123−133.
Hilser,V.J.,et al.,(1997)Biophys.Chem.64,69−79.
Iijima,H.,et al.,(1987) Prot:Struct,Funct,and Genet 2,330−339 Jacobs,M.D.&Fox,R.O.(1994).Proc.Natl Acad.Sci.USA,91,449−453.
Jennings,P.A.&Wright,P.E.(1993).Science,262,892−896.
Johannesson et al.,(1999)JMed.Chem.42: 601−608.
Johnson,M.S.et al.,(1993)J.Mol.Biol.,231: 735−52.
Jones,B.E.&Matthews,C.R.(1995).Protein Sci.4,167−177.
Kyte &Doolittle (1982) J Mol Biol.157:105−32.
Lee,K.H.et al.,(1994).Proteins:Struct.Funct.Genet.20,68−84.
Matthews,C.R.(1993).Annu.Rev.Biochem.62,653−683.
Metropolis,N.,et al.,(1953)J Chem.Phys.21,1087−1092.
Momany,F.A.,et al.,(1975)J.Phys.Chem.79,2361−2381.
Murphy,K.P.&Freire,E.(1992)Adv.Protein Chem.43,313−361.
Murphy,K.P.,et al.,(1992).J.Mol.Biol.227,293−306.
Ohmae,E.,et al.,(1996)J.Biochem.119,703−710.
Ohmae,E.,et al.,(1998)J.Biochem.123,839−846.
Olejniczak,E.T.,et al.,(1997)Biochemistry 36,41184124.
Pabo,C.O.&Lewis,M.(1982)Nature(London)298,443−447.
Pace,C.N.,et aL,(1988).J.Biol.Chem.263,11820−11825.
Pedersen,T.G.,et al.,(1991).J.Mol.Biol 218,413−426.
Peng,Z.&Kim,P.S.(1994).Biochemistry,33,2136−2141.
Ponder,J.W.&Richards,F.M.(1987),J.Mol.Biol.Vol 193,775−791 Ramachandran,et al.,(1963).J.Mol.Biol.7,95.
Remington's Pharmaceutical Sciences,18th Ed.Mack Printing Company,1990.
Schulman,B.A.,et al.,(1995).J.Mol.Biol.253,651−657.
Sosnick,T.R.,et al.,(1994).Nature Struct.Biol.1,149−156.
Stivers,J.T.,et al.,Biochemistry 35,16036−16047.
Vita et al.,1998,Biopolymers 47:93−100.
Warren,M.S.,et al.,(1991)Biochemistry 30,11092−11103.
Weisshoff et al.,1999,Eur.J.Biochem.259:776−788.
Wells,J.A.(1996)ProcNatlAcad Sci USA.93(1):1−6.
Xie,D.&Freire,E.(1994a).Proteins:Struct.Funct.Genet.19:291−301.
Xie,D.&Freire,E.(1994b).J Mol.Biol.242:62−80.
Xie,D.,Fox,R.&Freire,E.(1994).Protein Sci.3,2175−2184 Yu,L.,et al.,(1996)Biochemistry 35,9661−9666.
Zidek,L.,et al.,(1999)Nat.Struct.Biol.6,1118−1121.
本発明およびその利点が詳細に記載されているが、添付の特許請求の範囲によって定義される本発明の精神および範囲を逸脱することなく本明細書中で種々の変更、置換、および変形を行うことができると理解すべきである。さらに、本発明の範囲は、本明細書中に記載のプロセス、機械、製造物、物質の組成、手段、方法、および工程の特定の実施形態に制限されることを意図しない。本発明の開示から当業者に容易に認識されるので、本明細書中に記載の対応する実施形態と実質的に同一の機能を発揮するか、実質的に同一の結果が得られる既存または後に開発されるプロセス、機械、製造物、物質の組成、手段、方法、または工程を本発明にしたがって使用することができる。したがって、添付の特許請求の範囲は、これらの範囲内にこのようなプロセス、機械、製造物、物質の組成、手段、方法、または工程を含めることを意図する。
MPMODプログラムの流れ図である。 分析ツールとしてのBEST/MPMODプログラムの流れ図である。 タンパク質医薬品の開発で使用される予測ツールとしてのBEST/MPMODプログラムの流れ図である。 タンパク質医薬品の開発で使用される予測ツールとしてのBEST/MPMODプログラムの流れ図である。 CDK4Iの安定性プロットを示す図である。図4Aは、COREXを使用して計算したCDK4Iの安定性プロットを示す。異常な表現型をとる非同義一塩基多型置換(ミスセンス)を、黒塗りの三角で示し、無意味な変異をラインの下の黒塗りの四角で示す。病態を示すほとんどのSNPは、下向きの矢印で示す高安定性領域に集中している。ライン上の白抜きのボックスは、サイクリン依存性キナーゼ4および6と接触する残基である。 リボンプロットを示す図である。図4Bは、CDK4Iの実験構造のリボン図を示す(PDBコード:1B17)。異常な表現型を示す点変異を、ダークグレイで示す。

Claims (13)

  1. タンパク質機能に関連する同定された一塩基多型を有する非相同タンパク質を含むタンパク質データベース。
  2. 前記機能がタンパク質の結合である、請求項1に記載のデータベース。
  3. 前記データベースが、式:
    Figure 2006507562
    によるタンパク質中の残基間の残基特異的結合性を決定する工程を含む計算方法によって決定される、請求項1に記載のデータベース。
  4. 前記データベースが、式:
    Figure 2006507562
    によるタンパク質の結合部位とタンパク質中の各残基との間の機能的結合性を決定する工程を含む計算方法によって決定される、請求項1に記載のデータベース。
  5. タンパク質の活性部位を妨害する関連一塩基多型を有するサブセットを決定するために請求項1に記載のデータベースを使用する工程を含む、薬学的組成物の副作用を起こす危険性がある集団のサブセットを予測する方法。
  6. 一塩基多型とタンパク質の活性部位との相互作用を決定するために請求項1に記載のデータベースを使用する工程と、薬学的組成物が前記タンパク質の活性部位に結合するように一塩基多型の相互作用を克服するように薬学的組成物をデザインする工程とを含む、タンパク質の活性部位に薬学的組成物をターゲティングする方法。
  7. タンパク質の高分解能構造を入力する工程と、
    各タンパク質の全ての可能な組み合わせ中の所定の折りたたみ単位のセットの組み合わせ非折り畳みによって漸増的に異なる高次構造状態のアンサンブルを作成する工程と、
    前記各高次構造状態の確率を決定する工程と、
    前記各高次構造状態の残基特異的結合性を計算する工程と、
    前記各高次構造状態の機能的結合性を計算する工程とを含む、タンパク質データベースの開発方法。
  8. タンパク質データのデータ構造を有するタンパク質データベースと、前記データ構造が関連する一塩基多型のデータフィールドを含むことと、
    前記データベースのタンパク質データを同定するためのコンピュータベースのプログラムと、前記プログラムが、
    1つまたは複数のタンパク質の高解像度構造データを受信するための入力モジュールと、
    1つまたは複数のタンパク質の活性部位中の一塩基多型の関連を決定し、前記タンパク質データベースのデータフィールドに前記データを保存するための処理モジュールとを含むこととを含む、タンパク質機能に関連する同定された一塩基多型を有するタンパク質データベースの開発システム。
  9. 前記コンピュータプログラムが、スクリーンへの、またはプリントアウトするための1つまたは複数の画像レポートを作成するためのディスプレイモジュールをさらに含む、請求項8に記載のシステム。
  10. アミノ酸名またはアミノ酸略語の値を保存するフィールドと、
    関連一塩基多型の数値を示す値を保存するための1つまたは複数の分類フィールドを含む
    関連一塩基多型群を定義する情報を保存するデータ構造を有するデータベース。
  11. i.タンパク質医薬品の変異型の試験データセットを得る工程と、前記変異型が一塩基多型を含むことと、
    ii.コンピュータベースの方法を使用して試験データセットについてのアンサンブル由来の特性のライブラリを準備する工程と、
    iii.前記試験データセット内の各タンパク質変異型についての所与の特性の実験データを得る工程と、
    iv.前記実験データおよび前記アンサンブル由来の特性のライブラリを使用して助変数方程式を導く工程と、
    v.至適化された薬学的特性を得るために上記工程によって得られた情報を使用してタンパク質医薬品を作製する工程とを含む、至適化された薬学的特性を示すタンパク質医薬品をデザインする方法。
  12. 前記至適化された特性は結合親和性の増大である、請求項11に記載の方法。
  13. タンパク質の高解像度構造を入力する工程と、
    各タンパク質の全ての可能な組み合わせ中の所定の折りたたみ単位のセットの組み合わせ非折り畳みによって漸増的に異なる高次構造状態のアンサンブルを得る工程と、
    前記各高次構造状態の確率を決定する工程と、
    前記各高次構造状態の残基特異的結合性を計算する工程と、
    前記各高次構造状態の機能的結合性を計算する工程とを含む、関連一塩基多型を同定する方法。
JP2004508244A 2002-05-23 2003-05-19 アンサンブルベースの構造エネルギーを使用した一塩基多型(snps)の意義の予測 Withdrawn JP2006507562A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US38278402P 2002-05-23 2002-05-23
PCT/US2003/016081 WO2003100002A2 (en) 2002-05-23 2003-05-19 Predicting the significance of single nucleotide polymorphisms (snps) using ensemble-based structural energetics

Publications (1)

Publication Number Publication Date
JP2006507562A true JP2006507562A (ja) 2006-03-02

Family

ID=29584458

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004508244A Withdrawn JP2006507562A (ja) 2002-05-23 2003-05-19 アンサンブルベースの構造エネルギーを使用した一塩基多型(snps)の意義の予測

Country Status (6)

Country Link
US (1) US20040002108A1 (ja)
EP (1) EP1522037A2 (ja)
JP (1) JP2006507562A (ja)
AU (1) AU2003241565A1 (ja)
CA (1) CA2487006A1 (ja)
WO (1) WO2003100002A2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120021967A1 (en) * 2008-04-23 2012-01-26 Arizona Board of Regents, A Body Corporate of the State Of Arizona Acting for and Behalf of Arizona Synthetic antibodies

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4908773A (en) * 1987-04-06 1990-03-13 Genex Corporation Computer designed stabilized proteins and method for producing same
US4704692A (en) * 1986-09-02 1987-11-03 Ladner Robert C Computer based system and method for determining and displaying possible chemical structures for converting double- or multiple-chain polypeptides to single-chain polypeptides
US4853871A (en) * 1987-04-06 1989-08-01 Genex Corporation Computer-based method for designing stablized proteins
US5260207A (en) * 1987-04-06 1993-11-09 Enzon Labs Inc. Engineering of electrostatic interactions at metal ion binding sites for the stabilization of proteins
US4939666A (en) * 1987-09-02 1990-07-03 Genex Corporation Incremental macromolecule construction methods
US5265030A (en) * 1990-04-24 1993-11-23 Scripps Clinic And Research Foundation System and method for determining three-dimensional structures of proteins
US5331573A (en) * 1990-12-14 1994-07-19 Balaji Vitukudi N Method of design of compounds that mimic conformational features of selected peptides
WO1993001484A1 (en) * 1991-07-11 1993-01-21 The Regents Of The University Of California A method to identify protein sequences that fold into a known three-dimensional structure
US5386507A (en) * 1991-07-18 1995-01-31 Teig; Steven L. Computer graphics system for selectively modelling molecules and investigating the chemical and physical properties thereof
US5581476A (en) * 1993-01-28 1996-12-03 Amgen Inc. Computer-based methods and articles of manufacture for preparing G-CSF analogs
US5434796A (en) * 1993-06-30 1995-07-18 Daylight Chemical Information Systems, Inc. Method and apparatus for designing molecules with desired properties by evolving successive populations
US5699268A (en) * 1995-03-24 1997-12-16 University Of Guelph Computational method for designing chemical structures having common functional characteristics
US5680319A (en) * 1995-05-25 1997-10-21 The Johns Hopkins University School Of Medicine Hierarchical protein folding prediction
US6127524A (en) * 1996-10-18 2000-10-03 Dade Behring Inc. Binding molecules and computer-based methods of increasing the binding affinity thereof
US5878373A (en) * 1996-12-06 1999-03-02 Regents Of The University Of California System and method for determining three-dimensional structure of protein sequences
JP2002510966A (ja) * 1997-04-11 2002-04-09 カリフォルニア・インスティテュート・オブ・テクノロジー 自動蛋白質デザインのための装置および方法
DE69837555T2 (de) * 1997-06-02 2007-12-20 The Johns Hopkins University Rechnerverfahren freie energieberechnung für ligandenentwurf verwendend und die voraussage von bindenden zielen
US6265546B1 (en) * 1997-12-22 2001-07-24 Genset Prostate cancer gene
US20020048763A1 (en) * 2000-02-04 2002-04-25 Penn Sharron Gaynor Human genome-derived single exon nucleic acid probes useful for gene expression analysis

Also Published As

Publication number Publication date
US20040002108A1 (en) 2004-01-01
WO2003100002A2 (en) 2003-12-04
CA2487006A1 (en) 2003-12-04
AU2003241565A1 (en) 2003-12-12
WO2003100002A3 (en) 2004-11-18
EP1522037A2 (en) 2005-04-13

Similar Documents

Publication Publication Date Title
Jefferys et al. Protein folding requires crowd control in a simulated cell
Toth-Petroczy et al. Structured states of disordered proteins from genomic sequences
Tang et al. Tools for predicting the functional impact of nonsynonymous genetic variation
Koehl Protein structure similarities
Lee et al. Distinguish protein decoys by using a scoring function based on a new AMBER force field, short molecular dynamics simulations, and the generalized born solvent model
Gilis et al. Predicting protein stability changes upon mutation using database-derived potentials: solvent accessibility determines the importance of local versus non-local interactions along the sequence
Snow et al. How well can simulation predict protein folding kinetics and thermodynamics?
Matysiak et al. Optimal combination of theory and experiment for the characterization of the protein folding landscape of S6: how far can a minimalist model go?
Patel et al. Fast calculation of protein–protein binding free energies using umbrella sampling with a coarse-grained model
Tian et al. Fast and reliable prediction of domain–peptide binding affinity using coarse-grained structure models
Fossat et al. q-Canonical Monte Carlo sampling for modeling the linkage between charge regulation and conformational equilibria of peptides
Gfeller et al. Expanding molecular modeling and design tools to non‐natural sidechains
Robinson et al. Are AMBER force fields and implicit solvation models additive? A folding study with a balanced peptide test set
Jasnovidova et al. Structure and dynamics of the RNAPII CTDsome with Rtt103
Bendová‐Biedermannová et al. Identifying stabilizing key residues in proteins using interresidue interaction energy matrix
Littler et al. Conservation of orientation and sequence in protein domain–domain interactions
Shi et al. PTMdyna: exploring the influence of post-translation modifications on protein conformational dynamics
Zhou et al. Systematic Classification and Analysis of Themes in Protein− DNA Recognition
Wu et al. On the origins of the weak folding cooperativity of a designed ββα ultrafast protein FSD-1
Dehury et al. Molecular recognition of avirulence protein (avrxa5) by eukaryotic transcription factor xa5 of rice (Oryza sativa L.): Insights from molecular dynamics simulations
Kotulska et al. Bioinformatics methods in predicting amyloid propensity of peptides and proteins
JP2005512161A (ja) ペプチドおよびタンパク質の立体配座アンサンブルの列挙およびリガンド親和性分析のためのコンピュータベースのストラテジー
Herges et al. Exploration of the free‐energy surface of a three‐helix peptide with stochastic optimization methods
JP2006507562A (ja) アンサンブルベースの構造エネルギーを使用した一塩基多型(snps)の意義の予測
Zou et al. Local interactions that contribute minimal frustration determine foldability

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20060801