JP2004500544A

JP2004500544A - 高分子原子構造の汎ゲノム決定方法

Info

Publication number: JP2004500544A
Application number: JP2000595146A
Authority: JP
Inventors: ヘンドリクソン、ウェイン・エー; ホーニグ、バリー
Original assignee: Columbia University in the City of New York
Current assignee: Columbia University in the City of New York
Priority date: 1999-01-22
Filing date: 2000-01-21
Publication date: 2004-01-08
Also published as: US20020107643A1; AU3348400A; EP1149288A4; US20020022250A1; AU777520B2; WO2000043776A1; EP1149288A1; CA2359261A1; BR0007638A; KR20010108116A

Abstract

【課題】全生命体を代表する構造の総合的分析のためのシステム及び工程を提供する。
【解決手段】３次元高分子原子構造の汎ゲノム決定方法は、構成要素の独自の結合を用いる。すべての既知の構造情報、配列情報及び機能情報はゲノムデータベースに体系的に組織化される。
【選択図】図３

Description

【０００１】
【従来の技術】
（発明の背景）
遺伝子分析及びゲノム配列決定プロジェクトの最近の進歩は、全ての生命体の基本的普遍性に関する揺るがぬ証拠を提供している。例えば、大部分の人間の遺伝子は例えばマウス、虫や時に微生物さえにも相同性を有することが示されている。更に、個々の生物体の多くの蛋白質が互いに関連している。Ｃ．ｅｌｅｇａｎｓ中には１００，０００以上のヒト遺伝子と１９，０００以上の蛋白質をコードしている遺伝子が存在しているが、地球上の全生命体中に存在する別種蛋白質は１０，０００の位であると信じられている。実際の数は類似性の粒度のレベルに依存する。
【０００２】
現在多くの微生物、及び１種類の多細胞生物、線虫であるＣ．ｅｌｅｇａｎｓについて全遺伝子配列が知られている。更に、ヒトゲノム配列決定プロジェクトもかなり進行している。幾つかのベンチャー企業がほぼ全てのヒト遺伝子のコード領域の配列を決定した。機能的ゲノミクスに関わる学究的施設及びベンチャー企業は、遺伝子生成物の機能を解き明かすことを目的に遺伝子発現のパターンのマッピングを進行中である。
【０００３】
数年前まで科学者は全ゲノムの配列決定について論争していた。しかし非寄生性生物の全ゲノムが初めて４年間で配列決定されて以来、ゲノミクス、即ち全ゲノムの配列決定に基づく学問は、基礎生物学及び医学に於ける多くの最も重要な疑問に対するアプローチを大きく変えた。配列決定に基づくゲノミクスは、ゲノムを越え、及び種を越えて膨大な蛋白質の組合せを分類することを可能にした。ゲノムレベルのＤＮＡ配列研究にて進行中の配列決定は、生物学に対する価値ある洞察と大きな商業化の機会を提供する。しかし、新規蛋白質分子が実際に生物学的作用に影響する存在であって初めてより大きな洞察、及び商業化の機会が遺伝子生成物より得ることができるのである。原子レベルでの構造決定は遙かに遅れているが、しかし蓄積された結果により折り畳みのパターンに反復性があること、そして多くの蛋白質がモジュラー構造体を持つことが明らかにされた。蛋白質は構造及び機能のファミリーに分類される。推測は極めて広範囲であるが、特有の折り畳みの数は恐らく数千に過ぎないだろう。現在、これらの内僅か数百のものしか知られていない。未知構造体を分析するための体系的且つ迅速な方法が商業化されており、科学的な価値を持っている。
【０００４】
ゲノム配列情報は確かに有益であるが、それは１次元のものに過ぎず、従って限界を持っている。直線状の配列データに基づくゲノミクスの持つ、生物学的分子が持つ３次元の普遍性を理解する上での価値は限定的である。直線配列は、それらに対応する３次元（３Ｄ）構造に降り畳まれときにのみ生物学的に活性であり、医薬品、除草剤またはその他バイオテクノロジー製品の対象物になる。現在構造情報とゲノム情報との統合は殆どない。従って、一般にはゲノムに起因する標的同定には構造は影響しない。
【０００５】
生化学的及び細胞学的プロセスを理解することは、蛋白質及びその他生物高分子の３次元分子構造の知識によって大きく進歩する。３次元構造情報は、例えばゲノム情報が標的同定に利用され、そしてコンビナトリアル化学がその発見に影響する薬物設計にとって重要な構成要素である。薬物研究者は、結合阻害剤が利用できる場合には標的の構造を経験的に決定し、構造情報を利用して新規化合物を合成してきた。代替的には、薬物研究者は既知阻害剤の構造特性、又はそれ自体の結合部位の構造特性を利用して、結合をもたらす所定の大きさ、形状及び化学的ならびに物理的特性を持つ新規薬物の候補に関して、化学データベースを検索する。
【０００６】
現在に至るまで、標的同定及び発見につながるコンビナトリアル化学へのゲノミクスの利用が構造による影響を本式に受けることはなかった。しかし、特定の場合に、構造に関する知識が標的認識及び推測、薬物アッセイ及びスクリーニング、先行化合物の選択、及びコンビナトリアルライブラリーの設計に利用できることは既知であるため、これらを利用することをゲノミクスと統合する構造情報の総合的なデータベースが利用可能であれば構造志向型のアプローチの役割が増すと考えられている。通常技術を使用した構造決定は、それ自体有益であるが配列決定に比べよりコストがかかるという欠点を持っている。
【０００７】
配列決定ベースのゲノミクス及び通常構造決定技術の持つこれら制限は、構造ゲノミクスの新規科学によって取り除かれるだろう。構造ゲノミクスは、配列ゲノミクスがゲノムの直線情報内容に付加するパノラマ的理解同種の構造生物学の科学も提供する。構造ゲノミクスはヒトゲノムによりコードされると考えられている約１００，０００種類の発現蛋白質（’プロテオーム’と呼ばれる）を含む総合的な構造データベースを必要とすることが示唆されている。これら構造の全てを解明することは超人的な作業であるが、作業の達成により我々は例えばバクテリア、酵母、古生物や植物の蛋白質についてより多く知ることができるであろう。配列ゲノミクスにより詳細に示されているように、構造体の総合データベースには多くの利用がある。
【０００８】
構造ゲノミクスより獲得される情報は、従来の構造生物学により提供される情報と根本的に異なる特性を有しており、予想外の生物学的関連性への本質的な洞察、及び特定の生物学的問題の対象となる蛋白質モチーフまたは折り畳みに関する理解を提供し、これにより我々は伝統的な詳細な構造研究を実行する能力を更に高めることができる。
【０００９】
構造生物学者は伝統的に、分子作用体の構造的理解により最も良く解答できると思われる生物学的機能上重要な問題を表す問題に目を向けている。このことは単に構造決定だけでなく特定の機能問題についても詳細な解析を必要とする。構造ゲノミクスはこの様な活動にとって重要なツールとなるだろう。コンピューターによる構造予測の正確性は総合的分類データベースの実現により改善され、これらアプローチが実行的であること、そして実際に実験的構造決定にとって代わることが示唆されている。
【００１０】
ゲノム配列決定の進歩に加え、結晶学の様な構造決定に関する技術、バイオインフォマティクスの様な配列及び構造分析に関する技術も進歩している。この様な進歩を急激に進んでいる遺伝子配列情報と組み合わせることで、薬物発見の様な商業応用を含む生物学に関する構造的な基礎の総合的研究に適したツールがもたらされる。
【００１１】
バイオインフォマティクスとは、実験、モデル化、データベース検索及び機器研究により得た生物学情報及びデータを解析することを目的に、コンピューターシステムとコンピューター応用解決技術を利用する学問である。バイオインフォマティクスは、ゲノムデータ及び構造データの体系的分析を目的とした新規のコンピューター利用法の使用を含む。ＢＬＡＳＴの様な広く使用されている配列分析プログラムに加え、最近は新世代の“先進”ツールも利用され初めている。これらツールの利用によって、かすかな別種相同体の特定に大きな進歩がもたらされた。しかし、配列分析法は、同様の機能を持つ多くの蛋白質に明瞭な配列同一性がないという基本的な制約を受ける。
【００１２】
３次元構造情報はこの問題に対する最終解決を提供する。類似アミノ酸配列を持つ蛋白質は必ず類似の３Ｄ構造と関連する生物学的機能を持つ。更に、通常の比較方法でそれら配列が無関係な場合でさえ、蛋白質構造はしばしば似ている。「畳み込み認識」法は構造情報を用いて、蛋白質と異なる配列との相関性を同定する。これら方法は、構造パラダイムのデータベースが散在的に構成されているため、一部で成功しているに過ぎない。
【００１３】
各ファミリー及び全てのファミリーの代表メンバーの構造決定は、幾つかのレベルで全発現蛋白質の包括的概観を提供し得る。蛋白質ファミリーは独立モジュールに対応する、あるいは対応しないであろう全ての蛋白質、ドメイン又は配列モチーフを含み得る。利用可能な全ての蛋白質ファミリーを用いることで、例えば必須膜蛋白質を最終的に大規模構造決定し得る。ファミリーベースの構造データベースは、蛋白質の作用を決定するためのデータを提供し、それにより、もちろん構造決定をもたらさない例外的ファミリーもあるが、自然状態に於ける蛋白質の折り畳みに対する理解を改善するための貴重な資源を提供する。データベースはまた構造解析を通し新しい機能上の洞察に光を当てるための情報も提供する。
【００１４】
配列ゲノミクスに於ける特徴的配列モチーフの認識による蛋白質キナーゼ同定と同様にして、構造ゲノミクスは配列ベースの方法に比べ強力である３次元構造中の相同性検証により同目的を達成し得る。従って、構造ゲノミクスの有望な産物は、配列単独をベースでは同定不可能な「予想外」の構造的相同性、そしてある場合には機能的相同性を特定することであろう。構造ゲノミクスのこの機能は従来の仮説誘導的方法を使った場合には決定することができなかった、あるいは少なくとも極めて難しかった生物学的経路内での予想外の繋がりを推測し得る。
【００１５】
ファミリー代表の既知構造に基づく相同モデル化により、恐らく大部分を構成するであろう各ファミリー中の未解決メンバーが視覚化され得る。相同モデル化により、１ファミリーメンバーに由来する３Ｄ構造を利用することで、その他ファミリーメンバーに関する有用なモデルを推測することができる。比較的大きな構造データベースの支援を受け構築されたこれらモデルは、通常の技術を利用して達成されたものに比べ良好であり、そして二次構造予測の様なモデル化技術にとっての基礎を提供する。
【００１６】
Ｘ−線結晶学は蛋白質の様な生物学的高分子の分子レベルの３Ｄ構造を作るための技術である。結晶により回折されるＸ線の強度は正確に測定することができ、そして回折強度の３Ｄパターンは３Ｄ分子像に変換される。３Åおよびそれ以上の解析に対応するパターンについては、原子の位置はÅの数十分の一の正確さをもって結合長の分画内に規定される。ウイルスまたはリボソームの様な巨大高分子集合体の結晶のＸ線回折パターンでさえ同様にして分析できる。核磁気共鳴分光法や電子顕微鏡の様な他技術も代替的に構造決定に利用できるだろう。しかし、これらその他方法はＸ線結晶学にて利用可能な大きな潜在能力は示していない。
【００１７】
Ｘ線法は一般に配列決定法に比べ時間がかかる。３Ｄ構造決定はゲノム配列決定に比べ遙かに遅れている。しかし、Ｘ線結晶学の装置及び方法の最近の進歩は構造決定の速度を劇的に促進する機会を提供している。過去数年間に成熟し、シンクロトロン放射源に最も大きなインパクトを求め、得ている新規の発展には、（１）アンジュレータ挿入装置、（２）電荷結合素子（ＣＣＤ）検出器、（３）結晶の凍結保護法、（４）多波長型異常回折（ＭＡＤ）位相法、そして（５）セレノメチオニル蛋白質がある。これら最近の技術進歩は大規模な構造決定作業に適した結晶学装置を進歩させる。
【００１８】
アンジュレータは驚異的な輝度を持つ、Ｘ線のレーザー様光線を生ずる第３世代型シンクロトロン内の磁気列である。新世代シンクロトロン放射源は迅速な結晶学構造決定を可能にする。アルゴンナショナルラボラトリー（Ａｒｇｏｎｅ　Ｎａｔｉｏｎａｌ　Ｌａｂｏｒａｔｏｒｙ）のアドバンスフォトンソース（ＡＰＳ）の有焦点アンジュレータビームラインはそれ自体のベンディングマグネットビームライン又はブルックヘブンにある国立シンクロトロンライトソース（ＮＳＬＳ）の様な第２世代光源のそれに比べ、１００倍以上のフラックスを有している。使用される電子検出器はこのフラックスに適合できるものでなければならない。適当な大きさを持つ適当なＣＣＤ検出器が昨年利用できるようになった。例えば２Ｋ×２ＫのＣＣＤアレイが多くの販社より入手できる様になった。
【００１９】
フラッシュ凍結法による凍結保護は放射による損傷から結晶を保護する。凍結溶媒への移動に関する方法、この数年でようやく完成されたに過ぎない。アンジュレータを利用する微小結晶（１０−５０ミクロン断面）には凍結保護が必須である。結晶凍結はＸ線実験の応用性の拡大、大量のデータコピー量を必要とするＭＡＤについて、その拡大にインパクトを与えた。最高の毛細管はりつけ結晶についてのみしか有効なデータを得られなかった様な非常に不良な結晶でも、現在では実験の適用範囲内にある。
【００２０】
構造決定を大きく簡素化するＭＡＤ法による位相評価は１９９４年に実現された。ＭＡＤはシンクロトロン放射を必要とし、アンジュレータの優れたエネルギー分解能を必要とする。セレノメチオニンを組換え体蛋白質内に体系的に取り込ませる方法が日常化したことで、結晶構造の解析方法が変化した。セレノメチノニル蛋白質のＭＡＤ位相法は、今後構造ゲノミクスの構造決定法の主流になることだろう。セレノメチオニル蛋白質は大部分の組換え体発現システムにて容易に発現でき、同型誘導体に関ししばしば困難である研究ステージを不要にする。
【００２１】
アンジュレータビームラインはＭＡＤ実験に適したネルギー解像度を持つ非常に明るいＸ線を提供する。最新世代のＣＣＤ検出器と組合せることで、構造解析に必要な全データを提供する単独ＭＡＤ実験をこれまで通常であった数日間ではなく、数時間、あるいは１時間の分画からさえ得ることができるだろう。
【００２２】
ごく最近のその他進歩は、構造ゲノミクスを更に現実的なものにしている。その第１は、上記の如く配列ベースゲノミクスである。これは蛋白質の配列のゲノム内又はゲノム間の知的分類を提供し、それにより目標候補のリストを作る手段を提供している。
【００２３】
これら蛋白質を発現させるためには、容易にできるものをまず実施すべきであるとされている。例えば、細菌内での発現に注目した細菌ファミリーメンバーが存在する場合で且つ例えば好熱性の蛋白質が大腸菌に発現できる場合には、通常組換え体細胞抽出物を煮沸することで実質的精製は達成できる。同定可能な細菌相同体がない蛋白質分類は細菌発現システムを試すこともできるが、最終的には真核細胞システムが必要であろう。この「簡単にできることを最初に」という方法では、その配列から解析可能と思われる比較的小さな蛋白質にまず応用されるだろう。多ドメイン型蛋白質や単一膜貫通型蛋白質の場合には、分析的な配列ベース法を適用し、続いて発現試験、限定蛋白質溶解及びマススペクトロメトリー試験を適用してドメインを規定すべきであるという新しい意見がある。統合膜蛋白質については、結晶化に関するより良い方法、又はＮＭＲ分光分析法による構造決定が可能とする進歩を待つことになるだろう。
【００２４】
ファミリーをベースとした方法は、古典的な方法に対し、蛋白質が困難な対象であることが証明されれば、我々はより証明が簡単である同じファミリーの別のメンバーに交換することができるという大きな利点を提供する。複数のファミリーメンバーについて、少なくとも発現及び結晶化段階を通し同時並行して研究を進め、次に容易に作業できるものに限り続けることも提案されている。並列的な研究は、構造決定法の持続的な技術的進歩と合わせ研究時間の大幅な短縮に関し楽観するに足る根拠を提供している。
【００２５】
多くの部分に関し、構造ゲノミクスはまだ計画段階にある。一部構造ゲノミクスから学び取れるものが不明であり、そして３次元構造が配列ベースの知識以上に大きな進歩をもたらすかについて不明であるという意見もある。その他、総合的構造データベースが他のツールと統合され、新しい洞察をどの様に提供できるのかについても未知である。
【００２６】
【課題を解決するための手段】
本発明の目的は、全生命体を代表する構造の総合的分析のためのシステム及び工程を提供することである。
【００２７】
本発明の別の目的は、全生命体の全ての主要蛋白質ファミリーを表す原子レベルの構造パラダイムを高効率に生成するためのシステム及び工程を提供することである。
【００２８】
本発明の別の目的は、コンビナトリアル法の応用性を拡大するためのゲノミクスにより構造の利用を統合する構造情報の総合的データベースを生成するためのシステム及び工程を提供することである。
【００２９】
本発明の更に別の目的は、各ファミリー内の詳細な構造情報を提供しながら、可能な限り多くの遺伝子ファミリーを広範にカバーするゲノミクスを利用した構造体の利用を統合する構造情報の総合的データベースを生成するためのシステム及び工程を提供することである。データベースは詳細な表面特性、保存パターン及び活性部位を利用した機能的洞察も提供する。分子名、遺伝子ファミリー名、蛋白質ファミリー又は蛋白質名、代謝経路又は特定の配列を指定することで情報にアクセスしてもよい。３Ｄ構造、全ての関連蛋白質及び他データベースとのリンクを含む所望分子に関連した全ての情報がこのデータベースから得られてもよい。この蓄積情報は、標的同定及び評価、発見の指針、薬物アッセイの設計、スクリーニング及びコンビナトリアルライブラリーを含む多くの方法で利用され得る。
【００３０】
本発明は、それぞれが対応する蛋白質に関連している複数の３次元原子構造を決定することに関する、以下を具備するシステムであって、
複数の蛋白質に関し系統的に構築された、配列情報及び既知構造及び機能情報のデータベースと、
データベース内に蓄積された前記構造情報、配列情報及び機能情報を用い、各ファミリーのメンバーが対応する相同的配列を有する複数のファミリーに複数の蛋白質をクラスター分けするための少なくとも１つのバイオインフォーマティクスツールと、
少なくとも１つの前記バイオインフォーマティクスツールにより決定された各ファミリーに関し、ファミリーの適当な代表メンバーである複数の標的蛋白質を、その標的蛋白質に対応するデータベース内に蓄積された情報を利用して並列に合成するための蛋白質合成手段であって、蛋白質として有効であるものを決定するために合成生成物をスクリーニングするためのスクリーニング手段を有する蛋白質合成手段と、
スクリーニング手段により有効であることが決定された各標的蛋白質を調製し、精製し、そして特徴付けするための蛋白質処理手段と、
複数の結晶体をスクリーニングして標的蛋白質の複数の標本結晶を生成するのに対して並列に、前記蛋白質処理手段により処理された各標的蛋白質を結晶化し、複数の標本結晶について所定の回折特性に関し試験を行い複数の標的蛋白質の標本結晶の中から好適なものを決定する結晶化手段と、
前記結晶化手段により好適であると決定された各標的蛋白質の標本結晶を対象に高速処理型結晶学分析を実行するものであって、回折データに対して標的蛋白質の好適な標本結晶を測定する回折測定手段と、前記回折データを分析する分析手段、前記分析手段による前記回折データの分析に従い前記標的蛋白質の原子モデルを構築するための手段、及び前記回折データに対し前記標的蛋白質のモデルを精製し、前記データベース内に前記精製モデルを蓄積する手段とを有するＸ−線結晶学分析手段と、
前記データベース内に蓄積され他ファミリーメンバーに対応する配列情報、及び前記データベース内に蓄積され他の既知の三次元構造に対応する情報を利用して標的蛋白質精製モデルを分析する手段、前記精製モデルの機能モチーフ及び表面特性を分析し活性部位と高分子接触部位を特定する手段、及び前記標的蛋白質に対応した活性部位情報を利用して結合潜在力があると予測された化合物の少なくとも１分類を定義する手段を持つ構造抽出手段と、
前記データベースより引き出された前記標的蛋白質の前記精製モデルを用いて相同モデルを作り上げるための相同モデル構築ツールと
を備え、
前記データベースは開発された前記相同モデルと共に少なくとも１つのバイオインフォーマティクスツールを用いて更新されるシステムを提供する。
【００３１】
また、本発明は、以下の段階を含む、対応する蛋白質にそれぞれ関連している複数の３次元原子構造体を実験的に決定する方法であって、
（ａ）複数の蛋白質に関し、配列情報、および既知の構造情報と機能情報を体系的にデータベース内に組織化し、
（ｂ）少なくとも１つのバイオインフォーマティクスツールと前記データベース内に蓄積された前記配列情報、構造情報および機能情報を用いて、複数の蛋白質を各ファミリーメンバーが対応する相同配列を有している複数のファミリーにクラスター分けし、
（ｃ）複数の標的蛋白質に対応して前記データベース内に蓄積された情報を利用して、段階（ｂ）で決定された各ファミリーに関し、ファミリーの適当な代表メンバーである複数の標的蛋白質を並列的に合成し、この合成による生成物についてスクリーニングして蛋白質として有効であるものを決定し、
（ｄ）段階（ｃ）にて有効であるとことが決定された各標的蛋白質を調製し、精製し、そして特徴づけ、
（ｅ）複数の結晶体がスクリーニングして前記標的蛋白質の複数の標本結晶を精製するのと並列的に、段階（ｄ）にて調製され、精製され、特徴付けされた各標的蛋白質を結晶化し、
（ｆ）段階（ｅ）にて得られた標的蛋白質の一つである複数の前記標本結晶を、所定の回折特性に関し試験し、前記１つの標的蛋白質について複数の標本結晶から好適体を決定し、
（ｇ）段階（ｆ）にて決定された前記１つの標的蛋白質の前記標本結晶について回折データを測定すること、前記回折データの分析に従い前記１つの標的蛋白質の原子モデルを構築すること、前記回折データに対し前記１つの標的蛋白質のモデルを精製すること、そして前記データベース内に前記精製モデルを蓄積することを含む高速処理型結晶学分析を実施し、
（ｈ）前記データベース内に蓄積された他ファミリーに対応する配列情報および前記データベース内に蓄積された他の既知の３次元構造体に対応した情報を利用し、段階（ｇ）にてデータベース内に蓄積された前記１つの標的蛋白質の前記精製モデルを分析し、機能モチーフおよび表面特性に関する前記１つの標的蛋白質の前記精製モデルを分析し活性部位および高分子接触部位を決定し、前記１つの標的蛋白質に対応する活性部位情報を利用し結合潜在力を持つと予測された化合物の少なくとも１分類を決定し、
（ｉ）相同モデル構築のための計算ツールを用いた相同モデルと、前記データベースより引き出された前記１つの標的蛋白質の前記精製モデルを開発し、前記開発された相同モデルと共に前記少なくとも１つのバイオインフォーマティクスツールを利用して前記データベースを更新し、
（ｊ）他標的蛋白質のそれぞれについて段階（ｆ）から（ｉ）を実行する
段階を含む方法を提供する。
【００３２】
また、本発明は、以下の段階を含む、本発明による３次元高分子原子構造体の汎ゲノム決定に関する工程も提供する。
【００３３】
（１）本工程により決定された独占構造及びその他既知構造を含む全ての既知構造情報を体系的にユーザーに親しみやすいデータベースに組織化すること、及び情報が必要とされる時に追加構造、配列及び／又は機能情報を追加しデータベースを更新する段階、
（２）全既知遺伝子生成物を相同配列のファミリーに分類するバイオインフォマティクスの先進ツールを利用する段階、
（３）その様なファミリーのそれぞれについて並列的に、適当な代表的種からの幾つかのｃＤＮＡｓを幾つかの発現システムに適した発現ベクター内に同時にクローニングする段階、
（４）発現に適した構築体をスクリーニングし、調製段階に進めるのに適したものをスクリーニングする段階、
（５）発現された蛋白質を調製し、精製し、そして特徴付けする段階、
（６）結晶化スクリーニングと並列的に精製蛋白質を結晶化する段階、
（７）好適な回折特性について成長した結晶を試験する段階、
（８）好適な結晶を凍結する段階、及びアンジュレータその他ビームラインを利用した高処理型の結晶学用に特に設計されたシンクロトロンストレージリングに多波長型異常回折法を用い回折データを測定する段階、
（９）多波長型異常回折位相法又はその他技術により回折データを分析し、原子モデルを構築し、そして回折データに対しモデルを精製する段階、
（１０）他ファミリーメンバーからの配列情報内、及びその他既知３Ｄ構造体の内部にある精製モデルを分析し、活性部位及び高分子接触部位を特定することを目的として、機能的モチーフ（即ち空間的な、機能的に重要な残基の幾何学的配置）及び表面特性について分析する段階、
（１１）関連構造体に関し、例えばＧＲＡＳＰプログラムの様な活性部位特性情報を用いて、結合能を持つと予測される化合物のクラスを特定する段階、
（１２）相同モデル構築に適したコンピューターツールを利用し、相同体に関するモデルを構築する段階、
（１３）標的選択、薬物設計、及び／又は実験的分析により適当な構築体の設計に関し相同モデルを用いる段階、
（１４）バイオインフォマティクスツールの有効性を更に高めるために全既知構築体の集合を利用する段階。
【００３４】
【発明の実施の形態】
本出願は、その内容が参照されここに取り込まれている１９９９年１月２２日出願の米国連続番号０９／２３５，９８６号の優先権を主張している。
【００３５】
本発明は、それぞれが対応する蛋白質に関連している複数の３次元原子構造を決定することに関する、以下を具備するシステムであって、
複数の蛋白質に関し系統的に構築された、配列情報及び既知構造及び機能情報のデータベースと、
データベース内に蓄積された前記構造情報、配列情報及び機能情報を用い、各ファミリーのメンバーが対応する相同的配列を有する複数のファミリーに複数の蛋白質をクラスター分けするための少なくとも１つのバイオインフォーマティクスツールと、
少なくとも１つの前記バイオインフォーマティクスツールにより決定された各ファミリーに関し、ファミリーの適当な代表メンバーである複数の標的蛋白質を、その標的蛋白質に対応するデータベース内に蓄積された情報を利用して並列に合成するための蛋白質合成手段であって、蛋白質として有効であるものを決定するために合成生成物をスクリーニングするためのスクリーニング手段を有する蛋白質合成手段と、
スクリーニング手段により有効であることが決定された各標的蛋白質を調製し、精製し、そして特徴付けするための蛋白質処理手段と、
複数の結晶体をスクリーニングして標的蛋白質の複数の標本結晶を生成するのに対して並列に、前記蛋白質処理手段により処理された各標的蛋白質を結晶化し、複数の標本結晶について所定の回折特性に関し試験を行い複数の標的蛋白質の標本結晶の中から好適なものを決定する結晶化手段と、
前記結晶化手段により好適であると決定された各標的蛋白質の標本結晶を対象に高速処理型結晶学分析を実行するものであって、回折データに対して標的蛋白質の好適な標本結晶を測定する回折測定手段と、前記回折データを分析する分析手段、前記分析手段による前記回折データの分析に従い前記標的蛋白質の原子モデルを構築するための手段、及び前記回折データに対し前記標的蛋白質のモデルを精製し、前記データベース内に前記精製モデルを蓄積する手段とを有するＸ−線結晶学分析手段と、
前記データベース内に蓄積され他ファミリーメンバーに対応する配列情報、及び前記データベース内に蓄積され他の既知の三次元構造に対応する情報を利用して標的蛋白質精製モデルを分析する手段、前記精製モデルの機能モチーフ及び表面特性を分析し活性部位と高分子接触部位を特定する手段、及び前記標的蛋白質に対応した活性部位情報を利用して結合潜在力があると予測された化合物の少なくとも１分類を定義する手段を持つ構造抽出手段と、
前記データベースより引き出された前記標的蛋白質の前記精製モデルを用いて相同モデルを作り上げるための相同モデル構築ツールと
を備え、
前記データベースは開発された前記相同モデルと共に少なくとも１つのバイオインフォーマティクスツールを用いて更新されるシステムを提供する。
【００３６】
また、本発明は結晶化手段によって好適であることが決定された標的蛋白質の複数の標本結晶の好適体を凍結するクリオ保護手段を備え、結晶化手段によって好適であると決定された標本結晶は、回折測定手段によって回折データが測定される前にクリオ保護手段により凍結されてもよい。
【００３７】
蛋白質合成手段は、少なくとも一つのインフォマティクスツールにより決定された各ファミリーに対して並列的に、適切な代表ファミリーメンバーに対応するｃＤＮＡを、複数の発現システムに対する発現ベクターにクローニングするクローニング手段を有し、スクリーニング手段は、クローニング手段により得られた発現構造をスクリーニングして蛋白質として有効であるものを決定し、蛋白質処理手段はスクリーニング手段により有効であることが決定された発現蛋白質を処理してもよい。
【００３８】
Ｘ線結晶学分析手段は、多波長異常回折法による高速処理型結晶学分析法に適した波状光線を有するシンクロトロンストレージリングを備えてもよく、分析手段は、多波長異常回折位相法により回折データを分析してもよい。
【００３９】
蛋白質合成手段により合成された標的蛋白質内にセレノメチオニンが取り込まれていてもよく、多波長異常回折位相法を用いた分析手段はセレノメチオニル蛋白質に対応した回折データを分析してもよい。
【００４０】
相同モデル構築ツールにより構築された相同モデルは、標的選択、薬剤設計および実験的分析により適した構築体の設計の少なくとも１つに使用されてもよい。
【００４１】
また、本発明は、以下の段階を含む、対応する蛋白質にそれぞれ関連している複数の３次元原子構造体を実験的に決定する方法であって、
（ａ）複数の蛋白質に関し、配列情報、および既知の構造情報と機能情報を体系的にデータベース内に組織化し、
（ｂ）少なくとも１つのバイオインフォーマティクスツールと前記データベース内に蓄積された前記配列情報、構造情報および機能情報を用いて、複数の蛋白質を各ファミリーメンバーが対応する相同配列を有している複数のファミリーにクラスター分けし、
（ｃ）複数の標的蛋白質に対応して前記データベース内に蓄積された情報を利用して、段階（ｂ）で決定された各ファミリーに関し、ファミリーの適当な代表メンバーである複数の標的蛋白質を並列的に合成し、この合成による生成物についてスクリーニングして蛋白質として有効であるものを決定し、
（ｄ）段階（ｃ）にて有効であるとことが決定された各標的蛋白質を調製し、精製し、そして特徴づけ、
（ｅ）複数の結晶体がスクリーニングして前記標的蛋白質の複数の標本結晶を精製するのと並列的に、段階（ｄ）にて調製され、精製され、特徴付けされた各標的蛋白質を結晶化し、
（ｆ）段階（ｅ）にて得られた標的蛋白質の一つである複数の前記標本結晶を、所定の回折特性に関し試験し、前記１つの標的蛋白質について複数の標本結晶から好適体を決定し、
（ｇ）段階（ｆ）にて決定された前記１つの標的蛋白質の前記標本結晶について回折データを測定すること、前記回折データの分析に従い前記１つの標的蛋白質の原子モデルを構築すること、前記回折データに対し前記１つの標的蛋白質のモデルを精製すること、そして前記データベース内に前記精製モデルを蓄積することを含む高速処理型結晶学分析を実施し、
（ｈ）前記データベース内に蓄積された他ファミリーに対応する配列情報および前記データベース内に蓄積された他の既知の３次元構造体に対応した情報を利用し、段階（ｇ）にてデータベース内に蓄積された前記１つの標的蛋白質の前記精製モデルを分析し、機能モチーフおよび表面特性に関する前記１つの標的蛋白質の前記精製モデルを分析し活性部位および高分子接触部位を決定し、前記１つの標的蛋白質に対応する活性部位情報を利用し結合潜在力を持つと予測された化合物の少なくとも１分類を決定し、
（ｉ）相同モデル構築のための計算ツールを用いた相同モデルと、前記データベースより引き出された前記１つの標的蛋白質の前記精製モデルを開発し、前記開発された相同モデルと共に前記少なくとも１つのバイオインフォーマティクスツールを利用して前記データベースを更新し、
（ｊ）他標的蛋白質のそれぞれについて段階（ｆ）から（ｉ）を実行する
段階を含む方法を提供する。
【００４２】
段階（ｆ）にて好適であることが決定された一つの標的蛋白質の複数の標本結晶の好適な一つを凍結する工程を有し、好適であると決定された複数の標本結晶は、段階（ｇ）で回折データが測定される前に凍結されてもよい。
【００４３】
また、段階（ｃ）は、段階（ｂ）にて決定された各ファミリーについて、適当な代表的ファミリーメンバーに対応するｃＤＮＡを並列的に複数の発現システムに適した複数の発現ベクターにクローニングする工程を有ししてもよく、クローニングにより得られた構造は、蛋白質として有効である一つを決定するために発現がスクリーニングされ、有効であると決定された発現蛋白質は段階（ｄ）で処理されてもよい。
【００４４】
階（ｇ）に於ける高処理結晶学分析は、多波長異常位相法とともに波状光線を有するシンクロトロンストレージリングを用いて実行されてもよく、段階（ｇ）で測定された前記回折データは多波長異常回折位相法により分析されてもよい。
【００４５】
段階（ｃ）にて合成された複数の標的蛋白質内にセレノメチオニンが取り込まれてもよく、多波長異常回折位相法はセレノメチオニル蛋白質について測定された回折データを分析するのに用いられてもよい。
【００４６】
実験分析に関する標的選択、薬物設計及びより適当な構築体の設計の少なくとも１つに段階（ｉ）にて構築された相同モデルを利用する段階を更に備えてもよい。
【００４７】
本発明は蛋白質機能を演繹するために構造情報を直接探索するためのツールを提供する。実験的に決定された構築体とホモロジーモデル化された構築体の両方の表面特性に関する詳細記述を含む総合的データベースが開発される。また、この情報は新規配列／構造／機能関連性を同定するのに利用される。蛋白質の３次元構造は、その正常機能がいかなるものであり、それがどの様にしてその生化学的作用を発揮し、そしてどの様な生物学的経路がそれに関連しているかについての洞察を得るために研究される。また、構造証明の蓄積は、機能に関する洞察をもたらす蛋白質表面上の特徴的パターン（静電性、曲率等）の示唆のために研究される。
【００４８】
本発明の実施態様は、図１を参照しながら以下に説明される。
【００４９】
本発明の第１部分は構造的ゲノミクスデータベースの開発である。データベース１ａは既知の構造情報、配列情報及び機能情報を用いて構築される。データベース１ａは利用者に分かり易い様式に体系的に組織化され、コンピューター使用初心者でさえ容易に利用できる様にするためのインターフェースを含む。
【００５０】
３Ｄ構造が本発明の中心を構成するが、データベース自体はデータベースを通し利用可能な構造情報によってのみ可能となる方法で組織化され、そして分析される大量のデータを有する膨大な情報を含む。データベースはリンクしたデータベースと先進の分析ツールから成る完全型ゲノミクスデータベースシステムを構成する。データベース構造の一例では、利用可能な形で提供される構造情報を含む遺伝子及び生化学経路を関連づけるポインターにより、各遺伝子は１またはそれ以上のファミリーに関連付けされている。各遺伝子ファミリーに関し、情報は種を越えたファミリーメンバーのリスト、複数の配列及び構造アラインメント、進化樹、保存パターン及び活性部位残基、生化学経路との結び付き、及び利用可能な薬剤に関する医薬品アッセイ情報（結合データの様な）を有してもよい。注釈は、静電的特性、表面及びその他機能的に重要な領域の物理−化学的特性、ドメイン規定、進化パターン、機能的エピトープ、派生する医薬品体、及び最終的にスクリーニングされた小分子化合物の「仮想」ライブラリーを有していてもよい。データベースは情報項目及び項目間の関連性について持続的に更新されて動的特性を残す様に構築されてもよい。
【００５１】
システム構成要素１はデータベース１ａ及びデータベース１ａの更新を管理するコントローラ１ｂを含む。コントローラ１ｂはシステム内の他要素に管理情報も提供する。データベース１ａは、その他ソースより得た情報と同様に本発明の工程及びシステムにより決定された専有構造を含む新たに獲得された構造、配列、機能情報を受け付けた時に更新される。
【００５２】
三次元構造情報はアミノ酸配列分析に於ける最近の進歩と結びつけて活用され、データベースが構築されてもよい。先進のバイオインフォマティクスツール２は全ての既知遺伝子生成物を相同配列のファミリーにクラスター分けするのに使用される。クラスター化された遺伝子生成物は典型的には約３０％の同一性で類似しており、誤差確率は＜０．００１である。代表メンバーの構造が各ファミリー及びそれぞれのファミリーについて決定される。蛋白質分類は独立したモジュールに対応する、又はしない全蛋白質、ドメイン又は配列を含むだろう。各ファミリーの、おそらく大部分を構成する未確定メンバーは以下示す様に、ファミリー代表の既知構造をベースとした相同モデル化により確認できるだろう。
【００５３】
ＢＬＳＡＴ及びその他ツールの様な配列分析プログラムが利用され得る。その他ツールは、（１）配列探索とファミリー同定の対話式サイクル、（２）ファミリー分析に基づくプロファイル検索、及び（３）ドメイン同定の様な方策を実装してもよい。これら他ツールは、遠い配列相同体の同定の促進に利用され得る。幾つかのバイオインフォマティクスツールは、構造情報を利用し大きく異なる配列を持つ蛋白質間の関連性を同定する折り畳み認識法を実行する。
【００５４】
バイオインフォマティクスツール２は、実験、モデル化、データベース検索及び機器分析により得たゲノムや構造、そしてその他生物学に関するデータ及び情報的を分析するためのコンピューター処理技術を含むソフトウェアを作動させる１またはそれ以上のコンピューターシステムを有していてもよい。
【００５５】
一度遺伝子生成物がファミリーに組織化されれば、結晶は（１）選択された標的の分子クローニング、（２）蛋白質発現、（３）生化学的精製、及び（４）結晶化を含む一連の段階を利用し、生産される。
【００５６】
構成要素３は適当な代表種の情報を利用し、そのようなそれぞれのファミリーについて並列的に要素蛋白質を同時合成するのに利用される。例えば、蛋白質合成ユニット３は代表種由来の幾つかのｃＤＮＡｓを、幾つかの発現システムにクローニングするのに利用し得る。３ないし６種類のｃＤＮＡｓがクローニング目的に選択され、１ないし４種類の発現システムが利用され得る。大腸菌、バキュロウイルス感染昆虫細胞、ショウジョウバエ、ビチア酵母、及びチャイニーズハムスター卵巣細胞を含む各種発現システムが確立されている。細胞質及び分泌システムの両方が、アフィニティータグを用いてあるいは用いられずに適当に利用され得る。その速度及び経済性より、大腸菌での発現が強調されており、それは封入体からの尿素抽出及び巻き戻しを含む。また、大腸菌発現は、セレノメチオニン取り込みの容易さに関して遊離であり、それは生成物発現の開始に当たって日常的に利用され得る。クローニング及び発現段階を含む自動化は、可能な限りにおいて導入され得る。
【００５７】
代替的には、蛋白質合成ユニット３は、あるいはポリペプチドの化学合成とそれに続く原蛋白質への巻き戻しを実施してもよい。別の想定しうる代替法は、インビトロ翻訳又は蛋白質が合成できるその他方法による合成であろう。
【００５８】
次にシステム構成要素４はクローニングの結果得た構築体について、発現に関しスクリーニングするのに利用できる。構成要素４は、調製段階に進むことができる構築体を決定する。可能であれば、結晶は自家用装置でスクリーニングされる。
【００５９】
構成要素４により同定された発現蛋白質は装置５を用いて調製され、精製され、そして特徴付けられる。しばしば、多波長型異常回折（ＭＡＤ）位相法による構造決定に用いられたセレノメチオニル類似体を出発材料として調製発現が準備される。各蛋白質は類縁タグにより精製でき、大きさ、配列確実性、可溶性、均一性及び単分散性について特徴付けられる。精製機能は、１段階又は多段階により達成されるだろう。例えば、従来技術によるクロマトグラフィー及び電気泳動精製が用いられる。特徴付け作業は、超遠心分離、核磁気共鳴分光法、マススペクトロスコピー、及び動的光散乱法を含む数多くの既知技術の何れかを利用して実施されるだろう。
【００６０】
装置５は、それぞれが１またはそれ以上の調製、精製、及び特徴付け作業を実行する１又はそれ以上の物理的ユニットを具備している。調製、精製及び特徴付け段階でのデータはコントローラ１ｂに送られ、コントローラ１ｂは装置５にコントロール情報を供給する。
【００６１】
装置５により処理された精製蛋白質は結晶化装置６に供給される。精製蛋白質は、結晶化装置６で結晶体がスクリーニングするのに対して並列的に結晶化するように設定される。次に、成長した結晶は所定の回折特性について試験され、結晶が回折測定に関し好適であるかが決定される。結晶化はロボット化により作られる蒸気拡散装置内の要因配置実験を利用してもよい。
【００６２】
結晶化装置６により好適であると決定された結晶は、凍結保護装置７に供給され、凍結される。装置７は典型的にはフラッシュ凍結を利用する。しかしながら、他のクリオ保護技術も利用できるだろう。
【００６３】
凍結結晶は凍結保護装置７から取り出され、Ｘ線結晶学装置８に供給される。装置８は高処理型結晶学に合わせ特に設計されたアンジュレータビームラインを利用するシンクロトロンストレージリングを含む。適当な大きさの適当な電子検出器が使用される。検出器は２ｋ×２ｋ型電荷結合素子（ＣＣＤ）アレイでよい。ＣＭＯＳのようなピクセルアレー、又はその他先進の検出器も代替器として利用できるだろう。
【００６４】
結晶構造体の分析は（１）結晶特徴付け、（２）回折測定、（３）位相決定、（４）密度マップの解釈、及び（５）構造の精製を含む、一連の段階を有する。分析の進め方は、発現及びシンクロトロンの部分と密接に一体化しており、標準物質としてのセレノメチオニンの取り込み、及び小凍結結晶に対するＭＡＤ位相合わせを含む。大部分のデータはシンクロトロン装置にて測定されるが、実行可能であれば（分子置換構造体の場合の様に）、自家用装置も利用できるだろう。標準的及び特別に開発されたコンピュータープログラムをＰＣのシステム及びワークステーションコンピュータに利用することができ、好ましくは情報をグラフィカルに表示する。
【００６５】
結晶に関する回折データは、ＭＡＤ法により装置８を利用し測定される。典型的には、この場合セレノメチオニル蛋白質からのＳｅの特性が探索されるが、複数のその他重原子についても利用できる。代替的に又はＭＡＤ実験と組合せ、分析は多異種同体置換（ＭＩＲ）法を含んでもよい。次に装置８を用い、回折データはＭＡＤ位相化法又はその他技術により分析され、原子モデルが構築され、さらにモデルは回折データに対し精製される。精密化したモデルはデータベース１ａ内に記憶される。
【００６６】
装置８は高処理型高分子結晶学に最適化された装置である。装置は２つのアンジュレータビームラインと１つのベンディングマグネットビームラインをＡＰＳの１セクターにて実行可能な様に含んでもよく、当業者の能力範囲内の適当な設計に該当する。典型的にはビームラインは、シンクロトロンに関する構築費用の一部を回収することを目的として、ビームラインの一部が別の研究者に供給される様な条件で作動する。典型的な実験は、第２世代ソースでは３日間を要するが、ＡＰＳの様な第３世代ソースでは数時間のみである。ブルックヘブンにあるＮＳＬＳの様な施設に比べて１０倍程度高い処理能力でありながら、装置８を利用し年間当たり４００以上の新規の専有構造体が生成され、この数は現在の全世界に於ける産生速度に匹敵するものであり、真の新たな結果の生成の２倍以上である。
【００６７】
ＡＰＳの能力の持つ４つの観点が、それを施設としての有用なモデルにしている。第１に、高処理であることが優先されるため、現在典型的な蛋白質結晶の場合にも、通常のベンディングマグネットに比べＡＰＳアンジュレータからのフラックス自体が大きく強化されていることが重要である。更に、アンジュレータ放射が明るいことは、その他方法では扱い難いサンプルから構造を解明する上で必須である。輝度はエネルギー分解能、空間分解能及び角度分解能をもたらす。ＭＡＤ位相化に関するシグナルは、その最適化に関して高エネルギー分解能（２ｅＶ未満）を必要とする極めて短い寿命を持つことが多い電子項遷移に依存している。現状ではこれが達成されることは稀であるが、ＡＰＳアンジュレータからの偏差が本質的に小さいことは狭バンド幅モノクロメーターに良好に適合する。全アンジュレータ出力を極めて小さい点、例えば５０から１００ミクロンの点に集める能力により、微小結晶（２０ミクロン以下）からの回折を実行可能にする。より大きなサイズまで成長させるより小さな結晶を得ることの方がより容易であることが多く、そしてより小さい結晶はより完全且つ容易に凍結することができる。幾つかの分子は、５００Å以上のセルエッジを持つ様な大型ユニットセルに結晶化される。この場合も、ビームの開きが小さいことは大きな利点であり、一般に検出器表面での空間解像度を改善し、ほぼあらゆる問題に関しデータの正確性を高める。
【００６８】
挿入装置（ＩＤ）及び１ＡＰＳセクターのベンディングマグネット（ＢＭ）ビームラインが利用され得る。ＢＭビームラインは結晶を特性付けと、強い回折を示す結晶に関するデータ収集を行うための単一ステーションを有してもよい。ＩＤビームラインは、前後に配置され、独立に回転可能なアンジュレータを装備した２カ所の実験ステーションを有してもよい。末端のステーションはＡＰＳのセクター１９に、構造生物学センター共同アクセスチームビームラインのものと同様の光学装置を持ち、サイドステーションは欧州シンクロトロン放射線施設にあるＴＲＯＩＫＡ及びＱＵＡＤＲＩＧＡビームラインに設置されている様なダイヤモンド結晶技術を利用し得る。
【００６９】
ＭＡＤ実験は約３．５から３５ｋｅＶの範囲のＸ線受容範囲にある広範な吸収遷移状態について実施され得る。これはカルシウムからキセノン（Ｚ＝２０−５４）に至るＫエッジ、カドミウムからウラニウムまで（Ｚ＝４８−９２）のＬエッジ、そして例外的に強力なウラニウムのＭエッジまでを含んでいる。ＩＤ及びステーション、そしてＢＭビームラインがこの完全な実験範囲を可能にしなければならない。完全範囲の端部にある実験はより困難であるが、しかし今日までに鉄（７．１ｋｅＶ）ＫエッジからウラニウムＬ_ＩＩＩ−エッジ（１６．７ｋｅＶ）までの範囲でほとんど全てのＭＡＤ応用が成功している。他の仕様に束縛される中で、ビームライン光学はこの様な実験について最適化され得る。
【００７０】
ダイヤモンド結晶サイドステーションの幾何学により、受容可能なエネルギースパンを必然的に拘束する。しかしながら１０ないし１４ｋｅＶの拘束範囲は、重要なＳｅ及びＢｒのＫ−エッジ、そして原子番号７４から８３（Ｗ、Ｒｅ、Ｏｓ、Ｉｒ、Ｐｔ、Ａｕ、Ｈｇ、Ｔｌ、Ｐｂ、Ｂｉ）の重金属に関するＬ_ＩＩＩ−エッジを含む中心的な応用に適用している。このスパンに関する放射を最適化するために、３．３ｃｍ周期装置のそれよりもこの範囲を通してより高い第１調和強度を生成するより短い周期のアンジュレータ装置が用いられるべきである。ＭＡＤ実験はアンジュレータギャップの調製を必要とし、ダイヤモンドモノクロメーターは下流スペクトラムからの選択的放射を除くため、同一吸収エッジでの同時実験に対してスケジューリング拘束が組み込まれるだろう。もちろんベンディングマグネットラインは常に独立して運転できる。
【００７１】
ビームライン光学及び実験用装置は、小型結晶に関するＭＡＤ位相合わせのサポートに於ける迅速且つ正確な回折実験について最適化されていなければならない。従って、ビームは典型的には１００ミクロン以下の範囲の錯乱状態に焦点合わせされる。アンジュレータからのビーム分散は本質的には小さい。モノクロメーター結晶は、高エネルギー解像度をもたらす様に選択すべきである。検出器は迅速に読み出しできるものでなければならない。ＣＣＤ、ＣＭＯＳの様なピクセルアレイ、又はその他先進検出装置が利用され得る。
【００７２】
サンプル冷却も考慮し、幾つかの実験では必要であろう。ビームがサンプル健全性に関し過剰出力であるいかなる場合でも、輝度を得るような方法で出力が下げられる。従って、アッテネーターフィルターに代わりビームの中心部を選択する装置及び微小なバンドパスを持つモノクロメーターを利用すべきである。
【００７３】
次に、成分９がデータベース１ａからの他情報と共に精製されたモデルを引き受け、他のファミリーメンバーの配列情報及び他の既知３Ｄ構造に関する情報を利用しながら、引き受けたモデルを分析する。また、分析装置９は、活性部位及び高分子接触部位を特定することを目的として静電位、疎水性、曲率、変動性といった表面特性について、ＧＲＡＳＰの様なプログラムを用い精製モデルを分析する。関連構造体に関し、成分９は活性部位の特性に関する情報を利用して、結合能を有すると推測される化合物の分類を規定する。分類規定はデータベース１ａに送られ、保存される。
【００７４】
相同モデル構築用のコンピューターツール１０は相同性に関するモデル開発に利用される。１ファミリメンバーの原子モデルがデータベース１ａから引き出され、他の有用なファミリーメンバーのモデルの予測に利用される。配列類似性が十分に高い場合（例えば同一率５０％）、相同モデル化法により優れたモデルが構築できる。例えば、ポリペプチド折り畳みの一般的特性は、類似性が中程度（同一率約３０％）の場合でもモデル化できる。
【００７５】
この様な原子モデルは、例えば医薬品、農業、及びバイオテクノロジーに有用である。相同モデルはヒト相同体の実験的分析により好適である構築体を設計するのにも利用され得る。従って、例えばヒトのコレステロール合成に関わる酵素は、適当な原子モデルが利用可能であることを条件として、心臓血管治療薬の構造ベースの設計の対象になるだろう。例え細菌由来の関連分子の構造さえ、初期作業の指標としては有用であろう。構造データベースの利点を利用し構築されたモデルは、二次構造予測といったモデル化技術の基礎として利用できるだろう。他の構成要素と同様に、相同モデル構築ツールも典型的にはシステム内の他機能に関し利用できる、あるいは利用できないパーソナルコンピューター、又はワークステーション上で利用できるソフトウェアを含む。
【００７６】
最終目標は全ての主要な発現ファミリーを表す蛋白質及びＲＮＡ分子に関する３Ｄ原子モデルを得ることである。代表的なサブファミリーの構造、特定の医薬品標的、及び重要な相同モデルも含まれ得る。初期段階として、バイオインフォマティクスを利用し結晶化の対象を選択し、そして既知３Ｄ構造に由来するパイロットデータベースの構築を支援することができるだろう。しかし、データベースは常に変更を行い、新規データおよび新規方法が利用可能になる度に更新されるだろう。バイオインフォマティクスの構成要素は発現及び結晶化の標的を選択し、結果をデータベースに組み立てる。シンクロトロン施設は、結晶化に関する蛋白質の発現と回折結果の分析に関する並列的作業をシンクロトロンに協調させながら利用される。
【００７７】
以下の段階を含む本発明の好適工程では、図２に示す様に段階は連続的に繰り返され総合的な構造ゲノミクスデータベースを構築する。段階１０１では、蛋白質配列はファミリーとサブファミリーに組織化されるが、これは結晶化の標的の優先付けを行うために最初に必要とされる。次に、段階１０２では、各配列ファミリーは構造の観点より特徴付けられる。段階１０３では、相同モデルが構築される。段階１０４では、蛋白質表面、活性部位、機能領域等が詳細に特徴付けられる。段階１０５では、折り畳み認識及びその他配列分析法の開発と検証が続けられる。段階１０６では、生物学的経路、機能的注釈及び小数の分子を含む他データベースへのリンクが作られる。
【００７８】
工程の全ての段階に於いて、ロボット及びその他自動化を含む並列的技術が利用され得る。主題材料はモニターされ、各段階で記帳され、そしてこの種の工程管理データを用い操作は最適化され得る。進行しない主題に関し維持された記録は、次の作業が実行される様な実験の再開に利用され得る。
【００７９】
データベースは、例えばバイオテクノロジー、農業、医薬品産業に関し大きな商業的価値を持っている。構造情報は様々に利用されるだろう。構造体又は関連ファミリーメンバーの幾つかは薬剤の標的にされやすく、その目的に直接利用され得る。構造体はまた、例えばキナーゼやヘリカルサイトカインの様な医薬品として大きな利点を持つ蛋白質に対する初期段階での絞り込みを行いながら、遺伝子ファミリー内の詳細な構造範囲を並列的に提供する一方で可能な限り多くの遺伝子ファミリーの特徴を持つ構造体の提供に利用され得る。より広範なファミリー内の範囲により、より正確な相同モデルの構築が可能になる。別の重要な蛋白質ファミリーはＧ蛋白質結合受容体のファミリーである。これら膜蛋白質はまだ結晶化されていないが、世界中の研究室でこの問題に関し多大な努力が払われており、この数年以内に新たな進展が報告されると予想されている。もしそうなった場合には、本発明は重要な医薬品標的である、多数のこれら蛋白質の構造を直ちに解明するためのツールを提供するだろう。
【００８０】
組織化された情報システムは、新規薬物標的とそれらの基本的注釈に関するデータベースの効率的検索を可能にする。図３に示す様に、実施態様の一つでは、使用者は分子名、遺伝子ファミリー名、蛋白質ファミリー又は蛋白質名、代謝経路名、又は特定配列といった検索子を入力することで、データベースにアクセスし検索することができる。好適なアクセスルートは部分的な及び完全長の配列であろう。医薬品企業の典型的科学者は、例えば外部ソースから得た問題の配列リスト上にある、あらゆる利用可能な情報に迅速かつ簡単にアクセスできるだろう。データベースは、この様な解析の最新のタイプの結果を含むことから、配列決定に関する自前の専門家に関する必要性を軽減する。より重要なことは、データベースが、多数の３Ｄ構造体、幾つかの未公表３Ｄ構造体を含み、そして探索するということであり、これは利用者に標的同定工程に関し大きな競争力を提供するだろう。
【００８１】
第２の応用は構造ベースの薬物設計である。３次元構造情報は関心を持つ標的に結合する、又はそれを模擬するペプチド及び小分子の特性を規定するのに利用し得る。この様な記述子を次に利用して小分子データベースを検索し、コンビナトリアルライブラリーでの利用に適した制限を確定し得る。標的同定の場合同様、構造情報は実験的試験を含むフィードバックループに利用され得る。
【００８２】
データベースと医薬品及びバイオテクノロジー企業で利用可能なスクリーニングデータ及び小分子データとの結合により、遺伝子配列（即ちチップ技術に由来する）、蛋白質構造及び化学ライブラリーを特定する実験を持続的に相互作用させることができる。薬物発見工程へのインパクトは多大なものであろう。
【００８３】
発明の実施態様を詳細に記述したが、発明は実施態様に正確であるものに限定されるものではなく、添付のクレームに引用された発明の概念の精神又は範囲から逸脱することなく、その各種変更及び改良が当業者により実施可能であるものと理解すべきである。例えば、単純化を目的とし上記は蛋白質についてのみ記述されているが、本原理がＲＮＡにも応用可能であることは当業者にとって明らかであり、そして当業者は過度の実験なしに実施態様に対する変更及び改良を行い、ＲＮＡに関する本発明を実施することができる。
【００８４】
以下の公開物の開示はその全体は、本発明が属する分野の状態をより完全に記述するために参照され本明細書に取り込まれている。
【００８５】
Ｗ．Ａ．Ｈｅｎｄｒｉｃｋｓｏｎ、Ｊ．Ｒ．Ｈｏｒｔｏｎ及びＤ．Ｍ．ＬｅＭａｓｔｅｒによる“ＳｅｌｅｎｏｍｅｔｈｉｏｎｙｌＰｒｏｔｅｉｎｓＰｒｏｄｕｃｅｄｆｏｒＡｎａｌｙｓｉｓｂｙＭｕｌｔｉｃａｖｅｌｅｎｇｔｈＡｎｏｍａｌｏｕｓＤｉｆｆｒａｃｔｉｏｎ（ＭＡＤ）：ＡｖｅｈｉｃｌｅｆｏｒＤｉｒｅｃｔＤｅｔｅｒｍｉｎａｔｉｏｎｏｆＴｈｒｅｅ−ＤｉｍｅｎｓｉｏｎａｌＳｔｒｕｃｔｕｒｅ，”ＥＭＢＯＪ．，９：１６６５−１６７２（１９９０）
Ｗ．Ｙａｎｇ、Ｗ．Ａ．Ｈｅｎｄｒｉｃｋｓｏｎ、Ｒ．Ｊ．Ｃｒｏｕｃｈ及びＹ．Ｓａｔｏｗによる“ＳｔｒｕｃｔｕｒｅｏｆＲｉｂｏｎｕｃｌｅａｓｅＨＰｈａｓｅｄａｔ２ Å ＲｅｓｏｌｕｔｉｏｎｂｙＭＡＤＡｎａｌｙｓｙｓｏｆｔｈｅｓｅｌｅｎｏｍｅｔｈｉｏｎｙｌＰｒｏｔｅｉｎ，”Ｓｃｉｅｎｃｅ，２４９：１３９８−１４０５（１９９０）
Ｗ．Ａ．Ｈｅｎｄｒｉｃｋｓｏｎによる“ＤｅｔｅｒｍｉｎａｔｉｏｎｏｆＭａｃｒｏｍｏｌｅｃｕｌｅｒ
ＳｔｒｕｃｔｕｒｅｓｆｒｏｍＡｎｏｍａｌｏｕｓＤｉｆｆｒａｃｔｉｏｎｏｆＳｙｎｃｈｒｏｔｒｏｎＲａｄｉａｔｉｏｎ，”Ｓｃｉｅｎｃｅ，２５４：５１−５８（１９９１）
Ｋ．Ｃ．Ｓｍｉｔｈ、Ｂ．Ｈｏｎｉｇによる“ＥｖａｌｕａｔｉｏｎｏｆｔｈｅＣｏｎｆｏｒｍａｔｉｏｎａｌ
ＦｒｅｅＥｎｅｒｇｉｅｓｏｆＬｏｏｐｉｎＰｒｏｔｅｉｎｓ，”Ｐｒｏｔｅｉｎｓ，１８：１１９−３２（１９９４）
Ｂ．Ｈｏｎｉｇ、Ａ．Ｎｉｃｈｏｌｌｓによる“ＣｌａｓｓｉｃａｌＥｌｅｃｔｒｏｓｔａｔｉｃｓｉｎＢｉｏｌｏｇｙａｎｄＣｈｅｍｉｓｔｒｙ”Ｓｃｉｅｎｃｅ，２６８：１１４４−４９（１９９５）
Ｌ．Ｓｈａｐｉｒｏ、Ａ．Ｍ．Ｆａｎｎｏｎ、Ｐ．Ｄ．Ｋｗｏｎｇ、Ａ．Ｔｈｏｍｐｓｏｎ、Ｍ．Ｓ．Ｌｅｈｍａｎｎ、Ｇ．Ｇｒｕｂｅｌ、Ｊ．Ｆ．Ｌｅｇｒａｎｄ、Ｊ．Ａｌｓ−Ｎｉｅｌｓｅｎ、Ｄ．Ｒ．Ｃｏｌｍａｎ、Ｗ．Ａ．Ｈｅｎｄｒｉｃｋｓｏｎによる“ＳｔｒｕｃｔｕｒａｌＢａｓｉｓｏｆＣｅｌｌ−ＣｅｌｌＡｄｈｅｓｉｏｎｂｙＣａｄｈｅｒｉｎｓ”Ｎａｔｕｒｅ，３７４：３２７−３７（１９９５）
Ｎ．Ｂｅｎ−Ｔａｌ、Ａ．Ｂｅｎ−Ｓｈａｕｌ、Ａ．Ｎｉｃｈｏｌｌｓ、Ｂ．Ｈｏｎｉｇによる“Ｆｒｅｅ−ｅｎｅｒｇｙＤｅｔｅｒｍｉｎａｎｔｓｏｆＡｌｐｈａ−ｈｅｌｉｘＩｎｓｅｒｔｉｏｎｉｎｔｏＬｉｐｉｄＢｉｌａｙｅｒｓ，”ＢｉｏｐｈｙｓＪ，７０：１８０３−１２（１９９６）
Ｎ．Ｆｒｏｌｏｆｆ、Ａ．Ｗｉｎｄｅｍｕｔｈ、Ｂ．Ｈｏｎｉｇによる“ＯｎｔｈｅＣａｌｃｕｌａｔｉｏｎｏｆＢｉｎｄｉｎｇＦｒｅｅＥｎｅｒｇｉｅｓＵｓｉｎｇＣｏｎｔｉｎｕｍＭｅｔｈｏｄｓ：ＡｐｐｌｉｃａｔｉｏｎｔｏＭｈｃＣｌａｓｓＩＰｒｏｔｅｉｎ−ｐｅｐｔｉｄｅＩｎｔｅｒａｃｔｉｏｎｓ，”ＰｒｏｔｅｉｎｓＳｃｉ，６：１２９３−３０１（１９９７）
Ｗ．Ａ．Ｈｅｎｄｒｉｃｋｓｏｎ及びＣ．Ｍ．Ｈｅｎｄｒｉｃｋｓｏｎによる“ＰｈａｓｅＤｅｔｅｒｍｉｎａｔｉｏｎｂｙｔｈｅＭｅｔｈｏｄｏｆＭｕｌｔｉｗａｖｅｌｅｎｇｔｈＡｎｏｍａｌｏｕｓＤｉｆｆｒａｃｔｉｏｎ（ＭＡＤ），”ＭｅｔｈｏｄｓｉｎＥｎｚｙｍｏｌｏｇｙ，２７６：４９４−５２３（１９９７）
Ｂ．Ｈｏｎｉｇによる“ＮｅｗＣｈａｌｌｅｎｇｅｓｉｎＣｏｍｐｕｔａｔｉｏｎａｌＢｉｏｃｈｅｍｉｓｔｒｙ，”ＰａｃＳｙｍｐＢｉｏｃｏｍｐｕｔ，２１−２４（１９９７）
Ｃ．Ｄ．Ｌｉｍａ、Ｋ．Ｌ．Ｄ’Ａｍｉｃｏ、Ｉ．Ｎａｄａｙ、Ｇ．Ｒｏｓｅｎｂａｕｍ、Ｅ．Ｍ．Ｗｅｓｔｂｒｏｏｋ、Ｗ．Ａ．Ｈｅｎｄｒｉｃｋｓｏｎによる“ＭＡＤＡｎａｌｙｓｉｓｏｆＦＨＩＴ，ａＰｕｔａｔｉｖｅＨｕｍａｎＴｕｍｏｒＳｕｐｐｒｅｓｓｏｒｆｒｏｍｔｈｅＨＩＴＰｒｏｔｅｉｎＦａｍｉｌｙ，”Ｓｔｒｕｃｔｕｒｅ，５：７６３−７４（１９９７）
Ｌ．Ｓｈａｐｉｒｏ及びＣ．Ｄ．Ｌｉｍａによる“ＴｈｅＡｒｇｏｎｎｅＳｔｒｕｃｔｕｒａｌＧｅｍｏｎｉｃｓＷｏｒｋｓｈｏｐ：ＬａｍａｚｅＣｌａｓｓｆｏｒｔｈｅＢｉｒｔｈｏｆａＮｅｗＳｃｉｅｎｃｅ，”Ｓｔｒｕｃｔｕｒｅ，６：２６５−６７（１９９８）
Ｗ．Ａ．Ｈｅｎｄｒｉｃｋｓｏｎ、Ｈ．Ｗｕ、Ｊ．Ｌ．Ｓｍｉｔｈ、Ｗ．Ｉ．Ｗｅｉｓなどによる“ＭＡＤＳＹＳ，ａＣｏｍｐｕｔｅｒＳｙｓｔｅｍｓｆｏｒＰｈａｓｅＥｖａｌｕａｔｉｏｎｆｒｏｍＭｅａｓｕｒｅｍｅｎｔｓｏｆＭｕｌｔｉｗａｖｅｌｅｎｇｔｈＡｎｏｍａｌｏｕｓＤｉｆｆｒａｃｔｉｏｎ，”
以下に示すコンピュータプログラムは、本発明に関連する技術の状態をより詳細に説明するためにこの出願に参考のためにここに組み込まれる。
【００８６】
前述のＧＲＡＳＰプログラムに関する情報は、以下のＷＥＢアドレスで得られる“ｈｔｔｐ：／／ｈｏｎｉｇｌａｂ．ｃｐｍｃ．Ｃｏｌｕｍｂｉａ．ｅｄｕ／ｇｒａｓｐ／”。このＧＲＡＳＰプログラムはコロンビア大学からライセンスされ得る。コロンビア大学からのＧＲＡＳＰのライセンスに関する情報は以下のＷＥＢアドレスから得られる“ｈｔｔｐ：／／ｈｏｎｉｇｌａｂ．ｃｐｍｃ．Ｃｏｌｕｍｂｉａ．ｅｄｕ／ｇｒａｓｐ／Ｇ＿ａｃａｄｅｍｉｃ．ｈｔｍｌ”。
【００８７】
ＭＡＤＳＹＳソフトウェアに関する情報は及びＭＡＤＳＹＳのコピーを得る方法に関する情報は、以下のＷＥＢアドレスで得られる“ｈｔｔｐ：／／ｃｏｎｖｅｘ．ｈｈｍｉ．Ｃｏｌｕｍｂｉａ．ｅｄｕ／ｈｅｎｄｗ／ｍａｄｓｙｓ／ｍａｄｓｙｓ．ｈｔｍｌ”。

【図面の簡単な説明】
【図１】
図１は本発明のシステムの１実施態様のブロック図。
【図２】
図２は本発明の工程を示す図。
【図３】
図３は構造ゲノミクスデータベースの利用を例示する図。

Claims

それぞれが対応する蛋白質に関連している複数の３次元原子構造を決定することに関する、以下を具備するシステムであって、
複数の蛋白質に関し系統的に構築された、配列情報及び既知構造及び機能情報のデータベースと、
データベース内に蓄積された前記構造情報、配列情報及び機能情報を用い、各ファミリーのメンバーが対応する相同的配列を有する複数のファミリーに複数の蛋白質をクラスター分けするための少なくとも１つのバイオインフォーマティクスツールと、
少なくとも１つの前記バイオインフォーマティクスツールにより決定された各ファミリーに関し、ファミリーの適当な代表メンバーである複数の標的蛋白質を、その標的蛋白質に対応するデータベース内に蓄積された情報を利用して並列に合成するための蛋白質合成手段であって、蛋白質として有効であるものを決定するために合成生成物をスクリーニングするためのスクリーニング手段を有する蛋白質合成手段と、
スクリーニング手段により有効であることが決定された各標的蛋白質を調製し、精製し、そして特徴付けするための蛋白質処理手段と、
複数の結晶体をスクリーニングして標的蛋白質の複数の標本結晶を生成するのに対して並列に、前記蛋白質処理手段により処理された各標的蛋白質を結晶化し、複数の標本結晶について所定の回折特性に関し試験を行い複数の標的蛋白質の標本結晶の中から好適なものを決定する結晶化手段と、
前記結晶化手段により好適であると決定された各標的蛋白質の標本結晶を対象に高速処理型結晶学分析を実行するものであって、回折データに対して標的蛋白質の好適な標本結晶を測定する回折測定手段と、前記回折データを分析する分析手段、前記分析手段による前記回折データの分析に従い前記標的蛋白質の原子モデルを構築するための手段、及び前記回折データに対し前記標的蛋白質のモデルを精製し、前記データベース内に前記精製モデルを蓄積する手段とを有するＸ−線結晶学分析手段と、
前記データベース内に蓄積され他ファミリーメンバーに対応する配列情報、及び前記データベース内に蓄積され他の既知の三次元構造に対応する情報を利用して標的蛋白質精製モデルを分析する手段、前記精製モデルの機能モチーフ及び表面特性を分析し活性部位と高分子接触部位を特定する手段、及び前記標的蛋白質に対応した活性部位情報を利用して結合潜在力があると予測された化合物の少なくとも１分類を定義する手段を持つ構造抽出手段と、
前記データベースより引き出された前記標的蛋白質の前記精製モデルを用いて相同モデルを作り上げるための相同モデル構築ツールと
を備え、
前記データベースは開発された前記相同モデルと共に少なくとも１つのバイオインフォーマティクスツールを用いて更新される。
前記請求項１はさらに、
前記結晶化手段によって好適であることが決定された前記標的蛋白質の複数の標本結晶の好適体を凍結するクリオ保護手段を備え、
前記結晶化手段によって好適であると決定された前記標本結晶は、前記回折測定手段によって前記回折データが測定される前に前記クリオ保護手段により凍結されることを特徴とするシステム。
前記蛋白質合成手段は、前記少なくとも一つのインフォマティクスツールにより決定された各ファミリーに対して並列的に、前記適切な代表ファミリーメンバーに対応するｃＤＮＡを、複数の発現システムに対する発現ベクターにクローニングするクローニング手段を有し、
前記スクリーニング手段は、前記クローニング手段により得られた発現構造をスクリーニングして蛋白質として有効であるものを決定し、
前記蛋白質処理手段は前記スクリーニング手段により有効であることが決定された発現蛋白質を処理する、請求項１に記載のシステム。
前記Ｘ線結晶学分析手段は、多波長異常回折法による高速処理型結晶学分析法に適した波状光線を有するシンクロトロンストレージリングを備え、
前記分析手段は、多波長異常回折位相法により前記回折データを分析することを特徴とする請求項１によるシステム。
前記蛋白質合成手段により合成された標的蛋白質内にセレノメチオニンが取り込まれており、前記多波長異常回折位相法を用いた前記分析手段はセレノメチオニル蛋白質に対応した回折データを分析する、請求項４によるシステム。
前記相同モデル構築ツールにより構築された前記相同モデルは、標的選択、薬剤設計および実験的分析により適した構築体の設計の少なくとも１つに使用される、請求項１によるシステム。
以下の段階を含む、対応する蛋白質にそれぞれ関連している複数の３次元原子構造体を実験的に決定する方法であって、
（ａ）複数の蛋白質に関し、配列情報、および既知の構造情報と機能情報を体系的にデータベース内に組織化し、
（ｂ）少なくとも１つのバイオインフォーマティクスツールと前記データベース内に蓄積された前記配列情報、構造情報および機能情報を用いて、複数の蛋白質を各ファミリーメンバーが対応する相同配列を有している複数のファミリーにクラスター分けし、
（ｃ）複数の標的蛋白質に対応して前記データベース内に蓄積された情報を利用して、段階（ｂ）で決定された各ファミリーに関し、ファミリーの適当な代表メンバーである複数の標的蛋白質を並列的に合成し、この合成による生成物についてスクリーニングして蛋白質として有効であるものを決定し、
（ｄ）段階（ｃ）にて有効であるとことが決定された各標的蛋白質を調製し、精製し、そして特徴づけ、
（ｅ）複数の結晶体がスクリーニングして前記標的蛋白質の複数の標本結晶を精製するのと並列的に、段階（ｄ）にて調製され、精製され、特徴付けされた各標的蛋白質を結晶化し、
（ｆ）段階（ｅ）にて得られた標的蛋白質の一つである複数の前記標本結晶を、所定の回折特性に関し試験し、前記１つの標的蛋白質について複数の標本結晶から好適体を決定し、
（ｇ）段階（ｆ）にて決定された前記１つの標的蛋白質の前記標本結晶について回折データを測定すること、前記回折データの分析に従い前記１つの標的蛋白質の原子モデルを構築すること、前記回折データに対し前記１つの標的蛋白質のモデルを精製すること、そして前記データベース内に前記精製モデルを蓄積することを含む高速処理型結晶学分析を実施し、
（ｈ）前記データベース内に蓄積された他ファミリーに対応する配列情報および前記データベース内に蓄積された他の既知の３次元構造体に対応した情報を利用し、段階（ｇ）にてデータベース内に蓄積された前記１つの標的蛋白質の前記精製モデルを分析し、機能モチーフおよび表面特性に関する前記１つの標的蛋白質の前記精製モデルを分析し活性部位および高分子接触部位を決定し、前記１つの標的蛋白質に対応する活性部位情報を利用し結合潜在力を持つと予測された化合物の少なくとも１分類を決定し、
（ｉ）相同モデル構築のための計算ツールを用いた相同モデルと、前記データベースより引き出された前記１つの標的蛋白質の前記精製モデルを開発し、前記開発された相同モデルと共に前記少なくとも１つのバイオインフォーマティクスツールを利用して前記データベースを更新し、
（ｊ）他標的蛋白質のそれぞれについて段階（ｆ）から（ｉ）を実行する
方法。
前記請求項７はさらに、
段階（ｆ）にて好適であることが決定された前記一つの標的蛋白質の前記複数の標本結晶の好適な一つを凍結する工程を有し、
好適であると決定された前記複数の標本結晶は、段階（ｇ）で回折データが測定される前に凍結されることを特徴とする方法。
前記段階（ｃ）は、
段階（ｂ）にて決定された各ファミリーについて、適当な代表的ファミリーメンバーに対応するｃＤＮＡを並列的に複数の発現システムに適した複数の発現ベクターにクローニングする工程を有し、
前記クローニングにより得られた構造は、蛋白質として有効である一つを決定するために発現がスクリーニングされ、
有効であると決定された前記発現蛋白質は段階（ｄ）で処理されることを特徴とする請求項７に記載の方法。
段階（ｇ）に於ける高処理結晶学分析は、多波長異常位相法とともに波状光線を有するシンクロトロンストレージリングを用いて実行され、そして
段階（ｇ）で測定された前記回折データは多波長異常回折位相法により分析されることを特徴とする請求項７に記載の方法。
段階（ｃ）にて合成された複数の標的蛋白質内にセレノメチオニンが取り込まれ、前記多波長異常回折位相法はセレノメチオニル蛋白質について測定された回折データを分析するのに用いられることを特徴とする請求項１０に記載の方法。
実験分析に関する標的選択、薬物設計及びより適当な構築体の設計の少なくとも１つに段階（ｉ）にて構築された相同モデルを利用する段階を更に備えることを特徴とする請求項７に記載の方法。