JP2003528288A - 高分子の三次元形状の決定方法 - Google Patents

高分子の三次元形状の決定方法

Info

Publication number
JP2003528288A
JP2003528288A JP2000620343A JP2000620343A JP2003528288A JP 2003528288 A JP2003528288 A JP 2003528288A JP 2000620343 A JP2000620343 A JP 2000620343A JP 2000620343 A JP2000620343 A JP 2000620343A JP 2003528288 A JP2003528288 A JP 2003528288A
Authority
JP
Japan
Prior art keywords
molecule
protein
mass
cross
distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000620343A
Other languages
English (en)
Inventor
ギブソン・ブラッドフォード・ダブリュ.
クンズ・アーウィン・ディ.
タン・ニン
ドリンガー・ガビン
オーシロ・コニー・エム.
ヘンペル・ジュディス・シー.
テイラー・エリック
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of California
Original Assignee
University of California
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of California filed Critical University of California
Publication of JP2003528288A publication Critical patent/JP2003528288A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6848Methods of protein analysis involving mass spectrometry
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/20Protein or domain folding
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6818Sequencing of polypeptides
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6842Proteomic analysis of subsets of protein mixtures with reduced complexity, e.g. membrane proteins, phosphoproteins, organelle proteins
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6848Methods of protein analysis involving mass spectrometry
    • G01N33/6851Methods of protein analysis involving laser desorption ionisation mass spectrometry
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/02Details
    • H01J49/04Arrangements for introducing or extracting samples to be analysed, e.g. vacuum locks; Arrangements for external adjustment of electron- or ion-optical components
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Immunology (AREA)
  • Hematology (AREA)
  • Biomedical Technology (AREA)
  • Urology & Nephrology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Microbiology (AREA)
  • General Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Theoretical Computer Science (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Optics & Photonics (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

(57)【要約】 本発明は、タンパク質の三次元立体配座を決定するための迅速で効率的な方法を提供する。本発明の方法は、1)物理的な距離制約を形成するステップ、例えば、タンパク質の残基間で既知のサイズの分子内化学架橋を形成するステップと、2)反応プール内で分子内化学架橋を有する分子の数を、例えば、分子間結合を有するタンパク質を除去するサイズ分離によって、濃縮するステップと、3)濃縮された反応プールを、特定の部位においてタンパク質を切断するタンパク質分解酵素に触れさせて、ペプチド断片を生成するステップと、4)ペプチド断片のサイズを測定して、タンパク質において特定の空間的関係を有するリンク部位を決定するステップと、5)得られたデータを解釈して、推定されたリンク部位の空間的関係に基づいて空間ジオメトリおよびタンパク質の構造を決定するステップと、を備える。情報は、アミノ酸間の距離制約を生成および/または分析するために使用可能なコンピュータシステムの支援により分析されることが好ましい。

Description

【発明の詳細な説明】
【0001】
【発明の背景】
生物学的高分子の三次元構造を決定する能力における進歩は、結晶のX線回折
分析から始まり、その後、非結晶環境におけるタンパク質の高分解度の磁気共鳴
の使用に拡張された。こうした方法は非常に大きな成功を収め、現在、膨大な数
の構造体がブルックヘブンタンパク質データバンクおよび核酸データバンクに保
存されている。このような技術は、理論的な医薬品設計に使用される。しかし、
このような技術は、通常、多くの年月を要し、タンパク質の適切な分析を可能に
する十分な量の純生成物を必要とする。
【0002】 三次元構造の決定における結晶法およびNMR等の磁気共鳴アプローチの成功
にも関わらず、構造が知られていないタンパク質および核酸は多数存在し、例え
ば、膜タンパク質および結晶形成に関して不十分な可溶性を有するタンパク質が
存在する。また、種々のゲノムプロジェクトでは、今後数年だけでも膨大な数の
新しいタンパク質を確認することが約束されており、未決定の構造が残ることは
間違いない。科学者がこうした膨大な新しい一連の情報を利用する場合には、新
たな高スループットの戦略が要求される。
【0003】 NMRまたは結晶法の代替方法として研究されている1つのアプローチは、化
学架橋である。架橋および一価標識実験は、長年に渡って実施されており、低分
解度の構造情報を提供できる。コーヘン等の「ミオグロビンを例としたタンパク
質構造の予測における化学的に導かれた距離制約の使用について」、J Mol. Bio
l.1980 137:9-22。ミトラ等の「平衡転移アルキル化によるタンパク質の架橋用
試薬」、J. Am. Chem. Soc. 1979 101,3097。例えば、タンパク質におけるアミ
ノ酸表面の到達性は、選択的な化学修飾を使用し、その後、結果として生じた修
飾済み(および未修飾)のペプチドのタンパク質分解消化および質量スペクトロ
メトリプロファイリングを用いることによって、調査されてきた。スカウ等の「
選択的化学修飾および質量スペクトロメトリのペプチドマッピングによるタンパ
ク質表面のトポロジ調査」、Proc Natl Acad Sci USA. 1992 Jun 15;89(12):563
0-4。グロッカ等の「アミノアルキル化および質量スペクトロメトリペプチドマ
ッピングによるタンパク質の三次元構造における表面トポロジの分子の特徴」、
Bioconjug. Chem. 1994 Nov-Dec;5(6):583-90。シールスタッド等の「選択的な
タンパク質分解/質量スペクトル分析による人間のエストロゲン受容体配位結合
ドメインの構造的中心の分析」、Biochemistry. 1995 Oct 3;34(39):12605-15。
シールスタッド等の「大腸菌において発現する人間のエストロゲン受容体配位結
合ドメインの質量スペクトロメトリによる分子の特徴」、Mol. Endcrinol. 1995
Jun;9(6):647-58。ザッパコスタ等の「選択的化学修飾および質量スペクトロメ
トリによるミニボディの表面トポロジ」、Protein. Sci. 1997 Sep;6(9):1901-9
。スカロニ等の「質量スペクトロメトリ処理による人間の赤血球のアシルペプチ
ド分解酵素の構造調査」、J. Protein. Chem. 1999 Apr;18(3):349-60。
【0004】 アミド水素交換実験と、その後のタンパク質分解および質量スペクトロメトリ
も、タンパク質構造における溶媒到達可能領域のマップに使用されてきた。スミ
ス等の「アミド水素交換および質量スペクトロメトリによるタンパク質の非共有
構造の調査」、J Mass. Spectrom. 1979 32(2):135-146. 1997。タンパク質分解
に対する敏感性は、露出または埋もれたアミノ酸領域を間接的に特定する部位の
到達性の尺度として、いくつかのグループによって利用されている。ペイパック
等の「タンパク質分解とその後のマトリクス補助レーザ着脱イオン化質量スペク
トロメトリによるガストリン放出ペプチド/抗ボンベシンモノクローナル抗体複
合体のエピトープマッピング」、Protein. Sci. 1994 Sep;3(9):1485-92。コー
ヘン等の「タンパク質分解質量スペクトロメトリの組み合わせによるDNA結合
タンパク質マックスの溶液構造の調査」、Protein. Sci. 1995 Jun;4(6):1088-9
9。ゴームス等の「人間の複製タンパク質Aのタンパク質分解マッピング:一本
鎖DNAとの相互作用時の複合構造ドメインおよび配座変化の証拠」、Biochemi
stry 1996 Apr 30;35(17):5586-95。ザッパコスタ等の「限られたタンパク質分
解および質量スペクトロメトリによるタンパク質の立体構造の調査:ミニボディ
の場合」、Protein. Sci. 1996 May;5(5):802−13。ジェルバソニ等の「限られ
たタンパク質分解およびMALDI質量スペクトロメトリによるGroELに関
するβ−ラクタマーゼの結合表面の特定」、Biochemistry 1998 Aug 18;37(33):
11660-9。タンパク質分解およびアシル化のアプローチは両方とも、アセチルコ
リン受容体等のすべての膜タンパク質のトポロジを特徴付けるのに適用されてお
り、細胞質、細胞外、および膜スパニング要素の明確なパターンの観察を期待で
きる。ムーア等の「質量スペクトロメトリによって確認されるニコチン性アセチ
ルコリン受容体のタンパク質分解断片:受容体トポグラフィの意味」、Biochemi
stry 1989 Nov 14;28(23):9184-91。マソッテD等の「コリシンAの穴形成ドメ
インの膜結合形状の構造:部分的タンパク質分解および質量スペクトロメトリの
研究」、Biochemistry 1993 Dec 21;32(50):13787-94。しかし、こうした標識戦
略の大きな制限の1つは、タンパク質修飾の迅速で曖昧性のない特定を行う方法
の欠如だった。また、こうしたタイプの標識は、全体的な構造の決定にはほとん
ど使用されない。
【0005】 タンパク質の立体構造を化学的に推定する潜在的な選択肢として調査されてき
たタンパク質のフォールディングを予測する純計算的な方法も存在する。しかし
、こうした計算的な方法はすべて信頼性がない。20年前、ある研究において、
低分解度の距離情報が距離ジオメトリを有するタンパク質構造を決定できること
が示された。ハブル等の「高分子配座の距離制約の影響II 実験結果および理
論予測のシミュレーション」、Biopolymers 1979 18:73-81。ハブル等は、各ア
ルファ炭素が構造内の他のすべてのアルファ炭素から10Åより近いかまたは遠
いかを指定し、制約を満たす構造を解決する距離ジオメトリを使用して、ウシの
膵臓トリプシンインヒビタ(PTI)およびコイのカルシウム結合タンパク質−
B(コイミオゲン)のアルファ炭素バックボーンを、実験的に決定した構造の1
ÅRMS内に再構築した。この理論的実証の明らかな意味にも関わらず、必要な
距離制約を提供する可能性がある実験的アプローチはほとんど発展しておらず、
NMRおよび/またはX線結晶法には及ばない。
【0006】 このため、この分野では、タンパク質の立体的構造を決定する迅速で高スルー
プットな方法が必要とされている。また、長い精製プロセスの必要がなく、少量
のタンパク質で、タンパク質の構造を少なくとも適度な分解度で決定できる方法
が必要とされている。さらに、多重結合タンパク質またはドメインに適する改善
された方法も必要とされている。
【0007】
【発明の概要】
本発明は、タンパク質またはその他の高分子の三次元構造または立体配座を決
定するための迅速で効率的な方法を提供する。本発明の方法は、1)物理的な距
離制約を生成するステップ、例えば、タンパク質の残基間で既知の長さの分子内
化学架橋を形成するステップと、2)反応プール内で分子内化学架橋を有する分
子の数を、例えば、分子間結合を有するタンパク質を除去するサイズ分離によっ
て、濃縮するステップと、3)濃縮された反応プールを、特定または不特定の部
位においてタンパク質を分解する1以上のタンパク質分解酵素に触れさせて、ペ
プチド断片を生成するステップと、4)タンパク質において特定の空間的関係を
有するリンク部位を決定するために、ペプチド断片を確認するステップと、5)
得られたデータを解釈して、推定されたリンク部位の空間的関係に基づいて空間
ジオメトリおよびタンパク質構造を決定するステップと、を備える。情報は、ド
メイン間および/またはタンパク質内のフォールディング間の、距離制約および
空間ジオメトリを、生成および/または分析するために使用可能なコンピュータ
システムの支援により分析されることが好ましい。得られたデータは、既知の構
造のタンパク質と選択的に比較される。スレッディング等の技術を用いた構造モ
デリングが、タンパク質のフォールディングの決定を支援するために使用される
。これらの手法を組み合わせて用いることにより、この分野で現在用いられてい
る他の従来の方法よりも、遙かに迅速かつ効率的に、非常に正確な三次元化学構
造を提供できる。
【0008】 タンパク質で分子内架橋を形成するのに使用される化学試薬は、少なくとも1
つの予測されるタンパク質の残基と反応することが好ましく、例えば、化学架橋
残基の少なくとも一端が、タンパク質内のリシンにおける任意の2e−アミノ基
などのタンパク質の予測される部位と結合することが好ましい。本発明の好適な
実施形態において、タンパク質の架橋に使用される化学試薬は、タンパク質の2
つの予測される官能部位と反応し、例えば、この架橋試薬はタンパク質における
任意の2つのリシン残基を架橋する。
【0009】 本発明の一態様は、タンパク質の三次元(立体)構造に関する情報を得られる
ようにタンパク質等の分子を分析する方法である。いくつかのタンパク質は結晶
化できないため、X線結晶法では分析できない。膜タンパク質は、結晶化が困難
または不可能なタンパク質の例である。多くのタンパク質は、NMRを使用する
のに十分なほど溶解しない。本発明は、本質的に、すべてのタンパク質に適用で
きる。
【0010】 本発明の別の態様においては、分子の構造の詳細情報を決定するシステムを提
供する。このシステムは、質量スペクトロメータと、質量スペクトロメータから
質量情報を受け取り、この情報を処理することによって分子の構造の詳細を出力
する計算システムと、を含む。このシステムは、ポリペプチド、核酸、およびそ
の他の高分子の構造の詳細を提供することができる。この分子は、定められた少
なくとも1つの距離制約を有しており、ポリペプチドの場合は、BS3(ビス[
スルフォスクシニミジル]スベリン酸塩)等の架橋薬である。ポリペプチドに課
される制約の数は、アミノ酸残基の数の約20%未満にすることができる。この
システムは、さらに、高分子の三次元構造を出力するために、制約されたスレッ
ディングおよび類似性モデリングを実行する。本発明の別の態様においては、こ
れらの同じ処理を実施し、分子の構造の詳細を出力する計算システムのみが提供
される。この計算システムは、これを実行するために、質量スペクトロメータ等
の別のソースから情報を受け取る。
【0011】 本発明の別の態様においては、分子の候補の得点をつけるためのコンピュータ
によって実行される方法が提供される。この方法は、質量情報を受け取るステッ
プと、分子の予期される断片を生成または保存するステップと、質量情報を予期
される断片とマッチングさせるステップと、候補の得点をつけるステップと、を
含む。このシステムは、ポリペプチド、核酸、およびその他の高分子の構造の詳
細を提供できる。この分子は、定められた少なくとも1つの距離制約を有し、ポ
リペプチドの場合は、BS3(ビス[スルフォスクシニミジル]スベリン酸塩)
等の架橋薬である。ポリペプチドに課される制約の数は、アミノ酸残基の数の約
20%未満にすることができる。本発明の別の態様において、こうした得点付け
の処理を実行するためのコンピュータプログラム製品が提供される。
【0012】 本発明の一実施形態においては、タンパク質のアミノ酸は、検出可能ラベルを
有する架橋試薬を用いて架橋される。
【0013】 本発明の効果は、従来の三次元分析方法に比べ、化合物をより迅速に分析でき
ることである。また、この技術は、グリコシル化タンパク質等の本質的に不均一
なタンパク質に適用できる。
【0014】 本発明の別の効果は、調査されるタンパク質がNMRやX線結晶法の場合のよ
うに純性である必要がないことである。
【0015】 また、別の利点は、分析において、NMRまたはX線結晶法を用いる分析より
も、必要とされるタンパク質が少ないことである。
【0016】 さらに、別の利点は、本発明の方法で使用されるタンパク質の濃度は、希薄で
あってもよいことである。
【0017】 本発明の前述およびその他の目的、態様、効果、特徴は、以下でさらに詳述さ
れる方法の詳細を読むことにより、当業者に明らかとなる。
【0018】
【発明の実施の形態】
本発明のモデリング方法を説明するにあたり、本発明は、説明された特定のプ
ロトコルに限定されず、もちろん変形可能である。さらに、本発明の範囲は、添
付の特許請求の範囲のみによって制限されるので、ここで用いられる用語は、特
定の実施形態を説明する目的のみを有し、限定を意図するものではない。
【0019】 異なる定義がなされていない限り、ここで使用するすべての技術用語および科
学用語は、本発明が属する分野の業者が通常理解するものと同じ意味を有する。
本発明の実施または試験において、ここで説明するものと類似または同等の任意
の方法および要素を用いることができるが、ここでは好適な方法および要素につ
いて説明する。ここで言及するすべての引例は、出典を明記することによりその
開示内容を本願明細書の一部とする。
【0020】 ここで述べる引例は、本発明の出願日以前に開示が準備されている。ここには
、本発明に基づいて、本発明がこうした引例に先行する権利を有しないことの承
認と解釈されるものは含まれていない。さらに、提示した発刊日は、実際の発刊
日と異なる可能性があり、この場合は別途確認が必要となる。
【0021】 定義: ここで互換性のあるものとして使用されている「架橋薬」、「架橋試薬」など
の用語は、2つまたはそれ以上の可能性のあるアミノ酸の反応部位間の反応を可
能とする十分に近接したタンパク質内のアミノ酸を化学的にリンクする任意の試
薬を指す。架橋薬は、特定の架橋薬の最大距離内にあるタンパク質の反応性官能
基と反応する能力を有する。反応基(Xおよび/またはY)は、アミノ酸側鎖に
存在する種々の官能基と特定または一般的な態様で反応するように設計される。
二官能性架橋薬は、反応基が同じ場合はホモ二官能性(X−XまたはY−Y)で
あり、反応基が異なる場合はヘテロ二官能性(X−Y)である。アミン特異性ホ
モ二官能性架橋薬の例は、BS3(ビス[スルフォスクシニミジル]スベリン酸
塩)およびスルフォ−DSP(ジチオビス(スクシニミジルプロピオン酸塩))
である。官能基Xおよび/またはYは、例えばγ−アミンやメチレン等、架橋薬
と化学的に反応するアミノ酸の任意の官能部位である。アミン特異性およびメチ
レン特異性ヘテロ二官能性高分子の例は、SAND(スルフォスクシニンジジル
2−[オジド−o−ニトロ−ベンザミド]エチル−1,3’ジチオプロピオン酸
塩)である。SANDは、第二および直交反応部位としてのC−H結合への挿入
ための特殊な光活性基である、アリールアジドを有する。
【0022】 ここで使用される「三官能性架橋薬」という用語は、2つのアミノ酸特異性反
応基を含むとともに、リンクしたペプチドの容易な精製を可能にする親和基など
の第3の基を含む、任意の高分子を指す。三官能性架橋薬は、例えば、市販のス
ルフォ−SBED(スルフォスクシニミジル[2−o−(ビオチンアミド)−2
−(p−アジドベンザミド)−ヘキサミド]エチル1,3’−ジチオプロピオン
酸塩)であり、これは、ビオチン基を有し、アヴィジンを使用して親和的に選択
される。
【0023】 ここで使用される「オンラインクロマトグラフィ質量スペクトロメトリ」とい
う用語は、クロマトグラフィの流出物が質量スペクトロメータへ流入する方法を
指す。この流出物は、質量スペクトロメータに直接流入してもよいし、質量スペ
クトロメータに流入する前に他の検出手段を通過するようにしてもよい。
【0024】 ここで使用される「オフラインクロマトグラフィ」という用語は、クロマトグ
ラフィを実行し、フラクションを分離し、その後分析する方法を指す。
【0025】 ここで使用される「低分解度」という用語は、約5Åを超える構造の分解度を
指す。
【0026】 ここで使用される「中分解度」という用語は、約2〜5Åの構造を指す。本発
明は、約2〜5Å、より一般的には、約3〜5Åの構造の分解度を提供できる。
【0027】 本発明の一般的な態様: 本発明は、物理的な距離制約を決定する統合技術および制約情報の分析によっ
て、約3Å〜約5Å、より具体的には、3.5Å〜4.5Åの分解度レベルで高
分子の構造態様の決定を可能にする十分なアミノ酸近接情報を高い信頼性で入手
できる、という発見に基づいている。説明を容易にするために、ここでは、タン
パク質の空間ジオメトリを決定することに関して、この技術を説明する。この技
術は、例えば、RNA,DNAの構造的関係、および/または、こうした分子の
タンパク質との相互作用の関係(例えば制限結合)などの、他の高分子の構造態
様を決定する場合にも使用可能であり、本発明の方法は、タンパク質の構造の決
定に限定されるものではない。したがって、以下の開示では、タンパク質の立体
構造を決定するために本発明の方法が使用されているが、同じ一般的な概念は、
広範な異なるタイプの高分子の構造の確認にも適用できる。
【0028】 図1は、本発明の方法の一実施形態のステップを示している。本発明の方法の
第1のステップは、物理的な距離制約の決定であり、化学的または物理的手段を
用いたタンパク質の空間的制約の確認を含んでいる。本発明の一実施形態は、タ
ンパク質の残基の空間的関係の限界を決定するために化学架橋試薬を利用する。
架橋薬と融和する官能基を有し、化学反応が可能な近接性を有する残基のみが、
実際に架橋する。したがって、架橋残基の確認は、タンパク質の立体配座に関す
るジオメトリ制約を決定するために採用される。タンパク質構造の決定において
は、異なる空間的制約および/または官能基特異性を有する複数の架橋薬を、使
用できる。
【0029】 本発明の方法の第2のステップは、分子内架橋タンパク質の架橋反応プールの
濃縮である。架橋に続いて、反応プールは、ペプチド内架橋を有するタンパク質
に関して濃縮される。そして、ペプチド間結合を有する分子は、例えば、サイズ
分離技術によって、完全に除去されることが好ましい。
【0030】 本発明の方法の第3のステップは、濃縮された反応プールのタンパク質分解で
ある。架橋ペプチドは、トリプシンなどの既知の切断部位と反応するタンパク質
分解酵素によって、タンパク質分解される。架橋断片は、タンパク質分解後も結
合を維持している。架橋前のタンパク質におけるペプチド断片の数は予測できる
ため、架橋タンパク質のタンパク質分解後に生成された断片のサイズを決定する
ことにより、特定のサイズの化学架橋試薬と反応する残基の確認が可能になる。
【0031】 本発明の方法の第4のステップは、タンパク質分解によって生成されたペプチ
ド断片の分析である。本発明の一実施形態においては、質量スペクトロメトリ(
MS)技術を用いることによって、架橋断片が確認される。飛行時間型(TOF
)質量スペクトロメトリおよびタンデム質量スペクトロメトリ(MS/MS)等
の容易に利用可能な高分解度の質量スペクトロメトリ技術の出現により、タンパ
ク質分解により分解された架橋タンパク質から発生したペプチド等の化合物の複
雑な混合物の分析が実現可能となった。MS技術では、多数の架橋に関して、高
い質量精度(<10ppm)で、同位体レベルでの分子イオンの分解度を許容す
る。
【0032】 本発明の方法の最後のステップは、タンパク質のモデリング、特に空間ジオメ
トリソフトウェアを用いたモデリングを含む。最近の質量スペクトロメトリ方法
の高感度および質量範囲を、類似性モデリング等のタンパク質モデリング技術と
併用することで、ドメインマッピングおよび中分解度構造、すなわち、約3Å〜
約5Åの構造の構築が可能となる。このデータの統合および解釈により、タンパ
ク質の構造的な立体配座が決定され、タンパク質の立体構造が示される。
【0033】 分子内架橋によって取り組むことのできる構造上の問題は、フォールディング
の認識に限られない。いくつかの制約の限界において、ドメイン対当たり3つま
での制約によって、ドメイン−ドメイン配置が実施できる。ロッシ等の「人間の
補足タンパク質分解酵素C1sの触媒領域の構造:化学架橋および三次元類似性
モデリングによる研究」、Biochemistry 1995 Jun 6;34(22):7311-21。ラクロア
等の「人間の補足タンパク質分解酵素C1rの集合および触媒領域の構造:三次
元架橋および類似性モデリング化に基づく三次元モデル」、Biochemistry 1997
May 27;36(21):6270-82。したがって、ドメインレベルで溶解可能な構造を有す
る大きなタンパク質、例えばHIV−1インテグラーゼも、本発明の方法を用い
て分析できる。多くの制約の限界において、タンパク質の構造の計算は、距離ジ
オメトリを使用し、その後の分子力学の精緻化によって直接実行できる。ダイダ
等の「HIV−1インテグラーゼの触媒ドメインの結晶構造、他のポリヌクレオ
チジル転移酵素との類似性」Science 1994 Dec 23;266(5193):1981-6。ロディ
等の「HIV−1インテグラーゼのDNA結合ドメインの溶解構造」、Biochemi
stry 1995 Aug 8;34(31):9826-33。カイ等のNat. Struct. Biol. 1997 4,567-77
。ゴールドガ等の「HIV−1インテグラーゼの核ドメインの新たな3構造:マ
グネシウムと結合する活性部位」、Proc. Natl. Acad. Sci. USA 1998 Aug 4;95
(16):9150-4。ハブル他「溶液中のタンパク質配座の決定に関する核磁気共鳴お
よび距離ジオメトリの統合使用の評価」、J. Mol. Biol. 1985 Mar 20;182(2):2
81-94。ガンタート等の「冗長二面角制約を有するプログラムDIANAを使用
したNMRデータからのタンパク質構造計算の改善された効率」、J. Biomol. N
MR. 1991 Nov;1(4):447-56。
【0034】 本発明の方法は、特に、この技術分野で利用可能な他のタンパク質構造決定技
術の限界に関して、この方法に大きな有用性を与えるいくつかの利点を有する。
この方法は、第一の信頼できる中分解度(3〜5Å)の構造を生成するので、原
理的に、X線結晶法およびNMRデータの精緻化の開始点として利用可能であり
、時間および作業をかなり節約できる。本発明の方法は、比較的迅速に利用でき
るため、多数のペプチドを素早く分析するのに特に有効である。実験プロトコル
は完全に自動化が可能であるため、高スループットのアプローチに使用しやすい
。したがって、本発明は、ゲノムおよびタンパク質の研究結果の分析に特に適し
ている。分子内架橋は、非常に低いタンパク質濃度の条件下で高められるため、
わずかな量のタンパク質しか必要としない。本発明の方法は、NMRまたはX線
結晶法などの他の技術に比べ、タンパク質純度はあまり重要でなく、分子の重量
および配列情報に基づいた架橋ペプチドと一致するピークのみが関係する。具体
的には、本発明では、比較的短期間(平均1日ないし最大で数週間の範囲)でタ
ンパク質の立体構造を取得できる。ここで説明する方法は、任意のタンパク質混
合物に適用可能であり、具体的な一例においては、代表的なin vitro His標識
タンパク質表現系の1または2ステップの精製によって予想される中程度の純度
(例えば、約60%超〜約80%超の純度)のタンパク質標本に使用できる。
【0035】 一態様において、本発明の方法の実施において実行される種々の動作は、計算
処理として行われる。例えば、質量スペクトロメータからの化学データを解釈し
、解釈から三次元構造情報を決定する種々の動作を計算的に実施できる。図2は
、本発明の一実施形態の計算機能201の高レベルの概要を示すフローチャート
である。ステップ203では、ペプチド断片配列を、タンパク質分解されたタン
パク質で観察された質量スペクトロメトリのピークに割り当て、架橋残基を含む
タンパク質断片を確認することによって距離制約情報を生成する。ステップ20
5では、スレッディングアプローチによって、候補である二次構造の順位リスト
を生成する。後で詳述するように、スレッディングは、既知の三次元構造を有す
る別のタンパク質のレイアウト後に、問題のタンパク質の一次配列を三次元的に
レイアウトする。ステップ207では、(i)残基との疎水性相互作用、または
、(ii)ステップ203の距離制約情報、などの物理的制約基準との適合性に
基づいて、これらの候補構造の再順位付けを行う。ステップ209では、類似性
モデリングを、ステップ207で決定された上位の1つまたは複数の候補へ割り
当てる。そして、問題のタンパク質の残基と上位の候補の残基とを位置的にマッ
チングさせることによって、構造の更なる精緻化を行う。
【0036】 図3は、タンパク質、特に酵素、またはこのようなタンパク質と結合する高分
子の特定、設計、および/または、分析を行うために、比較的大きなゲノムまた
はタンパク質の調査として、本発明を使用する方法を示す。三次元タンパク質構
造は、種々の形態で生成される。図3の右側の二経路は、ゲノムデータから、タ
ンパク質を分析し、タンパク質の構造を生成する従来の技術を表す。研究者は、
通常、遺伝子/ポリヌクレオチド配列を確認または設計することから始める。3
01を参照されたい。完全なin silico処理の一部として(最も右の経路)、一
次ヌクレオチド/アミノ酸配列から仮想タンパク質が生成される。303を参照
されたい。次に、得られたタンパク質の3D構造を予測するために、広く知られ
た種々の処理が実行される。305を参照されたい。こうした処理は、タンパク
質の一次配列のみにより、完全なin silico開始点から実行可能であり、実験デ
ータを補足する必要はない。この時点で、完全なin silico技術は、タンパク質
の二次構造の予測に関してうまく機能するが、二次構造を超える高分解度の特徴
の予測に関しては不適切である。いずれにしても、タンパク質の予測三次元構造
は、対象の配位子との仮想結合等の仮想実験の実行に、使用される場合がある。
307を参照されたい。こうした結合は、タンパク質の構造が正確な場合に有効
である。同様の結合実験は、フローチャートの他の2経路から導かれた構造を用
いて実施可能である。
【0037】 手元にある与えられた遺伝子またはヌクレオチド配列を用いて、当然、実際の
タンパク質を作ることができる。前述のように、X線結晶法またはNMRを実際
のタンパク質(311)に対して実行し、その3D構造を予測することができる
。313を参照されたい。残念ながら、これらの方法は周知の難点と制限とを有
している。これらの方法は、極めて時間がかかる。X線結晶法は、問題のタンパ
ク質の標本の結晶化を必要とするが、多くのタンパク質は結晶化しない。結晶化
するタンパク質のうちの一部は、結晶化した時に本来の立体配座を示さない。N
MRは、通常、極度に濃縮された塩溶液内にタンパク質が懸濁または溶解するこ
とを必要とする。こうした条件は、タンパク質の本来の立体配座を混乱させる場
合が多い。本発明は、架橋残基の形態での非常に限られた実験情報を使用するこ
とにより、タンパク質の実際の3D構造の非常に優れた予測(2〜5Å RMS
以内)をすることを可能となる。本発明を達成するためには、非常に少数の架橋
、通常、アミノ酸残基の数の約10%で十分であることが分かっている。315
を参照されたい。この制約情報を使用し、タンパク質の一般的な構造特性(31
7)が決定される。これは、完全なin silicoまたはNMRやX線結晶法の実験
によって決定された3D構造の検証または改善に使用される。
【0038】 物理的な距離制約の決定: タンパク質の残基間の物理的な距離制約の決定には、蛍光共鳴エネルギ転移や
スピン標識手法などの多くの手法を利用できる。好適な実施形態において、距離
制約は、タンパク質を架橋し、その後、リンクした断片を確認するために質量ス
ペクトロメトリを用いることで決定される。図4は、そのような架橋タンパク質
の図である。架橋領域は単純なアルキル鎖にすることができ、架橋薬の長さは、
エチレン基を変えること等によって、変化させることができる。架橋薬領域は、
短くても、長くてもよく、より正確な近接性を定めても(例えば、試薬と強固な
架橋薬領域との結合)、結合近接性の外側の境界を定めてもよい(例えば、試薬
と柔軟な架橋薬領域との結合)。この架橋薬は、他の特性を変えるために化学的
に修正可能であり、例えば、架橋薬の親和性を強めるためにヒドロキシル基を加
えたり、架橋薬を強固にするために芳香基を加えたりすることができる。本発明
の方法においては、二官能性および三官能性化学架橋薬などの多くの異なるリン
カーを使用することができる。任意の架橋薬に関して、潜在反応部位の少なくと
も1つ、好ましくは両方は、知られている。反応基は、その反応性に対して直交
または非直交であるとみなすことができる。
【0039】 架橋実験から抽出できる距離制約情報を最大にするために、異なる長さのスペ
ーサアームおよび柔軟性を有する架橋試薬のライブラリによって、多くの多様な
一連のアミノ酸機能をターゲットにできる。より強固または短いスペーサは、架
橋残基間の可能性のある距離の範囲を狭めるので、フォールディングの認識にお
いて多くの判別が提供される。さらに、架橋薬のライブラリを用いて実行される
実験は、制約の全体的な精度を改善するために使用される。立体配座分析に多く
の距離制約を提供することによって、実験的に導かれる制約の数および精度によ
って、回答が得られる構造の問題のタイプが定義される。使用する架橋試薬は、
タンパク質およびペプチド化学分野の当業者に知られる種々の要素を用いて、選
ぶことが可能である。これには、タンパク質で予測される構造モチーフが含まれ
、例えば、タンパク質の一次配列から予測されるモチーフ等が含まれる。特定の
ドメインおよび/またはフォールディングを確認するための多数のタンパク質の
スクリーニング等で、タンパク質の特定の構造態様を確認する場合、架橋試薬は
、特定のドメインおよび/またはフォールディングを確認するための有効性に基
づいて選択される。
【0040】 本開示を読む当業者にとって明らかなように、長さ、強固さ、特異性等の異な
る種々の架橋薬を利用できる。例えば、異なる長さおよび/または特異性の一連
のホモ二官能性試薬が、特定のタンパク質の研究に適した適切な長さおよび/ま
たは化学的成分を有する架橋薬を提供するために、生成される。例えば、アミン
特異性を有する長さの異なる一連のホモ二官能性試薬を使用して、特定のタンパ
ク質の研究を実行できる。例えば、2または4メチレンの長さを有する架橋薬な
どの6メチレンを有する架橋薬BS3(ビス[スルフォスクシニミジル]スベリ
ン酸塩)と相同な架橋薬を生成することにより、長さの異なる一連のアミン特異
性架橋薬を提供できる。種々の架橋薬を使用して取られたデータを組み合わせる
ことによって、より詳細なタンパク質の空間制約の分析を提供できる。
【0041】 本発明の方法で使用する架橋試薬は、例えば、EDC(1−エチル−3−[3
−ジメチルアミノプロピル]−カルビジイミドヒドロクロリド)、ロマントの試
薬として知られるDSP(ジチオビス[スクシニミジルプロピオン酸塩])、B
S3(ビス[スルフォスクシニミジル]スベリン酸塩)、およびDSS(ジスク
シニミジルスベリン酸塩)である。DSPおよびDSSは共にホモ二官能性、ア
ミン反応性試薬であり、DSPのジスルフィド結合は分割可能であるが、DSS
のそれは非分割性であるという点のみ異なっている。BS3は、膜不浸透性であ
るDSSの水溶性の類似体である。EDCは用途が多く、水溶性で、カルボキシ
ル基(ターゲットタンパク質に存在するAspまたはGlu、若しくは架橋薬の
カルボキシル基)を活性エステルに転換する能力を有しており、アミン含有分子
(タンパク質または架橋薬)の求核攻撃により安定したアミド架橋を形成するこ
とを可能にする。
【0042】 タンパク質内の架橋を生成するために、タンパク質溶液に選択された架橋薬を
加え、架橋を可能にするのに有効な条件下で反応させる。この条件、例えば、緩
衝液、タンパク質と架橋薬との相対的な濃度、pH、温度、時間などは、当業者
が予測できるように、ターゲットの官能アミノ酸基の共有結合を形成するのに適
すように選択される。ホモ二官能性架橋薬(またはホモ三官能性架橋薬、X−z
−Y)の場合、両方の基が反応可能であり、架橋薬のいくらかのパーセンテージ
が、同じタンパク質の空間的に離れた2つのアミノ酸の間で架橋を形成し(分子
内架橋)、または、2つの分離したタンパク質分子の間で架橋を形成する(分子
間架橋)。ヘテロ二官能性架橋薬の場合は、第二の一連の条件が、その後、直交
基によって利用され、ターゲット部位と反応する。これは、例えば、アリールア
ジド等の光活性化基の場合は光の変化であり、スルフヒドリル選択基の場合はp
Hの変化である。
【0043】 例えば、BS3およびDSTは、次の一般的な反応条件でFGF−2とよく反
応する。25℃、2時間、100mMヘペス緩衝液内で架橋薬とタンパク質の分
子比率が20:1である5μMのタンパク質、pH7.5。HIV−1インテグ
ラーゼとの架橋反応は、特定の温度では不適切であり、全体の反応時間を増加さ
せるとともに、反応温度を下げることで達成される(0℃、40時間)。スルフ
ォ−EMCS(N−[ε−マレイミドカプロロキシ]スルフォスクシニミジルエ
ステル)や、スルフォ−GMBS(N−[γ−マレイミドブチリロキシ]スルフ
ォ−スクシニミドエステル)等のLys−Cysヘテロ二官能性架橋薬は、NH
S−エステルを介してLysと反応し、マレイミド官能基を介してCysと反応
する。マレイミド基は、pHが6.5〜7.5のとき、スルフヒドリルに関する
選択性が最も大きくなり、このpHを超えると、一次アミンとの反応がより大き
くなる。この反応は、pH7.0では、NHS−エステルとマレイミド基とが同
時に反応するため1ステップで実行される。あるいは、2ステップに分けて実行
することもでき、pH6.5の第1のステップではマレイミド基が反応し、pH
7.5の第2のステップではNHS−エステルが反応する。
【0044】 いずれの場合においても、得られる生成物は、以下の結果を含むタンパク質の
混合物を含む。1)一方の端部のみでタンパク質と共有して付着する架橋薬(ゆ
きどまり架橋の場合、距離に関する有効な情報はほとんどない)、2)単一のタ
ンパク質に付着する空間的に離れた2つの部位を含む架橋(2つの共有するリン
ク部位を有するタンパク質単量体、望ましい結果)、および/または3)別の2
つのタンパク質分子をつなぐ架橋薬(タンパク質間架橋、タンパク質−タンパク
質の相互作用を調査する場合を除き、一般には望まれない)。図5を参照。
【0045】 図6は、距離制約情報を生成する1つの適切な計算処理を示す。601を参照
されたい。この処理は603で開始される。計算システムは、タンパク質に使用
された特定の(複数の)架橋薬および(複数の)タンパク質分解酵素が与えられ
た場合に、予期される多くの断片を生成する。このリストを生成するために、シ
ステムは、通常、一次配列,タンパク質分解酵素の確認,架橋試薬の確認などの
入力を少なくとも必要とする。例えば、リシンおよびアルギニンをC末端で分割
するトリプシンによってタンパク質が処理される場合、こうした分割生成物の一
次配列から生成されるすべてのタンパク質断片が考慮される。また、タンパク質
断片の一部は、付着する架橋試薬を有するため、こうした修飾断片もリストにさ
れる。例えば、架橋薬BS3(リシンと結合する)が使用される場合、リシン残
基を有する追加の潜在的な断片の一部および結合するBS3が、加えられた架橋
薬の質量と共にリストにされる。好適な実施形態において、予期される断片のリ
ストは、1以上の架橋試薬によってリンクされる2以上のペプチドバックボーン
を含む多くまたは任意の断片を含まない。こうした化学種については、その後の
処理において説明される。この実施形態において、架橋薬を含む断片を考慮する
とき、結合した架橋薬は1つの自由な(結合していない)末端部を有する。こう
した架橋試薬を含むペプチド断片を考慮するとき、試薬の末端部の化学的状態に
応じて、種々の亜種が存在する可能性がある。例えば、同じタンパク質断片が、
次のような分子重量の変化を伴って、リストにされる場合がある。完全なリンカ
ーが付着した断片(リンカー+脱離基)および加水分解リンカーアームが付着し
た断片(通常、加水分解される)。特定の断片が2以上のリシン基を有する場合
には、例えば、リシン残基間の断片内架橋の可能性もリストにされる。
【0046】 603では、システムは、リスト内の生成された断片のそれぞれの質量を計算
する。これにより、断片を質量スペクトロメータからの情報と相関させることが
可能になる。すべての断片が生成されると、これらは、分子重量範囲に格納され
ることによって整理される。604を参照されたい。図7の701は、いくつか
の個別のビンを含む、計算済みタンパク質断片の格納リストを表している。例に
ついては、702を参照されたい。ビン内の個々の質量種は、リンクしたリスト
として表現される。703を参照されたい。次に、実際にタンパク質分解された
タンパク質から得られる質量スペクトロメトリデータを、予期される化学種の格
納された集合と整合させる。
【0047】 説明したように、断片のリストおよび関連する質量が生成および格納された後
、実際の質量スペクトロメトリデータが分析される。システムは、タンパク質分
解されたタンパク質の分析から得られた各MSピークを考慮することが好ましい
。処理601において、これは動作605および606として表される。ここで
は、システムは、考慮されるピーク数に等しい変数Nを設定し(605)、これ
らの種々のピークで反復適用する(606)。反復ループ動作606では、まず
、指標値「i」が1に設定される。その後、現在値iがNの値より大きいか否か
を決定する。大きくない場合は、ピークを作り出した化学種の化学的構造を特定
する種々の動作を実行する。
【0048】 好適な実施形態においては、1つまたは複数の制御スペクトルが、図6の処理
が実行される前に、MSデータから減じられる。リンクした残基を有するタンパ
ク質断片のみ(リンクしているものが他の端部で全く付着していない場合を含む
)が、一般に対象となるので、このように架橋薬を有する残基に対応するMSデ
ータを減じるのは有効である。好適な実施形態において、質量種のリストは、既
存のペプチドのライブラリを用いて部分的に構築可能であるため、リストの作成
作業が簡略化される。
【0049】 そして、システムが第1のMSピークを考慮すると仮定する場合には、観察さ
れたそのピークの質量が切り捨てられ、対応するビンと整合させる。607を参
照されたい。その後、システムはビン内の質量種のリストを調べ、それぞれの百
万分率(PPM)のエラーを計算する。609を参照されたい。プログラムは、
次に、計算された質量種の許容PPM範囲に入る、すべての断片を出力する。6
11を参照されたい。なお、システムへの1つの入力データは、ユーザ調整可能
なPPMエラーウィンドウであってもよい。
【0050】 この処理は、断片対断片の架橋に対応する質量種をまだ明らかにしていない。
この実施形態においては、プログラムは、このようなすべての組み合わせを格納
していないが、これに代えて、個々のタンパク質断片のリストを検索し、互いに
リンクする2つの断片が観察されたMSピークと整合するか否かを決定する。6
13を参照されたい。この処理は、詳しくは次のとおりである。この処理では、
ステップ605および606のような反復適用処理において、各MSピークの組
み合わせを検索する。この組み合わせにはリンカーが存在すると仮定できるため
、この処理ではMSピークの重量を調べ、リンカーの重量を減じる。次に、占有
の度合いが最も低い分子重量ビンに進む。ビン内の各断片に関して、断片のパー
トナーが存在する場合、どちらが断片と架橋することが可能か、および、どちら
が質量を持つか、を決定するためのチェックが行われ、第1の断片の質量が加え
られるときに、補正したMSピークが計算される。これは、現在のビンおよびそ
の後のビン内のすべての断片について反復され、組み合わせ検索において、すべ
てのビンが明らかになるまで継続される。PPMエラーウィンドウを満たすペプ
チド間架橋種は、615において出力される。特定の実施形態において、このプ
ログラムは、非常に希にしか生成されない3以上の架橋断片の組み合わせを検索
しない。
【0051】 611および/または615において、手元のピークが分析され、関連する一
致が出力された後、処理制御は反復ループ動作606に戻り、ここでは値iを1
増加させる。このシステムは、再び現在値iが値Nを超えるか否かを決定する。
考慮すべきピークがより多く存在すると仮定する場合、次のピーク(i)が選択
され、処理制御は動作607,609,611,613,615に戻り、前述の
処理が実行されるが、参照するのは新しいピーク(i)である。
【0052】 すべてのMSピークを考慮した後(iがNよりも大きくなった時点)、動作6
06の回答は否定となる。この時点で、処理制御は617に分岐し、システムは
最終結果を出力する。代表的な読み取り可能な出力形式では、リストは、図8に
示すように、MSピークの質量と、それが対応するタンパク質の断片または断片
の組み合わせと、一連のMSスキャンにおいて観察されたピークの回数と、PP
Mエラーと、架橋付着の位置と、を含む。質量の冗長性、つまり質量種より多く
対応することが観察されたMSピークは、特に許容PPMエラーとして約5が選
択された場合、希に見られる。これらは、コンピュータプログラムが最終結果を
出力した後で解決できる。この結果は、候補構造の再ランク付けのための距離制
約情報として使用される(図2の動作207および図13を参照)。このソフト
ウェアは、BS3に加え、他の架橋薬に適応するように書かれており、本発明の
ソフトウェアは、他のタンパク質分解および架橋試薬でも利用できる。1以上の
架橋薬またはタンパク質分解酵素が使用され、それぞれ異なる架橋薬およびタン
パク質分解酵素による複数の分解が実施される実施形態を扱うために拡張するこ
とができる。
【0053】 この質量スペクトロメータおよび計算システムの装置の概要は、図9の901
に示している。架橋分子断片は、質量スペクトロメータ903への入力であり、
この実施形態ではタンパク質断片である。この質量スペクトロメータは各断片に
関するM/Z(質量対電荷)を出力し、これは分子の一次配列と共に計算システ
ム905に供給される。この計算システムは、その後、分子の3D構造の詳細を
出力する。
【0054】 二部位分子内架橋の濃縮: タンパク質の架橋に続いて、オプションとして、分子内架橋を有するタンパク
質に関する反応生成物の濃縮が行われ、単一部位および/または分子間架橋を有
するタンパク質を最小化、および好ましくは排除する。例えば、分子間架橋は、
サイズ排除クロマトグラフィを用いて確認される。本開示を読む当業者にとって
明らかであるように、他の方法を利用することも可能である。あるいは、架橋反
応後の濃縮が不要な、十分に低い単一部位および/または分子間架橋の度合いを
有する反応生成物を提供する(複数の)架橋反応の反応条件を選択するようにし
てもよい。反応が完了し、所望の反応生成物の濃縮が実行された後、タンパク質
生成物の最初の質量スペクトル分析をオプションとして実行し、全体的な反応化
学量論を決定する。架橋修飾の予想質量は既知であるため、未修飾タンパク質(
M)から修飾タンパク質(M’)への質量の推移は、架橋修飾の平均数を与える
。架橋薬およびタンパク質の絶対および相対濃度は、実験設計の重要なパラメー
タである。理想的には、架橋薬によって、タンパク質の共有修飾の平均総数を、
タンパク質当たり1架橋よりも少なくし(つまり、架橋修飾数/タンパク質<1
)、誤った距離制約を生成する恐れのあるタンパク質の立体構造の大きな混乱を
避ける。また、架橋反応は、望ましい二部位タンパク質内架橋よりも、多くの単
一部位ゆきどまり修飾を生成する可能性がある。しかし、単純な単一部位修飾が
全体的な構造に与える混乱は、二部位架橋よりも遙かに小さい可能性が高い。
【0055】 Lys−Lys特異性架橋薬(例えば、BS3)の場合には、質量スペクトロ
メータが、これら2つの反応の可能性における質量の違い、例えば、0.1%未
満の分解能を有していれば、2つの結果は区別可能である。タンパク質が20,
000の質量を有する場合、水により加水分解された第2の端部を有する単一の
標識部位(Lys標識)の質量は、20,156となる。この質量の移行は、タ
ンパク質において二部位反応(Lys対Lys)が発生した場合の質量、M=2
0,138よりも、18Da大きい。
【0056】 架橋試薬は潜在的に、二つ(以上)の異なるタンパク質のアミノ酸残基との共
有結合を形成できるため、サイズ排除クロマトグラフィまたはその他の分離手法
を(変性または非変性条件下で)利用して、タンパク質間架橋を有するタンパク
質から内架橋タンパク質を分離できる。例えば、BioRad BioSele
ctTMカラムを使用して、架橋二量体を除去できる。BioRad BioS
elect125−5カラム(各300×7.8mm)を使用する非変性条件下
(100mM NH4HCO3、pH7.0)では、一般に2つのピークが観察
され、先の溶離ピークはタンパク質二量体を含み、後の溶離ピークは単量体を含
む(図10)。
【0057】 タンパク質単量体を含む部分は、さらに変性条件下(8M尿素、100mMク
エン酸塩緩衝液、pH5)でTosoHaas G2000カラムを使用して、
更に2つの下位構成要素に分離可能であり、先の溶離ピークはゆきどまりまたは
単一標識リンカー(実際の架橋ではなく、表面のみの標識)を有するタンパク質
単量体を主に含み、後の溶離ピークは実際に分子内架橋アミノ酸を有する単量体
を主に含む。
【0058】 ゲル電気泳導、濾過、透析等の他のサイズ分離法をこの方法に取り入れること
も可能である。非常に少量のタンパク質が利用可能である場合、単量体からの二
量体の分離は、SDS PAGEによって達成できる。その後、個々のタンパク
質ゲルバンドを切離し、タンパク質を電子溶離することができる。
【0059】 断片化およびサイズ分離: 架橋に続いて、対象のタンパク質は、分解によってペプチドに断片化され、ペ
プチド生成物は、例えば逆相クロマトグラフィによって分離される(図11参照
)。本発明の方法における断片化のためのタンパク質分解酵素は、架橋タンパク
質を小さな扱いやすい部分に分割するのに用いられる活量を有する。これは、分
解中にタンパク質を特定の切断部位で繰り返し正確に分裂させる能力を有する、
当技術分野において既知である任意の酵素または化学活量であってもよい。最適
な活量は広く知られており、最適な活量は従来の操作を使用して選択できる。
【0060】 こうした酵素または化学活量の例は、例示的な例として、リシンのカルボキシ
ル側とアルギニンとのペプチド結合を加水分解する酵素トリプシン、芳香族残基
(フェニルアラニン、チロシン、およびトリプトファン)のカルボキシル側のペ
プチド結合を加水分解する酵素キモトリプシン、メチオニン残基でタンパク質を
化学的に切断する臭化シアン(CNBr)、Gluのカルボキシル側(重炭素ア
ンモニウム、pH7.8、または酢酸アンモニウム緩衝液、pH4.0)または
GluおよびAsp(リン酸塩緩衝液、pH7.8)の非常に特異的なペプチド
結合を加水分解するエンドプロテイナーゼGlu−C、およびAspのアミノ側
およびシステイン酸のペプチド結合を加水分解するエンドプロテイナーゼAsp
−Nを含む。扱いやすいペプチドを取得するために、特異性の低いタンパク質分
解酵素を使用することも可能で、これには、Leu、Ile、Met、Phe、
Trp、およびValのような大きい側鎖を有する疎水性アミノ酸のアミノ基を
含むペプチド結合を加水分解するサーモリシン、および芳香族アミノ酸およびそ
の他の疎水性アミノ酸(PheおよびLeu)のカルボキシル基を含むペプチド
結合で選択的にタンパク質を切断するペプシン等が含まれる。酵素トリプシンは
、タンパク質を小さく扱いやすい部分に分割する酵素活量として最適な場合が多
く、これはトリプシンが、低コストと、タンパク質分子のアミノ酸配列において
発生するアミノ酸アルギニンおよびリシンにおける非常に再現性が高く正確な切
断部位とによって特徴付けられるためである。トリプシンを使用して標識タンパ
ク質から最終的なペプチド混合物を生成するのに使用する代表的な反応条件は、
50mM NH4NCO3、pH9、トリプシン対タンパク質の重量比20:1
、および37℃での2時間の定温放置である。
【0061】 タンパク質分解酵素と化学試薬との組み合わせを、架橋タンパク質に加えて、
ペプチド混合物を生成することも可能である。以下のSDS PAGEによるサ
イズ分離に続く場合、タンパク質分解酵素によるタンパク質のゲル内分解が使用
され、得られたペプチドは、このゲルスライスから抽出される。得られたペプチ
ド混合物は、未標識および標識ペプチドを含み、標識のある部分は、さらに、分
子間、分子内、または単一標識架橋に分けられる。
【0062】 分解の後、当業者に知られる任意の方法を使用して、断片を分けることができ
る。好ましくは、ペプチドはクロマトグラフィカラムを使用して分けられる。こ
のクロマトグラフィカラムは、適切な溶媒システムと協調し、分解反応後、ペプ
チド分解産物のクロマトグラフィによる分別が可能なクロマトグラフィ媒体を含
む。このクロマトグラフィカラムは、ペプチド分解産物を受け取る入口ポートと
、クロマトグラフィにより分別されたペプチド分解産物を含む流液を送り出す出
口ポートとを含む。
【0063】 好適な実施形態において、このクロマトグラフィカラムは、逆相HPLC分析
用カラムである。これは、逆相HPLC手法を使用して、分解産物がクロマトグ
ラフィカラムを通じて溶離した時に、ペプチド分解産物を分別することが可能な
分別媒体を備える。こうした技術を実践するために、クロマトグラフィ媒体は疎
水性であることが好ましい。これは、ペプチド分解産物自体が疎水性の性質を有
する傾向にあるためである。本発明の操作での使用に適したHPLC分析用カラ
ムの例は、カリフォルニア州ヘスペリアのセパレーションズグループ社からVy
dac TM C−18 HPLCカラムとして市販されている。
【0064】 ペプチド断片の確認: 架橋タンパク質を断片化し、オプションとして精製した後、ペプチド断片を確
認して、タンパク質構造内で特定のペプチド断片に架橋を割り当てる。これは種
々の手法を使用して行うことが可能であり、エドマン配列決定、クロマトグラフ
ィ、質量スペクトロメトリ法、またはこれらの方法の組み合わせが含まれる。グ
ラント等のMethods Enzymol. 1997 289:395-419。
【0065】 架橋ペプチドの確認の一方法は、オンラインクロマトグラフィ−質量スペクト
ロメトリ法、または、オフラインクロマトグラフィ後の質量スペクトロメトリ法
のいずれかを含む。クロマトグラフィ構成要素は、C4、C8、C18、または
同様の分離体系を使用する逆相分離を含む。100%水性から開始され70〜1
00%有機性(例えばアセトニトリルまたはメタノール)に至る勾配溶離プロフ
ィールが利用され、ペプチドはオフラインで分別して収集されるか、若しくは適
切に設計された質量スペクトロメータのソースに直接溶離する。C18またはC
8カラムの代表的な勾配は、100%溶媒Aから開始され、70分で100%溶
媒Bに至る直線勾配である(溶媒A=0.1%トリフルオロ酢酸(TFA)のH
2O、溶媒B=0.8%TFAの70%アセトニトリル/30%H2O)。質量
スペクトロメータにとってTFAが望ましくない場合は、TFAの代わりにギ酸
を使用できる。
【0066】 オフラインHPLC分離では、Eldex MicroPro HPLCを用
いることができ、1μl/分で動作するMichrom MAGIC MS逆相
カラム(0.2×50mm)を取り付けることが好ましい。あるいは、有する材
料の量および望まれるペプチド分離の度合いに応じて、高い充填容量を有するL
C Packing Fusica II逆相カラム(0.3×150mm,5
mL/min)を使用してもよい。いずれの場合においても、A=0〜1%TF
A/水およびB=70%アセトニトリル内の0.08%TFAである勾配プログ
ラムは、10%溶液B/90%溶液Aから60分で90%溶液B/10%溶液A
に至る。ペプチドは、LC PackingsキャピラリZ−セルを取り付けた
ABI785A UV検出器により、210nmで検出され、その後のMS分析
のためにエッペンドルフ管または直接プレート上に収集される。
【0067】 架橋ペプチドの検出に最適なMS器具がいくつか存在し、その一部としては、
1)個々のHPLCフラクションがオフラインで最初に分離されるマトリクス補
助レーザ着脱イオン化(MALDI)飛行時間型(TOF)器具、2)オンライ
ンHPLCによる電子スプレーイオン化(ESI)直交TOF質量スペクトロメ
ータ、および/または3)同じくオンラインHPLC検出によるESIイオント
ラップ器具が含まれる。さらに他の方法は、本開示を読むことで当業者に明らか
になる。
【0068】 この質量決定においては、いくつかの重要な考慮事項が存在し、これには全体
的な質量精度、検出の動的範囲、および質量範囲が含まれる。一般には、架橋ペ
プチドの確認に関して解釈の可能性を制限することが可能になる100ppmよ
り優れた質量精度が望ましい。実施においては、適切に内部調整された多くのM
S器具によって、10ppmまでまたはこれより優れた質量精度が達成できる。
この高いレベルの質量精度に基づいて、容易にペプチド(およびペプチド架橋)
の割り当てができるため、これは非常に望ましい。タンデムMS実験を選択した
ペプチドイオンに関して実施し、追加断片情報(「配列タグ」)を得ることが可
能であり、これはその後ペプチドのアイデンティティの立証および/または架橋
に含まれる正確なアミノ酸位置の割り当てに使用される。
【0069】 本発明の一実施形態は、好ましくは、飛行時間型(TOF)質量スペクトロメ
トリ器具の使用により、架橋ペプチドのアイデンティティを決定する。TOF質
量スペクトロメトリ法では、精製したイオンが検出器に移動する時間を測定する
ことで、質量対電荷(m/z)比率に従ってイオンを分離する。TOF質量スペ
クトロメータは、事実上無制限の質量対電荷比率範囲を有する比較的単純で安価
な器具であるため、本発明において有利である。TOF質量スペクトロメータは
、各イオン化イベントで生成されたすべてのイオンを記録できるため、走査型器
具より潜在的に高い感度を有する。TOF質量スペクトロメータは、従来の磁場
質量スペクトロメータでは感度が不足する大きな有機分子の質量対電荷比率を測
定するのに有効である。本発明で使用可能なTOF質量スペクトロメータの例は
、米国特許第5,045,694号、第5,160,840号、および第5,6
27,369号に示されており、これらは特に参考としてここに取り入れている
【0070】 質量スペクトロメータの性能は、質量分解度によって部分的にのみ定められる
。他の重要な特性は、質量精度、感度、質量体電荷比率、および動的範囲である
。全体的な性能を定める種々の要素の相対的な重要性は主に標本の種類によって
変化するが、特定の応用に関して十分な性能を得るために、いくつかのパラメー
タを指定し、同時に最適化する必要がある。こうしたパラメータは、本発明の方
法における最適な分解度に関して変化し、これは本開示を読むことで当業者にと
って明らかとなる。
【0071】 MALDI質量スペクトロメトリ: マトリクス補助レーザ着脱/イオン化法(MALDI)は、100,000D
a分子質量を超える大きな生体分子について、完全な状態を維持しながら脱着お
よびイオン化を容易にするため、特に生物学的応用において有利であり、したが
って本発明の方法における使用にも有利である。そのため、好適な一実施形態に
おいて、MALDI質量スペクトロメトリ手法が使用される。MALDIにおい
て、イオンは一般に、表面を離れた後で実質的な平均速度を有し、これはあらゆ
る質量のイオンの大部分において同じであり、平均速度の周囲には大きな幅があ
る。この平均速度は、飛行時間と質量のルートとの間の非線形関係につながる。
この幅は、低い質量分解度につながるが、個々のイオン質量の信号を測定すると
きには、質量分解度を改善する方法が存在する。飛行時間を質量に転換する関係
を、ここでは簡略化のために「質量スケール」と呼ぶ。
【0072】 MALDI質量スペクトロメトリ法の他の修正事項も報告されており、オプシ
ョンとして本発明の方法において使用することができる。レノン等の第42回質
量スペクトロメトリ法および関連事項に関するASMS会議議事録(Proceeding
s of the 42nd ASMS Conference on Mass Spectrometry and Allied Topics)、
1994年5月29日−6月3日、イリノイ州シカゴ、501ページにおいて、
研究者は、改善された分解度、および小さなタンパク質の迅速な断片化について
報告している。さらに、ブルーカ等の第13回国際質量スペクトロメトリ法会議
(13th International Mass Spectrometry Conference)、1994年8月29
日−9月3日、ハンガリ、ブダペストにおいて、研究者は、パルスイオン抽出を
用いるコンパクトなMALDI器具で小さな合成ポリマを測定する際の大幅な分
解度の向上を報告している。加えて、レイリ等のラピッドコミュニケーション(
Rapid Commun.)、質量スペクトロメトリ法、8、1994年、865−868
および、コルビ、ラピッドコミュニケーション(Rapid Commun.)、質量スペク
トロメトリ法、8、1994年、865−868において、研究者は、パルスイ
オン抽出MALDIソースによる小さなタンパク質に関する質量分解度の大きな
改善を報告している。
【0073】 最初の運動エネルギの分散による影響を補うために、イオンリフレクタ(イオ
ン鏡またはリフレクトロンとも呼ばれる)を使用できる。イオンリフレクタは、
自由飛行領域の端部に配置される。イオンリフレクタは、一つ以上の均一な、抑
制の静電フィールドを含む。イオンは、リフレクタに入ると、この静電フィール
ドに関して、フィールドの方向の速度要素がゼロになるまで減速させられる。そ
の後、イオンは、進入したエネルギと同一のエネルギでリフレクタから出るが、
速度の方向は反対になる。大きなエネルギを有するイオンは、リフレクタの深く
まで入り、その結果、イオンリフレクタ内に長い時間とどまる。適切に設計され
たリフレクタにおいては、同様の質量および電荷のイオンが、最初のエネルギに
関係なく、同時に検出器に到着するようにイオンの飛行経路を修正する電位を選
択する。本開示を読むことで、当業者には、こうした修正および本発明の方法へ
の応用が理解されるため、こうした修正および原則も開示した技術に応用するこ
とができる。
【0074】 電子スプレーイオン化質量スペクトロメトリ: 本発明の方法において、高い質量精度(≦20〜50ppm)およびオンライ
ンHPLC/MS分析のために、いわゆる「電子スプレーイオン化」(ESI)
質量スペクトロメトリ法が使用される。電子スプレーイオン化においては、通常
は伝導性のキャピラリニードルによって、(複数の)アナライトを含む液体に電
位が加えられる。溶液内のアナライトは、約75〜100μmの内径を有する伝
導性のニードルから、例えば3000Vの高電圧で、接地電位ないし質量スペク
トロメータの入口につながる約300Vの間の電位の伝導性アパーチャプレート
に向けて噴霧される。若しくは、同程度で極性が反対の高電圧を、質量スペクト
ロメータの入口アパーチャに加えてもよい。高電界においてイオンが生成され、
その後これが質量スペクトロメータで分析される。
【0075】 ESIでは、周囲と同じ温度および圧力で、過度な断片化を起こさずに、溶液
中のアナライトを気相イオンに直接転換できる。ESI質量スペクトロメトリ法
は、極性またはイオン性の不揮発性化合物の分析に適している。ESIが、高速
原子衝突またはサーモスプレー等の他のソフトイオン化手法より有利な点は、多
重電荷種の形成であり、このためESIは高分子重量(1,000,000Da
)の生体分子およびポリマの分析に適している。フェン等の「電子スプレーイオ
ン化−原理および実施」、Mass Spectrom. Rev. vol.9,pp.37-70(1990)を参照さ
れたい。電子スプレーのメカニズムの全般的な背景については、P・ケバール等
のAnal. Chem.65:972A-986A(1993)を参照されたい。
【0076】 この実施形態に関して、ESI−TOFは、好ましくはキャピラリHPLCカ
ラムに取り付けたアプライドバイオシステムズ140BシリンジポンプHPLC
システムと結合するマリナESI−TOF質量スペクトロメータを使用して実施
される(10〜15cm毎のフシカ200〜300μI.D.、C18またはC
14パッキング)。0.1%ギ酸のH2O(溶媒A)および0.055%ギ酸の
5/2(v/v)のエタノール/プロパノール(溶液B)を含む勾配溶媒が利用
され、10%〜60%Bで70分間行われる。
【0077】 構造モデリング: 構造モデリングに使用する計算機戦略は、種々の計算機手法を用いる、折り畳
みファミリー、ドメイン・ドメイン形状、および/または三次元構造の決定のた
めの実験的ペプチド断片データからの目標アミノ酸対間の、あらゆる実験的距離
制約条件を利用する。多くの制約の限界の中で、構造は、距離架橋を用いて、直
接生成される。同じ手法は、全長構造内でドメインを配向させるために、オリゴ
マー内でモノマー間の相互作用を決定するために、または受容体・リガンド複合
体を定義するために用いることもできる。そのような解析の組み合わせは、タン
パク質の三次元構造の構造モデリングを作るであろう。図12を参照。そのよう
な解析は、三次元ソフトウェアの助けを借りて行うのが望ましい。
【0078】 構造モデリングは、架橋のない、修飾された、または架橋した核酸配列、ペプ
チドまたは異常アミノ酸を有する偽ペプチド配列、オリゴ糖、または定義された
配列の他のポリマーの研究に拡張可能である。望ましくは、ソフトウェアは、一
価の(親和性ラベル)試薬、ホモ二価架橋剤、ヘテロ二価架橋剤、および3以上
の結合価を有する架橋剤を含む、種々の異なる化学的または光化学的な架橋剤を
、既知の化学的最終生産物に含ませることができる。
【0079】 一組の構造モデルが一旦対象の配列として作られると、それらは、実験由来距
離制約条件とのそれらの整合性に基づいて、および/または、それらの計算され
た物理的性質に基づいて計算可能である。モデルの制約条件との整合性は、その
モデルに伴う制約条件誤差および、そのモデルにより定義される制約条件の数の
関数である。例えば、これらの制約条件は、位置合わせ、X線結晶解析、または
NMRによって定義される領域における結合性残基である。その物理的性質に基
づくモデリングの評価には、疎水的/親水的アミノ酸分布の計算、その水素結合
ネットワーク地図の作製、ジスルフィド結合の位置決定、突然変異データの機能
地図作製、そのモデルの二次構造の相補性および配列から予想される二次構造の
評価、重要な静電気的相互作用が維持されていることの確認、ファンデルワール
ス衝突部位の同定、配列・構造・配列類似性の評価、またはそれらの組み合わせ
が含まれる。
【0080】 少なく生成された架橋(アミノ酸残基数の約10%)でさえ、未知の構造の配
列に関する折り畳みファミリーを決定することができる。折り畳みの認識のため
の重要な理論的跳躍には、すべての可能なタンパク質構造の空間の集中的解析が
含まれる。構造計算は、対象とする配列に関して、ありそうな候補である空間に
おける、それらの構造に限定される。
【0081】 従って、折り畳みファミリーの決定には、代表的タンパク質構造ライブラリで
、対象とする配列のスレッディングをすることによって仮想構造モデルを作り、
架橋データ組から得られる距離制約条件の適用によるモデルの評価が含まれる場
合もある。もし、あるモデルが、低い制約条件違反を有することがわかった場合
、このモデルは、さらなる類似性モデリング研究のための良い候補であると考え
られる。その解析のための第一ステップは、問題の配列についての一組の構造モ
デルの作成である。構造モデルは、一組の既知のタンパク質構造のスレッディン
グをし、制約されたエネルギ最小化または分子動力学のような、距離幾何学また
はab initio法を用いて新たに構造を計算することによって作ることができる。
構造モデルは、二次構造予測法、配列におけるモチーフ、類似性モデリング、ま
たは、これらの組み合わせおよび本明細書を読めば本技術を熟知する者には明白
な他の方法によっても作ることができる。
【0082】 距離幾何学プログラムは、本発明の方法では特に有用である。距離幾何学は、
一組の(NxN)・N距離限界を、これらの限界と整合する一組の3xNデカル
ト座標に変換する一般的な方法である。そのような距離幾何学プログラムの一つ
DGEOMは、カリフォルニア州エメリービルのカイロン社から入手できる分子
モデル構築および立体配座解析用距離幾何学プログラムである(Havel et al.,
J. Theor. Biol. 104:359-81(1983); Havel et al., J. Theor. Biol. 104:383-
400(1983))。分子構造は、物理的制約条件および断片同定を用いて作られる原
子間距離の全ての組によって記述可能である。DGEOMのような距離幾何学プ
ログラムを用いて、以前予測されたより、はるかに少ない物理的制約条件を用い
て中程度の解像度の構造を作ることができる。
【0083】 モデル作成の多くの方法のどれも、全体の方法のこのステップで適用可能であ
る。ここで述べる位置合わせ法は単なる例にすぎず、距離制約条件と整合する構
造を推定するために、他の方法を用いてもよい。本発明の方法で特に有用な2つ
の戦略は、制約されたスレッディングおよび制約された配列/構造位置合わせで
ある。他の可能な方法には、動的プログラミングおよびクリーク検出が含まれる
【0084】 制約されたスレッディング手順の第一ステップは、配列ユニークタンパク質の
データベースによって配列のスレッディングをすることによって、一組の構造モ
デルを作ることである。そのような構造モデルを作るために、本方法では、種々
のソフトウェアプログラムが利用できる。例えば、FGF−2について、これら
のモデルを作るために我々が用いた特殊なプログラム(FGF2・BOVIN)
は、公共領域ソフトウェア123Dである(Alexandrov et al., "Fast Protein
Fold Recognition via Sequence to Structure Alignment and Contact Capaci
ty Potentials." Protein Science Bulletin (1996))。このプログラムには、
タンパク質の配列を入力すること、位置合わせモードを決定すること、およびソ
フトウェアアルゴリズムにモデルを作らせることが含まれる。大域的位置合わせ
では、全ての位置が考慮される。自由シフト位置合わせでは、初めおよび終わり
の隙間は得点されない。局所的位置合わせは、最大共通部分列位置合わせである
。これらの位置合わせモードのどれについても、プログラムは、最大得点位置合
わせの、ある数を与える。このプログラムのあるバージョンは、httpサイトcart
an.gmd.deでオンライン接続可能である。そのタンパク質配列、例えばFGF−
2配列、に最も相補的であると123Dが考える構造モデルを次に、我々の方法
における次のステップ、モデル評価ステップに進める。上位20のスレッディン
グモデルを、次式を用いて、実験に由来する制約条件との整合性に関してさらに
調べることができる。
【0085】
【数2】
【0086】 式中、Etは全制約条件誤差、iは距離制約条件の数、d0は組距離分離、d
jは制約条件jでの2つの残基について構造によって定義される組距離。このよ
うに、djは候補のスレッディングモデルで観察される距離である。もしdjが
リンカーアームの長さで定義される距離d0より小さいか等しければ、制約条件
jが寄与する制約条件誤差は存在しない。もしdjがd0より大きければ、制約
条件誤差は、これらの距離間の差によって定義される。制約条件誤差の計算に関
するこれらの関数の形は例示のためのものであり、本技術に習熟する者が、本明
細書を読めば明らかなように、他の集計関数もまた使用可能であろう。
【0087】 不自然に低い制約条件誤差を有するモデルを考慮することを避けるために、組
制約条件の50%を有する配列構造モデルだけを一般に評価する。次に上位20
のスレッディングモデルを制約条件誤差が増える順にランク付けする。制約され
たスレッディング方法について、モデル作成ステップの部分として、物理的性質
の評価を実施する。例えば、123Dスレッディングポテンシャルには、配列構
造類似性に関する項が含まれる。この方法におけるモデル評価ステップは、実験
に由来する制約条件に対する、各モデルの相補性を測定することに集中する。
【0088】 制約されたスレッディング過程の一例が、図13の流れ図1301に、より詳
しく説明されている。既知の立体配座および折り畳みまたは領域情報を有する一
組のタンパク質構造を、ブルックヘブン・タンパク質データベースのようなデー
タベースから選ぶ。それぞれの選ばれたタンパク質に属する情報には、一次配列
、二次構造および各残基の立体位置が含まれる。次に、解析中のタンパク質の一
次構造を、それぞれの選ばれたタンパク質構造にスレッディングする。言い換え
れば、考慮中のタンパク質の骨格を、現在選んでいるタンパク質の骨格の上に置
く。考慮中のタンパク質を、ある選ばれたタンパク質で位置合わせした後、その
選ばれたタンパク質の得点を集計する(1305を参照)。もし例えば、公共領
域ソフトウェア123Dを用いれば、そのソフトウェアは、(1)2つのタンパ
ク質間の配列の同一性、(2)2つのタンパク質間の二次構造の位置合わせ、お
よび(3)そのスレッディングされた形でのタンパク質の接触容積ポテンシャル
に基づく得点集計を行う。第二の得点集計基準には、一次配列に基づいてタンパ
ク質の二次構造を推定することが含まれる。第三の得点集計基準には、あるアミ
ノ酸残基の局所的環境(隣接するアミノ酸)が、その実験的に求められた好まし
い環境と、どの程度密接に一致するかに基づく。他のソフトウェアプログラムお
よび他の得点集計基準(例えば、疎水性、潜在的平均力)を使用することができ
る。典型的な具体例では、次に、上位20の候補となる構造を計算プロセスの次
のステップで使用する。
【0089】 1307で、上位の候補は、カリフォルニア州エメリービルのカイロン社から
入手可能なDGEOMのようなコンピュータプログラムによって三次元座標に変
換された残基を有する。距離制約条件情報を、上述の式に従って各候補構造に適
用する(1309を参照)。次に候補構造は、その式への適合に従って再びラン
ク付けされる(1311を参照)。
【0090】 制約された配列/構造アライメント 制約条件リストの情報内容を調査するために使用可能な、もう1つの方法は、
制約された配列/構造アライメントである。この「制約された配列/構造アライ
メント」法は一組の構造モデルを構築するために制約条件を使用し、モデル評価
ステップは、各モデルに組疎水性接触ポテンシャルを適用することと、このポテ
ンシャル関数に基づいてモデルをランク付けすることから成る(Bryant et al.,
"An Empirical Energy Function for Threading Protein Sequence Through th
e Folding Motif," Proteins, 1993, 16:92-112)。この方法では、その折り畳
みへの位置合わせは、アルファ炭素の原子間距離が延ばされた架橋と側鎖原子の
合計(BS3結合剤の場合23.85Å未満)より小さい折り畳みの残基への制
約条件によって結合される標的タンパク質の残基を対称的に一致させることによ
って定義される。
【0091】 次に、タンパク質配列を、配列の最初に一致する残基から戻って最初の残基へ
、または、その折り畳みの最初へ、最初に一致した残基から前へ、そして対称的
に第二から戻り、そして二番目に一致した残基から前へ折り畳み作業上にマッピ
ングすることができる。例えば、マッピングした残基に関する制約条件の全リス
トにわたり、1つの挿入/欠失と2Åの平均誤差で、FGF−2の146残基内
の115残基以上が決定された。Bryantら(1993)によって定義された組疎水接触
ポテンシャルを用いて位置合わせの得点集計が可能であり、それぞれの折り畳み
について得られた最良の得点は、その折り畳みをランク付けするために保存され
た。
【0092】 次に、制約された配列/構造位置合わせの、もう1つの具体例を流れ図でより
詳細に説明する。この具体例のステップは、図13で説明したステップとは少し
異なるが、この具体例は、図2の一般的方法の概要と一致する。この具体例では
、距離制約条件は、MSデータを用いる上記の具体例と同様に作られる(図2の
203,図5のすべてを参照)。これらの距離制約条件は、ブルックヘブン・タ
ンパク質折り畳みによってスレッディングされながら、そのタンパク質の一次配
列に適用され、候補となる構造を作る(205を参照)。次に、適当な得点集計
関数を用いて、候補となる構造の得点集計がなされ、再びランク付けされる。特
殊な具体例では、Bryantら(1993)の接触容積ポテンシャルを含む得点集計関数が
用いられる。この具体例で使用する得点集計関数は、その論文に記述されている
。次に、下に述べる類似性モデリングを実施する(図14A、14B、および2
07を参照)。
【0093】 再ランク付けの後、次に、上位にランクされた構造の類似性モデリングを行う
。初めに、(その一次構造に由来する)タンパク質の二次構造を、モデル化して
いる構造の基礎となるブルックヘブン・タンパク質の二次構造と矛盾しないよう
にしなければならない。この一例を図14Aに示す。図14Aは、ブルックヘブ
ン折り畳み1405と比べて、配列1403に「隙間」がある、解析中のタンパ
ク質1401を示す。類似性モデリング・ソフトウェアは、そのタンパク質の最
小エネルギ立体配置を維持するように、この隙間の周りに残基を集める。逆に、
図14Bに示すように、もしタンパク質1407が、ブルックヘブン・タンパク
質1411と比べて余分な残基1409を有するならば、そのソフトウェアは、
その最小エネルギ立体配置も維持するループを作ることができる。また、類似性
モデリング・ソフトウェアは、その構造のエネルギ立体配座を最小にするように
残基および部分基の方向を変えることができる。本発明で使用する類似性モデリ
ング・ソフトウェアの例には、ミズーリ州セントルイスのトリポス社のSyby
lおよびカリフォルニア州サンフランシスコのカリフォルニア大学のコンピュー
タ・グラフィックス研究所のMidasがある。
【0094】 類似性モデリング 両方のモデル作成方法において、実験的制約条件に最も相補的なモデルを、類
似性モデルの構築のための出発点として選ぶ。スレッディング位置合わせを、そ
の配列におけるアミノ酸を、その構造における位置に合わせるために使うことが
できる。他の位置合わせ手順もまた使用できる。次に、標準的な類似性モデリン
グ技術を用いてモデルを構築することができる。さらに、そのモデル内の距離制
約条件違反の助けにより、そのモデルをさらに洗練させる。モデルの洗練は、距
離幾何学、エネルギ最小化、および/または分子動力学を用いて実行できよう。
【0095】 実施例: 以下の実施例は、本技術に通常の技能を有する者に、本発明を作り使用する方
法の完全な開示および記述を提供するためのものであり、発明者が自分達の発明
であるとみなすものの範囲を制限するためのもではなく、以下の実験が実施した
全ての実験であると示すためのものでもない。用いた数字(例えば、量、温度、
等)に関して正確さを確認する努力はしたが、いくつかの実験誤差および偏差を
考慮すべきである。特に断らない限り、部は重量部、分子量は重量平均分子量、
温度は摂氏、そして圧力は大気圧または大気圧に近い。
【0096】 以下に記述する本発明の方法は、本技術で予測されていたより、ずっと少ない
物理的制約距離、一般に、タンパク質のアミノ酸残基数の約10%を用いて中程
度の解像度の構造(2〜5Å)を与えることがわかった。この予想外で驚くべき
結果により、本発明の方法によって、この方法を用いないで予想した場合より良
い解像度の構造を作ることが可能になった。さらに、予想より短い時間で、合理
的な構造が作られるであろう。
【0097】 実施例1:確認実験 対象とするタンパク質の三次元構造を構築するために要求される組距離制約条
件の数および型を、分子間架橋技術を実施する前に予測した。七つの異なる制約
条件の型を、距離幾何学を用いて、BPTI、α・ブンガロトキシン、パルアル
ブミンα、サイクロフィリンA、FGF−2の五つのタンパク質の構造の計算に
適用した。各タンパク質について、それらの制約条件に矛盾しない10の構造の
組み合わせを作った。
【0098】 正確な残基間結晶学的距離を用いて作られた構造は、不正確な距離から計算さ
れた構造より高い品質を有していた。結晶構造からRMSDにより測定した最良
品質の構造は、極性極性アミノ酸結晶学的距離、二次構造由来制約条件、および
ジスルフィド結合情報を用いて計算されたものである。特にBPTIの構造は、
3つのジスルフィド結合により課される厳しい制約条件のために、2.72Åの
RMSDで容易に計算できた。逆に、サイクロフィリンA混合物は、ジスルフィ
ド結合がなく、その組で最大のタンパク質(165残基)であるので、最も挑戦
的な試みであることが判明した。
【0099】 二次構造情報に基づく制約条件の追加は、それぞれ100%および28%のα
ヘリックスであるパルアルビミンおよびBPTIについて最も劇的であったが、
一般にRMSDを下げる。サイクロフィリンA、FGF−2、およびαブンガロ
トキシンの組の他のタンパク質を、すべてβ構造であると仮定してSCOPによ
って分類した(Murzin et al. "SCOP: a Structural Classification of Protei
ns Database for the Investigation of Sequences and Structures." J. Mol.
Biol. 1995 Apr 7, 247(4):536-40)。αヘリックスの構造を正確に定義するた
めには、延びた構造より多くの制約条件が必要であるので、らせんシステムでは
二次構造は、最終RMSDを下げる。
【0100】 不正確な制約条件から計算された構造もまた、制約条件の数に応じて品質に影
響を与えた。もし各アミノ酸について、他の全てのアミノ酸が、接触している(
<10Å)または接触していない(>10Å)と分類できれば、得られるDG生
成構造は、結晶学的構造から平均で2ÅRMSD未満である。この結果は、Have
lら(1979)の結果と一致する。
【0101】 もしこの近接情報を、極性残基間の相互作用についてだけ定義すれば、制約条
件の総数が、ほぼ1/16に落ちる時、計算された構造の品質は、かなり低下す
る。極性・極性相互作用に関する非接触情報をさらに取り除いても、その組の小
さいタンパク質についてのRMSDを劇的には増やさなかった(即ち、59残基
を有するBPTIおよび74残基を有するαブンガロトキシン)。しかし、2つ
の最も大きいタンパク質FGF−2(146残基)およびサイクロフィリンA(
165残基)については増加が最大であった。
【0102】 実施例2.FGFモデル研究 FGF−2の三次元タンパク質構造を、FGF−2にBS3架橋剤を用い、そ
の後RPLC分離およびMS分析(共にMALDIおよびESI)を行って決定
した。FGF−2はヘパリンが存在しなければ弱く自己会合するだけであり、高
い塩基性(正味の電荷=+11)で、約10%のリジンを含む一次配列を有する
ので、BS3分子間架橋のためには、最適に近いシステムである(Venkataraman
et al. "Preferential self-association of basic fibroblast growth factor
is stabilized by heparin during receptor dimerization and activation."
Proc. Natl. Acad. Sci. USA. 1996 Jan 23, 93(2):845-50)。ホモ二官能性架
橋剤BS3は、スペーサアーム(長さ11.4Å)として六炭素アルキル鎖を有
するリシン・リジン架橋剤であり、生理的pHで一級アミンと反応し安定な生成
物を作る2つのNHSエステル基を有する。BS3の加水分解の半減期は、pH
7.0で4〜5時間である。NHSエステルの加水分解は、一級アミンとの反応
と競争し、従って、反応生成物には、a)一方の端は加水分解され(片末端が未
結合の架橋剤)、156.08Daの質量が増え、タンパク質に共有結合したB
S3の一端、およびb)138.08Daの質量が増え、BS3と架橋した2つ
のリジンの混合物が含まれる。架橋したペプチド:修飾されたペプチドの比にお
ける、ここの結果で説明した反応の記述は、約1:1であった。
【0103】 化学架橋: 化学架橋を非常に低いタンパク質濃度(5μM)で行い、タンパク質に対する
架橋剤の比を20:1とし、タンパク質当たり平均1つのリジン−リジン架橋を
行わせた。その主な理由は、天然のタンパク質では不可能な架橋を作るタンパク
質三次元構造の重大な歪み(偽りの距離制約条件)を避けることである。タンパ
ク質当たり1つの架橋は、三次および四次構造を歪ませないことが、結晶構造で
示された(Haniu et al. "Recombinant human erythropoietin (rHuEPO): cross
-linking with disuccinimidyl esters and identification of the interfacin
g domains in EPO." Protein Sci. 1993 Sep, 2(9):1441-51)。単純な単一部位
の修飾は、望む二部位架橋より、構造全体に、かなり小さな歪みしか与えないよ
うである。もし修飾の50%が架橋による場合には、タンパク質当たり形成させ
る平均の架橋は約1である。
【0104】 発現系から1mg/mlのFGF−2タンパク質を得、100mM HEPE
S pH 7.5、1M NaClおよび1 mM EDTAを含む反応緩衝液
中で4℃で一夜透析した。新たに調製した架橋剤にDTT(最終濃度10 mM
)を加え、この溶液を、複数のタンパク質含有反応緩衝液に加えた。用いた架橋
剤は、ホモ二官能性架橋剤スベリン酸ビス[スルフォスクシニミジル](BS3
)および酒石酸ジスルフォスクシニミジル(スルフォ・DST)(イリノイ州ロ
ックフォード、ピアス社)で、FGF−2タンパク質(5μM)に対して20倍
モル過剰の架橋剤(100μM)を用いた。この反応は、室温で1〜24時間行
い、1Mトリス塩酸pH8.0を10mMまで加えることにより反応を止めた。
いくつかの場合には、架橋したFGF−2を、8M尿素で変性させ、50mM
IAMを加えることによってシステイン残基を保護した。ゲル濾過精製およびタ
ンパク質分解の前に、変性したFGF−2を、4℃で、Centriprep
10で濾過することにより濃縮した。
【0105】 ゲル濾過クロマトグラフィ: 架橋の後、FGF−2の単量体および二量体を分離するために、ゲル濾過クロ
マトグラフィ(SEC)を行った。化学架橋は、理論的には、分子内架橋(1つ
のタンパク質上の2つの架橋したアミノ酸)と分子間架橋(相互に架橋した2つ
のタンパク質)の両方を起こし得る。架橋したFGF−2の単量体と二量体を分
離するために、TosoHaas G2000(2.0×60 cm)を付けた
ギルソンHPLCシステムを用いて変性条件下でゲル濾過クロマトグラフィを行
った。カラムは、100mMクエン酸緩衝液(pH5.0)、8M尿素、および
1mM DTT、流速1ml/minで平衡化した。単量体および二量体タンパ
ク質の画分を集め、4℃でCentercon 10濾過で濃縮した。非変性S
ECは、二本のBio・Silect SEC 125・5カラム(300×7
.8mm)を用いて行った。カラムは、100mM重炭酸アンモニウムpH7.
0で平衡化した。溶出は、1ml/minでKratos Spectrofl
ow 783吸光度検出器で分光学的にモニターした。
【0106】 タンパク質試料から二量体のSEC分離を行った後、積み重ね手順に従って、
試料を、15%ゲルを用いるSDS・PAGEにかけた(Laemmli "Cleavage of
structural proteins during the assembly of the head of bacteriophage T4
." Nature 1940 Aug 15, 227(259):680-5))。ミオシン(209kDa)、β
ガラクトシダーゼ(125kDa)、BSA (70kDa)、炭酸脱水酵素(
42.8kDa)、大豆トリプシン阻害剤(32.6kDa)、リゾチーム(1
7.6kDa)およびアプロチニン(7.5kDa)の各分子量のタンパク質を
含む予め染色した標準タンパク質混合物は、Bioradから購入した。
【0107】 キャピラリーHPLCおよびMALDI−TOF,PSD質量スペクトロメトリ
: 架橋したFGF−2を分析するために、単量体画分をトリプシンで消化した。
トリプシン消化は37℃で行い、トリプシン/タンパク質の比を1:20とした
。16時間後、その消化液に再度トリプシンを加え(トリプシン:タンパク質の
比は再度1:20)、37℃で2時間インキュベーションを続けた。PMSFを
5mMまで加えることにより酵素反応を止めた。得られるペプチド混合物は、未
修飾および修飾ペプチドを含んでいた。修飾されたFGF−2トリプシン消化物
のクロマトグラム(図16)は、非修飾FGF−2のクロマトグラムとはかなり
異なり、修飾されたペプチドの存在が示唆された。陰をつけたピークは、Thr
121・Lys129に結合したTyr73・Lys86等の、いくつかの架橋
したペプチドを含む、ある選ばれた画分であり、正確な質量m/z=2739.
4を有する。そのMALDIおよびPSDスペクトルを図17および図18にそ
れぞれ示す。ラベルされたピークは、質量スペクトロメトリによって、架橋した
ペプチドであることが後で同定された。BS3架橋剤アームは疎水性であるから
、架橋したペプチドは、すべて、勾配の後の部分に出てきた。
【0108】 架橋したペプチドの同定は、オンラインLC/MSまたはオフライン逆相キャ
ピラリHPLCで行い、後の場合には、画分を集めた。架橋したFGF−2混合
物の質量は、カリフォルニア州フォスター市のパースペクティーブ・バイオシス
テムズ社から購入したVoyager DE・STR MALDI・TOFで測
定した。この装置は、窒素レーザー(337nm)、遅延抽出光学および20k
Vの加速電圧を使用した。すべての場合、ペプチド画分はアセトニトリル/メタ
ノール(1:1; v/v)中33mMのα・シアノ・4・ヒドロキシ桂皮酸と
混合し、金メッキしたMALDI標的上で風乾させた。限られた配列情報を得る
ために、選ばれた架橋ペプチドのプロトン化イオン(MH+)から、後源崩壊(
PSD)スペクトルを得た。PSDの説明に関しては、Kaufmann et al. "Mass
spectrometric sequencing of linear peptides by product-ion analysis in a
reflection time-of-flight mass spectrometer using matrix-assisted laser
desorption ionization." Rapid Commun. Mass Spectrom. 1993 Oct, 7(19):90
2-10を参照。PSD実験は、電圧が9〜11ステップ変えられる一組の反射レン
ズを通して、各ステップで電圧を前のステップの75%まで下げながら焦点を合
わせた後、前駆体ペプチドイオンを選択的に飛び出させ、その準安定断片を解析
することにより行った。完全なPSDスペクトルは、個別に焦点を合わせた断片
を一緒にステッチすることによって作った。PSDモードでの質量校正は、標準
ペプチドACTH 18・39由来の断片イオンを用いて行った。(非修飾FG
F−2と比べて)約250Daの平均質量シフトを有する広いピークが観察され
た。
【0109】 ペプチド内(K46・K52)およびペプチド間(K26・K46)架橋の割
当ては、18の架橋のそれぞれが、どのように割り当てられたかの典型的な例で
ある。図17は、トリプシン消化物からの画分の1つのMALDI・TOFスペ
クトルを示す。各スペクトルは、近似的外部標準を用いて校正された。各スペク
トルについて、質量リストが作られ、本発明の計算機上の特徴で上述したように
、手作りのソフトウェアASAPを用いて質量の割り当てを行った。簡単に言え
ば、このプログラムは、特定の酵素での、あるタンパク質の予測された断片化に
基づいて架橋したタンパク質断片を同定することができる。
【0110】 3つのトリプシンペプチドが割り当てられた。1つのペプチド内架橋および1
つのペプチド間架橋は、この特定の画分での誤差が100ppm以内。その3つ
のトリプシンペプチドは同定が容易である。質量は、ペプチド27N・33R
(M+H+=810.49)、111Y・119K (M+H+=1116.6
33)および110K・119K (M+H+=1224.73)に一致する。
イオンm/z 2059.05がペプチド内架橋であると同定された。このイオ
ンの全質量は、ペプチド45E・60Rの質量(M+H+=1921.00Da
)と架橋剤アームの質量(138.08Da)の和である。このペプチド(EK
SDPHIKLQLQAEER)には2つの内部リジンしかないので、リジン4
6は恐らくリジン52と架橋しているであろう。この割り当ては、MALDI・
SPD(後源崩壊)実験(図19a)によって確認された。低分子領域では、P
/R、G/K、H、E、I/Lのアミノ酸アンモニウムイオンが観察され、この
ペプチドのアミノ酸組成を与えた。3つのN末端断片(m/z 1074、m/
z 1187、m/z 1315)および3つのC末端断片(m/z 988、
m/z 874、m/z 746)は、ペプチドの割り当ておよび架橋の位置と
一致した。PSDデータは、このように、リジン52と架橋したリジン46を有
するペプチド45E・60Rとしてイオンm/z 2059.05という我々の
割り当てを確認した。
【0111】 イオンm/z 2465.31は、ペプチド間架橋として割り当てられた。全
質量は、2つのトリプシン消化ペプチド23L・33R(M=1316.66
Da)、45E・52K(M=952.487 Da)、架橋剤アーム(M=1
38.083 Da)、および1つのプロトンの合計である。表面ラベル化実験
(データは示さず)から、NHSエステルによって修飾されるリジンは、トリプ
シンによって認識されず、切断されなかった。これは、C末端リジン52が、修
飾部位にはなり得ないことを示す。従って、唯一の可能性は、リジン26とリジ
ン46間の架橋である。選ばれた親イオンm/z 2465.31(図19b)
は、低分子量領域において、P/R、K、H、R、F、およびYに対するアンモ
ニウムイオンを示した。”α”はペプチド鎖23L・33Rを表し、”β”はペ
プチド鎖45E・52Kを表すために用いられる。最も多い断片イオンは、m/
z 696.4であり、y6αおよびy6βの両方に一致する。イオンm/z
1974.7は、b4βに一致する。PSDスペクトルの断片の90%が、その
割り当てに一致し、ペプチド23・33と45・52はK26・K46で架橋し
ていることが確認された。
【0112】
【表1】
【0113】 オンラインHPLC/ESI−TOF MS: いくつかのトリプシン消化物もまたオンラインHPLCおよび電子スプレーイ
オン化飛行時間(ESI・TOF)質量スペクトロメトリを用いて分析した。ペ
プチドをRP・HPLCで分離し、質量スペクトロメータのイオン源に直接溶出
させた。ESI・TOF質量スペクトルは、アプライド・バイオシステムズ75
9A吸光度検出器付アプライド・バイオシステムズ140B溶媒送達システムと
つなげたマリナー電子スプレーイオン化飛行時間質量スペクトロメータを用いて
得た。溶媒Aは、水中0.1%ギ酸。溶媒Bは、エタノール/プロパノール(5
/2)中0.05%ギ酸。濃度勾配は、70分で10%Bから60%B。
【0114】 概して、MALDI・TOFまたはESI・TOF質量スペクトロメータで1
00ppmの質量精度が達成された。内部標準を用いて、20ppmに達する、
より高い精度が達成された。全部で18の質量が、架橋ペプチドにユニークに割
り当てられた。
【0115】 制約されたスレッディング: 「制約されたスレッディング」手法が、折り畳み認識に用いられた。第一ステ
ップとして、ウシFGF−2配列(FGF2_BOVIN)を、折り畳み予測用
スレッディングプログラム123Dで処理した(Alexandrov等、1996)。123
Dプログラムは、635の配列ユニーク・タンパク質のデータベースをスレッデ
ィングする際に発見された得点上位20の配列構造位置合わせを出力した(Hobo
hrn等、1997)。FGF−2配列に関する123Dスレッディングアルゴリズム
によって発見された上位20の配列構造組を表2に示す。
【0116】
【表2】
【0117】 各組が、FGF−2配列に対する構造モデルを定義する。上位20の配列構造
組の内、3つのβ三つ葉タンパク質は、位置1(FGF−2: 4FGF)、5
(IL・1β)、および12(ヒスアクトフィリン:1HCE)である。FGF
−2構造4FGFは、組換え配列と98%以上の同一性を有し、それがスレッデ
ィングアルゴリズムによって第一位になった理由を部分的に説明している。しか
し、もし繊維芽細胞増殖因子の構造がスレッディングデータベースの中になけれ
ば、スレッディングアルゴリズムは、FGF−2の折り畳みファミリーを、D・
UTPアーゼ、βクリップタンパク質の折り畳みファミリーであると誤って予測
するであろう。
【0118】 距離制約条件に対する補正: 次に、これらの20のスレッディングモデルを次式を用いて全制約条件誤差E
tを計算することによって、我々の実験由来距離制約条件への適合を計算した:
【0119】
【数3】
【0120】 Etは全制約条件誤差、iは距離制約条件の数、d0は組距離分離、djは制
約条件jでの2つの残基について構造によって定義される組距離。このように、
djは候補のスレッディングモデルで観察される距離である。もしdjがリンカ
ーアームの長さで定義される距離d0より小さいか等しければ、制約条件jが寄
与する制約条件誤差は存在しない。もしdjがd0より大きければ、制約条件誤
差は、これらの距離間の差と定義される。23.85Åという距離は、BS3に
よって架橋された2つのリジンによって確保することができる理論的最大空間距
離である。いくつかの場合の制約条件は、結晶構造における非解像領域または配
列位置合わせにおける隙間のために定義できなかった。不自然に低い制約条件誤
差を有するモデルを考慮することを避けるために、組制約条件の50%を越える
配列構造モデルだけを評価した。上位20のスレッディングモデルを制約条件誤
差が増える順にランク付けした(表3)。
【0121】
【表3】
【0122】 結晶構造テンプレートにおける位置合わせまたは非解像領域における隙間によ
って定義される制約条件が50%未満の2つの構造モデル2PHYおよび2PL
DAを捨てた。制約条件誤差の計算の後、スレッディングアルゴリズムによって
1、5、および12位にランク付けされたβ三つ葉折り畳みファミリーに属する
ものを、表3の1、2、および4に再びランク付けした。それらは、それぞれ、
FGF−2、IL・1β、およびヒスアクトフィリンである。この場合、もしF
GF−2の構造が未知であったならば、FGF−2とIL・1βの位置合わせの
配列の同一性が13%未満であるとしても、FGF−2はIL・1βと同じ折り
畳みを有すると正しく予測されるであろう。
【0123】 三位にランクされた構造、脂肪酸結合タンパク質(1EAL)は、リポカイン
折り畳みファミリーの一員であり、β三つ葉ファミリーと多くの特徴を共有して
いる。リポカインファミリーは、曲折モチーフを有する閉じたまたは開いた樽に
よって特徴付けられる(Murzin等、1995)。β三つ葉折り畳みファミ
リーは、同様に、曲折モチーフおよびヘアピントリプレットを有する閉じた樽を
含む。脂肪酸結合タンパク質の構造は、βヘアピン挿入を有する開いた10鎖の
β樽で、47残基にわたり、3.6ÅのRMSDを有するFGF−2と位置合わ
せ可能である(Holm et al. "Protein Structure Comparison by Alignment of
Distance Matrices." J Mol Bio. 1993 233:123-38)。リポカイン折り畳みファ
ミリーの別の一員、レチノール結合タンパク質(1HBQ)は、8位にランクさ
れ、8鎖の閉じたβ樽を含む。
【0124】 制約条件誤差に基づいて、上位得点の配列構造組を再び順位付けすることは、
β三つ葉折り畳みファミリーに対して強い予測を可能にする。このファミリーの
メンバーは、リストの上位4つの地位の内3つを占める。さらに、それは、実験
データと完全に一致する構造の代表(IL・1β)を含む唯一のファミリーであ
る。FGF−2の構造が未知であったと仮定すれば、IL・1βの構造は、FG
F−2配列の類似性モデルを構築する合理的な出発点であろう。
【0125】 スペクトル割り当て: 我々の実験データの解釈での助けとなるように、質量スペクトロメトリ解析プ
ログラムが開発された。このプログラムは、SwissProt配列、質量/電
荷リスト、架橋剤の質量、最大許容質量誤差、タンパク質分解酵素、質量の型、
最大電荷状態、および最小ピーク量の入力を要求する。既知のタンパク質配列お
よびタンパク質分解の特異性に基づいて、ペプチドの仮想加水分解ライブラリを
構築する。このライブラリの各ペプチドを、単一同位体または平均質量によって
指標化する。アミノ酸修飾、ペプチド内ラベリング、および/またはペプチド間
架橋を、この仮想ライブラリに表示する。それぞれの非割り当て質量に対して、
このプログラムは、ユーザが定義した誤差閾値内の質量を有する代表例を求めて
、その仮想ライブラリを検索する。もし一致するものが見つからなければ、その
プログラムは、実験の質量の誤差閾値内の付加的質量を有する架橋可能なペプチ
ド対を求めて、そのライブラリをコンビナトリアル的に検索する。それぞれの質
量について、ASAPは、可能な割り当ておよび理論的質量と比べた各割り当て
の質量誤差を列挙する。
【0126】 類似性モデリング: リジン・リジン架橋に由来する距離制約条件情報は、一組の上位得点スレッデ
ィングモデルに存在するFGF−2の構造に似た構造に対して選択的であった。
特に、IL・1βの構造は、実験由来距離制約条件(FGF−2の次にランク)
と最も整合性があり、FGF−2(β三つ葉)と同じ折り畳みを有する。次に、
IL・1β構造に対する、FGF−2のスレッディング位置合わせを、FGF−
2の4.8Å類似性モデルの構築における出発点として用いた。
【0127】 このモデルは、IL・1β構造に対する、FGF−2配列のスレッディング位
置合わせに基づいた。図20に、類似性モデリングに使用したIL・1βおよび
FGF−2のスレッディング位置合わせを示す。このスレッディング位置合わせ
は、その類似性モデルの119のアミノ酸を定義した。この位置合わせに基づい
て構築されたモデルの全骨格RMSDは8.63Åである。もし、あまり位置合
わせされていないN末端領域を、この位置合わせから除けば、RMSDは、98
のアミノ酸にわたり、4.76Åに改善される。図21に、類似性モデリング後
の構造と、実際のタンパク質の構造間の一致を示す。このRMSDは、配列位置
合わせにおいて、平均して、1アミノ酸のフレームシフトで期待される値に等し
い。
【0128】 FGF−2とIL・1βが20%未満の配列同一性しか持たないとしても、こ
のモデルはFGF−2構造の突出した姿を捕まえる。FGF−2構造の核にある
β鎖を、正確に位置付けする。当然ながら、配列の位置合わせおよびモデリング
の誤差は主にループ領域に生じる。限られた類似性しか持たない配列では一般に
正確にモデル化することが困難な領域である(Hilbert et al. "Structural rel
ationships of homologous proteins as a functional principle in homology
modeling." Proteins. 1993, 17(2):138-51)。N末端の20のアミノ酸もまた
、スレッディングアルゴリズムによっては、うまく位置合わせされない。IL・
1βおよび4FGF構造(101残基にわたり2.7Å RMSD)のDALI
構造位置合わせによって定義される「正しい」位置合わせは、N末端領域では、
相当異なる(Holm等、1993)。FGF−2と比べてIL・1βの挿入に
より、その構造に残された隙間は、Tripos Sybyl 6.4を用いる
100ステップのエネルギ最小化によって閉じられた。結晶構造骨格へのモデル
の最小二乗偏差(RMSD)を、モデル中の等価な残基を結晶構造における残基
へ、位置合わせすることによって計算した。我々の類似性モデルに対して我々が
期待できた最低のRMSDは、この構造位置合わせに対応する。
【0129】 大抵の場合、我々は、ペプチド架橋割り当てを、個々のペプチドのPSD分析を
行うことによって、ほぼ確認したが、それは、しばしば正確な結合位置に関する
情報を提供した。次に、これらのデータを、これらのリジン残基間の一組の距離
制約条件を表にするために使用した。
【0130】 この実験データは、小さな球形のタンパク質であるFGF−2の18のリジン
・リジン架橋を、単一の実験によって、残基レベルまで分解することができるこ
とを示した。非常に保守的な残基・残基距離に変換した時、そのリジン・リジン
近接データは、FGF−2の折り畳みファミリーを正確に同定するのに充分であ
る。初めから低解像度のこのタンパク質の三次元構造を決定するには、さらに架
橋が必要であるが、FGF−2類縁体のリジン架橋の結果および既知の構造を、
FGF−2の4.8Å構造を作るために使うことができる。この技術は、大きさ
および複雑さを変えた複数のタンパク質および1mg以下のタンパク質を用いて
使用可能である。
【0131】 実施例3.HIV−1インテグラーゼ: HIV・1インテグラーゼは、亜鉛・指N末端領域、触媒核、および非特異的
DNA結合C末端領域の3つの構造領域を含む288アミノ酸のタンパク質であ
る。NおよびC末端は個別にNMRによって解析され、核領域はX線結晶解析に
よって解析されたが(Dyda等、1994;Lodi等、1995;Cai等、1997;Goldgur等、
1998)、HIVインテグラーゼの全長構造は決定されていなかった。
【0132】 BS3での分子内架橋が、全長HIV・Iインテグラーゼタンパク質に適用さ
れた。その手順は、FGF−2に用いられたものと同じ、例えば、架橋の後、ゲ
ル濾過クロマトグラフィ、タンパク質分解、およびLC・MSである。この実験
の目的はインテグラーゼの折り畳みファミリーを決定することではなく、全長構
造内の領域・領域相互作用の地図を作ることであった。そのインテグラーゼ単量
体内の3つの領域の配置を決定するためには、理論的には、9未満の領域間架橋
が必要である(領域対当たり約3)。
【0133】 1つの架橋反応は、五つの領域間架橋を作った。架橋したリジンは、K34・
K264、K42・K159、K42・K186、K42・K236、およびK
186・K236である。2つの架橋は、N末端領域/核領域架橋、二つはN末
端領域/C末端領域架橋、そして一つは核領域/C末端領域架橋である。各架橋
は、結合に関わる2つのリジン間の距離に上限を定義した。五つの架橋に由来す
る距離情報、3つの領域の構造、および領域間の隙間を橋渡しする制約条件を用
い、距離幾何学を用いて、我々は、3つのインテグラーゼ領域についてのユニー
クな配置を計算することができた。
【0134】 実施例4.CMP−NeuAc合成酵素: 未知の三次元構造を有するHaemophilusタンパク質であるCMP・
NeuAc合成酵素(CNアーゼ)の立体配座を決定するために、一組の架橋実
験もまた行った。このタンパク質は、以前に単離され、発現され、酵素機構が決
定された(Tullius et al., "Covalent modification of Lys19 in the CTP bin
ding site of cytidine 5'-monophosphate N-acetylneuraminic acid synthase.
" Protein Sci. 1999, Mar, 8(3):666-75; Samules et al., "Investigation of
the Kinetic Mechanism of Cytidine 5'-Monophosphate N-Acetylneuraminic A
cid Synthetase from Haemophilus ducreyi With New Insights On Rate-limiti
ng Steps from Product Inhibition Analysis." Biochemistry. 1999 38(19):61
95-203)。CNアーゼは、CTPとシアル酸(またはNeuAc)の反応を触媒
し、ヌクレオチド・糖供与体基質CMP・NeuAcを作り、これが今度は、感
染性細菌のリポオリゴ糖における末端ガラクトース残基にシアル酸を付加する。
シアル酸の付加は、細菌における重要な病原力機構であり、CNアーゼ酵素は薬
の開発のための潜在的に魅力的な標的である。
【0135】 CNアーゼ分子もまた、架橋剤としてBS3を用いて調べらた。架橋タンパク
質およびさらなる解析は、単一のBS3実験で六つの架橋ペプチドを同定した(
表4)。β樽タンパク質は一貫して高い得点を与えたが、スレッディング法と組
み合わせた、これらの制限されたLys・Lys距離制約条件を用いては、我々
はデータベース中のユニークな折り畳みファミリーを同定することはできなかっ
た。次に、他のホモおよびヘテロ二官能性試薬を用いるさらなる距離制約条件を
、CNアーゼの折り畳みファミリーだけでなく、3〜5Åの誤差範囲での完全三
次元構造を同定するために用いた。
【0136】
【表4】
【0137】 図22Aおよび図22Bに、本発明の具体例を実現するのに適したコンピュー
タシステム2200を示す。図22Aは、そのコンピュータシステムの1つの可
能な物理的形態を示す。勿論、そのコンピュータシステムは、集積回路、プリン
ト回路板および小さなハンドヘルド装置から大きなスーパーコンピュータに及ぶ
多くの物理的形態を有するであろう。コンピュータシステム2200には、モニ
ター2202、ディスプレイ2204、容器2206、ディスクドライブ220
8、キーボード2210およびマウス2212が含まれる。ディスク2214は
、コンピュータシステム2200へまたはからデータを移動するのに用いるコン
ピュータ読み取り可能な媒体である。
【0138】 図22Bは、コンピュータシステム2200の構成図の一例である。多種類の
サブシステムが、システムバス2220に付けられている。プロセッサ2222
(中央処理装置またはCPUとも呼ばれる)は、メモリ2224を含む保存装置
に結合される。メモリ2224には、ランダムアクセスメモリ(RAM)および
読み取り専用メモリ(ROM)が含まれる。この技術では良く知られているよう
に、ROMはCPUへ一方通行で、データや指令を送るために働き、RAMは通
常、両方向にデータや指令を送るために用いる。メモリのこれらの両タイプには
、下で説明するコンピュータ読み取り可能な媒体の適当なものが含まれてよい。
固定ディスク2226もまたCPU22222へ両方向に結合し、追加的データ
保存能力を提供し、下で説明するコンピュータ読み取り可能な媒体のどれかを含
んでよい。固定ディスク2226はプログラム、データ等を保存するために使わ
れてよく、通常、一次保存より遅い(ハードディスクのような)二次保存媒体で
ある。固定ディスク2226内に保存された情報は、適当な場合には、メモリ2
224中の仮想メモリとして通常、組み込まれているようである。取り外し可能
ディスク2214は、下で説明するコンピュータ読み取り可能な媒体のいずれか
の形態を取ってよい。
【0139】 また、CPU2222は、ディスプレイ2204、キーボード2210、マウ
ス2212およびスピーカ2230のような種々の入/出力装置に結合している
。一般に、入/出力装置は、ビデオディスプレイ、トラックボール、マウス、キ
ーボード、マイク、タッチセンスディスプレイ、トランスデューサーカードリー
ダー、磁気または紙テープリーダー、タブレット、スタイラス、声または手書き
認識装置、バイオメトリックス・リーダー、または他のコンピュータのいずれか
でよい。CPU2222は、ネットワーク・インタフェース2240を用いて、
他のコンピュータまたはテレコミュニケーション・ネットワークと接続されてよ
い。そのようなネットワーク・インタフェースを用いれば、CPUは、上述した
方法のステップの過程で、ネットワークから情報を得、またネットワークへ情報
を提供すると考えられる。さらに、本発明の方法の具体例は、CPU2222上
でだけ実行してもよく、処理の一部を共有する遠距離CPUと接続されたインタ
ーネットのようなネットワーク上で実行してもよい。
【0140】 さらに、本発明の具体例は、分析データの入力、そのデータを図形ユーザイン
タフェースでカラーグレードの表示に変え、そのデータの表示パラメータを変え
るようにユーザ入力に働きかけることのような種々のコンピュータ実行操作を行
うためのコンピュータコードを有するコンピュータ読み取り可能な媒体を有する
コンピュータ保存製品に関する。それらの媒体またはコンピュータコードは、本
発明の目的のために特別に設計され構築されたものでもよく、コンピュータソフ
トウェア技術を熟知する者にとって良く知られたまたは利用可能な種類のもので
もよい。コンピュータ読み取り可能な媒体の例には、ハードディスク、フロッピ
ー(登録商標)ディスク、磁気テープのような磁気媒体;CD−ROM、ホログ
ラフィ装置のような光学的媒体;フロプティカルディスクのような磁気光学的媒
体;用途特異的IC(ASIC)、プログラム可能な論理装置(PLD)、RO
MおよびRAM装置のような、プログラムコードを保存し実行するように特別に
構成されたハードウエア装置;および局所地域ネットワーク、高域ネットワーク
、インターネットのようなコンピュータ読み取り可能な指令を送るための信号伝
達媒体が含まれるが、これらには限定されない。コンピュータコードの例には、
コンパイラーによって作られる機械コードやインタプリタを用いてコンピュータ
によって実行される、より高いレベルのコードを含むファイルが含まれる。また
、本発明は、波を運んだり、その上で本発明のデータや指令が送られる媒体を輸
送することにも関係する。
【0141】 以上、本発明を特定の具体例を参照しながら説明してきたが、本発明の真の精
神および範囲から離れることなく種々の変形を行い、等価物で置き換え可能であ
ることを、当業者は理解し得よう。さらに、特定の状況、材料、物質組成、プロ
セス、プロセスステップを、本発明の目的、精神および範囲に適合させるために
多くの変形が可能である。そのようなすべての変形は、本明細書の前記特許請求
の範囲内にある。簡潔にするために種々の詳細が省かれているが、明白な構成の
代替手段を実現し得よう。従って、本実施例は、説明のためのものであり、限定
するためのものではないと考えるべきであり、本発明は、ここで与えられた詳細
に限定されるものではなく、前記特許請求範囲内で変形可能である。
【図面の簡単な説明】
【図1】 本発明の方法の全体のステップを示すフローチャートである。
【図2】 本発明で使用される計算プロセスの高レベルのフローチャートである。
【図3】 比較的大規模なゲノムまたはタンパク質の調査として、本発明を用いる方法を
示すフローチャートである。
【図4】 化学架橋を使用したタンパク質における物理的距離制約の形成を示す図である
【図5】 架橋反応の生じ得る結果を示す図である。
【図6】 距離制約情報を生成するための計算処理を示すフローチャートである。
【図7】 図6のフローチャートで使用された、計算済みタンパク質断片の格納リストを
示す図である。
【図8】 図6の計算処理で得られる結果のユーザ報告を示す図である。
【図9】 本発明の質量スペクトロメータおよび計算システム装置を示す図である。
【図10】 サイズ選択クロマトグラフィ処理の溶離における、単量体架橋分子および二量
体架橋分子間の相違を示す線グラフである。
【図11】 架橋タンパク質の加水分解を示す図である。
【図12】 架橋タンパク質の加水分解後に存在するペプチド断片の質量スペクトル分析を
示す図である。
【図13】 構造の生成およびランク付けを行う計算スレッディング処理を示すフローチャ
ートである。
【図14A】 類似性モデリングによって説明されるギャップを有するタンパク質構造を示す
図である。
【図14B】 類似性モデリングによって説明される余分なアミノ酸残基を有するタンパク質
構造を示す図である。
【図15】 三次元タンパク質構造をモデル化するために情報を統合するステップを示す図
である。
【図16】 BS3架橋FGFのトリプシン分解産物のHPLCクロマトグラムである。
【図17】 BS3架橋FGFのトリプシン分解産物を形成するHPLCフラクションのM
ALDI−TOFスペクトルを示す図である。
【図18】 Thr121−Lys129とリンクするペプチドTyr−Lys86から発
生する架橋ペプチドMH+=m/z2739.4のMALDI−TOF PSD
スペクトルを示す図である。
【図19A】 MH+=m/z2059(A)の分子内架橋ペプチドおよびMH+=m/z2
565(B)の分子間架橋ペプチドのMALDI−TOFスペクトルを示す図で
ある。
【図19B】 MH+=m/z2059(A)の分子内架橋ペプチドおよびMH+=m/z2
565(B)の分子間架橋ペプチドのMALDI−TOFスペクトルを示す図で
ある。
【図20】 (部分a)類似性モデリングに用いられるインターロイキン−1β(IL−1
β)およびFGF−2(FGF2)のスレッディングアライメントを示す図であ
る。アライメントの上下のバーは、PDB構造ファイルで定義されるインターロ
イキン−1β(上)およびFGF−2(下)のベータストランド位置を示す。シ
ーケンスアライメントの一致は12.7%である。図18(部分b)も、IL−
1βおよびFGF−2のDALI構造アライメントを示す図である。DALIア
ライメントの構造的な2乗平均平方根偏差(RMSD)は、101個の残基に対
して2.7Åである。
【図21】 FGF−2類似性モデルのFGF−2(4FGF)に対する構造アライメント
を示す図である。
【図22A】 本発明の実施形態の実施に適したコンピュータシステムを示す図である。
【図22B】 本発明の実施形態の実施に適したコンピュータシステムを示す図である。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G01N 30/06 G01N 30/48 K 30/48 30/84 Z 30/84 30/88 J 30/88 33/68 ZNA 33/68 ZNA 30/26 A // G01N 30/26 30/72 C 30/72 33/48 Z 33/48 C12N 15/00 A (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,MZ,SD,SL,SZ,TZ,UG ,ZW),EA(AM,AZ,BY,KG,KZ,MD, RU,TJ,TM),AE,AG,AL,AM,AT, AU,AZ,BA,BB,BG,BR,BY,CA,C H,CN,CR,CU,CZ,DE,DK,DM,DZ ,EE,ES,FI,GB,GD,GE,GH,GM, HR,HU,ID,IL,IN,IS,JP,KE,K G,KP,KR,KZ,LC,LK,LR,LS,LT ,LU,LV,MA,MD,MG,MK,MN,MW, MX,NO,NZ,PL,PT,RO,RU,SD,S E,SG,SI,SK,SL,TJ,TM,TR,TT ,TZ,UA,UG,UZ,VN,YU,ZA,ZW (72)発明者 クンズ・アーウィン・ディ. アメリカ合衆国 カリフォルニア州94904 グリーンブレー,アルメナー・ドライ ブ,55 (72)発明者 タン・ニン アメリカ合衆国 カリフォルニア州94131 サン・フランシスコ,ダイヤモンド・ハ イツ・ブルバード,5150 (72)発明者 ドリンガー・ガビン アメリカ合衆国 カリフォルニア州94122 サン・フランシスコ,5番・アベニュ ー,1465 (72)発明者 オーシロ・コニー・エム. アメリカ合衆国 カリフォルニア州94043 マウンテン・ビュー,ベンジャミン・ド ライブ,2446 (72)発明者 ヘンペル・ジュディス・シー. アメリカ合衆国 カリフォルニア州94118 サン・フランシスコ,2番・アベニュ ー,145 (72)発明者 テイラー・エリック アメリカ合衆国 カリフォルニア州94609 オークランド,62番・ストリート,561 Fターム(参考) 2G045 BB29 DA13 DA14 DA36 FB05 FB06 GC10 JA01 4B024 AA11 AA19 AA20 CA01 CA11 HA01 HA11 HA19 HA20

Claims (74)

    【特許請求の範囲】
  1. 【請求項1】 高分子の三次元構造を決定する方法であって、 高分子の残基間に物理的な距離制約を課すステップと、 前記高分子を、より小さな分子断片に断片化するステップと、 前記断片を同定処理にかけるステップと、 前記同定処理で得られる同定情報を分析して、前記高分子の三次元構造情報を
    提供するステップと、 を備える、方法。
  2. 【請求項2】 請求項1記載の方法であって、 前記同定処理は、質量スペクトル分析を用いた前記断片の質量測定を含む、方
    法。
  3. 【請求項3】 請求項2記載の方法であって、 前記同定処理は、配列の同定を含む、方法。
  4. 【請求項4】 請求項1記載の方法であって、 前記情報を分析するステップは、 前記断片の同定に基づいて、前記断片に得点を割り当てるステップと、 前記高分子を既知の構造の関連化合物と比較することによって、複数の仮想構
    造を生成するステップと、 前記距離制約を考慮することによって、前記複数の仮想構造を評価するステッ
    プと、 を含む、方法。
  5. 【請求項5】 請求項4記載の方法であって、さらに、 前記距離制約に最も適合する仮想構造の類似性モデリング分析を実行するステ
    ップを含む、方法。
  6. 【請求項6】 請求項1記載の方法であって、 前記高分子は、少なくとも1つのアミノ酸を含む、方法。
  7. 【請求項7】 請求項1記載の方法であって、 高分子は、RNAまたはDNAを含む、方法。
  8. 【請求項8】 タンパク質の三次元構造を決定する方法であって、 分析対象のタンパク質を、少なくとも2つの反応性基を含む少なくとも1つの
    架橋試薬と反応させるステップと、 反応生成物を分子内架橋を有する分子に濃縮するステップと、 濃縮された反応生成物についてタンパク質分解を行い、複数のタンパク質断片
    を得るステップと、 前記複数のタンパク質断片をペプチド同定分析にかけるステップと、 前記ペプチド同定分析から得られる情報を分析して、前記高分子の三次元構造
    に関する情報を得るステップと、 を備える、方法。
  9. 【請求項9】 請求項8記載の方法であって、 前記架橋試薬は、二官能性架橋試薬である、方法。
  10. 【請求項10】 請求項9記載の方法であって、 前記架橋試薬は、アミン特異的ホモ二官能性架橋試薬である、方法。
  11. 【請求項11】 請求項8記載の方法であって、 前記タンパク質を、前記タンパク質上の複数の反応性部位に対して異なる特異
    性を有する複数の架橋試薬と反応させる、方法。
  12. 【請求項12】 請求項8記載の方法であって、 前記タンパク質を、反応性基間の長さが異なる複数の架橋試薬と反応させる、
    方法。
  13. 【請求項13】 請求項1記載の方法であって、 前記架橋試薬との反応は、高分子当たり平均1つの架橋試薬で修飾されるよう
    に最適化されている、方法。
  14. 【請求項14】 請求項8記載の方法であって、 前記反応生成物は、分子間架橋を有するタンパク質の物理的除去によって、分
    子内架橋を有する分子に濃縮される、方法。
  15. 【請求項15】 請求項14記載の方法であって、 分子間架橋を有する分子は、ゲル濾過クロマトグラフィによって取り除かれる
    、方法。
  16. 【請求項16】 請求項8記載の方法であって、 前記タンパク質同定分析は、クロマトグラフィと質量スペクトル分析から成る
    、方法。
  17. 【請求項17】 請求項16記載の方法であって、 前記クロマトグラフィは、C4、C8およびC18の分離スキームを用いる逆
    相分離である、方法。
  18. 【請求項18】 請求項16記載の方法であって、 前記質量スペクトル分析は、マトリクス補助レーザー脱着イオン化(MALD
    I)飛行時間(TOF)装置または電子スプレーイオン化(ESI)飛行時間(
    TOF)装置を用いて実行される、方法。
  19. 【請求項19】 請求項8記載の方法であって、 前記ペプチド同定分析は、ペプチド配列決定から成る、方法。
  20. 【請求項20】 請求項8記載の方法であって、 前記情報分析ステップは、 質量スペクトルデータに基づいて、複数のタンパク質分解生成物に値を割り当
    るステップと、 前記高分子を既知の構造の関連化合物と比較することによって、複数の仮想構
    造を生成するステップと、 架橋データから得られる距離制約を考慮することによって、前記複数の仮想構
    造を評価するステップと、 を含む、方法。
  21. 【請求項21】 請求項20記載の方法であって、さらに、 前記距離制約に適合する仮想構造の類似性モデリング分析を実行するステップ
    を含む、方法。
  22. 【請求項22】 請求項20記載の方法であって、 値の割り当ては、タンパク質分解生成物の仮想ライブラリを構築することによ
    って行われ、前記ライブラリは、単一同位体データと平均質量データとで構成さ
    れるグループから選択された基準によって指示される、方法。
  23. 【請求項23】 請求項20記載の方法であって、 仮想構造は、折り畳み予測に関するスレッディングプログラムを用いて生成さ
    れる、方法。
  24. 【請求項24】 請求項20記載の方法であって、 前記仮想構造は、次式を用いて生成される、方法。 【数1】 ここで、Etは全制約誤差、d0は組距離分離、diは制約jによる構造によ
    って定義される組距離、iは距離制約の全数である。
  25. 【請求項25】 請求項21記載の方法であって、 類似性モデリング分析は、前記高分子の複数の成分を、前記高分子の構造にお
    けるこれらの成分の空間的位置とマッチングさせる、スレッディングアライメン
    トを用いて実行される、方法。
  26. 【請求項26】 アミノ酸配列の三次元構造に関する情報を決定する方法で
    あって、 アミノ酸配列を、約5Åないし約20Åの距離だけ離れた2つの反応性基およ
    び検出可能ラベルを含む架橋試薬と、反応させて反応生成物を得るステップと、 前記反応生成物をクロマトグラフィを用いてサイズ分離するステップと、 前記反応生成物のサイズ分離された部分のタンパク質分解を行い、前記架橋試
    薬の検出可能ラベルと結合したままになっている反応生成物の一部を、単離する
    ステップと、 検出可能ラベルを含む反応生成物の単離された部分について、質量スペクトル
    分析を行うステップと、 可能性のある反応生成物の質量を計算し、実際の実験的質量と比較し、前記ア
    ミノ酸配列の三次元構造に関する情報を提供するステップと、 を備える、方法。
  27. 【請求項27】 分子の構造の詳細を決定するシステムであって、 質量スペクトロメータと、 前記質量スペクトロメータから、少なくとも1つの距離制約が課された前記分
    子の実際の断片からの質量情報を含む入力データを受け取る計算システムと、 を備え、 前記計算システムは、入力データを、前記計算システムによって生成され、ま
    たは、保存された前記分子の予期される断片とマッチングさせた後、前記分子の
    構造の詳細を出力する、システム。
  28. 【請求項28】 請求項27記載のシステムであって、 前記分子は、ポリペプチドである、システム。
  29. 【請求項29】 請求項27記載のシステムであって、 前記分子は、核酸である、システム。
  30. 【請求項30】 請求項27記載のシステムであって、 前記距離制約は、ポリペプチド架橋試薬によって課される、システム。
  31. 【請求項31】 請求項27記載のシステムであって、 前記距離制約は、BS3によって課される、システム。
  32. 【請求項32】 請求項27記載のシステムであって、 前記距離制約の数は、約20未満である、システム。
  33. 【請求項33】 請求項27記載のシステムであって、 前記分子は、ポリペプチドであり、 前記距離制約の数は、前記ポリペプチド内のアミノ酸残基の数の約20%未満
    である、システム。
  34. 【請求項34】 請求項27記載のシステムであって、 前記入力データは、質量スペクトロメータから与えられる、システム。
  35. 【請求項35】 請求項27記載のシステムであって、 前記質量スペクトロメータは、MALDIまたはESI質量スペクトロメータ
    である、システム。
  36. 【請求項36】 請求項27記載のシステムであって、 前記分子の候補構造は、既知のタンパクの質折り畳みによる一次配列の制約さ
    れたスレッディングによって生成される、システム。
  37. 【請求項37】 請求項27記載のシステムであって、 前記分子の構造の詳細は、三次元構造情報を含む、システム。
  38. 【請求項38】 請求項27記載のシステムであって、 前記分子の構造の詳細は、三次元座標地図を含む、システム。
  39. 【請求項39】 請求項38記載のシステムであって、 前記三次元座標地図は、前記分子内の各原子の実際の位置の約2Åないし約5
    ÅRMS以内で決定される、システム。
  40. 【請求項40】 請求項27記載のシステムであって、 前記分子の構造の詳細は、類似性モデリングを用いて生成される、システム。
  41. 【請求項41】 分子の構造の詳細を決定するためのコンピュータシステム
    であって、 1以上のプロセッサと、 1以上のユーザ入力装置と、 を備え、 前記コンピュータシステムは、 少なくとも1つの距離制約が課された前記分子の実際の断片からの質量情報を
    含む入力データを受け取り、 前記コンピュータシステムは、 前記入力データを、前記分子の予期される断片とを比較した後、前記分子の構
    造の詳細を出力する、コンピュータシステム。
  42. 【請求項42】 請求項41記載のシステムであって、 前記距離制約の数は、約20未満である、システム。
  43. 【請求項43】 請求項41記載のシステムであって、 前記分子は、ポリペプチドであり、 前記距離制約の数は、前記ポリペプチド内のアミノ酸残基の数の約20%未満
    である、システム。
  44. 【請求項44】 請求項41記載のシステムであって、 前記分子の候補構造は、既知のタンパクの質折り畳みによる一次配列の制約さ
    れたスレッディングによって生成される、システム。
  45. 【請求項45】 請求項41記載のシステムであって、 前記分子の構造の詳細は、三次元構造情報を含む、システム。
  46. 【請求項46】 請求項41記載のシステムであって、 前記分子の構造の詳細は、三次元座標地図を含む、システム。
  47. 【請求項47】 請求項46記載のシステムであって、 前記三次元座標地図は、前記分子内の各原子の実際の位置の約2Åないし約5
    ÅRMS以内で決定される、システム。
  48. 【請求項48】 請求項41記載のシステムであって、 前記分子の構造の詳細は、類似性モデリングを用いて生成される、システム。
  49. 【請求項49】 分子の候補構造の得点をつけるためのコンピュータシステ
    ムで実行される方法であって、 少なくとも1つの距離制約が課された前記分子の実際の断片からの質量情報を
    含む入力データを受け取るステップと、 前記分子の予期される断片を生成し、または、保存するステップと、 前記質量情報を、前記分子の予期される断片とマッチングさせて、距離制約情
    報を生成するステップと、 それらが前記距離制約情報と一致する程度に基づいて、候補構造の得点をつけ
    るステップと、 を備える、方法。
  50. 【請求項50】 請求項49記載の方法であって、 前記分子は、ポリペプチドである、方法。
  51. 【請求項51】 請求項49記載の方法であって、 前記分子は、核酸である、方法。
  52. 【請求項52】 請求項49記載の方法であって、 前記距離制約は、ポリペプチド架橋試薬によって課される、方法。
  53. 【請求項53】 請求項49記載の方法であって、 前記距離制約は、BS3によって課される、方法。
  54. 【請求項54】 請求項49記載の方法であって、 前記距離制約の数は、約20未満である、方法。
  55. 【請求項55】 請求項49記載の方法であって、 前記分子は、ポリペプチドであり、 前記距離制約の数は、前記ポリペプチド内のアミノ酸残基の数の約20%未満
    である、方法。
  56. 【請求項56】 請求項49記載の方法であって、 前記入力データは、質量スペクトロメータから与えられる、方法。
  57. 【請求項57】 請求項49記載の方法であって、 前記質量スペクトロメータは、MALDIまたはESI質量スペクトロメータ
    である、方法。
  58. 【請求項58】 請求項49記載の方法であって、 前記分子の候補構造は、既知のタンパクの質折り畳みによる一次配列の制約さ
    れたスレッディングによって生成される、方法。
  59. 【請求項59】 請求項49記載の方法であって、 前記候補構造は、二次構造レベルに決定される、方法。
  60. 【請求項60】 請求項49記載の方法であって、さらに、 前記分子の構造の詳細を生成して出力する、方法。
  61. 【請求項61】 請求項49記載の方法であって、 前記分子の構造の詳細は、三次元構造情報を含む、方法。
  62. 【請求項62】 請求項49記載の方法であって、 前記分子の構造の詳細は、三次元座標地図を含む、方法。
  63. 【請求項63】 請求項63記載の方法であって、 前記三次元座標地図は、前記分子内の各原子の実際の位置の約2Åないし約5
    ÅRMS以内で決定される、方法。
  64. 【請求項64】 請求項49記載の方法であって、 前記分子の構造の詳細は、類似性モデリングを用いて生成される、方法。
  65. 【請求項65】 コンピュータ読み取り可能な媒体と、前記コンピュータ読
    み取り可能な媒体から供給されるプログラム指令であって、分子の候補構造の得
    点をつけるための指令を含む前記プログラム指令と、を備えるコンピュータプロ
    グラム製品であって、 前記指令は、 少なくとも1つの距離制約が課された分子の実際の断片からの質量情報を含む
    入力データを受け取り、 前記分子の予期される断片を生成し、または、保存し、 前記質量情報を、前記分子の予期される断片とマッチングさせて、距離制約情
    報を生成し、 それらが前記距離制約情報と一致する程度に基づいて、候補構造の得点をつけ
    る、 ように指令する、コンピュータプログラム製品。
  66. 【請求項66】 請求項65記載のコンピュータプログラム製品であって、 前記距離制約の数は、約20未満である、コンピュータプログラム製品。
  67. 【請求項67】 請求項65記載のコンピュータプログラム製品であって、 前記分子は、ポリペプチドであり、 前記距離制約の数は、前記ポリペプチド内のアミノ酸残基の数の約20%未満
    である、コンピュータプログラム製品。
  68. 【請求項68】 請求項65記載のコンピュータプログラム製品であって、 前記候補構造は、既知のタンパクの質折り畳みによる一次配列の制約されたス
    レッディングによって生成される、コンピュータプログラム製品。
  69. 【請求項69】 請求項65記載のコンピュータプログラム製品であって、
    さらに、 前記分子の構造の詳細を生成して出力する、コンピュータプログラム製品。
  70. 【請求項70】 請求項65記載のコンピュータプログラム製品であって、 前記分子の構造の詳細は、三次元座標地図を含む、コンピュータプログラム製
    品。
  71. 【請求項71】 請求項70記載のコンピュータプログラム製品であって、 前記三次元座標地図は、前記分子内の各原子の実際の位置の約2Åないし約5
    ÅRMS以内で決定される、コンピュータプログラム製品。
  72. 【請求項72】 請求項65記載のコンピュータプログラム製品であって、 前記分子の構造の詳細は、類似性モデリングを用いて生成される、コンピュー
    タプログラム製品。
  73. 【請求項73】 請求項19記載の方法であって、 前記ペプチドの配列決定がエドマン配列決定から成る、方法。
  74. 【請求項74】 請求項21記載の方法であって、さらに、 前記距離制約に最も適合する仮想構造を選択するステップを含む、方法。
JP2000620343A 1999-05-26 2000-05-26 高分子の三次元形状の決定方法 Pending JP2003528288A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13589199P 1999-05-26 1999-05-26
US60/135,891 1999-05-26
PCT/US2000/014667 WO2000072004A2 (en) 1999-05-26 2000-05-26 Method of determining the three-dimensional shape of a macromolecule

Publications (1)

Publication Number Publication Date
JP2003528288A true JP2003528288A (ja) 2003-09-24

Family

ID=22470229

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000620343A Pending JP2003528288A (ja) 1999-05-26 2000-05-26 高分子の三次元形状の決定方法

Country Status (4)

Country Link
EP (1) EP1277050A2 (ja)
JP (1) JP2003528288A (ja)
AU (1) AU5298900A (ja)
WO (1) WO2000072004A2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006282929A (ja) * 2005-04-04 2006-10-19 Taiyo Nippon Sanso Corp 分子構造予測方法
JP2010513890A (ja) * 2006-12-18 2010-04-30 コヴァルクス・アーゲー 治療タンパク質の凝集体の直接質量分光分析
JP2010521689A (ja) * 2007-03-16 2010-06-24 コヴァルクス・アーゲー タンパク質複合体をターゲティングする薬物候補の直接質量分析
JP2011152094A (ja) * 2010-01-28 2011-08-11 Sony Corp 耐熱化チロシン依存性酸化還元酵素の設計方法及び耐熱化チロシン依存性酸化還元酵素

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ITRM20010088A1 (it) 2001-02-21 2002-08-21 Idi Irccs Peptide in grado di inibire l'attivita' del fattore di crescita derivato dalle piastrine (pdgf-bb) e del fattore di crescita derivato dai fi
AU2003231525A1 (en) * 2002-04-26 2003-11-10 Ajinomoto Co., Inc. Method of analyzing protein structure, protein structure analyzer, program and recording medium
JP3743717B2 (ja) 2002-06-25 2006-02-08 株式会社日立製作所 質量分析データの解析方法および質量分析データの解析装置および質量分析データの解析プログラムならびにソリューション提供システム
ATE515697T1 (de) * 2005-05-04 2011-07-15 Eidgenoess Tech Hochschule Massenspektrometrisches analyseverfahren
US8012695B2 (en) 2007-02-14 2011-09-06 Dana-Farber Cancer Institute, Inc. Methods and compositions relating to promoter regulation by MUC1 and KLF proteins
NZ592537A (en) 2008-10-17 2012-07-27 Dana Farber Cancer Inst Inc Muc-1 cytoplasmic domain peptides as inhibitors of cancer
US9170221B2 (en) 2010-10-01 2015-10-27 Elizabeth M. HEIDER NMR crystallography methods for three-dimensional structure determination
US9194953B2 (en) * 2010-10-21 2015-11-24 Sony Corporation 3D time-of-light camera and method
WO2015072982A1 (en) * 2013-11-13 2015-05-21 Heider Elizabeth M Nmr crystallography methods for three-dimensional structure determination
GB201511508D0 (en) * 2015-07-01 2015-08-12 Ge Healthcare Bio Sciences Ab Method for determining a size of biomolecules
CN107449483B (zh) * 2017-08-04 2019-12-06 赵德省 一种物质余量的提醒系统及方法
CN108469495B (zh) * 2018-05-08 2020-02-07 中国海洋大学 一种利用液相色谱串联质谱检测鱼类小清蛋白的方法
CN111755065B (zh) * 2020-06-15 2024-05-17 重庆邮电大学 一种基于虚拟网络映射和云并行计算的蛋白质构象预测加速方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006282929A (ja) * 2005-04-04 2006-10-19 Taiyo Nippon Sanso Corp 分子構造予測方法
JP2010513890A (ja) * 2006-12-18 2010-04-30 コヴァルクス・アーゲー 治療タンパク質の凝集体の直接質量分光分析
JP2010521689A (ja) * 2007-03-16 2010-06-24 コヴァルクス・アーゲー タンパク質複合体をターゲティングする薬物候補の直接質量分析
JP2011152094A (ja) * 2010-01-28 2011-08-11 Sony Corp 耐熱化チロシン依存性酸化還元酵素の設計方法及び耐熱化チロシン依存性酸化還元酵素

Also Published As

Publication number Publication date
EP1277050A2 (en) 2003-01-22
WO2000072004A9 (en) 2002-08-29
WO2000072004A3 (en) 2002-11-28
WO2000072004A2 (en) 2000-11-30
AU5298900A (en) 2000-12-12

Similar Documents

Publication Publication Date Title
Piersimoni et al. Cross-linking mass spectrometry for investigating protein conformations and protein–protein interactions─ a method for all seasons
JP2003528288A (ja) 高分子の三次元形状の決定方法
Poma et al. Combining the MARTINI and structure-based coarse-grained approaches for the molecular dynamics studies of conformational transitions in proteins
Winston et al. Mass spectrometry as a readout of protein structure and function
Tsai et al. Protein-protein interfaces: architectures and interactions in protein-protein interfaces and in protein cores. Their similarities and differences
Liebler Introduction to proteomics: tools for the new biology
Cohen et al. Origins of structural diversity within sequentially identical hexapeptides
Eschweiler et al. Chemical probes and engineered constructs reveal a detailed unfolding mechanism for a solvent-free multidomain protein
Mehaffey et al. Uniting native capillary electrophoresis and multistage ultraviolet photodissociation mass spectrometry for online separation and characterization of Escherichia coli ribosomal proteins and protein complexes
Birch et al. Sensitivity of molecular docking to induced fit effects in influenza virus neuraminidase
Harvey et al. Dissecting the dynamic conformations of the metamorphic protein lymphotactin
Lee et al. Structure of the S100A6 complex with a fragment from the C-terminal domain of Siah-1 interacting protein: a novel mode for S100 protein target recognition
Fajardo et al. Assessment of chemical‐crosslink‐assisted protein structure modeling in CASP13
US20230303626A1 (en) Macrocyclic polypeptides
Konermann et al. Mobile protons limit the stability of salt bridges in the gas phase: implications for the structures of electrosprayed protein ions
Deslignière et al. High-Resolution IMS–MS to Assign Additional Disulfide Bridge Pairing in Complementarity-Determining Regions of an IgG4 Monoclonal Antibody
US20050053999A1 (en) Method for predicting G-protein coupled receptor-ligand interactions
Tang et al. CLPM: a cross-linked peptide mapping algorithm for mass spectrometric analysis
US7167819B1 (en) Method of determining the three-dimensional shape of a macromolecule
Temelso et al. Structural analysis of α-fetoprotein (AFP)-like peptides with anti-breast-cancer properties
Trnka et al. Role of integrative structural biology in understanding transcriptional initiation
Akashi Investigation of molecular interaction within biological macromolecular complexes by mass spectrometry
King et al. Identification of disulfide-containing chemical cross-links in proteins using MALDI-TOF/TOF-mass spectrometry
US20080318262A1 (en) Protein Cleavage at Aspartic Acid Using Chemical Reagents
Downard et al. Mass spectrometry in structural proteomics: The case for radical probe protein footprinting