JP2002543390A - アミノ酸配列評価システム - Google Patents

アミノ酸配列評価システム

Info

Publication number
JP2002543390A
JP2002543390A JP2000614047A JP2000614047A JP2002543390A JP 2002543390 A JP2002543390 A JP 2002543390A JP 2000614047 A JP2000614047 A JP 2000614047A JP 2000614047 A JP2000614047 A JP 2000614047A JP 2002543390 A JP2002543390 A JP 2002543390A
Authority
JP
Japan
Prior art keywords
amino acid
acid sequence
motif
protein
query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2000614047A
Other languages
English (en)
Inventor
ステファーノ ボリニア,
フン−セン ライ,
マイケル ビー. ヤッフェ,
ジャーマン ジー. レパー,
ルイス シー. キャントリー,
Original Assignee
ベス・イスラエル・ディーコニス・メディカル・センター・インコーポレーテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ベス・イスラエル・ディーコニス・メディカル・センター・インコーポレーテッド filed Critical ベス・イスラエル・ディーコニス・メディカル・センター・インコーポレーテッド
Publication of JP2002543390A publication Critical patent/JP2002543390A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Peptides Or Proteins (AREA)

Abstract

(57)【要約】 アミノ酸配列モチーフに関する疑問タンパク質アミノ酸配列を評価する方法および装置であって、このアミノ酸配列モチーフは公知の機能を有する公知のタンパク質のドメインの標的に対応し、この疑問タンパク質アミノ酸配列が公知の機能を果たすか否かを予想するための方法および装置である。1実施形態において、この予想は、スコアリングシステムを使用してアミノ酸配列モチーフに関する疑問タンパク質アミノ酸配列についてのスコアを生成することによって実行される。このスコアは、疑問タンパク質アミノ酸配列が公知の機能を実行することの確かさの程度を示す。スコアリングシステムのいくつかの実施形態が、記載される。

Description

【発明の詳細な説明】
【0001】 (発明の分野) 本発明は、機能的役割およびタンパク質がお互いに相互作用し得る経路を予測
するための、コンピューターによって実行される方法に関する。
【0002】 (背景) ヒトゲノムプロジェクトのようなゲノム配列決定の計画は、数千もの未知の機
能のタンパク質配列を作り出し、そしてここ数年においてさらに大多数の配列を
作り出すことが予測される。そのような新たに発見されたタンパク質と公知の機
能のタンパク質との間の配列ホモロジーの比較が、新たに発見されたタンパク質
の機能的特性を予測するために利用可能な唯一の方法である。
【0003】 多くの生物学的応答は、結合タンパク質と別の分子との相互作用によって媒介
される。そのような結合相互作用の例としては、酵素とその基質の相互作用(例
えば、キナーゼ、プロテアーゼ、ホスファターゼなどとその基質との相互作用)
、抗体と抗原との相互作用、レセプターとリガンドとの相互作用、およびSH2
ドメインとホスホチロシン含有標的との相互作用が挙げられる。特定の結合タン
パク質(例えば、酵素)の特異性は、代表的には、そのタンパク質の多数の天然
の基質を同定し、それら基質の配列を取得し、次にそれら基質の配列を比較して
基質結合のためのコンセンサスモチーフを規定することによって決定される。
【0004】 一般に、タンパク質および核酸のホモロジーを、インターネットを通じて入手
可能(ftp:/ncbi.nlm.nih.gov/pub/)な、NCBI
(Bethesda、Maryland)によって開発された種々の公に利用可
能なソフトウェアツールを使用して計算され得る。例示的なツールとしては、h
ttp://www:/ncbi.nlm.nih.govにて利用可能なBL
ASTシステムが挙げられる。Pairwise and ClustalWア
ラインメント(BLOSUM30マトリクス設定)ならびにKyte−Dool
ittle疎水性分析を、例えば、MacVector配列分析ソフトウェア(
Oxford Molecular Group)を使用して入手可能である。
さらに、モチーフ配列の編集物が、記載されている(Bairoch,A.,N
ucl.Acids Res.19:2241〜2245(1991))。不運
なことに、この配列の編集物は、多数の研究者の研究から推定されており、各々
の研究は、異なる程度の精度と誤差を有し、従って、編集物は、最初のデータ入
力に起因し得る不正確さを多く含む。
【0005】 上記を鑑みると、新たに発見されたタンパク質の機能的特性および/または結
合特性を予測するための改善された方法を提供する必要がなお存在する。そのよ
うな方法は、個々の配列の配列との比較によって生じる誤差を減少するか、また
は防ぎ、そして新たに発見されたタンパク質の機能的特性および/または結合特
性を予測するより正確な方法を提供するために、設計される。
【0006】 (要約) 本発明は、ユーザーが新たな機能、相互作用、翻訳後修飾および他の構造的特
徴についてタンパク質配列を検索することを可能にするシステムに関する。この
発明の適用は、研究室において以前に同定されたタンパク質に限定されず、例え
ば、ヒトゲノムプロジェクトのようなゲノム配列決定計画から配列が得られる理
論的なタンパク質についてこの情報を推定するためにもまた使用され得る。結論
として、本明細書において開示されるシステムを使用して、新たなタンパク質が
関与し得る機能的役割および経路を示唆し得、そして目的の標的タンパク質と相
互作用する可能性のある他のタンパク質の同定への方向付け提供し得る。特に、
1つの実施形態において、このシステムは、疑問タンパク質配列を検索して、タ
ンパク質と相互作用する可能性のあるアミノ酸モチーフを(例えば、酵素基質と
してか、または他の結合ドメインとして)同定する。別の実施形態において、こ
のシステムは、webに基づくシステムである。
【0007】 一般に、このシステムがタンパク質モチーフを推定する初期のデータは、配向
された縮重ペプチドライブラリー(oriented degenerate
peptide libraries)(ODPL)を使用して作成された情報
を含むデータベースに基づく。ODPLは、アミノ酸配列においてお互いに異な
るが、一般に固定されたアミノ酸位置(本明細書において非縮重@部位(non
−degenated@position)と呼ぶ)に位置する同一のアミノ酸
を含むライブラリーのメンバーの混合物を含む。異なるペプチド中で異なるアミ
ノ酸によって占められる(すなわち、固定されていない)各ライブラリーペプチ
ド内の位置を、本明細書において縮重部位@(degenate positi
on@)と呼ぶ。例示的な配向された縮重ペプチドライブラリーが、Songy
angら(Cell(1993)72:767〜778);米国特許第5,53
2,167号;およびPCT出願第PCT/US98/10876号(発明の名
称 A Cyclic Peptide Libraries and Met
hods of Use Thereof to Identify Bind
ing Motifs、国際公開第WO98/54577号)に記載される。本
出願において同定される全ての文献が、本明細書においてその全体が参考として
援用される。
【0008】 本発明の1つの局面に従って、疑問タンパク質アミノ酸配列を評価して、その
疑問タンパク質が1つ以上の規定されたモチーフを含むか否かを決定するのに有
用なシステムを提供する。このシステムは、公知の機能のタンパク質ドメインに
対応するモチーフの記録を含むデータベースを含む。この記録は、モチーフ内の
位置のアミノ酸についての優勢値@(preference value@)(
あるいは、選択値@(selectivity value@)と呼ぶ)のマト
リクスをさらに含み、この優勢値は、モチーフの機能に対する各位置の各アミノ
酸の相対的重要性を示す(例えば、結合機能、リン酸化部位機能)。このシステ
ムを疑問タンパク質アミノ酸配列を評価する方法として使用して、疑問タンパク
質がモチーフに対応する配列を含むか否か、従って、このモチーフに対応する配
列を含む他のタンパク質に起因する機能を示す可能性があるか否かを決定する。
従って、一般に、モチーフに関して疑問タンパク質アミノ酸配列を評価する本発
明の方法では、スコアは、疑問タンパク質アミノ酸配列内のアミノ酸に対応する
モチーフ内の選択された優勢値に基づく。
【0009】 本発明は、疑問タンパク質配列内の候補モチーフの相対的スコアを提供する2
つの異なるアプローチを提供する。これらのアプローチの各々は、(A)疑問タ
ンパク質アミノ酸配列内のアミノ酸に対応するモチーフ内の選択された優勢値に
基づくモチーフに関する疑問タンパク質アミノ酸配列についてのスコアを計算す
る工程を包含する。各方法を、以下に手短に要約し、そして実施例においてより
詳細に考察する。
【0010】 1つの局面において、本発明は、公知の機能を有する疑問タンパク質または別
のタンパク質のドメインの標的に対応するモチーフに関する、その疑問タンパク
質アミノ酸配列を評価する方法に関する。この方法は、モチーフの記録を含むデ
ータベースを含むシステムにおけるものであり、この記録は、モチーフ中の位置
におけるアミノ酸についての優勢値を含み、この優勢値は、その位置でのタンパ
ク質と相互作用するアミノ酸の優勢性を示す。この方法は:(A)疑問タンパク
質アミノ酸配列内のアミノ酸に対応するモチーフ内の選択された優勢値に基づく
モチーフに関する疑問タンパク質アミノ酸配列についてのスコアを計算する工程
を包含する。1つの実施形態において、工程(A)は:(A)(1)選択された
優勢値の結果の対数としてのスコアを計算する工程を包含する。別の実施形態に
おいて、工程(A)は:(A)(1)結果を得るために選択された優勢値を乗算
する工程;および(A)(2)結果の対数としてのスコアを計算する工程、を包
含する。さらなる実施形態において、工程(A)は:(A)(1)選択された優
勢値の各々の対数を計算する工程;および(A)(2)工程(A)(1)におい
て計算された対数の合計としてのスコアを計算する工程、を包含する。別の実施
形態において工程(A)は:(A)(1)選択された優勢値に対応する確率の負
の対数の合計の平均としてのスコアを計算する工程、を包含する。さらなる実施
形態において、このモチーフは、多数の縮重位置を含み、そして工程(A)は:
(A)(1)選択された優勢値の各々について、選択された優勢値に比例する確
率値(probability value)を作成する工程;(A)(2)確
率値の各々について、その確率値の負の対数を計算する工程;(A)(3)負の
対数を合計する工程;および(A)(4)その合計を、公知のアミノ酸配列中の
縮重位置の数で割り算をして、スコアを計算する工程、を包含する。別の実施形
態において、工程(A)は:(A)(1)モチーフ内の特定の位置の他の複数の
アミノ酸に対応する他の複数の優勢値の優勢値に基づき、そして他の複数のアミ
ノ酸の生理化学的特性に対応する値に基づいて、モチーフ内の特定の位置での第
一のアミノ酸に対応する選択された優勢値の1つを作成する工程、を包含する。
【0011】 別の実施形態において、この方法はさらに:(B)複数のアミノ酸配列中のア
ミノ酸に対応するモチーフ内の選択された優勢値に基づいて、モチーフに関する
複数のアミノ酸配列についてのスコアを計算する工程;および(C)疑問タンパ
ク質アミノ酸配列のスコアを、複数のアミノ酸配列のスコアと比較することによ
って、疑問タンパク質アミノ酸配列のパーセンタイルスコアを計算する工程、を
包含する。1つの実施形態において、工程(C)は:(C)(1)複数のアミノ
酸配列のスコアのヒストグラムを作成する工程;(C)(2)そのヒストグラム
内の疑問タンパク質アミノ酸配列のスコアの位置を同定する工程;および(C)
(3)疑問タンパク質アミノ酸配列のスコアの一方にあるスコアの数を、複数の
アミノ酸配列の数で割り算して、疑問タンパク質アミノ酸配列のスコアのパーセ
ンタイルを計算する工程、を包含する。
【0012】 1つの実施形態において、この方法はさらに:(B)ディスプレイデバイス上
にグラフディスプレイを作成する工程であって、このグラフディスプレイは、ス
コアを記述する情報を含む工程、を包含する。1つの実施形態において、工程(
B)は:(B)(1)疑問タンパク質アミノ酸配列の構造をディスプレイする疑
問タンパク質アミノ酸配列グラフエレメントを作成する工程;および(B)(2
)モチーフを同定するモチーフ同定器(identifier)を作成する工程
であって、このモチーフ同定器は、モチーフが疑問タンパク質アミノ酸配列と特
に良好に適合する、疑問タンパク質アミノ酸配列内の位置を視覚的に示す工程、
を包含する。1つの実施形態において、工程(B)(1)は:(B)(1)(1
)疑問タンパク質アミノ酸配列内の位置に対応する位置の可視的な範囲を有する
疑問タンパク質アミノ酸配列グラフエレメントを作成する工程、を包含し、そし
て工程(B)(2)は、(B)(2)(1)モチーフが疑問タンパク質アミノ酸
配列に特に良好に適合する、疑問タンパク質アミノ酸配列内の位置に可視的に対
応する位置におけるモチーフ同定器を作成する工程、を包含する。
【0013】 1つの実施形態において、工程(B)は:(B)(1)モチーフが疑問タンパ
ク質アミノ酸配列に特に良好に適合する、疑問タンパク質アミノ酸配列内の位置
を記述するディスプレイ情報を作成する工程、を包含する。さらなる実施形態に
おいて、この方法はさらに:(B)(1)モチーフに特に良好に適合する、疑問
タンパク質アミノ酸配列内のサブ配列を記述するディスプレイ情報を作成する工
程、を包含する。別の実施形態において、工程(B)は:(B)(1)モチーフ
に関する複数のアミノ酸配列のスコアのヒストグラムをディスプレイするヒスト
グラムディスプレイを作成する工程;および(B)(2)そのヒストグラム内疑
問タンパク質アミノ酸配列のスコアの位置を示すヒストグラムディスプレイ内の
疑問タンパク質アミノ酸配列マーカーを作成する工程、を包含する。
【0014】 別の局面において、本発明は、公知の機能を有するタンパク質のドメインの標
的に対応するモチーフについての記録を含むデータベースを含むシステム内の、
疑問配列評価器に関し、ここでこの記録は、モチーフ内の位置におけるアミノ酸
についての優勢値を含み、この優勢値は、その位置においてタンパク質と相互作
用するアミノ酸の優勢性を示す。この疑問配列評価器は:モチーフに関して評価
される疑問タンパク質アミノ酸配列を示す疑問配列評価リクエストを受け取る第
一の入力;データベースからの記録を記述する情報を受け取る第二の入力;およ
び疑問タンパク質アミノ酸配列内のアミノ酸に対応するモチーフ内の選択された
優勢値に基づいて、モチーフに関する疑問タンパク質アミノ酸配列についてのス
コアを現す出力、を包含する。
【0015】 1実施形態において、このスコアは、選択された優勢値の結果の対数を含む。
別の実施形態において、このスコアは、選択された優勢値に対応する、確率の逆
対数の和の平均を含む。
【0016】 別の局面において、本発明は、公知の機能を有するタンパク質のドメインの標
的に対応するモチーフに対する記録を含む、データベースを含有するシステムに
おける疑問配列評価システムに関する。この記録は、モチーフ中の部位における
アミノ酸に対する優勢値を含む。この優勢値は、この部位におけるタンパク質と
相互作用するアミノ酸の優勢を示す。この疑問配列評価システムは、疑問タンパ
ク質アミノ酸配列のアミノ酸に対応するモチーフ中の選択された優勢値に基づく
モチーフについて、疑問タンパク質アミノ酸配列のスコアを、出力上に展開する
ための疑問配列評価器;ならびにスコアを受容する入力、およびディスプレイデ
バイスへの出力に対して、スコアの記述的な出力ディスプレイ情報上に展開する
入力を有する、疑問配列ユーザーインターフェースを含む。
【0017】 1実施形態において、ディスプレイ情報は、以下の記述的な情報を含む:疑問
タンパク質アミノ酸配列の構造を表示する、疑問タンパク質アミノ酸配列のグラ
フエレメント;およびモチーフを同定するモチーフ同定器であって、このモチー
フ同定器は、モチーフが、疑問タンパク質アミノ酸配列と特に良好に一致する、
疑問タンパク質アミノ酸配列内の部位を視覚的に示す。別の実施形態において、
このディスプレイ情報は、モチーフが疑問タンパク質アミノ酸配列と特に良好に
一致する疑問タンパク質アミノ酸配列内の部位の記述的な情報を含む。さらなる
実施形態において、このディスプレイ情報は、このモチーフが特に良好に一致す
る疑問タンパク質アミノ酸配列内の部分配列の記述的な情報を含む。別の実施形
態において、このディスプレイ情報は、以下の記述的な情報を含む:モチーフに
関する複数のアミノ酸配列のスコアのヒストグラムを表示するヒストグラムディ
スプレイ;およびこのヒストグラム内の疑問タンパク質アミノ酸配列のスコアの
部位を示す、ヒストグラムディスプレイ内の疑問タンパク質アミノ酸配列マーカ
ー。
【0018】 別の局面において、本発明は、公知の機能を有するタンパク質のドメインの標
的に対応するモチーフに関して、疑問タンパク質アミノ酸配列を評価するための
、疑問配列評価システムに関する。この疑問配列評価システムは、モチーフの記
録を含むデータベースを含むシステムにおいて操作し、この記録は、このモチー
フの部位におけるアミノ酸の優勢値を含み、優勢値は、この部位のタンパク質と
相互作用するアミノ酸の優勢を示す。この疑問配列評価システムは、疑問タンパ
ク質アミノ酸配列のアミノ酸に対応するモチーフにおいて、選択された優勢値に
基づくモチーフについて、疑問タンパク質アミノ酸配列についてスコアを計算す
るための疑問配列評価手段を含む。1実施形態において、この疑問配列評価手段
は、選択された優勢値の結果の対数としてスコアを計算するための手段を含む。
別の実施形態において、この疑問配列評価手段は、選択された優勢値に対応する
、確率の逆対数の和の平均としてスコアを計算するための手段を含む。さらなる
実施形態において、この疑問システム評価手段は、モチーフ中の特定の部位にお
いて複数の他のアミノ酸に対応する、複数の他の優勢値の優勢値に基づくモチー
フ、ならびに複数の他のアミノ酸の物理化学的な特性に対応する値に基づくモチ
ーフにおいて、特定の位置の第1アミノ酸に対応する選択される優勢値の1つを
生成するための手段を含む。別の実施形態において、この疑問配列評価システム
はさらに、複数のアミノ酸配列のアミノ酸に対応するモチーフ中の選択された優
勢値に基づくモチーフについて、複数のアミノ酸配列のスコアを計算するための
第1計算手段;ならびに複数のアミノ酸配列のスコアと、疑問タンパク質アミノ
酸配列のスコアとを比較することによって、疑問タンパク質アミノ酸配列のパー
センタイルスコアを計算するための第2計算手段を含む。
【0019】 さらなる実施形態において、この第2計算手段は、複数のアミノ酸配列のスコ
アのヒストグラムを生成する手段;このヒストグラム内の疑問タンパク質アミノ
酸配列のスコアの部位を同定する手段;ならびに疑問タンパク質アミノ酸配列の
片側に隣接するスコアの数を、複数のアミノ酸配列の数で割ることにより、疑問
タンパク質アミノ酸配列のパーセンタイルスコアを計算する手段を含む。別の実
施形態において、この疑問配列評価システムはさらに、ディスプレイデバイス上
にグラフディスプレイを生成するグラフディスプレイ生成手段を含み、このグラ
フディスプレイは、スコアの記述的な情報を含む。
【0020】 1実施形態において、このグラフディスプレイ生成手段は、疑問タンパク質ア
ミノ酸配列の構造を表示する疑問タンパク質アミノ酸配列ディスプレイエレメン
トを生成する手段、およびこのモチーフを同定するモチーフ同定器を生成する手
段であって、このモチーフ同定器は、モチーフが、疑問タンパク質アミノ酸配列
と特に良好に一致する、疑問タンパク質アミノ酸配列内の部位を視覚的に示すモ
チーフ同定器を含む。別の実施形態において、このグラフディスプレイ生成手段
は、モチーフが、疑問タンパク質アミノ酸配列と特に良好に一致する、疑問タン
パク質アミノ酸配列内のタンパク質の部位の記述的なディスプレイ情報を生成す
るための手段を含む。さらなる実施形態において、このグラフディスプレイ生成
手段は、モチーフに関して複数のアミノ酸配列のスコアのヒストグラムを表示す
るヒストグラムディスプレイを生成するための手段、およびヒストグラム内の疑
問タンパク質アミノ酸配列のスコアの部位を示すヒストグラムディスプレイ内に
、疑問タンパク質アミノ酸配列マーカーを生成するための手段を含む。
【0021】 (詳細な説明) 本発明は、疑問タンパク質アミノ酸配列が公知の機能を行うかどうかを予想す
るために、公知の機能を有する公知のタンパク質のドメインのアミノ酸配列モチ
ーフに関連する疑問タンパク質アミノ酸配列を評価するための方法および装置を
提供する。1実施形態において、この予想は、スコアシステムを使用して、アミ
ノ酸配列モチーフに関連する疑問タンパク質アミノ酸配列についてのスコアを生
成することによって行われる。このスコアは、疑問タンパク質アミノ酸配列が公
知の機能を行う信頼度を示す。スコアシステムのいくつかの実施形態は、以下に
詳細に記載される。
【0022】 本発明は、ユーザーが、新規な機能、相互作用、翻訳後の改変および他の構造
特性について、タンパク質配列をスキャンすることを可能にするシステムに関す
る。本発明の適用は、実験室において前に同定されたタンパク質に限定されず、
ヒトゲノム計画のような遺伝子配列イニシアティブから得られる配列の理論的タ
ンパク質に対する情報を推定するために使用され得る。同時に、本明細書中に記
載されるシステムは、新規なタンパク質に含まれ得る機能的な役割および経路を
提案するため、そして目的の標的タンパク質と相互作用すると考えられる他のタ
ンパク質を同定する使用法を提供するために使用され得る。特に、このシステム
は、疑問タンパク質配列を調査し、タンパク質(例えば、酵素基質または他のタ
ンパク質結合ドメイン)と相互作用すると考えられるアミノ酸モチーフを同定す
る。好ましい実施形態において、このシステムは、ウェブベースシステムである
【0023】 アミノ酸配列を評価するため、そして以前に特徴付けされなかった配列の機能
を予測するために本明細書中に記載されるアプローチは、3つの事項に基づいて
いる:(1)アミノ酸の直鎖配列に含まれる情報(1次構造)は、公知または新
規のいずれかのタンパク質の機能について多くの糸口を提供するに十分であるこ
と:(2)真核細胞内の多数のタンパク質が、タンパク質−タンパク質相互作用
によって(少なくとも部分的に)支配される大きな分子の複合体成分として、あ
るいはリン酸化のような翻訳後の改変またはタンパク質−タンパク質相互作用に
よって調節される活性の酵素として機能すること;ならびに(3)タンパク質内
の少ない配列モチーフが、モジューラータンパク質−タンパク質相互作用または
翻訳後の改変に関する特異性を提供するために十分であること。本明細書中に記
載される技術は、これらの事項に基づいて特徴付けされていない疑問配列を分析
するために、非常に信頼性のある方法を提供する。
【0024】 一般的に、タンパク質モチーフを推定するシステムに由来する主なデータは、
配向された縮重ペプチドライブラリー(ODPL)を使用して生成される情報を
含むデータベースに基づいている。ODPLは、アミノ酸配列において互いに異
なるライブラリーメンバーの混合物を含むが、これは、一般的に、固定されたア
ミノ酸位置(本明細書中において「非縮重」位置として言及される)にある同じ
アミノ酸を含む。異なるペプチド(すなわち、固定されていない)における異な
るアミノ酸によって占められる各々のライブラリーペプチド内の位置は、本明細
書中で「縮重部位」として言及される。
【0025】 ODPLは、少なくとも一つの固定された非縮重アミノ酸位置およびいくつか
の縮重アミノ酸位置を含む。一つの実施形態において、固定された非縮重アミノ
酸残基のいずれかの側のアミノ酸残基(例えば、その非縮重残基が隣接するN末
端およびC末端)が縮重しており、従って、固定されたアミノ酸残基を囲む領域
に対する相互作用部位モチーフを決定し得る。例えば、非縮重アミノ残基の各々
の側に位置する4つのアミノ酸残基は、縮重し得る(例えば、0位の非縮重アミ
ノ酸残基に対して−4位、−3位、−2位、−1位、+1位、+2位、+3位、
+4位が縮重し得る)。配向された縮重環状ペプチドライブラリーのペプチドに
おける縮重部位は、20種の天然アミノ酸ならびに非天然αアミノ酸のいずれか
一つがそれらの位置を占め得るように、作製され得る。しかし、「バックグラン
ド」事象(例えば、固定された残基以外の残基における酵素的事象)を減少する
ために、一つの実施形態において、縮重部位は、試験された特定の結合化合物に
よって、作用され得るアミノ酸残基を含まない。従って、例えば、その結合化合
物が、プロテインセリン/スレオニンキナーゼであり、そしてその固定された残
基がセリンまたはスレオニンである場合、縮重部位はセリンまたはスレオニンを
含まないことが好ましい。同様に、プロテインチロシン特異的キナーゼについて
、固定された残基がチロシンである場合、縮重部位はチロシンを含まないことが
好ましい。
【0026】 例示的な適応された縮重ペプチドライブリーは、Songyangら、(Ce
ll(1993)72:767〜778);米国特許第5,532,167号;
および「Cyclic Peptide Libraries and Met
hod of Use Thereof to Identify Bindi
ng Motifs」という表題を付けられているPCT出願番号PCT/US
98/10876、公開番号WO98/54577において記載される。Son
gyangら、(Cell(1993)72:767〜778)は、適応された
縮重ホスホペプチドライブリーを使用して、SH2ドメインのペプチド結合部位
の配列特異性を決定するための方法を記載している。このアプローチにおいて、
固定されたホスホチロシン残基を含む線状ペプチドのライブラリーを使用して、
特定のSH2ドメインに対して最適なホスホペプチド基質を選択する。類似のア
プローチが、プロテインキナーゼに対する最適な基質の決定のために適用されて
いる(米国特許第5,532,167号を参照のこと)。これらの方法論は、も
っぱら天然に存在するαアミノ酸から構成される線状ペプチドライブラリーを利
用した。同様に、「Cyclic Peptide Libraries an
d Method of Use Thereof to Identify
Binding Motifs」という表題を付けられているPCT出願番号P
CT/US98/10876、公開番号WO98/54577は、結合化合物に
対する結合モチーフを同定するための方法および組成物を記載しており、これは
天然および/または非天然αアミノ酸からなる環状ペプチドを利用している。
【0027】 一般的に、ペプチドモチーフのデータベースは、適応された縮重ペプチドライ
ブリー(例えば、上記に列挙される参考文献において記載されるライブラリー)
を、結合化合物とODPLとの間の相互作用を可能にするための条件下で接触さ
せることによって、生成される。結合化合物は、複合体が結合化合物とその結合
化合物と相互作用し得るライブラリーメンバーの亜集団(subpopulat
ion)との間に形成されるようにODPLと相互作用する。次いで、結合化合
物と相互作用し得るライブラリーメンバーの亜集団は、結合化合物と相互作用し
得るライブラリーメンバーから分離される。次いで、線状化ライブラリーメンバ
ー内の各縮重部位における異なるアミノ酸残基の相対量に基づいて、アミノ酸配
列モチーフがその結合化合物の相互作用部位について決定される。
【0028】 本明細書中で使用される場合、用語「結合化合物」とは、一つ以上の機構によ
ってペプチド上の相互作用部位と相互作用し得る化合物をいう。本発明によると
、例示的な結合化合物としては、酵素および結合タンパク質(例えば、キナーゼ
(例えば、プロテインセリン/スレオニンキナーゼ、プロテインチロシンキナー
ゼ、脂質キナーゼ)、ホスファターゼ(例えば、タンパク質ホスファターゼ、脂
質ホスファターゼ)、プロテアーゼ(例えば、セリンプロテアーゼ、システイン
プロテアーゼ))が挙げられ、そして結合タンパク質は、例えば、SH2ドメイ
ン、SH3ドメイン、抗体、WWドメイン、PTBドメイン、PDZドメイン、
LIMドメイン、プレクストリン(pleckstrin)相同ドメイン、ジン
クフィンガードメイン、細胞外増殖因子およびレセプター、接着分子、細胞間シ
グナル伝達分子、7回膜貫通レセプタータンパク質、イオンチャネル、メチルト
ランスフェラーゼ、ユビキチン化(ubiquitinating)酵素および
ペプチジルトランフェラーゼを含む。
【0029】 用語「相互作用」とは、結合化合物を適応された縮重ペプチドライブリーメン
バー上の相互作用部位に物理的に結合させる引力(attractive fo
rce)をいう。そのような引力としては、疎水性相互作用、親水性相互作用、
共有結合、イオン結合、荷電相互作用(charged interactio
n)などが挙げられる。
【0030】 相互作用部位に対する語句「アミノ酸配列モチーフ」は、相互作用部位につい
てのコンセンサス配列を表す複合アミノ酸配列を説明することが意図される。一
般的に、アミノ酸配列モチーフは、結合化合物と特異的かつ優先的に相互作用す
るアミノ酸残基を含み、そして囲むペプチドの領域を包含する。
【0031】 結合化合物および適応された縮重ペプチドライブリー(ODPL)が接触され
るような特定の条件は、特定の結合化合物および使用されるODPLによって変
動するが、結合化合物とその結合化合物と相互作用し得る亜集団のライブラリー
メンバーとの間で、複合体が形成されるように選択される。結合化合物が酵素で
ある場合、酵素およびODPLは、その酵素の酵素活性を維持する条件下で接触
される(例えば、キナーゼは、そのキナーゼによってライブラリーメンバーがリ
ン酸化され得るような条件下でODPLと共にインキュベートされる)。
【0032】 複合体が、結合化合物と、その結合化合物(「結合亜集団」として言及される
)と相互作用し得るライブラリーメンバーの亜集団との間で形成された後、その
結合亜集団は非結合亜集団(例えば、その結合化合物と相互作用しないそれらの
ライブラリーメンバー)から分離される。適用可能な場合、その結合亜集団は、
線状化される。
【0033】 ライブラリーメンバーの結合亜集団を、ライブラリーメンバーの非結合亜集団
から分離するための方法は、使用される特定の結合化合物に依存する。例えば、
一つの実施形態において、結合化合物は、固体支持体上に(例えば、カラム)に
固定されて、そしてライブラリーメンバーの結合亜集団は、固定された結合化合
物に結合されて残るが、非結合亜集団は洗浄される。アフィニティークロマトグ
ラフィーについての標準的な方法を使用して、そのような分離が可能である。結
合化合物は、当該分野に公知の方法を使用して固体支持体上に固定され得る。例
えば、その結合化合物は、グルタチオンSトランスフェラーゼ(GST)融合タ
ンパク質として調製されて、そしてグルタチオンアガロースビーズにGST融合
タンパク質を結合させることによって固定され得る。そのようなアプローチは、
多くの型の結合化合物について適切であるが、タンパク質−タンパク質相互作用
(例えば、SH2およびSH3ドメイン)を媒介するが、酵素活性を有さない結
合ドメインに対して特に好ましい。
【0034】 あるいは、結合化合物は、酵素活性を有し、そしてライブラリーの結合亜集団
の非結合亜集団からの分離は、その結合化合物による結合亜集団の酵素的改変に
基づいている。例えば、結合化合物がキナーゼである場合、ライブラリーメンバ
ーの結合亜集団はリン酸化されるが、非結合亜集団はリン酸化されない(実施例
において議論される)。従って、非結合亜集団からの結合亜集団の分離を達成す
るために、リン酸化されたペプチドは、非リン酸化ペプチドから分離され得る。
同様に、結合化合物がホスファターゼである場合、ライブラリーメンバーの結合
亜集団は、脱リン酸化されるが、非結合亜集団はリン酸化されたままである。従
って、非リン酸化ペプチドは、非結合亜集団からの結合亜集団の分離を達成する
ために、リン酸化ペプチドから分離され得る。
【0035】 一般的に、選択された結合ライブラリーメンバーは、標準的なアミノ酸配列決
定技術(例えば、エドマン分解)によって配列決定される。自動ペプチドシーケ
ンサーを使用して、ライブラリーメンバーのアミノ酸配列を決定し得る。好まし
くは、使用されるODPLは、可溶性合成ペプチドライブラリーであり、そして
ペプチドの亜集団が、自動ペプチドシーケンサーを使用して、大量の集団として
配列決定される。このアプローチは、複雑な混合物の配列において所定のサイク
ルにて、最も重要なことであるがその縮重部位において、多量の各アミノ酸残基
に関する情報を提供する。次いで、選択されたペプチド(例えば、結合亜集団)
における各縮重部位について、相対量値が、開始ライブラリーにおけるその位置
の多量の同じアミノ酸残基によって、ライブラリースクリーニング後(例えば、
ペプチドを複合体化して、そして分離した後)のその位置の多量の特定のアミノ
酸残基を除算することによって算出され得る。従って、ペプチドライブラリー内
の縮重部位におけるアミノ酸残基Xaaの相対量(RA)は、以下のように定義
される: RA=選択されたペプチドの集団におけるXaaの総数 最初の適応された縮重ペプチドライブリーにおけるXaaの総数 この相対量値は、例えば、PCT/US98/10876に記載されるようなバ
ックグランド汚染のために補正され得る。
【0036】 結合化合物に対する基質として利用し得るか、または結合化合物に結合し得る
ペプチドの集団に対して豊富ではなく、または不利な選択もされないアミノ酸残
基は、1.0の相対量を有する。特定の縮重部位(例えば、複合体化されたペプ
チド内のその位置において豊富な残基)において好ましいそれらのアミノ酸残基
は、1.0よりも大きな相対量を有する。好ましくないそれらのアミノ酸残基(
例えば、複合体化されたペプチド内のその位置において不利に選択された残基)
は、1.0未満の相対量を有する。縮重部位における各アミノ酸残基についての
相対量値に基づいて、好ましいアミノ酸残基(例えば、1.0よりも大きな相対
量を有するアミノ酸残基)がその位置において同定され得る。
【0037】 選択されたペプチドの集団(例えば、リン酸化されたペプチド)内の各縮重部
位における異なるアミノ酸残基の相対量に基づいて、相互作用部位のためのアミ
ノ酸配列モチーフ(例えば、プロテインキナーゼに対するリン酸化部位)が決定
され得る。アミノ酸配列モチーフは、そのペプチドの縮重領域を包含する。各縮
重部位におけるモチーフについて選択された特定のアミノ酸残基は、各位置にお
いて最も豊富なアミノ酸残基である。従って、特定の位置において、予め決定さ
れた閾値(例えば、1.0)よりも大きな相対量値を有するアミノ酸残基は、ア
ミノ酸配列モチーフ内のその位置におけるアミノ酸残基として選択され得る。従
って、そのアミノ酸配列モチーフは、各位置において多数のアミノ酸を含み得る
。予め決定された閾値は、任意の値であり得る。あるいは、全てのアミノ酸残基
は、各位置おいてそのモチーフ内に含まれ得る。
【0038】 本発明のこれらの局面および他の局面は、以下の図面および説明に関してかな
り詳細に記載される。以下の説明は、プロテインキナーゼによりリン酸化される
相互作用部位についてのアミノ酸配列モチーフの存在について問い合わせタンパ
ク質の分析をするための本システムの適用を例示し、本システムは、上記で議論
されるように、ほとんど全ての型の結合化合物の分析のために使用され得るとい
うことが理解されるべきである。
【0039】 図1を参照して、1つの実施形態において、アミノ酸配列評価システム100
は、疑問タンパク質アミノ酸配列を、公知の機能を有するタンパク質のドメイン
についてのアミノ酸配列モチーフに関して評価するために、そしてモチーフの各
々について、疑問アミノ酸配列におけるモチーフの存在についての定量的なスコ
アを生成するために提供される。スコアの定量的な性質は、疑問タンパク質アミ
ノ酸配列が、公知の機能を有するタンパク質と同じ機能を実行するという信頼度
を示す。システム100には、公知の機能を有するタンパク質のドメインについ
てのモチーフを記述する記録104a−nを包含するペプチドライブラリーデー
タベース102が含まれる。1つの実施形態において、ペプチドライブラリーデ
ータベース104a−n中の記録104a−nは、上記の配向されたペプチドラ
イブラリーアプローチに従って開発される。そのペプチドライブラリーベータベ
ース102の内容および機能は、図2に関して以下に詳細に記載される。
【0040】 アミノ酸配列評価システム100はまた、システム100とシステム100の
ユーザーとの間にインターフェースを提供する疑問配列ユーザーインターフェー
ス106を包含する。疑問配列ユーザーインターフェース106は、ユーザーか
らの入力を受け、そしてコンピュータモニタのようなディスプレイデバイス11
2上においてユーザーに表示されるディスプレイ情報110を作成する。疑問タ
ンパク質アミノ酸配列の検索を行うために、ユーザーは、ユーザー疑問入力10
8を、疑問配列ユーザーインターフェース106に提出する。ユーザー疑問配列
入力108は、ユーザーが検索を希望する疑問タンパク質アミノ酸配列を記載す
る。そのユーザー疑問配列入力108は、任意の形態をとり得る。例えば、その
ユーザーは、単一文字フォーマットで完全なアミノ酸配列を提供し得るか、また
は公に利用可能なSwissProtデータベースのようなデータベースに保存
されたタンパク質の名称を提供し得る。そのユーザー疑問配列入力108はまた
、その検索がどのように行われるかを示すユーザー優先性のようなさらなる情報
を含み得る。例えば、ユーザー疑問配列入力108は、ペプチドライブラリーデ
ータベース中の選択されたモチーフのみが、その検索に含められるべきであるこ
とを示し得る。
【0041】 一旦、そのユーザーが、そのユーザー疑問配列入力108をその疑問配列ユー
ザーインターフェースに提出すると、その疑問配列ユーザーインターフェース1
06は、疑問配列評価リクエスト114を作成し、そして疑問配列評価器116
に提出する。その疑問配列評価リクエスト114は、例えば、検索されるべき疑
問タンパク質アミノ酸配列の記載、およびユーザーの優先性の情報的記載(例え
ば、ペプチドライブラリーデータベース102中に表されるどのモチーフがその
検索に含まれるかなど)を含み得る。
【0042】 その疑問配列評価リクエスト114を受けた後、その疑問配列配列評価器11
6は、その疑問配列評価リクエスト114に含まれる疑問タンパク質アミノ酸配
列を評価する。例えば、その疑問配列評価器116は、その疑問タンパク質アミ
ノ酸配列を、ペプチドライブラリーデータベース102中に表されるそのモチー
フ104a−nに評価し、その疑問タンパク質アミノ酸配列中のそのモチーフ1
04a−nの存在を示す疑問配列評価結果118を作成し得る。このような評価
結果118を作成するための方法の例は、図4A〜Bに関してより詳細に以下に
記載される。その疑問配列評価器116は、その疑問配列評価結果118をその
疑問配列ユーザーインターフェース106に伝達し、これは、ディスプレイデバ
イス112に、そのユーザーによって目を通されるに適切なフォーマットにおい
て疑問配列評価結果118を記載するディスプレイ情報110を作成しおよび伝
達する。そのユーザーは、ユーザーディスプレイナビゲーションコマンド120
を使用してディスプレイ情報110に目を通し得る。
【0043】 公知の機能を有する公知のタンパク質のドメインの標的に対応するモチーフの
ための疑問配列スコアは、その疑問タンパク質アミノ酸配列が同じまたは類似の
機能を実行するか否かを予想するために使用され得る。例えば、可能なスコアの
範囲が、より高いスコアがより低いスコアを有するアミノ酸配列よりも公知のタ
ンパク質の同じ機能を実行する可能性があることを予測されるように命令され得
る。
【0044】 図1に示される種々のエレメントは、任意の多数の方法で実行され得る。例え
ば、その疑問配列評価器116および疑問配列ユーザーインターフェースの各々
は、ランダムアクセスメモリ(RAM)のようなコンピュータ読み出し可能メモ
リに存在するコンピュータプログラムとして実行され得る。このようなコンピュ
ータプログラムには、例えば、スタンドアローンアプリケーション、バックグラ
ウンドプロセス、プラグイン、およびダイナミックリンクライブラリーを単独ま
たは組み合わせて含む。その疑問配列ユーザーインターフェース106および疑
問配列評価器116は、単一のコンピュータまたは異なるコンピュータにおいて
実行するプログラムとして実行され得るか、または単一のコンピュータ上で実行
するか、またはネットワーク上に分配される単一のコンピュータプログラム中に
組み合わされ得る。
【0045】 その疑問配列ユーザーインターフェース106は、例えば、標準的なウェブブ
ラウザによってディスプレイ可能なウェブページとして実行され得る。その疑問
配列評価器116は、疑問配列ユーザーインターフェース106にイントラネッ
トまたはインターネット(例えば、公のインターネット)のようなネットワーク
上でアクセス可能なウェブ適合性サーバーとして実行され得る。
【0046】 疑問配列評価結果118は、疑問タンパク質アミノ酸配列におけるペプチドラ
イブラリーデータベース102からのモチーフの存在を示す任意の情報を含み得
る。例えば、1つの実施形態において、その疑問配列評価結果118は、ペプチ
ドライブラリーデータベースにおいて表されるモチーフに関して疑問タンパク質
アミノ酸配列の定量的スコアを含む。特定のモチーフに関する疑問配列タンパク
質アミノ酸配列のスコアは、例えば、疑問配列タンパク質アミノ酸配列がそのモ
チーフを含む信頼度を示す。したがって、このようなモチーフは、その疑問アミ
ノ酸配列が、特定のドメインのためのそのモチーフを含有するタンパク質によて
実行される同じかまたは類似の機能を実行するか否かを示し得る。
【0047】 その疑問配列評価結果118は、単一のモチーフに関して、疑問タンパク質ア
ミノ酸配列についての複数のスコアを含み得、そのスコアの各々は、疑問タンパ
ク質アミノ酸配列中の異なる部分配列に対応する。例えば、1つの実施形態(図
3に関してより詳細に以下に記載される)において、その疑問タンパク質アミノ
酸配列の部分配列は、そのペプチドライブラリーデータベース102のモチーフ
の各々に関して評価される。このような実施形態において、その疑問配列評価結
果118は、各モチーフに関して各部分配列についての評価結果(例えば、定量
的なスコア)を含み得る。更なる実施形態において、その疑問配列評価結果11
8は、各評価結果(例えば、定量的なスコア)について、その評価結果が対応す
るその疑問タンパク質アミノ酸配列の部分配列を同定するための同定器を含む。
その同定器は、例えば、疑問配列タンパク質アミノ酸配列内の部分配列の始めの
位置を示し得る。
【0048】 別の実施形態において、その疑問配列評価結果118は、選択された評価結果
のみを含む。例えば、その疑問配列評価結果118は、疑問配列タンパク質アミ
ノ酸配列(またはその部分配列)に特に良好に整合するモチーフについての評価
結果のみを含み得る。例えば、その疑問配列評価結果118が定量的なスコアを
含む場合、その疑問配列評価結果118は、所定の閾値を満足するそれらの定量
的なスコアのみを含み得る。さらなる実施形態において、その疑問配列ユーザー
インターフェース106は、疑問配列評価結果の選択されたものについてのみの
ディスプレイ情報110を作成し得る。例えば、その疑問配列ユーザーインター
フェース106は、疑問タンパク質アミノ酸配列(またはその部分配列)に特に
良好に整合するモチーフのみについてのディスプレイ情報110を作成し得る。
例えば、その疑問配列表結果118が定量的スコアを含む場合、その疑問配列ユ
ーザーインターフェース106は、所定の閾値を満足する定量的スコアについて
のみのディスプレイ情報110を作成し得る。
【0049】 ペプチドライブラリーデータベース102中のその記録104a−nの各々は
、タンパク質のドメインのモチーフを記載する情報を含む。そのペプチドライブ
ラリーデータベース102は、モチーフを記載する情報をスコア付けし得る任意
の種類のデータベースであり得る。本明細書に記載されるように、ペプチドライ
ブラリーデータベース102中のモチーフ記録104a−nが、配向されたペプ
チドライブラリーアプローチに従って作成され得るが、これは、本発明を限定す
るものではない。むしろ、記録104a−nは、任意の方法によって作製され得
る。配向されたペプチドライブラリーアプローチは、Cantleyらの、「S
ubstrate Specificity of Protein Kina
ses」と題された、米国特許第5,532,167号(本明細書にその全体が
参考として援用される)に詳細に記載される。例示的な配向された縮重ペプチド
ライブラリーは、Songyangら(Cell(1993)72:767−7
78);米国特許第5,532,167号および「Cyclic Peptid
e Libraries and Methods of Use There
of to Identify Binding Motifs」と題されたP
CT出願第PCT/US98/10876(公開番号WO98/54577)に
記載される。
【0050】 例示的実施例として以下により詳細に記載されるように、配向されたペプチド
ライブラリーアプローチによって決定されるアミノ酸配列モチーフは、疑問配列
タンパク質が、特定のタンパク質キナーゼについての基質であるか否かを予想す
るために有用である。疑問タンパク質の一次アミノ酸配列は、決定されたアミノ
酸配列モチーフの存在について試験され得る。その同じ配列または非常に類似の
モチーフがそのタンパク質に存在する場合、そのタンパク質がそのタンパク質キ
ナーゼについての基質として機能し得ることが予想され得る。
【0051】 そのモチーフは、公知の機能を有するタンパク質のドメインに対応するが、そ
のモチーフが対応するそのタンパク質の機能は、公知である必要はない。例えば
、そのデータベース中のそのモチーフ記録104a−nに対応するそのタンパク
質によって実行される機能が公知でない場合、本明細書に記載されるその技術は
、疑問タンパク質アミノ酸配列とそのペプチドライブラリーデータベース102
に表されるモチーフとの間の対応度を決定するためになお使用され得る。このよ
うな対応度は、そのモチーフに対応するペプチドの機能が後で発見された場合、
またはその疑問タンパク質アミノ酸配列によって実行される機能が公知である場
合に、引き続き有用になり得る。
【0052】 1つの実施形態において、そのペプチドライブラリーデータベース102中の
その記録104a−nは、表として表される。このような表300の例は、図2
に示される。表300が、ペプチドライブラリーデータベース102(図1)に
おける記録104a(モチーフ1)に対応するという以下に記載の目的を仮定す
る。表300における列は、モチーフ1の位置に対応し、そして表300の行は
、アミノ酸に対応する。この実施例において、モチーフ1は、−4から+4で番
号付けされた9個の位置を含み、この中で、位置−4から−1および+1から+
4は、縮重位置であり、そしてその中で、位置ゼロは、非縮重位置である。モチ
ーフ1は、縮重および非縮重位置の両方を含むが、そのペプチドライブラリーデ
ータベースは、任意の数の縮重および非縮重位置を有するモチーフに対応する記
録を含み得る。図2に示されるように、モチーフ1中の単一の非縮重位置(位置
ゼロ)は、チロシンに対応する。
【0053】 特定の行(アミノ酸に対応する)および列(位置に対応する)の表300の各
セルは、その位置でのアミノ酸の相対的な豊富さに対応する優勢値を含む。例え
ば、位置−1のリジンの優勢値は、0.60033であり、これは、リジン(L
ys)に対応する行および−1と番号付けされた列でスコアされた値である。し
たがって、モチーフ1の任意の位置に関する任意のアミノ酸の優勢値は、表30
0を参照して容易に決定し得る。表300は、全てのアミノ酸についての、また
は全ての細胞内の優勢値を含む必要はない。表300が対応するモチーフにおけ
る特定の位置での特定のアミノ酸についての優勢値を含まない場合、適切なデフ
ォルト値が置き換えられ得る。例えば、そのモチーフが、各位置において選択さ
れたアミノ酸残基のみ(例えば、所定の閾値を越えるアミノ酸残基)を含む1つ
の実施形態において、特定の位置においてモチーフ中にないアミノ酸は、例えば
、1または0のようなその位置でのデフォルト優性値を与えられる。
【0054】 ユーザーは、標準的なキーボードまたはマウスのような任意の適切な入力デバ
イスを使用して、ユーザー疑問配列入力を提供し得る。
【0055】 図3を参照して、1つの実施形態において、その疑問配列評価器116は、疑
問タンパク質アミノ酸配列を、プロセス301に従って評価する。その疑問配列
評価器116は、その疑問配列評価リクエスト114を、疑問配列ユーザーイン
ターフェース106から受ける(ステップ302)。上記のように、疑問配列評
価リクエスト114は、検索されるべき疑問タンパク質アミノ酸配列の記載を含
み、そしてペプチドライブラリーデータベース102中のどの記録104a−n
がその検索に含まれるべきか否かを示すさらなる情報をさらに含み得る。その疑
問タンパク質アミノ酸配列(ステップ304)内の位置psで始まるその疑問タ
ンパク質アミノ酸配列における各部分配列について、およびそのペプチドライブ
ラリーデータベース(102)(ステップ306)において表される各モチーフ
について、その疑問配列評価器116は、モチーフmに関してその部分配列sを
評価する(ステップ308)。その疑問配列評価器116がその疑問タンパク質
アミノ酸配列を評価し得る方法の例は、図4A−Cを参照して以下により詳細に
記載される。
【0056】 疑問タンパク質アミノ酸配列(ステップ308)の評価は、将来の使用(ステ
ップ310)のために記憶される疑問配列評価結果(例えば、定量スコア)を生
成する。この評価結果は、例えば、カラムsおよび列mの二次元結果アレイで記
憶され得る。この評価結果は、この評価結果が対応するアミノ酸部分配列および
モチーフと関連する限り任意の方法で記憶され得る。
【0057】 ステップ308−310を残りのモチーフ(ステップ312)および疑問タン
パク質アミノ酸配列(ステップ314)の残りの部分配列について繰り返す。図
4に示される例示のプロセス400は、ペプチドライブラリーデータベース10
2内のすべてのモチーフに関して疑問タンパク質アミノ酸配列のすべての部分配
列を評価するけれども、この疑問タンパク質アミノ酸配列のすべてより少ない部
分配列が、このペプチドライブラリーデータベース102に提示されるモチーフ
のすべてより少ないモチーフに関して評価され得る。すべての疑問配列評価結果
118が生成された後、それらは、疑問配列ユーザーインターフェース106に
伝達される(ステップ316)。
【0058】 本発明の1つの実施形態では、「ログ−サム法(log−sum metho
d)」と呼ばれる方法を用いて、あるモチーフに関する疑問タンパク質アミノ酸
配列を評価する。特に、このログ−サム法を用いて図4Aでプロセス400によ
って示されるように、ステップ308(図3)を履行し得る。このログ−サム法
は、疑問タンパク質アミノ酸配列がスコアされているモチーフ中のアミノ酸の各
優勢値の結果の対数に基づいて、スコアを疑問タンパク質アミノ酸配列に割り当
てる。これは、数学的に、各アミノ酸の優勢値の対数を合計することと等価であ
る。この優勢値の対数は化学的結合エネルギーの反映と考えられ得ることにまた
注意のこと。この優勢値は、ログ−サム法で用いられる前に標準化され得る。例
えば、表300(図2)中のカラムの各々における値は、15の合計に標準化さ
れる。
【0059】 図4Aを参照して、疑問配列評価器は116は、疑問タンパク質アミノ酸配列
の位置Pqで始まる部分配列に対し、以下のようなログ−サム法に従うプロセス
400を用いて、モチーフmに関するスコアを生成し得る。プロセス400は、
疑問タンパク質アミノ酸配列がGNGDYMPMSである説明する例に関して記
載され、モチーフmに対応するペプチドライブラリーデータベース102中の記
録は、表400(図4)中に示される優勢値を含む。疑問配列評価器116は、
このスコアを値ゼロに初期化し(ステップ402)、そしてこのモチーフmに対
応し、それに対しこのスコアが生成されている(ステップ404)ペプチドライ
ブラリーデータベース102中の記録rを同定する。この例では、拾われる記録
rの内容は、表400中に示されている(図2)。次いで疑問配列評価器116
は、このモチーフ中の各位置pm上のループに入る(ステップ406)。この例
では、このモチーフの位置は−4から+4に番号付けられている。このような位
置pmの各々について、疑問配列評価器116は、位置(ps+pm)で疑問配列
中のアミノ酸を同定する(ステップ408)。この例では、第1番目の位置(位
置−4)にある疑問タンパク質アミノ酸配列(GNGDYMPMS)中のアミノ
酸はGである。疑問配列評価器116は、記録Rから、このモチーフの位置pm
にある同定されたアミノ酸の優勢値pvを拾う(ステップ410)。この例では
、位置−4におけるG(Gly)の優勢値は1.5284である。これは、表3
00の「Gly」と標識された列および−4と番号付けられた内容によって表さ
れる。同定されたアミノ酸について位置pmでモチーフ中の優勢値がない場合、
疑問配列評価器は、適切なデフォールト値、例えば1で置換し得る。この例では
、モチーフ中の非縮重位置に、優勢値16を含むアミノ酸(Tyr)があること
に注意のこと。しかし、非縮重位置にあるアミノ酸に対する優勢値には、任意の
優勢値が割り当てられ得る。1より少ない優勢値は無視され得る。代替のアプロ
ーチは、部分配列内の正確な位置に非縮重アミノ酸を含む部分配列のみをスコア
することである。
【0060】 疑問配列評価器116は、モチーフに対するスコアを、このスコアに優勢値p
vの対数(例えば、自然対数または常用対数)を付加することによりアップデー
トする(ステップ412)。モチーフm内の特定位置における優勢値は、ステッ
プ412における対数の算出前に標準化され得る。この例では、この優勢値の対
数は約0.1842である。ステップ408および410は、疑問タンパク質ア
ミノ酸配列中の残りのアミノ酸について繰り返される。このループの終りでは(
ステップ414)、スコアは、疑問タンパク質アミノ酸配列中のアミノ酸の各々
の優勢値の対数の合計に等しい。この例では、このスコアは、2.42にほぼ等
しい。
【0061】 このスコアは、このスコアをステップ402で値1に初期化することにより、
このスコアにステップ412で優勢値pvを乗じることにより、およびステップ
414の後のスコアの対数を算出することによって、代替的および等価に算出さ
れ得ることを認識すべきである。これらステップの置換は等価な結果を生成する
。なぜなら、複数の値の対数の合計は、値の積の対数に等しいからである。
【0062】 1つの実施形態では、ステップ410で拾われた各優勢値pvは、この優勢値
pvの対数がステップ412で算出される前に、定数値cによって増加される。
この定数Cの付加は、より低い優勢値の重きがより少ない対数関数の領域に向か
って拾われた優勢値をシフトするために用いられ得る。この定数値cは任意の方
法で選択され、そして任意の値であり得る。1より少ない優勢値は無視され得る
か、または1に等しいように増加され得る。
【0063】 本発明の1つの実施形態では、「エントロピー法」と称され方法を用いて疑問
配列中のモチーフの存在をスコアする。このエントロピー法によれば、モチーフ
中の各位置における各アミノ酸の優勢値Piは、確率に翻訳される(すべての確
率の合計は1に等しい)。piのlog2は、アミノ酸iのその位置における相対
的「エントロピー密度」の尺度として用いられ、そして累積スコアが算出される
。各位置における値は、−無限大(最悪のマッチ、すなわちモチーフ中に残基が
決して存在しない)〜完全マッチ(pi=1)に対するゼロまでの範囲にある。
次いで、得られるスコアは、モチーフ中の縮重位置の数に対して平均される。よ
り低いスコアは、疑問タンパク質アミノ酸配列がこのモチーフを含むというより
高い程度の確信を示し、その一方、より高いスコアは、より低い程度の確信を示
す。
【0064】 図4Bを参照して、疑問配列評価器116は、以下のようにエントロピー法に
より、プロセス308bを用い、モチーフmに関してアミノ酸部分配列を評価し
得る(図3のステップ308)。説明する例に関して記載されるプロセス420
は、疑問タンパク質アミノ酸配列がGSEEYMNMDであり、そしてこのモチ
ーフに対応するペプチドライブラリーデータベース102中の記録は表300中
に示される優勢値を含む(図2)。疑問配列評価器116は、スコアを値ゼロに
初期化し(ステップ422)、そしてスコアが生成されているモチーフに対応す
るこのペプチドライブラリーデータベース102中の記録rを同定する(ステッ
プ404)。この例では、拾われる記録rの内容は、表300中に示される(図
2)。モチーフm中の各位置pmについて、疑問配列評価器116は、確率の合
計が1に等しくして、優勢値を確率に翻訳することにより位置pmにおける優勢
値を標準化する。これは、例えば、特定位置における優勢値のすべてを合計し、
そして各々の優勢値をこの合計で除することにより実施され得る。これらの確率
は、以下に記載のように、プロセス308bのすべての引き続くステップによっ
て用いられる。
【0065】 次いで、疑問配列評価器116は、モチーフm中の各位置pm上のループに入
る(ステップ406)。この例では、このモチーフの位置は−4から+4で番号
付けられる。各428の位置pmについて、疑問配列評価器116は、位置(ps +pm)における疑問配列中のアミノ酸を同定する(ステップ430)。この例
では、疑問タンパク質アミノ酸配列中(GSEEYMNMD)の第1番目の位置
(位置−4)のアミノ酸はGである。疑問配列評価器116は、記録rから、こ
のモチーフmの位置pmにおける同定されたアミノ酸の確率値を拾う(ステップ
432)。この例では、位置−4におけるG(Gly)の確率値は0.1019
である。
【0066】 疑問配列評価器116は、スコアに、拾われた確率値の負の対数(例えば、自
然対数または常用対数)を付加することによりこのスコアをアップデートする(
ステップ434)。ステップ430−434を、疑問アミノ酸部分配列中の残り
のアミノ酸について繰り返す。このループが終了した後(ステップ436)、ス
コアを、モチーフm中の位置の数(この例では9)により除し、最終スコアを得
る(ステップ438)。この例では、この最終スコアは、3.3691にほぼ等
しい。
【0067】 本発明の1つの実施形態では、定量的構造−活性関係(QSAR)を利用する
方法を用いて疑問配列中のモチーフの存在をスコアする。QSARによれば、定
量的スコアを、アミノ酸の物理化学的性質に割り当てる。例えば、1つの実施形
態では、第1のスケール(z1と標識される)を、アミノ酸親水性に割り当て、
第2のスケール(z2と標識される)をサイズに割り当て、そして第3のスケー
ル(z3と標識される)を極性(電気的影響)に割り当てる。以下の論議の目的
のために、これらのスケールを「zスケール」と称する。QSARは、「定量的
構造−活性関係のための最小アナログペプチドセット(MAPS)」 Sven
Hellbergら、Int.J.Peptide Protein Res
.37(1991)、414−424頁中により詳細に記載されている。各アミ
ノ酸は、各zスケールについて特定の値を有している。このような値は実験的に
得られ得るか、または予め存在する供給源から得られ得、そして将来の使用のた
めにデータベース中に記憶される。
【0068】 モチーフに関する疑問タンパク質アミノ酸配列またはその他の化学的構造のス
コアは、このモチーフに対してペプチドライブラリーデータベース102中に記
憶された優勢値を用い、そしてこのモチーフ中のアミノ酸のzスケール値を用い
て算出され得る。このモチーフ内の各位置におけるアミノ酸の公知の優勢値およ
び各アミノ酸の公知のzスケール値が与えられれば、モチーフmの特定の位置x
における特定の化学的構造の優勢値pを、この化学的構造のzスケール値z1
2、z3に関係付ける等式:Pm.x=az1+bz2 2+cz3 3が誘導され得る。
【0069】 係数a、b、およびcの値は、zスケール値(z1、z2、およびz3)と優勢
値Pm.xとの間の相関を特徴付けるために適切に設定される。従って、等式(2
)は、化学的構造の公知のzスケール値に基づいてアミノ酸またはその他の化学
的構造に対する優勢値を算出するために用いられ得る。モチーフmの位置xにお
ける化学的構造に対する優勢値pm.xを算出するために、疑問配列評価器116
は、単に、この化学的構造のzスケール値を、適切な値の係数a、b、およびc
をもつ等式(2)の形態中に置換する。優勢値を算出するための等式(2)の使
用は、例えば、ペプチドライブラリーデータベース102が特定のアミノ酸また
はその他の化学的構造に対する優勢値を含んでいないときに有用であり得る。等
式(2)を用いて一旦優勢値が算出されると、この優勢値は、ペプチドライブラ
リーデータベース102中に記憶され得るか、および/または(上記のログ−サ
ム法またはエントロピー法のような)任意の適切な方法を用いて疑問タンパク質
アミノ酸配列のためのスコアの算出に用いられ得る。
【0070】 コンピューター効率の目的には、各モチーフmおよび各位置xに対する等式(
2)の係数a、b、およびcは、疑問配列評価器116によって、任意の疑問配
列の評価の前に生成され得る。このような係数の予備生成は、係数の値を生成し
なければならないことはなく、評価プロセスの間に化学的構造に対する優勢値が
迅速に生成されることを可能にする。位置xにおける特定のモチーフmに対する
係数a、b、およびcは、任意の適切な方法を用いて生成され得る。例えば、モ
チーフmの位置xにおける少なくとも3つのアミノ酸の優勢値およびzスケール
値が公知である場合、この係数a、b、およびcは、標準的な代数学手法を用い
て等式(2)を解くことにより得られ得る。
【0071】 (例えば、上記のようなログ−サム法またはエントロピー法に従って)モチー
フに関し、アミノ酸配列(または部分配列)に対する最終スコアが算出された後
、(例えば、疑問配列評価器116または疑問配列ユーザーインターフェース1
06により)「パーセンタイル値スコア」もまた算出され得る。このようなパー
センタイル値スコアは、疑問タンパク質アミノ酸配列に対する最終スコアが、同
じモチーフに関して評価されたとき非縮重残基を含むその他のアミノ酸配列の最
終スコアと比較してランクされる場所を示す。従って、パーセンタイル値スコア
は、疑問タンパク質アミノ酸配列に対する最終スコアを解釈するために有用であ
り得る。このようなパーセンタイルスコアを生成するために(例えば、疑問配列
評価器116により)実施され得るプロセス500の1つの例のフローチャート
を図5に示す。この疑問配列評価器116は、このモチーフに関し、公衆に利用
可能なSwiss Protデータベースのようなアミノ酸配列データベース中
のすべてのアミノ酸配列について、(例えば、図4A−Bに関して上記のように
)最終スコアを算出し、そして最終スコアのヒストグラムを生成する(ステップ
504)。疑問タンパク質アミノ酸配列の最終スコアの位置が、このヒストグラ
ム内で同定される(ステップ506)。疑問タンパク質アミノ酸配列のパーセン
タイル値スコアは、疑問タンパク質アミノ酸配列に対する最終スコアより大きい
(または用いたスコアリング方法に依存して、これより少ない)スコアの数を割
ることにより算出される(ステップ508)。
【0072】 1つの実施形態では、ステップ504で生成された最終スコアのヒストグラム
を用いて、疑問配列評価結果118中の疑問配列に対するスコアを含めるか否か
、あるいは、スコアに対するディスプレイ情報110を生成するか否かを決定す
る。例えば、1つの実施形態では、疑問配列評価器116は、最終スコアが、ヒ
ストグラム中でスコアの最良の5%以内のように、ヒストグラムの所定の領域内
に入る場合、疑問配列評価結果118中の疑問タンパク質アミノ酸配列に対する
最終スコアを含めるだけである。別の実施形態では、疑問配列評価器116は、
最終スコアがヒストグラムの平均から2標準偏差より遠い場合、疑問配列評価結
果118内の疑問タンパク質アミノ酸配列に対する最終スコアを含めるのみであ
る。その他の方法を用いて、疑問配列評価結果118中の疑問タンパク質アミノ
酸配列に対する最終スコアを含めるか否かを決定し得ること、しかも疑問配列ユ
ーザーインターフェース106のような、疑問配列評価器116以外のコンポー
ネントを用いて、最終スコアをフィルターにかけ得ることを認識すべきである。
【0073】 一旦疑問タンパク質アミノ酸配列が、ペプチドライブラリーデータベース10
2中に提示される1つ以上のモチーフに関して評価されると、疑問配列ユーザー
インターフェース106は、評価の結果をディスプレイデバイス112に提示す
るディスプレイ情報110を生成および伝達し得る。このディスプレイ情報11
0は、例えば、1つ以上のモチーフに関して疑問タンパク質アミノ酸配列の最終
スコア(単数または複数)を表示するための情報を含み得る。1つの実施形態で
は、このディスプレイ情報110は、疑問タンパク質アミノ酸配列の選択された
最終スコア、例えば、所定の閾値を満足するスコアを表示するための情報を含む
だけである。この所定の閾値は任意の値であり得、そして任意の方法で選択され
得る。ディスプレイ情報110中に選択された最終スコアのみを含めることは、
ペプチドライブラリーデータベース102中の対応するモチーフに特にマッチす
るらしいようなアミノ酸部分配列のみの最終スコアのグラフのディスプレイをユ
ーザーに提供するために用いられ得る。
【0074】 図6Aを参照して、1つの実施形態では、ディスプレイ情報110は、疑問タ
ンパク質アミノ酸配列のドメイン構造上に二重に映された、ペプチドライブラリ
ーデータベース102からの潜在的にマッチするモチーフを表示するグラフのデ
ィスプレイ600を含む。より詳細には、疑問タンパク質アミノ酸配列グラフエ
レメント602は、水平の小片として疑問タンパク質アミノ酸配列の構造を表示
し、この小片の最も左のエッジは、疑問タンパク質アミノ酸配列中の第1番目の
位置を表し、そしてこの小片の最も右のエッジは、疑問タンパク質アミノ酸配列
の最後の位置を表す。疑問タンパク質アミノ酸配列グラフエレメント602の下
に表示されたx軸604は、疑問タンパク質アミノ酸配列グラフエレメント60
2中のローケーションまたは位置の可視的な指標を提供する。従って、ユーザー
は、このx軸604を参照することにより、疑問タンパク質アミノ酸配列グラフ
エレメント602中の任意の点の位置を迅速に識別し得る。1つの実施形態では
、疑問タンパク質アミノ酸配列が公知のドメインを含む場合、グラフエレメント
602は、各々が、疑問タンパク質アミノ酸配列の配列相同性に基づく公知また
は推定ドメインを表すサブエレメントに分割される。
【0075】 疑問タンパク質アミノ酸配列グラフエレメントの上に表示されて、モチーフ同
定器606a−fがあり、ペプチドライブラリーデータベース102からのその
モチーフが、疑問タンパク質アミノ酸配列中の部分配列に特に良好にマッチする
タンパク質ドメインを示す。例えば、モチーフ同定器606eは、Ablキナー
ゼドメインが、疑問タンパク質アミノ酸配列中の位置Y266で疑問タンパク質
アミノ酸配列中の部分配列にマッチするモチーフを有することを示す。モチーフ
は、グラフディスプレイ600中の表示のために、例えば、疑問タンパク質アミ
ノ酸配列の最終スコアが、上記のような所定の閾値を満足するようなモチーフの
みを選択することによって選択され得る。このようなモチーフ同定器606a−
fを表示することは、ユーザーが疑問タンパク質アミノ酸配列に最も緊密にマッ
チするようなモチーフを迅速に同定することを可能にする。
【0076】 図6中にさらに示されるように、モチーフ同定器606a−fは、y軸604
に沿って位置し、yでは、それらがマッチする疑問タンパク質アミノ酸配列中の
ドメインの最初の位置に対応する。例えば、(位置Y266でAblキナーゼド
メインを同定する)モチーフ同定器606eはyに位置し、x軸に沿って266
に釣り合う。モチーフ同定器606a−fが疑問タンパク質アミノ酸配列中で対
応する位置にこれらを表示することは、ユーザーがマッチするモチーフの位置を
迅速かつ容易に視覚によって同定することを可能にする。
【0077】 図7Aを参照して、1つの実施形態では、疑問配列ユーザーインターフェース
106は、プロセス700を用い、疑問配列ユーザーインターフェース106が
疑問配列評価器116から疑問配列評価結果を受けた後にグラフディスプレイ6
00を生成する。疑問配列ユーザーインターフェース106は、疑問タンパク質
アミノ酸配列エレメント602を生成する(ステップ702)。疑問配列ユーザ
ーインターフェース106は、x軸604を生成する(ステップ704)。1つ
の実施形態では、この疑問配列ユーザーインターフェース106は、疑問タンパ
ク質アミノ酸配列に特に良好にマッチするモチーフを、上記のように、そのスコ
アが所定の閾値を満足するモチーフを選択することによるように、選択する。1
つの実施形態では、疑問配列評価器116により生成された疑問配列評価結果1
18は、モチーフが疑問タンパク質アミノ酸配列にマッチする位置を述べる情報
を含む。疑問配列ユーザーインターフェース106は、この情報を用い、それら
が疑問タンパク質アミノ酸配列にマッチする位置で良好にマッチするモチーフの
ためのモチーフ同定器を生成する(ステップ708)。
【0078】 図6Bを参照して、1つの実施形態では、ディスプレイ情報110は、疑問タ
ンパク質アミノ酸配列にマッチする特定のモチーフについて情報を表示するグラ
フディスプレイ620620を含む。このグラフディスプレイ620は、情報が
グラフディスプレイ620に表示されるモチーフに対応するドメインの名前を表
示するタイトル622を含む。このグラフディスプレイ620は、列624a−
cを含み、その各々は、このモチーフが特に良好にマッチする疑問タンパク質ア
ミノ酸配列内のドメインの最初の位置に対応する。このグラフディスプレイは、
位置カラム626、スコアカラム628、および配列カラム630を含む。位置
カラム626中の値は、モチーフが疑問配列にマッチする位置を示し、スコアカ
ラム628中の値は、疑問タンパク質アミノ酸配列に関するモチーフのスコアを
示し、そして配列カラム630中に示される配列は、このモチーフに特に良好に
マッチすると考えられる疑問タンパク質アミノ酸配列内の部分配列を示す。各々
について、列624a中に表示される情報は、SRCキナーゼドメインが、疑問
タンパク質アミノ酸配列内の位置141で始まる疑問タンパク質アミノ酸配列に
特に良好にマッチしたこと、SRCキナーゼドメインが(例えばログサム法に従
って)3.4710のスコアを有していたこと、そしてSRCキナーゼドメイン
に特に良好にマッチした疑問タンパク質アミノ酸配列内の部分配列がDEDIY
SGLSであったことを示す。1つの実施形態では、グラフディスプレイ620
に類似の複数のグラフディスプレイが生成され、その各々が、異なるモチーフに
ついての情報を表示する。1つの実施形態では、グラフディスプレイ600(図
6A)は、グラフディスプレイ620中に含まれた情報へのハイパーリンクを含
む。例えば、グラフディスプレイ600(図6A)中のモチーフ同定器606a
−fは、対応するモチーフについての情報を表示するグラフディスプレイ620
(図6B)のようなグラフディスプレイへのハイパーリンクを含み得る。従って
、グラフディスプレイ600中のモチーフ同定器606a−fの1つを(例えば
マウスまたはキーボードを用いて)選択することにより、ユーザーは、疑問配列
ユーザーインターフェース106に、選択されたモチーフ同定器に対応するモチ
ーフについてグラフディスプレイ(例えば、図6B中のグラフディスプレイ62
0)を生成させ得る。
【0079】 図7Bを参照して、1つの実施形態では、疑問配列ユーザーインターフェース
106は、プロセス720を用いて、グラフディスプレイ600(図6A)中の
モチーフ同定器606a−fの特定の1つのユーザーの選択に応答してグラフデ
ィスプレイ620を生成する。この実施形態では、疑問タンパク質アミノ酸配列
は、公知の位置でドメインを含み、そして疑問配列評価結果118は、疑問タン
パク質アミノ酸配列内の各々のドメインに関して選択されたモチーフに対する評
価結果を含む。しかし、他の実施形態では、類似の方法を用いてグラフディスプ
レイ620を生成し得ることが認識されるべきである。疑問タンパク質アミノ酸
配列内の各部分配列s(位置psにある)について(ステップ722)、選択さ
れたモチーフに関する部分配列のスコアが、疑問配列評価結果から拾われる(ス
テップ724)。拾われたスコアが所定の閾値を満足する場合、位置ps、拾わ
れたスコア、および部分配列sの配列が、図6Bに示されるように表示される(
ステップ728)。ステップ724−728が、疑問タンパク質アミノ酸配列中
の残りのドメインについて繰り返される。
【0080】 図5について上記で記載したように、疑問配列評価器116は、疑問タンパク
質アミノ酸配列に対するパーセンタイル値スコアを生成し得る。図6Cを参照し
て、1つの実施形態では、ディスプレイ情報110は、パーセンタイル値スコア
の記述する情報を含む。例えば、図6Cに示されるように、ディスプレイ情報1
10は、グラフディスプレイ640を記載し得る。このグラフディスプレイ64
0は、ステップ504中で生成されるヒストグラムを表示するヒストグラムディ
スプレイ642を含む(図5)。グラフディスプレイ640はまた、ヒストグラ
ム中に表されたその他のアミノ酸配列の最終スコアに関して、疑問タンパク質ア
ミノ酸配列の最終スコアがある場所を示すx軸上に配置された疑問タンパク質ア
ミノ酸配列マーカー644を含む。このようなディスプレイ640を用い、ユー
ザーは、ヒストグラムにおいて、疑問タンパク質アミノ酸配列のスコアを、その
他のアミノ酸配列のスコアに対してどのように比較するかを迅速かつ容易に視覚
により同定し得る。
【0081】 図7Cを参照して、1つの実施形態では、疑問配列ユーザーインターフェース
106は、プロセス740を用いて、ステップ504で生成されたヒストグラム
を表示するヒストグラムディスプレイ642を含むグラフディスプレイ640を
生成する。疑問配列ユーザーインターフェース106は、ヒストグラムディスプ
レイ640を生成する(ステップ742)。次いで、疑問配列ユーザー106は
、スコアに対応する位置に、ヒストグラムディスプレイ640上で疑問タンパク
質アミノ酸配列マーカー644を生成する(ステップ744)。
【0082】 1つ以上のコンピュータープログラムとして図1のシステムを履行するための
コンピューターシステムは、代表的には、ユーザーに情報を表示する出力デバイ
スおよびユーザーからの入力を受ける入力デバイスの両方に連結された主ユニッ
トを含む。この主ユニットは、一般に、相互接続機構を経由してメモリシステム
に連結されたプロセッサを含む。入力デバイスおよび出力デバイスもまた,相互
接続機構によりプロセッサおよびメモリシステムに連結される。
【0083】 1つ以上の出力デバイスがコンピューターシステムに連結され得ることを理解
すべきである。例示の出力デバイスは、カソード光線管(CRT)ディスプレイ
、液晶ディスプレイ(LCD)、プリンター、モデムのような通信デバイス、お
よび音声出力を含む。1つ以上の入力デバイスがコンピューターシステムに連結
され得ることもまた理解すべきである。例示の入力デバイスは、キーボード、キ
ーパッド、トラックボール、マウス、ペンおよびタブレット、通信デバイス、お
よびセンサーのようなデータ入力デバイスを含む。本発明は、コンピューターシ
ステムと組み合わせて用いられる特定の入力または出力デバイスまたは本明細書
に記載のものに制限されないことを理解すべきである。
【0084】 コンピューターシステムは、C++、Java(登録商標)、またはスクリプ
ト言語またはアセンブリ言語のようなその他の言語を用いてプログラム可能であ
る一般目的のコンピューターシステムであり得る。コンピューターシステムはま
た、特別にプログラムされた特別目的のハードウェアを含み得る。一般目的のコ
ンピューターシステムでは、プロセッサは、代表的には、市販のプロセッサであ
り、その例として、インテル社から入手可能であるシリーズx86およびペンテ
アムプロセッサ、AMD社およびCyrix社からの類似のデバイス、モトロー
ラ社から入手可能である680X0シリーズマイクロプロセッサ、IBM社から
のPowerPCマイクロプロセッサおよびDigital Equipmen
t CorporationからのAlphaシリーズプロセッサがある。多く
のその他のプロセッサが利用可能である。このようなマイクロプロセッサは、オ
ペレーティグシステムと呼ばれるプログラムを実行する。その例として、Win
dowNT、UNIX(登録商標)、DOS、VMSおよびOS8があり、これ
は、その他のコンピュータープログラムの実行を制御し、そしてスケジュール管
理、デバッグ、入力/出力コントロール、アカウンティング、コンパイル、記憶
割り当て、データ管理およびメモリ管理、ならびに通信制御および関連するサー
ビスを提供する。プロセッサおよびオペレーティングシステムは、高レベルのプ
ログラミング言語のアプリケーションプログラムが書かれるコンピュータープラ
ットホームを規定する。
【0085】 メモリシステムは、代表的には、コンピューターが読み出し可能かつ書き込み
可能な記録媒体を備え、その例として磁気ディスク、フラッシュメモリおよびテ
ープがある。ディスクは、フロッピー(登録商標)ディスクとして知られ取り出
し可能でるか、ハードドライブとして知られ永久的である。ディスクは、代表的
には、バイナリー形態、すなわち、1および0のシークエンスとして解釈される
形態である信号が記憶される多くのトラックを有する。このような信号は、マイ
クロプロセッサにより実行されるアプリケーションプログラムまたはアプリケー
ションプログラムにより処理されるディスク上に記憶される情報を規定し得る。
代表的には、オペレーションに際し、プロセッサは、データを、不揮発性媒体か
ら、代表的には、動的ランダムアクセスメモリ(DRAM)または静的メモリ(
SRAM)のような、揮発性のランダムアクセスメモリである集積回路メモリエ
レメント中に読み出させる。集積回路メモリエレメントは、ディスクが行うより
迅速なプロセッサによる情報へのアクセスを可能にする。一般に、プロセッサは
、集積回路内のデータを操作し、次いで処理が終了するとき、データをディスク
にコピーする。ディスクと集積回路メモリエレメントとの間のデータ移動を管理
するための種々の機構が知られ、そして本発明はそれに限定されない。本発明は
特定のメモリシステムに制限されないこともまた理解すべきである。
【0086】 本発明は、特定のコンピュータープラットホーム、特定のプロセッサ、または
特定の高レベルプログラミング言語に制限されないことを理解すべきである。さ
らに、コンピューターシステムは、マルチプロセッサコンピューターシステムで
あり得るか、またはコンピューターネットワーク上に連結された複数コンピュー
ターを含み得る。図1中の各モジュール(例えば、102、106、116)は
、コンピュータープログラムの分離したモジュールであり得るか、または別のコ
ンピュータープログラムであり得ることを理解すべきである。このようなモジュ
ールは、別のコンピューター上で作動可能であり得る。データ(例えば、108
および114)は、メモリシステム中に記憶され得るか、またはコンピューター
システム間で伝達され得る。本発明は、ソフトウェアまたはハードウェアまたは
ファームウェア、またはその任意の組み合わせを用いる任意の特定の履行に制限
されない。個々に、または組み合わせてのいずれかで、システムの種々のエレメ
ントが、コンピュータープロセッサによる実行のための機械読み取り可能な記憶
デバイス中に確実に埋め込まれたコンピュータープログラムとして実行され得る
。プロセスの種々のステップが、入力に際し作動すること、および出力を生成す
ることによって機能を実施するために、コンピューター読み出し可能な媒体上に
確実に埋め込まれたプログラムを実施するコンピュータープログラムにより実施
され得る。このようなシステムを履行するために適切なコンピュータープログラ
ミング言語は、手続的プログラミング言語、オブジェクト指向プログラミング言
語、およびこれら2つの組み合わせを含む。
【0087】 ここで記載された2〜3の実施形態があれば、前述の事項は単なる例示であり
、例示のみにより提示されて限定的でないことは当業者に明らかである。多くの
改変およびその他の実施形態が、当業者の範囲内にあり、そして請求項に記載す
る本発明の範囲内に入ることが意図される。
【図面の簡単な説明】
【図1】 図1は、本発明の1実施形態に従った、アミノ酸評価システムのデータフロー
ダイヤグラムである。
【図2】 図2は、タンパク質のドメインの標的に対応するモチーフについての優勢値を
含む、表である。
【図3】 図3は、疑問アミノ酸配列を評価するための方法のフローチャートである。
【図4A】 図4Aは、タンパク質のドメインのモチーフに対応する、疑問アミノ酸配列に
ついてのスコアを生成するための方法のフローチャートである。
【図4B】 図4Bは、タンパク質のドメインのモチーフに対応する、疑問アミノ酸配列に
ついてのスコアを生成するための方法のフローチャートである。
【図5】 図5は、タンパク質のドメインのモチーフに関する、疑問アミノ酸配列につい
てのパーセンタイルスコアを生成するための方法のフローチャートである。
【図6A】 図6Aは、複数のモチーフに関する疑問アミノ酸配列の評価の記述的な情報を
表示するグラフディスプレイのダイヤグラムである。
【図6B】 図6Bは、複数のモチーフに関する疑問アミノ酸配列の評価の記述的な情報を
表示するグラフディスプレイのダイヤグラムである。
【図6C】 図6Cは、複数のモチーフに関する疑問アミノ酸配列の評価の記述的な情報を
表示するグラフディスプレイのダイヤグラムである。
【図7A】 図7Aは、図6A〜Cのグラフディスプレイを生成するために使用され得る、
図解方法のフローチャートである。
【図7B】 図7Bは、図6A〜Cのグラフディスプレイを生成するために使用され得る、
図解方法のフローチャートである。
【図7C】 図7Cは、図6A〜Cのグラフディスプレイを生成するために使用され得る、
図解方法のフローチャートである。
【手続補正書】
【提出日】平成13年11月7日(2001.11.7)
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】0007
【補正方法】変更
【補正の内容】
【0007】 一般に、このシステムがタンパク質モチーフを推定する初期のデータは、配向
された縮重ペプチドライブラリー(oriented degenerate
peptide libraries)(ODPL)を使用して作成された情報
を含むデータベースに基づく。ODPLは、アミノ酸配列においてお互いに異な
るが、一般に固定されたアミノ酸位置(本明細書において「非縮重」部位(”n
on−degenated”position)と呼ぶ)に位置する同一のアミ
ノ酸を含むライブラリーのメンバーの混合物を含む。異なるペプチド中で異なる
アミノ酸によって占められる(すなわち、固定されていない)各ライブラリーペ
プチド内の位置を、本明細書において「縮重部位」(”degenate po
sition”)と呼ぶ。例示的な配向された縮重ペプチドライブラリーが、S
ongyangら(Cell(1993)72:767〜778);米国特許第
5,532,167号;およびPCT出願第PCT/US98/10876号(
発明の名称 ”Cyclic Peptide Libraries and
Methods of Use Thereof to Identify B
inding Motifs”、国際公開第WO98/54577号)に記載さ
れる。本出願において同定される全ての文献が、本明細書においてその全体が参
考として援用される。
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0008
【補正方法】変更
【補正の内容】
【0008】 本発明の1つの局面に従って、疑問タンパク質アミノ酸配列を評価して、その
疑問タンパク質が1つ以上の規定されたモチーフを含むか否かを決定するのに有
用なシステムを提供する。このシステムは、公知の機能のタンパク質ドメインに
対応するモチーフの記録を含むデータベースを含む。この記録は、モチーフ内の
位置のアミノ酸についての「優勢値」(”preference value”
)(あるいは、「選択値」(”selectivity value”)と呼ぶ
)のマトリクスをさらに含み、この優勢値は、モチーフの機能に対する各位置の
各アミノ酸の相対的重要性を示す(例えば、結合機能、リン酸化部位機能)。こ
のシステムを疑問タンパク質アミノ酸配列を評価する方法として使用して、疑問
タンパク質がモチーフに対応する配列を含むか否か、従って、このモチーフに対
応する配列を含む他のタンパク質に起因する機能を示す可能性があるか否かを決
定する。従って、一般に、モチーフに関して疑問タンパク質アミノ酸配列を評価
する本発明の方法では、スコアは、疑問タンパク質アミノ酸配列内のアミノ酸に
対応するモチーフ内の選択された優勢値に基づく。
【手続補正3】
【補正対象書類名】明細書
【補正対象項目名】0058
【補正方法】変更
【補正の内容】
【0058】 本発明の1つの実施形態では、「ログ−サム法(log−sum metho
d)」と呼ばれる方法を用いて、あるモチーフに関する疑問タンパク質アミノ酸
配列を評価する。特に、このログ−サム法を用いて図4Aでプロセス308aに
よって示されるように、ステップ308(図3)を履行し得る。このログ−サム
法は、疑問タンパク質アミノ酸配列がスコアされているモチーフ中のアミノ酸の
各優勢値の結果の対数に基づいて、スコアを疑問タンパク質アミノ酸配列に割り
当てる。これは、数学的に、各アミノ酸の優勢値の対数を合計することと等価で
ある。この優勢値の対数は化学的結合エネルギーの反映と考えられ得ることにま
た注意のこと。この優勢値は、ログ−サム法で用いられる前に標準化され得る。
例えば、表300(図2)中のカラムの各々における値は、15の合計に標準化
される。
【手続補正4】
【補正対象書類名】明細書
【補正対象項目名】0059
【補正方法】変更
【補正の内容】
【0059】 図4Aを参照して、疑問配列評価器は116は、疑問タンパク質アミノ酸配列
の位置Pqで始まる部分配列に対し、以下のようなログ−サム法に従うプロセス
308aを用いて、モチーフmに関するスコアを生成し得る。プロセス308a
は、疑問タンパク質アミノ酸配列がGNGDYMPMSである説明する例に関し
て記載され、モチーフmに対応するペプチドライブラリーデータベース102中
の記録は、表300(図2)中に示される優勢値を含む。疑問配列評価器116
は、このスコアを値ゼロに初期化し(ステップ402)、そしてこのモチーフm
に対応し、それに対しこのスコアが生成されている(ステップ404)ペプチド
ライブラリーデータベース102中の記録rを同定する。この例では、拾われる
記録rの内容は、表300中に示されている(図2)。次いで疑問配列評価器1
16は、このモチーフ中の各位置pm上のループに入る(ステップ406)。こ
の例では、このモチーフの位置は−4から+4に番号付けられている。このよう
な位置pmの各々について、疑問配列評価器116は、位置(ps+pm)で疑問
配列中のアミノ酸を同定する(ステップ408)。この例では、第1番目の位置
(位置−4)にある疑問タンパク質アミノ酸配列(GNGDYMPMS)中のア
ミノ酸はGである。疑問配列評価器116は、記録Rから、このモチーフの位置
mにある同定されたアミノ酸の優勢値pvを拾う(ステップ410)。この例
では、位置−4におけるG(Gly)の優勢値は1.5284である。これは、
表300の「Gly」と標識された列および−4と番号付けられた内容によって
表される。同定されたアミノ酸について位置pmでモチーフ中の優勢値がない場
合、疑問配列評価器は、適切なデフォールト値、例えば1で置換し得る。この例
では、モチーフ中の非縮重位置に、優勢値16を含むアミノ酸(Tyr)がある
ことに注意のこと。しかし、非縮重位置にあるアミノ酸に対する優勢値には、任
意の優勢値が割り当てられ得る。1より少ない優勢値は無視され得る。代替のア
プローチは、部分配列内の正確な位置に非縮重アミノ酸を含む部分配列のみをス
コアすることである。
【手続補正5】
【補正対象書類名】明細書
【補正対象項目名】0064
【補正方法】変更
【補正の内容】
【0064】 図4Bを参照して、疑問配列評価器116は、以下のようにエントロピー法に
より、プロセス308bを用い、モチーフmに関してアミノ酸部分配列を評価し
得る(図3のステップ308)。説明する例に関して記載されるプロセス308
bは、疑問タンパク質アミノ酸配列がGSEEYMNMDであり、そしてこのモ
チーフに対応するペプチドライブラリーデータベース102中の記録は表300
中に示される優勢値を含む(図2)。疑問配列評価器116は、スコアを値ゼロ
に初期化し(ステップ422)、そしてスコアが生成されているモチーフに対応
するこのペプチドライブラリーデータベース102中の記録rを同定する(ステ
ップ404)。この例では、拾われる記録rの内容は、表300中に示される(
図2)。モチーフm中の各位置pmについて、疑問配列評価器116は、確率の
合計が1に等しくして、優勢値を確率に翻訳することにより位置pmにおける優
勢値を標準化する。これは、例えば、特定位置における優勢値のすべてを合計し
、そして各々の優勢値をこの合計で除することにより実施され得る。これらの確
率は、以下に記載のように、プロセス308bのすべての引き続くステップによ
って用いられる。
【手続補正6】
【補正対象書類名】明細書
【補正対象項目名】0065
【補正方法】変更
【補正の内容】
【0065】 次いで、疑問配列評価器116は、モチーフm中の各位置pm上のループに入
る(ステップ428)。この例では、このモチーフの位置は−4から+4で番号
付けられる。各428の位置pmについて、疑問配列評価器116は、位置(pd +pm)における疑問配列中のアミノ酸を同定する(ステップ430)。この例
では、疑問タンパク質アミノ酸配列中(GSEEYMNMD)の第1番目の位置
(位置−4)のアミノ酸はGである。疑問配列評価器116は、記録rから、こ
のモチーフmの位置pmにおける同定されたアミノ酸の確率値を拾う(ステップ
432)。この例では、位置−4におけるG(Gly)の確率値は0.1019
である。
【手続補正7】
【補正対象書類名】明細書
【補正対象項目名】0076
【補正方法】変更
【補正の内容】
【0076】 図6中にさらに示されるように、モチーフ同定器606a−fは、x軸604
に沿って位置し、xでは、それらがマッチする疑問タンパク質アミノ酸配列中の
ドメインの最初の位置に対応する。例えば、(位置Y266でAblキナーゼド
メインを同定する)モチーフ同定器606eはxに位置し、x軸に沿って266
に釣り合う。モチーフ同定器606a−fが疑問タンパク質アミノ酸配列中で対
応する位置にこれらを表示することは、ユーザーがマッチするモチーフの位置を
迅速かつ容易に視覚によって同定することを可能にする。
【手続補正8】
【補正対象書類名】明細書
【補正対象項目名】0079
【補正方法】変更
【補正の内容】
【0079】 図7Bを参照して、1つの実施形態では、疑問配列ユーザーインターフェース
106は、プロセス720を用いて、グラフディスプレイ600(図6A)中の
モチーフ同定器606a−fの特定の1つのユーザーの選択に応答してグラフデ
ィスプレイ620を生成する。この実施形態では、疑問タンパク質アミノ酸配列
は、公知の位置でドメインを含み、そして疑問配列評価結果118は、疑問タン
パク質アミノ酸配列内の各々のドメインに関して選択されたモチーフに対する評
価結果を含む。しかし、他の実施形態では、類似の方法を用いてグラフディスプ
レイ620(ステップ702)を生成し得ることが認識されるべきである。疑問
タンパク質アミノ酸配列内の各部分配列d(位置pdにある)について(ステッ
プ722)、選択されたモチーフに関する部分配列のスコアが、疑問配列評価結
果から拾われる(ステップ724)。拾われたスコアが所定の閾値を満足する場
合、位置pd、拾われたスコア、および部分配列dの配列が、図6Bに示される
ように表示される(ステップ728)。ステップ724−728が、疑問タンパ
ク質アミノ酸配列中の残りのドメインについて繰り返される。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ヤッフェ, マイケル ビー. アメリカ合衆国 マサチューセッツ 02144, サマービル, スティーブズ サークル ナンバー2 11 (72)発明者 レパー, ジャーマン ジー. アメリカ合衆国 マサチューセッツ 02116, ボストン, マールボロウ ス トリート 83, アパートメント 9 (72)発明者 キャントリー, ルイス シー. アメリカ合衆国 マサチューセッツ 02138, ケンブリッジ, ラーチ ロー ド 43 Fターム(参考) 2G045 AA34 DA36 JA01

Claims (33)

    【特許請求の範囲】
  1. 【請求項1】 公知の機能を有するタンパク質のドメインの標的に対応する
    モチーフについての記録を含むデータベースを含むシステムであって、該記録は
    、該モチーフ中の部位におけるアミノ酸についての優勢値を含み、該優勢値は、
    該部位において該タンパク質と相互作用する該アミノ酸の優勢を示し、該モチー
    フに関して疑問タンパク質アミノ酸配列を評価する方法であって、該方法は、以
    下の工程: (A)該疑問タンパク質アミノ酸配列中のアミノ酸に対応する該モチーフ中の
    選択された優勢値に基くモチーフに関して、該疑問タンパク質アミノ酸配列につ
    いてのスコアを計算する工程、 を包含する、システム。
  2. 【請求項2】 請求項1に記載の方法であって、ここで前記工程(A)は以
    下の工程: (A)(1)前記選択された優勢値の結果の対数として前記スコアを計算する
    工程、 を包含する、方法。
  3. 【請求項3】 請求項1に記載の方法であって、ここで前記工程(A)は以
    下の工程: (A)(1)前記選択された優勢値を掛けて前記結果を得る工程;および、 (A)(2)該産物の対数として前記スコアを計算する工程、 を包含する、方法。
  4. 【請求項4】 請求項1に記載の方法であって、ここで前記工程(A)は以
    下の工程: (A)(1)前記選択された優勢値の各々の対数を計算する工程;および、 (A)(2)該工程(A)(1)で計算した対数の和として前記スコアを計算
    する工程、 を包含する、方法。
  5. 【請求項5】 請求項1に記載の方法であって、ここで前記工程(A)は以
    下の工程: (A)(1)前記選択された優勢値に対応する確率の逆対数の和の平均として
    前記スコアを計算する工程、 を包含する、方法。
  6. 【請求項6】 請求項1に記載の方法であって、前記モチーフは、多くの縮
    重部位を含み、ここで、前記工程(A)は以下の工程: (A)(1)前記選択された優勢値の各々について、該選択された優勢値に比
    例する確率値を生成する工程; (A)(2)前記確率値の各々について、該確率値の逆対数を計算する工程; (A)(3)該逆対数を合計する工程;および (A)(4)公知のアミノ酸配列中の縮重部位の数で該合計を割る工程によっ
    て該スコアを計算する工程、 を包含する、方法。
  7. 【請求項7】 請求項1に記載の方法であって、前記工程(A)が以下の工
    程: (A)(1)複数の他の優勢値の前記優勢値に基くモチーフ中の特定の部位に
    おいて、第一のアミノ酸に対応する前記選択された優勢値の1つを生成する工程
    であって、該複数の他の優勢値は、該モチーフ中の該特定の部位における複数の
    他のアミノ酸に対応し、そして該複数の他のアミノ酸の物理化学的特性に対応す
    る値に基く、工程、 を包含する、方法。
  8. 【請求項8】 請求項1に記載の方法であって、以下の工程: (B)複数のアミノ酸配列中のアミノ酸に対応する前記モチーフ中の選択され
    た優勢値に基く該モチーフに関して、該複数のアミノ酸配列についてのスコアを
    計算する工程;および (C)前記疑問タンパク質アミノ酸配列のスコアを該複数のアミノ酸配列のス
    コアと比較する工程によって、前記疑問タンパク質アミノ酸配列についてのパー
    センタイルスコアを計算する工程、 をさらに包含する、方法。
  9. 【請求項9】 請求項8に記載の方法であって、前記工程(C)は以下の工
    程: (C)(1)前記複数のアミノ酸配列のスコアのヒストグラムを生成する工程
    ; (C)(2)該ヒストグラム内の前記疑問タンパク質アミノ酸配列のスコアの
    部位を同定する工程; (C)(3)該複数のアミノ酸配列の数で該疑問タンパク質アミノ酸配列のス
    コアの一方に接近するスコアの数を割る工程によって、該疑問タンパク質アミノ
    酸配列についての前記パーセンタイルスコアを計算する工程、 を包含する、方法。
  10. 【請求項10】 請求項1に記載の方法であって、以下の工程: (B)ディスプレイデバイス上にグラフディスプレイを生成する工程であって
    、該グラフディスプレイは、前記スコアの記述的な情報を含む、工程、 をさらに包含する、方法。
  11. 【請求項11】 請求項10に記載の方法であって、以下の工程: (B)(1)前記疑問タンパク質アミノ酸配列の構造を表示する疑問タンパク
    質アミノ酸配列グラフエレメントを生成する工程; (B)(2)前記モチーフを同定するモチーフ同定器を作製する工程であって
    、該モチーフ同定器は、該モチーフが該疑問タンパク質アミノ酸配列に非常によ
    く一致する該疑問タンパク質アミノ酸配列内の部位を視覚的に示す、工程、 を包含する、方法。
  12. 【請求項12】 請求項11に記載の方法であって、前記工程(B)(1)
    は以下の工程: (B)(1)(1)前記疑問タンパク質アミノ酸配列内の部位に対応する部位
    の可視領域を有する疑問タンパク質アミノ酸配列グラフエレメントを生成する工
    程であって、ここで、前記工程(B)(2)は、以下の工程: (B)(2)(1)該疑問タンパク質アミノ酸配列内の部位に視覚的に対応す
    る位置で該モチーフ同定器を作製する工程であって、前記モチーフが該疑問タン
    パク質アミノ酸配列に非常によく一致する、工程、 を包含する、方法。
  13. 【請求項13】 請求項10に記載の方法であって、前記工程(B)が以下
    の工程: (B)(1)前記モチーフが前記疑問タンパク質アミノ酸配列に非常によく一
    致する該疑問タンパク質アミノ酸配列内の部位の記述的ディスプレイ情報を生成
    する工程、 を包含する、方法。
  14. 【請求項14】 請求項10に記載の方法であって、以下の工程: (B)(1)前記モチーフに非常によく一致する前記疑問タンパク質アミノ酸
    配列内の部分配列の記述的ディスプレイ情報を生成する工程、 を包含する、方法。
  15. 【請求項15】 請求項10に記載の方法であって、ここで、前記工程(B
    )は以下の工程: (B)(1)前記モチーフに関して複数のアミノ酸配列のスコアのヒストグラ
    ムを表示するヒストグラムディスプレイを生成する工程;および (B)(2)該ヒストグラム内の前記疑問タンパク質アミノ酸配列のスコアの
    部位を示すヒストグラムディスプレイ内で、疑問タンパク質アミノ酸配列マーカ
    ーを生成する工程、 を包含する、方法。
  16. 【請求項16】 公知の機能を有するタンパク質のドメインの標的に対応す
    るモチーフについての記録を含むデータベースを含むシステムであって、該記録
    は、該モチーフ中の部位におけるアミノ酸についての優勢値を含み、該優勢値は
    、該部位において該タンパク質と相互作用する該アミノ酸の優勢を示し、疑問配
    列評価器は: 該モチーフに関して評価されるべき疑問タンパク質アミノ酸配列を示す、疑問
    配列評価リクエストを受け取る第一の入力; 該データベースからの該記録の記述的な情報を受け取る第二の入力;および 該疑問タンパク質アミノ酸配列中のアミノ酸に対応する該モチーフ中の選択さ
    れた優勢値に基く該モチーフに関して、該疑問タンパク質アミノ酸配列について
    のスコアを展開する出力、 を含む、システム。
  17. 【請求項17】 請求項16に記載の疑問配列評価器であって、ここで、前
    記スコアは、前記選択された優勢値の結果の対数を含む、疑問配列評価器。
  18. 【請求項18】 請求項16に記載の疑問配列評価器であって、ここで、前
    記スコアは、前記選択された優勢値に対応する確率の逆対数の和の平均を含む、
    疑問配列評価器。
  19. 【請求項19】 公知の機能を有するタンパク質のドメインの標的に対応す
    るモチーフについての記録を含むデータベースを含むシステムであって、該記録
    は、該モチーフ中の部位におけるアミノ酸についての優勢値を含み、該優勢値は
    、該部位において該タンパク質と相互作用する該アミノ酸の優勢を示し、疑問配
    列評価システムは: 該疑問タンパク質アミノ酸配列中のアミノ酸に対応する該モチーフ中の選択さ
    れた優勢値に基くモチーフに関して、該疑問タンパク質アミノ酸配列についての
    スコアを出力上に展開する疑問配列評価器;および 該スコアを受け取る入力およびディスプレイデバイスへの出力について該スコ
    アの記述的な出力ディスプレイ情報上に展開する入力を有する疑問配列ユーザー
    インターフェイス、 を含む、システム。
  20. 【請求項20】 請求項19に記載のシステムであって、前記ディスプレイ
    情報は: 前記疑問タンパク質アミノ酸配列の構造を表示する、疑問タンパク質アミノ酸
    配列グラフエレメント;および 前記モチーフを同定するモチーフ同定器であって、該モチーフ同定器は、該モ
    チーフが該疑問タンパク質アミノ酸配列に非常によく一致する該疑問タンパク質
    アミノ酸配列内の部位を視覚的に示す、モチーフ同定器、 の記述的な情報を含む、システム。
  21. 【請求項21】 請求項19に記載のシステムであって、前記ディスプレイ
    情報は、前記モチーフが該疑問タンパク質アミノ酸配列に非常によく一致する該
    疑問タンパク質アミノ酸配列内の部位の記述的な情報を含む、システム。
  22. 【請求項22】 請求項19に記載のシステムであって、前記ディスプレイ
    情報は、前記モチーフに非常によく一致する前記疑問タンパク質アミノ酸配列内
    の部分配列の記述的な情報を含む、システム。
  23. 【請求項23】 請求項19に記載のシステムであって、前記ディスプレイ
    情報は: 前記モチーフに関して複数のアミノ酸配列のスコアのヒストグラムを表示する
    、ヒストグラムディスプレイ;および 該ヒストグラム内の前記疑問タンパク質アミノ酸配列のスコアの部位を示す、
    該ヒストグラムディスプレイ内の疑問タンパク質アミノ酸配列マーカー、 の記述的な情報を含む、システム。
  24. 【請求項24】 公知の機能を有するタンパク質のドメインの標的に対応す
    るモチーフについての記録を含むデータベースを含むシステムであって、該記録
    は、該モチーフ中の部位におけるアミノ酸についての優勢値を含み、該優勢値は
    、該部位において該タンパク質と相互作用する該アミノ酸の優勢を示し、該モチ
    ーフに関して疑問タンパク質アミノ酸配列を評価するための疑問配列評価システ
    ムであって、該疑問配列評価システムは: 該疑問タンパク質アミノ酸配列中のアミノ酸に対応する該モチーフ中の選択さ
    れた優勢値に基くモチーフに関して、該疑問タンパク質アミノ酸配列についての
    スコアを計算するための疑問配列評価手段、 を含む、システム。
  25. 【請求項25】 請求項24に記載の疑問配列評価システムであって、ここ
    で、前記疑問配列評価手段は: 前記選択された優勢値の結果の対数として前記スコアを計算する手段、 を含む、システム。
  26. 【請求項26】 請求項24に記載の疑問配列評価システムであって、ここ
    で、該疑問配列評価手段は: 前記選択された優勢値に対応する確率の逆対数の和の平均として前記スコアを
    計算する手段、 を含む、システム。
  27. 【請求項27】 請求項24に記載の疑問配列評価システムであって、ここ
    で、前記疑問配列評価手段は: 複数の他の優勢値の前記優勢値に基くモチーフ中の特定の部位において、第一
    のアミノ酸に対応する前記選択された優勢値の1つを生成する手段であって、該
    複数の他の優勢値は、該モチーフ中の該特定の部位における複数の他のアミノ酸
    に対応し、そして該複数の他のアミノ酸の物理化学的特性に対応する値に基く、
    手段、 を含む、システム。
  28. 【請求項28】 請求項24に記載の疑問配列評価システムであって、さら
    に: 前記複数のアミノ酸配列中のアミノ酸に対応するモチーフ中の選択された優勢
    値に基くモチーフに関して、該複数のアミノ酸配列についてのスコアを計算する
    第一の計算手段;および 前記疑問タンパク質アミノ酸配列のスコアを該複数のアミノ酸配列のスコアと
    比較する工程によって、該疑問タンパク質アミノ酸配列についてのパーセンタイ
    ルスコアを計算する第二の計算手段、 を含む、システム。
  29. 【請求項29】 請求項28に記載の疑問配列評価システムであって、ここ
    で、前記第二の計算手段が: 前記複数のアミノ酸配列のスコアのヒストグラムを生成する手段; 該ヒストグラム内の前記疑問タンパク質アミノ酸配列のスコアの部位を同定す
    る手段;および 該複数のアミノ酸配列の数で該疑問タンパク質アミノ酸配列のスコアの一方に
    接近するスコアの数を割る工程によって、該疑問タンパク質アミノ酸配列につい
    ての前記パーセンタイルスコアを計算する手段、 を含む、システム。
  30. 【請求項30】請求項24に記載の疑問配列評価システムであって、さらに
    : ディスプレイデバイス上にグラフディスプレイを生成するグラフディスプレイ
    生成手段であって、該グラフディスプレイは、前記スコアの記述的な情報を含む
    、手段、 を含む、システム。
  31. 【請求項31】 請求項30に記載の疑問配列評価システムであって、ここ
    で、前記グラフディスプレイ生成手段は: 前記疑問タンパク質アミノ酸配列の構造を表示する疑問タンパク質アミノ酸配
    列グラフエレメントを生成する手段; 前記モチーフを同定するモチーフ同定器を作製する手段であって、該モチーフ
    同定器は、該モチーフが該疑問タンパク質アミノ酸配列に非常によく一致する該
    疑問タンパク質アミノ酸配列内の部位を視覚的に示す、手段、 を含む、システム。
  32. 【請求項32】 請求項24に記載の疑問配列評価システムであって、ここ
    で、前記グラフディスプレイ生成手段は: 前記モチーフが前記疑問タンパク質アミノ酸配列に非常によく一致する該疑問
    タンパク質アミノ酸配列内の部位の記述的ディスプレイ情報を生成する手段、 を含む、システム。
  33. 【請求項33】 請求項24に記載の疑問配列評価システムであって、ここ
    で、前記グラフディスプレイ生成手段は: 前記モチーフに関して複数のアミノ酸配列のスコアのヒストグラムを表示する
    ヒストグラムディスプレイを生成する手段;および 該ヒストグラム内の前記疑問タンパク質アミノ酸配列のスコアの部位を示すヒ
    ストグラムディスプレイ内で、疑問タンパク質アミノ酸配列マーカーを生成する
    手段、 を含む、システム。
JP2000614047A 1999-04-23 2000-04-21 アミノ酸配列評価システム Withdrawn JP2002543390A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US29837199A 1999-04-23 1999-04-23
US09/298,371 1999-04-23
PCT/US2000/010756 WO2000065358A2 (en) 1999-04-23 2000-04-21 Amino acid sequence evaluation system

Publications (1)

Publication Number Publication Date
JP2002543390A true JP2002543390A (ja) 2002-12-17

Family

ID=23150210

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000614047A Withdrawn JP2002543390A (ja) 1999-04-23 2000-04-21 アミノ酸配列評価システム

Country Status (5)

Country Link
EP (1) EP1173755A2 (ja)
JP (1) JP2002543390A (ja)
AU (1) AU4479200A (ja)
CA (1) CA2371238A1 (ja)
WO (1) WO2000065358A2 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5532167A (en) * 1994-01-07 1996-07-02 Beth Israel Hospital Substrate specificity of protein kinases
US20020068301A1 (en) * 1997-05-28 2002-06-06 Hung-Sen Lai Cyclic peptide libraries and methods of use thereof to identify binding motifs

Also Published As

Publication number Publication date
WO2000065358A3 (en) 2001-01-11
CA2371238A1 (en) 2000-11-02
EP1173755A2 (en) 2002-01-23
AU4479200A (en) 2000-11-10
WO2000065358A2 (en) 2000-11-02

Similar Documents

Publication Publication Date Title
George et al. SnapDRAGON: a method to delineate protein structural domains from sequence data
Oliver et al. Functional genomics: high-throughput mRNA, protein, and metabolite analyses
Yang et al. Protein–ligand binding site recognition using complementary binding-specific substructure comparison and sequence profile alignment
Müller et al. Benchmarking PSI-BLAST in genome annotation
Rarey et al. A fast flexible docking method using an incremental construction algorithm
Fiser Template-based protein structure modeling
Maurer-Stroh et al. N-terminal N-myristoylation of proteins: prediction of substrate proteins from amino acid sequence
JP2005536714A5 (ja)
Pagnuco et al. Analysis of genetic association using hierarchical clustering and cluster validation indices
Maguire et al. Platelet proteomics
US20040083060A1 (en) Method of operating a computer system to perform a discrete substructural analysis
AU2002215028A1 (en) Method of operating a computer system to perform a discrete substructural analysis
Cammer et al. Structure-based active site profiles for genome analysis and functional family subclassification
Weisel et al. Form follows function: Shape analysis of protein cavities for receptor‐based drug design
Das et al. Rapid comparison of protein binding site surfaces with property encoded shape distributions
Schwacke et al. iQuantitator: a tool for protein expression inference using iTRAQ
Stoddard et al. Molecular recognition analyzed by docking simulations: the aspartate receptor and isocitrate dehydrogenase from Escherichia coli.
US6519611B1 (en) Method and apparatus for computer automated detection of protein and nucleic acid targets of a chemical compound
Yu et al. New advances in cross-linking mass spectrometry toward structural systems biology
US20060235622A1 (en) Statistical methods for analyzing biological sequences
JP2002543390A (ja) アミノ酸配列評価システム
US7286940B2 (en) Method of predicting functions of proteins using ligand database
Cuff et al. ProtEST: protein multiple sequence alignments from expressed sequence tags
Boguski Computational sequence analysis revisited: new databases, software tools, and the research opportunities they engender.
JP4688467B2 (ja) 受容体−リガンド安定複合体構造探索方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20070703