JP3990963B2 - 結合部位予測方法、結合部位予測装置、プログラム、および、記録媒体 - Google Patents

結合部位予測方法、結合部位予測装置、プログラム、および、記録媒体 Download PDF

Info

Publication number
JP3990963B2
JP3990963B2 JP2002275300A JP2002275300A JP3990963B2 JP 3990963 B2 JP3990963 B2 JP 3990963B2 JP 2002275300 A JP2002275300 A JP 2002275300A JP 2002275300 A JP2002275300 A JP 2002275300A JP 3990963 B2 JP3990963 B2 JP 3990963B2
Authority
JP
Japan
Prior art keywords
amino acid
binding site
storage unit
acid residue
energy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002275300A
Other languages
English (en)
Other versions
JP2004109053A (ja
Inventor
一樹 大野
光人 和田
静司 斎藤
建策 今井
信也 細木
尚 島田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Celestar Lexico Sciences Inc
Original Assignee
Celestar Lexico Sciences Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Celestar Lexico Sciences Inc filed Critical Celestar Lexico Sciences Inc
Priority to JP2002275300A priority Critical patent/JP3990963B2/ja
Priority to US10/516,133 priority patent/US20050130224A1/en
Priority to PCT/JP2003/006952 priority patent/WO2003107218A1/ja
Priority to EP03733232A priority patent/EP1510943A4/en
Publication of JP2004109053A publication Critical patent/JP2004109053A/ja
Application granted granted Critical
Publication of JP3990963B2 publication Critical patent/JP3990963B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、結合部位予測方法、結合部位予測装置、プログラム、および、記録媒体に関し、特に、アミノ酸配列データから予測された、または、実験的に求められた立体構造情報(アミノ酸残基間の空間上の距離情報)と、電荷の情報とを用いて静電的に不安定な部分を予測することにより、蛋白質または生理活性ポリペプチドの結合部位や結合相手を効率的に予測すること等ができる結合部位予測方法、結合部位予測装置、プログラム、および、記録媒体に関する。
【0002】
【従来の技術】
蛋白質または生理活性ポリペプチドが一定の機能を示すためには、他の蛋白質等と相互作用することが重要である。特定の蛋白質の相互作用を阻害したり、相互作用を強めたりするような物質は医薬品になる可能性を秘めている。したがって、蛋白質の相互作用部位、さらには、蛋白質の相互作用相手を予測することは生物学、医学、薬学上、極めて重要な問題である。このため、バイオインフォマティクスの分野においては、従来から様々な方法により蛋白質の相互作用相手を予測することが試みられている。
【0003】
【発明が解決しようとする課題】
しかしながら、既知のバイオインフォマティクスによる蛋白質の相互作用の予測手法は計算負担が大きく処理時間が長時間かかるものであり、また、予測精度は低いためさらなる精度の高くかつ処理時間が短い手法の開発が望まれているという問題点を有していた。
以下、この問題点の内容について、一層具体的に説明する。
【0004】
例えば、バイオインフォマティクス分野における相互作用部位予測に関しては、モチーフ検索などによる予測技術が開発されてきた。しかし、モチーフ検索は既知の相互作用部位については解析することができるが、未知の相互作用部位については解析できないという問題点がある。
【0005】
他にも、アミノ酸頻度解析を利用して結合部位を予測する方法も開発されている。例えば、特許文献1、特許文献2、特許文献3などがある。しかしながら、これらの予測方法は、予測精度が低いという問題点がある。
【0006】
【特許文献1】
特開平11−213003号公報
【特許文献2】
特開平10−222486号公報
【特許文献3】
特開平10−045795号公報
【0007】
また、この他にも、例えば、2つの蛋白質の立体構造をドッキングさせ、最も安定な複合体構造を得る方法がある。この方法の予測精度は高いが、いくつかの問題点がある。第一に、蛋白質のうちに立体構造が分かっているのはほんの一部に過ぎないので、ほとんどの蛋白質には適応できないことである。第二に、これらの手法は計算負担が大きく処理時間が長時間かかるものであるため、網羅的な計算を行うことが困難であることである。
【0008】
さらに、相互作用部位予測よりも難しい相互作用相手予測については有効な手段が確立されていない。つまり、全く未知の相互作用部位、さらには、相互作用相手を高精度に予測するためには、全く新しいアプローチが必要であるが、有効な手段は未だ確立していない。
【0009】
本発明は上記問題点に鑑みてなされたもので、バイオインフォマティクスによる蛋白質の相互作用の予測を極めて短時間で計算可能にし、網羅的な解析を可能にする、結合部位予測方法、結合部位予測装置、プログラム、および、記録媒体を提供することを目的としている。
【0010】
【課題を解決するための手段】
2つの蛋白質が自発的に相互作用するためには、結合することにより系全体のエネルギーが下がることが必要となる。つまり、蛋白質の中で不安定な部分は、結合によって安定化する可能性を秘めているので、結合しやすい部分と考えることができる。また、相互作用相手は他の蛋白質と比べて結合する能力が高いと考えられる。つまり、相互作用相手を予測するためには、網羅的に相互作用を計算した上で、他よりも相互作用する能力が高いものを探索する必要がある。そのためには、1対1の相互作用だけではなく、多対多の相互作用の計算が必要なので、計算コストを大幅に改善する必要がある。
【0011】
本発明の中心的な概念は、蛋白質の構造上、他の部位よりも不安定な領域が結合部位の可能性が高いというものである。つまり、本発明は、局所的に不安定な領域を比較的簡易な計算によって求めることで、結合部位を予測するものである。
【0012】
すなわち、本発明は、主に、
・基本的に蛋白質の配列情報のみから高精度に結合部位を予測できるようにすること(ただし、必要に応じて立体構造情報を追加できる。)
・極めて短時間で計算可能にし、網羅的な解析を可能にすること
の2点を特徴とするものである。
【0013】
本発明は上述した問題点を鑑みてなされたもので、蛋白質のアミノ酸情報から立体構造情報(アミノ酸間の空間上の距離)を予測して、立体構造と電荷の情報から静電的に不安定な部分を予測する、および/または、2つの蛋白質が結合する時の静電的なエネルギーを計算することにより、結合部位、結合相手を予測すること等ができる、結合部位予測方法、結合部位予測装置、プログラム、および、記録媒体に関する。
【0014】
このような目的を達成するため、請求項1に記載の結合部位予測方法は、記憶部と制御部とを少なくとも備えた結合部位予測装置において実行される結合部位予測方法であって、上記制御部において、上記記憶部に格納された蛋白質または生理活性ポリペプチドのアミノ酸配列データに基づいて、各アミノ酸残基間の配列上の距離を算出し上記記憶部に格納し、上記記憶部に格納された当該配列上の距離から、以下の式を用いて当該蛋白質または生理活性ポリペプチドの立体構造における上記各アミノ酸残基間の空間上の距離データを求め上記記憶部に格納しr = k d n (0<n<1)(ここでrは上記空間上の距離、dは上記配列上の距離、kは比例定数、nは所定のパラメータである)上記各アミノ酸残基荷電性に基づいた電荷と、上記記憶部に格納された対応する上記各アミノ酸残基間の上記空間上の距離データとに従って、上記各アミノ酸残基のエネルギーを計算し上記記憶部に格納し、上記記憶部に格納された上記エネルギーが予め定めた閾値を超えるか判断することにより結合部位を予測し、上記記憶部に格納することを特徴とする。
【0015】
この方法によれば、蛋白質または生理活性ポリペプチドのアミノ酸配列データに基づいて、各アミノ酸残基間の配列上の距離を算出し、当該配列上の距離から、r=kd n (0<n<1)(ここでrは空間上の距離、dは配列上の距離、kは比例定数、nは所定のパラメータである)の式を用いて当該蛋白質または生理活性ポリペプチドの立体構造における各アミノ酸残基間の空間上の距離データを求め、各アミノ酸残基荷電性に基づいた電荷と、対応する各アミノ酸残基間の空間上の距離データとに従って、各アミノ酸残基のエネルギーを計算し、当該エネルギーが予め定めた閾値を超えるか判断することにより結合部位を予測するので、蛋白質または生理活性ポリペプチドのアミノ酸配列から高速かつ高精度に結合部位を予測することができるようになる。
【0016】
また、請求項2に記載の結合部位予測方法は、記憶部と制御部とを少なくとも備えた結合部位予測装置において実行される結合部位予測方法であって、上記制御部において実行される、上記記憶部に格納された目的の蛋白質または生理活性ポリペプチドのアミノ酸配列データを取得するアミノ酸配列データ取得ステップと、上記アミノ酸配列データ取得ステップにより取得された上記アミノ酸配列データに基づく各アミノ酸残基の間の配列上の距離に基づいて各アミノ酸残基の間の空間上の距離を、以下の式を用いて決定し上記記憶部に格納する空間距離決定ステップと、r = k d n (0<n<1)(ここでrは上記空間上の距離、dは上記配列上の距離、kは比例定数、nは所定のパラメータである)上記各アミノ酸残基が持つ電荷を当該各アミノ酸残基の荷電性に基づいて決定する電荷決定ステップと、上記空間距離決定ステップにより上記記憶部に格納された上記各アミノ酸残基間の空間上の距離と、上記電荷決定ステップにより決定された上記各アミノ酸残基が持つ電荷とに従って、上記各アミノ酸残基のエネルギーを計算し上記記憶部に格納するエネルギー計算ステップと、上記エネルギー計算ステップにより上記記憶部に格納された上記エネルギーに従って、予め定めた閾値を超えるか判断することにより結合部位となる候補アミノ酸残基を決定し、上記記憶部に格納する候補アミノ酸残基決定ステップと、を含むことを特徴とする。
【0017】
この方法によれば、目的の蛋白質または生理活性ポリペプチドのアミノ酸配列データを取得し、取得されたアミノ酸配列データに基づく各アミノ酸残基の間の配列上の距離に基づいて各アミノ酸残基の間の空間上の距離を、r=kd n (0<n<1)(ここでrは空間上の距離、dは配列上の距離、kは比例定数、nは所定のパラメータである)の式を用いて決定し、各アミノ酸残基が持つ電荷を当該各アミノ酸残基の荷電性に基づいて決定し、各アミノ酸残基間の空間上の距離と、決定された各アミノ酸残基が持つ電荷とに従って、各アミノ酸残基のエネルギーを計算し、計算されたエネルギーに従って、予め定めた閾値を超えるか判断することにより結合部位となる候補アミノ酸残基を決定するので、蛋白質または生理活性ポリペプチドのアミノ酸配列から高速かつ高精度に結合部位を予測することができるようになる。
【0018】
また、請求項3に記載の結合部位予測方法は、記憶部と制御部とを少なくとも備えた結合部位予測装置において実行される結合部位予測方法であって、上記制御部において実行される、上記記憶部に格納された目的の複数の蛋白質または生理活性ポリペプチドのアミノ酸配列データを取得するアミノ酸配列データ取得ステップと、上記目的の複数の蛋白質または生理活性ポリペプチドの上記アミノ酸配列データにおいて、アミノ酸配列上で結合部位となる任意のアミノ酸残基を仮定する結合部位仮定ステップと、上記結合部位仮定ステップにて上記結合部位が仮定された上記アミノ酸配列データにおいて、各アミノ酸残基の間の配列上の距離に基づいて、上記各アミノ酸残基の間の空間上の距離を、以下の式を用いて決定し上記記憶部に格納する空間距離決定ステップと、r = k d n (0<n<1)(ここでrは上記空間上の距離、dは上記配列上の距離、kは比例定数、nは所定のパラメータである)上記各アミノ酸残基が持つ電荷を当該各アミノ酸残基の荷電性に基づいて決定する電荷決定ステップと、上記空間距離決定ステップにより上記記憶部に格納された上記各アミノ酸残基間の空間上の距離と、上記電荷決定ステップにより決定された上記各アミノ酸残基が持つ上記電荷とに従って、上記各アミノ酸残基のエネルギーを計算し上記記憶部に格納するエネルギー計算ステップと、上記結合部位仮定ステップにより上記結合部位を変えて、上記空間距離決定ステップにより上記空間距離を決定し上記記憶部に格納し、上記電荷決定ステップにより上記電荷を決定し上記記憶部に格納し、上記エネルギー計算ステップにより上記各アミノ酸残基のエネルギーを計算し上記記憶部に格納し、当該エネルギーの総和が最小となる上記結合部位を求め、求められた当該結合部位を上記記憶部に格納するエネルギー最小化ステップと、上記エネルギー最小化ステップによりエネルギーの総和が最小となる上記結合部位を、結合部位の候補アミノ酸残基として決定し上記記憶部に格納する候補アミノ酸残基決定ステップと、を含むことを特徴とする。
【0019】
この方法によれば、目的の複数の蛋白質または生理活性ポリペプチドのアミノ酸配列データを取得し、目的の複数の蛋白質または生理活性ポリペプチドのアミノ酸配列データにおいて、アミノ酸配列上で結合部位となる任意のアミノ酸残基を仮定し、結合部位を仮定されたアミノ酸配列データにおいて、各アミノ酸残基の間の配列上の距離に基づいて、各アミノ酸残基の間の空間上の距離を、r=kd n (0<n<1)(ここでrは空間上の距離、dは配列上の距離、kは比例定数、nは所定のパラメータである)の式を用いて決定し、各アミノ酸残基が持つ電荷を当該各アミノ酸残基の荷電性に基づいて決定し、各アミノ酸残基間の空間上の距離と、決定された各アミノ酸残基が持つ電荷とに従って、各アミノ酸残基のエネルギーを計算し、結合部位を変えて、空間距離を決定し、電荷を決定し、各アミノ酸残基のエネルギーを計算し、当該エネルギーの総和が最小となる結合部位を求め、エネルギーの総和が最小となる結合部位を、結合部位の候補アミノ酸残基として決定するので、蛋白質または生理活性ポリペプチドのアミノ酸配列から高速かつ高精度に結合部位を予測することができるようになる。
【0020】
また、請求項4に記載の結合部位予測方法は、記憶部と制御部とを少なくとも備えた結合部位予測装置において実行される結合部位予測方法であって、上記制御部において実行される、上記記憶部に格納された目的の蛋白質または生理活性ポリペプチドのアミノ酸配列データと、結合候補となる1つまたは複数の蛋白質または生理活性ポリペプチドのアミノ酸配列データとを取得するアミノ酸配列データ取得ステップと、上記目的の蛋白質または生理活性ポリペプチドの上記アミノ酸配列データ、および、上記結合候補となる蛋白質または生理活性ポリペプチドの上記アミノ酸配列データにおいてアミノ酸配列上で結合部位となる任意のアミノ酸残基を仮定する結合部位仮定ステップと、上記結合部位仮定ステップにて上記結合部位を仮定された上記アミノ酸配列データにおいて、各アミノ酸残基の間の配列上の距離に基づいて、上記各アミノ酸残基の間の空間上の距離を、以下の式を用いて決定し上記記憶部に格納する空間距離決定ステップと、r = k d (0<n<1)ここでrは上記空間上の距離、dは上記配列上の距離、kは比例定数、nは所定のパラメータである)上記各アミノ酸残基が持つ電荷を当該各アミノ酸残基の荷電性に基づいて決定する電荷決定ステップと、上記空間距離決定ステップにより上記記憶部に格納された上記各アミノ酸残基間の空間上の距離と、上記電荷決定ステップにより決定された上記各アミノ酸残基が持つ上記電荷とに従って、上記各アミノ酸残基のエネルギーを計算し上記記憶部に格納するエネルギー計算ステップと、上記結合部位仮定ステップにより上記結合部位を変えて、上記空間距離決定ステップにより上記空間距離を決定し上記記憶部に格納し、上記電荷決定ステップにより上記電荷を決定し上記記憶部に格納し、上記エネルギー計算ステップにより上記各アミノ酸残基のエネルギーを計算し上記記憶部に格納し、当該エネルギーの総和が最小となる上記結合部位を求め、求められた当該結合部位を上記記憶部に格納するエネルギー最小化ステップと、全ての上記結合候補について上記エネルギー最小化ステップを実行した結果、上記エネルギーの総和が最小となる上記結合部位をもつ結合候補を決定し、上記記憶部に格納する結合候補決定ステップと、を含むことを特徴とする。
【0021】
この方法によれば、目的の蛋白質または生理活性ポリペプチドのアミノ酸配列データと、結合候補となる1つまたは複数の蛋白質または生理活性ポリペプチドのアミノ酸配列データとを取得し、目的の蛋白質または生理活性ポリペプチドのアミノ酸配列データ、および、結合候補となる蛋白質または生理活性ポリペプチドのアミノ酸配列データにおいて、アミノ酸配列上で結合部位となる任意のアミノ酸残基を仮定し、結合部位を仮定されたアミノ酸配列データにおいて、各アミノ酸残基の間の配列上の距離に基づいて、各アミノ酸残基の間の空間上の距離を、r=kd n (0<n<1)(ここでrは空間上の距離、dは配列上の距離、kは比例定数、nは所定のパラメータである)の式を用いて決定し、各アミノ酸残基が持つ電荷を当該各アミノ酸残基の荷電性に基づいて決定し、各アミノ酸残基間の空間上の距離と、決定された各アミノ酸残基が持つ電荷とに従って、各アミノ酸残基のエネルギーを計算し、結合部位を変えて、空間距離を決定し、電荷を決定し、各アミノ酸残基のエネルギーを計算し、当該エネルギーの総和が最小となる結合部位を求め、全ての結合候補についてエネルギー最小化処理を実行した結果、エネルギーの総和が最小となる結合部位をもつ結合候補を決定するので、蛋白質または生理活性ポリペプチドのアミノ酸配列から高速かつ高精度に最適な結合候補の蛋白質を予測することができるようになる。
【0022】
また、本発明は結合部位予測装置に関するものであり、請求項5に記載の結合部位予測装置は、記憶部と制御部とを少なくとも備えた結合部位予測装置であって、上記制御部は、上記記憶部に格納された目的の蛋白質または生理活性ポリペプチドのアミノ酸配列データを取得するアミノ酸配列データ取得手段と、上記アミノ酸配列データ取得手段により取得された上記アミノ酸配列データに基づく各アミノ酸残基の間の配列上の距離に基づいて各アミノ酸残基の間の空間上の距離を、以下の式を用いて決定し上記記憶部に格納する空間距離決定手段と、r = k d n (0<n<1)(ここでrは上記空間上の距離、dは上記配列上の距離、kは比例定数、nは所定のパラメータである)上記各アミノ酸残基が持つ電荷を当該各アミノ酸残基の荷電性に基づいて決定する電荷決定手段と、上記空間距離決定手段により上記記憶部に格納された上記各アミノ酸残基間の空間上の距離と、上記電荷決定手段により決定された上記各アミノ酸残基が持つ電荷とに従って、上記各アミノ酸残基のエネルギーを計算し上記記憶部に格納するエネルギー計算手段と、上記エネルギー計算手段により上記記憶部に格納された上記エネルギーに従って、予め定めた閾値を超えるか判断することにより結合部位となる候補アミノ酸残基を決定し、上記記憶部に格納する候補アミノ酸残基決定手段と、を備えたことを特徴とする。
【0023】
この装置によれば、目的の蛋白質または生理活性ポリペプチドのアミノ酸配列データを取得し、取得されたアミノ酸配列データに基づく各アミノ酸残基の間の配列上の距離に基づいて各アミノ酸残基の間の空間上の距離を、r=kd n (0<n<1)(ここでrは空間上の距離、dは配列上の距離、kは比例定数、nは所定のパラメータである)の式を用いて決定し、各アミノ酸残基が持つ電荷を当該各アミノ酸残基の荷電性に基づいて決定し、各アミノ酸残基間の空間上の距離と、決定された各アミノ酸残基が持つ電荷とに従って、各アミノ酸残基のエネルギーを計算し、計算されたエネルギーに従って、予め定めた閾値を超えるか判断することにより結合部位となる候補アミノ酸残基を決定するので、蛋白質または生理活性ポリペプチドのアミノ酸配列から高速かつ高精度に結合部位を予測することができるようになる。
【0024】
また、請求項6に記載の結合部位予測装置は、記憶部と制御部とを少なくとも備えた結合部位予測装置であって、上記制御部は、上記記憶部に格納された目的の蛋白質または生理活性ポリペプチドのアミノ酸配列データと、結合候補となる1つまたは複数の蛋白質または生理活性ポリペプチドのアミノ酸配列データとを取得するアミノ酸配列データ取得手段と、上記目的の蛋白質または生理活性ポリペプチドの上記アミノ酸配列データ、および、上記結合候補となる蛋白質または生理活性ポリペプチドの上記アミノ酸配列データにおいて、アミノ酸配列上で結合部位となる任意のアミノ酸残基を仮定する結合部位仮定手段と、上記結合部位仮定手段にて上記結合部位を仮定された上記アミノ酸配列データにおいて、各アミノ酸残基の間の配列上の距離に基づいて、上記各アミノ酸残基の間の空間上の距離を、以下の式を用いて決定し上記記憶部に格納する空間距離決定手段と、r = k d n (0<n<1)(ここでrは上記空間上の距離、dは上記配列上の距離、kは比例定数、nは所定のパラメータである)上記各アミノ酸残基が持つ電荷を当該各アミノ酸残基の荷電性に基づいて決定する電荷決定手段と、上記空間距離決定手段により上記記憶部に格納された上記各アミノ酸残基間の空間上の距離と、上記電荷決定手段により決定された上記各アミノ酸残基が持つ上記電荷とに従って、上記各アミノ酸残基のエネルギーを計算し上記記憶部に格納するエネルギー計算手段と、上記結合部位仮定手段により上記結合部位を変えて、上記空間距離決定手段により上記空間距離を決定し上記記憶部に格納し、上記電荷決定手段により上記電荷を決定し上記記憶部に格納し、上記エネルギー計算手段により上記各アミノ酸残基のエネルギーを計算し上記記憶部に格納し、当該エネルギーの総和が最小となる上記結合部位を求め、求められた当該結合部位を上記記憶部に格納するエネルギー最小化手段と、全ての上記結合候補について上記エネルギー最小化手段を実行した結果、上記エネルギーの総和が最小となる上記結合部位をもつ結合候補を決定し、上記記憶部に格納する結合候補決定手段と、を備えたことを特徴とする。
【0025】
この装置によれば、目的の複数の蛋白質または生理活性ポリペプチドのアミノ酸配列データを取得し、目的の複数の蛋白質または生理活性ポリペプチドのアミノ酸配列データにおいて、アミノ酸配列上で結合部位となる任意のアミノ酸残基を仮定し、結合部位を仮定されたアミノ酸配列データにおいて、各アミノ酸残基の間の配列上の距離に基づいて、各アミノ酸残基の間の空間上の距離を、r=kd n (0<n<1)(ここでrは空間上の距離、dは配列上の距離、kは比例定数、nは所定のパラメータである)の式を用いて決定し、各アミノ酸残基が持つ電荷を当該各アミノ酸残基の荷電性に基づいて決定し、各アミノ酸残基間の空間上の距離と、決定された各アミノ酸残基が持つ電荷とに従って、各アミノ酸残基のエネルギーを計算し、結合部位を変えて、空間距離を決定し、電荷を決定し、各アミノ酸残基のエネルギーを計算し、当該エネルギーの総和が最小となる結合部位を求め、エネルギーの総和が最小となる結合部位を、結合部位の候補アミノ酸残基として決定するので、蛋白質または生理活性ポリペプチドのアミノ酸配列から高速かつ高精度に結合部位を予測することができるようになる。
【0026】
また、請求項7に記載の結合部位予測装置は、記憶部と制御部とを少なくとも備えた結合部位予測装置であって、上記制御部は、上記記憶部に格納された目的の蛋白質または生理活性ポリペプチドのアミノ酸配列データと、結合候補となる1つまたは複数の蛋白質または生理活性ポリペプチドのアミノ酸配列データとを取得するアミノ酸配列データ取得手段と、上記目的の蛋白質または生理活性ポリペプチドの上記アミノ酸配列データ、および、上記結合候補となる蛋白質または生理活性ポリペプチドの上記アミノ酸配列データにおいてアミノ酸配列上で結合部位となる任意のアミノ酸残基を仮定する結合部位仮定手段と、上記結合部位仮定手段にて上記結合部位を仮定された上記アミノ酸配列データにおいて、各アミノ酸残基の間の配列上の距離に基づいて、上記各アミノ酸残基の間の空間上の距離を、以下の式を用いて決定し上記記憶部に格納する空間距離決定手段と、r = k d n (0<n<1)ここでrは上記空間上の距離、dは上記配列上の距離、kは比例定数、nは所定のパラメータである)上記各アミノ酸残基が持つ電荷を当該各アミノ酸残基の荷電性に基づいて決定する電荷決定手段と、上記空間距離決定手段により上記記憶部に格納された上記各アミノ酸残基間の空間上の距離と、上記電荷決定手段により決定された上記各アミノ酸残基が持つ上記電荷とに従って、上記各アミノ酸残基のエネルギーを計算し上記記憶部に格納するエネルギー計算手段と、上記結合部位仮定手段により上記結合部位を変えて、上記空間距離決定手段により上記空間距離を決定し上記記憶部に格納し、上記電荷決定手段により上記電荷を決定し上記記憶部に格納し、上記エネルギー計算手段により上記各アミノ酸残基のエネルギーを計算し上記記憶部に格納し、当該エネルギーの総和が最小となる上記結合部位を求め、求められた当該結合部位を上記記憶部に格納するエネルギー最小化手段と、全ての上記結合候補について上記エネルギー最小化手段を実行した結果、上記エネルギーの総和が最小となる上記結合部位をもつ結合候補を決定し、上記記憶部に格納する結合候補決定手段と、を備えたことを特徴とする。
【0027】
この装置によれば、目的の蛋白質または生理活性ポリペプチドのアミノ酸配列データと、結合候補となる1つまたは複数の蛋白質または生理活性ポリペプチドのアミノ酸配列データとを取得し、目的の蛋白質または生理活性ポリペプチドのアミノ酸配列データ、および、結合候補となる蛋白質または生理活性ポリペプチドのアミノ酸配列データにおいて、アミノ酸配列上で結合部位となる任意のアミノ酸残基を仮定し、結合部位を仮定されたアミノ酸配列データにおいて、各アミノ酸残基の間の配列上の距離に基づいて、各アミノ酸残基の間の空間上の距離を、r=kd n (0<n<1)(ここでrは空間上の距離、dは配列上の距離、kは比例定数、nは所定のパラメータである)の式を用いて決定し、各アミノ酸残基が持つ電荷を当該各アミノ酸残基の荷電性に基づいて決定し、各アミノ酸残基間の空間上の距離と、決定された各アミノ酸残基が持つ電荷とに従って、各アミノ酸残基のエネルギーを計算し、結合部位を変えて、空間距離を決定し、電荷を決定し、各アミノ酸残基のエネルギーを計算し、当該エネルギーの総和が最小となる結合部位を求め、全ての結合候補についてエネルギー最小化処理を実行した結果、エネルギーの総和が最小となる結合部位をもつ結合候補を決定するので、蛋白質または生理活性ポリペプチドのアミノ酸配列から高速かつ高精度に最適な結合候補の蛋白質を予測することができるようになる。
【0028】
また、本発明はプログラムに関するものであり、請求項8に記載のプログラムは、記憶部と制御部とを少なくとも備えた結合部位予測装置に実行させるためのプログラムであって、上記制御部において実行される、上記記憶部に格納された目的の蛋白質または生理活性ポリペプチドのアミノ酸配列データを取得するアミノ酸配列データ取得ステップと、上記アミノ酸配列データ取得ステップにより取得された上記アミノ酸配列データに基づく各アミノ酸残基の間の配列上の距離に基づいて各アミノ酸残基の間の空間上の距離を、以下の式を用いて決定し上記記憶部に格納する空間距離決定ステップと、r = k d n (0<n<1)(ここでrは上記空間上の距離、dは上記配列上の距離、kは比例定数、nは所定のパラメータである)上記各アミノ酸残基が持つ電荷を当該各アミノ酸残基の荷電性に基づいて決定する電荷決定ステップと、上記空間距離決定ステップにより上記記憶部に格納された上記各アミノ酸残基間の空間上の距離と、上記電荷決定ステップにより決定された上記各アミノ酸残基が持つ電荷とに従って、上記各アミノ酸残基のエネルギーを計算し上記記憶部に格納するエネルギー計算ステップと、上記エネルギー計算ステップにより上記記憶部に格納された上記エネルギーに従って、予め定めた閾値を超えるか判断することにより結合部位となる候補アミノ酸残基を決定し、予測された当該結合部位を上記記憶部に格納する候補アミノ酸残基決定ステップと、を含む結合部位予測方法を上記結合部位予測装置に実行させることを特徴とする。
【0029】
このプログラムによれば、目的の蛋白質または生理活性ポリペプチドのアミノ酸配列データを取得し、取得されたアミノ酸配列データに基づく各アミノ酸残基の間の配列上の距離に基づいて各アミノ酸残基の間の空間上の距離を、r=kd n (0<n<1)(ここでrは空間上の距離、dは配列上の距離、kは比例定数、nは所定のパラメータである)の式を用いて決定し、各アミノ酸残基が持つ電荷を当該各アミノ酸残基の荷電性に基づいて決定し、各アミノ酸残基間の空間上の距離と、決定された各アミノ酸残基が持つ電荷とに従って、各アミノ酸残基のエネルギーを計算し、計算されたエネルギーに従って、予め定めた閾値を超えるか判断することにより結合部位となる候補アミノ酸残基を決定するので、蛋白質または生理活性ポリペプチドのアミノ酸配列から高速かつ高精度に結合部位を予測することができるようになる。
【0030】
また、請求項9に記載のプログラムは、記憶部と制御部とを少なくとも備えた結合部位予測装置に実行させるためのプログラムであって、上記制御部において実行される、上記記憶部に格納された目的の複数の蛋白質または生理活性ポリペプチドのアミノ酸配列データを取得するアミノ酸配列データ取得ステップと、上記目的の複数の蛋白質または生理活性ポリペプチドの上記アミノ酸配列データにおいて、アミノ酸配列上で結合部位となる任意のアミノ酸残基を仮定する結合部位仮定ステップと、上記結合部位仮定ステップにて上記結合部位が仮定された上記アミノ酸配列データにおいて、各アミノ酸残基の間の配列上の距離に基づいて、上記各アミノ酸残基の間の空間上の距離を、以下の式を用いて決定し上記記憶部に格納する空間距離決定ステップと、r = k d n (0<n<1)(ここでrは上記空間上の距離、dは上記配列上の距離、kは比例定数、nは所定のパラメータである)上記各アミノ酸残基が持つ電荷を当該各アミノ酸残基の荷電性に基づいて決定する電荷決定ステップと、上記空間距離決定ステップにより上記記憶部に格納された上記各アミノ酸残基間の空間上の距離と、上記電荷決定ステップにより決定された上記各アミノ酸残基が持つ上記電荷とに従って、上記各アミノ酸残基のエネルギーを計算し上記記憶部に格納するエネルギー計算ステップと、上記結合部位仮定ステップにより上記結合部位を変えて、上記空間距離決定ステップにより上記空間距離を決定し上記記憶部に格納し、上記電荷決定ステップにより上記電荷を決定し上記記憶部に格納し、上記エネルギー計算ステップにより上記各アミノ酸残基のエネルギーを計算し上記記憶部に格納し、当該エネルギーの総和が最小となる上記結合部位を求め、求められた当該結合部位を上記記憶部に格納するエネルギー最小化ステップと、上記エネルギー最小化ステップによりエネルギーの総和が最小となる上記結合部位を、結合部位の候補アミノ酸残基として決定し上記記憶部に格納する候補アミノ酸残基決定ステップと、を含む結合部位予測方法を上記結合部位予測装置に実行させることを特徴とする。
【0031】
このプログラムによれば、目的の複数の蛋白質または生理活性ポリペプチドのアミノ酸配列データを取得し、目的の複数の蛋白質または生理活性ポリペプチドのアミノ酸配列データにおいて、アミノ酸配列上で結合部位となる任意のアミノ酸残基を仮定し、結合部位を仮定されたアミノ酸配列データにおいて、各アミノ酸残基の間の配列上の距離に基づいて、各アミノ酸残基の間の空間上の距離を、r=kd n (0<n<1)(ここでrは空間上の距離、dは配列上の距離、kは比例定数、nは所定のパラメータである)の式を用いて決定し、各アミノ酸残基が持つ電荷を当該各アミノ酸残基の荷電性に基づいて決定し、各アミノ酸残基間の空間上の距離と、決定された各アミノ酸残基が持つ電荷とに従って、各アミノ酸残基のエネルギーを計算し、結合部位を変えて、空間距離を決定し、電荷を決定し、各アミノ酸残基のエネルギーを計算し、当該エネルギーの総和が最小となる結合部位を求め、エネルギーの総和が最小となる結合部位を、結合部位の候補アミノ酸残基として決定するので、蛋白質または生理活性ポリペプチドのアミノ酸配列から高速かつ高精度に結合部位を予測することができるようになる。
【0032】
また、請求項10に記載のプログラムは、記憶部と制御部を少なくとも備えた結合部位予測装置に実行させるためのプログラムであって、上記制御部において実行される、上記記憶部に格納された目的の蛋白質または生理活性ポリペプチドのアミノ酸配列データと、結合候補となる1つまたは複数の蛋白質または生理活性ポリペプチドのアミノ酸配列データとを取得するアミノ酸配列データ取得ステップと、上記目的の蛋白質または生理活性ポリペプチドの上記アミノ酸配列データ、および、上記結合候補となる蛋白質または生理活性ポリペプチドの上記アミノ酸配列データにおいてアミノ酸配列上で結合部位となる任意のアミノ酸残基を仮定する結合部位仮定ステップと、上記結合部位仮定ステップにて上記結合部位を仮定された上記アミノ酸配列データにおいて、各アミノ酸残基の間の配列上の距離に基づいて、上記各アミノ酸残基の間の空間上の距離を、以下の式を用いて決定し上記記憶部に格納する空間距離決定ステップと、r = k d n (0<n<1)(ここでrは上記空間上の距離、dは上記配列上の距離、kは比例定数、nは所定のパラメータである)上記各アミノ酸残基が持つ電荷を当該各アミノ酸残基の荷電性に基づいて決定する電荷決定ステップと、上記空間距離決定ステップにより上記記憶部に格納された上記各アミノ酸残基間の空間上の距離と、上記電荷決定ステップにより決定された上記各アミノ酸残基が持つ上記電荷とに従って、上記各アミノ酸残基のエネルギーを計算し上記記憶部に格納するエネルギー計算ステップと、上記結合部位仮定ステップにより上記結合部位を変えて、上記空間距離決定ステップにより上記空間距離を決定し上記記憶部に格納し、上記電荷決定ステップにより上記電荷を決定し上記記憶部に格納し、上記エネルギー計算ステップにより上記各アミノ酸残基のエネルギーを計算し上記記憶部に格納し、当該エネルギーの総和が最小となる上記結合部位を求め、求められた当該結合部位を上記記憶部に格納するエネルギー最小化ステップと、全ての上記結合候補について上記エネルギー最小化ステップを実行した結果、上記エネルギーの総和が最小となる上記結合部位をもつ結合候補を決定し、上記記憶部に格納する結合候補決定ステップと、を含む結合部位予測方法を上記結合部位予測装置に実行させることを特徴とする。
【0033】
このプログラムによれば、目的の蛋白質または生理活性ポリペプチドのアミノ酸配列データと、結合候補となる1つまたは複数の蛋白質または生理活性ポリペプチドのアミノ酸配列データとを取得し、目的の蛋白質または生理活性ポリペプチドのアミノ酸配列データ、および、結合候補となる蛋白質または生理活性ポリペプチドのアミノ酸配列データにおいて、アミノ酸配列上で結合部位となる任意のアミノ酸残基を仮定し、結合部位を仮定されたアミノ酸配列データにおいて、各アミノ酸残基の間の配列上の距離に基づいて、各アミノ酸残基の間の空間上の距離を、r=kd n (0<n<1)(ここでrは空間上の距離、dは配列上の距離、kは比例定数、nは所定のパラメータである)の式を用いて決定し、各アミノ酸残基が持つ電荷を当該各アミノ酸残基の荷電性に基づいて決定し、各アミノ酸残基間の空間上の距離と、決定された各アミノ酸残基が持つ電荷とに従って、各アミノ酸残基のエネルギーを計算し、結合部位を変えて、空間距離を決定し、電荷を決定し、各アミノ酸残基のエネルギーを計算し、当該エネルギーの総和が最小となる結合部位を求め、全ての結合候補についてエネルギー最小化処理を実行した結果、エネルギーの総和が最小となる結合部位をもつ結合候補を決定するので、蛋白質または生理活性ポリペプチドのアミノ酸配列から高速かつ高精度に最適な結合候補の蛋白質を予測することができるようになる。
【0034】
また、本発明は記録媒体に関するものであり、請求項11に記載の記録媒体は、上記請求項8から10のいずれか一つに記載されたプログラムを記録したことを特徴とする。
【0035】
この記録媒体によれば、当該記録媒体に記録されたプログラムをコンピュータに読み取らせて実行することによって、請求項8から10のいずれか一つに記載されたプログラムをコンピュータを利用して実現することができ、これら各方法と同様の効果を得ることができる。
【0036】
【発明の実施の形態】
以下に、本発明にかかる結合部位予測方法、結合部位予測装置、プログラム、および、記録媒体の実施の形態を図面に基づいて詳細に説明する。なお、この実施の形態によりこの発明が限定されるものではない。
特に、以下の実施の形態においては、本発明を、蛋白質のアミノ酸配列等に適用した例について説明するが、この場合に限られず、生理活性ポリペプチドのアミノ酸配列を用いた場合においても同様に適用することができる。
【0037】
[本発明の概要]
以下、本発明の概要について説明し、その後、本発明の構成および処理等について詳細に説明する。図1および図2は本発明の基本原理を示す原理構成図である。本発明は、概略的に、以下の基本的特徴を有する。
【0038】
図1は、本発明により1つの蛋白質のアミノ酸配列情報からその蛋白質の結合部位を予測する場合の概念を説明する図である。
図1に示すように、まず、本発明では、蛋白質または生理活性ポリペプチドのアミノ酸配列データから蛋白質の立体構造における各アミノ酸残基間の空間上の距離データを求める(ステップSA−1)。
【0039】
ここで、空間上の距離データを求める手法には、例えば、以下の3通りの手法がある。
【0040】
1)高速計算手法
この手法は、アミノ酸間の配列上の距離から空間的な距離に変換する方法である。図6は、本発明の高速計算手法の概念を示す図である。蛋白質の立体構造がガウス鎖をとると仮定すると、蛋白質のアミノ酸配列上の距離と、蛋白質の立体構造における空間上の距離は以下の式で関係づけることができる。
r = k d n (0<n<1)
ここでrは空間上の距離、dは配列上の距離、kは比例定数である。つまり、配列上の距離dが分かれば、空間上の距離rを計算することができる。kおよびnの値は、例えば、PDB(Protein Data Bank)などの蛋白質構造データベースに収集された立体構造情報データからアミノ酸間の配列上の距離と空間上の距離との関係を統計学的に処理し適切な値を設定してもよい。ここで、nは、0〜1であるが、好ましくは、0.5〜0.6である。また、kは2.8Å〜4.8Åであるが、好ましくは、3.3Å〜4.3Åである。本手法はアルゴリズムが非常にシンプルであり計算負荷も非常に少ないため、例えば数万以上の蛋白質を扱う時などの大量の蛋白質について処理する場合には非常に強力な方法となる。
【0041】
2)構造データ利用計算手法
この手法は、蛋白質構造データベースに登録された立体構造情報データを用いることにより、正確に実際のアミノ酸残基間の空間上の距離を求める手法である。例えばPDBなどの蛋白質構造データベースに目的の蛋白質の立体構造情報データが格納されている場合には、データベースに登録された立体構造情報データを取得することにより、空間上の距離を以下のように正確に計算することができる。
【0042】
例えばアミノ酸残基番号Iとアミノ酸残基番号Jとの空間上の距離RIJは、アミノ酸残基番号Iの重心や特定の主鎖の原子などの座標を(xI, yI, zI)とし、アミノ酸残基番号Jの重心や特定の主鎖の原子などの座標を(xJ, yJ, zJ)とすると、以下のように計算することができる。
Figure 0003990963
(ここで、R IJ > 0)
【0043】
3)シミュレーションデータ利用計算手法
この手法は、構造未知の蛋白質について、既知の構造シミュレーション手法により蛋白質の構造シミュレーションを行い、そのシミュレーションデータ(予想される立体構造情報データ)を用いて空間上の距離を求める手法である。立体構造予測シミュレーション手法に関してはホモロジー・モデリングなど様々な方法がある。例えば、『実践バイオインフォマティクス』(C. Gibas, P.Jambeck著 オライリー・ジャパン 2002年)などに詳しく紹介されている。
【0044】
本手法は、手法1や手法2と比較して計算負荷が大きいという欠点があるが、構造未知の蛋白質についてほぼ正確な空間上の距離を求めることができるという利点がある。
【0045】
本発明の特徴は、このように各ステップで複数の計算方法を可能にしたことである。特に既存のシミュレーション手法による立体構造予測方法は時間がかかるという欠点を補うために、手法1のようにアミノ酸配列データから簡易的に各アミノ酸残基間の空間上の距離データを決定する方法を組み合わせることで、高速な計算を可能にして結合相手予測など大量のデータを処理する予測法を可能にしている。
【0046】
次に、本発明は、当該距離データと各アミノ酸の電荷に従って蛋白質の全エネルギーを計算する(ステップSA−2)。
【0047】
ここで、アミノ酸の電荷の決定方法も様々考えられる。例えば、正に帯電している荷電性アミノ酸(リジン、アルギニン)の電荷を1、負に帯電している荷電性アミノ酸(グルタミン酸、アスパラギン酸)の電荷を−1、それ以外のアミノ酸の電荷は0とするような方法がある。また、蛋白質構造データベースに登録された蛋白質の立体構造情報や、シミュレーション手法により得られた立体構造情報を基にして既存の量子化学計算手法により各アミノ酸残基の電荷を決定することもできる。
【0048】
また、蛋白質の全エネルギーの計算も様々な方法が考えられるが、例えば、「Introduction to Computational Chemistry」(Frank Jensen著 John Wiley & Sons社 1999年)などで説明されている、分子力学、分子動力学、分子軌道法、密度汎関数法などのエネルギー計算法などの手法を用いても実施でき、いずれかの手法から要求される予測精度と実施者の計算環境によって最適なものを選べば良い。他にもFragment MO法(Chemical PhysicsLetters,Volume 336,Issues 1−2,9 March 2001,Pages 163−170)を用いることにより各アミノ酸残基のエネルギーを求めることができる。この方法は計算時間がかかるが、予測精度が高いことが期待される。
【0049】
他に計算時間がかからない方法としては、以下のように静電エネルギーを計算する方法がある。
total = 1/2 ΣΣqij / rij
(i、jは全アミノ酸残基の任意のアミノ酸残基番号、i not j)
本式において、Etotalは蛋白質の全エネルギーであり、qiはアミノ酸残基iの部分電荷であり、qjはアミノ酸残基jの部分電荷であり、rijはアミノ酸残基iとアミノ酸残基jとの空間上の距離である。
【0050】
本式による方法は他の手法と比較して計算負荷が極めて少ないため、特に網羅的な計算の時に有効である。
【0051】
次に、本発明は、特定のアミノ酸と蛋白質内のそれ以外のアミノ酸残基との相互作用エネルギーを以下の式により計算することにより、各アミノ酸残基が蛋白質の全エネルギーをどれくらい安定化しているかを求める(ステップSA−3)。
interaction(N) = qNΣqj/r
total = 1/2ΣEinteraction(N)
ここで、Nは任意のアミノ酸残基番号、E interaction (N)はアミノ酸残基Nとそれ以外のアミノ酸残基との相互作用エネルギー、jはN以外のアミノ酸残基番号、qNはアミノ酸残基Nの部分電荷、qjはアミノ酸残基jの部分電荷、rはアミノ酸残基Nとアミノ酸残基jとの空間上の距離を示す。ここで全てのアミノ酸残基に対する相互作用エネルギーの総和の半分が蛋白質全体のエネルギーEtotalに相当する。
【0052】
次に、本発明は、ステップSA−3で求めた相互作用エネルギーが相対的に高いアミノ酸残基や、予め定めた閾値を超える相互作用エネルギーをもつアミノ酸残基を、エネルギー的に不安定なアミノ酸残基として特定することにより結合部位を予測する(ステップSA−4)。
【0053】
また、図2は、本発明により複数の蛋白質のアミノ酸配列情報からそれらの蛋白質で複合体を形成するときの結合部位を予測する場合の概念を説明する図である。
【0054】
まず、本発明は、複数のアミノ酸配列上で結合部位となるアミノ酸残基(結合残基)を仮定する(ステップSB−1)。ここで、図7は、複数のアミノ酸配列上で結合残基を仮定する場合の概念を示す図である。図7に示す例においては、アミノ酸配列Aの50番目のアミノ酸残基と、アミノ酸配列Bの100番目のアミノ酸残基とを結合残基と仮定している。ここで、結合残基は、図1を用いて上述した本発明の手法により各アミノ酸配列において結合部位であると予測されたアミノ酸残基を用いてもよい。
【0055】
次に、本発明は、異なるアミノ酸配列上に存在する2つのアミノ酸残基間の空間上の距離を決定する(ステップSB−2)。ここで、空間上の距離の決定手法には、上述した3つの手法を用いることができるが、以下に、最も計算負荷が少なく効率的に計算を行うことができる1)高速計算手法を用いた場合について説明する。
【0056】
まず、異なるアミノ酸配列上に存在する2つのアミノ酸残基間の配列上の距離を以下のように定義する。
Figure 0003990963
ここで、図8は、着目残基の概念を説明する図である。図8に示すように、2つのアミノ酸配列(AおよびB)の結合残基と、結合残基以外の任意の着目残基を定義している。
【0057】
ついで、本発明は、異なるアミノ酸配列上に存在する2つのアミノ酸残基間の配列上の距離dから複合体の立体構造の空間上の距離rを推定する(ステップSB−3)。
r = k d n (0<n<1)
ここでrは空間上の距離、dは配列上の距離、kは比例定数である。ここで、nは0〜1であるが、好ましくは、0.5〜0.6である。また、kは2.8Å〜4.8Åであるが、好ましくは、3.3Å〜4.3Åである。つまり、配列上の距離dが分かれば、空間上の距離rを計算することができる。
【0058】
この他に、複合体の立体構造が既知である場合には、上述した2)構造データ利用計算手法を用いて、アミノ酸残基間の空間上の距離を正確に求めることができる。
【0059】
また、上述した3)シミュレーションデータ利用計算手法を用いることにより、複合体の立体構造を予測して、そのシミュレーションデータを利用することにより、アミノ酸残基間の空間上の距離をある程度正確に求めることができる。ここで、図12は、ドッキングシミュレーションを用いて複合体構造を生成する場合の概念を示す図である。図12に示すように、複数の立体構造情報を使って、複合体の構造を生成させるためにドッキングシミュレーションを行う。ドッキングシミュレーションは既知の様々なシミュレーション手法を用いることができる。例えば、図12で示すように、2つの蛋白質の距離と配向を変化させるものが一般的である。さらに具体的な例を挙げるとすると、一方の構造を固定し、もう一方の構造に回転で2つ、並進で2つの自由度を与えて、様々な構造を発生させる。2つの構造が重ならないが接触するという条件の構造を抽出すると、とりうる複合体の構造が得られる。
【0060】
次に、本発明は、空間上の距離データと各アミノ酸の電荷に従って蛋白質の全エネルギーを計算する(ステップSB−4)。
【0061】
ここで、アミノ酸の電荷の決定方法も様々考えられる。例えば、上述したように、正に帯電している荷電性アミノ酸(リジン、アルギニン)の電荷を1、負に帯電している荷電性アミノ酸(グルタミン酸、アスパラギン酸)の電荷を−1、それ以外のアミノ酸の電荷は0とするような方法がある。また、上述したように、蛋白質構造データベースに登録された複合体の立体構造情報や、シミュレーション手法により得られた複合体の立体構造情報を基にして既存の量子化学計算手法により各アミノ酸残基の電荷を決定することもできる。
【0062】
また、蛋白質の全エネルギーの計算も様々な方法が考えられるが、上述したように、例えば、「Introduction to Computational Chemistry」(Frank Jensen著 John Wiley & Sons 社 1999年)などで説明されている、分子力学、分子動力学、分子軌道法、密度汎関数法などのエネルギー計算法などの手法を用いても実施でき、いずれかの手法から要求される予測精度と実施者の計算環境によって最適なものを選べば良い。他にも上述したように、Fragment MO法(Chemical Physics Letters,Volume 336,Issues 1−2,9 March 2001,Pages 163−170)を用いることにより各アミノ酸残基のエネルギーを求めることができる。この方法は計算時間がかかるが、予測精度が高いことが期待される。
【0063】
他に計算時間がかからない方法としては、上述したように、以下のように静電エネルギーを計算する方法がある。
total = 1/2 ΣΣqij / rij
(i、jは全アミノ酸残基の任意のアミノ酸残基番号、i not j)
本式において、E totalは蛋白質の全エネルギーであり、qiはアミノ酸残基iの部分電荷であり、qjはアミノ酸残基jの部分電荷であり、rijはアミノ酸残基iとアミノ酸残基jとの空間上の距離である。このように本手法は基本的には二重線で示した処理フローと同様の手順で進み、候補蛋白質のアミノ酸配列を変えては繰り返す。その中で最も安定な複合体を形成できるものが相互作用相手の確率が高いと予測する。
【0064】
次に、本発明は、ステップSB−1に戻り、相互作用するアミノ酸残基(結合残基)を変えて、全ての組合せについてEtotal を計算して、最もEtotal が低いときの結合残基を結合部位として予測する(ステップSB−5)。
【0065】
[システム構成]
まず、本システムの構成について説明する。図3は、本発明が適用される本システムの構成の一例を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。本システムは、概略的に、結合部位予測装置100と、配列情報等に関する外部データベースやホモロジー検索等の外部プログラム等を提供する外部システム200とを、ネットワーク300を介して通信可能に接続して構成されている。
【0066】
図3においてネットワーク300は、結合部位予測装置100と外部システム200とを相互に接続する機能を有し、例えば、インターネット等である。
【0067】
図3において外部システム200は、ネットワーク300を介して、結合部位予測装置100と相互に接続され、利用者に対してアミノ酸配列情報や蛋白質立体構造情報等に関する外部データベースやホモロジー検索やモチーフ検索等の外部プログラムを実行するウェブサイトを提供する機能を有する。
【0068】
ここで、外部システム200は、WEBサーバやASPサーバ等として構成してもよく、そのハードウェア構成は、一般に市販されるワークステーション、パーソナルコンピュータ等の情報処理装置およびその付属装置により構成してもよい。また、外部システム200の各機能は、外部システム200のハードウェア構成中のCPU、ディスク装置、メモリ装置、入力装置、出力装置、通信制御装置等およびそれらを制御するプログラム等により実現される。
【0069】
図3において結合部位予測装置100は、概略的に、結合部位予測装置100の全体を統括的に制御するCPU等の制御部102、通信回線等に接続されるルータ等の通信装置(図示せず)に接続される通信制御インターフェース部104、入力装置112や出力装置114に接続される入出力制御インターフェース部108、および、各種のデータベースやテーブルなどを格納する記憶部106を備えて構成されており、これら各部は任意の通信路を介して通信可能に接続されている。さらに、この結合部位予測装置100は、ルータ等の通信装置および専用線等の有線または無線の通信回線を介して、ネットワーク300に通信可能に接続されている。
【0070】
記憶部106に格納される各種のデータベースやテーブル(アミノ酸配列データベース106a〜処理結果ファイル106g)は、固定ディスク装置等のストレージ手段であり、各種処理に用いる各種のプログラムやテーブルやファイルやデータベースやウェブページ用ファイル等を格納する。
【0071】
これら記憶部106の各構成要素のうち、アミノ酸配列データベース106aは、アミノ酸配列を格納したデータベースである。アミノ酸配列データベース106aは、インターネットを経由してアクセスする外部のアミノ酸配列データベースであってもよく、また、これらのデータベースをコピーしたり、オリジナルの配列情報を格納したり、さらに独自のアノテーション情報等を付加したりして作成したインハウスデータベースであってもよい。
【0072】
また、蛋白質構造データベース106bは、蛋白質の立体構造情報を格納したデータベースである。蛋白質構造データベース106bは、インターネットを経由してアクセスする外部の立体構造情報データベースであってもよく、また、これらのデータベースをコピーしたり、オリジナルの立体構造情報を格納したり、さらに独自のアノテーション情報等を付加したりして作成したインハウスデータベースであってもよい。
【0073】
また、距離データファイル106cは、アミノ酸配列に含まれる各アミノ酸残基間の距離(配列上の距離、空間上の距離)に関する情報等を格納する距離情報格納手段である。
【0074】
また、全エネルギーデータファイル106dは、蛋白質の全エネルギーに関する情報等を格納する全エネルギーデータ格納手段である。
【0075】
また、相互作用エネルギーデータファイル106eは、各アミノ酸残基の相互作用エネルギーに関する情報等を格納する相互作用エネルギーデータ格納手段である。
【0076】
また、複合体構造データファイル106fは、複数の蛋白質の複合体構造に関する情報等を格納する複合体構造データ格納手段である。
【0077】
また、処理結果ファイル106gは、結合部位予測装置100による各種の処理結果に関する情報等を格納する処理結果格納手段である。
【0078】
また、図3において、通信制御インターフェース部104は、結合部位予測装置100とネットワーク300(またはルータ等の通信装置)との間における通信制御を行う。すなわち、通信制御インターフェース部104は、他の端末と通信回線を介してデータを通信する機能を有する。
【0079】
また、図3において、入出力制御インターフェース部108は、入力装置112や出力装置114の制御を行う。ここで、出力装置114としては、モニタ(家庭用テレビを含む)の他、スピーカを用いることができる(なお、以下においては出力装置114をモニタとして記載する場合がある)。また、入力装置112としては、キーボード、マウス、および、マイク等を用いることができる。また、モニタも、マウスと協働してポインティングデバイス機能を実現する。
【0080】
また、図3において、制御部102は、OS(Operating System)等の制御プログラム、各種の処理手順等を規定したプログラム、および所要データを格納するための内部メモリを有し、これらのプログラム等により、種々の処理を実行するための情報処理を行う。制御部102は、機能概念的に、アミノ酸配列データ取得部102a、空間距離決定部102b、電荷決定部102c、エネルギー計算部102d、候補アミノ酸残基決定部102e、複合体構造生成部102f、エネルギー最小化部102g、結合候補データ取得部102h、結合部位予測部102i、および、結合相手候補決定部102jを備えて構成されている。
【0081】
このうち、アミノ酸配列データ取得部102aは、目的の蛋白質または生理活性ポリペプチドのアミノ酸配列データを取得するアミノ酸配列データ取得手段、目的の複数の蛋白質または生理活性ポリペプチドのアミノ酸配列データを取得するアミノ酸配列データ取得手段、および、目的の蛋白質または生理活性ポリペプチドのアミノ酸配列データと、結合候補となる複数の蛋白質または生理活性ポリペプチドのアミノ酸配列データとを取得するアミノ酸配列データ取得手段である。
【0082】
また、空間距離決定部102bは、アミノ酸配列データ取得手段により取得されたアミノ酸配列データに含まれる各アミノ酸残基の間の空間上の距離を決定する空間距離決定手段、アミノ酸配列データ取得手段により取得された複数のアミノ酸配列データに含まれる各アミノ酸残基の間の空間上の距離を、複合体構造生成手段により生成した複合体の立体構造情報に従って決定する空間距離決定手段、および、アミノ酸配列データ取得手段により取得された目的のアミノ酸配列データと結合候補のアミノ酸配列データに含まれる各アミノ酸残基の間の空間上の距離を、複合体構造生成手段により生成した複合体の立体構造情報に従って決定する空間距離決定手段である。ここで、空間距離決定部102bは、図4に示すように、高速計算部102k、構造データ利用計算部102m、および、シミュレーションデータ利用計算部102nを備えて構成されている。ここで、高速計算部102kは、高速計算手法により空間距離を決定する高速計算手段である。また、構造データ利用計算部102mは、構造データ利用計算手法により空間距離を決定する構造データ利用計算手段である。また、シミュレーションデータ利用計算部102nは、シミュレーションデータ利用計算手法により空間距離を決定するシミュレーションデータ利用計算手段である。
【0083】
また、電荷決定部102cは、アミノ酸配列データに含まれる各アミノ酸残基が持つ電荷を決定する電荷決定手段、複数のアミノ酸配列データに含まれる各アミノ酸残基が持つ電荷を決定する電荷決定手段、および、目的のアミノ酸配列データと結合候補のアミノ酸配列データに含まれる各アミノ酸残基が持つ電荷を決定する電荷決定手段である。
【0084】
また、エネルギー計算部102dは、空間距離決定手段により決定された各アミノ酸残基間の空間上の距離と、電荷決定手段により決定された各アミノ酸残基が持つ電荷とに従って、各アミノ酸残基のエネルギーを計算するエネルギー計算手段である。エネルギー計算部102dは、図5に示すように、全エネルギー計算部102p、および、相互作用エネルギー計算部102qを備えて構成される。ここで、全エネルギー計算部102pは、蛋白質の全エネルギーを計算する全エネルギー計算手段である。また、相互作用エネルギー計算部102qは、アミノ酸残基の相互作用エネルギーを計算する相互作用エネルギー計算手段である。
【0085】
また、候補アミノ酸残基決定部102eは、エネルギー計算手段により計算されたエネルギーに従って、結合部位となる候補アミノ酸残基を決定する候補アミノ酸残基決定手段、および、エネルギー最小化手段によりエネルギーの総和が最小となる結合部位を、結合部位の候補アミノ酸残基として決定する候補アミノ酸残基決定手段である。
【0086】
また、複合体構造生成部102fは、目的の複数の蛋白質または生理活性ポリペプチドの結合した複合体の立体構造情報を生成する複合体構造生成手段、および、目的の蛋白質または生理活性ポリペプチドと、結合候補となる蛋白質または生理活性ポリペプチドの結合した複合体の立体構造情報を生成する複合体構造生成手段である。
【0087】
また、エネルギー最小化部102gは、複合体構造生成手段により複合体について結合部位を変えて複合体の立体構造情報を生成し、エネルギー計算手段により各アミノ酸残基のエネルギーを計算し、当該エネルギーの総和が最小となる結合部位を求めるエネルギー最小化手段である。
【0088】
また、結合候補データ取得部102hは、結合候補となる蛋白質のアミノ酸配列データ等を取得する結合候補データ取得手段である。
【0089】
また、結合部位予測部102iは、結合部位の候補アミノ酸残基から結合部位のアミノ酸残基を予測する結合部位予測手段である。
【0090】
また、結合相手候補決定部102jは、全ての結合候補についてエネルギー最小化手段を実行した結果、エネルギーの総和が最小となる結合部位をもつ結合候補を決定する結合候補決定手段である。
これら各部によって行なわれる処理の詳細については、後述する。
【0091】
[システムの処理]
次に、このように構成された本実施の形態における本システムの処理の一例について、以下に図3〜図21を参照して詳細に説明する。
【0092】
図9は、本実施形態における本システムの処理の一例を示すフローチャートである。図9において、点線で示す処理フローは本システムにより一つの蛋白質の配列中における結合部位を予測する場合の処理フローを示し、また、二重線で示す処理フローは本システムにより相互作用することが既知である複数の蛋白質のアミノ酸配列を用いて結合部位を予測する場合の処理フローを示し、さらに、実線で示す処理フローは本システムにより目的蛋白質に対して最も良く結合する相手側の候補蛋白質を予測する場合の処理フローを示す。これらの3つの処理フローの基本的な考え方、計算の処理のほとんどが共通である。さらには、相互作用情報を解析するという大目的については共通である。
【0093】
[一つの蛋白質の配列中における結合部位を予測する場合の処理]
次に、本システムにより一つの蛋白質の配列中における結合部位を予測する場合の処理の詳細について図9等を参照して説明する。図9の点線で示す処理フローは、本実施形態における本システムにより一つの蛋白質の配列中における結合部位を予測する場合の処理の一例を示すフローチャートである。
【0094】
まず、結合部位予測装置100は、アミノ酸配列データ取得部102aの処理により、Genbankなどの外部システム200の外部データベースやアミノ酸配列データベース106aなどにアクセスして、目的の蛋白質または生理活性ポリペプチドのアミノ酸配列データを取得する(ステップSC−1)。
【0095】
そして、結合部位予測装置100は、空間距離決定部102bの処理により、ステップSC−1により取得されたアミノ酸配列データに含まれる各アミノ酸残基の間の空間上の距離を決定する(ステップSC−2)。
【0096】
ここで、空間距離決定部102bは、高速計算部102kの処理により上述した高速計算手法により各アミノ酸残基の間の配列上の距離から空間上の距離を決定してもよく、また、構造データ利用計算部102mの処理により上述した構造データ利用計算手法により既知の構造データを用いて各アミノ酸残基の間の空間上の距離を決定してもよく、さらに、シミュレーションデータ利用計算部102nの処理により上述したシミュレーションデータ利用計算手法により既存の構造シミュレーションプログラムの処理結果による予測構造を用いて各アミノ酸残基の間の空間上の距離を決定してもよい。
【0097】
ついで、結合部位予測装置100は、電荷決定部102cの処理により、アミノ酸配列データに含まれる各アミノ酸残基が持つ電荷を決定する(ステップSC−3)。アミノ酸の電荷の決定方法も様々考えられる。一般的には、正に帯電している荷電性アミノ酸(リジン、アルギニン)を1、負に帯電している荷電性アミノ酸(グルタミン酸、アスパラギン酸)を−1、それ以外は0とするような方法がある。また、得られた立体構造情報を基にして、量子化学計算で電荷を決定することもできる。さらに、実験的に各アミノ酸残基の電荷に関する実験データが分かっている場合は、それを反映することが好ましい。
【0098】
ついで、結合部位予測装置100は、エネルギー計算部102dの処理により、決定された各アミノ酸残基間の空間上の距離と、各アミノ酸残基が持つ電荷とに従って、各アミノ酸残基のエネルギーを計算する(ステップSC−4)。
【0099】
ここで、エネルギー計算には様々な手法があるが、最も計算時間がかからない方法である静電エネルギーを計算する方法について以下に説明する。
まず、全エネルギー計算部102pの処理により、以下の式により蛋白質の全エネルギーを計算する。
total = 1/2 ΣΣqij / rij
(i、jは全アミノ酸残基の任意のアミノ酸残基番号、i not j)
本式において、Etotalは蛋白質の全エネルギーであり、qiはアミノ酸残基iの部分電荷であり、qjはアミノ酸残基jの部分電荷であり、rijはアミノ酸残基iとアミノ酸残基jとの空間上の距離である。
【0100】
次に、相互作用エネルギー計算部102qは、特定のアミノ酸と蛋白質内のそれ以外のアミノ酸残基との相互作用エネルギーを以下の式により計算することにより、各アミノ酸残基が蛋白質の全エネルギーをどれくらい安定化しているかを求める。
interaction(N) = qNΣqj/r
total = 1/2ΣEinteraction(N)
ここで、Nは任意のアミノ酸残基番号、E interaction (N)はアミノ酸残基Nとそれ以外のアミノ酸残基との相互作用エネルギー、jはN以外のアミノ酸残基番号、qNはアミノ酸残基Nの部分電荷、qjはアミノ酸残基jの部分電荷、rはアミノ酸残基Nとアミノ酸残基jとの空間上の距離を示す。ここで全てのアミノ酸残基に対する相互作用エネルギーの総和の半分が蛋白質全体のエネルギーEtotalに相当する。
【0101】
そして、結合部位予測装置100は、候補アミノ酸残基決定部102eの処理により、計算された相互作用エネルギーに従って、結合部位となる候補アミノ酸残基を決定する(ステップSC−5)。すなわち、候補アミノ酸残基決定部102eは、相互作用エネルギーが相対的に高いアミノ酸残基や、予め定めた閾値を超える相互作用エネルギーをもつアミノ酸残基を、エネルギー的に不安定なアミノ酸残基として特定することにより、結合部位となる候補アミノ酸残基を決定する。
【0102】
そして、結合部位予測装置100は、結合部位予測部102iの処理により、候補アミノ酸残基のうち空間的、または、エネルギー的に結合部位とならない候補を除去することにより、結合部位を予測する。例えば、処理結果の候補アミノ酸残基のエネルギーなどの一例として図10のような結果が得られるとすると、結合部位予測部102iは、図10の中で最もエネルギーの高いグルタミン酸(GLU)を一番の結合部位の候補として予測する。また、結合部位予測部102iは、例えば図11に示すように立体構造上で不安定な部分がクラスター化しているもの(黒で示したアミノ酸残基部分)が結合部位である可能性が高いと予測する。
これにて、本システムにより一つの蛋白質の配列中における結合部位を予測する場合の処理が終了する。
【0103】
[相互作用することが既知である複数の蛋白質のアミノ酸配列を用いて結合部位を予測する場合の処理]
次に、本システムにより相互作用することが既知である複数の蛋白質のアミノ酸配列を用いて結合部位を予測する場合の処理の詳細について図9等を参照して説明する。図9の二重線で示す処理フローは、本実施形態における本システムにより相互作用することが既知である複数の蛋白質のアミノ酸配列を用いて結合部位を予測する場合の処理の一例を示すフローチャートである。
【0104】
まず、結合部位予測装置100は、アミノ酸配列データ取得部102aの処理により、Genbankなどの外部システム200の外部データベースやアミノ酸配列データベース106aなどにアクセスして、目的の蛋白質または生理活性ポリペプチドのアミノ酸配列データを取得する(ステップSC−1)。
【0105】
ついで、結合部位予測装置100は、複合体構造生成部102fの処理により、目的の複数の蛋白質または生理活性ポリペプチドの結合した複合体の立体構造情報を生成する(ステップSC−7)。ここで、図12を用いて上述したように、複合体構造生成部102fは、シミュレーションデータ利用計算手法を用いることにより、複合体の立体構造を予測してもよい。また、複合体構造生成部102fは、複合体の立体構造が既知である場合には、複合体の立体構造情報を取得してもよい。
【0106】
また、複合体構造生成部102fは、上述したように、複数のアミノ酸配列上で結合部位となるアミノ酸残基(結合残基)を仮定することにより、実際に複合体構造を生成することなく、処理を進めることができる。ここで、図7は、複数のアミノ酸配列上で結合残基を仮定する場合の概念を示す図である。図7に示す例においては、アミノ酸配列Aの50番目のアミノ酸残基と、アミノ酸配列Bの結合部位予測装置100番目のアミノ酸残基とを結合残基と仮定している。ここで、結合残基は、上述した本発明の手法により各アミノ酸配列において結合部位であると予測されたアミノ酸残基を用いてもよい。
【0107】
ついで、結合部位予測装置100は、空間距離決定部102bの処理により、取得された複数のアミノ酸配列データに含まれる各アミノ酸残基の間の空間上の距離を、複合体の立体構造情報に従って決定する(ステップSC−2)。
【0108】
ここで、空間上の距離の決定手法には、上述した3つの手法を用いることができるが、複合体の立体構造が既知である場合や、ドッキングシミュレーションを行った際には、空間距離決定部102bは、アミノ酸残基間の空間上の距離を正確に求めることができる。以下に、最も計算負荷が少なく効率的に計算を行うことができる1)高速計算手法を用いた場合について説明する。
【0109】
まず、空間距離決定部102bは、異なるアミノ酸配列上に存在する2つのアミノ酸残基間の配列上の距離を以下のように定義する。
Figure 0003990963
ここで、図8は、着目残基の概念を説明する図である。図8に示すように、2つのアミノ酸配列(AおよびB)の結合残基と、結合残基以外の任意の着目残基を定義している。
【0110】
ついで、空間距離決定部102bは、異なるアミノ酸配列上に存在する2つのアミノ酸残基間の配列上の距離dから複合体の立体構造の空間上の距離rを推定する。
r = k d n (0<n<1)
ここでrは空間上の距離、dは配列上の距離、kは比例定数である。ここで、nは0〜1であるが、好ましくは、0.5〜0.6である。また、kは2.8Å〜4.8Åであるが、好ましくは、3.3Å〜4.3Åである。
【0111】
ついで、結合部位予測装置100は、電荷決定部102cの処理により、複数のアミノ酸配列データに含まれる各アミノ酸残基が持つ電荷を決定する(ステップSC−3)。
【0112】
ついで、結合部位予測装置100は、エネルギー計算部102dの処理により、ステップSC−2により決定された各アミノ酸残基間の空間上の距離と、ステップSC−3により決定された各アミノ酸残基が持つ電荷とに従って、各アミノ酸残基のエネルギーを計算する(ステップSC−4)。
【0113】
そして、結合部位予測装置100は、候補アミノ酸残基決定部102eの処理により、計算された相互作用エネルギーに従って、結合部位となる候補アミノ酸残基を決定する(ステップSC−5)。
【0114】
そして、結合部位予測装置100は、エネルギー最小化部102gの処理により、ステップSC−7により複合体について結合部位を変えて複合体の立体構造情報を生成し、ステップSC−4により各アミノ酸残基のエネルギーを計算し、当該エネルギーの総和が最小となる結合部位を求める(ステップSC−7からステップSC−5までの各ステップを適宜繰り返す)。
【0115】
そして、結合部位予測装置100は、候補アミノ酸残基決定部102eの処理により、最終的にエネルギーの総和が最小となる結合部位を、結合部位の候補アミノ酸残基として決定する(ステップSC−5)。ここで、候補アミノ酸残基決定部102eは、蛋白質のエネルギーの総和をアミノ酸配列によりプロットした図を作成して出力装置114に出力してもよい。図13は、蛋白質Aと蛋白質Bの各アミノ酸残基を結合残基とした場合のエネルギーの総和をプロットした図の一例である。このようにプロット図を作成することにより、2つのアミノ酸配列のどのアミノ酸残基を結合残基として選択するとエネルギーの総和が少なくなるかを視覚的に把握することができるようになる。
これにて、本システムにより相互作用することが既知である複数の蛋白質のアミノ酸配列を用いて結合部位を予測する場合の処理が終了する。
【0116】
[目的蛋白質に対して最も良く結合する相手側の候補蛋白質を予測する場合の処理]
次に、本システムにより目的蛋白質に対して最も良く結合する相手側の候補蛋白質を予測する場合の処理の詳細について図9等を参照して説明する。図9の実線で示す処理フローは、本実施形態における本システムにより目的蛋白質に対して最も良く結合する相手側の候補蛋白質を予測する場合の処理の一例を示すフローチャートである。
【0117】
まず、結合部位予測装置100は、アミノ酸配列データ取得部102aの処理により、Genbankなどの外部システム200の外部データベースやアミノ酸配列データベース106aなどにアクセスして、目的の蛋白質または生理活性ポリペプチドのアミノ酸配列データを取得する(ステップSC−1)。また、結合部位予測装置100は、結合候補データ取得部102hの処理により、Genbankなどの外部システム200の外部データベースやアミノ酸配列データベース106aなどにアクセスして、目的の蛋白質の結合候補となる1つまたは複数の蛋白質または生理活性ポリペプチドのアミノ酸配列データを取得する(ステップSC−6)。
【0118】
ついで、結合部位予測装置100は、複合体構造生成部102fの処理により、目的の蛋白質または生理活性ポリペプチドと、結合候補となる蛋白質または生理活性ポリペプチドとが結合した複合体の立体構造情報を生成する(ステップSC−7)。
【0119】
ついで、結合部位予測装置100は、空間距離決定部102bの処理により、ステップSC−1より取得された目的のアミノ酸配列データと、ステップSC−6により取得された結合候補のアミノ酸配列データとに含まれる各アミノ酸残基の間の空間上の距離を、ステップSC−7により生成した複合体の立体構造情報に従って決定する(ステップSC−2)。
【0120】
ついで、結合部位予測装置100は、電荷決定部102cの処理により、目的のアミノ酸配列データと結合候補のアミノ酸配列データに含まれる各アミノ酸残基が持つ電荷を決定する(ステップSC−3)。
【0121】
ついで、結合部位予測装置100は、エネルギー計算部102dの処理により、ステップSC−2により決定された各アミノ酸残基間の空間上の距離と、ステップSC−3より決定された各アミノ酸残基が持つ電荷とに従って、各アミノ酸残基のエネルギーを計算する(ステップSC−4)。
【0122】
ついで、結合部位予測装置100は、エネルギー最小化部102gの処理により、ステップSC−7により複合体について結合部位を変えて複合体の立体構造情報を生成し、ステップSC−4により各アミノ酸残基のエネルギーを計算し、当該エネルギーの総和が最小となる結合部位を求める(ステップSC−7からステップSC−5までを適宜繰り返す)。
【0123】
ついで、結合部位予測装置100は、候補アミノ酸残基決定部102eの処理により、全ての結合候補についてステップSC−6からステップSC−5を繰り返して、エネルギー最小化処理を実行した結果、エネルギーの総和が最小となる結合部位をもつ結合候補を決定する(ステップSC−8)。
これにて、本システムにより目的蛋白質に対して最も良く結合する相手側の候補蛋白質を予測する場合の処理が終了する。
【0124】
[本発明の実施例]
次に本発明の実施例の詳細を図14〜図21を参照して説明する。
【0125】
[本発明の実施例1;リボヌクレアーゼA]
次に、本発明の実施例1の詳細について図14〜図16等を参照して説明する。実施例1は単体の蛋白質の結合部位予測に関する。
加水分解酵素であるリボヌクレアーゼAは実験的に良く調べられている蛋白質である。リボヌクレアーゼAは、そのインヒビターとの複合体の構造が分かっているので、アミノ酸配列上で結合部位が特定されている。
まず、リボヌクレアーゼAのアミノ酸配列データを蛋白質シークエンスデータベースGenbankから取得した。
【0126】
そして、リボヌクレアーゼAのアミノ酸配列データからアミノ酸の距離情報を以下の方法により推測した。まず、PDB(Protein Data Bank)に登録されている全ての蛋白質、または、ポリペプチドの立体構造情報から、アミノ酸の種類ごとに配列上の距離と空間上の距離との関連性を求めた。例えば、図14は2つのグルタミン酸の配列上の距離と空間上の距離との関係を示す図である。図14に示すように、例えば、グルタミン酸とグルタミン酸が配列上20残基離れていた時の空間距離の平均は20Åであるということが既知の統計学的手法により分かる。以上のようにして、アミノ酸残基間の配列上の距離と空間上の距離との関連を示す情報を得た。
【0127】
そして、アミノ酸の電荷を決定した。ここではグルタミン酸、アスパラギン酸を−1、アルギニン、リジン、ヒスチジンを+1、その他は0というようにアミノ酸残基ごとに電荷を割り当てた。
【0128】
そして、各アミノ酸残基の相互作用エネルギーを以下のように計算した。
interaction(K) = qKΣqj/r
(ここで、Kはアミノ酸残基番号、E interaction (K)はアミノ酸残基Kとそれ以外との相互作用エネルギー、jはK以外の任意のアミノ酸残基、rはアミノ酸残基Kとアミノ酸残基jとの空間上の距離)
【0129】
そして、上式によってリボヌクレアーゼAのアミノ酸残基ごとのエネルギーを計算し、リボヌクレアーゼAの各アミノ酸残基のエネルギーをアミノ酸残基番号に対してプロットした。図15は、リボヌクレアーゼAの各アミノ酸残基のエネルギーをアミノ酸残基番号に対してプロットした図である。
【0130】
そして、リボヌクレアーゼAのアミノ酸残基のエネルギーが0以上のものを結合部位候補として表にまとめた(図16)。図16に示すように結合部位候補18個のうち、実際の結合部位(実験的に求められた結合部位)は12個だった。このように、本発明により、リボヌクレアーゼAのアミノ酸配列情報だけを用いて、非常に高精度で、かつ、高速に結合部位を予測することができた。
これにて、本発明の実施例1が終了する。
【0131】
[本発明の実施例2;アセチルコリン・エステラーゼ・インヒビター]
次に、本発明の実施例2の詳細について図17〜図19等を参照して説明する。実施例2も単体の蛋白質の結合部位予測に関する。
実施例2では、アセチルコリン・エステラーゼ・インヒビターのアミノ酸配列を基にして、結合部位を推定した。ここでは立体構造予測をするのではなく、PDBに含まれる既存の立体構造情報データを利用した。
【0132】
図17は、PDBに格納されたアセチルコリン・エステラーゼ・インヒビターの立体構造情報データの一部を示す図である。図17の2列目からそれぞれ原子番号、原子種、chain名、アミノ酸残基番号、X座標、Y座標、Z座標を示している。
【0133】
例えばアミノ酸残基番号Iとアミノ酸残基番号Jとの空間上の距離RIJは、アミノ酸残基番号Iの重心や特定の主鎖の原子などの座標を(xI, yI, zI)とし、アミノ酸残基番号Jの重心や特定の主鎖の原子などの座標を(xJ, yJ, zJ)とすると、以下のように計算することができる。
Figure 0003990963
(ここで、R IJ > 0 )
【0134】
具体的に説明すると、図17に示すアミノ酸残基番号4のグルタミン酸と、アミノ酸残基番号5のアスパラギン酸との空間上の距離をαカーボンの原子間の距離によって計算すると、以下のようになる。
Figure 0003990963
【0135】
また、図18は本発明により求めたアセチルコリン・エステラーゼ・インヒビターのエネルギーを示す図である。図18からアセチルコリン・エステラーゼ・インヒビターのエネルギーが0以上のもの10個を結合部位候補として取り出し、実際に結合部位かどうかを実験的に調べると、その内に7個は実際に結合部位であった(図19)。
【0136】
以上のように極めて高精度に結合部位を予測することができる。実施例2では既知の立体構造情報を利用した点が実施例1とは異なる点である。つまり、実施例1と実施例2では空間距離の決定手法を変えているが、いずれも良好な結果を与えたことから、どのような空間距離の決定手法を使っても、本発明の効果が期待できると考えられる。
これにて、本発明の実施例2が終了する。
【0137】
[本発明の実施例3;「huntingtin−associtated protein interacting protein」と、「nitric oxide synthase 2A」との複合体]
次に、本発明の実施例3の詳細について図20等を参照して説明する。実施例3は2つの蛋白質が結合する時の結合部位予測に関する。「huntingtin−associtated protein interacting protein」は、「nitric oxide synthase 2A」と結合することが実験的に分かっている。更に、結合部位は「huntingtin−associtated protein interacting protein」はアミノ酸残基番号600付近であり、「nitric oxidesynthase 2A」はアミノ酸残基番号100付近であることが分かっている。
【0138】
ここで、本実施例においても実施例1と同様にして配列情報の獲得、立体構造の予測、電荷の決定を行った。ただし、アミノ酸間の配列上の距離から空間的な距離に変換する方法は、蛋白質がガウス鎖をとると仮定し、配列上の距離と空間上の距離とを以下の式で関係づけた。
r=3.8 d 0.5
ここでrは空間上の距離、dは配列上の距離である。
【0139】
また、複合体構造生成は上述した高速計算手法を使った。つまり、次式を用いた。
Figure 0003990963
【0140】
そして、それぞれの結合部位を仮定した複合体のエネルギーを計算し、図20を作成することができた。ここで、図20は横軸に、huntingtin−associtated protein interacting proteinの結合部位のアミノ酸残基番号をとり、縦軸にnitric oxide synthase 2Aの結合部位のアミノ酸残基番号をとり、各結合部位で複合体を生成したときのエネルギーの総和を等高線表示したものである。
【0141】
図20によれば、例えば、huntingtin−associtated protein interacting proteinのアミノ酸残基500番と、nitric oxide synthase 2Aのアミノ酸残基150番とが結合部位の場合の複合体のエネルギーは−10というように、結合部位ごとのエネルギーが求められる。
【0142】
図20に示すように、エネルギーの極小部は2つあり、1つはhuntingtin−associtated protein interacting proteinの結合部位がアミノ酸残基600〜950付近で、nitricoxide synthase 2Aの結合部位がアミノ酸残基25〜100付近で結合した場合であり、もう1つはhuntingtin−associtated protein interacting proteinの結合部位がアミノ酸残基650〜900付近で、nitric oxide synthase 2Aの結合部位がアミノ酸残基475〜500付近で結合した場合である。
【0143】
ここで、前者が実際の結合部位に対応している(図中の黒丸で囲んだ部分)。以上のように、2つの蛋白質の結合部位を正確に予測することができた。
これにて、本発明の実施例3が終了する。
【0144】
[本発明の実施例4;E2F transcription factor 1]次に、本発明の実施例4の詳細について図21等を参照して説明する。
実施例4は結合相手予測に関する。E2F transcription factor 1(以下、E2F1)は相互作用相手に関する情報が実験的に良く調べられている蛋白質である。
【0145】
ここで、E2F1と相互作用する相手をHomo Sapiensの遺伝子のデータベース(ここでは無作為に6600個を抽出した)から探し、候補蛋白質のアミノ酸配列データとした。
【0146】
そして、実施例3で計算した手順と同様に、相手の候補蛋白質ごとにE2F1との結合部位を探す。そして、最もエネルギーが安定(最小)になった時のエネルギーを相互作用エネルギーとする。図21は各候補蛋白質の相互作用エネルギーと遺伝子の数のヒストグラムである。
【0147】
図21に示したように、相対的な相互作用エネルギーを計算することができた。例えば、相互作用エネルギーが90よりも大きい(エネルギーが−90よりも小さい)ものは100個あるが、ここにあるものが相互作用相手である可能性が高い。この方法は非常に高速で、相互作用を網羅的に計算することができる。
これにて、本発明の実施例4が終了する。
【0148】
[他の実施の形態]
さて、これまで本発明の実施の形態について説明したが、本発明は、上述した実施の形態以外にも、上記特許請求の範囲に記載した技術的思想の範囲内において種々の異なる実施の形態にて実施されてよいものである。
【0149】
例えば、結合部位予測装置100がスタンドアローンの形態で処理を行う場合を一例に説明したが、結合部位予測装置100とは別筐体で構成されるクライアント端末からの要求に応じて処理を行い、その処理結果を当該クライアント端末に返却するように構成してもよい。
【0150】
また、実施形態において説明した各処理のうち、自動的に行なわれるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行なわれるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。
この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種の登録データや検索条件等のパラメータを含む情報、画面例、データベース構成については、特記する場合を除いて任意に変更することができる。
【0151】
また、結合部位予測装置100に関して、図示の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。
例えば、結合部位予測装置100の各部または各装置が備える処理機能、特に制御部102にて行なわれる各処理機能については、その全部または任意の一部を、CPU(Central Processing Unit)および当該CPUにて解釈実行されるプログラムにて実現することができ、あるいは、ワイヤードロジックによるハードウェアとして実現することも可能である。なお、プログラムは、後述する記録媒体に記録されており、必要に応じて結合部位予測装置100に機械的に読み取られる。
【0152】
すなわち、ROMまたはHDなどの記憶部106などには、OS(Operating System)と協働してCPUに命令を与え、各種処理を行うためのコンピュータプログラムが記録されている。このコンピュータプログラムは、RAM等にロードされることによって実行され、CPUと協働して制御部102を構成する。また、このコンピュータプログラムは、結合部位予測装置100に対して任意のネットワーク300を介して接続されたアプリケーションプログラムサーバに記録されてもよく、必要に応じてその全部または一部をダウンロードすることも可能である。
【0153】
また、本発明にかかるプログラムを、コンピュータ読み取り可能な記録媒体に格納することもできる。ここで、この「記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、EPROM、EEPROM、CD−ROM、MO、DVD等の任意の「可搬用の物理媒体」や、各種コンピュータシステムに内蔵されるROM、RAM、HD等の任意の「固定用の物理媒体」、あるいは、LAN、WAN、インターネットに代表されるネットワークを介してプログラムを送信する場合の通信回線や搬送波のように、短期にプログラムを保持する「通信媒体」を含むものとする。
【0154】
また、「プログラム」とは、任意の言語や記述方法にて記述されたデータ処理方法であり、ソースコードやバイナリコード等の形式を問わない。なお、「プログラム」は必ずしも単一的に構成されるものに限られず、複数のモジュールやライブラリとして分散構成されるものや、OS(Operating System)に代表される別個のプログラムと協働してその機能を達成するものをも含む。なお、実施の形態に示した各装置において記録媒体を読み取るための具体的な構成、読み取り手順、あるいは、読み取り後のインストール手順等については、周知の構成や手順を用いることができる。
【0155】
記憶部106に格納される各種のデータベース等(アミノ酸配列データベース106a〜処理結果ファイル106g)は、RAM、ROM等のメモリ装置、ハードディスク等の固定ディスク装置、フレキシブルディスク、光ディスク等のストレージ手段であり、各種処理やウェブサイト提供に用いる各種のプログラムやテーブルやファイルやデータベースやウェブページ用ファイル等を格納する。
【0156】
また、結合部位予測装置100は、既知のパーソナルコンピュータ、ワークステーション等の情報処理端末等の情報処理装置にプリンタやモニタやイメージスキャナ等の周辺装置を接続し、該情報処理装置に本発明の方法を実現させるソフトウェア(プログラム、データ等を含む)を実装することにより実現してもよい。
【0157】
さらに、結合部位予測装置100の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷等に応じた任意の単位で、機能的または物理的に分散・統合して構成することができる。例えば、各データベースを独立したデータベース装置として独立に構成してもよく、また、処理の一部をCGI(Common Gateway Interface)を用いて実現してもよい。
【0158】
また、ネットワーク300は、結合部位予測装置100と外部システム200とを相互に接続する機能を有し、例えば、インターネットや、イントラネットや、LAN(有線/無線の双方を含む)や、VANや、パソコン通信網や、公衆電話網(アナログ/デジタルの双方を含む)や、専用回線網(アナログ/デジタルの双方を含む)や、CATV網や、IMT2000方式、GSM方式またはPDC/PDC―P方式等の携帯回線交換網/携帯パケット交換網や、無線呼出網や、Bluetooth等の局所無線網や、PHS網や、CS、BSまたはISDB等の衛星通信網等のうちいずれかを含んでもよい。すなわち、本システムは、有線・無線を問わず任意のネットワークを介して、各種データを送受信することができる。
【0159】
【発明の効果】
以上詳細に説明したように、本発明によれば、蛋白質または生理活性ポリペプチドのアミノ酸配列データに基づいて、各アミノ酸残基間の配列上の距離を算出し、当該配列上の距離から、r=kd n (0<n<1)(ここでrは空間上の距離、dは配列上の距離、kは比例定数、nは所定のパラメータである)の式を用いて当該蛋白質または生理活性ポリペプチドの立体構造における各アミノ酸残基間の空間上の距離データを求め、各アミノ酸残基荷電性に基づいた電荷と、対応する各アミノ酸残基間の空間上の距離データとに従って、各アミノ酸残基のエネルギーを計算し、当該エネルギーが予め定めた閾値を超えるか判断することにより結合部位を予測するので、蛋白質または生理活性ポリペプチドのアミノ酸配列から高速かつ高精度に結合部位を予測することができる結合部位予測方法、結合部位予測装置、プログラム、および、記録媒体を提供することができる。
【0160】
また、本発明によれば、目的の蛋白質または生理活性ポリペプチドのアミノ酸配列データを取得し、取得されたアミノ酸配列データに基づく各アミノ酸残基の間の配列上の距離に基づいて各アミノ酸残基の間の空間上の距離を、r=kd n (0<n<1)(ここでrは空間上の距離、dは配列上の距離、kは比例定数、nは所定のパラメータである)の式を用いて決定し、各アミノ酸残基が持つ電荷を当該各アミノ酸残基の荷電性に基づいて決定し、各アミノ酸残基間の空間上の距離と、決定された各アミノ酸残基が持つ電荷とに従って、各アミノ酸残基のエネルギーを計算し、計算されたエネルギーに従って、予め定めた閾値を超えるか判断することにより結合部位となる候補アミノ酸残基を決定するので、蛋白質または生理活性ポリペプチドのアミノ酸配列から高速かつ高精度に結合部位を予測することができる結合部位予測方法、結合部位予測装置、プログラム、および、記録媒体を提供することができる。
【0161】
また、本発明によれば、目的の複数の蛋白質または生理活性ポリペプチドのアミノ酸配列データを取得し、目的の複数の蛋白質または生理活性ポリペプチドのアミノ酸配列データにおいて、アミノ酸配列上で結合部位となる任意のアミノ酸残基を仮定し、結合部位を仮定されたアミノ酸配列データにおいて、各アミノ酸残基の間の配列上の距離に基づいて、各アミノ酸残基の間の空間上の距離を、r=kd n (0<n<1)(ここでrは空間上の距離、dは配列上の距離、kは比例定数、nは所定のパラメータである)の式を用いて決定し、各アミノ酸残基が持つ電荷を当該各アミノ酸残基の荷電性に基づいて決定し、各アミノ酸残基間の空間上の距離と、決定された各アミノ酸残基が持つ電荷とに従って、各アミノ酸残基のエネルギーを計算し、結合部位を変えて、空間距離を決定し、電荷を決定し、各アミノ酸残基のエネルギーを計算し、当該エネルギーの総和が最小となる結合部位を求め、エネルギーの総和が最小となる結合部位を、結合部位の候補アミノ酸残基として決定するので、蛋白質または生理活性ポリペプチドのアミノ酸配列から高速かつ高精度に結合部位を予測することができる結合部位予測方法、結合部位予測装置、プログラム、および、記録媒体を提供することができる。
【0162】
さらに、本発明によれば、目的の蛋白質または生理活性ポリペプチドのアミノ酸配列データと、結合候補となる1つまたは複数の蛋白質または生理活性ポリペプチドのアミノ酸配列データとを取得し、目的の蛋白質または生理活性ポリペプチドのアミノ酸配列データ、および、結合候補となる蛋白質または生理活性ポリペプチドのアミノ酸配列データにおいて、アミノ酸配列上で結合部位となる任意のアミノ酸残基を仮定し、結合部位を仮定されたアミノ酸配列データにおいて、各アミノ酸残基の間の配列上の距離に基づいて、各アミノ酸残基の間の空間上の距離を、r=kd n (0<n<1)(ここでrは空間上の距離、dは配列上の距離、kは比例定数、nは所定のパラメータである)の式を用いて決定し、各アミノ酸残基が持つ電荷を当該各アミノ酸残基の荷電性に基づいて決定し、各アミノ酸残基間の空間上の距離と、決定された各アミノ酸残基が持つ電荷とに従って、各アミノ酸残基のエネルギーを計算し、結合部位を変えて、空間距離を決定し、電荷を決定し、各アミノ酸残基のエネルギーを計算し、当該エネルギーの総和が最小となる結合部位を求め、全ての結合候補についてエネルギー最小化処理を実行した結果、エネルギーの総和が最小となる結合部位をもつ結合候補を決定するので、蛋白質または生理活性ポリペプチドのアミノ酸配列から高速かつ高精度に最適な結合候補の蛋白質を予測することができる結合部位予測方法、結合部位予測装置、プログラム、および、記録媒体を提供することができる。
【図面の簡単な説明】
【図1】本発明により1つの蛋白質のアミノ酸配列情報からその蛋白質の結合部位を予測する場合の概念を説明する図である。
【図2】本発明により複数の蛋白質のアミノ酸配列情報からそれらの蛋白質で複合体を形成するときの結合部位を予測する場合の概念を説明する図である。
【図3】本発明が適用される本システムの構成の一例を示すブロック図である。
【図4】本発明が適用される空間距離決定部102bの構成の一例を示すブロック図である。
【図5】本発明が適用されるエネルギー計算部102dの構成の一例を示すブロック図である。
【図6】本発明の高速計算手法の概念を示す図である。
【図7】複数のアミノ酸配列上で結合残基を仮定する場合の概念を示す図である。
【図8】着目残基の概念を説明する図である。
【図9】本実施形態における本システムの処理の一例を示すフローチャートである。
【図10】処理結果の候補アミノ酸残基のエネルギーなどの一例を示す図である。
【図11】立体構造上で不安定な部分がクラスター化している場合の一例を示す図である。
【図12】ドッキングシミュレーションを用いて複合体構造を生成する場合の概念を示す図である。
【図13】蛋白質Aと蛋白質Bの各アミノ酸残基を結合残基とした場合のエネルギーの総和をプロットした図の一例である。
【図14】2つのグルタミン酸の配列上の距離と空間上の距離との関係を示す図である。
【図15】リボヌクレアーゼAの各アミノ酸残基のエネルギーをアミノ酸残基番号に対してプロットした図である。
【図16】リボヌクレアーゼAのアミノ酸残基のエネルギーが0以上のものを結合部位候補として表にまとめた図である。
【図17】PDBに格納されたアセチルコリン・エステラーゼ・インヒビターの立体構造情報データの一部を示す図である。
【図18】本発明により求めたアセチルコリン・エステラーゼ・インヒビターのエネルギーを示す図である。
【図19】アセチルコリン・エステラーゼ・インヒビターのエネルギーが0以上のもの10個を結合部位候補として取り出し、実際に結合部位かどうかを実験的に調べた結果を示す図である。
【図20】横軸に、huntingtin−associtated protein interacting proteinの結合部位のアミノ酸残基番号をとり、縦軸にnitric oxide synthase 2Aの結合部位のアミノ酸残基番号をとり、各結合部位で複合体を生成したときのエネルギーの総和を等高線表示した図である。
【図21】各候補蛋白質の相互作用エネルギーと遺伝子の数のヒストグラムである。
【符号の説明】
100 結合部位予測装置
102 制御部
102a アミノ酸配列データ取得部
102b 空間距離決定部
102c 電荷決定部
102d エネルギー計算部
102e 候補アミノ酸残基決定部
102f 複合体構造生成部
102g エネルギー最小化部
102h 結合候補データ取得部
102i 結合部位予測部
102j 結合相手候補決定部
102k 高速計算部
102m 構造データ利用計算部
102n シミュレーションデータ利用計算部
102p 全エネルギー計算部
102q 相互作用エネルギー計算部
104 通信制御インターフェース部
106 記憶部
106a アミノ酸配列データベース
106b 蛋白質構造データベース
106c 距離データファイル
106d 全エネルギーデータファイル
106e 相互作用エネルギーデータファイル
106f 複合体構造データファイル
106g 処理結果ファイル
108 入出力制御インターフェース部
112 入力装置
114 出力装置
200 外部システム
300 ネットワーク

Claims (11)

  1. 記憶部と制御部とを少なくとも備えた結合部位予測装置において実行される結合部位予測方法であって、
    上記制御部において、
    上記記憶部に格納された蛋白質または生理活性ポリペプチドのアミノ酸配列データに基づいて、各アミノ酸残基間の配列上の距離を算出し上記記憶部に格納し、上記記憶部に格納された当該配列上の距離から、以下の式を用いて当該蛋白質または生理活性ポリペプチドの立体構造における上記各アミノ酸残基間の空間上の距離データを求め上記記憶部に格納し
    r = k d n (0<n<1)
    ここでrは上記空間上の距離、dは上記配列上の距離、kは比例定数、nは所定のパラメータである)
    上記各アミノ酸残基荷電性に基づいた電荷と、上記記憶部に格納された対応する上記各アミノ酸残基間の上記空間上の距離データとに従って、上記各アミノ酸残基のエネルギーを計算し上記記憶部に格納し、
    上記記憶部に格納された上記エネルギーが予め定めた閾値を超えるか判断することにより結合部位を予測し、上記記憶部に格納することを特徴とする結合部位予測方法。
  2. 記憶部と制御部とを少なくとも備えた結合部位予測装置において実行される結合部位予測方法であって、
    上記制御部において実行される、
    上記記憶部に格納された目的の蛋白質または生理活性ポリペプチドのアミノ酸配列データを取得するアミノ酸配列データ取得ステップと、
    上記アミノ酸配列データ取得ステップにより取得された上記アミノ酸配列データに基づく各アミノ酸残基の間の配列上の距離に基づいて各アミノ酸残基の間の空間上の距離を、以下の式を用いて決定し上記記憶部に格納する空間距離決定ステップと、
    r = k d n (0<n<1)
    ここでrは上記空間上の距離、dは上記配列上の距離、kは比例定数、nは所定のパラメータである)
    上記各アミノ酸残基が持つ電荷を当該各アミノ酸残基の荷電性に基づいて決定する電荷決定ステップと、
    上記空間距離決定ステップにより上記記憶部に格納された上記各アミノ酸残基間の空間上の距離と、上記電荷決定ステップにより決定された上記各アミノ酸残基が持つ電荷とに従って、上記各アミノ酸残基のエネルギーを計算し上記記憶部に格納するエネルギー計算ステップと、
    上記エネルギー計算ステップにより上記記憶部に格納された上記エネルギーに従って、予め定めた閾値を超えるか判断することにより結合部位となる候補アミノ酸残基を決定し、上記記憶部に格納する候補アミノ酸残基決定ステップと、
    を含むことを特徴とする結合部位予測方法。
  3. 記憶部と制御部とを少なくとも備えた結合部位予測装置において実行される結合部位予測方法であって、
    上記制御部において実行される、
    上記記憶部に格納された目的の複数の蛋白質または生理活性ポリペプチドのアミノ酸配列データを取得するアミノ酸配列データ取得ステップと、
    上記目的の複数の蛋白質または生理活性ポリペプチドの上記アミノ酸配列データにおいて、アミノ酸配列上で結合部位となる任意のアミノ酸残基を仮定する結合部位仮定ステップと、
    上記結合部位仮定ステップにて上記結合部位が仮定された上記アミノ酸配列データにおいて、各アミノ酸残基の間の配列上の距離に基づいて、上記各アミノ酸残基の間の空間上の距離を、以下の式を用いて決定し上記記憶部に格納する空間距離決定ステップと、
    r = k d n (0<n<1)
    ここでrは上記空間上の距離、dは上記配列上の距離、kは比例定数、nは所定のパラメータである)
    上記各アミノ酸残基が持つ電荷を当該各アミノ酸残基の荷電性に基づいて決定する電荷決定ステップと、
    上記空間距離決定ステップにより上記記憶部に格納された上記各アミノ酸残基間の空間上の距離と、上記電荷決定ステップにより決定された上記各アミノ酸残基が持つ上記電荷とに従って、上記各アミノ酸残基のエネルギーを計算し上記記憶部に格納するエネルギー計算ステップと、
    上記結合部位仮定ステップにより上記結合部位を変えて、上記空間距離決定ステップにより上記空間距離を決定し上記記憶部に格納し、上記電荷決定ステップにより上記電荷を決定し上記記憶部に格納し、上記エネルギー計算ステップにより上記各アミノ酸残基のエネルギーを計算し上記記憶部に格納し、当該エネルギーの総和が最小となる上記結合部位を求め、求められた当該結合部位を上記記憶部に格納するエネルギー最小化ステップと、
    上記エネルギー最小化ステップによりエネルギーの総和が最小となる上記結合部位を、結合部位の候補アミノ酸残基として決定し上記記憶部に格納する候補アミノ酸残基決定ステップと、
    を含むことを特徴とする結合部位予測方法。
  4. 記憶部と制御部とを少なくとも備えた結合部位予測装置において実行される結合部位予測方法であって、
    上記制御部において実行される、
    上記記憶部に格納された目的の蛋白質または生理活性ポリペプチドのアミノ酸配列データと、結合候補となる1つまたは複数の蛋白質または生理活性ポリペプチドのアミノ酸配列データとを取得するアミノ酸配列データ取得ステップと、
    上記目的の蛋白質または生理活性ポリペプチドの上記アミノ酸配列データ、および、上記結合候補となる蛋白質または生理活性ポリペプチドの上記アミノ酸配列データにおいてアミノ酸配列上で結合部位となる任意のアミノ酸残基を仮定する結合部位仮定ステップと、
    上記結合部位仮定ステップにて上記結合部位を仮定された上記アミノ酸配列データにおいて、各アミノ酸残基の間の配列上の距離に基づいて、上記各アミノ酸残基の間の空間上の距離を、以下の式を用いて決定し上記記憶部に格納する空間距離決定ステップと、
    r = k d n (0<n<1)
    ここでrは上記空間上の距離、dは上記配列上の距離、kは比例定数、nは所定のパラメータである)
    上記各アミノ酸残基が持つ電荷を当該各アミノ酸残基の荷電性に基づいて決定する電荷決定ステップと、
    上記空間距離決定ステップにより上記記憶部に格納された上記各アミノ酸残基間の空間上の距離と、上記電荷決定ステップにより決定された上記各アミノ酸残基が持つ上記電荷とに従って、上記各アミノ酸残基のエネルギーを計算し上記記憶部に格納するエネルギー計算ステップと、
    上記結合部位仮定ステップにより上記結合部位を変えて、上記空間距離決定ステップにより上記空間距離を決定し上記記憶部に格納し、上記電荷決定ステップにより上記電荷を決定し上記記憶部に格納し、上記エネルギー計算ステップにより上記各アミノ酸残基のエネルギーを計算し上記記憶部に格納し、当該エネルギーの総和が最小となる上記結合部位を求め、求められた当該結合部位を上記記憶部に格納するエネルギー最小化ステップと、
    全ての上記結合候補について上記エネルギー最小化ステップを実行した結果、上記エネルギーの総和が最小となる上記結合部位をもつ結合候補を決定し、上記記憶部に格納する結合候補決定ステップと、
    を含むことを特徴とする結合部位予測方法。
  5. 記憶部と制御部とを少なくとも備えた結合部位予測装置であって、
    上記制御部は、
    上記記憶部に格納された目的の蛋白質または生理活性ポリペプチドのアミノ酸配列データを取得するアミノ酸配列データ取得手段と、
    上記アミノ酸配列データ取得手段により取得された上記アミノ酸配列データに基づく各アミノ酸残基の間の配列上の距離に基づいて各アミノ酸残基の間の空間上の距離を、以下の式を用いて決定し上記記憶部に格納する空間距離決定手段と、
    r = k d n (0<n<1)
    ここでrは上記空間上の距離、dは上記配列上の距離、kは比例定数、nは所定のパラメータである)
    上記各アミノ酸残基が持つ電荷を当該各アミノ酸残基の荷電性に基づいて決定する電荷決定手段と、
    上記空間距離決定手段により上記記憶部に格納された上記各アミノ酸残基間の空間上の距離と、上記電荷決定手段により決定された上記各アミノ酸残基が持つ電荷とに従って、上記各アミノ酸残基のエネルギーを計算し上記記憶部に格納するエネルギー計算手段と、
    上記エネルギー計算手段により上記記憶部に格納された上記エネルギーに従って、予め定めた閾値を超えるか判断することにより結合部位となる候補アミノ酸残基を決定し、上記記憶部に格納する候補アミノ酸残基決定手段と、
    を備えたことを特徴とする結合部位予測装置。
  6. 記憶部と制御部とを少なくとも備えた結合部位予測装置であって、
    上記制御部は、
    上記記憶部に格納された目的の蛋白質または生理活性ポリペプチドのアミノ酸配列データと、結合候補となる1つまたは複数の蛋白質または生理活性ポリペプチドのアミノ酸配列データとを取得するアミノ酸配列データ取得手段と、
    上記目的の蛋白質または生理活性ポリペプチドの上記アミノ酸配列データ、および、上記結合候補となる蛋白質または生理活性ポリペプチドの上記アミノ酸配列データにおいてアミノ酸配列上で結合部位となる任意のアミノ酸残基を仮定する結合部位仮定手段と、
    上記結合部位仮定手段にて上記結合部位を仮定された上記アミノ酸配列データにおいて、各アミノ酸残基の間の配列上の距離に基づいて、上記各アミノ酸残基の間の空間上の距離を、以下の式を用いて決定し上記記憶部に格納する空間距離決定手段と、
    r = k d n (0<n<1)
    ここでrは上記空間上の距離、dは上記配列上の距離、kは比例定数、nは所定のパラメータである)
    上記各アミノ酸残基が持つ電荷を当該各アミノ酸残基の荷電性に基づいて決定する電荷決定手段と、
    上記空間距離決定手段により上記記憶部に格納された上記各アミノ酸残基間の空間上の距離と、上記電荷決定手段により決定された上記各アミノ酸残基が持つ上記電荷とに従って、上記各アミノ酸残基のエネルギーを計算し上記記憶部に格納するエネルギー計算手段と、
    上記結合部位仮定手段により上記結合部位を変えて、上記空間距離決定手段により上記空間距離を決定し上記記憶部に格納し、上記電荷決定手段により上記電荷を決定し上記記憶部に格納し、上記エネルギー計算手段により上記各アミノ酸残基のエネルギーを計算し上記記憶部に格納し、当該エネルギーの総和が最小となる上記結合部位を求め、求められた当該結合部位を上記記憶部に格納するエネルギー最小化手段と、
    全ての上記結合候補について上記エネルギー最小化手段を実行した結果、上記エネルギーの総和が最小となる上記結合部位をもつ結合候補を決定し、上記記憶部に格納する結合候補決定手段と、
    を備えたことを特徴とする結合部位予測装置。
  7. 記憶部と制御部とを少なくとも備えた結合部位予測装置であって、
    上記制御部は、
    上記記憶部に格納された目的の蛋白質または生理活性ポリペプチドのアミノ酸配列データと、結合候補となる1つまたは複数の蛋白質または生理活性ポリペプチドのアミノ酸配列データとを取得するアミノ酸配列データ取得手段と、
    上記目的の蛋白質または生理活性ポリペプチドの上記アミノ酸配列データ、および、上記結合候補となる蛋白質または生理活性ポリペプチドの上記アミノ酸配列データにおいてアミノ酸配列上で結合部位となる任意のアミノ酸残基を仮定する結合部位仮定手段と、
    上記結合部位仮定手段にて上記結合部位を仮定された上記アミノ酸配列データにおいて、各アミノ酸残基の間の配列上の距離に基づいて、上記各アミノ酸残基の間の空間上の距離を、以下の式を用いて決定し上記記憶部に格納する空間距離決定手段と、
    r = k d n (0<n<1)
    ここでrは上記空間上の距離、dは上記配列上の距離、kは比例定数、nは所定のパラメータである)
    上記各アミノ酸残基が持つ電荷を当該各アミノ酸残基の荷電性に基づいて決定する電荷決定手段と、
    上記空間距離決定手段により上記記憶部に格納された上記各アミノ酸残基間の空間上の距離と、上記電荷決定手段により決定された上記各アミノ酸残基が持つ上記電荷とに従って、上記各アミノ酸残基のエネルギーを計算し上記記憶部に格納するエネルギー計算手段と、
    上記結合部位仮定手段により上記結合部位を変えて、上記空間距離決定手段により上記空間距離を決定し上記記憶部に格納し、上記電荷決定手段により上記電荷を決定し上記記憶部に格納し、上記エネルギー計算手段により上記各アミノ酸残基のエネルギーを計算し上記記憶部に格納し、当該エネルギーの総和が最小となる上記結合部位を求め、求められた当該結合部位を上記記憶部に格納するエネルギー最小化手段と、
    全ての上記結合候補について上記エネルギー最小化手段を実行した結果、上記エネルギーの総和が最小となる上記結合部位をもつ結合候補を決定し、上記記憶部に格納する結合候補決定手段と、
    を備えたことを特徴とする結合部位予測装置。
  8. 記憶部と制御部とを少なくとも備えた結合部位予測装置に実行させるためのプログラムであって、
    上記制御部において実行される、
    上記記憶部に格納された目的の蛋白質または生理活性ポリペプチドのアミノ酸配列データを取得するアミノ酸配列データ取得ステップと、
    上記アミノ酸配列データ取得ステップにより取得された上記アミノ酸配列データに基づく各アミノ酸残基の間の配列上の距離に基づいて各アミノ酸残基の間の空間上の距離を、以下の式を用いて決定し上記記憶部に格納する空間距離決定ステップと、
    r = k d n (0<n<1)
    ここでrは上記空間上の距離、dは上記配列上の距離、kは比例定数、nは所定のパラメータである)
    上記各アミノ酸残基が持つ電荷を当該各アミノ酸残基の荷電性に基づいて決定する電荷決定ステップと、
    上記空間距離決定ステップにより上記記憶部に格納された上記各アミノ酸残基間の空間上の距離と、上記電荷決定ステップにより決定された上記各アミノ酸残基が持つ電荷とに従って、上記各アミノ酸残基のエネルギーを計算し上記記憶部に格納するエネルギー計算ステップと、
    上記エネルギー計算ステップにより上記記憶部に格納された上記エネルギーに従って、予め定めた閾値を超えるか判断することにより結合部位となる候補アミノ酸残基を決定し、上記記憶部に格納する候補アミノ酸残基決定ステップと、
    を含む結合部位予測方法を上記結合部位予測装置に実行させることを特徴とするプログラム。
  9. 記憶部と制御部とを少なくとも備えた結合部位予測装置に実行させるためのプログラムであって、
    上記制御部において実行される、
    上記記憶部に格納された目的の複数の蛋白質または生理活性ポリペプチドのアミノ酸配列データを取得するアミノ酸配列データ取得ステップと、
    上記目的の複数の蛋白質または生理活性ポリペプチドの上記アミノ酸配列データにおいて、アミノ酸配列上で結合部位となる任意のアミノ酸残基を仮定する結合部位仮定ステップと、
    上記結合部位仮定ステップにて上記結合部位が仮定された上記アミノ酸配列データにおいて、各アミノ酸残基の間の配列上の距離に基づいて、上記各アミノ酸残基の間の空間上の距離を、以下の式を用いて決定し上記記憶部に格納する空間距離決定ステップと、
    r = k d n (0<n<1)
    ここでrは上記空間上の距離、dは上記配列上の距離、kは比例定数、nは所定のパラメータである)
    上記各アミノ酸残基が持つ電荷を当該各アミノ酸残基の荷電性に基づいて決定する電荷決定ステップと、
    上記空間距離決定ステップにより上記記憶部に格納された上記各アミノ酸残基間の空間上の距離と、上記電荷決定ステップにより決定された上記各アミノ酸残基が持つ上記電荷とに従って、上記各アミノ酸残基のエネルギーを計算し上記記憶部に格納するエネルギー計算ステップと、
    上記結合部位仮定ステップにより上記結合部位を変えて、上記空間距離決定ステップにより上記空間距離を決定し上記記憶部に格納し、上記電荷決定ステップにより上記電荷を決定し上記記憶部に格納し、上記エネルギー計算ステップにより上記各アミノ酸残基のエネルギーを計算し上記記憶部に格納し、当該エネルギーの総和が最小となる上記結合部位を求め、求められた当該結合部位を上記記憶部に格納するエネルギー最小化ステップと、
    上記エネルギー最小化ステップによりエネルギーの総和が最小となる上記結合部位を、結合部位の候補アミノ酸残基として決定し上記記憶部に格納する候補アミノ酸残基決定ステップと、
    を含む結合部位予測方法を上記結合部位予測装置に実行させることを特徴とするプログラム。
  10. 記憶部と制御部を少なくとも備えた結合部位予測装置に実行させるためのプログラムであって、
    上記制御部において実行される、
    上記記憶部に格納された目的の蛋白質または生理活性ポリペプチドのアミノ酸配列データと、結合候補となる1つまたは複数の蛋白質または生理活性ポリペプチドのアミノ酸配列データとを取得するアミノ酸配列データ取得ステップと、
    上記目的の蛋白質または生理活性ポリペプチドの上記アミノ酸配列データ、および、上記結合候補となる蛋白質または生理活性ポリペプチドの上記アミノ酸配列データにおいてアミノ酸配列上で結合部位となる任意のアミノ酸残基を仮定する結合部位仮定ステップと、
    上記結合部位仮定ステップにて上記結合部位を仮定された上記アミノ酸配列データにおいて、各アミノ酸残基の間の配列上の距離に基づいて、上記各アミノ酸残基の間の空間上の距離を、以下の式を用いて決定し上記記憶部に格納する空間距離決定ステップと、
    r = k d n (0<n<1)
    ここでrは上記空間上の距離、dは上記配列上の距離、kは比例定数、nは所定のパラメータである)
    上記各アミノ酸残基が持つ電荷を当該各アミノ酸残基の荷電性に基づいて決定する電荷決定ステップと、
    上記空間距離決定ステップにより上記記憶部に格納された上記各アミノ酸残基間の空間上の距離と、上記電荷決定ステップにより決定された上記各アミノ酸残基が持つ上記電荷とに従って、上記各アミノ酸残基のエネルギーを計算し上記記憶部に格納するエネルギー計算ステップと、
    上記結合部位仮定ステップにより上記結合部位を変えて、上記空間距離決定ステップにより上記空間距離を決定し上記記憶部に格納し、上記電荷決定ステップにより上記電荷を決定し上記記憶部に格納し、上記エネルギー計算ステップにより上記各アミノ酸残基のエネルギーを計算し上記記憶部に格納し、当該エネルギーの総和が最小となる上記結合部位を求め、求められた当該結合部位を上記記憶部に格納するエネルギー最小化ステップと、
    全ての上記結合候補について上記エネルギー最小化ステップを実行した結果、上記エネルギーの総和が最小となる上記結合部位をもつ結合候補を決定し、上記記憶部に格納する結合候補決定ステップと、
    を含む結合部位予測方法を上記結合部位予測装置に実行させることを特徴とするプログラム。
  11. 上記請求項8から10のいずれか一つに記載されたプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。
JP2002275300A 2002-05-31 2002-09-20 結合部位予測方法、結合部位予測装置、プログラム、および、記録媒体 Expired - Fee Related JP3990963B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2002275300A JP3990963B2 (ja) 2002-09-20 2002-09-20 結合部位予測方法、結合部位予測装置、プログラム、および、記録媒体
US10/516,133 US20050130224A1 (en) 2002-05-31 2003-06-02 Interaction predicting device
PCT/JP2003/006952 WO2003107218A1 (ja) 2002-05-31 2003-06-02 相互作用予測装置
EP03733232A EP1510943A4 (en) 2002-05-31 2003-06-02 INTERACTION PREDICTION DEVICE

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002275300A JP3990963B2 (ja) 2002-09-20 2002-09-20 結合部位予測方法、結合部位予測装置、プログラム、および、記録媒体

Publications (2)

Publication Number Publication Date
JP2004109053A JP2004109053A (ja) 2004-04-08
JP3990963B2 true JP3990963B2 (ja) 2007-10-17

Family

ID=32271540

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002275300A Expired - Fee Related JP3990963B2 (ja) 2002-05-31 2002-09-20 結合部位予測方法、結合部位予測装置、プログラム、および、記録媒体

Country Status (1)

Country Link
JP (1) JP3990963B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5339111B2 (ja) * 2007-03-08 2013-11-13 国立大学法人 千葉大学 分子設計装置、分子設計方法及びプログラム
EP2245571B1 (en) * 2008-02-05 2019-04-10 Zymeworks Inc. Methods for determining correlated residues in a protein or other biopolymer using molecular dynamics

Also Published As

Publication number Publication date
JP2004109053A (ja) 2004-04-08

Similar Documents

Publication Publication Date Title
Garzon et al. FRODOCK: a new approach for fast rotational protein–protein docking
Jendrusch et al. AlphaDesign: A de novo protein design framework based on AlphaFold
Skolnick et al. FINDSITE: a combined evolution/structure-based approach to protein function prediction
EP1510943A1 (en) Interaction predicting device
Durham et al. Solvent accessible surface area approximations for rapid and accurate protein structure prediction
Sato et al. The inference of protein–protein interactions by co-evolutionary analysis is improved by excluding the information about the phylogenetic relationships
Zuckerman Simulation of an ensemble of conformational transitions in a united-residue model of calmodulin
Skolnick et al. Interplay of physics and evolution in the likely origin of protein biochemical function
Halperin et al. SiteLight: binding‐site prediction using phage display libraries
JP2004086862A (ja) タンパク質相互作用情報処理装置、タンパク質相互作用情報処理方法、プログラム、および、記録媒体
Saven Designing protein energy landscapes
Hartmann et al. IRECS: a new algorithm for the selection of most probable ensembles of side‐chain conformations in protein models
Marsden et al. Comprehensive genome analysis of 203 genomes provides structural genomics with new insights into protein family space
Zhang et al. A fast mathematical programming procedure for simultaneous fitting of assembly components into cryoEM density maps
Bouvier et al. Shelling the Voronoi interface of protein–protein complexes reveals patterns of residue conservation, dynamics, and composition
Xu et al. OPUS-Rota3: improving protein side-chain modeling by deep neural networks and ensemble methods
Grigoryan et al. Ultra-fast evaluation of protein energies directly from sequence
Tao et al. Efficient 3D conformer generation of cyclic peptides formed by a disulfide bond
Mirkovic et al. Strategies for high‐throughput comparative modeling: applications to leverage analysis in structural genomics and protein family organization
Orry et al. Preparation and refinement of model protein–ligand complexes
JP3990963B2 (ja) 結合部位予測方法、結合部位予測装置、プログラム、および、記録媒体
Tao et al. Docking cyclic peptides formed by a disulfide bond through a hierarchical strategy
Chen et al. PepMapper: a collaborative web tool for mapping epitopes from affinity-selected peptides
Cohen et al. Four distances between pairs of amino acids provide a precise description of their interaction
Jänes et al. Deep learning for protein structure prediction and design—progress and applications

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050913

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070313

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070514

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070626

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070723

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100727

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110727

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120727

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120727

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130727

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees