JP2004295256A - 抗体設計装置、抗体設計方法、プログラム、および、記録媒体 - Google Patents

抗体設計装置、抗体設計方法、プログラム、および、記録媒体 Download PDF

Info

Publication number
JP2004295256A
JP2004295256A JP2003083775A JP2003083775A JP2004295256A JP 2004295256 A JP2004295256 A JP 2004295256A JP 2003083775 A JP2003083775 A JP 2003083775A JP 2003083775 A JP2003083775 A JP 2003083775A JP 2004295256 A JP2004295256 A JP 2004295256A
Authority
JP
Japan
Prior art keywords
affinity
epitope
cdr
antibody
site
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003083775A
Other languages
English (en)
Other versions
JP4250443B2 (ja
Inventor
Seiji Saito
静司 齋藤
Mitsuto Wada
光人 和田
Kazuki Ono
一樹 大野
Hirofumi Doi
洋文 土居
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Celestar Lexico Sciences Inc
Original Assignee
Celestar Lexico Sciences Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Celestar Lexico Sciences Inc filed Critical Celestar Lexico Sciences Inc
Priority to JP2003083775A priority Critical patent/JP4250443B2/ja
Publication of JP2004295256A publication Critical patent/JP2004295256A/ja
Application granted granted Critical
Publication of JP4250443B2 publication Critical patent/JP4250443B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Complex Calculations (AREA)

Abstract

【課題】計算負担が少なくかつ精度が高い抗体設計を計算機において行うことのできる抗体設計装置などを提供することを課題とする。
【解決手段】抗原のエピトープ部位のエピトープ構造と、当該抗原に結合する抗体のCDR部位のCDR構造の複合体構造データを予測し、予測された複合体構造データについて、エピトープ構造とCDR構造との間のアフィニティを計算し、計算されたアフィニティを評価し、CDR部位の配列の一部についてミューテーションを行う。そして、変異されたCDR部位のCDR構造に基づいて変異後の複合体構造データを予測し、当該変異後の複合体構造データについて変異後のアフィニティを計算し、当該変異後のアフィニティの評価を行い、変異前後のアフィニティの評価結果を比較する。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は、抗体設計装置、抗体設計方法、プログラム、および、記録媒体に関し、特に、計算負担が少なくかつ精度が高い抗体設計を計算機において行うことのできる抗体設計装置、抗体設計方法、プログラム、および、記録媒体に関する。
【0002】
【従来の技術】
モノクローナル抗体は生物の持つ抗原・抗体反応を利用した技術であり、癌、アレルギーなどの診断および治療のための高分子医薬として期待されている。例えば、ある病気に特有の発現蛋白質があれば、モノクローナル抗体を作成することにより病気の診断が可能である。これは、抗原(特有の発現蛋白質)と抗体の特異的結合を利用した新しい診断手法である。
【0003】
また、抗原−抗体間の特異的結合を目印としてNK細胞、マクロファージなどの免疫細胞が集まり、そのことにより病気の原因細胞(癌細胞など)を除去することも可能である。この治療法は、従来の抗癌剤のように正常な細胞に悪影響を与えることなく、癌細胞などの原因細胞のみに効果があるという特徴があり、副作用が少ないというメリットがある。
【0004】
しかし、こうした抗体医薬に関しては、精製手法に関する問題、中和抗体(ヒト以外由来抗体の場合)に関する問題など、医薬としての利用に関しては様々な問題点があるのも事実である。
【0005】
以下に、従来の抗体作成手法(実験、計算機)について概観する。
【0006】
まず、抗体を実験的に作成する手法に関しては、これまでに様々な報告がなされている。ファージの表面に抗体の抗原結合部位を発現させるファージ・ディスプレイ・ライブラリを用いた方法(例えば、非特許文献1や、特許文献1を参照。)やトランスジェニック・マウスを用いた方法(例えば、非特許文献2や、特許文献2を参照。)などが一般的に利用されている。こうした手法を用いて取り出された抗体を産生する細胞から、細胞融合法を用いてモノクローナル抗体を作成することとなる。
【0007】
しかし、上記のような実験的手法では一つのモノクローナル抗体を作成するために約4ヶ月〜半年程度の期間を要するのが普通であり、作成する時間、費用の負担が大きいのが難点である。またこの手法では、抗原のあるエピトープ領域に結合する抗体を選択的に作成することができない。あるエピトープ部位に特異的に結合する抗体を作成することは、その蛋白質が担うある特定の相互作用のみを阻害(あるいは促進)することにつながり、副作用の少ない医薬品開発の観点からは重要である。
【0008】
このような、抗体設計の時間、費用的問題、あるエピトープ領域へ特異的に結合する抗体作成、抗体の効果的改変という問題に対処するため、計算機による抗体デザイン手法の開発が望まれている。
【0009】
計算機による相互作用分子探索手法に関しても多数の報告がある。特に蛋白質に結合する低分子化合物を探索する手法についての報告例は多い(例えば、非特許文献3を参照。)。しかし、これらの手法の大部分はターゲットは低分子化合物のような分子量の小さいものであり、抗体のような巨大分子に適しているとは言い難い。
【0010】
抗体のような巨大分子の相互作用デザインを計算機上で行う、という試みに関しても報告例がある。特にアミノ酸変異による活性変化を計算機で計算することにより、既知抗体よりも高い活性を示す抗体を設計する、という観点からの試みは多い(例えば、非特許文献4を参照。)。
【0011】
しかし、これらの手法は既知抗原・抗体の構造を元に計算するので、構造既知の場合に適用範囲が限定される、などの問題点がある。
【0012】
また、従来、ドッキング・プログラム(docking program)を用いて抗原・抗体複合体の構造予測を行うもの(例えば、非特許文献5を参照。)、lysozyme−antibodyのbinding構造を予測(例えば、非特許文献6を参照。)など、抗原−抗体複合体の構造予測に関する様々な報告がなされているようであるが(例えば、非特許文献7を参照。)、基本的な考え方はここ10年来変わっていない。抗原の構造が与えられて抗体の構造を最適化、抗原、抗体の構造が与えられてそれらの相対的位置を最適化、などである。最適化の手法に関しても様々な方法が考えられている。
【0013】
しかし、ドッキング・シミュレーション等によるそれぞれの構造の位置関係最適化処理は計算負担が大きく処理時間がかかる。
【0014】
【特許文献1】
特表平09−506262号公報
【特許文献2】
特許繊3068507号公報
【非特許文献1】
James F. Smothers, Steven Henikoff, and Paul Carter “Affinity Selection from Biological Libraries” Science 2002 October 18; 298: 621−622
【非特許文献2】
Houdebine LM. “Antibody manufacture in transgenic animals and comparisons with other systems.”. Curr Opin Biotechnol 2002 Dec;13(6):625−9
【非特許文献3】
Honma T, Hayashi K, Aoyama T, Hashimoto N, Machida T, Fukasawa K, Iwama T, Ikeura C, Ikuta M, Suzuki−Takahashi I, Iwasawa Y, Hayama T, Nishimura S, Morishima H. “Structure−based generation of a new class of potent Cdk4 inhibitors: new de novo design strategy and library design.”,J Med Chem 2001 Dec 20;44(26):4615−27
【非特許文献4】
Sharp KA.“Calculation of HyHel10−lysozyme binding free energy changes: effect of ten point mutations.” Proteins 1998 Oct 1;33(1):39−48
【非特許文献5】
Vakser IA. “Evaluation of GRAMMlow−resolution docking methodology on the hemagglutinin−antibody complex.” Proteins 1997;Suppl 1:226−30
【非特許文献6】
Totrov M, Abagyan R. “Detailedab initio prediction of lysozyme−antibody complex with 1.6 A accuracy.”Nat Struct Biol 1994 Apr;1(4):259−63
【非特許文献7】
Van Regenmortel MH. “Structuraland functional approaches to the study of protein antigenicity.” Immunol Today 1989 Aug;10(8):266−72
【0015】
【発明が解決しようとする課題】
上述したように、従来技術においては、抗体設計の時間的および費用的問題、領域特異的結合性をもつ抗体の設計の困難性の問題、抗体の効果的改変の困難性の問題、構造未知抗原・抗体への適用の困難性の問題がある。
このように、従来の実験および計算機による抗体作成手法は数々の問題点を有しており、その結果、システムの利用者および管理者のいずれにとっても、利便性が悪く、また、利用効率が悪いものであった。
本発明は上記問題点に鑑みてなされたもので、計算負担が少なくかつ精度が高い抗体設計を計算機において行うことのできる、抗体設計装置、抗体設計方法、プログラム、および、記録媒体を提供することを目的としている。
【0016】
【課題を解決するための手段】
本発明者は、上述した問題点を解決するために、計算機による抗体設計を大まかに以下のような3つの要素手順に分け、それぞれを実現するシステムの開発を行った。
(1)抗原における相互作用部位(エピトープ部位)の特定
(2)抗原−抗体複合体構造予測
(3)抗原−抗体複合体のアフィニティ(結合活性)計算
上記の個々の要素を実現し、それらをシステム化することにより、上に示した問題点が解決可能であると考える。すなわち、本発明者は、エピトープ‐CDR複合体構造デザインとこれらのアフィニティ(結合活性)測定を計算機上で行うシステムの開発により、上記の問題点に対する解決策を提案する。
【0017】
このような目的を達成するため、請求項1に記載の抗体設計装置は、抗原のエピトープ部位のエピトープ構造と、当該抗原に結合する抗体のCDR部位のCDR構造の複合体構造データを予測する複合体構造予測手段と、上記複合体構造予測手段により予測された上記複合体構造データについて、上記エピトープ構造と上記CDR構造との間のアフィニティを計算するアフィニティ計算手段と、上記アフィニティ計算手段により計算された上記アフィニティを評価するアフィニティ評価手段と、上記CDR部位の配列の一部についてミューテーションを行うCDR配列ミューテーション手段とを備え、上記CDR配列ミューテーション手段により変異されたCDR部位のCDR構造に基づいて上記複合体構造予測手段により変異後の複合体構造データを予測し、当該変異後の複合体構造データについて上記アフィニティ計算手段により変異後のアフィニティを計算し、上記アフィニティ評価手段により当該変異後のアフィニティの評価を行い、変異前後のアフィニティの評価結果を比較することにより、抗原とアフィニティの高い抗体を設計することを特徴とする。
【0018】
この装置によれば、抗原のエピトープ部位のエピトープ構造と、当該抗原に結合する抗体のCDR部位のCDR構造の複合体構造データを予測し、予測された複合体構造データについて、エピトープ構造とCDR構造との間のアフィニティを計算し、計算されたアフィニティを評価し、CDR部位の配列の一部についてミューテーションを行う。そして、変異されたCDR部位のCDR構造に基づいて変異後の複合体構造データを予測し、当該変異後の複合体構造データについて変異後のアフィニティを計算し、当該変異後のアフィニティの評価を行い、変異前後のアフィニティの評価結果を比較することにより、抗原とアフィニティの高い抗体を設計することができる。
【0019】
すなわち、従来技術のように抗体と抗原の全体構造を取得してドッキングシュミレーション技術などを用いて複合体を設定しアフィニティを計算する場合には、計算対象の系が巨大になることから、ハイスループットな計算機資源が必要となり、かつ計算時間が膨大にかかるという問題点があったが、本発明のように抗原のエピトープ構造と抗体のCDR構造のみについて複合体構造を設定する方式を採用することにより、精度を対する影響を少なくしつつ計算負担を軽減することができるようになる。
【0020】
また、請求項2に記載の抗体設計装置は、請求項1に記載の抗体設計装置において、上記複合体構造予測手段は、エピトープ断片の類似配列および/またはエピトープ断片パターンの類似構造を持つ類似データを検索して得点を付ける類似データ得点化手段と、上記類似データ得点化手段により高い得点が付されたデータの構造データを雛型として、エピトープ‐CDR相対的位置関係および/またはエピトープ‐CDR結合関係をできるだけ保持するように複合体構造を作成する複合体構造作成手段とを備えたことを特徴とする。
【0021】
これは複合体構造予測手段の一例を一層具体的に示すものである。この装置によれば、エピトープ断片の類似配列および/またはエピトープ断片パターンの類似構造を持つ類似データを検索して得点を付け、高い得点が付されたデータの構造データを雛型として、エピトープ‐CDR相対的位置関係および/またはエピトープ‐CDR結合関係をできるだけ保持するように複合体構造を作成するので、既知の抗体−抗原の複合体構造データに基づいて新規の複合体構造を精度よく予測することができるようになる。
【0022】
また、請求項3に記載の抗体設計装置は、請求項1または2に記載の抗体設計装置において、上記複合体構造予測手段は、配列と構造との間の相関の大きさを計算する相関計算手段と、上記相関計算手段により計算された相関の大きさに応じて側鎖のロータマーの揺らぎの大きさを示す自由度を計算するロータマー自由度計算手段と、上記ロータマー自由度計算手段により計算された側鎖構造の上記自由度に基づいて、主鎖と側鎖を含めた複合体構造を作成するロータマー自由度反映構造作成手段とを備えたことを特徴とする。
【0023】
これは複合体構造予測手段の一例を一層具体的に示すものである。この装置によれば、配列と構造との間の相関の大きさを計算し、計算された相関の大きさに応じて側鎖のロータマーの揺らぎの大きさを示す自由度を計算し、計算された側鎖構造の自由度に基づいて、主鎖と側鎖を含めた複合体構造を作成するので、ロータマー揺らぎによる動的アフィニティ計算結果を反映することができ、より、現実のアフィニティ実測値に近い予測を行うことができるようになる。
【0024】
アフィニティを正確に評価するための関数、最適化手法に関しては様々な工夫がなされているが、基本的には計算化学的手法で一般的に用いられるポテンシャル関数などが用いられているのが現状である。
【0025】
本発明者の手法では、ロータマーを用いた動的アフィニティ計算手法に関して工夫がなされている。ロータマー揺らぎによる動的アフィニティ計算は、アフィニティ計算の新しいコンセプトである。これは、配列−構造相関の大きさに応じたロータマー揺らぎの発生により、構造の揺らぎを考慮したアフィニティ計算を行うものである。また、本発明者の手法では、粗い解像度でのアフィニティ計算から、細かな情報を加味したアフィニティ計算を段階的に行うことが可能である点も新しい点である。
【0026】
また、請求項4に記載の抗体設計装置は、請求項1から3のいずれか一つに記載の抗体設計装置において、上記アフィニティ計算手段は、複合体と単体の自由エネルギーの差により上記アフィニティを計算する自由エネルギー計算手段、および/または、コンタクトポテンシャルにより上記アフィニティを計算するコンタクトポテンシャル計算手段を備えたことを特徴とする。
【0027】
これはアフィニティ計算手段の一例を一層具体的に示すものである。この装置によれば、複合体と単体の自由エネルギーの差によりアフィニティを計算し、および/または、コンタクトポテンシャルによりアフィニティを計算するので、静電的相互作用、疎水的相互作用などのパラメータを、与えられた情報、計算時間、求められる精度によって統計ポテンシャル、分子力学、量子化学、コンタクトポテンシャルなどを使い分けて用いることができるようになる。
【0028】
また、請求項5に記載の抗体設計装置は、請求項1から4のいずれか一つに記載の抗体設計装置において、上記アフィニティ評価手段は、上記アフィニティの平均値および分散値に基づいてアフィニティ評価関数を設定するアフィニティ評価関数設定手段をさらに備え、上記アフィニティ計算手段により計算された上記アフィニティを上記アフィニティ評価関数に基づいて評価を行うことを特徴とする。
【0029】
これはアフィニティ評価手段の一例を一層具体的に示すものである。この装置によれば、アフィニティの平均値および分散値に基づいてアフィニティ評価関数を設定し、計算されたアフィニティをアフィニティ評価関数に基づいて評価を行うので、予測精度に対する影響を少なくしつつ、かつ計算負担を少なくことができるようになる。
【0030】
また、請求項6に記載の抗体設計装置は、請求項1から5のいずれか一つに記載の抗体設計装置において、上記CDR配列ミューテーション手段は、上記CDR部位のミューテーションさせる位置を、ランダムに、または、アフィニティ評価に基づいて決定するミューテーション位置決定手段をさらに備えたことを特徴とする。
【0031】
これはCDR配列ミューテーション手段の一例を一層具体的に示すものである。この装置によれば、CDR部位のミューテーションさせる位置を、ランダムに、または、アフィニティ評価に基づいて決定するので、遺伝的アルゴリズムなどの手法を用いてランダムに決定した場合には計算負担を少なくすることができ、また、アフィニティ評価に基づいて決定する場合には、アフィニティ平均値減少に寄与したロータマー揺らぎ構造をもつアミノ酸を重点的に変異させることなどができるようになるため、ミューテーションによる抗体精度の向上効率を上げることができるようになる。
【0032】
また、請求項7に記載の抗体設計装置は、請求項1から6のいずれか一つに記載の抗体設計装置において、2次構造予測結果を用いたSVMによるエピトープ部位予測のパラメータS(i)、オリゴペプチド頻度情報を用いたエピトープ部位予測のパラメータO(i)、エピトープ部位アミノ酸頻度情報を用いたエピトープ部位予測のパラメータK(i)の少なくとも一つに基づいて抗原のエピトープ部位を予測するエピトープ部位予測手段をさらに備えたことを特徴とする。
【0033】
この装置によれば、2次構造予測結果を用いたSVMによるエピトープ部位予測のパラメータS(i)、オリゴペプチド頻度情報を用いたエピトープ部位予測のパラメータO(i)、エピトープ部位アミノ酸頻度情報を用いたエピトープ部位予測のパラメータK(i)の少なくとも一つに基づいて抗原のエピトープ部位を予測するので、処理対象の抗原のエピトープ部位に関する情報がない場合であっても、効率的に予測することができるようになる。
【0034】
また、本発明は抗体設計方法に関するものであり、請求項8に記載の抗体設計方法は、抗原のエピトープ部位のエピトープ構造と、当該抗原に結合する抗体のCDR部位のCDR構造の複合体構造データを予測する複合体構造予測ステップと、上記複合体構造予測ステップにより予測された上記複合体構造データについて、上記エピトープ構造と上記CDR構造との間のアフィニティを計算するアフィニティ計算ステップと、上記アフィニティ計算ステップにより計算された上記アフィニティを評価するアフィニティ評価ステップと、上記CDR部位の配列の一部についてミューテーションを行うCDR配列ミューテーションステップとを含み、上記CDR配列ミューテーションステップにより変異されたCDR部位のCDR構造に基づいて上記複合体構造予測ステップにより変異後の複合体構造データを予測し、当該変異後の複合体構造データについて上記アフィニティ計算ステップにより変異後のアフィニティを計算し、上記アフィニティ評価ステップにより当該変異後のアフィニティの評価を行い、変異前後のアフィニティの評価結果を比較することにより、抗原とアフィニティの高い抗体を設計することを特徴とする。
【0035】
この方法によれば、抗原のエピトープ部位のエピトープ構造と、当該抗原に結合する抗体のCDR部位のCDR構造の複合体構造データを予測し、予測された複合体構造データについて、エピトープ構造とCDR構造との間のアフィニティを計算し、計算されたアフィニティを評価し、CDR部位の配列の一部についてミューテーションを行う。そして、変異されたCDR部位のCDR構造に基づいて変異後の複合体構造データを予測し、当該変異後の複合体構造データについて変異後のアフィニティを計算し、当該変異後のアフィニティの評価を行い、変異前後のアフィニティの評価結果を比較することにより、抗原とアフィニティの高い抗体を設計することができる。
【0036】
すなわち、従来技術のように抗体と抗原の全体構造を取得してドッキングシュミレーション技術などを用いて複合体を設定しアフィニティを計算する場合には、計算対象の系が巨大になることから、ハイスループットな計算機資源が必要となり、かつ計算時間が膨大にかかるという問題点があったが、本発明のように抗原のエピトープ構造と抗体のCDR構造のみについて複合体構造を設定する方式を採用することにより、精度を対する影響を少なくしつつ計算負担を軽減することができるようになる。
【0037】
また、請求項9に記載の抗体設計方法は、請求項8に記載の抗体設計方法において、上記複合体構造予測ステップは、エピトープ断片の類似配列および/またはエピトープ断片パターンの類似構造を持つ類似データを検索して得点を付ける類似データ得点化ステップと、上記類似データ得点化ステップにより高い得点が付されたデータの構造データを雛型として、エピトープ‐CDR相対的位置関係および/またはエピトープ‐CDR結合関係をできるだけ保持するように複合体構造を作成する複合体構造作成ステップとを含むことを特徴とする。
【0038】
これは複合体構造予測ステップの一例を一層具体的に示すものである。この方法によれば、エピトープ断片の類似配列および/またはエピトープ断片パターンの類似構造を持つ類似データを検索して得点を付け、高い得点が付されたデータの構造データを雛型として、エピトープ‐CDR相対的位置関係および/またはエピトープ‐CDR結合関係をできるだけ保持するように複合体構造を作成するので、既知の抗体−抗原の複合体構造データに基づいて新規の複合体構造を精度よく予測することができるようになる。
【0039】
また、請求項10に記載の抗体設計方法は、請求項8または9に記載の抗体設計方法において、上記複合体構造予測ステップは、配列と構造との間の相関の大きさを計算する相関計算ステップと、上記相関計算ステップにより計算された相関の大きさに応じて側鎖のロータマーの揺らぎの大きさを示す自由度を計算するロータマー自由度計算ステップと、上記ロータマー自由度計算ステップにより計算された側鎖構造の上記自由度に基づいて、主鎖と側鎖を含めた複合体構造を作成するロータマー自由度反映構造作成ステップとを含むことを特徴とする。
【0040】
これは複合体構造予測ステップの一例を一層具体的に示すものである。この方法によれば、配列と構造との間の相関の大きさを計算し、計算された相関の大きさに応じて側鎖のロータマーの揺らぎの大きさを示す自由度を計算し、計算された側鎖構造の自由度に基づいて、主鎖と側鎖を含めた複合体構造を作成するので、ロータマー揺らぎによる動的アフィニティ計算結果を反映することができ、より、現実のアフィニティ実測値に近い予測を行うことができるようになる。
【0041】
アフィニティを正確に評価するための関数、最適化手法に関しては様々な工夫がなされているが、基本的には計算化学的手法で一般的に用いられるポテンシャル関数などが用いられているのが現状である。
【0042】
本発明者の手法では、ロータマーを用いた動的アフィニティ計算手法に関して工夫がなされている。ロータマー揺らぎによる動的アフィニティ計算は、アフィニティ計算の新しいコンセプトである。これは、配列−構造相関の大きさに応じたロータマー揺らぎの発生により、構造の揺らぎを考慮したアフィニティ計算を行うものである。また、本発明者の手法では、粗い解像度でのアフィニティ計算から、細かな情報を加味したアフィニティ計算を段階的に行うことが可能である点も新しい点である。
【0043】
また、請求項11に記載の抗体設計方法は、請求項8から10のいずれか一つに記載の抗体設計方法において、上記アフィニティ計算ステップは、複合体と単体の自由エネルギーの差により上記アフィニティを計算する自由エネルギー計算ステップ、および/または、コンタクトポテンシャルにより上記アフィニティを計算するコンタクトポテンシャル計算ステップを含むことを特徴とする。
【0044】
これはアフィニティ計算ステップの一例を一層具体的に示すものである。この方法によれば、複合体と単体の自由エネルギーの差によりアフィニティを計算し、および/または、コンタクトポテンシャルによりアフィニティを計算するので、静電的相互作用、疎水的相互作用などのパラメータを、与えられた情報、計算時間、求められる精度によって統計ポテンシャル、分子力学、量子化学、コンタクトポテンシャルなどを使い分けて用いることができるようになる。
【0045】
また、請求項12に記載の抗体設計方法は、請求項8から11のいずれか一つに記載の抗体設計方法において、上記アフィニティ評価ステップは、上記アフィニティの平均値および分散値に基づいてアフィニティ評価関数を設定するアフィニティ評価関数設定ステップをさらに含み、上記アフィニティ計算ステップにより計算された上記アフィニティを上記アフィニティ評価関数に基づいて評価を行うことを特徴とする。
【0046】
これはアフィニティ評価ステップの一例を一層具体的に示すものである。この方法によれば、アフィニティの平均値および分散値に基づいてアフィニティ評価関数を設定し、計算されたアフィニティをアフィニティ評価関数に基づいて評価を行うので、予測精度に対する影響を少なくしつつ、かつ計算負担を少なくことができるようになる。
【0047】
また、請求項13に記載の抗体設計方法は、請求項8から12のいずれか一つに記載の抗体設計方法において、上記CDR配列ミューテーションステップは、上記CDR部位のミューテーションさせる位置を、ランダムに、または、アフィニティ評価に基づいて決定するミューテーション位置決定ステップをさらに含むことを特徴とする。
【0048】
これはCDR配列ミューテーションステップの一例を一層具体的に示すものである。この方法によれば、CDR部位のミューテーションさせる位置を、ランダムに、または、アフィニティ評価に基づいて決定するので、遺伝的アルゴリズムなどの手法を用いてランダムに決定した場合には計算負担を少なくすることができ、また、アフィニティ評価に基づいて決定する場合には、アフィニティ平均値減少に寄与したロータマー揺らぎ構造をもつアミノ酸を重点的に変異させることなどができるようになるため、ミューテーションによる抗体精度の向上効率を上げることができるようになる。
【0049】
また、請求項14に記載の抗体設計方法は、請求項8から13のいずれか一つに記載の抗体設計方法において、2次構造予測結果を用いたSVMによるエピトープ部位予測のパラメータS(i)、オリゴペプチド頻度情報を用いたエピトープ部位予測のパラメータO(i)、エピトープ部位アミノ酸頻度情報を用いたエピトープ部位予測のパラメータK(i)の少なくとも一つに基づいて抗原のエピトープ部位を予測するエピトープ部位予測ステップをさらに含むことを特徴とする。
【0050】
この方法によれば、2次構造予測結果を用いたSVMによるエピトープ部位予測のパラメータS(i)、オリゴペプチド頻度情報を用いたエピトープ部位予測のパラメータO(i)、エピトープ部位アミノ酸頻度情報を用いたエピトープ部位予測のパラメータK(i)の少なくとも一つに基づいて抗原のエピトープ部位を予測するので、処理対象の抗原のエピトープ部位に関する情報がない場合であっても、効率的に予測することができるようになる。
【0051】
また、本発明はプログラムに関するものであり、請求項15に記載の抗体設計方法をコンピュータに実行させることを特徴とするプログラムは、抗原のエピトープ部位のエピトープ構造と、当該抗原に結合する抗体のCDR部位のCDR構造の複合体構造データを予測する複合体構造予測ステップと、上記複合体構造予測ステップにより予測された上記複合体構造データについて、上記エピトープ構造と上記CDR構造との間のアフィニティを計算するアフィニティ計算ステップと、上記アフィニティ計算ステップにより計算された上記アフィニティを評価するアフィニティ評価ステップと、上記CDR部位の配列の一部についてミューテーションを行うCDR配列ミューテーションステップとを含み、上記CDR配列ミューテーションステップにより変異されたCDR部位のCDR構造に基づいて上記複合体構造予測ステップにより変異後の複合体構造データを予測し、当該変異後の複合体構造データについて上記アフィニティ計算ステップにより変異後のアフィニティを計算し、上記アフィニティ評価ステップにより当該変異後のアフィニティの評価を行い、変異前後のアフィニティの評価結果を比較することにより、抗原とアフィニティの高い抗体を設計することを特徴とする。
【0052】
このプログラムによれば、抗原のエピトープ部位のエピトープ構造と、当該抗原に結合する抗体のCDR部位のCDR構造の複合体構造データを予測し、予測された複合体構造データについて、エピトープ構造とCDR構造との間のアフィニティを計算し、計算されたアフィニティを評価し、CDR部位の配列の一部についてミューテーションを行う。そして、変異されたCDR部位のCDR構造に基づいて変異後の複合体構造データを予測し、当該変異後の複合体構造データについて変異後のアフィニティを計算し、当該変異後のアフィニティの評価を行い、変異前後のアフィニティの評価結果を比較することにより、抗原とアフィニティの高い抗体を設計することができる。
【0053】
すなわち、従来技術のように抗体と抗原の全体構造を取得してドッキングシュミレーション技術などを用いて複合体を設定しアフィニティを計算する場合には、計算対象の系が巨大になることから、ハイスループットな計算機資源が必要となり、かつ計算時間が膨大にかかるという問題点があったが、本発明のように抗原のエピトープ構造と抗体のCDR構造のみについて複合体構造を設定する方式を採用することにより、精度を対する影響を少なくしつつ計算負担を軽減することができるようになる。
【0054】
また、請求項16に記載のプログラムは、請求項15に記載のプログラムにおいて、上記複合体構造予測ステップは、エピトープ断片の類似配列および/またはエピトープ断片パターンの類似構造を持つ類似データを検索して得点を付ける類似データ得点化ステップと、上記類似データ得点化ステップにより高い得点が付されたデータの構造データを雛型として、エピトープ‐CDR相対的位置関係および/またはエピトープ‐CDR結合関係をできるだけ保持するように複合体構造を作成する複合体構造作成ステップとを含むことを特徴とする。
【0055】
これは複合体構造予測ステップの一例を一層具体的に示すものである。このプログラムによれば、エピトープ断片の類似配列および/またはエピトープ断片パターンの類似構造を持つ類似データを検索して得点を付け、高い得点が付されたデータの構造データを雛型として、エピトープ‐CDR相対的位置関係および/またはエピトープ‐CDR結合関係をできるだけ保持するように複合体構造を作成するので、既知の抗体−抗原の複合体構造データに基づいて新規の複合体構造を精度よく予測することができるようになる。
【0056】
また、請求項17に記載のプログラムは、請求項15または16に記載のプログラムにおいて、上記複合体構造予測ステップは、配列と構造との間の相関の大きさを計算する相関計算ステップと、上記相関計算ステップにより計算された相関の大きさに応じて側鎖のロータマーの揺らぎの大きさを示す自由度を計算するロータマー自由度計算ステップと、上記ロータマー自由度計算ステップにより計算された側鎖構造の上記自由度に基づいて、主鎖と側鎖を含めた複合体構造を作成するロータマー自由度反映構造作成ステップとを含むことを特徴とする。
【0057】
これは複合体構造予測ステップの一例を一層具体的に示すものである。このプログラムによれば、配列と構造との間の相関の大きさを計算し、計算された相関の大きさに応じて側鎖のロータマーの揺らぎの大きさを示す自由度を計算し、計算された側鎖構造の自由度に基づいて、主鎖と側鎖を含めた複合体構造を作成するので、ロータマー揺らぎによる動的アフィニティ計算結果を反映することができ、より、現実のアフィニティ実測値に近い予測を行うことができるようになる。
【0058】
アフィニティを正確に評価するための関数、最適化手法に関しては様々な工夫がなされているが、基本的には計算化学的手法で一般的に用いられるポテンシャル関数などが用いられているのが現状である。
【0059】
本発明者の手法では、ロータマーを用いた動的アフィニティ計算手法に関して工夫がなされている。ロータマー揺らぎによる動的アフィニティ計算は、アフィニティ計算の新しいコンセプトである。これは、配列−構造相関の大きさに応じたロータマー揺らぎの発生により、構造の揺らぎを考慮したアフィニティ計算を行うものである。また、本発明者の手法では、粗い解像度でのアフィニティ計算から、細かな情報を加味したアフィニティ計算を段階的に行うことが可能である点も新しい点である。
【0060】
また、請求項18に記載のプログラムは、請求項15から17のいずれか一つに記載のプログラムにおいて、上記アフィニティ計算ステップは、複合体と単体の自由エネルギーの差により上記アフィニティを計算する自由エネルギー計算ステップ、および/または、コンタクトポテンシャルにより上記アフィニティを計算するコンタクトポテンシャル計算ステップを含むことを特徴とする。
【0061】
これはアフィニティ計算ステップの一例を一層具体的に示すものである。このプログラムによれば、複合体と単体の自由エネルギーの差によりアフィニティを計算し、および/または、コンタクトポテンシャルによりアフィニティを計算するので、静電的相互作用、疎水的相互作用などのパラメータを、与えられた情報、計算時間、求められる精度によって統計ポテンシャル、分子力学、量子化学、コンタクトポテンシャルなどを使い分けて用いることができるようになる。
【0062】
また、請求項19に記載のプログラムは、請求項15から18のいずれか一つに記載のプログラムにおいて、上記アフィニティ評価ステップは、上記アフィニティの平均値および分散値に基づいてアフィニティ評価関数を設定するアフィニティ評価関数設定ステップをさらに含み、上記アフィニティ計算ステップにより計算された上記アフィニティを上記アフィニティ評価関数に基づいて評価を行うことを特徴とする。
【0063】
これはアフィニティ評価ステップの一例を一層具体的に示すものである。このプログラムによれば、アフィニティの平均値および分散値に基づいてアフィニティ評価関数を設定し、計算されたアフィニティをアフィニティ評価関数に基づいて評価を行うので、予測精度に対する影響を少なくしつつ、かつ計算負担を少なくことができるようになる。
【0064】
また、請求項20に記載のプログラムは、請求項15から19のいずれか一つに記載のプログラムにおいて、上記CDR配列ミューテーションステップは、上記CDR部位のミューテーションさせる位置を、ランダムに、または、アフィニティ評価に基づいて決定するミューテーション位置決定ステップをさらに含むことを特徴とする。
【0065】
これはCDR配列ミューテーションステップの一例を一層具体的に示すものである。このプログラムによれば、CDR部位のミューテーションさせる位置を、ランダムに、または、アフィニティ評価に基づいて決定するので、遺伝的アルゴリズムなどの手法を用いてランダムに決定した場合には計算負担を少なくすることができ、また、アフィニティ評価に基づいて決定する場合には、アフィニティ平均値減少に寄与したロータマー揺らぎ構造をもつアミノ酸を重点的に変異させることなどができるようになるため、ミューテーションによる抗体精度の向上効率を上げることができるようになる。
【0066】
また、請求項21に記載のプログラムは、請求項15から20のいずれか一つに記載のプログラムにおいて、2次構造予測結果を用いたSVMによるエピトープ部位予測のパラメータS(i)、オリゴペプチド頻度情報を用いたエピトープ部位予測のパラメータO(i)、エピトープ部位アミノ酸頻度情報を用いたエピトープ部位予測のパラメータK(i)の少なくとも一つに基づいて抗原のエピトープ部位を予測するエピトープ部位予測ステップをさらに含むことを特徴とする。
【0067】
このプログラムによれば、2次構造予測結果を用いたSVMによるエピトープ部位予測のパラメータS(i)、オリゴペプチド頻度情報を用いたエピトープ部位予測のパラメータO(i)、エピトープ部位アミノ酸頻度情報を用いたエピトープ部位予測のパラメータK(i)の少なくとも一つに基づいて抗原のエピトープ部位を予測するので、処理対象の抗原のエピトープ部位に関する情報がない場合であっても、効率的に予測することができるようになる。
【0068】
また、本発明は記録媒体に関するものであり、請求項22に記載の記録媒体は、上記請求項15から21のいずれか一つに記載されたプログラムを記録したことを特徴とする。
【0069】
この記録媒体によれば、当該記録媒体に記録されたプログラムをコンピュータに読み取らせて実行することによって、請求項15から21のいずれか一つに記載されたプログラムをコンピュータを利用して実現することができ、これら各方法と同様の効果を得ることができる。
【0070】
【発明の実施の形態】
以下に、本発明にかかる抗体設計装置、抗体設計方法、プログラム、および、記録媒体の実施の形態を図面に基づいて詳細に説明する。なお、この実施の形態によりこの発明が限定されるものではない。
【0071】
[本発明の概要]
以下、本発明の概要について説明し、その後、本発明の構成および処理等について詳細に説明する。図1は本発明の基本原理を示す原理構成図である。
本発明は、概略的に、以下の基本的特徴を有する。
【0072】
まず、本発明は、利用者により入力された抗原についてエピトープ部位の構造が入力データとして与えられない場合には、エピトープ構造を既知のデータベースなどから検索して取得する。ここで、エピトープ構造が取得できない場合には、以下に示すように、抗原配列、抗原構造、エピトープ部位配列などのうち少なくとも一つの情報に基づいて、エピトープ部位の構造を予測する(ステップSA−1)。
【0073】
[エピトープ構造予測処理]
ステップSA−1のエピトープ構造予測処理の詳細について図2を参照して説明する。図2は、本発明のエピトープ構造予測処理の一例を示すフローチャートである。
【0074】
まず、既知の抗体情報データベースなどを参照して、処理対象の抗原のエピトープ部位情報が存在するか確認する(ステップSB−1)。
【0075】
ステップSB−1において、エピトープ部位情報が存在しない場合には、以下に示すエピトープ部位予測処理を実行して、抗体配列情報からエピトープ部位を予測する(ステップSB−2)。
【0076】
そして、既知の抗体情報データベースから取得、または、エピトープ部位予測処理により予測されたエピトープ部位の配列情報について、以下に示す断片構造予測処理を実行する(ステップSB−3)。
【0077】
そして、予測されたエピトープ部位の構造データをエピトープ構造データとして出力する(ステップSB−4)。
【0078】
これにて、エピトープ構造予測処理が終了する。
【0079】
[エピトープ部位予測処理]
ステップSB−2のエピトープ部位予測処理の詳細について図3を参照して説明する。図3は、本発明のエピトープ部位予測処理の一例を示すフローチャートである。
【0080】
ここで、蛋白質の構造、または配列情報から相互作用部位を特定する、というテーマでの調査報告は、従来様々なものが考えられてきたが、いずれの方法により抗体の相互作用部位であるエピトープ部位を決定してもよい。例えば、既知の相互作用部位予測手法として、疎水度などの6つの指標から相互作用部位を予測(Jones S, Thornton JM. “Prediction of protein−protein interaction sites using patch analysis.” J Mol Biol 1997 Sep 12;272(1):133−43)、疎水度の値と分散から予測(Gallet X, Charloteaux B, Thomas A,Brasseur R. “A fast method to predict protein interaction sites from sequences.” J Mol Biol 2000 Sep 29;302(4):917−26)、構造情報からの静電的不安定性に基づく相互作用部位予測(Elcock AH. “Prediction of functionally important residues based solely on the computed energetics of protein structure.” J Mol Biol 2001 Sep 28;312(4):885−96)、ニューラル・ネットワーク(neural network)で学習して相互作用部位を予測(Zhou HX, Shan Y. “Prediction of protein interaction sites from sequence profile and residue neighbor list.” Proteins 2001 Aug 15;44(3):336−43)、等がある。
【0081】
また、相互作用部位予測における本発明者のコンセプトの一つは、全体構造から構造的、あるいはエネルギー的にフラストレーションが溜まっている部分構造(不安定性を持つ部分構造)が相互作用部位になる可能性が高い、というものである。このコンセプトに基づく手法は本発明者の独自のものであり、本出願人により、特願2002−275300号、特願2002−160782号、特願2001−392802号がされている。本発明においても、これらの特許出願により開示された技術を用いてエピトープ部位を予測してもよい。
【0082】
これにより、抗体設計に特化した相互作用部位特定技術としては、従来はエピトープ部位を入力データとしなければならなかったが、相互作用部位予測手法に基づくエピトープ部位の自動抽出により抗原全体を入力データとすることができる。
【0083】
さらに、以下に示す新規のエピトープ部位を予測する手法について、詳細に説明する。
【0084】
本発明は、エピトープ部位を予測するためのパラメータとして、2次構造予測結果データ、オリゴペプチド頻度情報、抗原・抗体アミノ酸頻度情報のうち少なくとも1つのパラメータを取得する(ステップSC−1)。
【0085】
そして、これらの各パラメータからエピトープ部位を判定するための統合評価関数を作成する(ステップSC−2)。
【0086】
以下に、I.2次構造予測結果データ、II.オリゴペプチド頻度情報、III.エピトープ部位アミノ酸頻度情報のそれぞれのパラメータに基づいて、IV.エピト
ープ部位を判定するための統合評価関数を作成する場合について、順に詳細に説明する。
【0087】
I.2次構造予測結果データからエピトープ可能性部位を予測する場合
(1)まず、以下の手順1〜手順4により、各2次構造予測プログラムの処理結果からSVM(サポート・ベクトル・マシーン)学習データを作成する。
(手順1)プロテイン・データ・バンク(PDB)などに登録された構造データについて、各2次構造予測手段(手段1,手段2,手段3,...)における2次構造予測結果を計算する。
(手順2)この構造データから、複合体形成時の結合部位を抽出する。ここで、アミノ酸配列が「AAAGKWF」の場合に、各2次構造予測手段により処理し、結合部位を抽出した処理結果の一例を図10に示す。
(手順3)各サイトでの各2次構造予測手段による2次構造予測結果を訓練データとし、また、結合部位であるかないか(図1における最右欄)を分類クラスとしてSVM学習を行う。
(手順4)SVM学習データを保存する。
【0088】
(2)処理対象の抗原配列を入力する。
【0089】
(3)処理対象の抗原配列に対して、各2次構造予測手段の手法を用いて2次構造予測を行う。ここで、アミノ酸配列がAGFWKRPの場合に、各2次構造予測手段により処理し、結合部位を抽出した処理結果の一例を図11に示す。
【0090】
(4)サイトごとの二次構造結果のパターンを、予めSVM学習を行い保存しておいたSVM学習データに入力する。
【0091】
(5)SVMにより、エピトープ部位の可能性を示すパラメータS(i)を出力する。
【0092】
II.オリゴペプチドの出現頻度からエピトープ可能性部位を予測する場合
(1)まず、オリゴペプチド頻度情報データベースを作成する。ここで、オリゴペプチド頻度情報データベースの作成手法について、手順1〜手順3に示す。
(手順1)生物種ごとの蛋白質のアミノ酸配列を収集する。
(手順2)各配列をn残基(3〜5)残基のオリゴペプチドに分割する。例えば、アミノ酸配列が「MAERTTRE」の場合には、5残基(例えば、「MAERT」、「AERTT」、「ERTTR」、「RTTRE」など)、4残基(例えば、「MAER」、「AERT」、「ERTT」、「RTTR」、「TTRE」など)、3残基(例えば、「MAE」、「AER」、「ERT」、「RTT」、「TTR」、「TRE」など)のオリゴペプチドに分割する。
(手順3)生物種ごとに各オリゴペプチドの出現確率P(s)を求めて、オリゴペプチド頻度情報データベースに登録する。
<各オリゴペプチドの出現確率P(s)の一例>
P(MAERS) = 0.000031
P(MAERT) = 0.000035
【0093】
(2)処理対象の抗原配列を入力する。
【0094】
(3)処理対象の抗原配列をn残基のオリゴペプチドに分割する。
【0095】
(4)i番目を含むオリゴペプチドの出現確率の平均をi番目のスコアO(i)にする。
【0096】
(5)処理結果を出力する。
【0097】
III.エピトープ部位アミノ酸頻度情報からエピトープ可能性部位を予測する場合
(1)エピトープ部位アミノ酸出現頻度情報DBを以下の手順1〜手順3により作成する。
(手順1)蛋白質立体構造DBや論文DBなどに基づいて、抗体のエピトープ部位の配列DBを作成する。
(手順2)蛋白質のアミノ酸配列DBを作成する。
(手順3)2つのDBで各アミノ酸の出現確率を計算し、その比を求めエピトープ部位アミノ酸出現頻度情報DBに登録する。ここで、図12は、エピトープ部位アミノ酸出現頻度情報DBに登録された情報の一例を示している。図12において、左からアミノ酸種類、蛋白質のアミノ酸配列DBにおける当該アミノ酸の出現頻度、エピトープ部位の配列DBにおける当該アミノ酸の出現頻度、蛋白質のアミノ酸配列DBにおける当該アミノ酸の出現頻度とエピトープ部位の配列DBにおける当該アミノ酸の出現頻度との比を示している。
【0098】
(2)処理対象の抗原配列を入力
【0099】
(3)i番目のアミノ酸の前後n残基の平均アミノ酸出現確率をスコアK(i)にする。
【0100】
(4)処理結果を出力する。
【0101】
IV.統合評価関数の作成
上述したように、i番目のサイトにおける、
I)2次構造予測結果を用いたSVMによるエピトープ部位予測のパラメータS(i)、
II)オリゴペプチド頻度情報を用いたエピトープ部位予測のパラメータO(i)、
III)エピトープ部位アミノ酸頻度情報を用いたエピトープ部位予測のパラメータK(i)、
の計算手法を挙げたが、ここでは、これらの結果を総合的に判断し、最終的にそれぞれのサイトがエピトープ部位となりうるかどうかの予測結果を同定する。例えば、統合評価関数として、それぞれのサイトにおける評価の線形和が閾値以上であればそのサイトをエピトープとして予測する。
【0102】
例えば、s、o、k、thresholdを判断用のパラメータ(定数)とした、以下の統合評価関数pe(i)を用いる。
pe(i) = s×S(i)+o×O(i)+k×K(i)−threshold
【0103】
そして、この統合評価関数pe(i)を用いて、各サイトがエピトープ部位であるかを予測する(ステップSC−3)。
すなわち、この統合評価関数を用い、サイトiについて、
pe(i) > 0
が成立している場合には、サイトiについてエピトープ部位であると予測する。
【0104】
これにて、エピトープ部位予測処理が終了する。
【0105】
[断片構造予測処理]
次に、ステップSB−3の断片構造予測処理の詳細について図4を参照して説明する。図4は、本発明の断片構造予測処理の一例を示すフローチャートである。
【0106】
まず、断片構造を予測する配列について、既知の構造データベース(例えば、PDBや、CDR領域やエピトープ構造に特化したデータベースなど)を検索して、対応する構造データが存在しているか確認する(ステップSD−1)。
【0107】
ステップSD−1において、対応する構造データが存在していない場合には、フラグメント構造予測を行う(ステップSD−2)。ここで、構造予測技術としては、既知の構造予測技術のいずれを用いてもよい。
【0108】
これにて、断片構造予測処理が終了する。
【0109】
再び図1に戻り、本発明は、処理対象の抗原と結合する設計対象の抗体についてCDR部位のCDR構造を既知のデータベースなどから検索して取得する。ここで、CDR構造が取得できない場合には、以下に示すように、抗体配列、抗体構造、部位配列などのうち少なくとも一つの情報に基づいて、CDR部位の構造を予測する(ステップSA−2)。
【0110】
[CDR構造予測処理]
ステップSA−2におけるCDR構造予測処理の詳細について図5を参照して説明する。図5は、本発明のCDR構造予測処理の一例を示すフローチャートである。
【0111】
まず、本発明は、抗体の配列情報の断片の特徴などに基づいて、CDR部位について分離する。すなわち、既知のCDR部位の特徴情報に基づいて、Light chain L1,L2,L3と、Heavy chain H1, H2,H3に対応する部位を抗体配列情報から分離して抽出する(ステップSE−1)。
【0112】
そして、図4において上述した断片構造予測処理を実行して、CDR部位の断片構造を予測する(ステップSE−2)。
【0113】
そして、予測された構造データをCDR構造データとして出力する(ステップSE−3)。
【0114】
これにて、CDR構造予測処理が終了する。
【0115】
再び図1に戻り、本発明は、抗原と抗体との複合体の構造を予測する(ステップSA−3)。
【0116】
[複合体構造予測処理]
ステップSA−3における複合体構造予測処理の詳細について図6を参照して説明する。図6は、本発明の複合体構造予測処理の一例を示すフローチャートである。
【0117】
本発明者の手法は、複合体DBと抗原(または抗体)情報を用いて抗原−抗体複合体構造を(相対的な位置関係も含めて)同時抽出する。ドッキング・シミュレーション等によるそれぞれの構造の位置関係最適化は不要となる。
【0118】
まず、本発明は、抗原と抗体との複合体の構造を既知のデータベースなどから検索して取得する。ここで、複合体構造が取得できない場合には、以下に示すように、複合体の構造を予測する(ステップSF−1)。
【0119】
本発明の複合体構造の予測は、以下のエピトープ‐CDRコンタクト・データベース(ECDB)を用いる。
【0120】
ここで、ECDBは、以下のデータを要素として持つ。
1.複合体ID(エピトープとCDRの複合体の全体のID)
2.エピトープ断片パターンID(エピトープ断片が何残基あるか、全エピトープ中何番目の断片かという情報)
3.エピトープ配列
4.エピトープ構造
5.CDR配列
6.CDR構造
7.エピトープ‐CDR間相対的位置関係
8.エピトープ‐CDR結合関係
【0121】
以下にECDBを用いた複合体構造予測の手順を説明する。
まず、ECDB中でエピトープ断片の類似配列、エピトープ断片パターン類似構造をもつデータを検索して、得点付けを実行する(ステップSF−2)。
【0122】
そして、得点の高いECDB中のエントリに対して、エピトープ‐CDR相対的位置関係と結合関係をできるだけ保つようにエピトープ、抗体(CDR)構造を当てはめ、複合体構造を作成する(ステップSF−3)。
【0123】
ここで、作られた複合体構造はDB中の構造を間接的に参照しているが、当然全く同じというわけではないので、構造中に矛盾点(例えば、座標の重なりなど)が発生する場合がある。
【0124】
そこで、そういった複合体構造における構造的不具合を排除する(ステップSF−4)。例えば、エピトープ‐CDR複合系においてエピトープ‐CDRのある原子間距離を計算し、それらが近すぎる場合には一方の(単独構造に対する影響が少ない方)原子の位置を矛盾がなくなるまで動かすなどの修正を加える。
【0125】
そして、予測された複合体構造データを出力する(ステップSF−5)。
【0126】
これにて、複合体構造予測処理が終了する。
【0127】
再び図1に戻り、本発明は、ステップSA−3において取得された複合体構造データを最適化する(ステップSA−4)。すなわち、ステップSA−3により得られた複合体構造は、上述した処理により構造的には矛盾が無い状態となっている。しかし、エネルギー的にはその限りではない。そこで、以降の処理でアフィニティを計算する際にはエネルギー的安定性がない状態では問題が生じるので、エネルギーの最適化を行う必要がある。
【0128】
[構造最適化処理]
ステップSA−4における構造最適化処理の詳細について図7を参照して説明する。図7は、本発明の構造最適化処理の一例を示すフローチャートである。
【0129】
まず、複合体構造データに対して各種のエネルギー指標に関するエネルギー計算を実行する(ステップSG−1)。ここで、コンタクトポテンシャル、統計ポテンシャル、力場計算、量子化学計算のいずれか、または、それらの組み合わせを用いてもよい。
【0130】
そして、ステップSG−1で計算された各種のエネルギー計算結果を評価する(ステップSG−2)。ここで、コンタクトポテンシャル、統計ポテンシャル、力場計算、量子化学計算のいずれか、または、それらの組み合わせによるエネルギー最適化による構造変化は、使用するエネルギー指標の評価関数や評価手法により変化の大きさや方向が異なることになる。
【0131】
そして、全体エネルギーが最適化されたか判断し(ステップSG−3)、最適化されていない場合には、再度ステップSG−1に戻る。一方、最適化されている場合には、最適化された構造データを出力する(ステップSG−4)。
【0132】
これにて、構造最適化処理が終了する。
【0133】
再び図1に戻り、本発明は、最適化された複合体構造に基づいてアフィニティ計算処理を実行する(ステップSA−5)。
【0134】
[アフィニティ計算処理]
次に、ステップSA−5におけるアフィニティ計算処理の詳細について図8を参照して説明する。図8は、本発明のアフィニティ計算処理の一例を示すフローチャートである。
【0135】
まず、複合体構造について、配列−構造の相関(配列空間の近傍において、どれくらい構造が収束しているか)を計算する(ステップSH−1)。例えば、ある配列の配列空間上近傍にある配列の取りうる構造をある解像度でクラスタリングしたときのクラスター数を配列−構造相関の指標とすることができる。
【0136】
そして、あるサイトにおけるこの配列−(主鎖)構造相関の大きさを計算し、その大きさに応じて側鎖のロータマー揺らぎの大きさを計算して決定する(ステップSH−2)。
【0137】
ここで、主鎖の揺らぎに対応して側鎖の揺らぎの大きさを決定してもよく、また、より直接的に側鎖断片のデータベース(ロータマー・データベース)を作成し、そこからロータマー揺らぎを計算することも可能である。例えば二次構造と中心の残基種が同じ配列空間で近傍にある、数個からなる断片をデータベースから抽出する。抽出されたロータマー構造をクラスタリングし、クラスター数を配列−側鎖構造相関の指標とする。ここでは、各々のサイトにおける配列−構造相関の大きさ、クラスター情報(側鎖構造の組)が得られることとなる。
【0138】
そして、得られたロータマーの揺らぎの大きさ(または、側鎖の構造の組)に基づき、側鎖構造のサンプリングを行う。最も簡単には、クラスター化された側鎖構造の代表構造を、そのサイトでとり得る側鎖構造とすることで、構造−配列相関の大きさを考慮したサンプリングができる。
【0139】
そして、得られた各々のサイトにおける側鎖構造の自由度を元に主鎖と側鎖を含めた複合体構造を作成する(ステップSH−3)。基本的にはランダムに作成することとなるが、できるだけ構造間に矛盾(座標の重なりなど)が無いように設計する。ここでさらに大まかな構造最適化を行っても良い。
【0140】
そして、アフィニティ計算を実行する(ステップSH−4)。ここで、アフィニティ計算は大きく分けて以下の2つの方法がある
【0141】
(1)複合体と単体のエネルギー差より評価
アフィニティは、数式1に示すように、複合体と単体の自由エネルギーの差を計算することで求められる。
アフィニティ=G(AB)−(G(A)+G(B))・・・(数式1)
数式1において、G(A)は単体Aの自由エネルギー、G(B)は単体Bの自由エネルギー、G(AB)はAとBの複合体の自由エネルギーである。
また、数式2に示すように、静電的相互作用、疎水的相互作用に分離してもよい。
アフィニティ=E(AB)−(E(A)+E(B))+ΔG(疎水相互作用)・・・(数式2)
数式1において自由エネルギーGは近似的に様々な方法で求めることができるが、与えられた情報、計算時間、求められる精度によって方法を使いわけることができる。一例を挙げると統計ポテンシャル、分子力学、量子化学には図13に示すような特徴がある。
【0142】
例えば、非常に多くの候補から相互作用する抗体を複数個探すような場合は統計ポテンシャルのような方法が計算時間の点で優れていると言える。反対に、数個の候補のなかから最もアフィニティが高いものを選ぶという場合は量子化学計算のような精度の高い方法が優れていると言える。本発明ではこれらの手法を適宜自動的に選択するので、それぞれ設計時に最も好適な手法を用いることができるようになる。
【0143】
(2)コンタクトポテンシャルより評価
アフィニティを計算するもう1つの方法は、数式3に示すように、コンタクトポテンシャル(contact potential)を用いるものである。
アフィニティi=ΣPi(aa1,aa2,r) ・・・(数式3)
数式3において、aa1とaa2は接触しているアミノ酸ペア、rは残基間距離である。また、Piはアミノ酸の種類と残基間距離のポテンシャル関数である。この方法は極めて短時間でアフィニティを評価できるという利点がある
【0144】
そして、このように計算された各々の構造におけるアフィニティに対して平均、分散などの統計計算を行う(ステップSH−5)。
【0145】
そして、計算されたアフィニティデータを出力する(ステップSH−6)。
【0146】
これにて、アフィニティ計算処理が終了する。
【0147】
再び図1に戻り、本発明は、ステップSA−5のアフィニティ計算処理において出力されたアフィニティデータを評価するためのアフィニティデータ評価処理を実行する(ステップSA−6)。
【0148】
[アフィニティ評価処理]
次に、アフィニティ評価処理の詳細について図9を参照して説明する。図9は、本発明のアフィニティ評価処理の一例を示すフローチャートである。
【0149】
ここでは、計算されたアフィニティの平均値、分散値のデータを評価する。計算されたアフィニティ平均値am、アフィニティ分散値avに基づいて、他の複合体のアフィニティと比較してミューテーション前のCDRのアフィニティよりも良くなっているかどうかを評価する。
【0150】
そして、アフィニティ平均値amがより大きく、分散値avがより小さければアフィニティの評価が高くなるようにアフィニティ評価関数を設定する(ステップSI−1)。例えば評価関数として、f=a×am−b×sqrt(av)等を用いることができる。ここで、a、bは定数パラメータである。
【0151】
そして、アフィニティデータベースを検索し(ステップSI−2)、以前に処理したアフィニティ評価関数の値より高くなっているかを判定する(ステップSI−3)。
【0152】
次ステップへの移行は、例えば、前の抗体構造よりもアフィニティ評価関数がより良くなっていれば(一番良い場合にはベストアフィニティデータとして)保存し次ステップへ進み(ステップSI−4)、一方、悪くなっていればある確率でこの計算データを破棄し、以前のデータについて次のステップへ行く(ステップSI−5)、というモンテ−カルロ(Monte−Carlo)的手法を用いても良い。
【0153】
これにて、アフィニティ評価処理が終了する。
【0154】
再び図1に戻り、本発明は、処理対象のCDR配列情報について、ミューテーション(例えば、点突然変異など)を行う(ステップSA−7)。
ミューテーションは、遺伝的アルゴリズムなどの手法を用いてランダムに、あるいはアフィニティ評価に基づいて行われる。すなわち、アフィニティ平均値減少に寄与したロータマー揺らぎ構造をもつアミノ酸を重点的に変異させてもよい。
【0155】
そして、変異されたCDR部位のCDR構造に基づいて、ステップSA−2に戻り、変異後のCDR構造を予測した後、ステップSA−3の複合体構造予測処理により変異後の複合体構造データを予測し、当該変異後の複合体構造データについてステップSA−5のアフィニティ計算処理により変異後のアフィニティを計算し、ステップSA−6アフィニティ評価処理により当該変異後のアフィニティの評価を行い、変異前後のアフィニティの評価結果を比較することにより、抗原とアフィニティの高い抗体を設計する。
【0156】
[システム構成]
次に、本システムの構成について説明する。図14は、本発明が適用される本システムの構成の一例を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。本システムは、概略的に、抗体設計装置100と、配列情報や構造情報等に関する外部データベースやホモロジー検索等の外部プログラム等を提供する外部システム200とを、ネットワーク300を介して通信可能に接続して構成されている。
【0157】
図14においてネットワーク300は、抗体設計装置100と外部システム200とを相互に接続する機能を有し、例えば、インターネット等である。
【0158】
図14において外部システム200は、ネットワーク300を介して、抗体設計装置100と相互に接続され、利用者に対して配列情報や構造情報等に関する外部データベースやホモロジー検索やモチーフ検索等の外部プログラムを実行するウェブサイトを提供する機能を有する。
【0159】
ここで、外部システム200は、WEBサーバやASPサーバ等として構成してもよく、そのハードウェア構成は、一般に市販されるワークステーション、パーソナルコンピュータ等の情報処理装置およびその付属装置により構成してもよい。また、外部システム200の各機能は、外部システム200のハードウェア構成中のCPU、ディスク装置、メモリ装置、入力装置、出力装置、通信制御装置等およびそれらを制御するプログラム等により実現される。
【0160】
図14において抗体設計装置100は、概略的に、抗体設計装置100の全体を統括的に制御するCPU等の制御部102、通信回線等に接続されるルータ等の通信装置(図示せず)に接続される通信制御インターフェース部104、入力装置112や出力装置114に接続される入出力制御インターフェース部108、および、各種のデータベースやテーブルなどを格納する記憶部106を備えて構成されており、これら各部は任意の通信路を介して通信可能に接続されている。さらに、この抗体設計装置100は、ルータ等の通信装置および専用線等の有線または無線の通信回線を介して、ネットワーク300に通信可能に接続されている。
【0161】
記憶部106に格納される各種のデータベースやテーブル(入力データファイル106a〜ロータマーデータベース106j)は、固定ディスク装置等のストレージ手段であり、各種処理に用いる各種のプログラムやテーブルやファイルやデータベースやウェブページ用ファイル等を格納する。
【0162】
これら記憶部106の各構成要素のうち、入力データファイル106aは、入力データを格納する入力データ格納手段である。この入力データファイル106aに格納される情報は、抗原に対する情報として、1)抗原配列、2)抗原配列や構造情報、3)エピトープ部位配列、4)エピトープ部位配列、構造情報、のうち少なくとも一つを含む。また、抗体に関する情報として、1)抗体配列、2)抗体配列、構造、3)CDR部位配列、4)CDR部位配列、構造情報、のうち少なくとも一つを含む。
【0163】
また、エピトープ情報データベース106bは、エピトープの配列情報や構造情報に関するエピトープ情報等を格納するエピトープ情報格納手段である。
【0164】
また、CDR情報データベース106cは、CDRの配列情報や構造情報に関するCDR情報等を格納するCDR情報格納手段である。
【0165】
また、複合体情報データベース106dは、エピトープ構造とCDR構造との複合体に関する情報等を格納する複合体情報格納手段である。
【0166】
また、2次構造予測結果データファイル106eは、2次構造予測プログラムによる2次構造予測結果に関する情報等を格納する2次構造予測結果情報格納手段である。この2次構造予測結果データファイル106eに格納される情報は、予測プログラム(予測手段)などを一意に識別するための識別情報、配列情報、予測結果等を相互に関連付けて構成されている。
【0167】
また、オリゴペプチド頻度情報データベース106fは、タンパク質配列におけるオリゴペプチドの出現頻度に関する情報等を格納するオリゴペプチド頻度情報格納手段である。このオリゴペプチド頻度情報データベース106fに格納される情報は、オリゴペプチドの配列情報、出現頻度等を相互に関連付けて構成されている。
【0168】
また、エピトープ部位アミノ酸頻度情報ファイル106gは、エピトープ部位のアミノ酸の出現頻度に関する情報等を格納するエピトープ部位アミノ酸頻度情報格納手段である。このエピトープ部位アミノ酸頻度情報ファイル106gに格納される情報は、アミノ酸種別、出現頻度等を相互に関連付けて構成されている。
【0169】
また、ECデータベース106hは、のエピトープ‐CDRコンタクト・データベース(ECDB)である。このECデータベース106hに格納される情報は、複合体ID(エピトープとCDRの複合体の全体のID)、エピトープ断片パターンID(エピトープ断片が何残基あるか、全エピトープ中何番目の断片かという情報)、エピトープ配列、エピトープ構造、CDR配列、CDR構造、エピトープ‐CDR間相対的位置関係、エピトープ‐CDR結合関係、等を相互に関連付けて構成されている。
【0170】
また、アフィニティデータベース106iは、抗体と抗原とのアフィニティに関する情報等を格納する格納手段である。このアフィニティデータベース106iに格納される情報は、抗体配列、アフィニティデータ、アフィニティ評価関数の値等を相互に関連付けて構成されている。
【0171】
また、ロータマーデータベース106jは、ロータマーに関する情報等を格納するロータマー情報格納手段である。このロータマーデータベース106jに格納される情報は、ロータマー構造(側鎖断片の構造を含む)、配列情報、ロータマー揺らぎの大きさ(自由度)、ロータマー構造(側鎖断片の構造を含む)のクラスタリング結果等を相互に関連付けて構成されている。
【0172】
また、その他の情報として、抗体設計装置100の記憶部106には、ウェブサイトを外部システム200に提供するための各種のWebデータやCGIプログラム等が記録されている。
【0173】
このWebデータとしては、後述する各種のWebページを表示するためのデータ等があり、これらデータは、例えば、HTMLやXMLにて記述されたテキストファイルとして形成されている。また、これらのWebデータを作成するための部品用のファイルや作業用のファイルやその他一時的なファイル等も記憶部106に記憶される。
【0174】
この他、必要に応じて、外部システム200に送信するための音声をWAVE形式やAIFF形式の如き音声ファイルで格納したり、静止画や動画をJPEG形式やMPEG2形式の如き画像ファイルで格納したりすることができる。
【0175】
また、図14において、通信制御インターフェース部104は、抗体設計装置100とネットワーク300(またはルータ等の通信装置)との間における通信制御を行う。すなわち、通信制御インターフェース部104は、他の端末と通信回線を介してデータを通信する機能を有する。
【0176】
また、図14において、入出力制御インターフェース部108は、入力装置112や出力装置114の制御を行う。ここで、出力装置114としては、モニタ(家庭用テレビを含む)の他、スピーカを用いることができる(なお、以下においては出力装置114をモニタとして記載する場合がある)。また、入力装置112としては、キーボード、マウス、および、マイク等を用いることができる。また、モニタも、マウスと協働してポインティングデバイス機能を実現する。
【0177】
また、図14において、制御部102は、OS(Operating System)等の制御プログラム、各種の処理手順等を規定したプログラム、および所要データを格納するための内部メモリを有し、これらのプログラム等により、種々の処理を実行するための情報処理を行う。制御部102は、機能概念的に、複合体構造予測部102a、アフィニティ計算部102b、アフィニティ評価部102c、および、CDR配列ミューテーション部102dを備えて構成されている。
【0178】
このうち、複合体構造予測部102aは、抗原のエピトープ部位のエピトープ構造と、当該抗原に結合する抗体のCDR部位のCDR構造の複合体構造データを予測する複合体構造予測手段である。ここで、図15は、複合体構造予測部102aの構成の一例を示すブロック図である。図15に示すように複合体構造予測部102aは、エピトープ構造予測部102e、CDR構造予測部102f、類似データ得点化部102g、複合体構造作成部102h、ロータマー自由度計算部102i、ロータマー自由度反映構造作成部102j、構造最適化部102k、および、断片構造予測部102mを含んで構成されている。
【0179】
図15のエピトープ構造予測部102eは、エピトープ構造を予測するエピトープ構造予測手段であり、また、2次構造予測結果を用いたSVMによるエピトープ部位予測のパラメータS(i)、オリゴペプチド頻度情報を用いたエピトープ部位予測のパラメータO(i)、エピトープ部位アミノ酸頻度情報を用いたエピトープ部位予測のパラメータK(i)の少なくとも一つに基づいて抗原のエピトープ部位を予測するエピトープ部位予測手である。
【0180】
また、CDR構造予測部102fは、CDR配列に基づいてCDR構造を予測するCDR構造予測手段である。
【0181】
また、類似データ得点化部102gは、エピトープ断片の類似配列および/またはエピトープ断片パターンの類似構造を持つ類似データを検索して得点を付ける類似データ得点化手段である。
【0182】
また、複合体構造作成部102hは、類似データ得点化手段により高い得点が付されたデータの構造データを雛型として、エピトープ‐CDR相対的位置関係および/またはエピトープ‐CDR結合関係をできるだけ保持するように複合体構造を作成する複合体構造作成手段である。
【0183】
また、ロータマー自由度計算部102iは、配列と構造との間の相関の大きさを計算する相関計算手段、および、相関計算手段により計算された相関の大きさに応じて側鎖のロータマーの揺らぎの大きさを示す自由度を計算するロータマー自由度計算手段である。
【0184】
また、ロータマー自由度反映構造作成部102jは、ロータマー自由度計算手段により計算された側鎖構造の自由度に基づいて、主鎖と側鎖を含めた複合体構造を作成するロータマー自由度反映構造作成手段である。
【0185】
また、構造最適化部102kは、複合体構造を最適化する構造最適化手段である。
【0186】
また、断片構造予測部102mは、部分配列から該当するフラグメント構造を予測する断片構造予測手段である。
【0187】
再び図14に戻り、アフィニティ計算部102bは、複合体構造予測手段により予測された上記複合体構造データについて、エピトープ構造とCDR構造との間のアフィニティを計算するアフィニティ計算手段である。ここで、図16は、アフィニティ計算部102bの構成の一例を示すブロック図である。図16に示すように、アフィニティ計算部102bは、自由エネルギー計算部102pおよびコンタクトポテンシャル計算部102qを含んで構成される。
【0188】
図16において、自由エネルギー計算部102pは、複合体と単体の自由エネルギーの差により上記アフィニティを計算する自由エネルギー計算手段である。
【0189】
また、コンタクトポテンシャル計算部102qは、コンタクトポテンシャルにより上記アフィニティを計算するコンタクトポテンシャル計算手段である。
【0190】
再び図14に戻り、アフィニティ評価部102cは、アフィニティ計算手段により計算された上記アフィニティを評価するアフィニティ評価手段である。ここで、図17は、アフィニティ評価部102cの構成の一例を示すブロック図である。図17に示すように、アフィニティ評価部102cは、アフィニティ評価関数設定部102rを含んで構成される。
【0191】
図17において、アフィニティ評価関数設定部102rは、アフィニティの平均値および分散値に基づいてアフィニティ評価関数を設定するアフィニティ評価関数設定手段である。
【0192】
再び図14に戻り、CDR配列ミューテーション部102dは、CDR部位の配列の一部についてミューテーションを行うCDR配列ミューテーション手段である。ここで、図18は、CDR配列ミューテーション部102dの構成の一例を示すブロック図である。図18に示すように、CDR配列ミューテーション部102dは、ミューテーション位置決定部102sを含んで構成される。
【0193】
図18において、ミューテーション位置決定部102sは、CDR部位のミューテーションさせる位置を、ランダムに、または、アフィニティ評価に基づいて決定するミューテーション位置決定手段である。
【0194】
なお、これら各部によって行なわれる処理の詳細については、後述する。
【0195】
[システムの処理]
次に、このように構成された本実施の形態における本システムの処理の一例について、以下に再び図1〜図18を参照して詳細に説明する。
【0196】
図1に示すように、まず、抗体設計装置100は、エピトープ構造予測部102eの処理により、入力データファイル106aに格納された入力データ中にエピトープ構造が存在しない場合には、利用者が入力した抗原についてエピトープ部位の構造を既知のデータベースなどから検索して取得する。ここで、エピトープ構造が取得できない場合には、エピトープ構造予測部102eは、以下に示すように、抗原配列、抗原構造、エピトープ部位配列などのうち少なくとも一つの情報に基づいて、エピトープ部位の構造を予測する(ステップSA−1)。
【0197】
[エピトープ構造予測処理]
ステップSA−1のエピトープ構造予測処理の詳細について図2を参照して説明する。図2は、本発明のエピトープ構造予測処理の一例を示すフローチャートである。
【0198】
まず、エピトープ構造予測部102eは、既知の抗体情報データベースなどを参照して、処理対象の抗原のエピトープ部位情報が存在するか確認する(ステップSB−1)。
【0199】
ステップSB−1において、エピトープ部位情報が存在しない場合には、エピトープ構造予測部102eは、以下に示すエピトープ部位予測処理を実行して、抗体配列情報からエピトープ部位を予測する(ステップSB−2)。
【0200】
そして、エピトープ構造予測部102eは、既知の抗体情報データベースから取得、または、エピトープ部位予測処理により予測されたエピトープ部位の配列情報について、以下に示す断片構造予測処理を実行する(ステップSB−3)。
【0201】
そして、エピトープ構造予測部102eは、予測されたエピトープ部位の構造データをエピトープ構造データとして出力する(ステップSB−4)。
【0202】
これにて、エピトープ構造予測処理が終了する。
【0203】
[エピトープ部位予測処理]
ステップSB−2のエピトープ部位予測処理の詳細について図3を参照して説明する。図3は、本発明のエピトープ部位予測処理の一例を示すフローチャートである。
【0204】
エピトープ構造予測部102eは、エピトープ部位を予測するためのパラメータとして、2次構造予測結果データ、オリゴペプチド頻度情報、抗原・抗体アミノ酸頻度情報のうち少なくとも1つのパラメータを取得する(ステップSC−1)。
【0205】
そして、エピトープ構造予測部102eは、これらの各パラメータからエピトープ部位を判定するための統合評価関数を作成する(ステップSC−2)。
【0206】
以下に、I.2次構造予測結果データ、II.オリゴペプチド頻度情報、III.エピトープ部位アミノ酸頻度情報のそれぞれのパラメータに基づいて、IV.エピトープ部位を判定するための統合評価関数を作成する場合について、順に詳細に説明する。
【0207】
I.2次構造予測結果データからエピトープ可能性部位を予測する場合
(1)まず、エピトープ構造予測部102eは、以下の手順1〜手順4により、各2次構造予測プログラムの処理結果から上述したSVM(サポート・ベクトル・マシーン)学習データを作成する。
【0208】
(2)エピトープ構造予測部102eは、処理対象の抗原配列を入力する。
【0209】
(3)エピトープ構造予測部102eは、処理対象の抗原配列に対して、各2次構造予測手段の手法を用いて2次構造予測を行う。
【0210】
(4)エピトープ構造予測部102eは、サイトごとの二次構造結果のパターンを、予めSVM学習を行い保存しておいたSVM学習データに入力する。
【0211】
(5)エピトープ構造予測部102eは、SVMにより、エピトープ部位の可能性を示すパラメータS(i)を出力する。
【0212】
II.オリゴペプチドの出現頻度からエピトープ可能性部位を予測する場合
(1)まず、エピトープ構造予測部102eは、上述した手順により、オリゴペプチド頻度情報データベースを作成する。
【0213】
(2)エピトープ構造予測部102eは、処理対象の抗原配列を入力する。
【0214】
(3)エピトープ構造予測部102eは、処理対象の抗原配列をn残基のオリゴペプチドに分割する。
【0215】
(4)エピトープ構造予測部102eは、i番目を含むオリゴペプチドの出現確率の平均をi番目のスコアO(i)にする。
【0216】
(5)エピトープ構造予測部102eは、処理結果を出力する。
【0217】
III.エピトープ部位アミノ酸頻度情報からエピトープ可能性部位を予測する場合
(1)エピトープ構造予測部102eは、上述した手順により、エピトープ部位アミノ酸出現頻度情報DBを作成する。
【0218】
(2)エピトープ構造予測部102eは、処理対象の抗原配列を入力
【0219】
(3)エピトープ構造予測部102eは、i番目のアミノ酸の前後n残基の平均アミノ酸出現確率をスコアK(i)にする。
【0220】
(4)エピトープ構造予測部102eは、処理結果を出力する。
【0221】
IV.統合評価関数の作成
上述したように、i番目のサイトにおける
1)2次構造予測結果を用いたSVMによるエピトープ部位予測のパラメータS(i)、
2)オリゴペプチド頻度情報を用いたエピトープ部位予測のパラメータO(i)、
3)エピトープ部位アミノ酸頻度情報を用いたエピトープ部位予測のパラメータK(i)、
の計算手法を挙げたが、ここでは、これらの結果を総合的に判断し、最終的にそれぞれのサイトがエピトープ部位となりうるかどうかの予測結果を同定する。例えば、エピトープ構造予測部102eは、統合評価関数として、それぞれのサイトにおける評価の線形和が閾値以上であればそのサイトをエピトープとして予測する。
【0222】
例えば、エピトープ構造予測部102eは、s、o、k、thresholdを判断用のパラメータ(定数)とした、以下の統合評価関数pe(i)を用いる。
pe(i) = s×S(i)+o×O(i)+k×K(i)−threshold
【0223】
そして、エピトープ構造予測部102eは、この統合評価関数pe(i)を用いて、各サイトがエピトープ部位であるかを予測する(ステップSC−3)。
すなわち、エピトープ構造予測部102eは、この統合評価関数を用い、サイトiについて、
pe(i) > 0
が成立している場合には、サイトiについてエピトープ部位であると予測する。
【0224】
これにて、エピトープ部位予測処理が終了する。
【0225】
[断片構造予測処理]
次に、ステップSB−3の断片構造予測処理の詳細について図4を参照して説明する。図4は、本発明の断片構造予測処理の一例を示すフローチャートである。
【0226】
まず、断片構造予測部102mは、断片構造を予測する配列について、既知の構造データベース(例えば、PDBや、CDR領域やエピトープ構造に特化したデータベースなど)を検索して、対応する構造データが存在しているか確認する(ステップSD−1)。
【0227】
ステップSD−1において、対応する構造データが存在していない場合には、断片構造予測部102mは、フラグメント構造予測を行う(ステップSD−2)。ここで、構造予測技術としては、既知の構造予測技術のいずれを用いてもよい。
【0228】
これにて、断片構造予測処理が終了する。
【0229】
再び図1に戻り、抗体設計装置100は、入力データファイル106aに格納された入力データ中に対応するCDR構造がない場合には、CDR構造予測部102fの処理により、処理対象の抗原と結合する設計対象の抗体についてCDR部位のCDR構造を既知のデータベースなどから検索して取得する。ここで、CDR構造が取得できない場合には、CDR構造予測部102fは、以下に示すように、抗体配列、抗体構造、部位配列などのうち少なくとも一つの情報に基づいて、CDR部位の構造を予測する(ステップSA−2)。
【0230】
[CDR構造予測処理]
ステップSA−2におけるCDR構造予測処理の詳細について図5を参照して説明する。図5は、本発明のCDR構造予測処理の一例を示すフローチャートである。
【0231】
まず、CDR構造予測部102fは、抗体の配列情報の断片の特徴などに基づいて、CDR部位について分離する。すなわち、CDR構造予測部102fは、既知のCDR部位の特徴情報に基づいて、Light chain L1,L2,L3と、Heavy chain H1,H2,H3に対応する部位を抗体配列情報から分離して抽出する(ステップSE−1)。
【0232】
そして、図4において上述した断片構造予測処理を実行して、CDR部位の断片構造を予測する(ステップSE−2)。
【0233】
そして、CDR構造予測部102fは、予測された構造データをCDR構造データとして出力する(ステップSE−3)。
【0234】
これにて、CDR構造予測処理が終了する。
【0235】
再び図1に戻り、抗体設計装置100は、複合体構造予測部102aの処理により、抗原のエピトープ構造と抗体のCDR構造との複合体の構造を予測する(ステップSA−3)。
【0236】
[複合体構造予測処理]
ステップSA−3における複合体構造予測処理の詳細について図6を参照して説明する。図6は、本発明の複合体構造予測処理の一例を示すフローチャートである。
【0237】
まず、複合体構造予測部102aは、抗原と抗体との複合体の構造を既知のデータベースなどから検索して取得する。ここで、複合体構造が取得できない場合には、複合体構造予測部102aは、以下に示すように、複合体の構造を予測する(ステップSF−1)。
まず、類似データ得点化部102gは、ECデータベース106h中でエピトープ断片の類似配列、エピトープ断片パターン類似構造をもつデータを検索して、得点付けを実行する(ステップSF−2)。
【0238】
そして、複合体構造作成部102hは、得点の高いECデータベース106h中のエントリに対して、エピトープ‐CDR相対的位置関係と結合関係をできるだけ保つようにエピトープ、抗体(CDR)構造を当てはめ、複合体構造を作成する(ステップSF−3)。
【0239】
ここで、作られた複合体構造はDB中の構造を間接的に参照しているが、当然全く同じというわけではないので、構造中に矛盾点(例えば、座標の重なりなど)が発生する場合がある。
【0240】
そこで、複合体構造予測部102aは、そういった複合体構造における構造的不具合を排除する(ステップSF−4)。例えば、複合体構造予測部102aは、エピトープ‐CDR複合系においてエピトープ‐CDRのある原子間距離を計算し、それらが近すぎる場合には一方の(単独構造に対する影響が少ない方)原子の位置を矛盾がなくなるまで動かすなどの修正を加える。
【0241】
そして、複合体構造予測部102aは、予測された複合体構造データを出力する(ステップSF−5)。
【0242】
これにて、複合体構造予測処理が終了する。
【0243】
再び図1に戻り、抗体設計装置100は、構造最適化部102kの処理により、ステップSA−3において取得された複合体構造データを最適化する(ステップSA−4)。すなわち、ステップSA−3により得られた複合体構造は、上述した処理により構造的には矛盾が無い状態となっている。しかし、エネルギー的にはその限りではない。そこで、以降の処理でアフィニティを計算する際にはエネルギー的安定性がない状態では問題が生じるので、エネルギーの最適化を行う必要がある。
【0244】
[構造最適化処理]
ステップSA−4における構造最適化処理の詳細について図7を参照して説明する。図7は、本発明の構造最適化処理の一例を示すフローチャートである。
【0245】
まず、構造最適化部102kは、複合体構造データに対して各種のエネルギー指標に関するエネルギー計算を実行する(ステップSG−1)。ここで、構造最適化部102kは、コンタクトポテンシャル、統計ポテンシャル、力場計算、量子化学計算のいずれか、または、それらの組み合わせを用いてもよい。
【0246】
そして、構造最適化部102kは、ステップSG−1で計算された各種のエネルギー計算結果を評価する(ステップSG−2)。ここで、コンタクトポテンシャル、統計ポテンシャル、力場計算、量子化学計算のいずれか、または、それらの組み合わせによるエネルギー最適化による構造変化は、使用するエネルギー指標の評価関数や評価手法により変化の大きさや方向が異なることになる。
【0247】
そして、構造最適化部102kは、全体エネルギーが最適化されたか判断し(ステップSG−3)、最適化されていない場合には、再度ステップSG−1に戻る。一方、最適化されている場合には、構造最適化部102kは、最適化された構造データを出力する(ステップSG−4)。
【0248】
これにて、構造最適化処理が終了する。
【0249】
再び図1に戻り、抗体設計装置100は、アフィニティ計算部102bの処理により、最適化された複合体構造に基づいてアフィニティ計算処理を実行する(ステップSA−5)。
【0250】
[アフィニティ計算処理]
次に、ステップSA−5におけるアフィニティ計算処理の詳細について図8を参照して説明する。図8は、本発明のアフィニティ計算処理の一例を示すフローチャートである。
【0251】
まず、ロータマー自由度計算部102iは、複合体構造について、配列−構造の相関(配列空間の近傍において、どれくらい構造が収束しているか)を計算する(ステップSH−1)。例えば、ある配列の配列空間上近傍にある配列の取りうる構造をある解像度でクラスタリングしたときのクラスター数を配列−構造相関の指標とすることができる。
【0252】
そして、ロータマー自由度計算部102iは、あるサイトにおけるこの配列−(主鎖)構造相関の大きさを計算し、その大きさに応じて側鎖のロータマー揺らぎの大きさを計算して決定する(ステップSH−2)。
【0253】
ここで、ロータマー自由度計算部102iは、主鎖の揺らぎに対応して側鎖の揺らぎの大きさを決定してもよく、また、より直接的に側鎖断片のデータベース(ロータマー・データベース)を作成し、そこからロータマー揺らぎを計算することも可能である。例えば、ロータマー自由度計算部102iは、二次構造と中心の残基種が同じ配列空間で近傍にある、数個からなる断片をデータベースから抽出する。ロータマー自由度計算部102iは、抽出されたロータマー構造をクラスタリングし、クラスター数を配列−側鎖構造相関の指標とする。ここでは、各々のサイトにおける配列−構造相関の大きさ、クラスター情報(側鎖構造の組)が得られることとなる。
【0254】
そして、ロータマー自由度反映構造作成部102jは、得られたロータマーの揺らぎの大きさ(または、側鎖の構造の組)に基づき、側鎖構造のサンプリングを行う。最も簡単には、クラスター化された側鎖構造の代表構造を、そのサイトでとり得る側鎖構造とすることで、構造−配列相関の大きさを考慮したサンプリングができる。
【0255】
そして、ロータマー自由度反映構造作成部102jは、得られた各々のサイトにおける側鎖構造の自由度を元に主鎖と側鎖を含めた複合体構造を作成する(ステップSH−3)。ここで基本的にはランダムに作成することとなるが、できるだけ構造間に矛盾(座標の重なりなど)が無いように設計する。さらに、構造最適化部102kが構造最適化を行っても良い。
【0256】
そして、アフィニティ計算部102bは、アフィニティ計算を実行する(ステップSH−4)。
ここで、アフィニティ計算は大きく分けて以下の2つの方法がある
【0257】
(1)複合体と単体のエネルギー差より評価
アフィニティは、自由エネルギー計算部102pにより、数式1に示すように、複合体と単体の自由エネルギーの差を計算することで求められる。
アフィニティ=G(AB)−(G(A)+G(B))・・・(数式1)
数式1において、G(A)は単体Aの自由エネルギー、G(B)は単体Bの自由エネルギー、G(AB)はAとBの複合体の自由エネルギーである。
また、自由エネルギー計算部102pは、数式2に示すように、静電的相互作用、疎水的相互作用に分離してもよい。
アフィニティ=E(AB)−(E(A)+E(B))+ΔG(疎水相互作)・・・(数式2)
数式1において自由エネルギーGは近似的に様々な方法で求めることができるが、自由エネルギー計算部102pは、与えられた情報、計算時間、求められる精度によって、統計ポテンシャル、分子力学、量子化学のいずれかの手法を選択することができる。これにより、自由エネルギー計算部102pは、これらの手法を適宜自動的に選択するので、それぞれ設計時に最も好適な手法を用いることができるようになる。
【0258】
(2)コンタクトポテンシャルより評価
アフィニティを計算するもう1つの方法は、コンタクトポテンシャル計算部102qにより、数式3に示すように、コンタクトポテンシャル(contact
potential)を用いてもよい。
アフィニティi=ΣPi(aa1,aa2,r)・・・(数式3)
数式3において、aa1とaa2は接触しているアミノ酸ペア、rは残基間距離である。また、Piはアミノ酸の種類と残基間距離のポテンシャル関数である。この方法は極めて短時間でアフィニティを評価できるという利点がある
【0259】
そして、アフィニティ計算部102bは、このように計算された各々の構造におけるアフィニティに対して平均、分散などの統計計算を行う(ステップSH−5)。
【0260】
そして、アフィニティ計算部102bは、計算されたアフィニティデータを出力する(ステップSH−6)。
【0261】
これにて、アフィニティ計算処理が終了する。
【0262】
再び図1に戻り、抗体設計装置100は、アフィニティ評価部102cの処理により、ステップSA−5のアフィニティ計算処理において出力されたアフィニティデータを評価するためのアフィニティデータ評価処理を実行する(ステップSA−6)。
【0263】
[アフィニティ評価処理]
次に、アフィニティ評価処理の詳細について図9を参照して説明する。図9は、本発明のアフィニティ評価処理の一例を示すフローチャートである。
【0264】
ここでは、計算されたアフィニティの平均値、分散値のデータを評価する。すなわち、アフィニティ評価部102cは、計算されたアフィニティ平均値am、アフィニティ分散値avに基づいて、他の複合体のアフィニティと比較してミューテーション前のCDRのアフィニティよりも良くなっているかどうかを評価する。
【0265】
そして、アフィニティ評価関数設定部102rの処理により、アフィニティ平均値amがより大きく、分散値avがより小さければアフィニティの評価が高くなるようにアフィニティ評価関数を設定する(ステップSI−1)。例えば評価関数として、
f=a×am−b×sqrt(av)
等を用いることができる。ここで、a、bは定数パラメータである。
【0266】
そして、アフィニティ評価部102cは、アフィニティデータベースを検索し(ステップSI−2)、以前に処理したアフィニティ評価関数の値より高くなっているかを判定する(ステップSI−3)。
【0267】
次ステップへの移行は、例えば、アフィニティ評価関数がより良くなっていればベストアフィニティデータとして保存し次ステップへ進み(ステップSI−4)、一方、悪くなっていればある確率でこの計算データを破棄し、以前のデータについて次のステップへ行く(ステップSI−5)、というモンテ−カルロ(Monte−Carlo)的手法を用いても良い。
【0268】
これにて、アフィニティ評価処理が終了する。
【0269】
再び図1に戻り、抗体設計装置100は、CDR配列ミューテーション部102dの処理により、処理対象のCDR配列情報について、ミューテーション(例えば、点突然変異など)を行う(ステップSA−7)。
まず、ミューテーション位置決定部102sにより、ランダム、あるいは、アフィニティ評価に基づいてミューテーションの位置の決定が行われる。すなわち、ミューテーション位置決定部102sは、アフィニティ平均値減少に寄与したロータマー揺らぎ構造をもつアミノ酸を重点的に変異させてもよい。
【0270】
そして、変異されたCDR部位のCDR構造に基づいて、ステップSA−2に戻り、変異後のCDR構造を予測した後、ステップSA−3の複合体構造予測処理により変異後の複合体構造データを予測し、当該変異後の複合体構造データについてステップSA−5のアフィニティ計算処理により変異後のアフィニティを計算し、ステップSA−6アフィニティ評価処理により当該変異後のアフィニティの評価を行い、変異前後のアフィニティの評価結果を比較することにより、抗原とアフィニティの高い抗体を設計する。
【0271】
[他の実施の形態]
さて、これまで本発明の実施の形態について説明したが、本発明は、上述した実施の形態以外にも、上記特許請求の範囲に記載した技術的思想の範囲内において種々の異なる実施の形態にて実施されてよいものである。
【0272】
例えば、抗体設計装置100がスタンドアローンの形態で処理を行う場合を一例に説明したが、抗体設計装置100とは別筐体で構成されるクライアント端末からの要求に応じて処理を行い、その処理結果を当該クライアント端末に返却するように構成してもよい。
【0273】
また、実施形態において説明した各処理のうち、自動的に行なわれるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行なわれるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。
この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種の登録データや検索条件等のパラメータを含む情報、画面例、データベース構成については、特記する場合を除いて任意に変更することができる。
【0274】
また、抗体設計装置100に関して、図示の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。
例えば、抗体設計装置100の各部または各装置が備える処理機能、特に制御部102にて行なわれる各処理機能については、その全部または任意の一部を、CPU(Central Processing Unit)および当該CPUにて解釈実行されるプログラムにて実現することができ、あるいは、ワイヤードロジックによるハードウェアとして実現することも可能である。なお、プログラムは、後述する記録媒体に記録されており、必要に応じて抗体設計装置100に機械的に読み取られる。
【0275】
すなわち、ROMまたはHDなどの記憶部106などには、OS(Operating System)と協働してCPUに命令を与え、各種処理を行うためのコンピュータプログラムが記録されている。このコンピュータプログラムは、RAM等にロードされることによって実行され、CPUと協働して制御部102を構成する。また、このコンピュータプログラムは、抗体設計装置100に対して任意のネットワーク300を介して接続されたアプリケーションプログラムサーバに記録されてもよく、必要に応じてその全部または一部をダウンロードすることも可能である。
【0276】
また、本発明にかかるプログラムを、コンピュータ読み取り可能な記録媒体に格納することもできる。ここで、この「記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、EPROM、EEPROM、CD−ROM、MO、DVD等の任意の「可搬用の物理媒体」や、各種コンピュータシステムに内蔵されるROM、RAM、HD等の任意の「固定用の物理媒体」、あるいは、LAN、WAN、インターネットに代表されるネットワークを介してプログラムを送信する場合の通信回線や搬送波のように、短期にプログラムを保持する「通信媒体」を含むものとする。
【0277】
また、「プログラム」とは、任意の言語や記述方法にて記述されたデータ処理方法であり、ソースコードやバイナリコード等の形式を問わない。なお、「プログラム」は必ずしも単一的に構成されるものに限られず、複数のモジュールやライブラリとして分散構成されるものや、OS(Operating System)に代表される別個のプログラムと協働してその機能を達成するものをも含む。なお、実施の形態に示した各装置において記録媒体を読み取るための具体的な構成、読み取り手順、あるいは、読み取り後のインストール手順等については、周知の構成や手順を用いることができる。
【0278】
記憶部106に格納される各種のデータベース等(入力データファイル106a〜ロータマーデータベース106j)は、RAM、ROM等のメモリ装置、ハードディスク等の固定ディスク装置、フレキシブルディスク、光ディスク等のストレージ手段であり、各種処理やウェブサイト提供に用いる各種のプログラムやテーブルやファイルやデータベースやウェブページ用ファイル等を格納する。
【0279】
また、抗体設計装置100は、既知のパーソナルコンピュータ、ワークステーション等の情報処理端末等の情報処理装置にプリンタやモニタやイメージスキャナ等の周辺装置を接続し、該情報処理装置に本発明の方法を実現させるソフトウェア(プログラム、データ等を含む)を実装することにより実現してもよい。
【0280】
さらに、抗体設計装置100等の分散・統合の具体的形態は明細書および図面に示すものに限られず、その全部または一部を、各種の負荷等に応じた任意の単位で、機能的または物理的に分散・統合して構成することができる(例えば、グリッド・コンピューティングなど)。例えば、各データベースを独立したデータベース装置として独立に構成してもよく、また、処理の一部をCGI(Common Gateway Interface)を用いて実現してもよい。
【0281】
【発明の効果】
以上詳細に説明したように、本発明によれば、抗原のエピトープ部位のエピトープ構造と、当該抗原に結合する抗体のCDR部位のCDR構造の複合体構造データを予測し、予測された複合体構造データについて、エピトープ構造とCDR構造との間のアフィニティを計算し、計算されたアフィニティを評価し、CDR部位の配列の一部についてミューテーションを行う。そして、変異されたCDR部位のCDR構造に基づいて変異後の複合体構造データを予測し、当該変異後の複合体構造データについて変異後のアフィニティを計算し、当該変異後のアフィニティの評価を行い、変異前後のアフィニティの評価結果を比較することにより、抗原とアフィニティの高い抗体を設計することができる、抗体設計装置、抗体設計方法、プログラム、および、記録媒体を提供することができる。
【0282】
また、本発明によれば、従来技術のように抗体と抗原の全体構造を取得してドッキングシュミレーション技術などを用いて複合体を設定しアフィニティを計算する場合には、計算対象の系が巨大になることから、ハイスループットな計算機資源が必要となり、かつ計算時間が膨大にかかるという問題点があったが、本発明のように抗原のエピトープ構造と抗体のCDR構造のみについて複合体構造を設定する方式を採用することにより、精度を対する影響を少なくしつつ計算負担を軽減することができる抗体設計装置、抗体設計方法、プログラム、および、記録媒体を提供することができる。
【0283】
また、本発明によれば、エピトープ断片の類似配列および/またはエピトープ断片パターンの類似構造を持つ類似データを検索して得点を付け、高い得点が付されたデータの構造データを雛型として、エピトープ‐CDR相対的位置関係および/またはエピトープ‐CDR結合関係をできるだけ保持するように複合体構造を作成するので、既知の抗体−抗原の複合体構造データに基づいて新規の複合体構造を精度よく予測することができる抗体設計装置、抗体設計方法、プログラム、および、記録媒体を提供することができる。
【0284】
また、本発明によれば、配列と構造との間の相関の大きさを計算し、計算された相関の大きさに応じて側鎖のロータマーの揺らぎの大きさを示す自由度を計算し、計算された側鎖構造の自由度に基づいて、主鎖と側鎖を含めた複合体構造を作成するので、ロータマー揺らぎによる動的アフィニティ計算結果を反映することができ、より、現実のアフィニティ実測値に近い予測を行うことができる抗体設計装置、抗体設計方法、プログラム、および、記録媒体を提供することができる。
【0285】
また、本発明によれば、複合体と単体の自由エネルギーの差によりアフィニティを計算し、および/または、コンタクトポテンシャルによりアフィニティを計算するので、静電的相互作用、疎水的相互作用などのパラメータを、与えられた情報、計算時間、求められる精度によって統計ポテンシャル、分子力学、量子化学、コンタクトポテンシャルなどを使い分けて用いることができる抗体設計装置、抗体設計方法、プログラム、および、記録媒体を提供することができる。
【0286】
また、本発明によれば、アフィニティの平均値および分散値に基づいてアフィニティ評価関数を設定し、計算されたアフィニティをアフィニティ評価関数に基づいて評価を行うので、予測精度に対する影響を少なくしつつ、かつ計算負担を少なくことができる抗体設計装置、抗体設計方法、プログラム、および、記録媒体を提供することができる。
【0287】
また、本発明によれば、CDR部位のミューテーションさせる位置を、ランダムに、または、アフィニティ評価に基づいて決定するので、遺伝的アルゴリズムなどの手法を用いてランダムに決定した場合には計算負担を少なくすることができ、また、アフィニティ評価に基づいて決定する場合には、アフィニティ平均値減少に寄与したロータマー揺らぎ構造をもつアミノ酸を重点的に変異させることなどができるようになるため、ミューテーションによる抗体精度の向上効率を上げることができる抗体設計装置、抗体設計方法、プログラム、および、記録媒体を提供することができる。
【0288】
さらに、本発明によれば、2次構造予測結果を用いたSVMによるエピトープ部位予測のパラメータS(i)、オリゴペプチド頻度情報を用いたエピトープ部位予測のパラメータO(i)、エピトープ部位アミノ酸頻度情報を用いたエピトープ部位予測のパラメータK(i)の少なくとも一つに基づいて抗原のエピトープ部位を予測するので、処理対象の抗原のエピトープ部位に関する情報がない場合であっても、効率的に予測することができる抗体設計装置、抗体設計方法、プログラム、および、記録媒体を提供することができる。
【図面の簡単な説明】
【図1】本発明の基本原理を示す原理構成図である。
【図2】本発明のエピトープ構造予測処理の一例を示すフローチャートである。
【図3】本発明のエピトープ部位予測処理の一例を示すフローチャートである。
【図4】本発明の断片構造予測処理の一例を示すフローチャートである。
【図5】本発明のCDR構造予測処理の一例を示すフローチャートである。
【図6】本発明の複合体構造予測処理の一例を示すフローチャートである。
【図7】本発明の構造最適化処理の一例を示すフローチャートである。
【図8】本発明のアフィニティ計算処理の一例を示すフローチャートである。
【図9】本発明のアフィニティ評価処理の一例を示すフローチャートである。
【図10】アミノ酸配列が「AAAGKWF」の場合に、各2次構造予測手段により処理し、結合部位を抽出した処理結果の一例を示す図である。
【図11】アミノ酸配列がAGFWKRPの場合に、各2次構造予測手段により処理し、結合部位を抽出した処理結果の一例を示す図である。
【図12】エピトープ部位アミノ酸出現頻度情報DBに登録された情報の一例を示す図である。
【図13】統計ポテンシャル、分子力学、量子化学の特徴の一例を示す図である。
【図14】本発明が適用される本システムの構成の一例を示すブロック図である。
【図15】複合体構造予測部102aの構成の一例を示すブロック図である。
【図16】アフィニティ計算部102bの構成の一例を示すブロック図である。
【図17】アフィニティ評価部102cの構成の一例を示すブロック図である。
【図18】CDR配列ミューテーション部102dの構成の一例を示すブロック図である。
【符号の説明】
100 抗体設計装置
102 制御部
102a 複合体構造予測部
102b アフィニティ計算部
102c アフィニティ評価部
102d CDR配列ミューテーション部
102e エピトープ構造予測部
102f CDR構造予測部
102g 類似データ得点化部
102h 複合体構造作成部
102i ロータマー自由度計算部
102j ロータマー自由度反映構造作成部
102k 構造最適化部
102m 断片構造予測部
102p 自由エネルギー計算部
102q コンタクトポテンシャル計算部
102r アフィニティ評価関数設定部
102s ミューテーション位置決定部
104 通信制御インターフェース部
106 記憶部
106a 入力データファイル
106b エピトープ情報データベース
106c CDR情報データベース
106d 複合体情報データベース
106e 2次構造予測結果データファイル
106f オリゴペプチド頻度情報データベース
106g エピトープ部位アミノ酸頻度情報ファイル
106h ECデータベース
106i アフィニティデータベース
106j ロータマーデータベース
108 入出力制御インターフェース部
112 入力装置
114 出力装置
200 外部システム
300 ネットワーク

Claims (22)

  1. 抗原のエピトープ部位のエピトープ構造と、当該抗原に結合する抗体のCDR部位のCDR構造の複合体構造データを予測する複合体構造予測手段と、
    上記複合体構造予測手段により予測された上記複合体構造データについて、上記エピトープ構造と上記CDR構造との間のアフィニティを計算するアフィニティ計算手段と、
    上記アフィニティ計算手段により計算された上記アフィニティを評価するアフィニティ評価手段と、
    上記CDR部位の配列の一部についてミューテーションを行うCDR配列ミューテーション手段と、
    を備え、
    上記CDR配列ミューテーション手段により変異されたCDR部位のCDR構造に基づいて上記複合体構造予測手段により変異後の複合体構造データを予測し、当該変異後の複合体構造データについて上記アフィニティ計算手段により変異後のアフィニティを計算し、上記アフィニティ評価手段により当該変異後のアフィニティの評価を行い、変異前後のアフィニティの評価結果を比較することにより、抗原とアフィニティの高い抗体を設計することを特徴とする抗体設計装置。
  2. 上記複合体構造予測手段は、
    エピトープ断片の類似配列および/またはエピトープ断片パターンの類似構造を持つ類似データを検索して得点を付ける類似データ得点化手段と、
    上記類似データ得点化手段により高い得点が付されたデータの構造データを雛型として、エピトープ‐CDR相対的位置関係および/またはエピトープ‐CDR結合関係をできるだけ保持するように複合体構造を作成する複合体構造作成手段と、
    を備えたことを特徴とする請求項1に記載の抗体設計装置。
  3. 上記複合体構造予測手段は、
    配列と構造との間の相関の大きさを計算する相関計算手段と、
    上記相関計算手段により計算された相関の大きさに応じて側鎖のロータマーの揺らぎの大きさを示す自由度を計算するロータマー自由度計算手段と、
    上記ロータマー自由度計算手段により計算された側鎖構造の上記自由度に基づいて、主鎖と側鎖を含めた複合体構造を作成するロータマー自由度反映構造作成手段と、
    を備えたことを特徴とする請求項1または2に記載の抗体設計装置。
  4. 上記アフィニティ計算手段は、
    複合体と単体の自由エネルギーの差により上記アフィニティを計算する自由エネルギー計算手段、および/または、
    コンタクトポテンシャルにより上記アフィニティを計算するコンタクトポテンシャル計算手段、
    を備えたことを特徴とする請求項1から3のいずれか一つに記載の抗体設計装置。
  5. 上記アフィニティ評価手段は、
    上記アフィニティの平均値および分散値に基づいてアフィニティ評価関数を設定するアフィニティ評価関数設定手段、
    をさらに備え、
    上記アフィニティ計算手段により計算された上記アフィニティを上記アフィニティ評価関数に基づいて評価を行うこと、
    を特徴とする請求項1から4のいずれか一つに記載の抗体設計装置。
  6. 上記CDR配列ミューテーション手段は、
    上記CDR部位のミューテーションさせる位置を、ランダムに、または、アフィニティ評価に基づいて決定するミューテーション位置決定手段、
    をさらに備えたことを特徴とする請求項1から5のいずれか一つに記載の抗体設計装置。
  7. 2次構造予測結果を用いたSVMによるエピトープ部位予測のパラメータS(i)、オリゴペプチド頻度情報を用いたエピトープ部位予測のパラメータO(i)、エピトープ部位アミノ酸頻度情報を用いたエピトープ部位予測のパラメータK(i)の少なくとも一つに基づいて抗原のエピトープ部位を予測するエピトープ部位予測手段、
    をさらに備えたことを特徴とする請求項1から6のいずれか一つに記載の抗体設計装置。
  8. 抗原のエピトープ部位のエピトープ構造と、当該抗原に結合する抗体のCDR部位のCDR構造の複合体構造データを予測する複合体構造予測ステップと、
    上記複合体構造予測ステップにより予測された上記複合体構造データについて、上記エピトープ構造と上記CDR構造との間のアフィニティを計算するアフィニティ計算ステップと、
    上記アフィニティ計算ステップにより計算された上記アフィニティを評価するアフィニティ評価ステップと、
    上記CDR部位の配列の一部についてミューテーションを行うCDR配列ミューテーションステップと、
    を含み、
    上記CDR配列ミューテーションステップにより変異されたCDR部位のCDR構造に基づいて上記複合体構造予測ステップにより変異後の複合体構造データを予測し、当該変異後の複合体構造データについて上記アフィニティ計算ステップにより変異後のアフィニティを計算し、上記アフィニティ評価ステップにより当該変異後のアフィニティの評価を行い、変異前後のアフィニティの評価結果を比較することにより、抗原とアフィニティの高い抗体を設計することを特徴とする抗体設計方法。
  9. 上記複合体構造予測ステップは、
    エピトープ断片の類似配列および/またはエピトープ断片パターンの類似構造を持つ類似データを検索して得点を付ける類似データ得点化ステップと、
    上記類似データ得点化ステップにより高い得点が付されたデータの構造データを雛型として、エピトープ‐CDR相対的位置関係および/またはエピトープ‐CDR結合関係をできるだけ保持するように複合体構造を作成する複合体構造作成ステップと、
    を含むことを特徴とする請求項8に記載の抗体設計方法。
  10. 上記複合体構造予測ステップは、
    配列と構造との間の相関の大きさを計算する相関計算ステップと、
    上記相関計算ステップにより計算された相関の大きさに応じて側鎖のロータマーの揺らぎの大きさを示す自由度を計算するロータマー自由度計算ステップと、
    上記ロータマー自由度計算ステップにより計算された側鎖構造の上記自由度に基づいて、主鎖と側鎖を含めた複合体構造を作成するロータマー自由度反映構造作成ステップと、
    を含むことを特徴とする請求項8または9に記載の抗体設計方法。
  11. 上記アフィニティ計算ステップは、
    複合体と単体の自由エネルギーの差により上記アフィニティを計算する自由エネルギー計算ステップ、および/または、
    コンタクトポテンシャルにより上記アフィニティを計算するコンタクトポテンシャル計算ステップ、
    を含むことを特徴とする請求項8から10のいずれか一つに記載の抗体設計方法。
  12. 上記アフィニティ評価ステップは、
    上記アフィニティの平均値および分散値に基づいてアフィニティ評価関数を設定するアフィニティ評価関数設定ステップ、
    をさらに含み、
    上記アフィニティ計算ステップにより計算された上記アフィニティを上記アフィニティ評価関数に基づいて評価を行うこと、
    を特徴とする請求項8から11のいずれか一つに記載の抗体設計方法。
  13. 上記CDR配列ミューテーションステップは、
    上記CDR部位のミューテーションさせる位置を、ランダムに、または、アフィニティ評価に基づいて決定するミューテーション位置決定ステップ、
    をさらに含むことを特徴とする請求項8から12のいずれか一つに記載の抗体設計方法。
  14. 2次構造予測結果を用いたSVMによるエピトープ部位予測のパラメータS(i)、オリゴペプチド頻度情報を用いたエピトープ部位予測のパラメータO(i)、エピトープ部位アミノ酸頻度情報を用いたエピトープ部位予測のパラメータK(i)の少なくとも一つに基づいて抗原のエピトープ部位を予測するエピトープ部位予測ステップ、
    をさらに含むことを特徴とする請求項8から13のいずれか一つに記載の抗体設計方法。
  15. 抗原のエピトープ部位のエピトープ構造と、当該抗原に結合する抗体のCDR部位のCDR構造の複合体構造データを予測する複合体構造予測ステップと、
    上記複合体構造予測ステップにより予測された上記複合体構造データについて、上記エピトープ構造と上記CDR構造との間のアフィニティを計算するアフィニティ計算ステップと、
    上記アフィニティ計算ステップにより計算された上記アフィニティを評価するアフィニティ評価ステップと、
    上記CDR部位の配列の一部についてミューテーションを行うCDR配列ミューテーションステップと、
    を含み、
    上記CDR配列ミューテーションステップにより変異されたCDR部位のCDR構造に基づいて上記複合体構造予測ステップにより変異後の複合体構造データを予測し、当該変異後の複合体構造データについて上記アフィニティ計算ステップにより変異後のアフィニティを計算し、上記アフィニティ評価ステップにより当該変異後のアフィニティの評価を行い、変異前後のアフィニティの評価結果を比較することにより、抗原とアフィニティの高い抗体を設計することを特徴とする抗体設計方法をコンピュータに実行させることを特徴とするプログラム。
  16. 上記複合体構造予測ステップは、
    エピトープ断片の類似配列および/またはエピトープ断片パターンの類似構造を持つ類似データを検索して得点を付ける類似データ得点化ステップと、
    上記類似データ得点化ステップにより高い得点が付されたデータの構造データを雛型として、エピトープ‐CDR相対的位置関係および/またはエピトープ‐CDR結合関係をできるだけ保持するように複合体構造を作成する複合体構造作成ステップと、
    を含むことを特徴とする請求項15に記載のプログラム。
  17. 上記複合体構造予測ステップは、
    配列と構造との間の相関の大きさを計算する相関計算ステップと、
    上記相関計算ステップにより計算された相関の大きさに応じて側鎖のロータマーの揺らぎの大きさを示す自由度を計算するロータマー自由度計算ステップと、
    上記ロータマー自由度計算ステップにより計算された側鎖構造の上記自由度に基づいて、主鎖と側鎖を含めた複合体構造を作成するロータマー自由度反映構造作成ステップと、
    を含むことを特徴とする請求項15または16に記載のプログラム。
  18. 上記アフィニティ計算ステップは、
    複合体と単体の自由エネルギーの差により上記アフィニティを計算する自由エネルギー計算ステップ、および/または、
    コンタクトポテンシャルにより上記アフィニティを計算するコンタクトポテンシャル計算ステップ、
    を含むことを特徴とする請求項15から17のいずれか一つに記載のプログラム。
  19. 上記アフィニティ評価ステップは、
    上記アフィニティの平均値および分散値に基づいてアフィニティ評価関数を設定するアフィニティ評価関数設定ステップ、
    をさらに含み、
    上記アフィニティ計算ステップにより計算された上記アフィニティを上記アフィニティ評価関数に基づいて評価を行うこと、
    を特徴とする請求項15から18のいずれか一つに記載のプログラム。
  20. 上記CDR配列ミューテーションステップは、
    上記CDR部位のミューテーションさせる位置を、ランダムに、または、アフィニティ評価に基づいて決定するミューテーション位置決定ステップ、
    をさらに含むことを特徴とする請求項15から19のいずれか一つに記載のプログラム。
  21. 2次構造予測結果を用いたSVMによるエピトープ部位予測のパラメータS(i)、オリゴペプチド頻度情報を用いたエピトープ部位予測のパラメータO(i)、エピトープ部位アミノ酸頻度情報を用いたエピトープ部位予測のパラメータK(i)の少なくとも一つに基づいて抗原のエピトープ部位を予測するエピトープ部位予測ステップ、
    をさらに含むことを特徴とする請求項15から20のいずれか一つに記載のプログラム。
  22. 上記請求項15から21のいずれか一つに記載されたプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。
JP2003083775A 2003-03-25 2003-03-25 抗体設計装置、抗体設計方法、プログラム、および、記録媒体 Expired - Fee Related JP4250443B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003083775A JP4250443B2 (ja) 2003-03-25 2003-03-25 抗体設計装置、抗体設計方法、プログラム、および、記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003083775A JP4250443B2 (ja) 2003-03-25 2003-03-25 抗体設計装置、抗体設計方法、プログラム、および、記録媒体

Publications (2)

Publication Number Publication Date
JP2004295256A true JP2004295256A (ja) 2004-10-21
JP4250443B2 JP4250443B2 (ja) 2009-04-08

Family

ID=33399156

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003083775A Expired - Fee Related JP4250443B2 (ja) 2003-03-25 2003-03-25 抗体設計装置、抗体設計方法、プログラム、および、記録媒体

Country Status (1)

Country Link
JP (1) JP4250443B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007265268A (ja) * 2006-03-29 2007-10-11 Fujitsu Ltd 抗原決定基予測プログラム、抗原決定基予測装置、および抗原決定基予測方法
WO2018052131A1 (ja) * 2016-09-16 2018-03-22 国立大学法人大阪大学 免疫実体クラスタリングソフトウェア

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007265268A (ja) * 2006-03-29 2007-10-11 Fujitsu Ltd 抗原決定基予測プログラム、抗原決定基予測装置、および抗原決定基予測方法
WO2018052131A1 (ja) * 2016-09-16 2018-03-22 国立大学法人大阪大学 免疫実体クラスタリングソフトウェア
JPWO2018052131A1 (ja) * 2016-09-16 2019-08-08 国立大学法人大阪大学 免疫実体クラスタリングソフトウェア

Also Published As

Publication number Publication date
JP4250443B2 (ja) 2009-04-08

Similar Documents

Publication Publication Date Title
Venkatraman et al. Protein-protein docking using region-based 3D Zernike descriptors
Zaki et al. Protein complex detection using interaction reliability assessment and weighted clustering coefficient
Clark et al. Relative binding affinity prediction of charge-changing sequence mutations with FEP in protein–protein interfaces
Jia et al. Protein asparagine deamidation prediction based on structures with machine learning methods
Lin et al. Information assessment on predicting protein-protein interactions
Durham et al. Solvent accessible surface area approximations for rapid and accurate protein structure prediction
Vajda et al. Sampling and scoring: A marriage made in heaven
Chen et al. Protein-protein interaction prediction using a hybrid feature representation and a stacked generalization scheme
El-Manzalawy et al. Recent advances in B-cell epitope prediction methods
Kukreja et al. Comparative study of classification algorithms for immunosignaturing data
Yan et al. Pushing the accuracy limit of shape complementarity for protein-protein docking
Lo et al. Prediction of conformational epitopes with the use of a knowledge-based energy function and geometrically related neighboring residue characteristics
JP2004086862A (ja) タンパク質相互作用情報処理装置、タンパク質相互作用情報処理方法、プログラム、および、記録媒体
Kynast et al. Evaluation of the coarse-grained OPEP force field for protein-protein docking
US20080021686A1 (en) Cluster modeling, and learning cluster specific parameters of an adaptive double threading model
Pan et al. Computationally identifying hot spots in protein-DNA binding interfaces using an ensemble approach
US11532377B2 (en) Systems and methods for modeling a protein parameter for understanding protein interactions and generating an energy map
Wu et al. Accurate prediction of protein relative solvent accessibility using a balanced model
CN116508103A (zh) 用于生物治疗开发的方法和系统
Leonhart et al. A biased random key genetic algorithm for the protein–ligand docking problem
Sevy et al. Integrating linear optimization with structural modeling to increase HIV neutralization breadth
Han et al. Large-scale prediction of long disordered regions in proteins using random forests
Desta et al. Mapping of antibody epitopes based on docking and homology modeling
Wong et al. Fast de novo discovery of low‐energy protein loop conformations
Liu et al. In-silico prediction of blood-secretory human proteins using a ranking algorithm

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060111

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090113

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090119

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120123

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130123

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140123

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees