JP6952351B2 - 集団座標バイアシングによりミスフォールディングタンパク質エピトープを予測するためのシステムおよび方法 - Google Patents

集団座標バイアシングによりミスフォールディングタンパク質エピトープを予測するためのシステムおよび方法 Download PDF

Info

Publication number
JP6952351B2
JP6952351B2 JP2018522708A JP2018522708A JP6952351B2 JP 6952351 B2 JP6952351 B2 JP 6952351B2 JP 2018522708 A JP2018522708 A JP 2018522708A JP 2018522708 A JP2018522708 A JP 2018522708A JP 6952351 B2 JP6952351 B2 JP 6952351B2
Authority
JP
Japan
Prior art keywords
protein model
protein
group
residues
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018522708A
Other languages
English (en)
Other versions
JP2018538254A5 (ja
JP2018538254A (ja
Inventor
サムエル プロトキン,スティーブン
サムエル プロトキン,スティーブン
Original Assignee
ザ・ユニバーシティ・オブ・ブリティッシュ・コロンビア
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ザ・ユニバーシティ・オブ・ブリティッシュ・コロンビア filed Critical ザ・ユニバーシティ・オブ・ブリティッシュ・コロンビア
Publication of JP2018538254A publication Critical patent/JP2018538254A/ja
Publication of JP2018538254A5 publication Critical patent/JP2018538254A5/ja
Application granted granted Critical
Publication of JP6952351B2 publication Critical patent/JP6952351B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/20Protein or domain folding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Molecular Biology (AREA)
  • Physiology (AREA)
  • Peptides Or Proteins (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Description

関連出願
本出願は、
・2015年11月9日出願の米国特許出願第62/253044号;
・2016年2月1日出願の同第62/289893号;
・2016年3月17日出願の同第62/309765号;
・2016年5月4日出願の同第62/331925号;
・2016年6月20日出願の同第62/352346号;
・2016年7月18日出願の同第62/363566号;
・2016年7月22日出願の同第62/365634号;および
・2016年9月12日出願の同第62/393615号;
の優先権を主張するものであり、これらの出願は全て、参照により本明細書に組み入れられる。
技術分野
本発明は、ミスフォールディングタンパク質エピトープ、より正確にはアンフォールディング特異性(unfolding−specific)タンパク質エピトープの予測に関する。アンフォールディング特異性エピトープは、タンパク質がその構造の少なくとも一部を損失している場合に生じ得る。ミスフォールディングタンパク質は、そのようなエピトープを提示し得るが、適切にフォールディングしたタンパク質は、それを提示しないであろう。特別な実施形態は、タンパク質(またはペプチド凝集体)に集団座標バイアス(例えば、全体的に課された集団座標バイアス)を課して該タンパク質(またはペプチド凝集体)を強制的にアンフォールディングさせる、分子動力学ベースのシミュレーションを実施すること;およびその後、該シミュレーションから得られた、部分的に構造化されていないタンパク質(またはペプチド凝集体)の中のアンフォールディング領域の検出に基づき、アンフォールディングタンパク質エピトープを予測すること、を含む、ミスフォールディングタンパク質エピトープを予測するための方法を提供する。
模範的実施形態を、参照される形状の図面で示す。本明細書に開示された実施形態および図が、制限ではなくむしろ例示と見なされるべきことを意図する。
特定の実施形態による、候補となるミスフォールディングタンパク質エピトープを予測するためのコンピュータベースの方法またはコンピュータに実装された方法を略図で示す。 模範的コンタクトについての、距離rに対する方程式(1)のコンタクト関数Qij(r)のプロットを示す。 Aβアミロイドの典型的なバイアシングシミュレーションについての、時間に対する、図1の方法を用いてシミュレートされたQ(t)のプロット、および滑らかな、または線形の(例えば、変動が一定速度の)目的集団座標曲線Q(t)のプロットを示す。 図4Aは、初期構造の80%にバイアスをかけた場合の、3回対称Aβ構造2M4Jの1つのモノマーについて、配列内の各残基の残基指数(residue index)の関数として初期構造の溶媒露出表面積(SASA)に比較した、アミノ酸の側鎖のSASAの変動のプロットを示す。プロット内の各曲線は、このモノマーについての別のバイアスシミュレーションに対応する。 図4Bは、各鎖の所与の区分(例えば、残基23〜28)が独立して検討され、各シミュレーションランが独立して検討される、模範的凝集構造のための図1の方法の分析を略図で示す。 図5A、5Bおよび5C(集合的に図5)は、特定の実施形態により、図1の方法で用いられ得る、またはその他では候補エピトープ予測方法で用いられ得る、凝集系を含むタンパク質内の候補エピトープを同定するための、シミュレーション結果を分析するための方法を略図で示す。 図5A、5Bおよび5C(集合的に図5)は、特定の実施形態により、図1の方法で用いられ得る、またはその他では候補エピトープ予測方法で用いられ得る、凝集系を含むタンパク質内の候補エピトープを同定するための、シミュレーション結果を分析するための方法を略図で示す。 図5A、5Bおよび5C(集合的に図5)は、特定の実施形態により、図1の方法で用いられ得る、またはその他では候補エピトープ予測方法で用いられ得る、凝集系を含むタンパク質内の候補エピトープを同定するための、シミュレーション結果を分析するための方法を略図で示す。 図6A〜6D(集合的に図6)は、特定の実施形態による、図1の方法に適用されたバイアシング工程のアウトプットに基づく潜在的候補エピトープの分析、および候補エピトープの予測を示す、異なるAβ線維構造のための複数の「ファイアプロット」を示す。 3回対称構造2M4Jのための、バイアシングの間、およびその後のしばらくの期間のファイアプロットを示す。図7Aは、4nsを中心とした1nsの時間ウインドウに対応し、同様に図7Bは8ns、図7Cは12ns、図7Dは16ns、図7Eは20nsを中心とした1nsの時間ウインドウに対応する。このシステムは、Q=0.6のみにバイアスがかけられており(図3参照)、そのためパネル7Dおよび7Eは、両者ともQ=0.6に対応する。 本明細書に記載された複数のタンパク質についての複数の予測されるエピトープを示す。 3つの異なるAβ線維構造についての、SASAの変動(上の行)および損失されたコンタクトの数(下の行)に基づくファイアプロットの比較を示す(図9の列に対応)。 初期Q0.8にバイアスをかけた後の3回対称Aβ構造2M4Jの描画である。 初期Q0.6にバイアスをかけた後の3回対称Aβ構造2M4Jの描画である。 初期Q0.8にバイアスをかけた後のAβ42構造2MXUの描画である。 初期Q約0.8にバイアスをかけた後の2回対称Aβ40構造2LMNの描画を示す。 該方法に対する複数の異なるリファインメントについてのファイアプロットを示す。 特定の実施形態による、本明細書に記載された方法のいずれか、および本明細書に記載された方法のいずれかのステップを実施するために用いられ得るコンピュータシステムの略図である。 特定の実施形態による、図5Cの方法の一部としての、図6Aのファイアプロットからの候補エピトープおよびサブエピトープの除去を示す一連のプロットである。 図17Aは、特定の実施形態による、図1の方法に適用されたバイアシング工程のアウトプットに基づく潜在的候補エピトープの分析、および候補エピトープの予測を示すSOD1のファイアプロットである。 図17Bは、Q=0.65での図17AのSOD1のバイアシング集団の例示的な図である。候補エピトープは、暗い描影で示されている。
記載
以下の記載全体を通して、当業者へより完全な理解を提供するために、具体的詳細が示されている。しかし、本開示を不要に妨害することのないよう、周知の要素は詳細に図示または記載されていない場合がある。したがって、該記載および図面は、制限というよりむしろ例示の意味で解釈されなければならない。
本開示の態様は、ミスフォールディングタンパク質エピトープの予測のための方法およびシステムを提供する。タンパク質またはペプチド凝集体は、典型的にはそれぞれ、いわゆるネイティブ構造またはフィブリル構造を呈する。本開示では、文脈から明白である場合には、ネイティブ構造およびフィブリル構造の両方を「ネイティブ構造」と称する。典型的にはタンパク質のネイティブ構造は、タンパク質の様々な部分の間にある相互作用(コンタクトと称される)により安定化されている。特定の実施形態は、タンパク質(またはペプチド凝集体)に集団座標バイアスを課してタンパク質またはペプチド凝集体を強制的にアンフォールディングさせる分子動力学ベースのシミュレーションを実施することを含む、アンフォールディング特異性タンパク質エピトープを予測するための方法を提供する。本開示および添付の特許請求の範囲において、文脈で他に示されない限り、タンパク質またはペプチド凝集体に対応する集団座標(または集団変数)は、タンパク質またはペプチド凝集体に対応する分子動力学ベースのモデルの複数のパラメータ/変数に基づく変数である。集団座標は、検討されているタンパク質またはペプチド凝集体の全体であり得る。本開示および添付の特許請求の範囲において、文脈で他に示されない限り、全体的な集団座標(または簡潔にするために全体的座標)は、原子に関連する幾何学的/空間的基準、一次配列における原子の場所(複数可)、特定の原子の二次構造などに基づくタンパク質またはペプチド凝集体の実質的部分の任意のサブポーション(sub−portion)に対応するパラメータ/変数の選択、加重などを含まない、タンパク質またはペプチド凝集体の少なくとも実質的部分に対応するモデル(例えば、分子動力学ベースのモデル)の原子に関連するパラメータ/変数に依存する集団座標を指す。タンパク質またはペプチド凝集体の実質的部分は、タンパク質もしくはペプチド凝集体の全て、またはタンパク質もしくはペプチド凝集体の適当な境界条件(例えば、縁部の残基または縁部のペプチド鎖)に適用されることを意味する、境界構造以外の全てを含み得る。全体的な集団座標の非限定的例は、ネイティブ構造の対応する位置に対する、タンパク質構造における全α炭素原子の位置の根平均二乗偏差(RMSD)を包含する。全体ではなく局所である集団座標の2つの非限定的例は、以下の通りである:1)タンパク質の疎水性コアの中のみにある全α炭素原子の位置のRMSD、2)二次構造のターン領域にあるα炭素のみのRMSD。これらの例は両者とも、ネイティブまたはフィブリル構造の選択部分またはサブセットについての先験的情報を考慮した原子選択について追加の制限条件を有するが、上記の全体的座標は、ネイティブ構造のサブポーションに任意の先験的なバイアスをかけた加重を用いない。
本発明の幾つかの態様による方法は、集団座標バイアスを課してタンパク質またはペプチド凝集体を強制的にアンフォールディングさせた後、シミュレーションから得られた部分的に構造化されていない(即ち、ネイティブ構造またはフィブリル構造でない)タンパク質またはペプチド凝集体のアンフォールディング領域の検出に基づき、アンフォールディングタンパク質エピトープを予測することを含む。幾つかの実施形態において、全体的にかけられた集団座標バイアスは、全体的にかけられた集団座標バイアスに応答してタンパク質にそれ自体のミスフォールディング(非ネイティブ)構造を採用させながら、または非ネイティブコンタクトが破壊されたタンパク質システムにより採用されない場合には、タンパク質のエネルギー関数に好適な幾つかの領域でタンパク質をアンフォールディングさせながら、タンパク質またはペプチド凝集体をネイティブ構造よりも少ないコンタクト、もしくはネイティブ構造と異なるコンタクトを強制的に持たせる。
本開示の幾つかの態様は、ネイティブ構造または凝集構造からの部分的な局所アンフォールディングを呈するタンパク質、またはタンパク質もしくはペプチド鎖の組に特有の1つまたは複数のエピトープを同定するためのコンピュータベースのシステムおよび方法を提供する。理解される通り、凝集構造(ペプチド凝集体またはフィブリルとも称される)は、ことによるとタンパク質をはじめとする、凝集した(例えば、比較的高濃度の)複数(例えば、3、5、10、100または1000)のペプチド鎖を含む。凝集構造を形成する個々のペプチド鎖は、それ自体のネイティブ構造を有する場合または有さない場合があるが、凝集構造は典型的には、1つまたは複数の「ネイティブ」フィブリル構造を有し、該フィブリル構造は、含まれるペプチド鎖、ペプチド鎖が凝集する条件、そしてことによると確率論的要因、例えば非限定的例として個々のペプチド鎖のランダムコンフォメーションなどに依存し得る。本開示および添付の特許請求の範囲において、文脈で他に示されない限り、一般性を失わず、タンパク質、ペプチド凝集体、フィブリルおよび凝集構造は、本明細書ではタンパク質と称され得、タンパク質、ペプチド凝集体、フィブリルおよび/または凝集構造のネイティブ構造は、本明細書でネイティブ構造と称され得る。
本発明の幾つかの態様および実施形態によれば、タンパク質の分子動力学ベースの、またはモンテカルロサンプリングベースのモデルを導入して、外部から適用された(目的の)集団座標をバイアシングすること(例えば、増加、減少、または他の方法で変動もしくは操作すること)によりネイティブ構造を部分的にディスオーダーする方法が、提供される。幾つかの態様または実施形態において、該集団座標は、全体的な集団座標である。幾つかの態様または実施形態において、該集団座標は、ネイティブ構造との類似性の度合い、および/またはネイティブ構造からの偏差の度合いを表示する(例えば、それらと相関する、それらの関数である、それらを定量することが可能である、それらを順序付けることが可能である、または他の方法で表示する)。全体的な集団座標の非限定的例としては、ネイティブ構造におけるコンタクトのうちの、任意の特定のタンパク質構造のタンパク質(またはペプチド凝集体)の重い(非水素)原子の間の安定化相互作用(コンタクト)の数;ネイティブ構造内の水素原子の間のコンタクトのうちの、任意の特定のタンパク質構造内の水素原子の間の安定化相互作用(コンタクト)の数;ネイティブ構造内の重い原子の間の距離に対する特定タンパク質構造の全ての重い原子の間の距離;α炭素原子の位置により定義される、ネイティブ構造の根平均二乗構造偏差(RMSD)に対する特定タンパク質構造のRMSD;重い原子の位置により定義される、ネイティブ構造に対する特定タンパク質構造のRMSD;ネイティブ構造に対する特定タンパク質構造の総溶媒露出表面積(SASA);タンパク質のネイティブ構造内のバックボーン水素結合の数のうちの、特定タンパク質構造におけるバックグボーン水素結合の数;前述のものの組み合わせなど、に基づく変数が挙げられる。
本発明の幾つかの態様および実施形態は、外部から適用された(目的の)集団座標にバイアスをかけること、およびタンパク質の分子動力学ベースのモデルに強制的に構造を再編成させて、バイアスをかけた目的集団座標に従わせることを含む。分子動力学ベースのモデルに強制的に構造を再編成させて、バイアスをかけた目的集団座標に従わせることは、例えば実際の集団座標(分子動力学ベースのモデルから決定)とバイアスをかけた目的集団座標との差異に依存し得るコスト関数(バイアシングポテンシャル関数とも称される)を、分子動力学ベースのモデルに強制的に最小限にさせることにより、成就され得る。分子動力学ベースのモデルに強制的に構造を再編成させて、バイアスをかけた目的集団座標に従わせることは、バイアシングポテンシャルを適用することもしくは課すこと、または集団座標バイアスを適用することもしくは課すこと、と称され得る。
適用されたバイアシングポテンシャルが、全体的な集団座標に基づく場合、タンパク質は、典型的にはネイティブ構造を均一に損失せず、代わりに熱力学的に最もディスオーダーし易い特異的領域(複数可)においてネイティブ構造を損失する(即ち、アンフォールディングする、そしてことによるとミスフォールディングする)。そのような領域(複数可)は、タンパク質の他の領域に比較して、比較的弱い安定化自由エネルギーを有するそれらの領域(複数可)に対応し得る。全体的なバイアシングポテンシャルの適用によりディスオーダーする領域(複数可)は、ミスフォールディング特異性またはアンフォールディング特異性エピトープ、即ち、それらの領域(複数可)についてのネイティブ構造の非存在下のみに存在する(例えば、アンフォールディングまたはミスフォールディング構造に存在するが、ネイティブ構造には存在しない)エピトープを含み得る。
本発明の態様は、タンパク質の構造モデルに集団座標バイアスを適用して、ネイティブ構造とは異なる部分的アンフォールディング構造を呈するようにその構造タンパク質モデルを変換することを含む。タンパク質モデルの実質的な部分でアンフォールディングが起こる場所に関してバイアスおよび対応する変換が偏らないように、集団座標バイアスに基づく変換は、タンパク質モデルの少なくとも実質的部分に全体的に適用され得る。変換された(部分的アンフォールディングの)構造タンパク質モデルは、その後、局在化アンフォールディングの印を検出するため、そして局在化アンフォールディングの印を呈する候補エピトープを同定するために、分析され得る。
本開示の態様は、アルツハイマー病、ALS、トランスサイレチンアミロイドポリニューロパチーなどの多様なアミロイド形成性神経変性疾患についてのミスフォールディング特異性の、または追加もしくは代替的にオリゴマー特異性のエピトープ、ならびに上皮成長因子受容体(EGFR)、細胞死受容体および分化タンパク質群などの細胞表面受容体をはじめとする部分的アンフォールディングの癌細胞特異性エピトープを予測するためのシステムおよび方法を提供する。加齢の、または破壊されたAβ線維において本明細書に開示されたシステムおよび方法にしたがって予測された特異的で非限定的な例のエピトープとしては、残基13〜18または配列HHQKLV、残基6〜9または配列HDSG、残基13〜16または配列HHQK、残基15〜18またはQKLV、残基21〜24またはAEDV、および残基37〜40(Aβ42に特異的に)またはGGVVが挙げられるが、これらに限定されない。抗体は、配列同一性およびそのコンホメーションの両方に基づいてこれらのエピトープをターゲットとするであろう。ネイティブ構造またはフィブリルからアンフォールディングした一次配列の区分は、ネイティブ構造またはフィブリルの状況下の対応する区分とコンホメーションが異なる。そのような領域をターゲットとする抗体は、ネイティブ構造またはフィブリルに対して生じず、アンフォールディング構造集団を模倣した前述の一次配列のペプチド足場に生じるであろう。アンフォールディング特異性エピトープ(即ち、外部摂動によりフィブリルからアンフォールディングされるという基準に基づいて選択されたエピトープ)に結合する抗体は、ネイティブ構造のコンホメーションの状況下では該エピトープに結合しないが、該コンホメーションが構造化されていない場合のみ、エピトープに結合する。抗体が、環状ペプチドに生じる場合、抗体はまた、ペプチド鎖のアンフォールディングモノマー形態への選択性、例えばモノマーAβ42への選択性があり得る。
神経変性性および全身性の両方のアミロイド関連疾患に関与する幾つかのミスフォールディングタンパク質は、非限定的例としてトランスサイレチン、β2−ミクログロブリン、およびスーパーオキシドジスムターゼをはじめとし、かなりの度合いのネイティブの構造を有するフィブリルを示すようである。かなりの度合いの適度にフォールディングした推定ネイティブ構造を有するフィブリルのそのような提示から、全体的ではなく局所的なタンパク質アンフォールディングが、これらの疾患において重要な役割を担い得ることが示唆される。
他の神経変性疾患は、アルツハイマー病におけるAβペプチドおよびパーキンソン病におけるα−シヌクレインなど、内因的にディスオーダーされたペプチドの凝集を含むようである。しかし、主にAβペプチドを含むプラーク(即ち、フィブリルの集まり)および主にτ−タンパク質を含む神経線維タングルは、認知症の任意の提示がなく、ほとんどの個体において加齢と共に生じる。その一方で、Aβシードを含む希釈脳抽出物によるマウスへの脳内注射で、プラーク沈着および脳内Aβ血管障害をはじめとするアルツハイマー病の表現型症状が導入されることが観察された。そのような証拠は、単独で作用する大きなフィブリルの比較的不活性の機能以外に、様々なサイズおよび多形構造のオリゴマーを含有し得るAβの異種血清の毒性を指摘している。これらの知見は、フィブリルではなくプリオンタンパク質のオリゴマーが最も感染性があることを見出したプリオン生物学の知見と一致している。その場合、大きなフィブリルは、Aβペプチドを捕捉することにより保護的役割を担い得る。
しかし、Aβモノマーの存在下では、フィブリルは、オリゴマーの生育および拡大のための核形成基質として作用し得る。この「二次的な核形成」過程は、Aβモノマーまたはフィブリル破砕の間の直接の核形成よりももっと毒性オリゴマー種の主な供給源となるS−放射性標識ペプチドを用いた速度論的試験により見出された。まとめると、フィブリルがオリゴマー化を触媒する傾向を有する相互作用部位を提示し得ること、しかしこれが株特異性(strain−specific)であり得、正常な患者に存在しない選択的フィブリル表面が露出することでモノマーとの異常な相互作用を有し得る(即ち、モノマーに提示される)場合のみに生じ得ることが、上記の証拠からが示唆される。低pH、炎症時に存在するオスモライト、または酸化障害などの環境上の課題は、フィブリル内に破壊を導入して、弱安定性領域の露出を導く可能性がある。その場合、これらの弱安定性領域を予測し、そのような予測を利用して、それらをターゲットにし得る治療薬を合理的に設計することに関心事になる。
癌の状況では、突然変異または欠失により導入されたタンパク質ミスフォールディングが、アポトーシス促進経路に関与するタンパク質を不安定にすること、または構成的活性になるように成長因子などの細胞表面タンパク質の機能を改変すること、のいずれかにより役割を担い得ることの複数の証拠が存在する。分子クラウディングの存在、低pHおよび活性酸素種は全て、タンパク質構造を不安定にする異常な環境に寄与して、新生物細胞内のタンパク質により頻繁な構造的破壊を受け易くする。
新生物の状況下でのミスフォールディングタンパク質は、癌細胞選択性抗原ターゲットを提示し得、ネイティブタンパク質ではなくこれらのターゲットに対する抗体が、健常な組織におけるフォールディングタンパク質(複数可)の非意図的ターゲッティングによる望まない副作用を回避することができる。例えばEGFRに対するネイティブ抗体療法は、健常な組織におけるEGFシグナル伝達に対抗することができ、EGFR阻害剤を受けた患者の大部分(45〜100%)は、丘疹膿疱性発疹を発症し、より少ない割合で、爪囲炎および粘膜炎を発症し、少数が、皮膚病変の生死にかかわる重感染を重度の反応を発症する。理想的な抗体系の抗悪性腫瘍薬は、腫瘍組織におけるEGFRシグナル伝達に選択的に対抗しながら、正常な組織におけるEGFRを免除することにより、これらの有害反応を回避し得る。
アルツハイマー病の状況では、上記証拠は、二次的な核形成のための「ホットスポット」として、またはAβモノマーの動員部位として作用し得るAβ線維の局所ディスオーダー領域の予測のための一般的欲求を起こさせる。フィブリル内で破壊される可能性がある領域は、毒性オリゴマー種における受動的露出領域のための良好な候補になり得る。なお、ネイティブフォールディングのタンパク質が、凝集の際に、かなりの度合いのネイティブ構造を保持し得るという事実は、ディスオーダーによりネイティブ構造を損失し易く、分子間非ネイティブ相互作用の候補領域として作用し得る、ネイティブフォールディングの構造における領域の予測を立証する。癌の状況では、新生物細胞の異常な環境の破壊的影響が、小分子または抗体療法のための癌細胞特異性ターゲットとして作用し得る、癌で調節不全となったタンパク質の局所ディスオーダー領域を予測する動機を与える。
本開示の態様は、ディスオーダーを受け易い連続したタンパク質領域(エピトープ)を予測するコンピュータベースのシステムおよび方法を提供する。部分的に破壊されたAβ線維に基づく具体的な例のエピトープ予測が、以下により詳細に記載される。
非限定的例として、CHARMM(Chemistry at HARvard Macromolecular Mechanics,http://www.charmm.org/)などの量子力学的にパラメータ化された力場(例えば、分子動力学エンジンとしても公知の分子動力学モデルを用いる)は現在、実験的なフォールディングタンパク質構造をde novoで再現する(即ち、タンパク質をフォールディングする)のに十分、正確である。量子化学のコンピュータ表示によってパラメータ化されるタンパク質のフォールディングに用いられる力場は、タンパク質の各ネイティブ構造の付近、またはその周辺で最も正確になる傾向がある。本発明の幾つかの実施形態は、そのような状況(即ち、ネイティブ構造の付近または周辺)での、またはこのネイティブ構造(例えば、熱運動を有するネイティブ構造)からの部分的な構造摂動に関する、本明細書に記載された技術を適用する。したがって、分子動力学モデルで用いられる、そしてそのような実施形態で用いられる公知の力場は、妥当な範囲内で適用されている。
本開示の態様は、タンパク質領域がネイティブ構造から構造的に逸脱する局所アンフォールディング事象を特徴づける。応答の際に、構造化されたタンパク質がアンフォールディングまたはミスフォールディングを開始するように、本発明の態様は、該タンパク質の分子動力学ベースのモデルに難題(幾つかの異常な環境的キュー(environmental queue)に基づく)を課す。そのような技術を実行するために、本開示の態様は、外部から適用される(目的の)集団座標にバイアスをかけて(例えば、増加、減少または他の方法で変動もしくは操作して)、分子動力学ベースのタンパク質モデルに対応するバイアシングポテンシャルを適用することを含む、本明細書で集団座標バイアシングと称される技術を用いる。本発明の幾つかの態様による方法は、タンパク質がアンフォールディングし始めると、部分的に構造化されていないタンパク質のアンフォールディング領域の検出に基づいてアンフォールディングタンパク質エピトープを予測することを含む。
図1は、特定の実施形態による、候補エピトープ52(例えば、候補のアンフォールディングエピトープ)を予測するためのコンピュータベースのまたはコンピュータに実装された方法10を示す。方法10は、方法10を実施するのに用いられ得るモデリングパラメータインプットを得ることを含むブロック20を実行する。例えば、例示された実施形態において、ブロック20のモデリングパラメータインプットとしては、ネイティブ構造モデル22、原子力場24、および集団座標バイアシングパラメータ26が挙げられるが、これらに限定されない。そのようなモデリングパラメータインプット22、24、26は一般に、任意の適切な供給源から任意の適切な技術により得ることができる。幾つかの実施形態において、モデリングパラメータインプット22、24、26の一部または全ては、ユーザーにより(例えば、グラフィカルユーザーインターフェース、コマンドラインインターフェース、ネットワークインタフェース、I/Oインターフェース、または他の適切なインターフェース(例えば、適切な分子動力学エンジンソフトウエアなど)を通して)方法10を実施するコンピュータに提供され得る。幾つかの実施形態において、方法10は、ソフトウエアおよび/またはハードウエアを含むより包括的なコンピュータベースの分子動力学エンジンの一部であり得、モデリングパラメータインプット22、24、26の一部または全ては、他の日常作業(図示しない)において分子動力学エンジンにより決定され得る。幾つかの実施形態において、モデリングパラメータインプット22、24、26の一部または全ては、方法10を実施するコンピュータと接続されているコンピュータに実装された外部システム(例えば、分子動力学システム、データベースなど)により提供され得る。幾つかの実施形態において、モデリングパラメータインプット22、24、26の一部は、他のモデリングパラメータインプット22、24、26から得ることができる(例えば、図1に明白に示されていない方法10のステップにおいて)。
例示された実施形態において、ブロック20は、該方法に供されたタンパク質(例えば、特定の疾患に関連することが示唆され得る、または他の方法で検討され得るタンパク質)の構造モデル22を得ることを含む。構造モデル22は、ブロック30を実施する分子動力学エンジンでの使用に適した対象タンパク質のコンピュータ表示を含み得る(以下により詳細に議論)。構造モデル22およびそれに関連するコンピュータ表示は、検討されているタンパク質中の原子核の物理的座標(例えば、x、yおよびzの物理的位置)を指定し得る(適切な手法で)。文脈で他に示されない限り、本開示および添付の特許請求の範囲において、タンパク質(例えば、方法10で検討されているタンパク質)に提供される場合の構造という用語は、タンパク質内の原子核の一部もしくは全ての物理的座標(例えば、x、yおよびzの物理的位置)、および/またはそのような物理的座標の幾つかのコンピュータ表示に対応すると理解されなければならない。ブロック20のモデリングパラメータインプットの一部として得られた構造モデル22は、以下により詳細に記載される通り、検討されているタンパク質の「ネイティブ」構造を提供、指示または表現することができ、ブロック25で実施されるシミュレーションにより集団座標バイアシングに供されて最新構造モデル32を提供することができる。構造モデル22は、実験的に決定された核座標の組を含み得るか、またはコンピュータで決定され得る。幾つかの実施形態において、構造モデル22は、タンパク質データバンク(PDB;www.rcsb.orgから入手し得るものなど)から得ることができる。幾つかの実施形態において、ブロック20のモデリングパラメータインプットの一部として得られた構造モデル22は、適切にフォールディングしたネイティブタンパク質構造のコンピュータベースの表示を含み得るか、またはミスフォールディングおよび凝集したフィブリル構造のコンピュータベースの表示を含み得る。構造モデル22は、凝集構造(例えば、フィブリル)を形成し得る単一のタンパク質鎖または複数のペプチド鎖を含み得る。先に議論された通り、簡潔にするために、方法10を受けたタンパク質および凝集構造は、一般性を失わず、本開示および添付の特許請求の範囲においてタンパク質またはタンパク質(複数)と称され得る。
ブロック20はまた、検討されているタンパク質と関連する原子力場24のコンピュータ表示を得ることを含む。そのような原子力場24は、ブロック30を実施する構造モデル22および/または分子動力学エンジンのコンピュータ表示の形態で使用するように構成され得る。力場24は、タンパク質の構造をシミュレートするための対応する分子動力学エンジンにより使用可能なCHARMMまたは類似の力場モデル、例えばOPLS(Optimization Potentials for Liquid Simulations)、GROMOS(www.gromos.net)などにより提供されるようなパラメータ化された力場モデルを含み得る。幾つかの実施形態において、構造モデル22および原子力場24は、統合され得る。
例示された実施形態において、ブロック20はまた、外部から適用された目的集団座標が以下により詳細に記載されるブロック25のシミュレーションループの間にどのようにしてバイアスをかけられるか(例えば、増加、減少または他の方法で変動もしくは操作されるか)を記載した集団座標および/またはシミュレーションパラメータ26を得ることを含む。例えばそのような集団座標バイアスパラメータ26は、目的集団座標の変動速度、目的集団座標の変動の振幅、目的集団座標の最大および/もしくは最小値、バイアスポテンシャル関数の他のパラメータ、例えば非限定的例として以下に記載されるポテンシャル関数の剛性(または「ばね定数」)kなどを指定し得る。パラメータ26は追加的または代替的に、非限定的例としてシミュレーションのような期間および/もしくは時間ステップ離散化、シミュレーションの期間など、ブロック25で実施されるシミュレーションの他のシミュレーションパラメータを含み得る。幾つかの実施形態において、該シミュレーションは、既に探索されたものと類似のコンホメーションにペナルティを課すことを含む、メタダイナミクス法を用いてタンパク質を強制的にアンフォールディングさせることができ、例えば、参照により本明細書に組み入れられる、Bonomi et al.PLUMED:A portable plugin for free−energy calculations with molecular dynamics,Computer Physics Communications 180(2009)1961−1972を参照されたい。幾つかのそのような実施形態において、メタダイナミクス法のパラメータは、シミュレーションパラメータ26の一部であり得る。
ブロック20でモデリングパラメータインプットを得た後、方法10は、例示された実施形態においてブロック30および40を含むシミュレーションループ25に進行する。幾つかの実施形態において、図1に示されたブロック50の分析ステップは、ループ25の内側全体またはその一部で実施され得る。ループ25のシミュレーションは、分子動力学エンジンにより実装され得、フェムト秒(即ち、1fs=10−15秒)の単位またはフェムト秒の割合で時間ステップを含む、コンピュータ実装の不連続時間シミュレーションを含み得る。ループ25のシミュレーションは、適切なコンピュータまたは複数のコンピュータで動作するソフトウエア分子動力学エンジンにより実装され得る。複数のソフトウエア分子動力学エンジンが、当該技術分野で公知である。1つの特定の実施形態において、ブロック25のループは、公開されたソフトウエアパッケージGROMACSおよびPLUMEDを時々更新しながら使用して実施される。ブロック25のシミュレーションループの一部として、集団座標バイアスポテンシャルが、タンパク質に適用されて、ブロック20内のインプットとして得られた構造モデル22の変換を強制的に行い、検討されているタンパク質の最新構造モデル(最新のコンホメーションとも称される)32を作成する。その上、検討されているタンパク質の構造モデルは、タンパク質の最新構造モデル(またはコンホメーション)32を作成するためのブロック25のシミュレーションの各時間ステップの際に変換される。具体的にはタンパク質の構造(即ち、タンパク質の原子の核の物理的座標のコンピュータ表示)は、最新構造モデル32を作成する各時間ステップの際に変換される。
以下により詳細に議論される通り、ループ25のシミュレーションは、検討されているタンパク質に集団座標バイアスを加えること、および一連の時間ステップ全体で該タンパク質を観察すること、を含む。全体的な集団座標は、原子位置(例えば、核の物理的座標)および/またはエネルギーの任意の適切な関数を含むことができ、バイアスがかけられると、検討されているタンパク質に全体的不安定化の影響を与え、それによりネイティブ構造の損失を導入することができる。全体的な集団座標の非限定的な例は、先に記載した。
最新構造モデル(複数可)32(コンホメーション(複数可)32とも称される)は、ループ25の1つまたは複数の反復の後、検討されているタンパク質のコンピュータ表示の変換構造(複数可)を参照し得る。幾つかの実施形態において、新しいコンホメーション32は、ループ25の各反復の際に(例えば、各時間ステップで)作成され、その場合、図1に示されたコンホメーション(複数可)32は、実際には複数のコンホメーション32を含み得る。幾つかの実施形態において、ループ25はまた、各反復の際に(例えば、各時間ステップで)集団座標アウトプット34を作成する。任意のコンホメーション32についての集団座標アウトプット34は、各時間ステップで、現行の、そして/または過去の時間ステップの最新構造モデル32に基づいて決定され得る。集団座標のアウトプット34は、特定の時間ステップで、検討されているタンパク質の「実際の」集団座標を含み得る(外部から適用される「目的」集団座標とは対照的に)。幾つかの実施形態において、任意の時間ステップの集団座標のアウトプット34または対応するコンホメーション32は、コンホメーション32のために存在するネイティブ構造の度合い、またはコンホメーション32のために存在するネイティブ構造の度合い欠落(例えば、アンフォールディング)の関数および/または他の指標と相関するパラメータを含み得る。幾つかの実施形態において、該集団座標アウトプット34は、スカラーである。例えば、該集団座標アウトプット34は、[0,1]の範囲内であり得、そのため全体にネイティブの構造(例えば、ブロック20内のPDBからネイティブ構造モデル22として得られた構造)は、1という全体的な座標アウトプット34を有し得るが、全体的にアンフォールディングしたランダムコイル構造では、集団座標アウトプット34は、0または0付近の値を有し得る。
方法10およびループ25で用いられる、またはその他の本明細書に記載された集団座標バイアシング法を用いて、アンフォールディングが起こる方法または場所(タンパク質構造内の)を指定せずに、候補タンパク質から特定レベルの全体的アンフォールディングを要求することができる(少なくとも許容できる閾値内で大まかに)。例えば、検討されているタンパク質にバイアスをかけるために用いられる場合に、タンパク質に任意の局所アンフォールディングを採用させて全体的な目的を実現しながら、タンパク質が全体的なアンフォールディングを実現して目的集団座標を追跡することのみを全体的な集団座標が要求するように、該集団座標は全体的な集団座標であり得る。タンパク質が仮に30%アンフォールディングすること(したがって70%フォールディングすること)を要求する場合、方法10を用いて、30%が部分的にディスオーダーになるように制限された平衡のタンパク質構造から結果を分析および獲得することができる。集団座標バイアスが、全体的である場合(例えば、30%ディスオーダーの構造に向けて)、全体的な集団座標バイアスは、30%のディスオーダーの制限を満たすようにタンパク質が局所的にディスオーダーになり得る場所または方法を指定しない。ディスオーダーの領域(複数可)は、タンパク質の内部エネルギー関数または力場(即ち、タンパク質のコンピュータベースのモデル表示に基づく)と、タンパク質が集団座標バイアスの制限を満たすという要件と、に基づいてタンパク質により採用され得る。以下により詳細に記載される通り、ディスオーダーになり易い(例えば、例示された実施形態において局所アンフォールディングの印54から決定され得る通り)タンパク質の局在化領域または「ホットスポット」は、ブロック50で分析されて、方法10の候補エピトープ予測52を提供し得る。これらの方法10の候補エピトープ52はその後、治療薬が設計され得る抗原ターゲットとして作用し得る。
方法10に基づく候補エピトープ予測52は、ループ25シミュレーションで用いられるインプット力場24およびコンピュータベースのモデル表示22と同様に正確になり得る。上述の通り、現在、分散コンピューティングまたはカスタムスーパーコンピュータは、これらの力場を用いてタンパク質を正確にフォールディングすることができ、方法10へのブロック20のインプットとして用いられる力場モデル24およびコンピュータベースのモデル表示22の正確さを裏づけている。
インプットコンピュータベース構造モデル22(例えば、ブロック20でPDBから得られるような)は、タンパク質の全ての原子についての一組の三次元座標を含み得る。インプットコンピュータベース構造モデル22が、ネイティブ構造モデルである場合、それは、一組のネイティブコンタクト(本明細書では初期コンタクトとも称される)を定義する。一組の初期コンタクトは、互いの閾値距離(例えば、4.8Åまたは幾つかの他の適切な距離)内にある核を有するネイティブ構造モデル22内の重い原子(水素以外)の全て(または一組)の対を含むように定義され得る。100程度のアミノ酸長の一次配列を有するタンパク質の典型的なPDBネイティブ構造22は、典型的には約2000またはその前後の初期コンタクトを有し得る。幾つかの実施形態において、コンタクトの数は、方法10で用いられる全体的な集団座標を表し得る。そのような実施形態において、初期コンタクトの数は、検討されている(シミュレーションループ25の任意の反復より前の)タンパク質の実際の集団座標の初期値を表し得る。
幾つかの実施形態において、インプットタンパク質構造22は、ループ25において厳密にネイティブの構造を用いるのではなく、任意選択的な平衡化工程23(図1に破線で示される)を用いて平衡化され得る。平衡化工程23は、当業者に周知の典型的な熱力学変数により特徴づけられる外部環境において、検討されているタンパク質を平衡化させるシミュレーションを含み得る。そのような熱力学的変数としては、一定の粒子数、一定圧力、および一定温度などを挙げることができるが、これらに限定されない。追加または代わりとして、平衡化工程23は、一定の粒子数、一定のシステム体積、および一定温度などを実現し得る。タンパク質が、シミュレーションループ25を開始する前にブロック23で平衡化される場合、平衡化された構造(即ち、平衡化された構造のコンピュータ表示)を用いて(インプットしたタンパク質構造22または真のネイティブ構造の追加または代わりとして)、検討されているタンパク質について、そしてシミュレーションループ25の最初の反復へのインプットについて、最初のコンタクトを決定することができる。典型的には、幾つかの弱安定性のコンタクトは、ブロック23の平衡化工程の間に単に熱揺らぎにより破壊され得るため、平衡化されたタンパク質は、わずかに少数の初期コンタクト(PDBネイティブ構造と比較して)を有し得る。幾つかの実施形態において、ブロック23の平衡化工程は、用いられない。幾つかの実施形態において、ブロック20で得られたインプット構造モデル22は、既に平衡化されている。文脈で他に示されない限り、本明細書に記載されたネイティブ構造の参照は、平衡化された構造を含むと見なされ得る。構造が、平衡化されていれば、複数の時間ステップ全体で適切に平均をとり(例えば、熱平衡においてタンパク質に関係する確率論的集団)、許容できるコンホメーション空間内に確率論的変動を収容することにより、方法10の残りの部分で用いられるネイティブ構造22を、ブロック20で得ることができる。文脈で他に示されない限り、平衡化されたタンパク質のネイティブ構造の参照は、この平均ネイティブ構造を参照し得る。
幾つかの実施形態において、多重鎖(例えば、凝集構造)を含むタンパク質の場合、方法10(図1)は、初期コンタクトの数の決定および/または集団座標アウトプット34の決定(即ち、シミュレーションループ25の各反復内の集団座標の実際の値)において鎖間および鎖内コンタクトの両方を含み得る。
幾つかの実施形態において、方法10は、ループ25のシミュレーションの際にタンパク質を強制的にアンフォールディングさせるのに用いられる集団座標のバイアスとして、コンタクト組(またはそのコンタクト組の標示)を用いる。より具体的には幾つかの実施形態において、タンパク質にバイアスをかけるのに用いられる集団座標は、一組の初期コンタクトのうちのコンタクトの数を含む。集団座標が他の形態を有し得るという一般性を失わずに、集団座標としてコンタクトの組の表示を用いる模範的実施形態を、以下に記載する。ループ25のシミュレーションのための最初のコンタクト組の標示は、ブロック20で得られた検討されているタンパク質のインプット(例えば、ネイティブ)構造モデル22から、そして/またはブロック23の平衡化工程のアウトプットとして得られた検討されているタンパク質の平衡化バージョンから作成され得る。任意の後の時間ステップで最初のコンタクト組(および対応する集団座標アウトプット34または集団座標の実際の値)のうちのコンタクト数の標示は、類似の手法で最新構造モデル32から決定され得る。検討されているタンパク質構造の各重い原子対(ijにより表示)の場合、方法10は、ネイティブコンタクト関数Qij(r)の使用を含み得る。幾つかの実施形態において、該コンタクト関数Qij(r)は、原子対ijと、該対ijの原子間の距離rijの関数を含み得る。1つの特定の実施形態において、該コンタクト関数Qij(r)は、式:
Figure 0006952351
(式中、rijは、検討されているタンパク質中の原子iとjとの核間距離である)を有する。方程式(1)の他のパラメータ:r、nおよびmは、適宜選択された定数であり得る。幾つかの実施形態において、m>nである。1つの特定の実施形態において、r=4.8Å(オングストローム)であり、n=6およびm=12である。図2は、模範的定数のための距離rに対する方程式(1)のコンタクト関数Qij(r)のプロットを示す。以下により詳細に説明される通り、コンタクト関数Qij(r)の滑らかな形態は、ポテンシャル関数Vが簡便に力に転換されて、順次、力が分子動力学エンジンにより用いられるように、ポテンシャル関数Vを公式化するために用い得る集団座標Qを可能にする。Qij(r)は通常、1未満であるため(rが0に近づくにつれて1に漸近的に近づく)、総和Q=ΣQij(検討されているタンパク質構造内の各原子対での総和)はほとんど常にネイティブ構造内の合計コンタクト数より小さい。コンタクト組を定義するのに用いられる構造モデルは、初期構造と称され得、この構造内のコンタクト全体の総和は、
Figure 0006952351
と称され得る。熱揺らぎまたはバイアス力のいずれかにより、この初期構造から逸脱する状態は一般に、1未満の初期コンタクトの割合を有する。実際に、全ての原子対ijについてQijを計算する必要がない場合があり、例えば閾値工程を利用して、かなり離れた幾つかの原子対ijでQij=0を設定することができる。先に議論された通り、幾つかの実施形態における集団座標は、タンパク質内の全原子ではなく重い原子および/または特定の重い原子に基づくことができる。例えば集団座標は、タンパク質内の全炭素原子またはタンパク質内の全α炭素原子に基づくことができる。
図2に示された方程式(1)のものと類似の関数形態および/または関数特性を有する多くの関数が存在する。方法10は、任意のそのような関数(例えば、rが零から∞になると関数が1から0になり、rの特徴的長さスケールを有する)をコンタクト関数Qij(r)として使用し得る。r、nおよびm(例えば、方程式(1)における)のパラメータは、タンパク質内の物理的な水素結合相互作用のおおよその範囲で連続関数を特徴づけるように選択され得る。
幾つかの実施形態は、以下により詳細に説明される通り、ループ25のシミュレーションの際にバイアシングポテンシャルをQijの関数として適用して、そのようなポテンシャルを個々の原子位置での力(例えば、ポテンシャルの導関数)として実装することが望ましくなり得るため、コンタクトに重みを与える(weight contacts)連続コンタクト関数(例えば、方程式(1)のコンタクト関数)(例えば、ヘビサイドまたは離散ステップ関数ではない)を使用し得る。したがって幾つかの実施形態において、Qijが確定された導関数を含むrの識別可能な関数であることが、望ましい。幾つかの実施形態において、ヘビサイドステップ関数またはステップ関数での多段階変動などの離散関数を用いて、ネイティブコンタクトを記載することができる。そのような公式は、一般に原子間相互作用に段階的なポテンシャル関数を用いる離散分子動力学(DMD)シミュレーションプロトコルに従い得る。
重い原子(非水素原子)間のペアワイズ距離の組{rij}により特徴づけられる任意の構造の実際の集団座標Q(例えば、方法10の集団座標アウトプット34)は、その場合、方程式:
Figure 0006952351
(方程式(2)において、Qijは、方程式(1)に示されており、総和
Figure 0006952351
は、インプット(例えば、ネイティブ)構造モデル22内の、またはネイティブ構造22自体からの原子対全体についてである)により特徴づけられ得る。上記方程式中の「initial」は、該総和が初期ネイティブ構造(典型的には適切にフォールディングした構造またはフィブリル構造のPDBモデル)に存在するそれらのコンタクトのみのものであることを示している。上記の方程式(2)に記載された実施形態において、方程式(2)の分母の量は、インプット(例えば、ネイティブ)構造モデル22または平衡化された構造におけるQij値の熱平均であり、方程式(2)の分子の量は、任意構造内(例えば、ブロック25のループの各反復で得られた最新構造モデル32の)のQijの総和である。分母の括弧〈・・・〉は、ネイティブPDB構造から開始して分子動力学シミュレーションを実施した場合の、ネイティブ状態、即ち熱が充満した構造(thermally−occupied structures)の平衡(熱)平均を示す。方程式(2)の量Qは、典型的には0〜1の間の数字である。
他の計量(例えば、方程式(2)以外の計量および/またはコンタクト以外の基準に基づく計量)は、追加的または代替的にネイティブ構造からのディスオーダーの度合いを特徴づけることが可能であり、結果的に幾つかの実施形態において、集団座標(例えば、全体的な集団座標)として用いることができる。これらの計量は、例えばネイティブ構造モデル22に対する最新構造モデル32の根平均二乗偏差(RMSD)、ネイティブ構造22の回転半径に対する最新構造モデル32の回転半径、ネイティブ構造22のバックボーン水素結合のうちの最新構造モデル32のバックボーン水素結合の数、ネイティブ構造22のSASAに対する最新構造モデル32の総溶媒露出表面積(SASA)、C.J.Camacho and D.Thirumalai.Kinetics and thermodynamics of folding in model proteins.Proc.Natl.Acad.Sci.USA,90(13):6369−6372,1 July 1993(参照により本明細書に組み入れられる)により記載された構造オーバーラップ関数、A.Das,B.K.Sin,A.R.Mohazab,and S.S.Plotkin,Unfolded protein ensembles,folding trajectories,and refolding rate prediction.J.Chem.Phys.,139(12):121925,2013(参照により本明細書に組み入れられる)により記載されたネイティブ構造からの一般化されたユークリッド距離、これらのパラメータの1つまたは複数の関数などを含み得る。幾つかの実施形態において、バイアシングシミュレーション(例えば、シミュレーションループ25)内で用いられるこれらの集団座標のそれぞれは、スカラーQとして表され得る。簡潔にするために、この記載は、単一の集団座標の使用を参照している。しかし文脈で他に示されない限り、集団座標の参照は、複数の集団座標の組み合わせの可能性を含むものと理解されなければならない。
幾つかの実施形態において、方法10のループ25は、式:
Figure 0006952351
(式中、Q(t)は、ユーザーに指定され得、集団座標/シミュレーションパラメータ26の一部であり得る、目的集団座標であり、Qは、任意の所与の時間ステップで最新構造モデルの実際の集団座標である)の時間依存性ポテンシャルとして一連の時間ステップでバイアスポテンシャルをアサートすることを含む。方程式(3)のポテンシャル関数が、ばねのポテンシャルエネルギー関数の外観を有し、パラメータkが、ばね定数と類似していることが、観察され得る。k>0の場合、方程式(3)のポテンシャル関数が増加し、実際の集団座標Qが、目的集団座標Q(t)と異なることも、観察され得る。ループ25のシミュレーションは、実際の集団座標Qが目的集団座標Q(t)を確実に追跡するようにポテンシャル関数を最小化すること(例えば、方程式(3)を最小化すること)を含み得る。幾つかの実施形態において、実際の集団座標Qと目的集団座標Q(t)の間の差異にペナルティを課す他の式を有するポテンシャル関数が、方程式(3)に加えて、またはその代わりに用いられ得る。類似の特徴を有する方程式(3)および他のポテンシャル関数が、本明細書に記載された集団座標のいずれかに用いられ得る。
幾つかの実施形態において、目的集団座標Q(t)は、インプット(例えば、ネイティブ)構造のためのQ(典型的には1または1の近似値であり得る)の値で開始し、経時的に減少する、時間の関数を含み得る。幾つかの実施形態において、Q(t)は、集団座標/シミュレーションパラメータ(複数可)26により指定され得る速度で幾つかの適切なレベルまで直線状に減少し得る。一般に目的集団座標Q(t)の特徴は、集団座標/シミュレーションパラメータ(複数可)26に従って指定または他の方法で構成され得る。時間の関数としての目的集団座標Q(t)、および時間の関数としての検討されているタンパク質の実際の集団座標Q(例えば、各時間ステップでの集団座標アウトプット34)の模範的アンフォールディング軌道を、図3に示す。より具体的には図3は、Aβアミロイドの典型的なバイアシングシミュレーションのための、時間に対する、例としての実際の集団座標Q(t)(例えば、方法10を用いてシミュレートされた集団座標アウトプット34)および滑らかな目的集団座標曲線(各時間ステップでのアウトプット集団座標34により提供され得るQ(t)102)のプロットを示す。
方程式(3)のポテンシャルV(Q,t)は、このポテンシャルを検討されているタンパク質の総エネルギーに付加することにより、実装され得る(ループ25のブロック30において)。該タンパク質は、自由エネルギーを最小化しようとするが、それを実行するのに時間がかかり、これが、図3に示されたタンパク質の目的集団座標Q(t)102と実際の集団座標Q(t)34の間のラグの一理由である。図3で示されたラグの別の理由は、検討されているタンパク質がネイティブ構造から摂動を加えられて、ポテンシャルVの存在下で目的集団座標Qとわずかに異なるタンパク質の実際の集団座標Q34の新しい平衡値の差が生じた場合に存在する零でない残りの力が存在するためである。
目的集団座標Q102の減少速度が、過度に急速であれば、検討されているタンパク質を特徴づける実際の集団座標Q34の値は、目的集団座標Q102の値から実質的に逸脱し得、V(Q,t)によるタンパク質の摂動は、高度に非平衡のアンフォールディング過程を導入する。幾つかの実施形態は、タンパク質がアンフォールディングすると、準平衡(断熱的)過程を維持するように試みる。目的集団座標Q(t)102の減少速度は、幾つかの実施形態において、実際の集団座標Q34が目的のQ102と大きく異ならない条件により決定され得る。そのような緩やかな(断熱的)摂動は、タンパク質に内在する安定化力よりもかなり大きくなり得る摂動力への応答ではなく、主に検討されているタンパク質内の相互作用により支配されるアンフォールディング過程を生じる。図3の実施例において、目的集団座標Q102は、典型的には0.4〜0.8の範囲内になり得る最終目的値104まで、一連の時間ステップで減少する。幾つかの実施形態において、この最終目的のQ値104は、0.5〜0.7の範囲内である。
方程式(3)の定数kの値を設定する上で、幾つかの自由が存在する。幾つかの実施形態において、この値kは、目的集団座標Qが変動する速度に応じて、2×10〜1×10kJ/molの範囲内で設定され得る。幾つかの実施形態において、この値kは、4×10〜8×10kJ/molの範囲内で設定され得る。1つの模範的実施形態において、kは、k=6×10kJ/molであるように設定され、Qが、15ナノ秒あたり約0.4の速度で変動した場合に、目的集団座標Q102から実際の集団座標Q34の小さな偏差を提供する(およそ0.02のQ−Q値を生じる)(図3参照)。バイアシング速度が緩やかである程(即ち、目的集団座標100の変動速度が緩やかである程)、許容できるk値が小さくなる。システムが目的Q(t)から逸脱する場合に適切なエネルギーコストを適用することにより、k値は、およそ0.02のQ−Qなど、偏差Q−Qに小さな値を提供するように選択され得る。定数kが、過度に小さい場合、Qは、Qから過度に大きく逸脱する傾向があり、他方でkが過度に大きい場合、方程式(3)のポテンシャルV(Q,t)の最小値からの小さな偏差でも大きな人工的力が導入されるため、該システムはエネルギー的に不安定になる。
検討されている所与のタンパク質では、幾つかの実施形態は、各バイアシングシミュレーションを独立させて、方法10のシミュレーションを数回(または少なくともループ25を数回)実施することを含む。これは、別の独立したランを実施するか否かに関する質問を含むブロック45により図1に例示される。ブロック45の質問が、肯定されれば、方法10は、シミュレーションループ25を再度実施するようにループバックする。例示された実施形態において、方法10は、ブロック20にループバックするが、これは必ずしも必須ではない。幾つかの実施形態において、方法100は、他の関数ブロックにループバックし得る。以下により詳細に記載される通り、独立したバイアシングシミュレーション(ランとも称され得る)の数は、任意の所与のシミュレーションにおいて露出される(即ち、アンフォールディングする)と観察されるポリマー領域が、確実に複数のシミュレーションで実際に一貫して露出され、特定の確率論的分子動力学シミュレーションにおけるまれな無作為変動の結果にならないように、支援し得る。したがって幾つかの実施形態は、独立したシミュレーションの数での少なくとも1つの有意な割合fが、バイアシングにより領域のアンフォールディングの1つまたは複数の印(例えば、露出の増加)を示した、タンパク質の領域(潜在的な候補エピトープ予測52である)を検討する。
幾つかの実施形態において、割合fは、0.8よりも大きくなるように選択される。幾つかの実施形態において、割合fは、0.85よりも大きくなるように選択される。1つの特定例の実施形態において、割合fは、エピトープを示す8のシミュレーションのうち7、エピトープを示す9のシミュレーションのうち8、またはエピトープを示す10のシミュレーションのうち9などのいずれかに対応するf=0.87になるように選択される。独立したシミュレーションの数は、典型的には8以上になり得るが、これは必須ではない。
検討されているタンパク質が、以下に記載されるAβ線維などの凝集したフィブリル構造を含む場合、所与のシミュレーションにおいて、領域がモノマー(ペプチド鎖のいずれか)のいずれかにおいてアンフォールディング(例えば、露出されている)の1つまたは複数の印を示し、そのようなエピトープが、シミュレーションの割合gにおいて確実に露出されることが見出されるならば、該領域は、エピトープであると見なされ得る。幾つかの実施形態において、割合gは、0.8よりも大きくなるように選択される。幾つかの実施形態において、割合gは、0.85よりも大きくなるように選択される。1つの特定例の実施形態において、割合gは、g=0.87になるように選択される。
ブロック45の質問が、否定された場合、方法10は、ブロック50に進行する。ブロック50は、候補エピトープを同定しようとして、ブロック25のシミュレーション(例えば、シミュレーショループ25による各反復またはラン)のシミュレーション結果を分析することを含む。図1の実施形態において、ブロック50は、ブロック25のシミュレーションループの実施されているアウトプットとして示される。これは、必須ではない。幾つかの実施形態において、ブロック50の幾つか、または全ては、シミュレーショループ25の中で実施され得る。
図4Aおよび4Bは、方法100に供され得る模範的な凝集構造についての模範的なシミュレーション結果のデータを示す。特に図4Aは、3回対称Aβ構造2M4Jの鎖Bの残基指数に対する初期Qが0.8となる目的集団座標Qにバイアスをかけた時の溶媒露出表面積(SASA)の変動を示し、図4Bは、各鎖の所与の区分(例えば、残基23〜28)が独立して検討され、各シミュレーションのランが、独立して検討されるような模範的凝集構造への図4の方法の適用を略図で示す。図4Bのデータは、Aβ40からのシミュレーションデータであり、純粋に例示的明瞭さのために3つのペプチド鎖および3つのシミュレーションのみが示されている。図4A、4B、5A、5Bおよび5Cで示される方法の特定の例において、ブロック50の候補エピトープ選択工程で用いられるデータが、シミュレーショループ25の各ランについて、集団座標バイアスが最終レベルに達した後の適切な時間に得られて、検討されているシステムを平衡にすることができる。方程式(1)〜(3)により記載された集団座標バイアスの特定の例において、ブロック50の候補エピトープ選択工程で用いられるデータは、Qが最終レベルに達した後の適切な時間(例えば、20〜200ns程度)に得ることができる(図3参照)。
図4Aは、10の独立したシミュレーションで、初期構造の80%にバイアスをかけた後、3回対称Aβ構造2M4Jの1つのペプチド鎖について残基指数の関数として各残基の溶媒露出表面積(SASA)の変動の例示的なプロットを示す。各図4Aの軌道は、1回のシミュレーション(またはラン)からの結果を示す。図4AプロットのX軸は、例示されたペプチド鎖のためのアミノ酸(または残基)指数である。SASAは、HOに接近し得る表面積を表す。図4AプロットのY軸は、独立したシミュレーション(検討されているタンパク質の初期構造22のものと比較)のそれぞれの結論での、最新構造32(図1)でのSASAの変動(ΔSASA)である。正のΔSASAは、関連の残基指数の領域内でのアンフォールディングを示すと見なされ得る。このΔSASAパラメータは、少なくとも一部がシミュレーションループ25で決定された最新構造モデル32に、そして/または初期構造モデル22(図1参照)への最新構造モデル32の比較に、基づいてブロック50で作成され得、局所ベースで(例えば、残基ごとに)決定され得る、局所アンフォールディングの印54の非限定的例である。幾つかの実施形態において、追加的または代替的な局所アンフォールディングの印54が、局所的に(例えば、残基ベースで)ブロック50で決定および/または分析されて、候補エピトープ52の予測で支援することができる。そのような局所アンフォールディングの印54は、シミュレーションループ25で決定された最新構造モデル32および/または初期構造モデル22への最新構造モデル32の比較に基づき得る。非限定的例としては、そのような追加的または代替的な局所アンフォールディングの印54としては、各残基の損失したコンタクトの数(最新構造モデル32を初期構造モデル22に比較した場合)、所与のコンホメーション集団においてどれ程の運動を残基が受けるかを表す、各残基のネイティブ構造モデル22に対する最新構造モデル32の根平均二乗揺らぎ(RMSF)、各残基の損失したバックボーン水素結合の数(最新構造モデル32を初期構造モデル22に比較した場合)、各残基の相互作用のポテンシャルエネルギー(最新構造モデル32を初期構造モデル22に比較した場合)、上記パラメータの組み合わせなどを挙げることができる。
初期構造の80%の集団座標バイアシングでの図4Aの例では(例えば、Q=0.8Qinitial)、確実に増加したSASAと共に出現する2つの領域:残基14〜17および残基25〜30が認められる。図4Aに示される実施形態において、側鎖表面露出における変動のみが示され、それにより全てのグリシン残基が、必ず零というSASA変動を有するが、予測にペナルティを課さない。他の実施形態は、グリシン残基のバックボーンのSASA変動をカウントする。方法100(図4)の例示的な実施形態を含む幾つかの実施形態において、ブロック50の分析は、10の独立したランの適切な閾値割合fが露出の増加(例えば、ΔSASA>0)を示す領域を検索する(このプロットにおいて、それらの領域は、残基14〜17および25〜30である)。
図4Bは、バイアシングシミュレーションが3回反復される(図4Bの行に示されたラン1、ラン2およびラン3)3つの同一ペプチド鎖(図4Bの列に示された鎖A、鎖Bおよび鎖C;各ペプチド鎖(本明細書では以後、「鎖」と称される)は、例えばフィブリル内のコピーAβペプチドであり得る)の例としての凝集構造(本明細書ではPDB 2M4Jから得られる)例示的結果を示す。図4Bの各列は、同じペプチド鎖の異なるシミュレーションランを示すが、各行は、同じシミュレーションランの異なるペプチド鎖を示す。図4Bのプロットの下の3×3の配列は、残基23〜28からなる残基の特定の群での「ズームイン」である。残基の全範囲を、シミュレーションラン1での図4Bの最上行に示される。図4Bの各プロットのX軸は、残基指数(例えば、アミノ酸指数)を含む。図4Bの各プロットのY軸は、各残基指数に対応する溶媒露出表面積の変動(ΔSASA)を表す(検討されている鎖の初期構造のものとの比較)。図4Bの水平軸を横切る3つの鎖それぞれについては、最上のプロットは、最初の独立したシミュレーション(「ラン1」)の1〜40の残基指数の範囲でのΔSASAを示し、最上部からの二番目のプロットは、ラン1の指数23〜28についてのΔSASAの詳細を示し、最上部からの三番目のプロットは、二番目のシミュレーション(「ラン2」)の指数23〜28についてのΔSASAの詳細を示し、一番下のプロットは、三番目のシミュレーション(「ラン3」)の指数23〜28についてのΔSASAの詳細を示す。
所与の鎖の区分(本明細書では残基23〜28)では、各鎖(即ち、図4Bの各列)を、独立して分析する。例示的実施形態において、各ラン(即ち、図4Bの行2、3および4のそれぞれ)で、該当するペプチド配列の残基全てがバイアシングにより正のΔSASAを有するような鎖が少なくとも1つ存在する場合には、エピトープが同定され得る。図4Bの例示において、所与のランについてのこの基準を満たす鎖区分を、太く示しており(ラン1の行の中央のパネル、ラン2の行の左パネル、ならびにラン3の行の中央および右パネル)、基準を満たさないものは、細い線である。図4Bのデータは、PDB構造2M4Jから開始したAβ−40のシミュレーションデータであり、明瞭に示すために3つの鎖および3つのシミュレーションのみを示している。候補エピトープは、各シミュレーションランで、またはシミュレーションランの数の適切な閾値割合f以上で、少なくとも1つの鎖において露出されるため、図4Bの実施例は、エピトープの群が潜在的な候補エピトープとして、またはより一般に、より大きな潜在的候補エピトープの一部として選択される方法を示している。
先に議論された通り、所与のシミュレーションのΔSASAは、本明細書に記載されたシミュレーション法に従ってエピトープを同定するのに用いられ得る唯一の局所アンフォールディングの印54(図1)を表す。幾つかの実施形態において、エピトープを同定するのに用いられ得る他の追加的または代替的な局所アンフォールディングの印54としては、各残基の損失したコンタクトの数(最新構造モデル32を初期構造モデル22に比較した場合)、所与のコンホメーション集団においてどれ程の運動を残基が受けるかを表す、各残基のネイティブ構造モデル22に対する最新構造モデル32の根平均二乗揺らぎ(RMSF)、各残基の損失したバックボーン水素結合の数(最新構造モデル32を初期構造モデル22に比較した場合)、各残基の相互作用のポテンシャルエネルギー(最新構造モデル32を初期構造モデル22に比較した場合)、上記パラメータの組み合わせなどが挙げられるが、これらに限定されない。そのような局所アンフォールディングの印54は、シミュレーションループ25において決定された最新構造モデル32および/または初期構造モデル22への最新構造モデル32の比較に基づき得る。確率論的熱揺らぎへの感受性を低下させるために、局所アンフォールディングの印54を、目的集団座標が最後の値に達した後の複数の時間ステップで平均することができる。局所アンフォールディングの印54のそのような平均化は、目的集団座標が最後の値に達した後に行われるため、局所アンフォールディングの印54のそのような平均化は、平衡平均化(equilibrium averaging)と称され得る。文脈で他に示されない限り、本明細書での局所アンフォールディングの印54の参照は、局所アンフォールディングの印54が平衡平均化される可能性を含むものと理解されなければならない。
上述の通り、Aβペプチドは、複数の異なる多形で凝集する傾向がある。多形は、フィブリル形態およびオリゴマー構造集団の両方に存在する。
本明細書に記載された複数の実施例結果は、それぞれが独自の形態、つまり9のAβ−40ペプチド(またはモノマー)からなる3回対称構造(PDBエントリー2M4J)、12のAβ−40モノマーからなる2回対称構造(PDBエントリー2LMN)、12のAβ−42モノマーからなる一本鎖の平行なインレジスタ(in−register)構造(PDBエントリー2MXU;ディスオーダーN−末端残基1〜10がこの構造モデルに付加されている)、および18のAβ−40モノマーからなる3回対称構造(PDBエントリー2LMP;ディスオーダーN−末端残基1〜8がこの構造モデルに付加されている)、を有する複数のAβ線維株(Aβ fibril strains)の結果を表す。2つのさらなるコンピュータ計算アッセイ(N−末端にディスオーダー残基1〜8(これらはPDB構造から失われている)を付加することによる構造2LMNでの1つと、フィブリルに沿って最上および最下のモノマーを構造化されたコンホメーションで残存するように制限して、中央の10のモノマーをディスオーダーさせることによる構造2MXUでの1つ)を実施した。シミュレーションは、各初期構造について実施した(方法10のループ25、ならびに参照により本明細書に組み入れられる、K.Vanommeslaeghe,E.Hatcher,C.Acharya,S.Kundu,S.Zhong,J.Shim,E.Darian,O.Guvench,P.Lopes,I.Vorobyov,and A.D.Mackerell.Charmm general force field:A force field for drug−like molecules compatible with the charmm all−atom additive biological force fields.Journal of Computational Chemistry,31(4):671−690,2010;およびP.Bjelkmar,P.Larsson,M.A.Cuendet,B.Hess,and E.Lindahl.Implementation of the CHARMM force field in GROMACS:analysis of protein stability effects from correlation maps,virtual interaction sites,and water models.J.Chem.Theo.Comp.,6:459−466,2010に記載されたCHARMM力場パラメータを、TIP3P水と共に用いて)。シミュレーションには、0.1Mの濃度のNaClが含まれた。各システムは、5nsで平衡化されて、その間にQを測定して初期値Q(t=0)を提供した。
他に示されない限り、バイアシングポテンシャルの中心は、15nsの期間に本来の値の0.6に移動し、その間に最初に存在した構造の量を上記のとおり本来の値の約60%まで系統的に減少させた。一組の初期エピトープ予測のために、本発明者らは、初期構造Q(t=0)の約71%に対応する構造、例えば初期集団座標の約0.71に対応する集団座標Qを分析した。先に議論された通り、検討されているタンパク質は、典型的には約100nsの時間ウインドウのために初期構造の71%を有するように制限した。
検討されている各タンパク質について、9または10(または幾つかの他の適切な数)の独立したランを実施することができ、各独立したランは、分子動力学エンジンのサーモスタット乱数発生器のランダムシーディングを含み得る。9または10(または幾つかの他の適切な数)の独立したランを実施することは、任意の予測されたエピトープが本物であり、レアまたはランダムな発生でないことの若干の保証を与える。先に議論された通り、幾つかの実施形態は、任意の鎖が全てのランの割合f(例えば、f>0.87)でエピトープを露出する場合に、該エピトープを潜在的な候補エピトープと同定することを含む。検討されているタンパク質の進化(evolution)をバイアスおよびシミュレートした後(ブロック30)、幾つかの実施形態は、最初の構造からバイアシング後の集団の構造までのSASA(または本明細書で議論されたアンフォールディングの他の適切な尺度)の変動を比較して、各残基がアンフォールディングした程度を確認することにより、結果を分析することを含む。SASAを用いる実施形態において、幾つかのそのような実施形態は、グリシン以外の各残基では側鎖表面積を使用することができ、グリシンの場合には幾つかの実施形態は、総残基表面積(グリシンではバックボーン表面積になる)を用いることができる。
タンパク質データバンク(PDB)(http://www.rcsb.org)および本発明者らが検査した経験的システムに含まれるAβ構造間の1つの差異は、PDB構造が鎖の残基全てを必ずしも含まないことであり、これは、幾つかの残基が経験的に決定されたシステムでディスオーダーされており、そのため信頼性のある座標がPDB構造の一部として預託され得ないためである。PDB ID 2LMNおよびPDB ID 2LMPに対応する構造は、各モノマーについて残基9〜40のみを含み、残基1〜8からなるN−末端領域を失っており、PDB 2MXUに対応する構造は、各モノマーについて残基11〜42のみを含み、N−末端残基1〜10を失っている。PDB 2M4Jは、各モノマーについて全40の残基を含む。N−末端領域を失ったPDB構造の場合、幾つかの実施形態は、ディスオーダーN−末端領域が明白にPDB構造内に付加されるシステムから最終的なエピトープ予測を作成することを含み得る。オーダータンパク質またはフィブリルの残り部分でのポリマーの立体非交差エントロピーにより、ディスオーダー末端領域を構造の残り部分につなぐためのポリマーエントロピーコストが存在するため、ディスオーダーN−末端テールの存在は潜在的に重要な影響になり得る。この理由から、具体的にはN−末端が存在しないモデルを用いた2LMNのN−末端領域についての予測は、幾らか過度に協調される可能性がある。
図5A、5Bおよび5Cは、幾つかの実施形態において、シミュレーション結果を分析して、ブロック50の一部として用いられ得るタンパク質内のエピトープを同定するための方法100を略図で示している。図5A、5Bおよび5Cは、検討されているタンパク質が複数のペプチド鎖を含む凝集構造である場合の、ブロック50の一部として用いられ得る方法100の特定の例を示している。
図5Aは、図4Bに関連して記載された、先に議論された手順の一般化である方法100の一部102を表している。方法100の一部102は、簡潔にするために方法102と称され得る。図5Aの方法102の手順は、各独立したシミュレーション(即ち、各ラン)で1回、そして各ランの中の各ペプチドで1回実施され得る。検討されているタンパク質が、一本鎖を含む場合に、方法102が、各独立したランで1回実施され得ることは、理解されよう。例示された実施形態において、方法102は、シミュレーションループ25(図1)で決定された最新構造モデル32から図4Bの下の9のプロットに示されたマトリックスのタイプまで進める方法を記載している。図4Bが残基の特定の群(図4Bの実施例では残基23〜28)ではΔSASAプロットのマトリックスを示すこと、そして図4Bのマトリックスが、凝集構造における複数の独立したランおよび複数の鎖に及ぶことは、理解されよう。同様に、図5Aに示された方法102は、残基の複数の群のうち各群のマトリックスの作成をもたらし得る。一般にこれらの群は、異なるサイズを有し得る(ウインドウサイズとも称され得る)。
方法102は、現行のランおよび現行の鎖における各残基のための局所アンフォールディングの印54を決定することを含むブロック105で開始する。先に議論された通り、局所アンフォールディングの印は、ブロック25のシミュレーションループで決定された最新構造モデル32に基づいて決定され得る。図5Aの実施形態の方法102の特定の例において、用いられる局所アンフォールディングの印は、一般性を失わずにΔSASAである。そのため方法102は、ウインドウサイズパラメータを初期化することを含むブロック110に進行する。次の反復において、ブロック110は、ウインドウサイズパラメータを増進することを含み得る。ブロック110のウインドウサイズパラメータは、方法102の特定の反復において正のΔSASAが存在するか否かを決定するために検討される群のサイズ(即ち、残基の数)を表す。図4Bの実施例の場合、検討されている残基は、6のウインドウサイズに対応する残基23〜28であった。以下により詳細に説明される通り、各ウインドウサイズは、図6に示されたファイアプロットマトリックスの行を表し得る。
方法102はその後、ブロック120に進行して、各群が現行のウインドウサイズと等しい複数の残基を有するような複数の群に、現行のペプチド鎖の残基指数を解析する。所与の鎖(所与の残基指数を有する)について、ブロック110のウインドウサイズが大きい程、ブロック120の群の数がより少なくなり、その逆もあてはまることは、理解されよう。その後、方法102は、群指数カウンタを初期化(最初の反復)または増進(続いての反復)するブロック130に進行する。群指数カウンタはまた、ウインドウ位置またはウインドウ位置指数とも称され得る。
その後、方法102は、現行の群が群の全ての残基でΔSASA>0を有するか否かの質問を含むブロック140に進行する。ブロック140の質問が、肯定である場合、方法102は、ブロック170で終了する前に、ブロック150に進行して、正の結果を現行の群について記録する。幾つかの実施形態において、ブロック150は、現行の群に属する残基のΔSASA、および/または現行の群に属する残基のΔSASAの累積合計を記録することを含み得るが、この情報は、ブロック105から入手できるため、これは必須ではない。ブロック140の質問が、否定であれば、方法102は、ブロック170で終了する前に、ブロック160に進行して、負の結果を現行の群について記録する。ブロック170は、現行の群が現行の鎖における最後の群であるか否かの質問を含む。現行の群が、最後の群でなければ、方法102は、ブロック130にループバックして、群指数を別の反復のために増進する。ブロック170の質問が、肯定であれば、方法102は、現行のウインドウサイズが検討されるべき最大のウインドウサイズであるか否かの質問を含むブロック180に進行する。幾つかの実施形態において、最大のウインドウサイズは、12残基に設定されている。幾つかの実施形態において、この最大のウインドウサイズは、10残基であり得る。現行のウインドウサイズが、最大のウインドウサイズでない場合、方法102は、ブロック110にループバックして、ウインドウサイズを別の反復のために増進する。
現行のウインドウサイズが、最大のウインドウサイズである場合、方法102は、完了して、以下により詳細に記載される図5Bの方法202に移行する。方法102の結論として、方法100が、特定の鎖および特定のランについて、群に関するアンフォールディングを示す(例えば、特定の一実施形態の場合、群内の残基全てでΔSASA>0)局所アンフォールディングの印54を呈する様々な異なるサイズの複数の残基群を決定した。先に議論された通り、方法102は、検討されているタンパク質の各鎖について1回、そして検討されているタンパク質の各シミュレーションランについて1回実施して、様々なペプチド鎖および様々な独立したシミュレーションランで、様々な残基群に関する類似の情報を発生させることができる。各鎖および各独立したランについて方法102を実施した後、方法102が、複数の残基群それぞれについて(即ち、複数の鎖および複数のランに及ぶマトリックス)、そして群が局所アンフォールディングの印を呈するか否かを識別することができるように、図4Bに例示されたものと類似のデータのマトリックスを作成し得ることは、理解されよう。
各ランについて、そして各ペプチド鎖について、方法102の実行の結論として、方法100は、図5Bに示された方法100の部分202に進行し得る。方法100の部分202は、簡潔さのために方法202と称され得る。先に議論された通り、幾つかの実施形態は、独立したシミュレーションの数での少なくとも1つの有意な割合fがバイアシングにより群のアンフォールディングの1つ以上の印(例えば、露出の増加)を示した、タンパク質の残基の群(潜在的な候補エピトープ予測52である)を検討し得る。先に議論された通り、検討されているタンパク質が、凝集構造である場合、所与のシミュレーションにおいて、残基の群が、モノマーのいずれか(ペプチド鎖のいずれか)においてアンフォールディングの1つまたは複数の印(例えば、露出されている)を呈し、そしてそのようなエピトープが、シミュレーションの割合gにおいて確実に露出されることが見出されれば、その残基の群は、潜在的な候補エピトープであると見なされ得る。図4Bに示された例の残基群において、図4Bの鎖(A、BおよびC)の少なくとも1つが、独立したランの総数の少なくとも1つの割合gにおいて検討されている群で零よりも大きなΔSASAを呈することを要件として、独立したランの総数の割合gでのペプチド鎖のいずれかにおいてアンフォールディングの呈された印を記載した。例示された実施形態において、方法202は、この閾値工程、および図6の「ファイアプロット」に例示されたデータのタイプに達する方法を記載している。
方法202は、群指数を初期化(最初の反復において)および増進すること(別の反復において)を含むブロック210で開始する。ブロック210の群指数は、方法102でどのデータが得られるかについて残基群の1つを参照し得る。方法202はその後、ラン指数を初期化(最初の反復において)および増進すること(続いての反復において)を含むブロック220に進行する。ブロック220のラン指数は、独立したランの特定の1つを参照し得る。方法202はその後、現行のランおよび現行の群について、現行の群の残基全てでΔSASA>0を有する少なくとも1つの鎖が存在するか否かの質問を含むブロック230に進行する。このブロック230の質問は、現行のランおよび現行の群について、ブロック150(図5A)に記録された正の結果を有する少なくとも1つの鎖が存在するか否かに関して質問することと同等である。検討されているタンパク質が、凝集構造でない場合、ブロック230の質問は、検討されているタンパク質が、現行のランおよび現行の群について、現行の群の残基全てについてΔSASA>0を有するか否かを検討すし得る。ブロック230の質問が、肯定であれば、方法202は、ブロック250で終了する前に、アンフォールディングカウンタを増進することを含むブロック240に移行する。ブロック230の質問が、否定であれば、方法202は、アンフォールディングカウンタを増進せずに、直接ブロック250に移行する。
ブロック250は、現行のランが最後のランであるか否かの質問を含む。もしそうでなければ、方法202は、別の反復の前にブロック220にループバックして、ラン指数を増進する。ブロック250の質問が、肯定であれば、方法202は、現行の残基群が独立したランの十分な割合f、gにおける潜在的な候補エピトープであることが示されるか否かの質問を含むブロック260に進行する。この割合f、gは、構成可能なパラメータであり得る。本明細書の他の箇所で議論される通り、幾つかの実施形態は、独立したシミュレーションの数での少なくとも1つの有意な割合fが、バイアシングにより群のアンフォールディングの1つまたは複数の印(例えば、群内の残基の全てでΔSASA>0)を示す、タンパク質の残基の群(潜在的な候補エピトープ予測52である)を検討し得る。先に議論された通り、検討されているタンパク質が、凝集構造である場合、所与のシミュレーションにおいて、残基の群が、ペプチド鎖のいずれかにおいてアンフォールディングの1つまたは複数の印(例えば、群の残基の全てでΔSASA>0)を呈し、そしてそのようなエピトープが、シミュレーションの割合gにおいて確実に露出されることが見出されれば、その残基の群は、潜在的な候補エピトープであると見なされ得る。ブロック260の質問が、否定であれば、方法220は、現行の群が最後の群であるか否かの質問を含むブロック280に進行する。ブロック280の質問もまた、否定であれば、方法202は、方法202の別の反復の前に、ブロック210にループバックして、群指数を増進する。ブロック260の質問が、肯定であれば、現行の群は、潜在的な候補エピトープであると見なされ得、方法202は、ブロック270に進行する。
ブロック270は、図6の「ファイアプロット」に示されるタイプのデータ(蓄積された局所アンフォールディングの印272)を含むデータ構造を作成することを含む。特定の群(即ち、方法202の現行の群)では、ブロック270は、群の残基それぞれが局在化されたアンフォールディングを示す局所アンフォールディングの印54を呈する群の全例について、組み合わせた局所アンフォールディングの印272を蓄積することを含み得る。例えば局所アンフォールディングの印54が、ΔSASAである場合、ブロック270は、群の残基それぞれがΔSASA>0を呈する群の全例について、組み合わせた(例えば、相加または平均の)ΔSASAを含む組み合わせた局所アンフォールディングの印272を蓄積することを含み得る(方法202の現行の群について)。蓄積された、または組み合わせられた局所アンフォールディングの印272(群により指数化)は、図6のファイアプロットに示され、以下により詳細に説明されたデータ構造を提供するために用いられるデータのタイプである。特定の群では、作製されたブロック270のデータは、蓄積された局所アンフォールディングの印272を、群の長さまたはウインドウサイズ(即ち、群の残基の数)および群の残基参照と共に含み得る。幾つかの実施形態において、群の残基参照は、群の中央の残基を含み得る。幾つかの実施形態において、群の残基数が等しい場合に、群の中央のすぐ下の指数を有する残基が、群の残基参照であるように選択されるように、カスタムが採用される。幾つかの実施形態において、群の残基参照を割り付けるために、異なるカスタムが、採用され得る。例えば、群内の最小の指数を有する残基が、群の残基参照として選択され得るように、カスタムが採用され得る。
最終的に方法202は、ブロック280に進行する(ブロック260のノーの分岐またはブロック270のいずれかを介して)。ブロック280の質問が、肯定であれば、方法202は、完了する。
先に議論された通り、方法202により作成されたデータ構造は、図6に示された模範的ファイアプロットなどのファイアプロットの形態で表され得る。図6A〜6Dは、本開示で検討されている3つの模範的なフィブリル株(PDB 2M4J、2LMNおよび2MXU)についてのエピトープ予測(図6A〜6C)を与える複数の「ファイアプロット」を、フィブリルのいずれかの端部にある2つのキャップモノマーがアンフォールディングしないように制限したPDB構造2MXUの予測(図6D)と共に示している。この図6Dの制限は、長いフィブリルのために存在する境界条件を模倣している。図6のプロットのX軸は、群の残基参照の残基指数を示している。方法202のブロック270に関係して先に議論された通り、幾つかの実施形態において、残基の対応する群の中央の残基が、群の残基参照であると見なされる。図6のファイアプロットに示された各長方形は、基になる残基の群を参照する群の残基参照である。図6のプロットのY軸は、対応する群の配列長(即ち、群または潜在的な候補エピトープの残基の数/ウインドウサイズ)を示す。図6のプロットの側部に示された凡例に示される通り、図6のプロットで陰影のあるグレースケールは、同定された群の蓄積された局所アンフォールディングの印272を示す。例示された図6の実施形態の場合、この蓄積された局所アンフォールディングの印は、各群における残基のΔSASAの総和を含む。図6のプロットの全てが、Q=0.71という集団座標目的値のために示されている。Qの他の値が、エピトープ予測に用いられ得、それらは、類似の結果を与える傾向がある(例えば、複数のQ値で「ファイアプロット」を示す図7を参照されたい。下の2つのパネルは、同じQ値で2つの異なる平衡化時間を示している)。
方法202(図5B)の実行の結論として、方法100は、図5Cに示された方法100の一部302に進行し得る。方法100の一部302は、簡潔にするために方法302と称され得る。方法302は、図6のファイアプロットにより表される形態のデータ構造を使用して、最終的な候補エピトープ52(図1)を予測することを含む。図6に示されたファイアプロットの場合、最終的な候補エピトープ52は、図8および以下の表1に示される。
方法302は、最大ウインドウサイズになるようにウインドウサイズを初期化すること(最初の反復で)、そしてその後、続いての反復でウインドウサイズを減少させること、を含むブロック310で開始する。幾つかの実施形態において、最大ウインドウサイズは、12残基長に設定され、それは方法302により予測された候補エピトープが、12残基という最大の可能な長さを有することを意味する。幾つかの実施形態において、最大ウインドウサイズは、10残基長に設定される。候補エピトープが10または12残基よりも長くなり得ることが、予期または発見されたら、最大ウインドウサイズを適宜、より大きな数に設定することができる。方法302の初めに最大ウインドウサイズになるようにウインドウサイズを初期化することは、方法302が図6のファイアプロットのY軸の最上部で検索を開始することを効果的に意味する。ブロック302の後、方法300は、残基指数を初期化(最初の反復で)および増進(続いての反復で)することを含むブロック320に進行して、方法302により特定のウインドウサイズで(即ち、図6のファイアプロットの水平の行)群の残基参照(図6のファイアプロットの長方形)をスキャンさせて、群の残基参照が非零の蓄積された局所アンフォールディングの印を有するようにヒットを探す。
ブロック320において残基指数を初期化した後、方法302は、蓄積された局所アンフォールディングの印272が現行の残基指数および現行のウインドウサイズで零よりも大きいか否かの質問を含むブロック330に進行する。局所アンフォールディングの印54がΔSASAである特定の実施形態において、ブロック330の質問は、蓄積されたΔSASAが、現行の残基指数および現行のウインドウサイズで零よりも大きいか否かの質問を含み得る。肯定的なブロック330の質問は、図6のファイアプロットの特定の行(ウインドウサイズ)および列(残基指数)における長方形の存在に対応する。本発明者らが、図6Aに示されたファイアプロットデータ構造の例を検討する場合、最初の肯定的なブロック330の質問が、ウインドウサイズ7および残基指数26、即ち、(残基指数,サイズ)=(26,7)で行われる。群の残基参照が、基になる群の中央の残基に対応するカスタム(図6で用いられる)の場合、この肯定的なブロック330の質問に関連する群(候補エピトープ)は、残基23〜29を含む。
ブロック330の質問が、肯定であれば、方法302は、ブロック340に進行して、ブロック330の「ヒット」の基になる残基の群が、方法10(図1)により予測された候補エピトープ52として同定および記録される。図6Aの実施例では、このブロック340の候補エピトープ52(即ち、(残基指数,サイズ)=(26,7))は、表1(下記)に示され、構造2M4Jに関して図8に示された最も長い候補エピトープとして、図6Aで検討されている。
方法302はその後、ブロック340に記録された候補エピトープ52およびブロック340に記録された候補エピトープ52内に存在する全てのサブエピトープの、さらなる検討からの除去を含むブロック350に進行する。例示された図6Aの実施例の場合、ブロック350は、ブロック340に記録された候補エピトープ52(即ち、(残基指数,サイズ)=(26,7)での7残基エピトープ)を図6Aから除去することを含み得る。
ブロック350はまた、ブロック340の候補エピトープ52内に存在するサブエピトープを除去することを含む。図6Aのファイアプロットの場合、(残基指数,サイズ)=(26,7)の最初のブロック240の候補エピトープは、残基23、24、25、26、27、28および29を含む。したがってブロック350の中でも除去される(26,7)のサブエピトープは、それぞれ残基23、24、25、26、27、28、および24、25、26、27、28、29に対応し、(残基指数,サイズ)=(26,7)の最初のブロック340の候補エピトープ52内に存在する、(25,6)および(26,6)の長方形を含む。最初のブロック340の候補エピトープ52が(残基指数,サイズ)=(26,7)にある図6Aの例でのブロック350の一部として除去される他のサブエピトープは、(25,5)、(26,5)、(27,5)、(24,4)、(25,4)、(26,4)、(27,4)、(23,2)、(24,2)、(25,2)、(26,2)、(27,2)、(28,2)、(23,1)、(24,1)、(25,1)、(26,1)、(27,1)、(28,1)および(29,1)を包含する。図6Aのファイアプロットのための最初のブロック340の候補エピトープ52(即ち、候補エピトープ(26,7))のためのサブエピトープのブロック350の除去は、図16のプロット(A)を図16のプロット(B)と比較することにより図16に示される。これらの2つのプロットの比較は、(26,7)のブロック340の候補エピトープ52のサイズと同じである底の長さを有する円錐形領域からのサブエピトープの除去を示す。
ブロック350における候補エピトープ52およびサブエピトープの除去の後、方法302は、現行の残基指数が最後の残基指数(例えば、図6のファイアプロットの行の最後の残基)であるか否かについての質問を含むブロック360に進行する。ブロック360の質問が、否定であれば、方法302は、ブロック320にループバックして、別の反復のために残基指数を増進する。ブロック360の質問が、肯定であれば、方法302は、ウインドウサイズが最後のウインドウサイズ(例えば、図6のファイアプロットで検討される最下の行)であるか否かに関する質問を含むブロック370に進行する。典型的には方法302で検討される最も小さいウインドウは、3または4(3 or for)残基長であろう。ブロック370の質問が、否定であれば、方法302は、ブロック310にループバックして、ウインドウサイズを別の反復(即ち、図6のファイアプロットのより下の行のスキャン)のために減少させる。ブロック370の質問が、肯定であれば、方法302を終了し、ブロック340の候補エピトープ52を、図1のブロック50および方法10により予測された候補エピトープ52としてアウトプットされる。
方法302が、図6のファイアプロットの最上から下向きに1行ずつスキャンして、群の残基参照が非零の蓄積された局所アンフォールディングの印272を示す長方形を探すことを含むことは、上記により理解されよう。各ブロック340の候補エピトープ52の決定により、候補エピトープ52および対応するサブエピトープを、さらなる検討から除去する。先に議論された通り、図16のプロット(B)は、(26,7)の第一の候補エピトープ52およびそのサブエピトープの除去の後の図6Aのファイアプロットを示す。方法302は、さらなる候補エピトープ52のために図16のファイアプロット(B)内を引き続き探す。ブロック330の質問が肯定となる次の候補エピトープ52は、(残基指数,サイズ)=(27,6)である(図16のプロット(B)参照)。この候補エピトープ(偶数の残基長の群で、中央のすぐ下の指数を有する残基が、群の残基参照として選択されるカスタムに従って残基25、26、27、28、29および30に対応する)は、図8および表1にも示されている。この候補エピトープ52およびそのサブエピトープの除去が、図16のプロット(C)に示されている。
方法302は、さらなる候補エピトープのための図16のプロット(C)のスキャンを続ける。図6のファイアプロットの基になるデータにおける複数の近隣の基が、同じ長さ(例えば、同じy軸の高さ)を有する場合、そのような各基は、候補エピトープの予測52として選択され得る。図6Aのファイアプロットの場合、2つの隣接するエピトープが、残基5〜9および6〜10に対応する(残基指数,サイズ)=(7,5)および(8,5)に存在する。これは、残基5〜10により定義される本質的に全ての領域が、良好な候補エピトープ52になり得ることを示唆している。さらに、図6Aの場合、残基14〜17および36〜39を含む2つの4残基長エピトープが、出現する。他のフィブリル株でのエピトープは、データ構造の他の図6プロットから同様に構築され得る。図8および表1は、図6のファイアプロットに示された構造について方法10により予測された候補エピトープ52の完全なリストを示す。予測されたエピトープは最初に、最も短い予測が3残基になるように長さを減少させること、そしてその後、N末端からC末端までの残基指数により選別される。
図6A〜6Dのファイアプロットに対応するエピトープ予測が、Aβ線維の形態それぞれについて表1で行われ、即ち記載された方法を利用した図6A〜6Dのファイアプロットの分析で、表1に列挙したエピトープが得られる。
Figure 0006952351

表1:図6A〜6Dのファイアプロットに示され、Q=0.71のバイアスに対応する構造の予測されたエピトープ。それらは、最長から最短までのエピトープ予測、そしてその後、同じ長さのエピトープについてN−末端からC−末端まで並べられている。
表2は、本発明者により検討された複数の他の構造についての予測されたエピトープを示す。
Figure 0006952351
表2:本発明者により検討された複数の他の構造の予測されたエピトープ
図7は、各プロットの上に示された特定の最終レベルのバイアシング(Q)と共に、様々なレベルのバイアシング(例えば、様々な最終レベルの目的集団座標)について図6のものと類似のファイアプロットを示している(図7Aは、Q=0.8を示し、図7Bは、Q=0.73を示し、図7Cは、Q=0.67を示し、図7Dは、Q=0.6を示す)。図7は、予測されたエピトープの一般的構造がバイアシングの度合いに著しく依存しないことを実証している。図7Dおよび図7Eは、最終的な平衡化時間がエピトープ予測に著しい影響を有さないことを示している。例えば平衡化の16ns後に(図7D)、残基8を中心とする長さ4のエピトープ(DSGY)が予測され、20nsの平衡化の後(図7E)、残基8を中心とする長さ5のエピトープ(HDSGY)が予測される。熱揺らぎは、その後の時間にエピトープのサイズを1残基ほど減少または増加させ得る。同様に、平衡化の16ns後に(図7D)、残基26を中心とする長さ7のエピトープ(DVGSNKG)が予測され、20nsの平衡化の後(図7E)、残基25を中心とする一方(DVGSNK)および残基27を中心とするもう一方(GSNKGA)の、長さ6の2つのエピトープが予測される。したがって、2つの異なる平衡化時間での予測が、強いオーバーラップを有し、ランダムな熱揺らぎと一致する。
本明細書に記載された方法により予測される候補エピトープ52を、実験的に検討された種々のフィブリルモデルおよび観察された出現傾向についてプロットすることができ、図8を参照されたい。図8の分析は、過去に実験的に裏づけられた複数のAβエピトープを生じる。およそ残基25〜30を含む、予測された強い永続性のエピトープが存在する。これは、この領域についての過去の予測と一致する。N.R.Cashman,Oligomer−specific amyloid beta epitope and antibodies,09 2011を参照されたい。図8、ならびに表1および2に示された候補エピトープのさらなる検証が、2016年7月22日出願の米国特許出願第62/365634号および2016年9月12日出願の同第62/393615号に記載されている。
本明細書で検討された単一の全長構造2M4Jでは、N−末端領域が、大体残基5〜10の間にエピトープ予測として出現している。高親和性ポリクローナル抗体が、残基5〜11からなる領域に生じており、これらの抗体は、プラークに結合することおよび神経突起の病態を減少させることも観察されており、Frederique Bard,Robin Barbour,Catherine Cannon,Robert Carretto,Michael Fox,Dora Games,Teresa Guido,Kathleen Hoenow,Kang Hu,Kelly Johnson−Wood,Karen Khan,Dora Kholodenko,Celeste Lee,Mike Lee,Ruth Motter,Minh Nguyen,Amanda Reed,Dale Schenk,Pearl Tang,Nicki Vasquez,Peter Seubert,and Ted Yednock.Epitope and isotype specificities of antibodies to b−amyloid peptide for protection against Alzheimer’s disease−like neuropathology.Proc.Natl.Acad.Sci.USA,100(4):2023−2028,2003を参照されたい。
新規なコンセンサスベースのエピトープが、図8から出現しており、それは株全体でかなり一致して認められ、大体残基13〜18または配列HHQKLVからなる。このエピトープを環状化して、オリゴマーについての立体選択性を検査することができる。該エピトープは、オリゴマー特異性選択性を促進する環状化に加えて、特異的コンホメーション内でエピトープを提示するようにタンパク質足場に移植することもできる。タンパク質足場は、タンパク質構造の状況においてコンホメーション安定性を促進する。そのようなエピトープ/足場は、構造特異性血清学的試薬として、そして/または病原性コンホメーションにおいてエピトープへの構造特異性を有する抗体を誘発する免疫源として、作用し得る。
ディスオーダーまたは露出(局所アンフォールディングの印54)の尺度としてSASAを用いることに加え、またはその代わりに、幾つかの実施形態は、コンタクトの損失(ネイティブ構造22におけるコンタクトの中から)を局所アンフォールディングの印54として検討することを含み得る。このアプローチにおいて、バイアシングシミュレーションは、同じになり得るが、ブロック50の分析は、わずかに異なり得る。エピトープが各シミュレーションにおける少なくとも1つの鎖の各残基についてΔSASAn(ΔSASAn each residue)の増加を示すことを必要とすることにより候補エピトープを評価する代わりに、そのような実施形態は、エピトープが各シミュレーションにおいて少なくとも1つの鎖の各残基でコンタクト(ネイティブ構造22におけるコンタクトの中から)の減少を示すことを必要とすることにより候補エピトープを評価することを含み得る。実際に、各残基がコンタクト(ネイティブ構造22におけるコンタクトの中から)の数を減少させなければならないだけでなく、その変更が、幾つかの値、典型的には約0.5〜1コンタクト/原子よりも大きくならなければならないように、幾つかの実施形態が閾値を設定することを含み得る。図9は、タンパク質の数(図9の列に対応する)それぞれについてのSASAの変動(最上行)および損失コンタクト数(最下行)に基づくファイアプロットの比較を示す。2MXUのバイアシングレベルが、上のパネルでQ=0.67、下のパネルでQ=0.6であることに留意されたい。Qを用いて予測された最長エピトープは、長さ9のエピトープAEDVGSNKGと、2種の長さ6のエピトープEVHHQK、VHHQKLである。これらは、この特定の株、詳細にはDVGSNKG、EDVGSN、QKLVF、HHQK、およびAEDVについて、表1のエピトープと良好にオーバーラップする。
本発明者は、残基の全数のサブセットを選択すること、およびN−末端領域を付加しないこと、の潜在的効果を検査した。幾つかの実施形態において、デフォルトによるシミュレーションパラメータは、正電荷の1プロトン単位をN−末端残基に割り付けるが、電荷間の反発が、N−末端領域のディスオーダーを増大させ得る。図14は、方法の異なるリファインメントおよび各効果の重要性を比較している。詳細には図14のプロットは、修飾のないPDB構造(右パネル)から開始したファイアプロット、帯電していないN−末端を有する構造(NH の代わりにNH;中央のパネル)について、およびN−末端残基1〜10が戻された構造(左パネル)についてのファイアプロットを示している。先に記載された通り、多くの分子動力学シミュレーションにおけるN−末端のデフォルト処理は、正電荷を有するNH 基である。そのような正電荷は、鎖のN−末端の間に余分な反発をもたらし、実際のシステムでは、末端がその他の箇所で大体10残基早く配置されている。
図10は、0.8という初期Qにバイアスをかけた後の、3回対称Aβ構造2M4Jの描画である。強調された領域(矢印101、103による)、つまり鎖Bにおける、側鎖の薄い色のリコリス状描画における残基13〜19(矢印101)および側鎖のより暗い色のリコリス状描画における残基25〜29(矢印103)は、図4Aで予測されたものである。より強いバイアシング(下の最終的なQ)で、フィブリルモノマーが、分離して開き始める(図11参照)。バイアシングの際に優先的に露出された残基12〜17を有すると予測される図10の鎖は全て、2M4J構造内の三層のうちの端の層にある。
構造2M4Jにおける残基25〜29は、本来の構造における2つのβシートの間にターンを形成する。この領域は、隣接する鎖のN−末端領域とのコンタクトを破壊することにより、露出するようになる(図10)。最後の目的集団座標のバイアス値は、フィブリルを崩壊するのに十分、減少し得る。図7は、最後の目的集団バイアシング座標に関する予測のロバストネスを例示している。図11は、3回回転構造を0.8ではなく0.6の初期Qにバイアシングすることがタンパク質を著しく歪め、残基25〜29におけるターンの相対的露出を増加させて、隣接する鎖のC−末端とのコンタクト全てを損失することを示している。しかしこれは、より低いバイアシングレベルでも予測されるエピトープであり、エピトープ予測を変更しない。
Aβ42構造2MXUは、12モノマー長のフィブリルであり、端のモノマーと中央のモノマーとの差異の検査を可能にする。PDB構造から失った残基1〜10は、再構築されて付加されている。本発明者は、2MXU構造の端のモノマーが図12で認めることができる中央のものをディスオーダーする見込みがかなり高いことを見出した。図12は、初期Q0.8へのバイアシング後のAβ42構造2MXUの描画であり、フィブリルからの端のモノマーの離脱を示す。これは、エンドキャップディスオーダー/断片化の過程を示している。実際のフィブリルは、この系におけるよりもずっと多くのモノマーで構成され得るため、この論点は、幾つかの実施形態において、端部で鎖(鎖AおよびL)を制限すること、およびバイアシングシミュレーションを反復すること、により取り組まれた。
PDB 2LMNの初期構造にスーパーインポーズされたディスオーダー構造のスナップショットを、図13に示している。この2回対称構造について、本発明者らは再度、予測されたエピトープとして出現した側鎖のリコリス状描画を利用して残基11〜16および25〜28を観察する。図13は、約0.8の初期Qにバイアシングした後の2回対称Aβ構造2LMNの描画を示している。ディスオーダー構成を、初期構成にスーパーインポーズしている。強調された側鎖を有する領域は、鎖JおよびKの残基11〜16(暗い色、105)、および鎖B、D、F、Iの残基25〜28(薄い色、107)に対応する。
本明細書に記載された方法は、一本鎖タンパク質に提供され得る。一実施例の実験において、本明細書に記載された方法を、金属を欠くがシステイン57と146の間のジスルフィド結合を含む、スーパーオキシドジスムターゼ1(SOD1)を構成する系に適用した。全コンタクト数に対応する全体的な座標で、タンパク質にバイアスをかけ、目的集団座標を、Q=0.65の値に減少させた。その後、タンパク質をQ=0.65に保持し、次に90nsの間、平衡化した。スナップショットを、20psごとに記録して、各残基のΔSASAを、この4500構成の集団において測定した。ファイアプロットの基になるデータ構造を構築するための図5に記載された手順(方法102、202)に従って、図17Aを与えた。図5C(方法302)の手順に従って、ファイアプロットのデータ構造から予測された対応するエピトープを、表3に与える。これらのエピトープを、Q=0.65にバイアスをかけた集団からのスナップショットにスーパーインポーズされた図17Bに暗い描影で示している。
Figure 0006952351
表3:SOD1で本明細書に記載された方法を実装するための候補エピトープ
図15は、特定の実施形態による、本明細書に記載された方法のいずれか、および本明細書に記載された方法のいずれかのステップを実施するために用いられ得るシステム500の略図である。例示された実施形態のシステム500は、1つまたは複数のプロセッサ504を含み得る1つまたは複数のコンピュータ502を含み、順次、プロセッサ(複数可)504にアクセス可能な適切なソフトウエア(明白に列挙されない)を実行し得る。そのようなソフトウエアが、コンピュータ502(そして詳細にはプロセッサ(複数可)504)により実行される場合、コンピュータ502および/またはプロセッサ(複数可)504は、本明細書に記載された方法のいずれかおよび本明細書に記載された方法のいずれかのステップを実施することができる。例示された実施形態において、コンピュータ502は、ユーザー506との相互作用のための任意選択によるユーザーインターフェース510を提供する。ハードウエアの目線から、ユーザーインターフェース510は、ユーザー506が情報をコンピュータ502にインプットし得る1つまたは複数のインプットデバイス508と、情報がユーザー506にアウトプットされ得る1つまたは複数のアウトプットデバイス512と、を含む。一般に、インプットデバイス508およびアウトプットデバイス512は、図15の例示された実施形態に示されたものに限定されない。一般に、インプットデバイス508およびアウトプットデバイス512は、コンピュータ502と相互作用するのに適した任意の適切なインプットおよび/またはアウトプットデバイスを含み得る。ソフトウエアがコンピュータ502および/またはそのプロセッサ(複数可)504により実行される場合には、ユーザーインターフェース510もまた、一部がそのようなソフトウエアにより提供され得る。例示された実施形態において、コンピュータ502はまた、アクセス可能なメモリーデバイス518でデータにアクセスするように(そして/またはデータを保存するために)接続されている。例示された実施形態において、コンピュータ502はまた、通信インターフェース514によりLANおよび/またはWANネットワーク516に接続されて、ネットワークデバイス(図示されない)からのデータのアクセスおよび/またはネットワークデバイスへのデータの通信を可能にする。
インプットは、非限定的にインプットデバイス508による、アクセス可能なメモリー518から、ネットワーク516から、または任意の他の適切なインプットメカニズムによる、などインプットメカニズムのいずれかを介してコンピュータ502により得ることができる。アウトプットは、非限定的に任意のアウトプットデバイス512により、アクセス可能なメモリー518へ、ネットワーク516へ、または任意の他の適切なアウトプットメカニズムへ、などアウトプットメカニズムのいずれかを介してコンピュータ502からアウトプットされ得る。先に議論される通り、図15は単に、本明細書に記載された方法を実装するのに適したコンピュータベースのシステム500の特定の実施形態の略図である。適切なシステムは、図15の略図において示された特定のタイプに限定されず、適切な構成要素(例えば、インプットおよびアウトプットデバイス)は、図15の略図に示されたものに限定されない。
本明細書に記載された方法は、幾つかの実施形態において、適切なコンピュータシステムの構成要素を含み得る、1つもしくは複数のプロセッサを含むコンピュータにより、そして/または1つもしくは複数の適切なプロセッサにより実装され得る。非限定的例として、そのようなプロセッサは、コンピュータベースの自動化された契約評価システム(contract valuation system)の一部を含み得る。一般にそのようなプロセッサは、例えば適宜構成されたコンピュータ、マイクロプロセッサ、マイクロコントローラ、デジタルシグナルプロセッサ、フィールドプログラマブルゲートアレイ(FPGA)、他のタイプのプログラム可能なロジックデバイス、前述のものの複数、前述のものの組み合わせなどの任意の適切なプロセッサを含み得る。そのようなプロセッサは、プロセッサにアクセス可能なコンピュータで読み取り可能なメモリーにおいて、そして/またはプロセッサと一体化されたコンピュータで読み取り可能なメモリーにおいて、保存され得るソフトウエアへのアクセスを有し得る。該プロセッサは、そのようなソフトウエアの指令を読み取り、そして実行するように構成され得、プロセッサにより実行されると、そのようなソフトウエアは、本明細書に記載された機能性の幾つかをプロセッサに実装させ得る。
本発明の特定の実装は、ソフトウエアの指令を実行して、プロセッサにコントローラを実装させる、そして/または本発明の方法を実施させる、コンピュータプロセッサを含む。例えば、コンピュータシステム内の1つまたは複数のプロセッサは、プロセッサにアクセス可能なプログラムメモリーから回収されたソフトウエアの指令を実行することにより、コントローラ内のデータ処理ステップ、および/または本明細書に記載された方法を実装し得る。本発明は、プログラム製品の形態でも提供され得る。該プログラム製品は、データプロセッサにより実行されると、データプロセッサにコントローラを実装させる、そして/または本発明の方法を実行させる、指令を含む一組のコンピュータで読み取り可能なシグナルを担う任意の媒体を含み得る。本発明によるプログラム製品は、非常に多様な形態のいずれかであり得る。該プログラム製品は、例えばフロッピーディスク、ハードディスクドライブをはじめとする磁気データ保存媒体、CD ROM、DVDをはじめとする光学データ保存媒体、ROM、フラッシュRAMをはじめとする電子データ保存媒体などの物理的(非一時的)媒体を含み得る。該指令は、暗号化および/または圧縮された形態でプログラム製品に存在し得る。
構成要素(例えば、ソフトウエアモジュール、コントローラ、プロセッサ、アセンブリ、デバイス、構成要素、回路など)が、先に参照される場合、他に示されない限り、その構成要素の参照(「手段」の参照を含む)は、本発明の例示された模範的実施形態において機能を実施する開示された構造と構造的に均等でない構成要素をはじめとし、記載された構成要素の機能を実施する(即ち、機能的に均等な)任意の構成要素を、その構成要素の均等物として含むと解釈されなければならない。
用語の解釈
文脈が他に明確に要求しない限り、本明細書および特許請求の範囲全体を通して、異なる方向で、そして/または空間および/もしくは角度により互いに相殺されて、
・「含む」、「含むこと」などは、排他的または徹底的意味の逆として包含的意味;即ち、「非限定的に包含する」の意味で解釈されなければならない;
・「連結された」、「結合された」またはその任意の変形例は、2つ以上の要素の間の直接的または間接的のいずれかの任意の連結または結合を意味し;要素間の結合または連結が、物理的、論理的またはその組み合わせであり得;一体として形成された要素は、連結または結合されていると見なされ得る;
・本明細書を記載するのに用いられる場合の、「本明細書に」、「先に」、「以下に」および類似の趣旨の言語は、本明細書の任意の特定の部分ではなく、本明細書を全体として参照している;
・2つ以上の事柄の列挙で参照される「または」は、言語の以下の解釈の全てを包含する:リストにある事項のいずれか、リストにある事項の全て、およびリストにある事項の任意の組み合わせ;
・単数の形態「a」、「an」および「the」は、任意の適当な複数形態の意味も包含する。
本発明の実施形態は、専用に設計されたハードウエア、構成可能なハードウエア、データプロセッサ上で実行され得るソフトウエア(場合により「ファームウエア」を含み得る)の提供により構成されたプログラム可能なデータプロセッサ、本明細書に詳細に説明された方法の1つもしくは複数のステップを実施するように専用にプログラム、構成もしくは構築された特別な目的のコンピュータもしくはデータプロセッサ、および/またはこれらの2つ以上の組み合わせを利用して実装され得る。専用に設計されたハードウエアの例は、論理回路、特定用途向け集積回路(「ASIC」)、大規模集積回路(「LSI」)、超大規模集積回路(「VLSI」)などである。構成可能なハードウエアの例は、プログラマブルアレイロジック(「PAL」)、プログラマブルロジックアレイ(「PLA」)およびフィールドプログラマブルゲートアレイ(「FPGA」)などの1つまたは複数のプログラマブルロジックデバイスである。プログラム可能なデータプロセッサの例は、マイクロプロセッサ、デジタルシグナルプロセッサ(「DSP」)、組み込みプロセッサ、グラフィックスプロセッサ、数値演算コプロセッサ、一般目的のコンピュータ、サーバーコンピュータ、クラウドコンピュータ、メインフレームコンピュータ、コンピュータワークステーションなどである。例えばデバイスのためのコンピュータシステム内の1つまたは複数のデータプロセッサは、該プロセッサにアクセス可能なプログラムメモリーにおいてソフトウエア指令を実行することにより本明細書に記載された方法を実装し得る。
プロセシングは、集中または分散され得る。プロセシングが、分散される場合、ソフトウエアおよび/またはデータをはじめとする情報が、集中的に保持され得るか、または分散され得る。そのような情報は、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、インターネット、有線もしくは無線データリンク、電磁シグナル、または他のデータ通信チャンネルなどの通信ネットワークを用いて異なる機能単位の間で交換され得る。
例えば、工程またはブロックは、所与の順序で提示されるが、別の実施例が、異なる順序で、ステップを有する日常的作業を実施すること、またはブロックを有するシステムを用いることができ、幾つかの工程またはブロックは、欠失、移動、付加、分解、結合、および/または修飾されて、代替法または部分的組み合わせを提供することができる。これらの工程またはブロックのそれぞれは、種々の異なる方法で実装され得る。おなじく工程またはブロックは、時には連続で実施されるように示されるが、これらの工程またはブロックは、代わりに並行して実施され得、または異なる時間に実施され得る。
加えて、要素は、時には順次、実施されるように示されるが、代わりにそれらは、同時にまたは異なる順序で実施され得る。それゆえ、以下の特許請求の範囲は、そのような変形例全てを意図する範囲内として含むものと解釈されるものとする。
本発明の実施形態は、プログラム製品の形態でも提供され得る。該プログラム製品は、データプロセッサにより実行されると、データプロセッサに本発明の方法を実行させる、一組のコンピュータで読み取り可能な指令を担う任意の非一時的媒体を含み得る。本発明によるプログラム製品は、非常に様々な形態のいずれかであり得る。該プログラム製品は、例えばフロッピーディスク、ハードディスクドライブをはじめとする磁気データ保存媒体、CD ROM、DVDをはじめとする光学データ保存媒体、ROM、フラッシュRAM、EPROM、ハードウエアに組み込まれたもしくは予めプログラムされたチップ(例えば、EEPROM半導体チップ)、ナノテクノロジーメモリーをはじめとする電子データ保存媒体などの非一時的媒体を含み得る。プログラム製品上のコンピュータで読み取り可能なシグナルは、場合により圧縮または暗号化され得る。
幾つかの実施形態において、本発明は、ソフトウエアに実装され得る。より明確にするために、「ソフトウエア」は、プロセッサ上で実行される任意の指令を含み、(非限定的に)ファームウエア、常駐ソフトウエア、マイクロコードなどを包含し得る。プロセシングハードウエアおよびソフトウエアは両者とも、当業者に公知の通り、全体または一部が集中または分散され得る(またはその組み合わせであり得る)。例えばソフトウエアおよび他のモジュールは、ローカルメモリーを介して、ネットワークを介して、分散されたコンピュータ環境のブラウザもしくは他の適用を介して、または先に記載された目的に適した他の手段を介して、アクセス可能になり得る。
構成要素(例えば、ソフトウエアモジュール、プロセッサ、アセンブリ、デバイス、回路など)が、先に参照される場合、他に示されない限り、その構成要素の参照(「手段」の参照も含む)は、本発明の例示された模範的実施形態において機能を実施する開示された構造と構造的に均等でない構成要素をはじめとし、記載された構成要素の機能を実施する(即ち、機能的に均等な)任意の構成要素を、その構成要素の均等物として含むと解釈されなければならない。
データベースの記録、フィールド、エントリー、および/または他の要素が、先に参照される場合、他に示されない限り、そのような参照は適宜、複数の記録、フィールド、エントリー、および/または他の要素を含むと解釈されなければならない。そのような参照はまた、適宜、1つまたは複数の記録、フィールド、エントリー、および/または他の要素の一部を含むと解釈されなければならない。例えばデータベースにおける複数の「物理的」記録(即ち、データベース構造においてコード化された記録)は、該複数の物理的記録が、論理記録から除外される情報を含むとしても、上記の記載、そして以下の特許請求の範囲の目的で1つの「論理」記録と見なされ得る。
システム、方法および装置の具体的な例が、例示の目的で本明細書に記載されている。これらは、例に過ぎない。本明細書で提供された技術は、上記の実施例のシステム以外のシステムに提供され得る。多くの代替、改変、付加、省略、および交換が、本発明の実践において可能である。本発明は、特色、要素および/もしくは活動を均等な特色、要素および/もしくは活動と交換すること;異なる実施形態からの特色、要素および/もしくは活動を混合および適合させること;本明細書に記載された実施形態からの特色、要素および/もしくは活動を他の技術の特色、要素および/もしくは活動と組み合わせること;ならびに/または組み合わせた特色、要素および/もしくは活動を記載された実施形態から省略すること、により得られる変形例をはじめとする、当業者に明白な、記載された実施形態上の変形例を包含する。
複数の模範的態様および実施形態が、先に議論されたが、当業者は、特定の改変、交換、追加およびそれらの部分的組み合わせを認識するであろう。例えば、
・幾つかの実施形態において、検討されているタンパク質は、ネイティブコンタクトを用いるのではなく溶媒露出表面積(SASA)を用いることにより、ネイティブ構造を損失するようにバイアスがかけられ得る。
・幾つかの実施形態において、バイアシングの結果を分析すること(例えば、ブロック50)は、力学的作用の最も顕著な増加を有する領域を測定することを含み得、バイアシングされたら、表面積(SASA)の増加または初期コンタクトの損失に加えて、またはその代りに、どの領域が構造的に破壊されて、非ネイティブ相互作用をより受け易いか、も示し得る。力学的作用増加のそのような尺度の例は、アミノ酸の根平均二乗揺らぎ(RMSF)を含み得る。
・幾つかの実施形態は、バイアシングによる構造変化の代理として作用し得るバイアシングによる特定のアミノ酸配列のポテンシャルエネルギーの損失の直接的なコンピュータ測定を含み得る。
・幾つかの実施形態は、バイアシングのための集団座標として、または続いての局所アンフォールディングの印(例えば、ネイティブ構造の局所損失)として作用し得る、ネイティブ構造のバックボーン水素結合の中からのバックボーン水素結合損失の尺度を含み得る。
・先に記載された実施形態は、バイアスの適用によるタンパク質構造の変化をシミュレートするための分子動力学エンジンの使用を行っている。幾つかの実施形態において、モンテカルロ力学エンジンが、分子動力学エンジンに加えて、またはその代わりに用いられ得る。分子動力学エンジンおよびモンテカルロ力学エンジンのいずれか、または両方は、本明細書ではタンパク質または凝集フィブリル構造のためのコンホメーションサンプリングエンジン(conformational sampling engine)と称され得る。
・幾つかの実施形態において、検討されているタンパク質は、ネイティブSASAに比較したSASA、またはネイティブコンタクトのうちのコンタクト数など、オーダーパラメータを基にしたバイアスポテンシャルを適用することに加えて、またはその代わりにメタダイナミクスを利用することによりネイティブ構造を損失するようにバイアスがかけられ得る。
特定の非限定的例の実施形態のステップおよび方法の詳細を示す疑似コードを、以下に記載する:
方法102、202(図5Aおよび5B)に対応する疑似コード
%ΔSASAの測定/記録
各ランについて、1<ラン<Nランであれば、%Nランは、典型的には10に設定される
各鎖について、1<鎖<N鎖であれば、%シミュレートされたフィブリルにおける鎖の数
各resで、1<r<Nresであれば、
<ΔSASA>(res,ラン,鎖)を計算し、%各鎖、各ランにおける各残基のresについて、ΔSASAは、溶媒露出表面積の変化であり、<...>は、システムの構成のスナップショット全体の平衡平均を示す。典型的な100nsシミュレーションでの20psごとのスナップショットが、100ns/20ps=5000スナップショットを与える。この量は、本明細書では以降、平均化された平衡と理解され、そのため<ΔSASA>≡ΔSASAとなる。
resについて終了
鎖について終了
ΔSASAを各ランについて別のデータファイルに書き込む;%フォーマットは、2つの列であり、最初の列=resであり、2番目の列はΔSASAである。ファイルにおける鎖J、残基kの場所は、Nresj+kの行により与えられる。%各ファイルは、複数の鎖を含む
ランについて終了 %ΔSASAの決定/記録を終了

%全てのランからの全てのデータファイルが、インプットのために読み込まれた後、ΔSASAは、サイズの3D長方形マトリックスである(Nラン×N鎖×Nres)

%各ウインドウ位置wp、各ウインドウサイズwsについてのΔSASA値からなるファイアプロットのために、ウインドウ表示の新しいマトリックスDSASAを定義する。
ウインドウ表示されたDSASA(wp,ws)=全てのwp、wsで0であり、%wpが、1<wp<Nresのウインドウ位置であれば(フォーループ値は、これらの位置のサブセットについて割り付けられる)、wsは、1<ws<wsmax(以下に定義)のウインドウサイズである。
%ウインドウ表示されたDSASAのサイズは、Nres×wsmaxであり;以下のループは、1:Nresからランせず;以下のフォーループの外側の要素は、決して零から変化しない。

%最大ウインドウサイズであるwsmax、典型的には約12アミノ酸/残基を推測する。最大ウインドウサイズは、その中に0の「ヒット」を有するであろう。即ち、以下に定義された通り零の成功。これは、本発明者らが生成されたファイアプロット内のピークを超えるウインドウサイズで終了していることのみを意味する。

fmin=成功の最小割合の設定。%これは、幾つかのランに局在化されたアンフォールディングを確率論的に偶然に示させないようにとらえられる。本発明者らは、典型的にはNラン=10ランを実装するため、本発明者らは、これを0.9であるととらえ、つまり10のランのうち少なくとも9が、局在化されたアンフォールディングの「ヒット」をもたらさなければならず、局在化されたアンフォールディングの「ヒット」が、ウインドウにおける全ての残基でSASA露出を増加していることを意味する。

%「ファイアプロット」のデータ構造を組み立てる
%以下のループへのインプットは、ΔSASA(res,ラン,鎖)の(Nres×Nラン×N鎖)サイズのアレイである。

ウインドウサイズws=1:wsmaxについて %即ちウインドウサイズがwsmaxになるまで増加し;wsmaxが全鎖長Nresになり得るか、または表面積の増加を示す隣接する鎖のいずれかよりも長いと予測されるウインドウサイズであり得る(実際のwsmaxは、12に設定され得る)
%以下に定義されたビルド_ファイアプロット関数を実装する ウインドウの中央位置=wp、ウインドウ表示されたDSASA(:,ws)=ビルドファイアプロット関数(ΔSASA(res,ラン,鎖),ws,fmin);%ビルト_ファイアプロット関数は、Nres長のベクトルを返し、2Dアレイをこのベクトルで満たす
ウインドウサイズについて終了

ウインドウ表示されたDSASA(wp,ws)をファイルに書き込む %各タンパク質またはフィブリルモデルについてファイルに書き込まれたNres×wsmaxのアレイ

%先のループからのアウトプットは、ネイティブタンパク質またはフィブリルモデルについてのウインドウ表示されたDSASA(wp,ws)、Nres×wsmaxサイズのアレイである。

%先の疑似コードにおけるビルド_ファイアプロット関数のコール:
ビルド_ファイアプロット関数を開始する %先のループにおける関数(ΔSASA(res,ラン,鎖),ws,fmin)を以下の通り定義する:
ウインドウ表示されたDSASA(:,ws)=0;%Nres零のベクターにウインドウ表示されたアウトプットDSASAを初期化する
カウント(:,:)=0;%これはfmin規準をチェックするためにビルド_ファイアプロット関数内のみで用いられた1’sおよび0’sサイズのNres×Nランのブールマトリックスである
ラン=1:Nランについて %図4Bの実施例において、Nラン=3およびN鎖=3
ウインドウの中心位置wp=wpmin:wpmaxについて %(ここでwpmin=円形(ws/2)は、所与のウインドウサイズwsについての初期ウインドウ位置である。例えば、もしwsが7であれば、wpminは、3.5の直後の整数として定義される4であるが、もしws=6であれば、wpmin=3;wpmax=Nres−(ws−wpmin))
鎖=1:N鎖について
もし((wp,ws)により定義されたウインドウの全てのresについて、ΔSASA(res、ラン、鎖)>0)、
%図4Bにおいて、この「もし」の提示が(ラン,鎖)=(1,2)、(2,1)、(3,2)、および(3,3)について真実であれば、
ウインドウ表示されたDSASA(wp,ws)=ΔSASA(res、ラン、鎖)のサイズwsのウインドウにおけるresの総和;
カウント(wp,ws)=1;
もしΔSASA>0であれば終了
鎖について終了
wpについて終了 %ここで任意のヒットについて1つの所与のランにおける全ての位置で全ての鎖をチェックした
ランについて終了 %ウインドウ表示されたDSASA(wp,ws)を、ここで鎖全体で、そしてラン全体で総和した;即ち、図4Bにおいて、4つのパネルからのSASA,(ラン,鎖)=(1,2)、(2,1)、(3,2)、および(3,3)を全て総和した。図4Bにおいて、少なくとも1つの鎖について各ランにヒットが存在し、そのため例示されたウインドウ位置でのカウント(wp,ラン)は[111]のベクターである。

%対応するDSASA(wp,ws0)=0を設定しない場合、ランの数がfminの割合要件(カウント=1が9/10のランで出現する)を満たすか否かをチェックする:
開始_要素=フロア((1−fmin)Nラン)+1;%エピトープが出現しなければならないランの数を設定するアレイ開始要素。fmin=0.9およびNラン=10について、ここでは開始_要素=2であり、エピトープは、10のうち2の要素に出現しなければならない。
wp=1:Nresについて
カウントソート=ソート(カウント(wp,:))%カウント(wp,:)は、1’sおよび0’sのNランの長さのベクター、例えば[1100110111]のベクターであり;ソート(カウント(wp,:))は、これを[0001111111]に転換し;0は、エピトープ予測なしを示し(即ち、区分(wp,ws)における全ての残基がSASAを増加させたわけではなく)、1は、エピトープが予測されることを示す(即ち、区分(wp,ws)における全ての残基がSASAを増加させた)
もし、(任意の(カウントソート(開始_要素:終了)==0)%(最初の(開始_要素−1)ラン状態をスキップする(本発明者らが開始_要素−1のランに予測を省略させることを意味する);カウントソートマトリックス(即ち、カウントソート(ss:終了))の残りの要素について、もし任意の要素が、0であれば(予測を省略するss−1以外のランが存在することを意味する)、本発明者らは、対応するウインドウ表示されたDSASA(wp,ws)=0を設定する:
ウインドウ表示されたDSASA(wp,ws)=0;%ウインドウ表示されたDSASAにおける零の要素は、そのマトリックスがその位置でエピトープを予測しないことを意味する。たとえこの時点でこのマトリックスにおいてSASAの非零の総和が存在したとしても、それがランの閾値基準を満たさなければ、その値は零にリセットされる。
「もし」を終了
wpについて終了

ウインドウ表示されたDSASA(wp,ws)を返す;%ウインドウ表示されたDSASA(:,ws0)を返す
ビルド_ファイアプロット関数を終了
方法302(図5C)に対応する疑似コード
%ファイアプロットデータ構造を利用して、候補エピトープを予測する
%インプット(上述から)は、ウインドウ表示されたDSASAの総和(wp,ws)、即ちファイアプロットのデータである。

ws=wmax−1:3について、%ウインドウサイズを最大値(例えば、図6Aのwsmax=11)から最小で3に減少させる。本発明者らは、ここでは3以上の長さのエピトープを検討する。これは、任意であり、4に減少させることができた。エピトープの長さが短い程、それがプロテオームにおいてより一般的に出現し、オフ・パスウェイターゲットに罹患している可能性がより高い。3の長さを取り入れると、タンパク質内で確定されたターゲットを提供するのに十分、エピトープを短くすることができるが、配列同一性およびコンホメーションに関してプロテオーム内で比較的独特にするのに十分に長くすることができる。
wp=1:Nresについて
もし(wpがヒットである)%即ち、ウインドウ位置wpについて0より大きなウインドウ表示されたDSASAの総和(wp,ws)の値が存在すれば、
エピトープ(wp,ws)を記録する %例えば、図6Aにおいて最初のヒットは(wp=26 ws=7)または位置26を中心とする長さ7のエピトープ:[23 24 25 26 27 28 29]に対応し;したがって残基23〜29は、表1の2M4Jについての最長のエピトープであり、DVGSNKGに対応する2M4Jについての図8内の最長の水平ボックスとして描画される
問題のエピトープ内に存在するサブエピトープ全てを除去する
%図6Aのファイアプロットにおいて、これは以下の座標における長方形を除去することに対応する:(26,7)を、
%その後、(25,6)および(26,6)(これらが、7の長さのエピトープ内の全て、即ち23〜28および24〜29であるサブエピトープを作成する)
%その後、(25,5)(26,5)(27,5)(これらもまた、7の長さのエピトープ内の全てであるサブエピトープを作成する)
%その後、(24,4)(25,4)(26,4)(27,4)
%その後、(24,3)(25,3)(26,3)(27,3)(28,3)
%その後、(23,2)(24,2)(25,2)(26,2)(27,2)(28,2)
%そして最後に(23,1)(24,1)(25,1)(26,1)(27,1)(28,1)(29,1)、を除去する
%対応する「切断された円錐(ablated cone)」を有するプロットは、図16において(A)から(B)への移行部にある。本発明者らは、長さ4のエピトープまで切断工程を続けるため、より多くのエピトープ、ことによるとオーバーラップしたものが、見出される
wpがヒットであれば、終了
wpについて終了
wsについて終了

%図6Aの2M4Jについて、最初の切断の後(本発明者らが託された次に大きなエピトープが(27,6)、またはエピトープ[25 26 27 28 29 30](最初のエピトープとオーバーラップした表1内の残基25〜30)である

%対応する円錐が図16で(B)から(C)への移行部において切断されていることが認められ得る

%本発明者らは、長さ3のエピトープまで(3を含む)、切断工程を反復する

%どの結果が、3以上の長さのエピトープ予測の組であるか
%これらのエピトープは、表1および図8に示される

Claims (18)

  1. タンパク質における1つまたは複数の候補エピトープのコンピュータベースの予測のための方法であって、
    コンピュータシステム上にコンホメーションサンプリングエンジンを提供するステップ;
    前記コンピュータシステムにおいて、前記コンホメーションサンプリングエンジンと共に使用するのに適したタンパク質のモデルを得るステップであって、得られたタンパク質モデルがネイティブ構造を含み、任意選択で、タンパク質のモデルを得ることは、タンパク質モデルのデータベースから前記タンパク質モデルを得ることを含んでもよい、ステップ;
    前記コンピュータシステムにより、集団座標に基づくバイアシングポテンシャルを適用して前記タンパク質モデルにバイアスをかけるステップであって、前記バイアシングポテンシャルが前記コンホメーションサンプリングエンジンに強制的に順次、前記タンパク質モデルをネイティブ構造から最新構造へ少なくとも部分的にアンフォールディングさせ、前記バイアシングポテンシャルが、前記タンパク質モデルの少なくとも実質的部分に全体的に適用されて、前記タンパク質モデルの実質的部分の中でアンフォールディングが起こる場所に関して偏らない、ステップ;および
    前記コンピュータシステムにより、前記最新構造を分析して、1つまたは複数の候補エピトープを同定するステップであって、前記1つまたは複数の候補エピトープが、局所的なアンフォールディングの印を呈する、ステップ、
    を含む、方法。
  2. 前記タンパク質のモデルを得るステップが、前記タンパク質モデルのための第一の構造を得ることと、次いで、前記コンピュータシステムにより前記タンパク質モデルのための前記第一の構造を修飾して前記タンパク質モデルのためのネイティブ構造を作成することと、を含み、
    任意選択で、
    (A)前記タンパク質モデルのための前記第一の構造を修飾して前記タンパク質モデルのためのネイティブ構造を作成することは、前記コンピュータシステムにより前記タンパク質モデル上での平衡化シミュレーションを実施することを含んでもよく、前記平衡化シミュレーションは、前記第一の構造で開始して、前記第一の構造を変換して前記ネイティブ構造を作成し;任意選択で、前記タンパク質モデル上での平衡化シミュレーションを実施することは、前記第一の構造を有するタンパク質モデルを、一定の粒子数、一定圧力および一定温度のうちの1つまたは複数を特徴とするモデル環境に供することを含んでもよい;あるいは
    (B)前記タンパク質モデルのための前記第一の構造を修飾して前記タンパク質モデルのためのネイティブ構造を作成することは、1つまたは複数の不足した残基を前記第一の構造に付加して前記ネイティブ構造を作成することを含んでもよく、前記ネイティブ構造は全長の一次配列に対応する、
    請求項1に記載の方法。
  3. 前記集団座標に基づくバイアシングポテンシャルを適用して前記タンパク質モデルにバイアスをかけるステップが、前記コンピュータシステムにより、複数の時間ステップにわたり前記タンパク質モデル上で不連続時間シミュレーションを実施することを含み、前記不連続時間シミュレーションが、前記タンパク質モデルのためのネイティブ構造で開始して、前記複数の時間ステップのうちの各特定の時間ステップにおいて、前記特定の時間ステップについて前記タンパク質モデルの対応する最新構造を作成する、請求項1または2に記載の方法。
  4. 前記複数の時間ステップにわたり前記タンパク質モデル上で不連続時間シミュレーションを実施することが、前記コンホメーションサンプリングエンジンに前記タンパク質モデルにおける構造変化を強制的に起こさせることを含み、前記構造変化が、前記タンパク質モデルのための前記最新構造から決定された実際の集団座標を要求して目的の集団座標を前記複数の時間ステップにわたり追跡することにより決定され、
    任意選択で、
    )前記タンパク質のための前記最新構造から決定された実際の集団座標を要求して目的の集団座標を前記複数の時間ステップにわたり追跡することは、前記コンピュータシステムにより、ポテンシャルエネルギー関数に供された前記タンパク質モデルの自由エネルギーを最小化することを含んでもよく、前記ポテンシャルエネルギー関数は、少なくとも部分的に、前記タンパク質モデルの任意の構造のための前記実際の集団座標と前記目的の集団座標との間の差異を表す計量に依存する;あるいは
    )前記タンパク質のための前記最新構造から決定された実際の集団座標を要求して目的の集団座標を前記複数の時間ステップにわたり追跡することは、前記コンピュータシステムによりポテンシャルエネルギー関数を最小化することを含んでもよく、前記ポテンシャルエネルギー関数は、少なくとも部分的に、前記タンパク質モデルの任意の構造のための前記実際の集団座標と前記目的の集団座標との間の差異を表す計量に依存し、好ましくは、前記ポテンシャルエネルギー関数を最小化することは、前記複数の時間ステップのうちの各特定の時間ステップで前記ポテンシャルエネルギー関数を最小化することを含む、
    請求項3に記載の方法。
  5. 前記ポテンシャルエネルギー関数が、式:
    Figure 0006952351
    (式中、Q(t)は、前記目的の集団座標であり、Qは、前記タンパク質モデルの任意の構造のための前記実際の集団座標であり、kは、構成可能な定数である)の項を含み、
    任意選択で、前記ポテンシャルエネルギー関数は、前記タンパク質モデルに内在する、あるいは前記タンパク質モデルに関連する、分子動力学的力にも依存してもよく、および/または前記ポテンシャルエネルギー関数を最小化することは、前記タンパク質モデルに内在する、あるいは前記タンパク質モデルに関連する、分子動力学的力に基づいて課された制限に供されたポテンシャルエネルギー関数を最小化することを含んでもよい、
    請求項4に記載の方法。
  6. 前記不連続時間シミュレーションの複数の時間ステップにわたり、前記目的の集団座標が、前記ネイティブ構造に関連する前記実際の集団座標のものと等しい初期の目的の集団座標の値で開始して、最初のやや多数(sub−plurality)の時間ステップで最後の目的の集団座標の値まで変動した後、第二の複数の時間ステップの間、前記最後の目的の集団座標の値で静止し、
    任意選択で、前記不連続時間シミュレーションの前記複数の時間ステップにわたり、前記目的の集団座標は、経時的に滑らかに変動してもよい;あるいは前記目的の集団座標は、前記初期の目的の集団座標の値と前記最後の目的の集団座標の値の間で経時的に一定速度で変動してもよい、
    請求項4または5に記載の方法。
  7. 前記タンパク質モデルのための任意の最新構造について決定された前記実際の集団座標が、前記タンパク質モデルの実質的部分のネイティブ構造に対する前記タンパク質モデルの前記実質的部分の最新構造の全体的なアンフォールディングを示す計量を含み、
    任意選択で、
    (A)前記タンパク質モデルのための任意の最新構造について決定された前記実際の集団座標が少なくとも一部として、前記タンパク質モデルの前記実質的部分の前記ネイティブ構造における重い原子の間のコンタクトのうちの、前記タンパク質モデルの前記実質的部分の前記最新構造における重い原子の間のコンタクトの数に基づく、あるいは
    (B)前記タンパク質モデルのための任意の最新構造について決定された前記実際の集団座標が少なくとも一部として、前記タンパク質モデルの前記実質的部分の前記ネイティブ構造における重い原子の間のコンタクトのうちの、前記タンパク質モデルの前記実質的部分の前記最新構造における重い原子の間のコンタクトの数に近似するコンタクト関数に基づく、あるいは
    (C)前記タンパク質モデルの前記実質的部分の前記ネイティブ構造におけるコンタクトのうちの各コンタクトについて、前記コンタクト関数が、式:
    Figure 0006952351
    (式中、rijは、前記タンパク質モデルの前記実質的部分における原子iとjの核間の距離であり、r、nおよびmは、適宜選択された定数である)を有する、あるいは
    (D)前記タンパク質モデルのための任意の最新構造について決定された前記実際の集団座標が少なくとも一部として、前記タンパク質モデルの前記実質的部分の前記ネイティブ構造における重い原子の間の距離に対する、前記タンパク質モデルの前記実質的部分の前記最新構造における重い原子の間の距離に基づく、あるいは
    (E)前記タンパク質モデルのための任意の最新構造について決定された前記実際の集団座標が少なくとも一部として、前記タンパク質モデルの前記実質的部分の前記ネイティブ構造の根平均二乗構造偏差(RMSD)に対する、前記タンパク質モデルの前記実質的部分の前記最新構造におけるRMSDに基づき、前記RMSDが、前記タンパク質モデルの前記実質的部分のα炭素原子、および前記タンパク質モデルの前記実質的部分の重い原子、のうちの少なくとも1つの位置を通して定義される、あるいは
    (F)前記タンパク質モデルのための任意の最新構造について決定された前記実際の集団座標が少なくとも一部として、前記タンパク質モデルの前記実質的部分の前記ネイティブ構造の総溶媒露出表面積(SASA)に対する、前記タンパク質モデルの前記実質的部分の前記最新構造における前記SASAに基づく、あるいは
    (G)前記タンパク質モデルのための任意の最新構造について決定された前記実際の集団座標が少なくとも一部として、前記タンパク質モデルの前記実質的部分の前記ネイティブ構造におけるバックボーン水素結合のうちの、前記タンパク質モデルの前記実質的部分の前記最新構造におけるバックボーン水素結合の数に基づく、あるいは
    (H)前記タンパク質モデルのための任意の最新構造について決定された前記実際の集団座標が少なくとも一部として、前記タンパク質モデルの前記実質的部分の前記ネイティブ構造の回転半径に対する、前記タンパク質モデルの前記実質的部分の前記最新構造の回転半径に基づく、あるいは
    (I)前記タンパク質モデルのための任意の最新構造について決定された前記実際の集団座標が少なくとも一部として、前記タンパク質モデルの前記実質的部分の前記ネイティブ構造の構造オーバーラップ関数に対する、前記タンパク質モデルの前記実質的部分の前記最新構造の構造オーバーラップ関数に基づく、あるいは
    (J)前記タンパク質モデルのための任意の最新構造について決定された前記実際の集団座標が少なくとも一部として、前記タンパク質モデルの前記実質的部分の前記ネイティブ構造からの、前記タンパク質モデルの前記実質的部分の前記最新構造の一般化されたユークリッド距離に基づく、
    請求項4〜6のいずれか1項に記載の方法。
  8. 前記タンパク質モデルの前記実質的部分の前記ネイティブ構造におけるコンタクトのうちの各コンタクトについて、前記コンタクト関数が、式:
    Figure 0006952351
    (式中、rijは、前記タンパク質モデルの前記実質的部分における原子iとjの核間の距離であり、r、nおよびmは、適宜選択された定数である)を有する、請求項4〜6のいずれか1項に記載の方法。
  9. 1つまたは複数の独立したランにおける集団座標に基づくバイアシングポテンシャルを適用して前記タンパク質モデルにバイアスをかけるステップを反復することを含み、
    任意選択で、複数の独立したランにおける集団座標に基づくバイアシングポテンシャルを適用して前記タンパク質モデルにバイアスをかけるステップを反復することを含んでもよく、
    任意選択で、各ランについて、前記コンピュータシステムにより、そして前記タンパク質モデルのための前記最新構造における複数の残基のうちの各残基について、前記残基の前記タンパク質のアンフォールディングを示す計量を提供する局所アンフォールディング指標を決定することを含んでもよ
    任意選択で、ランにより、そして残基により指数化されたマトリックスデータ構造を前記コンピュータシステムにより作成することをさらに含んでもよく、前記マトリックスデータ構造が、前記複数の残基のうちの各ランおよび各残基について、前記対応する局所アンフォールディング指標のための値を含む、
    請求項1〜8のいずれか1項に記載の方法。
  10. 前記複数の残基のうちの各ランおよび各残基について、前記タンパク質モデルのための複数の最新構造にわたる平均に基づいて前記局所アンフォールティング指標を決定することを含み、
    任意選択で、前記複数の残基のうちの各ランおよび各残基について、適用された集団座標に基づくバイアシングポテンシャルが、平均を決定した前記複数の最新構造について一定していてもよい、
    請求項9に記載の方法。
  11. (A)前記タンパク質モデルのための前記最新構造における前記複数の残基のうちの各ランおよび各残基について、前記局所アンフォールディング指標が少なくとも一部として、前記タンパク質モデルの前記ネイティブ構造における前記残基のための溶媒露出表面積(SASA)に対する、前記タンパク質モデルの前記最新構造における前記残基のための前記SASAの変動に基づく;
    (B)前記タンパク質モデルのための前記最新構造における前記複数の残基のうちの各ランおよび各残基について、前記局所アンフォールディング指標が少なくとも一部として、前記タンパク質モデルの前記ネイティブ構造における前記残基のための原子間の複数のコンタクトのうちの、前記タンパク質モデルの前記最新構造モデルにおける前記残基のための原子間の損失コンタクトの数に基づく;
    (C)前記タンパク質モデルのための前記最新構造における前記複数の残基のうちの各ランおよび各残基について、前記局所アンフォールディング指標が少なくとも一部として、前記タンパク質モデルの前記ネイティブ構造のための前記残基の根平均二乗揺らぎ(RMSF)に対する、前記タンパク質モデルの前記最新構造モデルのための前記残基の前記RMSFに基づく;
    (D)前記タンパク質モデルのための前記最新構造における前記複数の残基のうちの各ランおよび各残基について、前記局所アンフォールディング指標が少なくとも一部として、前記タンパク質モデルの前記ネイティブ構造の前記残基における複数の水素結合のうちの、前記タンパク質モデルの前記最新構造モデルの前記残基における損失バックボーン水素結合の数に基づく;
    (E)前記タンパク質モデルのための前記最新構造における前記複数の残基のうちの各ランおよび各残基について、前記局所アンフォールディング指標が少なくとも一部として、前記タンパク質モデルについての前記ネイティブ構造における前記残基のための相互作用のポテンシャルエネルギーに対する、前記タンパク質モデルの前記最新構造モデルにおける前記残基のための相互作用のポテンシャルエネルギーに基づく、
    請求項9または10に記載の方法。
  12. 各ランについて、前記最新構造を分析して前記1つまたは複数の候補エピトープを同定することが、前記コンピュータシステムにより、前記タンパク質モデルのための前記最新構造を残基の複数の群に解析すること、および各群について、前記コンピュータシステムにより、前記群のための前記局所アンフォールディングの印を群のアンフォールディング評価に供することを含み、前記群における残基の全てまたは適切な閾値割合より多くが、アンフォールディングを示す局所アンフォールディングの印を有する場合には、前記群のアンフォールディング評価が、前記群についての肯定的なアンフォールディング評価結果を返し、
    任意選択で、任意の1つの局所指標がアンフォールディングを示すか否かを評価することが、前記コンピュータシステムにより、前記1つの局所指標を閾値工程に供することを含んでもよい、
    請求項9〜11のいずれか1項に記載の方法。
  13. (A)前記複数の群が、様々なウインドウサイズを含み、特定の群の前記ウインドウサイズが、前記特定の群における複数の残基を参照し、任意選択で、前記複数の群の幾つかが、共通の残基を含んでもよい;
    (B)前記複数の群が、群の複数の組を含み、群の各組が、共通のウインドウサイズを有し、群の各組が、前記複数の残基における前記残基の全てを含む;および/または
    (C)前記タンパク質モデルのための前記最新構造における前記複数の残基のうちの各ランおよび各残基について、前記局所フォールティング指標が少なくとも一部として、前記タンパク質モデルの前記ネイティブ構造の残基についての溶媒露出表面積(SASA)に対する、前記タンパク質モデルの前記最新構造における残基についての前記SASAの変動に基づき、前記群における残基の全てまたは適切な閾値割合より多くが、零よりも大きなSASAの変動(ΔSASA>0)を有する場合、前記群のための前記局所アンフォールディングの印を群のアンフォールディング評価に供することが、前記群について肯定的な結果を返すことを含む、
    請求項12に記載の方法。
  14. 残基の前記複数の群のそれぞれについて、前記コンピュータシステムにより、ランの総数の閾値割合(f)以上のランの数で肯定的なアンフォールディング評価結果を呈する前記残基の群を決定することに基づいて、前記コンピュータシステムにより、潜在的な候補エピトープである前記残基の群を検討することを含み、
    (A)任意選択で、各潜在的な候補エピトープについて、前記潜在的な候補エピトープに対応する残基の群における前記残基のための前記局所アンフォールディングの印を蓄積することを含み、任意選択で、前記残基の群における前記残基のための前記局所アンフォールディングの印を蓄積することが、前記ランの全てを通して実施され、任意選択で、各潜在的な候補エピトープのための前記蓄積された局所アンフォールディングの印が、前記潜在的な候補エピトープの強度を示す;
    (B)任意選択で、前記コンピュータシステムにより、ウインドウサイズおよび群の残基参照により指数化されたマトリックスデータ構造を作成することを含み、前記マトリックスデータ構造における各エントリーが、潜在的候補エピトープと、前記潜在的候補エピトープを構成する前記残基と、場合により前記潜在的候補エピトープを構成する前記残基のための前記蓄積された局所アンフォールディングの印と、を含む;
    (C)前記潜在的な候補エピトープのうちの第一の候補エピトープを同定することを含み、前記第一の候補エピトープを同定することが、最大のウインドウサイズを有する前記潜在的な候補エピトープを、前記第一の候補エピトープになるように選択することを含み、任意選択で、前記第一の候補エピトープを同定した後、前記潜在的な候補エピトープから前記第一の候補エピトープおよび前記第一の候補エピトープのサブエピトープを除去して、候補エピトープとしてのさらなる検討のために減少された潜在的な候補エピトープの組を得ることを含み、前記第一のエピトープの前記サブエピトープが、前記第一の候補エピトープよりも小さく、前記第一の候補エピトープにも含まれる残基のみを含み、任意選択で、前記減少された潜在的候補エピトープの組の中の前記最大ウインドウサイズが、閾値最小サイズ以下になるまで、
    前記減少された潜在的候補エピトープの組の中で最大のウインドウサイズを有する潜在的候補エピトープを次の候補エピトープになるように選択することを含む、前記減少された潜在的候補エピトープの組のうちの前記次の候補エピトープを同定するステップと、
    前記次の候補エピトープおよび前記次の候補エピトープのサブエピトープを、前記減少された潜在的候補エピトープの組から除去するステップであって、前記次のエピトープの前記サブエピトープが、前記次の候補エピトープよりも小さく、前記次の候補エピトープにも含まれる残基のみを含む、エピトープの群を含む、ステップと、
    を反復することを含む、
    請求項12または13に記載の方法。
  15. (A)前記タンパク質が、凝集構造であり、前記ネイティブ構造が、前記凝集構造のペプチド鎖により呈されたネイティブ構造を含む;
    (B)前記タンパク質が、推定フォールディング構造を有する一本鎖ポリペプチドである;
    (C)前記タンパク質モデルの前記実質的な部分が、前記タンパク質の全てを含む;
    (D)前記タンパク質モデルの前記実質的な部分が、境界構造を除く前記タンパク質モデルの全てを含む;および/または
    (E)前記タンパク質が、凝集構造であり、前記タンパク質モデルの前記実質的な部分が、前記凝集構造の端部にある境界ペプチド鎖を除く前記凝集構造に対応する前記タンパク質モデルの全てを含む、
    請求項1〜14のいずれか1項に記載の方法。
  16. 前記タンパク質が、凝集構造であり、前記ネイティブ構造が、前記凝集構造のペプチド鎖により呈されたネイティブ構造を含み、各ランについて、前記最新構造を分析して前記1つまたは複数の候補エピトープを同定することが、前記コンピュータシステムにより、前記タンパク質モデルのための前記最新構造を残基の複数の群に解析すること、および各群について、前記コンピュータシステムにより、前記群のための前記局所アンフォールディングの印を群のアンフォールディング評価に供することを含み、前記群における残基の全てまたは適切な閾値割合より多くが、前記凝集構造における任意のペプチド鎖についてのアンフォールディングを示す局所アンフォールディングの印を有する場合には、前記群のアンフォールディング評価が、前記群について肯定的なアンフォールディング評価結果を返す、請求項9〜15のいずれか1項に記載の方法。
  17. タンパク質内の1つまたは複数の候補エピトープのコンピュータベースの予測のためのシステムであって、
    コンピュータシステム上にコンホメーションサンプリングエンジンを提供するステップ;
    前記コンピュータシステムにおいて、前記コンホメーションサンプリングエンジンと共に使用するのに適したタンパク質のモデルを得るステップであって、得られたタンパク質モデルが、ネイティブ構造を含む、ステップ;
    前記コンピュータシステムにより、集団座標に基づくバイアシングポテンシャルを適用して前記タンパク質モデルにバイアスをかけるステップであって、前記バイアシングポテンシャルが、前記コンホメーションサンプリングエンジンに順次、前記タンパク質モデルを強制的にネイティブ構造から最新構造に少なくとも部分的にアンフォールディングさせ、前記バイアシングポテンシャルが、前記タンパク質モデルの少なくとも実質的部分に全体的に適用されて、前記タンパク質モデルの前記実質的部分の中でアンフォールディングが起こる場所に関して偏りがない、ステップ;
    前記コンピュータシステムにより、前記最新構造を分析して、1つまたは複数の候補エピトープを同定するステップであって、前記1つまたは複数の候補エピトープが、局所的なアンフォールディングの印を呈する、ステップ、
    を含む方法を実施するように構成された1つまたは複数のコンピュータを含む、システム。
  18. コンピュータシステムにより実行された場合に前記コンピュータシステムに請求項1〜17のいずれかの方法を実施させる非一時的なコンピュータで読み取り可能な指令を含む、コンピュータログラム製品。
JP2018522708A 2015-11-09 2016-11-09 集団座標バイアシングによりミスフォールディングタンパク質エピトープを予測するためのシステムおよび方法 Active JP6952351B2 (ja)

Applications Claiming Priority (17)

Application Number Priority Date Filing Date Title
US201562253044P 2015-11-09 2015-11-09
US62/253,044 2015-11-09
US201662289893P 2016-02-01 2016-02-01
US62/289,893 2016-02-01
US201662309765P 2016-03-17 2016-03-17
US62/309,765 2016-03-17
US201662331925P 2016-05-04 2016-05-04
US62/331,925 2016-05-04
US201662352346P 2016-06-20 2016-06-20
US62/352,346 2016-06-20
US201662363566P 2016-07-18 2016-07-18
US62/363,566 2016-07-18
US201662365634P 2016-07-22 2016-07-22
US62/365,634 2016-07-22
US201662393615P 2016-09-12 2016-09-12
US62/393,615 2016-09-12
PCT/CA2016/051306 WO2017079836A1 (en) 2015-11-09 2016-11-09 Systems and methods for predicting misfolded protein epitopes by collective coordinate biasing

Publications (3)

Publication Number Publication Date
JP2018538254A JP2018538254A (ja) 2018-12-27
JP2018538254A5 JP2018538254A5 (ja) 2019-12-19
JP6952351B2 true JP6952351B2 (ja) 2021-10-20

Family

ID=58694580

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018522708A Active JP6952351B2 (ja) 2015-11-09 2016-11-09 集団座標バイアシングによりミスフォールディングタンパク質エピトープを予測するためのシステムおよび方法

Country Status (9)

Country Link
US (1) US11756650B2 (ja)
EP (1) EP3374906B1 (ja)
JP (1) JP6952351B2 (ja)
KR (1) KR20180093910A (ja)
CN (1) CN108475298A (ja)
CA (1) CA3004593A1 (ja)
DK (1) DK3374906T3 (ja)
HK (1) HK1259338A1 (ja)
WO (1) WO2017079836A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3374379A4 (en) 2015-11-09 2019-05-15 The University Of British Columbia N-TERMINAL EPITOPES IN BETA-AMYLOID AND CONFORMATIONALLY SELECTIVE ANTIBODIES THEREOF
US10759837B2 (en) 2015-11-09 2020-09-01 The University Of British Columbia Anti-amyloid beta antibodies binding to a cyclic amyloid beta peptide
JP7448174B2 (ja) * 2015-11-09 2024-03-12 ザ・ユニバーシティ・オブ・ブリティッシュ・コロンビア アミロイドベータ中間領域エピトープおよびそれに対する立体配座選択的抗体
CN116333108A (zh) 2016-07-18 2023-06-27 英属哥伦比亚大学 淀粉样蛋白β的抗体
US20180125920A1 (en) 2016-11-09 2018-05-10 The University Of British Columbia Methods for preventing and treating A-beta oligomer-associated and/or -induced diseases and conditions
EP3634987A4 (en) * 2017-05-30 2021-03-03 The University of British Columbia EPITOPES IN RNA RECOGNITION MOTIVE 1 (RRM1) OF TDP-43 AND MISFOLDING-SELECTIVE ANTIBODIES
CN109086565B (zh) * 2018-07-12 2021-11-23 浙江工业大学 一种基于残基间接触约束的蛋白质结构预测方法
CN109273048B (zh) * 2018-09-12 2021-08-03 浙江工业大学 一种蛋白质表面残基的快速确定方法
CN114927160A (zh) * 2022-03-03 2022-08-19 北京晶泰科技有限公司 热点残基和靶点蛋白复合物结构的生成方法及装置
CN116386712B (zh) * 2023-02-20 2024-02-09 北京博康健基因科技有限公司 一种基于抗原蛋白动态空间结构的表位预测方法及装置

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69837555T2 (de) * 1997-06-02 2007-12-20 The Johns Hopkins University Rechnerverfahren freie energieberechnung für ligandenentwurf verwendend und die voraussage von bindenden zielen
US6277970B1 (en) * 1999-05-11 2001-08-21 The Regents Of The University Of California PRP-like gene
DE10059720A1 (de) * 2000-11-30 2002-06-06 Roche Diagnostics Gmbh Verwendung intramolekular kovalent vernetzter Proteine als Bindepartner in Immunoassays
CN101082944A (zh) * 2007-06-01 2007-12-05 哈尔滨工程大学 基于综合算法的蛋白质折叠过程的计算机模拟方法
US8417461B2 (en) * 2007-10-05 2013-04-09 Ut-Battelle, Llc Identification and modification of dynamical regions in proteins for alteration of enzyme catalytic effect
US8498823B2 (en) 2008-09-26 2013-07-30 The Regents Of The University Of Michigan High-throughput ensemble-based docking and elucidation of 3-dimensional structural conformations of flexible biomolecular targets
CA2743361C (en) 2008-10-06 2021-05-25 Neil R. Cashman Methods and systems for predicting misfolded protein epitopes
CN102511045A (zh) * 2009-09-25 2012-06-20 上海抗体药物国家工程研究中心有限公司 通过计算机辅助设计来获得高亲和力的蛋白质的方法
WO2011106885A1 (en) 2010-03-03 2011-09-09 The University Of British Columbia Oligomer-specific amyloid beta epitope and antibodies
DE102010026094B4 (de) * 2010-07-05 2012-01-12 Sigeng Han Ein neues Verfahren zum Charakterisieren und multidimensionalen Darstellen des Faltungsvorgangs der Proteine
JP5697638B2 (ja) 2011-09-26 2015-04-08 富士フイルム株式会社 質点系の挙動を予測するシミュレーション装置およびシミュレーション方法並びにその方法を実行するためのプログラムおよび記録媒体
AU2013302283B2 (en) * 2012-08-17 2015-04-09 Zymeworks Inc. Systems and methods for sampling and analysis of polymer conformational dynamics
CA2926248A1 (en) * 2013-10-04 2015-04-09 The Johns Hopkins University Insertion of ionizable groups in the interior of proteins as a strategy for engineering artificial ph-sensitive switch proteins
JP2019505165A (ja) 2015-11-09 2019-02-28 ザ・ユニバーシティ・オブ・ブリティッシュ・コロンビア アミロイドベータのc末端エピトープおよびそれに対する立体配座選択的抗体
JP7448174B2 (ja) 2015-11-09 2024-03-12 ザ・ユニバーシティ・オブ・ブリティッシュ・コロンビア アミロイドベータ中間領域エピトープおよびそれに対する立体配座選択的抗体
US10759837B2 (en) 2015-11-09 2020-09-01 The University Of British Columbia Anti-amyloid beta antibodies binding to a cyclic amyloid beta peptide
EP3374379A4 (en) 2015-11-09 2019-05-15 The University Of British Columbia N-TERMINAL EPITOPES IN BETA-AMYLOID AND CONFORMATIONALLY SELECTIVE ANTIBODIES THEREOF
US20180326027A1 (en) 2015-11-09 2018-11-15 The University Of British Columbia Epitopes in amyloid beta and conformationally-selective antibodies thereto

Also Published As

Publication number Publication date
CN108475298A (zh) 2018-08-31
EP3374906A1 (en) 2018-09-19
EP3374906A4 (en) 2019-08-07
HK1259338A1 (zh) 2019-11-29
DK3374906T3 (da) 2022-03-07
CA3004593A1 (en) 2017-05-18
US11756650B2 (en) 2023-09-12
EP3374906B1 (en) 2022-01-05
US20180330045A1 (en) 2018-11-15
WO2017079836A1 (en) 2017-05-18
JP2018538254A (ja) 2018-12-27
KR20180093910A (ko) 2018-08-22

Similar Documents

Publication Publication Date Title
JP6952351B2 (ja) 集団座標バイアシングによりミスフォールディングタンパク質エピトープを予測するためのシステムおよび方法
Siebenmorgen et al. Computational prediction of protein–protein binding affinities
Yuan et al. Binding site detection and druggability prediction of protein targets for structure-based drug design
Zhang et al. Prediction of conformational B-cell epitopes from 3D structures by random forests with a distance-based feature
Park et al. Factors affecting the ability of energy functions to discriminate correct from incorrect folds
Warren et al. Essential considerations for using protein–ligand structures in drug discovery
Camilloni et al. Statistical mechanics of the denatured state of a protein using replica-averaged metadynamics
Tuncbag et al. Fast and accurate modeling of protein–protein interactions by combining template‐interface‐based docking with flexible refinement
Graham et al. Force-induced change in protein unfolding mechanism: discrete or continuous switch?
Maruyama et al. Analysis of protein folding simulation with moving root mean square deviation
Gao et al. New benchmark metrics for protein‐protein docking methods
JP5211458B2 (ja) 化合物の仮想スクリーニング方法および装置
Yuwen et al. Role of electrostatic interactions in binding of peptides and intrinsically disordered proteins to their folded targets: 2. The model of encounter complex involving the double mutant of the c-Crk N-SH3 domain and peptide Sos
CN116635940A (zh) 使用简化多序列比对来训练蛋白结构预测神经网络
Mugnai et al. Sizes, conformational fluctuations, and SAXS profiles for intrinsically disordered proteins
Suarez et al. Sampling assessment for molecular simulations using conformational entropy calculations
KR20160057003A (ko) 결합 상대방을 고려하여 rna 서열에서 단백질과 결합하는 부위를 예측하는 방법
JP4377691B2 (ja) スクリーニング方法とスクリーニングシステム及びスクリーニングプログラム
Salvatella Understanding protein dynamics using conformational ensembles
US20140222398A1 (en) Methods and apparatus for double-integration orthogonal space tempering
Kalinowska et al. Hypothetical in silico model of the early-stage intermediate in protein folding
Han et al. Distribution of bound conformations in conformational ensembles for X-ray ligands predicted by the ANI-2X machine learning potential
Ross-Naylor et al. Energy landscape mapping and replica exchange molecular dynamics of an adsorbed peptide
Luo et al. Biophysical and Integrative Characterization of Protein Intrinsic Disorder as a Prime Target for Drug Discovery
Noy et al. Flexible protein‐protein docking based on Best‐First search algorithm

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191108

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210126

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20210416

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20210625

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210726

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210824

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210917

R150 Certificate of patent or registration of utility model

Ref document number: 6952351

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150