JP6952351B2

JP6952351B2 - 集団座標バイアシングによりミスフォールディングタンパク質エピトープを予測するためのシステムおよび方法

Info

Publication number: JP6952351B2
Application number: JP2018522708A
Authority: JP
Inventors: サムエルプロトキン，スティーブン
Original assignee: ザ・ユニバーシティ・オブ・ブリティッシュ・コロンビア
Priority date: 2015-11-09
Filing date: 2016-11-09
Publication date: 2021-10-20
Anticipated expiration: 2036-11-09
Also published as: KR20180093910A; EP3374906B1; DK3374906T3; WO2017079836A1; CA3004593A1; JP2018538254A; US20180330045A1; CN108475298A; HK1259338A1; EP3374906A4; US11756650B2; EP3374906A1

Description

関連出願
本出願は、
・２０１５年１１月９日出願の米国特許出願第６２／２５３０４４号；
・２０１６年２月１日出願の同第６２／２８９８９３号；
・２０１６年３月１７日出願の同第６２／３０９７６５号；
・２０１６年５月４日出願の同第６２／３３１９２５号；
・２０１６年６月２０日出願の同第６２／３５２３４６号；
・２０１６年７月１８日出願の同第６２／３６３５６６号；
・２０１６年７月２２日出願の同第６２／３６５６３４号；および
・２０１６年９月１２日出願の同第６２／３９３６１５号；
の優先権を主張するものであり、これらの出願は全て、参照により本明細書に組み入れられる。

技術分野
本発明は、ミスフォールディングタンパク質エピトープ、より正確にはアンフォールディング特異性（ｕｎｆｏｌｄｉｎｇ−ｓｐｅｃｉｆｉｃ）タンパク質エピトープの予測に関する。アンフォールディング特異性エピトープは、タンパク質がその構造の少なくとも一部を損失している場合に生じ得る。ミスフォールディングタンパク質は、そのようなエピトープを提示し得るが、適切にフォールディングしたタンパク質は、それを提示しないであろう。特別な実施形態は、タンパク質（またはペプチド凝集体）に集団座標バイアス（例えば、全体的に課された集団座標バイアス）を課して該タンパク質（またはペプチド凝集体）を強制的にアンフォールディングさせる、分子動力学ベースのシミュレーションを実施すること；およびその後、該シミュレーションから得られた、部分的に構造化されていないタンパク質（またはペプチド凝集体）の中のアンフォールディング領域の検出に基づき、アンフォールディングタンパク質エピトープを予測すること、を含む、ミスフォールディングタンパク質エピトープを予測するための方法を提供する。

模範的実施形態を、参照される形状の図面で示す。本明細書に開示された実施形態および図が、制限ではなくむしろ例示と見なされるべきことを意図する。

特定の実施形態による、候補となるミスフォールディングタンパク質エピトープを予測するためのコンピュータベースの方法またはコンピュータに実装された方法を略図で示す。模範的コンタクトについての、距離ｒに対する方程式（１）のコンタクト関数Ｑ_ｉｊ（ｒ）のプロットを示す。Ａβアミロイドの典型的なバイアシングシミュレーションについての、時間に対する、図１の方法を用いてシミュレートされたＱ（ｔ）のプロット、および滑らかな、または線形の（例えば、変動が一定速度の）目的集団座標曲線Ｑ_ｃ（ｔ）のプロットを示す。図４Ａは、初期構造の８０％にバイアスをかけた場合の、３回対称Ａβ構造２Ｍ４Ｊの１つのモノマーについて、配列内の各残基の残基指数（ｒｅｓｉｄｕｅｉｎｄｅｘ）の関数として初期構造の溶媒露出表面積（ＳＡＳＡ）に比較した、アミノ酸の側鎖のＳＡＳＡの変動のプロットを示す。プロット内の各曲線は、このモノマーについての別のバイアスシミュレーションに対応する。図４Ｂは、各鎖の所与の区分（例えば、残基２３〜２８）が独立して検討され、各シミュレーションランが独立して検討される、模範的凝集構造のための図１の方法の分析を略図で示す。図５Ａ、５Ｂおよび５Ｃ（集合的に図５）は、特定の実施形態により、図１の方法で用いられ得る、またはその他では候補エピトープ予測方法で用いられ得る、凝集系を含むタンパク質内の候補エピトープを同定するための、シミュレーション結果を分析するための方法を略図で示す。図５Ａ、５Ｂおよび５Ｃ（集合的に図５）は、特定の実施形態により、図１の方法で用いられ得る、またはその他では候補エピトープ予測方法で用いられ得る、凝集系を含むタンパク質内の候補エピトープを同定するための、シミュレーション結果を分析するための方法を略図で示す。図５Ａ、５Ｂおよび５Ｃ（集合的に図５）は、特定の実施形態により、図１の方法で用いられ得る、またはその他では候補エピトープ予測方法で用いられ得る、凝集系を含むタンパク質内の候補エピトープを同定するための、シミュレーション結果を分析するための方法を略図で示す。図６Ａ〜６Ｄ（集合的に図６）は、特定の実施形態による、図１の方法に適用されたバイアシング工程のアウトプットに基づく潜在的候補エピトープの分析、および候補エピトープの予測を示す、異なるＡβ線維構造のための複数の「ファイアプロット」を示す。３回対称構造２Ｍ４Ｊのための、バイアシングの間、およびその後のしばらくの期間のファイアプロットを示す。図７Ａは、４ｎｓを中心とした１ｎｓの時間ウインドウに対応し、同様に図７Ｂは８ｎｓ、図７Ｃは１２ｎｓ、図７Ｄは１６ｎｓ、図７Ｅは２０ｎｓを中心とした１ｎｓの時間ウインドウに対応する。このシステムは、Ｑ＝０．６のみにバイアスがかけられており（図３参照）、そのためパネル７Ｄおよび７Ｅは、両者ともＱ＝０．６に対応する。本明細書に記載された複数のタンパク質についての複数の予測されるエピトープを示す。３つの異なるＡβ線維構造についての、ＳＡＳＡの変動（上の行）および損失されたコンタクトの数（下の行）に基づくファイアプロットの比較を示す（図９の列に対応）。初期Ｑ０．８にバイアスをかけた後の３回対称Ａβ構造２Ｍ４Ｊの描画である。初期Ｑ０．６にバイアスをかけた後の３回対称Ａβ構造２Ｍ４Ｊの描画である。初期Ｑ０．８にバイアスをかけた後のＡβ４２構造２ＭＸＵの描画である。初期Ｑ約０．８にバイアスをかけた後の２回対称Ａβ４０構造２ＬＭＮの描画を示す。該方法に対する複数の異なるリファインメントについてのファイアプロットを示す。特定の実施形態による、本明細書に記載された方法のいずれか、および本明細書に記載された方法のいずれかのステップを実施するために用いられ得るコンピュータシステムの略図である。特定の実施形態による、図５Ｃの方法の一部としての、図６Ａのファイアプロットからの候補エピトープおよびサブエピトープの除去を示す一連のプロットである。図１７Ａは、特定の実施形態による、図１の方法に適用されたバイアシング工程のアウトプットに基づく潜在的候補エピトープの分析、および候補エピトープの予測を示すＳＯＤ１のファイアプロットである。図１７Ｂは、Ｑ＝０．６５での図１７ＡのＳＯＤ１のバイアシング集団の例示的な図である。候補エピトープは、暗い描影で示されている。

記載
以下の記載全体を通して、当業者へより完全な理解を提供するために、具体的詳細が示されている。しかし、本開示を不要に妨害することのないよう、周知の要素は詳細に図示または記載されていない場合がある。したがって、該記載および図面は、制限というよりむしろ例示の意味で解釈されなければならない。

本開示の態様は、ミスフォールディングタンパク質エピトープの予測のための方法およびシステムを提供する。タンパク質またはペプチド凝集体は、典型的にはそれぞれ、いわゆるネイティブ構造またはフィブリル構造を呈する。本開示では、文脈から明白である場合には、ネイティブ構造およびフィブリル構造の両方を「ネイティブ構造」と称する。典型的にはタンパク質のネイティブ構造は、タンパク質の様々な部分の間にある相互作用（コンタクトと称される）により安定化されている。特定の実施形態は、タンパク質（またはペプチド凝集体）に集団座標バイアスを課してタンパク質またはペプチド凝集体を強制的にアンフォールディングさせる分子動力学ベースのシミュレーションを実施することを含む、アンフォールディング特異性タンパク質エピトープを予測するための方法を提供する。本開示および添付の特許請求の範囲において、文脈で他に示されない限り、タンパク質またはペプチド凝集体に対応する集団座標（または集団変数）は、タンパク質またはペプチド凝集体に対応する分子動力学ベースのモデルの複数のパラメータ／変数に基づく変数である。集団座標は、検討されているタンパク質またはペプチド凝集体の全体であり得る。本開示および添付の特許請求の範囲において、文脈で他に示されない限り、全体的な集団座標（または簡潔にするために全体的座標）は、原子に関連する幾何学的／空間的基準、一次配列における原子の場所（複数可）、特定の原子の二次構造などに基づくタンパク質またはペプチド凝集体の実質的部分の任意のサブポーション（ｓｕｂ−ｐｏｒｔｉｏｎ）に対応するパラメータ／変数の選択、加重などを含まない、タンパク質またはペプチド凝集体の少なくとも実質的部分に対応するモデル（例えば、分子動力学ベースのモデル）の原子に関連するパラメータ／変数に依存する集団座標を指す。タンパク質またはペプチド凝集体の実質的部分は、タンパク質もしくはペプチド凝集体の全て、またはタンパク質もしくはペプチド凝集体の適当な境界条件（例えば、縁部の残基または縁部のペプチド鎖）に適用されることを意味する、境界構造以外の全てを含み得る。全体的な集団座標の非限定的例は、ネイティブ構造の対応する位置に対する、タンパク質構造における全α炭素原子の位置の根平均二乗偏差（ＲＭＳＤ）を包含する。全体ではなく局所である集団座標の２つの非限定的例は、以下の通りである：１）タンパク質の疎水性コアの中のみにある全α炭素原子の位置のＲＭＳＤ、２）二次構造のターン領域にあるα炭素のみのＲＭＳＤ。これらの例は両者とも、ネイティブまたはフィブリル構造の選択部分またはサブセットについての先験的情報を考慮した原子選択について追加の制限条件を有するが、上記の全体的座標は、ネイティブ構造のサブポーションに任意の先験的なバイアスをかけた加重を用いない。

本発明の幾つかの態様による方法は、集団座標バイアスを課してタンパク質またはペプチド凝集体を強制的にアンフォールディングさせた後、シミュレーションから得られた部分的に構造化されていない（即ち、ネイティブ構造またはフィブリル構造でない）タンパク質またはペプチド凝集体のアンフォールディング領域の検出に基づき、アンフォールディングタンパク質エピトープを予測することを含む。幾つかの実施形態において、全体的にかけられた集団座標バイアスは、全体的にかけられた集団座標バイアスに応答してタンパク質にそれ自体のミスフォールディング（非ネイティブ）構造を採用させながら、または非ネイティブコンタクトが破壊されたタンパク質システムにより採用されない場合には、タンパク質のエネルギー関数に好適な幾つかの領域でタンパク質をアンフォールディングさせながら、タンパク質またはペプチド凝集体をネイティブ構造よりも少ないコンタクト、もしくはネイティブ構造と異なるコンタクトを強制的に持たせる。

本開示の幾つかの態様は、ネイティブ構造または凝集構造からの部分的な局所アンフォールディングを呈するタンパク質、またはタンパク質もしくはペプチド鎖の組に特有の１つまたは複数のエピトープを同定するためのコンピュータベースのシステムおよび方法を提供する。理解される通り、凝集構造（ペプチド凝集体またはフィブリルとも称される）は、ことによるとタンパク質をはじめとする、凝集した（例えば、比較的高濃度の）複数（例えば、３、５、１０、１００または１０００）のペプチド鎖を含む。凝集構造を形成する個々のペプチド鎖は、それ自体のネイティブ構造を有する場合または有さない場合があるが、凝集構造は典型的には、１つまたは複数の「ネイティブ」フィブリル構造を有し、該フィブリル構造は、含まれるペプチド鎖、ペプチド鎖が凝集する条件、そしてことによると確率論的要因、例えば非限定的例として個々のペプチド鎖のランダムコンフォメーションなどに依存し得る。本開示および添付の特許請求の範囲において、文脈で他に示されない限り、一般性を失わず、タンパク質、ペプチド凝集体、フィブリルおよび凝集構造は、本明細書ではタンパク質と称され得、タンパク質、ペプチド凝集体、フィブリルおよび／または凝集構造のネイティブ構造は、本明細書でネイティブ構造と称され得る。

本発明の幾つかの態様および実施形態によれば、タンパク質の分子動力学ベースの、またはモンテカルロサンプリングベースのモデルを導入して、外部から適用された（目的の）集団座標をバイアシングすること（例えば、増加、減少、または他の方法で変動もしくは操作すること）によりネイティブ構造を部分的にディスオーダーする方法が、提供される。幾つかの態様または実施形態において、該集団座標は、全体的な集団座標である。幾つかの態様または実施形態において、該集団座標は、ネイティブ構造との類似性の度合い、および／またはネイティブ構造からの偏差の度合いを表示する（例えば、それらと相関する、それらの関数である、それらを定量することが可能である、それらを順序付けることが可能である、または他の方法で表示する）。全体的な集団座標の非限定的例としては、ネイティブ構造におけるコンタクトのうちの、任意の特定のタンパク質構造のタンパク質（またはペプチド凝集体）の重い（非水素）原子の間の安定化相互作用（コンタクト）の数；ネイティブ構造内の水素原子の間のコンタクトのうちの、任意の特定のタンパク質構造内の水素原子の間の安定化相互作用（コンタクト）の数；ネイティブ構造内の重い原子の間の距離に対する特定タンパク質構造の全ての重い原子の間の距離；α炭素原子の位置により定義される、ネイティブ構造の根平均二乗構造偏差（ＲＭＳＤ）に対する特定タンパク質構造のＲＭＳＤ；重い原子の位置により定義される、ネイティブ構造に対する特定タンパク質構造のＲＭＳＤ；ネイティブ構造に対する特定タンパク質構造の総溶媒露出表面積（ＳＡＳＡ）；タンパク質のネイティブ構造内のバックボーン水素結合の数のうちの、特定タンパク質構造におけるバックグボーン水素結合の数；前述のものの組み合わせなど、に基づく変数が挙げられる。

本発明の幾つかの態様および実施形態は、外部から適用された（目的の）集団座標にバイアスをかけること、およびタンパク質の分子動力学ベースのモデルに強制的に構造を再編成させて、バイアスをかけた目的集団座標に従わせることを含む。分子動力学ベースのモデルに強制的に構造を再編成させて、バイアスをかけた目的集団座標に従わせることは、例えば実際の集団座標（分子動力学ベースのモデルから決定）とバイアスをかけた目的集団座標との差異に依存し得るコスト関数（バイアシングポテンシャル関数とも称される）を、分子動力学ベースのモデルに強制的に最小限にさせることにより、成就され得る。分子動力学ベースのモデルに強制的に構造を再編成させて、バイアスをかけた目的集団座標に従わせることは、バイアシングポテンシャルを適用することもしくは課すこと、または集団座標バイアスを適用することもしくは課すこと、と称され得る。

適用されたバイアシングポテンシャルが、全体的な集団座標に基づく場合、タンパク質は、典型的にはネイティブ構造を均一に損失せず、代わりに熱力学的に最もディスオーダーし易い特異的領域（複数可）においてネイティブ構造を損失する（即ち、アンフォールディングする、そしてことによるとミスフォールディングする）。そのような領域（複数可）は、タンパク質の他の領域に比較して、比較的弱い安定化自由エネルギーを有するそれらの領域（複数可）に対応し得る。全体的なバイアシングポテンシャルの適用によりディスオーダーする領域（複数可）は、ミスフォールディング特異性またはアンフォールディング特異性エピトープ、即ち、それらの領域（複数可）についてのネイティブ構造の非存在下のみに存在する（例えば、アンフォールディングまたはミスフォールディング構造に存在するが、ネイティブ構造には存在しない）エピトープを含み得る。

本発明の態様は、タンパク質の構造モデルに集団座標バイアスを適用して、ネイティブ構造とは異なる部分的アンフォールディング構造を呈するようにその構造タンパク質モデルを変換することを含む。タンパク質モデルの実質的な部分でアンフォールディングが起こる場所に関してバイアスおよび対応する変換が偏らないように、集団座標バイアスに基づく変換は、タンパク質モデルの少なくとも実質的部分に全体的に適用され得る。変換された（部分的アンフォールディングの）構造タンパク質モデルは、その後、局在化アンフォールディングの印を検出するため、そして局在化アンフォールディングの印を呈する候補エピトープを同定するために、分析され得る。

本開示の態様は、アルツハイマー病、ＡＬＳ、トランスサイレチンアミロイドポリニューロパチーなどの多様なアミロイド形成性神経変性疾患についてのミスフォールディング特異性の、または追加もしくは代替的にオリゴマー特異性のエピトープ、ならびに上皮成長因子受容体（ＥＧＦＲ）、細胞死受容体および分化タンパク質群などの細胞表面受容体をはじめとする部分的アンフォールディングの癌細胞特異性エピトープを予測するためのシステムおよび方法を提供する。加齢の、または破壊されたＡβ線維において本明細書に開示されたシステムおよび方法にしたがって予測された特異的で非限定的な例のエピトープとしては、残基１３〜１８または配列ＨＨＱＫＬＶ、残基６〜９または配列ＨＤＳＧ、残基１３〜１６または配列ＨＨＱＫ、残基１５〜１８またはＱＫＬＶ、残基２１〜２４またはＡＥＤＶ、および残基３７〜４０（Ａβ４２に特異的に）またはＧＧＶＶが挙げられるが、これらに限定されない。抗体は、配列同一性およびそのコンホメーションの両方に基づいてこれらのエピトープをターゲットとするであろう。ネイティブ構造またはフィブリルからアンフォールディングした一次配列の区分は、ネイティブ構造またはフィブリルの状況下の対応する区分とコンホメーションが異なる。そのような領域をターゲットとする抗体は、ネイティブ構造またはフィブリルに対して生じず、アンフォールディング構造集団を模倣した前述の一次配列のペプチド足場に生じるであろう。アンフォールディング特異性エピトープ（即ち、外部摂動によりフィブリルからアンフォールディングされるという基準に基づいて選択されたエピトープ）に結合する抗体は、ネイティブ構造のコンホメーションの状況下では該エピトープに結合しないが、該コンホメーションが構造化されていない場合のみ、エピトープに結合する。抗体が、環状ペプチドに生じる場合、抗体はまた、ペプチド鎖のアンフォールディングモノマー形態への選択性、例えばモノマーＡβ４２への選択性があり得る。

神経変性性および全身性の両方のアミロイド関連疾患に関与する幾つかのミスフォールディングタンパク質は、非限定的例としてトランスサイレチン、β２−ミクログロブリン、およびスーパーオキシドジスムターゼをはじめとし、かなりの度合いのネイティブの構造を有するフィブリルを示すようである。かなりの度合いの適度にフォールディングした推定ネイティブ構造を有するフィブリルのそのような提示から、全体的ではなく局所的なタンパク質アンフォールディングが、これらの疾患において重要な役割を担い得ることが示唆される。

他の神経変性疾患は、アルツハイマー病におけるＡβペプチドおよびパーキンソン病におけるα−シヌクレインなど、内因的にディスオーダーされたペプチドの凝集を含むようである。しかし、主にＡβペプチドを含むプラーク（即ち、フィブリルの集まり）および主にτ−タンパク質を含む神経線維タングルは、認知症の任意の提示がなく、ほとんどの個体において加齢と共に生じる。その一方で、Ａβシードを含む希釈脳抽出物によるマウスへの脳内注射で、プラーク沈着および脳内Ａβ血管障害をはじめとするアルツハイマー病の表現型症状が導入されることが観察された。そのような証拠は、単独で作用する大きなフィブリルの比較的不活性の機能以外に、様々なサイズおよび多形構造のオリゴマーを含有し得るＡβの異種血清の毒性を指摘している。これらの知見は、フィブリルではなくプリオンタンパク質のオリゴマーが最も感染性があることを見出したプリオン生物学の知見と一致している。その場合、大きなフィブリルは、Ａβペプチドを捕捉することにより保護的役割を担い得る。

しかし、Ａβモノマーの存在下では、フィブリルは、オリゴマーの生育および拡大のための核形成基質として作用し得る。この「二次的な核形成」過程は、Ａβモノマーまたはフィブリル破砕の間の直接の核形成よりももっと毒性オリゴマー種の主な供給源となるＳ−放射性標識ペプチドを用いた速度論的試験により見出された。まとめると、フィブリルがオリゴマー化を触媒する傾向を有する相互作用部位を提示し得ること、しかしこれが株特異性（ｓｔｒａｉｎ−ｓｐｅｃｉｆｉｃ）であり得、正常な患者に存在しない選択的フィブリル表面が露出することでモノマーとの異常な相互作用を有し得る（即ち、モノマーに提示される）場合のみに生じ得ることが、上記の証拠からが示唆される。低ｐＨ、炎症時に存在するオスモライト、または酸化障害などの環境上の課題は、フィブリル内に破壊を導入して、弱安定性領域の露出を導く可能性がある。その場合、これらの弱安定性領域を予測し、そのような予測を利用して、それらをターゲットにし得る治療薬を合理的に設計することに関心事になる。

癌の状況では、突然変異または欠失により導入されたタンパク質ミスフォールディングが、アポトーシス促進経路に関与するタンパク質を不安定にすること、または構成的活性になるように成長因子などの細胞表面タンパク質の機能を改変すること、のいずれかにより役割を担い得ることの複数の証拠が存在する。分子クラウディングの存在、低ｐＨおよび活性酸素種は全て、タンパク質構造を不安定にする異常な環境に寄与して、新生物細胞内のタンパク質により頻繁な構造的破壊を受け易くする。

新生物の状況下でのミスフォールディングタンパク質は、癌細胞選択性抗原ターゲットを提示し得、ネイティブタンパク質ではなくこれらのターゲットに対する抗体が、健常な組織におけるフォールディングタンパク質（複数可）の非意図的ターゲッティングによる望まない副作用を回避することができる。例えばＥＧＦＲに対するネイティブ抗体療法は、健常な組織におけるＥＧＦシグナル伝達に対抗することができ、ＥＧＦＲ阻害剤を受けた患者の大部分（４５〜１００％）は、丘疹膿疱性発疹を発症し、より少ない割合で、爪囲炎および粘膜炎を発症し、少数が、皮膚病変の生死にかかわる重感染を重度の反応を発症する。理想的な抗体系の抗悪性腫瘍薬は、腫瘍組織におけるＥＧＦＲシグナル伝達に選択的に対抗しながら、正常な組織におけるＥＧＦＲを免除することにより、これらの有害反応を回避し得る。

アルツハイマー病の状況では、上記証拠は、二次的な核形成のための「ホットスポット」として、またはＡβモノマーの動員部位として作用し得るＡβ線維の局所ディスオーダー領域の予測のための一般的欲求を起こさせる。フィブリル内で破壊される可能性がある領域は、毒性オリゴマー種における受動的露出領域のための良好な候補になり得る。なお、ネイティブフォールディングのタンパク質が、凝集の際に、かなりの度合いのネイティブ構造を保持し得るという事実は、ディスオーダーによりネイティブ構造を損失し易く、分子間非ネイティブ相互作用の候補領域として作用し得る、ネイティブフォールディングの構造における領域の予測を立証する。癌の状況では、新生物細胞の異常な環境の破壊的影響が、小分子または抗体療法のための癌細胞特異性ターゲットとして作用し得る、癌で調節不全となったタンパク質の局所ディスオーダー領域を予測する動機を与える。

本開示の態様は、ディスオーダーを受け易い連続したタンパク質領域（エピトープ）を予測するコンピュータベースのシステムおよび方法を提供する。部分的に破壊されたＡβ線維に基づく具体的な例のエピトープ予測が、以下により詳細に記載される。

非限定的例として、ＣＨＡＲＭＭ（ＣｈｅｍｉｓｔｒｙａｔＨＡＲｖａｒｄＭａｃｒｏｍｏｌｅｃｕｌａｒＭｅｃｈａｎｉｃｓ，ｈｔｔｐ：／／ｗｗｗ．ｃｈａｒｍｍ．ｏｒｇ／）などの量子力学的にパラメータ化された力場（例えば、分子動力学エンジンとしても公知の分子動力学モデルを用いる）は現在、実験的なフォールディングタンパク質構造をｄｅｎｏｖｏで再現する（即ち、タンパク質をフォールディングする）のに十分、正確である。量子化学のコンピュータ表示によってパラメータ化されるタンパク質のフォールディングに用いられる力場は、タンパク質の各ネイティブ構造の付近、またはその周辺で最も正確になる傾向がある。本発明の幾つかの実施形態は、そのような状況（即ち、ネイティブ構造の付近または周辺）での、またはこのネイティブ構造（例えば、熱運動を有するネイティブ構造）からの部分的な構造摂動に関する、本明細書に記載された技術を適用する。したがって、分子動力学モデルで用いられる、そしてそのような実施形態で用いられる公知の力場は、妥当な範囲内で適用されている。

本開示の態様は、タンパク質領域がネイティブ構造から構造的に逸脱する局所アンフォールディング事象を特徴づける。応答の際に、構造化されたタンパク質がアンフォールディングまたはミスフォールディングを開始するように、本発明の態様は、該タンパク質の分子動力学ベースのモデルに難題（幾つかの異常な環境的キュー（ｅｎｖｉｒｏｎｍｅｎｔａｌｑｕｅｕｅ）に基づく）を課す。そのような技術を実行するために、本開示の態様は、外部から適用される（目的の）集団座標にバイアスをかけて（例えば、増加、減少または他の方法で変動もしくは操作して）、分子動力学ベースのタンパク質モデルに対応するバイアシングポテンシャルを適用することを含む、本明細書で集団座標バイアシングと称される技術を用いる。本発明の幾つかの態様による方法は、タンパク質がアンフォールディングし始めると、部分的に構造化されていないタンパク質のアンフォールディング領域の検出に基づいてアンフォールディングタンパク質エピトープを予測することを含む。

図１は、特定の実施形態による、候補エピトープ５２（例えば、候補のアンフォールディングエピトープ）を予測するためのコンピュータベースのまたはコンピュータに実装された方法１０を示す。方法１０は、方法１０を実施するのに用いられ得るモデリングパラメータインプットを得ることを含むブロック２０を実行する。例えば、例示された実施形態において、ブロック２０のモデリングパラメータインプットとしては、ネイティブ構造モデル２２、原子力場２４、および集団座標バイアシングパラメータ２６が挙げられるが、これらに限定されない。そのようなモデリングパラメータインプット２２、２４、２６は一般に、任意の適切な供給源から任意の適切な技術により得ることができる。幾つかの実施形態において、モデリングパラメータインプット２２、２４、２６の一部または全ては、ユーザーにより（例えば、グラフィカルユーザーインターフェース、コマンドラインインターフェース、ネットワークインタフェース、Ｉ／Ｏインターフェース、または他の適切なインターフェース（例えば、適切な分子動力学エンジンソフトウエアなど）を通して）方法１０を実施するコンピュータに提供され得る。幾つかの実施形態において、方法１０は、ソフトウエアおよび／またはハードウエアを含むより包括的なコンピュータベースの分子動力学エンジンの一部であり得、モデリングパラメータインプット２２、２４、２６の一部または全ては、他の日常作業（図示しない）において分子動力学エンジンにより決定され得る。幾つかの実施形態において、モデリングパラメータインプット２２、２４、２６の一部または全ては、方法１０を実施するコンピュータと接続されているコンピュータに実装された外部システム（例えば、分子動力学システム、データベースなど）により提供され得る。幾つかの実施形態において、モデリングパラメータインプット２２、２４、２６の一部は、他のモデリングパラメータインプット２２、２４、２６から得ることができる（例えば、図１に明白に示されていない方法１０のステップにおいて）。

例示された実施形態において、ブロック２０は、該方法に供されたタンパク質（例えば、特定の疾患に関連することが示唆され得る、または他の方法で検討され得るタンパク質）の構造モデル２２を得ることを含む。構造モデル２２は、ブロック３０を実施する分子動力学エンジンでの使用に適した対象タンパク質のコンピュータ表示を含み得る（以下により詳細に議論）。構造モデル２２およびそれに関連するコンピュータ表示は、検討されているタンパク質中の原子核の物理的座標（例えば、ｘ、ｙおよびｚの物理的位置）を指定し得る（適切な手法で）。文脈で他に示されない限り、本開示および添付の特許請求の範囲において、タンパク質（例えば、方法１０で検討されているタンパク質）に提供される場合の構造という用語は、タンパク質内の原子核の一部もしくは全ての物理的座標（例えば、ｘ、ｙおよびｚの物理的位置）、および／またはそのような物理的座標の幾つかのコンピュータ表示に対応すると理解されなければならない。ブロック２０のモデリングパラメータインプットの一部として得られた構造モデル２２は、以下により詳細に記載される通り、検討されているタンパク質の「ネイティブ」構造を提供、指示または表現することができ、ブロック２５で実施されるシミュレーションにより集団座標バイアシングに供されて最新構造モデル３２を提供することができる。構造モデル２２は、実験的に決定された核座標の組を含み得るか、またはコンピュータで決定され得る。幾つかの実施形態において、構造モデル２２は、タンパク質データバンク（ＰＤＢ；ｗｗｗ．ｒｃｓｂ．ｏｒｇから入手し得るものなど）から得ることができる。幾つかの実施形態において、ブロック２０のモデリングパラメータインプットの一部として得られた構造モデル２２は、適切にフォールディングしたネイティブタンパク質構造のコンピュータベースの表示を含み得るか、またはミスフォールディングおよび凝集したフィブリル構造のコンピュータベースの表示を含み得る。構造モデル２２は、凝集構造（例えば、フィブリル）を形成し得る単一のタンパク質鎖または複数のペプチド鎖を含み得る。先に議論された通り、簡潔にするために、方法１０を受けたタンパク質および凝集構造は、一般性を失わず、本開示および添付の特許請求の範囲においてタンパク質またはタンパク質（複数）と称され得る。

ブロック２０はまた、検討されているタンパク質と関連する原子力場２４のコンピュータ表示を得ることを含む。そのような原子力場２４は、ブロック３０を実施する構造モデル２２および／または分子動力学エンジンのコンピュータ表示の形態で使用するように構成され得る。力場２４は、タンパク質の構造をシミュレートするための対応する分子動力学エンジンにより使用可能なＣＨＡＲＭＭまたは類似の力場モデル、例えばＯＰＬＳ（ＯｐｔｉｍｉｚａｔｉｏｎＰｏｔｅｎｔｉａｌｓｆｏｒＬｉｑｕｉｄＳｉｍｕｌａｔｉｏｎｓ）、ＧＲＯＭＯＳ（ｗｗｗ．ｇｒｏｍｏｓ．ｎｅｔ）などにより提供されるようなパラメータ化された力場モデルを含み得る。幾つかの実施形態において、構造モデル２２および原子力場２４は、統合され得る。

例示された実施形態において、ブロック２０はまた、外部から適用された目的集団座標が以下により詳細に記載されるブロック２５のシミュレーションループの間にどのようにしてバイアスをかけられるか（例えば、増加、減少または他の方法で変動もしくは操作されるか）を記載した集団座標および／またはシミュレーションパラメータ２６を得ることを含む。例えばそのような集団座標バイアスパラメータ２６は、目的集団座標の変動速度、目的集団座標の変動の振幅、目的集団座標の最大および／もしくは最小値、バイアスポテンシャル関数の他のパラメータ、例えば非限定的例として以下に記載されるポテンシャル関数の剛性（または「ばね定数」）ｋなどを指定し得る。パラメータ２６は追加的または代替的に、非限定的例としてシミュレーションのような期間および／もしくは時間ステップ離散化、シミュレーションの期間など、ブロック２５で実施されるシミュレーションの他のシミュレーションパラメータを含み得る。幾つかの実施形態において、該シミュレーションは、既に探索されたものと類似のコンホメーションにペナルティを課すことを含む、メタダイナミクス法を用いてタンパク質を強制的にアンフォールディングさせることができ、例えば、参照により本明細書に組み入れられる、Ｂｏｎｏｍｉｅｔａｌ．ＰＬＵＭＥＤ：Ａｐｏｒｔａｂｌｅｐｌｕｇｉｎｆｏｒｆｒｅｅ−ｅｎｅｒｇｙｃａｌｃｕｌａｔｉｏｎｓｗｉｔｈｍｏｌｅｃｕｌａｒｄｙｎａｍｉｃｓ，ＣｏｍｐｕｔｅｒＰｈｙｓｉｃｓＣｏｍｍｕｎｉｃａｔｉｏｎｓ１８０（２００９）１９６１−１９７２を参照されたい。幾つかのそのような実施形態において、メタダイナミクス法のパラメータは、シミュレーションパラメータ２６の一部であり得る。

ブロック２０でモデリングパラメータインプットを得た後、方法１０は、例示された実施形態においてブロック３０および４０を含むシミュレーションループ２５に進行する。幾つかの実施形態において、図１に示されたブロック５０の分析ステップは、ループ２５の内側全体またはその一部で実施され得る。ループ２５のシミュレーションは、分子動力学エンジンにより実装され得、フェムト秒（即ち、１ｆｓ＝１０^−１５秒）の単位またはフェムト秒の割合で時間ステップを含む、コンピュータ実装の不連続時間シミュレーションを含み得る。ループ２５のシミュレーションは、適切なコンピュータまたは複数のコンピュータで動作するソフトウエア分子動力学エンジンにより実装され得る。複数のソフトウエア分子動力学エンジンが、当該技術分野で公知である。１つの特定の実施形態において、ブロック２５のループは、公開されたソフトウエアパッケージＧＲＯＭＡＣＳおよびＰＬＵＭＥＤを時々更新しながら使用して実施される。ブロック２５のシミュレーションループの一部として、集団座標バイアスポテンシャルが、タンパク質に適用されて、ブロック２０内のインプットとして得られた構造モデル２２の変換を強制的に行い、検討されているタンパク質の最新構造モデル（最新のコンホメーションとも称される）３２を作成する。その上、検討されているタンパク質の構造モデルは、タンパク質の最新構造モデル（またはコンホメーション）３２を作成するためのブロック２５のシミュレーションの各時間ステップの際に変換される。具体的にはタンパク質の構造（即ち、タンパク質の原子の核の物理的座標のコンピュータ表示）は、最新構造モデル３２を作成する各時間ステップの際に変換される。

以下により詳細に議論される通り、ループ２５のシミュレーションは、検討されているタンパク質に集団座標バイアスを加えること、および一連の時間ステップ全体で該タンパク質を観察すること、を含む。全体的な集団座標は、原子位置（例えば、核の物理的座標）および／またはエネルギーの任意の適切な関数を含むことができ、バイアスがかけられると、検討されているタンパク質に全体的不安定化の影響を与え、それによりネイティブ構造の損失を導入することができる。全体的な集団座標の非限定的な例は、先に記載した。

最新構造モデル（複数可）３２（コンホメーション（複数可）３２とも称される）は、ループ２５の１つまたは複数の反復の後、検討されているタンパク質のコンピュータ表示の変換構造（複数可）を参照し得る。幾つかの実施形態において、新しいコンホメーション３２は、ループ２５の各反復の際に（例えば、各時間ステップで）作成され、その場合、図１に示されたコンホメーション（複数可）３２は、実際には複数のコンホメーション３２を含み得る。幾つかの実施形態において、ループ２５はまた、各反復の際に（例えば、各時間ステップで）集団座標アウトプット３４を作成する。任意のコンホメーション３２についての集団座標アウトプット３４は、各時間ステップで、現行の、そして／または過去の時間ステップの最新構造モデル３２に基づいて決定され得る。集団座標のアウトプット３４は、特定の時間ステップで、検討されているタンパク質の「実際の」集団座標を含み得る（外部から適用される「目的」集団座標とは対照的に）。幾つかの実施形態において、任意の時間ステップの集団座標のアウトプット３４または対応するコンホメーション３２は、コンホメーション３２のために存在するネイティブ構造の度合い、またはコンホメーション３２のために存在するネイティブ構造の度合い欠落（例えば、アンフォールディング）の関数および／または他の指標と相関するパラメータを含み得る。幾つかの実施形態において、該集団座標アウトプット３４は、スカラーである。例えば、該集団座標アウトプット３４は、［０，１］の範囲内であり得、そのため全体にネイティブの構造（例えば、ブロック２０内のＰＤＢからネイティブ構造モデル２２として得られた構造）は、１という全体的な座標アウトプット３４を有し得るが、全体的にアンフォールディングしたランダムコイル構造では、集団座標アウトプット３４は、０または０付近の値を有し得る。

方法１０およびループ２５で用いられる、またはその他の本明細書に記載された集団座標バイアシング法を用いて、アンフォールディングが起こる方法または場所（タンパク質構造内の）を指定せずに、候補タンパク質から特定レベルの全体的アンフォールディングを要求することができる（少なくとも許容できる閾値内で大まかに）。例えば、検討されているタンパク質にバイアスをかけるために用いられる場合に、タンパク質に任意の局所アンフォールディングを採用させて全体的な目的を実現しながら、タンパク質が全体的なアンフォールディングを実現して目的集団座標を追跡することのみを全体的な集団座標が要求するように、該集団座標は全体的な集団座標であり得る。タンパク質が仮に３０％アンフォールディングすること（したがって７０％フォールディングすること）を要求する場合、方法１０を用いて、３０％が部分的にディスオーダーになるように制限された平衡のタンパク質構造から結果を分析および獲得することができる。集団座標バイアスが、全体的である場合（例えば、３０％ディスオーダーの構造に向けて）、全体的な集団座標バイアスは、３０％のディスオーダーの制限を満たすようにタンパク質が局所的にディスオーダーになり得る場所または方法を指定しない。ディスオーダーの領域（複数可）は、タンパク質の内部エネルギー関数または力場（即ち、タンパク質のコンピュータベースのモデル表示に基づく）と、タンパク質が集団座標バイアスの制限を満たすという要件と、に基づいてタンパク質により採用され得る。以下により詳細に記載される通り、ディスオーダーになり易い（例えば、例示された実施形態において局所アンフォールディングの印５４から決定され得る通り）タンパク質の局在化領域または「ホットスポット」は、ブロック５０で分析されて、方法１０の候補エピトープ予測５２を提供し得る。これらの方法１０の候補エピトープ５２はその後、治療薬が設計され得る抗原ターゲットとして作用し得る。

方法１０に基づく候補エピトープ予測５２は、ループ２５シミュレーションで用いられるインプット力場２４およびコンピュータベースのモデル表示２２と同様に正確になり得る。上述の通り、現在、分散コンピューティングまたはカスタムスーパーコンピュータは、これらの力場を用いてタンパク質を正確にフォールディングすることができ、方法１０へのブロック２０のインプットとして用いられる力場モデル２４およびコンピュータベースのモデル表示２２の正確さを裏づけている。

インプットコンピュータベース構造モデル２２（例えば、ブロック２０でＰＤＢから得られるような）は、タンパク質の全ての原子についての一組の三次元座標を含み得る。インプットコンピュータベース構造モデル２２が、ネイティブ構造モデルである場合、それは、一組のネイティブコンタクト（本明細書では初期コンタクトとも称される）を定義する。一組の初期コンタクトは、互いの閾値距離（例えば、４．８Åまたは幾つかの他の適切な距離）内にある核を有するネイティブ構造モデル２２内の重い原子（水素以外）の全て（または一組）の対を含むように定義され得る。１００程度のアミノ酸長の一次配列を有するタンパク質の典型的なＰＤＢネイティブ構造２２は、典型的には約２０００またはその前後の初期コンタクトを有し得る。幾つかの実施形態において、コンタクトの数は、方法１０で用いられる全体的な集団座標を表し得る。そのような実施形態において、初期コンタクトの数は、検討されている（シミュレーションループ２５の任意の反復より前の）タンパク質の実際の集団座標の初期値を表し得る。

幾つかの実施形態において、インプットタンパク質構造２２は、ループ２５において厳密にネイティブの構造を用いるのではなく、任意選択的な平衡化工程２３（図１に破線で示される）を用いて平衡化され得る。平衡化工程２３は、当業者に周知の典型的な熱力学変数により特徴づけられる外部環境において、検討されているタンパク質を平衡化させるシミュレーションを含み得る。そのような熱力学的変数としては、一定の粒子数、一定圧力、および一定温度などを挙げることができるが、これらに限定されない。追加または代わりとして、平衡化工程２３は、一定の粒子数、一定のシステム体積、および一定温度などを実現し得る。タンパク質が、シミュレーションループ２５を開始する前にブロック２３で平衡化される場合、平衡化された構造（即ち、平衡化された構造のコンピュータ表示）を用いて（インプットしたタンパク質構造２２または真のネイティブ構造の追加または代わりとして）、検討されているタンパク質について、そしてシミュレーションループ２５の最初の反復へのインプットについて、最初のコンタクトを決定することができる。典型的には、幾つかの弱安定性のコンタクトは、ブロック２３の平衡化工程の間に単に熱揺らぎにより破壊され得るため、平衡化されたタンパク質は、わずかに少数の初期コンタクト（ＰＤＢネイティブ構造と比較して）を有し得る。幾つかの実施形態において、ブロック２３の平衡化工程は、用いられない。幾つかの実施形態において、ブロック２０で得られたインプット構造モデル２２は、既に平衡化されている。文脈で他に示されない限り、本明細書に記載されたネイティブ構造の参照は、平衡化された構造を含むと見なされ得る。構造が、平衡化されていれば、複数の時間ステップ全体で適切に平均をとり（例えば、熱平衡においてタンパク質に関係する確率論的集団）、許容できるコンホメーション空間内に確率論的変動を収容することにより、方法１０の残りの部分で用いられるネイティブ構造２２を、ブロック２０で得ることができる。文脈で他に示されない限り、平衡化されたタンパク質のネイティブ構造の参照は、この平均ネイティブ構造を参照し得る。

幾つかの実施形態において、多重鎖（例えば、凝集構造）を含むタンパク質の場合、方法１０（図１）は、初期コンタクトの数の決定および／または集団座標アウトプット３４の決定（即ち、シミュレーションループ２５の各反復内の集団座標の実際の値）において鎖間および鎖内コンタクトの両方を含み得る。

幾つかの実施形態において、方法１０は、ループ２５のシミュレーションの際にタンパク質を強制的にアンフォールディングさせるのに用いられる集団座標のバイアスとして、コンタクト組（またはそのコンタクト組の標示）を用いる。より具体的には幾つかの実施形態において、タンパク質にバイアスをかけるのに用いられる集団座標は、一組の初期コンタクトのうちのコンタクトの数を含む。集団座標が他の形態を有し得るという一般性を失わずに、集団座標としてコンタクトの組の表示を用いる模範的実施形態を、以下に記載する。ループ２５のシミュレーションのための最初のコンタクト組の標示は、ブロック２０で得られた検討されているタンパク質のインプット（例えば、ネイティブ）構造モデル２２から、そして／またはブロック２３の平衡化工程のアウトプットとして得られた検討されているタンパク質の平衡化バージョンから作成され得る。任意の後の時間ステップで最初のコンタクト組（および対応する集団座標アウトプット３４または集団座標の実際の値）のうちのコンタクト数の標示は、類似の手法で最新構造モデル３２から決定され得る。検討されているタンパク質構造の各重い原子対（ｉｊにより表示）の場合、方法１０は、ネイティブコンタクト関数Ｑ_ｉｊ（ｒ）の使用を含み得る。幾つかの実施形態において、該コンタクト関数Ｑ_ｉｊ（ｒ）は、原子対ｉｊと、該対ｉｊの原子間の距離ｒ_ｉｊの関数を含み得る。１つの特定の実施形態において、該コンタクト関数Ｑ_ｉｊ（ｒ）は、式：

（式中、ｒ_ｉｊは、検討されているタンパク質中の原子ｉとｊとの核間距離である）を有する。方程式（１）の他のパラメータ：ｒ_０、ｎおよびｍは、適宜選択された定数であり得る。幾つかの実施形態において、ｍ＞ｎである。１つの特定の実施形態において、ｒ_０＝４．８Å（オングストローム）であり、ｎ＝６およびｍ＝１２である。図２は、模範的定数のための距離ｒに対する方程式（１）のコンタクト関数Ｑ_ｉｊ（ｒ）のプロットを示す。以下により詳細に説明される通り、コンタクト関数Ｑ_ｉｊ（ｒ）の滑らかな形態は、ポテンシャル関数Ｖが簡便に力に転換されて、順次、力が分子動力学エンジンにより用いられるように、ポテンシャル関数Ｖを公式化するために用い得る集団座標Ｑを可能にする。Ｑ_ｉｊ（ｒ）は通常、１未満であるため（ｒが０に近づくにつれて１に漸近的に近づく）、総和Ｑ＝ΣＱ_ｉｊ（検討されているタンパク質構造内の各原子対での総和）はほとんど常にネイティブ構造内の合計コンタクト数より小さい。コンタクト組を定義するのに用いられる構造モデルは、初期構造と称され得、この構造内のコンタクト全体の総和は、

と称され得る。熱揺らぎまたはバイアス力のいずれかにより、この初期構造から逸脱する状態は一般に、１未満の初期コンタクトの割合を有する。実際に、全ての原子対ｉｊについてＱ_ｉｊを計算する必要がない場合があり、例えば閾値工程を利用して、かなり離れた幾つかの原子対ｉｊでＱ_ｉｊ＝０を設定することができる。先に議論された通り、幾つかの実施形態における集団座標は、タンパク質内の全原子ではなく重い原子および／または特定の重い原子に基づくことができる。例えば集団座標は、タンパク質内の全炭素原子またはタンパク質内の全α炭素原子に基づくことができる。

図２に示された方程式（１）のものと類似の関数形態および／または関数特性を有する多くの関数が存在する。方法１０は、任意のそのような関数（例えば、ｒが零から∞になると関数が１から０になり、ｒ_０の特徴的長さスケールを有する）をコンタクト関数Ｑ_ｉｊ（ｒ）として使用し得る。ｒ_０、ｎおよびｍ（例えば、方程式（１）における）のパラメータは、タンパク質内の物理的な水素結合相互作用のおおよその範囲で連続関数を特徴づけるように選択され得る。

幾つかの実施形態は、以下により詳細に説明される通り、ループ２５のシミュレーションの際にバイアシングポテンシャルをＱ_ｉｊの関数として適用して、そのようなポテンシャルを個々の原子位置での力（例えば、ポテンシャルの導関数）として実装することが望ましくなり得るため、コンタクトに重みを与える（ｗｅｉｇｈｔｃｏｎｔａｃｔｓ）連続コンタクト関数（例えば、方程式（１）のコンタクト関数）（例えば、ヘビサイドまたは離散ステップ関数ではない）を使用し得る。したがって幾つかの実施形態において、Ｑ_ｉｊが確定された導関数を含むｒの識別可能な関数であることが、望ましい。幾つかの実施形態において、ヘビサイドステップ関数またはステップ関数での多段階変動などの離散関数を用いて、ネイティブコンタクトを記載することができる。そのような公式は、一般に原子間相互作用に段階的なポテンシャル関数を用いる離散分子動力学（ＤＭＤ）シミュレーションプロトコルに従い得る。

重い原子（非水素原子）間のペアワイズ距離の組｛ｒ_ｉｊ｝により特徴づけられる任意の構造の実際の集団座標Ｑ（例えば、方法１０の集団座標アウトプット３４）は、その場合、方程式：

（方程式（２）において、Ｑ_ｉｊは、方程式（１）に示されており、総和

は、インプット（例えば、ネイティブ）構造モデル２２内の、またはネイティブ構造２２自体からの原子対全体についてである）により特徴づけられ得る。上記方程式中の「ｉｎｉｔｉａｌ」は、該総和が初期ネイティブ構造（典型的には適切にフォールディングした構造またはフィブリル構造のＰＤＢモデル）に存在するそれらのコンタクトのみのものであることを示している。上記の方程式（２）に記載された実施形態において、方程式（２）の分母の量は、インプット（例えば、ネイティブ）構造モデル２２または平衡化された構造におけるＱ_ｉｊ値の熱平均であり、方程式（２）の分子の量は、任意構造内（例えば、ブロック２５のループの各反復で得られた最新構造モデル３２の）のＱ_ｉｊの総和である。分母の括弧〈・・・〉は、ネイティブＰＤＢ構造から開始して分子動力学シミュレーションを実施した場合の、ネイティブ状態、即ち熱が充満した構造（ｔｈｅｒｍａｌｌｙ−ｏｃｃｕｐｉｅｄｓｔｒｕｃｔｕｒｅｓ）の平衡（熱）平均を示す。方程式（２）の量Ｑは、典型的には０〜１の間の数字である。

他の計量（例えば、方程式（２）以外の計量および／またはコンタクト以外の基準に基づく計量）は、追加的または代替的にネイティブ構造からのディスオーダーの度合いを特徴づけることが可能であり、結果的に幾つかの実施形態において、集団座標（例えば、全体的な集団座標）として用いることができる。これらの計量は、例えばネイティブ構造モデル２２に対する最新構造モデル３２の根平均二乗偏差（ＲＭＳＤ）、ネイティブ構造２２の回転半径に対する最新構造モデル３２の回転半径、ネイティブ構造２２のバックボーン水素結合のうちの最新構造モデル３２のバックボーン水素結合の数、ネイティブ構造２２のＳＡＳＡに対する最新構造モデル３２の総溶媒露出表面積（ＳＡＳＡ）、Ｃ．Ｊ．ＣａｍａｃｈｏａｎｄＤ．Ｔｈｉｒｕｍａｌａｉ．Ｋｉｎｅｔｉｃｓａｎｄｔｈｅｒｍｏｄｙｎａｍｉｃｓｏｆｆｏｌｄｉｎｇｉｎｍｏｄｅｌｐｒｏｔｅｉｎｓ．Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ，９０（１３）：６３６９−６３７２，１Ｊｕｌｙ１９９３（参照により本明細書に組み入れられる）により記載された構造オーバーラップ関数、Ａ．Ｄａｓ，Ｂ．Ｋ．Ｓｉｎ，Ａ．Ｒ．Ｍｏｈａｚａｂ，ａｎｄＳ．Ｓ．Ｐｌｏｔｋｉｎ，Ｕｎｆｏｌｄｅｄｐｒｏｔｅｉｎｅｎｓｅｍｂｌｅｓ，ｆｏｌｄｉｎｇｔｒａｊｅｃｔｏｒｉｅｓ，ａｎｄｒｅｆｏｌｄｉｎｇｒａｔｅｐｒｅｄｉｃｔｉｏｎ．Ｊ．Ｃｈｅｍ．Ｐｈｙｓ．，１３９（１２）：１２１９２５，２０１３（参照により本明細書に組み入れられる）により記載されたネイティブ構造からの一般化されたユークリッド距離、これらのパラメータの１つまたは複数の関数などを含み得る。幾つかの実施形態において、バイアシングシミュレーション（例えば、シミュレーションループ２５）内で用いられるこれらの集団座標のそれぞれは、スカラーＱとして表され得る。簡潔にするために、この記載は、単一の集団座標の使用を参照している。しかし文脈で他に示されない限り、集団座標の参照は、複数の集団座標の組み合わせの可能性を含むものと理解されなければならない。

幾つかの実施形態において、方法１０のループ２５は、式：

（式中、Ｑ_ｃ（ｔ）は、ユーザーに指定され得、集団座標／シミュレーションパラメータ２６の一部であり得る、目的集団座標であり、Ｑは、任意の所与の時間ステップで最新構造モデルの実際の集団座標である）の時間依存性ポテンシャルとして一連の時間ステップでバイアスポテンシャルをアサートすることを含む。方程式（３）のポテンシャル関数が、ばねのポテンシャルエネルギー関数の外観を有し、パラメータｋが、ばね定数と類似していることが、観察され得る。ｋ＞０の場合、方程式（３）のポテンシャル関数が増加し、実際の集団座標Ｑが、目的集団座標Ｑ_ｃ（ｔ）と異なることも、観察され得る。ループ２５のシミュレーションは、実際の集団座標Ｑが目的集団座標Ｑ_ｃ（ｔ）を確実に追跡するようにポテンシャル関数を最小化すること（例えば、方程式（３）を最小化すること）を含み得る。幾つかの実施形態において、実際の集団座標Ｑと目的集団座標Ｑ_ｃ（ｔ）の間の差異にペナルティを課す他の式を有するポテンシャル関数が、方程式（３）に加えて、またはその代わりに用いられ得る。類似の特徴を有する方程式（３）および他のポテンシャル関数が、本明細書に記載された集団座標のいずれかに用いられ得る。

幾つかの実施形態において、目的集団座標Ｑ_ｃ（ｔ）は、インプット（例えば、ネイティブ）構造のためのＱ（典型的には１または１の近似値であり得る）の値で開始し、経時的に減少する、時間の関数を含み得る。幾つかの実施形態において、Ｑ_ｃ（ｔ）は、集団座標／シミュレーションパラメータ（複数可）２６により指定され得る速度で幾つかの適切なレベルまで直線状に減少し得る。一般に目的集団座標Ｑ_ｃ（ｔ）の特徴は、集団座標／シミュレーションパラメータ（複数可）２６に従って指定または他の方法で構成され得る。時間の関数としての目的集団座標Ｑ_ｃ（ｔ）、および時間の関数としての検討されているタンパク質の実際の集団座標Ｑ（例えば、各時間ステップでの集団座標アウトプット３４）の模範的アンフォールディング軌道を、図３に示す。より具体的には図３は、Ａβアミロイドの典型的なバイアシングシミュレーションのための、時間に対する、例としての実際の集団座標Ｑ（ｔ）（例えば、方法１０を用いてシミュレートされた集団座標アウトプット３４）および滑らかな目的集団座標曲線（各時間ステップでのアウトプット集団座標３４により提供され得るＱ_ｃ（ｔ）１０２）のプロットを示す。

方程式（３）のポテンシャルＶ（Ｑ，ｔ）は、このポテンシャルを検討されているタンパク質の総エネルギーに付加することにより、実装され得る（ループ２５のブロック３０において）。該タンパク質は、自由エネルギーを最小化しようとするが、それを実行するのに時間がかかり、これが、図３に示されたタンパク質の目的集団座標Ｑ_ｃ（ｔ）１０２と実際の集団座標Ｑ（ｔ）３４の間のラグの一理由である。図３で示されたラグの別の理由は、検討されているタンパク質がネイティブ構造から摂動を加えられて、ポテンシャルＶの存在下で目的集団座標Ｑ_ｃとわずかに異なるタンパク質の実際の集団座標Ｑ３４の新しい平衡値の差が生じた場合に存在する零でない残りの力が存在するためである。

目的集団座標Ｑ_ｃ１０２の減少速度が、過度に急速であれば、検討されているタンパク質を特徴づける実際の集団座標Ｑ３４の値は、目的集団座標Ｑ_ｃ１０２の値から実質的に逸脱し得、Ｖ（Ｑ，ｔ）によるタンパク質の摂動は、高度に非平衡のアンフォールディング過程を導入する。幾つかの実施形態は、タンパク質がアンフォールディングすると、準平衡（断熱的）過程を維持するように試みる。目的集団座標Ｑ_ｃ（ｔ）１０２の減少速度は、幾つかの実施形態において、実際の集団座標Ｑ３４が目的のＱ_ｃ１０２と大きく異ならない条件により決定され得る。そのような緩やかな（断熱的）摂動は、タンパク質に内在する安定化力よりもかなり大きくなり得る摂動力への応答ではなく、主に検討されているタンパク質内の相互作用により支配されるアンフォールディング過程を生じる。図３の実施例において、目的集団座標Ｑ_ｃ１０２は、典型的には０．４〜０．８の範囲内になり得る最終目的値１０４まで、一連の時間ステップで減少する。幾つかの実施形態において、この最終目的のＱ_ｃ値１０４は、０．５〜０．７の範囲内である。

方程式（３）の定数ｋの値を設定する上で、幾つかの自由が存在する。幾つかの実施形態において、この値ｋは、目的集団座標Ｑ_ｃが変動する速度に応じて、２×１０^４〜１×１０^５ｋＪ／ｍｏｌの範囲内で設定され得る。幾つかの実施形態において、この値ｋは、４×１０^４〜８×１０^４ｋＪ／ｍｏｌの範囲内で設定され得る。１つの模範的実施形態において、ｋは、ｋ＝６×１０^４ｋＪ／ｍｏｌであるように設定され、Ｑ_ｃが、１５ナノ秒あたり約０．４の速度で変動した場合に、目的集団座標Ｑ_ｃ１０２から実際の集団座標Ｑ３４の小さな偏差を提供する（およそ０．０２のＱ−Ｑ_ｃ値を生じる）（図３参照）。バイアシング速度が緩やかである程（即ち、目的集団座標１００の変動速度が緩やかである程）、許容できるｋ値が小さくなる。システムが目的Ｑ_ｃ（ｔ）から逸脱する場合に適切なエネルギーコストを適用することにより、ｋ値は、およそ０．０２のＱ−Ｑ_ｃなど、偏差Ｑ−Ｑ_ｃに小さな値を提供するように選択され得る。定数ｋが、過度に小さい場合、Ｑは、Ｑ_ｃから過度に大きく逸脱する傾向があり、他方でｋが過度に大きい場合、方程式（３）のポテンシャルＶ（Ｑ，ｔ）の最小値からの小さな偏差でも大きな人工的力が導入されるため、該システムはエネルギー的に不安定になる。

検討されている所与のタンパク質では、幾つかの実施形態は、各バイアシングシミュレーションを独立させて、方法１０のシミュレーションを数回（または少なくともループ２５を数回）実施することを含む。これは、別の独立したランを実施するか否かに関する質問を含むブロック４５により図１に例示される。ブロック４５の質問が、肯定されれば、方法１０は、シミュレーションループ２５を再度実施するようにループバックする。例示された実施形態において、方法１０は、ブロック２０にループバックするが、これは必ずしも必須ではない。幾つかの実施形態において、方法１００は、他の関数ブロックにループバックし得る。以下により詳細に記載される通り、独立したバイアシングシミュレーション（ランとも称され得る）の数は、任意の所与のシミュレーションにおいて露出される（即ち、アンフォールディングする）と観察されるポリマー領域が、確実に複数のシミュレーションで実際に一貫して露出され、特定の確率論的分子動力学シミュレーションにおけるまれな無作為変動の結果にならないように、支援し得る。したがって幾つかの実施形態は、独立したシミュレーションの数での少なくとも１つの有意な割合ｆが、バイアシングにより領域のアンフォールディングの１つまたは複数の印（例えば、露出の増加）を示した、タンパク質の領域（潜在的な候補エピトープ予測５２である）を検討する。

幾つかの実施形態において、割合ｆは、０．８よりも大きくなるように選択される。幾つかの実施形態において、割合ｆは、０．８５よりも大きくなるように選択される。１つの特定例の実施形態において、割合ｆは、エピトープを示す８のシミュレーションのうち７、エピトープを示す９のシミュレーションのうち８、またはエピトープを示す１０のシミュレーションのうち９などのいずれかに対応するｆ＝０．８７になるように選択される。独立したシミュレーションの数は、典型的には８以上になり得るが、これは必須ではない。

検討されているタンパク質が、以下に記載されるＡβ線維などの凝集したフィブリル構造を含む場合、所与のシミュレーションにおいて、領域がモノマー（ペプチド鎖のいずれか）のいずれかにおいてアンフォールディング（例えば、露出されている）の１つまたは複数の印を示し、そのようなエピトープが、シミュレーションの割合ｇにおいて確実に露出されることが見出されるならば、該領域は、エピトープであると見なされ得る。幾つかの実施形態において、割合ｇは、０．８よりも大きくなるように選択される。幾つかの実施形態において、割合ｇは、０．８５よりも大きくなるように選択される。１つの特定例の実施形態において、割合ｇは、ｇ＝０．８７になるように選択される。

ブロック４５の質問が、否定された場合、方法１０は、ブロック５０に進行する。ブロック５０は、候補エピトープを同定しようとして、ブロック２５のシミュレーション（例えば、シミュレーショループ２５による各反復またはラン）のシミュレーション結果を分析することを含む。図１の実施形態において、ブロック５０は、ブロック２５のシミュレーションループの実施されているアウトプットとして示される。これは、必須ではない。幾つかの実施形態において、ブロック５０の幾つか、または全ては、シミュレーショループ２５の中で実施され得る。

図４Ａおよび４Ｂは、方法１００に供され得る模範的な凝集構造についての模範的なシミュレーション結果のデータを示す。特に図４Ａは、３回対称Ａβ構造２Ｍ４Ｊの鎖Ｂの残基指数に対する初期Ｑが０．８となる目的集団座標Ｑ_ｃにバイアスをかけた時の溶媒露出表面積（ＳＡＳＡ）の変動を示し、図４Ｂは、各鎖の所与の区分（例えば、残基２３〜２８）が独立して検討され、各シミュレーションのランが、独立して検討されるような模範的凝集構造への図４の方法の適用を略図で示す。図４Ｂのデータは、Ａβ４０からのシミュレーションデータであり、純粋に例示的明瞭さのために３つのペプチド鎖および３つのシミュレーションのみが示されている。図４Ａ、４Ｂ、５Ａ、５Ｂおよび５Ｃで示される方法の特定の例において、ブロック５０の候補エピトープ選択工程で用いられるデータが、シミュレーショループ２５の各ランについて、集団座標バイアスが最終レベルに達した後の適切な時間に得られて、検討されているシステムを平衡にすることができる。方程式（１）〜（３）により記載された集団座標バイアスの特定の例において、ブロック５０の候補エピトープ選択工程で用いられるデータは、Ｑ_ｃが最終レベルに達した後の適切な時間（例えば、２０〜２００ｎｓ程度）に得ることができる（図３参照）。

図４Ａは、１０の独立したシミュレーションで、初期構造の８０％にバイアスをかけた後、３回対称Ａβ構造２Ｍ４Ｊの１つのペプチド鎖について残基指数の関数として各残基の溶媒露出表面積（ＳＡＳＡ）の変動の例示的なプロットを示す。各図４Ａの軌道は、１回のシミュレーション（またはラン）からの結果を示す。図４ＡプロットのＸ軸は、例示されたペプチド鎖のためのアミノ酸（または残基）指数である。ＳＡＳＡは、Ｈ_２Ｏに接近し得る表面積を表す。図４ＡプロットのＹ軸は、独立したシミュレーション（検討されているタンパク質の初期構造２２のものと比較）のそれぞれの結論での、最新構造３２（図１）でのＳＡＳＡの変動（ΔＳＡＳＡ）である。正のΔＳＡＳＡは、関連の残基指数の領域内でのアンフォールディングを示すと見なされ得る。このΔＳＡＳＡパラメータは、少なくとも一部がシミュレーションループ２５で決定された最新構造モデル３２に、そして／または初期構造モデル２２（図１参照）への最新構造モデル３２の比較に、基づいてブロック５０で作成され得、局所ベースで（例えば、残基ごとに）決定され得る、局所アンフォールディングの印５４の非限定的例である。幾つかの実施形態において、追加的または代替的な局所アンフォールディングの印５４が、局所的に（例えば、残基ベースで）ブロック５０で決定および／または分析されて、候補エピトープ５２の予測で支援することができる。そのような局所アンフォールディングの印５４は、シミュレーションループ２５で決定された最新構造モデル３２および／または初期構造モデル２２への最新構造モデル３２の比較に基づき得る。非限定的例としては、そのような追加的または代替的な局所アンフォールディングの印５４としては、各残基の損失したコンタクトの数（最新構造モデル３２を初期構造モデル２２に比較した場合）、所与のコンホメーション集団においてどれ程の運動を残基が受けるかを表す、各残基のネイティブ構造モデル２２に対する最新構造モデル３２の根平均二乗揺らぎ（ＲＭＳＦ）、各残基の損失したバックボーン水素結合の数（最新構造モデル３２を初期構造モデル２２に比較した場合）、各残基の相互作用のポテンシャルエネルギー（最新構造モデル３２を初期構造モデル２２に比較した場合）、上記パラメータの組み合わせなどを挙げることができる。

初期構造の８０％の集団座標バイアシングでの図４Ａの例では（例えば、Ｑ_ｃ＝０．８Ｑ_{ｉｎｉｔｉａｌ}）、確実に増加したＳＡＳＡと共に出現する２つの領域：残基１４〜１７および残基２５〜３０が認められる。図４Ａに示される実施形態において、側鎖表面露出における変動のみが示され、それにより全てのグリシン残基が、必ず零というＳＡＳＡ変動を有するが、予測にペナルティを課さない。他の実施形態は、グリシン残基のバックボーンのＳＡＳＡ変動をカウントする。方法１００（図４）の例示的な実施形態を含む幾つかの実施形態において、ブロック５０の分析は、１０の独立したランの適切な閾値割合ｆが露出の増加（例えば、ΔＳＡＳＡ＞０）を示す領域を検索する（このプロットにおいて、それらの領域は、残基１４〜１７および２５〜３０である）。

図４Ｂは、バイアシングシミュレーションが３回反復される（図４Ｂの行に示されたラン１、ラン２およびラン３）３つの同一ペプチド鎖（図４Ｂの列に示された鎖Ａ、鎖Ｂおよび鎖Ｃ；各ペプチド鎖（本明細書では以後、「鎖」と称される）は、例えばフィブリル内のコピーＡβペプチドであり得る）の例としての凝集構造（本明細書ではＰＤＢ２Ｍ４Ｊから得られる）例示的結果を示す。図４Ｂの各列は、同じペプチド鎖の異なるシミュレーションランを示すが、各行は、同じシミュレーションランの異なるペプチド鎖を示す。図４Ｂのプロットの下の３×３の配列は、残基２３〜２８からなる残基の特定の群での「ズームイン」である。残基の全範囲を、シミュレーションラン１での図４Ｂの最上行に示される。図４Ｂの各プロットのＸ軸は、残基指数（例えば、アミノ酸指数）を含む。図４Ｂの各プロットのＹ軸は、各残基指数に対応する溶媒露出表面積の変動（ΔＳＡＳＡ）を表す（検討されている鎖の初期構造のものとの比較）。図４Ｂの水平軸を横切る３つの鎖それぞれについては、最上のプロットは、最初の独立したシミュレーション（「ラン１」）の１〜４０の残基指数の範囲でのΔＳＡＳＡを示し、最上部からの二番目のプロットは、ラン１の指数２３〜２８についてのΔＳＡＳＡの詳細を示し、最上部からの三番目のプロットは、二番目のシミュレーション（「ラン２」）の指数２３〜２８についてのΔＳＡＳＡの詳細を示し、一番下のプロットは、三番目のシミュレーション（「ラン３」）の指数２３〜２８についてのΔＳＡＳＡの詳細を示す。

所与の鎖の区分（本明細書では残基２３〜２８）では、各鎖（即ち、図４Ｂの各列）を、独立して分析する。例示的実施形態において、各ラン（即ち、図４Ｂの行２、３および４のそれぞれ）で、該当するペプチド配列の残基全てがバイアシングにより正のΔＳＡＳＡを有するような鎖が少なくとも１つ存在する場合には、エピトープが同定され得る。図４Ｂの例示において、所与のランについてのこの基準を満たす鎖区分を、太く示しており（ラン１の行の中央のパネル、ラン２の行の左パネル、ならびにラン３の行の中央および右パネル）、基準を満たさないものは、細い線である。図４Ｂのデータは、ＰＤＢ構造２Ｍ４Ｊから開始したＡβ−４０のシミュレーションデータであり、明瞭に示すために３つの鎖および３つのシミュレーションのみを示している。候補エピトープは、各シミュレーションランで、またはシミュレーションランの数の適切な閾値割合ｆ以上で、少なくとも１つの鎖において露出されるため、図４Ｂの実施例は、エピトープの群が潜在的な候補エピトープとして、またはより一般に、より大きな潜在的候補エピトープの一部として選択される方法を示している。

先に議論された通り、所与のシミュレーションのΔＳＡＳＡは、本明細書に記載されたシミュレーション法に従ってエピトープを同定するのに用いられ得る唯一の局所アンフォールディングの印５４（図１）を表す。幾つかの実施形態において、エピトープを同定するのに用いられ得る他の追加的または代替的な局所アンフォールディングの印５４としては、各残基の損失したコンタクトの数（最新構造モデル３２を初期構造モデル２２に比較した場合）、所与のコンホメーション集団においてどれ程の運動を残基が受けるかを表す、各残基のネイティブ構造モデル２２に対する最新構造モデル３２の根平均二乗揺らぎ（ＲＭＳＦ）、各残基の損失したバックボーン水素結合の数（最新構造モデル３２を初期構造モデル２２に比較した場合）、各残基の相互作用のポテンシャルエネルギー（最新構造モデル３２を初期構造モデル２２に比較した場合）、上記パラメータの組み合わせなどが挙げられるが、これらに限定されない。そのような局所アンフォールディングの印５４は、シミュレーションループ２５において決定された最新構造モデル３２および／または初期構造モデル２２への最新構造モデル３２の比較に基づき得る。確率論的熱揺らぎへの感受性を低下させるために、局所アンフォールディングの印５４を、目的集団座標が最後の値に達した後の複数の時間ステップで平均することができる。局所アンフォールディングの印５４のそのような平均化は、目的集団座標が最後の値に達した後に行われるため、局所アンフォールディングの印５４のそのような平均化は、平衡平均化（ｅｑｕｉｌｉｂｒｉｕｍａｖｅｒａｇｉｎｇ）と称され得る。文脈で他に示されない限り、本明細書での局所アンフォールディングの印５４の参照は、局所アンフォールディングの印５４が平衡平均化される可能性を含むものと理解されなければならない。

上述の通り、Ａβペプチドは、複数の異なる多形で凝集する傾向がある。多形は、フィブリル形態およびオリゴマー構造集団の両方に存在する。

本明細書に記載された複数の実施例結果は、それぞれが独自の形態、つまり９のＡβ−４０ペプチド（またはモノマー）からなる３回対称構造（ＰＤＢエントリー２Ｍ４Ｊ）、１２のＡβ−４０モノマーからなる２回対称構造（ＰＤＢエントリー２ＬＭＮ）、１２のＡβ−４２モノマーからなる一本鎖の平行なインレジスタ（ｉｎ−ｒｅｇｉｓｔｅｒ）構造（ＰＤＢエントリー２ＭＸＵ；ディスオーダーＮ−末端残基１〜１０がこの構造モデルに付加されている）、および１８のＡβ−４０モノマーからなる３回対称構造（ＰＤＢエントリー２ＬＭＰ；ディスオーダーＮ−末端残基１〜８がこの構造モデルに付加されている）、を有する複数のＡβ線維株（Ａβ ｆｉｂｒｉｌｓｔｒａｉｎｓ）の結果を表す。２つのさらなるコンピュータ計算アッセイ（Ｎ−末端にディスオーダー残基１〜８（これらはＰＤＢ構造から失われている）を付加することによる構造２ＬＭＮでの１つと、フィブリルに沿って最上および最下のモノマーを構造化されたコンホメーションで残存するように制限して、中央の１０のモノマーをディスオーダーさせることによる構造２ＭＸＵでの１つ）を実施した。シミュレーションは、各初期構造について実施した（方法１０のループ２５、ならびに参照により本明細書に組み入れられる、Ｋ．Ｖａｎｏｍｍｅｓｌａｅｇｈｅ，Ｅ．Ｈａｔｃｈｅｒ，Ｃ．Ａｃｈａｒｙａ，Ｓ．Ｋｕｎｄｕ，Ｓ．Ｚｈｏｎｇ，Ｊ．Ｓｈｉｍ，Ｅ．Ｄａｒｉａｎ，Ｏ．Ｇｕｖｅｎｃｈ，Ｐ．Ｌｏｐｅｓ，Ｉ．Ｖｏｒｏｂｙｏｖ，ａｎｄＡ．Ｄ．Ｍａｃｋｅｒｅｌｌ．Ｃｈａｒｍｍｇｅｎｅｒａｌｆｏｒｃｅｆｉｅｌｄ：Ａｆｏｒｃｅｆｉｅｌｄｆｏｒｄｒｕｇ−ｌｉｋｅｍｏｌｅｃｕｌｅｓｃｏｍｐａｔｉｂｌｅｗｉｔｈｔｈｅｃｈａｒｍｍａｌｌ−ａｔｏｍａｄｄｉｔｉｖｅｂｉｏｌｏｇｉｃａｌｆｏｒｃｅｆｉｅｌｄｓ．ＪｏｕｒｎａｌｏｆＣｏｍｐｕｔａｔｉｏｎａｌＣｈｅｍｉｓｔｒｙ，３１（４）：６７１−６９０，２０１０；およびＰ．Ｂｊｅｌｋｍａｒ，Ｐ．Ｌａｒｓｓｏｎ，Ｍ．Ａ．Ｃｕｅｎｄｅｔ，Ｂ．Ｈｅｓｓ，ａｎｄＥ．Ｌｉｎｄａｈｌ．ＩｍｐｌｅｍｅｎｔａｔｉｏｎｏｆｔｈｅＣＨＡＲＭＭｆｏｒｃｅｆｉｅｌｄｉｎＧＲＯＭＡＣＳ：ａｎａｌｙｓｉｓｏｆｐｒｏｔｅｉｎｓｔａｂｉｌｉｔｙｅｆｆｅｃｔｓｆｒｏｍｃｏｒｒｅｌａｔｉｏｎｍａｐｓ，ｖｉｒｔｕａｌｉｎｔｅｒａｃｔｉｏｎｓｉｔｅｓ，ａｎｄｗａｔｅｒｍｏｄｅｌｓ．Ｊ．Ｃｈｅｍ．Ｔｈｅｏ．Ｃｏｍｐ．，６：４５９−４６６，２０１０に記載されたＣＨＡＲＭＭ力場パラメータを、ＴＩＰ３Ｐ水と共に用いて）。シミュレーションには、０．１Ｍの濃度のＮａＣｌが含まれた。各システムは、５ｎｓで平衡化されて、その間にＱを測定して初期値Ｑ_ｃ（ｔ＝０）を提供した。

他に示されない限り、バイアシングポテンシャルの中心は、１５ｎｓの期間に本来の値の０．６に移動し、その間に最初に存在した構造の量を上記のとおり本来の値の約６０％まで系統的に減少させた。一組の初期エピトープ予測のために、本発明者らは、初期構造Ｑ（ｔ＝０）の約７１％に対応する構造、例えば初期集団座標の約０．７１に対応する集団座標Ｑを分析した。先に議論された通り、検討されているタンパク質は、典型的には約１００ｎｓの時間ウインドウのために初期構造の７１％を有するように制限した。

検討されている各タンパク質について、９または１０（または幾つかの他の適切な数）の独立したランを実施することができ、各独立したランは、分子動力学エンジンのサーモスタット乱数発生器のランダムシーディングを含み得る。９または１０（または幾つかの他の適切な数）の独立したランを実施することは、任意の予測されたエピトープが本物であり、レアまたはランダムな発生でないことの若干の保証を与える。先に議論された通り、幾つかの実施形態は、任意の鎖が全てのランの割合ｆ（例えば、ｆ＞０．８７）でエピトープを露出する場合に、該エピトープを潜在的な候補エピトープと同定することを含む。検討されているタンパク質の進化（ｅｖｏｌｕｔｉｏｎ）をバイアスおよびシミュレートした後（ブロック３０）、幾つかの実施形態は、最初の構造からバイアシング後の集団の構造までのＳＡＳＡ（または本明細書で議論されたアンフォールディングの他の適切な尺度）の変動を比較して、各残基がアンフォールディングした程度を確認することにより、結果を分析することを含む。ＳＡＳＡを用いる実施形態において、幾つかのそのような実施形態は、グリシン以外の各残基では側鎖表面積を使用することができ、グリシンの場合には幾つかの実施形態は、総残基表面積（グリシンではバックボーン表面積になる）を用いることができる。

タンパク質データバンク（ＰＤＢ）（ｈｔｔｐ：／／ｗｗｗ．ｒｃｓｂ．ｏｒｇ）および本発明者らが検査した経験的システムに含まれるＡβ構造間の１つの差異は、ＰＤＢ構造が鎖の残基全てを必ずしも含まないことであり、これは、幾つかの残基が経験的に決定されたシステムでディスオーダーされており、そのため信頼性のある座標がＰＤＢ構造の一部として預託され得ないためである。ＰＤＢＩＤ２ＬＭＮおよびＰＤＢＩＤ２ＬＭＰに対応する構造は、各モノマーについて残基９〜４０のみを含み、残基１〜８からなるＮ−末端領域を失っており、ＰＤＢ２ＭＸＵに対応する構造は、各モノマーについて残基１１〜４２のみを含み、Ｎ−末端残基１〜１０を失っている。ＰＤＢ２Ｍ４Ｊは、各モノマーについて全４０の残基を含む。Ｎ−末端領域を失ったＰＤＢ構造の場合、幾つかの実施形態は、ディスオーダーＮ−末端領域が明白にＰＤＢ構造内に付加されるシステムから最終的なエピトープ予測を作成することを含み得る。オーダータンパク質またはフィブリルの残り部分でのポリマーの立体非交差エントロピーにより、ディスオーダー末端領域を構造の残り部分につなぐためのポリマーエントロピーコストが存在するため、ディスオーダーＮ−末端テールの存在は潜在的に重要な影響になり得る。この理由から、具体的にはＮ−末端が存在しないモデルを用いた２ＬＭＮのＮ−末端領域についての予測は、幾らか過度に協調される可能性がある。

図５Ａ、５Ｂおよび５Ｃは、幾つかの実施形態において、シミュレーション結果を分析して、ブロック５０の一部として用いられ得るタンパク質内のエピトープを同定するための方法１００を略図で示している。図５Ａ、５Ｂおよび５Ｃは、検討されているタンパク質が複数のペプチド鎖を含む凝集構造である場合の、ブロック５０の一部として用いられ得る方法１００の特定の例を示している。

図５Ａは、図４Ｂに関連して記載された、先に議論された手順の一般化である方法１００の一部１０２を表している。方法１００の一部１０２は、簡潔にするために方法１０２と称され得る。図５Ａの方法１０２の手順は、各独立したシミュレーション（即ち、各ラン）で１回、そして各ランの中の各ペプチドで１回実施され得る。検討されているタンパク質が、一本鎖を含む場合に、方法１０２が、各独立したランで１回実施され得ることは、理解されよう。例示された実施形態において、方法１０２は、シミュレーションループ２５（図１）で決定された最新構造モデル３２から図４Ｂの下の９のプロットに示されたマトリックスのタイプまで進める方法を記載している。図４Ｂが残基の特定の群（図４Ｂの実施例では残基２３〜２８）ではΔＳＡＳＡプロットのマトリックスを示すこと、そして図４Ｂのマトリックスが、凝集構造における複数の独立したランおよび複数の鎖に及ぶことは、理解されよう。同様に、図５Ａに示された方法１０２は、残基の複数の群のうち各群のマトリックスの作成をもたらし得る。一般にこれらの群は、異なるサイズを有し得る（ウインドウサイズとも称され得る）。

方法１０２は、現行のランおよび現行の鎖における各残基のための局所アンフォールディングの印５４を決定することを含むブロック１０５で開始する。先に議論された通り、局所アンフォールディングの印は、ブロック２５のシミュレーションループで決定された最新構造モデル３２に基づいて決定され得る。図５Ａの実施形態の方法１０２の特定の例において、用いられる局所アンフォールディングの印は、一般性を失わずにΔＳＡＳＡである。そのため方法１０２は、ウインドウサイズパラメータを初期化することを含むブロック１１０に進行する。次の反復において、ブロック１１０は、ウインドウサイズパラメータを増進することを含み得る。ブロック１１０のウインドウサイズパラメータは、方法１０２の特定の反復において正のΔＳＡＳＡが存在するか否かを決定するために検討される群のサイズ（即ち、残基の数）を表す。図４Ｂの実施例の場合、検討されている残基は、６のウインドウサイズに対応する残基２３〜２８であった。以下により詳細に説明される通り、各ウインドウサイズは、図６に示されたファイアプロットマトリックスの行を表し得る。

方法１０２はその後、ブロック１２０に進行して、各群が現行のウインドウサイズと等しい複数の残基を有するような複数の群に、現行のペプチド鎖の残基指数を解析する。所与の鎖（所与の残基指数を有する）について、ブロック１１０のウインドウサイズが大きい程、ブロック１２０の群の数がより少なくなり、その逆もあてはまることは、理解されよう。その後、方法１０２は、群指数カウンタを初期化（最初の反復）または増進（続いての反復）するブロック１３０に進行する。群指数カウンタはまた、ウインドウ位置またはウインドウ位置指数とも称され得る。

その後、方法１０２は、現行の群が群の全ての残基でΔＳＡＳＡ＞０を有するか否かの質問を含むブロック１４０に進行する。ブロック１４０の質問が、肯定である場合、方法１０２は、ブロック１７０で終了する前に、ブロック１５０に進行して、正の結果を現行の群について記録する。幾つかの実施形態において、ブロック１５０は、現行の群に属する残基のΔＳＡＳＡ、および／または現行の群に属する残基のΔＳＡＳＡの累積合計を記録することを含み得るが、この情報は、ブロック１０５から入手できるため、これは必須ではない。ブロック１４０の質問が、否定であれば、方法１０２は、ブロック１７０で終了する前に、ブロック１６０に進行して、負の結果を現行の群について記録する。ブロック１７０は、現行の群が現行の鎖における最後の群であるか否かの質問を含む。現行の群が、最後の群でなければ、方法１０２は、ブロック１３０にループバックして、群指数を別の反復のために増進する。ブロック１７０の質問が、肯定であれば、方法１０２は、現行のウインドウサイズが検討されるべき最大のウインドウサイズであるか否かの質問を含むブロック１８０に進行する。幾つかの実施形態において、最大のウインドウサイズは、１２残基に設定されている。幾つかの実施形態において、この最大のウインドウサイズは、１０残基であり得る。現行のウインドウサイズが、最大のウインドウサイズでない場合、方法１０２は、ブロック１１０にループバックして、ウインドウサイズを別の反復のために増進する。

現行のウインドウサイズが、最大のウインドウサイズである場合、方法１０２は、完了して、以下により詳細に記載される図５Ｂの方法２０２に移行する。方法１０２の結論として、方法１００が、特定の鎖および特定のランについて、群に関するアンフォールディングを示す（例えば、特定の一実施形態の場合、群内の残基全てでΔＳＡＳＡ＞０）局所アンフォールディングの印５４を呈する様々な異なるサイズの複数の残基群を決定した。先に議論された通り、方法１０２は、検討されているタンパク質の各鎖について１回、そして検討されているタンパク質の各シミュレーションランについて１回実施して、様々なペプチド鎖および様々な独立したシミュレーションランで、様々な残基群に関する類似の情報を発生させることができる。各鎖および各独立したランについて方法１０２を実施した後、方法１０２が、複数の残基群それぞれについて（即ち、複数の鎖および複数のランに及ぶマトリックス）、そして群が局所アンフォールディングの印を呈するか否かを識別することができるように、図４Ｂに例示されたものと類似のデータのマトリックスを作成し得ることは、理解されよう。

各ランについて、そして各ペプチド鎖について、方法１０２の実行の結論として、方法１００は、図５Ｂに示された方法１００の部分２０２に進行し得る。方法１００の部分２０２は、簡潔さのために方法２０２と称され得る。先に議論された通り、幾つかの実施形態は、独立したシミュレーションの数での少なくとも１つの有意な割合ｆがバイアシングにより群のアンフォールディングの１つ以上の印（例えば、露出の増加）を示した、タンパク質の残基の群（潜在的な候補エピトープ予測５２である）を検討し得る。先に議論された通り、検討されているタンパク質が、凝集構造である場合、所与のシミュレーションにおいて、残基の群が、モノマーのいずれか（ペプチド鎖のいずれか）においてアンフォールディングの１つまたは複数の印（例えば、露出されている）を呈し、そしてそのようなエピトープが、シミュレーションの割合ｇにおいて確実に露出されることが見出されれば、その残基の群は、潜在的な候補エピトープであると見なされ得る。図４Ｂに示された例の残基群において、図４Ｂの鎖（Ａ、ＢおよびＣ）の少なくとも１つが、独立したランの総数の少なくとも１つの割合ｇにおいて検討されている群で零よりも大きなΔＳＡＳＡを呈することを要件として、独立したランの総数の割合ｇでのペプチド鎖のいずれかにおいてアンフォールディングの呈された印を記載した。例示された実施形態において、方法２０２は、この閾値工程、および図６の「ファイアプロット」に例示されたデータのタイプに達する方法を記載している。

方法２０２は、群指数を初期化（最初の反復において）および増進すること（別の反復において）を含むブロック２１０で開始する。ブロック２１０の群指数は、方法１０２でどのデータが得られるかについて残基群の１つを参照し得る。方法２０２はその後、ラン指数を初期化（最初の反復において）および増進すること（続いての反復において）を含むブロック２２０に進行する。ブロック２２０のラン指数は、独立したランの特定の１つを参照し得る。方法２０２はその後、現行のランおよび現行の群について、現行の群の残基全てでΔＳＡＳＡ＞０を有する少なくとも１つの鎖が存在するか否かの質問を含むブロック２３０に進行する。このブロック２３０の質問は、現行のランおよび現行の群について、ブロック１５０（図５Ａ）に記録された正の結果を有する少なくとも１つの鎖が存在するか否かに関して質問することと同等である。検討されているタンパク質が、凝集構造でない場合、ブロック２３０の質問は、検討されているタンパク質が、現行のランおよび現行の群について、現行の群の残基全てについてΔＳＡＳＡ＞０を有するか否かを検討すし得る。ブロック２３０の質問が、肯定であれば、方法２０２は、ブロック２５０で終了する前に、アンフォールディングカウンタを増進することを含むブロック２４０に移行する。ブロック２３０の質問が、否定であれば、方法２０２は、アンフォールディングカウンタを増進せずに、直接ブロック２５０に移行する。

ブロック２５０は、現行のランが最後のランであるか否かの質問を含む。もしそうでなければ、方法２０２は、別の反復の前にブロック２２０にループバックして、ラン指数を増進する。ブロック２５０の質問が、肯定であれば、方法２０２は、現行の残基群が独立したランの十分な割合ｆ、ｇにおける潜在的な候補エピトープであることが示されるか否かの質問を含むブロック２６０に進行する。この割合ｆ、ｇは、構成可能なパラメータであり得る。本明細書の他の箇所で議論される通り、幾つかの実施形態は、独立したシミュレーションの数での少なくとも１つの有意な割合ｆが、バイアシングにより群のアンフォールディングの１つまたは複数の印（例えば、群内の残基の全てでΔＳＡＳＡ＞０）を示す、タンパク質の残基の群（潜在的な候補エピトープ予測５２である）を検討し得る。先に議論された通り、検討されているタンパク質が、凝集構造である場合、所与のシミュレーションにおいて、残基の群が、ペプチド鎖のいずれかにおいてアンフォールディングの１つまたは複数の印（例えば、群の残基の全てでΔＳＡＳＡ＞０）を呈し、そしてそのようなエピトープが、シミュレーションの割合ｇにおいて確実に露出されることが見出されれば、その残基の群は、潜在的な候補エピトープであると見なされ得る。ブロック２６０の質問が、否定であれば、方法２２０は、現行の群が最後の群であるか否かの質問を含むブロック２８０に進行する。ブロック２８０の質問もまた、否定であれば、方法２０２は、方法２０２の別の反復の前に、ブロック２１０にループバックして、群指数を増進する。ブロック２６０の質問が、肯定であれば、現行の群は、潜在的な候補エピトープであると見なされ得、方法２０２は、ブロック２７０に進行する。

ブロック２７０は、図６の「ファイアプロット」に示されるタイプのデータ（蓄積された局所アンフォールディングの印２７２）を含むデータ構造を作成することを含む。特定の群（即ち、方法２０２の現行の群）では、ブロック２７０は、群の残基それぞれが局在化されたアンフォールディングを示す局所アンフォールディングの印５４を呈する群の全例について、組み合わせた局所アンフォールディングの印２７２を蓄積することを含み得る。例えば局所アンフォールディングの印５４が、ΔＳＡＳＡである場合、ブロック２７０は、群の残基それぞれがΔＳＡＳＡ＞０を呈する群の全例について、組み合わせた（例えば、相加または平均の）ΔＳＡＳＡを含む組み合わせた局所アンフォールディングの印２７２を蓄積することを含み得る（方法２０２の現行の群について）。蓄積された、または組み合わせられた局所アンフォールディングの印２７２（群により指数化）は、図６のファイアプロットに示され、以下により詳細に説明されたデータ構造を提供するために用いられるデータのタイプである。特定の群では、作製されたブロック２７０のデータは、蓄積された局所アンフォールディングの印２７２を、群の長さまたはウインドウサイズ（即ち、群の残基の数）および群の残基参照と共に含み得る。幾つかの実施形態において、群の残基参照は、群の中央の残基を含み得る。幾つかの実施形態において、群の残基数が等しい場合に、群の中央のすぐ下の指数を有する残基が、群の残基参照であるように選択されるように、カスタムが採用される。幾つかの実施形態において、群の残基参照を割り付けるために、異なるカスタムが、採用され得る。例えば、群内の最小の指数を有する残基が、群の残基参照として選択され得るように、カスタムが採用され得る。

最終的に方法２０２は、ブロック２８０に進行する（ブロック２６０のノーの分岐またはブロック２７０のいずれかを介して）。ブロック２８０の質問が、肯定であれば、方法２０２は、完了する。

先に議論された通り、方法２０２により作成されたデータ構造は、図６に示された模範的ファイアプロットなどのファイアプロットの形態で表され得る。図６Ａ〜６Ｄは、本開示で検討されている３つの模範的なフィブリル株（ＰＤＢ２Ｍ４Ｊ、２ＬＭＮおよび２ＭＸＵ）についてのエピトープ予測（図６Ａ〜６Ｃ）を与える複数の「ファイアプロット」を、フィブリルのいずれかの端部にある２つのキャップモノマーがアンフォールディングしないように制限したＰＤＢ構造２ＭＸＵの予測（図６Ｄ）と共に示している。この図６Ｄの制限は、長いフィブリルのために存在する境界条件を模倣している。図６のプロットのＸ軸は、群の残基参照の残基指数を示している。方法２０２のブロック２７０に関係して先に議論された通り、幾つかの実施形態において、残基の対応する群の中央の残基が、群の残基参照であると見なされる。図６のファイアプロットに示された各長方形は、基になる残基の群を参照する群の残基参照である。図６のプロットのＹ軸は、対応する群の配列長（即ち、群または潜在的な候補エピトープの残基の数／ウインドウサイズ）を示す。図６のプロットの側部に示された凡例に示される通り、図６のプロットで陰影のあるグレースケールは、同定された群の蓄積された局所アンフォールディングの印２７２を示す。例示された図６の実施形態の場合、この蓄積された局所アンフォールディングの印は、各群における残基のΔＳＡＳＡの総和を含む。図６のプロットの全てが、Ｑ_ｃ＝０．７１という集団座標目的値のために示されている。Ｑ_ｃの他の値が、エピトープ予測に用いられ得、それらは、類似の結果を与える傾向がある（例えば、複数のＱ値で「ファイアプロット」を示す図７を参照されたい。下の２つのパネルは、同じＱ値で２つの異なる平衡化時間を示している）。

方法２０２（図５Ｂ）の実行の結論として、方法１００は、図５Ｃに示された方法１００の一部３０２に進行し得る。方法１００の一部３０２は、簡潔にするために方法３０２と称され得る。方法３０２は、図６のファイアプロットにより表される形態のデータ構造を使用して、最終的な候補エピトープ５２（図１）を予測することを含む。図６に示されたファイアプロットの場合、最終的な候補エピトープ５２は、図８および以下の表１に示される。

方法３０２は、最大ウインドウサイズになるようにウインドウサイズを初期化すること（最初の反復で）、そしてその後、続いての反復でウインドウサイズを減少させること、を含むブロック３１０で開始する。幾つかの実施形態において、最大ウインドウサイズは、１２残基長に設定され、それは方法３０２により予測された候補エピトープが、１２残基という最大の可能な長さを有することを意味する。幾つかの実施形態において、最大ウインドウサイズは、１０残基長に設定される。候補エピトープが１０または１２残基よりも長くなり得ることが、予期または発見されたら、最大ウインドウサイズを適宜、より大きな数に設定することができる。方法３０２の初めに最大ウインドウサイズになるようにウインドウサイズを初期化することは、方法３０２が図６のファイアプロットのＹ軸の最上部で検索を開始することを効果的に意味する。ブロック３０２の後、方法３００は、残基指数を初期化（最初の反復で）および増進（続いての反復で）することを含むブロック３２０に進行して、方法３０２により特定のウインドウサイズで（即ち、図６のファイアプロットの水平の行）群の残基参照（図６のファイアプロットの長方形）をスキャンさせて、群の残基参照が非零の蓄積された局所アンフォールディングの印を有するようにヒットを探す。

ブロック３２０において残基指数を初期化した後、方法３０２は、蓄積された局所アンフォールディングの印２７２が現行の残基指数および現行のウインドウサイズで零よりも大きいか否かの質問を含むブロック３３０に進行する。局所アンフォールディングの印５４がΔＳＡＳＡである特定の実施形態において、ブロック３３０の質問は、蓄積されたΔＳＡＳＡが、現行の残基指数および現行のウインドウサイズで零よりも大きいか否かの質問を含み得る。肯定的なブロック３３０の質問は、図６のファイアプロットの特定の行（ウインドウサイズ）および列（残基指数）における長方形の存在に対応する。本発明者らが、図６Ａに示されたファイアプロットデータ構造の例を検討する場合、最初の肯定的なブロック３３０の質問が、ウインドウサイズ７および残基指数２６、即ち、（残基指数，サイズ）＝（２６，７）で行われる。群の残基参照が、基になる群の中央の残基に対応するカスタム（図６で用いられる）の場合、この肯定的なブロック３３０の質問に関連する群（候補エピトープ）は、残基２３〜２９を含む。

ブロック３３０の質問が、肯定であれば、方法３０２は、ブロック３４０に進行して、ブロック３３０の「ヒット」の基になる残基の群が、方法１０（図１）により予測された候補エピトープ５２として同定および記録される。図６Ａの実施例では、このブロック３４０の候補エピトープ５２（即ち、（残基指数，サイズ）＝（２６，７））は、表１（下記）に示され、構造２Ｍ４Ｊに関して図８に示された最も長い候補エピトープとして、図６Ａで検討されている。

方法３０２はその後、ブロック３４０に記録された候補エピトープ５２およびブロック３４０に記録された候補エピトープ５２内に存在する全てのサブエピトープの、さらなる検討からの除去を含むブロック３５０に進行する。例示された図６Ａの実施例の場合、ブロック３５０は、ブロック３４０に記録された候補エピトープ５２（即ち、（残基指数，サイズ）＝（２６，７）での７残基エピトープ）を図６Ａから除去することを含み得る。

ブロック３５０はまた、ブロック３４０の候補エピトープ５２内に存在するサブエピトープを除去することを含む。図６Ａのファイアプロットの場合、（残基指数，サイズ）＝（２６，７）の最初のブロック２４０の候補エピトープは、残基２３、２４、２５、２６、２７、２８および２９を含む。したがってブロック３５０の中でも除去される（２６，７）のサブエピトープは、それぞれ残基２３、２４、２５、２６、２７、２８、および２４、２５、２６、２７、２８、２９に対応し、（残基指数，サイズ）＝（２６，７）の最初のブロック３４０の候補エピトープ５２内に存在する、（２５，６）および（２６，６）の長方形を含む。最初のブロック３４０の候補エピトープ５２が（残基指数，サイズ）＝（２６，７）にある図６Ａの例でのブロック３５０の一部として除去される他のサブエピトープは、（２５，５）、（２６，５）、（２７，５）、（２４，４）、（２５，４）、（２６，４）、（２７，４）、（２３，２）、（２４，２）、（２５，２）、（２６，２）、（２７，２）、（２８，２）、（２３，１）、（２４，１）、（２５，１）、（２６，１）、（２７，１）、（２８，１）および（２９，１）を包含する。図６Ａのファイアプロットのための最初のブロック３４０の候補エピトープ５２（即ち、候補エピトープ（２６，７））のためのサブエピトープのブロック３５０の除去は、図１６のプロット（Ａ）を図１６のプロット（Ｂ）と比較することにより図１６に示される。これらの２つのプロットの比較は、（２６，７）のブロック３４０の候補エピトープ５２のサイズと同じである底の長さを有する円錐形領域からのサブエピトープの除去を示す。

ブロック３５０における候補エピトープ５２およびサブエピトープの除去の後、方法３０２は、現行の残基指数が最後の残基指数（例えば、図６のファイアプロットの行の最後の残基）であるか否かについての質問を含むブロック３６０に進行する。ブロック３６０の質問が、否定であれば、方法３０２は、ブロック３２０にループバックして、別の反復のために残基指数を増進する。ブロック３６０の質問が、肯定であれば、方法３０２は、ウインドウサイズが最後のウインドウサイズ（例えば、図６のファイアプロットで検討される最下の行）であるか否かに関する質問を含むブロック３７０に進行する。典型的には方法３０２で検討される最も小さいウインドウは、３または４（３ｏｒｆｏｒ）残基長であろう。ブロック３７０の質問が、否定であれば、方法３０２は、ブロック３１０にループバックして、ウインドウサイズを別の反復（即ち、図６のファイアプロットのより下の行のスキャン）のために減少させる。ブロック３７０の質問が、肯定であれば、方法３０２を終了し、ブロック３４０の候補エピトープ５２を、図１のブロック５０および方法１０により予測された候補エピトープ５２としてアウトプットされる。

方法３０２が、図６のファイアプロットの最上から下向きに１行ずつスキャンして、群の残基参照が非零の蓄積された局所アンフォールディングの印２７２を示す長方形を探すことを含むことは、上記により理解されよう。各ブロック３４０の候補エピトープ５２の決定により、候補エピトープ５２および対応するサブエピトープを、さらなる検討から除去する。先に議論された通り、図１６のプロット（Ｂ）は、（２６，７）の第一の候補エピトープ５２およびそのサブエピトープの除去の後の図６Ａのファイアプロットを示す。方法３０２は、さらなる候補エピトープ５２のために図１６のファイアプロット（Ｂ）内を引き続き探す。ブロック３３０の質問が肯定となる次の候補エピトープ５２は、（残基指数，サイズ）＝（２７，６）である（図１６のプロット（Ｂ）参照）。この候補エピトープ（偶数の残基長の群で、中央のすぐ下の指数を有する残基が、群の残基参照として選択されるカスタムに従って残基２５、２６、２７、２８、２９および３０に対応する）は、図８および表１にも示されている。この候補エピトープ５２およびそのサブエピトープの除去が、図１６のプロット（Ｃ）に示されている。

方法３０２は、さらなる候補エピトープのための図１６のプロット（Ｃ）のスキャンを続ける。図６のファイアプロットの基になるデータにおける複数の近隣の基が、同じ長さ（例えば、同じｙ軸の高さ）を有する場合、そのような各基は、候補エピトープの予測５２として選択され得る。図６Ａのファイアプロットの場合、２つの隣接するエピトープが、残基５〜９および６〜１０に対応する（残基指数，サイズ）＝（７，５）および（８，５）に存在する。これは、残基５〜１０により定義される本質的に全ての領域が、良好な候補エピトープ５２になり得ることを示唆している。さらに、図６Ａの場合、残基１４〜１７および３６〜３９を含む２つの４残基長エピトープが、出現する。他のフィブリル株でのエピトープは、データ構造の他の図６プロットから同様に構築され得る。図８および表１は、図６のファイアプロットに示された構造について方法１０により予測された候補エピトープ５２の完全なリストを示す。予測されたエピトープは最初に、最も短い予測が３残基になるように長さを減少させること、そしてその後、Ｎ末端からＣ末端までの残基指数により選別される。

図６Ａ〜６Ｄのファイアプロットに対応するエピトープ予測が、Ａβ線維の形態それぞれについて表１で行われ、即ち記載された方法を利用した図６Ａ〜６Ｄのファイアプロットの分析で、表１に列挙したエピトープが得られる。

表１：図６Ａ〜６Ｄのファイアプロットに示され、Ｑ＝０．７１のバイアスに対応する構造の予測されたエピトープ。それらは、最長から最短までのエピトープ予測、そしてその後、同じ長さのエピトープについてＮ−末端からＣ−末端まで並べられている。

表２は、本発明者により検討された複数の他の構造についての予測されたエピトープを示す。

表２：本発明者により検討された複数の他の構造の予測されたエピトープ

図７は、各プロットの上に示された特定の最終レベルのバイアシング（Ｑ）と共に、様々なレベルのバイアシング（例えば、様々な最終レベルの目的集団座標）について図６のものと類似のファイアプロットを示している（図７Ａは、Ｑ＝０．８を示し、図７Ｂは、Ｑ＝０．７３を示し、図７Ｃは、Ｑ＝０．６７を示し、図７Ｄは、Ｑ＝０．６を示す）。図７は、予測されたエピトープの一般的構造がバイアシングの度合いに著しく依存しないことを実証している。図７Ｄおよび図７Ｅは、最終的な平衡化時間がエピトープ予測に著しい影響を有さないことを示している。例えば平衡化の１６ｎｓ後に（図７Ｄ）、残基８を中心とする長さ４のエピトープ（ＤＳＧＹ）が予測され、２０ｎｓの平衡化の後（図７Ｅ）、残基８を中心とする長さ５のエピトープ（ＨＤＳＧＹ）が予測される。熱揺らぎは、その後の時間にエピトープのサイズを１残基ほど減少または増加させ得る。同様に、平衡化の１６ｎｓ後に（図７Ｄ）、残基２６を中心とする長さ７のエピトープ（ＤＶＧＳＮＫＧ）が予測され、２０ｎｓの平衡化の後（図７Ｅ）、残基２５を中心とする一方（ＤＶＧＳＮＫ）および残基２７を中心とするもう一方（ＧＳＮＫＧＡ）の、長さ６の２つのエピトープが予測される。したがって、２つの異なる平衡化時間での予測が、強いオーバーラップを有し、ランダムな熱揺らぎと一致する。

本明細書に記載された方法により予測される候補エピトープ５２を、実験的に検討された種々のフィブリルモデルおよび観察された出現傾向についてプロットすることができ、図８を参照されたい。図８の分析は、過去に実験的に裏づけられた複数のＡβエピトープを生じる。およそ残基２５〜３０を含む、予測された強い永続性のエピトープが存在する。これは、この領域についての過去の予測と一致する。Ｎ．Ｒ．Ｃａｓｈｍａｎ，Ｏｌｉｇｏｍｅｒ−ｓｐｅｃｉｆｉｃａｍｙｌｏｉｄｂｅｔａｅｐｉｔｏｐｅａｎｄａｎｔｉｂｏｄｉｅｓ，０９２０１１を参照されたい。図８、ならびに表１および２に示された候補エピトープのさらなる検証が、２０１６年７月２２日出願の米国特許出願第６２／３６５６３４号および２０１６年９月１２日出願の同第６２／３９３６１５号に記載されている。

本明細書で検討された単一の全長構造２Ｍ４Ｊでは、Ｎ−末端領域が、大体残基５〜１０の間にエピトープ予測として出現している。高親和性ポリクローナル抗体が、残基５〜１１からなる領域に生じており、これらの抗体は、プラークに結合することおよび神経突起の病態を減少させることも観察されており、ＦｒｅｄｅｒｉｑｕｅＢａｒｄ，ＲｏｂｉｎＢａｒｂｏｕｒ，ＣａｔｈｅｒｉｎｅＣａｎｎｏｎ，ＲｏｂｅｒｔＣａｒｒｅｔｔｏ，ＭｉｃｈａｅｌＦｏｘ，ＤｏｒａＧａｍｅｓ，ＴｅｒｅｓａＧｕｉｄｏ，ＫａｔｈｌｅｅｎＨｏｅｎｏｗ，ＫａｎｇＨｕ，ＫｅｌｌｙＪｏｈｎｓｏｎ−Ｗｏｏｄ，ＫａｒｅｎＫｈａｎ，ＤｏｒａＫｈｏｌｏｄｅｎｋｏ，ＣｅｌｅｓｔｅＬｅｅ，ＭｉｋｅＬｅｅ，ＲｕｔｈＭｏｔｔｅｒ，ＭｉｎｈＮｇｕｙｅｎ，ＡｍａｎｄａＲｅｅｄ，ＤａｌｅＳｃｈｅｎｋ，ＰｅａｒｌＴａｎｇ，ＮｉｃｋｉＶａｓｑｕｅｚ，ＰｅｔｅｒＳｅｕｂｅｒｔ，ａｎｄＴｅｄＹｅｄｎｏｃｋ．Ｅｐｉｔｏｐｅａｎｄｉｓｏｔｙｐｅｓｐｅｃｉｆｉｃｉｔｉｅｓｏｆａｎｔｉｂｏｄｉｅｓｔｏｂ−ａｍｙｌｏｉｄｐｅｐｔｉｄｅｆｏｒｐｒｏｔｅｃｔｉｏｎａｇａｉｎｓｔＡｌｚｈｅｉｍｅｒ’ｓｄｉｓｅａｓｅ−ｌｉｋｅｎｅｕｒｏｐａｔｈｏｌｏｇｙ．Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ，１００（４）：２０２３−２０２８，２００３を参照されたい。

新規なコンセンサスベースのエピトープが、図８から出現しており、それは株全体でかなり一致して認められ、大体残基１３〜１８または配列ＨＨＱＫＬＶからなる。このエピトープを環状化して、オリゴマーについての立体選択性を検査することができる。該エピトープは、オリゴマー特異性選択性を促進する環状化に加えて、特異的コンホメーション内でエピトープを提示するようにタンパク質足場に移植することもできる。タンパク質足場は、タンパク質構造の状況においてコンホメーション安定性を促進する。そのようなエピトープ／足場は、構造特異性血清学的試薬として、そして／または病原性コンホメーションにおいてエピトープへの構造特異性を有する抗体を誘発する免疫源として、作用し得る。

ディスオーダーまたは露出（局所アンフォールディングの印５４）の尺度としてＳＡＳＡを用いることに加え、またはその代わりに、幾つかの実施形態は、コンタクトの損失（ネイティブ構造２２におけるコンタクトの中から）を局所アンフォールディングの印５４として検討することを含み得る。このアプローチにおいて、バイアシングシミュレーションは、同じになり得るが、ブロック５０の分析は、わずかに異なり得る。エピトープが各シミュレーションにおける少なくとも１つの鎖の各残基についてΔＳＡＳＡｎ（ΔＳＡＳＡｎｅａｃｈｒｅｓｉｄｕｅ）の増加を示すことを必要とすることにより候補エピトープを評価する代わりに、そのような実施形態は、エピトープが各シミュレーションにおいて少なくとも１つの鎖の各残基でコンタクト（ネイティブ構造２２におけるコンタクトの中から）の減少を示すことを必要とすることにより候補エピトープを評価することを含み得る。実際に、各残基がコンタクト（ネイティブ構造２２におけるコンタクトの中から）の数を減少させなければならないだけでなく、その変更が、幾つかの値、典型的には約０．５〜１コンタクト／原子よりも大きくならなければならないように、幾つかの実施形態が閾値を設定することを含み得る。図９は、タンパク質の数（図９の列に対応する）それぞれについてのＳＡＳＡの変動（最上行）および損失コンタクト数（最下行）に基づくファイアプロットの比較を示す。２ＭＸＵのバイアシングレベルが、上のパネルでＱ＝０．６７、下のパネルでＱ＝０．６であることに留意されたい。Ｑを用いて予測された最長エピトープは、長さ９のエピトープＡＥＤＶＧＳＮＫＧと、２種の長さ６のエピトープＥＶＨＨＱＫ、ＶＨＨＱＫＬである。これらは、この特定の株、詳細にはＤＶＧＳＮＫＧ、ＥＤＶＧＳＮ、ＱＫＬＶＦ、ＨＨＱＫ、およびＡＥＤＶについて、表１のエピトープと良好にオーバーラップする。

本発明者は、残基の全数のサブセットを選択すること、およびＮ−末端領域を付加しないこと、の潜在的効果を検査した。幾つかの実施形態において、デフォルトによるシミュレーションパラメータは、正電荷の１プロトン単位をＮ−末端残基に割り付けるが、電荷間の反発が、Ｎ−末端領域のディスオーダーを増大させ得る。図１４は、方法の異なるリファインメントおよび各効果の重要性を比較している。詳細には図１４のプロットは、修飾のないＰＤＢ構造（右パネル）から開始したファイアプロット、帯電していないＮ−末端を有する構造（ＮＨ_３ ^＋の代わりにＮＨ_２；中央のパネル）について、およびＮ−末端残基１〜１０が戻された構造（左パネル）についてのファイアプロットを示している。先に記載された通り、多くの分子動力学シミュレーションにおけるＮ−末端のデフォルト処理は、正電荷を有するＮＨ_３ ^＋基である。そのような正電荷は、鎖のＮ−末端の間に余分な反発をもたらし、実際のシステムでは、末端がその他の箇所で大体１０残基早く配置されている。

図１０は、０．８という初期Ｑにバイアスをかけた後の、３回対称Ａβ構造２Ｍ４Ｊの描画である。強調された領域（矢印１０１、１０３による）、つまり鎖Ｂにおける、側鎖の薄い色のリコリス状描画における残基１３〜１９（矢印１０１）および側鎖のより暗い色のリコリス状描画における残基２５〜２９（矢印１０３）は、図４Ａで予測されたものである。より強いバイアシング（下の最終的なＱ）で、フィブリルモノマーが、分離して開き始める（図１１参照）。バイアシングの際に優先的に露出された残基１２〜１７を有すると予測される図１０の鎖は全て、２Ｍ４Ｊ構造内の三層のうちの端の層にある。

構造２Ｍ４Ｊにおける残基２５〜２９は、本来の構造における２つのβシートの間にターンを形成する。この領域は、隣接する鎖のＮ−末端領域とのコンタクトを破壊することにより、露出するようになる（図１０）。最後の目的集団座標のバイアス値は、フィブリルを崩壊するのに十分、減少し得る。図７は、最後の目的集団バイアシング座標に関する予測のロバストネスを例示している。図１１は、３回回転構造を０．８ではなく０．６の初期Ｑにバイアシングすることがタンパク質を著しく歪め、残基２５〜２９におけるターンの相対的露出を増加させて、隣接する鎖のＣ−末端とのコンタクト全てを損失することを示している。しかしこれは、より低いバイアシングレベルでも予測されるエピトープであり、エピトープ予測を変更しない。

Ａβ４２構造２ＭＸＵは、１２モノマー長のフィブリルであり、端のモノマーと中央のモノマーとの差異の検査を可能にする。ＰＤＢ構造から失った残基１〜１０は、再構築されて付加されている。本発明者は、２ＭＸＵ構造の端のモノマーが図１２で認めることができる中央のものをディスオーダーする見込みがかなり高いことを見出した。図１２は、初期Ｑ０．８へのバイアシング後のＡβ４２構造２ＭＸＵの描画であり、フィブリルからの端のモノマーの離脱を示す。これは、エンドキャップディスオーダー／断片化の過程を示している。実際のフィブリルは、この系におけるよりもずっと多くのモノマーで構成され得るため、この論点は、幾つかの実施形態において、端部で鎖（鎖ＡおよびＬ）を制限すること、およびバイアシングシミュレーションを反復すること、により取り組まれた。

ＰＤＢ２ＬＭＮの初期構造にスーパーインポーズされたディスオーダー構造のスナップショットを、図１３に示している。この２回対称構造について、本発明者らは再度、予測されたエピトープとして出現した側鎖のリコリス状描画を利用して残基１１〜１６および２５〜２８を観察する。図１３は、約０．８の初期Ｑにバイアシングした後の２回対称Ａβ構造２ＬＭＮの描画を示している。ディスオーダー構成を、初期構成にスーパーインポーズしている。強調された側鎖を有する領域は、鎖ＪおよびＫの残基１１〜１６（暗い色、１０５）、および鎖Ｂ、Ｄ、Ｆ、Ｉの残基２５〜２８（薄い色、１０７）に対応する。

本明細書に記載された方法は、一本鎖タンパク質に提供され得る。一実施例の実験において、本明細書に記載された方法を、金属を欠くがシステイン５７と１４６の間のジスルフィド結合を含む、スーパーオキシドジスムターゼ１（ＳＯＤ１）を構成する系に適用した。全コンタクト数に対応する全体的な座標で、タンパク質にバイアスをかけ、目的集団座標を、Ｑ_ｃ＝０．６５の値に減少させた。その後、タンパク質をＱ_ｃ＝０．６５に保持し、次に９０ｎｓの間、平衡化した。スナップショットを、２０ｐｓごとに記録して、各残基のΔＳＡＳＡを、この４５００構成の集団において測定した。ファイアプロットの基になるデータ構造を構築するための図５に記載された手順（方法１０２、２０２）に従って、図１７Ａを与えた。図５Ｃ（方法３０２）の手順に従って、ファイアプロットのデータ構造から予測された対応するエピトープを、表３に与える。これらのエピトープを、Ｑ_ｃ＝０．６５にバイアスをかけた集団からのスナップショットにスーパーインポーズされた図１７Ｂに暗い描影で示している。

表３：ＳＯＤ１で本明細書に記載された方法を実装するための候補エピトープ

図１５は、特定の実施形態による、本明細書に記載された方法のいずれか、および本明細書に記載された方法のいずれかのステップを実施するために用いられ得るシステム５００の略図である。例示された実施形態のシステム５００は、１つまたは複数のプロセッサ５０４を含み得る１つまたは複数のコンピュータ５０２を含み、順次、プロセッサ（複数可）５０４にアクセス可能な適切なソフトウエア（明白に列挙されない）を実行し得る。そのようなソフトウエアが、コンピュータ５０２（そして詳細にはプロセッサ（複数可）５０４）により実行される場合、コンピュータ５０２および／またはプロセッサ（複数可）５０４は、本明細書に記載された方法のいずれかおよび本明細書に記載された方法のいずれかのステップを実施することができる。例示された実施形態において、コンピュータ５０２は、ユーザー５０６との相互作用のための任意選択によるユーザーインターフェース５１０を提供する。ハードウエアの目線から、ユーザーインターフェース５１０は、ユーザー５０６が情報をコンピュータ５０２にインプットし得る１つまたは複数のインプットデバイス５０８と、情報がユーザー５０６にアウトプットされ得る１つまたは複数のアウトプットデバイス５１２と、を含む。一般に、インプットデバイス５０８およびアウトプットデバイス５１２は、図１５の例示された実施形態に示されたものに限定されない。一般に、インプットデバイス５０８およびアウトプットデバイス５１２は、コンピュータ５０２と相互作用するのに適した任意の適切なインプットおよび／またはアウトプットデバイスを含み得る。ソフトウエアがコンピュータ５０２および／またはそのプロセッサ（複数可）５０４により実行される場合には、ユーザーインターフェース５１０もまた、一部がそのようなソフトウエアにより提供され得る。例示された実施形態において、コンピュータ５０２はまた、アクセス可能なメモリーデバイス５１８でデータにアクセスするように（そして／またはデータを保存するために）接続されている。例示された実施形態において、コンピュータ５０２はまた、通信インターフェース５１４によりＬＡＮおよび／またはＷＡＮネットワーク５１６に接続されて、ネットワークデバイス（図示されない）からのデータのアクセスおよび／またはネットワークデバイスへのデータの通信を可能にする。

インプットは、非限定的にインプットデバイス５０８による、アクセス可能なメモリー５１８から、ネットワーク５１６から、または任意の他の適切なインプットメカニズムによる、などインプットメカニズムのいずれかを介してコンピュータ５０２により得ることができる。アウトプットは、非限定的に任意のアウトプットデバイス５１２により、アクセス可能なメモリー５１８へ、ネットワーク５１６へ、または任意の他の適切なアウトプットメカニズムへ、などアウトプットメカニズムのいずれかを介してコンピュータ５０２からアウトプットされ得る。先に議論される通り、図１５は単に、本明細書に記載された方法を実装するのに適したコンピュータベースのシステム５００の特定の実施形態の略図である。適切なシステムは、図１５の略図において示された特定のタイプに限定されず、適切な構成要素（例えば、インプットおよびアウトプットデバイス）は、図１５の略図に示されたものに限定されない。

本明細書に記載された方法は、幾つかの実施形態において、適切なコンピュータシステムの構成要素を含み得る、１つもしくは複数のプロセッサを含むコンピュータにより、そして／または１つもしくは複数の適切なプロセッサにより実装され得る。非限定的例として、そのようなプロセッサは、コンピュータベースの自動化された契約評価システム（ｃｏｎｔｒａｃｔｖａｌｕａｔｉｏｎｓｙｓｔｅｍ）の一部を含み得る。一般にそのようなプロセッサは、例えば適宜構成されたコンピュータ、マイクロプロセッサ、マイクロコントローラ、デジタルシグナルプロセッサ、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、他のタイプのプログラム可能なロジックデバイス、前述のものの複数、前述のものの組み合わせなどの任意の適切なプロセッサを含み得る。そのようなプロセッサは、プロセッサにアクセス可能なコンピュータで読み取り可能なメモリーにおいて、そして／またはプロセッサと一体化されたコンピュータで読み取り可能なメモリーにおいて、保存され得るソフトウエアへのアクセスを有し得る。該プロセッサは、そのようなソフトウエアの指令を読み取り、そして実行するように構成され得、プロセッサにより実行されると、そのようなソフトウエアは、本明細書に記載された機能性の幾つかをプロセッサに実装させ得る。

本発明の特定の実装は、ソフトウエアの指令を実行して、プロセッサにコントローラを実装させる、そして／または本発明の方法を実施させる、コンピュータプロセッサを含む。例えば、コンピュータシステム内の１つまたは複数のプロセッサは、プロセッサにアクセス可能なプログラムメモリーから回収されたソフトウエアの指令を実行することにより、コントローラ内のデータ処理ステップ、および／または本明細書に記載された方法を実装し得る。本発明は、プログラム製品の形態でも提供され得る。該プログラム製品は、データプロセッサにより実行されると、データプロセッサにコントローラを実装させる、そして／または本発明の方法を実行させる、指令を含む一組のコンピュータで読み取り可能なシグナルを担う任意の媒体を含み得る。本発明によるプログラム製品は、非常に多様な形態のいずれかであり得る。該プログラム製品は、例えばフロッピーディスク、ハードディスクドライブをはじめとする磁気データ保存媒体、ＣＤＲＯＭ、ＤＶＤをはじめとする光学データ保存媒体、ＲＯＭ、フラッシュＲＡＭをはじめとする電子データ保存媒体などの物理的（非一時的）媒体を含み得る。該指令は、暗号化および／または圧縮された形態でプログラム製品に存在し得る。

構成要素（例えば、ソフトウエアモジュール、コントローラ、プロセッサ、アセンブリ、デバイス、構成要素、回路など）が、先に参照される場合、他に示されない限り、その構成要素の参照（「手段」の参照を含む）は、本発明の例示された模範的実施形態において機能を実施する開示された構造と構造的に均等でない構成要素をはじめとし、記載された構成要素の機能を実施する（即ち、機能的に均等な）任意の構成要素を、その構成要素の均等物として含むと解釈されなければならない。

用語の解釈
文脈が他に明確に要求しない限り、本明細書および特許請求の範囲全体を通して、異なる方向で、そして／または空間および／もしくは角度により互いに相殺されて、
・「含む」、「含むこと」などは、排他的または徹底的意味の逆として包含的意味；即ち、「非限定的に包含する」の意味で解釈されなければならない；
・「連結された」、「結合された」またはその任意の変形例は、２つ以上の要素の間の直接的または間接的のいずれかの任意の連結または結合を意味し；要素間の結合または連結が、物理的、論理的またはその組み合わせであり得；一体として形成された要素は、連結または結合されていると見なされ得る；
・本明細書を記載するのに用いられる場合の、「本明細書に」、「先に」、「以下に」および類似の趣旨の言語は、本明細書の任意の特定の部分ではなく、本明細書を全体として参照している；
・２つ以上の事柄の列挙で参照される「または」は、言語の以下の解釈の全てを包含する：リストにある事項のいずれか、リストにある事項の全て、およびリストにある事項の任意の組み合わせ；
・単数の形態「ａ」、「ａｎ」および「ｔｈｅ」は、任意の適当な複数形態の意味も包含する。

本発明の実施形態は、専用に設計されたハードウエア、構成可能なハードウエア、データプロセッサ上で実行され得るソフトウエア（場合により「ファームウエア」を含み得る）の提供により構成されたプログラム可能なデータプロセッサ、本明細書に詳細に説明された方法の１つもしくは複数のステップを実施するように専用にプログラム、構成もしくは構築された特別な目的のコンピュータもしくはデータプロセッサ、および／またはこれらの２つ以上の組み合わせを利用して実装され得る。専用に設計されたハードウエアの例は、論理回路、特定用途向け集積回路（「ＡＳＩＣ」）、大規模集積回路（「ＬＳＩ」）、超大規模集積回路（「ＶＬＳＩ」）などである。構成可能なハードウエアの例は、プログラマブルアレイロジック（「ＰＡＬ」）、プログラマブルロジックアレイ（「ＰＬＡ」）およびフィールドプログラマブルゲートアレイ（「ＦＰＧＡ」）などの１つまたは複数のプログラマブルロジックデバイスである。プログラム可能なデータプロセッサの例は、マイクロプロセッサ、デジタルシグナルプロセッサ（「ＤＳＰ」）、組み込みプロセッサ、グラフィックスプロセッサ、数値演算コプロセッサ、一般目的のコンピュータ、サーバーコンピュータ、クラウドコンピュータ、メインフレームコンピュータ、コンピュータワークステーションなどである。例えばデバイスのためのコンピュータシステム内の１つまたは複数のデータプロセッサは、該プロセッサにアクセス可能なプログラムメモリーにおいてソフトウエア指令を実行することにより本明細書に記載された方法を実装し得る。

プロセシングは、集中または分散され得る。プロセシングが、分散される場合、ソフトウエアおよび／またはデータをはじめとする情報が、集中的に保持され得るか、または分散され得る。そのような情報は、ローカルエリアネットワーク（ＬＡＮ）、ワイドエリアネットワーク（ＷＡＮ）、インターネット、有線もしくは無線データリンク、電磁シグナル、または他のデータ通信チャンネルなどの通信ネットワークを用いて異なる機能単位の間で交換され得る。

例えば、工程またはブロックは、所与の順序で提示されるが、別の実施例が、異なる順序で、ステップを有する日常的作業を実施すること、またはブロックを有するシステムを用いることができ、幾つかの工程またはブロックは、欠失、移動、付加、分解、結合、および／または修飾されて、代替法または部分的組み合わせを提供することができる。これらの工程またはブロックのそれぞれは、種々の異なる方法で実装され得る。おなじく工程またはブロックは、時には連続で実施されるように示されるが、これらの工程またはブロックは、代わりに並行して実施され得、または異なる時間に実施され得る。

加えて、要素は、時には順次、実施されるように示されるが、代わりにそれらは、同時にまたは異なる順序で実施され得る。それゆえ、以下の特許請求の範囲は、そのような変形例全てを意図する範囲内として含むものと解釈されるものとする。

本発明の実施形態は、プログラム製品の形態でも提供され得る。該プログラム製品は、データプロセッサにより実行されると、データプロセッサに本発明の方法を実行させる、一組のコンピュータで読み取り可能な指令を担う任意の非一時的媒体を含み得る。本発明によるプログラム製品は、非常に様々な形態のいずれかであり得る。該プログラム製品は、例えばフロッピーディスク、ハードディスクドライブをはじめとする磁気データ保存媒体、ＣＤＲＯＭ、ＤＶＤをはじめとする光学データ保存媒体、ＲＯＭ、フラッシュＲＡＭ、ＥＰＲＯＭ、ハードウエアに組み込まれたもしくは予めプログラムされたチップ（例えば、ＥＥＰＲＯＭ半導体チップ）、ナノテクノロジーメモリーをはじめとする電子データ保存媒体などの非一時的媒体を含み得る。プログラム製品上のコンピュータで読み取り可能なシグナルは、場合により圧縮または暗号化され得る。

幾つかの実施形態において、本発明は、ソフトウエアに実装され得る。より明確にするために、「ソフトウエア」は、プロセッサ上で実行される任意の指令を含み、（非限定的に）ファームウエア、常駐ソフトウエア、マイクロコードなどを包含し得る。プロセシングハードウエアおよびソフトウエアは両者とも、当業者に公知の通り、全体または一部が集中または分散され得る（またはその組み合わせであり得る）。例えばソフトウエアおよび他のモジュールは、ローカルメモリーを介して、ネットワークを介して、分散されたコンピュータ環境のブラウザもしくは他の適用を介して、または先に記載された目的に適した他の手段を介して、アクセス可能になり得る。

構成要素（例えば、ソフトウエアモジュール、プロセッサ、アセンブリ、デバイス、回路など）が、先に参照される場合、他に示されない限り、その構成要素の参照（「手段」の参照も含む）は、本発明の例示された模範的実施形態において機能を実施する開示された構造と構造的に均等でない構成要素をはじめとし、記載された構成要素の機能を実施する（即ち、機能的に均等な）任意の構成要素を、その構成要素の均等物として含むと解釈されなければならない。

データベースの記録、フィールド、エントリー、および／または他の要素が、先に参照される場合、他に示されない限り、そのような参照は適宜、複数の記録、フィールド、エントリー、および／または他の要素を含むと解釈されなければならない。そのような参照はまた、適宜、１つまたは複数の記録、フィールド、エントリー、および／または他の要素の一部を含むと解釈されなければならない。例えばデータベースにおける複数の「物理的」記録（即ち、データベース構造においてコード化された記録）は、該複数の物理的記録が、論理記録から除外される情報を含むとしても、上記の記載、そして以下の特許請求の範囲の目的で１つの「論理」記録と見なされ得る。

システム、方法および装置の具体的な例が、例示の目的で本明細書に記載されている。これらは、例に過ぎない。本明細書で提供された技術は、上記の実施例のシステム以外のシステムに提供され得る。多くの代替、改変、付加、省略、および交換が、本発明の実践において可能である。本発明は、特色、要素および／もしくは活動を均等な特色、要素および／もしくは活動と交換すること；異なる実施形態からの特色、要素および／もしくは活動を混合および適合させること；本明細書に記載された実施形態からの特色、要素および／もしくは活動を他の技術の特色、要素および／もしくは活動と組み合わせること；ならびに／または組み合わせた特色、要素および／もしくは活動を記載された実施形態から省略すること、により得られる変形例をはじめとする、当業者に明白な、記載された実施形態上の変形例を包含する。

複数の模範的態様および実施形態が、先に議論されたが、当業者は、特定の改変、交換、追加およびそれらの部分的組み合わせを認識するであろう。例えば、
・幾つかの実施形態において、検討されているタンパク質は、ネイティブコンタクトを用いるのではなく溶媒露出表面積（ＳＡＳＡ）を用いることにより、ネイティブ構造を損失するようにバイアスがかけられ得る。
・幾つかの実施形態において、バイアシングの結果を分析すること（例えば、ブロック５０）は、力学的作用の最も顕著な増加を有する領域を測定することを含み得、バイアシングされたら、表面積（ＳＡＳＡ）の増加または初期コンタクトの損失に加えて、またはその代りに、どの領域が構造的に破壊されて、非ネイティブ相互作用をより受け易いか、も示し得る。力学的作用増加のそのような尺度の例は、アミノ酸の根平均二乗揺らぎ（ＲＭＳＦ）を含み得る。
・幾つかの実施形態は、バイアシングによる構造変化の代理として作用し得るバイアシングによる特定のアミノ酸配列のポテンシャルエネルギーの損失の直接的なコンピュータ測定を含み得る。
・幾つかの実施形態は、バイアシングのための集団座標として、または続いての局所アンフォールディングの印（例えば、ネイティブ構造の局所損失）として作用し得る、ネイティブ構造のバックボーン水素結合の中からのバックボーン水素結合損失の尺度を含み得る。
・先に記載された実施形態は、バイアスの適用によるタンパク質構造の変化をシミュレートするための分子動力学エンジンの使用を行っている。幾つかの実施形態において、モンテカルロ力学エンジンが、分子動力学エンジンに加えて、またはその代わりに用いられ得る。分子動力学エンジンおよびモンテカルロ力学エンジンのいずれか、または両方は、本明細書ではタンパク質または凝集フィブリル構造のためのコンホメーションサンプリングエンジン（ｃｏｎｆｏｒｍａｔｉｏｎａｌｓａｍｐｌｉｎｇｅｎｇｉｎｅ）と称され得る。
・幾つかの実施形態において、検討されているタンパク質は、ネイティブＳＡＳＡに比較したＳＡＳＡ、またはネイティブコンタクトのうちのコンタクト数など、オーダーパラメータを基にしたバイアスポテンシャルを適用することに加えて、またはその代わりにメタダイナミクスを利用することによりネイティブ構造を損失するようにバイアスがかけられ得る。

特定の非限定的例の実施形態のステップおよび方法の詳細を示す疑似コードを、以下に記載する：

方法１０２、２０２（図５Ａおよび５Ｂ）に対応する疑似コード
％ΔＳＡＳＡの測定／記録
各ランについて、１＜ラン＜Ｎランであれば、％Ｎランは、典型的には１０に設定される
各鎖について、１＜鎖＜Ｎ鎖であれば、％シミュレートされたフィブリルにおける鎖の数
各ｒｅｓで、１＜ｒ＜Ｎｒｅｓであれば、
＜ΔＳＡＳＡ＞（ｒｅｓ，ラン，鎖）を計算し、％各鎖、各ランにおける各残基のｒｅｓについて、ΔＳＡＳＡは、溶媒露出表面積の変化であり、＜．．．＞は、システムの構成のスナップショット全体の平衡平均を示す。典型的な１００ｎｓシミュレーションでの２０ｐｓごとのスナップショットが、１００ｎｓ／２０ｐｓ＝５０００スナップショットを与える。この量は、本明細書では以降、平均化された平衡と理解され、そのため＜ΔＳＡＳＡ＞≡ΔＳＡＳＡとなる。
ｒｅｓについて終了
鎖について終了
ΔＳＡＳＡを各ランについて別のデータファイルに書き込む；％フォーマットは、２つの列であり、最初の列＝ｒｅｓであり、２番目の列はΔＳＡＳＡである。ファイルにおける鎖Ｊ、残基ｋの場所は、Ｎｒｅｓ^＊ｊ＋ｋの行により与えられる。％各ファイルは、複数の鎖を含む
ランについて終了％ΔＳＡＳＡの決定／記録を終了

％全てのランからの全てのデータファイルが、インプットのために読み込まれた後、ΔＳＡＳＡは、サイズの３Ｄ長方形マトリックスである（Ｎラン×Ｎ鎖×Ｎｒｅｓ）

％各ウインドウ位置ｗｐ、各ウインドウサイズｗｓについてのΔＳＡＳＡ値からなるファイアプロットのために、ウインドウ表示の新しいマトリックスＤＳＡＳＡを定義する。
ウインドウ表示されたＤＳＡＳＡ（ｗｐ，ｗｓ）＝全てのｗｐ、ｗｓで０であり、％ｗｐが、１＜ｗｐ＜Ｎｒｅｓのウインドウ位置であれば（フォーループ値は、これらの位置のサブセットについて割り付けられる）、ｗｓは、１＜ｗｓ＜ｗｓｍａｘ（以下に定義）のウインドウサイズである。
％ウインドウ表示されたＤＳＡＳＡのサイズは、Ｎｒｅｓ×ｗｓｍａｘであり；以下のループは、１：Ｎｒｅｓからランせず；以下のフォーループの外側の要素は、決して零から変化しない。

％最大ウインドウサイズであるｗｓｍａｘ、典型的には約１２アミノ酸／残基を推測する。最大ウインドウサイズは、その中に０の「ヒット」を有するであろう。即ち、以下に定義された通り零の成功。これは、本発明者らが生成されたファイアプロット内のピークを超えるウインドウサイズで終了していることのみを意味する。

ｆｍｉｎ＝成功の最小割合の設定。％これは、幾つかのランに局在化されたアンフォールディングを確率論的に偶然に示させないようにとらえられる。本発明者らは、典型的にはＮラン＝１０ランを実装するため、本発明者らは、これを０．９であるととらえ、つまり１０のランのうち少なくとも９が、局在化されたアンフォールディングの「ヒット」をもたらさなければならず、局在化されたアンフォールディングの「ヒット」が、ウインドウにおける全ての残基でＳＡＳＡ露出を増加していることを意味する。

％「ファイアプロット」のデータ構造を組み立てる
％以下のループへのインプットは、ΔＳＡＳＡ（ｒｅｓ，ラン，鎖）の（Ｎｒｅｓ×Ｎラン×Ｎ鎖）サイズのアレイである。

ウインドウサイズｗｓ＝１：ｗｓｍａｘについて％即ちウインドウサイズがｗｓｍａｘになるまで増加し；ｗｓｍａｘが全鎖長Ｎｒｅｓになり得るか、または表面積の増加を示す隣接する鎖のいずれかよりも長いと予測されるウインドウサイズであり得る（実際のｗｓｍａｘは、１２に設定され得る）
％以下に定義されたビルド＿ファイアプロット関数を実装するウインドウの中央位置＝ｗｐ、ウインドウ表示されたＤＳＡＳＡ（：，ｗｓ）＝ビルドファイアプロット関数（ΔＳＡＳＡ（ｒｅｓ，ラン，鎖），ｗｓ，ｆｍｉｎ）；％ビルト＿ファイアプロット関数は、Ｎｒｅｓ長のベクトルを返し、２Ｄアレイをこのベクトルで満たす
ウインドウサイズについて終了

ウインドウ表示されたＤＳＡＳＡ（ｗｐ，ｗｓ）をファイルに書き込む％各タンパク質またはフィブリルモデルについてファイルに書き込まれたＮｒｅｓ×ｗｓｍａｘのアレイ

％先のループからのアウトプットは、ネイティブタンパク質またはフィブリルモデルについてのウインドウ表示されたＤＳＡＳＡ（ｗｐ，ｗｓ）、Ｎｒｅｓ×ｗｓｍａｘサイズのアレイである。

％先の疑似コードにおけるビルド＿ファイアプロット関数のコール：
ビルド＿ファイアプロット関数を開始する％先のループにおける関数（ΔＳＡＳＡ（ｒｅｓ，ラン，鎖），ｗｓ，ｆｍｉｎ）を以下の通り定義する：
ウインドウ表示されたＤＳＡＳＡ（：，ｗｓ）＝０；％Ｎｒｅｓ零のベクターにウインドウ表示されたアウトプットＤＳＡＳＡを初期化する
カウント（：，：）＝０；％これはｆｍｉｎ規準をチェックするためにビルド＿ファイアプロット関数内のみで用いられた１’ｓおよび０’ｓサイズのＮｒｅｓ×Ｎランのブールマトリックスである
ラン＝１：Ｎランについて％図４Ｂの実施例において、Ｎラン＝３およびＮ鎖＝３
ウインドウの中心位置ｗｐ＝ｗｐｍｉｎ：ｗｐｍａｘについて％（ここでｗｐｍｉｎ＝円形（ｗｓ／２）は、所与のウインドウサイズｗｓについての初期ウインドウ位置である。例えば、もしｗｓが７であれば、ｗｐｍｉｎは、３．５の直後の整数として定義される４であるが、もしｗｓ＝６であれば、ｗｐｍｉｎ＝３；ｗｐｍａｘ＝Ｎｒｅｓ−（ｗｓ−ｗｐｍｉｎ））
鎖＝１：Ｎ鎖について
もし（（ｗｐ，ｗｓ）により定義されたウインドウの全てのｒｅｓについて、ΔＳＡＳＡ（ｒｅｓ、ラン、鎖）＞０）、
％図４Ｂにおいて、この「もし」の提示が（ラン，鎖）＝（１，２）、（２，１）、（３，２）、および（３，３）について真実であれば、
ウインドウ表示されたＤＳＡＳＡ（ｗｐ，ｗｓ）＝ΔＳＡＳＡ（ｒｅｓ、ラン、鎖）のサイズｗｓのウインドウにおけるｒｅｓの総和；
カウント（ｗｐ，ｗｓ）＝１；
もしΔＳＡＳＡ＞０であれば終了
鎖について終了
ｗｐについて終了％ここで任意のヒットについて１つの所与のランにおける全ての位置で全ての鎖をチェックした
ランについて終了％ウインドウ表示されたＤＳＡＳＡ（ｗｐ，ｗｓ）を、ここで鎖全体で、そしてラン全体で総和した；即ち、図４Ｂにおいて、４つのパネルからのＳＡＳＡ，（ラン，鎖）＝（１，２）、（２，１）、（３，２）、および（３，３）を全て総和した。図４Ｂにおいて、少なくとも１つの鎖について各ランにヒットが存在し、そのため例示されたウインドウ位置でのカウント（ｗｐ，ラン）は［１１１］のベクターである。

％対応するＤＳＡＳＡ（ｗｐ，ｗｓ０）＝０を設定しない場合、ランの数がｆｍｉｎの割合要件（カウント＝１が９／１０のランで出現する）を満たすか否かをチェックする：
開始＿要素＝フロア（（１−ｆｍｉｎ）^＊Ｎラン）＋１；％エピトープが出現しなければならないランの数を設定するアレイ開始要素。ｆｍｉｎ＝０．９およびＮラン＝１０について、ここでは開始＿要素＝２であり、エピトープは、１０のうち２の要素に出現しなければならない。
ｗｐ＝１：Ｎｒｅｓについて
カウントソート＝ソート（カウント（ｗｐ，：））％カウント（ｗｐ，：）は、１’ｓおよび０’ｓのＮランの長さのベクター、例えば［１１００１１０１１１］のベクターであり；ソート（カウント（ｗｐ，：））は、これを［０００１１１１１１１］に転換し；０は、エピトープ予測なしを示し（即ち、区分（ｗｐ，ｗｓ）における全ての残基がＳＡＳＡを増加させたわけではなく）、１は、エピトープが予測されることを示す（即ち、区分（ｗｐ，ｗｓ）における全ての残基がＳＡＳＡを増加させた）
もし、（任意の（カウントソート（開始＿要素：終了）＝＝０）％（最初の（開始＿要素−１）ラン状態をスキップする（本発明者らが開始＿要素−１のランに予測を省略させることを意味する）；カウントソートマトリックス（即ち、カウントソート（ｓｓ：終了））の残りの要素について、もし任意の要素が、０であれば（予測を省略するｓｓ−１以外のランが存在することを意味する）、本発明者らは、対応するウインドウ表示されたＤＳＡＳＡ（ｗｐ，ｗｓ）＝０を設定する：
ウインドウ表示されたＤＳＡＳＡ（ｗｐ，ｗｓ）＝０；％ウインドウ表示されたＤＳＡＳＡにおける零の要素は、そのマトリックスがその位置でエピトープを予測しないことを意味する。たとえこの時点でこのマトリックスにおいてＳＡＳＡの非零の総和が存在したとしても、それがランの閾値基準を満たさなければ、その値は零にリセットされる。
「もし」を終了
ｗｐについて終了

ウインドウ表示されたＤＳＡＳＡ（ｗｐ，ｗｓ）を返す；％ウインドウ表示されたＤＳＡＳＡ（：，ｗｓ０）を返す
ビルド＿ファイアプロット関数を終了

方法３０２（図５Ｃ）に対応する疑似コード
％ファイアプロットデータ構造を利用して、候補エピトープを予測する
％インプット（上述から）は、ウインドウ表示されたＤＳＡＳＡの総和（ｗｐ，ｗｓ）、即ちファイアプロットのデータである。

ｗｓ＝ｗｍａｘ−１：３について、％ウインドウサイズを最大値（例えば、図６Ａのｗｓｍａｘ＝１１）から最小で３に減少させる。本発明者らは、ここでは３以上の長さのエピトープを検討する。これは、任意であり、４に減少させることができた。エピトープの長さが短い程、それがプロテオームにおいてより一般的に出現し、オフ・パスウェイターゲットに罹患している可能性がより高い。３の長さを取り入れると、タンパク質内で確定されたターゲットを提供するのに十分、エピトープを短くすることができるが、配列同一性およびコンホメーションに関してプロテオーム内で比較的独特にするのに十分に長くすることができる。
ｗｐ＝１：Ｎｒｅｓについて
もし（ｗｐがヒットである）％即ち、ウインドウ位置ｗｐについて０より大きなウインドウ表示されたＤＳＡＳＡの総和（ｗｐ，ｗｓ）の値が存在すれば、
エピトープ（ｗｐ，ｗｓ）を記録する％例えば、図６Ａにおいて最初のヒットは（ｗｐ＝２６ｗｓ＝７）または位置２６を中心とする長さ７のエピトープ：［２３２４２５２６２７２８２９］に対応し；したがって残基２３〜２９は、表１の２Ｍ４Ｊについての最長のエピトープであり、ＤＶＧＳＮＫＧに対応する２Ｍ４Ｊについての図８内の最長の水平ボックスとして描画される
問題のエピトープ内に存在するサブエピトープ全てを除去する
％図６Ａのファイアプロットにおいて、これは以下の座標における長方形を除去することに対応する：（２６，７）を、
％その後、（２５，６）および（２６，６）（これらが、７の長さのエピトープ内の全て、即ち２３〜２８および２４〜２９であるサブエピトープを作成する）
％その後、（２５，５）（２６，５）（２７，５）（これらもまた、７の長さのエピトープ内の全てであるサブエピトープを作成する）
％その後、（２４，４）（２５，４）（２６，４）（２７，４）
％その後、（２４，３）（２５，３）（２６，３）（２７，３）（２８，３）
％その後、（２３，２）（２４，２）（２５，２）（２６，２）（２７，２）（２８，２）
％そして最後に（２３，１）（２４，１）（２５，１）（２６，１）（２７，１）（２８，１）（２９，１）、を除去する
％対応する「切断された円錐（ａｂｌａｔｅｄｃｏｎｅ）」を有するプロットは、図１６において（Ａ）から（Ｂ）への移行部にある。本発明者らは、長さ４のエピトープまで切断工程を続けるため、より多くのエピトープ、ことによるとオーバーラップしたものが、見出される
ｗｐがヒットであれば、終了
ｗｐについて終了
ｗｓについて終了

％図６Ａの２Ｍ４Ｊについて、最初の切断の後（本発明者らが託された次に大きなエピトープが（２７，６）、またはエピトープ［２５２６２７２８２９３０］（最初のエピトープとオーバーラップした表１内の残基２５〜３０）である

％対応する円錐が図１６で（Ｂ）から（Ｃ）への移行部において切断されていることが認められ得る

％本発明者らは、長さ３のエピトープまで（３を含む）、切断工程を反復する

％どの結果が、３以上の長さのエピトープ予測の組であるか
％これらのエピトープは、表１および図８に示される

Claims

タンパク質における１つまたは複数の候補エピトープのコンピュータベースの予測のための方法であって、
コンピュータシステム上にコンホメーションサンプリングエンジンを提供するステップ；
前記コンピュータシステムにおいて、前記コンホメーションサンプリングエンジンと共に使用するのに適したタンパク質のモデルを得るステップであって、得られたタンパク質モデルがネイティブ構造を含み、任意選択で、タンパク質のモデルを得ることは、タンパク質モデルのデータベースから前記タンパク質モデルを得ることを含んでもよい、ステップ；
前記コンピュータシステムにより、集団座標に基づくバイアシングポテンシャルを適用して前記タンパク質モデルにバイアスをかけるステップであって、前記バイアシングポテンシャルが前記コンホメーションサンプリングエンジンに強制的に順次、前記タンパク質モデルをネイティブ構造から最新構造へ少なくとも部分的にアンフォールディングさせ、前記バイアシングポテンシャルが、前記タンパク質モデルの少なくとも実質的部分に全体的に適用されて、前記タンパク質モデルの実質的部分の中でアンフォールディングが起こる場所に関して偏らない、ステップ；および
前記コンピュータシステムにより、前記最新構造を分析して、１つまたは複数の候補エピトープを同定するステップであって、前記１つまたは複数の候補エピトープが、局所的なアンフォールディングの印を呈する、ステップ、
を含む、方法。
前記タンパク質のモデルを得るステップが、前記タンパク質モデルのための第一の構造を得ることと、次いで、前記コンピュータシステムにより前記タンパク質モデルのための前記第一の構造を修飾して前記タンパク質モデルのためのネイティブ構造を作成することと、を含み、
任意選択で、
（Ａ）前記タンパク質モデルのための前記第一の構造を修飾して前記タンパク質モデルのためのネイティブ構造を作成することは、前記コンピュータシステムにより前記タンパク質モデル上での平衡化シミュレーションを実施することを含んでもよく、前記平衡化シミュレーションは、前記第一の構造で開始して、前記第一の構造を変換して前記ネイティブ構造を作成し；任意選択で、前記タンパク質モデル上での平衡化シミュレーションを実施することは、前記第一の構造を有するタンパク質モデルを、一定の粒子数、一定圧力および一定温度のうちの１つまたは複数を特徴とするモデル環境に供することを含んでもよい；あるいは
（Ｂ）前記タンパク質モデルのための前記第一の構造を修飾して前記タンパク質モデルのためのネイティブ構造を作成することは、１つまたは複数の不足した残基を前記第一の構造に付加して前記ネイティブ構造を作成することを含んでもよく、前記ネイティブ構造は全長の一次配列に対応する、
請求項１に記載の方法。
前記集団座標に基づくバイアシングポテンシャルを適用して前記タンパク質モデルにバイアスをかけるステップが、前記コンピュータシステムにより、複数の時間ステップにわたり前記タンパク質モデル上で不連続時間シミュレーションを実施することを含み、前記不連続時間シミュレーションが、前記タンパク質モデルのためのネイティブ構造で開始して、前記複数の時間ステップのうちの各特定の時間ステップにおいて、前記特定の時間ステップについて前記タンパク質モデルの対応する最新構造を作成する、請求項１または２に記載の方法。
前記複数の時間ステップにわたり前記タンパク質モデル上で不連続時間シミュレーションを実施することが、前記コンホメーションサンプリングエンジンに前記タンパク質モデルにおける構造変化を強制的に起こさせることを含み、前記構造変化が、前記タンパク質モデルのための前記最新構造から決定された実際の集団座標を要求して目的の集団座標を前記複数の時間ステップにわたり追跡することにより決定され、
任意選択で、
（Ａ）前記タンパク質のための前記最新構造から決定された実際の集団座標を要求して目的の集団座標を前記複数の時間ステップにわたり追跡することは、前記コンピュータシステムにより、ポテンシャルエネルギー関数に供された前記タンパク質モデルの自由エネルギーを最小化することを含んでもよく、前記ポテンシャルエネルギー関数は、少なくとも部分的に、前記タンパク質モデルの任意の構造のための前記実際の集団座標と前記目的の集団座標との間の差異を表す計量に依存する；あるいは
（Ｂ）前記タンパク質のための前記最新構造から決定された実際の集団座標を要求して目的の集団座標を前記複数の時間ステップにわたり追跡することは、前記コンピュータシステムによりポテンシャルエネルギー関数を最小化することを含んでもよく、前記ポテンシャルエネルギー関数は、少なくとも部分的に、前記タンパク質モデルの任意の構造のための前記実際の集団座標と前記目的の集団座標との間の差異を表す計量に依存し、好ましくは、前記ポテンシャルエネルギー関数を最小化することは、前記複数の時間ステップのうちの各特定の時間ステップで前記ポテンシャルエネルギー関数を最小化することを含む、
請求項３に記載の方法。
前記ポテンシャルエネルギー関数が、式：

（式中、Ｑ_ｃ（ｔ）は、前記目的の集団座標であり、Ｑは、前記タンパク質モデルの任意の構造のための前記実際の集団座標であり、ｋは、構成可能な定数である）の項を含み、
任意選択で、前記ポテンシャルエネルギー関数は、前記タンパク質モデルに内在する、あるいは前記タンパク質モデルに関連する、分子動力学的力にも依存してもよく、および／または前記ポテンシャルエネルギー関数を最小化することは、前記タンパク質モデルに内在する、あるいは前記タンパク質モデルに関連する、分子動力学的力に基づいて課された制限に供されたポテンシャルエネルギー関数を最小化することを含んでもよい、
請求項４に記載の方法。
前記不連続時間シミュレーションの複数の時間ステップにわたり、前記目的の集団座標が、前記ネイティブ構造に関連する前記実際の集団座標のものと等しい初期の目的の集団座標の値で開始して、最初のやや多数（ｓｕｂ−ｐｌｕｒａｌｉｔｙ）の時間ステップで最後の目的の集団座標の値まで変動した後、第二の複数の時間ステップの間、前記最後の目的の集団座標の値で静止し、
任意選択で、前記不連続時間シミュレーションの前記複数の時間ステップにわたり、前記目的の集団座標は、経時的に滑らかに変動してもよい；あるいは前記目的の集団座標は、前記初期の目的の集団座標の値と前記最後の目的の集団座標の値の間で経時的に一定速度で変動してもよい、
請求項４または５に記載の方法。
前記タンパク質モデルのための任意の最新構造について決定された前記実際の集団座標が、前記タンパク質モデルの実質的部分のネイティブ構造に対する前記タンパク質モデルの前記実質的部分の最新構造の全体的なアンフォールディングを示す計量を含み、
任意選択で、
（Ａ）前記タンパク質モデルのための任意の最新構造について決定された前記実際の集団座標が少なくとも一部として、前記タンパク質モデルの前記実質的部分の前記ネイティブ構造における重い原子の間のコンタクトのうちの、前記タンパク質モデルの前記実質的部分の前記最新構造における重い原子の間のコンタクトの数に基づく、あるいは
（Ｂ）前記タンパク質モデルのための任意の最新構造について決定された前記実際の集団座標が少なくとも一部として、前記タンパク質モデルの前記実質的部分の前記ネイティブ構造における重い原子の間のコンタクトのうちの、前記タンパク質モデルの前記実質的部分の前記最新構造における重い原子の間のコンタクトの数に近似するコンタクト関数に基づく、あるいは
（Ｃ）前記タンパク質モデルの前記実質的部分の前記ネイティブ構造におけるコンタクトのうちの各コンタクトについて、前記コンタクト関数が、式：

（式中、ｒ_ｉｊは、前記タンパク質モデルの前記実質的部分における原子ｉとｊの核間の距離であり、ｒ_０、ｎおよびｍは、適宜選択された定数である）を有する、あるいは
（Ｄ）前記タンパク質モデルのための任意の最新構造について決定された前記実際の集団座標が少なくとも一部として、前記タンパク質モデルの前記実質的部分の前記ネイティブ構造における重い原子の間の距離に対する、前記タンパク質モデルの前記実質的部分の前記最新構造における重い原子の間の距離に基づく、あるいは
（Ｅ）前記タンパク質モデルのための任意の最新構造について決定された前記実際の集団座標が少なくとも一部として、前記タンパク質モデルの前記実質的部分の前記ネイティブ構造の根平均二乗構造偏差（ＲＭＳＤ）に対する、前記タンパク質モデルの前記実質的部分の前記最新構造におけるＲＭＳＤに基づき、前記ＲＭＳＤが、前記タンパク質モデルの前記実質的部分のα炭素原子、および前記タンパク質モデルの前記実質的部分の重い原子、のうちの少なくとも１つの位置を通して定義される、あるいは
（Ｆ）前記タンパク質モデルのための任意の最新構造について決定された前記実際の集団座標が少なくとも一部として、前記タンパク質モデルの前記実質的部分の前記ネイティブ構造の総溶媒露出表面積（ＳＡＳＡ）に対する、前記タンパク質モデルの前記実質的部分の前記最新構造における前記ＳＡＳＡに基づく、あるいは
（Ｇ）前記タンパク質モデルのための任意の最新構造について決定された前記実際の集団座標が少なくとも一部として、前記タンパク質モデルの前記実質的部分の前記ネイティブ構造におけるバックボーン水素結合のうちの、前記タンパク質モデルの前記実質的部分の前記最新構造におけるバックボーン水素結合の数に基づく、あるいは
（Ｈ）前記タンパク質モデルのための任意の最新構造について決定された前記実際の集団座標が少なくとも一部として、前記タンパク質モデルの前記実質的部分の前記ネイティブ構造の回転半径に対する、前記タンパク質モデルの前記実質的部分の前記最新構造の回転半径に基づく、あるいは
（Ｉ）前記タンパク質モデルのための任意の最新構造について決定された前記実際の集団座標が少なくとも一部として、前記タンパク質モデルの前記実質的部分の前記ネイティブ構造の構造オーバーラップ関数に対する、前記タンパク質モデルの前記実質的部分の前記最新構造の構造オーバーラップ関数に基づく、あるいは
（Ｊ）前記タンパク質モデルのための任意の最新構造について決定された前記実際の集団座標が少なくとも一部として、前記タンパク質モデルの前記実質的部分の前記ネイティブ構造からの、前記タンパク質モデルの前記実質的部分の前記最新構造の一般化されたユークリッド距離に基づく、
請求項４〜６のいずれか１項に記載の方法。
前記タンパク質モデルの前記実質的部分の前記ネイティブ構造におけるコンタクトのうちの各コンタクトについて、前記コンタクト関数が、式：

（式中、ｒ_ｉｊは、前記タンパク質モデルの前記実質的部分における原子ｉとｊの核間の距離であり、ｒ_０、ｎおよびｍは、適宜選択された定数である）を有する、請求項４〜６のいずれか１項に記載の方法。
１つまたは複数の独立したランにおける集団座標に基づくバイアシングポテンシャルを適用して前記タンパク質モデルにバイアスをかけるステップを反復することを含み、
任意選択で、複数の独立したランにおける集団座標に基づくバイアシングポテンシャルを適用して前記タンパク質モデルにバイアスをかけるステップを反復することを含んでもよく、
任意選択で、各ランについて、前記コンピュータシステムにより、そして前記タンパク質モデルのための前記最新構造における複数の残基のうちの各残基について、前記残基の前記タンパク質のアンフォールディングを示す計量を提供する局所アンフォールディング指標を決定することを含んでもよく、
任意選択で、ランにより、そして残基により指数化されたマトリックスデータ構造を前記コンピュータシステムにより作成することをさらに含んでもよく、前記マトリックスデータ構造が、前記複数の残基のうちの各ランおよび各残基について、前記対応する局所アンフォールディング指標のための値を含む、
請求項１〜８のいずれか１項に記載の方法。
前記複数の残基のうちの各ランおよび各残基について、前記タンパク質モデルのための複数の最新構造にわたる平均に基づいて前記局所アンフォールティング指標を決定することを含み、
任意選択で、前記複数の残基のうちの各ランおよび各残基について、適用された集団座標に基づくバイアシングポテンシャルが、平均を決定した前記複数の最新構造について一定していてもよい、
請求項９に記載の方法。
（Ａ）前記タンパク質モデルのための前記最新構造における前記複数の残基のうちの各ランおよび各残基について、前記局所アンフォールディング指標が少なくとも一部として、前記タンパク質モデルの前記ネイティブ構造における前記残基のための溶媒露出表面積（ＳＡＳＡ）に対する、前記タンパク質モデルの前記最新構造における前記残基のための前記ＳＡＳＡの変動に基づく；
（Ｂ）前記タンパク質モデルのための前記最新構造における前記複数の残基のうちの各ランおよび各残基について、前記局所アンフォールディング指標が少なくとも一部として、前記タンパク質モデルの前記ネイティブ構造における前記残基のための原子間の複数のコンタクトのうちの、前記タンパク質モデルの前記最新構造モデルにおける前記残基のための原子間の損失コンタクトの数に基づく；
（Ｃ）前記タンパク質モデルのための前記最新構造における前記複数の残基のうちの各ランおよび各残基について、前記局所アンフォールディング指標が少なくとも一部として、前記タンパク質モデルの前記ネイティブ構造のための前記残基の根平均二乗揺らぎ（ＲＭＳＦ）に対する、前記タンパク質モデルの前記最新構造モデルのための前記残基の前記ＲＭＳＦに基づく；
（Ｄ）前記タンパク質モデルのための前記最新構造における前記複数の残基のうちの各ランおよび各残基について、前記局所アンフォールディング指標が少なくとも一部として、前記タンパク質モデルの前記ネイティブ構造の前記残基における複数の水素結合のうちの、前記タンパク質モデルの前記最新構造モデルの前記残基における損失バックボーン水素結合の数に基づく；
（Ｅ）前記タンパク質モデルのための前記最新構造における前記複数の残基のうちの各ランおよび各残基について、前記局所アンフォールディング指標が少なくとも一部として、前記タンパク質モデルについての前記ネイティブ構造における前記残基のための相互作用のポテンシャルエネルギーに対する、前記タンパク質モデルの前記最新構造モデルにおける前記残基のための相互作用のポテンシャルエネルギーに基づく、
請求項９または１０に記載の方法。
各ランについて、前記最新構造を分析して前記１つまたは複数の候補エピトープを同定することが、前記コンピュータシステムにより、前記タンパク質モデルのための前記最新構造を残基の複数の群に解析すること、および各群について、前記コンピュータシステムにより、前記群のための前記局所アンフォールディングの印を群のアンフォールディング評価に供することを含み、前記群における残基の全てまたは適切な閾値割合より多くが、アンフォールディングを示す局所アンフォールディングの印を有する場合には、前記群のアンフォールディング評価が、前記群についての肯定的なアンフォールディング評価結果を返し、
任意選択で、任意の１つの局所指標がアンフォールディングを示すか否かを評価することが、前記コンピュータシステムにより、前記１つの局所指標を閾値工程に供することを含んでもよい、
請求項９〜１１のいずれか１項に記載の方法。
（Ａ）前記複数の群が、様々なウインドウサイズを含み、特定の群の前記ウインドウサイズが、前記特定の群における複数の残基を参照し、任意選択で、前記複数の群の幾つかが、共通の残基を含んでもよい；
（Ｂ）前記複数の群が、群の複数の組を含み、群の各組が、共通のウインドウサイズを有し、群の各組が、前記複数の残基における前記残基の全てを含む；および／または
（Ｃ）前記タンパク質モデルのための前記最新構造における前記複数の残基のうちの各ランおよび各残基について、前記局所フォールティング指標が少なくとも一部として、前記タンパク質モデルの前記ネイティブ構造の残基についての溶媒露出表面積（ＳＡＳＡ）に対する、前記タンパク質モデルの前記最新構造における残基についての前記ＳＡＳＡの変動に基づき、前記群における残基の全てまたは適切な閾値割合より多くが、零よりも大きなＳＡＳＡの変動（ΔＳＡＳＡ＞０）を有する場合、前記群のための前記局所アンフォールディングの印を群のアンフォールディング評価に供することが、前記群について肯定的な結果を返すことを含む、
請求項１２に記載の方法。
残基の前記複数の群のそれぞれについて、前記コンピュータシステムにより、ランの総数の閾値割合（ｆ）以上のランの数で肯定的なアンフォールディング評価結果を呈する前記残基の群を決定することに基づいて、前記コンピュータシステムにより、潜在的な候補エピトープである前記残基の群を検討することを含み、
（Ａ）任意選択で、各潜在的な候補エピトープについて、前記潜在的な候補エピトープに対応する残基の群における前記残基のための前記局所アンフォールディングの印を蓄積することを含み、任意選択で、前記残基の群における前記残基のための前記局所アンフォールディングの印を蓄積することが、前記ランの全てを通して実施され、任意選択で、各潜在的な候補エピトープのための前記蓄積された局所アンフォールディングの印が、前記潜在的な候補エピトープの強度を示す；
（Ｂ）任意選択で、前記コンピュータシステムにより、ウインドウサイズおよび群の残基参照により指数化されたマトリックスデータ構造を作成することを含み、前記マトリックスデータ構造における各エントリーが、潜在的候補エピトープと、前記潜在的候補エピトープを構成する前記残基と、場合により前記潜在的候補エピトープを構成する前記残基のための前記蓄積された局所アンフォールディングの印と、を含む；
（Ｃ）前記潜在的な候補エピトープのうちの第一の候補エピトープを同定することを含み、前記第一の候補エピトープを同定することが、最大のウインドウサイズを有する前記潜在的な候補エピトープを、前記第一の候補エピトープになるように選択することを含み、任意選択で、前記第一の候補エピトープを同定した後、前記潜在的な候補エピトープから前記第一の候補エピトープおよび前記第一の候補エピトープのサブエピトープを除去して、候補エピトープとしてのさらなる検討のために減少された潜在的な候補エピトープの組を得ることを含み、前記第一のエピトープの前記サブエピトープが、前記第一の候補エピトープよりも小さく、前記第一の候補エピトープにも含まれる残基のみを含み、任意選択で、前記減少された潜在的候補エピトープの組の中の前記最大ウインドウサイズが、閾値最小サイズ以下になるまで、
前記減少された潜在的候補エピトープの組の中で最大のウインドウサイズを有する潜在的候補エピトープを次の候補エピトープになるように選択することを含む、前記減少された潜在的候補エピトープの組のうちの前記次の候補エピトープを同定するステップと、
前記次の候補エピトープおよび前記次の候補エピトープのサブエピトープを、前記減少された潜在的候補エピトープの組から除去するステップであって、前記次のエピトープの前記サブエピトープが、前記次の候補エピトープよりも小さく、前記次の候補エピトープにも含まれる残基のみを含む、エピトープの群を含む、ステップと、
を反復することを含む、
請求項１２または１３に記載の方法。
（Ａ）前記タンパク質が、凝集構造であり、前記ネイティブ構造が、前記凝集構造のペプチド鎖により呈されたネイティブ構造を含む；
（Ｂ）前記タンパク質が、推定フォールディング構造を有する一本鎖ポリペプチドである；
（Ｃ）前記タンパク質モデルの前記実質的な部分が、前記タンパク質の全てを含む；
（Ｄ）前記タンパク質モデルの前記実質的な部分が、境界構造を除く前記タンパク質モデルの全てを含む；および／または
（Ｅ）前記タンパク質が、凝集構造であり、前記タンパク質モデルの前記実質的な部分が、前記凝集構造の端部にある境界ペプチド鎖を除く前記凝集構造に対応する前記タンパク質モデルの全てを含む、
請求項１〜１４のいずれか１項に記載の方法。
前記タンパク質が、凝集構造であり、前記ネイティブ構造が、前記凝集構造のペプチド鎖により呈されたネイティブ構造を含み、各ランについて、前記最新構造を分析して前記１つまたは複数の候補エピトープを同定することが、前記コンピュータシステムにより、前記タンパク質モデルのための前記最新構造を残基の複数の群に解析すること、および各群について、前記コンピュータシステムにより、前記群のための前記局所アンフォールディングの印を群のアンフォールディング評価に供することを含み、前記群における残基の全てまたは適切な閾値割合より多くが、前記凝集構造における任意のペプチド鎖についてのアンフォールディングを示す局所アンフォールディングの印を有する場合には、前記群のアンフォールディング評価が、前記群について肯定的なアンフォールディング評価結果を返す、請求項９〜１５のいずれか１項に記載の方法。
タンパク質内の１つまたは複数の候補エピトープのコンピュータベースの予測のためのシステムであって、
コンピュータシステム上にコンホメーションサンプリングエンジンを提供するステップ；
前記コンピュータシステムにおいて、前記コンホメーションサンプリングエンジンと共に使用するのに適したタンパク質のモデルを得るステップであって、得られたタンパク質モデルが、ネイティブ構造を含む、ステップ；
前記コンピュータシステムにより、集団座標に基づくバイアシングポテンシャルを適用して前記タンパク質モデルにバイアスをかけるステップであって、前記バイアシングポテンシャルが、前記コンホメーションサンプリングエンジンに順次、前記タンパク質モデルを強制的にネイティブ構造から最新構造に少なくとも部分的にアンフォールディングさせ、前記バイアシングポテンシャルが、前記タンパク質モデルの少なくとも実質的部分に全体的に適用されて、前記タンパク質モデルの前記実質的部分の中でアンフォールディングが起こる場所に関して偏りがない、ステップ；
前記コンピュータシステムにより、前記最新構造を分析して、１つまたは複数の候補エピトープを同定するステップであって、前記１つまたは複数の候補エピトープが、局所的なアンフォールディングの印を呈する、ステップ、
を含む方法を実施するように構成された１つまたは複数のコンピュータを含む、システム。
コンピュータシステムにより実行された場合に前記コンピュータシステムに請求項１〜１７のいずれかの方法を実施させる非一時的なコンピュータで読み取り可能な指令を含む、コンピュータプログラム製品。