定義
親和性:一方が標的で他方がリガンドである2つの化学成分が互いに相互作用するとき、複合体を形成する。複合体を形成するリガンドおよび標的の性質は、結合親和性または単に親和性と呼ばれる。
DDG:1つ以上のアミノ酸の変異の際のDGの変化であるデルタ−デルタGであり、変異のタイプは本文中で特定される。ここでは、Rosettaスコアリング関数を使用したため、Rosetta単位(Rosetta Units、「RU」)で表される。これは、Rosettaスコアリング関数が使用されたためである。
DG:デルタGは、標的へのリガンドの結合時の自由エネルギー変化である。ここでは、Rosettaスコアリング関数を使用したため、RUで表される。
官能基:リガンドと標的との間の相互作用の一部を再現するアミノ酸の一部。
ホットスポット(またはL−ホットスポット):リガンドとその標的との相互作用、および標的/リガンド複合体の形成に、高度に関連すると考えられるペプチドまたはタンパク質リガンドにおける1つ以上の完全な残基。
ホットスポットレシーバ:標的とそのリガンドとの相互作用、および標的/リガンド複合体の形成に関連すると考えられる標的における1つ以上の残基。
SASA:標的へのリガンドの結合に埋もれた溶媒露出面積。
スキャフォールド:D−リガンドを設計する出発点として使用される既知の配列および/または構造のL−タンパク質。
スコアリング関数:分子座標の関数であり、結合親和性を近似することを目的とする数学的表現。スコアリング関数は、潜在的な結合剤を非結合剤と区別するために用いられる。スコアリング関数の結果は、スコアリング関数のタイプに応じて、最小化または最大化されなければならない「スコア」と呼ばれる実数である。
仮定ホットスポット:計算的または実験的手法を介して、その側鎖と標的との相互作用から、結合親和性の重要な部分を占めると考えられる複合体中のアミノ酸のリスト。
ポーズ:受容体タンパク質の結合ポケット内のリガンドの三次元配向。ポーズは、X線結晶学などの実験、またはインシリコでのモデリング(例えば、ドッキング)から得ることができる。
以下の詳細な説明では、本明細書の一部を形成する添付の図面を参照する。図面において、同様の符号は、文脈で別途指示しない限り、概して同様の構成要素を特定する。詳細な説明、図面、および特許請求の範囲に記載された例示的な実施形態は、限定を意味するものではない。本明細書に提示される主題の精神または範囲から逸脱することなく、他の実施形態が利用されてもよく、他の変更が行われてもよい。本明細書に一般的に記載され、図示されている本開示の態様は、広範囲の異なる構成で配置、置換、組み合わせ、分離、および設計することができ、これらのすべてが本明細書で明示的に企図されていることは、容易に理解されよう。
一般的に、本発明は、標的タンパク質に結合することができるタンパク質およびポリペプチドの合成設計の分野に関し、より詳細には、L−アミノ酸で構築される標的タンパク質に結合するD−アミノ酸を含むタンパク質およびポリペプチドの合成設計に関する。本発明はさらに、タンパク質およびポリペプチドを設計および選択するための計算システムおよび計算方法、ならびにデザイナータンパク質およびポリペプチドと標的タンパク質との間の結合相互作用を最適化する計算方法に関する。本発明は、標的のサイズまたはD−タンパク質中の標的エピトープを構築する能力によって制限されないD−リガンドを設計する方法を含む。さらに、本発明は、予防剤、治療剤または診断剤としてのそのようなデザイナータンパク質の使用に関する。本明細書に記載の発明に従って設計されたデザイナータンパク質およびポリペプチドは、1つ以上のD−アミノ酸を含み、標的とのリガンドとして作用し、したがって本明細書では「D−リガンド」と呼ばれる。
一実施形態では、本発明の計算システムおよび方法で設計されたD−リガンドは、疾患または恒常性において役割を果たす分子の活性に干渉する予防剤および/または治療剤として機能し得る。この干渉は、その特定の標的分子および/またはその特定の標的分子が相互作用する分子の1つの機能の調節(例えば、阻害または活性化)をもたらす標的分子へのD−リガンドの結合を含む。標的分子は、非限定的な例として、ポリペプチド、タンパク質、核酸、脂質またはグリカンであってよく、細胞の内部および/または外部に位置し得る。D−リガンドは、ホルモン、サイトカインならびに予防剤および/または治療剤として使用される抗体に見出され得る特性を用いて設計されることによって、多くの異なる疾患を予防および/または治療するように構成され得る。抗体、ホルモン、サイトカインまたは他のタンパク質と同様の特性を有するように設計されたD−リガンドは、標的(例えば、受容体タンパク質)に結合し、活性化または阻害シグナルを誘発することができ得、または他の分子(例えば、他のタンパク質)に結合し、それによりその分子の活性に影響を与え得る。
一実施形態では、計算システムおよび方法で設計されたD−リガンドは、D−リガンドおよび標的が結合相互作用に有用な大きな表面を有し得る標的との、タンパク質−タンパク質相互作用(PPI)を有するように設計することができ、より高い特異性およびより低いオフターゲットの結合および関連毒性をもたらす。D−リガンドはしばしば小分子よりも大きく、それにより、サイズがより大きいことに起因して、結合領域は小分子の結合領域とは異なる。D−リガンドは、標的の平坦な表面への結合を可能にする、より大きな相互作用領域を含むことができ、一方、小さなサイズの化学物質は、より深いポケットまたは溝における相互作用を要する。D−リガンドは、長い半減期を有するように設計され得る。D−リガンドは、本質的に、L−アミノ酸のみを有するL−リガンドと比較して、タンパク質分解切断に対して感受性がより低く、免疫原性がより低い。したがって、D−リガンドは、改善されたバイオアベイラビリティおよび半減期、ならびに長期間の反復投与の機会を有し得る。本発明の方法は、D−リガンドについてインビトロでスクリーニングすることができる、インシリコでのD−タンパク質ライブラリを設計する技術を提供する。この設計法は、102の小さな複雑度を有するライブラリからD−リガンドを生成するのに十分良好であり、合成およびスクリーニングすることができる。より大きなライブラリは化学合成を介してアクセスすることが困難であるため、これは方法の適用にとって非常に重要である。効率的な設計アプローチがないことが、一般的な疾患標的に対するD−タンパク質が今まで同定されてこなかった理由である。
一実施形態では、本発明は、標的と結合するD−リガンドをインシリコで設計するための計算システムおよび計算法に関する。標的は、リガンドと相互作用することができる任意のタイプのタンパク質またはその一部であり得、非限定的な例としては、L−タンパク質受容体、またはより詳細には、L−タンパク質細胞表面受容体を含む。しかしながら、標的は、ホルモン、酵素、構造、防御、貯蔵、輸送、受容体、収縮、または他のタンパク質などのL−タンパク質であってもよい。L−タンパク質またはその一部である標的は、L−標的と呼ぶことができる。しかしながら、その標的は、その従来の受容体または受容体ドメインであるかどうかにかかわらず、任意のタイプのタンパク質またはその一部であり得る。D−リガンドは、任意のL−標的またはその一部ならびに任意の標的物質(天然または合成)を標的とするように構成することができる。すなわち、D−リガンドは、ポリペプチド、タンパク質、核酸、脂質またはグリカン、もしくはその一部、またはそれらの組み合わせであるかどうかにかかわらず、任意の標的物質を標的とするように構成することができる。このように、標的は従来のタンパク質受容体でなくてもよく、標的は任意の生物学的物質またはその一部であり得る。一例では、標的は、インフルエンザウイルスヘマグルチニン(HA)またはそのステムであり得る。任意の生物学的物質が標的であり得る。しかしながら、本発明の実施形態の説明のために、標的は一般的にL−標的と呼び、D−リガンドは任意のタイプの標的物質に結合するよう設計されてもよい。
D−リガンドは、D−ポリペプチドまたはD−ポリペプチドの組み合わせにおいて配列決定されるD−アミノ酸を含み得るタンパク質またはその一部であり得る。リガンドとみなされるために、D−リガンドは標的と相互作用するものであって、すべてのD−タンパク質がD−リガンドとなり得るわけではない。D−リガンドは、構造エピトープと協働してD−リガンド系を形成する複数のD−リガンドポリペプチドを含む、D−リガンドグループまたはD−リガンド系に含まれ得る。このように、D−リガンド系は、標的と共に相互作用する構造エピトープを形成するD−リガンドポリペプチドの組み合わせを、別個にまたは連結した状態で含み得る。すなわち、D−リガンドまたはD−リガンド系は、標的の受容体ドメインと相互作用する少なくとも1つのリガンドドメインを含み得る。
一実施形態では、L−標的は、D−リガンドの少なくとも1つのD−ポリペプチドと相互作用し、会合する少なくとも1つのL−ポリペプチドを含む。L−標的は、D−リガンドと相互作用し会合する受容体ドメインを提供する三次元立体構造で自らを配置するL−アミノ酸を有し、D−リガンドは、L−標的のL−アミノ酸と会合する、対応の三次元立体構造で自らを配置するD−アミノ酸を有する。このように、D−リガンドの三次元立体構造は、L−標的の三次元立体構造と相互作用し、会合する。したがって、本発明は、L−標的との結合のためにインビトロでスクリーニングすることができる1つ以上のD−リガンド(例えば、D−リガンドライブラリ)のインシリコでの計算的設計のために構成されたシステムおよび方法として簡単に説明され得る。
D−タンパク質およびそれによるD−リガンドは、通常、動物には発生せず、生体系におけるL−タンパク質よりも安定であるため、D−リガンドは、人体などの哺乳類の体内への投与に有用であり得る。D−リガンドの化学的性質は、それらがL−標的アゴニストまたはアンタゴニストとして構成されることを可能とする。例えば、D−リガンドアゴニストは、L−標的の活性を促進し得る。一方、D−リガンドアンタゴニストは、L−標的の活性を阻害し得る。また、D−リガンドは、L−タンパク質に類似したカーゴ分子に連結することができ、それにより、治療剤であるカーゴ分子または任意の他のカーゴをD−リガンドの標的受容体を有する細胞に送達するのに有用であり得る。したがって、L−標的と会合するD−リガンドには有意な用途があり得る。
本計算方法に従って設計されたD−リガンドのD−アミノ酸は、D−異性体構造にある任意のタイプの天然、非天然、必須、非必須、標準または非標準アミノ酸であり得る。そのようなタイプのアミノ酸は周知であり、それらの三次元空間配向、親水性/疎水性および電荷特性はよく研究されている。しかしながら、D−リガンドは、1つ以上のD−アミノ酸(例えば、少なくとも1つのD−アミノ酸またはD−アミノ酸配列)を含み、それにより、1つ以上のL−アミノ酸を含み得る。命名法では、D−リガンドとは、1つ以上のL−アミノ酸の可能性を有する1つ以上のD−アミノ酸の存在を示す。多くの例では、D−リガンドは完全にD−アミノ酸であり得る。いくつかの例では、D−リガンドは、D−リガンド全体に分散した1つ以上のL−アミノ酸を、個々にまたは連続して含み得る。本明細書で提供されるプロトコル下でD−リガンドを設計するため、本発明は、これらのタイプの十分に特徴付けられたアミノ酸の基礎知識、およびそれらの相対的三次元立体構造、三次元空間配向、L対応物に対する対称的フォールディング特性、親水性/疎水性および電荷のデータを利用する。しかしながら、標準的アミノ酸のみを有するD−リガンドが好ましい場合もあり得る。
図1Aは、標的110およびリガンド120を有するリガンド−標的結合環境100の概略図を示す。標的110は、ヒト体内のタンパク質、病原体のタンパク質、または任意の他のタンパク質、または特異的相互作用を介してタンパク質に結合することができる任意の標的物質もしくは分子などの任意のタンパク質であり得る。標的110は、標的110の表面上の場所であって、リガンド120が標的110と相互作用するかまたは相互作用できることが知られている、エピトープ112を含む。エピトープ112は、それぞれエピトープ112の領域におけるポリペプチド配列および物理化学的性質に起因して、またおそらく、その物理化学的特性のためエピトープ112のアミノ酸と相互作用する標的110の他のアミノ酸によって、1つ以上の三次元立体構造を含み得る。エピトープ112の三次元立体構造または構造は、リガンド120との結合に関与し得る正電荷および負電荷、水素結合、ファンデルワールス力または他の原子的相互作用によって影響され得る。ここで、エピトープ112の概略図は、突起118によって分離された、方形の凹部114と円形の凹部116とを含み、エピトープ112は、標的110の表面上に露出する任意の凹部または突起であってもよい。
本発明の一実施形態では、標的110は、1つ以上のL−ポリペプチドにおいて共に連結されてエピトープ112(例えば、L−エピトープ)を形成するL−アミノ酸を有する、L−タンパク質であり得る。エピトープ112の突起118によって分離された方形の凹部114および円形の凹部116は、後述するパラトープ122のホットスポット123を受容することから、ホットスポットレシーバ113の概略図であり得る。パラトープ122は、ホットスポット123を含むことに留意されたい。
リガンド120は、任意のタイプのリガンドであってよく、D−リガンドを調製する目的でタンパク質リガンドが本明細書に記載される。リガンド120は、標的110のエピトープ112と相互作用し、結合することができる任意のタイプのタンパク質であり得る。リガンド120の例は抗体である。リガンド120は、標的110のエピトープ112と相互作用して結合するリガンド120の表面上の場所であるパラトープ122を含み得る。パラトープ122は、エピトープ112に結合するときに結合エネルギーに寄与する(例えば、顕著に寄与する)パラトープ122の部分である、ホットスポット123を含む。ここで、ホットスポット123は、凹部126によって分離された、方形の突起124および円形の突起128によって概略的に表されている。例示のため、パラトープ122の凹部126によって分離された方形の突起124および円形の突起128を、エピトープ112の突起118によって分離された方形の凹部114および円形の凹部116とマッチさせて嵌合し、環境100a中に示す。パラトープ122とエピトープ112との結合は、リガンド120の標的化および標的110との結合を促進する。図1A〜1Bは、リガンド−標的の会合および結合の概略図を提供するが、これは本発明によって設計されるD−リガンドに望ましい相互作用の代表である。したがって、本発明は、L−標的(例えば、110)と結合するD−リガンド(例えば、120)の計算的設計を可能とし得る。図1Bは、エピトープ112およびパラトープ122の結合の拡大図を示す。
一実施形態では、D−リガンドを設計する方法は、L−標的タンパク質に結合する抗体(L−抗体とも表示される)についての情報(例えば、実験データ)を用いる。このように、開始情報は、2つの異なるL−タンパク質である、L−抗体およびL−標的間の複合体の構造から得ることができる。一例では、情報は、データバンクから入手可能な実験データである。L−抗体およびL−標的について入手可能な実験データから、コンピュータデータ処理および操作プロトコルは、L−標的に結合する1つ以上のD−リガンドに到達し得る。D−リガンド設計法のプロトコルは、D−リガンドライブラリに含まれ得るL−標的と結合する、複数のD−リガンドを生じることが好ましい。設計されたD−リガンドは、仮想L−標的との理論的結合のために計算的に分析され、インシリコでスクリーニングされ得る。D−リガンドライブラリから1つ以上のD−リガンド(例えば、リードD−リガンド)を優先させるための基準が決定されると、これらのリードD−リガンドは、L−標的との結合のためインビトロで、および/または種々のスクリーニングアッセイにおいてインビボで、合成および試験され得る。したがって、D−リガンドを設計する方法は、インシリコ設計プロトコル、およびD−リガンドの実際の合成、およびインビボアッセイ、および/または実際のL−標的を用いたインビボアッセイを含み得る。
D−リガンドを設計する本発明の計算方法を処理する計算システムは、本明細書に記載のモジュールおよびソフトウェアを有する任意のタイプの計算システムであり得る。これらの計算システムは、D−リガンド設計法の計算関数を実行するためのコンピュータ実行可能命令を有するメモリデバイスを含み得る。計算システムは、L−タンパク質に関する特定のデータを受信することができ、データの計算操作は、D−タンパク質のアミノ酸配列を生成することができる。これは、D−アミノ酸、および任意選択的にいくつかのL−アミノ酸を含む配列を含み得る。本発明は、L−タンパク質標的を標的とするD−タンパク質リガンドを設計するために実施することができる様々な計算プロトコルを対象としており、そのような計算プロトコルは、D−リガンド設計について本明細書で提供される概念の下で変更され得る。したがって、計算システムは、D−リガンドを設計するためのインシリコ法を実施するために用いることができる。一例では、計算プロトコルは、L−標的と結合するL抗体の実際の相互作用から得られたデータで処理することができ、実際の相互作用は、析出した結晶の構造からのデータまたは他の実験データから得ることができる。
図2Aは、ステップA−データ取得を示し、ステップA1−初期化;ステップA2−データ同定;およびステップA3−計算システムデータ入力、が含まれる。これらのステップおよびサブステップは、以下で説明される。図2Bは、ステップA−データ取得などの、図2Aの計算法を実行することができる計算モジュールを有する計算システム299を示す。
図2Bは、図2Aのステップを実行するように構成されたデータベース201および計算モジュールを有する計算システム299を示す。具体的には示されていないが、計算システム299は、本明細書で説明される方法ステップのいずれかを実行するように構成された計算モジュールを有することができ、任意の方法ステップへの言及はまた、その方法ステップを実行するように構成されたモジュールへの言及でもある。計算モジュールは、データ記憶デバイス(例えば、メモリデバイス)、ソフトウェア、ハードウェアなどの任意の組み合わせとすることができる。示されるように、計算システム299は、サブモジュールに結合され得る、またはサブモジュールを含み得る、データ取得モジュール290を含む。データ取得モジュール290は、ステップAまたは他の方法ステップに関連して説明される原理に従ってデータ取得プロトコルを実装するように構成され得る。また、本明細書で説明する方法ステップに関連して説明される原理に従って初期化プロトコルを実装するように構成され得る初期化モジュール291も含まれる。データ同定モジュール292は、本明細書で説明する原理および方法のステップに従ってデータ同定プロトコルを実装するように含まれ、構成され得る。さらに、計算システム299は、方法ステップに関連して本明細書に記載される原理に従って計算システムへのデータ入力を実行するように構成される計算システムデータ入力モジュール294を含むことができ、これは、人間、コンピュータ、またはデータベースソースからの手動または自動データ入力を含み得る。
図2Aでは、タンパク質L−標的110と結合してL−標的/L−リガンド複合体140を形成するL−リガンド(例えば、L−抗体)130のデータ取得(例えば、実験分析および/または実験データバンク)を行う、ステップA(例えば、ステップA−データ取得)が示される。すなわち、L−リガンド130、L−標的110、および/またはL−リガンド/L−標的複合体140は、インビトロおよび/またはインビボアッセイで分析して、次のアミノ酸およびポリペプチドに関する実験データを得ることができる:L−抗体リガンド130のL−パラトープ122およびL−ホットスポット123;L−標的110のL−エピトープ112およびL−ホットスポットレシーバ113;ならびにL−パラトープ122とL−エピトープ112およびL−抗体/L−標的複合体140のL−ホットスポットとL−ホットスポットレシーバのアミノ酸相互作用。これは、L−エピトープ112ホットスポットレシーバ113および/またはL−パラトープ122ホットスポット123の分析、ならびにその相互作用およびその結合を含み得る。しかしながら、このような実験データは、自動的にまたは人間による入力などからアクセスできるデータバンク内にあってもよい。特に、ステップAのデータは、三次元構造、親水性/疎水性プロファイルおよび電荷からのアミノ酸および/またはポリペプチドのデータを、単独でまたは他のアミノ酸および/またはポリペプチドに関連して、含み得る。例えば、取得できるステップAのデータには、実験からのデータであるかインシリコでのシミュレーションおよび予測からのデータであるかどうかにかかわらず、分子構造データ、変異原性データ;および結合データが含まれ得る。データ取得は、そのようなデータを取得することに加え、方法200のためのデータを同定する、人間の分子モデラーの経験に依存し得る。この段階の結果は、L−標的と複合したL−リガンドの三次元モデルであり得る。
ステップA1は、計算システムまたは計算法ソフトウェアによって行われても行われなくてもよい、初期化段階を含み得る。初期化段階は、方法を初期化するためのプロトコルを含み得る。これは方法を開始するための命令を含むことができ、この命令は、人間の分子モデラーに対するデータ取得の指示または計算システム299に対するデータベース201へのアクセスおよびデータ取得の命令であってもよい。
ステップA2は、L−リガンドの重要な接触アミノ酸を同定するためのデータ同定段階を含むことができ、L−リガンドは、ここではホットスポットとして定義され得る。L−リガンドの重要な接触アミノ酸の同定は、以下の方法のうちの1つ以上によって実施され得る:1)視覚的検査;2)変異原性データ;3)保存された相互作用の分析;および4)結合エネルギーのインシリコ予測、ならびに他の方法。
ステップA3はまた、そのようなデータを計算システム299のデータベース201に入力することを含み得る。データは、人間の入力ならびに/または他のデータベースおよび/もしくは計算システムからのデータにアクセスする計算システム299を含む任意の方法によって、データベース201に入力することができる。データは、計算システム299のデータベース201に入力され、計算システム299は、本明細書に記載されたインシリコ法に従ってデータ処理操作を実行することができる。データベース201は、仮定ホットスポットデータベースであってもよい。また、データベース201は、任意の方法ステップでアクセスして必要なデータを取得することができ、任意の方法ステップによって決定された任意のデータをデータベース201に入力することができる。したがって、計算システム299およびデータベースは、情報のために繰り返しアクセスされ、インシリコ法の間に情報が得られるに従って、その情報によって変更されてもよい。
図3は、D−リガンド220を設計するためのインシリコ法300の概略図を示す。方法300の様々なステップが示されているが、これらのステップは、別の順序で再配置されてもよく、いくつかのステップは、本明細書に記載された原理に従って省略されまたは変更されてもよい。図3では、方法300は、ステップ1(例えば、ステップ1−仮定ホットスポット);ステップ2(例えば、ステップ2−鏡像反転);ステップ3(例えば、(ステップ3−ホットスポットライブラリ生成);ステップ4(例えば、ステップ4−スキャフォールドマッチング);ステップ5(例えば、ステップ5−ヒット同定);ステップ6(例えば、ステップ6−ヒット最適化);ステップ7(例えば、ステップ7−ヒット鏡像反転);ステップ8(例えば、ステップ8−合成およびスクリーニング)を含んで示される。
ステップ1−仮定ホップスポットは、一般的に、標的/リガンド複合体140を形成するための抗体130と標的タンパク質110との間の結合、またはより詳細には抗体130のパラトープと標的タンパク質110のエピトープとの間の結合、またはより詳細にはパラトープのホットスポット123とエピトープのホットスポットレシーバ113との間の結合のデータ分析、ならびに抗体130、パラトープ、およびホットスポット123の構造的操作を含む。次いで、ホットスポット側鎖を除く抗体全体を除去することにより、抗体−標的複合体構造をインシリコで操作することができる。ステップ1は、標的とホットスポット側鎖の異なるセットとの間の複合体の多数のインシリコ変異体が生成される構造操作を含み得る。このような複合体をそれぞれ仮定ホットスポットと呼ぶ。より具体的には、図10に示すように、標的タンパク質110と相互作用するホットスポット123の側鎖のみを残すように、鋳型L−リガンド(例えば、抗体)を除去することができる。この結果、データは、L−標的110と複合したホットスポット123の側鎖の三次元モデルを含み得る。データは、変異原性または他の実験データなどのさらなる情報で補完され得る。図3は、ホットスポットアミノ酸123によって表されるただ1つの仮定ホットスポットについてのD−リガンド設計プロセスを示す。複数の仮定ホットスポットが定義されている場合、各仮定ホットスポットについて設計手順を繰り返すことができる。
ステップ2−鏡像反転は、L−ホットスポット側鎖123と複合したL−標的110の鏡像反転を含み得る。鏡像反転を実行せずに設計が行われる特定の実施形態では、ステップ2は任意選択であることに留意されたい。この操作の結果、D−標的210とミラーD−ホットスポット側鎖222および223との複合体240が得られる。図11は、鏡像反転を示す。鏡像反転は、標的−ホットスポット複合体の原子座標データを操作することによって実行される。鏡像反転は、任意に配置された任意のミラー面を介して行うことができる。
ステップ3−ホットスポットライブラリ生成は、代替ミラーD−ホットスポット側鎖、ミラーD−ホットスポット側鎖ポーズ、および標的のホットスポットレシーバと適合する立体構造を決定するステップを含み得る。これにより、複数のミラーD−ホットスポット側鎖およびミラーD−ホットスポット側鎖位置が生じ、累積的に合わせたものをミラーD−ホットスポット側鎖ライブラリと呼ぶことができる。ミラーホットスポット側鎖ライブラリは、その後、「ホットスポットライブラリ」とも呼ばれるミラーL−ホットスポットアミノ酸ライブラリを得るために、骨格再生で処理することができる。ステップ3において、ミラーD−ホットスポット側鎖222および223の配向は、様々な相互作用保存変換(図12参照)によって多様化される。一例では、天然の標的−リガンド相互作用を保存する配向のみがライブラリで受け入れられる。ミラーD−ホットスポット側鎖222および223の配向の全部または一部は、次に、側鎖から始まるアミノ酸全体(または機能的部分などの部分)を再構築するルーチンに供される(図13参照)−いわゆるバックボーン再生である。失われた骨格原子は、Cα(L−キラリティ)の反転キラリティで再構築され、「ミラーL−ホットスポットアミノ酸」または単に「反転ホットスポット」となる(図13参照)。ここで、「反転」という語は、Cαの反転したキラリティに適用される。反転ホットスポットは、L−キラリティを有するアミノ酸であるが、それらの側鎖立体構造は、各L−ホットスポットの立体構造の鏡像である。ライブラリ中の各反転ホットスポットについて、標的の構造がそれを立体的に許容する場合は常に、すべての(または一部の)利用可能な側鎖回転異性体が含まれる。骨格再生は、一般性を失うことなく相互作用保存変換の前に行うこともできることに留意されたい。次に、ホットスポット−標的相互作用を保存する方法で、ホットスポットライブラリをさらに多様化することができる。例えば、反転ホットスポットをリドッキングすることによって、または他の立体構造サンプリング技術を用いることによって行われる。この最後のステップでは、さらに改良されたホットスポットライブラリが作成される(図14参照)。最後に、ライブラリ中のすべての(または選択された部分の)アミノ酸を標的タンパク質との重複について試験し、D−標的との衝突を示すライブラリのすべての残基を除外する。ステップ3の結果、ホットスポットライブラリ中の各アミノ酸は、天然のホットスポット相互作用を保存し、標的受容体と衝突せず、標的のものに対し反転したキラリティを有する。図19において、本明細書で採用されている命名法が明らかにされている:ホットスポットアミノ酸(またはL−ホットスポット)は、鏡像反転が実行される場合、ミラーD−ホットスポットアミノ酸となる。Cαのキラル反転が実行されると、ミラーD−ホットスポットはミラーL−ホットスポットまたは反転ホットスポットになる。本方法のこのステップは、本発明の重要なステップであり、リガンドのキラリティ変化を可能にする。
ステップ4−スキャフォールドマッチングはまた、潜在的にD−標的210と結合する可能性があるL−スキャフォールドのデータベースの生成を含み得る。図15に示すように、ホットスポットライブラリをスキャフォールドのデータベースと照合して、ライブラリからすべての異なる反転ホットスポットを同時に得ることができる(参考文献の国際公開第2013/138259A2号パンフレットのように)スキャフォールドを決定する。図15の例では、ホットスポットアミノ酸のチロシンは3つの立体構造を有するが、フェニルアラニンは1つの立体構造しか有しない。チロシンの3つの立体構造のうちの1つのみが、スキャフォールド上のすべてのホットスポット(フェニルアラニンおよびチロシン)の同時グラフトを可能にする。その他、マッチしない立体構造はこのスキャフォールドでは無視されるが、別のスキャフォールドで再利用され得る。各ホットスポットが多数の立体構造を有することで、L−スキャフォールドとの良好なマッチを見出す機会が増加する。図15に示すように、マッチングプロセスにより、L−スキャフォールドとD−標的との複合体が得られる。L−スキャフォールドはホットスポットに重ね合わされ、マッチするホットスポット立体構造が選択され、L−スキャフォールドと合体される。グラフトされたホットスポットを有するその結果得られたL−スキャフォールドは、D−標的との形状相補性を高め、分子内衝突を低減し、インシリコ複合体のスコアを改善するため、再設計された周囲のアミノ酸を有することができる(図16参照)。ここで、グラフトされた反転ホットスポットを有するL−スキャフォールドは、L−スキャフォールドとD−標的との間の衝突を除去するか、または相補性を改善し、複合体のスコアを改善し得る2つの変異(バリンおよびアスパラギン酸)を受ける。その結果得られた複合体は、ステップ5でヒットとみなされる多数の基準に従うことができる。
ステップ5−ヒット同定は、さらに再設計および最適化するための設計選択を含み得る。選択された設計はヒット250と呼ばれる。ヒット250は、抗体のパラトープ123の三次元構造を維持するようにグラフトされた抗体130由来のホットスポット222および223を有するL−スキャフォールドである。ヒット250はまた、複雑な250−210スコアを改善する多数の追加変異を有する。
ステップ6−ヒット最適化は、インシリコ変異分析、繰り返しドッキング、側鎖のリパック、さらなる基準による設計品質の再評価(再スコアリング)、分子動力学、その他標的受容体に対する1つのタンパク質の結合親和性の改善を助け得る任意の他の方法によって、D−標的210と結合すると予測される最初のL−リガンドヒット250を改善することを含み得る(図17参照)。ヒット最適化の任意の時点で、抗体のパラトープ構造123との類似性が失われた場合、そのヒットはさらなる処理から無視することができる。
ステップ7−ヒット鏡像反転は、改善されたL−リガンドヒット250の、対応するD−リガンド220への鏡像反転を含み得る。
ステップ8−合成およびスクリーニングは、L−標的110と結合するD−リガンド120の合成およびインビトロスクリーニングを含むことができ、D−リガンド/L−標的特異的結合を確認する。
ステップ1の計算的ステップおよび論理フロー図を図4に示す。D−タンパク質リガンド220を設計するためのインシリコ法300のステップ1を実施するための計算システム299および対応するモジュールが、図5に関連して図示および説明される。
ステップ1は、仮定ホットスポットを決定するための標的/リガンド複合体中の重要な接触アミノ酸の同定を含み得る。ここで、仮定ホットスポットは、リガンド結合親和性または特異性に有意に寄与する可能性のあるパラトープ中の、重要なアミノ酸のセットを含み得る。ホットスポットアミノ酸のセットは、異なる方法、例えばアラニンスキャニングまたは計算的方法を用いて決定され得る。ホットスポットの数が2より大きい場合、ホットスポットアミノ酸のセットに属する異なる数および異なるタイプのアミノ酸を含む複数の仮定ホットスポットが導かれ得る。したがって、1つまたは複数の仮定ホットスポットを決定することができる。しばしば、複数の仮定ホットスポットが通常存在する。非ホットスポットアミノ酸は、それらが標的と特異的な相互作用を形成する場合、仮定ホットスポットに加えることができる。いくつかのホットスポットは、本明細書に記載の方法に基づく人間の分子モデラーによって決定され得る。異なる仮定ホットスポットは、異なるD−リガンドおよび場合によっては異なるD−リガンドライブラリにつながり得る。
仮定ホットスポットの決定は、ホットスポットである可能性が高いパラトープアミノ酸の同定を含み得る。一態様では、ホットスポットを同定するために様々な方法を用いることができ、したがって、既知のまたは開発された任意の方法を用いることができる。一態様では、ホットスポットは、通常、標的エピトープとの複数の相互作用を形成する大きなアミノ酸である。このように、ホットスポットアミノ酸をアラニンに変異させることは、場合によっては、結合親和性の有意な減少をもたらし得る。結晶構造は、潜在的なホットスポットであるアミノ酸に関する情報を提供し得る。
仮定ホットスポットの決定は、疎水性パラトープアミノ酸の同定を含み得る。一態様では、仮定ホットスポットは、最初に、ホットスポット残渣分析の第1の候補として、トリプトファン(TrpまたはW)またはフェニルアラニン(PheまたはF)などの大きな疎水性アミノ酸を含み得る。これらのアミノ酸は大きな相互作用表面を有し、複雑な境界面に埋もれた場合に結合親和性に有意に寄与する可能性がある。次に、他の疎水性アミノ酸も考えられ得る。
仮定ホットスポットの決定は、特異的相互作用に寄与する、またはホットスポットの立体構造を安定させる1つ以上の余分のパラトープアミノ酸の同定を含み得る。余分のパラトープアミノ酸は、パラトープの任意の位置、例えば、ホットスポットアミノ酸に隣接するか、またはホットスポットアミノ酸から離れて位置し得る。隣接または近位のアミノ酸は、ホットスポットから1〜30オングストローム離れていてもよく、または好ましくは1〜10オングストロームアミノ酸離れていてもよく、またはより好ましくはホットスポットに隣接していてもよい。一態様では、1つ以上の余分のパラトープアミノ酸は、隣接するホットスポットの立体構造を安定化させる隣接残基であり得る。別の態様では、余分のパラトープアミノ酸は、水素結合または塩橋を形成するアミノ酸であってもよく、または受容体との高レベルの形状相補性を有していてもよい。このように、少なくとも1つの余分のパラトープアミノ酸を仮定に加えることができる。
一実施形態では、仮定ホットスポットは、残りの天然リガンドからホットスポット側鎖を単離することを含む、ステップ1A(例えば、ステップ1A−ホットスポット側鎖の単離)を含み得る。これは、L−リガンドおよび/またはL−パラトープおよび/またはL−ホットスポットをそのアミノ酸側鎖へと処理するためのインシリコ法を含み得る。アミノ酸側鎖は未変化のままであり、三次元空間配向および互いの相対的立体構造、ならびに親水性/疎水性およびイオン特性を保持する。タンパク質骨格から切断されると、側鎖はもはやキラルではなく、それにより、ThrおよびIleを除き、LまたはDではない。リガンド構造から非ホットスポットを除去する際に、アルファ炭素が保持されるが、残りのアミノ酸骨格も除去されるので、この炭素はそのキラル特性を失う。
図10は、L−標的と相互作用するホットスポットの側鎖のみを残すように、鋳型L−リガンド(例えば、抗体)の構造を除去できることを示す。ここでは、受容体と相互作用するホットスポットアミノ酸の例が示され、アルファ炭素のキラリティが示され(L)、ホットスポットアミノ酸の側鎖はXおよびYとして示される。側鎖Xがキラルでない場合、その鏡像X’はXと同じ化学的部分であるので、X=X’となる。側鎖がキラル中心を有する場合、X≠X’である。代表的な側鎖は実際にキラルではないかもしれないが、XおよびYは、図示されたもの以外のいくつかのアミノ酸がそのような側鎖キラリティを有し得ることを示す。側鎖はまた、非標準または他の非天然または非必須アミノ酸からのものであってもよい。芳香族相互作用および水素結合相互作用は、L−標的受容体に結合したL−リガンドについて模式的に表される。次いで、仮定ホットスポットに属するアミノ酸の側鎖およびそのアルファ炭素以外のL−リガンドが除去される。側鎖はL−標的にドッキングしたままであり、その構造は保持されるが、アルファ炭素のキラル中心は除去される。
一態様では、仮定ホットスポットが選択されると、ホットスポット側鎖およびホットスポットアミノ酸アルファ炭素以外のすべてが、L−リガンドからインシリコで取り除かれる。図3に示すように、L−リガンドホットスポット側鎖123は、その天然のポリペプチド鎖から単離される。
しかしながら、一態様では、正確にこの段階でL−リガンドを除去する必要はない。以下の処理は、アミノ酸、パラトープ、またはリガンドの全体について行われ得る。このように、以下のプロセスは、ホットスポットを含む、アミノ酸、パラトープ、またはリガンドの全体について行われ得る。例えば、鏡像反転は、標的/リガンド複合体の全体について行われ得る。さらに別の態様では、L−リガンドの除去は鏡像反転の後に行われ得る。
本システムおよび方法は、ホットスポットを検出するための任意のプロセスを用いることができ、ホットスポットであることの検証を含み得る。標的との相互作用を形成するホットスポットアミノ酸を決定するためのアミノ酸ホットスポット分析には、様々な計算プロセスを用いることができる。ホットスポットは、通常、標的との複数の相互作用を形成する大きなアミノ酸である。ホットスポットをアラニンに変異させると結合親和性が有意に低下し、それにより、ホットスポットが標的との結合に関与していることが示される。仮定ホットスポットは、1つ以上のホットスポットが同定されるまで続く。
したがって、図10は、A)L−標的に結合するL−リガンドの構造の同定;B)どのアミノ酸が、L−リガンドとL−標的との結合のためのホットスポットであるか、を決定することによる、仮定ホットスポットの実行;およびC)アルファ炭素を有するホットスポット側鎖のみを残すようにしたL−リガンドの除去、を表し得る。
図4Bはまた、ステップ2−鏡像反転を示す。ステップ2における鏡像反転は、反転複合体、および標的−リガンド境界面を含む複合体の任意の一部を反転したもの、例えば、リガンド、リガンドパラトープ、リガンドホットスポットまたはリガンドホットスポット側鎖と複合した、標的またはエピトープの反転したものなど、を含み得る。例えば、異なる方法は、プロセスで使用される外部モデリングソフトウェアの性能に応じて、異なる鏡像反転を用いることができる。したがって、鏡像反転を介して処理されるエンティティは、インシリコ法300におけるさらなる処理に使用されてもよい。また、鏡像反転エンティティの組み合わせを組み合わせて、さらに処理される鏡像反転エンティティを作成してもよい。鏡像反転は、エンティティについてのデータを使用して、その空間的鏡像を生成するアルゴリズムによって実行することができる。エンティティの鏡像反転は、グラフィカルユーザインタフェースでレンダリングされてもされなくてもよい。図5の計算システム299は、ステップ2の鏡像反転法を実行する鏡像反転モジュール280を含み得る。
一般的に、ステップ2では、鏡像反転が、さらに処理される1つまたは複数のエンティティに対して行われ得る。ステップ2は、ステップ1のデータから得られたデータに基づいて行われ得る。しかしながら、追加の情報は、結晶構造データなどの公的または独自のデータからアクセスしてもよい。一例では、ステップ1における仮定ホットスポットの同定の後、L−ホットスポットを有するL−ホットスポットレシーバの複合体の三次元座標を得ることができ、次に三次元座標の鏡像反転が実行される。このように、L三次元座標は、D三次元座標に鏡像反転される。
図11は、仮定ホットスポットに属するアミノ酸側鎖の例の鏡像反転を示す。ここでは、アルファ炭素に結合した側鎖のみが示される。鏡像反転前の側鎖はXおよびYと呼ばれ、そのエナンチオマーはX’およびY’と呼ばれる。
したがって、ステップ2において、D−標的の構造を生成することができる。また、ステップ2において、L−標的および/またはL−エピトープおよび/またはL−ホットスポットレシーバまたはその側鎖の三次元座標は、D−標的および/またはD−エピトープおよび/またはD−ホットスポットレシーバまたはその側鎖の三次元座標に鏡像反転することができる。同様に、ステップ2において、D−リガンドまたはD−パラトープまたはD−ホットスポットを生成することができる。また、ステップ2において、L−リガンドおよび/またはL−パラトープおよび/またはL−ホットスポットの三次元座標は、D−リガンドおよび/またはD−パラトープおよび/またはD−ホットスポットの三次元座標に鏡像反転することができる。また、L−標的/L−リガンド複合体および/またはL−エピトープとL−パラトープの複合体の三次元座標は、D−標的/D−リガンド複合体および/またはD−エピトープとD−パラトープの複合体および/またはD−ホットスポットレシーバとD−ホットスポットとの複合体に鏡像反転することができる。ステップ2に従って実現され得るように、鏡像反転は、分子またはその部分またはその側鎖のいずれかに対して実行され得る。
一態様では、鏡像反転は、L−アミノ酸の配列(ここではL−配列と略記する)のD−アミノ酸の同じ配列(ここではD−配列と略記する)への単純な変換であり得る。ここで、L−構造は、L−配列によって規定されるタンパク質のアミノ酸の三次元座標を表し、D−構造は、D−配列によって定義されるタンパク質のアミノ酸の三次元座標を表す。L−配列を対応するD−配列に変換すると、そのL−構造の正確な鏡像であるD−構造へとフォールディングするタンパク質が生じる。
一態様では、鏡像反転は、幾何学的オブジェクトの基本的な数学的変換であり得る。これは、平面(例えば、任意の選択、この場合はxy平面)を定義し、すべてのz座標の符号を変更することを含み得る。同様に、反射変換には、xz平面、yz平面、または任意の他の平面を使用することができる。変換された分子の結果として生じるキラリティが採用される平面に依存しないことは、注目に値する。
鏡像反転プロトコルは、プロセスで採用される外部モデリングソフトウェアの性能に応じて、最も都合のよいときにいつでもインシリコ300方法内の様々な段階でリコールして実行できる。
したがって、図11は、仮定ホットスポットのL−標的と側鎖との間の複合体の幾何学的鏡像反転を表す。これには、L−標的の座標の鏡像反転変換が含まれ、L−標的のD−標的への変換、および示されるようにL−標的とドッキングしたホットスポット側鎖の鏡像反転を生じる。側鎖XおよびYはキラルであり得るので、それらの鏡像X’およびY’は異なる化学的部分であり得る。この鏡像反転プロセスは、本明細書に記載のプロトコルの任意のステップで実行することができる。また、エピトープおよびパラトープの境界面を含むリガンド標的複合体の任意の部分は、図4の方法によるさらなる処理のために反転することができる。このように、標的−リガンド境界面を含む任意の一部、例えば、リガンド、リガンドパラトープ、リガンドホットスポットまたはリガンドホットスポット側鎖と複合した、標的またはエピトープなどを、鏡像反転させてから再び反転させることができる。反転は、本明細書に記載されたステップで、またはプロトコル中の任意の時点で起こり得る。
ステップ3は、ステップ4のタンパク質構造(例えば、ホットスポットおよびスキャフォールド)の調製のためのステップを含み、ここで、反転ホットスポットは、D−標的および/またはD−エピトープのD−ホットスポットレシーバと相互作用および結合するL−ホットスポットを有する可能性があるL−リガンドを同定するため、スキャフォールド上にグラフトし得る。ステップ3および/または4において、スキャフォールドが得られ、計算システム299のデータベース201に入力され、D−標的への結合のインシリコでのスクリーニングが実行され得る。スキャフォールドはまた、例えば、データベースに既に保存されたスキャフォールドに適用される、分子動力学シミュレーション、または任意の他の立体構造サンプリング技術を実行することによる、反復設計によって得ることもできる。3D座標は、NMRおよび/または結晶構造データまたは新規生成された構造を含み得る。次いで、得られた3D座標は、分子動力学(「MD」)または他のインシリコ立体構造サンプリング技術を用いて処理され、各スキャフォールドについて代替立体構造の大きなセットを生成する。これは、任意の分子動力学(「MD」)パッケージ、例えば、GROMACS、NAMD、またはDesmondで行うことができる。
図4は、スキャフォールドに対するマッチング段階の前にホットスポットを調製するためのインシリコ法300の一部を示し、これは、図3のステップ3に対応し得る。方法300は、関与するホットスポット側鎖の化学的性質に応じて、様々なステップを含み得る。これらのステップは、ホットスポット側鎖の内部対称性を利用することによって相互作用するアミノ酸の幾何学的変換を決定するステップ3A(例えば、ステップ3A−幾何学的変換);および相互作用するアミノ酸の化学的性質を変更するステップ3B(例えば、ステップ3B−アミノ酸の変更)を含み得る。このステップはまた、ステップ3Aおよび/または3Bで同定されるホットスポット側鎖の骨格の一部または全部を再生するステップ3C(例えば、ステップ3C−骨格再生)を含み得る。
図12において、ステップ3Aは、フェニルアラニンホットスポットの例について説明され得る。フェニル環がアミノ酸の主要な相互作用基である場合、環の対称性を利用することができる。環は、環の平面に垂直な軸の周りに60、120、180、240、300および360度回転させることができ、これらの回転は、アミノ酸の残りの部分が標的と衝突しない限り、フェニル環と標的との間の相互作用を保存する。示されるように、HO基以外のチロシンを180度回転させると、標的との相互作用は保存されるが、アルファ炭素の新しい位置が生成する。
相互作用を保存するもう1つの変換は、2つのフェニル環炭素と環の中心を横切る任意の軸の周りでの180度回転である。これらの対称的変換は、いくつかの特定の側鎖に対してのみ定義できるが、他のものについては可能でない。
図12において、ステップ3Bは、標的とのホットスポット相互作用がその転換によって保存される限り、ホットスポットアミノ酸を任意のタイプの別のアミノ酸で置き換えられ得ることを示す。例えば、標的と相互作用するフェニルアラニンホットスポットのフェニル環は、ナフタレンに置き換えられてもよい。両方のアミノ酸において、相互作用するフェニル環の化学的性質は類似しており、この変換は骨格の位置にのみ影響し、標的との相互作用には影響しない。非標準アミノ酸を使用することにより、最初の相互作用が保存され、アルファ炭素が異なる位置をとることを可能にする。
ステップ3Aおよび3Bにおける変換のいずれか、またはこれらの変換の任意の数の組み合わせは、方法の次のステップで利用されるホットスポットアルファ炭素原子の位置の多様性を高める方法で行われる。ステップ3Aおよび3Bにおける変換の導入により、仮定ホットスポットで同定された本質的な相互作用を維持しながら、各ホットスポットの代替側鎖位置の大きなライブラリを生成することができる。各ホットスポット(ホットスポットライブラリと呼ばれる)につき代替立体構造を有することにより、仮定ホットスポットからのすべてのホットスポットにマッチするスキャフォールドを見つける機会を増加させることができる。側鎖の機能的部分は依然として天然の複合体の相互作用を再現しているが、側鎖の残りの部分は変更することができる。
したがって、側鎖とエピトープとの相互作用を保持しながら、アルファ炭素の異なる位置をもたらし得る任意の変換を行うことができる。これは、相互作用を保存するための、可能なすべての回転、変異などを含み得る。例えば、水素結合が存在する場合、相互作用のための角度および距離が維持され得るように水素結合相互作用が保存されるように、相互作用は保存される。相互作用のタイプに応じていくつかの変更を許容することができ、変更が大きすぎて相互作用が保存されないような場合のためにカットオフがあってもよい。このように、相互作用はある程度の可変性を有し、相互作用のタイプおよび関与する相互作用する原子に応じて、相互作用の距離および角度のカットオフを既存の実験的根拠に基づいて定義することができる。これらは、本分野において明らかに知られた限界である。複数の側鎖位置は、ホットスポット側鎖ライブラリとして視覚化することができる。
ステップ3Aは、回転などの幾何学的変換を表し、ステップ3Bは、アミノ酸構造の変化を表す。しかしながら、これらのステップの一方または両方は、任意の順序で実行されてもよい。いくつかの例では、ステップ3Aのみが実行され、他の例ではステップ3Bのみが実行され、連続で行う場合はステップ3Aまたはステップ3Bのいずれかが他方のステップの前に実行され得る。これらのステップの後、プロトコルは、生成された側鎖がD−標的および/またはD−パラトープおよび/またはD−ホットスポットレシーバと立体的に衝突するか否かを判定することを含み得る。立体的な衝突が検出されない場合、例えば、ステップ3C、ステップ3D、およびステップ4以降を通して行われるように、変換されたホットスポット側鎖がさらに処理される。立体的衝突が存在する場合、ホットスポット側鎖は除外され、さらなる処理から放棄される。ステップ3Aおよび3Bを図12に示す。図4に示すように、ステップ3Aおよび3Bの後、ステップ3C(例えば、ステップ3C−骨格再生)は、ホットスポット側鎖ライブラリに属する各側鎖が完全アミノ酸になるように骨格再生が行われるプロセスを含み得る。これは、鏡像反転された官能基を有する側鎖から開始し、任意選択的にL−標的のD−標的への鏡像反転と合わせて、L−骨格を構築することを含み得る。L−骨格は、D−標的を結合する官能基の3D構造から再生され得る。
骨格再生は、官能基を固定し、標的タンパク質のキラリティに応じて、アミノ酸骨格をLまたはD配置のいずれかで構築することによって機能する。本方法は、ホットスポット側鎖によって媒介されるタンパク質−タンパク質相互作用を保存することができると同時に、ホットスポットアミノ酸のアルファ炭素立体中心のキラリティを変化させることができる。この変換は一義的ではないので、プロセスは骨格立体構造の大きなセットを生成し、これにより、ホットスポットライブラリのサイズおよびステップ4においてホットスポットにマッチするスキャフォールドを発見する機会が増加する。図13は、骨格再生を示す。また、L−骨格は、ステップ3(例えば、ステップ3Aおよび/または3B)で生成されたすべての変異体について、ミラーを通して反転された側鎖構造から再生することができる。図は、D−標的の側鎖とエピトープとの間の元の相互作用を維持しながら、Lキラリティが再生されることを示す。
ステップ3Cは、図13に示すような骨格再生を含むことができ、これは、ホットスポット側鎖構造をアミノ酸骨格で補完することを含み得る。再生された骨格は、標的がD−ホットスポットレシーバおよび/またはD−パラトープおよび/またはD−標的全体を示す場合、常にすべてのホットスポット側鎖においてL−キラリティを有する。アミノ酸のタイプに応じて、複数の回転異性体が許容され、これらの立体構造のすべてが含まれ、これはホットスポットライブラリに属するホットスポット構造の数を増加させる。回転異性体の従来の概念は、骨格を固定することによって側鎖の位置を変化させることからなる。ここでは、代わりに、側鎖の標的との相互作用を保存するために、骨格の位置が変化する。
ホットスポットアミノ酸構造が骨格につき完了すると、そのD−ホットスポットレシーバおよび/またはD−パラトープおよび/またはD−標的との立体的衝突が試験される。ホットスポットアミノ酸の骨格のキラリティの反転は、ホットスポット側鎖が元の複合体と同じように結合することをもはや許容しない構造をもたらすことがしばしばあり得る。標的と立体的に衝突するホットスポットアミノ酸は、ホットスポットライブラリから除外される。一例では、ホットスポットアミノ酸の構造がD−標的または他のホットスポットアミノ酸と衝突する場合、そのホットスポットアミノ酸の構造は除外され得る。別の例では、分子視覚化ツールを使用して、隣接するホットスポットに属する衝突するホットスポットアミノ酸を検出し、それらのエントリを選択的に除外することができる。すべての場合において、D−標的と直接衝突しないホットスポットアミノ酸構造のみが選択され、さらなる処理のために保存される。
図4はまた、最終的なホットスポットライブラリを生成するためのステップ3D(例えば、ステップ3D−ホットスポット立体構造)を示す。このステップには、ホットスポットライブラリのすべての立体構造へのさらなる変更が含まれる。
図14は、ホットスポットライブラリのバリエーションをさらに増加させるために許容されるホットスポットアミノ酸立体構造のさらなるバリエーションを示す。この時点で、リドッキング、最小化、分子動力学などの、ホットスポットの側鎖の位置をわずかに変更し得る変換が許容される。これにより、ホットスポットアミノ酸につき数百の立体構造またはそれ以上を生成することができる。一例では、ホットスポットアミノ酸のリドッキングにより、ホットスポットライブラリのさらなる立体構造を作り出すことができる。一例では、ホットスポットライブラリは、元のホットスポット側鎖のD−標的のエピトープとの相互作用を保持する数百またはそれ以上の異なる立体構造を表し得る。
任意のホットスポットアミノ酸は、本明細書に記載されるように多様化され、さらなる処理のために選択され得る。多様化の結果、最終的なホットスポットライブラリが得られる。
ステップ3Dでは、ホットスポット側鎖とD−標的との相互作用を失うことなく、再成長したL−骨格を有するホットスポット、いわゆる反転ホットスポットの位置変更が許容される。ステップ3Dの結果は、ホットスポットライブラリにホットスポット骨格の大きなセットを含み得る。この時点で適用され得る変換としては、D−標的上のホットスポットのリドッキングが含まれる。D−標的を有するホットスポットアミノ酸の分子動力学を実施することができる。また、D−標的ホットスポットレシーバに関して、ホットスポット立体構造の立体構造サンプリングを改善することができる、任意の他の立体構造サンプリング技術を用いることができる。ホットスポット−ホットスポットレシーバ相互作用(例えば、ホットスポット−エピトープ相互作用)の保存について、ホットスポットライブラリデータベース(例えば、データベース201)に加える前に、ステップ3Dで得られたすべての立体構造を試験することができる。
一態様では、ステップ3Aおよび3Bの任意のホットスポット側鎖ならびにステップ3Cおよび/または3Dで生成されたホットスポットアミノ酸は、それらがD−標的エピトープと適切にドッキングしない場合、例えば、ドッキングが元の相互作用を再現しない場合、除外され得る。いずれのステップにおいても、ホットスポット立体構造がD−標的と衝突すると、その立体構造はホットスポットライブラリデータベースから除外される。その他の場合は、ホットスポット立体構造を保存し、さらなる処理のために選択することができる。
図4はまた、D−標的および/またはD−エピトープのD−ホットスポットレシーバと相互作用して結合するホットスポットを有する可能性があるスキャフォールドを同定するために、反転ホットスポットをL−スキャフォールド上にグラフトするためのステップ4(例えば、ステップ4−スキャフォールドマッチング)を示す。したがって、このステップで得られるスキャフォールドは、計算システム299のデータベース201に入力され、インシリコスクリーニングを継続することができる。マッチングプロセスにより、ホットスポットライブラリデータベースに記憶されている許容された立体構造の1つにおいて、仮定ホットスポットからのすべてのホットスポットを同時に取得することができるスキャフォールドが得られる。ホットスポットをスキャフォールド上にグラフトすると、元のホットスポット相互作用を模倣し、天然に存在するタンパク質に似た側鎖および骨格原子両方の立体構造を保存するように、側鎖が示され得るはずである。
一態様では、ステップ4は、A)ホットスポットとマッチするL−スキャフォールドの同定;B)さらなる処理のためのスキャフォールドを生成するための、対応するL−スキャフォールド上へのホットスポットのグラフト、を含み得る。これを図15に示す。
スキャフォールド−ホットスポットライブラリマッチングアルゴリズムに使用されるスキャフォールドはまた、例えば、データベースに既に保存されたスキャフォールドに適用される、分子動力学シミュレーション、または任意の他の立体構造サンプリング技術を実行することによる、反復設計によって得ることもできる。これは、スキャフォールドに対しホットスポットをマッチさせ、適切なスキャフォールドを選択するための、インシリコ法300の一部である。図15は、潜在的なL−スキャフォールドとマッチしたホットスポットライブラリ、およびマッチするL−スキャフォールドが選択されていることを示す。このプロセスにより、計算システム299が、ホットスポットライブラリをL−スキャフォールドとマッチさせることが可能となる。ホットスポットライブラリは、ホットスポットごとに多数の立体構造を提供することができ、これは、良好にマッチするL−スキャフォールドを見つける機会を増加させる。図15に示すように、ホットスポットごとに最もマッチするホットスポットの立体構造が選択される。しかしながら、1つのスキャフォールドのみが示されており、他のスキャフォールドは、異なる配列および三次元構造を有し得ることを認識されたい。
一般的に、低エネルギーのL−ホットスポット立体構造がステップ3において作成され、スキャフォールドとのマッチングについてスクリーニングされ得る。一例では、ここでRosettaホットスポットマッチングアルゴリズムを採用することができる。Meditパッケージなど、類似の関数を実行し、本目的に使用され得る、他のアルゴリズムもある。ホットスポットマッチングアルゴリズムは、立体的な制約から許容される場合は常に、ホットスポットをスキャフォールド上にグラフトすることを含み得る。マッチするスキャフォールドの決定は、インシリコの予測された親和性(スコア)を改善し、スキャフォールド/D−標的複合体の分子衝突を最小化するために、隣接するアミノ酸を変更することもできる。このように、マッチするスキャフォールドが同定され、さらなる処理または改良のためにヒットとして保存される。
図6に示すように、反復プロセスをスキャフォールドマッチング(例えば、ステップ4)のために実行することができる。ここでは、ステップ3で得られたホットスポットライブラリからの各ホットスポットの個々の立体構造が、スキャフォールドマッチングのために提供される。このように、ステップ4A(例えば、ステップ4A−ホットスポット立体構造の提供)は、スキャフォールド生成のためのホットスポット立体構造を提供することを含む。ステップ4B(例えば、ステップ4B−マッチするスキャフォールドのスクリーニング)は、反転ホットスポットをグラフトすることができるスキャフォールドのスクリーニングを含み得る。スクリーニングは、グラフトされたホットスポット周辺の境界面の再設計を含み得る。ステップ4Bでのスクリーニングから、データを得ることができる。データとしては、例えば、予測されるタンパク質−タンパク質複合体が挙げられ、これはランクおよびスコアされ得る。したがって、スキャフォールド設計のそれぞれに相対スコアを付与するため、ステップ4C(例えば、ステップ4C−スキャフォールドのスコア)を実行することができる。任意のタンパク質−タンパク質相互作用スコアリング関数が用いられ得る(例えば、Rosettaスコアリング関数)。スコアは、結合親和性を示し得、より高い結合親和性を有するグラフト化ホットスポットを有するL−スキャフォールドの選択、およびより低い結合親和性を有するエンティティの放棄を可能にする。したがって、低い結合親和性は、ステップ4D−低親和性の放棄において、放棄され得る。高親和性はステップ4E−高結合エネルギーの保存で保存することができる。保存された高親和性エンティティは、さらなる処理のために選択することができる。高い結合親和性および最適化された境界面を有するL−リガンドは、ヒット(またはL−ヒット)と呼ばれ、さらなる変異および変化のために用いられ得る。ステップ4A〜4Eは、計算システムのスキャフォールドマッチングモジュール284に実装することができるが、各ステップに固有のモジュールを利用してもよい。
図4はまた、マッチしたスキャフォールドのどれがヒットと呼ばれ、さらなる分析のために採用され得るかを決定するためのステップ5(例えば、ステップ5−ヒット同定)を示す。したがって、ステップ5Aは、D−標的と結合し得る潜在的なL−リガンドスキャフォールドの3D座標を得ることを含み得る。グラフトされたホットスポットを有するL−スキャフォールドの座標は、ステップ4−スキャフォールドマッチング(例えば、ステップ5A−データベースからのマッチしたスキャフォールドデータの取得)から得られる。スキャフォールドは、多数の基準および制約に基づき、さらなる分析のために選択され得る。例えば、1つの制約は、利用可能な計算リソースを含み得る。原理的には、すべての適合したスキャフォールドをさらに最適化することができるが、これは計算的に高価になる可能性がある。このため、マッチしたスキャフォールドの一部を取り除くことができる。マッチしたスキャフォールドの一部を無視することは、より有望なスキャフォールドを選択するのに役立ついくつかの基準に基づいて行うことができる。そのような基準の1つは、標的とマッチしたスキャフォールドとの間の複合体の構造に基づいてもよく、例えば、結合時の溶媒露出面積の変化の閾値を用いることができる。複合体スコアも、閾値として使用することができる。スキャフォールド中の変異数も、閾値として使用することができる。有望なヒットを選択するために使用され得るもう1つのパラメータは、スコアと変異数の比率であり得る。別の重要な閾値は、グラフトされた反転ホットスポット側鎖と元の鏡像反転ホットスポット側鎖との類似性であり得る。グラフト中に側鎖が歪んだ場合、得られたスキャフォールドは除外することができ、それ以外の場合は許容することができる。閾値の値は、利用可能な計算リソースにのみ依存する。有利性の最も低いパラメータのセットを有するスキャフォールドは排除することができる。閾値は、ステップ5B(ヒットのフィルタリング)において、マッチしたスキャフォールドのセットに対し実行され適用され得る。フィルタリングされたヒットは、ステップ5C−ヒットの保存においてさらに処理するために保存することができる。ステップ5A〜5Cは、計算システムのヒット同定モジュール285に実装することができるが、各ステップに固有のモジュールを利用してもよい。
図4はまた、ステップ5で得られたヒットを最適化するためのステップ6(例えば、ステップ6−ヒット最適化)を示す。ヒット最適化は、計算システム299において実行される1以上のラウンドの最適化プロトコルを含み得る。1回のラウンドは、1)ヒットのシーケンスおよび構造が変化しない、ヒットのD−標的とのリドッキング;2)低エネルギー側鎖立体構造の再生(リパック);3)境界面または直接の周囲での単一/二重/三重変異体の作製;4)溶解度および/または安定性を改善する変異の作製;5)環化修飾の作成;6)スコアリング関数を改善しない変異の除去;7)分子動力学またはタンパク質複合体の位相空間を探索することを可能にする任意の他の分子動力学/モンテカルロ法によるヒットの増殖、を含み得る。プロトコル1、2、3、4、および5が図17に示される。ポイント6を含む理由は、インシリコ複合体の任意の変換によって、特定の以前の変異が無意味になり得ることである。変異数をできる限り低く保ち、必要な変異のみを含めることが好ましいため、ステップ6は、ヒット最適化プロトコルのすべての点で実行することができる。プロトコル7の分子動力学は、当技術分野で一般的に知られているように実行することができる。
図8は、ヒット最適化またはD−標的と結合するためにステップ5で設計された最初のホットスポットグラフト化スキャフォールドの改善のためのインシリコ法を示し、これは図4のステップ6に対応し得る。ステップ6は、改善されたミニライブラリ(例えば、さらに改善されたスコアリング関数、溶解性、安定性または他の物理化学的性質を有する設計を含む)を開発するために、ステップ5−ヒット同定から来るヒットをさらに変更することを含み得る。ステップ6A(例えば、ステップ6A−変異の検索)は、ヒットが由来する野生型スキャフォールドとヒットとの間の変異の検索を含み得る。ステップ5のヒット同定のマッチング段階は、D−標的との結合のためのヒットスコアリング関数を改善する、ホットスポットを囲むアミノ酸へのホットスポットのグラフトおよび副次的な変異によって、変異を導入することができる。ここでは、プロトコルは、野生型スキャフォールドおよびヒットの両方の配列を単純に見て、通常のアライメントなどによって変異を特定することを含み得る。このように、最初の野生型スキャフォールドとヒットとの間の差は、ステップ6A−変異の検索で決定することができる。ステップ6Bは、対応する、野生型へ戻る変異(例えば、ステップ6B変異結合寄与の計算)と比較して、ステップ6Aで同定されたすべての変異についての結合スコアへの寄与を計算することを含み得る。スコアに対する特定の変異の寄与が無視できる程度である場合、変異は取り除かれ、その位置で野生型スキャフォールドアミノ酸が回復され得る。結合スコアへ有意に寄与する変異は保持され得る。ステップ6Bでは、すべての変異に対する寄与が計算され、有意性の最大から最小までソートされる。結合親和性は、様々な方法およびソフトウェアで推定することができる。非限定的な一例では、この方法は、DDGスコア計算モジュールとしてRosettaで実行することができる。しかしながら、任意の親和性計算モジュールまたはプロトコルを使用してもよい。一例では、ヒットとD−標的との間の結合親和性を予測する任意の他の方法を用いることができる。計算された結合親和性はDGと呼ぶことができ、変異の際のDGの変化はDDG=DG_mut−DGと呼ぶことができる。−0.5RUを超えるDDGが除外としてマークされ、−2.0RUを超え、−0.5RU未満のDDGが重要としてマークされ、−2.0RU未満のDDGがホットスポットとしてマークされる。ステップ6Cは、すべての除外された変異(例えば、DDG>−1)が野生型へ戻る(すなわち、BTW)変異である構造を含む設計の作成を含む(例えば、ステップ6C−有意な変異を伴うヒットの作成)。ステップ6Dは、重要(すなわち、ホットスポットおよび重要)な変異のみを伴うヒットから出発して、重要な変異としてマークされた位置に単一のBTW変異を実行する、変異体の生成を含む(例えば、ステップ6D−変異生成)。ステップ6Dは、ステップ6E−重要な変異の除去の反復において、重要な変異が残らなくなるまで反復することができる。この結果、ホットスポット変異のみを含むヒットが得られる。次に、ヒットを含むホットスポット変異のみを変異させて、野生型スキャフォールドが達成されるまで、単一のBTW変異によりホットスポットを除去することができる(例えば、ステップ6F−ホットスポット変異の除去)。BTWホットスポット変異のすべての組み合わせが含まれ、保存される。これらの変異体が結合することは想定されていないため、以下のインビトロ実験の陰性対照となる。すべての変異体の3D構造は、Maestro、Rosetta、Pymol、MOEのようなすべての分子モデリングパッケージに存在する標準的なソフトウェアの方法を使用して生成される。このようにして得られた、15個を超える変異および/または50%を超えるアミノ酸の変異、好ましくは12個を超える変異および/または40%を超えるアミノ酸の変異、および最も好ましくは10個を超える変異および/または30%を超えるアミノ酸の変異を有するヒット設計のセットが除外され、それにより、過剰に変異したヒットおよび設計が除外される(例えば、ステップ6G−過剰に変異したヒットの除外)。このパラメータによって、ライブラリのサイズは合理的な数に減少する。ここで、ヒットが多すぎることは制限要因になり得る。15個以下の変異および/または50%以下のアミノ酸の変異、好ましくは12個以下の変異および/または40%以下のアミノ酸の変異、および最も好ましくは10個以下の変異および/または30%以下のアミノ酸の変異を有するヒット設計が選択される。
過剰に変異したヒット設計を除外した後、本方法は、鏡像反転したD−リガンドに変換することができる、さらに改善されたリガンドのセットを生成するためのプロトコルから始まる。
ステップ6Hは、より親和性の高いリガンドを見出すために、選択されたヒット設計を変異させることを含み得る(例えば、ステップ6H−より高い親和性のための変異)。図17を参照。これは、パラトープ、ホットスポットおよび/または側鎖において単一および/または二重および/または三重変異により選択されたヒット設計を変異させることを含むことができ、これは、反復およびD−標的と複合して最適化されたスコアリング関数について分析することができる。最も改善された結合スコアを有する複合体が同定される。スコアリング関数が、開始時のヒットと比較して、なされた変異につき好ましくは5%、より好ましくは8%、最も好ましくは10%改善された場合、変異したヒット設計が許容され得る。
ステップ6Iは、最も高い予測された親和性を有するステップ6Hからの変異したヒットを変更するためのプロトコルを含み得る(例えば、ステップ6I−最も親和性の高い変異したヒットの変更)。ヒットは、所与のヒットスキャフォールドクラス内の最大スコアの50%〜100%、より好ましくは60%〜100%以内、および最も好ましくは70%〜100%以内の閾値で選択することができる。この閾値は、さらなる改変のためにスキャフォールドファミリーにつき最もよく設計されたヒットのみを選択するために用いられる。選択されたヒットは、任意のドッキングアルゴリズム、およびパラトープ内に単一および/または二重および/または三重変異を有し、ステップ6Hを介して再び処理することによって再設計されたパラトープを用いてリドッキングすることができる。得られたヒットを最適化ヒットという。
任意選択的に1つ以上の反復を有する、ステップ6Iが実行されると、様々な一般的およびシステム固有の基準を満たさない設計を除外することができる。変更された、変異したヒット設計は、過剰に変異したヒットを除外することによって改良することができる(例えば、ステップ6J−過剰に変異したヒットの除外)。過剰に変異したヒットは、15を超える変異および/または50%を超える変異、好ましくは12を超える変異および/または40%を超える変異、および最も好ましくは10を超える変異および/または30%を超える変異を有する場合、除外することができる。小さな相互作用表面または400平方オングストローム(Å2)未満、より好ましくは600Å2未満、最も好ましくは800Å2未満のSASAを有する変異体は無視することができる。
最適化されたヒットは、閾値よりも小さいパラメータ値を有する設計を除去することによって、さらに改良することができる。ここで、パラメータは、予想された結合親和性(例えば、閾値)の5%未満、好ましくは10%未満、および最も好ましくは15%未満である、野生型スキャフォールドと比較した変異数あたりの、インシリコで予測された結合親和性であり得る(例えば、ステップ6K−非効率な結合剤の除去)。
最適化されたヒットは、ステップ6L−非標準アミノ酸の標準アミノ酸への変異のように、非標準アミノ酸(「NCAA」)のいずれかを標準アミノ酸(「AA」)に戻すことによってさらに改良され得る。この変化がインシリコで予測される結合エネルギーまたは親和性に有意に影響しない場合、標準アミノ酸が好ましいものであり得る。ここで、インシリコで予測された結合親和性が、ファミリーあたりの最大スコアの5%未満、より好ましくは8%、または最も好ましくは10%、変異により増加する場合、プロセスはステップ6M−変異体の許容および除去において、NCAA変異体を許容しおよび除去することができる。
改善されたヒット設計が改良されると、最適化されたヒットファミリーが特定の結合親和性/スコアリング関数閾値に達したかどうかの決定を行うことができる。これはステップ6N−結合親和性閾値の取得であり得る。この閾値は、用いられる特定のスコアリング関数に依存し、また、合成され得る配列の数に基づいて決定され得る。より多くの配列を合成するためのリソースがある場合、閾値はより許容的であり得る。いくつかのエピトープは平均でより良いスコアをもたらすので、D−標的エピトープに依存して決定することもできる。閾値は、スキャフォールドファミリーごとに到達する最高のスコアに基づいて定義することができる。全最高スコアを参照として使用することができ、そのスコアの50%、より好ましくは60%、および最も好ましくは70%に到達したスキャフォールドファミリーのみが同定される。スキャフォールドファミリーが閾値に達したか。答えが「いいえ」の場合、プロセスはステップ6Hから始めて反復することができる。答えが「はい」の場合、プロセスは続行できる。
継続したプロセスは、セットが大きすぎると判定された場合、変異体の数当たり最も低いスコア(例えば、score/n_mut)を有する構造を除去することによって、最適化されたヒットのさらなる改良を含むことができ、これは、ステップ6Oであってもよい(例えば、ステップ6O−最低スコア/変異体の除去)。これは、所望の数の構造が得られるまで行うことができる。
したがって、特定の最適化されたヒット設計を選択することができる(例えば、ステップ6P−ヒットセットの選択)。
ステップ6A〜6Pは、計算システムのヒット最適化モジュール286で実行することができるが、各ステップに固有のモジュールを利用してもよい。
これらの異なるステップはすべて、座標のわずかな変化によるヒットのロバスト性の証明、境界面でのアミノ酸の変異による可能な変異体のパネルの提供、およびスコアの最適化を目的として、様々な順序で実施することができる。最適化段階におけるバリエーションは、良好なスコアを維持しながら、ヒットを変調して実際に変異が少ないようにすることを含み得る。一部では、変異数がスキャフォールドのミスフォールディングのリスクを増加させるため、より少ない変異が有益であり得る。
できる限り少ない変異を有することは、結合親和性と相関し得るスコアを改善することに次いで、最適化段階の目標であり得る。このように、特定の構造におけるフォールディングの確率を考慮しないスコアを単に最適化するのではなく、より高いスコアおよびより低い変異が望ましい、スコア/変異率を最適化することが有利であり得る。
一態様では、ヒットが高度に疎水性である場合、水溶性を増加させる特定の変異を導入することが有利であり得る。これらの水溶性変異は、D−標的のエピトープと相互作用しない位置に導入することができる、より水溶性のアミノ酸(例えば、リジンまたはグルタミン酸)であり得る(図17、改変4)。水溶性であることは、ヒット、および最終的にはD−リガンドにとって、有利であり得る。このように、水可溶化アミノ酸への変異は、それらが結合相互作用を妨害しない場合、有利であり得る。一態様では、N末端および/またはC末端に水溶性を増加させるアミノ酸を導入することが有益であり得る。
一態様では、環化導入変異を用いることができる。これらのアミノ酸は、スキャフォールドの折りたたみ構造を安定化させるために、他のアミノ酸または骨格末端と共有結合を形成することができる(図17、改変5)。
さらに、ステップ6は、分子動力学、分子最小化を実行するか、または他の位相空間サンプリング方法を使用することによって、最適化されたヒット−D−標的複合体の構造に直接作用し得るステップ−分子構造最適化を含み得る。実行する場合、図8のプロトコルのステップの前または後に、または図8のプロトコル中または間の任意の時点で行うことができる。例えば、任意の分子構造最適化は、野生型に戻る変異、リドッキング、単一/二重/三重変異の設計、またはステップ6の他のプロセスのループの前に行うことができる。分子構造の最適化は、変異数ごとに結合スコアが増加するヒットをもたらし得る。一態様では、ステップ6のヒット最適化は、野生型に戻る変異、リドッキング、および変異の設計(例えば、単一変異の設計、二重変異の設計および/または三重変異の設計)のループを含むことができ、野生型に戻る変異、リドッキングおよび変異の設計は、ループごとに任意の順序で任意の回数実施することができる。ループは図8に示す任意のステップを実行し、前のステップにループバックできる。その後、ヒット最適化のために野生型に戻る変異、リドッキングおよび変異の設計を実施することができる。本方法では、任意の数のヒット最適化ループが生じ得る。ヒット最適化ループは、変異数当たりの結合スコアが増加した最適化ヒットを得るために、記載された任意の順序および任意の方法で実行することができる。最適化されたヒットの変異数あたりの結合スコアを最大にすることが最適である。ヒット最適化プロトコルを実行することにより、ヒット集団はそれ以上変化しないことが分かり、高いスコアおよび最適な低い変異数を保持するすべての関連した可能性のあるヒットのバリエーションが探索されたことが示される。
図4はまた、その対応するD−リガンドに対し最適化されたヒットの鏡像反転を実行するためのステップ7(例えば、ステップ7−ヒット鏡像反転)を示す。鏡像反転プロトコルは、本明細書に記載されているか、または当技術分野で一般的に知られているように実行することができる。鏡像反転は、D−リガンドにドッキングされているまたはされていないヒットに対するものであってもよい。したがって、ヒットは、D−リガンドを得るために単独で(図3、ステップ7のように)、またはL−標的/D−リガンド複合体を得るためにD−標的と複合して、鏡像反転することができる。図18は、最適化されたヒットの構造のヒット鏡像反転を示す。ここで、キラル中心のすべてが反転されていることが分かる(例えば、LからD、X’からX、Y’からY)。D−リガンドにおいて、1つ以上のアミノ酸は(D)−アミノ酸である。しかしながら、いくつかのアミノ酸はLアミノ酸であってもよい。ホットスポット側鎖が立体中心を有する場合、ホットスポットは、元のホットスポットアミノ酸のエピマーになり、アルファ炭素立体中心のみがD−リガンド中で反転する。
最適化されたヒット設計が選択されると、それらの配列を、本発明によるインシリコ法のD−リガンドを得るために鏡像反転することができる。例えば、ヒットが配列GLFGHQAを有する場合、ミラー構造を有する対応するD−リガンドは、配列GlfGhqaを有する。ここで、大文字はL−アミノ酸に用いられ、小文字は対応するD−アミノ酸に用いられる。このように、キラルではないアミノ酸側鎖のLからDへの変換は自明である。アミノ酸側鎖がキラル(例えばスレオニンまたはイソロイシン)である場合、側鎖のキラル中心を反転させることにも注意する必要がある。鏡像反転の任意のプロセスを実行することができる。したがって、D−リガンドは、最適化したヒット設計のL−アミノ酸のキラリティの鏡像反転をD−アミノ酸異性体に行うことによって、得ることができる(例えば、ステップ7)。この鏡像反転は、鏡像反転モジュール282と同じでも異なってもよいヒット鏡像反転モジュール287で行うことができる。
図5は、図4のステップを実行するように構成された計算モジュールを有する計算システム299を示す。計算システム299は、モジュールで読み取り/書き込みすることができるデータベース201を含むことができる。ここで、データはデータベース201に保存され、またはデータベース201からアクセスされてモジュール内で操作され、そのような操作から得られたデータをデータベース201に保存することができる。示されるように、計算システム299は、データベース201に対し読み取りおよび書き込みができる、サブモジュールに結合され得る、またはサブモジュールを含み得る、仮定ホットスポットモジュール280を含む。仮定ホットスポットモジュール280は、ステップ1に関連して説明される原則に従って仮定ホットスポットプロトコルを実装するように構成することができる。また、仮定ホットスポットプロトコルを実装するように構成することができるホットスポットアミノ酸同定モジュール、大型アミノ酸同定モジュール、疎水性アミノ酸同定モジュール、および/または余分のパラトープアミノ酸同定モジュールが含まれる。計算システムは、ステップ1Aに関連して本明細書に記載の原理に従ってホットスポット側鎖を残すために、残りのリガンドからホットスポットアミノ酸側鎖を単離するように構成されたホットスポット分離モジュール281を含み得る。計算システムは、ステップ2に関連して本明細書に記載された原理に従って、L−ホットスポットアミノ酸側鎖およびL−ホットスポットレシーバおよび/またはL−パラトープおよび/またはL−標的のインシリコ鏡像反転を実行するように構成された鏡像反転モジュール282を含み得る。しかしながら、プロセスのどの段階においても、システムは鏡像反転モジュール282を用いて鏡像反転させることができる。計算システムは、ステップ3に関連して本明細書で説明される原理に従って、インシリコホットスポットアミノ酸ライブラリ生成を実施するように構成されたホットスポットライブラリ生成モジュール283を含み得る。ホットスポットライブラリ生成モジュール283はまた、ステップ3A、3B、3Cおよび/または3Dを実施するように構成されてもよく、または別個のモジュールが含まれてもよい。計算システムは、ステップ3Aに関連して本明細書に記載された原理に従って、ホットスポットアミノ酸側鎖のインシリコ幾何学的変換を実行するように構成された幾何学的変換モジュール283aを含み得る。計算システムは、ステップ3Bに関連して本明細書に記載された原理に従って、ホットスポットのアミノ酸側鎖を他のアミノ酸側鎖にインシリコ変換させるように構成されたアミノ酸変換モジュール283bを含み得る。計算システムは、ステップ3Cに関連して本明細書に記載の原理に従って、ホットスポットアミノ酸側鎖のインシリコ骨格再生を実現するように構成された骨格再生モジュール283cを含み得る。計算システムは、ステップ3Dに関連して本明細書で説明される原理に従って、代替ホットスポット立体構造のインシリコ生成を実施するように構成されたホットスポット立体構造モジュール283dを含み得る。計算システムは、ステップ4に関連して本明細書に記載される原理に従って、ホットスポットのアミノ酸側鎖をスキャフォールドにインシリコグラフトするように構成されたスキャフォールドマッチングモジュール284を含み得る。計算システムは、ステップ5に関連して本明細書で説明される原理に従って、ホットスポットに合致したスキャフォールドからのヒットのインシリコ同定を実施するように構成されたヒット同定モジュール285を含み得る。計算システムは、ステップ6に関連して本明細書に記載された原理に従って、D−リガンドへ反転されるヒットを同定する、ヒットのインシリコ最適化を実施するように構成されたヒット最適化モジュール286を含み得る。計算システムは、鏡像反転モジュール282と同じでも異なっていてもよい、ステップ7に関連して本明細書で説明される原理に従ってD−リガンドへのヒットのインシリコ鏡像反転を実現するように構成されたヒット鏡像反転モジュール287を含み得る。
ステップ1、2、3、4、5、6および7は、本明細書に記載されるもの、または本明細書に記載のプロトコルを容易にするために開発されるものなどの、計算的に実行されるサブステップを含み得ることに留意されたい。
したがって、最適化されたヒットは、L−標的と結合するD−リガンドに反転することができる。合成に適した1つ以上のD−リガンドを選択することができる。合成のために選択されるD−リガンドは、L−標的との良好なまたは悪い結合剤(陰性対照)であり得る。
図4はまた、L−標的/D−リガンド複合体形成を確認するためにL−標的との結合についてのD−リガンドの実際の合成およびインビトロスクリーニングを含み得るステップ8(例えば、ステップ8−合成およびスクリーニング)を示す。また、L−標的を結合するD−リガンドの結合親和性および他の関連する実験データを測定することができる。
インシリコ法によって得られたD−リガンドを合成し、インビトロでL−標的との結合についてスクリーニングすることができる。インビトロでのスクリーニングは、ELISA、競合ELISA、Octet、表面プラズモン共鳴、またはペプチドとタンパク質との特異的結合を検出することができる任意の他の技術によって行うことができる。
一般的に、最終的なD−タンパク質ライブラリは、L−タンパク質ライブラリ中のすべてのアミノ酸のキラリティを反転させることによって生成される。次に、これらのライブラリを標準的なペプチド合成を用いて合成し、結合について試験する。しかしながら、L−標的に対する結合のためのD−タンパク質の合成およびスクリーニングの任意の方法が実行され得る。
さらに、本明細書に記載の方法は、任意のL−標的タンパク質のD−リガンドを設計するように改変することができる。L−標的タンパク質は受容体であってもよく、タンパク質との相互作用のためのスコアリング関数を形成することができる任意のタンパク質または任意の他の基質であってもよい。本明細書に記載の方法は、D−リガンドライブラリを得るための計算プロトコルに有意な柔軟性を提供する。これは、D−リガンドスキャフォールドファミリーあたりの結合親和性の分布、およびスクリーニングのための所望の最終化合物数で、D−リガンドライブラリを設計することを可能にする。結合エネルギーの分布は、一定の閾値を超える結合エネルギーで提供することができる。D−リガンドは、最小限の変異で設計することができる。このように、D−リガンドスキャフォールドファミリーは、変異数を最小にしながらL−標的タンパク質への結合エネルギーを増加させた、複数のD−リガンドタンパク質を含み得る。
さらに、標的はタンパク質である必要はない。例えば、標的は、DNA鎖などの核酸であってもよい。唯一の要件は、スコアリング関数が、この種の標的でLおよびDペプチドの結合を予測するために定義されることである。
一実施形態では、本明細書に記載の方法は、任意のL−標的タンパク質と結合する任意の出発L−リガンドタンパク質またはポリペプチドまたはポリペプチドのセットを用いて実施することができる。出発L−リガンドは、L−標的に対して任意の結合親和性を有し得る。このように、低い結合エネルギーを有するいくつかのL−リガンドは、それに基づいて強く結合するD−リガンドを得るために、インシリコ法を用いて処理することができる。また、高い結合エネルギーを有するいくつかのL−リガンドは、それに基づいてD−リガンドを得るために、インシリコ法を用いて処理することができる。したがって、本明細書に記載の方法は、マイクロモルまたはナノモルの結合剤であるL−リガンドから出発することにより、強力なD−リガンドのインシリコ開発を可能にすることができる。
一実施形態では、本明細書に記載のインシリコ法は、リガンドおよび標的の実験的構造を用いて、L−標的/D−リガンド複合体を設計する能力を可能にする。これは、ペプチドリガンド設計の技術における重要な進歩であり、いくつかの有益かつ驚くべきかつ予想外の結果が得られる。これには、L−ホットスポットとL−標的(例えば、L−ホットスポットレシーバ)の相互作用するグループを保存することによってL−標的を結合するD−ホットスポットに、L−標的を結合する、L−ホットスポットの計算的変換を提供するインシリコ法が含まれ得る。
さらに、インシリコ法が、D−タンパク質を設計するために、D−リガンドタンパク質を設計するためのL−タンパク質データベース(例えば、公的または私的タンパク質データベース)の使用をも含む、L−タンパク質の使用を可能にすることは驚くべきことであり、かつ予想外である。
また、ここで提示するインシリコ法が、小さなD−ペプチドライブラリの合成が十分であるような、十分に大きな結合剤を見出す可能性(すなわち、ヒット率)を有する、D−ペプチドを設計することができることは、驚くべきことであり、かつ予想外である。D−ペプチドはディスプレイ技術によって直接スクリーニングすることが困難であるため、これは非常に重要かつ驚くべき発見である。L−標的または所望の結合に応じて変更することができる十分な程度までL−標的に結合するD−リガンドは、ヒットを提供することができ、そのD−リガンドは、D−リガンド/L−標的複合体の形成を確認するためにさらなるスクリーニングを受けることができる。ライブラリのサイズは、可溶性ライブラリ(数百ペプチド)の合成を可能にする。スクリーニングは、L−標的またはそれを含む細胞または細胞成分のみを用いることができる。任意のリガンド−標的スクリーニングをD−リガンドライブラリと共に用いることができる。
一実施形態では、本発明は、スキャフォールド鏡像反転のみが行われる方法を用いることができる。このように、計算法は、本明細書に記載された発明を使用することができるが、標的がL−標的であり、反転ホットスポットに対しスキャフォールド構造の鏡像をマッチさせることによってD−リガンドを設計する。
図4Aおよび図4Bに示すように、ステップ2(鏡像反転)は、設計手順の任意の段階で実行されてもよいし、全く実行されなくてもよい。いくつかの例では、鏡像反転を導入して、本明細書に記載の方法を容易にすることができる。例えば、L−標的上のD−ホットスポットのドッキングが計算上困難な場合、鏡像反転を有利に適用してから、D−標的上のL−ホットスポットをドッキングすることができる。図4に示すように、ステップ2および7における鏡像反転を伴う特定の経路は、採用されたモデリングソフトウェア(Rosettaパッケージ)のために便宜上選択されているが、いくつかの例では省略することもできる。ホットスポット骨格のキラリティが反転され、反転ホットスポットを生じるステップ3C(骨格再生)内のステップ3の設計プロトコルで提示される鏡像変換は、有益であり得る。このステップは、ミラーのいずれの側でも実行することができ、標的上ではなくホットスポット上でのみ作用するので、標的および元のリガンドとは異なるキラリティでリガンドを設計することができる。
図4Aは、鏡像反転を全く行わずにL−標的に結合するD−リガンドを決定するための方法を示す。このように、ステップ3は、D−標的の代わりにL−標的が使用され、ホットスポットの側鎖が鏡像反転されないこと以外は、本明細書に記載されるように実行される。その後、元のL−ホットスポットの側鎖は、D−アミノ酸のように骨格に連結される。このように、ステップ3A〜3Dは、鏡像反転せずL−標的およびホットスポット側鎖で実行される。しかしながら、骨格は常にL−標的と結合するD−アミノ酸を有することになるように、側鎖と結合している。ステップ4、5および6は、すべてD−アミノ酸で構築されたL−標的およびD−スキャフォールドまたはD−ヒットで行われる。これらのD−スキャフォールドの構造を、対応するL−スキャフォールドから得るため、鏡像反転が用いられた。本明細書に記載のプロトコルは、標的の鏡像反転を使用しないこの改変に従って実施することができる。L−キラリティを有するホットスポット側鎖アミノ酸を含むL−スキャフォールドおよび/またはL−ヒットでの試験の代わりに、D−キラリティを有するホットスポット側鎖アミノ酸を用いたスキャフォールドおよびヒットで試験を行う。その結果、L−標的と結合するD−ヒットを含むステップ6のヒット最適化後、D−ヒットが直接合成され、スクリーニングされる。D−ヒットは、D−キラリティを有するホットスポット側鎖アミノ酸を含むD−リガンドとなる。ここで、ホットスポットではない他のアミノ酸の一部または全部は、D−キラリティおよび/またはL−キラリティを有する。いくつかの例では、D−リガンドはD−アミノ酸のみを有する。ステップ6のヒット最適化では、いくつかのL−アミノ酸を任意の他の非標準アミノ酸と同様に配列中に導入することができる。
一実施形態では、本明細書に記載の任意のステップまたはサブステップで、標的およびホットスポット、ホットスポット骨格、ホットスポット骨格ライブラリ、スキャフォールドまたはヒットの鏡像反転を行うことができる。これは、反対のキラリティを有するアミノ酸の取り扱いに関連する様々な分子モデリングパッケージの特定の機能を利用し、または制限を回避するのに便利であり得る。次に、D−標的の代わりにL−標的を用いてプロトコルを実施することができ、キラリティが定義されている場合、ホットスポット、ホットスポット骨格、ホットスポットライブラリ、スキャフォールドまたはヒットは一般的にD−キラリティである。
図4Bは、L−標的に結合するD−リガンドを決定するための方法を示しており、鏡像反転は任意のステップの前、間または後に起こり得るが、鏡像反転は任意選択であってよい。すなわち、ステップ1A、3、4、5、または6のいずれかを鏡像反転の前、間または後に行うことができ、いずれもミラーの両側の標的およびホットスポット側鎖で行うことができる。ミラーの第1の側は、元のキラリティで標的をL−標的に保ち、D−キラリティを有するホットスポット側鎖アミノ酸の骨格、スキャフォールド、ヒットおよびリガンドと相互作用する。ミラーの第2の側は、標的のすべての中心のキラリティを、L−キラリティを有するホットスポット側鎖アミノ酸の骨格、スキャフォールド、ヒットおよびリガンドと相互作用するD−標的に反転させる。ステップのいずれかは、ミラーの第1の側またはミラーの第2の側で実行することができ、任意のプロセスステップにより、ステップを実行する前または後に、ミラーの第1の側または第2の側に切り替えることができる。結果として、L−標的と結合することができるD−リガンドが得られる。D−リガンドは、合成し、L−標的との物理的結合についてスクリーニングすることができる。
一実施形態では、本方法は、特定のステップの実行を容易にするために計算システムと対話する人間を含み得る。人間は、方法を容易にする他のアクションのうち、入力を提供するために、および/または選択を行うために計算システムと対話する方法のオペレータとみなすことができる。
一態様では、オペレータは、計算システムと対話し、計算システムへの入力を提供することによって、ステップA−データ取得を容易にすることができる。D−タンパク質設計の出発点として複数のテンプレートが利用可能な方法では、オペレータは、さらなる処理のためにどのテンプレートを採用するかを決定し、その決定を計算システムに入力することができる。これには、計算システムから受信した情報をオペレータが検討し、次に計算システムに命令または選択を入力することが含まれる。この決定は、ケース特異的であり得、標的の生物学に依存し得る。
一態様では、オペレータは、計算システムと対話し、計算システムに入力を提供することによって、ステップ1−仮定ホットスポットを容易にすることができる。このステップでは、オペレータは、計算システムによって提供される情報をレビューし、次にホットスポット立体構造ライブラリ生成のためにどのアミノ酸が用いられるかを決定することができる。決定がなされると、オペレータは決定および命令を計算システムに入力することができる。オペレータは、単離されたホットスポット親和性予測、およびケースごとに視覚的検査に基づいて決定することができる。このように、計算システムは、予測に関連するデータを提供することができ、またはオペレータは、データおよび本分野の経験に基づいて予測を行うことができる。次に、オペレータは、計算システムから視覚情報を受信し、その後、決定を計算システムに入力して、方法を容易にすることができる。例えば、計算システムからオペレータに提供されるデータに基づく、オペレータの標的特異的洞察にのみ基づいて、いくつかのアミノ酸を含めることができる。
一態様では、オペレータは、計算システムと対話し、計算システムへの入力を提供することによって、ステップ3−ホットスポットライブラリ生成を容易にすることができる。このステップ中、ホットスポットライブラリは、計算システムによって、レビューのためにオペレータに提供され得る。ホットスポットライブラリおよびそれに関連するデータがレビューされると、オペレータは、計算システムによって提供されるコンピュータスクリーングラフィックまたはプリントアウトなどの、その視覚的検査によって、ホットスポットライブラリを承認することができる。オペレータは、次に、承認された1つ以上のホットスポットライブラリを計算システムに入力することができる。ホットスポットの立体構造は、特定のケーススタディには有益ではないおそれのある方法で変化する可能性があるため、オペレータは計算システムに入力して、そのような特定のホットスポットの立体構造またはライブラリを省略または除外できる。このような場合であれ、標的の生物学および構造に関する知識をもって、オペレータが評価することができる。これにより、オペレータは方法を制御し、計算システムへの入力を提供することができる。
一態様では、オペレータは、計算システムと対話し、計算システムへの入力を提供することによって、ステップ3B−アミノ酸の変更を容易にすることができる。アミノ酸の化学的空間はほぼ無限であり、それにより、オペレータは計算システムから情報を受け取り、次にこのステップに入る1つ以上のアミノ酸を決定することができる。1つ以上のアミノ酸の選択は、アミノ酸の利用可能性および/または標的の構造に基づき得る。選択は、アミノ酸鎖の構造および立体構造などの、計算システムによって提供されるデータの視覚的検査に基づいてもよい。ある特定の非標準アミノ酸がホットスポットのグラフトに有益であり、および/またはスキャフォールドに対するさらなる相互作用または代替の固定位置を提供する場合、このような非標準アミノ酸を選択することができる。オペレータに提供されるグラフまたは他のデータなどのデータは、1つ以上のアミノ酸の選択を容易にし得る。データがレビューされると、次にオペレータはステップ3Bのプロトコルで使用される命令を計算システムに入力することができる。これは、オペレータがステップ3Bのための特定のアミノ酸を選択するように計算システムに指示することを可能にする。
一態様では、オペレータは、ステップ5−ヒット同定および/またはステップ6ヒット最適化を容易にすることができる。ステップ5の間、計算システムは、データベースからマッチしたスキャフォールドのデータを提供することができ、オペレータは、計算システムに命令を入力することによって、1つ以上のマッチしたスキャフォールドを選択することができる。オペレータは、含めるヒットまたは除外するヒットのいずれかを計算システムに入力することによって、ヒットを手動でフィルタリングすることもできる。さらに、ユーザはヒットを入力して計算システムに保存することができる。ステップ6の間、オペレータは、計算システムからデータを受信し、データを分析し、適切な命令を計算システムに入力して、サブステップのいずれかを容易にすることができる。例えば、限定するものではないが、オペレータは、計算システムから情報を受信してレビューし、次にステップ6A、ステップ6C、ステップ6D、ステップ6E、ステップ6F、ステップ6G、ステップ6H、ステップ6I、ステップ6J、ステップ6K、ステップ6L、ステップ6M、ステップ6Oおよび/またはステップ6Pなどの適切な入力を計算システムに提供することによって、これらのステップのいずれかを容易にすることができる。ヒット検索およびヒット最適化ステップの後、特定のヒットクラスは、オペレータによるさらなる処理から除外されてもよい。オペレータは、1つ以上のヒットファミリーに関するデータを受信してレビューし、ホットスポットの相互作用を正しく再現しないか、または標的と可能性の低い方法で相互作用する除外のヒットを特定および/または選択し、そして次に計算システムに選択を入力することができる。オペレータはまた、ホットスポット相互作用を正確に再現する、または可能な方法で標的と相互作用する計算システムへのさらなる分析のためのヒットを入力することができる。これらのステップの後、オペレータは、ヒットに合成をさらに行うことに関する決定を、すべての設計パラメータに基づき、および/または計算システムによって提供されるグラフト相互作用の質の視覚的検査に基づき、行うことができる。
一実施形態では、標的と結合するリガンドを設計する方法は、L−キラリティを有するポリペプチド標的を同定すること;標的との結合相互作用を有するL−キラリティを有するポリペプチドリガンドのホットスポットアミノ酸を決定すること;標的との結合相互作用を保持するホットスポットアミノ酸側鎖の変換を決定すること;およびポリペプチドが標的と結合するように、標的との結合相互作用を保持するD−キラリティを有する1つ以上のホットスポットアミノ酸側鎖を有するD−ポリペプチドを生成すること、を含み得る。
一実施形態では、本方法は、標的のエピトープに結合するアミノ酸として、ホットスポットアミノ酸を決定することを含み得る。
一実施形態では、本方法は、ホットスポットアミノ酸側鎖がそれぞれのアルファ炭素を保持するように、ポリペプチドリガンドの残りからホットスポットアミノ酸を単離することを含み得る。
一実施形態では、本方法は、標的との結合相互作用を保持するホットスポットアミノ酸側鎖の回転を決定することを含むことができ、その回転は、ホットスポット側鎖の異なる配向をもたらす任意の軸および角度の周りの回転であるが、元のホットスポット相互作用の性質(例えば、疎水性、水素結合、芳香族)を保持する。
一実施形態では、本方法は、標的との結合相互作用を保持するホットスポットアミノ酸側鎖の化学的修飾を決定することを含むことができ、化学的修飾により、変換されたホットスポットアミノ酸側鎖として標準または非標準アミノ酸側鎖が得られる。
一実施形態では、本方法は、変換されたアミノ酸側鎖と標的との間の相互作用を分析すること;および変換されたアミノ酸側鎖が、標的との結合相互作用を保持するかどうかを決定すること、を含み得る。標的との結合相互作用が保持される場合、変換されたアミノ酸側鎖が選択される。標的との結合相互作用が保持されない場合、変換されたアミノ酸側鎖は放棄される。
一実施形態では、本方法は、変換されたアミノ酸側鎖と標的との間の相互作用を分析すること;および変換されたアミノ酸側鎖が標的と立体的に衝突するかどうかを決定すること、を含み得る。変換されたアミノ酸側鎖が標的と立体的に衝突しない場合、変換されたアミノ酸が選択される。変換されたアミノ酸側鎖が標的と立体的に衝突する場合、変換されたアミノ酸は放棄される。
一実施形態では、本方法は、1つ以上の変換ホットスポットアミノ酸側鎖から出発してホットスポットポリペプチドLまたはD−骨格立体構造を生成すること;および生成した立体構造が標的と立体的に衝突するかどうかを決定すること、を含み得る。生成した立体構造が標的と衝突しない場合、それが選択される。生成した立体構造が標的と衝突する場合、それは放棄される。
一実施形態では、本方法は、ホットスポットポリペプチド骨格を選択すること;およびそれぞれ標的と結合することができる複数の代替ホットスポットポリペプチド骨格立体構造(ホットスポットライブラリ)を生成すること、を含み得る。一実施形態では、本方法は、ホットスポットアミノ酸を選択すること;およびそれぞれ標的と結合することができる複数のホットスポットアミノ酸立体構造を生成すること、を含み得る。一態様では、代替立体構造の生成は、立体構造サンプリング技術を含む。一態様では、立体構造サンプリング技術は分子動力学を含む。
一実施形態では、本方法は、生成されたホットスポットライブラリの視覚的検査を実行すること、および隣接するホットスポットから重複するアミノ酸を除去することを含み得る。一実施形態では、本方法は、ホットスポットライブラリからの各アミノ酸の体系的スクリーニングを実行すること、および任意の他のホットスポットアミノ酸と任意の立体的衝突が生じた場合にそれを放棄することを含み得る。
一実施形態では、本方法は、ホットスポットアミノ酸立体構造を選択すること;およびその相対的な三次元配列に影響を与えることなく、この構造上のホットスポットアミノ酸をグラフトすることを可能にする三次元構造を有するスキャフォールドを決定すること、を含み得る。
一実施形態では、本方法は、リガンドスキャフォールドを選択すること;リガンドスキャフォールド中の非ホットスポットアミノ酸を変異させること;変異したリガンドスキャフォールドがリガンドスキャフォールドに対して改善された結合スコアを有するかどうかを決定すること;および改善された結合スコアを有する変異したリガンドスキャフォールドをヒットとして選択すること、を含み得る。
一実施形態では、本方法は、ヒットを選択すること;選択されたヒットの配列を変化させて最適化されたヒットを得ること;および最適化されたヒットが標的と結合するかどうかを決定すること、を含み得る。一態様では、選択されたヒットの配列は、立体構造サンプリング技術をヒットに適用した後に改変される。一態様では、立体構造サンプリング技術は分子動力学を含む。
一実施形態では、本方法は、ヒットを選択すること;および、野生型リガンドスキャフォールドと比較して、変異数あたり増加した標的との結合スコアを有する、1つ以上の最適なヒットを決定するために、ヒットの配列を変更すること、を含み得る。一態様では、ヒットの配列の変更は、リガンドスキャフォールドとは異なるヒット中の1つ以上のアミノ酸を変更して元のリガンドスキャフォールドのアミノ酸へ戻すこと;モデル化した標的−リガンド複合体中の、標的から10オングストローム以内の単一アミノ酸を変異させること;モデル化した標的−リガンド複合体中の、標的から10オングストローム以内の2つのアミノ酸を変異させること;3つのアミノ酸を変異させること;より水溶性の低いアミノ酸を極性または荷電アミノ酸に変異させること;環化の目的で共有結合を導入すること;非標準アミノ酸を標準アミノ酸に変異させること;標準アミノ酸を非標準アミノ酸に変異させること;または結合スコアを高める目的で、立体構造サンプリング技術を実行すること、のうちの1つ以上を含む。一態様では、本方法は、配列への変更のうちの1つ以上で、1つ以上の反復ループを実行すること;配列への1つ以上の変更により、リガンドスキャフォールドから、変異数あたり増加した標的との結合スコアが得られるかどうかを決定すること;およびリガンドスキャフォールドから、変異数あたり増加した標的との結合スコアを有するヒットを、最適化ヒットとして選択すること、を含み得る。
一実施形態では、選択された後、1つ以上の最適化されたヒットが合成され得る。合成された最適化ヒットは、標的と結合することができる。一態様では、最適化されたヒットはD−リガンドである。一態様では、最適化されたヒットはL−リガンドであり、この方法は、D−リガンドを合成する前にL−リガンドをD−リガンドに鏡像反転することを含み得る。
一実施形態では、本方法は、ポリペプチド標的を、D−キラリティを有するD−標的に鏡像反転すること;および変換前にホットスポットアミノ酸の側鎖を鏡像反転すること、を含み得る。後続のステップは、D−標的および鏡像反転ホットスポット側鎖を用いて行うことができる。骨格再生の後、反転ホットスポット側鎖から生成されるホットスポットアミノ酸は、D−標的と結合するL−アミノ酸であり得る。方法ステップはいずれも、L−ホットスポットアミノ酸と共にD−標的で実行することができる。一態様では、本方法は、鏡像反転の前にその天然のポリペプチドリガンドからホットスポットアミノ酸全体を単離することを含み得る。本明細書に記載の方法ステップはいずれも、D−標的および反転ホットスポット側鎖パラダイムの下で実行することができ、反転ホットスポット側鎖はL−リガンドにグラフトされる。プロトコルの最後に、最適化されたL−リガンドはD−リガンドに鏡像反転され、D−リガンドを合成することができる。
一実施形態では、D−標的および反転ホットスポットの側鎖を用いる方法は、標的との結合相互作用を保持する鏡像反転されたホットスポットアミノ酸側鎖の対称操作を決定することを含むことができ、その対称操作は、ホットスポット側鎖の異なる配向をもたらす任意の軸および/または平面周りの任意の角度で行われるが、元のホットスポット相互作用の性質(例えば、疎水性、水素結合、芳香族、πカチオン)を保持し;および/または標的との結合相互作用を保持する鏡像反転されたホットスポットアミノ酸側鎖の化学的修飾を決定することを含むことができ、化学的修飾により、ホットスポットライブラリの構成要素として、標準または非標準アミノ酸側鎖が得られる。
一実施形態では、D−標的および反転ホットスポットの側鎖を用いる方法は、変換されたアミノ酸側鎖とD−標的との間の相互作用を分析すること;および変換されたアミノ酸側鎖が、D−標的との結合相互作用を保持するかどうかを決定すること、を含み得る。D−標的との結合相互作用が保持される場合、変換されたアミノ酸側鎖が選択される。D−標的との結合相互作用が保持されない場合、変換されたアミノ酸側鎖は放棄される。
一実施形態では、D−標的および反転ホットスポットの側鎖を用いる方法は、変換されたアミノ酸側鎖とD−標的との間の相互作用を分析すること;および変換されたアミノ酸側鎖がD−標的と立体的に衝突するかどうかを決定すること、を含み得る。変換されたアミノ酸側鎖がD−標的と立体的に衝突しない場合、変換されたアミノ酸が選択される。変換されたアミノ酸側鎖がD−標的と立体的に衝突する場合、変換されたアミノ酸は放棄される。
一実施形態では、D−標的および反転ホットスポットの側鎖を用いる方法は、1つ以上の変換ホットスポットアミノ酸側鎖立体構造から出発してL−骨格原子を生成すること;および生成した立体構造がD−標的と立体的に衝突するかどうかを決定すること、を含み得る。生成した立体構造がD−標的と衝突しない場合、その立体構造が選択される。生成した立体構造がD−標的と衝突する場合、それは放棄される。
一実施形態では、D−標的および反転ホットスポットの側鎖を用いる方法は、それぞれL−キラリティを有するD−標的と結合することができる複数の代替ホットスポットアミノ酸立体構造を選択することを含み得る。一態様では、代替立体構造の生成は、立体構造サンプリング技術を含む。一態様では、立体構造サンプリング技術は分子動力学を含む。
一実施形態では、D−標的および反転ホットスポットライブラリを用いる方法は、ホットスポットアミノ酸を選択すること;およびその相対的な三次元配列に影響を与えることなく、この構造上のホットスポットアミノ酸をグラフトすることを可能にする三次元構造を有するスキャフォールドを決定すること、を含み得る。
一実施形態では、D−標的および反転ホットスポットライブラリを用いる方法は、リガンドスキャフォールドを選択すること;リガンドスキャフォールド中の非ホットスポットアミノ酸を変異させること;変異したリガンドスキャフォールドがリガンドスキャフォールドに対して改善されたスコアを有するかどうかを決定すること;および改善された結合スコアを有する変異したリガンドスキャフォールドをヒットとして選択すること、を含み得る。
一実施形態では、D−標的および反転ホットスポットライブラリを用いる方法は、ヒットを選択すること;選択されたヒットの配列を変化させて最適化されたヒットを得ること;および最適化されたヒットが改善されたスコアを提示するかどうかを決定すること、を含み得る。一態様では、選択されたヒットの配列は、立体構造サンプリング技術をヒットに適用した後に改変される。一態様では、立体構造サンプリング技術は分子動力学を含む。
一実施形態では、D−標的および反転ホットスポットライブラリを用いる方法は、ヒットを選択すること;およびリガンドスキャフォールドから変異数あたり増加した標的とのスコアを有する1つ以上の最適なヒットを決定するために、ヒットの配列を変更すること、を含み得る。一態様では、最適化されたヒットはL−リガンドであり、この方法は、L−リガンドをD−リガンドに鏡像反転することを含み得る。一度D−リガンドが決定されると、それらは化学的に合成することができる。
一実施形態では、リガンドの設計はインシリコで実行される。一度設計されると、D−リガンドを合成することができる。
一実施形態では、リガンドを作成するためにL−標的および/またはD−標的を用いる方法のいずれかは、鏡像反転を含み得る。このように、本明細書に記載の方法は、L−キラリティからD−キラリティへの標的の1つ以上の鏡像反転を実行すること;リガンド、ホットスポット、ホットスポット骨格、スキャフォールド、ヒット、多様化ヒット、最適化ヒット、のうちの1つ以上のL−キラリティからD−キラリティへの1以上の鏡像反転を実行すること;またはリガンド、ホットスポット、ホットスポット骨格、スキャフォールド、ヒット、多様化ヒット、最適化ヒットのうちの1つ以上のD−キラリティからL−キラリティへの1以上の鏡像反転を実行すること;または任意のアミノ酸側鎖の鏡像反転を実行すること、のうちの1つ以上を含み得る。
当業者には、本明細書で開示されるこれらおよび他のプロセスおよび方法のために、プロセスおよび方法で実行される機能が異なる順序で実施されてもよいことが理解されよう。さらに、概略的なステップおよび操作は例としてのみ提供され、いくつかのステップおよび操作は任意選択であり、開示された実施形態の本質を損なうことなく、より少ないステップおよび操作に組み合わせ、または追加のステップおよび操作に拡張されてもよい。
本開示は、本出願に記載された特定の実施形態に関して限定されるものではなく、様々な態様の説明として意図される。当業者には明らかであるように、その精神および範囲から逸脱することなく、多くの改変および変形が可能である。本明細書に列挙したものに加えて、本開示の範囲内の機能的に等価な方法および装置は、前述の説明から当業者には明らかであろう。そのような改変および変形は、添付の特許請求の範囲内に含まれることが意図される。本開示は、添付の特許請求の範囲、およびそのような特許請求の範囲が権利を与えられる均等物の全範囲によってのみ限定されるべきである。この開示は、特定のインシリコ法、試薬、化合物組成物または生体系に限定されず、当然のことながら変更し得るものと理解されたい。本明細書で使用する用語は、特定の実施形態のみを説明するためのものであり、限定することを意図するものではないことも理解されたい。
一実施形態では、本方法は、計算システム上で実行される態様を含むことができ、これはインシリコ法であるとみなし得る。このように、計算システムは、その方法を実行するためのコンピュータ実行可能命令を有するメモリデバイスを含み得る。コンピュータ実行可能命令は、特許請求の範囲のいずれかに記載の方法のいずれかを実行するための1つ以上のアルゴリズムを含むコンピュータプログラム製品の一部であってもよい。メモリデバイスは、本明細書で提供されるようなステップのうちのいずれかを単独で、またはそれらの組み合わせを実行するための命令を含み得る。
一実施形態では、本明細書に記載された操作、プロセス、方法、またはステップのいずれかは、コンピュータ可読媒体に格納されたコンピュータ可読命令として実装することができる。コンピュータ可読命令は、デスクトップ計算システム、ポータブル計算システム、タブレット計算システム、ハンドヘルド計算システム、ならびにネットワーク要素、および/または任意の他の計算デバイスからの広範な計算システムのプロセッサによって実行することができる。コンピュータ可読媒体は一時的ではない。コンピュータ可読媒体は、コンピュータによって物理媒体から物理的に読み取ることができるように、コンピュータ可読命令が格納された物理媒体である。
システムの態様のハードウェアとソフトウェアの実装の間にはほとんど区別がない。ハードウェアまたはソフトウェアの使用は、コスト対効率のトレードオフを表す設計選択であることが一般的である(しかし常にというわけではなく、特定の状況では、ハードウェアとソフトウェアの間の選択が重要になる)。本明細書で説明されるプロセスおよび/またはシステムおよび/または他の技術(例えば、ハードウェア、ソフトウェア、および/またはファームウェア)を達成し得る様々な媒体が存在し、好ましい媒体は、プロセスおよび/またはシステムおよび/または他の技術が展開される状況に応じて異なる。例えば、実装者が速度および精度が最も重要であると判断した場合、実装者は主にハードウェアおよび/またはファームウェア媒体を選択することができ、柔軟性が最も重要な場合、実装者は主にソフトウェアの実装を選択することができ、または、代わりに、実施者は、ハードウェア、ソフトウェア、および/またはファームウェアのいくつかの組み合わせを選択することもできる。
前述の詳細な説明は、ブロック図、フローチャート、および/または例を使用してプロセスの様々な実施形態を説明した。そのようなブロック図、フローチャート、および/または例が1つ以上の機能および/または動作を含む限り、そのようなブロック図、フローチャート、または例の中の各機能および/または動作は、ハードウェア、ソフトウェア、ファームウェア、または実質的にそれらの任意の組み合わせを含み得る広範囲のモジュールによって、個別におよび/または集合的に実装可能であることは、当業者に理解されよう。一実施形態では、本明細書に記載される主題のいくつかの部分は、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、デジタル信号プロセッサ(DSP)、または他の統合フォーマットを介して実装されてもよい。しかしながら、当業者には、本明細書に開示された実施形態のいくつかの態様は、全体または一部として、1つ以上のコンピュータ上で実行される1つ以上のコンピュータプログラムとして(例えば、1つ以上のコンピュータシステム上で実行される1つ以上のプログラムとして)、1つ以上のプロセッサ上で実行される1つ以上のプログラムとして(例えば、1つ以上のマイクロプロセッサ上で実行される1つ以上のプログラムとして)、ファームウェアとして、または実質的にそれらの任意の組み合わせとして、集積回路において同等に実装され得ること、および回路の設計ならびに/またはソフトウェアおよび/もしくはファームウェアのコードの記述は、本開示に照らして当業者の技術範囲内であることが認識されよう。さらに、当業者は、本明細書に記載される主題のメカニズムが、様々な形態のプログラム製品として配布され得ること、および本明細書に記載される主題の例示的な実施形態は、実際にその配布物を実行するために用いられる物理的信号担持媒体の特定のタイプのものであるかにかかわらず適用されることを理解するであろう。物理的な信号担持媒体の例には、フロッピーディスク、ハードディスクドライブ、CD、DVD、デジタルテープ、コンピュータメモリ、一時的または伝送でない任意の他の物理媒体などの記録可能型媒体が含まれるが、これらに限定されるものではない。コンピュータ可読命令を有する物理媒体の例としては、デジタルおよび/またはアナログ通信媒体(例えば、光ファイバケーブル、導波路、有線通信リンク、無線通信リンクなど)などの一時的または伝送型媒体を省略する。
当業者には、本明細書に記載の方法でデバイスおよび/またはプロセスを記述し、その後、そのような説明されたデバイスおよび/またはプロセスをデータ処理システムに統合するために技術慣行を使用することが一般的であることが認識されよう。すなわち、本明細書に記載のデバイスおよび/またはプロセスの少なくとも一部は、妥当な量の実験を介してデータ処理システムに統合することができる。当業者には、典型的なデータ処理システムは、一般的に、システムユニットハウジング、ビデオディスプレイデバイス、揮発性および不揮発性メモリなどのメモリ、マイクロプロセッサおよびデジタル信号プロセッサなどのプロセッサ、オペレーティングシステム、ドライバ、グラフィカルユーザインタフェース、およびアプリケーションプログラムなどの計算的エンティティ、タッチパッドまたはスクリーンなどの1つ以上の相互作用デバイス、および/またはフィードバックループおよび制御モータを含む制御システム(例えば、位置および/または速度を検出するためのフィードバック;移動ならびに/またはコンポーネントおよび/もしくは量を調整するための制御モータ)の1つまたは複数を含むことが認識されよう。典型的なデータ処理システムは、データ計算/通信および/またはネットワーク計算/通信システムに一般的に見られるような任意の適切な市販のコンポーネントを利用して実装されてもよい。
本明細書に記載された主題は、異なる他のコンポーネント内に含まれるか、または接続される、異なるコンポーネントを示すことがある。このような示されたアーキテクチャは単なる例示であり、実際には同じ機能を達成する多くの他のアーキテクチャを実装することができることを理解されたい。概念的な意味では、同じ機能を達成するためのコンポーネントの任意の配置は、所望の機能性が達成されるように効果的に「関連」する。したがって、特定の機能性を達成するために組み合わされた任意の2つのコンポーネントは、アーキテクチャまたは中間コンポーネントにかかわらず、所望の機能性が達成されるように互いに「関連」するとみなすことができる。同様に、そのように関連付けられた任意の2つのコンポーネントは、所望の機能を達成するために互いに「動作可能に接続された」または「動作可能に結合された」とみなすことができ、そのように関連付けられた任意の2つのコンポーネントはまた、所望の機能を達成するために、互いに「動作可能に結合できる」とみなすことができる。動作可能に結合できる具体例としては、物理的に接合可能なコンポーネントならびに/または物理的に相互作用するコンポーネントならびに/または無線で対話可能なおよび/もしくは無線で相互作用するコンポーネントならびに/または論理的に相互作用するおよび/もしくは論理的に対話可能なコンポーネントを含むが、これらに限定されるものではない。
図9は、本明細書に記載の計算方法のいずれかを実行するように構成された例示的な計算デバイス900を示す。計算システム900は、モバイルコンピュータなどのユーザ側計算デバイスを表し得る。非常に基本的な構成902では、計算デバイス900は、一般的に、1つ以上のプロセッサ904およびシステムメモリ906を含む。メモリバス908は、プロセッサ904とシステムメモリ906との間で通信するために用いられてもよい。
所望の構成に応じて、プロセッサ904は、マイクロプロセッサ(μP)、マイクロコントローラ(μC)、デジタル信号プロセッサ(DSP)、またはそれらの任意の組み合わせを含むがこれらに限定されない、任意のタイプのものでよい。プロセッサ904は、レベル1キャッシュ910およびレベル2キャッシュ912などの1つ以上のレベルのキャッシュ、プロセッサコア914、およびレジスタ916を含み得る。例示的なプロセッサコア914は、算術論理ユニット(ALU)、浮動小数点ユニット(FPU)、デジタル信号処理コア(DSPコア)、またはそれらの任意の組み合わせを含み得る。例示的なメモリコントローラ918は、プロセッサ904と使用されてもよく、またはいくつかの実装形態では、メモリコントローラ918は、プロセッサ904の内部部分であってもよい。
所望の構成に応じて、システムメモリ906は、揮発性メモリ(RAMなど)、不揮発性メモリ(ROM、フラッシュメモリなど)、またはそれらの任意の組み合わせを含むがこれらに限定されない、任意のタイプのものであってもよい。システムメモリ906は、オペレーティングシステム920、1つ以上のアプリケーション922、およびプログラムデータ924を含み得る。アプリケーション922は、本明細書に記載の方法に関して説明される関数を含む本明細書に記載の関数を実行するように構成された決定アプリケーション926を含み得る。プログラムデータ924は、センサユニット940によって提供される汚染特性を分析するのに有用であり得る判定情報928を含み得る。いくつかの実施形態では、アプリケーション922は、信頼できない計算ノードによって実行される作業が本明細書に記載のように検証されるよう、オペレーティングシステム920上のプログラムデータ924で動作するように構成されてもよい。この説明された基本構成902は、内側の破線内の構成要素によって図9に示される。
計算デバイス900は、追加の特徴または機能、ならびに基本構成902と任意の必要なデバイスおよびインターフェースとの間の通信を容易にする追加のインターフェースを有し得る。例えば、バス/インターフェースコントローラ930を使用して、記憶インターフェースバス934を介して基本構成902と1つ以上のデータ記憶デバイス932との間の通信を容易にすることができる。データ記憶デバイス932は、リムーバブル記憶デバイス936、非リムーバブル記憶デバイス938、またはそれらの組み合わせであってもよい。リムーバブル記憶および非リムーバブル記憶デバイスの例には、いくつか挙げるとすれば、フレキシブルディスクドライブおよびハードディスクドライブ(HDD)などの磁気ディスクデバイス、コンパクトディスク(CD)ドライブまたはデジタル多用途ディスク(DVD)ドライブなどの光学ディスクドライブ、ソリッドステートドライブ(SSD)、およびテープドライブが含まれる。例示的なコンピュータ記憶媒体は、コンピュータ可読命令、データ構造、プログラムモジュール、または他のデータなどの情報の記憶のための任意の方法または技術で実装される、揮発性および不揮発性の、リムーバブルおよび非リムーバブルの媒体を含み得る。
システムメモリ906、リムーバブル記憶デバイス936および非リムーバブル記憶デバイス938は、コンピュータ記憶媒体の例である。コンピュータ記憶媒体には、RAM、ROM、EEPROM、フラッシュメモリ、ソリッドステートドライブ(SSD)または他のメモリ技術、CD−ROM、デジタル多用途ディスク(DVD)または他の光記憶、磁気カセット、磁気テープ、磁気ディスク記憶または他の磁気記憶デバイス、または所望の情報を格納するために使用することができ、計算デバイス900によってアクセスされ得る任意の他の媒体を含むが、これらに限定されるものではない。そのようなコンピュータ記憶媒体は、計算デバイス900の一部であってもよい。
計算デバイス900は、バス/インターフェースコントローラ930を介して様々なインターフェースデバイス(例えば、出力デバイス942、周辺インターフェース944、および通信デバイス946)から基本構成902への通信を容易にするためのインターフェースバス940を含むこともできる。例示的な出力デバイス942は、グラフィックス処理ユニット948およびオーディオ処理ユニット950を含み、これらは、1つ以上のA/Vポート952を介してディスプレイまたはスピーカなどの様々な外部デバイスと通信するように構成することができる。例示的な周辺インターフェース944は、1つ以上のI/Oポート958を介して、入力デバイス(例えば、キーボード、マウス、ペン、音声入力デバイス、タッチ入力デバイスなど)、または他の周辺デバイス(例えば、プリンタ、スキャナなど)などの外部デバイスと通信するように構成され得るシリアルインターフェースコントローラ954またはパラレルインターフェースコントローラ956を含む。例示的な通信デバイス946は、1つ以上の通信ポート964を介したネットワーク通信リンクを介して、1つ以上の他の計算デバイス962との通信を容易にするように構成され得るネットワークコントローラ960を含む。
ネットワーク通信リンクは、通信媒体の一例であってもよい。通信媒体は、一般的に、搬送波または他の移送機構などの変調データ信号内の、コンピュータ可読命令、データ構造、プログラムモジュール、または他のデータによって具体化することができ、任意の情報配信媒体を含み得る。「変調データ信号」は、信号内の情報を符号化するようにその特性の1つ以上が設定または変更された信号であってもよい。限定ではなく例として、通信媒体は、有線ネットワークまたは直接有線接続などの有線媒体、および超音波、無線周波数(RF)、マイクロ波、赤外線(IR)および他の無線媒体などの無線媒体を含み得る。本明細書で使用するコンピュータ可読媒体という用語は、記憶媒体と通信媒体の両方を含み得る。
計算デバイス900は、携帯電話、パーソナルデータアシスタント(PDA)、パーソナルメディアプレーヤデバイス、無線ウェブウォッチデバイス、パーソナルヘッドセットデバイス、特定用途向けデバイス、または上記機能のいずれかを含むハイブリッドデバイスなどの、小型携帯用(またはモバイル)電子デバイスの一部として実装されてもよい。計算デバイス900は、ラップトップコンピュータおよび非ラップトップコンピュータ構成の両方を含むパーソナルコンピュータとして実施することもできる。
本明細書で説明される実施形態は、インシリコ法のステップを実行することができる本明細書に記載のモジュールに従って、様々なコンピュータハードウェアまたはソフトウェアモジュールを含む専用または汎用コンピュータの使用を含み得る。
本発明の範囲内の実施形態はまた、コンピュータ実行可能命令を担持または有するためのコンピュータ可読媒体、またはそれに記憶されたデータ構造を含む。そのようなコンピュータ可読媒体は、汎用または専用コンピュータによってアクセスすることができる任意の利用可能な媒体であってもよい。限定ではなく例として、そのようなコンピュータ可読媒体は、RAM、ROM、EEPROM、CD−ROMまたは他の光ディスク記憶、磁気ディスク記憶または他の磁気記憶デバイス、またはコンピュータ実行可能な命令またはデータ構造の形で所望のプログラムコード手段を担持または格納するために使用することができ、汎用または専用コンピュータによってアクセスすることができる任意の他の媒体を含み得る。情報がネットワークまたは他の通信接続(有線、無線、または有線もしくは無線の組み合わせのいずれか)を介してコンピュータに転送または提供されるとき、コンピュータは接続をコンピュータ可読媒体として適切にみなす。このように、このような接続は、コンピュータ読み取り可能媒体と適切に呼ばれている。上記の組み合わせもまた、コンピュータ可読媒体の範囲内に含まれるべきである。
コンピュータ実行可能命令は、例えば、汎用コンピュータ、専用コンピュータ、または専用処理デバイスに特定の関数または関数群を実行させる命令およびデータを含む。主題は、構造的特徴および/または方法論的動作に特有の文言で説明されているが、添付の特許請求の範囲に定義された主題は、必ずしも上述の具体的特徴または動作に限定されないことを理解されたい。むしろ、上記の具体的特徴および動作は、特許請求の範囲を実施する例示的な形態として開示される。
本明細書で使用する「モジュール」または「コンポーネント」という用語は、計算システム上で実行するソフトウェアオブジェクトまたはルーチンを指すことができる。本明細書で説明されている様々なコンポーネント、モジュール、エンジン、およびサービスは、計算システム上で(例えば、別々のスレッドとして)実行されるオブジェクトまたはプロセスとして実装されてもよい。本明細書で説明されるシステムおよび方法は、好ましくはソフトウェアに実装され、ハードウェアへの実装、またはソフトウェアとハードウェアの組み合わせも可能であり、企図される。この説明では、「計算エンティティ」は、本明細書で前に定義した任意の計算システム、または計算システム上で動作する任意のモジュールまたは変調の組み合わせであってもよい。すべての設計ステップは、計算システムを使用してオペレータが実行することができ、設計された後、D−リガンドを合成し、L−標的上で試験することができる。
すべての例において、計算的設計方法のオペレータは、計算システムでのデータ取得およびデータ入力プロトコルのいくつかまたはすべてを実装し、および計算システムで任意の計算的設計選択(selection)または選択(choice)を実装することが可能である。計算システムが計算的設計データを取得または生成するとき、オペレータは、そのようなデータを計算システムから受信し、計算システムの有無にかかわらずデータを分析し、計算的設計データおよびその解析に基づいて計算システムに入力することができる。
実施例1:インターロイキン−17Aに結合するD−タンパク質の計算的設計。
インターロイキン17Aは、IL−17ファミリーのサイトカインのメンバーであり、2つの分子内ジスルフィド架橋を有するシステインノットフォールドを提示する二量体を形成する。IL17応答は、喘息、関節リウマチおよび乾癬などの疾患に関与する。この例では、IL17A二量体に結合し得るD−タンパク質リガンドを設計するために、独自の抗IL17抗体CNTO6785のFABとIL17Aとの複合体の独自構造が用いられる。D−タンパク質リガンドの1つのクラスは、CNTO6785のエピトープと重複するエピトープに結合する独自のセンチリンWPWとの競合を示すことが示され、IL17Aの異なる領域で結合する抗体CAT2200とは競合しない。このように、D−タンパク質リガンドを本明細書に記載のように設計し、次いで合成し、IL17A二量体とのインビトロ結合について試験することができる。
モデリング部分に関し、以下のすべての例について、力場(すなわち、複合体の分子座標の関数である、立体的/化学的正確性および結合の推定値)は、Rosettaのmm_stdバージョンの力場を選択したが、当業者には、同じ目的のために他の力場を用い得ることが認識されよう。したがって、DGまたはDDGである結合の自由エネルギーの推定値はすべて、Rosetta単位(RU)で表される。
IL−17へのD−タンパク質結合剤の設計の出発点は、IL17と独自の抗IL17A抗体との複合体の結晶構造であった。この構造は、IL17二量体と直接相互作用しないため、FABの定常領域を除去することによって最初に減少した。次に、失われた水素原子を加え、側鎖を再構築して、極小値に最も近い力場が再現された(この操作は、プレパックとも呼ばれる)。得られた構造は最初のX線結晶構造に非常に近いものであった。これらの操作は、ステップA−データ取得で表される。
その後、モデルは、4つの並列最適化の実行の中で最低のスコアを選択することによって最適化された。各最適化プロセスには、一連のプレパック、骨格最適化、極小化、FABの局所的リドッキング、それに続くさらなる極小化およびプレパックが含まれた。骨格は、減少した複合体の完全な最適化が最終的な立体構造に影響を及ぼす可能性があるため、最小限の変化のみが許容された。各ラウンドでは、4つの並列最適化の実行から最良の構造が選択され、次のラウンドに入力された。Rosettaスコアが収束に達すると、複合体は、さらなる処理の準備ができたものとみなされた。
ステップ1:仮定ホットスポット
FABパラトープに属する各残基は、FAB環境から単離された後に局所的に最適化された。これは、FABの非存在下でアミノ酸相互作用が保持されているかどうかを調べるために行われた(図4、ステップ1)。 IL17上のポケットに深く埋め込まれた2つのフェニルアラニン残基−F92およびF91、および1つのチロシン残基Y89は、2.5RU未満のDG(計算された結合自由エネルギー)を有すると同定され、FAB環境から取り除いたときの元の相互作用を保存した。同じ残基は、標的とのほとんどの原子接触を形成するものとして最初に同定され、視覚的検査によってホットスポットとしてタグ付けされた。すべての指標に基づき、3つのアミノ酸がD−タンパク質リガンドの設計の出発点として選択され、以降ホットスポットと呼ばれる。
ステップ2:鏡像反転
IL17−ホットスポットL−複合体は、キラリティの変化を反映するように、L−複合体のタンパク質データベース(PDB)ファイルのx座標の符号を変更し、残基名を変更することによって、D−複合体に鏡像反転した(図4、ステップ2)。
ステップ3:側鎖ライブラリの生成
それぞれのホットスポット残基は、標的のキラリティとは反対のキラリティ(ここでは、各ホットスポットの骨格はL−キラリティで再構築された)でその骨格キラリティが反転され(図4、ステップ3)、いわゆる「反転ホットスポット」となった。骨格再生の手順(図4、ステップ3C)は、元のアミノ酸骨格を取り、側鎖を固定したまま、Hα、CαおよびCβを横切るミラーを通して骨格原子のみを反転させることを含む(図20A参照)。骨格反転は、Pymol APIを用いてPythonスクリプトで実行された。
図20Aは、D−標的およびL−ホットスポットの複合体に変換されるD−標的およびD−ホットスポットで構成されるD−複合体を示す。キラリティは、CO−RN(H)規則によって推測することができる:Hαがバックグラウンドに、かつCαが中心になるようアミノ酸を配置した後、CO−R−NH基の順序が反時計回りである場合は、キラリティはL、そして時計回りの場合はDである。矢印はCO−R−N(H)規則に従った順序を示す。左側のパネルには、骨格再生のプロセスをよりよく理解するための理想化されたミラーが示される(図4、ステップ3C)。
反転したホットスポットのそれぞれについて、標的と適合するポーズのセットをホットスポットライブラリに追加した。水素結合した残基の場合には、特定の水素結合の存在も新しいポーズを受け入れるための条件とみなされた(図20B参照)。すべての反転ホットスポットの場合において、別の条件は、疎水性接触を含む結晶構造相互作用を維持することであった。図20Bは、Y89の反転ホットスポットライブラリ生成を示す。側鎖の出発ポーズは保持され、水素結合はライブラリに加えられたすべてのポーズで保存される。
仮定ホットスポットにおける残基のうちの2つはフェニルアラニンであるため、側鎖によって形成される相互作用を保存しながらいくつかの代替アルファ位炭素をとることが可能である。骨格は、環上の異なる位置から始めて再構築され、得られたポーズは局所的にリドッキングされた。インシリコで計算された親和性が少なくとも2RUであり、側鎖の相互作用が再現されたとき、ポーズがライブラリに追加され、骨格の代替位置が提供された(図4、ステップ3D参照)。同様に、アミノ酸間の化学的類似性を利用することによって、6員環部分を結合位置に保ちながら、フェニルアラニン残基もトリプトファンに変異した。最適化後(すなわち、ステップ3Dを繰り返した後)に、代替ポーズが依然として合理的なインシリコの親和性を提供し、フェニルアラニン環の位置を模倣している場合、代替ホットスポット残基を反転ホットスポットライブラリに加えた(図20C、ならびに図4、ステップ3Aおよび3B:幾何学的変換およびアミノ酸の変化を参照)。図20Cは、F92の化学的類似性および内部構造対称性を利用して発見された代替ホットスポットを示す。左パネルには、最初のホットスポットが表示される。中央のパネルは、側鎖の対称性を利用して骨格の位置を変えることを示す。右のパネルは、フェニルアラニンがトリプトファン残基に変異しており、フェニル環が開始時のホットスポットに覆われていることを示す。
反転ホットスポットライブラリを生成する次のステップでは、ライブラリの各残基は、側鎖を固定したままで骨格を回転させた、さらなる構造サンプリングを受けた(Rosettaの反転回転異性体ルーチンを用いて行った)。これに続いて標的との最終的な衝突を収容するためのさらなるリドッキングが行われた。図20Dおよび図4、ステップ3Dを参照。このステップは、骨格立体構造の数を増加させ、設計法の次のステップでマッチするスキャフォールドを発見する可能性を高めた。2RUのインシリコ親和性閾値を達成したすべての立体構造が、反転ホットスポットライブラリに加えられた。図20Dは、F92ホットスポットの場合の、反転ホットスポットライブラリの代替骨格立体構造の生成を示す。左パネルには、代替側鎖相互作用保存配向が示される。これらの立体構造は、代替アルファ位炭素(白丸で示される)の数を増やすため、リドッキングおよび骨格サンプリングを実行するのに用いられる。得られる立体構造ライブラリは、右のパネルに提示される。
さらに、異なるホットスポットに属するライブラリ内の別の立体構造は、それらが独立して生成されたためにしばしば重複した。したがって、相補的なホットスポット対の確率を最大にするため、ホットスポット−スキャフォールドマッチング手順中に、重複するホットスポットを除去した。最終的なホットスポット立体構造ライブラリは、残基Y89について27の異なるポーズ、残基F92について60のポーズ、およびF91について71のポーズを含んでいた。
ステップ4−スキャフォールドマッチング
標準的な化学合成によって到達可能なペプチドを選択することにより、PDBデータベースからスキャフォールドのセットを選択した。35アミノ酸以下のペプチドが選択された。膜貫通ペプチド、および受容体との相互作用によって安定化された二次構造を有しない線状ペプチドは除外された。約300ペプチドのセットが回収され、計算システムに入力され、その多くは毒素であり、複数のシステイン架橋によって安定化された。構造の大部分はNMRで決定され、複数のモデルを含んでいた。その後、すべてのモデルを反転ホットスポットライブラリと標的とのマッチングに用いた。(図4、ステップ4:スキャフォールドマッチング、ステップ4A〜C)。アルゴリズムの計算中、L−スキャフォールドは、L−骨格を含む反転ホットスポットとマッチする。
マッチングを実行するために、各L−スキャフォールドをD−標的のエピトープ上に300回ドッキングした。各ポーズについて、ホットスポットライブラリからドッキングしたL−スキャフォールド上に、少なくとも2つの残基をグラフトする試みを行った。ドッキングされたポーズがホットスポットグラフトのステップに適合していれば、表面の相補性を改善し、標的とのさらなる相互作用を形成するよう、スキャフォールドのパラトープの残りの部分を再設計した。有意な内部の歪みがなく、Rosettaスコアリング関数(図6、ステップ4C)から標的との重大な衝突がない、グラフトされたホットスポットを有し得るスキャフォールドのみが、さらに検討された(図6、ステップ4E)。
ステップ5−ヒット同定
その野生型に対して10未満の変異数を示し、RosettaのDGスコアが−8RU未満(全設計中の最大スコアの50%)であり、接触表面積が少なくとも1000Å2であるスキャフォールドのみを、さらに次のステップで検討した。図20Eおよび図7、ステップ5A〜Cを参照。ヒット同定段階で選択された閾値はそれほど厳しいものではなかった。図20Eは、ホットスポットマッチングを示し、ここで、2つの反転したホットスポット残基F91およびF92の立体構造とマッチするL−スキャフォールドヒット(PDBID1ROO)の例が示される。
ステップ6−最適化
スキャフォールドを過剰に変異させるとフォールディングに影響する可能性があるため、変異の重要性につきインシリコでの推定値が計算された(図8、ステップ6A)。これは、2つのスコアの差(すなわち、2つの計算された結合親和性またはDDGの間の差)を計算することによって行われ、1つは変異体のスコア、他方は野生型に戻る変異を有する変異体のスコアである(図8、ステップ6B)。変異が−0.5RU以上のDDGをもたらすことが判明した場合、その変異は無視できるものに分類された。このような無視できる変異はすべて野生型に戻る変異であり、一連の野生型に戻る変異(図8、ステップ6D)によって、有意な変異のみを伴う設計を含む、多数の設計を作成した(図8、ステップ6C)。ステップ6Eおよび6Fは、この例ではスキップされたが、使用されてもよい。この段階で、9個以上の変異を有する設計をライブラリから除外した(図8、ステップ6G)。
可変性を生み、親和性を向上させるため、ヒットライブラリ中の各エントリについて、設計されたリガンドのパラトープにおける単一変異のさらなる2ラウンドを試みた(図8、ステップ6H〜6Nループ)。ヒットライブラリに変異体を加えるため、各新規構造についてこれらのすべての基準を同時に保持する必要があった:複合体形成時に表面積の1000Å2以上の変化、−8RU未満のDGスコア、変異の数<9、および変異後のDDGの変化<−0.5RU(無視できない変異)(図8、ステップ6J〜K参照)。
複合体が局所的に撹乱されてリドッキングされる連続的な計算が実行された(図8、ステップ6I)。新しい構造は、以前の基準のセットが同時に満たされた場合にのみ許容された。変異の最終ラウンドは、リドッキングされたヒットのセットに対して実行された。ここでも、ヒットライブラリに含まれる変異したリガンドについて、同じ基準が同時に有効である必要があった(図8、ステップ6J〜K)。
手順の最後に、冗長設計(同じ配列を有するリガンド)を除去した。すべての構造の最終的な視覚的検査は、最終セットを減少させ、人為的結果を回避するために用いられ得る[図4、ステップ6−ヒット最適化]。リドッキングおよび変異の結果として元のホットスポット配向を失ったヒットはすべて除外された(図8、ステップ6P)。
残基の変異、最適化およびインシリコ結合親和性の推定を含む、上記のこれらすべてのステップにつき、Rosettaモデリングパッケージが使用されたが、多くの手順は市場で入手可能な様々なモデリングパッケージを用いて実施することができ、または開発することができる。用いられる閾値は、異なるスコアリング関数に対して較正することができる。ヒットリストに対照のセットが追加された。陰性対照は、最も有望なインシリコリガンドを採用し、WTアミノ酸がホットスポットと化学的に有意に異なる場合は常にそれぞれのホットスポットを対応する野生型アミノ酸に変異させることによって作成した。それ以外は、標的とのホットスポット相互作用を破壊するために、ホットスポットを著しく化学的に異なる残基に変異させた。これらの陰性対照は、「ホットスポットノックアウト」と呼ばれる。野生型配列も陰性対照として含まれていた。
ステップ7−鏡像反転
シーケンスの最終セットは、シーケンス内の大文字のアミノ酸略語をシーケンス内の小文字の略語に変換する単純なテキスト操作によって「鏡像反転」された[図4、ステップ7:ヒット鏡像反転]。このような大文字から小文字への操作により、すべてのL−アミノ酸がD−アミノ酸に変換され、したがって、それらはD−タンパク質へと変化した(例えば、非キラルなグリシンg=Gについて)。スキャフォールド1ROOの最終ペプチドライブラリを表1に示す。非標準アミノ酸は、以下の記号で示された:「<」3−ナフチル−D−アラニン、「x」D−ノルロイシン。ノックアウトは、ホットスポットアミノ酸フェニルアラニンをグルタミン酸に変異させることによって設計された。
ステップ8−合成およびスクリーニング
すべてのD−タンパク質は、通常のFmocベースの固相ペプチド化学のルーチンを使用して合成した。得られた線状D−タンパク質について90+%の純度基準を実施し、これをHPLC(純度)と質量分析(同一性)の組み合わせにより個々のすべての場合について評価した。すべてのD−タンパク質は、個々の1.0mgのアリコート中の固体、凍結乾燥物質として送達された。タンパク質は、それぞれの機能的形態に折りたたまれた。
CNTO6785の結合部位におけるIL17AへのD−タンパク質の潜在的結合を評価するために、既知の競合体である抗体CNTO6785、センチリンWPW−Hisに対するELISA競合アッセイでD−タンパク質をスクリーニングした。エピトープへの特異的結合を示すために、陰性対照抗体CAT2200を、IL17A上の異なる非重複エピトープに結合するように採用した。IL17Aで実行された競合ELISAの結果を図21に示す。図21は、最適化ヒットDP142137(左のグラフ)、野生型DP141050(中央のグラフ)およびホットスポットノックアウトDP141063(右のグラフ)の競合ELISAの結果を示す。上のグラフは、センチリンWPWとの競合を示し、下のグラフは、非重複エピトープに結合する抗体CAT2200との競合を示す。応答は濃度の対数関数としてプロットされる。
19のタンパク質のライブラリ(陰性対照−WTおよび2つのノックアウトを含む)から、pIC50が4.2(64μM)であり、すべての陰性対照について活性の欠如を示す、1つのヒットが同定された。陰性対照には、以下のものが含まれた:リードDP142137の、非重複エピトープに結合する抗体であるCAT2200との競合;野生型スキャフォールドDP141050の、センチリンWPWとの競合;野生型スキャフォールドDP141050の、CAT2200との競合;2つのノックアウトDP141063およびDP141065の、センチリンWPWとの競合;および2つのノックアウトDP141063およびDP141065の、CAT2200との競合。陰性対照はいずれも、DP142137およびセンチリンWPW競合に対する明確な結合曲線と比較して、活性を示さなかった。本実施例は、本明細書に記載の方法を標的のためのリガンドの設計に用いることができ、物理的リガンドが物理的標的に結合することを示すために、設計されたリガンドを構築し、試験することができることを示す。
実施例2:インフルエンザヘマグルチニンに結合するD−タンパク質の計算的設計
この実施例では、L−標的インフルエンザH1ヘマグルチニンに結合することができるD−タンパク質リガンドを設計するために、広範に中和する抗体FI6のFABとH1インフルエンザヘマグルチニン(HA)との間の複合体の構造が用いられる。D−タンパク質リガンドの1つのクラスは、FI6のエピトープと重複するエピトープへの結合について、デザイナータンパク質HB80.4リガンドとの競合を示すこと、およびHAヘッド結合抗体と競合しないことが示される。さらに、デザイナーD−タンパク質リガンドは、X線結晶学の手段によって、L−標的のFI6エピトープに結合することが確認される。
ステップA:データ取得。D−タンパク質結合剤をHAに設計するための出発点は、H1 HAと広範に中和する抗体FI6(PDB ID 3ZTN)との間の複合体の結晶構造であった。失われた水素原子を加え、側鎖を再構築し、Rosettaでリパックした。その後、モデルは、20の独立した最適化の実行の中で最低のスコアを選択することによって最適化された。各最適化プロセスには、一連のプレパック、骨格最適化、極小化、FABの局所的リドッキング、それに続くさらなる極小化およびプレパックが含まれた。骨格は、減少した複合体の完全な最適化が最終的な立体構造に影響を及ぼす可能性があるため、最小限の変化のみが許容された。5ラウンドの最適化が実行され、各ラウンド後に最良スコアを有する複合体が選択され、次の最適化ラウンドに入力された。すべてのステップで、この特定の残基がリパック中の回転異性体の状態を有意に変化させ、代替回転異性体の状態がH1 HA結晶構造と一致しない、という観察の後、中央エピトープ残基W21(HA2サブユニット)の側鎖が限定された。Rosettaスコアの5ラウンドの最適化および収束後、複合体は次のステップに用いる準備ができたものとみなされた。
ステップ1:仮定ホットスポット。パラトープに属する各残基は、FAB環境から単離された後に局所的に最適化された。これは、FABの非存在下でアミノ酸相互作用が保持されているかどうかを調べるために行われた(図4、ステップ1)。4つの残基−L100A、Y100C、F100DおよびW100Fは、2.5RU未満のDG(例えば、計算された結合自由エネルギー)を有すると同定され、FAB環境から取り除かれたときの元の相互作用を保存した。同じ残基は、標的とのほとんどの原子接触を形成するものとして最初に同定され、視覚的検査によってホットスポットとしてタグ付けされた。すべての指標に基づき、4つのアミノ酸がD−タンパク質リガンドの設計の出発点として選択され、以降ホットスポットと呼ばれる。
ステップ2:鏡像反転。HA−ホットスポットL−複合体は、キラリティの変化を反映するように、L−複合体のPDBファイルのx座標の符号を変更し、残基名を変更することによって、D−複合体に鏡像反転した。
ステップ3:ホットスポットライブラリの生成。それぞれのホットスポット残基はその骨格キラリティが反転され(ここでは、各ホットスポットの骨格はL−キラリティで再構築された)、いわゆる「反転ホットスポット」となった。骨格再生の手順は、元のアミノ酸骨格を取り、側鎖を固定したまま、Hα、CαおよびCβを横切るミラーを通して骨格原子のみを反転させることを含む。骨格反転は、Pymol APIを用いてPythonスクリプトで実行された。
反転ホットスポットのそれぞれについて、標的と適合するポーズのセットが生成され、ホットスポットライブラリに追加された。すべての反転ホットスポットにおいて、疎水性接触を含む結晶構造相互作用の保存が設定条件であった。水素結合した残基Y100CおよびW100Fには、特定の水素結合の存在も設定された。代替ポーズを得るために、各反転ホットスポットをRosettaでリドッキングした。インシリコで算出された親和性が少なくとも2RUであり、側鎖の相互作用が再現されたとき、ポーズがライブラリに追加された。反転ホットスポットライブラリを生成する最終ステップでは、ライブラリの各残基は、側鎖を固定したままで骨格を回転させた、さらなる立体構造サンプリングを受けた(Rosettaの反転回転異性体ルーチンを用いて行った)。これに続いて標的との最終的な衝突を収容するためのさらなるリドッキングが行われた。2RUのインシリコ親和性閾値を達成したすべての立体構造が、反転ホットスポットライブラリに加えられた。最後に、ホットスポットライブラリには、L100Aについて486のポーズ、Y100Cにつき316ポーズ、F100Dにつき431ポーズ、およびW100Fにつき531ポーズが含まれていた。
ステップ4−スキャフォールドマッチング。ホットスポットライブラリからの反転ホットスポットの異なる組み合わせをスキャフォールドとのマッチングに使用した。FWL、LY、LF、LW、およびFWの組み合わせの反転ホットスポットが試験された。実施例1と同じスキャフォールドセットをホットスポットライブラリとのマッチングに用いた。マッチングを実行するために、各スキャフォールドをD−標的のエピトープ上に30回ドッキングした。各ポーズについて、ライブラリからドッキングしたスキャフォールド上に、少なくとも2つの残基をグラフトする試みを行った。ドッキングされたポーズがホットスポットグラフトのステップに適合していれば、表面の相補性を改善し、標的とのさらなる相互作用を形成するよう、スキャフォールドのパラトープの残りの部分を再設計した。有意な内部の歪みがなく、Rosettaスコアリング関数から標的との重大な衝突がない、グラフトされたホットスポットを有し得るスキャフォールドのみ
ステップ5−ヒット同定。その野生型に対して10未満の変異数を示し、RosettaのDDGスコアが−8RU未満(全設計中の最大スコアの50%)であり、接触表面積が少なくとも1000Å2であるスキャフォールドのみを、さらに次のステップで検討した。図7、ステップ5A〜Cを参照。ヒット同定段階で選択された閾値はそれほど厳しいものではなかった。
ステップ6−最適化。野生型スキャフォールドのすべての変異がフォールディングに影響する可能性があるため、過剰な変異を減少させるために、各変異がどれほど重要であるかにつきインシリコでの推定値が計算された(図8、ステップ6)。これは、2つのスコアの差(すなわち、2つの計算された結合親和性またはDDGの間の差)を計算することによって行われ、1つは変異体のスコア、他方は野生型に戻る変異を有する変異体のスコアである(図8、ステップ6B)。変異が−0.5RU以上のDDGをもたらすことが判明した場合、その変異は無視できるものに分類された。このような無視できる変異はすべて野生型に戻る変異であり、一連の野生型に戻る変異(図8、ステップ6D)によって、無視できる変異を伴わない設計を含む、多数の設計を作成した(図8、ステップ6C)。ステップ6Eおよび6Fでは、陰性対照が作成される。これらの例では、陰性対照は野生型配列のみであったので、これらのステップはスキップされた。最後に、9個以上の変異を有する設計をヒットライブラリから除外した(図8、ステップ6G)。
可変性を生み、親和性を向上させるため、ヒットライブラリ中の各エントリについて、設計されたリガンドのパラトープにおける単一変異のさらなる2ラウンドを試みた(図8、ステップ6H〜6Nループ)。ヒットライブラリに変異体を加えるため、各新規構造についてこれらのすべての基準を同時に保持することが望ましい:複合体形成時に表面積の1000Å2以上の変化、−8RU未満のDGスコア、変異の数<9、および変異後のDDGの変化<−0.5RU(無視できない変異)(図8、ステップ6J〜K参照)。
複合体が局所的に撹乱されてリドッキングされる連続的な計算が実行された(図8、ステップ6I)。新しい構造は、以前の基準のセットが同時に満たされた場合にのみ許容された。変異の最終ラウンドは、リドッキングされたヒットのセットに対して実行された。ここでも、ヒットライブラリに含まれる変異したリガンドについて、同じ基準が同時に有効であった(図8、ステップ6J〜K)。
手順の最後に、冗長設計(例えば、同じ配列を有するリガンド)を除外した。最終セットを減少させるためには、すべての構造につき最終的な視覚的検査が必要であった(図4、ステップ6−ヒット最適化)。リドッキングおよび変異の結果として元のホットスポット配向を失ったヒットはすべて除外された(図8、ステップ6P)。
残基の変異、最適化およびインシリコ結合親和性の推定を含む、上記のすべてのステップにつき、Rosettaモデリングパッケージが使用されたが、多くの手順は市場で入手可能な様々なモデリングパッケージを用いて実施することも、または後に開発することもできる。用いられる閾値は、異なるスコアリング関数に対して較正する必要がある。
ステップ7−鏡像反転。シーケンスの最終セットは、大文字のシーケンスを小文字に変換する単純なテキスト操作によって「鏡像反転」された。(図4、ステップ7:ヒット鏡像反転)。このような操作の結果、すべてのL−アミノ酸がD−アミノ酸に変換され、したがって、設計がD−タンパク質になる(非キラルなグリシンg=Gについて)。スキャフォールド2LJSの最終ペプチドライブラリを表2に示す。非標準的アミノ酸は、以下の記号で示された:「!」はD−ホモフェニルアラニンを意味し、「b」はD−ホモロイシンを意味する。
ステップ8−合成およびスクリーニング
スクリーニングのための機能的D−タンパク質の合成および調製については、実施例1を参照。インフルエンザヘマグルチニンのステムエピトープに結合するD−タンパク質リガンドをスクリーニングするために、D−タンパク質リガンドは、デザイナータンパク質HB80.4との競合につきELISAアッセイでスクリーニングされた。D−タンパク質リガンドの結合が特異的であることを示すために、非競合ヘッド結合抗体CR11054を対照として採用した。競争Elisaの結果が図22に示される。図22は、最適化ヒットDP142093(左のグラフ)、最適化ヒットDP141751(中央のグラフ)および野生型DP141753(右のグラフ)の競合ELISAの結果を示す。上のグラフはHB80.4との競合を示し、下のグラフは非重複エピトープに結合するヘッド結合抗体CR11054との競合を示す。応答は濃度の対数関数としてプロットされる。
8つのタンパク質(陰性対照を含む)のライブラリから、pIC50が4.1(88μM)であり、陰性対照の活性の欠如を示す、1つのヒットが同定された。陰性対照には、以下のものが含まれた:ヒットDP142093の、非重複エピトープに結合する抗体であるCR11054との競合;野生型スキャフォールドDP141753の、HB80.4との競合;および野生型スキャフォールドDP141050の、CR11054との競合。最良の化合物に対する競合が弱いにもかかわらず、図22の曲線は、デザイナーD−タンパク質と野生型との間の明確な差異を示す。DP142093およびDP141751はいずれも、ステム結合(stem binding)HB80.4との競合について明らかなS字曲線を示すが、ヘッド結合抗体CR11054については、競合(平坦な曲線)はない。野生型タンパク質DP141753は、最高濃度まで競合を示さず、これは人為的結果である可能性が非常に高い。本明細書に提示されたインシリコのアプローチで設計されたインフルエンザHAのステムにDP142093が結合することの代替的な実験的証拠を得るために、DP142093およびHAを共結晶化した。得られた共結晶構造を図23に示す。図は、D−タンパク質が模倣しようとする抗体FI6との共結晶の隣に、結晶化した複合体を示す。X線構造により、D−タンパク質が鋳型抗体と同じエピトープに結合することが確認される。本実施例は、本明細書に記載の方法を標的のためのリガンドの設計に用いることができ、物理的リガンドが物理的標的に結合することを示すために、設計されたリガンドを構築し、試験することができることを示す。
本明細書における実質的に任意の複数形および/または単数形の用語の使用に関して、当業者は、文脈および/または用途に適切であるように、複数形から単数形および/または単数形から複数形に変換することができる。様々な単数形/複数形の置換は、明確化のために本明細書に明示的に記載されてもよい。
一般的に、本明細書、および特に添付の特許請求の範囲(例えば、添付の特許請求の範囲の本文)で用いられる用語は、一般的に、「オープンな(open)」用語として意図されることが当業者に理解されるであろう(例えば、「含んでいる(including)」という用語は「含んでいるがそれに限定されない」と解釈されるべきであり、「有する(having)」という用語は「少なくとも有する」と解釈されるべきであり、「含む(includes)」という用語は、「含むがそれに限定されない」と解釈されるべきである、など)。さらに、当業者には、導入された特許請求の範囲の記述につき特定の数が意図される場合、そのような意図は特許請求の範囲に明示的に記述されるものであり、そのような記述がない場合、そのような意図が存在しないことが理解されよう。例えば、理解の補助として、以下の添付の特許請求の範囲は、特許請求の範囲の記述を導入するため、「少なくとも1つ」および「1つ以上」という導入句の使用を含み得る。しかしながら、そのような句の使用は、たとえ同じ特許請求の範囲が「1つ以上」または「少なくとも1つ」という導入句、および「a」または「an」などの不定冠詞を含む場合であっても(例えば、「a」および/または「an」は、「少なくとも1つ」または「1つ以上」を意味すると解釈されるべきである)、不定冠詞「a」または「an」による特許請求の範囲の記述の導入が、そのような導入された特許請求の範囲の記載を含む特定の特許請求の範囲のいずれかを、そのような記述を1つのみ含む実施形態に限定することを意味すると解釈されるべきではない。同じことが、特許請求の範囲の記述を導入するために用いられる定冠詞の使用にも該当する。さらに、導入された特許請求の範囲の記述に特定の数が明示的に記述される場合であっても、当業者には、そのような記載が少なくとも記述された数を意味すると解釈すべきであることが認識されよう(例えば、他の修飾語なしに単に「2つの記述」と記述された場合、少なくとも2つの記述、または2つ以上の記述を意味する)。さらに、「A、B、およびCなどの少なくとも1つ」に類似の条件が用いられる例では、一般的に、そのような構成は、当業者がその条件を理解するであろう意味を意図したものである(例えば、「A、B、およびCのうちの少なくとも1つを有するシステム」は、A単独、B単独、C単独、AとBを一緒に、AとCを一緒に、BとCを一緒に、ならびに/またはA、BおよびCを一緒に有するシステムなどを含むが、これらに限定されない)。「A、B、またはCなどの少なくとも1つ」に類似の条件が用いられる例では、一般的に、そのような構成は、当業者がその条件を理解するであろう意味を意図したものである(例えば、「A、B、またはCのうちの少なくとも1つを有するシステム」は、A単独、B単独、C単独、AとBを一緒に、AとCを一緒に、BとCを一緒に、ならびに/またはA、BおよびCを一緒に有するシステムなどを含むが、これらに限定されない)。さらに、当業者には、2つ以上の代替用語を提示する、実質的に任意の離接的な語および/または句は、明細書、特許請求の範囲、または図面であるかどうかにかかわらず、用語のうちの1つ、いずれかの用語、または両方の用語を含み可能性を企図するものと理解されるべきことが理解されよう。例えば、「AまたはB」という句は、「A」または「B」または「AおよびB」の可能性を含むと理解されよう。
さらに、開示の特徴または態様がマーカッシュグループに関して記載されている場合、当業者には、本開示が、マーカッシュグループの構成要素の任意の個々の構成要素またはサブグループに関しても記載されることが認識されよう。
当業者によって理解されるように、記載された説明を提供することなどの任意のかつすべての目的のために、本明細書に開示されたすべての範囲はまた、任意のかつすべての可能な部分的範囲およびその部分的範囲の組み合わせを包含する。任意の列挙された範囲は、十分に記載されており、同じ範囲を少なくとも同等の半分、3分の1、4分の1、5分の1、10分の1などに分解できると容易に認識することができる。非限定的な例として、本明細書で説明する各範囲は、下3分の1、中3分の1および上3分の1などに容易に分解することができる。当業者によってまた理解されるように、「〜まで(up to)」、「少なくとも」などのすべての文言は記述された数字を含み、引き続いて上で説明したように部分的な範囲に分割することができる範囲を指す。最後に、当業者によって理解されるように、ある範囲は個々の構成要素それぞれを含む。このように、例えば、1〜3個の細胞を有するグループは、1個、2個、または3個の細胞を有するグループを指す。同様に、1〜5個の細胞を有するグループは、1個、2個、3個、4個、または5個の細胞を有するグループを指し、以下同様である。
以上のことから、本開示の様々な実施形態が説明のために本明細書に記載されており、本開示の範囲および精神から逸脱することなく様々な修正がなされ得ることが理解されよう。したがって、本明細書に開示された様々な実施形態は、以下の特許請求の範囲によって示される真の範囲および精神と共に、限定することを意図するものではない。
本明細書中に列挙されるすべての参考文献は、その全体が具体的参照により本明細書に組み込まれる。