DE60312330T2 - Verfahren zur vorhersage der bindungsaffinität der mhc-peptid-komplexe - Google Patents

Verfahren zur vorhersage der bindungsaffinität der mhc-peptid-komplexe Download PDF

Info

Publication number
DE60312330T2
DE60312330T2 DE60312330T DE60312330T DE60312330T2 DE 60312330 T2 DE60312330 T2 DE 60312330T2 DE 60312330 T DE60312330 T DE 60312330T DE 60312330 T DE60312330 T DE 60312330T DE 60312330 T2 DE60312330 T2 DE 60312330T2
Authority
DE
Germany
Prior art keywords
peptide
mhc
class
collection
binding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60312330T
Other languages
English (en)
Other versions
DE60312330D1 (de
Inventor
Ignace Lasters
Johan Desmet
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lonza Biologics PLC
Original Assignee
Algonomics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Algonomics NV filed Critical Algonomics NV
Publication of DE60312330D1 publication Critical patent/DE60312330D1/de
Application granted granted Critical
Publication of DE60312330T2 publication Critical patent/DE60312330T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/20Protein or domain folding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Peptides Or Proteins (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Description

  • Die vorliegende Erfindung betrifft ein Verfahren zur Struktur-basierten Vorhersage von Eigenschaften von Peptiden und Peptidanaloga im Komplex mit Haupthistokompatibilitäts(MHC)-Molekülen der Klasse I und Klasse II. Die besagten Eigenschaften betreffen vor allem die dreidimensionale Struktur eines MHC/Peptid-Komplexes und die Bindungsaffinität eines Peptids für einen MHC-Rezeptor. Die Erfindung betrifft des Weiteren ein Computerprogramm und eine Vorrichtung dafür. Die Erfindung betrifft ferner die mittels eines Verfahrens der Erfindung hergestellten Daten. Die Erfindung betrifft zudem Peptide und Peptidanaloga, für die vorhergesagt wurde, dass sie an Ziel-MHC-Moleküle binden. Die vorliegende Erfindung betrifft daher das Gebiet der Immunologie, mit möglichen Anwendungen bei der Herstellung von Impfstoffen, der De-Immunisierung von Proteinen und der Herstellung von therapeutischen Wirkstoffen, insbesondere immuntherapeutischen Wirkstoffen.
  • Zytotoxische T-Zellen (TC- oder CD8-T-Lymphozyzten) und T-Helferzellen (TH- oder CD4-T-Lymphozyten) haben die Fähigkeit kurze, prozessierte Fragmente eines Proteinantigens, die als Antigenpeptide oder T-Zellepitope bezeichnet werden, zu erkennen. Die Erkennung ereignet sich jedoch nicht durch direkte Bindung an freie Peptide. Spezifische Rezeptormoleküle auf T-Zellen (T-Zellrezeptoren oder TCRs) erkennen ein Peptidantigen nur, wenn es an einen anderen Rezeptor, der als Haupthistokompatibilitätskomplex (MHC)-Molekül bekannt ist, gebunden ist. Solche MHC-Peptidkomplexe übernehmen die Rolle von Zellmarkern: Wenn der MHC ein endogenes (Selbst-)Peptid enthält, markiert er die Zelle als „gesund"; wenn er ein Fremdpeptid enthält, ist die Zelle als „infiziert" markiert. Die MHC-vermittelte Präsentation von Antigenpeptiden gegenüber dem T-Zellrepertoire kann daher als der primäre Stimulus gesehen werden, um eine Immunantwort auszulösen. In Abhängigkeit von dem ein Antigen präsentierenden Typ von MHC, der in Zusammenhang mit dem Zelltyp steht, der ihn exprimiert, wird das Immunsystem ausgelöst, um entweder die Antigen-präsentierende Zelle zu zerstören oder um Antikörper zu produzieren, die gegen den infektiösen Wirkstoff gerichtet sind.
  • MHC-Moleküle werden in die Klassen I und II unterteilt. Während ihre allgemeine Funktion die gleiche ist (das Präsentieren von Antigen), unterscheiden sie sich in einer Anzahl von Aspekten. MHC der Klasse I wird auf der Zelloberfläche als heterodimärer Komplex zwischen einer 46 kDa Schweren Kette (der α-Kette) und einer 12 kDa Leichten Kette (das β2-Mikroglobulin oder die β2m-Kette) exprimiert. Die α-Kette besteht aus drei Domänen, α1, α2 und α3; die α1- und α2-Domänen sind für die Bindung eines Peptidliganden verantwortlich, während die α3-Domäne Membran-gebunden ist und an der Bindung des CD8-Korezeptors beteiligt ist. MHC-Moleküle der Klasse II haben die gleiche Gesamtgestalt, obwohl sie sich aus zwei Membran-gebundenen Ketten zusammensetzen: Einer α-Kette von ∼35 kDa und eine β-Kette von ∼28 kDa. Sowohl die α- als auch die β-Kette bilden zwei Domänen (α1 und α2 auf der einen Seite und β1 und β2 auf der anderen). Die α1- und β1-Domänen bilden zusammen die Peptidbindedomäne. Die β2-Domäne ist an der CD4-Korezeptorbindung beteiligt.
  • Sowohl MHC-Moleküle der Klasse I als auch der Klasse II zeigen einen hohen Grad an Polymorphismus. Sie sind in verschiedene Subtypen weiter unterteilt worden. Die Existenz verschiedener MHC-Allotypen liegt der Fähigkeit der MHCs zugrunde, eine große Bandbreite an Peptiden zu binden, während sie immer noch eine gewisse Spezifität beibehalten. In Anbetracht dieses Polymorphismus denkt man, dass die Möglichkeit vorherzusagen, welche Peptide spezifisch an welche MHC-Subtypen binden, von großem Wert bei Impfstrategien und in De-Immunisierungsprogrammen ist. Dank der Informationsflut in letzter Zeit, die von experimentell bestimmten 3D-Strukturen abgeleitet wurde, wurden wertvolle Einblicke in die Determinanten der Peptidbindespezifität erhalten. Das wiederum hat zu der Idee geführt, dass eine Strukturbasierte Vorhersage potentieller Antigenpeptide (oder T-Zellepitopen) in Reichweite ist.
  • Funktionelle menschliche Leukozytenantigene (HLAs oder menschliche MHCs) sind durch eine tiefe Bindungsgrube gekennzeichnet, an die endogene ebenso wie potentielle Antigenpeptide binden. Die Grube ist ferner durch eine gut definierte Gestalt und physicochemische Eigenschaften gekennzeichnet. HLA- Bindestellen der Klasse I sind insofern geschlossen, dass die Peptidtermini in den Enden der Grube festgehalten werden. Sie sind auch an einem Netzwerk von Wasserstoffbindungen mit konservierten HLA-Resten beteiligt (Madden, D. R. et al., (1992) Cell 70, 1035–1048). In Anbetracht dieser Beschränkungen ist die Länge der gebundenen Peptide auf 8–10 Reste beschränkt. Die Überlagerung der Struktuuen verschiedener HLA-Komplexe bestätigte eine allgemeine Bindungsart, wobei Peptide eine relativ lineare, gestreckte Konformation einnehmen. Gleichzeitig wurde auch eine signifikante Variabilität in der Konformation verschiedener Peptide beobachtet. Diese Variabilität erstreckt sich von geringfügigen strukturellen Unterschieden bis hin zu beachtlich unterschiedlichen Bindungsweisen. Solch eine Variation ist nicht unerwartet in Anbetracht der Tatsache, dass Moleküle der Klasse I tausende von verschiedenen Peptiden binden können, die in ihrer Länge (8–10 Reste) und in ihrer Aminosäuresequenz variieren. Die verschiedenen Allotypen der Klasse I binden Peptide, die ein oder zwei konservierte Aminosäurereste an spezifischen Positionen gemein haben. Diese Reste werden als Ankerreste bezeichnet und werden begleitet von komplementären Taschen (Falk, K. et al., (1991) Nature 351, 290–296). Neben den Hauptankern gibt es auch sekundäre Ankerreste, die in flacheren Taschen gelegen sind (Matsumura, M. et al., (1992) Science 257, 927–934). Insgesamt wurden sechs Allel-spezifische Taschen genannt A-F charakterisiert (Saper, M. A. et al., (1991) J. Mol. Biol. 219, 277–312; Latron, F. et al., (1992) Science 257, 964–967). Der Aufbau dieser Taschen variiert in Übereinstimmung mit dem Polymorphismus der Moleküle der Klasse I, was einen hohen Spezifitätsgrad (beschränkte Kreuzreaktivität) unter Beibehaltung einer breiten Bindekapazität zur Folge hat.
  • Im Gegensatz zu HLA- Bindestellen der Klasse I sind die Stellen der Klasse II an beiden Enden offen. Das erlaubt den Peptiden sich aus dem tatsächlichen Bindungsbereich herauszuerstrecken, wodurch sie an beiden Enden „heraushängen" (Brown, J. et al., (1993) Nature 364, 33–39). HLAs der Klasse II können daher Peptidliganden variabler Länge, im Bereich von 9 bis mehr als 25 Aminosäurereste, binden. Ähnlich wie bei der HLA-Klasse I wird die Affinität eines Liganden der Klasse II von einem „konstanten" und einem „variablen" Bestandteil bestimmt. Der konstante Teil resultiert erneut aus einem Netzwerk von Wasserstoffbindungen, die zwischen konservierten Resten in der Grube des HLA der Klasse II und der Hauptkette eines gebundenen Peptids gebildet wird. Dieses Wasserstoffbindungsmuster ist jedoch nicht auf die N- und C-terminalen Reste des Peptids beschränkt, sondern ist über die gesamte Kette verteilt. Letzteres ist wichtig, weil es die Konformation komplexierter Peptide auf eine strikt lineare Bindungsweise beschränkt. Das ist allen Allotypen der Klasse II gemein. Der zweite Bestandteil, der die Bindungsaffinitiät eines Peptids bestimmt, ist aufgrund bestimmter Positionen für Polymorphismus innerhalb von Bindestellen der Klasse II variabl. Verschiedene Allotypen bilden verschiedene komplementäre Taschen innerhalb der Grube, wodurch zur Subtypabhängigen Selektion von Peptiden oder Spezifität beigetragen wird. Wichtig ist, dass die Beschränkungen der Aminosäurereste, die innerhalb von Taschen der Klasse- II gehalten werden, im Allgemeinen „lockerer" sind als jene für die Klasse I. Es gibt viel mehr Kreuzreaktivität von Peptiden innerhalb von verschiedener HLAAllotypen der Klasse II. Anders als bei der Klasse I war es unmöglich, Muster hochkonservierter Reste in Peptidliganden (sog. Motive) zu identifizieren, die mit den Allotypen der Klasse II korrelieren.
  • Die verschiedenen Charakteristika der MHC-Moleküle der Klasse I und Klasse II sind für spezifische Probleme verantwortlich, die mit der Vorhersage potentieller T-Zellepitope zusammenhängen. Wie zuvor diskutiert, binden Moleküle der Klasse I kurze Peptide, die gut definierte Restetypmuster aufweisen. Das hat zu verschiedenen Vorhersageverfahren geführt, die auf experimentell bestimmten, statistischen Präferenzen für bestimmte Restetypen an spezifischen Positionen in dem Peptid basieren. Obwohl diese Verfahren relativ gut arbeiten, beschränken Unsicherheiten, die mit den nicht-konservierten Positionen zusammenhängen, ihre Genauigkeit. Vorhersageverfahren für MHC-Klasse-II-vermittelte T-Zellepitope folgen im Wesentlichen der gleichen Strategie, werden aber durch die Tatsache behindert, dass die Bindungsgrube offen ist. Letzteres macht es schwierig in einer Ansammlung von Peptiden, die als bindend identifiziert wurden, das 9-Reste-Segment, das tatsächlich für die Bindung verantwortlich ist, zu ermitteln. Diese Tatsache, zusammen mit den intrinsisch schwächeren Beschränkungen der komplementären Taschen in Bindungsgruben der Klasse II, macht die Etablierung von (Pseudo)-Motiven sehr schwierig (Mallios, R. R. (2001) Bioinformatics 17, 942–948). Auf der anderen Seite schließen Peptidbindemotive der Klasse II im Allgemeinen mehr Ankerreste ein als Motive der Klasse I.
  • Die Verfahren zur Vorhersage von MHC/Peptidbindung können grob in zwei Kategorien unterteilt werden: „statistische Verfahren", die von experimentell erhaltenen Affinitätsdaten vorangetrieben werden und „Struktur-bezogene Verfahren", die auf der verfügbaren 3D-Stukturinformation für MHC-Moleküle basieren.
  • Die statistischen Verfahren sind unter dem Druck einer wachsenden Menge an Bindungsdaten gefördert worden. Die Quellen für Bindungsinformation sind im Üblichen Elutions- und Sammelsequenzierung von Peptiden, die natürlich an MHC-Moleküle innerhalb von Zellen gebunden sind (Falk, K. et al., (1994) Immunogenetics 39, 230–242), Phagendisplay von Peptidbibliotheken (Hammer, J. et al., (1993) Cell 74, 197–203, Fleckenstein, B et al., (1999) Sem. Immunol. 11, 405–416), Datensätze, die aus Berichten aus der Literatur zusammengestellt wurden (Brusic, V. et al., (1998) Nucleic Acids Res. 26, 368–371, Rammensee, H.G. et al., (1999) Immunogenetics 50, 213–219). Eine allgemeine Herangehensweise ist auf statistische Weise die verfügbare experimentelle Information in MHC-Typ-spezifische und Peptidrestpositions-spezifische numerische Werte zu zerlegen, die die Präferenz für individuelle Aminosäuretypen an dieser Position wiedergeben (Parker, K. C. et al., (1994) J. Immunol. 152, 163–175). Die auf diese Weise erhaltenen Matrizen können dann als Profile dienen, aus denen die Bindungsaffinität einer Peptidsequenz von Interesse abgeschätzt werden kann.
  • Struktur-basierte Verfahren schließen im Allgemeinen einen ersten Schritt ein, in dem die Struktur eines spezifischen MHC/Peptidkomplexes modelliert wird, und einen zweiten Schritt, in dem die Bindungsstärke des Peptids ausgehend von dem modellierten Komplex in Übereinstimmung mit einer empirischen Punktewertfunktion abgeschätzt werden. Beispiele schließen WO 98/59244, Altuvia, Y. et al., (1995) J. Mol. Biol. 249, 244–250; Doytchinova, I. A. und Flower, D.R. (2001) J. Med. Chem. 44, 3572–3581) mit ein. Alternativ wird manchmal eine molekulare Dynamiksimulation durchgeführt, um ein Peptid innerhalb einer MHC-Bindungsgrube zu modellieren (Lim; J. S. et al. (1996) Mol. Immunol. 33, 221–230). Eine andere Herangehensweise ist, die Schleifenmodellerstellung mit simulierter Anlagerung zu kombinieren (Rognan, D. et al., (1999) J. Med. Chem. 42, 4650–4658). Die meisten Forschungsgruppen betonen die Bedeutung der Punktewertfunktion, die im Affinitätsvorhersageschritt verwendet wird. Schueler-Furman et al. (Schueler-Furman, O. et al., (2000) Prot. Sci. 9, 1838–1864) wenden ein statistisches Potenzial an, um die Kontakte zwischen dem Peptid und dem MHC-Rezeptor zu bewerten. Rognan et al. (1999) verlassen sich auf die Quantifizierung physicochemischer Effekte (wie H-Bindungsbildung, lipophile Kontakte, Desolvation, etc.). Swain et al. (Swain, M. T., et al., (2001) Proceedings of the second IEEE International Symposium on Bioinformatics and Biomedical Engineering. IEEE computer Society Press, Bethesda, Maryland, S. 81–88) wenden auch eine heuristische Punktewertfunction basierend auf Zwischenatomkontakten, elektrostatischen Wechselwirkungen und H-Bindungsbildung an. Doytchinova und Flower (2001) berücksichtigen im Prinzip dieselben Verteilungen, folgen aber einem quantitativen Struktur-Affinitäts-Beziehungs-(QSAR)-Verfahren, um die Bindungsaffinität einzuschätzen. Logean et al. (Logean, A. et al., (2001) Bioinorg. & Med. Chem. Letters 11, 675–679) haben die Leistung von 7 universellen Punktewertfunktionen analysiert. Sie haben herausgefunden, dass viele dieser Punktewertfunktionen eine schwache Korrelation mit dem Experiment ergeben, im Gegensatz zu ihrer „Fresno"-Punktewertfunktion. Es wurde jedoch auch erkannt, dass die Fresno-Funktion nicht universell angewandt werden kann, sondern der Rekalibrierung für verschiedene Protein-Liganden-Systeme bedarf.
  • Es gibt Bedarf sowohl die Strukturvorhersage als auch die Affinitätsbewertungsschritte von Verfahren zu verbessern, die die Affinität eines Peptids für ein Haupthistokompatibilitäts(MHC)-Molekül der Klasse I oder Klasse II vorhersagen. Das Hauptproblem, dem man sich in diesem Gebiet gegenübersieht, ist die schwache Leistung der Vorhersagealgorithmen hinsichtlich der MHC-Allele, für die experimentell bestimmte Daten (sowohl Bindungs- als auch Strukturinformation) spärlich sind. Es ist ein Ziel der vorliegenden Erfindung ein neues Verfahren zur Vorhersage der Affinität eines Peptids für Haupthistokompatibilitäts(MHC)-Moleküle der Klasse I oder Klasse II auch in Fallen wo experimentelle Information selten ist, zur Verfügung zu stellen.
  • Die vorliegende Erfindung betrifft ein Verfahren für die Vorhersage der Bindungsaffinität eines Peptids für ein Haupthistokompatibilitäts(MHC)-Molekül der Klasse I oder Klasse II, wobei das Verfahren die folgenden Schritte umfasst:
    • a) Empfangen einer Darstellung einer vollständigen oder partiellen dreidimensionalen Struktur eines MHC-Moleküls der Klasse I oder Klasse II,
    • b) Erhalten einer Sammlung an Darstellungen von Peptidrückgratstrukturen des Peptids, wobei sich die Darstellungen innerhalb der Bindungsstelle des MHC-Moleküls befinden,
    • c) Modellerstellung für jede Peptidrückgratstruktur der Sammlung in Bezug auf das MHC-Molekül, wenigstens der Seitenketten des Peptids, wodurch eine Sammlung modellierter MHC/Peptid-Komplexe erhalten wird, und
    • d) Evaluieren der Bindungseigenschaften des Peptids für das MHC-Molekül, wobei das Evaluieren wenigstens die folgenden Schritte umfasst:
    • d1) Evaluieren von einer oder mehreren Komponente(n) der potentiellen Energie jedes Komplexes der Sammlung und
    • d2) Evaluieren der Konformationsentropie für die vollständige Sammlung.
  • Ein akkurates und effizientes Verfahren wird zur Verfügung gestellt, welches eine dreidimensionale Struktur verwendet, um die Bindungsaffinität eines MHC-Molekül/Peptid-Komplexes vorherzusagen. Es erfüllt den Bedarf strukturelle und physiochemische Daten zu Peptid-MHC-Komplexen zu erhalten, ohne dass Laborausrüstung, Platz, Fachkenntnisse und Zeit benötigt werden. Des Weiteren stellt es die Mittel zur Verfügung, große Zahlen von potentiellen Antigenpeptiden zu durchmustern und stellt des Weiteren die Mittel zur Erzeugung einer Datenbank zur Verfügung, die auf Trends untersucht werden kann oder die als Grundlage für andere Experimente verwendet werden kann.
  • Ein Schritt, der eine Sammlung von Rückgratstrukturen erhält, und ein separater Schritt, der die Seitenketten modelliert, bieten die Vorteile den Konformationsplatz des Rückgrats effizienter abzufragen, die Berechnungszeit, die benötigt wird, um die Seitenketten zu modellieren, zu reduzieren, und stellt ein präziseres Gesamtmodell des Komplexes (der Komplexe) zur Verfügung.
  • Die Kombination von potentieller Energie und Konformationsentropie im Bewertungsschritt führt zu einer verbesserten Genauigkeit bei der Vorhersage der Bindungsaffinität. Die vorliegenden Erfinder haben die überraschende Verbesserung in der Korrelation zwischen experimentell bestimmten und vorhergesagten Bindeaffinitäten, wenn beide Bestandteile explizit berechnet werden, vorhergesagt.
  • In einer Ausführungsform der vorliegenden Erfindung wird die Darstellung aus Schritt (a) aus einem der Folgenden gewonnen:
    • – eine oder mehrere experimentell bestimmte Struktur(en), die beispielsweise mittels Röntgenkristallographie, kernmagnetischer Resonanzspektroskopie, Abtastungsmikroskopie gewonnen wurde(n) oder
    • – ein oder mehrere Modell(e), das/die von einer oder mehreren experimentell bestimmte(n) Strukturen) abgeleitet ist/sind, wobei die experimentell bestimmten Strukturen eine hohe Sequenzidentität mit dem MHC-Molekül besitzen.
  • Die Möglichkeit, experimentell bestimmte Strukturen zu verwenden führt zu einer genaueren Vorhersage der Affinität des Komplexes, weil die besagten Strukturen experimentell validiert worden sind und einen höheren Grad an Genauigkeit haben können. Die Möglichkeit Computermodellierte Strukturen zu verwenden, kann die Vorhersage von Affinitäten von Peptiden für MHC-Moleküle in Komplexen, für die keine oder nur teilweise MHC-Molekülstrukturen existieren, erlauben. Da mehr MHC-Moleküle bekannt sind, als experimentell Strukturen aufgelöst worden sind, erlaubt die Verwendung modellierter Strukturen die Vorhersage von ansonsten nicht-erhältlichen Komplexaffinitätsdaten, was den wachsenden Bedarf an solcher Information deckt.
  • In einer anderen Ausführungsform der vorliegenden Erfindung wird die Darstellung in Schritt (b) mittels eines Computer-gestützten Modellerstellungsverfahrens erzeugt, wobei dieses Verfahren in der Lage ist, multiple energetisch günstige Rückgratkonfigurationen in Bezug auf das MHC-Molekül zu erzeugen. Die Verwendung der Modellerstellung, um die Darstellung zu erzeugen, erlaubt es, den verfügbaren Konformationsraum effizient abzufragen, beispielsweise in einer Weise, die spezifisch für die Sequenz des Peptids ist. Das stellt eine Validierung für erlaubte Konformationen dar, und kann auch eine genauere Bewertung von Eigenschaften des Komplexes zur Verfügung stellen.
  • In einer anderen Ausführungsform der vorliegenden Erfindung wird die Darstellung in Schritt (b) aus einer Bibliothek an Peptidstrukturen, die in Bezug auf das MHC-Molekül vororientiert sind, abgefragt. Die Verwendung einer Bibliothek stellt die Möglichkeit einer drastischen Verringerung der Berechnungszeit pro Peptid zur Verfügung, da eine Alternative die Verwendung von Simulationen ist, die aufgrund des großen Suchraums extrem anspruchsvoll hinsichtlich der Berechnungszeit sind. Ein indirekter Vorteil ist die Tatsache, dass die Vorhersagegenauigkeit verbessert werden kann, weil eine große Anzahl an vororientierten Peptidstrukturen abgefragt werden kann, und mehr Aufmerksamkeit der wichtigen Seitenkettenplatzierung und den Affinitätsvorhersageschritten gewidmet werden kann.
  • In noch einer weiteren Ausführungsform der vorliegenden Erfindung wird ein Komplex innerhalb der Sammlung in Schritt (c) aus einem Seitenketten-Platzierungsalgorithmus gewonnen. Die Verwendung eines Seitenketten-Platzierungsalgorithmus entkoppelt die Seitenkette von der Hauptketten-Probennahme, wodurch eine Möglichkeit zur Verfügung gestellt wird, die Geschwindigkeit und Genauigkeit der Berechnung zu erhöhen.
  • In noch einer weiteren Ausführungsform der vorliegenden Erfindung umfasst die Seitenkettenplatzierung in Schritt (c) nicht nur die Platzierung der Seitenketten des Peptids selbst, sondern umfasst auch die Platzierung von wenigstens einer Seitenkette des MHC-Moleküls, die mit dem Peptid in Kontakt ist. Die Verwendung sowohl einer Seitenketten-Platzierung für das Peptid als auch MHC-Moleküle stellt die Möglichkeit zur Verfügung, genauere Modelle zu erzeugen und daher die Genauigkeit der vorhergesagten Affinität des Komplexes zu erhöhen.
  • In noch einer weiteren Ausführungsform der vorliegenden Erfindung wird ein Komplex innerhalb der Sammlung in Schritt (c) aus einem Seitenketten-Platzierungsalgorithmus, der für eine globale Seitenketten-Optimierung geeignet ist, gewonnen. Die globale Optimierungsplatzierung von Seitenketten ergibt im Vergleich zur lokalen Optimierung generell genauere Vorhersagen.
  • In noch einer weiteren Ausführungsform der vorliegenden Erfindung umfasst der Seitenkettenplatzierungsalgorithmus eines oben erwähnten Verfahrens einen Dead-End-Eliminations(DEE)-Algorithmus, dadurch gekennzeichnet, dass der DEE-Algorithmus Rotamerkonformationen auf der Grundlage eines mathematischen Kriteriums eliminiert, das den Nachweis von Konformationen erlaubt, die mit der globaloptimalen Konformation nicht kompatibel sind. Die DEE-Herangehensweise ist bei der Lösung des Kombinationssuchproblems bei der Reduzierung der Anzahl an möglichen Rotameren, die getestet werden müssen, hilfreich, wodurch die Geschwindigkeit der globalen Seitenkettenoptimierung außerordentlich erhöht wird.
  • In noch einer weiteren Ausführungsform der vorliegenden Erfindung umfasst der Seitenketten-Platzierungsalgorithmus eines oben erwähnten Verfahrens einen FASTER-Algorithmus (Desmet J. et al. (2002) Proteins 48, 31–43), wobei der Algorithmus durch einen wiederholten Störungs(perturbation), Entspannungs-(relaxation) und Evaluierungsschritt gekennzeichnet ist. Der FASTER-Algorithmus verbessert die Seitenkettenvorhersagegenauigkeit bei geringen Berechnungskosten, und trifft daher Vorkehrungen für genauere Vorhersagen der Bindungsaffinität.
  • In noch einer weiteren Ausführungsform der vorliegenden Erfindung werden die Bindungseigenschaften in Schritt (d) eines oben erwähnten Verfahrens dargestellt durch einen einzelnen Punktewert für die gesamte Sammlung an MHC/Peptidkomplexen, wobei der Punktewert die Summe der Konformationsentropie für die vollständige Sammlung an MHC/Peptid-Komplexen und den Mittelwert der energetischen Komponenten jedes Komplexes der Sammlung umfasst. Die Konformationsentropie ist eine grundlegende Eigenschaft eines Komplexes, die vorzugsweise aus einer Struktursammlung berechnet wird. Die explizite Einbeziehung der Konformationsentropie trägt auf vorteilhafte Weise zu der Korrelation zwischen vorhergesagten und experimentellen Affinitäten bei. Ferner erlaubt der Einbau signifikanter energetischer Bestandteile in Kombination mit einer Entropiekomponente eine genauere Bewertung der Affinität des Komplexes.
  • In noch einer weiteren Ausführungsform der vorliegenden Erfindung wird die Bindungsaffinität in Schritt (d) eines oben erwähnten Verfahrens für den globalen Komplex evaluiert, wodurch Wechselwirkungen zwischen Restepaaren des Peptids, des MHC-Moleküls und sowohl des Peptids als auch des MHC-Moleküls berücksichtigt werden. Die Verwendung der Globalbewertung, die Wechselwirkungen zwischen den Restepaaren berücksichtigt, stellt eine genauere Bewertung der globalen Energie des Systems zur Verfügung und stellt daher ein exakteres Maß der Affinität des Komplexes zur Verfügung.
  • In noch einer weiteren Ausführungsform der vorliegenden Erfindung spiegelt die Entropiekomponente eines oben erwähnten Verfahrens die allgemeine Konformationsflexibilität des Peptids wider. Konformationsflexibilität ist eine grundlegende Eigenschaft von Komplexen, die nicht trivial simuliert oder quantifiziert werden kann. Ferner kann die Simulation und Quantifizierung der Konformationsflexibilität nützliche Erkenntnisse zur Verfügung stellen.
  • In noch einer weiteren Ausführungsform der vorliegenden Erfindung werden die Darstellungen des in der Bibliothek enthaltenen Peptids eines oben erwähnten Verfahrens abgeleitet von experimentell bestimmten Strukturen. Das Vorliegen experimentell bestimmter Strukturen in der Bibliothek stellt die Möglichkeit zur Verfügung, Strukturen zu verwenden, die experimentell bestätigt wurden. Die Strukturen können einen höheren Grad der Genauigkeit haben und konsequenterweise zu einer genaueren Vorhersage der Affinität des Komplexes führen.
  • In noch einer weiteren Ausführungsform der vorliegenden Erfindung werden die Darstellungen des in der Bibliothek enthaltenen Peptids eines oben erwähnten Verfahrens von Computererzeugten Strukturen abgeleitet, wobei die Strukturen mit dem oben beschriebenen Computergestützten Modellerstellungsverfahren erzeugt werden. Das Vorliegen von Computermodellierten Strukturen in der Bibliothek kann die Vorhersage von Peptidaffinitäten für MHC-Moleküle in Komplexen erlauben, für die keine oder nur teilweise Strukturinformation verfügbar ist. Weil nur wenige Komplexstrukturen experimentell aufgelöst worden sind, erlaubt die Verwendung von modellierten Strukturen die Struktur-basierte Affinitätsvorhersage für Komplexe unbekannter Struktur, was den wachsenden Bedarf an solcher Information deckt.
  • In noch einer weiteren Ausführungsform der vorliegenden Erfindung umfasst ein Peptid eines oben beschriebenen Verfahrens eine oder mehrere nicht-natürlicherweise vorkommende Aminosäure(n). Die Verwendung von nicht-natürlicherweise vorkommenden Aminosäuren stellt die Möglichkeit zur Verfügung, Affinitätsdaten für Verbindungen zu gewinnen, in denen das Merkmal zusätzliche Eigenschaften zur Verfügung stellt, beispielsweise eine therapeutische Eigenschaft, erhöhte in vivo-Stabilität, erhöhte intrinsische Aktivität, verringerte Toxizität.
  • In noch einer weiteren Ausführungsform betrifft die Erfindung ein Verfahren zur Herstellung eines Immunogenpeptids, das ein MHC-Klasse I- oder Klasse II-beschränktes T-Zellepitop umfasst, das an das MHC-Molekül der Klasse I oder Klasse II bindet und eine MHC-Klasse I- oder -II-beschränkte zytotoxische T-Zellantwort induziert, wobei das Verfahren die folgenden Schritte umfasst:
    • (a) zur Verfügung stellen einer Aminosäuresequenz eines Polypeptids von Interesse;
    • (b) Zubereiten von einem oder mehreren überlappenden putativen immunogenen Peptidfragmenten des Polypeptids von Interesse, beispielsweise bestehend aus 8 bis 20 Aminosäuren;
    • (c) Erhalten einer Darstellung einer kompletten oder teilweise dreidimensionalen Struktur des MHC-Moleküls der Klasse I oder Klasse II,
    • (d) Erhalten einer Sammlung an Darstellungen von Peptidrückgratstrukturen der putativen immunogenen Peptide, wobei sich die Darstellungen innerhalb der Bindungsstelle des MHC-Moleküls befinden,
    • (e) Modellerstellung für alle Peptidrückgratstrukturen der Sammlung in Bezug auf das MHC-Molekül, wenigstens der Seitenketten des putativen immunogenen Peptids, wodurch eine Sammlung modellierter MHC/Peptid-Komplexe erhalten wird,
    • (f) Evaluieren der Bindungseigenschaften des putativen immunogenen Peptids für das MHC-Molekül, wobei das Evaluieren wenigstens die folgenden Schritte umfasst: (f1) Evaluieren von einer oder mehreren Komponente(n) der potentiellen Energie eines jeden Komplexes der Sammlung, (f2) Evaluieren der Konformationsentropie für die vollständige Sammlung eines jeden MHC/Peptidkomplexes,
    • (g) Ableiten von einem oder mehreren putativen immunogenen Peptid(en), das/die an das MHC-Molekül bindet/binden, aus den in (f) erhaltenen Ergebnissen,
    • (h) ggf. Zubereiten von einem oder mehreren der putativen immunogenen Peptide des Polypeptids von Interesse,
    • (i) ggf. Testen der Komplexe des einen oder der mehreren putativen immunogenen Peptide des MHC-Moleküls auf eine Eignung, von MHC-zytotoxischen T-Zellen erkannt zu werden und dadurch eine zytotoxische T-Zellantwort auf das Epitop zu induzieren, und
    • (e) (ggf.) Auswählen des einen oder der mehreren putativen immunogenen Fragmente, die eine MHC-Bindungsstelle der Klasse I oder Klasse II umfassen, die eine MHC-Klasse I- oder Klasse II-zytotoxische T-Zellreaktion gegen das Epitop induziert.
  • In einer bevorzugten Ausführungsform bestehen das eine oder die mehreren überlappenden putativen immunogenen Peptidfragmente des Polypeptids von Interesse aus 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25 oder mehr Aminosäuren.
  • In einer weiteren Ausführungsform der vorliegenden Erfindung wird die Darstellung in Schritt (c) aus einem der Folgenden gewonnen:
    • – eine oder mehrere experimentell bestimmte Struktur(en), die beispielsweise mittels Röntgenkristallographie, kernmagnetischer Resonanzspektroskopie, Abtastungsmikroskopie gewonnen wurde oder
    • – ein oder mehrere Modell(e), das/die von einer experimentell bestimmten Struktur abgeleitet ist/sind, wobei die experimentell bestimmte Struktur eine hohe Sequenzidentität mit dem MHC-Molekül besitzt.
  • In einer weiteren Ausführungsform der vorliegenden Erfindung wird die Darstellung in Schritt (d) mittels eines Computer-gestützten Modellerstellungsverfahrens erzeugt, wobei dieses Verfahren in der Lage ist, multiple energetisch günstige Rückgratkonfigurationen in Bezug auf das MHC-Molekül zu erzeugen.
  • In einer weiteren Ausführungsform der vorliegenden Erfindung wird die Darstellung in Schritt (d) aus einer Bibliothek an Peptidstrukturen abgefragt, die in Bezug auf das MHC-Molekül vororientiert sind.
  • In einer noch weiteren Ausführungsform der vorliegenden Erfindung wird ein Komplex innerhalb der Sammlung in Schritt (e) aus einem Seitenketten-Platzierungsalgorithmus gewonnen.
  • In einer weiteren Ausführungsform der vorliegenden Erfindung umfasst die Seitenketten-Platzierung in Schritt (e) nicht nur die Platzierung der Seitenketten des Peptids selbst, sondern auch die Platzierung von wenigstens einer Seitenkette des MHC-Moleküls, die mit dem Peptid in Kontakt ist.
  • In einer weiteren Ausführungsform der vorliegenden Erfindung wird ein Komplex innerhalb der Sammlung in Schritt (e) aus einem Seitenketten-Platzierungsalgorithmus gewonnen, der für eine globale Seitenketten-Optimierung geeignet ist.
  • In einer weiteren Ausführungsform der vorliegenden Erfindung ist der Seitenketten-Platzierungsalgorithmus ein Dead-End-Eleminations-(DEE)-Algorithmus, dadurch gekennzeichnet, dass der DEE-Algorithmus Rotamerkonformationen auf der Grundlage eines mathematischen Kriteriums eliminiert, das den Nachweis von Konformationen erlaubt, die mit der global-optimalen Konformation nicht kompatibel sind.
  • In einer weiteren Ausführungsform der vorliegenden Erfindung ist der Seitenketten-Platzierungsalgorithmus ein FASTER-Algorithmus, wobei der Algorithmus durch einen wiederholten Störungs-(pertubation), Entspannungs-(relaxation) und Evaluierungsschritt gekennzeichnet ist.
  • In einer weiteren Ausführungsform der vorliegenden Erfindung wird die Bindungsaffinität in Schritt (f) durch einen einzelnen Punktewert für die gesamte Sammlung an MHC-Peptid-Komplexen dargestellt, wobei der Punktewert die Summe der Konformationsentropie für die vollständige Sammlung an MHC-Peptid-Komplexen und den Mittelwert der energetischen Komponenten jedes Komplexes der Sammlung umfasst.
  • In einer weiteren Ausführungsform der Erfindung wird die Bindungsaffinität in Schritt (f) für den globalen Komplex evaluiert, wodurch Wechselwirkungen zwischen Restepaaren des Peptids, des MHC-Moleküls und sowohl des Peptids als auch des MHC-Moleküls berücksichtigt werden.
  • In einer weiteren Ausführungsform der Erfindung spiegelt die Entropiekomponente die allgemeine Konformationsflexibilität des Peptids wider.
  • In einer weiteren Ausführungsform der Erfindung, wobei die Darstellungen des in der Bibliothek enthaltenen Peptids von experimentell bestimmten Strukturen abgeleitet sind.
  • In einer weiteren Ausführungsform der vorliegenden Erfindung werden die Darstellungen des in der Bibliothek enthaltenen Peptids von Computer-erzeugten Strukturen abgeleitet, wobei die Strukturen mit dem Computer-gestützen Modellerstellungsverfahren gemäß Anspruch 18 erzeugt sind.
  • In noch einer weiteren Ausführungsform der vorliegenden Erfindung umfasst das Peptid eine oder mehrere nicht-natürlicherweise vorkommende Aminosäure(n).
  • In noch einer weiteren Ausführungsform betrifft die vorliegende Erfindung jedes hierin beschriebene Verfahren, wobei das MHC-Molekül der Klasse I ein HLA-Antigen umfasst, das ausgewählt ist aus einem der HLA-A-, HLA-B-, HLA-C-, HLA-E-, HLA-F- und HLA-G-Genen oder Genprodukten oder einem Genprodukt irgendeines der Allele dieser Gene.
  • In noch einer weiteren Ausführungsform betrifft die vorliegende Erfindung jedes hierin beschriebene Verfahren, wobei das MHC-Molekül der Klasse II ein HLA-Antigen umfasst, das ausgewählt ist aus einem der HLA-DR-, HLA-DQ- und HLA-DP-Gene, Genprodukte oder einem Genprodukt von irgendeinem der Allele dieser Gene. Einige nicht-beschränkende Beispiele für HLA-Allele können beispielsweise unter der folgenden Internetadresse gefunden werden: http://www.anthonynolan.com/HIG/lists/class1list.html.
  • Eine weitere Ausführungsform der vorliegenden Erfindung sind Daten umfassend:
    • – Darstellungen einer oder mehrerer Peptidrückgratstruktur(en), wobei jedes Peptid eine Wechselwirkung mit einem MHC-Molekül der Klasse I oder Klasse II zeigt, und
    • – eine Anzeige des MHC-Moleküls, das mit der Darstellung assoziiert ist.
  • Daten, die Information zu MHC-Molekülen, Peptiden, und Komplexen der beiden umfassen, stellen eine Quelle zur Dataminierung von beispielsweise therapeutisch nützlichen Peptiden zur Verfügung. Strukturinformation, dargestellt als Daten, umgeht den Bedarf, die Strukturen unter Verwendung von Verfahren aus dem Stand der Technik zu modellieren, wodurch eine wesentliche Zeit- und daher Kostenersparnis zur Verfügung gestellt wird.
  • Eine weitere Ausführungsform der vorliegenden Erfindung ist ein Computerprogramm, das auf einem Computer-lesbaren Träger gespeichert Berechnungsroutinen für die Evaluierung der Bindungsaffinität eines Peptids an MHC-Moleküle der Klasse I oder Klasse II umfasst, wobei die Routinen Folgendes umfassen:
    • – Empfang einer Sammlung an Darstellungen der Strukturen des Komplexes zwischen dem MHC-Molekül und dem Peptid,
    • – Evaluieren der potentiellen Energie jedes Komplexes in der Sammlung,
    • – Evaluieren der Konformationsentropie für die vollständige Sammlung.
  • Eine Computerroutine zur Evaluierung der Bindungsaffinität eines Peptids an ein MHC-Molekül stellt den Vorteil der Geschwindigkeit zur Verfügung und erlaubt die Integration mit anderen Routinen. Durch Integration der Routine entsteht beispielsweise die Möglichkeit der Automatisierung, des effizienten Datentransfers und die Bereitstellung von Werkzeugen für die Dateninterpretation.
  • Eine weitere Ausführungsform der vorliegenden Erfindung ist ein Computerprogramm wie oben beschrieben, das zudem die Modellierung für jede Peptidrückgratstruktur dieser Sammlung in Bezug auf das MHC-Molekül, zumindest die Seitenketten des Peptids umfasst.
  • Eine weitere Ausführungsform der vorliegenden Erfindung ist ein Computerprogramm wie oben beschrieben, wobei die Peptidrückgratstrukturen durch eine Computer-gestützte Modellerstellung oder durch Abfragen einer Datenbank gewonnen werden.
  • Eine weitere Ausführungsform der vorliegenden Erfindung ist eine Vorrichtung zur Evaluierung der Bindungsaffinität eines Peptids an ein MHC-Molekül der Klasse I oder Klasse II, wobei die Vorrichtung Folgendes umfasst:
    • – Empfang einer Sammlung an Darstellungen von Strukturen des Komplexes zwischen dem MHC-Molekül und dem Peptid,
    • – Evaluieren der potentiellen Energie jedes Komplexes in der Sammlung,
    • – Evaluieren der Konformationsentropie für die vollständige Sammlung.
  • Eine Vorrichtung, die ein Verfahren der vorliegenden Erfindung ausführt, befreit den Verwender von der Aufgabe, dieses Verfahren durchzuführen und bietet dadurch Zeit- und Kostenersparnis.
  • Eine weitere Ausführungsform der vorliegenden Erfindung ist ein (unbekanntes) Peptid, das MHC-Moleküle der Klasse I oder Klasse II bindet, wobei das Peptid mittels Verwendung eines oben erwähnten Verfahrens gewonnen werden kann.
  • Eine weitere Ausführungsform der vorliegenden Erfindung ist ein (unbekanntes) Peptid, das MHC-Moleküle der Klasse I oder Klasse II bindet, wobei das Peptid mittels Verwendung eines oben beschriebenen Verfahrens gewonnen wurde.
  • Eine weitere Ausführungsform der vorliegenden Erfindung ist eine Nukleinsäure, die für ein Peptid wie oben definiert kodiert (oder dazu in der Lage ist).
  • Eine weitere Ausführungsform der vorliegenden Erfindung ist eine Nukleinsäure von mindestens 15 Nukleotiden Länge, die spezifisch mit der Nukleinsäure, wie oben definiert, hybridisiert (oder dazu in der Lage ist).
  • Eine weitere Ausführungsform der vorliegenden Erfindung ist ein Antikörper, der spezifisch ein Peptid, wie oben definiert, erkennt.
  • Eine noch weitere Ausführungsform der vorliegenden Erfindung ist ein Antikörper der spezifisch eine Nukleinsäure, wie oben definiert, erkennt.
  • Eine noch weitere Ausführungsform der vorliegenden Erfindung ist ein Verfahren zur Herstellung eines Peptids, wie oben definiert, wobei das Verfahren Folgendes umfasst:
    • (i) Kultivieren der Wirtszellen, die eine Nukleinsäure entsprechend wie oben definiert, umfassen, unter Bedingungen, die die Expression des Peptids erlauben, und,
    • (ii) Rückgewinnung des hergestellten Peptids aus der Kultur.
  • Noch eine weitere Ausführungsform der vorliegenden Erfindung ist ein Peptid, wie oben definiert, als Medikament verwendet.
  • Noch eine weitere Ausführungsform der vorliegenden Erfindung ist eine Nukleinsäure, wie oben definiert, als Medikament verwendet.
  • Die vorliegende Erfindung betrifft ein Verfahren für die Struktur-basierte Vorhersage der Affinität potentieller Antigenpeptide für Haupthistokompatibilitäts(MHC)-Rezeptoren. Insbesondere ein Verfahren, um eine quantitative Bewertung der Affinität einer ausgewählten Peptidsequenz für einen ausgewählten MHC-Allotyp zur Verfügung zu stellen durch (i) Analyse der dreidimensionalen Struktur einer MHC-Peptidbindedomäne, (ii) durch Erzeugung multipler Konformationen für das Rückgrat des ausgewählten Peptids, (iii) durch Optimierung- der Seitenkettenkonformation für jede MHC/Peptid-Hauptkettenstruktur, und (iv) durch Berechnen der erwarteten Bindungsaffinität des MHC/Peptid-Komplexes, wobei eine Konformationsentropiekomponente abgeleitet aus dem Satz erzeugter Konformationen mit eingeschlossen wird. Die Anwendung dieses Verfahrens auf multiple Peptide und/oder multiple MHC-Rezeptortypen kann hilfreich sein, um die meisten Antigenpeptide, die aus einer gemeinsamen Quelle herrühren, beispielsweise von einer spezifischen Virus- oder Bakterienspezies oder einem therapeutischen Proteinmolekül, zu identifizieren. Das wiederum kann nützlich bei der Vakzinierung oder bei De-Immunisierungsanwendungen sein.
  • In einer Ausführungsform der vorliegenden Erfindung umfasst ein erster Schritt das Empfangen einer experimentell bestimmten dreidimensionalen (3D)-Struktur für einen ausgewählten MHC-Allotyp der Klasse I oder Klasse II. Wenn eine geeignete 3D-Struktur nicht verfügbar ist, wird sie über Homologie zu einer bekannten Struktur, die vorzugsweise eine maximale Aminosäuresequenzidentität mit dem ausgewählten MHC-Allotyp hat, modelliert. Die empfangene oder modellierte Struktur besteht mindestens aus jenen Aminosäureresten, die die Peptidbindungsstelle bilden.
  • In einem zweiten Schritt werden multiple Konformationen für die Hauptkette des ausgewählten Peptids erzeugt, entweder durch Abfrage einer MHC/Peptidhauptkettenbibliothek oder durch einen geeigneten Computer-gestützten Modellerstellungsalgorithmus, vorzugsweise einen Docking-Algorithmus. Die genannte Bibliothek kann eine Zusammenstellung experimentell bestimmter Strukturen oder im Voraus mittels eines geeigneten Computer-gestützten Modellerstellungsalgorithmus; vorzugsweise eines Docking-Algorithmus, erzeugter Strukturen sein.
  • In einem dritten Schritt wird für jede in Schritt zwei erzeugte Peptidhauptkettenkonformation die Konformation der Seitenketten des ausgewählten Peptids durch Anwendung eines geeigneten Seitenketten-Platzierungsalgorithmus, vorzugsweise eines FASTER- oder eines DEE-Verfahrens, in Verbindung mit einer ersten Energie-basierten Punktewertfunktion, vorzugsweise einer potentiellen oder freien Energiefunktion modelliert. Die Komodellierung der MHC-Rezeptorstruktur mit der des Peptids ist eine bevorzugte Möglichkeit. Das Ergebnis dieses dritten Schritts ist ein Satz Voll-Komplexstrukturen bei atomarer Auflösungsebene.
  • In einem vierten Schritt wird die Sammlung der im dritten Schritt gewonnenen modellierten Strukturen in Übereinstimmung mit einer zweiten Punktewertfunktion, im Folgenden die „Affinitätspunktewertfunktion" genannt, evaluiert. Letztere ist insbesondere geeignet, um die Bindungsaffinität eines Peptidliganden an einen Rezeptor zu evaluieren. Die Affinitätspunktewertfunktion schließt vorzugsweise Bestandteile ein, die die Konformationsenergie, die Auswirkungen des Lösungsmittels; und parametrisierte Aminosäuretyp-basierte Ausdrücke betreffen, mit ein. Ein wesentlicher Bestandteil der Affinitätsfunktion ist die Einbeziehung eines Entropiebeitrags, vorzugsweise abgeleitet in Übereinstimmung mit statistischen Mechanikgesetzen und angewendet auf die vollständige Sammlung modellierter Strukturen, wie im dritten Schritt erzeugt. Die ausdrückliche Erzeugung von Struktursammlungen soll im Wesentlichen der Konformationsfreiheit (oder Flexibilität, Mikro-Zustände, Entropie etc.) des Komplexes Rechnung tragen.
  • Ein Verfahren der vorliegenden Erfindung betrifft die quantitative Vorhersage der Bindungsaffinität eines gegebenen Peptids für einen gegebenen MHC-Allotyp. Ein Verfahren könnte auch multiple Peptide und/oder multiple Rezeptoren durch wiederholte Anwendung des Grundverfahrens für ein Einzelpeptid/Rezeptorsystem angewendet werden.
  • In einer Ausführungsform der Erfindung sind die in Betracht kommenden MHC-Moleküle von beliebiger Klasse, vorzugsweise der Klasse I und Klasse II.
  • In einer weiteren Ausführungsform der vorliegenden Erfindung gibt es keine Beschränkungen bezüglich der Aminosäurezusammensetzung oder der Länge des simulierten Peptids. In einer anderen Ausführungsform beträgt die Länge des simulierten Klasse I-bindenden Peptids weniger als 30 Reste, vorzugsweise weniger als 20 und noch bevorzugter zwischen 8 bis 10 Resten. In einer weiteren Ausführungsform beträgt die Länge der simulierten Peptide der Klasse II weniger als 30 Reste, vorzugsweise weniger als 20 und am bevorzugtesten beschränkt auf Nonapeptide (9-Reste-Peptide) hinsichtlich des experimentellen Beweises, das Fragmente dieser Länge den Kontaktbereich mit der Rezeptorbindungsgrube bilden.
  • Ein Verfahren der vorliegenden Erfindung betrifft die quantitative Vorhersage von Affinitätswerten. Eigenschaften, die direkt in Zusammenhang mit der Bindungsaffinität stehen, umfassen die freie Bindungsenergie, Assoziations-/Dissoziationskonstanten und die IC50-Werte. Die Vorhersage dieser Werte bildet auch einen Teil der Erfindung. Eigenschaften, die indirekt in Zusammenhang mit der Bindungsaffinität stehen, umfassen beispielsweise Assoziations/Dissoziationsraten (on/off-Raten), Immunogenizität und Konformationsflexibilität. Ein Aspekt der vorliegenden Erfindung kann ein Verfahren für die Vorhersage von kinetischen und immunogenen Eigenschaften sein. Ein weiterer Aspekt der vorliegenden Erfindung kann ein Verfahren zur Simulation und Quantifizierung der Konformationsflexibilität sein.
  • Ein Verfahren der vorliegenden Erfindung stellt eine neue Herangehensweise zur Strukturbasierten Vorhersage von MHC/Peptid-Affinitäten zur Verfügung, umfassend die quantitative Bewertung der Affinität einer ausgewählten Peptidsequenz für einen ausgewählten MHC-Allotyp über 4 Berechnungsschritte.
  • Die ersten drei Schritte betreffen die Vorhersage multipler 3D-Strukturen für den ausgewählten MHC/Peptid-Komplex durch schrittweises Hinzufügen von Detailstufen in den sich anschließenden Modellerstellungsschritten. Der vierte Schritt analysiert die Strukturinformation und wendet eine spezifische Punktewertfunktion an, um die Strukturinformation in eine vorhergesagte Peptidbindungsaffinität zu übersetzen. Ein Verfahren der vorliegenden Erfindung umfasst die Schritte 1–4, die wie folgt zusammengefasst werden (siehe auch 1).
  • 1. MHC-Matrizenkonstruktion.
  • Ein geeignetes 3D-Modell für den ausgewählten MHC-Allotyp wird erzeugt, entweder durch Abfrage der Proteindatenbank (PDB) oder mittels eines Standard-Homologiemodellerstellungsverfahrens. Dieses Modell dient als Eingabe-Matrizenstruktur für die nächsten Schritte. Das Modell hat keinerlei Peptidstruktur, d.h. die Bindungsgrube ist „entleert". Nur für die Zwecke dieses Abschnitts wird das Modell als „MHC" bezeichnet.
  • 2. MHC/Peptidhauptkettenkonstruktion.
  • Die MHC-Matrizenstruktur aus Schritt 1 wird mit einer Sammlung von Peptidrückgrat(d.h. Hauptketten)-Konformationen ergänzt. Das führt zu einer Sammlung von 3D-Strukturen, die aus einem strukturellen konstanten Teil, MHC, und einer Vielzahl an Peptidhauptkettenstrukturen bestehen. Nur für die Zwecke dieses Abschnittes wird die Sammlung „{pmc}" genannt. Die Vereinigung von MHC und den multiplen Darstellungen der Peptidrückgrate wird in dieser Beschreibung als „{MHC/pmc}" bezeichnet. Letzterer Strukturensatz kann beispielsweise mittels eines geeigneten Computermodellerstellungsalgorithmus erzeugt werden, der energetisch mögliche Peptidrückgratkonfigurationen in Bezug zu MHC ergibt, zum Zwecke dieser Beschreibung als „Docking-Herangehensweise" bezeichnet. In einem weiteren Beispiel kann der Strukturensatz mittels eines Verfahrens erzeugt werden, das vororientierte Peptidstrukturen aus einer Bibliothek abfrägt, wobei das Verfahren „Datenbank-Herangehensweise" für den Zweck dieser Beschreibung genannt wird. Beide Herangehensweisen werden unten im Detail diskutiert.
  • 3. MHC/Vollpeptidkonstruktion.
  • Ein dritter Schritt betrifft die Hinzufügung und die Modellerstellung von Seitenketten. In Übereinstimmung mit der Aminosäuresequenz des ausgewählten Peptids wird jede Resteposition von pmc in jeder Struktur des Satzes {MHC/pmc} mit der korrigierten Seitenkette zur Verfügung gestellt. Im Falle, dass die korrigierten Seitenketten bereits vorliegen, (beispielsweise, wenn Schritt 2 mittels Docking desselben Peptids durchgeführt wurde), kann der Mutationsschritt übersprungen werden. Wichtiger ist die Modellerstellung eines jeden MHC/pmc. In einer Ausführungsform der vorliegenden Erfindung wird dies mittels eines geeigneten Seitenketten-Platzierungsalgorithmus wie einem FASTER- oder einem DEE-Verfahren erreicht. Die Modellerstellung der Seitenketten muss nicht notwendigerweise beschränkt sein auf jene des Peptids; ein Aspekt der Erfindung ist in diesen Schritt ebenfalls eine Anzahl von MHC-Seitenketten einzubeziehen. Selbst wenn Schritt 2 mittels eines Docking-Verfahrens durchgeführt wurde, erlaubt die Erfindung die Rückmodellierung mindestens aller Rezeptorseitenketten, die mit dem Peptid in Kontakt stehen, zusätzlich zu den Seitenketten des Peptids selbst. Daher liefert Schritt 3 eines Verfahrens der vorliegenden Erfindung eine Sammlung von Vollkomplexstrukturen bei atomarer Auflösung, bezeichnet als {MHC/pfull} zu den Zwecken dieser Beschreibung, wobei die Seitenkettenkonformationen optimal an jede pmc-Struktur hinsichtlich des MHC angepasst sind.
  • 4. MHC/Peptidaffinitätsbewertung.
  • Ein Ziel von Schritt 4 ist es, einen einzelnen Punktewert, der die Bindungsaffinität des ausgewählten Peptids für den ausgewählten MHC-Allotyp widerspiegelt, zu berechnen. Eine Quelle der Eingabedaten ist die Strukturinformation, die in Schritt 3 erhalten wird. Der Endwert des betrachteten Systems wird erhalten durch Anwenden einer Funktion, die zum Zweck der vorliegenden Beschreibung Affinitätspunktewertfunktion, F, genannt wird, die so optimiert wurde, dass sie mit der wahren thermodynamischen freien Bindungsenergie korreliert. Wie weiter unten erklärt werden wird, umfasst diese Funktion vorzugsweise Bestandteile, die in Bezug zur Konformationsenergie, dem Lösungsmitteleinfluss und spezifischen Aminosäuretyp-basierten Ausdrücken, die parametrisiert wurden, stehen. Diese Beitragstypen sind keine Sammlungseigenschaften, d.h. sie werden nicht für jede individuelle Struktur des {MHC/pfull}-Satz berechnet. Dennoch erlaubt das Arbeiten mit multiplen Strukturen oder Sammlungen bestimmte Struktur-abgeleitete Beiträge zu mitteln, wodurch das Niveau des Hintergrundrauschens verringert wird. Die Verarbeitung dieser Beiträge führt zu einem ersten Bestandteil der vorhergesagten Affinität in Form eines mittleren Energiebestandteils für die gesamte Sammlung, genannt <E> für den Zweck der vorliegenden Beschreibung. Ein anderer wesentlicher Bestandteil von F ist der Entropiebeitrag (genannt S für den Zweck der vorliegenden Erfindung), abgeleitet in Übereinstimmung mit statistischen Mechanikregeln und berücksichtigt über eine Gleichung: F = <E> – cS [1].
  • In Gleichung [1] ist c eine parametrisierte Konstante, die theoretisch der absoluten Temperatur (in Grad Kelvin) entspricht, an der das MHC/Peptid-System simuliert wird. Der Entropiebeitrag S wird vorzugsweise als Logarithmus der Anzahl energetisch akzeptabler Strukturen innerhalb des {MHC/pfull}-Satzes genommen. S ist ganz klar eine Sammlungseigenschaft, die die allgemeine Konformationsflexibilität des ausgewählten Peptids in dem Komplex widerspiegelt. Es ist auch bemerkenswert, dass je negativer <E> und je positiver S, umso niedriger wird F und daher umso höher die vorhergesagte Affinität sein, was mit den thermodynamischen Prinzipien übereinstimmt.
  • In Schritt 2 der Erfindung – Erhalten einer Sammlung von multiplen Konformationen für die Hauptkette des in der Ziel-MHC-Bindestelle befindlichen Peptids – werden zwei Mittel zur Erzeugung der Sammlungen als Beispiele vorgeschlagen:
    • (A) Ein Grundverfahren, auch als die „Docking-Herangehensweise" bezeichnet, in dem die Hauptkettenkonformationen oder die „Bindungsmodi" über molekulare Modellerstellung vorzugsweise über Peptid-Docking erzeugt werden.
    • (B) Ein fortgeschrittenes Verfahren, auch bezeichnet als das „Datenbankverfahren", in dem die Peptidhauptkettenkonformationen aus einer Strukturdatenbank abgefragt werden.
  • Eine dem Datenbankverfahren zugrunde liegende Hypothese könnte durch das Folgende erklärt werden: Peptide können nur eine beschränkte Anzahl von Bindungsmodi einnehmen, unabhängig von ihrer Aminosäuresequenz. Unter Annahme des Zutreffens dieser Hypothese, bedeutet dies, dass verschiedene unabhängig durchgeführte Docking-Experimente von Peptiden, die in der Sequenz variieren (aber nicht in der Länge), wahrscheinlich eine teilweise Überlappung zwischen den erzeugten Sammlungen zeigen. In einer formaleren Schriftweise entspricht es der Situation, wo – {MHC/pmc} ∩ {MHC/p'mc} ≠ ∅ [2]
  • Das Zusammenlegen einer ausreichenden Anzahl an Sammlungen, die aus unabhängigen Docking-Experimenten mit verschiedenen Peptidsequenzen resultieren, kann daher zur Etablierung einer verallgemeinerten Sammlung möglicher MHC/pmc-Strukturen führen, hierin als {MHC/Pmc} bezeichnet. Die exakte Aminosäuresequenz jedes Peptids in dieser Sammlung wird dann irrelevant (in Anbetracht der strukturellen Überlappung zwischen den sie bildenden Populationen). Mit anderen Worten, der {MHC/Pmc}-Satz kann als der Struktur-MHC gesehen werden, der mit einer Vielzahl von reinen Peptidrückgratkonformationen oder „Poly-Alanin"-Peptidkonformationen zur Verfügung gestellt wird.
  • Ein Aspekt der vorliegenden Erfindung, in dem die Peptidhauptkettenkonformationen aus einer Bibliothek abgefragt werden, hat Vorteile gegenüber anderen Verfahren. Ein Vorteil ist natürlich die drastische Verringerung der Berechnungszeit pro Peptid. Docking-Simulationen sind oft extrem anspruchsvoll hinsichtlich der Berechnungszeit, wegen des großen Suchraums (letzterer besteht aus drei translationalen, drei rotationalen und einer großen Anzahl von Konformationfreiheitsgraden, was insgesamt einen Gesamtraum mit sehr hoher Dimension ergibt). Ein indirekter Vorteil ist die Tatsache, dass die Vorhersagegenauigkeit verbessert werden kann, weil der wichtigen Seitenkettenplatzierung und der Affinitätsvorhersageschritten mehr Aufmerksamkeit gewidmet werden kann. Schließlich können aus zahlreichen technischen Gründen einige Peptidbindungsmodi in einem Docking-Experiment übersehen werden, wohingegen sie de facto in der allgemeinen Sammlung repräsentiert werden, unter der Bedingung, dass letztere (die Sammlung) den gesamten zugänglichen Raum abdeckt.
  • Eine {MHC/Pmc}-Sammlung hängt nur von zwei Variablen ab: MHC-Allotyp und Peptidlänge. Jede Sequenzinformation kann in Anbetracht des Rahmens einer solchen Sammlung unterdrückt werden: das stellt Peptidhauptkettenbindungsmodi dar. In einer Ausführungsform der vorliegenden Erfindung werden MHC/Pmc-Strukturen vorzugsweise in einem Format gespeichert, in dem die Peptide in Poly-Alanin-Fragmente konvertiert sind. In einer anderen Ausführungsform kann eine allgemeine Datenbank aus verschiedenen MHC-Allotypspezifischen und Peptidlängen-spezifischen Strukturbibliotheken zusammengestellt werden.
  • Solch eine Datenbank kann beispielsweise verwendet werden, um Affinitäten für Peptide verschiedener Länge vorherzusagen oder um die Affinität eines gegebenen Peptids für verschiedene MHC-Typen vorherzusagen.
  • Die detaillierten Schritte eines Verfahrens der vorliegenden Erfindung umfassen das Folgende:
  • 1. Herstellung einer MHC-Matrize.
  • Ein Verfahren der vorliegenden Erfindung benötigt neben einer Anzahl von Ausführungsparametern zwei Grundelemente der Dateneingabe (siehe 2 für einen schematischen Überblick über das gesamte Verfahren). Das erste Element ist die Auswahl eines MHC-Allotypen von Interesse, das zweite ist die Sequenz eines Peptids wie sie in einer Proteinquelle von Interesse vorliegt, beispielsweise einem viralen Protein. Das Auswählen eines MHC-Allotyps ist äquivalent zur Auswahl der Aminosäuresequenz, die das MHC-Allel darstellt. Mit dieser Sequenz (oder einem Bezug darauf) ist es möglich, die Proteindatenbank (PDB) auf Anwesenheit von 3D-Strukturen zu untersuchen, die dieselbe Aminosäuresequenz teilen. Falls solch eine Struktur existiert, kann sie von der PDB abgefragt werden (Berman, H.M. et al., (2000) Nucleic Acids Res. 28, 235–242) und als dreidimensionale MHC-Matrizenstruktur in den weiteren Vorhersageschritten verwendet werden. Im Falle, dass mehr als eine Kandidatenstruktur verfügbar ist, muss der Verwender entscheiden, welche die bevorzugteste Ausgangsstruktur ist. Nützliche Kriterien zu diesem Zwecke sind die kristallographische Auflösung und Verfeinerung, die Abwesenheit fehlender Atome, und/oder die von Strukturvalidierungswerkzeugen wie der Biotec Validation Suite (www.embl-heidelberg.de, und folge den Links darin für die Biotech Validation Suite) verwendeten Kriterien.
  • Für den Fall, dass weder die PDB-Datenbank noch verfügbare Publikationen die Strukturkoordinaten einer identischen Sequenz zu der des ausgewählten MHC-Allotyps beschreiben, kann eine Matrizenstruktur über Homologiemodellerstellung konstruiert werden. Verschiedene Verfahren für die Homolgiemodellerstellung schließen beispielsweise Swiss-Model (Guex, N. und Peitsch, M.C. (1997) Electrophoresis 18, 2714–2723, 1997) oder SCWRL (Bower, M. et al., (1997) J. Mol. Biol. 267, 1268–1282) mit ein. Weil die Modellerstellung für MHC-Bindegruben keine Insertionen oder Deletionen mit einbezieht, kann ein reiner Seitenketten-Platzierungsalgorithums angewendet werden. Um dies zu erreichen, ist ein bevorzugtes Verfahren ein DEE-Verfahren (De Maeyer et al., 2000) oder das FASTER-Verfahren wie durch Desmet et al. beschrieben (Desmet, J. et al., (2002) Proteins 48, 31–43). Sobald eine Matrizenstruktur abgefragt oder modelliert wurde, liegt es innerhalb des Rahmens der vorliegenden Erfindung, sie durch das Durchführen von 100–200 Schritten des steilsten Abstiegs der Energieminimierung oder mittels jeder äquivalenten Energieminimierungsvorgehensweise zu verfeinern. Solche Energieminimierungsmaßnahmen sind eine Standardvorgehensweise in der Proteinmodellerstellung und dienen dazu, mögliche atomare Konflikte oder suboptimale Positionierungen aufzulösen.
  • In einer Ausführungsform der Erfindung umfasst ein Verfahren, dem ein Verwender im fortgeschrittenen Ausführungsmodus, d.h. der Datenbank-Herangehensweise, folgt, lediglich die Auswahl der geeigneten {MHC/Pmc}-Sammlung aus der Datenbank, wobei die Sammlung dem MHC-Allotyp von Interesse entspricht. In diesem Fall kann der MHC-Matrizenkonstruktionsschritt nicht explizit ausgeführt werden, liegt aber implizit in der aus der Datenbank abgefragten Struktur vor.
  • 2. MHC/Peptidhauptkettenkonstruktion.
  • Ein Schritt des vorliegenden Verfahrens ist die Konstruktion einer Sammlung von Peptid-Hauptkettenkonfigurationen {pmc} in Bezug auf die MHC-Matrize, oder {MHC/pmc}. Das ausgewählte Peptid p ist gekennzeichnet durch eine gut definierte Aminosäuresequenz. Es ist logisch anzunehmen, dass die Sequenz von p zumindest einen gewissen Einfluss auf die Sammlung der Bindungsmodi hat oder, mit anderen Worten, dass {MHC/pmc} sequenzspezifisch ist. Auf der anderen Seite legt gerade die Natur der Bindungsgruben von MHC der Klasse I und Klasse II nahe, dass die Anzahl distinkter Bindungsmodi beschränkt ist. Daher könnte die Konstruktion von Peptidrückgraten in mehr als einer Weise durchgeführt werden. Beispielsweise kann eine sequenzspezifische {MHC/pmc}-Sammlung für jedes neue Peptid erzeugt werden. Oder in einem anderen Beispiel könnte eine verallgemeinerte Sammlung {MHC/Pmc} verfügbar gemacht werden, die mindestens den Konformationsraum des ausgewählten Peptids p darstellt. Eine Überrepräsentation des Raums ist kein so großes Problem, weil die verallgemeinerte Sammlung {MHC/Pmc} auf die Peptidspezifische Sammlung {MHC/pmc} in Schritt drei eines Verfahrens, wo MHC-inkompatible Bindungsmodi nach der Seitenkettenplatzierung identifiziert werden, verringert werden kann. Zudem kann die Etablierung einer verallgemeinerten Sammlung auf direkte Art und Weise erreicht werden durch Vereinheitlichung verschiedener Peptid-spezifischer Sammlungen bis eine ausreichende Überlappung zwischen den Populationen beobachtet wird. Konsequenterweise reduziert Schritt zwei eines Verfahrens der vorliegenden Erfindung das Problem der Erzeugung von Peptid-spezifischen {MHC/pmc}-Sammlungen.
  • Ein Beispiel eines Verfahrens zur Konstruktion des Peptidrückgrats findet sich in Desmet et al. (1997, 2000). Dieses Docking-Verfahren ist ein kombinatorischer Algorithmus für flexibles Docking von Peptiden an die Bindungsstelle auf einem Proteinrezeptormolekül, in dem das Peptid von Grund auf in Bezug auf die ausgewählte Rezeptorstruktur konstruiert wird, wobei jede potentielle Zweideutigkeit von einer Ausgangsstruktur des Rezeptor/Peptid-Komplexes vermieden wird. Es ergibt eine Kollektion verschiedener energetisch begünstigter Komplexstrukturen, wobei das Peptid typischerweise zwischen 0 und 500 verschiedene Bindungsstadien einnimmt. Dieses de novo-Peptid-Bindungsverfahren ist daher die am meisten bevorzugte Herangehensweise, um die in Erwägung gezogenen {MHC/pmc}-Sammlungen zu erzeugen.
  • Seine wesentlichen Ausführungsschritte und Charakteristika werden im Folgenden behandelt:
    Das Docking-Verfahren, auf das oben verwiesen wurde, besteht aus einem Kombinationaufbaualgorithmus, der das Peptid „züchtet" („grows") durch schrittweises Hinzufügen eines einzelnen Rests, der eine spezifische Hauptkettenkonformation einnimmt. Für jeden Restetyp gibt es 47 Niederenergie-Hauptkettenrotamere und für jedes Hauptkettenrotamer gibt es verschiedene Anzahlen an Rückgrat-kompatiblen Seitenkettenrotameren. Glycin, Prolin und N- oder C-terminale Reste bilden eine Ausnahme und haben 125, 35 bzw. 12 Hauptkettenrotamere. Die Rotamerbibliothek stellt daher den gesamten Konformationsraum für jeden Restetyp dar.
  • Der Docking-Algorithmus beginnt ausgehend von einem Peptidfragment der Länge eins, d.h. einem vom Nutzer ausgewählten Ursprungsrest (das kann jeder Rest des Peptids sein). Der für den Ursprungsrest zugängliche Raum wird durch Kombination translationaler, rotationaler und konformationaler Untersuchung durchsucht. Translationen und Rotationen werden in Übereinstimmung mit einer Rasterherangehensweise (grid-approach) dikretisiert. Die Konformationsprobennahme wird separat für die Hauptketten- und Seitenkettenteile des Systems durchgeführt. Die Hauptkettenkonformation wird nur für das Peptid variiert, wohingegen die des Rezeptors strikt fixiert gehalten wird. Mögliche Hauptkettenkonformationen für das Peptid, in diesem Fall des Ursprungsrests, werden aus der Hauptkettenrotamerbibliothek (enthaltend hauptsächlich 47 Rotamere pro Restetyp) ausgewählt. Mögliche Seitenkettenkonformationen werden aus einer Rückgrat-abhängigen Seitenkettenrotamerbibliothek abgefragt. Neben den Seitenketten des Ursprungsrests des Peptids können bis zu 40 Seitenketten des Rezeptors simultan modelliert werden. Der Seitenkettenplatzierungsschritt wird vollständig für jede Translations-Rotations-(Rückgrat)-Rotamerkombination des Ursprungsrests wiederholt, wobei ein solcher Schritt ein einzelner Docking-Schritt genannt wird. Die Seitenkettenplatzierung selbst wird mittels eines Standard-DEE-Verfahrens durchgeführt (Desmet et al., 1992). Das Netto-Ergebnis jedes Docking-Schritts ist ein Energiewert, Ebind, der „die Qualität der Übereinstimmung" des Ursprungsrests des Peptids in dem betrachteten Bindungsmodus widerspiegelt. Ebind wird als Rich-Funktion berechnet einschließlich der Wechselwirkungsenergie zwischen dem Peptid(Ursprungs)-fragment und dem Rezeptor, der gesamten Fragmenteigenenergie und der Verstärkung der Rezeptoreigenenergie aufgrund von Konformationsänderungen, die durch das Vorliegen des Fragments induziert werden. Dieser Wert dient als Diskriminator zwischen energetisch-akzeptablen und verbotenen Bindungsmodi (unter Anwendung eines Benutzer-definierten Schwellenwerts). Alle energetisch-akzeptablen Einzelrestfragmente werden zu einem Peptidfragmentspeicher hinzugefügt.
  • Der Aufbau des Peptids setzt sich fort durch Kombinieren jedes zuvor akzeptierten Fragments in dem Speicher mit den verfügbaren Hauptkettenrotameren eines benachbarten Restes. Jede neue Kombination wird erneut individuell über den DEE-basierten Seitenkettenplatzierungsalgorithmus prozessiert. Alle energetisch günstigen Fragmente werden zu dem Peptidfragmentspeicher hinzugefügt. Dieser Aufbauprozess setzt sich fort bis alle Reste des Peptids auf ihre volle Länge ausgedehnt worden sind. Daher enthält am Ende der Peptidfragmentspeicher nur energetisch akzeptable Volllängenpeptide.
  • Ein Aspekt eines Fragmentspeichers ist, dass er nur Information enthalten kann, die in Bezug zum Bindungsmodus der Hauptkette des Peptids steht; ein Bezug auf eine spezifische Konformation der Seitenketten muss nicht gespeichert werden.
  • Eine Ausführungsform der vorliegenden Erfindung ist die Speicherung von Modi, die mittels des Docking-Verfahrens identifiziert wurden, in einer allgemeinen Datenbank von {MHC/Pmc}-Sammlungen. In Anbetracht der Verwendung einer solchen Datenbank bei der zur Verfügung Stellung einer generischen Quelle der Bindungsmodi (d.h. wenn der fortgeschrittene Datenbankbezogene Betriebsmodus auf ein Verfahren der vorliegenden Erfindung angewendet wird) werden die Peptidkonformationen vorzugsweise als Poly-Alanin- oder Poly-Glycin-Konstrukte gespeichert. Die einzige Form der Spezifität in der Datenbank betrifft den MHC-Allotyp und die Länge der generischen Peptidfragmente.
  • 3. MHC/Vollpeptidkonstruktion
  • Schritt 3 eines Verfahrens der vorliegenden Erfindung schließt die Rekonstruktion eines Peptids und gegebenenfalls die Rezeptorseitenkettenkonformationen mit ein, um die Vollkomplexstrukturen zu bilden. Diese Strukturinformation bildet die Hauptquelle an Informationseingabe für den nächsten Schritt 4 des vorliegenden Verfahrens.
  • In Anbetracht der Tatsache, dass die vorliegende Erfindung beinahe ausschließlich auf Eigenschaften basiert, die von vorhergesagten Strukturen abgeleitet werden, steht die Genauigkeit dieses Schritts direkt in Bezug mit der Vorhersagegenauigkeit der Peptidbindungsaffinität, d.h. einem wichtigen Ziel der vorliegenden Erfindung.
  • Die Genauigkeit jeden Seitenkettenplatzierungsverfahrens kann mittels dreier Aspekt bestimmt werden: (i) das Suchverfahren, das verwendet wird, um das optimale globale Seitenkettenarrangement zu bestimmen, (ii) die Rotamerbibliothek aus der potentielle Seitenkettenkonformationen abgefragt werden, und (iii) die Qualität der Punktewertefunktion, die während der Konformationssuche verwendet wird. Eine vierte Determinante der Genauigkeit, d.h. die Kopplung zwischen Hauptketten- und Seitenkettenkonformationsänderungen, wird ebenfalls berücksichtigt. Sie kann implizit aus den obigen berechnet werden, weil die Seitenkettenkonformationen für eine breite Sammlung an Pepitdhauptkettenstrukturen erzeugt werden. Die ersten drei Determinanten der Vorhersagegenauigkeit werden detaillierter diskutiert.
  • 1. Bevorzugtes Seitenkettenkonformationssuchverfahren.
  • Die vorliegenden Erfinder haben kürzlich ein neues Verfahren für die schnelle und genaue Seitenkettenmodellerstellung, genannt das „fast and accurate side-chain topology and energy refinement method" oder FASTER-Verfahren, entwickelt (Desmet et al., 2002). In Anbetracht seiner Eigenschaften ist das FASTER-Verfahren für die Durchführung von Schritt 3 des vorliegenden Verfahrens stark bevorzugt. Der Hauptgrund dafür ist, dass FASTER eine rapide aber genaue Suche für das global-optimale Seitenkettenarrangement erlaubt, was einer der Schlüsselaspekte der vorliegenden Erfindung ist. Insbesondere sind für alle MHC/Pmc-Strukturen der in Schritt 2 erzeugten Sammlung alle Seitenketten des Peptids und eine signifikante Anzahl an Seitenketten aus den MHC-Rezeptor (typischerweise 10–30) simultan modelliert, um das global beste Verpackungsarrangement zu finden. Dadurch wird allen möglichen paarweisen Wechselwirkungen zwischen zwei flexibel behandelten Seitenketten während der Modellerstellung Rechnung getragen. Das steht im Widerspruch zu anderen Verfahren (z.B. Swain et al., 2001) die nur die Seitenkettenkonformationen des Peptids bewerten und dies für jede Seitenkette unabhängig tun.
  • Neben dem FASTER-Verfahren sind andere Seitenkettenplatzierungsverfahren für die Durchführung von Schritt 3 der vorliegenden Erfindung geeignet, beispielsweise DEE (De Maeyer et al., 2000), selbstkonsistente Durchschnittsfeldoptimierung (self-consistent mean field optimization; Koehl, P. und Delarue, M: (1994), J. Mol. Biol. 239, 249–275), simulierte Anlagerung (Shenkin, P.S. et al., (1996) Proteins 26, 323–352), ein genetischer Algorithmus (Tuffery, P. et al., (1997) Protein Eng. 10, 361–372) oder eine Monte Carlo-Simulation (Holm, L. und Sander, C. (1992) Proteins 14, 213–223). Im Allgemeinen werden Verfahren, die explizit den paarweisen Seitenkette/Seitenkette-Wechselwirkungen Rechnung tragen, bevorzugt. Solche Verfahren können entweder einer rotamerischen oder einer nicht-rotamerischen Strategie folgen.
  • 2. Rotamerbibliothek.
  • Wenn Schritt 3 auf Basis des FASTER- oder eines DEE-Verfahrens durchgeführt wird, braucht der Algorithmus Zugang zu einer Bibliothek von separaten, vorzugsweise Seitenkettenkonformationen oder -rotameren. Solch eine Bibliothek kann eine Rotamerbibliothek genannt werden. Nicht-beschränkende Beispiele schließen Ponder und Richards (Ponder, J.W. und Richards, F.M. (1987) J. Mol. Biol. 193, 775–791), Tuffery et al. (Tuffery, P. et al., (1991) J. Biomol. Struct. Dynam. 8, 1267–1289), Holm und Sander, (1992); Schrauber et al., (Schrauber, H. et al., (1993) J. Mol. Biol. 230, 592–612), Dunbrack und Karplus, (Dunbrack, R.L. Jr. und Karplus, M. (1993) J. Mol. Biol. 230, 543–574), De Maeyer et al., 1997, Mendes et al., (Mendes, J. et al., (1999) Proteins 37, 530–543), Xiang und Honig, (Xiang, Z. und Honig, B. (2001) J. Mol. Biol. 311, 421–430) mit ein. Ein Weg um Rotamere zu definieren ist sie als eine Liste von Torsionswinkelwerten für alle rotierbaren Bindungen innerhalb eines bestimmten Seitenkettentyps und für die chemische Bindung, die sie mit dem Rückgrat verbindet, zu speichern. Alternativ können die Rotamere in der Bibliothek als Sätze von Atomkoordinaten in einem gegebenen Bezugsrahmen gespeichert werden. Welche Rotamerdarstellung auch immer gewählt wird, es ist bevorzugt, dass die Rotamerbibliothek die notwendige und ausreichende Information zur Verfügung stellt, um Seitenkettenkonformationen auf unzweideutige Weise auf einem Polypeptidrückgrat zu rekonstruieren. Ein Beispiel einer bevorzugten Rotamerbibliothek ist die von Mendes et al. (1999) ausgewiesene, die sogenannte „flexible Rotamere" umfasst. Hierin ist ein flexibles Rotamer im Wesentlichen als eine Sammlung von Sub-Rotameren definiert, die leicht in der Struktur von einem klassisch starren Rotamer abweichen. Letzterer Typ an Rotameren ist insbesondere für das vorliegende Verfahren geeignet, weil es die Quanifizierung von SeitenkettenEntropieeffekten, sowohl für Peptid- als. auch Rezeptorseitenketten, auf ähnliche Weise wie für die Peptidhauptkette ermöglicht. Ebenfalls bevorzugt sind hochdetaillierte Bibliotheken klassischer starrer Rotamere, egal ob Rückgrat-abhängig (Dunbrack & Karplus, 1993; Bower et al., 1997, Desmet et al., 1997) oder Rückgrat-unabhängig (De Maeyer et al., 1997; Xiang & Honig, 2001). Ein weniger bevorzugtes Verfahren für die Zuordnung von Seitenkettenkonformationen ist die- Anwendung einer nicht-rotamerischen Herangehensweise, beispielsweise ein molekularmechanistisches oder dynamisches Verfahren, oder ein Kombinationsprotokoll (Rognan et al, 1999). Nicht-rotamerische Verfahren werden weniger bevorzugt, weil sie langsamer und weniger effizient bei der Konformationsprobennahme sind (Mendes et al., 1999), obwohl sie in den Bereich der vorliegenden Erfindung fallen.
  • 3. Punktewertfunktion für die Seitenkettenplatzierung.
  • Ein Verfahren der vorliegenden Erfindung unterscheidet zwischen zwei separaten Punktewertfunktionen, von denen die erste auf die Strukturvorhersage von Seitenketten angewendet wird (und auch auf Peptidhauptketten, wenn Schritt zwei des vorliegenden Verfahrens mittels Docking durchgeführt wird), und die zweite Punktewertfunktion auf den Affinitätsvorhersageschritt angewendet wird (siehe Schritt 4. MHC/Peptidaffinitätsbewertung). Da sie zur Verwendung in Verbindung mit einem Verfahren zur Durchsuchung (Probeentnahme) großer Konformationshyperräume gedacht ist, ist die erste Punktewertfunktion vorzugsweise intrinsisch schnell um zu bewerten und muss auch nicht so viele energetische Bestandteile wie eine Affinitätspunktewertfunktion einschließen. Ein Zweck der Punktewertfunktion ist es, die Bestimmung der richtigen Konformation eines spezifischen MHC/Peptidkomplexes zu erlauben. Aus diesem Grund kann eine Standard-Potenzial- oder freie Energiefunktion angewendet werden, die den intramolekularen Wechselwirkungen Rechnung trägt. Solche eine Funktion wird üblicherweise eine Kraftfeldfunktion genannt. Nichtbeschränkende Beispiele von weithin verwendeten Kraftfeldern schließen das CHARMM-Kraftffeld (Brooks, B.R. et al., (1993) J. Comput. Chem. 4, 187–217), das AMBER-Kraftfeld von Kollmann und Mitarbeitern am UCSF (Weiner, S.J. et al., (1984) J. Am. Chem. Soc. 106, 765–784) und das DREIDING-Feld (Mayo, S.L. et al., (1990) J. Phys. Chem. 94, 8897–8909) mit ein. Die angewendete Energiefunktion kann so viele relevante Energiebeiträge wie möglich enthalten, für die nicht-beschränkende Bespiele van der Waals-Wechselwirkungen, H-Brückenbildung, elektrostatische Wechselwirkungen und auf die chemische Bindung zurückzuführende Beiträge (Bindungsdehnung, Winkeldehnung, Torsinen, Ebenenabweichungen) einschließen. Die vorliegenden Erfinder haben gezeigt, dass diese Energieterme ausreichen, um die momentan höchst mögliche Genauigkeit bei der Seitenkettenvorhersage zu erreichen, bei gleichzeitiger Gestattung einer sehr rapiden Modellerstellung (Desmet et al., 2002). Der Rahmen der vorliegenden Erfindung gestattet Kraftfelder, die irgendeines der obigen zufrieden stellen. In einer Ausführungsform der vorliegenden Erfindung ist das bevorzugte Kraftfeld CHRAMM (Brooks et al., 1983).
  • 4. MHC/Peptidaffinitätsbewertung.
  • Die Ligandenbindungsaffinität (Kb) steht im Bezug zur freien Bindungsenergie (ΔG) über die folgende Gleichung. ΔG = –RT 1n(Kb) [3],wobei R die ideale Gaskonstante (8,31 J mol–1 K–1) ist und T die absolute Temperatur in Grad Kelvin ist. Des Weiteren ist Kb das Inverse der Dissoziationskonstante (Kd), die ungefähr gleich dem oft erwähnten IC50-Wert ist. ΔG = RT 1n(Kd) ≈ RT 1n(IC50) [4].
  • Die freie Bindungsenergie, ΔG, ist der Unterschied in freier Gibb'scher Energie zwischen dem freien Rezeptormolekül plus dem freien Peptidliganden auf der einen Seite und dem Rezeptor/Liganden-Komplex auf der anderen Seite. Stark negative ΔG-Werte zeigen eine starke Bindung an. Unterschiede in ΔG für verschiedene Peptide und/oder verschiedene MHC-Subtypen können auf eine Anzahl von Gründen zurückgeführt werden, einschließlich Enthalpie- und Entropieeffekte, die zu einem der freien oder gebundenen Zustände in Bezug stehen. Weil viele dieser Effekte mit keinerlei Mittel aus theoretischen Simulationen abgeleitet werden können, können Affinitätspunktewertfunktionen mehr als einen parametrisierten Bestandteil einschließen. Eine Grundherangehensweise der vorliegenden Erfindung ist dann, in die vorhergesagte freie Bindungsenergie, ΔGpred, soviel relevante Strukturinformation wie möglich einzubauen, und alle anderen Effekte über empirische Bestandteile abzudecken. Unter der Annahme, dass die verschiedenen Beiträge unabhängig und additiv sind, ist Folgendes ein Beispiel eines allgemeinen Ausdrucks, der die vorhergesagte freie Bindungsenergie widerspiegelt:
    Figure 00310001
  • In Gleichung [5] sind Si und Pi Struktur-abgeleitete bzw. nicht-Struktur-abgeleitete Beiträge. NS und NP sind die Anzahl an berücksichtigten Beiträgen beider Typen, wohingegen si und pi ihre entsprechenden Gewichtskoeffizienten sind. Es sollte jedoch festgehalten werden, dass die meisten Verfahren entweder Struktur-basierte oder nicht-Struktur-basierte Terme berücksichtigen, aber selten beide. Die Koeffzienten si und die Anzahl an Strukturkomponenten NS sind eigentlich ebenso Parameter, weil sie kalibriert werden müssen. Die Koeffizienten pi werden in vielen Verfahren gleichgesetzt mit Einheit.
  • Hinsichtlich der Struktur-bezogenen Ausdrücke in Gleichung [5] ist eine Herangehensweise über alle Beiträge, die von einer Kraftfeld-Funktion zur Verfügung gestellt werden (z.B. elektrostatische, van der Waals, H-Brückenterme, etc.) zu summieren. Jedoch ergeben reine Standardkraftfeldausdrücke im Allgemeinen keine optimale Korrelation mit experimentellen Daten. Das Einbeziehen zusätzlicher Effekte, für die nicht-beschränkende Beispiele, die Auflösung, das Einfrieren von rotierbaren Bindungen und spezielle Hydrophobizitätsterme einschließen, kann die Korrelation wesentlich verstärken. Das „Fresno"-Verfahren (Rognan et al., 1999) berücksichtigt 5 zusätzliche Beiträge: H-Brückenbildung, lipophile Kontakte, rotierende Bindungseinfrierung, Verborgenheit von polaren Atomen und Auflösung. Diese Punktewertfunktion bedarf der Kalibrierung der Gewichtskoeffizienten nach verschiedenen MHC-Subtypen. Das Verfahren von Schueler-Furman et al. (2000) berücksichtigt nur MHC-Seitenketten/Peptid-Seitenkettenkontakte (mit einer speziellen Behandlung von MHC-Seitenketten, die in Kontakt mit dem Peptidrückgrat stehen) in Verbindung mit einem statistischen paarweisen Potenzial.
  • Punktewertfunktionen, die auf experimentellen Daten beruhen, verlassen sich häufig auf die Häufigkeit von Aminosäuretypen, die an jeder Position innerhalb einer Peptidpopulation (z.B. Selbstpeptiden) beobachtet werden, von denen man weiß, dass sie an ein spezifisches MHC-Allel binden (Rammensee et al., 1999). Alternativ kann der Beitrag der individuellen Aminosäuretypen an jeder Position innerhalb einer Peptidsequenz auf die Gesamtbindungsaffinität des Peptids über eine Anzahl von statistischen Analysen abgeschätzt werden. Das kann man für einen Satz an bekannten Bindungspeptiden (Parker et al., 1994) oder experimentell konstruierten Peptide (Kammer et al., 1993; Fleckenstein et al., 1999) machen.
  • Ein Verfahren der vorliegenden Erfindung beruht vorwiegend auf 3D-Strukturbeiträgen. Strukturbeiträge umfassen vorzugsweise: (i) alle Terme, die unter Verwendung eines Kraftfelds z.B. CHARMM (Brooks et al., 1983), für einen MHC/Pfull-Komplex berechnet werden können, der aus Schritt 3 eines Verfahrens resultiert; (ii) auf selbigem Weg berechnete Beiträge für separat modellierte Referenzzustände des freien Peptids und des Rezeptors; (iii) Beiträge, die der Lösung sowohl des Rezeptors als auch des Peptids infolge von Komplex-Bildung Rechnung tragen, und (iv) besonders wichtig, Entropiebeträge, die in Übereinstimmung mit einer statistischen Mechanikanalyse der Struktursammlung, die in Schritt 3 erhalten wurde, d.h. {MHC/Pfull} abgeleitet sind.
  • Wenn man der Standard-Docking-Herangehensweise zur Erzeugung der letzteren Sammlung folgt, erhält man im Allgemeinen einen begrenzten Satz an Komplexstrukturen, die alle energetisch relaxiert sind. In einer Ausführungsform eines Verfahrens der vorliegenden Erfindung werden die Beiträge (i) bis (iii) für jede Struktur der Sammlung aufaddiert und wird jeder Summe der Gewichtskoeffizient si = 1/(Nsol) gegeben, wobei Nsol die Anzahl an Lösungen in der Sammlung darstellt. Das ergibt den Energieterm <E> in Gleichung [1]. Der Strukturbezogenen Bestandteil (iv), der dem Entropiebetrag S in Gleichung [1] entspricht, kann 1n(Nsol) oder kB 1n(Nsol), wo kB die Boltzmann-Konstante ist, gleichgesetzt werden. Letztere Konstante kann in den Gewichtskoeffizient mit einbezogen werden (c in Gleichung [1], entspricht SEntropie in Gleichung [5]). Dieser Koeffizient unterliegt einer globalen Parameter-Optimierung, die mittels eines geeigneten Parameteroptimierungsverfahrens ausgeführt werden muss. Ein nichtbeschränkendes Beispiel, das die Bedeutung des Einbeziehens eines Entropiebestandteils veranschaulicht, wird in BEISPIEL 4 zur Verfügung gestellt.
  • Wenn ein Verfahren der vorliegenden Erfindung in Übereinstimmung mit dem fortschrittlichen Datenbank-bezogenen Ausführungsmodus durchgeführt wird, kann ein ausgeklügelteres Verfahren notwendig sein, um die passenden Gewichtskoeffizienten der zuvor erwähnten Beiträge (i) bis (iv) zu bestimmen, vorzugsweise auf Grundlage von statistischen mechanischen Beziehungen.
  • Neben Struktur-bezogenen Beiträgen (Si in Gleichung [5]), liegt es innerhalb des Rahmens des vorliegenden Verfahrens, eine Anzahl von Nicht-Strukturtermen zu berücksichtigen (Pi in Gleichung [5]). Eine erste Möglichkeit ist ein Kombinationsverfahren, gebildet durch Verbinden eines Struktur-basierten und eines experimentellen Verfahrens. Das wird erreicht durch Bestimmung des global-optimalen Satzes an Gewichtskoeffizienten {si,pi}, unter Anwendung eines geeigneten Parameteroptimierungsverfahrens.
  • Eine bevorzugte Möglichkeit ist es, Topologiebeiträge mit einzuschließen, beispielsweise die „Type and Topology Specific" (TTS)-Beiträge von Desmet et al. (Internationale Patentanmeldung Nr. WO 02/05146), die im Rahmen von Proteindesign erfunden wurden. Dieses Verfahren berücksichtigt eine begrenzte Anzahl an Topologieklassen (typischerweise zwei oder drei), abhängig vom Grad der Verborgenheit eines Restes in einem Komplex. Der Begriff Topologie kann auch so ausgedehnt werden, dass er neben dem Abschirmen vom Solvens die chemische Natur der Umgebung des Rests, beispielsweise ein Maß von Polarität, widerspiegelt. Zudem liegt es innerhalb des Rahmens der vorliegenden Erfindung, eine Alternative zur Resttypdimension im Konzept der TTS-Parameter zu berücksichtigen, nämlich die Unterscheidung von chemischen Gruppen anstelle von Resttypen. Eine bevorzugte Klassifizierung chemischer Gruppen ist folgende: 1, CHx aliphatisch; 2, CHx aromatisch; 3, NHx aromatisch; 4, OH; 5, S + SH; 6, NH3 +; 7, COO-; 8, CONH2; 9, NHC(NH2)2 +. Dadurch kann die Typdimension in dem Satz an TTS-Parametern auf 9 Gruppen beschränkt werden (anstelle von 20 Resttypen). Die Möglichkeit, mit chemischen Gruppen zu arbeiten ist mit der breiteren Definition von Topologie voll kompatibel. Das schafft ein Repertoire an Möglichkeiten, das erforscht werden kann durch Anwenden einer geeigneten Dataminierungs- und Parameteroptimierungsstrategie, was innerhalb des Rahmens der vorliegenden Erfindung liegt. Zudem liegt es innerhalb des Rahmens der Erfindung, die relevantesten Beiträge in einem Versuch zu identifizieren und zu quantifizieren, um die Korrelation zwischen vorhergesagten und experimentellen ΔG-Werten zu verstärken. Der Einbau von Typ- und Topologiespezifischen Beiträgen führt erneut zu einem vollkommen Struktur-basierten Verfahren.
  • Wie hierin verwendet, bezieht sich ein „Peptid" auf mindestens zwei kovalent angeheftete Aminosäuren, was Polypeptide und Oligopeptide einschließt. Das Peptid kann aus natürlich vorkommenden Aminosäuren und Peptidbindungen aufgebaut sein oder aus nicht-natürlich vorkommenden Aminosäuren oder synthetischen Peptidomimetika-Strukturen, d.h. „Analoga" wie Peptoide [siehe Simon, R.J. et al., (1992) Proc. Natl. Acad. Sci. U.S.A. 89(20), 9367–9371], was im Allgemeinen vom Verfahren der Synthese abhängt.
  • Die Peptide der Erfindung können mittels klassischer chemischer Synthese zubereitet werden. Die Synthese kann in homogener Lösung oder in Festphase ausgeführt werden. Beispielsweise kann die verwendbare Synthesetechnik in homogener Lösung die durch Houbenweyl in dem Buch mit dem Titel „Methode der organischen Chemie", herausgegeben von E. Wunsh, Band 15-I und II. THIEME, Stuttgart 1974 beschrieben ist. Die Peptide der Erfindung können auch in der Festphase gemäß den von Atherton und Shepard in ihrem Buch mit dem Titel „Solid phase peptide synthesis" (IRL Press, Oxford, 1989) beschriebenen Verfahren zubereitet werden. Die Peptide gemäß dieser Erfindung können mittels rekombinanter DNA-Techniken wie in Sambrook et al., Molecular Cloning: A Laboratory Manual 2te Auflage, New York, Cold Spring Harbor Laboratory, 1989 beschrieben, zubereitet werden.
  • „Aminosäure", oder „Rest", wie hierin verwendet, bezeichnet sowohl natürlich vorkommende als auch synthetische Aminosäuren. Beispielsweise werden Homo-Phenylalanin, Citrullin, und Norleucin für die Zwecke der Erfindung als Aminosäuren betrachtet. „Aminosäure" schließt auch Iminosäurereste wie Prolin und Hydroxyprolin mit ein. Darüber hinaus kann jede Aminosäure, die einen Bestandteil der varianten Proteine der vorliegenden Erfindung darstellt, ausgetauscht werden durch dieselbe Aminosäure mit der entgegen gesetzten Chiralität. Daher kann jede Aminosäure, die natürlicherweise in der L-Konfiguration auftritt (die auch als die R oder S-Konfiguration bezeichnet werden kann, in Abhängigkeit von der Struktur und dem chemischen Gebilde) durch eine Aminosäure desselben chemischen Strukturtyps aber der entgegen gesetzten Chiralität, die im Allgemeinen als die D-Aminosäure bezeichnet wird, die aber zusätzlich als die R- oder die S-, abhängig von ihrer Zusammensetzung und der chemischen Konfiguration bezeichnet werden kann, ausgetauscht werden. Solche Derivate haben die Eigenschaft stark gesteigerter Stabilität und sind daher vorteilhaft bei der Formulierung von Verbindungen, die längere in vivo-Halbwertszeiten haben können, wenn sie oral, intravenös, intramuskulär, intraperitoneal, topisch, rektal, intraokular, oder über andere Wege verabreicht werden.
  • In der bevorzugten Ausführungsform sind die Aminosäuren in der (S)- oder L-Konfiguration. Wenn nicht-natürlicherweise vorkommende Seitenketten verwendet werden, können nicht-Aminosäuresubstituenten verwendet werden, beispielsweise, um in vivo den Abbau zu verhindern oder zu verzögern. Proteine, die nicht-natürlich vorkommende Aminosäuren einschließen, können synthetisiert werden oder in einigen Fällen rekombinant hergestellt werden; siehe van Hest et al., FEBS Lett 428:(1–2) 68–70 Mai 221998 und Tang et al., Abstr. Am. Chem. 5218:U138-U138 Teil 2, 22. August 1999.
  • Aromatische Aminosäuren können durch D- oder L-Naphylalanin, DM- oder L-Phenylglycin, D- oder L-2-Thieneylalanin, D- oder L-1-, -2-, -3- oder -4-Pyreneylalanin, D- oder L-3-Thieneylalanin, D- oder L-(2-Pyridinyl)-alanin, D- oder L-(3-Pyridinyl)-alanin, D- oder L-(2-Pyrazinyl)-alanin, D- oder L-(4-Isopropyl)-phenylglycin, D-(Trifluormethyl)-phenylglycin, D-(Trifluormethyl)-phenylalanin, D-p-Fluorphenylalanin, D- oder L-p-Biphenylphenylalanin, D- oder L-p-Methoxybiphenylalanin, D- oder L-2-Indol(alkyl)alanine und D- oder L-Alkylalanine (Alkylainines), wo Alkyl substituiert oder unsubstituiert sein kann, Methyl, Ethyl, Propyl, Hexyl, Butyl, Pentyl, Isopropyl, Iso-Butyl, Sec-Isotyl, Iso-Pentyl, nicht-saure Aminosäuren, von C1–C20 ausgetauscht werden kann.
  • Saure Aminosäuren können durch nicht-carboxylierte Aminosäuren ersetzt werden unter Beibehaltung einer negativen Ladung, und Derivate oder Analoga davon, beispielsweise die nicht-beschränkenden Beispiele (Phosphon)alanin, Glycin, Leucin, Isoleucin, Threonin, oder Serin; oder sulfatisiertes (z.B. -SO3H) Threonin, Serin oder Tyrosin.
  • Andere Substitutionen können unnatürliche hyroxylierte Aminosäuren einschließen, die gemacht werden können durch Kombination von „Alkyl" mit jeder anderen natürlichen Aminosäure. Der Ausdruck „Alkyl", wie hierin verwendet, bezieht sich auf eine verzweigte oder unverzweigte gesättigte Kohlenwasserstoffgruppe mit 1 bis 24 Kohlenstoffatomen, beispielsweise Methyl, Ethyl, n-Propyl, Isopropyl, n-Butyl, Isobutyl, t-Butyl, Octyl, Decyl, Tetradecyl, Hexadecyl, Eicosyl, Tetracisyl und Dergleichen. Alkyl schließt Heteroalkyl mit Stickstoff-, Sauerstoff- und Schwefelatomen mit ein. Hierin bevorzugte Alkylgruppen enthalten 1 bis 12 Kohlenstoffatome. Basische Aminosäuren können mit Alkylgruppen an jeder Position der natürlich vorkommenden Aminosäuren Lysin, Arginin, Ornithin, Citrullin, oder (Guanidino)-Essigsäure, oder anderen (Guanidino)-Alkyl-Essigsäuren, wo „Alkyl" wie oben definiert ist, substituiert werden. Nitrilderivate (die z.B. den CN-Anteil anstelle von COOH enthalten) können auch durch Asparagin oder Glutamin substituiert werden, und Methionin-Sulfoxide können durch Methionin ersetzt werden. Zubereitungsverfahren für solche Peptidderivate sind dem Fachmann gut bekannt.
  • Darüber hinaus kann jede Amidbindung in jedem der varianten Polypeptide durch einen Ketomethylenanteil ausgetauscht werden. Für solche Derivate erwartet man, dass sie die Eigenschaft erhöhter Stabilität gegenüber Abbau durch Enzymen haben und daher Vorteile bei der Formulierung von Verbindungen haben, die erhöhte in vivo-Halbwertszeiten haben können, wenn oral, intravenös, intramuskulär, intraperitoneal, topisch, rektal, intraokular oder auf anderen Wegen verabreicht.
  • Zusätzliche Aminosäuremodifikationen von Aminosäuren von Polypeptidvarianten der vorliegenden Erfindung können Folgendes einschließen: Cysteinylreste können mit alpha-Haloacetaten (und entsprechendem Amin) umgesetzt werden, beispielsweise 2-Chloressigsäure oder Chloracetamid, um Carboxymethyl oder Carboxyamidomethylderivate zu ergeben. Cysteinylreste können auch mittels Reaktion mit Verbindungen wie Bromtrifluoraceton, alpha-Brom-beta-(5-imidozoyl)propionsäure, Chloracetylphosphat, N-Alkylmaleimide, 3-Nitro-2-pyridyldisulfid, Methyl-2-pyridyldisulfid, P-Chlormercuribenzoat, 2-Chlormercuri-4-nitrophenol, oder Chlor-7-nitrobenzo-2-oxo-1,3-diazol umgesetzt werden.
  • Histidylreste können derivatisiert werden durch Umsatz mit Verbindungen wie Diethylprocarbonat z.B. bei pH 5,5 bis 7,0, weil dieser Wirkstoff relativ spezifisch für die Histidylseitenkette ist, und Parabromphenacylbromid kann ebenfalls verwendet werden, z.B., wo die Reaktion vorzugsweise in 0,1 M Natriumcacodylat bei pH 6,0 durchgeführt wird.
  • Lysinyl- und aminoterminale Reste können mit Verbindungen wie Succin- oder anderen Carbonsäureanhydriden umgesetzt werden. Von der Derivatisierung mit diesen Wirkstoffen erwartet man, dass sie Ladungsumkehreffekt auf die Lysinylreste hat.
  • Andere geeignete Reagenzien für die Derivatisierung von alpha-Amino-enthaltenden Resten schließen Verbindungen wie Imidoester z.B. als Methylpicolinimidat; Pyridoxalphosphat; Pyridoxal; Chlorborhydrid; Trinitrobenzolsulfonsäure; O-Methylisoharnstoff, 2,4 Pentandion; und Transaminase-katalysierte Reaktion mit Glyoxylat ein. Arginylreste können durch Reaktion mit einem oder mehreren herkömmlichen Reagenzien modifiziert werden, unter denen Phenylglyoxal, 2,3-Butandion, 1,2-Cyclohexandion und Ninhydrin sind, gemäß bekannter Verfahrensschritte. Die Derivatisierung von Argininresten setzt voraus, dass die Reaktion unter alkalischen Bedingungen durchgeführt wird, wegen des hohen pKa der funktionellen Guanidingruppe. Zudem können diese Wirkstoffe mit den Gruppen von Lysin sowie der Epsilon-Aminogruppe von Arginin reagieren. Die spezifische Modifikation von Tyrosyl-Resten ist per se gut bekannt, beispielsweise für die Einführung spektraler Markierungen in Tyrosyl-Resten durch Reaktion mit aromatischen Diazonium-Verbindungen oder Tetranitromethan.
  • N-Acetylimidizol und Tetranitromethan können verwendet werden, um O-Acetyltyrosyl-Spezies bzw. 3-Nitroderivate zu bilden. Carboxylseitengruppen (Aspartyl oder Glutamyl) können selektiv durch Reaktion mit Carbodiimiden (R'-N-C-N-R') wie 1-Cyclohexyl-3-(2-morpholinyl(4-ethyl)carbodümid oder 1-Ethyl-3-(4-azonia-4,4-dimethylpentyl)carbodümid, modifiziert werden. Zudem können Aspartyl- und Glytamylreste zu Asparaginyl- und Glytaminylresten mittels Reaktion mit Ammoniumionen umgesetzt werden.
  • Glutaminyl- und Asparaginylreste können häufig deamidiert werden zu den entsprechenden Glutamyl- und Aspartylresten. Alternativ können diese Reste unter milden sauren Bedingungen deamidiert werden. Jede der Formen dieser Rückstände fällt in den Bereich der vorliegenden Erfindung.
  • Wie hierin verwendet, bezieht sich „Seitenkettenplatzierungsalgorithmus" auf Verfahren zur Optimierung der Seitenkettenkonformationen von Resten. Nicht-beschränkende Beispiele solcher Verfahren schließen internationale Patentanmeldung Nr. WO 01/33438, De Maeyer et al (De Maeyer et al., (2000) Methods in Molecular Biology, Band 143: Protein Structure Prediction: Methods and Protocols. Webster, D. (Hrsg.) Humana Press Inc., Totowa, NJ, S. 265– 304), Koehl, P. und Delarue, M. (J. Mol. Biol. (1994) 239, 249–275), Shenkin, P.S. et al., (Shenkin, P.S. et al., (1996) Proteins 26, 323–352), Tuffery et al. (Tuffery, P. et al., (1997) Protein Eng. 10, 361–372), Holm und Sander (Proteins (1992) 14. 213–223, 1992) mit ein. Zudem sind Verfahren eingeschlossen, die explizit paarweiser Seitenketten/Seitenketten-Wechselwirkungen Rechnung tragen.
  • Wie hierin verwendet, bezeichnet „dead-end-elimination" oder „DEE" Verfahren zum Testen, welche Seitenkettenkonformationen energetisch inkompatibel mit der global-optimalen Seitenkettenanordnung auf einer Proteinrückgrat- (oder Matrizen-)Struktur sind (z.B. Desmet, J. et al., (1992) Nature 356, 539–542). In einem zu testenden Proteinsystem wird jeder Aminosäurerest erst durch einen beschränkten Satz an separaten Seitenkettenkonformationen dargestellt, der aus einer Bibliothek von theoretisch möglichen Konformationen erhalten wird, auch bekannt als Rotamer-Bibliothek. Um bei der global-optimalen Konformation für das Proteinsystem anzukommen, werden Rotamere in Übereinstimmung mit einer oder mehreren mathematischen Termen, genannte DEE-Kriterien, durchmustert. Verschiedene gültige Eliminierungskriterien sind in der Vergangenheit identifiziert worden (De Maeyer, M., Desmet, J. und Lasters, I. (2000) The dead-end elimination theorem: mathematical aspects, implementation, optimizations, evaluation and performance. in: Methods in Molecular Biology, Band 143: De Maeyer, M., Desmet, J. und Lasters, I. (2000) und Literaturangaben darin). Nach Konvergenz wurden alle bis auf ein Rotamer für jede gemodelte Seitenkette eliminiert, so dass die finale, einzigartige Zuordnung an Rotameren dem globalen Optimum entspricht. Wenn Konvergenz nicht durch einfaches Anwenden der DEE-Kriterien erreicht werden kann, werden einige zusätzliche Endstadiumroutinen benötigt (Desmet et al., 1997).
  • Wie hierin verwendet, bezieht sich „schnelle und genaue Seitenkettentopologie und Energieverbesserung" oder „FASTER" auf Verfahren der Internationalen Patentanmeldung Nr. WO 01/33438.
  • 1 Schematische Übersicht der Information, die durch die Schritte 1–4 eines Verfahrens der vorliegenden Erfindung erzeugt wird.
  • 2 Flussdiagramm eines Verfahrens der vorliegenden Erfindung.
  • 3 Zeichnung der 43 geringsten Energiepeptide, die aus dem VSV-8-Docking resultieren. Die kristallographisch bestimmte Struktur ist durch das Stabmodell dargestellt. Schwarze Farbe wird für Atome der Hauptkette verwendet und grau wird für Seitenkettenatome verwendet. Nur „schwere" (nicht-H)-Atome sind gezeigt. Der Blickwinkel ist von der „Seite" des Peptids mit dem N-Terminus auf der linken Seite. In dem Komplex ist das Peptid innerhalb der MHC α1α2-Domäne verborgen, wobei die α2-Helix vorne, die α1-Helix auf der Rückseite und das β-Faltblatt am Boden ist; der obere Teil des Peptids ist dem Lösungsmittel zugänglich. Der MHC-Rezeptor selbst ist, obwohl er während des Dockings vorliegt, nicht in der Figur gezeigt.
  • 4 Vergleich zwischen kristallographischen Temperaturfaktoren und der theoretischen Strukturvariation. Die durchschnittlichen B-Faktoren für die Hauptkettenatome eines jeden Rests des Peptids LLFGYPVYV, erhalten aus dem PDB-Eintrag 1 DUZ (c-Kette), werden mit der Standardabweichung auf der Hauptkette RMSD, beobachtet in der Sammlung an gedockten Strukturen, verglichen. Das Docking-Experiment selbst ist in BEISPIEL 2 der vorliegenden Erfindung beschrieben.
  • 5 Verteilung der Anzahl der Docking-Lösungen. Alle Nonapeptide, die von den HPV E6- und E7-Proteinen abgeleitet wurden, wurden an den A*0201-Rezeptor gemäß dem in BEISPIEL 2 der vorliegenden Erfindung beschriebenen Protokoll angedockt. Jedes Experiment ergab einen Satz Rezeptor-kompatibler Strukturen reichend von 0–500. Dieses Diagramm zeigt die Verteilung der Docking-Lösungen. Für 27 Peptide wurde herausgefunden, dass sie mit dem Rezeptor (inset) nicht kompatibel sind. Der Hauptgrund war das Vorliegen von entweder einer sperrigen (R, Y, F) oder einer die Hauptkette beschränkenden (P)-Seitenkette an Position P2.
  • 6 Wahrscheinlichkeitsverteilung der mittleren quadratischen Abweichung (RMSD) zwischen den Rückgratatomen von jeweils 2 Peptidhauptkettenstrukturen der in BEISPIEL 3 der vorliegenden Erfindung beschriebenen {MHC/Pmc}-Sammlung.
  • 7 Verteilung der vorhergesagten durchschnittlichen Bindungsenergien von HPV E6- und E7-Peptiden für HLA A*0201. Die Ergebnisse wurden wie in BEISPIEL 4 der vorliegenden Erfindung beschrieben erhalten. Die Energien schließen keinen Entropiebestandteil mit ein.
  • 8 Korrelation zwischen experimentellen und vorhergesagten Affinitäten für 15 Peptide von HPV E6- und E7, für die bekannt ist, dass sie an HLA A*0201 binden. Die Ergebnisse werden wie in BEISPIEL 4 der vorliegenden Erfindung beschrieben erhalten. Teilabbildung (a), nur aus durchschnittlichen Bindungsenergien erhaltene Werte. Teilabbildung (b); durch Einbeziehen des Entropiebestandteils erhaltene Werte. Zwei Peptide (Sequenzen angegeben) wurden als Ausreißer erachtet und ihre Werte wurden nicht in die Regressionsanalyse mit einbezogen.
  • BEISPIEL 1. PEPTID-DOCKING
  • Im vorliegenden Beispiel beschreiben wir das flexible Docking des Octapeptids VSV-8 (Peptid p = RGYVYQGL) an ein MHC(-Molekül) der Klasse I H-2Kb der Maus (Fremont, D.H. et al., (1995) Proc. Natl. Acad. Sci. USA 92, 2479–2483). Die folgenden experimentellen Bedingungen wurden verwendet.
    • 1. Peptidaufbau: Tyr-P5 wurde als Ursprungsrest ausgewählt, wegen seines Potenzials multiple Kontakte mit der Bindungsgrube auf dem MHC zu bilden. Die Verlängerung erfolgte zunächst in Richtung des C- und dann in Richtung des N-terminalen Endes in folgender Weise: ----Y--- > ----YQ- > -YQG- > ----YQGL > ---VYQGL > --YVYQGL > -GYVYQGL > RGYVYQGL.
    • 2. Peptidtranslationen: Das Peptid wurde systematisch in jedem der 79 translationalen Abstände bei einer relativen Entfernung von 1,0, 2,0 und 4,0 Å von der Anfangsposition aus versetzt.
    • 3. Rotationen: Bei jedem translationalen Abstand wurde eine separate, jedoch Vollraumrotation über 84 Rotationskonfigurationen durchgeführt.
    • 4. Konformationen: Für die Peptidreste Tyr-P3, Val-P4, Tyr-P5 und Gln-P6 enthielt die Rotamerbibliothek 47 Hauptkettenkonformationen; für Gly-P2 und Gly-P7 gab es 125 Rotamere und für die N- und C-terminalen Reste Arg-P1 und Leu-P8 gab es 12.
    • 5. Peptid- und Rezeptorseitenkettenkonformationen: Die Seitenkettenkonformationen wurden aus der Rückgrat-abhängigen Rotamerbibliothek, die in Desmet et al. (1997) beschrieben ist, abgefragt. Im Mittel gab es 16 Seitenkettenrotamere pro Rest. Zusätzlich zu den 8 Peptidresten wurden 28 Rezeptorreste während des Dockings als flexibel eingestuft.
    • 6. Kraftfeld: Gesamtatom-CHARMM-Kraftfeld umfassend Terme für Bindungsdehnung, Bindungswinkelkrümmung, eine periodische Funktion für die Torsionswinkel, ein Lennard-Jones-Potenzial für die nicht-gebundenen Atompaare, ein 10–12 Potenzial für Wasserstoffbindungen und eine Culofunktion für geladene Atome. Eine entfernungsabhängige dielektrische Konstante wurde verwendet (∊ = rij, wo rij die Entfernung zwischen zwei Atomen i und j ist; Warshel, A. und Levitt, M. (1976) J. Mol. Biol. 103, 227–249).
    • 7. Wassermoleküle: Dieses Experiment wurde in Gegenwart von 9 kristallographisch bestimmten verborgenen Wassermolekülen, die als Teil des Proteins erachtet wurden, durchgeführt.
    • 8. Teilpeptidkonformationen (Fragmente) wurden für die weitere Elongation akzeptiert, während ein relativer Energieschwellenwert von 10 kcal mol–1 verwendet wurde. In diesem Experiment wurden endgültige Volllängenpeptide unter Verwendung des gleichen Schwellenwertes akzeptiert.
    • 9. Der Docking-Algorithmus brach spontan und erfolgreich ab, nachdem er in kombinatorischer Weise, d.h. Rest um Rest, alle Teilpeptide auf ihre volle Länge verlängert hatte.
  • Das Docking des VSV-8-Peptids an das MHC der Klasse I H-2Kb ergab schließlich eine {MHC/pfull}-Sammlung von 323 Vollpeptidkonfigurationen innerhalb eines Energieintervalls von 10 kcal mol–1 (siehe TABELLE 1). Für diesen Zweck wurden während des Aufbaus 1.117.957 Teilpeptidfragmente verarbeitet.
  • Figure 00410001
  • TABELLE 1. VSV-8-Docking: Spalte 1: Fragmentlänge (Anzahl an Resten); Spalte 2: Fragmentsequenz im 1-Buchstabencode; Spalte 3: Gesamtanzahl an erzeugten Konfigurationen für Fragmente der entsprechenden Länge; Spalte 4: Anzahl an akzeptierten Konfigurationen; Spalte 5: Akzeptanzverhältnis in %; Spalte 6: Bindungsenergie des Fragments geringster Energie (kcal mol–1); Spalte 6: Inkrementelle Bindungsenergie (kcal mol–1).
  • Es ist wichtig, festzuhalten, dass der Docking-Algorithmus jedes Mal wenn eine Teil- oder Vollpeptidkonfiguration erzeugt wird alle Seitenkettenkonformationen vollständig von Grund auf neu aufbaut. In dem vorliegenden Beispiel wurde dies mittels eines Dead-end-Eliminationsverfahrens (DEE) erzielt. Insgesamt wurden 1.117.957 separate DEE-Seitenkettenplatzierungsoperationen durchgeführt, d.h. eine für jedes Peptidfragment. Diese Herangehensweise könnte als eleganter Weg beschrieben werden, um die Seitenkettenmodellerstellung von der Hauptkettenkonstruktion zu entkoppeln. Sie reduziert enorm den zu durchsuchenden Raum und vermeidet doch jede potenzielle Zweideutigkeit durch inkorrekt positionierte oder eingefrorene Seitenketten. Als eine möglich Alternative zum DEE-Verfahren verweisen die vorliegenden Erfinder auf das kürzlich publizierte FASTER-Verfahren (Desmet et al., 2002). Im Allgemeinen kann jedes Verfahren für die Seitenkettenplatzierung anwendbar sein. Die Vorhersagegenauigkeit kann tatsächlich ein geringeres Problem in Anbetracht der Tatsache bilden, dass die Modellerstellung von Seitenketten in Schritt 3 eines Verfahrens der vorliegenden Erfindung vollständig wiederholt wird (aber dann nur für die letztendlichen Volllängenpeptide, d.h. im vorliegenden Beispiel nur für 323 Vollstrukturen anstelle von mehr als einer Million Teilstrukturen).
  • Zusammenfassend lässt sich sagen, dass Tabelle 1 zeigt, dass das Akzeptanzverhältnis von Teilpeptidfragmenten nur bei 30.525 von insgesamt 1.117.957 untersuchten Fragmenten oder 2,73 % lag. Höhere Akzeptanzverhältnisse wurden beobachtet, wenn ein Fragment um einen schwach beschränkten Restetyp verlängert wurde, beispielsweise Gly an Position P2. Dennoch führte der Kombinationsaufbau nicht zu einer Fragmentexplosion.
  • Von den 323 letztlichen Strukturen innerhalb eines Energieintervalls von 10 kcal mol–1 hatten 43 eine Bindungsenergie innerhalb von 5 kcal mol–1 über dem niedrigsten (–147,1 kcal mol–1) und sind in 3 abgebildet. Im Vergleich mit der experimentellen Struktur des Komplexes hatte das Peptid mit niedrigster Energie eine Hauptketten-RMSD von nur 0,56 Å. Für die 43 abgebildeten Strukturen betrug die mittlere RMSD 0,89 ± 0,27 Å und für alle 323 Ergebnisse betrug sie 1,01 ± 0,39 Å. Die Ankerreste Tyr-P3, Tyr-P5 und Leu-P8 wurden korrekt in ihre komplementären Taschen verpackt (Fremont, D.H. et al., (1992) Science 257, 919–927). Die Seitenkette von Leu-P8 nahm zwei verschiedenen Konformationszustände ein. Andere offensichtlich bi-stabile Konformationen wurden für Gln-P6 und Arg-P1 beobachtet (3). Die Seitenkettenkonformation von Gln-P6 war klar an die Konformation der MHC-Reste Glu-152 und Arg-155 gekoppelt. Interessanterweise wurde diese alternative Konformation für diese zwei Reste auch kristallographisch beobachtet, nämlich in der Struktur desselben H-2Kb-Rezeptors im Komplex mit dem Nonapeptid SEV-9 (Fremont et al., 1992). Das illustriert die Wichtigkeit, zumindest eine gewisse beschränkte Flexibilität für die Seitenketten des Rezeptors zu berücksichtigen.
  • BEISPIEL 2. SYSTEMATISCHES DOCKING VON VIRALEN PEPTIDEN
  • Dieses Beispiel illustriert die Durchführung des in BEISPIEL 1 beschriebenen Docking-Algorithmus bei einer Anwendung auf Docking großen Maßstabs. Der Zweck dieses Beispiels ist es, zu zeigen, dass der Algorithmus nicht nur für die Untersuchung ausgewählter Fälle, für die bekannt ist, dass sie Hochaffinitätskomplexe bilden, nützlich ist, sondern auch für die Handhabung einer großen Anzahl verschiedener Peptide, die von einer gemeinsamen Proteinquelle abgeleitet sind. Einige Merkmale einer solchen Sammlung sind (i) dass der Peptidsatz nicht einseitig unausgewogen ist hinsichtlich des Vorliegens von Ankerresten und (ii) dass der Hauptteil der Peptide sehr wahrscheinlich Nicht-Binder sind. Die Computeranforderungen des Verfahrens, die Statistiken der simulierten Strukturen und die potenziellen Schwierigkeiten beim Docking im großen Maßstab werden berücksichtigt. Dieses Beispiel illustriert auch die bevorzugte Ausführungsform der Schritte 1 und 2 eines Verfahrens der vorliegenden Erfindung, d.h. MHC-Modellzubereitung bzw. flexibles Docking. Zusätzlich haben wir eine Clustering-Analyse mit den verschiedenen beobachteten Peptidbindungsmodi durchgeführt, um die (theoretische) Variabilität der Hauptkette eines Peptids in einem Komplex zu untersuchen.
  • Der Testfall wurde wie folgt konstruiert.
    • 1. MHC-Rezeptor-Typ/Subtyp: Klasse I, A*0201
    • 2. PDB-Struktur für die Modellzubereitung: 1DUZ a-Kette
    • 3. Peptidliste für das Docking: Alle nonameren (9-Reste) Peptide, die von den E6- und E7-Proteinen des humanen Papillomavirus vom Typ 18 (HPV-18) abgeleitet werden können, d.h. 150 bzw. 97 Peptide. Experimentelle Bindungsaffinitäten für den gleichen Satz sind aus der Literatur verfügbar (Rudolf, M.P. et al., (2001) Clin. Cancer Res. 7, 788s–795s).
    • 4. Docking-Bedingungen: Kraftfeld und Rotamerbibliothek sind identisch zu Beispiel 1. Die Translationen waren beschränkt auf 26 relative Versetzungen über 0,5 Å von der Ursprungsposition. Keine Rotationsbewegungen wurden gestattet. Alle kristallographischen Wassermoleküle wurden entfernt. Der Peptidrest P1 wurde als Ursprungsrest ausgewählt, daher erfolgte die Elongation der Fragmente vom N- zum C-Terminus. Der relative Energieschwellenwert für das Akzeptieren von Teilpeptidfragmenten wurde abhängig von der Fragmentlänge gemacht: 7, 7, 10, 13, 15, 15, 15, 13 und 10 für die entsprechenden Längen 1–9. Das war notwendig, weil die Teilpeptide mittlerer Länge dazu tendierten, viele enge aber falsche Wechselwirkungen mit dem Rezeptor zu bilden (Klasse I Nonapeptide beulen sich typischerweise in der Mitte aus; Fremont et al., 1992).
  • Die Auswahl der PDB-Struktur 1 DUZ, um das MHC-Matrizenmodell zu konstruieren, wurde aufgrund seiner hohen kristallographischen Auflösung entschieden (1,8 Å). Der gesamte PDB-Eintrag (Ketten a–e) wurde mittels 200 Schritten Energieminimierung des steilsten Abstiegs verfeinert. Als nächstes wurden die Ketten a (MHC) und c (Peptidsequenz LLFGYPVYV) extrahiert. Die einzige PDB-Information bezüglich des Peptids, die nach dem Docking beibehalten wurde, waren die Koordinaten des Rückgrat N, des Cα und der C-Atome von Rest P1. Vor dem Docking wurde jedes Peptid initialisiert durch seinen Neuaufbau in einer erweiterten Konformation mit Standardbindungslängen und winkeln. Die N-, Cα und C-Atome von Rest P1 des initialisierten Peptids wurden in jene in der PDB-Struktur beobachteten angepasst. Als nächstes wurde das Peptid aus der PDB-Datei entfernt. Der MHC-Rezeptor bildete zusammen mit dem initialisierten Peptid die Ausgangssituation für das Docking. Eine Anzahl von Versuch-Dockings wurde dann unter Verwendung des „Selbst"-Peptids LLFGYPVYV durchgeführt, um die optimalen Einstellungen für die relativen Energieschwellenwerte der Teilpeptide verschiedener Länge zu bestimmen (die Werte sind oben angegeben, siehe: 4. Docking-Bedingungen). Diese Versuchsexperimente dienten auch dazu in sicherer Weise die Anzahl an flexibel behandelten Rezeptorseitenketten zu verringern: Von den ursprünglich 29 Seitenketten, die in Kontakt mit dem Peptid stehen, wurde letztlich nur 14 als flexibel beibehalten, weil sie einen wesentlichen Einfluss auf die letztendliche Sammlung an vorhergesagten Strukturen hatten (a7, a63, a66, a70, a73, a80, a84, a97, a99, a114, a116, a143, a146 und a159). Mit diesen Einstellungen wurde eine Sammlung von 210 Strukturen für den A*0201/LLFGYPVYV-Komplex erhalten. Alle Peptidkonformationen ließen sich gut mit der bekannten Kristallstruktur vergleichen: Der Rückgrat-RMSD lag im Bereich von 0,75 bis 1,81 Å, mit einem Mittel von 1,08 ± 0,20 Å. Eine gute Korrelation wurde zwischen den Kristallographie-Temperaturfaktoren und der Strukturvariation, die die Sammlung an gedockten Strukturen aufwies, beobachtet (4). Die B-Faktoren, gemittelt über die Hauptkettenatome eines jeden Peptidrests, schienen der Standardabweichung auf der Hauptketten-RMSD mit der Kristallstruktur gut zu folgen, abgekürzt als SD (RMSD). Letztere wurde als Maß der theoretischen Flexibilität der Peptidhauptkette genommen. Eine etwas größer als erwartete Flexibilität wurde für Gly-P4 beobachtet, was auf einen hohen Grad an Torsionsfreiheit der Peptidebenen, die P4 flankieren, zurückzuführen ist. Eine überraschend hohe Flexibilität wurde auch für Pro-P6 beobachtet: der CαCβ-Vektor dieses Rests wies eine relativ große Rotationsvariation über ~90° um die Peptidhauptachse auf. Jedoch erscheint dieses theoretische Ergebnis vollkommen gerechtfertigt zu sein auf Grundlage der experimentellen B-Faktoren, auch legt die allgemeine Korrelation zwischen den beiden Parametern nahe, dass die Computerberechnete Sammlung das reale dynamische Verhalten des gebundenen Peptids widerspiegelt. In Anbetracht dieser zufrieden stellenden Ergebnisse wurde geschlussfolgert, dass die experimentellen Einstellungen korrekt ausgewählt worden waren. Letztere wurden in allen nachfolgenden Docking-Experimenten angewendet.
  • Das Docking im großen Maßstab für alle HPV E6- und E7-Peptide wurde in automatisierter Weise durchgeführt. Die Aufgaben wurden über ein Cluster von 4 SGI Origin 200-Computern verteilt, von denen jeder mit vier 270 MHz R12000 Prozessoren und 4 GB Speicher ausgestattet war. Die mittlere pro Aufgabe benötigte Computerzeit lag bei 8,7 CPU-Stunden, aber einige brachen beinahe sofort ab (0,01 CPU-h) oder benötigten eine sehr lange Zeit (113,6 CPU-h). Üblicherweise tendierte das Docking von Peptiden, die große Seitenketten enthielten (Phe, Tyr, Arg) oder Pro an Position P2 enthielten dazu, abzubrechen, bevor sie ihre volle Länge erreichten (5). Die Analyse zeigte, dass der P2-Rest dieser Peptide aus sterischen Gründen nur in „Nicht-Standard"-Konformationen eingebettet werden konnte.
  • Rudolf et al. (2001) publizierten experimentelle Affinitätsdaten für Peptide, die von den HPV-E6- und E7-Sequenzen abgeleitet wurden und an HLA A*0201 binden. Fünfzehn von 247 abgebildeten IC50-Werten im Bereich von 3 bis 943 nM. Diese Peptide können daher als starke oder moderate Binder an HLA A*0201 klassifiziert werden. Alle anderen möglichen E6- und E7-Peptide hatten IC50-Werte höher als 1000 nM und können daher schwache oder Nicht-Binder genannt werden. Interessanterweise hatten viele der bindenden Peptide Aminosäurereste an Positionen P2 und P9 (die sogenannten primären Ankerpositionen), die untypisch für die Bindung an HLA A*0201 sind. Beispielsweise wies das am höchsten eingestufte Peptid, FAFKDLFW (mit Ala an Position P2 anstelle von Leu, Ile oder Met) einen IC50-Wert von nur 3 nM auf. Das Peptid FKDLFWYR (mit Lys an P2 und Arg an P9), was ein sehr untypisches Peptid ist, wies immer noch einen IC50-Wert von 500 nM auf. Zwei andere Bindepeptide hatten auch untypisch aromatische Reste an Position P2, nämlich LYNLLIRCL und LFLNTLSFV. Insbesondere für diese Peptide war es interessant das Verhalten des Docking-Algorithmus zu untersuchen.
  • Man kann 5 entnehmen, dass keines der Docking-Experimente, die das Peptid nicht auf seine volle Länge erweitern konnten, (26 von insgesamt 247) Bindungspeptide betraf (15 von 247). Selbst die zwei Bindepeptide, die Tyr oder Phe an Position P2 enthielten, konnten erfolgeich gedockt werden (das LYNLLIRCL- und LFLNTLSFV-Docking resultierte in 8 bzw. 13 Lösungen), im Gegensatz zu vielen anderen Peptiden, die eine aromatische Seitenkette an dieser Position enthielten (5). Das FKDLFVVYR-Peptid konnte auch erfolgreich gedockt werden (30 Lösungen) trotz seiner sperrigen Arg-Seitenkette an P9. Im Allgemeinen hatten große Seitenketten an den Primärankern P2 und P9 die Wirkung, die Anzahl an Docking-Lösungen aufgrund sterischer Beschränkungen zu verringern. Für einige Peptide, von denen alle schwache oder Nicht-Binder waren, führte dies zur frühzeitigen Termination des Docking-Prozesses.
  • Eine andere wichtige Beobachtung war, dass die Bindepeptide im Mittel eine viel höhere Anzahl an Docking-Lösungen hatten als die Nicht-/Schwach-Binder. Bindungspeptide wurden durch etwa zweimal so viele Lösungen repräsentiert wie Nicht-/Schwach-Binder (im Mittel: 91 gegenüber 42 Lösungen). In ähnlicher Weise hatten nur 3 der 15 Binder (20 %) weniger als 25 Lösungen, wohingegen es 132 der 232 (57 %) gab mit weniger als 25 Lösungen innerhalb der Nicht-/Schwach-Binder. Eine logische Schlussfolgerung ist, dass die Anzahl an Lösungen, die aus den Peptid-Docking-Experimenten erhalten wurde, einen Hinweis auf die wahre Konformationsflexibilität eines Peptids innerhalb der MHC-Bindungsgrube zur Verfügung stellt. Das stimmt mit dem grundlegenden Entropieprinzip überein, das besagt, dass je höher die Anzahl der Mikrozustände für einen gegebenen Makrozustand ist (in diesem Fall den gebundenen Zustand), umso höher wird die Wahrscheinlichkeit für diesen Zustand sein. Diese Beispiel illustriert auch die Bedeutung, anstelle mit einer einzelnen gemodellten Struktur mit Sammlungen von Strukturen zu arbeiten, um die Bindungseigenschaften der MHC/Peptid-Komplexe zu untersuchen.
  • BEISPIEL 3. KONSTRUKTION EINER GENERISCHEN MHC/PEPTID-DATENBANK
  • Eine Ausführungsform der vorliegenden Erfindung ist ein Verfahren, bei dem die Bindung von einem oder mehreren Peptiden durch Anwendung einer fortschrittlichen Datenbank-Herangehensweise untersucht wird. Wie in der detaillierten Beschreibung der Erfindung beschrieben ist, kann eine solche Datenbank aus experimentellen (vorzugsweise Röntgen-) oder theoretischen (vorzugsweise gedockten) Strukturen zusammengestellt werden. Eine Datenbank, die aus bekannten 3D-Strukturen erhalten wurde, hat den Vorteil, dass sie auf validierter Strukturinformation beruht, kann aber am Mangel solcher Daten leiden, insbesondere für bestimmte MHC-Subtypen, für welche keine Komplexstruktur gelöst worden ist. Selbst für gut repräsentierte Subtypen wie den MHC Klasse I HLA A*0201-Allotyp kann es eine starke Tendenz in Richtung bestimmter beobachteter Peptidbindungsmodi geben, wohingegen viele andere brauchbare Konformationen noch nicht in der Proteindatenbank repräsentiert sind. Konsequenterweise bevorzugen es die Erfinder, um Probleme, die im Zusammenhang stehen mit einem Fehlen von experimentellen Strukturen, zu vermeiden, eine Datenbank von MHC/Pmc-Strukturen durch systematisches Docking einer großen Anzahl von Peptiden verschiedener Sequenz zu erzeugen. Offensichtlich kann dies separat für verschiedene MHC-Subtypen und für Peptide verschiedener Länge gemacht werden. In diesem Beispiel illustneren wir die Konstruktion einer {MHC/Pmc}-Sammlung für nonamere Peptide, die innerhalb der Bindungsgrube eines HLA A*0201 orientiert sind (repräsentiert durch PDB Code 1 DUZ, Kette a).
  • Die Docking-Experimente wurden in identischer Weise zu den in Beispiel 2 beschriebenen Experimenten durchgeführt. Ein Satz von 180 nonameren Peptidsequenzen, die gedockt werden sollen, wurde in pseudozufälliger Weise wie folgt bestimmt. Die vorliegenden Erfinder haben eine Kombination typischer Ankerreste an Position P2 und P9, d.h. Leu, Ile und Met an P2 und Leu, Ile und Val an P9 ausgewählt. An allen anderen Positionen wurden die Resttypen in vollständig zufälliger Weise aus dem Satz an natürlich vorkommenden Aminosäuren ausgewählt. Das bedeutet, dass jede der 3 × 3 = 9 möglichen P2/P9-Kombinationen durch 180/9 = 20 Sequenzen mit randomisierten Resten an Positionen P1 und P3–P8 dargestellt wurde. Dieser Prozedur wurde gefolgt um das Docking von Peptiden, die wegen inkompatibler Ankerreste nicht an HLA A*0201-Model binden können, zu vermeiden. Zur gleichen Zeit wurde für die Randomisierung angenommen, dass sie ausreichend Variation in den Peptidsequenzen erzeugt, um eine breite und nicht-einseitige Probennahme aus dem Konformationsraum sicherzustellen.
  • Alle bis auf ein Docking-Experiment terminierten erfolgreich, d.h. nur eine Simulation (des Peptids p = DIGVHKVV) terminierte bevor das Peptid zu seiner vollen Länge verlängert worden war. Alle anderen Simulationen ergaben eine Anzahl von MHC/pmc-Lösungen im Bereich von 1 bis 500 (eine Benutzer-gesetztes hartes Limit) und mit einem Durchschnitt von 22 pro Peptid. Die Gesamtanzahl an MHC/pmc-Strukturen betrug 3951.
  • Alle Docking-Ergebnisse wurden dann in einer globalen {MHC/Pmc}-Sammlung vereinigt, die Seitenketten wurden abgestreift und die Koordinaten der Hauptkettenatome einer jeden Peptidstruktur wurden in einem geeigneten Format in einer Datenbank gespeichert. Dies vervollständigte die Konstruktion einer generischen Datenbank-Sammlung an MHC/Pmc-Strukturen, die anwendbar ist, um die Bindung von Nonapeptiden an MHC Klasse I HLA A*0201-Subtyp zu untersuchen.
  • Die Sammlung wurde danach weiter analysiert hinsichtlich der räumlichen Verteilung der Peptidkonformationen in der {MHC/Pmc}-Sammlung. Ein geeigneter Parameter, um diese Verteilung zu analysieren, ist für das Peptidrückgrat die Wurzel der mittleren quadratischen Abweichung (RMSD) zwischen verschiedenen Pmc-Strukturen in der Sammlung. 6 zeigt die Wahrscheinlichkeitsverteilung zwei Hauptkettenstrukturen mit einer bestimmten RMSD zu finden. Aus der integrierten Wahrscheinlichkeitskurve ist ersichtlich, dass für jede ausgewählte Pmc-Struktur die erwartete Anzahl an anderen Strukturen mit einer RMSD ≤ 0,5 Å nur etwa 0,3 % der Gesamtpopulation beträgt. Das zeigt, dass es, wenn überhaupt, nur eine sehr beschränkte Redundanz innerhalb der Mitglieder der Sammlung gibt. Die Wahrscheinlichkeit einer RMSD < 1 Å steigt auf 0,062 oder 6,2 % an. Hinsichtlich der Modellerstellung von Seitenketten auf Rückgraten kann für einen Unterschied in der RMSD von bis zu 1 Å erwartet werden, dass er ähnliche Ergebnisse ergibt. Mit anderen Worten, die weitere Modellerstellung einer Peptidsequenz auf jeder Pmc-Struktur wird statistisch auf 0,062 × 3951 oder etwa 250 relativ richtigen Strukturen durchgeführt. Diese Situation eröffnet die Möglichkeit, die Sammlung weiter zu clustern und/oder die Mittlung der Ergebnisse von verschiedenen Seitenkettenplatzierungen. Zudem legt die Breite der Wahrscheinlichkeitsverteilung (~3 Å) nahe, dass eine große Vielzahl verschiedener Bindungsmodi, von denen einige für spezifische Peptide benötigt werden könnten, in der Sammlung repräsentiert werden. Aus diesen Ergebnissen schlossen die Erfinder, dass die eine Ausführungsform der vorliegenden Erfindung bildende Datenbank-Herangehensweise sehr nützlich sein kann, um die Bindungseigenschaften eines Peptids innerhalb einer MHC-Bindungsgrube vorherzusagen.
  • BEISPIEL 4. ANWENDUNG EINER PUNKTEWERTFUNKTION, UM AFFINITÄTEN VORHERZUSAGEN
  • Eine Eigenschaft eines MHC/Peptid-Komplexes ist, ist die Affinität des Peptids für das MHC-Molekül. In Übereinstimmung mit der Struktur-basierten Herangehensweise der vorliegenden Erfindung wird die Bindungsaffinität vorwiegend aus Information abgeleitet, die im Zusammenhang mit der dreidimensionalen Struktur eines modellierten Komplexes steht. Zu diesem Zweck wird eine sogenannte Punktewertfunktion benötigt, die die Strukturinformation in einen oder mehrere Beiträge übersetzt, für die erwartet wird, dass sie mit der experimentellen Affinität korrelieren. Verschiedene Beiträge können kombiniert werden, beispielsweise zusammengezählt werden, um einen qualitativen oder quantitativen Punktewert für einen MHC/Peptid-Komplex von Interesse zur Verfügung zu stellen. Durch Ausdehnung können verschiedene Punktewerte für verschiedene Komplexe berechnet werden, beispielsweise um verschiedene Peptide gemäß ihren vorhergesagten Affinitäten für einen gegebenen MHC einzustufen.
  • Dieses Beispiel wird miteinbezogen, um eine praktische Implementierung einer Ausführungsform der vorliegenden Erfindung zu illustrieren. Dieses Beispiel wird zudem eingeschlossen, um zu zeigen, dass der Einbau eines Entropiebeitrags, der aus einer Sammlung modellierter Komplexstrukturen anstelle aus einer einzelnen modellierten oder experimentellen Struktur abgeleitet wurde, wesentlich die Qualität der vorhergesagten Affinitäten verstärkt. Der Einbau eines Entropiebestandteils stimmt sowohl mit Gleichungen [1] und [5] der vorliegenden Erfindung überein.
  • Die Ergebnisse der in Beispiel 2 beschriebenen Docking-Experimente, insbesondere der Computer-simulierten Bindung aller HPV E6/E7-Peptide an den HLA A*0201-Rezeptor, wurden noch weiter analysiert, um gegebenenfalls die Affinitäten der Peptide vorhersagen zu können. Wir rufen in Erinnerung, dass jedes dieser Docking-Experimente eine Sammlung von MHC/pmc-Lösungen ergab, in Übereinstimmung mit einem zweiten Schritt (MHC/Peptidhauptkettenkonstruktion) einer Ausführungsform der vorliegenden Erfindung. Diese Sammlungen wurden weiter verarbeitet in Übereinstimmung mit einem dritten Schritt (MHC/Vollpeptidkonstruktion) und einem vierten Schritt (MHC/Peptidaffinitätsbewertung) einer Ausführungsform der vorliegenden Erfindung.
  • Als erstes wurden die Seitenketten einer jeden MHC/pmc-Struktur in jeder Sammlung durch Anwenden des DEE-Verfahrens von De Maeyer et al. (2000) neu aufgebaut. Seitenketten des MHC-Rezeptors, die flexibel behandelt wurden, waren die gleichen, wie während der in Beispiel 2 beschriebenen Docking-Experimenten (14 insgesamt). Um die Auswirkungen der separaten Rotamerplatzierung der Seitenketten zu verringern, wurde ein zusätzlicher Modellerstellungsschritt für jede DEE-modellierte Struktur durchgeführt: Die Vollstrukturen wurden mittels 50 Schritten der steilsten Abstiegsenergieminimierung weiter verfeinert, um die lokalen Kontakte zu optimieren. Dies resultierte in dem finalen Satz von Sammlungen {MHC/Pfull}, d.h. eine Sammlung von Vollkomplexstrukturen für jedes Peptid p. Diese Daten bildeten die Hauptquelle strukturbezogener Eingabeinformation für einen vierten Schritt einer Ausführungsform der vorliegenden Erfindung.
  • Da die Komplexbildung einer physiko-chemischer Reaktion zwischen einem Rezeptor und einem Ligandenmolekül aus dem ungebundenen zu dem gebundenen Zustand bedarf, wird der Bindungsprozess durch eine Veränderung in der freien Energie oder ΔG vorangetrieben (siehe Gleichungen [3] und [4]). Konsequenterweise wird eine Energiegleichung der Komplexstrukturen vorzugsweise mit einer ähnlichen Gleichung der Modelle der ungebundenen Moleküle ergänzt. Der freie MHC-Rezeptor wurde daher separat durch Durchführung von DEE-Seitenkettenplatzierung mit denselben 14 flexibel behandelten Seitenketten wie für die Vollkomplexe modelliert, gefolgt von 50 Schritten der steilsten Abstiegsenergieminimierung. Strukturen für das freie Peptid wurden auf der anderen Seite nicht mittels der DEE-Modellerstellung erzeugt, sondern durch Erzeugung von maximal ausgestreckten Konformationen, ebenfalls gefolgt von 50 Schritten der steilsten Abstiegsenergieverfeinerung.
  • Die Bindungsenergie Ebind(p, i) einer Lösung i aus der für ein Peptid p erzeugten Sammlung wurde berechnet unter Verwendung der Gleichung [6]: Ebind(p,i) = Ekomplex(p,i) – EMHC – Ep(p) [6],wo alle Energiewerte die potenziellen Energien berechnet in Übereinstimmung mit dem Kraftfeld sind, und wo Ekomplex(p,i),EMHC und Ep(p) die potenzielle Energie des Komplexes, des freien Rezeptors bzw. des freien Peptids sind. Als nächstes wurden die Bindungsenergien über alle Lösungen i für jedes Peptid p gemittelt, um die mittlere Bindungsenergie <Ebind(p)> für jede Sammlung {MHC/Pfull} zu erhalten. Diese Quantität entspricht dem Term <E> in Gleichung [1] der vorliegenden Erfindung.
  • 7 zeigt die Verteilung der mittleren Bindungsenergien für alle vorhergesagten Peptide. Peptide, für die durch Rudolf et al. (2001) herausgefunden wurde, dass sie gute Binder sind, sind in schwarz angegeben, wohingegen die Nicht-Binder mit grauen Balken angegeben sind. Man kann klar sehen, dass die bekannten Binder dazu tendieren, gute Werte im Vergleich mit den Nicht-Bindern zu erzielen. Jedoch sind beide Populationen nicht klar von einander getrennt in sofern, als dass mehrere Nicht-Binder bessere Werte erzeugen als die meisten der Binder (man kann sie sich als „falsch-Positive" vorstellen). Das legt nahe, dass die diskriminierende Leistung der Potenzialenergie alleine nicht stark genug ist, um eine gute Auftrennung zu erhalten.
  • In Anbetracht der Beobachtung, dass die meisten der Nicht-bindenden Peptide im Mittel weniger MHC/pmc-Lösungen im Docking-Schritt (siehe Beispiel 2) hatten, wurde untersucht, ob dieser Faktor in einen signifikanten, quantitativen Beitrag der Punktewertfunktion umgewandelt werden könnte. Die signifikanteste Verbesserung in der Auftrennung zwischen Bindern und Nicht-Bindern wurde erreicht, wenn zu dem Potenzialenergieterm ein logarithmischer Term, der von der Gesamtanzahl an Lösungen N abhängt, die innerhalb jeder Sammlung enthalten sind, hinzugefügt wurde. Daher schien die optimale Punktewertefunktion F folgende Form zu haben: F(p) = <Ebind(P)> – c × 1nN(P) [7],wobei c eine Konstante ist. Interessanterweise besagt die Theorie der statistischen Mechanik, dass die Entropie von (mikrokanonischen) Sammlungen logarithmisch mit der Anzahl an Mikrozuständen zusammenhängt, die energetisch zugänglich sind. (Insbesondere ist die Entropie S gleich kB 1n(N), wobei kB die Boltzmann'sche Konstante ist). Daher war es konsequent, die logarithmische Abhängigkeit von der Anzahl der Lösungen als zutreffende Wiedergabe der intrinischen Konformationsflexibilität eines Peptids innerhalb eines Komplexes rationell zu deuten. Mit anderen Worten, die Anzahl an energetisch brauchbaren Peptidkonformationen, wie sie aus den Simulationen abgeleitet wird, korreliert vermutlich in statistisch signifikanter Weise mit der wahren Konformationsentropie eines Komplexes.
  • Aus der Optimierung der Auftrennung von Bindern und Nicht-Bindern wurde der beste Wert für den Parameter c in Gleichung [7] als 20 kcal mol–1 gefunden. Dieser Wert wurde in einer weiteren Analyse angewendet, worin die vorhergesagten Werte für die 15 Bindungspeptide direkt mit der bekannten experimentellen Affinität korreliert (Rudolf et al. (2001) publizierten nur quantitative Werte für die Bindungspeptide). 8 zeigt eine Korrelationsauftragung zwischen vorhergesagten Werten und bekannten freien Bindungsenergien. In 8a ist der Entropieterm ausgeschaltet (c = 0), wohingegen er in 8b auf seinen optimalen Wert aus dem vorhergehenden Optimierungsprozedere gesetzt wurde (c = 20). Zwei Peptide (FQQLFLNTL und FLNTLSFVC) zeigten ein abweichendes Verhalten im Vergleich zum Rest und wurden als Ausreißer erachtet. Sie wurden nicht in die Regessionsanalyse miteinbezogen. Interessanterweise haben beide Peptide einen nicht-typischen Ankerrest (Gln an P2 von FQQLFLNTL und Cys an P9 von FLNTLSFVC), wohingegen ihre Punktewerte überschätzt zu sein schienen. Das legt nahe, dass ein zusätzlicher Korrekturfaktor für typische Ankerreste wünschenswert sein kann.
  • Eine wichtige Beobachtung innerhalb des Kontexts der vorliegenden Erfindung war die erheblich bessere Korrelation, die mit der Punktewertfunktion, die den Entropieterm einschließt (Teilabbildung b, R2 = 0,71) im Vergleich zu der Funktion, die ausnahmslos auf der Potenzialenergie basierte (Teilabbildung a, R2 = 0,19). Ohne den Entropiebestandteil konnte nur eine sehr geringe Korrelation beobachtet werden. Das stimmt überein mit der Verteilungsauftragung, die in 7 dargestellt ist, die zeigt, dass der Energiebestandteil selbst praktisch nur nützlich ist, um Peptide mit einer klaren suboptimalen energetischen Kompatibilität mit dem Rezeptor zu identifizieren. Nur die Kombination von Potenzialenergie mit einem Term, der die Konformationsentropie widerspiegelt, ermöglichte eine gute qualitative Auftrennung zwischen bindenden und nicht-bindenden Peptiden. Des Weiteren ermöglichte er die Etablierung einer quantitativen Beziehung zwischen vorhergesagten und experimentellen Affinitäten. 8b zeigt die Gleichung, die verwendet werden kann, um jeden Punktewert F in eine vorhergesagte freie Bindungsenergie umzusetzen.

Claims (25)

  1. Verfahren für die Vorhersage der Bindungsaffinität eines Peptids für ein Haupthistokompatibilitäts- (MHC-) Molekül der Klasse I oder Klasse Π, wobei das Verfahren die folgenden Schritte umfasst: a) Empfangen einer Darstellung einer vollständigen oder partiellen dreidimensionalen Struktur eines MHC-Moleküls der Klasse I oder Klasse II, b) Erhalten einer Sammlung an Darstellungen von Peptidrückgratstrukturen des Peptids, wobei sich die Darstellungen innerhalb der Bindungsstelle des MHC-Moleküls befinden, c) Modellerstellung für jede Peptidrückgratstruktur der Sammlung in Bezug auf das MHC-Molekül, wenigstens der Seitenketten des Peptids, wodurch eine Sammlung modellierter MHC/Peptid-Komplexe erhalten wird, und d) Evaluieren der Bindungseigenschaften des Peptids für das MHC-Molekül, wobei das Evaluieren wenigstens die folgenden Schritte umfasst: d1) Evaluieren von einer oder mehreren Komponente(n) der potentiellen Energie jedes Komplexes der Sammlung und d2) Evaluieren der Konformationsentropie für die vollständige Sammlung.
  2. Verfahren gemäß Anspruch 1, wobei die Darstellung in Schritt (a) aus einem des Folgenden gewonnen wird: – eine oder mehrere experimentell bestimmte Struktur(en), die beispielsweise mittels Röntgenkristallographie, kernmagnetischer Resonanzspektroskopie, Abtastungsmikroskopie gewonnen wurde oder – ein oder mehrere Modell(e), das/die von einer experimentell bestimmten Struktur abgeleitet ist/sind, wobei die experimentell bestimmte Struktur eine hohe Sequenzidentität mit dem MHC-Molekül besitzt.
  3. Verfahren gemäß Anspruch 1 oder 2, wobei die Darstellung in Schritt (b) mittels eines computergestützten Modellerstellungsverfahrens erzeugt wird, wobei dieses Verfahren in der Lage ist, multiple energetisch günstige Rückgratkonfigurationen in Bezug auf das MHC-Molekül zu erzeugen.
  4. Verfahren gemäß Anspruch 1 oder 2, wobei die Darstellung in Schritt (b) aus einer Bibliothek an Peptidstrukturen abgefragt wird, die in Bezug auf das MHC-Molekül vororientiert sind.
  5. Verfahren gemäß einem der Ansprüche 1 bis 4, wobei ein Komplex innerhalb der Sammlung in Schritt (c) aus einem Seitenketten-Platzierungs-Algorithmus gewonnen wird.
  6. Verfahren gemäß einem der Ansprüche 1 bis 5, wobei die Seitenketten-Platzierung in Schritt (c) nicht nur die Platzierung der Seitenketten des Peptids selbst umfasst, sondern auch die Platzierung von wenigstens einer Seitenkette des MHC-Moleküls umfasst, die mit dem Peptid in Kontakt ist.
  7. Verfahren gemäß einem der Ansprüche 1 bis 6, wobei ein Komplex innerhalb der Sammlung in Schritt (c) aus einem Seitenketten-Platzierungs-Algorithmus gewonnen wird, der für eine globale Seitenketten-Optimierung geeignet ist.
  8. Verfahren gemäß einem der Ansprüche 5 bis 7, wobei der Seitenketten-Platzierungs-Algorithmus ein Dead-End-Eliminations- (DEE-) Algorithmus ist, dadurch gekennzeichnet, dass der DEE-Algorithmus Rotamerkonformationen auf der Grundlage eines mathematischen Kriteriums eliminiert, das den Nachweis von Konformationen erlaubt, die mit der global optimalen Konformation nicht kompatibel sind.
  9. Verfahren gemäß einem der Ansprüche 5 bis 7, wobei der Seitenketten-Platzierungs-Algorithmus ein FASTER-Algorithmus ist, wobei der Algorithmus durch einen wiederholten Störungs- (perturbation), Entspannungs- (relaxation) und Evaluierungsschritt gekennzeichnet ist.
  10. Verfahren gemäß einem der Ansprüche 1 bis 9, wobei die Bindungsaffinität in Schritt (d) durch einen einzelnen Punktewert für die gesamte Sammlung an MHC/Peptid-Komplexen dargestellt wird, wobei der Punktewert die Summe der Konformationsentropie für die vollständige Sammlung an MHC/Peptid-Komplexen und den Mittelwert der energetischen Komponenten jedes Komplexes der Sammlung umfasst.
  11. Verfahren gemäß einem der Ansprüche 1 bis 10, wobei die Bindungsaffinität in Schritt (d) für den globalen Komplex evaluiert wird, wodurch Wechselwirkungen zwischen Restepaaren des Peptids, des MHC-Moleküls und sowohl des Peptids als auch des MHC-Moleküls berücksichtigt werden.
  12. Verfahren gemäß einem der Ansprüche 1 bis 11, wobei die Entropiekomponente die allgemeine Konformationsflexibilität des Peptids widerspiegelt.
  13. Verfahren gemäß einem der Ansprüche 1 bis 12, wobei die Darstellungen des in der Bibliothek enthaltenen Peptids von experimentell bestimmten Strukturen abgeleitet sind.
  14. Verfahren gemäß einem der Ansprüche 1 bis 12, wobei die Darstellungen des in der Bibliothek enthaltenen Peptids von computererzeugten Strukturen abgeleitet sind, wobei die Strukturen mit dem computergestützten Modellerstellungsverfahren gemäß Anspruch 3 erzeugt sind.
  15. Verfahren gemäß einem der Ansprüche 1 bis 14, wobei das Peptid eine oder mehrere nicht natürlicherweise vorkommende Aminosäure(n) umfasst.
  16. Verfahren gemäß einem der Ansprüche 1 bis 15, wobei das Verfahren auf mehrere ausgewählte Peptide durch wiederholte Anwendung des Verfahrens für ein einzelnes Peptid angewendet wird.
  17. Verfahren gemäß Anspruch 16, wobei die mehreren ausgewählten Peptide ein oder mehrere putative(s) immunogene(s) Peptidfragment(e) darstellen, das/die von einem Polypeptid von Interesse abgeleitet ist/sind.
  18. Verfahren gemäß Anspruch 17, wobei das Verfahren weiter die folgenden Schritte umfasst: (a) Zubereiten von einem oder mehreren der putativen immunogenen Peptide des Polypeptids von Interesse, (b) Zubereiten von Komplexen des einen oder der mehreren putativen immunogenen Peptids/Peptide mit den MHC-Molekülen der Klasse I oder Klasse II und (c) Testen der zubereiteten Komplexe auf eine Eignung, von zytotoxischen T-Zellen oder T-Helferzellen erkannt zu werden und dadurch eine zytotoxische T-Zell- oder T-Helferzell-Reaktion zu induzieren.
  19. Verfahren gemäß einem der Ansprüche 16 bis 18 für die Herstellung eines immunogenen Peptids, das ein MHC-Klasse I oder -Klasse II-restringiertes T-Zell-Epitop umfasst, das an ein MHC-Molekül der Klasse I oder Klasse II bindet und eine MHC-Klasse I- oder -Klasse II-restringierte T-Zell-Reaktion induziert.
  20. Verfahren gemäß einem der Ansprüche 1 bis 19, wobei das MHC-Molekül der Klasse I ein HLA-Antigen umfasst, das ausgewählt ist aus einem der HLA-A-, HLA-B-, HLA-C-, HLA-E-, HLA-F- und HLA-G-Allele.
  21. Verfahren gemäß einem der Ansprüche 1 bis 19, wobei das MHC-Molekül der Klasse II ein HLA-Antigen umfasst, das ausgewählt ist aus einem der HLA-DR-, HLA-DQ- und HLA-DP-Genprodukte.
  22. Computerprogramm, umfassend das Code-Mittel, das angepasst ist, um, wenn das Programm auf einem Datenverarbeitungssystem betrieben wird, die Verfahrensschritte, wie sie in einem der Ansprüche 1 bis 21 definiert sind, auszuführen.
  23. Computerprogramm gemäß Anspruch 22, weiter umfassend eine Modellerstellung für jede Peptidrückgratstruktur der Sammlung in Bezug auf das MHC-Molekül, wenigstens der Seitenketten des Peptids.
  24. Computerprogramm gemäß Anspruch 22 oder 23, wobei die Peptidrückgatstrukturen durch computergestützte Modellerstellung oder durch Abfrage einer Datenbank gewonnen werden.
  25. Vorrichtung für die Vorhersage der Bindungsaffinität eines Peptids für ein Haupthistokompatibilitäts- (MHC-) Molekül der Klasse I oder Klasse II, wobei die Vorrichtung die folgenden technischen Merkmale umfasst: a) ein Mittel, das für das Empfangen einer Darstellung einer vollständigen oder partiellen dreidimensionalen Struktur eines MHC-Moleküls der Klasse I oder Klasse II angepasst ist, b) ein Mittel, das für das Erhalten einer Sammlung an Darstellungen von Peptidrückgratstrukturen des Peptids angepasst ist, wobei sich die Darstellungen innerhalb der Bindungsstelle des MHC-Moleküls befinden, c) ein Mittel, das für die Modellerstellung für jede Peptidrückgratstruktur der Sammlung in Bezug auf das MHC-Molekül, wenigstens der Seitenketten des Peptids, angepasst ist, wodurch eine Sammlung modellierter MHC/Peptid-Komplexe erhalten wird, und d) ein Mittel, das für das Evaluieren der Bindungseigenschaften des Peptids für das MHC-Molekül angepasst ist, wobei das Evaluieren wenigstens die folgenden Schritte umfasst: d1) Evaluieren von einer oder mehreren Komponente(n) der potentiellen Energie jedes Komplexes der Sammlung und d2) Evaluieren der Konformationsentropie für die vollständige Sammlung.
DE60312330T 2002-06-10 2003-06-10 Verfahren zur vorhersage der bindungsaffinität der mhc-peptid-komplexe Expired - Lifetime DE60312330T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP02447115 2002-06-10
EP02447115 2002-06-10
PCT/EP2003/006049 WO2003105058A2 (en) 2002-06-10 2003-06-10 Method, computing routine, device for predicting properties of mhc/peptide complexes, and data and peptides produced therefrom

Publications (2)

Publication Number Publication Date
DE60312330D1 DE60312330D1 (de) 2007-04-19
DE60312330T2 true DE60312330T2 (de) 2007-11-22

Family

ID=29724618

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60312330T Expired - Lifetime DE60312330T2 (de) 2002-06-10 2003-06-10 Verfahren zur vorhersage der bindungsaffinität der mhc-peptid-komplexe

Country Status (6)

Country Link
US (3) US7702465B2 (de)
EP (1) EP1516275B1 (de)
AT (1) ATE356385T1 (de)
AU (1) AU2003236728A1 (de)
DE (1) DE60312330T2 (de)
WO (1) WO2003105058A2 (de)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1759323A2 (de) 2004-04-21 2007-03-07 AlgoNomics N.V. Verfahren zur affinitätsbewertung von peptid-/proteinkomplexen
US8396671B2 (en) * 2006-02-16 2013-03-12 Microsoft Corporation Cluster modeling, and learning cluster specific parameters of an adaptive double threading model
US20070192033A1 (en) * 2006-02-16 2007-08-16 Microsoft Corporation Molecular interaction predictors
US8706421B2 (en) * 2006-02-16 2014-04-22 Microsoft Corporation Shift-invariant predictions
EP2062180A2 (de) * 2006-08-25 2009-05-27 The Government of the United States of America as Represented by The Department of Health and Human Services Epitopen-proteingerüste und ihre verwendung
US8121797B2 (en) 2007-01-12 2012-02-21 Microsoft Corporation T-cell epitope prediction
WO2011119484A1 (en) * 2010-03-23 2011-09-29 Iogenetics, Llc Bioinformatic processes for determination of peptide binding
EP2646459B1 (de) 2010-12-02 2020-01-08 Bionor Immuno AS Peptidgerüstentwurf
CN103347892B (zh) 2011-01-06 2016-11-02 比奥诺尔免疫有限公司 单体和多聚体免疫原性肽
EP2859011B1 (de) 2012-06-06 2019-12-11 Bionor Immuno AS Peptide aus viralen proteinen zur verwendung als immunogene oder nachweisreagenzien
WO2017081288A1 (en) 2015-11-11 2017-05-18 Lonza Ltd Crispr-associated (cas) proteins with reduced immunogenicity
US20190237158A1 (en) * 2016-08-31 2019-08-01 Medgenome, Inc. Methods to analyze genetic alterations in cancer to identify therapeutic peptide vaccines and kits therefore
EP3565908A1 (de) 2017-02-03 2019-11-13 Lonza Ltd Verfahren zur analyse mehrerer zellen und zum nachweis von proteinsequenzvarianten bei der herstellung von biologischen produkten
EP3894188A4 (de) * 2018-12-10 2022-11-16 University of Notre Dame du Lac Vorhersage der affinität unter verwendung struktureller und physikalischer modellierung
US10515715B1 (en) 2019-06-25 2019-12-24 Colgate-Palmolive Company Systems and methods for evaluating compositions
FR3103621A1 (fr) 2019-11-22 2021-05-28 Commissariat A L'energie Atomique Et Aux Energies Alternatives Procédé et système pour sélectionner des variants d’une protéine thérapeutique moins immunogènes que cette protéine thérapeutique
WO2023180346A1 (en) 2022-03-22 2023-09-28 Morphosys Ag Deimmunized antibodies specific for cd3

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10299017I2 (de) * 1987-06-22 2005-05-25 Medeva Holdings Bv Hepatitis-B-Oberfl{chenantigen enthaltendes Peptid.
US5780036A (en) * 1991-08-26 1998-07-14 The Scripps Research Institute Peptides for inducing cytotoxic T lymphocyte responses to hepattis B virus
DE69837555T2 (de) * 1997-06-02 2007-12-20 The Johns Hopkins University Rechnerverfahren freie energieberechnung für ligandenentwurf verwendend und die voraussage von bindenden zielen
GB9712892D0 (en) 1997-06-20 1997-08-20 Eclagen Ltd Identification of mhc binding peptides

Also Published As

Publication number Publication date
EP1516275B1 (de) 2007-03-07
ATE356385T1 (de) 2007-03-15
DE60312330D1 (de) 2007-04-19
WO2003105058A2 (en) 2003-12-18
US20060111554A1 (en) 2006-05-25
US20120202247A1 (en) 2012-08-09
AU2003236728A1 (en) 2003-12-22
AU2003236728A8 (en) 2003-12-22
WO2003105058A3 (en) 2004-09-16
US20100168398A1 (en) 2010-07-01
US7702465B2 (en) 2010-04-20
EP1516275A2 (de) 2005-03-23

Similar Documents

Publication Publication Date Title
DE60312330T2 (de) Verfahren zur vorhersage der bindungsaffinität der mhc-peptid-komplexe
Fabrizio et al. Electron density learning of non-covalent systems
Bower et al. Prediction of protein side-chain rotamers from a backbone-dependent rotamer library: a new homology modeling tool
Holtje et al. Molecular modeling
Kolinski et al. On the origin of the cooperativity of protein folding: implications from model simulations
Koehl et al. De novo protein design. II. Plasticity in sequence space
Mannhold et al. Molecular Modeling: Basic Principles and Applications
JP4633930B2 (ja) タンパク質工学
Mordalski et al. Protein binding site analysis by means of structural interaction fingerprint patterns
US20210005277A1 (en) Obtaining an Improved Therapeutic Ligand
JP4315960B2 (ja) タンパク質のリガンド結合部位の特定方法およびタンパク質−リガンド複合体の立体構造構築方法
Chwastyk et al. Statistical radii associated with amino acids to determine the contact map: fixing the structure of a type I cohesin domain in the Clostridium thermocellum cellulosome
Zheng et al. Protein structure prediction constrained by solution X-ray scattering data and structural homology identification
Dauber-Osguthorpe et al. Low frequency motion in proteins: comparison of normal mode and molecular dynamics of streptomyces griseus protease A
Moon et al. 3D database searching and de novo construction methods in molecular design
Buchete et al. Orientation-dependent coarse-grained potentials derived by statistical analysis of molecular structural databases
EP1280901A1 (de) Raumform von tpr-strukturmotiv enthaltenden polypeptiden mit chaperon-bindungsfunktion, deren kristalle und verbindungen zur inhibierung derartiger polypeptide
Buchete et al. Continuous anisotropic representation of coarse-grained potentials for proteins by spherical harmonics synthesis
Parisien et al. A new catalog of protein β‐sheets
Rayan et al. Stochastic algorithm for kinase homology model construction
Sapundzhi et al. Exploring the interactions of enkephalin and dalargin analogues with the mu-opioid receptor
JP2003524831A (ja) 組み合わせ空間を探索するためのシステムおよび方法
Marques et al. Conformational characterization of disulfide bonds: A tool for protein classification
Das et al. Optimization of solvation models for predicting the structure of surface loops in proteins
Deplazes et al. Characterizing the conformational dynamics of metal-free PsaA using molecular dynamics simulations and electron paramagnetic resonance spectroscopy

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
R082 Change of representative

Ref document number: 1516275

Country of ref document: EP

Representative=s name: DEHMEL & BETTENHAUSEN PATENT- UND RECHTSANWAEL, DE

R081 Change of applicant/patentee

Ref document number: 1516275

Country of ref document: EP

Owner name: LONZA BIOLOGICS PLC, GB

Free format text: FORMER OWNER: LONZA VERVIERS SPRL, VERVIERS, BE

Effective date: 20120918

R082 Change of representative

Ref document number: 1516275

Country of ref document: EP

Representative=s name: DEHMEL & BETTENHAUSEN PATENT- UND RECHTSANWAEL, DE

Effective date: 20120918