-
Die Erfindung betrifft ein Verfahren zur mehrdimensionalen Analyse eines Proteoms, bei dem das biologische Gewebe mit dem zu analysierenden Proteom aufgeschlossen und die zu dem Proteom gehörenden Proteine getrennt sowie quantitativ bestimmt und identifiziert werden. Das Verfahren findet in der Biochemie, in der Biotechnologie, in der Medizin sowie in der Pharmazeutischen Industrie Verwendung und dient u. a. zu diagnostischen Zwecken und zur Entwicklung biologisch wirksamer Substanzen. Spezielle Einsatzgebiete eröffnen sich in der Grundlagenforschung, beispielsweise für die Klärung entwicklungsbiologischer oder zelldifferenzierender Fragestellungen, sowie in der angewandten Forschung für das Screening von Wirkstoffbanken, für die Entwicklung und Optimierung biologisch aktiver Substanzen oder für die Differenzierung zwischen normalen und pathogenen Zuständen in Organismen.
-
In der jüngeren Vergangenheit wurden Genome von Organismen ganz oder zu großen Teilen sequenziert [Fraser CM et al.: The minimal gene complement of Mycoplasma genitalium, Science, 1995, Oct 20, 270 (5235), 397–403; Fleischmann RD et al.: Whole-genome random sequencing and assembly of Haemophilus influenzae Rd. Science, 1995, Jul 28, 269 (5223), 496–512; Blattner FR et al.: The complete genome sequence of Escherichia coli K-12, Science, 1997, Sep 5, 277 5331), 1453–74; Goffeau A et al.: Life with 6000 genes, Science, 1996, Oct 25, 274 (5287), 546, 563–7]. Noch intensiver wurden cDNA-Abschnitte sequenziert [Clark MS: Comparative genomics: the key to understanding the Human Genome Project, Bioessays, 1999, Feb, 21 (2), 121–30; Evans MJ et al.: Gene trapping and functional genomics, Trends Genet, 1997 Sep, 13 (9), 370–4]. Die Sequenzdaten sind in Datenbanken gespeichert. Die Aufklärung des Genoms eines Organismus führt letztlich ”nur” zur Kenntnis des relativ statischen Informationsgehaltes des genetischen Materials für diesen Organismus. Mit den Sequenzen der cDNA- ist es prinzipiell möglich, Expressionslevel der mRNA auch zellspezifisch und umweltspezifisch zu ermitteln und damit ein Genexpressionsmuster der RNA zu erhalten.
-
Aus einem Gen des Genoms können
- a) durch verschiedene Prozesse, unterschiedliche mRNA-Sorten entstehen, die für divergente Proteine kodieren, und
die aus ihnen entstehenden Proteine können durch posttranslationale Modifikation eine Vielzahl außerordentlich unterschiedlich funktionierender Proteine bilden. Zu den bisher bekannten Modifikationen gehören Phosphorylierung und Dephosphorylierung, limitierte Proteolyse, Acetylierung, Methylierung, Adenylierung, Sulfatierung, Glykosylierung [McDonald LJ et al.: Enzymatic and nonenzymatic ADP-ribosylation of cysteine, Mol Cell Biochem, 1994 Sep, 138 (1–2), 221–6; Baenziger JU: Protein-specific glycosyltransferases: how and why they do it!, FASEB J, 1994 Oct, 8 (13), 1019–25; Mimnaugh EG et al.: The measurement of ubiquitin and ubiquitinated Proteins, Electrophoresis, 1999 Feb, 20 (2), 418–28; Davis PJ et al.: Protein modification by thermal processing, Allergy, 1998, 53 (46 Suppl), 102–5]. Die expremierten und modifizierten Proteine ergeben aber letztendlich das Muster, welches die Zelldifferenzierung und die Reaktion auf innere und äußere Einflüsse von Zellen beschreibt. Am augenfälligsten ist die eingeschränkte Bedeutung der Kenntnis des Genoms für die Realisierung eines definierten biologischen Zustandes, wenn man die unterschiedlichen Zellen in verschiedenen Organen und innerhalb eines Organs vergleicht. Beispielsweise haben eine Leberparanchymzelle, eine Nervenzelle des Gehirns und eine Mukosazelle des Darmes den selben Satz genetischer Information, aber völlig unterschiedliche Funktion, die durch die Regulation der Expression des Genoms in diesen Zellen und die Regulation des Enzym- und Proteinmusters innerhalb der Zellen sowie der verschiedenen Gewebe hervorgerufen wird.
-
DNA |
→ |
RNA |
→ |
Protein |
Mit Ausnahmen statisch und deskriptiv. |
|
Übertragung der Information. Menge ist reguliert und überträgt die Information der DNA auf die Proteinebene |
|
Aufrechterhaltung der Zellstruktur, Reaktion auf Veränderungen und Signale. Interaktionen mit anderen Zellen. Menge und Aktivität sind reguliert. |
-
Die Begriffsbestimmung des ”Proteoms”, erfolgte erst 1996 [Friedrich GA: Moving beyond the genome projects, Nat Biotechnol, 1996 Oct, 14 (10), 1234–7].
-
Das Proteom, das heißt die Gesamtheit aller Proteine in einer Zelle mit einem bestimmten Entwicklungsstand und unter definierten Umweltbedingungen, stellt eine sehr viel dynamischere Repräsentation des physiologischen Zustandes von Zellen, Organen und Organismsmen dar. Die Proteomanalytik untersucht, welche Teile des Genoms unter definierten, zellspezifischen Bedingungen exprimiert und modifiziert werden. Dies führte zu schnell anwachsendem Interesse an diesem Gebiet, mit der Folge von ansteigenden Publikationszahlen (PubMed query Suchbegriff: Proteome; Suche 1 Jahr zurück: 64 Einträge, 2 Jahre zurück: 99 Einträge, 5 Jahre zurück: 122 Einträge), Kongressen und Veranstaltungen zu dieser Thematik.
-
Um ein quantifizierbares ”Bild” eines Proteoms zu erhalten, wird gegenwärtig folgendermaßen verfahren: In einem ersten Schritt müssen die biologischen Materialien aufgeschlossen und homogenisiert werden (mit Ausnahmen: z. B. beim Serum liegen sie in einer homogenen Lösung vor). Im zweiten Schritt erfolgt die Trennung der Proteine, im dritten die Identifizierung und im vierten die Auswertung der erhaltenen Daten [Ben RH et al.: Two dimensional electrophoresis, The state of the art and future directions, Proteome Research, New frontiers in functional genomics, Springer 1997 Chap, 2, 13–33]. Die Trennung der Proteine bzw. Peptide kann in mehr als zwei Dimensionen durchgeführt werden. So beschreiben Moore und Jorgenson eine umfassende dreidimensionale Trennung von Petiden mittels Größenausschlusschromatography (SEC), Reverser Flüssigphasenchromatographie (RPLC) und Kapillarer Zonen Elektrophorese (CZE), wobei die zu trennenden Peptide vor der Trennung durch Hitzeeinwirkung denaturiert werden.
-
1. Aufschluß
-
Hierfür werden bekannte Verfahren und Anordnungen aus der Biochemie eingesetzt, wie beispielsweise Scherkrafthomogenisatoren, Ultraschallbehandlung, Hochdruckpressen. Die Schwierigkeit besteht in einem quantitativen und möglichst die Funktion der Proteine nicht zerstörenden Aufschluß, denn nur quantitativ aufgeschlossene Proteine liefern in dem nachfolgenden zweiten Schritt (Trennung und Detektion der Proteine) ein reales Bild des Probenmaterials [Rabilloud T: Solubilization of proteins in 2-D electrophoresis, An outline, Methods Mol Biol, 1999, 112, 9–19; Rabilloud T et al.: Improvement of the solubilization of proteins in two-dimensional electrophoresis with immobilized pH gradients, Electrophoresis, 1997 Mar-Apr, 18 (3–4), 307–16; Staudenmann W et al.: Sample handling for proteome analysis, Electrophoresis, 1998 May, 19 (6), 901–8].
-
2. Trennung und Detektion
-
Für die Trennung der Proteine des Proteoms wird gegenwärtig essentiell die zweidimensionale Gelelektrophorese verwendet. Es sind erste Versuche mit einer zweidimensionalen HPLC unternommen worden. Diese haben jedoch bisher nicht die Trennschärfe der zweidimensionalen Elektrophorese erreicht [Opiteck GJ, et al. Comprehensive two-dimensional high-performance liquid chromatography for the isolation of overexpressed Proteins and proteome mapping. Anal Biochem. 1998 May 1; 258(2): 349–61.]. Die erste Dimension der zweidimensionalen Elektrophorese ist eine Trennung nach dem isoelektrischen Punkt, also letztendlich nach den Ladungseigenschaften eines Proteins. In der zweiten Dimension wird nach der Größe der Proteine in einem denaturierenden Natriumdodecylsulfat-Gel getrennt. Diese Trenntechnik ist seit etwa seit 20 Jahren bekannt. Ein Vorteil der 2-D-Elektrophorese liegt in der Möglichkeit, eine relativ große Zahl von Proteinen auf einer Fläche mit hoher Auflösung zu trennen. Man geht gegenwärtig davon aus, daß ca. 10.000 Proteine in einem solchen zweidimensionalen Gel nachgewiesen werden können [Klose J et al.: Two-dimensional electrophoresis of Proteins: an updated protocol and implications for a functional analysis of the genome, Electrophoresis, 1995, Jun 16 (6), 1034–59]. Ein weiterer Vorteil liegt darin, daß man durch radioaktive Markierung oder nach der Anfärbung mit ebenfalls bekannten Techniken in der Lage ist, die getrennten Proteine zu quantifiziern. Diese Quantifizierungsmethoden sind proteinspezifisch, haben einen eingeschränkten dynamischen Nachweisbereich, sind in der Regel schwer automatisierbar und sind abhängig von den jeweiligen (oft nicht vollständig zu reproduzierenden) Einsatzbedingungen [James P: Of genomes and proteomes, Biochem Biophys Res Commun, 1997, Feb 3, 231 (1), 1–6]. Sie sind nur für relative Bestimmungen geeignet. Die Quantifizierung über immunologische Eigenschaften ist problematisch, weil dafür Blottechniken mit eingeschränkter quantitativer Aussagekraft eingesetzt werden müssen.
-
Das Ergebnis ist ein fingerabdruckähnliches Bild, welches das Proteom charakterisiert.
-
Die Nachteile dieser Trenntechnik sind:
- – eingeschränkter dynamischer Bereich, der durch die Belastbarkeit der Trenngele hervorgerufen wird
- – die maximal einsetzbare Proteinmenge ist auf einen Bereich von ptg bis mg Protein begrenzt [James P: Of genomes and proteomes, Biochem Biophys Res Commun, 1997, Feb 3, 231 (1), 1–6]
- – Einschränkung des verwendeten Probenvolumens
- – die Trennung ist auf zwei Dimensionen beschränkt
- – die für die Trennung benötigten Ampholyte und das Gelmaterial Acrylamid können zu Artefakten führen und dadurch zu schwer erkennbaren Fehlinterpretationen beitragen
- – Proteine, die in sehr hohen Konzentrationen vorhanden sind, ergeben relativ starke Signale und überdecken solche in niedrigen Konzentrationen vorhandene, so daß eine direkte Identifikation und Quantifizierung in diesem Falle nicht möglich ist
- – der Verlust der nativen Konformation im denaturierenden Trenngel bedingt den Verlust der biologisch funktionellen Eigenschaften und erschwert die Identifikation der Proteine über die Bestimmung ihrer biologischen Eigenschaften, wie beispielsweise ihrer katalytischen Aktivität oder ihrer spezifischen Bindungseigenschaften
- – die Sekundäranalyse, wie die häufig eingesetzte, spezifische Proteolyse einzelner Proteine, gefolgt von Massebestimmungen, macht einen schwer automatisierbaren Extraktionsschritt aus dem Gel oder von der Blotmembran notwendig.
-
3. Identifikation der Proteine
-
Hierfür werden üblicherweise die Sequenzierung, die Massenanalyse und Schätzung des isoelektrischen Punkts aus der Laufstrecke im Gel sowie die Peptidfragmentmassenanalyse nach Isolierung aus dem Gel und tryptischem Verdau in der Massenspektrometrie eingesetzt [Shevchenko A et al.: Linking genome and proteome by mass spectrometry: large-scale identification of yeast Proteins from two dimensional gels, Proc Natl Acad Sci USA, 1996, Dec 10, 93 (25), 14440–5; Traini M et al.: Towards an automated approach for protein identification in proteome projects, Electrophoresis, 1998, Aug 19 (11), 1941–9]. Durch die verwendete Trenntechnik werden Merkmale, wie beispielsweise die katalytische Aktivität der Proteine und die native Konformation, nahezu vollständig ausgeschaltet und stehen nicht für die Identifikation zur Verfügung.
-
Die Vor- und Nachteile der bekannten Identifikationsverfahren sind insbesondere:
- – Die Sequenzierung erfolgt durch Edman Abbau an automatisierten Einrichtungen und ist relativ kosten- und zeitaufwendig. Sie erfordert größere Mengen des Proteins. Deshalb ist sie trotz gegenwärtiger Weiterentwicklung für ein Massenscreening weniger geeignet [Gooley AA et al.: A role for Edman degradation in proteome studies, Electrophoresis, 1997, Jun 18 (7), 1068–72]. Für die Identifizierung von primär unbekannten Proteinen ist dieser Analyseschritt allerdings in den meisten Fällen notwendig.
- – Die Spezifität der Aussage der Massenbestimmung eines Proteins, die letztlich zu seiner Identifizierung führen soll, wird dadurch erhöht, daß man die Proteine nach der Trennung einem Proteaseverdau unterwirft, und die mittels Masseanalytik erhaltenen Informationen mit den aus der Primärstruktur vorhergesagten Massen der Peptidsequenzen nach dem tryptischen Verdau vergleicht. Im wesentlichen werden zwei Arten der Massenspektrometrie eingesetzt. Das sind erstens die Matrix assistierte Laserdesorptionsionisierungs-Massenspektrometrie (MALDI-MS) und zweitens die Electrospray Ionisierungs-Massenspektrometrie (ESI-MS) [Ducret A et al.: High throughput Protein characterization by automated reverse-phase chromatography/electrospray tandem mass spectrometry, Protein Sci, 1998, Mar 7 (3), 706–19; Parker KC et al.: Identification of yeast proteins from two-dimensional gels: working out spot cross-contamination, Electrophoresis, 1998, Aug 19 (11), 1920–32]. Die erste Methode hat den Vorteil, daß sie einen sehr großen Massebereich bis zu 1 Mio Dalton zu analysieren erlaubt und relativ robust durchführbar ist. Allerdings kann sie nur diskontinuierlich durchgeführt werden. Die ESI-Technik hingegen kann quasi kontinuierlich an Trenntechniken angeschlossen werden und zeigt gegenwärtig einen starken Zuwachs sowohl in der Entwicklung der Applikationsbreite als auch hinsichtlich der technologischen Möglichkeiten. Die enormen Fortschritte, die in den letzten Jahren mit beiden Techniken erreicht wurden, erlauben Massenauflösungen bis zur Isotopenverteilung, also Auflösungen kleiner 1 Dalton. Damit wird ein Massenspektrum von Peptidfragmenten nach sequenzspezifischen, definiertem Proteaseverdau oder einer anderen definierten Spaltung der Proteine erhalten. Dieses Spektrum ist typisch für jedes Protein und wird zur Proteinidentifizierung in Sequenzdatenbanken von Proteinen und Expressed Sequence Tag Banken eingesetzt. Da die Identifikation des Proteins durch die präzise Identifikation der vorhergesagten Peptide nach Proteaseverdau zustande kommt, stört jede posttranslationale Modifikation der Proteine, beispielsweise durch Glykosylierung, die Erkennung. Darüber hinaus können Fragmentierungsspektren der einzelnen Peptide im Massenspektrometer Informationen über die Aminosäuresequenz der Peptide liefern. Diese Sequenzinformation kann allein oder zusammen mit den anderen bekannten Daten des Proteins zu dessen Identifizierung in einer Sequenzdatenbank genutzt werden. Dieses Verfahren zur Sequenzanalyse ist gegenwärtig auf Grund der Schwierigkeiten einer korrekten Dateninterpretation noch nicht im Routineeinsatz. Die Grenzen der Proteinidentifizierung durch massenspektrometrische Methoden bestehen in der nicht vollständigen Erfassung aller Proteinsequenzen in den vorhandenen Datenbanken.
-
4. Datenanalyse
-
Die erhaltenen Charakteristika der einzelnen detektierten Proteine aus der Trennung in der 2-D-Elektrophorese, wie die Quantität, isoelektrischer Punkt und Größe, die Daten zur Proteinidentifizerung aus weiteren Schritten, beispielsweise der Sequenzierung oder Massenspektrometrie, werden zusammengeführt. Hieraus ergibt sich das Bild der Gesamtheit der Proteine mit ihrer Identität und Quantität in dem jeweiligen Proteom.
-
Der Erfindung liegt die Aufgabe zu Grunde, die Quantifikation und Identifikation der Proteine eines Proteoms zu verbessern, zu erleichtern und für bestimmte Proteine überhaupt erst zu ermöglichen.
-
Die Aufgabe wird in einem Verfahren zur mehrdimensionalen Analyse eines Proteoms gelöst, bei dem das biologische Material mit dem zu analysierenden Proteom aufgeschlossen und die zu dem Proteom gehörenden Proteine getrennt sowie quantitativ bestimmt und identifiziert werden. Das erfindungsgemäße Verfahren ist dadurch gekennzeichnet,
- – dass die Proteine des Proteoms drei verschiedenen Chromatographieverfahren unter Erhalt der nativen Eigenschaften derart unterworfen werden, dass jeweils jede der in einem Trennschritt erhaltenen flüssigen Fraktionen m1 in einem darauf folgenden Trennschritt m2 flüssige Fraktionen liefert, wobei nach drei Trennschritten m1·m2·m3= M flüssige Fraktionen vorliegen, die mit r verschiedenen Analyseverfahren qualitativ durch an sich bekannte Identifikationsverfahren identifiziert und durch an sich bekannte Quantifikationsverfahren quantitativ bestimmt werden,
wobei als Trennverfahren Methoden, die nach Größe der Proteine trennen und/oder Methoden, die nach der Ladung der Proteine trennen und/oder Methoden, die nach der Hydrophobizität der Proteine trennen und/oder Methoden, die nach der Affinität der Proteine trennen, ausgewählt werden und wobei als Quantifikationsverfahren quantitative immunologische Methoden und/oder quantitative Bindungsassays ausgewählt werden, so dass nach Zusammenfügen der Analysedaten ein dreidimensionales Abbild des Proteoms, charakterisiert durch Identifikatoren und Quantifikatoren sowie durch die Lage im dreidimensionalen Datenraum, gewonnen wird.
-
In den Unteransprüchen 2–5 sind vorteilhafte Ausführungsformen des Verfahrens aufgeführt.
-
Mit dem erfindungsgemäßen Verfahren ist die enge Mengenlimitation durch die Belastbarkeit der bisher verwendeten 2-D-Elektrophorese nicht mehr gegeben. Es sind Proteinmengen im Bereich einiger Gramm einsetzbar. Die Trennmatrices sind mehrfach nutzbar. Hierdurch ist eine höhere Reproduzierbarkeit der Ergebnisse erzielbar. Das eingesetzte Probenmaterial liegt in der flüssigen Phase vor und ist somit anschließenden Analyseschritten unmittelbar zugänglich. Durch den besseren Erhalt der nativen Eigenschaften während der Trennung sind analytische Verfahren, wie die Aktivitätsbestimmung, und immunologische Verfahren, die auf der nativen Konformation des Analyten beruhen, möglich. Die Trennung von Analyten mit gleichen Ladungs- und Größeneigenschaften ist in der meist verwendeten 2-D-Elektrophorese nicht möglich. Durch den Einsatz von mindestens einem weiteren Charakteristikum, wie beispielsweise der Hydrophobizität des Analyten, zur Trennung entfällt allerdings diese Einschränkung. Die Proben stehen in den Fraktionen nach der Trennung auch weiteren präparativen Arbeiten zur Verfügung.
-
Die Erfindung soll nachstehend anhand eines in der Zeichnung dargestellten Ausführungsbeispiels näher erläutert werden.
-
Es zeigen:
-
1: Trennung von 1000 Proteinen in drei Dimensionen
Fig. Ia: Fraktionen 1 bis 33
Fig. 2a: Fraktionen 33/34 bis 67
Fig. 3a: Fraktionen 68 bis 100
-
2: Graphische dreidimensionale Darstellung der Fraktionen gemäß 1
-
Als Ausführungsbeispiel sollen 1000 Proteine durch drei Eigenschaften A, B, C beschrieben werden. Diese Eigenschaften können zum Beispiel Größe, Ladung und Hydrophobizität sein. Die Eigenschaften sind in den Proteinen zufällig verteilt. Alle Proteine sind fortlaufend numeriert. Hierauf erfolgt eine Trennung nach der Eigenschaft A (beispielsweise der Größe), bei der 100 Fraktionen a mit den entsprechenden Proteinen erhalten werden. Diese Fraktionen a werden nach der Eigenschaft B (beispielsweise der Ladung) in jeweils 10 Fraktionen b getrennt.
-
Jede dieser Fraktionen b wird einer Trennung nach der Eigenschaft C (beispielsweise der Hydrophobizität) unterworfen und liefert die Fraktionen c. Insgesamt werden 100 × 10 × 10 = 10.000 einzelne Fraktionen erhalten. Jedes durch die Trennung erhaltene Protein wird nach seinen Eigenschaften eindeutig einer der Fraktionen a, b, c zugeordnet. In der Aufstellung gemäß 1 sind die jeweiligen Fraktionen durch Zahlen bezeichnet. Hierbei sind die Fraktionen a der Eigenschaft A zugehörig. Sie teilen den möglichen Wertebereich der Eigenschaft A in jeweils einhundert gleiche Teile, d. h. für die Voraussetzung eines Wertebereichs von 0 bis 100 entspricht beispielsweise der Wert 1 dem Bereich 0 bis 1, der Wert 2 dem Bereich 1 bis 2, ..., der Wert 100 dem Bereich 99–100. Analog sind die möglichen Wertebereiche der Eigenschaften B und C in jeweils zehn gleiche Teile eingeteilt, d. h. beispielsweise der Wert 1 entspricht dem Bereich 1–10. Durchschnittlich jede zehnte Fraktion enthält ein Protein.
-
Aus der Zufallsbetrachtung ergibt sich die Möglichkeit von Mehrfachbesetzungen. In dem in der Aufstellung nach 1a–c aufgeführten Beispiel sind 39 Doppelbelegungen und eine Dreifachbelegung von Fraktionen enthalten.
-
Aus Platzgründen und der Übersicht halber sind die leeren 9.000 Fraktionen nicht dargestellt.
-
1 enthält folgende tabellarische Auflistung:
Protein | Fraktionen | Fraktionen | Fraktionen |
Nr. | a | b | c |
wobei in Fig. Ia die Fraktionen a = 1 bis 33, in
2a die Fraktionen a = 33/34 bis 67 und in Fig. Ic die Fraktionen a = 68 bis 100 aufgeführt sind.
2 zeigt ein dreidimensionales Diagramm mit den Positionen der durch Proteine besetzten Fraktionen nach
1.
-
Aufstellung der verwendeten Bezugszeichen
-
-
- A, B, C
- – Eigenschaft von Proteinen
- a, b, c
- – Fraktion