-
Die
vorliegende Erfindung betrifft ein Verfahren der Massenspektrometrie.
Die bevorzugte Ausführungsform
betrifft im Allgemeinen die Proteomanalyse und, genauer gesagt,
Verfahren zur Identifizierung und/oder Quantifizierung von einem
Protein oder Proteinen, die in einer Mischung aus Proteinen enthalten sind.
-
Der
klassische biochemische Ansatz zur Untersuchung biologischer Vorgänge basiert
auf der Reinigung bis zur Homogenität mittels Sequenzfraktionierung
und Assay-Zyklen
spezifischer Aktivitäten,
die einen Vorgang darstellen, der ausführlichen Struktur-, Funktions-
und Regelungsanalyse jeder isolierten Komponente und der Wiederherstellung
des Vorgangs anhand der isolierten Komponenten. Das Humangenomprojekt und
andere Genomsequenzprogramme veröffentlichen
in schneller Folge die vollständigen
Genomsequenzen bestimmter Arten und somit prinzipiell die Aminosäuresequenz
jedes Proteins, das möglicherweise
von dieser Art kodiert wird. Es ist nur zu erwarten, dass diese
in der Geschichte der Biologie einmalige Informationsquelle traditionelle
Forschungsmethoden verbessern und Fortschritte in von Grund auf
verschiedenen Forschungsparadigmen katalysieren wird, wovon eines
die Proteomforschung ist.
-
Die
Arbeit mit der Sequenzanalyse des gesamten humanen Genoms sowie
der Genome einer Anzahl anderer Arten war ausgesprochen erfolgreich.
Die Genome zahlreicher mikrobieller Arten (TIGR Microbial Database;
www.tigr.org) liegen vollständig
vor und die Genome von über
mehr als hundertzwanzig anderen mikrobiellen Arten werden gerade
sequenziert. Ferner sind die komplexeren Genome von Eukaryoten,
insbesondere diejenigen des genetisch gut beschriebenen einzelligen
Organismus Saccharomyces cerevisiae und der mehrzelligen Arten Caenorhabditis
elegans und Drosophila melanogaster vollständig sequenziert. Außerdem wurde
eine "vorläufige Sequenz" des Reisgenoms veröffentlicht
und die Vervollständigung
des Humangenoms und des Genoms von Arabidopsis steht kurz bevor.
Trotz des Fehlens vollständiger
Genomsequenzen wurden umfangreiche DNA-Sequenzdatenbanken frei verfügbar gemacht,
einschließlich
solcher, die mehr als 2,1 Millionen menschliche und mehr als 1,2
Millionen Exprimierte Sequenz Tags (EST) von Mäusen umfassen.
-
EST
sind Schnipsel mit etwa 300 bis 500 zusammenhängenden Nukleotiden, die Gensequenzfragmente
darstellen, welche durch eine systematische Sequenzanalyse in einem
Durchlauf von Klonen in cDNA-Bibliotheken
erzeugt werden. Gemessen am zeitlichen Maßstab der meisten biologischen
Vorgänge,
natürlich
mit Ausnahme der Evolution, kann die genomische DNA-Sequenz als statisch
betrachtet werden und somit stellt eine Genomsequenz-Datenbank eine
Informationsquelle dar, die einer Bibliothek ähnlich ist. Intensive Anstrengungen
werden unternommen, um einzelnen Sequenzen in Sequenzdatenbanken "Funktionen" zuzuweisen. Versucht
wird dies mithilfe von Computeranalysen der linearen Sequenzmotive
oder der Strukturmotive höherer
Ordnung, die eine statistisch signifikante Ähnlichkeit einer Sequenz mit
einer Familie von Sequenzen bekannter Funktion aufweisen, oder mithilfe
von anderen Mitteln, wie einem Vergleich der artübergreifenden homologen Proteinfunktionen.
Auch andere Verfahren wurden zur Bestimmung der Funktion einzelner
Sequenzen verwendet, einschließlich
experimenteller Verfahren, wie der Ausschaltung von Genen und der
Unterdrückung
der Genexpression unter Verwendung der antisense-Nukleotid-Technik,
was zeitaufwändig und
in einigen Fällen
unzureichend sein kann, einem von der Sequenz kodierten Polypeptid
eine biologische Funktion zuzuweisen.
-
Das
Proteom ist als das von einem Genom exprimierte Proteinkomplement
definiert. Diese etwas restriktive Definition unterstellt, dass
das Proteom statisch ist. Tatsächlich
ist das Proteom ausgesprochen dynamisch, da die Arten der exprimierten
Proteine, deren Häufigkeit,
Modifikationszustand und subzelluläre Stellen von dem physiologischen
Zustand der Zelle oder des Gewebes abhängig sind. Aus diesem Grund
kann das Proteom einen zellulären
Zustand oder externe, von der Zelle angetroffene Bedingungen widerspiegeln
und die Proteomanalyse kann als ein Assay des gesamten Genoms zur
Differenzierung und Untersuchung zellulärer Zustände und zur Bestimmung der
molekularen Mechanismen, die diese steuern, betrachtet werden. In Anbetracht
der Tatsachen, dass das Proteom einer differenzierten Zelle aus
schätzungsweise
Tausenden bis Zehntausenden von differenzierten Proteinarten besteht,
wobei der geschätzte
dynamische Expressionsbereich mindestens 5 Größenordnungen beträgt, scheinen
die Aussichten für
eine Proteomanalyse eher entmutigend. Dank der Verfügbarkeit
von DNA-Datenbanken, die die Sequenz jedes potenziell exprimierten
Proteins enthalten, sowie der schnellen Fortschritte bei Technologien,
mit denen sich Proteine, die tatsächlich exprimiert werden, identifizieren
lassen, ist die Proteomik heute jedoch eine realistische Möglichkeit.
Die Massenspektrometrie ist einer der wesentlichen Grundpfeiler
der aktuellen Proteomiktechnik.
-
Die
quantitative Proteomik ist die systematische Analyse aller Proteine,
die von einer Zelle oder einem Gewebe exprimiert werden, bezüglich deren
Quantität
und Identität.
Die Proteine, die von einer Zelle, einem Gewebe, einer biologischen
Flüssigkeit
oder einem Proteinkomplex zu jedem Zeitpunkt exprimiert werden, stellen
eine präzise
Definition des jeweiligen Zustands der Zelle oder des Gewebes dar.
Die quantitativen und qualitativen Unterschiede von Proteinprofilen
desselben Zelltyps in unterschiedlichen Zuständen können zum Verständnis der Übergänge zwischen
den jeweiligen Zuständen
beitragen. Traditionell wurde die Proteomanalyse mit einer Kombination
aus hochauflösender
Gelelektrophorese, insbesondere zweidimensionaler Gelelektrophorese,
zur Trennung der Proteine und Massenspektrometrie zur Identifizierung
von Proteinen durchgeführt.
Dieser Ansatz ist sequenziell und Zeit raubend, aber noch wichtiger,
er ist grundsätzlich
beschränkt,
da biologisch wichtige Proteinklassen im Wesentlichen nicht erfassbar
sind.
-
WO
99/12040 offenbart ein Verfahren zur Bestimmung der Identität eines
Zielpolypeptids unter Verwendung der Massenspektrometrie. Courchesne
et al., Methods in Molecular Biology, Band 112, 1999, Seite 487–511, offenbart
die Identifizierung von Proteinen mittels Massenspektrometrie mit
matrixunterstützter
Laserdesorption/-ionisation unter Verwendung von Peptid- und Fragment-Ionenmassen.
Corthals et al. offenbart die Identifizierung von Proteinen mithilfe
der Massenspektrometrie in Proteome research: 2D gel electrophoresis
and detection methods, Herausgeber: Rabilloud, T., Springer, New
York, 1999, S. 197–231.
Pennington et al. offenbart Verfahren zur Proteinidentifizierung
in Trends in Cell Biology, Band 7, Nr. 7, April 1997 (1997-04),
Seite 168–173.
-
Erfindungsgemäß wird ein
Verfahren zur Massenspektrometrie bereitgestellt.
-
Die
bevorzugte Ausführungsform
stellt Verfahren zur Identifizierung von Polypeptiden bereit. Das
Verfahren kann die Schritte des simultanen Bestimmens der Masse
einer Untergruppe von parentalen Polypeptiden einer Population von
Polypeptiden und der Masse von Fragmenten der Untergruppe von parentalen
Polypeptiden; Vergleichens der bestimmten Massen mit einem annotierten
Polypeptidindex und Identifizierens eines oder mehrerer Polypeptide
des annotierten Polypeptidindex mit den bestimmten Massen umfassen.
Die bevorzugte Ausführungsform
stellt auch Verfahren zur Identifizierung eines Polypeptids durch
Bestimmen zweier oder mehrerer Charakteristika, die mit dem Polypeptid
oder einem Fragment davon assoziiert sind, wobei eines der Charakteristika
die Masse eines Fragments des Polypeptids ist, wobei die Fragmentmasse
mithilfe der Massenspektrometrie bestimmt wird; Vergleichen der
Charakteristika, die mit dem Polypeptid assoziiert sind, mit einem
annotierten Polypeptidindex und Identifizieren eines oder mehrerer
Polypeptide in dem annotierten Polypeptidindex mit diesen Charakteristika
bereit. Das Verfahren kann darüber
hinaus den Schritt eines Quantifizierens der Menge des identifizierten
Polypeptids in einer Probe, die das Polypeptid enthält, umfassen.
-
Verschiedene
Ausführungsformen
der vorliegenden Erfindung mit anderen Anordnungen, die ausschließlich der
Veranschaulichung dienen, sind nachstehend unter Bezugnahme auf
die beiliegenden Zeichnungen offenbart.
-
1 zeigt
ein schematisches Diagramm einer Strategie zur Proteinidentifizierung
auf der Grundlage von Messungen mittels Massenspektrometrie (MS)
und Tandem-Massenspektrometrie
(MS/MS).
-
2 zeigt
zwei unterschiedliche Verfahren zur Erzeugung von mittels Fragment-Ionen
selektierten Peptid-Ionen, die ein Diagnosewerkzeug zur Identifizierung
des parentalen Ions sind. 2A zeigt
die Selektion eines parentalen Ions (in Q1), das in einer Kollisionszelle
(Q2) fragmentiert wird. Von den Fragmenten wird ein Massenspektrum
erstellt (in Q3). 2B zeigt, dass anstatt
der Selektion eines einzigen parentalen Ions mehrere parentale Ionen
(in der "Ursprungsregion" angegeben) gleichzeitig
in der Postionisationsregion oder der Kollisionszelle fragmentiert
werden. Die Fragment-Ionen werden dann in einem Q1- oder anderen
Massenanalysegerät
analysiert, was ein Massenspektrum ergibt, das aus Fragment-Ionen
mehrerer parentaler Ionen besteht.
-
3 zeigt
die Schritte eines Verfahrens zum Vergleichen und Quantifizieren
zweier Polypeptidpopulationen unter Verwendung eines Polypeptididentifizierungsindex
von annotierten Peptidtags.
-
4 zeigt
die Identifizierung eines Polypeptids unter Verwendung der Massenspektrometrie
(MS). 4A und 4B zeigen
Massenspektren zweier Polypeptide (P1, ASHLGLAR, SEQ ID NO: 1; und
P2, RPRGFSPR, SEQ ID NO: 2), die unter Verwendung von ESI-TOF erhalten
wurden. Die Spektren wurden mit niedriger VDüse-Skimmer (10
V) (4A) und hoher VDüse-Skimmer (240
V) (4B) erhalten. 4C zeigt
eine Liste mit 12 und 13 möglichen
Polypeptididentifizierungen für
P1 (SEQ ID NO: 3–12,
2, 13 bzw. 14) bzw. P2 (SEQ ID NO: 15–24, 1 bzw. 25).
-
5 zeigt
eine chromatographische Analyse eines Extrakts von Saccharomyces
cerevisiae. Das durch den Pfeil gekennzeichnete Peptid wurde mittels
nicht fragmentarischer und fragmentarischer MS-Analyse analysiert.
-
6 zeigt
die nicht fragmentarische MS-Analyse des in 5 durch
den Pfeil gekennzeichneten Peptids (YRPNCPIILVTR; SEQ ID NO: 26).
-
7 zeigt
die nicht fragmentarische MS-Analyse des in 5 durch
den Pfeil gekennzeichneten Peptids (YRPNCPIILVTR; SEQ ID NO:26).
-
8 zeigt eine chromatographische Analyse. 8A zeigt das Basispeak-Chromatogramm, 8B zeigt das Einzelionenchromatogramm bei 496,26
m/z [M1 + 3H] und 8C zeigt
das Einzelionenchromatogramm bei 586, 30 m/z [M2 +
3H].
-
9 zeigt
eine nicht fragmentarische MS-Analyse.
-
10 zeigt eine fragmentarische MS-Analyse.
-
Die
bevorzugte Ausführungsform
stellt Verfahren zur Identifizierung eines Polypeptids aus einer
Population von Polypeptiden durch Bestimmen von Charakteristika,
die mit einem Polypeptid oder einem Peptidfragment davon assoziiert
sind, Vergleichen der ermittelten Charakteristika mit einem Polypeptididentifizierungsindex
und Identifizieren eines oder mehrerer Polypeptide in dem Polypeptididentifizierungsindex
mit denselben Charakteristika bereit. Diese Verfahren sind bei der
Proteomanalyse anwendbar und ermöglichen
eine schnelle und wirksame Identifizierung eines oder mehrerer Polypeptide
in einer komplexen Probe. Die Verfahren basieren auf der Erzeugung
eines Polypeptididentifizierungsindex, bei dem es sich um eine Datenbank
aus Charakteristika, die mit einem Polypeptid assoziiert sind, handelt.
Der Polypeptididentifizierungsindex kann zum Vergleichen von Charakteristika
verwendet werden, deren Assoziation mit einem Polypeptid aus einer Probe
zur Identifizierung des Polypeptids bestimmt wurde. Ferner können die
Verfahren nicht nur zur Identifizierung eines Polypeptids, sondern
auch zur Quantifizierung der Menge bestimmter Proteine in der Probe
verwendet werden.
-
Die
Verfahren zur Identifizierung eines Polypeptids können zur
Durchführung
einer quantitativen Proteomanalyse oder für Vergleiche von Polypeptidpopulationen,
die sowohl die Identifizierung als auch die Quantifizierung von
Polypeptidproben beinhalten, angewendet werden. Eine derartige quantitative
Analyse lässt sich,
falls erwünscht,
zweckmäßig in zwei
Stadien durchführen.
In einem ersten Schritt kann beispielsweise aus einer zu untersuchenden
Art, einem zu untersuchenden Zelltyp oder Gewebetyp, wie hier beschrieben,
ein Bezugspolypeptidindex erstellt werden, der für die zu prüfende Probe repräsentativ
ist. Der zweite Schritt ist der Vergleich von Charakteristika, die
mit dem unbekannten Polypeptid assoziiert sind, mit dem zuvor erzeugten
Bezugspolypeptidindex oder den zuvor erzeugten Bezugspolypeptidindices.
Ein Bezugspolypeptidindex ist eine Datenbank aus Polypeptididentifikationscodes,
die die Polypeptide einer bestimmten Probe repräsentieren, wie einer Zelle,
einer subzellulären
Fraktion, eines Gewebes, eines Organs oder eines Organismus. Ein Polypeptididentifizierungsindex
kann erzeugt werden, der für
eine beliebige Anzahl von Polypeptiden in einer Probe repräsentativ
ist, einschließlich
im Wesentlichen aller Polypeptide, die potenziell in einer Probe
exprimiert werden. Demzufolge ermöglichen die Verfahren vorteilhaft
die Bestimmung von Polypeptiden in einer Probe, die mit einem bestimmten
physiologischen Zustand der Probe, z. B. einem Krankheitszustand
korreliert und diesen festlegt. Sobald ein Polypeptididentifizierungsindex
erzeugt ist, kann der Index darüber
hinaus wiederholt zur Identifizierung eines oder mehrerer Polypeptide
in einer Probe, beispielsweise eine Probe eines Individuums, das
möglicherweise
an einer Krankheit leidet, verwendet werden.
-
Für die Quantifizierung
eines Polypeptids in einer Probe wird ein Polypeptid mit einem chemisch
identischen Molekül
verglichen, das beispielsweise mit 13C anstatt 12C, Deuterium anstatt Wasserstoff oder 18O anstatt 16O isotopenmarkiert
ist. Es kann eine beliebige Anzahl an differenzierten Isotopen eingearbeitet
werden, mit der Maßgabe,
dass, wie hier offenbart, eine ausreichende mittels Massenspektrometrie
unterscheidbare Massendifferenz vorhanden ist. Da die Moleküle bis auf
den Isotopenunterschied chemisch identisch sind, zeigen die Moleküle dasselbe
physikalisch-chemische Verhalten. Falls erwünscht, können außerdem mehr als zwei Proben
verglichen werden, sofern eine ausreichende Anzahl an Isotopenmarkierungen
(zum Beispiel d0, d4, d8, d12) zur Verfügung steht, sodass die verschiedenen
Proben mittels MS verglichen und unterschieden werden können. Die
Quantifizierung basiert auf einer stabilen Isotopenverdünnung. Ein
Verfahren zur Quantifizierung einer Probe ist das Anreichern der
Probe mit einem internen Standard, der chemisch identisch ist, aber
unterschiedliche Isotopen aufweist. Zum Extrapolieren der Menge
an Molekül
in einer Probe kann mit Verdünnung
des Isotops eine Standardkurve erzeugt werden. In einem derartigen
Fall muss das anzureichernde Molekül identisch sein und aus diesem
Grund müssen
die Moleküle
in der Probe bekannt sein.
-
Ein
anderes zweckmäßiges Verfahren
zur Quantifizierung von Polypeptiden in einer Probe ist die Verwendung
eines Reagenz, wie ICATTM (Gygi et al.,
Nature Biotechnol. 17: 994–999
(1999); WO 00/11208). Ein ICATTM-artiges Reagenz,
das nachstehend ausführlicher
beschrieben ist, enthält
ein Affinitätstag,
eine Linker-Einheit, in die ein oder mehrere stabile Isotope eingefügt werden
können,
und eine reaktive Gruppe, die kovalent an eine Aminosäureseitenkette
eines Polypeptids, wie eines Cysteins, binden kann. Zur Quantifizierung
unter Verwendung eines ICATTM-artigen Reagenz
werden parallele Proben mit unterschiedlichen Isotopenversionen
des ICATTM-artigen Reagenz behandelt. Eine
Probe kann markiert und mit einer parallel markierten Probe beispielsweise
für die
Normalisierung mit einer Bezugs- oder Kontrollprobe für die Quantifizierung verglichen
werden. Die Verwendung eines ICATTM-artigen
Reagenz zur Identifizierung und Quantifizierung von Polypeptiden
in einer Probe ist in 3 dargestellt. Da die mit unterschiedlichen
Isotopenversionen des ICATTM-artigen Reagenz
markierten Peptide dasselbe physikalisch-chemische Verhalten zeigen,
lassen sich dieselben Polypeptide in den zwei Proben gemeinsam reinigen,
sind aber weiterhin aufgrund der Isotopenunterschiede der ICATTM-artigen Markierung mittels MS unterscheidbar.
Demzufolge können
die relativen Mengen derselben Polypeptide einfach verglichen und
quantifiziert werden (Gygi et al., supra, 1999). Jedes zweite Scan
kann nur auf die Fragmentierung und anschließende Aufzeichnung von Sequenzdaten
des eluierten Peptids (MS/MS-Spektrum) beschränkt sein. Das parentale Polypeptid,
von dem dieses Peptid abstammt, kann durch eine Suche in einer Sequenzdatenbank
mit dem aufgezeichneten MS/MS-Spektrum identifiziert werden. Das
Verfahren stellt somit die relative Quantifizierung und Identifizierung
der Komponenten von Proteinmischungen im Rahmen einer einzigen Analyse
bereit. Ein derartiger Vergleich kann für die Quantifizierung der Expressionsniveaus
von Polypeptiden im Verhältnis
zu einer Bezugsprobe nützlich
sein, beispielsweise beim Vergleich der Expressionsniveaus in einer
Probe eines Individuums mit einer Krankheit oder mit Verdacht auf
eine Krankheit mit einer Probe von einem gesunden Individuum oder
für forensische
Zwecke.
-
Ein
ICATTM-artiges Reagenz dient, neben seiner
Nützlichkeit
bei der Quantifizierung von Polypeptiden, als eine Beschränkung der
Komplexität
des Systems, das heißt,
nur wenn die Polypeptide affinitätsisoliert
oder nebeneinander mit einer unterschiedlich isotopenmarkierten
Probe verglichen wurden, werden die Polypeptide oder Fragment davon,
die die Aminosäure
enthalten, die mit dem ICATTM-artigen Reagenz
reaktiv ist, markiert und charakterisiert (Gygi et al., supra, 1999).
Demzufolge kann die Verwendung eines ICATTM-artigen Reagenz eine
Senkung der Komplexität
der Probe bereitstellen. Ferner ist die Fähigkeit eines Polypeptids oder
eines Fragments davon, sich mit einem ICATTM-artigen
Reagenz markieren zu lassen, das heißt, sofern das Peptid die reaktive
Aminosäure
enthält,
ein Charakteristikum, das mit dem Polypeptid assoziiert ist und
das für
die Identifizierung des Polypeptids zusammen mit weiteren Charakteristika
nützlich
ist.
-
Ein
weiterer Vorteil der Verwendung eines ICATTM-artigen
Reagenz ist die Tatsache, dass die Identität von Polypeptiden in einer
Probe nicht vor der Analyse bekannt sein muss. Wie vorstehend beschrieben,
verlangt eine Isotopenverdünnung,
wenn die Probe mit einem internen Standard angereichert wird, dass
die Probe mit einem chemisch identischen Molekül mit unterschiedlicher Isotopenmarkierung
angereichert wird, und verlangt somit, dass ein zu quantifizierendes
Polypeptid oder Fragment davon bekannt ist, sodass ein chemisch
identisches Molekül
mit unterschiedlicher Isotopenmarkierung zugegeben werden kann.
Mit einem ICATTM-artigen Reagenz müssen die
genauen Polypeptide oder Fragmente davon nicht bekannt sein. Ferner ist
es nicht erforderlich, für
die Charakterisierung einer Vielfalt von Polypeptiden in einer Probe
eine Vielfalt von isotopenmarkierten Molekülen zu synthetisieren.
-
Neben
der Verwendung eines Markierungsreagenz, wie eines ICATTM-artigen
Reagenz, das einen Affinitätsmarker
einschließt,
können
auch andere Markierungsreagenzien zur unterschiedlichen Isotopenmarkierung
von zwei verschiedenen Polypeptide enthaltenden Proben verwendet
werden. So können
beispielsweise zwei chemisch identische Reagenzien, die unterschiedliche
Isotope enthalten, verwendet werden, um zwei Polypeptidproben kovalent
zu modifizieren, wobei die Reagenzien kein Affinitätstag enthalten.
Demzufolge können,
falls erwünscht,
anstatt eines Affinitätsisolierschritts,
der mit einem ICATTM-artigen Tag assoziiert
ist, andere Isolierschritte verwendet werden. Nichtsdestotrotz können die
Polypeptide mit unterschiedlicher Isotopenmarkierung für eine quantitative
Analyse verglichen werden. Beispielsweise kann die Methylierung von
Polypeptiden mittels Veresterung mit Methanol, das d0 (kein Deuterium)
oder d3 (drei Deuteriumatome) enthält, zur unterschiedlichen Isotopenmarkierung
von zwei Polypeptidproben verwendet werden. Auf ähnliche Weise kann jedes bekannte
Verfahren zur Modifizierung von Seitenkettenaminosäuren an
Polypeptiden analog mit unterschiedlicher Isotopenmarkierung, wie
Deuterium anstatt Wasserstoff, C13 anstatt
C12, O18 anstatt
O16 verwendet werden (siehe beispielsweise
Glazer et al., Laboratory Techniques in Biochemistry and Molecular
Biology: Chemical Modification of Proteins, Kapitel 3, S. 68–120, Elsevier
Biomedical Press, New York (1975); Pierce Catalog (1994), Pierce,
Rockford IL). Es kann jede beliebige Anzahl an unterschiedlichen
Isotopen eingeführt
werden, solange parallel markierte Polypeptide einen Massenunterschied
aufweisen, der ausreicht, um mittels MS erfasst zu werden. Zusätzlich zu
der chemischen Modifizierung eines Polypeptids, wie vorstehend beschrieben,
können
zwei Polypeptidproben mit einer Protease, wie Trypsin oder dergleichen,
in Gegenwart von O16- sowie O18-markiertem
H2O gespalten werden. Da die Spaltreaktion
der Protease zur Addition von Wasser zu den gespaltenen Peptiden
führt,
kann die Spaltung in Gegenwart von H2O mit
unterschiedlicher Isotopenmarkierung zur Einführung unterschiedlicher Markierungen
zu getrennten Polypeptidproben verwendet werden. Es ist offensichtlich,
dass jedes Verfahren, das zur Einführung einer Isotopenmarkierung
zur unterschiedlichen Markierung von zwei Polypeptidproben nützlich ist,
in erfindungsgemäßen Verfahren,
insbesondere quantitativen Verfahren, verwendbar ist, solange die
zu vergleichenden Proben auf chemisch ähnliche Weise behandelt werden,
sodass sich die gebildeten markierten Polypeptide im Wesentlichen
nur durch die unterschiedliche Isotopenmarkierung unterscheiden.
-
Noch
ein weiteres Verfahren zur Quantifizierung einer Probe ist die Inkubation
einer Probe unter Bedingungen, die eine metabolische Einführung von
Isotopen in zwei zu vergleichende Proben ermöglicht, indem eine Probe in
Gegenwart eines Isotops inkubiert wird oder in einem Medium inkubiert
wird, das zu einer Verarmung an einem natürlich vorkommenden Isotop führt (siehe
beispielsweise Oda et al., Proc. Natl. Acad. Sci. USA 96: 6591–6596 (1999)).
Ein derartiges Verfahren ist bei einer zweckgemäß gezüchteten Probe besonders nützlich,
beispielsweise einer mikrobiellen Proben oder einer Primärkultur
von Zellen, die von einem Individuum stammt. Demzufolge können sowohl
In-vitro- als auch In-vivo-Verfahren
für die
unterschiedliche Isotopenmarkierung zweier Proben für Vergleichs-
oder Quantifizierungszwecke verwendet werden.
-
Die
Verfahren der bevorzugten Ausführungsform
basieren auf der Bestimmung der Charakteristika eines Polypeptids,
die die Identifizierung des Polypeptids auf der Grundlage der bestimmten
physikalisch-chemischen
Charakteristika ermöglichen.
Die Zusammenstellung der physikalisch-chemischen Charakteristika, die
zur Identifizierung eines Polypeptids dienen können, ist im Wesentlichen ein "Strichcode" des Polypeptids, das
heißt,
eine Zusammenstellung von Charakteristika, die ausreicht, um ein
Polypeptid auf der Grundlage einer Korrelation der Charakteristika
mit einer Bezugsdatenbank, die als Polypeptididentifizierungsindex
dient, eindeutig zu identifizieren. Die Verfahren sind für die schnelle
und wirksame Analyse komplexer Proben, die viele verschiedene Polypeptide
enthalten, was ansonsten mit anderen Verfahren zeitaufwändig und
ineffizient ist, besonders vorteilhaft. Die Verfahren der bevorzugten
Ausführungsform
können
somit zur Analyse komplexer Proben angewendet werden, die zahlreiche
unterschiedliche Polypeptide enthalten, und sind besonders in Proteomikanwendungen
nützlich.
Demgemäß können die
Verfahren vorteilhaft zur Identifizierung von Polypeptiden des Proteoms
verwendet werden. Da das Proteom ein Spiegel der Polypeptidexpression
und posttranslationaler Modifizierungen, die mit dem metabolischen
Zustand der Zelle korrelieren, ist, können die Verfahren auch für Diagnoseanwendungen
zur Bestimmung einer normalen oder anomalen Polypeptidexpression,
die mit einer Krankheit assoziiert ist, verwendet werden. Demzufolge
können
die Verfahren in klinischen Anwendungen zur Diagnose einer Krankheit
oder eines Zustands verwendet werden.
-
Die
Verfahren verwenden vorteilhaft Beschränkungsparameter, die die Identifizierung
eines Polypeptids in einer komplexen Mischung verschiedener Polypeptide
ermöglichen.
Diese Beschränkungen
können
zur Vereinfachung der Identifizierung von Polypeptiden verwendet
werden. Eine Beschränkung
kann beispielsweise der Einschluss einer oder mehrerer Charakteristika,
die mit einem Polypeptid assoziiert sind, die Identifikation einer
Untergruppe von Polypeptiden in einer komplexen Mischung oder jede
Art von Beschränkung
sein, die zur Vereinfachung der Analyse einer komplexen Mischung
aus Polypeptid herangezogen werden kann. Die Verfahren stellen somit
einer wirksamere Identifizierung von Polypeptiden in einer komplexen
Mischung, die eine große
Anzahl an Polypeptiden enthält,
bereit, was für
die Proteomanalyse besonders nützlich
ist.
-
Die
Erzeugung und die Verwendung eines Polypeptididentifizierungsindex
bietet mehrere Vorteile. Zum einen können die Verfahren in Verbindung
mit der selektiven Isolierung von Polypeptidfragmenten verwendet
werden, die spezifische Strukturmerkmale enthalten, welche durch
Markieren mit spezifischen chemischen Reagenzien genutzt werden
können.
Die Selektion der "markierten" Fragmente mittels
Affinität
macht die Polypeptidmischung weniger komplex und kompatibel mit
den hoch denaturierenden/solubilisierenden Bedingungen, die für die Proteinisolierung
und -behandlung verwendet werden können. Die selektive Isolierung von
Fragmenten kann auch durch eine Datenbankabfrage eingeschränkt werden.
Beispielsweise senkt eine selektive Cystein-Markierung, wie hier
offenbart, die Komplexität
der Peptidmischung um etwa das Zehnfache.
-
Ein
zweiter Vorteil der bevorzugten Verfahren ist deren einfache Verwendbarkeit
in einer Vielfalt von Laborkonfigurationen. Massenmessungen sind
beispielsweise absolut und Chromatographieparameter können problemlos
standardisiert werden. Aus diesem Grund lässt sich ein Polypeptididentifizierungsindex,
der mittels der Verfahren der bevorzugten Ausführungsform ermittelt wurde,
problemlos von Labor zu Labor übertragen
und die von verschiedenen Labors produzierten Daten können problemlos
mit einem unter ähnlichen Bedingungen
ermittelten Polypeptididentifizierungsindex verglichen werden. Dieser
Vorteil kann durch die Verfügbarkeit
des Verfahrens über
ein Netzwerk, beispielsweise durch Erstellen eines webbasierten
Suchwerkzeugs, weiter genutzt werden. Ein dritter Vorteil besteht
darin, dass die Verfahren mit einer einstufigen Massenanalyse durchgeführt werden
können,
die schnell, einfach und empfindlich ist. Ein vierter Vorteil ist
die Tatsache, dass die Verfahren zur präzisen Ermittlung des Verhältnisses
jedes in der komplexen Polypeptidprobe vorhandenen Polypeptids genutzt
werden können,
mit der Maßgabe,
dass die Proben mit einer stabilen Isotopenmarkierung modifiziert
wurden. Schließlich
haben die Verfahren eine im Wesentlichen unbegrenzte Kapazität, was die
Möglichkeit
einer Analyse von Polypeptiden mit sehr geringer Häufigkeit
sichert, sowie eine hohe Peak-Kapazität, was wiederum die Analyse
hoch komplexer Proben ermöglicht.
-
Wie
hier offenbart können
neben der Isolierung einzelner parentaler Ionen vor der Fragmentierung mehrere
Ionen parallel und ohne die Selektion einzelner Ionen fragmentiert
werden (siehe 2). Demgemäß besteht ein wesentlicher
Vorteil eines derartigen Verfahrens darin, dass die Parameter für mehrere
Polypeptide einfach und parallel anstatt, wie es bei der Proteinidentifizierung
mittels MS/MS der Fall ist, einzeln für jedes Peptid bestimmbar sind.
-
In
einer Ausführungsform
kann ein Polypeptididentifizierungsindex durch Bestimmung der Charakteristika,
die mit einem Polypeptid assoziiert sind, insbesondere durch Messungen
der Fragment-Ionenmasse, mittels
MS/MS, die mit oder ohne Selektion parentaler Ionen (2)
erzeugt wurde, und fakultativ einschließlich chromatographischer Schritte
erzeugt werden. Diese Massenbestimmungen müssen nicht von hoher Genauigkeit
sein. Die genaue Masse kann, falls erwünscht, berechnet und zusammen
mit anderen Charakteristika, die mit einem bestimmten Polypeptid
assoziiert sind, zu einem Index kompiliert werden. Um die Identifizierung
eines Polypeptids im Index zu ermöglichen, wird eine ausreichende
Anzahl an Charakteristika bestimmt. Die Verfahren können wahlweise
und vorteilhaft zusammen mit einer Quantifizierung zur Bereitstellung zusätzlicher
Angaben über
den physiologischen Zustand einer Probe verwendet werden. Im Falle
von einfacheren Systemen, beispielsweise mikrobiellen oder viralen
Genomen oder Spezimen von Individuen mit einer geringeren Anzahl
an Polypeptiden, wie Zerebrospinalflüssigkeit, kann jedoch die Komplexität der Polypeptide in
einer Probe gering genug sein, dass in bestimmten Anwendungen eine
qualitative Analyse der Polypeptide in einer Probe ausreicht. Wenn
in diesem Fall eine qualitative Bestimmung der Expression eines
Polypeptids in einer Probe für
eine Korrelation mit einer bestimmten Bedingung, beispielsweise
einer Krankheitsbedingung, ausreicht, können die erfindungsgemäßen Verfahren
für eine
qualitative Identifizierung eines Polypeptids in einer Probe verwendet
werden.
-
Ein
beispielhafter Polypeptididentifizierungsindex oder eine solche
Datenbank ist in Beispiel IV beschrieben. Das wachsende Gebiet der
auf Massenspektrometrie basierenden Proteomik verlangt die Einarbeitung
neuer Verfahren zur schnellen Identifizierung von Proteinen für Abfragen
betreffend den Zustand ganzer Zellen. Hierfür wurden erfolgreich Verfahren
zur Probenvereinfachung verwendet, einschließlich der Reinigung mit cysteinhaltigem
Peptid (Gygi et al., Nat. Biotechnol. 17: 994–999 (1999)). Unter Verwendung
der sich natürlich
daraus ergebenden Beschränkungen,
kann die potenzielle Anzahl an Peptidkandidaten in einer Mischung
so weit gesenkt werden, dass ein Peptid und dessen parentales Protein
mit einer hohen Massengenauigkeit (~0,1–1 ppm) eindeutig identifiziert
werden können
(Goodlett et al., Anal Chem. 72: 1112–1118 (2000)). Es hat sich
erwiesen, dass mit einer hohen Massengenauigkeit eines Peptids und
wenigen Fragment-Ionen
dieses Peptids auch ohne die Verwendung einer Beschränkung durch
Cystein dieselben Ergebnisse sogar in Gegenwart von gleichzeitig
eluierenden Peptiden erzielt werden können (Masselon et al., Anal Chem.
73: 1918–1924
(2000)). Wie hier offenbart, wurde eine Kombination dieser Konzepte
unter Verwendung eines TOF-anstatt
eines FT-ICR-Massenspektrometers anhand eines Extrakts von Saccharomyces
cerevisiae getestet (siehe Beispiel IV). Dies erfolgte mit einer
Kombination aus Beschränkung
durch Cystein zur Reduzierung der Datenbankkomplexität und in-source
CID zur Erzeugung von Fragment-Ionen. Das Verfahren ist erwiesenermaßen auch
bei Co-Elution der Peptide wirksam. Dieser Vorgang ermöglicht eine
Shotgun-Sequenzanalyse, die die Sequenz von co-eluierenden Peptiden
wiedergibt.
-
Wie
in 2 dargestellt, kann ein bevorzugtes Verfahren
beispielsweise in Abwesenheit von Einzelionenselektion oder in Abwesenheit
von Ionenselektion in einer Ursprungsregion durchgeführt werden.
Die beispielsweise als Q1, Q2,
Q3 und dergleichen, bezeichneten Regionen
beziehen sich auf Quadrupole. Diese sind physikalische Mittel zum
Abtrennen eines selektierten Ions auf der Grundlage von m/z. Es
ist jedoch offensichtlich, dass neben der Verwendung von Quadrupolen
jedes passende Verfahren, das zum Abtrennen selektierter Ionen geeignet
ist, in den Verfahren der bevorzugten Ausführungsform verwendet werden
kann.
-
Der
Begriff "Charakteristikum", wie hierin unter
Bezugnahme auf ein Polypeptid verwendet, bezieht sich auf eine physikalisch-chemische
Eigenschaft eines Polypeptids. Zu physikalisch-chemischen Eigenschaften
gehören
physikalisch-chemische Eigenschaften eines parentalen Polypeptids,
wie die Molekülmasse,
Aminosäurezusammensetzung,
pI-Wert und dergleichen, sowie die physikalisch-chemischen Eigenschaften
eines Fragments eines Polypeptids, einschließlich Fragment-Ionen, die mit einem
Polypeptid korrelierbar sind und somit als Charakteristika, die
mit einem parentalen Polypeptid assoziiert sind, betrachtet werden.
Zu den physikalisch-chemischen Eigenschaften eines Polypeptids gehören auch
messbare Verhalten eines Polypeptids, die sich aus den jeweiligen
physikalisch-chemischen Eigenschaften ergeben. Zu physikalisch-chemischen
Eigenschaften gehören
beispielsweise die Reihenfolge der Elution an einem bestimmten chromatographischen Medium
unter bestimmten Bedingungen und die Position, zu der ein Polypeptid
unter bestimmten Bedingungen in einem Polyacrylamidgel wandert.
Die Charakteristika können
empirisch ermittelt oder auf der Grundlage bekannter Informationen über das
Polypeptid, beispielsweise Sequenzinformationen, vorhergesagt werden.
-
Der
Begriff "Charakteristika,
die mit einem Polypeptid assoziiert sind", wie hierin verwendet, bezieht sich
auf eine physikalisch-chemische Eigenschaft eines Polypeptids und/oder
eines beliebigen Fragments des Polypeptids. Somit gehören zu Charakteristika,
die mit einem Polypeptid assoziiert sind, bestimmte Charakteristika
eines parentalen Polypeptids sowie Charakteristika eines Fragments
des parentalen Polypeptids, die als Charakteristika, die mit dem
parentalen Polypeptid assoziiert sind, gelten, da das Fragment mit
dem Polypeptid in Verbindung gebracht werden kann. Derartige Charakteristika
können
zur Identifizierung eines Polypeptids verwendet werden, beispielsweise
anhand eines Vergleichs mit einem Polypeptididentifizierungsindex.
-
Der
Begriff "Polypeptid", wie hierin verwendet,
bezieht sich auf ein Peptid oder Polypeptid aus zwei oder mehr Aminosäuren. Ein
Polypeptid kann auch mittels natürlich
auftretender Modifizierungen, wie posttranslationaler Modifizierungen,
einschließlich
Phosphorylierung, Lipidbeladung, Prenylierung, Sulfatierung, Hydroxylierung,
Acetylierung, Zugabe von Kohlenhydraten, Zugabe von prosthetischen
Gruppen oder Cofaktoren, Bildung von Disulfidbindungen, Proteolyse,
Zusammensetzen zu makromolekularen Komplexen und dergleichen, modifiziert
werden.
-
Eine
Modifikation eines Polypeptids, insbesondere Ligandenpolypeptide,
kann nicht natürlich
vorkommende Derivate, Analoge und funktionelle Mimetika davon umfassen,
die mittels chemischer Synthese erzeugt wurden, mit der Maßgabe, dass
eine derartige Polypeptidmodifikation eine ähnliche funktionelle Aktivität wie das
parentale Polypeptid zeigt. Zu Derivaten können beispielsweise chemische
Modifizierungen des Polypeptids, wie Alkylierung, Acylierung, Carbamylierung,
Iodierung oder jede beliebige Modifizierung gehören, die das Polypeptid derivatisiert.
Zu derartigen derivatisierten Molekülen gehören beispielsweise diejenigen
Moleküle, in
denen freie Aminogruppen unter Ausbildung von Aminhydrochloriden,
p-Toluolsulfonylgruppen, Carbobenzoxygruppen, t-Butyloxycarbonylgruppen,
Chloracetylgruppen oder Formylgruppen derivatisiert wurden. Freie Carboxylgruppen
können
unter Ausbildung von Salzen, Methyl- und Ethylestern oder anderen
Arten von Estern oder Hydraziden derivatisiert werden. Freie Hydroxylgruppen
können
unter Ausbildung von O-Acyl- oder O-Alkylderivaten
derivatisiert werden. Der Imidazol-Stickstoff von Histidin kann
unter Ausbildung von N-Im-Benzylhistidin derivatisiert werden. Zu
Derivaten oder Analogen gehören
auch diejenigen Polypeptide, die ein oder mehrere natürlich vorkommende
Aminosäurederivate
der zwanzig üblichen
Aminosäuren,
beispielsweise 4-Hydroxyprolin, 5-Hydroxylysin, 3-Methylhistidin, Homoserin,
Ornithin oder Carboxyglutamat, enthalten und die Aminosäuren enthalten
können,
die nicht über
Peptidbindungen verbunden sind.
-
Ein
besonders nützliches
Polypeptidderivat umfasst eine Modifizierung von Sulfhydrylgruppen,
beispielsweise die Modifizierung von Sulfhydrylgruppen, Affinitätsreagenzien,
wie einem ICATTM-artiges Reagenz, zu binden.
Eine besonders nützliche
Modifizierung eines Polypeptids umfasst eine Modifizierung von Polypeptiden
in einer Probe mit einer Einheit mit einem stabilen Isotop. Beispielsweise
können
zwei verschiedene Polypeptidproben getrennt mit Einheiten markiert
werden, die unterschiedliche Isotope aufweisen, und derart unterschiedlich
markierte Proben können
verglichen werden. Die Modifizierung von Polypeptiden mit stabilen
Isotopen ist für
die Quantifizierung der relativen Menge einzelner Polypeptide in
einer Probe besonders nützlich.
-
Ein "Fragment", wie hier verwendet,
bezieht sich auf eine verkürzte
Form, entweder am Carboxy-Terminus, Amino-Terminus oder beiden,
eines parentalen Polypeptids. Demzufolge gilt die Deletion einer
einzigen Aminosäure
am Carboxy-Terminus oder Amino-Terminus
als Fragment eines parentalen Polypeptids. Ein Fragment bezieht
sich im Allgemeinen auf eine Deletion von Aminosäuren am N- und/oder C-Terminus,
umfasst aber auch Modifizierungen, bei denen eine Seitenkette entfernt
wurde, die Peptidbindung jedoch erhalten bleibt. Ein Fragment umfasst
ein gekürztes
Polypeptid, das beispielsweise durch Spaltung des Polypeptids unter
Verwendung eines chemischen Reagenz, eines Enzyms oder Energiezufuhr
gebildet wird. Ein Fragment kann das Ergebnis eines sequenzspezifischen
oder sequenzunabhängigen
Spaltereignisses sein. Zu Beispielen für Reagenzien, die üblicherweise
zum Spalten von Polypeptiden verwendet werden, gehören Enzyme, beispielsweise
Proteasen, wie Thrombin, Trypsin, Chymotrypsin und dergleichen,
und Chemikalien, wie Cyanogenbromid, Säuren, Basen und o-Iodbenzoesäure, wie
hier offenbart. Ein Fragment kann auch mittels eines Massenspektrometrieverfahrens
erzeugt werden. Ferner kann ein Fragment auch das Ergebnis mehrerer Spaltereignisse
sein, sodass ein gekürztes
Polypeptid, das aus einem Spaltereignis hervorgeht, durch zusätzliche
Spaltereignisse weiter gekürzt
wird.
-
Der
Begriff "Polypeptididentifizierungsindex", wie hier verwendet,
bezieht sich auf eine Zusammenstellung von Charakteristika, die
mit einem Polypeptid assoziiert sind, die zur Identifizierung und
Unterscheidung von anderen Polypeptiden im Index ausreicht. Ein
Polypeptididentifizierungsindex ist somit eine Zusammenstellung
von Polypeptididentifikationscodes zur Identifizierung eines Polypeptids
auf der Grundlage der Charakteristika des Polypeptids oder eines
Fragments davon. Ein Polypeptididentifizierungsindex kann auf hergeleiteten
Charakteristika, die mit einem Polypeptid assoziiert sind, basieren,
beispielsweise Charakteristika, die aufgrund der Sequenzinformationen,
wie der Genomsequenz, cDNA-Sequenz oder EST-Datenbanken vorhergesagt
wurden. Ein Polypeptididentifizierungsindex kann auch auf empirisch
bestimmten Charakteristika oder einer Kombination aus hergeleiteten
und empirisch bestimmten Charakteristika basieren. Ein "annotierter Polypeptidindex
(AP)" bezieht sich
auf einen Polypeptididentifizierungsindex, der für jedes der Polypeptide im
Index mindestens ein empirisch bestimmtes Charakteristikum umfasst,
welches beispielsweise mittels der hier offenbarten Verfahren bestimmt
werden kann. Falls erwünscht,
kann ein AP-Index
vollständig
auf empirisch bestimmten Charakteristika oder auf einer Kombination
aus hergeleiteten und empirisch bestimmten Charakteristika basieren.
Die Verwendung eines annotierten Polypeptidindex ist besonders zur
Identifizierung von Polypeptiden nützlich, die mittels posttranslationaler
Modifikationen modifiziert wurden, die Charakteristika aufweisen
können,
welche unvorhersehbar ausschließlich
auf einer Herleitung aus einer Sequenzdatenbank basieren.
-
Ein "Polypeptididentifizierungssubindex" bezieht sich auf
eine Untergruppe eines Polypeptididentifizierungsindex, die weniger
als alle Polypeptididentifikationscodes des Polypeptididentifizierungsindex
enthält.
Ein Subindex kann beispielsweise fünf Polypeptididentifikationscodes
eines Polypeptididentifizierungsindex mit zehn Polypeptididentifikationscodes
enthalten, der eine Untergruppe des gesamten Index ist. Die Identifizierung
eines Subindex kann beispielsweise beim Reduzieren der Komplexität einer
Suche in einem Polypeptididentifizierungsindex nützlich sein, was der Reduzierung
der Komplexität ähnlich ist,
die bei einer Polypeptidprobe mittels der hier offenbarten Fraktionierverfahren
erreicht wird. Demzufolge kann die Suche in einem Subindex vorteilhaft
weniger Rechenzeit erfordern, als für die Suche des gesamten Index
erforderlich ist.
-
Der
Begriff "Identifikationscode", wie hier verwendet,
bezieht sich auf eine Gruppe von Charakteristika, die mit einem
Polypeptid assoziiert sind, die zur Bestimmung der Identität des Polypeptids
und zur Unterscheidung des Polypeptids von anderen Polypeptiden
in einem Polypeptididentifizierungsindex ausreicht. Ein Identifikationscode
ist im Wesentlichen ein annotiertes Peptidtag oder ein "Strichcode", der zur Identifizierung
eines Polypeptids verwendet werden kann.
-
Die
bevorzugte Ausführungsform
bezieht sich auf ein Verfahren zur Identifizierung eines Polypeptids. Das
Verfahren umfasst die Schritte des Bestimmens zweier oder mehrerer
Charakteristika, die mit einem Polypeptid oder einem Fragment davon
assoziiert sind, wobei eines der Charakteristika die Masse eines
Fragments des Polypeptids ist, wobei die Fragmentmasse mithilfe
der Massenspektrometrie bestimmt wird; Vergleichens der Charakteristika,
die mit dem Polypeptid assoziiert sind, mit einem Polypeptididentifizierungsindex,
wie einem annotierten Polypeptidindex, und Identifizierens eines
oder mehrerer Polypeptide in dem Polypeptididentifizierungsindex
mit den bestimmten Charakteristika. Das Fragment kann mit einer
Genauigkeit in ppm von mehr als 1 Teil je Million (ppm) oder mit
einer noch geringeren Genauigkeit (höherem ppm) bestimmt werden.
Das Verfahren umfasst ferner das Bestimmen eines oder mehrerer zusätzlicher
Charakteristika, die mit dem Polypeptid assoziiert sind, und Vergleichen
der in jedem der Schritte bestimmten Charakteristika mit dem Polypeptididentifizierungsindex.
Wahlweise können
die Schritte des Bestimmens eines oder mehrerer zusätzlicher
Charakteristika, die mit dem Polypeptid assoziiert sind, und des
Vergleichens der in jedem der Schritte bestimmten Charakteristika
mit dem Polypeptididentifizierungsindex einmal oder mehrmals wiederholt
werden, wobei eine Gruppe von Charakteristika bestimmt wird, die
ein einzelnes Polypeptid im Polypeptididentifizierungsindex identifiziert.
Das vorstehende Verfahren sowie andere Verfahren können weiter
die Quantifizierung der Menge an Polypeptid in einer Probe umfassen.
Darüber
hinaus können
die Verfahren zum Messen der relativen Häufigkeit in zwei oder mehr
unterschiedlichen Populationen von Polypeptiden, das heißt Polypeptidmischungen,
verwendet werden, beispielsweise Populationen von Polypeptiden in
unterschiedlichen Proben.
-
Die
Verfahren der bevorzugten Ausführungsform
zur Identifizierung eines Polypeptids umfassen die Bestimmung von
Charakteristika, die mit dem Polypeptid oder einem Fragment des
Polypeptids assoziiert sind. Charakteristika, die mit einem Polypeptid
assoziiert sind und die zur Identifizierung eines Polypeptids nützlich sind,
sind solche Charakteristika, die sich wiederholfähig bestimmen lassen. Zu physikalisch-chemischen Eigenschaften
eines Polypeptids oder Fragments gehören beispielsweise die Atommasse,
die Aminosäurezusammensetzung,
die partielle Aminosäuresequenz,
das scheinbare Molekulargewicht, der pI-Wert und die Reihenfolge
der Elution an einem spezifischen chromatographischen Medium unter
bestimmten Bedingungen. Derartige Charakteristika, deren Assoziation
mit einem Polypeptid bestimmt wurde, werden zur Identifizierung
des Polypeptids verwendet. Verfahren zur Bestimmung von Charakteristika,
die mit einem Polypeptid assoziiert sind, sind nachstehend ausführlicher
beschrieben.
-
Eines
der Charakteristika, das in Verfahren der bevorzugten Ausführungsform
besonders nützlich
ist, ist die Masse eines Polypeptids oder eines Fragments oder mehrerer
Fragmente davon. Ein Fragment eines Polypeptids kann vor oder während des
Vorgangs der Massenbestimmung mittels Massenspektrometrie erzeugt
werden. Die Masse eines Polypeptidfragments kann somit die Masse
eines Fragments eines Polypeptids, das während der Vorbereitung der
Polypeptidprobe erzeugt wurde, oder die Masse eines Fragments sein, das
durch eine Polypeptidspaltung erzeugt wurde, welche während der
Massenspektrometrie auftrat.
-
Die
Masse eines Polypeptidfragments wird mittels Massenspektrometrie
bestimmt und kann vorteilhaft in Abwesenheit von Ionenselektion
zur Herstellung von Fragment-Ionen bestimmt werden. Die Verfahren
ermöglichen
die Identifizierung eines Polypeptids, ohne dass eine Sequenzanalyse
des Polypeptids oder des Fragments davon erforderlich ist. Die Masse
eines Polypeptidfragments kann unter Verwendung einer Vielfalt von
im Fachgebiet bekannten Verfahren für die Massenspektrometrie,
die hier beschrieben sind, bestimmt werden.
-
In
den Verfahren zur Identifizierung eines Polypeptids können eine
Vielfalt von Massenspektrometrie-Systemen verwendet werden. Zu Massenanalysatoren
mit hoher Massengenauigkeit, hoher Empfindlichkeit und hoher Auflösung gehören, ohne
darauf beschränkt
zu sein, matrixgestützte
dynamische Laser-Desorptionsmassenspektrometer
(MALDI-TOF), ESI-TOF-Massenspektrometer
und Fourier-Transformations-Ionenzyklotron-Massenanalysatoren
(FT-ICR-MS). Zu weiteren MS-Verfahren gehören Elektrosprayvorgänge mit
MS und Ionenfalle. Bei der Ionenfalle-MS werden Fragmente mittels
Elektrospray oder MALDI ionisiert und dann in eine Ionenfalle überführt. Gefangene
Ionen können
dann getrennt und nach selektiver Freisetzung aus der Ionenfalle
mittels MS analysiert werden. In der Ionenfalle können auch
Fragmente erzeugt und analysiert werden. Die mit einem ICATTM-artigen Reagenz markierten Polypeptide,
die in den erfindungsgemäßen Verfahren
zur Anwendung kommen können,
können
beispielsweise mithilfe einer einstufigen Massenspektrometrie mit
einem MALDI-TOF-
oder ESI-TOF-System analysiert werden. Massenspektrometrieverfahren
für Proteomikanwendungen
sind beschrieben (siehe Aebersold und Goodlett, Chem. Rev. 101:
269–295
(2001)). Falls erwünscht,
können
MS-Verfahren beispielsweise,
wie hier beschrieben, unter Verwendung von ICATTM- oder
IDEnT-artigen Reagenzien modifiziert werden, um die Erfassung von
Peptiden mit Affinitätstags
zu ermöglichen.
-
Falls
erwünscht,
können
zur Erzeugung eines Polypeptididentifizierungsindex andere MS-Analysen als
zur Bestimmung von Charakteristika eines unbekannten Polypeptids
verwendet werden. Beispielsweise kann zum Sammeln von Daten für den Identifizierungsindex
LC-MS/MS und zur
Ermittlung von Charakteristika eines unbekannten Polypeptids LC-ESI
TOF verwendet werden. Es ist offensichtlich, dass jedes beliebige MS-Verfahren
und jede beliebige Kombination aus MS-Verfahren verwendet werden
kann, solange die Proben auf im Wesentlichen gleiche Weise behandelt
werden und solange die MS-Verfahren für den Vergleich der mittels
der verschiedenen Verfahren bestimmten Massen kompatibel sind.
-
Die
Verfahren der bevorzugten Ausführungsform
können
einen Schritt der Polypeptidtrennung im Anschluss an einen Schritt
der Massenanalyse beinhalten. Die Schritte der Polypeptidtrennung
und Massenanalyse können
unabhängig
voneinander durchgeführt
werden oder in einem "online"-Analyseverfahren
gekoppelt sein.
-
Verschiedene
Arten von Techniken zur Polypeptidtrennung können an einen Massenanalysator
gekoppelt sein. Polypeptide können
beispielsweise mithilfe von Chromatographie unter Verwendung von
Mikrokapillar-HPLC,
mithilfe von Festphasenextraktion-Kapillarelektrophorese-Systemen, die
an einen Massenanalysator gekoppelt sein können, oder mithilfe von Gelelektrophoreseverfahren
getrennt werden. Ein spezifisches Beispiel für ein gekoppeltes Verfahren
zur Polypeptidtrennung und Massenanalyse ist die Mikrokapillar-HPLC,
die an ein ESI-MS/MS-System gekoppelt ist, das unter dynamischem
Ausschluss mit einer Ionenfalle-MS verwendet wird.
-
Für die verschiedenen
Anwendungen der Verfahren der bevorzugten Ausführungsform können verschiedene
Arten der Massenspektrometrie verwendet werden. Für bestimmte
Anwendungen, wie der Massenbestimmung eines Polypeptidfragments
zur Erzeugung eines Polypeptididentifizierungsindex, ein Verfahren, das
eine hohe Genauigkeit vorsieht, wie eine Genauigkeit von weniger
als 1 Teil je Million. Die Verfahren sind jedoch dahingehend vorteilhaft,
dass zweckmäßig MS mit
geringer Genauigkeit, das heißt
hoher ppm Auflösung,
verwendet werden kann, ohne dass dies teurerer Instrumente, die
für Bestimmungen
mit höherer
Genauigkeit erforderlich sind, bedarf. Bei Anwendungen, die die
Analyse einer Population von Polypeptiden mit hohem Durchsatz beinhalten,
kann eine Massenbestimmung mit geringerer Genauigkeit ausreichend
sein. Massenbestimmungen mit geringerer Genauigkeit ergeben im Allgemeinen
einen höheren
Probendurchsatz, da der Zeitaufwand für eine Massenbestimmung geringer
ist.
-
Die
Verfahren der bevorzugten Ausführungsform,
die Massenbestimmungen beinhalten, sind zweckmäßig mit geringerer Genauigkeit
durchführbar.
Instrumente mit hoher Massengenauigkeit, wie FTMS oder FTICR MS
können
beispielsweise zur Bestimmung der Genauigkeit bei 0,2 ppm verwendet
werden (Goodlett et al., Anal. Chem. 72: 1112–1118 (2000); Masselon et al.,
Anal. Chem. 72: 1918–1924
(2000)). Die Verwendung einer sehr hohen Massengenauigkeit, wie
0,1 ppm, dient als Beschränkung.
Die Verfahren der bevorzugten Ausführungsform weisen jedoch den
Vorteil auf, dass mehrere Charakteristika, die mit einem Polypeptid assoziiert
sind, bestimmt werden können.
In Kombination mit zusätzlichen
Charakteristika können
die Massen mit einer geringeren Genauigkeit, das heißt höherem ppm,
bestimmt werden. Die Bestimmung einer Masse mit geringerer Genauigkeit
ermöglicht
die Verwendung weniger teurer MS-Instrumente,
die weiter verbreitet sind als FTMS. Die Massenbestimmungen können mit
einer Genauigkeit in ppm von 1 Teil je Million (ppm) oder mehr als
1 ppm bestimmt werden und können
mit einer Genauigkeit in ppm von 2,5 ppm oder mehr, von etwa 5 ppm
oder mehr, etwa 10 ppm oder mehr, etwa 50 ppm oder mehr, etwa 100
ppm oder mehr, etwa 200 ppm oder mehr, etwa 500 ppm oder mehr oder
sogar etwa 1000 ppm oder mehr bestimmt werden, die jeweils sequenziell
eine geringere Genauigkeit des MS-Instruments verlangen. Die Verfahren
ermöglichen,
wie hier offenbart, vorteilhaft die Verwendung einer MS-Analyse
mit geringer Genauigkeit in Kombination mit anderen physikalisch-chemischen
Charakteristika zur Identifizierung eines Polypeptids in einer Probe.
Die Genauigkeit der MS-Messungen für eine bestimmte Anwendung
kann von einem Fachmann problemlos und beispielsweise in Abhängigkeit
von der Komplexität
der Probe und/oder dem zu verwendenden Index bestimmt werden.
-
Die
Verfahren zur Identifizierung eines Polypeptids können die
Bestimmung der Masse eines Polypeptidfragments mit einer Genauigkeit
von mehr als 1 Teil je Million beinhalten. Aus diesem Grund verlangt
das Verfahren kein MS-Verfahren mit hoher Genauigkeit. Demzufolge
kann in den Verfahren zur Identifizierung eines Polypeptids ein
preiswertes MS-System verwendet werden. Die Anpassung eines Massenspektrometers an
ein Format mit hohem Durchsatz, wie ein Format mit 96-Well-Platte oder 384-Tüpfelplatte,
oder an ein Autoinjektionssystem, das einen unbeaufsichtigten Betrieb
ermöglicht,
ist zur Erhöhung
des Probendurchsatzes vorteilhaft.
-
In
Verfahren der bevorzugten Ausführungsform
kann die Masse eines Polypeptids oder eines Fragments davon in der
Abwesenheit von Ionenselektion zur Herstellung von Fragment-Ionen
bestimmt werden. 1 zeigt einen Überblick über die
Strategie eines Verfahrens zur Proteinidentifizierung. Polypeptide
werden wahlweise beispielsweise unter Verwendung von Polyacrylamid-Gelelektrophorese
fraktioniert und die Polypeptide können weiter in Peptide fragmentiert
werden. Die Peptide können
darüber
hinaus wahlweise mittels Chromatographie fraktioniert werden. Eine
Chromatographiefraktion, oder ein Speicher (in 1 mit "*" gekennzeichnet), wird MS unterworfen.
Traditionell wird ein Ion oder werden dominante Ionen in einer Kollisionszelle
für eine
kollisionsinduzierte Dissoziation (CID) selektiert. In Q1 in 1 ist
die Selektion eines einzigen Ions dargestellt. Wie in Q3 in 1 dargestellt,
wird ein Ion selektiert und anschließend fragmentiert. In Abwesenheit
von Ionenselektion wird anstatt der Selektion eines einzigen Ions
keine Ionenselektion angewendet, sondern stattdessen werden alle
Ionen fragmentiert, was zu vielen Peptidfragmenten führt. Die
Peptidfragmente werden dekonvoliert, um zu bestimmen, welches einem
bestimmten parentalen Polypeptid entspricht, und derartige Daten über die
Masse eines Fragments eines Polypeptids stellen ein Charakteristikum
dar, das mit dem Polypeptid assoziiert ist (siehe 4).
Wie unten in 1 dargestellt, können die
Fragmentmassen mit einer beliebigen Anzahl von zusätzlichen
Charakteristika kombiniert und mit einem Polypeptididentifizierungsindex,
beispielsweise einer Sequenzdatenbank oder einem annotierten Polypeptidindex,
verglichen werden und das Polypeptid wird auf der Grundlage dieser
bestimmten Charakteristika identifiziert.
-
Eine
Gruppe von bestimmten Charakteristika, die mit einem Polypeptid
assoziiert sind, werden mit den Charakteristika, die mit einem Polypeptid
in einem Polypeptididentifizierungsindex assoziiert sind, verglichen. Ein
Polypeptididentifizierungsindex ist eine Zusammenstellung von Charakteristika,
die mit einzelnen Polypeptiden assoziiert sind, zur Identifizierung
und Unterscheidung der Polypeptide von anderen im Index annotierten Polypeptiden.
Anhand eines Vergleichs der Gruppe von bestimmten Charakteristika,
die mit einem Polypeptid assoziiert sind, mit einem Polypeptididentifizierungsindex
können
ein oder mehrere Polypeptide im Polypeptididentifizierungsindex
mit denselben Charakteristika identifiziert werden. Wenn festgestellt
wird, dass mehr als ein Polypeptid dieselben Charakteristika aufweist,
können
weitere Beschränkungen
auferlegt werden, beispielsweise die Bestimmung eines oder mehrerer
zusätzlicher
Charakteristika. Ein Polypeptididentifizierungsindex kann auf hergeleiteten
Charakteristika eines Polypeptids basieren, beispielsweise einem
oder mehreren Charakteristika, die aus Gensequenzdatenbanken hergeleitet
sind, oder kann empirisch bestimmt werden, wie mit dem hier beschriebenen
annotierten Peptidtagindex.
-
Ein
beispielhaftes Verfahren zur Erzeugung eines annotierten Peptidindex
sieht wie folgt aus: Ernten von Proteinen; Markieren der Proteine
mit einem Isotope coded Affinity Tag-artigen (ICATTM)
Reagenz; Fraktionieren der Proteine über das Molekulargewicht; Spalten
der Proteine zu Peptiden (z. B. unter Verwendung von Trypsin); Trennen
der Peptide mittels Ionenaustausch; Reinigen jeder Ionenaustauschfraktion mittels
Affinitätschromatographie;
Analyse jeder Affinitätschromatographiefraktion
mittels LC/MS/MS (oder CE/MS/MS); Identifizieren aller exprimierten
Proteine mittels einer Datenbankabfrage der einzelnen MS/MS-Peptidspektren;
Erzeugen einer Datenbank mit annotierten Peptidtags, die einen eindeutigen
Strichcode eines individuellen Peptids basierend auf gemessenen
physikalisch-chemischen Eigenschaften und somit des parentalen Proteins
des Peptids darstellen. Es ist offensichtlich, dass das vorstehend
beschriebene Verfahren, Kombinationen dieser Schritte, Modifikationen
davon oder jedes andere Verfahren, das geeignet ist, die Bestimmung
von Charakteristika, die mit einem Polypeptid assoziiert sind, zu
ermöglichen,
verwendet werden kann, um einen Polypeptididentifizierungsindex
zu erzeugen, der, wie hier beschrieben, mindestens ein empirisch
bestimmtes Charakteristikum umfasst.
-
Die
Verfahren können
ferner die Bestimmung eines oder mehrerer zusätzlicher Charakteristika, die
mit dem Polypeptid assoziiert sind, zum Vergleich mit einem Polypeptididentifizierungsindex
umfassen. Das Verfahren zur Bestimmung eines oder mehrerer zusätzlicher
Charakteristika, die mit dem Polypeptid assoziiert sind, mit anschließendem Vergleich
mit einem Polypeptididentifizierungsindex kann wiederholt werden,
bis ein einziges Polypeptid eindeutig im Polypeptididentifizierungsindex
identifiziert ist. Demzufolge können,
sofern zusätzliche
Beschränkungen
anzuwenden sind, diese die Identifizierung eines Polypeptids durch
Vergleich mit einem Polypeptididentifizierungsindex umfassen (siehe 4C).
-
Die
Anzahl an Charakteristika, die zur Identifizierung eines Polypeptids
ausreicht, kann von einem Fachmann problemlos anhand eines Vergleichs
der Gruppe von bestimmten Charakteristika mit dem Polypeptididentifizierungsindex
festgelegt werden. Die Identifizierung eines einzigen. Polypeptids
in einem Polypeptididentifizierungsindex bezieht sich auf die Bestimmung
einer Gruppe von Charakteristika, die zur Unterscheidung des Polypeptids
von anderen Polypeptiden in einem Polypeptididentifizierungsindex
ausreicht. Wenn beispielsweise zwei bestimmte Charakteristika auf
ein einziges Polypeptid in einem Polypeptididentifizierungsindex
zutreffen, dann reichen diese beiden Charakteristika zur Identifizierung
des Polypeptids aus. Analog können
für ein
anderes Polypeptid drei bestimmte Charakteristika für eine eindeutige
Identifizierung des Polypeptids im Index erforderlich sein. Demgemäß wird ein
Vergleich mit einem Polypeptididentifizierungsindex auf der Grundlage
der für
ein Polypeptid bestimmten Charakteristika angestellt. Wenn ein einziges
Polypeptid identifiziert ist, wurde eine ausreichende Anzahl an
Charakteristika bestimmt. Wenn mehr als ein Polypeptid identifiziert
wurde, können
ein oder mehrere Charakteristika bestimmt werden, bis ein einziges
Polypeptid eindeutig den bestimmten Charakteristika entspricht und
somit eine Identifizierung des Polypeptids ermöglicht. Somit kann ein Fachmann
problemlos bestimmen, ob auf der Grundlage eines Vergleichs mit
einem bestimmten Polypeptididentifizierungsindex eine ausreichende
Anzahl an Charakteristika für
ein Polypeptid bestimmt wurde, um eine Identifizierung eines eindeutigen
Polypeptids des Polypeptididentifizierungsindex zu ermöglichen.
-
Die
Verfahren basieren vorteilhaft auf dem Einschluss ausgewählter Beschränkungen,
die eine wirksamere Identifizierung eines Polypeptids ermöglichen,
insbesondere in komplexen Proben, die zahlreiche unterschiedliche
Polypeptide enthalten. Die Verfahren können auch vorteilhaft zur Identifizierung
mehrerer Polypeptide simultan in einer komplexen Probe eingesetzt
werden. Demzufolge können
die Verfahren, anstatt eine große
Anzahl an Charakteristika zu bestimmen, die mit verschiedenen Polypeptiden
assoziiert sind, falls erwünscht,
auf iterative Weise unter Einschluss zusätzlicher Beschränkungen
nach Bedarf zur Identifizierung eines einzigen Polypeptids in einem
Polypeptididentifizierungsindex durchgeführt werden.
-
Homologe
Polypeptide haben beispielsweise im Allgemeinen Segmente mit hoher
Sequenzidentität. Derartige
Polypeptide können
beispielsweise von Polypeptiden mit ähnlicher Funktion, von Spleißvarianten derselben
Nukleinsäure
und dergleichen abstammen. Polypeptide mit Segmenten mit hoher Sequenzidentität können mehrere
physikalisch-chemische Charakteristika gemeinsam haben, insbesondere
in Verbindung mit homologen Fragmenten des Polypeptids. Polypeptide,
die hohe Ähnlichkeit
aufweisen, können
somit eine ähnliche
oder identische Gruppe von assoziierten Charakteristika aufweisen.
Bei derartigen ähnlichen
Polypeptiden kann eine vorgegebene Gruppe von Charakteristika, die
zur Unterscheidung zweier nicht ähnlicher
Polypeptide ausreicht, zur Identifizierung eines einzigen Polypeptids
in einem Polypeptididentifizierungsindex unzureichend sein, wenn
die Polypeptide ähnliche
Regionen aufweisen. In einem solchen Fall können ein oder mehrere zusätzliche
Charakteristika, die mit dem Polypeptid assoziiert sind, bestimmt
werden und die Bestimmung zusätzlicher
Charakteristika kann wiederholt werden, bis das fragliche Polypeptid
von anderen Polypeptiden in einem Polypeptididentifizierungsindex
unterschieden werden kann. Die Verfahren des Bestimmens einer Gruppe
von Charakteristika, die mit einem Polypeptid assoziiert sind, des
Vergleichens mit einem Polypeptididentifizierungsindex und des Bestimmens
eines oder mehrerer zusätzlicher
Charakteristika, bis ein einziges Polypeptid in einem Polypeptididentifizierungsindex
identifiziert ist, kann auf ein oder mehrere Polypeptide angewendet
werden.
-
Somit
können
zusätzliche
Beschränkungen
nach Bedarf zur Identifizierung eines einzigen Polypeptids erwogen
werden. Wenn beispielsweise mehr als ein Polypeptid in einem Polypeptididentifizierungsindex
eine vorgegebene Gruppe von Charakteristika aufweist, dient die
Identifizierung ausgewählter
Polypeptide des Polypeptididentifizierungsindex, das heißt einer
Untergruppe von Polypeptiden im Index oder eines Subindex des Index,
im Wesentlichen als Beschränkung.
Demzufolge kann ein anschließender
Vergleich mit dem Polypeptididentifizierungsindex mit dem Subindex
erfolgen, wodurch die Rechenzeit herabgesetzt wird und, falls erwünscht, ein
wirksamerer Vergleich bereitgestellt wird. Anschließend kann
eine zusätzliche
Beschränkung, beispielsweise
ein zusätzliches
Charakteristikum, erwogen und mit dem Subindex verglichen werden,
was zu einer Reduzierung der Anzahl an Polypeptiden führt, die
alle die bestimmten Charakteristika aufweisen. Derartige Schritte
können
wahlweise wiederholt werden, bis ein einziges Polypeptid in dem
Polypeptididentifizierungsindex identifiziert ist. Ein derartiger
Ansatz ist bei der simultanen Bestimmung der Identität von mehreren Polypeptiden
vorteilhaft, da nur die Charakteristika bestimmt werden müssen die
zur Identifizierung eines Polypeptids ausreichen. Die Verfahren
können
somit problemlos die Bestimmung der Identität einer Vielfalt von Polypeptiden
und die Komplexitäten,
die mit der Proteomikanalyse assoziiert sind, umfassen, ohne Ressourcen
für unnötige Datenerfassungen
zu verbrauchen.
-
Die
Verfahren zur Erzeugung eines Polypeptididentifizierungsindex beinhalten
die Bestimmung einer Gruppe von Charakteristika für zwei oder
mehrere Polypeptide, die zur Identifizierung des Polypeptids genutzt werden
kann. Eine Gruppe von Charakteristika, die ein Polypeptid in einem
Polypeptididentifizierungsindex eindeutig identifiziert, legt einen
Polypeptididentifikationscode oder "Strichcode" des Polypeptids fest. Ein Polypeptididentifizierungsindex
kann eine Vielfalt von Charakteristika aufweisen, die mit einem
indexierten Polypeptid assoziiert sind. Zu Polypeptidcharakteristika,
die in einem Polypeptididentifizierungsindex enthalten sind, gehören die
Polypeptidmasse, die Aminosäurezusammensetzung,
die partielle Aminosäurezusammensetzung,
beispielsweise die Gegenwart einer bestimmten die Aminosäuren, der
pI-Wert, die Reihenfolge
der Elution an einem spezifischen chromatographischen Medium und
eine Masse eines oder mehrerer Polypeptidfragmente. Ein Polypeptididentifizierungsindex
kann darüber
hinaus die Aminosäuresequenz,
Verweise auf verwandte Polypeptide, Datenbankeinträge oder
Literatur sowie andere Daten umfassen, die zur Identifizierung eines
Polypeptids relevant sind. Der Anwender weiß, welche Arten von Informationen
für einen
Polypeptidindex nützlich
sind und kann jede physikalisch-chemische Eigenschaft oder Information
mit Bezug zu dem Polypeptid einschließen. Ein Polypeptididentifizierungsindex,
der eine große
Anzahl an Identifikationscodes für eine
Vielfalt von Polypeptiden umfasst, ist zur Identifizierung von Polypeptiden
in komplexen Proben besonders nützlich.
-
Die
Verfahren zur Identifizierung eines Polypeptids basieren auf einem
Vergleich von Charakteristika, die für ein Polypeptid bestimmt wurden,
mit einem Polypeptididentifizierungsindex. Ein Polypeptididentifizierungsindex
kann eine im Handel oder öffentlich
erhältliche
Datenbank sein, wie (www.ncbi.nlm.nih.gov/GenBank), in der ein oder
mehrere Charakteristika eines Polypeptids, beispielsweise die Aminosäurezusammensetzung,
die Masse eines Polypeptids oder eines Fragments davon und dergleichen, vorhergesagt
sind. Außerdem
kann ein Polypeptididentifizierungsindex auf empirisch bestimmten
Charakteristika basieren, die mittels der hier beschriebenen Verfahren
bestimmt wurden. Ein Polypeptididentifizierungsindex kann beispielsweise
empirisch bestimmt sein oder eine Kombination aus vorhergesagten
und empirisch bestimmten Charakteristika darstellen, wie beispielsweise
der hier offenbarte annotierte Polypeptidindex (AP), der auch als
annotierter Peptidtagindex (APT) bezeichnet wird.
-
Eine
Gruppe von empirisch bestimmten Charakteristika, die mit einem Polypeptid
assoziiert sind, kann experimentell unter Verwendung einer Vielfalt
von Verfahren bestimmt werden. Ein beispielhaftes Verfahren für die Polypeptididentifizierung
und/oder Bestimmung von Charakteristika zur Erzeugung eines Polypeptididentifizierungsindex
ist in 1 dargestellt und nachstehend
beschrieben. Das Verfahren ist zur Festlegung eines Polypeptididentifikationscodes
nützlich,
da das Verfahren eine Serie von Schritten beinhaltet, was die Bestimmung
von Charakteristika, die mit einem Polypeptid assoziiert sind, ermöglicht,
wobei der letzte Schritt eine Massenbestimmung eines Polypeptids
oder Fragments darstellt. Das Verfahren kann umfassen: (i) Vorbereitung
der Polypeptidprobe; (ii) Polypeptidmarkierung; (iii) wahlweise
Polypeptidfraktionierung; (iv) Polypeptidfragmentierung; (v) Trennung
der Polypeptidfragmente; (vi) Affinitätsisolierung der markierten
Polypeptidfragmente; (vii) hochauflösende Trennung der Polypeptidfragmente;
(viii) Datenbankabfrage und (ix) Erstellung des Polypeptididentifizierungsindex
(siehe Beispiel I).
-
Für die Vorbereitung
der Polypeptidprobe werden Polypeptidproben, mit denen eine quantitative
Proteomanalyse durchgeführt
werden soll, unter Verwendung von Standardprotokollen zur Erhaltung
der Solubilität
der Polypeptide von den jeweiligen Quellen isoliert. Polypeptidproben
und die Vorbereitung der Polypeptidprobe sind nachstehend ausführlicher
besprochen.
-
Für die Polypeptidmarkierung
können
die Polypeptide in der Probe denaturiert werden, wahlweise reduziert
werden und eine chemisch reaktive Gruppe der Polypeptide kann kovalent
mit einem chemischen Modifizierungsreagenz derivatisiert werden.
Eine beispielhafte Gruppe ist eine Sulfhydrylgruppe, die eine Seitenkette
eines reduzierten Cysteinrests darstellt, die mit einem Reagenz,
wie einem ICATTM-Reagenz (Gygi et al., Nature Biotechnol.
17: 994–999
(1999)) oder IDEnT-Reagenz (Goodlett et al., Anal. Chem. 72: 1112–1118 (2000))
derivatisiert werden kann. Zu weiteren nützlichen reaktiven Gruppen
gehören
Amino- oder Carboxylgruppen
von Polypeptiden oder spezifische posttranslationale Modifikationen,
einschließlich
Phosphat, Kohlenhydrat oder Lipid. Jede beliebige chemische Reaktion,
die für
eine chemische Gruppe im Polypeptid spezifisch ist, kann in diesem
Schritt angewendet werden. Das ICATTM-artige
Reagenz und IDEnT-Reagenzien
sowie Verfahren zur Verwendung sind nachstehend ausführlicher
beschrieben.
-
Für die fakultative
Polypeptidfraktionierung kann die Mischung aus markierten Polypeptiden
unter Verwendung jedes beliebigen Verfahrens zur Polypeptidtrennung
fraktioniert werden. Ein in erfindungsgemäßen Verfahren nützliches
Fraktionierverfahren ist wiederholfähig, erhält die Löslichkeit der Polypeptide und
hat eine hohe Proben- und Peakkapazität. Jede fakultative Fraktioniertechnik
kann zur Anreicherung von Proteinen, die mit geringer Häufigkeit
auftreten, und/oder zur Senkung der Komplexität der Mischung durchgeführt werden und
die relativen Mengen können
erhalten bleiben. Zu beispielhaften Fraktionierverfahren gehören beispielsweise
die Natriumdodecylsulfate-Polyacrylamid- Gelelektrophorese (SDS-PAGE), chromatographische
Verfahren, wie Größenausschluss,
Ionenaustausch, Hydrophobie und dergleichen, wie hier offenbart.
Verfahren zur Polypeptidfraktionierung sind nachstehend ausführlicher
beschrieben.
-
Für die Polypeptidfragmentierung
können
die Polypeptide in der Probenmischung oder, falls eine fakultative
Probenfraktionierung vorgenommen wurde, die in jeder Fraktion enthaltenen
Polypeptide einer sequenzspezifischen Spaltung, wie einer Spaltung
mittels Trypsin, unterworfen werden. Die Verwendung der sequenzspezifischen
Spaltung kann besonders nützlich
sein, da die Termini von Peptiden, die mittels eines sequenzspezifischen
Verfahren gespalten wurden, als eine Beschränkung dienen können. Es
ist jedoch offensichtlich, dass das zur Erzeugung von Fragmenten
verwendete Spaltverfahren, falls erwünscht, nicht sequenzspezifisch
zu sein braucht. Verfahren, die zur Spaltung von Polypeptiden auf
eine sequenzspezifische Weise nützlich
sind, sind nachstehend ausführlicher
beschrieben.
-
Für die Trennung
der Polypeptidfragmente kann die gebildete Mischung aus Polypeptidfragmenten wahlweise
einer Peptidtrennung der ersten Dimension unterworfen werden. In
diesem Schritt sind Trennverfahren mit einer hohen Probenkapazität, einer
mindestens mäßigen Auflösung und
hoch wiederholfähiger Trennmuster
nützlich.
Zu Beispielen für
Trennverfahren für
die erste Dimension gehören
Anionen- und Kationenaustauchchromatographie. Diese und andere chromatographische
Verfahren sind nachstehend ausführlicher
beschrieben. Obwohl die Trennung der Polypeptidfragmente wahlweise
durchgeführt
werden kann, können
die Verfahren vorteilhaft dazu eingesetzt werden, die Charakteristika
der Peptidfragmente in der "Menge" zu bestimmen, das
heißt,
diese Verfahren verlangen keine Reinigung der Peptidfragmente bis
zur Homogenität.
-
Für die Affinitätsisolierung
der markierten Polypeptidfragmente können die Polypeptidfragmente
mithilfe eines Affinitätsreagenz,
das an das Polypeptidtag bindet, von jeder chromatographischen Fraktion
isoliert werden. Polypeptidfragmente, die mit dem hier beispielhaft
genannten ICATTM-Reagenz markiert wurden,
können
beispielsweise unter Verwendung von Avidin- oder Streptavidin-Affinitätschromatographie
isoliert werden. Ein Beispiel für
ein nützliches
Affinitätsmedium
zur Isolierung von mit ICATTM markierten
Polypeptidfragmenten ist monomeres Avidin, das auf Polymerkügelchen
immobilisiert wurde. Wenn ICATTM-artige
Reagenzien verwendet werden, deren Affinitätstags von Biotin verschieden
sind, wird ein entsprechendes Affinitätsmedium verwendet, das das
Affinitätstag
bindet. Wie hier offenbart, kann die Trennung mittels Affinitätsisolierung
parallel durchgeführt
werden, beispielsweise unter Verwendung einer Mikrotiterplatte mit
Affinitätskügelchen
in den Wells der oberen Kammer, die eine Membran oder Fritte oder
eine andere Einrichtung enthält,
welche ein Durchdringen der Kügelchen
verhindert. Die Probe wird in die obere Kammer gegeben und mit den
Affinitätskügelchen
inkubiert, gewaschen, um nicht spezifische Bindungen und anschließend spezifische
Bindemittel zu entfernen, welche in eine zweite Mikrotiterplatte
mit undurchlässigem
Boden eluiert werden.
-
Für eine Trennung
der Polypeptidfragmente mit hoher Auflösung kann Flüssigkeitschromatographie-ESI-MS/MS
verwendet werden. Die Mischungen aus Polypeptidfragmenten, die aus
den Affinitätschromatographiesäulen eluiert
wurden, können
mittels automatisierter LC-MS/MS unter Verwendung von Kapillar-Umkehrphasenchromatographie
als Trennverfahren (Yates et al., Methods Mol. Biol. 112: 553–569 (1999)) und
datenabhängiger
CID mit dynamischem Ausschluss (Goodlett et al., supra, 2000) als
Massenspektrometrieverfahren individuell analysiert werden.
-
Für eine simultane
Analyse mit hohem Durchsatz aller Affinitätsfraktionen können die
hochauflösenden
Trennungen parallel durchgeführt
werden. Eine Vorrichtung hierfür
besteht aus parallelen Trennkapillarröhrchen, einschließlich, ohne
darauf beschränkt
zu sein, CE, SPE-CE, HPLC, die jeweils an einer piezoelektrischen
Pumpe oder einer anderen Vorrichtung enden, die zu einer schnellen
Probenaufgabe auf eine MALDI-MS-Probenplatte fähig ist. Jede piezoelektrische
Pumpe oder ähnliche
Vorrichtung ist zu einer schnellen Probenaufgabe im Stande, die
die Auflösung
aus der Trennung aufrecht erhält
und durch Ablegen der Probe auf einem eng begrenzten Punkt eine
erhöhte
MALDI-TOF-Empfindlichkeit bereitstellt. Das Eluat jeder Trennung
kann gleichzeitig auf einem MALDI-Target oder aber auch auf einer Mikrotiterplatte
abgelegt werden.
-
Für die Datenbankabfrage
werden die Sequenzen der Polypeptidfragmente, für die geeignete CID-Spektren
erhalten wurden, durch Abfragen einer Sequenzdatenbank der zu untersuchenden
Art bestimmt. Für
Abfragen einer Datenbank kann vorteilhaft ein Suchprogramm für Sequenzdatenbanken,
wie SEQUEST (Eng, J. et al., J. Am. Soc. Mass. Spectrom. 5: 976–989, (1994)),
oder ein Programm mit ähnlichen
Funktionen verwendet werden.
-
Für die Erstellung
des Polypeptididentifizierungsindex können die Sequenzen aller Peptide,
die mittels des vorstehend beschriebenen Verfahrens identifiziert
wurden, in eine Datenbank eingegeben und mit den Charakteristika,
die während
der vorstehend beschriebenen Schritte erzeugt wurden, als Attribute versehen werden.
Zu diesen Attributen können
beispielsweise die partielle Aminosäurezusammensetzung, die ungefähre Molekülmasse des
parentalen Polypeptids, die beispielsweise mittels des fakultativen
Fraktionierschritts bestimmt werden kann, die Reihenfolge der Elution
in einem ersten Chromatographieschritt, die Reihenfolge der Elutionszeit
in einem zweiten Chromatographieschritt und dergleichen, gehören.
-
Kollektiv
können
eine ausreichende Anzahl an Charakteristika bestimmt werden, mit
der jedes Polypeptidfragment in einem Polypeptididentifizierungsindex
unterschieden werden kann. Die Zusammenstellung von Charakteristika,
die ein Polypeptid eindeutig identifizieren, stellt einen "Strichcode" oder Polypeptididentifikationscode
dar. Anschließend
können
Charakteristika, die mit einem unbekannten Polypeptid assoziiert sind,
bestimmt und mit einem zuvor erzeugten Polypeptididentifizierungsindex
verglichen werden. Alternativ kann ein Polypeptididentifizierungsindex
zusammen mit dem unbekannten Polypeptid bestimmt werden. Die Sammlung
von Informationen zu Charakteristika, die mit einem Polypeptid assoziiert
sind, und die Zusammenstellung zu einem Index ist für die Minimierung
der Versuchsschritte, die zum Zeitpunkt der Probenanalyse erforderlich
sind, zweckmäßig. Aus
diesem Grund kann ein Polypeptididentifikationscode, der für ein Fragment eines
Polypeptids bestimmt wurde, welches in einem anschließenden Versuch
erzeugt wird, zur Identifizierung eines Polypeptids in einer Probe
verwendet werden, indem der Polypeptididentifikationscode, der für ein unbekanntes
Polypeptid neu erzeugt wurde, zur Identifizierung des unbekannten
Polypeptids mit dem Polypeptididentifizierungsindex korreliert wird.
-
Für die Identifizierung
eines Polypeptids durch Vergleich mit einem Polypeptididentifizierungsindex kann
eine Gruppe von Charakteristika, die mit einem Polypeptid assoziiert
sind, wie im Allgemeinen hier beschrieben zur Erzeugung eines Polypeptididentifizierungsindex
bestimmt werden oder sie kann unter Verwendung eines gleichwertigen,
modifizierten oder verkürzten
Verfahrens oder jedes beliebigen Verfahrens bestimmt werden, die
die Bestimmung von Charakteristika, die mit einem Polypeptid assoziiert
sind, ermöglicht. Die
Anzahl an Charakteristika, die zur eindeutigen Identifizierung eines
Polypeptid ausreicht, lässt
sich von Fachleuten, wie hier offenbart, problemlos festlegen. Die
Verfahren umfassen im Allgemeinen die Identifizierung von 2 oder
mehr Charakteristika und können
3 oder mehr, 4 oder mehr, 5 oder mehr, 6 oder mehr, 7 oder mehr,
8 oder mehr, 9 oder mehr, 10 oder mehr, 15 oder mehr, 20 oder mehr,
30 oder mehr oder sogar 50 oder mehr Charakteristika oder jede beliebige
Anzahl an Charakteristika umfassen, solange eine ausreichende Anzahl
an Charakteristika bestimmt wird, die jedes der Polypeptide in dem
Index unterscheidet. Die Anzahl an Charakteristika, die in einen
Polypeptididentifizierungsindex aufgenommen werden müssen, ist
von der jeweiligen Verwendung des Index und der Komplexität der zu
analysierenden Probe abhängig.
-
Bei
der Erzeugung eines Polypeptididentifizierungsindex können Charakteristika,
die mit einem Polypeptid assoziiert sind, dazu verwendet werden,
die Polypeptidsequenz mittels Suche in einer Sequenzdatenbank zu
erhalten. Beispielsweise kann eine partielle Aminosäuresequenz
eines Polypeptids oder eines Fragments, die wahlweise mittels Massenspektrometrie
bestimmt wurde, problemlos zur Suche in einer Datenbank mit Polypeptiden
oder translatierten Nukleinsäuresequenzen
für die
Identifizierung eines Namens oder einer Sequenzidentifikationsnummer,
wie einer Zugriffsnummer, die ein Polypeptid eindeutig beschreibt,
verwendet werden. Ein Polypeptididentifizierungsindex kann somit
Polypeptidcharakteristika, wie den Trivialnamen, einen numerischen
oder alphanumerischen Identifikationscode einer öffentlich zugänglichen
Datenbank oder jeden anderen Identifikationscode, der zur Identifizierung
eines Polypeptids in einem Polypeptididentifizierungsindex ausgewählt wurde,
enthalten.
-
Für die Beschaffung
von Sequenzinformationen von Polypeptiden, die kein parentales Polypeptid
oder keine Nukleinsäuresequenz
in einer Datenbank aufweisen oder die eine unerwartete posttranslationale
Modifikation enthalten, die die Identifizierung erschwert, kann
eine De-novo-Sequenzanalyse durchgeführt werden. Für die Suche
in einer Datenbank mit Polypeptiden oder Nukleinsäuresequenzen
können,
wie vorstehend beschrieben, identifizierte Aminosäuresequenzen
verwendet werden. Eine De-novo-Sequenzanalyse kann unter Verwendung
einer Vielfalt von Verfahren durchgeführt werden. Ein besonders nützliches
Verfahren für
die De-novo-Sequenzanalyse beinhaltet einen MS-Datensatz, der für die Polypeptididentifizierung
erzeugt wurde. Verfahren für
die Sequenzanalyse von Polypeptiden unter Verwendung der Massenspektrometrie
sind Fachleuten gut bekannt (siehe beispielsweise Kinter und Sherman,
Protein Sequencing and Identification Using Tandem Mass Spectrometry,
John Wiley & Sons,
New York (2000)).
-
Es
ist offensichtlich, dass Sequenzinformationen zu einem Polypeptid
oder einem Teil davon, die beispielsweise mittels eines Verfahrens
wie CID erhalten wurden, zwar als Charakteristikum in einen Polypeptididentifizierungsindex
aufgenommen werden können,
die erfindungsgemäßen Verfahren
machen jedoch eine Sequenzanalyse eines unbekannten Polypeptids
zu Identifikationszwecken unnötig,
obwohl die Sequenzinformation, falls erwünscht, in die Erzeugung eines
Polypeptididentifizierungsindex einfließen kann. Demgemäß kann ein
Polypeptididentifizierungsindex Informationen über Charakteristika, die mit
einem Polypeptid assoziiert sind, die zusätzlich zu den Charakteristika
vorliegen, die zur Identifizierung eines Polypeptids ausreichen, beispielsweise
Sequenzinformationen. Durch die Ansammlung von Informationen zu
Charakteristika, die mit einem Polypeptid assoziiert sind, in einem
Index kann die Identität
eines Polypeptids bei Nichtbeschaffen von Sequenzinformationen problemlos über ein
unbekanntes Polypeptid bestimmt werden.
-
Zur
Bestimmung eines Charakteristikums eines Polypeptids kann eine chromatographische
Trennung verwendet werden, da sich die physikalisch-chemischen Eigenschaften
eines Polypeptids im Verhalten eines Polypeptids auf einem chromatographischen
Medium widerspiegeln. Ein hoch geladenes Polypeptid lässt sich beispielsweise
aus einer Anionen- oder Kationenaustauschsäule unter spezifischen pH-
und/oder Salzbedingungen eluieren, die sich von den pH- und/oder
Salzbedingungen unterscheiden, bei denen ein nicht geladenes Polypeptid
oder ein Polypeptid mit entgegengesetzter Ladung eluiert werden
kann. Aus diesem Grund kann ein Charakteristikum, das mit einem
Polypeptid assoziiert ist, ein bestimmter pH-Wert und/oder eine
bestimmte Salzbedingung sein, bei der das Polypeptid aus einer Chromatographiesäule eluiert
wird. Analog können
Bedingungen bestimmt werden, bei denen ein Polypeptid aus jeder
beliebigen Art von Chromatographiesäule eluiert wird. Einer Reihenfolge
der Elution oder einer Pufferbedingung, mit der ein Polypeptid aus
einer Säule
eluiert wird, kann ein Wert zugewiesen werden, der als Attribut
in einen Polypeptidindex aufgenommen oder zum Vergleich mit entsprechenden
Werten in einem Polypeptidindex verwendet wird. Ein Wert kann beispielsweise
eine relative Position in einem Elutionsprofil unter festgelegten
Bedingungen, eine Elutionszeit unter einem vorgegebenen Satz Bedingungen
oder einer Durchflussgeschwindigkeit, die relative Zeit oder Elutionsreihenfolge
im Verhältnis
zur Fraktionsnummer eines externen Standards oder zu einem internen
Standard, die Salzkonzentration, der pH-Wert oder jeder beliebige
Parameter sein, der das wiederholfähig bestimmbare verhalten eines
Polypeptids in einer bestimmten Chromatographiesäule beschreibt. Zu alternativen Verfahren
gehören
beispielsweise die Gelelektrophorese, die Elektrofokussierung (IEF)
oder andere elektrophoretische Analyseverfahren. IEF hat sich beispielsweise
als ein nützliches
Charakteristikum für
die Erzeugung eines Strichcodes zur Identifizierung eines Polypeptids
erwiesen (siehe Beispiel VI). Verfahren zur Fraktionierung von Polypeptiden
sind Fachleuten gut bekannt (Scopes, Protein Purification: Principles
and Practice, 3. Ausgabe, Springer Verlag, New York (1993)). Die
Chromatographieverfahren können
in einem herkömmlichen
Chromatographieformat oder als chargenweises Bindungs- und Elutionsverfahren
beispielsweise in einem Massen- oder Multiwell-Format verwendet
werden.
-
Proteinfraktionierschritte
sind in den Verfahren der bevorzugten Ausführungsform sowohl für die Reduzierung
der Komplexität
einer Polypeptidprobe vor der Massenanalyse eines Polypeptids oder
eines Fragments davon als auch zur Bestimmung von Charakteristika,
die mit einem Polypeptid assoziiert sind, nützlich. Neben der vorstehend
beschriebenen chromatographischen Fraktionierung kann jeder gut
bekannte Fraktionierschritt zur Reduzierung der Komplexität der Probe
verwendet werden und/oder als bestimmtes Charakteristikum, das mit
einem Polypeptid assoziiert ist, dienen. Zu beispielhaften Fraktionierschritten
gehört
die Fällung
mit Salz, wie Ammoniumsulfat, oder die Fällung mit Chemikalien, wie
Polyethylenglycol oder Polyethylenimin, die subzelluläre Fraktionierung,
die Gewebefraktionierung, die Immunpräzipitation und dergleichen
(siehe Scopes, supra, 1993). Ein Fraktionierschritt kann zur Reduzierung
der Komplexität
einer Polypeptidpopulation verwendet werden. Die Reduzierung der
Komplexität
kann beispielsweise zur Isolierung einer Polypeptidsubpopulation
verwendet werden, die an einer bestimmten Aminosäure markierte Polypeptide enthält. Im Fall
von Gewebeproben kann die Fraktionierung die Isolierung eines oder
mehrerer bestimmter Zelltypen umfassen, beispielsweise mittels Zentrifugiertechniken
oder Immunselektion. Ferner können
auch andere Fraktionierschritte, wie die subzelluläre Fraktionierung,
zur Reduzierung der Komplexität
einer Probe und/oder zur Bereitstellung eines zur Identifizierung
eines Polypeptids nützlichen
Charakteristikums angewandt werden. Die Fraktionierschritte können möglicherweise
biologisch wichtige Informationen über das Polypeptid bereitstellen, beispielsweise,
ob sich das Polypeptid auf einer Organelle befindet oder ein Zellkernprotein,
ein Membranprotein und/oder ein Teil eines Signalkomplexes und dergleichen
ist. Jeder Fraktionierschritt, der vorteilhaft die Komplexität der Polypeptidpopulation
senkt, kann in den verfahren der bevorzugten Ausführungsform
angewandt werden.
-
Ein
Polypeptidfraktionierschritt ist in den Verfahren der bevorzugten
Ausführungsform
zur Bestimmung eines Charakteristikums, das mit einem Polypeptid
assoziiert ist, nützlich.
Zur Bestimmung des Molekulargewichts eines Polypeptids kann beispielsweise
ein Proteinfraktionierverfahren auf der Grundlage des Molekulargewichts
verwendet werden. Verfahren, wie SDS-PAGE, im Handel erhältliche Gelelution oder präparative Zellsysteme
(BIO-RAD) sowie Größenausschluss-Chromatographie sind
zur Bestimmung des scheinbaren Molekulargewichts eines Polypeptids
oder Fragments verwendbar. Das Molekulargewicht eines Polypeptids oder
Fragments ist ein Charakteristikum, das in einen Polypeptididentifizierungsindex
aufgenommen werden kann.
-
Die
bestimmte Gruppe von Charakteristika, die bei der Erzeugung eines
Polypeptididentifizierungsindex für ein Polypeptid oder für die Identifizierung
eines Polypeptids bestimmt wurde, kann vom Anwender ausgewählt werden
und ist von der Polypeptidprobe, den zur Vorbereitung der Polypeptidprobe
verwendeten Verfahren, dem verwendeten Massenspektrometrie-Verfahren und den
Wünschen
des Anwenders abhängig.
Die Charakteristika eines Polypeptids können in jeder zeitlichen Reihenfolge
bestimmt werden. Polypeptidcharakteristika können beispielsweise in einer
Reihenfolge gesammelt werden, die zeitlich effektiv oder zweckmäßig ist,
oder so gesammelt werden, wie dies durch ein bestimmtes Verfahren,
das für
die Verarbeitung der Probe gewählt
wurde, vorgegeben ist.
-
Bei
der Erzeugung eines Polypeptididentifizierungsindex können Sequenzinformationen,
die beispielsweise mittels CID bestimmt wurden, sowie andere Charakteristika
eines Polypeptids verwendet werden und die Sequenzinformation ist
besonders bei der Korrelation von anderen Charakteristika eines
Polypeptids mit einer speziellen Sequenz zur Identifizierung des
Polypeptids nützlich.
Der Vorteil der Verfahren besteht jedoch darin, dass die Beschaffung
von Sequenzinformationen über
ein Polypeptid nicht erforderlich ist, sobald der Polypeptididentifizierungsindex
erzeugt wurde. Stattdessen können
andere Charakteristika bestimmt werden, die zur Identifizierung
eines Polypeptids ausreichen, beispielsweise Massen und/oder Verhältnisse
von Peptiden, sowie andere Charakteristika und mit einem Polypeptididentifizierungsindex
verglichen werden, der selbst Sequenzinformationen umfassen kann, wodurch
eine Sequenzanalyse eines Polypeptids zu Identifizierungszwecken überflüssig wird.
-
Die
Verfahren zur Erzeugung eines Polypeptididentifizierungsindex beinhalten
das Bestimmen einer Gruppe von Charakteristika, die mit einem ersten
und einem zweiten Polypeptid assoziiert sind, wobei die bestimmten
Charakteristika zur Unterscheidung des ersten und zweiten Polypeptids
ausreichen. Charakteristika, die zur Unterscheidung des ersten und
zweiten Polypeptids ausreichen, beziehen sich auf eine Gruppe von Charakteristika,
die einem Polypeptid eindeutig zugeordnet werden können, sodass
die Polypeptididentität
mit dem Polypeptididentifizierungsindex unzweideutig bestimmt werden
kann. Falls eine Gruppe von Charakteristika einem oder mehreren
Polypeptiden gemeinsam ist, wird ein zusätzliches Charakteristikum bestimmt,
das eine Unterscheidung eines Polypeptids von anderen Polypeptiden
ermöglicht.
Somit können
die in einem Polypeptididentifizierungsindex vertretenen Polypeptide
anhand der Gruppe an Charakteristika, die jedes Polypeptid identifiziert,
voneinander unterschieden werden.
-
Die
Verfahren zur Identifizierung eines Polypeptids können auf
eine Population von Polypeptiden angewandt werden, in der zwei oder
mehr Polypeptide identifiziert sind, und können, falls erwünscht, zweckmäßig zur
simultanen Identifizierung mehrerer Polypeptide in einer Probe verwendet
werden. Aus diesem Grund kann das Verfahren bei einer einfachen
und einer komplexen Polypeptidprobe angewandt werden. Eine einfache
Polypeptidprobe kann beispielsweise eine gereinigte Polypeptidprobe
sein, die ein bis mehrere Polypeptide enthält. Eine komplexe Probe kann
beispielsweise ein Zell- oder ein Gewebelysat oder eine solche Fraktion
sein, das bzw. die einige bis mehrere Hundert Polypeptide oder sogar
Tausende oder Zehntausende Polypeptide enthält. Unter Verwendung der hier
beschriebenen Verfahren kann die Bestimmung der Polypeptidcharakteristika
das Sammeln von Versuchsdaten erforderlich machen, die das Ergebnis
einer Reihe von Schritten, wie beispielsweise einer Reihe von chromatographischen
Trennungen, sind.
-
Ein
beispielhaftes Verfahren, das zur Organisation von Daten, die während der
Analyse von komplexen Polypeptidproben erhalten wurden, nützlich ist,
beinhaltet das Aufteilen von Informationen in theoretische "Speicher". Eine ICATTM-artig markierte Mischung aus Polypeptiden
kann der Größe nach
in eine bestimmte Anzahl von Speichern abgetrennt werden, wobei
es sich um Fraktionen handeln kann, die aus einer Chromatographiesäule, wie
für den
Größenausschluss,
den Ionenaustausch und dergleichen, eluiert wurden, oder um Segmente
eines SDS-Polyacrylamid-Gels. Die Polypeptide in jedem Speicher
können
mittels eines sequenzspezifischen Spaltverfahrens fragmentiert werden.
Alternativ kann die Analyse der Polypeptide in einer Probe ohne
Fraktionieren der Polypeptide durchgeführt werden, solange eine ausreichende
Reduzierung der Komplexität
der Probe erfolgt, sodass die Identifizierung des Polypeptids ohne
Fraktionierung möglich
ist. Die in Speicher fraktionierte Peptidmischung kann mittels verschiedener
Verfahren, einschließlich
beispielsweise Ionenaustauschchromatographie, Affinitätschromatographie,
wie sie zur Isolierung von ICATTM-artig
markierten Peptiden verwendet wird, Umkehrphasen-Flüssigkeitschromatographie
oder anderer chromatographischer Techniken, weiter fraktioniert
werden. Jeder Speicher mit Peptiden kann anschließend in
einem weiteren Fraktionierschritt, wie Ionenaustauschchromatographie,
gespeichert und erneut weiter in eine bestimmte Anzahl an Speicher
aufgeteilt werden. Jeder dieser Speicher wiederum kann mittels eines
anderen Fraktionierschritts, wie Umkehrphasenchromatographie, getrennt
und weiter in eine bestimmte Anzahl an Speicher aufgeteilt werden,
die jeweils mittels Massenspektrometrie analysiert werden können. Somit
hat jedes mittels eines derartigen Verfahrens analysierte Polypeptid
fünf assoziierte
Charakteristika, die beispielsweise mittels eines 5-stelligen Polypeptididentifikationscodes
oder "Strichcodes" auf der Grundlage
von Cysteingehalt, Größe, Ladung, Hydrophobie
und Masse dargestellt werden können.
-
Die
Verfahren zur Indexierung der Charakteristika, die mit einer großen Anzahl
an Polypeptiden assoziiert sind, benötigt Computerspeicherplatz,
dessen Menge dem Quadrat zur Sequenzlänge entspricht. Zur Reduzierung
der Anforderungen an den Speicherplatz kann eine moderne Datenstruktur,
wie beispielsweise Suffixbäume,
verwendet werden (Gusfield, Algorithms on Strings, Trees and Sequences:
Computer Science and Computational Biology, Cambridge University
Press (1997)). Suffixbäume
sind eine kompakte Datendarstellung für alle Suffixe einer Sequenzdatenbank.
In ihrer Reinform können
sie in linearer Zeit konstruiert und in einem linearen Speicher
anstatt eines quadratischen Speichers gespeichert werden. Zur Optimierung
der Rechenzeit und der Verwendung von Speicherplatz, der mit der
Abfrage eines Polypeptididentifizierungsindex assoziiert ist, können verschiedene
Modifikationen von Suffixbäumen
und Traversal-Algorithmen verwendet werden.
-
Eine
Gruppe bestimmter Charakteristika, die mit einem Polypeptid assoziiert
sind, werden mit einem Polypeptididentifizierungsindex verglichen.
Zum Abgleich von Werten, die den bestimmten Charakteristika zugewiesen
wurden, mit den annotierten Werten des Index können verschiedene Suchalgorithmen
verwendet werden. Eine nützliche
Strategie zur Verbesserung der Wirksamkeit einer Datenbankabfrage
ist das Einengen oder "Beschränken" der Datenbank. Der
Begriff "Beschränkung" bezieht sich, wenn
er in Bezug auf einen Polypeptididentifizierungsindex verwendet
wird, auf eine Begrenzung, die bei einem Polypeptididentifizierungsindex
angewendet wird, um einen Subindex zu erhalten, der eine Fraktion
der Polypeptididentifikationscodes enthält, die den Polypeptiden entspricht,
die die Charakteristika aufweisen, die einem oder mehreren Charakteristika
eines zu identifizierenden Polypeptids entsprechen. Ein Subindex
kann dann erzeugt werden, wenn eine Gruppe von Polypeptiden mit
einem gemeinsamen Charakteristikum in einem Polypeptididentifizierungsindex
ausgewählt
ist oder wenn ein bestimmtes Charakteristikum, das in einem Polypeptididentifikationscode enthalten
ist, zum Ausschluss eines oder mehrerer Polypeptide von einem Index
verwendet wird. Ein gemeinsames Charakteristikum kann ein festgelegtes
physikalisch-chemisches Charakteristikum, wie eine partielle Aminosäuresequenz
oder jedes andere bestimmte Charakteristikum sein, das einen Wertebereich
zugewiesen hat. Die Masse eines Polypeptidfragments, die als ein
Wertebereich ausgedrückt
ist, der der Grund für
den Fehler bei der Massenbestimmung ist, kann beispielsweise als
eine Beschränkung
bei der Selektion einer Untergruppe an Polypeptiden oder Fragmenten
einer bestimmten Masse dienen.
-
Ein
Charakteristikum, das mit einem Polypeptid assoziiert ist und das
als Beschränkung
für eine
Datenbank verwendet werden kann, ist die partielle Aminosäurezusammensetzung.
Die partielle Aminosäurezusammensetzung
eines Polypeptids umfasst die Identifizierung mindestens einer einzigen
Aminosäure,
die in einem bestimmten Polypeptid oder Fragment davon vorhanden
ist. Eine partielle Aminosäuresequenz
kann beispielsweise durch Behandeln eines Polypeptids oder eines
Fragments davon mit einer Reagenz erhalten werden, was zur Erzeugung
eines Polypeptids oder Fragments davon führt, das eine oder mehrere
festgelegte Aminosäuren
enthält.
Ein sequenzspezifisches Spaltverfahren für Polypeptide erzeugt beispielsweise
Fragmente mit einem oder mehreren bekannten Aminosäureresten
an dem Carboxy- oder
Amino-Terminus des Fragments. Es ist jedoch nicht nötig zu wissen,
ob sich ein spezifischer Aminosäurerest
an dem Carboxy- oder Amino-Terminus des Fragments eines Polypeptids
befindet. Demzufolge zeigt die Spaltung eines Polypeptids mit einer
sequenzspezifischen Protease die Gegenwart der entsprechenden Aminosäure und/oder
Sequenz im Polypeptid oder Peptidfragment davon an. Analog kann
ein Reagenz dazu verwendet werden, einen oder mehrere spezifische
Aminosäurereste
eines Polypeptids oder Fragments spezifisch zu modifizieren oder
zu markieren. Ein Polypeptid oder Fragment, das eine derartige Modifizierung
oder Markierung enthält,
enthält bekanntermaßen eine
spezifische Aminosäure.
Die partielle Aminosäurezusammensetzung
ist ein Charakteristikum, das mit einem Polypeptid assoziiert ist
und das als Beschränkung
eines Polypeptididentifizierungsindex bei der Erzeugung eines Polypeptididentifizierungssubindex
nützlich
ist.
-
Der
Vergleich einer Gruppe bestimmt Charakteristika mit einem Polypeptididentifizierungsindex
kann somit eine Reihe von Anfragen beinhalten, die durch ein bestimmtes
Charakteristikum eines Polypeptids beschränkt sind. Beispielsweise kann
eine erste Abfrage betreffend die Masse eines parentalen Polypeptids
oder Fragments durchgeführt
werden, die zur Erzeugung eines Polypeptididentifizierungssubindex
führt,
der Massenwerte für
Polypeptide und Fragmente enthält,
die dem zu identifizierenden Polypeptid oder Fragment davon ähnlich sind,
das heißt,
innerhalb des Toleranzbereichs des Instruments liegen. Ein zweites
Charakteristikum, mit dem der erzeugte Polypeptididentifizierungssubindex
durchsucht wird, wie die Gegenwart eines Cysteinrests in dem zu
identifizierenden Polypeptid, sieht eine weitere Beschränkung vor
und kann zur Erzeugung eines weiteren Polypeptididentifizierungssubindex
verwendet werden.
-
Die
bestimmte Masse eines Polypeptids oder Fragments ist ein Charakteristikum,
das vorteilhaft zur Beschränkung
einer derartigen Datenbankabfrage verwendet werden kann, um die
Wirksamkeit beim Durchsuchen einer großen Datenbank zu erhöhen. So
können
beispielsweise die Tandem-MS-Spektren unter Verwendung einer Software,
wie SEQUESTTM, analysiert werden, die eine
Liste von Peptiden aus einer Datenbank erzeugt, die der Molekülmasse des
unbekannten Peptids entsprechen, das einer CID unterworfen worden
war, und die dann das beobachtete CID-Spektrum des unbekannten Peptids
mit denen aller mögliche
Isobare vergleicht (Eng, J. et al., J. Am. Soc. Mass. Spectrom.
5: 976–989,
(1994)). Somit stellt die Gruppe von Peptiden mit einer dem zu analysierenden
Polypeptidfragment ähnlichen
Masse, die durch diese Art der Abfrage erzeugt wird, eine Untergruppe
von möglichen
parentalen Polypeptiden bereit, die durch das Polypeptidfragment
repräsentiert
ist. Die Untergruppe kann dann zur Identifizierung des parentalen
Polypeptids beispielsweise unter Verwendung einer partiellen Aminosäurezusammensetzung
durchsucht werden. Fachleuten sind die passenden Korrelationspunktparameter
für eine
bestimmte Abfrage unter Verwendung von Softwareanwendungen, wie
SEQUESTTM, bekannt oder sie können diese
problemlos bestimmen.
-
Ein
Verfahren zum Vergleich von zwei oder mehr Polypeptidpopulationen
bedient sich eines Verfahren zur quantitativen Unterscheidung der
beiden Polypeptidpopulationen, wie des hier beschriebenen Verfahrens unter
Verwendung eines ICATTM-artigen Reagenz,
das in 3 dargestellt ist. In diesem
Schritt können
zwei oder mehr chemisch identische aber unterschiedlich isotopenmarkierte
ICATTM-artige Reagenzien verwendet werden.
Somit können
mehrere Proben mit den hier beschriebenen Verfahren verglichen werden,
obwohl 3 nur zwei Proben darstellt.
Die in 3 dargestellten Proben enthalten
Polypeptidpopulationen, die vom selben Probentyp geerntet wurden,
sich jedoch hinsichtlich der Wachstumsbedingungen unterscheiden.
Zu beispielhaften unterschiedlichen Wachstumsbedingungen können das
Wachstum unter unterschiedlichen Stoffwechselbedingungen oder Zellen
mit unterschiedlichem Stoffwechselzustand, der Vergleich einer normalen
und einer krankhaften Probe, wie einer Tumorprobe, der Vergleich
von nicht behandelten und mit einem pharmazeutischen Wirkstoff behandelten
Zellen und dergleichen gehören.
-
Wie
in 3 dargestellt, werden die Proben unabhängig voneinander
unter Verwendung eines ICATTM-artigen Reagenz
markiert, vereinigt und die Charakteristika der Polypeptide und
entsprechenden Fragmente werden wie hier beschrieben bestimmt. Während dieses
Vorgangs erzeugte Polypeptide und Fragmente können, falls erwünscht, unter
Verwendung einer einstufigen Massenspektrometrie anstatt MS/MS analysiert
werden, um den Probendurchsatz und die Empfindlichkeit zu erhöhen (Goodlett
et al., supra, 2000). Die für
die Polypeptide und Fragmente bestimmten Charakteristika werden,
wie hier beschrieben, zur Bestimmung der Polypeptididentitäten verwendet.
Anschließend
können
die Massenspektren auf Paare von Peptid-Ionen untersucht werden,
die während
des gesamten Vorgangs gemeinsam fraktioniert wurden und die einen
Massenunterschied aufweisen, der genau dem von dem ICATTM-artigen
Reagenz kodierten Massenunterschied entspricht. Die relative Signalstärke der
beiden Peaks gibt die relative Häufigkeit
der Fragmentpolypeptide an und ist somit ein Anzeichen für die relative
Häufigkeit
des entsprechenden parentalen Polypeptids, das anfänglich in
der Probe vorhanden war. Somit kann ein Verfahren zum Vergleichen
der in zwei Polypeptidproben enthaltenen Polypeptide die Erzeugung
von zwei Polypeptid-Bezugsindices beinhalten, die neben einem Polypeptididentifikationscode
eine quantitative Bestimmung einer Polypeptidmenge für jedes
identifizierte Polypeptid enthalten.
-
Ein
alternatives Verfahren zum Vergleichen von zwei oder mehr Polypeptidpopulationen
ist der Vergleich von einer oder mehreren Polypeptidproben mit einem
zuvor bestimmten Polypeptid-Bezugsindex. Eine Gruppe von Charakteristika
für ein
oder mehrere Polypeptide in einer Polypeptidprobe kann identifiziert
und mit einem Polypeptididentifizierungs-Bezugsindex verglichen
werden, um die Identitäten
eines oder mehrerer Polypeptide und die relativen Mengen der identifizierten
Polypeptide zu bestimmen. Falls erwünscht, kann eine unbekannte
Probe unter Verwendung der vorstehend beschriebenen quantitativen
Verfahren mit einer Bezugsprobe verglichen werden, um die relativen
Expressionsniveaus der Polypeptide zu bestimmen. Eine Bezugsprobe
kann beispielsweise eine Probe von einem gesunden Individuum oder
eine unter einer Kontrollbedingung erstellte Probe sein, die für den Vergleich
des physiologischen Zustands einer anderen Probe, wie einer krankhaften
Probe, nützlich
ist.
-
Ein
Polypeptididentifizierungsindex, der quantitative Bestimmungen der
Polypeptidmenge enthält,
gilt als ein "Polypeptidprofil" der jeweiligen zur
Erzeugung des Index verwendeten Probe. Ein Polypeptidprofil, wie hier
verwendet, ist eine Gruppe von Polypeptididentifikationscodes, die
eine für
eine spezifische Probe erzeugte Polypeptidmenge umfassen.
-
Ein
Polypeptidprofil ist für
Proteomikverfahren nützlich,
da ein derartiges Profil zur Unterscheidung zwischen unterschiedlichen
Bedingungen und Zuständen der
Zellen, Gewebe, Organe und Organismen verwendet werden kann. Das
Polypeptid, das von einer Zelle oder einem Gewebe zu einem bestimmten
Zeitpunkt exprimiert wird, kann zur Festlegung des Zustands der
Zelle oder des Gewebes zum Messzeitpunkt herangezogen werden. Somit
können
die quantitativen und qualitativen Unterschiede von Proteinprofilen
desselben Zelltyps in unterschiedlichen Zuständen zur Diagnose der jeweiligen
Zustände
beitragen. Zu Beispielen für derartige
Vergleiche gehören
normale und Tumorzellen, Zellen mit unterschiedlichen Stoffwechselzuständen sowie
nicht behandelte und mit einem pharmazeutischen Wirkstoff behandelte
Zellen. Der Unterschied zwischen zwei Polypeptidprofilen kann als "differenzielles Polypeptidprofil" bezeichnet werden.
Ein differenzielles Polypeptidprofil ist bei der Analyse quantitativer Änderungen
von Polypeptiden nützlich,
die in Proben enthalten sind, welche von verschiedenen Zelltypen,
wie beispielsweise Krebs- und normalen Zellen, stimulierten und
nicht stimulierten Zellen oder von verschiedenen Gewebeproben von
klinischem Interesse abgeleitet sind.
-
Die
Verfahren zur Erzeugung differenzieller Polypeptidprofile sind für die Analyse
der Veränderungen von
Polypeptidprofilen in Proben, wie Körperflüssigkeiten, anwendbar. Ein
differenzielles Polypeptidprofil wird mithilfe eines Vergleichs
des Polypeptidprofils zweier Spezimens, beispielsweise eines normalen
und eines mit einer Krankheit verbundenen Polypeptidprofils, bestimmt.
Beispielsweise kann ein Polypeptidprofil, das einen normalen Zustand
des Spezimens darstellt, erzeugt und mit einem Spezimen verglichen
werden, das unter Verdacht steht, einen anomalen oder krankhaften
Zustand zu haben. Alternativ kann ein Polypeptidbezugsprofil, das
einen Krankheitszustand darstellt, mit einem Spezimen eines Individuums
verglichen werden, das einen bestimmten Krankheitszustand aufweist
oder möglicherweise aufweist.
Ein Polypeptidbezugsprofil, das einen normalen oder krankhaften
Zustand darstellt, kann unter Verwendung eines Spezimens eines bestimmten
Individuums oder einer Population aus Individuen bestimmt werden.
-
Falls
erwünscht,
kann die Analyse mit einer Population anstatt einem Individuum durchgeführt werden, insbesondere
einer Bezugspopulation oder Kontrollpopulation. Eine derartige Bezugspopulation
kann für
den Vergleich mit einer unbekannten Probe verwendet werden. Ein
Fachmann kann eine geeignete Bezugspopulation auf der Grundlage
der jeweiligen Anwendung der bevorzugten Verfahren bestimmen. Die
bevorzugten Verfahren können
zur Erzeugung eines differenziellen Polypeptidprofils verwendet
werden, mit dem die unterschiedliche Polypeptidexpression zwischen
zwei Proben, beispielsweise einem normalen oder krankhaften Zustand,
identifiziert wird. Die Größe der Bezugspopulation
ist von den zur Auswahl der Bezugsindividuen angelegten Kriterien
abhängig.
In Abhängigkeit
von den Selektionskriterien und der jeweiligen Anwendung der erfindungsgemäßen Verfahren
kann eine Bezugspopulation eine verhältnismäßig kleine Anzahl bis zu einer
großen
Anzahl an Individuen, bis einschließlich Tausender von Individuen,
umfassen.
-
Die
Analyse von Proben im Großmaßstab von
Patienten mit einer spezifisch diagnostizierten Krankheit oder mit
Anzeichen oder Symptomen einer Krankheit ist für die Identifizierung klinischer
Marker oder Markerkonstellationen der jeweiligen Zustände nützlich.
Proben von Individuen mit einer Krankheit können zur Erzeugung eines qualitativen
und/oder quantitativen Polypeptididentifizierungsindex für diese
Krankheit verwendet werden. Analog kann die vergleichende Analyse
von Polypeptiden, die in Proben von Patienten enthalten sind, welche
eine therapeutische Behandlung erhalten, zur Identifizierung von
Diagnosemarkern oder Markerkonstellationen verwendet werden, die
den Erfolg oder Misserfolg der Behandlung anzeigen. Die Verfahren sind
auch bei der Analyse solcher Proben in einem systematischen, populationsweiten
Maßstab
für die
Entdeckung oder das Screening von Markern oder Markerkonstellationen
anwendbar, die für
die Anzeige einer Prädisponierung
von Individuen für
bestimmte klinische Zustände
nützlich
sind.
-
Die
bevorzugte Ausführungsform
stellt ferner ein Verfahren zur Erzeugung eines Polypeptididentifizierungsindex
bereit. Das Verfahren umfasst die Schritte des (a) Bestimmens einer
Gruppe von zwei der mehr Charakteristika, die mit einem ersten Polypeptid
oder einem Peptidfragment davon assoziiert sind, wobei eines der
Charakteristika die Masse eines Peptidfragments des Polypeptids
ist, wobei die Fragmentmasse mithilfe der Massenspektrometrie bestimmt
wird; (b) Wiederholens von Schritt (a) mit einem zweiten Polypeptid;
(c) wahlweise Bestimmens eines oder mehrerer zusätzlicher Charakteristika, die
mit dem ersten und dem zweiten Polypeptid assoziiert sind, wobei
die bestimmten Charakteristika zur Unterscheidung des ersten und
des zweiten Polypeptids ausreichen, wodurch ein Polypeptididentifizierungsindex
für das
erste und das zweite Polypeptid erzeugt wird. Das Verfahren kann
ferner das ein- oder mehrmalige Wiederholen von Schritt (a) bis
(c) mit einem unterschiedlichen Polypeptid umfassen, wobei die bestimmten
Charakteristika zur Unterscheidung der jeweiligen Polypeptide ausreichen,
wodurch ein Polypeptididentifizierungsindex für die jeweiligen Polypeptide erzeugt
wird. Wie bei der Bestimmung von Charakteristika eines Polypeptids
kann der Polypeptididentifizierungsindex mit jedem der hier offenbarten
Verfahren oder jedem gut bekannten Verfahren zur Bestimmung von Charakteristika,
die mit einem Polypeptid assoziiert sind, bestimmt werden. Der Polypeptididentifizierungsindex
kann wahlweise durch eine Massenbestimmung in Abwesenheit von Ionenselektion
erhalten werden.
-
Die
Verfahren zur Erzeugung eines Polypeptididentifizierungsindex können die
Bestimmung der Polypeptid- oder Fragmentmasse in Abwesenheit von
Ionenselektion zur Erzeugung von Fragment-Ionen beinhalten und können ferner
die Bestimmung einer Fragmentmasse mit einer Genauigkeit von mehr
als 1 Teil je Million oder, falls erwünscht, einer noch geringeren
Genauigkeit (höherer
ppm) beinhalten. Ein Polypeptididentifizierungsindex kann zwar eine
Aminosäuresequenz
für ein
Polypeptid umfassen, zur Durchführung
der Verfahren der bevorzugten Ausführungsform zum Erzeugen eines
Polypeptididentifizierungsindex oder zur Identifizierung eines Polypeptids
unter Verwendung eines Polypeptididentifizierungsindex ist eine
Sequenzanalyse eines Polypeptids oder Fragments jedoch nicht erforderlich.
-
Die
bevorzugte Ausführungsform
stellt ferner ein Verfahren zur Identifizierung eines Polypeptids
bereit. Das Verfahren kann die Schritte des (a) simultanen Bestimmens
der Masse einer Untergruppe von parentalen Polypeptiden einer Population
von Polypeptiden und der Masse von Peptidfragmenten der Untergruppe von
parentalen Polypeptiden; (b) Vergleichens der bestimmten Massen
mit einem Polypeptididentifizierungsindex und (c) Identifizierens
eines oder mehrerer Polypeptide des Polypeptididentifizierungsindex
mit den bestimmten Massen umfassen. Der Polypeptididentifizierungsindex
kann ein annotierter Polypeptidindex sein. Das Verfahren kann ferner
die Schritte des (d) Bestimmens eines oder mehrerer Charakteristika,
die mit einem oder mehreren der parentalen Polypeptide assoziiert
sind; (e) Vergleichens der in Schritt (a) und Schritt (d) bestimmten
Charakteristika mit dem Polypeptididentifizierungsindex und (f)
wahlweise Wiederholens der Schritte (d) und (e) ein oder mehrere
Male umfassen, wobei eine Gruppe von Charakteristika bestimmt wird,
die ein parentales Polypeptid als einziges Polypeptid im Polypeptididentifizierungsindex
identifiziert. Die Verfahren können
darüber
hinaus das Quantifizieren der Menge des identifizierten Polypeptids
in einer Probe, die das Polypeptid enthält, umfassen. Wie hier offenbart,
können
das vorstehende Verfahren sowie andere Verfahren mit bestimmten
Massengenauigkeiten durchgeführt
werden. Die Identifizierung eines parentalen Polypeptids als ein
einziges Polypeptid in einem Polypeptididentifizierungsindex bezieht
sich auf die Bestimmung einer ausreichenden Anzahl an Charakteristika,
sodass ein bestimmtes Polypeptid in dem Polypeptididentifizierungsindex
den bestimmten Charakteristika entspricht, das heißt, sodass
ein Polypeptid identifiziert ist.
-
Ein
Verfahren zur Identifizierung eines Polypeptids umfasst einen Schritt
des simultanen Bestimmens der Masse einer Untergruppe von parentalen
Polypeptiden einer Population von Polypeptiden und der Masse von
Polypeptidfragmenten der Untergruppe von parentalen Polypeptiden
(siehe Beispiel III). Die simultane Bestimmung der Masse einer Untergruppe
von parentalen Polypeptiden bezieht sich auf die Erfassung von Massewerten
für eine
Untergruppe von parentalen Polypeptiden aus einer einzige Probe,
die eine Polypeptidpopulation enthält. Der Begriff "simultan" soll hier bedeuten,
dass die Massen von parentalen Polypeptiden und Polypeptidfragmenten
derart gleichzeitig bestimmt werden, dass das verwendete MS-Verfahren die Massen der
parentalen Polypeptide und der entsprechenden Fragmente innerhalb
eines Zeitrahmens erfassen kann, der dafür ausreicht, die parentale
und fragmentarische Masse mit derselben Untergruppe an Polypeptiden
zu korrelieren. Die mittels eines MS- Verfahrens untersuchten Polypeptide
verändern
sich im Laufe der Zeit, da unterschiedliche Untergruppen von Polypeptiden
aus einer Chromatographiesäule
eluieren, wie dies durch die Durchflussgeschwindigkeit der Säule vorgegeben
ist. Eine simultane Bestimmung tritt während eines Zeitintervalls
vor der Veränderung
einer bestimmten Untergruppe an Polypeptiden aufgrund der Einführung eines
zusätzlichen
Polypeptids oder des Verlustes eines Polypeptids der Polypeptiduntergruppe
auf, was aufgrund der online Probennahmeverfahren erfolgt.
-
Die
simultane Bestimmung der Masse einer Untergruppe an Polypeptiden
kann beispielsweise in Abwesenheit der Selektion eines Einzelions
für die
Massenbestimmung durchgeführt
werden. Anstatt eines einzigen Ions können beispielsweise mehrere
Polypeptide selektiert werden (Masselon et al., Anal. Chem. 72: 1918–1924 (2000)).
In Verfahren der bevorzugten Ausführungsform werden vorzugsweise
mehr als 5 Ionen, beispielsweise 6 Ionen, 7 Ionen, 8 Ionen, 9 Ionen,
10 Ionen oder sogar noch größere Ionenzahlen
selektiert. In einem solchen Fall ist der Polypeptididentifizierungsindex
vorzugsweise ein annotierter Polypeptidindex.
-
Alternativ
kann eine simultane Bestimmung der Massen einer Untergruppe an Polypeptiden
in Abwesenheit von Einzelionenselektion oder in Abwesenheit von
Ionenselektion in einer Ursprungsregion durchgeführt werden (siehe 2).
In einem solchen Fall werden die erhaltenen Fragment-Ionen dekonvoliert,
um zu bestimmen, welche Ionen mit einem bestimmten parentalen Polypeptid
assoziiert und somit als Charakteristikum, das mit dem parentalen
Polypeptid assoziiert ist, nützlich
sind. Ein derartiges Verfahren kann für den Nachweis und die Identifizierung
weniger häufiger
Ionen, die mittels üblicher
MS-Verfahren nicht für
die Fragmentierung selektiert werden, nützlich sein.
-
Ein
Massenspektrometrieverfahren, das zum simultanen Erhalten der Massen
von Polypeptiden und Polypeptidfragmenten nützlich ist, ist in-source CID
auf ESI-TOF. Das Verfahren beinhaltet das kontinuierliche Verändern zwischen
Scans des parentalen Ions und in-source CID. In-source CID Scans
stellen spezifische Fragment-Ionen bereit, die selbst in Gegenwart
von mehreren fragmentierten parentalen Ionen zu einem bestimmten
parentalen Ion zurückführbar sind.
Die Stammbäume
parentaler Fragment-Ionen können
mittels Dekonvolieren der Massenspektrometriedaten unter Verwendung
einer geeigneten Software bestimmt werden. MS-Instrumente, die Messungen
mit geringerer Genauigkeit bereitstellen, z. B. ESI-TOF, können vorteilhaft
zur Bereitstellung eindeutiger Beschränkungen der Polypeptididentifizierung
verwendet werden.
-
Die
bevorzugte Ausführungsform
stellt darüber
hinaus ein Verfahren zur Identifizierung eines Polypeptids bereit.
Das Verfahren umfasst die Schritte des (a) Bestimmens zweier oder
mehrerer Charakteristika, die mit dem Polypeptid oder einem Fragment
davon assoziiert sind, wobei eines der Charakteristika die Masse eines
Fragments des Polypeptids ist, wobei die Fragmentmasse mithilfe
der Massenspektrometrie in Abwesenheit von Ionenselektion für die Erzeugung
von Fragment-Ionen bestimmt wird; (b) Vergleichens der Charakteristika,
die mit dem Polypeptid assoziiert sind, mit einem Polypeptididentifizierungsindex,
und (c) Identifizierens eines oder mehrerer Polypeptide in dem Polypeptididentifizierungsindex
mit den bestimmten Charakteristika. Das Verfahren kann ferner die
Schritte des (d) Bestimmens eines oder mehrerer zusätzlicher
Charakteristika, die mit dem Polypeptid assoziiert sind, und (e)
Vergleichens der in Schritt (a) und Schritt (d) bestimmten Charakteristika
mit dem Polypeptididentifizierungsindex umfassen. Wie bei den anderen
Verfahren der bevorzugten Ausführungsform
kann das Verfahren das Quantifizieren der Menge des identifizierten
Polypeptids in einer Probe umfassen. Die Verfahren können auch
mit einer bestimmten Massengenauigkeit durchgeführt werden.
-
Somit
stellt die bevorzugte Ausführungsform
auch ein Verfahren zur Identifizierung eines Polypeptids bereit.
Das Verfahren umfasst die Schritte des (a) Bestimmens zweier oder
mehrerer Charakteristika, die mit dem Polypeptid oder einem Fragment
davon assoziiert sind, wobei eines der Charakteristika die Masse
eines Fragments des Polypeptids ist, wobei die Fragmentmasse mithilfe
der Massenspektrometrie mit einer Genauigkeit in ppm von mehr als
2,5 ppm bestimmt wird; (b) Vergleichens der Charakteristika, die
mit dem Polypeptid assoziiert sind, mit einem Polypeptididentifizierungsindex,
und (c) Identifizierens eines oder mehrerer Polypeptide in dem Polypeptididentifizierungsindex
mit den bestimmten Charakteristika. Das Verfahren kann ferner die Schritte
des (d) Bestimmens eines oder mehrerer zusätzlicher Charakteristika, die
mit dem Polypeptid assoziiert sind, und (e) Vergleichens der in
Schritt (a) und Schritt (d) bestimmten Charakteristika mit dem Polypeptididentifizierungsindex
umfassen. Die Verfahren können
auch mit einer niedrigeren Genauigkeit (höherer ppm) durchgeführt werden.
-
Wie
hier offenbart, wurden parentale Proteine mithilfe einer Kombination
aus (1) Cysteingehalt, (2) genauer Peptidmasse und (3) genauer Peptidfragmentmasse
ohne Selektion spezifischer Ionen identifiziert (siehe Beispiel
IV). Obwohl in diesem bestimmten Beispiel der Cysteingehalt gewählt wurde,
ist der Cysteingehalt nicht zwingend ein bestimmtes Charakteristikum.
Im Gegensatz zur herkömmlichen
Tandem-MS wurden alle gemeinsam MS unterworfenen Peptide ohne Einzelionenselektion
fragmentiert. Alle Fragment-Ionen der beiden simultan fragmentierten
Peptide wurden im Gegensatz zur Tandem-MS, bei der Fragment-Ionen
jeweils pro Einzelpeptid gemessen werden, gemeinsam gemessen.
-
Die
Verfahren der bevorzugten Ausführungsform
beinhalten die Bestimmung von Charakteristika, die mit einem Polypeptid
assoziiert sind. Eine ein Polypeptid enthaltende Probe kann so einfach
sein wie eine isolierte ein Polypeptid enthaltende Polypeptidmischung
oder so komplex wie eine Probe, die im Wesentlichen alle in einem
Organismus exprimierten Polypeptide enthält. Ferner kann eine Probe,
falls erwünscht
unter Verwendung der hier offenbarten Verfahren fraktioniert werden.
-
Ein
Polypeptid kann in einer aus einer Vielfalt von Quellen isolierten
Probe sein. Eine Polypeptidprobe kann beispielsweise aus jeder beliebigen
biologischen Flüssigkeit,
Zelle, Gewebe, Organ oder einem Teil davon oder jeder beliebigen
Art eines Organismus gewonnen werden. Eine Probe kann in einem Individuum
vorliegen oder von dem Individuum genommen oder abgeleitet werden.
Eine Probe kann beispielsweise ein histologischer Schnitt eines
Spezimens, das mittels Biopsie erhalten wurde, oder Zellen, die
von einem Individuum isoliert und in eine Gewebekultur gegeben oder
zu einer solchen umgewandelt wurden, darstellen. Eine Probe kann
ferner eine subzelluläre
Fraktion oder ein solches Extrakt darstellen. Eine Probe kann mittels
Verfahren vorbereitet werden, die im Fachgebiet zur Erhaltung der
Polypeptidsolubilität
bekannt sind, wie derjenigen, die hier nachstehend beschrieben sind.
-
Ein
Spezimen bezieht sich spezifisch auf eine von einem Individuum erhaltene
Probe. Ein Spezimen kann von einem Individuum als Flüssigkeits-
oder Gewebegut gewonnen werden. Ein Gewebespezimen kann beispielsweise
mittels einer Biopsie, wie einer Hautbiopsie, Gewebebiopsie oder
Tumorbiopsie, gewonnen werden. Ein flüssiges Spezimen kann Blut,
Serum, Urin, Speichel, Rückenmarksflüssigkeit
oder jede andere Körperflüssigkeit
sein. Insbesondere ein flüssiges
Spezimen ist bei den erfindungsgemäßen Verfahren nützlich,
da flüssige
Spezimens schnell von einem Individuum erhalten werden können. Verfahren
zum Sammeln von Spezimens sind dem Fachmann gut bekannt (siehe beispielsweise
Young and Bermes, in Tietz Textbook of Clinical Chemistry, 3. Ausgabe,
Burtis and Ashwood, Herausgeber, W. B. Saunders, Philadelphia, Kapitel
2, S. 42–72
(1999)).
-
Ein
Polypeptid, das in den Verfahren der bevorzugten Ausführungsform
verwendet werden soll, kann aus einer Quelle, wie einer Zelle, Gewebe,
einem Organ oder einem Organismus, gewonnen werden. Im Fachgebiet
sind eine Vielfalt von Verfahren zur Lyse einer Zelle bekannt. Zellen
können
beispielsweise mithilfe von Denaturierungsmitteln, einem oder mehreren
Gefrier- und Auftauzyklen, Ultraschallbehandlung und dergleichen
aufgelöst
werden. Nach der Lyse kann die Polypeptidmischung einem Fraktionierschritt
unterworfen werden, um beispielsweise Nukleinsäure oder Lipide zu entfernen
oder um intakte subzelluläre
Fraktionen oder Organellen zu entfernen. Verfahren zum Auflösen und
Fraktionieren sind Fachleuten gut bekannt (siehe Scopes, supra,
1993).
-
Zur
Identifizierung eines Polypeptids kann eine Probe oder ein Spezimen
in einem Puffer enthalten sein, der sich zur Aufrechterhaltung der
Polypeptidsolubilität
eignet, wie beispielsweise ein Puffer, der ein Tensid enthält, einschließlich Denaturierungsmittel,
wie Natriumdodecylsulfat (SDS). Zu Denaturierungsmitteln, die zur
Solubilisierung von Polypeptiden nützlich sind, gehören beispielsweise
Guanidin-HCl, Guanidinisothiocyanat, Harnstoff und dergleichen.
Im Falle von Guanidinisothiocyanat kann ein solches Reagenz, wie
bei der Behandlung mit jedem Reagenz, das ein Polypeptid kovalent
modifizieren kann, verwendet werden, solange der Polypeptididentifizierungsindex,
mit dem die Probe verglichen werden soll, im Wesentlichen auf dieselbe weise
hergestellt wurde wie die Probe, sodass dies für einen Vergleich desselben
Polypeptids ausreicht. Andere im Fachgebiet bekannte Denaturierungsmittel
können
auf ähnliche
Weise für
solubilisierte Polypeptide verwendet werden. Darüber hinaus können Reduktionsmittel,
wie Dithiothreitol (DTT), Dithioerythritol (DTE) oder Mercaptoethanol
enthalten sein.
-
Die
Verfahren der bevorzugten Ausführungsform
können
wahlweise Proteinfraktionierschritte beinhalten. Die Proteinfraktionierung
bezieht sich auf jedes Verfahren, das zum Entfernen von einem oder
mehreren Polypeptiden aus einer Polypeptidpopulation nützlich ist.
Zum Fraktionieren kann beispielsweise ein Zentrifugierschritt gehören, der
lösliche
von unlöslichen
Komponenten trennt, ein Elektrophoreseverfahren, ein Chromatographieverfahren
oder jedes der offenbarten Verfahren. Für die chromatographische Trennung
kann eine große
Vielfalt an im Fachgebiet gut bekannten chromatographischen Medien
zum Trennen von Polypeptidpopulationen verwendet werden. Polypeptide
können
beispielsweise auf der Grundlage von Größe, Ladung, Hydrophobie, Bindung
an bestimmte Farbstoffe und andere Gruppierungen, einschließlich Affinitätsliganden,
die mit chromatographischen Medien assoziiert sind, getrennt werden.
Harze für
den Größenausschluss,
die Gelfiltration und die Gelpermeation sind für die Polypeptidtrennung auf
Grundlage der Größe nützlich.
Beispiele für
chromatographische Medien für
eine Trennung auf Ladungsbasis sind starke und schwache Anionenaustausch-
sowie starke und schwache Kationenaustauschharze. Hydrophobe oder
Umkehrphasenchromatographie können
ebenfalls verwendet werden.
-
Auch
die Affinitätschromatographie
kann verwendet werden, einschließlich Farbstoff bindender Harze, wie
Cibacron Blau, Substratanaloge, einschließlich Analoger von Cofaktoren,
wie ATP, NAD und dergleichen, Liganden, spezifischer Antikörper, entweder
polyklonal oder monoklonal, und dergleichen. Ein beispielhaftes Affinitätsharz umfasst
die Affinitätsharze,
die an spezifische Gruppierungen binden, welche in ein Polypeptid eingearbeitet
werden können,
wie Avidinharz, das an ein Biotintag auf einem Polypeptid bindet,
wie hier offenbart. Die Auflösung
und die Kapazität
eines bestimmten chromatographischen Mediums sind im Fachgebiet bekannt
und können
von Fachleuten bestimmt werden. Die Nützlichkeit einer bestimmten
chromatographischen Trennung für
eine bestimmte Anwendung kann auf ähnliche Weise von Fachleuten
beurteilt werden.
-
Fachleute
können
die passenden Chromatographiebedingungen für eine bestimmte Probengröße oder
-zusammensetzung bestimmen und wissen, wie wiederholfähige Ergebnisse
für chromatographische Trennungen
bei Festlegung von Puffer, Säulenabmessungen,
Durchflussgeschwindigkeit, Temperatur und anderen Bedingungen erhalten
werden können.
Proteinfraktionierverfahren können
wahlweise die Verwendung eines internen Standards umfassen, beispielsweise
zur Beurteilung der Wiederholfähigkeit
einer bestimmten chromatographischen Anwendung oder eines anderen
Fraktionierschritts. Passende interne Standards variieren und sind
von dem chromatographischen Medium oder Fraktionierschritt abhängig. Fachleute
können
einen internen Standard, der für
ein Chromatographieverfahren oder einen Fraktionierschritt geeignet
ist, festlegen.
-
Zur
Reduzierung der Komplexität
einer Polypeptidprobe für
die Verfahren der bevorzugten Ausführungsform ist das Markieren
von Polypeptiden nützlich
und stellt eine Beschränkung
für eine
Datenbankabfrage dar und ermöglicht
quantitative Polypeptidvergleiche. Die Komplexität einer Polypeptidprobe kann
durch Markieren eines Polypeptids mit einem Affinitätstag reduziert
werden, der zur Isolierung einer Subpopulation von Polypeptiden,
die dieses Tag. enthält,
verwendet werden kann. Eine Population aus Polypeptiden und Fragmenten
kann beispielsweise an einer verhältnismäßig seltenen Aminosäure, wie
Cystein, oder auf der Grundlage einer posttranslationalen Modifikation
markiert und eine Subpopulation aus Polypeptiden und Fragmenten,
die dieses Tag enthalten, kann isoliert werden. Die Subpopulation
an Polypeptiden und Fragmenten, die durch Markieren einer bestimmten
Aminosäure
isoliert wurde, enthält
somit eine bekannte Aminosäure. Wie
hierin beschrieben, stellt eine bekannte Aminosäure eine partielle Aminosäurezusammensetzung
dar, die zur Beschränkung
einer Datenbankabfrage nützlich
ist. Mittels unterschiedlicher Markierung zweier Polypeptide oder
Polypeptidpopulationen können
quantitative Polypeptidvergleiche vorgenommen werden. Ein ICATTM-artiges
Affinitätsreagenz
oder ein IDEnT-artiges Reagenz, die nachstehend ausführlicher
besprochen werden, sind für
diesen Zweck besonders nützlich,
es kann jedoch auch jedes andere Verfahren zum Markieren von Polypeptiden
auf ähnliche
Weise für
Polypeptidvergleiche angewandt werden.
-
Das
Markieren von Polypeptiden kann unter Verwendung einer Vielfalt
von im Fachgebiet bekannten Verfahren durchgeführt werden. Ein Reagenz zum
Markieren oder Modifizieren von Polypeptiden kann verschiedene Komponenten
enthalten, die durch Linker-Regionen voneinander getrennt sind.
Komponenten eines Reagenz zum Markieren von Polypeptiden können eine
reaktive Gruppe umfassen, die eine spezifische chemische Gruppe
eines Polypeptids modifiziert, eine Gruppierung, die beispielsweise
mittels Massenspektrometrie erfasst werden kann, und ein Affinitätstag, das
zur Isolierung des Polypeptids verwendet wird. Nachstehend sind
zwei Beispiele für
Reagenzien zum Markieren von Polypeptiden, ICATTM-artig
und IDEnT, ausführlich
beschrieben, es kann jedoch, falls erwünscht, jede andere Art von
Polypeptidtag verwendet werden.
-
Die
Verfahren für
den quantitativen Vergleich zweier Polypeptidpopulationen können die
Verwendung eines Isotope coded Affinity Tag-artigen (ICATTM) Verfahrens beinhalten (Gygi et al., Nature
Biotechnol. 17: 994–999
(1999); WO 00/11208) umfassen. Ein ICATTM-artiges
Reagenz kann darüber
hinaus für
Anwendungen zum Markieren von Polypeptiden nützlich sein, die keinen quantitativen
Vergleich beinhalten. Das Verfahren mit einem ICATTM-artigen
Reagenz verwendet ein Affinitätstag,
das differenziell mit einem Isotop markiert ist, welches sich problemlos
unter Verwendung der Massenspektrometrie unterscheiden lässt, wie
Wasserstoff und Deuterium. Das ICATTM-artige
Affinitätsreagenz
besteht aus drei Elementen, einem Affinitätstag, einem Linker und einer
reaktiven Gruppe.
-
Ein
Element des ICATTM-artigen Affinitätsreagenz
ist ein Affinitätstag,
das eine Isolierung von Peptiden ermöglicht, welche durch Binden
an einen spezifischen Bindungspartner des Affinitätstags an
das Affinitätstag gekoppelt
sind. Ein besonders nützliches
Affinitätstag
ist Biotin, das mit hoher Affinität an seinen spezifischen Bindungspartner
Avidin oder verwandte Moleküle,
wie Streptavidin, bindet und somit gegenüber weiteren biochemischen
Manipulationen stabil ist. Es kann jedes beliebige Affinitätstag verwendet
werden, solange eine ausreichende Bindungsaffinität mit dem
spezifischen Bindungspartner besteht, die eine Isolierung von Peptiden
ermöglicht,
welche an das ICATTM-artige Affinitätsreagenz
gekoppelt sind. Ein Affinitätstag
kann auch zur Isolierung eines markierten Peptids mit magnetischen
Kügelchen
oder einem anderen magnetischen Format, das zur Isolierung eines magnetischen
Affinitätstags
geeignet ist, verwendet werden. Bei Verfahren mit einem ICATTM-artigen Reagenz oder jedem anderen Verfahren
zur Affinitätsmarkierung
eines Peptids kann ein kovalentes Abfangen dazu verwendet werden,
die markierten Peptide, falls erwünscht, an einen festen Träger zu binden.
-
Ein
zweites Element des ICATTM-artigen Affinitätsreagenz
ist ein Linker, der in ein stabiles Isotop eingearbeitet werden
kann. Der Linker hat eine Länge,
die ausreicht, um das Binden der reaktiven Gruppe an ein Polypeptid
des Spezimens und das Binden des Affinitätstags an den spezifischen
Bindungspartner zu ermöglichen.
Der Linker weist auch eine Zusammensetzung auf, die geeignet ist,
die Einarbeitung eines stabilen Isotops an einem oder mehreren Atomen
zu ermöglichen.
Ein besonders nützliches
stabiles Isotopenpaar ist Wasserstoff und Deuterium, die unter Verwendung
der Massenspektrometrie problemlos als leichte bzw. schwere Form
unterscheidbar sind. In den Linker kann eine beliebige Anzahl isotoper
Atome eingearbeitet werden, solange die leichte und die schwere
Form unter Verwendung der Massenspektrometrie unterschieden werden
kann. Zu beispielhaften Linkern gehören der Linker auf der Grundlage
von 4,7,10-Trioxa-1,13-tridecandiamin und dessen verwandte deuterierte
Form, 2,2',3,3',11,11',12,12'-Octadeutero-4,7,10-trioxa-1,13-tridecandiamin, die
von Gygi et al. (supra, 1999) beschrieben sind. Der Fachmann kann
problemlos jeden beliebigen einer Anzahl an passenden Linker finden,
der in einem ICATTM-artigen Affinitätsreagenz,
das die vorstehend genannten Kriterien erfüllt, nützlich ist.
-
Das
dritte Element des ICATTM-artigen Affinitätsreagenz
ist eine reaktive Gruppe, die kovalent an ein Polypeptid des Spezimens
gekoppelt werden kann. Verfahren zur Modifizierung von Seitenkettenaminosäuren an
Polypeptiden sind Fachleuten gut bekannt (siehe beispielsweise Glazer
et al., Laboratory Techniques in Biochemistry and Molecular Biology:
Chemical Modification of Proteins, Kapitel 3, S. 68–120, Elsevier
Biomedical Press, New York (1975); Pierce Catalog (1994), Pierce,
Rockford IL). Jede beliebige einer Vielfalt von reaktiven Gruppen
kann in ein ICATTM-artiges Affinitätsreagenz eingearbeitet werden,
solange die reaktive Gruppe kovalent an ein Polypeptid gekoppelt
werden kann. Ein Polypeptid kann beispielsweise über eine für Sulfhydryl reaktive Gruppe,
die mit den freien Sulfhydrylen von Cystein reagiert oder Cystine
in einem Polypeptid reduziert, an ein ICATTM-artiges
Affinitätsreagenz
gekoppelt werden. Eine beispielhafte für Sulfhydryl reaktive Gruppe
umfasst eine Iodacetamidgruppe, wie bei Gygi et al. (supra, 1999)
beschrieben. Zu weiteren beispielhaften für Sulfhydryl reaktiven Gruppen
gehören
Maleinimide, Alkyl- und Arylhalogenide, α-Halogenacyle und Pyridyldisulfide.
Falls erwünscht,
können
die Polypeptide vor der Reaktion mit einem ICATTM-artigen
Affinitätsreagenz
reduziert werden, was dann besonders nützlich ist, wenn das ICATTM-artige Affinitätsreagenz eine für Sulfhydryl
reaktive Gruppe enthält.
-
Eine
reaktive Gruppe kann auch mit Aminen, wie beispielsweise Lys, Imidestern
und N-Hydroxysuccinimidylestern,
reagieren. Eine reaktive Gruppe kann auch mit Carboxylgruppen reagieren,
die in Asp oder Glu vorkommen, der die reaktive Gruppe kann mit
einer anderen Aminosäure,
wie His, Tyr, Arg und Met, reagieren. Eine reaktive Gruppe kann
auch mit einer Phosphatgruppe unter selektivem Markieren von Phosphopeptiden reagieren
oder mit anderen kovalent modifizierten Peptiden, einschließlich Glycopeptide,
Lipopeptide oder jeder beliebigen kovalenten hier offenbarten Polypeptidmodifikation.
Der Fachmann kann problemlos die Bedingungen für die Modifizierung von Molekülen des
Spezimens unter Verwendung verschiedener Reagenzien, Inkubationsbedingungen
und Inkubationszeiten bestimmen, mit denen optimale Bedingungen
für die
Modifizierung von Molekülen
des Spezimens zur Verwendung in den erfindungsgemäßen Verfahren
erhalten werden.
-
Das
Verfahren mit der ICATTM-artigen Reagenz
basiert auf der Derivatisierung eines Moleküls des Spezimens, wie eines
Polypeptids, mit einem ICATTM-artigen Reagenz.
Für den
Vergleich von zwei Proben und/oder für die Quantifizierung werden
ein Bezugsspezimen für
Kontrollzwecke und ein Spezimen von einem zu prüfenden Individuum unterschiedlich
mit der leichten und der schweren Form des ICATTM-artigen
Affinitätsreagenz
markiert. Die derivatisierten Spezimens werden vereinigt und die
derivatisierten Moleküle
zur Erzeugung von Fragmenten gespalten. Ein Polypeptidmolekül kann beispielsweise
enzymatisch mit einer oder mehreren Proteasen in Peptidfragmente
gespalten werden. Zu beispielhaften Proteasen, die beim Spalten
von Polypeptiden nützlich
sind, gehören
Trypsin, Chymotrypsin, Pepsin, Papain, Staphylococcus aureus (V8)
Protease und dergleichen. Polypeptide können auch chemisch, beispielsweise
unter Verwendung von CNBr, Säure oder
anderen chemischen Reagenzien, gespalten werden.
-
Nach
der Spaltung in Fragmente werden die mit dem ICATTM-artigen
Affinitätsreagenz
markierten Fragmente über
das Affinitätstag
isoliert, biotinylierte Fragmente können beispielsweise durch Bindung
an Avidin in einem Festphasen- oder Chromatographieformat isoliert
werden. Falls erwünscht,
können
die isolierten, markierten Fragment weiter unter Verwendung einer
oder mehrerer alternativer Trenntechniken, einschließlich Ionenaustausch-,
Umkehrphasen-, Größenausschluss-Affinitätschromatographie
und dergleichen, oder elektrophoretischer Verfahren, einschließlich Elektrofokussierung,
weiter fraktioniert werden. Die isolierten, markierten Fragmente
können
beispielsweise mittels Hochleistungs-Flüssigkeits- Chromatographie (HPLC), einschließlich Mikrokapillar-HPLC, fraktioniert
werden.
-
Die
Fragmente werden unter Verwendung von Massenspektrometrie (MS) analysiert.
Da die Moleküle des
Spezimens unterschiedlich mit leichten und schweren Affinitätstags markiert
sind, können
die Peptidfragmente mittels MS unterschieden werden, was einen SBS-Vergleich
der relativen Mengen jedes Peptidfragments des Bezugsspezimens zu
Kontrollzwecken und des Prüfspezimens
ermöglicht.
Falls erwünscht,
kann MS auch zur Sequenzanalyse der entsprechend markierten Peptide
verwendet werden, was eine Identifizierung von Molekülen ermöglicht,
die den markierten Peptidfragmenten entsprechen.
-
Ein
Vorteil des Verfahrens mit ICATTM-artigem
Reagenz ist, dass das mit der leichten und der schweren ICATTM-artigen
Reagenz markierte Peptidpaar chemisch identisch ist und somit als
gegenseitiger interner Standard für eine genaue Quantifizierung
dient (Gygi et al., supra, 1999). Mit MS stellen die Intensitätsverhältnisse
der Komponenten mit der geringer und hoher Masse der Paare mit schwer
und leicht markierten Fragmenten ein präzises Maß der verhältnismäßigen Häufigkeit der Peptidfragmente
dar. Somit kann das Verfahren mit ICATTM-artigem
Reagenz, falls erwünscht,
zweckmäßig zur
Identifizierung von unterschiedlich exprimierten Polypeptiden verwendet
werden.
-
Ein
IDEnT-Reagenz kann zur Modifizierung eines Polypeptids durch Einführen eines
isotopischen Tags an einer speziellen funktionellen Proteingruppe
verwendet werden. Ein beispielhaftes IDEnT-Reagenz ist bei Goodlett
et al., supra, 2000, beschrieben. Ein IDEnT-Reagenz enthält mindestens ein Element mit
einer Isotopenverteilung, die in einem Massenspektrometer eine einmalige
Signatur schafft. Ein IDEnT-Reagenz kann beispielsweise Chlor, Deuterium
oder ein anderes Element, einschließlich eines radioaktiven Elements, enthalten.
Ein IDEnT-Reagenz kann so entwickelt sein, dass es an eine Aminosäure eines
Polypeptids mit geringer Häufigkeit,
wie Cystein, bindet. Das Markieren eines Polypeptids mit einem IDEnT-Tag
kann auf die Verfahren angewendet werden, indem eine Beschränkung für die Abfrage
eines Polypeptididentifizierungsindex mit Massen von Polypeptidfragmenten
bereitgestellt wird.
-
Die
Proteinspaltung oder -fragmentierung ist für die Verfahren nützlich,
da sie eine Beschränkung
der Datenbankabfrage darstellt. Die Polypeptidfragmentation kann
sequenzspezifisch oder nicht sequenzspezifisch sein. Eine sequenzspezifische
Polypeptidspaltung hält
den Vorteil bereit, dass Polypeptidfragmente erhalten werden, die
bekannte Aminosäuren
enthalten, was als Beschränkung
bei der Datenbankabfrage verwendet werden kann. Zu Beispielen für Reagenzien,
die bei der Durchführung
einer nicht spezifischen Polypeptidspaltung nützlich sind, gehören Papain,
Pepsin und Protease Sg. Diese Proteasen können dazu verwendet werden,
einen erwünschten
Proteinfragmentierungsgrad zu erreichen, wie beispielsweise die
Erzeugung von etwa zwei bis vier Polypeptidfragmenten aus einem
Polypeptid, indem die Reaktionsbedingungen geändert werden. Bedingungen für die Verwendung
dieser Proteasen sind im Fachgebiet gut bekannt. Zu Beispielen für Reagenzien,
die für
die Durchführung
einer sequenzspezifischen Polypeptidspaltung nützlich sind, gehören Trypsin,
V-8-Protease, o-Iodosobenzoesäure, Cyanogenbromid
und Säure.
-
Die
bevorzugte Ausführungsform
stellt auch einen Polypeptididentifizierungsindex zur Identifizierung eines
Polypeptids in einer Population von Polypeptiden bereit. Der Index
umfasst eine annotierte Gruppe an Charakteristika, die mit Polypeptiden
des Index assoziiert sind, wobei eines der Charakteristika die Masse
eines Fragments des Polypeptids ist, wobei die Fragmentmasse mithilfe
der Massenspektrometrie in Abwesenheit von Ionenselektion zur Erzeugung
von Fragment-Ionen bestimmt wird. Die Charakteristika reichen aus, um
eines der Polypeptide von den anderen Polypeptiden im Index zu unterscheiden.
Ein Polypeptididentifizierungsindex kann Charakteristika für 2 oder
mehr, 3 oder mehr, 5 oder mehr, 10 oder mehr, 20 oder mehr, 50 oder
mehr, 100 oder mehr, 150 oder mehr, 200 oder mehr, 500 oder mehr,
1000 oder mehr, 2000 oder mehr, 5000 oder mehr oder sogar 10.000
oder mehr Polypeptide umfassen. Ein Polypeptididentifizierungsindex
kann auch im Wesentlichen alle Polypeptide einer Probe umfassen.
Ein Polypeptididentifizierungsindex kann beispielsweise im Wesentlichen
alle die Polypeptide umfassen, die in einem Genom, wie einem viralen,
bakteriellen, pflanzlichen oder tierischen Genom, einschließlich eines
Säugetiergenoms,
wie eines Genoms von einem Menschen, nicht humanen Primaten, einer
Maus, einer Ratte, eines Rinds, einer Ziege, eines Kaninchens oder
anderen Säugetierarten,
exprimiert werden. Die Anzahl an Polypeptiden in einem Polypeptididentifizierungsindex
ist von den Bedürfnissen
des Anwenders abhängig
und schwankt in Abhängigkeit
vom Ursprung der Probe, die zur Identifizierung von Polypeptiden
verwendet werden soll, und der Komplexität der Polypeptidexpression
in der Probe. Ein Beispiel für
die Erzeugung eines Polypeptididentifizierungsindex für Drosophila melanogaster
ist hier offenbart (siehe Beispiel V).
-
Der
Polypeptididentifizierungsindex kann, nach Wunsch, auf einen gesamten
Organismus oder auf bestimmte Gewebe oder Zellen im Organismus oder
auf spezifische subzelluläre
Fraktionen, beispielsweise Organellen, bezogen sein. Demzufolge
kann ein Polypeptididentifizierungsindex, der auf ein bestimmtes Target bezogen
ist, wie einen Organismus, ein Gewebe, eine Zelle oder eine subzelluläre Fraktion, ähnlich wie
bei der Reduzierung der Komplexität, die bei einer zu prüfenden Probe
angewendet wird, zur Vereinfachung der Suche nach der Identifikation
eines bestimmten Polypeptids bei einer bestimmten Anwendung nützlich sein. Beispielsweise
kann in einer bestimmten Diagnoseanwendung, bei der die Expression
eines bestimmten Polypeptids oder einer Gruppe von Polypeptiden
oder der Umfang der Expression der Polypeptide mit einer bestimmten
Bedingung, wie einem Krankheitszustand, korreliert, ein auf ein
bestimmtes Target bezogener Polypeptididentifizierungsindex verwendet
werden. Wenn beispielsweise bekannt ist, dass eine Gruppe von Kernproteinen
in einer Krebszelle überexprimiert
wird, kann die Verwendung eines Polypeptididentifizierungsindex, der
auf Kernproteine bezogen ist, zur Prüfung der Überexpression von Kernproteinen
in einer Probe eines Individuums mithilfe der hier offenbarten quantitativen
Verfahren verwendet werden. Außerdem
kann die Erzeugung eines Target-Polypeptididentifizierungsindex
und ein Vergleich mit einer einschlägigen krankhaften Probe zur
Identifizierung von aberrant exprimierten Polypeptiden verwendet
werden, was wiederum, wie hier offenbart, in Diagnoseanwendungen
Verwendung findet.
-
Die
bevorzugte Ausführungsform
stellt darüber
hinaus einen Polypeptididentifizierungsindex bereit, der eine annotierte
Gruppe an Charakteristika, die mit Polypeptiden des Index assoziiert
sind, umfasst, welche zwei oder mehr Charakteristika umfasst, die
mit Polypeptiden des Index oder einem Fragment davon assoziiert sind,
wobei eines der Charakteristika die Masse eines Fragments des Polypeptids
ist, wobei die Fragmentmasse mithilfe der Massenspektrometrie in
Abwesenheit von Ionenselektion zur Erzeugung von Fragment-Ionen bestimmt
wird, und wobei die Masse mit einer Genauigkeit in ppm von mehr
als 1 ppm bestimmt wird.
-
Falls
erwünscht,
kann der Polypeptididentifizierungsindex zweckmäßig auf einem elektronisch
lesbaren Medium gespeichert sein. Demgemäß stellt die bevorzugte Ausführungsform
ein elektronisch lesbares Medium bereit, das einen Polypeptididentifizierungsindex,
beispielsweise einen annotierten Polypeptidindex, umfasst. Ein derartiges
elektronisch lesbares Medium, das einen Polypeptididentifizierungsindex
umfasst, ist für den
Vergleich der Charakteristika eines Polypeptids mit dem Polypeptididentifizierungsindex
nützlich,
der zweckmäßig mit
einer Computervorrichtung durchgeführt werden kann. Die Verwendung
einer Computervorrichtung ist zweckmäßig, da ein Polypeptididentifizierungsindex
zweckmäßig darauf
gespeichert werden kann und für
Vergleiche mit Charakteristika und/oder quantitativen Mengen eines
Polypeptids in einer Probe zugänglich
ist. Ein Polypeptididentifizierungsindex kann zweckmäßig unter
Verwendung geeigneter Hardware, Software und/oder Netzwerke, beispielsweise
unter Verwendung von Hardware, die an Netzwerke, einschließlich des
Internets, angeschlossen sein kann, zugänglich sein.
-
Unter
Verwendung von verschiedenen Hardware-, Software- und Netzwerkkombinationen können die Verfahren
der bevorzugten Ausführungsform,
einschließlich
des Schritts des Vergleichens der für ein Polypeptid bestimmten
Charakteristika mit einem Polypeptididentifizierungsindex, zweckmäßig in einer
Vielfalt von Konfigurationen durchgeführt werden. Demzufolge stellt
eine bevorzugte Ausführungsform
zusätzlich
eine Computervorrichtung zur Durchführung von elektronisch ausführbaren
Schritten bereit, die Verfahrensschritten entsprechen. Eine einzige
Computervorrichtung kann beispielsweise Anweisungen zur Durchführung des
bzw. der elektronisch ausführbaren Schritts(e)
des Vergleichens von für
ein Polypeptid bestimmten Charakteristika mit einem Polypeptididentifizierungsindex,
einen Polypeptididentifizierungsindex und Anweisungen zur Bestimmung,
ob die für
das Polypeptid bestimmten Charakteristika einem oder mehreren Polypeptiden
des Polypeptididentifizierungsindex entsprechen, enthalten.
-
Alternativ
kann die Computervorrichtung Anweisungen zur Durchführung der
Schritte eines bevorzugten Verfahrens enthalten, wohingegen der
Polypeptididentifizierungsindex auf einem getrennten Medium gespeichert
ist. Ferner können
Anweisungen zur Bestimmung, ob ein Polypeptid einem oder mehreren
Polypeptiden des Polypeptididentifizierungsindex entspricht, auf
einer getrennten Computervorrichtung oder einem getrennten Medium
enthalten oder mit der Computervorrichtung verbunden sein, die die
elektronisch ausführbaren
Schritte des Verfahrens und/oder die Datenbank auf einem getrennten
Medium enthält.
Ein derartiges elektronisch lesbares Medium kann eine andere Computervorrichtung,
ein Speichermedium, wie eine Diskette, eine Zip-Diskette oder ein
Server, wie ein Fileserver, sein, auf die bzw. den über eine
Trägerwelle,
wie eine elektromagnetische Trägerwelle
zugegriffen werden kann. Somit kann über ein Netzwerk, wie das Internet,
ein Fernzugriff auf eine Computervorrichtung, die einen Polypeptididentifizierungsindex
enthält,
oder einen Fileserver, auf der der Polypeptididentifizierungsindex
gespeichert ist, erfolgen. Der Fachmann kennt geeignete Hardware-,
Software- oder Netzwerkschnittstellen, die eine Kopplung mit einer
erfindungsgemäßen Computervorrichtung
zulassen, oder kann diese problemlos bestimmen.
-
Falls
erwünscht,
können
Algorithmen zur Optimierung und Verbesserung der Leistungsfähigkeit
bei der Identifizierung eines Polypeptids unter Verwendung eines
Polypeptididentifizierungsindex verwendet werden. Beispielsweise
kann, wie vorstehend beschrieben, ein Subindex eines Polypeptididentifizierungsindex bestimmt
und der Subindex durch Verkleinerung der Größe der Vergleichsdatenbank
zur weiteren Identifizierung eines Polypeptids verwendet werden.
Eine derartige Verkleinerung mithilfe eines Subindex stellt eine
Beschränkung
dar, die die Rechenzeit für
die Datenabfrage verkürzt.
Der Fachmann kennt verschiedene Verfahren zur Erhöhung der
Leistungsfähigkeit
der Datenbankabfrage.
-
Zur
Verbesserung der Analyse der Massenspektraldaten kann ein Algorithmus
verwendet werden. Die Gegenwart von Komplementärionen in einem Tandem-Massenspektrum
kann zur Entwicklung von Algorithmen verwendet werden, um die Masse
des parentalen Ions genauer zu bestimmen. Damit wird durch Einschränken der
Toleranz der Peptidmasse auf eine kleinere Untergruppe isobarer
Datenbankpeptide die Bewertung verbessert und die Suchzeit verkürzt. Zur
Erhöhung
der Proteomdeckung kann ein ESI-MS/MS mit Ionenfallen durchgeführt werden,
sodass explizite Bestimmungen des Peptidlandungszustands ausgeschlossen sind,
wodurch alle Tandem-Massenspektren von Peptiden zweimal, als [M
+ 2H]2+ und [M + 3H]3+, abgefragt werden müssen. Der die beste Bewertung
ergebende Ladungszustand wird bewahrt, der andere verworfen. Zur
Erhöhung
des Durchsatzes kann ein Algorithmus zur Bestimmung des Ladungszustands
vor der Datenbankabfrage verwendet werden. Damit sich Spektren vor
und nach der Datenbankabfrage katalogisieren lassen, kann ein Programm
zum Messen der Spektralqualität
verwendet werden. Damit wird, wie hier offenbart, durch Verwerfen
schlechter Spektren vor der Suche und die Möglichkeit einer Follow-up-Analyse
mit Spektren "guter
Qualität", die aber möglicherweise
aufgrund unerwarteter posttranslationaler Modifikationen versagten, der Durchsatz
zur Erzeugung eines guten Datenbankabgleichs erhöht.
-
BEISPIEL I
-
Erzeugung
eines annotierten Polypeptidindex
-
In
diesem Beispiel ist die Erzeugung eines annotierten Polypeptidindex
und die Verwendung des annotierten Polypeptidindex zur Identifizierung
eines Polypeptids in einer Probe beschrieben.
-
Die
Elemente eines annotierten Polypeptidindex (AP), der auch als ein
annotierter Peptidtagindex (APT) oder -datenbank bezeichnet wird,
sind die Sequenzen im Wesentlichen aller Peptide oder ausgewählter Peptide
mit spezifischen Strukturmerkmalen, die durch eine sequenzspezifische
chemische oder enzymatische Fragmentierung der Proteine, die von
der zu untersuchenden Art, Zelle oder Gewebe produziert werden, erzeugt
werden. Jedes Peptid wird anhand von Attributen oder Charakteristika
annotiert, die einfach experimentell bestimmt werden und die die
unzweideutige Korrelation zwischen dem annotierten Peptid und dem Protein,
von dem das Peptid stammt, ermöglichen.
-
Die
Erzeugung eines beispielhaften AP-Index kann die folgenden spezifischen
Schritte beinhalten: Ernten von Proteinen; Markieren der Proteine
mit einem Isotope coded Affinity Tag-artigen (ICATTM)
Reagenz; Fraktionieren der Proteine über das Molekulargewicht; Spalten
der Proteine mit einer Protease, beispielsweise Trypsin, zur Erzeugung
von Peptiden; Trennen der Peptide mittels Chromatographie, beispielsweise
Ionenaustauschchromatographie; Reinigen jeder Ionenaustauschfraktion
mittels Affinitätschromatographie,
beispielsweise auf der Grundlage eines ICATTM-artigen
Affinitätstags;
Analyse jeder Affinitätschromatographiefraktion mittels LC/MS/MS
oder CE/MS/MS; Identifizieren im Wesentlichen aller exprimierten
Proteine mittels einer Datenbankabfrage der einzelnen MS/MS-Peptidspektren
und Erzeugen einer Datenbank mit annotierten Peptidtags, die einen
eindeutigen Strichcode eines individuellen Peptids basierend auf
gemessenen physikalisch-chemischen
Eigenschaften und somit des parentalen Proteins des Peptids darstellen.
-
Der
AP-Index kann wie folgt erzeugt werden: (i) Vorbereitung der Proteinprobe;
(ii) Proteinmarkierung; (iii) wahlweise Proteinfraktionierung; (iv)
Proteinfragmentierung; (v) Peptidtrennung; (vi) Affinitätsisolierung
der markierten Polypeptide; (vii) hochauflösende Peptidtrennung; (viii)
Datenbankabfrage und (ix) Erstellung des AP-Index (APT-Datenbank).
- (i) Vorbereitung der Proteinprobe. Proteinproben,
mit denen eine quantitative Proteomanalyse durchgeführt werden
soll, beispielsweise Zellen, Gewebe, subzelluläre Fraktionen, Körperflüssigkeiten,
Zellausscheidungen und dergleichen, werden unter Verwendung von
Standardprotokollen für
die Erhaltung der Solubilität
der Proteine aus den jeweiligen Ursprungsorten isoliert.
- (ii) Proteinmarkierung. Die Proteine der Proben werden vollständig denaturiert,
reduziert und alle die Sulfhydrylgruppen, die die Seitenketten reduzierter
Cysteinreste darstellen, werden kovalent mit der leichten bzw. schweren
Form von für
Sulfhydryl spezifischen ICATTM-artigen Reagenzien
unter den vorstehend beschriebenen Bedingungen derivatisiert (Gygi
et al., Nature Biotechnol. 17: 994–999 (1999)) (siehe 3). Die
Cysteinmarkierung ist zwar eine besonders nützliche Durchführung des
Verfahrens, es kann jedoch jede andere chemische Reaktion, die für eine chemische
Gruppe des Proteins spezifisch ist, angewendet werden.
- (iii) Wahlweise Proteinfraktionierung. Die Mischung aus markierten
Proteinen wird unter Verwendung eines beliebigen bekannten üblichen
Proteintrennverfahrens fraktioniert. Das angewendete Verfahren ist
wiederholfähig,
hält die
Proteine in Lösung
und weist eine hohe Probenkapazität auf. Ein besonders nützliches Verfahren
ist die präparative
Natriumdodecylsulfate-Polyacrylamid-Gelelektrophorese
(SDS-PAGE).
- (iv) Proteinfragmentierung. Die Proteine der Probenmischung
oder die Proteine, die in jeder Fraktion enthalten sind, sofern
eine fakultative Probenfraktionierung verwendet wird, werden einer
sequenzspezifischen Spaltung unterworfen. Ein besonders nützliches
Verfahren ist die Proteasespaltung, beispielsweise mit Trypsin.
- (v) Peptidtrennung. Die gebildeten Peptidmischungen werden einer
Peptidtrennung der ersten Dimension unterworfen. Das Verfahren zur
Peptidtrennung weist, ungeachtet der Komplexität der angewendeten Proben,
eine hohe Probenkapazität,
eine mindestens mäßige Auflösung auf
und erzeugt hoch wiederholfähige Trennmuster.
Ein besonders nützliches
Trennverfahren der ersten Dimension ist die Ionenaustauschchromatographie,
wie der Kationen- oder Anionenaustausch.
- (vi) Affinitätsisolierung
der markierten Polypeptide. Aus jeder chromatographischen Fraktion
werden die mit dem ICATTM-artigen Reagenz
markierten Peptide, beispielsweise cysteinhaltige Peptide, oder
Peptide, die eine andere Aminosäure
oder posttranslationale Modifikation enthalten, die affinitätsmarkiert
werden kann, unter Verwendung von Avidin- oder Streptavidin-Affinitätschromatographie
isoliert. Ein besonders nützliches
Affinitätsmedium
ist monomeres Avidin, das auf Polymerkügelchen immobilisiert wurde.
Wenn ICATTM-artige Reagenzien verwendet werden,
deren Affinitätstags
von Biotin verschieden sind, wird ein dem verwendeten Tag entsprechendes
Affinitätsmedium
verwendet.
- (vii) Hochauflösende
Peptidtrennung. Ein besonders nützliches
Verfahren für
eine hochauflösende
Peptidtrennung ist die Flüssigkeitschromatographie-ESI-MS/MS. Die Peptidmischungen,
die aus den Affinitätschromatographiesäulen eluiert
wurden, werden mittels automatisierter LC-MS/MS unter Verwendung
von Kapillar-Umkehrphasenchromatographie als Trennverfahren (Yates
et al., Methods Mol. Biol. 112: 553–569 (1999)) und datenabhängiger CID
mit dynamischem Ausschluss (Goodlett et al., Anal. Chem. 15: 1112–1118 (2000))
als Massenspektrometrieverfahren individuell analysiert.
- (viii) Datenbankabfrage. Die Sequenzen aller Peptide, für die geeignete
CID-Spektren erhalten wurden, wird durch Abfragen einer Sequenzdatenbank
der zu untersuchenden Art bestimmt. Eine besonders nützliche
Sequenzdatenbank ist eine Datenbank, die im Wesentlichen alle Proteinsequenzen
enthält,
die potenziell von der zu untersuchenden Art exprimiert werden können. Ein
verwendbares Suchprogramm für
Sequenzdatenbanken ist das Programm SEQUEST (Eng, J. et al., J.
Am. Soc. Mass. Spectrom. 5: 976–989, (1994))
oder ein Programm mit ähnlichen
Funktionen.
- (ix) Erstellung des AP-Index (APT-Datenbank). Die Sequenzen
aller Peptide, die mittels des vorstehend beschriebenen Verfahrens
identifiziert wurden, werden in eine Datenbank eingegeben und mit
den Charakteristika oder Attributen, die in den Schritten (i)–(viii)
erzeugt wurden, versehen. Diese Charakteristika oder Attribute können, ohne
darauf beschränkt
zu sein, Folgendes umfassen: die partielle Aminosäurezusammensetzung
(wie die Gegenwart eines Cysteinrests in jedem selektierten Peptid;
siehe Goodlett et al., supra, 2000); die ungefähre Molekülmasse des parentalen Proteins
(wie mittels der fakultativen SDS-PAGE-Fraktionierung bestimmt);
die Reihenfolge der Elution oder die Elutionszeit an der Ionenaustauschsäule; die
Elutionszeit an der Umkehrphasensäule und jedes andere bestimmte
Charakteristikum. Gemeinsam sind die Attribute für jedes Peptid in der Datenbank
einmalig und kommen damit einem Strichcode jedes Peptids gleich.
Wenn für
Peptide, die in anschließenden
Versuchen erzeugt werden, derselbe Strichcode bestimmt wird, werden
diese somit eindeutig durch Korrelation der Strichcodes, die beim
Versuch erzeugt wurden, mit den im AP-Index (der APT-Datenbank)
vorhandenen Strichcodes als die beim Versuch erzeugten Peptide identifiziert.
-
Für die Korrelation
von Polypeptiden mit dem AP-Index (der APT-Datenbank) werden die
Peptidproben, die mittels der vorstehend beschriebenen Verfahren
für die
quantitative Proteomanalyse erzeugt wurden, genauso wie die für den AP-Index
(die APT-Datenbank) erzeugten Peptide, jedoch mit folgenden Ausnahmen erzeugt,
behandelt und verarbeitet. (i) Die zu vergleichenden Proteine in
den zwei (oder mehr) Proben werden mit unterschiedlich isotopenmarkierten
ICATTM-artigen Reagenzien markiert. In diesem
Schritt können
zwei oder mehr chemisch identische, aber unterschiedlich isotopenmarkierte
ICATTM-artige Reagenzien verwendet werden.
(ii) Die erzeugten Peptide werden anstatt mit MS/MS nur mittels
einer einstufigen Massenspektrometrie untersucht. Massenanalysatoren
haben im Allgemeinen eine hohe Massengenauigkeit, eine hohe Empfindlichkeit
und eine hohe Massenauflösung.
Zu Instrumenten mit diesen Charakteristika gehören, ohne darauf beschränkt zu sein,
MALDI-TOF-Massenspektrometer, ESI-TOF-Massenspektrometer und Fourier-Transformations-Ionenzyklotron-Massenanalysatoren
(FT-ICR-MS). Die Attribute, die mittels dieses Verfahrens für jedes
Peptid bestimmt wurden (alle Attribute oder eine Auswahl davon werden
wie vorstehend beschrieben bestimmt), werden in einen Strichcode
für jedes
Peptid umgewandelt und der experimentell bestimmte Strichcode wird
mit den Strichcodes des AP-Index (der APT-Datenbank) korreliert, was zu einer
unzweideutigen Identifizierung des Peptids und damit des Proteins,
aus dem das Peptid stammt, führt.
Anschließend
werden die Massenspektren auf Paare von Peptid-Ionen untersucht,
die während
des gesamten Vorgangs gemeinsam fraktioniert wurden und die einen
Massenunterschied aufweisen, der genau dem von dem ICATTM-artigen
Reagenz kodierten Massenunterschied entspricht. Die relative Signalstärke der
beiden Peaks gibt die relative Häufigkeit
der Peptide und damit die relative Häufigkeit der entsprechenden
parentalen Proteine an, die anfänglich
in der Probe vorhanden waren. Folglich ermöglicht die Korrelation der
experimentell bestimmten Daten mit dem AP-Index (der APT-Datenbank)
die Quantifizierung und Identifizierung der Proteine in den analysierten
Proben.
-
BEISPIEL II
-
Erzeugung
eines annotierten Polypeptidindex für Hefe
-
In
diesem Beispiel ist die Erzeugung eines annotierten Polypeptidindex
für Hefe
beschrieben.
-
Es
wurde geschätzt,
dass bei der Empfindlichkeit derzeitiger Massenspektrometer für die Erfassung von
Proteinen mit geringer Häufigkeit
mittels des LC/LC/MS/MS-Verfahrens (Gygi et al., Proc. Natl. Acad.
Sci. USA 97: 9390–9395
(2000)) mindestens 5 mg Gesamtprotein erforderlich sind und diese
Menge wurde experimentell im Wesentlichen bestätigt. Gygi et al., supra, 2000,
zeigten auch, dass das "Speicher-Verfahren" für die Erfassung
von Proteinen mit geringer Häufigkeit
ausreicht und eine ausreichende Probenkapazität aufweist, um die verhältnismäßig großen Mengen
der Gesamtprobe zu verarbeiten.
-
Für die Erstellung
der Datenbank wird folgendes Verfahren verwendet. Für die Proteinmarkierung
wird eine Proteinprobe in 0,5% SDS, 50 mM Tris, pH 8,3, 5 mM Ethylendiamintetraessigsäure (EDTA)
mit einer Proteinkonzentration von 5 mg/ml erzeugt. Insgesamt werden
25 mg Gesamthefeprotein verwendet. Sobald die Proteine gelöst sind,
wird die SDS-Konzentration durch Verdünnen der Probe 1:10 mit Wasser
und Zugabe von EDTA zur Erhaltung einer EDTA-Konzentration von 5
mM verdünnt.
Die Endkonzentration beträgt
0,05% SDS, 5 mM Tris, 5 mM EDTA. Die Proben wird dann 3–5 min lang
bei 100°C
gekocht und anschließend
abgekühlt. Die
Reduzierung der Disulfidbindungen wird durch Zugabe von ausreichend
Tributylphosphin (TBP) für
einen 5 mM-Gehalt
in der Probenlösung
erreicht. Dem folgt eine 30 min lange Inkubation der Probe bei 37°C. Zu der reduzierten
Probe wird das Alkylierungsreagenz (beispielsweise ein ICATTM-artiges Reagenz) mit etwa 5-fach molarem Überschuss
im Verhältnis
zu den in der Proben vorhandenen SH-Gruppen gegeben. Die Alkylierungsreaktion
läuft 90
min lang in Dunkelheit ab.
-
Für die Proteintrennung
wird die reduzierte und alkylierte Probe mit 0,2 Volumenanteilen
des 5 × SDS-Gelprobenpuffers
angereichert und 5 min lang gekocht. Die abgekühlte Probe wird dann auf ein
präparatives
SDS-Gel mit den Abmessungen 20 cm × 20 cm × 1,5 mm aufgebracht. Nach
der Elektrophorese wird das Gel senkrecht zur Elektrophoresendimension
in 10 Streifen gleicher Größe geschnitten.
Diese Streifen stellen 10 Größenspeicher
der intakten Proteine dar. Die Proteine in den Gelstreifen werden
dann unter Verwendung von Standardprotokollen einer Spaltung im
Gel unterworfen.
-
Für die Peptidtrennung
werden die aus den Gelscheiben extrahierten Peptide drei aufeinander
folgenden chromatographischen Trennungen unterworfen. Zuerst werden
sie mittels Kationenaustauschchromatographie getrennt. Dann werden
die biotinylierten Peptide mittels Avidin-Chromatographie isoliert.
Schließlich werden
die Peptide mittels Kapillar-Umkehrphasenchromatographie
weiter fraktioniert.
-
Für die Kationenaustauschchromatographie
wird eine Kationenaustausch-HPLC-Säule verwendet (PolyLC Inc.,
Columbia MD; 2,1 mm × 20
cm, Teilchengröße 5 μm, Porengröße 300 Å, stark
saures Kationenaustauschmaterial Polysulfoethyl A). Es wurden die
folgenden Puffer verwendet: Puffer A, 10 mM KH2PO4, 25% CH3CN, pH
3,0; Puffer B, 10 mM KH2PO4,
25% CH3CN, 350 mM KCl, pH 3,0. Es wurde
der folgende Gradient verwendet:
-
-
Die
Durchflussrate beträgt
200 μl pro
Minute. Fraktionen werden in Zeitabständen von 1–2 Minuten gesammelt. Die Säule wird
mit Mengen von etwa 200 Mikrogramm bis zu etwa 5 mg gespaltenem,
ICATTM-markiertem
Gesamtprotein, üblicherweise
mit 2 ml-Probenschleifen,
beladen. Wichtig ist, die Proben vor dem Beladen der Kationenaustauschsäule auf
pH 3,0 oder weniger anzusäuern,
da die Peptide bei höheren
pH-Werten nicht
vollständig
geladen werden und möglicherweise
nicht in der Säule
haften bleiben. Der gezeigte Gradient ist so gewählt, dass die Elution doppelt
geladener Peptide so weit wie möglich
verteilt wird, sodass diese Peptide üblicherweise beginnend bei
etwa 8–9
Minuten bis etwa Minute 15–16
in den Durchlauf eluiert werden, wonach dreifach geladene Peptide
zu eluieren beginnen. Über
die Dauer des Gradienten werden etwa 30 Fraktionen gesammelt.
-
Für die Avidin-Affinitätschromatographie
wird Ultralink Monomeric Avidin (Pierce, Katalog-Nr. 53146) verwendet.
Der Hals eines Pipettenglases aus Glas wird mit einem kleinen Stück Glaswolle
verschlossen. 400 μl
Avidin-Chromatographiematerial
wird in das Glas gepackt (die Aufschlämmung wird in einer 50%igen
Verdünnung
geliefert, um 400 μl
Avidin-Chromatographiematerial zu erhalten, müssen also 800 μl 50%ige
Aufschlämmung
zugegeben werden). Die Kügelchen
setzen sich ab und die Säule
wird mit 2 × PBS
gewaschen, um die Kügelchen
von der Seite des Glases abzuspülen.
Die -gepackte Säule
wird mit 30% Acetonitril (ACN) mit 0,4% Trifluoressigsäure (TFA)
durchgespült,
bis der Abfluss-pH
~1 beträgt,
wonach mit einem weiteren Säulenvolumen
ACN/TFA durchgespült
wird. Dieser Säuerungsschritt
dient dazu, mit den Kügelchen
assoziierte Polymere zu entfernen. Die Säule wird mit 2 × PBS, pH
7,2, gewaschen, bis der pH-Wert ~7,2 ist. Dann wird die Säule mit
drei weiteren Säulenvolumen
(1200 μl)
desselben Puffers durchgespült.
-
Die
Säule wird
mit 3–4
Säulenvolumen
eines Biotin blockierenden Puffers (2 mM d-Biotin in PBS) gewaschen.
Das Biotin blockiert die Avidin-Stellen der Säule mit größerer Aufnahmefähigkeit,
wodurch die spätere
Rückgewinnung
der Proben an den restlichen Bindungsstellen gesichert ist.
-
Leicht
gebundenes Biotin wird mit ~6 Säulenvolumen
(2,400 μl)
Regenerationspuffer (100 mM Glycin, pH 2,8) ausgewaschen, bis der
Abfluss auf pH ~2,8 fällt.
Diese Glycinlösung
wird vor der Benutzung autoklaviert und bei 4°C aufbewahrt und kann so eine
Woche halten.
-
Die
Säule wird
mit 6 Säulenvolumen
2 × PBS
gewaschen, um wieder den korrekten pH-Wert (~7,2) einzustellen.
Der Durchfluss-pH wird überwacht.
Die Peptidproben, die aus individuellen oder vereinigten Fraktionen
aus der Ionenaustauschsäule
stammen, werden dann auf die Säule
aufgebracht und ~20 min in der Säule
inkubiert. Anschließend
wird nicht gebundenes Material durch Aufbringen von 5 Säulenvolumen
2 × PBS,
pH 7,2 aus der Säule
gewaschen und die Fraktionen werden gesammelt. Die Säule wird
weiter mit 5 × Säulenvolumen
1 × PBS
(dieser Schritt dient der Herabsetzung der Salzkonzentration) und
6 Säulenvolumen 50
mM AMBIC (Ammoniumbicarbonat), pH 8,3, mit 20% Methanol (MeOH) durchgespült, während weiter
Fraktionen gesammelt werden (50 mM AMBIC dient dazu, die Salzkonzentration
zu verringern; MeOH dient dazu, hydrophobe Peptide zu entfernen).
Biotinylierte Peptide werden mit einem Elutionspuffer (30% CN/0,4%
TFA) eluiert und manuell in einem Reagenzglas gesammelt. Diese Proben
werden mittels Kapillar-Umkehrphasenchromatographie weiter getrennt.
-
Für die Umkehrphasenchromatographie
werden gereinigte biotinylierte Peptide mittels Umkehrphasen-Kapillarchromatographie
unter Verwendung von Standardprotokollen getrennt. Der Lösungsmittel-Gradient ist so gewählt, dass
die Peptide über
einen Zeitraum von 60 min eluieren. Wenn alle 1 min Fraktionen gesammelt
und im Massenspektrometer analysiert werden, werden mittels dieses
Verfahrens 60 Speicher geschaffen.
-
Für die Massenanalyse
und die Sequenzanalyse werden biotinylierte Peptide, die aus den
UP-Säulen eluieren,
mittels ESI MS/MS für
die Erzeugung der Datenbank und mittels ESI-MS für die Datenbankabfrage analysiert.
Für die
Erstellung der Datenbank wird ein Massenspektrometer mit Ionenfalle
mit einer Massengenauigkeit von etwa 1 Masseneinheit verwendet.
Für die
Massenbestimmungen für
Datenbankabfragen wird ein ESI-TOF-Massenspektrometer mit einer
Massengenauigkeit von mehr als 50 ppm und einer Auflösung von mehr
als 10.000 verwendet. Das bedeutet, dass ein Peptid mit 1000 Masseneinheiten
von einem Peptid mit 1000,1 Masseneinheiten unterschieden werden
kann. Wenn ein Massenbereich für
Trypsin-Peptide von zwischen 500 und 3000 Masseneinheiten angenommen
wird, erzeugt ein Massenspektrometer mit dieser Leistung 25.000
Speicher.
-
Bei
der Proteomanalyse der Hefe S. cerevisiae enthält das Genom des Organismus
etwa 6200 offene Leseraster (ORF). Das Hefeproteom enthält somit
erwartungsgemäß, etwa
6200 verschiedene Proteine, wobei differenziell modifizierte Formen
desselben Proteins unberücksichtigt
bleiben. Bei Anlegen von empirisch abgeleiteten Spezifizitätsregeln
für Trypsin
würde die
Trypsinspaltung eines Hefeproteoms etwa 350.000 Peptide ergeben.
Diese Probenkomplexität
wird auf etwa 35.000 Peptide reduziert, nur wenn die cysteinhaltigen Peptide
ausgehend von einer chemischen Derivatisierung mit den ICATTM-artigen Reagenzien extrahiert werden.
Die Gesamtanzahl an Speichern, die für das vorstehend beschriebene
Verfahren zur Verfügung
stehen, beträgt
10 × 30 × 60 × 25.000
= 4,5 × 108 und übersteigt
somit bei weitem die Anzahl an Peptiden, die bei einer Analyse des
Gesamthefeproteoms zu erwarten sind. Deswegen ist zu erwarten, dass
das Verfahren zur Erzeugung von Daten für eine Datenbankabfrage bei
einer Probe mit der Komplexität
eines Hefeextrakts vereinfacht werden kann. Als ein Beispiel kann
der Schritt einer Trennung mittels Gelelektrophorese wahlweise ausgeschaltet
werden.
-
Weder
das Verfahren zur Erzeugung von Daten, die in eine Datenbank eingegeben
werden, noch das Verfahren zur Erzeugung von Daten für eine Datenbankabfrage
ist festgelegt. Für
die Optimierung kann die Anzahl der verfügbaren Speicher somit problemlos
und in Abhängigkeit
von der Probenkomplexität
angepasst werden. Im Allgemeinen ist die Anzahl der Speicher, die
für die
Erzeugung der Datenbank gewählt
wird, hoch, wohingegen die Anzahl der Speicher für die Erzeugung der Daten für eine Datenbankabfrage
so gering wie möglich
gewählt
wird, um den Probendurchsatz zu maximieren. Die Anzahl an verfügbaren Speichern
kann problemlos auf mannigfaltige Weise angepasst werden. Zum einen
kann der Einschluss von zusätzlichen
orthogonalen Trenndimensionen für
Proteine und Peptide erwogen werden. Bei der Proteintrennung können Elektrofokussierung,
Ionenaustauschchromatographie, Hydroxylapatit-Chromatographie oder ähnliche
elektrophoretische oder chromatographische Techniken eingeschlossen
werden. Bei der Peptidtrennung können eine
Trennung auf der Grundlage von der Peptidgröße oder Kapillar-Elektrophorese-Verfahren
eingeschlossen werden.
-
Zum
andern kann der Trennbereich der vorstehend beschriebenen Trennverfahren
erweitert werden. Die Proteintrennung kann durch Verwendung von
Gradientengelen oder längeren
Gelen mit größerem Trennbereich
ausgedehnt werden. Bei chromatographischen Verfahren zur Peptidtrennung
kann die Anzahl der Speicher durch Erzeugen umfassenderer, flacherer
Gradienten und/oder durch häufigere
Probennahme problemlos erhöht
werden. Schließlich
ist die Anzahl der Speicher von der Auflösung und der Massengenauigkeit des
verwendeten Massenanalysators abhängig. Die zusätzliche
Verwendung eines Massenanalysators mit höherer Leistung senkt die Anzahl
an Speichern, die durch die in dem Verfahren verwendeten Trennverfahren bereitgestellt
werden.
-
BEISPIEL III
-
Verwendung
von ESI-TOF für
die MS-Analyse komplexer Proben
-
In
diesem Beispiel ist ein Verfahren zur Bestimmung eines Polypeptididentifizierungssubindex
unter Verwendung der Masse von Polypeptidfragmenten, die mittels
ESI-TOF bestimmt wurde, beschrieben.
-
Die
Massen einer Gruppe von Polypeptiden, oder Fragmenten davon, wurden
unter Verwendung von ESI-TOF bestimmt, um einen Polypeptididentifizierungsindex
anhand der Massenwerte zu beschränken,
um wiederum einen Polypeptididentifizierungssubindex zur Verwendung
mit komplexen Genomen zu erzeugen. Zwei Peptide, ASHLAGAR (P1) und
RPPGFSPR (P2), wurden zusammen in einen ESI-TOF infundiert. Die
Mischung sollte eine gemeinsame Elution von Peptiden während der
HPLC-Trennung simulieren.
Die Spektren wurden mit niedriger (4A)
und hoher (4B) VDüse-Skimmer erhalten.
-
Wie
aus 4B hervorgeht, liegen für beide
Peptide zahlreiche Fragmente vor. Oberhalb des P1 1 + Ion erschienen
keine Fragment-Ionen, weswegen dieser m/z-Bereich nicht in 4B aufgenommen
wurde. Zum Dekonvolieren der Mischung aus parentalen und Fragment-Ionen in einem einzigen
Massenspektrum wurde ein Algorithmus geschrieben (4B).
Die P1- und P2-Sequenz
wurde in eine Liste aller möglichen Trypsin-Peptide aus einer
Datenbank mit 60.884 humanen Polypeptiden aufgenommen. Ein Vergleich
der beobachteten Massen von P1 und P2 (4A)
mit allen möglichen
Trypsin-Peptiden der 60.884 Polypeptide ergab eine Liste von 57
bzw. 124 Isobaren. Die Liste mit b- und y-Ionenfragmenten aller Isobare,
die mit 10 ppm berechnet wurden, wurde dann mit den zwischen 500
und 825 m/z in 4B beobachteten Fragment-Ionen verglichen.
Dieses Verfahren ergab eine Liste von 12 bzw. 13 möglichen
Polypeptididentifikationen für
P1 bzw. P2, wie aus 4C hervorgeht.
Dieses Verfahren ist für
die Anwendung einer Beschränkung
auf einen Polypeptididentifizierungsindex beispielsweise zur Erzeugung
eines Polypeptididentifizierungssubindex zur Verwendung mit komplexen
Genomen nützlich.
In-source CID mit Peptiden kann leicht und schnell auf kontinuierlich
wechselnde Weise von ESI-TOF und möglicherweise von in-source
Zerfall mit MALDI-TOF erfasst werden. Ferner führt das Verfahren nicht zu
Datenverlusten, wie sie mit Tandem-MS auftreten, bei der während der
CID eines selektierten Ions gleichzeitig eluierende Ionen notwendigerweise
nicht in die Analyse aufgenommen werden. Wenn die Peptide eine geringe
Häufigkeit
haben (das heißt
ein niedriges Signal-Rausch-Verhältnis),
dann werden sie von datenabhängigen
(DD) Tandem-MS-Verfahren nicht für
CID selektiert. Der Grund hierfür
besteht darin, dass übliche
DD-Verfahren zuerst den Basis-Peak (das heißt, das intensivste Fenster
für Ionen
pro m/z) untersuchen, damit CID durchführen und diesen dynamisch von
weiteren Überlegungen
ausschließen und
mit dem am zweithäufigsten
vorkommenden Ion fortsetzen.
-
Die
in 4C dargestellten Peptide stellen
eine Reduzierung der Komplexität
von mehr als 60.000 möglichen
Polypeptiden auf etwa 12 oder 13 Polypeptide dar. Für parentale
Polypeptide oder eines oder mehrere zusätzliche Peptidfragmente davon
werden zusätzlich
Charakteristika bestimmt, beispielsweise die Atommasse, die Aminosäurezusammensetzung,
die partielle Aminosäuresequenz,
das scheinbare Molekulargewicht, der pI-Wert und die Reihenfolge
der Elution an einem spezifischen chromatographischen Medium unter bestimmten
Bedingungen. Verfahren zur Fraktionierung von Polypeptiden sind
bereits beschrieben (siehe beispielsweise Scopes, Protein Purification:
Principles and Practice, 3. Ausgabe, Springer Verlag, New York (1993)).
Um die Identifizierung eines einzigen Polypeptids im Polypeptididentifizierungsindex
zu ermöglichen, wird
eine ausreichende Anzahl an Charakteristika bestimmt.
-
BEISPIEL IV
-
Shotgun-Peptidsequenzanalyse
zur Erzeugung eines Polypeptididentifizierungsindex
-
In
diesem Beispiel ist die Sequenzanalyse von Peptiden mit hoher Massengenauigkeit
beschrieben.
-
Es
wurde ein Verfahren für
die Sequenzanalyse von Peptiden unter Verwendung von parentalen
und Fragment-Ionen
mit hoher Massengenauigkeit (50 ppm oder besser) in einem ESI-TOF-LC/MS-System
entwickelt. Das Verfahren beinhaltete die Einführung gereinigter Proteinspaltproben
bei abwechselnd hohem und niedrigem Ionenquellen-Gradientpotenzial,
wodurch Fragmentierungsdaten über
Peptide aufgezeichnet und mit nicht fragmentarischen Daten für eine positive
Identifizierung einer Peptidsequenz und des parentalen Proteins über eine
Datenbankabfrage kombiniert werden. Obwohl in diesem bestimmten
Beispiel der Cysteingehalt gewählt
wurde, ist der Cysteingehalt nicht zwingend ein bestimmtes Charakteristikum.
Im Gegensatz zur herkömmlichen
Tandem-MS wurden alle gemeinsam MS unterworfenen Peptide ohne Einzelionenselektion fragmentiert.
Alle Fragment-Ionen der beiden simultan fragmentierten Peptide wurden
im Gegensatz zur Tandem-MS,
bei der Fragment-Ionen jeweils pro Einzelpeptid gemessen werden,
gemeinsam gemessen.
-
Kurz
gesagt, wurde Saccharomyces cerevisiae (BWG1-7A) in YPD-Medium bis
zu einem OD600 von 3 (gerade nach der log-Phase)
gezüchtet.
Mittels Lyticase-Spaltung und anschließender mechanischer Lyse wurden
Sphäroplasten
gebildet. Die Kerne wurden mittels Zentrifugieren (13.000 Umdr./min,
30 min) isoliert und durch Zugabe von Ammoniumsulfat gelyst. Unlösliches
Material wurde zentrifugiert (28.000 Umdr./min, 90 min) und der Überstand
extrahiert. Proteine wurden mit Ammoniumsulfat gefällt. Der
Niederschlag wurde erneut suspendiert und gegen 20 mM Hepes, 20%
Glycerol, 10 mM MgSO4, 1 mM EGTA und 75
mM Ammoniumsulfat dialysiert.
-
Das
Proteinextrakt (5,6 mg) wurde in einem Speedvac (Savant Instruments;
Holbrook NY) getrocknet und erneut suspendiert und mittels Kochen
3 min lang in 0,5% SDS, 50 mM Tris, 1 mM EDTA denaturiert. Dithiothreitol
(DTT; 5 mM) wurde zugegeben und die Probe wurde 30 min lang bei
50°C inkubiert.
Die Proteine wurden in kaltes Aceton/Ethanol (EtOH) (50:50 Vol.:Vol.)
ausgefällt.
Die Pellets wurden gewaschen und erneut in 0,05% SDS, 6 M Harnstoff,
50 mM Tris, pH 8,3, und 1 mM EDTA suspendiert und es wurden 3 mg
EZ-Link PEO-Iodacetyl-Biotin
(Pierce Katalog-Nr. 21334; Pierce Chemical Co.; Rockford IL) zugegeben.
Die Probe wurde 90 min lang dunkel unter Rühren inkubiert. Gleiche Volumen
20 mM DTT wurden zugegeben, um die Biotinylierungsreaktion abzubrechen.
Dann wurde die Probe mit 50 mM Tris, 1 mM EDTA auf das 6-fache ihres Volumens
verdünnt.
Es wurden 200 μg
Trypsin zugegeben und die Probe wurde über Nacht bei 37°C inkubiert.
-
Etwa
2 mg der mit Trypsin gespaltenen Lösung wurden durch eine stark
saure Kationenaustauschsäule
Polysulfoethyl A (PolyLC #202SE0503, 2,1 mm × 200 mm, 300 Å, 5 μm) (Gradient
= 0% bis 25% über
30 min, 25% bis 100% über
20 min, 300 mM KCl in 10 mM K2PO4, 25% Acetonitril (ACN), pH 3,0, bei 200 μl/min) geführt, wobei
alle 5 Minuten Fraktionen gesammelt wurden. Jede Fraktion wurde
unter Verwendung einer ABI-Affinitätspatrone,
Patronenhalter und zugehörigem
Puffersystem (ABI #4326740 und #4326688-90; Applied Biosystems;
Foster City CA) von biotinylierten Cysteinylpeptiden gereinigt.
Die gereinigten Fraktionsvolumen (die 0,1 Kationenaustauschabsorbanzeinheiten
bei 214 nm UV-Spur repräsentieren)
wurden vollständig in
einem Speedvac getrocknet und erneut in 0,2% Essigsäure (HOAc)
auf 5 μl
Volumen suspendiert.
-
Die
getrocknete Probe wurde auf einer Umkehrphasensäule mithilfe eines integrierten
Autosampler/μHPLC-Systems
von LC Packings (San Francisco CA), das mit einer handgepackten
100 μm × 10 cm C-18-Quarzglassäule (Michrom
Magic C18) gekoppelt war, unter Verwendung eines linearen Gradienten
aus ACN (Lösungsmittel
B) von 5% bis 50% mit etwa 700 nl pro Minute über einen Zeitraum von 60 Minuten
getrennt. Lösungsmittel
A war 0,2% HOAc/0,001% Heptafluorbuttersäure. Die Quarzglas-Kapillarsäule wurde über eine
Mikrovolumen-Verschraubung
mit 0,15 mm Durchmesser aus Edelstahl von Valco (MUIXCS6), an die
4000 VDC (Gleichspannung) angelegt wurde, mit einer Quarznadel mit
einer sich von 75 auf 30 μm
zuspitzenden Spitze (New Objective, FS360-75-30-N) gekoppelt. Die biotinylierten
Peptide wurden unter Verwendung eines ESI-TOF-Massenspektrometers
für eine
Biospektrometrie-Workstation von ABI Mariner zweimal mittels μLC/MS analysiert,
zuerst mit einem Düsen/Skimmer-Potenzial
(VNZ) von 70/25 VDC, dann erneut mit einem
VNZ-Potenzial von 200/25 VDC.
-
Im
Rahmen der manuellen Untersuchung des gesamten chromatographischen
Durchlaufs wurde eine Liste nicht fragmentierter potenzieller Peptide
erstellt. Identifizierbare doppelt, dreifach und vierfach geladene m/z-Monoisotopenwerte
wurden in eine Tabellenkalkulation überführt und dekonvoltiert. Dekonvoltierte
Massen wurden in ein einfaches Datenbanksuchprogramm eingegeben,
das eine Liste mit Peptiden erzeugte, die folgende Kriterien erfüllten: Masse
mit einer Genauigkeit von 30 ppm, Peptid mit einem Cysteinylrest,
Peptid mit Trypsin-Stellen an beiden Enden, zwei mögliche Trypsin-Spaltstellen
dürfen
fehlen, Cystein mit 414,1931 Da (PEO-Iodacetylierung). Jede potenzielle
Peptidsequenz wurde dann in silico fragmentiert, um eine Liste möglicher
Fragment-Ionen-m/z-Werte
zu erstellen. Der fragmentierte chromatographische Durchlauf wurde dann
manuell auf Gegenwart oder Abwesenheit solcher potenzieller Fragmente
untersucht, die innerhalb des experimentell festgelegten m/z-Bereichs
liegen. Jeder potenzielle Peptidkandidat wurde dann hinsichtlich
seiner Übereinstimmung
mit den tatsächlichen
Fragmenten entsprechend der Massenspektrometriedaten mit einem Fehler
von 40 ppm überprüft. Ferner
wurden die Fragmente und die Vorstufenmassen, von denen diese stammten,
manuell in SEQUESTTM eingegeben und eine
Abfrage derselben Datenbank durchgeführt, um die Werte für Kreuzkorrelation
(XCorr) und Delta-Korrelation (dCn) für Vergleiche mit Ionenfallendaten
zu erzeugen. Schließlich
wurde dieselbe Probe unter Verwendung einer ähnlichen Strategie für die Umkehrphasentrennung
in einer LCQ-Ionenfallen-LC/MS (MS)-Konfiguration von ThermoFinnigan
untersucht. Die Ergebnisse wurden einer automatischen Datenbankanalyse
mit SEQUESTTM (Eng et al., supra, 1994)
unterworfen, um die ESI-TOF-Ergebnisse
zu bestätigen.
-
Die
Scans des chromatographischen Bereichs in 5 wurden
für sowohl
nicht fragmentarische als auch fragmentarische Durchläufe summiert
und in 6 bzw. 7 dargestellt.
Der dreifach geladene Peak bei 620,3436 m/z und der doppelt geladene
Peak bei 930,0258 m/z wurde auf [M + H] = 1859,03 dekonvoltiert. Die
Datenbank über
offene Leseraster für
Hefe wurde auf cysteinhaltige Peptide mit diesem [M + H] durchsucht,
die vollständig
tryptisch waren, zwei mögliche übersehene
Spaltungen enthielten und innerhalb von 30 ppm der dekonvoltierten
Masse lagen. In 5 zeigt die Pfeilspitze auf
das Peptid YRPNCPIILVTR (SEQ ID NO: 26), das sich nach Chromatographie
als einziges Peptid ergab. Obwohl während der MS keine Ionenselektion
durchgeführt
wurde, wurde das Peptid trotzdem positiv identifiziert. Die Ergebnisse
gehen aus Tabelle 1 hervor, wobei ein Peptid, die Sequenz YRPNCPIILVTR
(SEQ ID NO: 26), durch 22 von 33 erkannten Ionen positiv identifiziert
wurde (Tabelle 1, SEQ ID NOS: 27–33, 26 bzw. 34–38).
-
-
-
-
Tabelle
2 zeigt die theoretischen Massen jedes Fragments, das im experimentellen
m/z-Bereich (300–1500
m/z) liegt, wobei die übereinstimmenden
Peaks mit "*" und dem jeweiligen
ppm-Fehler angegeben sind. Die Massen wurden von Hand in SEQUESTTM eingegeben, um die in Tabelle 1 gezeigten
Werte für
die Kreuzkorrelation und die delta-Korrelation zu erzeugen. Schließlich wurde
das Peptid auch bei einer Abfrage von Ionenfallendaten derselben
Probe in SEQUESTTM gefunden, wobei der Xcorr-Wert
3,75 und der Wert der delta-Korrelation
0,325 betrug.
-
In
einer komplexeren Probe wurden zwei Peptide gleichzeitig im Chromatogramm
eluiert (siehe 8). Die gemeinsam eluierten
Peptide wurden in der Ursprungsregion ohne Ionenselektion fragmentiert. Obwohl
MS ohne Ionenselektion durchgeführt
wurde, wurden die beiden gemeinsam eluierenden Peptide trotzdem
identifiziert.
-
Die
in 9 dargestellten nicht fragmentarischen Massen
wurde in das vorstehend verwendete Suchprogramm für eine Datenbank
eingegeben. Die potenziellen Peptide wurden in silico fragmentiert
und die erhaltenen Fragmentmassen mit den fragmentarischen m/z-Spektralwerten aus 10 verglichen. Tabelle 3 zeigt die Kandidatpeptide
für [M1
+ H] = 1486,76 und die Anzahl der abgeglichenen Ionen. Als Peptidsequenz wurde
VCSSHTGLIR (SEQ ID NO: 44) bestimmt (Tabelle 3, SEQ ID NOS: 39–49) bestimmt.
-
-
-
-
Tabelle
4 zeigt die Kandidatpeptide für
[M2 + H] 1758,84 und die Anzahl der abgeglichenen Ionen. Als Peptidsequenz
wurde GHNIPCTSTISGR (SEQ ID NO: 60) (Tabelle 4, SEQ ID NOS: 50–63) bestimmt.
-
Im
Falle beider Peptide ([M1 + H) = 1486, 76 und [M2 + H] = 1758,84)
wurden die m/z-Werte der Fragmente von Hand in SEQUESTTM eingegeben
und die Werte für
XCorr und dCn erzeugt. Sie gehen aus Tabelle 3 bzw. 4 hervor.
-
Tabelle
5 und 6 zeigen, welche Fragment-Ionen abgeglichen wurden ("*"), die theoretischen m/z-Werte der Fragmente
und die ppm-Fehler der tatsächlichen
m/z-Werte. Schließlich wurden
auch diese Peptide bei einer Abfrage der Ionenfallendaten derselben
Probe mittels SEQUESTTM gefunden, wobei
der Xcorr-Wert für [M1
+ H] = 1486,76 2,84 und der Wert der delta-Korrelation 0,198 und
der Xcorr-Wert für
(M2 + H) = 1758,84 3.18 und der Wert der delta-Korrelation 0,299
betrug.
-
-
-
Diese
Ergebnisse zeigen, dass positive Identifizierungen von Peptidsequenzen
für Peptide
in Reinform und zusammen mit anderen Peptiden erhalten wurden, das
heißt,
für einzeln
bzw. gemeinsam mit anderen eluierende Peptide. Bei gleichzeitig
eluierenden Peptiden wurde eine "Shotgun"-Sequenzanalyse unter Verwendung von
in-source CID auf einem einstufigen ESI-TOF-Massenspektrometer durchgeführt. Verglichen mit
einer herkömmlichen
Peptid-Sequenzanalyse mithilfe von Tandem-MS, bei der parentale
Ionen sequenziell selektiert werden, ermöglicht eine Kombination aus
Cystein-Beschränkung,
hoher Massengenauigkeit und hoher Massenauflösung die parallele Shotgun-Sequenzanalyse
von Peptiden. Das Verfahren kann auch mit ICAT (Gygi et al., Nature
Biotechnol. 17: 994–999
(1999)) bei der Analyse von mit ICAT-markierten Peptiden in einer Analyse
verwendet werden.
-
Die
Ergebnisse zeigen, dass parentale Proteine aus einer Kombination
aus bestimmten Charakteristika identifiziert werden können. In
diesem Beispiel waren die bestimmten Charakteristika (1) Cysteingehalt, (2)
genaue Peptidmasse und (3) genaue Peptidfragmentmasse ohne Selektion
spezifischer Ionen.
-
BEISPIEL V
-
Erzeugung
einer Datenbank für
Drosophila als Polypeptididentifizierungsindex
-
In
diesem Beispiel ist die Erzeugung einer Datenbank zur Identifizierung
von Drosophila-Proteinen beschrieben.
-
Als
Modellorganismus, der eine Art repräsentiert, für die die vollständige Genomsequenz
bestimmt wurde und deren Genomsequenz eine große Anzahl an Exonen enthält, wurde
Drosophila gewählt.
Der Zweck des Versuchs war die Erzeugung einer großen Gruppe
an Peptiden und Proteinen von einer Art, deren Genomsequenz vollständig bestimmt
war, um die Peptide mittels mehrdimensionaler Chromatographie zu
trennen und die Peptide über
die Erzeugung von CID-Spektren und Abfragen einer Sequenzdatenbank
zu identifizieren und jedes identifizierte Peptid mit einem Strichcode
mit Informationen zu annotieren, die während des Fraktionier-/Identifizierverfahrens
erhalten wurden.
-
Schneider-Zellen
(S2) (109) von Drosophila melanogaster wurden
durch Züchten
in einer geeigneten Gewebekulturnährlösung vorbereitet. Die Zellen
wurden gelyst und die gebildeten Lysate durch differenzielles Zentrifugieren
in eine Kernfraktion, eine Zytoplasmafraktion und eine mikrosomale
Fraktion fraktioniert. Jede Fraktion wurde in zwei identische Hälften geteilt
und die Proteine, die in jeder Probe enthalten waren, mit entweder
dem isotopisch normalen (d0) oder dem isotopisch schweren (d8) ICAT-Reagenz
markiert. Die markierten Proben, die dieselben subzellulären Fraktionen
darstellen, wurden dann vereinigt, um eine 1:1 Proteinmischung aus
isotopenmarkierten Proteinen zu erstellen, und trypsinitiert. Die
gebildeten Peptide wurden mittels Kationenaustauschchromatographie
wie in Beispiel II bestimmt und anschließender Avidin-Chromatographie zur
selektiven Isolierung der markierten Peptide und Umkehrphasenchromatographie
fraktioniert. Die getrennten Peptide wurden analysiert und in einem
LCQ-Ionenfallen-Massenspektrometer
CID unterworfen. Die gebildeten Peptid-CID-Spektren wurden einer
Datenbankabfrage unterworfen, wobei die Fliegen-Sequenzdatenbank des Fliegen-Genomsequenz-Konsortiums
und der Suchalgorithmus SequestTM verwendet
wurden.
-
Zur
Identifizierung der Proteine mittels Abfrage einer Sequenzdatenbank
anhand von Peptid-CID-Spektren wurden die folgenden Suchparameter
verwendet: Es wurden ausschließlich
doppeltryptische Peptide mit mindestens einem Cysteinrest berücksichtigt.
Es waren ein delta-Korrelationsfaktor
von mehr als 0,1 und für
ein doppelt geladenes Vorläufer-Ion
ein X-Korrelationskoeffizient von mehr als 2,0 erforderlich (X-corr. > 1,5 für einfach
geladene Peptide; X-corr. > 2,5
für dreifach
geladene Peptide).
-
In
der Kernfraktion wurden 1470 Proteine identifiziert. In der Zytoplasmafraktion
wurden 967 Proteine identifiziert. In der mikrosomalen Fraktion
wurden 1500 Proteine identifiziert. Somit wurden mit dieser Analyse etwa
4000 Proteine identifiziert. Die Daten belegen somit die Verwendbarkeit
multidimensionaler Chromatographie, Tandem-Massenspektrometrie und
Abfragen von Sequenzdatenbanken zur Errichtung einer annotierten
Peptiddatenbank für
ein spezifisches Gewebe, einen Zelltyp oder ein Art.
-
Diese
Ergebnisse zeigen, dass sich ein Polypeptididentifizierungsindex
erzeugen lässt,
der zur Identifizierung einer großen Anzahl an Polypeptiden
verwendet werden kann.
-
BEISPIEL VI
-
Verwendung
des isoelektrischen Punkts als Unterscheidungscharakteristikum für die Polypeptididentifizierung
-
In
diesem Beispiel ist die Verwendung des isoelektrischen Punkts (pI)
als Charakteristikum zur Identifizierung eines Polypeptids beschrieben.
-
Der
isoelektrische Punkt von Peptiden wurde als Unterscheidungskomponente
geprüft,
die für
einen Peptid-Strichcode nützlich
ist. Zu den Vorteilen der Verwendung des pI als Komponenten des
Strichcodes gehören:
i) der pI ist einfach und genau anhand der Aminosäuresequenz
eines Peptids vorhersagbar; ii) der pI kann mittels IEF präzise gemessen
werden und iii) die Peptide können
wirksam aus den IEF-Gelen wiedergewonnen werden.
-
Eine
Ionenaustauschfraktion der in Beispiel V beschriebenen Peptidproben
von Fliegen wurde weiter mittels Elektrofokussierung in einem Polyacrylamid-Gel
mit immobilisiertem pH-Gradient (IPG-IEF) getrennt. Die Peptide,
die an einem Segment um pI 6,8–7,0
fokussierten, wurden ausgeschnitten und die in dieser Fraktion enthaltenen
Peptide wurden extrahiert und mittels LC-MS/MS analysiert. Die gebildeten
CID-Spektren wurden,
wie in Beispiel V beschrieben, einer Abfrage in einer Sequenzdatenbank
unterworfen und der pI jedes identifizierten Peptids wurde unter
Verwendung der Sequenz der besten Übereinstimmung mit der Sequenzdatenbank
ermittelt. Tabelle 7 zeigt zur Veranschaulichung des Verfahrens
eine Teilliste der Ergebnisse (SEQ ID NOS: 64–117). Die pI der meisten identifizierten
Peptide häuften
sich in einem engen pI-Bereich,
ein Anzeichen dafür,
dass der pI zur genauen Berechnung anhand der Sequenz verwendbar
ist.
-
Die
Daten zeigen ferner, dass eine (geringe) Anzahl an Peptiden vorkam,
deren beste Übereinstimmung
zu einem pI außerhalb
des aus dem Gel extrahierten Bereichs führte. Eine genauere Untersuchung
dieser Peptide lässt
vermuten, dass der Sequenzdatenbankabgleich für diese Peptide außerhalb
des pI-Bereichs des extrahierten Gels mit größter Sicherheit falsch war,
da die Suchwerte Randwerte waren, die Peptide üblicherweise einen höheren Anteil
an übersehenen
Trypsin-Spaltstellen enthielten und zahlreiche Peptide nicht tryptisch
waren. Insgesamt gesehen zeigen die Daten die Effektivität der Verwendung
des Peptid-pI als eine Komponente für den Strichcode zur Identifizierung
eines Polypeptids in einem Polypeptididentifizierungsindex.
-
-
Diese
Ergebnisse zeigen, dass der pI als Charakteristikum eines Polypeptids
zur Identifizierung eines Polypeptids unter Verwendung eines Polypeptididentifizierungsindex
verwendet werden kann.
-
Die
Erfindung ist hier zwar unter Bezugnahme auf die offenbarten Ausführungsformen
beschrieben, für
Fachleute ist es jedoch offensichtlich, dass die spezifischen ausführlich beschriebenen
Versuche nur als Veranschaulichung der Erfindung dienen. Es ist
offensichtlich, dass verschiedene Modifikationen möglich sind, ohne
vom Schutzumfang der Erfindung abzuweichen.