DE60026452T2 - Verfahren zur Identifizierung von Peptidensequenzen und Proteinensequenzen mittels Massenspektromterie - Google Patents

Verfahren zur Identifizierung von Peptidensequenzen und Proteinensequenzen mittels Massenspektromterie Download PDF

Info

Publication number
DE60026452T2
DE60026452T2 DE60026452T DE60026452T DE60026452T2 DE 60026452 T2 DE60026452 T2 DE 60026452T2 DE 60026452 T DE60026452 T DE 60026452T DE 60026452 T DE60026452 T DE 60026452T DE 60026452 T2 DE60026452 T2 DE 60026452T2
Authority
DE
Germany
Prior art keywords
sequences
mass
probability
sequence
ions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60026452T
Other languages
English (en)
Other versions
DE60026452D1 (de
Inventor
John Kenmare Skilling
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Micromass UK Ltd
Original Assignee
Micromass UK Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GBGB9907810.7A external-priority patent/GB9907810D0/en
Priority claimed from GBGB9908684.5A external-priority patent/GB9908684D0/en
Application filed by Micromass UK Ltd filed Critical Micromass UK Ltd
Publication of DE60026452D1 publication Critical patent/DE60026452D1/de
Application granted granted Critical
Publication of DE60026452T2 publication Critical patent/DE60026452T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6848Methods of protein analysis involving mass spectrometry
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/0027Methods for using particle spectrometers
    • H01J49/0036Step by step routines describing the handling of the data generated during a measurement
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/02Details
    • H01J49/04Arrangements for introducing or extracting samples to be analysed, e.g. vacuum locks; Arrangements for external adjustment of electron- or ion-optical components

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Biomedical Technology (AREA)
  • Immunology (AREA)
  • Cell Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biophysics (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Description

  • Diese Erfindung betrifft Verfahren zum Bestimmen der Sequenz von Aminosäuren, die Peptide, Polypeptide oder Proteine bilden, durch Massenspektrometrie und im Besonderen durch Tandemmassenspektrometrie oder MS/MS. Im Besonderen betrifft sie Verfahren, worin die Sequenz bestimmt werden kann aus den Massenspektraldaten alleine und welche keine Verwendung bestehender Bibliotheken mit Proteinsequenzinformation erfordern. Verfahren gemäß der Erfindung erfordern keine Information bezüglich der Natur des Peptids, die hinaus geht über eine Bibliothek der Aminosäurereste, die in Proteinen auftreten können, gewichtet entsprechend ihrer natürlichen Häufigkeit.
  • Wenngleich mehrere gut entwickelte chemische Verfahren zum Sequenzieren von Peptiden, Polypeptiden und Proteinen bekannt sind (z.B. der Edman-Abbau) werden massenspektrometrische Verfahren zunehmend wichtig im Hinblick auf ihre Geschwindigkeit und leichte Anwendbarkeit. Massenspektrometrische Verfahren sind bis zu dem Punkt entwickelt worden, bei welchem sie in der Lage sind zum Sequenzieren von Peptiden in einem Gemisch ohne höhere chemische Reinigung oder Trennung, typischerweise unter Verwendung von Elektrospray-Ionisation und Tandenmassenspektrometrie (MS/MS). Siehe z.B. Yates III (J. Mass. Spectrom, 1998, Band 33, S. 1-19), Papayannopoulos (Mass Spectrom, Rev. 1995, Band 14, S. 49-73) und Yates III, McCormack und Eng (Anal. Chem. 1996, Band 68 (17), S.534A-540A). So werden in einem typischen MS/MS-Sequenzierungsversuch Molekülionen eines bestimmten Peptids selektiert durch den ersten Massenanalysator und fragmentiert durch Kollision mit neutralen Gasmolekülen in einer Kollisionszelle. Der zweite Massenanalysator wird dann verwendet, um das Fragmentierungsionenspektrum aufzuzeichnen, das im Allgemeinen genug Information enthält, um zu erlauben, dass mindestens ein Teil und häufig die gesamte Sequenz bestimmt werden kann.
  • Unglücklicherweise ist jedoch die Interpretation der Fragmentspektren nicht einfach. Manuelle Interpretation (siehe z.B. Hunt, Yates III, et al., Proc. Nat. Acad. Sci. USA, 1986, Band 83, S. 6233-6237 und Papayannopoulos, ibid) erfordert beachtliche Erfahrung und ist zeitaufwändig. Folglich haben viele Bearbeiter Algorithmen und Computerprogramme entwickelt, um das Verfahren zumindest teilweise zu automatisieren. Die Natur des Problems ist jedoch so, dass keines der soweit entwickelten Verfahren in der Lage ist, in einer vernünftigen Zeit eine komplette Sequenzinformation bereitzustellen ohne entweder eine gewisse Vorkenntnis der chemischen Struktur des Peptids zu haben oder lediglich wahrscheinliche Kandidatensequenzen in vorliegenden Proteinstrukturdatenbanken zu identfizieren. Der Grund hierfür wird aus der folgenden Diskussion der Natur der erzeugten Fragmentspektren verständlich.
  • Typischerweise umfasst das Fragmentspektrum eines Peptids Signale, die etwa einem halbe Dutzend verschiedener Ionenreihen zugehören, wobei jede verschiedenen Arten der Fragmentierung des Vorläuferpeptidions entspricht. Jede umfasst typischerweise (jedoch nicht unweigerlich) Signale, die den Verlust von aufeinanderfolgenden Aminosäureresten aus dem ursprünglichen Peptidion darstellen. Da mit Ausnahme von zwei alle 20 Aminosäuren, aus welchen die meisten natürlich auftretenden Proteine aufgebaut sind, verschiedene Massen aufweisen, ist es daher möglich, die Sequenz von Aminosäuren aus dem Masseunterschied von Signalen in gegebenen Reihen zu entwickeln, die dem sukkzessiven Verlust eines Aminosäurerestes aus dem ursprünglichen Peptid entsprechen. Jedoch treten Schwierigkeiten auf beim Nachweisen welcher Reihe ein Ion zugehört und durch eine Vielzahl von Mehrdeutigkeiten, die auftreten können beim Zuordnen der Signale, insbesondere wenn bestimmte Signale entweder fehlen oder nicht erkannt werden. Darüber hinaus liegen in einem Spektrum typischerweise andere Signale vor, aufgrund verschiedener komplizierterer Fragmentations- oder Umlagerungswege, sodass eine direkte Zuordnung von Ionen mit Schwierigkeit behaftet ist. Darüber hinaus neigt Elektrosprayionisation dazu, mehrfach geladene Ionen zu erzeugen, die an entsprechend neu bemessenen Massen auftreten, was weiterhin die Interpretation der Spektren erschwert. Isotropencluster führen ebenfalls zur Erzeugung von Signalen in dem beobachteten Spektrum. Daher ist die direkte Information eines Massenspektrums für eine Sequenz nur möglich in trivial kleinen Peptiden.
  • Der umgekehrte Weg, die Übertragung von Versuchssequenzen zum Vorhersagen von Spektren zum Vergleich mit dem beobachteten Spektrum, sollte leichter sein, ist jedoch nicht vollständig entwickelt worden. Die Anzahl möglicher Sequenzen für ein Peptid (20n, worin n die Anzahl von Aminosäuren ist, die im Peptid umfasst sind) ist sehr groß, sodass man sich bewusst ist der Schwierigkeit des Auffindens der korrekten Sequenz für z.B. ein Peptid mit nur 10 Aminosäuren (2010 = 1013 mögliche Sequenzen). Die Anzahl potenzieller Sequenzen nimmt sehr rasch zu, sowohl mit der Größe des Peptids als auch mit der Anzahl (mindestens 20) der zu beachtenden Reste.
  • Details der ersten Computerprogramme zum Vorhersagen möglicher Aminosäuresequenzen aus Massenspektraldaten erschienen 1984 (Sakurai, Matsuo, Matsuda, Katakuse, Biomed. Mass Spectrom, 1984, Band 11 (8) S. 397-399). Dieses Programm (PAAS3) durchsuchte alle Aminosäuresequenzen, deren Molekulargewichte mit dem des Peptids, das zu untersuchen ist, übereinstimmte und identifizierte die wahrscheinlichsten Sequenzen für die beobachteten experimentellen Spektren. Hamm, Wilson und Harvan (CABIOS, 1986 Band 2 (2) S. 115-118) entwickelten auch ein ähnliches Programm.
  • Jedoch wie von Ishikawa und Niwa angegeben (Biomed. and Environ. Mass Spektrom. 1986, Band 13, S. 373-380) ist dieser Ansatz begrenzt auf Peptide, die 800 Dalton nicht überschreiten, im Hinblick auf die Rechenzeit, die erforderlich ist, um die Suche durchzuführen. Parekh et al. haben in der UK-Patentanmeldung 2,325,465 (veröffentlicht im November 1998) diese Idee wiederbelebt und geben ein Beispiel einer Sequenzierung eines Peptids mit 1000 Dalton an, welche es erforderlich machte 2 × 106 mögliche Sequenzen zu durchsuchen, jedoch geben sie die erforderliche Computerzeit bzw. Rechenzeit nicht an. Nichtsdestotrotz ist trotz der Erhöhung der Bearbeitungsgeschwindigkeit von Computern zwischen 1984 und 1999 eine einfache Suche nach allen möglichen Sequenzen für ein Peptid mit einem Molekulargewicht von größer als 1200 Dalton immer noch unpraktikabel in einer vernünftigen Zeit unter Verwendung des Personal Computers, der typischerweise für Datenverarbeitung mit den meisten kommerziellen Massenspektrometern bereitgestellt wird.
  • Dieses Problem war lange bekannt und viele Versuche wurden durchgeführt, um dieses Problem leichter bearbeitbar zu machen. Zum Beispiel kann das MS/MS-Spektrum eher korreliert werden mit Aminosäuresequenzen, die von einer Proteindatenbank stammen, als mit jeder möglichen Sequenz. Solche Verfahren werden gelehrt in der PCT-Patentanmeldung 95/25281 von Tylor und Johnson (Rapid Commun. in Mass Spectrom, 1997, Band 11, S. 1067-1075, von Eng. McCormack, Yates in J. Am. Mass. Spectrom. 1994, Band 5, S. 976-989, von Figeys, Lock et al. (Rapid Commun. in Mass Spectrom. 1998, Band 12, S. 1435-1444) und von Mortz, O'Connor et al. (Proc. Nat. Acid Sci. USA 1996, Band 93 S. 8264-8267). Alternativ können MS/MS-Experimente durchgeführt werden sowohl auf dem ursprünglichen Peptid als auch einem Derivat davon und die Ergebnisse aus beiden Experimenten kombiniert werden, um zumindest eine Teilsequenz ohne Bezugnahme auf eine Datenbank zu entwickeln. (Siehe z.B. die Isotopen-Markierungsverfahren, die von Shevchenko, Chernushevich et al. in Rapid Commun. in Mass Spectrom. 1997, Band 11, S. 1015-24 gelehrt werden oder das Veresterungsverfahren, das von Yates III, Griffin und Hood in Techniques in Protein Chem. II, Kap. 46 (1991) S. 477-485) gelehrt wird und das H2/D2-Austauschverfahren, das von Septov, Issakova et al. in Rapid Commun. in Mass Spectrom. 1993, Band 7, S. 58-62 gelehrt wird. Johnson und Walsh (Protein Science, 1992, Band 1, S. 1083-1091) lehren ein ähnliches Verfahren, das die Edman-Abbaudaten und MS/MS-Daten kombiniert.
  • Von den früheren Programmen, welche versuchen, eine Sequenzinformation vorauszusagen unter Verwendung von nur MS/MS-Daten und ohne Bezugnahme auf bestehende Datenbanken, sind eine Vielzahl von Verfahren nahegelegt worden, um die Vorhersageeiner Sequenzinformation zu erleichtern. Siegel und Bauman (Biomed. Enviorn. Mass Spectrom. 1998, Band 15, S. 333-343) beschreiben einen Algorithmus, der die Sequenzinformation schrittweise aus dem Massenunterschied zwischen benachbarten Ionen in Ionenreihen aufbaut, die erkannt werden in dem Spektrum, jedoch gute Ergebnisse wurden nur erhalten mit Peptiden mit wenigen Aminosäuren. Zidarov, Thibault et al. (Biomed. and Environ. Mass Spectrom, 1990, Band 19, S. 13-26) schlugen ein Algorithmus vor, der zuerst versuchte zu der Aminosäurezusammensetzung des Peptids über Molekulargewichts- und Isotopen-Verhältnis-Daten zu gelangen und nachfolgend das Peptid zu sequenzieren, unter Verwendung eines schrittweisen Ansatzes, der alle möglichen Sequenzen für die so identifizierten Aminosäuren betrachtet. Das Programm SEQPEP (Johnson und Biemann, Biomed and Environ. Mass Spectros., 1989, Band 18, S. 945-957) identifizierte kurze Sub-Sequenzen von Aminosäuren in einem Peptid und erweiterte die Sequenz über die Enden der Sequenzen hinaus, wobei versucht wurde, andere Signale in dem Spektrum mit mehr Aminosäureresten zu korrelieren, bis das Molekulargewicht des Peptids erreicht war. Bartels (Biomed. and Environ. Mass Spectrom, 1990, Band 19, S. 363-368) erkannten, dass die Suchstrategie ein Problem in der Graph-Theorie darstellt und das Verfahren wurde weiter entwickelt durch Fernandez-de-Cossio et al. (CABIOS, 1995, Band 11 (4) S. 427-434). Diese Verfahren berechneten eine Bewertung für Zielsequenzen, basierend auf der Anzahl von Signalen in dem experimentellen Spektrum, zu dem sie passen. Unglücklicherweise fragmentieren Peptide in idiosykratischer Weise und generelle Bewertungen wie die ihren sind hier nicht besonders geeignet. Hines, Falik et al. (J. Am. Soc. Mass Spectrom. 1992, Band 3, S. 326-336) beschrieben ein Sequenzierungsprogramm, das Mustererkennungstechniken verwendet, um Gruppen von Signalen in einem beobachteten Spektrum zu identifizieren und nachfolgend zum Vorhersagen der Aminosäuresequenz. Delgada und Pulfer (J. Chem. Inf. Computer Sci. 1993, Band 33, S. 332-337) beschreiben einen ähnlichen Mustererkennungsalgorithmus, welcher die Technik lehrnfähiger Maschinen verwendet, die ebenfalls zum Beobachten von Daten verwendet wurden. Scarberry, Zhang und Knapp (J. Am. Soc. Mass Spectrom, 1995, Band 6, S. 936-946) berichten von der Anwendung künstlicher neuraler Netzwerke zum Klassifizieren von Signalen in beobachteten Peptid-MS/MS-Spektren, gefolgt durch Sequenzbestimmung der so identifizierten Signalreihen.
  • Die folgenden Schwierigkeiten sind inhärent in diesen früheren Sequenzierungsalgorithmen. Diejenigen, die begrenzt sind auf das Durchsuchen bestehender Datenbanken zum Identifizieren eines Peptids oder Proteins werden deutlich versagen, wenn eine Sequenz zur Zeit tatsächlich unbekannt ist.
  • Diejenigen, die versuchen schrittweise zu sequenzieren, werden versagen, wenn das Spektrum kein signifikantes Signal bei einer Masse enthält, die einem speziellen Aminosäurevedust entspricht, und die Wahrscheinlichkeit davon erhöht sich rasch, wenn sich die Anzahl von Aminosäuren, die in dem Peptid umfasst sind, erhöht. Diejenigen, die die Analyse von Derivaten der Peptide erfordern, um Vieldeutigkeiten aufzulösen, sind deutlich weniger wünschenswert als diejenigen, die darauf hindeuten die Sequenz ohne solche Derivate zu liefern. Diejenigen, die Gruppen möglicher Sequenzen früh im Sequenzierungsverfahren auf Basis eines Einzeltests eliminieren, um rasch die Anzahl von Möglichkeiten auf ein handhabbareres Maß zu reduzieren, versagen häufig dabei auch nur eine geringe Wahrscheinlichkeit für die korrekte Sequenz nahezulegen, da unkorrekt eliminiert worden ist, aufgrund eines Fehlers dieses Tests. Dies kann auftreten aufgrund einer unkorrekten Zuordnung eines Signals zu einer Reihe, einer kleineren als erwarteten Signalintensität oder einer etwas ungenauen Massemessung. Diejenigen, die eine zusätzliche Information erfordern, wie etwa eine Teilsequenz, werden versagen, wenn diese Information tatsächlich unkorrekt oder nicht erhältlich ist. Diejenigen, die versuchen Muster in den beobachteten Daten zu erkennen, sind stark abhängig von einem präzisen Verständnis der Fragmentierungsmechanismen, welche die Natur des Spektrums bestimmen, und die Komplexität der umfassten Verfahren ist so, dass universell anwendbare Regeln derzeit nicht formuliert werden können. So ist die Wiedereinführung in GB 2,325,465 des "de-novo"-Ansatzes von Sakurai et al., Ishikawa, et al. und Hamm et al. (ibid.), worin alle möglichen Sequenzen verglichen werden mit den beobachteten Daten, weder unter Eliminierung von Wahrscheinlichkeiten, noch in Abhängigkeit von einer maschinellen Interpretation der chemischen Regeln, deutlich wünschenswert. Jedoch GB 2,325,465 entwickelt die Technik nicht in der Praxis und erneuert bloß die früheren Techniken.
  • Daher gibt es keine frühere Lehre eines "de-novo"-Peptidsequenzierungsverfahrens für MS/MS-Spektren, welches in der Lage ist zum Handhaben der Daten von Peptiden mit mehr als etwa zehn Aminosäuren. Vollständige Durchsuchungen erfordern eine zu lange Zeit am Computer, der typischerweise verwendet wird, um Daten zu verarbeiten, die durch Massenspektrometer erzeugt werden, um MS/MS-Daten zu erhalten. Ein Gegenstand der vorliegenden Erfindung ist die Bereitstellung eines Verfahrens zum Sequenzieren eines Peptids, entweder einzeln oder enthalten in einem Gemisch von Peptiden, durch Tandemmassenspektrometrie, ohne die Verwendung zusätzlicher Daten, die die Natur des Peptids betreffen und ohne eine Begrenzung der Anzahl möglicher Sequenzen, die betrachtet werden. Ein weiterer Gegenstand ist die Bereitstellung eines solchen Verfahrens, das implementiert werden kann in einen Personal Computer, der typischerweise verwendet wird zur Datenaufnahme von einem Tandenmassenspektrometer, selbst in dem Falle von Peptiden, die 10 oder mehr Aminosäuren umfassen. Ein anderer Gegenstand ist die Bereitstellung eines solchen Verfahrens, welches nicht auf dem erschöpfenden Vergleich der Spektren beruht, die von jeder möglichen Aminosäuresequenz vorhergesagt werden, die übereinstimmend ist mit einem beschränkten Molekulargewicht, sondern mathematische Techniken verwendet, um den Effekt einer solchen vollständigen Suche zu simulieren, ohne sie tatsächlich durchzuführen.
  • Gemäß diesen Gegenständen liefert die Erfindung ein Verfahren zum Identifizieren der wahrscheinlichsten Aminosäuresequenzen, die verantwortlich sein könnten für ein Massenspektrum, das erhalten wird von einem Peptid, das eine unbekannte Sequenz von Aminosäuren aufweist, wobei das Verfahren die Schritte umfasst:
    • a) Erzeugen eines bearbeitbaren Massenspektrums des Peptids;
    • b) Auswählen einer begrenzten Anzahl von Probesequenzen von Aminosäuren, die übereinstimmend sind mit einer vorausgehenden Wahrscheinlichkeitsverteilung; und
    • c) iteratives Modifizieren der Probesequenzen durch einen terminierte Markov Chain Monte Carlo-Algorithmus (MCMC), um neue Probesequenzen zu erzeugen, unter Verwendung von Modifikationen in jeder Stufe, die innerhalb der vorausgehenden Wahrscheinlichkeitsverteilung liegen, Berechnen der Wahrscheinlichkeit jeder der Probesequenzen, die für das bearbeitbare Massenspektrum verantwortlich sind, und akzeptieren oder verwerten jeder der Probesequenzen entsprechend der Wahrscheinlichkeit und dem mathematischen Prinzip der detaillierten Bilanz (detailed balance).
  • In bevorzugten Verfahren wird die Wahrscheinlichkeit einer speziellen Probesequenz, die zu dem bearbeitbaren Massenspektrum beiträgt, beurteilt unter Verwendung des Bayes' Theorems. Eine vorläufige (prior) Wahrscheinlichkeit wird der Sequenz zugeordnet und wird multipliziert mit einem Wahrscheinlichkeitsfaktor, der das Ausmaß der Übereinstimmung zwischen einem vorhergesagten Spektrum für die Sequenz und dem bearbeitbaren Massenspektrum widerspiegelt. Dieses Verfahren wird repräsentiert durch die Gleichung Wahrscheinlichkeit (Probesequenz UND bearbeitbares Spektrum) _ Vorläufig (Probesequenz) × Wahrscheinlichkeit (bearbeitbares Spektrum der GEGEBENEN Probesequenz)
  • Herkömmlicherweise kann der Ausdruck
    Vorläufig (Probesequenz)
    bestimmt werden aus der natürlichen (oder anderen) Häufigkeit jedes der Aminosäurereste, die in der Probesequenz umfasst sind. Der Ausdruck
    Wahrscheinlichkeit (bearbeitbares Spektrum der GEGEBENEN Probesequenz)
    ist der Wahrscheinlichkeitsfaktor und kann bestimmt werden unter Verwendung eines Fragmentierungsmodells, das auf Wahrscheinlichkeit beruhend aufsummiert über alle Wege, auf welchen eine Probesequenz fragmentieren kann und zu Signalen in dem bearbeitbaren Massenspektrum führt.
  • In einer bevorzugten Ausführungsform kann die begrenzte Anzahl von Probeaminosäuresequenzen, die ausgewählt wird in Schritt b) etwa 100 Mitglieder umfassen, pseudo-statistisch ausgewählt aus der vorläufigen Wahrscheinlichkeitsverteilung. Die Verteilung kann Sequenzen umfassen, die auf einer Bibliothek der 20 häufigsten Aminosäurereste beruht, jedoch ist es innerhalb des Bereichs der Erfindung weniger übliche oder bis dahin unbekannte Reste zu umfassen. Die Verteilung verkörpert eine grobe vorausgehende Information über die Natur der unbekannten Peptidprobe, jedoch ihre Bestimmung kann nur minimale Information über die Probe erfordern. Zum Beispiel kann es ausreichend sein, dass die Probesequenzen, die davon ausgewählt werden, chemisch plausibel sind und keine solche Länge aufweisen, daß sie offensichtlich die Probe nicht repräsentieren könnten. Die Aminosäurezusammensetzung der Probe, falls sie bekannt ist, kann ebenfalls ausreichend sein. In bevorzugten Verfahren kann jedoch die Verteilung eingegrenzt werden durch das ungefähre Molekulargewicht der Probe, z.B. innerhalb von +/- 5 Dalton, am bevorzugtesten innerhalb von +/- 0,5 Dalton, falls es ausreichend genau bekannt ist. Im Allgemeinen wird, umso mehr Eingrenzungen, die für die voläufige Wahrscheinlichkeitsverteilung bestehen können, umso schneller die Computerberechnungen sein und umso enger eingegrenzt werden die wahrscheinlichsten Sequenzen für das unbekannte Peptid sein.
  • Es versteht sich, dass in den Anfangsschritten des Verfahrens die Probesequenzen wenig Widerspiegelung der tatsächlichen Sequenz des unbekannten Peptids aufweisen können. Zur Sicherstellung einer leichten Konvergenz mit den wahrscheinlichsten Sequenzen kann in weiteren bevorzugten Verfahren der Beitrag des Wahrscheinlichkeitsfaktors zur Wahrscheinlichkeitsbewertung kontrolliert werden durch simuliertes Annealen. Typischerweise kann der Wahrscheinlichkeitsfaktor auf eine Fraktionspotenz erhöht werden, die anfangs Null ist und schrittweise erhöht wird, wenn der Logarithmus fortschreitet, sodass den experimentellen Daten schrittweise erhöhte Bedeutung gegeben wird.
  • Ein weiterer Vorteil bei der Verwendung des simulierten Annealens ist, dass der verwendete Algorithmus angeben kann wenn eine ausreichende Anzahl von Probesequenzen getestet worden ist, sodass die Erzeugung von Probesequenzen automatisch beendet werden kann. Der simulierte Anneal-Algorithmus kann an sich auf der Basis der Wahrscheinlichkeiten, die vorläufigen getesteten Sequenzen zugeschrieben werden, die Fraktionspotenz bestimmen, die aktuell anzuwenden ist auf die Wahrscheinlichkeitsfaktoren der aktuellen Probesequenzen. Daher wird in weiteren bevorzugten Ausführungsformen der Erfindung die Erzeugung und das Testen neuer Probesequenzen fortgesetzt, bis der simultierte Anneal-Algorithmus die Potenz auf den richtigen Wert (Einheit) einstellt, auf welchen die Wahrscheinlichkeitsfaktoren erhöht werden.
  • Gemäß der Erfindung erzeugt ein Markov Chain Monte Carlo Algorithmus neue Probeaminosäuresequenzen. Die Verwendung eines solchen Algorithmus erlaubt die Identifizierung der wahrscheinlichsten Sequenzen ohne die Erfordernis jede mögliche Sequenz von Aminosäuren zu testen, die z.B. zu dem beobachteten Molekulargewichtsbereich des unbekannten Peptids beitragen kann. Zum Erreichen maximaler Effizienz sollten die Veränderungen, die an den Probesequenzen durchgeführt werden, vorzugsweise eher auf eine chemisch sinnvolle Art als rein statistisch durchgeführt werden. Daher kann in weiteren bevorzugten Ausführungsformen der Erfindung der Markov Chain Monte Carlo Algorithmus ein Probesequenz in mindestens einem und vorzugsweise gemäß einen der folgenden Wege modifizieren:
    • a) Revertieren einer aufeinanderfolgenden bzw. angrenzenden Subsequenz mit statistisch gewählten Endpunkten, z.B. kann eine Sequenz ...ARQEIK ... geändert werden in ...KIEQRA....
    • b) Zyklisieren einer aufeinanderfolgenden Subsequenz mit statistisch gewählten Endpunkten, z.B. kann ...ARQEIK... geändert in ...QEIKAR...
    • c) Permutieren einer aufeinanderfolgenden Subsequenz mit statistisch gewählten Endpunkten, z.B. kann eine Sequenz ...ARQEIK... geändert in ...IQRKAE...
    • d) Ersetzen einer aufeinanderfolgenden Subsequenz mit statistisch gewählten Endpunkten durch eine andere Subsequenz mit ungefähr der gleichen nominellen Masse, z.B. kann ...NEQ... ersetzt werden durch ...EKGG...
    • e) Austauschen der C-terminalen und N-terminalen Enden von zwei Sequenzen zum Erhalten der nominellen Masse, z.B. können die Sequenzen EKGG-DQCYKR und NEN-YKDQCR geändert werden in NEN-DQCYKR und EKGG-YKDQCR.
  • Es wird zu schätzen sein, dass diese Liste möglicher Mutationen nicht ausschließlich ist und viele andere in dem Markov Chain Monte Carlo Algorithmus enthalten sein können. Jedoch zum Minimieren der Gefahr, dass der Algorithmus nicht alle Regionen hoher Wahrscheinlichkeit der Probesequenzen, die zum bearbeitbaren Massenspektrum beitragen, untersucht, ist es wünschenswert, dass mindestens ein "genetischer Algorithmus", wie durch die Mutation e) oben beispielhaft dargestellt, enthalten ist. Gemäß dem Markov Chain Monte Carlo-Verfahren kann die Auswahl wie Mutationen einer speziellen Sequenz durchzuführen sind, durch einen Pseudozufallszahlengenerator bestimmt werden.
  • In noch weiteren bevorzugten Verfahren wird ein neues Fragmentierungsmodell, welches Wahrscheinlichkeiten aufsummiert über alle Wege, auf welchen eine Probesequenz fragmentieren kann, um Signale in dem bearbeitbaren Massenspektrum zu ergeben, verwendet. Ein solches Modell kann basieren auf der Herstellung von mindestens zwei Reihen von Ionen, die b-Reihe, (welche Ionen umfasst, die den N-terminalen Rest der Probesequenz und den Verlust der C-terminalen Aminosäurereste umfasst) und die y"-Reihen (welche Ionen umfasst, die den C-terminalen Rest und den Verlust der N-terminalen Aminosäurereste darstellt). Jede Ionenfamilie verhält sich als kohärente Reihe, wobei Nachbarionen entweder wahrscheinlich beide vorliegen oder beide nicht vorliegen. Das Verhalten kann beschrieben werden durch eine Markov-Kette (Markov chain), worin die Wahrscheinlichkeit, dass ein Ion beobachtet wird, dadurch beeinflusst wird, ob sein Vorläufer beobachtet oder nicht beobachtet wurde. Die Parameter der Kette können eingestellt werden, um den Protonenaffinitäten der Reste und ihren physikalischen Bindungsstärken Rechnung zu tragen. Das Fragmentierungsmodell kann verfeinert werden durch Aufnahme anderer Ionenreihen, im Besonderen der a-Reihe (b-Ionen, die CO verloren haben), der z"-Reihe (y"-Ionen, die NH3 verloren haben) und durch den allgemeineren Verlust von NH3 oder N2O, wodurch wiederum Rechnung der Wahrscheinlichkeit der umfassten chemischen Prozesse getragen wird. Immoniumionen, die äquivalent zum Verlust von CO und N aus den verschiedenen Aminosäureresten sind, können ebenfalls umfasst sein. Weiterhin kann das Fragmentierungsmodell die Erzeugung von Subsequenzen von Aminosäuren umfassen, d.h. Sequenzen, die an Aminosäureresten beginnen und enden, innerhalb des unbekannten Peptids. Es wird zu schätzen sein, dass umso realistischer das Fragmentierungsmodell ist, umso besser die Genauigkeit und Geschwindigkeit der Computerberechnung der wahrscheinlichsten Sequenzen sein wird. Es wird daher in Betracht gezogen, dass verschiedene Fragmentierungsmodelle verwendet werden können wenn Fortschritte im Verständnis des chemischen Mechanismus gemacht werden, durch welchen das Massespektrum des Peptids erzeugt wird.
  • Die Verwendung von Markov-Ketten zum Modellieren des Fragmentierungsverfahrens erlaubt die Aufsummierung über alle möglichen Fragmentierungsmuster, die in linearer Zeit zu berechnen sind (d.h. in einer Zeit proportional zur Anzahl von Aminosäureresten in dem Peptid), eher als in einer Zeit proportional zur exponentiell großen Anzahl von Fragmentierungsmustern an sich. Dies erlaubt, dass die Zeit, die für die Vorhersage der wahrscheinlichsten Sequenzen erforderlich ist, auf einen praktischen Wert reduziert wird (d.h. etwa eine Minute) selbst für Peptide mit 10 oder mehr Aminosäuren, unter Verwendung eines typischen Personal Computers. Jedoch wird es einzuschätzen sein, dass die Erfindung nicht begrenzt ist auf das spezielle oben beschriebene Fragmentierungsmodell, sondern jedes Wahrscheinlichkeitsfragmentierungsmodellumfasst, das in die Computerberechnung in polynomineller Zeit integriert werden kann. Das Ergebnis der Verwendung eines solchen Modells ist ein Wahrscheinlichkeitsfaktor
  • Wahrscheinlichkeit(bearbeitbares Spektrum der GEGEBENEN Probsequenz)
    der verwendet werden kann in dem Markov Chain Monte Carlo Algorithmus.
  • Obwohl in bestimmten Einzelfällen das bearbeitbare Massenspektrum einfach das beobachtete Massenspektrum sein kann, ist es im Allgemeinen bevorzugt, das beobachtete Spektrum in eine geeignetere Form überzuführen bevor versucht wird das Peptid zu sequenzieren. Vorzugsweise wird das bearbeitbare Spektrum erhalten durch Konvertieren mehrfach geladener Ionen und isotoper Cluster von Ionen in einen einzelnen Intensitätswert mit dem Masse-zu-Ladung-Verhältnis, das einem einfach geladenen Ion des Isotops mit der geringsten Masse entspricht, und Berechnen eines Unsicherheitswerts für die tatsächliche Masse und die Wahrscheinlichkeit, dass ein Signal bei diesem Masse-zu-Ladung-Verhältnis tatsächlich beobachtet worden ist. Üblicherweise kann der Unsicherheitswert eines Signals, basieren auf der Standardabweichung eines Gaußschen Signals, das das bearbeitete Signal darstellt und die Wahrscheinlichkeit, dass ein Signal tatsächlich beobachtet wird, in Bezug gebracht werden mit dem Signal-zu-Rausch-Verhältnis des Signals in dem beobachteten Spektrum. Das Programm "MaxEnt3TM", das von Micromass UK Ltd. erhältlich ist, kann verwendet werden, um das bearbeitbare Spektrum aus einem beobachteten Spektrum zu erhalten.
  • Man wird es zu schätzen wissen, dass ein beschriebenes Fragmentierungsmodell verwendet werden kann, um die Wahrscheinlichkeit einer Probesequenz von Aminosäuren zu berechnen, die zu einem gegebenen Massenspektrum beiträgt, ungeachtet dessen, wie diese Probesequenz hergeleitet worden ist. Aus einer anderen Sicht umfasst daher die Erfindung ein Verfahren zum Berechnen der Wahrscheinlichkeit, dass ein experimentell bestimmtes Massenspektrum eines Peptids oder eines ähnlichen Moleküls eine gegebene Sequenz von Aminosäuren erklären durch die Verwendung eines Fragmentierungsmodells kann, das Wahrscheinlichkeiten aufsummiert über alle Wege, über die eine gegebene Sequenz fragmentieren kann. Vorzugsweise kann das Fragmentierungsmodell die Fragmentierung der Sequenz mittels Markov-Ketten (Markov chains), auf die oben beschriebene Art modellieren. Ebenfalls ist das experimentell bestimmte Massenspektrum ein bearbeitbares Spektrum, das auf die oben beschriebene Art erhalten wird. Zum Beispiel kann ein Fragmentierungsmodell gemäß der Erfindung verwendet werden, um die Wahrscheinlichkeit von Aminosäuresequenzen zu berechnen, die in einer bestehenden Protein- oder Peptiddatenbank umfasst sind, die ein experimentell beobachtetes Massenspektrum eines Peptids erklären. Auf diese Art kann das Peptid und/oder das Protein, von welchem es abgeleitet ist, identifiziert werden. Üblicherweise werden in einem solchen Verfahren nur Sequenzen oder Teilsequenzen, die ein Molekulargewicht in einem gegebenen Bereich aufweisen, ausgewählt aus der Datenbank zur Eingabe für das Fragmentierungsmodell.
  • Zum Ausführen der Verfahren der Erfindung kann eine Probe, die ein oder mehrere unbekannte Peptide enthält, in ein Tandemmassenspektrometer eingebracht werden und unter Verwendung von Elektronensprayionisation ionisiert werden. Die Molekulargewichte der unbekannten Peptide können typischerweise bestimmt werden durch Beobachten der Molekülionengruppen der Signale in einem Massenspektrum der Probe. Der erste Analysator des Tandemmassenspektrometers kann dann eingestellt werden, um die Molekülionengruppe von Signalen, die einem der unbekannten Peptide entspricht, einer Kollisionszelle in eine Kollissionszellle zu überführen, worin die Molekülionen fragmentiert werden durch Kollision mit neutralen Gasmolekülen. Der zweite Masseanalysator des Tandemmassespektrometers kann dann verwendet werden, um ein beobachtetes Fragmentierungsmassespektrum des Peptids aufzuzeichnen. Ein bearbeitbares Massenspektrum kann dann aus dem beobachteten Massenspektrum erhalten werden, unter Verwendung geeigneter Computer-Software, wie beschrieben. Wenn die Probe ein Gemisch von Peptiden umfasst, z.B. wie es erzeugt werden kann durch typtischen Verdau eines Proteins, können weitere Peptide analysiert werden durch Auswählen der geeigneten Molekülionengruppe, unter Verwendung des ersten Massenanalysators.
  • Aus einer anderen Sicht betrachtet, liefert die Erfindung eine Vorichtung zum Identifizieren der wahrscheinlichsten Sequenzen von Aminosäuren in einem unbekannten Peptid, wobei die Vorrichtung ein Massenspektrometer zum Erzeugen eines Massespektrums des unbekannten Peptids und Datenbearbeitungsmittel umfasst, die programmiert sind um:
    • a) Daten zu bearbeiten, die erzeugt werden durch das Massenspektrometer, um ein bearbeitbares Massenspektrum herzustellen;
    • b) Eine begrenzte Anzahl von Probeaminosäuresequenzen auszuwählen, die übereinstimmend sind mit einer vorläufigen (prior) Wahrscheinlichkeitsverteilung;
    • c) Die Probesequenzen iterativ zu modifizieren durch einen terminierte Markov Chain Monte Carlo Algorithmus, um weitere Probesequenzen zu erzeugen, die übereinstimmend sind mit einer vorläufigen Wahrscheinlichkeitsverteilung, um die Wahrscheinlichkeit jeder der Probesequenzen zu berechnen, die zu dem bearbeitbaren Massenspektrum beiträgt und jede der Probesequenzen gemäß der Wahrscheinlichkeit und des mathematischen Prinzips der detaillierten Bilanz (detailed balance) zu akzeptieren oder zu verwerten.
  • In bevorzugten Ausführungsformen umfasst eine Vorrichtung gemäß der Erfindung ein Tandemmassenspektrometer und am bevorzugtesten ein Tandemmassenspektrometer, das einen Flugzeitmassenanalysator mindestens in seiner letzten Stufe aufweist. Ein Flugzeitmassenanalysator ist bevorzugt, da er im Allgemeinen in der Lage ist, zur genaueren Massenmessung als ein Quadrupol-Analysator. Vorzugsweise umfasst das Massenspektrometer auch eine Elektronensprayionisationsquelle, in welche eine unbekannte Peptidprobe eingeleitet werden kann.
  • Ein bevorzugtes Verfahren der Erfindung wird nun detaillierter unter Bezugnahme auf die Figuren beschrieben werden, worin:
  • 1 eine schematische Zeichnung eines Tandem-TOF-Massenspektrometers ist, das geeignet ist zum Erzeugen eines Massenspektrums aus einer unbekannten Peptidprobe;
  • 2 ein Flußdiagramm ist, das die Durchführung eines Verfahrens gemäß der Erfindung darstellt;
  • 3 ein Massenspektrum eines typtischen Verdaus von humanem Transferrin-Vorläufer-Protein ist;
  • 4 ein Fragmentierungsmassenspektrum des m/z = 864,4-Signals in dem Spektrum von 3 ist;
  • 5 das Spektrum von 4 nach Bearbeiten mit dem Programm "maxEnt3TM" ist;
  • 6 ein Fragmentierungsspektrum des m/z = 815,4 Signals im Spektrum von 3 ist; und
  • 7 das Spektrum von 6 nach Bearbeiten mit dem Programm "MaxEnt3TM" ist.
  • Beginnend mit Bezugnahme auf 1 werden die prinzipiellen Komponenten eines Tandemflugzeitmassenspektrometers, das geeignet ist zum Durchführen der Verfahren gemäß der Erfindung in schematischer Form gezeigt. Eine unbekannte Peptidprobe oder ein Gemisch aus solchen Proben wird eingeleitet in eine Kapillare 17, die in einer Elektronensprayquelle enthalten ist, die allgemein mit 1 bezeichnet wird. Ein Strahl 18, der Ionen umfasst, die charakteristisch für das Peptid sind, wird in der Quelle 1 erzeugt und mindestens ein Teil dieser Ionen gelangt durch eine Öffnung in einem Probenkonus 2 in eine erste evakuierte Kammer 3. Aus der Kammer 3 gelangen die Ionen über eine Öffnung in einen Sammelkonus bzw. Skimmerkonus 4 in eine zweite evakuierte Kammer 5 und werden dann mittels einer Hexapol-Ionenführung 6 in einen Quadropolmassenanalysator 7 befördert, der in einer dritten evakuierten Kammer 8 angeordnet ist.
  • In einem Spektrometer der Art, die in 1 dargestellt ist, kann das Molekülgewicht des Peptids bestimmt werden unter Verwendung des Masseanalysators 7 in einem Nicht-Masse-selektiven Modus, während ein Massenspektrum der Probe aufgenommen wird. Vorzusweise wird das Molekulargewicht innerhalb von +/- 0,5 Dalton bestimmt.
  • Zum Aufzeichnen eines Fragmentierungsspektrums eines unbekannten Peptids kann der Massenanalysator 7 eingestellt werden, um nur die Molekülionen des unbekannten Peptids (oder eines ausgewählten aus mehreren Peptiden, wenn mehr als eines in der Probe vorliegt) zu übertragen. Molekülionen des unbekannten Peptids gelangen dann vom Massenanalysator 7 in eine Hexapolkollisionszelle 9, die ein Kollisionsgas (typischerweise Helium oder Argon) bei einem Druck zwischen 0,133 und 1,33 Pa (1013 und 10-2 Torr) enthält und werden fragmentiert, um Fragmentionen zu bilden, welche kennzeichnend für die Sequenz des unbekannten Peptids sind. Typischerweise umfassen diese Fragmentionen Ionen, die gebildet werden durch verschiedene Verluste der Aminosäurereste von sowohl den C- als auch N-Termini des Peptidmoleküls, wie unten detaillierter diskutiert.
  • Die Fragmentionen, die in der Kollisionszelle 9 gebildet werden, gelangen in einen Flugzeitmassenanalysator, der allgemein als 10 angegeben wird, über eine elektrostatische Linse 11. In dem Flugzeitanalysator 10 werden die Ionen durch eine Ionenstoßvorrichtung (ion-pusher) 12 aufgenommen, die bewirkt, dass Ionenbündel 10 durch einen Driftbereich 13 von der Stoßvorrichtung zu einem Ionenreflektor 14 laufen, dann zurück in einen Ionendetektor 15, wie in 1 gezeigt. Die Masse der Ionen wird dann bestimmt durch Messen der Zeit, die für sie erforderlich ist, um den Detektor 15 zu erreichen, relativ zur Zeit, in welcher sie von der Ionenstoßvorrichtung 12 ausgegeben wurden. Ein Datenerfassungssystem 16 steuert diesen Prozess und ist programmiert, um ein Verfahren der Erfindung auszuführen, wie unten diskutiert. Der Massenbereich des gesamten Spektrometers sollte mindestens 2500 Dalton sein und es sollte vorzugsweise in der Lage sein zum Bestimmen der Massen der Fragmentionen auf mindestens +/- 0,5 und vorzugsweise +/- 0,05 Dalton. Ein geeignetes Massenspektrometer ist von Micromass UK Ltd als das "Q-Tof' erhältlich.
  • Bezugnehmend auf 2 beginnt ein bevorzugtes Verfahren gemäß der Erfindung durch Aufnehmen eines Fragmentierungsmassenspektrums des unbekannten Peptids unter Verwendung des Tandemmassenspektrometers von 1.
  • Das Fragmentierungsspektrum ist in der Praxis verkompliziert durch das Auftreten von mehrfach geladenen Ionen und Isotopen-Clustern (d.h. mehrere Signale, die mit einem einzigen Ion einer speziellen nominellen Masse verbunden sind, die eine Folge des natürlichen Auftretens von verschiedenen Kohlenstoff-, Wasserstoff-, Sauerstoff-, Stickstoff- und Schwefel-Isotopen sind, die in dem Ion umfasst sind). Das Verfahren wird daher vereinfacht durch Überführen des Rohfragmentierungsspektrums in ein "bearbeitbares" Spektrum. In einem solchen Spektrum können die mehrfach geladenen Ionen übergeführt werden in ein entsprechendes einfach geladenes Ion mit der geeigneten nominellen Masse und die unbedeutenden Signale, die in jedem Isotopen-Cluster umfasst sind, werden dem Hauptsignal zugeordnet, das die Stammisotopenvariante darstellt (d.h. umfassend 12C, 16O,15N,1H, 32S). Das Programm "MaxEnt3TM", das von Micromass UK Ltd. erhältlich ist, kann für diesen Zweck verwendet werden, jedoch eine andere Software, die für diese Schritte geeignet ist, kann ebenfalls verwendet werden.
  • Es ist ebenfalls bevorzugt, jedes Signal in dem bearbeitbaren Massenspektrum als einen einzelnen nominellen Massewert zusammen mit einem Unsicherheitswert anzugeben, z.B. 512,30 +/- 0,05 Dalton, eher als eine Reihe von realen Datenpunkten, die ein annähernd Gaußsches Signal bilden, wie es in dem Rohspektrum auftreten würde. Das Programm "MaxEnt3TM" führt ebenfalls diese Umwandlung durch, jedoch könnte jede geeignete Signalerkennungssoftware verwendet werden. Jedoch ist gefunden worden, dass die Genauigkeit der letztendlich wahrscheinlichsten Sequenzen, die durch Verfahren gemäß der Erfindung vorhergesagt werden, stark abhängig ist von dem Bereich der Massen, die den Bestandteilssignalen in dem bearbeitbaren Massenspektrum zugeschrieben werden. Folglich müssen sowohl die Kalibrierung der Massenskala des Tandenmassenspektrometers als auch die Umwandlung der Rohsignale in ihre normalen Massen und ihre Unsicherheiten sorgfältig und gründlich durchgeführt werden. Es ist gefunden worden, dass die Intensitäten der Signale in dem Fragmentierungsspektrum wenig Wert haben beim Vorhersagen der Sequenz eines unbekannten Peptids. Anstelle von Intensitäten sollte daher die Signalerkennungssoftware eine Wahrscheinlichkeit berechnen, dass jedes Signal tatsächlich nachgewiesen worden ist in dem Fragmentierungsspektrum, als dass es zurückzuführen ist auf ein Rauschen oder einen störenden Hintergrund. Das Progamm "MaxEnt3" ist ebenfalls zu diesem Schritt in der Lage.
  • Zum Vorhersagen der Sequenz des unbekannten Peptids wird zuerst ein Anfangssatz von ungefähr 100 Probesequenzen erzeugt, indem sie pseudostatistisch gemäß den Beschränkungen aufgebaut werden, die durch die vorläufige Wahrscheinlichkeitsverteilung auferlegt werden. Die in diesem Anfangssatz enthaltenen Sequenzen basieren auf pseudo-statistischen Kombinationen der Aminosäurereste, die in einer Bibliothek enthalten sind und können Wahrscheinlichkeiten zugeschrieben werden, die das natürliche Auftreten der betreffenden Aminosäuren widerspiegeln. Die Bibliothek umfasst typischerweise die 20 häufigsten Aminsäuren oder chemischen Modifikationen der häufigsten Aminosäuren, falls dies gewünscht ist. Tabelle 1 führt diese Aminosäuren zusammen mit ihren Molekulargewichten auf. TABELLE 1 – Die 20 am häufigsten auftretenden Aminosäurereste
    Figure 00200001
  • Die vorläufige Wahrscheinlichkeit, die jeder Probesequenz zugeschrieben wird, wird berechnet durch Multiplizieren der Wahrscheinlichkeiten (welche immer im Bereich 0 ≤ p ≤ 1 liegen müssen) jeder der Aminosäuren in den Sequenzen, z.B. würde die Sequenz ETDDCQ einer vorläufigen von 0,0637 × 0,0567 × 0,0528 × 0,0528 × 0,166 × 0,0397 = 6,63 × 10-9 auf der Basis des natürlichen Auftretens, das in Tabelle 1 gezeigt wird, zugeschrieben werden.
  • Der Anfangssatz der Probesequenzen wird zusätzlich begrenzt durch das Molekulargewicht des Peptids, das bekannt ist aus dem Massespektrum, das durch den ersten Massenanalysator erzeugt wird (1). Um die Probesequenzen auf ein gegebenes Molekulargewichtsfenster (typischerweise +/- 0,5 Dalton) zu begrenzen, wird zuerst eine Unterbibliothek von vorberechneten Teilsequenzen mit verschiedenen Molekulargewichten < 700 Dalton vorbereitet und entsprechend des Molekulargewichts indiziert. Probesequenzen werden dann statistisch Rest für Rest aufgebaut bis die Summe der Molekulargewichte sich um weniger als 700 Dalton vom Molekulargewicht des unbekannten Peptids unterscheidet. Die Probesequenz wird dann vervollständigt durch eine der vorberechneten Sequenzen, deren Molekulargewicht ungefähr gleich dem Unterschied zwischen der teilweise vervollständigten Sequenz und der des Peptids ist. Als eine weitere Verfeinerung kann dann die gesamte Probesequenz pseudo-statistisch permutiert werden, um den systematischen Fehler gegenüber einem schweren Rest, wie etwa Typtophan, am Ende der Sequenz zu minimieren.
  • Die nächste Stufe des Verfahrens ist der Vergleich jeder der Probesequenzen mit dem bearbeitbaren Spektrum und die Berechnung einer Wahrscheinlichkeit, dass jede Sequenz zum Spektrum beiträgt, unter Verwendung des Bayes' Theorems Wie bereits erklärt, wird dies durchgeführt durch Multiplizieren der vorläufigen Wahrscheinlichkeit gemäß obiger Berechnung mit einem Wahrscheinlichkeitsfaktor, der das tatsächliche Ausmaß der Übereinstimmung zwischen einem vorhergesagten Spektrum aus der Probesequenz und dem bearbeitbaren Spektrum darstellt, d.h.: Wahrscheinlichkeit (Probesequenz, bearbeitbares Spektrum) = Vorläufig (Probesequenz) × Wahrscheinlichkeit (bearbeitbares Spektrum der GEGEBENEN Probesequenz).
  • Der letztere Ausdruck ist der Wahrscheinlichkeitsfaktor. Die Abschätzung des Wahrscheinlichkeitsfaktors wird unten detailliert diskutiert. Neue Probesequenzen werden dann erzeugt, unter Verwendung eines Markov Chain Monte Carlo (MCMC)-Algorithmus und die Wahrscheinlichkeit dieser Sequenzen wird wie beschrieben berechnet.
  • Die Anwendung der MCMC-Algorithmen auf experimentelle wissenschaftliche Daten ist in einer Übersicht dargestellt von Skilling in J. Microscopy 1998, Band 190 (1/2), S. 28-36. In der vorliegenden Erfindung simuliert die Verwendung eines solchen Algorithmus die Untersuchung von einer gewaltigen Anzahl möglicher Sequenzen durch Aufnahme der Probesequenzen und ihr Verändern auf eine pseudo-statistische Art, um neue Probesequenzen zu erzeugen. Jede der so erzeugten neuen Sequenzen muss natürlich innerhalb der Einschränkungen liegen, die durch die vorläufige Wahrscheinlichkeitsverteilung, die zuvor diskutiert worden ist, auferlegt werden, insbesondere im Hinblick auf das Molekulargewicht. Eine neue Sequenz wird akzeptiert, wenn die Wahrscheinlichkeit einer Übereinstimmung zwischen einem vorhergesagten Spektrum durch sie erhöht wird, oder möglicherweise akzeptiert, falls es erniedrigt wird, gemäß dem mathematischen Prinzip der detallierten Bilanz (detailed balance), welches inhärent in allen geeigneten Algorithmen ist. Probesequenzen mit den geringsten Wahrscheinlichkeiten verschwinden fortschreitend aus den Berechnungen, sodass mit Fortschreiten des Algorithmus die Wahrscheinlichkeit von bestimmten Sequenzen, die sich in der Berechnung entwickelt, die Wahrscheinlichkeit widerspiegeln, die ihnen zugeordnet wird durch Bayes' Ansatz, der oben angegeben ist. Die wahrscheinlichsten Sequenzen, die während einer beliebigen Stufe während der Algorithmus läuft, vorhergesagt wird, kann bestimmt werden, indem bewirkt wird, dass der Computer, der den Algorithmus durchläuft, eine Liste der Sequenzen ausgibt, die zu dieser Zeit Veränderungen unterliegen.
  • Die wahrscheinlichsten Sequenzen, die so identifiziert werden, werden möglicherweise den wahrscheinlichsten Sequenzen für das unbekannte Peptid entsprechen, basierend auf seinem Tandemmassenspektrum, und der Algorithmus kann dann beendet werden. Ein präziserer Weg zum Beenden des MCMC-Algorithmus wird unten diskutiert.
  • Aus anderer Sicht betrachtet, lernt der Algorithmus mit seinem Fortschreiten Domänen potenzieller Sequenzen zu vermeiden, die geringe Wahrscheinlichkeiten aufweisen, und beginnt sich zu verbreiten zwischen relativ wenigen plausiblen Sequenzen, die hohe Wahrscheinlichkeiten aufweisen. MCMC-Algorithmen erreichen dies ohne spezifisches Testen aller möglichen Sequenzen, da Veränderungen, die in Richtung neuer Sequenzen mit geringeren Wahrscheinlichkeiten führen, möglicherweise verworfen werden bevor übermäßige Modifikationen der Sequenzen mit geringerer Wahrscheinlichkeit (welche zu Sequenzen mit noch geringerer Wahrscheinlichkeit führen würden) durchgeführt werden. Im derzeit bevorzugten Verfahren werden Markov Ketten begonnen an jeder der 100 Probesequenzen des anfänglichen Satzes und die Gesamtzahl von Sequenzen, die erhältlich sind zur Abwandlung wird um den Wert 100 gehalten, wobei die Sequenzen mit geringster Wahrscheinlichkeit, die so erzeugt werden, verworfen werden und eine Konzentration auf diejenigen mit der höchsten Wahrscheinlichkeit erfolgt. Mit Fortschreiten des Algorithmus besteht daher die Tendenz, dass die gesamte Erinnerung an den anfänglichen Satz von Sequenzen verlorengeht.
  • Die mathematischen Details geeigneter MCMC-Algorithmen sind angegeben worden von Hastings, in Biometrika 1970, Band 57, S. 97-109, Gelfand und Smith in J. Am. Statis. Assoc. 1990, Band 85, S. 398-409, Smith in Philos. Trans. R. Soc. London A, 1991, Band 337, S. 369-386, Smith und Roberts in J. Royal Statis. Soc. B, 1993, Band 55, S. 3-23 und Besag und Green in J. Royal. Statis. Soc. B, 1993, Band 55, S. 25-37.
  • Im Speziellen erwiesen sich MCMC-Algorithmen, die einen Metropolis-Algorithmus beinhalten (Metropolis, Rosenbluth, Rosenbluth, Teller und Teller, J. Chem. Phys., 1953, Band 21, S. 1087-1091) als am geeignetsten zur Verwendung in Verfahren gemäß der vorliegenden Erfindung.
  • Es ist sehr wichtig für die effiziente Untersuchung plausibler Sequenzen, dass die Veränderungen, die durch den MCMC-Algorithmus erfolgen, geeignet sind. Vielversprechende Wege, auf welche eine Sequenz modifiziert werden kann, sind oben diskutiert worden. Die Aufnahme dieser Mutationen in den MCMC-Algorithmus erwies sich so, dass sich genaue Sequenzvorhersagen in den meisten getesteten Fällen ergeben, wobei weniger als 5 Minuten Rechenzeit am Computer erforderlich sind, jedoch es ist innerhalb des Bereichs der Erfindung andere chemisch plausible Mutationen aufzunehmen, entweder zum Ersetzen einiger der vorgeschlagenen Mutationen oder zusätzlich zu diesen.
  • In dem bevorzugten Verfahren wird simuliertes Annealen (siehe z.B. Kirkpatrick, Gelatt, Vecchi, Science, 1983, Band 220, S. 671-680 und Aarts, Kost in Simulated Annealing and Boltzmann Machines, Wiley, New York, 1989), um sicherzustellen, dass der MCMC-Algorithmus die wahrscheinlichsten Sequenzen richtig konvergiert. Wie bereits ausgeführt, wird beim Berechnen der Wahrscheinlichkeit einer Probesequenz der Wahrscheinlichkeitsfaktor auf eine Potenz erhöht, welche anfangs auf Null gesetzt ist und wird schrittweise auf eins erhöht, mit Fortschreiten des MCMC-Algorithmus, wobei schrittweise die Bedeutung der experimentellen Daten von dem Punkt keiner Signifikanz auf maximale Signifikanz erhöht wird. Der Ablauf zum Erhöhen der gebrochenen Potenz λ ist wie folgt. Unter Zugrundelegung eines gegebenen Satzes von N Probesequenzen mit Wahrscheinlichkeitswerten L1, ..., LN, werden ein zentraler Wahrscheinlichkeitswert L0 und ein Exponent γ gemäß den Gleichungen:
    Figure 00240001
    und
    Figure 00250001
    definiert werden.
  • Nach jedem iterativen Schritt des vollständigen Satzes von N Mitgliedern, wird eine Probesequenz des weniger wahrscheinlichen Untersatzes gelöscht, entsprechend der Wahrscheinlichkeit Q, und eine Sequenz aus dem wahrscheinlicheren Untersatz wird dupliziert, entsprechend der Wahrscheinlichkeit P. Dieses Verfahren ist äquivalent zur Neugewichtung der Sequenzen des ursprünglichen Satzes durch die Faktoren Lγ i, sodass der Parameter λ dabei um γ auf λ + γ erhöht wird, ohne weitere ad hoc-Vorrichtung.
  • Das Annealen wird beendet wenn λ = 1, an welchem Punkt den experimentellen Daten volle Signifikanz verliehen wird. Der MCMC-Algorithmus kann dann beendet werden und die Probesequenzen, die in Betracht stehen, werden zusammen mit ihren Wahrscheinlichkeiten die wahrscheinlichsten Sequenzen für die unbekannte Peptidprobe darstellen.
  • Zum Berechnen der Wahrscheinlichkeitsfaktoren, die erforderlich sind bei der Bestimmung der Wahrscheinlichkeiten für jede Probesequenz, wird ein Fragmentierungsmodell verwendet, welches die Wahrscheinlichkeit über alle Wege aufsummiert, auf welche eine Probesequenz fragmentieren kann und zu Signalen in dem bearbeitbaren Massenspektrum führt. Dieses Modell sollte als solches chemische Kenntnis beinhalten, die die Fragmentierung von Peptiden in dem Tandemmassenspektrometer betreffen, wie sie zum Zeitpunkt der Erstellung verfügbar sind. Ein bevorzugtes Modell beinhaltet die Erzeugung der folgenden Ionenreihen:
    • a) die b-Reihe (Ionen, die N-terminale Aminosäurereste und den Verlust von C-terminalen Aminosäureresten darstellen);
    • b) Die y"=Reihe (Ionen, die C-terminale Aminosäurereste und Verlust von N-terminalen Aminosäureresten darstellen);
    • c) Die a-Reihe (b-Ionen, die CO verloren haben); und d) z"-Reihe (y"-Ionen, die NH3 verloren haben);
    • e) im Allgemeineren Verlust von NH2 oder H2O.
  • Die beiden Hauptreihen von Ionen (y" und b) werden in dem bevorzugten Fragmentierungsmodell durch Markov-Ketten dargestellt, eine für jede Reihe. In jeder Kette ist die Wahrscheinlichkeit, dass ein spezielles Ion beobachtet wird, abhängig von der Wahrscheinlichkeit seines Vorläufers. Zum Beispiel neigen grundsätzlich aufgrund von Ladungslokalisierung die beobachteten y"-Ionen in einem Fragmentierungsspektrum dazu, eine kohärente Reihe zu bilden, beginnend mit y1 und üblicherweise für einen gewissen Weg unter Fortsetzung mit y2, y2 ....., möglicherweise unter zeitweisem Nachlassen (Fading), jedoch mit wahrscheinlichem Wiederauftreten gegen yn-1 und schließlich für das gesamte Molekül. Eine Markov-Kette modelliert dieses Verhalten durch Einstellen der Wahrscheinlichkeit (P) von vorliegenden y-Ionen als eine wiederkehrende Relation: P(y1) = P1 P(yr) = Pr P(yr-1)+qr(1-P(yr-1))für r = 2,3,4,..., n, worin P(yr) die Wahrscheinlichkeit von vorliegendem yr ist und wobei die Wahrscheinlichkeit von nicht vorliegendem yr 1 – P(yr) ist. Die Koeffizienten p und q sind Übergangswahrscheinlichkeiten, die bestimmen, wie wahrscheinlich es ist, dass die Reihe beginnt, endet und (wieder)beginnt. Ihre Werte können eingestellt werden entsprechend der Ladungsaffinität der Reste, die verbunden ist mit den physikalischen Bindungsstärken. Zum Beispiel beginnt und liegt eine y-Reihe wahrscheinlich vor bei und nach einem Prolinrest, sodass p einem höheren Wert zugeordnet würde, wenn der Rest r Prolin wäre als wenn es ein anderer Rest wäre.
  • Eine ähnliche Markov-Kette kann aufgebaut werden, um die b-Ionen darzustellen, wobei die Beobachtung aufgenommen wird, dass das b1-Ion üblicherweise nicht vorliegt.
  • Diese Markov-Ketten werden ergänzt durch Einführen von Wahrscheinlichkeiten, dass die b-Reihe-Ionen ebenfalls einen Verlust von CO erfahren können, um Ionen in der a-Reihe zu bilden, und dass y"-Reihe-Ionen NH3 verlieren können, um z"-Reihe-Ionen zu bilden, und es kann allgemeinerer ein Verlust von NH3 oder H2O vorliegen. Die Wahrscheinlichkeit, dass ein Fragmention entweder NH3 oder H2O verlieren kann, ist ebenfalls in dem Modell aufgenommen. Jedem geeigneten Prozess ist eine Wahrscheinlichkeit zugeordnet, welche abhängig ist von der betroffenen Chemie, z.B. erhöht sich die Wahrscheinlichkeit eines Wasserverlustes mit der Anzahl von Hydroxylgruppen auf den Seitenketten des Fragments und würde Null sein, wenn keine solchen Hydroxylgruppen vorliegen, die verlorengehen können.
  • Die Bildung von Immoniumionen (welche äquivalent zum Verlust von CO und H aus einem einzelnen Rest sind) ist ebenfalls in dem Fragmentierungsmodell aufgenommen. Nur bestimmte Reste können diese Ionen erzeugen und für diejenigen, für welche dies zutrifft, sind geeignete Wahrscheinlichkeiten vorgesehen. Zum Beispiel führen Histidinreste im Allgemeinen zur Bildung eines Immoniumions bei der Masse 110,072 Dalton und die Wahrscheinlichkeit dieses Prozesses wird daher nahe 100 % gesetzt. Schließlich erlaubt das Fragmentierungsmodell die Bildung interner Sequenzen, die an einem beliebigen Rest beginnen, entsprechend einer Wahrscheinlichkeit, die für den speziellen Rest geeignet ist. Interne Sequenzen werden häufig beobachtet beginnend bei Prolinresten, sodass die Wahrscheinlichkeit, dass einer an einem Prolinrest beginnt, daher hoch gesetzt wird.
  • Es ist zu würdigen, dass umso realistischer das Fragmentierungsmodell ist, umso schneller und genauer die Schlußfolgerung auf die Sequenz des unbekannten Peptids sein wird. Folglich ist es im Bereich der Erfindung, dass, wenn das Verständnis der chemischen Prozesse, die in der Bildung der Fragmentierungsspektren von Peptiden umfasst sind, sich fortentwickelt, das Fragmentierungsmodell entsprechend angepasst wird.
  • Dass das Fragmentierungsmodell außerordentlich wahrscheinlich ist, bedeutet, dass es eine Wahrscheinlichkeitsverteilung über alle Wege, über die eine Probesequenz fragmentieren kann (basierend auf dem Fragmentierungsmodell) erzeugt, eher als eine Liste möglicher Massen in einem vorausgesagten Spektrum. Daher wird der Wahrscheinlichkeitsfaktor berechnet als die Summe über alle diese vielen Fragmentierungsmöglichkeiten, sodass das Fragmentierungsmuster für eine Probesequenz automatisch und individuell an die Daten angepasst wird, die in dem bearbeitbaren Spektrum umfasst sind. In Hinblick auf die Wahrscheinlichkeitstheorie ist der Wahrscheinlichkeitsfaktor des bearbeitbaren Spektrums D unter Vorgabe einer speziellen Probesequenz S
    Figure 00280001
    worin
    Figure 00280002
    die Summe über alle zulässigen Fragmentierungsmuster f darstellt, P(D GEGEBEN f) die Wahrscheinlichkeit des bearbeitbaren Spektrums ist unter Annahme des speziellen Fragmentierungsmusters f, und P(f GEGEBEN S) die Wahrscheinlichkeit des Vorliegens der Fragmentierung f von der Probesequenz S ist. Wie bereits ausgeführt, kann diese Summe am Computer in polynomischer Zeit integriert werden, eher als in einer Zeit, proportional zu der exponentiell großen Anzahl von Fragmentierungsmustern an sich, was zu praktischen Rechenzeiten im Bereich von einer Minute für das gesamte MCMC-Verfahren führt, wobei ein mathematisch strenger Ansatz bereitgestellt wird, ohne Begrenzung der betrachteten Probesequenzen.
  • Wie bereits ausgeführt, umfasst die Erfindung die Verwendung eines Wahrscheinlichkeitsfragmentierungsmodells zum Berechnen der Wahrscheinlichkeit, dass eine gegebene Aminosäuresequenz zu einem experimentell beobachteten Peptidmassenspektrum beitragen könnte, ungeachtet des Ursprungs der Sequenz an sich. Zum Identifizieren eines unbekannten Peptids oder Proteins können daher Probesequenzen mit geeignetem Molekulargewicht erhalten werden aus einer Datenbank bekannter Peptide und Proteine. Ein experimentell bearbeitbares Spektrum und Molekulargewicht des unbekannten Peptids wird zuerst wie oben ausgeführt, erhalten. Probesequenzen oder Teilsequenzen werden dann pseudo-statistisch aus der Datenbank ausgewählt, entsprechend des Kriteriums, dass sie das Molekulargewicht (innerhalb eines experimentellen Fehlers) des unbekannten Peptids aufweisen sollten. Das Fragmentierungsmodell (oben beschrieben) wird dann verwendet, um die Wahrscheinlichkeit zu berechnen, dass jede Probesequenz zu dem bearbeitbaren Spektrum beitragen würde. Die wahrscheinlichsten Probesequenzen, die so identifiziert werden, sollten es dann ermöglichen, das unbekannte Peptid zu identifizieren, vorausgesetzt, dass seine Sequenz tatsächlich in der Datenbank enthalten ist. Da das Fragmentierungsmodell deutlich auf Wahrscheinlichkeiten beruht, erfordert es keine ad hoc-Bewertungsmethode zum Vergleichen des bearbeitbaren Spektrums mit einem Spektrum, das für eine Probesequenz vorausgesagt wird, im Unterschied zu früheren Sequenzierungsverfahren, die verwendet werden in Verbindung mit bestehenden Datenbanken. Es wird nicht nur ein aussagekräftiges Wahrscheinlichkeitsbild für eine gegebene Probesequenz berechnet, sondern es wird die Wahrscheinlichkeit der Zuordnung von jedem Signal des bearbeitbaren Spektrums zu einem gegebenen Aminosäurerestverlust ebenfalls inhärent berechnet. Dies führt zu einer höheren Verlässlichkeit bei der Identifizierung des Peptids und zeigt die Bereiche in einer Sequenz, über welche ein gewisser Zweifel bestehen kann, falls eine einzelne Übereinstimmung sehr hoher Wahrscheinlichkeit nicht erreicht werden kann.
  • Beispiele
  • Eine Probe von humanem Transferrinvorläufer, worin die Cysteingruppen geschützt waren durch Carboxymethylierung, wurde verdaut, unter Verwendung von Trypsin, um ein Gemisch von Peptiden zu erzeugen, welches analysiert wurden durch ein Verfahren gemäß der Erfindung. 3 zeigt das Elektrospraymassenspektrum des Verdaus, der erzeugt wird, unter Verwendung des Quadrupol-Massenanalysators 7 der ersten Stufe im Spektrometer der 1 in einem Nicht-Masse-selektiven Modus. Der Analysator 7 wurde dann optimiert, um Ionen mit einem Masse-zu-Ladung-Verhältnis von 864,4 (tatsächlich ein doppelt geladenes Ion) in die Kollisionszelle 9 (1) überzuführen und das resultierende Fragmentierungsspektrum ist in 4 gezeigt. Ein bearbeitbares Massenspektrum (5) wurde dann gemäß der Erfindung erzeugt, unter Verwendung des Programms "MaxEnt3TM", wie oben diskutiert. Die Daten, auf welchen das Spektrum von 5 basierte, wurden dann bearbeitet durch das bevorzugte Verfahren der Erfindung und die wahrscheinlichsten Sequenzen, die in Tabelle 2 gezeigt sind, wurden vorhergesagt. So ist die Sequenz LECVSAETTEDCLAK bei weitem die wahrscheinlichste Sequenz. Da das Verfahren der Erfindung vollständig auf Wahrscheinlichkeit beruht, wird die Wahrscheinlichkeit der Zuordnung jeder Aminosäure, die von den vorgeschlagenen Aminosäuresequenzen umfasst ist, automatisch vorhergesagt, wie in Tabelle 3 für die wahrscheinlichste Sequenz gezeigt. In Tabelle 3 sind die mit a, b, y und z bezeichneten Reihen die vorausgesagten Masse-zu-Ladung-Verhältnisse der a-, b-, y"- und z"-Reihen für die Sequenz und die unterstrichenen Einträge geben die Ionen an, die gut in dem bearbeitbaren Spektrum nachgewiesen werden. TABELLE 2 Wahrscheinlichste Sequenzen für m/z 864,4
    Figure 00300001
  • Es ist ersichtlich, dass die meisten der vorhergesagten Ionen, die in den y"- und b-Reihen umfasst sind, nachgewiesen worden sind in dem bearbeitbaren Spektrum, sodass die Wahrscheinlichkeiten, die den Aminosäureresten zugeschrieben werden, die in der wahrscheinlichsten Sequenz umfasst sind, sehr hoch sind. Der zweit-wahrscheinlichsten Sequenz, welche sich von der wahrscheinlichsten Sequenz nur durch die Inversion der beiden Reste unterscheidet, wird eine Wahrscheinlichkeit von nur 1,7 % zugewiesen, was zu vergleichen ist mit der Wahrscheinlichkeit von 97,6 % für die wahrscheinlichste Sequenz. Tatsächlich stellt das 864,4++-Ion das bekannte T42-Fragment im Verdau des Proteins dar (siehe Tabelle 4) und die wahrscheinlichste Sequenz ist die korrekte. (In Tabelle 4 wird das Symbl B verwendet, um die carboxymethylierten Cysteinreste darzustellen, welche als C oben aufgeführt sind. Ebenfalls weisen die Reste Leucin (L) und Isoleucin (I) identische Molekulargewichte auf und können so durch Massenspektrometrie nicht unterschieden werden. Beide werden dargestellt durch L in Tabelle 2, jedoch unterschieden in Tabelle 4). Die Position des T42-Fragments in der vollständigen Proteinsequenz ist unterstrichen in Tabell 5 gezeigt.
  • Das Fragmentierungsspektrum eines zweiten Signals (815,4) im Massenspektrum von 3 wurde ebenfalls bestimmt und ist in 6 gezeigt. Ein bearbeitbares Massenspektrum (7) wurde dann aus den Daten erzeugt, die das Massenspektrum von 6 umfassen, unter Verwendung des Programms "MaxEnt3TM". Die so erzeugten Daten wurden dann entsprechend des Verfahrens der Erfindung bearbeitet und die wahrscheinlichsten Sequenzen, die in 6 gezeigt sind, wurden vorausgesagt. In diesem Falle gibt es zwei Sequenzen, die mit ähnlichen Wahrscheinlichkeiten vorausgesagt werden, und viele andere mit sehr kleinen Wahrscheinlichkeiten. Das Fragment ist tatsächlich bekannt als das T11-Fragment des Proteinverdaus (siehe Tabelle 4) und die tatsächliche Sequenz ist in der Tat korrekt vorhergesagt worden als die wahrscheinlichste Sequenz in Tabelle 6 durch ein signifikantes Spanne. Tabelle 6 wahrscheinlichste Sequenzen für m/z 815,4
    Figure 00320001
  • Die Position des T11-Fragments ist gezeigt durch doppeltes Unterstreichen in der vollständigen Sequenz, die in Tabelle 5 aufgeführt ist. Die zweit-wahrscheinlichste Sequenz in Tabelle 6 unterscheidet sich von der wahrscheinlichsten nur durch die Inversion der ersten beiden Reste und es ist aus den einzelnen Wahrscheinlichkeitszuordnungen zu den verschiedenen vorhergesagten Resten ersichtlich (Tabelle 7), dass geringere Sicherheit über die Zuordnung der ersten beiden Reste besteht als bezüglich der Zuordnung der anderen. Dieses Beispiel zeigt deutlich den Vorteil einer strengen Anwendung der Wahrscheinlichkeitsberechnung im Vergleich mit ad hoc-Verfahren zum Vorhersagen von Sequenzen aus Massenspektraldaten, die im Stand der Technik beschrieben sind. Mit den Figuren in Tabelle 7 ist es möglich, Sicherheit zu erhalten bezüglich der Sequenz des zentralen Teils des Peptids, für welches sehr hohe Wahrscheinlichkeiten angegeben werden, und jeglicher Zweifel, der über die vollständige Sequenz auftreten kann, kann sichtlich begrenzt werden auf die ersten beiden Reste. Weiterhin kann das Ausmaß der Sicherheit dieser Zuordnung jedes dieser Reste quantifiziert werden anhand der Figuren in den Tabellen 3 und 7, wodurch das Vertrauen das in Sequenzen, die durch Verfahren der Erfindung vorhergesagt werden, stark verbessert werden kann.
    Figure 00330001
    Tabelle 4 Humanes Transferrin-Vorläuferprotein
    Figure 00340001
    Figure 00350001
    Figure 00360001

Claims (36)

  1. Verfahren zum Identifizieren der wahrscheinlichsten Aminosäuresequenz, die verantwortlich sein könnte für ein Massenspektrum, das erhalten wird von einem Peptid, das eine unbekannte Sequenz von Aminosäuren aufweist, wobei das Verfahren die Schritte umfasst: Erzeugen eines bearbeitbaren Massenspektrums des Peptids; Auswählen einer begrenzten Anzahl von Probesequenzen von Aminosäuren, die übereinstimmend sind mit einer vorausgehenden Wahrscheinlichkeitsverteilung; und iteratives Modifizieren der Probesequenzen durch einen terminierte Markov Chain Monte Carlo-Algorithmus, um neue Probesequenzen von Aminosäuren zu erzeugen, die übereinstimmend mit der vorausgehenden Wahrscheinlichkeitsverteilung sind, unter Verwendung von Modifikationen in jeder Stufe, die innerhalb der vorausgehenden Wahrscheinlichkeitsverteilung liegen, Berechnen der Wahrscheinlichkeit jeder der Probesequenzen, die für das bearbeitbare Massenspektrum verantwortlich sind, und akzeptieren oder verwerten jeder der Probesequenzen entsprechend der berechneten Wahrscheinlichkeit und dem mathematischen Prinzip der detaillierten Bilanz.
  2. Verfahren nach Anspruch 1, worin die Wahrscheinlichkeit einer speziellen Probesequenz, die für das bearbeitbare Massenspektrum verantwortlich ist, berechnet wird unter Verwendung des Bayes-Theorems, worin die vorausgehende Wahrscheinlichkeitsverteilung multipliziert wird mit einem Wahrscheinlichkeitsfaktor, der das Ausmaß der Übereinstimmung zwischen einem Spektrum, das für die Probesequenz vorausgesagt wird und dem bearbeitbaren Massenspektrum widerspiegelt.
  3. Verfahren nach Anspruch 2, worin der Wahrscheinlichkeitsfaktor bestimmt wird unter Verwendung eines Fragmentierungsmodells, das die Wahrscheinlichkeit über alle Wege aufsummiert, über welche eine Probesequenz fragmentieren kann und zu Signalen in dem bearbeitbaren Massenspektrum führt.
  4. Verfahren nach Anspruch 3, worin das Fragmentierungsmodell über alle Wege aufsummiert, auf welchen eine Probesequenz fragmentieren kann, in einer Zeit, die proportional zur Anzahl der Aminosäurereste in dem Peptid ist.
  5. Verfahren nach Anspruch 3 oder 4, worin das Fragmentierungsmodell die Fragmentierung einer Probesequenz mittels Markov-Ketten (Markov-Chains) modelliert.
  6. Verfahren nach Anspruch 3, 4 oder 5, worin das Fragmentierungsmodell die Erzeugung mindestens der b- und y"-Reihe von Ionen umfasst, worin die b-Reihe so definiert ist, dass sie Ionen umfasst, die den N-terminalen Rest der Probesequenz und den Verlust der C-terminalen Aminosäurereste darstellen, und worin die y"-Reihe so definiert ist, dass sie Ionen umfasst, die den C-terminalen Rest und den Verlust der N-terminalen Aminosäurereste darstellen.
  7. Verfahren nach Anspruch 6, worin das Fragmentierungsmodell die Erzeugung der a-Reihe von Ionen umfasst, worin die a-Reihe so definiert ist, dass sie die b-Reihe von Ionen umfasst, die CO verloren haben.
  8. Verfahren nach Anspruch 6 oder 7, worin das Fragmentierungsmodell die Erzeugung der z"-Reihe von Ionen umfasst, worin die z"-Reihe so definiert ist, dass sie die y"-Reihe von Ionen umfasst, die NH3 verloren haben.
  9. Verfahren nach Anspruch 6, 7 oder 8, worin das Fragmentierungsmodell die Erzeugung von Ionen umfasst, die NH3 und/oder H2O verloren haben.
  10. Verfahren nach einem der Ansprüche 6-9, worin das Fragmentierungsmodell die Erzeugung von Immoniumionen umfasst, die äquivalent ist zum Verlust von CO und H von Aminosäureresten.
  11. Verfahren nach einem der Ansprüche 6-10, worin das Fragmentierungsmodell die Erzeugung von Subsequenzen von Aminosäuren umfasst, die an Aminosäureresten, die innerhalb des unbekannten Peptids vorliegen, beginnen und enden.
  12. Verfahren nach einem der Ansprüche 2-11, worin der Wahrscheinlichkeitsfaktor gesteuert wird durch einen simulierten Anneal-Algorithmus, worin der Wahrscheinlichkeitsfaktor auf eine Fraktionspotenz erhöht wird, die anfangs Null ist und schrittweise erhöht wird.
  13. Verfahren nach Anspruch 12, worin die Erzeugung und das Testen der neuen Probesequenzen fortgesetzt wird bis der simulierte Anneal-Algorithmus den Wahrscheinlichkeitsfaktor auf die Potenz eins erhöht.
  14. Verfahren nach einem der vorhergehenden Ansprüche, worin die Anzahl von Probesequenzen auf ungefähr 100 begrenzt ist.
  15. Verfahren nach einem der vorhergehenden Ansprüche, worin die Probesequenzen pseudostatistisch aus der vorausgehenden Wahrscheinlichkeitsverteilung ausgewählt werden.
  16. Verfahren nach einem der vorhergehenden Ansprüche, worin die vorausgehende Wahrscheinlichkeitsverteilung bestimmt wird aus der natürlichen Häufigkeit jedes der Aminosäurereste, die in der Probesequenz, umfasst sind.
  17. Verfahren nach einem der vorhergehenden Ansprüche, worin die Wahrscheinlichkeitsverteilung Sequenzen von Aminosäuren umfasst, die auf den 20 häufigsten Aminosäurenresten beruhen.
  18. Verfahren nach einem der vorhergehenden Ansprüche, worin die vorausgehende Wahrscheinlichkeitsverteilung Sequenzen von Aminosäuren umfasst, die ein Molekulargewicht in einem vorbestimmten Bereich des ungefähren Molekulargewichts der Probe aufweisen.
  19. Verfahren nach Anspruch 18, worin der vorbestimmte Bereich ± 5 Dalton ist.
  20. Verfahren nach Anspruch 18, worin der vorbestimmte Bereich ± 0,5 Dalton ist.
  21. Verfahren nach einem der vorhergehenden Ansprüche, worin der Markov Chain Monte Carlo-Algorithmus neue Probesequenzen erzeugt durch Revertieren einer benachbarten Subsequenz mit statistisch gewählten Endpunkten.
  22. Verfahren nach einem der vorhergehenden Ansprüche, worin der Markov Chain Monte Carlo-Algorithmus neue Probesequenzen erzeugt durch Cyclisieren einer benachbarten Subsequenz mit statistisch gewählten Endpunkten.
  23. Verfahren nach einem der vorhergehenden Ansprüche, worin der Markov Chain Monte Carlo-Algorithmus neue Probesequenzen erzeugt durch Permutieren einer benachbarten Subsequenz mit statistisch gewählten Endpunkten.
  24. Verfahren nach einem der vorhergehenden Ansprüche, worin der Markov Chain Monte Carlo-Algorithmus neue Probesequenzen erzeugt durch Ersetzen einer benachbarten Subsequenz mit statistisch ausgewählten Endpunkten durch eine andere Subsequenz mit ungefähr der gleichen nominalen Masse.
  25. Verfahren nach einem der vorhergehenden Ansprüche, worin der Markov Chain Monte Carlo-Algorithmus neue Probesequenzen erzeugt durch Austauschen der C-Terminus- und N-Terminus-Enden von zwei Sequenzen, um die nominale Masse zu erhalten.
  26. Verfahren nach einem der vorhergehenden Ansprüche, worin das bearbeitbare Massenspektrum das beobachtete Massenspektrum umfasst.
  27. Verfahren nach einem der Ansprüche 1-25, worin das bearbeitbare Massenspektrum erhalten wird durch Konvertieren mehrfach geladener Ionen und isotoper Cluster von Ionen auf einen einzelnen Intensitätswert bei einem Verhältnis von Masse zu Ladung, das einem einfach geladenen Ion des Isotops mit geringster Masse entspricht.
  28. Verfahren nach Anspruch 27, weiterhin umfassend den Schritt des Berechnens eines Unsicherheitswerts für die wirkliche Masse und die Wahrscheinlichkeit, dass tatsächlich ein Signal bei dem Verhältnis von Masse zu Ladung beobachtet worden ist.
  29. Verfahren nach Anspruch 28, worin der Unsicherheitswert eines Signals basieren kann auf der Standardabweichung eines Gauss-Signals, das das bearbeitete Signal darstellt, und die Wahrscheinlichkeit, dass ein Signal tatsächlich beobachtet wird, auf dem Signal-zu-Rausch-Verhältnis des Signals in dem beobachteten Spektrum basiert.
  30. Verfahren zum Berechnen der Wahrscheinlichkeit, dass ein experimentell bestimmtes Massenspektrum eines Peptids oder eines ähnlichen Moleküls für eine gegebene Sequenz von Aminosäuren verantwortlich sein kann, umfassend die Schritte: Verwendung eines Fragmentierungsmodells, das die Wahrscheinlichkeit über alle Wege aufsummiert, über die die gegebene Sequenz fragmentieren kann, wobei das Fragmentierungsmodell die Fragmentierung einer Probesequenz mittels Markov-Ketten modelliert.
  31. Verfahren nach Anspruch 30, worin das experimentell bestimmte Massenspektrum ein bearbeitbares Spektrum ist.
  32. Verfahren nach Anspruch 31, worin das bearbeitbare Massenspektrum erhalten wird durch Konvertieren von mehrfach geladenen Ionen und isotopen Clustern von Ionen auf einen einzelnen Intensitätswert bei dem Verhältnis von Masse zu Ladung, das einem einfach geladenen Ion des Isotops mit geringster Masse entspricht.
  33. Vorrichtung zum Identifizieren der wahrscheinlichsten Sequenzen von Aminosäuren in einem unbekannten Peptid, wobei die Vorrichtung ein Massenspektrometer zum Erzeugen eines Massenspektrums des unbekannten Peptids und Datenverarbeitungsmittel umfasst, die programmiert sind, um: (a) die Daten, die durch das Massenspektrometererzeugt werden, zu barbeiten, um ein bearbeitbares Massenspektrum zu erzeugen; (b) eine begrenzte Anzahl von Probeaminosäuresequenzen, die konsistent ist mit einer vorausgehenden Wahrscheinlichkeitsverteilung, auszuwählen; und (c) iterativ die Probesequenzen durch einen terminierte Markov Chain Monte Carlo-Algorithmus zu modifizieren, um neue Probesequenzen zu erzeugen, die konsistent sind mit der vorausgehenden Wahrscheinlichkeitsverteilung, unter Verwendung bei jeder Stufe von Modifikationen, die innerhalb der vorausgehenden Wahrscheinlichkeitsverteilung liegen, um die Wahrscheinlichkeit jeder der Probesequenzen, die zu dem bearbeitbaren Massenspektrum beitragen, zu berechnen, und jede der Probesequenzen gemäß der berechneten Wahrscheinlichkeit und des mathematischen Prinzips der detaillierten Bilanz zu akzeptieren oder zu verwerfen.
  34. Vorrichtung nach Anspruch 33, worin das Massenspektrometer ein Tandem-Massenspektrometerumfasst.
  35. Vorrichtung nach einem der Ansprüche 33 oder 34, worin das Massenspektrometer einen Flugzeitmasseanalysator umfasst.
  36. Vorrichtung nach Anspruch 33, 34 oder 35, weiterhin umfassend eine Elektrosprühionisationsquelle, in welche eine unbekannte Peptidprobe eingebracht werden kann.
DE60026452T 1999-04-06 2000-04-06 Verfahren zur Identifizierung von Peptidensequenzen und Proteinensequenzen mittels Massenspektromterie Expired - Lifetime DE60026452T2 (de)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
GBGB9907810.7A GB9907810D0 (en) 1999-04-06 1999-04-06 A method of determining peptide sequences by mass spectrometry
GB9907810 1999-04-06
GB9908684 1999-04-16
GBGB9908684.5A GB9908684D0 (en) 1999-04-16 1999-04-16 Improved methods of identifying peptides and proteins by mass spectrometry
EP00302897A EP1047107B1 (de) 1999-04-06 2000-04-06 Verfahren zur Identifizierung von Peptiden und Proteinen mittels Massenspektromterie

Publications (2)

Publication Number Publication Date
DE60026452D1 DE60026452D1 (de) 2006-05-04
DE60026452T2 true DE60026452T2 (de) 2006-08-10

Family

ID=57132898

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60026452T Expired - Lifetime DE60026452T2 (de) 1999-04-06 2000-04-06 Verfahren zur Identifizierung von Peptidensequenzen und Proteinensequenzen mittels Massenspektromterie

Country Status (4)

Country Link
US (1) US6489608B1 (de)
EP (2) EP1688987A1 (de)
CA (1) CA2303761C (de)
DE (1) DE60026452T2 (de)

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8814896B2 (en) 1999-11-02 2014-08-26 Stat Medical Devices, Inc. Single use lancet assembly
US20050070945A1 (en) 1999-11-02 2005-03-31 Steven Schraga Single use lancet assembly
CA2298181C (en) 2000-02-02 2006-09-19 Dayan Burke Goodnough Non-targeted complex sample analysis
WO2001069219A2 (en) * 2000-03-14 2001-09-20 National Research Council Canada Faims apparatus and method with laser-based ionization source
US7091479B2 (en) * 2000-05-30 2006-08-15 The Johns Hopkins University Threat identification in time of flight mass spectrometry using maximum likelihood
CA2340150C (en) * 2000-06-09 2005-11-22 Micromass Limited Methods and apparatus for mass spectrometry
GB0014342D0 (en) * 2000-06-13 2000-08-02 Scient Analysis Instr Limited Method of analysis
SE517259C2 (sv) * 2000-06-14 2002-05-14 Jan Eriksson System för molekylidentifiering
AUPR116100A0 (en) 2000-11-01 2000-11-23 University Of Sydney, The P450 gene regulation
US20020115056A1 (en) * 2000-12-26 2002-08-22 Goodlett David R. Rapid and quantitative proteome analysis and related methods
EP1451207B1 (de) * 2001-11-05 2009-08-26 Irm Llc Markierungsreagens und anwendungsverfahren
DE10155707B4 (de) * 2001-11-13 2006-11-16 Bruker Daltonik Gmbh Massenbestimmung für Biopolymere
US20030153007A1 (en) * 2001-12-28 2003-08-14 Jian Chen Automated systems and methods for analysis of protein post-translational modification
DE60337003D1 (de) 2002-03-22 2011-06-16 Phenomenome Discoveries Inc Verfahren zur visualisierung von nicht gezielten metabolomischen daten, erzeugt durch ionenzyklotronresonanz -fouriertransformation-massenspektrometer
US8715309B2 (en) 2002-04-29 2014-05-06 Steven Schraga Lancet device
GB0305796D0 (en) 2002-07-24 2003-04-16 Micromass Ltd Method of mass spectrometry and a mass spectrometer
US7409296B2 (en) * 2002-07-29 2008-08-05 Geneva Bioinformatics (Genebio), S.A. System and method for scoring peptide matches
EP1623351B1 (de) * 2003-04-28 2012-04-18 Cerno Bioscience LLC Rechnerisches verfahren und system für die massenspektralanalyse
EP1636822A2 (de) * 2003-05-15 2006-03-22 Electrophoretics Limited Massenspektrometrie
US20050255606A1 (en) * 2004-05-13 2005-11-17 Biospect, Inc., A California Corporation Methods for accurate component intensity extraction from separations-mass spectrometry data
US7072772B2 (en) * 2003-06-12 2006-07-04 Predicant Bioscience, Inc. Method and apparatus for modeling mass spectrometer lineshapes
US20040267456A1 (en) * 2003-06-27 2004-12-30 Stephan Brunner Method and computer program product for drug discovery using weighted grand canonical metropolis Monte Carlo sampling
WO2005001645A2 (en) * 2003-06-27 2005-01-06 Locus Pharmaceuticals, Inc. Method and computer program product for drug discovery using weighted grand canonical metropolis monte carlo sampling
JP2007507771A (ja) * 2003-10-01 2007-03-29 プロテオム システムズ インテレクチュアル プロパティ プロプライエタリー リミテッド 候補組成物又は候補構造体の生物学的尤度を決定する方法
WO2005057208A1 (en) * 2003-12-03 2005-06-23 Prolexys Pharmaceuticals, Inc. Methods of identifying peptides and proteins
US7415361B2 (en) * 2003-12-09 2008-08-19 Locus Pharmaceuticals, Inc. Methods and systems for analyzing and determining ligand-residue interaction
DE102004012524B4 (de) * 2004-03-15 2006-11-16 Mosaiques Diagnostics And Therapeutics Ag Verfahren zur Bestimmung wahrer Molekülmassen von Konstituenten biologischer Proben
US20050222776A1 (en) * 2004-03-31 2005-10-06 Locus Pharmaceuticals, Inc. Method for fragment preparation
GB0409676D0 (en) * 2004-04-30 2004-06-02 Micromass Ltd Mass spectrometer
WO2005106453A2 (en) * 2004-04-30 2005-11-10 Micromass Uk Limited Mass spectrometer
CA2772688A1 (en) 2005-09-12 2007-03-22 Phenomenome Discoveries Inc. Methods for the diagnosis of colorectal cancer and ovarian cancer health states
GB2432712B (en) * 2005-11-23 2007-12-27 Micromass Ltd Mass spectrometer
US7429727B2 (en) * 2005-12-13 2008-09-30 Palo Alto Research Center Incorporated Method, apparatus, and program product for quickly selecting complex molecules from a data base of molecules
US8108153B2 (en) * 2005-12-13 2012-01-31 Palo Alto Research Center Incorporated Method, apparatus, and program product for creating an index into a database of complex molecules
GB0609253D0 (en) * 2006-05-10 2006-06-21 Micromass Ltd Mass spectrometer
US8515686B2 (en) 2006-12-18 2013-08-20 Macquarie University Detection and quantification of polypeptides using mass spectrometry
US7755744B1 (en) * 2007-08-15 2010-07-13 Thomas Leberer Environment sensor that conveys information about objects in the vicinity of the visually impaired user
CN101886928A (zh) * 2009-05-14 2010-11-17 深圳富泰宏精密工业有限公司 具有导盲功能的便携式电子装置
GB201100302D0 (en) * 2011-01-10 2011-02-23 Micromass Ltd A method of correction of data impaired by hardware limitions in mass spectrometry
GB201100300D0 (en) * 2011-01-10 2011-02-23 Micromass Ltd A method of deadtime correction in mass spectrometry
WO2014124365A2 (en) * 2013-02-08 2014-08-14 Cornell University Biomolecular processing platform and uses thereof
JP2020514746A (ja) 2016-12-01 2020-05-21 ノーティラス バイオテクノロジー インコーポレイテッド タンパク質をアッセイする方法
US11721412B2 (en) 2017-10-23 2023-08-08 Nautilus Subsidiary, Inc. Methods for identifying a protein in a sample of unknown proteins
EP3701066A4 (de) * 2017-10-23 2021-08-11 Nautilus Biotechnology, Inc. Verfahren und systeme zur proteinidentifikation
JP7458678B2 (ja) 2017-12-29 2024-04-01 ノーティラス・サブシディアリー・インコーポレイテッド タンパク質同定のためのデコーディングアプローチ方法
CN108491690B (zh) * 2018-03-16 2020-06-05 中国科学院数学与系统科学研究院 一种蛋白质组学中肽段的肽段定量效率预测方法
EP3598135A1 (de) * 2018-07-20 2020-01-22 Univerzita Palackého v Olomouci Verfahren zur identifizierung von entitäten aus massenspektren
US20200327961A1 (en) * 2019-04-15 2020-10-15 Bruker Daltonik Gmbh Methods for determining isomeric amino acid residues of proteins and peptides

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5331158A (en) * 1992-12-07 1994-07-19 Hewlett-Packard Company Method and arrangement for time of flight spectrometry
US6017693A (en) * 1994-03-14 2000-01-25 University Of Washington Identification of nucleotides, amino acids, or carbohydrates by mass spectrometry
GB2308917B (en) * 1996-01-05 2000-04-12 Maxent Solutions Ltd Reducing interferences in elemental mass spectrometers
GB9616105D0 (en) * 1996-07-31 1996-09-11 Univ Kingston TrkA binding site of NGF
GB9710582D0 (en) 1997-05-22 1997-07-16 Oxford Glycosciences Uk Ltd A method for de novo peptide sequence determination

Also Published As

Publication number Publication date
EP1047107A2 (de) 2000-10-25
EP1047107A3 (de) 2002-12-18
US6489608B1 (en) 2002-12-03
CA2303761A1 (en) 2000-10-06
DE60026452D1 (de) 2006-05-04
EP1047107B1 (de) 2006-10-04
CA2303761C (en) 2005-12-20
EP1688987A1 (de) 2006-08-09

Similar Documents

Publication Publication Date Title
DE60026452T2 (de) Verfahren zur Identifizierung von Peptidensequenzen und Proteinensequenzen mittels Massenspektromterie
DE60031030T2 (de) Verfahren zur Identifizierung von Peptiden und Proteinen mittels Massenspektromterie
DE112005001143B4 (de) System und Verfahren zum Gruppieren von Vorläufer- und Fragmentionen unter Verwendung von Chromatogrammen ausgewählter Ionen
DE69530915T2 (de) Identifizierung von aminosäuren durch massenspektrometrie
DE112009001094B4 (de) MS/MS-Datenverarbeitung
DE60126055T3 (de) Massenspektrometer und massenspektrometrisches Verfahren
DE102014008264B4 (de) Isotopenmustererkennung
DE102004015018B4 (de) Verfahren zum Identifizieren von Ionen aus Chromatographie-Massenspektral-Datensätzen, die überlappende Komponenten enthalten
DE112004000746B4 (de) Verfahren und Vorrichtung zum Verarbeiten von LC-MS- oder LC-MS-/MS-Daten bei Stoffwechseluntersuchungen
DE112005001166T5 (de) Verfahren und Vorrichtung zum Identifizieren von Proteinen in Gemischen
DE102010019590B4 (de) Datenabhängiges Erfassungssystem für die Massenspektrometrie und Verfahren für dessen Anwendung
US7595484B2 (en) Mass spectrometric method, mass spectrometric system, diagnosis system, inspection system, and mass spectrometric program
DE4032491C2 (de) Massenspektroskopisches Verfahren und massenspektroskopische Vorrichtung
DE112012004324T5 (de) Multikomponentenregression/Multikomponentenanalyse von Zeit- und/oder Raumreihendateien
DE102010054580B3 (de) Proteomanalyse in Massenspektrometern mit HF-Ionenfallen
DE20122885U1 (de) Massenspektrometer
JP5080945B2 (ja) 質量分析装置および質量分析方法
DE10158860A1 (de) Massenspektrometrische Proteingemischanalyse
DE102010051810A1 (de) Bilderzeugende Massenspektrometrie mit Protein-Identifizierung
DE112015000402B4 (de) Näherungsalgorithmus zum Lösen eines Impulsübertragungsquerschnitts
DE112006001030T5 (de) Analyseinstrumente, -Vorrichtungen und -Verfahren
DE602004012637T2 (de) Verfahren und Vorrichtungen zur Identifizierung von Biopolymeren mittels Massenspektometrie
DE102019114829A1 (de) Massenspektrometrische Bestimmung von Gewebezuständen
DE112011102604T5 (de) Verfahren zur Analyse einer Stoffstruktur
DE102020101408A1 (de) Verfahren für die massenspektrometrische bestimmung der anwesenheit oder des fehlens eines chemischen elements in einem analyten

Legal Events

Date Code Title Description
8364 No opposition during term of opposition