DE60211744T3 - Massenspektrometrie-verfahren - Google Patents

Massenspektrometrie-verfahren Download PDF

Info

Publication number
DE60211744T3
DE60211744T3 DE60211744T DE60211744T DE60211744T3 DE 60211744 T3 DE60211744 T3 DE 60211744T3 DE 60211744 T DE60211744 T DE 60211744T DE 60211744 T DE60211744 T DE 60211744T DE 60211744 T3 DE60211744 T3 DE 60211744T3
Authority
DE
Germany
Prior art keywords
mixture
molecules
mass
protein
ppm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60211744T
Other languages
English (en)
Other versions
DE60211744D1 (de
DE60211744T2 (de
Inventor
Scott Middletown GEROMANOS
Ashok Newtown DONGRE
Gregory Montreal OPITECK
Jeffrey Beverly SILVA
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Micromass UK Ltd
Original Assignee
Micromass UK Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=26992114&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=DE60211744(T3) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Micromass UK Ltd filed Critical Micromass UK Ltd
Publication of DE60211744D1 publication Critical patent/DE60211744D1/de
Application granted granted Critical
Publication of DE60211744T2 publication Critical patent/DE60211744T2/de
Publication of DE60211744T3 publication Critical patent/DE60211744T3/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6848Methods of protein analysis involving mass spectrometry
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6872Methods for sequencing involving mass spectrometry
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6842Proteomic analysis of subsets of protein mixtures with reduced complexity, e.g. membrane proteins, phosphoproteins, organelle proteins
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6848Methods of protein analysis involving mass spectrometry
    • G01N33/6851Methods of protein analysis involving laser desorption ionisation mass spectrometry
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/0027Methods for using particle spectrometers
    • H01J49/0031Step by step routines describing the use of the apparatus
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10TTECHNICAL SUBJECTS COVERED BY FORMER US CLASSIFICATION
    • Y10T436/00Chemistry: analytical and immunological testing
    • Y10T436/24Nuclear magnetic resonance, electron spin resonance or other spin effects or mass spectrometry

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Immunology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Food Science & Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Cell Biology (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Optics & Photonics (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Sampling And Sample Adjustment (AREA)
  • Transition And Organic Metals Composition Catalysts For Addition Polymerization (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
  • Peptides Or Proteins (AREA)
  • Glass Compositions (AREA)
  • Crystals, And After-Treatments Of Crystals (AREA)

Description

  • Die vorliegende Erfindung betrifft ein Verfahren der Massenspektrometrie. Die bevorzugte Ausführungsform betrifft die Proteinidentifizierung, Proteinquantifizierung, Proteasen, Hochauflösungs-Massenspektrometrie, Proteomik, Genomik und Bioinformatik.
  • Die zunehmende Bedeutung von Genomik- und Proteomik-Informationen in der Biotechnologie und der pharmazeutischen Forschung und Entwicklung hat die Entwicklung vieler innovativer Technologien stimuliert. Technologieplattformen, wie beispielsweise das Transkriptionsprofiling oder die Analyse der Genexpression ermöglichen ein besseres Verständnis der zellulären Physiologie und die Entwicklung von Beziehungen zwischen der Genexpression (mRNA) und der zellulären Antwort auf interne Stimuli und Stimuli der Umgebung. Siehe J. L. DeRisi et al., Exploring the metabolic and genetic control of gene expression an a genomic scale, Science 278: 680-686 (1997); F. P. Roth et al., Finding DNA regulatory motifs within unaligned noncoding sequences clustered by whole-genome mRNA Quantitation, Nat. Biotechnol. 16: 939-945 (1998). Zu internen Stimuli zählen genetische Variationen und Krankheitszustände, während externe Stimuli Veränderungen in den Umgebungsbedingungen (z. B. Temperatur, pH, Osmolalität etc.) oder chemische Konzentrationen (z. B. Medikamente, Hormone, Toxine etc.) umfassen. Das Verständnis, wie sich Genexpressionsprofile dynamisch verändern, wenn Bedingungen schwanken, kann wertvolle Einblicke in die Identifikation und Entwicklung neuartiger therapeutischer Ziele, Behandlungen und Krankheitsentwicklungen/Regressionsmarker (Biomarker) geben. Die Aufklärung von Veränderungen in Expressionsprofilen sollte ein besseres Verständnis vieler biochemischer Prozesse auf makroskopischer Ebene erlauben.
  • Genexpressions-Analyseverfahren messen Veränderungen im mRNA-Niveau und setzen diese Veränderungen in Beziehung zu einer zellulären Reaktion, die für einen gegebenen Stimulus charakteristisch ist. Der Bereich hat mit der Entwicklung von DNA-Arrays (z. B. die von Affymetrix, Santa Clara, CA vermarkteten GeneChipTM-Arrays) eine bedeutende Erweiterung erfahren. Forschungen in diesem Bereich haben jedoch gezeigt, dass häufig eine unklare Beziehung zwischen gemessenen mRNA-Werten und Werten des von der mRNA kodierten tatsächlichen Proteins besteht. Siehe S. P. Gygi et al., Correlation between Protein and mRNA abundance in yeast, Mol. Cell. Biol. 19: 1720-1730 (1999); L. M. Hartford and D. R. Morris, Posttranscriptional gene regulation, Wiley-Liss Inc (1997); und A. Varshavsky, The Nend rule: functions, mysteries, uses, Proc. Natl. Acad. Sci. USA, 93: 12142-12149 (1996). Die Diskrepanz kann auf eine Vielzahl von Faktoren zurück geführt werden, so beispielsweise auf eine geringe experimentelle Reproduzierbarkeit bei verschiedenen Transkriptionsprofiling-Plattformen, auf Effekte zellulärer Kompartimentierung, auf Translationseffizienz, auf Posttranslations-Modifikationen und auf Proteindegradationssysteme.
  • Ein verbesserter Ansatz der quantitativen Proteomik würde die bestehenden Genomik-Ansätze durch eine direkte Untersuchung der an zellulären Prozessen beteiligten Proteine ergänzen. Eine Kombination dieser beiden Verfahren wird zu einem vollständigeren konzeptuellen Verständnis der funktionellen Architektur von Genom- und Proteom-Netzwerken führen und damit ein umfangreicheres Verständnis der Physiologie einer Zelle erlauben.
  • Zwei gemeinsame Ziele in der Proteomik-Forschung sind die qualitative Identifizierung der in einer Zelle vorhandenen Proteine unter einer Anzahl von Bedingungen und die quantitative Bestimmung der relativen Werte dieser Proteine, wenn sich diese Bedingungen ändern. Leider ergibt die Mehrheit der derzeitigen Analyseansätze in der Proteomik entweder qualitative Informationen oder ein rudimentäres Niveau quantitativer Informationen. Zuverlässige und genaue Methoden für die quantitative Bestimmung der relativen Expressionswerte von Proteinen fehlen. Die Möglichkeit, diese quantitativen Informationen zu erhellen, ist für die Proteomik wesentlich und wird zu Verbesserungen in der Entdeckung und Entwicklung von Medikamenten, der Entwicklung einer neuartigen, proteinbasierten Diagnostik/prognostischer Tests und der Überwachung der Wirksamkeit von Medikamentenbehandlungsstrategien (Biomarker) führen. Einige der mit der Identifikation von Proteinen in Zusammenhang stehenden vorhandenen Verfahren und derzeitige Technologien für die Quantifizierung von Proteinen werden jetzt kurz beschrieben.
  • Der Nutzen der Single-Stage-Massenspektrometrie und der Tandem-Massenspektrometrie für die Identifizierung zellulärer Proteine unter Verwendung von Protein- und Nukleotid-Datenbanken ist gut dokumentiert. Bei der Single-Stage-Massenspektrometrie ist das instrument der Wahl ein Matrix-unterstützter Laser-Desorptions-Ionisations(MALDI)-Flugzeit-Massenspektrometer (TOF-MS oder MALDI-TOF). Das MALDI-Instrument erzeugt charakteristischerweise ein Massenspektrum einfach geladener Peptidionen mit einer Massegenauigkeit von 20 bis 50 ppm. Die erzeugte Liste von Peptidionen-Massewerten wird dann in eine einer Anzahl zuvor beschriebener Suchmaschinen für die Proteinidentifikation eingegeben (siehe Mann et al., Use of mass spectrometric molecular weight information to identify Proteins in sequence databases, Biological Mass Spectr. 22(6): 338-45 (1993); Henzel et al., Identification of 2-D Gel Proteins at the femtomole level by Molecular Mass Searching of Peptide Fragments in a Protein Sequence Database, Techniques in Protein Chemistry V, John Crabb Hrsg., (1994); und Pappin et al., Peptide Mass Fingerprinting using MALDI-TOF mass spectrometry, Current Biology 3: 327-322 (1993)). Fachleute haben für diese Methode der Identifikation von Proteinen die Bezeichnung Peptid-Massenfingerprint („PMF”) geprägt. Obgleich gezeigt wurde, dass der Peptid-Massenfingerprint die Identifikation mehrfacher Proteine in einfachen Mischungen (Jensen et al., Anal. Chem. 69(23): 4741-50 (1997)) erleichtert, führt die beschränkte Genauigkeit des Verfahrens zu Unklarheiten, wenn es bei komplexen Mischungen angewendet wird und die Wahrscheinlichkeit falsch-positiver Zuordnungen erreicht inakzeptable Ausmaße. Darüber hinaus kann der Peptid-Massenfingerprint aufgrund von Ionensuppressionsproblemen in Zusammenhang mit dem MALDI-Ionisierungsverfahren nicht zuverlässig für die quantitative Analyse eingesetzt werden. Zu den weiteren Massenspektrometerkonstruktionen, welche für die Proteinanalyse verwendet werden, zählen Triele-Stage Quadrupol(TSQ)-Instrumente und Quadrupol-Ionenfallen(QIT)-Vorrichtungen. Beide Instrumententypen sind auch für MS/MS-Anwendungen (nachfolgend beschrieben) geeignet, sind jedoch tendenziell auf Massegenauigkeiten von 50 bis 100 ppm beschränkt und weisen aufgrund des Scannercharakters der Konstruktion eine geringe Sensitivität auf. QIT-Instrumente haben ferner eine relativ begrenzte Ladungskapazität und folglich einen begrenzten Dynamikbereich.
  • Ein alternativer Ansatz zum Peptid-Massenfingerprint besteht in der Tandem-Massenspektrometrie (MS/MS). Die Tandem-Massenspektrometrie-Identifikation von Proteinen umfasst den Erhalt und die Analyse des Massenspektrums der Produkt-Ionen, die von jedem in dem primären Massenspektrum eines Satzes proteolysierter Proteinfragmente selektierten Vorläuferion erzeugt werden. Die zusätzliche Information ist insofern hilfreich als unterschiedliche Proteinfragmente mit derselben Nominalmasse durch ihre Produkt-Ionenspektren unterschieden werden können. MS/MS-Daten können auch verwendet werden, um die Aminosäurensequenz des Proteinfragment-Vorläuferions abzuleiten, und die resultierende Sequenz kann mit einem Protein oder mit translatierten Nukleotid-Datenbanken zur Proteinidentifikation verglichen werden. Tandem-Massenspektrometrie-Identifikationen verbessern die Konfidenz der MALDI-TOF-basierten Proteinidentifikationen erheblich, indem Primärsequenzdaten vorgesehen werden, die die durch den Peptid-Massenfingerprint erzeugte Identität bestätigen. Siehe Wilm and Mann, Error-tolerant identification of peptides in sequence databases by peptide sequence tags, Anal. Chem. 66: 4390-4399 (1994); W. Hines et al., Pattern-Gases Algorithm for Peptide Sequencing from Tandem High Energy Collision-Induced Dissociation Mass Spectra, J. Am. Soc. Mass Spectrom, 3: 326-336 (1992); V. Dancik et al., De Novo Peptide Sequencing via Tandem Mass Spectrometry: A Graph-Theoretical Approach, RECOMB, 135-144 (1999); und Yates et al., US-Patent Nr. 5,538,897 .
  • Obgleich nützlich beim Vorsehen eines Systems zum raschen Korrelieren von Fragmentspektren mit bekannten Proteinsequenzen, teilt der Algorithmus in diesen automatisierten Prozessen jedem Spektrum einen wahrscheinlichsten Treffer zu, und der Nutzer muss sich auf multiple Einzelpeptidzuordnungen zu demselben Proteinfragment verlassen, um die Wahrscheinlichkeit des Erzeugens falsch positiver Ergebnisse der Peptid-MS/MS-Daten auszugleichen. MS/MS-basierte Strategien zur Proteinidentifikation können bei jedem Polypeptid-Ion, das benutzerdefinierte Kriterien erfüllt, automatisches Wechseln zwischen MS und MS/MS-Analysemodi beinhalten. Das Umschalten auf den MS/MS-Modus unterbricht die Datenerfassung im MS-Modus, und da immer nur ein Vorläufer-Ion analysiert werden kann, ist der Netto-Durchsatz des Systems begrenzt. Die MS/MS-Analyse jedes Ions in dem primären Spektrum einer Mischung, die so komplex ist wie ein Proteom, wäre extrem zeitaufwendig und würde viele Proben benötigen. Um eine umfassende Protein-Abdeckung einer komplexen, heterogenen Mischung, wie im Falle eines Proteoms, zu erreichen, muss das MS/MS-Umschalten sehr häufig erfolgen, und dies beeinträchtigt die Qualität der MS- und MS/MS-Daten. Die Beeinträchtigung der Qualität der versuchten Identifikations-MS-Spektren vermindert die quantitative Genauigkeit des Experiments signifikant. Die Beeinträchtigung der Qualität der Peptid-MS/MS-Spektren erhöht die Wahrscheinlichkeit, falsch positive Identifikationen zu erzeugen signifikant, insbesondere bei einem Proteom, bei welchem die Komponenten der Mischung nicht in äquimolaren Mengen vorliegen und bei welchem die Anzahl der von manchen Proteinen abgeleiteten Ionen gering ist.
  • Viele Wissenschaftler haben 2-D Protein-Gele extrahiert oder zerlegt und die abgetrennten Proteine einer Massenspektroskopie unterzogen, um mit den oben beschriebenen Methoden eine Charakterisierung und mögliche Identifikation durchzuführen. Siehe beispielsweise H. Nakayama, et al., Capillary column high-performance liquid chromatographic-electrospray ionization triele-stage mass spectometric analysis of Proteins separated by two-dimensional polyacrylamide gel electrophoresis. Application to cerebral Protein mapping, J. Chrom. A 730: 279-287 (1996); S. M. Hanash, Biomedical applications of two-dimensional electrophoresis using immobilized pH gradients: current status, Electrophoresis 21: 1202-1209 (2000); A. Pandey, M. Mann, Proteomics to study genes and genomes, Nature 405: 837-846 (2000); M. P. Washburn, J. R. Yates, Analysis of the microbial proteome, Curr. Opin. Microbiol. 3: 292-297 (2000); H. Langen et al., Two-dimensional map of the proteome of Haemophilus influenzae, Electrophoresis, 21: 411-429 (2000). Solche Hybridmethoden sind sehr empfindlich, sind aber durch die Auflösungskapazität des 2D-Gels beschränkt und erfordern eine arbeitsintensive Extraktion und Analyse individueller Punkte auf dem Gel.
  • Ein von Fachleuten im Bereich der Proteomik vorgeschlagener Ansatz umfasst das Erzeugen einer komplexen Peptidmischung durch das enzymatische Aufspalten aller Proteinelemente eines gegebenen Proteoms, gefolgt von chromatographischen Trennungen mit einer Schnittstelle zu Massenspektrometrie-Verfahren, wie beispielsweise die Fourier-Transform-Ionenzyklotronresonanz (FTICR; siehe L. Li et al., High-throughput peptide identification from Protein digests using data-dependent multiplexed tandem FTICR Mass spectometry coupled with capillary liquid chromatography, Anal. Chem. 73: 3312-33222 (2001); Y. Shen et al., High-Throughput Proteomics Using High-Efficiency Multiple-Capillary Liquid Chromatography with On-Line High-Performance ESI FTICR Mass Spectometry, Anal. Chem. 73: 3011-3021 (2001)). Dies ist ein sehr erfolgversprechender Ansatz, aber die für die FTICR benötigten Instrumente sind extrem teuer. Ein FTICR-Spektrometer kann mehr als fünf Millionen Dollar kosten, was die Methode für eine weit verbreitete Routineanwendung ausschließt.
  • Ein weiteres Verfahren ist ein Tandem-Massenspektrometrie-Verfahren, das als Multidimensionale Proteinidentifikationstechnologie („MudPIT”) bezeichnet wird (A. Link et al., Direct Analysis of Protein Complexes Using Mass Spectometry, Nat. Biotechnol. 17: 676-682 (1999); M. P. Washburn et al., Large-Scale Analysis of the Yeast Proteome by Multidimensional Protein identification Technology, Nat. Biotechnol. 19: 242-247 (2001). Dieses Verfahren, das in der Tat eine Art von Chromatographie ist, die vor der Tandem-Massenspektrometrie auf vorfraktionierte Proben angewendet wird, hat sich nicht als fähig erwiesen, Veränderungen in Proteinexpressions-Werten zu überwachen.
  • Proteome sind im Allgemeinen sehr komplex. Sie enthalten viele Tausend Proteine, welche in relativen Konzentrationen von fünf oder sechs Größenordnungen vorliegen können. Anders als Genome sind Proteome dynamisch: die Proteine, die das Proteom einer Zelle ausmachen, verändern sich als Reaktion auf das chemische und physikalische Umfeld der Zelle. Posttranslationsprozesse verändern ständig die funktionellen Formen zellulärer Proteine und dieses Niveau der Proteinexpression wird durch viele verschiedene Stimuli beeinflusst. Ein Transkriptionsprofiling (Untersuchung der mRNA) ist beim Entziffern solch eines dynamischen Systems von begrenztem Nutzen. Daher ist eine direkte qualitative und quantitative Analyse der tatsächlichen Proteine in dem Proteom erforderlich, um ein funktionelles Verständnis der Proteine auf einer zellulären Ebene zu erzielen. Der folgende Abschnitt stellt Methoden detailliert vor, die derzeit verwendet werden, um quantitative Proteininformationen zu erhalten.
  • Verschiedene biochemische Techniken, wie beispielsweise das Färben von auf 2-D-Gelen separierten Proteinen mit nicht fluoreszierenden Farbstoffen (Coomassie Blau, Fast Grün), fluoreszierenden Farbstoffen (Sypro Rot, Sypro Orange) und Kolloidmetallfarben (Silber, Gold) werden verwendet, um relative Proteinmengen zu quantifizieren. Diese Färbetechniken sind durch eine geringere quantitative Präzision und Genauigkeit begrenzt, da eine variierende Farbmenge in jedes Protein aufgenommen wird und es schwierig sein kann, gefärbte Proteine vor der Hintergrundfarbe der Gel-Matrix aufzulösen. Andere Techniken, wie beispielsweise das Einführen radioaktiver Markierungen oder die Stoffwechsel-Markierung (14C-Aminosäuren, 3H-Lucin, 35S-Methionin) während der zellulären Proteinsynthese können einige dieser mit dem Hintergrundrauschen bei klassischen Färbetechniken verbundenen Probleme überwinden. Das radioaktive Markieren ist leider bei Proben des Menschen, wie beispielsweise Plasma, Gewebe oder Tumoren, zeitaufwendig, teuer und unpraktisch (oder selten erlaubt). So ist die radioaktive Markierung keine praktische Option.
  • Um diese mit Gel-basierten Techniken verbundenen Nachteile zu überwinden, haben andere Forscher verschiedene massenspektral-basierte Methoden verwendet. Eine solche Methode verwendet MS-Isotopenmarkierungstechniken, um eine genaue Quantifizierung der relativen Proteinmengen in Zellen durchzuführen, die unter unterschiedlichen Bedingungen gewachsen sind. Bei diesem Verfahren werden stabile Isotope, wie beispielsweise 15N in das Zellenwachstumsmedium eingeführt. Die 15N-angereicherten Proteine, die während des Zellwachstumsprozesses erzeugt wurden, werden dann mit unveränderten Proteinen verglichen, indem beide gemischt und zusammen analysiert werden. Die entsprechenden 15N-markierten Peptide werden mit ihrer 14N-Begleitung verglichen, da sie bis auf die vorhergesagte Massenverschiebung fast identische physikalische Eigenschaften aufweisen. Diese Strategie ermöglicht es, die quantitativen Unterschiede zwischen nativen und isotopisch angereicherten „Begleit”-Peptiden ziemlich genau aufzuzeichnen. Y. Oda, et al., Proc. Natl. Acad. Sci. USA 96: 6591-6596 (1999). Jedoch ist diese Strategie von begrenztem Nutzen, da vor der Proteinisolierung eine Behandlung mit einem angereicherten, stabilen Isotopenmedium erforderlich ist, und dies über einen Zeitraum, der für die Aufnahme der Isotope in das Proteom selbst ausreichend ist.
  • Ein weiterer Ansatz, der diesen Mangel überwindet, wurde kürzlich vorgestellt (Gygi, S. P., et al., Quantitative analysis of complex Protein mixtures using isotope-coded affinity tags, Nat. Biotechnol. 17: 994-999 (1999); Griffin, T. J., et al., Quantitative proteomic analysis using a MALDI quadrupole time-of-flight mass spectrometer, Anal. Chem., 73: 978-986 (2001)). Dieser Ansatz umfasst das Derivatisieren von Proteinmischungen mit schweren und leichten Isotop-codierten Affinitätsmarkierungen (ICAT). Diese Markierungen weisen eine kovalente Bindung zu spezifischen Aminosäureresten auf und tragen eine Komponente mit hoher Affinität, wie beispielsweise Biotin, das als ein Isolierungsmittel von nicht markiertem Material dient. Die Proteine werden dann aufgespalten und die markierten Peptide werden für die nachfolgende quantitative Analyse Affinitäten-gereinigt. Die von Affinitäten gereinigten Fraktionen werden unter Anwendung von Tandem-Massenspektrometriemethoden einer Sequenzidentifikation unterworfen und gleichzeitig analysiert, um die relativen Expressionswerte individueller Proteine aus komplexen, kontrollierten und experimentellen Proteinmischungen zu bestimmen. Zu Beginn der Entwicklung zeigte sich diese Technologie als ziemlich robust und konnte breit angewendet werden. Doch auch bei dieser Methode kommt es zu Nachteilen, wie schlechte Ergebnisse durch unvollständiges Markieren und durch die Affinitäten-Reinigungsschritte. Ein weiteres Problem dieses Ansatzes besteht darin, dass er nur bei Proteinen von Nutzen ist, die wenigstens eine freie Cysteingruppe enthalten. Ein Beispiel für diesen Stolperstein wird durch die Tatsache deutlich, dass 35% der ribosomalen Proteine der Hefe frei von Cystein sind und daher durch die Verwendung der ICAT-Technologie nicht identifiziert oder quantifiziert werden können. Darüber hinaus müssen diese markierten Peptide einer Masse angehören, die für die sensitive MS/MS-Analyse zugänglich ist.
  • Die zunehmende Bedeutung genomischer, proteomischer und metabolischer Informationen in der Biotechnologie und der pharmazeutischen Forschung und Entwicklung hat die Entwicklung vieler innovativer Technologien stimuliert. Ein gemeinsames Ziel vieler analytischer Studien in den Biowissenschaften ist die qualitative Identifikation chemischer Komponenten in komplexen chemischen Mischungen biologischen Ursprungs und die quantitative Bestimmung der relativen Fülle chemischer Komponenten in diesen Mischungen. Ein spezifischeres Ziel ist die Entdeckung chemischer Spezies oder Biomarker in solchen Mischungen, welche als Indikator für eine bestimmte Krankheit genutzt werden können. Solche Studien spielen eine Schlüsselrolle im Bereich der Metabolomik und Proteomik, können jedoch leicht auf andere Bereiche der Biowissenschaften ausgedehnt werden. Häufig bieten diese Biomarker Informationen über eine chemische Spezies oder einen biologischen Pfad, welcher entweder als Ziel einer Behandlung oder wenigstens als ein Indikator für die Wirksamkeit eines Medikamentenkandidaten, der für die Behandlung einer speziellen Krankheit entwickelt wurde, dienen können. Diese Studien zur Entdeckung von Biomarkern umfassen im Allgemeinen den Vergleich zweier Populationen komplexer biologischer Mischungen. Eine dieser Probenpopulationen ist typischerweise repräsentativ für einen „Kontroll”-Zustand (normal, unbehandelt, nicht krank, etc.) und die zweite Probenpopulation ist typischerweise repräsentativ für einen „Versuchs”-Zustand (anormal, behandelt, erkrankt, etc.). Die primären Ziele dieser Versuche zur Entdeckung von Biomarkern sind zweifach. Erstens muss jede Komponente in den beiden Probenpopulationen quantitativ bestimmt werden, um zu bestimmen, ob sich ihr relatives Expressionsniveau zwischen den zwei Probenzuständen in einer statistisch signifikanten Weise verändert hat. Das zweite Ziel besteht in der qualitativen Identifikation jeder Komponente, deren Expressionsniveau sich in statistisch signifikanter Weise verschoben hat, und allgemein darin, so viele chemische Komponenten wie möglich in den Probenpopulationen qualitativ zu identifizieren. Idealerweise weisen für diese Anwendung entwickelte analytische Methoden eine hohe Sensitivität auf und können chemische Komponenten in einer Mischung mit einem breiten dynamischen Bereich bestimmen.
  • Saskic et al. (Biochemistry 1999, 38, 1757-1764) offenbart Methoden zur Anwendung funktioneller Proteomik für die Untersuchung von Signaltransduktionswegen bei Mäusefibroblasten nach der Stimulierung mit PDGF. WO 00/03240 offenbart eine Methode zum Detektieren und Analysieren von fest bindenden Liganden in komplexen biologischen Proben.
  • Gras et al. (Electrophoresis 1999, 20, 3535-3550) offenbart eine Methode zur Identifikation von Proteinen durch Peptid-Massenfingerprint.
  • Also besteht eine Notwendigkeit für eine relativ schnelle und kostengünstige Analysemethode, die ermöglicht, dass die chemische Zusammensetzung von sehr komplexen biologischen Mischungen in umfassender und quantitativer Weise und vorzugsweise in einer umfassenden quantitativen und umfassenden qualitativen Weise verglichen werden kann.
  • Gemäß einem Merkmal der vorliegenden Erfindung ist ein Verfahren der Massenspektrometrie nach Anspruch 1 vorgesehen.
  • Die erste Mischung und/oder die zweite Mischung umfassen eine Vielzahl verschiedener Proteine oder Peptide.
  • Die erste Mischung und/oder die zweite Mischung umfassen vorzugsweise wenigstens 2, 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1500, 2000, 2500, 3000, 3500, 4000, 4500 oder 5000 Moleküle mit unterschiedlichen Identitäten. Vorzugsweise umfassen die erste Mischung und/oder die zweite Mischung eine nicht äquimolare, heterogene, komplexe Mischung.
  • Das Masse-zu-Ladung Verhältnis der ersten Moleküle in der ersten Mischung und/oder das Masse-zu-Ladung Verhältnis der ersten Moleküle in der zweiten Mischung ist als innerhalb 20 ppm bestimmt.
  • Die Quantifizierung der ersten Moleküle kann wenigstens einen der folgenden Schritte umfassen:
    • (i) Vergleichen der Intensität der ersten Moleküle in der ersten Mischung mit der Intensität der ersten Moleküle in der zweiten Mischung;
    • (ii) Vergleichen der Intensität der zweiten Moleküle in der ersten Mischung mit der Intensität der zweiten Moleküle in der zweiten Mischung;
    • (iii) Vergleichen des Verhältnisses von: (a) der Intensität der ersten Moleküle in der ersten Mischung zu der Intensität der ersten Moleküle in der zweiten Mischung mit (b) der Intensität der zweiten Moleküle in der ersten Mischung zu der Intensität der zweiten Moleküle in der zweiten Mischung.
  • Die zweiten Moleküle in der ersten Mischung sind vorzugsweise im Wesentlichen dieselben wie die zweiten Moleküle in der zweiten Mischung.
  • Das Masse-zu-Ladung Verhältnis der ersten Moleküle in der ersten Mischung und/oder das Masse-zu-Ladung Verhältnis der ersten Moleküle in der zweiten Mischung werden masseanalysiert mit: (i) einem Flugzeit(„TOF”)-Massenspektrometer; (ii) einem Flugzeit-Massenspektrometer mit orthogonaler Beschleunigung („oaTOF”); (iii) einem Magnetsektor-Massenspektrometer; (iv) einem Quadrupol-Massenanalysator oder einem Ionenfallen-Massenanalysator.
  • Die erste Probe kann eine experimentelle Probe umfassen und die zweite Probe kann eine Kontrollprobe umfassen. Beispielsweise kann die erste Probe von einem erkrankten Organismus stammen und die zweite Probe kann von einem nicht erkrankten Organismus stammen. Alternativ kann die erste Probe von einem behandelten Organismus stammen und die zweite Probe kann von einem nicht behandelten Organismus stammen. Eine noch weitere Option wäre, dass die erste Probe von einem mutanten Organismus stammen kann und dass die zweite Probe von einem Wildtyp-Organismus stammen kann.
  • Es werden Ausführungsformen in Erwägung gezogen bei denen 3, 4, 5 oder mehr unterschiedliche Proben analysiert und quantifiziert werden können.
  • Die Identifikation der ersten Moleküle kann unter bestimmten Umständen nur dann ausgeführt werden, wenn eine Differentialexpression vorliegt, die größer ist als ein vorbestimmter Grenzwert. Beispielsweise werden dann die in einer experimentellen Probe vorliegenden Moleküle nur identifiziert, wenn sie in einer höheren (oder geringeren) Konzentration vorliegen als eine Kontrollprobe. Beispielsweise werden dann die ersten Moleküle in der ersten Mischung und/oder die ersten Moleküle in der zweiten Mischung nur identifiziert, wenn sich die Intensität der ersten Moleküle in der ersten Mischung von der Intensität der ersten Moleküle in der zweiten Mischung um mehr als einen vorbestimmten Wert (positiv oder negativ) unterscheidet. Alternativ werden dann die ersten Moleküle in der ersten Mischung und/oder die ersten Moleküle in der zweiten Mischung nur identifiziert, wenn sich die durchschnittliche Intensität einer Vielzahl unterschiedlicher Moleküle in der ersten Mischung von der durchschnittlichen Intensität einer Vielzahl unterschiedlicher Moleküle in der zweiten Mischung um mehr als einen vorbestimmten Wert unterscheidet. In beiden Fällen kann der vorbestimmte Wert aus der folgenden Gruppe gewählt sein: (i) 1%; (ii) 2%; (iii) 5%; (iv) 10%; (v) 20%; (vi) 50%; (vii) 100%; (viii) 150%; (ix) 200%; (x) 250%; (xi) 300%; (xii) 350%; (xiii) 400%; (xiv) 450%; (xv) 500%; (xvi) 1000%; (xvii) 5000%; und (xviii) 10000%.
  • Moleküle werden durch Bezug auf eine Datenbank identifiziert. Der Schritt des Identifizierens der ersten Moleküle in der ersten Mischung und/oder der ersten Moleküle in der zweiten Mischung umfasst das Vergleichen der ersten physikochemischen Eigenschaft und der zweiten physikochemischen Eigenschaft und des bestimmten Masse-zu-Ladung Verhältnis der ersten Moleküle in der ersten Mischung und/oder der ersten Moleküle in der zweiten Mischung mit einem Molekülindex umfassen, wobei der Index umfasst:
    • (i) die Identität jedes indizierten Moleküls;
    • (ii) eine experimentell bestimmte oder vorhergesagte erste physikochemische Eigenschaft jedes indizierten Moleküls;
    • (iii) eine experimentell bestimmte oder vorhergesagte genaue Masse oder ein Masse-zu-Ladung Verhältnis/Masse-zu-Ladung Verhältnisse jedes indizierten Moleküls; und
    • (iv) eine experimentell bestimmte oder vorhergesagte zweite physikochemische Eigenschaft jedes indizierten Moleküls.
  • Die ersten Moleküle in der ersten Mischung und/oder die ersten Moleküle in der zweiten Mischung können ein Peptid umfassen und der Molekülindex kann einen Peptidindex umfassen. Der Peptidindex kann durch Bestimmen der Art und Weise, wie ein oder mehrere Proteine in Fragmente zerfallen oder aufgespalten werden, um in einer Vielzahl von Peptiden zu resultieren, erzeugt werden.
  • Der Molekülindex kann umfassen: (i) eine Protein- oder Proteomsequenz-Datenbank; (ii) eine Expressed-Sequence-Tag(EST)-Datenbank; oder (iii) eine Gen- oder Genom-Datenbank.
  • Es werden andere Ausführungsformen in Erwägung gezogen, wobei man sich auf eine Datenbank bezieht, die sowohl die genaue Masse als auch andere physikochemische Eigenschaften umfasst, und andere physikochemische Eigenschaften werden von Daten in der Datenbank berechnet.
  • Die ersten Moleküle in der ersten Mischung und/oder die ersten Moleküle in der zweiten Mischung können auf der folgenden Basis identifiziert werden:
    • (i) das Ausmaß der Übereinstimmung des bestimmten Masse-zu-Ladung Verhältnisses der ersten Moleküle in der ersten Mischung und/oder der ersten Moleküle in der zweiten Mischung mit der Masse oder dem Masse-zu-Ladung Verhältnis eines indizierten Moleküls; und/oder
    • (ii) das Ausmaß der Übereinstimmung der ersten physikochemischen Eigenschaft der ersten Moleküle in der ersten Mischung und/oder der ersten Moleküle in der zweiten Mischung mit der ersten physikochemischen Eigenschaft des indizierten Moleküls; und/oder
    • (iii) das Ausmaß der Übereinstimmung der zweiten physikochemischen Eigenschaft der ersten Moleküle in der ersten Mischung und/oder der ersten Moleküle in der zweiten Mischung mit der zweiten physikochemischen Eigenschaft des indizierten Moleküls.
  • Die Molekülmischung umfasst eine Vielzahl verschiedener Proteine oder Peptide.
  • Die ersten Moleküle können auch quantifiziert werden.
  • Gemäß einer weiteren Anordnung ist ein Verfahren der Massenspektrometrie vorgesehen, umfassend:
    Vorsehen einer Mischung von Peptiden;
    Messen einer ersten physikochemischen Eigenschaft, die nicht das Masse-zu-Ladung Verhältnis der ersten Moleküle in der Mischung ist;
    Genaue Bestimmung des Masse-zu-Ladung Verhältnisses der ersten Moleküle, umfassend Peptide; und
    Identifizieren der ersten Moleküle auf der Basis von wenigstens der ersten physikochemischen Eigenschaft und des genau bestimmten Masse-zu-Ladung Verhältnisses der ersten Moleküle, umfassend Peptide.
  • Ein interner Standard, der ein oder mehrere Peptide und/oder ein oder mehrere synthetische Moleküle umfasst, kann zu der Peptidmischung oder einer Fraktion der Peptidmischung hinzugefügt werden.
  • Gemäß einer weiteren Anordnung ist ein Verfahren der Massenspektrometrie vorgesehen, umfassend:
    Vorsehen einer Proteinmischung;
    Vorsehen einer Mischung von Peptiden, die von wenigstens einigen der Proteine her stammen;
    Messen einer ersten physikochemischen Eigenschaft, die nicht das Masse-zu-Ladung Verhältnis ist von entweder wenigstens einem Protein in der Proteinmischung und/oder der ersten Moleküle mit Peptiden in der Peptidmischung; genaues Bestimmen des Masse-zu-Ladung Verhältnisses der ersten Moleküle, umfassend Peptide; und
    Identifizieren der ersten Moleküle mit Peptiden auf der Basis von wenigstens der ersten gemessenen physikochemischen Eigenschaft und des genau bestimmten Masse-zu-Ladung Verhältnisses der ersten Peptide.
  • Ein interner Standard, umfassend ein oder mehrere Proteine und/oder ein oder mehrere synthetische Moleküle kann zu der Proteinmischung oder zu einer Fraktion der Proteinmischung hinzu gefügt werden.
  • Die Proteinmischung kann vorfraktioniert werden. Beispielsweise kann die Methode ferner das Fraktionieren der Proteinmischung, vorzugsweise durch eindimensionale Elektrophorese, z. B. 1D-Gel, multidimensionale Elektrophorese, z. B. 2D-Gel, Größenausschluss-Chromatographie oder durch Affinitäten-Chromatographie umfassen, um ein oder mehrere Proteine von der Proteinmischung zu trennen und wobei das eine oder die mehreren von der Proteinmischung getrennten Proteine dann aufgespalten oder fragmentiert werden, um die Peptidmischung vorzusehen.
  • Gemäß einer alternativen Anordnung kann die Proteinmischung ohne eine Vorfraktionierung der Proteine aufgespalten werden und so kann die Methode ferner das Aufspalten oder Fragmentieren der Proteinmischung umfassen, um die Peptidmischung vorzusehen.
  • Die Peptide können vor der Massenanalyse fraktioniert werden. Die Methode kann ferner das Trennen einer ersten Fraktion eines oder mehrerer Peptide von der Peptidmischung umfassen. Das eine oder die mehreren Peptide können von der Peptidmischung getrennt werden durch: (i) Hochleistungsflüssigchromatographie („HPLC”); (ii) Anionenaustausch; (iii) Anionenaustausch-Chromatographie; (iv) Kationenaustausch; (v) Kationenaustausch-Chromatographie; (vi) Ionenpaar-Umkehrphasenchromatographie; (vii) Chromatographie; (vii) eindimensionale Elektrophorese; (ix) mehrdimensionale Elektrophorese; (x) Größenausschluss; (xi) Affinität; (xii) Umkehrphasenchromatographie; (xiii) Kapillarelektrophoresen-Chromatographie („CEC”); (xiv) Elektrophorese; (xv) Ionenmobilitätstrennung; (xvi) Feldasymmetrie-Ionenmobilitätstrennung („FAIMS”) oder (xvi) Kapillarelektrophorese. Vorzugsweise weisen das eine oder die mehreren Peptide in der ersten Fraktion im Wesentlichen die gleiche erste physikochemische Eigenschaft, vorzugsweise die gleiche Elutionszeit, Hydrophobie, Hydrophilie, Migrationszeit oder chromatographische Retentionszeit auf. Chromatographische Methoden können daher verwendet werden, um ein oder mehrere Peptide von einer Menge von Peptiden auf der Basis von beispielsweise Elutionszeit, Hydrophobie, Hydrophilie, Migrationszeit oder chromatographischer Retentionszeit zu trennen.
  • Die Peptide können auch quantifiziert werden.
  • Gemäß einer Anordnung kann ein Protein oder ein posttranslational modifiziertes („PTM”) Protein, welches mit einem oder mehreren identifizierten Peptiden korreliert, identifiziert werden. Das Protein oder das posttranslational modifizierte Protein können auch quantifiziert werden.
  • Verschiedene Verfeinerungen des Identifikationsprozesses werden genannt. Eine Verfeinerung betrifft die Kontrolle, ob die Intensitäten aller Peptide, welche mit dem Protein oder dem posttranslational modifizierten Protein korrelieren können, in einem oder mehreren vorbestimmten Bereichen liegen (d. h. eine Kontrolle, ob die Intensitäten konsistent sind).
  • Ein oder mehrere endogene Moleküle werden als interner Standard verwendet. Der interne Standard kann verwendet werden, um wenigstens die erste physikochemische Eigenschaft und optional die zweite physikochemische Eigenschaft zu kalibrieren.
  • Die ersten Moleküle umfassen ein Peptid und der Molekülindex umfasst einen Peptidindex.
  • Der Peptidindex kann erzeugt werden, indem bestimmt wird, wie ein oder mehrere Proteine in Fragmente zerfallen oder aufgespalten werden können, um zu einer Vielzahl von Peptiden zu führen.
  • Vorzugsweise werden die ersten Moleküle auf der folgenden Basis identifiziert:
    • (i) Übereinstimmungsgenauigkeit des bestimmten Masse-zu-Ladung Verhältnisses der ersten Moleküle mit der Masse oder dem Masse-zu-Ladung Verhältnis eines indizierten Moleküls; und/oder
    • (ii) Übereinstimmungsgenauigkeit der ersten physikochemischen Eigenschaft der ersten Moleküle mit der ersten physikochemischen Eigenschaft des indizierten Moleküls; und/oder
    • (iii) Übereinstimmungsgenauigkeit einer zweiten physikochemischen Eigenschaft der ersten Moleküle mit der zweiten physikochemischen Eigenschaft des indizierten Moleküls.
  • Der Index kann eine Protein- oder Proteomsequenz-Datenbank, eine Expressed-Sequence-Tag(EST)-Datenbank oder eine Gen- oder Genom-Datenbank umfassen.
  • Gemäß einer weiteren Anordnung ist eine Methode zum Erzeugen eines Index zur Verwendung beim Identifizieren von Molekülen biologischen Ursprungs durch die Massenspektrometrie vorgesehen, umfassend:
    Genaues Bestimmen der Massen oder Masse-zu-Ladung Verhältnisse von Molekülen biologischen Ursprungs;
    Bestimmen einer ersten physikochemischen Eigenschaft, die nicht die Masse oder das Masse-zu-Ladung Verhältnis der Moleküle biologischen Ursprungs ist; und
    optional Bestimmen einer zweiten und/oder dritten und/oder vierten und/oder fünften oder weiteren physikochemischen Eigenschaft der Moleküle biologischen Ursprungs.
  • Gemäß einer weiteren Anordnung ist eine Methode zum Erzeugen eines Index zur Verwendung beim Identifizieren von Molekülen biologischen Ursprungs durch die Massenspektrometrie vorgesehen, umfassend:
    Genaues Bestimmen der Massen oder Masse-zu-Ladung Verhältnisse von Molekülen, umfassend Peptide, die aus der Aufspaltung oder Fragmentierung eines Polypeptids oder Proteins stammen;
    Bestimmen einer ersten physikochemischen Eigenschaft, die nicht die Masse oder das Masse-zu-Ladung Verhältnis der Moleküle, umfassend Peptide, ist; und optional Bestimmen einer zweiten und/oder dritten und/oder vierten und/oder fünften oder weiteren physikochemischen Eigenschaft der Moleküle, umfassend Peptide.
  • Gemäß einer weiteren Anordnung ist eine Methode zum Erzeugen eines Index zur Verwendung beim Identifizieren von Molekülen biologischen Ursprungs durch die Massenspektrometrie vorgesehen, umfassend:
    Genaues Bestimmen der Massen oder Masse-zu-Ladung Verhältnisse von Molekülen, umfassend Peptide, die aus der Aufspaltung oder Fragmentierung eines Polypeptids oder Proteins stammen;
    Bestimmen einer ersten physikochemischen Eigenschaft, die nicht die Masse oder das Masse-zu-Ladung Verhältnis eines oder mehrerer Proteine, von denen die Peptide abgeleitet sind, ist; und
    optional Bestimmen einer zweiten und/oder dritten und/oder vierten und/oder fünften oder weiteren physikochemischen Eigenschaft der Proteine.
  • Das Massenspektrometer umfasst ferner vorzugsweise eine Ionenquelle zum Erzeugen von hauptsächlich molekularen oder pseudo-molekularen Ionen. Die Ionenquelle kann eine Atmosphärendruck-Ionisationsquelle, z. B. eine Elektrospray-Ionisation(„ESI”)-Ionenquelle, eine chemische-Atmosphärendruck-Ionisation(„APCI”)-Ionenquelle, eine Atmosphärendruck-Photoionisation(„APPI”)-Ionenquelle oder eine Atmosphärendruck-Matrix-unterstützte-Laserdesorptionsionisation(„MALDI”)-Ionenquelle sein. Alternativ kann die Ionenquelle eine Nicht-Atmosphärendruck-Ionisationsquelle, z. B. eine Fast Atom Bombardment(„FAB”)-Ionenquelle, eine Flüssig-Sekundärionen-Massenspektrometrie(„LSIMS”)-Ionenquelle, eine Matrix-unterstützte-Laserdesorptionsionisation(„MALDI”)-Ionenquelle, eine Matrix-unterstützte-Laserdesorptionsionisation(„MALDI”)-Ionenquelle in Kombination mit einer Kollisionszelle zum Kollisionskühlen von Ionen oder eine Laserdesorptionsionisation(„LDI”)-Ionenquelle sein.
  • Vorzugsweise ist der Index wenigstens partiell in dem Massenspektrometer gespeichert oder erzeugt und/oder der Index ist wenigstens partiell entfernt gespeichert oder erzeugt, vorzugsweise im Internet.
  • Gemäß einer weiteren Anordnung ist ein Massenspektrometer vorgesehen, umfassend:
    ein Identifikationsmittel zum Identifizieren erster, durch das Massenspektrometer analysierter Moleküle, wobei sich das Identifikationsmittel bei der Verwendung auf einen Molekülindex bezieht, wobei der Index umfasst:
    • (i) die Identität jedes indizierten Moleküls; und
    • (ii) eine experimentell bestimmte oder vorhergesagte genaue Masse oder ein Masse-zu-Ladung Verhältnis/Masse-zu-Ladung Verhältnisse jedes indizierten Moleküls; und wobei das Identifikationsmittel ferner eine erste physikochemische Eigenschaft bestimmt, die nicht die Masse oder das Masse-zu-Ladung Verhältnis der Moleküle in dem Index ist, und optional eine zweite und/oder dritte und/oder vierte und/oder fünfte oder weitere physikochemische Eigenschaft der Moleküle in dem Index bestimmt.
  • Die bevorzugte Ausführungsform sieht eine analytische Methode vor, die die in einer Mischung vorliegenden Biopolymere identifiziert und/oder quantifiziert. Die Biopolymere können Proteine sein. Die untersuchte Mischung kann durch einen oder mehrere Trennungsschritte fraktioniert werden, während die Retentionszeiten jeder Komponente aufgezeichnet werden. Wenn die Biopolymere Proteine sind, kann jede Fraktion einer enzymatischen Aufspaltung unterworfen werden, um Peptidmischungen zu erhalten. Diese Peptidpools können dann durch einen oder mehrere Trennungsschritte fraktioniert werden, während die Retentionszeiten jeder Komponente aufgezeichnet werden. Jede Fraktion kann dann einer Massenspektrometrie unterworfen werden, um die Massen und Bereiche der Peptide zu bestimmen. Im Verlauf dieser Bearbeitungsschritte kann eine Vielzahl interner Standards und Kalibrierungsmittel in die Proben eingeführt werden, um die Leistung und Reproduzierbarkeit der Prozesse zu überwachen.
  • Eine geeignete Datenbank kann für die untersuchten Proben mit Hilfe eines Computers erzeugt werden. Diese Datenbank kann eine Sammlung von Proteinsequenzen umfassen, von denen man annimmt, dass sie in den untersuchten Proben vorliegen, und kann bekannte und/oder angenommene posttranslationale Modifikationen umfassen. Die Datenbank kann dann durch folgende Vorhersagen erweitert werden: (a) die Retentionszeiten von Proteinen auf der Basis verwendeter Versuchsparameter; (b) die durch enzymatische Aufspaltung auf der Basis verwendeter Versuchsparameter erzeugten Peptide; (c) die Retentionszeiten der Peptide auf der Basis verwendeter Versuchsparameter; und (d) die Massen der Peptide.
  • Die Versuchsdaten werden mit der mittels Computer erzeugten Datenbank verglichen. Jedem Datenpunkt wird auf der Basis der statistischen Signifikanz der Korrelation ein Peptid zugeordnet, wodurch die Proteine in der Mischung/den Mischungen identifiziert werden. Ferner werden die Bereiche der zugeordneten Peptide zwischen Proteinmischungen verglichen, um die relative Veränderung der Peptide und/oder posttranslational modifizierter Peptide zu bestimmen. Schließlich können die aus dieser Analyse gewonnenen quantitativen Informationen genutzt werden, um die Proteinzuordnungen zu validieren.
  • Die Massenspektrometrie wird für die Kennzeichnung der genauen Masse einer Vielzahl biologischer Moleküle in einer Mischung verwendet, insbesondere, wenn ein oder mehrere der biologischen Moleküle gekennzeichnet sind, so dass eine oder mehrere der Komponenten der Mischung identifiziert und/oder quantifiziert werden können.
  • Es ist ein Verfahren vorgesehen um zu bestimmen, welche Elemente eines Satzes von Kandidaten-Biopolymeren in einer Mischung von Proben-Biopolymeren vorhanden sind. Das Verfahren umfasst die folgenden Schritte:
    • (a) optional wird die Mischung der Proben-Biopolymere einem oder mehreren Fraktionierungsschritten unterzogen, um eine Vielzahl von Proben-Biopolymerfraktionen zu erhalten;
    • (b) selektives Aufspalten einer Vielzahl der Proben-Biopolymere, um einen Auszug, umfassend eine Mischung von Probenfragmenten zu erhalten;
    • (c) der Auszug wird einem oder mehreren Fraktionierungsschritten unterworfen, um eine Vielzahl von Probenfragmentfraktionen zu erhalten;
    • (d) Bestimmen der genauen Massen der individuellen Probenfragmente, welche in einer oder mehreren Fraktionen vorliegen;
    • (e) Zuweisen einer oder mehrer physikochemischer Eigenschaften zu den individuellen Probenfragmenten, auf der Basis der speziellen Probenfragmentfraktion, in die jedes individuelle Probenfragment fraktioniert worden ist;
    • (f) optional Zuweisen einer oder mehrerer physikochemischer Eigenschaften zu den Proben-Biopolymeren, von welchen die Probenfragmente abgeleitet worden sind, auf der Basis der speziellen Proben-Biopolymerfraktion, in welche die Proben-Biopolymere fraktioniert worden sind; und
    • (g) Identifizierung individueller Probenfragmente durch Vergleichen der genauen Massen und der zugewiesenen physikochemischen Eigenschaften der Probenfragmente mit den genauen Massen und physikochemischen Eigenschaften von Kandidatenfragmenten, welche von einem Satz Kandidaten-Biopolymere abgeleitet sind, von denen bekannt ist, dass sie mit einiger Wahrscheinlichkeit in der Probe vorliegen.
  • Optional werden die zugewiesenen physikochemischen Eigenschaften der Proben-Biopolymere, von welchen die Probenfragmente abgeleitet worden sind, mit den physikochemischen Eigenschaften der Kandidaten-Biopolymere verglichen, und ein Kandidaten-Biopolymer wird auf der Basis der Identifizierung in Schritt (g) eines oder mehrerer Fragmente davon in der Probenfragmentmischung als in der Probe vorhanden identifiziert.
  • Vorzugsweise werden die genauen Massen und physikochemischen Eigenschaften von Kandidatenfragmenten in einer berechneten Fragmentkarte gespeichert, welche von einem Satz Kandidaten-Biopolymere abgeleitet ist, von denen bekannt ist, dass sie mit einiger Wahrscheinlichkeit in der Probe vorliegen.
  • Bei einer Ausführungsform umfasst die Methode das Erzeugen einer Probenfragmentkarte, welche die genaue Masse individueller Probenfragmente mit den zugewiesenen physikochemischen Eigenschaften der individuellen Probenfragmente korreliert. Die Identifizierung individueller Probenfragmente erfolgt durch Vergleichen der Probenfragmentkarte mit der berechneten Fragmentkarte.
  • Optional wird eine bekannte Menge eines oder mehrerer Referenz-Biopolymere zu einem beliebigen Zeitpunkt vor dem Bestimmen der genauen Massen der individuellen Probenfragmente hinzugefügt. Vorzugsweise werden die Referenz-Biopolymere vor dem selektiven Aufspalten der Vielzahl von Proben-Biopolymeren hinzugefügt. Vorzugsweise sind die physikochemischen Eigenschaften der Referenz-Biopolymere bekannt und werden verwendet, um die den speziellen Proben-Biopolymerfraktionen, in die die Proben-Biopolymere fraktioniert worden sind, zugeordneten physikochemischen Eigenschaften zu validieren.
  • Bei einer weiteren Anordnung werden die relativen Mengen individueller Probenfragmente und Referenz-Biopolymerfragmente bestimmt. Vorzugsweise werden ein oder mehrere Referenz-Biopolymere zu einer Vielzahl von Proben-Biopolymermischungen, Proben-Biopolymerfraktionen, Auszügen oder Probenfragmentfraktionen hinzugefügt.
  • Bei den oben beschriebenen Verfahren werden die genauen Massen vorzugsweise durch Massenspektrometrie bestimmt. Vorzugsweise werden die Verfahren ausgeführt, ohne sekundäre MS/MS-Massenspektren der gemessenen Fragment-Ionen zu erhalten.
  • Zu den gemäß den bevorzugten Ausführungsformen verwendeten physikochemischen Eigenschaften zählen pI, chromatographische Retentionszeit, elektrophoretische Mobilität, Ionenladung, Ionisationspotential, Hydrophilie, Hydrophobie, Dipolmoment, Größe, Wasserstoffbindungsfähigkeit und Antikörperaffinität.
  • Vorzugsweise ist wenigstens ein in den Verfahren der bevorzugten Ausführungsform verwendeter Fraktionierungsschritt eine Umkehrphasenchromatographie.
  • Die Verfahren der bevorzugten Ausführungsform sind besonders geeignet, wo das Biopolymer ein Protein ist. Die Verfahren werden vorzugsweise auf Mischungen angewendet, die wenigstens 100, 1000 oder 5000 oder mehr Proteine umfassen.
  • Eine offenbarte Anordnung sieht ein analytisches Verfahren zum Identifizieren und Quantifizieren der in einer komplexen Proteinmischung vorhandenen Proteine vor. Bei dieser Anordnung umfasst das Verfahren die folgenden Schritte:
    die Proteinmischung wird einem oder mehreren Trennungsschritten unterzogen, während die einhergehenden Retentions- und/oder Migrationszeiten aufgezeichnet werden;
    selektives Aufspalten der in den resultierenden Fraktionen vorliegenden Proteine, um Proteinfragmentmischungen zu erhalten;
    die resultierenden Mischungen werden einem oder mehreren Trennungsschritten unterzogen, während die einhergehenden Retentions- und/oder Migrationszeiten aufgezeichnet werden;
    genaues Messen der Massen individueller Proteinfragmente in den resultierenden Fraktionen durch Massenspektrometrie; und
    Identifizieren individueller Proteinfragmente durch Vergleichen der gemessenen Massen und Retentions- und/oder Migrationszeiten der Proteinfragmente mit berechneten Werten.
  • Bei einer Anordnung umfasst das Verfahren eine Bestimmung der relativen Mengen individueller Proteinfragmente auf der Basis der massenspektralen Antwort. Bei einer anderen Ausführungsform werden die relativen Mengen individueller Proteine verwendet, um zu einer Identifizierung der Proteine beizutragen.
  • Bei der oben beschriebenen Anordnung werden Retentions- und/oder Migrationszeiten vorzugsweise von geeigneten Modi aus dem Bereich Hochleistungschromatographie, Elektrophorese und Ionenmobilitäts-Massenspektrometrie erhalten.
  • Gemäß einer Ausführungsform können Aminosäuremodifikationen und die relativen Mengen davon identifiziert und gemessen werden. Eine Ausführungsform wird unten mit Bezug zu der Analyse der Proteinmischungen detaillierter beschrieben. Mit Modifikationen, die als für die speziellen untersuchten Biopolymere geeignet bekannt sind, können die Verfahren der bevorzugten Ausführungsform auch auf RNA, DNA und Polysaccharide angewendet werden.
  • Ein Verfahren für die Identifizierung und Quantifizierung von Biopolymeren in Mischungen ist offenbart. Das Biopolymer kann ein Protein oder ein Peptid, eine Nukleinsäure oder ein Polysaccharid, vorzugsweise ein Protein oder ein Peptid oder eine Nukleinsäure und am stärksten vorzugsweise ein Protein oder ein Peptid sein. Das Verfahren ist in der Lage, ein oder mehrere Biomoleküle in sehr komplexen Mischungen zu identifizieren und zu quantifizieren, beispielsweise in einem Genom vorliegende Nukleinsäuren und in einem Proteom vorliegende Proteine.
  • Gemäß einer Anordnung ist die selektive Spaltung der Makromoleküle mit Reagenzien vorgesehen, die nur an bestimmten Stellen der Makromoleküle spalten, beispielsweise die Spaltung von Nukleinsäuren durch Restriktionsenzyme, die Spaltung von Proteinen durch selektive Peptidasen und die Spaltung von Polysacchariden durch Glykosidasen. Zu den Peptidasen, die verwendet werden können, zählen Trypsin, Endoprotease-LysC, Endoprotease-ArgC, Endoprotease GluC und Chymotrypsin. Der selektiven Spaltung folgt vorzugsweise die Trennung der resultierenden Fragmente auf der Basis von wenigstens einer ersten physikochemischen Eigenschaft und optional eine weitere Trennung auf der Basis einer zweiten, dritten oder weiteren physikochemischen Eigenschaft. Die Masse der Fragmente wird dann mit hoher Genauigkeit gemessen und durch den Vergleich der Ergebnisse mit einer Datenbank erwarteter Fragmente, welche Informationen über ihre genaue Masse und physikochemischen Eigenschaften enthält, bestimmt das Verfahren die Identität der Fragmente. Aufgrund der Identität und der Quantität der Fragmente können die Identität und die ursprüngliche Quantität der Biopolymere bestimmt werden.
  • Im Falle von Proteinen kombiniert das Verfahren die genaue Masse der Peptidfragmente mit einer oder mehreren physikochemischen Eigenschaften der Peptidfragmente, um die Fragmente zu identifizieren und sie bekannten Proteinen zuzuweisen. Dieses Verfahren wird verwendet, um detaillierte Ionenkarten von Proteinen in dem Proteom zu erzeugen. Diese Ionenkarten erlauben gleichzeitig eine genaue Identifikation und quantitative Informationen bezüglich der Proteine im Proteom.
  • In den Ionenkarten sind Informationen bezüglich einer oder mehreren physikochemischen Eigenschaften dieser enzymatisch oder chemisch abgeleiteten Peptide innerhalb der Versuchsparameter definiert. Diese physikochemischen Informationen können einschließen, sind jedoch nicht beschränkt auf die genaue Masse, die Hydrophobie/Hydrophilie und die Nettoladung. Darüber hinaus können die Proteine in der Probenmischung/den Probenmischungen durch jedes einer Anzahl unterschiedlicher Verfahren vorfraktioniert oder fraktioniert werden, einschließlich der Verwendung von Säulenmatrizes, wie beispielsweise, aber nicht ausschließlich Größenausschluss, Kationenaustausch, Anionenaustausch, Heparin, Sepharose. Diese Fraktionierung kann vor und/oder nach dem enzymatischen oder chemischen Aufschluss der Proteinmischung auftreten. Die Fraktionierung kann verwendet werden, um eine oder mehrere Unterfraktionen mit einem dadurch zugewiesenen Kennzeichen zu erzeugen, welche dann aufgeschlossen und/oder weiter fraktioniert werden können. Dieser Fraktionierungs- und Trennungsprozess sieht weitere Informationen vor, die zu der Ionenkarte hinzugefügt werden können und in einen Identifikations- und Quantifizierungsalgorithmus eingegeben werden können, wodurch die Stringenz der Suche weiter erhöht wird.
  • Die Integration eines internen Standards bietet ein Mittel zum Quantifizieren der Menge eines Proteins oder Peptids, wodurch eine absolute Quantifizierung eines Proteins oder Peptids in einer Probe erfolgt. Die relative Quantifizierung von Proteinmengen in komplexen Mischungen erfolgt durch das Vergleichen von unter verschiedenen Bedingungen (z. B. erkrankt versus nicht erkrankt, behandelt versus unbehandelt) erzeugten Ionenkarten.
  • So ist ein umfassendes Verfahren zum Identifizieren und Quantifizieren der Proteine und/oder Peptide in einer Mischung, insbesondere einer komplexen Mischung vorgesehen, wodurch eine Serie experimentell abgeleiteter, sehr genauer Molekularmassen mit einer Datenbank korreliert und verglichen wird, die theoretische Molekularmassen umfasst. Zusätzlich zur Molekularmasse werden eine oder mehrere physikochemische Eigenschaften oder Merkmale der Proteine und/oder Peptide in Korrelation zu und zur Überprüfung der Mischungsproteine/-peptide mit einer Datenbank oder einem Proteindatensatz verwendet.
  • Proteine in einer Probenmischung, die analysiert werden, können durch ein- oder mehrdimensionale Elektrophorese und/oder Chromatographie, z. B. Größenausschluss, Anionenaustausch, Kationenaustausch, Affinität oder eine beliebige Kombination daraus getrennt werden, wobei jede resultierende Teilmenge einer enzymatischen oder chemischen Behandlung unterzogen wird, mit dem speziellen Ziel, Peptid-Teilfolgen daraus zu erzeugen. Die aus jeder Teilmenge erzeugten Peptide können dann einer Massenspektralanalyse unterzogen werden, wobei die Trennungsvorrichtung vorzugsweise direkt oder indirekt mit einem Massenspektrometer gekoppelt ist. Genauer kann der Elutionspfad der Trennungs-/Konzentrierungsvorrichtung bezüglich der Elektrospray-Ionisationsmassenspektrometrie direkt mit der Ionisationsquelle des Massenspektrometers gekoppelt sein. Bei der Nano-Elektrospray-Ionisationsmassenspektrometrie kann das Elutionsmittel von der Trennungs-/Konzentrierungsvorrichtung direkt in den Nano-Elektrospray-Ausgeber oder in eine beliebige Verbindung, die in Fluidregistration damit steht, gegeben werden. Bei der MALDI-Massenspektrometrie wird das Elutionsmittel von der Trennungs-/Konzentrierungsvorrichtung direkt in zeitlich festgelegten Fraktionen abgelegt oder in Fraktionen abgelegt, die durch Peak-Detektion mittels Verfahren wie UV oder Fluoreszenz selektiert sind, und dies auf die MALDI-Ziele. In jedem Fall ist das Gesamtergebnis die Erzeugung einer Vielzahl experimentell abgeleiteter Massenladungswerte, deren Flutions-/Detektionszeit auf den Einschränkungen für die Elution basiert, die durch die zuvor vor der Peptidionisation eingesetzte Separations-/Konzentrierungsvorrichtung diktiert werden. Ein Peak-auffindender Algorithmus rekonstruiert eine errechnete Molekularmassenkarte jeder Teilmenge enzymatisch oder chemisch behandelter Proteine oder eines Protein-Pools, in welchem eine Auflistung aller entsprechenden Informationen aufgenommen ist, die sich auf die Erzeugung der Teilmenge beziehen. Genauer gesagt ist der Molekulargewichtbereich des intakten Proteins/der intakten Proteine, die Nettoladung des intakten Proteins/der intakten Proteine und die Affinität des intakten Proteins/der intakten Proteine eingeschlossen, um nur ein paar zu nennen. Ebenfalls eingeschlossen können Eigenschaften, wie beispielsweise, aber nicht ausschließlich die Nettoladung, die Hydrophobie, die Hydrophilie und die elektrophoretische Beweglichkeit jeder getrennten Untersequenz von dem enzymatisch oder chemisch behandelten Peptidpool vor der Ionisation sein.
  • Ferner können eine Kontrollsubstanz oder Kontrollsubstanzen in bekannten Konzentrationen optional eingeschlossen sein und vor der Peptidionisation direkt in die selektierten Trennungspuffer platziert werden oder direkt in die vorgetrennten/konzentrierten Peptidteilmengen platziert werden. Vorzugsweise ist die Kontrollsubstanz ungefähr äquimolar und ist von einem Typ, der nicht mit der Trennungs-/Konzentrierungs-Hilfsmatrix interagiert. Das Hinzufügen der Kontrollsubstanz/der Kontrollsubstanzen in einer bekannten Konzentration erleichtert die Quantifizierung der identifizierten Proteine.
  • Identifikationen können unter Verwendung eines beliebigen einer Anzahl von verschiedenen nicht redundanten Protein- oder Nukleotidsequenz-Datenbanken erfolgen, wie beispielsweise Genbank, SWISS-PROT, EMBLE, TREMBLE, Pdb, Genseq, etc. Diese Datenbanken können verwendet werden, um sehr genaue Molekularmassenkarten jedes einer Anzahl von verschiedenen enzymatisch oder chemisch aufgespaltenen Proteinen zum Vergleich mit den experimentell abgeleiteten Daten vorherzusagen. Bei einer Ausführungsform werden Proteine mit einer statistisch relevanten Anzahl von Peptiden, deren errechnete Molekularmassen im Wesentlichen denjenigen der Vorhersage des Verfahrens entsprechen, als Kandidatenproteine identifiziert. Für jedes Kandidatenprotein wird auf der Basis der Genauigkeit der Vorhersage des Verfahrens eine Vielzahl von Peptid- Molekularmassen identifiziert, was zu einer vorhergesagten Proteinliste mit Rangfolge führt. Die in der abgestuften Proteinliste identifizierten Proteine werden dann gemäß ihrer Entsprechungsgenauigkeit mit den kennzeichnenden physikochemischen Eigenschaften, einschließlich beispielsweise Hydrophilie-/Hydrophobiewerte, Basizitäts-/Aziditätswerte des Peptids kreuzkorreliert. Bei einer Ausführungsform ist ein reiteratives Mehrstufen-Analyseverfahren vorgesehen, wobei die Massegenauigkeit als erste Analyse bewertet wird, gefolgt von der Bewertung der Korrelation mittels verschiedener, bestimmter physikochemischer Eigenschaften einschließlich der Hydrophilie, der Nettoladung und der Protein-Nettoladung oder Größe, abhängig davon, wie die Probenmischung fraktioniert oder gekennzeichnet wurde.
  • Durch die Kennzeichnung von Mischungen unter unterschiedlichen Bedingungen oder aus unterschiedlichen Quellen sieht das erfindungsgemäße Verfahren ein Mittel zum Bestimmen von Proteinkonzentrationen, Aufwärts- und/oder Abwärtsregulierung, Komplexbildung, post-translationale Modifikation und das Bearbeiten von Proteinen, von nicht äquimolaren, heterogenen, komplexen Proteinmischungen vor. Der ausgebildete Fachmann kann dann die resultierenden Informationen nutzen, um therapeutisch oder diagnostisch relevante Ziele zur Untersuchung, für Screenings oder Eingriffe zu bestimmen und/oder zu identifizieren.
  • Die bevorzugte Ausführungsform sieht ein Mittel zum quantitativen Vergleichen der relativen Werte chemischer Komponenten vor, welche in zwei oder mehr komplexen chemischen Mischungen, wie jene, die im Bereich der Metabolomik oder Proteomik oder bei anderen biowissenschaftlichen vergleichbaren Versuchen anzutreffen sind, enthalten sind. Bei wenigstens einer Ausführungsform bietet das erfindungsgemäße Verfahren Informationen, die genutzt werden können, um eine oder mehrere chemische Komponenten in jeder chemischen Mischung qualitativ zu identifizieren.
  • Die vorliegende Erfindung umfasst zusätzlich zur Bestimmung der genauen Masse durch Massenspektrometrie die Schritte des Messens von zwei oder mehr physikochemischen Eigenschaften jeder chemischen Komponente in einer Mischung.
  • Die genaue Masse und die für jede Komponente vorgesehene Informationssammlung zu physikochemischen Eigenschaften bietet eine unterscheidende Signatur für jede Komponente in jeder Mischung. Schließlich umfasst das erfindungsgemäße Verfahren den Schritt des Messens der Intensität des massenspektrometrischen Signals oder der chromatographischen Peakfläche jeder chemischen Komponente in jeder Mischung. Diese Intensitäts- oder Peakflächenmessung basiert auf der genauen Masse.
  • Wie zuvor erwähnt, besteht eine sehr wünschenswerte Aufgabe bei vergleichenden biowissenschaftlichen Versuchen darin, zu bestimmen, ob sich chemische Komponenten in zwei oder mehr Mischungen von Proben biologischen Ursprungs in ihren Häufigkeitswerten bezüglich anderer in jeder Mischung vorhandener chemischer Komponenten verändert haben. Das erfindungsgemäße Verfahren ermöglicht einen Abgleich in jeder Mischung vorhandener chemischer Komponenten auf der Basis ihrer durch physikochemische Eigenschaften unterscheidenden Signaturen. Für einen Abgleich ist es nicht erforderlich, dass die chemische Identität jeder Komponente bekannt ist. Es ist nur erforderlich, dass die genaue Masse und die Signatur der physikochemischen Eigenschaft jeder chemischen Komponente eine klare Abgrenzung zu anderen chemischen Komponenten in der Mischung erlauben. Die Bestimmung der relativen Abundanz jeder abgeglichenen chemischen Komponente erfolgt, indem zuerst die Abundanz dieser chemischen Komponente bezüglich der Abundanz einer zweiten endogenen, in beiden Mischungen vorhandenen chemischen Komponente bestimmt wird, von der bestimmt wurde, dass sie in einer statistisch signifikanten Weise in den zwei verglichenen Probenzuständen einen unveränderten relativen Abundanzwert aufweist. Eine endogene chemische Komponente mit diesen Eigenschaften dient als ein interner Standard. Das Verhältnis jeder abgeglichenen chemischen Komponente in jeder Mischung bezüglich des gleichen endogenen internen Standards in jeder Mischung wird dann verglichen, um die Unterschiede der relativen Abundanzwerte jeder abgeglichenen chemischen Komponente in jeder Mischung vorzusehen. Manchmal kann die Hinzugabe exogener chemischer Spezies zu jeder chemischen Mischung als interne Standards Schätzungen zu Rückgewinnung, enzymatischer Aufspaltungseffizienz, falls zutreffend, genauer Massenmessung und chromatischer Elutionszeitkorrektur erleichtern.
  • Bei einigen biowissenschaftlichen Versuchen ist bekannt, dass die chemischen Komponenten in einer Probenmischung auf eine Liste gut gekennzeichneter chemischer Komponenten beschränkt sind. Beispielsweise können in einem Proteomik-Versuch die untersuchten Proteine von einem bestimmten Organismus oder einer gut gekennzeichneten Fraktion oder Teilmenge des Proteoms eines bestimmten Organismus stammen. Die Proteine, welche in einer solchen Probe oder einer Probenunterfraktion enthalten sein könnten, sind in vielen Fällen im Wesentlichen bekannt. Entsprechend können die Polypeptide, welche erzeugt werden, wenn eine solche Proteinmischung unter Verwendung einer selektiven Peptidase enzymatisch aufgespalten wird, vorhergesagt werden, und die genaue Masse und viele der physikochemischen Eigenschaften jedes dieser Polypeptide können errechnet werden. Ein bevorzugtes Verfahren ermöglicht den Vergleich der empirisch gemessenen genauen Masse und der physikochemischen Eigenschaften jedes unbekannten Polypeptids in einer Mischung mit der errechneten genauen Masse und den physikochemischen Eigenschaften jedes Polypeptids, das theoretisch in der Mischung enthalten sein könnte. Die chemische Identität eines Polypeptids in der unbekannten Mischung kann durch seine Entsprechungsgenauigkeit der genauen Masse und der physikochemischen Eigenschaften eines Polypeptids, das theoretisch in der Mischung enthalten sein könnte, bestätigt werden. Im Allgemeinen ist ein Polypeptid auf ein bestimmtes Protein beschränkt. Daher bietet die Identifizierung eines bestimmten Polypeptids im Allgemeinen auch eine eindeutige Identifizierung des Mutterproteins zu diesem Polypeptid. Die Identifizierung eines Proteins ist ferner bestätigt, wenn mehr als ein Polypeptid identifiziert wird, das auf dieses Protein beschränkt ist.
  • Bei der Untersuchung von Proteinen ermöglicht eine weitere Ausführungsform der Erfindung die Detektion posttranslational modifizierter Formen der beschränkten Proteingruppe oder einer Teilmenge davon, welche theoretisch in der untersuchten Mischung enthalten sein könnten. Dieses Verfahren erlaubt auch die Detektion modifizierter Formen der beschränkten Proteingruppe, die theoretisch in der Mischung oder einer Teilmenge davon, welche von einer oder mehreren Aminosäuresubstitutionen stammt, enthaften sein könnten. Diese Ausführungsform untersucht den gesamten gemessenen Polypeptid-Datensatz für die genaue Masse und die physikochemischen Eigenschaften für zusätzliche Polypeptide, welche sich in der Masse durch einen exakten Wert unterscheiden, welcher der Massendifferenz einer posttranslationalen Modifikation oder einer Aminosäurensubstitution eines Polypeptids entspricht, welches theoretisch von jedem der Proteine in der beschränkten Proteingruppe oder einer Teilmenge davon stammen könnte, die theoretisch in der untersuchten unbekannten Mischung enthalten sein könnte. Die Identität jeder dieser posttranslational modifizierten und aminosäuresubstituierten Kandidatenformen dieses anfänglichen Proteindatensatzes kann ferner durch ihre Konformität mit anderen errechneten physikalischen und chemischen Eigenschaften bestätigt werden. Beispielsweise würde eine phosphorylierte Form eines Polypeptids nicht nur eine exakte Massendifferenz entsprechend der hinzugefügten Phosphorylierungsgruppe aufweisen, sondern sie würde in Säugetiersystemen nur auftreten, wenn die nicht phosphorylierte Form des Polypeptids eine der folgenden Aminosäuren enthalten würde: Serin, Tyrosin oder Threonin. Bei Bakteriensystemen könnte diese Aminosäurenliste um Histidin ergänzt werden. Schließlich wäre zu erwarten, dass die phosphorylierte Form des Polypeptids stärker hydrophil als die nicht phosphorylierte Form wäre, und es wäre daher davon auszugehen, dass sie bei einer Umkehrphasenchromatographie-Trennung eine geringfügig kürzere Elutionszeit aufweisen würde.
  • Das Verfahren der bevorzugten Ausführungsform ist für die Analyse von Mischungen geeignet, bei denen verschiedene chemische Komponenten der Mischung durch eine oder mehrere Dimensionen einer genau definierten Chromatographie zuerst getrennt oder partiell getrennt werden, die bewirkt, dass Komponenten sequentiell und in reproduzierbarer Weise eluieren.
  • Eine Vielzahl von Massenspektrometriesystemen kann bei den erfindungsgemäßen Verfahren Anwendung finden. Idealerweise werden Massenspektrometer verwendet, die eine hohe Massegenauigkeit, eine hohe Empfindlichkeit und eine hohe Auflösung bieten. Die Massenanalysevorrichtungen solcher Massenspektrometer umfassen, sind aber nicht beschränkt auf Quadrupol, Flugzeit, Ionenfalle oder Magnetsektor oder Kombinationen daraus. Idealerweise sollte die Ionenquelle des Massenspektrometers hauptsächlich Proben-Molekularionen oder Pseudo-Molekularionen und wenige Fragmentionen erzeugen. Beispiele solcher Ionenquellen umfassen Atmosphärendruck-Ionisationsquellen (z. B. Elektrospray und atmosphärische chemische Ionisation) und Matrix-unterstützte Laser-Desorptions-Ionisation („MALDI”).
  • Idealerweise misst der Massenspektrometer die Masse einer betreffenden chemischen Spezies bis auf innerhalb 20 ppm seiner exakten oder errechneten Masse, stärker vorzugsweise mit einer Genauigkeit von innerhalb 10 ppm seiner exakten oder errechneten Masse und am stärksten vorzugsweise mit einer Genauigkeit von innerhalb 5 ppm seiner exakten oder errechneten Masse.
  • Idealerweise sollte die Massenanalysevorrichtung das gesamte Massenspektrum gleichzeitig und mit einer Frequenz abtasten und aufzeichnen, die die Erfassung von genügend Spektren für eine Vielzahl von Komponenten in der Mischung erlaubt, um zu garantieren, dass die Intensität oder die Peakfläche des massenspektrometrischen Signals quantitativ repräsentativ sind. Dies garantiert auch, dass die für alle Massen beobachteten Elutionszeiten durch die Massenanalysevorrichtung nicht modifiziert oder verzerrt werden und es würde dazu beitragen, sicherzustellen, dass quantitative Messungen nicht durch die Notwendigkeit, Abundanzen vorübergehender Signale zu messen beeinträchtigt werden.
  • Die bevorzugte Ausführungsform nutzt die Tatsache, dass jede chemische Komponente in einer komplexen chemischen Mischung in einer hochspezifischen Weise durch die Messung ihrer genauen Masse und einer oder mehrerer zusätzlicher physikochemischer Eigenschaften gekennzeichnet werden kann. Diese hochspezifische Information ermöglicht, dass chemische Komponenten, welche Bestandteil verschiedener chemischer Mischungen sind, abgeglichen und quantitativ verglichen werden. Bei einigen Versuchen, bei denen bekannt ist, dass die chemischen Komponenten in einer Probenmischung auf eine gut gekennzeichnete Liste chemischer Komponenten beschränkt sind, ist es auch möglich, die chemischen Komponenten in der Mischung qualitativ zu identifizieren.
  • Obgleich die Verfahren der bevorzugten Ausführungsform auf eine große Vielzahl von biowissenschaftlichen Experimenten angewendet werden können, ist die Beschreibung ihrer Anwendung auf die qualitative und quantitative Kennzeichnung einer Proteinmischung erläuternd. Die Proteinmischung kann eine einfache Zusammensetzung aufweisen oder sie kann wenigstens 100 Proteine oder sogar mehr als 1000 Proteine umfassen.
  • Gemäß einer Anordnung umfasst das Verfahren die folgenden Schritte:
    eine Proteinmischung wird einem oder mehreren Trennungsschritten unterzogen, während die physikochemischen Eigenschaften jeder erhaltenen Fraktion aufgezeichnet werden;
    Aufspalten der in den resultierenden Fraktionen vorliegenden Proteine mit einer selektiven Peptidase, um Mischungen von Proteinfragmenten oder Polypeptiden zu erhalten;
    die resultierenden Polypeptid-Mischungen werden einem oder mehreren chromatographischen Trennungsschritten unterzogen, während die damit verbundenen Elutionszeiten aufgezeichnet werden;
    genaues Messen der Massen individueller Polypeptide in den resultierenden Fraktionen durch Massenspektrometrie;
    Identifizieren individueller Polypeptide durch Vergleichen ihrer gemessenen genauen Masse und einer oder mehrerer physikalischer und chemischer Eigenschaften mit der errechneten genauen Masse und den physikochemischen Eigenschaften von Polypeptiden, welche theoretisch zu einer beschränkten Liste von Proteinen zugehörig sein könnten, die für die untersuchte Probe repräsentativ ist.
  • In manchen Situationen ist es von Interesse, die relativen Werte individueller Proteine in zwei unterschiedlichen Probenmischungen biologischen Ursprungs quantitativ zu vergleichen. Beispielsweise können die zwei Proteinmischungen für zwei unterschiedliche Zustände eines Organismus repräsentativ sein, wie beispielsweise erkrankt versus normal oder behandelt versus unbehandelt. Die oben erhaltenen Informationen erleichtern eine solche quantitative Bewertung. Mischungen dieses Typs von ähnlicher biologischer Herkunft und welche auf fast identische Weise gemäß der guten analytischen Praxis hergestellt worden sind, sind in ihrer chemischen Zusammensetzung meistens qualitativ und quantitativ sehr ähnlich. Im Allgemeinen sind die meisten Proteine in solchen Mischungen qualitativ gleich und liegen mit der gleichen relativen Abundanz vor. Polypeptide von diesen Proteinen bilden einen Pool endogener interner Standards, welche die Entdeckung und die quantitative Bestimmung von Polypeptiden erleichtern und damit auch die Proteine, deren relative Abundanz sich in den zwei verglichenen Probenzuständen verändert hat.
  • Gemäß einer Anordnung umfasst das Verfahren das Abgleichen von Polypeptiden, die der einen oder den mehreren Mischungen, die auf der Basis ihrer unterscheidenden genauen Masse und ihrer physikochemischen Eigenschaften verglichen werden, gemein sind. Es ist nicht erforderlich, dass die chemische Identität jedes Polypeptids für einen auszuführenden Abgleich bekannt ist. Es ist lediglich notwendig, dass die Signatur der physikochemischen Eigenschaft jedes Polypeptids erlaubt, dass dieses eindeutig von anderen Polypeptiden in der Mischung unterschieden wird. Eine Anzahl endogener Polypeptide kann getestet werden, um festzustellen, ob sie als interne Standards qualifiziert sind. Ein Polypeptid ist als interner Standard qualifiziert, wenn sich sein Abundanzwert bezüglich anderer spezifischer Polypeptide in der Mischung im Vergleich zu denselben Polypeptid-Abundanzverhältnissen in den anderen untersuchten Probenzustandsmischungen nicht in statistisch signifikanter Weise verändert. Das Verhältnis der Abundanz jedes Polypeptids in jeder Mischung bezüglich der Abundanz eines in jeder Mischung vorhandenen bestimmten internen Standards kann bestimmt werden. Dieses Verhältnis kann für jedes Polypeptid, welches zwischen Mischungen abgeglichen wurde, verglichen werden, um zu bestimmen, ob sich sein relatives Expressionsniveau in den verglichenen Probenzuständen verändert hat.
  • Komplexe Probenmischungen können unter Verwendung einer Vielzahl physikalischer Prozesse getrennt werden, wie beispielsweise durch Zentrifugieren oder durch die Verwendung einer oder mehrerer Chromatographiedimensionen, wie beispielsweise Größenausschluss, Anionenaustausch, Kationenaustausch, Gel-Elektrophorese, Normalphase, Umkehrphase oder Kombinationen davon. Diese Trennungsschritte können off-live oder on-line mit dem massenspektrometrischen Messverfahren erfolgen. Bei der Untersuchung von Biopolymeren, wie beispielsweise von Proteinen, können die Trennungen optional an den intakten Proteinen vor der enzymatischen Aufspaltung sowie an den Proteinabbauprodukten erfolgen. Das primäre Ziel des Trennungsprozesses ist das Erzeugen von Fraktionen in einer gut definierten und reproduzierbaren Weise. In vielen Fällen produzieren diese Trennungsprozesse Probenfraktionen mit definierbaren physikochemischen Eigenschaften.
  • Eine Anordnung umfasst die Schritte des Messens von zwei oder mehr physikochemischen Eigenschaften jeder chemischen Komponente in einer Mischung, wobei eine dieser Eigenschaften ihre durch Massenspektrometrie bestimmte genaue Masse ist. Die in zwei verschiedenen Mischungen enthaltenen chemischen Komponenten dürfen abgeglichen und auf der Basis der unterscheidenden Natur der Informationen der genauen Masse und der physikochemischen Eigenschaft quantitativ verglichen werden. Diese chemischen Komponenten können auch qualitativ identifiziert werden, wenn ihre gemessene genaue Masse und die physikochemischen Eigenschaften mit der errechneten genauen Masse und den physikochemischen Eigenschaften einer beschränkten Liste chemischer Spezies, von welchen bekannt ist, dass sie die untersuchte chemische Mischung repräsentieren, abgeglichen werden können.
  • Es gibt eine Vielzahl chemischer Spezies in vielen chemischen Mischungen biologischen Ursprungs, welche errechnete Molekularmassen haben, die mit einiger Massentoleranz eindeutig sind. Es ist möglich, einer chemischen Komponente in einer Mischung auf der Basis der Messung der genauen Masse allein eine eindeutige Signatur zuzuweisen, wenn der inhärente Massefehler des massenspektrometrischen Messverfahrens ausreichend ist, um sie von anderen Komponenten in der Mischung, die eine ähnliche Masse aufweisen, zu unterscheiden.
  • Zusätzliche physikochemische Eigenschaften, die eine eindeutige Signaturinformation für eine chemische Komponente in einer komplexen Mischung biologischen Ursprungs bieten könnten, sind beispielsweise die Löslichkeit, die Hydrophobie, die Hydrophilie, die Nettoladung, pI, pKa, das Molekularvolumen und die Antikörperaffinität. Einige dieser Parameter können zu dem gemessenen Elutionsrang einer chemischen Komponente bei der chromatographischen Trennung in Bezug gesetzt werden. Eine solche unterscheidende physikochemische Eigenschaft ist der Elutionsrang in einer Trennung durch Umkehrphasen- Chromatographie, welche ein Maß der Hydrophobie einer chemischen Komponente ist. Die chromatographische Retentionszeit oder die relative Retentionszeit in Kombination mit der genauen Masse ist häufig ausreichend, um eine chemische Komponente in einer komplexen Metabolitenmischung oder einer Proteinaufspaltungsmischung eindeutig zu unterscheiden, wodurch die relative Abundanz quantitativ mit einer entsprechenden Komponente in einer zweiten Mischung verglichen werden kann. Dieses Konzept kann erweitert werden, um die tatsächliche qualitative Identifizierung von Polypeptiden in einer Proteinaufspaltungsmischung einzuschließen, wenn bekannt ist, dass die Zusammensetzung der unbekannten Probe auf eine bestimmte Proteinliste beschränkt werden kann. In diesem Fall wird der Elutionsrang eines unbekannten Polypeptids in Bezug zu bekannten Polypeptidstandards verwendet, um die Hydrophobie zu beurteilen. Dieser gemessene Wert für die Hydrophobie kann dann mit der theoretischen Hydrophobie all der Polypeptide verglichen werden, welche theoretisch in der Mischung enthalten sein könnten. Diese Hydrophobie, eingeschränkt durch die Kombination mit der genauen Masse, kann verwendet werden, um das unbekannte Polypeptid eindeutig zu identifizieren.
  • Eine weitere beispielhafte physikochemische Eigenschaft, welche als eine unterscheidende chemische Signatur von Nutzen ist, ist der isoelektrische Punkt (pI). Intakte Proteine können auf der Basis des (pI) elektrophoretisch fraktioniert werden. Kleine Moleküle und Polypeptide können unter geeigneten Bedingungen durch eine Austauschchromatographie auf der Basis des pI fraktioniert werden. Diese gemessenen pI-Werte für eine unbekannte chemische Spezies können mit errechneten pI-Werten für chemische Spezies, welche theoretisch in der untersuchten Mischung enthalten sein könnten, verglichen werden.
  • Eine weitere beispielhafte physikochemische Eigenschaft, welche als eine unterscheidende chemische Signatur von Nutzen ist, ist der Ladungsstatus, wie er in dem massenspektrometrischen Messverfahren bestätigt ist. Dies ist als eine unterscheidende Signatur für Polypeptide von besonderem Wert. Die gegenwärtigen Erfinder haben empirisch bestimmt, dass der Ladungsstatus eines Polypeptid-Ions (2+, 3+, 4+ etc.) auf der Basis der Länge seiner Sequenz und der Anzahl der in seiner Sequenz enthaltenen basischen Aminosäuren geschätzt werden kann.
  • Beispielsweise ermöglichen solche Informationen, dass das korrekte Polypeptid identifiziert wird, wenn mehr als ein Polypeptid, das theoretisch in der untersuchten Mischung enthalten sein könnte, mit der gemessenen genauen Masse des unbekannten Peptids übereinstimmt.
  • Nachfolgend wird die Bedeutung einer Reihe von Ausdrücken, welche in der vorliegenden Anmeldung verwendet werden, erläutert. „AEX” steht für Anionenaustausch-Hochleistungsflüssigchromatographie. „Fläche” ist das über die Zeit integrierte Massenspektralsignal für ein gemessenes Polypeptidfragment. „Flächenverhältnis” ist die Division einer Fläche von einem Peptid in einer gegebenen Probe (wie beispielsweise Versuch) durch die Fläche von einem Peptid in einer anderen Probe (wie beispielsweise Kontrolle). „B & B” ist der Bull-Breese-Wert, ein Maß für die Hydrophobie. Siehe H. B. Bull, K. Breese, Hydrophobicity estimates for Proteins and peptides, Arch. Biochem. Biophys. 161: 665-670 (1974). Die ”Kalibrierungssperrmasse” bezeichnet die Tatsache, dass ein Analyt verwendet wird, um Fluktuationen in Massenmessungen während der Datenaufnahme zu korrigieren, um die Massegenauigkeit zu verbessern. „CAM” steht für Carboxamidomethylgruppe, ein chemischer Rest, der im Allgemeinen durch Bearbeitung eines Proteins oder Peptids mit einem Reduktionsmittel, wie beispielsweise Mercaptoethanol oder Dithiothreitol, gefolgt von dem Alkylierungsmittel 2-Iodoacetamid, an Sulfhydrylgruppen hängt. Ein „Kandidatenprotein” ist ein Protein, welchem eine statistisch signifikante Anzahl von Peptiden allein durch die Masse zugeordnet werden kann. „CEX” steht für Kationenaustausch-Hochleistungsflüssigchromatographie. „Ladungsstatus” ist die Anzahl von Protonen, die während des Ionisationsverfahrens (Ionenbildung) in der Ionenquelle eines Massenspektrometers an einem Peptidmolekül hängen. Die „Komposit-Ionenkarte” ist eine Liste aller gemessenen physikochemischen Eigenschaften und Flächen aller Peptide und aller Proteine, die bei einem Ionenkartierungsversuch identifiziert und qualifiziert werden. Die „Komposit-UML” ist eine nicht redundante Liste, die durch Vergleichen zweier Typen aller in Eindeutige-Masse-Listen (UMLs) enthaltenen Typen erzeugt wird. Die Komposit-UML umfasst den Status jedes Peptids als eine Funktion ihrer UMLs. Dieses Verfahren ist wiederholbar, um weitere Komposit-UMLs zu erzeugen. Die „Komprimierte UML” ist der Überschneidungsbereich einer Komposit-UML, wobei die Fläche(n) die Mittelwerte sind. Die „Datenbank” bezeichnet eine Sammlung von Proteinsequenzen und/oder Peptiden, von denen hypothetisch angenommen wird, dass sie in dem untersuchten Proteom einschließlich all ihrer betreffenden physikochemischen Eigenschaften vorliegen. Das „Endogene Referenzprotein (ERP)” ist ein endogenes Protein, von dem hypothetisch angenommen wird, dass es in allen Proben vorliegt und das für die Normierung der Versuchsparameter verwendet wird. Der „HPLC-Index” ist ein Maß der Hydrophobie. Siehe Biochemistry, 25: 5425 (1986). Der „Intensitätswert” ist die Summe aller flächenzentrierten, massenspektralen Signale für alle Isotope aller Ladungszustände jedes Ions, das den Minimalwert für die Iondetektion überschreitet. Das „Interne Referenzprotein (IRP)” ist ein exogenes Protein, das in eine untersuchte Probe eingeführt wird und für die Normierung der Versuchsparameter verwendet wird. Der „Interne Standard (IS)” ist ein exogenes Peptid mit bekanntem Molekulargewicht und bekannter Konzentration, das den Peptidfraktionen unmittelbar vor der endgültigen Trennung hinzugefügt wird. Die „Ionenkarte” ist eine Liste aller gemessenen physikochemischen Eigenschaften und Bereiche aller Peptide von einem einzelnen Protein, das in einem Ionenkartierungsversuch identifiziert und qualitativ bestimmt wurde. Die „Physikochemische Eigenschaft” ist jedes messbare Kennzeichen eines Proteins, Peptids oder eines anderen biologischen Moleküls, das als eine Basis für seine Trennung oder Beschreibung dienen kann. Die „Posttranslationale Modifikation/Modifikationen (PTM)” bezeichnet alle Veränderungen an einem Protein nach seiner Zusammensetzung aus einzelnen Aminosäuren. Ein „Posttranslationaler Modifikations(PTM)-Kandidat” ist ein Peptid, dessen Veränderungen der physikochemischen Eigenschaften die Hypothese posttranslationaler Modifikationen stützen. Das „Proteom” bezeichnet die in einer lebenden Zelle zu einem beliebigen Zeitpunkt vorhandenen Proteine. Der „Qualifizierungsalgorithmus” ist ein Computerwerkzeug, welches Versuchswerte aus einer UML, Komposit-UML, Ionenkarte und/oder Komposit-Ionenkarte verwendet und sie mit errechneten Werten aus einer Datenbank/Datenbanken vergleicht, um Peptide und damit Proteine in der Mischung/den Mischungen zu identifizieren. Das „Qualifizierte Protein” ist ein Protein, dem ferner eine statistisch signifikante Anzahl von Peptiden durch physikochemische Eigenschaften, die nicht die Masse sind, zugeordnet werden können. Das „Signatur-Peptid” ist ein Peptid, das einem Protein allein auf der Basis der Masse zugeordnet werden kann. Die „Eindeutige-Masse-Liste (UML)” ist eine nicht redundante Liste von Werten, wie beispielsweise Masse, Fläche, Retentionszeit, Ladungsstatus, etc., die von einem Ionenkartierungsversuch stammen. Der „Eindeutige-Masse-Listen-Browser (UMLB)” ist ein Software-Tool, das dafür ausgelegt ist, zwei UMLs, Komposit-UMLs oder Komposit-Ionenkarten zu vergleichen und zu normieren, um ihren Vergleichszustand zu bestimmen. Der „Eindeutige-Masse-Liste-Generator (UMLG)” ist ein benutzerdefiniertes Software-Tool, das durch einen Ionenkartierungsversuch erhaltene Rohdaten untersucht und reduziert, um eine nicht redundante Liste von Datenpunkten zu extrahieren. Die „Aufwärts-Regulierung, Abwärts-Regulierung” ist die Veränderung der Abundanz eines Peptids oder Proteins zwischen zwei physiologischen Bedingungen. Das „Validierte Protein” ist ein qualifiziertes Protein, dessen Peptide zwischen zwei Versuchen alle quantitativ nachfolgen.
  • Verschiedene Ausführungsformen der vorliegenden Erfindung zusammen mit anderen, ausschließlich für erläuternde Zwecke beschriebenen Anordnungen werden jetzt rein beispielhaft und mit Bezug zu den beiliegenden Zeichnungen beschrieben, für die gilt:
  • Die 1A1F zeigen ein Flussdiagramm, das eine Methode zum Analysieren der Differential-Proteinexpression durch Ionenkartierung darstellt;
  • 2 zeigt die Hydrophobie versus die Retentionszeit bei einer Umkehrphasen-HPLC-Säule für eine Sammlung tryptischer Fragmente bovinen Serumalbumins (BSA), welche als ein interner Standard verwendet werden können;
  • 3 zeigt Einträge der Ionenintensität versus die BSA-Menge, eingegeben in das Spektrometer für drei Fragment-Peptidionen;
  • 4 zeigt die Zusammensetzung der zwei Mischungen im Detail;
  • 5 zeigt ein Histogramm der beobachteten versus die theoretische Abundanz für eine Mischung B/Mischung A;
  • 6 zeigt eine Eindeutige-Masse-Liste für BSA;
  • 7A zeigt eine indizierte Peptiddatenbank für bovines Serumalbumin, welche in 7B fortgeführt ist;
  • 8 zeigt gemessene und errechnete Abgleichergebnisse für eine BSA-Proteinaufspaltung;
  • Die 9A9F zeigen einen qualitativen Proteinabgleich im Detail und
  • 10 zeigt eine komparative Studie für den Rattenurinmetabolismus.
  • E. COLI
  • Es gibt eine wesentliche Anzahl von Peptiden, deren errechnete Molekularmassen innerhalb einer Massentoleranz eindeutig sind. Je genauer die Messvorrichtung ist, desto besser sind die Chancen, eine große Anzahl dieser Peptidtypen zu identifizieren. Peptide, die keine Nachbarn innerhalb des inhärenten Massefehlers der Messvorrichtung haben, werden als Genaue-Masse-Signaturionen für ihre jeweiligen Mutterproteine bezeichnet. Um diesen Punkt zu erläutern, wurde eine nicht redundante Datenbank des Proteoms von E. coli unter Verwendung des unten beschriebenen Indizierungsalgorithmus indiziert.
  • Nachdem das gesamte E. coli-Proteom in silico analysiert war, wurden für die erwarteten Aufschlussprodukte mit Trypsin 191.777 theoretische Peptide erzeugt. Der Indizierer wurde so eingestellt, dass er nur die Peptide mit Molekularmassen von 500 bis 5000 mit bis zu einer ausgelassenen Spaltstelle erfasste. Errechnete theoretische physikochemische Eigenschaften umfassten, aber waren nicht beschränkt auf die vorbestimmte Retentionszeit und den vorbestimmten Ladungsstatus. Die indizierte Datenbank wurde nach jenen Peptiden befragt, die innerhalb von 5 ppm ihrer entsprechenden genauen Masse (d. h. für welche kein anderes Peptid in der Datenbank eine Masse innerhalb 5 ppm aufwies) eindeutig waren. Die Anfrage führte zu einer Liste mit 20.455 Peptiden, die 4023 (95%) der 4234 angeführten Proteine in der nicht redundanten E. coli-Datenbank identifizierte.
  • Die in silico Analyse zeigt die Möglichkeit, 95% der Proteine in dem E. coli-Proteom qualitativ zu identifizieren, indem eine genaue Massenmessung der Signaturionen von jedem jeweiligen Protein erzeugt wird. Dies bedeutet jedoch nicht, dass ein experimenteller enzymatischer Aufschluss eines Ganzzellenlysats alle theoretischen Signaturpeptide von allen Proteinen in dem Proteom erzeugt. Typischerweise führt jeder Typ einer massenspektrometrischen Analyse eines enzymatisch oder chemisch fragmentierten Proteins zu einer Sequenzabdeckung von zwischen 20% und 60%, wodurch die Anzahl der Signaturionen pro Protein wichtig wird, falls das Ziel darin besteht, so viele Proteine wie möglich in einem Proteom qualitativ zu identifizieren. Im Fall des Trypsin-behandelten E. coli-Proteoms (mit bis zu einer ausgelassenen Spaltstelle) sind nur 10,6% der Peptide Signaturionen. So kommt die Frage auf, wie die Anzahl der Signaturionen pro Protein zu vergrößern ist, wenn die Probe komplexer wird.
  • Um die Anzahl von Signaturionen pro Protein zu vergrößern, verwendet die bevorzugte Ausführungsform eine zweite Fraktionierungsmethode unter Verwendung einer zusätzlichen physikochemischen Eigenschaft, vorzugsweise der Hydrophobie. So wie jede Aminosäure eine definierte Molekularmasse aufweist, weist sie auch eine definierte Hydrophobie auf und kann gemäß dieser Eigenschaft unter Verwendung der geeigneten chromatographischen Säule und des geeigneten Lösungsmittelsystems, typischerweise mittels einer Umkehrphasenflüssigchromatographie, getrennt werden. Die Hydrophobie eines Peptids kann durch Summieren der Hydrophobiewerte für alle Aminosäuren in einer Peptidsequenz berechnet werden. In manchen Fällen wird der Wert durch Multiplizieren der Summe mit einem Korrekturkoeffizienten korrigiert, der einen direkten Bezug zu der Peptidlänge aufweist. So kann die Hydrophobie eines Peptids als eine zweite physikalische Konstante, d. h. als eine zweite physikochemische Eigenschaft betrachtet werden. Durch die Verwendung einer durch die genaue Massenanalyse eines Intakten Referenzproteins erzeugten Hydrophobiekurve kann jedes der theoretischen Peptide in der indizierten, nicht redundanten E. coli-Datenbank einer berechneten Hydrophobie und einer theoretischen Retentionszeit zugeordnet werden. Die Datenbank kann dann nach Ionen abgefragt werden, die eindeutig (Hydrophobie-Signaturionen) innerhalb eines Retentionszeitfensters sind. Das Einstellen des Retentionszeitfensters auf +/–2,5 Minuten und das Entfernen aller Genaue-Masse-Signaturionen aus der Datenbank und das nachfolgende Befragen der indizierten, nicht redundanten E. coli-Datenbank führte beispielsweise zu 74.239 Hydrophobie-Signaturionen (38,7%). Das Kombinieren der zwei physikochemischen Eigenschaften Masse und Hydrophobie identifiziert 94.671 Peptide, welche für das Protein, von welchem sie abgeleitet sind, eindeutig sind. Das Abfragen dieser 94.671 Ionen gegen die indizierte, nicht redundante E. coli Datenbank führte zu der Identifizierung von 100% der 4234 Proteine. Abhängig von der Komplexität des untersuchten Proteoms (E. coli 4.234, Hefe 6.173, Mensch 35.000 und mehr) kann es erforderlich sein, die Anzahl der Signaturionen pro Protein weiter zu erhöhen, um die minimale Sequenzabdeckung auf ein akzeptierbares, benutzerdefiniertes Niveau zu bringen.
  • Wenn dies notwendig ist, verwendet die bevorzugte Ausführungsform eine dritte physikochemische Eigenschaft, wie beispielsweise den isoelektrischen Punkt (pI). So wie jede Aminosäure eine definierte Molekularmasse und Hydrophobie aufweist, besitzt sie auch einen definierten pI und kann durch Ionenaustauschchromatographie zusammen mit einem geeigneten Elutionsgradienten und einer Pufferzusammensetzung getrennt werden. In Fällen, in denen der Peptid-pI als eine physikochemische Eigenschaft verwendet wird, wird der enzymatisch abgeleitete Peptidpool zuerst durch Ionenaustauschchromatographie getrennt. Die Analyse der genauen Masse und der physikochemischen Eigenschaften identifiziert die Peptidionen von dem intakten Referenzprotein/den intakten Referenzproteinen, die in jeder Salzfraktion vorliegen, wodurch jeweils ein pI-Bereich vorliegt. Ein pI-Toleranzfenster kann dann jeder Fraktion zugewiesen werden. Dann kann die indizierte, nicht redundante E. coli-Proteindatenbank nach Ionen abgefragt werden, die eindeutig innerhalb eines pI-Toleranzfensters liegen (pI-Signaturionen). Beispielsweise führte das Einstellen des pi-Toleranzfensters auf +/–2 pI-Einheiten, das Entfernen aller Genaue-Masse- und Hydrophobie-Signaturionen und das anschließende Abfragen der indizierten, nicht redundanten E. coli-Datenbank zu 16.470 pI-Signaturionen (8,6%). Die Kombination der drei physikochemischen Eigenschaften führte zu 111.141 Peptiden, welche für das Protein, von welchern sie abgeleitet sind, eindeutig sind. Die Abfrage dieser 111.141 Ionen gegen die indizierte, nicht redundante E. coli-Datenbank führte dazu, dass alle 4234 Proteine (100%) identifiziert wurden.
  • Ist das gewünschte Niveau der Sequenzabdeckung durch die Verwendung von drei physikochemischen Eigenschaften nicht erreicht worden, kann eine vierte physikochemische Eigenschaft, wie beispielsweise der Ladungsstatus des Peptids, verwendet werden. Bei einem gegebenen spezifischen Puffersystem (typischerweise pH < 2) für eine Genaue-Masse-LCMS-Analyse wird der Ladungsstatus/die Ladungszustände eines Peptidions durch die Peptidlänge, die Zusammensetzung und die Sequenz bestimmt. Durch die massenspektrometrische Analyse und die Analyse der physikochemischen Eigenschaften vieler Peptide von vielen verschiedenen Referenzproteinen haben die gegenwärtigen Erfinder empirisch bestimmt, dass der Ladungsstatus eines Peptids (2+, 3+, 4+, etc.) durch seine Sequenz und Länge vorhergesagt werden kann. Ist beispielsweise die Sequenz > 18 Aminosäuren lang und umfasst einen internen basischen Rest an der Position 9, so ist der kombinierte, gewichtete Ladungsstatus für dieses Peptidion 2,5 +/– 0,2. Unter Anwendung dieser empirisch abgeleiteten Ladungsstatussregeln weist das Verfahren der bevorzugten Ausführungsform jedem der 191.777 theoretischen Peptide in der indizierten, nicht redundanten E. coli-Proteindatenbank einen theoretischen Ladungsstatus zu und erzeugt eine Liste von Ladungsstatus-Signaturionen.
  • Die bevorzugte Ausführungsform verwendet optional zusätzliche Trennungsverfahren zum weiteren Erhöhen der Anzahl von Signaturionen pro Protein. Fachmänner im Bereich der Protein- und Peptidfraktionierung werden erkennen, dass eine Vielzahl verschiedener chromatographischer Trennungstechnologien verwendet werden können, um komplexe Proben weiter zu fraktionieren. Solche Trennungstechnologien umfassen, sind aber nicht beschränkt auf Gelpermeationschromatographie (Größenausschluss), Anionen- und Kationenaustauschchromatographie, Kapillarelektrophorese, isoelektrische Fokussierung und die zahlreichen Formen der Affinitätschromatographie. Die Trennungsmethoden können sowohl auf intakte Proteine als auch auf davon abgeleitete Peptidfragmente angewendet werden. Vorzugsweise vergrößert jede aufeinanderfolgende Trennungsrunde die Zahl der Signaturionen, die für das Protein, von dem sie stammen, eindeutig sind, bis alle Proteine in dem untersuchten Proteom genügend Signaturionen aufweisen, um das gewünschte Niveau der Peptididentifikation zu erreichen.
  • Es ist ersichtlich, dass mit abnehmender Auflösung des Massenspektrometers die Anzahl der physikochemischen Eigenschaften und/oder das Auflösungsniveau, mit welchem sie gemessen und berechnet sind, zunehmen muss, um ein gegebenes Signaturionen-Niveau zu halten. Aus diesem Grund ist es vorzuziehen, dass das Massenspektrometer innerhalb der praktischen Grenzen von Ausgaben und Durchsatz die höchstmögliche Auflösung aufweist.
  • Das Ionenkartierungsverfahren
  • Ein Beispiel der bevorzugten Ionenkartierung wird nun mit Bezug zu der „in silico”-Aufspaltung von Proteinen beschrieben. Die Aminosäuresequenzen der betreffenden Proteine, die die zu analysierende Mischung ausmachen, werden mittels einer der verschiedenen bekannten automatischen Methoden untersucht, um Spaltstellen zu identifizieren, an denen das zu verwendende Enzym diese vermutlich spaltet. Im World Wide Web sind Programme zum Zwecke der Berechnung der Massen von aus der Aufspaltung erwarteten Peptidfragmenten erhältlich, beispielsweise MS-Digest unter (http://) prospector.ucsf.edu/ucsfhtml3.4/msdigest.htm. Die interessierenden Proteine können das ganze Genom eines Organismus sein und die Sequenzen können von leicht erhältlichen Genomik- und Proteomik-Datenbanken stammen. Die Peptidfragmente, von denen erwartet wird, dass sie durch das zu verwendende Enzym oder die Enzyme erzeugt werden, können „fliegend” berechnet und mit gespeicherten Ergebnissen eines Ionenkartierungsversuchs verglichen werden und/oder die Daten der erwarteten Fragmente können vorberechnet und gespeichert werden, und die Ergebnisse von einem Ionenkartierungsversuch können mit den gespeicherten Daten fast so schnell verglichen werden, wie sie erzeugt werden.
  • Bei einer Ausführungsform der Erfindung umfasst die Methode des Erzeugens einer theoretischen Ionenkarte mit wenigstens einem Polypeptid einen oder mehrere der folgenden Schritte:
    Optional Translatieren von Sequenzen in eine Datenbank (z. B. Translatieren einer DNA-Datenbank in eine Protein- oder EST-Datenbank);
    Berechnen vorhergesagter Molekulargewichte und pI für native Proteine, von denen Peptide abgeleitet sind;
    In Beziehung setzen jedes Peptids zu dem MW und pI des nativen Mutterproteins; Durchführen einer Trypsin-Aufspaltung in silico unter Verwendung von bekannten Trypsinsubstrat-Mustern (Vorsehen einer Referenz für vorhergesagte Trypsinmuster);
    Optional Berechnen der theoretischen genauen Masse und/oder des Masse-zu-Ladung Verhältnisses/der Masse-zu-Ladung Verhältnisse jedes der resultierenden Fragmente;
    Optional Festlegen eines Grenzwertes „Vorhersehbare Masse” für Massen (z. B. > 8.000 Dalton und < 500 Dalton – Es ist schwierig, Massen weit über ungefähr 8.000 Dalton mit der für die Identifizierung der Aminosäurenzusammensetzung erforderlichen Auflösung zu wiegen; Peptide, die kürzer sind als ungefähr 5 Aminosäuren sind zu weit verbreitet, um von großem diagnostischen Nutzen zu sein);
    Optional Festsetzen eines Grenzwertes für berechnete ausgelassene Spaltstellen (Vorsehen einer Referenz für ausgelassene Spaltstellen);
    Optional Berechnen von Hydrophobie-Indizes für alle oder einige Peptide (z. B. durch die Bull-Breese-Methode);
    Optional Berechnen des pI für alle oder einige Peptide;
    Optional Berechnen der theoretischen Ladung für alle oder einige Peptide;
    Optional Erhalten der Anmerkungen zu jedem nativen Mutterprotein in der Datenbank (z. B. kann eine Protein-Datenbank Wissen zu post-translationalen Modifikationen, Verbindungsvarianten etc. umfassen);
    Optional Berechnen aller Phosphorylierungsstellen nativer Peptide (dies kann über das World Wide Web erfolgen, beispielsweise durch Verwenden der Prosite-Quelle unter www.expasy.org/prosite/(unter Verwendung des http://protocol) oder mit ähnlichen Programmen, die auf einem lokalen Computer laufen);
    Optional Berechnen aller Glykosylierungsstellen nativer Peptide (dies kann über das World Wide Web erfolgen, beispielsweise durch Verwenden der netOglyc-Quelle unter www.cbs.dtu.dk/services/NetOGlyc/(unter Verwendung des http://protocol)).
  • 1 zeigt ein Flussdiagramm der in dem Ionenkartierungsverfahren unternommenen Schritte. Das Verfahren, wie es in 1 dargestellt ist, umfasst die Beurteilung einer Kontrollprobe und einer Versuchsprobe zusammen mit einer intakten Referenz-Proteinprobe/Referenz-Proteinproben. Jeder Aspekt des Verfahrens wird unten detaillierter beschrieben.
  • Kontrollprobe/Versuchsprobe
  • Die Ionenkartierung kann verwendet werden, um Proteine in komplexen Mischungen zu identifizieren und/oder um das relative Expressionsniveau von Proteinen aus einer oder mehreren Kontroll- und Versuchsprobenquellen quantitativ zu vergleichen.
  • Isolierung und Vorfraktionierung einer intakten Proteinmischung
  • Wenn ein Ziel der Ionenkartierungsstudie darin besteht, das relative Expressionsniveau von Proteinen in zwei unterschiedlichen Proben quantitativ zu vergleichen, dann würden ähnliche Mengen einer komplexen Proteinmischung von einer oder mehreren Kontroll- und Versuchsprobenquellen isoliert. Diese intakten Proteinmischungen können von einer beliebigen Anzahl Quellen abgeleitet sein, einschließlich Ganzzellenlysate, partiell fraktionierte Proteinkomplexe und subzelluläre Organellen, um nur einige zu nennen.
  • Intakte Proteinmischungen von einer oder mehreren Kontroll- und Versuchsquellen können durch eine beliebige Anzahl einer Anzahl unterschiedlicher bekannter Methoden fraktioniert werden, einschließlich, aber nicht beschränkt auf eindimensionale Gelelektrophorese, Kapillarelektrophorese, Flüssigphasenisoelektrischer Punkt-Fokussierung, Affinitätschromatographie, ein- oder mehrdimensionale Anionen- oder Kationenaustauschchromatographie, Umkehrphasenchromatographie und Partitionszentrifugieren. Das Fraktionieren komplexer intakter Proteinmischungen ist eine Möglichkeit, den dynamischen Bereich von Proteinen zu erhöhen, die unter Verwendung des Verfahrens/der Verfahren der bevorzugten Ausführungsform identifiziert und/oder quantitativ verglichen werden können.
  • Probe bekannter Menge intakter Proteinmischung
  • Ähnliche Mengen einer intakten komplexen Proteinmischung sollten von den rohen und/oder fraktionierten Kontroll- und Versuchsprobenquellen isoliert werden, um nachfolgende quantitative Vergleiche zu vereinfachen.
  • Hinzufügen eines/von intakten (exogenen) internen Proteinstandards
  • Dieselbe Menge eines oder mehrerer intakter Proteine, von denen bekannt ist, dass sie für die untersuchten komplexen Proteinmischungen nativ sind, können den Kontroll- und Versuchsproben als interner Standard/interne Standards hinzugefügt werden. Diese intakten internen Proteinstandards ermöglichen mehrere wertvolle Qualitätskontrolltests in der Ionenkartierungsstudie. Das relative, durch den Aufschluss von internen Proteinstandards und nativen Proteinen erzeugte Peptidniveau stellt ein Maß dafür dar, dass die komplexen Kontroll- und Versuchs-Proteinmischungen mit ähnlicher Effizienz aufgeschlossen, reduziert und abgeleitet worden sind. Die durch den Aufschluss des/der internen Proteinstandards erzeugten Peptide dienen auch als Marker, um die Reproduzierbarkeit der chromatographischen Retentionszeit in aufeinander folgenden Peptidtrennungsverfahren zu überwachen und um die Massenbestimmungsgenauigkeit zu überwachen.
  • Erzeugen einer Blindprobe für einen/mehrere intakte interne Proteinstandards Eine unabhängige Probe des/der intakten Proteins/Proteine, die als interner Standard/interne Standards in den Kontroll- und Versuchsproben verwendet werden, wird/werden denselben Aufschluss-, Reduktions- und Ableitungsverfahren unterzogen und unterliegen denselben chromatographischen und Ionisierungsbedingungen, wie für die Ionenkartierungsanalyse der Kontroll- und Versuchsproben festgelegt ist. Dies ermöglicht die Identifizierung der zu den internen Standards zugehörigen Peptide. Es ermöglicht auch die Identifizierung von Hintergrundionen, welche von der nachfolgenden qualitativen Identifikation und/oder quantitativen Vergleichsverfahren ausgeschlossen sein sollten.
  • Chemischer/enzymatischer Aufschluss einer Proteinmischung
  • Jede beliebige Anzahl der zuvor beschriebenen Methoden kann verwendet werden, um Peptidfragmente aus den komplexen, intakten Kontroll- und Versuchs-Proteinmischungen und von den intakten interner-Proteinstandardmischungen zu erzeugen. Solche Methoden der Proteinfragmentierung können den enzymatischen oder chemischen Aufschluss umfassen, sind aber nicht darauf beschränkt.
  • Optionale eindimensionale oder mehrdimensionale chromatographische Trennung
  • Eindimensionale oder mehrdimensionale Flüssigphasen-chromatographische Trennungsmethoden können verwendet werden, um die Komplexität der beim Aufschluss der Kontroll-, Versuchs- und Interner-Standard-/Hintergrund-Proteinmischungen erzeugten Peptidmischungen vor der massenspektrometrischen Analyse zu reduzieren. Diese Flüssigphasen-chromatographischen Trennungsmethoden könnten eine Anionen- oder Kationenaustauschchromatographie, eine Umkehrphasenchromatographie, eine Kapillare Elektrophorese-Chromatographie („CEC”) oder eine Kombination dieser Methoden oder anderer zuvor beschriebener Methoden nach dem Stand der Technik, die sich auf die chromatographische Trennung von in nicht äquimolaren, heterogenen komplexen Mischungen enthaltenen Peptiden beziehen, umfassen. Diese flüssigchromatographischen Trennungsmethoden können direkt gekoppelt oder voneinander unabhängig verwendet werden, um Unterfraktionen des Peptid-Pools zu bilden. Typischerweise ist die abschließende flüssigchromatographische Trennung direkt mit der Ionenquelle eines für eine genaue Massenbestimmung geeigneten Massenspektrometers gekoppelt.
  • Optionales Hinzufügen eines Internen Standards B für die Iniektionsvolumenkorrektur
  • Dieselbe Menge eines oder mehrerer Interner-Standard-Gemische kann jeder Probenmischung vor der Flüssigchromatographie-Massenspektrometrie(LC-MS)-Analyse hinzugefügt werden. Der primäre Zweck dieses/dieser optionalen internen Standards besteht darin, chromatographische Injektionsvolumenvariationen zu korrigieren; sie können jedoch auch als chromatographischer Retentionszeit-Standard oder auch als Massegenauigkeitsüberprüfungs-Standard dienen.
  • Flüssigchromatographie-Analyse der genauen Masse
  • Der letzte Schritt der flüssigchromatographischen Trennung der aus dem Aufschluss der Kontrollprobe, der Versuchsprobe und der Interner-Standard-Protein-Blindproben erzeugten Peptid-Pools ist direkt mit einem Massenspektrometer gekoppelt, das eine genaue Massenbestimmung durchführen kann. Ein Massenspektrometer, das routinemäßig eine Massenbestimmungsgenauigkeit im Bereich von 10 Teilen pro Million (ppm) der theoretisch berechneten Masse leistet, ist akzeptabel. Jedoch ist eine routinemäßige Massenbestimmungsgenauigkeit im Bereich von 5 ppm oder weniger der theoretisch berechneten Masse wünschenswert. Der Massenspektrometertyp, der zu diesem genauen Massenbestimmungsverfahren in der Lage ist, kann Flugzeit, Fourier-Transform-Ionencyclotronresonanz oder Magnetsektor umfassen, um nur einige wenige zu nennen.
  • Verfahrensergebnisse unter Verwendung eines Eindeutige-Masse-Liste-Generators
  • Die flüssigchromatographische genaue Masseninformation wird unter Verwendung eines Eindeutige-Masse-Liste-Generators bearbeitet, welcher Grenzwertkriterien unter anderem auf der Basis von Massegenauigkeit, Ladungsstatus, chromatographische Peakintensität und Peakfläche und berechneter Hydrophobie verwendet, um eine Liste eindeutiger Ionen zu erzeugen, welche mit Listen verglichen werden kann, die in ähnlicher Weise von anderen LC-MS-Analysen abgeleitet sind.
  • Identifizieren und Quantifizieren Interner-Standard-Komponenten
  • Sowohl die Peptidaufschlussprodukte des/der optionalen intakten internen Proteinstandards als auch der/die optionale(n) post-Aufschluss „B” interne Standard/internen Standards, die der Kontrollprobe, der Versuchsprobe und den Interner-Standard-/Blindproben hinzugefügt wurden, sind in den Eindeutige-Masse-Liste-Informationensätzen identifiziert, die für jede dieser Proben erzeugt wurden und für die Nichtbeachtung als native Peptidkandidatenionen markiert wurden.
  • Interner Standard B-Korrektur von Peakflächen nativer Peptide
  • Die Peakfläche jeder durch den Eindeutige-Masse-Liste-Generator identifizierten Komponenten wird bezüglich LC-MS-Injektionsvolumenabweichungen durch Rationierung gegen die Peakfläche des optionalen Internen Standards „B” korrigiert.
  • Kompilierte Liste der Hintergrundionen für die Eindeutige-Masse-Liste-Blindkorrektur
  • Alle nicht-Interner-Standard-Ionen, die in der Intakte-Proteine-Interner-Standard/Interne-Standards-Blindprobe identifiziert sind, werden als Hintergrundionen bezeichnet und in einer Ausschlussliste kompiliert.
  • Entfernen von Hintergrundionen aus der Eindeutige-Masse-Liste
  • In der Intakte-Proteine-Interner-Standard/Interne-Standards-Blindprobe identifizierte Hintergrundionen werden aus der Betrachtung als native Peptidkandidatenionen in den Kontroll- und Versuchsproben- Eindeutige-Masse-Listen ausgeschlossen.
  • Geschätzte relative Aufschlusseffizienz vom Internen Proteinstandard
  • Die Peakflächen von dem/den Intakte-Proteine-Interne(r)-Standard(s), welche den Kontroll- und den Versuchsproben vor dem Aufschluss hinzugegeben wurden, gehörigen Peptidionen werden mit den Peakflächen einer Anzahl von nativen Peptidionen in den Kontroll- und Versuchsproben verglichen, um zu bestimmen, dass beide Proben mit vergleichbarer Effizienz aufgeschlossen wurden.
  • Vergleichen der mit Internem Standard korrigierten Peakflächen in dem Genaue-Masse-Chromatogramm für Polypeptide aus der Kontrollprobe und der Versuchsprobe
  • Die mit internem Standard korrigierten Peakflächen der genauen Masse für Peptidionen der Eindeutige-Masse-Liste, die nach der Hintergrundkorrektur in der Kontrollprobe verbleiben, werden mit in ähnlicher Weise korrigierten Peakflächen der genauen Masse für Peptidionen der Eindeutige-Masse-Liste in der Versuchsprobe verglichen. Zu vergleichende Peptidionen werden gemäß benutzerdefinierten Grenzwertkriterien bezüglich genauer Masse und chromatographischer Retentionszeit abgeglichen. Ist das Peakflächenverhältnis für ein Peptidion der Versuchsprobe, das mit einem Peptid der Kontrollprobe abgeglichen wird, über oder unter den benutzerdefinierten Expressionsniveau-Grenzwertkriterien oder wird ein Peptidion der Versuchsprobe nicht mit einem Peptidion der Kontrollprobe abgeglichen, so wird das Peptidion der Versuchsprobe für spätere Versuche, das Protein, von dem es abstammt, qualitativ zu identifizieren, markiert. Ist das Peakflächenverhältnis für ein Peptidion der Versuchsprobe, das mit einem Peptidion der Kontrollprobe abgeglichen wird, innerhalb der benutzerdefinierten Expressionsniveau-Grenzwertkriterien, dann kann ein weiterer Versuch, das Protein, von dem es abstammt, qualitativ zu identifizieren, unternommen werden oder auch nicht.
  • Qualitative Identifizierung biologisch wichtig
  • Ist das Peakflächenverhältnis für ein Peptidion der Versuchsprobe, das mit einem Peptidion der Kontrollprobe abgeglichen wird, innerhalb der benutzerdefinierten Expressionsniveau-Grenzwertkriterien, dann kann ein weiterer Versuch, das Protein, von dem es abstammt, qualitativ zu identifizieren, unternommen werden, falls diese Information als biologisch wichtig oder als in anderer Weise relevant für die Ziele der Studie betrachtet wird. Andernfalls wird die analytische Information, die für das Peptidion der Versuchsprobe bestimmt wurde, in einer Datenbank gespeichert und es werden keine weiteren Versuche, das Protein, von dem es abstammt, qualitativ zu identifizieren, unternommen.
  • Durchführen einer Hohe-Massegenauigkeit-Peptid-Massenfingerprint(PMF)-Datenbanksuche für Ionen der Eindeutige-Masse-Liste
  • Für eine qualitative Identifizierung ausgewählte Peptidionen der Versuchsprobe werden gegen eine nicht redundante Protein-Datenbank abgesucht. Datenbanksuchen sind durch die Massenbestimmungsgenauigkeit des Peptidions der Versuchsprobe sowie durch eine oder mehrere physikochemische Eigenschaften eingeschränkt, die für die in der Versuchsprobe enthaltene Proteinquelle bekannt sind. Relevante physikochemische Eigenschaften können den Probenherkunftsorganismus, eine subzelluläre Probenfraktion, den Proteinmolekulargewichtsbereich und den Protein-pI einschließen, um nur einige wenige zu nennen.
  • Tabellarische Darstellung oder Bildung einer Redundanzliste aller Eindeutige-Masse-Liste-Peptide, die mit jeder versuchten PMF-Proteinidentifizierung konsistent sind
  • Versuchsproben-Eindeutige-Masse-Liste-Peptide, welche versuchsweise über die PMF-Datenbanksuche identifiziert werden, um demselben Protein zugeordnet zu werden, werden gruppiert, um eine Redundanzliste für jedes versuchsweise identifizierte Protein zu bilden.
  • Bestimmung, ob jedes mit jeder versuchten Peptid-Massenfingerprint-Proteinidentifizierung konsistente Peptid dieselbe Expressionsniveauveränderung aufweist
  • Die Expressionsniveauveränderung jedes Versuchsprobenpeptids, das als konsistent mit derselben Proteinidentifizierung identifiziert wurde, wird verglichen. Sind die Expressionsniveauveränderungen für alle Peptide konsistent, dann können zusätzliche Tests zur qualitativen Identifizierung durchgeführt werden, z. B. eine Doppelkontrolle der Retentionszeit. Wenn die Expressionsniveauveränderungen nicht konsistent sind, dann können entweder alle Peptide oder wenigstens das Peptid/die Peptide, die bezüglich der Expressionsniveauveränderung nicht konsistent sind, für die LC-MS/MS-Analyse markiert werden.
  • Erzeugen von Bull & Breeze Kalibrierungskurven
  • Ein optionaler Test zum Bestätigen einer versuchten PMF-Identifizierung basiert darauf, ob die gemessene Bull & Breeze Hydrophobie/Hydrophilie für jedes Versuchsprobenpeptid mit der theoretischen Bull & Breeze Hydrophobie/Hydrophilie, die das Peptid aufweisen sollte, wenn die PMF-Identifizierung korrekt ist, konsistent ist. Zu diesem Zweck wird der theoretische Bull & Breeze-Index bekannter Interner-Standard-Peptide mit der LC-MS-Retentionszeit verknüpft, um eine Kalibrierungskurve zu erzeugen, durch welche der gemessene Bull & Breeze-Index für jedes Versuchsprobenpeptid bestimmt werden kann.
  • Versuchte Peptid-Massenfingerprintidentifizierung mittels Anwendung eines Qualifizierungsalgorithmus
  • Eine Vielzahl von Informationen ist zusammengetragen worden, die genutzt werden kann, um die PMF-Identifizierungsergebnisse weiter zu validieren. Informationen, wie beispielsweise unter anderem der Probenursprungsorganismus, die subzelluläre Probenfraktion, der Protein-Molekulargewichtsbereich und der Protein-pI können zusammen oder in Teilen genutzt werden, um die PMF-Datenbanksuche zu begrenzen. Zusätzliche Informationen zu physikochemischen Eigenschaften können durch die Verwendung eines Qualifizierungsalgorithmus getestet werden, um jede versuchte PMF-Identifizierung weiter zu qualifizieren. Beispielsweise könnte der Algorithmus genutzt werden, um die Konsistenz des gemessenen im Vergleich zum theoretischen Bull & Breeze-Index für jedes Eindeutige-Masse-Liste-Peptid zu bewerten; er könnte genutzt werden, um die um die Konsistenz des gemessenen im Vergleich zum theoretischen pI für jedes Eindeutige-Masse-Liste-Peptid zu bewerten; er könnte genutzt werden, um die Konsistenz ausgelassenen Spaltstellen und von Peptid-Ladungsstatussinformationen zu bewerten; er könnte genutzt werden, um die Konsistenz von Histidin-enthaltenden Peptiden und Ladungsstatussinformationen zu bewerten; er könnte genutzt werden, um die Konsistenz von Cystein-enthaltenden Peptiden und dem gemessenen Vorliegen zugehöriger Peptide, welche modifizierte Cystein-Aminosäuren umfassen, zu bewerten und/oder er könnte genutzt werden, um die Konsistenz von Methionin-enthaltenden Peptiden und dem gemessenen Vorliegen zugehöriger Peptide, welche oxidiertes Methionin mit Peptiden umfassen, zu bewerten.
  • Entfernen versuchsweise identifizierter Massen von der Eindeutige-Masse-Liste und Erzeugen einer Liste versuchsweise identifizierter Proteine
  • An diesem Punkt im Datenreduzierungsprozess sind alle Hintergrund- und optionalen, Interner-Standard-zugehörigen Ionen von der Versuchsproben-Eindeutige-Masse-Liste entfernt. Abhängig von den Zielen der Studie kann die Versuchsproben-Eindeutige-Masse-Liste weiter begrenzt sein und nur diejenigen Ionen umfassen, welche einen offensichtlichen Expressionsniveauunterschied im Bezug zu den Kontrollproben-Eindeutige-Masse-Liste-Ionen aufweisen, das heißt oberhalb oder unterhalb der benutzerdefinierten Grenzwertkriterien liegen. In jedem Fall werden die verbleibenden Versuchsproben-Eindeutige-Masse-Liste-Ionen in jene aufgeteilt, die die Qualifizierungsalgorithmus-Kriterien erfüllen, und in jene, die die Qualifizierungsalgorithmus-Kriterien nicht erfüllen. Ionen, die die Qualifizierungsalgorithmus-Kriterien erfüllen, werden zu einer Versuchsweise-Identifizierte-Proteine-Liste bewegt. Diese Ionen werden im Allgemeinen nicht weiter durch die LC-MS/MS-Analyse qualifiziert.
  • Erzeugen einer Waisen-Massenliste für nicht identifizierte Massen in der Eindeutige-Masse-Liste
  • Versuchsproben-Eindeutige-Masse-Liste-Ionen, die die Qualifizierungsalgorithmus-Kriterien nicht erfüllen, werden in eine Waisen-Massenliste bewegt.
  • Suche nach posttranslational modifizierten (PTM) Varianten versuchsweise identifizierter Proteine in der Waisen-Massenliste
  • Waisen-Massenliste-Ionen werden erneut einer PMF-Suche unterzogen, um spezifisch zu bewerten, ob sie als posttranslational modifizierte Varianten der versuchsweise identifizierten Proteine betrachtet werden können.
  • Transfer qualifizierter PTM-Treffer von der Waisen-Massenliste zu der Versuchsweise-Identifizierte-Proteine-Liste
  • Waisen-Massenliste-Ionen, die die Kriterien der Versuchsweise-Identifizierte-Proteine-PTM-Varianten erfüllen, werden unter Anwendung des Qualifizierungsalgorithmus validiert und von der Waisen-Massenliste zu der Versuchsweise-Identifizierte-Proteine-Liste transferiert.
  • Platzierung verbleibender Waisen-Massen auf der Einschlussliste für die LC-MS/MS-Analyse
  • Waisen-Massenliste-Ionen, die nicht die Kriterien der Versuchsweise-Identifizierte-Proteine-PTM-Varianten oder nachfolgende qualifizierende Kriterien erfüllen, werden für die LC-MS/MS-Analyse markiert.
  • LC-MS/MS-Analyse nicht identifizierter Waisen-Massen und versuchte Protein-ID-Peptidmassen, die eine weitere Überprüfung benötigen
  • Nicht identifizierte Waisen-Massen und andere Peptidmassen, die für eine weitere Überprüfung markiert sind, können dann mittels LC-MS/MS analysiert werden.
  • Proteinsequenz-Datenbanksuche oder EST-Datenbanksuche oder de-novo-Sequenz LC-MS/MS-Ergebnisse
  • Die LC-MS/MS-Analyseergebnisse werden mit Software-Tools untersucht, die die im MS/MS-Analyseprozess erzeugten Peptidsequenzinformationen nutzen. Die Software-Tools umfassen die Proteinsequenz-Datenbanksuche, die Expressed-Sequence-Tag(EST)-Datenbanksuche und de-novo-Sequenzierungsalgorithmen, um nur einige wenige zu nennen.
  • Update der Versuchte-Protein-ID-Liste mit den LC-MS/MS-Analvseergebnissen
  • Versuchsweise durch die LC-MS/MS-Analyse identifizierte Proteine werden zu der Versuchsweise-Identifizierte-Proteine-Liste hinzugefügt.
  • Erzeugen von Ionenkarten und Archivieren der Ergebnisse für versuchsweise identifizierte Proteine und Waisen-Peptid-Massenlisten
  • Alle physikochemischen Eigenschaftsdaten und quantitativen Expressionsniveaudaten für die versuchsweise identifizierten Proteine, ihre entsprechenden Peptidfragmente und für die Waisen-Peptid-Massenliste-Ionen werden in einer Datenbank archiviert und für die Anzeige in einer Vielzahl von Ionenkartenformaten verfügbar gemacht, welche die unterschiedlichen Proteingehaltswerte der untersuchten Kontroll- und Versuchsproben zeigen.
  • Qualitative Bestimmung
  • Bevor eine experimentell abgeleitete eindeutige Masse qualitativ bestimmt werden kann, wird das optionale Interne Referenzprotein/die Internen Referenzproteine (IRP) allein aufgeschlossen. Erneut erhalten die IRPs einen dreifachen Durchlauf, wobei jede resultierende UML unter Verwendung spezifischer benutzerdefinierter Parameter und Grenzwerte verglichen und komprimiert wird. Als Beispiel für den hierin beschriebenen E. coli-Datensatz wurden diese Parameter auf +/–5 ppm, 2 Minuten und +/–0,5 Ladungsstatus eingestellt. Da dieselben IRPs verwendet werden, ermöglicht die Datenkomprimierung ständig eine Anzahl unterschiedlicher Redundanztests. Erstens, wie reproduzierbar der Aufschluss war; zweitens, wie reproduzierbar die Cysteinderivatisierung war und drittens, wie reproduzierbar die Ionisierungseffizienz war. All diese Parameter können durch Vergleichen der komprimierten Daten für diesen Satz von IRP Genaue-Masse-LCMS-Analysen mit jenen anderer qualitativ bestimmt werden.
  • Die Retentionszeiten aller eindeutigen Massen, die mit IRP-Peptiden durch die genaue Masse und den Ladungsstatus abgeglichen sind, können dann mit der theoretischen Hydrophobie jedes Peptids verknüpft werden, was zu einer linearen Gleichung führt, die die Retentionszeit in Bezug zur Hydrophobie setzt (siehe 2). Das Vorliegen dieser Gleichung ermöglicht, dass eine experimentelle Hydrophobie für jede experimentell abgeleitete eindeutige-Masse-Retentionszeit in der Komposit-UML berechnet wird. Ferner ermöglicht die Tatsache, dass die Ladungsstatussregeln bereits feststehen, dass ein theoretischer Ladungsstatus für jedes Peptid in der indizierten, nicht redundanten Proteindatenbank berechnet wird. Die qualitative Bestimmung kann daher das Einordnen aller experimentell abgeleiteten physikochemischen Eigenschaften bezüglich der theoretischen physikochemischen Eigenschaften aller Peptide im Proteom eines Organismus umfassen. Bezüglich des E. coli-Datensatzes können diese physikochemischen Eigenschaften die genaue Masse, die Hydrophobie und der Ladungsstatus sein. Bevor der Qualifizierungsalgorithmus angewendet wird, wird die Komposit-UML über die genaue Masse gegen die indizierte, nicht redundante Proteindatenbank abgesucht. Eine genaue-Masse-Suche kann als Peptid-Massenfingerprint betrachtet werden. Hier wählt der Benutzer einen Toleranzwert aus und gibt ihn für eine Liste unterschiedlicher genaue-Masse-Suchparameter ein. Bezüglich des E. coli-Datensatzes wurden die genaue-Masse-Suchparameter festgelegt als: Massegenauigkeit +/–10 ppm, minimale Anzahl von abzugleichenden Peptiden 3 und ausgelassenen Spaltstellen = 0. Weitere Parameter könnten die Sequenzabdeckung, den intaktes-Protein-Molekulargewichtsbereich, den intaktes-Protein-pI, den Peptid-pI, Peptidmodifikationen, d. h. Phosphate, Zucker, und nicht spezifische Abspaltungen umfassen, um nur einige wenige zu nennen. Ferner könnte der Benutzer verschiedene Parameter für verschiedene Wiederholungen auswählen, wie im Abschnitt zur subtraktiven Iteration erläutert. Hier bietet der Algorithmus für die versuchte Identifizierung die geeigneten Suchparameter für die genaue Masse für jede Iteration.
  • Frequenz-Generator
  • Der Frequenz-Generator versieht zuerst jede versuchte Identifizierung (TID) mit der Anzahl der Proteine, die im benutzerdefinierten Toleranzfenster für jede im Analyseprozess gewählte physikochemische Eigenschaft als Treffer erscheinen. Beim E. coli-Beispiel waren diese Frequenzwerte (FregAM, FreqHPLCi, FreqCS). Der experimentell abgeleitete, berechnete MH+ 1795,9523 @ RT 45,00 Minuten mit einem berechneten experimentellen Ladungsstatus von 2,90 hatte 7 verschiedene Proteintreffer innerhalb der genaue-Masse-Toleranz von 10 ppm. Für die genaue Masse wurden jedoch drei Toleranzfenster gewählt, nämlich 0–5 ppm, 5–7,5 ppm und 7,5 bis 10 ppm:
    Toleranz = 10 ppm
    Koeffizienten für AMFenster
    x = 5 7,5 bis 10 ppm
    y = 2,5 5 bis 7,5 ppm
    z = 1 0 bis 5 ppm
  • Als solches war der FreqAM 5 für die 5 TIDs innerhalb des Toleranzfensters 0–5 ppm, 6 für das Toleranzfenster 5–7,5 ppm und 7 für das Toleranzfenster 7,5–10 ppm. Um die Ränge weiter zu trennen, erhält jede versuchte Identifizierung (TID) einen Gewichtungsfaktor auf der Basis des Toleranzfensters, in das diese TID fiel. Bei diesem Beispiel ist der Unterschied zwischen 5 Treffern und 7 Treffern nicht so groß; wird jedoch jedem Toleranzfenster ein Gewichtungsfaktor zugeordnet, so ist es möglich, eine hochqualitative (< 5 ppm) genaue-Masse-TID von einer mit einer geringeren Qualität (> 7,5 ppm) weiter zu trennen. So wird jedem Toleranzfenster ein benutzerdefinierter Gewichtungsfaktor zugeordnet AMGewichtet (x, y und z, wie oben gezeigt). Bei diesem Beispiel wurden die Gewichtungsfaktoren 1; 2,5 und 5 den Toleranzfenstern 0–5 ppm, 5–7,5 ppm bzw. 7,5–10 ppm zugeordnet. Das Produkt FreqAM·AMFenster verändert den Rang von 5, 6, 7 zu 5, 15, 35 und distanziert eine TID mit geringerer Qualität deutlich von einer TID mit höherer Qualität. (Später wird deutlich werden, warum ein niedriger Rang besser ist). Um die Rangordnung weiter anzupassen, kann ein weiterer Gewichtungsfaktor TIDSGewichtetAM eingeführt werden. Dieser Koeffizient korrigiert die Bewertung durch Teilen jedes einzelnen TID FreqAM durch denjenigen Wert des Maximum FreqAM. Beim vorliegenden Beispiel war der berechnete TIDSGewichtetAM 3,57 für jene mit FreqAM von 5, 5,14 für jene bei 6 und 7 für den einen mit einer FreqAM von 7. Da die Bandbreite abhängig von der Anzahl der versuchsweise identifizierten Proteine bei jedem Toleranzfenster nicht so groß ist, beeinflusst der Koeffizient TIDSGewichtetAM die Bewertung nicht so stark wie AMFenster. Das Produkt aus FreqAM·AMFenster·TIDSGewichtetAM verändert die Bewertung von 5, 15, 35 zu 17,85; 77,1; 245. Liegt jedoch nur eine TID vor, trennt dieser Koeffizient jede zur Datenreduzierung gewählte physikochemische Eigenschaft innerhalb des Toleranzfensters 1 klar vom Rest der Gruppe. Der endgültige, benutzerdefinierte Gewichtungsfaktor für eine bestimmte physikochemische Eigenschaft ist das Gewicht, das diese Eigenschaft bei der endgültigen Bewertung hat, d. h. 50% der gesamten Bewertung basiert auf der genauen Masse, daher gilt AMGewicht = 1/5: Koeffizienten für Frequenzgewichtung
    a = 6 Gewicht_AM
    b = 2 Gewicht_HPLC
    c = 2 Gewicht_CS
  • AM-Wert in der endgültigen gewichteten Rang-Gleichung: 1/(AM + HPLC + CS) = (AMGewichtet·AMFreq·TIDSGewichtet·AMFenster).
  • Dieselbe Logik gilt für alle gewählten physikochemischen Eigenschaften, die für die Datenreduzierung verwendet wurden, mit dem Ergebnis eines endgültigen gewichteten Rangs von 0,1795 für zwei der sieben TIDs mit der nächsten Bewertung bei 0,156. Es wird darauf hingewiesen, dass die zwei TIDs mit einem Wert von 0,1795 von demselben Peptid stammen, abgeleitet von zwei Isoformen desselben Proteins. Um diese Genaue-Masse-Physikochemische-Eigenschaften-TID zu validieren, wurden die genaue Masse und die Retentionszeit in einer Einschlussliste platziert und eine MS/MS wurde durchgeführt. Die MS/MS-Suchergebnisse ordneten diese eindeutige Masse klar und eindeutig tufA und B zu.
  • Es gibt einen weiteren Gewichtungsfaktor, den „Wahrscheinlichkeits-Gewichtungsfaktor”, einen Koeffizienten, der im Allgemeinen standardmäßig auf 1 gesetzt ist. Wenn alle TIDs nur mit dem niedrigsten physikochemischen Toleranzfenster abgeglichen sind, werden die folgenden Gewichtungsfaktoren verwendet, was anzeigt, dass mit hoher Wahrscheinlichkeit alle TIDs falsch positiv sind:
    AM = 0,2
    HPLCi = 0,5
    CS = 0,33
  • In einem reiterativen Suchsystem können dies eindeutige Massen sein, die ausgelassene Spaltstellen, Punktmutationen und Modifikationen etc. umfassen. Trifft dieser Umstand zu, wird der Wahrscheinlichkeitswert mit dem benutzerdefinierten Koeffizienten multipliziert.
  • Fachleute werden erkennen, dass andere physikochemische Eigenschaften ebenfalls bewertet werden können. Solche anderen physikochemischen Eigenschaften könnten sein: Mw und pI für das Intakte Protein, Peptid-pI und genaue Massenunterschiede, sofern sie einen Bezug zu Peptidmodifikationen haben, um nur einige wenige zu nennen.
  • Wie zuvor erwähnt, ist der Frequenzgenerator einfach ein Bewertungsalgorithmus, der dazu führt, dass jeder TID ein gewichteter Rang zugeordnet wird. Der gewichtete Rang kann zu einer Wahrscheinlichkeitsbewertung extrapoliert werden, wodurch im Wesentlichen einer bestimmten genauen Masse eine Wahrscheinlichkeit zugeordnet wird, wobei ein bestimmter Ladungsstatus bei einer bestimmten Retentionszeit zu der wahrscheinlichsten Kandidatenpeptidsequenz in der nicht redundanten Proteindatenbank eluiert. Um eine TID weiter zu validieren, führt der Benutzer am besten einen Qualifizierungsalgorithmus aus.
  • Qualifizierungsalgorithmus
  • Der Qualifizierungsalgorithmus ermöglicht dem Benutzer, bestimmte Parameter für das Vergleichen und Qualifizieren Frequenz-kommentierter TIDs von einem beliebigen zwei-Proben-Satz, vorzugsweise einer Kontrolle und einem Versuch, einzustellen. Um den Algorithmus zu aktivieren, stellt der Benutzer zuerst die Parameter für den Abgleich ein. In dem tufA-Beispiel für E. coli wurden die Qualifizierungsparameter nur auf jene Abgleichpaare mit einem Massefehler von weniger als 5 ppm, einer Retentionszeitdifferenz von weniger als 2 Minuten, einer ABS Freq <= 4 und einem Wahrscheinlichkeitswert > 70% eingestellt. Zuerst werden die Frequenz-kommentierten Daten nach Proteinen sortiert, dann nach MH+, dann nach Proben. Nur jene mit Abgleichpaaren werden gewählt. Dies erfolgt durch ein weiteres Sortieren nach Sequenz, dann nach Probe. Dann erfolgen Berechnungen der Massen- und Retentionszeitdifferenzen und der normalisierten Flächenverhältnisse. Die Berechnungen basieren immer auf der Division der Versuchsergebnisse durch die Kontrollergebnisse.
  • Sobald dies erfolgt ist, erzeugt die Software eine ABS Freq für jedes abgeglichene Paar. Die ABS Freq ist gleich dem Min Wert von FreqAM, FreqHPLCi und FreqCS. Alle abgeglichenen Paare, die die benutzerdefinierten Qualifizierungsparameter erfüllen, werden zu dem Ionenkarte-Zusammenfassungsbericht übermittelt.
  • Gezielte Tandem-Massenspektrometrie für Waisen-Peptidionen aus dem Ionenkartierungsversuch
  • Nach dem Erzeugen von Ionenkarten, wie bei der bevorzugten Ausführungsform beschrieben, gibt es typischerweise mehrere Ionen, die eine gute Massegenauigkeit zeigen, aber nicht mit bekannten Proteinen aus einer Vielzahl von Protein- und Nukleotiddatenbanken korrelieren. Für diese „Waisen”-Peptidionen wird eine Liste erzeugt. Die Liste kann dann als eine Einschlussliste zum Durchführen eines Satzes von LC-MS/MS-Versuchen herangezogen werden. Diese Versuche sehen Waisenpeptidionen-Fragmentierungsdaten vor, welche dann unter Verwendung von de-novo-Verfahren und/oder de-novo-Datenbank-Suchsoftware untersucht werden können, um die Identität dieser Peptide zu bestätigen. Die Waisenpeptide können dann mit oder ohne posttranslationale Modifikationen mit ihren jeweiligen Mutterproteinen korreliert werden.
  • Globale Analyse
  • Eine globale Analyse versucht, jedes Protein in einem Proteom oder einer Proteom-Teilmenge zu identifizieren. Ferner sieht sie ein Mittel zum Messen der relativen Mengen dieser Proteine in zwei oder mehr Proteomen oder Proteom-Teilmengen vor. Bei ihrer einfachsten Form werden zwei oder mehr Proteinmischungen chemisch oder enzymatisch auf reproduzierbare Weise fragmentiert, um jeweilige Peptidmischungen zu bilden. Diese Peptide werden dann in einem LC-MS-Analyseverfahren getrennt und die genaue Masse bestimmt. Der Eindeutige-Masse-Liste-Erzeugungsalgorithmus extrahiert eine umfassende Liste von genauen Massen, die zu den Peptiden in diesen Mischungen gehören und misst die relative Intensität dieser Peptide. Ein qualifizierender Algorithmus verwendet diese Informationen zur genauen Masse in Kombination mit Informationen zu physikochemischen Eigenschaften, um die Proteine in den Ausgangsmischungen zu identifizieren und um jedes Eindeutige-Masse-Liste-Peptid dem Protein zuzuordnen, von dem es abstammt. Ferner misst dieses Verfahren das relative Niveau jedes vorhandenen Peptids, welches proportional zu dem relativen Niveau des Proteins ist, von dem das Peptid abstammt.
  • Jene Ionen, die die benutzer-spezifizierte Redundanz und die Grenzwertkriterien nicht erfüllen, können mittels LC-MS/MS analysiert werden, um Sequenzinformationen abzuleiten, die gegen eine Protein- oder DNA-Datenbank durchsucht werden können oder unter Verwendung von de-novo-Sequenzierungsmethoden analysiert werden können, um zusätzliche Proteinidentifizierungsinformationen vorzusehen. Das Verfahren der globalen Analyse erlaubt eine umfassende und reproduzierbare Beschreibung der identifizierten und nicht identifizierten Proteine in zwei oder mehr Proteomen oder Proteom-Teilmengenproben, welche verwendet werden können, um die qualitativen und quantitativen Unterschiede in der Proteinzusammensetzung der Proben zu erläutern.
  • Aufwärts-/Abwärtsregulierung
  • Diese Art der Analyse ermöglicht dem Benutzer, einen Grenzwert für den Unterschied im Protein- oder Peptidexpressionsniveau zwischen zwei Proben festzulegen und nur jene Peptidionen außerhalb der benutzerdefinierten, vorbestimmten Grenzwerte zu identifizieren und qualitativ zu bestimmen. Dieser Analysetyp ist ein Teil der globalen Analyse.
  • Differentialanalyse
  • Diese Art der Analyse ermöglicht dem Benutzer, nur jene Peptidionen zu identifizieren und qualitativ zu bestimmen, die eindeutig zu einer der zwei Bedingungen (Kontrolle und Versuch) gehören. Dieser Analysetyp ist ein Teil der globalen Analyse.
  • Posttranslationale Modifikationen
  • Dieser Analysetyp identifiziert und erfasst nur relative Expressionsniveaus für posttranslational modifizierte peptidionen. Dieser Analysetyp ist ein Teil der globalen Analyse.
  • Proteinfamilie
  • Diese Art der Analyse identifiziert und meldet nur relative Expressionsniveaus für ein durch den Benutzer indiziertes Protein/Proteine, was dazu dient, eine indizierte Teildatenbank anzulegen. Dieser Analysetyp ist ein Teil der globalen Analyse.
  • Relative Stöchiometrie
  • Da das globale Analyseverfahren die relativen Mengen der Proteine bestimmt, die identifiziert und qualitativ bestimmt worden sind, kann man sich dazu entschließen, die gemessenen Werte dieser Proteine mit einem beliebigen, benutzerdefinierten Protein zu vergleichen, das auch identifiziert und qualitativ bestimmt worden ist. Ist eine quantitative Stöchiometrie erforderlich, können ferner Signaturpeptide für jedes Protein synthetisch hergestellt und analysiert werden, um MS-Ionisierungsreaktionsfaktoren zu entwickeln, die verwendet werden können, um die Messungen zum relativen Flächenverhältnis bezüglich Reaktionsfaktorunterschieden zu korrigieren.
  • Für Fachleute wird deutlich, dass, wenn eine globale Analyse ausgeführt werden kann, auch jeder Typ Teilanalyse durchgeführt werden kann.
  • Die Einstellung des Identifizierungs- und Quantifizierungsalgorithmus
  • Der Identifizierungs- und Quantifizierungsalgorithmus kann durch den Benutzer so eingestellt werden, dass es sich um einen einzigen oder um einen reiterativen Prozess handelt. Über eine Benutzer-Schnittstelle kann der Benutzer die Anzahl der Stringenz-Suchen (Iterationen) und die Anzahl der DURCHGÄNGE (Zyklen reiterativer Analyse) für MS(und MS/MS, falls zutreffend)-Befragungen auswählen.
  • Der Benutzer gibt ein, wie viele DURCHGÄNGE gewünscht sind und wie viele Iterationen des Identifizierungs- und Quantifizierungsalgorithmus für jeden DURCHGANG zu nutzen sind. Nachfolgend sind Beispiele für einige physikochemische Eigenschaften für jede Iteration jedes DURCHGANGS aufgelistet. Die Schnittstelle ermöglicht dem Benutzer vorzugsweise, den Suchalgorithmus durch Einstellen der Stringenzparameter für jede Iteration jedes DURCHGANGS zu kontrollieren.
    Parameter Beispiel(e)
    Quelle Alle Taxonomien, Hefe, Mensch, E. coli etc.
    Proteolytisches Enzym (Benutzer-definiert)
    Nicht redundante Datenbank Protein, Translatierte Genom-DNA
    Sub-zelluläre Anordnung ER, Golgi, Zytoplasma etc.
    Protein-Molekulargewichtsbereich* Vollständig, 0–50, 50–100, > 100 und Grenzwert
    Protein-Isoelektrischer Punkt-Bereich Vollständig, 0–4, 4–8, 8–12 und Grenzwert
    Peptid-Molekularbereich Vollständig, Start- und Stop-Gewicht (kDa) und Grenzwert
    Peptid-Isoelektrischer Punkt-Bereich* Vollständig, 0–4, 4–8, 8–12 und Grenzwert
    Anzahl der für einen Abgleich erforderlichen Peptide Benutzerdefiniert
    Massegenauigkeit Benutzerdefiniert
    Anzahl ausgelassener Spaltstellen (missed cleavages) Benutzerdefiniert
    Modifikationen CAM, Phosphorylierung etc.
    Unspezifische Spaltstellen Ja/Nein (falls ja, wähle: Subtlisin, Chymotrypsin etc.)
    Punktmutationen Ja/Nein (Benutzerdefiniert: Substitution, Löschung, etc.)
    • Einige oder alle, nicht aufgelisteten zusätzlichen physikochemischen Eigenschaften.
    • *Benutzer-definierte Werte. Die dargestellten Werte sind nur Beispiele.
  • Regeln für die Anzahl von ausgelassenen Spaltstellen (missed cleavages) Für ausgelassene Spaltstellen können Regeln auf der Basis der Tatsache aufgestellt werden, dass jedes Peptid mit einer ausgelassenen Spaltstelle einen zusätzlichen basischen Rest zwischen dem N-und dem C-Terminus aufweist, da Trypsin Peptidbindungen vorzugsweise hinter R und K spaltet. Entsprechend gilt:
    • 1. Liegt ein 2+ Peptidion ohne 3+ Begleition vor, gibt es wahrscheinlich keine ausgelassene Spaltstelle;
    • 2. Liegt ein 2+ Peptidion ohne 3+ Begleition vor, kann es eine ausgelassene Spaltstelle geben;
    • 3. Liegt ein 2+ Peptidion ohne 3+ Begleition vor, ist es unwahrscheinlich, dass zwei ausgelassene Spaltstellen vorliegen;
    • 4. Liegen ein 2+ Peptidion und ein 3+ Begleition vor, gibt es wahrscheinlich keine ausgelassene Spaltstelle;
    • 5. Liegt ein 2+ Peptidion vor und weist die identifizierte Sequenz KP oder RP auf, dann hat das 2+ Peptidion vermutlich einen 3+ Begleiter;
    • 6. Liegt ein 3+ Peptidion ohne 2+ Begleition vor, gibt es wahrscheinlich eine ausgelassene Spaltstelle;
    • 7. Liegt ein 3+ Peptidion mit einem 2+ Begleition vor, gibt es sehr wahrscheinlich eine oder zwei ausgelassene Spaltstellen;
    • 8. Liegt ein 3+ Peptidion mit einem 2+ Begleition vor, gibt es wahrscheinlich keine ausgelassene Spaltstelle.
  • Regeln für die Phosophorylierung
  • Es können Regeln formuliert werden, um einige der Parameter zu formulieren, die notwendig wären, um ein Peptid als phosphoryliert zu qualifizieren:
    • 1. Das Peptid muss eine Aminosäure aufweisen, die phosphoryliert werden kann (Serin, Serin, Tyrosin, Histidin, Asparaginsäure);
    • 2. Das Peptidion sollte ein phosphoryliertes Begleition umfassen, das heißt 79,9994 Atommasseneinheiten größer;
    • 3. Das Peptid sollte ein Phosphorylierungsmotiv aufweisen (beispielsweise ... GXDP ...);
    • 4. Das phosphorylierte Begleition sollte früher von der Umkehrphasen-C18-Säule eluieren; und
    • 5. Je hydrophobischer das nicht phosphorylierte Peptidion, desto größer der Retentionszeitunterschied im Vergleich zu dem phosphorylierten Begleiter.
  • Bewertungsalgorithmus-Alternative
  • Ein weiterer algorithmischer Ansatz wird nachfolgend erläutert, durch welchen Werte jedem abgeglichenen/korrelierten Merkmal zugeordnet werden, um eine Abgleichbewertung für Proteine/Peptide von einer theoretischen/berechneten Datenbank bekannter Peptide/Proteine versus das experimentelle Protein/Peptid abzuleiten.
  • Algorithmus
  • Teil 1 – Datensatzerzeugung:
    • • Smooth, Center und Lock Mass korrekt
    • • Bestimmung Ladungsstatus
    • • Berechnung Molekularmasse
    • • Suche in Datenbank zum Erzeugen einer ersten Trefferliste von Kandidatenprotein-/Kandidatenpeptidabgleichen
  • Teil 2 – Bewertung:
    • • Sortieren der Trefferliste nach Protein-Mw Erhöhung der Bewertung, falls das Protein-Mw um 2x innerhalb der SEC-Toleranz ist Verringerung der Bewertung, falls das Protein-Mw um 0,5x außerhalb der SEC-Toleranz ist
    • • Sortieren der Trefferliste nach Protein-pI Erhöhung der Bewertung, falls der Protein-pI um 2x innerhalb der CEX/AEX-Toleranz ist Verringerung der Bewertung, falls der Protein-pI um 0,5x außerhalb der CEX/AEX-Toleranz ist
    • • Sortieren der Peptidtreffer nach ppm-Massendifferenz falls die ppm-Massendifferenz innerhalb der Massendifferenz des Lock Masskorrigierten, nächsten internen Standards ist, Erhöhung der Bewertung um 4x falls die ppm-Massegenauigkeit innerhalb 5 ppm ist, Erhöhung der Bewertung um 3x falls die ppm-Massegenauigkeit innerhalb 7,5 ppm ist, Erhöhung der Bewertung um 1,5x falls die ppm-Massegenauigkeit innerhalb 10 ppm ist, Bewertung belassen falls die ppm-Massegenauigkeit außerhalb 10 ppm ist, Verringerung der Bewertung um 0,5x
    • • Sortieren der Peptidtreffer nach Bull & Breese-Werten falls B & B innerhalb +/–1000 des internen Standards ist, Erhöhung der Bewertung um 3x falls B & B innerhalb +/–2000 des internen Standards ist, Erhöhung der Bewertung um 2x falls B & B innerhalb +/–3000 des internen Standards ist, beibehalten falls B & B außerhalb +/–3000 des internen Standards ist, Verringerung der Bewertung um 0,5x
    • • Vergleich des Peptid-pI mit dem internen Standard Erhöhung der Bewertung um 2x, falls der pI bezüglich der CEX/AEX-Trennung innerhalb der benutzerdefinierten Toleranz des internen Standards ist Verringerung der Bewertung um 0,5x, falls der pI bezüglich der CEX/AEX-Trennung außerhalb der benutzerdefinierten Toleranz des internen Standards ist
    • • Sortieren der Peptidtreffer nach ausgelassenen Spaltstellen falls 2+ ohne mehrfach geladene(s) Begleition(en) und 0 ausgelassene Spaltstellen, Erhöhung der Bewertung um 3x falls 2+ ohne mehrfach geladene(s) Begleition(en) und 1 ausgelassene Spaltstelle, Bewertung beibehalten falls 2+ ohne mehrfach geladene(s) Begleition(en) und 2 ausgelassene Spaltstellen, Verringerung der Bewertung um 0,5x falls 2+ Ion mit 3+ Begleition und ohne ausgelassene Spaltstellen, Bewertung beibehalten falls 2+ Ion mit 3+ Begleition und K/P oder RP, Erhöhung der Bewertung um 1,5x falls 2+ Ion ohne 3+ Begleition und K/P oder RP, Bewertung beibehalten falls 3+ Ion mit einer ausgelassenen Spaltstelle und ohne 2+ Gegenstück, Bewertung beibehalten falls 3+ Ion mit einer oder zwei ausgelassenen Spaltstellen und mit 2+ Gegenstück, Erhöhung der Bewertung um 2x
    • • Sortieren nach Histidin-enthaltenden Peptiden falls kein „Histidin” vorhanden, Bewertung beibehalten falls „Histidin” und Begleition mit einem unterschiedlichen Ladungsstatus vorhanden sind, Erhöhung der Bewertung um 1,5x falls „Histidin” und Begleition mit einem unterschiedlichen Ladungsstatus vorhanden und ohne ausgelassene Spaltstelle, Erhöhung der Bewertung um 3x falls „Histidin” vorhanden ist und kein Begleition mit einem unterschiedlichen Ladungsstatus, Bewertung beibehalten falls mehrere Histidine vorhanden oder Histidine zusammen mit einer oder mehreren ausgelassenen Spaltstellen vorhanden sind und keine mehrfach geladenen Begleitionen, Erhöhung der Bewertung um 2x
    • • Sortieren nach Cystein-enthaltenden Peptiden falls „Cystein” vorhanden und modifiziert ist, Bewertung beibehalten falls „Cystein” vorhanden und nicht modifiziert ist und falls kein in der Eluierung früheres Ion zu dem modifizierten Cystein passt, Bewertung um 0,5x verringern falls „Cystein” vorhanden und nicht modifiziert ist und falls ein in der Eluierung früheres Ion zu einem modifizierten Cystein passt, Bewertung um 2x erhöhen falls mehrere Cysteine vorliegen und keines modifiziert ist, Bewertung um 2x erhöhen
    • • Sortieren nach Met Ox falls einer oder mehrere „Met Ox” vorliegen und es ein später eluierendes Ion gibt, dessen Masse zu derselben Sequenz passt, in der ein oder mehrere Methionine nicht oxidiert sind, Erhöhung der Bewertung um 2x
    • • Summieren aller Treffer von allen Scans, die einen benutzerdefinierten, voreingestellten Grenzwert erfüllen (d. h. nur Bewertungen, die den benutzerdefinierten Grenzwert übertreffen, werden genehmigt)
    • • Im Falle von Wiederholungsionen (die nächsten zwei Scans oder Anzahl von Scans, die eine typische Peakweite definieren) wird nur der Treffer mit der höchsten Bewertung eingeschlossen
    • • Erhöhung der abschließenden Bewertung, wenn die Abdeckung zunimmt
    • • Sortieren der resultierenden Zusammenfassungs-Trefferliste mit Proteinen in aufsteigender Reihenfolge, Berechnen des Wahrscheinlichkeitswertes
  • Teil 3 – Quantifizierung:
    • • Erfassen der Molekularmassen für jedes identifizierte Protein einschließlich der summierten Intensitäten für alle Isotope und Speichern der resultierenden Ionenkarte
    • • Vergleichen der relativen Intensitäten jeder Ionenkarte mit jenen des Kontrollproteins
    • • Berechnen des Pseudo-Konzentrationsniveaus bezüglich des internen Kontrollproteins
  • Bei dem oben genannten Algorithmus kann die Datenbank mit einer Anzahl anerkannter Methoden oder Fachleuten bekannten Programmen abgefragt werden. Beispielhaft umfassen solche Methoden, ohne darauf beschränkt zu sein, jene, die von K. R. Clauser et al., Anal. Chem. 71: 2871-2882 (1999); M. Mann, M. Wilm, Anal. Chem. 66: 4390-4399 (1994); P. A. Pevzner et al., Genome Res. 11: 290-299 (2001); J. A. Taylor, R. S. Johnson, Rapid Comm. Mass Spec., 11: 1067-1075 (1997); S. Altschul et al., Nucl. Acids Res. 25: 3389-3402 (1997); und B. A. Gaeta, Biotechniques 28: 436-440 (2000) beschrieben werden.
  • Gemäß der bevorzugten Ausführungsform können herkömmliche Verfahren der Molekularbiologie, Mikrobiologie und rekombinante DNA-Techniken aus dem Fachbereich verwendet werden. Solche Techniken werden ausführlich in der Literatur beschrieben. Siehe z. B. Sambrook et al., „Molecular Cloning: A Laboratory Manual” (1989); „Current Protocols in Molecular Biology” Bände I-III [Ausubel, R. M., Hrsg. (1994)]; ”Cell Biology: A Laboratory Handbook” Bände I-III [J. E. Celis, Hrsg. (1994)]; ”Current Protocols in Immunology” Bände I-III [Coligan, J. E., Hrsg. (1994)].
  • Alle Aminosäurerest-Sequenzen sind hierin durch Formeln dargestellt, deren Ausrichtung von links nach rechts in der herkömmlichen Richtung von Amino-Terminus nach Carboxy-Terminus verläuft. Ein Bindestrich oder eine Auslassung am Anfang oder am Ende einer Aminosäurerest-Sequenz zeigt eine Peptidbindung zu einer weiteren Sequenz mit einem oder mehreren Aminosäureresten an.
  • Anwendungen der Ionenkartierung
  • Die bevorzugte Ausführungsform kann in einer Vielzahl von Anwendungen verwendet werden, z. B. Entwicklung neuer Medikamente, Patientendiagnose und Monitoring.
  • Erfassung eines Single-Nukleotid-Polymorphismus (SNP)
  • Die Ionenkartierung könnte verwendet werden, um Polymorphismus in der 2'-Deoxy-5'-Ribonukleinsäure (DNA) zu identifizieren. Die interessierende DNA würde von Populationen eukaryotischer oder prokaryotischer interessierenden Zellen gewonnen und einer Verstärkung unterzogen, wie in der Literatur (Genome Res 1999 Mai; 9(5): 499-505) beschrieben. Durch eine angemessene Verwendung von Restriktionsendonukleasen könnten resultierende Fragmente dann getrennt und ihre genauen Massen durch eindimensionale oder mehrdimensionale Hochleistungsflüssigchromatographie in Verbindung mit Massenspektrometrie aufgezeichnet werden. Interessierende Fragmente, aufgeteilt auf interessierende Populationen, könnten gleichzeitig erfasst werden, da nicht der gesamte Säulenausfluss zu der Quelle des Massenspektrometers geleitet würde. Dieser erfasste Pool würde erneute Durchgänge von Verstärkung, Spaltung und Ionenkartierung durchlaufen, um irgendwann das bestimmte Gen oder seinen Bereich zu identifizieren, der den für die interessierende Population eindeutigen Polymorphismus aufweist. War die spezifische Sequenzstelle des Polymorphismus gewünscht, so kann die angemessene Anwendung des Wissens über die Sequenz des Ausgangsmaterials (d. h. das ganze Genom, das ganze/die ganzen Chromosom(en), Teilmengen davon, spezifische Gene oder Teilmengen davon), die Wahl eines/von Restriktionsenzyms/en, die Elutionszeit der verschiedenen, in der Aufschlussreihe erzeugten Fragmente und ihrer genauen Massen dafür verwendet werden, zu berechnen, wie die ursprüngliche Sequenz des Fragments gewesen sein muss, um ein Fragment/Fragmente mit der/den beobachteten Retentionszeit(en) und Masse(n) zu erzeugen.
  • Genotypisierung
  • Die Ionenkartierung könnte für die Genotypisierung herangezogen werden. Ein Single-Base-Extension(SBE)-Versuch würde verwendet, und dies ist zuvor in der Literatur beschrieben worden (Clin Chem. 2001 Feb; 47(2): 164-72). Der Vorteil der Anwendung der Ionenkartierung auf diese bestehende Technologie würde in der Parallelisierung des Prozesses realisiert. Zahlreiche interessierende Gene könnten gleichzeitig verstärkt werden; während die Anzahl der Versuche zum Bestimmen des/der spezifischen Allels/Allele und Homozygote versus Heterozygote auf das Massefenster eines gegebenen Flugzeitinstruments oder auf die Fluoreszenz oder die Fluoreszenz-Polarisierung eines bestimmten Antikörper-Konjugats/bestimmter Antikörper-Konjugate beschränkt ist, würde die Ionenkartierung die Anzahl der Versuche, welche gleichzeitig detektiert werden könnten deutlich erweitern. Diese Nukleinsäuren würden durch ein- oder mehrdimensionale Hochleistungsflüssigchromatographie (HPLC) getrennt, z. B. Anionenaustauschchromatographie, gefolgt von Ionenpaar-Umkehrphasenchromatographie in Verbindung mit Massenspektrometrie. Nur wenn der SBE-Versuch das Potential hätte, zwei oder mehr Nukleinsäuren mit genau der gleichen Masse (innerhalb der Massegenauigkeit des gegebenen Ionenkartierungsverfahrens) und genau die gleiche(n) chromatographische(n) Retentionszeit(en) zu erzeugen, wären die zwei (oder mehr) Versuche nicht in der Lage, gleichzeitig analysiert zu werden. Da ein solcher potentieller Konflikt durch die angemessene Verwendung der errechneten Masse(n) und Retentionszeit(en) der erweiterten Nukleinsäuren im Voraus berechnet werden könnte, könnten diese interferierenden Versuche in getrennten Versuchen durchgeführt werden, oder die verstärkten Bereiche könnten verändert werden, um nicht interferierende Versuche zu erhalten. In jedem Fall würde die durch jede erweiterte Nukleinsäure im Massenspektrometer erzeugte Signalintensität als Basis für die quantitative Analyse, z. B. die Bestimmung der Zygosität, verwendet werden.
  • Transkriptionelles Profiling
  • Die Ionenkartierung könnte für das Monitoring der Genexpression genutzt werden, allgemein als transkriptionelles Profiling bezeichnet. Diese Technik ist zuvor in der Literatur beschrieben worden (Science 270, 467-470, (1995), wobei das Trennungsmittel eine Anordnung komplementärer immobilisierter Nukleinsäuren ist, und es kommt zu einer Detektion, wenn fluoreszierend markierte Nukleinsäuren, die aus in vivo oder in vitro-Systemen erzeugt sind, mit diesen Anordnungen hybridisieren und zurück bleiben, um nach dem Entfernen unspezifischer Bindungspartner zu fluoreszieren. Die Ionenkartierung könnte als ein überlegener Ersatz sowohl für die Trennung als auch für die Identifizierung der von den in vivo und in vitro-Systemen erzeugten Nukleinsäuren verwendet werden. Diese Nukleinsäuren würden durch eine oder mehrere Dimensionen der Hochleistungsflüssigchromatographie (HPLC) getrennt, z. B. durch Anionenaustauschchromatographie gefolgt von einer Ionenpaar-Umkehrphasenchromatographie in Kombination mit Massenspektrometrie. Die Retentionszeit(en) der Moleküle, kombiniert mit dem Wissen ihrer genauen Massen könnte verwendet werden, um zu identifizieren, welche Transkripte in der Probe vorlagen und um ungefähr zu ermitteln, welche Menge vorlag. Die jeweils erzeugte Signalfläche und/oder Intensität würden als Basis für den quantitativen Vergleich der Proben verwendet. Es wäre möglich, markierte Versionen dieser Nukleinsäuren zu erzeugen, die die Detektion dieser Moleküle durch eine positives-Ion-Massenspektrometrie ermöglichen würde und dies würde sowohl die Zuverlässigkeit als auch die Empfindlichkeit verbessern.
  • Metabolomik
  • Eine Methode zum Identifizieren und Quantifizieren von Metabolitenprofilen von allen unterschiedlichen Typen klinischer Proben. Die Ionenkartierung der Metaboliten erfolgt unter Verwendung von Techniken, die den für die bevorzugte Ausführungsform dieser Anmeldung beschriebenen ähnlich sind. Zwei oder mehr Sätze klinischer Proben werden verglichen, um Metaboliten zu identifizieren und zu quantifizieren. Beispielsweise werden Medikamentenmetaboliten von klinischen Proben (behandelt gegen unbehandelt) extrahiert, indem eine Vielzahl von chromatographischen Trennungstechniken angewendet wird. Diese Proben werden dann mittels Flüssigchromatographie verbunden mit Massenspektrometrie analysiert, um Informationen zu genauen chromatographischen Retentionszeiten und zur genauen Masse aller Metaboliten in der Probe zu gewinnen, um Ionenkarten zu erzeugen. Zusätzlich können physikochemische Eigenschaften kleiner Molekülmetaboliten verwendet werden, um zur Erzeugung dieser Metaboliten-Ionenkarten beizutragen. Relative sowie absolute Quantifizierungsinformationen können von ausgewählten Ionenchromatogramm(SIC)-Informationen, die durch den LC/MS-Versuch erzeugt worden sind, extrahiert werden. Die relative Quantifizierung der Metaboliten erfolgt durch Vergleich der SIC-Peak-Integrationsdaten der Metaboliten-Ionenkarten, die unter unterschiedlichen Umständen (d. h. erkrankt versus nicht erkrankt, behandelt versus nicht behandelt, Mutant versus Wildtyp) erzeugt worden sind. Um eine absolute Quantifizierung der Metaboliten durch ihre jeweiligen Ionenkarten durchzuführen, wird ein bekannter interner Standard eingeschlossen und eine Kalibrierungskurve erzeugt. Diese Information kann dann verwendet werden, um eine absolute Quantifizierung aller Metaboliten in der Ionenkarte zu erhalten.
  • Peptidomik
  • Eine Methode zum Identifizieren und Quantifizieren bioaktiver Peptidprofile von allen verschiedenen Typen biologischer Proben. Die Ionenkartierung von Peptiden erfolgt unter Verwendung von Techniken, die den für die bevorzugte Ausführungsform dieser Anmeldung beschriebenen ähnlich sind. Zwei oder mehr Sätze biologischer Proben werden verglichen, um bioaktive Peptide zu identifizieren und zu quantifizieren. Beispielsweise werden bioaktive Peptide von klinischen Proben (d. h. erkrankt versus nicht erkrankt, behandelt versus unbehandelt und Wildtyp gegen Mutant) extrahiert, indem eine Vielzahl von chromatographischen Trennungstechniken angewendet wird. Diese Proben mit bioaktiven Peptiden werden dann mittels Flüssigchromatographie verbunden mit Massenspektrometrie analysiert, um Informationen zu genauen chromatographischen Retentionszeiten und zur genauen Masse aller Peptide in der Probe zu gewinnen, um Peptidionenkarten zu erzeugen. Zusätzlich können physikochemische Eigenschaften dieser bioaktiven Peptide, wie beispielsweise mol. Wt., pI etc. verwendet werden, um zur Erzeugung dieser Peptidionenkarten beizutragen. Relative sowie absolute Quantifizierungsinformationen können von ausgewählten Ionenchromatogramm(„SIC”)-Informationen, die durch den LC/MS-Versuch erzeugt worden sind, extrahiert werden. Die relative Quantifizierung der Peptide erfolgt durch Vergleich der SIC-Peak-Integrationsdaten der Peptidionenkarten, die unter unterschiedlichen Umständen (d. h. erkrankt versus nicht erkrankt, behandelt versus nicht behandelt, Mutant versus Wildtyp) erzeugt worden sind. Um eine absolute Quantifizierung der Peptide durch ihre jeweiligen Ionenkarten durchzuführen, wird ein bekannter interner Standard eingeschlossen und eine Kalibrierungskurve erzeugt. Diese Information kann dann verwendet werden, um eine absolute Quantifizierung aller bioaktiver Peptide in der Ionenkarte zu erhalten.
  • Protein-Profiling
  • Eine Methode zum Identifizieren und Quantifizieren von Proteinprofilen von allen unterschiedlichen Typen biologischer Proben wird beschrieben. Die Ionenkartierung intakter Proteine erfolgt unter Verwendung von Techniken, die den für die bevorzugte Ausführungsform dieser Anmeldung beschriebenen ähnlich sind. Zwei oder mehr Sätze biologischer Proben können verglichen werden, um intakte Proteine zu identifizieren und zu quantifizieren. Beispielsweise können intakte Proteine von klinischen Proben (d. h. erkrankt versus nicht erkrankt, behandelt gegen unbehandelt und Wildtyp versus Mutant) extrahiert werden, indem eine Vielzahl von chromatographischen Trennungstechniken angewendet wird. Diese Proben mit intakten Proteinen können dann mittels Flüssigchromatographie verbunden mit Massenspektrometrie analysiert werden, um Informationen zu genauen chromatographischen Retentionszeiten und zur genauen Masse aller Proteine in der Probe zu gewinnen, um Proteinionenkarten zu erzeugen. Zusätzlich können physikochemische Eigenschaften dieser Proteine, wie beispielsweise mol. Wt., pI etc. verwendet werden, um zur Erzeugung dieser intakte-Proteine-Ionenkarten beizutragen. Relative sowie absolute Quantifizierungsinformationen können von ausgewählten Ionenchromatogramm(„SIC”)-Informationen, die durch den LC/MS-Versuch erzeugt worden sind, extrahiert werden. Die relative Quantifizierung der intakten Proteine erfolgt durch Vergleich der SIC-Peak-Integrationsdaten der Protein-Ionenkarten, die unter unterschiedlichen Umständen (d. h. erkrankt versus nicht erkrankt, behandelt versus nicht behandelt, Mutant versus Wildtyp) erzeugt worden sind. Um eine absolute Quantifizierung der Proteine durch ihre jeweiligen Ionenkarten durchzuführen, wird ein bekannter interner Standard eingeschlossen und eine Kalibrierungskurve erzeugt. Diese Information kann dann verwendet werden, um eine absolute Quantifizierung aller intakten Proteine in der Ionenkarte zu erhalten.
  • Die Erfindung ist mit Bezug zu den folgenden, nicht einschränkenden Beispielen besser zu verstehen, die nur als Beispiel angeführt werden. Die Beispiele werden dargestellt, um die bevorzugten Ausführungsformen der Erfindung umfassender zu erläutern und sollen in keiner Weise als Einschränkung des Umfangs der Erfindung verstanden werden.
  • BEISPIELE
  • Allgemeine Verfahren
  • Alle Proteine und komplexen Proteinmischungen wurden in 0,4 M Ammoniumbicarbonatpuffer (pH 8,5) mit 8,0 M Harnstoff gelöst. Die Proteine wurden durch das Hinzugeben von DTT auf eine endgültige Konzentration von 4,5 mM und durch Inkubieren über 30 Minuten bei 50 Grad Celsius reduziert. Nach der Reduktion wurden Cysteinreste durch das Hinzufügen von Iodacetamid zu einer endgültigen Konzentration von 10 mM und durch Inkubieren über 30 Minuten in Dunkelheit bei Raumtemperatur alkyliert. Die Reaktion wurde mit Wasser zu einer endgültigen Harnstoffkonzentration von 2 M verdünnt, und Trypsin wurde zu einer endgültigen Konzentration von 4% (w/w, Enzym zu derjenigen des Proteins) hinzugefügt und für 24 Stunden bei 37 Grad Celsius inkubiert. Essigsäure wurde zu einer endgültigen Konzentration von 2% hinzugefügt, um den Trypsinaufschluss abzuschließen.
  • Eine genaue Massen-LCMS-Analyse wurde an einem Flugzeitmassenspektrometer mit orthogonaler Beschleunigung (Q-TOF 2, Micromass Ltd., Manchester UK) in Verbindung mit einem Waters CapLC HPLC-System durchgeführt. Der Q-TOF 2 wurde zu einer maßgefertigten triaxialen Sprühvorrichtung passend gewählt, die das Hinzufügen einer Lösung des Lock-Mass-Standards an der Spitze der Sprühvorrichtung erleichterte (innerer Durchmesser: chromatographisches Eluierungsmittel, mittlerer Durchmesser: Lockmass, äußerer Durchmesser: Vernebelungsgas). Eine 2,0-Picomol-pro-Mikroliter-Lösung von [Glu1]-Fibrinopeptid B wurde im Allgemeinen als ein Lockmass-Standard verwendet. Das Instrument wurde im W-Optik-Modus mit 17.000 Auflösungsleistung (FWHM-Definition) betrieben. Der Q-TOF 2 wurde eingestellt, um Daten über den 300 und 2000 Masse-zu-Ladung-Bereich zu erfassen. Die Spektralerfassungszeit betrug 1,9 Sekunden mit einer Inter-Scan-Verzögerung von 0,1 Sekunden.
  • Einhundert Mikroliter jeder Probe wurden in eine Ampulle mit Septumkappe pipettiert und auf einer gekühlten (4°C) Autosampler-Platte des CapLC platziert. Fünf Mikroliter einer 1,0 Picomol/Mikroliter-Lösung Leu-Enkaphlin wurden jeder Ampulle als interner Standard zugefügt, um die Injektionsreproduzierbarkeit zu überwachen. Die mobile Phase A war 2% Essigsäure/0,05% TFA/5% Acetonitril und die mobile Phase B war 2% Essigsäure/0,05% TFA/95% Acetonitril. Eine 0,320 × 150 mm C18 Waters-SymmetrieTM-Säule wurde für die on-line Peptidtrennung benutzt, mit einem Gradienten von 1–40% B in 120 Minuten, 50–90% B in 1 Minute, isokratisch bei 90% B für 15 Minuten, dann zurück zu den anfänglichen Bedingungen für 30 Minuten vor der nächsten Injektion. Der Gradient wurde bei einer Fließgeschwindigkeit von 3,5 Mikroliter pro Minute entwickelt, und die Lock-Mass-Lösung wurde mit einer Fließgeschwindigkeit von 0,25 Mikroliter pro Minute hinzugefügt. Alle Proben wurden in dreifacher Ausfertigung durchgeführt, wobei nach jeder Injektion Blindproben eingeschoben wurden, um sicherzustellen, dass von Injektion zu Injektion kein Übertrag stattfand.
  • Eine maßgefertigte Ausführung der Q-TOF 2 MassLynx-Software wurde verwendet, um eine Lock-Mass-Korrektur und eine genaue Massenbestimmung innerhalb +/–5 ppm der Komponenten in der interessierenden Mischung durchzuführen. In jedem Spektrum wurde die isotopische Cluster-Signal-Intensität von allen mit jeder Komponente verbundenen Ladungszuständen entsprechend dem MH+ monoisotopischen Ion entsprechend der Komponente in eine Intensitätszahl kollabiert. Die Intensität dieser genaue-Masse-monoisotopischer-Peak-Information wurde über das chromatographische Eluierungsprofil jeder Komponente summiert, um die Abundanz zu quantifizieren. Diese Abundanzbestimmung wurde bezüglich der Abundanz des in die Proben geimpften internen Standards und/oder der Abundanz einer oder mehrerer endogener chemischer Komponenten oder Polypeptide, die als geeigneter interner Standard bestimmt worden waren, korrigiert. Eine endogene chemische Komponente oder ein Polypeptid qualifiziert sich als interner Standard, wenn sich sein Abundanzniveau im Bezug zu anderen spezifischen chemischen Komponenten oder Polypeptiden in der Mischung nicht in statistisch signifikanter Weise verändert, und dies im Vergleich zu derselben chemischen Komponente oder Polypeptid-Abundanzverhältnissen in anderen Probenmischungen, die quantitativ verglichen werden. Die Eignung einer chemischen Komponente als endogener interner Standard kann gemäß der folgenden Gleichung getestet werden: (AIS/ACC)Kontrolle/(AIS/ACC)Versuch ~ 1,0wobei gilt:
    AIS ist die Abundanz eines Kandidaten für einen endogenen internen Standard, der sowohl in der Kontrollprobe als auch in der Versuchsprobe zu finden ist, und ACC ist die Abundanz einer zweiten Komponente, welche ebenfalls sowohl in der Kontrollprobe als auch in der Versuchsprobe vorkommt. Ist das Verhältnis ungefähr eins, wenn die Abundanz eines Kandidaten für einen endogenen internen Standard gegen die Abundanz einer Vielzahl zweiter Komponenten in der Kontrollprobe und der Versuchsprobe getestet wird, dann handelt es sich um einen zufriedenstellenden endogenen internen Standard.
  • Diese resultierenden Informationen für die genaue Masse, die Intensität, den Ladungsstatus und die chromatographische Retentionszeit wurden für jede chemische Komponente oder jedes Polypeptid in einer Kompilierung aufgezeichnet, die als eine Eindeutige-Masse-Liste bezeichnet wird. Informationen aus Replikationsanalysen derselben Mischung wurden in einer komprimierten oder Komposit-Eindeutige-Masse-Liste festgehalten, welche die erfassten Informationen in einer statistisch gültigen Weise kombiniert.
  • Bei den folgenden Beispielen zur qualitativen Identifizierung werden zwei physikochemische Eigenschaften – die Hydrophobie und der Ladungsstatus – zusammen mit einer Messung der genauen Masse verwendet, um die Identität eines unbekannten Polypeptids zu bestätigen und so das Protein, von dem es stammte. Für beide physikochemischen Eigenschaften wird die Entsprechungsgenauigkeit zwischen den gemessenen und den berechneten Werten dieser Eigenschaften in Kombination mit der entsprechenden Bestimmung der genauen Masse verwendet, um ein gegebenes unbekanntes Polypeptid zu identifizieren. 2 erläutert die Beziehung zwischen der beobachteten Retentionszeit und den entsprechenden berechneten Hydrophobie-Bestimmungen für eine Mischung bekannter tryptischer BSA-Peptide, die unter den zuvor beschriebenen chromatographischen Bedingungen getrennt wurden. Bei diesem Beispiel ist der HPLC-Index-Wert eines gegebenen Peptids ein Maß seiner Hydrophobie auf der Basis seiner Aminosäurenzusammensetzung. Bei der Verwendung von BSA als interner Standard für jede Probe wird die Hydrophobie-Beziehung genutzt, um den HPLC-Index-Wert unbekannter Peptide in einer komplexen Peptidmischung zu schätzen. Die Identität eines unbekannten Peptids in einer komplexen Mischung wird bestimmt, indem der geschätzte HPLC-Index-Wert auf der Basis der besten Entsprechung mit den theoretischen HPLC-Index-Werten bekannter Peptide in einem kommentierten Peptidindex verglichen wird, die in einem akzeptierbaren Massenfehlerbereich der gemessenen genauen Masse liegen. Peptide, die zu zwischen 1 und 15 Einheiten der vorhergesagten HPLC-Index-Werte passen, werden mit der höchsten Wahrscheinlichkeit bewertet, und jene, die zu zwischen 15 und 30 Einheiten passen, werden niedriger bewertet.
  • Wenn die Identifizierung eines unbekannten Peptids nicht durch den vorhergesagten Hydrophobie-Wert und die Informationen zur genauen Masse erfolgen kann, dann kann eine weitere physikochemische Eigenschaft verwendet werden, um die Anzahl der möglichen Kandidatenpeptide auf eine Einzelpeptididentifizierung weiter zu reduzieren. Eine solche zusätzliche physikochemische Eigenschaft ist der Ladungsstatus. Genauer kann der gemessene Ladungsstatus eines unbekannten Peptids mit dem berechneten Ladungsstatus eines gegebenen Peptidkandidaten von einem kommentierten Peptidindex verglichen werden. Der gemessene Ladungsstatus (Komposit-beobachteter Ladungsstatus) eines Peptids wird mit Hilfe der folgenden Formel berechnet: Komposit-beobachteter Ladungsstatus = (C1·IC1) + (C2·IC2) + (Cn·ICn)/(IC1 + IC2 + ICn)
  • Wobei gilt:
  • ICn
    entspricht der Intensität jedes Ladungsstatus Cn, zugehörig zu jedem Peptid.
  • Der zu jedem Peptid notierte Ladungsstatus in der Proteom-Teilmenge, die zu jeder interessierenden Probe gehört, kann nach den folgenden Regeln berechnet werden.
  • Ist bei keinem internen basischen Rest/benutzerdefiniert die Peptidlänge < 12, dann liegt der berechnete Ladungsstatus im Bereich 2,00–2,05; ist die Peptidlänge > 12 und < 17, dann liegt der berechnete Ladungsstatus im Bereich 2,00–2,20; ist die Peptidlänge > 18 und < 25, dann liegt der berechnete Ladungsstatus im Bereich 2,00–2,30 und ist die Peptidlänge > 25, dann liegt der berechnete Ladungsstatus im Bereich 2,50–3,00.
  • Ist bei einem internen basischen Rest/benutzerdefinierte Reste (bis zu 4 Resten mit N- oder C-Terminus) die Peptidlänge < 12, dann liegt der berechnete Ladungsstatus im Bereich 2,15–2,25; ist die Peptidlänge > 12 und < 25, dann liegt der berechnete Ladungsstatus im Bereich 2,00–2,25 oder 2,75–3,00 und ist die Peptidlänge > 25, dann liegt der berechnete Ladungsstatus im Bereich 2,00–2,35 oder 2,85–3,00.
  • Ist bei zwei internen basischen Resten/benutzerdefinierte Reste (bis zu 4 Resten mit N- oder C-Terminus) die Peptidlänge < 12, dann liegt der berechnete Ladungsstatus im Bereich 2,00–2,20 oder 2,50–2,70; ist die Peptidlänge > 12 und < 25, dann liegt der berechnete Ladungsstatus im Bereich 2,25–2,35 oder 2,8–3,25 und ist die Peptidlänge > 25, dann liegt der berechnete Ladungsstatus im Bereich 2,30–2,50 oder 3,00–4,00.
  • Ist bei drei internen basischen Resten/benutzerdefinierte Reste (bis zu 4 Resten mit N- oder C-Terminus) die Peptidlänge < 12, dann liegt der berechnete Ladungsstatus im Bereich 2,10–2,30 oder 2,70–3,00; ist die Peptidlänge > 12 und < 25, dann liegt der berechnete Ladungsstatus im Bereich 2,25–2,50 oder 3,00–3,50 und ist die Peptidlänge > 25, dann liegt der berechnete Ladungsstatus im Bereich 2,50–2,70 oder 3,20–4,50.
  • BEISPIEL 1 – Analyse eines Einzelproteins (BSA)
  • Qualitative Analyse
  • Um darzustellen, dass ein Protein qualitativ identifiziert werden kann, wurde ein Picomol boviner Serumalbumin-Trypsinaufschluss dreifach durch genaue-Masse-LC-MS analysiert. Dieselbe Lösung wurde auch mittels Q-TOF 2 analysiert, betrieben in einem herkömmlichen, datenabhängigen LC-MS-MS/MS-Erfassungsmodus zum Validieren der genaue-Masse-LC-MS-Identifikationen. Die genaue Masse, Intensität, Ladungsstatus und die chromatographische Retentionszeit für jedes Peptid wurden zu einer Komposit-Eindeutige-Masse-Liste kompiliert, die die durch die drei wiederholten Analysen erhaltenen Messungen repräsentiert. Diese Liste ist in 6 dargestellt. Die für den Abgleich von Peptiden in wiederholten Injektionen verwendeten Kriterien waren, dass die genaue-Masse-Toleranz innerhalb +/–5 ppm zum Durchschnitt liegen muss, die Retentionszeittoleranz innerhalb +/–2 Minuten zum Durchschnitt und die Ladungsstatustoleranz innerhalb +/–0,35.
  • Die resultierende Komposit-UML wurde dann mit einer für das Protein bovines Serumalbumin (BSA) erzeugten, indizierten Peptiddatenbank abgeglichen. Diese Datenbank ist in den 7A und 7B dargestellt. Der Indizierungsalgorithmus wurde gewählt, um nur tryptische Peptide zu erfassen, die bezüglich des Masse-zu-Ladung-Verhältnisses mit dem Massenbestimmungsbereich konsistent waren, der für den Q-TOF 2 (m/z 300 bis 2000) verwendet wurde, und die nur eine oder keine ausgelassene Abspaltung aufwiesen. Der Indizierungsalgorithmus berechnete und kommentierte jedes Peptid mit der genauen Masse seines MH+-Ions, seinem HPLC-Index als ein Maß der Hydrophobie (Browne, C. A., Rennet, H. P. J. und Solomon S. (1982) Anal. Biochem. Vol. 124, S. 201 ff.), dem Peptid-pI, der Anzahl und Position ausgelassener Abspaltungen, der Zahl und Position basischer Reste, der Peptidlänge, dem Frequenzindexwert und der Aminosäuresequenz sowie mit dem Molekulargewicht und dem pI des intakten Proteins. Der Frequenzindexwert repräsentierte die Anzahl der Peptide in der gesamten Indizierten Datenbank, die eine Masse innerhalb +/–5 ppm dieses Peptids aufweisen. Die Indizierte Datenbank für BSA umfasst 99 Peptide. Keines dieser Peptide ist auf dem +/–5 ppm Niveau isobar. 8 zeigt die Eindeutige-Masse-Liste MH+-Ionen, die experimentell gemessen wurden und mit der indizierten Datenbank für BSA abgeglichen wurden. Insgesamt 27 Ionen wurden auf der Basis ihrer genauen Masse, Hydrophobie und Ladungsstatus abgeglichen, um eine 64%ige Sequenzabdeckung des BSA-Proteins zu bieten. Die Identität von 11 dieser 27 Peptide, welche auf der Basis ihrer genauen Masse und ihrer physikochemischen Eigenschaften zugeordnet wurden, wurde ebenfalls durch LC-MS-MS/MS bestätigt.
  • Die BSA-Einzelproteinmischung wurde auch verwendet, um den dynamischen Bereich und die quantitative Reproduzierbarkeit des Probenhandlings und des Analyseverfahrens zu evaluieren. Entsprechend wurde intaktes bovines Serumalbumin auf Konzentrationen von 10, 100, 1000, 5000 und 10.000 Femtomol pro Mikroliter in einem Ambic/Harnstoffpuffer suspendiert. Diese fünf Proben wurden unabhängig mit DTT reduziert, die Cysteine wurden mit Iodacetimid derivatisiert und jedes wurde über Nacht bei 37°C mit Trypsin, wie zuvor beschrieben, aufgeschlossen. Dreifache Injektionen erfolgten von Konzentrationen aufgeschlossenen BSAs. Die resultierenden Massenchromatogramme wurden, wie zuvor beschrieben, bearbeitet, und die Signalintensität für die Peptide mit MH+-Ionen bei Masse 1399,6931, 1502,6189 und 2491,2649 wurden als eine Funktion der Konzentration in 3 erfasst. Der dynamische Bereich jedes Peptids war über drei Größenordnungen linear. Die Linearität der Reaktion zeigt auch, dass die Aufschlusschemie und das Massenbestimmungsverfahren reproduzierbar sind.
  • BEISPIEL 2 – Analyse einer 14-Peptid-Mischung
  • Qualitative Analyse – einfache Mischung
  • Um dazustellen, dass mit der Methode alle Proteine in einer moderat komplexen Mischung qualitativ identifiziert werden können, wurde ein Modellsystem von vierzehn Proteinen, umfassend die in 4 aufgelisteten, handelsüblichen Proteine geschaffen. Alle Proteine wurden ohne weitere Säuberung verwendet. Stammlösungen jedes Proteins wurden in einem Ambic/Harnstoffpuffer in einer Konzentration von 150 Picomol/Mikroliter (Gewicht laut Anbieter) angefertigt. Bestimmte Mengen dieser Stammlösungen wurden dann zusammengefügt, um, wie in 4 definiert, zwei unterschiedliche Mischungen zu erzeugen. Nach dem Zusammenfügen wurde jede Lösung mit variierenden Mengen Ambic/Harnstoff verdünnt, um die Endmengen konstant zu halten. Jede Mischung wurde mit DTT reduziert; Cysteinreste wurden mit Iodacetamid derivatisiert und jede Mischung wurde, wie zuvor beschrieben, über Nacht bei 37°C unabhängig aufgeschlossen. Jede Mischung wurde derselben, zuvor beschriebenen, LC-MS-Analyse der genauen Masse unterzogen und die Daten wurden, wie zuvor beschrieben, verarbeitet.
  • Von bis zu einer ausgelassenen Abspaltung ausgehend, wurde berechnet, dass in dem tryptischen Aufschluss der Mischung der 14 Proteine insgesamt 487 Peptide theoretisch möglich wären. Die Analyse der genauen Masse in Mischung A ergab insgesamt 125 Peptide, die mit dieser theoretischen Datenbank abgeglichen wurden. Die Sequenzabdeckung lag bei 67% für die Proteine in der Mischung. Die beobachtete versus die berechnete genaue Masse und die Informationen zu physikochemischen Eigenschaften für diese 125 Peptide sind in den 9A9F dargestellt.
  • Quantitative Analyse – 14-Proteine-Mischung
  • 5 zeigt in einem Histogrammformat die gemessene versus die theoretische relative Abundanz der Proteine in Mischung B (fett) und A (schraffiert). Die theoretische Proteinzusammensetzung beider Mischungen ist in 4 dargestellt. Das Protein Fetuin wies in den Mischungen A und B die gleiche Konzentration auf. Ein zu Fetuin gehöriges Peptid wurde als ein endogener, interner Standard verwendet, um quantitative Vergleiche der beiden Mischungen zu normieren. Alle gemessenen, relativen Abundanzwerte lagen innerhalb von 20% der theoretischen Abundanzwerte, wodurch die Genauigkeit der Methode zum Überwachen von Änderungen in der relativen Abundanz von Proteinen oder anderen chemischen Stoffen in relativ komplexen Mischungen gezeigt wird.
  • BEISPIEL 3 – Analyse eines Bakteriellen Proteoms
  • Bakterienstämme und Wachstumsbedinqungen
  • Zwei 1 L Kulturen je eines Escherichia coli-Stammes MC4100 wurden in M9 Minimalmedium mit 0,2% Glukose gleichzeitig angesetzt, einer bei der permissiven Temperatur von 37°C (MCLT), der andere bei der nicht-permissiven Temperatur von 42°C (MCHT). Die Zellen wurden bis zur Mittel-logarithmischen Phase (wie durch O. D. bei 450 nm festgelegt) gezüchtet und durch Zentrifugieren in 500 mL-Röhrchen bei 1000 × g über 30 min bei 4°C geerntet.
  • Zelluläre Lyse und Aufschluss
  • Die Lyse der Zellen erfolgte unter Verwendung eines Cocktails von 6 M Harnstoff, 10 mM Tris, 1 mM DTT, pH 8,0, unter leichtem Schütteln über 20 min bei 23°C. Die Überreste der Zellen wurden dann bei 20.000 × g über 20 min bei 4°C abgesetzt und der Überstand mit einer Pipette aufgenommen. Der Protein-geladene Überstand wurde auf die Gesamtproteinkonzentration mittels der Bicinchoninsäuremethode nach Smith et al. (Anal. Biochem. 150: 74-85, 1985) untersucht. Diese Daten wurden verwendet, um den Überstand zu gleichen Teilen auf Proben von je 2,9 mg Gesamtprotein aufzuteilen. Zu jeder Probe wurden 2,2 μL eines 30 mg/mL bovines Serumalbumin (Sigma) in 8 M Harnstoff, 400 mM Ammoniumbicarbonat, pH 8.0 als Retentionszeitstandard hinzugefügt, um die Berechnung der HPLC-Indexwerte zu erleichtern. Nach dem Mischen im Vortex wurde jede Probe bei 4°C gekühlt und mit Chloroform/Methanol ausgefällt. Diese Pellets wurden in 8 M Harnstoff, 400 mM Ammoniumbicarbonat, pH 8,0 gelöst und einer Reduzierung (Dithiothreitol, Sigma), Alkylierung (Iodacetamid, Sigma) und Lösung auf 200 μL unterzogen. Die Proben wurden durch den Zusatz von 20 μg Schweinetrypsin (Promega) über Nacht bei 37°C aufgeschlossen. Die Proben wurden dann durch Zusatz von Wasser auf eine endgültige Menge von 1000 μL verdünnt, wodurch die endgültige Konzentration des aufgeschlossenen Proteins bei ~60 pmol/μL mit ca. 1 pmol/μL BSA lag. Diese Proben wurden zu gleichen Teilen auf Polypropylen-PCR-Röhrchen mit je 200 μL aufgeteilt und bei –80°C bis zur Analyse gelagert.
  • Zur Erläuterung wird die Niedrigtemperatur-Probe als Kontrolle betrachtet und die Hochtemperaturprobe als Versuchsprobe betrachtet. Jede Probe wurde dreifach durchgeführt und die resultierende Eindeutige-Masse-Liste (UML) wurde zu einer Komposit-UML komprimiert, wie zuvor beschrieben.
  • Nach der Komprimierung enthielt die Komposit-UML für die Kontroll- und die Versuchsprobe 13.722 bzw. 15.242 beobachtete MH+-Ionen. Die Abundanz dieser Polypeptide wurde auf zu den Proteinen FTS1 und REC-C zugehörige Polypeptide, die für beide Proben endogen waren, normalisiert und durch die Versuchsbedingungen unverändert gelassen. Jede Komposit-UML wurde auf der Basis der genauen Masse und physikochemischer Eigenschaften mit einer indizierten, nicht redundanten E. coli-Datenbank abgeglichen, die ungefähr 190.000 tryptische Peptide umfasst (mit einer zulässigen, ausgelassenen Abspaltung), was den 4234 Proteinen entspricht, die das E. coli-Proteom enthalten soll.
  • Nach der Anwendung von Abgleichkriterien für genaue Masse, Hydrophobie und Ladungsstatus wurden insgesamt 12.542 bzw. 13.987 Peptide in den Kontroll- und Versuchsproben identifiziert, welche eindeutig den Proteinen im E. coli-Proteom zugeordnet werden konnten. Auf der Basis der Tatsache, dass ein Minimum von zwei Peptiden für die Qualifizierung einer Proteinidentifizierung notwendig war, wurden 2985 Proteine (70,5% des Proteoms) versuchsweise in der Kontrollprobe identifiziert und 3.127 Proteine (73,9% des Proteoms) wurden versuchsweise in der Versuchsprobe identifiziert. Der Vergleich der Kontrolle versus Versuch ergab 2.743 gemeinsame Proteine unter beiden Bedingungen, 242 eindeutige Proteine für die Kontrolle und 384 eindeutige Proteine für den Versuch. Von den 2.743 Proteinen, die in beiden Proben vorlagen, variierten 2.249 Proteine laut Beobachtung um weniger als 150% bezüglich ihrer relativen Abundanz und 331 variierten laut Beobachtung um mehr als 150%, aber weniger als 450% bezüglich ihrer relativen Abundanz. Insgesamt 163 Proteine, die in beiden Proben vorlagen, variierten um mehr als 450% bezüglich ihrer relativen Abundanz.
  • Von besonderem Interesse in dieser Studie ist die Tatsache, dass die Proteine GroEL und GroEs zwei gut gekennzeichnete E. coli-Chaperon-Proteine sind, die bekanntermaßen hoch-reguliert werden, wenn sie bei nicht-permissiven Temperaturen gezüchtet werden. Beide Proteine wurden in den Mischungen identifiziert, und diese Identifizierungen wurden durch eine nachfolgende datenabhängige LC-MS-MS/MS-Analyse bestätigt. Die Daten zeigten eine 3,0 bis 6,1fache Zunahme der Abundanz von GroEL- bzw. GroEs-Proteinen in der Versuchsprobe versus der Kontrollprobe, was mit der erwarteten Veränderung konsistent ist. Von dem Protein TufA, einem Elongationsfaktorprotein war zuvor nicht bekannt, dass es durch die Temperatur beeinflusst wurde. Es zeigte jedoch in der Versuchsprobe eine 2,1fache Zunahme der relativen Abundanz. TufA dient ferner als ein Beispiel für die Qualität der Daten, die durch die Methode gewonnen werden können. Insgesamt 8 Peptide wurden als TufA-Peptide identifiziert und bieten 56% Sequenzabdeckung. Die relative Abundanz jedes dieser Peptide zeigte eine 2,1fache Veränderung der Expression mit einem Variationskoeffizienten von nur 8%.
  • Dosis/Reaktion-Metabolismusstudie bei Ratten
  • Es wurde eine Studie durchgeführt, bei der zwei Ratten eine Dosis eines proprietären Medikamentenkandidaten erhielten. Eine Ratte erhielt eine „niedrige” Dosis des Medikaments und die zweite Ratte erhielt eine „hohe” Dosis des gleichen Medikaments. Nach einer vorgeschriebenen Anzahl von Stunden wurden von beiden Ratten Urinproben genommen. Die Bearbeitung der Urinproben bestand in einer Verdünnung mit Faktor vier mit doppeltdestilliertem Wasser vor der LC-MS-Analyse der genauen Masse. Die LC-MS Analysebedingungen waren wie zuvor beschrieben. Sowohl die Proben der niedrigen Dosis als auch jene der hohen Dosis wurden dreifach analysiert.
  • Die komprimierte Eindeutige-Masse-Liste für die Rattenurinproben für die hohe Dosis und die niedrige Dosis enthielt 2.674 bzw. 2.827 eindeutige Massen. Insgesamt 1.164 dieser eindeutigen Massen waren sowohl in den Proben der hohen Dosis als auch in jenen der niedrigen Dosis zu finden und konnten auf der Basis ihrer genauen Masse und Retentionszeitsignaturen abgeglichen werden. Alle Komponentenwerte wurden auf eine gemeinsame chemische Komponente normiert, die sich wie zuvor beschrieben als endogener interner Standard qualifizierte. Die relative Abundanz aller zwischen den Proben der hohen Dosierung und jenen der niedrigen Dosierung abgeglichenen Komponenten wurden quantitativ verglichen. 10 zeigt eine Teilmengenliste mit 27 dieser abgeglichenen Metaboliten, die mehr als eine 4-fache Veränderung der relativen Abundanz aufwiesen. Die statistische Analyse der dreifachen Ergebnisse zeigte, dass diese quantitativen Messungen einen p-Score von weniger als 0,005 aufwiesen. Diese Ergebnisse zeigen an, dass die Methode der Erfindung ein wirksames Mittel zum Quantifizieren der relativen Abundanz chemischer Komponenten in zwei komplexen Metabolismusproben ist. Ferner zeigt das Beispiel, dass es nicht nötig ist, die interessierenden Komponenten vor dem quantitativen Vergleich qualitativ zu identifizieren.

Claims (15)

  1. Verfahren der Massenspektrometrie, umfassend: Vorsehen einer ersten Probe, umfassend eine erste Molekülmischung biologischen Ursprungs, wobei die erste Mischung eine Vielzahl verschiedener Proteine, Peptide oder Polypeptide umfasst; Messen einer ersten physikochemischen Eigenschaft, die nicht das Masse-zu-Ladung-Verhältnis erster Moleküle in der ersten Mischung ist, wobei die ersten Moleküle in der ersten Mischung aus Proteinen oder Peptiden bestehen, worin die erste physikochemische Eigenschaft die chromatographische Retentionszeit umfasst; Messen einer zweiten physikochemischen Eigenschaft, die nicht das Masse-zu-Ladung-Verhältnis der ersten Moleküle in der ersten Mischung ist, worin die zweite physikochemische Eigenschaft die Ionenbeweglichkeit in der Gasphase umfasst; Massenanalyse der ersten Moleküle in der ersten Mischung und Bestimmen des Masse-zu-Ladung-Verhältnisses der ersten Moleküle in der ersten Mischung auf 20 ppm genau; Vorsehen einer zweiten Probe, umfassend eine zweite Molekülmischung biologischen Ursprungs, wobei die zweite Mischung eine Vielzahl verschiedener Proteine, Peptide oder Polypeptide umfasst; Messen einer ersten physikochemischen Eigenschaft, die nicht das Masse-zu-Ladung-Verhältnis erster Moleküle in der zweiten Mischung ist, wobei die ersten Moleküle in der zweiten Mischung aus Proteinen oder Peptiden bestehen, worin die erste physikochemische Eigenschaft die chromatographische Retentionszeit umfasst; Messen einer zweiten physikochemischen Eigenschaft, die nicht das Masse-zu-Ladung-Verhältnis der ersten Moleküle in der zweiten Mischung ist, worin die zweite physikochemische Eigenschaft die Ionenbeweglichkeit in der Gasphase umfasst; Massenanalyse der ersten Moleküle in der zweiten Mischung und Bestimmen des Masse-zu-Ladung-Verhältnisses der ersten Moleküle in der zweiten Mischung auf 20 ppm genau; wobei das Masse-zu-Ladung-Verhältnis der ersten Moleküle in der ersten Mischung und das Masse-zu-Ladung-Verhältnis der ersten Moleküle in der zweiten Mischung massenanalysiert werden mit: (i) einem Flugzeit-Massenspektrometer (”TOF”); (ii) einem Flugzeit-Massenspektrometer mit orthogonaler Beschleunigung (”oaTOF”); (iii) einem Magnetsektor-Massenspektrometer; (iv) einem Quadrupol-Massenanalysator; oder (v) einem Ionenfallen-Massenanalysator; Bestimmen der Intensität der ersten Moleküle in der ersten Mischung und der Intensität der ersten Moleküle in der zweiten Mischung, wobei bestimmt wurde, dass die ersten Moleküle in der ersten Mischung und die ersten Moleküle in der zweiten Mischung im Wesentlichen das gleiche Masse-zu-Ladung-Verhältnis aufweisen und im Wesentlichen dieselbe erste physikochemische Eigenschaft aufweisen und wobei bestimmt wird, dass die ersten Moleküle in der ersten Mischung und die ersten Moleküle in der zweiten Mischung im Wesentlichen dieselbe zweite physikochemische Eigenschaft aufweisen; Vergleichen der Intensität der ersten Moleküle in der ersten Mischung mit der Intensität zweiter Moleküle in der ersten Mischung und Vergleichen der Intensität der ersten Moleküle in der zweiten Mischung mit der Intensität der zweiten Moleküle in zweiter Mischung, wobei die zweiten Moleküle endogen zu den ersten und zweiten Mischungen sind; und dann Identifizieren der ersten Moleküle in der ersten Mischung und/oder der ersten Moleküle in der zweiten Mischung, wobei die ersten Moleküle in der ersten Mischung und/oder die ersten Moleküle in der zweiten Mischung nur identifiziert werden, wenn sich die Intensität der ersten Moleküle in der ersten Mischung von der Intensität der ersten Moleküle in der zweiten Mischung um mehr als einen vorbestimmten Wert unterscheidet, wobei der Schritt des Identifizierens der ersten Moleküle in der ersten Mischung und/oder der ersten Moleküle in der zweiten Mischung das Vergleichen der ersten physikochemischen Eigenschaft, der zweiten physikochemischen Eigenschaft und des bestimmten Masse-zu-Ladung-Verhältnisses der ersten Moleküle in der ersten Mischung und/oder der ersten Moleküle in der zweiten Mischung mit einem Molekülindex umfasst, wobei der Index Folgendes umfasst: (i) die Identität jedes indizierten Moleküls; (ii) eine experimentell bestimmte oder vorhergesagte erste physikochemische Eigenschaft jedes indizierten Moleküls; (iii) eine experimentell bestimmte oder vorhergesagte zweite physikochemische Eigenschaft jedes indizierten Moleküls; und (iv) eine experimentell bestimmte oder vorhergesagte genaue Masse oder ein Masse-zu-Ladung-Verhältnis/Masse-zu-Ladung-Verhältnisse jedes indizierten Moleküls.
  2. Verfahren nach Anspruch 1, wobei der vorbestimmte Wert aus der folgenden Gruppe gewählt ist: (i) 1%; (ii) 2%; (iii) 5%; (iv) 10%; (v) 20%; (vi) 50%; (vii) 100%; (viii) 150%; (ix) 200%; (x) 250%; (xi) 300%; (xii) 350%; (xiii) 400%; (xiv) 450%; (xv) 500%; (xvi) 1000%; (xvii) 5000%; und (xviii) 10000%.
  3. Verfahren nach Anspruch 1 oder 2, wobei die erste Mischung und/oder die zweite Mischung wenigstens 2, 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1500, 2000, 2500, 3000, 3500, 4000, 4500 oder 5000 Moleküle mit unterschiedlichen Identitäten umfasst.
  4. Verfahren nach Anspruch 1, 2 oder 3, wobei die erste Mischung und/oder die zweite Mischung eine nicht äquimolare, heterogene, komplexe Mischung umfassen.
  5. Verfahren nach einem der vorangehenden Ansprüche, wobei das Masse-zu-Ladung-Verhältnis der ersten Moleküle in der ersten Mischung und/oder das Masse-zu-Ladung-Verhältnis der ersten Moleküle in der zweiten Mischung als innerhalb 19 ppm, 18 ppm, 17 ppm, 16 ppm, 15 ppm, 14 ppm, 13 ppm, 12 ppm, 11 ppm, 10 ppm, 9 ppm, 8 ppm, 7 ppm, 6 ppm, 5 ppm, 4 ppm, 3 ppm, 2 ppm, 1 ppm oder < 1 ppm bestimmt ist.
  6. Verfahren nach einem der vorangehenden Ansprüche, wobei das Masse-zu-Ladung-Verhältnis der ersten Moleküle in der ersten Mischung und/oder das Masse-zu-Ladung-Verhältnis der ersten Moleküle in der zweiten Mischung als innerhalb 15–20 ppm, 10–15 ppm, 5–10 ppm oder 1–5 ppm bestimmt ist.
  7. Verfahren nach einem der vorangehenden Ansprüche, wobei das Masse-zu-Ladung-Verhältnis der ersten Moleküle in der ersten Mischung und/oder das Masse-zu-Ladung-Verhältnis der ersten Moleküle in der zweiten Mischung als innerhalb 0,01 Masseeinheiten, 0,009 Masseeinheiten, 0,008 Masseeinheiten, 0,007 Masseeinheiten, 0,006 Masseeinheiten, 0,005 Masseeinheiten, 0,004 Masseeinheiten, 0,003 Masseeinheiten, 0,002 Masseeinheiten, 0,001 Masseeinheiten oder < 0,001 Masseeinheiten bestimmt ist.
  8. Verfahren nach einem der vorangehenden Ansprüche, welches ferner wenigstens einen der folgenden Schritte umfasst: (i) Vergleichen der Intensität der ersten Moleküle in der ersten Mischung mit der Intensität der ersten Moleküle in der zweiten Mischung; (ii) Vergleichen der Intensität der zweiten Moleküle in der ersten Mischung mit der Intensität der zweiten Moleküle in der zweiten Mischung; und (iii) Vergleichen des Verhältnisses von: (a) der Intensität der ersten Moleküle in der ersten Mischung zu der Intensität der ersten Moleküle in der zweiten Mischung mit (b) der Intensität der zweiten Moleküle in der ersten Mischung zu der Intensität der zweiten Moleküle in der zweiten Mischung.
  9. Verfahren nach Anspruch 8, wobei die zweiten Moleküle in der ersten Mischung im Wesentlichen die gleichen sind wie die zweiten Moleküle in der zweiten Mischung.
  10. Verfahren nach einem der vorangehenden Ansprüche, wobei gilt: (i) die erste Probe stammt von einem kranken Organismus und die zweite Probe stammt von einem nicht-kranken Organismus; (ii) die erste Probe stammt von einem behandelten Organismus und die zweite Probe stammt von einem nicht-behandelten Organismus; oder (iii) die erste Probe stammt von einem mutanten Organismus und die zweite Probe stammt von einem Wildttyp-Organismus.
  11. Verfahren nach einem der vorangehenden Ansprüche, wobei die ersten Moleküle in der ersten Mischung und/oder die ersten Moleküle in der zweiten Mischung ein Peptid umfassen und der Molekülindex einen Peptidindex umfasst.
  12. Verfahren nach Anspruch 11, wobei der Peptidindex durch Bestimmen der Art und Weise, wie ein oder mehrere Proteine in Fragmente zerfallen oder verdaut werden können, um in einer Vielzahl von Peptiden zu resultieren, erzeugt wurde.
  13. Verfahren nach einem der vorangehenden Ansprüche, wobei der Schritt des Identifizierens der ersten Moleküle in der ersten Mischung und/oder der ersten Moleküle in der zweiten Mischung das Errechnen der ersten physikochemischen Eigenschaft von einem Molekülindex umfasst, wobei der Index umfasst: (i) die Identität jedes indizierten Moleküls; und (ii) eine experimentell bestimmte oder vorhergesagte genaue Masse oder ein Masse-zu-Ladung-Verhältnis/Masse-zu-Ladung-Verhältnisse jedes indizierten Moleküls.
  14. Verfahren nach Anspruch 13, wobei der Index umfasst: (i) eine Protein- oder Proteomsequenz-Datenbank; (ii) eine Expressed-Sequence-Tag(EST)-Datenbank; oder (iii) eine Gen- oder Genom-Datenbank.
  15. Verfahren nach einem der vorangehenden Ansprüche, wobei die ersten Moleküle in der ersten Mischung und/oder die ersten Moleküle in der zweiten Mischung auf der folgenden Basis identifiziert werden: (i) das Ausmaß der Übereinstimmung des bestimmten Masse-zu-Ladung-Verhältnisses der ersten Moleküle in der ersten Mischung und/oder der ersten Moleküle in der zweiten Mischung mit der Masse oder dem Masse-zu-Ladung-Verhältnis eines indizierten Moleküls; und/oder (ii) das Ausmaß der Übereinstimmung der ersten physikochemischen Eigenschaft der ersten Moleküle in der ersten Mischung und/oder der ersten Moleküle in der zweiten Mischung mit der ersten physikochemischen Eigenschaft eines indizierten Moleküls; und/oder (iii) das Ausmaß der Übereinstimmung der zweiten physikochemischen Eigenschaft der ersten Moleküle in der ersten Mischung und/oder der ersten Moleküle in der zweiten Mischung mit einer zweiten physikochemischen Eigenschaft eines indizierten Moleküls.
DE60211744T 2001-12-08 2002-12-09 Massenspektrometrie-verfahren Expired - Lifetime DE60211744T3 (de)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US34046001P 2001-12-08 2001-12-08
US340460P 2001-12-08
US36484702P 2002-03-14 2002-03-14
US364847P 2002-03-14
PCT/GB2002/005571 WO2003054549A2 (en) 2001-12-08 2002-12-09 Method of mass spectrometry

Publications (3)

Publication Number Publication Date
DE60211744D1 DE60211744D1 (de) 2006-06-29
DE60211744T2 DE60211744T2 (de) 2006-11-02
DE60211744T3 true DE60211744T3 (de) 2010-07-01

Family

ID=26992114

Family Applications (2)

Application Number Title Priority Date Filing Date
DE60211744T Expired - Lifetime DE60211744T3 (de) 2001-12-08 2002-12-09 Massenspektrometrie-verfahren
DE60228132T Expired - Lifetime DE60228132D1 (de) 2001-12-08 2002-12-09 Massenspektormetrie-Verfahren

Family Applications After (1)

Application Number Title Priority Date Filing Date
DE60228132T Expired - Lifetime DE60228132D1 (de) 2001-12-08 2002-12-09 Massenspektormetrie-Verfahren

Country Status (8)

Country Link
US (4) US20050092910A1 (de)
EP (1) EP1456667B2 (de)
JP (2) JP4767496B2 (de)
AT (2) ATE403872T1 (de)
CA (1) CA2465297C (de)
DE (2) DE60211744T3 (de)
GB (1) GB2385918B (de)
WO (1) WO2003054549A2 (de)

Families Citing this family (101)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020115056A1 (en) * 2000-12-26 2002-08-22 Goodlett David R. Rapid and quantitative proteome analysis and related methods
US7001587B2 (en) * 2001-10-24 2006-02-21 The Regents Of The University Of California Measurement of protein synthesis rates in humans and experimental systems by use of isotopically labeled water
US20030129760A1 (en) * 2001-11-13 2003-07-10 Aguilera Frank Reinaldo Morales Mass intensity profiling system and uses thereof
GB2385918B (en) 2001-12-08 2004-05-26 Micromass Ltd Method of mass spectrometry
AU2003217385B2 (en) 2002-02-12 2008-09-11 The Regents Of The University Of California Non-invasive method for measuring rates of biosynthesis of biological molecules by label incorporation
GB0305796D0 (en) 2002-07-24 2003-04-16 Micromass Ltd Method of mass spectrometry and a mass spectrometer
WO2004011426A2 (en) 2002-07-30 2004-02-05 The Regents Of The University Of California Method for automated, large-scale measurement of the molecular flux rates of the proteome or the organeome using mass spectrometry
US20060105339A1 (en) * 2002-09-04 2006-05-18 Marc Hellerstein Methods for measuring the rates of replication and death of microbial infectious agents in an infected
DE60324950D1 (de) * 2002-09-13 2009-01-08 Univ California Verfahren zur messung der geschwindigkeiten des cholesterinrückwärtstransports in vivo als index für anti-artherogenese
US20070248540A1 (en) * 2002-09-16 2007-10-25 The Regents Of The University Of California Biochemical methods for measuring metabolic fitness of tissues or whole organisms
CA2504313C (en) 2002-11-04 2012-01-17 Marc K. Hellerstein Deuterated glucose or fat tolerance tests for high-throughput measurement of the metabolism of sugars or fatty acids in the body
US20040172200A1 (en) * 2002-11-22 2004-09-02 Kearney Paul Edward Constellation mapping and uses thereof
US7262020B2 (en) * 2003-07-03 2007-08-28 The Regents Of The University Of California Methods for comparing relative flux rates of two or more biological molecules in vivo through a single protocol
GB0322356D0 (en) * 2003-09-24 2003-10-22 Micromass Ltd Mass spectrometer
WO2005031343A1 (en) * 2003-10-01 2005-04-07 Proteome Systems Intellectual Property Pty Ltd A method for determining the biological likelihood of candidate compositions or structures
JP4714584B2 (ja) * 2003-11-21 2011-06-29 エーザイ・アール・アンド・ディー・マネジメント株式会社 同位体標識化内部標準物質を用いる定量方法、該定量方法を実行する解析システムおよび該解析のためのプログラム
US20050202406A1 (en) * 2003-11-25 2005-09-15 The Regents Of The University Of California Method for high-throughput screening of compounds and combinations of compounds for discovery and quantification of actions, particularly unanticipated therapeutic or toxic actions, in biological systems
JP4284167B2 (ja) * 2003-12-24 2009-06-24 株式会社日立ハイテクノロジーズ イオントラップ/飛行時間型質量分析計による精密質量測定方法
US9164067B2 (en) 2004-02-13 2015-10-20 Waters Technologies Corporation System and method for tracking chemical entities in an LC/MS system
TW200538738A (en) * 2004-02-20 2005-12-01 Univ California Molecular flux rates through critical pathways measured by stable isotope labeling in vivo, as biomarkers of drug action and disease activity
CA2559095A1 (en) * 2004-03-11 2005-09-22 The Regents Of The University Of California Temporal or spatial characterization of biosynthetic events in living organisms by isotopic fingerprinting under conditions of imposed isotopic gradients
US20050238577A1 (en) * 2004-03-29 2005-10-27 The Regents Of The University Of California Isolation of epithelial cells or their biochemical contents from excreta after in vivo isotopic labeling
DE112005001166B4 (de) * 2004-05-20 2014-10-09 Waters Technologies Corp. (N.D.Ges.D. Staates Delaware) Verfahren und Vorrichtung zum Identifizieren von Proteinen in Gemischen
GB0415046D0 (en) 2004-07-05 2004-08-04 Micromass Ltd Mass spectrometer
ATE548657T1 (de) * 2004-07-20 2012-03-15 Symphogen As Prozedur zur strukturellen charakterisierung rekombinanter polyclonaler proteine oder einer polyclonalen zelllinie
WO2006011351A1 (en) * 2004-07-29 2006-02-02 Eisai R&D Management Co., Ltd. Absolute quantitation of protein contents based on exponentially modified protein abundance index by mass spectrometry
NZ536082A (en) * 2004-10-22 2007-06-29 Syft Technologies Ltd Detection of bromamines and chloramines in breath samples for detecting asthma
JP4118918B2 (ja) * 2005-02-28 2008-07-16 シャープ株式会社 信号品質評価装置、情報記録再生装置、信号品質評価方法、記録条件決定方法、信号品質評価プログラム、信号品質評価プログラムを記録したコンピュータ読み取り可能な記録媒体
WO2006105653A1 (en) * 2005-04-04 2006-10-12 Viventia Biotech Inc. Method and system for identification of antigen
US7447597B2 (en) * 2005-05-06 2008-11-04 Exxonmobil Research And Engineering Company Data processing/visualization method for two (multi) dimensional separation gas chromatography xmass spectrometry (GCxMS) technique with a two (multiply) dimensional separation concept as an example
US20070023632A1 (en) * 2005-06-03 2007-02-01 Kieser Byron System and Method for Analysis of Compounds Using a Mass Spectrometer
WO2006133191A2 (en) * 2005-06-03 2006-12-14 Waters Investments Limited Methods and apparatus for performing retention-time matching
US7391015B2 (en) 2005-06-03 2008-06-24 Mds Analytical Technologies System and method for data collection in recursive mass analysis
JP5011283B2 (ja) * 2005-06-03 2012-08-29 ウオーターズ・テクノロジーズ・コーポレイシヨン 化学分析のためのポリペプチド関連情報のカタログの発生および使用
TW200711660A (en) * 2005-06-10 2007-04-01 Univ California Monitoring two dimensions of diabetes pathogenesis separately or concurrently (insulin sensitivity and beta-cell sufficiency): uses in diagnosis, prognosis, assessment of disease risk, and drug development
WO2006133568A1 (en) * 2005-06-16 2006-12-21 Caprion Pharmaceuticals Inc. Virtual mass spectrometry
AU2006265381B2 (en) 2005-06-30 2010-06-10 Biocrates Life Sciences Ag Device for quantitative analysis of a metabolite profile
WO2007013699A1 (ja) 2005-07-29 2007-02-01 Eisai R & D Management Co., Ltd. 化合物に対するタンパク質の結合力を解析する方法
US20090114809A1 (en) * 2005-09-02 2009-05-07 Australian Nuclear Science & Technology Organisation Isotope ratio mass spectrometer and methods for determining isotope ratios
CA2621910A1 (en) * 2005-09-07 2007-03-15 Human Metabolome Technologies, Inc. Method for calibrating detected mass in mass spectrometry system
WO2007072648A1 (ja) * 2005-12-21 2007-06-28 Japan Health Sciences Foundation 質量分析システムおよび質量分析方法
WO2007104160A1 (en) * 2006-03-14 2007-09-20 Caprion Pharmaceuticals Inc. Identification of biomolecules through expression patterns in mass spectrometry
GB0609253D0 (en) * 2006-05-10 2006-06-21 Micromass Ltd Mass spectrometer
US9063162B2 (en) * 2006-05-26 2015-06-23 Waters Technologies Corporation Apparatus and method for performing mass spectroscopy
EP2021789A4 (de) * 2006-05-26 2010-10-20 Waters Technologies Corp Vorrichtung und verfahren zur durchführung von massenspektroskopie
US20080073499A1 (en) * 2006-07-25 2008-03-27 George Yefchak Peak finding in low-resolution mass spectrometry by use of chromatographic integration routines
RU2009113801A (ru) * 2006-09-14 2010-10-20 Конинклейке Филипс Электроникс Н.В. (Nl) Способы анализа образцов белков на основе идентификации с-концевых пептидов
US7499807B1 (en) * 2006-09-19 2009-03-03 Battelle Memorial Institute Methods for recalibration of mass spectrometry data
ZA200902588B (en) * 2006-11-09 2010-06-30 Alcon Res Ltd Punctual plug comprising a water-insoluble polymeric matrix
JP5194212B2 (ja) * 2006-12-26 2013-05-08 ブリガム・ヤング・ユニバーシティ 血清プロテオミクスシステムと関連する方法
US7595485B1 (en) * 2007-02-07 2009-09-29 Thermo Finnigan Llc Data analysis to provide a revised data set for use in peptide sequencing determination
US20080226133A1 (en) * 2007-03-14 2008-09-18 Jean-Luc Truche Use of Optical Sensors for Spray Jet Diagnostics
US8399827B1 (en) * 2007-09-10 2013-03-19 Cedars-Sinai Medical Center Mass spectrometry systems
WO2009146345A1 (en) * 2008-05-29 2009-12-03 Waters Technologies Corporation Techniques for performing retention-time matching of precursor and product ions and for constructing precursor and product ion spectra
WO2010002819A1 (en) 2008-07-01 2010-01-07 Waters Technologies Corporation Stacked-electrode peptide-fragmentation device
US20100224770A1 (en) * 2009-03-06 2010-09-09 Ensco, Inc. Method for configuring an ion mobility spectrometer system
US9500572B2 (en) * 2009-04-30 2016-11-22 Purdue Research Foundation Sample dispenser including an internal standard and methods of use thereof
US8987662B2 (en) * 2009-05-14 2015-03-24 Agilent Technologies, Inc. System and method for performing tandem mass spectrometry analysis
US20110042564A1 (en) * 2009-08-20 2011-02-24 Yasuhide Naito Laser ablation mass analyzing apparatus
US9453845B2 (en) 2010-02-01 2016-09-27 Cell Signaling Technology, Inc. Mass spectroscopy analysis of mutant polypeptides in biological samples
US10553412B2 (en) * 2010-05-24 2020-02-04 Agilent Technologies, Inc. System and method of data-dependent acquisition by mass spectrometry
US9530633B2 (en) * 2010-05-25 2016-12-27 Agilent Technologies, Inc. Method for isomer discrimination by tandem mass spectrometry
US20140051092A1 (en) * 2011-04-15 2014-02-20 Micromass Uk Limited Method And Apparatus For The Analysis Of Biological Samples
JP5736235B2 (ja) * 2011-05-23 2015-06-17 株式会社日立製作所 質量分析システム及びコンピュータプログラム
JP2014526685A (ja) 2011-09-08 2014-10-06 ザ・リージェンツ・オブ・ザ・ユニバーシティ・オブ・カリフォルニア 代謝流量測定、画像化、および顕微鏡法
CN104023551A (zh) 2011-11-04 2014-09-03 生物辐射实验室股份有限公司 细胞组分的同时纯化
CN104024856B (zh) * 2011-11-04 2018-10-26 生物辐射实验室股份有限公司 基于pI的蛋白质分级
US9766207B2 (en) 2011-11-04 2017-09-19 Bio-Rad Laboratories, Inc. Affinity methods and compositions employing electronic control of pH
ES2668678T3 (es) 2011-12-07 2018-05-21 Glaxosmithkline Llc Procedimiento de determinación de la masa muscular esquelética corporal total
EP2814597A4 (de) 2012-02-15 2015-10-28 Bio Rad Laboratories Elektronische steuerung von ph-wert und ionenstärke
US9321012B2 (en) 2012-04-04 2016-04-26 Bio-Rad Laboratories, Inc. Electronic protein fractionation
US20150074093A1 (en) * 2012-04-25 2015-03-12 Atonarp Inc. System that provides content
US9169331B2 (en) 2012-12-21 2015-10-27 Dionex Corporation Separation of glycans by mixed-mode liquid chromatography
US9310344B2 (en) 2013-06-14 2016-04-12 Dionex Corporation HILIC/anion-exchange/cation-exchange multimodal media
DK3729958T3 (da) * 2013-03-15 2023-08-07 Mayo Found Medical Education & Res Identificering og overvågning af monoklonale immunoglobuliner ved hjælp af molekylmasse
US9134319B2 (en) 2013-03-15 2015-09-15 The Regents Of The University Of California Method for replacing biomarkers of protein kinetics from tissue samples by biomarkers of protein kinetics from body fluids after isotopic labeling in vivo
GB201306868D0 (en) 2013-04-15 2013-05-29 Micromass Ltd A method of screening samples
EP3486937B1 (de) 2013-06-25 2022-07-27 Purdue Research Foundation Massenspektrometrieanalyse von mikroorganismen in proben
WO2015082889A1 (en) 2013-12-02 2015-06-11 Micromass Uk Limited Method of charge state selection
CN107077592B (zh) * 2014-03-28 2021-02-19 威斯康星校友研究基金会 高分辨率气相色谱-质谱数据与单位分辨率参考数据库的改进谱图匹配的高质量精确度滤波
JP6759104B2 (ja) 2014-04-04 2020-09-23 メイヨ・ファウンデーション・フォー・メディカル・エデュケーション・アンド・リサーチ 精密分子質量を用いた免疫グロブリンのアイソタイピング
US9720001B2 (en) * 2014-05-21 2017-08-01 Thermo Finnigan Llc Methods for mass spectrometric biopolymer analysis using optimized weighted oligomer scheduling
US10690676B2 (en) 2014-07-29 2020-06-23 Mayo Roundation for Medical Education and Research Quantifying monoclonal antibody therapeutics by LC-MS/MS
EP3198627A1 (de) * 2014-09-26 2017-08-02 Micromass UK Limited Genaue mobilitätschromatogramme
KR20180033466A (ko) * 2015-05-29 2018-04-03 워터스 테크놀로지스 코포레이션 질량 스펙트럼 데이터의 프로세싱을 위한 기법
GB201509402D0 (en) * 2015-06-01 2015-07-15 Micromass Ltd Lock mass library for internal correction
US9847216B2 (en) * 2015-08-14 2017-12-19 Thermo Finnigan Llc Systems and methods for targeted top down discovery
WO2017053932A1 (en) 2015-09-24 2017-03-30 Mayo Foundation For Medical Education And Research Identification of immunoglobulin free light chains by mass spectrometry
CN108139357B (zh) * 2015-10-07 2020-10-27 株式会社岛津制作所 串联型质谱分析装置
AU2017325022B2 (en) 2016-09-07 2022-10-13 Mayo Foundation For Medical Education And Research Identification and monitoring of cleaved immunoglobulins by molecular mass
US11092597B2 (en) 2017-02-28 2021-08-17 Waters Technoligies Corporation Devices and methods for analyzing intact proteins, antibodies, antibody subunits, and antibody drug conjugates
US9911588B1 (en) * 2017-03-10 2018-03-06 Thermo Finnigan Llc Methods and systems for quantitative mass analysis
US9911587B1 (en) * 2017-03-10 2018-03-06 Thermo Finnigan Llc Methods and systems for quantitative mass analysis
US10347477B2 (en) 2017-03-24 2019-07-09 Thermo Finnigan Llc Methods and systems for quantitative mass analysis
JP7295841B2 (ja) * 2017-07-25 2023-06-21 バイオコン・リミテッド インスリン&インスリン類似体の配列の同定のためのペプチドマッピング方法
EP3681528A4 (de) 2017-09-13 2021-07-21 Mayo Foundation for Medical Education and Research Identifizierung und überwachung des apoptosehemmers von makrophagen
WO2020152871A1 (ja) * 2019-01-25 2020-07-30 株式会社島津製作所 クロマトグラフを用いた物質同定方法
JP7306676B2 (ja) * 2019-02-26 2023-07-11 国立大学法人九州大学 脂質プロファイリングシステム、脂質プロファイリング方法、及び脂質プロファイリングプログラム
BE1027232B1 (fr) * 2019-08-28 2020-11-20 Zentech S A Procédé de détection d'au moins un variant de protéine et/ou d'au moins un peptide propre aux chaînes alpha et/ou bêta et/ou delta d'hémoglobine
US20210333251A1 (en) * 2020-04-24 2021-10-28 Waters Technologies Ireland Limited Methods, mediums, and systems to compare data within and between cohorts
WO2022146812A1 (en) * 2020-12-30 2022-07-07 Purdue Research Foundation Mass spectrometry to identify predictive failure with chemical detection in microelectronic systems

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB870203A (en) * 1949-10-26 1961-06-14 Edward Whitworth Improvements in or relating to surface moderated propellent powders
US4735777A (en) * 1985-03-11 1988-04-05 Hitachi, Ltd. Instrument for parallel analysis of metabolites in human urine and expired air
JP3001252B2 (ja) * 1990-11-16 2000-01-24 株式会社日立製作所 半導体メモリ
US5428621A (en) * 1992-09-21 1995-06-27 Sundisk Corporation Latent defect handling in EEPROM devices
US6017693A (en) * 1994-03-14 2000-01-25 University Of Washington Identification of nucleotides, amino acids, or carbohydrates by mass spectrometry
US6323482B1 (en) * 1997-06-02 2001-11-27 Advanced Research And Technology Institute, Inc. Ion mobility and mass spectrometer
WO2000003240A1 (en) * 1998-07-10 2000-01-20 Cetek Corporation Method to detect and analyze tight-binding ligands in complex biological samples
US6147344A (en) * 1998-10-15 2000-11-14 Neogenesis, Inc Method for identifying compounds in a chemical mixture
US20020009394A1 (en) 1999-04-02 2002-01-24 Hubert Koster Automated process line
US6936424B1 (en) * 1999-11-16 2005-08-30 Matritech, Inc. Materials and methods for detection and treatment of breast cancer
CA2298181C (en) 2000-02-02 2006-09-19 Dayan Burke Goodnough Non-targeted complex sample analysis
EP1254373B1 (de) * 2000-02-07 2007-04-11 Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. Verfahren zur identifizierung und/oder charakterisierung eines (poly)peptides
MXPA02007664A (es) * 2000-02-08 2004-08-23 Univ Michigan Separacion y representacion de proteinas.
JP2001330599A (ja) 2000-05-24 2001-11-30 Shimazu S D Kk Gc/msによる代謝異常スクリーニング診断装置
WO2002052259A1 (en) 2000-12-26 2002-07-04 The Institute For Systems Biology Rapid and quantitative proteome analysis and related methods
US20020119490A1 (en) * 2000-12-26 2002-08-29 Aebersold Ruedi H. Methods for rapid and quantitative proteome analysis
US20020115056A1 (en) * 2000-12-26 2002-08-22 Goodlett David R. Rapid and quantitative proteome analysis and related methods
US6931325B2 (en) * 2001-02-07 2005-08-16 Regents Of The University Of Michigan Three dimensional protein mapping
US20030031350A1 (en) 2001-03-09 2003-02-13 Pe Corporation (Ny) Methods for large scale protein matching
US6835927B2 (en) * 2001-10-15 2004-12-28 Surromed, Inc. Mass spectrometric quantification of chemical mixture components
US20030129760A1 (en) 2001-11-13 2003-07-10 Aguilera Frank Reinaldo Morales Mass intensity profiling system and uses thereof
DE10158860B4 (de) 2001-11-30 2007-04-05 Bruker Daltonik Gmbh Massenspektrometrische Proteingemischanalyse
GB2385918B (en) 2001-12-08 2004-05-26 Micromass Ltd Method of mass spectrometry
US6835027B1 (en) * 2003-11-05 2004-12-28 Billy Glass Staple for securing geo-textile material to the ground

Also Published As

Publication number Publication date
CA2465297C (en) 2011-02-15
EP1456667A2 (de) 2004-09-15
JP4654230B2 (ja) 2011-03-16
JP2005513481A (ja) 2005-05-12
CA2465297A1 (en) 2003-07-03
US20070009898A1 (en) 2007-01-11
WO2003054549A3 (en) 2003-10-16
EP1456667B1 (de) 2006-05-24
US20080142696A1 (en) 2008-06-19
JP2008076403A (ja) 2008-04-03
US8030089B2 (en) 2011-10-04
GB2385918B (en) 2004-05-26
US20080286764A9 (en) 2008-11-20
GB0228653D0 (en) 2003-01-15
ATE403872T1 (de) 2008-08-15
JP4767496B2 (ja) 2011-09-07
DE60211744D1 (de) 2006-06-29
US20050092910A1 (en) 2005-05-05
ATE327512T1 (de) 2006-06-15
GB2385918A (en) 2003-09-03
DE60211744T2 (de) 2006-11-02
WO2003054549A2 (en) 2003-07-03
EP1456667B2 (de) 2010-01-20
US20080135744A1 (en) 2008-06-12
DE60228132D1 (de) 2008-09-18

Similar Documents

Publication Publication Date Title
DE60211744T3 (de) Massenspektrometrie-verfahren
Guerrera et al. Application of mass spectrometry in proteomics
James Protein identification in the post-genome era: the rapid rise of proteomics
DE102012102875B4 (de) Vorläuferauswahl mit einem Artificial-Intelligence-Algorithmus erhöht Abdeckung und Reproduzierbarkeit von proteomischen Proben
US20060004525A1 (en) System and method of determining proteomic differences
JP2003533672A (ja) 非標的化複雑試料分析の方法
DE102012102874A1 (de) Gasphasenreinigung zur genauen Quantifizierung auf der Basis isobarer Tags
DE60119580T2 (de) Schnelle und quantitative proteomanalyse und damit zusammenhängende verfahren
EP1877783B1 (de) Massenspektrometrisches analyseverfahren
Bakhtiar et al. Mass spectrometry of the proteome
GB2395271A (en) Index for identifying biomolecules
EP1891569B1 (de) System und verfahren zur absoluten quantifizierung von proteinen unter verwendung von lc/ms
EP1469314B1 (de) Massenspektormetrie-Verfahren
CA2616888C (en) Method of mass spectrometry
GB2408574A (en) Method of mass spectrometry
Laukens et al. Tobacco BY-2 proteome display, protein profiling and annotation using two-dimensional electrophoresis and mass spectrometry-based cross-species identification

Legal Events

Date Code Title Description
8363 Opposition against the patent
8366 Restricted maintained after opposition proceedings