WO2012045396A2 - Selektive proteinquantifizierung mittels multivariater auswertung von uv-absorptionsspektren - Google Patents

Selektive proteinquantifizierung mittels multivariater auswertung von uv-absorptionsspektren Download PDF

Info

Publication number
WO2012045396A2
WO2012045396A2 PCT/EP2011/004687 EP2011004687W WO2012045396A2 WO 2012045396 A2 WO2012045396 A2 WO 2012045396A2 EP 2011004687 W EP2011004687 W EP 2011004687W WO 2012045396 A2 WO2012045396 A2 WO 2012045396A2
Authority
WO
WIPO (PCT)
Prior art keywords
protein
proteins
calibration
absorption spectra
spectra
Prior art date
Application number
PCT/EP2011/004687
Other languages
English (en)
French (fr)
Other versions
WO2012045396A3 (de
Inventor
Jürgen HUBBUCH
Sigrid Hansen
Erik Skibsted
Janus C. Krarup
Hans Holmegaard SØRENSEN
Arne Staby
Original Assignee
Karlsruher Institut für Technologie
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Karlsruher Institut für Technologie filed Critical Karlsruher Institut für Technologie
Publication of WO2012045396A2 publication Critical patent/WO2012045396A2/de
Publication of WO2012045396A3 publication Critical patent/WO2012045396A3/de

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/33Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using ultraviolet light
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2201/00Features of devices classified in G01N21/00
    • G01N2201/12Circuits of general importance; Signal processing
    • G01N2201/129Using chemometrical methods
    • G01N2201/1293Using chemometrical methods resolving multicomponent spectra

Definitions

  • the present invention relates to a method for the selective quantification of individual proteins in a protein mixture. This method is based on the determination of the individual concentrations of the proteins in the protein mixture from a UV absorption spectrum of the protein mixture. Furthermore, the present invention relates to a method based on this method for the selective quantification of individual proteins in a protein mixture.
  • selective protein analysis covers processes that are capable of simultaneously detecting and possibly quantifying the various proteins that are present in a sample, and for the selective analysis of complex multicomponent mixtures which do not contain any proteins.
  • Technique Methods which use multivariate calibration techniques to determine the composition of these complex mixtures from spectral data, however, such methods have not been used for protein mixtures because the differences between the UV absorption spectra of various proteins were considered too low to provide multivariate calibration techniques successfully apply to complex protein mixtures.
  • the present invention is therefore based on the object to provide a simple and rapid method for the selective quantification of individual proteins in a protein mixture.
  • This method is intended to overcome the disadvantages of existing methods.
  • the method should be able to do without complicated sample preparation, be easy to automate and enable rapid analysis of protein mixtures.
  • This object is achieved by the embodiments of the present invention characterized in the claims.
  • an object of the present invention relates to a method for the selective quantification of individual proteins in a protein mixture, comprising the steps:
  • step (b) determining the single concentration of at least one protein in the protein mixture from the UV absorption spectrum prepared in step (a).
  • step (b) the individual concentrations of one, several or all proteins in the protein mixture are determined
  • step (b) the individual concentrations of one, several or all proteins in the protein mixture are determined
  • the method according to the invention is thus able to determine not only the total concentration of all proteins in the whole but also the individual concentrations of the respective proteins
  • Methods for producing UV absorption spectra are known to the person skilled in the art and include the use of a UV detector, for example a diode-based UV detector.
  • continuous UV absorption spectra are created.
  • continuous ultraviolet spectrum refers to ultraviolet spectra which detect UV absorption over a particular wavelength range in reasonable resolution, for example, in 10 nm, preferably 5 nm, more preferably 1 nm, steps
  • a further preferred embodiment is the use of discontinuous absorption spectra, wherein the resolution need not be present over the entire wavelength range, for example only ten UV spectra, preferably only five UV spectra, more preferably only three UV spectra are measured.
  • the UV absorption spectra of different proteins differ, in particular it was recognized that the forms of the absorption spectra of the individual proteins differ (see Fig. 2a). These differences are largely due to the different amino acid Attributable to the composition of the proteins involved and therefore contain information that is linked to the identity of the respective protein. A protein mixture of several proteins thus exhibits a characteristic of this protein mixture UV absorption spectrum.
  • the correlation of this information with the individual concentrations of the proteins contained in the protein mixture takes place mathematically in a preferred embodiment of the method according to the invention.
  • the determination of the individual concentrations in step (b) of the method according to the invention is preferably carried out by calculation.
  • a so-called multivariate calibration model can be used.
  • the differences in the absorption spectra of different protein mixtures are sufficient to enable the individual concentration of at least one protein of the protein mixture, in particular of all proteins of the protein mixture, to be determined in particular.
  • step (b), ie the determination of the individual concentration of the proteins in the protein mixture from the UV absorption spectrum prepared in step (a), is carried out with the aid of a multivariate calibration model.
  • the multivariate calibration model according to the present invention is prepared based on UV absorption spectra of samples containing known proteins in known concentration.
  • the calibration samples each contain only one protein in known concentration.
  • mixed spectra are generated from the UV absorption spectra of the calibration samples, each containing only one protein in a known concentration, by linear combinations, which are used for the preparation of the multivariate calibration model.
  • a method for generating mixed spectra from the UV absorption spectra of calibration samples each containing only one protein in a known concentration Linear combinations are known in the art. Advantages of such a procedure are an improved accuracy of the method, since inaccuracies in the generation of protein samples, eg by incorrect pipetting, can be minimized. In addition, only a small amount of often very expensive and difficult to access proteins is needed.
  • multivariate calibration model generally refers to models by which several interrelated statistical variables can be examined simultaneously. In the process, relationships and dependency structures between the variables can be identified.
  • a multivariate calibration model combines the relationship between multiple input variables with one or more target properties. In some cases, the benefit of multivariate calibration is a more robust model. In other cases, the objective property can only be examined if several variables are measured.
  • the input variables are the spectral data of the recorded UV absorption spectra
  • the target properties are the concentrations of the respective proteins contained in the protein mixture.
  • the input data are referred to as X data and the target properties as Y data.
  • Multilinear regression is a classical statistical technique for multivariate calibration.
  • An MLR-based calibration model consists of a linear equation in which each variable of the X data is multiplied by a weight.
  • MLR is known to be sensitive to collinearity. Collinearity between the measured variables can always occur if the number of measured variables exceeds the number of samples included in the calibration.
  • collinearity is inherent in spectral data, as it does not consist of independent variables.
  • Principal component analysis is a technique used to find the significant variance within X data consisting of non-independent variables. They transform the X data into a new (main) axis system.
  • PLS regression refers to the statistical regression method described, often referred to as partial least square regression, but more correctly referred to as "projection to latent structure regression.”
  • PLS can thus have both meanings, with the designated statistical regression method in each Case is the same.
  • PLS regression offers greater robustness to measurement errors than other multivariate calibration approaches, such as multilinear regression.
  • Multivariate calibration models which can be used in conjunction with the method according to the invention are known to the person skilled in the art. According to the invention, it has been recognized that for the determination of the individual concentration of at least one protein in a protein mixture, for example, calibration models can be used which are created with the aid of an MCR (Multivariate Curve Resolution) method, multilinear regression or PLS regression.
  • MCR Multivariate Curve Resolution
  • the multivariate calibration model is determined by means of a statistical method selected from the group of methods for multivariate calibration, in particular consisting of Multivariate Curve Resolution (MCR), partial least square (PLS) regression and multilinear regression (MLR).
  • MCR Multivariate Curve Resolution
  • PLS partial least square
  • MLR multilinear regression
  • the statistical method is PLS regression.
  • a calibration model using the PLS regression is created.
  • protein concentrations of unknown composition can be used to determine the individual concentrations of the proteins present based on the UV absorption spectrum of the respective protein mixture.
  • the protein mixture originates from a column chromatography.
  • the creation of the UV spectrum is preferably carried out at the column outlet, wherein preferably at least one UV spectrum every ten seconds, more preferably at least one UV spectrum per second, more preferably at least four UV spectra per second are created. It is also possible that between 1 and 20 UV spectra per second, for example, between 2 and 10 UV spectra per second, in particular between 4 and 7 UV spectra per second are created at the column output.
  • column chromatography is preparative column chromatography.
  • Column chromatographic methods that can be used in conjunction with the method of the invention are known to those skilled in the art.
  • the protein mixture originates from a high-throughput process, wherein preferably at least one UV spectrum is produced every ten seconds, more preferably at least one UV spectrum per second, more preferably at least four UV spectra per second. It is also possible that between 1 and 20 UV spectra per second, for example, between 2 and 10 UV spectra per second, in particular between 4 and 7 UV spectra per second are created.
  • High throughput processes which can be used in conjunction with the process of the invention are known to those skilled in the art.
  • a disadvantage of conventional methods for analyzing chromatographic separations of proteins is the inability to selectively select the proteins in the eluate, i. their respective nature. Therefore, the exact composition of the eluate, as well as the individual concentrations or the amounts of the individual proteins contained therein can not be determined promptly. Rather, the collected fractions of the eluate first have to be analyzed, which delays the following process steps. Likewise, optimal fractionation of the target protein, irrespective of whether the purity or yield of the protein is the relevant target, is not possible.
  • the protein mixture to be investigated comprises N different proteins, where N is a natural number and preferably N> 2 or N> 3 or N> 5 or N> 7 or N> 10 and / or N ⁇ 100 and / or N ⁇ 50 and / or N ⁇ 30 and / or N ⁇ 20.
  • N may hold: N e [2, 10] or N e [3, 10] or N e [4, 7].
  • the protein mixture to be investigated contains no protein unknown to the multivariate calibration model, or no protein that was not taken into account in the preparation of the multivariate calibration model.
  • the protein mixture to be investigated contains unknown proteins to the multivariate calibration model in a proportion of at most 30% (w / v), more preferably at most 10% (w / v), and most preferably at most 1% ( w / v).
  • the method according to the invention does not require any sample preparation.
  • the UV spectrum is produced in a middle ultraviolet range, more preferably in a range of about 210 nm to about 300 nm wavelength, most preferably in a range of about 240 nm to about 300 nm wavelength ,
  • the UV spectrum is produced in a wavelength range which includes or comprises parts between 240 nm and 300 nm, for example in the range between 220 nm and 300 nm, 230 nm and 300 nm, 250 nm and 300 nm, 260 nm and 300 nm, 220 nm and 280 nm, 240 nm and 280 nm or 250 nm and 290 nm.
  • the spectrum is preferably a continuous or discontinuous UV absorption spectrum.
  • the UV absorption spectrum is created in a preferred embodiment with the aid of a diode-based detector.
  • Such devices are capable of recording multiple spectra per second. Suitable detectors are known to the person skilled in the art.
  • a further subject of the present invention relates to a system for the selective quantification of individual proteins in a protein mixture, comprising:
  • a detector in particular a diode-based UV detector, which is arranged at the column exit, and (c) means for automatically processing the UV absorption spectra produced by the UV detector and determining the concentration of the individual proteins in the protein mixture from these UV absorption spectra using a multivariate calibration model and a suitable statistical method.
  • Another object of the present invention relates to a system for the selective quantification of individual proteins in protein mixtures, comprising:
  • (c) means for automatically processing the UV absorption spectra produced by the detector and determining the concentration of the individual proteins in the protein mixtures from these UV absorption spectra using a multivariate calibration model and a suitable statistical method.
  • compositions for a column chromatographic separation of a protein mixture are known to those skilled in the art and include, for example, suitable columns, column materials, pumps, collectors, mobile phases, fluidics, control and monitoring equipment.
  • Means for the automated handling of multi-well plates are also known in the art and include, for example, conventional plate readers.
  • the systems may also contain or be functionally connected to one or more sources of electromagnetic radiation, in particular a UV source. Suitable diode-based UV detectors are also known to the person skilled in the art. Additionally or alternatively, it is also possible to use the method according to the invention at wavelengths other than the wavelength of the UV. Accordingly, the system may include other or additional sources of electromagnetic radiation and corresponding detector (s).
  • Means for automatically processing the ultraviolet absorption spectra produced by the UV detector and determining the concentration of the individual proteins in the protein mixture from these UV absorption spectra using a multivariate calibration model are also known in the art, and include, for example, suitable computers in conjunction with appropriate software.
  • Suitable software packages that can be used in this context are known to the person skilled in the art and include, for example, the MATLAB-based package "PLS Toolbox" (EigenVector, USA).
  • the present invention has surprisingly been able to show that the differences between the UV absorption spectra of different proteins are large enough to determine the individual concentrations of the proteins contained by means of multivariate calibration methods from UV absorption spectra of complex protein mixtures. So far, it has been assumed in the art that this is not possible.
  • the method according to the invention enables rapid analysis of protein mixtures, e.g. the eluate of a column chromatographic protein purification, whereby an often time-consuming and costly downstream protein analysis is unnecessary.
  • optimal determination of the eluate can be effected directly by the determination of the individual concentrations of the proteins contained in the eluate, which takes place simultaneously with the elution, since downstream protein analysis becomes superfluous.
  • the method of the invention further provides the ability to rapidly and automatically quantify proteins in aqueous solution by creating a UV absorption spectrum and linking the spectral information thus obtained to selective protein concentrations via a multivariate calibration without the need for sample preparation.
  • the process according to the invention can be used in a variety of ways in the fields of protein and process analysis.
  • selective protein analysis in all questions permits protein quantification in a protein mixture and / or the relative or absolute change in the protein composition of a protein mixture.
  • Possible fields of application are high-throughput screening in biology, biochemistry, biotechnology, pharmacy or medicine, microfluidics, sensor technology, biochromatography, biochemistry Bioreanum or bioprocess analysis, wherein the inventive method, for example, both in batch mode in cuvettes or multi-well plates, as well as in flow operation in microfluidic applications, lines or measuring cells can be performed. This is not possible with the methods for selective protein analysis known in the prior art.
  • the simplicity and rapidity of the method according to the invention is also of great use in high-throughput analysis.
  • automation is possible without much effort and the analysis time and / or the preparation time is considerably lower.
  • the required equipment is also inexpensive, less susceptible to interference and easy to use.
  • Another object of the present invention relates to the use of UV absorption spectra for determining the concentration of individual proteins in the protein mixture using a multivariate calibration model and a suitable statistical method.
  • Fig. 1 UV absorption spectra of three proteinogenic amino acids having an aromatic structure, namely tyrosine, tryptophan and phenylalanine in the middle UV range.
  • the concentration of the amino acids was 0.1 mg / ml.
  • a concentration of 1.0 mg / ml is also shown due to the relatively low UV absorption.
  • Fig. 2 UV absorption spectra of three model proteins, namely lysozyme (lys), cytochrome C (cytC) and ribonuclease A (ribA).
  • lys lys
  • cytochrome C cytochrome C
  • ribA ribonuclease A
  • Mixture ratios of cytC and ribA include.
  • Fig. 3 (a) 19 mixing ratios of the three model proteins resulting from the four-shell design / on which the calibration set was based.
  • FIG. 5 shows chromatograms of the separations of the ternary protein mixture via four different cation exchange resins. For each resin, a histogram is shown (top) showing the total absorbance of each of the 24 elution fractions at 280 and 526 nm, and a scatter plot (bottom) illustrating the concentrations of the three proteins calculated using the method of the invention of the elution volume shows.
  • FIG. 6 Chromatogram of a column chromatographic separation of the three model proteins by means of conventional single-channel UV absorption measurement at 280 nm at the column exit (top) and by calculation according to the method according to the invention (bottom). Spectra in the range of 240 to 300 nm were recorded at the column exit from the eluate and used to calculate the concentration of the individual proteins present in the eluate.
  • Fig. 7 Protein composition of the lysozyme / BSA and BSA / HSA calibration sets.
  • Fig. 8 Predictivity of the PLS regression-based model for the
  • Lysozyme / BSA system as a function of the number of latent variables contained in the model.
  • Figure 9 Predicted Protein Concentrations as a Function of Nominal Protein Concentrations for Lysozyme and BSA. The data was not processed before the PLS regression. The model was based on three latent ones
  • Fig. 10 Predictivity of the PLS regression-based model for the lysozyme / BSA system as a function of the number of latent variables contained in the model. The data was prepared by centering on the model before creating the model.
  • Fig. 11 Predicted protein concentrations as a function of nominal protein concentrations for lysozyme and BSA. The data were processed by centering on the mean before PLS regression. The
  • Fig. 12 Predictivity of the PLS regression-based model for the HSA / BSA system as a function of the number of latent variables contained in the model. The data was prepared by centering on the model before creating the model.
  • Fig. 13 Predicted protein concentrations as a function of nominal protein concentrations for HSA and BSA. The data was collected before the PLS
  • FIG. 14 UV absorption spectra in the middle UV range of deamidated and non-deamidated aspart.
  • the spectra were measured at a resolution of 1 nm.
  • Fig. 15 A two-factorial Doehlert design was used to prepare the composition of the calibration samples. Seven resulting different compositions are shown. The mean was created in triplicate.
  • Fig. 16 Predicted protein concentration as a function of nominal protein concentration for deamidated and non-deamidated aspart. The light gray larger dots represent the predictions from the cross validations, the smaller black dots those from the test samples.
  • a straight line symbolizing the ideal correlation is shown.
  • Sample preparation 96-well plates with flat bottom, volumetric capacity 2 ml, polypropylene (VWR, Germany). Measurement of UV spectra in the middle range: 96-well flat bottom UV microtiter plates, volumetric capacity 360 ⁇ , polystyrene (Greiner, Germany). Chromatography: RoboColumns ® filled with 200 ⁇ resin for cation exchange chromatography. The following resins were used: CM Ceramic HyperD ® F, Toyopearl ® SP 650 M, SP Sepharose ® FF and Fractogel ® EMDSO3 (Atoll, Germany).
  • Model proteins were lysozyme (lys) from chicken egg white, cytochrome C (cytC) from horse hearts, ribonuclease A (ribA) from bovine pancreas, bovine serum albumin (BSA), and human serum albumin (HSA) (all from Sigma-Aldrich, Germany). pipetting
  • the calibration and test samples were prepared from stock solutions containing 2.1 mg / ml protein in a sodium phosphate buffer at pH 7.
  • the samples were prepared in 96-well plates in a volume of 2 ml.
  • 150 ⁇ of the samples were transferred to UV-transparent 96-well flat-bottomed UV microtiter plates.
  • the absorption spectra were measured at a resolution of 1 nm in the range of 240 nm to 295 nm using a Lambda 35 UV detector (Perkin Elmer, Germany) or the Infinite 200 plate reader (Tecan, Crailsheim, Germany).
  • the calibration samples were based on a four level D-optimal onion design. This resulted in 19 mixing ratios (see Fig. 3a) of the three components and a total of 28 samples including three centers (all three components at half maximum concentration in a sample). Further, three samples were added to the calibration set, each containing 0.05 mg / ml of one of the three proteins. Overall, the calibration model was based on 31 samples.
  • Fig. 3b shows the composition of the calibration samples for lys and ribA. The test samples were based on a D-optimal onion design with three levels. Both the calibration samples and the test samples were prepared from the same protein stock solutions.
  • the proteins were eluted from the column with a sodium chloride gradient from 0 to 500 mM over 24 CV. Due to the device, a gradual gradient with an increase in the salt concentration of 20.83 mM per CV was used. Each step of the gradient had a volume of 200 ⁇ and was recorded as one Fraction collected and analyzed. After complete elution, 150 ⁇ of each eluted fraction was transferred to fresh 96-well plates and the UV absorption spectra were measured. Deamidation of aspart
  • the human insulin analog Aspart (Novo Nordisk, Denmark) was provided in the form of Aspart API.
  • Aspart API The human insulin analog Aspart (Novo Nordisk, Denmark) was provided in the form of Aspart API.
  • Aspart API For deamidation Aspart was incubated for 16 days at 45 ° C in a sodium phosphate buffer (pH 7.4). The solution was filtered through a syringe filter (0.2 ⁇ ) every 24 hours to prevent bacterial contamination.
  • Fig. 2a shows the UV absorption spectra of the three model proteins lys, cytC and ribA. These proteins represent a favorable model system because they can be easily separated from one another by their different isoelectric points.
  • Table 1 Determination coefficients of all cross validations and the predicted test data
  • the applicability of the method according to the invention was investigated by means of column chromatographic separations of the three model proteins.
  • the separations were carried out automatically on a pipetting station.
  • Four different cation exchange materials were used and elution performed with the same salt gradient for each column.
  • the resulting chromatograms are shown in Figure 5, with two plots for each resin, the total UV absorbance of the collected fractions at 280 nm and 526 nm versus the elution volume, and the concentrations of individual proteins versus elution volume. as predicted by the calibration model.
  • UV absorption spectra for the binary protein system BSA (bovine serum albumin) / Iys were recorded. The samples were each generated according to the protein concentrations shown in FIG. 7. Calibration models were created from the acquired spectra using the PLS Toolbox software.
  • Fig. 8 shows the root mean square error of the calibration
  • RMSEC / RMSECV as a function of the latent variables included in the model.
  • Figure 9 shows the predicted protein concentrations as a function of nominal protein concentrations for lysozyme and BSA, respectively.
  • UV absorption spectra for the binary protein system BSA / HSA human Serum albumin
  • the samples were each generated according to the protein concentrations shown in FIG. 7.
  • Calibration models were created from the acquired spectra using the PLS Toolbox software.
  • Fig. 14 shows the UV absorption spectra of both proteins. As expected, the spectra are very similar in shape and intensity, although slight differences were found. To test whether these differences are sufficient to create a stable calibration model, samples were prepared for calibration.
  • Fig. 15 shows the protein concentrations of the nine prepared samples. Their composition is based on a two-factor Doehlert design with a triple average.
  • the PLS-based calibration model was designed with two latent variables created.
  • the PLS regression was performed with cross validations, with each sample omitted once and predicted by the calibration model based on the remaining samples.
  • Fig. 16 shows the predictions of the krauz validations made during the creation of the model and the predictions of the test samples.
  • the coefficients of determination were calculated for the predictions of the cross-validations, which were related to the straight line of ideal correlation and not to the best-fitting straight line to the existing data points.
  • the corresponding values were 0.77 for deamidated and 0.88 for non-deamidated aspart. These values were not as high as for the other test systems (see above).

Landscapes

  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

Die vorliegende Erfindung betrifft ein Verfahren zur selektiven Quantifizierung einzelner Proteine in einem Proteingemisch. Dieses Verfahren basiert auf der Bestimmung der Einzelkonzentrationen der Proteine in dem Proteingemisch aus einem UV-Absorptionsspektrum des Proteingemisches. Weiter betrifft die vorliegende Erfindung ein auf diesem Verfahren basierendes System zur selektiven Quantifizierung einzelner Proteine in einem Proteingemisch.

Description

"Selektive Proteinquantifizierung mittels multivariater Auswertung
von UV-Absorptionsspektren"
Beschreibung
Die vorliegende Erfindung betrifft ein Verfahren zur selektiven Quantifizierung einzelner Proteine in einem Proteingemisch. Dieses Verfahren basiert auf der Bestimmung der Einzelkonzentrationen der Proteine in dem Proteingemisch aus einem UV-Absorptionsspektrum des Proteingemisches. Weiter betrifft die vorliegende Erfindung ein auf diesem Verfahren basierendes System zur selektiven Quantifizierung einzelner Proteine in einem Proteingemisch.
Die meisten Proteine absorbieren aufgrund der aromatischen Strukturen der darin enthaltenen Aminosäuren Tyrosin, Tryptophan und Phenylalanin elektromagnetische Strahlung im mittleren ultravioletten Bereich (etwa 210 bis 300 nm). Die Absorptionsspektren dieser Aminosäuren weisen zwei Absorptionsmaxima auf, ein intensives Maximum im Bereich von 220 bis 230 nm und ein weniger intensives Maximum im Bereich von 250 bis 290 nm (vgl. Fig. 1 ). Das Absorptionsverhalten von Proteinen, die diese aromatischen Aminosäuren enthalten, weist die gleichen charakteristischen Absorptionsmaxima auf. Diese Eigenschaft, UV-Strahlung zu absorbieren, wird oft zur Quantifizierung von gelösten Proteinen herangezogen. Häufig wird dabei die Absorption bei einem der beiden Absorptionsmaxima, z.B. bei 220 nm oder 280 nm, gemessen. Diese Herangehensweise erlaubt jedoch lediglich die Messung der Gesamtkonzentration aller Proteine in der Lösung, ohne eine selektive Aussage, d.h. eine Aussage über die Einzelkonzentrationen bzw. die Mengen der jeweils einzelnen in der Lösung enthaltenen Proteine, machen zu können.
Für die präparative Aufreinigung von Proteinen, z.B. in der pharmazeutischen Industrie, wird sehr häufig Säulenchromatographie mit einer flüssigen mobilen Phase eingesetzt. Hierbei wird standardmäßig die erzielte chromatographische Auftrennung der Proteine mit Hilfe von UV-Absorptionsmessungen bei einer einzelnen Wellenlänge im mittleren UV-Bereich am Säulenausgang visualisiert bzw. analysiert. So erstellte Chromatogramme zeigen typischerweise die über das Elutionsvolumen aufgetragene UV-Absorption des Eluats bei einer bestimmten Wellenlänge, wobei diese UV-Absorption mit der Gesamtkonzentration aller Proteine im Eluat korreliert. Weitere prozessanalytische Parameter, die bei einem solchen Verfahren erfaßt werden können, sind beispielsweise pH-Wert, Leitfähigkeit und Temperatur des Eluats am Säulenausgang.
In der Entwicklung von Prozessen zur Proteinaufreinigung oder von Screeningverfahren werden in jüngerer Zeit vermehrt miniaturisierte Experimente automatisiert in Hochdurchsatzverfahren durchgeführt. Für die Auswertung solcher Experimente ist ebenfalls eine selektive Proteinquantifizierung notwendig. Geeignete analytische Verfahren hierfür müßten einen vergleichbaren Durchsatz haben und einfach zu automatisieren sein. Entsprechende analytische Meßverfahren, die auf der Basis photospektrometrischer Daten Proteingemische qualitativ und/oder quantitativ analysieren könnten, sind dabei im Stand der Technik nicht bekannt.
Der Begriff „selektive Proteinanalytik" deckt Verfahren ab, die in der Lage sind, die verschiedenen Proteine, die in einer Probe vorhanden sind, gleichzeitig nachzuweisen und gegebenenfalls zu quantifizieren. Für die selektive Analytik komplexer Mehrkomponentengemische, die keine Proteine enthalten, sind im Stand der Technik Verfahren bekannt, die multivariate Kalibrierungsmethoden verwenden, um anhand von Spektraldaten die Zusammensetzung dieser komplexen Gemische zu bestimmen. Solche Verfahren wurden allerdings bisher nicht für Proteingemische verwendet, da die Unterschiede zwischen den UV-Absorptionsspektren verschiedener Proteine als zu gering erachtet wurden, um multivariate Kalibrierungsmethoden erfolgreich auf komplexe Proteingemische anwenden zu können.
Der vorliegenden Erfindung liegt daher die Aufgabe zu Grunde, ein einfaches und schnelles Verfahren zur selektiven Quantifizierung einzelner Proteine in einem Proteingemisch bereitzustellen. Dieses Verfahren soll die Nachteile bestehender Verfahren überwinden können. Insbesondere soll das Verfahren ohne aufwendige Probenvorbereitung auskommen, leicht zu automatisieren sein und eine schnelle Analytik von Proteingemischen ermöglichen. Diese Aufgabe wird durch die in den Ansprüchen gekennzeichneten Ausführungsformen der vorliegenden Erfindung gelöst.
Dementsprechend betrifft ein Gegenstand der vorliegenden Erfindung ein Verfahren zur selektiven Quantifizierung einzelner Proteine in einem Proteingemisch, umfassend die Schritte:
(a) Erstellen eines UV-Absorptionsspektrums des Proteingemisches, und
(b) Bestimmen der Einzelkonzentration zumindest eines Proteins in dem Proteingemisch aus dem in Schritt (a) erstellten UV-Absorptionsspektrum.
Gemäß der vorliegenden Erfindung wurden Nachteile von bestehenden Verfahren zur selektiven Proteinanalytik, wie Massenspektrometrie, Gelelektrophorese und Kapillarelektrophorese überwunden. Beispielsweise ist zur Durchführung der genannten herkömmlichen Verfahren meist eine mehr oder weniger aufwendige Probenvorbereitung von Nöten. Die dadurch bedingte Dauer der Analysen und die mangelhafte Automatisierung macht jedoch eine Anwendung auf dem Gebiet der Hochdurchsatz-basierten Prozessentwicklung bzw. -analytik schwierig, wenn nicht unmöglich. Diese Schwierigkeit wird durch das erfindungsgemäße Verfahren überwunden.
Ein weiteres herkömmliches Verfahren zur selektiven Proteinanalytik, die analytische Chromatographie, läßt sich zwar in vielen Fällen ohne Probenvorbereitung durchführen, ist jedoch gerätebedingt ein sequentiell durchgeführtes Verfahren, wodurch sich sehr lange Analysenzeiten ergeben können, welche den zeitlichen Gewinn bei Hochdurchsatz-Experimenten wieder zunichte machen.
Schließlich existieren Verfahren auf dem Gebiet der selektiven Proteinanalytik, deren Anwendung auf Proteine beschränkt ist, die eine spezifische Absorption bei bestimmten Wellenlängen aufweisen (z.B. Cytochrom C oder Green Fluorescent Protein (GFP)). Dabei wird herkömmlicher Wiese die Absorption bei diesen bestimmten Wellenlängen für die selektive Quantifizierung verwendet. Eine generelle Anwendbarkeit, wie dies durch die vorliegende Erfindung ermöglicht wird, ist bei solchen herkömmlichen Verfahren allerdings nicht gegeben. Das erfindungsgemäße Verfahren weist diese Nachteile nicht mehr auf. Insbesondere bedarf das erfindungsgemäße Verfahren keiner Probenvorbereitung, was eine schnelle und leicht zu automatisierende selektive Proteinanalytik ermöglicht.
Der Begriff „selektive Quantifizierung" bezeichnet die Bestimmung der Einzelkonzentrationen eines, mehrerer oder aller Proteine in dem Proteingemisch nach ihrer jeweiligen Art. In einer bevorzugten Ausführungsform des erfindungsgemäßen Verfahrens werden in Schritt (b) die Einzelkonzentrationen eines, mehrerer oder aller Proteine in dem Proteingemisch bestimmt. Das erfindungsgemäße Verfahren ist damit in der Lage, nicht lediglich die Gesamtkonzentration aller Proteine in der Gesamtheit, sondern die Einzelkonzentrationen der jeweiligen Proteine zu bestimmen. Verfahren zum Erstellen von UV-Absorptionsspektren sind dem Fachmann bekannt und umfassen die Verwendung eines UV-Detektors, beispielsweise eines Diodenbasierten UV-Detektors.
In einer bevorzugten Ausführungsform des erfindungsgemäßen Verfahrens werden kontinuierliche UV-Absorptionsspektren erstellt. Der Begriff „kontinuierliches UV- Spektrum" bezeichnet UV-Spektren, welche die UV-Absorption über einen bestimmten Wellenlängenbereich in angemessener Auflösung, beispielsweise in 10 nm-, bevorzugt in 5 nm-, mehr bevorzugt in 1 nm-Schritten, erfassen, wobei sich die Auflösung über den gemessenen Wellenlängenbereich ändern kann. Eine weitere bevorzugte Ausführungsform besteht in der Nutzung von diskontinuierlichen Absorptionsspektren, wobei die Auflösung nicht über den gesamten Wellenlängenbereich vorliegen muss. Beispielsweise können nur zehn UV-Spektren, bevorzugt nur fünf UV-Spektren, mehr bevorzugt nur drei UV-Spektren gemessen werden.
Erfindungsgemäß wurde erkannt, daß sich die UV-Absorptionsspektren verschiedener Proteine unterscheiden, insbesondere wurde erkannt , daß sich die Formen der Absorptionsspektren der individuellen Proteine unterscheiden (vgl. Fig. 2a). Diese Unterschiede sind größtenteils auf die unterschiedliche Aminosäure- Zusammensetzung der beteiligten Proteine zurückzuführen und beinhalten daher Informationen, die mit der Identität des jeweiligen Proteins verknüpft sind. Ein Proteingemisch aus mehreren Proteinen weist so ein für dieses Proteingemisch charakteristisches UV-Absorptionsspektrum auf. Die Korrelation dieser Informationen mit den Einzelkonzentrationen der in dem Proteingemisch enthaltenen Proteine erfolgt in einer bevorzugten Ausführungsform des erfindungsgemäßen Verfahrens rechnerisch. Dementsprechend erfolgt das Bestimmen der Einzelkonzentrationen in Schritt (b) des erfindungsgemäßen Verfahren bevorzugt rechnerisch. Dazu kann in einer bevorzugten Ausführungsform des erfindungsgemäßen Verfahrens ein sogenanntes multivariates Kalibrierungsmodell verwendet werden.
In anderen Worten wurde erfindungsgemäß erkannt, die Unterschiede in den Absorptionsspektren verschiedener Proteingemische ausreichen, daß die Einzelkonzentration zumindest eines Proteins des Proteingemisches, insbesondere aller Proteine des Proteingemisches bestimmt, insbesondere berechnet werden können.
Dementsprechend wird in einer bevorzugten Ausführungsform des erfindungsgemäßen Verfahrens Schritt (b), also das Bestimmen der Einzelkonzentration der Proteine in dem Proteingemisch aus dem in Schritt (a) erstellten UV-Absorptionsspektrum, mit Hilfe eines multivariaten Kalibrierungsmodells durchgeführt.
Bevorzugt wird das multivariate Kalibrierungsmodell gemäß der vorliegenden Erfindung auf Grundlage von UV-Absorptionsspektren von Proben erstellt, die bekannte Proteine in bekannten Konzentration enthalten. In einer bevorzugten Ausführungsform des erfindungsgemäßen Verfahrens enthalten die Kalibrierungsproben jeweils nur ein Protein in bekannter Konzentration. In einer weiteren bevorzugten Ausführungsform werden aus den UV-Absorptionsspektren der jeweils nur ein Protein in bekannter Konzentration enthaltenden Kalibrierungsproben durch Linearkombinationen Mischspektren erzeugt, die für die Erstellung des multivariaten Kalibrierungsmodells verwendet werden. Verfahren für das Erzeugen von Mischspektren aus den UV-Absorptionsspektren von jeweils nur ein Protein in bekannter Konzentration enthaltenden Kalibrierungsproben durch Linearkombinationen sind dem Fachmann bekannt. Vorteile einer solchen Vorgehensweise sind eine verbesserte Genauigkeit des Verfahrens, da Ungenauigkeiten beim Generieren der Proteinproben, z.B. durch fehlerhaftes Pipettieren, minimiert werden können. Außerdem wird nur eine kleine Menge der oft seht teuren und schwer zugänglichen Proteine benötigt.
Der Begriff "multivariates Kalibrierungsmodell" bezeichnet im Allgemeinen Modelle mit deren Hilfe mehrere miteinander in Zusammenhang stehende statistische Variablen gleichzeitig untersucht werden können. Dabei können Zusammenhänge und Abhängigkeitsstrukturen zwischen den Variablen erkannt werden. Ein multivariates Kalibrierungsmodell verknüpft dabei die Beziehung zwischen mehreren Eingangsvariablen mit einer oder mehreren Zieleigenschaft(en). In manchen Fällen ist der Vorteil einer multivariaten Kalibrierung ein robusteres Modell. In anderen Fällen kann die Zieleigenschaft überhaupt nur untersucht werden, wenn mehrere Variablen gemessen werden. Im Fall der vorliegenden Erfindung sind die Eingangsvariablen die spektralen Daten der aufgenommenen UV- Absorptionsspektren, und die Zieleigenschaften sind die Konzentrationen der in dem Proteingemisch enthaltenen jeweiligen Proteine. Im Weiteren werden die Eingangsdaten als X-Daten und die Zieleigenschaften als Y-Daten bezeichnet.
Multilineare Regression (MLR) ist ein klassisches statistisches Verfahren für die multivariate Kalibrierung. Ein auf MLR basierendes Kalibrierungsmodell besteht aus einer linearen Gleichung, in der jede Variable der X-Daten mit einer Gewichtung multipliziert wird. Allerdings ist MLR bekannt dafür, empfindlich gegenüber Kollinearität zu sein. Kollinearität zwischen den gemessenen Variablen kann immer auftreten, wenn die Anzahl der gemessenen Variablen die Anzahl der in der Kalibrierung enthaltenen Proben übersteigt. Weiter ist Kollinearität inhärent in spektralen Daten enthalten, da diese nicht aus unabhängigen Variablen bestehen. Die Hauptkomponentenanalyse (principal component analysis, PCA) ist ein Verfahren, das verwendet wird, um die signifikante Varianz innerhalb von X-Daten zu finden, die aus nicht-unabhängigen Variablen bestehen. Durch sie werden die X- Daten in ein neues (Haupt-)Achsensystem transformiert. Dies geschieht auf solche Weise, daß die Transformation auf diese Achsen die größtmögliche Varianz in dem Datensatz widerspiegelt. Diese neuen Variablen werden als latente Variablen bezeichnet. Auf diese Weise können unabhängige latente Variablen aus den ursprünglichen X-Daten (also den Absorptionsspektren) erzeugt werden, und verwendet werden, um ein Kalibrierungsmodell mittels MLR zu erzeugen, mit dessen Hilfe die Y-Daten (also die spezifischen Proteinkonzentrationen) vorhergesagt werden können. Allerdings ist, wenn das PCA-Verfahren verwendet wird, um latente Variablen zu finden, das einzige Kriterium die Menge der beschreibbaren Varianz. Da es keine Garantie dafür geben kann, daß diese Variablen mit den Zieleigenschaften korrelieren, kann das Verwenden von PCA für die multivariate Kalibrierung zu suboptimalen Kalibrierungen führen. Dieses Problem wird durch Verwenden der PLS-Regression gelöst, da diese die latenten Variablen der X-Daten basierend auf zwei Kriterien extrahiert, nämlich beschriebene Varianz und Korrelation mit den Y-Daten. Im Zusammenhang mit PLS werden die latenten Variablen als Komponenten bezeichnet. Der Begriff „PLS-Regression" bezeichnet das beschriebene statistische Regressionsverfahren, das oftmals als partial least Square Regression, richtiger aber als projection to latent structure Regression bezeichnet wird. Das Akronym„PLS" kann somit beide Bedeutungen haben, wobei das bezeichnete statistische Regressionsverfahren in jedem Fall dasselbe ist. Die PLS-Regression bietet im Vergleich zu anderen multivariaten Kalibrierungsansätzen, wie z.B. der multilinearen Regression, eine höhere Robustheit gegenüber Meßfehlern.
Multivariate Kalibrierungsmodelle, die in Verbindung mit dem erfindungsgemäßen Verfahren eingesetzt werden können, sind dem Fachmann bekannt. Erfindungsgemäß wurde erkannt, daß zur Bestimmung der Einzelkonzentration zumindest eines Proteins in einem Proteingemisch beispielsweise Kalibrierungsmodelle eingesetzt werden können, die mit Hilfe eines MCR (Multivariate Curve Resolution) genannten Verfahrens, multilinearer Regression oder PLS-Regression erstellt werden.
Dementsprechend wird in einer bevorzugten Ausführungsform des erfindungsgemäßen Verfahrens das multivariate Kalibrierungsmodell mit Hilfe eines statistischen Verfahrens, ausgewählt aus der Gruppe der Methoden zur multivariaten Kalibrierung, insbesondere bestehend aus Multivariate Curve Resolution (MCR), partial least Square (PLS)-Regression und Multilinearer Regression (MLR), erstellt. In einer besonders bevorzugten Ausführungsform ist das statistische Verfahren die PLS-Regression. Die Berechnung multivariater Kalibrierungsmodelle und ihre Anwendung sind oft sehr aufwendig und werden daher meist computergestützt durchgeführt. Geeignete Software-Pakete, die auch in Verbindung mit dem erfindungsgemäßen Verfahren eingesetzt werden können, sind dem Fachmann bekannt und umfassen beispielsweise das auf MATLAB basierende Paket„PLS Toolbox" (EigenVector, USA).
Gemäß einer bevorzugten Ausführungsform des erfindungsgemäßen Verfahrens wird, basierend auf Spektren von Proben bekannter Zusammensetzung bezüglich Protein und Konzentration, ein Kalibrierungsmodell mit Hilfe der PLS-Regression erstellt. Mit diesem Modell können in Proteingemischen unbekannter Zusammensetzung die Einzelkonzentrationen der vorhandenen Proteine anhand des UV-Absorptionsspektrums des jeweiligen Proteingemisches bestimmt werden.
Dabei stammt in einer bevorzugten Ausführungsform des erfindungsgemäßen Verfahrens das Proteingemisch aus einer Säulenchromatographie. Das Erstellen des UV-Spektrums erfolgt dabei bevorzugt am Säulenausgang, wobei bevorzugt mindestens ein UV-Spektrum alle zehn Sekunden, mehr bevorzugt mindestens ein UV-Spektrum pro Sekunde, mehr bevorzugt mindestens vier UV-Spektren pro Sekunde erstellt werden. Es ist auch möglich, daß zwischen 1 und 20 UV-Spektren pro Sekunde, beispielsweise zwischen 2 und 10 UV-Spektren pro Sekunde, insbesondere zwischen 4 und 7 UV-Spektren pro Sekunde am Säulenausgang erstellt werden.
In einer bevorzugten Ausführungsform ist die Säulenchromatographie eine präparative Säulenchromatographie. Säulenchromatographische Verfahren, die in Verbindung mit dem erfindungsgemäßen Verfahren verwendet werden können, sind dem Fachmann bekannt. In einer weiteren bevorzugten Ausführungsform des erfindungsgemäßen Verfahrens stammt das Proteingemisch aus einem Hochdurchsatzverfahren, wobei bevorzugt mindestens ein UV-Spektrum alle zehn Sekunden, mehr bevorzugt mindestens ein UV-Spektrum pro Sekunde, mehr bevorzugt mindestens vier UV-Spektren pro Sekunde erstellt werden. Es ist auch möglich, daß zwischen 1 und 20 UV-Spektren pro Sekunde, beispielsweise zwischen 2 und 10 UV-Spektren pro Sekunde, insbesondere zwischen 4 und 7 UV-Spektren pro Sekunde erstellt werden. Hochdurchsatzverfahren, die in Verbindung mit dem erfindungsgemäßen Verfahren verwendet werden können, sind dem Fachmann bekannt.
Ein Nachteil herkömmlicher Verfahren zur Analyse chromatographischer Auftrennungen von Proteinen ist die fehlende Möglichkeit, die Proteine im Eluat selektiv, d.h. ihrer jeweiligen Art nach, zu bestimmen. Daher kann die genaue Zusammensetzung des Eluats, sowie die Einzelkonzentrationen bzw. die Mengen der einzelnen darin enthaltenen Proteine nicht zeitnah bestimmt werden. Vielmehr müssen erst die gesammelten Fraktionen des Eluats analysiert werden, wodurch nachstehende Prozesschritte verzögert werden. Ebenso ist eine optimale Fraktionierung des Zielproteins, unabhängig davon ob Reinheit oder Ausbeute des Proteins die relevante Zielgröße ist, nicht möglich.
Dagegen ist es mit dem erfindungsgemäßen Verfahren zum selektiven Nachweis von Proteinen in einem Proteingemisch möglich, zeitgleich zur Elution die Reinheit des Zielproteins im Eluat zu bestimmen. Somit ist eine deutlich verbesserte Grundlage für die Fraktionierung des Eluats im Hinblick auf eine kontrollierbare Reinheit oder Ausbeute geschaffen.
In einer weiteren bevorzugten Ausführungsform des erfindungsgemäßen Verfahrens umfaßt das zu untersuchende Proteingemisch N verschiedene Proteine, wobei N eine natürliche Zahl und bevorzugt N > 2 oder N > 3 oder N > 5 oder N > 7 oder N > 10 und/oder N < 100 und/oder N < 50 und/oder N < 30 und/oder N < 20 ist. Beispielsweise kann für N gelten: N e [2, 10] oder N e [3, 10] oder N e [4, 7]. Insbesondere kann für N gelten: N = 2 oder N = 3 oder N = 4 oder N = 5 oder N = 6 oder N = 7 oder N = 8 oder N = 9 oder N = 10, etc. Dabei enthält in einer bevorzugten Ausführungsform des erfindungsgemäßen Verfahrens das zu untersuchende Proteingemisch kein dem multivariaten Kalibrierungsmodell unbekanntes Protein, bzw. kein Protein, das bei der Erstellung des multivariaten Kalibrierungsmodells nicht berücksichtigt wurde. In einer weiteren bevorzugten Ausführungsform des erfindungsgemäßen Verfahrens enthält das zu untersuchende Proteingemisch dem multivariaten Kalibrierungsmodell unbekannte Proteine zu einem Anteil von höchstens 30% (w/v), mehr bevorzugt höchstens 10% (w/v), und am meisten bevorzugt höchstens 1 % (w/v). In einer weiteren bevorzugten Ausführungsform bedarf das erfindungsgemäße Verfahren keinerlei Probenvorbereitung.
In einer weiteren bevorzugten Ausführungsform des erfindungsgemäßen Verfahrens wird das UV-Spektrum in einem mittleren ultravioletten Bereich, mehr bevorzugt in einem Bereich von etwa 210 nm bis etwa 300 nm Wellenlänge, am meisten bevorzugt in einem Bereich von etwa 240 nm bis etwa 300 nm Wellenlänge erstellt. In einer weiteren bevorzugten Ausführungsform wird das UV-Spektrum in einem Wellenlängenbereich erstellt, welcher den Bereich zwischen 240 nm und 300 nm beinhaltet oder Teile davon umfasst, beispielsweise im Bereich zwischen 220 nm und 300 nm, 230 nm und 300 nm, 250 nm und 300 nm, 260 nm und 300 nm, 220 nm und 280 nm, 240 nm und 280 nm oder 250 nm und 290 nm. Dabei ist das Spektrum bevorzugt ein kontinuierliches oder diskontinuierliches UV-Absorptionsspektrum. Das UV-Absorptionsspektrum wird in einer bevorzugten Ausführungsform mit Hilfe eines Dioden-basierten Detektors erstellt. Solche Geräte sind in der Lage, mehrere Spektren pro Sekunde aufzunehmen. Geeignete Detektoren sind dem Fachmann bekannt.
In einer bevorzugten Ausführungsform des erfindungsgemäßen Verfahrens wird das Verfahren automatisiert durchgeführt. Ein weiterer Gegenstand der vorliegenden Erfindung betrifft ein System zur selektiven Quantifizierung einzelner Proteine in einem Proteingemisch, umfassend:
(a) Mittel für eine säulenchromatographische Trennung eines Proteingemisches,
(b) einen Detektor, insbesondere einen Dioden-basierten UV-Detektor, der am Säulenausgang angeordnet ist, und (c) Mittel für die automatische Verarbeitung der von dem UV-Detektor erstellten UV-Absorptionsspektren und die Bestimmung der Konzentration der einzelnen Proteine in dem Proteingemisch aus diesen UV-Absorptionsspektren mit Hilfe eines multivariaten Kalibrierungsmodells und eines geeigneten statistischen Verfahrens.
Ein weiterer Gegenstand der vorliegenden Erfindung betrifft ein System zur selektiven Quantifizierung einzelner Proteine in Proteingemischen, umfassend:
(a) Mittel für die automatisierte Handhabung von Multi-Well-Platten, welche die Proteingemische enthalten,
(b) einen Detektor, insbesondere einen Dioden-basierten UV-Detektor, der oberhalb oder unterhalb der Multi-Well-Platten angeordnet ist, und
(c) Mittel für die automatische Verarbeitung der von dem Detektor erstellten UV- Absorptionsspektren und die Bestimmung der Konzentration der einzelnen Proteine in den Proteingemischen aus diesen UV-Absorptionsspektren mit Hilfe eines multivariaten Kalibrierungsmodells und eines geeigneten statistischen Verfahrens.
Mittel für eine säulenchromatographische Trennung eines Proteingemisches sind dem Fachmann bekannt und umfassen beispielsweise geeignete Säulen, Säulenmaterialien, Pumpen, Sammler, mobile Phasen, Fluidik, Steuer- und Kontrolleinrichtungen. Mittel für die automatisierte Handhabung von Multi-Well- Platten sind dem Fachmann ebenfalls bekannt und umfassen beispielsweise übliche Plattenlesegeräte. Die Systeme können insbesondere auch ein oder mehrere Quellen elektromagnetischer Strahlung, insbesondere eine UV-Quelle beinhalten oder damit funktional verbunden sein. Geeignete Dioden-basierte UV-Detektoren sind dem Fachmann ebenfalls bekannt. Zusätzlich oder alternativ ist es auch möglich, das erfindungsgemäße Verfahren bei anderen Wellenlängen als der Wellenlänge des UV zu verwenden. Entsprechend kann das System andere bzw. zusätzliche Quellen elektromagnetischer Strahlung und entsprechende Detektor(en) aufweisen.
Mittel für die automatische Verarbeitung der von dem UV-Detektor erstellten UV- Absorptionsspektren und die Bestimmung der Konzentration der einzelnen Proteine in dem Proteingemisch aus diesen UV-Absorptionsspektren mit Hilfe eines multivariaten Kalibrierungsmodells sind dem Fachmann ebenfalls bekannt, und umfassen beispielsweise geeignete Computer in Verbindung mit geeigneter Software. Geeignete Software-Pakete, die in diesem Zusammenhang eingesetzt werden können, sind dem Fachmann bekannt und umfassen beispielsweise das auf MATLAB basierende Paket„PLS Toolbox" (EigenVector, USA).
Anhand der vorliegenden Erfindung konnte überraschend gezeigt werden, daß die Unterschiede zwischen den UV-Absorptionsspektren verschiedener Proteine groß genug sind, um mit Hilfe multivariater Kalibrierungsmethoden aus UV- Absorptionsspektren komplexer Proteingemische die Einzelkonzentrationen der enthaltenen Proteine zu bestimmen. Bislang wurde in der Fachwelt angenommen, daß dies nicht möglich ist. Das erfindungsgemäße Verfahren ermöglicht insbesondere eine schnelle Analytik von Proteingemischen, z.B. des Eluats einer säulenchromatographischen Proteinaufreinigung, wodurch eine oft zeit- und kostenaufwendige nachgeschaltete Proteinanalytik überflüssig wird. Insbesondere kann hierbei durch die mit der Elution gleichzeitig stattfindende Bestimmung der Einzelkonzentrationen der im Eluat enthaltenen Proteine eine optimale Fraktionierung des Eluats unmittelbar erfolgen, da eine nachgeschaltete Proteinanalytik überflüssig wird. Das erfindungsgemäße Verfahren bietet weiter die Möglichkeit, Proteine in wäßriger Lösung schnell und automatisiert durch das Erstellen eines UV-Absorptionsspektrums und die Verknüpfung der so gewonnenen spektralen Informationen mit selektiven Proteinkonzentrationen über eine multivariate Kalibrierung zu quantifizieren, ohne daß eine Vorbereitung der Proben nötig wäre.
Das erfindungsgemäße Verfahren ist in vielfältiger Weise auf den Gebieten der Protein- und Prozessanalytik einsetzbar. Insbesondere erlaubt es eine selektive Proteinanalytik bei allen Fragestellungen der Proteinquantifizierung in einem Proteingemisch und/oder der relativen oder absoluten Änderung der Proteinzusammensetzung eines Proteingemisches. Mögliche Einsatzgebiete sind das Hochdurchsatz-Screening in der Biologie, Biochemie, Biotechnologie, Pharmazie oder Medizin, die Mikrofluidik, die Sensorik, die Biochromatographie, die Bioprozessentwicklung oder die Bioprozessanalytik, wobei das erfindungsgemäße Verfahren beispielsweise sowohl im Batchbetrieb in Küvetten oder Multi-Well- Platten, als auch im Durchflussbetrieb in mikrofluidischen Applikationen, Leitungen oder Meßzellen durchgeführt werden kann. Dies ist bei den im Stand der Technik bekannten Verfahren zur selektiven Proteinanalytik nicht möglich.
Weiter ist die Einfachheit und Schnelligkeit des erfindungsgemäßen Verfahrens auch von großem Nutzen in der Hochdurchsatz-Analytik. Insbesondere ist, entgegen den im Stand der Technik bekannten Verfahren zur selektiven Proteinanalytik, eine Automatisierung ohne großen Aufwand möglich und die Analysezeit und/oder die Vorbereitungszeit wesentlich geringer. Die benötigte Ausstattung ist darüber hinaus preiswert, wenig störanfällig und leicht zu bedienen.
Ein weiterer Gegenstand der vorliegenden Erfindung betrifft die Verwendung von UV-Absorptionsspektren zur Bestimmung der Konzentration einzelner Proteine in dem Proteingemisch mit Hilfe eines multivariaten Kalibrierungsmodells und eines geeigneten statistischen Verfahrens.
Die Figuren zeigen:
Fig. 1 : UV-Absorptionsspektren von drei proteinogenen Aminosäuren mit aromatischer Struktur, nämlich Tyrosin, Tryptophan und Phenylalanin im mittleren UV-Bereich. Die Konzentration der Aminosäuren war dabei 0,1 mg/ml. Für Phenylalanin ist aufgrund der relativ geringen UV-Absorption auch eine Konzentration von 1 ,0 mg/ml gezeigt.
Fig. 2: UV-Absorptionsspektren von drei Modellproteinen, nämlich Lysozym (lys), Cytochrom C (cytC) und Ribonuclease A (ribA).
(a) Rohspektren der reinen Modellproteine bei 0,5 mg/ml.
(b) Rohspektren von fünf Proben, die reines Protein und drei verschiedene
Mischungsverhältnisse von cytC und ribA umfassen.
(c) Die fünf Spektren, die basierend auf der Absorption der reinen cytC- Probe bei 280 nm in ihren Offsets verschoben wurden.
(d) Differenzspektren, die aus den fünf Offset-verschobenen Spektren erstellt wurden.
Fig. 3: (a) 19 Mischungsverhältnisse der drei Modellproteine, die sich aus dem vierschaligen Design/auf dem das Kalibrierungsset basierte, ergaben.
(b) Die Konzentrationen der Proteine reichten von 0 bis 0,7 mg/ml. Die
Konzentrationen von ribA und lys sind gezeigt. Weitere drei Proben mit einer Konzentration von 0,05 mg/ml nur jeweils eines Proteins wurden hinzugefügt (Proben 28 bis 30). Fig. 4: Von dem PLS-Kalibrierungsmodell vorhergesagte Proteinkonzentrationen, die als Funktion der nominellen Konzentration für alle drei Protein aufgetragen wurden (obere Reihe).
(a) Ribonuclease A,
(b) Cytochrom C,
(c) Lysozym. Eine die ideale Korrelation symbolisierende Gerade ist gezeigt.
Ebenso sind die entsprechenden relativen und absoluten Fehler gezeigt (untere Reihe).
Fig. 5: Chromatogramme der Trennungen des ternären Proteingemisches über vier verschiedene Kationentauscherharze. Für jedes Harz ist ein Histogramm dargestellt (oben), das die gesamte Absorption jeder der 24 Elutionsfraktionen bei 280 und 526 nm zeigt, und ein Scatter-Plot dargestellt (unten), der die mit Hilfe des erfindungsgemäßen Verfahrens berechneten Konzentrationen der drei Proteine als Funktion des Elutionsvolumens zeigt.
Fig. 6: Chromatogramm einer säulenchromatographischen Auftrennung der drei Modellproteine mittels herkömmlicher Ein-Kanal UV-Absorptionsmessung bei 280 nm am Säulenausgang (oben) und mittels Berechnung gemäß dem erfindungsgemäßen Verfahren (unten). Spektren im Bereich von 240 bis 300 nm wurden am Säulenausgang vom Eluat aufgenommen und anhand dessen die Konzentration der einzelnen im Eluat vorhandenen Proteine berechnet. Fig. 7: Proteinzusammensetzung der Lysozym/BSA und BSA/HSA Kalibrierungssets.
Fig. 8: Vorhersagefähigkeit des auf PLS-Regression basierenden Modells für das
Lysozym/BSA-System als Funktion der Anzahl der in dem Modell enthaltenen latenten Variablen.
Fig. 9 Vorhergesagte Proteinkonzentrationen als Funktion der nominellen Proteinkonzentrationen für Lysozym und BSA. Die Daten wurden vor der PLS-Regression nicht aufbereitet. Das Modell basierte auf drei latenten
Variablen. Eine die ideale Korrelation symbolisierende Gerade ist gezeigt.
Fig. 10 Vorhersagefähigkeit des auf PLS-Regression basierenden Modells für das Lysozym/BSA-System als Funktion der Anzahl der in dem Modell enthaltenen latenten Variablen. Die Daten wurden vor Erstellen des Modells durch Zentrierung auf den Mittelwert aufbereitet.
Fig. 11 Vorhergesagte Proteinkonzentrationen als Funktion der nominellen Proteinkonzentrationen für Lysozym und BSA. Die Daten wurden vor der PLS-Regression durch Zentrierung auf den Mittelwert aufbereitet. Das
Modell basierte auf zwei latenten Variablen. Eine die ideale Korrelation symbolisierende Gerade ist gezeigt.
Fig. 12 Vorhersagefähigkeit des auf PLS-Regression basierenden Modells für das HSA/BSA-System als Funktion der Anzahl der in dem Modell enthaltenen latenten Variablen. Die Daten wurden vor Erstellen des Modells durch Zentrierung auf den Mittelwert aufbereitet.
Fig. 13 Vorhergesagte Proteinkonzentrationen als Funktion der nominellen Proteinkonzentrationen für HSA und BSA. Die Daten wurden vor der PLS-
Regression durch Zentrierung auf den Mittelwert aufbereitet. Das Modell basierte auf zwei latenten Variablen. Eine die ideale Korrelation symbolisierende Gerade ist gezeigt. Fig. 14 UV-Absorptionsspektren im mittleren UV-Bereich von deamidiertem und nicht-deamidiertem Aspart. Die Spektren wurden mit einer Auflösung von 1 nm gemessen. Fig. 15 Ein zwei-faktorielles Doehlert-Design wurde verwendet, um die Zusammensetzung der Kalibrierungsproben zu erstellen. Sieben daraus resultierende verschiedene Zusammensetzungen sind gezeigt. Der Mittelwert wurde dreifach erstellt. Fig. 16 Vorhergesagte Proteinkonzentration als Funktion der nominellen Proteinkonzentration für deamidiertes und nicht-deamidiertes Aspart. Die hellgrauen größeren Punkte repräsentieren die Vorhersagen aus den Kreuzvalidierungen, die kleineren schwarzen Punkte die aus den Testproben. Eine die ideale Korrelation symbolisierende Gerade ist gezeigt.
Die vorliegende Erfindung wird anhand der folgenden nicht-einschränkenden Beispiele näher erläutert.
Material und Methoden
Verbrauchsmaterialien
Probenvorbereitung: 96-well Platten mit flachem Boden, volumetrische Kapazität 2 ml, Polypropylen (VWR, Deutschland). Messung von UV-Spektren im mittleren Bereich: 96-well UV-Mikrotiterplatten mit flachem Boden, volumetrische Kapazität 360 μΙ, Polystyrol (Greiner, Deutschland). Chromatographie: Mit 200 μΙ Harz für die Kationenaustauschchromatographie befüllte RoboColumns®. Die folgenden Harze wurden verwendet: CM Ceramic HyperD® F, Toyopearl® SP 650 M, SP Sepharose® FF und Fractogel® EMDSO3 (Atoll, Deutschland).
Modellproteine
Modellproteine waren Lysozym (lys) aus Hühnereiweiß, Cytochrom C (cytC) aus Pferdeherzen, Ribonuclease A (ribA) aus bovinem Pankreas, bovines Serumalbumin (BSA) und humanes Serumalbumin (HSA) (alle Sigma-Aldrich, Deutschland). Pipettierstation
Die Herstellung der Kalibrierungs- und Testproben für das Kalibrierungsmodell, sowie die chromatographischen Experimente wurden automatisiert auf einer Tecan Freedom Evo® 200 Pipettierstation (Tecan, Crailsheim, Deutschland) durchgeführt. Um das Durchführen von Säulenchromatographie auf der Pipettierstation zu ermöglichen, wurde ein Te-Chrom® Säulenträger (Tecan, Crailsheim, Deutschland) installiert. Weiter wurde die Pipettierstation mit einem Infinite 200 Plattenleser (Tecan, Crailsheim, Deutschland) ausgerüstet, um UV-Spektren im mittleren UV- Bereich der hergestellten Kalibrierungs- und Testproben, sowie der chromatographischen Fraktionen zu messen.
Software
Für das Design der Probenzusammensetzung für das Kalibrierungsmodell und für die Testproben, die zur Evaluierung des Kalibrierungsmodells verwendet wurden, wurde die Software MODDE® (Umetrics, Umea, Schweden) verwendet. Die Pipettierstation wurde mit EVOware 2.0 (Tecan, Crailsheim, Deutschland) betrieben. Die zu importierenden Werte für die zu pipettierenden Volumina und die zu exportierenden Spektraldaten wurden mit Microsoft Excel verwaltet (Microsoft, Redmond, USA). Um die Kalibrierungsmodelle der verschiedenen Proteingemische zu erstellen, und um die unbekannten Proteinkonzentrationen in den Chromatographieproben vorherzusagen, wurde das auf MATLAB basierende Paket PLS Toolbox (EigenVector, USA) verwendet.
Probenvorbereitung und Aufnehmen der Spektren
Die Kalibrierungs- und Testproben wurden aus Stammlösungen, die 2,1 mg/ml Protein in einem Natriumphosphatpuffer bei pH 7 enthielten, hergestellt. Die Proben wurden in 96-well Platten in einem Volumen von 2 ml hergestellt. Für die Messung der UV-Absorptionsspektren wurden 150 μΙ der Proben in UV-transparente 96-well UV-Mikrotiterplatten mit flachem Boden überführt. Die Absorptionsspektren wurden mit einer Auflösung von 1 nm im Bereich von 240 nm bis 295 nm mit Hilfe eines Lambda 35 UV-Detektors (Perkin Elmer, Deutschland) oder dem Infinite 200 Plattenleser (Tecan, Crailsheim, Deutschland) gemessen. Erstellen des multivariaten Kalibrierungsmodells
Für das ternäre Proteingemisch lys/cytC/ribA basierten die Kalibrierungsproben auf einem D-optimalen Zwiebel-Design mit vier Ebenen. Dies führte zu 19 Mischungsverhältnissen (vgl. Fig. 3a) der drei Komponenten und insgesamt 28 Proben einschließlich dreier Mittelpunkte (alle drei Komponenten bei halbmaximaler Konzentration in einer Probe). Weiter wurden drei Proben zu dem Kalibrierungsset hinzugefügt, die jeweils 0,05 mg/ml eines der drei Proteine enthielten. Insgesamt basierte das Kalibrierungsmodell somit auf 31 Proben. Fig. 3b zeigt die Zusammensetzung der Kalibrierungsproben für lys und ribA. Die Testproben basierten auf einem D-optimalen Zwiebel-Design mit drei Ebenen. Sowohl die Kalibrierungsproben, als auch die Testproben wurden aus den selben Protein- Stammlösungen hergestellt. In der Software PLS Toolbox wird per Voreinstellung eine automatische Skalierung für das Aufbereiten der Daten verwendet. Eine solche Skalierung ist nur dann sinnvoll, wenn Datensätze aus Variablen verschiedener Skalierung und Verteilung bestehen, die notwendigerweise transformiert werden müssen. Wird die automatische Skalierung auf spektrale Daten angewendet, können nützliche Informationen verloren gehen. Daher sollte die automatische Skalierung nicht verwendet werden. Statt dessen wurden die Daten durch Zentrierung am Mittelwert aufbereitet. Nach Aufbereitung der Daten wurde ein Kalibrierungsmodell für alle drei Proteine erstellt. Das Modell wurde mit drei latenten Variablen erstellt und mit fünf zufälligen Subsets kreuzvalidiert. Um die Vorhersagefähigkeit des Modells zu gewährleisten, wurde es an einem unabhängigen Probensatz getestet. Die Kalibrierungsmodelle für die binären Proteinsysteme wurden in analoger Weise wie in den entsprechenden Beispielen beschrieben erstellt.
Chroma tographie
Ein 5 mg/ml jedes Modellproteins enthaltendes Proteingemisch wurde in einem 20 mM Natriumphosphat-Puffer (pH 7) hergestellt. Alle Säulen wurden mit 5 Säulenvolumina (column volume, CV) (1 CV = 200 μΙ) des Ladepuffers äquilibriert, bevor sie mit 50 μΙ der Proteinlösung, entsprechend 0,25 mg jedes Proteins, beladen wurden. Die Proteine wurden von der Säule mit einem Natriumchlorid-Gradienten von 0 bis 500 mM über 24 CV eluiert. Gerätebedingt wurde dabei ein schrittweiser Gradient mit einem Anstieg der Salzkonzentration von 20,83 mM pro CV verwendet. Jeder Schritt des Gradienten hatte ein Volumen von 200 μΙ und wurde als eine Fraktion gesammelt und analysiert. Nach der vollständigen Elution wurden 150 μΙ jeder eluierten Fraktion in frische 96-well Platten überführt und die UV- Absorptionsspektren gemessen. Deamidierung von Aspart
Das humane Insulin-Analogon Aspart (Novo Nordisk, Dänemark) wurde in Form von Aspart API bereitgestellt. Für die Deamidierung wurde Aspart für 16 Tage bei 45°C in einem Natriumphosphatpuffer (pH 7,4) inkubiert. Die Lösung wurde alle 24 Stunden durch einen Spritzenfilter (0,2 μηι) filtriert, um bakterieller Kontamination vorzubeugen.
Beispiel 1 :
UV-Absorptionsspektren der drei Modellproteine lys, cvtC und ribA
Aufgrund der verschiedenen Verhältnisse der aromatischen Aminosäurereste, die in einem bestimmten Protein vorhanden sind, unterscheiden sich die Intensität und die Form der entsprechenden UV-Absorptionsspektren verschiedener Proteine leicht voneinander. Fig. 2a zeigt die UV-Absorptionsspektren der drei Modellproteine lys, cytC und ribA. Diese Proteine stellen ein günstiges Modellsystem dar, da sie aufgrund ihrer unterschiedlichen isoelektrischen Punkte leicht chromatographisch voneinander getrennt werden können.
Das UV-Absorptionsspektrum von lys unterscheidet sich klar von denen der anderen beiden Proteine. Dagegen erscheinen die UV-Absorptionsspektren von cytC und ribA sehr ähnlich in ihrer Form und scheinen sich nur in ihrer Intensität zu unterscheiden. Um zu zeigen, daß sich die Spektren der beiden Proteine tatsächlich auch in ihrer Form unterscheiden, wurden fünf Proben mit unterschiedlichen Mischungsverhältnissen der beiden Proteine hergestellt und die entsprechenden UV- Absorptionsspektren verglichen. Fig. 2 zeigt die rohen Spektren (Fig. 2b), Spektren die basierend auf der Absorption bei 280 nm übereinandergelegt wurden (Fig. 2c) und Differenz-Spektren, die auf den übereinandergelegten Spektren basieren (Fig. 2d). Die Differenz-Spektren zeigen klar, daß sich die Spektren von Cytochrom C und Ribonuclease A auch in ihrer Form unterscheiden. Beispiel 2:
Multivariates Kalibrierunqsmodell für das lys, cytC, ribA System
Die Unterschiede in den UV-Absorptionsspektren der drei Modellproteine wurden verwendet, um multivariate Kalibrierungsmodelle mit der Fähigkeit, spezifische Proteinkonzentrationen vorherzusagen, zu erstellen. Um PLS-Regression im Vergleich zu MLR zu testen, wurden Kalibrierungsmodelle mit beiden Ansätzen erstellt. Weiter wurde der Einfluß der Datenaufbereitung, hier Zentrierung auf den Mittelwert, untersucht. In allen vier Modellen wurden die Konzentrationen der drei Proteine ko-kalibriert. Ein unabhängiger Probensatz wurde verwendet, um die tatsächliche Vorhersagefähigkeit der Modelle zu testen. Die PLS-Modelle basierten auf drei Komponenten. Tabelle 1 zeigt die Bestimmungskoeffizienten (R2-Werte) für jedes, jeweils mit den vier verschiedenen Ansätzen kalibrierte Protein. Die Ergebnisse der Kreuzvalidierung (cross Validation, cv), wie auch die Vorhersagen der Testsets (test) sind gezeigt.
Tabelle 1 : Bestimmungskoeffizienten aller Kreuzvalidierungen und der vorhergesagten Testdaten
Figure imgf000022_0001
Die besten Ergebnisse wurden mit PLS-Regression, basierend auf mittelwertzentrierten Daten, erhalten. Dieses Modell lieferte R2-Werte über 0,99 für alle Proteine. Eine Zentrierung auf den Mittelwert war dabei entscheidend für das PLS-Modell, nachdem die Vorhersagefähigkeit von Kalibrierungsmodellen, die auf rohen Spektraldaten basierten, wesentlich niedriger war. Charakteristisch für die MLR-Modelle sind R2-Werte von 1 ,0 bei der Kreuzvalidierung. Aufgrund der hohen Anzahl an Variablen im Vergleich zur PLS-Regression, auf denen diese Modelle basieren (MLR: 60 Variablen; PLS: 3 Variablen), können die MLR-Modelle angepaßt werden, um die exakten Konzentrationen in den Kalibrierungsdatensätzen unabhängig von der Datenaufbereitung vorherzusagen. Diese Fähigkeit zur fehlerfreien Vorhersage trifft allerdings nur auf die Kalibrierungsdatensätze zu.
Für alle Testproben wurden absolute (mg/ml) und relative (%) Abweichungen von den Vorhersagen, die das PLS-Modell basierend auf mittelwertszentrierten Daten lieferte, berechnet. Figur 4 zeigt diese Abweichungen als Funktion der nominellen Konzentrationen für jede Probe und jedes Protein. Über den kalibrierten Bereich von 0,0 bis 0,7 mg/ml war der absolute Vorhersagefehler für lys und cytC in Bereich von ± 0,025 mg/ml und für ribA im Bereich von ± 0,05 mg/ml. Die größeren Abweichungen bei ribA waren dabei vermutlich auf die geringe Intensität der UV- Absorptionsspektren von ribA zurückzuführen.
Beispiel 3:
Anwendung des erfindunqsqemäßen Verfahrens bei der Säulenchromatographie
Die Anwendbarkeit des erfindungsgemäßen Verfahrens wurde anhand säulenchromatographischer Trennungen der drei Modellproteine untersucht. Die Trennungen wurden automatisiert auf einer Pipettierstation durchgeführt. Dabei wurden vier verschiedene Kationentauscher-Materialien verwendet, und die Elution mit dem gleichen Salzgradienten für jede Säule durchgeführt. Die resultierenden Chromatogramme sind in Fig. 5 gezeigt, wobei für jedes Harz zwei Plots gezeigt sind, zum einen die gesamte UV-Absorption der gesammelten Fraktionen bei 280 nm und 526 nm gegen das Elutionsvolumen und zum anderen die Konzentrationen der einzelnen Proteine gegen das Elutionsvolumen, wie von dem Kalibrierungsmodell vorhergesagt. Die vier Trennungen repräsentieren vier häufige Szenarien in der Trennung von Proteinen, nämlich Co-Elution aller drei Proteine (Fig. 5a), Trennung aller drei Proteine (Fig. 5b), Co-Elution der ersten beiden Proteine (Fig. 5c) und Co-Elution der letzten beiden Proteine (Fig. 5d). Eine Gegenüberstellung eines Chromatogramms, das durch herkömmliche UV- Absorptionsmessung bei 280 nm erstellt wurde, und eines Chromatogramms, das die mit dem erfindungsgemäßen Verfahren berechneten Konzentrationen der einzelnen Proteine zeigt, ist in Fig. 6 dargestellt. Beispiel 4:
Kalibrierunqsmodell für BSA/Ivs
UV-Absorptionsspektren für das binäre Proteinsystem BSA (bovines Serumalbumin)/Iys wurden aufgenommen. Die Proben wurden jeweils entsprechend den in Fig. 7 dargestellten Proteinkonzentrationen erzeugt. Kalibrierungsmodelle wurden aus den aufgenommenen Spektren mit der Software PLS Toolbox erstellt.
Zunächst wurden Kalibrierungsmodelle ohne vorherige Datenaufbereitung erstellt. Fig. 8 zeigt den quadratischen Mittelwert des Fehlers der Kalibrierung und der
Kreuzvalidierung (root mean Square error of calibration/cross Validation;
RMSEC/RMSECV) als Funktion der in dem Modell enthaltenen latenten Variablen.
Entsprechend diesen Daten wurde ein auf drei latenten Variablen basierendes
Modell gewählt. Fig. 9 zeigt die vorhergesagten Proteinkonzentrationen als Funktion der nominellen Proteinkonzentrationen jeweils für Lysozym und BSA. Die
Bestimmungskoeffizienten (R2-Werte) der Kalibrierungsmodelle waren 0,997 für
Lysozym und 0,990 für BSA.
Weitere Kalibrierungsmodelle wurden mit den selben Daten des BSA/lys-Systems erstellt, allerdings wurden die Daten vorab durch Zentrierung auf den Mittelwert aufbereitet. Basierend auf den in Fig. 10 gezeigten RMSEC- und RMSECV-Werten in Abhängigkeit der Zahl der in dem Modell enthaltenen latenten Variablen wurden Modelle mit zwei latenten Variablen ausgewählt. Fig. 11 zeigt die vorhergesagten Proteinkonzentrationen als Funktion der nominellen Proteinkonzentrationen jeweils für Lysozym und BSA. Die Bestimmungskoeffizienten (R2-Werte) der Kalibrierungsmodelle waren 0,999 für Lysozym und 0,997 für BSA. Obwohl die Modelle mit mittelwertszentrierten Daten auf weniger latenten Variablen basierten, lieferten diese somit eine höhere Korrelation.
Beispiel 5:
Kalibrierunqsmodell für BSA/HSA
UV-Absorptionsspektren für das binäre Proteinsystem BSA/HSA (humanes Serumalbumin) wurden aufgenommen, um die Kalibrierung von strukturell ähnlicheren Proteinen zu testen. Die Proben wurden jeweils entsprechend den in Fig. 7 dargestellten Proteinkonzentrationen erzeugt. Kalibrierungsmodelle wurden aus den aufgenommenen Spektren mit der Software PLS Toolbox erstellt.
Für das Erstellen der Kalibrierungsmodelle wurden die Daten vorab mittelwertszentriert. Basierend auf den in Fig. 12 gezeigten RMSEC- und RMSECV- Werten in Abhängigkeit der Zahl der in dem Modell enthaltenen latenten Variablen wurden Modelle mit drei latenten Variablen ausgewählt. Fig. 13 zeigt die vorhergesagten Proteinkonzentrationen als Funktion der nominellen Proteinkonzentrationen jeweils für BSA und HSA. Trotz der großen Ähnlichkeit der beiden Proteine hatte das Modell eine hohe Vorhersagefähigkeit. Die Bestimmungskoeffizienten (R2-Werte) des Kalibrierungsmodells waren 0,988 für HSA und 0,986 für BSA.
Beispiel 6:
Kalibrierunqsmodell für deamidiertes/nicht-deamidiertes Aspart Um die Grenzen des Auflösungsvermögens des erfindungsgemäßen Verfahrens auszuloten, wurde die Kalibrierung von zwei extrem ähnlichen Proteinen, nämlich dem humanen Insulin-Analogon Aspart in deamidierter und nicht-deamidierter Form getestet. Mögliche Unterschiede in den UV-Absorptionsspektren dieser Proteine sollten, wenn überhaupt detektierbar, äußerst klein sein.
Fig. 14 zeigt die UV-Absorptionsspektren beider Proteine. Wie erwartet sind sich die Spektren in Form und Intensität sehr ähnlich, wobei geringfügige Unterschiede festgestellt werden konnten. Um zu prüfen, ob diese Unterschiede ausreichen, um ein stabiles Kalibrierungsmodell zu erstellen, wurden Proben für eine Kalibrierung zubereitet. Fig. 15 zeigt die Proteinkonzentrationen der neun zubereiteten Proben. Ihre Zusammensetzung basiert auf einem zwei-faktoriellen Doehlert-Design mit einem dreifachen Mittelwert.
Das auf PLS basierende Kalibrierungsmodell wurde mit zwei latenten Variablen erstellt. Die PLS-Regression wurde mit Kreuzvalidierungen durchgeführt, wobei jede Probe einmal weggelassen und von dem Kalibrierungsmodell, basierend auf den restlichen Proben, vorhergesagt wurde. Fig. 16 zeigt die Vorhersagen der Krauzvalidierungen, die während des Erstellens des Modells gemacht wurden, sowie die Vorhersagen der Testproben. Die Bestimmungskoeffizienten wurden für die Vorhersagen der Kreuzvalidierungen berechnet, wobei diese auf die Gerade idealer Korrelation bezogen wurden und nicht auf die am besten zu den vorhandenen Datenpunkten passende Gerade. Die entsprechenden Werte waren 0,77 für deamidiertes und 0,88 für nicht-deamidiertes Aspart. Diese Werte waren nicht so hoch wie für die anderen Testsysteme (s.o.). Angesichts der marginalen Unterschiede zwischen beiden Proteinen (vgl. Fig. 14), wurde gemäß der vorliegenden Anmeldung jedoch erkannt, daß eine Kalibrierung überhaupt möglich ist.

Claims

Ansprüche
Verfahren zur selektiven Quantifizierung einzelner Proteine in einem Proteingemisch, umfassend die Schritte:
(a) Erstellen mindestens eines UV-Absorptionsspektrums des Proteingemisches, und
(b) Bestimmen der Einzelkonzentration zumindest eines Proteins in dem Proteingemisch aus dem in Schritt (a) erstellten UV-Absorptionsspektrum.
Verfahren nach Anspruch 1 , wobei das Bestimmen der Einzelkonzentration(en) in Schritt (b) rechnerisch erfolgt, insbesondere mit Hilfe eines muitivariaten Kalibrierungsmodells durchgeführt wird.
Verfahren nach Anspruch 2, wobei das multivariate Kalibrierungsmodell auf Grundlage von UV-Absorptionsspektren von Kalibrierungsproben erstellt wird, die bekannte Proteine in bekannten Konzentrationen enthalten.
Verfahren nach Anspruch 2 oder 3, wobei aus den UV-Absorptionsspektren der jeweils nur ein Protein in bekannter Konzentration enthaltenden Kalibrierungsproben durch Linearkombinationen Mischspektren erzeugt werden, die für die Erstellung des muitivariaten Kalibrierungsmodells verwendet werden.
Verfahren nach einem der Ansprüche 2 bis 4, wobei das multivariate Kalibrierungsmodell mit Hilfe eines statistischen Verfahrens zur muitivariaten Kalibrierung erstellt wird.
Verfahren nach Anspruch 5, wobei das statistische Verfahren zur muitivariaten Kalibrierung aus der Gruppe, bestehend aus Multivariate Curve Resolution (MCR), partial least Square (PLS)-Regression und Multilinearer Regression (MLR) ausgewählt ist.
7. Verfahren nach einem der vorangehenden Ansprüche, wobei mindestens vier UV-Absorptionsspektren pro Sekunde erstellt werden.
8. Verfahren nach einem der vorangehenden Ansprüche, wobei das Proteingemisch N verschiedene Proteine umfaßt, wobei N eine natürliche Zahl und bevorzugt N > 2 ist.
9. Verfahren nach einem der Ansprüche 2 bis 8, wobei das Proteingemisch kein dem multivariaten Kalibrierungsmodell unbekanntes Protein enthält.
10. Verfahren nach einem der vorangehenden Ansprüche, wobei das UV- Absorptionsspektrum ein kontinuierliches Spektrum ist, vorzugsweise in einem Wellenlängenbereich zwischen 240 und 300 nm.
11. System zur selektiven Quantifizierung einzelner Proteine in einem Proteingemisch, umfassend:
(a) Mittel für eine säulenchromatographische Trennung eines Proteingemisches,
(b) einen Detektor, insbesondere einen Dioden-basierten UV-Detektor, der am Säulenausgang angeordnet ist, und
(c) Mittel für die automatische Verarbeitung der von dem Detektor erstellten UV-Absorptionsspektren und die Bestimmung der Konzentration der einzelnen Proteine in dem Proteingemisch aus diesen UV- Absorptionsspektren mit Hilfe eines multivariaten Kalibrierungsmodells und eines geeigneten statistischen Verfahrens.
12. System zur selektiven Quantifizierung einzelner Proteine in Proteingemischen, umfassend:
(a) Mittel für die automatisierte Handhabung von Multi-Well-Platten, welche die Proteingemische enthalten,
(b) einen Detektor, insbesondere einen Dioden-basierten UV-Detektor, der oberhalb oder unterhalb der Multi-Well-Platte angeordnet ist, und
(c) Mittel für die automatische Verarbeitung der von dem Detektor erstellten UV-Absorptionsspektren und die Bestimmung der Konzentration der einzelnen Proteine in den Proteingemischen aus diesen UV- Absorptionsspektren mit Hilfe eines multivariaten Kalibrierungsmodells und eines geeigneten statistischen Verfahrens.
PCT/EP2011/004687 2010-10-04 2011-09-20 Selektive proteinquantifizierung mittels multivariater auswertung von uv-absorptionsspektren WO2012045396A2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102010047427.4 2010-10-04
DE201010047427 DE102010047427A1 (de) 2010-10-04 2010-10-04 Selektive Proteinquantifizierung mittels multivariater Auswertung von UV-Absorptionsspektren

Publications (2)

Publication Number Publication Date
WO2012045396A2 true WO2012045396A2 (de) 2012-04-12
WO2012045396A3 WO2012045396A3 (de) 2012-08-23

Family

ID=45808714

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2011/004687 WO2012045396A2 (de) 2010-10-04 2011-09-20 Selektive proteinquantifizierung mittels multivariater auswertung von uv-absorptionsspektren

Country Status (2)

Country Link
DE (1) DE102010047427A1 (de)
WO (1) WO2012045396A2 (de)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018227338A1 (zh) * 2017-06-12 2018-12-20 深圳前海达闼云端智能科技有限公司 物质成分检测方法、装置和检测设备
EP3243073B1 (de) 2015-11-26 2019-03-13 Karlsruher Institut für Technologie Verfahren zur steuerung kontinuierlicher chromatographie und multisäulen-chromatographie-anordnung
CN113984692A (zh) * 2021-11-01 2022-01-28 武汉轻工大学 鸡蛋综合品质无损检测方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69418450T2 (de) * 1993-10-07 1999-09-16 Beckman Coulter, Inc. Verwendung von kapillarer elektroforese zur quantitativen bestimmung von proteinkomponenten und des gesamten proteingehaltes in flussigkeiten
CA2708585A1 (en) * 2007-12-10 2009-06-18 Novartis Ag Analysis of mixtures including proteins

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
None

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3243073B1 (de) 2015-11-26 2019-03-13 Karlsruher Institut für Technologie Verfahren zur steuerung kontinuierlicher chromatographie und multisäulen-chromatographie-anordnung
WO2018227338A1 (zh) * 2017-06-12 2018-12-20 深圳前海达闼云端智能科技有限公司 物质成分检测方法、装置和检测设备
US11468264B2 (en) 2017-06-12 2022-10-11 Beijing Cloudoptek Technology Co., Ltd. Substance ingredient detection method and apparatus, and detection device
CN113984692A (zh) * 2021-11-01 2022-01-28 武汉轻工大学 鸡蛋综合品质无损检测方法及装置

Also Published As

Publication number Publication date
DE102010047427A1 (de) 2012-04-05
WO2012045396A3 (de) 2012-08-23

Similar Documents

Publication Publication Date Title
EP1354189B1 (de) Schnelltest für biologische substanzen mittels ftir
EP1846757B1 (de) Verfahren und system zur massenspektrenanalyse
DE69720505T2 (de) Verfahren und vorrichtung zur identifizierung und charakterisierung von biomolekuelen
DE69301310T2 (de) Verfahren zur bestimmung von harnstoff in milch
DE10392707B4 (de) Verfahren zur Verwendung von Datenbinning bei der Analyse von Chromatographie-/Spektrometriedaten
DE69419192T2 (de) Methode zur Bestimmung von Hämoglobinaddukten
EP1397669B1 (de) Vorrichtung und verfahren zur stabilitätsbestimmung von substanzen und formulierungen
DE102018122961A1 (de) Chromatographische datensystemverarbeitungseinrichtung
EP0695805A2 (de) Verfahren zur Analyse einer medizinischen Probe unter Vermeidung von Störbeiträgen aufgrund von Hämolyse
DE602004010154T2 (de) Verfahren zur bestimmung der auswirkung eines aus mehreren komponenten bestehenden naturproduktgemischs auf das biologische profil einer krankheit in einer gruppe lebender systeme sowie entwicklung und qualitätskontrolle von medizin auf naturproduktbasis
WO1997000969A1 (de) Verfahren und vorrichtung zur bestimmung der aktivität von enzymen in flüssigkeiten, beziehungsweise der konzentration und/oder aktivität von inhibitoren in flüssigkeiten
WO2008107476A1 (de) Verfahren zur normierung der konzentration von analyten in einer urinprobe
WO2002033400A1 (de) Verfahren zur charakterisierung, identifizierung und kennzeichnung von mikrobiellen mischungen durch vergleich von ir-, ft-ir-, raman-, ft-raman- und gc-analysedaten mit daten aus einer referenzdatenbank
WO2012045396A2 (de) Selektive proteinquantifizierung mittels multivariater auswertung von uv-absorptionsspektren
WO2002101384A2 (de) Verfahren und vorrichtung zur automatischen, optimierten durchführung chromatographischer analysen
EP0993609B1 (de) Verfahren zur bestimmung der anzahl von komponenten in peaks, banden und signalen von chromatogrammen, elektrogrammen und spektrogrammen aller art
WO2018166546A1 (de) Verfahren zur chromatografischen quantitativen bestimmung der aminosäuren valin, methionin, allo-isoleucin, isoleucin, leucin, tyrosin und phenylalanin im blutplasma
DE102011117320A1 (de) Vorrichtung und Verfahren zum Nachweis von in biologischen oder chemischen Proben vorliegenden Substanzen
DE102014106918A1 (de) Verfahren und Vorrichtung zur automatisierten Durchführung von affinitätsbasierten Assays
DE102005001362A1 (de) Verfahren und Vorrichtung zur Quantifizierung von Proteinen
EP2771697B1 (de) Vorrichtung und verfahren zum nachweis von in biologischen oder chemischen proben vorliegenden substanzen
DE10233022B4 (de) Verfahren zur Lösung von Aufgaben der adaptiven Chemie
DE102019218593B4 (de) Normierungsverfahren und Normierungssystem für eine Trockenblutmatrix
DE102011117311A1 (de) Vorrichtung und Verfahren zum Nachweis von in biologischen oder chemischen Proben vorliegenden Substanzen
EP2771672B1 (de) Vorrichtung und verfahren zum nachweis von in biologischen oder chemischen proben vorliegenden substanzen

Legal Events

Date Code Title Description
NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2011822843

Country of ref document: EP

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 11822843

Country of ref document: EP

Kind code of ref document: A2

122 Ep: pct application non-entry in european phase

Ref document number: 11822843

Country of ref document: EP

Kind code of ref document: A2