WO2009115478A2 - Verfahren zur in vitro erfassung und unterscheidung von pathophysiologischen zuständen - Google Patents

Verfahren zur in vitro erfassung und unterscheidung von pathophysiologischen zuständen Download PDF

Info

Publication number
WO2009115478A2
WO2009115478A2 PCT/EP2009/053042 EP2009053042W WO2009115478A2 WO 2009115478 A2 WO2009115478 A2 WO 2009115478A2 EP 2009053042 W EP2009053042 W EP 2009053042W WO 2009115478 A2 WO2009115478 A2 WO 2009115478A2
Authority
WO
WIPO (PCT)
Prior art keywords
sepsis
gene
patients
infection
patient
Prior art date
Application number
PCT/EP2009/053042
Other languages
English (en)
French (fr)
Other versions
WO2009115478A3 (de
Inventor
Stefan Russwurm
Original Assignee
Sirs-Lab Gmbh
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sirs-Lab Gmbh filed Critical Sirs-Lab Gmbh
Priority to JP2011500171A priority Critical patent/JP2011517401A/ja
Priority to CA2718741A priority patent/CA2718741A1/en
Priority to GB201017326A priority patent/GB2470707C/en
Priority to US12/933,169 priority patent/US8765371B2/en
Publication of WO2009115478A2 publication Critical patent/WO2009115478A2/de
Publication of WO2009115478A3 publication Critical patent/WO2009115478A3/de

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/178Oligonucleotides characterized by their use miRNA, siRNA or ncRNA

Definitions

  • the present invention relates to a method for the in vitro detection and / or differentiation and / or course monitoring of pathophysiological conditions according to claim 1, the use of a plurality of polynucleotides and / or their gene loci and / or their transcripts to form at least one multigene biomarker for the production of a multiplex Assays according to claim 4; the use of at least one polynucleotide and / or their gene loci and / or their transcripts for the production of an assay according to claim 11, as well as a kit for carrying out the method according to claim 14.
  • the present invention relates to the use of polynucleotides for detecting gene activities of at least one multigene biomarker, for the preparation of an adjunct for diagnosis in patients with certain pathophysiological conditions, such as sepsis and sepsis-like conditions, having similar features to an "In Vitro Diagnostic Multivariate Index Assay "(IVDMIA).
  • IVDMIA Intelligent Multivariate Index Assay
  • Sepsis blood poisoning
  • blood poisoning is a life-threatening infection that affects the entire organism, is associated with high mortality, is becoming more prevalent and affects people of all ages.
  • the mortality rate of severe sepsis has not improved significantly in recent decades, with the last two breakthroughs in innovation since the introduction of blood culture (around 1880) being the introduction of antibiotics over 60 years ago and the onset of intensive care about 50 years ago.
  • novel diagnostic agents must be made available.
  • Sepsis is caused by infectious agents. As there is currently no specific therapy for sepsis, the success of the treatment largely depends on the successful control of the underlying infection and the quality of the intensive care treatment. Crucial for survival is the early administration of an antibiotic that also successfully combats the causative agent [Kumar et. al., 2006]. However, deficits in sepsis diagnostics delay the initiation of therapy and the choice of a suitable antibiotic. Since the identification of sepsis with the current methods of blood culture only succeed in less than 25% of sepsis cases and the findings in the case of pathogen detection after 2-3 days, the initial choice of antibiotic or antimycotic (anti-fungal substances) must " calculated on suspicion, in 20-30% of cases this choice is not correct.
  • the present invention relates to genes and / or fragments thereof and their use for generating multigene biomarkers which are specific to a condition and / or investigation.
  • the invention further relates to marker primers derived PCR primers and probes for hybridization or duplication methods.
  • Sepsis is still one of the most difficult clinical pictures in modern intensive care, with not only the therapy but also the diagnosis being a challenge for the clinician.
  • generalized inflammatory conditions such as SIRS and sepsis are very common in patients in intensive care units and contribute significantly to mortality [Marshai et al., 2003; Alberti et al., 2003].
  • the mortality is about 20% in SIRS, about 40% in sepsis and increases in development of multiple organ dysfunction up to 70-80% [Brun-Buisson et al., 1995; LeGalII et al., 1995; Brun-Buisson et al., 2003].
  • SIRS and sepsis are of interdisciplinary clinical-medical importance, as it increasingly the treatment successes of the most advanced therapeutic procedures numerous medical specialties (eg traumatology, neurosurgery, heart / lung surgery, visceral surgery, transplantation medicine, hematology / oncology, etc. ), which are all, without exception, at risk of SIRS and sepsis.
  • medical specialties eg traumatology, neurosurgery, heart / lung surgery, visceral surgery, transplantation medicine, hematology / oncology, etc.
  • This is also reflected in the continuous increase in the frequency of sepsis: between 1979 and 1987, there was an increase of 139%, from 73.6 to 176 cases per 100,000 hospital patients [MMWR Morb Mortal WkIy Rep 1990].
  • SIRS systemic inflammatory response syndrome
  • SIRS systemic inflammatory response syndrome
  • Sepsis severe sepsis
  • septic shock a distinction is made between the clinically defined severity levels “systemic inflammatory response syndrome” (SIRS), "sepsis”, “severe sepsis” and “septic shock.”
  • SIRS is the systemic response of the inflammatory system to a non-infectious stimulus
  • at least two of the following clinical criteria must be met: fever> 38 ° C or hypothermia ⁇ 36 ° C, leukocytosis> 12g / l or leukopenia ⁇ 4g / l or left shift in the differential blood count, heart rate above 90 / min, a tachypnoea> 20 breaths / min or a PaCO 2 (partial pressure of carbon dioxide in the arterial blood) ⁇ 4.3 kPa.
  • This Definit ion has a high sensitivity but low specificity. For intensive medical care, it is of little help
  • Sepsis is defined as those clinical conditions in which the SIRS criteria are fulfilled and the cause of an infection is proven or at least very probable.
  • Infection is defined as a pathological process caused by invasion of pathogens or potentially pathogenic organisms into a normally sterile tissue. If the body fails to limit this infection to the site of origin, the pathogens or their toxins induce inflammation in the organs or tissues of the body remote from the site of infection. Immediate intensive care treatment, the targeted administration of antibiotics and the surgical rehabilitation of the infectious focus are needed to achieve recovery. Severe sepsis is characterized by the additional occurrence of organ dysfunctions.
  • Common organ dysfunctions are changes in the state of consciousness, an oliguria, a Lactic acidosis or sepsis-induced hypotension with a systolic blood pressure of less than 90 mmHg or a pressure drop of more than 40 mmHg from baseline. If such hypotension can not be cured by the administration of crystalloids and / or colloids and in addition to the catecholamine requirement of the patient, it is called a septic shock. This is detected in about 20% of all sepsis patients.
  • the first group includes score systems such as APACHE, SAPS and SIRS, which can stratify patients based on a variety of physiological indices. While some studies have shown diagnostic potential for the APACHE Il Score, other studies have demonstrated that APACHE II and SAPS II can not differentiate between sepsis and SIRS [Carrigan et al., 2004].
  • the second group contains protein markers that are detected from plasma and serum.
  • protein markers that are detected from plasma and serum.
  • protein markers include, for example, CA125, S100B, copeptin, glycine N-acyltransferase (GNAT), protachykinin and / or its fragments, aldose 1-epimerase (mutarotase), Chp, carbamoyl phosphate synthetase 1, LASP-1 (Brahms Diagnostika GmbH Germany), IL -1 Ra, MCP-1, MPIF-1, TNF-R1, MIG, BLC, HVEM, IL-15, MCP-2, M-CSF, MIP-3b, MMP-9, PARC, ST-2; IL-6, slL-2R, CD141, MMP-9, EGF, ENA-78, EOT, Gro-beta, IL-1b, leptin, MIF, MIP-1a, OSM, protein C, P-selectin, and HCC4 (Molecular St
  • PCT procalcitonin
  • CRP C-reactive protein
  • Procalcitonin is a 16 amino acid peptide that plays a role in inflammatory reactions. This marker has been increasingly used over time as a new infection marker in intensive care units [Sponholz et al., 2006]. This marker is used as an infection marker and serves to determine the severity of sepsis, with the dynamics of the values is more important than the absolute values themselves, for. To differentiate between infectious and non-infectious complication in cardiac surgery patients [Sponholz et al., 2006].
  • CRP C-reactive protein
  • PCT is considered more suitable as a CRP to differentiate non-infectious versus infectious SIRS as well as bacterial versus viral infection [Simon et al., 2004].
  • the third group contains biomarkers or profiles identified at the transcriptome level. These molecular parameters should allow a better correlation of the molecular inflammatory / immunological host response with the severity of sepsis, but also provide information on individual prognosis.
  • biomarkers are currently being searched extensively by various scientific groups and commercial organizations, such as changes in blood cytokine concentrations caused by bacterial cell wall components such as lipopolysaccharides [Mathiak et al., 2003], or use of gene expression profiles in a blood sample to determine differences in survivors and non-survivors sepsis patients [Pachot et al., 2006].
  • Gene expression profiles or classifiers are for the determination of the severity of sepsis [WO 2004/087949], the distinction between a local or systemic infection [unpublished DE 10 2007 036 678.9], the identification of the source of infection [WO 2007/124820] or gene expression signatures for the distinction between multiple etiologies and pathogen-associated signatures [Ramilo et al., 2007].
  • the currently available protein markers due to the insufficient specificity and sensitivity of the consensus criteria according to [Bone et al., 1992] the currently available protein markers, as well as due to the time required to detect the cause of the infection by blood culture, there is an urgent need for new methods that take into account the complexity of the disease.
  • Many gene expression studies that either single genes and / or combinations of Genes named as classifiers, as well as numerous descriptions of statistical methods for deriving a score and / or index [WO03084388; US6960439] belong to the state of the art.
  • MammaPrint The microarray-based, 70-gene signature called MammaPrint (Aqendia, NL) allows predicting the risk of recurrence and metastasis in women with breast cancer. It is being investigated whether the risk of developing distant metastases in the next few years could be considered high or low and that they would benefit from chemotherapy. The approval of this test by the FDA has led to the development of guidelines for a new class of diagnostic tests known as IVDMIA (in vitro diagnostic multivariate index assay). The MammaPrint signature is measured and calculated on a microarray in the manufacturer's laboratories.
  • Oncotype DX multigene assav (Genomic Health, USA) is used to assess the likelihood of breast cancer recurrence in patients and to evaluate the response of patients to chemotherapy. 21 genes are summarized as "Recurrence-Score.” The measurement takes place in the rooms of the company, it is also the TaqMan- PCR technology used.
  • the AlloMap gene expression test from XDx (USA) is used to monitor any rejection reactions in patients with heart transplantation, which show approximately 30% of patients within one year. So far, were to Diagnosis several biopsies necessary.
  • the test is based on 1 1 quantitative PCR assays (plus 9 controls and references) using the TaqMan technology (Hoffman-La Roche) in the manufacturer's premises. The sample material is blood. Already two months after the transplantation, the results are reliable and predict the absence of rejection reactions for the next 80 days.
  • a kit according to claim 14 solves the problem as well.
  • the present invention relates to a system comprising the following elements:
  • the system provides a solution to the problem of detecting disease states such as For example, the distinction between infectious and non-infectious multi-organ failure but also for other relevant applications and issues in this context.
  • the present invention relates to a method for in vitro detection and / or differentiation and / or course monitoring of pathophysiological conditions selected from the group consisting of: SIRS, sepsis and their degrees of severity; sepsis-like states; septic shock; infectious / non-infectious multi-organ failure; Survival probability in sepsis; Focus of an infection; Responder / non-responder for a given therapy; Causes of a pathophysiological condition, in particular classification of an infection according to gram-positive and / or gram-negative bacteria; the method comprising the steps of:
  • the at least one reference gene is a housekeeping gene, wherein the housekeeping gene is in particular selected from polynucleotides of the group consisting of SEQ ID NO: 676 to SEQ ID NO: 686 and / or their gene loci and / or their transcripts and / or Fragments of it.
  • RNA As polynucleotide sequences, preference is given to using gene loci, sense and / or antisense strands of pre-mRNA and / or mRNA, small RNA, in particular scRNA, snoRNA, microRNA, siRNA, dsRNA, ncRNA or transposable elements.
  • the index is preferably determined by statistical techniques such as supervised machine and static learning classification techniques such as e.g. (diagonal, linear, quadratic) discriminant analysis, super vector machines, generalized partial least squares, k-nearest neighbors, random forests, k-nearest neighbor.
  • supervised machine and static learning classification techniques such as e.g. (diagonal, linear, quadratic) discriminant analysis, super vector machines, generalized partial least squares, k-nearest neighbors, random forests, k-nearest neighbor.
  • the invention further relates to the use of a plurality of polynucleotides selected from the group consisting of SEQ ID NO: 1 to SEQ ID NO: 669 and / or their gene loci and / or their transcripts and / or fragments thereof, for the formation of at least one Multigenbiomarkers for the production of a multiplex Assays as an aid to assessing whether a patient has a pathophysiological condition and / or to determine the severity and / or the course of the pathophysiological condition.
  • the multigene biomarker is preferably a combination of a plurality of polynucleotide, in particular gene sequences, based on whose gene activities a classification is carried out by means of an interpretation function and / or an index or score is formed.
  • the gene activities are determined by enzymatic methods, in particular amplification methods, preferably polymerase chain reaction (PCR), preferably real-time PCR; and / or by means of hybridization methods, in particular those on microarrays.
  • enzymatic methods in particular amplification methods, preferably polymerase chain reaction (PCR), preferably real-time PCR; and / or by means of hybridization methods, in particular those on microarrays.
  • Differential expression signals of the polynucleotide sequences contained in the multigene biomarker may be advantageously and unambiguously assigned to a pathophysiological condition, course, and / or therapy monitoring.
  • an index is formed from the individual determined gene activities, which after appropriate calibration is a measure of the severity and / or the course of the pathophysiological state, in particular sepsis or the sepsis-like state.
  • This index or score can be displayed on an easily interpretable scale to give the treating physician a quick diagnostic tool.
  • the gene activity data obtained for the production of software for the description of at least one pathophysiological condition and / or an investigation question and / or used as aids for diagnostic purposes and / or for patient data management systems.
  • RNA small RNA, in particular scRNA, snoRNA, microRNA, siRNA, dsRNA, ncRNA or transposable elements, genes and / or gene fragments used which have a sequence homology of at least about 10%, in particular about 20%, preferably about 50%, particularly preferably about 80% to the polynucleotide sequences according to SEQ ID NO: 1 to SEQ ID NO: 669.
  • the invention further relates to the use of at least one polynucleotide selected from the group consisting of SEQ ID NO: 1 to SEQ ID NO: 152 and / or their gene loci and / or their transcripts and / or fragments thereof, for the preparation of an assay for Assessing whether a patient has a pathophysiological condition and / or assessing the severity and / or pathophysiological status.
  • the pathophysiological condition is advantageously selected from the group consisting of: SIRS, sepsis and their degrees of severity; sepsis-like states; septic shock; infectious / non-infectious multi-organ failure; local / systemic infection; Improvement / worsening of a pathophysiological condition, especially sepsis; Responder / non-responder for a given therapy; Focus of an infection; Causes of a pathophysiological condition, in particular classification according to gram-positive and / or gram-negative.
  • the sample nucleic acid is RNA, in particular total RNA or mRNA, or DNA, in particular cDNA.
  • the invention further relates to a kit for carrying out the method according to the invention, comprising at least one multigene biomarker which comprises a plurality of polynucleotide sequences which are selected from the pool of SEQ ID NO: 1 to SEQ ID NO.
  • the multigene biomarker is specific for a pathophysiological condition of a patient and such conditions which are selected from the group consisting of: SIRS, sepsis and their degrees of severity; sepsis-like states; septic shock; infectious / non-infectious multi-organ failure; Survival probability in sepsis; local / systemic infection; Responder / non-responder for a given therapy; Focus of an infection; Causes of a pathophysiological condition, in particular classification of an infection according to Gram-positive or Gram-negative pathogens.
  • the polynucleotide sequences of the kit preferably also include gene loci, sense and / or antisense strands of pre-mRNA and / or mRNA, small RNA, in particular scRNA, snoRNA, microRNA, siRNA, dsRNA, ncRNA or transposable elements.
  • the polynucleotide sequences with the SEQ IDs given in Tab. 11 and 16 are preferably used.
  • the polynucleotide sequences with the SEQ IDs given in Tab. 20 and 21 are preferably used.
  • the present invention makes it possible to assess a potential infectious complication in patients with SIRS or possible sepsis.
  • This system includes the choice of patients and the determination of their gene expression signals in an interpretable index that the physician can use as a diagnostic tool.
  • This system combines the measured gene expression data from defined sequence groups selected from SEQ ID NO: 1 to SEQ ID NO: 669 and / or their gene loci and / or their transcripts and / or fragments thereof, as well as housekeeping genes.
  • those specific genes and / or gene fragments are used which have a sequence homology of at least about 10%, in particular about 20%, preferably about 50%, particularly preferably about 80% have the polynucleotide sequences according to SEQ ID NO: 1 to SEQ ID NO: 669 or to the housekeeping genes.
  • Table 32 shows the highly relevant sequence pool, which is important for various clinical questions.
  • Tab. 8, 11 and 16 show a preferred choice of sequences which, when integrated into the above system, are essential for the distinction between SIRS and sepsis.
  • Applicant has developed a method that uses large sequence pools to detect and / or differentiate states or to answer defined questions of investigation. Examples can be found in the following patents: Distinction between SIRS, sepsis and sepsis-like conditions [WO 2004/087949; WO 2005/0831 15], Development of Criteria for Predicting the Disease Course in Sepsis [WO 05/106020], distinction between non-infectious and infectious causes of multiorgan failure [WO 2006/042581], in vitro classification of gene expression profiles of patients with infectious / non-infectious multiorgan failure [WO 2006/100203], Determination of the Local Causes of a Fever of Unclear Genesis [WO 2007/144105], polynucleotides for the detection of gene activities for the distinction between local and systemic infection [DE 10 2007 036 678.9].
  • the invention relates to polynucleotide sequences, to a method and also to kits for generating multigene biomarkers which have features of an "in vitro diagnostic multivariate index assay” (IVDMIA) in one and / or several modules.
  • IVDMIA in vitro diagnostic multivariate index assay
  • Multi-organ failure is the failure of two or more vital organ systems occurring simultaneously or in rapid succession.
  • Multi-organ dysfunction syndrome precedes MOV as initial organ failure [Zeni et al., 1997].
  • MODS Multi-organ dysfunction syndrome
  • the prognosis of MOV is closely related to the number of involved organ systems. Mortality is 22% in the first 24 hours of an organ failure and 41% after 7 days. When three organ systems fail, mortality increases to 80% on the first day and to 100% on the first day [Knaus et al., 1985].
  • MODS and MOV can be both infectiologic and non-infectiological.
  • Fever of unclear origin Fever of unknow origin (FUO) is clinically defined as a fever in which the temperature is higher than 38.8 ° C over a period of more than 3 weeks, without a week after that Examination time is a clear diagnosis of the cause.
  • FUO Fever of unknow origin
  • four classes of FUO have been described: FUO classic, nosocomial, immunodeficient or HIV-related origin [Roth and Basello, 2003].
  • FUO has also been described as "a more well-known disease with an unusual appearance than a rare disorder" [Amin and Kauffman, 2003].
  • Examination Question A clinically relevant question that is important for the treatment of a patient, for example: prediction of disease progression, therapy monitoring, focus of infection, chances of survival, predisposition, etc.
  • a systemic infection is an infection in which the pathogens have spread through the bloodstream throughout the organism.
  • SIRS Systemic Inflammatory Response Syndrome, according to Bone [Bone et al., 1992] and Levy [Levy et al., 2003] a generalized, inflammatory, non-infectious condition of a patient.
  • Biological fluid Biological fluids within the meaning of the invention are understood to be all body fluids of mammals, including humans.
  • a gene is a section of the deoxyribonucleic acid (DNA) that contains the basic information needed to produce a biologically active ribonucleic acid (RNA) as well as regulatory elements that activate or inactivate this production.
  • genes are also understood as meaning all derived DNA sequences, partial sequences and synthetic analogs (for example peptido-nucleic acids (PNA)).
  • PNA peptido-nucleic acids
  • Genlocus is the position of a gene in the genome. If the genome consists of several chromosomes, the position within the chromosome on which the gene is located is meant. Different manifestations or variants of this gene are referred to as alleles, all located at the same site on the chromosome, namely the gene locus.
  • the term "gene locus” includes, on the one hand, the pure genetic information for a specific gene product and, on the other hand, all regulatory DNA segments as well as any additional DNA sequences that are in any functional relationship with the gene at the gene locus in the immediate vicinity (1 Kb) but outside the 5 'and / or 3' end of a gene locus
  • the gene locus is specified by the accession number and / or RefSeq ID of the major RNA product derived from this locus ,
  • Gene activity is the measure of the ability of a gene to be transcribed and / or to form translation products.
  • Gene Expression The process of forming a gene product and / or expression of a genotype into a phenotype.
  • Multigenbiomarker Combination of several gene sequences whose gene activities form a combined overall result (eg a classification and / or an index) by means of an interpretation function. This result is specific to a condition and / or an investigation question.
  • Hybridization Conditions Physical and chemical parameters well known to those skilled in the art that may affect the establishment of a thermodynamic equilibrium of free and bound molecules. In the interest of optimal hybridization conditions, the duration of contact of the probe and sample molecules, cation concentration in the hybridization buffer, temperature, volume, and concentrations and ratios of the hybridizing molecules must be matched.
  • Amplification conditions Constant or cyclic reaction conditions that allow the amplification of the starting material in the form of nucleic acids.
  • the reaction mixture are the individual components (deoxyribonucleotides) for the resulting nucleic acids, as well as short oligonucleotides, which can attach to complementary regions in the starting material, as well as a nucleic acid synthesis enzyme, called polymerase.
  • the cation concentrations, pH, volume and the duration and temperature of the individual reaction steps which are well known to the person skilled in the art are of importance for the course of the amplification.
  • Primer is an oligonucleotide which can be used as a starting point for nucleic acid-replicating enzymes, such as, for example, B. the DNA polymerase is used. Primers may consist of both DNA and RNA (primer 3, see, e.g., http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www.cgi of MIT).
  • a probe is a
  • Nucleic acid fragment having a molecular tag (for example fluorescent markers, in particular Scorpion ®, molecular beacons, Minor Groove Binding- probes, TaqMan ® probes, isotopic label, etc.) are provided can be used and for the sequence-specific detection of target DNA and / or target RNA molecules.
  • a molecular tag for example fluorescent markers, in particular Scorpion ®, molecular beacons, Minor Groove Binding- probes, TaqMan ® probes, isotopic label, etc.
  • PCR is the abbreviation for the term "polymerase chain reaction.”
  • the polymerase chain reaction is a method to amplify DNA in vitro outside a living organism using a DNA-dependent DNA polymerase according to the present invention, to amplify short parts - up to about 3,000 base pairs - of a DNA strand of interest, which may be a gene or just a part of a gene or non-coding DNA sequences.
  • PCR a number of PCR methods are known in the art, all of which are encompassed by the term "PCR”. This applies in particular to "real-time PCR” (see also the explanations below).
  • PCR primers typically, PCR requires two primers to set the starting point of DNA synthesis on each of the two strands of DNA, thereby limiting the range of duplication on both sides.
  • primers are well known to those skilled in the art, for example from the website "Primer3", see for example http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www.cgi of MIT.
  • RNA transcript For the purposes of the present application, a transcript is understood to mean any RNA product which is produced on the basis of a DNA template.
  • Small RNAs in general. Representatives of this group are in particular, but not limited to: a) small cytoplasmic RNA (scRNA), which is one of several small RNA molecules in the cytoplasm of a eukaryote. b) snRNA (small nuclear RNA), one of the many small RNA forms found only in the nucleus. Some of the snRNAs play a role in splicing or in other RNA-processing reactions.
  • scRNA small cytoplasmic RNA
  • snRNA small nuclear RNA
  • RNAs 1 small non-protein codinq RNAs 1 which include the so-called small nucleolar RNAs (snoRNAs), microRNAs (miRNAs), short interfering RNAs (siRNAs) and small double-stranded RNAs (dsRNAs), which increase gene expression on many levels, including chromatin architecture, RNA editing, RNA stability, translation, and possibly also transcription and splicing. In general, these RNAs are multiply processed from the introns and exons of longer primary transcripts, including protein-coding transcripts. Although only 1, 2% of the human genome encodes proteins, a large part is nevertheless transcribed.
  • ncRNA non-protein-coding RNAs
  • snoRNAs Small nucleolar RNAs
  • miRNAs have a length of about 60 to 300 nucleotides.
  • miRNAs miRNAs
  • siRNAs short interfering RNAs
  • miRNAs are derived from endogenous short hairpin precursor structures and usually use other loci with similar - but not identical - sequences as the target of translational repression.
  • siRNAs arise from longer double-stranded RNAs or long hairpins, often of exogenous origin. They usually target homologous sequences at the same locus or elsewhere in the genome, where they participate in so-called gene silencing, a phenomenon also called RNAi. However, the boundaries between miRNAs and siRNAs are fluid.
  • the term "small RNA” may also include so-called transposable elements (TEs) and in particular retroelements, which are also understood for the purposes of the present invention by the term "small RNA”.
  • RefSeq ID This name refers to entries in the NCBI database (www.ncbi.nlm.nih.gov). This database provides non-redundant Reference standards for genomic information. This genomic information includes, among others, chromosomes, mRNAs, RNAs, and proteins. Each RefSeq ID represents a single, naturally occurring molecule of an organism. The biological sequences representing a RefSeq are derived from GenBank entries (also NCBI) but are a collection of informational elements. These information elements come from primary research at the DNA, RNA and protein levels.
  • accession number represents the entry number of a polynucleotide in the NCBI gene bank known to the person skilled in the art. In this database, both RefSeq IDs and less well characterized and redundant sequences are managed as entries and made available to the public (www.ncbi .nlm.nih.gov / gene bank / index.html).
  • PCR polymerase chain reaction
  • Suitable PCR primers are, for example, primers having the sequences of SEQ ID NO: 687 to SEQ ID NO: 742. However, it is known to the person skilled in the art that a variety of other primers can be used to practice the present invention.
  • PCR is one of the most important methods in molecular biology and molecular medicine. Today it is used in a very broad thematic spectrum, eg. In the detection of viruses or germs, in sequencing, in the detection of kinship, the generation of transcription profiles and the quantification of nucleic acids [Valasek and Repa, 2005; Klein, 2002]. In addition, any sequence sections of the nucleic acid inventory of an organism can be cloned in a simple manner with the aid of the PCR.
  • the variety of developed PCR variants allows u. a. a targeted or random change in the DNA sequence and even the synthesis of larger, in this form previously nonexistent sequence sequences.
  • RNA can be detected with high sensitivity and RNA can also be qualitatively detected by reverse transcription (RT) [Wong et al., 2005; Bustin 2002].
  • RT reverse transcription
  • a further development of this method is the real-time PCR, which was first introduced in 1991 and enables not only qualitative statements but also quantification.
  • Real-time PCR also called quantitative PCR (qPCR)
  • qPCR quantitative PCR
  • the detection takes place here already during the amplification.
  • the fluorophores Based on fluorescently labeled probes, the fluorophores, amplification can be monitored in real time.
  • the fluorescent PCR products and thus the intensity of light-induced fluorescence emission increase. Since the increase in fluorescence and the amount of newly synthesized PCR products over a wide range are proportional to each other, the data obtained from the data obtained Templates are determined. Gel electrophoretic separation of the amplificates is no longer necessary. The results are directly available, resulting in significant time savings. Since the reactions take place in closed vessels and no further pipetting steps are required after the start of the PCR, the risk of contamination is reduced to a minimum.
  • the fluorophores used are either nucleic acid-binding fluorescent dyes such as SYBRGreen or sequence-specific fluorescent probes such as Taq-Man probes, LightCycler probes and molecular beacons [Kubista et al., 2006].
  • SYBRGreen is a dye whose fluorescence increases strongly as the molecule binds to double-stranded DNA. This cost-effective solution is particularly suitable for the parallel execution of multiple reactions with different primer pairs. Disadvantages lie in the low specificity, since SYBRGreen binds sequences nonspecifically to each double-stranded DNA, and in that no multiplex measurements can be performed.
  • each DNA double strand breaks down into its two single strands at a characteristic temperature, the melting temperature. Since the double-stranded DNA of specific PCR products has a higher melting point than nonspecifically resulting primer dimers, a distinction based on the fluorescence decrease with increasing temperature is possible.
  • the detection with fluorescence-based probes is highly specific, but also very costly.
  • the PCR approach contains, in addition to the PCR primers, a sequence-specific TaqMan hybridization probe which has a quencher and a reporter dye.
  • the probe is complementary to a sequence lying between the primers.
  • the fluorescence is suppressed by the proximity of the quencher.
  • the quencher swallows the fluorescence emission of the excited fluorophore.
  • this probe hybridizes to the target sequence, it is hydrolyzed by the Taq polymerase during PCR, the reporter dye is spatially removed from the quencher and emits detectable fluorescence upon excitation.
  • the PCR approach contains two fluorescently-labeled PCR primers Probes (donor and acceptor fluorescent dye).
  • Probes donor and acceptor fluorescent dye
  • a fluorescence signal which can be measured outwardly only arises in the case of directly adjacent hybridization of the two probes with the specific target sequence. In a subsequent melting curve analysis, even the presence and type of single point mutations within the hybridization regions of the probes can be detected.
  • Another example is the Molecular Beacons. These oligonucleotides contain mutually complementary sequences at the 5 ' and 3 ' ends, which hybridize in an unbound state and form a hairpin structure. Reporter fluorophore and quencher, located at both ends, are in close proximity. Only when the probe binds to the template, the two dyes are spatially separated, so that after excitation again fluorescence is measurable.
  • Scorpion and Sunrise primers form two further modifications for sequence-specific probes [Whitcombe et al. 1999].
  • the quantitative determination of a template can be done by absolute or relative quantification.
  • absolute quantification the measurement is based on external standards, e.g. Plasmid DNA in different dilutions, instead.
  • relative quantification uses so-called housekeeping or reference genes as reference [Huggett et al., 2005]. These reference genes are constantly expressed and thus offer the opportunity to standardize different expression analyzes. The selection of housekeeping genes must be done individually for each experiment.
  • housekeeping genes having the sequences of SEQ ID NO: 676 to SEQ ID NO: 686 are preferably used.
  • the generated experiment data are evaluated using the device's own software. For the plot, the measured fluorescence intensity is plotted against the number of cycles. The resulting curve is divided into three areas. In the first phase, ie at the beginning of the reaction, the background noise predominates, a signal of the PCR product is not yet detectable. The second phase corresponds to the exponential growth phase. In this segment, the DNA template almost doubles in each reaction step. Critical to the evaluation is the cycle at which detectable fluorescence occurs and the exponential phase of amplification begins. This threshold Cycle (CT) value or Crossing Point provides the basis for calculating the starting amount of existing target DNA. In the case of an absolute quantification, the software determines the crossing points of the different reference dilutions and quantifies the template quantity on the basis of the calculated standard curve. In the last phase, the reaction finally reaches a plateau.
  • CT Cycle
  • Quantitative PCR is an important tool for gene expression studies in clinical research. With the ability to accurately quantify mRNA, the search for new drugs can be used to analyze the effects of certain factors on cells, to observe the differentiation of progenitor cells into different cell types, or to track gene expression in host cells in response to infection. By comparing wild-type and cancer cells at the RNA level, it is possible to identify genes in cell culture that have a decisive influence on carcinogenesis.
  • real-time PCR is used primarily for the qualitative and quantitative detection of viruses and bacteria. In clinical routine, especially in the field of intensive care, the doctor needs a quick and clear finding. On the basis of real-time PCR, tests can be carried out that deliver the result on the same day. This is an enormous advance in the clinical diagnosis of sepsis.
  • so-called isothermal amplification methods such as NASBA or SDA or other technical variants can be used for the detection of the target sequence preceding the detection.
  • a preferred method for selecting multigene biomarker sequences comprises the following steps:
  • Patient selection is based on the extreme group procedure
  • control genes are also suitably determined, for example those with the sequences of SEQ ID NO: 670 to SEQ ID NO: 675.
  • a preferred embodiment of the present invention is also in a use in which the gene activities are determined by means of a hybridization method, in particular on at least one microarray.
  • the advantage of a microarray lies in the higher information density of the biochip compared to the amplification method. So it is e.g. It is easily possible to provide several 100 probes on a microarray in order to examine several questions simultaneously in a single examination.
  • the gene activity data obtained by means of the invention can also be used advantageously for electronic further processing, e.g. B. be used for recording in the electronic medical record.
  • a further embodiment of the invention consists of the use of recombinantly or synthetically produced, specific nucleic acid sequences, partial sequences, individually or in part, as multigene biomarkers in sepsis assays and / or for evaluating the effect and toxicity in drug screening and / or for the preparation of therapeutics and of substances and mixtures intended as therapeutic agents for the prevention and treatment of SIRS and sepsis.
  • the sample is selected from: tissue, body fluids, in particular blood, serum, plasma, urine, saliva or cells or cell components; or a mixture of them.
  • samples especially cell samples, be subjected to lytic treatment to release their cell contents.
  • polynucleotide sequences of SEQ ID NO: 1 to SEQ ID NO: 669 from blood and blood cells and probes derived therefrom, which can be used for generating multigene biomarkers, are disclosed (see Table 32).
  • Tables 1 and 16 exemplify sequence selection for multigene biomarkers for distinguishing infectious / non-infectious states
  • Tables 20 and 21 exemplify sequence selection for multigene biomarkers to distinguish Gram-positive and Gram-negative infections.
  • Class prediction uses data / samples / patients assigned to existing or defined classes / groups (so-called training data set) to develop an analytical method (classification algorithm) that reflects the differences between the groups. Independent samples (so-called test data set) are used to evaluate the separation quality of the classification rule.
  • the procedure can be divided into the following steps:
  • Each group is then split to create 2 equivalent subsets, a training record and a test record.
  • Profiles for the training record ideally contain data that reflects a maximum difference between the groups.
  • DA Discriminant Analysis
  • RF Random Forests
  • GPLS Generalized Partial Least Squares
  • SVM Support Vector Machines
  • kNN k-Nearest Neighbors
  • DA Discriminant Analysis
  • Random Forests The Random Forests classification is based on the combination of decision trees, [Breiman, 2001]. The process of the algorithm is something like this:
  • GPLS Generalized Partial Least Squares
  • Support Vector Machine The Support Vector Machine classifier is a generalized linear classifier. The input data is mapped into a higher dimensional space and in this space an optimal separating (hyper) plane is constructed. These barriers, linear in higher-dimensional space, transform into nonlinear barriers in the space of input data, [Vapnik, 1999].
  • k-nearest neighbors In the k-closest neighbors method, the class affiliation of an observation (of a patient) becomes based on the nearest k neighbors in its vicinity decided. As a rule, the neighborhood is determined by Euclidean distance, and the class membership is then decided by a majority vote [Hastie et al., 2001].
  • a method to determine a multigene biomarker should be developed that reflects an infectious complication such as sepsis.
  • the biomarker and associated index value also known as “score” form the basis of a so-called “in vitro diagnostic multivariate index assay” [IVDMIA, FDA Guidelines, 2003] for improving the diagnosis of systemic infections.
  • the classification rule resulting from the method should allow a differentiation of SIRS and sepsis patients with improved sensitivity and specificity compared to the established biomarker procalcitonin, but is not limited to this question.
  • populations are most clearly defined that represent their presence or absence.
  • SIRS non-infectious
  • a plan for the collection or selection of the associated RNA samples is determined. From the selected samples, gene expression profiles are measured on a suitable platform, preprocessed and subjected to a quality control. Systematic measurement errors are corrected and outliers eliminated.
  • Step 3 Classification procedure.
  • Various classification methods are tested for their ability to separate with respect to the pathophysiological conditions to be differentiated. For this purpose methods of cross-validation are used. A classification method with the smallest classification error is selected, with the smallest necessary number of genes being co-determined. As a reasonable rule, it has been found that the number of genes should always be smaller than the number of samples in the training data set in order to avoid over-fitting. Finally, the resulting classification rule is defined.
  • Patient selection is important when setting up the training data set.
  • a sensitivity of approximately 75% in the training data and approximately 65% in the test data set was achieved for the time being.
  • this relatively low classification quality could not be explained by the poor optimization of the classifier but by the insufficiently precise selection of sepsis patients.
  • sepsis patients after peritonitis were classified much more correctly than sepsis patients after a "VAP" (ventilator-associated pneumonia) .
  • VAP ventilation-associated pneumonia
  • extreme groups can be useful. Thereafter, in a study, only those patient groups are taken into account that reflect the examined effect as clearly as possible. The selected samples represent an idealized case in which many effects occurring in practice (e.g., frequency of disease) are not taken into account.
  • Liu Liu [Liu et al., 2005] suggested forming extreme groups for the training data set of a microarray-based classifier. Using cancer survivor survival as an example, it has been shown that the use of extreme groups (patients who died in a short time vs.
  • the sepsis selection was also made using clinical sepsis diagnosis.
  • the severity of the disease between the group of sepsis patients and the control group of SIRS patients was not considered. This may be the reason for the low classification quality and its dependence on Be classification algorithm.
  • Johnson Johnson et al., 2007
  • patients were divided into two groups after trauma, with one infectious complication and no infection.
  • the advantage of this study was that patients in the two groups differed little in comorbidity and pretreatment.
  • the preselection is not representative for all sepsis patients and the generalization of the sepsis-relevant gene expression pattern revealed here to patients with a different background (to other risk groups) is not self-evident.
  • Applicants' patient database included 400 ITS patients who were suspected to be at risk of sepsis over a two-and-a-half-year period and detailed documentation of the patient's clinical history throughout their stay. The RNA samples were collected for approximately 7-14 sepsis-relevant days.
  • Step 1 Quality control: Based on the preselection of a patient collective confirmed by the expert's knowledge, the associated gene expression data were subjected to various similarity analyzes in order to rule out atypical hybridization results [Buneß et al., 2005], which generated the final training data matrix.
  • 2nd step normalization or preprocessing of the data: Different methods of background correction and normalization were compared. Methods with a variance-stabilizing transformation were best shown [Rocke and Durbin, 2001]. Normalization by Box-Cox [Box and Cox, 1964], with subsequent median and MAD standardization, was the best normalization procedure. Its advantage, namely the normalization of individual profiles (compared to the normalization of the entire data matrix according to, for example, Huber [Huber et al., 2003]), was specifically used in the bootstrap in particular.
  • Step 3 Filter: A filter was used to identify the best classifier genes. The filter consisted of the following steps:
  • Step 4th step Classification: The best of the selected transcripts were then used for classification.
  • the classification step compared different linear and non-linear methods [Hastie et al., 2001]: DLDA, LDA, RF, GPLS, SVM, and kNN.
  • Step 5 Internal validation: To assess the quality of the classification, the 10-fold cross-validation was used, with the cross-validation repeated several times (20 or even 1000 times).
  • Step 6 Selection of the transcripts: The final selection of the transcripts for the classifier was carried out with the aid of bootstrap.
  • FIG. 1 shows the classification error for the linear discriminant analysis (LDA). Since the curve reaches its minimum at about 12 features, the results obtained with this number of genes were further presented.
  • Tab. 2 summarized the results of the various classification methods, which were obtained by means of 20 repetitions of a 10-fold cross-validation.
  • Table 2 shows that the estimated sensitivity in the range of 95% and the estimated specificity - with the exception of DLDA - are in the range of more than 90%. The most promising are the results using LDA and SVM. In the case of these two classification methods, only a few patients were predominantly wrongly classified, so that a misclassification rate of at most 5% is achieved. Due to the great complexity of the SVM method and the resulting computational effort, which would cause the optimization of an SVM classifier, as well as the better biological interpretability of a classifier based on the LDA, the Applicant decided to use the classifier based on the LDA to develop. The classification rule resulting from the LDA was converted into a score. The score is shown for an exemplary collective of 96 patients in FIG. A value> 10 indicates that infection (ie sepsis) is very likely. A value between +10 and -10 indicates that there is some risk of sepsis. Finally, a value ⁇ -10 indicates that infection is very unlikely.
  • the quality of the multigene biomarkers according to the invention was compared with the established biomarkers PCT and CRP, for which the associated ROCs for the training data set were calculated (FIG. 3).
  • AUC (PCT) 0.326
  • AUC (CRP) 0.656
  • AUC (PCT & CRP) 0.940
  • AUC (multigene biomarker) 0.997.
  • FIG. 4a shows the distribution of score values as a function of the clinical diagnosis.
  • the distribution of the PCT and CRP values for the same data set is shown in FIG. 4b. While the index values or scores are consistent with the clinical diagnosis, PCT distribution in particular shows that severe SIRS is more likely to be classified as sepsis and uncomplicated sepsis rather than non-infectious.
  • a non-specific distribution is shown by the markers CRP and WBC (leukocyte count).
  • the quality of the multigene biomarkers according to the invention and of the method according to the invention was investigated on expression data of other patients of a foreign collection center. Again, clinical and molecular biology ratings were consistent in 90% of cases.
  • FIG. 5 shows the score curve in the course of the disease for individual patients.
  • the multigene biomarker of the present invention reflects the clinical diagnosis.
  • the validation analysis included patient profiles of the applicant's patient database, whose expression profiles were not included in the training dataset were represented. Due to the lack of a golden standard for the diagnosis of sepsis, this independent test dataset was examined in stratified subgroups. Patient profiles were divided and classified according to the severity of the disease (see Fig. 4). In fact, patients with uncomplicated SIRS were almost exclusively classified as non-infectious. Patients with severe SIRS (SIRS with additional multi-organ dysfunction (MOD)) were predominantly identified as noninfectious. Patients with uncomplicated sepsis were predominantly classified as systemically infectious. The infectious complication was most often diagnosed among patients with severe sepsis or septic shock. This finding was confirmed in a group of patients recruited and diagnosed in an independent center ( Figure 6).
  • FIG. 2 shows a score (a) and its distribution for the training data record (b);
  • FIG. 3 shows the quality of a multigene biomarker compared to established monomolecular biomarkers PCT and CRP or their combination (via
  • Fig. 4 shows a distribution of biomarker values as a function of the clinical
  • Diagnosis (a) multigene biomarker score, (b) PCT, CRP and WBC; 5 shows a course of the score for three patients (the gray area marks the
  • Fig. 6 shows a distribution of the scores for expression data of a foreign
  • FIG. 7 is a schematic representation of the microarray design and the three
  • qPCR run shows an example of a qPCR run (marker EPC1)
  • Fig. 1 1 is a schematic representation of the derived score
  • Fig. 12 is an illustration of the differences in expression between the
  • Patient Groups Boxplots of markers created from 31 patient samples (19 with sepsis diagnosis, 12 with SIRS); the legend explains the used ones
  • Fig. 13 is a box plot of the normalized real-time PCR data for the
  • Biomarker candidate CDKN1 C (SEQ ID NO: 104) for distinguishing Gram-positive and Gram-negative infection
  • Fig. 14 is a box plot of the normalized real-time PCR data for the biomarker
  • FIG. 15 is a box plot of the normalized real-time PCR data for the biomarker candidate METTL7B (SEQ ID NO: 145) to distinguish Gram-positive and Gram-negative infection; and FIG. 16 shows a box plot for the non-coding marker with SEQ ID NO: 207; on the y-axis, the mean Ct value during real-time amplification is shown.
  • a method for the determination of multigene biomarkers will be disclosed.
  • the classification rule resulting from the procedure should allow a differentiation of SIRS and sepsis patients.
  • Another classification rule is to allow the distinction between the focus of infection pneumonia and peritonitis.
  • transcripts were identified which, unaffected by patient heterogeneity due to age, comorbidities, and medications, reflect the molecular differences between groups of sepsis patients. Depending on the patient population studied, the number of biomarkers required for successful classification varies.
  • biomarker candidates Two examples will illustrate the potential of biomarker candidates:
  • FIG. 7 shows a schematic representation of the focused sepsis microarray. Spotted on epoxy-silanized glass slides (Nexterion E-Slides, manufacturer Schott, FRG), each gene-specific oligonucleotide is represented in triplicate. The three identical sub-arrays are hybridized to a patient sample. In addition to the marker-specific oligonucleotides, probes for controls (monitoring of the entire sample preparation and hybridization process) are also represented on the array.
  • the marker genes addressed on the array are assigned with high significance to the signaling pathways in the human cell shown in FIG. 8 and the associated functionalities. A high relevance for immunological and inflammatory processes and thus also sepsis is given.
  • the Ingenuity Pathway Analysis software (Ingenuity Systems, USA, www.ingenuity.com) was used to clarify the functional context of the identified markers.
  • the markers are classified into functional networks, which may then have relevance for physiological and pathological processes.
  • the markers are of high significance for immunological and inflammatory processes, which suggests a close connection to sepsis from a functional point of view. This provides biological plausibility, a prerequisite for biomarkers.
  • RNA from patient blood was analyzed by reverse transcription (Superscriptll, Invitrogen, USA) in a reaction volume of 30 ⁇ l ??? transcribed into cDNA.
  • the primer used was a PolydT primer (18mer). Aminoallyl-dUTP was added to the reaction, thus substituting 80% of the dTTP amount in the mRNA strand with AA-dUTP (Table 4).
  • Table 4 Sample pipetting approach for cDNA synthesis. 4 ⁇ g of totaIRNA and 2.5 ⁇ g of OligodT primer were submitted. RNAse-free water was added to 30 ⁇ l total volume.
  • the entire samples are placed on each column, which is centrifuged at 1 10OOxg for 10 min. After washing twice with 450 .mu.l RNase-free H 2 O and intervening centrifugation at 1 1000xg for 10 min, the columns are inverted on a new 1.5 ml reaction vessel and centrifuged for 3 min at 15000xg. The eluate obtained now purified single-stranded cDNA with a volume of about 20 - 40 ul, which is reduced in the Speedvac to dryness.
  • Fluorescent dyes are used to detect the hybridization signals.
  • a fluorescent dye was used by Dyomics (manufacturer: Dyomics GmbH, Jena, FRG).
  • DY-647 (Cy5 analogues) are purchased as N-hydroxysuccinimide esters (NHS esters) and used for fluorescent labeling. The chemical coupling of the dyes takes place on the incorporated AA dUTPs.
  • the cDNA is dissolved in 10 .mu.l H 2 O and divided with 5 ul each on two tubes. The dissolved samples are incubated at 42 ° C for 5 min. Subsequently, 3 ⁇ l of bicarbonate buffer are added to each sample. The fluorescent dye is dissolved in DMSO (manufacturer SIGMA-Aldrich, FRG). 75 ⁇ g of dye are used per sample. This photosensitive reaction takes place in the dark for 1 h. After this time, the samples are filled with H 2 O to a final volume of 30 ⁇ l. The samples are pipetted together with 80 ⁇ l each of H 2 O and 100 ⁇ l membrane binding solution and purified by Promega Kit (Promega Wizard-SV gel and PCR CleanUP System, PROMEGA, USA) according to the manufacturer's instructions.
  • Promega Kit Promega Wizard-SV gel and PCR CleanUP System, PROMEGA, USA
  • the columns are centrifuged dry for 1 min at 16000xg and eluted twice with 50 ul H 2 O (1 min, 10000xg). Thereafter, each sample is spiked with 10 ⁇ l of Cot-1 DNA (Invitrogen, USA) and 400 ⁇ l of H 2 O. The concentration of the labeled samples is carried out by means of Microcon YM-30 (10000xg, 10 min centrifugation). The columns are inverted and placed on a new tube and centrifuged at 15,000xg for 3 min. The volume of the cDNA / Cot-1 DNA mixture is adjusted to 32 ⁇ l. The fluorescently labeled cDNA / Cot-1 DNA mixture (32 ⁇ l) is admixed with 58 ⁇ l of hybridization mixture (Table 5).
  • the mixture After denaturation at 98 ° C. for 3 minutes, the mixture is pipetted into the hybridization chambers of the TECAN hybridization automaton (HS-400, manufacturer Tecan, Austria).
  • the contained formamide lowers the melting temperature of the hybrid and thus allows a good hybridization.
  • the addition of 10% SDS improves the wetting of the biomolecules on the glass slide.
  • the yeast t-RNA / poly-A mix ensures that there are no non-specific bonds and background noise. As a result, poly (A) binds to the poly (T) end of the labeled cDNA, with the yeast t-RNA blocking all nonspecific sequences.
  • Table 5 The hybridization mixture for a sample.
  • the arrays are initially washed with hybridization solution and then incubated with the samples. The process is incubated for ten hours at a temperature of 42 ° C in hybridization chambers of the Tecan HS-400 device with constant agitation of the hybridization mixture on the array surface carried out. Finally, the arrays are washed and dried in three automated steps.
  • the expression levels of the transcripts studied were compared to the Wilcoxon rank sum test for infection status (infectious vs. non-infectious).
  • Table 8 shows the differential gene expression in the patient groups measured on the microarray.
  • Table. 8 differential gene expression between patient groups; p-values for analyzes 1 and 2: grayed out are the markers that show a significant difference between the groups for the respective analysis; Analysel (non-infectious vs. infectious cause of multiple organ failure): CPB vs patient. septic patients with a focus on peritonitis or pneumonia; Analysis2 (focus of infection, distinction of focus peritonitis from focus pneumonia): 18 septic patients with focus on peritonitis. 12 patients with the focus on pneumonia
  • Example 2 Preparation of a Classifier for the Identification of SIRS and Sepsis Patients by Real-Time-PCR
  • the markers for classification were selected from the biomarker pool (see Example 1) and show strong differential gene expression in patient groups with and without diagnosed sepsis.
  • Relative quantification of gene expression means a statement on the abundance of the target transcript, for example with respect to a calibrator. This can be a reference value determined from the expression values of constantly expressed genes (so-called reference genes or housekeeping genes). For each organism and tissue, such reference genes are specific and must be carefully selected for each study. Based on the gene expression profiles from the whole blood of the sepsis and control patients, the most stable genes with the lowest variability were selected and used in the quantitative PCR for normalization.
  • Table 1 1 is a list of the primers used in real-time PCR and their SeqlDs. For each target sequence several primer combinations are possible, the table represents only one of many possibilities.
  • the patients' whole blood was removed from the intensive care unit by the patients using the PAXGene kit according to the manufacturer's instructions (Qiagen) and the RNA was isolated.
  • RNA was then removed from the batch by alkaline hydrolysis.
  • the reaction mixtures were not purified, but made up to 50 ⁇ l with water.
  • the Platinum SYBR Green qPCR SuperMix UDG kit from Invitrogen was used.
  • the patient cDNA was diluted 1: 100 with water and 1 ⁇ l of each was used in the PCR.
  • One PCR plate (BIORAD) with all 31 patients and no template controls (NTC) was pipetted in 3-fold per marker.
  • the iQ TM 5 Multicolor Real-Time PCR Detection System from BIORAD was used with the associated evaluation software. The results of such a qPCR run are shown in FIG. With the aid of the evaluation software, such images were generated for each of the 18 markers and 5 housekeepers, from which the corresponding Ct values could then be derived. The Ct values are automatically calculated by the program in the area of the linear increase of the curves. In the example of EPC1, the Ct values for the sepsis patients were in the range of 25.08 - 27.71 and for the SIRS patients in the range of 28.08 - 35.91.
  • the measured expression signals were saved in Excel format and averaged over the 3-fold determinations.
  • the marker MON2 with 15 missing values and the patients 6065 and 81 1 1 with 13 or a missing value were excluded from the analysis.
  • the training record contained 18 infectious (62%) and 1 1 non-infectious (38%) samples.
  • the 3 most stable housekeeper genes were determined from the 5 measured. Subsequently, for each patient, the mean of the 3 selected housekeeper genes was subtracted from the marker genes.
  • the linear discriminant analysis [Hastie et al., 2001] was used with a simple cross-validation. The calculation was carried out using the function Ida from the R library MASS. For p markers, the weights of the discriminant function f L D were given by the formula is calculated from the training data, wherein a sample has been omitted sequentially. This sample was classified retrospectively, for which in the previous formula for x, the Ct values of the sample were used. The weights of the discriminant function were calculated so that a positive value of the function means the assignment to the group with an infectious complication and a negative value of the function means the assignment to the group without an infectious complication. The classification procedure was repeated for an increasing number of markers.
  • FIG. 10 shows the scores for the 12 marker classification for samples 933 and 790. A schematic representation of the derived score value and the division into 4 areas is shown. If the calculated score is above 6.5, the patient is 95% likely to have sepsis (infectious). If the score is below -6.5, then the probability of not having sepsis for the patient is also 95% (non-infectious).
  • Table 13a shows the raw data (Ct values) from the qPCR assays
  • Table 13b the weights of the linear discriminant function for increasing number of markers and the associated score values for independent samples 790 and 933 are shown.
  • Table 13b Weights of the linear discriminant function for increasing number of markers and the associated score values for independent samples 790 and 933.
  • Example 3 Preparation of a Classifier for the Identification of SIRS and Sepsis Patients by Conventional PCR
  • the markers for classification were selected from the biomarker pool (see Example 1) and show strong differential gene expression in patient groups with and without diagnosed sepsis.
  • Table 15 lists the gene expression gene marker gene products used for classification and their description.
  • Table 16 is a list of the primers used in the PCR and the associated Seq IDs. For each target sequence several primer combinations are possible, the table represents only one of many possibilities.
  • Table 15 Gene expression gene marker gene products used for classification and their description
  • Table 16 List of primers used. For each target sequence several primer combinations are possible, the table represents only one of many possibilities.
  • the patients' whole blood was removed from the intensive care unit by the patients using the PAXGene kit according to the manufacturer's instructions (Qiagen) and the RNA was isolated.
  • RNA was then removed from the batch by alkaline hydrolysis.
  • the reaction mixtures were not purified, but made up to 50 ⁇ l with water.
  • the patient cDNA was diluted 1: 500 (or in the case of 4 markers 1:50, SNAPC, EPC1, KIAA0146 and MON2) with water and 1 ⁇ l of each were used in the PCR.
  • One PCR plate (96 wells, Nerbe Plus) was pipetted per marker with all 31 patients and no template controls (NTC) in a 3-fold determination.
  • a mastermix without template was prepared, this was quilted into 12 ⁇ l aliquots in the PCR plate and to each of the patient cDNA were pipetted (see composition of the PCR reaction mixture).
  • a 1, 1-fold SYBR Green solution was prepared.
  • 100 ⁇ l of a 100 ⁇ SYBR Green stock solution (prepared from a 10,000 ⁇ SYBR Green stock solution from BMA, BioWhittaker Molecular Applications) were pipetted into 8.9 ml of water and mixed.
  • 90 ⁇ l of this solution were added to each PCR batch and this mixture was then transferred to a black plate (96 wells, Greiner). Subsequently, this plate was measured in a fluorescence measuring instrument (TECAN GENios) at 485 nm excitation wavelength / 535 nm emission wavelength.
  • the measured expression signals were saved in Excel format, averaged over the 3-fold determinations and the NTC values were subtracted for each marker.
  • Patient 6065 with 15 missing values was excluded from the analysis.
  • Individual missing values were replaced with the knn algorithm (the function pamr.knnimpute from the R library pamr was used for this).
  • the averaged signals were transformed log-2.
  • the mean of the 3 housekeeper genes was subtracted from the associated marker genes for each patient. Classification:
  • the separability of the training data set was checked by means of simple cross-validation. Subsequently, two independent samples were classified, one from each of the two groups of patients studied (patients 933 and 790). The raw measurement signals were preprocessed in the same way as the training data.
  • FIG. 11 The arrangement of the genes and the associated values are summarized in FIG. 11. The differences in expression between the groups are shown: Boxplots of the 15 markers created from 31 patient samples (19 with sepsis diagnosis, 12 with SIRS). By means of the box plots, gene by gene was shown the distribution of the Ct values per group. These Ct values were generated from each patient sample by real-time PCR on the patient's cDNA (Biorad IQ5) and normalized by the Ct values of three reference genes. The x-axis gives the p-value and the Hodge-Lehmann estimator of the Wilcoxon rank-sum test. In the classification, 1 became a sensitivity in the simple cross-validation of 100% and a specificity of 83%, which corresponds to a misclassification of 2 non-infectious samples.
  • FIG. 12 shows a schematic representation of the derived score value and the division into 4 ranges. If the calculated score is above 6.5, the patient is 95% likely to have sepsis. If the score is below -6.5, then the probability of not having sepsis for the patient is also 95%. The classification result was projected on this scale. The score of sample 933 took the value of -38.7 and was classified as non-infectious; the score of sample 790 took the value of 9.1 and was classified as infectious.
  • Table 18a contains the raw data from the fluorescence measurements with SYBR Green at TECAN GENios.
  • Tab. 18b shows the raw data of the independent patient samples as well as the legend for the gene names and their assignment to the SeqlDs.
  • Example 4 Exciter Type - Gram Vs. Gram - Differential gene expression in
  • biomarkers In genome-wide gene expression analyzes on microarray platforms, biomarkers have been identified that express different levels in septic patients with infections of Gram-negative and Gram-positive bacteria. Starting from this biomarker list with 1 14 markers, it was shown for three markers that these differences in gene expression can be represented by quantitative PCR. For these 3 markers, gene-specific primers were identified and their gene activity determined by quantitative PCR.
  • Table 19 List of patients studied. Not highlighted: Patients with gram-negative infection; highlighted in light gray: patients with gram-positive infection.
  • RNA Place 50-500ng RNA in a microcentrifuge tube and make up to 1 ⁇ l with nuclease-free water.
  • 1 ⁇ l array script 9 ⁇ l of the mix are added to the RNA sample and then incubated for 2 hours at 42 ° C.
  • the poly-A overhang at the 3 'end of the mRNA integrates the T7 oligo (dT) nucleotide so that the mRNA, regardless of its sequence, is transcribed into cDNA using ArrayScript. After the 2 hour incubation, the reaction vessel is put back on ice.
  • RNA is simultaneously degraded by RNase H.
  • the prepared mix is added to the sample and incubated for 14 hours.
  • the T7 Enzyme Mix contains T7 RNA polymerase, a highly promoter-specific RNA polymerase that requires a DNA template.
  • the T7 oligo (dT) nucleotide used for reverse transcription has a T7 promoter sequence, which is now recognized by the T7 RNA polymerase.
  • the in vitro Transcription is thus an amplification and labeling step in one. Subsequent to the incubation, 75 ⁇ l of nuclease-free water are added.
  • RNA, primers, enzymes and salt are removed.
  • Another purification step after in vitro transcription removes enzymes, salt, and non-embedded nucleotides.
  • bead arrays which are arranged on carriers, the bead chips.
  • the required buffers, solutions and hybridization chambers are provided by the manufacturer in the form of the bead-chip kit (HumanWG-6 BeadChip Kit, Illumina, www.illumina.com).
  • 1, 5 ⁇ g of the respective cRNA sample is made up to 10 ⁇ l with RNase-free water. 20 ⁇ l GEX-HYB solution is added to the sample. 200 ⁇ l of GEX-HCB are loaded into the humidification buffer reservoirs of the hybridization chamber and the bead chips (Human WG-6 BeadChip, Illumina, www.illumina.com) are inserted into the hybridization chamber. 30 ⁇ l of sample is applied to the sample port of the array. The hybridization chamber is closed carefully and the samples are incubated at 58 ° C for 16-20 hours.
  • the bead chips are immersed in E1 BC wash solution and washed in high-temp buffer at 55 ° C. This is followed by a rinsing step at room temperature with E1 BC solution, an ethanol washing step and another E1 BC washing step. This is followed by a blocking step with block E1 buffer and a labeling step with block E1 + streptavidin-Cy3, in which the fluorescently labeled streptavidin binds to the biotinylated nucleotides of the cRNA. It will be again washed with E1 BC buffer and then the bead chip is dried by centrifugation (2min at 500 rpm). The Bead Chip can then be scanned in with the Bead Array Reader (Illumina Beadstation 500, www.illumina.com).
  • the bead chip is read out fluorometrically.
  • the scanner has a resolution of 0.8 ⁇ m and thus the fluorescence is measured at least 9 pixels from each of the 48687 array types placed on an array.
  • Each bead type is at least 5 times redundant.
  • the Bumina Studio 2.0 program provided by Illumina the fluorescence values of a bead type are averaged and output as an "average signal.”
  • the background signal is detected, which is subtracted from each averaged signal.
  • the negative controls determine the detection p-value of each individual bead type, which provides information on whether it is a true signal or whether the measured intensity matches the background. For further analysis, only the bead types are used in which at least one of the ten arrays has reached a detection p-value below 0.01.
  • the normalization proposed by the data processing program Bead Studio 2.0 (part of the Illumina Beadstation 500) was selected using Cubic Splines. In accordance with the recommendations [MAQC Consortium, 2006], the following correction steps were additionally added.
  • the data was further processed with the statistics software (http://www.r.project.org). From all the bead types selected for further analysis, the smallest averaged signal value is determined. This minimum is subtracted from each averaged signal, so that now the smallest averaged signal takes the value 0.
  • the constant 16 is added to each averaged signal before logarithmizing to the base 2. After the logarithm receives the smallest average signal is 4. At the same time, the averaged signal is prevented from accepting a negative value.
  • the ratio between the expression values is given as a "fold change.” This value indicates the factor by which the transcript was expressed differently in one sample than in the other sample.
  • the difference is formed from the average values of the normalized data of both groups, where the FoId Change of gram-positive with respect to gram-negative is given:
  • the number 2 is exponentiated with the logarithmic FoId Change to obtain a theoretical change. If the theoretical change takes a value less than one, the change results from the negative reciprocal of the theoretical change. In the opposite case, the FoId Change corresponds to the Theoretical FoId Change:
  • a positive change means that the corresponding gene is expressed more strongly in the case of a gram-positive infection than in a gram-negative infection.
  • the p-value for the t-test and the Wilcoxon test are also calculated. Assuming that the null hypothesis of the test is correct, the p-value indicates the probability that the measured value will be by chance comes about. If this probability is less than a given bound, it is assumed that the difference is not random.
  • Tab. 20 shows the identified biomarkers:
  • Table 20 Differential gene expression of transcripts in Gram-positive and Gram-negative sepsis measured on the Illumina gene expression platform
  • the three markers and a representative primer pair for quantification by means of real-time PCR are shown in Tab. 21. Furthermore, so-called reference genes are used for relative quantification, which are constantly expressed in the respective tissue. The reference genes used in this experiment are also shown.
  • the patients' whole blood in the intensive care unit was approved by the patients using the PAXGene kit according to the manufacturer's instructions (Qiagen). After collection of the whole blood, the total RNA of the samples was isolated using the PAXGene Blood RNA Kit according to the manufacturer's instructions (Qiagen).
  • RNA to complementary DNA RNA was transcribed with the reverse transcriptase Superscript II (Invitrogen) in a 20 ⁇ l batch, and the RNA was subsequently removed from the batch by alkaline hydrolysis. The reaction mixtures were then purified by means of microconcolumns.
  • the iQ TM 5 Multicolor Real-Time PCR Detection System from BIORAD was used with the associated evaluation software.
  • the third root is drawn from the product of the three reference genes.
  • the quotient of relative size R and the normalization factor is formed:
  • Fig. 13 shows the differential expression of the CDKN1 C gene in septic patients with gram-positive and gram-negative infection.
  • the box plot shows the mean normalized Ct values for every 5 patients. These values were determined using real-time PCR on the patient's cDNA.
  • Figure 14 shows the differential expression of the CTSL gene in septic patients with gram-positive and gram-negative infection. In the box plot are also the middle normalized Ct values are shown for every 5 patients. These values were determined using real-time PCR on the patient's cDNA.
  • Figure 15 shows the differential expression of the gene METTL7B in septic patients with Gram-positive and Gram-negative infection.
  • the box plot shows the mean normalized Ct values for every 5 patients. These values were determined using real-time PCR on the patient's cDNA.
  • Table 22 shows raw data (Ct values, mean values from triplicates) from the qPCR assays for the marker CDKN1 C (SeqlD 104).
  • Table 23 contains normalized raw data from the qPCR assays for the marker CDKN1 C (SeqlD 104).
  • Table 24 contains raw data (Ct values, mean values from triplicates) from the qPCR assays for the marker CTSL (SeqlD 149).
  • Table 25 shows, according to Vandesompele [Vandesompele et al., 2002], normalized raw data from the qPCR assays for the marker CTSL (SeqlD 149).
  • Table 26 contains raw data (Ct values, mean values from triplicates) from the qPCR assays for the marker METTL7B (SeqlD 145).
  • Table 27 shows, according to Vandesompele [Vandesompele et al., 2002], normalized raw data from the qPCR assays for the marker METTL7B (SeqlD 145).
  • Table 22 Raw data (Ct values, means) from the qPCR assays for the marker CDKN1 C (SeqlD 104). Light gray: patients with gram-negative infection, dark gray: patients with gram-positive infection.
  • Table 23 Raw data normalized by Vandesompele from the qPCR assays for marker CDKN 1 C (SeqlD 104). Light gray: patients with gram-negative infection, dark gray: patients with gram-positive infection.
  • Table 24 Raw data (Ct values, means) from the qPCR assays for marker CTSL (SeqlD 149). Light gray: patients with gram-negative infection, dark gray: patients with gram-positive infection.
  • Table 25 Raw data normalized by Vandesompele from the qPCR assays for marker CTSL (SeqlD 149). Light gray: patients with gram-negative infection, dark gray: patients with gram-positive infection.
  • Table 26 Raw data (Ct values, means) from the qPCR assays for the marker METTL7B (SeqlD 145). Light gray: patients with gram-negative infection, dark gray: patients with gram-positive infection.
  • Table 27 Raw data normalized by Vandesompele from the qPCR assays for the marker METTL7B (SeqlD 145). Light gray: patients with gram-negative infection, dark gray: patients with gram-positive infection.
  • the FoId change of the patients is thus calculated as follows:
  • Table 28 shows the medical parameters of the patients included in the analysis, as validated by the clinic.
  • Table 28 Medical parameters of the patients included in the analysis. Light gray: patients with gram-negative infection, dark gray: patients with gram-positive infection.
  • Example 5 Non-coding RNA - Differential gene expression of a transcript without protein-coding function (so-called non-coding RNA) in SIRS and sepsis patients by means of real-time PCR.
  • the marker with SeqlD 207 (Accession No. AA868082) for non-coding RNA is part of the biomarker list above.
  • Tab. 30 shows an example of a primer pair for the amplification of the noncoding marker with the SeqlD 207 in the real-time PCR. 10 patients were studied (5 sepsis patients, 5 SIRS patients).
  • the patients' whole blood was removed from the intensive care unit by the patients using the PAXGene kit according to the manufacturer's instructions (Qiagen) and the RNA was isolated.
  • RNA to complementary DNA RNA to complementary DNA
  • cDNA RNA to complementary DNA
  • the reverse transcriptase Superscript II Invitrogen
  • the gene-specific primers in a 20 ⁇ l assay (10 mM dNTP mix and 2 ⁇ M gene-specific primers ( SeqID 207) and the RNA were then removed from the batch by alkaline hydrolysis, the reaction mixtures were purified with microconcolumns, the eluted cDNA was evaporated in the SpeedVac and then taken up in 50 ⁇ l of water.
  • the Platinum SYBR Green qPCR SuperMix UDG kit from Invitrogen was used.
  • the patient cDNA was diluted 1: 100 with water and 2 ⁇ l of each were used in the PCR. All batches were pipetted in 3-fold.
  • the iQ TM 5 Multicolor Real-Time PCR Detection System from BIORAD was used with the associated evaluation software.
  • Figure 16 shows a box plot for the non-coding marker with SeqlD 207 made from 10 patient samples (5 with sepsis diagnosis, 5 with SIRS). The mean Ct value during real-time amplification is shown on the y axis. There is a clear separation between sepsis and SIRS patients.
  • Table 32 establishes the relationship between the sequence listing number of each polynucleotide and its publicly available accession number.
  • MAQC MicroArray Quality Control
  • Valasek MA Repa JJ (2005) The power of real-time PCR.
  • WO 2006/100203 Use of geneactivity classifiers for the in vitro classification of gene expression profiles of patients with infectious / non-infectious WO 2004/087949 A method for the detection of acute, generalized inflammatory conditions (SIRS), sepsis, sepsis-like conditions and systemic infections
  • SIRS generalized inflammatory conditions
  • WO 2006/042581 A method for distinguishing between non-infectious and infectious causes of a multi-organ failure

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

Die Erfindung betrifft ein Verfahren zur in vitro Erfassung und/oder Unterscheidung und/oder Verlaufsbeobachtung von pathophysiologischen Zuständen (z.B. SIRS oder SEPSIS) mittels Probennukleinsäuren, Bestimmung von Genaktivitäten mittels einer Mehrzahl von Polynukleotiden, Bestimmung von Genaktivitäten wenigstens eines internen Referenzgens sowie Bilden eines Index-Wertes aus den einzelnen bestimmten normalisierten Genaktivitäten eines Multigenbiomarkers, der den pathophysiologischen Zustand anzeigt, umfasst.

Description

Beschreibung
Verfahren zur in vitro Erfassung und Unterscheidung von pathophysiologischen
Zuständen
Die vorliegende Erfindung betrifft ein Verfahren zur in vitro Erfassung und/oder Unterscheidung und/oder Verlaufsbeobachtung von pathophysiologischen Zuständen gemäß Anspruch 1 , die Verwendung einer Mehrzahl von Polynukleotiden und/oder deren Genloci und/oder deren Transkripten zur Bildung wenigstens eines Multigenbiomarkers zur Herstellung eines Multiplex-Assays gemäß Anspruch 4; die Verwendung mindestens eines Polynukleotids und/oder deren Genloci und/oder deren Transkripten zur Herstellung eines Assays gemäß Anspruch 11 , sowie einen Kit zur Durchführung des Verfahrens gemäß Anspruch 14.
Insbesondere betrifft die vorliegende Erfindung die Verwendung von Polynukleotiden zur Erfassung von Genaktivitäten von mindestens einem Multigenbiomarker, zur Herstellung eines Hilfsmittels zur Diagnose bei Patienten mit bestimmten pathophysiologischen Zuständen, wie beispielsweise Sepsis und Sepsisähnliche Zuständen, mit ähnlichen Merkmalen wie ein „In Vitro Diagnostic Multivariate Index Assay" (IVDMIA).
Sepsis („Blutvergiftung") ist eine lebensbedrohliche Infektion, die den gesamten Organismus erfasst. Sie ist mit hoher Sterblichkeit verbunden, kommt immer häufiger vor und erfasst Menschen in jedem Lebensalter. Sepsis gefährdet den medizinischen Fortschritt in vielen Bereichen der Hochleistungsmedizin und verbraucht einen Großteil der Ressourcen im Gesundheitswesen. Die Sterblichkeit der schweren Sepsis hat sich in den letzten Jahrzehnten nicht entscheidend verbessert. Die letzten beiden Innovationssprünge nach Einführung der Blutkultur (ca. 1880) waren die Einführung der Antibiotika vor über 60 und der Beginn der Intensivmedizin vor etwa 50 Jahren. Um heute ähnlich entscheidende Behandlungsfortschritte zu erzielen, müssen neuartige Diagnostika zur Verfügung gestellt werden.
Sepsis wird durch Infektionserreger verursacht. Da es bislang keine spezielle Therapie gegen die Sepsis gibt, hängt der Erfolg der Behandlung weitgehend von der erfolgreichen Bekämpfung der zugrunde liegenden Infektion und der Qualität der intensivmedizinischen Behandlung ab. Entscheidend für das Überleben ist die frühzeitige Gabe eines Antibiotikums, das außerdem den verursachenden Erreger erfolgreich bekämpft [Kumar et. al., 2006]. Defizite der Sepsis-Diagnostik verzögern jedoch den Therapiebeginn und die Wahl eines geeigneten Antibiotikums. Da die Identifizierung des Sepsiserregers mit den derzeitigen Methoden der Blutkultur nur in weniger als 25 % der Sepsisfälle gelingt und die Befunde im Fall des Erregernachweises erst nach 2-3 Tagen vorliegen, muss die initiale Wahl des Antibiotikums oder Antimykotikums (gegen Pilze gerichtete Substanzen) „kalkuliert", d.h. auf Verdacht gewählt werden. In 20 - 30 % der Fälle ist diese Wahl nicht richtig.
Weitere Ursachen für die Verzögerung der Therapie liegen in der Fehlinterpretation der Krankheitssymptome und Laborwerte. Verbesserte Diagnostika, die die Sepsisdiagnose vereinfachen und beschleunigen, können zu einer erheblichen Reduktion der Sepsissterblichkeit und Verkürzung ihrer Behandlungsdauer beitragen. Medizinische Fachgesellschaften bestätigen die Defizite der bisherigen Sepsis-Diagnostik in Umfragen unter nordamerikanischen und europäischen Intensivmedizinern [Marshall et. al., 2003]. Auch die Betroffeneninitiative „Deutsche Sepsis Hilfe e.V." und der Deutschen Sepsis-Gesellschaft beklagen die Defizite.
Im Zuge der Entwicklung marktreifer in-vitro-Diagnostika aus dem Bereich molekularer Diagnostik wurde am 26.7.2007 ein Richtlinienentwurf der Food and Drug Administration (FDA) der Vereinigten Staaten von Amerika veröffentlicht. Diese Richtlinie liefert Empfehlungen, Definitionen und Anhaltspunkte für den Entwicklungsund Zulassungsprozess. Weiterhin werden Spezifikationen für die neue Klasse der „in vitro-diagnostischen multivariaten Index-Assays (IVDMIA)" vorgeschlagen. Kennzeichen dieser Assays sind:
1 ) Die Kombination von mehreren Einzelwerten mittels eines Interpretationsschrittes, um einen einzelnen patientenspezifischen Ausgabewert in Form eines Index, Score oder einer Klassifikation zu erhalten. Dieser Wert ist für diagnostische Aussagen, zur Schadensbegrenzung, Behandlung oder Vorbeugung einer Krankheit einsetzbar.
2) Das erreichte Ergebnis ist von den Messwerten in einer Weise abgeleitet, die keine Rückschlüsse auf die eigentlichen Messdaten erlaubt. Daher kann das Ergebnis vom End-Anwender nicht bestätigt bzw. nachvollzogen werden. 3) Dadurch ist es notwendig, dem Anwender alle Informationen zur Interpretation des Testergebnisses zur Verfügung zu stellen.
Die vorliegende Erfindung betrifft insbesondere Gene und/oder deren Fragmente und ihre Verwendung zur Erstellung von Multigenbiomarkern, welche spezifisch für einen Zustand und/oder Untersuchungsfrage sind.
Die Erfindung betrifft ferner von den Markergenen abgeleitete PCR-Primer und Sonden für Hybridisierungs- bzw. Vervielfertigungsverfahren.
Nach wie vor ist die Sepsis eines der schwierigsten Krankheitsbilder in der modernen Intensivmedizin, wobei für den klinisch tätigen Arzt nicht nur die Therapie, sondern auch die Diagnose eine Herausforderung darstellt. Trotz Fortschritten im pathophysiologischen Verständnis und der supportiven Behandlung von Intensivpatienten sind generalisierte inflammatorische Zustände wie SIRS und Sepsis bei Patienten auf Intensivstationen sehr häufig auftretende und erheblich zur Sterblichkeit beitragende Erkrankungen [Marshai et al., 2003; Alberti et al., 2003]. Die Sterblichkeit beträgt ca. 20 % bei SIRS, ca. 40 % bei Sepsis und steigt bei Entwicklung von multiplen Organdysfunktionen bis auf 70-80 % an [Brun-Buisson et al., 1995; Le-GaII et al., 1995; Brun-Buisson et al., 2003]. Der Morbiditäts- und Letalitätsbeitrag von SIRS und Sepsis ist von fachübergreifender klinischmedizinischer Bedeutung, denn dadurch werden in zunehmendem Maße die Behandlungserfolge der fortgeschrittensten Therapieverfahren zahlreicher medizinischer Fachgebiete (z.B. Traumatologie, Neurochirurgie, Herz- /Lungenchirurgie, Viszeralchirurgie, Transplantationsmedizin, Hämatologie/ Onkologie, etc.) gefährdet, denen ohne Ausnahme eine Erhöhung des Krankheitsrisikos für SIRS und Sepsis immanent ist. Dies drückt sich auch im kontinuierlichen Anstieg der Häufigkeit der Sepsis aus: zwischen 1979 und 1987 wurde ein Anstieg um 139%, nämlich von 73,6 auf 176 Krankheitsfälle je 100.000 Krankenhauspatienten verzeichnet [MMWR Morb Mortal WkIy Rep 1990]. Die Senkung der Morbidität und Letalität einer Vielzahl von schwer erkrankten Patienten ist daher an einen gleichzeitigen Fortschritt in der Vorbeugung, Behandlung und insbesondere der Erkennung und Verlaufsbeobachtung der Sepsis und schweren Sepsis gebunden. Im Laufe der Zeit hat der Sepsisbegriff einen erheblichen Bedeutungswandel erfahren. Eine Infektion bzw. der dringliche Verdacht auf eine Infektion sind auch heute noch wesentlicher Bestandteil aktueller Sepsisdefinitionen. Besondere Berücksichtigung findet jedoch dabei die Beschreibung Infektionsort-ferner Organfehlfunktionen im Rahmen der inflammatorischen Wirtsreaktion. Im internationalen Schrifttum haben sich zwischenzeitlich die Kriterien der Konsensuskonferenz des „American College of Chest Physicians/Society of Critical Care Medicine Consensus Conference (ACCP/SCCM)" aus dem Jahr 1992 am breitesten zur Definition des Sepsis-Begriffs durchgesetzt [Bone et al., 1992]. Entsprechend dieser Kriterien werden die klinisch definierten Schweregrade „systemic inflammatory response Syndrom" (SIRS), „Sepsis", „severe Sepsis" und „septic shock" unterschieden. Als SIRS wird dabei die systemische Antwort des inflammatorischen Systems auf einen nichtinfektiösen Reiz definiert. Dazu müssen mindestens zwei der folgenden klinischen Kriterien erfüllt sein: Fieber >38°C oder Hypothermie <36°C, eine Leukozytose >12g/l oder eine Leukopenie <4g/l bzw. eine Linksverschiebung im Differentialblutbild, eine Herzfrequenz von über 90/min, eine Tachypnoe >20 Atemzüge/min oder ein PaCO2 (Partialdruck des Kohlendioxid im arteriellen Blut) <4,3 kPa. Diese Definition hat eine hohe Sensitivität, aber eine niedrige Spezifität. Für intensivmedizinische Belange ist sie wenig hilfreich, da in der Regel jeder Intensivpatient, zumindest für kurze Zeit, die SIRS-Kriterien erfüllt.
Als Sepsis werden solche klinischen Zustände definiert, bei denen die SIRS- Kriterien erfüllt sind und ursächlich eine Infektion nachgewiesen wird oder zumindest sehr wahrscheinlich ist. Eine Infektion wird definiert als ein pathologischer Prozess, welcher durch eine Invasion von Pathogenen beziehungsweise potentiell pathogenen Organismen in ein normalerweise steriles Gewebe hervorgerufen wird. Wenn es dem Körper nicht gelingt, diese Infektion auf den Ursprungsort zu begrenzen, induzieren die Krankheitserreger oder deren Toxine in den vom Infektionsort entfernten Organen bzw. Geweben des Körpers eine Entzündung. Eine sofortige intensivmedizinische Behandlung, die zielgerichtete Gabe von Antibiotika und die operative Sanierung des infektiösen Herdes sind nötig, um eine Genesung zu erreichen. Eine schwere Sepsis ist vom zusätzlichen Auftreten von Organfehlfunktionen gekennzeichnet. Häufige Organfehlfunktionen sind Änderungen der Bewusstseinslage, eine Oligurie, eine Laktazidose oder eine Sepsis-induzierte Hypotension mit einem systolischen Blutdruck von weniger als 90 mmHg bzw. ein Druckabfall um mehr als 40 mmHg vom Ausgangswert. Wenn eine solche Hypotension nicht durch die Verabreichung von Kristalloiden und/oder Kolloiden zu beheben ist und es zusätzlich zu einer Katecholaminpflichtigkeit des Patienten kommt, so spricht man von einem septischen Schock. Dieser wird bei etwa 20 % aller Sepsispatienten nachgewiesen.
Es besteht unter vielen Medizinern Einigkeit darüber, dass die Konsensuskriterien nach [Bone et al., 1992] keiner spezifischen Definition von Sepsis entsprechen. So zeigte eine von der European Society of Intensive Care Medicine (ESICM) durchgeführte Umfrage, dass 71 % der befragten Ärzte trotz langjähriger klinischer Erfahrungen Unsicherheit bei der Diagnosestellung einer Sepsis hatten [Poeze et al., 2003]. Der Versuch, eine einheitliche Terminologie durchzusetzen, fand in der klinischen Umsetzung variable Akzeptanz. Insbesondere die Fortschritte im Verständnis der Pathophysiologie der Sepsis veranlasste verschiedene Experten, nach einer entsprechenden Modifikation der bisherigen Definitionen zu suchen. Die Definitionen von Sepsis, schwerer Sepsis und septischem Schock wurden bestätigt und als nützlich für Kliniker und Forscher beurteilt. Allerdings wurden die diagnostischen Kriterien der Sepsis erheblich erweitert, um dem klinischen Aspekt der Infektabwehr gerecht zu werden. Die internationale Sepsis-Konferenz 2001 schlug außerdem ein neues Konzept (PIRO genannt) zur Beschreibung der Sepsis vor, welches sich aus den Kriterien Prädisposition, Infektion, Immunantwort (Response) und Organdysfunktion zusammensetzt [Levy et al., 2003]. Trotz einer neuen Definition der SIRS/Sepsis mit dem Akronym PIRO [Opal et al., 2005] wird in den meisten Studien immer noch die ACCP/SCCM Konsensuskonferenz aus dem Jahre 1992 benutzt [Bone et al., 1992], um ihre Patienten zu klassifizieren.
Mehrere Ansätze zur Diagnosestellung von SIRS und Sepsis wurden entwickelt. Diese Ansätze können in 3 Gruppen geteilt werden.
Der erste Gruppe enthält Score-Systeme wie beispielsweise APACHE, SAPS und SIRS welche die Patienten auf der Basis einer Vielzahl physiologischer Indices stratifizieren können. Während in einigen Studien für den APACHE Il Score ein diagnostisches Potential nachgewiesen werden konnte, haben andere Studien gezeigt, dass APACHE Il und SAPS Il nicht zwischen Sepsis und SIRS differenzieren können [Carrigan et al., 2004].
Die zweite Gruppe enthält Proteinmarker, die aus Plasma und Serum nachgewiesen werden. Solche sind zum Beispiel CA125, S100B, Copeptin, Glycin N- acyltransferase (GNAT), Protachykinin und/oder seine Fragmente, Aldose 1 - Epimerase (Mutarotase), Chp, Carbamoylphosphat Synthetase 1 , LASP-1 (Brahms Diagnostika GmbH Deutschland), IL-1 Ra, MCP-1 , MPIF-1 , TNF-R1 , MIG, BLC, HVEM, IL-15, MCP-2, M-CSF, MIP-3b, MMP-9, PARC, ST-2; IL-6, slL-2R, CD141 , MMP-9, EGF, ENA-78, EOT, Gro-beta, IL-I b, Leptin, MIF, MIP-I a, OSM, Protein C, P-Selectin, und HCC4 (Molecular Staging, Inc., USA) oder CD 14 Antigen, Lipopolysaccharid-Bindungsstellen auf den Proteinen Alkalische Phosphatase und Inter-Alpha-Trypsin Inhibitor (Mochida Pharm Co, Ltd. Japan). Trotz der großen Menge von patentierten Biomarkern konnten sich nur wenige im klinischen Alltag durchsetzen. Von diesen scheinen Procalcitonin (PCT, BRAHMS) und das C-reaktive Protein (CRP, EIi Lilly) die Marker zu sein, die am besten zwischen infektiösen und nicht infektiösen Ursachen der SIRS unterscheiden können.
Procalcitonin ist ein 1 16 Aminosäuren langes Peptid das eine Rolle bei Entzündungsreaktionen spielt. Dieser Marker ist im Laufe der Zeit zunehmend als neuer Infektionsmarker auf Intensivstationen eingesetzt worden [Sponholz et al., 2006]. Dieser Marker gilt als Infektionsmarker und dient dazu, den Schweregrad der Sepsis festzulegen, wobei die Dynamik der Werte wichtiger ist als die Absolutwerte selbst, um z. B. bei Herzchirurgie-Patienten zwischen infektiöser und nicht-infektiöser Komplikation zu unterscheiden [Sponholz et al., 2006]. Trotz der weitgehenden Akzeptanz des Biomarkers PCT konnte in internationalen Studien gezeigt werden, dass die erreichten Sensitivitäten und Spezifitäten des Sepsismarkers PCT vor allem bei der Abgrenzung einer systemischen bakteriellen SIRS, also Sepsis, von einer nicht -bakteriellen SIRS noch immer unzureichend sind [Ruokonen et al., 1999; Suprin et al. 2000; Ruokonen et al.,2002; Tang et al., 2007a]. Die Meta-Analyse von Tang und Kollegen [Tang et al., 2007a], in der 18 Studien berücksichtigt wurden, zeigt, dass PCT nur schlecht geeignet ist, um SIRS von Sepsis zu diskriminieren. Darüberhinaus betonen die Autoren, dass PCT eine sehr schwache diagnostische Genauigkeit mit einem Odd Ratio (OR) von 7.79 hat. Als Regel benennen die Autoren, dass ein OR <25 nicht aussagekräftig, zwischen 25 und 100 hilfreich und im Falle von mehr als 100 hoch genau ist [Tang et al., 2007a].
C-reaktives Protein (CRP) ist ein 224 Aminosäuren langes Protein, das eine Rolle bei Entzündungsreaktionen spielt. Die Messung von CRP soll dazu dienen, um den Krankheitsverlauf sowie die Wirksamkeit der gewählten Therapie zu verfolgen.
In mehreren Berichten wurde beschrieben, dass im intensivmedizinischen Bereich PCT ein besser geeigneter diagnostischer Marker als CRP ist [Sponholz et al., 2006; Kofoed et al., 2007]. Darüber hinaus wird PCT als besser geeignet als CRP angesehen, um eine nicht infektiöse versus infektiöse SIRS sowie bakterielle versus virale Infektion zu unterscheiden [Simon et al., 2004].
Die dritte Gruppe enthält Biomarker oder Profile, die auf Transkriptom - Ebene identifiziert wurden. Diese molekularen Parameter sollten eine bessere Korrelation der molekularen inflammatorischen/immunologischen Wirtsantwort mit dem Schweregrad der Sepsis ermöglichen, aber auch Aussagen zur individuellen Prognose liefern. Nach derartigen Biomarkern wird derzeit von verschiedenen wissenschaftlichen Gruppen und kommerziellen Organisationen intensiv gesucht, wie zum Beispiel Veränderungen der Cytokinkonzentrationen im Blut verursacht durch Bakterienzellwandbestandteile wie Lipopolysaccharide [Mathiak et al., 2003], oder Verwendung von Genexpressionsprofilen in einer Blutprobe zur Bestimmung von Unterschieden bei überlebenden und nicht-Überlebenden Sepsispatienten [Pachot et al., 2006]. Genexpressionsprofile oder Klassifikatoren sind für die Bestimmung des Schwergrads von Sepsis [WO 2004/087949], die Unterscheidung zwischen einer lokalen oder systemischen Infektion [nicht veröffentlichte DE 10 2007 036 678.9], die Identifizierung der Infektionsquelle [WO 2007/124820] oder von Genexpressionssignaturen für die Unterscheidung zwischen mehreren Ätiologien und Pathogen-assoziierten Signaturen [Ramilo et al., 2007] geeignet. Allerdings besteht aufgrund der unzureichenden Spezifität und Sensitivität der Konsensuskriterien nach [Bone et al., 1992], der aktuell verfügbaren Proteinmarker sowie aufgrund des Zeitbedarfs des Nachweises der Infektionsursache durch Blutkultur ein dringender Bedarf für neue Verfahren, die die Komplexität der Erkrankung berücksichtigen. Viele Geneexpressionsstudien, die entweder einzelne Gene und/oder Kombinationen von Genen, die als Klassifkatoren benannt sind, verwenden sowie zahlreiche Beschreibungen von statistischen Verfahren zur Ableitung eines Score und/oder Index [WO03084388; US6960439] gehören zum Stand der Technik.
Es besteht heute ein Konsens dahingehend, dass komplexe Erkrankungen sinnvoll nur über mehrere Parameter beschrieben werden können.
In zunehmendem Maße finden molekulare Signaturen Eingang in die klinische Diagnostik, insbesondere bei komplexen Erkrankungen, die mit herkömmlichen Biomarkern nicht erfasst werden können, aber auch zur Beurteilung von Risiken für die Patienten und zur Identifizierung von Respondern beim Einsatz von Medikamenten und Therapien. Nachfolgende Aufzählung soll den aktuellen Stand und die Einsatzgebiete der Genexpressionsdiagnostik verdeutlichen.
1 ) Die Microarray-basierte, 70 Gene umfassende Signatur namens MammaPrint (Aqendia, NL) erlaubt es, eine Prognose über das Rezidiv- und Metastasierungsrisiko von Frauen mit Brustkrebs zu treffen. Dabei wird untersucht, ob das Risiko, in den nächsten Jahren entfernte Metastasen zu entwickeln, als hoch oder niedrig eingestuft werden kann und sie von einer Chemotherapie profitieren würden. Die Zulassung dieses Tests durch die FDA brachte die Entwicklung von Richtlinien für eine neue Klasse von diagnostischen Tests, sog. IVDMIA (in vitro diagnostic multivariate index assay) mit sich. Die MammaPrint-Signatur wird auf einem Mikroarray in den Laboren des Herstellers gemessen und berechnet.
2) An Formalin-fixierten Gewebeproben wird mittels des Oncotype DX -Multiqen- Assavs (Genomic Health, USA) die Wahrscheinlichkeit des Wiederauftretens von Brustkrebs in Patientinnen beurteilt, sowie das Ansprechen der Patientinnen auf Chemotherapie geprüft. 21 Gene werden als „Recurrence-Score" zusammengefasst. Die Messung findet in den Räumen der Firma statt, es kommt ebenfalls die TaqMan- PCR Technologie zum Einsatz.
3) Der AlloMap Genexpressionstest der Firma XDx (USA) wird zur Überwachung eventueller Abstoßungsreaktionen bei Patienten mit Herztransplantation eingesetzt, die ca. 30 % der Patienten innerhalb eines Jahres zeigen. Bislang waren zur Diagnose mehrere Biopsien notwendig. Der Test basiert auf 1 1 quantitativen PCR- Assays (zusätzlich 9 Kontrollen und Referenzen) unter Nutzung der TaqMan Technologie (Hoffman-La Roche) in den Räumen des Herstellers. Das Probenmaterial ist Blut. Bereits zwei Monate nach der Transplantation sind die Messergebnisse zuverlässig und sagen das Ausbleiben von Abstoßungsreaktionen für die nächsten 80 Tage voraus.
Eine Gemeinsamkeit dieser Tests ist, dass die addressierte diagnostische Fragestelllung Untersuchungszeiten bis zum Vorliegen des Ergebnisses von mehreren Tagen erlaubt. Für diagnostische Tests in der Indikation Sepsis dagegen, muß die Information innerhalb eines einzigen Arbeitstages vorliegen.
Mehrere Anwendungen von Genexpressionsprofilen sind in dem Stand der Technik bekannt.
Pachot und Kollegen demonstrieren den Nutzen von Expressionssignaturen für die Verlaufsbeurteilung von Patienten mit septischem Schock. Hier finden sich molekulare Unterschiede, die die Wiederherstellung eines funktionierenden Immunsystems in den Überlebenden wiederspiegeln. 28 Markergene mit Funktionen im innaten Immunsystem zeigen innerhalb des ersten Tages nach Diagnose des septischen Schocks mit hoher Sensitivität (100%) und Spezifität (88%) an, ob die Immunparalyse reversibel ist und damit das Überleben des Patienten ermöglicht. Allerdings war in der Untersuchung das Patientenkollektiv zu klein (38) um ein robustes Profil zu erstellen und eine Validierung dieses Datensatzes durch einen unabähngigen Datenatz ist bislang nicht erfolgt. Der Stand der Technik enthält zahlreiche Studien zur Identifikation von Genexpressionsmarkern [Tang et al., 2007b] oder Genexpressionsprofilen für die Feststellung einer systemischen Infektion [Johnson et al., 2007].
Tang und Kollegen [Tang et al., 2007b] suchten in einer bestimmten Blutzellpopulation, den Neutrophilen, nach einer Signatur, welche eine Unterscheidung von Patienten mit SIRS und Sepsis ermöglicht. 50 Marker aus dieser Zellpopulation genügen um die Immunantwort auf eine systemische Infektion wiederzugeben und neue Erkenntnisse zur Pathophysiologie und den beteiligten Signalwegen zu ermöglichen.
Die Klassifikation von Patienten mit und ohne Sepsis gelingt mit hoher Sicherheit (PPV 88% bzw. 91 % in Trainings- und Testdatensatz). Die Anwendbarkeit für die klinische Diagnose ist allerdings dadurch begrenzt, dass im Blut diese Signatur von Signalen aus anderen Blutzelltypen überlagert werden kann. Bezüglich der Anwendbarkeit ist die Präparation dieser Blutzellpopulation mit erheblich erhöhtem Aufwand verbunden. Die Aussagekraft der in dieser Studie publizierten Ergebnisse ist für praktische Anwendungen jedoch limitiert, weil die Patientenauswahl sehr stark heterogen war. Es wurden Patienten in die Studie eingeschlossen, die stark unterschiedliche Begleiterkrankungen wie z. B zu 1 1 % bis 16% Tumorerkrankungen aufwiesen oder sehr stark unterschiedlichen therapeutischen Maßnahmen unterlagen (z.B. 27% bis 64% Vasopressor-Therapie), wodurch die Genexpressionsprofile stark beeinflusst wurden.
Johnson und Kollegen [Johnson et al., 2007] beschreiben an einem Kollektiv von Traumapatienten, dass sich die Ausprägung einer Sepsis bereits bis zu 48 Stunden vor der klinischen Diagnose anhand molekularer Veränderungen messen lässt. Die Traumapatienten wurden über mehrere Tage untersucht. Ein Teil der Patienten entwickelte eine Sepsis. Nichtinfektiöse SIRS-Patienten wurden mit präseptischen Patienten verglichen. Die identifizierte Signatur aus 459 Transkripten setzt sich aus Markern der Immunantwort und Entzündungsmarkern zusammen. Probenmaterial war Vollblut, die Analysen wurden auf einem Mikroarray durchgeführt. Unklar ist, ob sich diese Signatur auch auf andere Kollektive septischer bzw. präseptischer Patienten ausdehnen lässt. Eine Klassifikation und der diagnostische Nutzen dieser Signatur wurde nicht gezeigt.
Weiterhin werden im Stand der Technik andere Signaturen beschrieben, beispielsweise die Antwort des Wirtes auf eine Infektion.
Die Spezifität der Wirtsantwort auf unterschiedliche Erreger ist bisher in mehreren experimentellen Systemen untersucht worden. In keiner Studie jedoch wurden Genexpressionsprofile und/oder Signaturen von Sepsis-Patienten beschrieben. Das Ziel von Feezor und Kollegen [Feezor et al., 2003] war es, Unterschiede zwischen Infektionen mit gram-negativen und gram-positiven Erregern zu identifizieren. Blutproben von drei verschiedenen Spendern wurden ex vivo mit E.coli- LPS und Hitze-inaktiviertem S.aureus stimuliert. Mittels Microarraytechnologie wurden Genexpressionsuntersuchungen durchgeführt. Die Arbeitsgruppe fand sowohl Gene, die nach S.aureus-s-Stimulation hochreguliert und nach LPS-Stimulation herunterreguliert waren, als auch Gene die nach LPS-Behandlung stärker exprimiert wurden als nach der Zugabe von Hitze-inaktivierten S.aureus-Keimen. Gleichzeitig wurden viele Gene durch gram-positive und gram-negative Stimulation in gleichem Maße hochreguliert. Dies betrifft zum Beispiel die Zytokine TNF-α, IL-1 ß und IL-6. Die differentiell exprimierten Gene wurden leider nicht namentlich veröffentlicht, so dass lediglich ein indirekter Vergleich anderen Ergebnissen möglich ist. Neben der Genexpression wurden von Feezor et al. auch die Plasmakonzentrationen einiger Zytokine untersucht. Dabei korrelierten die Genexpressionsdaten nicht zwangsweise mit den Plasmakonzentrationen. Bei der Genexpression wird die Menge an mRNA vermessen. Diese ist jedoch vor der Proteinsynthese posttranskriptionaler Regulation unterworfen, woraus die beobachteten Unterschiede resultieren können.
Die interessanteste Publikation zu diesem Thema wurde von einer texanischen Forschungsgruppe um Ramilo [Ramilo et al., 2007], veröffentlicht. Hier wurden ebenfalls Genexpressionsuntersuchungen an humanen Blutzellen durchgeführt, die Unterschiede in der molekularen Wirtsreaktion auf verschiedene Pathogene aufdeckten. Dazu wurden pediatrische Patienten mit akuten Infektionen, wie z.B. akuten Atemwegserkrankungen, Harnwegsinfektionen, Bakteriämien, lokalen Abszessen, Knochen- und Gelenkinfektionen sowie Meningitis untersucht. Microarrayexperimente wurden mit RNA-Proben durchgeführt, die aus peripheren mononuklearen Blutzellen von jeweils zehn Patienten mit E.coli- bzw. S.aureus- Infektion isoliert wurden. Die Identifizierung der Erreger erfolgte mittels Blutkultur. Anhand des Trainingsdatensatzes wurden 30 Gene identifiziert, durch deren Verwendung die verursachenden pathogenen Keime mit hoher Genauigkeit diagnostiziert werden konnten. Trotz der zahlreichen publizierten Studien und der darin beschriebenen individuellen Signaturen, die den Stand der Technik begründen, erlaubt keine davon eine diagnostische Ausage über Sepsis und/oder Sepsis-ähnliche Zustände. Keine dieser Publikationen bietet die Zuverlässigkeit, Genauigkeit und Robustheit der hier offenbarten Erfindung. Diese Studien sind darauf konzentriert, den aus wissenschaftlicher Sicht "besten" Multigenbiomarker (Klassifikator) zu identifizieren, jedoch nicht, wie in der vorliegenden Erfindung, den für eine spezifische klinische Fragestellung optimalen Multigenbiomarker [Simon et al., 2005].
Somit ist es Aufgabe der vorliegenden Erfindung, ein Testsystem zur Verfügung zu stellen, mit dem eine schnelle und zuverlässige Aussage über einen pathophysiologischen Zustand, beispielsweise Sepsis, möglich ist.
Die Lösung dieser Aufgabe erfolgt verfahrenstechnisch durch die Merkmale des Anspruchs 1.
Bezüglich einer Verwendung wird die Aufgabe durch die Merkmale der Ansprüche 4 und 1 1 gelöst.
Ein Kit gemäß Anspruch 14 löst die Aufgabe ebenfalls.
In allgemeiner Form betrifft die vorliegende Erfindung ein System, das folgende Elemente umfaßt:
• Set von Genaktivitätsmarkern
• Referenzgene als interne Kontrolle für die Normalisierung der Genaktivitätsmarkersignale in Vollblut
• Detektion hauptsächlich über Real-Time-PCR oder andere Amplifikationsverfahren oder Hybridisierungsverfahren • Verwendung eines Algorithmus, um die Einzelergebnisse der Genaktivitätsmarker zu einem gemeinsamen numerischen Wert, Index oder auch Score, umzuwandeln
• Darstellung dieses numerischen Wertes auf einer entsprechend eingeteilten Skala
• Kalibrierung, d.h. Einteilung der Skala entsprechend der intendierten Anwendung durch vorherige Validierungsexperimente.
Das System liefert eine Lösung für das Problem der Feststellung von Krankheitszuständen wie z. B. die Unterscheidung von infektiösem und nichtinfektiösem Multiorganversagen aber auch für andere in diesem Kontext relevante Anwendungen und Fragestellungen.
Insbesondere betrifft die vorliegende Erfindung ein Verfahren zur in vitro Erfassung und/oder Unterscheidung und/oder Verlaufsbeobachtung von pathophysiologischen Zuständen, ausgewählt aus der Gruppe bestehend aus: SIRS, Sepsis und deren Schweregraden; sepsisähnlichen Zuständen; septischem Schock; infektiösem/nicht-infektiösem Multiorganversagen; Überlebenswahrscheinlichkeit bei Sepsis; Fokus einer Infektion; Responder/non-Responder für eine bestimmte Therapie; Ursachen eines pathophysiologischen Zustandes, insbesondere Klassifizierung einer Infektion nach gram-positiven und/oder gram-negativen Bakterien; wobei das Verfahren folgende Schritte umfaßt:
a) Isolierung von Probennukleinsäuren aus einer von einem Patienten stammenden Probe;
b) Bestimmung von Genaktivitäten mittels einer Mehrzahl von Polynukleotiden, ausgewählt aus der Gruppe bestehend aus SEQ-ID NO: 1 bis SEQ-ID NO: 669 und/oder deren Genloci und/oder deren Transkripten und/oder Fragmenten davon, zur Bildung wenigstens eines für die Erfassung und/oder Unterscheidung und/oder den Verlauf von pathophysiologischen Zuständen eines Patienten charakteristischen Multigenbiomarkers;
c) Bestimmung von Genaktivitäten wenigstens eines internen Referenzgens, auf die die unter b) bestimmten Genaktivitäten bezogen, insbesondere normalisiert, werden;
d) Bilden eines Index-Wertes aus den einzelnen bestimmten normalisierten Genaktivitäten des Multigenbiomarkers, der den pathophysiologischen Zustand anzeigt.
In einem bevorzugten Verfahren ist das wenigstens eine Referenzgen ein Housekeepinggen, wobei das Housekeepinggen insbesondere ausgewählt ist aus Polynukleotiden der Gruppe bestehend aus SEQ-ID NO: 676 bis SEQ-ID NO: 686 und/oder deren Genloci und/oder deren Transkripten und/oder Fragmenten davon.
Bevorzugt werden als Polynukleotidsequenzen Genloci, sense und/oder antisense Stränge von prä-mRNA und/oder mRNA, small RNA, insbesondere scRNA, snoRNA, micro RNA, siRNA, dsRNA, ncRNA oder transposable Elemente verwendet.
Der Index wird vorzugsweise mittels statistischer Verfahren wie überwachte Klassifikationsverfahren aus dem Bereich des maschinellen und statischen Lernens wie z.B. (diagonale, lineare, quadratische) Diskriminanzanalyse, Super vector machines, verallgemeinerte partielle kleinste Quadrate, k-nächste Nachbarn, random forests, k-nächste Nachbar ermittelt. Für eine lineare Diskriminanzanalyse kann beispielsweise folgende Formel verwendet werden:
Figure imgf000016_0001
Die Erfindung betrifft ferner die Verwendung einer Mehrzahl von Polynukleotiden, ausgewählt aus der Gruppe bestehend aus SEQ-ID NO: 1 bis SEQ-ID NO: 669 und/oder deren Genloci und/oder deren Transkripten und/oder Fragmenten davon, zur Bildung wenigstens eines Multigenbiomarkers zur Herstellung eines Multiplex- Assays als Hilfsmittel zur Beurteilung, ob bei einem Patienten ein pathophysiologischer Zustand vorliegt, und/oder zur Feststellung des Schweregrades und/oder des Verlaufs des pathophysiologischen Zustands.
Bevorzugt ist der Multigenbiomarker eine Kombination von mehreren Polynukleotid-, insbesondere Gensequenzen, anhand deren Genaktivitäten mittels einer Interpretationsfunktion eine Klassifikation durchgeführt und/oder ein Index oder Score gebildet wird.
Für die Zwecke der vorliegenden Erfindung hat es sich als vorteilhaft herausgestellt, dass die Genaktivitäten mittels enzymatischer Verfahren, insbesondere Amplifikationsverfahren, bevorzugt Polymereasekettenreaktion (PCR), vorzugsweise Real-Time-PCR; und/oder mittels Hybridisierungsverfahren, insbesondere solchen auf Microarrays, erfasst werden.
Bei der Erfassung der Genaktivitäten auftretende differentielle Expressionssignale der in dem Multigenbiomarker enthaltenen Polynukleotidsequenzen können vorteilhaft und eindeutig einem pathophysiologischen Zustand, einem Verlauf und/oder Therapiemonitoring zugeordnet werden.
Typischerweise wird aus den einzelnen bestimmten Genaktivitäten ein Index gebildet wird, der nach entsprechender Kalibrierung ein Maß für den Schweregrad und/oder den Verlauf des pathophysiologischen Zustands, insbesondere der Sepsis oder des sepsisähnlichen Zustandes, ist.
Dieser Index oder Score kann auf einer leicht interpretierbaren Skala angezeigt werden, um dem behandelnden Arzt eine schnelles diagnostisches Hilfsmittel in die Hand zu geben.
Bei einer vorteilhaften Ausführungsform der Erfindung werden die erhaltenen Genaktivitätsdaten zur Herstellung von Software für die Beschreibung mindestens eines pathophysiologischen Zustands und/oder einer Untersuchungsfrage und/oder als Hilfsmittel für Diagnosezwecke und/oder für Patientendatenmangement-Systeme eingesetzt.
Zur Erstellung der Genaktivitätsdaten werden vorteilhaft solche spezifischen Genloci, sense und/oder antisense Stränge von prä-mRNA und/oder mRNA, small RNA, insbesondere scRNA, snoRNA, micro RNA, siRNA, dsRNA, ncRNA oder transposable Elemente, Gene und/oder Genfragmente verwendet, welche eine Sequenzhomologie von mindestens ca. 10%, insbesondere ca. 20%, vorzugsweise ca. 50%, besonders bevorzugt ca. 80% zu den Polynukleotidsequenzen gemäß SEQ- ID NO: 1 bis SEQ-ID NO: 669 aufweisen.
Die Erfindungsgemäß betrifft ferner die Verwendung wenigstens eines Polynukleotids, ausgewählt aus der Gruppe bestehend aus SEQ-ID NO: 1 bis SEQ-ID NO: 152 und/oder deren Genloci und/oder deren Transkripten und/oder Fragmenten davon, zur Herstellung eines Assays zur Beurteilung, ob bei einem Patienten ein pathophysiologischer Zustand vorliegt, und/oder zur Feststellung des Schweregrades und/oder des Verlaufs des pathophysiologischen Zustands.
Der pathophysiologische Zustand ist vorteilhaft ausgewählt aus der Gruppe, bestehend aus: SIRS, Sepsis und deren Schweregraden; sepsisähnlichen Zuständen; septischer Schock; infektiösem/nicht-infektiösem Multiorganversagen; lokaler/systemischer Infektion; Verbesserung/Verschlechterung eines pathophysiologischen Zustandes, insbesondere Sepsis; Responder/non-Responder für eine bestimmte Therapie; Fokus einer Infektion; Ursachen eines pathophysiologischen Zustandes, insbesondere Klassifizierung nach gram-positiv und/oder gram-negativ.
Erfindungsgemäß ist es bevorzugt, dass die Probennukleinsäure RNA, insbesondere Gesamt-RNA oder mRNA, oder DNA, insbesondere cDNA, ist.
Die Erfindung betrifft ferner einen Kit zur Durchführung des erfindungsgemäßen Verfahrens, enthaltend mindestens einen Multigenbiomarker, welcher eine Mehrzahl von Polynukleotidsequenzen umfasst, die aus dem Pool von SEQ-ID NO: 1 bis SEQ- ID NO: 669 und/oder deren Genloci und/oder deren Transkripten und/oder Fragmenten davon ausgewählt sind, und/oder Primer und/oder Sonden und/oder Antisensenukleotide hierfür, wobei der Multigenbiomarker spezifisch für einen pathophysiologischen Zustand eines Patienten ist und solche Zustände einschließt, die ausgewählt sind aus der Gruppe bestehend aus: SIRS, Sepsis und deren Schweregraden; sepsisähnlichen Zuständen; septischem Schock; infektiösem/nichtinfektiösem Multiorganversagen; Überlebenswahrscheinlichkeit bei Sepsis; lokaler/systemischer Infektion; Responder/non-Responder für eine bestimmte Therapie; Fokus einer Infektion; Ursachen eines pathophysiologischen Zustandes, insbesondere Klassifizierung einer Infektion nach gram-positiven oder gramnegativen Erregern.
Die Polynukleotidsequenzen des Kits umfassen bevorzugt auch Genloci, sense und/oder antisense Stränge von prä-mRNA und/oder mRNA, small RNA, insbesondere scRNA, snoRNA, micro RNA, siRNA, dsRNA , ncRNA oder transposable Elemente.
Als Multigenbiomarker für die Unterscheidung von SIRS/Sepsis oder von infektiösem/nicht-infektiösem Multiorganversagen werden vorzugsweise die Polynukleotidsequenzen mit den in Tab. 1 1 und 16 angegebenen SEQ-IDs eingesetzt. Als Multigenbiomarker für die Unterscheidung von Ursachen eines pathophysiologischen Zustandes, insbesondere Klassifizierung nach gram-positiven und/oder gram-negativen Bakterien, werden vorzugsweise die Polynukleotidsequenzen mit den in Tab. 20 und 21 angegebenen SEQ-IDs eingesetzt.
Die vorliegende Erfindung ermöglicht es, als Teil eines integrierten Systems (In Vitro Diagnostic Multivariate Index Assay, IVDMIA) eine potenzielle infektiöse Komplikation in Patienten mit SIRS oder möglichen Sepsis einzuschätzen. Dieses System umfasst die Wahl der Patienten und die Bestimmung von deren Genexpressionssignalen in einem interpretierbaren Index, welchen der Arzt als Hilfsmittel zur Diagnose verwenden kann. Dieses System kombiniert die gemessenen Genexpressionsdaten von definierten Sequenzgruppen ausgewählt aus SEQ-ID NO: 1 bis SEQ-ID NO: 669 und/oder deren Genloci und/oder deren Transkripten und/oder Fragmenten davon, sowie von Housekeepinggenen. In einer bevorzugten Ausführungsform der vorliegenden Erfindung werden zur Erstellung der Genaktivitätsdaten solche spezifischen Gene und/oder Genfragmente verwendet, die eine Sequenzhomologie von mindestens ca. 10%, insbesondere ca. 20%, vorzugsweise ca. 50%, besonders bevorzugt ca. 80% zu den Polynukleotidsequenzen gemäß SEQ-ID NO: 1 bis SEQ- ID NO: 669 oder zu den Housekeepinggenen aufweisen.
Tab. 32 zeigt den hochrelevanten Sequenzpool, der für verschiedene klinische Fragenstellungen wichtig ist.
Tab. 8, 1 1 und 16 zeigen eine bevorzugte Wahl von Sequenzen, die, wenn in das obengennantes System integriert, für die Unterscheidung zwischen SIRS und Sepsis essentiell sind.
Die Wahl der Sequenzen aus dem hochrelevanten Sequenzpool ist von der klinischen Fragestellung abhängig.
Die Anmelderin hat ein Verfahren entwickelt, das große Sequenzpools benutzt, um Zustände festzustellen und/oder zu unterscheiden oder definierte Untersuchungsfragen zu beantworten. Beispiele sind in folgenden Patentschriften zu finden: Unterscheidung zwischen SIRS, Sepsis und sepsisähnlichen Zuständen [WO 2004/087949; WO 2005/0831 15], Erstellung von Kriterien zur Vorhersage des Krankheitsverlaufs bei Sepsis [WO 05/106020], Unterscheidung zwischen nichtinfektiösen und infektiösen Ursachen eines Multiorganversagens [WO 2006/042581 ], in vitro Klassifizierung von Genexpressionsprofilen von Patienten mit infektiösem/nichtinfektiösem Multiorganversagen [WO 2006/100203], Feststellung der lokalen Ursachen eines Fiebers unklarer Genese [WO 2007/144105], Polynukleotide zur Erfassung von Genaktivitäten für die Unterscheidung zwischen lokaler und systemischer Infektion [DE 10 2007 036 678.9]. Die Erfindung betrifft Polynukleotidsequenzen, ein Verfahren und ferner Kits zur Erstellung von Multigenbiomarkern, die in einem und/oder mehreren Modulen Merkmale eines „In Vitro Diagnostic Multivariate Index Assay" (IVDMIA) aufweisen.
Definitionen:
Für die Zwecke der vorliegenden Erfindung werden folgende Definitionen verwendet:
Zustand: die klinisch definierten Schweregrade „systemic inflammatory response Syndrom" (SIRS), „sepsis", „severe sepsis" und „septic shock" wie definiert in [Bone et al., 1992] und das PIRO Konzept [Levy et al., 2003].
Multiorganversagen: Als Multiorganversagen bezeichnet man das gleichzeitig oder in rascher zeitlicher Abfolge auftretende Versagen von zwei oder mehr vitalen Organsystemen. Das Multiorgandysfunktionssyndrom (MODS) geht als initiale Organinsuffizienz dem MOV voraus [Zeni et al., 1997]. Man spricht heute vom Multiorganversagen wenn zwei oder mehr Organe gleichzeitig oder nacheinander Funktionstörungen aufweisen, wobei ein chronisch persistierendes Organversagen auszuschließen ist. Die Prognose des MOV hängt eng mit der Anzahl der beteiligten Organsysteme zusammen. Die Mortalität beträgt bei Versagen eines Organs innerhalb der ersten 24 Stunden 22%, nach 7 Tagen 41 %. Beim Versagen von drei Organsystemen steigt die Mortalität am ersten Tag auf 80 % und nach 4 Tagen auf 100 % an [Knaus et al., 1985].
Ein wichtiger Pathomechanismus für die Entstehung von MODS und MOV ist die Entwicklung eines systemischen Inflammationssyndromes (SIRS, [Bone et al., 1992]. MODS und MOV können sowohl infektiologischer als auch nicht- infektiologischer Genese sein.
Fieber unklarer Genese: Fieber unklarer Genese (Fever of unknow origin, FUO) ist klinisch definiert als ein Fieber, bei dem die Temperatur über einen Zeitraum von mehr als 3 Wochen höher als 38,8°C ist, ohne dass nach einer einwöchigen Untersuchungszeit eine eindeutige Diagnose der Ursache vorliegt. In Abhängigkeit des Ursprungs wurden vier Klassen des FUO beschrieben: FUO klassischen, nosokomialen, immunschwachen oder HlV-bezogenen Ursprungs [Roth und Basello, 2003]. FUO wurde auch als "eine eher bekannte Krankheit mit einem ungewöhnlichen Erscheinungsbild als eine seltene Störung" geschildert [Amin und Kauffman, 2003].
Nur in 10% der Patienten mit postoperativem Fieber wird eine Infektion dokumentiert [PiIe et al., 2006]. In den meisten Fälle geht die Temperatur des Patienten innerhalb von vier Tagen nach dem Eingriff zurück auf Normaltemperatur. Trotzdem entwickeln einige Patienten am oder nach dem fünften postoperativem Tag eine Infektion, wobei es sich in 12% der Fälle um eine Lungenentzündung handelt. Ebenso wird von PiIe und Kollegen berichtet, dass es sich bei Fieber, welches zwei Tage nach dem Eingriff auftritt, mit hoher Wahrscheinlichkeit um eine Infektion handelt, wie z.B. eine Infektion der Harnwege und/ oder des inneren Unterleibs (Peritonitis), Lungenentzündung oder eine durch einen intravenösen Katheder ausgelöste Infektion.
Untersuchungsfrage: Eine klinische relevante Frage, die für die Behandlung eines Patientes wichtig ist, beispielsweise: Vorhersage des Krankheitsverlaufs, Therapieüberwachung, Fokus der Infektion, Überlebenschancen, Prädisposition, etc.
Eine systemische Infektion ist eine Infektion, bei der sich die Erreger über die Blutbahn im gesamten Organismus ausgebreitet haben.
SIRS: Systemic Inflammatory Response Syndrome, nach Bone [Bone et al., 1992] und Levy [Levy et al., 2003] ein generalisierter, inflammatorischer, nichtinfektiöser Zustand eines Patienten.
Sepsis: Nach Bone [Bone et al., 1992] und Levy [Levy et al., 2003] ein generalisierter, inflammatorischer infektiöser Zustand eines Patienten. Biologische Flüssigkeit: Als biologische Flüssigkeiten im Sinne der Erfindung werden alle Körperflüssigkeiten der Säugetiere, einschließlich des Menschen, verstanden.
Gen: Ein Gen ist ein Abschnitt auf der Desoxyribonukleinsäure (DNA), der die Grundinformationen zur Herstellung einer biologisch aktiven Ribonukleinsäure (RNA) sowie regulatorische Elemente, welche diese Herstellung aktivieren oder inaktivieren, enthält. Als Gene im Sinne der Erfindung werden auch alle abgeleiteten DNA- Sequenzen, Partialsequenzen und synthetische Analoga (beispielsweise Peptido- Nukleinsäuren (PNA)) verstanden. Die auf Bestimmung der Genexpression auf RNA- Ebene bezogene Beschreibung der Erfindung stellt somit ausdrücklich keine Einschränkung sondern nur eine beispielhafte Anwendung dar.
Genlocus: Genlocus (Genort) ist die Position eines Gens im Genom. Besteht das Genom aus mehreren Chromosomen, ist die Position innerhalb des Chromosoms gemeint, auf dem sich das Gen befindet. Verschiedene Ausprägungen oder Varianten dieses Gens werden als Allele bezeichnet, die sich alle an derselben Stelle auf dem Chromosom, nämlich dem Genlocus befinden. Somit beinhaltet der Begriff „Genlocus" einerseits die reine genetische Information für ein spezifisches Genprodukt und andererseits sämtliche regulatorische DNA-Abschnitte sowie sämtliche zusätzliche DNA-Sequenzen, welche mit dem Gen am Genlocus in irgendeinem funktionellen Zusammenhang stehen. Die letzteren schließen an Sequenzregionen an, die in der unmittelbar Nähe (1 Kb) aber außerhalb des 5-' und/oder 3'- Endes eines Genlocus liegen. Die Spezifizierung des Genlocus erfolgt durch die Accession-Nummer und/oder RefSeq ID des RNA-Hauptproduktes, welches von diesem Locus abstammt.
Genaktivität: Unter Genaktivität wird das Maß der Fähigkeit eines Gens verstanden, transkribiert zu werden und/oder Translationsprodukte zu bilden.
Genexpression: Der Vorgang, ein Genprodukt zu bilden und/oder Ausprägung eines Genotyps zu einem Phänotyp. Multigenbiomarker: Kombination von mehreren Gen-Sequenzen deren Genaktivitäten mittels einer Interpretationsfunktion ein kombiniertes Gesamtergebnis (z.B. eine Klassifikation und/oder ein Index) bilden. Dieses Ergebnis ist spezifisch für einen Zustand und/oder eine Untersuchungsfrage.
Hybridisierungsbedingungen: Dem Fachmann wohl bekannte physikalische und chemische Parameter, welche die Etablierung eines thermodynamischen Gleichgewichtes aus freien und gebundenen Molekülen beeinflussen können. Im Interesse optimaler Hybridisierungsbedingungen müssen Zeitdauer des Kontaktes der Sonden- und Probenmoleküle, Kationenkonzentration im Hybridisierungspuffer, Temperatur, Volumen sowie Konzentrationen und -Verhältnisse der hybridisierenden Moleküle aufeinander abgestimmt werden.
Amplifikationsbedingungen: Konstante oder sich zyklisch verändernde Reaktionsbedingungen, welche die Vervielfältigung des Ausgangsmateriales in Form von Nukleinsäuren ermöglichen. Im Reaktionsgemisch liegen die Einzelbausteine (Desoxyribonukleotide) für die entstehenden Nukleinsäuren vor, ebenso wie kurze Oligonukleotide, welche sich an komplementäre Bereiche im Ausgangsmaterial anlagern können, sowie ein Nukleinsäure-Synthese-Enzym, Polymerase genannt. Dem Fachmann wohl bekannte Kationenkonzentrationen, pH-Wert, Volumen und die Dauer und Temperatur der einzelnen Reaktionsschritte sind von Bedeutung für den Ablauf der Amplifikation.
Primer: Als Primer wird in der vorliegenden Erfindung ein Oligonukleotid bezeichnet, das als Startpunkt für Nukleinsäure-replizierende Enzyme wie z. B. die DNA-Polymerase dient. Primer können sowohl aus DNA als auch aus RNA bestehen (Primer3, siehe z.B. http://frodo.wi. mit.edu/cgi-bin/primer3/primer3_www.cgi des MIT)
Sonde: In der vorliegenden Anmeldung ist eine Sonde ein
Nukleinsäurefragment (DNA oder RNA), das mit einer molekularen Markierung (z.B. Fluoreszenzlabel, insbesondere Scorpion®, molecular beacons, Minor Groove Binding- Sonden, TaqMan®-Sonden, Isotopenmarkierung, usw.) versehen werden kann und zur sequenzspezifischen Detektion von Ziel-DNA- und/oder Ziel-RNA- Molekülen eingesetzt wird.
PCR: ist die Abkürzung für die englische Bezeichnung „Polymerase Chain Reaction" (Polymerase-Kettenreaktion). Die Polymerase-Kettenreaktion ist eine Methode, um DNA in vitro außerhalb eines lebenden Organismus mit Hilfe einer DNA-abhängigen DNA Polymerase zu vervielfältigen. PCR wird insbesondere gemäß der vorliegenden Erfindung eingesetzt, um kurze Teile - bis zu etwa 3.000 Basenpaare - eines interessierenden DNA-Strangs zu vervielfältigen. Dabei kann es sich um ein Gen oder auch nur um einen Teil eines Gens oder auch um nicht kodierende DNA-Sequenzen handeln. Es ist dem Fachmann wohl bekannt, dass eine Reihe von PCR-Verfahren im Stand der Technik bekannt sind, welche alle durch den Begriff „PCR" mit umfasst sind. Dies gilt insbesondere für die „Real-Time-PCR" (vgl. auch die Erläuterungen weiter unten).
PCR-Primer: Typischerweise benötigt eine PCR zwei Primer, um auf den beiden Einzelsträngen der DNA jeweils den Startpunkt der DNA-Synthese festzulegen, wodurch der zu vervielfältigende Bereich von beiden Seiten begrenzt wird. Derartige Primer sind dem Fachmann wohlbekannt, beispielsweise aus der Website „Primer3", siehe z.B. http://frodo.wi. mit.edu/cgi-bin/primer3/primer3_www.cgi des MIT.
Transkript: Für die Zwecke der vorliegenden Anmeldung wird unter einem Transkript jegliches RNA-Produkt verstanden, welches anhand einer DNA-Vorlage hergestellt wird.
Small RNA: Kleine RNAs im Allgemeinen. Vertreter dieser Gruppe sind insbesondere, jedoch nicht ausschließlich: a) scRNA (small cytoplasmatic RNA), welche eines von mehreren kleinen RNA-Molekülen im Cytoplasma eines Eukaryonten ist. b) snRNA (small nuclear RNA), eine der vielen kleinen RNA-Formen, die nur im Zellkern vorkommen. Einige der snRNAs spielen beim Spleißen oder bei anderen RNA-verarbeitenden Reaktionen eine Rolle. c) small non-protein-codinq RNAs1 welche die sogenannten small nucleolar RNAs (snoRNAs), microRNAs (miRNAs), Short interfering RNAs (siRNAs) und small double-stranded RNAs (dsRNAs) einschließen, welche die Genexpression auf vielen Ebenen, einschließlich der Chromatin-Architektur, RNA-Editierung, RNA- Stabilität, Translation und möglicherweise auch Transkription und Spleißen. Im Allgemeinen werden diese RNAs auf mehrfachem Wege prozessiert aus den Introns und Exons längerer Primärtranskripte, einschließlich proteincodierender Transkripte. Obwohl etwa nur 1 ,2% des Humangenoms Proteine codiert, wird ein großer Teil dennoch transkribiert. Tatsächlich bestehen ca. 98% der in Säugern und Menschen gefundenen Transkripte aus non-protein-coding RNAs (ncRNA) aus Introns von proteincodierenden Genen und den Exons und Introns von nicht proteincodierenden Genen, einschließlich vieler, welche anti-sense zu proteincodierenden Genen sind oder mit diesen überlappen. Small nucleolar RNAs (snoRNAs) regulieren die sequenzspezifische Modifikation von Nukleotiden in Target-RNAs. Hierbei treten zwei Typen von Modifikationen auf, nämlich 2'-O-Ribosemethylierung und Pseudouridylierung, welche durch zwei große snoRNA-Familien reguliert werden, die einerseits box C/D-snoRNAs und andererseits box H/ACA snoRNAs genannt werden. Derartige snoRNAs weisen eine Länge von etwa 60 bis 300 Nukleotiden auf. miRNAs (microRNAs) und siRNAs (short interfering RNAs ) sind noch kleinere RNAs mit im Allgemeinen 21 bis 25 Nukleotiden. miRNAs stammen aus endogenen kurzen Hairpin-Vorläuferstrukturen und benutzen gewöhnlich andere Loci mit ähnlichen - jedoch nicht identischen Sequenzen als Ziel translationaler Repression. siRNAs entstehen aus längeren doppelsträngigen RNAs oder langen Hairpins, oftmals exogenen Ursprungs. Sie haben gewöhnlich homologe Sequenzen an demselben Locus oder woanders im Genom zum Ziel, wo sie am sogenannten gene silencing, ein Phänomen, welches auch RNAi genannt wird, beteiligt sind. Die Grenzen zwischen miRNAs und siRNAs sind jedoch fließend. d) Zusätzlich kann der Begriff "small RNA" auch sogenannte transposable Elemente (TEs) und insbesondere Retroelemente umfassen, welche ebenfalls für die Zwecke der vorliegenden Erfindung unter dem Begriff „small RNA" verstanden werden.
RefSeq ID: Diese Bezeichnung bezieht sich auf Einträge in der NCBI Datenbank (www.ncbi.nlm.nih.gov). Diese Datenbank liefert nicht-redundante Referenz-Standards zu genomischer Information. Diese genomischen Informationen schließen unter anderem Chromosomen, mRNAs, RNAs und Proteine ein. Jede RefSeq ID stellt ein einzelnes, natürlich vorkommendes Molekül eines Organismus dar. Die biologischen Sequenzen, die eine RefSeq repräsentieren, sind von GenBank Einträgen (ebenfalls NCBI) abgeleitet, sind aber eine Zusammenstellung von Informationselementen. Diese Informationselemente stammen aus Primär-Forschung auf DNA-, RNA- und Proteinebene.
Accession-Nummer: Eine Accession-Nummer stellt die Eintragsnummer eines Polynukleotides in der dem Fachmann bekannten NCBI-GenBank dar. In dieser Datenbank werden sowohl RefSeq ID's als auch weniger gut charakterisierte und redundante Sequenzen als Einträge verwaltet und der Öffentlichkeit zugänglich gemacht (www.ncbi.nlm.nih.gov/genbank/index.html).
Abkürzungen
AUC (area under curve) Fläche unter der Kurve
CRP C-reaktives Protein
CV (cross validation) Kreuzvalidierung
DLDA diagonale lineare Diskriminanzanalyse
(diagonal linear discriminant analysis) Klasssifikationsverfahren GPLS (generalized partial least Squares) verallgemeinerte partielle kleinste
Quadrate (Klassifikationsverfahren)
IQR (inter quartile ränge) Abstand zwischen dem 75% und 25%
Perzentil kNN (k nearest neighbours) k-nächste Nachbarn
(Klassifikationsverfahren) LDA (linear discriminant analysis) lineare Diskriminanzanalyse
(Klassifikationsverfahren)
MAD Normalisierungsverfahren
(Median of the absolute deviation of the Median) NPV (negative predictive value) negativer prädikativer Wert (Anteil der korrekt negativen Tests)
OR Odd Ratio
PCT Procalcitonin
PPV (positive predictive value) positiver prädikativer Wert (Anteil der korrekt positiven Tests)
RF (random forests) Klassifikationsverfahren
ROC (receiver Operator characteristics) Abbildung zur Darstellung von
Klassifikationsergebnissen Sensitivität Anteil der korrekten Tests in der
Gruppe mit vorgegebenener
Erkrankung (infektiöse SIRS bzw.
Sepsis) Spezifizität Anteil der korrekten Tests in der
Gruppe ohne vorgegebenene
Erkrankung (nicht-infektiöse SIRS) SVM (support vector machines) Klassifikationsverfahren
Für eine schnelle Diagnosik hat sich in der Praxis herausgestellt, dass Echtzeitoder Real-Time-Amplifikationsverfahren die bevorzugten Verfahren sind. Daher werden im Folgenden die Grundlagen, welche dem Fachmann wohlbekannt sind, kurz im Hinblick auf ihre Bedeutung für die vorliegende Erfindung zusammengefaßt.
Andere, dem Fachmann bekannten Verfahren, wie z.B. Sequenzierung, Mikroarray basierte Methoden, NASBA usw. sind ebenfalls möglich.
Mit Hilfe der Polymerase-Kettenreaktion (PCR) ist es möglich, spezifische Sequenzbereiche aus geringsten Ausgangsmengen von Nukleinsäuren in-vitro und zudem schnell zu amplifizieren, um sie so einer Analyse oder Weiterverarbeitung zugänglich zu machen. Ein doppelsträngiges DNA-Molekül wird durch Hitzeeinwirkung aufgeschmolzen (denaturiert). Die Einzelstränge dienen in der Folge als Matrize für die enzymatisch katalysierte Polymerisation von Desoxyribonukleotiden, wodurch wieder doppelsträngige DNA-Moleküle entstehen. Die als Primer bezeichneten Oligodesoxyribonukleotide definieren dabei den zu kopierenden Sequenzabschnitt, indem sie an Orten komplementärer Sequenz mit der Ziel-DNA hybridisieren und als Starter für die Polymerisation dienen. Der Prozess exponentieller Produktbildung wird von verschiedenen Faktoren begrenzt. Im Laufe der PCR geht die Netto-Produktbildung daher schließlich auf Null zurück und die Gesamtmenge an PCR-Produkt erreicht einen Plateauwert.
Geeignete PCR-Primer sind beispielsweise Primer mit den Sequenzen der SEQ ID NO: 687 bis SEQ ID NO: 742. Es ist dem Fachmann jedoch bekannt, dass eine Vielzahl weiterer Primer zur Ausführung der vorliegenden Erfindung verwendet werden kann.
Seit ihrer Einführung in das molekularbiologische Methodenspektrum wurde eine nahezu unüberschaubare Vielzahl von technischen Varianten entwickelt. Heute ist die PCR eine der wichtigsten Methoden in der molekularen Biologie und der molekularen Medizin. Heute findet sie Verwendung in einem überaus breiten thematischen Spektrum, z. B. beim Nachweis von Viren oder Keimen, bei der Sequenzierung, dem Verwandtschaftsnachweis, der Erstellung von Transkriptionsprofilen und der Quantifizierung von Nukleinsäuren [Valasek und Repa, 2005; Klein, 2002]. Zudem lassen sich mit Hilfe der PCR in einfacher Weise beliebige Sequenzabschnitte des Nukleinsäurebestandes eines Organismus klonieren. Die Vielzahl entwickelter PCR-Varianten ermöglicht u. a. eine zielgerichtete oder zufällige Veränderung der DNA-Sequenz sowie sogar die Synthese größerer, in dieser Form zuvor nicht existenter Sequenzabfolgen.
Mit diesem klassischen Verfahren lassen sich hochsensitiv DNA und über die reverse Transkription (RT) auch RNA qualitativ nachweisen [Wong et al., 2005; Bustin 2002]. Eine Weiterentwicklung dieser Methode ist die Real-Time-PCR, die erstmals 1991 vorgestellt wurde und neben qualitativen Aussagen auch eine Quantifizierung ermöglicht.
Real-Time-PCR, auch quantitative PCR (qPCR) genannt, ist eine Methode zur Detektion und Quantifizierung von Nukleinsäuren in Echtzeit [Nolan et al., 2006]. In der Molekularbiologie gehört sie bereits seit einigen Jahren zu den etablierten Standardtechniken.
Im Gegensatz zur PCR findet hier die Detektion bereits während der Amplifikation statt. Basierend auf Fluoreszenz-markierten Sonden, den Fluorophoren, kann die Amplifikation in Echtzeit verfolgt werden. In jedem Reaktionszyklus nehmen die fluoreszierenden PCR-Produkte und damit die Intensität der lichtinduzierten Fluoreszenz-Emission zu. Da die Zunahme der Fluoreszenz und die Menge an neusynthetisierten PCR-Produkten über einen weiten Bereich proportional zueinander sind, kann aus den gewonnenen Daten die Ausgangsmenge des Templates bestimmt werden. Eine gelelektrophoretische Auftrennung der Amplifikate ist nicht mehr erforderlich. Die Ergebnisse sind direkt verfügbar, was eine deutliche Zeitersparnis mit sich bringt. Da die Reaktionen in geschlossenen Gefäßen ablaufen, und nach dem Start der PCR keine weiteren Pipettierschritte erforderlich sind, reduziert sich das Kontaminationsrisiko auf ein Minimum. Als Fluorophore werden entweder nukleinsäure-bindende Fluoreszenzfarbstoffe wie SYBRGreen oder sequenzspezifische Fluoreszenzsonden wie Taq-Man-Sonden, LightCycler-Sonden und Molecular Beacons eingesetzt [Kubista et al., 2006]. SYBRGreen ist ein Farbstoff, dessen Fluoreszenz stark zunimmt, sobald das Molekül an doppelsträngige DNA bindet. Diese kostengünstige Lösung ist besonders bei der parallelen Durchführung mehrerer Reaktionen mit unterschiedlichen Primerpaaren geeignet. Nachteile liegen in der geringen Spezifität, da SYBRGreen sequenzunspezifisch an jede doppelsträngige DNA bindet, sowie darin, dass keine Multiplex-Messungen durchgeführt werden können. Mit Hilfe einer Schmelzkurvenanalyse kann nach erfolgter PCR allerdings zwischen dem Zielprodukt und unspezifischer DNA differenziert werden: In Abhängigkeit der Nukleotidlänge und -Zusammensetzung zerfällt jeder DNA-Doppelstrang bei einer für ihn charakteristischen Temperatur, der Schmelztemperatur, in seine zwei Einzelstränge. Da die doppelsträngige DNA von spezifischen PCR-Produkten einen höheren Schmelzpunkt hat als unspezifisch entstehende Primerdimere, ist eine Unterscheidung anhand der Fluoreszenzabnahme bei Zunahme der Temperatur möglich.
Im Gegensatz dazu ist der Nachweis mit fluoreszenzbasierten Sonden hochspezifisch, aber auch sehr kostenintensiv. Beim TaqMan-Prinzip enthält der PCR-Ansatz neben den PCR-Primern eine sequenzspezifische TaqMan- Hybridisierungssonde, die über einen Quencher und einen Reporterfarbstoff verfügt. Die Sonde ist komplementär zu einer Sequenz, die zwischen den Primern liegt. In freier Lösung wird die Fluoreszenz durch die räumliche Nähe des Quenchers unterdrückt. Nach dem FRET-(Fluoreszenz-Resonanz-Energie-Transfer)-Prinzip schluckt der Quencher die Fluoreszenzemission des angeregten Fluorophors. Hybridisiert diese Sonde jedoch mit der Zielsequenz, wird sie während der PCR von der Taq-Polymerase hydrolysiert, der Reporterfarbstoff wird räumlich vom Quencher entfernt und emittiert bei Anregung detektierbare Fluoreszenz. Beim LightCycler- Prinzip enthält der PCR-Ansatz neben den PCR-Primern zwei fluoreszenz-markierte Sonden (Donor- und Akzeptor- Fluoreszenzfarbstoff). Ein nach außen hin messbares Fluoreszenzsignal entsteht nur bei unmittelbar benachbarter Hybridisierung der beiden Sonden mit der spezifischen Zielsequenz. Im Rahmen einer anschließenden Schmelzkurvenanalyse können sogar das Vorliegen und die Art einzelner Punktmutationen innerhalb der Hybridisierungsbereiche der Sonden detektiert werden. Ein weiteres Beispiel sind die Molecular Beacons. Diese Oligonukleotide enthalten am 5'- und 3'-Ende zueinander komplementäre Sequenzen, die in ungebundenem Zustand hybridisieren und eine Haarnadelstruktur bilden. Reporterfluorophor und Quencher, lokalisiert an beiden Enden, sind so in direkter Nachbarschaft. Erst wenn die Sonde am Templat bindet, werden die beiden Farbstoffe räumlich getrennt, so dass nach Anregung wieder Fluoreszenz messbar ist. Scorpion- und Sunrise-Primer bilden zwei weitere Modifikationen für sequenzspezifische Sonden [Whitcombe et al,. 1999].
Die quantitative Bestimmung eines Templates kann mittels absoluter oder relativer Quantifizierung erfolgen. Bei der absoluten Quantifizierung findet die Messung anhand externer Standards, z.B. Plasmid-DNA in unterschiedlichen Verdünnungen, statt. Die relative Quantifizierung nutzt dagegen so genannte Housekeeping- oder Referenzgene als Referenz [Huggett et al., 2005]. Diese Referenzgene werden konstant exprimiert und bieten damit die Möglichkeit zur Normierung unterschiedlicher Expressionsanalysen. Die Auswahl der Housekeepinggene muss für jedes Experiment individuell erfolgen. Für die vorliegende Erfindung werden bevorzugt Housekeepinggene mit den Sequenzen der SEQ-ID NO: 676 bis SEQ-ID NO: 686 verwendet.
Die generierten Experiment-Daten werden mit Hilfe der geräteeigenen Software ausgewertet. Für die grafische Darstellung wird die gemessene Fluoreszenzintensität gegen die Anzahl der Zyklen aufgetragen. Die resultierende Kurve unterteilt sich dabei in drei Bereiche. In der ersten Phase, also zu Beginn der Reaktion, überwiegt noch das Grundrauschen, ein Signal des PCR-Produktes ist noch nicht nachweisbar. Die zweite Phase entspricht der exponentiellen Wachstumsphase. In diesem Segment verdoppelt sich das DNA-Template annähernd in jedem Reaktionsschritt. Entscheidend für die Auswertung ist der Zyklus, bei dem detektierbare Fluoreszenz auftritt und die exponentielle Phase der Amplifikation beginnt. Dieser Threshold- Cycle(CT)-Wert oder auch Crossing Point liefert die Basis für die Berechnung der Ausgangsmenge an vorhandener Ziel-DNA. So ermittelt die Software bei einer absoluten Quantifizierung die Crossing Points der unterschiedlichen Referenz- Verdünnungen und quantifiziert anhand der errechneten Standardkurve die Template-Menge. In der letzten Phase erreicht die Reaktion schließlich ein Plateau.
Die quantitative PCR ist ein wichtiges Werkzeug für Genexpressionsstudien in der klinischen Forschung. Mit der Möglichkeit, mRNA exakt zu quantifizieren, lassen sich bei der Suche nach neuen Wirkstoffen die Auswirkungen bestimmter Faktoren auf Zellen analysieren, die Differenzierung von Vorläuferzellen in verschiedene Zelltypen beobachten oder die Genexpression in Wirtszellen als Antwort auf Infektionen nachverfolgen. Durch den Vergleich von Wildtyp- und Krebszellen auf RNA-Ebene können in der Zellkultur Gene identifiziert werden, die einen entscheidenden Einfluss auf Krebsentstehung haben. In der Routine-Labordiagnostik wird Real-Time-PCR vorrangig zum qualitativen und quantitativen Nachweis von Viren und Bakterien eingesetzt. In der klinischen Routine, insbesondere im Bereich der Intensivmedizin, braucht der Arzt einen schnellen und eindeutigen Befund. Auf Basis der Real-Time-PCR können Tests durchgeführt werden, die noch am gleichen Tag das Ergebnis liefern. Hiermit begründet sich ein enormer Fortschritt für die klinische Diagnostik der Sepsis.
Neben den hier beschriebenen technischen Varianten der PCR-Methode können auch sogenannte isothermale Amplifikationsverfahren wie beispielsweise NASBA oder SDA oder andere technische Varianten für die der Detektion vorausgehenden Vervielfältigung der Zielsequenz verwendet werden.
Ein bevorzugtes Verfahren zur Wahl der Multigenbiomarkersequenzen umfaßt die folgenden Schritte:
a. Patientenauswahl basiert auf dem extremen Gruppenverfahren;
b. Generierung von mindestens einem Multigenbiomarker;
c. Bestimmung finaler Multigenbiomarker. Ein bevorzugtes Verfahren des dem „in vitro Diagnostic multivariate index assay" ähnlichen Tests umfaßt die folgenden Schritte:
a. Isolierung von Proben-Nukleinsäuren aus einer von einem Patienten stammenden Probe;
b. Erfassung von Genaktivitäten mittels Sequenzen von wenigstens einem Zustands- und/oder Untersuchungsfragespezifischen Multigenbiomarkers;
c. Erfassung von Genaktivitäten für wenigstens ein internes Referenzgen um die in b) erfassten Genaktivitäten zu normalisieren;
d. Verwendung einer Interpretationsfunktion für die in c) normalisierten Genaktivitäten um einen Zustands- und/oder Untersuchungsfrage-spezifischen Index abzuleiten.
Als technische Kontrolle werden zweckmäßig auch die Genaktivitäten von Kontrollgenen bestimmt, beispielsweise solchen mit den Sequenzen der SEQ ID NO: 670 bis SEQ ID NO: 675.
Eine bevorzugte Ausführungsform der vorliegenden Erfindung liegt auch in einer Verwendung, bei welcher die Genaktivitäten mittels eines Hybridisierungsverfahrens, insbesondere auf wenigstens einem Mikroarray, bestimmt werden. Der Vorteil eines Mikroarrays liegt in der höheren Informationsdichte des Biochips im Vergleich zu den Amplifikationsverfahren. So ist es z.B. mühelos möglich, auf einem Mikroarray mehrere 100 Sonden bereitzustellen, um in einem einzigen Untersuchungsgang mehrere Fragestellungen gleichzeitig zu untersuchen.
Die mittels der Erfindung erhaltenen Genaktivitätsdaten können auch vorteilhaft für die elektronische Weiterverarbeitung, z. B. zur Aufzeichnung in der elektronischen Krankenakte verwendet werden. Eine weitere Ausführungsform der Erfindung besteht in der Verwendung von rekombinant oder synthetisch hergestellten, spezifischen Nukleinsäuresequenzen, Partialsequenzen, einzeln oder in Teilmengen, als Multigenbiomarker in Sepsis- Assays und/oder zur Bewertung der Wirkung und Toxizität beim Wirkstoffscreening und/oder zur Herstellung von Therapeutika und von Stoffen und Stoffgemischen, die als Therapeutikum vorgesehen sind, zur Vorbeugung und Behandlung von SIRS und Sepsis.
Für die erfindungsgemäßen Verfahren (Arraytechnik und/oder Amplifikationsverfahren) wird die Probe ausgewählt aus: Gewebe, Körperflüssigkeiten, insbesondere Blut, Serum, Plasma, Urin, Speichel oder Zellen oder Zellkomponenten; oder eine Mischung davon.
Es ist bevorzugt, dass Proben, insbesondere Zellproben, einer lytischen Behandlung unterzogen werden, um deren Zellinhalte freizusetzen.
Offenbart werden hierzu Polynukleotidsequenzen von SEQ-ID NO: 1 bis SEQ-ID NO: 669 aus Blut und Blutzellen sowie daraus abgeleitete Sonden, welche zur Erstellung von Multigenbiomarkern verwendet werden können (vgl. Tab. 32).
Tab. 1 1 und 16 zeigen beispielhaft eine Sequenzauswahl für Multigenbiomarker für die Unterscheidung von infektiösen/nicht infektiösen Zuständen, und Tab. 20 und 21 zeigen beispielhaft eine Sequenzauswahl für Multigenbiomarker zur Unterscheidung von gram-positiven und gram-negativen Infektionen.
Es ist dem Fachmann klar, dass die in den Ansprüchen dargelegten einzelnen Merkmale der Erfindung ohne Einschränkung beliebig miteinander kombinierbar sind.
Klassifikationsmethoden
Die Theorie des Lernens spielt eine Schlüsselrolle auf dem Gebiet der Statistik, Datenanalyse und künstlichen Intelligenz mit zahlreichen Anwendungen in Ingenieurwissenschaften. Klassifikationsverfahren werden hauptsächlich bei 2 unterschiedlichen Aufgaben verwendet, bei der Abgrenzung von vorher unbekannten Klassen (unüberwachtes Lernen, class discovery) und bei der Zuordnung von bestimmten Daten/Proben/Patienten zu einer bereit definierten Klasse (Klassenvorhersage, class prediction) [Golub et al., 1999].
In der Klassenvorhersage werden Daten/Proben/Patienten benutzt, die bereits existierenden bzw. definierten Klassen/Gruppen zugeordnet wurden (so genannter Trainingsdatensatz), um ein analytisches Verfahren (Klassifikationsalgorithmus) zu entwickeln, das die Unterschiede zwischen den Gruppen widerspiegelt. Unabhängige Proben (sogenannter Testdatensatz) werden verwendet, um die Trennungsgüte der Klassifikationsregel zu bewerten. Die Vorgehensweise kann in folgende Schritte eingeteilt werden:
1. Definiere einen idealen Daten/Proben/Patientensatz, um charakteristische Profile der zu detektierenden Gruppen zu bekommen.
2. Jede Gruppe wird dann geteilt, so dass 2 gleichwertige Teilmengen, ein Trainingsdatensatz und ein Testdatensatz, entstehen.
3. Profile für den Trainingsdatensatz enthalten idealerweise Daten, die eine maximale Differenz zwischen den Gruppen widerspiegeln.
4. Die Differenz zwischen den Gruppen wird mittels geeigneter Abstandsmaße quantifiziert und anhand eines Algorithmus bewertet. Dieser Algorithmus sollte zu einer Klassifikationsregel führen, die mit der höchsten Spezifität und Sensitivität die Daten in die richtige Klasse einordnet. Typische Vertreter solcher Algorithmen aus dem Bereich des überwachten Lernens sind die Diskriminanzanalyse (DA), Random Forests (RF), Generalized Partial Least Squares (GPLS), Support Vector Machines (SVM) oder k-Nearest Neighbors (kNN).
5. Abschließend wird die Güte der Klassifikationsregel am Testdatensatz geprüft.
Definitionen:
Diskriminanzanalyse (DA): Bei der linearen Diskriminanzanalyse erhalten wir eine lineare, bei der quadratischen Diskriminanzanalyse (QDA) eine quadratische Diskriminanzfunktion. Die Diskriminanzfunktion bestimmt sich aus der Kovarianzmatrix und den Gruppenmittelwerten. Im Fall der quadratischen Diskriminanzanalyse wird zusätzlich angenommen, dass auch die Kovarianzmatrix zwischen den Gruppen variiert [Hastie et al.,2001 ].
Random Forests (RF): Die Klassifikation mittels Random Forests basiert auf der Kombination von Entscheidungsbäumen, [Breiman, 2001 ]. Der Ablauf des Algorithmus ist etwa folgendermaßen:
1. Wähle durch Ziehen mit Zurücklegen einen Trainingsdatensatz aus (Out-of-bag data).
2. An jedem Knoten des Entscheidungsbaums wähle zufällig Variablen aus. Berechne mit diesen Variablen die beste Aufteilung des Trainingsdatensatzes auf die Klassen.
3. Nachdem alle Entscheidungsbäume generiert wurden, fass die Klassenzuordnungen der einzelnen Entscheidungsbäume zu einer Klassenzuordnung zusammen.
Generalized Partial Least Squares (GPLS): Bei dem Generalized Partial Least Squares [Ding und Gentleman, 2004] Verfahren handelt es sich um eine sehr flexible Verallgemeinerung des multiplen Regressionsmodells. Aufgrund der großen Flexibilität kann diese Methode auch in vielen Situationen angewendet werden, in denen das klassische Modell versagt.
Support Vector Machine (SVM): Beim Support Vector Machine Klassifikator handelt es sich um einen verallgemeinerten linearen Klassifikator. Die Eingabedaten werden in einem höher dimensionalen Raum abgebildet und in diesem Raum wird eine optimale trennende (Hyper-)Ebene konstruiert. Diese im höherdimensionalen Raum linearen Schranken transformieren sich zu nichtlinearen Schranken im Raum der Eingabedaten, [Vapnik, 1999].
k-nächsten Nachbarn (k-Nearest Neighbors, kNN): Bei der Methode der k- nächsten Nachbarn, wird die Klassenzugehörigkeit einer Beobachtung (eines Patienten) anhand der sich in seiner Umgebung befindlichen k-nächsten Nachbarn entschieden. Die Nachbarschaft wird dabei in der Regel mit Hilfe des euklidischen Abstands bestimmt und die Klassenzugehörigkeit dann anhand eines Mehrheitsvotums entschieden [Hastie et al., 2001 ].
Im Folgenden ist ein generelles Konzept beschrieben, wie die erfindungsgemäßen Verfahren durchgeführt werden. Dabei ist dem Fachmann wohbekannt, dass geringfüge Anpassungen der statistischen Verfahren erforderlich sein können, wenn andere Patientenkollektive und/oder andere Fragestellungen untersucht werden sollen. Für die Generierung des Trainings- und des Testsdatensatzes werden verschiedene statistische Verfahren (Oiskriminanzanalyse und/oder Random Forests u.a.) sowie Strategien verwendet (einfache und mehrfache Kreuzvalidierung, zufällige Bootstrapstichproben u.a.)
Basierend auf Mikroarray-Expressionsdaten sollte ein Verfahren zur Bestimmung eines Multigenbiomarkers entwickelt werden, der eine infektiöse Komplikation wie beispielsweise Sepsis widerspiegelt. Der Biomarker und der zugehörige Index-Wert, auch „Score" genannt, bilden die Grundlage eines sogenannten „in vitro Diagnostic multivariate Index Assays" [IVDMIA, FDA- Guidelines, 2003] zur Verbesserung der Diagnose systemischer Infektionen. Die aus dem Verfahren resultierende Klassifikationsregel sollte insbesondere eine Differenzierung von SIRS-und Sepsis-Patienten mit - im Vergleich zum etablierten Biomarker Procalcitonin - verbesserter Sensitivität und Spezifität ermöglichen, ist jedoch nicht auf diese Fragestellung beschränkt.
Zur Entwicklung eines solchen Multigenbiomarkers sind die folgenden Schritte notwendig: 1. Schritt: Traininqsdatensatz. Um den Zusammenhang zwischen einer Genexpression bestimmter Gene und der untersuchten Erkrankung aufzudecken, werden Populationen (Kohorten) definiert, die ihr Vorhanden- bzw. NichtVorhandensein am deutlichsten repräsentieren. Bei der Diagnose einer infektiösen Komplikation werden üblicherweise Sepsis-Patienten (infektiös) und Patienten mit einer sogenannten sterilen SIRS (nichtinfektiös) in die Studie aufgenommen. Entsprechend dieser Festlegung wird ein Plan zur Sammlung bzw. Auswahl der zugehörigen RNA-Proben festgelegt. Von den ausgewählten Proben werden die Genexpressionsprofile auf einer geeigneten Plattform gemessen, vorverarbeitet und einer Qualitätskontrolle unterzogen. Systematische Messfehler werden korrigiert und Ausreißer eliminiert.
2. Schritt: Genvorauswahl. Bei der Generierung eines formalen Klassifikators auf der Basis von Mikroarray-Daten ist die Genvorauswahl ein Schlüsselschritt, da nur ein geringer Anteil der gemessenen Gene einen Beitrag zur Gruppenunterscheidung leistet. Auch die meisten Klassifikationsverfahren setzen eine Genselektion voraus. Durch eine präzise Genauswahl kann das Klassifikationsverfahren so einfach wie möglich gestaltet und eine Überanpassung an die Trainingsdaten (Overfitting) vermieden werden. Zur Vorauswahl der Klassifikationsgene werden geeignete Filteroptionen wie die Schwelle der statistischen Inferenz, der minimale akzeptierte Abstand zwischen den Gruppen, die minimale Signalintensität u. a. festgelegt. Nur Gene, die solche Bedingungen erfüllen, werden für die Klassifikation betrachtet.
3.Schritt: Klassifikationsverfahren. Verschiedene Klassifikationsverfahren werden bzgl. ihrer Trennfähigkeit hinsichtlich der zu differenzierenden pathophysiologischen Zustände getestet. Dazu werden Methoden der Cross- Validierung verwendet. Ein Klassifikationsverfahren mit dem kleinsten Klassifikationsfehler wird ausgewählt, wobei die kleinste notwendige Anzahl von Genen gleich mitbestimmt wird. Als sinnvolle Regel hat sich herausgestellt, dass die Anzahl der Gene immer kleiner sein soll als die Anzahl der Proben im Trainingsdatensatz, um eine Überanpassung zu vermeiden. Abschließend wird die resultierende Klassifikationsregel definiert.
Patientenauswahl Die Patientenauswahl ist bei der Aufstellung des Trainingsdatensatzes bedeutsam. In einer Vorstudie im Rahmen der vorliegenden Erfindung wurde vorerst eine Sensitivität von ca. 75 % im Trainings-und ca. 65 % im Testdatensatz erreicht. Diese relativ geringe Klassifikationsgüte ließ sich aber nicht durch die schwache Optimierung des Klassifikators, sondern durch die nicht ausreichend präzise Auswahl von Sepsis-Patienten erklären. Dementsprechend wurden Sepsis-Patienten nach einer Peritonitis viel häufiger richtig klassifiziert als Sepsis-Patienten nach einer „VAP" (Ventilator-Associated Pneumonia). Tatsächlich liegt die infektiöse Komplikation nach einer Peritonitis an sich vor. Dagegen lässt sich bei VAP eine wirkliche Infektion von einer Kolonisation nur schwer unterscheiden [Mayhall, 2001 ].
Um die Güte der Patientenauswahl zu bewerten, kann das Prinzip der sogenannten Extremgruppen nützlich sein. Danach werden in einer Studie nur solche Patientengruppen berücksichtigt, die den untersuchten Effekt möglichst deutlich abbilden. Dabei repräsentieren die ausgewählten Stichproben einen idealisierten Fall, in dem viele in der Praxis auftretende Effekte (z.B. die Häufigkeit der Erkrankung) nicht berücksichtigt werden. Von Liu [Liu et al., 2005] wurde vorgeschlagen, für den Trainingsdatensatz eines auf Mikroarrays basierten Klassifikators Extremgruppen zu bilden. Am Beispiel der Überlebensanalyse von Krebspatienten wurde gezeigt, dass die Anwendung von extremen Gruppen (Patienten, die nach kurzer Zeit gestorben sind vs. Patienten, die lange überlebt haben) zu einer besseren Vorauswahl von Klassifikationsgenen und einer höheren Klassifikationgüte geführt hat, auch wenn der Trainingdatensatz aus weniger Profilen (Patienten) bestand, als im üblichen Fall, wenn alle Patienten (auch mit mittleren Überlebenszeiten) berücksicht wurden.
Im Folgenden wird ausgeführt, wie weit die Patientenauswahl die Generierung eines Multigenbiomarkers zur Diagnose der infektiösen Komplikation beeinflussen kann. In einer Studie der Anmelderin wurden Patienten, die nach einem schweren operativen Eingriff eine Sepsis entwickelt haben, untersucht. Es wurden Proben vom ersten Tag der Sepsis-Diagnose mit der Probe vom ersten post-operativen Tag verglichen. Die hier signifikant differentiell exprimierten Gene spiegeln aber einen Mischeffekt wider; die infektiöse Komplikation wird verdeckt durch Effekte wie Erholung nach dem operativen Stress oder die post-operative Behandlung. In der bereits erwähnten Pilotstudie wurden die Patienten mit einer klinischen (nicht immer mikrobiologisch gesicherten) Sepsisdiagnose in die Trainingspopulation eingeschlossen, was zu einer Durchmischung der beiden untersuchten Gruppen (Septiker und Kontrollen) führte und die Sensitivität verschlechterte. In dem Ausführungsbeispiel der US-Patentanmeldung Nr. 20060246495 wurde für die Auswahl der Sepsisgruppe ebenfalls die klinische Sepsisdiagnose verwendet. Darüber hinaus wurde die Schwere der Erkrankung zwischen der Gruppe der Sepsispatienten und der Kontrollgruppe der SIRS-Patienten nicht berücksichtigt. Dies kann der Grund der geringen Klassifikationsgüte und ihrer Abhängigkeit vom Klassifikationsalgorithmus sein. In die Studie von Johnson [Johnson et al., 2007] wurden Patienten nach einem Trauma in zwei Gruppen aufgeteilt, mit einer infektiösen Komplikation und ohne eine Infektion. Der Vorteil dieser Studie war, dass Patienten der beiden Gruppen sich in Komorbidität und Vorbehandlung wenig unterschieden. Die Vorauswahl ist aber nicht für alle Sepsispatienten repräsentativ und die Verallgemeinerung des hier aufgedeckten sepsisrelevanten Genexpressionsmusters auf Patienten mit anderem Hintergrund (auf andere Risikogruppen) ist nicht selbstverständlich. Im Allgemeinen muss davon ausgegangen werden, dass in Studien mit verschiedenen Risikogruppen auch verschiedene Klassifikatoren generiert werden müssen. In der Studie von Tang [Tang et al., 2007a] wurde das Prinzip der Extremgruppen indirekt angewandt, in dem nur Patienten mit einer mikrobiologisch gesicherten Sepsis-Diagnose im Trainingsdatensatz berücksichtigt wurden. Der Proben-Sammelplan führte aber zu einer kleinen Kontrollgruppe (ein Drittel der Proben: 14 aus 44). Dementsprechend wurde im Training eine Spezifität von 77% und in einem unabhängigen Testdatensatz (unter mehr realen Bedingungen) von lediglich 60% erreicht. Die Beschreibung der Patientengruppen in der SIRS-Lab Studie und der Studie von Tang [Tang et al., 2007a] lässt einen weiteren Einflussfaktor erkennen. Sie zeigt, dass die bzgl. des Infektionsfokus heterogenen Sepsisgruppen nicht ausbalanciert sind, sondern dass Gruppen mit verschiedenen Infektionsfoci unterschiedlich vertreten sind. Tatsächlich ist im Großteil der Fälle auf der Intensivstation (ITS) die Lunge (ca. 45-50 %) oder der Abdomen (ca. 25%) der Fokus der Infektion bei einer Sepsisdiagnose. Dementsprechend sind diese Patientengruppen in den Untersuchungen überrepräsentiert, viele andere Foci kommen dann nur vereinzelt vor. Ähnlich sind in den Kontrollgruppen insbesondere postoperative und Traumapatienten vertreten und andere Risikogruppen sind nur durch einzelne Patienten vertreten. Die dargestellte Analyse zeigt, dass in allen Studien die ausgewählten Patientengruppen die infektiöse Komplikation nicht eindeutig abbilden, wodurch die Klassifikationsschwächen erklärt werden können. Andererseits wird aus der Zusammenfassung deutlich, dass es bei der infektiösen Komplikation kaum möglich ist, alle Einflussfaktoren bei der Auswahl der Patientengruppen zu berücksichtigen. Aus diesem Grund wird der folgende Weg zur Patientenauswahl für den Trainingsdatensatz vorgeschlagen. Allqemeines zu Material und Methoden der vorliegenden Erfindung:
Patientenauswahl
Die Auswahl der repräsentativen Stichproben stand im Mittelpunkt des beschriebenen Verfahrens. Es wurden in den Trainingsdatensatz Patienten mit einer mikrobiologischen gesicherten bzw. ausgeschlossenen Infektionsdiagnose aus jeweils zwei der am besten repräsentierten Sepsis- bzw. Kontrollsubgruppen eingeschlossen. Damit wird das Prinzip der Extremgruppen nicht nur für den Haupteffekt (infektiös vs. nicht infektiös) sondern auch für die Kontrolle der wichtigsten Einflussgrössen (Schichtung von Populationen) angewandt. Der Vorteil dieser Auswahl ist vorerst, dass man hier einen Klassifikator für die häufigsten Risiko bzw. Erkrankungsgruppen generiert. Darüber hinaus wird erwartet, dass sich ein Klassifikator, der die systemische Infektion für wenige aber sehr unterschiedliche Subgruppen widerspiegelt, sich auf weitere Patientengruppen anwenden lässt. Bei der Auswahl der Trainingsdaten wurde wie folgt vorgegangen. In die Patientendatenbank der Anmelderin wurden im Zeitrahmen von zweieinhalb Jahren 400 ITS-Patienten aufgenommen, bei denen ein Sepsis-Risiko vermutet wurde, und die zugehörigen klinischen Daten über den gesamten Aufenthalt detailliert dokumentiert. Die RNA-Proben wurden über ca. 7-14 Sepsis-relevante Tage gesammelt. In Annäherung an das PIRO-Konzept [Levy et al., 2003] wurden die Patienten retrospektiv nach folgenden Kriterien stratifiziert: (i) welche Indikation führte zur der Übernahme auf die Intensivstation (postoperative Komplikation, Trauma bzw. Polytrauma, akuter Sepsisverdacht), (ii) wurde eine infektiöse Komplikation diagnostiziert, was war der Infektionsfokus, (iii) wie war die Reaktion des Organismus (Anzahl der vorhanden SIRS-Kriterien , Schock-Behandlung, PCT-, CRP-Werte), (iv) wie schwer war die Erkrankung (SOFA, M O D S- Score). Die Datenbankrecherche ergab, dass mit einer infektiösen Komplikation (Sepsis) insbesondere Patienten nach einer Pneumonie (40%) und nach einer Peritonitis (23%) in die Studie aufgenommen wurden. Ohne eine Infektion wurden insbesondere Patienten nach einem (PoIy-) Trauma (9 %) und nach einer Bypass-Operation (20%) eingeschlossen. Diese Daten entsprechen den epidemiologischen Studien der Deutschen Sepsisgesellschaft, womit die Sammlung als repräsentativ eingestuft wurde. Die Patientendaten dieser Gruppen wurden unabhängig von 2 Ärzten [nach ACCP/SCCM, 1992; Levy et al., 2003; Calandra und Cohen, 2005] geprüft und die finale Patientenauswahl festgelegt. Es wurden aus den beiden Sepsis-Gruppen 46 Patienten mit einer mikrobiologisch gesicherten Diagnose ausgewählt und der erste septische Tag bestimmt. Die Zusammenfassung der Schwere-Kriterien ergab, dass bei den Patienten an diesem Tag eine schwere Sepsis bzw. ein septischer Schock diagnostiziert wurde. Sie erreichten einen durchschnittlichen SOFA- Wert von 10, die Summe akuter Organdysfunktionen betrug etwa 3. Aus den beiden Risikogruppen (nach einer CPB- Operation und oder einem Trauma) wurden 59 Patienten ohne Zeichen einer Infektion ausgewählt und der erste Tag mit einer ähnlichen Schwere wie bei den Sepsis-Gruppen bestimmt. Auf diese Weise wurden 105 Patienten primär in die Studie eingeschlossen; nach der Qualitätskontrolle der zugehörigen Mikroarray- Experimente wurde die Gruppe auf 96 Patienten mit guter Qualität der Genexpressionsmessung eingeschränkt. Eine Aufstellung zu wichtigen klinischen und Labor- Parametern für die ausgewählten Patienten findet sich beispielhaft, jedoch ohne Einschränkung hierauf, in Tab. 1.
Figure imgf000042_0001
Generierung des Klassifikators
Auf dem Weg zur Klassifikatorentwicklung wurden folgende Schritte durchgeführt: 1. Schritt: Qualitätskontrolle: Aus der vom Expertenwissen bestätigten Vorauswahl aus einem Patientenkollektiv wurden die zugehörigen Genexpressionsdaten verschiedenen Ähnlichkeitsanalysen unterworfen, um untypische Hybridisierungsergebnisse auszuschließen [Buneß et al., 2005], wodurch die finale Trainingsdatenmatrix generiert wurde.
2. Schritt: Normalisierung bzw. Vorverarbeitunq der Daten: Verglichen wurden verschiedene Verfahren der Background-Korrektur und der Normalisierung. Am besten zeigten sich Verfahren mit einer Varianz stabilisierenden Transformation [Rocke und Durbin, 2001 ]. Als bestes Normalisierungsverfahren stellte sich die Normalisierung mittels Box-Cox [Box und Cox, 1964], mit anschießender Median und MAD Standardisierung, heraus. Sein Vorteil, nämlich die Normalisierung einzelner Profile (gegenüber der Normalisierung der gesamte Datenmatrix nach z.B. Huber [Huber et al., 2003], wurde insbesondere beim Bootstrap gezielt verwendet.
3. Schritt: Filter: Es wurde ein Filter verwendet, um die besten Klassifikatorgene zu identifizieren. Der Filter bestand aus folgenden Schritten:
(i) Auswahl von einer bestimmten Anzahl an Transkripten mit dem geringsten Variationskoeffizienten, wobei nur Transkripte mit einer positiven mittleren Signalintensität berücksichtigt wurden, (ii) Anschließend wurde für diese Transkripte der Wilcoxon-Test für den Vergleich infektiös vs. nicht infektiös durchgeführt. Die Transkripte wurden mittels der p-Werte angeordnet, wobei alle Transkripte mit einem p-Wert <= 0.001 als gleichwertig betrachtet werden und diese mittels dem Abstand zwischen infektiöser und nicht infektiöser Gruppe angeordnet werden. Der Abstand zwischen den beiden Gruppen wurde mittels des Hodges-Lehmann Schätzer [Hollander und Wolfe, 1973] bestimmt.
4. Schritt: Klassifikation: Die besten der ausgewählten Transkripte wurden dann zur Klassifikation eingesetzt. Im Klassifikationsschritt wurden verschiedene lineare und nicht lineare Verfahren [Hastie et al., 2001 ] miteinander verglichen: DLDA, LDA, RF, GPLS, SVM und kNN. 5. Schritt: Interne Validierung: Um die Güte der Klassifikation zu beurteilen wurde die 10-fach Kreuzvalidierung verwendet, wobei die Kreuzvalidierung mehrfach (20- bzw. sogar 1000-mal) wiederholt wurde.
6. Schritt: Auswahl der Transkripte: Die finale Auswahl der Transkripte für den Klassifikator erfolgte unter zu Hilfenahme von Bootstrap. Bootstrapping ist in der Statistik eine Methode des Resampling; dabei werden wiederholt Statistiken auf der Grundlage lediglich einer Stichprobe x = (x(1 ),...,x(n)) berechnet. Dafür werden im einfachsten Fall B Bootstrap-Stichproben x(b) = (x*(1 ),...,x*(n)), b = 1 ,...,B, dadurch generiert, dass jeweils n mal aus der gegebenen Stichprobe ein Wert mit Zurücklegen gezogen wird [Efron, 1979].
So wurden aus dem ursprünglichen Trainingsdatensatz bestimmte für die jeweilige Fragestellung geeignete Bootstrap-Stichproben gezogen und für jede dieser Stichproben - wie oben beschrieben - die optimalen Transkripte bestimmt. Im finalen Klassifikator finden sich solche Transkripte, die bei häufigen, z.B. 5000 Wiederholungen am häufigsten ausgewählt wurden.
Bestimmung des finalen Klassifikators
Die Betrachtung der Abhängigkeit der Klassifikationsergebnisse von der Anzahl der Gene bestätigte das Resultat von Baker und Kramer [Baker und Kramer, 2006], nämlich, dass sich die Ergebnisse mit 5, 10, 25, 40 und 50 Genen wenig unterschieden. In Fig. 1 wird der Klassifikationsfehler für die lineare Diskriminanzanalyse (LDA) dargestellt. Da die Kurve ihr Minimum bei etwa 12 Merkmalen erreicht, wurden im weiteren die mit dieser Anzahl von Genen erreichten Ergebnisse dargestellt. In Tab. 2 wurden die Ergebnisse der verschiedenen Klassifikationsverfahren, die mittels 20 Wiederholungen einer 10-fach Kreuzvalidierung gewonnen wurden, zusammengefasst.
Tabelle 2: Mittels 20-fach CV (Kreuzvalidierung) geschätzte Sensitivität und Spezifität bei simultaner Betrachtung von 12 Transkripten
Figure imgf000044_0001
Figure imgf000045_0001
Aus Tab. 2 geht hervor, dass die geschätzte Sensitivität im Bereich von 95 %, die geschätzte Spezifität - mit Ausnahme bei DLDA - im Bereich von über 90 % liegen. Am vielversprechendsten sind die Ergebnisse mittels LDA und SVM. Im Fall dieser beiden Klassifikationsverfahren wurden jeweils nur wenige Patienten überwiegend falsch klassifiziert, so dass eine Missklassifikationsrate von höchstens 5% erreicht wird. Aufgrund der großen Komplexität der SVM-Methode und dem dadurch entstehenden Rechenaufwand, den die Optimierung eines SVM- Klassifikators verursachen würde, sowie der besseren biologischen Interpretierbarkeit eines Klassifikators auf der Basis der LDA hat sich die Anmelderin dazu entschieden, den Klassifikator auf der Basis der LDA zu entwickeln. Die aus der LDA resultierende Klassifikationsregel wurde in einen Score umgerechnet. Der Score ist für ein beispielhaftes Kollektiv von 96 Patienten in Fig. 2 dargestellt. Ein Wert > 10 zeigt an, dass eine Infektion (also Sepsis) sehr wahrscheinlich ist. Ein Wert zwischen +10 und -10, dass ein gewisses Risiko für eine Sepsis besteht. Ein Wert < -10 schließlich deutet darauf hin, dass eine Infektion sehr unwahrscheinlich ist.
Zusammenfassend ergibt sich folgendes Bild: Aus dem Generierungsprozess des Klassifikators werden die Vorteile der Gruppenauswahl deutlich: Die geschätzte Anzahl der Klassifikationsgene ist klein, wodurch eine Überanpassung (overfitting) an die Trainingsdaten unwahrscheinlich ist. Die einzelnen Klassifikationsverfahren unterscheiden sich dabei nur geringfügig (Dass die diagonale lineare Diskriminanzanalyse [DLDA] als Klassifikationsverfahren die geringste Klassifikationsgüte liefert, ist dadurch zu erklären, dass in der DLDA die Korrelation zwischen den Genen nicht berücksichtigt wird, was zum Informationsverlust führt). Eine Erhöhung der Genanzahl verbessert das Ergebnis nicht. Diese Tatsachen deuten darauf hin, dass die Gruppen im Trainingsdatensatz sich gut trennen lassen, also deutliche Distanzen aufweisen.
Die vorliegende Erfindung wird im Folgenden anhand von Beispielen und unter Bezug auf das Sequenzprotokoll, das ebenfalls ein Teil dieser Beschreibung ist, näher erläutert, ohne dass dies eine Einschränkung der Erfindung bedeutet. Erqebnisse
Die Güte der erfindungsgemäßen Multigenbiomarker wurde mit den etablierten Biomarkern PCT und CRP verglichen, wofür die zugehörigen ROCs für den Trainingsdatensatz berechnet wurden (Fig. 3). Man erhält als AUC (Area Under the Curve): AUC(PCT) = 0.326, AUC(CRP) = 0.656, AUC(PCT & CRP) = 0.940, AUC(Multigenbiomarker) = 0.997. Anhand dieser ROC-Kurven wird die sehr hohe Sensitivität bei ähnlich hoher Spezifität für den deutlich. Durch die gezielte Auswahl der Klassikationsgene wurde also von dem Multigenbiomarker eine bessere Klassifikationsgüte erreicht als von den etablierten Markern PCT und CRP, auch für die Trainingsdaten, die nach dem Prinzip der Extremgruppen scharfe Unterschiede repräsentieren.
Im nächsten Schritt wurden die Genexpressionsdaten der Patientendatenbank der Anmelderin, die nicht im Trainingsdatensatz verwendet wurden, einer Klassifikation unterzogen. Die Fig. 4a zeigt die Verteilung der Score-Werte in Abhängigkeit von der klinischen Diagnose. Zum Vergleich wird in der Fig. 4b die Verteilung der PCT-und CRP-Werte für den gleichen Datensatz dargestellt. Während die Index-Werte bzw. die Scores mit der klinischen Diagnose übereinstimmen, zeigt insbesondere die PCT-Verteilung, dass eine schwere SIRS eher als Sepsis und eine unkomplizierte Sepsis eher als nicht infektiös eingestuft wird. Eine unspezifische Verteilung zeigen die Marker CRP und WBC (Leukozytenanzahl).
Die Güte der erfindungsgemäßen Multigenbiomarker bzw. des erfindungsgemäßen Verfahrens wurde an Expressionsdaten von weiteren Patienten eines fremden Sammelzentrums untersucht. Auch hier stimmten die klinische und molekularbiologische Einstufung in 90% der Fälle überein.
In Fig. 5 wird abschließend die Score-Kurve im Verlauf der Erkrankung für einzelne Patienten dargestellt. Auch hier spiegelt der Multigenbiomarker der vorliegenden Erfindung die klinische Diagnose wider.
In die Validierungsanalyse wurden Patientenprofile der Patientendatabank der Anmelderin eingeschlossen, deren Expressionsprofile nicht im Trainingsdatensatz vertreten waren. Aufgrund des fehlenden Golden Standards für die Diagnose der Sepsis wurde dieser unabhängige Testdatensatz in geschichteten Subgruppen untersucht. Dabei wurden Patientenprofile nach der Schwere der Erkrankung aufgeteilt und klassifiziert (vgl. Fig. 4). Tatsächlich wurden Patienten mit einer unkomplizierten SIRS fast ausschließlich als nicht infektiös eingestuft. Patienten mit einer schweren SIRS (SIRS mit zusätzlicher Multiorgandysfunktion (MOD)) wurden überwiegend als nicht infektiös erkannt. Patienten mit einer unkomplizierten Sepsis wurden überwiegend als systemisch infektiös klassifiziert. Die infektiöse Komplikation wurde am häufigsten unter den Patienten mit einer schweren Sepsis bzw. einem septischen Schock bestimmt. Dieser Befund konnte an einer Patientengruppe, die in einem unabhängigen Zentrum rekrutiert und diagnostiziert wurden, bestätigt werden (Fig. 6).
Weitere Vorteile und Merkmale der vorliegenden Erfindung ergeben sich aufgrund der Beschreibung von Ausführungsbeipielen sowie anhand der Zeichnung.
Es zeigt:
Fig. 1 einen Verlauf des Klassifikationsfehlers der LDA in Abhängikeit von der
Anzahl von Klassifikationsgenen; (a) Klassifikationsfehler bei der
Verwendung von 5-200 Genen, (b) Auschnitt für 8-20 Gene; Fig. 2 einen Score (a) und seine Verteilung für den Trainingsdatensatz (b); Fig. 3 die Güte eines Multigenbiomarkers im Vergleich zu etablierten monomolekularen Biomarkern PCT und CRP bzw. ihrer Kombination (via
LDA); Fig. 4 eine Verteilung der Biomarker-Werte in Abhängigkeit von der klinischen
Diagnose, (a) Multigenbiomarker-Score, (b) PCT, CRP und WBC; Fig. 5 einen Verlauf des Score für drei Patienten (die graue Fläche markiert die
Tage der Sepsisdiagnose; Fig. 6 eine Verteilung der Scores für Expressionsdaten eines fremden
Sammelzentrums; Fig. 7 eine schematische Darstellung des Mikroarray-Designs und der drei
Replikate; Fig. 8 eine Darstellung der auf dem Mikroarray repräsentierten Signalwege; Fig. 9 ein Beispiel eines qPCR-Laufs (Marker EPC1 );
Fig. 10 eine schematische Darstellung des abgeleiteten Score-wertes für 12 Marker und die Einteilung in vier Bereiche; auf diese Skala wird das
Klassifikationsergebnis projiziert; Fig. 1 1 eine schematische Darstellung des abgeleiteten Score-Wertes und die
Einteilung in vier Bereiche; auf diese Skala wird das Klassifikationsergebnis projiziert; Fig. 12 eine Darstellung der Expressionsunterschiede zwischen den
Patientengruppen: Boxplots der Marker erstellt aus 31 Patientenproben (19 mit Sepsisdiagnose, 12 mit SIRS); die Legende erklärt die verwendeten
Gensysmbole; Fig. 13 eine Boxplot der normalisierten Real-Time-PCR-Daten für den
Biomarkerkandidaten CDKN1 C (SEQ-ID NO: 104) zur Unterscheidung von gram-positiver und gram-negativer Infektion; Fig. 14 einen Boxplot der normalisierten Real-Time-PCR-Daten für den Biomarker
CTSL zur Unterscheidung von gram-positiver und gram-negativer Infektion; Fig. 15 einen Boxplot der normalisierten Real-Time-PCR-Daten für den Biomarker kandidaten METTL7B (SEQ-ID NO: 145) zur Unterscheidung von grampositiver und gram-negativer Infektion; und Fig. 16 einen Boxplot für den nicht-kodierenden Marker mit der SEQ-ID NO: 207; auf der y-Achse ist der mittlere Ct-Wert während der Real-Time-Amplifikation dargestellt.
Ausführunqsbeispiele
Beispiel 1 : Sepsis/SIRS-Abqrenzunq
Es soll ein Verfahren zur Bestimmung von Multigenbiomarkern offenbart werden. Die aus dem Verfahren resultierende Klassifikationsregel soll eine Differenzierung von SIRS- und Sepsis-Patienten erlauben. Eine weitere Klassifikationsregel soll die Unterscheidung zwischen dem Fokus der Infektion Pneumonie und Peritonitis ermöglichen. Experimenteller Ansatz
In genomweiten Genexpressionsuntersuchungen des Blutes nichtseptischer und septischer Patienten wurden Transkripte identifiziert, welche unbeeinflusst von der Heterogenität der Patienten bedingt durch Alter, Komorbiditäten und Medikationen die molekularen Unterschiede zwischen Gruppen von Sepsispatienten widerspiegeln. Abhängig vom untersuchten Patientenkollektiv ist die Anzahl der zur erfolgreichen Klassifikation benötigten Biomarker unterschiedlich.
Man geht davon aus, dass in heterogenen Kollektiven mehr Biomarker analysiert werden müssen als in sehr gut definierten Gruppen. Im Sinne möglichst robuster klinischer Diagnostik wird von einem Pool an signifikanten Biomarkern ausgegangen. Je nach diagnostischer Fragestellung werden dann Biomarker ausgewählt und das Klassifikationsverfahren auf diversen technischen Genexpressionsplattformen optimiert. An zwei Beispielen soll das Potenzial der Biomarkerkandidaten verdeutlicht werden:
a) Messung differenzieller Genexpression zwischen SIRS- und Sepsis- Patienten auf einem Mikroarray b) Klassifikation von SIRS- und Sepsis-Patienten mit Genexpressionssignalen ausgewählter Oligonukleotidsonden, generiert auf dem Mikroarray
zu a:
Charakteristik des verwendeten-Arravs:
• mittels Spottingtechnologie hergestellter Oligonukleotid-Mikroarray
• 484 genspezifische Oligonukleotide sind in 3 Replikaten aufgebracht
• davon adressieren 344 Oligonukleotide Genexpressionsbiomarker
• 84 Oligonukleotide adressieren Kontrollen (neg. and pos.)
• 56 Oligonukleotide adressieren Referenzgene
Fig. 7 zeigt eine schematische Darstellung des fokussierten Sepsis-Mikroarrays. Gespottet auf epoxy-silanisierte Glasträgern (Nexterion E-Slides, Hersteller Schott, BRD), ist jedes genspezifische Oligonukleotid dreifach repräsentiert. Die drei identischen Sub-Arrays werden mit einer Patientenprobe hybridisiert. Neben den markerspezifischen Oligonukleotiden sind auch Sonden für Kontrollen (Überwachung des gesamten Probenvorbereitungs- und Hybridisierungsprozesses) auf dem Array vertreten.
Biologische Plausibilität der eingesetzten Biomarker:
Die auf dem Array adressierten Markergene sind mit hoher Signifikanz den in Fig. 8 dargestellten Signalwegen in der menschlichen Zelle und den damit verbundenen Funktionalitäten zugeordnet. Eine hohe Relevanz für immunologische und inflammatorische Prozesse und damit auch die Sepsis ist gegeben. Für die wissensbasierte Analyse der Biomarkerpopulation auf dem fokussierten Sepsis-Array wurde die Software Ingenuity Pathway Analysis (Ingenuity Systems, USA, www.ingenuity.com), verwendet, um den funktionellen Kontext der identifizierten Marker zu verdeutlichen. Basierend auf dem gesamten öffentlich verfügbaren Datenbankwissen über die Gene und Genprodukte werden die Marker in funktionelle Netzwerke eingeordnet, welche dann Relevanz für physiologische und pathologische Vorgänge haben können. Die Marker sind mit hoher Signifikanz an immunologischen und entzündlichen Prozessen beteiligt, was von funktioneller Seite einen engen Zusammenhang zur Sepsis vermuten lässt. Damit ist biologische Plausibilität, eine Grundvoraussetzung für Biomarker, gegeben.
Patientenkollektiv für die Auswertung:
Im Großteil der Fälle auf der Intensivstation (ITS) ist die Lunge (ca. 45-50 %) oder der Abdomen (ca. 25%) der Fokus der Infektion bei einer Sepsisdiagnose. Daher wurden im Rahmen der Multigenbiomarker-Entwicklung Patienten mit Pneumonie bzw. Peritonitis ausgewählt. Im Fall der SIRS wurden Herz-Patienten ausgewählt, welche den Großteil der SIRS-Patienten auf einer ITS stellen darstellen. Auf diese Weise wurden 12 Patienten mit schwerer Pneumonie, 18 Patienten mit schwerer Peritonitis und 19 Herz-Patienten (OP: cardiopulmonaler Bypass) mit schwerer SIRS identifiziert. Für die Analysen wurde von diesen Patienten jeweils der erste Tag der Diagnose ausgewählt. In nachfolgender Tab. 3 ist das Patientenkollektiv für die Klassifikator- Validierung auf dem Sepsis- Array dargestellt. Tabelle 3: Patientenkollektiv für die Validierung des Klassifikators auf dem fokussierten Sepsis-Array (klinische Daten siehe Beschreibung Gesamtkollektiv von 96 Patienten)
Figure imgf000051_0001
Figure imgf000052_0001
Hybridisierunq:
4 μg total RNA aus Patientenblut wurde mittels reverser Transkription (Superscriptll, Invitrogen, USA) in einem Reaktionsvolumen von 30μl??? in cDNA umgeschrieben. Als Primer wurde ein PolydT-Primer (18mer eingesetzt). Aminoallyl- dUTP wurde der Reaktion zugesetzt und somit 80 % der dTTP Menge im mRNA- Strang anhand des AA-dUTP substituiert (Tab. 4).
Tabelle 4: Pipettieransatz für die Proben für die cDNA-Synthese. 4μg totaIRNA sowie 2,5μg OligodT Primer wurden vorgelegt. Mit RNAse-freiem Wasser wurde auf 30μl Gesamtvolumen aufgefüllt.
Figure imgf000052_0002
Figure imgf000053_0001
Alle Proben werden für 2 h bei 42 °C inkubiert. Nach diesen 2 h werden die entstandenen mRNA / cDNA Duplexe in einzel-strängige cDNA alkalisch hydrolisiert (Zugabe von je 20 μl 0,5 M EDTA (pH 8,0) und je 20 μl 1 N NaOH mit einer Inkubationszeit von 30 min bei 65 °C). Zur Neutralisation der einzelsträngigen cDNA werden je 50 μl 1 M Tris-HCI (pH 7,4) zugegeben. Anschließend werden alle Proben mit 400 μl RNase freiem H2O versetzt und mittels Microcon YM-30 Säulen (AMICON, USA) aufgereinigt. Dazu gibt man die gesamten Proben auf jeweils eine Säule, die bei 1 10OOxg für 10 min zentrifugiert wird. Nach zweimaligen waschen mit 450 μl RNase freien H2O und dazwischenliegende Zentrifugationsschritten bei 1 1000xg für 10 min, werden die Säulen umgedreht auf ein neues 1 ,5 ml Reaktionsgefäß gestülpt und für 3 min bei 15000xg zentrifugiert. Als Eluat erhält man nun aufgereinigte einzelsträngige cDNA mit einem Volumen von ca. 20 - 40 μl, welche in der Speedvac zur Trockene reduziert wird.
Markierung der cDNA mit Fluoreszenzfarbstoffen
Zur Detektion der Hybridisierungssignale werden fluoreszierende Farbstoffe eingesetzt. Für die Analysen wurde ein Fluoreszenzfarbstoff von Dyomics verwendet (Hersteller: Dyomics GmbH, Jena, BRD). DY-647 (Cy5-Analoga) werden als N- Hydroxylsuccinimid-Ester (NHS-Ester) erworben und für die Fluoreszenzmarkierung eingesetzt. Die chemische Kopplung der Farbstoffe erfolgt an den eingebauten AA- dUTPs.
Die cDNA wird in 10 μl H2O gelöst und mit je 5 μl auf zwei Röhrchen aufgeteilt. Die gelösten Proben werden bei 42 °C für 5 min inkubiert. Anschließend werden jeder Probe jeweils 3 μl Bicarbonatpuffer zugesetzt. Der Fluoreszenzfarbstoff wird in DMSO (Hersteller SIGMA-Aldrich, BRD) gelöst. Pro Probe werden 75 μg Farbstoff eingesetzt. Diese lichtempfindliche Reaktion erfolgt im Dunkeln für 1 h. Nach dieser Zeit werden die Proben mit H2O auf ein Endvolumen von 30 μl aufgefüllt. Die Proben werden mit jeweils 80 μl H2O und 100 μl Membran-Binding-Solution zusammenpipettiert und mittels Promega Kit ( Promega Wizard-SV Gel and PCR CleanUP System, PROMEGA, USA) aufgereinigt, nach den Angaben des Herstellers.
Im letzten Schritt werden die Säulen für 1 min bei 16000xg trocken zentrifugiert und zweimal mit 50 μl H2O (je 1 min, 10000xg) eluiert. Danach wird jede Probe mit 10 μl Cot-1 -DNA (Invitrogen, USA) und 400 μl H2O versetzt. Die Konzentration der markierten Proben erfolgt mittels Microcon YM-30 (10000xg; 10 min Zentrifugation). Die Säulen werden umgedreht auf ein neues Röhrchen gestülpt und bei 15000xg für 3 min zentrifugiert. Das Volumen des cDNA/Cot-1 -DNA-Gemisches wird auf 32μl eingestellt. Das fluoreszenzmarkierte cDNA/Cot-1 -DNA-Gemisch (32μl) wird mit 58 μl Hybridisierungsgemisch (Tab. 5) versetzt.
Nach dreiminütiger Denaturierung bei 98 °C wird das Gemisch in die Hybridisierungskammern des TECAN- Hybridisierungsautomaten (HS-400, Hersteller Tecan, Österreich) einpipettiert. Das enthaltene Formamid setzt die Schmelztemperatur des Hybrids herab und ermöglicht somit eine gute Hybridisierung. Durch die Zugabe von 10 %igem SDS wird die Benetzung der Biomoleküle am Glasobjektträger verbessert. Die Hefe-t-RNA / Poly-A-Mix sorgt dafür, dass es keine unspezifischen Bindungen und Hintergrundrauschen gibt. Demzufolge bindet PoIy(A) an das Poly(T)-Ende der markierten cDNA, wobei die Hefe-t-RNA alle unspezifischen Sequenzen blockiert.
Tabelle 5: Das Hybridisierungsgemisch für eine Probe.
Figure imgf000054_0001
Das Programm an der Hybridisierungsstation ist in der nachfolgenden Tab. 6 dargestellt.
Figure imgf000055_0001
Die Arrays werden zu Beginn mit Hybridisierungslösung gewaschen und anschließend mit den Proben inkubiert. Der Prozess wird für zehn Stunden bei einer Temperatur von 42 °C in Hybridisierungskammern des Tecan Gerätes HS-400 mit konstanter Agitation des Hybridisierungsgemisches auf der Array Oberfläche durchgeführt. Zum Schluss werden die Arrays in drei automatisierten Schritten gewaschen und getrocknet.
Nach zehn Stunden werden alle nicht gebundenen Moleküle durch anschließende Waschschritte vom Mikroarray entfernt. Die fertigen Arrays müssen zur Auswertung eingescannt (AxonB Scanner, GenePix-Software, Axon Technologies, USA) werden. Die resultierenden gpr-files werden biostatistisch ausgewertet.
Auswertung
Die Datenanalyse wurde unter der freien Software R Project Version 2.6.1 durchgeführt, die unter www.r-project.org zur Verfügung steht.
1. Qualitätskontrolle der Rohdaten:
Aus der vom Expertenwissen bestätigten Vorauswahl aus 46 Patienten wurden die zugehörigen Genexpressionsdaten verschiedenen Ähnlichkeitsanalysen unterworfen, um untypische Hybridisierungsergebnisse auszuschließen [Buneß et al., 2005].
2. Normalisierung der Daten:
Verglichen wurden verschiedene Verfahren der Background-Korrektur und der Normalisierung. Am besten zeigten sich Verfahren mit einer Varianz stabilisierenden Transformation [Rocke und Durbin, 2001 ]. Als bestes Normalisierungsverfahren stellte sich die Normalisierung mittels Box-Cox [Box und Cox, 1964], mit anschießender Median und MAD Standardisierung, heraus. Sein Vorteil, nämlich die Normalisierung einzelner Profile (gegenüber der Normalisierung der gesamten Datenmatrix nach z.B. Huber [Huber et al., 2003], können insbesondere beim Bootstrap gezielt verwendet werden.
3. Statistischer Vergleich der Gruppen:
Die Expressionswerte der untersuchten Transkripte wurden mit dem Wilcoxon- Ranksummen-Test nach dem Infektionsstatus (infektiös vs. nicht infektiös) verglichen. Die Transkripte wurden aufsteigend nach dem erreichten p-Wert angeordnet, wobei alle Transkripte mit einem p-Wert <= 0.001 als gleichwertig betrachtet und diese mittels dem Abstand zwischen infektiöser und nicht infektiöser Gruppe angeordnet wurden. Der Abstand zwischen den beiden Gruppen wurde mittels des Hodges-Lehmann Schätzer bestimmt.
4. Klassifikation:
Aus Tab. 7 wurden 14 Transkripte ausgewählt, die die Patientengruppen in einem Klassifikationstest nach ihrem Infektionszustand am besten trennen konnten. Als bestes Klassifikationsverfahren (d.h. das Verfahren, das in einer einfachen Kreuzvalidierung den kleinsten Klassifikationsfehler lieferte) wurde die lineare Diskriminanzanalyse [Hastie et al., 2001 ] gewählt. Dafür wurde die Funktion Ida aus dem Packet MASS der Software R verwendet. Für die p = 14 Gen-Marker wurden die Gewichte (wo,...,wp ) der Diskriminanzfunktion fLD, die durch die Formel
Figure imgf000057_0001
definiert ist, aus den normalisierten Expressionsdaten berechnet, wobei nacheinander eine Probe weggelassen wurde. Diese Probe wurde nachhinein klassifiziert, wofür in der vorangegangenen Formel für {xi,...,xp) die ct-Werte der Probe eingesetzt wurden. Die Gewichte der Diskriminanzfunktion wurden so berechnet, dass ein positiver Wert der Funktion die Zuordnung zur Gruppe mit einer infektiösen Komplikation und ein negativer Wert der Funktion die Zuordnung zur Gruppe ohne eine infektiöse Komplikation bedeuten. Die Gewichte der linearen Diskriminanzfunktion, die aus allen Proben berechnet wurden, sind in Tab. 7 zusammengefasst.
zu b):
Klassifikationserqebnisse:
Die verwendeten Expressionssignale entstammen dem obigen Datensatz. In der Klassifikation wurden bei einer einfachen Kreuzvalidierung eine Sensitivität von 96 % und eine Spezifität von 95 % erreicht. Das entspricht einer Fehlerrate von 96 %, also einer Falschklassifikation von 2 Proben. Die Gewichte der zugehörigen Diskriminanzfunktion sind in Tab. 7 zusammengefasst.
Figure imgf000058_0001
Tab. 8 zeigt die differenzielle Genexpression in den Patientengruppen, gemessen auf dem Mikroarray.
Tabelle. 8: Differentielle Genexpression zwischen den Patientengruppen; p-Werte für die Analysen 1 und 2: grau unterlegt sind die Marker, die für die jeweilige Analyse einen signifikanten Unterschied zwischen den Gruppen aufzeigen; Analysel (nichtinfektiöse vs. infektiöse Ursache des Multiorganversagens): CPB Patienten vs. septische Patienten mit Fokus Peritonitis bzw. Pneumonie; Analyse2 (Fokus der Infektion, Unterscheidung von Fokus Peritonitis von Fokus Pneumonie): 18 septische Patienten mit Fokus Peritonitis vs. 12 Patienten mit dem Fokus Pneumonie
Figure imgf000059_0001
Figure imgf000060_0001
Figure imgf000061_0001
Figure imgf000062_0001
Figure imgf000063_0001
Figure imgf000064_0001
Figure imgf000065_0001
Figure imgf000066_0001
Figure imgf000067_0001
Figure imgf000068_0001
Figure imgf000069_0001
Figure imgf000070_0001
Figure imgf000071_0001
Figure imgf000072_0001
Figure imgf000073_0001
Figure imgf000074_0001
Figure imgf000075_0001
Beispiel 2: Aufstellung eines Klassifikators zur Identifizierung von SIRS- und Sepsis-Patienten mittels Real-Time-PCR
Messung der Genexpression
Es wurden Patienten mit Pneumonie bzw. Peritonitis als typische Sepsis- Vertreter und im Fall der SIRS Patienten mit einer schweren Herz-OP ausgewählt (Cardiopulmonaler Bypass, CPB), da diese den Großteil der SIRS-Patienten auf einer ITS stellen (siehe Tab. 9). Die Patienten wurden retrospektiv von einem Ärzte- Team der Uni-Klinik Jena in ihrer Diagnose validiert.
Aus dem Blut der Patienten wurde Total-RNA isoliert und in cDNA umgeschrieben. Diese wurde im Assay als Templat eingesetzt.
Tabelle 9: Liste der untersuchten Patienten
Figure imgf000075_0002
Figure imgf000076_0001
Figure imgf000077_0001
Die Marker zur Klassifizierung (Tab. 10) wurden aus dem Biomarkerpool (siehe Beispiel 1 ) ausgewählt und zeigen starke differenzielle Genexpression in Patientengruppen mit und ohne diagnostizierte Sepsis.
Zur Quantifizierung von Genexpression sind verschiedene Methoden verfügbar. Relative Quantifizierung von Genexpression bedeutet eine Aussage zur Abundanz des Targettranskriptes beispielsweise bezogen auf einen Kalibrator. Das kann ein aus den Expressionswerten konstant exprimierter Gene (sog. Referenzgene oder Housekeepinggene) ermittelter Bezugswert sein. Für jeden Organismus und jedes Gewebe sind solche Referenzgene spezifisch und müssen für die jeweilige Studie sorgfältig ausgewählt werden. Ausgehend von den Genexpressionsprofilen aus dem Vollblut der Sepsis- und Kontrollpatienten wurden die stabilsten Gene mit der geringsten Variabilität ausgewählt und in der quantitativen PCR zur Normalisierung eingesetzt.
Figure imgf000077_0002
Figure imgf000078_0001
Tab. 1 1 ist eine Liste der in der Real-Time PCR verwendeten Primer und deren SeqlDs. Für jede Zielsequenz sind mehrere Primerkombinationen möglich, die Tabelle stellt nur eine von vielen Möglichkeiten dar.
Figure imgf000078_0002
Figure imgf000079_0001
Figure imgf000080_0001
Experimentelle Ausführung
Blutabnahme und RNA-Isolation:
Das Vollblut der Patienten wurde auf der Intensivstation von den Patienten mittels des PAXGene Kits gemäß den Vorgaben des Herstellers (Qiagen) abgenommen und die RNA isoliert.
Reverse Transkription:
Von jeder Patienten-Probe wurden 4 μg der Total-RNA zu komplementärer DNA (cDNA) mit der reversen Transkriptase Superscript Il (Invitrogen) in einem 20 μl- Ansatz (enthält 1 μl 10 mM dNTP-Mix von Fermentas und 1 μl 0,5 μg/μl Oligo(dT)- Primer) umgeschrieben. Die RNA wurde anschließend durch alkalische Hydrolyse aus dem Ansatz entfernt. Die Reaktionsansätze wurden nicht aufgereinigt, sondern mit Wasser auf 50 μl aufgefüllt.
Real-Time-PCR
Verwendet wurde der Platinum SYBR Green qPCR SuperMix-UDG - Kit der Firma Invitrogen. Die Patienten-cDNA wurde 1 :100 mit Wasser verdünnt und davon jeweils 1 μl in die PCR eingesetzt. Es wurde pro Marker eine PCR-Platte (BIORAD) mit allen 31 Patienten und No-Template-Controls (NTC) in 3-facher Ausführung pipettiert.
PCR-Ansatz pro well (10 μl) 2μl Templat-cDNA 1 :100
1 μl forward primer, 10 mM
1 μl reverse primer, 10 mM
1 μl Fluorescein Reference Dye
5 μl Platinum SYBR Green qPCR SuperMix-UDG Es wurde ein Mastermix ohne Templat hergestellt, dieser wurde in 9 μl-Aliquots in die PCR-Platte gesteppt und dazu wurden jeweils die Patienten-cDNAs pipettiert.
Figure imgf000081_0001
Verwendet wurde das iQ5 Multicolor Real-Time-PCR Detection System der Firma BIORAD mit der dazugehörigen Auswertungssoftware. Die Ergebnisse eines solchen qPCR-Laufs sind in Fig. 9 gezeigt. Mit Hilfe der Auswertungssoftware wurden für jeden der 18 Marker und 5 Housekeeper solche Abbildungen generiert, aus denen sich dann die entsprechenden Ct-Werte ableiten ließen. Die Ct-Werte werden vom Programm automatisch im Bereich des linearen Anstiegs der Kurven berechnet. Im Beispiel von EPC1 lagen die Ct-Werte für die Sepsis-Patienten im Bereich von 25,08 - 27,71 und für die SIRS-Patienten im Bereich von 28,08 - 35,91.
Datenanalvse:
Die Datenanalyse wurde unter der freien Software R Project Version 2.6.1 durchgeführt, die unter www.r-project.org zur Verfügung steht.
Daten-Vorverarbeitunq:
Die gemessenen Expressionssignale wurden im Excel-Format abgespeichert und über die 3-fach-Bestimmungen gemittelt. Der Marker MON2 mit 15 fehlenden Werten und die Patienten 6065 und 81 1 1 mit 13 bzw. einem fehlenden Wert wurden aus der Analyse ausgeschlossen. Damit enthielt der Trainingsdatensatz 18 infektiöse (62%) und 1 1 nicht infektiöse (38%) Proben. Zum Normalisieren wurden aus den 5 gemessenen die 3 stabilsten Housekeepergene bestimmt. Anschließend wurde für jeden Patienten wurde der Mittelwert der 3 ausgewählten Housekeeper-Gene von den Marker-Genen subtrahiert. Klassifikation:
Um die Gen-Marker nach ihrer Trennungsgüte anzuordnen, wurde der Wilcoxon Ranksummen-Test durchgeführt, in dem die Patientengruppen mit und ohne eine infektiöse Komplikation verglichen wurden. Danach wurden Gene mit p < 0.001 nach dem Hodge-Lehmann-Schätzer angeordnet, die restlichen nach dem p-Wert selbst.
Für die Klassifikation wurde die lineare Diskriminanzanalyse [Hastie et al., 2001 ] mit einer einfachen Kreuzvalidierung verwendet. Die Berechnung erfolgte unter der Verwendung der Funktion Ida aus der R-Bibliothek MASS. Für p Marker wurden die Gewichte der Diskriminanzfunktion fLD, die durch die Formel
Figure imgf000082_0002
Figure imgf000082_0001
definiert ist, aus den Trainingsdaten berechnet, wobei nacheinander eine Probe weggelassen wurde. Diese Probe wurde nachhinein klassifiziert, wofür in der vorangegangenen Formel für x, die Ct-Werte der Probe eingesetzt wurden. Die Gewichte der Diskriminanzfunktion wurden so berechnet, dass ein positiver Wert der Funktion die Zuordnung zur Gruppe mit einer infektiösen Komplikation und ein negativer Wert der Funktion die Zuordnung zur Gruppe ohne eine infektiöse Komplikation bedeuten. Die Klassifikationsprozedur wurde für eine aufsteigende Anzahl von Markern wiederholt.
Anschließend wurde die Vorgehensweise für alle Trainingsdaten durchgeführt und zwei weiteren unabhängigen Proben wurden klassifiziert. Die Gewichte der linearen Diskriminanzfunktion für die aufsteigende Anzahl der Marker und die zugehörigen Score-werte für die unabhängigen Proben 790 und 933 (die grau unterlegten Werte wurden in Fig. 12 graphisch dargestellt) sind in Tab. 12 zusammengefasst.
Ergebnisse
Bei der Klassifikation wurden zuerst die 2 besten Marker verwendet, danach wurde schrittweise der nächste Marker zugefügt. Bei der einfachen Kreuzvalidierung wurde in fast allen Fällen keine Probe falsch klassifiziert. Lediglich bei der Verwendung von 13, 14 und 17 Markern wurde bei der einfachen Kreuzvalidierung eine nicht infektiöse Probe falsch klassifiziert. Damit wurden eine Sensitivität von 100 % und eine Spezifität von 91 % für den Trainingsdatensatz erreicht.
Die zwei unabhängigen Proben 933 und 790 wurden beide überwiegend korrekt klassifiziert. Für die korrekte Klassifikation (d.h. einen negativen Score-Wert) der nicht-infektiösen Probe 933 benötigte man 2 und mehr Marker. Für die infektiöse Probe 790 benötigte man 6 und mehr Marker-Gene, um einen positiven Score-Wert zu erreichen (vgl. Tab. 12). Die Klassifikation wurde mit mehr als 14 Markern instabil. In Fig. 10 sind die Score-Werte für die Klassifikation mit 12 Markern für die Proben 933 und 790 abgebildet. Es wird eine schematische Darstellung des abgeleiteten Score-Wertes und die Einteilung in 4 Bereiche gezeigt. Liegt der berechnete Score über 6,5, so hat der Patient mit einer 95%igen Wahrscheinlichkeit eine Sepsis (infektiös). Liegt der Score unter -6,5, so ist die Wahrscheinlichkeit, keine Sepsis zu haben, für den Patienten ebenfalls 95% (nicht infektiös). Auf diese Skala wurde das Klassifikationsergebnis für 12 Marker für zwei vom Klassifikationsdatensatz unabhängige Testproben projiziert. Der Score der Probe 933 nahm den Wert von - 36,58 an und der Patient wurde als nicht infektiös klassifiziert; der Score der Probe 790 nahm den Wert von 7,44 an und wurde als infektiös klassifiziert.
Die Experimente lieferten Expressionssignale in guter Qualität, so dass die zugehörige Datenmatrix zur Aufstellung des Klassikators verwendet werden konnte. Mittels der gemessenen Signale konnten die Trainingsdaten nach der infektiösen Komplikation so gut wie vollständig getrennt werden. Ebenfalls 2 unabhängige Testdaten wurden richtig klassifiziert. Für eine robuste Klassifikationsgüte im Trainings- und Testdatensatz benötigte man 6 bis 14 Klassifikationsmarker.
Tab. 13a zeigt die Rohdaten (Ct-Werte) aus den qPCR-Assays, wobei in Tab. 13b die Gewichte der linearen Diskriminanzfunktion für aufsteigende Anzahl von Markern und die zugehörigen Score-Werte für die unabhängigen Proben 790 und 933 gezeigt sind.
Figure imgf000084_0001
Figure imgf000085_0001
Tabelle 13b: Gewichte der linearen Diskriminanzfunktion für aufsteigende Anzahl von Markern und die zugehörigen Score- Werte für die unabhängigen Proben 790 und 933.
Figure imgf000086_0002
Legenden zu den Gennamen:
Figure imgf000086_0001
[File ANM\SL0604B1 doc] 11 03 09 SIRS-LAB GmbH
Beispiel 3: Aufstellung eines Klassifikators zur Identifizierung von SIRS- und Sepsis-Patienten mittels konventioneller PCR
Messung der Genexpression
Es wurden Patienten mit Pneumonie bzw. Peritonitis als typische Sepsis- Vertreter und im Fall der SIRS Patienten mit einer schweren Herz-OP ausgewählt (Cardiopulmonaler Bypass, CPB), da diese den Großteil der SIRS-Patienten auf einer ITS stellen (siehe Tab. 14).
Aus dem Blut der Patienten wurde Total-RNA isoliert und in cDNA umgeschrieben. Diese wurde im Assay als Template eingesetzt.
Figure imgf000087_0001
Figure imgf000088_0001
Die Marker zur Klassifizierung wurden aus dem Biomarkerpool (siehe Beispiel 1 ) ausgewählt und zeigen starke differenzielle Genexpression in Patientengruppen mit und ohne diagnostizierte Sepsis.
Tab. 15 enthält eine Auflistung der Genprodukte der Genexpressionsmarker, die für die Klassifizierung verwendet wurden, sowie ihre Beschreibung. Tab. 16 ist eine Liste der in der PCR verwendeten Primer und die dazugehörigen Seq-IDs. Für jede Zielsequenz sind mehrere Primerkombinationen möglich, die Tabelle stellt nur eine von vielen Möglichkeiten dar. Tabelle 15: Genprodukte der Genexpressionsbiomarker, die für die Klassifizierung verwendet wurden, sowie ihre Beschreibung
Figure imgf000089_0001
Tabelle 16: Liste der verwendeten Primer. Für jede Zielsequenz sind mehrere Primerkombinationen möglich, die Tabelle stellt nur eine von vielen Möglichkeiten dar.
Figure imgf000089_0002
Figure imgf000090_0001
Experimentelle Ausführung
Blutabnahme und RNA-Isolation:
Das Vollblut der Patienten wurde auf der Intensivstation von den Patienten mittels des PAXGene Kits gemäß den Vorgaben des Herstellers (Qiagen) abgenommen und die RNA isoliert.
Reverse Transkription:
Von jeder Patienten-Probe wurden 4 μg der Total-RNA zu komplementärer DNA (cDNA) mit der reversen Transkriptase Superscript Il (Invitrogen) in einem 20 μl- Ansatz (enthält 1 μl 10 mM dNTP-Mix von Fermentas und 1 μl 0,5 μg/μl Oligo(dT)- Primer) umgeschrieben. Die RNA wurde anschließend durch alkalische Hydrolyse aus dem Ansatz entfernt. Die Reaktionsansätze wurden nicht aufgereinigt, sondern mit Wasser auf 50 μl aufgefüllt.
PCR:
Die Patienten-cDNA wurde 1 :500 (bzw. bei 4 Markern 1 :50, SNAPC, EPC1 , KIAA0146 und MON2) mit Wasser verdünnt und davon jeweils 1 μl in die PCR eingesetzt. Es wurde pro Marker eine PCR-Platte (96 wells, Nerbe Plus) mit allen 31 Patienten und No-Template-Controls (NTC) in 3-fach-Bestimmung pipettiert.
PCR-Ansatz pro well (13 μl) 1 μl Templat cDNA 1 :500 oder 1 :50
0,5 μl forward primer, 10 mM 0,5 μl reverse primer, 10 mM 1 ,3 μl 10 x Puffer I 0,05 μl Accuprime Taq-Polymerase 9,7 μl Wasser
Es wurde ein Mastermix ohne Templat hergestellt, dieser wurde in 12 μl- Aliquots in die PCR-Platte gesteppt und dazu wurden jeweils die Patienten-cDNA pipettiert (siehe Zusammensetzung des PCR- Reaktionsansatzes).
Das sich daran anschließende PCR-Programm war folgendermaßen aufgebaut:
Figure imgf000092_0001
Verwendet wurde ein Mastercycler Gradient der Firma Eppendorf.
Detektion der PCR-Produkte:
Es wurde eine 1 ,1 -fache SYBR Green-Lösung hergestellt. Dazu wurden zu 8,9 ml Wasser 100 μl einer 100 x SYBR Green-Stammlösung (hergestellt aus einer 10.000 x SYBR Green-Stammlösung der Firma BMA, BioWhittaker Molecular Applications) pipettiert und gemischt. Im Anschluß an die PCR wurden von dieser Lösung je 90 μl in jeden PCR-Ansatz gegeben und dieses Gemisch dann in eine schwarze Platte (96 wells, Greiner) überführt. Im Anschluß daran wurde diese Platte in einem Fluoreszenz-Meßgerät (TECAN GENios) bei 485 nm Anregungswellenlänge/535 nm Emmissionswellenlänge gemessen.
Datenanalvse:
Die Datenanalyse wurde unter der freien Software R Project Version 2.6.1 durchgeführt, die unter www.r-project.org zur Verfügung steht.
Daten-Vorverarbeitunq:
Die gemessenen Expressionssignale (siehe Tab. 16) wurden im Excel-Format abgespeichert, über die 3-fach-Bestimmungen gemittelt und für jeden Marker wurden die NTC-Werte abgezogen. Patient 6065 mit 15 fehlenden Werten wurde aus der Analyse ausgeschlossen. Einzelne fehlende Werte wurden mit dem knn-Algorithmus ersetzt (dafür wurde die Funktion pamr.knnimpute aus der R-Bibliothek pamr verwendet). Die gemittelten Signale wurden log-2 transformiert. Zum Normalisieren wurde für jeden Patienten von den zugehörigen Marker-Genen der Mittelwert der 3 Housekeepergene subtrahiert. Klassifikation:
Um die Genmarker nach ihrer Trennungsgüte anzuordnen, wurde der Wilcoxon Ranksummen-Test durchgeführt, in dem die Patientengruppen mit und ohne eine infektiöse Komplikation verglichen wurden. Danach wurden Gene mit p < 0.001 nach dem Hodge-Lehmann-Schätzer angeordnet, die restlichen nach dem p-Wert selbst.
Für die Klassifikation wurde die lineare Diskriminanzanalyse [Hastie et al., 2001 ] verwendet (für die Berechnung wurde die Funktion Ida im R-Packet MASS genutzt). Die geschätzten Gewichte
Figure imgf000093_0002
der linearen Diskriminanzfunktion fLD mit p Markern wurden in Tab. 17 zusammengefasst. Für eine Messung mit den Werten
Figure imgf000093_0003
wurde der zugehörige Score nach der Formel
Figure imgf000093_0001
berechnet. Ein positiver Wert der Funktion führte zu einer Zuordnung zur Gruppe mit einer infektiösen Komplikation und ein negativer Wert der Funktion zu einer Zuordnung zur Gruppe ohne eine infektiöse Komplikation.
Im ersten Schritt wurde die Trennbarkeit des Trainingsdatensatzes mittels einfacher Kreuzvalidierung geprüft. Anschließend wurden zwei unabhängige Proben klassifiziert, von jeweils einer der beiden untersuchten Patienten-Gruppen (Patient 933 und 790). Dafür wurden die Roh-Messsignale in gleicher Weise vorverarbeitet wie die Trainingsdaten.
Ergebnisse
Die Anordnung der Gene und die zugehörigen Werte sind in Fig. 1 1 zusammengefasst. Es werden die Expressionsunterschiede zwischen den Gruppen: Boxplots der 15 Marker erstellt aus 31 Patienten-Proben (19 mit Sepsis-Diagnose, 12 mit SIRS) dargestellt. Mittels der Boxplots wurde Gen für Gen die Verteilung der Ct- Werte pro Gruppe dargestellt. Diese Ct-Werte wurden von jeder Patientenprobe mittels Real-Time PCR an der cDNA der Patienten (Biorad IQ5) generiert und über die Ct-Werte von drei Referenzgenen normalisiert. An der x-Achse sind der p-Wert und der Hodge-Lehmann-Schätzer des Wilcoxon Rank-Summen-Tests angegeben. Bei der Klassifikation wurden bei der einfachen Kreuzvalidierung 1 eine Sensitivität von 100 % und eine Spezifität von 83 % erreicht, was einer Falschklassifikation von 2 nicht infektiösen Proben entspricht.
Die zwei unabhängigen Proben wurden beide korrekt klassifiziert. Fig. 12 zeigt eine schematische Darstellung des abgeleiteten Score-Wertes und die Einteilung in 4 Bereiche. Liegt der berechnete Score über 6,5, so hat der Patient mit einer 95 %igen Wahrscheinlichkeit eine Sepsis. Liegt der Score unter -6,5, so ist die Wahrscheinlichkeit, keine Sepsis zu haben, für den Patienten ebenfalls 95 %. Auf diese Skala wurde das Klassifikationsergebnis projiziert. Der Score der Probe 933 nahm den Wert von -38,7 an und wurde als nicht infektiös klassifiziert; der Score der Probe 790 nahm den Wert von 9,1 an und wurde als infektiös klassifiziert.
Tab. 18a enthält die Rohdaten aus den Fluoreszenzmessungen mit SYBR Green am TECAN GENios. Tab. 18b zeigt die Rohdaten der unabhängigen Patienen- Proben sowie die Legende für die Gennamen und deren Zuordnung zu den SeqlDs.
Figure imgf000094_0001
Figure imgf000095_0001
Figure imgf000096_0001
Beispiel 4: Erreqertyp - Gram vs. Gram - Differenzielle Genexpression in
septischen Patienten mit gram-negativen und gram-positiven Sepsiserreqern sowie Identifizierung und partielle Validierung der Biomarkerkandidaten für eine diagnostische Anwendung.
In genomweiten Genexpressionsanalysen auf Mikroarrayplattformen wurden Biomarker identifiziert, welche in septischen Patienten mit Infektionen gram-negativer und gram-positiver Bakterien unterschiedlich stark exprimiert werden. Ausgehend von dieser Biomarkerliste mit 1 14 Markern wurde für drei Marker gezeigt, dass sich diese Genexpressionsunterschiede mittels quantitativer PCR darstellen lassen. Für diese 3 Marker wurden genspezifische Primer identifiziert und ihre Genaktivität mittels quantitativer PCR bestimmt.
Messung der Genexpression
Auswahl des Patientenkollektivs:
Aus der umfangreichen Patientendatenbank wurden Patientengruppen mit nachgewiesener (Identifizierung durch Blutkultur) gram-negativer und gram-positiver Infektion ausgewählt. Die für die Untersuchungen ausgewählten Patienten litten alle unter einer schweren Sepsis bzw. Septischem Schock. Die Sepsis ging in den meisten Fällen von einer Pneumonie (Lungenentzündung) oder einer Tracheobronchitis (Entzündung der Bronchien) aus (siehe Tab. 19).
Tabelle 19: Liste der untersuchten Patienten. Nicht unterlegt: Patienten mit gram-negativer Infektion; hellgrau unterlegt: Patienten mit gram-positiver Infektion.
Figure imgf000097_0001
Figure imgf000098_0001
Diese Patienten wurden in einer pangenomischen Genexpressionsstudie auf der Illumina-Plattform (wwwJJJιuminιa.cgmι) analysiert.
Durchführung Genexpressionsanalvse auf Illumina-Plattform: Für die Illumina-Probenvorbereitung wird der „Illumina TotalPrep RNA Amplification Kit" von Ambion (Ambion, USA) nach den darin enthaltenen Vorschriften verwendet. Die Vorbereitung der Hybridisierung erfolgt mit dem „Illumina Gene Expression System".
Die einzelnen Schritte sind nachfolgend prinzipiell beschrieben:
• Reverse Transkription (Erststrang cDNA-Synthese)
Es werden 50-500ng RNA in ein Microzentrifugenröhrchen geben und auf 1 1 μl mit Nuklease-freiem Wasser aufgefüllt.
Folgender Reaktionsmix wird zusammenpipettiert:
1 μl T7 Oligo (dT) Primer
2μl 10X First Strand Buffer
4μl dNTP Mix
1 μl RNase Inhibitor
1 μl Array Script Von dem Mix werden 9μl zur RNA-Probe gegeben und anschließend 2 Stunden bei 42 °C inkubiert. An den Poly-A-Überhang am 3' Ende der mRNA lagert sich das T7 Oligo(dT)-Nukleotid komplementär an, sodass die mRNA unabhängig von ihrer Sequenz mit Hilfe von ArrayScript in cDNA umgeschrieben wird. Nach den 2 Stunden Inkubation wird das Reaktionsgefäß wieder auf Eis gelegt.
• Illumina: Zweitstrang cDNA-Synthese Folgender Reaktionsmix wird auf Eis vorbereitet:
63μl Nuclease free H2O
10μl 10X Second Strand Buffer
4μl dNTP Mix
2μl DNA Polymerase
1 μl RNase H
Zu der Probe werden 80μl vom Zweitstrang cDNA-Reaktionsmix gegeben und anschließend wird 2 Stunden bei 16°C im Thermocycler inkubiert. Während der Zweitstrangsynthese durch DNA-Polymerase wird gleichzeitig die RNA durch RNase H abgebaut.
• In Vitro Transkription (IVT, zur cRNA-Synthese) Bei Raumtemperatur wird folgender Mix vorbereitet:
2,5μl T7 10X Reaction Buffer 2,5μl T7 Enzyme Mix 2,5μl Biotin NTP Mix
Der angesetzte Mix wird zur Probe gegeben und 14h Stunden inkubiert. Der T7 Enzyme Mix enthält T7 RNA Polymerase, eine hoch Promotor-spezifische RNA- Polymerase, die ein DNA-Template benötigt. Das T7 Oligo(dT)-Nukleotid, welches für die Reverse Transkription verwendet wird, verfügt über eine T7-Promotor Sequenz, welche nun von der T7 RNA Polymerase erkannt wird. Es werden cRNA-Stränge (=Antisense RNA) synthetisiert, welche biotinyliertes UTP enthalten. Die In Vitro Transkription ist somit ein Amplifikations- und Markierungsschritt in einem. Anschließend an die Inkubation wird 75μl Nuklease-freies Wasser hinzugegeben.
Aufreiniqunq:
Nach der Zweitstrang-cDNA-Synthese folgt ein Aufreinigungsschritt, durch welchen RNA, Primer, Enzyme und Salz entfernt werden. Ein weiterer Aufreinigungsschritt nach der In Vitro Transkription entfernt Enzyme, Salz, sowie nicht eingelagerte Nukleotide.
Die Aufreinigung erfolgt über cDNA bzw. cRNA Filter Kartuschen, an welchen die Nukleinsäuren mittels cDNA- bzw. cRNA-Bindepuffer gebunden werden. Nach der Zugabe des Waschpuffers werden die Filterkartuschen trocken zentrifugiert und die Nukleinsäure wird mit RNase freiem Wasser in ein neues Reaktionsgefäß eluiert.
Hvbridisierunα:
Die Hybridisierung der cRNA an genspezifische Oligonukleotidsonden erfolgt auf sog. Beadarrays, welche auf Trägern, den Beadchips, angeordnet sind. Die benötigten Puffer, Lösungen und Hybridisierungskammern werden vom Hersteller in Form des Bead-Chip-Kits zur Verfügung gestellt (HumanWG-6 BeadChip-Kit, Illumina, www.illumina.com).
1 ,5μg der jeweiligen cRNA-Probe wird auf 10μl mit RNase freiem Wasser aufgefüllt. Zu der Probe werden 20μl GEX-HYB-Lösung hinzugefügt. In die Befeuchtungspufferreservoirs der Hybridisierungskammer werden 200μl GEX-HCB eingefüllt und die Bead Chips (Human WG-6 BeadChip, Illumina, www.illumina.com) werden in die Hybridisierungskammer eingesetzt. 30μl Probe wird auf die Probenöffnung des Arrays aufgetragen. Die Hybridisierungskammer wird sorgfältig verschlossen und die Proben werden 16-20 Stunden bei 58 °C inkubiert.
Die Bead Chips werden in E1 BC Waschlösung eingetaucht und im High-Temp Puffer bei 55 °C gewaschen. Anschließend erfolgen ein Waschschritt bei Raumtemperatur mit E1 BC-Lösung, ein Ethanolwaschschritt und ein weiterer Waschschritt mit E1 BC. Es folgt ein Blockierschritt mit Block E1 Puffer und ein Markierungsschritt mit Block E1 + Streptavidin-Cy3, bei dem an die biotinylierten Nukleotide der cRNA das fluoreszenzmarkierte Streptavidin bindet. Es wird nochmals mit E1 BC Puffer gewaschen und anschließend wird der Bead Chip durch Zentrifugation getrocknet (2min bei 500 rpm). Anschließend kann der Bead Chip mit dem Bead Array Reader (Illumina Beadstation 500, www.illumina.com) eingescannt werden.
Auswertung der Microarrav-Daten:
Mit dem Beadarray Reader wird der Bead Chip fluorometrisch ausgelesen. Der Scanner hat eine Auflösung von 0,8μm und somit wird von jedem der 48687 auf einem Array platzierten Beadtypen die Fluoreszenz an mindestens 9 Pixeln gemessen. Jeder Beadtyp liegt in mindestens 5facher Redundanz vor. Mit dem von Illumina zur Verfügung gestellte Programm Bead Studio 2.0 werden die Fluoreszenzwerte eines Beadtypen gemittelt und als „Average Signal" ausgegeben. Neben den Beads, die als Sonde für humane Gentranskripte dienen, gibt es auch Beadtypen, die als Negativ-Kontrollen wirken. Deren Sequenzen hybridisieren nicht mit Transkripten aus dem Human-Genom.
Mit Hilfe dieser Kontrollbeads wird das Hintergrundsignal ermittelt, welches von jedem gemittelten Signal abgezogen wird. Außerdem wird mit den Negativ-Kontrollen der Detektions-p-Wert jedes einzelnen Beadtypen ermittelt, der eine Auskunft darüber gibt, ob es sich um ein echtes Signal handelt oder ob die gemessene Intesität dem Hintergrund entspricht. Für die weiterführende Analyse werden nur die Beadtypen verwendet, bei denen mindestens einer der zehn Arrays einen Detektions- p-Wert unter 0,01 erreicht hat.
Für die Korrektur der systematischen Messfehler wurde die vom Datenverarbeitungsprogramm Bead Studio 2.0 (Bestandteil der Illumina Beadstation 500) vorgeschlagene Normalisierung mittels Cubic Splines gewählt. Entsprechend der Empfehlungen [MAQC-Consortium, 2006] wurden zusätzlich folgende Korrekturschritte zugefügt. Die Daten wurden mit der Statistiksoftware weiter bearbeitet (http://www.r.project.org). Aus allen für die weitere Analyse ausgewählten Beadtypen wird der kleinste gemittelte Signal-Wert ermittelt. Dieses Minimum wird von jedem gemittelten Signal subtrahiert, so dass nun das kleinste gemittelte Signal den Wert 0 annimmt. Zu jedem gemittelten Signal wird außerdem die Konstante 16 addiert, bevor zur Basis 2 logarithmiert wird. Nach dem Logarithmieren erhält das kleinste gemittelte Signal den Wert 4. Gleichzeitig wird verhindert, dass das gemittelte Signal einen negativen Wert annehmen kann.
Vergleicht man die Expressionsdaten von gram-positiven mit gram-negativen Proben, so wird das Verhältnis zwischen den Expressionswerten als „Fold Change" angegeben. Dieser Wert gibt an, um welchen Faktor das Transkript in der einen Probe anders exprimiert wurde als in der anderen Probe. Um den Logarithmischen FoId Change zu erhalten, wird die Differenz aus den Mittelwerten der normalisierten Daten beider Gruppen gebildet. Hier wird der FoId Change von gram-positiv bezüglich gram-negativ angegeben:
log2 FoldChange = Mittelwert(normdata(gram+)) - Mittelwert(normdata(gram-)) log2 FoldChange = Iog2(gram+/gram-)
Die Zahl 2 wird mit dem Logarithmischen FoId Change potenziert, um einen Theoretischen FoId Change zu erhalten. Nimmt der Theoretische FoId Change einen Wert kleiner als eins an, so ergibt sich der FoId Change aus dem negativen Reziproken des Theoretischen FoId Changes. Im entgegengesetzten Fall entspricht der FoId Change dem Theoretischen FoId Change:
Theoretischer FoId Change = 2 log2 Fold Changθ = 2log2(gram+/gram-) =gram+/gram- FoId Change: wenn Theoretischer FoId Change < 1
dann FoId Change =
TheoretischerFoldChange sonst FoId Change = Theoretischer FoId Change
Ein positiver FoId Change bedeutet, dass das entsprechende Gen im Fall einer gram-positiven Infektion stärker exprimiert wird als bei einer gram-negativen Infektion.
Für jeden Beadtyp wird außerdem der p-Wert für den t-Test und den Wilcoxon- Test berechnet. Unter der Annahme, dass die Nullhypothese des Tests richtig ist, gibt der p-Wert die Wahrscheinlichkeit an, dass der gemessene Wert durch Zufall zustande kommt. Ist diese Wahrscheinlichkeit geringer als eine vorgegebene Schranke, so wird angenommen, dass die Differenz nicht zufällig ist.
In Tab. 20 sind die identifizierten Biomarker dargestellt:
Tabelle 20: Differentielle Genexpression von Transkripten in gram-positiver und gram-negativer Sepsis, gemessen auf der Illumina-Genexpressionsplattform
Figure imgf000103_0001
Figure imgf000104_0001
Figure imgf000105_0001
Figure imgf000106_0001
Figure imgf000107_0001
Figure imgf000108_0001
Die Genaktivität von drei Markern aus dieser Liste wurden mittels quantitativer PCR an der cDNA derselben Patienten gemessen, um die Daten mit einer anderen Methode zu reproduzieren.
Die drei Marker sowie ein repräsentatives Primerpaar für die Quantifizierung mittel Real-Time-PCR sind in Tab. 21 dargestellt. Weiterhin werden zur relativen Quantifizierung sog. Referenzgene verwendet, welche im jeweiligen Gewebe konstant exprimiert sind. Die in diesem Experiment genutzten Referenzgene sind ebenfalls dargestellt.
Figure imgf000108_0002
Blutabnahme und RNA-Isolation:
Das Vollblut der Patienten wurde auf der Intensivstation von den Patienten mittels des PAXGene Kits gemäß den Vorgaben des Herstellers (Qiagen) abgenommen. Nach Abnahme des Vollblutes wurde die Gesamt-RNA der Proben unter Anwendung des PAXGene Blood RNA Kits gemäß den Vorgaben des Herstellers (Qiagen) isoliert.
Reverse Transkription:
Von jeder Patienten-Probe wurden 300 ng der Total-RNA zu komplementärer DNA (cDNA) mit der reversen Transkriptase Superscript Il (Invitrogen) in einem 20 μl- Ansatz umgeschrieben und die RNA anschließend durch alkalische Hydrolyse aus dem Ansatz entfernt. Die Reaktionsansätze wurden anschließend mit Hilfe von Microcon-Säulchen aufgereinigt.
Real-Time-PCR
Verwendet wurde der Platinum SYBR Green qPCR SuperMix-UDG - Kit der Firma Invitrogen. Für einen 10 μl-Ansatz wurden folgende Bestandteile pipettiert:
5 μl Platinum SYBR Green qPCR Supermix-UDG, 2x
1 μl Primer forward (10 pmol/μl)
1 μl Primer reverse (10 pmol/μl)
1 μl Fluorescein (0,5 μM)
1 μl H2O, RNase frei
1 μl Template cDNA (6,67 ng/μl)
Figure imgf000109_0001
Verwendet wurde das iQ5 Multicolor Real-Time-PCR Detection System der Firma BIORAD mit der dazugehörigen Auswertungssoftware.
Ergebnisse
Die Ct-Werte der Real-Time-PCR wurden nach der Methode von Vandesompele normalisiert [Vandesompele et al., 2002]. Für die Vandesompele- Normalisierung wird zuerst die Relative Größe R für jedes Target (Interessierendes Gen (Gene gf hterest) und Referenzgen) berechnet:
Figure imgf000110_0002
Für die Effizienz E wird der idealisierte Wert 2 eingesetzt. Die Effizienz wird mit der Differenz aus dem kleinsten Ct-Wert aus allen Proben eines Gens und der jeweiligen Patientenprobe potenziert. Der Normalisierungsfaktor NF wird über das geometrische Mittel der Relativen Größen R der Referenzgene (Ref) berechnet:
Figure imgf000110_0004
Figure imgf000110_0001
Für den Normalisierungsfaktor wird die dritte Wurzel aus dem Produkt der drei Referenzgene gezogen. Um die normalisierten Daten zu erhalten, wird der Quotient aus Relativer Größe R und dem Normalisierungsfaktor gebildet:
Figure imgf000110_0003
In diesem Zusammenhang zeigt Fig. 13 die differenzielle Expression des Gens CDKN1 C in septischen Patienten mit gram-positiver und gram-negativer Infektion. Im Boxplot sind die mittleren normalisierten Ct-Werte für jeweils 5 Patienten dargestellt. Ermittelt wurden diese Werte mit realtime-PCR an der cDNA der Patienten. Fig. 14 zeigt die differenzielle Expression des Gens CTSL in septischen Patienten mit gram-positiver und gram-negativer Infektion. Im Boxplot sind ebenfalls die mittleren normalisierten Ct-Werte für jeweils 5 Patienten dargestellt. Ermittelt wurden diese Werte mit realtime-PCR an der cDNA der Patienten.
In Fig. 15 wird die differenzielle Expression des Gens METTL7B in septischen Patienten mit gram-positiver und gram-negativer Infektion gezeigt. Im Boxplot sind die mittleren normalisierten Ct-Werte für jeweils 5 Patienten dargestellt. Ermittelt wurden diese Werte mit realtime-PCR an der cDNA der Patienten.
Tab. 22 zeigt Rohdaten (Ct-Werte, Mittelwerte aus Triplikaten) aus den qPCR- Assays für den Marker CDKN1 C (SeqlD 104).
Tab. 23 enthält nach Vandesompele [Vandesompele et al., 2002] normalisierte Rohdaten aus den qPCR-Assays für den Marker CDKN1 C (SeqlD 104).
In Tab. 24 sind Rohdaten (Ct-Werte, Mittelwerte aus Triplikaten) aus den qPCR- Assays für den Marker CTSL (SeqlD 149) enthalten.
Tab 25 zeigt nach Vandesompele [Vandesompele et al., 2002] normalisierte Rohdaten aus den qPCR-Assays für den Marker CTSL (SeqlD 149).
In Tab. 26 sind Rohdaten (Ct-Werte, Mittelwerte aus Triplikaten) aus den qPCR- Assays für den Marker METTL7B (SeqlD 145) enthalten.
Tab. 27 zeigt nach Vandesompele [Vandesompele et al., 2002] normalisierte Rohdaten aus den qPCR-Assays für den Marker METTL7B (SeqlD 145).
Tabelle 22: Rohdaten (Ct-Werte, Mittelwerte) aus den qPCR-Assays für den Marker CDKN1 C (SeqlD 104). Hellgrau: Patienten mit gram-negativer Infektion, dunkelgrau: Patienten mit gram-positiver Infektion.
Figure imgf000111_0001
Figure imgf000112_0001
Tabelle 23: Nach Vandesompele normalisierte Rohdaten aus den qPCR-Assays für den Marker CDKN 1 C (SeqlD 104). Hellgrau: Patienten mit gram-negativer Infektion, dunkelgrau: Patienten mit gram-positiver Infektion.
Figure imgf000112_0003
Tabelle 24: Rohdaten (Ct-Werte, Mittelwerte) aus den qPCR-Assays für den Marker CTSL (SeqlD 149). Hellgrau: Patienten mit gram-negativer Infektion, dunkelgrau: Patienten mit gram-positiver Infektion.
Figure imgf000112_0002
Figure imgf000113_0003
Tabelle 25: Nach Vandesompele normalisierte Rohdaten aus den qPCR-Assays für den Marker CTSL (SeqlD 149). Hellgrau: Patienten mit gram-negativer Infektion, dunkelgrau: Patienten mit gram-positiver Infektion.
Figure imgf000113_0002
Tabelle 26: Rohdaten (Ct-Werte, Mittelwerte) aus den qPCR-Assays für den Marker METTL7B (SeqlD 145). Hellgrau: Patienten mit gram-negativer Infektion, dunkelgrau: Patienten mit gram-positiver Infektion.
Figure imgf000113_0001
Figure imgf000114_0001
Tabelle 27: Nach Vandesompele normalisierte Rohdaten aus den qPCR-Assays für den Marker METTL7B (SeqlD 145). Hellgrau: Patienten mit gram-negativer Infektion, dunkelgrau: Patienten mit gram-positiver Infektion.
Figure imgf000114_0002
Signifikanz der Ergebnisse
Mit dem Wilcoxon Test wurde anschließend überprüft, ob die Ergebnisse signifikant sind. Die aufgestellte Nullhypothese besagte, dass es keine signifikanten Unterschiede in den beiden Gruppen bezüglich der Genexpression gibt. Die Nullhypothese konnte bei allen 3 Targets widerlegt werden. Damit ist der Unterschied zwischen gram-positiven und gram-negativen Septikern bezüglich der Expression von CDKN1 C( SeqlD 104), CTSL (SeqlD 149) und METTL7B (SeqlD 145) mit einer 95%igen Wahrscheinlichkeit nicht zufällig.
FoId Change
Um die x-fache Veränderung einer größeren Anzahl von Werten miteinander zu vergleichen, wurde aus den nach Vandesompele normalisierten Werten zuerst das geometrische Mittel jeder Gruppe gebildet. Der FoId Change bzw. die x-fache Veränderung der Genexpression berechnet sich dann aus dem Quotienten der nach Vandesompele normalisierten Ct-Werte der zu vergleichenden Gruppen. Die Effizienz der PCR wurde schon bei der Normalisierung einberechnet, sodass sie an dieser Stelle entfällt.
Der FoId Change der Patienten berechnet sich somit wie folgt:
Figure imgf000115_0001
Alle drei untersuchten Targets wiesen in der PCR-Analyse einen FoId ChangeGram+ vs Gram- mit der gleichen Tendenz wie in der Microarrayauswertung auf. Dabei fällt auf, dass das Target METTL7B, welches bei Illumina den größten FoId Change erzielte nun auch in der PCR-Analyse den höchsten Wert annimmt.
Tab. 28 zeigt medizinische Parameter der in die Analyse eingegangenen Patienten wie sie von Seiten der Klinik validiert wurden.
Tabelle 28: Medizinische Parameter der in die Analyse eingegangenen Patienten. Hellgrau: Patienten mit gram-negativer Infektion, dunkelgrau: Patienten mit gram-positiver Infektion.
Figure imgf000115_0002
Figure imgf000116_0001
Figure imgf000117_0001
Beispiel 5: Nicht-kodierende RNA - Differenzielle Genexpression eines Transkriptes ohne Protein-kodierende Funktion (sog, nicht-kodierende RNA) in SIRS- und Sepsis-Patienten mittels Real-Time-PCR.
Messung der Genexpression
Es wurden 5 Patienten mit Pneumonie als Sepsis-Vertreter und im Fall der SIRS 5 Patienten mit einer schweren Herz-OP ausgewählt (Cardiopulmonaler Bypass, CPB), da diese den Großteil der SIRS-Patienten auf einer ITS stellen (siehe Tab. 29). Die Patienten wurden retrospektiv von einem Ärzte-Team der Uni-Klinik Jena in ihrer Diagnose validiert.
Aus dem Blut der Patienten wurde Total-RNA isoliert und in cDNA umgeschrieben. Diese wurde im Assay als Templat eingesetzt.
Tabelle 29: Liste der untersuchten Patienten
Figure imgf000118_0001
Der Marker mit der SeqlD 207 (Accession-No. AA868082) für nichtkodierende RNA ist Bestandteil der oben angeführten Biomarkerliste.
Tab. 30 zeigt ein Beispiel eines Primerpaares für die Amplifikation des nicht- kodierenden Markers mit der SeqlD 207 in der Real-Time PCR. Es wurden 10 Patienten untersucht (5 Sepsis-Patienten, 5 SIRS-Patienten).
Figure imgf000119_0001
Experimentelle Ausführung
Blutabnahme und RNA-Isolation
Das Vollblut der Patienten wurde auf der Intensivstation von den Patienten mittels des PAXGene Kits gemäß den Vorgaben des Herstellers (Qiagen) abgenommen und die RNA isoliert.
Reverse Transkription
Von jeder Patienten-Probe wurden 4 μg der Total-RNA zu komplementärer DNA (cDNA) mit der Reversen Transkriptase Superscript Il (Invitrogen) und den genspezifischen Primern in einem 20 μl-Ansatz umgeschrieben (10 mM dNTP-Mix und 2 μM genspezifische Primer (SeqlD 207) und die RNA anschließend durch alkalische Hydrolyse aus dem Ansatz entfernt. Die Reaktionsansätze wurden mit Microcon-Säulchen aufgereinigt, die eluierte cDNA in der SpeedVac eingedampft und anschließend in 50 μl Wasser aufgenommen.
Real-Time-PCR
Verwendet wurde der Platinum SYBR Green qPCR SuperMix-UDG - Kit der Firma Invitrogen. Die Patienten-cDNA wurde 1 :100 mit Wasser verdünnt und davon jeweils 2 μl in die PCR eingesetzt. Alle Ansätze wurden in 3facher Ausführung pipettiert.
Figure imgf000119_0002
1 μl reverse primer, 10 mM
1 μl Fluorescein Reference Dye
5 μl Platinum SYBR Green qPCR SuperMix-UDG, 2x
Es wurde ein Mastermix ohne Template hergestellt, dieser wurde in 8 μl- Aliquots in die PCR-Platte gesteppt und dazu wurden jeweils die Patienten-cDNAs pipettiert. Das sich daran anschließende PCR-Programm war folgendermaßen aufgebaut:
Figure imgf000120_0002
Verwendet wurde das iQ5 Multicolor Real-Time-PCR Detection System der Firma BIORAD mit der dazugehörigen Auswertungssoftware.
Ergebnisse
Die mittels Real-Time-Assays gemessenen Expressionssignale wurden im Excel-Format abgespeichert und über die 3-fach-Bestimmungen gemittelt. Die Ergebnisse sind in der nachfolgenden Tab. 31 gezeigt.
Tabelle. 31 Ct-Werte aus den Real Time-Assays
Figure imgf000120_0001
Figure imgf000121_0001
Fig. 16 zeigt einen Boxplot für den nicht-kodierenden Marker mit der SeqlD 207, erstellt aus 10 Patienten-Proben (5 mit Sepsis-Diagnose, 5 mit SIRS). Auf der y- Achse ist der mittlere Ct-Wert während der Real-Time- Amplifikation dargestellt. Es ist eine klare Trennung von Sepsis- und SIRS-Patienten erkennbar.
Die folgende Tab. 32 stellt den Bezug zwischen der Sequenzprotokollnummer der einzelnen Polynukleotide und deren öffentlich zugänglichen Accession-Nummer her.
Tabelle 32: Korrelation von Sequenznummer (Sequenzprotkoll) und Accession- Nummer
Figure imgf000121_0002
Figure imgf000122_0001
Figure imgf000123_0001
Figure imgf000124_0001
Figure imgf000125_0001
LITERATUR
ACCP/SCCM (1992), Crit. Care Med 20, 864-74
Alberti C, Brun-Buisson C, Goodman SV, Guidici D, Granton J, Moreno R, Smithies M, Thomas O, Artigas A, Le GaII JR; European Sepsis Group (2003) Influence of systemic inflammatory response Syndrome and Sepsis on outcome of critically ill infected patients. Am J Respir Crit Care Med 168, 77-84.
Amin K, Kauffman CA (2003), Fever of unknown origin. Postgrad med1 14(3), 69-75
Baker SG, und Kramer B (2006), Identifying genes that contribute most to good Classification in microarray. BMC Bioinformatics 7, 407
Bone RC, BaIk RA, Cerra FB, Dellinger EP, Fein AM, Knaus WA, Schein RM, Sibbald WJ, the ACCP/SCCM Consensus Conference Committee (1992) Definitions for Sepsis and organ failure and guidelines for the use of innovative therapies in Sepsis. Chest 101 ,1656-1662
Box GEP, Cox DR (1964) An analysis of transformations (with discussion). J Roy Stat Soc B 26, 21 1 -252
Buneß A, Huber W, Steiner K, Sültmann H, Poustka A (2005) ArrayMagic: two- colour cDNA microarray quality control and preprocessing. Bioinformatics 21 , 554 - 556.
Breiman L (2001 ) Random Forests. Machine Learning 45(1 ), 5-32
Brun-Buisson C, Doyon F, Carlet J, Dellamonica P, Gouin F, Lepoutre A, Mercier JC, Offenstadt G, Regnier B (1995) Incidence, risk factors, and outcome of severe Sepsis and septic shock in adults. A multicenter prospective study in intensive care units. French ICU Group for Severe Sepsis. JAMA 274, 968-974
Brun-Buisson C, Roudot-Thoraval F, Girou E, Grenier-Sennelier C, Durand-Zaleski I (2003) The costs of septic Syndromes in the intensive care unit and influence of hospital-acquired Sepsis. Intensive Care Med 29, 1464-1471
Bustin SA (2002) Quantification of mRNA using real-time reverse transcription PCR (RT-PCR): trends and problems. J Mol Endicronol 29, 23-29
Calandra T, Cohen J. (2005) International Sepsis Forum Definition of Infection in the ICU Consensus Conference. Critical Care Med 33(7), 1538-48.
Carrigan SD Scott G Tabrizian M (2004) Toward resolving the challenges of Sepsis. Clin Chem 50(8), 1301 -1314
DE 10 2007 036 678 Verwendung von Polynukleotiden zur Erfassung von Genaktivitäten für die Unterscheidung zwischen lokaler und systemischer Infektion
DE 102007036678.9 (nicht veröffentlicht) Ding BY and Gentleman R (2004) Classification using generalized partial least Squares. Bioconductor Project Working Papers. Paper 5. http://www.begress.com/bioconductor/paper5 9
Efron B (1979) Bootstrap Methods: Another Look at the Jackknife. The Annais of Statistics 7(1 ), 1 -26
FDA: In Vitro Diagnostic Multivariate Index Assays. Draft Guidance for Industry, Clinical Laboratories, and FDA Staff (2003) http://www.fda.gOv/cdrh/oivd/guidance/1610.pdf
Feezor RJ, Baker HV, Xiao W et al. (2004) Genomic and Proteomic Determinants of Outcome in Patients Untergoing Thoracoabdominal Aortic Aneurysm Repair. J Immun 172, 7103-7109
Klein D (2002) Quantification using real-time PCR technology: applications and limitations. Trends Mol Med 8(6), 257-260
Mayhall G (2001 ) Ventilator-Associated Pneumonia or Not? Contemporary Diagnosis. Emerging Infection Disease CDC 7(2)
Golub TR, Slonim DK, Tamayo P, et al. (1999) Molecular Classification of Cancer: class discovery and class prediction by gene expression monitoring. Science 286, 531 -537
Hastie T, Tibshirani R, Friedman J. (2001 ) The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer Series in Statistics.
Hollander M., Wolfe D., (1973), Nonparametric Statistical inference. New York: John Wiley & Sons. Huber W, von Heydebreck A, Sueltmann H, Poustka A, Vingron M (2003) Parameter estimation for the calibration and variance stabilization of microarray data. Stat Appl in Genetics and Mol Biology 2(1 ), Article 3
Huggett J, Dheda K, Bustin S et al. (2005) Real-time RT-PCr normalisation; strategies and considerations Genes Immun 6(4), 279-284
Increase in National Hospital Discharge Survey rates for septicemia-United States, 1979-1987. MMWR Morb Mortal WkIy Rep 1990 39, 31 -34
Johnson SB, Lissauer M, Bochicchio GV, Moore R, Cross AS, Scalea TM. (2007) Gene Expression Profiles Differentiate Between Sterile SIRS and Early Sepsis Annais of Surgery 245(4), 61 1 -621
Knaus WA , Draper EA, Wagner DP, Zimmermann JE (1985) Prognosis in acute organ-system failure. Ann Surg 202, 658-693
Kofoed K, Andersen O, Kronborg G, Tvede M, Petersen J, Eugen-Olsen J, Larsen K (2007), Use of plasma C-reactive protein, procalcitonin, neutrophils, macrophage migration inhibitory factor, soluble urokinase-type Plasminogen activator receptor, and soluble triggering receptor expressed on myeloid cells-1 in combination to diagnose infections: a prospective study. Critical Care 1 1 , R38
Kubista M, Andrade JM, Bengtsson M et al. (2006) The real-time Polymerase chain reaction. Mol Aspects Med 27, 95-125
Kumar A, Roberts D, Wood KE et al. (2006) Duration of hypothension before initiation of effective antimicrobial therapy is the critical determinant of survival in human septic shock. Crit Care Med 34(6), 1589-1596
Le-GaII JR, Lemeshow S, Leleu G, Klar J, Huillard J, Rue M, Teres D, Artigas A (1995) Customized probability modeis for early severe Sepsis in adult intensive care patients. Intensive Care Unit Scoring Group. JAMA 273, 644-650 Levy MM, Fink MP, Marshall JC, Abraham E, Angus D, Cook D, Cohen J, Opal SM, Vincent JL, Ramsay G et al. (2003) 2001 SCCM/ESICM/ACCP/ATS/SIS International Sepsis Definitions Conference. Intensive Care Med 29, 530-538
Liu H, Li J, Wong L (2005) Use of extreme patient samples for outcome prediction from gene expresseion data. Bioinformatics 21 (16), 3377-3384
MAQC Consortium. The MicroArray Quality Control (MAQC) project shows inter-and intraplatform reproducibility of gene expression measurements. Nat Biotechnol 2006, 24:, 1 151 -61
Mathiak G, Kabir K, Grass G, et al. (2003) Lipopolysaccharides from different bacterial sources elicit disparate cytokine responses in whole blood assays. Int J Mol Med 1 1 (1 ), 41 -44
Marshall JC, Vincent JL, Fink MP et al. Measures, markers, and mediators: toward a Staging System for clinical sepsis. A report of the Fifth Toronto Sepsis Roundtable, Toronto, Ontario, Canada, October 25-26, 2000 und Crit Care Med. 2003, 31 : 1560- 1567
Mayhall CG (2001 ) Ventilator-Associated Pneumonia or Not? Contemporary Diagnosis. Emerg Infect Dis 7(2), 200-204
Nolan T, Hands RE, Bustin SA (2006) Quantification of mRNA using realt-time RT- PCR. Nat Protoc 1 (3), 1559-1582
Opal SM, Lim Y-P, Siryaporn E, et al. (2005) Longitudinal studies of inter-alpha inhibitor proteins in severly septic patients : A potential clinical marker and mediator of severe sepsis. Clin Invest 35(2), 387-292
Pachot A, Lepape A, Vey S, et al. (2006) Systemic transcriptional analysis in survivor and non-survivor septic shock patients: a preliminary study. Immunol Lett 106(1 ), 63- 71. Epub 2006 May 17 PiIe JC (2006) Evaluating postoperative fever: a focused approach. Clev Clin J Med. 73 (supp.1 ) 62-66
Ramilo O, Allman W, Chung W, Mejias A, Ardura M, Glaser C, Wittkowski KM, Piqueras P, Bancherau J, Palucka K A, Chaussabel D, (2007) Gene expression patterns in blood leukocytes discriminate patients with acute infections. Blood 109, 2066-2077
R Development Core Team (2006) R: A language and environment for Statistical Computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051 - 07-0, URL http://www.R-project.org
Rocke DM, Durbin B. (2001 ) A model for measurement error for gene expression arrays. J Comput Biol 8, 557-569
Roth AR, Basello DO, (2003) Approach to the adult patient with fever of unknown origin. Am Farn Phys 68(1 1 ) 2223-2228
Ruokonen E et al. (1999) Procalcitonin concentrations in patients with neutropenic fever. Eur J Clin Microbiol Infect Dis 18(4), 283-5
Ruokonen E et al. (2002) Procalcitonin and neopterin as indicators of infection in critically ill patients. Acta Anaesthesiol Scand 46(4), 398-404
Simon L, Gauvin F, Amre DK, Saint-Lois P, Lacroix J, (2004) Serum procalcitonin and C-reactive protein levels as marker of bacterial infection: A systematic review and meta analysis. Clin Infec Dis 39, 206-217
Simon R. (2005) Roadmap for Developing and Validating Therapeutically Relevant Genomic Classifiers. J Clin Oncol 23, 7332-7341
Sponholz C, Sakr Y, Reinhart K, Brunkhorst F, (2006) Diagnostic value and prognostic implications of serum procalcitonin after cardiac surgery: a systematic review of the literature, Critical Care 10, R145 Suprin E et al. (2000) Procalcitonin: a valuable indicator of infection in a medical ICU? Intensive Care Med 26(9), 1232-1238
Tang BMP, Eslick GD, Craig JC et al. (2007a) Accuracy of procalcitonin for sepsis diagnosis in critically ill patients : systematic review and meta-analysis. Lancet Infect Dis 7, 210-217
Tang BMP, McLean AS, Dawes IW, Huang SJ, Lin RCY (2007b) The Use of Gene- Expression Profiling to Identify Candidate Genes In Human Sepsis. American Journal of Respiratory and Critical Care Medicine 176(7), 676-684
US 20060246495 Diagnosis of sepsis
US 6960439 Identification, monitoring and treatment of disease and characterization of biological condition using gene expression profiles
Vandesompele J, Preter De K, Pattyn F, et al. (2002) Accurate normalisation of real- time quantitative PCR data by geometric averaging of multiple internal control genes. Genome Biology 3(7), research0034.1 -0034.1 1
Valasek MA, Repa JJ (2005) The power of real-time PCR. Advan Physiol Educ 29, 151 -159
Vapnik V., (1999). The Nature of Statistical Learning Theory. Springer, New York.
Whitcombe D, Theaker J, Guy SP et al. (1999) Detection of PCR products using selfprobing amplicons and fouoreschence. Nat Biotechnol 17, 904-907
WO 2006/100203 Verwendung von Geneaktivitäts-Klassifikatoren für die in vitro Klassifizierung von Genexpressionsprofilen von Patienten mit infektiösem/nichtinfektiösem WO 2004/087949 Verfahren zur Erkennung akuter, generalisierter entzündlicher Zustände (SIRS), Sepsis, sepsisähnlichen Zuständen und systemischen Infektionen
WO 2005/0831 15 Verfahren zur Erkennung von Sepsis
WO 2005/106020 Verfahren zur Erstellung von Kriterien zur Vorhersage des Krankheitsverlaufs bei Sepsis
WO 2006/042581 Verfahren zur Unterscheidung zwischen nichtinfektiösen und infektiösen Ursachen eines Multiorganversagens
WO 2007/144105 Verfahren zur Feststellung der lokalen Entzündung eines Fiebers unklarer Genese
WO 2007/124820 Verfahren zur in vitro-überwachung postoperativer Veränderungen nach Lebertransplantation
WO 2003/084388 Early detection of sepsis
Wong ML, Medrano JF (2005) Real-time PCR for mRNA quantification. Biotechniques 39(1 ) 1 -1 1
Zeni F, Freeman B, Natanson C (1997) Anti-inflammatory therapies to treat sepsis and septic shock: A reassessment. Crit Care Med 25(7), 1095-1 100

Claims

Ansprüche
1. Verfahren zur in vitro Erfassung und/oder Unterscheidung und/oder Verlaufsbeobachtung von pathophysiologischen Zuständen, ausgewählt aus der Gruppe bestehend aus: SIRS, Sepsis und deren Schweregraden; sepsisähnlichen Zuständen; septischem Schock; infektiösem/nicht-infektiösem Multiorganversagen; Überlebenswahrscheinlichkeit bei Sepsis; Fokus einer Infektion; Responder/non-Responder für eine bestimmte Therapie; Ursachen eines pathophysiologischen Zustandes, insbesondere Klassifizierung einer Infektion nach gram-positiven und/oder gram-negativen Bakterien; wobei das Verfahren folgende Schritte umfaßt:
a) Isolierung von Probennukleinsäuren aus einer von einem Patienten stammenden Probe;
b) Bestimmung von Genaktivitäten mittels einer Mehrzahl von Polynukleotiden, ausgewählt aus der Gruppe bestehend aus SEQ-ID NO: 1 bis SEQ-ID NO: 669 und/oder deren Genloci und/oder deren Transkripten und/oder Fragmenten davon, zur Bildung wenigstens eines für die Erfassung und/oder Unterscheidung und/oder den Verlauf von pathophysiologischen Zuständen eines Patienten charakteristischen Multigenbiomarkers;
c) Bestimmung von Genaktivitäten wenigstens eines internen Referenzgens, auf die die unter b) bestimmten Genaktivitäten bezogen, insbesondere normalisiert, werden;
d) Bilden eines Index-Wertes aus den einzelnen bestimmten normalisierten Genaktivitäten des Multigenbiomarkers, der den pathophysiologischen Zustand anzeigt.
2. Verfahren nach Anspruch 1 , dadurch gekennzeichnet, dass das wenigstens eine Referenzgen ein Housekeepinggen ist, insbesondere ausgewählt aus Polynukleotiden der Gruppe bestehend aus SEQ-ID NO: 676 bis SEQ-ID NO: 686, und/oder deren Genloci und/oder deren Transkripten und/oder Fragmenten davon.
3. Verfahren nach Anspruch 1 , dadurch gekennzeichnet, dass als Polynukleotidsequenzen Genloci, sense und/oder antisense Stränge von prä- mRNA und/oder mRNA, small RNA, insbesondere scRNA, snoRNA, micro RNA, siRNA, dsRNA , ncRNA oder transposable Elemente zur Erfassung der Genexpressionsprofile verwendet werden.
4. Verwendung einer Mehrzahl von Polynukleotiden, ausgewählt aus der Gruppe, bestehend aus SEQ-ID NO: 1 bis SEQ-ID NO: 669 und/oder deren Genloci und/oder deren Transkripten und/oder Fragmenten davon, zur Bildung wenigstens eines Multigenbiomarkers zur Herstellung eines Multiplex-Assays als Hilfsmittel zur Beurteilung, ob bei einem Patienten ein pathophysiologischer Zustand vorliegt, und/oder zur Feststellung des Schweregrades und/oder des Verlaufs des pathophysiologischen Zustands.
5. Verwendung nach Anspruch 4, dadurch gekennzeichnet, dass der Multigenbiomarker eine Kombination von mehreren Polynukleotid-, insbesondere Gensequenzen ist, anhand deren Genaktivitäten mittels einer Interpretationsfunktion eine Klassifikation durchgeführt und/oder ein Index gebildet wird.
6. Verwendung nach Anspruch 4 oder 5, dadurch gekennzeichnet, dass die Genaktivitäten mittels enzymatischer Verfahren, insbesondere Amplifikationsverfahren, bevorzugt Polymereasekettenreaktion (PCR), vorzugsweise Real-Time-PCR; und/oder mittels Hybridisierungsverfahren, insbesondere solchen auf Microarrays, erfasst werden.
7. Verwendung nach einem der Ansprüche 4 bis 6, dadurch gekennzeichnet, dass aus den einzelnen bestimmten Genaktivitäten ein Index gebildet wird, der nach entsprechender Kalibrierung ein Maß für den Schweregrad und/oder den Verlauf des pathophysiologischen Zustands, insbesondere der Sepsis oder des sepsisähnlichen Zustandes, ist.
8. Verwendung nach einem der Ansprüche 4 bis 7, dadurch gekennzeichnet, dass der Index auf einer leicht interpretierbaren Skala angezeigt wird.
9. Verwendung nach einem der Ansprüche 4 bis 8, dadurch gekennzeichnet, dass man die erhaltenen Genaktivitätsdaten zur Herstellung von Software für die Beschreibung mindestens eines pathophysiologischen Zustands und/oder einer Untersuchungsfrage und/oder als Hilfsmittel für Diagnosezwecke und/oder für Patientendatenmangement-Systeme einsetzt.
10. Verwendung nach einem der Ansprüche 4 bis 9, wobei zur Erstellung der Genaktivitätsdaten solche spezifischen Genloci, sense und/oder antisense Stränge von prä-mRNA und/oder mRNA, small RNA, insbesondere scRNA, snoRNA, micro RNA, siRNA, dsRNA, ncRNA oder transposable Elemente, Gene und/oder Genfragmente verwendet werden, welche eine Sequenzhomologie von mindestens ca. 10%, insbesondere ca. 20%, vorzugsweise ca. 50%, besonders bevorzugt ca. 80% zu den Polynukleotidsequenzen gemäß SEQ-ID NO: 1 bis SEQ-ID NO: 669 aufweisen.
1 1. Verwendung mindestens eines Polynukleotids, ausgewählt aus der Gruppe, bestehend aus SEQ-ID NO: 1 bis SEQ-ID NO: 152 und/oder deren Genloci und/oder deren Transkripten und/oder Fragmenten davon, zur Herstellung eines Assays zur Beurteilung, ob bei einem Patienten ein pathophysiologischer Zustand vorliegt, und/oder zur Feststellung des Schweregrades und/oder des Verlaufs des pathophysiologischen Zustands.
12. Verwendung nach einem der Ansprüche 4 bis 1 1 , dadurch gekennzeichnet, dass der pathophysiologische Zustand ausgewählt ist aus der Gruppe bestehend aus: SIRS, Sepsis und deren Schweregraden; sepsisähnlichen Zuständen; septischem Schock; infektiösem/nicht-infektiösem Multiorganversagen; lokaler/systemischer Infektion; Verbesserung/Verschlechterung eines pathophysiologischen Zustandes, insbesondere Sepsis; Responder/non-Responder für eine bestimmte Therapie; Fokus einer Infektion; Ursachen eines pathophysiologischen Zustandes, insbesondere Klassifizierung nach gram-positiv und/oder gram-negativ.
13. Verwendung nach einem der Ansprüche 4 bis 12, dadurch gekennzeichnet, dass die Probennukleinsäure RNA, insbesondere Gesamt-RNA oder mRNA, oder DNA, insbesondere cDNA, ist.
14. Kit zur Durchführung des Verfahrens nach einem der Ansprüche 1 bis 3, enthaltend mindestens einen Multigenbiomarker, welcher eine Mehrzahl von Polynukleotidsequenzen umfasst, die aus dem Pool von SEQ-ID NO: 1 bis SEQ-ID NO: 669 und/oder deren Genloci und/oder deren Transkripten und/oder Fragmenten davon ausgewählt sind, und/oder Primer und/oder Sonden und/oder Antisensenukleotide hierfür, wobei der Multigenbiomarker spezifisch für einen pathophysiologischen Zustand eines Patienten ist und solche Zustände einschließt, die ausgewählt sind aus der Gruppe bestehend aus: SIRS, Sepsis und deren Schweregraden; sepsisähnlichen Zuständen; septischem Schock; infektiösem/nicht-infektiösem Multiorganversagen; Überlebenswahrscheinlichkeit bei Sepsis; lokaler/systemischer Infektion; Responder/non-Responder für eine bestimmte Therapie; Fokus einer Infektion; Ursachen eines pathophysiologischen Zustandes, insbesondere Klassifizierung einer Infektion nach gram-positiven oder gram-negativen Erregern.
15. Kit nach Anspruch 14, dadurch gekennzeichnet, dass die
Polynukleotidsequenzen auch Genloci, sense und/oder antisense Stränge von prä-mRNA und/oder mRNA, small RNA, insbesondere scRNA, snoRNA, micro RNA, siRNA, dsRNA , ncRNA oder transposable Elemente umfassen.
PCT/EP2009/053042 2008-03-17 2009-03-16 Verfahren zur in vitro erfassung und unterscheidung von pathophysiologischen zuständen WO2009115478A2 (de)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2011500171A JP2011517401A (ja) 2008-03-17 2009-03-16 病態生理学的症状の体外検出及び識別方法
CA2718741A CA2718741A1 (en) 2008-03-17 2009-03-16 Method for the in vitro detection and differentiation of pathophysiological conditions
GB201017326A GB2470707C (en) 2008-03-17 2009-03-16 Method for the in vitro detection and differentiation of pathophysiological conditions
US12/933,169 US8765371B2 (en) 2008-03-17 2009-03-16 Method for the in vitro detection and differentiation of pathophysiological conditions

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102008000715.3 2008-03-17
DE102008000715A DE102008000715B9 (de) 2008-03-17 2008-03-17 Verfahren zur in vitro Erfasssung und Unterscheidung von pathophysiologischen Zuständen

Publications (2)

Publication Number Publication Date
WO2009115478A2 true WO2009115478A2 (de) 2009-09-24
WO2009115478A3 WO2009115478A3 (de) 2009-11-12

Family

ID=40679552

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2009/053042 WO2009115478A2 (de) 2008-03-17 2009-03-16 Verfahren zur in vitro erfassung und unterscheidung von pathophysiologischen zuständen

Country Status (6)

Country Link
US (1) US8765371B2 (de)
JP (1) JP2011517401A (de)
CA (1) CA2718741A1 (de)
DE (1) DE102008000715B9 (de)
GB (1) GB2470707C (de)
WO (1) WO2009115478A2 (de)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011035904A1 (en) * 2009-09-24 2011-03-31 Ludwig-Maximilians-Universität München A combination of markers for predicting the mortality risk in a polytraumatized patient
WO2011036091A1 (de) * 2009-09-23 2011-03-31 Sirs-Lab Gmbh Verfahren zur in vitro erfassung und unterscheidung von pathophysiologischen zuständen
EP2309001A1 (de) * 2009-09-23 2011-04-13 SIRS-Lab GmbH Verfahren zur in vitro Erfassung und Unterscheidung von pathophysiologischen Zuständen
WO2011058765A1 (ja) * 2009-11-13 2011-05-19 国立大学法人九州大学 トコトリエノールの抗がん作用標的遺伝子ならびにバイオマーカー及びその使用方法
WO2012170947A2 (en) * 2011-06-10 2012-12-13 Isis Pharmaceuticals, Inc. Methods for modulating factor 12 expression
EP2643483A1 (de) * 2010-11-26 2013-10-02 Immunexpress Pty Ltd Diagnose- und/oder screening-mittel und verwendungen dafür
JP2014508525A (ja) * 2011-03-08 2014-04-10 アナリティック イエナ アーゲー ヒトゲノムに対応するポリヌクレオチドの初期セットから患者の宿主応答の重症度をインビトロ決定するためのポリヌクレオチドのサブセットを同定するための方法
US9150864B2 (en) 2010-11-08 2015-10-06 Isis Pharmaceuticals, Inc. Methods for modulating factor 12 expression
FR3044325A1 (fr) * 2015-12-01 2017-06-02 Biomerieux Sa Procede d'evaluation du risque de complications chez les patients qui presentent un syndrome de reponse inflammatoire systemique (sirs)
US20210068735A1 (en) * 2016-02-17 2021-03-11 Nuralogix Corporation System and method for detecting physiological state

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110076685A1 (en) * 2009-09-23 2011-03-31 Sirs-Lab Gmbh Method for in vitro detection and differentiation of pathophysiological conditions
FR2988479B1 (fr) * 2012-03-23 2014-12-19 Hospices Civils Lyon Procede de determination de la susceptibilite aux infections nosocomiales
US10190169B2 (en) 2013-06-20 2019-01-29 Immunexpress Pty Ltd Biomarker identification
AU2014299322B2 (en) * 2013-06-28 2018-08-09 Acumen Research Laboratories Pte. Ltd. Sepsis biomarkers and uses thereof
US10260111B1 (en) 2014-01-20 2019-04-16 Brett Eric Etchebarne Method of detecting sepsis-related microorganisms and detecting antibiotic-resistant sepsis-related microorganisms in a fluid sample
US11047010B2 (en) 2014-02-06 2021-06-29 Immunexpress Pty Ltd Biomarker signature method, and apparatus and kits thereof
GB201402293D0 (en) 2014-02-11 2014-03-26 Secr Defence Biomarker signatures for the prediction of onset of sepsis
EP3211989A4 (de) 2014-10-27 2018-09-26 Pioneer Hi-Bred International, Inc. Verbesserte molekulare zuchtverfahren
US11980147B2 (en) 2014-12-18 2024-05-14 Pioneer Hi-Bred International Inc. Molecular breeding methods
FR3101423A1 (fr) * 2019-10-01 2021-04-02 bioMérieux Procédé pour déterminer la capacité d’un individu à répondre à un stimulus
EP4038202A1 (de) * 2019-10-01 2022-08-10 Biomérieux Verfahren zum bestimmen der ansprechbarkeit eines individuums auf einen stimulus
CN111413497A (zh) * 2020-04-15 2020-07-14 上海市东方医院(同济大学附属东方医院) 组蛋白甲基转移酶ezh2在制备用于诊断脓毒症的生物标记物中的用途

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004087949A2 (de) * 2003-04-02 2004-10-14 Sirs-Lab Gmbh Verfahren zur erkennung akuter generalisierter entzündlicher zustände (sirs), sepsis, sepsisähnlichen zuständen und systemischen infektionen
DE10315031A1 (de) * 2003-04-02 2004-10-14 Sirs-Lab Gmbh Verfahren zur Erkennung von Sepsis und/oder sepsisähnlichen Zuständen
DE10336511A1 (de) * 2003-08-08 2005-02-24 Sirs-Lab Gmbh Verfahren zur Erkennung von schwerer Sepsis
DE10340395A1 (de) * 2003-09-02 2005-03-17 Sirs-Lab Gmbh Verfahren zur Erkennung akuter generalisierter entzündlicher Zustände (SIRS)
WO2005106020A1 (de) * 2004-03-30 2005-11-10 Sirs-Lab Gmbh Verfahren zur vorhersage des individuellen krankheitsverlaufs bei sepsis
WO2006042581A1 (de) * 2004-10-13 2006-04-27 Sirs-Lab Gmbh Verfahren zur unterscheidung zwischen nichtinfektiösen und infektiösen ursachen eines multiorganversagens
WO2006100203A2 (de) * 2005-03-21 2006-09-28 Sirs-Lab Gmbh Verwendung von genaktivitäts-klassifikatoren für die in vitro klassifizierung von genexpressionsprofilen von patienten mit infektiösem/nichtinfektiösem multiorganversagen
WO2008107114A2 (de) * 2007-03-02 2008-09-12 Sirs-Lab Gmbh Kontrollgene zur normalisierung von genexpressionsanalysedaten
WO2009018962A1 (de) * 2007-08-03 2009-02-12 Sirs-Lab Gmbh Verwendung von polynukleotiden zur erfassung von genaktivitäten für die unterscheidung zwischen lokaler und systemischer infektion

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6960439B2 (en) 1999-06-28 2005-11-01 Source Precision Medicine, Inc. Identification, monitoring and treatment of disease and characterization of biological condition using gene expression profiles
US7465555B2 (en) 2002-04-02 2008-12-16 Becton, Dickinson And Company Early detection of sepsis
DE102004009952B4 (de) 2004-03-01 2011-06-01 Sirs-Lab Gmbh Verfahren zur Erkennung von Sepsis
EP1774044A4 (de) 2004-06-03 2009-06-10 Univ Johns Hopkins Verfahren zur überprüfung von zellproliferation oder neoplastischer störungen
EP1869463A4 (de) 2005-04-15 2010-05-05 Becton Dickinson Co Sepsisdiagnose
DE102006019480A1 (de) 2006-04-26 2007-10-31 Sirs-Lab Gmbh Verfahren zur in-vitro Überwachung postoperativer Veränderungen nach Lebertransplantation
DE102006027842B4 (de) 2006-06-16 2014-07-31 Analytik Jena Ag Verfahren zur Feststellung der Infektionsquelle bei Fieber unklarer Genese
WO2008095050A1 (en) 2007-01-30 2008-08-07 Pharmacyclics, Inc. Methods for determining cancer resistance to histone deacetylase inhibitors

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004087949A2 (de) * 2003-04-02 2004-10-14 Sirs-Lab Gmbh Verfahren zur erkennung akuter generalisierter entzündlicher zustände (sirs), sepsis, sepsisähnlichen zuständen und systemischen infektionen
DE10315031A1 (de) * 2003-04-02 2004-10-14 Sirs-Lab Gmbh Verfahren zur Erkennung von Sepsis und/oder sepsisähnlichen Zuständen
DE10336511A1 (de) * 2003-08-08 2005-02-24 Sirs-Lab Gmbh Verfahren zur Erkennung von schwerer Sepsis
DE10340395A1 (de) * 2003-09-02 2005-03-17 Sirs-Lab Gmbh Verfahren zur Erkennung akuter generalisierter entzündlicher Zustände (SIRS)
WO2005106020A1 (de) * 2004-03-30 2005-11-10 Sirs-Lab Gmbh Verfahren zur vorhersage des individuellen krankheitsverlaufs bei sepsis
WO2006042581A1 (de) * 2004-10-13 2006-04-27 Sirs-Lab Gmbh Verfahren zur unterscheidung zwischen nichtinfektiösen und infektiösen ursachen eines multiorganversagens
WO2006100203A2 (de) * 2005-03-21 2006-09-28 Sirs-Lab Gmbh Verwendung von genaktivitäts-klassifikatoren für die in vitro klassifizierung von genexpressionsprofilen von patienten mit infektiösem/nichtinfektiösem multiorganversagen
WO2008107114A2 (de) * 2007-03-02 2008-09-12 Sirs-Lab Gmbh Kontrollgene zur normalisierung von genexpressionsanalysedaten
WO2009018962A1 (de) * 2007-08-03 2009-02-12 Sirs-Lab Gmbh Verwendung von polynukleotiden zur erfassung von genaktivitäten für die unterscheidung zwischen lokaler und systemischer infektion

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
DEIGNER H P: "Vortrag im Rahmen der Konferenz 6th World Congress on Trauma, Shock, Inflammation and Sepsis ? Pathophysiology, Immune Consequences and Therapy, 4. März 2004, München" INTERNET CITATION, [Online] XP002327554 Gefunden im Internet: URL:http://www.sirs-lab.de/content/de/pdf/kompetenzen/deigner.pdf> [gefunden am 2005-05-09] *
LANDRÉ, J.: "Towards transcription-based sepsis diagnosis - recent progress." LECTURE AT THE EDUCATIONAL WORKSHOP OF DYNEX LABORATORIES, OCTOBER 24, 2006, PRAGUE, CZECH REPUBLIC., [Online] 2006, XP002535917 PRAGUE, CZECH REPUBLIC. Gefunden im Internet: URL:http://separraytor.com/files/0610_landre_lec_towards.pdf> [gefunden am 2009-07-07] *

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011036091A1 (de) * 2009-09-23 2011-03-31 Sirs-Lab Gmbh Verfahren zur in vitro erfassung und unterscheidung von pathophysiologischen zuständen
EP2309001A1 (de) * 2009-09-23 2011-04-13 SIRS-Lab GmbH Verfahren zur in vitro Erfassung und Unterscheidung von pathophysiologischen Zuständen
EP2985352A1 (de) * 2009-09-23 2016-02-17 Analytik Jena AG Verfahren zur in vitro erfassung und unterscheidung von pathophysiologischen zuständen
WO2011035904A1 (en) * 2009-09-24 2011-03-31 Ludwig-Maximilians-Universität München A combination of markers for predicting the mortality risk in a polytraumatized patient
WO2011058765A1 (ja) * 2009-11-13 2011-05-19 国立大学法人九州大学 トコトリエノールの抗がん作用標的遺伝子ならびにバイオマーカー及びその使用方法
US9150864B2 (en) 2010-11-08 2015-10-06 Isis Pharmaceuticals, Inc. Methods for modulating factor 12 expression
EP2643483A1 (de) * 2010-11-26 2013-10-02 Immunexpress Pty Ltd Diagnose- und/oder screening-mittel und verwendungen dafür
CN103649329A (zh) * 2010-11-26 2014-03-19 ImmuneXpress有限公司 诊断和/或筛选剂及其用途
EP2643483A4 (de) * 2010-11-26 2014-04-30 Immunexpress Pty Ltd Diagnose- und/oder screening-mittel und verwendungen dafür
JP2014508525A (ja) * 2011-03-08 2014-04-10 アナリティック イエナ アーゲー ヒトゲノムに対応するポリヌクレオチドの初期セットから患者の宿主応答の重症度をインビトロ決定するためのポリヌクレオチドのサブセットを同定するための方法
US20140128277A1 (en) * 2011-03-08 2014-05-08 Analytik Jena Ag Method for Identifying a Subset of Polynucleotides from an Initial Set of Polynucleotides Corresponding to the Human Genome for the In Vitro Determination of the Severity of the Host Response of a Patient
WO2012170947A2 (en) * 2011-06-10 2012-12-13 Isis Pharmaceuticals, Inc. Methods for modulating factor 12 expression
US9187749B2 (en) 2011-06-10 2015-11-17 Isis Pharmaceuticals, Inc. Methods for modulating factor 12 expression
WO2012170947A3 (en) * 2011-06-10 2013-02-21 Isis Pharmaceuticals, Inc. Methods for modulating factor 12 expression
FR3044325A1 (fr) * 2015-12-01 2017-06-02 Biomerieux Sa Procede d'evaluation du risque de complications chez les patients qui presentent un syndrome de reponse inflammatoire systemique (sirs)
US11339438B2 (en) 2015-12-01 2022-05-24 Biomerieux Method for assessing the risk of complications in patients with systemic inflammatory response syndrome (sirs)
AU2016361646B2 (en) * 2015-12-01 2023-01-19 Hospices Civils De Lyon Method for assessing the risk of complications in patients with systemic inflammatory response syndrome (SIRS)
US20210068735A1 (en) * 2016-02-17 2021-03-11 Nuralogix Corporation System and method for detecting physiological state
US11497423B2 (en) * 2016-02-17 2022-11-15 Nuralogix Corporation System and method for detecting physiological state

Also Published As

Publication number Publication date
WO2009115478A3 (de) 2009-11-12
US8765371B2 (en) 2014-07-01
DE102008000715B9 (de) 2013-01-17
DE102008000715A1 (de) 2009-09-24
GB201017326D0 (en) 2010-11-24
GB2470707B (en) 2013-03-06
JP2011517401A (ja) 2011-06-09
GB2470707A (en) 2010-12-01
CA2718741A1 (en) 2009-09-24
DE102008000715B4 (de) 2012-02-02
US20110098195A1 (en) 2011-04-28
GB2470707C (en) 2013-03-27

Similar Documents

Publication Publication Date Title
DE102008000715B9 (de) Verfahren zur in vitro Erfasssung und Unterscheidung von pathophysiologischen Zuständen
US20110076685A1 (en) Method for in vitro detection and differentiation of pathophysiological conditions
DE102011005235B4 (de) Verfahren zum Identifizieren einer Teilmenge von Polynucleotiden aus einer dem Humangenom entsprechenden Ausgangsmenge von Polynucleotiden zur in vitro Bestimmung eines Schweregrads der Wirtsantwort eines Patienten
KR102082016B1 (ko) 알츠하이머병을 나타내는 마이크로rna 바이오마커들
EP3103046B1 (de) Biomarkersignaturverfahren sowie vorrichtung und kits dafür
CN107532214B (zh) 用于败血症诊断的方法
EP1863928B1 (de) Verwendung von genaktivitäts-klassifikatoren für die in vitro klassifizierung von genexpressionsprofilen von patienten mit infektiösem/nichtinfektiösem multiorganversagen
EP2218795B1 (de) Verfahren zur Unterscheidung zwischen nichtinfektiösen und infektiösen Ursachen eines Multiorganversagens
CN116218988A (zh) 用于诊断结核病的方法
WO2011036091A1 (de) Verfahren zur in vitro erfassung und unterscheidung von pathophysiologischen zuständen
JP2019530878A (ja) 重篤患者における死亡率の予後診断に使用するためのバイオマーカー
US10584383B2 (en) Mitochondrial non-coding RNAs for predicting disease progression in heart failure and myocardial infarction patients
KR102096498B1 (ko) 대장암 진단 또는 재발 예측을 위한 마이크로RNA-4732-5p 및 이의 용도
EP2092087B1 (de) Prognostische marker für die klassifizierung von kolorektalen karzinomen basierend auf expressionsprofilen von biologischen proben
CN114566224B (zh) 一种用于鉴别或区分不同海拔人群的模型及其应用
WO2015117205A1 (en) Biomarker signature method, and apparatus and kits therefor
EP2985352A1 (de) Verfahren zur in vitro erfassung und unterscheidung von pathophysiologischen zuständen
CN114839369B (zh) 急性高原反应微生物标志物及其应用
EP2092086B1 (de) Prognostische marker für dievorhersage des fünfjährigen progressionsfreien überlebens von patienten mit kolorektalen karzinomen basierend auf expressionsprofilen von biologischen proben
KR20240054437A (ko) 패혈증 진단 또는 예후 예측용 신규 바이오마커 및 이의 용도
CN116875685A (zh) 一种肝硬化合并门静脉系统血栓形成的诊断模型及其应用

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 09722590

Country of ref document: EP

Kind code of ref document: A2

DPE1 Request for preliminary examination filed after expiration of 19th month from priority date (pct application filed from 20040101)
WWE Wipo information: entry into national phase

Ref document number: 2011500171

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 2718741

Country of ref document: CA

ENP Entry into the national phase

Ref document number: 1017326

Country of ref document: GB

Kind code of ref document: A

Free format text: PCT FILING DATE = 20090316

WWE Wipo information: entry into national phase

Ref document number: 1017326.8

Country of ref document: GB

WWE Wipo information: entry into national phase

Ref document number: 12933169

Country of ref document: US

122 Ep: pct application non-entry in european phase

Ref document number: 09722590

Country of ref document: EP

Kind code of ref document: A2