DE10159262A1 - Identifizieren pharmazeutischer Targets - Google Patents

Identifizieren pharmazeutischer Targets

Info

Publication number
DE10159262A1
DE10159262A1 DE10159262A DE10159262A DE10159262A1 DE 10159262 A1 DE10159262 A1 DE 10159262A1 DE 10159262 A DE10159262 A DE 10159262A DE 10159262 A DE10159262 A DE 10159262A DE 10159262 A1 DE10159262 A1 DE 10159262A1
Authority
DE
Germany
Prior art keywords
cell
determined
genes
expression
gene expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE10159262A
Other languages
English (en)
Other versions
DE10159262B4 (de
Inventor
Bernd Schuermann
Martin Stetter
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens Healthcare GmbH
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Priority to DE10159262A priority Critical patent/DE10159262B4/de
Priority to US10/307,997 priority patent/US20030104463A1/en
Publication of DE10159262A1 publication Critical patent/DE10159262A1/de
Application granted granted Critical
Publication of DE10159262B4 publication Critical patent/DE10159262B4/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • G16B5/20Probabilistic models
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression

Abstract

Zum Identifizieren pharmazeutischer Targets wird mindestens eine Korrelation zwischen den Expressionsraten verschiedener Gene einer Zelle durch Auswertung einer Mehrzahl von Gen-Expressionsmustern ermittelt. Dabei werden Korrelationen zweiter oder höherer Ordnung betrachtet. Die Korrelationen lassen auf kausale Beziehungen zwischen verschiedenen Genen und den zugehörigen Proteinen schließen. Daher kann aus den Korrelationen das regulatorische Netzwerk der untersuchten Zelle erschlossen werden. Aus dem solcherart erschlossenen regulatorischen Netzwerk können geeignete Targets identifiziert werden.

Description

  • Die menschliche Erbsubstanz (Genom) umfasst schätzungsweise 20 000 bis 80 000 Gene, die den genetischen Code für etwa eine Million Eiweißstoffe (Proteine) beinhalten. In den spezialisierten Körperzellen werden jeweils nur Untermengen aller Gene tatsächlich abgelesen (exprimiert). Die Gesamtheit der dadurch erzeugten Proteine wird als Proteom dieser Zelle bezeichnet. Das Wechselspiel der Proteine untereinander sowie mit der DNA stellt den wichtigsten Teil der Maschinerie dar, die der Entwicklung des menschlichen Körpers aus der befruchteten Eizelle sowie allen Körperfunktionen zugrunde liegt. Aus der Sicht der Informatik stellt die Erbsubstanz damit einen prozeduralen Code für die Struktur und Funktion des menschlichen Körpers dar.
  • Viele Krankheiten und Fehlfunktionen des Körpers gehen auf Störungen des funktionellen Netzwerks aus Genom und Proteom zurück. So wirken einige Medikamente als Agonisten bzw. Antagonisten spezifischer Zielproteine, d. h. sie verstärken oder schwächen die Funktion eines Proteins mit dem Ziel, das aus Proteom und Genom gebildete regulatorische Netzwerk zurück in einen normalen Funktionsmodus zu bringen. Diese Zielproteine (Targets) werden bislang nach heuristischen Prinzipien aus biochemischen Überlegungen abgeleitet. Oft ist dabei unklar, ob die Fehlfunktion eines Proteins tatsächlich die Krankheitsursache oder nur eines der Symptome einer versteckten Fehlregulation an anderer Stelle des Netzwerks darstellt.
  • Für die Entwicklung verbesserter Therapien ist daher ein quantitatives Verständnis des Wechselspiels zwischen Genom und Proteom erforderlich.
  • Aufgabe der Erfindung ist es, das Identifizieren von Proteinen, die sich als Target medikamentöser Behandlung genetisch bedingter Krankheiten oder Störungen eignen, zu verbessern.
  • Diese Aufgabe wird durch die Erfindungen gemäß den unabhängigen Ansprüchen gelöst. Vorteilhafte Weiterbildungen der Erfindungen sind in den Unteransprüchen gekennzeichnet.
  • Zum Identifizieren pharmazeutischer Targets wird mindestens eine Abhängigkeit oder statistische Korrelation zwischen den Expressionsraten verschiedener Gene einer Zelle durch Auswertung einer Mehrzahl von Gen-Expressionsmustern ermittelt. Dabei werden u. a. Korrelationen zweiter oder höherer Ordnung betrachtet. Die Abhängigkeiten lassen auf kausale Beziehungen zwischen verschiedenen Genen und den zugehörigen Proteinen schließen. Daher kann aus den Abhängigkeiten das regulatorische Netzwerk der untersuchten Zelle erschlossen werden.
  • So lassen sich Gene identifizieren, die am wahrscheinlichsten regulatorische Kaskaden initiieren, oder die für komplexe Änderungen in den Expressionsmustern, beispielsweise bei Vorliegen einer genetisch bedingten Erkrankung, verantwortlich sind.
  • Das erfindungsgemäße Verfahren erlaubt dadurch die Identifizierung von Targets auf systematischer Basis. Dies geschieht durch statistische Modellierung des regulatorischen genetischen Netzwerks mit einem strukturlernenden kausalen Netz auf der Basis von Gen-Expressionsmustern.
  • Das beschriebene Verfahren ist nicht auf zeitliche Informationen angewiesen und damit auf eine breite Basis von Gen- Expressionsmessungen anwendbar.
  • Das beschriebene Verfahren wird üblicherweise mit Hilfe eines Computers durchgeführt.
  • Die Erfindung ist besonders geeignet, High Throughput Drug Discovery Verfahren in der Biotechnologie zu ergänzen. Eine weitere Anwendung der Erfindung findet sich im Bereich der Unterstützung von Tumordiagnostik und Tumorbehandlung. Untersucht werden können sowohl regulatorische Zusammenhänge im menschlichen Körper als auch in jedem anderen Lebewesen, sei es Tier oder Pflanze, Bakterium oder eine sonstige Zelle.
  • Die einzelnen Messungen der Gen-Expressionsmuster werden dabei als unabhängig voneinander angesehen. Sie stellen Zufallswerte dar, die von einer unbekannten hochdimensionalen Wahrscheinlichkeitsverteilung erzeugt wurden. Die vollständige Charakterisierung der statistischen Struktur bzw. der Korrelationen der Gen-Expressionsraten anhand der gemessenen Expressionsmuster ist gleichbedeutend mit der Schätzung der zusammengesetzten, hochdimensionalen Wahrscheinlichkeitsverteilung für diese Muster. Beinhaltet eine Messung die Bestimmung der Expression von 5000 Genen, so ist eine 5000- dimensionale Wahrscheinlichkeitsdichte zu schätzen, was in voller Allgemeinheit große Schwierigkeiten bereitet.
  • Kausale Netze nehmen an, dass in den Daten bedingte Unabhängigkeiten existieren. Eine bedingte Unabhängigkeit liegt dann vor, wenn zwei Zufallsvariablen unter der Bedingung voneinander unabhängig sind, dass alle anderen Zufallsvariablen konstant gehalten werden, dass also Korrelationen höherer Ordnung über eine mehrstufige Rückkopplungsschleife zwischen den beiden Zufallsvariablen vernachlässigt werden. Die volle Wahrscheinlichkeitsdichte kann dann durch ein Produkt von niedriger dimensionierten Wahrscheinlichkeitsdichten ersetzt werden.
  • Eine besonders effiziente Möglichkeit, die Korrelationen bzw. Abhängigkeiten zwischen den einzelnen Zufallsvariablen, also den Expressionsraten, der hochdimensionalen Wahrscheinlichkeitsverteilung zu erschließen, besteht darin, dass zunächst eine Menge von unabhängigen Zufallsvariablen angenommen wird.
  • Sukzessiv wird jeweils diejenige Korrelation dem Netzwerk hinzugefügt, die den Fehler des Netzes für die Erklärung neuer Daten (Generalisierungsfehler) am meisten herabsetzt. Das heißt, es werden diejenigen Korrelationen angenommen, bei denen die tatsächlich gemessenen Gen-Expressionsmuster die höchste Wahrscheinlichkeit unter allen denkbaren Wahrscheinlichkeitsverteilungen aufweisen. Dies wird fortgesetzt, bis sich der Generalisierungsfehler nur noch innerhalb einer vorgegebenen Schwelle verringern lässt.
  • Die bevorzugte, einfachste Ausführungsform der Suchstrategien für die Korrelationen erfolgt mit Hilfe der folgenden Schritte:
    • - zunächst wird diejenige alleinige Kante gesucht, die den Generalisierungsfehler minimiert, sozusagen die beste erste Kante.
    • - anschließend wird die beste zweite Kante gesucht.
    • - usw., bis sich der Generalisierungsfehler nicht mehr sinnvoll verbessern lässt.
  • Auf diese Weise können sowohl die Korrelationen zwischen den Zufallsvariablen (Expressionsraten) erschlossen werden als auch die Form der hochdimensionalen Wahrscheinlichkeitsverteilung, letztere zumindest qualitativ. Das Erschließen der Korrelationen zwischen den Zufallsvariablen mit der Möglichkeit, diese Korrelationen mit Hilfe von mindestens teilweise gerichteten Graphen darzustellen, wird als Strukturlernen bezeichnet, da hierbei die Struktur des regulatorischen Netzwerks gelernt wird.
  • Beim sukzessiven Ergänzen von Korrelationen kann auf vorhandenes Wissen über regulatorische Zusammenhänge zurückgegriffen werden. Auf diese Weise kann das Erschließen der regulatorischen Zusammenhänge weiter beschleunigt und präzisiert werden.
  • Dieser insbesondere für hochdimensionale Daten sehr zeitaufwändige Algorithmus lässt sich durch schnelle, fast-optimale Suchstrategien für wichtige Abhängigkeiten entscheidend beschleunigen. Ein bekannter Algorithmus hierfür ist der Greedy-Algorithmus (T. H. Cormen, C. E. Leiserson, R. L. Rivest, C. Stein: "Introduction to Algorithms", 2nd edition McGraw- Hill Columbus, OH (2001)).
  • Durch eine künstliche Veränderung einzelner Gen- Expressionsraten kann mit Hilfe der aus den bisher vorliegenden Daten berechneten Struktur des regulatorischen Netzwerks, bzw. der hochdimensionalen Wahrscheinlichkeitsverteilung, das am wahrscheinlichsten resultierende Gen-Expressionsmuster vorhergesagt werden. Dieses kann mit Messungen an erkranktem Gewebe (beispielsweise Tumorgewebe) verglichen werden. Dadurch ist es möglich, die einer krankhaft veränderten zellulären Funktion ursächlich zu Grunde liegende Gen-Gruppe bzw. gegebenenfalls das zu Grunde liegende einzelne Gen zu erkennen und das zugehörige Protein als Target einer medikamentösen Behandlung zu identifizieren.
  • Im Folgenden wird die Erfindung anhand von Ausführungsbeispielen näher erläutert, die in den Figuren schematisch dargestellt sind. Gleiche Bezugsziffern in den einzelnen Figuren bezeichnen dabei gleiche Elemente. Im Einzelnen zeigt:
  • Fig. 1 schematisch die regulatorischen Vorgänge, die das Expressionsmuster einer Zelle bestimmen;
  • Fig. 2 einen gerichteten azyklischen Graphen; und
  • Fig. 3 illustriert Möglichkeiten, die Richtung von Kanten in einem gerichteten azyklischen Graphen zu bestimmen.
  • Fig. 1 zeigt die wichtigsten Wechselwirkungen zwischen Genen und Proteinen eines DNA-Abschnitts auf. Die Wechselwirkungen werden als Basis für die Beschreibung des genomischen regulatorischen Netzwerks herangezogen.
  • Im oberen Teil der Fig. 1 ist schematisch angedeutet, wie ein von außen auf die Zelle einwirkendes externes Signal - etwa im Rahmen der interzellulären Kommunikation -, das beispielsweise von einem Transmembran-Rezeptorprotein (z. B. von einem Kalziumkanal) aufgenommen und in geeigneter Weise in das Innere der Zelle übertragen wird, die Produktion der Gene A, B, C und D des DNA-Abschnitts auslöst.
  • Es besteht daher prinzipiell auch die Möglichkeit, die Expressionsrate einzelner Gene einer Zelle über die erwähnten Wege von außerhalb der Zellen zu beeinflussen.
  • Als ein Gen wird ein nicht notwendigerweise zusammenhängender Abschnitt der DNA bezeichnet, der den genetischen Code für ein Protein oder auch für eine Gruppe von Proteinen enthält.
  • Der Produktionsvorgang eines Proteins aus einem Gen, zum Beispiel Protein A ausgehend von Gen A in Fig. 1, wird als Expression dieses Gens bezeichnet. Die Übersetzung des DNA- Codes des Gens in die Kette der Aminosäuren des Proteins wird als Translation bezeichnet. Die Rate, mit der Protein A in einem gegebenen Kontext produziert wird, wird seine Expressionsrate genannt.
  • Nicht alle Gene werden in einer Zelle exprimiert. Vielmehr unterscheiden sich verschiedene Zelltypen durch ihr Gen- Expressionsmuster. Dies gilt oftmals auch für den Unterschied zwischen kranken und gesunden Zellen.
  • Das Expressionsmuster einer Zelle wird durch die in Fig. 1 schematisch dargestellten regulatorischen Vorgänge bestimmt. Die regulatorischen Vorgänge werden im Wesentlichen von einigen wichtigen Wechselwirkungen zwischen Proteinen und Genen sowie zwischen den Proteinen untereinander bestimmt.
  • So kann die Expressionsrate eines Gens A durch das Vorhandensein eines anderen Proteins B reguliert, d. h. erhöht, erniedrigt oder zum Erliegen gebracht werden. In diesem Beispiel wirkt das Protein B regulatorisch auf das Gen A bzw. das Protein A. Zu regulatorischen Proteinen können beispielsweise die Proteinbausteine von Aktivatorkomplexen gerechnet werden. Regulatorische Proteine können sich gleichzeitig auf viele Zielgene auswirken.
  • Eine zweite Art der Wechselwirkung besteht in der posttranslationalen Modifikation von Proteinen, d. h. der Modifikation von Proteinen nach der Translation. In der Regel erfolgt die posttranslationale Modifikation eines Proteins im unmittelbaren Anschluss an die Translation, d. h. bevor das Protein in der Zelle wirkt. So werden zum Beispiel viele Proteine von speziellen Enzymen phosphoryliert oder glykolysiert, d. h. das Zielprotein wird durch Anhängen bzw. Abspalten chemischer Gruppen in seinen funktionellen Zustand gebracht oder in einen Zustand versetzt, in dem es nicht mehr wirksam ist. Posttranslationale Modifikation kann also ein Protein gegebenenfalls temporär funktionell einschalten oder ausschalten.
  • In Fig. 1 ist das Protein A ein so genanntes Effektorprotein, d. h. es wirkt innerhalb der Zelle auf andere Substanzen und nicht unmittelbar auf das Genom oder Proteom. In Fig. 1 modifiziert somit das Protein C im Wege der posttranslationalen Modifikation die Funktion des Effektorproteins A.
  • Protein B ist ein regulatorisches Protein, da es die Expressionsrate des Proteins A bestimmt, indem es mit demjenigen DNA-Abschnitt wechselwirkt, der das Gen A enthält. Das Protein D modifiziert somit die Funktion eines regulatorischen Proteins (Protein B) im Wege der posttranslationalen Modifikation.
  • Die Nukleinsäuresequenz der menschlichen DNA ist weitestgehend bekannt. Auch die durch die DNA kodierten Gene sind in zunehmendem Maße identifiziert. Nicht ganz so vollständig ist das Wissen über das Proteom, einschließlich der eventuell durch Wechselwirkung zwischen den Proteinen posttranslational modifizierten Proteine. Allerdings erlauben neuere Sequenzierungs- und Hochdurchsatz-Screeningverfahren eine rasche Identifizierung weiterer Gene und Proteine.
  • Ein weiterer wichtiger Schritt zur Aufklärung der Expressionsmuster einer Zelle hat sich mit der Entwicklung von Hochdurchsatz-Hybridisierungstechniken vollzogen. Bei diesen Verfahren wird auf einem so genannten Microarray die Expressionsrate vieler 100 verschiedener Gene gleichzeitig getestet. Mit Hilfe dieser Verfahren ist es möglich, das Gen- Expressionsmuster einer Zelle zu bestimmen.
  • Dazu werden in der Regel die in der Zelle synthetisierten mRNA (messenger RNA) bestimmt. Die mRNA ist ein Zwischenprodukt bei der Translation des Gens zum Protein. Die mRNA ist somit eine Vorstufe bei der Bildung des Proteins. Die zu untersuchende Zelle wird zunächst isoliert. Anschließend wird sie aufgeschlossen. Durch geeignete Aufreinigungsschritte wird die mRNA aus der Zelle isoliert. Danach wird die mRNA mittels der reversen Transkriptase in cDNA (complementary DNA) übersetzt. Diese wird mit i. d. R. linearer PCR (polymerase chain reaction) amplifiziert. Die so gewonnene cDNA wird mit Hilfe von geeigneten Microarrays, z. B. DNA-Chips, qualitativ bzw. quantitativ analysiert. Mit modernen Microarrays können die Expressionsraten von 5000 und mehr Genen gleichzeitig vermessen werden.
  • Aufgrund dieser verbesserten Techniken steht mittlerweile ein umfangreiches Wissen über das menschliche Genom und Proteom sowie über die Wechselwirkungen zwischen Proteinen und Genen bzw. Proteinen untereinander zur Verfügung.
  • Im Folgenden werden zunächst einige für die Aufklärung des regulatorischen Netzwerks benötigte mathematische Begriffe eingeführt.
  • Die aus den gemessenen Gen-Expressionsmustern bestimmten Expressionsraten der einzelnen Gene sind die im Folgenden zu betrachtenden Zufallsvariablen. Für Gen i wird die die Expressionsrate repräsentierende Zufallsvariable mit Xi bezeichnet. Werte, die sie annehmen kann, werden mit xi bezeichnet. Mit


    wird der Zufallsvektor bezeichnet, der aus den Expressionsraten aller k Gene besteht. ()T bezeichnet die Transposition.
  • Um die Korrelationen zwischen den Expressionsraten bzw. Zufallsvariablen zu ermitteln, werden verschiedene Momente der Zufallsvariablen betrachtet.
  • Das erste Moment des Zufallsvektors X, das auch als Erwartungswert E bezeichnet wird, ist definiert durch

    EX := (α1, . . ., αk)T := (EX1, . . ., EXk)T.
  • Aufgrund bekannter statistischer Überlegungen wird der Erwartungswert EXi der Expressionsraten Xi mit Hilfe des arithmetischen Mittels der beobachteten Expressionsraten xi über n Messungen von Gen-Expressionsmustern geschätzt:


    wobei xim die für das Gen i in der Messung m ermittelte Expressionsrate angibt und der hochgestellte Index (s) anzeigt, dass es sich um einen geschätzten Wert handelt.
  • Die zweiten Momente sind definiert durch

    αij := E(Xi.Xj).
  • Wiederum aufgrund bekannter statistischer Überlegungen wird der für das zweite Moment zu berechnende Erwartungswert E(Xi.Xj) mit Hilfe der folgenden Gleichung geschätzt:


  • Das zweite zentrale Moment wird auch als Kovarianz bezeichnet. Es ist definiert durch

    cov(Xi, Xj) := µij := E([Xi - EXi].[Xj - EXj]).
  • Es gilt aufgrund der Linearität des Erwartungswerts

    cov(Xi, Xj) = µij = E(Xi.Xj) - EXi.EXj = αij - αij.
  • Die Schätzung der Kovarianz erfolgt in bekannter Weise mittels


  • Die µii sind gerade die Varianzen der einzelnen Expressionsraten Xi:


  • Ihre Schätzung erfolgt in bekannter Weise über


  • Die k × k-Matrix

    cov(X, X) : = E([X - EX].[X - EX]T) = E(X.XT) - EX.EXT

    wird als Kovarianzmatrix von X bezeichnet.
  • Die Korrelation der Zufallsvariablen Xi und Xj wird häufig mit Hilfe des Korrelationskoeffizienten (zweiter Ordnung) bestimmt. Dieser ist definiert durch


  • Er liegt zwischen -1 und +1. Er lässt sich unter Verwendung der angegebenen Schätzungen der Kovarianz und der Varianz ebenfalls schätzen. Ein verschwindender Korrelationskoeffizient deutet auf die Abwesenheit regulatorischer Zusammenhänge hin. Ein signifikant von Null verschiedener Korrelationskoeffizient deutet auf eine statistische und damit regulatorische Abhängigkeiten hin.
  • Die obigen Definitionen lassen sich auf dritte, vierte und beliebig höhere Momente verallgemeinern. Insbesondere ist das dritte Moment definiert durch

    αijk := E(Xi.Xj.Xk).
  • Das dritte zentrale Moment ist definiert durch

    µijk := E([Xi - EXi].[Xj - EXj].[Xk - EXk]).
  • Es wird in bekannter Weise geschätzt durch


  • Die Korrelation der Zufallsvariablen Xi, Xj und Xk kann ebenfalls mit Hilfe des Korrelationskoeffizienten dritter Ordnung bestimmt werden. Dieser ist definiert durch


  • Er liegt ebenfalls zwischen -1 und +1 und kann in gleicher Weise wie der Korrelationskoeffizient zweiter Ordnung geschätzt werden.
  • In einem bevorzugten Ausführungsbeispiel der Erfindung wird das Vorliegen regulatorischer Abhängigkeiten dadurch ermittelt, dass die Korrelationskoeffizienten daraufhin getestet werden, ob sie signifikant von Null abweichen. Statistisch gesprochen wird die Hypothese getestet, ob der Korrelationskoeffizient verschwindet. Dies kann mit Hilfe verschiedener bekannter statistischer Testverfahren durchgeführt werden. Das bevorzugte Verfahren ist beispielsweise in Bronstein- Semendjajew: "Taschenbuch der Mathematik", Verlag Harm Deutsch, 22. Aufl., 1985, S. 693, beschrieben.
  • Die geschilderten Verfahren haben allgemein das Ziel, statistische Abhängigkeiten bzw. Unabhängigkeiten aufzuklären und dadurch das Netzwerk der Beeinflussungen aus den Daten zu extrahieren.
  • Reguliert das Protein B das Gen A und sind keine anderen regulatorischen Phänomene vorhanden, so äußert sich diese Eigenschaft in einer statistischen Korrelation oder Antikorrelation beider Expressionsraten über verschiedene Messungen hinweg (statistische Abhängigkeit bzw. Korrelation zweiter Ordnung).
  • Die Gegenwart eines Metaregulators wie Protein D in Fig. 1 drückt sich hingegen in einer statistischen Abhängigkeit dritter Ordnung aus, d. h. in einem nicht verschwindenden Korrelationskoeffizienten dritter Ordnung.
  • In einer Zelle existieren viele, teilweise noch unbekannte regulatorische Rückkopplungsschleifen, deren Existenz sich in komplexen statistischen Beziehungen zwischen Expressionsraten ausdrückt.
  • Korrelationen werden oft durch gerichtete Graphen zwischen Zufallsvariablen dargestellt (siehe z. B. David Edwards: "Introduction to Graphical Modelling", Springer Texts in Statistics, Springer Verlag, 1995). Derartige Modelle werden daher auch als graphische Modelle bezeichnet.
  • Die hochdimensionale Wahrscheinlichkeitsverteilung für die Zufallsvariable


    kann mit Hilfe eines Netzwerks oder Graphen G dargestellt werden, wie er in Fig. 2 für ein einfaches Beispiel gezeigt ist. Die Knoten 1, 2 und 3 entsprechen dabei Zufallsvariablen X1, X2 und X3. Im Rahmen der statistischen Modellierung regulatorischer Zusammenhänge im Genom werden die Zufallsvariablen mit den Expressionsraten identifiziert.
  • Im Graphen G gem. Fig. 2 werden Abhängigkeiten durch gerichtete Kanten dargestellt. Dabei wird die Abhängigkeit der Zufallsvariable X2 von der Zufallsvariable X1 durch eine gerichtete Kante 12 vom Knoten 1 zum Knoten 2 dargestellt. Die Abhängigkeit der Zufallsvariable X3 von der Zufallsvariable X2 wird durch eine gerichtete Kante 14 von Knoten 2 zum Knoten 3 dargestellt.
  • Wird eine Korrelation zweiter Ordnung festgestellt, so wird dies durch eine Kante zwischen zwei Knoten, d. h. zwischen zwei Zufallsvariablen, im Graphen angezeigt. Im Allgemeinen ist es nicht möglich, die Richtung dieser Kante zu ermitteln, d. h. welche der beiden Zufallsvariablen ursächlich für die andere ist. Beobachtet wird lediglich das gleichzeitige Auftreten. Damit kann im allgemeinen auch nicht ermittelt werden, welches von den beiden beteiligten Genen bzw. Proteinen das andere reguliert.
  • In bestimmten Fällen kann jedoch die Richtung einer Kante ermittelt werden. Fig. 3A zeigt einen solchen Fall. Gezeigt sind drei Knoten 1, 2 und 3. Zwischen diesen drei Knoten sind zwei Kanten eingezeichnet, und zwar die Kante 20 zwischen den Knoten 1 und 3 sowie die Kante 22 zwischen den Knoten 2 und 3. Beide Kanten sind in Richtung auf den Knoten 3 gerichtet. In der Graphentheorie wird ein solcher Fall allgemein als "collider" bezeichnet. Statistisch wird man in einer solchen Konstellation eine Korrelation zweiter Ordnung zwischen den Knoten 1 und 3, also den zugehörigen Zufallsvariablen, ermitteln, sowie eine weitere Korrelation zweiter Ordnung zwischen den Knoten 2 und 3. Man wird jedoch keine Korrelationen dritter Ordnung feststellen, da beispielsweise die Zufallsvariablen 1 und 3 sich gegenseitig beeinflussen, ohne jedoch einen Einfluss auf die Zufallsvariable 2 zu haben.
  • Übersetzt in die Sprache der regulatorischen Wechselwirkungen zwischen Genen bzw. Proteinen zeigt der Graph gem. Fig. 3A, dass das Gen 3 durch Gen bzw. Protein 1 und 2 reguliert wird, jedoch nicht umgekehrt. Wird beispielsweise Gen 1 exprimiert, so wird nach dem Modell gem. Fig. 3A auch Gen 3 exprimiert. Dies impliziert jedoch nicht, dass auch Gen 2 exprimiert wird. Werden zwei Korrelationen zweiter Ordnung gefunden, eine zwischen Knoten 1 und Knoten 3 und die andere zwischen Knoten 2 und Knoten 3, so können die Kanten nicht anders gerichtet sein, da sich sonst eine Korrelation dritter Ordnung zeigen würde (vergleiche Fig. 3B).
  • Anders verhält es sich im Falle von Fig. 3B. Fig. 3B zeigt Graphen, die im wesentlichen dem Graph gem. Fig. 3A entsprechen und auch in gleicher Weise zu lesen sind. Lediglich die Kanten und ihre Richtungen sind variiert. Alle in Fig. 3B gezeigten Graphen weisen ausschließlich eine Korrelation dritter Ordnung zwischen den Knoten 1, 2 und 3 auf und sind auf der Basis der Korrelationsanalyse nicht unterscheidbar.
  • Im Allgemeinen ist es sehr schwierig, auf der Basis von Gen- Expressionsmustern posttranslationale Modifikationen zu erschließen. Allerdings geben Korrelationen dritter Ordnung zumindest einen Hinweis auf solche posttranslationalen Modifikationen.
  • Im Folgenden wird das Erkennen des zu einem regulatorischen Netzwerk gehörenden Graphen näher erläutert.
  • Die gemeinsame Wahrscheinlichkeitsverteilung der Zufallsvariablen X1, X2 und X3 aus Fig. 2 kann stets durch ein Produkt bedingter Wahrscheinlichkeiten ausgedrückt werden:

    P(X1, X2, X3) = P(X3|X2, X1).P(X2|X1).P(X1).
  • Im Graphen G gem. Fig. 2 werden die bedingten Wahrscheinlichkeiten der rechten Seite durch gerichtete Kanten dargestellt. Dabei wird die bedingte Wahrscheinlichkeit P(X2|X1) durch eine gerichtete Kante 12 vom Knoten 1 zum Knoten 2 dargestellt. Die bedingte Wahrscheinlichkeit P(X3|X2, X1) wird durch eine gerichtete Kante 14 von Knoten 2 zum Knoten 3 dargestellt. Derartige Graphen G werden als gerichtete azyklische Graphen (DAG, directed acyclic graph) bezeichnet. Die Graphen G heißen azyklisch, da es in dem betrachteten mathematischen Modell niemals eine zyklische Graphenkonfiguration geben wird, bei der beispielsweise in Fig. 2 auch noch eine gerichtete Kante vom Knoten 3 zum Knoten 1 verläuft, die einen Kreis schließen würde.
  • Bei der bedingten Wahrscheinlichkeit P(X3|X2, X1) stellen die Zufallsvariablen X1 und X2 die so genannten Eltern (Pa, parents) der Zufallsvariablen X3 dar, d. h.

    Pa(X3) = {X1, X2}.
  • Allgemeinen kann daher eine hochdimensionale Wahrscheinlichkeitsverteilung der Variablen Xi geschrieben werden als


  • Dabei ist mit Pa(Xi) die Menge der Eltern der Variablen Xi bezeichnet.
  • Statistische Unabhängigkeiten können in einem solchen Graphen G durch betrachten der Eltern einer Zufallsvariablen bestimmt werden.
  • Die Struktur eines solchen Graphen G wird durch Vergleich mit gewonnenen Daten, im vorliegenden Fall den gemessenen Gen- Expressionsmustern, bestimmt. Das statistische Problem kann daher in der folgenden Weise formuliert werden: ausgehend von einem Datensatz


    von n Realisierungen der Zufallsvariablen (X1, . . ., Xk) wird derjenige Graph G gesucht, der den Datensatz D am besten wiedergibt.
  • Es gibt im wesentlichen zwei Wege, die Struktur eines Graphen G aus den Daten D zu erschließen: Die so genannte "constrained based method" (R. Hofmann: "Lernen der Struktur nichtlinearer Abhängigkeiten mit graphischen Modellen", dissertation.de Berlin, 2000) und die so genannte "score based method" (R. Hofmann: "Lernen der Struktur nichtlinearer Abhängigkeiten mit graphischen Modellen", dissertation.de Berlin, 2000), die zur Ausführung der Erfindung bevorzugt wird.
  • Die "constrained based method" versucht, statistische Abhängigkeiten bzw. Unabhängigkeiten aus den Daten zu erschließen, ähnlich wie es weiter oben im Zusammenhang mit der Schätzung von Korrelationskoeffizienten geschildert wurde.
  • Die "score based method" sucht den Raum der möglichen Graphen ab und bewertet die Übereinstimmung zwischen den Graphen und den Daten mit Hilfe einer Bewertungsfunktion. Das Modell mit dem besten Wert der Bewertungsfunktion wird ausgewählt. Mögliche Bewertungsfunktionen sind das Bayes-Maß (D. Heckerman: "A Bayesian Approach to learning causal networks", Tech Report MSR-TR-95-04, Microsoft Research 1995), die MDL-Metrik (s. u.) oder die BIC-Bewertungsfunktion (G. Schwarz: "Estimating the dimension of a model", The Annals of Statistics 6(2): 461-464 (1978)).
  • Die bevorzugte Bewertungsfunktion ist die MDL-Metrik. MDL steht für "minimum description length". Diese Bewertungsfunktion hat zum Ziel, die Daten durch ein Netzwerk bzw. einen Graphen G möglichst genau mit möglichst wenig Kanten zu beschreiben. Die verwendete Bewertungsfunktion lautet:


  • Dabei ist logP(G) die a-priori-Wahrscheinlichkeit (im Sinne einer Bayes-Bewertung), den Grafen G vorzufinden. logP(G) wird für alle Graphen G gleich angenommen. Es kann daher bei der Maximierung von L außer Betracht bleiben.
  • n ist die Anzahl der zur Verfügung stehenden, gemessenen Datensätze.

    gibt die bedingte Entropie des Graphen G in Anbetracht der Daten D wieder.
  • Dabei ist k, wie oben erwähnt, die Anzahl der Zufallsvariablen Xi bzw. die Anzahl der Knoten i. D. h. es wird über alle Knoten summiert.
  • Ei ist die Anzahl der unmittelbaren Eltern des Knotens i, d. h. die Anzahl der zum Knoten i hin gerichteten Kanten. D. h. es wird zusätzlich über alle zum Knoten i hin gerichteten Kanten summiert.
  • ri ist die Anzahl der möglichen (diskreten bzw. diskretisierten) Werte xi, die die Zufallsvariable Xi annehmen kann, die also der Knoten i annehmen kann. D. h. es wird über alle möglichen Werte der Zufallsvariablen Xi bzw. des Knotens i summiert.
  • qei ist die Anzahl der möglichen (diskreten bzw. diskretisierten) Werte Xei, die der unmittelbare Elternknoten e des Knotens i, d. h. die Zufallsvariable Xei annehmen kann. D. h. es wird zusätzlich über alle möglichen Werte der Zufallsvariablen Xei bzw. des Knotens e summiert.
  • Nilej ist die Anzahl der Datensätze in denen der Knoten i den Wert xl hat und der unmittelbare Elternknoten e den Wert xj hat, gezählt über alle n Datensätze. D. h. es wird die Kante zwischen den Knoten i und e betrachtet und gezählt, wie oft bei den gemessenen Datensätzen die zugehörigen Werte xl und xj auftraten. Hier fließen die gemessenen Daten ein.
  • Schließlich ist die Normierung


    d. h. es wird über alle Werte summiert, die der Knoten i annehmen kann.
  • Die Entropie ist ein nicht-negatives Maß der Unsicherheit, das maximal ist, wenn die Unsicherheit maximal ist, und das verschwindet, wenn vollständiges Wissen vorliegt.
  • K ist gegeben durch:


  • Vernachlässigt man den Term "-1" in der Klammer, so erkennt man in K die Anzahl aller Kombinationen von Werten, summiert über alle Kanten. Ist die Anzahl der Kanten in einem Graphen G klein, so ist in der Regel auch K klein, weshalb L entsprechend größer ist. Dieser letzte Term der rechten Seite erhöht somit den Wert von L für Graphen mit wenigen Kanten, er bevorzugt somit einfache Graphen. Er wird auch Evidenz genannt.
  • Die Bewertungsfunktion L entspricht in etwa dem Logarithmus der Bayes-Wahrscheinlichkeit für den Graphen G, wenn die Daten D beobachtet wurden. Sie entspricht damit in etwa der Likelihood des Graphen G. L wird maximiert, d. h. es wird derjenige Graph G gesucht, der für die gegebenen Daten D die Funktion L maximiert.
  • Eine besonders effiziente Möglichkeit, die Kanten des Graphen G zu finden, besteht darin, dass zunächst eine Menge von unabhängigen Zufallsvariablen angenommen wird. Sukzessiv wird jeweils diejenige Kante dem Netzwerk hinzugefügt, die die Funktion L am meisten herabsetzt. Dies wird fortgesetzt, bis Minimum von L erreicht ist.
  • Wie bereits erwähnt, lässt sich dies in einer bevorzugten, einfachen Ausführungsart mit Hilfe der folgenden Schritte durchführen:
    • - zunächst wird diejenige alleinige Kante gesucht, die L minimiert, sozusagen die beste erste Kante.
    • - anschließend wird die beste zweite Kante gesucht, d. h. diejenige zweite Kante, die zusätzlich zur bereits vorhandenen ersten Kante L am weitestgehenden minimiert.
    • - usw., bis sich L nicht mehr weiter minimieren lässt.
  • Dieser insbesondere für hochdimensionale Daten sehr zeitaufwändige Algorithmus lässt sich durch schnelle, fast-optimale Suchstrategien für wichtige Abhängigkeiten entscheidend beschleunigen. Ein bekannter Algorithmus hierfür ist der bereits erwähnte Greedy-Algorithmus.
  • Um nicht nur lokale Maxima der Graphenstruktur zu finden, können bekannte Algorithmen wie simulated annealing oder genetische Algorithmen mit den bereits geschilderten Algorithmen kombiniert zur Suche des optimalen Graphen eingesetzt werden.
  • Aus dem solcherart erschlossenen regulatorischen Netzwerk können geeignete Targets identifiziert werden. So erkennt man in Fig. 1 beispielsweise, dass zur Beeinflussung der Konzentration oder Wirksamkeit des Effektorproteins A sowohl das Gen A selbst als auch die Gene B, C und D als Target dienen können.

Claims (6)

1. Verfahren zum Identifizieren pharmazeutischer Targets mit folgenden Schritten:
a) Eine Mehrzahl von Gen-Expressionsmustern einer Zelle wird bestimmt, wobei jeweils die Expressionsrate der Gene der Zelle bestimmt wird.
b) Mindestens eine Abhängigkeit zwischen den Expressionsraten der Gene der Zelle wird bestimmt.
c) Aus mindestens einen Abhängigkeit wird das regulatorische Netzwerk der untersuchten Zelle erschlossen.
2. Verfahren nach dem vorhergehenden Anspruch, dadurch gekennzeichnet, dass angenommen wird, dass nicht alle Expressionsraten der Gene der Zelle voneinander abhängig sind.
3. Verfahren nach dem vorhergehenden Anspruch, dadurch gekennzeichnet,
dass zunächst eine Menge von unabhängigen Gen-Expressionsraten angenommen wird;
dass sukzessiv jeweils diejenige Abhängigkeit hinzugefügt wird, die den Fehler für die Erklärung der Gen- Expressionsmuster am meisten herabsetzt.
4. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Abhängigkeiten mit Hilfe von Methoden der Graphen- Theorie ermittelt werden.
5. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet,
dass die Expressionsrate mindestens eines Gens der Zelle künstlich verändert wird;
dass mindestens ein Gen-Expressionsmuster der solcherart veränderten Zelle bestimmt wird; und
dass das bestimmte Gen-Expressionsmuster mit mindestens einem berechneten Gen-Expressionsmuster verglichen wird, das auf der Basis der mindestens einen künstlich veränderten Gen- Expressionsrate berechnet wurde.
6. Anordnung zum Identifizieren pharmazeutischer Targets
a) mit Mitteln zum Bestimmen einer Mehrzahl von Gen- Expressionsmustern einer Zelle, wobei jeweils die Expressionsrate der Gene der Zelle bestimmt wird;
b) mit Mitteln zum Bestimmen mindestens einer Korrelation zwischen den Expressionsraten der Gene der Zelle;
c) mit Mitteln zum Erschließen des regulatorischen Netzwerks der untersuchten Zelle aus den bestimmten Korrelationen.
DE10159262A 2001-12-03 2001-12-03 Identifizieren pharmazeutischer Targets Expired - Fee Related DE10159262B4 (de)

Priority Applications (2)

Application Number Priority Date Filing Date Title
DE10159262A DE10159262B4 (de) 2001-12-03 2001-12-03 Identifizieren pharmazeutischer Targets
US10/307,997 US20030104463A1 (en) 2001-12-03 2002-12-03 Identification of pharmaceutical targets

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE10159262A DE10159262B4 (de) 2001-12-03 2001-12-03 Identifizieren pharmazeutischer Targets

Publications (2)

Publication Number Publication Date
DE10159262A1 true DE10159262A1 (de) 2003-06-18
DE10159262B4 DE10159262B4 (de) 2007-12-13

Family

ID=7707835

Family Applications (1)

Application Number Title Priority Date Filing Date
DE10159262A Expired - Fee Related DE10159262B4 (de) 2001-12-03 2001-12-03 Identifizieren pharmazeutischer Targets

Country Status (2)

Country Link
US (1) US20030104463A1 (de)
DE (1) DE10159262B4 (de)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10342274A1 (de) * 2003-09-12 2005-04-28 Siemens Ag Identifizieren pharmazeutischer Targets
DE10358332A1 (de) * 2003-12-12 2005-07-21 Siemens Ag Verfahren, Computerprogramm mit Progammcode-Mitteln und Computerprogramm-Produkt zur Analyse eines regulatorischen genetischen Netzwerks einer Zelle
DE102004007215A1 (de) * 2004-02-13 2005-09-15 Siemens Ag Verfahren und Computerprogramm mit Programmcode-Mitteln und Computerprogramm-Produkt zur Ermittlung einer in Daten enthaltenen Struktur unter Verwendung zerlegbarer graphischer Modelle
DE102004030296A1 (de) * 2004-06-23 2006-01-12 Siemens Ag Verfahren, Computerprogramm mit Programmcode-Mitteln und Computerprogramm-Produkt zur Analyse eines regulatorischen genetischen Netzwerks einer Zelle
DE102005030136A1 (de) * 2005-06-28 2007-01-11 Siemens Ag Verfahren zur rechnergestützten Simulation von biologischen RNA-Interferenz-Experimenten
US7945523B2 (en) 2003-09-30 2011-05-17 Siemens Aktiengesellschaft Method and computer program for analyzing variables using pruning, influencing a combustion process in a combustion chamber, using a trainable statistical model
US8260307B2 (en) 2003-09-24 2012-09-04 Siemens Aktiengesellschaft Method for communicating in an ad-hoc radio communication system

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005003368A2 (de) * 2003-07-04 2005-01-13 Siemens Aktiengesellschaft Verfahren, computerprogramm mit programmcode-mitteln und computerprogramm-produkt zur analyse eines regulatorischen genetischen netzwerks einer zelle
WO2007067956A2 (en) * 2005-12-07 2007-06-14 The Trustees Of Columbia University In The City Of New York System and method for multiple-factor selection
WO2007134167A2 (en) * 2006-05-10 2007-11-22 The Trustees Of Columbia University In The City Of New York Computational analysis of the synergy among multiple interacting factors
US8086409B2 (en) * 2007-01-30 2011-12-27 The Trustees Of Columbia University In The City Of New York Method of selecting genes from continuous gene expression data based on synergistic interactions among genes
CN106874704B (zh) * 2017-01-04 2019-02-19 湖南大学 一种基于线性模型的基因共调控网络中关键调控子识别方法
CN113539366A (zh) * 2020-04-17 2021-10-22 中国科学院上海药物研究所 一种用于预测药物靶标的信息处理方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6240374B1 (en) * 1996-01-26 2001-05-29 Tripos, Inc. Further method of creating and rapidly searching a virtual library of potential molecules using validated molecular structural descriptors

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6303301B1 (en) * 1997-01-13 2001-10-16 Affymetrix, Inc. Expression monitoring for gene function identification
US7127379B2 (en) * 2001-01-31 2006-10-24 The Regents Of The University Of California Method for the evolutionary design of biochemical reaction networks

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6240374B1 (en) * 1996-01-26 2001-05-29 Tripos, Inc. Further method of creating and rapidly searching a virtual library of potential molecules using validated molecular structural descriptors

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Instrinsic noise in gene regulatory networks, TATTAI, M. & VAN OUDENAARDEN, A., Proc. Natl. Acad. Sci. USA (17.07.2001) 98 (15) 8614-8619 *
Internetdokument, Adresse www.biosource.com/ content/techCornerContent/theSource/SourceIssue6- BSI1.pdf (Frühjahr 2001), Band 6, S. 1 u. 7 (recherchiert am 26.07.2002 *
Internetdokument, Adresse www.genomatica.com/ science tech future.htm (gutachtlich) (recherchiert am 25.07.2002) *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10342274A1 (de) * 2003-09-12 2005-04-28 Siemens Ag Identifizieren pharmazeutischer Targets
DE10342274B4 (de) * 2003-09-12 2007-11-15 Siemens Ag Identifizieren pharmazeutischer Targets
US8260307B2 (en) 2003-09-24 2012-09-04 Siemens Aktiengesellschaft Method for communicating in an ad-hoc radio communication system
US7945523B2 (en) 2003-09-30 2011-05-17 Siemens Aktiengesellschaft Method and computer program for analyzing variables using pruning, influencing a combustion process in a combustion chamber, using a trainable statistical model
DE10358332A1 (de) * 2003-12-12 2005-07-21 Siemens Ag Verfahren, Computerprogramm mit Progammcode-Mitteln und Computerprogramm-Produkt zur Analyse eines regulatorischen genetischen Netzwerks einer Zelle
DE102004007215A1 (de) * 2004-02-13 2005-09-15 Siemens Ag Verfahren und Computerprogramm mit Programmcode-Mitteln und Computerprogramm-Produkt zur Ermittlung einer in Daten enthaltenen Struktur unter Verwendung zerlegbarer graphischer Modelle
DE102004030296A1 (de) * 2004-06-23 2006-01-12 Siemens Ag Verfahren, Computerprogramm mit Programmcode-Mitteln und Computerprogramm-Produkt zur Analyse eines regulatorischen genetischen Netzwerks einer Zelle
DE102004030296B4 (de) * 2004-06-23 2008-03-06 Siemens Ag Verfahren zur Analyse eines regulatorischen genetischen Netzwerks einer Zelle
DE102005030136A1 (de) * 2005-06-28 2007-01-11 Siemens Ag Verfahren zur rechnergestützten Simulation von biologischen RNA-Interferenz-Experimenten
DE102005030136B4 (de) * 2005-06-28 2010-09-23 Siemens Ag Verfahren zur rechnergestützten Simulation von biologischen RNA-Interferenz-Experimenten

Also Published As

Publication number Publication date
DE10159262B4 (de) 2007-12-13
US20030104463A1 (en) 2003-06-05

Similar Documents

Publication Publication Date Title
DE60015074T2 (de) Verfahren und vorrichtung zur beobachtung der therapieeffektivität
DE202019005627U1 (de) Methylierungsmarker und gezielte Methylierungssondenpanels
DE112005002331B4 (de) Verfahren, System und Vorrichtung zur Zusammenstellung und Nutzung von biologischem Wissen
DE69535428T2 (de) Verfahren zum Auffinden von differentiel exprimierte Gene
DE10159262B4 (de) Identifizieren pharmazeutischer Targets
DE60015726T2 (de) Verfahren und vorrichtung zum vorhersagen von haemostatischer funktionsstörung in patientenproben
DE69719734T2 (de) System zur Prüfung und Auswertung von Testergebnissen in der Antibiotikaempfindlichkeitstestung von Mikroorganismen
DE102020214050A1 (de) Computerimplementiertes Verfahren und Vorrichtung zum Durchführen einer medizinischen Laborwertanalyse
DE102012205686B3 (de) Verfahren zur Substanzidentifizierung und zugehöriges Computerprogrammprodukt
EP2389588A1 (de) Verfahren zur identifizierung insbesondere unbekannter substanzen durch massenspektrometrie
WO2017202713A1 (de) Verfahren und system zur dokumentation eines diagnostischen tests
DE60023496T2 (de) Mathematische analyse für die schätzung von veränderungen des niveaus der gen-expression
EP1280090A1 (de) Verfahren zur Konfiguration paralleler Nukleinsäureanalyseverfahren
DE10342274B4 (de) Identifizieren pharmazeutischer Targets
DE4331018A1 (de) Verfahren zur automatischen Bewertung von Fraktionsmustertypen, die Krankheiten betreffen
DE102006031979A1 (de) Verfahren zur Bestimmung des Verhaltens eines biologischen Systems nach einer reversiblen Störung
EP2743852A1 (de) Verwendung künstlicher neuronaler netze zum nachweis der bildung von nierensteinen und zur bestimmung der zusammensetzung dieser steine
DE102005028975B4 (de) Verfahren zur Ermittlung eines Biomarkers zur Kennzeichnung eines spezifischen biologischen Zustands eines Organismus aus mindestens einem Datensatz
DE102005030136B4 (de) Verfahren zur rechnergestützten Simulation von biologischen RNA-Interferenz-Experimenten
DE102005062163A1 (de) Verfahren zur Identifizierung von prediktiven Biomarken aus Patientendaten
DE102004030296B4 (de) Verfahren zur Analyse eines regulatorischen genetischen Netzwerks einer Zelle
DE102017125013B4 (de) MCC als epigenetischer Marker zur Identifizierung von Immunzellen, insbesondere basophiler Granulozyten
WO2022069162A1 (de) Bestimmen von vergleichspatienten basierend auf ontologien
DE102015206444B3 (de) Verfahren zum Erkennen von Mikroorganismen
WO2010060746A2 (de) Verfahren und vorrichtung zur automatischen analyse von modellen

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8364 No opposition during term of opposition
R081 Change of applicant/patentee

Owner name: SIEMENS HEALTHCARE GMBH, DE

Free format text: FORMER OWNER: SIEMENS AKTIENGESELLSCHAFT, 80333 MUENCHEN, DE

R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee
R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: C12Q0001680000

Ipc: G16B0025100000