DE102005030136B4 - Verfahren zur rechnergestützten Simulation von biologischen RNA-Interferenz-Experimenten - Google Patents

Verfahren zur rechnergestützten Simulation von biologischen RNA-Interferenz-Experimenten Download PDF

Info

Publication number
DE102005030136B4
DE102005030136B4 DE102005030136A DE102005030136A DE102005030136B4 DE 102005030136 B4 DE102005030136 B4 DE 102005030136B4 DE 102005030136 A DE102005030136 A DE 102005030136A DE 102005030136 A DE102005030136 A DE 102005030136A DE 102005030136 B4 DE102005030136 B4 DE 102005030136B4
Authority
DE
Germany
Prior art keywords
rna
cell
activity
causal network
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE102005030136A
Other languages
English (en)
Other versions
DE102005030136A1 (de
Inventor
Mathäus Dejori
Bernd Prof. Schürmann
Martin Dr. Stetter
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Priority to DE102005030136A priority Critical patent/DE102005030136B4/de
Priority to PCT/EP2006/062393 priority patent/WO2007000379A1/de
Publication of DE102005030136A1 publication Critical patent/DE102005030136A1/de
Application granted granted Critical
Publication of DE102005030136B4 publication Critical patent/DE102005030136B4/de
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression

Landscapes

  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Physiology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

Verfahren zur rechnergestützten Simulation von biologischen RNA-Interferenz-Experimenten zur Bestimmung von RNA-Aktivitäts-Mustern einer Zelle,
a) bei dem ein kausales Netz verwendet wird, welches das regulatorische genetische Netzwerk der Zelle derart beschreibt, dass Knoten des kausalen Netzes jeweils die Aktivität einer RNA-Molekülart in der Zelle repräsentieren und Kanten des kausalen Netzes regulatorische Wechselwirkungen zwischen den RNA-Molekülarten der Zelle repräsentieren;
b) bei dem das kausale Netz unter Verwendung von einem oder mehreren bekannten RNA-Aktivitäts-Mustern, welche mithilfe der DNA-Microarray-Technologie gemessene Muster sind, trainiert wird, wobei die Knoten und die Kanten des kausalen Netzes angepasst werden;
c) bei dem die Aktivität von einer oder mehreren RNA-Molekülarten der Zelle blockiert wird, indem deren Aktivität auf Null gesetzt wird;
d) bei dem unter Verwendung des kausalen Netzes für die blockierten RNA-Molekülarten ein oder mehrere RNA-Aktivitäts-Muster der Zelle generiert werden.

Description

  • Die Erfindung betrifft ein Verfahren zur rechnergestützten Simulation von biologischen RNA-Interferenz-Experimenten sowie ein entsprechendes Computerprogrammprodukt.
  • Lebensvorgänge in der Zelle werden durch komplexe Wechselwirkungen verschiedener Gene gesteuert. In einer lebenden Zelle werden kontinuierlich aus den Genen der Erbsubstanz (DNA) Ribonukleinsäure-Moleküle (im folgenden RNA-Moleküle) und anschließend Proteinmoleküle produziert, welche die vielfältigen Aufgaben in der Zelle übernehmen. Das Wechselspiel bzw. die Wechselwirkungen der Gene untereinander sowie mit den Proteinen stellen ein sog. regulatorisches genetisches Netzwerk dar, welches der Entwicklung des menschlichen Körpers aus einer befruchteten Eizelle sowie allen Körperfunktionen zugrunde liegt.
  • Der Vorgang der Proteinsynthese aus einem Gen über den Zwischenschritt der RNA-Produktion wird als Genexpression bezeichnet. Wird aus einem Gen zu einem bestimmten Zeitpunkt mehr Protein (bzw. mehr RNA als Zwischenprodukt) als in einem Referenzzustand erzeugt, spricht man von Überexpression, bei zu wenig Protein (bzw. zu wenig RNA) von einer Unterexpression. Der Expressionszustand aller Gene zusammengenommen zu einem Zeitpunkt wird hierbei als Genexpressionsmuster bezeichnet. Das Genexpressionsmuster ändert sich über die Zeit abhängig vom Zustand der Zelle, von der zellulären Umgebung sowie von dem betrachteten Zelltyp. Da eine Zelle während ihres Lebens unterschiedliche und sehr komplexe Zustände durchläuft, verändert sich auch ihr Genexpressionsmuster kontinuierlich. Ein Genexpressionsmuster stellt somit eine Momentaufnahme des Zustandes der Zelle dar.
  • Für lange Zeit wurden die Ribonukleinsäuren nur als Zwischenprodukt bei der Proteinsynthese in einer Zelle angesehen. Die Genforschung der letzten Jahre hat jedoch gezeigt, dass die Ribonukleinsäuren eine weit wichtigere Rolle im Zellsystem spielen und grundlegende Mechanismen bei den biologischen Prozessen in einer Zelle steuern. Bisher wurde angenommen, dass die Regulation der Genexpression einer Zelle vornehmlich durch die in der Zelle erzeugten Proteine gesteuert wird. Forschungsergebnisse der letzten Jahre zeigen jedoch, dass kurze einsträngige RNA-Moleküle die Übersetzung von Genen in Proteine hemmen können (sog. Gene Silencing), indem sie die als Zwischenprodukt bei der Proteinsynthese erzeugten RNA-Moleküle binden und damit ein Ablesen in das entsprechende Protein verhindern.
  • Ein verstärkter Effekt wurde bei doppelsträngigen RNA-Molekülen beobachtet, welche die als Zwischenprodukt erzeugten RNA-Moleküle nicht nur hemmen, sondern zusätzlich deren Abbau durch Enzyme bewirken. Dieses Phänomen wird als RNA-Interferenz (im folgenden RNAi) bezeichnet. RNAi stellt ein wichtiges Werkzeug der Genomforschung dar, denn man kann gezielt und sehr wirksam die Aktivität einzelner Gene abschalten, die daraus resultierenden Effekte studieren und auf diese Weise Erkenntnisse über deren Funktionsweise gewinnen. Mit RNAi ist es sehr viel gezielter und genauer möglich, die Funktion von Genen zu studieren, da diese – im Gegensatz zu herkömmlichen Knock-out-Studien – nicht vollständig entfernt werden, sondern nur vorübergehend und reversibel blockiert werden.
  • Neben der Gen-Funktionsanalyse ist RNAi vor allem für therapeutische und pharmazeutische Anwendungsgebiete interessant. Beispielsweise können durch Ausschalten einzelner krankheitsrelevanter Gene (z. B. Onkogene) krankheitsverursachende Mechanismen gehemmt werden und neue Medikamentenwirkstoffe aufgefunden werden. RNAi-Studien werden heutzutage als in-vivo und in-vitro Experimente durchgeführt, die aufwändig und teuer sind. Zudem bedarf es zusätzlicher experimenteller Daten, z. B. DNA-Microarray-Daten, um die für ein RNAi-Experiment interessanten RNA-Moleküle zu selektieren.
  • Die Druckschrift WO 2005/003368 A2 beschreibt ein Verfahren zur rechnergestützten Simulation von Gen-Expressionsmustern, wobei ein kausales Netz verwendet wird, welches das regulatorische genetische Netzwerk einer Zelle beschreibt.
  • Der Artikel RICE J. J. u. a.: Reconstructing biological networks using conditional correlation analysis, Bioinformatics (März 2005) 21 (6) 765–773, beschreibt die Rekonstruktion von biologischen Netzwerken mit Hilfe einer Korrelationsanalyse zwischen einzelnen mRNA-Konzentrationen von Genen in dem Netzwerk. Die in diesem Artikel beschriebenen Netzwerke dienen nicht zur Simulation von RNA-Interferenz-Experimenten.
  • Aus der Druckschrift Chen C.-I. u. a.: A Bayesian approach toward analyzing the network of genes involved in C. elegans programmed cell death, West Coast Worm Meeting, 2004, Poster and talk (http://elegans.swmed.edu/wli/[wcwm2004p85]/) ist ein Bayesianischer Ansatz zur Analyse von genetischen Netzwerken bekannt, wobei die mit den Netzwerken durchgeführten Prädiktionen mit Daten aus RNAi-Experimenten verglichen werden.
  • In der Veröffentlichung Pe'er D. u. a.: Inferring subnetworks from perturbed expression profiles, Bioinformatics (2001) 7 (Suppl. 1) S215–224, wird die Modellierung von Störungen in Bayesianischen Netzen beschrieben, wobei insbesondere Störungen in der Form von Abschaltung von Genen erwähnt sind.
  • In dem Dokument Markowetz F, Grossmann S, Spang R: Probabilistic soft interventions in Conditional Gaussian networks, Tenth International Workshop an Artificial Intelligence and Statistics (AISTATS), Barbados, Januar 2005 (http://compdiag. molgen.mpg.de/research/projectRNAi.shtml), wird ein Lernverfahren für ein Bayesianisches Netz beschrieben, wobei im Zusammenhang mit dem Lernen des Netzes RNAi-Experimente erwähnt werden. Die Druckschrift beschreibt nicht die Simulation von RNAi-Experimenten mit einem kausalen Netz.
  • Aus der Druckschrift DE 101 59 262 A1 ist die Simulation von Gen-Expressionsmustern mit Hilfe von graphischen Modellen bekannt.
  • Die Veröffentlichungen DEJORI M.: Analyzing Gene-Expression Data with Bayesian Networks, Diplomarbeit, Technische Universität Graz, Juni 2002, FRIEDMAN N. u. a.: Using Bayesian Networks to Analyze Expression Data, Journal of computational biology (2000) 7 (3–4) 601–620, und YOO C. u. a.: Discovery of causal relationships in a gene-regulation pathway from a mixture of experimental and observational DNA microarray data, Proceedings of the Pacific Symposium an Biocomputing (2002) 7: 498–509, beschäftigen sich mit der Analyse von Gen-Expressions-Daten basierend auf Bayesianischen Netzen.
  • Aufgabe der Erfindung ist es, ein Verfahren und ein entsprechendes Computerprogrammprodukt zu schaffen, mit denen rechnergestützt RNAi-Experimente simulierbar sind.
  • Diese Aufgabe wird durch die unabhängigen Patentansprüche gelöst. Weiterbildungen der Erfindung sind in den abhängigen Ansprüchen definiert.
  • In dem erfindungsgemäßen Verfahren werden rechnergestützt RNA-Aktivitäts-Muster einer Zelle dadurch bestimmt, dass
    • a) ein kausales Netz verwendet wird, welches das regulatorische genetische Netzwerk der Zelle derart beschreibt, dass Knoten des kausalen Netzes jeweils die Aktivität einer RNA-Molekülart in der Zelle repräsentieren und Kanten des kausalen Netzes regulatorische Wechselwirkungen zwischen den RNA-Molekülarten der Zelle repräsentieren;
    • b) das kausale Netz unter Verwendung von einem oder mehreren bekannten RNA-Aktivitäts-Mustern, welche mithilfe der DNA-Microarray-Technologie gemessene Muster sind, trainiert wird, wobei die Knoten und die Kanten des kausalen Netzes angepasst werden;
    • c) die Aktivität von einer oder mehreren RNA-Molekülarten der Zelle blockiert wird, indem deren Aktivität auf Null gesetzt wird;
    • d) unter Verwendung des kausalen Netzes für die blockierten RNA-Molekülarten ein oder mehrere RNA-Aktivitäts-Muster der Zelle generiert werden.
  • Unter Aktivität versteht man hierbei die Konzentration oder ein Maß für die Konzentration der entsprechenden RNA-Molekülarten in der Zelle.
  • Das Verfahren stellt im Wesentlichen eine Weiterentwicklung des in der oben genannten Druckschrift WO 2005/003368 A2 beschriebenen Verfahrens dar, wobei die Offenbarung dieser Druckschrift hiermit durch Verweis zum Inhalt der vorliegenden Anmeldung gemacht wird. Dem erfindungsgemäßen Verfahren liegt dabei die Erkenntnis zugrunde, dass das Verfahren zur Simulation von Gen-Expressionsmustern gemäß der WO 2005/003368 A2 auch zur Simulation von RNAi-Experimenten eingesetzt werden kann, indem die Variablen des Verfahrens als Aktivitäten der einzelnen RNA-Molekülarten in der Zelle interpretiert werden und die Aktivitäten einzelner RNA-Moleküle im Wesentlichen ausgeschaltet werden. Durch das erfindungsgemäße Verfahren können somit RNAi-Experimente am Rechner simuliert werden, wodurch der experimentelle und zeitliche Aufwand minimiert werden kann.
  • Vorzugsweise verwendet das erfindungsgemäße Verfahren als kausales Netz ein Bayesianisches Netz (auch Bayessches Netz genannt), das hinlänglich aus dem Stand der Technik bekannt ist. Das kausale Netz ist ferner vorzugsweise vom Typ eines gerichteten azylkischen Graphen (englisch: DAG = directed acylic graph).
  • In dem erfindungsgemäßen Verfahren können die Aktivitäten der RNA-Molekülarten durch diskrete Zustände repräsentiert werden, welche Maße für bestimmte Konzentrationen der RNA-Molekülarten in der Zelle darstellen. Beispielsweise können die diskreten Zustände einen überexprimierten, normalexprimierten und unterexprimierten Zustand umfassen. Hierbei steht ein überexprimierter Zustand für eine hohe, einen Normbereich überschreitende Aktivität, ein normalexprimierter Zustand für eine in einem Normbereich liegende Aktivität und ein unterexprimierter Zustand für eine Aktivität, die unterhalb eines Normbereichs liegt.
  • In einer Weiterentwicklung des erfindungsgemäßen Verfahrens wird ein rechnergestützter Vergleich des oder der in Schritt d) generierten RNA-Aktivitäts-Muster mit einem oder mehreren vorgegebenen RNA-Aktivitäts-Mustern durchgeführt, um beispielsweise Rückschlüsse über den Einfluss bestimmter RNA-Molekülarten auf RNA-Aktivitäts-Muster zu gewinnen. Der rechnergestützte Vergleich wird dabei vorzugsweise unter Verwendung eines statistischen Verfahrens und/oder einer statistischen Kennzahl, insbesondere eines Abstandsmaßes, durchgeführt.
  • Zur Gewinnung von Erkenntnissen bezüglich des Einflusses bestimmter RNA-Moleküle auf Krankheiten, stammen in einer Ausführungsform der Erfindung das eine oder die mehreren bekannten und/oder vorgegebenen RNA-Aktivitäts-Muster, mit denen das Netz trainiert bzw. der rechnergestützte Vergleich durchgeführt wird, aus kranken Zellen.
  • Das erfindungsgemäße Verfahren kann insbesondere als Voruntersuchung für nass-biochemische RNA-Interferenz-Experimente verwendet werden, wobei mit dem Verfahren RNA-Molekülarten mit großem Einfluss auf die in Schritt d) generierte RNA-Aktivitäts-Muster extrahiert werden, so dass bei den nachfolgenden RNAi-Experimenten vorzugsweise die extrahierten RNA-Molekülarten blockiert werden.
  • Neben dem soeben beschriebenen Verfahren betrifft die Erfindung ferner ein Computerprogramm-Produkt mit einem auf einem maschinenlesbaren Träger gespeicherten Programmcode zur Ausführung des erfindungsgemäßen Verfahrens, wenn das Programm auf einem Rechner abläuft.
  • Ausführungsbeispiele der Erfindung werden nachfolgend detailliert anhand der beigefügten Figuren beschrieben.
  • Es zeigen:
  • 1 den Ablauf einer Ausführungsform des erfindungsgemäßen Verfahrens;
  • 2 den Ablauf eines Verfahrens zur Erzeugung eines Datensatzes von Stichproben aus einem Bayesschen Netz; und
  • 3 den Ablauf eines Verfahrens der interventionellen Stichprobenentnahme gemäß einem Teilschritt des Verfahrens aus 1.
  • Im folgenden wird mit Bezug auf 1 ein Ausführungsbeispiel der Erfindung beschrieben, bei dem als kausales Netzwerk zur Simulation eines RNAi-Experiments ein Bayessches Netzwerk B verwendet wird, mit dem eine sog. Bayessche inverse Modellierung (BIM) durchgeführt wird.
  • Ein Bayessches Netzwerk B ist ein spezieller Typ der Darstellung einer gemeinsamen multivariaten Wahrscheinlichkeitsdichtefunktion (WDF) einer Menge von Variablen X durch ein graphisches Modell.
  • Es ist durch einen gerichteten azyklischen Graphen (directed acyclic graph, DAG) G definiert, in welchem jeder Knoten i = 1, ..., n einer Zufallsvariablen Xi entspricht.
  • Die Kanten zwischen den Knoten repräsentieren statistische Abhängigkeiten und können als Kausalzusammenhänge zwischen ihnen interpretiert werden. Der zweite Bestandteil des Bayesschen Netzwerkes ist die Menge von bedingten WDFen P(Xi|Pai, θ, G), welche mittels eines Vektors θ parametriert sind.
  • Diese bedingten WDFen spezifizieren die Art der Abhängigkeiten der einzelnen Variablen i von der Menge ihrer Elternknoten (Parents) Pai. Somit kann die gemeinsame WDF in die Produktform
    Figure 00090001
    zerlegt werden.
  • Der DAG eines Bayesschen Netzwerkes beschreibt auf eindeutige Weise die bedingten Abhängigkeits- und Unabhängigkeitsbeziehungen zwischen einer Menge von Variablen, jedoch hat im Gegensatz dazu eine gegebene statistische Struktur der WDF keinen eindeutigen DAG zur Folge.
  • Vielmehr kann gezeigt werden, dass zwei DAG ein und dieselbe WDF beschreiben, dann und nur dann, wenn sie dieselbe Menge von Kanten und dieselbe Menge von ”Colliders” aufweisen, wobei ein Collider eine Konstellation ist, in welcher wenigstens zwei gerichtete Kanten zu demselben Knoten führen.
  • In diesem Netzwerk repräsentieren gemäß der hier beschriebenen Ausführungsform der Erfindung Knoten die Aktivität einer RNA-Molekülart in der Zelle und die Kanten beschreiben die Regelungsmechanismen zwischen zwei Knoten, welche auf kausale Art und Weise interpretiert werden können.
  • Um mit dem Bayesschen Netzwerk B RNAi-Experimente zu simulieren, wird das Netzwerk gemäß Schritt 101 der 1 zunächst strukturell gelernt.
  • Der Vorgang des strukturellen Lernens kann wie folgt beschrieben werden:
    Sei D = {d1, d2, ..., dN} ein Datensatz von N unabhängigen Beobachtungen, wobei jeder Datenpunkt ein n-dimensionaler Vektor mit Komponenten dl = {dl l, dl 2, ..., dl n} ist. Bei gegebenem D ist die Struktur G des Bayesschen Netzwerkes zu finden, welche am besten mit D übereinstimmt, d. h. welche die Bayes-Punktbewertung (Bayes-Score)
    Figure 00100001
    maximiert, wobei P(D|G) die Randwahrscheinlichkeit, P(G) die Apriori-Wahrscheinlichkeit der Struktur und P(D) die Evidenz ist.
  • Da sowohl die Apriori-Wahrscheinlichkeit als auch die Evidenz unbekannt sind, reduziert sich das Problem auf das Ermitteln der Struktur mit der besten Randwahrscheinlichkeit entsprechend den Daten.
  • In der hier beschriebenen Ausführungsform besteht der Datensatz D aus N Microarray-Experimenten, z. B. aus Zellproben von unterschiedlichen Patienten, und jeder Datenvektor {dl 1, d1 2, ..., d1 n} entspricht der Aktivität von n RNA-Molekülarten in dem Microarray-Experiment.
  • Ein aus solchen Daten gelerntes Bayessches Netzwerk codiert die Wahrscheinlichkeitsverteilung von n RNA-Molekülarten, die aus diesen N Microarray-Experimenten erhalten wurden.
  • Als nächstes wird gemäß Schritt 102 der 1 eine sog. interventionelle Stichprobenentnahme (B, E, N) durchgeführt, mit der in dem gelernten Bayesschen Netzwerk Datensätze von N unabhängigen Stichproben bei einer vorgegebenen Evidenz erzeugt werden. Das Verfahren der interventionellen Stichprobenentnahme wird weiter unten mit Bezug auf 3 näher erläutert. Die Evidenz stellt hierbei die in dem erfindungsgemäßen Verfahren vorgegebene Menge an Beobachtungen des zu simulierenden RNAi-Experiments dar. D. h. E steht für eine oder mehrere blockierte RNA-Molekülarten, deren Aktivitätswert im Wesentlichen auf Null gesetzt wird.
  • Nach Durchführung der interventionellen Stichprobenentnahme wird im Schritt 103 schließlich der Datensatz von N Stichpro ben ausgegeben, wobei dieser Datensatz das Ergebnis des simulierten RNAi-Experiments darstellt.
  • Zum besseren Verständnis wird zunächst mit Bezug auf 2 allgemein ein Verfahren zur Stichprobenentnahme (B, N) von N unabhängigen Stichproben aus einem Bayesschen Netzwerk B beschrieben. Hierbei entspricht jeder Knoten i = 1, ..., n des Bayesschen Netzwerks einer Zufallsvariablen Xi, wobei die Knoten im erfindungsgemäßen Verfahren für Aktivitäten einzelner RNA-Molekülarten stehen.
  • In einem ersten Schritt 201 wird zunächst die Variablenmenge X gemäß der Bedingung geordnet, dass Parents (Elternknoten) Pai vor den Xi angeordnet sind.
  • Anschließend wird für jede Stichprobe s = 1, ..., N und für i = 1, ..., n der Knoten Xi mit der höchsten Ordnungsnummer in der Strichprobe, der nicht instantiiert ist, ausgewählt (Schritt 202). Falls Xi ein Wurzelknoten (d. h. ein Knoten ohne Elternknoten) ist, wird ein zufälliger Zustand mit der Wahrscheinlichkeit P(Zustand) gewählt (Schritt 203). Andernfalls wird ein zufälliger Zustand mit der bedingten Wahrscheinlichkeit P(Zustand|entnommene Zustände von Pai) gewählt (Schritt 204). Schließlich wird im Schritt 205 der Knoten Xi mit dem zufälligen Zustand instantiiert, d. h. Xi = Zustand. Nach Instantiierung aller Xi für alle Stichproben N hat man einen Datensatz DB von N unabhängigen Stichproben erhalten.
  • Das soeben beschriebene Verfahren zur Stichprobenentnahme wird nun unter Berücksichtigung einer Evidenz angewandt, welche – wie oben erwähnt – eine Menge XE an RNA-Molekülarten repräsentiert, deren Aktivität zur Simulation des RNAi-Experiments blockiert wird. Die Menge an durch die Stichprobenentnahme zu bestimmenden Abfragevariablen Xq ist somit gegeben durch Xq = {X\XE}.
  • In Bezug auf 3 werden nachfolgend die einzelnen Schritte des Verfahrens erläutert, wobei das Verfahren das oben erwähnte Verfahren zur interventionellen Stichprobenentnahme darstellt.
  • In einem ersten Schritt 301 wird zunächst die Variablenmenge Xq gemäß der Bedingung geordnet, dass Parents (Elternknoten) Pai vor den Xi angeordnet sind.
  • Anschließend wird für jede Stichprobe s = 1, ..., N und für i 1, ..., n der Knoten Xi mit der höchsten Ordnungsnummer in der Strichprobe, der nicht instantiiert ist, ausgewählt (Schritt 302). Falls Xi ein Wurzelknoten (d. h. ein Knoten ohne Elternknoten) ist, wird ein zufälliger Zustand mit der Wahrscheinlichkeit P(Zustand|E) gewählt (Schritt 303). Andernfalls wird ein zufälliger Zustand mit der bedingten Wahrscheinlichkeit P(Zustand|entnommene Zustände von Pai, E) gewählt (Schritt 304). Schließlich wird im Schritt 305 der Knoten Xi mit dem zufälligen Zustand instantiiert, d. h. Xi = Zustand. Nach Instantiierung aller Xi für alle Stichproben N hat man einen Datensatz DB|E von N unabhängigen Stichproben in Abhängigkeit von der Evidenz E erhalten. Dieser Datensatz stellt die simulierten Aktivitäten der RNA-Molekülarten eines RNAi-Experiments dar, bei dem gemäß der Evidenz E bestimmte RNA-Molekülarten blockiert wurden.
  • Die Berechnung der Wahrscheinlichkeiten P(Zustand|E) und P(Zustand|entnommene Zustände von Pai, E) in Schritten 303 und 304 des obigen Verfahrens erfolgt mittels probabilistischer Interferenz. Hierbei wird die Aposteriori-Verteilung P(Xq|E) einer Abfragevariablen Xq ermittelt, wenn eine gewisse Evidenz E im Bayesschen Netzwerk beobachtet worden ist.
  • Aufgrund der Definition einer bedingten Wahrscheinlichkeit ist die Aposteriori-Wahrscheinlichkeit gegeben durch
    Figure 00130001
    wobei XE die Menge der beobachteten Variablen bezeichnet.
  • Um die Zeitkomplexität zu überwinden, verwenden die verschiedenen Methoden der exakten Interferenzberechnung das allgemeine Prinzip der dynamischen Programmierung.
  • Im Rahmen dieses Ausführungsbeispiels wird ein einfacher Interferenzalgorithmus, der ”bucket elimination”, verwendet.
  • Die Grundidee bei diesem Interferenzalgorithmus besteht darin, Variablen eine nach der anderen entsprechend einer Eliminationsreihenfolge ρ durch Summieren zu eliminieren. Auf diese Weise kann P(Xq|E) innerhalb einer annehmbaren Zeit effizient berechnet werden.
  • Ggf. kann das im Vorangegangenen beschriebene Simulationsverfahren dadurch erweitert werden, dass die Qualität des Einflusses der Evidenz E auf das Verhalten des Bayesschen Netzwerkes B abgeschätzt wird, um hierdurch biologische bzw. medizinische Erkenntnisse aus dem Verfahren zu gewinnen. Hierzu wird der erzeugte Datensatz DB|E mit einer Menge von Datensätzen D von bekannten Zuständen S verglichen.
  • Es wird angenommen, dass D die Auswirkung verschiedener Krebsarten beschreibt. Ausführungsgemäß kann nun das Verhalten der Evidenz E in Bezug auf eine bestimmte Krebsart S beschrieben werden.
  • Unter Verwendung eines Abstandsmaßes wird die Änderung a der Korrelation zwischen DB|E und DS infolge von E schätzbar:
    Figure 00130002
    wobei der Abstand zwischen den zwei Datensätzen mit Hilfe des Abstands zwischen DB, welches aus B ohne Evidenz entnommen wurde, und DS normiert wurde.
  • Folglich ist ausführungsgemäß der Einfluss einer beobachteten Evidenz in der Form von blockierten RNA-Molekülarten auf ein für Krebs charakteristisches Verhalten des Modells messbar.
  • Zweitens ist die Wahrscheinlichkeit dafür berechenbar, dass B einen Datensatz DB|E erzeugt, welcher gleich DS bei gegebenem E ist.
  • Zu diesem Zweck wird geschätzt, wie viele Stichproben dl von DB|E am nächsten bei DS liegen, indem der Abstand zwischen jeder Stichprobe und jedem Datensatz von D berechnet wird.
  • Somit erhält man die Aposteriori-Wahrscheinlichkeit P(S|E) des Auftretens der Krebsart S bei gegebener Evidenz E aus:
    Figure 00140001
    wobei NES die Anzahl der Stichproben von DB|E ist, welche statistisch dem Datensatz DS am nächsten kommen, und wobei N die Gesamtzahl der Stichproben von DB|E ist.

Claims (11)

  1. Verfahren zur rechnergestützten Simulation von biologischen RNA-Interferenz-Experimenten zur Bestimmung von RNA-Aktivitäts-Mustern einer Zelle, a) bei dem ein kausales Netz verwendet wird, welches das regulatorische genetische Netzwerk der Zelle derart beschreibt, dass Knoten des kausalen Netzes jeweils die Aktivität einer RNA-Molekülart in der Zelle repräsentieren und Kanten des kausalen Netzes regulatorische Wechselwirkungen zwischen den RNA-Molekülarten der Zelle repräsentieren; b) bei dem das kausale Netz unter Verwendung von einem oder mehreren bekannten RNA-Aktivitäts-Mustern, welche mithilfe der DNA-Microarray-Technologie gemessene Muster sind, trainiert wird, wobei die Knoten und die Kanten des kausalen Netzes angepasst werden; c) bei dem die Aktivität von einer oder mehreren RNA-Molekülarten der Zelle blockiert wird, indem deren Aktivität auf Null gesetzt wird; d) bei dem unter Verwendung des kausalen Netzes für die blockierten RNA-Molekülarten ein oder mehrere RNA-Aktivitäts-Muster der Zelle generiert werden.
  2. Verfahren nach Anspruch 1, bei dem das kausale Netz ein Bayesianisches Netz ist.
  3. Verfahren nach Anspruch 1 oder 2, bei dem das kausale Netz vom Typ eines gerichteten azyklischen Graphen ist.
  4. Verfahren nach einem der vorhergehenden Ansprüche, bei dem die Aktivitäten der RNA-Molekülarten durch diskrete Zustände repräsentiert werden.
  5. Verfahren nach Anspruch 4, bei dem die diskreten Zustände einen überexprimierten, normalexprimierten und unterexprimierten Zustand umfassen.
  6. Verfahren nach einem der vorhergehenden Ansprüche, bei dem ein rechnergestützter Vergleich des oder der in Schritt d) des Anspruchs 1 generierten RNA-Aktivitäts-Muster mit einem oder mehreren vorgegebenen RNA-Aktivitäts-Mustern durchgeführt wird.
  7. Verfahren nach Anspruch 6, bei dem der rechnergestützte Vergleich unter Verwendung eines statistischen Verfahrens und/oder einer statistischen Kennzahl, insbesondere eines Abstandsmaßes, durchgeführt wird.
  8. Verfahren nach Anspruch 6 oder 7, bei dem das eine oder die mehreren vorgegebenen RNA-Aktivitäts-Muster mithilfe der DNA-Microarray-Technologie gemessene Muster sind.
  9. Verfahren nach einem der vorhergehenden Ansprüche, bei dem das eine oder die mehreren bekannten und/oder vorgegebenen RNA-Aktivitäts-Muster aus kranken Zellen stammen.
  10. Verfahren nach einem der vorhergehenden Ansprüche bei dem RNA-Molekülarten mit großem Einfluss auf die in Schritt d) des Anspruchs 1 generierten RNA-Aktivitäts-Muster extrahiert werden.
  11. Computerprogramm-Produkt mit einem auf einem maschinenlesbaren Träger gespeicherten Programmcode zur Ausführung des Verfahrens nach einem der vorhergehenden Ansprüche, wenn das Programm auf einem Rechner abläuft.
DE102005030136A 2005-06-28 2005-06-28 Verfahren zur rechnergestützten Simulation von biologischen RNA-Interferenz-Experimenten Expired - Fee Related DE102005030136B4 (de)

Priority Applications (2)

Application Number Priority Date Filing Date Title
DE102005030136A DE102005030136B4 (de) 2005-06-28 2005-06-28 Verfahren zur rechnergestützten Simulation von biologischen RNA-Interferenz-Experimenten
PCT/EP2006/062393 WO2007000379A1 (de) 2005-06-28 2006-05-17 Verfahren zur rechnergestützten simulation von biologischen rna-interferenz-experimenten

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102005030136A DE102005030136B4 (de) 2005-06-28 2005-06-28 Verfahren zur rechnergestützten Simulation von biologischen RNA-Interferenz-Experimenten

Publications (2)

Publication Number Publication Date
DE102005030136A1 DE102005030136A1 (de) 2007-01-11
DE102005030136B4 true DE102005030136B4 (de) 2010-09-23

Family

ID=36809053

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102005030136A Expired - Fee Related DE102005030136B4 (de) 2005-06-28 2005-06-28 Verfahren zur rechnergestützten Simulation von biologischen RNA-Interferenz-Experimenten

Country Status (2)

Country Link
DE (1) DE102005030136B4 (de)
WO (1) WO2007000379A1 (de)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107391961B (zh) * 2011-09-09 2020-11-17 菲利普莫里斯生产公司 用于基于网络的生物活性评估的系统与方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10159262A1 (de) * 2001-12-03 2003-06-18 Siemens Ag Identifizieren pharmazeutischer Targets
WO2005003368A2 (de) * 2003-07-04 2005-01-13 Siemens Aktiengesellschaft Verfahren, computerprogramm mit programmcode-mitteln und computerprogramm-produkt zur analyse eines regulatorischen genetischen netzwerks einer zelle

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10159262A1 (de) * 2001-12-03 2003-06-18 Siemens Ag Identifizieren pharmazeutischer Targets
WO2005003368A2 (de) * 2003-07-04 2005-01-13 Siemens Aktiengesellschaft Verfahren, computerprogramm mit programmcode-mitteln und computerprogramm-produkt zur analyse eines regulatorischen genetischen netzwerks einer zelle

Non-Patent Citations (9)

* Cited by examiner, † Cited by third party
Title
Chen C.-I. u.a.: A Bayesian approach toward analyzing the network of genes involved in C. elegans programmed cell death, West Coast Worm Meeting, 2004. Poster and talk. (http://elegans.swmed.edu./ wli[wcwm2004p85]/) *
DEJORI M.: Analyzing Gene-Expression Data with Bayesian Networks. Diplomarbeit Technische Universität Graz, Juni 2002 *
FRIEDMANN N. u.a.: Using Bayesian Networks to Analyze Expression Data. Journal of computational biology (2000) 7 (3-4) 601-620 *
Markowetz F., Grossmann S., Spang R.: Probalistic soft interventions in Conditional Gaussian networks. Tenth International Workshop on Artifical Intelligence and Statistics (AISTATS), Barbados, Januar 2005 (http://compdiag.molgen.mpg.de/ research/project_RNAi.shtml) *
Pe'er D. u.a.: Inferring subnetworks from perturbed expression profiles. Bioinformatics. (2001) 7 (Suppl. 1) S.215-24 *
Pressemitteilung vom 26.08.2003: Ambion und Cenix Bioscience geben Verfügbarkeit von Pre-Designed siRNAs für das menschliche, Maus- und Ratten- Genom bekannt [recherchiert am 20.10.2006 unter http://www.cenix-bioscience.com/downloads/pi/Ambio _Cenix_PR_ Aug26_03_dt.pdf] *
RICE, J.J. u.a.: Reconstructing biological networks using conditional correlation analysis. Bioinformatics (März 2005) 21 (6) 765-73 *
RICE, J.J. u.a.: Reconstructing biological networks using conditional correlation analysis. Bioinformatics (März 2005) 21 (6) 765-73 Chen C.-I. u.a.: A Bayesian approach toward analyzing the network of genes involved in C. elegans programmed cell death, West Coast Worm Meeting, 2004. Poster and talk. (http://elegans.swmed.edu./ wli[wcwm2004p85]/) Pe'er D. u.a.: Inferring subnetworks from perturbed expression profiles. Bioinformatics. (2001) 7 (Suppl. 1) S.215-24 Markowetz F., Grossmann S., Spang R.: Probalistic soft interventions in Conditional Gaussian networks. Tenth International Workshop on Artifical Intelligence and Statistics (AISTATS), Barbados, Januar 2005 (http://compdiag.molgen.mpg.de/ research/project_RNAi.shtml) Pressemitteilung vom 26.08.2003: Ambion und Cenix Bioscience geben Verfügbarkeit von Pre-Designed siRNAs für das menschliche, Maus- und Ratten- Genom bekannt [recherchiert am 20.10.2006 unter http://www.cenix-bioscience.com/downloads/pi/Ambion_Cenix_PR_ Aug26_03_dt.
YOO C. u.a.: Discovery of causal relationships in a gene- regulation pathway from a mixture of experimental and observational DNA microarray data. Proceedings of the Pacific Symposium on Biocomputing (2002) 7: 498-509 *

Also Published As

Publication number Publication date
DE102005030136A1 (de) 2007-01-11
WO2007000379A1 (de) 2007-01-04

Similar Documents

Publication Publication Date Title
DE112005002331B4 (de) Verfahren, System und Vorrichtung zur Zusammenstellung und Nutzung von biologischem Wissen
DE69630116T2 (de) System umd verfahren zum erstellen eines hierarchischen biologischen modells
DE102009032649B4 (de) Massenspektrometrische Identifizierung von Mikroben nach Unterarten
DE60015074T2 (de) Verfahren und vorrichtung zur beobachtung der therapieeffektivität
EP1934895A2 (de) Verfahren zum rechnergestützten lernen eines neuronalen netzes und neuronales netz
DE112012001902T5 (de) Vorrichtung, System und Verfahren zur Beurteilung der Wirksamkeit von Arzneistoffen anhand holistischer Analyse und Visualisierung von pharmakologischen Daten
DE10159262B4 (de) Identifizieren pharmazeutischer Targets
DE102005030136B4 (de) Verfahren zur rechnergestützten Simulation von biologischen RNA-Interferenz-Experimenten
WO2005003368A2 (de) Verfahren, computerprogramm mit programmcode-mitteln und computerprogramm-produkt zur analyse eines regulatorischen genetischen netzwerks einer zelle
DE102006033267B4 (de) Verfahren zur rechnergestützten Ermittlung von quantitativen Vorhersagen aus qualitativen Informationen mit Hilfe von Bayesianischen Netzwerken
DE102004030296B4 (de) Verfahren zur Analyse eines regulatorischen genetischen Netzwerks einer Zelle
DE102005028975B4 (de) Verfahren zur Ermittlung eines Biomarkers zur Kennzeichnung eines spezifischen biologischen Zustands eines Organismus aus mindestens einem Datensatz
DE102018117395B4 (de) Verfahren zur Einrichtung einer Apparatur für biologische Prozesse und Apparatur für biologische Prozesse
Arnau et al. Short time series analysis: C statistic vs Edgington model
WO2022069162A1 (de) Bestimmen von vergleichspatienten basierend auf ontologien
DE102007039917A1 (de) Verfahren zur rechnergestützten Analyse eines Interaktionsnetzwerks von biomedizinischen Entitäten
DE102007022170A1 (de) Verfahren zur rechnergestützten Verarbeitung von biomedizinischen Daten
Salinas Ruíz et al. Covariance Analysis
DE10358332A1 (de) Verfahren, Computerprogramm mit Progammcode-Mitteln und Computerprogramm-Produkt zur Analyse eines regulatorischen genetischen Netzwerks einer Zelle
EP1527406A2 (de) Verfahren und anordnung sowie computerprogramm mit programmcode-mitteln und computerprogramm-produkt zur analyse von neuronalen aktivit ten in neuronalen arealen
Stonkute Deep learning as an alternative to global optimization in diffusion model for conflict tasks
EP4420085A1 (de) Computer-implementiertes verfahren zur erzeugung synthetischer bilder zum trainieren künstlicher intelligenz (ai)
DE102021205097A1 (de) Computerimplementiertes Verfahren und System zur Bestimmung einer Kostenfunktion
Fröhlich Same, same but different: Cognitive and neural mechanisms underlying basic subprocesses of reading in younger and older adults
WO2010060746A2 (de) Verfahren und vorrichtung zur automatischen analyse von modellen

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee