DE102006031979A1

DE102006031979A1 - Verfahren zur Bestimmung des Verhaltens eines biologischen Systems nach einer reversiblen Störung

Info

Publication number: DE102006031979A1
Application number: DE102006031979A
Authority: DE
Inventors: Andreas Dr. Schuppert; Heidrun Dr. Ellinger-Ziegelbauer; Hans-Jürgen Dr. Ahr
Original assignee: Bayer Technology Services GmbH
Current assignee: Bayer AG
Priority date: 2006-07-11
Filing date: 2006-07-11
Publication date: 2008-01-17
Also published as: US20090326897A1; EP2041682A1; WO2008006469A1

Abstract

Die Erfindung betrifft ein Verfahren zur Bestimmung des Verhaltens wenigstens eines biologischen Systems nach einer reversiblen Störung, umfassend die folgenden Schritte: (a) Bereitstellen wenigstens eines biologischen Systems, wobei das biologische System ein biologisches Netzwerk, umfassend eine Vielzahl von biologischen oder biochemischen Komponenten, die eine Aktivität aufweisen, umfasst; (b) Bereitstellen eines linearen Modells zur Beschreibung des Verhaltens des Netzwerks des biologischen Systems; (c) Bestimmen der Aktivität der biologischen oder biochemischen Komponenten des biologischen Netzwerks; (d) reversibles Stören der Aktivität wenigstens einer der biologischen oder biochemischen Komponenten, wobei eine Reaktion des biologischen Netzwerks erzeugt wird, die durch die Änderung der Aktivität wenigstens einer oder mehrerer der biologischen oder biochemischen Komponenten ausgebildet wird; (e) Bestimmen der Aktivität der biologischen oder biochemischen Komponenten des biologischen Netzwerks nach Ausüben der reversiblen Störung, sobald die Komponenten des Netzwerks die Reaktion auf die Störung vollzogen haben; (f) Bestimmen der Änderung der Aktivität wenigstens einer biologischen oder biochemischen Komponente des biologischen Netzwerks als Reaktion auf die reversible Störung; (g) Berechnen des Verhaltens des biologischen Netzwerks anhand des bereitgestellen linearen Modells zur Beschreibung ...

Description

Die Erfindung betrifft ein Verfahren zur Bestimmung des Verhaltens wenigstens eines biologischen Systems nach einer reversiblen Störung.
Eukariotische wie auch prokariotische Zellen, die einem externen Stress ausgesetzt sind, zeigen signifikante Änderungen der Expression mehr oder weniger großer Gruppen von Genen, wobei bis zu 30 % aller Gene beeinflusst sein können. Hieraus lässt sich ableiten, dass eine Änderung der Genexpression als Antwort auf einen Stress weder ein lokales Phänomen in einem Netzwerk einander regulierender Gene darstellt, noch dass die Stressantwort auf isolierte Gene, Moleküle oder Signalwege beschränkt ist, selbst wenn die kausale Wirkungsweise des Stresses direkt lediglich wenige Gene betreffen mag. Zwischen verschiedenen Signalwegen besteht offensichtlich eine gegenseitige Beeinflussung und ein hoher Informationsaustausch, der es einer Zelle erlaubt, die zelluläre Stressantwort von ihrer lokalen Wirkung auf große Teile der Genexpression auszudehnen.
Die allgemeine Wirkung auf einen toxischen Stress auf Proteinebene wurde beispielsweise für Protein-Proteinwechselwirkung Netzwerk in S. cerevisae und E. coli-Bakterien untersucht, wobei gezeigt werden konnte, dass ein toxischer Stress eine Stressantwort großer Gruppen von Proteinen hervorruft.
Es wird angenommen, dass die Organisationsstruktur der Stressantwort in Form sehr komplex wechselwirkender Hierarchien zu beschreiben ist, die ihrerseits auf lokalen Wechselwirkungen im Gesamtnetzwerk beruhen, die als biologische Signalwege und umfassende funktionelle Module interpretiert werden können. Die biologische Regulation eines Stresses kann somit umfassende Auswirkungen auf die Aktivität zellulärer Netzwerke haben und einen Austausch zwischen verschiedenen Signalwegen und funktionellen Einheiten beinhalten.
Eine globale Modulation der Genexpression legt nahe, dass ein ganzheitlicher Ansatz auf der Basis von generischen Eigenschaften von großräumigen Mechanismen der Stressantwort in Netzwerken geeignet sein könnte, eine solche Stressantwort zu beschreiben.
Im Stand der Technik sind Verfahren zur Bestimmung einer solchen Stressantwort bekannt. Beispielsweise offenbart die Schrift WO 03/077062 sowie in "Gardner et al., Science, Vol. 301 (5629), S. 102-5 (4. Juli 2003)" ein Modell zur Beschreibung einer stressinduzierten Änderung der Genexpression unter Verwendung einer Gruppe von Differenzialgleichungen, die die Aktivität der einzelnen Elemente des Netzwerks durch Variablen wiedergeben. Nachteilig bei diesem Modell ist jedoch, dass die die Gleichungen quantifizierende Matrix, die die Interaktionen der einzelnen Elemente beschreibt, explizit berechnet werden muss. Voraussetzung für die explizite Berechnung der Interaktion der einzelnen Elemente ist, dass die Interaktion der einzelnen Elemente bekannt ist. Dies ist beispielsweise für Gene in den wenigstens Fällen ausreichend bekannt. Dann beinhaltet eine solche Berechnung, dass experimentell über exakt definierte Störungen die Wechselwirkung der einzelnen Komponenten ermittelt werden muss. Für eine größere Anzahl an Elementen ist eine explizite Berechnung mit diesem Model somit nicht möglich und das beschreibbare Netzwerk ist auf eine sehr geringe Zahl an Elementen und deren Wechselwirkungen beschränkt.
Der Erfindung lag entsprechend die Aufgabe zugrunde, ein Modell zur Beschreibung von Änderungen der Genexpression als Antwort auf einen externen Stress zur Verfügung zu stellen, das die vorgenannten Nachteile des Standes der Technik überwindet. Insbesondere war die Aufgabe der vorliegenden Erfindung ein Verfahren zur Verfügung zu stellen, das eine Bestimmung einer Stressantwort in Netzwerken ermöglicht, ohne dass die explizite Wechselwirkung der Elemente bekannt sein muss.
Erfindungsgemäß wird die Aufgabe dadurch gelöst, dass ein Verfahren zur Bestimmung des Verhaltens wenigstens eines biologischen Systems nach einer reversiblen Störung zur Verfügung gestellt wird, das die folgenden Schritte umfasst:

(a) Bereitstellen wenigstens eines biologischen Systems, wobei das biologische System ein biologisches Netzwerk umfassend eine Vielzahl von biologischen oder biochemischen Komponenten, die eine Aktivität aufweisen, umfasst;
(b) Bereitstellen eines linearen Modells zur Beschreibung des Verhaltens des Netzwerks des biologischen Systems;
(c) Bestimmen der Aktivität der biologischen oder biochemischen Komponenten des biologisches Netzwerks;
(d) reversibles Stören der Aktivität wenigstens einer der biologischen oder biochemischen Komponenten, wobei eine Reaktion des biologisches Netzwerks erzeugt wird, die durch die Änderung der Aktivität wenigstens einer oder mehrerer der biologischen oder biochemischen Komponenten ausgebildet wird;
(e) Bestimmen der Aktivität der biologischen oder biochemischen Komponenten des biologisches Netzwerks nach Ausüben der reversiblen Störung, sobald die Komponenten des Netzwerks die Reaktion auf die Störung vollzogen haben;
(f) Bestimmen der Änderung der Aktivität wenigstens einer biologischen oder biochemischen Komponente des biologischen Netzwerks als Reaktion auf die reversible Störung;
(g) Berechnen des Verhaltens des biologischen Netzwerks anhand des bereitgestellten linearen Modells zur Beschreibung des Verhaltens des biologischen Netzwerks und der in Schritt (f) bestimmten Änderung der Aktivität der biologischen oder biochemischen Komponenten) des biologischen Netzwerks nach der reversiblen Störung, unter Berücksichtigung der Biodiversität der Reaktion der biologischen oder biochemischen Komponente(n); und
(h) optional Vergleichen zwischen der gemäß Schritt (f) bestimmten Änderung der Aktivität der einzelnen Komponenten und dem gemäß Schritt (g) berechneten Verhalten des biologischen Netzwerks anhand des bereitgestellten linearen Modells, wobei man erwartet, dass eine Übereinstimmung des berechneten Verhaltens mit den in Schritt (f) bestimmten Änderung der Aktivität der biologischen oder biochemischen Komponente(n) besteht.

Weitere Gegenstände der vorliegenden Erfindung betreffen ein Computerprogrammprodukt, ein Computerprogramm und ein Computersystem zur Ausführung eines oder mehrerer Schritte des erfindungsgemäßen Verfahrens.
Weitere vorteilhafte Ausgestaltungen der Erfindung ergeben sich aus den Unteransprüchen.
Unter dem Begriff "biologisches System" wird im Sinne der vorliegenden Erfindung eine Zelle oder eine Zellpopulation, beispielsweise ein Gewebe oder ein Organ, wie die Leber, oder ein multizellulärer Organismen, insbesondere ein Säugetier wie Maus oder Ratte, verstanden. In bevorzugten Ausführungsformen ist das biologische System ausgewählt aus der Gruppe umfassend Zelle(n), Gewebe, Organ(e) und/oder Organismen.
Ein biologisches System enthält eine Vielzahl von biologischen oder biochemischen Komponenten. Unter dem Begriff "biologische Komponente" werden im Sinne der vorliegenden Erfindung biologische zelluläre Bestandteile verschiedener Art verstanden, beispielsweise Gene, die miteinander in Verbindung stehen und/oder einander beeinflussen können. Es versteht sich, dass die Art der biologischen Komponente abhängt von der Art des betrachteten biologischen Systems. Ist das betrachtete biologische System eine Zelle, so sind die biologischen Komponenten ausgewählt aus der Gruppe zelluläre Bestandteile, insbesondere Gene. Ist das betrachtete biologische System eine Zellpopulation wie Gewebe oder Organ, so können die biologischen Komponenten Gene wie auch einzelne Zellen sein.
Unter dem Begriff "biochemische Komponente" werden im Sinne der vorliegenden Erfindung biochemische zelluläre Bestandteile verschiedener Art verstanden, beispielsweise Moleküle, die mit einander in Verbindung stehen und/oder einander beeinflussen können. In bevorzugten Ausführungsformen ist die biochemische Komponente ausgewählt aus der Gruppe umfassend in der Zelle oder Zellpopulationen enthaltenen Molekülen wie Desoxyribonukleinsäure (DNA, DNS), Ribonukleinsäure (RNA, RNS), Proteine und/oder Metabolite.
Unter dem Begriff "Aktivität" wird im Sinne der vorliegenden Erfindung verstanden, dass eine biologische oder biochemische Komponente eine Eigenschaft oder Funktion aufweist. Beispielsweise werden Gene oder Proteine entweder exprimiert oder nicht exprimiert oder weisen eine Expressionsrate auf, die beispielsweise als Gehalt an RNA oder Genprodukt bestimmbar ist. Weiterhin können Gene oder Proteine in bestimmter Menge oder Konzentration vorliegen, Funktionen ausüben, beispielsweise katalytische Wirkungen, die durch chemische Modifizierung des Gens oder Proteins variiert werden kann. Einer Aktivität oder dem Zustand einer Aktivität kann die Menge, Konzentration, Expressionsrate oder katalytische Funktion entsprechen. Eine chemische Modifizierung oder Funktionalisierung einer Komponente, beispielsweise eines Gens oder Proteins, kann einem Aktivitätszustand entsprechend, es kann im Rahmen der Erfindung jedoch auch vorgesehen sein, dass eine chemische Modifizierung oder Funktionalisierung zwei verschiedene biologische oder biochemische Komponenten definieren kann.
Unter dem Begriff "biologisches Netzwerk" wird im Sinne der vorliegenden Erfindung eine Gruppe oder Vielzahl von biologischen oder biochemischen Komponenten verstanden, die einander beeinflussen und/oder Auswirkungen auf die Aktivität anderer Komponenten haben können. Ein biologisches Netzwerk enthält vorzugsweise biologische oder biochemische Komponenten einer Art, es kann jedoch auch vorgesehen sein, dass ein biologisches Netzwerk biologische und/oder biochemische Komponenten verschiedener Art enthalten kann, die einander beeinflussen können. Beispielsweise kann ein biologisches Netzwerk Gene, RNA-Moleküle, Proteine und/oder Metaboliten aufweisen, die einander gegenseitig in ihrer jeweiligen Aktivität beeinflussen können.
Unter dem Begriff "reversible Störung" wird im Sinne der vorliegenden Erfindung verstanden, dass die biologischen oder biochemischen Komponenten, das biologische Netzwerk und/oder das biologische System beeinflusst werden, wobei eine Störung insbesondere ein Stress sein kann, der auf das System wirkt. Insbesondere kann der Stress ein externer Stress sein, der von außen auf das System wirkt. Vorzugsweise ist ein Stress ausgewählt aus der Gruppe umfassend toxischer Stresse, bevorzugt Stress durch nicht-genotoxische oder genotoxische Hepatokarzinogene, Stress durch Applikation eines pharmazeutischen Wirkstoffs, Wärmestress oder Hunger. Ein Stress, der eine Störung des Systems verursacht, kann ebenfalls ein Wirkstoff und/oder ein Medikament sein, das dem System beigebracht wird. Eine Störung oder Stress ist dann reversibel, wenn das System nach Entfernen der Störung oder des Stresses in seinen Ausgangszustand zurückkehrt.
Eine Störung ruft im Sinne der Erfindung eine "Reaktion" der biologischen oder biochemischen Komponenten hervor. Unter dem Begriff "Reaktion" wird im Sinne der vorliegenden Erfindung verstanden, dass die Aktivität wenigstens einer der biologischen oder biochemischen Komponenten durch die Störung verändert wird. Beispielsweise kann durch eine Störung die Aktivität wenigstens einer biologischen oder biochemischen Komponenten geändert werden. Diese Änderung der wenigstens einen biologischen oder biochemischen Komponente kann wiederum die Aktivität wenigstens einer weiteren biologischen oder biochemischen Komponente beeinflussen. Eine Störung kann durch direkte oder indirekte Beeinflussung der biologischen oder biochemischen Komponenten eines biologischen Systems eine Reaktion einer, mehrerer oder einer Vielzahl der biologischen oder biochemischen Komponenten hervorrufen. Diese Reaktion der Komponenten bildet die Reaktion des Netzwerks, die entsprechend durch die Reaktion wenigstens einer, mehrerer oder vieler der biologischen oder biochemischen Komponenten ausgebildet wird.
Beispielsweise kann ein Wirkstoff nur die Aktivität eines Proteins beeinflussen oder die Konzentration eines Metaboliten erhöhen. Ein toxischer Stress kann beispielsweise viele verschiedene Gene direkt und indirekt in ihrer Aktivität beeinflussen und eine großräumige Stressantwort hervorrufen.
Unter dem Begriff "Verhalten des biologischen Netzwerks" wird im Sinne der vorliegenden Erfindung verstanden, dass das biologische Netzwerk auf die Änderung der Aktivität wenigstens einer der biologischen oder biochemischen Komponenten reagiert, indem die gegenseitige Beeinflussung der Komponenten Auswirkungen auf die Aktivität anderer Komponenten hat und das Netzwerk durch die Reaktionen der einzelnen Komponenten insgesamt seine Aktivität ändert. Beispielsweise kann ein Gen als Reaktion auf einen Stress seine Expression ändern, wobei die Expressionsänderung dieses Gens die Expression eines oder mehrerer anderer Gene beeinflusst, die untereinander oder bei weiteren Gene ebenfalls Expressionsänderungen bewirken können. Als Folge davon wird das Netzwerk miteinander korrespondierender Gene insgesamt eine Änderung bzw. Verschiebung der Expression erfahren.
Unter dem Begriff "Rauschen" wird im Sinne der vorliegenden Erfindung verstanden, dass die Reaktion der biologischen oder biochemischen Komponenten auf eine identische externe Störung oder Stress nicht identisch sein muss, sondern insbesondere bei biologischen Systemen eine Variation aufweist. Diese Variation kann beispielsweise graduelle Unterschiede in der Änderung der Expression eines Gens oder Proteins auf einen identischen Stressfaktor unter identischen Bedingungen hervorrufen. Diese Variation oder "Rauschen" der Reaktion der biologischen oder biochemischen Komponenten weist einen Rauschanteil, der auf Messrauschen und Messfehlern beruht, wie sie bei Experimenten regelmäßig auftreten, und einen biologischen Anteil auf, der im Sinne der vorliegenden Erfindung als "Biodiversität" bezeichnet wird. Ein Rauschen kann insbesondere eine Fluktuationen der Gen- oder Proteinexpression sein. Das "Rauschen" der Gen- und Proteinexpression aufgrund von Biodiversität ist beispielsweise beschrieben in Bar-Even el al., Nature Genetics, Vol. 38, Nr. 6, S. 636-643, 2006, auf die Bezug genommen wird.
Unter dem Begriff "Biodiversität" wird im Sinne der vorliegenden Erfindung eine biologische Variation verstanden. Biodiversität kann biologische Variationen ausgewählt aus der Gruppe umfassend natürliche Variation einer Aktivität einer Komponente oder eines Netzwerks, eine natürliche Variation eines biologischen Systems und/oder eine Variation der biologischen Reaktionen eines Systems auf Umgebungsfaktoren sein. Beispielsweise kann der Begriff "Biodiversität" in dem biologischen System einer Zelle oder eines Gewebes umfassend ein Netzwerk aus vielen einzelnen Genen eine natürliche Variation der Genexpression eines einzelnen Gens, mehrerer Gene und/oder eines Netzwerks von Genen, oder eine natürliche Variation der Proteinexpression eines einzelnen Proteins, mehrerer Proteine und/oder eines Netzwerks von Proteinen in einem Proteinnetzwerk umfassen. Weiterhin kann eine "Biodiversität" bei einem Vergleich verschiedener biologischer Systeme, beispielsweise verschiedener Organismen einer Spezies, Variationen ausgewählt aus der Gruppe umfassend eine Variation des Genotyps, eine Variation einzelner Organe und/oder eine unterschiedliche Reaktion des Organismus auf äußere Einflüsse wie Ernährung umfassen. Es versteht sich, dass die Biodiversität die Aktivität oder Reaktionen der Komponenten, Netzwerke und/oder Systeme einander beeinflusst, so dass die Biodiversität der Reaktion der Komponenten auf eine Störung sowohl auf der natürlichen Variation der Aktivität der Komponenten beruhen kann wie auch eine natürlichen Variation eines biologischen Systems und/oder einer Variation der biologischen Reaktionen eines Systems auf Umgebungsfaktoren umfassen kann.
Der Begriff "Biomarker" wird als indirektes Beobachtungsverfahren für eine große Zahl intra- and extrazellulärer Ereignisse wie auch physiologische Änderungen eines Organismus verwendet, die nicht oder nur mit großem Aufwand direkt beobachtet werden können. Hierzu kann beispielsweise des Gehalts oder der Produktionsrate von Signalmolekülen, Transkriptionsfaktoren, Metaboliten, Gentranskripten oder Modifikationen von Proteinen nach der Translation, oder auch der physiologische Zustand eines biologischen Systems gehören. Unter dem Begriff "Biomarker" wird im Sinne der vorliegenden Erfindung insbesondere eine Kombination aus einem Gen, oder Genprodukt, ein Protein, oder eine Gruppe von Genen, Genprodukten oder Proteinen verstanden, das nach einer Störung verglichen mit der Aktivität vor der Störung auf- oder abreguliert wird, und ein entsprechendes Berechnungsverfahren zur Berechnung nicht direkt beobachtbarer Größen. Für einen Biomarker ist insbesondere eine biologische oder biochemische Komponente oder eine Gruppe davon, ein Gen oder eine Gruppe von Genen, das ausreichend spezifisch auf eine spezielle Störung reagiert wesentlich, so dass es allein oder in Kombination mit anderen Genen oder Genprodukten verwendbar ist, eine Klassifizierung von Störungen in Klassen, beispielsweise in Toxizitätsklassen, zu erlauben. Insbesondere ist ein Biomarker eine Kombination aus einer biologische oder biochemische Komponente oder eine Gruppe davon, ein Gen, eine Gruppe von Genen oder ein Genprodukt, die charakteristisch für eine Reaktion eines biologischen Systems auf eine bestimmte Störung ist, und einem zugehörigen Berechnungsverfahren.
Die Störung des Grundzustands der Aktivität bildet die Basis von Krankheiten, die mit einer Reaktion der Komponenten bzw. des Systems auf die Störung verbunden sind. Die vorliegende Erfindung beruht insbesondere auf der Hypothese, dass Störungen an beispielsweise toxischen Phänomenen beteiligt sein können und dass Biomarker d.h. eine oder mehrere Komponenten, die eine für die Reaktion des Systems charakteristische Aktivitätsänderung zeigen, wirksame Marker der Toxizität bilden könnten.
Ein Vorteil der vorliegenden Erfindung ist, dass dadurch, dass die Berechnung innerhalb des bereitgestellten linearen Modells zur Beschreibung des Verhaltens eines biologischen Netzwerks unter Berücksichtigung der Biodiversität der Reaktion der biologischen oder biochemischen Komponenten erfolgt, das Verhalten des biologischen Netzwerks berechenbar ist, ohne dass die Wechselwirkung aller Komponenten explizit berechnet werden muss. Von besonderem Vorteil ist hierbei, dass das Verhalten des Netzwerks aus bestimmbaren oder messbaren Daten der Einzelreaktionen der Komponenten rekonstruierbar ist. Vorteilhafter Weise kann die Berechnung des Verhaltens des Netzwerks auf die Reaktionen der Komponenten auf die Störung und somit beobachtbare Größen zurückgeführt werden.
Insbesondere ist von großem Vorteil, dass es aufgrund der Berücksichtigung der Biodiversität erzeugten Variation der Reaktion der biologischen oder biochemischen Komponenten in dem Verfügung gestellten linearen Modell ermöglicht wird, das Verhalten des Netzwerks ohne systematische Experimente zu bestimmen.
Biologische Netzwerke können mathematisch dargestellt werden. Das im Rahmen des erfindungsgemäßen Verfahrens zur Verfügung gestellte lineare Modell zur Beschreibung des Verhaltens des biologischen Netzwerks umfasst eine mathematische Beschreibung der Reaktion biologischer oder biochemischer Komponenten eines Netzwerks auf eine reversible Störung. Eine reversible Störung, bei der das System wieder in seinen Ausgangszustand zurückkehrt, wenn der Stress entfernt wird, stört die Aktivität der Komponenten und führt zu einer Aktivitätsänderung der durch die Störung betroffenen Komponenten. Eine solche Änderung der Aktivität einer Komponente kann ihrerseits Auswirkung auf die Aktivität weiterer biologischer oder biochemischer Komponenten zeigen. Biologische und/oder biochemische Komponenten, die Komponenten eines biolo gischen Netzwerks sind, können miteinander Wechselwirken und einander in ihrer Aktivität regulieren. Die Regulation kann positiv oder negativ sein, beispielsweise eine Hoch- oder Runterregulation der Genexpression für den Fall, dass die Komponenten Gene sind oder eine Hoch- oder Runterregulation der Proteinexpression für den Fall, dass die Komponenten Proteine sind. Ein reversibles Stören der Aktivität wenigstens einer biologischen oder biochemischen Komponente erzeugt somit eine Reaktion der Komponenten des biologischen Netzwerks, die insgesamt die Reaktion des gesamten Netzwerks der Komponenten ausbilden.
Die Wechselwirkung oder Interaktion der einzelnen Komponenten in einem Netzwerk miteinander ist nicht zwangsläufig homogen. Einwertige Parameter können die Wechselwirkung der Komponenten daher nicht beschreiben und ein generischer Formalismus zur Berechnung des Verhaltens eines biologischen Netzwerks ist im Sinne dieser Erfindung vorzugsweise geeignet.
Eine bevorzugte generische Beschreibung kann das bereitgestellte lineare Modell zur Beschreibung des Verhaltens des biologischen Netzwerks gemäß der nachstehenden Gleichung (I) zur Verfügung stellen: x = A u (I)worin:

x: [x₁ .... x_n]: ein Vektor ist, der die Bestimmung der Änderung der Aktivität wenigstens einer biologischen oder biochemischen Komponente des biologischen Netzwerks als Reaktion auf die reversible Störung umfasst,
u:[u₁ .... u_n]: ist ein Vektor, der die Störung beschreibt,
A:: ist eine Matrix, die die Parameter enthält, die die Reaktion der Komponenten auf die Störung beschreiben,
n: ist die Anzahl der Komponenten.

Vorzugsweise beschreibt man die Matrix durch eine symmetrische n×n-Matrix, wobei n der Anzahl der Komponenten entspricht. Diese enthält die Bestandteile a_ij, die quantitativ die Reaktion einer Komponente i auf einen Stress u_j beschreiben, der auf die Komponente j wirkt. Die Matrix A gibt also sowohl die Reaktion der Komponenten des Netzwerks auf die reversible Störung wieder als auch die Verteilung der Reaktion auf eine lokale Störung oder einen lokalen Stress, der nur auf nur wenige Komponenten wirkt, auf das ganze Netzwerk.
Der Vektor x, der die Änderung der Aktivität der einzelnen Komponenten angibt, gibt geeigneterweise Daten oder Messwerte wieder, die die Änderung der Aktivität der Komponenten nach einer reversiblen Störung beschreiben, nachdem die Komponenten des Netzwerks auf die Störung reagiert haben.
Die Komponenten reagieren abhängig von der Art der Komponente, beispielsweise Gene und/oder Proteine, und von der ausgeübten reversiblen Störung innerhalb unterschiedlicher Zeiträume auf die Störung mit einer Änderung ihrer Aktivität, wobei die Zeiträume einer reversiblen Reaktion der Komponenten können hierbei im Bereich von Minuten, Stunden oder Tagen liegen können. Diese Zeiträume sind dem Fachmann bekannt und/oder bestimmbar. Vorzugsweise sind im Schritt (f) schnelle Reaktionen der Komponenten bestimmbar, beispielsweise Änderungen der Genexpression, die vorzugsweise im Bereich von 0,5 Stunden bis 24 Stunden nach dem Ausüben einer reversiblen Störung auftreten.
Die Größe der Matrix A hängt ab von der Anzahl an biologischen oder biochemischen Komponenten des Netzwerks. Diese Zahl kann in biologischen Netzwerken und/oder Systeme in weiten Bereichen variieren. Ist das biologische System beispielsweise eine Zelle und die Komponenten sind Gene, können mehrere tausend Gene in einem Netzwerk enthalten sein. Die Größe eines solchen Netzwerks kann ebenfalls abhängig sein von der Störung, die auf das System einwirkt. Ist eine solche Störung beispielsweise ein toxischer Stress, können mehrere tausend Gene durch einen solchen Stress betroffen sein.
Anzahl der Komponenten n kann im Bereich von ≥ 1 Komponente bis ≥ 25.000 Komponenten, vorzugsweise im Bereich von ≥ 1 Komponente bis ≤ 15.000 Komponenten, bevorzugt im Bereich von ≥ 1 Komponente bis ≤ 5000 Komponenten, besonders bevorzugt im Bereich von ≥ 2 Komponenten bis ≤ 1000 Komponenten, weiter vorzugsweise im Bereich von ≥ 5 Komponenten bis ≤ 400 Komponenten, noch vorzugsweise im Bereich von ≥ 5 Komponenten bis ≤ 200 Komponenten liegen.
In bevorzugten Ausführungsformen des erfindungsgemäßen Verfahrens werden die Eigenschaften der Matrix A aus der bestimmbaren Änderung der Aktivität der biologischen oder biochemischen Komponenten des biologischen Netzwerks nach der reversiblen Störung unter Berücksichtigung der Biodiversität der Reaktion der Komponenten beschrieben. Eine solche Berechnung erfolgt vorzugsweise dadurch, dass der Vektor u, der die Störung beschreibt, die auf die Komponenten wirkt, einen Rauschanteil aufweist, der das Messrauschen wiedergibt, das beispielsweise durch Messungenauigkeiten und/oder Messfehler verursacht werden kann, und einen Rauschanteil, der das Rauschen aufgrund der Biodiversität der Reaktion der Komponenten wiedergibt, wobei die Biodiversität dieser Reaktion die biologische Variation der Reaktion der Komponenten wiedergibt.
Das bereitgestellte lineare Modell zur Beschreibung des Verhaltens des Netzwerks umfassend die Matrix A ist eine lineare Näherung eines nicht linearen Systems. Eine solche lineare Näherung des Verhaltens des Netzwerks ist einem grundsätzlich nicht linearen System dann äquivalent, wenn sich das System in oder nahe einem stationären Zustand befindet. Ist das biologische System beispielsweise eine Zelle, eine Zellkultur oder ein Organismus, beispielsweise eine Ratte, bedeutet dies, dass Zellen oder Organismen vorzugsweise in einer konstanten Umgebung zu halten sind.
Im Rahmen dieses erfindungsgemäßen Verfahrens wird weiterhin eine reversible Störung bevorzugt ein reversibler Stress auf das System ausgeübt, wobei das System nach Entfernen der Störung oder des Stresses in den Ausgangszustand zurückkehrt. Eine solche reversible Störung erlaubt entsprechend die Anwendung eines linearen Modells zur Beschreibung des Verhaltens des Netzwerks. Die Rückkehr des Systems in den Ausgangszustand umfasst regelmäßig ein sogenanntes Rauschen, das im Sinne der vorliegenden Erfindung so verstanden wird, dass die Reaktion der biologischen oder biochemischen Komponenten auf eine identische Störung oder Stress nicht identisch sein muss, sondern eine Variation aufweist. Diese Variation bedingt, dass die Komponenten den Ausgangszustand erreichen können oder sich dem Ausgangszustand nähern können, wobei der Zustand den das System bzw. die einzelne Komponente nach der Störung einnimmt, ihrem Ausgangszustand entspricht, der durch das Rauschen überlagert ist.
Dieses Rauschen oder Variationen der Reaktion der biologischen oder biochemischen Komponenten und/oder des biologischen Systems lässt sich in einen Rauschanteil unterteilen, der auf Messrauschen und/oder Messfehlern beruht und einen biologischen Rauschanteil, der auf der biologischen Variation der Komponenten und/oder des Systems beruht und im Sinne der vorliegenden Erfindung als Biodiversität bezeichnet wird.
Ist die Komponente beispielsweise ein Gen und das biologische System ein Gewebe oder eine Zelle, dem ein Stress zugefügt wird, führt das Rauschen dazu, dass die Expression eines Gens, nachdem sie sich als Reaktion auf die reversible Störung geändert hat, nach Ende der Störung ihren Ausgangswert nicht exakt wieder einnehmen muss, sondern um den Ausgangswert variieren kann. Auch bei einer oder mehreren Wiederholungen beispielsweise in wenigstens einem identischen System und/oder mit wenigstens einer identischen Störung oder Stress, wird die Komponente bzw. das System nach einer reversiblen Störung in den Ausgangszustand zurückkehren bzw. einen Zustand einnehmen, der eine Variation oder Streuung um den Ausgangszustand aufweist.
Es wird für die Anwendung des Modells zur Voraussage des Verhaltens des Netzwerks vorausgesetzt, dass sich das System sich in einem stationären Zustand oder "steady state" befindet. Das Ausüben einer reversiblen Störung oder eines reversiblen Stresses führt dazu, dass das System nach Entfernen der Störung oder des Stresses in diesen stationären Ausgangszustand bis auf Abweichungen, erzeugt durch die Biodiversität, zurückkehrt.
Gemäß dem erfindungsgemäßen Verfahren bestimmt man in Schritt (c) die Aktivität der biologischen oder biochemischen Komponenten des biologisches Netzwerks im Ausgangszustand, stört gemäß Schritt (d) reversible die Aktivität wenigstens einer der biologischen oder biochemischen Komponenten, wobei eine Reaktion des biologisches Netzwerks erzeugt wird, die durch die Änderung der Aktivität wenigstens einer oder mehrerer der biologischen oder biochemischen Komponenten ausgebildet wird, und bestimmt gemäß Schritt (e) die Aktivität der biologischen oder biochemischen Komponenten des biologisches Netzwerks nach Ausüben der reversiblen Störung, sobald die Komponenten des Netzwerks die Reaktion auf die Störung vollzogen haben.
Vorteilhafter Weise ist eine Wiederholung des erfindungsgemäßen Verfahrens zur Voraussage des Verhaltens des Netzwerks nicht notwendig. Somit liegt ein besonderer Vorteil des Verfahrens darin, dass eine Berechnung ermöglicht wird, durch eine Messung nach einer Störung in einem System und der Ausgangszustand bekannt ist oder bestimmt wird.
Unter der Berücksichtigung der Biodiversität der Reaktion der biologischen oder biochemischen Komponenten weist der Vektor u, der die auf jede Komponente wirkende Störung beschreibt, einen Anteil auf, der das Messrauschen wiedergibt und einen Anteil, der die biologische Variation oder Biodiversität wiedergibt. Wird der Anteil des Messrauschens als konstanter Faktor betrachtet, kann die Reaktion auf eine Störung als auf die Biodiversität beschränkt angenommen werden. Weiterhin kann angenommen werden, dass die Biodiversität oder der biologische Anteil des Rauschens eine energetische Gleichverteilung aufweist und in Bezug auf die einzelnen Parameter u₁ bis u_n eine Gleichverteilung aufweist. Die einzelnen Parameter u₁ bis u_n werden auch als Anregungsmoden bezeichnet.
In bevorzugten Ausführungsformen des Verfahrens wird die Matrix durch eine Projektion der Daten der Änderung der bestimmten Aktivität der Komponenten auf ihre Eigenvektoren mit Hilfe der Korrelationskoeffizienten von Komponentenpaaren des biologischen Netzwerks beschrieben.
Die Eigenvektoren der Matrix A beschreiben formal Komponentengruppen des Netzwerks, die sich in ihrer Reaktion auf eine Störung oder Stress kohärent verhalten. Der zugehörige Eigenwert beschreibt die Sensitivität auf eine Störung oder Stress der jeweiligen Komponentengruppe bei kohärentem Reaktionsverhalten.
Die Korrelationskoeffizienten der Komponentenpaare des biologischen Netzwerks sind in Form der Eigenwerte und Eigenvektoren der Matrix A bestimmbar. Die Eigenwerte sind erhältlich aus der Biodiversität der Reaktion der Komponenten unter der Annahme, dass die Biodiversität einem thermischen Rauschen entspricht. Unter dieser Voraussetzung kann das Reaktionsverhalten des Netzwerks respektive die relevanten Eigenvektoren der Matrix A aus eine Analyse des Rauschverhaltens berechnet werden.
Die Matrix A sei vorzugsweise eine elastische Matrix. Hierbei sei {λ_i *} die Menge der Eigenwerte von A und {ϕ_i} seien die entsprechenden othonormierten Eigenvektoren.
Dann kann die Steifigkeit des Netzwerks ausgedrückt werden durch die inversen Eigenwerte: 1/λi* =: λi so dass λ_i die Steifigkeit der Systemantwort in Richtung des i-ten Eigenvektors unter einer Störung oder Stress beschreibt.
Mit Gleichung (I) kann x dargestellt werden durch Projektionen auf die Eigenvektoren von A gemäß Gleichung (S2):
worin <u, φ_k> das Skalarprodukt zwischen zwei Vektoren ist.
Weiterhin sei {ω_k}, eine Störung des Systems mit der Struktur eines weißen Rauschens um den stationären Zustand, worin k der Index der Datensätze ist und die Dimension von (ω_k) = n ist.
Dann sei ohne Beschränkung der Allgemeinheit:
<|ω|> = 1
ω_k und ω_l sind unkorreliert: <<ω_k, ω_l>>_Datensätze = δ_k,l
wobei ω_l die Bedeutung einer Störung des Systems in Richtung des i-ten Eigenvektors hat, wobei die Störungseinflüsse in Richtung der Eigenvektoren des Systems unkorreliert sein sind, so dass der Ausdruck <<ω_k, ω_l>> 0 ist, wenn k ungleich i ist.
Unter diesen Annahmen gehorcht die Auslenkung η_i ^k als Projektion dem Zustand auf den i-ten Eigenvektor von A der durch das Rauschen induzierten Störung von x durch ω_k, entsprechend der mittleren Amplitude der rauschinduzierten Auslenkung des Systems in Richtung des i-ten Eigenvektors, den im folgenden dargestellten Bedingungen.
Entsprechend den Annahmen der Thermodynamik verteilt sich die durch ein weißes Rauschen induzierte Dehnungsenergie in einem elastischen Netzwerk gleichmäßig auf alle Eigenvektoren, so dass für die Erwartungswerte der Momente der Amplituden die folgende Gleichung (S3) gilt:
mit Z als der Zustandssumme gemäß der folgenden Gleichung (S4):
und <|η_i|²>_T als Mittelwert über alle Datensätze erhältlich aus den bereitgestellten Systemen, beispielsweise einer Anzahl bereitgestellter Gewebe.
Aus diesen Gleichungen für die Amplitudenverteilung (S3) kann die Statistik für die rauschinduzierten Auslenkungen ξ_i in den Originalkoordinaten um den stationären Zustand durch Projektion der Amplitudenstatistik auf die Eigenvektoren gemäß der folgenden Gleichung (S5) berechnet werden:
mit ϕ_k ⁱ als der i-ten Komponente des k-ten Eigenvektors. Hier bedeutet <ξ_i, ξ_j>_T wieder den Mittelwert, gebildet über alle Datensätze, erhältlich aus den bereitgestellten Systemen, beispielsweise einer Anzahl bereitgestellter Gewebe.
Man erhält eine Beziehung gemäß der nachstehenden Gleichung (S6): <ξi, ξj>T = |ξi||ξj|corT(ξi, ξj) (S6)mit cor_T(ξ_i, ξ_u) als den Korrelationskoeffizienten von ξ_i und ξ_j auf den Datensätzen für die Komponenten i und j, und |ξi| = (<ξ2i >T)1/2 = σT(ξi) =: σi als Länge des Vektors ξ_i auf dem Datensatz der Komponente i.
Eine Projektion des Stressvektors u = {u₁, ..., u_n} auf die Eigenvektoren von A:
und ein Einsetzen in die Gleichung (S2) und Vertauschen der Summation ergibt für die Auslenkung von x_i, induziert durch eine externe Störung oder Stress die nachstehende Gleichung (S7):
Ein Einsetzen von Gleichung (S5) in Gleichung (S7) und Benutzen der Korrelation der rauschinduzierten Auslenkungen um den stationären Zustand, dargestellt durch Gleichung (S6), führt zu nachstehender Gleichung (S8):
Sei nun formal:
die gewichtete Summe über die ξ_i, wobei die Gewichte u_j die Störungskomponenten der j-ten Komponente des Systems ist. ξ_u ist ein Vektor mit einer Länge die gleich der Anzahl der bereitgestellten Systemen, beispielsweise Gewebeproben, und beschreibt die effektive Störung oder den effektiven Stress auf jedes System, beispielsweise eine Gewebeprobe, und hängt nicht von den Komponenten i ab.
Unter Verwendung von ξ_u wird die Analyse vereinfacht zu nachstehender Gleichung (S9):
Hieraus folgt wegen |ξ_i| = σ_i die folgende Proportionalitätsrelation (S10):
mit dem "effektiven Stressvektor" ξ_u, der unabhängig von den Komponenten i ist und aus den Daten der Aktivität der Komponenten identifiziert werden muss.
Die Proportionalitätskonstante der Gleichung (S10) entsprechend dem Term |u| σ_u der Gleichungen (IV) bis (VI) und ein Wert ξ_u ^j für jeden Datensatz j ist mittels Auflösen eines linearen Gleichungssystems berechenbar.
Die Berechnung kann vorzugsweise im Rahmen einer Parameterschätzung durchgeführt werden. Bestimmbar sind die Daten der Aktivität der Komponenten, beispielsweise die Expressionswerte für alle Gene in dem System, beispielsweise einem Gewebe bzw. einer Probe des untersuchten Gewebes, an den stationären Zuständen. Daher ist die Anzahl der verfügbaren Datensätze für die Parameterschätzung gleich der Zahl der Komponenten mal der Zahl der Gewebeproben und damit um die Zahl der Gene mal größer als der Mindestbedarf der benötigten Datensätze.
Da die Parameterschätzung letztlich auf Auflösen eines kleinen linearen Gleichungssystems reduziert werden kann, kann vorteilhafter Weise eine deutlich höhere Stabilität als bei einer direkten Schätzung aller Komponenten der Matrix A erwartet werden.
Die Änderung der Aktivität einer Komponente i kann in Form der Korrelationskoeffizienten von Komponentenpaaren und der jeweiligen Standardabweichung gemäß der folgenden Gleichung (II) ausgedrückt werden.
worin:

x_i:: ist die Verschiebung der Aktivität der i-ten Komponente als Reaktion auf die Störung,
σ_i:: ist die Standardabweichung der Komponente i in einem "stratifizierten" System,
cor(ξ_i, ξ_j):: ist der lineare Korrelationskoeffizient zwischen den Änderungen der Aktivität der Komponenten i und j in dem stratifizierten System,
u_j:: ist die Störung, die auf die Komponente j wirkt.

Der Begriff "stratifizieren" hat im Sinne der Berechnungen des erfindungsgemäßen Verfahrens die Bedeutung, dass für jede Komponente der Mittelwert der Aktivität vor und nach der ausgeübten Störung berechnet wird. Danach wird für jede Komponente und jeden Wert der Aktivität der jeweilige Mittelwert subtrahiert. In bevorzugten Ausführungsformen des Verfahrens hat der Begriff "stratifizieren" im Sinne der Berechnungen des erfindungsgemäßen Verfahrens die Bedeutung, dass für jedes bestimmte Gen der Mittelwert der Expression für jeden applizierten pharmazeutischen Wirkstoff, oder gemittelt über eine applizierte Stoffgruppe umfassend mehrere gleichwirkende Wirkstoffe, berechnet. Danach wird für jedes Gen und jeden Expressionswert der jeweilige Mittelwert subtrahiert. Hierdurch wird erreicht, dass nur noch die Schwankungen um den jeweils durch die Mittelwerte beschriebenen stationären Zustand oder Steady state berücksichtigt werden.
Unter Verwendung von |u| = (Σ u_k ²)^1/2, wobei k Koeffizienten für jede Komponente darstellen, die die Wirkung der Störung auf die Komponente darstellen, für die gesamte Störung ist die "effektive" Störung durch die folgende Gleichung (III)
worin:

ξ_u: ist der formale Vektor der Aktivitätsänderung an einer fiktiven Komponente, die den Angriffspunkts der Störung darstellt und über gewichtete Mittelung über die x- Werte der beteiligten Komponenten berechnet wird,
Σ_ju_jξ_j: beschreibt die Berechnung des gewichteten Mittelwerts der Aktivitäten der Komponenten, die durch die Störung oder den Stress direkt beeinflusst werden,
|u|: die Intensität der Störung oder des Stress wiedergibt,

Der Term |u| ist hierbei identisch mit 1/μ in Gleichung (S9) der formalen Herleitung.
In bevorzugten Ausführungsformen des Verfahrens sind die Daten der Aktivitätsänderung an einer fiktiven Komponente, die den Angriffspunkts der Störung darstellt, Expressionswerte für die Genexpression.
Diese Umformulierung der Störung erlaubt die Summe der Einwirkung einer Komponente j auf die durch die Störung verursachte Änderung der Aktivität einer Komponente i durch die nachstehende Gleichung (IV): xi = |u|σiσucor(ξj, ξu) (IV)worin:

x_i:: ist die Verschiebung der Aktivität der i-ten Komponente als Reaktion auf die Störung oder den Stress,
|u|: ist die Intensität der Störung,
σ_u:: ist die Standardabweichung der durch das Rauschen u erzeugten Antwort,
σ_i:: ist die Standardabweichung der Komponente i,
cor(ξ_i, ξ_u):: ist der lineare Korrelationskoeffizient zwischen den Änderungen der Aktivität der Komponenten i und j in dem stratifizierten System,

_u

Äquivalent kann die Gleichung (IV) durch die folgende algebraische Gleichung (V) ausgedrückt werden:
worin:

r:: ist die Steigung.

Die Gleichungen (IV) und (V) beschreiben die Änderung der Aktivität der Komponenten durch eine reversible Störung, wobei die Berechnung erfolgt über die Stärke der Störung |u|, die Standardabweichung σ_i der ξ_i der Komponente i und einen Vektor ξ_u und σ_u, der die effektive Störung auf die Komponenten wiedergibt.
Die Gleichungen (IV) und (V) sind nicht länger abhängig von einer tatsächlichen Komponente i, so dass es für die Berechnung des Verhaltens des biologischen Mehrzwecks ausreichend ist, einen Vektor σ_uξ_u zu bestimmen und eine Zahl für |u| als "effektive Stärke der Störungen" zu bestimmen. Diese Bestimmung ist möglich über die bestimmten Daten der Änderung der Aktivität der Kompo nenten des Netzwerks, wobei |u| für sich genommen nicht messbar ist und die Größe, die in das Modell eingeht, r = |u|σ_u ist, wobei r durch lineare Regression aus Gleichung (V) mit Hilfe der Messdaten bestimmt werden kann.
Somit erlaubt das zur Verfügung gestellte Verfahren das Verhalten eines biologischen Netzwerks auf eine reversible Störung mit Hilfe des bereitgestellten linearen Modells aus den bestimmten Daten der Änderung der Aktivität der Komponenten als Reaktion auf eine reversible Störung zu berechnen.
Der Anstieg r = |u| σ_u stellt ein Maß für die Sensitivität der Änderung der Aktivität der Komponenten zur Verfügung, mit einem Bezug auf den formalen Abstand der Komponente i auf den Ort des Wirkens des Stresses ausgedrückt durch den Korrelationskoeffizienten cor(ξ_i, ξ_u). Unter Voraussetzung eines Netzwerks der Komponenten mit rein linearer Wechselwirkung der Komponenten untereinander und ohne Streuung sollte die Steigung r für alle Komponenten konstant sein.
Aus den Gleichungen (IV) bzw. (V) ergibt sich, dass der Vektor ξ_i für Komponenten mit hohen Werten des Parameters x_i/σ_i zu dem Vektor ξ_u hochkorreliert sein sollte. Der Vektor ξ_u ist die verbleibende, nicht aus der Bestimmung der Aktivitätsänderung der Komponenten messbare Größe. Obwohl ξ_u unbekannt ist ergibt sich, dass der Vektor ξ_i für Gruppen von Komponenten mit ähnlichen Werten von x_i/σ_i in einem "Winkel" um ξ_u orientiert ist, wobei der Kosinus des Kegelwinkels durch den Parameter cor(ξ_i, ξ_u) gegeben ist. Der Parameter ξ_u ist unbekannt, da der Vektor ξ_i der einzelnen Komponenten eine verschiedene Korrelation zu dem Vektor ξ_u aufweist.
Die Bestimmung der Änderung der Aktivität der Komponenten gibt die Änderung der Aktivität für jede Komponente i und somit den Parameter x_i an, sowie die Standardabweichung σ_i der Komponente i.
Die Standardabweichung σ_i wird bei der Erstellung des Modells aus mehreren Messungen bestimmt. Vorzugsweise werden hierzu wenigstens zwei biologische Systeme, vorzugsweise wenigstens drei, bevorzugt wenigstens vier biologische Systeme, vorzugsweise ausgewählt aus der Gruppe umfassend Zelle, Zellkultur, Gewebe, Organ und/oder Organismus bereitgestellt und das Verfahren insbesondere die Schritte (a) bis (g) in den bereitgestellten Systemen durchgeführt. Aus den erhaltenen Messdaten der Änderung der Aktivität der Komponenten, beispielsweise der Änderung der Genexpression, nach der verwendeten reversiblen Störung ist dann die Standardabweichung σ_i für die Komponente i berechenbar.
Von besonderem Vorteil ist hierbei, dass die Standardabweichung σ_i für die Komponente i anhand der verwendeten Störung in einem System bestimmt wird, und nachfolgend bei der Anwendung des Modells für anderer Störungen des Systems verwendbar ist.
Von weiterem Vorteil ist hierbei, dass die einmal bestimmte Standardabweichung σ_i für die Komponente i erlaubt, das erfindungsgemäße Verfahren für eine andere Störung der Komponente i in dem verwendeten System zu verwenden, ohne dass σ_i erneut zu bestimmen ist. Vorteilhafter Weise ist das Verhalten eines Netzwerks umfassend Komponenten bekannter Standardabweichung σ für die Komponenten aus den in Schritten (c) und (e) bestimmten Aktivität der biologischen oder biochemischen Komponenten des biologisches Netzwerks vor und nach Ausüben der reversiblen Störung bestimmbar.
Somit ergibt sich der Vektor ξ_i für alle Komponenten i und die Gleichung (V) erlaubt die Berechnung von σ_u ξ_u. Diese Berechnung kann mittels Optimierungsverfahren durchgeführt werden. Geeignete Optimierungsverfahren sind beispielsweise alle Verfahren der Kombinatorischen Optimierung, beispielsweise ausgewählt aus der Gruppe umfassend Genetische Algorithmen und/oder das Simulierte Ausglühen oder "Simulated Annealing". Geeignete Genetische Algorithmen sind beispielsweise beschrieben in Ingo Rechenberg, Evolutionsstrategie '94, Frommann Holzboog, 1994.
Die Berechnung von ξ_u kann insbesondere unter der Voraussetzung, dass |u| wie auch ξ_u näherungsweise konstant in einem biologischen System sind, berechnet werden.
Die Rekonstruktion von ξ_u aus den Daten der bestimmten Änderung der Aktivität der Komponenten setzt voraus, dass die Gleichung (V) in ein überbestimmtes lineares Gleichungssystem überführt wird.
ξ_u wird vorzugsweise durch kombinatorische Optimierung bestimmt, wobei ein bevorzugter Algorithmus der sogenannte genetische Algorithmus ist. Dieser ist beispielsweise beschrieben in Ingo Rechenberg, Evolutionsstrategie '94, Frommann Holzboog, 1994. Weitere geeignete Optimierungsverfahren, die die Berechnung von ξ_u aus den bestimmten Daten der Änderung der Aktivität der Komponenten erlauben, sind beispielsweise ausgewählt aus der Gruppe umfassend Simulierte Ausglühen oder "Simulated Annealing" genannt und/oder Sintflut-Algorithmus oder "Grand Deluge" genannt.
Vorzugsweise wird ξ_u in Form einer linearen Kombination aus den bestimmten Daten der Änderung der Aktivität der Komponenten für eine gewählte Anzahl Komponenten bestimmt. Die Anzahl der Komponenten, die für eine solche Bestimmung benutzt werden, kann vorzugsweise im Bereich von 1 bis 4.000 Komponenten, bevorzugt im Bereich von 5 bis 100 Komponenten liegen.
Aus der Anzahl Komponenten kann eine geeignete Untergruppe an Komponenten, beispielsweise S_u benannt, beispielsweise mit einer Anzahl Komponenten im Bereich von ≥ 10 Komponenten bis ≤ 4000 Komponenten, vorzugsweise im Bereich von ≥ 20 Komponenten bis ≤ 200 Komponenten verwendet werden, um die statistische Gewichtung w_i für eine lineare Kombination gemäß der folgenden Gleichung (VI):
worin:

ξ_u': ist der optimierte formale Vektor des biologischen Rauschens an einer fiktiven Komponente, die den Angriffspunkts der Störung darstellt,
w_i: ist die statistische Gewichtung der Komponenten,
ξ_i: ist der Vektor der Verschiebung der i-ten Komponente als Reaktion auf das Rauschen um den Mittelwert der Aktivität der Komponente i, beispielsweise der Expression des Gens i, im stratifizierten System,

_i

_u

Unter Verwendung des optimierten ξ_u' ist die Gleichung (V) bzw. (IV) für alle Komponenten berechenbar.
Das erfindungsgemäße Verfahren erlaubt somit das Verhalten eines biologischen Netzwerks zu berechnen anhand von experimentell erhältlichen Daten der Änderung der Aktivität der einzelnen Komponenten des Netzwerks. Von besonderem Vorteil ist hierbei, dass eine solche Berechnung auch bei einer sehr großen Anzahl an Komponenten anhand des bereitgestellten linearen Modells zur Beschreibung des Verhaltens des Netzwerks ermöglicht ist, wobei unter Berücksichtigung der Biodiversität der Reaktion der Komponenten eine Berechnung ermöglicht wird, ohne dass inner halb des bereitgestellten linearen Modells eine Matrix, die die Parameter enthält, die die Reaktion der Komponenten auf eine Störung beschreiben, explizit berechnet werden muss.
In bevorzugten Ausführungsformen des erfindungsgemäßen Verfahrens ist die Biodiversität eine biologische Variation ausgewählt aus der Gruppe umfassend natürliche Variation einer Aktivität einer Komponente oder eines Netzwerks, eine natürliche Variation eines biologischen Systems und/oder eine Variation der biologischen Reaktion eines Systems auf Umgebungsfaktoren, die es erlaubt, das bereitgestellte lineare Modell mit Hilfe der durch die Biodiversität erzeugten Variationen ohne systematische Experimente zu bestimmen.
Dies stellt einen besonderen Vorteil des erfindungsgemäßen Verfahrens zur Verfügung mit dem das Verhalten eines Netzwerks vieler Komponenten beispielsweise einer großen Anzahl von Genen, wie sie beispielsweise als Reaktion auf einen toxischen Stress reguliert werden können, zu bestimmen, ohne dass systematische Experimente durchgeführt werden müssen.
Insbesondere ermöglicht das erfindungsgemäße Verfahren, dass durch Bereitstellen eines biologischen Systems, Ausüben einer Störung auf dieses System, und einer einmaligen Bestimmung der Änderung der Aktivität der Komponenten auf die reversible Störung das Verhalten anhand des bereitgestellten linearen Modells beschrieben werden kann.
Eine Störung kann beispielsweise ein Stress sein, der auf das System wirkt. Vorzugsweise ist die Störung ein externer Stress, bevorzugt ausgewählt aus der Gruppe umfassend toxischer Stress, vorzugsweise ausgewählt aus der Gruppe umfassend Stress durch nicht-genotoxische oder gentoxische Hepatokarzinogene, Wärmestress, Stress durch Hunger, Stress durch Applikation eines pharmazeutischen Wirkstoffs, einer Chemikalie und/oder eines Medikaments.
Bevorzugte biologische Systeme sind ausgewählt aus der Gruppe umfassend Zelle(n), Gewebe, Organ(e) und/oder Organismus, wobei bevorzugte Gewebe oder Organe solche sind, die biologische und/oder biochemische Komponenten enthalten. Bevorzugte Gewebe oder Organe sind beispielsweise ausgewählt aus der Gruppe umfassend Gehirn und/oder Leber. Es versteht sich, dass jedes biologische System im Rahmen der vorliegenden Erfindung verwendet werden kann, beispielsweise prokariotische wie eukariotische Zellen oder Organismen. Ein biologisches System kann beispielsweise eine Zellkultur sein oder ein Säugetierorganismus wie Maus oder Ratte, die durch geeignete experimentelle Ausführung einer reversiblen Störung ausgesetzt werden können.
Bevorzugte biologische Komponenten sind Gene. Insbesondere die Untersuchung der Genexpression ist Gegenstand weitläufiger Untersuchungen zur Reaktion von biologischen Systemen auf eine Störung bzw. Stress. Bevorzugte biochemische Komponenten sind ausgewählt aus der Gruppe umfassend RNA, DNA, Metaboliten und/oder Proteine.
Biologische und/oder biochemische Komponenten können auf eine reversible Störung reagieren, indem sie ihre Aktivität ändern. Abhängig von der Art des Stresses und der hierdurch beeinflussten Komponenten und/oder der Stärke der ausgeübten Störung werden unterschiedliche biologische und/oder biochemische Komponenten durch eine solche Störung beeinflusst. Durch eine solche Störung können abhängig von der Art und des Ausmaßes der Störung viele oder wenige Komponenten eines Netzwerks beeinflusst werden. Die Anzahl der Komponenten, die durch eine Störung direkt betroffen werden kann in weiten Bereichen variieren, beispielsweise in einem Bereich von ≥ 1 Komponente bis alle Komponenten, entsprechend ≤ 100 % der Komponenten, bezogen auf 100 % Komponenten, bevorzugt im Bereich bis ≤ 20% der Komponenten, bevorzugter im Bereich bis ≤ 10 % der Komponenten, vorzugsweise im Bereich bis 5 % der Komponenten, auch bevorzugt im Bereich bis ≤ 3 % der Komponenten, noch bevorzugt im Bereich bis ≤ 2 % der Komponenten, bezogen auf 100 % der Komponenten, liegen.
In weiterhin bevorzugten Ausführungsformen des erfindungsgemäßen Verfahrens kann eine Störung auf die Änderung der Aktivität aller Komponenten berechnet werden, solange ihre Aktivität vorzugsweise ihre Expression hinreichend genau gemessen werden kann. Die hinreichend genau bestimmbare Anzahl der Komponenten beispielsweise bei Genexpressionsnetzwerken liegt im Bereich bis 40 % der Komponenten, vorzugsweise im Bereich bis 30 % der Komponenten, bezogen auf 100 % der Komponenten. Es ist ein besonderer Vorteil des erfindungsgemäßen Verfahrens, dass die grobe Berechnung des Verhaltens eines Netzwerks auch dann noch ermöglicht wird, wenn mehr als 30 % der Komponenten eines Netzwerks, insbesondere wenn mehr als 40 % der Komponenten eines Netzwerks von der reversiblen Störung betroffen sind.
Die Aktivität der biologischen oder biochemischen Komponenten des Netzwerks kann hierbei in Abhängigkeit von der reversiblen Störung ebenfalls in einem variierenden Ausmaß beeinflusst werden. In bevorzugten Ausführungsformen des erfindungsgemäßen Verfahrens ist die Aktivität der Komponenten in einem Bereich von 0,1 % bis 30 %, bevorzugt 0,5 % bis 25 %, vorzugsweise 1 % bis 20 %, noch bevorzugter 5 % bis 15 % bezogen auf die Aktivität der biologischen oder biochemischen Komponenten im Grundzustand, d.h. in einem Zustand bevor oder das keine Störung auf das System ausgeübt wird, beeinflusst.
Das erfindungsgemäße Verfahren ist in bevorzugten Ausführungsformen ein Verfahren in dem Gebiet der quantitativen Toxikogenomik. In bevorzugten Ausführungsformen sind die biochemischen oder biologischen Komponenten entsprechend Gene und RNA- und/oder DNA-Moleküle. Im Rahmen der vorliegenden Erfindung bedeutet Änderung der Aktivität eines Gens vorzugsweise, dass ein solches Gen in seiner Expression hoch- oder runter-reguliert wird. Die Expressionsrate eines Gens ist vorzugsweise als Gehalt an RNA oder dem entsprechenden Genprodukt bestimmbar. In besonders bevorzugten Ausführungsformen wird der in dem entsprechenden System, vorzugsweise einer Zellkultur oder Zellen eines Gewebes vorliegende RNA-Gehalt bestimmt.
Bevorzugt wird die Änderung der Aktivität mindestens einer biologischen oder biochemischen Komponente entsprechend mittels Verfahren bestimmt, die Auskunft über die in einem System vorliegenden RNA- oder DNA-Gehalt geben können, vorzugsweise aus der Gruppe umfassend semiquantitative RT-PCR, Northern Hybridisierung, Differential display, substraktive Hybridisierung, subtrahierte Bibliotheken, cDNA Arrays und/oder Oligo-Arrays.
In anderen bevorzugten Ausführungsformen des erfindungsgemäßen Verfahrens kann die biochemische Komponente ein Protein sein, oder ein Metabolit einer Wirksubstanz, die als Störung verabreicht wurde.
Es kann entsprechend weiterhin bevorzugt sein, dass man die Änderung der Aktivität einer Komponente mittels Verfahren bestimmt, die ausgewählt sind aus der Gruppe umfassend Verfahren, die zur Bestimmung eines Proteingehalts eines Systems verwendbar sind, vorzugsweise ausgewählt aus der Gruppe umfassend Western Hybridisierung, ELISA–Technik (Enzyme Linked Immuno Sorbent Assay) und/oder spektroskopische Methoden, beispielsweise HPLC (High Pressure Liquid Chromatography), fluroeszenzbasierte absorptive oder massenspektrometrische Nachweise.
In bevorzugten Ausführungsformen des erfindungsgemäßen Verfahrens kann man zwischen der gemäß Schritt (f) bestimmten Änderung der Aktivität der einzelnen Komponenten und dem gemäß Schritt (g) berechneten Verhalten des biologischen Netzwerks anhand des bereitgestellten linearen Modells vergleichen, wobei man erwartet, dass eine Übereinstimmung des berechneten Verhaltens mit den in Schritt (f) bestimmten Änderungen der Aktivität der biologischen oder biochemischen Komponenten besteht. Ergibt ein solcher Vergleich, dass eine Übereinstimmung zwischen der bestimmten Änderung der Aktivität einer Komponente und der entsprechenden Berechnung durch das bereitgestellte Modell besteht, entsprechend also eine Übereinstimmung vorzugsweise experimentell bestimmter Daten und der Berechnung des Modells besteht, unterliegt die experimentell bestimmte Reaktion der Komponente auf die Störung den Vorhersagen des Modells.
In anderen Ausführungsformen der erfindungsgemäßen Verfahren kann bei einem solchen Vergleich entsprechend Schritt (h) des Verfahrens feststellbar sein, dass eine statistisch signifikante Abweichung einer oder mehrerer Komponente(n) der gemäß Schritt (f) bestimmten Änderung der Aktivität und dem gemäß Schritt (g) berechneten Verhalten der Komponente(n) im Netzwerk vorliegt, die anzeigt, dass diese Komponente(n) nicht dem bereitgestellten linearen Modell unterliegt. Eine solche Komponente, die dem bereitgestellten linearen Modell nicht unterliegt, kann ein Indikator für einen störungsinduzierten Übergang in einen neuen Zustand der Komponente sein und einen solchen Übergang anzeigen. Eine solche Abweichung von dem durch das bereitgestellte lineare Modell berechneten Verhalten, kann insbesondere bedeuten, dass die Störung für die Komponente nicht reversibel ist. Bei einer nicht reversiblen Störung kehrt das System nach Entfernen des Stresses nicht in seinen Ausgangszustand zurück, und/oder eine einzelne Komponente kehrt nach Entfernen der Störung nicht in den Ausgangszustand der Aktivität vor der reversiblen Störung zurück. Eine solche Komponente kann als Indikator dafür dienen, dass das System in einen anderen Zustand des biologischen Systems übergegangen ist, beispielsweise in einen Zustand, der einer Erkrankung verursacht durch die Störung entspricht.
Es ist ein Vorteil des erfindungsgemäßen Verfahrens, dass eine feststellbare statistisch signifikante Abweichung einer oder mehrerer Komponenten eine Aussage darüber ermöglicht, ob das System eine oder mehrere Komponenten aufweist, die anzeigen können, dass das System nach der ausgeübten Störung nicht reversibel reagiert, sondern einen davon abweichenden Zustand, vorzugsweise einen Zustand, der eine Erkrankung des Systems charakterisiert, einnimmt.
Die bevorzugten Ausführungsformen des erfindungsgemäßen Verfahrens bestimmt man die statistische Signifikanz mittels eines Signifikanztests vorzugsweise ausgewählt aus der Gruppe umfassend T-Test, Z-Test, und/oder chi-Quadrat-Test.
In weiteren Ausführungsformen des Verfahrens kann man in einem weiteren Schritt erhalten, dass eine statistisch signifikante Regulation der Aktivität einer oder mehrerer Komponente(n) gemäß der in Schritt (f) bestimmten Änderung der Aktivität und dem gemäß Schritt (g) berechneten Verhalten der Komponente im Netzwerk vorliegt.
Der Abstand von einem direkten Angriffspunkt der Störung ist erhältlich durch den Korrelationskoeffizienten cor(ξ_i, ξ_u). Je größer der Absolutbetrag ist, desto dichter ist die Komponente am Angriffspunkt.
Eine solche statistisch signifikante Isolation der Aktivität einer oder mehrerer Komponenten kann bedeuten, dass diese Komponente dicht am mechanistischen Angriffspunkt der Störung liegt. Eine solche Komponente, die signifikant stärker durch die ausgeübte Störung in ihrer Aktivität reguliert wird, weist eine hohe Sensitivität gegenüber der Störung auf. Eine solche signifikant regulierte Komponente kann eine Komponente, beispielsweise ein Gen, sein, die mit einem entsprechenden Berechnungsverfahren zur Berechnung nicht direkt beobachtbare Größe, beispielsweise physiologische Änderungen eines Organismus, einen Biomarker ausbilden.
In einer weiteren bevorzugten Ausführungsform des Verfahrens kann dieses zur Bestimmung von Biomarkern dienen.
In einer weiteren bevorzugten Ausführungsform des Verfahrens können die Schritte (a) bis (h) für wenigstens zwei reversible Störungen und optional wenigstens zwei Systeme wiederholt werden und man erhält in einem weiteren Schritt des Vergleichs, dass eine statistisch signifikante Regulation der Aktivität einer oder mehrerer Komponente(n) gemäß der in Schritt (f) bestimmten Änderung der Aktivität und dem gemäß Schritt (g) berechneten Verhalten der Komponente in Bezug auf verschiedene Arten von Störungen vorliegt, die eine Klassifikation der Störung anhand des Auftretens der statistisch signifikanten Regulation der Komponente(n) erlaubt.
Vorzugsweise ist feststellbar, dass wenigstens eine der bestimmten Komponenten in Bezug auf eine bestimmte Art von Störung einer statistisch signifikante Regulation aufweist, und in Bezug auf weitere Arten von Störungen davon statistisch signifikant verschiedene Regulationen aufweist, so dass eine statistisch signifikante charakteristische Reaktion auf eine bestimmte Störung feststellbar ist. Eine solche statistisch signifikante Regulation wenigstens einer Komponente auf eine bestimmte Störung erlaubt es, die Störung anhand des Auftretens einer solchen als Biomarker bezeichneten Komponente zu klassifizieren. Das Erhalten eines solchen Biomarkers kann in bevorzugten Ausführungsformen des Verfahrens unter Bestimmung der Änderung der Aktivität wenigstens einer Komponente und der Berechnung des Verhaltens des Netzwerks, dem diese Komponente angehört, entsprechend dem zur Verfügung gestellten linearen Modell zur Verfügung gestellt werden.
In bevorzugten Ausführungsformen erhält man eine statistisch signifikante Regulation der Aktivität mehrerer Komponenten, wobei eine solche Regulation eine positive oder negative Regulation, beispielsweise in Bezug auf die Expressionsrate von Genen eine Auf- oder Abregulation der Genexpression, sein kann. Die statistisch signifikante Regulation mehrerer Komponenten ist nicht notwendigerweise gleichgerichtet, sondern kann vorzugsweise eher einem charakteristischen Muster der Regulation der verschiedenen Komponenten entsprechen.
Vorteilhafterweise ermöglicht das erfindungsgemäße Verfahren in bevorzugten Ausführungsformen, dass eine große Anzahl von Komponenten durch das Modell berechenbar ist. In weiterhin vorteilhaften Ausführungsformen des Verfahrens ermöglicht das Verfahren weiterhin, dass die Berechnung auf möglichst wenige Komponenten beschränkbar ist. Dies ermöglicht das erfindungsgemäße Verfahren vorteilhafterweise dadurch, dass man eine statistisch signifikante Regulation der Aktivität einer oder mehrerer Komponenten und der berechneten Änderung des Verhaltens des Netzwerks ermöglicht, dass die signifikant geregelten Komponenten über ihre signifikante Regulation durch eine bestimmte Störung erlauben, diese Störung beispielsweise in weiteren oder wiederholten Verfahren zu klassifizieren.
Das erfindungsgemäße Verfahren ist in bevorzugten Ausführungsformen ein Verfahren auf dem Gebiet der quantitativen Toxikogenomik. In bevorzugten Ausführungsformen des Verfahrens sind die Komponenten Gene und es wird die Genexpression vorzugsweise von Stressgenen bestimmt. Vorzugsweise ist das System ein Säugetier, beispielsweise eine Ratte oder Maus, das verschiedene Gewebe beispielsweise ausgewählt aus der Gruppe umfassend Leber und Gehirn umfasst, oder eine Zellkultur. Vorzugsweise wird eine externe Störung ausgeübt, indem ein reversibler toxischer Stress auf das System ausgeübt wird. Bevorzugt wird wenigstens ein, vorzugsweise mehrere pharmazeutischer Wirkstoff, vorzugsweise wenigstens ein Karzinogen appliziert. Es können in mehreren bereitgestellten Systemen mehrere pharmazeutische Wirkstoffe oder andere Chemikalien, vorzugsweise Karzinogene, bevorzugt ausgewählt aus der Gruppe umfassend Wirkstoffe, die einen nicht-genotoxischen Stress, genotoxischer Stress und/oder hepatotoxischer Stress ausüben, appliziert werden.
In einer besonders bevorzugten Ausführungsform des Verfahrens betrifft das Verfahren die Bestimmung der Änderung der Genexpression in einem Gewebe nach einem reversiblen toxischen Stress umfassend die folgenden Schritte:

(a) Bereitstellen eines Organismus, der ein Gewebes enthält, das ein biologisches Netzwerk umfassend eine Vielzahl von Genen umfasst;
(b) Bereitstellen eines linearen Modells zur Beschreibung der Änderung der Genexpression des Netzwerks;
(c) Bestimmen der Grundexpression der Gene;
(d) Ausüben eines toxischen Stresses, bevorzugt Applikation eines pharmazeutischen Wirkstoffs, vorzugsweise eines Karzinogens, wobei eine Änderung der Genexpression erzeugt wird;
(e) Bestimmen der Genexpression nach Applikation des toxischen Stresses, bevorzugt des pharmazeutischen Wirkstoffs, vorzugsweise des Karzinogens, sobald die Gene des Netzwerks die Reaktion auf den Stress vollzogen haben;
(f) Bestimmen der Änderung der Expression wenigstens eines Gens nach Ausüben des toxischen Stresses, bevorzugt Applikation des pharmazeutischen Wirkstoffs, vorzugsweise des Karzinogens;
(g) Berechnen der Änderung der Genexpression aller Gene des Netzwerks anhand des bereitgestellten linearen Modells zur Beschreibung des Verhaltens des biologischen Netzwerks aus der bestimmten Änderung der Expression wenigstens eines Gens unter Berücksichtigung der Biodiversität der Änderung der Genexpression; und
(h) optional Vergleichen der gemäß Schritt (f) bestimmten Änderung der Expression wenigstens eines Gens und der gemäß Schritt (g) berechneten Änderung der Genexpression der Gene des Netzwerks anhand des bereitgestellten linearen Modells, wobei man erwartet, dass eine Übereinstimmung berechneten Änderung der Genexpression mit den in Schritt (f) bestimmten Änderung der Expression wenigstens eines Gens besteht.

In bevorzugten Ausführungsformen des Verfahrens ist das Karzinogen ausgewählt aus der Gruppe umfassend nicht-genotoxische, genotoxische und/oder hepatotoxische Karzinoge.
In bevorzugten Ausführungsformen des Verfahrens ist vorgesehen, dass man die Expression einer Anzahl Gene im Bereich von ≥ 1 Gen bis ≤ 25.000 Gene, vorzugsweise im Bereich von ≥ 1 Gene bis ≤ 15.000 Gene, bevorzugt im Bereich von ≥ 1 Gene bis ≤ 5000 Gene, besonders bevorzugt im Bereich von ≥ 2 Gene bis ≤ 1000 Gene, weiter vorzugsweise im Bereich von ≥ 5 Gene bis ≤ 400 Gene, noch vorzugsweise im Bereich von ≥ 5 Gene bis ≤ 200 Gene bestimmt.
Ein weiterer Gegenstand der vorliegenden Erfindung betrifft ein Computerprogrammprodukt mit computerlesbaren Programmmitteln zur Durchführung eines oder mehrerer Schritte des Verfahrens, wenn das Programm auf einem Computer ausgeführt wird. Die Erfindung lässt sich vorteilhafterweise in einem oder mehreren Computerprogrammen zur Ausführung in einem Computersystem mit Softwarekomponenten zur Durchführung eines oder mehrerer Schritte des Verfahrens durchführen, wenn das Programm auf einem Computer ausgeführt wird. Ein weiterer Gegenstand der vorliegenden Erfindung betrifft somit ein Computerprogramm zur Ausführung in einem Computersystem mit Softwarekomponenten zur Durchführung eines oder mehrerer Schritte des Verfahrens, wenn das Programm auf einem Computer ausgeführt wird. Ein weiterer Gegenstand des Verfahrens betrifft ein Computersystem mit Mitteln zur Ausführung eines oder mehrerer Schritte des erfindungsgemäßen Verfahrens.
Wenn nicht anders ausgeführt, weisen die verwendeten technischen und wissenschaftlichen Ausdrücke die Bedeutung auf, wie sie gemeinhin von einem Durchschnittsfachmann in dem Gebiet, zu dem diese Erfindung gehört, verstanden wird.
Alle Veröffentlichungen, Patentanmeldungen, Patente und weiteren hier angegebenen Literaturangaben sind voll inhaltlich durch Bezugnahme aufgenommen.
Beispiele, die der Veranschaulichung der vorliegenden Erfindung dienen, sind nachstehend angegeben.
Berechnungen und Datenanalysen wurden unter Verwendung von Matlab, Mathworks, Waltham, USA, ausgeführt, wenn nicht anders angegeben.
Beispiel 1
Bestimmung der Genexpression in Rattenleber nach einem reversiblen toxischen Stress
Versuchsablauf, Behandlungsbedingungen und Probenaufbereitung erfolgte wie in "Ellinger-Ziegelbauer et al., Mutation Research 575, 2005 S. 61-84" beschrieben, sofern im folgenden nicht anders angegeben.
Für die in vivo Studien wurden männliche Wistar-Hanover-Ratten (Cr1:WI[G1/BRL/Han]IGS BR, Charles River Laboratories Inc, Raleigh, USA) in Versuchsgruppen von jeweils 5 Tieren eingeteilt und erhielten einmal täglich für einen Zeitraum von 1, 3, 7 oder 14 Tagen per Magensonde ("Gavage") jeweils eine der folgenden Substanzen in der angegebenen Konzentration. Verwendet wurden fünf genotoxische Karzinogene: 2-Nitrofluoren (Sigma, St. Louis, USA), in einer Konzentration von 4 mg/kg/Tag für 3 und 7 Tage, Dimethylnitrosamin (Sigma, St. Louis, USA), in einer Konzentration von 4 mg/kg/Tag für 3 und 7 Tage, Aflatoxin B1 (Sigma, St. Louis, USA), in einer Konzentration von 0,24 mg/kg/Tag für 3 und 7 Tage, N-nitrosomorpholin (TCI America, Portland, USA), in einer Konzentration von 3,5 mg/kg/Tag für 3 und 7 Tage, und CI Direct Black (TCI America, Portland, USA), 146 mg/kg/Tag für 3 und 7 Tage; fünf nicht-genotoxische Karzinogene: Methapyrilene HCl (Sigma, St. Louis, USA), in einer Konzentration von 60 mg/kg/Tag) für 3 und 7 Tage, Thioacetamid (Sigma, St. Louis, USA), in einer Konzentration von 19,2 mg/kg/Tag für 3 und 7 Tage, Diethylstilbestrol (Sigma, St. Louis, USA), in einer Konzentration von 10 mg/kg/Tag für 1 und 3 Tage, Wy 14643 (TCI America, Portland, USA), in einer Konzentration von 60 mg/kg/Tag für 1 und 3 Tage, und Piperonylbutoxid (Sigma, St. Louis, USA), in einer Konzentration von 1200 mg/kg/Tag für 1 und 3 Tage; sowie drei zusätzliche nicht-hepatotoxische Substanzen: Cefuroxim (Sigma, St. Louis, USA), in einer Konzentration von 250 mg/kg/Tag für 1, 3, 7 und 14 Tage, Nifedipin (Sigma, St. Louis, USA), in einer Konzentration von 3 mg/kg/Tag für 1, 3, 7 und 14 Tage, und Propranolol (Sigma, St. Louis, USA), in einer Konzentration von 40 mg/kg/Tag für 1, 3, 7 und 14 Tage.
Die Dosierungen der Karzinogene wurde so ausgewählt, dass ein Lebertumor lediglich unter der Bedingung einer langfristigen Verabreichung entsteht, so dass eine kurzfristige Verabreichung dieser Karzinogene in einem Bereich von 14 Tagen lediglich einen reversiblen toxischen Stress auf die Ratten ausübt. Für jede Verabreichungsgruppe wurde einer entsprechenden Gruppe von Kontrolltieren in gleicher Weise Lösemittel appliziert.
Nach den pro Substanz angegebenen Tagen der Applikation wurde jeweils die Gesamt-RNA der Leber von jeweils 3 gleichbehandelten Versuchstieren mittels RNAeasy 96 well-Kits (Qiagen) isoliert. Die Analyse der RNA Expression erfolgte mit der Affymetrix Gene Chip Microarray Plattform(Affymetrix Inc., Santa Clara, USA) nach einem Standardprotokoll ("GeneChip Sample Cleanup Module, Section 2: Eukaroytic Target Preparation, Affymetrix 701194 Rev.1, 2002). Die einzelnen Schritte sind im folgenden kurz beschrieben. 5 μg der Gesamt-RNA wurden wie vorgegeben mit dem cDNA Doppelstrang Synthese Kit, (Life Technologies, Karlsruhe) in doppelsträngige cDNA umgeschrieben. Von der gereinigten cDNA wurde anschließend in einer in vitro Transkriptionsreaktion mit dem ENZO Bio Array high Yield RNA transcript Labeling Kit, (Affymetrix Inc., Santa Clara, USA) biotinylierte copy-RNA (cRNA) hergestellt. Nach einer Fragmentierung wurden 15 μg der biotinylierten cRNA mit RAE230A Microarrays hybridisiert (Affymetrix Inc., Santa Clara, USA).
Nach der Hybridisierung für 16 Stunden wurden die Arrays entsprechend den Angaben des Herstellers gewaschen und mit Phycoerythrin-markiertem Streptavidin (Molecular Probes, Eugene, USA), gefärbt. Die Phycoerythrin-Fluoresezenz wurde anschließend in einem Agilent Gene Array Scanner (Agilent, Palo Alto, USA) gelesen.
Der RAE230A Microarray repräsentiert 15.866 sogenannte "Probe Sets". Diese entsprechen 14.280 rattenspezifischen Unigene Clustern, die wiederum größtenteils einzelnen Rattengenen entsprechen. Die vom Scanner ausgegebenen Rohdatenfiles (DAT) wurden mit Hilfe der Software Microarray Suite 5.0 (MAS5) der Firma Affymetrix durch Hintergrundkorrektur und Mittelung der Fluoreszenzwerte aller 36 pixels pro Oligonukleotid Set in CEL files umgewandelt. Danach erfolgte eine Qualitätskontrolle der Micorarrays mit der Software Expressionist Refiner der Firma Genedata AG (Basel, Schweiz). Diese kann Fluoreszenzgradienten und helle oder dunkle Flecken pro Microarray erkennen und korrigieren. In den CEL files wird ein "Probe Set" durch 11 Paare von "Perfect Match (PM)" und "Mismatch (MM)" Oligonukleotid Sets dargestellt, wobei in den MM Oligonukleotiden ein Nukleotid in der Mitte ausgetauscht ist, somit nicht mehr mit der passenden cRNA des durch das PM repräsentierte Gen hybridisieren kann, und damit ein Maß für eine unspezifische Hintergrundhybridisieung darstellt.
Im folgenden wurden dann die Intensitätswerte der einzelnen PMs und MMs pro "Probe Set" mit zwei verschiedenen Algorithmen zu einem Intensitätswert verrechnet. Diese Algorithmen, genannt MAS5 und GCRMA, führen zu etwas unterschiedlichen Intensitätswerten im Niedrig-Expressionsbreich. Die daraus resultierenden zwei Sets von Datenfiles, mit einem Intensitätswert pro "Probe Set" wurden dann wie im folgenden Beispiel beschrieben, eingesetzt.
Insgesamt wurden Microarrays von 138 Lebergewebeproben hybridisiert, wobei die Proben in Gruppen entsprechend Leberproben von Tieren, denen genotoxische Karzinogene (Gruppe 1), nicht-genotoxischen Karzinogene (Gruppe 2), nicht-hepatotoxischen Karzinogene (Gruppe 3) appliziert wurden, und den jeweiligen Kontrollen der Genexpression vor der Applikation des Karzinogens (Gruppe 0), eingeteilt wurden.
Beispiel 2
Berechnung der Änderung der Genexpression anhand des linearen Modells
Für die Erstellung des Modells wurden die mittels Affymetrix gemäß Beispiel 1 bestimmten 4.000 höchst exprimierenden Gene verwendet. Die Auswahl erfolgte, indem die mittlere Expression jedes Gens berechnet wurde und dann die 4000 Gene mit der höchsten mittleren Expression ausgewählt wurden. Diese Auswahl erfolgte, um Fehler in der Auswertung von Expressionsdaten bei niederen Expressionswerten zu vermeiden.
Für jedes der 4.000 Gene i wurde die logarithmische Expressionsrate x_i einzeln berechnet.
Hierzu wurde für alle Daten, die mit Hilfe von GCRMA aus den Rohmessdaten gewonnen werden, der natürliche Logarithmus mit Hilfe von Matlab berechnet.
Weiterhin wurden die erhaltenen Daten für jedes Gen stratifiziert. Hierzu wurde für jedes Gen der Mittelwert der Expression für jede Substanzgruppe berechnet. Danach wurde für jedes Gen und jeden Expressionswert der jeweilige Mittelwert subtrahiert. Hierdurch wurde erreicht, dass nur noch die Schwankungen um den jeweils durch die Mittelwerte beschriebenen stationären Zustand order Steady state berücksichtigt wurden.
Bei der Bestimmung des jeweiligen stationären Zustands oder Steady State wurde für jedes Gen über jede Substanzgruppe 0, 1, 2 und 3 der Mittelwert berechnet.
Hierdurch wurde für jedes Gen i ein Wert x_i, der die mittlere Verschiebung der Genexpression der i-ten Komponente als Reaktion auf den toxischen Stress wiedergibt, erhalten. Zusätzlich wurde für jedes Gen i und jede Gewebeprobe der stratifizierte Expressionswert ξ_i berechnet, indem von allen Expressionswerten des Gens i in den Geweben der Stressgruppe der Mittelwert der Expression des Gens i in dieser Gewebegruppe subtrahiert wurde. Diese Werte geben das Rauschen um den Mittelwert der jeweiligen Gruppe jeder Substanzgruppe 0, 1, 2 und 3 an. Dieses Rauschen wird zum einen von Messfehlern, zum anderen von der Biodiversität der Reaktion der Gene auf den jeweiligen toxischen Stress und zusätzliche, stochastisch schwankende Umweltbedingungen, erzeugt.
Aus den Werten ξ_i wurden je Gen die Standardabweichung σ_i über die verwendeten 138 Proben mit Hilfe von Matlab berechnet.
Aus bekannten Werten von der mittleren Verschiebung x_i und σ_i wurde der Term x_i/σ_i für die Gene berechnet. Dieser Term gibt effektive Verschiebung der Genexpression der einzelnen Gene durch die Störung an.
Aus den erhaltenen Werten von x_i/σ_i für die 4000 Gene wurden die 100 höchst signifikanten Gene mit den höchsten Werten von x_i/σ_i ausgewählt.
Für diese 100 höchst signifikanten Gene wurden die Gewichte w_i durch Optimierung mit Hilfe eine genetischen Algorithmus berechnet Diese Prozedur wird unten beschrieben. Aus diesen Gewichten wurde gemäß
ξ_u berechnet und mit dem bekannten ξ_i wurde dann gemäß Gleichung (IV) der paarweise Korrelationskoeffizient cor(ξ_i, ξ_u) berechnet.

In der folgenden Tabelle 1 sind die Werte für x_i/σ_i und cor(ξ_i, ξ_u) exemplarisch für die 100 höchst exprimierten Gene angegeben:

Gen-Nummer	x_i/σ_i für die 100 höchstexprimierenden Gene	cor(ξ_i, ξ_u) für die 100 höchstexprimierenden Gene	Gen-Nummer	x_i/σ_i für die 100 höchstexprimierenden Gene	cor(ξ_i, ξ_u) für die 100 höchstexprimierenden Gene
1	–0,8639	–0,2284	51	–1,6086	–0,1596
2	–1,7449	–0,2937	52	–0,8255	–0,2469
3	–0,3352	–0,1256	53	–1,2481	–0,1669
4	–1,714	–0,1832	54	–1,7704	–0,2794
5	–0,1267	0,054	55	–0,8749	–0,1012
6	–1,1887	–0,1871	56	1,1776	0,204
7	–0,5797	–0,0272	57	–1,4196	–0,2213
8	–1,1887	–0,1375	58	–1,5482	–0,1247
9	–0,9122	–0,0954	59	–1,2607	–0,1632
10	–0,7818	–0,1221	60	–1,661	–0,249
11	1,0403	0,1477	61	–3,182	–0,4786
12	–0,621	–0,005	62	–0,5108	–0,1255
13	–1,0258	–0,1489	63	0,3719	0,092
14	–2,0452	–0,2533	64	1,6891	0,2705

Gen-Numme	x_i/σ_i für die 100 höchstexprimierenden Gene	cor(ξ_i, ξ_u) für die 100 höchstexprimierenden Gene	Gen-Nummer	x_i/σ_i für die 100 höchstexprimierenden Gene	cor(ξ_i, ξ_u) für _die ₁₀₀ _höchst exprimierenden Gene
15	–1,5043	–0,0387	65	–0,7853	–0,1772
16	–1,8747	–0,2316	66	–0,0616	0,0251
17	1,2427	0,0753	67	–1,6085	–0,2457
18	–1,1158	–0,2487	68	–1,1772	–0,228
19	–0,0269	0,0349	69	–1,8573	–0,202
20	–1,5387	–0,2411	70	1,4588	0,2035
21	–0,5044	0	71	–0,1823	0,0684
22	1,4232	0,1759	72	0,2329	0,1671
23	–1,2783	–0,1777	73	1,3752	0,1567
24	–2,0932	–0,3754	74	–1,3919	–0,2328
25	–1,9516	–0,261	75	–2,486	–0,3218
26	–0,8018	–0,1673	76	–1,616	–0,2251
27	–1,5668	–0,2338	77	–1,616	–0,2251
28	–2,731	–0,2212	78	–0,1054	–0,0522
29	–2,8363	–0,3401	79	1,1247	0,1754
30	–1,0813	0,0704	80	–0,8774	–0,1094
31	0,0119	–0,0596	81	–0,0144	0,0008
32	0,964	0,1351	82	–1,709	–0,0839
33	–1,1782	–0,0393	83	–1,8448	–0,2745
34	–1,6021	–0,17	84	–2,8029	–0,2393
35	–0,9161	–0,1772	85	1,712	0,3029
36	–1,6307	–0,3445	86	0,8732	0,1756
37	–0,634	–0,0916	87	–2,7089	–0,251
38	–0,1102	–0,0148	88	–1,7333	–0,2831
39	–0,1269	0,0543	89	–0,9931	–0,0826
40	–1,9546	–0,3756	90	–0,9297	–0,0934
41	–0,3329	0,0894	91	0,8024	0,1281
42	0,1357	–0,1004	92	0,8872	0,066
43	–0,33	0,1339	93	–1,0377	–0,1278
44	–0,5336	–0,012	94	–0,3729	–0,1597
45	–0,0215	–0,0694	95	–0,5099	–0,062

Gen-Nummer	x_i/σ_i für die 100 höchstexprimierenden Gene	cor(ξ_i, ξ_u) für die 100 höchstexprimierenden Gene	Gen-Nummer	x_i/σ_i für die 100 höchstexprimierenden Gene	cor(ξ_i, ξ_u) für die 100 höchstexprimierenden Gene
46	0,5651	0,1144	96	1,3229	0,1239
47	–0,456	–0,0907	97	–2,1548	–0,2142
48	–1,5579	–0,2523	98	–2,1819	–0,3201
49	–1,406	–0,2453	99	–0,3307	–0,032
50	–1,6404	–0,2383	100	2,9326	0,4455

Die Berechnung von ξ_u erfolgte folgendermassen:
Die Berechnungen wurden mit Hilfe der 4000 höchst exprimierenden Genen durchgeführt, wobei jeweils die 100 signifikantesten Gene als Trainingsdatensatz zur Berechnung der Parameter verwendet werden, die restlichen 3900 Gene als Testdatensatz zum Test der Modellqualität mit den erhaltenen Parametern.
Um die Stabilität des Modells zu verbessern, wurde nur ein Teil von ca. 30 Genen aus diesen 100 Gene für die Modellierung verwendet. Um diesen Teil optimal zu bestimmen, wurde unter Verwendung des genetischen Algorithmus der Vektor ξ_u optimiert, indem schrittweise diese Teilmenge an Genen mit Hilfe des genetischen Algorithmus so ausgewählt wurde, dass das Modell einen minimalen Fehler aufwies.
Die optimale Auswahl dieser Gengruppe erfolgte mit Hilfe eines genetischen Algorithmus wie in der Literatur beschrieben. Es wurden hierzu 20 Gengruppen mit je 20 Genen gebildet. Für jede Gengruppe wurden dann die Gewichte w_i durch Auflösen der Gleichung (V) nach Einsetzen der Gleichung (VI) mit Hilfe der linearen Algebraroutinen von Matlab unter Benutzung der 100 höchst signifikanten Gene errechnet. Dann wurde für jede Gengruppe mit den berechneten Gewichten w_i nach Gleichung (VI) bestimmt und mit Hilfe von Gleichung (V) und der oben genannten Formel für ξ_u die Vorhersagewerte für die übrigen 4000 Gene berechnet. Das mittlere Fehlerquadrat der Abweichung dieser Vorhersagewerte von den gemessenen Werten ergab das Maß für die Qualität des Modells, das durch die jeweilige Gengruppe bestimmt ist. Dann wurden wie bei genetischen Algorithmen üblich die 20 Gengruppen durch Rekombination und Mutation variiert und mit den variierten Gengruppen die Berechnung der Modellparamter und der jeweiligen Modellqualität erneut ausgeführt. Diese Prozedur wurde solange wiederholt, bis sich keine Verbesserung mehr erzielen ließ. Nach 200 Wiederholungen wurde keine signifikante Verbesserung der Prognosefähigkeit des Modells mehr erzielt.
Dieser optimierte Vektor ξ_u wurde dann verwendet, um gemäß der Gleichung (IV) die Änderung der Genexpression aller Gene des Netzwerks zu berechnen.

In der folgenden Tabelle 2 sind die Werte für ξ_u, das als Ergebnis der Optimierung erhalten wurde, für die 138 verwendeten Gewebeproben angegeben:

Gewebe-Nummer	Vektor ξ_u	Gewebe-Nummer	Vektor ξ_u	Gewebe-Nummer	Vektor ξ_u
1	76,5569	47	36,0453	93	–18,4466
2	–14,5742	48	–14,2015	94	–85,8512
3	288,1599	49	145,4589	95	10,727
4	11,1768	50	–160,644	96	–109,0306
5	230,3513	51	77,3361	97	–43,5056
6	191,2853	52	48,4672	98	89,0143
7	188,1156	53	–40,5311	99	–116,9526
8	291,1027	54	–74,2292	100	–102,3417
9	224,6252	55	47,0955	101	–56,6384
10	–53,294	56	–50,7783	102	–167,215
11	–90,4583	57	–107,2944	103	9,239
12	–294,7351	58	–459,4381	104	–42,8732
13	274,2629	59	–581,0783	105	–68,8991
14	–56,5562	60	116,1542	106	–72,9573
15	–28,1301	61	177,4406	107	33,4551
16	167,6595	62	149,8353	108	–30,4143
17	–137,847	63	58,9269	109	–186,0175
18	–77,9698	64	167,4023	110	–13,3843
19	–54,7617	65	–59,1586	111	–25,0929
20	–169,1818	66	–605,2145	112	–150,191
21	–5,0533	67	316,2251	113	–186,7943
22	15,2488	68	322,8739	114	16,8619
23	–82,9799	69	–51,0424	115	79,3224
24	–73,3627	70	245,5574	116	91,981
25	–268,3438	71	66,4274	117	–172,7753
26	–27,8142	72	42,202	118	–44,9154
27	–31,3407	73	–21,7779	119	–46,1011
28	–234,3951	74	91,325	120	136,5539

Gewebe-Nummer	Vektor ξ_u	Gewebe-Nummer	Vektor ξ_u	Gewebe-Nummer	Vektor ξ_u
29	208,0049	75	–52,6885	121	94,5613
30	98,5644	76	–57,2132	122	–121,9597
31	–17,0821	77	–149,6873	123	–211,345
32	3,8032	78	78,5563	124	–95,7291
33	–1,7166	79	448,4771	125	23,3157
34	13,7851	80	–185,6028	126	50,9724
35	36,9275	81	–56,3119	127	198,6063
36	–275,6066	82	113,9029	128	227,2184
37	83,9284	83	183,2596	129	101,7276
38	–7,4295	84	107,4858	130	29,5541
39	–43,6217	85	128,9119	131	–62,2693
40	77,6214	86	146,4095	132	119,2673
41	–36,2371	87	–100,1825	133	–224,152
42	30,5607	88	83,4926	134	153,3749
43	0,5632	89	21,8313	135	341,7285
44	–99,5823	90	–312,5623	136	126,7139
45	–33,3024	91	78,934	137	–107,1419
46	18,2819	92	–75,366	138	28,559

Dieser optimierte Vektor ξ_u wurde dann verwendet, um gemäß der Gleichung (IV) die Änderung der Genexpression der 4.000 Gene des Netzwerks zu berechnen.
Es zeigte sich, dass die mit dem bereitgestellten linearen Modell bestimmte Änderung der Genexpression aller Gene des Netzwerks eine gute Übereinstimmung mit den gemessenen Daten zeigt. So zeigte eine Auftragung von x_i/σ_i gegen cor(ξ_i, ξ_u) dass die durch die reversible Störung regulierten Gene, insbesondere durch die Störung durch nicht-genotoxische Kanzerogene, eine gute Übereinstimmung mit dem linearen Modell zeigten.
Es zeigte sich weiter, dass die Gene, die dicht am biologisch vermuteten Angriffpunkt lagen, tatsächlich einen hohen Korrelationskoeffizienten mit ξu hatten. Darüber hinaus zeigt es sich, dass keine signifikanten systematischen Abweichungen vom Modell auftraten, so dass die im Experiment verursachten Störungen durch nicht-genotoxische Kanzerogene keinen signifikanten nichtlinearen Anteil hatten und somit als reversibel klassifiziert werden konnten.

Claims

Verfahren zur Bestimmung des Verhaltens wenigstens eines biologischen Systems nach einer reversiblen Störung umfassend die folgenden Schritte: (a) Bereitstellen wenigstens eines biologischen Systems, wobei das biologische System ein biologisches Netzwerk umfassend eine Vielzahl von biologischen oder biochemischen Komponenten, die eine Aktivität aufweisen, umfasst; (b) Bereitstellen eines linearen Modells zur Beschreibung des Verhaltens des Netzwerks des biologischen Systems; (c) Bestimmen der Aktivität der biologischen oder biochemischen Komponenten des biologisches Netzwerks; (d) reversibles Stören der Aktivität wenigstens einer der biologischen oder biochemischen Komponenten, wobei eine Reaktion des biologisches Netzwerks erzeugt wird, die durch die Änderung der Aktivität wenigstens einer oder mehrerer der biologischen oder biochemischen Komponenten ausgebildet wird; (e) Bestimmen der Aktivität der biologischen oder biochemischen Komponenten des biologisches Netzwerks nach Ausüben der reversiblen Störung, sobald die Komponenten des Netzwerks die Reaktion auf die Störung vollzogen haben; (f) Bestimmen der Änderung der Aktivität wenigstens einer biologischen oder biochemischen Komponente des biologischen Netzwerks als Reaktion auf die reversible Störung; (g) Berechnen des Verhaltens des biologischen Netzwerks anhand des bereitgestellten linearen Modells zur Beschreibung des Verhaltens des biologischen Netzwerks und der in Schritt (f) bestimmten Änderung der Aktivität der biologischen oder biochemischen Komponente(n) des biologischen Netzwerks nach der reversiblen Störung, unter Berücksichtigung der Biodiversität der Reaktion der biologischen oder biochemischen Komponente(n); und (h) optional Vergleichen zwischen der gemäß Schritt (f) bestimmten Änderung der Aktivität der einzelnen Komponenten und dem gemäß Schritt (g) berechneten Verhalten des biologischen Netzwerks anhand des bereitgestellten linearen Modells, wobei man erwartet, dass eine Übereinstimmung des berechneten Verhaltens mit den in Schritt (f) bestimmten Änderung der Aktivität der biologischen oder biochemischen Komponente(n) besteht.
Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass das bereitgestellte lineare Modell umfasst: – einen Vektor, der die Bestimmung der Änderung der Aktivität wenigstens einer biologischen oder biochemischen Komponente des biologischen Netzwerks als Reaktion auf die reversible Störung umfasst, – eine Matrix, die die Parameter enthält, die die Reaktion der Komponenten auf die Störung beschreiben, und – einen Vektor, der die Störung beschreibt.
Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass der Schritt des Berechnens des Verhaltens des biologischen Netzwerks beinhaltet, dass man eine Matrix, die die Parameter enthält, die die Reaktion der Komponenten auf die Störung beschreiben, durch eine n×n-Matrix beschreibt, wobei n der Anzahl der Komponenten entspricht.
Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass man die Matrix durch eine Projektion der Daten der Änderung der Aktivität auf ihre Eigenvektoren mit Hilfe der Korrelationskoeffizienten von Komponentenpaaren des biologischen Netzwerks beschreibt.
Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass der Vektor, der die Störung beschreibt, einen Rauschanteil aufweist, der die Biodiversität der Reaktion der biologischen oder biochemischen Komponente(n) beschreibt.
Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass die Biodiversität eine biologische Variationen ist ausgewählt aus der Gruppe umfassend natürliche Variation einer Aktivität einer Komponente oder eines Netzwerks, eine natürliche Variation eines biologischen Systems und/oder eine Variation der biologischen Reaktionen eines Systems auf Umgebungsfaktoren, die es erlaubt, das Modell mit Hilfe der durch die Biodiversität erzeugten Variationen ohne systematische Experimente zu bestimmen.
Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass die Störung ein externer Stress ist, vorzugsweise ausgewählt aus der Gruppe umfassend toxischer Stresse, bevorzugt ausgewählt aus der Gruppe umfassend Stress durch nicht-genotoxische oder genotoxische Hepatokarzinogene, Wärmestress, Hunger, Stress durch Applikation eines pharmazeutischen Wirkstoffs, einer Chemikalie und/oder eines Medikaments.
Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass man das biologische System auswählt aus der Gruppe umfassend Zelle(n), Gewebe, Organ(e) und/oder Organismus.
Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass die biologische Komponente ein Gen ist.
Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass man die biochemische Komponente auswählt aus der Gruppe umfassend RNA, DNA, Metabolit und/oder Protein.
Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass die Störung eine direkte Änderung der Aktivität einer Anzahl an Komponenten eines Netzwerks im Bereich von ≥ 1 Komponente bis alle Komponenten, entsprechend ≤ 100 % der Komponenten, bezogen auf 100 % Komponenten, bevorzugt im Bereich bis ≤ 10 % der Komponenten, vorzugsweise im Bereich bis ≤ 5 % der Komponenten, bezogen auf 100 % Komponenten, hervorruft.
Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass man die Änderung der Aktivität wenigstens einer biologischen oder biochemischen Komponente mittels Verfahren ausgewählt aus der Gruppe umfassend semiquantitative RT-PCR, Northern Hybridisierung, Differentialdisplay, substraktiver Hybridisierung, subtrahierten Bibliotheken, cDNA Arrays und/oder Oligo-Arrays bestimmt.
Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass man in einem weiteren Schritt erhält, dass eine statistisch signifikante Regulation der Aktivität einer oder mehrerer Komponente(n) gemäß der in Schritt (f) bestimmten Änderung der Aktivität und dem gemäß Schritt (g) berechneten Verhalten der Komponente im Netzwerk vorliegt.
Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass man die Schritte (a) bis (h) für wenigstens zwei reversible Störungen und optional wenigstens zwei Systeme wiederholt, und in einem weiteren Schritt des Vergleichs erhält, dass eine statistisch signifikante Regulation der Aktivität einer oder mehrerer Komponente(n) gemäß der in Schritt (f) bestimmten Änderung der Aktivität und dem gemäß Schritt (g) berechneten Verhalten der Komponente in Bezug auf verschiedene Arten von Störungen vorliegt, die eine Klassifikation der Störung anhand des Auftretens der statistisch signifikanten Regulation der Komponente(n) erlaubt.
Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass man in Schritt (h) feststellt, dass eine statistisch signifikante Abweichung einer oder mehrerer Komponente(n) der gemäß Schritt (f) bestimmten Änderung der Aktivität und dem gemäß Schritt (g) berechneten Verhalten der Komponente(n) im Netzwerk vorliegt, die anzeigt, dass diese Komponente(n) nicht dem bereitgestellten linearen Modell unterliegt.
Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass man die statistische Signifikanz mittels eines Signifikanztests vorzugsweise ausgewählt aus der Gruppe umfassend T-Test, Z-Test und/oder chi-Quadrat-Test bestimmt.
Verfahren nach einem der vorherigen Ansprüche umfassend die folgenden Schritte: (a) Bereitstellen eines Organismus, der ein Gewebes enthält, das ein biologisches Netzwerk umfassend eine Vielzahl von Genen umfasst; (b) Bereitstellen eines linearen Modells zur Beschreibung der Änderung der Genexpression des Netzwerks; (c) Bestimmen der Grundexpression der Gene; (d) Ausüben eines toxischen Stresses, bevorzugt Applikation eines pharmazeutischen Wirkstoffs, vorzugsweise eines Karzinogens, wobei eine Änderung der Genexpression erzeugt wird; (e) Bestimmen der Genexpression nach Applikation des toxischen Stresses, bevorzugt des pharmazeutischen Wirkstoffs, vorzugsweise des Karzinogens, sobald die Gene des Netzwerks die Reaktion auf den Stress vollzogen haben; (f) Bestimmen der Änderung der Expression wenigstens eines Gens nach Ausüben des toxischen Stresses, bevorzugt Applikation des pharmazeutischen Wirkstoffs, vorzugsweise des Karzinogens; (g) Berechnen der Änderung der Genexpression aller Gene des Netzwerks anhand des bereitgestellten linearen Modells zur Beschreibung des Verhaltens des biologischen Netzwerks aus der bestimmten Änderung der Expression wenigstens eines Gens unter Berücksichtigung der Biodiversität der Änderung der Genexpression; und (h) optional Vergleichen der gemäß Schritt (f) bestimmten Änderung der Expression wenigstens eines Gens und der gemäß Schritt (g) berechneten Änderung der Genexpression der Gene des Netzwerks anhand des bereitgestellten linearen Modells, wobei man erwartet, dass eine Übereinstimmung berechneten Änderung der Genexpression mit den in Schritt (f) bestimmten Änderung der Expression wenigstens eines Gens besteht.
Verfahren zur Bestimmung der Änderung der Genexpression in einem Gewebe nach Anspruch 17, dadurch gekennzeichnet, dass man die Expression einer Anzahl Gene im Bereich von ≥ 1 Gen bis ≤ 5.000 Gene, bevorzugt im Bereich von ≥ 2 Gene bis ≤ 1000 Gene, vorzugsweise im Bereich von ≥ 5 Gene bis ≤ 400 Gene bestimmt.
Computerprogrammprodukt mit computerlesbaren Programmmitteln zur Durchführung eines oder mehrerer Schritte des Verfahrens nach einem der vorherigen Ansprüche, wenn das Programm auf einem Computer ausgeführt wird.
Computerprogramm zur Ausführung in einem Computersystem mit Softwarekomponenten zur Durchführung eines oder mehrerer Schritte des Verfahrens nach einem der vorherigen Ansprüche, wenn das Programm auf einem Computer ausgeführt wird.
Computersystem mit Mitteln zur Ausführung der eines oder mehrerer Schritte des Verfahrens nach einem der vorherigen Ansprüche.