FR2858446A1 - Methode d'analyse de reseaux d'interactions moleculaires biologiques - Google Patents

Methode d'analyse de reseaux d'interactions moleculaires biologiques Download PDF

Info

Publication number
FR2858446A1
FR2858446A1 FR0309557A FR0309557A FR2858446A1 FR 2858446 A1 FR2858446 A1 FR 2858446A1 FR 0309557 A FR0309557 A FR 0309557A FR 0309557 A FR0309557 A FR 0309557A FR 2858446 A1 FR2858446 A1 FR 2858446A1
Authority
FR
France
Prior art keywords
sep
molecules
vertices
state
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR0309557A
Other languages
English (en)
Other versions
FR2858446B1 (fr
Inventor
Todor Vujasinovic
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Helios Biosciences
Original Assignee
Helios Biosciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Helios Biosciences filed Critical Helios Biosciences
Priority to FR0309557A priority Critical patent/FR2858446B1/fr
Priority to EP04786022A priority patent/EP1649405A2/fr
Priority to CA002534401A priority patent/CA2534401A1/fr
Priority to PCT/FR2004/002064 priority patent/WO2005013173A2/fr
Publication of FR2858446A1 publication Critical patent/FR2858446A1/fr
Priority to US11/342,707 priority patent/US20060235670A1/en
Application granted granted Critical
Publication of FR2858446B1 publication Critical patent/FR2858446B1/fr
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • G16B5/30Dynamic-time models
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • G16B5/10Boolean models
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • G16B5/20Probabilistic models

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Physiology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

La présente invention concerne le domaine de l'analyse intégrative des interactions moléculaires dans un système biologique. Elle porte en particulier sur un procédé d'obtention d'un modèle dynamique d'un réseau d'interactions moléculaires dans un système biologique, comprenant les étapes suivantes :A) à partir d'un graphe statique dont les sommets représentent des molécules biologiques et les arrêtes représentent des interactions physico-chimiques entre ces molécules, associer une variable quantitative Xi à chaque sommet, et une relation mathématique à chaque arc du graphe,B) calculer les paramètres de chaque relation à partir de données expérimentales quantitatives concernant les sommets du graphe, par la mise en oeuvre de techniques d'apprentissage utilisées pour le paramétrage de réseaux en intelligence artificielle.L'invention porte également sur un procédé d'analyse des réseaux d'interactions moléculaires biologiques permettant, à partir de l'obtention de données expérimentales, d'identifier et de décrire les fonctionnements de ces interactions à la fois (i) entre des molécules interagissant deux à deux, (ii) au niveau des résultantes des interactions s'exerçant sur une molécule donnée, et (iii) au niveau de l'ensemble du réseau d'interactions considéré. Encore plus particulièrement, cette méthode d'analyse permet, une fois les fonctionnements de ces interactions décrits, de prédire les conséquences, sur l'ensemble du réseau d'interactions moléculaires considéré, d'actions d'activations ou d'inhibitions des molécules formant ce réseau. Elle permet ainsi notamment d'identifier des cibles thérapeutiques potentielles, de comprendre des mécanismes d'actions de xénobiotiques.

Description

<Desc/Clms Page number 1>
La présente invention concerne le domaine de l'analyse intégrative des interactions moléculaires dans un système biologique. Elle porte en particulier sur des méthodes d'obtention et d'analyse des réseaux d'interactions moléculaires biologiques permettant, à partir de l'obtention de données expérimentales, d'identifier et de décrire les fonctionnements de ces interactions à la fois (i) entre des molécules interagissant deux à deux, (ii) au niveau des résultantes des interactions s'exerçant sur une molécule donnée, et (iii) au niveau de l'ensemble du réseau d'interactions considéré.
Encore plus particulièrement, cette méthode d'analyse permet, une fois les fonctionnements de ces interactions décrits, de prédire les conséquences, sur l'ensemble du réseau d'interactions moléculaires considéré, d'actions d'activations ou d'inhibitions des molécules formant ce réseau. Elle permet ainsi notamment d'identifier des cibles thérapeutiques potentielles, de comprendre des mécanismes d'actions de xénobiotiques.
L'un des enjeux actuels majeurs des entreprises biotechnologiques et pharmaceutiques, est de développer de nouveaux médicaments, plus efficaces, contre la plupart des maladies, notamment (mais non uniquement) les maladies chroniques d'origines multi-factorielles qui représentent l'essentiel de la morbidité et de la mortalité dans les pays développés : maladies cardio-vasculaires, cancers, maladies psychiatriques et neurologiques, maladies immuno-allergiques, maladies endocriniennes (diabète...) etc. Les traitements actuellement disponibles pour la plupart de ces maladies ont des effets purement symptomatiques, souvent insuffisants même du point de vue purement symptomatique, sans action notable sur l'évolution propre de ces maladies, et avec souvent des effets indésirables importants. Par ailleurs, on ne dispose à ce jour d'aucun traitement réellement efficace pour certains syndromes ou maladies qui représentent des problèmes de santé majeurs, tels que les maladies neuro-
<Desc/Clms Page number 2>
dégénératives. La principale raison de cette situation est l'insuffisance actuelle de la compréhension des mécanismes physio-pathologiques aboutissant aux conditions pathologiques concernées, et notamment l'insuffisance de compréhension des mécanismes physiopathologiques moléculaires.
En effet, la plupart des médicaments existants ont été développés suivant une approche "pharmacologique" (désormais classique), consistant, schématiquement, à tester et sélectionner des molécules thérapeutiques potentielles (un grand nombre d'entre elles étant obtenues par des méthodes de synthèse organique artificielle, notamment de type chimie combinatoire) sur des modèles physiopathologiques cellulaires et / ou animaux. Ces modèles sont censés reproduire tout ou partie des symptômes ou des modifications observées dans la pathologie. Cependant, une compréhension des mécanismes physiologiques, et notamment des mécanismes moléculaires, mis en jeu dans ces modèles, n'est pas requise pour leur mise en #uvre. Cette approche, fondée sur le crible à grande échelle de petites molécules de synthèse, présente donc l'avantage d'être relativement peu dépendante de la compréhension fine des processus physio-pathologiques impliqués dans les maladies concernées. Elle présente cependant une limite majeure, à laquelle elle est progressivement arrivée depuis environ deux décennies : sa dépendance vis à vis des modèles physiopathologiques utilisés, avec actuellement un épuisement des modèles génériques. Ceci est notamment lié au fait que la plupart de ces modèles ont été développés dans une logique d'interdépendance réciproque entre l'observation d'effets de molécules thérapeutiques et l'analyse progressive des actions pharmacologiques (moléculaires) de ces molécules. Ces modèles sont donc pour la plupart dépendants des effets pharmacologiques initialement observés, et ne permettent plus que de développer des médicaments d'effets proches de ceux déjà existants. Cette approche a progressivement évolué vers un coût élevé lié à un taux d'échec important dans le développement de nouveaux médicaments.
<Desc/Clms Page number 3>
Le développement de modèles animaux par transgénèse n'a pas, à ce jour, résolu ce problème de l'épuisement des modèles physiopathologiques : en effet, d'une part il s'avère que les gènes modifiés par transgénèse ne sont en général pas eux-mêmes des cibles thérapeutiques, et d'autre part l'approche de criblage de petites molécules de synthèse nécessite, pour être mise en #uvre de façon efficace, une orientation de la synthèse, soit par analogie avec des molécules existantes (ce qui ne permet le plus souvent pas d'innovation thérapeutique importante), soit par la connaissance préalable de la (ou des) molécule(s) cible(s), auxquelles on n'a pas directement accès par les modèles transgéniques. Par ailleurs, dans le cas des modèles d'animaux transgéniques de type knock-out, le fait qu'un gène cible thérapeutique éventuel ait été éliminé empêche tout criblage de molécules pharmacologiques potentiellement actives sur ce gène ou la protéine pour laquelle il code.
De ce fait, l'approche qui est de plus en plus mise en oeuvre pour développer de nouveaux traitements pharmacologiques est une autre approche, dite "physiologique" ou "compréhensive", qui consiste à explorer et comprendre les mécanismes physiopathologiques, et notamment les mécanismes physiopathologiques moléculaires, aboutissant à la pathologie concernée, afin de définir les molécules de l'organisme à soigner, qui seront les molécules-cibles (ou "cibles thérapeutiques") des traitements chimiques. L'identification de ces molécules-cibles permet alors, dans un second temps, d'effectuer des cribles de molécules thérapeutiques potentielles de synthèse afin d'identifier celles qui vont modifier directement d'activité biologique de ces cibles thérapeutiques, ou encore d'effectuer des synthèses orientées de telles molécules thérapeutiques lorsque la structure spatiale des molécules-cibles est connue.
Schématiquement, dans cette seconde approche, l'accent est mis sur la compréhension des mécanismes moléculaires physiologiques et physiopathologiques sous-tendant la maladie. Cette approche est elle aussi ancienne, puisqu'elle a débuté avec des techniques et méthodes de chimie
<Desc/Clms Page number 4>
organique permettant d'identifier et d'analyser des molécules intracellulaires (par exemple : description du cycle de Krebs), et elle s'est développée en intégrant les techniques et méthodes de la biologie moléculaire depuis environ 15 - 20 ans (séquençage d'acides nucléiques, clonage, transgénèse...). Il ne s'agit donc pas d'utiliser un modèle cellulaire ou animal physiopathologique pour cribler des petites molécules de synthèse à la recherche d'un effet thérapeutique, mais d'analyser d'abord le processus pathologique dans ces modèles (ou, lorsque c'est possible, directement chez l'Homme) afin de déterminer les cascades d'évènements moléculaires menant à l'état pathologique pour identifier des cibles thérapeutiques potentielles. L'étape de synthèse de nouvelles molécules thérapeutiques n'intervient donc que dans un second temps.
Cette approche "compréhensive" a aussi permis le développement de médicaments, mais elle s'est longtemps heurté à une limite majeure : jusqu'au milieu des années 1990, il était extrêmement difficile d'étudier plus d'une ou deux molécules en même temps. En conséquence, les cascades d'évènements moléculaires décrites n'incluaient que quelques dizaines de molécules dans le meilleur des cas, alors que plusieurs dizaines de milliers de molécules différentes sont présentes dans une cellule eukaryote donnée. Cette approche ne permettait donc pas d'étudier les processus pathologiques en intégrant la complexité de ces processus, ceci particulièrement en ce qui concerne les maladies à déterminisme multifactoriel. Enfin, sa logique tendait vers l'identification de cibles thérapeutiques uniques, mal adaptées pour soigner des maladies où une action sur une seule cible n'est pas suffisante. De fait, dans la plupart de ces maladies, la focalisation des traitements sur des actions pharmacologiques limitées s'est accompagnée de l'augmentation en miroir du nombre de médicaments prescrits à un même patient (ainsi, la plupart des maladies cardio-vasculaires, des maladies psychiatriques, etc. sont aujourd'hui traitées par poly-thérapie, et avec souvent des effets insuffisants et des interactions médicamenteuses difficiles à gérer et parfois
<Desc/Clms Page number 5>
néfastes). Les progrès enregistrés par cette approche ont essentiellement concerné la diminution des effets indésirables des traitements (ceux-ci ayant des actions moléculaires plus ciblées), sans être pour autant accompagnés d'une amélioration notable des effets thérapeutiques (un exemple en est le développement de la fluoxetine (prozac #).
Dans ce contexte, il était crucial de pouvoir passer d'une analyse des processus pathologiques molécule par molécule à une analyse en parallèle de l'ensemble des molécules impliquées, permettant seule de rendre compte de la complexité de ces processus pathologiques.
Ceci a été rendu partiellement possible depuis la fin des années 1990 par deux processus parallèles : d'une part l'identification d'une grande partie des molécules constitutives d'organismes vivants tels que l'homme et certains animaux modèles (séquençage de génomes entiers, identification en cours de l'ensemble des gènes présents dans ces génomes, déduction en cours des protéines correspondantes), et, d'autre part, le développement de techniques de biologie moléculaire qui permettent d'étudier un grand nombre de molécules différentes dans un même tissu.
La plus significative de ces techniques, citée ici à titre d'exemple, est celle des puces à ADN permettant l'analyse en parallèle de virtuellement tous les ARN messagers présents dans un type cellulaire ou un tissu donné (Schena et al., 1995, Quantitative monitoring of gene expression patterns with a complementary DNA microarray, Science 270: 467-470 ; Lockhort et al., 1996, Expression monitoring by hybridization to high-density oligonucleotide arrays, Nature Biotechnology 14 :1675-1680; Blanchard et al., 1996, Sequence to array: Probing the genome's secrets, Nature Biotechnology 14,1649; brevet U. S. No. 5,569,588, publié le 29 Oct. 1996, Ashby et al., pour Methods for Drug Screening). Des méthodes d'analyse protéique à grande échelle ont aussi été développées, telles que l'utilisation d'hybrides dans la levure, le couplage électrophorèse 2D - spectrographie de masse, etc (McCormacket al., 1997, Direct analysis and identification of proteins in mixtures by LC, MS, MS and database searching at the low-
<Desc/Clms Page number 6>
femtomole level, Anal. Chem. 69(4):767-776; Chait, Trawling for proteins in the post-genome era, Nature Biotechnology 14 :1544) ou sont actuellement en cours de développement (notamment la co-précipitation à grande échelle de protéines sur micro-colonnes).
Cependant, à ce jour, ces évolutions technologiques ont mené à la génération d'une grande masse de données biologiques, toujours croissante, sans que des techniques et méthodes satisfaisantes d'analyse et d'exploitation de ces données n'aient été développées. Ceci a entraîné le développement d'outils de biologie intégrative pour les interpréter et sélectionner des cibles thérapeutiques pertinentes parmi une grande masse de données expérimentales générées.
Les méthodes de biologie intégrative visent à analyser le rôle des molécules présentes dans l'organisme à soigner en tenant compte (donc en intégrant) dans cette analyse des autres molécules avec lesquelles elles interagissent. Leur objectif est donc de permettre d'obtenir des modèles des cascades (ou réseaux) d'interactions moléculaires du vivant, notamment de celles impliquées dans les processus pathologiques. Dans le contexte de la sélection de cibles thérapeutiques, de tels modèles visent à être appliqués pour sélectionner ces cibles. Plus précisément, une telle application doit permettre de prédire les conséquences des actions d'activation ou d'inhibition des molécules du réseau, afin d'identifier celles qui auront un effet thérapeutique. Il n'est envisageable de réaliser de telles prédictions à grande échelle et de façon suffisamment fiable que si le modèle permet de pratiquer des simulations systématiques des effets d'actions d'inhibition ou d'activation des molécules de la cascade.
Les méthodes de modélisation proposées aujourd'hui sont d'une part, des méthodes produisant des modèles statiques et, d'autre part, des méthodes produisant des modèles dynamiques.
<Desc/Clms Page number 7>
Les méthodes de modélisation produisant des modèles statiques consistent à construire des graphes statiques représentant des cascades d'interactions de molécules biologiques à partir de données de la littérature scientifique (publications dans des revues, analyse de profils d'expressions de molécules, prise en compte de données de séquences, etc. ). Le graphe résultant peut être représenté sous la forme d'un schéma, le plus souvent en deux dimensions, dont les noeuds (ou sommets) du graphe sont les molécules, et où ces noeuds sont reliés par des trait ou des flèches (ou arcs, ou sommets du graphe) représentant les interactions entre les molécules. Des exemples de graphes statiques sont ceux construits dans diverses bases de données publiques telles que par exemple la base KEGG (M. Kanehisa and S. Goto : KEGG : Kyoto Encyclopedia of Genes and Genomes. Nucleic Acids Research, 28(1) : 27-30, 2000).
Cette méthode de modélisation aboutit à des résultats purement qualitatifs. Elle ne suffit pas à la mise en oeuvre de simulations quantitatives et dynamiques pour prédire les effets d'actions sur des cibles thérapeutiques potentielles. Cette limite est source d'un taux d'erreurs très important dans la sélection des cibles. De plus, il est extrêmement difficile pour un expert biologiste d'analyser de façon cohérente un graphe de plus de quelques dizaines de molécules, et cela devient impossible pour des graphes de plus d'une centaine de molécules. En conséquence, les cascades d'interactions moléculaires analysées sont de taille très réduite par rapport aux cascades réellement mises en jeu dans les organismes vivants, donc très incomplètes, et cette méthode ne permet pas de chercher des cibles de façon exhaustive. Mise en #uvre seule, elle est donc insuffisante au regard des enjeux cités plus haut.
Dans les méthodes produisant des modèles dynamiques, les graphes statiques représentant les cascades d'interactions moléculaires sont utilisés pour créer des modèles dynamiques de ces graphes, reproduisant autant que faire se peut le comportement dynamique de la cascade biologique
<Desc/Clms Page number 8>
étudiée (ou voie biologique). Les méthodes utilisées à ce jour pour réaliser de tels modèles sont : Les méthodes qualitatives : - La méthode des réseaux booléens.
- La méthode des formalismes logiques généralisés.
- La méthode des formalismes fondés sur des règles (aussi appelés "rule-based" ou "knowledge-based").
Les méthodes probabilistes : - La méthode des équations stochastiques.
- La méthode des réseaux Bayésiens.
Les méthodes d'équations différentielles : - La méthode des équations différentielles ordinaires non linéaires.
- La méthode des équations différentielles décomposées-linéaires (piecewise-linear differential equations).
- La méthode des équations différentielles partielles et modèles de distribution spatiale.
Les méthodes mixtes :
La méthode des équations différentielles qualitatives.
Les principes sous-jacents à ces différentes méthodes sont résumés dans le tableau 1 ci-dessous.
<Desc/Clms Page number 9>
Figure img00090001
<tb>
<tb>
(1) <SEP> (2) <SEP> (3) <SEP> (4) <SEP> (5)
<tb> , <SEP> Intégration <SEP> de <SEP> Formalisme <SEP> Variables <SEP> Fonctions <SEP> Modèle
<tb> Méthode <SEP> données <SEP> utilisées <SEP> continues <SEP> déterministe
<tb> quantitatives
<tb> Méthodes
<tb> qualitatives <SEP> : <SEP> ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
<tb> Réseaux <SEP> Partielle <SEP> On/off <SEP> Discrétisation <SEP> Non <SEP> Non
<tb> booléens <SEP> de <SEP> x,
<tb> Formalismes <SEP> Partielle <SEP> Discrétisation <SEP> Discrétisation <SEP> Non <SEP> Non
<tb> logiques <SEP> des <SEP> variables <SEP> de <SEP> x,
<tb> généralisés
<tb> Formalismes <SEP> Non <SEP> On/off <SEP> Variables <SEP> non <SEP> Non <SEP> Non
<tb> "rule-based" <SEP> quantitatives
<tb> Méthodes
<tb>
Figure img00090002

probabilistes : :~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Figure img00090003
<tb>
<tb> Equations <SEP> Oui <SEP> Probabilité <SEP> x, <SEP> Oui <SEP> Non
<tb> stochastiques <SEP> de <SEP> réaction
<tb> ~~~~~~~~~ <SEP> chimique
<tb> Réseaux <SEP> Oui <SEP> Probabilité <SEP> x, <SEP> Oui <SEP> Non
<tb> Bayésiens <SEP> de <SEP> réaction
<tb> chimique
<tb> Méthodes
<tb> d'équations
<tb> différentielles <SEP> ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
<tb> Equations <SEP> Oui <SEP> Synthèse/ <SEP> x, <SEP> Oui <SEP> Oui
<tb> différentielles <SEP> Dégradation
<tb> ordinaires <SEP> non
<tb> linéaires
<tb> Equations <SEP> Oui <SEP> Synthèse/ <SEP> x, <SEP> Oui <SEP> Oui
<tb> différentielles <SEP> Dégradation
<tb> linéaires
<tb> Equations <SEP> Oui <SEP> Synthèse/ <SEP> x, <SEP> Oui <SEP> Oui
<tb> différentielles <SEP> Dégradation/
<tb> partielles <SEP> Diffusion
<tb> Méthodes
<tb> mixtes <SEP> ~~~~~~~~~~~~~
<tb> Equations <SEP> Oui <SEP> Synthèse/ <SEP> Discrétisation <SEP> Non <SEP> Non
<tb> différentielles <SEP> Dégradation <SEP> et <SEP> de <SEP> x, <SEP>
<tb> qualitatives <SEP> Discrétisation
<tb> des <SEP> variables
<tb>
Tableau 1 :Comparaison des méthodes de modélisation : principes sousjacents Ce tableau doit être lu en considérant les éléments suivants :
<Desc/Clms Page number 10>
(1) Intégration de données quantitatives : certaines méthodes ne sont pas conçues pour utiliser et analyser des données quantitatives expérimentales biologiques (formalismes rule-based), ou les modifient de façon importante lorsqu'elles imposent une discrétisation des variables (réseaux booléens, etc. ), d'où la notation : intégration "partielle". Ces méthodes ont toutes été initialement conçues pour s'affranchir au maximum de telles données. Ceci les limite dans leur fiabilité et dans leur possibilité d'application pour la recherche systématique de cibles thérapeutiques sur de grands réseaux.
(2) Formalisme :il s'agit des principes de représentation des interactions biologiques utilisés dans la méthode. On/off : les molécules sont soit présentes, soit absentes, sans état intermédiaire possible. Discrétisation des variables : le taux des molécules peut prendre un nombre limité de valeurs finies ; il s'agit d'un raffinement du formalisme précédent, mais qui représente mal la réalité biologique où les taux des molécules varient de façon continue. Probabilité de réaction chimique : spécifique des méthodes probabilistes où l'évolution du réseau est liée à la probabilité estimée des évènements moléculaires individuels. Synthèse/ Dégradation : les effets des interactions sont représentées comme limités à des réactions de synthèse ou de dégradation des molécules, ces représentations étant celles des équations élémentaires de chimie, en général limitées à la loi d'action de masse (dont l'expression élémentaire est : si A+BC, à l'équilibre: [C]=k1 [A][B]). Diffusion: la diffusion des molécules dans le système biologique étudié ou hors du système biologique étudié (par exemple une cellule) est aussi prise en compte, comme équivalente à une synthèse ou à une dégradation (respectivement) au sein du système.
(3) Variables utilisées : toutes les méthodes existantes définissent les variables comme étant le taux, ou la concentration, ou la quantité totale, des molécules, noté ici x, pour la molécule i, et non sa proportion de variation par rapport à un état étalon x,o.
<Desc/Clms Page number 11>
(4) Fonctions continues : pour une fonction continue, les variables changent de façon continue (comme c'est le cas dans les systèmes biologiques réels) et non discrète.
(5) Modèle déterministe : une fois le modèle calculé, le réseau ne peut passer d'un état à un autre que par un seul chemin (séquence unique d'états intermédiaires). Le fait qu'un modèle soit déterministe permet d'obtenir une croissance linéaire de la quantité de calculs lors des simulations. A l'inverse, dans les modèles non déterministes, la quantité de calcul requise lors des simulations tend à croître de façon exponentielle avec la taille du réseau, pouvant aboutir à une impossibilité de mise en #uvre pour de grands réseaux.
Du fait de leurs caractéristiques résumées dans le tableau 1, ces différentes méthodes nécessitent des pré-requis et sont utilisables dans des applications qui sont résumées dans le tableau 2 ci-dessous :
<Desc/Clms Page number 12>
Figure img00120001
<tb>
<tb> Pré-requis <SEP> Applications
<tb> (1) <SEP> (2) <SEP> (3) <SEP> (4) <SEP> (5)
<tb> Niveau <SEP> requis <SEP> Croissance <SEP> Taille <SEP> Applicable <SEP> à <SEP> Mise <SEP> en <SEP> #uvre
<tb> de <SEP> de <SEP> la <SEP> maximale <SEP> de <SEP> de <SEP> réseaux <SEP> pour
<tb> connaissance <SEP> quantité <SEP> de <SEP> réseau <SEP> mis <SEP> de <SEP> 1000 <SEP> à <SEP> l'identification
<tb> Méthode <SEP> fonctionnelle <SEP> calcul <SEP> en <SEP> #uvre <SEP> 100000 <SEP> systématique <SEP> de
<tb> du <SEP> réseau <SEP> requise <SEP> en <SEP> molécules <SEP> cibles
<tb> biologique <SEP> fonction <SEP> de <SEP> thérapeutiques
<tb> la <SEP> taille <SEP> du
<tb> # <SEP> réseau <SEP> #
<tb> Méthodes
<tb>
Figure img00120002

qualitatives ~~~~~~~~~~~~~~ ~~~~~~~~~~~~~~~~~~~~~~~~
Figure img00120003
<tb>
<tb> Réseaux <SEP> C <SEP> C <SEP> <100 <SEP> Non <SEP> Non <SEP>
<tb> booléens <SEP> molécules <SEP> Non <SEP> Non
<tb> Formalismes <SEP> <100
<tb> logiques <SEP> C <SEP> C <SEP> molécules <SEP> Non <SEP> Non
<tb> généralisés~~~~~~~~~~~~~~ <SEP> molécules
<tb> Formalismes <SEP> <100
<tb> "rule-based" <SEP> C <SEP> B <SEP> molécules <SEP> Non <SEP> Non
<tb> Méthodes
<tb> probabilistes <SEP> ~~~~~~~~~~~~~~~ <SEP> ~~~~~~~~~~~~~~
<tb> Equations <SEP> <100 <SEP> Non <SEP> Non <SEP>
<tb> stochastiques <SEP> B <SEP> C <SEP> molécules <SEP> Non <SEP> Non
<tb> Réseaux <SEP> A <SEP> C <SEP> <100 <SEP> Non <SEP> Non <SEP>
<tb> Bayésiens <SEP> molécules <SEP> Non <SEP> Non
<tb> Méthodes
<tb> d'équations
<tb> différentielles <SEP> ~~~~~~~~~~~~~~~ <SEP> ~~~~~~~~
<tb> Equations
<tb> différentielles <SEP> C <SEP> B <SEP> <100 <SEP> Non <SEP> Non
<tb> ordinaires <SEP> non <SEP> molécules <SEP> Non <SEP> Non
<tb> linéaires <SEP> ~~~~~~~~~~~~~~~ <SEP> ~~~~~~~
<tb> Equations <SEP> <100
<tb> différentielles <SEP> C <SEP> A <SEP> molécules <SEP> Non <SEP> Non
<tb> linéaires
<tb> Equations <SEP> <50
<tb> différentielles <SEP> C <SEP> C <SEP> molécules <SEP> Non <SEP> Non
<tb> partielles <SEP> ~~~~~~~~~~~~~~~ <SEP> molécules
<tb> Méthodes
<tb> mixtes <SEP> ~~~~~~~~~~~~~~ <SEP> ~~~~~~~
<tb> Equations <SEP> <100
<tb> différentielles <SEP> C <SEP> C <SEP> molécules <SEP> Non <SEP> Non
<tb> qualitatives~~~~~~~~~~~~~~ <SEP> molécules
<tb>
Tableau 2 : comparaison des méthodes de modélisation de l'art antérieur : pré-requis et applications possibles.
Le tableau 2 doit être lu en considérant les éléments suivants :
<Desc/Clms Page number 13>
(1) Connaissance fonctionnelle du réseau biologique : Niveau A : connaissance de l'existence en soi des interactions moléculaires, et au moins une partie de leurs orientations et une partie des effets des interactions (activation/ inhibition ou synthèse/ dégradation). Seule la connaissance de niveau A est largement disponible à ce jour. Par conséquent, seule une méthode ne requérant qu'une connaissance de niveau A peut être appliquée à des réseaux étendus.
Niveau B : A avec toutes les orientations des interactions et de tous les effets des interactions.
Niveau C :connaissance fonctionnelle étendue du réseau, c'est-à-dire niveau B plus d'autres données telles que : constantes des vitesses des réactions chimiques, description d'effets de seuil, description d'effets allostériques, etc. A ce jour, quel que soit l'organisme vivant considéré, pour la plupart des molécules des réseaux d'interactions moléculaires les connaissances de niveau C ne sont pas disponibles. Une description fonctionnelle détaillée du réseau biologique est nécessaire à la mise en oeuvre de la méthode lorsque des connaissances de niveau C sont requises. Du fait de l'indisponibilité des connaissances de niveau C pour la plupart des molécules, toute méthode requérant ce type de connaissance pour sa mise en #uvre ne peut être appliquée qu'à de très petits réseaux bien étudiés et connus (quelques dizaines de molécules au maximum) et est de fait inadaptée à son application à de grands réseaux (de plus de 100 à 150 molécules).
(2) Puissance de calcul : Niveau A : croissance linéaire avec la taille du réseau (en nombre de molécules) de la quantité de calcul requise. Ceci correspond à la possibilité de mise en #uvre sur un serveur de puissance standard (grand public).
Les méthodes mettant en #uvre des calculs dont la quantité croît de façon linéaire avec la taille du réseau peuvent être appliquées à des réseaux étendus (sous réserve de ne pas présenter d'autre limite à cette application).
<Desc/Clms Page number 14>
Niveau B : de la quantité de calcul intermédiaire entre les cas A et C. Les méthodes mettant en oeuvre des calculs dont la quantité croît de façon intermédiaire entre A et C sont théoriquement applicables à des réseaux étendus mais à un coût élevé voire très élevé (et sous réserve de ne pas présenter d'autre limite à cette application).
Niveau C : croissanceexponentielle avec la taille du réseau (en nombre de molécules) de la quantité de calcul requise. Toute méthode mettant en oeuvre des calculs dont la quantité croît de façon exponentielle avec la taille du réseau requiert une très grande puissance de calcul. A titre d'exemple, certaines applications des réseaux bayésiens nécessitent environ 30 minutes de temps de calcul sur un serveur équipé d'un processeur de 1,2 Giga Hertz pour un réseau de 8 molécules : sur un réseau de 32 molécules, le temps de calcul sur le même ordinateur serait dans ce cas de plus d'un an et demi. En pratique, même avec des ordinateurs les plus puissants actuels les méthodes présentant une croissance exponentielle du temps de calcul ne sont pas applicables à de grands ou très grands réseaux (quelques milliers à quelques dizaines de milliers de molécules et plus ; certaines d'entre elles ne sont pas applicables même à des réseaux de quelques centaines de molécules).
(3) Taille maximale de réseau mis en oeuvre : il s'agit de la taille maximale des réseaux sur lesquelles la méthode a pu être mise en #uvre à ce jour avec succès.
(4) Applicable à de réseaux de 1000 à 100000 molécules : cette possibilité d'application est liée (i) aux principes intrinsèques de la méthode (par exemple les réseaux Bayésiens, qui sont des réseaux linéaires et donc non adaptés à de grands réseaux biologiques comprenant des boucles de rétrocontrôle ne peuvent pas être appliqués à de grands réseaux), (ii) au niveau A, B ou C de connaissance fonctionnelle du réseau biologique requise, la nécessité d'une connaissance de niveau C rendant de fait la méthode inadaptée aux grands réseaux, et la nécessité d'une connaissance de niveau B la rendant très difficilement applicable à de tels réseaux, et (iii) à
<Desc/Clms Page number 15>
la puissance de calcul requise (niveaux A, B ou C), une croissance du temps de calcul de niveau C étant de fait non compatible avec une mise en #uvre sur de grands réseaux, et une croissance de niveau B rendant la méthode très difficilement applicable à de tels réseaux.
(5) Mise en #uvre pour l'identification systématique de cibles thérapeutiques : il s'agit de la mise en #uvre effective de la méthode dans une recherche systématique de cibles au sein du réseau, sans a priori.
Aucune des méthodes existantes n'a pu être mise en #uvre dans cette application à ce jour.
Toutes ces méthodes sont peu fiables dans leurs prédictions dès lors que le réseau dépasse une cinquantaine de molécules. Elles sont donc mal adaptées pour réaliser des modèles dynamiques corrects des réseaux d'interactions moléculaires des organismes vivants qui présentent les caractéristiques suivantes : - un grand nombre de types moléculaires différents sont impliqués : de quelques centaines à quelques dizaines de milliers, voire centaine de milliers, - les cascades mettent en jeu des boucles de rétro-action, avec une redondance des circuits, - les vitesses de propagation des activations / inhibitions des molécules au sein des réseaux sont différentes en fonction des circuits (i.e. des chemins de propagation au sein du réseau), - des réseaux extrêmement complexes difficiles à modéliser.
Pour être réellement applicable à la prise en compte des données de génomique, transcriptomique et protéomique produites à grande échelle, dans un objectif d'identification systématique de cibles thérapeutiques, les modèles dynamiques construits doivent permettre de modéliser des cascades d'interactions moléculaires telles que décrites ci-dessus.
<Desc/Clms Page number 16>
Le fait de produire un modèle de la dynamique d'un réseau d'interactions moléculaires biologiques ne suffit pas en soi pour pouvoir sélectionner de façon fiable et rationnelle de nouvelles cibles thérapeutiques. A ce jour, toutes les méthodes développées n'ont pu être appliquées qu'à la simple description de processus moléculaires dans des réseaux biologiques de petite taille (quelques dizaines de molécules au plus) et à quelques simulations visant à reproduire des modifications connues du réseau.
Aucune n'a été appliquée à la sélection systématique de cibles thérapeutiques parmi l'ensemble des molécules du réseau, y compris sur ces petits réseaux, et a fortiori sur de grands réseaux. En effet, une telle application requiert la mise en #uvre d'une stratégie de simulations appropriée, telle que décrite dans l'invention, et qui n'a pas été décrite avec les méthodes existantes (et pour certaines d'entre elles, n'est pas applicable même sur de petits réseaux).
Cette application, à savoir la sélection de cibles thérapeutiques à partir de modélisations dynamiques des réseaux d'interactions moléculaires de grande taille effectivement mis en jeu dans les processus pathologiques n'est donc pas atteint par les méthodes décrites à ce jour.
La présente invention a pour objectif de fournir une méthode d'obtention de modèles dynamiques de réseaux d'interactions moléculaires dans un système biologique, qui rendent possibles ce type d'applications.
Pour une bonne intelligibilité de ce texte, un certain nombre de termes sont définis ci-dessous.
Par interaction moléculaire entre deux (ou plus) molécules biologiques, il est entendu ici une interaction où une molécule (ou plus) active ou inhibe une autre molécule (ou plus). Le cas où une molécule d'un type donné interagit avec une autre molécule du même type n'est qu'un cas particulier de cette définition générale. Deux molécules sont définies ici comme étant du même type si elles ont la même formule chimique.
L'activation (ou l'inhibition, respectivement) est définie ici comme l'augmentation (ou la diminution, respectivement) de l'activité biologique de
<Desc/Clms Page number 17>
la (ou des) molécule(s) sur laquelle (ou lesquelles) s'exerce l'interaction considérée. Cette augmentation (ou cette diminution, respectivement) de l'activité biologique peut correspondre soit à une augmentation (ou une diminution, respectivement) du nombre de molécules d'un type donné présentes dans le système biologique analysé, chacune gardant la même activité (ou fonction) biologique, soit à une augmentation (ou une diminution, respectivement) de l'activité des molécules d'un type donné, leur nombre restant constant, soit à une combinaison de ces deux mécanismes, soit à la résultante de ces deux mécanismes. L'activation (ou l'inhibition, respectivement) peut aussi être la conséquence d'une augmentation (ou d'une diminution, respectivement) du nombre de molécules associée à une diminution (ou une augmentation, respectivement) de leur activité biologique, si la résultante globale en est une augmentation globale (ou une diminution globale, respectivement) de l'activité, et vice-versa.
L'activation (ou l'inhibition, respectivement) peut être non-nulle ou nulle en fonction des molécules considérées et du système biologique considéré.
Elle peut être variable au cours du temps. Le fait que certaines interactions du réseau d'interactions moléculaires considéré correspondent à une activation (ou une inhibition, respectivement) nulle n'est qu'un cas particulier du champ de l'invention.
L'activité biologique d'une (ou de) molécule(s) biologique(s) considérée (s) correspond à toute capacité de la (ou des) molécules considérées à avoir une interaction chimique et/ou physique avec toute autre molécule d'un autre type (ou avec une autre molécule du même type). Cette interaction chimique et/ou physique peut résulter ou non dans l'acquisition (ou la perte) par une des molécules interagissant de capacités à avoir une interaction chimique et/ou physique avec toute autre molécule d'un autre type (ou avec une autre molécule du même type). Les interactions chimiques sont toute interaction entre deux molécules (ou plus) provoquant une réaction chimique (pouvant être représentée par une modification de la formule
<Desc/Clms Page number 18>
chimique d'une molécule, ou la synthèse, ou la dégradation d'une molécule). Les interactions physiques sont toute interaction entre deux molécules (ou plus) provoquant la formation d'un complexe stable ou instable entre ces molécules. Des exemples d'activités biologiques de molécules et d'interactions moléculaires correspondantes sont (de façon non exclusive) : l'activité d'activation de la transcription d'un gène donné (interaction moléculaire : protéine (facteur de transcription) - ADN), l'activité de mise en oeuvre d'une réaction chimique (interaction moléculaire : protéine (enzyme) - molécule (substrat), permettant la transformation de la molécule-substrat en molécule-produit de la réaction chimique), l'activité de formation d'un complexe moléculaire protéique ayant lui-même telle ou telle activité biologique (interaction moléculaire : protéine (sous-unité du complexe) - protéine (sous-unité du complexe)), etc.
Par molécule biologique, il est entendu ici toute molécule, quelle que soit sa complexité, présente dans le système biologique considéré.
Par système biologique, il est entendu ici tout organisme vivant, qu'il soit prokaryote ou eukaryote, et qu'il soit unicellulaire ou pluricellulaire, et que le système biologique corresponde à cet organisme dans son entier ou à une partie de cet organisme. A titre d'exemples, on peut citer : Organismes entiers - Une cellule (eucaryote ou procaryote) dans son ensemble.
- Un ensemble de cellules interagissant directement ou indirectement entre elles, ou n'interagissant pas entre elles :
0 l'ensemble des cellules en culture dans une boite de Pétri ;
0 l'ensemble des cellules en formant un organe ou une partie de cet organe : noyau amygdalien d'un cerveau de mammifère.
- Un être vivant pluricellulaire.
- Les différents exemples plus leur environnement.
Partie d'un organisme : - Un organelle d'une cellule, tel qu'une mitochondrie.
<Desc/Clms Page number 19>
- Un ensemble de molécules participant à une fonction biologique donnée, tel qu'un ensemble de molécules participant à la respiration cellulaire, ou un ensemble de molécules participant à la mort cellulaire, que cet ensemble de molécules soit constitué de toutes les molécules participant à ladite fonction biologique où une partie seulement d'entre elles.
L'ensemble des molécules formant le réseau d'interactions moléculaires tel qu'il est décrit sous forme d'un graphe statique dans la figure 2 est un exemple de système biologique.
De nombreux graphes statiques sont par exemple disponibles dans la base de données publique KEGG (M. Kanehisa and S. Goto : KEGG :Kyoto Encyclopedia of Genes and Genomes. Nucleic Acids Research, 28(1) : 27- 30, 2000).
Tout système biologique est constitué de molécules, ces molécules interagissant les unes avec les autres de façon plus ou moins stable et variable au cours du temps et des effets de l'environnement de ce système sur le système biologique lui-même. A titre d'exemple, l'apoptose (mécanisme de mort cellulaire) est la résultante de l'interaction de multiples molécules (hormones, protéines, seconds messagers, etc...) qui, pour certaines d'entre elles, ont des interactions physiques ou chimiques plus ou moins stables au cours du temps.
Par réseau d'interactions moléculaires il est entendu ici l'ensemble des molécules analysées par la méthode de l'invention associé à l'ensemble (ou une partie de cet ensemble) de leurs interactions biologiques possibles.
Le réseau peut comprendre toutes les molécules du système biologique concerné, ou seulement une partie de ces molécules. Pour plus de clarté, le réseau peut être représenté visuellement sous la forme d'un graphe (comme un exemple en est donné dans la description ci-dessous). C'est ce type de représentation visuelle qui est à l'origine de l'utilisation du terme de "réseau". Une telle représentation n'est cependant pas un pré-requis de l'invention. Le réseau peut aussi être représenté par un tableau (ou une
<Desc/Clms Page number 20>
matrice) dont par exemple chaque ligne correspond à une des molécules du réseau et dont les colonnes correspondent aux caractéristiques des interactions biologiques possibles de ces molécules (ou d'une partie de ces interactions ou de leurs caractéristiques).
Un graphe est ici une représentation du réseau d'interactions moléculaires sous la forme d'un graphe dont les sommets (ou n#uds) correspondent aux molécules du réseau d'interactions moléculaires représenté et dont les arrêtes (ou arcs) reliant les sommets correspondent aux interactions moléculaires du réseau d'interactions moléculaires représenté. Dans la suite du texte, il sera très souvent fait référence à un tel graphe, bien qu'il ne soit pas indispensable d'en réaliser un physiquement. Etant donné qu'il ne s'agit que d'une représentation symbolique du réseau, une référence au graphe correspond en réalité à une référence au réseau.
Par variable associée à un sommet du graphe, il est entendu ici une variable quantitative au sens mathématique du terme, pouvant prendre des valeurs numériques, et dont la valeur à un état donné du graphe représente l'état du sommet correspondant en ce qui concerne une quantité se rapportant à une molécule du système biologique considéré. Suivant les cas, cette quantité peut être un niveau d'expression d'un gène exprimé dans le système biologique (par exemple, l'abondance d'ARN messagers, mesurable notamment par la technique des puces à ADN), un niveau d'abondance d'une protéine, un niveau d'activité d'une protéine, un niveau d'abondance d'un métabolite, etc, pourvu que la quantité considérée soit mesurable expérimentalement, par un moyen direct ou non.
Un état d'un graphe est un graphe pour lequel une valeur numérique est donnée pour chaque variable (associée à chaque sommet). Le cas où une valeur numérique non nulle n'est donnée que pour une partie des variables (et associée aux sommets correspondants), une autre partie des variables (associées à d'autres sommets) étant nulles, n'est qu'un cas particulier d'état du graphe. Un état du graphe donné est une représentation d'un état réel ou simulé du réseau d'interactions moléculaires correspondant, et par
<Desc/Clms Page number 21>
extension une représentation d'un état réel ou simulé du système biologique correspondant. A titre d'exemple, dans certaines représentations d'un réseau d'interactions moléculaires sous la forme d'un graphe, le fait de donner à une variable associée à un sommet du graphe la valeur nulle peut correspondre à une représentation de la situation où la molécule correspondant à ce sommet n'est pas présente dans le réseau d'interactions (ce qui ne signifie pas qu'elle n'est pas présente dans le système biologique), ou bien de la situation où son activité biologique est nulle. Le fait de donner une valeur nulle à un certain nombre de variables correspond donc à considérer qu'à un temps donné celles-ci n'interagissent pas avec le reste du réseau, mais leur valeur peut devenir non nulle à un autre temps suite à une modification de l'état du réseau. Le fait de donner une valeur nulle à une variable ne revient donc pas nécessairement à exclure le sommet correspondant du réseau.
Dans certains cas particuliers, il est possible de donner une valeur constamment nulle à un certain nombre de variables, ce qui correspond alors à exclure les sommets correspondants du réseau et donc à travailler sur un sous-réseau. Pour travailler sur un sous-réseau, on préférera toutefois faire une hypothèse conservatrice, c'est-à-dire considérer la valeur des variables exclues comme constante, ce qui permet de ne pas modifier la structure du réseau.
L'invention met en jeu un système informatique, contenant au moins un microprocesseur, une mémoire, et un logiciel mettant en oeuvre les calculs requis. Le logiciel peut éventuellement être composé de plusieurs modules opérant chacun certaines des étapes de calcul. L'ensemble forme un outil d'analyse de données expérimentales biologiques, et notamment un outil de hiérarchisation de molécules biologiques vis-à-vis d'un problème biologique.
<Desc/Clms Page number 22>
La présente invention a entre autres pour objet d'apporter des solutions techniques aux difficultés exposées plus haut, notamment en apportant la possibilité de construire des modèles dynamiques utilisables pour des réseaux d'interactions moléculaires de plus de 100, de plus de 200 molécules ou même davantage, dans les applications décrites.
Un premier aspect de l'invention est un procédé d'obtention d'un modèle dynamique d'un réseau d'interactions moléculaires dans un système biologique, par la mise en oeuvre d'un système informatique, comprenant les étapes suivantes : A) à partir d'un graphe statique dont les sommets représentent des molécules biologiques et les arcs représentent des interactions physico-chimiques entre ces molécules, on associe une variable quantitative X, à chaque sommet, et une relation mathématique, de préférence continue, à chaque arc du graphe, chacune desdites relations présentant les caractéristiques suivantes : - elle comprend un terme inertiel (i) qui tend vers une limite finie, - elle comprend un terme (ii) tendant à faire revenir les variables à leur état initial, et dont la variation en fonction du temps croit en valeur absolue de façon plus lente que la variation en fonction du temps du terme inertiel (i), - elle comporte un facteur de pondération wij qui permet de tenir compte de la combinaison d'effets pouvant s'exercer sur chaque sommet du graphe, - les paramètres de ces fonctions ou relations sont définis de façon à pouvoir être directement calculables à partir des données expérimentales ;
B) on calcule ensuite les paramètres de chaque relation à partir de données expérimentales quantitatives concernant les sommets du graphe, par la mise en oeuvre de techniques d'apprentissage utilisées pour le paramétrage de réseaux en intelligence artificielle.
<Desc/Clms Page number 23>
Le signe réel du terme (ii) est déterminé par le résultat du calcul de son ou ses paramètre(s). Ce terme (ii) est de signe inverse au terme (i) une fois les paramètres calculés, mais cela n'apparaît pas obligatoirement dans sa formulation mathématique, où l'on ne précise pas a priori le signe du ou des paramètre (s) associé (s).
Dans une mise en #uvre préférée du procédé ci-dessus, chaque variable quantitative associée à un sommet représente la variation relative de la quantité de la molécule correspondant audit sommet, par rapport à un état étalon du système biologique. Comme mentionné ci-dessus, la "quantité de la molécule associée à un sommet" peut concerner n'importe quel aspect mesurable directement ou non ce cette molécule, qu'il s'agisse de sa concentration, son activité, son taux d'expression, etc. Dans cette variante où les X, sont des rapports à un état étalon, ledit état étalon est de préférence un état stable du système biologique, dans lequel la quantité de chaque molécule associée à un sommet du graphe est mesurable expérimentalement. Comme reprécisé dans la description d'une mise en #uvre pratique ci-dessous, cet état étalon peut correspondre à un état physiologique donné (par exemple sain ou malade) réellement observable, ou à un état artificiel du système, par exemple à l'état d'un un pool de plusieurs échantillons biologiques prélevés dans des conditions expérimentales différentes.
Les variations relatives de quantité des molécules du réseau sont donc représentées sous la forme de variables dépendantes des variations relatives de quantité des molécules interagissant sur elles (i. e. en interaction avec elles et en amont dans le réseau en termes de propagation des activations / inhibitions). La définition des variables correspond directement aux mesures expérimentales disponibles : en effet, dans la plupart des technologies de biologie moléculaire (dont les criblages d'expression d'ARN messagers), la quantité absolue des molécules présentes dans le système biologique d'intérêt n'est pas mesurée (ni
<Desc/Clms Page number 24>
mesurable) ; seule la proportion de leur variation par rapport à un état de référence est mesurable.
Soit les n molécules j (1-n), représentée par les n sommets j (1#n) du réseau, interagissant sur la molécule i, représentée par le sommet i du réseau. Dans les procédés d'obtention d'un modèle dynamique d'un réseau d'interactions moléculaires dans un système biologique selon l'invention, les termes inertiel (i) et de retour à l'état initial (ii) permettent de calculer les valeurs de Xi et les variations de valeurs de Xi au cours du temps en fonction des valeurs des Xj (1#n) et des variations des valeurs des Xj (1-n) au cours du temps.
Par l'expression "terme inertiel", on entend : - une résistance au changement, résistance notamment initiale, et - un délai pour arriver à la variation maximale, ce qui permet de rendre compte des complexités des propagations dans le réseau.
En particulier, le terme inertiel (i) a pour objet de permettre d'intégrer une résistance des variables au changement et un décalage temporel entre les modifications des variables en amont et aval du réseau. Il introduit en particulier : - l'intégration du facteur temps - la prise en compte des différences de vitesses de propagation au sein du réseau en fonction des sous-circuits - la prise en compte des retards temporels consécutifs aux influences des boucles de rétro-contrôle sur la propagation dans le réseau, et - il permet de calculer les cinétiques des interactions moléculaires au sein du réseau directement à partir des données expérimentales, sans connaissance préalable des constantes de vitesse de ces cinétiques, et sans faire d'a priori sur d'éventuels autres paramètres.
Ce terme inertiel (i) tend vers une limite finie, ce qui permet d'éviter des divergences importantes lors des simulations (amélioration de leur
<Desc/Clms Page number 25>
fiabilité) :ceci évite le risque de divergence (ou d' "explosion") des valeurs des variables liées à des propagations itératives dans des boucles de rétroaction ou lors de simulations portant sur des temps prolongés. Le fait de pouvoir, en évitant de telles divergences, obtenir des convergences satisfaisantes lors de simulations portant sur des durées longues (qui soient en rapport par exemple avec les temps d'installation de processus pathologiques), est une caractéristique importante de l'invention.
La formulation de ce terme inertiel est de préférence peu contraignante, et permet de rendre compte de formes multiples de relations. Pour cela, il peut être avantageusement exprimé sous la forme d'une relation mathématique présentant une ou plusieurs inflexion(s), ce qui permet de limiter les contraintes imposées aux modèles et de pouvoir pratiquer des modélisations fiables dans les situations où la forme des cinétiques n'est pas connue a priori, ce qui est une situation constante dès que l'on modélise un grand réseau (plus d'une centaine de molécules). Des exemples de telles sous-relations mathématiques pouvant être utilisées sont les relations sigmoïdes, les relations d'oscillation, et, d'une façon générale, toute fonction mathématique tendant à une ou des limite(s) finie (s) et pouvant être infléchie.
Le terme (ii) tendant à faire revenir les variables à leur état initial (ou d'équilibre antérieur), permet de rendre compte des phénomènes d'homéostasie et de l'existence d'états d'équilibre du réseau, tout en diminuant de façon significative les risques de divergence lors des simulations (amélioration de leur fiabilité). Une fois les paramètres des relations mathématiques calculés, il est de signe réel inverse au terme inertiel (i), et sa variation au cours du temps croit en valeur absolue de façon plus lente (i.e., de façon temporellement plus tardive) que la variation en fonction du temps du terme inertiel (i).
<Desc/Clms Page number 26>
Par le terme (i), X, et les variations de X, dépendent des Xj (1#n) et des variations des Xj (1n). Le terme (i), qui fait tendre X, vers une valeur finie, est donc exprimé en fonction des Xj (1#n).
Le terme (ii) est, lui, exprimé en fonction de X, (et non des X, (1 n)). La valeur de ce terme ne peut donc changer que si la valeur de X, change, celle-ci changeant si les valeurs des Xj (1 n) changent.
Toute variation initiale de l'effet du terme (ii) sur la valeur calculée de X, peut donc être considérée comme consécutive à une variation préalable de l'effet du terme (i) sur la valeur calculée de X,. Ceci s'applique notamment si l'on considère qu'il existe un état stable du réseau ; à l'état stable, les termes (i) et (ii) s'équilibrent, de telle sorte que X, reste constant ; à partir de cet état, toute variation de X, est consécutive à une situation où l'effet du terme (i) sur la variation de X, est plus grand en valeur absolue que l'effet du terme (ii) sur la variation de X,.
En effet, une fois les paramètres des termes (i) et (ii) calculés, le terme (ii) calculé est de signe opposé au terme (i) calculé, et tend, lors du calcul des valeurs de X, à diminuer l'effet du terme (i) sur les variations des valeurs de X,.
Par conséquent, X, ne peut présenter une variation que si, à un temps donné au moins, la variation de X, au temps suivant calculée par le terme (ii) est inférieure en valeur absolue à la variation de X, au temps suivant calculée par le terme (i).
En d'autres termes, X, ne peut présenter une variation, à partir d'un état stable, que si, sur un espace de temps donné au moins, la variation de la valeur calculée du terme (ii) est inférieure en valeur absolue à la variation de la valeur calculée du terme (i).
Cette caractéristique est inhérente au fait que le terme (i) est exprimé en fonction des Xj (1n) alors que le terme (ii) est exprimé en fonction de X,.
A partir d'un état stable, la variation du terme (ii) est initialement inférieure en valeur absolue à la variation du terme (i).
<Desc/Clms Page number 27>
Lors de l'évolution de la valeur de X, au cours du temps, l'effet du terme (ii) sur la variation de X, peut, ou non, devenir supérieur à l'effet du terme (i) sur la variation de X,. Si c'est le cas, X, va tendre à retourner vers sa valeur initiale.
En fonction des valeurs des paramètres calculés des termes (i) et (ii), des valeurs des Xj (1#n) et des valeurs de X,, X, peut éventuellement retourner à sa valeur initiale, ceci notamment si les Xj (1#n) retournent à leur valeur initiale.
Si un stimulus est appliqué de façon constante sur un ou plusieurs sommets du réseau, on peut cependant aboutir à une situation où les Xj (1n) ne retournent pas à leur valeur initiale. Dans ce cas, X, peut ne pas retourner à sa valeur initiale. Si, à un temps donné, les effets des termes (i) et (ii) sur la variation de X, s'équilibrent à nouveau, on aboutira alors à une nouvelle stabilité de X,, à une valeur différente de sa valeur initiale.
La méthode permet donc de rendre compte du passage du réseau d'un état stable donné à un autre état stable, différent. Elle permet aussi de rendre compte de l'évolution du réseau lors d'états instables.
Enfin, comme le terme (i) fait tendre X, vers une limite finie, et comme le terme (ii) est exprimé en fonction de X,, le terme (ii) est contraint par X, : par la résultante des termes (i) et (ii) la valeur calculée de X, ne peut sortir d'un intervalle fini. Cette caractéristique (X, tendant vers une limite finie par le terme (i) et expression du terme (ii) en fonction de X,) permet de rendre compte d'états stables, et de contraindre les valeurs de X, dans un intervalle fini.
Le fait de pouvoir calculer les paramètres des relations associées aux arcs du graphe directement à partir des données expérimentales, sans nécessiter d'hypothèse préalable ou de fixation à des valeurs arbitraires, est rendu possible par l'utilisation de relations de forme peu contraignante, ne requérant pas une connaissance préalable des cinétiques des interactions moléculaires.
<Desc/Clms Page number 28>
Comme mentionné ci-dessus, les procédés d'obtention d'un modèle dynamique d'un réseau d'interactions moléculaires dans un système biologique selon l'invention comportent une deuxième étape (étape B), dans laquelle on calcule les paramètres des relations associées à chacun des arcs du graphe, à partir de données expérimentales quantitatives concernant les sommets du graphe. Ce calcul est effectué de préférence par la mise en #uvre de techniques d'apprentissage. On obtient alors un graphe dynamique, entièrement déterministe, consistant au graphe statique aux arrêtes duquel sont désormais associées des relations mathématiques dont les paramètres ont tous été définis numériquement.
Cette étape de calcul peut être effectuée par l'utilisation de procédures d'apprentissage utilisées pour le paramétrage de réseaux en intelligence artificielle, par exemple celles développées en informatique dans les méthodes de "réseaux de neurones" (dont les réseaux de neurones récurrents) par descente de gradient "simple" (en prenant comme base de calcul les couples de données (X,,Xj) fournis par les données expérimentales indépendamment les uns des autres), ou par descente de gradient dans le temps (où ces couples ne sont pas considérés comme indépendants). Les couples de données (X,,Xj) fournis par les données expérimentales sont définis comme suit : soit i une molécule du réseau, représentée par le commet i, et soit j toute molécule du réseau interagissant sur i, représentée par le sommet j. X, et Xj sont les variables associées aux sommets i et j, respectivement. Les mesures expérimentales des valeurs des X, et des Xj dans des conditions expérimentales données et à des temps expérimentaux donnés permettent d'obtenir des valeurs numériques des X, et des Xj. Un couple de données expérimentales (Xi,Xj) correspond aux valeurs mesurées de X, et Xj à un état expérimental donné (même temps, même condition expérimentale).
<Desc/Clms Page number 29>
Les données expérimentales utilisées pour réaliser l'étape B) mentionnée ci-dessus présentent les caractéristiques suivantes : Nature des données expérimentales. Ces données sont des données quantitatives concernant les molécules (correspondant aux sommets du graphe) et sont par exemple des niveaux d'expression de gènes exprimés dans le système biologique (par la mesure de l'abondance d'ARN messagers, par exemple par la technique des puces à ADN) et / ou des niveaux d'abondance de protéines et /ou des niveaux d'activité des protéines et/ ou des niveaux d'abondance de métabolites. Comme précisé plus haut, ces données sont exprimables sous la forme d'une proportion de variation de quantité par rapport à une situation de référence (état étalon).
Compilation des données de réseau statique (ou graphe statique : identification d'interactions j # i) et des données expérimentales (mesures de valeurs des variables X,). Ces données peuvent être extraites de la littérature scientifique au sens large, ceci incluant les bases de données biologiques publiques ou privées (telles que par exemple la base de données "TRANSFAC' du "German Research Centre for Biotechnology (GBF) accessible par l'adresse internet : http://transfac.gbf.de/ (Wingender et al., 2001, The TRANSFAC system on gene expression regulation, Nucleic Acids Research, 29 (1) :281-283), ou encore la base de données " BIOMOLECULAR INTERACTION NETWORK DATABASE" (BIND) de l'université de Toronto, accessible par l'adresse internet : http://www.bind.ca (Bader et al., 2003, BIND : the biomolecular interaction network database, Nucleic Acids Research 31 : 248-250), ou encore la base de données KEGG (M. Kanehisa and S. Goto : KEGG : Kyoto Encyclopedia of Genes and Genomes. Nucleic Acids Research, 28(1) : 27- 30,2000), ou bien être générées par des expériences de biologie moléculaire dédiées, notamment par l'utilisation des techniques de criblages à grande échelle. En fonction du système biologique d'intérêt, des molécules formant le réseau d'interactions moléculaires, de la
<Desc/Clms Page number 30>
problématique scientifique biologique (étude d'un modèle de maladie, étude de toxicité d'un produit, étude de processus du développement, etc. ), des paradigmes expérimentaux adéquats ou disponibles (cultures de cellules, étude de tissus, etc.), la personne de l'art définira le type de données expérimentales d'intérêt. Des exemples du type de données utilisables en fonction des applications de l'invention sont donnés ci-après, dans la description de la méthode des simulations.
L'homme du métier mettra donc en #uvre la ou les méthodes de compilation lui convenant le mieux pour effectuer cette étape, qui intervient en amont de la méthode d'analyse constituant la présente invention.
Enregistrement des données expérimentales. Ces données expérimentales sont enregistrées avantageusement dans une base de données, de nombreux systèmes de bases de données existant pour ce faire et pouvant être mis en oeuvre et utilisés de façon simple par toute personne de l'art du domaine de la bio-informatique (bases de données commerciales Oracle, Microsoft SQL server, FileMaker, bases de données d'accès libre : postgreSQL). Ces données peuvent aussi être enregistrées sous le format d'un tableau ou d'un fichier plat.
Indexation des données expérimentales. Ces données expérimentales peuvent être indexées automatiquement au graphe. Le rôle de cette indexation est de relier chaque donnée expérimentale à l'objet biologique correspondant du graphe (sommet du graphe, ou arrête du graphe pour les couples de données (X, , Xj), de façon à pouvoir utiliser conjointement ces deux types d'informations (données expérimentales et graphe) lors de la mise en #uvre du système de calcul des paramètres.
De nombreux systèmes de bases de données commerciaux ou gratuits permettent de créer cet indexage sans difficulté technique particulière pour l'homme de l'art du domaine de la biologie ou de la bio-informatique (bases de données commerciales Oracle, Microsoft SQL server, FileMaker, bases
<Desc/Clms Page number 31>
de données d'accès libre : postgreSQL). Alternativement, si les données concernant le graphe et les résultats expérimentaux ont été enregistrées sous le format de tableaux ou de fichiers plats, ou d'un tableau ou fichier plat commun, ces données étant liées de fait dans ce cas, cette étape d'indexation peut ne pas être nécessaire en soi.
Forme des données expérimentales. Dans une mise en #uvre préférentielle, les données expérimentales des valeurs des couples (X,, Xj) sont sous la forme de cinétiques d'expression. Par cinétique d'expression il est entendu ici un ensemble de séries de données expérimentales ordonnées dans le temps, chaque série de données correspondant à un ensemble de valeurs de couples (X,, Xj) mesurés expérimentalement à un temps donné. Chaque série de données peut concerner soit l'ensemble des sommets du graphe, soit uniquement un sous-ensemble de ces sommets.
Les différents temps correspondent à des temps successifs au cours de l'observation d'un processus biologique mettant en oeuvre le système biologique modélisé par le graphe, que ce processus soit naturel ou induit artificiellement en laboratoire. Une telle cinétique comprend de préférence au moins trois temps successifs, et, pour améliorer la qualité du calcul des paramètres, plus de trois temps.
Plusieurs cinétiques indépendantes, correspondant à des processus biologiques différents (Le., mettant en jeu des sous-réseaux différents d'un même réseau global, ces sous-réseaux pouvant ou non présenter des parties communes), peuvent être utilisées simultanément. Ceci peut permettre d'améliorer la qualité du calcul des paramètres, et donc la qualité des simulations.
Dès lors qu'au moins une cinétique d'expression est disponible, il est possible d'utiliser simultanément aussi des données expérimentales des valeurs des couples (X,, Xj) obtenues par des expériences indépendantes les unes des autres (sans description de cinétiques d'évolution du système biologique étudié au cours du temps).
<Desc/Clms Page number 32>
La méthode de calcul des paramètres des relations, à l'étape B) des méthodes de l'invention, tient de préférence compte des principes suivants : Mesure expérimentale d'un état stable du système biologique. Le graphe est considéré comme étant dans un état stable de référence à un temps donné, cet état stable étant mesurable expérimentalement. L'état stable de référence en question correspond à un état existant et mesurable du système biologique étudié, pouvant être considéré comme stable dans le temps vis-à-vis du processus biologique modélisé. Bien qu'un système biologique soit le plus souvent, du fait de ses interactions avec l'environnement et de ses rythmes biologiques propres, en train de se modifier, on peut définir, du fait de l'existence des processus homéostatiques, des états où ces modifications sont au maximum "oscillantes" autour d'états homéostatiques, et a priori de faible amplitude. Dans cet état, le processus modélisé n'est pas lui-même en train d'évoluer significativement.
Cet état ne doit pas être confondu avec l'état étalon. L'état étalon, qui est défini arbitrairement par l'expérimentateur biologiste sert à effectuer des mesures quantitatives expérimentales. L'état stable de référence correspond à un état réel du système modélisé (i.e., non artificiel), et sert de référence pour le calcul des paramètres du modèle. Il est considéré comme un état du système où les processus d'activation et d'inhibition au sein du réseau sont équilibrés, ou présentent des oscillations faibles autour d'un état d'équilibre théorique. Il représente l'état vers lequel le système tend en général à retourner lors des simulations. Il peut être le même, ou différent, de l'état étalon.
L'état stable de référence est directement mesurable expérimentalement dès lors que le problème biologique étudié permet de définir un état de référence du système biologique.
<Desc/Clms Page number 33>
A titre d'exemple, une culture cellulaire dont le nombre de cellules est arrivé à un plateau (absence de divisions cellulaires) et dans un milieu de culture stable, avant toute induction de stimulus, ou un animal adulte sain avant toute induction de processus pathologique, peuvent être considérés comme des états stables de référence. Dans le premier cas, les cascades d'interactions moléculaires mises en jeu par le stimulus dont on cherche à modéliser les conséquences ne sont pas activées au-delà des processus homéostatiques. Dans le second cas, les cascades mises en jeu par le processus pathologique à modéliser ne sont pas non plus en oeuvre : l'état de référence est stable vis à vis du processus biologique modélisé. L'état stable ne doit pas nécessairement être l'état initial du système biologique dans le cadre du processus biologique étudié.
Dans un autre exemple, l'état sain peut être considéré comme un état stable initial de référence si l'on étudie l'installation d'un processus pathologique à partir de cet état sain.
La mesure des X, de l'ensemble des sommets du graphe dans cet état est utilisée, dans le calcul des paramètres, comme référence stable du graphe, notamment pour la procédure de minimisation des erreurs.
L'état stable est défini mathématiquement par le vecteur de l'ensemble des valeurs expérimentales des variables de chaque sommet mesurées à l'état biologique correspondant (mesures effectuées pour tous les sommets du graphe).
Dans une mise en #uvre préférentielle, l'état étalon pour les mesures est l'état stable. Dans ce cas, comme les variables sont définies par (voir l'exemple 1 de mise en oeuvre) : X, = xit/xi0, en théorie, à l'état stable, puisque le réseau ne se modifie pas, quel que soit t, xit = x,o, donc X, = 1, pour tout sommet i. C'est le fait d'induire une modification du réseau par l'application de stimuli lors des expériences biologiques qui va "déstabiliser" le réseau, aboutissant à la mesure de cinétiques où Xit # X,o et Xi # 1.
Dans cette mise en #uvre, on peut donc éventuellement définir un état stable arbitraire où quel que soit i, X, = 1.
<Desc/Clms Page number 34>
En pratique, lors de la mesure expérimentale de cinétiques, au premier temps (to), les X, sont proches de 1 en général (si l'état étalon de mesure est le temps to).
Mais ce qui est important n'est pas tant le fait que les X, soient égaux à 1 en théorie et proches de 1 lors des mesures expérimentales, mais le fait en soit que cet état soit considéré comme stable.
En effet, lors du calcul de paramètres des relations mathématiques entre les X, et les Xj par des techniques de réseaux de neurones avec minimisation des erreurs, le fait de définir un état comme stable (au moins au début de la cinétique) introduit une contrainte forte dans le calcul des paramètres et améliore ainsi significativement leur calcul.
Pour que le modèle obtenu soit pertinent vis-à-vis du ou des processus biologique(s) étudié (s), il est préférable de s'assurer que cet état stable existe biologiquement, en le validant, par sa mesure expérimentale. Si l'état stable est différent de l'état étalon, les valeurs des X, à l'état stable ne peuvent être définies rationnellement que par leur mesure expérimentale.
Il est également possible de décider arbitrairement de le définir par V i, X, = 1, et d'introduire (au sens "ajouter") ce vecteur des X, au temps initial des cinétiques sans l'avoir mesuré. Ceci revient à considérer l'état étalon comme stable, arbitrairement. Ceci est souvent possible si l'état étalon ne correspond pas à un pool de tissus biologiques différents.
Dans une mise en oeuvre préférentielle, les données expérimentales sont mesurées au cours d'une cinétique (voir plus haut). Dans le cas où le processus biologique d'intérêt est étudié au cours du passage d'un état stable initial à un état stable final, et où des mesures expérimentales sont effectuées à ces deux états et à des temps intermédiaires, deux états stables sont définis : l'état initial et l'état final de la cinétique du processus biologique étudié. Cependant, le fait de disposer de mesures expérimentales correspondant à deux états stables n'est pas un pré-requis à la mise en oeuvre de l'invention.
<Desc/Clms Page number 35>
Lissage des données : si l'ensemble des données expérimentales est très restreint, une procédure de lissage des données expérimentales peut être mise en #uvre préalablement au calcul des paramètres, pour permettre d'augmenter le nombre de valeurs de couples (X, ,Xj) disponibles, en calculant des valeurs intermédiaires de ces couples à partir de la courbe lissée. Cette procédure, classique, ne pose pas de difficulté particulière à l'homme de l'art.
Le calcul des paramètres des relations (X, ,Xj) est effectué par la mise en oeuvre de techniques d'apprentissage utilisées pour le paramétrage de réseaux en intelligence artificielle (telles que celles mises en oeuvre pour les réseaux de neurones), à partir des données expérimentales quantitatives concernant les variables du graphe.
A titre d'exemple, ce calcul peut utiliser des algorithmes de résolution numérique de propagation ou de rétro-propagation avec calcul de l'erreur.
Des paramètres sont arbitrairement fixés, une propagation ou une rétropropagation est effectuée, puis l'erreur est calculée entre les résultats calculés et les résultats expérimentaux. Les paramètres sont corrigés en conséquence, et le processus de propagation et de calcul d'erreur est repris de façon itérative. Le choix d'une fonction d'erreur et la mise en oeuvre de ce type de calcul ne pose pas de difficulté particulière à l'homme du métier.
Un deuxième aspect de la présente invention concerne un procédé d'analyse d'un réseau d'interactions moléculaires dans un système biologique, comprenant les étapes suivantes :
A) à partir d'un graphe statique dont les sommets représentent des molécules biologiques et les arrêtes représentent des interactions physico-chimiques entre ces molécules, on associe une variable quantitative X, à chaque sommet, et une relation mathématique continue à chaque arc du graphe,
<Desc/Clms Page number 36>
B) on calcule ensuite les paramètres de chaque relation à partir de données expérimentales quantitatives concernant les sommets du graphe,
C) un état du graphe, mesuré expérimentalement, est choisi comme "état à modifier", et la durée du processus biologique à simuler est définie et découpée en une série de pas de temps,
D) plusieurs procédures itératives de simulation sont effectuées, comprenant chacune les étapes suivantes : a) un stimulus est imposé à l'état à modifier, c'est-à-dire que la valeur d'une ou de plusieurs des variables quantitatives associées aux sommets du graphe est modifiée, constituant ainsi un "état de départ" de la simulation ; b) à partir de l'état de départ de la simulation, un calcul de propagation est effectué au sein du graphe, pendant un nombre de pas de temps tel que la durée de la simulation n'excède pas la durée du processus biologique à simuler définie à l'étape C).
Toutefois, il est également possible de laisser la simulation se poursuivre au-delà de la durée du processus biologique à simuler définie à l'étape C), par exemple si on cherche à voir si le réseau va à terme trouver un nouvel état stable (état d'équilibre) et si on ne sait pas a priori combien de temps cela va prendre. Il est important de noter que la durée de la simulation définie à l'étape C) peut être plus longue que celle des cinétiques expérimentales utilisées pour le calcul des paramètres (ou plus courte).
Selon une variante du procédé d'analyse d'un réseau d'interactions moléculaires décrit ci-dessus, seules les étapes C), D) a) et D) b) ci-dessus sont effectuées, en utilisant (sans le reconstruire) un modèle dynamique du réseau d'interactions moléculaires choisi, ledit modèle étant susceptible d'être obtenu par un procédé tels que les procédés d'obtention de modèles dynamiques de réseaux d'interactions moléculaires décrits plus hauts.
<Desc/Clms Page number 37>
Un autre aspect particulièrement important de la présente invention est un procédé de sélection de cibles thérapeutiques appliquant un modèle dynamique d'un réseau d'interactions moléculaires dans un système biologique, par la mise en oeuvre d'un système informatique, comprenant les étapes suivantes :
A) à partir d'un graphe statique dont les sommets représentent des molécules biologiques et les arrêtes représentent des interactions physico-chimiques entre ces molécules, associer une variable quantitative X, à chaque sommet, et une relation mathématique continue à chaque arc du graphe,
B) calculer les paramètres de chaque relation à partir de données expérimentales quantitatives concernant les sommets du graphe,
C) un état du graphe, mesuré expérimentalement, est choisi comme "état à modifier", et la durée du processus biologique à simuler est définie et découpée en une série de pas de temps,
D) plusieurs procédures itératives de simulation sont effectuées, comprenant chacune les étapes suivantes : a) un stimulus est imposé à l'état à modifier, c'est-à-dire que la valeur d'une ou de plusieurs des variables quantitatives associées aux sommets du graphe est modifiée, constituant ainsi un état de départ de la simulation ; b) à partir de l'état de départ de la simulation, un calcul de propagation est effectué au sein du graphe, pendant un nombre de pas de temps tel que la durée de la simulation n'excède pas la durée du processus biologique à simuler définie à l'étape C) ; toutefois, il est également possible de laisser la simulation se poursuivre au-delà de la durée du processus biologique à simuler définie à l'étape C), par exemple si on cherche à voir si le réseau va à terme trouver un nouvel état stable (état d'équilibre) et si on ne sait pas a priori combien de temps cela va prendre. Il est important de noter que la durée de la simulation définie à l'étape
<Desc/Clms Page number 38>
C) peut être plus longue que celle des cinétiques expérimentales utilisées pour le calcul des paramètres (ou plus courte). c) un calcul de proximité entre l'"état final" du graphe obtenu à l'issue de l'étape b) et l'état à modifier, ou entre T'état final" du graphe et un état voulu est effectué ;
E) à partir de l'ensemble des proximités statistiques calculées à l'étape
D), les sommets, et les stimuli imposés sur ces sommets, sont hiérarchisés.
Bien entendu, et comme pour le procédé d'analyse d'un réseau d'interactions, le procédé de sélection de cibles thérapeutiques selon l'invention peut être mis en #uvre en effectuant uniquement les étapes C) à E) ci-dessus en utilisant, sans le reconstruire, un modèle dynamique susceptible d'être obtenu par une des méthodes d'obtention de tels modèles, décrites plus haut. De même, l'étape D) b) peut être poursuivie au-delà de la durée spécifiée à l'étape C) Les étapes A) et B) des procédés ci-dessus peuvent être réalisées de la même façon que les étapes A) et B) des procédés d'obtention de modèles dynamiques de réseaux d'interactions décrits plus haut.
Dans ces procédés, l'étape C) peut être réalisée en tenant compte des éléments suivants, lorsque le cas de figure s'y prête : Pas de temps : La durée du processus biologique à simuler est découpée en une série de pas de temps, régulièrement espacés ou non ; les pas de temps sont définis de façon à être préférablement plus petits que les durées expérimentales réelles séparant les séries de données expérimentales quantitatives utilisées pour le calcul des paramètres des relations. La définition de ces pas de temps est rendue nécessaire par le fait que tout processus informatique de simulation dynamique consiste à calculer des états à des temps discrets, rendant la discrétisation du temps
<Desc/Clms Page number 39>
nécessaire. On obtient donc une série de temps consécutifs, sur lesquels va être effectuée la simulation. Le premier temps de la série est appelé le temps initial. Ce temps initial correspond à l'état de départ du graphe, défini plus bas.
Etats du graphe pour les simulations : Un état du graphe, mesuré expérimentalement, et correspondant à un état que l'on veut modifier du système biologique, est défini (par exemple un état pathologique). Cet état est appelé "l'état à modifier". Dans certains cas, l'homme du métier peut savoir que les différences entre l'état à modifier et l'état stable de référence concernent essentiellement un sous-ensemble des molécules du réseau, et décider de ne mesurer expérimentalement que les valeurs des variables correspondantes, les autres X, étant alors, par défaut, fixés aux valeurs de l'état stable de référence. Un état du graphe (mesuré expérimentalement ou défini arbitrairement), correspondant à un état que l'on veut atteindre du système biologique, est éventuellement défini (par exemple un état sain).
Cet état est appelé "l'état à atteindre".
Identification de molécules-cibles thérapeutiques pour une pathologie donnée ; Dans une mise en #uvre préférentielle de l'invention, l'état à modifier et l'état à atteindre sont définis comme suit : On pratique les simulations d'actions sur les sommets du graphe à partir d'un état à modifier du graphe identique ou similaire à son état tel qu'observé expérimentalement dans la condition pathologique (par exemple par criblage d'expression des ARN messagers sur puces à ADN à partir de tissus pathologiques).
On définit l'état à atteindre comme étant un état proche d'un état non pathologique de référence (tel que mesuré lui aussi par l'observation expérimentale de la condition non pathologique, par exemple par criblage
<Desc/Clms Page number 40>
d'expression des ARN messagers sur puces à ADN à partir de tissus sains).
Le processus de simulation consiste alors à identifier les sommets, et les stimuli sur ces sommets, qui, en partant de l'état à modifier (l'état pathologique), permettent le mieux de faire évoluer le graphe (en partie ou entièrement) vers un état proche de l'état à atteindre (état non pathologique).
Identification des molécules-cibles thérapeutiques de traitements existants ou en cours de développement, et pour lesquels aucune ou une partie seulement des cibles sont connues (ce qui est le cas de nombreux médicaments actuels).
Dans ce cas, l'état à modifier est défini comme ci-dessus, et l'état à atteindre est défini comme l'état, ou un état proche, de celui obtenu expérimentalement lors de l'administration de ce traitement (tel que mesuré par exemple par criblage d'expression des ARN messagers sur puces à ADN à partir de tissus pathologiques qui ont été soumis au traitement concerné).
Le processus de simulation consiste alors à identifier les sommets, et les stimuli sur ces sommets, qui, en partant de l'état à modifier (l'état pathologique), permettent le mieux de faire évoluer le graphe (en partie ou entièrement) vers un état proche de l'état à atteindre (état pathologique sous traitement).
Cette mise en oeuvre particulière peut aussi être réalisée en définissant l'état à modifier comme tout état # possible du système biologique étudié (par exemple l'état sain), et l'état à atteindre comme l'état obtenu après l'administration du traitement concerné au système biologique à l'état #.
Dans les procédés d'analyse de réseaux d'interactions et de sélection de cibles selon l'invention, l'étape D) est réalisée en considérant les éléments suivants :
<Desc/Clms Page number 41>
Stimulus : Un stimulus est imposé à l'état à modifier. Ce stimulus est exercé sous la forme de la variation de la valeur d'une ou de plusieurs variable(s) du graphe (correspondant à un ou plusieurs sommet(s)), c'est-àdire d'une augmentation ou d'une diminution de cette ou ces valeur(s), selon la simulation souhaitée. Les valeurs de toutes les autres variables restent inchangées. On obtient donc un nouvel état du graphe, qui est "l'état de départ' de la simulation. L'état de départ et l'état à modifier ne diffèrent donc que par la valeur de la ou des variable(s) modifiée (s), toutes les valeurs de toutes les autres variables étant identiques. Cet état est défini comme correspondant au premier temps de la simulation. Dans une mise en #uvre particulière du procédé, les stimuli portent à chaque fois sur un seul sommet.
Propagation : A partir de l'état de départ de la simulation, un calcul de propagation est effectué au sein du réseau. Cette propagation consiste à calculer les nouvelles valeurs de toutes les variables au pas de temps suivant, aboutissant à un nouvel état du graphe, et à recommencer le calcul à partir de ce nouvel état pour le pas de temps suivant, et ainsi de suite.
Cette propagation se prolonge pendant le nombre de pas de temps (donc la durée biologique) définie par l'expérimentateur en fonction de la question biologique posée. Elle peut éventuellement être prolongée jusqu'à l'apparition d'un nouvel état stable du graphe (un nouvel état d'équilibre), ou être arrêtée avant. Au terme de cette simulation, un nouvel état ("état final") du graphe est obtenu.
Itération : Le processus précédent est répété avec un nouveau stimulus, portant sur un ou plusieurs autre (s) sommet (s) du graphe, ou portant éventuellement sur le(s) même (s) sommet (s) du graphe avec l'imposition d'une nouvelle valeur à la ou aux variable(s).
<Desc/Clms Page number 42>
Ce processus peut être répété de façon itérative sur tous les sommets individuellement, éventuellement en imposant plusieurs valeurs (en nombre fini) par variable de manière à tester des gammes d'activation ou d'inhibition sur tous les n#uds. Dans ce cas, le résultat de l'étape E) est une hiérarchisation des sommets, et des stimuli imposés sur ces sommets. Ce classement correspond donc au classement des sommets, de celui sur lequel un stimulus est le plus susceptible d'aboutir à l'état voulu à partir de l'état à modifier, jusqu'à celui sur lequel un stimulus est le moins susceptible d'avoir cet effet. A chaque proximité correspond en effet un et un seul sommet et une et une seule valeur de stimulation sur ce sommet.Si l'effet recherché est l'amélioration d'un état pathologique, ce classement est celui des cibles thérapeutiques potentielles, de la plus probable à la moins probable.
Bien que présenté ici de manière séquentielle, l'ensemble des propagations effectuées peut être calculé de manière parallèle.
A l'étape D)c), la proximité de chaque état final obtenu à l'étape D) b) peut être calculée soit par rapport à l'état à modifier choisi à l'étape C), soit par rapport à un autre état, mesuré expérimentalement ou déterminé arbitrairement, et défini comme Fêtât à atteindre", qui peut être, par exemple, un état sain. Il peu s'agir de l'état de référence défini plus haut.
Une fois les calculs de proximité de graphes effectués pour toutes les simulations, l'étape E) consiste à classer l'ensemble des multiplets (sommet(s) du graphe - stimulus) en ordre hiérarchique (croissant ou décroissant) correspondant directement à l'ordre hiérarchique (croissant ou décroissant, respectivement) des proximités qui leur sont associées. Aux sommets du graphe correspondent directement les molécules du réseau biologique, qui sont donc hiérarchisées de fait.
Cette hiérarchisation ne pose aucun problème technique à l'homme de l'art, les proximités étant des valeurs numériques positives pouvant être
<Desc/Clms Page number 43>
directement hiérarchisées de la plus grande à la plus petite, ou inversement.
Le résultat de ce classement peut être avantageusement produit sous forme de liste ou de tableau, ou sous tout autre type de format, et / ou stocké dans une base de données en vue d'une utilisation ultérieure.
Quels que soient les niveaux de proximité des graphes, une hiérarchisation des multiplets (sommet(s) du graphe - stimulus) selon cette méthode sera toujours obtenue. L'invention permet donc toujours d'obtenir un résultat, en fonction des connaissances biologiques et des techniques de mesure expérimentales utilisées. Elle ne requiert pas de connaissance préalable étendue des processus physiopathologiques moléculaires en #uvre dans le processus pathologique analysé. Toutes les molécules du réseau d'interactions moléculaires sont considérées a priori (avant mise en oeuvre de l'invention) comme des molécules cibles thérapeutiques potentielles sans en exclure aucune, les molécules cibles thérapeutiques étant sélectionnées a posteriori (après mise en #uvre de l'invention) sur des critères statistiques objectifs (calculs de proximités). Cette méthode est utilisable de façon systématique et automatisée quelle que soit la pathologie étudiée, dès lors qu'il est possible de définir un état à modifier.
Ceci la rend notamment particulièrement adaptée à une utilisation dans le cadre de processus industriels de sélection systématique à grande échelle de cibles thérapeutiques, en utilisant les données expérimentales fournies par les technologies de criblages moléculaires à grande échelle.
Dans le cas de l'identification de cibles thérapeutiques, le classement hiérarchique des molécules du réseau biologique correspond directement au classement hiérarchique de ces molécules considérées comme cibles thérapeutiques. L'invention permet donc d'obtenir un classement des cibles thérapeutiques potentielles hiérarchisées selon des critères statistiques objectifs, en fonction des données expérimentales (mesures des X,) et des
<Desc/Clms Page number 44>
connaissances fonctionnelles du réseau (existence d'interactions moléculaires). Dans les cas où il est possible de définir à la fois un état à modifier et un état à atteindre, les meilleures cibles thérapeutiques potentielles sont considérées comme étant celles correspondant aux proximités les meilleures avec l'état à atteindre.
Dans les cas où la définition d'un état à atteindre n'est pas possible (ce qui devrait être exceptionnel, l'état sain pouvant à priori toujours être utilisé par défaut comme état à atteindre pour les processus pathologiques), il est possible de hiérarchiser les multiplets (sommet(s) du graphe - stimulus) par leur proximité avec l'état à modifier, et de classer les molécules du réseau biologique considérées comme cibles thérapeutiques potentielles en suivant une hiérarchie directement inverse de celle des proximités :les meilleures cibles thérapeutiques potentielles sont considérées comme étant celles correspondant aux proximités les plus mauvaises par rapport à l'état à modifier.
Un point important est que cette invention permet non seulement d'identifier des molécules-cibles thérapeutiques, mais aussi de prédire le sens de l'action thérapeutique qu'il sera nécessaire d'appliquer sur ces molécules (activation ou inhibition).
Les cibles thérapeutiques sont donc sélectionnées à partir des données concernant l'ensemble des molécules étudiées, et non seulement celles concernant spécifiquement les molécules-cibles, puisque le critère utilisé pour la hiérarchisation dépend de l'évolution du graphe dans son ensemble, donc de l'ensemble des mesures expérimentales d'expression et/ou d'activation de toutes les molécules représentées dans le graphe, et non la simple évolution des mesures expérimentales d'expression et/ou d'activation des seules molécules cibles. Il s'agit donc bien d'une méthode intégrative répondant aux besoins actuels tels que définis plus haut,
<Desc/Clms Page number 45>
notamment en ce qui concerne des maladies à déterminisme multi-factoriel, apportant clairement un progrès par rapport aux méthodes de sélection de cibles thérapeutiques existantes.
La méthode d'identification des cibles décrite ci-dessus comporte les caractéristiques avantageuses suivantes : - Les calculs sont fondés sur méthode non probabiliste, ce qui élimine toute limitation en termes de temps de calcul, au contraire des méthodes des équations stochastiques et des réseaux bayésiens.
- L'invention intègre les données expérimentales quantitatives, ce qui la différencie des méthodes qualitatives (réseaux booléens, formalismes logiques généralisés, formalismes fondés sur des règles), permet d'éviter des contraintes et hypothèses sur le fonctionnement du réseau, et permet d'augmenter la fiabilité des simulations.
- Le fait de définir les variables comme similaires aux données expérimentales effectivement mesurables permet de calculer les paramètres des relations de façon optimale (sans avoir à extrapoler les valeurs des variables).
- Le fait d'établir, pour tout sommet du graphe, une relation directe entre la variable qui lui est associée et les variables associées aux sommets du graphe agissant sur ce sommet permet la mise en oeuvre directe de méthodes de calcul des paramètres dérivées des méthodes d'apprentissage de réseaux de neurones par calcul de l'erreur minimale qui sont compatibles avec des réseaux de grande taille en termes de temps de calcul.
- Une fois les paramètres calculés, les simulations sont très peu coûteuses en temps de calcul, le réseau étant déterministe. Ceci est aussi compatible avec l'application de l'invention à des réseaux de grande taille.
<Desc/Clms Page number 46>
- Les limitations de divergence introduites dans les relations ou fonctions permettent de pratiquer des simulations sur des cinétiques longues et des réseaux de grande taille avec une fiabilité satisfaisante.
Les connaissances de l'existence d'interactions entre les molécules du réseau, et de l'orientation d'une partie de ces interactions, sont suffisantes pour la mise en #uvre de l'invention. La connaissance du type d'interaction (activation ou inhibition) peut être avantageusement utilisée lorsqu'elle est disponible, mais elle n'est pas indispensable. Aucune autre connaissance qualitative supplémentaire concernant le réseau n'est requise. Pour les grands réseaux d'interactions moléculaires (plus d'une centaine de molécules) ces connaissances sont en général les seules disponibles aujourd'hui.
La qualification de cette méthode, suivant les critères considérés dans les tableaux 1 et 2 ci-dessus, est donc la suivante :
Figure img00460001
<tb>
<tb> (1) <SEP> (2) <SEP> (3) <SEP> (4) <SEP> (5)
<tb> Méthode <SEP> Intégration <SEP> de <SEP> Formalisme <SEP> Variables <SEP> Fonctions <SEP> Modèle
<tb> Méthode <SEP> données <SEP> utilisées <SEP> continues <SEP> déterministe
<tb> uantitatives
<tb> Inertiel
<tb> Méthode <SEP> de <SEP> Qui <SEP> Tendance <SEP> dXi/Xi0 <SEP> Oui
<tb> l'invention <SEP> Oui <SEP> au <SEP> retour <SEP> à <SEP> dX, <SEP> /Xi0 <SEP> Oui <SEP> Oui
<tb> l'état <SEP> initial
<tb>
Tableau 3 Il est important de noter que le formalisme permettant de prendre en compte l'inertie/ tendance au retour à l'état initial est spécifique à l'invention. En effet, dans la méthode de la présente invention, les conséquences des interactions sont représentées comme résultant d'une résistance au changement des taux de molécules suite à une modification quantitative de l'activité biologique d'au moins une molécule interagissant
<Desc/Clms Page number 47>
sur elles et une tendance à revenir à l'état initial ; cette représentation permet d'éviter de faire des hypothèses sur le fonctionnement du système (effets de seuil, types de réactions chimiques, etc. ) et de tenir compte des données ou variables éventuellement non connues ou non mesurées, l'inertie et la tendance au retour à l'état initial représentant la résultante des multiples phénomènes biologiques impliqués dans une interaction donnée (temps de synthèse de la molécule, existence d'un rétro-contrôle négatif concomitant, temps de transport des molécules jusqu'au compartiment cellulaire où elles sont actives, etc.) ; le formalisme de l'invention est donc fondamentalement différent de celui des autres méthodes existantes (comparer avec le tableau 1).
Figure img00470001
<tb>
<tb>
~~~~~~~~~ <SEP> Pré-re <SEP> uis <SEP> Applications
<tb> (1) <SEP> (2) <SEP> (3) <SEP> (4) <SEP> (5)
<tb> Niveau <SEP> requis <SEP> Croissance <SEP> Taille <SEP> Applicable <SEP> à <SEP> Mise <SEP> en <SEP> oeuvre
<tb> de <SEP> de <SEP> la <SEP> maximale <SEP> de <SEP> de <SEP> réseaux <SEP> pour
<tb> connaissance <SEP> quantité <SEP> de <SEP> réseau <SEP> mis <SEP> de <SEP> 1000 <SEP> à <SEP> l'identification
<tb> Méthode <SEP> fonctionnelle <SEP> calcul <SEP> en <SEP> #uvre <SEP> 100000 <SEP> systématique <SEP> de
<tb> du <SEP> réseau <SEP> requise <SEP> en <SEP> molécules <SEP> cibles
<tb> biologique <SEP> fonction <SEP> de <SEP> thérapeutiques
<tb> la <SEP> taille <SEP> du
<tb>
Figure img00470002

~~~~~~~~~ réseau ~~~~~~~~~~~~~~~~~~~~~~~~~~
Figure img00470003
<tb>
<tb> Méthode <SEP> de <SEP> A <SEP> A <SEP> >100 <SEP> Oui <SEP> Oui
<tb>
Figure img00470004

l'invention ~~~~~~~~~~~~~ ~~~~~~~~~~~~~~~~~~~~~~~ Tableau 4 Selon une variante des procédés de sélection de cibles thérapeutiques décrits plus haut, un premier classement hiérarchique des sommets, considérés individuellement, est obtenu en effectuant les étapes A) à E) en imposant, pour chacune des simulations de l'étape D), des stimuli qui concernent un sommet unique ; une étape D2) est ensuite effectuée, correspondant à l'étape D) dans laquelle les stimuli imposés à chaque simulation sont exercés sur deux sommets, soit en testant toutes les combinaisons de deux sommets possibles, soit en limitant ces calculs aux combinaisons de deux sommets parmi un certain nombre des sommets les mieux classés à l'étape E). Enfin, une étape E2) de classement
<Desc/Clms Page number 48>
hiérarchique des associations de deux sommets sur lesquels des stimuli sont le plus susceptibles d'avoir l'effet voulu est effectuée à partir de l'ensemble des proximités statistiques calculées à l'étape D2).
A partir de la variante ci-dessus, les étapes D) et E) peuvent être répétées de façon itérative, en augmentant à chaque fois le nombre de sommets sur lesquels sont exercés les stimuli. Ainsi, le procédé peut comporter une étape D3) suivant l'étape E2) et correspondant à l'étape D) dans laquelle les stimuli imposés à chaque simulation sont exercés sur trois sommets, soit en testant toutes les combinaisons de trois sommets possibles, soit en limitant ces calculs aux combinaisons de trois sommets choisis parmi un certain nombre des sommets les mieux classés à l'étape E) et des combinaisons de deux sommets les mieux classées à l'étape E2), ladite étape D3) étant suivie d'une étape E3) de classement hiérarchique des associations de trois sommets sur lesquels des stimuli sont le plus susceptibles d'avoir l'effet voulu. Des étapes D4) et E4), avec des stimuli sur 4 sommets peuvent ensuite être rajoutées, et ainsi de suite. Ces procédés de sélection de cibles thérapeutiques comportent de préférence une étape finale de classement statistique des proximités de graphes de toutes les simulations effectuées, intégrant l'ensemble des classements précédemment obtenus.
Dans les procédés de l'invention, lorsqu'une simulation implique des stimuli sur une combinaison de sommets, les stimuli exercés sur ces différents sommets peuvent être appliqués simultanément ou non, c'est-à-dire que la simulation peut tenir compte d'un décalage temporel entre les stimuli exercés sur différents sommets.
Dans une mise en #uvre de l'invention, la relation entre X, et les Xj est établie, pour au moins une partie des interactions physico-chimiques entre les molécules du réseau, par une relation inertielle découlant de celle de
<Desc/Clms Page number 49>
l'oscillateur harmonique en physique, associée à un facteur d'amortissement suffisamment important pour limiter l'oscillation à un seul cycle.
Plus précisément, une relation de ce type entre X, et chaque Xj, deux à deux est de la forme : wij .Xj = m, .(d2Xi / dt2) + 2 .#ij .(dX, / dt) + #ij2 .X,, dans laquelle m, .(d2Xi / dt2) + #ij2 .X, correspond au terme inertiel (i),
2 .#ij .(dX, / dt) correspond au terme de retour à l'état initial (ii),
X, est une variable associée à la molécule i dX, / dt est la dérivée de X, en fonction du temps d2Xi / dt2 est la dérivée seconde de X, en fonction du temps
Xj est une variable associée à la molécule j, m, représente l'inertie de i, #ij régit le retour à l'état d'équilibre de Xi, la pulsation #ij correspond au temps de réponse de X, à la variation de Xj, et
Wij est un facteur de couplage représentant la force de l'interaction entre les molécules i et j, correspondant à une pondération de l'effet de chaque molécule j sur la molécule i vis-à-vis de la résultante de l'ensemble des effets combinés de toutes les molécules j exerçant un effet sur i.
Selon une autre mise en oeuvre des procédés de l'invention, pour au moins une partie des interactions physico-chimiques entre les molécules du réseau, la relation entre les variables X, et Xj, deux à deux est établie par une relation sigmoïde comportant un facteur de retardement associée à une fonction de décroissance linéaire.
Un autre type de relation entre les variables X, et Xj, décrit plus en détail ciaprès, utilisable dans les procédés de l'invention pour modéliser au moins
<Desc/Clms Page number 50>
une partie des interactions physico-chimiques entre les molécules du système biologique, est de la forme : (dX,/dt) = Ki, . [ 1 / (1 + e-# wij Xj-bi)]- K2i. X, ; où : le terme sigmoïde K1i. [1 / (1 + e-# wij Xj- bi)] correspond au terme inertiel (i), et le terme K2, . X, correspond au terme de retour à l'état initial (ii), avec :
X, = variable associée au sommet i,
Xj = variable associée au sommet j, wij = facteur de couplage représentant la force de l'interaction entre les molécules i et j, correspondant à une pondération de l'effet de chaque molécule j sur la molécule i vis-à-vis de la résultante de l'ensemble des effets combinés de toutes les molécules j exerçant un effet sur i., bi = facteur de retardement,
K1i = facteur de limite maximale de variation de X,, et
K2i = facteur de retour à l'équilibre.
Dans les procédés ci-dessus, la relation entre les variables X, et Xj, peut également être, pour au moins une partie des interactions considérées, une fonction polynôme de type
Figure img00500001

wu Xi = E bm,.X,m = b(p-1)' X,P-1 + ... + b31 X,' + b2, .X12 + b11 .X + bo [m 1p-1] d'ordre strictement inférieur au nombre p de couples (X,t, Xjt) de valeurs expérimentales du niveau de taux ou d'activité X, ou Xj des molécules i et j, respectivement, à différents instants t, les paramètres bm, étant calculés à partir des p couples expérimentaux (X,t, Xjt) disponibles, et Wij étant un facteur de couplage représentant la force de l'interaction entre les molécules i et j, correspondant à une pondération de l'effet de chaque molécule j sur la molécule i vis-à-vis de la résultante de l'ensemble des effets combinés de toutes les molécules j exerçant un effet sur i.
Des fonctions de type dérivée :
<Desc/Clms Page number 51>
wij Xj = # amij.[dmXi/dtm], [m O p'-1] p' étant un entier tel que 1 < p' > p - 1, et p étant défini tel que ci-dessus, peuvent également être utilisées dans les procédés de l'invention pour modéliser au moins une partie des interactions physico-chimiques entre les molécules du système biologique.
Ceci peut notamment être mis en #uvre avec p'=3.
La résultante globale de n interactions exercées par des molécules 1 à n sur une molécule i peut être, dans les procédés de l'invention, et pour au moins une partie des molécules du réseau, une somme pondérée des actions des molécules 1 à n sur la molécule i, de la forme FG (# j # i) = # aij . fji, où [l 1#n] [l 1#n] fji est la fonction associée à l'arc (i, j) pour chaque couple (i, j) et aij = (dXj/dt) / # (dXj/dt).
[l 1#n] Une telle somme pondérée peut également être faite avec aij = (d2Xj/dt2) / # (d2Xj/dt2).
[l 1#n] La présente invention porte également sur un procédé de détermination du mode d'action d'un xénobiotique, consistant à mettre en oeuvre un procédé d'analyse d'un réseau d'interactions moléculaires dans un système biologique, tels que ceux décrits plus haut, dans les conditions suivantes : (i) le système biologique dans lequel un réseau d'interactions moléculaires est étudié est concerné par l'action du xénobiotique ; (ii) l'"état à modifier" choisi à l'étape C), correspond à un état observé expérimentalement avant l'administration dudit xénobiotique ;
<Desc/Clms Page number 52>
(iii) on identifie les modifications à apporter au cours de l'étape D)a) pour que le calcul effectué à l'étape D) b) montre une évolution du système vers un état proche de l'état observé après administration du xénobiotique.
Un autre aspect de l'invention est une méthode de prédiction d'effets indésirables de traitements appliquant un modèle dynamique d'un réseau d'interactions moléculaires dans un système biologique, par la mise en #uvre d'un système informatique.
Dans cet aspect de l'invention, les étapes et caractéristiques de la méthode sont les mêmes que précédemment, la seule modification consistant dans l'adaptation suivante : Une fois identifiées les molécules-cibles d'un traitement, on analyse sur des parties du graphe représentatives de fonctions physiologiques connues, par des simulations mettant en jeu la même méthode que dans les aspects précédents de l'invention (étapes A à E, éventuellement A à Ek lorsque les étapes D et E sont répétées de façon itérative en appliquant les stimuli sur des combinaisons de sommets allant jusqu'à k sommets), les conséquences de l'application du traitement sur ces molécules cibles. Cette analyse consiste à identifier les éventuelles évolutions de ces sous-parties de graphes vers de nouveaux états proches d'autres états pathologiques de référence (tels que définis par l'observation expérimentale de ces conditions pathologiques, selon des méthodes similaires à ce qui est décrit plus haut).
A titre d'exemple, l'observation lors des simulations de l'évolution du sous graphe de l'apoptose vers un état final ayant une grande proximité avec un état de référence de ce graphe correspondant à une activation de cette voie physiologique (telle que définie à partir de données concernant un ou des tissus affectés par des processus de dégénérescence cellulaire) permet de prédire un effet de toxicité cellulaire du traitement dans le ou les tissu concernés.
<Desc/Clms Page number 53>
Cet aspect de l'invention consiste donc à mettre en oeuvre un procédé d'analyse tel que décrit plus haut, dans les conditions suivantes : (i) le système biologique dans lequel un réseau d'interactions moléculaires est étudié est concerné par le traitement ; (ii) les modifications de l'étape D) a) correspondent aux modifications des niveaux de taux ou d'activité des molécules cibles observées ou souhaitées lors de l'application du traitement ; (iii) l'étape D) b) de calcul de l'évolution du système biologique est suivie d'une analyse de sous-parties du système correspondant à des fonctions physiologiques connues, afin d'identifier les éventuelles évolutions de ces sous-parties vers des états proches d'états pathologiques de référence.
La présente invention porte également sur un procédé pour hiérarchiser des cibles thérapeutiques potentielles pour une pathologie, consistant à identifier des cibles thérapeutiques par un procédé selon l'invention, puis à prédire les éventuels effets indésirables d'un traitement visant ces cibles, et enfin à déterminer le rapport "bénéfice thérapeutique / effets indésirables" d'une action sur chacune des cibles thérapeutiques potentielles.
Comme exposé ci-dessus, un des avantages principaux de la présente invention, dans ses différents aspects, est de permettre de travailler sur des graphes ou réseaux de molécules en interaction comportant un grand nombre de molécules. Dans l'ensemble des procédés de l'invention, décrits plus haut, le nombre de variables X, du réseau d'interactions moléculaires considéré est donc de préférence supérieur à 100, supérieur à 200, voire supérieur à 300.
L'invention concerne aussi un procédé d'analyse tel que décrit plus haut faisant appel à l'utilisation des réseaux d'interaction moléculaire de
<Desc/Clms Page number 54>
l'invention, lesdits réseaux étant associés pour former un hypergraphe de réseaux.
Selon cette variante de réalisation de l'invention, le nombre de variables X, de chaque réseau d'interactions moléculaires est inférieur à environ 100 et le nombre de réseaux associés pour former l'hypergraphe est compris entre 2 et environ 100.
Un programme d'ordinateur, enregistré sur un support utilisable dans un ordinateur, ou, de manière plus générale, chargeable directement dans la mémoire interne d'un ordinateur, comprenant des portions de code de logiciel pour l'exécution des étapes d'un quelconque des procédés cidessus, fait également partie intégrante de l'invention.
Un autre aspect de l'invention est une méthode d'extension des graphes à partir de résultats de criblages expérimentaux des variations de taux d'expression ou d'activité de molécules, appliquant un modèle dynamique d'un réseau d'interactions moléculaires dans un système biologique, par la mise en oeuvre d'un système informatique.
Dans cet aspect de l'invention, les étapes et caractéristiques de la méthode sont les mêmes que précédemment, la seule modification consistant dans l'adaptation suivante : Dans cette application, la méthode est mise en oeuvre pour identifier de nouvelles interactions moléculaires. Ceci peut être réalisé par le couplage de la méthode de l'invention décrite plus haut, avec des méthodes statistiques de recherche de corrélation entre des points dans un espace à n dimensions (par exemple analyse factorielle, classifications hiérarchiques, etc.) telles que (mais de façon non exclusive) celles utilisées à ce jour pour rechercher des corrélations de l'expression de gènes à partir des résultats de criblage d'ARN messagers sur puces à ADN ("clustering" de gènes). A titre d'exemple de méthode de "clustering", on peut citer Eisen
<Desc/Clms Page number 55>
MB, Spellman PT, Brown PO and Botstein D (1998), Cluster Analysis and Display of Genome-Wide Expression Patterns, Proc Natl Acad Sci U S A 95,14863-8. Un exemple de système logiciel d'accès libre permettant de réaliser des analyses de clustering disponible sur internet est le logiciel "cluster 3. 0", développé par le Laboratory of DNA Information Analysis of Human Genome Center, http://www.ims.u-tokvo.ac.ip/imswww/index- e.htmllnstitute of Medical Science, University of Tokyo, au Japon (4-6-1 Shirokanedai, Minato-ku, Tokyo 108-8639 JAPAN). Le logiciel "cluster 3. 0" est disponible sur le site internet http://bonsai.ims.u-
Figure img00550001

tokyo.ac.jphmdehoon/software/clusterl. Les données expérimentales utilisées peuvent par exemple être celles produites par les criblages d'expression d'ARN messagers sur puces à ADN.
Ce couplage consiste à utiliser les paramétrages calculés par la mise en oeuvre de l'invention pour re-calculer une nouvelle matrice de données expérimentales de mesure d'expression de taux ou d'activité des molécules, en éliminant des matrices de résultats expérimentaux d'origine les facteurs d'interactions moléculaires inclus dans le modèle dynamique paramétré (tels que la composante de résistance dynamique ou inertielle), puis à effectuer les recherches de corrélation. Ce "nettoyage" des matrices de résultats d'origine consiste en d'autres termes à en éliminer le"bruit statistique" lié à ces facteurs, ces facteurs étant alors considérés comme introduisant des distorsions, dans les mesures réellement observées des taux d'expression ou d'activité des molécules, par rapport à ce qu'auraient été ces mesures, d'un point de vue théorique, en l'absence de ces facteurs. A titre d'exemple, la résistance dynamique de l'expression d'un gène A donné (donc l'inertie de la modification du taux d'ARN messager correspondant) à deux stimulations distinctes exercées par les molécules B et C (elles mêmes distinctes) peut varier, empêchant avant tout"nettoyage" de ce type de mettre en évidence à la fois une corrélation entre l'expression de A et l'activité de la molécule B, et une corrélation entre l'expression de A et l'activité de la molécule C.
<Desc/Clms Page number 56>
L'invention porte donc sur l'utilisation d'un modèle dynamique d'un réseau d'interactions moléculaires dans un système biologique susceptible d'être obtenu par un procédé tel que décrit plus haut, pour étendre un graphe statique dont les sommets représentent des molécules biologiques et les arcs représentent des interactions physico-chimiques entre ces molécules.
D'autres avantages et caractéristiques de la présente invention apparaissent dans les exemples ci-après de mise en #uvre pratique des procédés de l'invention, qui illustrent de façon non limitative les méthodes décrites ci-dessus.
Les schémas et figures ci-après illustrent également certains aspects de l'invention : La figure 1 représente un schéma synthétique des diverses étapes d'une méthode d'identification des cibles selon la présente invention.
La figure 2 représente un schéma du graphe construit dans l'exemple 4.
*Ce graphe comporte 116 molécules dans le réseau d'interactions moléculaires (116 sommets), et 329 interactions moléculaires entre ces molécules. Chaque rectangle représente une molécule du réseau (= un sommet du graphe). Chaque flèche représente une interaction entre deux molécules (= une arrête du graphe) ; le sens des flèches représente le sens des interactions : si la flèche va de la molécule A vers la molécule B, cela signifie que la molécule A a une action d'activation ou d'inhibition potentielles de la molécule B ; certaines flèches sont à double sens : interaction bilatérale. Le texte au sein de chaque rectangle correspond à l'abréviation du nom de la protéine telle que décrite dans le texte. Le calcul des paramètres des relations entre les sommets du graphe et les simulations ont été réalisées sur l'ensemble de ce graphe (exemple 4).
La figure 3 montre des exemples graphiques de cinétiques calculées (triangles) et observées (carrés), pour quelques gènes (exemple 4). Figure 3A : ORF YBL015W (ACH1). Figure 3B : ORF YMR169C (ALD3). Figure
<Desc/Clms Page number 57>
3C : ORF YIL125W (KGD1). Figure 3D : ORF YNL071W (PDA2). Figure 3E : ORF YAL054C (ACS1). Figure 3F : ORF YFL018C (LPD1).
Exemples Exemple 1 : Mise en #uvre pratique de l'étape A) - (1) Les variables associées aux sommets du graphe : Soit i une molécule donnée du réseau, et x, sa quantité (ou sa concentration) au sein du système biologique étudié. Soit x,o la mesure expérimentale effectivement réalisée de i à un état étalon du système biologique, utilisé lors des mesures. Soit x,t la mesure expérimentale effectivement réalisée de i à un instant t. La variable utilisée est : (1) Xi = (xit/xi0).
L'état étalon est un état mesurable utilisé pour pratiquer les mesures biologiques, contre lequel toutes les autres mesures sont quantifiées. Il peut correspondre à un état artificiel du système, par exemple à un pool de plusieurs échantillons biologiques prélevés dans des conditions expérimentales différentes (état artificiel), ou à un état réellement observable (non artificiel) du système.
Cette variable correspond bien au type de mesures biologiques effectivement réalisables. A titre d'exemple, lors des mesures de taux d'ARN messagers sur puces à ADN, la mesure effectivement réalisée pour chaque ARN à un temps expérimental t donné est le rapport du signal émis par l'hybridation des ARN présents dans l'échantillon biologique au temps t sur le signal émis par les ARN de même type présents dans l'échantillon à un état étalon du système biologique étudié (par exemple le temps initial de l'expérience biologique). Seule cette mesure peut être considérée comme fiable, la quantité réelle de molécules d'ARN n'étant pas directement mesurable car elle dépend de paramètres expérimentaux non directement
<Desc/Clms Page number 58>
contrôlés (rendement des réactions de marquage des sondes, rendement des hybridations sur la puces, etc., ces paramètres différant de façon non prédictible entre deux ARN de type différent donnés). La quantité de signal mesuré à l'état étalon sert donc d'étalon de mesure pour celle aux autres temps, en se fondant sur l'hypothèse que pour un type d'ARN donné, les paramètres expérimentaux influant sur le signal finalement émis sont les mêmes.
X, correspond donc directement aux mesures quantitatives biologiques réellement productibles dans l'état actuel des techniques de biologie moléculaire.
Les variables X,, X, etc. sont donc égales à (x,t/x,o), (xjt/xj0) etc.
- (2) Les relations associées aux arrêtes du graphe et reliant les variables : Soient n sommets j1, j2,..., jn du graphe (correspondant à n molécules du réseau) qui agissent sur un sommet i (orientation du graphe des j vers i).
Ces relations définissent une relation directe entre X, et les Xj (Xj1, Xj2,...,Xjn)
Terme inertiel de ces relations : Ce terme correspond à une fonction continue des Xj. Ce terme comporte une composante inertielle. Par inertie, on entend le fait que X, présente une résistance au changement suite à une variation des Xj : plus précisément, ce terme de la relation doit permettre de rendre compte du comportement suivant des variables : suite à une variation donnée d'un ou plusieurs des Xj, la vitesse de variation de X, va être initialement faible, puis s'accélérer progressivement.
Ce terme doit aussi permettre de rendre compte du comportement suivant des variables : suite à la variation d'un ou plusieurs des Xj, X, va progressivement atteindre une nouvelle valeur finie correspondant à la
<Desc/Clms Page number 59>
variation maximale de X, (pic de variation) ; ceci revient à dire que la vitesse de variation de X,, après avoir augmenté, va diminuer et progressivement tendre vers 0. Il y a donc une inflexion de la courbe de X, en fonction du temps.
Commentaires : Le fait de comporter une composante inertielle introduit de fait l'expression d'un retard temporel de la variation de X, suite à la variation de Xj : en l'absence d'autres interactions s'exerçant sur i, le pic de variation de X, tend à survenir après le pic de variation de Xj.
Le fait de comporter une composante inertielle permet donc de rendre compte du décalage temporel dans les variations des X, lors de la propagation des activation / inhibitions dans le réseau. A l'inverse, le fait d'introduire un simple décalage temporel par d'autres méthodes mathématiques n'introduira pas systématiquement un terme inertiel.
Terme de retour à l'état de initial de ces relations : Ce terme tend à ramener X, à son niveau initial.
Il correspond à une fonction continue de X, toujours croissante en valeur absolue avec X, : plus la variation de X, est forte, plus ce terme augmente en valeur absolue et tend à ramener X, à son niveau de départ.
Le couplage de ces deux termes permet de définir une relation générale pouvant rendre compte de cinétiques variables et non linéaires.
Plusieurs relations mathématiques peuvent comporter ces caractéristiques et être utilisées pour établir une relation entre X, et les Xj. Le fait de présenter une inflexion, d'être contraint par une limite maximale finie, et de tendre au retour à l'état initial peut être obtenu notamment par :
<Desc/Clms Page number 60>
- (1) Dans un aspect de l'invention, la relation entre X, et les Xj est établie par une relation inertielle découlant de celle de l'oscillateur harmonique en physique associée à un facteur d'amortissement suffisamment important pour limiter l'oscillation à un seul cycle.
Pour plus de clarté dans la description, une relation de ce type entre X, et chaque Xj, deux à deux est de la forme : wij .Xj = m, .(d2Xi / dt2) + 2 .#ij .(dX, / dt) + #ij2 .Xi
Le terme : m, .(d 2Xi / dt2) + #ij2 .X, correspond au terme inertiel
Le terme : 2 .#ij .(dX, / dt) correspond au terme de retour à l'état initial X, = variable associée à la molécule i dX, / dt = dérivée de X, en fonction du temps d2X, / dt2 = dérivée seconde de X, en fonction du temps Xj = variable associée à la molécule j m, = inertie de i (résistance au changement) #ij = amortissement (régit le retour à l'état d'équilibre de X, ).
#ij = pulsation (temps de réponse de X, au stimulus représenté par Xj) wij = facteur de couplage représentant la force de l'interaction entre les molécules i et j, correspondant à une pondération de l'effet de chaque molécule j sur la molécule i vis à vis de la résultante de l'ensemble des effets combinés de toutes les molécules j exerçant un effet sur i.
Une variante formellement équivalente également utilisable de cette relation entre X, et Xj consiste à se ramener à un cas particulier où m, est considéré comme une constante ; dans ce cas on peut éliminer le paramètre m, de l'équation. La formulation de l'équation reste globalement la même : wij .Xj = (d2Xi / dt2) + 2 .Au (dX, / dt) + #ij2 .X, Dans les deux cas, si : # #ij # # 1 , l'amortissement est tel qu'il n'y a plus qu'une seule oscillation de X,. En d'autres termes, cette relation fait
<Desc/Clms Page number 61>
varier X, à partir de son niveau de départ, jusqu'à une variation maximale, puis tend à le faire revenir à son état initial.
Pour mettre en #uvre l'invention, on définit donc une relation entre X, et l'ensemble des Xj : Dans un aspect de l'invention, celle-ci est définie par une sommation pondérée des effets des Xj sur la résultante sur X, : (2) # (wij. Xj) + c, = m, .(d2Xi / dt2) + 2 .#ij .(dX, / dt) + #ij2.Xi [l 1#n] Ou : (3) # (wij. Xj) + c, =(d2X, / dt2) + 2 .Au (dX, / dt) + #ij2 .X, [l 1#n] wij = facteur de pondération c, = facteur de correction, du fait des marges d'erreurs possibles dans les données expérimentales, non indispensable.
La définition des autres paramètres et variables est la même que précédemment.
X, ; dX, / dt ; d2 Xi / dt2 et Xj sont des données fournies expérimentalement ou directement calculés à partir de ces données. Par exemple, ces données peuvent être obtenues par des criblages d'expressions d'ARNm.
Les inconnues de cette équation en sont les paramètres ( m, ; #ij ; #ij ; wij ), qui sont à fixer pour entièrement définir la relation en vue de simulations.
On pose que quel que soit i et quel que soit j, # #ij # # 1.
Dans un autre aspect de l'invention, la relation entre X, et l'ensemble des Xj est définie par une somme dont la pondération inclut un terme variable au cours du temps et tenant compte explicitement des vitesses respectives des modifications des Xj, vitesses représentées par les dérivées : dXj(t)/dt, noté dans la suite dX/dt. Ceci revient à considérer que les vitesses de variation des Xj (des molécules j) influencent la résultante globale de leurs actions sur la cinétique de X, (de la molécule i).
<Desc/Clms Page number 62>
On définit : (4) aij = ( dXj / dt ) / ( dXj / dt ) ; aij étant un facteur de pondération.
[l 1#n] aij est directement calculable, à partir des données quantitatives expérimentales, pour chaque temps expérimental. Ce facteur de pondération varie en fonction du temps.
Dans ce cas, la relation entre X, et l'ensemble des Xj est définie comme suit : (5) (aij. wij. Xj) + c, = m, .(d2Xi / dt2) + 2 .#ij .(dX, / dt) + #ij2.Xi [l 1#n] Ou: (6) (aij.wij. Xj) + c, =(d2X, / dt2) + 2 .Au (dX, / dt) + #ij2 .X, [l 1#n] La définition des paramètres et variables est la même que précédemment.
Les équations (2) et (3) reviennent à un cas particulier des équations (5) et (6) où l'on pose arbitrairement : aij = 1.
Dans un autre aspect de l'invention, la relation entre X, et l'ensemble des Xj est définie par une somme dont la pondération inclut un terme variable au cours du temps et tenant compte explicitement des accélérations respectives des modifications des Xj, accélérations représentées par les dérivées secondes :d2Xj(t)/dt2 notées dans la suite d2Xj(t)/dt2. Ceci revient à considérer que les accélérations des variations des Xj (des molécules j) influencent la résultante globale de leurs actions sur la cinétique de X, (de la molécule i).
On définit : (7) aij = ( d 2Xj / dt2 ) / ( d 2Xj / de ) ; aij étant un facteur de pondération.
[j:1 n]
<Desc/Clms Page number 63>
Ici aussi, aij est directement calculable, à partir des données quantitatives expérimentales, pour chaque temps expérimental. Ce facteur de pondération varie en fonction du temps.
Dans ce cas, la relation entre X, et l'ensemble des Xj est définie comme précédemment : (8) # (aij. wij. Xj) + c, = m, .(d2Xi / dt2) + 2 .#ij .(dX, / dt) + #ij2.Xi [l 1#n] Ou : (9) # (aij. wij. Xj) + c, =(d2X, 1 de) + 2 .Au (dX, / dt) + #ij2 .Xi [l 1#n] La définition des paramètres et variables est la même que précédemment.
Seule la définition des paramètres aij (et par conséquent leur valeur et les valeurs calculées des autres paramètres) diffère par rapport à l'aspect précédent de l'invention.
Ici aussi, Les équations (2) et (3) reviennent à un cas particulier des équations (8) et (9) où l'on pose arbitrairement : aij = 1.
Dans la mesure où les temps auxquels sont effectuées les mesures expérimentales sont longs par rapport aux accélérations, il est préférable de définir les pondérations par rapport aux vitesses que par rapport aux accélérations.
- (2) Dans un autre aspect de l'invention, la relation entre X, et les Xj est établie par une relation sigmoïde comportant un facteur de retardement associée à une relation de décroissance linéaire.
Dans ce cas, dans une mise en #uvre préférentielle, la relation entre X, et les Xj sera : (10) (dX/dt) = Ki, . [ 1 / (1 + e-# wij xj - bi) ] - K2, . X, ; pour l'ensemble des sommets j ayant une action sur i (notés sommets j).
<Desc/Clms Page number 64>
Dans cette formulation, la relation associée aux arrêtes correspondant à une interaction moléculaire inhibitrice pourra être l'inverse de celle associée aux arrêtes correspondant à une interaction activatrice (courbe sigmoïde décroissante ou croissante, respectivement), cette caractéristique étant directement obtenue lors du calcul des paramètres, par leurs signes positifs ou négatifs.
Le terme sigmoïde : Ki,.[1/(1 + e-# wij xj - bi) ] correspond au terme inertiel Le terme : - K2i. X, correspond au terme de retour à l'état initial.
X, = variable associée au sommet i.
Xj = variable associée au sommet j. wij = facteur de pondération de l'effet de j sur i lorsque plusieurs sommets (j1, jz, ...,jn) agissent sur le sommet i. bi = facteur de retardement K1, = facteur de limite maximale de variation de X, . Son utilisation est liée au fait que le terme sigmoïde varie entre 0 (variation de 0 %) et 1 (variation de 100%). Ce facteur est donc requis pour rendre compte des situations ou X, varie de plus de 100%.
K2, = facteur de retour à l'équilibre.
Dans cet aspect de l'invention, la résultante pondérée de la combinaison des effets de l'ensemble des Xj sur X, est incluse d'emblée. L'effet combiné de l'ensemble des Xj est représenté ici aussi par une somme pondérée, dans le terme inertiel.
Dans un autre aspect de l'invention, la relation entre les X, et les Xj est établie similairement à l'aspect précédent, mais avec l'introduction d'un facteur de pondération supplémentaire aij tel que défini par les équations
<Desc/Clms Page number 65>
(4) ou (7) précédentes. Dans ce cas, dans une mise en #uvre préférentielle, la relation entre X, et les Xj sera : (11) (dX/dt) = K1i. [1 / (1 + e-#aij wij xj - bi) ] - K2,. Xi ;pour l'ensemble des sommets j ayant une action sur i (notés sommets j).
La définition des paramètres et variables est la même que précédemment ; le paramètre aij est défini soit par l'équation (4), soit par l'équation (7) précédentes. L'équation (10) revient à un cas particulier de l'équation (11) où l'on pose arbitrairement : aij = 1.
Le paramètre aij est un terme variable au cours du temps et tenant compte explicitement des vitesses respectives des modifications des Xj, ou des accélérations respectives des Xj, selon que aij est défini par l'équation (4) ou l'équation (7), respectivement.
Dans la mesure où les temps auxquels sont effectuées les mesures expérimentales sont longs par rapport aux accélérations, il est préférable de définir les facteurs de pondération aij par rapport aux vitesses (équation (4)) que par rapport aux accélérations (équation (7)).
Equation (4) : (4) aij = (dXj / dt) / # (dXj / dt) [l 1#n] Equation (7) : (7) aij = (d2Xj / dt2) / # (d2 Xj / dt2) [l 1#n] - (3) Cependant, d'autres types de relations mathématiques non citées ici comportant les caractéristiques décrites dans l'invention pourrait aussi être utilisées, leur utilisation dans le cadre de l'invention étant alors considérée comme tombant sous le coup du présent brevet.
- (4) Il doit être entendu ici que l'utilisation de relations mathématiques non explicitées ici mais qui permettent de reprendre tout ou partie
<Desc/Clms Page number 66>
des caractéristiques décrites ci-dessus entrent dans le cadre de l'invention. Ainsi, il est possible, de façon non limitative, d'établir une relation entre X, et Xj qui respecte l'existence d'inflexion de la courbe de X, en fonction du temps, et une limite maximale de X, dans l'intervalle des données expérimentales utilisées et dans les intervalles de temps expérimentaux par une fonction polynôme, ou une fonction sinus ou cosinus, etc.
Exemple 2 : Mise en oeuvre pratique de l'étape B) De multiples techniques de procédures d'apprentissage, dont par descente de gradient au sein de graphes, sont disponibles pour effectuer le calcul des paramètres dans le domaine public (notamment en utilisant les transformées de Laplace, ou encore la méthode développée par Pearlmutter, 'Gradient calculations for dynamic recurrent neural networks : a survey', IEEE transactions on neural networks, 1995). Un autre exemple de méthode de calcul consiste à mette en oeuvre la méthode de résolution numérique adaptative d'ordre S de Runge-Kutta (permettant d'utiliser un pas de temps non constant dans les données expérimentales) associée à un apprentissage par BPTT (back propagation through time).
Le choix de la procédure d'apprentissage est notamment lié aux algorithmes utilisés pour définir la relation entre les couples (X,, Xj). La personne de l'art pourra facilement effectuer ce choix, et le mettre en oeuvre.
Le choix et la mise en oeuvre d'une fonction d'erreur ne posent pas de difficulté particulière. En effet, plusieurs fonctions d'erreur peuvent être utilisées, et sont disponibles dans la littérature. A titre d'exemples, des types de fonctions d'erreur utilisables sont :
E = # # [X1i(t) - X2i (t)]2. dt t avec : Xi,(t) : valeur de X, au temps t calculée par simulation
<Desc/Clms Page number 67>
avec : X2,(t) : valeur de X, au temps t mesurée expérimentalement.
Ou encore l'erreur globale relative aux trajectoires données pour l'apprentissage :
Figure img00670001

, [ ( X11(t) - X21(t ) )2 / ( X21(t) )2 i t 1 t # = racine carrée du terme entre crochets [ ].
X1i(t) et X2,(t ) étant définis comme ci-dessus.
On peut également, pour calculer l'erreur relative locale (au niveau de la trajectoire d'un sommet du graphe), utiliser la formule :
Figure img00670002

V[l(x1l(t)-x2l(t))2/z(x2l(t))2] t t # = racine carrée du terme entre crochets : [ ].
Xi,(t) et X2,(t ) étant définis comme ci-dessus.
Dans le cas de la mise en #uvre d'une relation X, Xj de type inertielle adaptée de l'oscillateur harmonique, et dans une mise en oeuvre préférentielle, les contraintes suivantes seront imposées lors du calcul des paramètres : Un seuillage sera introduit en imposant que pour toute relation élémentaire (X, ,Xj), les paramètres calculés respectent : #ij > #ij (ce qui revient à imposer un amortissement important), ou encore, m, = valeur maximale calculée pour l'ensemble des relations (X, ,Xj), ces deux critères pouvant être associés.
Au terme du calcul des paramètres, le graphe (ou réseau) est entièrement déterminé par les relations mathématiques associées aux arrêtes du graphe : il s'agit d'un réseau entièrement déterministe. Le graphe correspondant est orienté. Le réseau est peut être représenté de façon explicite par la mise en oeuvre de techniques de représentation de réseaux de neurones utilisées en intelligence artificielle. Il s'agit d'un réseau non
<Desc/Clms Page number 68>
booléen, ni bayésien, ni organisé en couches, permettant de représenter des redondances des circuits et des boucles de rétro-action. Ce réseau déterministe permet la mise en #uvre de simulations sans coût de calcul notable, même pour un graphe de très grande taille.
Exemple 3 : Mise en #uvre pratique de l'étape D) Propagation : De nombreuses méthodes de propagation sont disponibles dans la littérature, adaptées des technologies de réseaux de neurones développées en intelligence artificielle, et leur mise en #uvre ne pose pas de difficulté particulière à l'homme de l'art, le graphe dynamique étant entièrement déterministe à ce stade de la mise en #uvre.
A titre d'exemples de méthodes de propagation, on peut citer le logiciel Neural Network Toolbox 4. 0.2, développé dans l'environnement de calcul MATLAB, disponible à l'adresse internet
Figure img00680001

http://www.mathtools.net/MATLAB/Neural Networks/index.html, commercialisé par la société The MathWorks, Inc. Ce logiciel de mise en oeuvre de réseau de neurones permet notamment de réaliser des propagations dans un réseau. D'autres exemples de propagations sont intégrés aux méthodes de Runge Kutta et de Pearlmutter citées dans le présent texte.
La propagation est inhérente aux méthodes d'apprentissage citées à l'exemple 2. L'étape de simulation consiste donc à utiliser la méthode de propagation mise en #uvre de l'étape B, ou toue autre méthode de propagation jugée adéquate par l'homme de l'art.
Plusieurs principes sont toutefois préférentiellement respectés lors de la mise en #uvre des simulations : Dans une mise en #uvre particulière de l'invention, des procédures de seuillage sont associées à la méthode de propagation choisie, afin de
<Desc/Clms Page number 69>
diminuer les divergences (donc d'améliorer les convergences, c'est à dire la fiabilité). Celles-ci peuvent porter sur : - Un seuillage inférieur (c'est à dire que toute valeur d'une variable prédite en dessous de 0 est ramenée à 0 (où à une valeur de bruit de fond minimale si celui-ci peut être défini par les données expérimentales) : Seuillage : pour toute molécule i , quelle que soit la valeur X, , Xi < 0 => Xi = 0 - Un seuillage supérieur : en imposant un seuil maximal aux valeurs des X, pouvant être obtenues lors des simulations (par exemple en fixant un seuil maximal correspondant à un facteur multiplicatif (pouvant de façon non exclusive être fixé entre 1 et 10) des valeurs maximales observées expérimentalement pour chaque X, ; ce facteur peut éventuellement être défini lors de simulations de résultats expérimentaux réels disponibles en testant plusieurs valeurs de ce facteur.
- L'introduction de contraintes dans les boucles lors des simulations : Ceci peut être réalisé par plusieurs méthodes, non exclusives les unes des autres, cette liste n'étant pas limitative. Toutes ces méthodes visent à imposer des contraintes, soit au nombre de boucles effectuées, soit aux gammes de valeurs des X, : o Limitation du nombre de boucles pouvant être effectuées lors des simulations, le nombre maximal de boucles pouvant être défini à partir de l'analyse de données expérimentales réelles en tenant compte de la durée des simulations. o Utilisation du seuillage tel que décrit ci dessus pour éviter des phénomènes d' explosion dans des boucles, celles-ci allant alors se stabiliser au niveau maximal autorisé du seuil.
Itération : La pratique d'itérations est couramment utilisée en informatique. Elle consiste ici à répéter la séquence de calculs de propagation en modifiant de façon systématique les stimuli. Elle peut ou non inclure une stratégie de
<Desc/Clms Page number 70>
calcul parallèle. Elle est facile à mettre en oeuvre par l'homme de l'art et ne nécessite pas d'être plus détaillée.
En permettant de décrire l'effet de telle ou telle modification du réseau sur l'ensemble du réseau, ces simulations visent à analyser le système biologique dans son ensemble, et donc à répondre aux enjeux cités plus haut. Ces simulations consistent donc à décrire l'évolution de l'ensemble des molécules du réseau d'interactions moléculaires au cours du temps suite aux stimuli virtuels initiaux, y compris, si cela s'avère biologiquement important, jusqu'à un nouvel état d'équilibre du graphe.
Ces stimuli virtuels peuvent être appliqués de façon systématique sur chaque sommet du graphe, mais il est aussi possible d'effectuer plusieurs stimuli en même temps, ou de façon séquentielle, sur plusieurs sommets.
Proximité des états du graphe : Un calcul statistique de proximité entre chaque état final calculé et l'état voulu, ou entre chaque état final et l'état à modifier, est effectué. Il permet, pour chaque sommet, d'associer un critère statistique (proximité obtenue) au sommet sur lequel s'est exercé le stimulus et au stimulus exercé sur ce sommet.
De nombreuses possibilités de comparaison statistique des états d'un graphe existent, et leur choix ne pose pas de difficulté pour l'homme de l'art.
A titre d'exemple, la distance entre deux états d'un graphe peut être calculée comme suit : Si X1i est la valeur de la variable X, à l'état 1 du graphe ; Si X2, est la valeur de la variable Xi à l'état 2 du graphe, on peut calculer une distance mathématique entre les états 1 et 2 du graphe par : D = # (X1i = X2i)2 Ou encore :
<Desc/Clms Page number 71>
Figure img00710001

o=((x,-x2>2(x2,>2l # = racine carrée du terme entre crochets : [ ].
D'autres méthodes de statistiques classiques telles que comparaisons des populations, etc... sont aussi disponibles.
Les éléments de comparaison des graphes, sont de deux ordres : - Points de convergence des valeurs X, (end point), par exemple par comparaison des populations de X, finaux entre états de graphes par statistiques classiques de comparaisons de populations (moyennes, variance... ).
- Cinétiques de chaque molécule i (par exemple par comparaison des différences d'intégrales des courbes de cinétiques, et comparaison des populations de différences d'intégrales). Il est ainsi possible de comparer, par exemple, la cinétique des X, au cours de l'établissement d'un processus pathologique à celle suite à un stimulus tel que défini plus haut, permettant de hiérarchiser les sommets et les stimuli par l'écart qu'ils provoquent par rapport au processus pathologique, en ne se limitant pas aux points de convergence. Dans ce cas, il est possible par exemple d'estimer la distance entre les deux cinétiques du graphe par les fonctions d'erreur citées plus haut :
Figure img00710002

E = f [ X11(t) - X21 (t)]2 . dt i t Ou encore :
Figure img00710003

.. [ l l ( X11(t) - X21(t ) )2/ II ( X21(t) )2 i t i t Ces deux types de comparaisons permettent d'évaluer statistiquement la proximité des graphes, dans les procédures de simulations décrites plus haut.
<Desc/Clms Page number 72>
- D'autres types d'analyse d'analyse de proximité peuvent être mis en #uvre : voir par exemple : Pearlmutter, 'Gradient calculations for dynamic recurrent neural networks : a survey', IEEE transactions on neural networks, 1995.
Le choix et la mise en #uvre de ces comparaisons sera facilement réalisée par l'homme de l'art et ne requiert pas plus de description ici.
Exemple 4 : modélisations et simulations à partir d'un graphe statique de 116 molécules Données biologiques utilisées : 1) Un graphe statique correspondant à un réseau d'interactions moléculaires dans la levure (Saccharomyces cerevisiae, organisme vivant eucaryote pouvant être considéré comme un système biologique répondant aux critères de complexité cités plus haut) a été construit par une saisie manuelle dans un fichier plat de type txt (sans mettre en #uvre de système automatisé particulier), à partir des données de la base de données KEGG :Kyoto encyclopedia of Genes and Genomes, données en accès
Figure img00720001

libre à l'adresse internet http:llwww.aenome.ad.jp/keg~ Ikce.q~ 2 html.
Ce graphe est plus particulièrement centré sur les mécanismes de la respiration cellulaire (glycolyse, néoglucogénèse, métabolisme du Pyruvate et de l'acetyl CoA, etc.). Il comprend 116 molécules, enzymes ou facteurs de transcription. Il comprend 329 interactions uni- ou bi-directionnelles entre ces molécules.
Le graphe statique correspondant à ce réseau d'interactions moléculaires est donné ici à titre d'exemple, sous deux formes : - Schéma (figure 2). Sur ce schéma, chaque rectangle représente une protéine. Les lettres dans le rectangle sont les abréviations usuelles du nom de la protéine, selon la nomenclature de KEGG et de SGD :
<Desc/Clms Page number 73>
Saccharomyces Genome Database développée par le Department of Genetics at the School of Medicine, Université Stanford, USA.
- Tableau représentant les interactions moléculaires (Tableau 5 cidessous) Ce tableau présente les données de graphe statique sous une forme directement utilisable par un système informatique de modélisation et de simulation tel que décrit dans l'invention.
Figure img00730001
<tb>
<tb>
A <SEP> A <SEP> B <SEP> B
<tb> Code <SEP> ORF <SEP> Abréviation <SEP> Code <SEP> ORF <SEP> Abréviation <SEP> sens
<tb> YKL106W <SEP> AAT1 <SEP> YNR001C <SEP> CIT1 <SEP> A-B
<tb> YKL106W <SEP> AAT1 <SEP> YCR005C <SEP> CIT2 <SEP> A-B
<tb> YBL015W <SEP> ACH1 <SEP> YMR170C <SEP> ALD2 <SEP> A-B
<tb> YBL015W <SEP> ACH1 <SEP> YMR169C <SEP> ALD3 <SEP> A-B
<tb> YBL015W <SEP> ACH1 <SEP> YPL061W <SEP> ALD6 <SEP> A-B
<tb> YLR304C <SEP> AC01 <SEP> YER065C <SEP> ICL1 <SEP> A-B
<tb> YLR304C <SEP> AC01 <SEP> YNL037C <SEP> IDH1 <SEP> A-B
<tb> YLR304C <SEP> AC01 <SEP> YOR136W <SEP> IDH2 <SEP> A-B
<tb> YLR304C <SEP> AC01 <SEP> YDL066W <SEP> IDP1 <SEP> A<->B
<tb> YLR304C <SEP> AC01 <SEP> YLR174W <SEP> IDP2 <SEP> A<->B
<tb> YAL054C <SEP> ACS1 <SEP> YBL015W <SEP> ACH1 <SEP> A-B
<tb> YAL054C <SEP> ACS1 <SEP> YNR001C <SEP> CIT1 <SEP> A<->B
<tb> YAL054C <SEP> ACS1 <SEP> YCR005C <SEP> CIT2 <SEP> A<->B
<tb> YAL054C <SEP> ACS1 <SEP> YIR031C <SEP> DAL7 <SEP> A-B
<tb> YAL054C <SEP> ACS1 <SEP> YNL117W <SEP> MLS1 <SEP> A-B
<tb> YAL054C <SEP> ACS1 <SEP> YNL071W <SEP> PDA2 <SEP> A<->B
<tb> YAL054C <SEP> ACS1 <SEP> YLR044C <SEP> PDC1 <SEP> A<->B
<tb> YAL054C <SEP> ACS1 <SEP> YLR134W <SEP> PDC5 <SEP> A<->B
<tb> YAL054C <SEP> ACS1 <SEP> YGR087C <SEP> PDC6 <SEP> A<->B
<tb> YAL054C <SEP> ACS1 <SEP> YAL038W <SEP> PYK1 <SEP> A<->B
<tb> YAL054C <SEP> ACS1 <SEP> YOR347C <SEP> PYK2 <SEP> A<->B
<tb> YLR153C <SEP> ACS2 <SEP> YBL015W <SEP> ACH1 <SEP> A-B
<tb> YLR153C <SEP> ACS2 <SEP> YNR001C <SEP> CIT1 <SEP> A<->B
<tb> YLR153C <SEP> ACS2 <SEP> YCR005C <SEP> CIT2 <SEP> A<->B
<tb> YLR153C <SEP> ACS2 <SEP> YIR031 <SEP> C <SEP> DAL7 <SEP> A-B
<tb> YLR153C <SEP> ACS2 <SEP> YNL117W <SEP> MLS1 <SEP> A-B
<tb> YLR153C <SEP> ACS2 <SEP> YNL071W <SEP> PDA2 <SEP> A<->B
<tb> YLR153C <SEP> ACS2 <SEP> YLR044C <SEP> PDC1 <SEP> A<->B
<tb> YLR153C <SEP> ACS2 <SEP> YLR134W <SEP> PDC5 <SEP> A<->B
<tb> YLR153C <SEP> ACS2 <SEP> YGR087C <SEP> PDC6 <SEP> A<->B
<tb>
<Desc/Clms Page number 74>
Figure img00740001
<tb>
<tb> YLR153C <SEP> ACS2 <SEP> YAL038W <SEP> PYK1 <SEP> A<->B
<tb> YLR153C <SEP> ACS2 <SEP> YOR347C <SEP> PYK2 <SEP> A<->B
<tb> YOL086C <SEP> . <SEP> ADH1 <SEP> YMR170C <SEP> ALD2 <SEP> A-B
<tb> YOL086C <SEP> ADH1 <SEP> YMR169C <SEP> ALD3 <SEP> A-B
<tb> YOL086C <SEP> ADH1 <SEP> YPL061W <SEP> ALD6 <SEP> A-B
<tb> YOL086C <SEP> ADH1 <SEP> YHL032C <SEP> GUT1 <SEP> A-B
<tb> YMR303C <SEP> ADH2 <SEP> YMR170C <SEP> ALD2 <SEP> A-B
<tb> YMR303C <SEP> ADH2 <SEP> YMR169C <SEP> ALD3 <SEP> A-B
<tb> YMR303C <SEP> ADH2 <SEP> YPL061W <SEP> ALD6 <SEP> A-B
<tb> YMR303C <SEP> ADH2 <SEP> YHL032C <SEP> GUT1 <SEP> A-B
<tb> YBR145W <SEP> ADH5 <SEP> YMR170C <SEP> ALD2 <SEP> A-B
<tb> YBR145W <SEP> ADH5 <SEP> YMR169C <SEP> ALD3 <SEP> A-B
<tb> YBR145W <SEP> ADH5 <SEP> YPL061W <SEP> ALD6 <SEP> A-B
<tb> YBR145W <SEP> ADH5 <SEP> YHL032C <SEP> GUT1 <SEP> A-B
<tb> YDR216W <SEP> ADR1 <SEP> YOL086C <SEP> ADH1 <SEP> A-B
<tb> YDR216W <SEP> ADR1 <SEP> YMR303C <SEP> ADH2 <SEP> A-B
<tb> YMR170C <SEP> ALD2 <SEP> YAL054C <SEP> ACS1 <SEP> A<->B
<tb> YMR170C <SEP> ALD2 <SEP> YLR153C <SEP> ACS2 <SEP> A<->B
<tb> YMR169C <SEP> ALD3 <SEP> YAL054C <SEP> ACS1 <SEP> A<->B
<tb> YMR169C <SEP> ALD3 <SEP> YLR153C <SEP> ACS2 <SEP> A<->B
<tb> YPL061W <SEP> ALD6 <SEP> YAL054C <SEP> ACS1 <SEP> A<->B
<tb> YPL061W <SEP> ALD6 <SEP> YLR153C <SEP> ACS2 <SEP> A<->B
<tb> YPR026W <SEP> ATH1 <SEP> YCL040W <SEP> GLK1 <SEP> A-B
<tb> YDR423C <SEP> CAD1 <SEP> YBR126C <SEP> TPS1 <SEP> A-B
<tb> YDR423C <SEP> CAD1 <SEP> YDR074W <SEP> TPS2 <SEP> A-B
<tb> YAL021C <SEP> CCR4 <SEP> YMR303C <SEP> ADH2 <SEP> A-B
<tb> YNR001 <SEP> C <SEP> CIT1 <SEP> YLR304C <SEP> AC01 <SEP> A<->B
<tb> YCR005C <SEP> CIT2 <SEP> YLR304C <SEP> AC01 <SEP> A<->B
<tb> YML054C <SEP> CYB2 <SEP> YER178W <SEP> PDA1 <SEP> A-B
<tb> YML054C <SEP> CYB2 <SEP> YBR221C <SEP> PDB1 <SEP> A-B
<tb> YIR031C <SEP> DAL7 <SEP> YKL085W <SEP> MDH1 <SEP> A-B
<tb> YIR031C <SEP> DAL7 <SEP> YOL126C <SEP> MDH2 <SEP> A-B
<tb> YIR031 <SEP> C <SEP> DAL7 <SEP> YDL078C <SEP> MDH3 <SEP> A-B
<tb> YDL174C <SEP> DLD1 <SEP> YER178W <SEP> PDA1 <SEP> A-B
<tb> YDL174C <SEP> DLD1 <SEP> YBR221 <SEP> C <SEP> PDB1 <SEP> A-B
<tb> YGR254W <SEP> EN01 <SEP> YKL152C <SEP> GPM1 <SEP> A<->B
<tb> YGR254W <SEP> EN01 <SEP> YDL021W <SEP> GPM2 <SEP> A<->B
<tb> YGR254W <SEP> EN01 <SEP> YAL038W <SEP> PYK1 <SEP> A-B
<tb> YGR254W <SEP> EN01 <SEP> YOR347C <SEP> PYK2 <SEP> A-B
<tb> YHR174W <SEP> EN02 <SEP> YKL152C <SEP> GPM1 <SEP> A<->B
<tb> YHR174W <SEP> EN02 <SEP> YDL021W <SEP> GPM2 <SEP> A<->B
<tb> YHR174W <SEP> EN02 <SEP> YAL038W <SEP> PYK1 <SEP> A-B
<tb> YHR174W <SEP> EN02 <SEP> YOR347C <SEP> PYK2 <SEP> A-B
<tb> YDR261 <SEP> C <SEP> EXG2 <SEP> YIL162W <SEP> SUC2 <SEP> A-B
<tb>
<Desc/Clms Page number 75>
Figure img00750001
<tb>
<tb> YDR261 <SEP> C <SEP> EXG2 <SEP> YCL040W <SEP> GLK1 <SEP> A-B
<tb> YDR261C <SEP> EXG2 <SEP> YFR053C <SEP> HXK1 <SEP> A-B
<tb> YKL060C <SEP> FBA1 <SEP> YLR377C <SEP> FBP1 <SEP> A-B
<tb> YKL060C <SEP> FBA1 <SEP> YDR050C <SEP> TPI1 <SEP> A<->B
<tb> YLR377C <SEP> FBP1 <SEP> YGR240C <SEP> PFK1 <SEP> A<->B
<tb> YLR377C <SEP> FBP1 <SEP> YMR205C <SEP> PFK2 <SEP> A<->B
<tb> YLR377C <SEP> FBP1 <SEP> YBR196C <SEP> PGI1 <SEP> A-B
<tb> YJL155C <SEP> FBP26 <SEP> YGR240C <SEP> PFK1 <SEP> A-B
<tb> YJL155C <SEP> FBP26 <SEP> YMR205C <SEP> PFK2 <SEP> A-B
<tb> YJL155C. <SEP> FBP26 <SEP> YER003C <SEP> PM140 <SEP> A-B
<tb> YPL262W <SEP> FUM1 <SEP> YKL085W <SEP> MDH1 <SEP> A<->B
<tb> YPL262W <SEP> FUM1 <SEP> YOL126C <SEP> MDH2 <SEP> A<->B
<tb> YPL262W <SEP> FUM1 <SEP> YDL078C <SEP> MDH3 <SEP> A<->B
<tb> YBR020W <SEP> GAL1 <SEP> YBR018C <SEP> GAL7 <SEP> A-B
<tb> YBR019C <SEP> GAL10 <SEP> YKL035W <SEP> UGP1 <SEP> A-B
<tb> YPL248C <SEP> GAL4 <SEP> YMR105C <SEP> PGM2 <SEP> A-B
<tb> YBR018C <SEP> GAL7 <SEP> YBR019C <SEP> GAL10 <SEP> A-B
<tb> YPL075W <SEP> GCR1 <SEP> YOL086C <SEP> ADH1 <SEP> A-B
<tb> YPL075W <SEP> GCR1 <SEP> YGR254W <SEP> EN01 <SEP> A-B
<tb> YPL075W <SEP> GCR1 <SEP> YHR174W <SEP> EN02 <SEP> A-B
<tb> YPL075W <SEP> GCR1 <SEP> YKL152C <SEP> GPM1 <SEP> A-B
<tb> YEL011W <SEP> GLC3 <SEP> YPR160W <SEP> GPH1 <SEP> A<->B
<tb> YEL011W <SEP> GLC3 <SEP> YBR299W <SEP> MAL32 <SEP> A-B
<tb> YCL040W <SEP> GLK1 <SEP> YBR196C <SEP> PGI1 <SEP> A<->B
<tb> YDR272W <SEP> GL02 <SEP> YML054C <SEP> CYB2 <SEP> A-B
<tb> YDR272W <SEP> GL02 <SEP> YDL174C <SEP> DLD1 <SEP> A-B
<tb> YGR256W <SEP> GND2 <SEP> YOR095C <SEP> RKI1 <SEP> A-B
<tb> YGR256W <SEP> GND2 <SEP> YJL121C <SEP> RPE1 <SEP> A-B
<tb> YPR160W <SEP> GPH1 <SEP> YKL035W <SEP> UGP1 <SEP> A-B
<tb> YPR160W <SEP> GPH1 <SEP> YBR299W <SEP> MAL32 <SEP> A-B
<tb> YPR160W <SEP> GPH1 <SEP> YKL127W <SEP> PGM1 <SEP> A-B
<tb> YPR160W <SEP> GPH1 <SEP> YMR105C <SEP> PGM2 <SEP> A-B
<tb> YKL152C <SEP> GPM1 <SEP> YCR012W <SEP> PGK1 <SEP> A<->B
<tb> YDL021W <SEP> GPM2 <SEP> YCR012W <SEP> PGK1 <SEP> A<->B
<tb> YGR032W <SEP> GSC2 <SEP> YDR261 <SEP> C <SEP> EXG2 <SEP> A-B
<tb> YFR015C <SEP> GSY1 <SEP> YEL011W <SEP> GLC3 <SEP> A-B
<tb> YLR258W <SEP> GSY2 <SEP> YEL011W <SEP> GLC3 <SEP> A-B
<tb> YBL021C <SEP> HAP3 <SEP> YNR001C <SEP> CIT1 <SEP> A-B
<tb> YBL021C <SEP> HAP3 <SEP> YKL148C <SEP> SDH1 <SEP> A-B
<tb> YBL021C <SEP> HAP3 <SEP> YKL141W <SEP> SDH3 <SEP> A-B
<tb> YBL021 <SEP> C <SEP> HAP3 <SEP> YIL125W <SEP> KGD1 <SEP> A-B
<tb> YBL021 <SEP> C <SEP> HAP3 <SEP> YDR148C <SEP> KGD2 <SEP> A-B
<tb> YKL109W <SEP> HAP4 <SEP> YNR001 <SEP> C <SEP> CIT1 <SEP> A-B
<tb> YKL109W <SEP> HAP4 <SEP> YKL148C <SEP> SDH1 <SEP> A-B
<tb>
<Desc/Clms Page number 76>
Figure img00760001
<tb>
<tb> YKL109W <SEP> HAP4 <SEP> YKL141W <SEP> SDH3 <SEP> A-B
<tb> YKL109W <SEP> HAP4 <SEP> YIL125W <SEP> KGD1 <SEP> A-B
<tb> YKL109W <SEP> HAP4 <SEP> YDR148C <SEP> KGD2 <SEP> A-B
<tb> YKL109W <SEP> HAP4 <SEP> YFL018C <SEP> LPD1 <SEP> A-B
<tb> YFR053C <SEP> HXK1 <SEP> YGR240C <SEP> PFK1 <SEP> A-B
<tb> YFR053C <SEP> HXK1 <SEP> YMR205C <SEP> PFK2 <SEP> A-B
<tb> YFR053C <SEP> HXK1 <SEP> YIL107C <SEP> PFK26 <SEP> A-B
<tb> YFR053C <SEP> HXK1 <SEP> YBR196C <SEP> PGI1 <SEP> A-B
<tb> YGL253W <SEP> HXK2 <SEP> YGR240C <SEP> PFK1 <SEP> A-B
<tb> YGL253W <SEP> HXK2 <SEP> YMR205C <SEP> PFK2 <SEP> A-B
<tb> YGL253W <SEP> HXK2 <SEP> YIL107C <SEP> PFK26 <SEP> A-B
<tb> YER065C <SEP> ICL1 <SEP> YIR031 <SEP> C <SEP> DAL7 <SEP> A-B
<tb> YER065C <SEP> ICL1 <SEP> YNL117W <SEP> MLS1 <SEP> A-B
<tb> YNL037C <SEP> IDH1 <SEP> YIL125W <SEP> KGD1 <SEP> A-B
<tb> YOR136W <SEP> IDH2 <SEP> YIL125W <SEP> KGD1 <SEP> A-B
<tb> YDL066W <SEP> IDP1 <SEP> YIL125W <SEP> KGD1 <SEP> A-B
<tb> YLR174W <SEP> IDP2 <SEP> YIL125W <SEP> KGD1 <SEP> A-B
<tb> YIL125W <SEP> KGD1 <SEP> YDR148C <SEP> KGD2 <SEP> A-B
<tb> YDR148C <SEP> KGD2 <SEP> YFL018C <SEP> LPD1 <SEP> A<->B
<tb> YDR148C <SEP> KGD2 <SEP> YGR244C <SEP> LSC2 <SEP> A<->B
<tb> YFL018C <SEP> LPD1 <SEP> YMR189W <SEP> GCV2 <SEP> A-B
<tb> YFL018C <SEP> LPD1 <SEP> YIL125W <SEP> KGD1 <SEP> A-B
<tb> YFL018C <SEP> LPD1 <SEP> YER178W <SEP> PDA1 <SEP> A-B
<tb> YFL018C <SEP> LPD1 <SEP> YBR221C <SEP> PDB1 <SEP> A<->B
<tb> YBR299W <SEP> MAL32 <SEP> YCL040W <SEP> GLK1 <SEP> A-B
<tb> YBR299W <SEP> MAL32 <SEP> YFR053C <SEP> HXK1 <SEP> A-B
<tb> YBR299W <SEP> MAL32 <SEP> YBR196C <SEP> PG11 <SEP> A-B <SEP>
<tb> YKL085W <SEP> MDH1 <SEP> YNR001C <SEP> CIT1 <SEP> A<->B
<tb> YKL085W <SEP> MDH1 <SEP> YCR005C <SEP> CIT2 <SEP> A<->B
<tb> YKL085W <SEP> MDH1 <SEP> YKR097W <SEP> PCK1 <SEP> A<->B
<tb> YKL085W <SEP> MDH1 <SEP> YGL062W <SEP> PYC1 <SEP> A<->B
<tb> YKL085W <SEP> MDH1 <SEP> YBR218C <SEP> PYC2 <SEP> A<->B
<tb> YOL126C <SEP> MDH2 <SEP> YNR001 <SEP> C <SEP> CIT1 <SEP> A<->B
<tb> YOL126C <SEP> MDH2 <SEP> YCR005C <SEP> CIT2 <SEP> A<->B
<tb> YOL126C <SEP> MDH2 <SEP> YKR097W <SEP> PCK1 <SEP> A<->B
<tb> YOL126C <SEP> MDH2 <SEP> YGL062W <SEP> PYC1 <SEP> A<->B
<tb> YOL126C <SEP> MDH2 <SEP> YBR218C <SEP> PYC2 <SEP> A<->B
<tb> YDL078C <SEP> MDH3 <SEP> YNR001C <SEP> CIT1 <SEP> A<->B
<tb> YDL078C <SEP> MDH3 <SEP> YCR005C <SEP> CIT2 <SEP> A<->B
<tb> YDL078C <SEP> MDH3 <SEP> YKR097W <SEP> PCK1 <SEP> A<->B
<tb> YDL078C <SEP> MDH3 <SEP> YGL062W <SEP> PYC1 <SEP> A<->B
<tb> YDL078C <SEP> MDH3 <SEP> YBR218C <SEP> PYC2 <SEP> A<->B
<tb> YNL117W <SEP> MLS1 <SEP> YKL085W <SEP> MDH1 <SEP> A-B
<tb> YNL117W <SEP> MLS1 <SEP> YOL126C <SEP> MDH2 <SEP> A-B
<tb>
<Desc/Clms Page number 77>
Figure img00770001
<tb>
<tb> YNL117W <SEP> MLS1 <SEP> YDL078C <SEP> MDH3 <SEP> A-B
<tb> YMR037C <SEP> MSN2 <SEP> YMR170C <SEP> ALD2 <SEP> A-B
<tb> YMR037C <SEP> MSN2 <SEP> YMR169C <SEP> ALD3 <SEP> A-B
<tb> YMR037C <SEP> MSN2 <SEP> YCL040W <SEP> GLK1 <SEP> A-B
<tb> YMR037C <SEP> MSN2 <SEP> YFR053C <SEP> HXK1 <SEP> A-B
<tb> YMR037C <SEP> MSN2 <SEP> YMR105C <SEP> PGM2 <SEP> A-B
<tb> YMR037C <SEP> MSN2 <SEP> YBR117C <SEP> TKL2 <SEP> A-B
<tb> YMR037C <SEP> MSN2 <SEP> YBR126C <SEP> TPS1 <SEP> A-B
<tb> YMR037C <SEP> MSN2 <SEP> YDR074W <SEP> TPS2 <SEP> A-B
<tb> YKL062W <SEP> MSN4 <SEP> YMR170C <SEP> ALD2 <SEP> A-B
<tb> YKL062W <SEP> MSN4 <SEP> YMR169C <SEP> ALD3 <SEP> A-B
<tb> YKL062W <SEP> MSN4 <SEP> YCL040W <SEP> GLK1 <SEP> A-B
<tb> YKL062W <SEP> MSN4 <SEP> YFR053C <SEP> HXK1 <SEP> A-B
<tb> YKL062W <SEP> MSN4 <SEP> YMR105C <SEP> PGM2 <SEP> A-B
<tb> YKL062W <SEP> MSN4 <SEP> YBR117C <SEP> TKL2 <SEP> A-B
<tb> YKL062W <SEP> MSN4 <SEP> YBR126C <SEP> TPS1 <SEP> A-B
<tb> YKL062W <SEP> MSN4 <SEP> YDR074W <SEP> TPS2 <SEP> A-B
<tb> YDR001C <SEP> NTH1 <SEP> YCL040W <SEP> GLK1 <SEP> A-B
<tb> YDR001C <SEP> NTH1 <SEP> YBR196C <SEP> PGI1 <SEP> A-B
<tb> YBR001 <SEP> C <SEP> NTH2 <SEP> YBR196C <SEP> PGI1 <SEP> A-B
<tb> YBR001 <SEP> C <SEP> NTH2 <SEP> YCL040W <SEP> GLK1 <SEP> A-B
<tb> YKR097W <SEP> PCK1 <SEP> YNR001 <SEP> C <SEP> CIT1 <SEP> A<->B
<tb> YKR097W <SEP> PCK1 <SEP> YCR005C <SEP> CIT2 <SEP> A<->B
<tb> YKR097W <SEP> PCK1 <SEP> YAL038W <SEP> PYK1 <SEP> A-B
<tb> YKR097W <SEP> PCK1 <SEP> YOR347C <SEP> PYK2 <SEP> A-B
<tb> YKR097W <SEP> PCK1 <SEP> YGR254W <SEP> EN01 <SEP> A<->B
<tb> YKR097W <SEP> PCK1 <SEP> YHR174W <SEP> EN02 <SEP> A<->B
<tb> YER178W <SEP> PDA1 <SEP> YNL071W <SEP> PDA2 <SEP> A-B
<tb> YNL071W <SEP> PDA2 <SEP> YNR001C <SEP> CIT1 <SEP> A<->B
<tb> YNL071W <SEP> PDA2 <SEP> YCR005C <SEP> CIT2 <SEP> A<->B
<tb> YNL071W <SEP> PDA2 <SEP> YIR031C <SEP> DAL7 <SEP> A-B
<tb> YNL071W <SEP> PDA2 <SEP> YFL018C <SEP> LPD1 <SEP> A-B
<tb> YNL071W <SEP> PDA2 <SEP> YNL117W <SEP> MLS1 <SEP> A-B
<tb> YBR221C <SEP> PDB1 <SEP> YNL071W <SEP> PDA2 <SEP> A-B
<tb> YLR044C <SEP> PDC1 <SEP> YOL086C <SEP> ADH1 <SEP> A-B
<tb> YLR044C <SEP> PDC1 <SEP> YMR303C <SEP> ADH2 <SEP> A-B
<tb> YLR044C <SEP> PDC1 <SEP> YBR145W <SEP> ADH5 <SEP> A-B
<tb> YLR044C <SEP> PDC1 <SEP> YMR170C <SEP> ALD2 <SEP> A<->B
<tb> YLR044C <SEP> PDC1 <SEP> YMR169C <SEP> ALD3 <SEP> A<->B
<tb> YLR044C <SEP> PDC1 <SEP> YPL061W <SEP> ALD6 <SEP> A<->B
<tb> YLR134W <SEP> PDC5 <SEP> YOL086C <SEP> ADH1 <SEP> A-B
<tb> YLR134W <SEP> PDC5 <SEP> YMR303C <SEP> ADH2 <SEP> A-B
<tb> YLR134W <SEP> PDC5 <SEP> YBR145W <SEP> ADH5 <SEP> A-B
<tb> YLR134W <SEP> PDC5 <SEP> YMR170C <SEP> ALD2 <SEP> A<->B
<tb>
<Desc/Clms Page number 78>
Figure img00780001
<tb>
<tb> YLR134W <SEP> PDC5 <SEP> YMR169C <SEP> ALD3 <SEP> A<->B
<tb> YLR134W <SEP> PDC5 <SEP> YPL061W <SEP> ALD6 <SEP> A<->B
<tb> YGR087C <SEP> PDC6 <SEP> YOL086C <SEP> ADH1 <SEP> A-B
<tb> YGR087C <SEP> PDC6 <SEP> YMR303C <SEP> ADH2 <SEP> A-B
<tb> YGR087C <SEP> PDC6 <SEP> YBR145W <SEP> ADH5 <SEP> A-B
<tb> YGR087C <SEP> PDC6 <SEP> YMR170C <SEP> ALD2 <SEP> A<->B
<tb> YGR087C <SEP> PDC6 <SEP> YMR169C <SEP> ALD3 <SEP> A<->B
<tb> YGR087C <SEP> PDC6 <SEP> YPL061W <SEP> ALD6 <SEP> A<->B
<tb> YGR240C <SEP> PFK1 <SEP> YKL060C <SEP> FBA1 <SEP> A-B
<tb> YGR240C <SEP> PFK1 <SEP> YLR377C <SEP> FBP1 <SEP> A<->B
<tb> YMR205C <SEP> PFK2 <SEP> YKL060C <SEP> FBA1 <SEP> A-B
<tb> YMR205C <SEP> PFK2 <SEP> YLR377C <SEP> FBP1 <SEP> A<->B
<tb> YIL107C <SEP> PFK26 <SEP> YJL155C <SEP> FBP26 <SEP> A<->B
<tb> YBR196C <SEP> PGI1 <SEP> YGR240C <SEP> PFK1 <SEP> A-B
<tb> YBR196C <SEP> PGI1 <SEP> YKL127VV <SEP> PGM1 <SEP> A<->B
<tb> YBR196C <SEP> PGI1 <SEP> YMR105C <SEP> PGM2 <SEP> A<->B
<tb> YBR196C <SEP> PGI1 <SEP> YNL241C <SEP> ZWF1 <SEP> A-B
<tb> YCR012W <SEP> PGK1 <SEP> YJL052W <SEP> TDH1 <SEP> A-B
<tb> YCR012W <SEP> PGK1 <SEP> YJR009C <SEP> TDH2 <SEP> A-B
<tb> YCR012W <SEP> PGK1 <SEP> YGR192C <SEP> TDH3 <SEP> A<->B
<tb> YKL127W <SEP> PGM1 <SEP> YCL040W <SEP> GLK1 <SEP> A<->B
<tb> YKL127W <SEP> PGM1 <SEP> YFR053C <SEP> HXK1 <SEP> A-B
<tb> YKL127W <SEP> PGM1 <SEP> YGL253W <SEP> HXK2 <SEP> A-B
<tb> YKL127W <SEP> PGM1 <SEP> YKL035W <SEP> UGP1 <SEP> A<->B
<tb> YMR105C <SEP> PGM2 <SEP> YCL040W <SEP> GLK1 <SEP> A<->B
<tb> YMR105C <SEP> PGM2 <SEP> YFR053C <SEP> HXK1 <SEP> A-B
<tb> YMR105C <SEP> PGM2 <SEP> YGL253W <SEP> HXK2 <SEP> A-B
<tb> YMR105C <SEP> PGM2 <SEP> YKL035W <SEP> UGP1 <SEP> A<->B
<tb> YER003C <SEP> PM140 <SEP> YCL040W <SEP> GLK1 <SEP> A-B
<tb> YER003C <SEP> PM140 <SEP> YFL045C <SEP> SEC53 <SEP> A-B
<tb> YDL055C <SEP> PSA1 <SEP> YBL082C <SEP> RHK1 <SEP> A-B
<tb> YGL062W <SEP> PYC1 <SEP> YNR001C <SEP> CIT1 <SEP> A<->B
<tb> YGL062W <SEP> PYC1 <SEP> YCR005C <SEP> CIT2 <SEP> A<->B
<tb> YGL062W <SEP> PYC1 <SEP> YLR044C <SEP> PDC1 <SEP> A<->B
<tb> YGL062W <SEP> PYC1 <SEP> YLR134W <SEP> PDC5 <SEP> A<->B
<tb> YGL062W <SEP> PYC1 <SEP> YGR087C <SEP> PDC6 <SEP> A<->B
<tb> YBR218C <SEP> PYC2 <SEP> YNR001 <SEP> C <SEP> CIT1 <SEP> A<->B
<tb> YBR218C <SEP> PYC2 <SEP> YCR005C <SEP> CIT2 <SEP> A<->B
<tb> YBR218C <SEP> PYC2 <SEP> YLR044C <SEP> PDC1 <SEP> A<->B
<tb> YBR218C <SEP> PYC2 <SEP> YLR134W <SEP> PDC5 <SEP> A<->B
<tb> YBR218C <SEP> PYC2 <SEP> YGR087C <SEP> PDC6 <SEP> A<->B
<tb> YAL038W <SEP> PYK1 <SEP> YER178W <SEP> PDA1 <SEP> A-B
<tb> YAL038W <SEP> PYK1 <SEP> YBR221C <SEP> PDB1 <SEP> A-B
<tb> YAL038W <SEP> PYK1 <SEP> YLR044C <SEP> PDC1 <SEP> A<->B
<tb>
<Desc/Clms Page number 79>
Figure img00790001
<tb>
<tb> YAL038W <SEP> PYK1 <SEP> YLR134W <SEP> PDC5 <SEP> A<->B
<tb> YAL038W <SEP> PYK1 <SEP> YGR087C <SEP> PDC6 <SEP> A<->B
<tb> YAL038W <SEP> PYK1 <SEP> YGL062W <SEP> PYC1 <SEP> A-B
<tb> YAL038W <SEP> PYK1 <SEP> YBR218C <SEP> PYC2 <SEP> A-B
<tb> YOR347C <SEP> PYK2 <SEP> YER178W <SEP> PDA1 <SEP> A-B
<tb> YOR347C <SEP> PYK2 <SEP> YBR221 <SEP> C <SEP> PDB1 <SEP> A-B
<tb> YOR347C <SEP> PYK2 <SEP> YLR044C <SEP> PDC1 <SEP> A<->B
<tb> YOR347C <SEP> PYK2 <SEP> YLR134W <SEP> PDC5 <SEP> A<->B
<tb> YOR347C <SEP> PYK2 <SEP> YGR087C <SEP> PDC6 <SEP> A<->B
<tb> YOR347C <SEP> PYK2 <SEP> YGL062W <SEP> PYC1 <SEP> A-B
<tb> YOR347C <SEP> PYK2 <SEP> YBR218C <SEP> PYC2 <SEP> A-B
<tb> YNL216W <SEP> RAP1 <SEP> YGR254W <SEP> EN01 <SEP> A-B
<tb> YNL216W <SEP> RAP1 <SEP> YHR174W <SEP> EN02 <SEP> A-B
<tb> YOR095C <SEP> RKI1 <SEP> YKL127W <SEP> PGM1 <SEP> A-B
<tb> YOR095C <SEP> RKI1 <SEP> YMR105C <SEP> PGM2 <SEP> A-B
<tb> YOR095C <SEP> RK11 <SEP> YCR036W <SEP> RBK1 <SEP> A-B
<tb> YOR095C <SEP> RKI1 <SEP> YBR117C <SEP> TKL2 <SEP> A-B
<tb> YJL121C <SEP> RPE1 <SEP> YBR117C <SEP> TKL2 <SEP> A-B
<tb> YOL067C <SEP> RTG1 <SEP> YLR304C <SEP> AC01 <SEP> A-B
<tb> YOL067C <SEP> RTG1 <SEP> YNR001C <SEP> CIT1 <SEP> A-B
<tb> YOL067C <SEP> RTG1 <SEP> YCR005C <SEP> CIT2 <SEP> A-B
<tb> YOL067C <SEP> RTG1 <SEP> YNL037C <SEP> IDH1 <SEP> A-B
<tb> YOL067C <SEP> RTG1 <SEP> YOR136W <SEP> IDH2 <SEP> A-B
<tb> YBL103C <SEP> RTG3 <SEP> YLR304C <SEP> AC01 <SEP> A-B
<tb> YBL103C <SEP> RTG3 <SEP> YNR001C <SEP> CIT1 <SEP> A-B
<tb> YBL103C <SEP> RTG3 <SEP> YCR005C <SEP> CIT2 <SEP> A-B
<tb> YBL103C <SEP> RTG3 <SEP> YNL037C <SEP> IDH1 <SEP> A-B
<tb> YBL103C <SEP> RTG3 <SEP> YOR136W <SEP> IDH2 <SEP> A-B
<tb> YFL045C <SEP> SEC53 <SEP> YDL055C <SEP> PSA1 <SEP> A-B
<tb> YDL168W <SEP> SFA1 <SEP> YDR272W <SEP> GL02 <SEP> A-B
<tb> YOL004W <SEP> SIN3 <SEP> YOL086C <SEP> ADH1 <SEP> A-B
<tb> YOL004W <SEP> SIN3 <SEP> YMR303C <SEP> ADH2 <SEP> A-B
<tb> YOL004W <SEP> SIN3 <SEP> YBR145W <SEP> ADH5 <SEP> A-B
<tb> YOR290C <SEP> SNF2 <SEP> YOL086C <SEP> ADH1 <SEP> A-B
<tb> YOR290C <SEP> SNF2 <SEP> YMR303C <SEP> ADH2 <SEP> A-B
<tb> YOR290C <SEP> SNF2 <SEP> YBR145W <SEP> ADH5 <SEP> A-B
<tb> YCR073W-A <SEP> Sol2 <SEP> YGR256W <SEP>GND2 <SEP> A-B
<tb> YBR112C <SEP> SSN6 <SEP> YCR005C <SEP> CIT2 <SEP> A-B
<tb> YBR112C <SEP> SSN6 <SEP> YER065C <SEP> ICL1 <SEP> A-B
<tb> YBR112C <SEP> SSN6 <SEP> YIL162W <SEP> SUC2 <SEP> A-B
<tb> YIL162W <SEP> SUC2 <SEP> YBR196C <SEP> PGI1 <SEP> A<->B
<tb> YIL162W <SEP> SUC2 <SEP> YKL127W <SEP> PGM1 <SEP> A<->B
<tb> YIL162W <SEP> SUC2 <SEP> YMR105C <SEP> PGM2 <SEP> A<->B
<tb> YPL016W <SEP> SWI1 <SEP> YOL086C <SEP> ADH1 <SEP> A-B
<tb>
<Desc/Clms Page number 80>
Figure img00800001
<tb>
<tb> YPL016W <SEP> SWI1 <SEP> YMR303C <SEP> ADH2 <SEP> A-B
<tb> YPL016W <SEP> SWI1 <SEP> YBR145W <SEP> ADH5 <SEP> A-B
<tb> YJL052W <SEP> - <SEP> TDH1 <SEP> YKL060C <SEP> FBA1 <SEP> A-B
<tb> YJL052W <SEP> TDH1 <SEP> YDR050C <SEP> TPI1 <SEP> A-B
<tb> YJR009C <SEP> TDH2 <SEP> YKL060C <SEP> FBA1 <SEP> A-B
<tb> YJR009C <SEP> TDH2 <SEP> YDR050C <SEP> TPI1 <SEP> A-B
<tb> YGR192C <SEP> TDH3 <SEP> YKL060C <SEP> FBA1 <SEP> A<->B
<tb> YGR192C <SEP> TDH3 <SEP> YDR050C <SEP> TPI1 <SEP> A<->B
<tb> YBR117C <SEP> TKL2 <SEP> YGR240C <SEP> PFK1 <SEP> A-B
<tb> YBR117C <SEP> TKL2 <SEP> YMR205C <SEP> PFK2 <SEP> A-B
<tb> YBR117C <SEP> TKL2 <SEP> YBR196C <SEP> PGI1 <SEP> A-B
<tb> YDR050C <SEP> TPI1 <SEP> YKL060C <SEP> FBA1 <SEP> A<->B
<tb> YBR126C <SEP> TPS1 <SEP> YDR074W <SEP> TPS2 <SEP> A-B
<tb> YDR074W <SEP> TPS2 <SEP> YPR026W <SEP> ATH1 <SEP> A-B
<tb> YDR074W <SEP> TPS2 <SEP> YDR001C <SEP> NTH1 <SEP> A-B
<tb> YDR074W <SEP> TPS2 <SEP> YBR001C <SEP> NTH2 <SEP> A-B
<tb> YML100W <SEP> TSL1 <SEP> YDR074W <SEP> TPS2 <SEP> A-B
<tb> YOR344C <SEP> TYE7 <SEP> YOL086C <SEP> ADH1 <SEP> A-B
<tb> YOR344C <SEP> TYE7 <SEP> YHR174W <SEP> EN02 <SEP> A-B
<tb> YKL035W <SEP> UGP1 <SEP> YGR032W <SEP> GSC2 <SEP> A-B
<tb> YKL035W <SEP> UGP1 <SEP> YFR015C <SEP> GSY1 <SEP> A-B
<tb> YKL035W <SEP> UGP1 <SEP> YLR258W <SEP> GSY2 <SEP> A-B
<tb> YKL035W <SEP> UGP1 <SEP> YBR299W <SEP> MAL32 <SEP> A-B
<tb> YKL035W <SEP> UGP1 <SEP> YKL127W <SEP> PGM1 <SEP> A<->B
<tb> YKL035W <SEP> UGP1 <SEP> YBR126C <SEP> TPS1 <SEP> A-B
<tb> YKL035W <SEP> UGP1 <SEP> YML100W <SEP> TSL1 <SEP> A-B
<tb> YNL241 <SEP> C <SEP> ZWF1 <SEP> YCR073W-A <SEP> Sol2 <SEP> A-B
<tb> YKL148C <SEP> SDH1 <SEP> YPL262W <SEP> FUM1 <SEP> A<->B
<tb> YLL041C <SEP> SDH2 <SEP> YPL262W <SEP> FUM1 <SEP> A<->B
<tb> YKL141W <SEP> SDH3 <SEP> YPL262W <SEP> FUM1 <SEP> A<->B
<tb> YDR178W <SEP> SDH4 <SEP> YPL262W <SEP> FUM1 <SEP> A<->B
<tb> YGR244C <SEP> LSC2 <SEP> YKL148C <SEP> SDH1 <SEP> A<->B
<tb> YGR244C <SEP> LSC2 <SEP> YLL041 <SEP> C <SEP> SDH2 <SEP> A<->B
<tb> YGR244C <SEP> LSC2 <SEP> YKL141W <SEP> SDH3 <SEP> A<->B
<tb> YGR244C <SEP> LSC2 <SEP> YDR178W <SEP> SDH4 <SEP> A<->B
<tb>
Tableau 5 : Représentation du graphe sous forme de tableau Le graphe représente les 329 interactions entre les 116 molécules du réseau. Les interactions sont représentées entre les molécules deux à deux.
Colonnes A : première molécule Colonnes B : seconde molécule Sens : sens de l'interaction : A-B : de A vers B
B-A : de B vers A A<-> B : dans les deux sens.
<Desc/Clms Page number 81>
Ce tableau établit aussi la correspondance entre les codes ORF (open reading frame) de la base de données SGD (Dolinski, K., Balakrishnan, R., Christie, K. R., Costanzo, M. C., Dwight, S. S., Engel, S. R., Fisk, D. G., Hirschman, J. E., Hong, E. L., Issel-Tarver, L., Sethuraman, A., Theesfeld, C. L., Binkley, G., Lane, C., Schroeder, M., Dong, S., Weng, S., Andrada, R., Botstein, D., and Cherry, J. M. "Saccharomyces Genome Database http://www.yeastgenome.org/), et les abréviations des noms des protéines (elles aussi de SGD). Les codes ORF sont uniques pour une protéine donnée et permettent de l'identifier sans aucune ambiguïté. Ils permettent aussi d'établir un lien non ambigu avec les résultats de criblages sur puces à ADN (correspondance des séquences nucléiques des ARN messagers correspondants).
2) Des données de criblage d'expression d'ARN messagers sur puces à ADN concernant l'ensemble de ces gènes ont été saisies à partir de la publication : DeRisi JL, lyer VR, Brown PO . Exploring the metabolic and genetic control of gene expression on a genomic scale, Science. 1997 Oct 24;278(5338):680-6.
Cette publication décrit une expérience de culture de levures dans des conditions où la concentration de glucose dans le milieu de culture diminue progressivement (du fait de son utilisation par les levures pour la fermentation, du glucose n'étant rajouté à la culture à aucun temps de l'expérience). Au cours du temps, les levures présentent une modification de leur métabolisme, leur système respiratoire passant d'un fonctionnement en fermentation à un fonctionnement en respiration aérobie.
Cette culture de levures a été étudiée au cours du temps, notamment par la pratique de criblages d'expression de la quasi-totalité des ARN messagers de levure sur puces à ADN. Ces criblages ont été effectués à des temps
<Desc/Clms Page number 82>
successifs, les résultats produisant donc une cinétique de niveau d'expression pour chaque ARN messager. Les résultats montrent des variations du niveau d'expression d'un certain nombre d'ARN messagers au cours du temps, ceux-ci étant plus particulièrement nombreux parmi les ARN messagers des protéines de la respiration cellulaire, dont une partie importante est représentée dans le graphe décrit ci dessus. Dans ces conditions expérimentales, le graphe que nous avons construit présente donc un évolution dynamique au cours du temps, qui est représentée par les cinétiques des molécules du réseau (donc les sommets du graphe).
Il sera clair au lecteur que le graphe statique est déjà d'une taille trop grande, et comprend trop d'interactions et de boucles, pour permettre, même à un expert, de prédire correctement à partir du seul graphe statique son évolution dynamique telle qu'observée expérimentalement sans la mise en #uvre d'une méthode de modélisation dynamique adaptée.
L'ensemble des données expérimentales de criblage d'expression d'ARN messagers sur puces à ADN correspondant à cet article sont disponibles sur le site internet de l'Université de Stanford à l'adresse : http://cmgm.stanford.edu/pbrown/explore/array.txt.
A partir de ces données, les données expérimentales correspondant spécifiquement aux ARN messagers des molécules du graphe ont été saisies manuellement (procédure de copier-coller dans un fichier plat de type txt) sous la forme suivante : chaque ligne correspond à une molécule du graphe, la première colonne identifiant l'ORF (open reading frame) par son code SGD, les colonnes suivantes correspondant aux mesures expérimentales. Les tableaux 6 à 8 ci-dessous donnent des exemples de données pour quelques molécules du graphe, données extraites de la page http://cmgm.stanford.edu/pbrown/explore/array.txt.
Figure img00820001
1 ORF 1 Nom 1 81- G2- G3- G4- G5- G6- G7-
<Desc/Clms Page number 83>
Figure img00830001
<tb>
<tb> Bkg <SEP> Bkg <SEP> Bkg <SEP> Bkg <SEP> Bkg <SEP> Bkg <SEP> Bkg
<tb> YBR218C <SEP> PYC2 <SEP> 9361 <SEP> 7699 <SEP> 11731 <SEP> 5304 <SEP> 4702 <SEP> 6455 <SEP> 6056
<tb> YCR005C <SEP> CIT2 <SEP> 1540 <SEP> 1244 <SEP> 1875 <SEP> 1727 <SEP> 1241 <SEP> 1904 <SEP> 1644
<tb> Tableau <SEP> 6
<tb> ORF <SEP> Nom <SEP> R1- <SEP> R2- <SEP> R3- <SEP> R4- <SEP> R5- <SEP> R6- <SEP> R7Bkg <SEP> Bkg <SEP> Bkg <SEP> Bkg <SEP> Bkg <SEP> Bkg <SEP> Bkg
<tb> YBR218C <SEP> PYC2 <SEP> 11070 <SEP> 9483 <SEP> 8998 <SEP> 3944 <SEP> 3739 <SEP> 4603 <SEP> 16293
<tb> YCR005C <SEP> CIT2 <SEP> 1092 <SEP> 1138 <SEP> 2007 <SEP> 1328 <SEP> 695 <SEP> 3962 <SEP> 7997
<tb> Tableau <SEP> 7
<tb> ORF <SEP> Nom <SEP> R1 <SEP> Ratio <SEP> R2 <SEP> Ratio <SEP> R3 <SEP> Ratio <SEP> R4 <SEP> Ratio <SEP> R5 <SEP> Ratio <SEP> R6 <SEP> Ratio <SEP> R7 <SEP> Ratio <SEP>
<tb> YBR218C <SEP> PYC2 <SEP> 1. <SEP> 18 <SEP> 1. <SEP> 23 <SEP> . <SEP> 77 <SEP> . <SEP> 75 <SEP> . <SEP> 79 <SEP> . <SEP> 71 <SEP> 2.7
<tb> YCR005C <SEP> CIT2 <SEP> . <SEP> 71 <SEP> .92 <SEP> 1.08 <SEP> .77 <SEP> .56 <SEP> 2.08 <SEP> 4.76
<tb>
Tableau 8 Tableaux 6 à 8 : Exemples de données de criblages sur puces à ADN pour 2 des molécules du graphe, à partir des résultats de l'article : DeRisi JL, lyer VR, Brown PO Exploring the metabolic and genetic control of gene expression on a genomic scale, Science. 1997 Oct 24;278(5338):680- 6.
Les données complètes sont disponibles sur la page internet :
Figure img00830002

http7/cmqm. stanford.edu/pbrown/explore/array.txt. Compte-tenu de la taille du tableau des données complètes, il n'en est montré ici qu'une partie. L'homme de l'art pourra très facilement récupérer les données correspondant aux autres molécules du graphe utilisé dans cet exemple, sur cette page internet qui correspond directement au tableau de l'ensemble des données.
Les criblages d'expression des ARN messagers ont été réalisés toutes les deux heures, pendant 12 heures, ce qui correspond à 7 temps expérimentaux (le temps initial plus les 6 temps suivants). Ceux-ci correspondent aux notations 1 à 7. Le lecteur trouvera toutes les explications correspondant à l'obtention de ces mesures dans l'article cité en référence.
Nom = abréviation du nom du gène (selon SGD)
<Desc/Clms Page number 84>
ORF = code de l'open reading frame (selon SGD) G = condition expérimentale correspondant à "l'état étalon" du graphe tel que décrit dans l'invention. Cet état étalon, dans cette série d'expériences, correspond à l'état initial de culture des levures. G1, G2, G3, G4, G5, G6, G7 correspondent tous au même échantillon biologique étalon.
R = états du graphe aux divers temps expérimentaux.
R1 correspond à l'état initial de culture des levures (même échantillon biologique que G1), au temps TO. R2 : TO + 2,5 heures, R3 : TO + 4 heures, R4 : TO + 6 heures, R5 : + 7,5 heures, R6 : TO + 9,5 heures, R7 : + 11,5 heures.
Les séries de valeurs G-Bkg et R-Bkg correspondent à des mesures absolues de signal. Par rapport au présent texte, les séries G-Bkg correspondent à x,o, et les séries R-Bkg correspondent à x,t.
G1-Bkg = mesure de G1 moins le bruit de fond (background) lors des mesures expérimentales.
G2-Bkg = mesure de G2 moins le bruit de fond (background) lors des mesures expérimentales.
G3-Bkg = mesure de G3 moins le bruit de fond (background) lors des mesures expérimentales.
G4-Bkg = mesure de G4 moins le bruit de fond (background) lors des mesures expérimentales.
G5-Bkg = mesure de G5 moins le bruit de fond (background) lors des mesures expérimentales.
G6-Bkg = mesure de G6 moins le bruit de fond (background) lors des mesures expérimentales.
G7-Bkg = mesure de G7 moins le bruit de fond (background) lors des mesures expérimentales.
Les variations des valeurs mesurées sont liées aux variations des rendements des diverses réactions mises en oeuvre dans la méthode de
<Desc/Clms Page number 85>
mesure (puces à ADN) et justifient l'utilisation d'un état étalon comme référence de mesure.
R1-Bkg = mesure de R1 moins le bruit de fond (background) lors des mesures expérimentales.
R2-Bkg = mesure de R2 moins le bruit de fond (background) lors des mesures expérimentales.
R3-Bkg = mesure de R3 moins le bruit de fond (background) lors des mesures expérimentales.
R4-Bkg = mesure de R4 moins le bruit de fond (background) lors des mesures expérimentales.
R5-Bkg = mesure de R5 moins le bruit de fond (background) lors des mesures expérimentales.
R6-Bkg = mesure de R6 moins le bruit de fond (background) lors des mesures expérimentales.
R7-Bkg = mesure de R7 moins le bruit de fond (background) lors des mesures expérimentales.
R1.Ratio, R2.Ratio, R3. Ratio, R4.Ratio, R5. Ratio, R6. Ratio, R7.Ratio correspondent aux rapports R-Bkg / G-Bkg à chacun des 7 temps expérimentaux :ils correspondent aux variables telles que définies dans la description de l'invention : X, = x,t / xo.
On a donc produit deux tableaux sous la forme de fichiers plats de type txt, avec une correspondance mutuelle par le code ORF de chaque molécule.
Dans cet exemple de mise en #uvre, il n'a pas été nécessaire d'utiliser de système de base de données.
Mise en oeuvre de la méthode :
<Desc/Clms Page number 86>
Les étapes A et B ont été mises en #uvre comme suit : Un lissage des données expérimentales a été effectué afin de disposer de plus de points temporels.
On a considéré que si la concentration en glucose dans le milieu de culture des levures avait été maintenue constante en supplémentant en glucose le milieu de culture, l'état initial, qui correspond aux mesures expérimentales au temps TO, serait un état stable. Ceci est en accord avec les données expérimentales disponibles et avec le texte de la publication dont ont été extraites les données.
Par ailleurs, on sait que si la culture de levures est à nouveau supplémentée en glucose après le temps 7 (To + 12 heures), elle va revenir à son état initial. Un état final du graphe a donc été défini comme suit : tendance du système biologique étudié à revenir à son état initial au temps To + 36 heures, et les données expérimentales obtenues à To ont été répliquées à ce temps. Ceci a été fait de afin d'ajouter une contrainte, logique vis-à-vis de l'expérience, lors du calcul des paramètres des fonctions. Ceci n'est cependant pas à considérer comme une étape de mise en #uvre indispensable à la mise en #uvre de l'invention, mais comme un exemple de définition des états stables du système biologique à partir de cet exemple précis.
La relation utilisée entre les variables X, correspondant à la molécule i et les variables Xj correspondant aux molécules j interagissant sur i a été la suivante : (dX,/dt) = K1i. [1 / (1 + e-#wij xj - bi) ] - K2i. X, Le calcul des paramètres a été effectué à partir des données expérimentales par une méthode classique d'apprentissage de réseaux de neurones, plus précisément à partir des algorithmes de la méthode de Runge Kutta de rétro-propagation dans le temps (BPTT :back propagation through time). Les calculs ont été effectués en double précision.
<Desc/Clms Page number 87>
Le reste des méthodes mises en #uvre, qui ne posent pas de difficulté particulière à l'homme de l'art, ont été effectuées comme décrit plus haut.
Un graphe dynamique, entièrement déterministe a ainsi été obtenu, permettant de réaliser des simulations.
Résultats : Lors des simulations, l'efficacité de la méthode a été vérifiée. En effet, le résultat de divergence moyen (erreur relative globale) des simulations par rapport aux données expérimentales est d'environ 0,30, cette divergence étant essentiellement concentrée sur 8 sommets (molécules) du graphe, pour cette série de données, alors que pour les 108 sommets (molécules) restant, la divergence est très faible.
Ce résultat d'erreur relative globale montre que les cinétiques calculées lors des simulations sont proches des données réelles, car des cinétiques aléatoires auraient donné un calcul d'erreur supérieur à 1.
La divergence globale des simulations par rapport aux données expérimentales sur l'ensemble du graphe et l'ensemble des cinétiques a été estimée par le calcul d'erreur relative suivant : Erreur globale relative :
Figure img00870001

Y X1yt - X2yt 2 X2Ot 2 i t i t # = racine carrée du terme entre crochets [ ].
Xi,(t) = valeur de X, calculée au temps t de la simulation, X2i(t) = valeur de X, mesurée expérimentalement au temps t.
# = somme des valeurs aux différents temps t
<Desc/Clms Page number 88>
Ce résultat de simulation est satisfaisant, d'autant plus si l'on tient compte du taux d'erreurs de mesures, puisqu'il est légèrement inférieur au taux d'erreurs de mesures lors des expériences ayant servi à générer les données expérimentales sur puces à ADN.
Le taux de non-reproductibilité des données expérimentales peut être estimé par le rapport R1.Ratio des données expérimentales (Tableau 8), et est globalement de 14% dans cet exemple.
Ce résultat de divergence globale est obtenu par un calcul d'erreur relative permettant de comparer deux cinétiques (ou trajectoires) dans leur ensemble. Il ne peut naturellement pas être utilisé pour estimer le taux de non-reproductibilité des données expérimentales puisqu'on ne dispose ici que d'une seule cinétique expérimentale, pour ces conditions expérimentales, pour chaque molécule du réseau. Le calcul de ce taux de non-reproductibilité a donc effectué par la moyenne des ratios R1.
Le fait que ces deux calculs d'erreurs soient différents ne permet pas de les comparer directement au sens strict. Cependant, on voit que l'erreur relative globale des simulations et le taux de non-reproductibilité des mesures expérimentales sont proches : 0,3 et 0,14 respectivement, 1 étant le seuil au dessus duquel les simulations et les mesures peuvent être considérées comme non-fiables.
Bien qu'il soit possible par la méthode de l'invention de descendre lors des simulations à un résultat de divergence inférieur au taux de nonreproductibilité des données expérimentales, il est clairement inutile de descendre à un résultat de divergence inférieur à cette limite de reproductibilité des données expérimentales, quelles que soient celles-ci.
En effet, puisque des données expérimentales sont utilisées pour le calcul des paramètres, cela reviendrait à introduire tout de même un risque de divergence vis-à-vis du phénomène biologique réel étudié, dont la divergence vis-à-vis des mesures expérimentales peut être estimée égale
<Desc/Clms Page number 89>
au taux de non-reproductibilité des expériences de mesure, sans que l'on puisse prédire le sens de cette divergence (qui peut de plus varier en fonction des molécules du réseau).
A titre d'exemple, le tableau 9 donne le détail des calculs des divergences de l'ensemble des cinétiques lors des simulations pour l'ensemble des molécules du réseau, sous la forme d'un tableau récapitulatif.
<Desc/Clms Page number 90>
Figure img00900001
<tb>
<tb>
Taux <SEP> d'erreurs <SEP> relatives <SEP> molécule <SEP> par <SEP> molécule <SEP> lors <SEP> des <SEP> simulations
<tb> Code <SEP> ORF <SEP> Erreur <SEP> Code <SEP> ORF <SEP> Erreur <SEP> Code <SEP> ORF <SEP> Erreur <SEP> Code <SEP> ORF <SEP> Erreur
<tb> YKL106W <SEP> 0,439906 <SEP> YMR170C <SEP> 0,658778 <SEP> YDL021W <SEP> 0,356443 <SEP> YNL241C <SEP> 0,238029
<tb> YNR001C <SEP> 0,557923 <SEP> YIR031C <SEP> 0,287518 <SEP> YNL216W <SEP> 0,330334 <SEP> YBR299W <SEP> 0,223996
<tb> YCR005C <SEP> 0,603893 <SEP> YNL117W <SEP> 0,555319 <SEP> YOR344C <SEP> 0,345711 <SEP> YGR240C <SEP> 0,656938
<tb> YLR304C <SEP> 0,611941 <SEP> YMR169C <SEP> 0,323143 <SEP> YMR105C <SEP> 0,477063 <SEP> YIL107C <SEP> 0,440545
<tb> YAL054C <SEP> 0,719416 <SEP> YLR044C <SEP> 0,548165 <SEP> YDR261C <SEP> 0,20506 <SEP> YMR205C <SEP> 0,45229
<tb> YNL071W <SEP> 0,322178 <SEP> YER178W <SEP> 0,171016 <SEP> YKL127W <SEP> 0,298067 <SEP> YER003C <SEP> 0,366261
<tb> YLR153C <SEP> 0,368722 <SEP> YBR221C <SEP> 0,19549 <SEP> YBR196C <SEP> 0,376657 <SEP> YPR026W <SEP> 0,436716
<tb> YKL085W <SEP> 0,499697 <SEP> YFL018C <SEP> 0,173079 <SEP> YHL032C <SEP> 0,450714 <SEP> YJL121C <SEP> 0,371399
<tb> YOL126C <SEP> 0,80045 <SEP> YPL262W <SEP> 0,519434 <SEP> YDR216W <SEP> 0,434734 <SEP> YDR423Ç <SEP> 0,266008
<tb> YDL078C <SEP> 0,348449 <SEP> YKL148C <SEP> 0,471327 <SEP> YOL004W <SEP> 0,104797 <SEP> YML100W <SEP> 0,411204
<tb> YBL021C <SEP> 0,137275 <SEP> YKL141W <SEP> 0,501865 <SEP> YOR290C <SEP> 0,13138 <SEP> YDL168W <SEP> 0,144725
<tb> YKL109W <SEP> 0,558143 <SEP> YIL125W <SEP> 0,593086 <SEP> YPL016W <SEP> 0,0633654 <SEP> YGR192C <SEP> 0,274425
<tb> YKR097W <SEP> 0,594474 <SEP> YDR148C <SEP> 0,449052 <SEP> YAL021C <SEP> 0,104898 <SEP> YJR009C <SEP> 0,821626
<tb> YGL062W <SEP> 0,617472 <SEP> YHR174W <SEP> 0,422694 <SEP> YFR053C <SEP> 0,563052 <SEP> YJL052W <SEP> 1,04515
<tb> YBR218C <SEP> 0,519166 <SEP> YGR254W <SEP> 0,194786 <SEP> YCL040W <SEP> 0,330382 <SEP> YEL011W <SEP> 0,540345
<tb> YOL067C <SEP> 0,0981591 <SEP> YIL162W <SEP> 0,58694 <SEP> YBR117C <SEP> 0,503985 <SEP> YCR036W <SEP> 0,272221
<tb> YBL103C <SEP> 0,255736 <SEP> YOL086C <SEP> 0,310685 <SEP> YBR126C <SEP> 0,401095 <SEP> YGR256W <SEP> 0,448943
<tb> YBR112C <SEP> 0,219397 <SEP> YBR145W <SEP> 0,156328 <SEP> YDR074W <SEP> 0,401062 <SEP> YFR015C <SEP> 0,492893
<tb> YER065C <SEP> 0,592483 <SEP> YMR303C <SEP> 0,309401 <SEP> YDR272W <SEP> 0,568757 <SEP> YLR258W <SEP> 0,481474
<tb> YNL037C <SEP> 0,452065 <SEP> YMR037C <SEP> 0,660788 <SEP> YCR012W <SEP> 0,612743 <SEP> YBR019C <SEP> 0,367005
<tb> YOR136W <SEP> 0,156624 <SEP> YKL062W <SEP> 0,219838 <SEP> YPL248C <SEP> 0,176129 <SEP> YKL060C <SEP> 1,27125
<tb> YDL066W <SEP> 0,188101 <SEP> YDL174C <SEP> 0,252933 <SEP> YGL253W <SEP> 0,461389 <SEP> YCR073W-A <SEP> 0,383641
<tb> YLR174W <SEP> 0,559782 <SEP> YML054C <SEP> 0,596073 <SEP> YPR160W <SEP> 0,162637 <SEP> YJL155C <SEP> 0,394901
<tb> YBL015W <SEP> 0,517625 <SEP> YMR189W <SEP> 0,0996465 <SEP> YOR095C <SEP> 0,368831 <SEP> YFL045C <SEP> 0,474401
<tb> YLR134W <SEP> 0,526367 <SEP> YLL041C <SEP> 0,478881 <SEP> YKL035W <SEP> 0,360385 <SEP> YDR050C <SEP> 1,05587
<tb> YGR087C <SEP> 0,553019 <SEP> YDR178W <SEP> 0,41253 <SEP> YGR032W <SEP> 0,240247 <SEP> YBR018C <SEP> 0,395082
<tb> YAL038W <SEP> 0,60519 <SEP> YGR244C <SEP> 0,383062 <SEP> YLR377C <SEP> 0,35616 <SEP> YDL055C <SEP> 0,436756
<tb> YOR347C <SEP> 0,296306 <SEP> YPL075W <SEP> 0,327211 <SEP> YDR001C <SEP> 0,371987 <SEP> YBR020W <SEP> 0,163797
<tb> YPL061W <SEP> 0,547283 <SEP> YKL152C <SEP> 0,427984 <SEP> YBR001C <SEP> 0,41725 <SEP> YBL082C <SEP> 0,217509
<tb>
Tableau 9 (tableau récapitulatif des divergences lors des simulations pour l'ensemble des molécules du réseau)
<Desc/Clms Page number 91>
Les divergences ont été estimées pour chaque molécule du réseau par le calcul de l'erreur relative sur l'ensemble de la trajectoire de la molécule concernée, suivant la formule suivante (erreur relative locale) :
Figure img00910001

[ ( X,(t) - X2(t ) )2 ( Xz(t) )2 t t
X1i(t) = valeur de X, calculée au temps t de la simulation,
X2,(t ) = valeur de X, mesurée expérimentalement au temps t, # = somme des valeurs aux différents temps t # = racine carrée du terme entre les crochets [ ] Ce calcul revient à calculer la différence d'intégrale entre les courbes des cinétiques observées expérimentalement et les cinétiques calculées lors des simulations. Elle concerne donc aussi bien l'ensemble de la cinétique que l'état final.
Dans une variante de cet exemple, la modélisation et les simulations ont été mises en #uvre de la même manière que décrit ci-dessus, et à partir des mêmes données biologiques, avec la seule modification suivante lors du calcul des paramètres par rétro-propagation dans le temps : Les variables associées aux sommets du graphe ne recevant pas d'arc ou arrête, c'est-à-dire correspondant aux molécules ne recevant pas d'interaction ("inputs" du graphe) ont été exclues du calcul d'erreur globale lors de l'apprentissage, leurs valeurs restant donc fixées aux valeurs expérimentales mesurées pendant cette procédure. Ceci a été effectué : - afin d'éviter de simuler des cinétiques sur ces sommets lors de la descente de gradient ce qui risque de majorer les erreurs, - et car ces sommets ne recevant pas eux mêmes d'inputs, leurs cinétiques sont de fait indépendantes des résultats de calculs des paramètres des relations mathématiques reliant les sommets.
<Desc/Clms Page number 92>
En d'autres termes, seules les molécules recevant au moins une interaction (arrête orientée vers le sommet du graphe leur correspondant) ont été prises en compte pour le calcul d'erreur lors de l'apprentissage.
Afin d'éviter toute confusion, cette variante ne consiste bien sûr pas à enlever du graphe les sommets "inputs", mais à imposer que leur cinétique reste la cinétique mesurée expérimentalement, ceci uniquement lors des simulations pratiquées pendant les calculs d'erreur de la procédure de calcul des paramètres par rétro-propagation dans le temps. Les paramètres des relations mathématiques reliant ces sommets à d'autres sommets du graphe sont donc calculés, comme pour toutes les autres arrêtes du graphe, et le modèle dynamique finalement obtenu inclut ces sommets.
Dans cette variante, les résultats de simulation obtenus ont été similaires à ceux montrés ci-dessus, bien que légèrement meilleurs.
La figure 3 donne à titre d'exemple les cinétiques mesurées expérimentalement et les cinétiques calculées par simulation pour quelques gènes représentatifs de l'ensemble des résultats obtenus par la mise en oeuvre de cette variante.

Claims (36)

  1. B) calculer les paramètres de chaque relation à partir de données expérimentales quantitatives concernant les sommets du graphe, par la mise en #uvre de techniques d'apprentissage par descente de gradient utilisées pour le paramétrage de réseaux.
    A) à partir d'un graphe statique dont les sommets représentent des molécules biologiques et les arcs représentent des interactions physico-chimiques existant entre ces molécules, associer une variable quantitative X, mesurée expérimentalement à chaque sommet i, et une relation mathématique à chaque arc du graphe, chacune desdites relations présentant les caractéristiques suivantes : - elle comprend un terme inertiel (i) qui tend vers une limite finie ; - elle comprend un terme (ii) tendant à faire revenir les variables Xi à leur état initial, de signe inverse au terme inertiel (i), et dont la variation en fonction du temps croit en valeur absolue de façon plus lente que la variation en fonction du temps du terme inertiel (i) ; - elle comporte un facteur de pondération wij qui permet de tenir compte de la combinaison d'effets pouvant s'exercer sur chaque sommet du graphe;
    REVENDICATIONS 1. Procédé d'obtention d'un modèle dynamique d'un réseau d'interactions moléculaires dans un système biologique, permettant l'analyse desdites interactions lorsqu'un stimulus est appliqué au modèle dynamique, en vue notamment de hiérarchiser des molécules biologiques ou de sélectionner des cibles thérapeutiques vis-à-vis d'un problème biologique donné, pour en particulier définir une action thérapeutique à appliquer auxdites molécules, ledit procédé étant mis en #uvre par un système informatique et comprenant les étapes suivantes : -
    <Desc/Clms Page number 94>
  2. 2. Procédé d'obtention d'un modèle dynamique d'un réseau d'interactions moléculaires dans un système biologique selon la revendication 1, dans lequel les relations mathématiques associées aux arcs sont continues.
  3. 3. Procédé d'obtention d'un modèle dynamique d'un réseau d'interactions moléculaires dans un système biologique selon la revendication 1 ou 2, dans lequel chaque variable quantitative X, associée à un sommet représente la variation relative de la quantité de la molécule correspondant audit sommet, par rapport à la quantité de la même molécule dans un état étalon du système biologique.
  4. 4. Procédé d'obtention d'un modèle dynamique d'un réseau d'interactions moléculaires dans un système biologique selon l'une des revendications
    1 à 3, dans lequel le terme inertiel (i) est exprimé sous la forme d'une relation mathématique présentant une ou plusieurs inflexion(s).
  5. 5. Procédé d'obtention d'un modèle dynamique d'un réseau d'interactions moléculaires dans un système biologique selon la revendication 4, dans lequel le terme inertiel (i) est exprimé sous la forme d'une relation sigmoïde ou d'une relation d'oscillation.
  6. 6. Procédé d'obtention d'un modèle dynamique d'un réseau d'interactions moléculaires dans un système biologique selon l'une quelconque des revendications 1 à 5, dans lequel l'étape B) est effectuée par descente de gradient simple, en prenant comme base de calcul les couples de données (X,,Xj) fournis par les données expérimentales, indépendamment les uns des autres, ou par descente de gradient dans le temps, les couples (Xi,Xj) n'étant alors pas considérés comme indépendants les uns des autres.
    <Desc/Clms Page number 95>
  7. 7. Procédé d'obtention d'un modèle dynamique d'un réseau d'interactions moléculaires dans un système biologique selon l'une quelconque des revendications 3 à 6, dans lequel les données expérimentales quantitatives concernant les sommets du graphe sont obtenues par l'utilisation des techniques de criblage à grande échelle.
  8. 8. Procédé d'obtention d'un modèle dynamique d'un réseau d'interactions moléculaires dans un système biologique selon l'une quelconque des revendications 3 à 6, dans lequel l'état étalon est un état stable du système biologique, dans lequel la quantité de chaque molécule associée à un sommet du graphe est mesurée expérimentalement.
  9. 9. Procédé d'analyse d'un réseau d'interactions moléculaires dans un système biologique, comportant les étapes suivantes :
    A') utilisation d'un modèle dynamique du réseau d'interactions moléculaires, ledit modèle étant susceptible d'être obtenu, par un procédé selon l'une quelconque des revendications 1 à 8, à partir d'un graphe statique construit à partir des données expérimentales concernant les molécules biologiques du réseau, dont les sommets représentent des molécules biologiques du système biologique et les arrêtes représentent des interactions physico-chimiques entre ces molécules,
    C) un état du graphe, mesuré expérimentalement, est choisi comme "état à modifier", et la durée du processus biologique à simuler est définie et découpée en une série de pas de temps,
    D) plusieurs procédures itératives de simulation sont effectuées, comprenant chacune les étapes suivantes : a) un stimulus est imposé à l'état à modifier, c'est-à-dire que la valeur d'une ou de plusieurs des variables quantitatives associées aux sommets du graphe est modifiée, constituant ainsi un état de départ de la simulation ;
    <Desc/Clms Page number 96>
    b) à partir de l'état de départ de la simulation, un calcul de propagation est effectué au sein du graphe.
  10. 10. Procédé de sélection de cibles thérapeutiques mettant en #uvre un modèle dynamique d'un réseau d'interactions moléculaires dans un système biologique, par la mise en #uvre d'un système informatique, comprenant les étapes et caractéristiques suivantes :
    A') utilisation d'un modèle dynamique du réseau d'interactions moléculaires, ledit modèle étant susceptible d'être obtenu, par un procédé selon l'une quelconque des revendications 1 à 8, à partir d'un graphe statique construit à partir des données expérimentales concernant les molécules biologiques du réseau, dont les sommets représentent des molécules biologiques du système biologique et les arrêtes représentent des interactions physico-chimiques entre ces molécules;
    C) un état du graphe, mesuré expérimentalement, est choisi comme "état à modifier", et la durée du processus biologique à simuler est définie et découpée en une série de pas de temps, et un état du graphe correspondant à un "état à atteindre" du système biologique est choisi comme "état final du graphe" à atteindre ;
    D) plusieurs procédures itératives de simulation sont effectuées, comprenant chacune les étapes suivantes : a) un stimulus est imposé à l'état à modifier, c'est-à-dire que la valeur d'une ou de plusieurs des variables quantitatives associées aux sommets du graphe est modifiée, constituant ainsi un état de départ de la simulation ; b) à partir de l'état de départ de la simulation, un calcul de propagation est effectué au sein du graphe ; c) un calcul de proximité entre Fêtât final du graphe " obtenu à l'issue de l'étape b) et l'état à modifier, ou entre Fêtât final du graphe " et un état voulu est effectué ;
    <Desc/Clms Page number 97>
    D), les sommets, et les stimuli imposés sur ces sommets, sont hiérarchisés, les sommets hiérarchisés correspondant à des cibles thérapeutiques classées.
    E) à partir de l'ensemble des proximités statistiques calculées à l'étape
  11. 11. Procédé selon les revendications 9 ou 10, dans lequel les relations mathématiques associées aux arcs du graphe à l'étape A) sont continues.
  12. 12. Procédé selon l'une quelconque des revendications 9 à 11, dans lequel le calcul de propagation effectué à l'étape D) b) est effectué pendant un nombre de pas de temps tel que la durée de la simulation n'excède pas la durée du processus biologique à simuler définie à l'étape C).
  13. 13. Procédé selon l'une quelconque des revendications 9 à 12, dans lequel les pas de temps définis à l'étape C) sont d'un ordre de grandeur inférieur à celui des durées expérimentales réelles séparant les séries de données expérimentales quantitatives utilisées pour le calcul des paramètres des relations, à l'étape B).
  14. 14. Procédé de sélection de cibles thérapeutiques selon l'une quelconque des revendications 10 à 13, dans lequel les stimuli imposés à l'étape
    D) a) concernent, pour chacune des simulations, un sommet unique, et dans lequel le résultat de l'étape E) est un classement des sommets, de celui sur lequel un stimulus est le plus susceptible d'aboutir à l'état voulu à partir de l'état à modifier, jusqu'à celui sur lequel un stimulus est le moins susceptible d'avoir cet effet.
  15. 15. Procédé de sélection de cibles thérapeutiques selon l'une quelconque des revendications 11 à 13, comprenant les étapes suivantes :
    <Desc/Clms Page number 98>
    D2), une étape supplémentaire E2) de classement hiérarchique des associations de deux sommets sur lesquels des stimuli sont le plus susceptibles d'avoir l'effet voulu, est effectuée.
    - un premier classement hiérarchique des sommets est obtenu en effectuant les étapes A) à E) en imposant, pour chacune des simulations de l'étape D), des stimuli qui concernent un sommet unique ; - une étape supplémentaire D2) est ensuite effectuée, correspondant à l'étape D) dans laquelle les stimuli imposés à chaque simulation sont exercés sur deux sommets, soit en testant toutes les combinaisons de deux sommets possibles, soit en limitant ces calculs aux combinaisons de deux sommets parmi un certain nombre des sommets les mieux classés à l'étape E), - à partir de l'ensemble des proximités statistiques calculées à l'étape
  16. 16. Procédé de sélection de cibles thérapeutiques selon la revendication
    15, comportant en outre une étape D3) correspondant à l'étape D) dans laquelle les stimuli imposés à chaque simulation sont exercés sur trois sommets, soit en testant toutes les combinaisons de trois sommets possibles, soit en limitant ces calculs aux combinaisons de trois sommets choisis parmi un certain nombre des sommets les mieux classés à l'étape E) et des combinaisons de deux sommets les mieux classées à l'étape E2), ladite étape D3) étant suivie d'une étape E3) de classement hiérarchique des associations de trois sommets sur lesquels des stimuli sont le plus susceptibles d'avoir l'effet voulu.
  17. 17. Procédé de sélection de cibles thérapeutiques selon la revendication
    16, comportant en outre une étape D4) correspondant à l'étape D) dans laquelle les stimuli imposés à chaque simulation sont exercés sur quatre sommets, soit en testant toutes les combinaisons de quatre sommets possibles, soit en limitant ces calculs aux combinaisons de quatre
    <Desc/Clms Page number 99>
    sommets choisis parmi un certain nombre des sommets et combinaisons de sommets les mieux classés aux étapes E), E2) et E3), ladite étape D4) étant suivie d'une étape E4) de classement hiérarchique des associations de quatre sommets sur lesquels des stimuli sont le plus susceptibles d'avoir l'effet voulu.
  18. 18. Procédé de sélection de cibles thérapeutiques selon la revendication
    17, dans lequel les étapes D et E sont répétées de façon itérative en augmentant le nombre de sommets sur lesquels s'exercent les stimuli imposés pour les simulations.
  19. 19. Procédé de sélection de cibles thérapeutiques selon l'une quelconque des revendications 10 à 13 et 15 à 18, dans lequel, pour les simulations impliquant des stimuli sur plusieurs sommets, les stimuli sont exercés sur ces différents sommets simultanément ou non.
  20. 20. Procédé de sélection de cibles thérapeutiques selon l'une quelconque des revendications 15 à 19, comportant en outre une étape de classement statistique des proximités de graphes de toutes les simulations effectuées, intégrant l'ensemble des classements précédemment obtenus.
  21. 21. Procédé selon l'une quelconque des revendications 9 à 20, dans lequel les étapes A) et/ou B) correspondent aux étapes A) et/ou B) de l'une quelconque des revendications 1 à 8.
  22. 22. Procédé selon l'une quelconque des revendications 1 à 21, dans lequel pour au moins une partie des interactions physico-chimiques entre les molécules du système biologique, la relation entre les variables Xi et Xj, deux à deux est de la forme : wij .Xj = m, .(d2Xi / dt2) + 2 .#ij .(dX, / dt) + #ij2 .X,, dans laquelle
    <Desc/Clms Page number 100>
    Xj est une variable associée à la molécule j, m, représente l'inertie de i, #ij régit le retour à l'état d'équilibre de Xi, la pulsation #ij correspond au temps de réponse de X, à la variation de Xj, et wij est un facteur de couplage représentant la force de l'interaction entre les molécules i et j, correspondant à une pondération de l'effet de chaque molécule j sur la molécule i vis-à-vis de la résultante de l'ensemble des effets combinés de toutes les molécules j exerçant un effet sur i.
    X, est une variable associée à la molécule i dX, / dt est la dérivée de Xi en fonction du temps d2Xi/dt2 est la dérivée seconde de Xi en fonction du temps
    2 .#ij .(dX, / dt) correspond au terme de retour à l'état initial (ii),
    m, .(d2Xi / dt2) + #ij2.Xi correspond au terme inertiel (i),
  23. 23. Procédé selon l'une quelconque des revendications 1 à 22, dans lequel pour au moins une partie des interactions physico-chimiques entre les molécules du système biologique, la relation entre les variables Xi et Xj, deux à deux est établie par une relation sigmoïde comportant un facteur de retardement associée à une fonction de décroissance linéaire.
  24. 24. Procédé selon la revendication 23, dans lequel pour au moins une partie des interactions physico-chimiques entre les molécules du système biologique, la relation entre les variables Xi et Xj, est de la forme : (dX,/dt) = K1i. [ 1/ (1 + e-#wij.xj- bi) - K2i. Xi, où : le terme sigmoïde K1i. [1/ (1 + e-#wij.xj - bi)] correspond au terme inertiel (i), le terme K2, . Xi correspond au terme de retour à l'état initial (ii), avec : X, = variable associée au sommet i,
    <Desc/Clms Page number 101>
    K2, = facteur de retour à l'équilibre.
    K1i = facteur de limite maximale de variation de X;, et
    Xj = variable associée au sommet j, wij = facteur de couplage représentant la force de l'interaction entre les molécules i et j, correspondant à une pondération de l'effet de chaque molécule j sur la molécule i vis-à-vis de la résultante de l'ensemble des effets combinés de toutes les molécules j exerçant un effet sur i., bi = facteur de retardement,
  25. 25. Procédé selon l'une quelconque des revendications 1 à 24, dans lequel pour au moins une partie des interactions physico-chimiques entre les molécules du système biologique, la relation entre les variables X; et Xj, est une fonction polynôme de type
    Figure img01010001
    Wlj Xj = E bm;.X,m = b(P-1)i .xt1 + ... + b31 .X,3 + b21 .X,2 + b1i Xi + bOl [m:1#p-1] d'ordre strictement inférieur au nombre p de couples (X,t, Xjt) de valeurs expérimentales du niveau de taux ou d'activité Xi ou Xj des molécules i et j, respectivement, à différents instants t, les paramètres bmi étant calculés à partir des p couples expérimentaux (Xit, Xjt) disponibles, et wij étant un facteur de couplage représentant la force de l'interaction entre les molécules i et j, correspondant à une pondération de l'effet de chaque molécule j sur la molécule i vis-à-vis de la résultante de l'ensemble des effets combinés de toutes les molécules j exerçant un effet sur i.
  26. 26. Procédé selon l'une quelconque des revendications 1 à 25, dans lequel pour au moins une partie des interactions physico-chimiques entre les molécules du système biologique, la relation entre les variables Xi et Xj, est une fonction de type dérivée de polynôme wij Xj = E amij.[dmxi/dtm] [m:0p'-1]
    <Desc/Clms Page number 102>
    avec 1 < p' < p - 1, p étant le nombre de couples expérimentaux (Xit, Xjt) disponibles.
  27. 27. Méthode selon la revendication 26, dans laquelle p'=3.
  28. 28. Procédé selon l'une quelconque des revendications 1 à 27, dans lequel pour au moins une partie des molécules du système biologique, la résultante globale de n interactions exercées par des molécules 1 à n sur une molécule i est une somme pondérée des actions des molécules
    1 à n sur la molécule i, de la forme FG (# j # i) = # aij. fji, où [l:1#n] [i:1#n] fji est la relation associée à l'arc (i, j) pour chaque couple (i, j) et aij (dX/dt) / # (d2Xj/dt2).
    1 à n sur la molécule i, de la forme FG (# j # i ) = # aij. fji, où [l:1#n] [l:1#n] fji est la relation associée à l'arc (i, j) pour chaque couple (i, j) et aij = (d2Xj/dt2) # (d2Xj/dt2).
    [l:1#n]
  29. 29. Procédé selon l'une quelconque des revendications 1 à 27, dans lequel pour au moins une partie des molécules du système biologique, la résultante globale de n interactions exercées par des molécules 1 à n sur une molécule i est une somme pondérée des actions des molécules
    [l:1#n]
  30. 30. Procédé de détermination du mode d'action d'un xénobiotique, consistant à mettre en oeuvre un procédé selon la revendication 9 ou 10 dans les conditions suivantes : (i) le système biologique dans lequel un réseau d'interactions moléculaires est étudié est concerné par l'action du xénobiotique ;
    <Desc/Clms Page number 103>
    (ii) l'"état à modifier" choisi à l'étape C), correspond à un état observé expérimentalement avant l'administration dudit xénobiotique ; (iii) on identifie les modifications à apporter au cours de l'étape D) a) pour que le calcul effectué à l'étape D) b) montre une évolution du système vers un état proche de l'état observé après administration du xénobiotique.
  31. 31. Procédé de prédiction d'éventuels effets indésirables d'un traitement, consistant à mettre en oeuvre un procédé selon la revendication 9 ou 10 dans les conditions suivantes : (i) le système biologique dans lequel un réseau d'interactions moléculaires est étudié est concerné par le traitement ; (ii) les modifications de l'étape D) a) correspondent aux modifications des niveaux de taux ou d'activité des molécules cibles observées ou souhaitées lors de l'application du traitement ; (iii) l'étape D) b) de calcul de l'évolution du système biologique est suivie d'une analyse de sous-parties du système correspondant à des fonctions physiologiques connues, afin d'identifier les éventuelles évolutions de ces sous-parties vers des états proches d'états pathologiques de référence.
  32. 32. Procédé pour hiérarchiser des cibles thérapeutiques potentielles pour une pathologie, consistant à mettre en oeuvre un procédé selon les revendications 10 à 29 et le procédé selon la revendication 31, puis à déterminer le rapport "bénéfice thérapeutique/ effets indésirables" d'une action sur chacune des cibles thérapeutiques potentielles.
  33. 33. Procédé selon l'une quelconque des revendications 1 à 32, dans lequel le nombre de variables Xi du réseau d'interactions moléculaires considéré est supérieur à environ 100, supérieur à environ 200, ou supérieur à environ 300.
    <Desc/Clms Page number 104>
  34. 34. Procédé selon l'une quelconque des revendications 1 à 32, dans lequel le nombre de variables X, des réseaux d'interactions moléculaires considéré est inférieur à environ 100 et en ce que l'on associe lesdits réseaux d'interactions moléculaires, pour former une association de réseaux.
  35. 35. Procédé selon la revendication 34, dans lequel le nombre de réseaux associés est compris entre 2 et environ 100.
  36. 36. Utilisation d'un modèle dynamique d'un réseau d'interactions moléculaires dans un système biologique susceptible d'être obtenu par un procédé selon l'une quelconque des revendications précédentes, pour étendre un graphe statique dont les sommets représentent des molécules biologiques et les arcs représentent des interactions physico- chimiques entre ces molécules, pour identifier de nouvelles interactions moléculaires.
FR0309557A 2003-08-01 2003-08-01 Methode d'analyse de reseaux d'interactions moleculaires biologiques Expired - Fee Related FR2858446B1 (fr)

Priority Applications (5)

Application Number Priority Date Filing Date Title
FR0309557A FR2858446B1 (fr) 2003-08-01 2003-08-01 Methode d'analyse de reseaux d'interactions moleculaires biologiques
EP04786022A EP1649405A2 (fr) 2003-08-01 2004-07-30 METHODE ET SYSTEME DE SELECTION DE CIBLES THERAPEUTIQUES PAR L&apos;UTILISATION DE RESEAUX DYNAMIQUES D INTERACTIONS MOLECULA IRES
CA002534401A CA2534401A1 (fr) 2003-08-01 2004-07-30 Methode et systeme de selection de cibles therapeutiques par l'utilisation de reseaux dynamiques d'interactions moleculaires
PCT/FR2004/002064 WO2005013173A2 (fr) 2003-08-01 2004-07-30 Methode et systeme de selection de cibles therapeutiques par l'utilisation de reseaux dynamiques d'interactions moleculaires
US11/342,707 US20060235670A1 (en) 2003-08-01 2006-01-31 Method and system for selecting therapeutic targets using molecular interaction dynamic networks

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR0309557A FR2858446B1 (fr) 2003-08-01 2003-08-01 Methode d'analyse de reseaux d'interactions moleculaires biologiques

Publications (2)

Publication Number Publication Date
FR2858446A1 true FR2858446A1 (fr) 2005-02-04
FR2858446B1 FR2858446B1 (fr) 2007-11-09

Family

ID=34043752

Family Applications (1)

Application Number Title Priority Date Filing Date
FR0309557A Expired - Fee Related FR2858446B1 (fr) 2003-08-01 2003-08-01 Methode d'analyse de reseaux d'interactions moleculaires biologiques

Country Status (5)

Country Link
US (1) US20060235670A1 (fr)
EP (1) EP1649405A2 (fr)
CA (1) CA2534401A1 (fr)
FR (1) FR2858446B1 (fr)
WO (1) WO2005013173A2 (fr)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012163440A3 (fr) * 2011-06-01 2013-01-24 Albert-Ludwigs-Universität Freiburg Procédé de modélisation, d'optimisation, de paramétrage, de test et / ou de validation d'un réseau dynamique ou de perturbations de réseau

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7667582B1 (en) * 2004-10-14 2010-02-23 Sun Microsystems, Inc. Tool for creating charts
CA2726175A1 (fr) 2008-05-27 2009-12-23 Memorial Sloan-Kettering Cancer Center Modeles de perturbations combinatoires de systemes biologiques vivants
EP2530615A1 (fr) * 2011-06-01 2012-12-05 Albert-Ludwigs-Universität Freiburg Procédé de modélisation, optimisation, paramétrage, test et/ou validation des perturbations de réseau dynamique
EP3298524A4 (fr) 2015-05-22 2019-03-20 CSTS Health Care Inc. Mesures thermodynamiques portant sur des réseaux d'interaction protéine-protéine pour le traitement du cancer
US10366324B2 (en) * 2015-09-01 2019-07-30 Google Llc Neural network for processing graph data
US11456053B1 (en) 2017-07-13 2022-09-27 X Development Llc Biological modeling framework
CN109635439B (zh) * 2018-12-12 2023-05-05 新疆大学 基于传播动力学的扰动环境下生产网络连锁效应研究方法
CN116844645B (zh) * 2023-08-31 2023-11-17 云南师范大学 一种基于多视角分层超图的基因调控网络推断方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002044992A2 (fr) * 2000-11-28 2002-06-06 Physiome Sciences, Inc. Systeme de modelisation de mecanismes biologiques
WO2003017127A2 (fr) * 2001-08-16 2003-02-27 Biotech Research Ventures Pte Limited Modelisation de chemins biochimiques

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002044992A2 (fr) * 2000-11-28 2002-06-06 Physiome Sciences, Inc. Systeme de modelisation de mecanismes biologiques
WO2003017127A2 (fr) * 2001-08-16 2003-02-27 Biotech Research Ventures Pte Limited Modelisation de chemins biochimiques

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CURTO R ET AL: "Mathematical models of purine metabolism in man", MATHEMATICAL BIOSCIENCES, ELSEVIER, NEW YORK, NY, US, vol. 151, no. 1, July 1998 (1998-07-01), pages 1 - 49, XP002250783, ISSN: 0025-5564 *
GORYANIN I ET AL: "Mathematical simulation and analysis of cellular metabolism and regulation", BIOINFORMATICS, OXFORD UNIVERSITY PRESS, SURREY, GB, vol. 15, no. 9, September 1999 (1999-09-01), pages 749 - 758, XP002190906, ISSN: 1367-4803 *
SEDAGHAT AHMAD R ET AL: "A mathematical model of metabolic insulin signaling pathways.", AMERICAN JOURNAL OF PHYSIOLOGY, vol. 283, no. 5 Part 1, November 2002 (2002-11-01), pages E1084 - E1101, XP002289933, ISSN: 0002-9513 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012163440A3 (fr) * 2011-06-01 2013-01-24 Albert-Ludwigs-Universität Freiburg Procédé de modélisation, d'optimisation, de paramétrage, de test et / ou de validation d'un réseau dynamique ou de perturbations de réseau
US10910084B2 (en) 2011-06-01 2021-02-02 Albert-Ludwigs-Universität Freiburg Method for modelling, optimizing, parameterizing, testing and validating a dynamic network with network perturbations

Also Published As

Publication number Publication date
WO2005013173A2 (fr) 2005-02-10
CA2534401A1 (fr) 2005-02-10
WO2005013173A3 (fr) 2005-09-29
FR2858446B1 (fr) 2007-11-09
US20060235670A1 (en) 2006-10-19
EP1649405A2 (fr) 2006-04-26

Similar Documents

Publication Publication Date Title
Ghasemi et al. Neural network and deep-learning algorithms used in QSAR studies: merits and drawbacks
Nicolaou et al. De novo drug design using multiobjective evolutionary graphs
Ma et al. CGI: a new approach for prioritizing genes by combining gene expression and protein–protein interaction data
Fiser et al. Statistically optimal perception and learning: from behavior to neural representations
Rastelli et al. Binding estimation after refinement, a new automated procedure for the refinement and rescoring of docked ligands in virtual screening
Daw et al. The pigeon as particle filter
Hooft et al. Discovering collective variables of molecular transitions via genetic algorithms and neural networks
Gonnelli et al. A decoy-free approach to the identification of peptides
JP2005505031A (ja) 多重破壊表現ライブラリから生成される遺伝子調節ネットワークを用いた生物学的発見
Korfmann et al. Deep learning in population genetics
FR2948209A1 (fr) Simulation d&#39;un agregat evolutif du monde reel, notamment pour gestion de risque
CN113012770A (zh) 基于多模态深度神经网络的药物-药物相互作用事件预测方法、系统、终端及可读存储介质
Knowles Closed-loop evolutionary multiobjective optimization
US20060235670A1 (en) Method and system for selecting therapeutic targets using molecular interaction dynamic networks
Savva et al. Computational drug repurposing for neurodegenerative diseases
Jariwala et al. Intriguing of pharmaceutical product development processes with the help of artificial intelligence and deep/machine learning or artificial neural network
Datta et al. Data, Analytics and Interoperability between Systems (IoT) is Incongruous with the Economics of Technology: Evolution of Porous Pareto Partition (P3)
Braillard et al. Explanation in systems biology: Is it all about mechanisms?
Ghosh et al. Discovery of structure–property relations for molecules via hypothesis-driven active learning over the chemical space
Jauhiainen et al. Transcriptional and metabolic data integration and modeling for identification of active pathways
Courville et al. The rat as particle filter
Lelandais et al. Comparative functional genomics of stress responses in yeasts
EP1934873A1 (fr) Procede pour determiner l&#39;etat d&#39;un ensemble de cellules et systeme pour la mise en oeuvre dudit procede
Drouard et al. Exploring machine learning strategies for predicting cardiovascular disease risk factors from multi-omic data
Engel DNA Systems Under Internal and External Forcing: An Exploration Using Coarse-Grained Modelling

Legal Events

Date Code Title Description
ST Notification of lapse

Effective date: 20130430