FI118101B - Informaationhallintajärjestelmä biokemiallista informaatiota varten - Google Patents

Informaationhallintajärjestelmä biokemiallista informaatiota varten Download PDF

Info

Publication number
FI118101B
FI118101B FI20031025A FI20031025A FI118101B FI 118101 B FI118101 B FI 118101B FI 20031025 A FI20031025 A FI 20031025A FI 20031025 A FI20031025 A FI 20031025A FI 118101 B FI118101 B FI 118101B
Authority
FI
Finland
Prior art keywords
variable
management system
information management
data
information
Prior art date
Application number
FI20031025A
Other languages
English (en)
Swedish (sv)
Other versions
FI20031025A0 (fi
FI20031025A (fi
Inventor
Pertteli Varpela
Meelis Kolmer
Original Assignee
Medicel Oy
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Medicel Oy filed Critical Medicel Oy
Publication of FI20031025A0 publication Critical patent/FI20031025A0/fi
Priority to FI20031025A priority Critical patent/FI118101B/fi
Priority to EP04103074A priority patent/EP1494159A3/en
Priority to CA002531131A priority patent/CA2531131A1/en
Priority to JP2006516238A priority patent/JP2007520773A/ja
Priority to PCT/FI2004/000424 priority patent/WO2005003999A1/en
Priority to RU2005141111/09A priority patent/RU2005141111A/ru
Priority to AU2004254729A priority patent/AU2004254729A1/en
Priority to US10/883,648 priority patent/US20050192756A1/en
Publication of FI20031025A publication Critical patent/FI20031025A/fi
Application granted granted Critical
Publication of FI118101B publication Critical patent/FI118101B/fi

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/10Ontologies; Annotations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • G16B5/10Boolean models

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Molecular Biology (AREA)
  • Physiology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

118101
Informaationhallintajärjestelmä biokemiallista informaatiota varten
Keksinnön tausta
Keksintö liittyy informaationhallintajärjestelmään (lyhyesti "IMS” (in-5 formation management system)) biokemiallisen informaation hallintaa varten.
Biologinen tutkimus tuottaa valtavia datamääriä nopeudella, jota ei ole koskaan nähty millään tieteen alalla. Keksinnön pohjana oleva ongelma liittyy vaikeuksiin järjestää valtavia määriä nopeasti vaihtuvaa informaatiota. IMS-järjestelmät voivat olla vapaamuotoisia tai strukturoituja. Eräs hyvin tun-10 nettu esimerkki vapaamuotoisesta IMS:stä on tutkimusinstituutin lähiverkko, johon informaation tuottajat (tutkijat tms.) voivat syöttää informaatiota mielivaltaisessa muodossa käyttämällä mitä tahansa yleisesti saatavilla olevia tai räätälöityjä sovellusohjelmia, kuten tekstinkäsittely-, taulukkolaskenta- tai tietokan- f taohjelmia. Strukturoitu IMS tarkoittaa järjestelmää, jossa on järjestelmän laa-15 juiset säännöt informaation tallentamiseksi yhtenäiseen tietokantaan. ^
Keksinnön perustana oleva erityinen ongelma liittyy biologisiin pol- i
kuihin ("pathway”). Biologiset polut ovat jossakin määrin analogisia elektronis- C
ten piirien piirikaavioiden kanssa. Tunnetuissa IMS-järjestelmissä polut piirretään tyypillisesti käsin, mikä on virhealtista ja aikaa vievää. Lisäksi käsin piirret-20 tyjä polkuja ovat vaikea analysoida tietokoneilla.
. . Keksinnön lyhyt selostus • · · • ♦ ·
Keksinnön tavoitteena on tuottaa informaationhallintajärjestelmä • · · (jäljempänä lyhennetty ’’IMS”) yllä mainittujen haittojen lieventämiseksi. Toisin ***\ sanoen Keksinnön tavoitteena on tuottaa IMS, joka tukee biologisten polkujen / 25 automaattista prosessointia. Keksinnön tavoite saavutetaan IMS:llä, jolle on •‘ ·* tunnusomaista se, mitä sanotaan itsenäisissä patenttivaatimuksissa. Keksin- * · · nön edulliset suoritusmuodot ilmenevät epäitsenäisistä patenttivaatimuksista.
Keksinnön mukaisella IMS:llä on edullisesti kyky tallentaa informaa-j*\. tiota populaatioista, yksilöistä, reagenteista tai muiden biomateriaalien näyt- 30 teistä (mitä tahansa, jota voidaan tutkia biologisena/biokemiallisena järjestel- • · * mänä tai sen komponenttina). IMS käsittää edullisesti koetietokannan. Koe voi *.,** olla todellisen elämän koe ("märkälaboratorio”) tai simuloitu koe (”in silico”). f • · *·;·* Keksinnön mukaisesti molemmat koetyypit tuottavat datajoukkoja, joista ku- hunkin kuuluu: • · ·♦· • · • · • · · 2 118101 - muuttuja-arvomatriisi, joka sisältää riveiksi ja sarakkeiksi järjestettyjä muuttuja-arvoja; 4' muuttujankuvauskielellä oleva rivienkuvauslista muuttuja-arvomatriisin riveistä; 5 - muuttujankuvauskielellä oleva sarakkeidenkuvauslista muuttuja- arvomatriisin sarakkeista; - muuttujankuvauskielellä oleva kiinteiden dimensioiden kuvaus yh-
• VI
destä tai useammasta kiinteästä dimensiosta, jotka ovat yhteisiä muuttuja-arvomatriisin kaikille arvoille.
10 Kunkin kokeen numeeriset arvot talletetaan edullisesti skalaarilukui- 4 na muuttuja-arvomatriisiin, jossa on rivi-sarake -organisaatio. Tällaisia rivi-sarake-matriiseja voidaan käsitellä edelleen hyvin monilla erilaisilla valmiilla tai räätälöidyillä sovellusohjelmilla. On erilliset rivi- ja sarakekuvauslistat kuvaa- 4 maan, vastaavasti, muuttuja-arvomatriisissa olevien rivien ja sarakkeiden mer-15 kitystä. Rivi-ja sarakekuvauslistat sekä kiinteiden dimensioiden kuvaus kirjoitetaan muuttujankuvauskielellä mielivaltaisten muuttuja-arvojen linkittämiseksi IMS:n strukturoituun informaatioon.
Muuttujankuvauskielen (variable description language = VDL) käyt-tämisellä saavutetaan se etu, että IMS on pitkälti itseriittoinen. Numeroarvojen 20 tulkitsemiseen tarvitaan vähän tai ei lainkaan ulkopuolista informaatiota. On myös suhteellisen suoraviivainen tehtävä kohdistaa muuttujalausekkeisiin pa- | : .·, kollinen automaattinen syntaksintarkastus. Eräs VDL:n oleellinen piirre on, että • · « [·[ | se sallii muuttujien kuvaamisen muuttuvalla detaljitasolla. VDL voi esimerkiksi * · · /..* kuvata muuttujan biomateriaalitermein (populaatio - yksilö - näyte; organismi - ***\ 25 elin - kudos, solutyyppi, jne.), fyysisinä määrinä ja aikana, mutta voimme jättää pois detaljeja, jotka eivät ole nykyiselle kontekstille oleellisia.
: XML (extendible Markup Language) on eräs hyvin tunnettu esi- ··· merkki kielestä, jota voidaan käyttää muuttujankuvauskielenä. XML:n ongelmana on kuitenkin se, että se on tarkoitettu kuvaamaan käytännöllisesti katso- ' 30 en mitä tahansa strukturoitua informaatiota, mikä johtaa pitkähköihin lausek-keisiin, joiden lukeminen on ihmiselle vaikeaa. Näin ollen, keksinnön eräs edul- • · · linen suoritusmuoto liittyy muuttujankuvauskieleen, joka XML:ää paremmin soveltuu biologisten muuttujien kuvaamiseen. Lisäksi lausekkeet XML:llä ja • · sen biologisilla tai matemaattisilla varianteilla, kuten SBML (Systems Biology ί :/.: 35 Markup Language) tai CellML (Cell Markup Language) tai MathML (Mathe- /*': matical Markup Language), ovat yleensä liian pitkiä tai monimutkaisia toimiak- .·/· 118101 3 seen itse dokumentoivina symboleina biologisten muuttujien kuvaamiseen matemaattisissa malleissa. Näin ollen keksinnön vielä eräs edullinen suoritusmuo- i to käsittää kompaktin mutta laajennettavan VDL:n, joka ratkaisee nämä XML:n ja sen varianttien ongelmat.
5 Tallettamalla numeroarvot skalaarimatriisina saavutetaan se etu, et tä matriisi voidaan analysoida monilla kaupallisesti saatavilla datanetsintätyö-kaluilla (data mining tools), kuten itsejärjestyvillä kartoilla tai muilla klusterointialgoritmeilla, jotka eivät helposti prosessoi arvoja, joissa on dimensioita. Niinpä rivi- ja sarakekuvaukset talletetaan erikseen. Tallettamalla kol-10 mas lista, nimittäin kiinteiden dimensioiden kuvaus, saavutetaan se etu, että 4 riveille ja sarakkeille yhteisiä dimensioita ei tarvitse toistaa rivi- ja sarakeku-vauslistoissa.
IMS:n käsittelynopeutta voidaan lisätä tallettamalla kukin datajoukko (kukin datajoukko käsittää muuttuja-arvomatriisin, rivi- ja sarakekuvauslistat 15 sekä kiinteiden dimensioiden kuvauksen) datan säiliönä ja tallettamalla tietokantaan vain tämän säiliön osoite tai tunniste. Olettaen, että datajoukkojen noutamiseen käytetään SQL-(structured query language) tai muita tietokanta- i kyselyjä, yhden säiliön tekniikka vähentää dramaattisesti SQL-kyselyillä prosessoitavien yksittäisten dataelementtien määrää. Kun yksittäisiä dataelement- y
20 tejä tarvitaan, koko säiliö voidaan prosessoida sopivalla työkalulla, kuten taulukkolaskennalla tai yksinkertaisten tiedostojen (flat file) tietokantajärjestelmä!- T
lä.
: :*: Keksinnön erään toisen edullisen suoritusmuodon mukaisesti IMS
««· » käsittää lisäksi biokemiallisten olioiden tietokannan, joka sisältää olioita tai tau- • · :**·. 25 lukoita. Muuttujankuvauskieli käsittää muuttujakuvauksia, joista kukin käsittää * * · " yhden tai useamman avainsana-nimiparin. Kutakin biokemiallisten olioiden * tietokannassa olevaa oliota tai taulukkoa kohti on siihen viittaava avainsana.
• * Tämä suoritusmuoto helpottaa automaattista syntaksin tai muuta tarkastusta, j **’ joka tehdään talletettavaan informaatioon.
30 Keksinnön mukaisten datajoukkojen eräs toinen etu on hyvä tuki hyvin määritellyille konteksteille. Konteksti määrittelee kokeen, joko märkälabo-ratorio tai in-silico, laajuuden. Jokainen konteksti määritellään biomateriaalei- * · i ·*«*. na, muuttujina ja aikana. ; • · ... .1 • « *···* Kuvioiden lyhyt selostus • · \*·· 35 Keksintöä selostetaan nyt lähemmin edullisten suoritusmuotojen yh- • · · teydessä, viitaten oheisiin piirroksiin, joista:
118101 :J
V
4
Kuvio 1 on lohkokaavio IMS:stä, jossa keksintöä voidaan käyttää;
Kuvio 2 on IMS:n tietokantarakenteen olio-relaatiomalli;
Kuviot 3A ja 3B esittävät edullista muuttujankuvauskieltä eli VDL:ää;
Kuvio 3C esittää VDL-kielisen muuttujalausekkeen syntaksin-5 tarkastusprosessia;
Kuvio 4 näyttää esimerkkejä VDL-kielisistä yhdistetyistä muuttuja-lausekkeista;
Kuvio 5 näyttää, kuinka VDL:ää voidaan käyttää ilmaisemaan erilaisia datakonteksteja; 10 Kuviot 6A ja 6B esittävät keksinnön mukaisia datajoukkoja;
Kuvio 7A on IMSiään tallennetun polun (pathway) lohkokaavio;
Kuvio 7B näyttää esimerkin monimutkaisesta polusta, joka sisältää yksinkertaisempia polkuja;
Kuvio 8 näyttää polun visualisoitua muotoa; £ 15 Kuvio 9 esittää koe-oliota IMS.n koeosiossa;
Kuvio 10 näyttää esimerkin IMS:n biomateriaaliosion objektipohjaisesta toteutuksesta;
Kuviot 11A ja 11B osoittavat datan seurattavuutta kahden esimerkin : ^ valossa; 20 Kuvio 12A näyttää ohjelmisto-komponenttimallia monimutkaisten työvirtojen selostamiseksi ja hallitsemiseksi IMSissä;
Kuvio 12B näyttää asiakas-palvelin -arkkitehtuurin, johon kuuluu : asiakaspäätelaitteessa CT suoritettava graafinen työvirtojen editori; :*·.· Kuvio 13 esittää prosessia polkujen automaattista täyttämistä varten .·**. 25 sekvenssitietokannasta; ja
Kuvio 14 esittää spatiaalista referenssimallia erilaisille solutyypeille.
• « ·· · ί V Keksinnön yksityiskohtainen selostus ··♦ • · ’···* Tässä dokumentissa "objekti” tarkoittaa samaa kuin englanninkieli nen termi "object” ja "olio” tarkoittaa samaa kuin englanninkielen "entity”.
• · • *·· 30 Kuvio 1 on yksinkertaistettu lohkokaavio informaationhallintajärjes- :]**: telmästä IMS, jossa keksintöä voidaan käyttää. Tässä esimerkissä IMS on to- :·]·. teutettu asiakas/palvelin -järjestelmänä. Useilla asiakaspäätelaitteilla CT, kuten • · \.m.' graafisilla työasemilla, on pääsy palvelimeen (tai palvelinten joukkoon) S ver- i “·* kon NW, kuten lähiverkon tai Internetin kautta. Palvelimeen kuuluu tai siihen * V*j 35 on kytketty tietokanta DB. Palvelimen informaationkäsittelylogiikka ja tietokan-:***: nan data muodostavat IMS:n. Tietokanta muodostuu rakenteesta ja sisällöstä.
118101 5
Keksinnön eräs edullinen suoritusmuoto tuo parannuksia IMS:n tietokannan DB rakenteeseen. Palvelin S käsittää myös erilaisia prosessointilogiikoita. ^
Viestilogiikka tarjoaa palvelimen perustoiminnot asiakaspäätelaitteiden kanssa viestintää varten. On myös edullisesti käyttöliittymälogiikka erilaisten käyttöliit-5 tyrnien luomiseksi. Voi olla erilaisia tarkastuksia syötettävän datan merkitsevyyden tarkastamista varten (kuten syntaksi- tai aluetarkastuksia). Eräs hyvin hyödyllinen piirre on projektihallitsija, jolla on seurantalogiikka, joka tarjoaa datan visuaalisen seurannan.
Palvelin (tai palvelinjoukko) S käsittää myös erilaisia dataproses-10 sointityökaluja datan analysointia, visualisointia ja etsimistä (mining) varten, ym. Tallentamalla datajoukot säiliöinä rivi-sarake -organisaatiossa (eikä osoiteta jokaista data-alkiota erikseen SQL-kyselyillä) saavutetaan se etu, että tällaiset rivien ja sarakkeiden datajoukot voidaan helposti prosessoida kaupallisesti saatavilla analyysi-tai visualisointityökaluilla. Muita suoritusmuotoja kolmansi-15 en osapuolten työkalujen integroimiseksi yhteisen käyttöliittymän alaisuuteen selostetaan kuvion 12 yhteydessä.
Datajoukot
Kuvio 2 on IMS:n tietokantarakenteen 200 olio-relaatiomalli. Tieto-kantarakenne 200 käsittää seuraavat pääosat: perusmuuttujat/yksiköt 204, 20 datajoukot 202, kokeet 208, biomateriaalit 210, polut 212 ja valinnaisesti sijainnit 214. £ • ·*. Datajoukot 202 kuvaavat IMS:ään tallennettuja numeerisia arvoja.
• · « · .\j Kukin datajoukko koostuu muuttujajoukosta, biomateriaali-informaatiosta ja ,···! ajasta. Huomattakoon, että perusmuuttujat/yksiköt -osasta 204 ja aikaosasta • · 25 206 on monesta moneen -relaatiot datajoukko-osaan 202. Tämä tarkoittaa, ... että kukin datajoukko 202 käsittää tyypillisesti yhden tai useamman perus- **..;* muuttujan/yksikön ja yhden tai useamman aikalausekkeen. Datajoukko-osan • · **··* 202 ja koeosan 208 välillä on monesta moneen -relaatiot, mikä tarkoittaa, että kukin datajoukko 202 liittyy yhteen tai useampaan kokeeseen 208, ja kukin koe • · : *·· 30 liittyy yhteen tai useampaan datajoukkoon. Datajoukko-osan edullista toteutus- «·* ta selostetaan lisää kuvioiden 6A ja 6B yhteydessä.
:v. Perusmuuttujat/yksiköt-osa 204 kuvaa IMS:ssä käytetyt perusmuut- tujat ja yksiköt. Erässä yksinkertaisessa toteutuksessa kukin perusmuuttuja-• ♦ '·* "* tietue käsittää yksikkökentän, mikä tarkoittaa, että kukin perusmuuttuja (esim.
35 massa) voidaan ilmaista vain yhdessä yksikössä (esim. kilogrammoina). Jous- « · « tavammassa suoritusmuodossa yksiköt tallennetaan erilliseen tauluun, mikä 6 n 8101 ; sallii perusmuuttujien ilmaisemisen useassa yksikössä, kuten kilogrammoina tai nauloina.
Perusmuuttujat ovat muuttujia, joita voidaan käyttää sellaisinaan, tai niitä voidaan yhdistää muodostamaan monimutkaisempia muuttujia, kuten tie-5 tyn näytteen konsentraatio tietyllä ajanhetkellä.
Aikaosa 206 tallentaa datajoukkojen 202 aikakomponentit. Datajou-kon aikakomponentti käsittää edullisesti suhteellisen (sekuntikello-) ajan ja absoluuttisen (kalenteri-) ajan. Suhteellista aikaa voidaan käyttää esimerkiksi kuvaamaan nopeutta, jolla kemiallinen reaktio tapahtuu. On myös päteviä syitä 10 tallentaa absoluuttinen aika kunkin datajoukon yhteydessä. Absoluuttinen aika i osoittaa koska kalenteriajassa vastaava tapahtuma esiintyi. Tällaista absoluuttisen ajan informaatiota voidaan käyttää laskemaan suhteellinen aika minkä tahansa koetapahtumien välillä. Sitä voidaan käyttää myös vianetsintätarkoi-tuksiin. Jos esimerkiksi havaitaan viallinen instrumentti tiettynä aikana, niin 15 tuolla instrumentilla tehdyt kokeet ennen vian havaitsemista tulisi tarkistaa.
Koeosa 208 tallentaa kaikki IMS:n tuntemat kokeet. On kaksi kokeiden päätyyppiä, joista käytetään yleisesti nimitystä märkälaboratorio ja in-silico. Mutta datajoukkojen 202 suunnasta nähtynä kaikki kokeet näyttävät samoilta. Koeosa 208 toimii siltana datajoukkojen 202 ja kokeiden kahden pää- ^ 20 tyypin välillä. Jo suoritettujen kokeiden lisäksi koeosaa 208 voidaan käyttää tallentamaan tulevia kokeita. Kokeiden edullisia objektiperustaisia toteutuksia selostetaan kuvion 9 yhteydessä. Koeosan eräs tärkeä suunnittelutavoite on i.j*: datan seurattavuus, kuten kuvion 11 yhteydessä lähemmin selostetaan. · :\j Biomateriaaliosa 210 sisältää tietoa populaatioista, yksilöistä, ;***; 25 reagenteista tai muiden biomateriaalien näytteistä (mitä tahansa, jota voidaan • · · tutkia biologisena järjestelmänä tai sen komponenttina) IMS:ssä. Biomateriaalit *·,·, kuvataan edullisesti datajoukkoina 202 käyttäen VDL:ää kuvaamaan kunkin • · biomateriaalin hierarkkisesti, eli muuttuvalla detaljitasolla, kuten populaationa, • m yksilönä, reagenttina ja näytteenä. Eräs edullinen biomateriaaliosan 210 objek- „ 30 tiperusteinen toteutus selostetaan kuvion 10 yhteydessä.
• · “ Biomateriaaliosa 210 kuvaa reaalimaailman biomateriaaleja, mutta *··.* polkuosa 212 kuvaa biomateriaalien teoreettisia malleja. Biokemialliset polut ovat jossakin määrin analogisia elektronisten piirien piirikaavioiden kanssa.
• · .***. Polut voidaan kuvata IMS.ssä monella tavalla, mutta kuvio 2 esittää erään .· „ 35 edullisen toteutuksen pääpiirteet. Kuvion 2 esimerkissä kukin polku 212 käsit- • · · • tt • · * · · • * • · ···
7 118101 J
tää yhden tai useamman yhteyden 216, joista kukin liittyy yhteen tai useampaan biokemialliseen olioon 218 ja yhteen interaktioon 222. Ϊ
Biokemialliset oliot tallennetaan biokemiallisten olioiden osassa 218.
Kuvion 2 esimerkissä kukin biokemiallinen olio on luokkaobjekti, jonka alaluo-5 kat ovat geeni 218-1, transkripti 218-2, proteiini 218-3, makromolekyylikomp-leksi 218-4 ja yhdiste 218-5. Edullisesti on myös optio tallentaa abioottinen heräte 218-6, kuten lämpötila, jolla on potentiaalisia yhteyksiä interaktioihin ja ^ potentiaalisia vaikutuksia relevantteihin kineettisiin lakeihin.
Tietokantaviiteosa 220 toimii siltana ulkoisiin tietokantoihin. Kukin 10 tietokantaviite osassa 220 on relaatio sisäisen biokemiallisen olion 218 ja ulkoisen tietokannan olion välillä, kuten Affymetrix Inc.-yhtiön spesifinen koetin-joukko.
Interaktio-osa 222 sisältää biokemiallisten olioiden välisiä interaktioi- . 1 ta, mukaanlukien reaktioita. Kineettisten lakien osa 224 kuvaa (hypoteettisia tai 5 15 kokeellisesti varmennettuja) kineettisiä lakeja, jotka vaikuttavat interaktioihin.
Polkujen edullisia ja yksityiskohtaisempia toteutuksia selostetaan kuvioiden 7A, 7B ja 8 yhteydessä.
Keksinnön erään edullisen suoritusmuodon mukaisesti IMS tallentaa myös paikkatietoa 214. Paikkatietoon viitataan biomateriaaliosasta 210 ja pol- 20 kuosasta 122. Esimerkiksi biomateriaaleihin liittyvän informaation suhteen ku- ' viossa 2 näytetty organisaatio sallii minkä tahansa detaljitason tai tarkkuuden yhtäältä populaation ja toisaalta solun spatiaalisen pisteen (koordinaattien) ;5 välillä. Kuviossa 2 näytetyssä esimerkissä paikkatieto käsittää organismin 214- :·1· · 1 (esimerkiksi ihminen), elimen 214-2 (esim. sydän, mahalaukku), kudoksen \1·: 25 214-3 (esim. sileä lihaskudos, hermokudos), solutyypin 214-4 (esim. lieriöepi- • » · teelisolu), solun osa 214-5 (eg tuma, solulima) ja avaruuspisteen 214-6 (eg x = *:1“ 0.25, y = 0.50, z = 0.75 suhteessa suorakulmaisen referenssisolun dimensioi- hin. Organismi tallennetaan edullisesti taksonomiapuuna, jossa on solmu kul- ;1'1· lekin tunnetulle organismille. Elin-, kudos-, solutyyppi- ja solun osa -lohkot voi- • · · 30 daan toteuttaa yksinkertaisina listoina. Tallentamalla paikkatieto viittauksena ennalta määrättyihin listoihin saadaan se etu, että tällainen viittaus pakottaa • · 1 automaattiseen syntaksintarkastukseen. On siis mahdotonta tallentaa paikka-tietoa, joka viittaa väärinkirjoitettuun tai olemattomaan elimeen tai organismiin.
• ♦ · : Keksinnön erään toisen edullisen suoritusmuodon mukaisesti paik- 35 katieto voi käsittää myös spatiaalista tietoa 214-6, kuten spatiaalisen pisteen .·’ : organismi-soluhierarkian kaikkein detaljoiduimmassa paikassa. Jos kaikkein * ♦ · • · · · • · * · i • · · 8 ' 118101 detaljoiduin paikka osoittaa spesifistä solua tai solun osaa, niin spatiaalinen piste voi edelleen määrittää kyseistä tietoa relatiivisina spatiaalisina koordinaatteina. Solutyypistä riippuen spatiaaliset koordinaatit voivat olla suorakulmaisia tai napakoordinaatteja.
5 Eräs tällaisen paikkatiedon etu on parempi ja systemaattinen tapa verrata paikkoja näytteissä ja teoreettisissa rakenteissa, kuten poluissa, jotka on varmennettava relevanteilla mittaustuloksilla.
Muuttujankuvauskieli
Kuviot 3A ja 3B esittävät edullista muuttujankuvauskieltä eli VDL:ää.
10 Yleisesti ottaen muuttuja on mitä tahansa, jolla on arvo ja joka edustaa biologisen järjestelmän tilaa (joko tosielämän biomateriaalia tai teoreettista mallia).
Kun IMS otetaan käyttöön, suunnittelija ei tiedä, minkälaisia biomateriaaleja tullaan kohtaamaan tai minkälaisia kokeita tullaan suorittamaan tai mitä tuloksia näistä kokeista tullaan saamaan. Niin ollen muuttujakuvausten on oltava 15 avoimia tuleville laajennuksille. Toisaalta avoimuus ja joustavuus eivät saa johtaa anarkiaan, minkä vuoksi tulisi varmistaa, että muuttujakuvauksiin sovelle- v taan hyvin määriteltyjä sääntöjä. Nämä tarpeet tyydytetään parhaiten laajennettavalla muuttujankuvauskielellä (variable description language, VDL).
Esimerkiksi extendible markup language (XML) on eräs esimerkki 20 laajennettavasta kielestä, jota voitaisiin periaatteessa käyttää kuvaamaan biologisia muuttujia. Tietokoneet tulkitsevat XML-lausekkeita melko helposti. XML-lausekkeet pyrkivät kuitenkin olemaan hyvin pitkiä, minkä vuoksi ihmisten on • · ♦ :·· ί vaikea lukea niitä. Sen vuoksi tarvitaan laajennettavaa VDL:ää, joka on kom- V*: paktimpi ja ihmisille ja tietokoneille helppolukuisempi kuin XML. : • · « 25 Laajennettavan VDL:n idea on, että sallittavat muuttujalausekkeet "· *:·*: ovat ’’vapaita mutta ei kaoottisia”. Tämä idea voidaan esittää formaalimmin sanomalla, että IMS:n tulisi sallia vain ennalta määrättyjä muuttujia, mutta en-naita määrättyjen muuttujien joukon tulisi olla laajennettavissa ilman ohjelmoin- • · · titaitoja. Esimerkiksi jos muuttujalausekkeille suoritettava syntaksintarkastus on :·. 30 kiinteästi koodattu syntaksintarkastusrutiiniin, jokainen uusi muuttujalauseke • #· vaatii uudelleenohjelmointia. Optimaalinen kompromissi tiukan järjestyksen ja * · "* kaaoksen välillä voidaan toteuttaa tallentamalla sallittavat muuttuja-avainsanat • · »
: tietorakenteeseen, kuten datatauluun tai tiedostoon, joka on muutettavissa il- J
man uudelleenohjelmointia. Normaaleja pääsynhallintatekniikoita voidaan käyt- ΐ .·* : 35 tää määrittämään, mitkä käyttäjät ovat valtuutettuja lisäämään uusia sallittavia • · · muuttuja-avainsanoja.
• · ·♦·' 9 118101
Kuvio 3A esittää muuttujalauseketta edullisella VDL:llä. Muuttujalau-seke 30 käsittää yhden tai useamman avainsana-nimiparin 31, jotka on erotettu rajoittimilla. Kuten kuvion 3A esimerkissä näytetään, kukin avainsana-nimipari 31 koostuu avainsanasta 32, avaavasta rajoittimesta (kuten avaavasta 5 hakasulusta) 33, (muuttujan) nimestä 34 ja sulkevasta rajoittimesta (kuten sulkevasta hakasulusta) 35. Esimerkiksi “Ts[2002-11-26 18:00:00]” (ilman lainausmerkkejä) on esimerkki aikaleimasta. Jos on useita avainsana-nimlpareja 31, niin parit voidaan erottaa erottimella 36, kuten välilyönnillä tai sopivalla prepositiolla. Erotin ja toinen avainsana-nimipari 31 on piirretty katkoviivoilla, 10 koska ne ovat valinnaisia. Elementtien 32 - 36 väliset &-merkit osoittavat merkkijonoyhdistämistä. Toisin sanoen &-merkit eivät sisälly muuttujankuvauk-seen.
Mitä kielen syntaksiin tulee, niin muuttujankuvaus voi käsittää mieli-valtaisen määrän avainsana-nimipareja 31. Mutta mielivaltainen parien 31 yh-15 distelmä, kuten esimerkiksi ajan konsentraatio, ei ehkä ole semanttisesti mielekäs.
Kuvio 3B esittää tyypillisten avainsanojen taulukkoa. Taulukon 38 kunkin merkinnän vieressä on sen selkokielinen kuvaus 38’ ja havainnollistava esimerkki 38”. Huomattakoon, että taulukko 38 on tallennettu IMS:ään, mutta T
20 muita taulukoita 38’ ja 38” ei välttämättä ole tallennettu (niiden tarkoitus on vain selventää taulukon 38 kunkin avainsanan merkitystä). Esimerkiksi avainsanan ”T” esimerkki on “T[-2.57E-3]’’, joka on yksi tapa ilmaista miinus 2.57 . , millisekuntia ennen referenssiaikaa. Referenssiaika voidaan osoittaa aika- * 1 2 3 · | leiman avainsanalla "Ts".
• » · 25 Avainsanat ”T” ja ”Ts” toteuttavat vastaavasti suhteellisen (sekunti- kello-) ajan ja absoluuttisen (kalenteri-) ajan. Ilmaisemalla aika suhteellisen ja ♦ absoluuttisen ajan yhdistelmänä tuo sen pienen haitan, että kullakin ajanhet- ·· « ' • V kellä on teoriassa ääretön määrä ekvivalenttisia lausekkeita. Esimerkiksi O “Ts[2002-11-26 18:00:30]" ja “Ts[2002-11-26 18:00:00]T[00:00:30]” ovat ekvi- 30 valenttisia. Niinpä on edullista olla hakulogiikka, joka prosessoi aikalausekkeet mielekkäällä tavalla.
• ·· : ,1··. Tallentamalla IMS:n taulukkoon 38 merkintä kutakin sallittavaa • · avainsanaa kohti on mahdollista pakottaa syötettäville muuttujille automaatti- ·1 ·1 nen syntaksintarkastus, kuten kuviossa 3C näytetään.
··« 35 Edullisen VDL:n syntaksi voidaan ilmaista formaalisti seuraavalla .·. : tavalla: • · · • · 1 1 • · 2 * · 3 : -4 10 118101 «muuttujan kuvaus>::=<avainsana>T<nimi>1]”{{erotin}<avamsana>T<nimi>T}<loppu> <avainsana>::=<jokin ennalta määrätty avainsana, ks. esim. taulu 38> : <nimi>::=<merkkijono> | “1” = mikä tahansa nimi relevantissa datataulussa ' l',|
Eksplisiittisten rajoittimien, kuten”[" ja ”]” nimen ympärillä, tarkoitus 5 on sallia nimessä mikä tahansa merkki, mukaanlukien välilyönnit (muttei tietenkään rajoittimia).
Eräs edullinen avainsanojen joukko 38 käsittää kolmenlaisia avainsanoja: mitä, missä ja koska. "Mitä” avainsanat, kuten muuttuja, yksikkö, biokemiallinen olio, vuorovaikutus, jne., osoittavat mitä havaittiin tai tullaan havait-10 semaan. ’’Missä” avainsanat, kuten näyte, populaatio, yksilö, paikka, jne., osoittavat missä havainto tehtiin tai tullaan tekemään. ’’Koska” avainsanat, kuten aika tai aikaleima, osoittavat havainnon aikaa.
Kuvio 3C esittää valinnaista syntaksintarkastusprosessia. Formaalin VDL:n eräs etu on, että se sallii automaattisen syntaksintarkastuksen. Kuvio 15 3C esittää tilakonetta 300 tällaisen syntaksintarkastuksen suorittamiseksi. Tilakoneet voidaan toteuttaa tietokonerutiineina. Alkutilasta 302 lähtien pätevä avainsana aiheuttaa siirtymän ensimmäiseen välitilaan 304. Mikä tahansa muu aiheuttaa siirtymän virhetilaan 312. Ensimmäisestä välitilasta 304 avaava rajoitin aiheuttaa siirtymän toiseen välitilaan 306. Mikä tahansa muu aiheuttaa siir-20 tymän virhetilaan 312.
Avaavan rajoittimen jälkeen nimen osaksi hyväksytään mitä tahansa merkkejä paitsi sulkeva rajoitin, ja tilakone pysyy toisessa välitilassa 306. Vain . ^ muuttujalausekkeen ennenaikainen päättyminen aiheuttaa siirtymän virhetilaan : 312. Sulkeva rajoitin aiheuttaa siirtymän kolmanteen välitilaan 308, jossa yksi • · · 25 avainsana/nimipari on pätevästi ilmaistu. Pätevä erotinmerkki aiheuttaa paluun ·...1 ensimmäiseen välitilaan 304. Muuttujalausekkeen lopun ilmaisu aiheuttaa siir- tymän ”OK” -tilaan 310, jossa muuttujalauseke todetaan syntaksiltaan oikeaksi.
;**.! Kuvio 4 näyttää esimerkkejä VDL-kielisistä yhdistetyistä muuttuja- lausekkeista. Yhdistetyt muuttujalausekkeet ovat lausekkeita, joissa on useita 30 avainsana/nimipareja. Huomattakoon, kuinka muuttujien spesifisyys kasvaa kun määreitä lisätään. Viitenumerot 401 - 410 osoittavat viittä ekvivalenttisten • «1 lausekkeiden paria siten, että kunkin parin ensimmäinen lauseke on monisa- * · "1 naisempi ja toinen on kompaktimpi. Tietokoneelle monisanaiset ja kompaktit • · · • 1.· lausekkeet ovat samanarvoisia, mutta niitä lukevat ihmiset saattavat pitää mo- 35 nisanaista muotoa helpommin ymmärrettävänä. Kuvion 4 lausekkeet ovat it- .·1 : sestään selviä taulukkoon 38 tehtävän viittauksen perusteella. Esimerkiksi lau- • · · • · • · · • ♦ ♦ · 118101 11
sekkeet 409 ja 410 määrittelevät reaktionopeuden vuorovaikutuksen EC
2.7.7.13-PSA1 kautta mooleina litraa ja sekuntia kohti. Viitenumero 414 osoittaa muuttujalauseketta “V[*]P[*]0[*]L[*]U[*]”. joka tarkoittaa minkä tahansa organismin minkä tahansa proteiinin mitä tahansa muuttujaa missä tahansa yk-5 siköissä. Viitenumerot 415 ja 416 osoittavat kahta erilaista muuttujalauseketta kahdelle erilaiselle ajan ilmaukselle. Muuttujalauseke 415 määrittelee kolmen tunnin aikavälin ja muuttujalauseke 417 määrittelee 10 sekunnin aikavälin (joka alkaa viisi sekuntia ennen aikaleimaa ja päättyy viisi sekuntia sen jälkeen).
Huomattakoon, että IMS:ää käyttävien ihmisten kielestä riippumatta 10 on edullista sopia yhteisestä kielestä muuttujalausekkeita varten. Vaihtoehtoisesti IMS voi käsittää käännösjärjestelmän muuttujalausekkeiden kääntämiseksi ihmisten eri kielille.
Olennaisesti yllä kuvatun kaltainen VDL on hyvin määritelty, koska vain kuviossa 3C näytetyn syntaksintarkastuksen läpäisevät lausekkeet hyväk-15 sytään. VDL on avoin, koska sallitut avainsanat talletetaan taulukkoon 38, joka on laajennettavissa. VDL on kompakti, koska avainsanoja varten käytetään olennaisesti minimimäärä kirjaimia tai merkkejä. Yleisimmät avainsanat koostuvat yhdestä kirjaimesta, tai kahdesta kirjaimesta, mikäli yhden kirjaimen ^ avainsana ei ole yksikäsitteinen.
•:il • ‘A' 20 Datakontekstit
Kuvio 5 näyttää, kuinka VDL:ää voidaan käyttää ilmaisemaan erilaisia datakonteksteja eli biologisen tutkimuksen laajuutta (scopes). Kaikki muut- • · % :·*· ' tujat, olivatpa ne sitten näytteitettyjä, mitattuja, mallinnettuja, simuloituja tai miten tahansa prosessoituja, voidaan ilmaista: • · · 25 a) yksinkertaisina arvoina biomateriaalinäytteelle jonakin ajan- *:·*: hetkenä; :*·*: b) ajan funktiona biomateriaalille; c) stokastisina muuttujina jakaumineen kunakin ajanhetkenä pe- » » · rustuen käytettävissä oleviin biomateriaalinäytteisiin; tai :·. 30 d) stokastisina prosesseina biologisessa datakontekstissa.
* ♦· a), b) ja c) ovat d:n projektioita, joka on järjestelmän rikkain esitys.
"* Kaikki IMS:ssä oleva data on kolmeulotteisessa kontekstiavaruudessa, jolla on • V relaatiot: 1. muuttujalistoihin ("mitä”); .·* . 35 2. biomateriaalin listoihin ("missä”) ja • ♦· I..* 3. aikapisteiden tai -intervallien listoihin ("milloin”).
• · · 118101 12 f;
Tfl
Viitenumero 500 osoittaa yleisesti N + 2 -ulotteista kontekstiavaruut-ta, jossa on yksi akseli kullekin muuttujalle (N), biomateriaaleille ja ajalle. Eräs b hyvin yksityiskohtainen muuttujalauseke 510 spesifioi muuttujan (mannoosin ^ konsentraatio mooleina litrassa), biomateriaalin (populaatio abcd1234) ja aika-5 leiman (10.6.2003 klo 12:30). Muuttujan arvo on 1,3 mol/l. Koska muuttujalau- ΐ seke 510 spesifioi kontekstiavaruuden kaikki koordinaatit, se esitetään pisteenä 511 kontekstiavaruudessa 500.
Seuraava muuttujalauseke 520 on vähemmän detaljoitu sikäli, että se ei spesifioi aikaa. Siksi muuttujalauseke 520 esitetään ajan funktiona 521 10 kontekstiavaruudessa 500. 3;
Kolmas muuttujalauseke 530 spesifioi ajan, mutta ei biomateriaalia.
Sen vuoksi se esitetään kaikkien niiden biomateriaalien jakaumana 531, jotka kuuluvat kokeeseen spesifioituna aikana.
Neljäs muuttujalauseke 540 ei spesifioi aikaa eikä biomateriaalia.
15 Se esitetään ajan funktioiden joukkona 541 ja eri biomateriaalien jakaumien i joukkona 542.
Muuttujankuvauskielen mahdollistamien erilaisten lausekkeiden ja sopivasti järjestettyjen (seuraavaksi selostettavien) datajoukkojen ansiosta tutkijoilla on käytännöllisesti katsoen rajattomat mahdollisuudet tutkia biologisen ,t.
20 järjestelmän aika-tila -avaruutta moniulotteisena stokastisena prosessina. Järjestelmän probabilistiset aspektit perustuvat relevanttien biomateriaalien tapahtuma-avaruuteen, ja dynaamiset aspektit perustuvat aika-avaruuteen. Biomate-. . riaalidata ja aika voidaan rekisteröidä, kun relevantit kokeet dokumentoidaan.
t · « \ Kaikki kvantitatiiviset mittaukset, data-analyysit, mallit ja simulointi- 25 tulokset voidaan käyttää uudelleen uusissa analyysitekniikoissa relevantin taustainformaation, kuten mitattujen biomateriaalien fenotyyppien, löytämisek-si, kun dataa tulee tulkita eri sovelluksiin.
·· 1 2 3 - b- • 1 · · >» • · ··.'·?.· *··1. Datajoukot * 1 1
Kuviot 6A ja 6B esittävät keksinnön edullisen suoritusmuodon mu- ··. 30 kaisia datajoukkoja. Sekä märkälaboratorio- että in-silico -tyyppiset kokeet tai- • · · lennetään datajoukkoina. Kuviossa 6A esimerkinomainen datajoukko 610 ku- T1 vaa mRNA-molekyylien joukon 610 (on näytetty mRNA1 - mRNA6) ilmentymis- • · · 2 • V tasoja. Datajoukko 610 on yksi esimerkki kuviossa 2 näytettyyn datajoukko- osioon 202 tallennetusta datajoukosta. Datajoukko 610 käsittää neljä matriisia · 35 611 - 614. Muuttuja-arvomatriisi 614 kuvaa muuttujien arvot rivi-sarake -organisaatiossa. Rivienkuvauslista 613 määrittää muuttuja-arvomatriisin rivien • · 3 118101 ' - ' 13 merkityksen. Sarakkeidenkuvauslista 612 määrittää muuttuja-arvomatriisin sarakkeiden merkityksen. Lopuksi, kiinteiden dimensioiden kuvaus 611 määrittää yhden tai useamman kiinteän dimension, jotka ovat yhteisiä muuttuja- ^ arvomatriisin 614 kaikille arvoille. Huomattakoon, että muuttuja-arvomatriisi 5 614 koostuu skalaarinumeroista. Muut matriisit 610 - 613 käyttävät VDL:ää sisältönsä merkityksen spesifioimiseen.
Kuvio 6A näyttää myös ihmisille luettavan version 615 datajoukosta 610. Huomattakoon, että datajoukon ihmisille luettava versio 615 on näytetty vain tämän suoritusmuodon parempaa ymmärtämistä varten. Ihmisille luetta-10 vaa versiota 615 ei välttämättä tallenneta mihinkään, ja se voidaan luoda data-joukosta 610 automaattisesti, koska tahansa kun tarve tähän esiintyy. Ihmisille luettava versio 615 on esimerkki datajoukoista, kuten taulukkolaskennan tie- ^ dostoista, joita tyypillisesti tallennetaan tunnetuissa IMS.issä biologista tutki-musta varten. IMS käsittää edullisesti käyttöliittymälogiikan automaattista kak- * 15 sisuuntaista muunnosta varten tallennusformaatin 611 - 614 ja ihmisille luettavan version 615 välillä.
Kuvio 6B esittää toista datajoukkoa 620. Datajoukko 620 spesifioi myös kuuden mRNA-molekyylin ilmentymistasoja, mutta nämä eivät ole kuuden eri yksilön ilmentymistasoja vaan yhden populaation ilmentymistasoja nel-20 jänä eri aikana. Datajoukossa 620 kiinteiden dimensioiden kuvaus 621 spesifioi, että data liittyy tietyn hiivan näytteeseen xyz tiettynä päivänä ja aikana. Sarakkeidenkuvauslista 622 spesifioi, että sarakkeet spesifioivat dataa neljälle " . , ajanhetkelle, nimittäin 0, 30, 60 ja 120 sekuntia kiinteiden dimensioiden kuva- • · · \ uksen 621 aikaleiman jälkeen. Rivienkuvauslista 623 on hyvin samanlainen * · · *· *: 25 kuin edellisen esimerkin vastaava lista 613, ja ainoa ero on, että viimeinen rivi • * * * osoittaa lämpötilaa eikä potilaan ikää. Muuttuja-arvomatriisi 624 sisältää todel- m liset numeroarvot.
j V Kunkin datajoukon (esimerkiksi datajoukon 610) jakaminen neljään ·.['[: eri komponenttiin (matriisit 611 - 614) voidaan toteuttaa siten, että kukin matrii- 30 si 611 - 614 on erikseen osoitettava datarakenne, kuten tiedosto tietokoneen :·.4> tiedostojärjestelmässä. Vaihtoehtoisesti muuttuja-arvomatriisi voidaan tallentaa .···. yhtenä osoitettavana datarakenteena, kun taas muut kolme matriisia (kiintei- ί • · *·] den dimensioiden kuvaus ja rivi/sarakekuvaukset) voidaan tallentaa toisena ί .* datarakenteena, kuten yhtenä tiedostona, jossa on otsakkeet ’’yhteiset”, "rivit” • * · 35 ja "sarakkeet”. Eräs avainelementti tässä on se, että muuttuja-arvomatriisi tal-letetaan erillisenä datarakenteena, koska se on datajoukon todellisia numero- • · • · · * » • · • · * 118101 14 f- arvoja sisältävä komponentti. Jos numeroarvot tallennetaan erikseen osoitettavaan datarakenteeseen, kuten tiedostoon tai taulukkoon, se voidaan helposti prosessoida erilaisilla datanprosessointisovelluksilla, kuten tiedonrikastuksella (data mining) tai vastaavilla. Toinen etu on, että eri matriiseja muodostavia eril-5 lisiä dataelementtejä ei tarvitse prosessoida SQL-kyselyillä. SQL-kysely noutaa vain datajoukon osoitteen tai muun tunnisteen mutta ei erillisiä dataelementtejä, kuten matriiseissa 611 - 614 olevia numeroita ja kuvauksia.
Polut
Kuvio 7A on IMS:ään tallennetun polun (pathway) lohkokaavio.
10 Keksinnön mukainen IMS tallentaa kunkin biologisen järjestelmän strukturoituna polkumallina 700 järjestelmän komponenteista ja komponenttien välisistä yhteyksistä (connections). Järjestelmän komponentteja ovat biokemialliset oliot 218 ja vuorovaikutukset 222. Biokemiallisten olioiden 218 ja vuorovaikutusten 222 väliset yhteydet 216 tunnistetaan itsenäisiksi objekteiksi, jotka edustavat 15 kunkin biokemiallisen olion roolia (esimerkiksi substraatti, tuote, aktivaation tai inhibiittori) kunkin polun kussakin vuorovaikutuksessa. Yhteys voi sisältää attribuutteja, jotka ovat spesifisiä kullekin biokemialliselle oliolle ja vuorovaikutus-parille (kuten stökiömetrinen kerroin). Kuten aiemmin todettiin, IMS tallentaa edullisesti paikkatietoa, ja kukin polku 212 liittyy bioloogiseen paikkaan 214.
20 Yksi biologinen paikka voidaan kuvata yhdellä tai useammalla polulla riippuen polkuun sisällytettyjen detaljien tasosta.
Objektipohjaisessa toteutuksessa biokemiallinen polkumalli perus- : tuu kolmeen objektikategoriaan: biokemialliset oliot (molekyylit) 218, vuorovai- • · :.1 i kutukset (kemialliset reaktiot, transkriptio, translaatio, kokoonpano, hajottami- 25 nen, translokaatio, jne.) 222 sekä polun biokemiallisten olioiden ja vuorovaiku- ·:1·: tusten väliset yhteydet 216. Ajatuksena on erottaa nämä kolme objektia niiden ·1·1: käyttämiseksi omine attribuutteineen ja käyttää yhteyttä sisältämään kunkin * 1 .2·. biokemiallisen olion rooli (kuten substraatti, tuote, aktivaation tai inhibiittori) ja stökiömetriset kertoimet kussakin vuorovaikutuksessa, joka tapahtuu tietyssä j.§ 30 biokemiallisessa verkossa. Tämän lähestymistavan etuna on eksplisiittisen *... mallin selkeys ja helppo synkronointi, kun useat käyttäjät modifioivat samaa • · *·"1 polkua yhteys kerrallaan. Käyttöliittymälogiikka voidaan suunnitella tarjoamaan polkujen helposti ymmärrettäviä visualisointeja, kuten kuvion 8 yhteydessä tul-laan esittämään.
• · · • ♦ ··♦' ··♦-• · » 2 • · »·· 118101 15
Kineettisten lakien osio 224 kuvaa vuorovaikutuksiin vaikuttavat teoreettiset tai kokeelliset kineettiset lait. Esimerkiksi vuo substraatista kemialliseen reaktioon voidaan ilmaista seuraavalla kaavalla: . > V max-[s]· [e] K + [s] 5 missä V on substraatin virtausnopeus, Vmax ja K ovat vakioita, [5] on alustan konsentraatio ja [£] on entsyymin konsentraatio. Reaktionopeus vuorovaikutuksen läpi voidaan laskea jakamalla vuo substraatin stökiömetrisellä kertoimella. ;
Biokemiallinen verkko ei välttämättä päde kaikkialla. Toisin sanoen 10 verkko on tyypillisesti paikkasidonnainen. Sen vuoksi polkujen 212 ja biologi- " sesti relevanttien diskreettien paikkojen välillä on relaatioita, kuten kuvioissa 1 ja 7A näytetään.
Monimutkainen polku voi sisältää muita polkuja 700. Eri polkujen 'f 700 yhdistämiseksi malli tukee polkuyhteyksiä 702, joista kullakin on viisi relaa-15 tiota, jotka selostetaan kuvion 7B yhteydessä.
Kuvio 7B näyttää esimerkin monimutkaisesta polusta, joka sisältää > yksinkertaisempia polkuja. Kaksi tai useampia polkuja voidaan yhdistää, jos niillä on yhteisiä biokemiallisia olioita, jotka voivat siirtyä sellaisinaan relevanttien paikkojen tai yhteisten vuorovaikutusten välillä (esimerkiksi translokaatio-20 tyyppinen vuorovaikutus, joka siirtää biokemiallisia olioita paikasta toiseen).
Muussa tapauksessa polkuja pidetään erillisinä.
: Viitenumeron 711 osoittama polku A on pääpolku poluille B ja C, joi- » * · j ta osoitetaan vastaavasti viitenumeroilla 712 ja 713. Polut 711 - 713 ovat peri- • *· I..* aatteessa samanlaisia kuin yllä selostettu polku 700. Kaksi polkuyhteyttä 720 ***·. 25 ja 730 kytkevät polut B ja C, 712 ja 713, pääpolkuun A, 711. Esimerkiksi pol- ? * kuyhteydellä 720 on pääpolkurelaatio 721 polkuun A, 711; ’’polusta” relaatio : *·* 722 polkuun B, 712; ja ’’polkuun” relaatio 723 polkuun C, 713. Lisäksi sillä on ’’yhteinen olio”-relaatiot 724, 725 polkuihin B, 712 ja C, 713. Selväkielellä’’yhteinen olio” -relaatiot 724, 725 tarkoittavat, että polut B ja C jakavat relaatioiden 30 724 ja 725 osoittaman biologisen olion.
:1: Toisella polkuyhteydellä 730 on sekä ’’pääpolku” että ’’polusta" • · · -relaatiot polkuun A, 711 ja ’’polkuun” -relaatio polkuun C, 713. Lisäksi sillä on ’’yhteinen vuorovaikutus” -relaatiot 734, 735 polkuihin B, 712 ja C, 713. Tämä • · *·;** tarkoittaa, että polut B ja C jakavat relaatioiden 734 relaatioiden 734 ja 735 i 35 osoittaman vuorovaikutuksen.
* · • · · • · • · • * · 118101 16
Yllä selostettu polkumalli tukee epätäydellisiä malleja, jotka voidaan rakentaa vaiheittain tietämyksen lisääntyessä. Tutkijat voivat valita detaljitason tarpeen vaatiessa. Jotkut polut voidaan kuvata suhteellisen karkealla tavalla.
Muut polut voidaan kuvata aina kineettisiin lakeihin ja/tai spatiaalisiin koordi- i 5 naatteihin asti. Malli tukee myös epätäydellistä informaatiota olemassa olevista sekvenssitietokannoista. Esimerkiksi jotkut polkukuvaukset voivat selostaa geenin transkription ja translaation erikseen, kun taas muut käsittelevät niitä yhtenä yhdistettynä vuorovaikutuksena. Kutakin aminohappoa voidaan käsitellä erikseen, tai kaikki aminohapot voidaan yhdistää yhteen olioon nimeltä ami-10 nohapot.
Polkumalli tukee myös automaattisia mallinnusprosesseja. Solmu-yhtälöitä voidaan muodostaa automaattisesti kunkin biokemiallisen olion aikaderivaatoille, kun relevantit kineettiset lait ovat käytettävissä kullekin vuorovai- ·* kutukselle. Erityistapauksessa stökiömetrisiä taseyhtälöitä voidaan muodostaa 15 automaattisesti vuotaseanalyysejä varten. Polkumalli tukee myös automaatti- ...
siä päästä-päähän-työvirtoja, mukaanlukien mittausdatan erottaminen mallintamalla, ylimääräisten rajoitteiden mukaanotto ja yhtälöryhmien ratkaisu, aina erilaisiin data-analyyseihin ja potentiaalisiin automaattisiin merkintöihin asti.
Automaattinen polkumallinnus voi perustua polun topologiatietoihin, 20 muuttujanimien kuvaamiseen käytettäviin VDL-lausekkeisiin, sovellettaviin ki- * neettisiin lakeihin (kuten stökiömetrisiin kertoimiin) ja matemaattisiin tai loogisiin operaattoreihin ja funktioihin. Parametrit, joita ei tunneta tarkasti, voidaan , , estimoida tai päätellä mittausdatasta. Oletusyksiköitä voidaan käyttää yksin- • · · | kertaistamaan muuttujankuvauskielisiä lausekkeita. Esimerkiksi: • * · • · · 25 dV[concentration]C[mannose]/dV[time] = V[flux]C[mannose]l[EC 2.7.7.13_PSA1] + ...
***** - V[flux]C[manno$e]l[ EC... ]-...
• « ·· · • · f • ·* dV[concentration ]C[water]/dV[time] = V[flux]C[water]l[EC... ] + ...
:...* - V[flux]C[water]l[EC... ]-...
30 Tässä yhtälössä biokemialliset oliospesifiset vuot voidaan korvata j**.. reaktionopeuksilla, jotka on kerrottu stökiömetrisillä kertoimilla. Tässä esimer- kissä stökiömetriset kertoimet ovat ykkösiä, esimerkiksi: • * · ^
Yhtälöt voidaan kirjoittaa seuraavasti: ‘..I dV[concentration ]C[mannose]/dV[time] = 1*V[reaction rate]l[EC 2.7.7.13_PSA1] + ...
• · *;** 35 - 1*V[rection rate]l[ EC... ]·...
* * • · · ··· • · 1 • · i • · *·« 17 118101 dVJconcentration ]C[water]/dV[time] = rV[reaction rate]l[EC... ] + ,,.
• 1*V[reaction rate]l[ EC... ]-...
i
Staattisessa tapauksessa derivaatat ovat nollia. Tämä johtaa vuo-tasemalliin: 5 0 = rV[reaction rate]l[EC 2.7.7.13_PSA1] + ,,, 1*V[rection rate]l[ EC ... ]-,,, 0 = rV[reaction rate]l[EC... ] + ... . ' •1* V[reaction rate]l[ EC ...
10 Käyttäjä voi tuottaa omat tavoitefunktionsa ja ylimääräiset reunaeh tonsa tai mittaustuloksensa, jotka rajoittavat mahdollisten ratkaisujen joukkoa.
Vielä eräs edullinen piirre on kyky mallintaa kohinaa vuotaseanalyy-sissä. Voimme lisätä keinotekoisia kohinamuuttujia, jotka tulee minimoida ta-voitefunktiossa. Tämä helpottaa epätarkkojen mittausten hyväksymistä koh-15 tuullisin tuloksin.
Malli tukee myös visuaalisten polkuratkaisujen (aktiivisten reunaehtojen) visualisointia. Yleinen tapaus johtaa tavallisten differentiaaliyhtälöiden (ordinary differential equations, ODE) malliin, jossa tarvitaan kineettisiä lakeja.
Niitä voidaan kerätä tietokantaan, mutta voi olla joitakin oletuslakeja, joita käy-20 tetään tarvittaessa. Yleisissä yhtälöissä vuorovaikutuskohtaiset reaktionopeudet korvataan kineettisillä laeilla, kuten Michaels-Menten -laeilla, jotka sisältävät entsyymien ja substraattien konsentraatioita. Esimerkiksi: f t Vfreaction rate]l[EC 2.7.7.13_PSA1] = 5.2*V[concentration]P[PSA1]*V[concentration]C[...]/(3.4 V[concentration]C[...]) Π • · · • · * T t Yhtälöt voidaan muuntaa muotoon: • * * • · · !.,* 25 dV[concentration ]C[mannose]/dV[time] = 5.2*V[concentration]P[PSA1]*V[concentration]C[...]/( 3.4 + • * ***, V[concentration]C[...]) + ... . * • · · · · ^ -7.9*V[concentration]P[... ]*V[concentration]C[...]/(...) • · * • * • « ,,, j * ·· dV[concentration ]C[water]/dV(time] = 10.0*V[concentration] P[...]*V[concentration]C[...] /(...) + ... * 30 -8.6*V[concentration ]P[...]*V[concentration]C[.....
·» j '* On vaihtoehtoisia toteutuksia. Esimerkiksi yllä tehdyn sijoituksen asemasta voidaan laskea kineettiset lait erikseen ja sijoittaa numeroarvot spe-sifisiin reaktionopeuksiin iteratiivisesti.
• · .···. Tällaisen rakenteellisen polkumallin etuna on, että hierarkkisia pol- 35 kuja voidaan tulkita tietokoneilla. Esimerkiksi käyttöliittymälogiikka voi kyetä • · · « · · « · • * « • · • · • · 118101 18 tuottamaan hierarkkisten polkujen helposti ymmärrettäviä visualisointeja, kuten kuvion 8 yhteydessä näytetään. - ^
Kuvio 8 näyttää polun visualisoitua muotoa, jota yleisesti osoitetaan !; viitenumerolla 800. Käyttöliittymälogiikka piirtää visualisoidun polun 800 kuvi-5 oissa 1 ja 7 A näytettyjen elementtien 212 - 224 perusteella. Ympyrät 810 esittävät biokemiallisia olioita. Laatikot 820 esittävät vuorovaikutuksia ja reunat 830 esittävät yhteyksiä. Yhtenäiset nuolet 840 biokemiallisesta oliosta vuoro- ; vaikutukseen esittävät substraattiyhteyksiä, missä vuorovaikutus kuluttaa biokemiallista oliota. Yhtenäiset nuolet 850 vuorovaikutuksesta biokemialliseen 10 olioon esittävät tuotosyhteyttä, missä vuorovaikutus tuottaa biokemiallista oliota. Katkoviivoin esitetyt nuolet 860 esittävät aktivaatioita, missä biokemiallista oliota ei kuluteta eikä tuoteta, mutta se tekee vuorovaikutuksen mahdolliseksi tai kiihdyttää sitä. Katkoviivat 870, joilla on poikittaisviivapäät, esittävät | inhibitiota, missä biokemiallista oliota ei kuluteta eikä tuoteta, mutta se estää * 15 vuorovaikutuksen tai hidastaa sitä. Nollasta poikkeavat stökiömetriset kertoimet assosioidaan substraatti- tai tuotosyhteyksiin 840, 850. Säätöyhteyksissä (esim. aktivaatio 860 tai inhibitio 870) stökiömetriset kertoimet ovat nollia.
Lisäksi biokemiallisten olioiden mitattuja tai säädettyjä muuttujia voidaan visualisoida ja paikantaa. Esimerkiksi viitenumero 881 osoittaa bioke-20 miallisen olion konsentraatiota, viitenumero 882 osoittaa vuorovaikutuksen reaktionopeutta ja viitenumero 883 osoittaa yhteyden virtausta (flux). ~
Yhteyksien tarkat roolit, vuorovaikutuksiin assosioidut kineettiset lait ja kunkin polun biologisesti relevantti paikka tuovat parannuksia tunnettuihin : polkumalleihin nähden, esimerkiksi kuvioissa 7A - 8 näytetty malli tukee kuva- • · V*: 25 uksia vaihtelevilla detaljitasoilla vaihtelemalla elementtien määrää. Lisäksi malli ··· Σ...Σ tukee eksplisiittisten kineettisten lakien sisällyttämistä, mikäli niitä tunnetaan.
·:·*: Tämä tekniikka tukee myös mittaustulosten graafista esittämistä näytetyillä poluilla. Mitatut muuttujat voidaan korreloida graafisen polkuesityk- e * · .·**. sen detaljeihin objektien nimien perusteella.
» · · 30 Huomattakoon, että viitenumeroilla 200 ja 700 (kuvioissa 2 ja 7A) :·. näytetty tietokantastruktuuri tarjoaa välineet tallentaa biologisen polun topolo- * · · giaa mutta ei sen visualisointia 800. Visualisointi voidaan generoida topologi-asta ja tallentaa myöhemmin, seuraavalla tavalla. Visualisoinnin 800 elementin • · · • ja keskinäiset yhteydet perustuvat suoraan tallennettuihin polkuihin 700. Näy-35 tettyjen elementtien paikat voidaan aluksi valita ohjelmistorutiinilla, joka optimoi .·* : jonkin ennalta määrätyn kriteerin, kuten toistensa ylittävien yhteyksien määrän.
• »I • · • · · • · *·· 19 118101 Tällaisia tekniikoita tunnetaan piirilevyjen suunnittelusta. IMS voi tarjota käyttäjälle graafisia työkaluja visualisoinnin siistimiseksi käsin. Kunkin elementin sijoitus käsin editoidussa versiossa voidaan sitten tallentaa erilliseen datarakenteeseen, kuten tiedostoon.
5 Kokeet IMS käsittää edullisesti kokeiden projektinhallinnan. Projekti käsittää yhden tai useamman kokeen, kuten näytteenoton, käsittelyn, ohjauksen (perturbation), ruokkimisen, viljelyn, manipuloinnin, puhdistamisen, kloonaamisen tai muunlaisen yhdistämisen, erottamisen, mittauksen, luokittamisen, doku-10 mentoinnin tai in-silico -työvirran.
Kokeiden projektinhallinnan etuna on, että kaikki mittaustulokset tai kontrolloidut olosuhteet tai ohjaukset ("mitä”), biomateriaalit ja paikat niissä ("missä”), sekä relevanttien kokeiden ajoitus ("koska”) ja menetelmät ("kuinka”) voidaan rekisteröidä koedatan tulkitsemista varten. Toinen etu tulee mahdolli-15 suudesta hyödyntää muuttujankuvauskieltä koedatan tallentamisessa, kuten aiemmin selostettiin.
Kuvio 9 esittää koe-oliota IMS:n koeosiossa. Kukin IMS:ään tallennettu projekti 902 käsittää yhden tai useamman kokeen 904. Kullakin kokeella 904 on relaatiot laitteistodataan 906, käyttäjädataan 908 ja metodidataan 910.
20 Kukin metodiolio 910 liittyy koeottoon 914 ja koeantoon 920. Koeotto 914 kytkee relevantin oton, kuten biomateriaalin 916 (esimerkiksi populaation, yksilön, reagentin tai näytteen) tai dataolion 918 (esimerkiksi kontrolloidut olosuhteet) : kokeeseen yhdessä relevantin aikainformaation kanssa.
Kokeen anto 920 kytkee relevantin annon, kuten biomateriaalin 922 * · . i' .***; 25 (esimerkiksi populaation, yksilön, reagentin tai näytteen) tai dataolion 924 »«1 (esimerkiksi mittaustulokset, dokumentit, luokitustulokset tai muut tulokset) kokeeseen yhdessä relevantin aikainformaation kanssa. Esimerkiksi jos otto • ♦ \.I käsittää biomateriaalin spesifisen näytteen, koe voi tuottaa erinumeroisen näyt- **'1’ teen samasta organismista. Lisäksi koeotto 920 voi käsittää tuloksia erilaisten 30 dataolioiden muodossa (kuten kuvioissa 6A ja 6B näytetyt datajoukot tai do- *· 1’ kumentit tai taulukkolaskentatiedostot). Koeanto 920 voi käsittää myös feno- • · 1 tyyppiluokittelun ja/tai genotyyppiluokittelun dataolioissa.
Kokeella on myös kohde 930, joka on tyypillisesti biomateriaali 932 *···. (esimerkiksi populaatio, yksilö, reagentti tai näyte), mutta in-silico -kokeiden • · *·1 35 kohde voi olla dataolio 934.
♦ · ♦ · · • ·· • · • / « • 1 t ♦ · 118101 ,.
20
Menetelmäoliolla 910 on relaatio menetelmäkuvaukseen 912, joka kuvaa menetelmän. Menetelmäkuvauksen 912 vieressä oleva silmukka tarkoittaa, että yksi menetelmäkuvaus voi viitata toisiin menetelmäkuvauksiin.
Kokeen otto 914 ja kokeen anto 920 ovat joko spesifisiä biomateri-5 aaleja 916, 922 tai dataolioita 918, 924, jotka ovat samoja dataelementtejä kuin vastaavat elementit kuviossa 2. Jos koe on märkälaboratoriokoe, otto- ja antobiomateriaalit 916, 922 ovat kuvion 2 biomateriaalin 210 kaksi (samaa tai eri) instanssia. Ne voivat esimerkiksi olla kaksi spesifistä näytettä 210-4.
Koska biokemiallinen informaatio (viitenumero 200 kuviossa 2) ja 10 projektin informaatio kuvataan yhteisillä dataolioilla, projektihallitsija pystyy seuraamaan kunkin informaatioelementin historiaa. Se pystyy myös monitoroimaan tuottavuutta lisättynä informaatiomääränä resurssia (kuten henkilövuotta) kohti.
Koeprojektinhallitsija käsittää edullisesti projektieditorin, jolla on i1 15 käyttöliittymä, joka tukee projektinhallinnan toiminnallisuutta projektin aktiviteettejä varten. Tämä antaa lisäksi kaikki ne normaalin projektinhallinnan edut, jotka ovat hyödyksi myös järjestelmäbiologian projekteissa.
Projektieditorin edullinen toteutus pystyy seuraamaan kaikkia biomateriaaleja, niiden näytteitä ja kaikkea dataa eri kokeiden kautta, mukaanlu-20 kien märkälaboratorio-operaatiot ja in-silico-datankäsittelyn.
Koeprojekti voidaan esittää verkkona, joka koostuu koeaktiviteeteis-ta, kohdebiomateriaaleista ja otto-tai antotuotoksista, jotka ovat biomateriaaleja tai dataolioita.
• · 1 : Monimutkaisuuden suhteen kuvio 9 on pahimman tapauksen kaa- • · 25 vio. Harvat, jos mitkään tosielämän kokeet käsittävät kaikki kuviossa 9 näytetyt elementit. Esimerkiksi jos koe on lääketieteellinen tai biologinen käsittely, niin *:2: otto- ja anto-osiot 914, 920 osoittavat tyypillisesti tietyn potilaan tai biologisen ·1·'; näytteen. Valinnainen tilaelementti voi kuvata potilaan tai näytteen tilan ennen • · .3. käsittelyä. Anto-osa on käsitelty potilas tai näyte.
30 Näytteenoton tapauksessa otto-osa osoittaa biomateriaalin, johon .. näytteenotto kohdistuu, ja anto-osa osoittaa spesifisen näytteen. Näytteen *... manipuloinnin tapauksessa otto-osa osoittaa manipuloitavan näytteen, ja anto- • · *·;·’ osa osoittaa manipuloidun näytteen. Kombinaatiokokeessa otto-osa osoittaa useita kombinoitavia näytteitä ja anto-osa osoittaa kombinoidun, identifioidun 35 näytteen. Kääntäen, separaatiokokeessa otto-osa osoittaa separoitavan näyt- • · · e··'1.. ...
2 4 4 • 1 1 4 4 4 4 3 *4· 118101 21 teen ja anto-osa osoittaa useita separoituja, identifioituja näytteitä. Mittausko-keessa otto-osa osoittaa mitattavan näytteen, ja anto-osa on dataolio, joka sisältää mittaustulokset. Luokituskokeessa otto-osa osoittaa luokitettavan näytteen, ja anto-osa osoittaa fenotyypin ja/tai genotyypin. Viljelykokeessa otto- ja 5 anto-osat osoittavat spesifisiä populaatioita, ja laiteosa voi käsittää viljelyasti-oiden tunnisteet.
Monimutkaisten kokeiden kuvaamiseksi voi olla koesidontoja (binders, ei näytetty erikseen), jotka yhdistävät useita kokeita tavalla, joka on jossakin määrin analoginen tapaan, jolla polkuyhteydet 700, 720, 730 yhdistävät eri 10 polkuja.
Biomateriaalikuvaukset
Kuvio 10 näyttää esimerkin IMS:n biomateriaaliosion objektipohjaisesta toteutuksesta. Tulee huomata, että tämä on vain yksi esimerkki, ja monet T
biomateriaalit voidaan kuvata riittävästi ilman kaikkia kuviossa 10 näytettyjä 15 elementtejä. Biomateriaaliosio 210 alaelementteineen 210-1 ... 210-4 ja paik-kaosio 214 alaelementteineen 214-1 ... 214-5 on lyhyesti selostettu kuvion 2 yhteydessä. Kuvio 10 näyttää, että biomateriaalilla 210 voi olla monesta moneen -relaatio tilaelementtiin 1002, fenotyyppielementtiin 1004 ja dataolioele- -s menttiin 1006. Valinnaista organismisidontaa 1008 voidaan käyttää yhdistä-20 mään (sekoittamaan) eri organismeja. Esimerkiksi organismisidonta 1008 voi osoittaa, että tietty populaatio käsittää x prosenttia organismia 1 ja y prosenttia organismia 2.
• · : Organismielementin 214-1 alapuolinen silmukka 1010 tarkoittaa, et- tä organismi kuvataan edullisesti taksonomisena kuvauksena. Kuvion 10 ala- :***: 25 puoli näyttää kaksi esimerkkiä tällaisesta taksonomisesta kuvauksesta. Esi- • · * merkki 1010A on kolibakteerin erään spesifisen näytteen taksonominen kuva-us. Esimerkki 1010B on valkoapilan taksonominen kuvaus.
]*··. Kuvioiden 3A - 3C yhteydessä selostettua muuttujankuvauskieltä i · voidaan käyttää kuvaamaan tällaisiin biomateriaaleihin ja/tai niiden paikkoihin .. 30 liittyviä muuttujia. Esimerkki: 4 · • · * -b '.··, V[concentration]P[P53]U[mol/l]ld[Patient X]L[human • 4 * 4 4 ;·[·, Eräs tällaisen paikkatiedon etu on parannettu ja systemaattinen ta- • 4 *..! pa verrata paikkoja näytteissä ja teoreettisissa rakenteissa, kuten poluissa, **;·* jotka joudutaan varmentamaan relevanteilla mittaustuloksilla.
• · · ' · · * 4 * •4 4 4 4 4 " 444 118101 22
Toinen etu, joka saavutetaan tallentamalla biomateriaaliosio olen- ^ naisesti kuviossa 10 näytetyllä tavalla, liittyy datan visualisointiin. Esimerkiksi ,..¾ biomateriaalit voidaan korvata niiden fenotyypeillä. Eräs esimerkki tällaisesta korvaamisesta on, että tietyt yksilöt luokitellaan ’’allergisiksi”, mikä on ihmisille 5 paljon havainnollisempi kuin pelkkä tunniste.
Datan seurattavuus
Kuviot 11A ja 11B osoittavat datan seurattavuutta kahden esimerkin valossa. Kuvio 11A esittää näytteenottotapahtumaa. Kaikki näytteet saadaan tietystä yksilöstä A, jota osoitetaan viitenumerolla 1102. Viitenumero 1104 10 osoittaa yleisesti neljää nuolta, joista kukin osoittaa näytteenottoa tietyllä hetkellä. Esimerkiksi hetkellä 5 saadaan näyte 4, kuten viitenumero 1106 osoittaa.
Kuvioiden 3A - 4 yhteydessä käytettyä muuttujankuvauskieltä käyttäen näyte 4 hetkellä 5 voidaan ilmaista lausekkeella Sa[4]T[5]. Lauseke Sa[4]T[5] -ld[A]T[5] tarkoittaa, että näyte 4 saatiin yksilöstä A hetkellä 5.
15 Hetkellä 12 näytteestä 4 otetaan kaksi muuta näytettä. Kuten nuoli 1108 osoittaa, näyte 25 otetaan näytteestä 4 erottamalla tumat. Viitenumero 1112 osoittaa näytteen 25 havaintoa (mittausta), nimittäin proteiinin P53 kon-sentraatiota, jonka tässä esimerkissä näytetään olevan 4,95.
Kuvio 11B esittää datan seurattavuutta tapahtumaketjussa, jossa to-20 teutetaan ohjaus annostelemalla yksilölle B 1150 tiettyä yhdistettä. Kuten viitenumerot 1152 - 1158 osoittavat, 10 gramman annos yhdistettä abcd annetaan näytteelle 40 hetkellä 1, ja tuo näyte annetaan yksilölle B hetkellä 6. Viitenu- : • · ·
:.· · mero 1160 osoittaa mannoosin annostelua yksilölle B hetkellä 5. Kuvion 11B
alapuoli on analoginen kuvion 11A kanssa, ja erillinen selostus jää pois.
25 Näyttämällä sellaisia kuvia, joita sisältyy kuvioihin 11A ja 11B, aute- ···♦· taan käyttäjiä ymmärtämään, mihin havainnot perustuvat. Parannetun datan seurattavuuden etuihin kuuluu virheiden väheneminen ja anomalioiden hei- 2 ,···. pompi selittäminen. , ^ • ·
Tulisi ymmärtää, että tosielämän tapaukset voivat olla paljon moni-.. 30 mutkaisempia kuin mitä yhdellä piirrossivulla voidaan kohtuudella esittää. Ku- φ « ·..]* viot 11A ja 11B esittävät siis vain datan seurattavuuden periaatetta. Monimut- « · *···* kaisten tapausten tukemiseksi visualisointilogiikan edellä tulisi olla käyttäjän aktivoimia suotimia, jotka sallivat käyttäjien nähdä vain mielenkiinnon kohteita. ? ;***· Jos esimerkiksi käyttäjä on kiinnostunut vain kuviossa 11A näytetystä näyt- .* . 35 teestä 25, niin voidaan näyttää vain tapahtumien (näytteiden) ketju 1102 - 5 Y/j 1106-1110-1112.
«t • · 118101 23 :^1
Työvirtojen kuvaukset
Kuvio 12A näyttää ohjelmisto-komponenttimallia työvirtojen (work- f· flow) kuvaamiseksi ja hallitsemiseksi IMS:ssä. Työvirta 1202 voi sisältää toisia työvirtoja. Alimman tason työvirta sisältää työkalun 1208. Kullakin työvirralla on : 5 omistaja-käyttäjä 1220. Kukin työvirta kuuluu johonkin projektiin 1218. (Projekteja tarkasteltiin kuvion 9 yhteydessä.)
Työkalut määrittelytermejä ovat työkalun nimi, kategoria, kuvaus, lähde, aluke (pre-tag), suoritusosa (executable), otot, annot ja palveluobjektin luokka (mikäli ei oletusarvo). Tämä informaatio talletetaan työkalutietokantaan 10 1208.
Ottomäärityksiin sisältyy aluke, tunnistenumero, kuvaus, dataolio-tyyppi, lopuke (post-tag), komentorivijärjestys, valinnaisuus-status (pakollinen vai valinnainen). Tämä informaatio talletetaan työkalun ottosidontaan (input binder) 1210 tai työkalun antosidontaan (output binder) 1212.
15 Dataoliotyypit määritellään järjestelmään termeillä dataoliotyypin nimi, kuvaus, datakategoria (esim. tiedosto, hakemisto alihakemistoineen ja tiedostoineen, datajoukko, tietokanta, jne.) On useita dataoliotyyppejä, jotka kuuluvat samaan kategoriaan mutta joilla on erilainen syntaksi tai semantiikka % ja jotka sen vuoksi kuuluvat eri dataoliotyyppiin olemassa olevien työkalujen 20 yhteensopivuussääntöjen vuoksi. Tämä informaatio talletetaan dataoliotyyppiin 4, 1214. Työkalupalvelimen sidonta 1224 osoittaa sen palvelimen 1222, jossa työkalu voidaan suorittaa.
. Tyypitettyjä dataolioita käytetään ohjaamaan erilaisten työkalujen "1 \ yhteensopivuutta, jotka voivat olla tai olla olematta yhteensopivia. Tämä antaa • » · 25 mahdollisuuden kehittää käyttöliittymän, jossa järjestelmä avustaa käyttäjiä • · *···1 luomaan järkeviä työvirtoja ilman etukäteistietoa kunkin työkalun yksityiskoh- · dista.
• · · • Dataolioinstanssit, jotka sisältävät käyttäjädataa, tallennetaan data-olioon 1216. Kun työvirtoja rakennetaan, relevantit dataoliot kytketään rele- 30 vantteihin työkaluottoihin työvirran ottojen 1204 tai työvirran antojen 1206 kaut-ta.
• 1 · « .···. Kuvio 12B esittää asiakas-palvelin -arkkitehtuuria, johon kuuluu asiakaspäätelaitteessa CT suoritettava graafinen työvirtojen editori 1230. | : ·1 Graafinen työvirtojen editori 1230 kytkeytyy työvirtapalvelimen 1232 kautta • · · 35 suoritushallitsijan (executor) palveluobjektiin työkalupalvelimessa 1234. Graa-fista työvirtojen editoria 1230 käytetään valmistelemaan, suorittamaan ja moni- • · ·«· • » • · 118101 24 £' toroimaan sekä tarkastelemaan työvirtoja ja dataolioita, jotka viestivät työvirta-tietokannan 1236 kanssa. Työvirtapalvelin 1232 huolehtii työvirtojen suorittamisesta käyttämällä yhtä tai useampaa työkalupalvelinta 1234. Relevantin työ-kalupalvelimen osoite voidaan löytää palvelintaulukosta (kuvio 12A).
5 Kukin työkalupalvelin 1234 käsittää suoritushallitsijan ja palveluob- jektin, joka pystyy kutsumaan mitä tahansa itsenäistä työkalua, joka on asennettu työkalupalvelimelle. Suoritushallitsija hallitsee työvirran kaikkien relevanttien työkalujen suorittamista relevanteilla dataolioilla standardoidun palveluob-jektin kautta. Palveluobjekti tarjoaa suoritushallitsijalle yhteisen rajapinnan 10 minkä tahansa itsenäisen ohjelmistotyökalun suorittamiseksi. Työkalukohtaista informaatiota voidaan kuvata XML-tiedostossa, jota käytetään alustamaan metadataa kullekin työkalulle työkalutietokannassa (kuvion 12A kohta 1208). Palveluobjekti vastaanottaa anto- ja ottodatan, ja käyttämällä työkalun määritysin- * formaatiota, se voi valmistella vaaditun komentorivin työkalun suorittamiseksi.
15 Kuvioissa 12A ja 12B näytetty työvirtojen/työkalujen hallitsija integroi helposti perinteisiä työkaluja ja kolmansien osapuolten työkaluja. Työvirtojen/työkalujen hallitsijan muihin etuihin kuuluu työvirtojen täydellinen dokumentointi, helppo uudelleenkäytettävyys ja automaattinen suoritus. Esimerkiksi työvirtojen/työkalujen hallitsija voi piilottaa kolmansien osapuolten työkalujen val-20 mistajakohtaiset käyttöliittymät ja korvata ne IMS:n yhteisellä graafisella käyttöliittymällä. Käyttäjät voivat siis käyttää yhteisen graafisen käyttöliittymän toimintoja valmistelemaan, suorittamaan ja monitoroimaan sekä tarkastelemaan työ- • ' virtoja ja niiden dataolioita.
Ϊφ* * | Kuvio 12C näyttää, kuinka työvirtaeditori voi esittää työvirrat työkalu-
I II
I..* 25 jen ja dataolioiden verkkona siten, että dataoliot ovat työkalujen ottoja ja anto- j · *··[ ja. Työkalut suoritetaan työvirtojen topologisen lajittelun perusteella.
····· ^ ‘ Nämä työvirrat ovat erittäin hyödyllisiä monimutkaisiin tehtäviin, jot- : V ka on toistettava uudelleen hieman erilaisin syöttein.
• · ·
Polkujen automaattinen täyttäminen sekvenssitietokannasta !\ 30 IMS, jossa on olennaisesti sellainen polkumalli, joka selostettiin ku- .***, vioiden 7A - 8 yhteydessä, tukee epätäydellisiä polkuja. Näin siksi, että polut • · määritellään alkeiskomponenttien kautta, joita voidaan lisätä kun uutta tietoa : V saadaan. Tämän ominaisuuden eräs etu on, että IMS voidaan varustaa laitteis- • k · to- ja ohjelmistovälineillä polkujen automaattista täyttämistä varten ulkoisista : 35 (usein kaupallisista) sekvenssitietokannoista. Tähän tarvitaan yhteysvälineet v" • #♦ .·*.[ ulkoisiin tietokantoihin, jäsennyslogiikka kutakin tiettyä tietokantaa varten sekä • *
Ml 118101 25 logiikka polun komponenttien (tai ainakin joidenkin) johtamiseksi ulkoisten tietokantojen ominaisuustaulukoista (feature table) tai muusta informaatiosta. \
Huomattakoon, että sekvenssitietokannat eivät tuota mitään eksplisiittistä informaatiota polkumalleista. Ne tuottavat vain informaatiota geeneistä ja niiden 5 koodaamista proteiineista. Mutta sopiva logiikka voi päätellä ainakin jotkut pol-kukomponentit tästä informaatiosta. Logiikka voi tulkita joidenkin sekvenssitie-tokantojen tuottamat annotaatiot valtavaksi relaatiomassaksi hyvin määriteltyjen biokemiallisten olioiden avulla (spesifinen geeni ja spesifinen joukko proteiineja) heti, kun nämä relaatiot - joista sekvenssitietokannat eivät kerro ekspli-10 siittisesti mitään - on talletettu polkutietokantaan (kuviot 7 A ja 7B). Interaktioita (transkriptioita ja translaatioita), joista sekvenssitietokannat eivät myöskään kerro mitään, ei voida täydellisesti kuvata biologista perustietämystä käyttämällä, mutta hyvin määriteltyjen biokemiallisten olioiden ja biologisten peruskäsit- - L.
teiden avulla interaktioiden väliset yhteydet voidaan kuvata täydellisesti polku-15 mallissa. Ei edes ole välttämätöntä, että sekvenssitietokanta sisältää informaatiota transkripteista. Sen sijaan keksinnöllinen logiikka voi määrittää transkriptit, identifioida ja nimetä ne. Nimeäminen on usein välttämätöntä, koska mRNA-molekyylejä ei usein nimetä niin kuin geenejä tai proteiineja.
IMS, jossa on yllä selostettu polkumalli, perustuu siis yhteyksiin ja 20 interaktioihin, ja IMS tukee epätäydellisiä polkumalleja. On hyödyllinen lisäys määrittää yhteydet automaattisesti ulkoisista tietokannoista, vaikka interaktioita pitääkin täydentää jälkikäteen, kun lisätietoa on saatavana.
Kuvio 13 esittää prosessia, kuten ohjelmistorutiinia, polkujen auto- : maattista täyttämistä varten sekvenssitietokannasta. Tässä esimerkissä sek- ♦ · 25 venssitietokannassa on kaksi identifioitua geeniä G1 ja G2, joita osoitetaan ··· ϊ.,.ϊ viitenumeroilla 1302 ja 1308. Tietokannan ominaisuustaulukossa on *:··: annotoituja DNA-sekvenssejä. · ·’·1: Tyypillisissä sekvenssitietokannoissa on rivitunnisteita, avainsanoja • · .1·1. ja sekventiaalista paikka- tai määriteinformaatiota ominaisuuksien annotointia ·· · 30 varten. Vaikka on monia erilaisia tunnisteita, avainsanoja ja määritteitä, on :·. mahdollista hyödyntää joitakin yleisiä yhteneväisyyksiä.
• ·· *... Esimerkiksi EMBL-tietokannassa on seuraavanlaisia ominaisuustau- • · **;1 lukoita: · · * · • 2 Rivi Avain Paikka/Määrite i·· " — 35 FT CDS 22..2892
: FT
•e·:'1 • · » 2 • ft ft ft · 118101 26 FT db xrcfT"SWlSS-PROT:P49746" , ft ...
FT /gene="THBS3" FT - - ·.
5
On FT-rivejä (feature table, ominaisuustaulukko), joissa on avainsana CDS (coding sequence, koodaussekvenssi), joka osoittaa koodausaluetta ja spesifisiä määritteitä, jota tuottavat erilaisia tietokantaviittauksia geeneihin (/gene=,,THBS3") ja niiden proteiineihin (db_xref="SWISS-PROT:P49746").
10 Tämä tarkoittaa, että geenillä, jonka identifioi THBS3, on proteiinituote, jonka identifioi "SWISS-PROT:P49746", ja geenin ja proteiinin välissä täytyy olla mRNA. Nimet on muunnettava suositelluiksi nimiksi (ks. nimitaulukot 226 kuviossa 2).
Oletetaan, että annotoituna ominaisuutena on geeni G1 (osoitettu 15 viitenumerolla 1302) silmukointivarianttituotteiden (splice variant product) P1, P2 ja P3 kanssa (viitenumerot 1342, 1344 ja 1346). Silloin tiedämme, että täytyy olla kolme silmukointivariantti mRNA:ta, nimittäin Tr1=mRNA G1:stä P1:een, Tr2=mRNA G1:stä P2:een, ja Tr3=mRNA G1:stä P3:een. Nämä silmukointivariantti mRNA:t osoitetaan viitenumeroilla 1322, 1324 ja 1326.
20 Oletetaan lisäksi, että annotoituna ominaisuutena on geeni G2, ' 1308, jolla on yksi tuote P4, 1348. Silloin tiedämme, että täytyy olla yksi mRNA, nimittäin Tr4=mRNA, 1328, G2:sta P4:ään.
, , Yllä olevan informaation perusteella polun luuranko, kuten kuviossa • · · !·: · 13 näytetty, voidaan luoda automaattisesti.
• · !.1·: 25 Aluksi transkriptio-interaktiot voidaan täydentää mekaanisesti • 1 1 ribonukleotidi-substraateilla ja myöhemmin tunnetuilla transkriptiotekijöillä.
*"1: Translaatio-interaktio voidaan täydentää aminohapoilla ja ribosomilla. Interak- :1·]: tiot eivät ole vielä täydellisiä, mutta RNA-sekvenssitietokantoja voidaan käyttää :“1· muodostamaan translaatio-interaktioita, jos on olemassa annotoituja ominai- • · · 30 suuksia (features), joihin kuuluu identifioitu mRNA ja proteiini.
Automaattisen populointiominaisuuden etu on automaattinen geno- [···, min kattava polunmuodostus kullekin organismille, mikä helpottaa kehit- • · *!1 tyneempää polun kokoamista, joka perustuu kuviossa 13 näytettyyn peruskaa- * · • vioon.
35 Laitteiston ja ohjelmiston osalta IMS tarvitsee pääsyn ulkoisiin tieto- · kantoihin. Moniin tietokantoihin voidaan päästä tavallisella Internet-selaimella.
• ·· • · 1 · • t • · ft·· 118101 ί 27 i? V,
Niinpä automaattisen populointiohjelmiston tulee emuloida Internet-selainta tai muuten tuottaa yhteensopivia komentoja. Lisäksi IMS tarvitsee jäsentämislo-giikan (parsing) ja tietoa siitä, kuinka kunkin tietokannan anto on järjestetty. |; -7!
Spatiaaliset referenssimallit 5 Kuvio 14 esittää spatiaalisia referenssimalleja erilaisille solutyypeil le. Aiemmin todettiin, että yksinkertaiset suorakulmaiset tai napakoordinaatti-järjestelmät voivat riittää joillekin solutyypeille. Koordinaattijärjestelmä on edullista normalisoida siten, että maksimietäisyys referenssipisteestä on yksi.
On monia solutyyppejä, joille yksinkertainen suorakulmainen tai na-10 pakoordinaattijärjestelmä ei riitä. Esimerkiksi kantasolut ovat suuntautuneita, mikä tarkoittaa, että niillä on etupää ja takapää. Hermosolut ovat vieläkin monimutkaisempia. Niinpä IMS edullisesti käsittää useita spatiaalisia referenssi- . »· malleja, ja spatiaalinen piste ilmaistaan referenssimallin ja sen sisällä olevan f alueen yhdistelmänä.
15 Kuvio 14 esittää kolmea erilaista referenssimalli-esimerkkiä. Refe- renssimalli 1400 on yksinkertainen koordinaattijärjestelmä, kuten kolmiulotteinen suorakulmainen koordinaattijärjestelmä. Joillekin solutyypeille voi riittää yksi tai kaksi koordinaattia. Jos kyseinen solutyyppi on pyörähdyssymmetrinen, napakoordinaattijärjestelmä voi olla parempi kuin suorakulmainen. 1
20 Referenssimalli 1410 perustuu solun jakamiseen useaan alueeseen. I
Alueiden määrä tulisi valita siten, että biokemiallinen informaatio pätee koko ^ alueella. Referenssimalli 1410 soveltuu kompaktille suuntautuneelle solulle, : kuten kantasolulle. Malli 1410 on suuntautunut, mutta pyörähdyssymmetrinen.
• · \**j Siihen kuuluu etupään alue 1411, takapään alue 1416, tuma-alue 1414 ja eri ί)”ί 25 välialueita 1412, 1413 ja 1415. Etu-ja takapäät voidaan valita jonkin gradientin ·:**: suhteen, kuten jonkin yhdisteen laskevan konsentraation suhteen.
·*·*: Referenssimalli 1420 on esimerkki hermosolun topologian mallinta- • « .***. misesta. Siinä on tuma-alue 1421 ja sen ympärillä eri osia 1422, 1423, sooma- alue 1424, aksonialue 1425, jne. Normalisoituja spatiaalikoordinaatteja voi- ··' 30 daan käyttää kasvattamaan detaljitasoa edelleen tarvittaessa. Esimerkiksi pis- • ·· te, joka on aksonin ulkopinnalla sen pituussuuntaisessa keskipisteessä, voi- • · **·.*' daan ilmaista muodossa {1420, 1425, (0,5,1)}, missä 1420 osoittaa referens- j*·*! simallia, 1425 osoittaa aluetta referenssimallin sisällä, 0,5 on normalisoitu pi- :"*} tuussuuntainen koordinaatti aksonia pitkin ja 1 tarkoittaa 100% säteestä . 35 aksonin poikkileikkausta pitkin.
• ·· • * ··· • · • ♦ · 118101 28
Alan ammattilaiselle on selvää, että tekniikan kehittyessä keksinnön mukainen konsepti voidaan toteuttaa eri tavoin. Keksintö suoritusmuotoineen ei rajoitu yllä esitettyihin esimerkkeihin vaan ne voivat vaihdella patenttivaatimusten suojapiirin puitteissa. ^ 5 ♦ · • · · • ♦ * ··· · • ♦ • · · • · · • ♦ • * ♦ ♦ ··· • · · *·:'· • · • · «·· ·♦ ♦ ♦ « « · «4 • * »«· » • * ·
• I I
* · • ♦ :il; • · ·
• · , ,, 'V
* * • · · • · • · · ··· • « »»· • « • · ···'

Claims (12)

118101 29
1. Informaationhallintajärjestelmä biologisen informaation (200) hallitsemiseksi, johon informaationhallintajärjestelmään kuuluu palvelin (S) ja tietokanta (DB), johon kuuluu biologisten polkujen strukturoituja kuvauksia (700), 5 jotka muodostuvat ainakin poluista (212), biokemiallisista olioista (218), yhteyksistä (216) ja vuorovaikutuksista (222), siten, että kullakin yhteydellä (216) on ensimmäinen relaatio biokemialliseen olioon (218) ja toinen relaatio yhteen vuorovaikutukseen (222); ' tunnettu siitä, että: 10. kullakin yhteydellä (216) on kolmas relaatio yhteen polkuun (212); ja - kullakin polulla (212) on relaatio spesifiseen sijaintiin (214).
2. Patenttivaatimuksen 1 mukainen informaationhallintajärjestelmä, 1 tunnettu siitä, että kullakin vuorovaikutuksella (222) on relaatio yhteen tai useampaan kineettiseen lakiin.
3. Patenttivaatimuksen 1 tai 6 mukainen informaationhallintajärjes- telmä, tunnettu siitä, että siihen kuuluu välineet yhden tai useamman ennalta määrätyn roolin assosioimiseksi kuhunkin yhteyteen, missä rooli osoittaa biokemiallisen olion (218) roolin vuorovaikutuksessa (222) ja useisiin ennalta määrättyihin rooleihin kuuluu substraatti (840), tuote (850), aktivaation (860) ja h 20 inhibiittori (870). |
4. Jonkin patenttivaatimuksen 1 - 3 mukainen informaationhallinta- : järjestelmä, t u n n e 11 u siitä, että siihen kuuluu välineet stökiömetrisen ker- • · · ' :‘tf · toimen assosioimiseksi kuhunkin yhteyteen, missä stökiömetrinen kerroin • · · l..\ osoittaa biokemiallisen olion (218) tuotettujen tai kulutettujen molekyylien mää- 25 rän vuorovaikutuksessa (222). • « · · · • ·
5. Jonkin patenttivaatimuksen 1 - 4 mukainen informaationhallinta- • · \.I# järjestelmä, t u n n e tt u siitä, että siihen kuuluu käyttöliittymälogiikka mainittu- • · *“ jen biologisten polkujen (700) strukturoitujen kuvausten visualisointien (800) esittämiseksi. ·« • 1
6. Patenttivaatimuksen 5 mukainen informaationhallintajärjestelmä, * · ’2 tunnettu siitä, että käyttöliittymälogiikka käsittää välineet näyttämään visu- M · j alisointeja (800) mitatuista tai perturboiduista muuttujista, jotka on paikallistettu biologisten polkujen (700) biokemiallisiin olioihin (881), vuorovaikutuksiin (882) : ja/tai yhteyksiin (883). • ·♦ '“· • · · · • · • · 2 • · · 30 11 81 01
7. Jonkin patenttivaatimuksen 5-10 mukainen informaationhal- lintajärjestelmä, tunnettu siitä, että kuuluu polkuyhteyksiä (720, 730) usean polun (711 - 713) yhdistämiseksi kompleksisiksi poluiksi. >
8. Jonkin edellisen patenttivaatimuksen mukainen informaation-5 hallintajärjestelmä, tunnettu siitä, että biologinen informaatio (200) käsittää datajoukkoja (202, 610, 620), joista kukin datajoukko käsittää: - muuttuja-arvomatriisin (614, 624), joka sisältää riveiksi ja sarakkeiksi järjestettyjä muuttuja-arvoja; - muuttujankuvauskielellä (30) olevan rivienkuvauslistan (613, 623) 10 muuttuja-arvomatriisin riveistä; - muuttujankuvauskielellä (30) olevan sarakkeidenkuvauslistan (612, 622. muuttuja-arvomatriisin sarakkeista; - muuttujankuvauskielellä (30) olevan kiinteiden dimensioiden kuvauksen (611, 621) yhdestä tai useammasta kiinteästä dimensiosta, jotka ovat 15 yhteisiä muuttuja-arvomatriisin kaikille arvoille.
9. Patenttivaatimuksen 8 mukainen informaationhallintajärjestelmä, tunnettu siitä, että: - muuttujankuvauskieli (30) käsittää muuttujankuvauksia, joista kukin käsittää yhden tai useamman parin, jossa on avainsana (32) ja nimi (34); ja '· 20. informaationhallintajärjestelmä käsittää sallittujen avainsanojen taulukon (38).
10. Patenttivaatimuksen 9 mukainen informaationhallintajärjestelmä, :·: i tunnettu siitä, että siihen kuuluu logiikka (300) syntaksitarkastuksen teke- • · V1: miseksi mainitulla muuttujankuvauskielellä ilmaistuille muuttujille. • · · • 2 *··1] 25 11. Patenttivaatimuksen 9 tai 10 mukainen informaationhallintajär- * 2 jestelmä, tunnettu siitä, että se käsittää yhdistettyjä muuttujalausekkeita, : V joista kukin käsittää kaksi tai useampia muuttujalausekkeita, jotka on erotettu ·«· :...· operaattoreilla ja/tai funktioilla.
12. Jonkin edellisen patenttivaatimuksen mukainen informaation- i 3 30 hallintajärjestelmä, tunnettu siitä, että siihen kuuluu käyttöliittymälogiikka ··· datajälkien (1102 -1174) näyttämiseksi toisiinsa liittyvien datajoukkojen välillä. • · · ' • · φ · *·· « # • · • · · 1 » 2 • ·· • · 3 ··· ... ··· 118101 31
FI20031025A 2003-07-04 2003-07-04 Informaationhallintajärjestelmä biokemiallista informaatiota varten FI118101B (fi)

Priority Applications (8)

Application Number Priority Date Filing Date Title
FI20031025A FI118101B (fi) 2003-07-04 2003-07-04 Informaationhallintajärjestelmä biokemiallista informaatiota varten
EP04103074A EP1494159A3 (en) 2003-07-04 2004-06-30 Information management system for biochemical information
PCT/FI2004/000424 WO2005003999A1 (en) 2003-07-04 2004-07-02 Information management system for biochemical information
JP2006516238A JP2007520773A (ja) 2003-07-04 2004-07-02 生化学情報のための情報管理システム
CA002531131A CA2531131A1 (en) 2003-07-04 2004-07-02 Information management system for biochemical information
RU2005141111/09A RU2005141111A (ru) 2003-07-04 2004-07-02 Система управления биохимической информацией
AU2004254729A AU2004254729A1 (en) 2003-07-04 2004-07-02 Information management system for biochemical information
US10/883,648 US20050192756A1 (en) 2003-07-04 2004-07-02 Information management system for biochemical information

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FI20031025 2003-07-04
FI20031025A FI118101B (fi) 2003-07-04 2003-07-04 Informaationhallintajärjestelmä biokemiallista informaatiota varten

Publications (3)

Publication Number Publication Date
FI20031025A0 FI20031025A0 (fi) 2003-07-04
FI20031025A FI20031025A (fi) 2005-01-05
FI118101B true FI118101B (fi) 2007-06-29

Family

ID=27636063

Family Applications (1)

Application Number Title Priority Date Filing Date
FI20031025A FI118101B (fi) 2003-07-04 2003-07-04 Informaationhallintajärjestelmä biokemiallista informaatiota varten

Country Status (3)

Country Link
US (1) US20050192756A1 (fi)
EP (1) EP1494159A3 (fi)
FI (1) FI118101B (fi)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI119160B (fi) * 2005-10-10 2008-08-15 Medicel Oy Tietokannan hallintajärjestelmä
US20070150906A1 (en) * 2005-12-09 2007-06-28 Art Richards Method for integration of functionality of computer programs and substitute user interface for transportation environment
US7941433B2 (en) 2006-01-20 2011-05-10 Glenbrook Associates, Inc. System and method for managing context-rich database
US8332209B2 (en) * 2007-04-24 2012-12-11 Zinovy D. Grinblat Method and system for text compression and decompression
US8285523B2 (en) * 2009-02-17 2012-10-09 Massachusetts Institute Of Technology Electronic system for modeling chemical reactions and biochemical processes
US20150261914A1 (en) * 2014-03-13 2015-09-17 Genestack Limited Apparatus and methods for analysing biochemical data
US11586695B2 (en) 2018-02-27 2023-02-21 Elasticsearch B.V. Iterating between a graphical user interface and plain-text code for data visualization
US10657317B2 (en) * 2018-02-27 2020-05-19 Elasticsearch B.V. Data visualization using client-server independent expressions
US10997196B2 (en) 2018-10-30 2021-05-04 Elasticsearch B.V. Systems and methods for reducing data storage overhead

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5930154A (en) * 1995-01-17 1999-07-27 Intertech Ventures, Ltd. Computer-based system and methods for information storage, modeling and simulation of complex systems organized in discrete compartments in time and space
US6108635A (en) * 1996-05-22 2000-08-22 Interleukin Genetics, Inc. Integrated disease information system
EP1163614A1 (en) * 1999-02-19 2001-12-19 Cellomics, Inc. Method and system for dynamic storage retrieval and analysis of experimental data with determined relationships
AU2001286880A1 (en) * 2000-11-28 2002-06-11 Physiome Sciences, Inc. System for modeling biological pathways
CA2500526A1 (en) * 2002-10-01 2004-04-15 Luke V. Schneider Artificial intelligence for analyzing hypothetical models

Also Published As

Publication number Publication date
FI20031025A0 (fi) 2003-07-04
EP1494159A2 (en) 2005-01-05
EP1494159A3 (en) 2007-10-17
EP1494159A9 (en) 2005-08-24
FI20031025A (fi) 2005-01-05
US20050192756A1 (en) 2005-09-01

Similar Documents

Publication Publication Date Title
FI118102B (fi) Informaationhallintajärjestelmä työvirtojen hallitsemiseksi
Lacroix et al. Bioinformatics: managing scientific data
Cline et al. Integration of biological networks and gene expression data using Cytoscape
Fiehn et al. Setup and annotation of metabolomic experiments by integrating biological and mass spectrometric metadata
Luna et al. A formal MIM specification and tools for the common exchange of MIM diagrams: an XML-Based format, an API, and a validation method
FI118101B (fi) Informaationhallintajärjestelmä biokemiallista informaatiota varten
FI117067B (fi) Informaationhallintajärjestelmä biokemiallista informaatiota varten
FI117988B (fi) Informaationhallintajärjestelmä biokemiallista informaatiota varten
FI118063B (fi) Informaationhallintajärjestelmä biokemiallista informaatiota varten
FI117068B (fi) Informaationhallintajärjestelmä biokemiallista informaatiota varten
Wolstencroft et al. Semantic data and models sharing in systems biology: The just enough results model and the seek platform
Jones et al. The PRIDE proteomics identifications database: data submission, query, and dataset comparison
FI118868B (fi) Informaationhallintajärjestelmä biokemiallisen informaation hallintaa varten
WO2005003999A1 (en) Information management system for biochemical information
Friedrich et al. Interactive Visualization for Large-Scale Multi-factorial Research Designs
Schoof et al. The PlaNet consortium: a network of European plant databases connecting plant genome data in an integrated biological knowledge resource
Clark et al. A structured interface to the object-oriented genomics unified schema for XML-formatted data
Chen et al. multiomics: A user-friendly multi-omics data harmonisation R pipeline [version 1; peer review: 2 not approved]
Chen et al. multiomics: A user-friendly multi-omics data harmonisation R pipeline [version 1; peer review: awaiting peer review]
CANAKOGLU Integration of biomelecular interaction data in a genomic and proteomic data warehouse
Hernández Knowledge representation for curation and analysis of crop phenotypic data underpinning nutritional security
Jones The development of data standards and a database to aid proteomic research
DI GIROLAMO Design and implementation of automatic procedures to import and integrate data in a genomic and proteomic data warehouse
Sidhu et al. Introduction to data modeling
Lister Enhancing systems biology models through semantic data integration

Legal Events

Date Code Title Description
FG Patent granted

Ref document number: 118101

Country of ref document: FI