FI118063B - Informaationhallintajärjestelmä biokemiallista informaatiota varten - Google Patents

Informaationhallintajärjestelmä biokemiallista informaatiota varten Download PDF

Info

Publication number
FI118063B
FI118063B FI20031028A FI20031028A FI118063B FI 118063 B FI118063 B FI 118063B FI 20031028 A FI20031028 A FI 20031028A FI 20031028 A FI20031028 A FI 20031028A FI 118063 B FI118063 B FI 118063B
Authority
FI
Finland
Prior art keywords
data
variable
information
biochemical
path
Prior art date
Application number
FI20031028A
Other languages
English (en)
Swedish (sv)
Other versions
FI20031028A (fi
FI20031028A0 (fi
Inventor
Pertteli Varpela
Meelis Kolmer
Original Assignee
Medicel Oy
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Medicel Oy filed Critical Medicel Oy
Priority to FI20031028A priority Critical patent/FI118063B/fi
Publication of FI20031028A0 publication Critical patent/FI20031028A0/fi
Priority to EP04103136A priority patent/EP1494141A3/en
Priority to US10/883,045 priority patent/US20050010370A1/en
Priority to PCT/FI2004/000424 priority patent/WO2005003999A1/en
Priority to AU2004254729A priority patent/AU2004254729A1/en
Priority to CA002531131A priority patent/CA2531131A1/en
Priority to JP2006516238A priority patent/JP2007520773A/ja
Publication of FI20031028A publication Critical patent/FI20031028A/fi
Application granted granted Critical
Publication of FI118063B publication Critical patent/FI118063B/fi

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Molecular Biology (AREA)
  • Physiology (AREA)
  • Automatic Analysis And Handling Materials Therefor (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

118063
Informaationhallintajärjestelmä biokemiallista informaatiota varten
Keksinnön tausta
Keksintö liittyy informaationhallintajärjestelmään (lyhyesti "IMS” (in-5 formation management system)) biokemiallisen informaation hallintaa varten.
Biologinen tutkimus tuottaa valtavia datamääriä nopeudella, jota ei ole koskaan nähty millään tieteen alalla. Sivuvaikutuksena on, että voidaan tehdä päällekkäisiä kokeita, koska ei ole ollut systemaattisia tapoja kokeiden kuvaamiseksi niiden myöhempää palauttamista varten.
10 Keksinnön lyhyt selostus
Keksinnön tavoitteena on tuottaa informaationhallintajärjestelmä (jäljempänä lyhennetty ’’IMS”) organisoimaan suurta työmäärää biokemiallisessa tutkimuksessa. Keksinnön tavoite saavutetaan IMS:llä, jolle on tunnusomaista se, mitä sanotaan itsenäisissä patenttivaatimuksissa. Keksinnön edul-15 liset suoritusmuodot ilmenevät epäitsenäisistä patenttivaatimuksista.
Keksinnön mukainen informaationhallintajärjestelmä kuvaa biokemiallista tietoa ja sitä luovia kokeita samojen dataelementtien suhteen, mahdollisuuksien mukaan. Toisin sanoen datarakenne biokemiallista tietoa varten ja datarakenne kokeita varten viittaavat mahdollisuuksien mukaan samoihin 20 dataelementteihin. Esimerkiksi datarakenne kokeita varten viittaa ottodataele-menttiin ja antodataelementtiin, jotka molemmat voivat olla spesifisiä biomate- v.! riaalinäytteitä. Keksinnön mukaisesti datarakenne biokemiallista tietoa varten • · \**: käyttää samoja dataelementtejä kuvaamaan biomateriaalinäytteitä.
ί.,.ϊ Jakamalla samat dataelementit biokemiallisen tiedon datarakenteen *:··: 25 ja kokeiden datarakenteen kesken saavutetaan tiettyjä etuja. On esimerkiksi ·*·*· suhteellisen suoraviivainen tehtävä toteuttaa kattava seurantajärjestelmä, joka • · .*·*. pystyy seuraamaan kunkin biomateriaalielementin tai biokemiallisen tiedon historian. Tällainen informaationhallintajärjestelmä tukee myös usean tyyppisiä tuottavuusanalyysejä. Esimerkiksi keksinnön eräs edullinen suoritusmuoto liit- *... 30 tyy tiettyyn tapaan kuvata biokemiallisia polkuja yhteyksien ja interaktioiden • · **;·* suhteessa. Informaationhallintajärjestelmä voi valvoa tuottavuutta seuraamalla lisättyjen yhteyksien määrää resurssia (aikaa, henkilöitä, rahoitusta,...) kohti.
Keksinnön eräs edullinen suoritusmuoto käsittää projektieditorin hal-.* . litsemaan projektitietokantaa seuraavan datarakenteen avulla. Projektitieto- *;./ 35 kanta on sovitettu tallentamaan useita projekteja. Kukin projekti käsittää yhden • · .
• · ··· 2 118063 tai useamman kokeen. Kukin koe liittyy spesifiseen metodiin koeannon tuottamiseksi koeotosta. Lisäksi kukin koe edullisesti määrittää ihmis- ja/tai laiteresurssit. Sekä koeotto että koeanto spesifioidaan biomateriaaleina (märkäla-boratorio) tai dataolioina (in-silico). Metodi liittyy metodikuvaukseen. Edullisesti 5 on myös koekohde, joka spesifioidaan samoin biomateriaaleina tai dataolioina.
Keksinnön mukainen informaationhallintajärjestelmä pystyy edullisesti tallentamaan tietoa populaatioista, yksilöistä, reagenteista tai muiden biomateriaalien näytteistä (mitä tahansa, jota voidaan tutkia biologisena/biokemi-allisena järjestelmänä tai sen komponenttina).
10 Koe voi olla tosielämän koe (’’märkälaboratorio”) tai simuloitu koe ("in silico”). Keksinnön erään edullisen suoritusmuodon mukaisesti molemmat koetyypit tuottavat datajoukkoja, joista kuhunkin kuuluu: - muuttuja-arvomatriisi, joka sisältää riveiksi ja sarakkeiksi järjestettyjä muuttuja-arvoja; 15 - muuttujankuvauskielellä oleva rivienkuvauslista muuttuja-arvomat- riisin riveistä; - muuttujankuvauskielellä oleva sarakkeidenkuvauslista muuttuja-ar-vomatriisin sarakkeista; - muuttujankuvauskielellä oleva kiinteiden dimensioiden kuvaus yh-20 destä tai useammasta kiinteästä dimensiosta, jotka ovat yhteisiä muuttuja-ar- vomatriisin kaikille arvoille.
Kunkin kokeen numeeriset arvot talletetaan edullisesti skalaarilukui- • · na muuttuja-arvomatriisiin, jossa on rivi-sarake -organisaatio. Tällaisia rivi-sa- • » rake -matriiseja voidaan käsitellä edelleen hyvin monilla erilaisilla valmiilla tai ί,,.ί 25 räätälöidyillä sovellusohjelmilla. On erilliset rivi- ja sarakekuvauslistat kuvaa- ·;··: maan, vastaavasti, muuttuja-arvomatriisissa olevien rivien ja sarakkeiden mer- ·*·*; kitystä. Rivi-ja sarakekuvauslistat sekä kiinteiden dimensioiden kuvaus kirjoite- • · .·*. taan muuttujankuvauskielellä mielivaltaisten muuttuja-arvojen linkittämiseksi IMS:n strukturoituun informaatioon.
30 Muuttujankuvauskielen (variable description language = VDL) käyt- tämisellä saavutetaan se etu, että IMS on pitkälti itseriittoinen. Numeroarvojen • · *·;·* tulkitsemiseen tarvitaan vähän tai ei lainkaan ulkopuolista informaatiota. On :*·*: myös suhteellisen suoraviivainen tehtävä kohdistaa muuttujalausekkeisiin pa- :***: kollinen automaattinen syntaksintarkastus. Eräs VDL:n oleellinen piirre on, että .* ♦ 35 se sallii muuttujien kuvaamisen muuttuvalla detaljitasolla. VDL voi esimerkiksi **„/ kuvata muuttujan biomateriaalitermein (populaatio - yksilö - näyte; organismi - • · i * • * · 3 118063 elin - kudos, solutyyppi, jne.), fyysisinä määrinä ja aikana, mutta voimme jättää pois detaljeja, jotka eivät ole nykyiselle kontekstille oleellisia.
XML (extendible Markup Language) on eräs hyvin tunnettu esimerkki kielestä, jota voidaan käyttää muuttujankuvauskielenä. XML:n ongelma-5 na on kuitenkin se, että se on tarkoitettu kuvaamaan käytännöllisesti katsoen mitä tahansa strukturoitua informaatiota, mikä johtaa pitkähköihin lausekkeisiin, joiden lukeminen on ihmiselle vaikeaa. Näin ollen, keksinnön eräs edullinen suoritusmuoto liittyy muuttujankuvauskieleen, joka XML:ää paremmin soveltuu biologisten muuttujien kuvaamiseen. Lisäksi lausekkeet XML:llä ja sen 10 biologisilla tai matemaattisilla varianteilla, kuten SBML (Systems Biology Markup Language) tai CellML (Cell Markup Language) tai MathML (Mathematical Markup Language), ovat yleensä liian pitkiä tai monimutkaisia toimiakseen itse dokumentoivina symboleina biologisten muuttujien kuvaamiseen matemaattisissa malleissa. Näin ollen keksinnön vielä eräs edullinen suoritusmuoto käsit-15 tää kompaktin mutta laajennettavan VDL.n, joka ratkaisee nämä XML.n ja sen varianttien ongelmat.
Tallettamalla numeroarvot skalaarimatriisina saavutetaan se etu, että matriisi voidaan analysoida monilla kaupallisesti saatavilla datanetsintätyö-kaluilla (data mining tools), kuten itsejärjestyvillä kartoilla tai muilla klusterointi-20 algoritmeilla, jotka eivät helposti prosessoi arvoja, joissa on dimensioita. Niinpä rivi- ja sarakekuvaukset talletetaan erikseen. Tallettamalla kolmas lista, nimittäin kiinteiden dimensioiden kuvaus, saavutetaan se etu, että riveille ja sarak-t.t·' keille yhteisiä dimensioita ei tarvitse toistaa rivi-ja sarakekuvauslistoissa.
φ · · I IMS:n käsittelynopeutta voidaan lisätä tallettamalla kukin datajoukko * * * 25 (kukin datajoukko käsittää muuttuja-arvomatriisin, rivi- ja sarakekuvauslistat m * *···* sekä kiinteiden dimensioiden kuvauksen) datan säiliönä ja tallettamalla tieto- *:*'* kantaan vain tämän säiliön osoite tai tunniste. Olettaen, että datajoukkojen ·· · : noutamiseen käytetään SQL- (structured query language) tai muita tietokanta- kyselyjä, yhden säiliön tekniikka vähentää dramaattisesti SQL-kyselyillä pro-30 sessoitavien yksittäisten dataelementtien määrää. Kun yksittäisiä dataelement-tejä tarvitaan, koko säiliö voidaan prosessoida sopivalla työkalulla, kuten tau- .*··. lukkolaskennalla tai yksinkertaisten tiedostojen (flat file) tietokantajärjestelmäl- *·*·* ...
• la.
···
i ·* Keksinnön erään toisen edullisen suoritusmuodon mukaisesti IMS
* * * 35 käsittää lisäksi biokemiallisten olioiden tietokannan, joka sisältää olioita tai tau-lukoita. Muuttujankuvauskieli käsittää muuttujakuvauksia, joista kukin käsittää • · • · · • · **· ...
4 118063 yhden tai useamman avainsana-nimiparin. Kutakin biokemiallisten olioiden tietokannassa olevaa oliota tai taulukkoa kohti on siihen viittaava avainsana. Tämä suoritusmuoto helpottaa automaattista syntaksin tai muuta tarkastusta, joka tehdään talletettavaan informaatioon.
5 Keksinnön mukaisten datajoukkojen eräs toinen etu on hyvä tuki hyvin määritellyille konteksteille. Konteksti määrittelee kokeen, joko märkälabo-ratorio tai in-silico, laajuuden. Jokainen konteksti määritellään biomateriaaleina, muuttujina ja aikana.
Kuvioiden lyhyt selostus 10 Keksintöä selostetaan nyt lähemmin edullisten suoritusmuotojen yh teydessä, viitaten oheisiin piirroksiin, joista:
Kuvio 1 on lohkokaavio IMS:stä, jossa keksintöä voidaan käyttää; Kuvio 2 on IMS:n tietokantarakenteen olio-relaatiomalli;
Kuviot 3A ja 3B esittävät edullista muuttujankuvauskieltä eli VDL:ää; 15 Kuvio 3C esittää VDL-kielisen muuttujalausekkeen syntaksintarkas- tusprosessia;
Kuvio 4 näyttää esimerkkejä VDL-kielisistä yhdistetyistä muuttuja-lausekkeista;
Kuvio 5 näyttää, kuinka VDL:ää voidaan käyttää ilmaisemaan erilai-20 siä datakonteksteja;
Kuviot 6A ja 6B esittävät keksinnön mukaisia datajoukkoja;
Kuvio 7A on IMS:ään tallennetun polun (pathway) lohkokaavio; • · ·
Kuvio 7B näyttää esimerkin monimutkaisesta polusta, joka sisältää yksinkertaisempia polkuja; *“·* 25 Kuvio 8 näyttää polun visualisoitua muotoa; ···**
Kuvio 9 esittää koe-oliota IMS:n koeosiossa; ·♦···.
: ·* Kuvio 10 näyttää esimerkin IMS:n biomateriaaliosion objektipohjai- • · · sesta toteutuksesta;
Kuviot 11A ja 11B osoittavat datan seurattavuutta kahden esimerkin 30 valossa; :***: Kuvio 12A näyttää ohjelmisto-komponenttimallia monimutkaisten • · · työvirtojen selostamiseksi ja hallitsemiseksi IMS:ssä; • · ·
Kuvio 12B näyttää asiakas-palvelin-arkkitehtuurin, johon kuuluu asi- • « *·;* akaspäätelaitteessa CT suoritettava graafinen työvirtojen editori; 35 Kuvio 13 esittää prosessia polkujen automaattista täyttämistä varten sekvenssitietokannasta; ja • * * 5 118063
Kuvio 14 esittää spatiaalista referenssimallia erilaisille solutyypeille.
Keksinnön yksityiskohtainen selostus Tässä dokumentissa "objekti” tarkoittaa samaa kuin englanninkielinen termi "object” ja "olio” tarkoittaa samaa kuin englanninkielen ’’entity”.
5 Kuvio 1 on yksinkertaistettu lohkokaavio informaationhallintajärjes- telmästä IMS, jossa keksintöä voidaan käyttää. Tässä esimerkissä IMS on toteutettu asiakas/palvelin -järjestelmänä. Useilla asiakaspäätelaitteilla CT, kuten graafisilla työasemilla, on pääsy palvelimeen (tai palvelinten joukkoon) S verkon NW, kuten lähiverkon tai Internetin kautta. Palvelimeen kuuluu tai siihen 10 on kytketty tietokanta DB. Palvelimen informaationkäsittelylogiikka ja tietokannan data muodostavat IMS:n. Tietokanta muodostuu rakenteesta ja sisällöstä. Keksinnön eräs edullinen suoritusmuoto tuo parannuksia IMS:n tietokannan DB rakenteeseen. Palvelin S käsittää myös erilaisia prosessointilogiikoita. Viestilogiikka tarjoaa palvelimen perustoiminnot asiakaspäätelaitteiden kanssa 15 viestintää varten. On myös edullisesti käyttöliittymälogiikka erilaisten käyttöliittymien luomiseksi. Voi olla erilaisia tarkastuksia syötettävän datan merkitsevyyden tarkastamista varten (kuten syntaksi- tai aluetarkastuksia). Eräs hyvin hyödyllinen piirre on projektihallitsija, jolla on seurantalogiikka, joka tarjoaa datan visuaalisen seurannan.
20 Palvelin (tai palvelinjoukko) S käsittää myös erilaisia dataproses- sointityökaluja datan analysointia, visualisointia ja etsimistä (mining) varten, ... ym. Tallentamalla datajoukot säiliöinä rivi-sarake -organisaatiossa (eikä osoite- ta jokaista data-alkiota erikseen SQL-kyselyillä) saavutetaan se etu, että tällai- • * * *;//· set rivien ja sarakkeiden datajoukot voidaan helposti prosessoida kaupallisesti • * *···* 25 saatavilla analyysi- tai visualisointityökaluilla. Muita suoritusmuotoja kolmansi- *·’*· en osapuolten työkalujen integroimiseksi yhteisen käyttöliittymän alaisuuteen ·· · · • V selostetaan kuvion 12 yhteydessä.
• · · • · • ·
Datajoukot «·. Kuvio 2 on IMS:n tietokantarakenteen 200 olio-relaatiomalli. Tieto- • ♦* ’.... 30 kantarakenne 200 käsittää seuraavat pääosat: perusmuuttujat/yksiköt 204, da- V tajoukot 202, kokeet 208, biomateriaalit 210, polut 212 ja valinnaisesti sijainnit fV 214.
Datajoukot 202 kuvaavat IMS:ään tallennettuja numeerisia arvoja. ,·* ; Kukin datajoukko koostuu muuttujajoukosta, biomateriaali-informaatiosta ja
t M
35 ajasta. Huomattakoon, että perusmuuttujat/yksiköt -osasta 204 ja aikaosasta • · · 118063 6 206 on monesta moneen-relaatiot datajoukko-osaan 202. Tämä tarkoittaa, että kukin datajoukko 202 käsittää tyypillisesti yhden tai useamman perusmuut-tujan/yksikön ja yhden tai useamman aikalausekkeen. Datajoukko-osan 202 ja koeosan 208 välillä on monesta moneen -relaatiot, mikä tarkoittaa, että kukin 5 datajoukko 202 liittyy yhteen tai useampaan kokeeseen 208, ja kukin koe liittyy yhteen tai useampaan datajoukkoon. Datajoukko-osan edullista toteutusta selostetaan lisää kuvioiden 6A ja 6B yhteydessä.
Perusmuuttujat/yksiköt -osa 204 kuvaa IMS:ssä käytetyt perusmuuttujat ja yksiköt. Erässä yksinkertaisessa toteutuksessa kukin perusmuuttujatie-10 tue käsittää yksikkökentän, mikä tarkoittaa, että kukin perusmuuttuja (esim. massa) voidaan ilmaista vain yhdessä yksikössä (esim. kilogrammoina). Joustavammassa suoritusmuodossa yksiköt tallennetaan erilliseen tauluun, mikä sallii perusmuuttujien ilmaisemisen useassa yksikössä, kuten kilogrammoina tai nauloina.
15 Perusmuuttujat ovat muuttujia, joita voidaan käyttää sellaisinaan, tai niitä voidaan yhdistää muodostamaan monimutkaisempia muuttujia, kuten tietyn näytteen konsentraatio tietyllä ajanhetkellä.
Aikaosa 206 tallentaa datajoukkojen 202 aikakomponentit. Datajou-kon aikakomponentti käsittää edullisesti suhteellisen (sekuntikello-) ajan ja ab-20 soluuttisen (kalenteri-) ajan. Suhteellista aikaa voidaan käyttää esimerkiksi kuvaamaan nopeutta, jolla kemiallinen reaktio tapahtuu. On myös päteviä syitä tallentaa absoluuttinen aika kunkin datajoukon yhteydessä. Absoluuttinen aika osoittaa koska kalenteriajassa vastaava tapahtuma esiintyi. Tällaista absoluut- * * · tisen ajan informaatiota voidaan käyttää laskemaan suhteellinen aika minkä 25 tahansa koetapahtumien välillä, Sitä voidaan käyttää myös vianetsintätarkoi- • · ***** tuksiin. Jos esimerkiksi havaitaan viallinen instrumentti tiettynä aikana, niin tuolla instrumentilla tehdyt kokeet ennen vian havaitsemista tulisi tarkistaa.
: Koeosa 208 tallentaa kaikki IMS:n tuntemat kokeet. On kaksi kokei- • · · den päätyyppiä, joista käytetään yleisesti nimitystä märkälaboratorio ja in-30 silico. Mutta datajoukkojen 202 suunnasta nähtynä kaikki kokeet näyttävät sa-·*·„ moilta. Koeosa 208 toimii siltana datajoukkojen 202 ja kokeiden kahden pää- tyypin välillä. Jo suoritettujen kokeiden lisäksi koeosaa 208 voidaan käyttää tallentamaan tulevia kokeita. Kokeiden edullisia objektiperustaisia toteutuksia se- • 4 · : ^* lostetaan kuvion 9 yhteydessä. Koeosan eräs tärkeä suunnittelutavoite on da- 35 tan seurattavuus, kuten kuvion 11 yhteydessä lähemmin selostetaan.
• * · * ·♦ m · «4· * · • · *** 7 118063
Biomateriaaliosa 210 sisältää tietoa populaatioista, yksilöistä, rea-genteista tai muiden biomateriaalien näytteistä (mitä tahansa, jota voidaan tutkia biologisena järjestelmänä tai sen komponenttina) IMS:ssä. Biomateriaalit kuvataan edullisesti datajoukkoina 202 käyttäen VDL:ää kuvaamaan kunkin 5 biomateriaalin hierarkkisesti, eli muuttuvalla detaljitasolla, kuten populaationa, yksilönä, reagenttina ja näytteenä. Eräs edullinen biomateriaaliosan 210 objek-tiperusteinen toteutus selostetaan kuvion 10 yhteydessä.
Biomateriaaliosa 210 kuvaa reaalimaailman biomateriaaleja, mutta polkuosa 212 kuvaa biomateriaalien teoreettisia malleja. Biokemialliset polut 10 ovat jossakin määrin analogisia elektronisten piirien piirikaavioiden kanssa. Polut voidaan kuvata IMS:ssä monella tavalla, mutta kuvio 2 esittää erään edullisen toteutuksen pääpiirteet. Kuvion 2 esimerkissä kukin polku 212 käsittää yhden tai useamman yhteyden 216, joista kukin liittyy yhteen tai useampaan biokemialliseen olioon 218 ja yhteen interaktioon 222.
15 Biokemialliset oliot tallennetaan biokemiallisten olioiden osassa 218.
Kuvion 2 esimerkissä kukin biokemiallinen olio on luokkaobjekti, jonka alaluokat ovat geeni 218-1, transkripti 218-2, proteiini 218-3, makromolekyylikomp-leksi 218-4 ja yhdiste 218-5. Edullisesti on myös optio tallentaa abioottinen heräte 218-6, kuten lämpötila, jolla on potentiaalisia yhteyksiä interaktioihin ja po-20 tentiaalisia vaikutuksia relevantteihin kineettisiin lakeihin.
Tietokantaviiteosa 220 toimii siltana ulkoisiin tietokantoihin. Kukin tietokantaviite osassa 220 on relaatio sisäisen biokemiallisen olion 218 ja ul-koisen tietokannan olion välillä, kuten Affymetrix Inc. -yhtiön spesifinen koetin- • · · joukko.
25 Interaktio-osa 222 sisältää biokemiallisten olioiden välisiä interaktio!- • · *···’ ta, mukaanlukien reaktioita. Kineettisten lakien osa 224 kuvaa (hypoteettisia tai * ‘ kokeellisesti varmennettuja) kineettisiä lakeja, jotka vaikuttavat interaktioihin.
: V Polkujen edullisia ja yksityiskohtaisempia toteutuksia selostetaan kuvioiden 7A, • · · 7B ja 8 yhteydessä.
30 Keksinnön erään edullisen suoritusmuodon mukaisesti IMS tallentaa myös paikkatietoa 214. Paikkatietoon viitataan biomateriaaliosasta 210 ja pol-.*·*; kuosasta 122. Esimerkiksi biomateriaaleihin liittyvän informaation suhteen ku- viossa 2 näytetty organisaatio sallii minkä tahansa detaljitason tai tarkkuuden • · · : # yhtäältä populaation ja toisaalta solun spatiaalisen pisteen (koordinaattien) vä- 35 Iillä. Kuviossa 2 näytetyssä esimerkissä paikkatieto käsittää organismin 214-1 (esimerkiksi ihminen), elimen 214-2 (esim. sydän, mahalaukku), kudoksen * · • · · • · • · * · · 8 118063 214-3 (esim. sileä lihaskudos, hermokudos), solutyypin 214-4 (esim. lieriöepi-teelisolu), solun osa 214-5 (eg tuma, solulima) ja avaruuspisteen 214-6 (eg x = 0.25, y = 0.50, z = 0.75 suhteessa suorakulmaisen referenssisolun dimensioihin. Organismi tallennetaan edullisesti taksonomiapuuna, jossa on solmu kulle-5 kin tunnetulle organismille. Elin-, kudos-, solutyyppi- ja solun osa -lohkot voidaan toteuttaa yksinkertaisina listoina. Tallentamalla paikkatieto viittauksena ennalta määrättyihin listoihin saadaan se etu, että tällainen viittaus pakottaa automaattiseen syntaksintarkastukseen. On siis mahdotonta tallentaa paikkatietoa, joka viittaa väärinkirjoitettuun tai olemattomaan elimeen tai organismiin. 10 Keksinnön erään toisen edullisen suoritusmuodon mukaisesti paik katieto voi käsittää myös spatiaalista tietoa 214-6, kuten spatiaalisen pisteen organismi-soluhierarkian kaikkein detaljoiduimmassa paikassa. Jos kaikkein detaljoiduin paikka osoittaa spesifistä solua tai solun osaa, niin spatiaalinen piste voi edelleen määrittää kyseistä tietoa relatiivisina spatiaalisina koordi-15 naatteina. Solutyypistä riippuen spatiaaliset koordinaatit voivat olla suorakulmaisia tai napakoordinaatteja.
Eräs tällaisen paikkatiedon etu on parempi ja systemaattinen tapa verrata paikkoja näytteissä ja teoreettisissa rakenteissa, kuten poluissa, jotka on varmennettava relevanteilla mittaustuloksilla.
20 Muuttujankuvauskieli
Kuviot 3A ja 3B esittävät edullista muuttujankuvauskieltä eli VDL:ää. Yleisesti ottaen muuttuja on mitä tahansa, jolla on arvo ja joka edustaa biologi-sen järjestelmän tilaa (joko tosielämän biomateriaalia tai teoreettista mallia).
• · ·
Kun IMS otetaan käyttöön, suunnittelija ei tiedä, minkälaisia biomateriaaleja :...* 25 tullaan kohtaamaan tai minkälaisia kokeita tullaan suorittamaan tai mitä tulok- siä näistä kokeista tullaan saamaan. Niin ollen muuttujakuvausten on oltava \\· avoimia tuleville laajennuksille. Toisaalta avoimuus ja joustavuus eivät saa joh- taa anarkiaan, minkä vuoksi tulisi varmistaa, että muuttujakuvauksiin sovelletaan hyvin määriteltyjä sääntöjä. Nämä tarpeet tyydytetään parhaiten laajen-m 30 nettavalla muuttujankuvauskielellä (variable description language, VDL).
*···. Esimerkiksi extendible markup language (XML) on eräs esimerkki • * laajennettavasta kielestä, jota voitaisiin periaatteessa käyttää kuvaamaan bio- • · · : logisia muuttujia. Tietokoneet tulkitsevat XML-lausekkeita melko helposti. XML- • · lausekkeet pyrkivät kuitenkin olemaan hyvin pitkiä, minkä vuoksi ihmisten on 35 vaikea lukea niitä. Sen vuoksi tarvitaan laajennettavaa VDL:ää, joka on kom- /.··*. paktimpi ja ihmisille ja tietokoneille helppolukuisempi kuin XML.
• · • · · 118063 9
Laajennettavan VDL:n idea on, että sallittavat muuttujalausekkeet ovat "vapaita mutta ei kaoottisia”. Tämä idea voidaan esittää formaalimmin sanomalla, että IMS:n tulisi sallia vain ennalta määrättyjä muuttujia, mutta ennalta määrättyjen muuttujien joukon tulisi olla laajennettavissa ilman ohjelmoin-5 titaitoja. Esimerkiksi jos muuttujalausekkeille suoritettava syntaksintarkastus on kiinteästi koodattu syntaksintarkastusrutiiniin, jokainen uusi muuttujalauseke vaatii uudelleenohjelmointia. Optimaalinen kompromissi tiukan järjestyksen ja kaaoksen välillä voidaan toteuttaa tallentamalla sallittavat muuttuja-avainsanat tietorakenteeseen, kuten datatauluun tai tiedostoon, joka on muutettavissa il-10 man uudelleenohjelmointia. Normaaleja pääsynhallintatekniikoita voidaan käyttää määrittämään, mitkä käyttäjät ovat valtuutettuja lisäämään uusia sallittavia muuttuja-avainsanoja.
Kuvio 3A esittää muuttujalauseketta edullisella VDL:llä. Muuttujalauseke 30 käsittää yhden tai useamman avainsana-nimiparin 31, jotka on erotet-15 tu rajoittimilla. Kuten kuvion 3A esimerkissä näytetään, kukin avainsana-nimi-pari 31 koostuu avainsanasta 32, avaavasta rajoittimesta (kuten avaavasta hakasulusta) 33, (muuttujan) nimestä 34 ja sulkevasta rajoittimesta (kuten sulkevasta hakasulusta) 35. Esimerkiksi “Ts[2002-11-26 18:00:00]” (ilman lainausmerkkejä) on esimerkki aikaleimasta. Jos on useita avainsana-nimipareja 20 31, niin parit voidaan erottaa erottimella 36, kuten välilyönnillä tai sopivalla pre positiolla. Erotin ja toinen avainsana-nimipari 31 on piirretty katkoviivoilla, koska ne ovat valinnaisia. Elementtien 32 - 36 väliset &-merkit osoittavat merkkijo-..... noyhdistämistä. Toisin sanoen &-merkit eivät sisälly muuttujankuvaukseen.
I « · I *. Mitä kielen syntaksiin tulee, niin muuttujankuvaus voi käsittää mieli- *;./ 25 valtaisen määrän avainsana-nimipareja 31. Mutta mielivaltainen parien 31 yh- • *···* distelmä, kuten esimerkiksi ajan konsentraatio, ei ehkä ole semanttisesti miele- käs.
• V Kuvio 3B esittää tyypillisten avainsanojen taulukkoa. Taulukon 38 ϊ,..ϊ kunkin merkinnän vieressä on sen selkokielinen kuvaus 38’ ja havainnollistava 30 esimerkki 38”. Huomattakoon, että taulukko 38 on tallennettu IMS:ään, mutta ·*·., muita taulukoita 38’ ja 38” ei välttämättä ole tallennettu (niiden tarkoitus on .**. vain selventää taulukon 38 kunkin avainsanan merkitystä). Esimerkiksi avain sanan "T" esimerkki on “T[-2.57E-3]”, joka on yksi tapa ilmaista miinus 2.57 ί ·* millisekuntia ennen referenssiaikaa. Referenssiaika voidaan osoittaa aikalei- * * * 35 man avainsanalla ”Ts”.
* • · • * · • #· * · ··* * * * * ·*· 118063 10
Avainsanat ”T” ja ”Ts” toteuttavat vastaavasti suhteellisen (sekuntikello-) ajan ja absoluuttisen (kalenteri-) ajan. Ilmaisemalla aika suhteellisen ja absoluuttisen ajan yhdistelmänä tuo sen pienen haitan, että kullakin ajanhet-kellä on teoriassa ääretön määrä ekvivalenttisia lausekkeita. Esimerkiksi 5 “Ts[2002-11-26 18:00:30]” ja “Ts[2002-11-26 18:00:00]T[00:00:30]” ovat ekvi valenttisia. Niinpä on edullista olla hakulogiikka, joka prosessoi aikalausekkeet mielekkäällä tavalla.
Tallentamalla IMS:n taulukkoon 38 merkintä kutakin sallittavaa avainsanaa kohti on mahdollista pakottaa syötettäville muuttujille automaatti-10 nen syntaksintarkastus, kuten kuviossa 3C näytetään.
Edullisen VDL:n syntaksi voidaan ilmaista formaalisti seuraavalla tavalla: <muuttujan kuvaus>::=<avainsana>T<nimi>”]”{{erotin}<avainsana>T<nimi>”]”}<loppu> <avainsana>::=<jokin ennalta määrätty avainsana, ks. esim. taulu 38> 15 <nimi>:;=<merkkijono> | “*" = mikä tahansa nimi relevantissa datataulussa
Eksplisiittisten rajoittimien, kuten”[” ja ”]” nimen ympärillä, tarkoitus on sallia nimessä mikä tahansa merkki, mukaanlukien välilyönnit (muttei tietenkään rajoittimia).
Eräs edullinen avainsanojen joukko 38 käsittää kolmenlaisia avain-20 sanoja: mitä, missä ja koska. ’’Mitä” avainsanat, kuten muuttuja, yksikkö, biokemiallinen olio, vuorovaikutus, jne., osoittavat mitä havaittiin tai tullaan havaitsemaan. ’’Missä” avainsanat, kuten näyte, populaatio, yksilö, paikka, jne., osoitta-vat missä havainto tehtiin tai tullaan tekemään. ’’Koska” avainsanat, kuten aika • · : tai aikaleima, osoittavat havainnon aikaa.
• · · 25 Kuvio 3C esittää valinnaista syntaksintarkastusprosessia. Formaalin • · ***. VDL:n eräs etu on, että se sallii automaattisen syntaksintarkastuksen. Kuvio ,* ,* 3C esittää tilakonetta 300 tällaisen syntaksintarkastuksen suorittamiseksi. Tila- • · · • ·* koneet voidaan toteuttaa tietokonerutiineina. Alkutilasta 302 lähtien pätevä • · · ' avainsana aiheuttaa siirtymän ensimmäiseen välitilaan 304. Mikä tahansa muu 30 aiheuttaa siirtymän virhetilaan 312. Ensimmäisestä välitilasta 304 avaava rajoi- : *.· tin aiheuttaa siirtymän toiseen välitilaan 306. Mikä tahansa muu aiheuttaa siir- :***: tymän virhetilaan 312.
• · ♦
Avaavan rajoittunen jälkeen nimen osaksi hyväksytään mitä tahansa merkkejä paitsi sulkeva rajoitin, ja tilakone pysyy toisessa välitilassa 306. Vain * ♦ *“·* 35 muuttujalausekkeen ennenaikainen päättyminen aiheuttaa siirtymän virhetilaan 312. Sulkeva rajoitin aiheuttaa siirtymän kolmanteen välitilaan 308, jossa yksi • · ♦ • ♦ • · 118063 11 avainsana/nimipari on pätevästi ilmaistu. Pätevä erotinmerkki aiheuttaa paluun ensimmäiseen välitilaan 304. Muuttujalausekkeen lopun ilmaisu aiheuttaa siirtymän ”OK” -tilaan 310, jossa muuttujalauseke todetaan syntaksiltaan oikeaksi.
Kuvio 4 näyttää esimerkkejä VDL-kielisistä yhdistetyistä muuttuja-5 lausekkeista. Yhdistetyt muuttujalausekkeet ovat lausekkeita, joissa on useita avainsana/nimipareja. Huomattakoon, kuinka muuttujien spesifisyys kasvaa kun määreitä lisätään. Viitenumerot 401 - 410 osoittavat viittä ekvivalenttisten lausekkeiden paria siten, että kunkin parin ensimmäinen lauseke on monisa-naisempi ja toinen on kompaktimpi. Tietokoneelle monisanaiset ja kompaktit 10 lausekkeet ovat samanarvoisia, mutta niitä lukevat ihmiset saattavat pitää monisanaista muotoa helpommin ymmärrettävänä. Kuvion 4 lausekkeet ovat itsestään selviä taulukkoon 38 tehtävän viittauksen perusteella. Esimerkiksi lausekkeet 409 ja 410 määrittelevät reaktionopeuden vuorovaikutuksen EC
2.7.7.13-PSA1 kautta mooleina litraa ja sekuntia kohti. Viitenumero 414 osoit-15 taa muuttujalauseketta “ν[*]Ρ[*]ΟΠΙ_Πυ[*]”, joka tarkoittaa minkä tahansa organismin minkä tahansa proteiinin mitä tahansa muuttujaa missä tahansa yksiköissä. Viitenumerot 415 ja 416 osoittavat kahta erilaista muuttujalauseketta kahdelle erilaiselle ajan ilmaukselle. Muuttujalauseke 415 määrittelee kolmen tunnin aikavälin ja muuttujalauseke 417 määrittelee 10 sekunnin aikavälin (joka 20 alkaa viisi sekuntia ennen aikaleimaa ja päättyy viisi sekuntia sen jälkeen).
Huomattakoon, että IMS:ää käyttävien ihmisten kielestä riippumatta on edullista sopia yhteisestä kielestä muuttujalausekkeita varten. Vaihtoehtoi- sesti IMS voi käsittää käännösjärjestelmän muuttujalausekkeiden kääntämi- .·.*· seksi ihmisten eri kielille.
• * · I./ 25 Olennaisesti yllä kuvatun kaltainen VDL on hyvin määritelty, koska vain kuviossa 3C näytetyn syntaksintarkastuksen läpäisevät lausekkeet hyväksytään. VDL on avoin, koska sallitut avainsanat talletetaan taulukkoon 38, joka i · < : ·* on laajennettavissa. VDL on kompakti, koska avainsanoja varten käytetään • · · olennaisesti minimimäärä kirjaimia tai merkkejä. Yleisimmät avainsanat koos-30 tuvat yhdestä kirjaimesta, tai kahdesta kirjaimesta, mikäli yhden kirjaimen avainsana ei ole yksikäsitteinen.
• ·· • · *T Datakontekstit ·* * ' ♦* Kuvio 5 näyttää, kuinka VDL:ää voidaan käyttää ilmaisemaan erilai- • · · siä datakonteksteja eli biologisen tutkimuksen laajuutta (scopes). Kaikki muut-35 tujat, olivatpa ne sitten näytteitettyjä, mitattuja, mallinnettuja, simuloituja tai mi- • · .···. ten tahansa prosessoituja, voidaan ilmaista: » « ··· 118063 12 a) yksinkertaisina arvoina biomateriaalinäytteelle jonakin ajanhetkenä; b) ajan funktiona biomateriaalille; c) stokastisina muuttujina jakaumineen kunakin ajanhetkenä pe- 5 rustuen käytettävissä oleviin biomateriaalinäytteisiin; tai d) stokastisina prosesseina biologisessa datakontekstissa.
a), b) ja c) ovat d:n projektioita, joka on järjestelmän rikkain esitys. Kaikki IMS:ssä oleva data on kolmeulotteisessa kontekstiavaruudessa, jolla on relaatiot: 10 1. muuttujalistoihin ("mitä”); 2. biomateriaalin listoihin ("missä”) ja 3. aikapisteiden tai-intervallien listoihin ("milloin”).
Viitenumero 500 osoittaa yleisesti N + 2-ulotteista kontekstiavaruut- ta, jossa on yksi akseli kullekin muuttujalle (N), biomateriaaleille ja ajalle. Eräs 15 hyvin yksityiskohtainen muuttujalauseke 510 spesifioi muuttujan (mannoosin konsentraatio mooleina litrassa), biomateriaalin (populaatio abcd1234) ja aika-leiman (10.6.2003 klo 12:30). Muuttujan arvo on 1,3 mol/l. Koska muuttujalauseke 510 spesifioi kontekstiavaruuden kaikki koordinaatit, se esitetään pisteenä 511 kontekstiavaruudessa 500.
20 Seuraava muuttujalauseke 520 on vähemmän detaljoitu sikäli, että se ei spesifioi aikaa. Siksi muuttujalauseke 520 esitetään ajan funktiona 521 kontekstiavaruudessa 500.
Kolmas muuttujalauseke 530 spesifioi ajan, mutta ei biomateriaalia.
• · : Sen vuoksi se esitetään kaikkien niiden biomateriaalien jakaumana 531, jotka .1··♦1 25 kuuluvat kokeeseen spesifioituna aikana.
φ · *‘\ Neljäs muuttujalauseke 540 ei spesifioi aikaa eikä biomateriaalia.
„ , Se esitetään ajan funktioiden joukkona 541 ja eri biomateriaalien jakaumien • t · it>·1 joukkona 542.
• · *···1 Muuttujankuvauskielen mahdollistamien erilaisten lausekkeiden ja 30 sopivasti järjestettyjen (seuraavaksi selostettavien) datajoukkojen ansiosta tut- • · • ’·· kijoilla on käytännöllisesti katsoen rajattomat mahdollisuudet tutkia biologisen järjestelmän aika-tila-avaruutta moniulotteisena stokastisena prosessina. Jär-jestelmän probabilistiset aspektit perustuvat relevanttien biomateriaalien tapah- • 1 \,'.t tuma-avaruuteen, ja dynaamiset aspektit perustuvat aika-avaruuteen. Biomate- *“· 35 riaalidata ja aika voidaan rekisteröidä, kun relevantit kokeet dokumentoidaan.
• · l · I • ·· • · · · • · * · ·»1 118063 13
Kaikki kvantitatiiviset mittaukset, data-analyysit, mallit ja simulointi-tulokset voidaan käyttää uudelleen uusissa analyysitekniikoissa relevantin taustainformaation, kuten mitattujen biomateriaalien fenotyyppien, löytämiseksi, kun dataa tulee tulkita eri sovelluksiin, 5 Datajoukot
Kuviot 6A ja 6B esittävät keksinnön edullisen suoritusmuodon mukaisia datajoukkoja. Sekä märkälaboratorio- että in-silico -tyyppiset kokeet tallennetaan datajoukkoina. Kuviossa 6A esimerkinomainen datajoukko 610 kuvaa mRNA-molekyylien joukon 610 (on näytetty mRNA1 - mRNA6) ilmentymis-10 tasoja. Datajoukko 610 on yksi esimerkki kuviossa 2 näytettyyn datajoukko-osi-oon 202 tallennetusta datajoukosta. Datajoukko 610 käsittää neljä matriisia 611 - 614. Muuttuja-arvomatriisi 614 kuvaa muuttujien arvot rivi-sarake -organisaatiossa. Rivienkuvauslista 613 määrittää muuttuja-arvomatriisin rivien merkityksen. Sarakkeidenkuvauslista 612 määrittää muuttuja-arvomatriisin sarakkei-15 den merkityksen. Lopuksi, kiinteiden dimensioiden kuvaus 611 määrittää yhden tai useamman kiinteän dimension, jotka ovat yhteisiä muuttuja-arvomatriisin 614 kaikille arvoille. Huomattakoon, että muuttuja-arvomatriisi 614 koostuu skalaarinumeroista. Muut matriisit 610 - 613 käyttävät VDL:ää sisältönsä merkityksen spesifioimiseen.
20 Kuvio 6A näyttää myös ihmisille luettavan version 615 datajoukosta 610. Huomattakoon, että datajoukon ihmisille luettava versio 615 on näytetty . . vain tämän suoritusmuodon parempaa ymmärtämistä varten. Ihmisille luetta- • · ***** vaa versiota 615 ei välttämättä tallenneta mihinkään, ja se voidaan luoda data- ♦ · · ’•'tl joukosta 610 automaattisesti, koska tahansa kun tarve tähän esiintyy. Ihmisille 25 luettava versio 615 on esimerkki datajoukoista, kuten taulukkolaskennan tie-dostoista, joita tyypillisesti tallennetaan tunnetuissa IMS:issä biologista tutki-j *,J musta varten. IMS käsittää edullisesti käyttöliittymälogiikan automaattista kak- sisuuntaista muunnosta varten tallennusformaatin 611 - 614 ja ihmisille luetta-van version 615 välillä.
:\t# 30 Kuvio 6B esittää toista datajoukkoa 620. Datajoukko 620 spesifioi *.···. myös kuuden mRNA-molekyylin ilmentymistasoja, mutta nämä eivät ole kuu- • * den eri yksilön ilmentymistasoja vaan yhden populaation ilmentymistasoja nel- · · : V jänä eri aikana. Datajoukossa 620 kiinteiden dimensioiden kuvaus 621 spesifi- ϊ...: oi, että data liittyy tietyn hiivan näytteeseen xyz tiettynä päivänä ja aikana. Sa- ,·*. : 35 rakkeidenkuvauslista 622 spesifioi, että sarakkeet spesifioivat dataa neljälle • ·· .*..* ajanhetkelle, nimittäin 0, 30, 60 ja 120 sekuntia kiinteiden dimensioiden kuva- * * « · * 118063 14 uksen 621 aikaleiman jälkeen. Rivienkuvauslista 623 on hyvin samanlainen kuin edellisen esimerkin vastaava lista 613, ja ainoa ero on, että viimeinen rivi osoittaa lämpötilaa eikä potilaan ikää. Muuttuja-arvomatriisi 624 sisältää todelliset numeroarvot.
5 Kunkin datajoukon (esimerkiksi datajoukon 610) jakaminen neljään eri komponenttiin (matriisit 611 - 614) voidaan toteuttaa siten, että kukin matriisi 611 - 614 on erikseen osoitettava datarakenne, kuten tiedosto tietokoneen tiedostojärjestelmässä. Vaihtoehtoisesti muuttuja-arvomatriisi voidaan tallentaa yhtenä osoitettavana datarakenteena, kun taas muut kolme matriisia (kiintei-10 den dimensioiden kuvaus ja rivi/sarakekuvaukset) voidaan tallentaa toisena datarakenteena, kuten yhtenä tiedostona, jossa on otsakkeet ’’yhteiset”, ’’rivit” ja ’’sarakkeet”. Eräs avainelementti tässä on se, että muuttuja-arvomatriisi talletetaan erillisenä datarakenteena, koska se on datajoukon todellisia numeroarvoja sisältävä komponentti. Jos numeroarvot tallennetaan erikseen osoitetta-15 vaan datarakenteeseen, kuten tiedostoon tai taulukkoon, se voidaan helposti prosessoida erilaisilla datanprosessointisovelluksilla, kuten tiedonrikastuksella (data mining) tai vastaavilla. Toinen etu on, että eri matriiseja muodostavia erillisiä dataelementtejä ei tarvitse prosessoida SQL-kyselyillä. SQL-kysely noutaa vain datajoukon osoitteen tai muun tunnisteen mutta ei erillisiä dataelementte-20 jä, kuten matriiseissa 611 - 614 olevia numeroita ja kuvauksia.
Polut
Kuvio 7A on IMS:ään tallennetun polun (pathway) lohkokaavio. Kek- • · · sinnön mukainen IMS tallentaa kunkin biologisen järjestelmän strukturoituna * · · polkumallina 700 järjestelmän komponenteista ja komponenttien välisistä yhte-*···*, 25 yksistä (connections). Järjestelmän komponentteja ovat biokemialliset oliot 218 • I·*· ja vuorovaikutukset 222. Biokemiallisten olioiden 218 ja vuorovaikutusten 222 ·· · ' ' *: ·* väliset yhteydet 216 tunnistetaan itsenäisiksi objekteiksi, jotka edustavat kun- * » · kin biokemiallisen olion roolia (esimerkiksi substraatti, tuote, aktivaattori tai inhibiittori) kunkin polun kussakin vuorovaikutuksessa. Yhteys voi sisältää attri-30 buutteja, jotka ovat spesifisiä kullekin biokemialliselle oliolle ja vuorovaikutus-parille (kuten stökiömetrinen kerroin). Kuten aiemmin todettiin, IMS tallentaa ··· edullisesti paikkatietoa, ja kukin polku 212 liittyy bioloogiseen paikkaan 214.
• · · :mm\ Yksi biologinen paikka voidaan kuvata yhdellä tai useammalla polulla riippuen • · '···* polkuun sisällytettyjen detaljien tasosta.
35 Objektipohjaisessa toteutuksessa biokemiallinen polkumalli perus- • · .**· tuu kolmeen objektikategoriaan: biokemialliset oliot (molekyylit) 218, vuorovai- * · · 118063 15 kutukset (kemialliset reaktiot, transkriptio, translaatio, kokoonpano, hajottaminen, translokaatio, jne.) 222 sekä polun biokemiallisten olioiden ja vuorovaikutusten väliset yhteydet 216. Ajatuksena on erottaa nämä kolme objektia niiden käyttämiseksi omine attribuutteineen ja käyttää yhteyttä sisältämään kunkin 5 biokemiallisen olion rooli (kuten substraatti, tuote, aktivaation tai inhibiittori) ja stökiömetriset kertoimet kussakin vuorovaikutuksessa, joka tapahtuu tietyssä biokemiallisessa verkossa. Tämän lähestymistavan etuna on eksplisiittisen mallin selkeys ja helppo synkronointi, kun useat käyttäjät modifioivat samaa polkua yhteys kerrallaan. Käyttöliittymälogiikka voidaan suunnitella tarjoamaan 10 polkujen helposti ymmärrettäviä visualisointeja, kuten kuvion 8 yhteydessä tullaan esittämään.
Kineettisten lakien osio 224 kuvaa vuorovaikutuksiin vaikuttavat teoreettiset tai kokeelliset kineettiset lait. Esimerkiksi vuo substraatista kemialliseen reaktioon voidaan ilmaista seuraavalla kaavalla: .5 „ Vmax[s][E] K .-[s] missä V on substraatin virtausnopeus, Vmax ja K ovat vakioita, [5] on alustan konsentraatio ja [£] on entsyymin konsentraatio. Reaktionopeus vuorovaikutuksen läpi voidaan laskea jakamalla vuo substraatin stökiömetrisellä kertoimella.
20 Biokemiallinen verkko ei välttämättä päde kaikkialla. Toisin sanoen verkko on tyypillisesti paikkasidonnainen. Sen vuoksi polkujen 212 ja biologi-sesti relevanttien diskreettien paikkojen välillä on relaatioita, kuten kuvioissa 1 • · : ja 7A näytetään.
• ·· ,!··'. Monimutkainen polku voi sisältää muita polkuja 700. Eri polkujen 25 700 yhdistämiseksi malli tukee polkuyhteyksiä 702, joista kullakin on viisi relaa- ,* tiota, jotka selostetaan kuvion 7B yhteydessä.
• · : Kuvio 7B näyttää esimerkin monimutkaisesta polusta, joka sisältää yksinkertaisempia polkuja. Kaksi tai useampia polkuja voidaan yhdistää, jos niillä on yhteisiä biokemiallisia olioita, jotka voivat siirtyä sellaisinaan relevant-j**·· 30 tien paikkojen tai yhteisten vuorovaikutusten välillä (esimerkiksi translokaatio- tyyppinen vuorovaikutus, joka siirtää biokemiallisia olioita paikasta toiseen). Muussa tapauksessa polkuja pidetään erillisinä.
Viitenumeron 711 osoittama polku A on pääpolku poluille B ja C, joi-*···’ ta osoitetaan vastaavasti viitenumeroilla 712 ja 713. Polut 711 - 713 ovat peri- 35 aatteessa samanlaisia kuin yllä selostettu polku 700. Kaksi polkuyhteyttä 720 ··· • · • · • · t 118063 16 ja 730 kytkevät polut B ja C, 712 ja 713, pääpolkuun A, 711. Esimerkiksi polku-yhteydellä 720 on pääpolkurelaatio 721 polkuun A, 711; "polusta” relaatio 722 polkuun B, 712; ja ’’polkuun" relaatio 723 polkuun C, 713. Lisäksi sillä on "yhteinen olio” -relaatiot 724, 725 polkuihin B, 712 ja C, 713. Selväkielellä "yhtei-5 nen olio” -relaatiot 724, 725 tarkoittavat, että polut B ja C jakavat relaatioiden 724 ja 725 osoittaman biologisen olion.
Toisella polkuyhteydellä 730 on sekä "pääpolku” että "polusta” -relaatiot polkuun A, 711 ja "polkuun” -relaatio polkuun C, 713. Lisäksi sillä on "yhteinen vuorovaikutus” -relaatiot 734, 735 polkuihin B, 712 ja C, 713. Tämä 10 tarkoittaa, että polut B ja C jakavat relaatioiden 734 relaatioiden 734 ja 735 osoittaman vuorovaikutuksen.
Yllä selostettu polkumalli tukee epätäydellisiä malleja, jotka voidaan rakentaa vaiheittain tietämyksen lisääntyessä. Tutkijat voivat valita detaljitason tarpeen vaatiessa. Jotkut polut voidaan kuvata suhteellisen karkealla tavalla. 15 Muut polut voidaan kuvata aina kineettisiin lakeihin ja/tai spatiaalisiin koordinaatteihin asti. Malli tukee myös epätäydellistä informaatiota olemassa olevista sekvenssitietokannoista. Esimerkiksi jotkut polkukuvaukset voivat selostaa geenin transkription ja translaation erikseen, kun taas muut käsittelevät niitä yhtenä yhdistettynä vuorovaikutuksena. Kutakin aminohappoa voidaan käsitel-20 lä erikseen, tai kaikki aminohapot voidaan yhdistää yhteen olioon nimeltä aminohapot.
Polkumalli tukee myös automaattisia mallinnusprosesseja. Solmu- .·,*· yhtälöitä voidaan muodostaa automaattisesti kunkin biokemiallisen olion aika- • ** derivaatoille, kun relevantit kineettiset lait ovat käytettävissä kullekin vuorovai-***. 25 kutukselle. Erityistapauksessa stökiömetrisiä taseyhtälöitä voidaan muodostaa / automaattisesti vuotaseanalyysejä varten. Polkumalli tukee myös automaatti- • · · : ·* siä päästä-päähän -työvirtoja, mukaanlukien mittausdatan erottaminen mallin- tamalla, ylimääräisten rajoitteiden mukaanotto ja yhtälöryhmien ratkaisu, aina erilaisiin data-analyyseihin ja potentiaalisiin automaattisiin merkintöihin asti.
30 Automaattinen polkumallinnus voi perustua polun topologiatietoihin, muuttujanimien kuvaamiseen käytettäviin VDL-lausekkeisiin, sovellettaviin ki- • * · neettisiin lakeihin (kuten stökiömetrisiin kertoimiin) ja matemaattisiin tai loogi-siin operaattoreihin ja funktioihin. Parametrit, joita ei tunneta tarkasti, voidaan • · *·;·* estimoida tai päätellä mittausdatasta. Oletusyksiköitä voidaan käyttää yksin- :*·.! 35 kertaistamaan muuttujankuvauskielisiä lausekkeita. Esimerkiksi: • t · • * * · • · * 118063 17 dV[concentration]C[mannose]/dV[time] = V[fiux]C[mannose]l[EC 2.7.713_PSA1] +...
- V[flux]C[mannose]l[EC ... ]-...
dV[concentration ]C[waterVdV[time] = V[flux]C[water]l[EC... ] + ...
5 - V[flux]C[water] l[ EC... ]-...
Tässä yhtälössä biokemialliset oliospesifiset vuot voidaan korvata reaktionopeuksilla, jotka on kerrottu stökiömetrisillä kertoimilla. Tässä esimerkissä stökiömetriset kertoimet ovat ykkösiä, esimerkiksi:
Yhtälöt voidaan kirjoittaa seuraavasti: 10 dV[concentration]C[mannose]/dV[time] = 1*V[reactionrate]l[EC2.7.7.13_PSA1] + „.
- 1*V[rection rate]l[ EC... )-...
dV[concentration ]C[water]/dV[timej = 1*V[reaction rate]l[EC... ] + ...
- 1*V[reaction rate]l[EC... ]-...
15 Staattisessa tapauksessa derivaatat ovat nollia. Tämä johtaa vuo- tasemalliin: 0 = 1*V[reaction rate]l[EC 2.7,7.13_PSA1] +... · rvfrection rate]l[ EC... ]-...
20 0 = 1*V[reaction rate]l[EC... ] + ...
- 1*V[reaction rate]l[ EC... ]-...
Käyttäjä voi tuottaa omat tavoitefunktionsa ja ylimääräiset reunaeh- * * * 1/. tonsa tai mittaustuloksensa, jotka rajoittavat mahdollisten ratkaisujen joukkoa.
Vielä eräs edullinen piirre on kyky mallintaa kohinaa vuotaseanalyy- • · '···] 25 sissä. Voimme lisätä keinotekoisia kohinamuuttujia, jotka tulee minimoida ta- * * voitefunktiossa. Tämä helpottaa epätarkkojen mittausten hyväksymistä koh- • · · *:*.*· tuullisin tuloksin.
• * ·
Malli tukee myös visuaalisten polkuratkaisujen (aktiivisten reunaehtojen) visualisointia. Yleinen tapaus johtaa tavallisten differentiaaliyhtälöiden 30 (ordinary differential equations, ODE) malliin, jossa tarvitaan kineettisiä lakeja. Niitä voidaan kerätä tietokantaan, mutta voi olla joitakin oletuslakeja, joita käy-tetään tarvittaessa. Yleisissä yhtälöissä vuorovaikutuskohtaiset reaktionopeu- • * · : ·* det korvataan kineettisillä laeilla, kuten Michaels-Menten -laeilla, jotka sisältä- • * * * vät entsyymien ja substraattien konsentraatioita. Esimerkiksi; ;*·.· 35 V[reactionrate]l[EC2.7.7.13_PSA1] = 5.2*V[concentrationlP[PSA1]*V[concentration]C[...]/(3.4 + V[concentration]C[...]) • · • · · f « · • * · 18" ' ......
118063
Yhtälöt voidaan muuntaa muotoon: dV[concentration ]C[mannose]/dV[time] = 5.2*V[concentration]P[PSA1]*V[concentration]C[..,] / (3.4 + V[concentration]C[...]) + ...
-7.9‘V[concentration]P[... ]*V[concentration]C[...]/(...) 5 ...
dV[concentration ]C[water]/dV[time] = 10.0*V(concentration] P[...]*V[concentration]C[..
- 8.6*V[concentration ]P[...]*V[concentration]C[...
On vaihtoehtoisia toteutuksia. Esimerkiksi yllä tehdyn sijoituksen asemasta voidaan laskea kineettiset lait erikseen ja sijoittaa numeroarvot spe-10 sifisiin reaktionopeuksiin iteratiivisesti.
Tällaisen rakenteellisen polkumallin etuna on, että hierarkkisia polkuja voidaan tulkita tietokoneilla. Esimerkiksi käyttöliittymälogiikka voi kyetä tuottamaan hierarkkisten polkujen helposti ymmärrettäviä visualisointeja, kuten kuvion 8 yhteydessä näytetään.
15 Kuvio 8 näyttää polun visualisoitua muotoa, jota yleisesti osoitetaan viitenumerolla 800. Käyttöliittymälogiikka piirtää visualisoidun polun 800 kuvioissa 1 ja 7A näytettyjen elementtien 212 - 224 perusteella. Ympyrät 810 esittävät biokemiallisia olioita. Laatikot 820 esittävät vuorovaikutuksia ja reunat 830 esittävät yhteyksiä. Yhtenäiset nuolet 840 biokemiallisesta oliosta vuoro-20 vaikutukseen esittävät substraattiyhteyksiä, missä vuorovaikutus kuluttaa biokemiallista oliota. Yhtenäiset nuolet 850 vuorovaikutuksesta biokemialliseen :Y: olioon esittävät tuotosyhteyttä, missä vuorovaikutus tuottaa biokemiallista olio- :*·.· ta. Katkoviivoin esitetyt nuolet 860 esittävät aktivaatioita, missä biokemiallista • · .**·. oliota ei kuluteta eikä tuoteta, mutta se tekee vuorovaikutuksen mahdolliseksi • · 25 tai kiihdyttää sitä. Katkoviivat 870, joilla on poikittaisviivapäät, esittävät inhibiti- » · ..... ota, missä biokemiallista oliota ei kuluteta eikä tuoteta, mutta se estää vuoro- • · vaikutuksen tai hidastaa sitä. Nollasta poikkeavat stökiömetriset kertoimet as- • · **··* sosioidaan substraatti- tai tuotosyhteyksiin 840, 850. Säätöyhteyksissä (esim.
aktivaatio 860 tai inhibitio 870) stökiömetriset kertoimet ovat nollia.
• * : ’** 30 Lisäksi biokemiallisten olioiden mitattuja tai säädettyjä muuttujia voi- * * * daan visualisoida ja paikantaa. Esimerkiksi viitenumero 881 osoittaa biokemial-lisen olion konsentraatiota, viitenumero 882 osoittaa vuorovaikutuksen reaktio- * · !···, nopeutta ja viitenumero 883 osoittaa yhteyden virtausta (flux).
• · *" Yhteyksien tarkat roolit, vuorovaikutuksiin assosioidut kineettiset lait * · 35 ja kunkin polun biologisesti relevantti paikka tuovat parannuksia tunnettuihin polkumalleihin nähden, esimerkiksi kuvioissa 7A - 8 näytetty malli tukee kuva- 19 118063 uksia vaihtelevilla detaljitasoilla vaihtelemalla elementtien määrää. Lisäksi malli tukee eksplisiittisten kineettisten lakien sisällyttämistä, mikäli niitä tunnetaan.
Tämä tekniikka tukee myös mittaustulosten graafista esittämistä näytetyillä poluilla. Mitatut muuttujat voidaan korreloida graafisen polkuesityk-5 sen detaljeihin objektien nimien perusteella.
Huomattakoon, että viitenumeroilla 200 ja 700 (kuvioissa 2 ja 7A) näytetty tietokantastruktuuri tarjoaa välineet tallentaa biologisen polun topologiaa mutta ei sen visualisointia 800. Visualisointi voidaan generoida topologiasta ja tallentaa myöhemmin, seuraavalla tavalla. Visualisoinnin 800 elementin 10 ja keskinäiset yhteydet perustuvat suoraan tallennettuihin polkuihin 700. Näytettyjen elementtien paikat voidaan aluksi valita ohjelmistorutiinilla, joka optimoi jonkin ennalta määrätyn kriteerin, kuten toistensa ylittävien yhteyksien määrän. Tällaisia tekniikoita tunnetaan piirilevyjen suunnittelusta. IMS voi tarjota käyttäjälle graafisia työkaluja visualisoinnin siistimiseksi käsin. Kunkin elementin si-15 joitus käsin editoidussa versiossa voidaan sitten tallentaa erilliseen datarakenteeseen, kuten tiedostoon.
Kokeet IMS käsittää edullisesti kokeiden projektinhallinnan. Projekti käsittää yhden tai useamman kokeen, kuten näytteenoton, käsittelyn, ohjauksen (per- 20 turbation), ruokkimisen, viljelyn, manipuloinnin, puhdistamisen, kloonaamisen , , tai muunlaisen yhdistämisen, erottamisen, mittauksen, luokittamisen, doku- * · · mentoinnin tai in-silico-työvirran.
:.**ί Kokeiden projektinhallinnan etuna on, että kaikki mittaustulokset tai kontrolloidut olosuhteet tai ohjaukset ("mitä”), biomateriaalit ja paikat niissä 25 ("missä”), sekä relevanttien kokeiden ajoitus ("koska”) ja menetelmät ("kuinka”) voidaan rekisteröidä koedatan tulkitsemista varten. Toinen etu tulee mahdolli- • * :***: suudesta hyödyntää muuttujankuvauskieltä koedatan tallentamisessa, kuten • · * aiemmin selostettiin, ;·, Kuvio 9 esittää koe-oliota IMS:n koeosiossa. Kukin IMS:ään tallen- * ·· 30 nettu projekti 902 käsittää yhden tai useamman kokeen 904. Kullakin kokeella • · Ύ 904 on relaatiot laitteistodataan 906, käyttäjädataan 908 ja metodidataan 910.
*· * • V Kukin metodiolio 910 liittyy koeottoon 914 ja koeantoon 920. Koeotto 914 kyt- kee relevantin oton, kuten biomateriaalin 916 (esimerkiksi populaation, yksilön, ,·] · reagentin tai näytteen) tai dataolion 918 (esimerkiksi kontrolloidut olosuhteet) • *· 35 kokeeseen yhdessä relevantin aikainformaation kanssa.
• · 118063 20
Kokeen anto 920 kytkee relevantin annon, kuten biomateriaalin 922 (esimerkiksi populaation, yksilön, reagentin tai näytteen) tai dataolion 924 (esimerkiksi mittaustulokset, dokumentit, luokitustulokset tai muut tulokset) kokeeseen yhdessä relevantin aikainformaation kanssa, Esimerkiksi jos otto käsittää 5 biomateriaalin spesifisen näytteen, koe voi tuottaa erinumeroisen näytteen samasta organismista. Lisäksi koeotto 920 voi käsittää tuloksia erilaisten dataoli-oiden muodossa (kuten kuvioissa 6A ja 6B näytetyt datajoukot tai dokumentit tai taulukkolaskentatiedostot). Koeanto 920 voi käsittää myös fenotyyppiluokit-telun ja/tai genotyyppiluokittelun dataolioissa.
10 Kokeella on myös kohde 930, joka on tyypillisesti biomateriaali 932 (esimerkiksi populaatio, yksilö, reagentti tai näyte), mutta in-silico -kokeiden kohde voi olla dataolio 934.
Menetelmäoliolla 910 on relaatio menetelmäkuvaukseen 912, joka kuvaa menetelmän. Menetelmäkuvauksen 912 vieressä oleva silmukka tarkoit-15 taa, että yksi menetelmäkuvaus voi viitata toisiin menetelmäkuvauksiin.
Kokeen otto 914 ja kokeen anto 920 ovat joko spesifisiä biomateriaaleja 916, 922 tai dataolioita 918, 924, jotka ovat samoja dataelementtejä kuin vastaavat elementit kuviossa 2. Jos koe on märkälaboratoriokoe, otto- ja antobiomateriaalit 916, 922 ovat kuvion 2 biomateriaalin 210 kaksi (samaa tai 20 eri) instanssia. Ne voivat esimerkiksi olla kaksi spesifistä näytettä 210-4.
Koska biokemiallinen informaatio (viitenumero 200 kuviossa 2) ja :Y: projektin informaatio kuvataan yhteisillä dataolioilla, projektihallitsija pystyy • · seuraamaan kunkin informaatioelementin historiaa. Se pystyy myös monitoroi- .···*. maan tuottavuutta lisättynä informaatiomääränä resurssia (kuten henkilövuot- • · 25 ta) kohti.
• · ... Koeprojektinhallitsija käsittää edullisesti projektieditorin, jolla on t p · käyttöliittymä, joka tukee projektinhallinnan toiminnallisuutta projektin aktivi- • · *···* teettejä varten. Tämä antaa lisäksi kaikki ne normaalin projektinhallinnan edut, jotka ovat hyödyksi myös järjestelmäbiologian projekteissa.
• · : *·· 30 Projektieditorin edullinen toteutus pystyy seuraamaan kaikkia bio- :,..ϊ materiaaleja, niiden näytteitä ja kaikkea dataa eri kokeiden kautta, mukaanlu- kien märkälaboratorio-operaatiot ja in-silico-datankäsittelyn.
• · \.!t Koeprojekti voidaan esittää verkkona, joka koostuu koeaktiviteeteis- T ta, kohdebiomateriaaleista ja otto-tai antotuotoksista, jotka ovat biomateriaale- • · Y·: 35 ja tai dataolioita.
• ·· • « * · • · · 21 118065
Monimutkaisuuden suhteen kuvio 9 on pahimman tapauksen kaavio. Harvat, jos mitkään tosielämän kokeet käsittävät kaikki kuviossa 9 näytetyt elementit. Esimerkiksi jos koe on lääketieteellinen tai biologinen käsittely, niin otto- ja anto-osiot 914, 920 osoittavat tyypillisesti tietyn potilaan tai biologisen 5 näytteen. Valinnainen tilaelementti voi kuvata potilaan tai näytteen tilan ennen käsittelyä. Anto-osa on käsitelty potilas tai näyte.
Näytteenoton tapauksessa otto-osa osoittaa biomateriaalin, johon näytteenotto kohdistuu, ja anto-osa osoittaa spesifisen näytteen. Näytteen manipuloinnin tapauksessa otto-osa osoittaa manipuloitavan näytteen, ja anto-10 osa osoittaa manipuloidun näytteen. Kombinaatiokokeessa otto-osa osoittaa useita kombinoitavia näytteitä ja anto-osa osoittaa kombinoidun, identifioidun näytteen. Kääntäen, separaatiokokeessa otto-osa osoittaa separoitavan näytteen ja anto-osa osoittaa useita separoituja, identifioituja näytteitä. Mittausko-keessa otto-osa osoittaa mitattavan näytteen, ja anto-osa on dataolio, joka si-15 sältää mittaustulokset. Luokituskokeessa otto-osa osoittaa luokitettavan näytteen, ja anto-osa osoittaa fenotyypin ja/tai genotyypin. Viljelykokeessa otto- ja anto-osat osoittavat spesifisiä populaatioita, ja laiteosa voi käsittää viljelyastioi-den tunnisteet.
Monimutkaisten kokeiden kuvaamiseksi voi olla koesidontoja (bind-20 ers, ei näytetty erikseen), jotka yhdistävät useita kokeita tavalla, joka on jossakin määrin analoginen tapaan, jolla polkuyhteydet 700, 720, 730 yhdistävät eri polkuja.
• · • ·
Biomateriaalikuvaukset ···
Kuvio 10 näyttää esimerkin IMS.n biomateriaaliosion objektipohjai-25 sesta toteutuksesta. Tulee huomata, että tämä on vain yksi esimerkki, ja monet • *.: biomateriaalit voidaan kuvata riittävästi ilman kaikkia kuviossa 10 näytettyjä elementtejä. Biomateriaaliosio 210 alaelementteineen 210-1 ... 210-4 ja paik-kaosio 214 alaelementteineen 214-1 ... 214-5 on lyhyesti selostettu kuvion 2 yhteydessä. Kuvio 10 näyttää, että biomateriaalilla 210 voi olla monesta mo- /··. 30 neen -relaatio tilaelementtiin 1002, fenotyyppielementtiin 1004 ja dataolioele- • ♦ *·* menttiin 1006. Valinnaista organismisidontaa 1008 voidaan käyttää yhdistä- • · · : V mään (sekoittamaan) eri organismeja. Esimerkiksi organismisidonta 1008 voi »lt osoittaa, että tietty populaatio käsittää x prosenttia organismia 1 ja y prosenttia .·*. ♦ organismia 2.
* ·· t*./ 35 Organismielementin 214-1 alapuolinen silmukka 1010 tarkoittaa, et- • » *** tä organismi kuvataan edullisesti taksonomisena kuvauksena. Kuvion 10 ala- 118063 22 puoli näyttää kaksi esimerkkiä tällaisesta taksonomisesta kuvauksesta. Esimerkki 101OA on kolibakteerin erään spesifisen näytteen taksonominen kuvaus. Esimerkki 101 OB on valkoapilan taksonominen kuvaus.
Kuvioiden 3A - 3C yhteydessä selostettua muuttujankuvauskieltä 5 voidaan käyttää kuvaamaan tällaisiin biomateriaaleihin ja/tai niiden paikkoihin liittyviä muuttujia. Esimerkki: V[concentration]P[P53]U[mol/l]ld[Patient X]L[human cytoplasm]=0.01.
Eräs tällaisen paikkatiedon etu on parannettu ja systemaattinen tapa verrata paikkoja näytteissä ja teoreettisissa rakenteissa, kuten poluissa, 10 jotka joudutaan varmentamaan relevanteilla mittaustuloksilla.
Toinen etu, joka saavutetaan tallentamalla biomateriaaliosio olennaisesti kuviossa 10 näytetyllä tavalla, liittyy datan visualisointiin. Esimerkiksi biomateriaalit voidaan korvata niiden fenotyypeillä. Eräs esimerkki tällaisesta korvaamisesta on, että tietyt yksilöt luokitellaan "allergisiksi”, mikä on ihmisille 15 paljon havainnollisempi kuin pelkkä tunniste.
Datan seurattavuus
Kuviot 11A ja 11B osoittavat datan seurattavuutta kahden esimerkin valossa. Kuvio 11A esittää näytteenottotapahtumaa. Kaikki näytteet saadaan tietystä yksilöstä A, jota osoitetaan viitenumerolla 1102. Viitenumero 1104 20 osoittaa yleisesti neljää nuolta, joista kukin osoittaa näytteenottoa tietyllä het- • · kellä. Esimerkiksi hetkellä 5 saadaan näyte 4, kuten viitenumero 1106 osoittaa.
i,*·· Kuvioiden 3A - 4 yhteydessä käytettyä muuttujankuvauskieltä käyttäen näyte 4 hetkellä 5 voidaan ilmaista lausekkeella Sa[4]T[5], Lauseke Sa[4]T[5] = ··*** ld[A]T[5] tarkoittaa, että näyte 4 saatiin yksilöstä A hetkellä 5.
25 Hetkellä 12 näytteestä 4 otetaan kaksi muuta näytettä. Kuten nuoli .···. 1108 osoittaa, näyte 25 otetaan näytteestä 4 erottamalla tumat. Viitenumero • · 1112 osoittaa näytteen 25 havaintoa (mittausta), nimittäin proteiinin P53 kon- „ sentraatiota, jonka tässä esimerkissä näytetään olevan 4,95.
• »
Kuvio 11B esittää datan seurattavuutta tapahtumaketjussa, jossa to-***** 30 teutetaan ohjaus annostelemalla yksilölle B 1150 tiettyä yhdistettä. Kuten viite- numerot 1152 - 1158 osoittavat, 10 gramman annos yhdistettä abcd annetaan » * .·*** näytteelle 40 hetkellä 1, ja tuo näyte annetaan yksilölle B hetkellä 6. Viitenu- • * ·
.* . mero 1160 osoittaa mannoosin annostelua yksilölle B hetkellä 5. Kuvion 11B
• * · *;*: alapuoli on analoginen kuvion 11A kanssa, ja erillinen selostus jää pois.
• · *·* 118063 23 Näyttämällä sellaisia kuvia, joita sisältyy kuvioihin 11A ja 11B, autetaan käyttäjiä ymmärtämään, mihin havainnot perustuvat. Parannetun datan seurattavuuden etuihin kuuluu virheiden väheneminen ja anomalioiden helpompi selittäminen.
5 Tulisi ymmärtää, että tosielämän tapaukset voivat olla paljon moni mutkaisempia kuin mitä yhdellä piirrossivulla voidaan kohtuudella esittää. Kuviot 11A ja 11B esittävät siis vain datan seurattavuuden periaatetta. Monimutkaisten tapausten tukemiseksi visualisointilogiikan edellä tulisi olla käyttäjän aktivoimia suotimia, jotka sallivat käyttäjien nähdä vain mielenkiinnon kohteita. 10 Jos esimerkiksi käyttäjä on kiinnostunut vain kuviossa 11A näytetystä näytteestä 25, niin voidaan näyttää vain tapahtumien (näytteiden) ketju 1102 -1106-1110-1112.
Työvirtojen kuvaukset
Kuvio 12A näyttää ohjelmisto-komponenttimallia työvirtojen (work-15 flow) kuvaamiseksi ja hallitsemiseksi IMS:ssä. Työvirta 1202 voi sisältää toisia työvirtoja. Alimman tason työvirta sisältää työkalun 1208. Kullakin työvirralla on omistaja-käyttäjä 1220. Kukin työvirta kuuluu johonkin projektiin 1218. (Projekteja tarkasteltiin kuvion 9 yhteydessä.)
Työkalut määrittelytermejä ovat työkalun nimi, kategoria, kuvaus, 20 lähde, aluke (pre-tag), suoritusosa (executable), otot, annot ja palveluobjektin . . luokka (mikäli ei oletusarvo). Tämä informaatio talletetaan työkalutietokantaan • · · * · · . _ _ _ • · 1208.
* · * · · *· [’· Ottomäärityksiin sisältyy aluke, tunnistenumero, kuvaus, dataolio- tyyppi, lopuke (post-tag), komentorivijärjestys, valinnaisuus-status (pakollinen 25 vai valinnainen). Tämä informaatio talletetaan työkalun ottosidontaan (input binder) 1210 tai työkalun antosidontaan (output binder) 1212.
Dataoliotyypit määritellään järjestelmään termeillä dataoliotyypin nimi, kuvaus, datakategoria (esim. tiedosto, hakemisto alihakemistoineen ja tie-# dostoineen, datajoukko, tietokanta, jne.) On useita dataoliotyyppejä, jotka kuu- ]···. 30 luvat samaan kategoriaan mutta joilla on erilainen syntaksi tai semantiikka ja * · *t* jotka sen vuoksi kuuluvat eri dataoliotyyppiin olemassa olevien työkalujen yh- : V teensopivuussääntöjen vuoksi. Tämä informaatio talletetaan dataoliotyyppiin 1214. Työkalupalvelimen sidonta 1224 osoittaa sen palvelimen 1222, jossa : työkalu voidaan suorittaa.
• »· .···*. 35 Tyypitettyjä dataolioita käytetään ohjaamaan erilaisten työkalujen yhteensopivuutta, jotka voivat olla tai olla olematta yhteensopivia. Tämä antaa 118063 24 mahdollisuuden kehittää käyttöliittymän, jossa järjestelmä avustaa käyttäjiä luomaan järkeviä työvirtoja ilman etukäteistietoa kunkin työkalun yksityiskohdista.
Dataolioinstanssit, jotka sisältävät käyttäjädataa, tallennetaan data-5 olioon 1216. Kun työvirtoja rakennetaan, relevantit dataoliot kytketään relevantteihin työkaluottoihin työvirran ottojen 1204 tai työvirran antojen 1206 kautta.
Kuvio 12B esittää asiakas-palvelin -arkkitehtuuria, johon kuuluu asi-akaspäätelaitteessa CT suoritettava graafinen työvirtojen editori 1230. Graafi-10 nen työvirtojen editori 1230 kytkeytyy työvirtapalvelimen 1232 kautta suoritus-hallitsijan (executor) palveluobjektiin työkalupalvelimessa 1234. Graafista työ-virtojen editoria 1230 käytetään valmistelemaan, suorittamaan ja monitoroimaan sekä tarkastelemaan työvirtoja ja dataolioita, jotka viestivät työvirtatieto-kannan 1236 kanssa. Työvirtapalvelin 1232 huolehtii työvirtojen suorittamises-15 ta käyttämällä yhtä tai useampaa työkalupalvelinta 1234. Relevantin työkalu-palvelimen osoite voidaan löytää palvelintaulukosta (kuvio 12A).
Kukin työkalupalvelin 1234 käsittää suoritushallitsijan ja palveluob-jektin, joka pystyy kutsumaan mitä tahansa itsenäistä työkalua, joka on asennettu työkalupalvelimelle. Suoritushallitsija hallitsee työvirran kaikkien relevant-20 tien työkalujen suorittamista relevanteilla dataolioilla standardoidun palveluob-jektin kautta. Palveluobjekti tarjoaa suoritushallitsijalle yhteisen rajapinnan min- ..... kä tahansa itsenäisen ohjelmistotyökalun suorittamiseksi. Työkalukohtaista in- • · · ‘ 1. formaatiota voidaan kuvata XML-tiedostossa, jota käytetään alustamaan meta- • 1 · *·./ dataa kullekin työkalulle työkalutietokannassa (kuvion 12A kohta 1208). Palve- * · *··1! 25 luobjekti vastaanottaa anto-ja ottodatan, ja käyttämällä työkalun määritysinfor- maatiota, se voi valmistella vaaditun komentorivin työkalun suorittamiseksi.
·· · ♦ V Kuvioissa 12A ja 12B näytetty työvirtojen/työkalujen hallitsija integroi helposti perinteisiä työkaluja ja kolmansien osapuolten työkaluja. Työvirtojen/työkalujen hallitsijan muihin etuihin kuuluu työvirtojen täydellinen dokumen- "... 30 tointi, helppo uudelleenkäytettävyys ja automaattinen suoritus. Esimerkiksi työ- ♦ .···. virtojen/työkalujen hallitsija voi piilottaa kolmansien osapuolten työkalujen val- mistajakohtaiset käyttöliittymät ja korvata ne IMS.n yhteisellä graafisella käyttö- i .1 liittymällä. Käyttäjät voivat siis käyttää yhteisen graafisen käyttöliittymän toimin- • · · toja valmistelemaan, suorittamaan ja monitoroimaan sekä tarkastelemaan työ-35 virtoja ja niiden dataolioita.
• · · ··· 118063 25
Kuvio 12C näyttää, kuinka työvirtaeditori voi esittää työvirrat työkalujen ja dataolioiden verkkona siten, että dataoliot ovat työkalujen ottoja ja antoja. Työkalut suoritetaan työvirtojen topologisen lajittelun perusteella.
Nämä työvirrat ovat erittäin hyödyllisiä monimutkaisiin tehtäviin, jot-5 ka on toistettava uudelleen hieman erilaisin syöttein.
Polkujen automaattinen täyttäminen sekvenssitietokannasta IMS, jossa on olennaisesti sellainen polkumalli, joka selostettiin kuvioiden 7A - 8 yhteydessä, tukee epätäydellisiä polkuja. Näin siksi, että polut määritellään alkeiskomponenttien kautta, joita voidaan lisätä kun uutta tietoa 10 saadaan. Tämän ominaisuuden eräs etu on, että IMS voidaan varustaa laitteisto- ja ohjelmistovälineillä polkujen automaattista täyttämistä varten ulkoisista (usein kaupallisista) sekvenssitietokannoista. Tähän tarvitaan yhteysvälineet ulkoisiin tietokantoihin, jäsennyslogiikka kutakin tiettyä tietokantaa varten sekä logiikka polun komponenttien (tai ainakin joidenkin) johtamiseksi ulkoisten tie-15 tokantojen ominaisuustaulukoista (feature table) tai muusta informaatiosta. Huomattakoon, että sekvenssitietokannat eivät tuota mitään eksplisiittistä informaatiota polkumalleista. Ne tuottavat vain informaatiota geeneistä ja niiden koodaamista proteiineista. Mutta sopiva logiikka voi päätellä ainakin jotkut pol-kukomponentit tästä informaatiosta. Logiikka voi tulkita joidenkin sekvenssitie-20 tokantojen tuottamat annotaatiot valtavaksi relaatiomassaksi hyvin määritelty-jen biokemiallisten olioiden avulla (spesifinen geeni ja spesifinen joukko prote- *;*·* iineja) heti, kun nämä relaatiot - joista sekvenssitietokannat eivät kerro ekspli- * « · siittisesti mitään - on talletettu polkutietokantaan (kuviot 7A ja 7B). Interaktioita (transkriptioita ja translaatioita), joista sekvenssitietokannat eivät myöskään *:**: 25 kerro mitään, ei voida täydellisesti kuvata biologista perustietämystä käyttämäl- ·· · • V lä, mutta hyvin määriteltyjen biokemiallisten olioiden ja biologisten peruskäsit- teiden avulla interaktioiden väliset yhteydet voidaan kuvata täydellisesti polku-mallissa. Ei edes ole välttämätöntä, että sekvenssitietokanta sisältää informaa-tiota transkripteista. Sen sijaan keksinnöllinen logiikka voi määrittää transkriptit, .···. 30 identifioida ja nimetä ne. Nimeäminen on usein välttämätöntä, koska mRNA- ♦ · "S molekyylejä ei usein nimetä niin kuin geenejä tai proteiineja.
i V IMS, jossa on yllä selostettu polkumalli, perustuu siis yhteyksiin ja * * * interaktioihin, ja IMS tukee epätäydellisiä polkumalleja. On hyödyllinen lisäys .*.tj määrittää yhteydet automaattisesti ulkoisista tietokannoista, vaikka interaktioita .···] 35 pitääkin täydentää jälkikäteen, kun lisätietoa on saatavana.
• · « · · 118063 26
Kuvio 13 esittää prosessia, kuten ohjelmistorutiinia, polkujen automaattista täyttämistä varten sekvenssitietokannasta. Tässä esimerkissä sek-venssitietokannassa on kaksi identifioitua geeniä G1 ja G2, joita osoitetaan viitenumeroilla 1302 ja 1308. Tietokannan ominaisuustaulukossa on annotoitu-5 ja DNA-sekvenssejä.
Tyypillisissä sekvenssitietokannoissa on rivitunnisteita, avainsanoja ja sekventiaalista paikka- tai määriteinformaatiota ominaisuuksien annotointia varten. Vaikka on monia erilaisia tunnisteita, avainsanoja ja määritteitä, on mahdollista hyödyntää joitakin yleisiä yhteneväisyyksiä.
10 Esimerkiksi EMBL-tietokannassa on seuraavanlaisia ominaisuustau- lukoita:
Rivi Avain Paikka/Määrite FT CDS 22..2892
FT
15 FT db xref="SWISS-PROT:P49746" FT ...
FT /gene="THBS3"
FT
20 On FT-rivejä (feature table, ominaisuustaulukko), joissa on avainsa na CDS (coding sequence, koodaussekvenssi), joka osoittaa koodausaluetta :V: ja spesifisiä määritteitä, jota tuottavat erilaisia tietokantaviittauksia geeneihin (/gene="THBS3") ja niiden proteiineihin (db_xref="SWISS-PROT:P49746").
• · .*·*. Tämä tarkoittaa, että geenillä, jonka identifioi THBS3, on proteiinituote, jonka 25 identifioi "SWISS-PROT:P49746", ja geenin ja proteiinin välissä täytyy olla ..... mRNA. Nimet on muunnettava suositelluiksi nimiksi (ks. nimitaulukot 226 kuvi- \.f ossa 2).
*···* Oletetaan, että annotoituna ominaisuutena on geeni G1 (osoitettu viitenumerolla 1302) silmukointivarianttituotteiden (splice variant product) P1, : *** 30 P2 ja P3 kanssa (viitenumerot 1342, 1344 ja 1346). Silloin tiedämme, että täy- ··* tyy olla kolme silmukointivariantti mRNA:ta, nimittäin Tr1=mRNA G1:stä P1:een, Tr2=mRNA G1:stä P2:een, ja Tr3=mRNA G1:stä P3:een. Nämä sil-mukointivariantti mRNA:t osoitetaan viitenumeroilla 1322, 1324 ja 1326.
• · V Oletetaan lisäksi, että annotoituna ominaisuutena on geeni G2, • * 35 1308, jolla on yksi tuote P4, 1348. Silloin tiedämme, että täytyy olla yksi :**.: mRNA, nimittäin Tr4=mRNA, 1328, G2:sta P4:ään.
27 1 1 8 0 6 3
Yllä olevan informaation perusteella polun luuranko, kuten kuviossa 13 näytetty, voidaan luoda automaattisesti.
Aluksi transkriptio-interaktiot voidaan täydentää mekaanisesti ribo-nukleotidi-substraateilla ja myöhemmin tunnetuilla transkriptiotekijöillä. Trans-5 laatio-interaktio voidaan täydentää aminohapoilla ja ribosomilla. Interaktiot eivät ole vielä täydellisiä, mutta RNA-sekvenssitietokantoja voidaan käyttää muodostamaan translaatio-interaktioita, jos on olemassa annotoituja ominaisuuksia (features), joihin kuuluu identifioitu mRNA ja proteiini.
Automaattisen populointiominaisuuden etu on automaattinen geno-10 min kattava polunmuodostus kullekin organismille, mikä helpottaa kehittyneempää polun kokoamista, joka perustuu kuviossa 13 näytettyyn peruskaavi-oon.
Laitteiston ja ohjelmiston osalta IMS tarvitsee pääsyn ulkoisiin tietokantoihin. Moniin tietokantoihin voidaan päästä tavallisella Internet-selaimella. 15 Niinpä automaattisen populointiohjelmiston tulee emuloida Internet-selainta tai muuten tuottaa yhteensopivia komentoja. Lisäksi IMS tarvitsee jäsentämislo-giikan (parsing) ja tietoa siitä, kuinka kunkin tietokannan anto on järjestetty.
Spatiaaliset referenssimallit
Kuvio 14 esittää spatiaalisia referenssimalleja erilaisille solutyypeil- 20 le. Aiemmin todettiin, että yksinkertaiset suorakulmaiset tai napakoordinaatti- . , järjestelmät voivat riittää joillekin solutyypeille. Koordinaattijärjestelmä on edul- • · · *;*·[ lista normalisoida siten, että maksimietäisyys referenssipisteestä on yksi.
*t On monia solutyyppejä, joille yksinkertainen suorakulmainen tai na- * * · pakoordinaattijärjestelmä ei riitä. Esimerkiksi kantasolut ovat suuntautuneita, * "·’**· 25 mikä tarkoittaa, että niillä on etupää ja takapää. Hermosolut ovat vieläkin moni- mutkaisempia. Niinpä IMS edullisesti käsittää useita spatiaalisia referenssimal-leja, ja spatiaalinen piste ilmaistaan referenssimallin ja sen sisällä olevan alu- • · · een yhdistelmänä.
Kuvio 14 esittää kolmea erilaista referenssimalli-esimerkkiä. Refe- • ·· 30 renssimalli 1400 on yksinkertainen koordinaattijärjestelmä, kuten kolmiulottei- • · T nen suorakulmainen koordinaattijärjestelmä. Joillekin solutyypeille voi riittää ·· · • \: yksi tai kaksi koordinaattia. Jos kyseinen solutyyppi on pyörähdyssymmetrinen, napakoordinaattijärjestelmä voi olla parempi kuin suorakulmainen.
,·* : Referenssimalli 1410 perustuu solun jakamiseen useaan alueeseen.
• ·· l..mt 35 Alueiden määrä tulisi valita siten, että biokemiallinen informaatio pätee koko '·**’ alueella. Referenssimalli 1410 soveltuu kompaktille suuntautuneelle solulle, 28 118063 kuten kantasolulle. Malli 1410 on suuntautunut, mutta pyörähdyssymmetrinen. Siihen kuuluu etupään alue 1411, takapään alue 1416, tuma-alue 1414 ja eri välialueita 1412, 1413 ja 1415. Etu-ja takapäät voidaan valita jonkin gradientin suhteen, kuten jonkin yhdisteen laskevan konsentraation suhteen.
5 Referenssimalli 1420 on esimerkki hermosolun topologian mallinta misesta. Siinä on tuma-alue 1421 ja sen ympärillä eri osia 1422, 1423, sooma-alue 1424, aksonialue 1425, jne. Normalisoituja spatiaalikoordinaatteja voidaan käyttää kasvattamaan detaljitasoa edelleen tarvittaessa. Esimerkiksi piste, joka on aksonin ulkopinnalla sen pituussuuntaisessa keskipisteessä, voi-10 daan ilmaista muodossa {1420, 1425, (0,5,1)}, missä 1420 osoittaa referens-simallia, 1425 osoittaa aluetta referenssimallin sisällä, 0,5 on normalisoitu pituussuuntainen koordinaatti aksonia pitkin ja 1 tarkoittaa 100% säteestä aksonin poikkileikkausta pitkin.
Alan ammattilaiselle on selvää, että tekniikan kehittyessä keksinnön 15 mukainen konsepti voidaan toteuttaa eri tavoin. Keksintö suoritusmuotoineen ei rajoitu yllä esitettyihin esimerkkeihin vaan ne voivat vaihdella patenttivaatimusten suojapiirin puitteissa.
« · *·· • · · • 1 • · • · · • ·% * 1 *·· • · • · • · ··2· ·1 · • · · • · • · *·· • · * · ··· • 1 • · • «1 * · · • · « 1 φ • 1 · • · ··· • · * • ti.·.
« 1 · • · · • · ' · i ' ( ' 1 1 # ♦ • · 2 • 1 ·

Claims (5)

29 1 1 8 0 6 3
1. Informaationhallintajärjestelmä biologisen informaation (200) hallitsemiseksi, johon informaationhallintajärjestelmään kuuluu palvelin (S) ja tietokanta (DB), tunnettu siitä, että tietokantaan kuuluu: 5. ensimmäinen datarakenne (200) sisältämään biokemiallista tietoa, joka ensimmäinen datarakenne käsittää datajoukkoja biomateriaalin (210) ja/tai biokemiallisten olioiden (218) kuvaamiseksi; - toinen datarakenne (900) sisältämään projektitietoa, joka toinen datarakenne käsittää koedatajoukkoja kokeiden (904) kuvaamiseksi, joista kul- 10 lakin kokeella on yksi tai useampi metodikuvaus (910, 912), joista kullakin on koeottomäärittely (914) ja koeantomäärittely (920); - missä koeottomäärittely (914) ja koeantomäärittely (920) ovat ensimmäisen datarakenteen datajoukkojen instansseja biomateriaalin (210) ja/tai biokemiallisten olioiden (218) kuvaamiseksi.
2. Patenttivaatimuksen 1 mukainen informaationhallintajärjestelmä, tunnettu siitä, että siihen kuuluu logiikka datajälkien (1102- 1174) näyttämiseksi toisiinsa liittyvien datajoukkojen välillä.
3. Patenttivaatimuksen 1 tai 2 mukainen informaationhallintajärjes-telmä, tunnettu siitä, että siihen kuuluu biologisten polkujen (700) struktu- 20 roituja kuvauksia, jotka muodostuvat ainakin poluista (212), biokemiallisista :Y: olioista (218), yhteyksistä (216) ja vuorovaikutuksista (222) siten, että; - kukin polku (212) liittyy yhteen tai useampaan yhteyteen (216); • · - kukin yhteys (216) liittää yhden biokemiallisen olion (218) ja yhden vuorovaikutuksen (222); ja • · 25. kukin polku (212) liittyy spesifiseen sijaintiin (214). • · • · • · ·
4. Jonkin edellisen patenttivaatimuksen mukainen informaationhal-lintajärjestelmä, tunnettu siitä, että siihen kuuluu logiikka monitoroimaan lisättyjen datajoukkojen määrää resurssia kohti. • · · • ·
5. Jonkin edellisen patenttivaatimuksen mukainen informaationhal- : V 30 lintajärjestelmä, tunnettu siitä, että biologinen informaatio (200) käsittää datajoukkoja (202, 610, 620), joista kukin datajoukko käsittää: S, i - muuttuja-arvomatriisin (614, 624), joka sisältää riveiksi ja sarak- I..* keiksi järjestettyjä muuttuja-arvoja; • » • · • · · 118063 30 - muuttujankuvauskielellä (30) olevan rivienkuvauslistan (613, 623) muuttuja-arvomatriisin riveistä; - muuttujankuvauskielellä (30) olevan sarakkeidenkuvauslistan (612, 622) muuttuja-arvomatriisin sarakkeista; 5. muuttujankuvauskielellä (30) olevan kiinteiden dimensioiden kuva uksen (611, 621) yhdestä tai useammasta kiinteästä dimensiosta, jotka ovat yhteisiä muuttuja-arvomatriisin kaikille arvoille. • · • · · * » 1 2 3 • · • · · ' • · · * · * · · • · • · • · · • · » « • · *·· • · · ♦ · • · • · * · ··♦ • · • · ··· ·♦·..;· • · • · • · · • · · ··· • · • · ··· • · * · « • · · - * » · · • · 2 • · 3 ' 118063 31 " ^
FI20031028A 2003-07-04 2003-07-04 Informaationhallintajärjestelmä biokemiallista informaatiota varten FI118063B (fi)

Priority Applications (7)

Application Number Priority Date Filing Date Title
FI20031028A FI118063B (fi) 2003-07-04 2003-07-04 Informaationhallintajärjestelmä biokemiallista informaatiota varten
EP04103136A EP1494141A3 (en) 2003-07-04 2004-07-02 Information management system for biochemical information
US10/883,045 US20050010370A1 (en) 2003-07-04 2004-07-02 Information management system for biochemical information
PCT/FI2004/000424 WO2005003999A1 (en) 2003-07-04 2004-07-02 Information management system for biochemical information
AU2004254729A AU2004254729A1 (en) 2003-07-04 2004-07-02 Information management system for biochemical information
CA002531131A CA2531131A1 (en) 2003-07-04 2004-07-02 Information management system for biochemical information
JP2006516238A JP2007520773A (ja) 2003-07-04 2004-07-02 生化学情報のための情報管理システム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FI20031028A FI118063B (fi) 2003-07-04 2003-07-04 Informaationhallintajärjestelmä biokemiallista informaatiota varten
FI20031028 2003-07-04

Publications (3)

Publication Number Publication Date
FI20031028A0 FI20031028A0 (fi) 2003-07-04
FI20031028A FI20031028A (fi) 2005-01-05
FI118063B true FI118063B (fi) 2007-06-15

Family

ID=27636066

Family Applications (1)

Application Number Title Priority Date Filing Date
FI20031028A FI118063B (fi) 2003-07-04 2003-07-04 Informaationhallintajärjestelmä biokemiallista informaatiota varten

Country Status (3)

Country Link
US (1) US20050010370A1 (fi)
EP (1) EP1494141A3 (fi)
FI (1) FI118063B (fi)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8150857B2 (en) * 2006-01-20 2012-04-03 Glenbrook Associates, Inc. System and method for context-rich database optimized for processing of concepts
US8543337B2 (en) 2006-04-21 2013-09-24 The Mathworks, Inc. Block diagram explorer in a method and apparatus for integrated modeling, simulation and analysis of chemical and biological systems
US20080077613A1 (en) * 2006-09-27 2008-03-27 Ffd, Inc. User Interface Displaying Hierarchical Data on a Contextual Tree Structure
US8332209B2 (en) * 2007-04-24 2012-12-11 Zinovy D. Grinblat Method and system for text compression and decompression
US20100289800A1 (en) * 2009-05-14 2010-11-18 Pioneer Hi-Bred International, Inc. Method and system to facilitate transformation process improvements
US20190392168A1 (en) * 2018-06-24 2019-12-26 Prifender Inc. System and method for monitoring flow of data elements of entities

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5930154A (en) * 1995-01-17 1999-07-27 Intertech Ventures, Ltd. Computer-based system and methods for information storage, modeling and simulation of complex systems organized in discrete compartments in time and space
US6189013B1 (en) * 1996-12-12 2001-02-13 Incyte Genomics, Inc. Project-based full length biomolecular sequence database
US6553317B1 (en) * 1997-03-05 2003-04-22 Incyte Pharmaceuticals, Inc. Relational database and system for storing information relating to biomolecular sequences and reagents
AU3002700A (en) * 1999-02-19 2000-09-04 Cellomics, Inc. Method and system for dynamic storage retrieval and analysis of experimental data with determined relationships
US20010039539A1 (en) * 1999-12-12 2001-11-08 Adam Sartiel Database assisted experimental procedure

Also Published As

Publication number Publication date
EP1494141A2 (en) 2005-01-05
FI20031028A (fi) 2005-01-05
US20050010370A1 (en) 2005-01-13
FI20031028A0 (fi) 2003-07-04
EP1494141A3 (en) 2007-10-24

Similar Documents

Publication Publication Date Title
FI118102B (fi) Informaationhallintajärjestelmä työvirtojen hallitsemiseksi
Lacroix et al. Bioinformatics: managing scientific data
Visser et al. BioAssay Ontology (BAO): a semantic description of bioassays and high-throughput screening results
Cline et al. Integration of biological networks and gene expression data using Cytoscape
Leontis et al. The RNA Ontology Consortium: an open invitation to the RNA community
Kochev et al. Your spreadsheets can be fair: A tool and fairification workflow for the enanomapper database
FI117067B (fi) Informaationhallintajärjestelmä biokemiallista informaatiota varten
FI118101B (fi) Informaationhallintajärjestelmä biokemiallista informaatiota varten
FI118063B (fi) Informaationhallintajärjestelmä biokemiallista informaatiota varten
FI117988B (fi) Informaationhallintajärjestelmä biokemiallista informaatiota varten
FI117068B (fi) Informaationhallintajärjestelmä biokemiallista informaatiota varten
Wolstencroft et al. Semantic data and models sharing in systems biology: The just enough results model and the seek platform
McGinty KNowledge Acquisition and Representation Methodology (KNARM) and its applications
Banville Chemical information mining: facilitating literature-based discovery
WO2005003999A1 (en) Information management system for biochemical information
FI118868B (fi) Informaationhallintajärjestelmä biokemiallisen informaation hallintaa varten
Curcin et al. It service infrastructure for integrative systems biology
Bada et al. GOAT: the gene ontology annotation tool
Schoof et al. The PlaNet consortium: a network of European plant databases connecting plant genome data in an integrated biological knowledge resource
Doms et al. Ontologies and text mining as a basis for a semantic web for the life sciences
CANAKOGLU Integration of biomelecular interaction data in a genomic and proteomic data warehouse
Jones The development of data standards and a database to aid proteomic research
Sidhu et al. Introduction to data modeling
Chen A bioinformatics discovery-oriented computing framework
Vos et al. BioHackathon 2015: Semantics of data for life sciences an d reproducible research [version 1; peer review: 2 approved]

Legal Events

Date Code Title Description
FG Patent granted

Ref document number: 118063

Country of ref document: FI