FI117067B - Informaationhallintajärjestelmä biokemiallista informaatiota varten - Google Patents

Informaationhallintajärjestelmä biokemiallista informaatiota varten Download PDF

Info

Publication number
FI117067B
FI117067B FI20031027A FI20031027A FI117067B FI 117067 B FI117067 B FI 117067B FI 20031027 A FI20031027 A FI 20031027A FI 20031027 A FI20031027 A FI 20031027A FI 117067 B FI117067 B FI 117067B
Authority
FI
Finland
Prior art keywords
information
data
variable
ims
path
Prior art date
Application number
FI20031027A
Other languages
English (en)
Swedish (sv)
Other versions
FI20031027A0 (fi
FI20031027A (fi
Inventor
Pertteli Varpela
Meelis Kolmer
Original Assignee
Medicel Oy
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Medicel Oy filed Critical Medicel Oy
Publication of FI20031027A0 publication Critical patent/FI20031027A0/fi
Priority to FI20031027A priority Critical patent/FI117067B/fi
Priority to EP04103138A priority patent/EP1494142A1/en
Priority to PCT/FI2004/000424 priority patent/WO2005003999A1/en
Priority to CA002531131A priority patent/CA2531131A1/en
Priority to RU2005141111/09A priority patent/RU2005141111A/ru
Priority to US10/883,044 priority patent/US20050010369A1/en
Priority to CNA2004800232855A priority patent/CN1836234A/zh
Priority to AU2004254729A priority patent/AU2004254729A1/en
Priority to JP2006516238A priority patent/JP2007520773A/ja
Publication of FI20031027A publication Critical patent/FI20031027A/fi
Application granted granted Critical
Publication of FI117067B publication Critical patent/FI117067B/fi

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Molecular Biology (AREA)
  • Physiology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Description

Informaationhallintajärjestelmä biokemiallista informal varten
Keksinnön tausta
Keksintö liittyy infomnaationhallintajärjestelmään (lyhyesi 5 formation management system)) biokemiallisen informaation hallir Tarkemmin sanottuna keksintö liittyy informaationhallintajärjestelmä erityisesti sovitettu kuvaamaan biologisia polkuja (pathway).
Biologinen tutkimus tuottaa valtavia datamääriä nopeud ole koskaan nähty millään tieteen alalla. Keksinnön pohjana ole\ 10 liittyy vaikeuksiin jäljestää valtavia määriä nopeasti vaihtuvaa inl IMS-järjestelmät voivat olla vapaamuotoisia tai strukturoituja. Eräs nettu esimerkki vapaamuotoisesta IMS:stä on tutkimusinstituutin johon informaation tuottajat (tutkijat tms.) voivat syöttää informaatio täisessä muodossa käyttämällä mitä tahansa yleisesti saatavilla ole 15 tälöityjä sovellusohjelmia, kuten tekstinkäsittely-, taulukkolaskenta-1 taohjelmia. Strukturoitu IMS tarkoittaa jäijestelmää, jossa on jäijes juiset säännöt informaation tallentamiseksi yhtenäiseen tietokantaar Keksinnön pohjana oleva spesifinen ongelma liittyy siihc kemiallinen informaatio ei ole pätevää kaikkialla. Uutta tietoa saata< 20 tiedä kuinka laajasti kyseinen tieto voidaan yleistää. Jos löydetään i tiettyä tyyppiä olevia hiiren soluja viljeltäessä, emme tiedä pystyykö ]\ : tio kuvaamaan muita solutyyppejä.
• M • · · *
Keksinnön lyhyt selostus
Keksinnön tavoitteena on tuottaa informaationhallinta M « : 25 (jäljempänä lyhennetty "IMS”) yllä mainittujen haittojen lieventämii sinnön tavoitteena on tuottaa informaationhallintajärjestelmä (jälj< hennetty "IMS”) yllä mainittujen haittojen lieventämiseksi. Toisin s; : sinnön tavoitteena on tuottaa IMS tallentamaan biokemiallista in * * * .“··· siten, että siinä on systemaattinen tapa kuvata, missä kukin info 2 ti hierarkkinen. Edullinen hierarkia käsittää viisi lisääntyvän detaljii ganismi - elin - kudos - solutyyppi - solun osa.
Keksinnön eräs edullinen suoritusmuoto kasvattaa deta lentämällä kuudennen hierarkiatason, nimittäin spatiaalisen pis 5 osassa. Spatiaalisen pisteen ilmaiseminen solussa tai solun osassa aali tehtävä, koska solujen muoto vaihtelee. Jotkut solut muistutti jotkut näyttävät tiileltä, jne. Tällaisille soluille voidaan käyttää vastaa tai suorakulmakoordinaatistoa. Mutta yksinkertainen napa- tai s koordinaatisto on selvästi riittämätön hermosoluille, joiden muoto 10 mutkikas. Niinpä IMS tallentaa edullisesti useita spatiaalisia referei ja spatiaalinen piste ilmaistaan relevanttina alueena spesifisessä mallissa. Paikkatieto voi jopa olla yhdistelmä, johon kuuluu spes renssimalli, alue spesifisessä mallissa sekä koordinaattijoukko tällä
Koska paikkatieto on hierarkkista, IMS sietää epätäyd* 15 maatiota. Kun uusi biokemiallinen tietoelementti saadaan, voimrr paikkatiedon, joka vastaa sitä koetta, josta tietoelementti saatiin. N tiedon kasvaessa, voimme yleistää tai tarkemmin spesifioida paikka
Keksinnön mukaisella IMS:llä on edullisesti kyky tallenta tiota populaatioista, yksilöistä, reagenteista tai muiden biomateric 20 teistä (mitä tahansa, jota voidaan tutkia biologisena/biokemialliser mänä tai sen komponenttina). IMS käsittää edullisesti koetietokann j\. olla todellisen elämän koe (”märkälaboratorio") tai simuloitu koe I Keksinnön mukaisesti molemmat koetyypit tuottavat datajoukkoja ····. hunkin kuuluu: 25 - muuttuja-arvomatriisi, joka sisältää riveiksi ja sarakkeik • » :v. tyjä muuttuja-arvoja; - muuttujankuvauskielellä oleva rivienkuvauslista ’··* arvomatriisin riveistä; - muuttujankuvauskielellä oleva sarakkeidenkuvauslisti 30 arvomatriisin sarakkeista; ««· 3 räätälöidyillä sovellusohjelmilla. On erilliset rivi- ja sarakekuvausli maan, vastaavasti, muuttuja-arvomatriisissa olevien rivien ja sarakl· kitystä. Rivi- ja sarakekuvauslistat sekä kiinteiden dimensioiden kuv taan muuttujankuvauskielellä mielivaltaisten muuttuja-arvojen linl 5 IMS:n strukturoituun informaatioon.
Muuttujankuvauskielen (variable description language = tämisellä saavutetaan se etu, että IMS on pitkälti itseriittoinen. Nun tulkitsemiseen tarvitaan vähän tai ei lainkaan ulkopuolista inform* myös suhteellisen suoraviivainen tehtävä kohdistaa muuttujalausel 10 kollinen automaattinen syntaksintarkastus. Eräs VDL:n oleellinen pi se sallii muuttujien kuvaamisen muuttuvalla detaljitasolla. VDL voi kuvata muuttujan biomateriaalitermein (populaatio - yksilö - näyte; elin - kudos, solutyyppi, jne.), fyysisinä määrinä ja aikana, mutta voi pois detaljeja, jotka eivät ole nykyiselle kontekstille oleellisia.
15 XML (extendible Markup Language) on eräs hyvin tu merkki kielestä, jota voidaan käyttää muuttujankuvauskielenä. Xk mana on kuitenkin se, että se on tarkoitettu kuvaamaan käytännöllä en mitä tahansa strukturoitua informaatiota, mikä johtaa pitkähkö! keisiin, joiden lukeminen on ihmiselle vaikeaa. Näin ollen, keksinnör 20 linen suoritusmuoto liittyy muuttujankuvauskieleen, joka XML:ää soveltuu biologisten muuttujien kuvaamiseen. Lisäksi lausekkeet sen biologisilla tai matemaattisilla varianteilla, kuten SB ML (Syste Markup Language) tai CellML (Cell Markup Language) tai Mathf .···. matical Markup Language), ovat yleensä liian pitkiä tai monimutkau 25 seen itse dokumentoivina symboleina biologisten muuttujien kuvaar « * .. . temaattisissa malleissa. Näin ollen keksinnön vielä eräs edullinen si 9 * 9 to käsittää kompaktin mutta laajennettavan VDL:n, joka ratkaisee ni • » * * · · ’ ja sen varianttien ongelmat.
Tallettamalla numeroarvot skalaarimatriisina saavutetaan 30 tä matriisi voidaan analysoida monilla kaupallisesti saatavilla datar 9 9 9 9 m I L ·|| _ / J _J ___ * I \ | _ .1 ·* _ ·»_!_ _ A «Il U | I . · 4 IMS:n käsittelynopeutta voidaan lisätä tallettamalla kukin (kukin datajoukko käsittää muuttuja-arvomatriisin, rivi- ja sarake* sekä kiinteiden dimensioiden kuvauksen) datan säiliönä ja tallettai kantaan vain tämän säiliön osoite tai tunniste. Olettaen, että dal 5 noutamiseen käytetään SQL- (structured query language) tai muita kyselyjä, yhden säiliön tekniikka vähentää dramaattisesti SQL-kys sessoitavien yksittäisten dataelementtien määrää. Kun yksittäisiä ds tejä tarvitaan, koko säiliö voidaan prosessoida sopivalla työkalulla, lukkolaskennalla tai yksinkertaisten tiedostojen (flat file) tietokantaji 10 lä.
Keksinnön erään toisen edullisen suoritusmuodon muki käsittää lisäksi biokemiallisten olioiden tietokannan, joka sisältää oli< lukoita. Muuttujankuvauskieli käsittää muuttujakuvauksia, joista kul yhden tai useamman avainsana-nimiparin. Kutakin biokemialliste 15 tietokannassa olevaa oliota tai taulukkoa kohti on siihen viittaava Tämä suoritusmuoto helpottaa automaattista syntaksin tai muuta t joka tehdään talletettavaan informaatioon.
Keksinnön mukaisten datajoukkojen eräs toinen etu or hyvin määritellyille konteksteille. Konteksti määrittelee kokeen, joko i 20 ratorio tai in-silico, laajuuden. Jokainen konteksti määritellään bior na, muuttujina ja aikana.
»« • 9 « \ . Kuvioiden lyhyt selostus * ** .*·** Keksintöä selostetaan nyt lähemmin edullisten suoritusmi *[\ teydessä, viitaten oheisiin piirroksiin, joista: .1 / 25 Kuvio 1 on lohkokaavio IMS:stä, jossa keksintöä voidaan t * · : ·' Kuvio 2 on IMS:n tietokantarakenteen olio-relaatiomalli; : · · -': Kuviot 3A ja 3B esittävät ed Ullista muuttujankuvauskieltä <
Kuvio 3C esittää VDL-kielisen muuttujalausekkeen tarkastusprosessia; «·« __ . * . ....... . ................. .........
5
Kuvio 7B näyttää esimerkin monimutkaisesta polusta, jc yksinkertaisempia polkuja;
Kuvio 8 näyttää polun visualisoitua muotoa;
Kuvio 9 esittää koe-oliota IMS:n koeosiossa; 5 Kuvio 10 näyttää esimerkin IMS:n biomateriaaliosion ot sesta toteutuksesta;
Kuviot 11A ja 11B osoittavat datan seurattavuutta kahdei valossa;
Kuvio 12A näyttää ohjelmisto-komponenttimallia mon 10 työvirtojen selostamiseksi ja hallitsemiseksi IMS:ssä;
Kuvio 12B näyttää asiakas-palvelin -arkkitehtuurin, joi asiakaspäätelaitteessa CT suoritettava graafinen työvirtojen editori;
Kuvio 13 esittää prosessia polkujen automaattista täyttän sekvenssitietokannasta; ja 15 Kuvio 14 esittää spatiaalista referenssimallia erilaisille soi
Keksinnön yksityiskohtainen selostus Tässä dokumentissa "objekti” tarkoittaa samaa kuin en< nen termi "object” ja "olio” tarkoittaa samaa kuin englanninkielen "en
Kuvio 1 on yksinkertaistettu lohkokaavio informaationhe 20 telmästä IMS, jossa keksintöä voidaan käyttää. Tässä esimerkissä f... teutettu asiakas/palvelin -järjestelmänä. Useilla asiakaspäätelaitteill; j\ : graafisilla työasemilla, on pääsy palvelimeen (tai palvelinten joukki ,·'·[ kon NW, kuten lähiverkon tai Internetin kautta. Palvelimeen kuulu on kytketty tietokanta DB. Palvelimen informaationkäsittelylogiikka / 25 nan data muodostavat IMS:n. Tietokanta muodostuu rakenteesta μ • « · : Keksinnön eräs edullinen suoritusmuoto tuo parannuksia IMS.n 1 DB rakenteeseen. Palvelin S käsittää myös erilaisia prosessoir Viestilogiikka tarjoaa palvelimen perustoiminnot asiakaspäätelaittefc :,:V* viestintää varten. On myös edullisesti käyttöliittymälogiikka erilaiste ««« „ , . , , . ... „ ......... < .
6 ta jokaista data-alkiota erikseen SQL-kyselyillä) saavutetaan se etu set rivien ja sarakkeiden datajoukot voidaan helposti prosessoida k saatavilla analyysi- tai visualisointityökaluilla. Muita suoritusmuoto]· en osapuolten työkalujen integroimiseksi yhteisen käyttöliittymän ; 5 selostetaan kuvion 12 yhteydessä.
Datajoukot
Kuvio 2 on IMS:n tietokantarakenteen 200 olio-relaatior kantarakenne 200 käsittää seuraavat pääosat: perusmuuttujat/yl datajoukot 202, kokeet 208, biomateriaalit 210, polut 212 ja valin 10 jainnit214.
Datajoukot 202 kuvaavat IMS:ään tallennettuja numeer Kukin datajoukko koostuu muuttujajoukosta, biomateriaali-inform ajasta. Huomattakoon, että perusmuuttujat/yksiköt -osasta 204 ja 206 on monesta moneen -relaatiot datajoukko-osaan 202. Tämä 15 että kukin datajoukko 202 käsittää tyypillisesti yhden tai useamr muuttujan/yksikön ja yhden tai useamman aikalausekkeen. Dataji 202 ja koeosan 208 välillä on monesta moneen -relaatiot, mikä tail kukin datajoukko 202 liittyy yhteen tai useampaan kokeeseen 208, j liittyy yhteen tai useampaan datajoukkoon. Datajoukko-osan edullis 20 ta selostetaan lisää kuvioiden 6A ja 6B yhteydessä.
:a." Perusmuuttujat/yksiköt -osa 204 kuvaa IMS:ssä käytetyt : tujat ja yksiköt. Erässä yksinkertaisessa toteutuksessa kukin pen * · · .*·'[ tietue käsittää yksikkökentän, mikä tarkoittaa, että kukin perusmuu massa) voidaan ilmaista vain yhdessä yksikössä (esim. kilogramme .* 25 tavammassa suoritusmuodossa yksiköt tallennetaan erilliseen tai * · * : f sallii perusmuuttujien ilmaisemisen useassa yksikössä, kuten kilo tai nauloina.
Perusmuuttujat ovat muuttujia, joita voidaan käyttää sells niitä voidaan yhdistää muodostamaan monimutkaisempia muuttujia ·***< 30 h/n nävtteen Lrnncontraatin tiatvllä ai an halVallä 11 7
tisen ajan informaatiota voidaan käyttää laskemaan suhteellinen tahansa koetapahtumien välillä. Sitä voidaan käyttää myös vianel fuksiin. Jos esimerkiksi havaitaan viallinen instrumentti tiettynä i tuolla instrumentilla tehdyt kokeet ennen vian havaitsemista tulisi tai 5 Koeosa 208 tallentaa kaikki IMS:n tuntemat kokeet. On I
den päätyyppiä, joista käytetään yleisesti nimitystä märkälabora silico. Mutta datajoukkojen 202 suunnasta nähtynä kaikki kokeet ni moilta. Koeosa 208 toimii siltana datajoukkojen 202 ja kokeiden k tyypin välillä. Jo suoritettujen kokeiden lisäksi koeosaa 208 voidi 10 tallentamaan tulevia kokeita. Kokeiden edullisia objektiperustaisia selostetaan kuvion 9 yhteydessä. Koeosan eräs tärkeä suunnittel datan seurattavuus, kuten kuvion 11 yhteydessä lähemmin selosteta Biomateriaaliosa 210 sisältää tietoa populaatioista, reagenteista tai muiden biomateriaalien näytteistä (mitä tahansa, j< 15 tutkia biologisena järjestelmänä tai sen komponenttina) IMS:ssä. Bi< kuvataan edullisesti datajoukkoina 202 käyttäen VDL:ää kuvaam biomateriaalin hierarkkisesti, eli muuttuvalla detaljitasolla, kuten pc yksilönä, reagenttina ja näytteenä. Eräs edullinen biomateriaaliosan tiperusteinen toteutus selostetaan kuvion 10 yhteydessä.
20 Biomateriaaliosa 210 kuvaa reaalimaailman biomateriac polkuosa 212 kuvaa biomateriaalien teoreettisia malleja. Biokemia ovat jossakin määrin analogisia elektronisten piirien piirikaavioid* Polut voidaan kuvata IMS.ssä monella tavalla, mutta kuvio 2 es ;**\ edullisen toteutuksen pääpiirteet. Kuvion 2 esimerkissä kukin polki .:::.. 25 tää yhden tai useamman yhteyden 216, joista kukin liittyy yhteen r#% paan biokemialliseen olioon 218 ja yhteen interaktioon 222.
.! * Biokemialliset oliot tallennetaan biokemiallisten olioiden c * · ***** Kuvion 2 esimerkissä kukin biokemiallinen olio on luokkaobjekti, jo kat ovat geeni 218-1, transkripti 218-2, proteiini 218-3, makromok 30 leksi 218-4 ja yhdiste 218-5. Edullisesti on myös optio tallentaa ··· • · i aja a I,. 1 . _ I l·· M (Il Il M j· * li I I„ .
8
Interaktio-osa 222 sisältää biokemiallisten olioiden välisiä ta, mukaanlukien reaktioita. Kineettisten lakien osa 224 kuvaa (hypo kokeellisesti varmennettuja) kineettisiä lakeja, jotka vaikuttavat int Polkujen edullisia ja yksityiskohtaisempia toteutuksia selostetaan ku\ 5 7B ja 8 yhteydessä.
Keksinnön erään edullisen suoritusmuodon mukaisesti IM myös paikkatietoa 214. Paikkatietoon viitataan biomateriaaliosasta ; kuosasta 122. Esimerkiksi biomateriaaleihin liittyvän informaation si viossa 2 näytetty organisaatio sallii minkä tahansa detaljitason tai t 10 yhtäältä populaation ja toisaalta solun spatiaalisen pisteen (koor välillä. Kuviossa 2 näytetyssä esimerkissä paikkatieto käsittää organ 1 (esimerkiksi ihminen), elimen 214-2 (esim. sydän, mahalaukku), 214-3 (esim. sileä lihaskudos, hermokudos), solutyypin 214-4 (esin teelisolu), solun osa 214-5 (eg tuma, solulima) ja avaruuspisteen 21-15 0.25, y = 0.50, z = 0.75 suhteessa suorakulmaisen referenssisolun hin. Organismi tallennetaan edullisesti taksonomiapuuna, jossa on lekin tunnetulle organismille. Elin-, kudos-, solutyyppi- ja solun osa -daan toteuttaa yksinkertaisina listoina. Tallentamalla paikkatieto vi ennalta määrättyihin listoihin saadaan se etu, että tällainen viittaus 20 automaattiseen syntaksintarkastukseen. On siis mahdotonta tallent tietoa, joka viittaa väärinkiijoitettuun tai olemattomaan elimeen tai on
Keksinnön erään toisen edullisen suoritusmuodon mukai katieto voi käsittää myös spatiaalista tietoa 214-6, kuten spatiaalis * * organismi-soluhierarkian kaikkein detaljoiduimmassa paikassa. Jo 25 detaljoiduin paikka osoittaa spesifistä solua tai solun osaa, niin s\ piste voi edelleen määrittää kyseistä tietoa relatiivisina spatiaalisi * * naatteina. Solutyypistä riippuen spatiaaliset koordinaatit voivat olla '”'a maisia tai napakoordinaatteja.
Eräs tällaisen paikkatiedon etu on parempi ja systemaal 30 verrata paikkoja näytteissä ja teoreettisissa rakenteissa, kuten polu * * ____ Il | J Mf . | «|| 9 tullaan kohtaamaan tai minkälaisia kokeita tullaan suorittamaan tai siä näistä kokeista tullaan saamaan. Niin ollen muuttujakuvausten avoimia tuleville laajennuksille. Toisaalta avoimuus ja joustavuus eiv taa anarkiaan, minkä vuoksi tulisi varmistaa, että muuttujakuvauksi 5 taan hyvin määriteltyjä sääntöjä. Nämä tarpeet tyydytetään parhai nettavalla muuttujankuvauskielellä (variable description language, VI Esimerkiksi extendible markup language (XML) on eräs laajennettavasta kielestä, jota voitaisiin periaatteessa käyttää kuvas logisia muuttujia. Tietokoneet tulkitsevat XML-lausekkeita melko help 10 lausekkeet pyrkivät kuitenkin olemaan hyvin pitkiä, minkä vuoksi il· vaikea lukea niitä. Sen vuoksi tarvitaan laajennettavaa VDL:ää, jok paktimpi ja ihmisille ja tietokoneille helppolukuisempi kuin XML.
Laajennettavan VDL:n idea on, että sallittavat muuttuja ovat "vapaita mutta ei kaoottisia”. Tämä idea voidaan esittää for 15 sanomalla, että IMS:n tulisi sallia vain ennalta määrättyjä muuttujia, naita määrättyjen muuttujien joukon tulisi olla laajennettavissa ilman titaitoja. Esimerkiksi jos muuttujalausekkeille suoritettava syntaksini kiinteästi koodattu syntaksintarkastusrutiiniin, jokainen uusi muutt vaatii uudelleenohjelmointia. Optimaalinen kompromissi tiukan järje 20 kaaoksen välillä voidaan toteuttaa tallentamalla sallittavat muuttuja-; tietorakenteeseen, kuten datatauluun tai tiedostoon, joka on muute :*·.. man uudelleenohjelmointia. Normaaleja pääsynhallintatekniikoita voi tää määrittämään, mitkä käyttäjät ovat valtuutettuja lisäämään uusii • · .· · \ muuttuja-avainsanoja.
25 Kuvio 3A esittää muuttujalauseketta edullisella VDLHIä. M
* · .. . seke 30 käsittää yhden tai useamman avainsana-nimiparin 31, jotka tu rajoittimilla. Kuten kuvion 3A esimerkissä näytetään, kukin i * * ***** nimipari 31 koostuu avainsanasta 32, avaavasta rajoittimesta (kuten hakasulusta) 33, (muuttujan) nimestä 34 ja sulkevasta rajoittimesta 30 kevasta hakasulusta) 35. Esimerkiksi “Ts[2002-11-26 18:00:00]" (ill • *· • · , - -...1.1. _ _ _ _ * „I_| _» _!_ |Ä_ ___ , ,**!!* · 10
Mitä kielen syntaksiin tulee, niin muuttujankuvaus voi kä valtaisen määrän avainsana-nimipaneja 31. Mutta mielivaltainen ρε distelmä, kuten esimerkiksi ajan konsentraatio, ei ehkä ole seman lekäs.
5 Kuvio 3B esittää tyypillisten avainsanojen taulukkoa. T
kunkin merkinnän vieressä on sen selkokielinen kuvaus 38’ ja hava esimerkki 38”. Huomattakoon, että taulukko 38 on tallennettu IMS muita taulukoita 38’ ja 38” ei välttämättä ole tallennettu (niiden t vain selventää taulukon 38 kunkin avainsanan merkitystä). Esimer 10 sanan T" esimerkki on *Τ[-2.57Ε-3]", joka on yksi tapa ilmaista i millisekuntia ennen referenssiaikaa. Referenssiaika voidaan os< leiman avainsanalla Ts\
Avainsanat T ja ”Ts” toteuttavat vastaavasti suhteellis< kello-) ajan ja absoluuttisen (kalenteri-) ajan. Ilmaisemalla aika sut 15 absoluuttisen ajan yhdistelmänä tuo sen pienen haitan, että kulial kellä on teoriassa ääretön määrä ekvivalenttisia lausekkeita. “Ts[2002-11-26 18:00:30]” ja “Ts[2002-11-26 18:00:00]T[00:00:30] valenttisia. Niinpä on edullista olla hakulogiikka, joka prosessoi aiki mielekkäällä tavalla.
20 Tallentamalla IMS:n taulukkoon 38 merkintä kutakin avainsanaa kohti on mahdollista pakottaa syötettäville muuttujille nen syntaksintarkastus, kuten kuviossa 3C näytetään.
Edullisen VDL.n syntaksi voidaan ilmaista formaalisti » · .···. tavalla: ♦ ·· 25 <muutlujan kuvaus>::=<avainsana>T<nimi>y{{erotin}<avainsana>T<nimi>T}<lo| • · ; ·. · e <avainsana>::=<jokin ennalta määrätty avainsana, ks. esim. taulu 38> * * \. I ^ <nimi>::=<merkkijono> | **" = mikä tahansa nimi relevantissa datataulussa ***** Eksplisiittisten rajoittimien, kuten”[” ja ”]” nimen ympärill on sallia nimessä mikä tahansa merkki, mukaanlukien välilyönnit 30 tenkään rajoittimia).
• · ·
• · «M . a· · < I | ΛΑ I U Ui V V I I
11
Kuvio 3C esittää valinnaista syntaksintarkastusprosessia. VDL:n eräs etu on, että se sallii automaattisen syntaksintarkastuk 3C esittää tilakonetta 300 tällaisen syntaksintarkastuksen suorittami koneet voidaan toteuttaa tietokonerutiineina. Alkutilasta 302 lähti 5 avainsana aiheuttaa siirtymän ensimmäiseen välitilaan 304. Mikä tai aiheuttaa siirtymän virhetilaan 312. Ensimmäisestä välitilasta 304 av tin aiheuttaa siirtymän toiseen välitilaan 306. Mikä tahansa muu aih tymän virhetilaan 312.
Avaavan rajoittimen jälkeen nimen osaksi hyväksytään mi 10 merkkejä paitsi sulkeva rajoitin, ja tilakone pysyy toisessa välitilassa muuttujalausekkeen ennenaikainen päättyminen aiheuttaa siirtymän 312. Sulkeva rajoitin aiheuttaa siirtymän kolmanteen välitilaan 308, avainsana/nimipari on pätevästi ilmaistu. Pätevä erotinmerkki aiheul ensimmäiseen välitilaan 304. Muuttujalausekkeen lopun ilmaisu aih 15 tymän ”OK” -tilaan 310, jossa muuttujalauseke todetaan syntaksiltaa
Kuvio 4 näyttää esimerkkejä VDL-kielisistä yhdistetyistä lausekkeista. Yhdistetyt muuttujalausekkeet ovat lausekkeita, joissc avainsana/nimipareja. Huomattakoon, kuinka muuttujien spesifisy kun määreitä lisätään. Viitenumerot 401 - 410 osoittavat viittä ekviv 20 lausekkeiden paria siten, että kunkin parin ensimmäinen lauseke c naisempi ja toinen on kompaktimpi. Tietokoneelle monisanaiset ja lausekkeet ovat samanarvoisia, mutta niitä lukevat ihmiset saattavai * :*·.· nisanaista muotoa helpommin ymmärrettävänä. Kuvion 4 lausekkc ;**\ sestään selviä taulukkoon 38 tehtävän viittauksen perusteella. Esim< 25 sekkeet 409 ja 410 määrittelevät reaktionopeuden vuorovaikut • f .. . 2.7.7.13-PSA1 kautta mooleina litraa ja sekuntia kohti. Viitenumero :.S taa muuttujalauseketta Λ/[*]ΡΠΟΠί[*]υΠ”, joka tarkoittaa minkä ti . * * ***** ganismin minkä tahansa proteiinin mitä tahansa muuttujaa missä te siköissä. Viitenumerot 415 ja 416 osoittavat kahta erilaista muuttuja 30 kahdelle erilaiselle ajan ilmaukselle. Muuttujalauseke 415 määrittele « · · • · 1, «I Ml* Il I I I A A^f *» M · A Λ ___· ;i 12
Olennaisesti yllä kuvatun kaltainen VDL on hyvin määrit vain kuviossa 3C näytetyn syntaksintarkastuksen läpäisevät lausekk sytään. VDL on avoin, koska sallitut avainsanat talletetaan taulukkoc on laajennettavissa. VDL on kompakti, koska avainsanoja varten 5 olennaisesti minimimäärä kirjaimia tai merkkejä. Yleisimmät avains; tuvat yhdestä kirjaimesta, tai kahdesta kirjaimesta, mikäli yhden avainsana ei ole yksikäsitteinen.
Datakontekstit
Kuvio 5 näyttää, kuinka VDL:ää voidaan käyttää ilmaisen 10 siä datakonteksteja eli biologisen tutkimuksen laajuutta (scopes). K; tujat, olivatpa ne sitten näytteitettyjä, mitattuja, mallinnettuja, sim miten tahansa prosessoituja, voidaan ilmaista: a) yksinkertaisina arvoina biomateriaalinäytteelle jon hetkenä; 15 b) ajan funktiona biomateriaalille; c) stokastisina muuttujina jakaumineen kunakin ajanh rustuen käytettävissä oleviin biomateriaalinäytteisiii d) stokastisina prosesseina biologisessa datakonteksl a), b) ja c) ovat d:n projektioita, joka on järjestelmän rikk 20 Kaikki IMS:ssä oleva data on kolmeulotteisessa kontekstiavaruudesi relaatiot: : 1. muuttujalistoihin ("mitä"); 2. biomateriaalin listoihin ("missä”) ja 3. aikapisteiden tai -intervallien listoihin ("milloin”).
’ / 25 Viitenumero 500 osoittaa yleisesti N + 2 -ulotteista kontek : ta, jossa on yksi akseli kullekin muuttujalle (N), biomateriaaleille ja s hyvin yksityiskohtainen muuttujalauseke 510 spesifioi muuttujan (r konsentraatio mooleina litrassa), biomateriaalin (populaatio abcd123 : leiman (10.6.2003 klo 12:30). Muuttujan arvo on 1,3 mol/l. Koska m
>***· on «Alfa cnacifini ΙτηηΙΑίΉίΑυαπ n ι/4αιί kailrln tnArr^inaatit e a aeitoM
13
Kolmas muuttujalauseke 530 spesifioi ajan, mutta ei bioi Sen vuoksi se esitetään kaikkien niiden biomateriaalien jakaumani kuuluvat kokeeseen spesifioituna aikana.
Neljäs muuttujalauseke 540 ei spesifioi aikaa eikä bioi 5 Se esitetään ajan funktioiden joukkona 541 ja eri biomateriaalien joukkona 542.
Muuttujankuvauskielen mahdollistamien erilaisten lause sopivasti jäljestettyjen (seuraavaksi selostettavien) datajoukkojen a kijoilla on käytännöllisesti katsoen rajattomat mahdollisuudet tutkia 10 jäijestelmän aika-tila -avaruutta moniulotteisena stokastisena pros* jestelmän probabilistiset aspektit perustuvat relevanttien biomateriai tuma-avaruuteen, ja dynaamiset aspektit perustuvat aika-avaruuteei riaalidata ja aika voidaan rekisteröidä, kun relevantit kokeet dokume
Kaikki kvantitatiiviset mittaukset, data-analyysit, mallit ja 15 tulokset voidaan käyttää uudelleen uusissa analyysitekniikoissa taustainformaation, kuten mitattujen biomateriaalien fenotyyppien, si, kun dataa tulee tulkita eri sovelluksiin.
Datajoukot
Kuviot 6A ja 6B esittävät keksinnön edullisen suoritusm 20 kaisia datajoukkoja. Sekä märkälaboratorio- että in-silico -tyyppiset lennetään datajoukkoina. Kuviossa 6A esimerkinomainen datajouk ]\ : vaa mRNA-molekyylien joukon 610 (on näytetty mRNA1 - mRNA6) • ** *···[ tasoja. Datajoukko 610 on yksi esimerkki kuviossa 2 näytettyyn < osioon 202 tallennetusta datajoukosta. Datajoukko 610 käsittää ne / 25 611 - 614. Muuttuja-arvomatriisi 614 kuvaa muuttujien arvot * * -organisaatiossa. Rivienkuvauslista 613 määrittää muuttuja-arvoma merkityksen. Sarakkeidenkuvauslista 612 määrittää muuttuja-arvon rakkeiden merkityksen. Lopuksi, kiinteiden dimensioiden kuvaus 61 yhden tai useamman kiinteän dimension, jotka ovat yhteisiä 14 joukosta 610 automaattisesti, koska tahansa kun tarve tähän esiintyy luettava versio 615 on esimerkki datajoukoista, kuten taulukkolask dostoista, joita tyypillisesti tallennetaan tunnetuissa IMS:i$sä bioloj musta varten. IMS käsittää edullisesti käyttöliittymälogiikan automas 5 sisuuntaista muunnosta varten tallennusformaatin 611 - 614 ja ihmis van version 615 välillä.
Kuvio 6B esittää toista datajoukkoa 620. Datajoukko 62 myös kuuden mRNA-molekyylin ilmentymistasoja, mutta nämä eivc den eri yksilön ilmentymistasoja vaan yhden populaation ilmentymiä 10 jänä eri aikana. Datajoukossa 620 kiinteiden dimensioiden kuvaus 6 oi, että data liittyy tietyn hiivan näytteeseen xyz tiettynä päivänä ja a rakkeidenkuvauslista 622 spesifioi, että sarakkeet spesifioivat dat ajanhetkelle, nimittäin 0, 30, 60 ja 120 sekuntia kiinteiden dimensioi uksen 621 aikaleiman jälkeen. Rivienkuvauslista 623 on hyvin sa 15 kuin edellisen esimerkin vastaava lista 613, ja ainoa ero on, että viir osoittaa lämpötilaa eikä potilaan ikää. Muuttuja-arvomatriisi 624 sisä liset numeroarvot.
Kunkin datajoukon (esimerkiksi datajoukon 610) jakamini eri komponenttiin (matriisit 611 - 614) voidaan toteuttaa siten, että ki 20 si 611 - 614 on erikseen osoitettava datarakenne, kuten tiedosto ti< tiedostojärjestelmässä. Vaihtoehtoisesti muuttuja-arvomatriisi voidaa yhtenä osoitettavana datarakenteena, kun taas muut kolme matriis den dimensioiden kuvaus ja rivi/sarakekuvaukset) voidaan tallenta .···. datarakenteena, kuten yhtenä tiedostona, jossa on otsakkeet "yhtei .!!!: 25 ja "sarakkeet”. Eräs avainelementti tässä on se, että muuttuja-arvor . letetaan erillisenä datarakenteena, koska se on datajoukon todellisi: :..I* arvoja sisältävä komponentti. Jos numeroarvot tallennetaan erikseen * · *···* vaan datarakenteeseen, kuten tiedostoon tai taulukkoon, se voidaa prosessoida erilaisilla datanprosessointisovelluksilla, kuten tiedonrik 30 (data mining) tai vastaavilla. Toinen etu on, että eri matriiseja muodo * · * : : lisiä HataAlemantteiä si tarvitsa nrnsassniHa ftHI -lrusal\/illä SOI -kusi 15 na polkumallina 700 järjestelmän komponenteista ja komponenttia yhteyksistä (connections). Järjestelmän komponentteja ovat biokem 218 ja vuorovaikutukset 222. Biokemiallisten olioiden 218 ja vuoro' 222 väliset yhteydet 216 tunnistetaan itsenäisiksi objekteiksi, jotka 5 kunkin biokemiallisen olion roolia (esimerkiksi substraatti, tuote, akt inhibiittori) kunkin polun kussakin vuorovaikutuksessa. Yhteys voi s ribuutteja, jotka ovat spesifisiä kullekin biokemialliselle oliolle ja vuo parille (kuten stökiömetrinen kerroin). Kuten aiemmin todettiin, IM edullisesti paikkatietoa, ja kukin polku 212 liittyy bioloogiseen pail 10 Yksi biologinen paikka voidaan kuvata yhdellä tai useammalla polu polkuun sisällytettyjen detaljien tasosta.
Objektipohjaisessa toteutuksessa biokemiallinen polkun tuu kolmeen objektikategoriaan: biokemialliset oliot (molekyylit) 21 £ kutukset (kemialliset reaktiot, transkriptio, translaatio, kokoonpano, 15 nen, translokaatio, jne.) 222 sekä polun biokemiallisten olioiden ja \ tusten väliset yhteydet 216. Ajatuksena on erottaa nämä kolme obji käyttämiseksi omine attribuutteineen ja käyttää yhteyttä sisältäni; biokemiallisen olion rooli (kuten substraatti, tuote, aktivaation tai in stökiömetriset kertoimet kussakin vuorovaikutuksessa, joka tapaht 20 biokemiallisessa verkossa. Tämän lähestymistavan etuna on ek mallin selkeys ja helppo synkronointi, kun useat käyttäjät modifioi polkua yhteys kerrallaan. Käyttöliittymälogiikka voidaan suunnitella 1 ·/·.: polkujen helposti ymmärrettäviä visualisointeja, kuten kuvion 8 yhte • · laan esittämään.
• · 25 Kineettisten lakien osio 224 kuvaa vuorovaikutuksiin vaiki • · reettiset tai kokeelliset kineettiset lait. Esimerkiksi vuo substraatis seen reaktioon voidaan ilmaista seuraavalla kaavalla:
Ymax-fsI-fEl K + [S] * * · 'l\l missä Von substraatin virtausnopeus, Vmax ja Kovat vak • » • * AA .1. I ____J.___1! _ ΓΗΙ ± - -___* I _ ____ - _ - · rm. lii 16 sesti relevanttien diskreettien paikkojen välillä on relaatioita, kuten I ja 7A näytetään.
Monimutkainen polku voi sisältää muita polkuja 700. E 700 yhdistämiseksi malli tukee polkuyhteyksiä 702, joista kullakin on 5 tiota, jotka selostetaan kuvion 7B yhteydessä.
Kuvio 7B näyttää esimerkin monimutkaisesta polusta, joi yksinkertaisempia polkuja. Kaksi tai useampia polkuja voidaan yh niillä on yhteisiä biokemiallisia olioita, jotka voivat siirtyä sellaisinaa tien paikkojen tai yhteisten vuorovaikutusten välillä (esimerkiksi trai 10 tyyppinen vuorovaikutus, joka siirtää biokemiallisia olioita paikasb Muussa tapauksessa polkuja pidetään erillisinä.
Viitenumeron 711 osoittama polku A on pääpolku poluille ta osoitetaan vastaavasti viitenumeroilla 712 ja 713. Polut 711 -712 aatteessa samanlaisia kuin yllä selostettu polku 700. Kaksi polkuyt 15 ja 730 kytkevät polut B ja C, 712 ja 713, pääpolkuun A, 711. Esim< kuyhteydellä 720 on pääpolkurelaatio 721 polkuun A, 711; Rpolus1 722 polkuun B, 712; ja "polkuun” relaatio 723 polkuun C, 713. Lisä "yhteinen olio" -relaatiot 724, 725 polkuihin B, 712 ja C, 713. Selväk teinen olio” -relaatiot 724,725 tarkoittavat, että polut B ja C jakavat n 20 724 ja 725 osoittaman biologisen olion.
Toisella polkuyhteydellä 730 on sekä "pääpolku” että :*\. -relaatiot polkuun A, 711 ja "polkuun” -relaatio polkuun C, 713. Lisä "yhteinen vuorovaikutus” -relaatiot 734, 735 polkuihin B, 712 ja C,' » * .***. tarkoittaa, että polut B ja C jakavat relaatioiden 734 relaatioiden ϊ ««* 25 osoittaman vuorovaikutuksen.
* ·
Yllä selostettu polkumalli tukee epätäydellisiä malleja, jotl rakentaa vaiheittain tietämyksen lisääntyessä. Tutkijat voivat valita c ***** tarpeen vaatiessa. Jotkut polut voidaan kuvata suhteellisen karkea
Muut polut voidaan kuvata aina kineettisiin lakeihin ja/tai spatiaalis 30 naatteihin asti. Malli tukee myös epätäydellistä informaatiota olemas *·· * * _____· j j i p- _1___a j « «I _ .i _ ai · _ i * » 17
Polkumaili tukee myös automaattisia mallinnusprosessi yhtälöitä voidaan muodostaa automaattisesti kunkin biokemiallisen derivaatoille, kun relevantit kineettiset lait ovat käytettävissä kulleki kutukselle. Erityistapauksessa stökiömetrisiä taseyhtälöitä voidaan 5 automaattisesti vuotaseanalyysejä varten. Polkumaili tukee myös siä päästä-päähän -työvirtoja, mukaanlukien mittausdatan erottami tamalla, ylimääräisten rajoitteiden mukaanotto ja yhtälöryhmien ral erilaisiin data-analyyseihin ja potentiaalisiin automaattisiin merkintöi
Automaattinen polkumallinnus voi perustua polun topolo 10 muuttujanimien kuvaamiseen käytettäviin VDL-lausekkeisiin, sove neettisiin lakeihin (kuten stökiömetrisiin kertoimiin) ja matemaattisi siin operaattoreihin ja funktioihin. Parametrit, joita ei tunneta tarka estimoida tai päätellä mittausdatasta. Oletusyksiköitä voidaan k& kertaistamaan muuttujankuvauskielisiä lausekkeita. Esimerkiksi: 15 dV[ooncentration]C[mannose]/dV[time] = V[flux)C[mannose]l[EC 2.7.7.13_PSA1] +...
- V[fluxJC[mannose]l[ EC... ] -...
dV[conoentration ]C[water]/dV[time] = V[flux]C[water]l[EC ... ] + ...
- V[fluxJC[water]l[EC... ]-...
20 Tässä yhtälössä biokemialliset oliospesifiset vuot voida reaktionopeuksilla, jotka on kerrottu stökiömetrisillä kertoimilla. Täi : kissä stökiömetriset kertoimet ovat ykkösiä, esimerkiksi: • * V·: Yhtälöt voidaan kirjoittaa seuraavasti: dV[concenlration ]C[mannose]/d V[time] = 1 ^reaction rate]l[EC 2.7.7.13_PSA1 ] +...
·;*·: 25 -1*V[rectionrate]l[EC... )-...
·» · » · · * « • · . * · *; dV[conoentration ]C[water]/dV[time] = 1 *V[reaction rate]l[EC... ] + ...
- ^reactionrate]l[EC... ]-...
Staattisessa tapauksessa derivaatat ovat nollia. Tämä jot 30 tasemalliin: * « 18 Käyttäjä voi tuottaa omat tavoitefunktionsa ja yiimääräise tonsa tai mittaustuloksensa, jotka rajoittavat mahdollisten ratkaisujer Vielä eräs edullinen piirre on kyky mallintaa kohinaa vuot sissä. Voimme lisätä keinotekoisia kohinamuuttujia, jotka tulee mir 5 voitefunktiossa. Tämä helpottaa epätarkkojen mittausten hyväksy tuullisin tuloksin.
Malli tukee myös visuaalisten polkuratkaisujen (aktiivistei tojen) visualisointia. Yleinen tapaus johtaa tavallisten differentiaal (ordinary differential equations, ODE) malliin, jossa tarvitaan kineetl 10 Niitä voidaan kerätä tietokantaan, mutta voi olla joitakin oletuslakejs tetään tarvittaessa. Yleisissä yhtälöissä vuorovaikutuskohtaiset rea det korvataan kineettisillä laeilla, kuten Michaels-Menten -laeilla, jo vät entsyymien ja substraattien konsentraatioita. Esimerkiksi: VIreacfcn rate]l[EC 2.7.7.13.PSA1] = 5.2^concertfr^ .]/(3.4 + V[oonoentralmnJC[...]) 15 Yhtälöt voidaan muuntaa muotoon: (^concentration ]C[mannose]/dV[timel = 5.2*V[concentration]P[PSAirV[conoentration]C[...]/ (3.4 V[ooncentrationjC[...]) +... -7,9*V[concentrationJP[... ]*V[concentration]( 20 dV[conoentration ]C[water]/dV[time] = 10.0*V[concentration] P[...]*V[concentrationJC[...] /(...) +...
- 8.6*V[concentration ]P[.. .]*V[concentration]C
e · \ ! On vaihtoehtoisia toteutuksia. Esimerkiksi yllä tehdyn *:./ asemasta voidaan laskea kineettiset lait erikseen ja sijoittaa numerc * * · · * sifisiin reaktionopeuksiin iteratiivisesti.
25 Tällaisen rakenteellisen polkumallin etuna on, että hierai *· * : kuja voidaan tulkita tietokoneilla. Esimerkiksi käyttöliittymälogiikka ·[..· tuottamaan hierarkkisten polkujen helposti ymmärrettäviä visualisoir kuvion 8 yhteydessä näytetään.
: Kuvio 8 näyttää polun visualisoitua muotoa, jota yleisesti ··* 30 viitenumerolla 800. Kävttöliittvmäloaiikka oiirtää visualisoidun nolur 19 ta. Katkoviivoin esitetyt nuolet 860 esittävät aktivaatioita, missä bk oliota ei kuluteta eikä tuoteta, mutta se tekee vuorovaikutuksen mj tai kiihdyttää sitä. Katkoviivat 870, joilla on poikittaisviivapää inhibitiota, missä biokemiallista oliota ei kuluteta eikä tuoteta, mut! 5 vuorovaikutuksen tai hidastaa sitä. Nollasta poikkeavat stökiömet met assosioidaan substraatti- tai tuotosyhteyksiin 840, 850. Säätö] (esim. aktivaatio 860 tai inhibitio 870) stökiömetriset kertoimet ovat r Lisäksi biokemiallisten olioiden mitattuja tai säädettyjä voidaan visualisoida ja paikantaa. Esimerkiksi viitenumero 881 oso 10 miallisen olion konsentraatiota, viitenumero 882 osoittaa vuorovaiki aktionopeutta ja viitenumero 883 osoittaa yhteyden virtausta (flux).
Yhteyksien tarkat roolit, vuorovaikutuksiin assosioidut kir ja kunkin polun biologisesti relevantti paikka tuovat parannuksia 1 polkumalleihin nähden, esimerkiksi kuvioissa 7A - 8 näytetty malli t 15 uksia vaihtelevilla detaljitasoilla vaihtelemalla elementtien määrää. L tukee eksplisiittisten kineettisten lakien sisällyttämistä, mikäli niitä tu Tämä tekniikka tukee myös mittaustulosten graafista näytetyillä poluilla. Mitatut muuttujat voidaan korreloida graafisen f sen detaljeihin objektien nimien perusteella.
20 Huomattakoon, että viitenumeroilla 200 ja 700 (kuviois; näytetty tietokantastruktuuri tarjoaa välineet tallentaa biologisen pc giaa mutta ei sen visualisointia 800. Visualisointi voidaan generoic asta ja tallentaa myöhemmin, seuraavalla tavalla. Visualisoinnin 80( • ♦ .···. ja keskinäiset yhteydet perustuvat suoraan tallennettuihin polkuihin 25 tettyjen elementtien paikat voidaan aluksi valita ohjelmistorutiinilla, jt * · jonkin ennalta määrätyn kriteerin, kuten toistensa ylittävien yhteyksin Tällaisia tekniikoita tunnetaan piirilevyjen suunnittelusta. IMS voi tar *··’ jälle graafisia työkaluja visualisoinnin siistimiseksi käsin. Kunkin el· joitus käsin editoidussa versiossa voidaan sitten tallentaa erilliseen * 1 teeseen, kuten tiedostoon.
• a « » f
V
20
Kokeiden projektinhallinnan etuna on, että kaikki mittausi kontrolloidut olosuhteet tai ohjaukset ('’mitä”), biomateriaalit ja ps ("missä”), sekä relevanttien kokeiden ajoitus ("koska”) ja menetelmä voidaan rekisteröidä koedatan tulkitsemista varten. Toinen etu tule* 5 suudesta hyödyntää muuttujankuvauskieltä koedatan tallentamise aiemmin selostettiin.
Kuvio 9 esittää koe-oliota IMS:n koeosiossa. Kukin IMS: nettu projekti 902 käsittää yhden tai useamman kokeen 904. Kullak 904 on relaatiot laitteistodataan 906, käyttäjädataan 908 ja metodid 10 Kukin metodiolio 910 liittyy koeottoon 914 ja koeantoon 920. Koeot kee relevantin oton, kuten biomateriaalin 916 (esimerkiksi populaatk reagentin tai näytteen) tai dataolion 918 (esimerkiksi kontrolloidut < kokeeseen yhdessä relevantin aikainformaation kanssa.
Kokeen anto 920 kytkee relevantin annon, kuten biomate 15 (esimerkiksi populaation, yksilön, reagentin tai näytteen) tai dat (esimerkiksi mittaustulokset, dokumentit, luokitustulokset tai muu kokeeseen yhdessä relevantin aikainformaation kanssa. Esimerkih käsittää biomateriaalin spesifisen näytteen, koe voi tuottaa erinumeri teen samasta organismista. Lisäksi koeotto 920 voi käsittää tuloksia 20 dataolioiden muodossa (kuten kuvioissa 6A ja 6B näytetyt datajou kumentit tai taulukkolaskentatiedostot). Koeanto 920 voi käsittää r :**.· tyyppiluokrttelun ja/tai genotyyppiluokittelun dataolioissa.
Kokeella on myös kohde 930, joka on tyypillisesti biomat .···. (esimerkiksi populaatio, yksilö, reagentti tai näyte), mutta in-silico .!!!: 25 kohde voi olla dataolio 934.
* * .. . Menetelmäoliolla 910 on relaatio menetelmäkuvaukseen • · · :..f kuvaa menetelmän. Menetelmäkuvauksen 912 vieressä oleva silmul • ♦ ’"** taa, että yksi menetelmäkuvaus voi viitata toisiin menetelmäkuvauksi
Kokeen otto 914 ja kokeen anto 920 ovat joko spesifisiä 30 aaleja 916, 922 tai dataolioita 918, 924, jotka ovat samoja datae ·*» • * ..Ä*i**m _ I____ __Λ I I______ _uj.ur I____- _ 21 roimaan tuottavuutta lisättynä informaatiomääränä resurssia (kute vuotta) kohti.
Koeprpjektinhallitsija käsittää edullisesti projektieditorin käyttöliittymä, joka tukee projektinhallinnan toiminnallisuutta projel 5 teettejä varten. Tämä antaa lisäksi kaikki ne normaalin projektinhallii jotka ovat hyödyksi myös järjestelmäbblogian projekteissa.
Projektieditorin edullinen toteutus pystyy seuraamaan k materiaaleja, niiden näytteitä ja kaikkea dataa eri kokeiden kautta, kien märkälaboratorio-operaatiot ja in-silico -datankäsittelyn.
10 Koeprojekti voidaan esittää verkkona, joka koostuu koeak ta, kohdebiomateriaaleista ja otto- tai antotuotoksista, jotka ovat bior ja tai dataolioita.
Monimutkaisuuden suhteen kuvio 9 on pahimman tapau vio. Harvat, jos mitkään tosielämän kokeet käsittävät kaikki kuviossa 15 elementit. Esimerkiksi jos koe on lääketieteellinen tai biologinen käi otto- ja anto-osiot 914, 920 osoittavat tyypillisesti tietyn potilaan tai näytteen. Valinnainen tilaelementti voi kuvata potilaan tai näytteen t käsittelyä. Anto-osa on käsitetty potilas tai näyte.
Näytteenoton tapauksessa otto-osa osoittaa bio materia» 20 näytteenotto kohdistuu, ja anto-osa osoittaa spesifisen näytteen, manipuloinnin tapauksessa otto-osa osoittaa manipuloitavan näyttee osa osoittaa manipuloidun näytteen. Kombinaatiokokeessa otto-os useita kombinoitavia näytteitä ja anto-osa osoittaa kombinoidun, id .*··. näytteen. Kääntäen, separaatiokokeessa otto-osa osoittaa separoit» 25 teen ja anto-osa osoittaa useita separoituja, identifioituja näytteitä.
.. . keessa otto-osa osoittaa mitattavan näytteen, ja anto-osa on dataoli sältää mittaustulokset. Luokituskokeessa otto-osa osoittaa luokitetti • * *··’ teen, ja anto-osa osoittaa fenotyypin ja/tai genotyypin. Viljelykokees anto-osat osoittavat spesifisiä populaatioita, ja laiteosa voi käsittää 30 oiden tunnisteet.
• * # • * Monimutkaisten kokeiden kuvaamiseksi voi olla koesidnn 22
Biomateriaalikuvaukset
Kuvio 10 näyttää esimerkin IMS:n biomateriaaliosion ot sesta toteutuksesta. Tulee huomata, että tämä on vain yksi esimerkl biomateriaalit voidaan kuvata riittävästi ilman kaikkia kuviossa 1C 5 elementtejä. Blomateriaaliosio 210 alaelementteineen 210-1 ... 21( kaosio 214 alaelementteineen 214-1 ... 214-5 on lyhyesti selostetl yhteydessä. Kuvio 10 näyttää, että biomateriaalilla 210 voi olla m< neen -relaatio tilaelementtiin 1002, fenotyyppielementtiin 1004 ja < menttiin 1006. Valinnaista organismisidontaa 1008 voidaan käytti 10 mään (sekoittamaan) eri organismeja. Esimerkiksi organismisidonl osoittaa, että tietty populaatio käsittää x prosenttia organismia 1 ja) organismia 2.
Organismielementin 214-1 alapuolinen silmukka 1010 tai tä organismi kuvataan edullisesti taksonomisena kuvauksena. Kuv 15 puoli näyttää kaksi esimerkkiä tällaisesta taksonomisesta kuvauk merkki 1010A on kolibakteerin erään spesifisen näytteen taksonon us. Esimerkki 1010B on valkoapilan taksonominen kuvaus.
Kuvioiden 3A - 3C yhteydessä selostettua muuttujank voidaan käyttää kuvaamaan tällaisiin biomateriaaleihin ja/tai niiden 20 liittyviä muuttujia. Esimerkki: ,. V[concentration]P[P53]U[mol/l]ld[Patient X]L[human cytoplasm]=0.01.
• · i ·· ]·,: Eräs tällaisen paikkatiedon etu on parannettu ja system; pa verrata paikkoja näytteissä ja teoreettisissa rakenteissa, kutei jotka joudutaan varmentamaan relevanteilla mittaustuloksilla.
/ 25 Toinen etu, joka saavutetaan tallentamalla biomateriaal
i naisesti kuviossa 10 näytetyllä tavalla, liittyy datan visualisointiin. I
biomateriaalit voidaan korvata niiden fenotyypeillä. Eräs esimerkki korvaamisesta on, että tietyt yksilöt luokitellaan "allergisiksi”, mikä < : paljon havainnollisempi kuin pelkkä tunniste.
• · 23 1
Kuvioiden 3A - 4 yhteydessä käytettyä muuttujankuvauskieltä käyttää hetkellä 5 voidaan ilmaista lausekkeella Sa[4]T[5]. Lauseke S; ld[A]T[5] tarkoittaa, että näyte 4 saatiin yksilöstä A hetkellä 5.
Hetkellä 12 näytteestä 4 otetaan kaksi muuta näytettä. K 5 1108 osoittaa, näyte 25 otetaan näytteestä 4 erottamalla tumat. Vi 1112 osoittaa näytteen 25 havaintoa (mittausta), nimittäin proteiinin sensaatiota, jonka tässä esimerkissä näytetään olevan 4,95.
Kuvio 11B esittää datan seurattavuutta tapahtumaketjussa teutetaan ohjaus annostelemalla yksilölle B 1150 tiettyä yhdistettä. K 10 numerot 1152- 1158 osoittavat, 10 gramman annos yhdistettä abcd näytteelle 40 hetkellä 1, ja tuo näyte annetaan yksilölle B hetkellä mero 1160 osoittaa mannoosin annostelua yksilölle B hetkellä 5. K alapuoli on analoginen kuvion 11A kanssa, ja erillinen selostus jää p< Näyttämällä sellaisia kuvia, joita sisältyy kuvioihin 11A ja 15 taan käyttäjiä ymmärtämään, mihin havainnot perustuvat. Paranne seurattavuuden etuihin kuuluu virheiden väheneminen ja anomalii pompi selittäminen.
Tulisi ymmärtää, että tosielämän tapaukset voivat olla pa mutkaisempia kuin mitä yhdellä piirrossivulla voidaan kohtuudella e 20 viot 11A ja 11B esittävät siis vain datan seurattavuuden periaatetta, kaisten tapausten tukemiseksi visualisointilogiikan edellä tulisi olla aktivoimia suotimia, jotka sallivat käyttäjien nähdä vain mielenkiinnoi Jos esimerkiksi käyttäjä on kiinnostunut vain kuviossa 11A näytet • · teestä 25, niin voidaan näyttää vain tapahtumien (näytteiden) ke1 .*‘1: 25 1106-1110-1112.
• « ·· 9 : V Työvirtojen kuvaukset ··· : Kuvio 12A näyttää ohjelmisto-komponenttimallia työvirtoj flow) kuvaamiseksi ja hallitsemiseksi IMS:ssä. Työvirta 1202 voi si$« työvirtoja. Alimman tason työvirta sisältää työkalun 1208. Kullakin tyc :***: 30 omistaia-kävttäiä 1220. Kukin tvövirta kuuluu johonkin oroiektiin 1211 24
Ottomäärityksiin sisältyy aluke, tunnistenumero, kuvaus tyyppi, lopuke (post-tag), komentorivijäijestys, valinnaisuus-status vai valinnainen). Tämä informaatio talletetaan työkalun ottosidonl binder) 1210 tai työkalun antosidontaan (output binder) 1212.
5 Dataoliotyypit määritellään järjestelmään termeillä dal nimi, kuvaus, datakategoria (esim. tiedosto, hakemisto alihakemk tiedostoineen, datajoukko, tietokanta, jne.) On useita dataoliotyyp kuuluvat samaan kategoriaan mutta joilla on erilainen syntaksi tai s ja jotka sen vuoksi kuuluvat eri dataoliotyyppiin olemassa olevien 10 yhteensopivuussääntöjen vuoksi. Tämä informaatio talletetaan data 1214. Työkalupalvelimen sidonta 1224 osoittaa sen palvelimen 1 työkalu voidaan suorittaa.
Tyypitettyjä dataolioita käytetään ohjaamaan erilaisten yhteensopivuutta, jotka voivat olla tai olla olematta yhteensopivia. T 15 mahdollisuuden kehittää käyttöliittymän, jossa järjestelmä avusta luomaan järkeviä työvirtoja ilman etukäteistietoa kunkin työkalun y dista.
Dataolioinstanssit, jotka sisältävät käyttäjädataa, tallenne olioon 1216. Kun työvirtoja rakennetaan, relevantit dataoliot kytk< 20 vantteihin työkaluottoihin työvirran ottojen 1204 tai työvirran antojen ta.
Kuvio 12B esittää asiakas-palvelin -arkkitehtuuria, joh • asiakaspäätelaitteessa CT suoritettava graafinen työvirtojen ed .···! Graafinen työvirtojen editori 1230 kytkeytyy työvirtapalveiimen 1: ·!!!: 25 suoritushallitsijan (executor) palveluobjektiin työkalupalvelimessa 1; • · .. . fista työvirtojen editoria 1230 käytetään valmistelemaan, suorittama; toroimaan sekä tarkastelemaan työvirtoja ja dataolioita, jotka viestiv • * *···* tietokannan 1236 kanssa. Työvirtapalvelin 1232 huolehtii työvirtoje misesta käyttämällä yhtä tai useampaa työkalupalvelinta 1234. Rele 30 kalupalvelimen osoite voidaan löytää palvelintaulukosta (kuvio 12A).
1 1 Viiliin h/AIralimalualin ΛIrSeiftöS eimritiichallHeiian ia φ 25 informaatiota voidaan kuvata XML-tiedostossa, jota käytetään alust tadataa kullekin työkalulle työkaiutietokannassa (kuvion 12A kohta veluobjekti vastaanottaa anto- ja ottodatan, ja käyttämällä työkalun formaatiota, se voi valmistella vaaditun komentorivin työkalun suoritl 5 Kuvioissa 12A ja 12B näytetty työviitojen/työkalujen hallit helposti perinteisiä työkaluja ja kolmansien osapuolten työkaluja jen/työkalujen hallitsijan muihin etuihin kuuluu työvirtojen täydelliner tointi, helppo uudelleenkäytettävyys ja automaattinen suoritus. Esim vlrtojen/työkalujen hallitsija voi piilottaa kolmansien osapuolten työl 10 mistajakohtaiset käyttöliittymät ja korvata ne IMS:n yhteisellä graafis liittymällä. Käyttäjät voivat siis käyttää yhteisen graafisen käyttöliittyr toja valmistelemaan, suorittamaan ja monitoroimaan sekä tarkasteli virtoja ja niiden dataolioita.
Kuvio 12C näyttää, kuinka työvirtaedrtori voi esittää työvir 15 jen ja dataolioiden verkkona siten, että dataoliot ovat työkalujen otti ja. Työkalut suoritetaan työvirtojen topologisen lajittelun perusteella.
Nämä työvirrat ovat erittäin hyödyllisiä monimutkaisiin te ka on toistettava uudelleen hieman erilaisin syöttein.
Polkujen automaattinen täyttäminen sekvenssitietokannasta 20 IMS, jossa on olennaisesti sellainen polkumalli, joka sek vioiden 7A - 8 yhteydessä, tukee epätäydellisiä polkuja. Näin siksi ]·, : määritellään alkeiskomponenttien kautta, joita voidaan lisätä kun i I..' saadaan. Tämän ominaisuuden eräs etu on, että IMS voidaan varus to- ja ohjelmistovälineillä polkujen automaattista täyttämistä vartei .* / 25 (usein kaupallisista) sekvenssitietokannoista. Tähän tarvitaan yht< : ulkoisiin tietokantoihin, jäsennysfogiikka kutakin tiettyä tietokantaa v logiikka polun komponenttien (tai ainakin joidenkin) johtamiseksi ui tokantojen ominaisuustaulukoista (feature table) tai muusta info :j*: Huomattakoon, että sekvenssitietokannat eivät tuota mitään ekspl :***: 30 formaatiota polkumalleista. Ne tuottavat vain informaatiota aeeneisi 26 (transkriptioita ja translaatioita), joista sekvenssitietokannat eivät kerro mitään, ei voida täydellisesti kuvata biologista perustietämystä lä, mutta hyvin määriteltyjen biokemiallisten olioiden ja biologisten teiden avulla interaktioiden väliset yhteydet voidaan kuvata täydeltä 5 mallissa. Ei edes ole välttämätöntä, että sekvenssitietokanta sisältä, tiota transkripteista. Sen sijaan keksinnöllinen logiikka voi määrittää identifioida ja nimetä ne. Nimeäminen on usein välttämätöntä, koi molekyylejä ei usein nimetä niin kuin geenejä tai proteiineja.
IMS, jossa on yllä selostettu polkumalli, perustuu siis yl 10 interaktioihin, ja IMS tukee epätäydellisiä polkumalleja. On hyödyl määrittää yhteydet automaattisesti ulkoisista tietokannoista, vaikka i pitääkin täydentää jälkikäteen, kun lisätietoa on saatavana.
Kuvio 13 esittää prosessia, kuten ohjelmistorutiinia, poll maattista täyttämistä varten sekvenssitietokannasta. Tässä esime 15 venssitietokannassa on kaksi identifioitua geeniä G1 ja G2, joita viitenumeroilla 1302 ja 1306. Tietokannan ominaisuustaulu annotoituja DNA-sekvenssejä.
Tyypillisissä sekvenssitietokannoissa on rivitunnisteita, £ ja sekventiaalista paikka· tai määriteinformaatiota ominaisuuksien 20 varten. Vaikka on monia erilaisia tunnisteita, avainsanoja ja mäi mahdollista hyödyntää joitakin yleisiä yhteneväisyyksiä.
Esimerkiksi EMBL-tietokannassa on seuraavanlaisia omii lukoita: » * ·*· (
Bm &taio Paikka/Määrite ·:··: 25 π CDS 22..2892 Γν π I*". FT db_xref="SWISS-PROT :P49746"
FT
. ... FT /gene=’THBS3' 30 ft 27 identifioi "SWISS-PROT:P49746M, ja geenin ja proteiinin välissä mRNA. Nimet on muunnettava suositelluiksi nimiksi (ks. nimitaulukc ossa 2).
Oletetaan, että annotoituna ominaisuutena on geeni G 5 viitenumerolla 1302) silmukointivarianttituotteiden (splice variant p P2 ja P3 kanssa (viitenumerot 1342,1344 ja 1346). Silloin tiedämnr tyy olla kolme silmukointivariantti mRNArta, nimittäin Tr1=mRI P1:een, Tr2=mRNA G1:stä P2:een, ja Tr3=mRNA G1:stä P3:een mukointivariantti mRNA:t osoitetaan viitenumeroilla 1322,1324 ja Y< 10 Oletetaan lisäksi, että annotoituna ominaisuutena on 1308, jolla on yksi tuote P4, 1348. Silloin tiedämme, että täyty mRNA, nimittäin Tr4=mRNA, 1328, G2:sta P4:ään.
Yllä olevan informaation perusteella polun luuranko, kute 13 näytetty, voidaan luoda automaattisesti.
15 Aluksi transkriptio-interaktiot voidaan täydentää m ribonukleotidi-substraateilla ja myöhemmin tunnetuilla transkrip Translaatio-interaktio voidaan täydentää aminohapoilla ja ribosomil tiot eivät ole vielä täydellisiä, mutta RNA-sekvenssitietokantoja voidi muodostamaan translaatio-interaktioita, jos on olemassa annotoiti 20 suuksia (features), joihin kuuluu identifioitu mRNA ja proteiini.
Automaattisen populointiominaisuuden etu on automaatl min kattava polunmuodostus kullekin organismille, mikä helpc tyneempää polun kokoamista, joka perustuu kuviossa 13 näytettyyr /·*! vioon.
• « 25 Laitteiston ja ohjelmiston osalta IMS tarvitsee pääsyn ulk • « , kantoihin. Moniin tietokantoihin voidaan päästä tavallisella Internet
Niinpä automaattisen populointiohjelmiston tulee emuloida Internet-***** muuten tuottaa yhteensopivia komentoja. Lisäksi IMS tarvitsee jäi giikan (parsing) ja tietoa siitä, kuinka kunkin tietokannan anto on järji « « · « « · «4« 28 mikä tarkoittaa, että niillä on etupää ja takapää. Hermosolut ovat v nimutkaisempia. Niinpä IMS edullisesti käsittää useita spatiaalisia malleja, ja spatiaalinen piste ilmaistaan referenssimaliin ja sen sis alueen yhdistelmänä.
5 Kuvio 14 esittää kolmea erilaista referenssimalli-esimer renssimalli 1400 on yksinkertainen koordinaattijärjestelmä, kuten k nen suorakulmainen koordinaattijärjestelmä. Joillekin solutyypeille yksi tai kaksi koordinaattia. Jos kyseinen solutyyppi on pyörähdyssyi napakoordinaattijäijestelmä voi olla parempi kuin suorakulmainen.
1 o Referenssimalli 1410 perustuu solun jakamiseen useaan
Alueiden määrä tulisi valita siten, että biokemiallinen informaatio | alueella. Referenssimalli 1410 soveltuu kompaktille suuntautunee kuten kantasolulle. Malli 1410 on suuntautunut, mutta pyörähdyssyi Siihen kuuluu etupään alue 1411, takapään alue 1416, tuma-alue 15 välialueita 1412,1413ja 1415. Etu-ja takapäät voidaan valita jonkir suhteen, kuten jonkin yhdisteen laskevan konsentraation suhteen.
Referenssimalli 1420 on esimerkki hermosolun topologia misesta. Siinä on tuma-alue 1421 ja sen ympärillä eri osia 1422,14! alue 1424, aksonialue 1425, jne. Normalisoituja spatiaalikoordim 20 daan käyttää kasvattamaan detaljitasoa edelleen tarvittaessa. Esim te, joka on aksonin ulkopinnalla sen pituussuuntaisessa keskipisti daan ilmaista muodossa {1420, 1425, (0,5,1)}, missä 1420 osoitta simallia, 1425 osoittaa aluetta referenssimaliin sisällä, 0,5 on nomr * · .***. tuussuuntainen koordinaatti aksonia pitkin ja 1 tarkoittaa 1009 .]*]* 25 aksonin poikkileikkausta pitkin.
• · :v, Alan ammattilaiselle on selvää, että tekniikan kehittyessä ..! mukainen konsepti voidaan toteuttaa eri tavoin. Keksintö suoritusr • * ***** ei rajoitu yllä esitettyihin esimerkkeihin vaan ne voivat vaihdella pg musten suojapiirin puitteissa.
« · * *.:·· 30 ··· • ♦ • +

Claims (7)

29
1. InfoiTnaationhallintajäijestelmä biologisen informaation litsemiseksi, johon informaationhallintajärjestelmään kuuluu palvelin tokanta (DB), joka on sovitettu tallentamaan blomateriaalitietoa (210 5 kutietoa (212); tunnettu siitä,että: - tietokanta on lisäksi sovitettu tallentamaan paikkatietoa liittyy biomateriaalitietoon (210) ja/tai polkutietoon (212); ja - paikkatieto käsittää paikkahierarkian (214-1 ... 214-6); 10 jolloin paikkatieto voidaan ilmaista biomateriaali- ja po erillisenä tietoelementtinä ja niistä riippumatta.
2. Patenttivaatimuksen 1 mukainen informaationhallintaj; tunnettu siitä, että paikkahierarkia käsittää organismin (214-(214-2), kudoksen (214-3), solutyypin (214-4) ja solun osan (214-5).
3. Patenttivaatimuksen 2 mukainen informaationhallintaj; tunnettu siitä, että paikkahierarkia käsittää spatiaalisen pistetied solun osassa tai solussa.
4. Patenttivaatimuksen 3 mukainen informaationhallintaji tunnettu siitä, että spatiaalinen pistetieto (214-6) käsittää koordii 20 (1400). 9 9 m 9 9 • 99
5. Patenttivaatimuksen 3 tai 4 mukainen informaati järjestelmä, tunnettu siitä, että spatiaalinen pistetieto (214-6) o .* / den spesifisen referenssimallin useasta referenssimallista (1410, 1 * * · relevantin alueen (1411 -1416; 1421 -1427) spesifisestä referenssir « · ···
6. Jonkin edellisen patenttivaatimuksen mukainen infom . lintajäijestelmä, tunnettu siitä, että biologinen informaatio (20l .···, datajoukkoja (202, 610,620), joista kukin datajoukko käsittää: 30 - muuttujankuvauskielellä (30) olevan kiinteiden dimensio uksen (611, 621) yhdestä tai useammasta kiinteästä dimensiosta, yhteisiä muuttuja-arvomatriisin kaikille arvoille.
7. Jonkin edellisen patenttivaatimuksen mukainen inforrr 5 lintajärjestelmä, tunnettu siitä, että se on sovitettu tallentamaan materiaalitietoa (210) että polkutietoa (212). ·· « · • ·· • · • · · • • · • * • * a a * • · 99 9 9 9 9 9 9 9 9 999 9 9 9 9 999 1 9 9 9 9 9 9 99 9 99 9 9 9 31 4
FI20031027A 2003-07-04 2003-07-04 Informaationhallintajärjestelmä biokemiallista informaatiota varten FI117067B (fi)

Priority Applications (9)

Application Number Priority Date Filing Date Title
FI20031027A FI117067B (fi) 2003-07-04 2003-07-04 Informaationhallintajärjestelmä biokemiallista informaatiota varten
RU2005141111/09A RU2005141111A (ru) 2003-07-04 2004-07-02 Система управления биохимической информацией
PCT/FI2004/000424 WO2005003999A1 (en) 2003-07-04 2004-07-02 Information management system for biochemical information
CA002531131A CA2531131A1 (en) 2003-07-04 2004-07-02 Information management system for biochemical information
EP04103138A EP1494142A1 (en) 2003-07-04 2004-07-02 Information management system for biochemical information
US10/883,044 US20050010369A1 (en) 2003-07-04 2004-07-02 Information management system for biochemical information
CNA2004800232855A CN1836234A (zh) 2003-07-04 2004-07-02 用于生物化学信息的信息管理系统
AU2004254729A AU2004254729A1 (en) 2003-07-04 2004-07-02 Information management system for biochemical information
JP2006516238A JP2007520773A (ja) 2003-07-04 2004-07-02 生化学情報のための情報管理システム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FI20031027 2003-07-04
FI20031027A FI117067B (fi) 2003-07-04 2003-07-04 Informaationhallintajärjestelmä biokemiallista informaatiota varten

Publications (3)

Publication Number Publication Date
FI20031027A0 FI20031027A0 (fi) 2003-07-04
FI20031027A FI20031027A (fi) 2005-01-05
FI117067B true FI117067B (fi) 2006-05-31

Family

ID=27636065

Family Applications (1)

Application Number Title Priority Date Filing Date
FI20031027A FI117067B (fi) 2003-07-04 2003-07-04 Informaationhallintajärjestelmä biokemiallista informaatiota varten

Country Status (4)

Country Link
US (1) US20050010369A1 (fi)
EP (1) EP1494142A1 (fi)
CN (1) CN1836234A (fi)
FI (1) FI117067B (fi)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070143094A1 (en) * 2005-12-15 2007-06-21 Torres Robert J Systems, methods, and media for integrating and driving experimental design and analysis
CN102750360B (zh) * 2012-06-12 2014-05-28 清华大学 一种用于推荐系统的计算机数据挖掘方法
CA2920608C (en) * 2013-05-28 2018-07-24 Five3 Genomics, Llc Paradigm drug response networks
CN104866248A (zh) * 2015-06-12 2015-08-26 中国地质大学(武汉) 一种量化语义块关系的方法及装置
WO2017101112A1 (zh) * 2015-12-18 2017-06-22 云舟生物科技(广州)有限公司 载体设计方法及载体设计装置
US10684919B2 (en) * 2016-10-25 2020-06-16 Siemens Healthcare Gmbh Query with data distribution in a hospital network
WO2020227383A1 (en) 2019-05-09 2020-11-12 Aspen Technology, Inc. Combining machine learning with domain knowledge and first principles for modeling in the process industries
US11782401B2 (en) 2019-08-02 2023-10-10 Aspentech Corporation Apparatus and methods to build deep learning controller using non-invasive closed loop exploration
WO2021076760A1 (en) 2019-10-18 2021-04-22 Aspen Technology, Inc. System and methods for automated model development from plant historical data for advanced process control
US11630446B2 (en) * 2021-02-16 2023-04-18 Aspentech Corporation Reluctant first principles models
US11556696B2 (en) * 2021-03-15 2023-01-17 Avaya Management L.P. Systems and methods for processing and displaying messages in digital communications

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6023659A (en) * 1996-10-10 2000-02-08 Incyte Pharmaceuticals, Inc. Database system employing protein function hierarchies for viewing biomolecular sequence data
US6341279B1 (en) * 1998-10-12 2002-01-22 Starwave Corporation Method and apparatus for event modeling
US6343295B1 (en) * 1998-12-16 2002-01-29 Microsoft Corporation Data lineage
US6434558B1 (en) * 1998-12-16 2002-08-13 Microsoft Corporation Data lineage data type
JP3545271B2 (ja) * 1999-09-14 2004-07-21 富士通株式会社 Cadシステム、cad連携システム、cadデータ管理方法及び記憶媒体

Also Published As

Publication number Publication date
EP1494142A1 (en) 2005-01-05
FI20031027A0 (fi) 2003-07-04
US20050010369A1 (en) 2005-01-13
EP1494142A9 (en) 2005-09-07
FI20031027A (fi) 2005-01-05
CN1836234A (zh) 2006-09-20

Similar Documents

Publication Publication Date Title
FI118102B (fi) Informaationhallintajärjestelmä työvirtojen hallitsemiseksi
Lacroix et al. Bioinformatics: managing scientific data
Cline et al. Integration of biological networks and gene expression data using Cytoscape
Revell et al. Rphylip: an R interface for PHYLIP
FI117067B (fi) Informaationhallintajärjestelmä biokemiallista informaatiota varten
Donelson et al. The BioMediator system as a data integration tool to answer diverse biologic queries
FI118101B (fi) Informaationhallintajärjestelmä biokemiallista informaatiota varten
FI117068B (fi) Informaationhallintajärjestelmä biokemiallista informaatiota varten
FI118063B (fi) Informaationhallintajärjestelmä biokemiallista informaatiota varten
FI117988B (fi) Informaationhallintajärjestelmä biokemiallista informaatiota varten
Fernandez-Breis et al. Enriching the gene ontology via the dissection of labels using the ontology pre-processor language
Pedersen et al. A language for biochemical systems
Hagedorn Structuring descriptive data of organisms—requirement analysis and information models
Romanel et al. The beta workbench
Paterson et al. A universal character model and ontology of defined terms for taxonomic description
Le Novere et al. Systems biology graphical notation: process diagram level 1
FI118868B (fi) Informaationhallintajärjestelmä biokemiallisen informaation hallintaa varten
WO2005003999A1 (en) Information management system for biochemical information
Babur et al. Model analytics for industrial MDE ecosystems
Bada et al. GOAT: the gene ontology annotation tool
Fukuda et al. A pathway editor for literature-based knowledge curation
Guimarães et al. Hypermedia genes: An evolutionary perspective on concepts, models, and architectures
Chan et al. Applications, Representation, and Management of Signaling Pathway Information: Introduction to the SigPath Project
CANAKOGLU Integration of biomelecular interaction data in a genomic and proteomic data warehouse
Eriksson Integration of Data From Heterogeneous Biological Databases Using COBRA and XML

Legal Events

Date Code Title Description
FG Patent granted

Ref document number: 117067

Country of ref document: FI