FI120116B - Information management techniques related to the metabolism of data - Google Patents

Information management techniques related to the metabolism of data Download PDF

Info

Publication number
FI120116B
FI120116B FI20065309A FI20065309A FI120116B FI 120116 B FI120116 B FI 120116B FI 20065309 A FI20065309 A FI 20065309A FI 20065309 A FI20065309 A FI 20065309A FI 120116 B FI120116 B FI 120116B
Authority
FI
Finland
Prior art keywords
information
compound
compounds
lipid
individual
Prior art date
Application number
FI20065309A
Other languages
Finnish (fi)
Swedish (sv)
Other versions
FI20065309A (en
FI20065309A0 (en
Inventor
Matej Oresic
Original Assignee
Valtion Teknillinen
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Valtion Teknillinen filed Critical Valtion Teknillinen
Priority to FI20065309A priority Critical patent/FI120116B/en
Priority to FI20065309 priority
Publication of FI20065309A0 publication Critical patent/FI20065309A0/en
Publication of FI20065309A publication Critical patent/FI20065309A/en
Application granted granted Critical
Publication of FI120116B publication Critical patent/FI120116B/en

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/80Data visualisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/90Programming languages; Computing architectures; Database systems; Data warehousing

Description

Informaationhaliintatekniikoita metaboliaan liittyvälle datalle Informaationhaliintatekniikoita associated with the metabolism of data

Keksinnön tausta background of the invention

Keksintö liittyy informaationhallintatekniikoihin metaboliaan liittyvälle datalle, kuten datalle, joka liittyy lipideihin ja/tai muihin yhteisiä rakenneosia 5 jakaville molekyyliluokille, kuten glykaaneihin. The invention relates to information management techniques associated with the metabolism of data, such as data associated with lipids and / or other common structural elements 5 that share the molecular classes, such as glycans.

Lipidit ovat tärkeä ja erittäin monipuolinen luokka aineenvaihdunta-tuotteita, joilla on rakenne-, energiavarasto- ja viestintärooleja. Lipids are an important and highly diverse class of metabolic products, which are structural, energy storage, and communication roles. Lipidien aineenvaihdunnan tunnistetaan näyttelevän keskeistä roolia useissa sairauksissa, kuten arterioskleroosi, diabetes ja Alzheimerin tauti, vain muutamia mainitak-10 semme. Lipid metabolism is identified to play a central role in several diseases, such as arteriosclerosis, diabetes and Alzheimer's disease, only a few of our mainitak-10. Tästä tärkeydestä huolimatta ei vielä ole esitetty bioinformatiikan strategioita, jotka täysin hyödyntäisivät moderneja analyysi- ja informatiikkateknii-koita. In spite of this importance has not yet bioinformatics strategies that fully take advantage of the modern analysis and informatiikkateknii-loops are shown.

Lipidit ovat monipuolinen luokka biologisia molekyylejä, jotka näyttelevät keskeistä roolia biologisten solukalvojen rakenneosina, energiavarastoina 15 ja viestimolekyyieinä. Lipids are a diverse class of biological molecules which play a central role in biological cell membranes, components, parts and reservoirs of energy and 15 viestimolekyyieinä. Lipidien metabolia häiriöt liittyvät useisiin ihmisen sairauksiin, mukaan lukien diabetes, Alzheimerin tauti, arterioskleroosi ja tartuntataudit. Lipid metabolism disorders are associated with many human diseases, including diabetes, Alzheimer's disease, atherosclerosis and infectious diseases. Samalla kun lipidien ja metaboiomien tutkimus on viime vuosikymmenten aikana yleisesti jäänyt genomiikan kehityksen varjoon, viimeaikainen uudelleen herännyt ja nopeasti kasvava kiinnostus lipidejä kohtaan, joka on saattanut 20 liikkeelle useita uusia hankkeita lipiditutkimuksen alalla, havainnollistaa niiden kriittistä tärkeyttä biologiassa. While lipids and metaboiomien research has during the last decades generally been overshadowed by developments in genomics, the recent re-awakened and a rapidly growing interest in lipid-point, which may have been 20 issued a number of new projects in the field of lipiditutkimuksen, illustrates the critical importance of biology. Lipidomiikka alana pyrkii karakterisoimaan lipidi-molekyylien lajeja ja niiden biologisia rooleja suhteessa lipidimetaboliaan osallistuvien proteiinien ilmentymiseen ja toimintaan, mukaan lukien geenien sääntely. Lipidomics field of endeavor to characterize the types of lipid molecules and their biological roles with respect to expression and activity, including regulatory genes of proteins involved in lipid metabolism.

25 On useita julkisia resursseja, jotka edustavat lipidi-informaation eri aspekteja, kuten LIPID MAPS, Lipid Bank, LIPIDAT, CyberLipids, ja Lipid Base. 25 There are a number of public resources, which represent different aspects of lipid-information, such as the LIPID MAPS, Lipid Bank, LIPIDAT, CyberLipids, and Lipid Base. On muodostettu uusia yhteenliittymiä, kuten LIPID MAPS {Lipid Metabolites and Pathway Strategy), ja muut pioneeriryhmät Euroopassa ja Japanissa työskentelevät samoja päämääriä kohti. It is formed new associations, such as the LIPID MAPS {Lipid Metabolites and Pathway Strategy) and other pioneer groups in Europe and Japan are working towards the same purpose. LIPID MAPS -yhteenliittymä esitteli 30 nimistön, joka mahdollistaa lipidiyhdisteen esittämisen uniikilla 12-numeroisella tunnisteella. LIPID MAPS consortium introduced 30 names, which allows the presentation of a lipid with a unique 12-digit identifier. Samaa LIPID MAPS -yhteenliittymän ehdottamaa luokitus- ja ni-mistöjärjestelmää seuraten JCBL (Japanese Conference on the Biochemistry j of Lipids) ylläpitää tähän liittyvää tietokantaa Lipid Base, jossa myös ylläpide- j tään MS/MS -fragmentti-informaatiota yksilöllisistä lipidilajeista. The same LIPID MAPS consortium proposed classification and ni software system following the JCBL (Japanese Conference on the Biochemistry of Lipids j) maintains this database-related Lipid base, where j is maintained in the MS / MS fragment information of individual lipid species. j 35 Viime aikaiset kehitykset lipiditutkimuksen analyyttisten menetelmi- j en, erityisesti massaspektrometriaan kytketyn nestekromatografian (liquid | ! \ % 2 chromatography coupled to mass spectrometry, LC/MS), alalla edellyttävät kattavia lipidikirjastoja mahdollistamaan lipidien järjestelmätason identifiointi, löydöt ja myöhempi tutkimus, integroidut tutkimukset, jotka yhdistävät usean kudoksen lipidomiikka profiileja biologisen informaation muiden tasojen kans-5 sa, kuten geeniekspressio ja proteomiikka, ovat tulleet mahdollisiksi tällaisten ominaisuuksien ansiosta. j 35 Recent developments lipiditutkimuksen analytical with the methods j I, especially coupled with mass spectrometry liquid chromatography (liquid |! \% 2 chromatography coupled to mass spectrometry, LC / MS), the field will require comprehensive lipidikirjastoja to allow the lipid system-level identification, discoveries and subsequent research, integrated studies connecting the plurality of tissue lipidomics profiles of other biological information with the levels-5, such as in gene expression and proteomics, have been made possible thanks to such characteristics.

Paljon tietoa tuottavien lipidomäikkakokeiden vuoksi käytettävissä on suuria informaatiomääriä, minkä vuoksi tietokantajärjestelmän on oltava tehokkaasti kytketty lipidiprofiilidataa kehittävään analyyttiseen alustaan sekä kemo-10 ja bioinformatiikkajärjesteimään yhdisteiden identifioimiseksi ja informaation kytkemiseksi biologisen organisaation muille tasoille, järjestelmätekniikoiden mahdollistamiseksi. Therefore a lot of information is available lipidomäikkakokeiden producing large amounts of information, therefore, the database system must be efficiently coupled to lipidiprofiilidataa generating the analytical support, and the chemo-10 and bioinformatiikkajärjesteimään for identifying compounds and coupling the information to the other levels of biological organization, to allow the system technologies.

Lipidien diversiteetti eri organismeissa, kudoksissa ja solutyypeissä aiheuttaa, että suurta enemmistöä relevanteista lipideistä ei ole identifioitu, ja 15 mikään yksittäinen tietokanta pystyy tuskin kattamaan kaikkia mahdollisia lipidejä. Lipid diversity in different organisms, tissues and cell types causes that the vast majority of the relevant lipids has not been identified, and 15 no single database can hardly cover all possible lipids. On siis tarve mekanismille, joka helpottaisi uusien lipidilajien löytämistä käytettävissä olevan datan joukosta biologisissa järjestelmissä. There is therefore a need for a mechanism which would facilitate the identification of new lipid from the group of the data available in biological systems.

Lisäksi nykyisin käytettävissä oleva lipidien polkukaaviotason esitys tietokannoissa, kuten KEGG, on rajoittunut geneeristen lipidiluokkien polku-20 kaavioesityksiin, ts. ne sisältävät pääasiassa pääryhmäinformaatiota, ja ohittavat rasvahappojen sivuketjuinformaation, ja sellaisenaan siitä puuttuu detaljita-so joka on tulossa käyttöön LC/MS -tekniikoissa. In addition, the currently available lipid pathway domain representation databases such as KEGG, is limited to the generic lipid classes of anti-20 schematic representations, ie., They contain mainly pääryhmäinformaatiota, and pass the fatty acid side chain of the information, and as such, it lacks the detail drawing, i.e., which is to be introduced by LC / MS techniques. Nykyiset tietokannat ovat todella hyvin hyödyllisiä, mitä tulee hyvin suurten huippumäärien automaattiseen identifointiin. Current databases are actually very useful when it comes to very large quantities of automatic identification is high. On siis olemassa tarve tavoille identifioida yksittäisiä molekylaari-25 siä lajeja. There is therefore a need for methods to identify individual molecular-25 SIA species. Eräs tähän liittyvä ongelma on, kuinka yksittäisiä molekylaarisia lajeja kytketään tunnettuihin metabolioihin. A related problem is how the individual molecular species is connected to known Metabolix. Esimerkiksi nykyiset polkukaaviotieto-kannat sisältävät informaatiota vain geneerisistä lipidiluokista, kuten polkukaavioista, mukaan lukien fosfokoliini. For example, the current path diagram of the data-strains contain only information on generic lipid classes, such path diagrams, including phosphocholine. Mutta alla olevista rasvahapoista ei ole informaatiota. But below the fatty acids do not have information. Tämän seurauksena fosfokoliinille voi olla satoja eri lajeja. As a result, phosphocholine may be hundreds of different species. j 30 Vielä eräs tähän liittyvä ongelma on, kuinka kehittää iipidiyhdistei- i den diversiteettiä informaatiotekniikkaa käyttämällä. j 30 Yet another related problem is how to develop iipidiyhdistei- i of the diversity by using information technology.

Keksinnön lyhyt selostus j BRIEF DESCRIPTION OF THE INVENTION j

Keksinnön tavoitteena on siten kehittää menetelmä, laitteisto ja ohjelmistotuote ainakin yhden yllä mainitun ongelman lieventämiseksi. The aim of the invention is to provide a method, apparatus and program product of one of said at least alleviate the above problem. Keksinnön 35 tavoite saavutetaan menetelmällä, laitteistolla ja ohjelmistotuotteilla, joille on i 3 tunnusomaista se, mitä sanotaan oheisissa itsenäisissä patenttivaatimuksissa. 35 is achieved by a method, apparatus and software products for which i 3 characterized by what is stated in the appended independent patent claims. Epäitsenäiset patenttivaatimukset esittävät keksinnön erityisiä suoritusmuotoja. The dependent claims show particular embodiments of the invention.

Keksinnön eräs näkökohta on menetelmä prosessoida informaatiota yhteisiä rakenneosia jakavien molekylaaristen luokkien yhdisteistä. Another aspect of the invention is a method to process the information from compounds of molecular classes sharing a common structural elements. Menetelmä 5 käsittää vaiheet: ylläpidetään polkukaavioinformaatiota yhdisteistä yksittäisen yhdisteen tasolla ja/tai geneerisen luokan tasolla; Method 5 comprising steps of: maintaining a pathway information on the compounds at a single compound and / or the generic class level; kehitetään yhdisteiden diversiteettiä perustuen joukkoon siemen-rakenteita, joista kukin kuvaa lipidiyhdisteen, jolla on keskimääräistä suurempi 10 todennäköisyys esiintyä luonnossa; diversity of the compounds developed based on a set seed structures, each describing a lipid having a higher than average probability of 10 occur in nature; käytetään formaalia kuvauskieltä ilmaisemaan siemenrakenteet; formal description language is used to indicate the seed structures; käytetään rakenne-elementtejä kehittämään odotettuja spektrejä kullekin yhdisteelle käyttämällä massaspektrometrian tunnettuja koeolosuhteita; using the structural elements to generate the expected spectra of each compound using the known experimental conditions for mass spectrometry; 15 suoritetaan yksi tai useampia spektroskopiakokeita yhdisteinformaa- tion saamiseksi; 15, carrying out one or more spectroscopy to obtain yhdisteinformaa- State; ja kytketään saatu yhdisteinformaatio olemassa olevaan informaatioon molekyyliluokista. and coupling the compound of the information obtained from the existing information on the molecular classes.

Keksinnön eräässä edustavassa sovelluksessa yhteisiä rakenne-20 osia jakavien molekylaaristen luokkien yhdisteet käsittävät lipidejä, ja jäljempänä tässä dokumentissa keksintö selostetaan lipidien yhteydessä. In one representative embodiment of the invention, the common structure 20, compounds of molecular classes sharing the components comprising a lipid, and hereinafter referred to in this document the invention is described in connection with the lipids.

Vaihe, jossa ylläpidetään polkukaavioinformaatiota lipidiyhdisteistä, on sinänsä tunnettu. The step of maintaining the pathway information lipid compounds, known per se. Polkukaavioinformaation ylläpitämiseksi on useita bio-informatiikan lähestymistapoja, ja yksityiskohtainen selostus ohitetaan. maintaining the pathway information is a series of bio-informatics approaches and a detailed explanation is omitted.

25 Keksinnön erään suoritusmuodon mukaisesti formaali kuvauskieli on SMILES, joka on akronyymi ja tarkoittaa Simplified Molecular Input Line Entry System. According to an embodiment 25 of the invention is a formal description of the SMILES language, which is the acronym means and Simplified Molecular Input Line Entry System. Tietyn lipidiluokan konstruktio voi perustua kyseisen luokan SMILES-kaavioon (template). Certain lipid construct can be based on the class SMILES chart (template). Ensin kehitetään geneerinen SMILES-kaavio, esimerkiksi käsin. First, the development diagram of a generic SMILES, for example by hand. Sitten rasvahappokeljun pituutta varioidaan ja näin luodaan 30 useita tai kaikki mahdolliset tämän luokan yhdisteet tietyssä rasvahappoketjun ; Then rasvahappokeljun length is varied, thus creating the 30 multiple, or all possible this class of compounds in a certain fatty acid chain; pituusikkunassa. the length of the window. Esimerkiksi PERL-kielen jäsennin voidaan kehittää varioimaan rasvahappoketjun pituutta. For example, the PERL language parser can be generated to vary the length of the fatty acid chain. Kun yhdisteen SMILES-esitys on kehitetty, i SMILES-esitys voidaan muuntaa kanoniseksi (=uniikiksi) SMILES-esitykseksi. When the compound of the SMILES representation has been developed, i SMILES notation can be converted to the canonical (= being unique) SMILES representation.

Eräs toinen tämän metodin kiinnostava ominaisuus liittyy sen kykyyn luoda 35 systemaattisia nimiä algoritmisesti. Another interesting feature of this method is related to its ability to create systematic names of 35 algorithmically.

4 4

Vaiheessa, jossa käytetään rakenne-elementtejä kehittämään odotettuja spektrejä kullekin yhdisteelle, on edullista käyttää yleisesti käytettyjä koeolosuhteita. In the step of using the structural elements to generate the expected spectra of each compound, it is preferable to use the commonly used experimental conditions.

Olemassa oleva informaatio lipideistä sisältää polkukaavioinformaa-5 tiota yksittäisen yhdisteen tasolla ja/tai geneerisen luokan tasolla. The existing information lipids containing polkukaavioinformaa 5-quota level of the individual compound and / or the generic class level. Vaihtoehtoisesti tai tämän lisäksi olemassa oleva informaatio lipideistä voi sisältää yhteis-sääntelyinformaatiota toisten yhdisteiden kanssa eri biologisten näytteiden kesken. Alternatively, or in addition to the existing information lipids may include a common regulatory information with other compounds among different biological samples.

Erään suoritusmuodon mukaisesti menetelmä käsittää lisäksi infor-10 maation linkittämisen yksittäisestä yhdisteestä informaatioon muilla tasoilla. According to one embodiment, the method further comprising informal information over a 10-linking of the individual compound information at other levels.

Informaatio muilla tasoilla voi sisältää informaatiota proteiineista tai geeneistä, jotka liittyvät yksittäisen yhdisteen metaboliaan tai biologiseen variaatioon. Information on other levels may include information on proteins or the genes involved in the metabolism of the individual compound or biological variation of.

Erään suoritusmuodon mukaisesti menetelmä käsittää lisäksi informaation käyttämisen yksittäisten yhdisteiden tasolla ja niiden variaation tietyn 15 organismin osan sisällä eri biologisissa näytteissä, yhdisteiden välisten riippuvuuksien löytämiseksi organismin eri osien välillä. According to one embodiment, the method further comprising using the information at the level of the individual compounds and a certain portion of 15 of the organism within the variation range of biological samples, to find the dependencies between the various components of the compounds of the organism.

Kuvioiden lyhyt selostus BRIEF DESCRIPTION OF THE DRAWINGS

Keksintöä selostetaan nyt lähemmin edullisten suoritusmuotojen yhteydessä, viitaten oheisiin piirroksiin, joista: 20 Kuvio 1 esittää keksinnön toimintaperiaatetta; The invention will now be described in greater detail in connection with preferred embodiments with reference to the accompanying drawings, in which: 20 Figure 1 shows the operating principle of the invention;

Kuvio 2 esittää tietokantakaaviota lipidien esittämistä varten; Figure 2 shows a database schema for the presentation of lipids;

Kuvio 3 esittää menetelmää glyserofosfolipidien systemaattista konstruointia varten; Figure 3 shows a method for the systematic construction of glycerophospholipids;

Kuvio 4 esittää tekniikkaa lipidiyhdisteiden rakenteiden esittämiseksi 25 SMiLES:iä käyttämällä; Figure 4 illustrates a technique for displaying lipid structures 25 SMILES using IA;

Kuvio 5 esittää SMILES-kaaviota, joka näyttää rasvahappojen sie-menmuuttujia; Figure 5 shows a SMILES diagram showing fatty acid SIE menmuuttujia;

Kuvio 6 esittää glyserofosfolipidien rakenteita; Figure 6 shows the structures of glycerophospholipids;

Kuvio 7 esittää esimerkinomaista nimikaaviota glyserofosfolipidien | Figure 7 illustrates an exemplary diagram of glycerophospholipids name | l 30 luokalle; 30 l category; { t {t

Kuvio 8 esittää tekniikkaa strukturoitujen nimien käyttämiseksi linki- j tysvaiheessa; Figure 8 illustrates a technique of using structured names of the linking-up stage j; ! !

Kuviot 9A ja 9B, jotka muodostavat yhden loogisen piirroksen esittä- S Figures 9A and 9B, which form a single logical drawing presentation S

vät algoritmisesti muodostettua SMILES:iä eräälle rasvahappoketjujen esi- j TEs are algorithmically generated SMILES GPCRs to a fatty acid chains of pre-j

35 merkkijoukolie; 35 merkkijoukolie; I I

Ϊ iff 5 Ϊ iff 5

Kuviot 10A ja 10B esittävät karakterististen MS/MS spektrien kehittämistä yksittäisille lajeille; Figures 10A and 10B show the characteristic MS / MS spectra for the development of individual species;

Kuvio 11 esittää pisteytysjärjestelmää; Figure 11 shows a scoring system;

Kuvio 12 esittää, kuinka Iipidiprofiiiien kudostenväiinen tutkimus yk-5 sittäisen molekyylijajin tasolla voi paljastaa biologisten prosessien välisiä riippuvuuksia organismien eri osastoissa; Figure 12 shows how Iipidiprofiiiien kudostenväiinen research un-5 yearly molekyylijajin level can reveal dependencies between biological processes in different compartments organisms; ja and

Kuvio 13 kokoaa yhteen keksinnön mukaisen menetelmän vaiheet. Figure 13 brings together the steps of the method according to the invention.

Keksinnön yksityiskohtainen selostus DETAILED DESCRIPTION OF THE INVENTION

Kuvio 1 esittää keksinnön toimintaperiaatetta. Figure 1 shows the operating principle of the invention. Viitenumero 100 esit-10 tää yleisesti datajärjesteimän arkkitehtuuria, jossa keksintöä voidaan käyttää. Reference numeral 100 Present-10 MPLIANCEWITH generally datajärjesteimän architecture in which the invention may be used. Lipiditietokanta 102 on tietokannan hallintalohkon 104 ja spektroskopian ohjel-mistoiohkon 106 käytettävissä prosessointilohkon 108 kautta. Lipiditietokanta 102 is a database management block 104 and translation in over-spectroscopy mistoiohkon 106 available processing block 108 through. Tässä toteutuksessa spektroskopian ohjelmistolohko 106 tukee nestekromatografiaa/massa-spektrometriaa, mutta muitakin tekniikoita voidaan käyttää. In this embodiment spectroscopy software block 106 supports the liquid chromatography / mass spectrometry, but other techniques can be used. Datajärjesteimän 15 100 ensisijainen lisäarvo tunnettuihin järjestelmiin verrattuna on kahtalainen. Datajärjesteimän 15 100 primary value in comparison with known systems is two-fold.

Tietokannan hallintalohko 104 tuottaa paremman lipidipolkukaavioiden rekonstruktion ja spektroskopian ohjelmistolohko 106 parantaa Iipidiprofiiiien tulkintaa. The database management block 104 produces better lipidipolkukaavioiden reconstruction and spectroscopic software block 106 to improve the interpretation of Iipidiprofiiiien.

Lisädetaljeja sopivan tietokannan hallintalohkon 104 muodostami-20 sesta selostetaan saman hakijan suomalaisessa patenttihakemuksessa FI20055198, nimeltään "Visuaiisointitekniikka biologista informaatiota varten”, jätetty 28.4.1995. Mainitun saman hakijan hakemuksen esittämän keksinnön eräs näkökohta on menetelmä tietojärjestelmän toiminnan ohjaamiseksi biologisen tiedon visualisoimiseksi, joka menetelmä käsittää seuraavat vaiheet: 25 1) muodostetaan käyttöliittymä ja vastaanotetaan biologiseen tie toon liittyvä kysely muodostetun käyttöliittymän kautta; 2) ylläpidetään yhteyksiä useaan tietokantaan, jotka tallentavat ainakin osaksi ei-päällekkäistä biologista tietoa; 3) määritetään mikä tietokanta useasta tietokannasta sisältää vastaanotettuun kyselyyn liittyvää biologista tietoa; 4) lähetetään määritetylle tieto-30 kannalle tietokantakysely ja vastaanotetaan tietokantakyselyn tulos, joka käsit- \ tää biologisia ja/tai kemiallisia ol Further details of the management block of a suitable database 104. Formed 20 of the described in the same applicant's Finnish patent application FI20055198, called "Visuaiisointitekniikka for biological information", filed 28.4.1995. The present invention by said same applicant of the application, one aspect is a method for controlling an information system activity to visualize the biological information, the method comprising the following the steps of: 25 1) generating a user interface and receiving a biological way related toon a request through the established interface, 2) to maintain links with several database, which stores at least part of the non-overlapping biological information; 3) determining which database a plurality of databases containing biological information related to the received query; 4 ) sending the specified information-30 strain database query and receiving a result of a database query, which comprises \ from biological and / or chemical ol ioita sekä biologisten ja/tai kemiallisten olioi- ! den väiilisiä relaatioita; ioita, biological and / or chemical olioi- the väiilisiä relations!; 5) luodaan verkko tietokantakyselyn tuloksen perusteella, missä verkon luomisvaihe käsittää biologisten ja/tai kemiallisten olioiden kuvaamisen verkon solmuihin ja relaatioiden kuvaamisen verkon yhteyksiin; 5) creating the network on the basis of the result of the database query, wherein the creating step comprises the network of biological and / or chemical entities filming nodes of the network and recording the relations network connections; 6) 35 määritetään etäisyysmatriisi etäisyyden osoittamiseksi usealle verkkosolmupa- j rille, missä kukin etäisyys lasketaan usean dimension yli; 6) 35 to indicate the distance of a distance determined by a plurality of verkkosolmupa- j General, wherein each distance is calculated over a plurality of dimensions; 7) sovelletaan di- j 6 mensionvähennysfunktiota etäisyysmatriisin kuvaamiseksi pienempään määrään dimensioita; 7) applies di- and 6 illustrate mensionvähennysfunktiota Distance Matrix smaller number of dimensions; 8) etsitään valitun verkkosolmun naapureita etäisyysmatriisin perusteella valitun verkkosolmun biologisen roolin selventämiseksi; 8) from the selected network node neighbors in order to clarify the biological role of Distance Matrix based on the selected network node; 9) säädetään dimensionvähennysfunktiota biologisen ja/tai kemiallisen tiedon yhden tai 5 useamman tutkimuskontekstin perusteella, tutkimuksen kohdistamiseksi relevanttia polttopistettä kohti; 9) provides for the dimensional reduction of the function on the basis of a biological and / or chemical information of one or more of the five complementary domains, a study for applying a relevant focal points; ja 10) luodaan uudelleen ja visualisoidaan verkko säädetyn dimensionvähennysfunktion perusteella. and 10) and re-created on the basis of dimensionvähennysfunktion provided visualized network.

Menetelmä voi lisäksi käsittää, että kukin yhdestä tai useammasta tutkimuskontekstista kuvataan verkkosolmuun. The method may further comprise the each of the one or more complementary domains described network node. Kuvausvaihe voi käsittää kulo vaamisen useasta dimensiosta kahteen dimensioon. Description step may comprise a plurality of wildfire-drying the dimension of the two dimensions. Etäisyysfunktio voi perustua verkkotopologiaan ja/tai kokeellisesta datasta johtuviin relaatioihin. Distance function can be based on network topology and / or experimental data arising out of relations. Tällaisiin kokeellisesta datasta johtuviin relaatioihin voi kuulua korrelaation mitta. Such resulting from the experimental data of relations may include a measure of correlation.

Usädetaljeja sopivan spektroskopian ohjelmistolohkon 106 muodostamisesta selostetaan saman hakijan suomalaisissa patenttihakemuksissa 15 FI20055252, FI20055253 ja FI20055254, kaikki nimeltään ''Anaiyysitekniikoita nestekromatografiaa/massaspektrometriaa varten”, ja ne on jätetty 26.5.2005. Usädetaljeja suitable spectroscopic software block 106 discloses the formation of the same applicant's Finnish Patent Applications 15 FI20055252, FI20055253 and FI20055254, all known as '' Anaiyysitekniikoita liquid chromatography / mass spectrometry to, "and filed 26.5.2005.

Mainitun saman hakijan hakemuksen F120055252 esittämän keksinnön eräs näkökohta on menetelmä nestekromatografia/massaspektrometriadatan [="LC/MS-datan"] analysointia varten, jossa menetelmässä: 20 1) valmistetaan useita näyteajoja; invention of the same applicant of the application F120055252 one aspect is a method of liquid chromatography / mass spectrometry [= "LC / MS data"] for the analysis, which comprises: 20 1) preparing a plurality of sample runs; 2) prosessoidaan kukin valmistet tu näyteajo LC/MS-spektrometrissä spektrin saamiseksi kunkin prosessoidun näyteajon osalta; 2) processing the sample runs in each of the preparations TU LC / MS spectrometer to obtain a spectrum of each of the processed sample run; 3) sisäisesti esitetään kukin spektri massa/varaussuhteen j sijoituksena retentioaikaan nähden; 3) internally representing the spectrum of each mass / charge ratio j investment with respect to retention time; 4) suoritetaan ensimmäinen huipunilmaisu kunkin spektrin huippujen ilmaisemiseksi; 4) performing a first detection for detecting the peak of each spectrum; 5) muodostetaan kohdistettujen f 25 spektrien joukko sisäisesti kohdistamalla kunkin spektrin ilmaistut huiput; 5) forming an aligned set of spectra f 25 internally by applying each of the spectral peaks expressed; ja 6) j suoritetaan toinen huipunilmaisu ensimmäisessä huipunilmaisussa ilmaisemattomien huippujen ilmaisemiseksi, missä toinen huipunilmaisu käsittää tietämyksen käyttämisen kohdistettujen spektrien joukon muista spektreistä. and 6) j, a second peak detecting the first peak detection to detect peaks INDICATIVE, wherein the second peak detection involves the use of targeted knowledge of the spectra of the plurality of spectra. | |

Mainitun saman hakijan hakemuksen FI20055253 esittämän keksin- j 30 nön eräs näkökohta on menetelmä LC/MS-datan analysoimiseksi, jossa menetelmässä: 1) valmistetaan useita näyteajoja; Such application of the same applicant FI20055253 invention, one aspect of the j 30 NON is a method by LC / MS to analyze the data, the method comprising: 1) preparing a plurality of sample runs; 2) prosessoidaan kukin valmistettu näyteajo LC/MS-spektrometrissä spektrin saamiseksi kunkin prosessoidun näyteajon osalta; 2) processing each of the prepared sample runs LC / MS spectrometer to provide a spectrum of each of the processed sample run; 3) sisäisesti esitetään kukin spektri massa/varaussuhteen sijoituksena retentioaikaan nähden; 3) internally representing the spectrum of each mass / charge ratio of an investment with respect to retention time; 4) suoritetaan ensimmäinen huipunilmaisu 35 kunkin spektrin huippujen ilmaisemiseksi; 4) of the first peak detection 35 for detecting the peaks of each spectrum; 5) visualisoidaan kunkin spektrin hui-put, missä visuaiisointivaihe käsittää 5a) kuvataan kukin visualisoitava huippu 7 koordinaatistoon, jossa ensimmäinen koordinaatti osoittaa massa/varaussuh-detta ja toinen koordinaatti osoittaa retentioaikaa; 5) visualization of each spectrum Hui-put, which comprises visuaiisointivaihe 5a) described in each coordinate visualized peak 7, wherein a first coordinate indicates mass / varaussuh-ratio and the other coordinate indicates the retention time; ja 5b) osoitetaan spesifinen visuaalinen attribuutti kullekin visualisoitavalle huipulle. and 5b) is assigned to a specific visual attribute is visualized for each of the top.

Mainitun saman hakijan hakemuksen FI20055254 esittämän kek-5 sinnön eräs näkökohta on menetelmä LC/MS-datan analysoimiseksi, jossa menetelmässä: 1) valmistetaan useita näyteajoja; One aspect of the application of the same applicant FI20055254 KEK-5 sinnön a method for analysis of LC / MS data, the method comprising: 1) preparing a plurality of sample runs; 2) prosessoidaan kukin valmistettu näyteajo IC/MS-spektrometrissä spektrin saamiseksi kunkin prosessoidun näyteajon osalta; 2) processing each of the prepared sample runs IC / MS spectrometer to provide a spectrum of each of the processed sample run; 3) sisäisesti esitetään kukin spektri massa/varaus-suhteen sijoituksena retentioaikaan nähden; 3) internally representing the spectrum of each mass / charge ratio of an investment with respect to retention time; 4) suoritetaan ensimmäinen hui-10 punilmaisu kunkin spektrin huippujen ilmaisemiseksi; 4) performing a first-Hui 10 punilmaisu for detecting peaks of each spectrum; ja 5) etsitään analysoitavaa huippua lähin standardiyhdisteen huippu ja normalisoidaan analysoitava huippu perustuen etäisyysmittaan analysoitavan huipun ja mainitun lähimmän standardiyhdisteen huipun välillä. and 5) finding the nearest peak of the analyte standard peak and the compound to be analyzed is normalized peak time based on the distance the analyte peak and the nearest top of the standard compound.

LC/MS -datan analysointitekniikoita voidaan edelleen tehostaa lisä-15 piirteiden avulla. LC / MS -datan analysis techniques may be further enhanced by additional features of 15. Esimerkiksi toinen huipunilmaisu voi käsittää paikallisten maksimien ilmaisun ja/tai rekursiivisen kynnysilmaisun. For example, the second peak detection may comprise the detection of local maxima and / or recursive threshold detection. Menetelmä voi lisäksi käsittää spektrien normalisoimisen, esimerkiksi yhden tai useamman standardiyhdisteen injektoimisen ennalta määrätyssä konsentraatiossa kuhunkin näy-teajoon ennen prosessointivaihetta standardiyhdisteiden huippujen joukon 20 saamiseksi kutakin injektoitua standardiyhdistettä kohti. The method may further comprise the normalization of the spectra, for example, one or more of the standard compound in a predetermined concentration of each of the injection-teajoon displayed before the processing phase of the standard set of 20 compounds of the peaks of each injected to obtain a standard substance. Menetelmä voi lisäksi käsittää analysoitavaa huippua lähimmän standardiyhdisteen huipun etsimisen ja analysoitavan huipun normalisoimisen perustuen etäisyysmittaan analysoitavan huipun ja mainitun lähimmän standardiyhdisteen huipun välillä. The method may further comprise the analyte peaks of a compound of the nearest standard to detect and analyze the peak of the peak based on the normalization of the distance over the analyte peak and the nearest top of the standard compound. Kohdis-tusvaihe voi käsittää seuraavat vaiheet: luodaan huippuiista kunkin spektrin 25 osalta, luodaan huippujen päälista ja kunkin huippulistan kutakin huippua kohti löydetään huippujen päälistan vastaava huippu ennalta määrättyä etäisyysmit-taa käyttämällä. Not allocated-step may comprise the steps of: creating a huippuiista each spectrum 25 regards the main list and creating a peak list for each peak for each peak found in the main list corresponding to the peak top predetermined etäisyysmit-TAA using. Etäisyysmitta voi perustua suureiden \m/zp - m/zm\\a\rtp -rtm I painotettuun yhdistelmään, missä m/zp ja rtp ovat vastaavasti yksittäisen huippulistan huipun massa-varaussuhde ja retentioaika, ja m/z,„ ja rtm ovat vas-30 taavasti keskimääräinen massa-varaussuhde ja retentioaika kaikille huipuille eri huippuiistoista, jotka on ositettu huippujen päälistan samalle riville. Distance measurement may be based variables \ m / z p - m / z m \\ a \ RTP -rtm I, a weighted combination, where m / z p and RTP are respectively a single peak list of the peak of mass-to-charge ratio and the retention time and m / z, 'and RTM are left -30 respectively the average mass-to-charge ratio and the retention time of the peaks of all the different huippuiistoista, which is partitioned into the main list of peaks on the same line. Menetelmä voi lisäksi käsittää kunkin spektrin huippujen visualisoimisen, missä visual isointivaihe käsittää: kuvataan kukin visualisoitava huippu koordinaatistoon, jossa ensimmäinen koordinaatti osoittaa massa-varaussuhteen ja toinen 35 koordinaatti osoittaa retentioajan; The method may further comprise the peaks of each spectrum of visualization, where the visual isointivaihe comprises: mapping each visualized peak coordinate system, wherein a first coordinate indicates mass-to-charge ratio of 35, and the second coordinate indicates the retention time; ja osoitetaan kullekin visualisoitavalle huipulle spesifinen visuaalinen attribuutti. and assigned to each of the top visualized for the specific visual attribute. Visualisointimenetelmä voi lisäksi käsittää 8 huippujen visualisoimisen näytteiden ensimmäisestä ryhmästä ja toisesta ryhmästä, ja spesifinen visuaalinen attribuutti perustuu keskimääräisten intensiteettien suhteeseen vastaavien huippujen välillä ensimmäisessä ryhmässä ja toisessa ryhmässä. The visualization method may further comprise a first group of eight peaks of visualization of the samples and the second group, and specific visual attribute based on the average ratio of the intensities of the respective peaks of the first group and the second group. Vielä edelleen, visualisointimenetelmä voi käsittää huippu-5 jen visualisoimisen näytteiden ryhmästä ja spesifinen visuaalinen attribuutti perustuu huippuintensiteettien variaatioon näytteiden ryhmän sisällä. Still further, the method may comprise visualization from the group consisting of the top 5 of visualization of the samples and the specific visual attribute based on the variation of the peak intensities of the samples within the group.

Kuvio 2 esittää havainnollistavaa tietokantakaaviota lipidien esittämistä varten. Figure 2 shows a diagram of an illustrative database for presentation of lipids. Tässä havainnollistavassa mutta ei-rajoittavassa suoritusmuodossa lipididata tallennetaan natiivi-XML -tietokantaan, jonka toteutus on 10 Tamino XML Server. In this illustrative but non-limiting embodiment, the lipididata stored in a native XML database, the implementation of which is 10 Tamino XML Server. Kunkin yhdisteen merkintä tietokannassa sisältää informaatiota sisäisestä tunnisteesta, pisteytys!nformaatiota, luokan, kanonisen SMILES:in, molykyyfikaavan, moiekyylipainon ja isotooppisen jakauman. marking each compound database containing information about the internal identifier, scoring nformaatiota, the class, the canonical SMILES! in, molykyyfikaavan, moiekyylipainon and isotopic distribution. PERL-skriptejä voidaan käyttää muuntamaan dataa XML-dokumenteiksä. PERL scripts can be used to convert the data to XML dokumenteiksä. Syntyvät XML-dokumentit ladataan Tamino-tietokannan massaiataustyökalua. The generated XML documents are loaded massaiataustyökalua Tamino database. 15 Loogisten ja fyysisten kaavioiden konstruktiota ja välidointia varten voidaan käyttää vastaavasti ohjelmistoja XMLSPY ja Tamino Schema Editor Software. 15 the logical and physical diagrams for the construction and validation can be employed in the software XMLSpy and Tamino Schema Editor software. Tamino XML Server ja Tamino Schema Editor Software ovat saatavissa Software AG:itä Saksassa ja XMLSPY-ohjelmisto Aitova lnc:iltä. Tamino XML Server and Tamino Schema Editor Software are available from Software AG in Germany and in the east XMLSpy software Aitova Inc. from.

Lipidit ovat moninainen ryhmä molekyylilajeja, jotka laajasti määritel-20 iään hydrofobisiksi tai amfipaattisiksi pieniksi molekyyleiksi, jotka voivat syntyä kokonaan tai osaksi tioesterien karbanionipohjaisessa kondensaatiossa ja/tai isopreeniyksiköiden hiiiikationiperusteisessa kondensaatiossa. Lipids are a diverse group of molecular species that are broadly defined to 20 iaan hydrophobic or amphipathic small molecules that may occur in whole or in part in the condensation karbanionipohjaisessa thioesters and / or isoprene hiiiikationiperusteisessa condensation. Tässä erityisten suoritusmuotojen selostuksessa painopiste on ensisijaisesti informatiikan metodien muodostamisessa glyserofosfoiipidien, sfingolipidien, glyserolipidien ja 25 steroliesterien tutkimusta varten. This description of specific embodiments of the focus is primarily informatics research methods for forming glyserofosfoiipidien, sphingolipids, sterol esters of glycerolipids and 25.

Pääasiallinen rakenteellinen variantti yllä mainittujen luokkien välillä on vaihtelu lipidimolekyylin muodostavan yhden tai useamman rasvahappoket-jun sisällä. The main structural variant of the above mentioned categories in the range of lipid molecule forming one or more rasvahappoket-jun inside. Esimerkiksi glyserofosfolipidit voidaan esittää muutamalla pääryhmällä, kuten koliini tai etanolamiini, kun taas funktionaalisiin ryhmiin liittyvät 30 modifikaatiot ja mahdollisten rasvahappoyhdistelmien diversiteetti on paljon suurempi. For example, the glycerophospholipids can be represented by a few main categories, such as choline or ethanolamine, while the functional groups of 30 possible modifications and combinations of fatty acid diversity is much greater.

Eräs edullinen lähestymistapa moninaisen lipidijoukon kehittämiseksi, identifioinnin helpottamiseksi lipidomiikkakokeista, on kehittää joukko "siemen” -rasvahappoja, jotka todennäköisimmin esiintyvät elävissä järjestel-35 missä. Tässä selostettu siemenrasvahappojen valinta heijastaa painottumista nisäkkäiden soluihin, mutta keksinnön mukainen tekniikka on joustava muiden 9 rasvahappojen ja funktionaalisten ryhmien sisällyttämiselle. Rasvahappo-siemenet ilmaistaan SMILES-termistöllä (Simplified Molecular Input Line Entry System), joka on ihmisen luettavissa oleva atomien ja sidosten lineaarinen in-deksointijärjestelmä, jota säätelee täsmälliset syntaksisäännöt. Vaikka yleisesti 5 ottaen mille tahansa yhdisteelle voi olla useita SMILES-esityksiä, on käytettävissä kanonisia versioita, jotka mahdollistavat uniikit SMILES-esitykset. Tässä selostetut suoritusmuodot voidaan toteuttaa Daylight canonical SMILES -esityksellä (Daylight, Chemical information A preferred approach for the development of diverse lipidijoukon, in order to facilitate the identification of lipidomiikkakokeista, is to develop a set of "seed" fatty acids, which are most likely to occur in living reshuffled 35 in. This described seed fatty acids selection reflects a bias towards the mammalian cells, but the technique of the invention is a flexible other 9 fatty acids and functional groups incorporation. the fatty acid seed detecting (Simplified Molecular Input Line Entry System) SMILES terminology, which has the atoms and bonds in a linear in-deksointijärjestelmä, which controls the precise syntax rules in human readable. Although, generally 5, having any of the compound may have a plurality of SMILES representations, is available canonical versions that allow unique SMILES representations. In described embodiments may be implemented Daylight canonical SMILES presentation (Daylight Chemical information system, Inc.). SMILES-esityksiä on konstruoitu algoritmisesti kaikille näille siemen-rasvahappoketjuille, ja ne näy-10 tetään kuvioissa 9A ja 9B. System, Inc.). SMILES representations are constructed algorithmically all of these seed fatty acid chains, and they appear in a 10-VED Figures 9A and 9B. Lipiditietokannan konstruoinnissa käytetään LIPID MAPS -konsortion hyväksymiä systemaattisia nimiä. Lipiditietokannan used in the construction of the LIPID MAPS consortium approved by the systematic names.

Tietokannan kullekin yhdisteelle voidaan osoittaa pistelaskuarvo perustuen niiden rasvahappojen luonnolliseen runsauteen, joista kyseinen yhdiste on muodostettu. The database for each compound can be demonstrated by dot count value based on the natural abundance of the fatty acids, of which the compound is formed. Yleisiä huomioon otettavia tekijöitä pisteytystä osoitettaes-15 sa ovat rasvahapon luonnollinen runsaus sekä rasvahappoketjussa olevien hiiliatomien parillinen tai pariton määrä. Common factors to be considered in the scoring osoitettaes-15 SA are the natural abundance of fatty acids and an even or odd number of the fatty acid chain of carbon atoms. Lisäksi rasvahappojen erilaiset sidokset lipidien pääryhmään saavat eri pisteytykset. In addition, different bonds of fatty acids of lipids main groups receive different scores. Pisteytysjärjestelmä näytetään kuviossa 11. Kokonaispisteytys on sitten kaikkien rasvahappopisteiden tulo. The scoring system is shown in Figure 11. The total score is then all the entry points of the fatty acid.

Tietyn lipidiluokan konstruointi perustuu luokan SMILES-kaavioon. The construction is based on a particular lipid class SMILES chart.

20 Kun geneerinen SMILES-kaavio on manuaalisesti, PERL-jäsentimiä voidaan kehittää varioimaan rasvahappoketjun pituutta luokan kaikkien mahdollisten yhdisteiden luomiseksi valitun rasvahappoketjupituuden annetussa ikkunassa. 20 In the generic SMILES is a diagram manually, PERL parsers can be developed to vary the chain length of the fatty acid class to create a window for all possible compounds selected fatty acid chain length on.

Kun yhdisteen SMILES on kehitetty, SMILES voidaan muuntaa kanoniseksi (uniikiksi) SMILES-esitykseksi. When the compound of SMILES is developed, the SMILES notation can be converted to the canonical (being unique) SMILES representation. Tämän metodin eräs toinen kiinnostava omi- j This method is another interesting characteristic j

25 naisuus liittyy sen helppouteen luoda systemaattisia nimiä algoritmisesti. 25 uNit associated with its ease of use to create systematic names algorithmically. I I

Daylightin SMILES tool kit -ohjelmistoa voidaan käyttää kehittämään kanonisia j SMILES-esityksiä. Daylight SMILES tool kit software can be used to develop a canonical SMILES j presentations. Daylight toolkit on räätälöity yhdisteiden molekyylipainon ja j tarkkojen massojen saamiseksi. Daylight toolkit is tailored to obtain accurate mass molecular weight compounds and j. Elementtien tarkat massat otetaan standardi-kirjallisuudesta. the exact masses of the elements into the standard literature. Eräs menetelmä glyserofosfolipidien systemaattista konstru-30 ointia varten tiivistetään kuviossa 3. One method for the systematic glycerophospholipids konstru-30 elution from the seal in Figure 3.

Kuvio 11 esittää erästä pisteytysjärjestelmää. Figure 11 shows a scoring system. Tietokannan kullekin yhdisteelle osoitetaan pistelaskuarvo perustuen niiden rasvahappojen luonnolliseen runsauteen, joista kyseinen yhdiste on muodostettu. The database for each compound indicated by dot count value based on the natural abundance of the fatty acids, of which the compound is formed. Yleisiä huomioon otettavia tekijöitä pisteytystä osoitettaessa ovat rasvahapon luonnollinen run-35 saus sekä rasvahappoketjussa olevien hiiliatomien parillinen tai pariton määrä. General factors to be considered in the scoring of the allocation are natural fatty acid run-35 review, along with an even or odd number of the fatty acid chain of carbon atoms.

Lisäksi rasvahappojen erilaiset sidokset lipidien pääryhmään saavat eri pistey- 10 tykset. In addition, different bonds of fatty acids of lipids main categories received from different scoring on 10 MICRO- ENTERPRISES. Kokonaispisteytys on sitten kaikkien rasvahappopisteiden tulo. An overall score is then all the fatty acid entry points. Satunnainen pisteytys S mille tahansa lipidiyhdisteelle, Jolla on rasvahappoketjuja, joiden pisteytysmuuttujat ovat Vj (positiossa Sn1), Vj (positiossa Sn2) ja Vk (positiossa Sn3). Random S scoring any lipid compound having a fatty acid chains, which are scoring variables Vj (Sn1 position), Vj (Sn2 position) and V k (position Sn3). Yhdisteille, joilla on yksi rasvahappoketju positiossa Sn1 tai 5 Sn2: S = V, tai Vj For compounds having one fatty acid chain at position Sn1 or Sn2 5: S = V or Vi

Yhdisteille, joilla on kaksi rasvahappoketjua positioissa Sn1 ja Sn2: = VjXVj For compounds with two fatty acid chains at positions Sn1 and Sn2: = VjXVj

Yhdisteille, joilla on kolme rasvahappoketjua positioissa Sn1, Sn2 ja Sn3: 10 = V x Vj x Vk For compounds having three fatty acid chains at positions Sn1, Sn2 and Sn3: 10 Vj = V x x Cs

Kuvio 3 esittää menetelmää glyserofosfolipidien systemaattista konstruointia varten. Figure 3 shows a method for the systematic construction of glycerophospholipids. Vaiheessa 3-1 muodostetaan yleinen SMILES-kaavio, jonka rakenne sopii glyserofosfolipidien luokkaan. In step 3-1 the square formed by the SMILES diagram, the structure of which is suitable class of glycerophospholipids. SMILES-kaavio, joka näyttää rasvahappojen siemenmuuttujia positioille Sn1 ja Sn2 sekä pääryhmän 15 muuttujalle (jota edustaa symboli X) positiossa Sn3 (SMILES:in syntaksisään-töjen mukaan rasvahappojen siemenmuuttujat kirjoitetaan sulkuihin, esittäen ne haaroittuvina ketjuina), näytetään kuviossa 5. Joukko sopivia rakenteita näytetään kuviossa 6. SMILES diagram showing fatty acid seed variables positions in Sn1 and Sn2, and the main group 15 of the variable (represented by the symbol X) in position Sn3 (SMILES in syntaksisään-rules of the fatty acid seed variables are written in brackets showing the construction of branch chains), are shown in Figure 5. A number of suitable structures shown in Figure 6.

Vaiheessa 3-2 käytetään vastaavia systemaattisia nimiä kutakin 20 rasvahappo-siemen-SMILES:iä kohti geneerisen nimikaavion konstruoimiseksi, nimien algoritmista kehittämistä varten. In step 3-2 the respective systematic names are used for each 20-seed fatty acid-SMILES a generic name of Scheme IA to construct an algorithm for the development of names. Eräs esimerkinomainen nimikaavio glyserofosfolipidien luokalle näytetään kuviossa 7. Eräs esimerkinomainen ni-mitaulukko systemaattisten nimien noutamista varten näytetään kuvioissa 9A ja 9B. An exemplary diagram of glycerophospholipids name of the class shown in Figure 7. An exemplary ni mitaulukko for retrieving systematic names are shown in Figures 9A and 9B.

25 Vaiheessa 3-3 käytetään PERL-skriptiä, joka kehittää yhdisteiden 25 Step 3-3 is used PERL script which generates the compounds

kaikki mahdolliset SMILES:it sekä niiden systemaattiset nimet. all possible SMILES: IT, as well as their systematic names. Vaiheessa 3-4 muunnetaan SMILES:it kanonisiksi SMILES:eiksi (esim. daylight SMILES toolkit -ohjelmistoa käyttämällä). At step 3-4 is converted into SMILES it canonical SMILES into GOVs (e.g., daylight, using the SMILES software toolkit.). Vaihe 3-5 käsittää molekyylikaavan saamisen SMILES:istä ja molekyylipainon laskemisen saadulle molekyylikaavaile. Step 3-5 comprises obtaining a molecular formula SMILES for the calculation of molecular and molecular weight of the obtained envisaged. Vai-30 heessa 3-6 lasketaan satunnainen pisteytys yhdisteen runsauden iimentämi- I Val-30 step 3-6 is calculated random scoring the abundance of the compound I iimentämi-

seksi. sex. Vaiheessa 3-7 saadaan isotooppien jakauma kyseisen yhdisteen mole- I In step 3-7 a distribution of isotopes in the molecule of the compound I.

kyylikaavasta. kyylikaavasta. Vaiheessa 3-8 isotooppijakauma räätälöidään käytettävän massaspektrometrin resoluutioon. At step 3-8 will be tailored to the mass spectrometer used for isotopic resolution.

Spektriesitystä voidaan käyttää yhdessä LC/MS-perusteisen seuion-35 nan kanssa. Spektriesitystä may be used in combination with the LC / MS-based seuion nan-35. Lipidien identifioinnin helpottamiseksi massaspektrometriadatan In order to facilitate the identification of lipid mass spectrometry

perusteella tietokannan kullekin yhdisteelle voidaan laskea isotooppijakauma. on the basis of a database for each compound can be calculated isotopic distribution. I I

! ! l 11 Tämä isotooppijakauma voi perustua kemiallisen kaavan kunkin elementin havaittuun luonnolliseen runsauteen. This isotopic l 11 may be based on the chemical formula of each element of the observed natural abundance. Tietyn kemiallisen koostumuksen isotooppien massat ja runsaudet ennustetaan käyttämällä sopivaa ohjelmistoa, josta esimerkkinä on avoimen lähdekoodin Isotope Pattern Calculator. Certain isotopes of the chemical composition of masses and abundances of prediction using the appropriate software, an example of which is an open-source Isotope Pattern Calculator. Tämä teo-5 reettisesti kehitetty jakauma on hyvin hyödyllinen vertaillessa isotooppikaavioi-ta massaspektrometriadatasta. This theo-5 tangibly developed distribution is very useful in comparing isotooppikaavioi to-mass spectrometry. Mutta massaspektrometrista saadut jakaumat riippuvat sen resoluutiosta. But the distributions received will depend on the mass spectrometric resolution. PERL-skriptiä voidaan käyttää muuntamaan laskettu jakauma halutuiksi jakaumiksi resoluution mukaisesti. PERL script can be used to modify the distribution of distributions calculated in accordance with the desired resolution. Jakaumat voidaan esittää graafisesti. The distributions can be represented graphically.

10 Seuraava selostus liittyy lipidiyhdisteiden diversiteetin kehittämi seen. 10 The following description relates to the development of the lipid diversity. Se, että nämä rasvahappoketjut pysyvät useimpien iipidirakenteiden osana, tekee mahdolliseksi konstruoida lipidifuokkia algoritmisesti. The fact that these fatty acid chains remain part of most iipidirakenteiden, makes it possible to construct a lipidifuokkia algorithmically. Erot rasva-asyyli/alkyyliketjujen pituuksissa ja kyllästämättömyyden asteissa luovat suuren diversiteetin jo tiettyyn luokkaan. The differences in the fatty-acyl / alkyl chain lengths and degrees of kyllästämättömyyden create a great diversity in a particular category. Lipiditietokanta voi sisältää pääluokkia, 15 kuten rasva-asyylit, glyserolipidit, glyserofosfolipidit, sfingolipidit ja sterolit. Lipiditietokanta may contain sections, such as 15 fatty acyls, glycerolipids, glycerophospholipids, sphingolipids and sterols. Rasva-asyylien luokkaan sisältyvät rasva-alkoholit, rasva-aldehydit, rasva-karboksyylihapot, rasva-asyyli-CoAs/ACP:t ja eikosanoidit. included in the category of fatty acyl moieties of fatty alcohols, fatty aldehydes, fatty carboxylic acids, fatty acyl-COAS / ACPs and eicosanoids. Glyseroiipidien luokka on melkoisen valtava luokka tässä tietokannassa ja sisältää alaluokkia, kuten monoasyyli/alkyyligiyserolit, diasyyli/alkyyliglyserolit ja triasyyliglyserolit. Glyseroiipidien class is quite huge class of this database and includes the subclasses such as monoasyyli / alkyyligiyserolit, diacyl / alkyyliglyserolit and triacylglycerols. 20 Rasva-a syy li/al kyy li ketjujen permutaatioiden määrä glyserolin kolmessa positiossa, nimittäin sn-1, sn-2 ja sn-3, tekee tästä yhdlsteluokasta eräittäin valtavan. 20 Fatty September a Li / Li Al adder chains, the number of permutations of glycerol three position, namely the sn-1, sn-2 and sn-3, makes this yhdlsteluokasta eräittäin huge. Glyserofosfolipidit ovat toinen tärkeä luokka, joka sisältää glyseroli-fosfokoliinit, glyserofosfoetanolamiinit, glyserofosfoseriinit, glyserofosfaatit, glyseropyrofosfaatit ja glyserofosfoglyserolit. Glycerophospholipids are another important class that includes the glycerol-phosphocholine, glyserofosfoetanolamiinit, glyserofosfoseriinit, glycerophosphate, glyseropyrofosfaatit and glyserofosfoglyserolit. Nämä yhdisteet sisältävät sekä 25 mono- että diasyyii/alkyyliglyseroifosfolipidejä. These compounds include both mono- and diasyyii 25 / alkyyliglyseroifosfolipidejä. Plasmologeenit ovat erityinen fosfolipidien luokka, missä glyserolin rasvahappoketju sisältää 0-alkenyylieetterin (-O-ChNCH-) sidoksia. Plasmologeenit are a special class of phospholipids where the glycerol fatty acid chain contains from 0-alkenyl ethers (-O-ChNCH-) bonds. Erään suoritusmuodon mukaisesti plasmologeenien alaluokan koko on 181548. Sfingolipidien luokka sisältää sfingoidikannat, erilaisia keramideja mukaan lukien keramidifosforinositolit, 30 keramldifosfokoliinit, keramidifosfoetanolamiinit, N-asyylisfingosiinit, N-asyyli-sfinganinit, keramidi-1-fosfaatit ja sulfatiidit. According to one embodiment of the plasmologeenien subclass size of 181548. sphingolipid class includes sfingoidikannat, various types of ceramides including keramidifosforinositolit, 30 keramldifosfokoliinit, keramidifosfoetanolamiinit, N-asyylisfingosiinit, N-acyl-sfinganinit, ceramide-1-phosphate and sulfatiidit. Steroleissa esiintyy koleste-ryyliesterien tyyppisiä yhdisteitä. Of sterols present in the compounds types of cholest-ryyliesterien.

Lipiditietokanta sisältää pääasiassa kaikki mahdolliset lipidit, joiden rasvahappojen pituuksia (tai pääryhmiä mikäli niitä esiintyy luokassa) voidaan 35 varioida algoritmisesti. Lipiditietokanta contains substantially all of the possible lipids, fatty acids with a length (or head groups if present in class) 35 can be varied by algorithmically. Eräs SMILES-metodin rajoitus on sen vaikeus kehittää SMILES-rakenteita algoritmisesti kompleksisemmille lipideille. A method as SMILES limitation is the difficulty in developing structures in SMILES algorithm by the complex lipids. Esimerkiksi 12 kompleksiset lipidit, kuten giykosfingolipidit, joiden SMILES-rakenteita on vaikea kehittää algoritmisesti, voidaan konstruoida manuaalisesti. For example, the 12 complex lipids such as giykosfingolipidit with the SMILES structures are difficult to develop algorithmically can be constructed manually. Eräs toinen tämän tietokannan rajoitus on redundanttisuus. Another limitation of this database is redundancy. Saman koostumuksen omaa-via lipidejä on vaikea erottaa. The same composition of its own, via lipids are difficult to distinguish. Redundanssiongelmaa voidaan käsitellä osittain 5 pisteytysarvojen perusteella, koska pisteytys lajittelee redundantit lipidit niiden perustuen niiden estimoituun frekvenssiin luonnossa. Redundanssiongelmaa may be treated in part on the basis of five values, scoring, scoring sorting redundant because of the lipids based on the estimated frequency in nature. Yleisemmät lipidit saavat matalampia pisteitä ja päin vastoin. More common lipids will receive lower scores, and vice versa. Pisteytysarvoja on edullista säätää eri organismeille. Scoring values ​​is advantageous to provide different organisms. Fragmentointi- ja kromatografiakirjastoja tarvitaan redundanssi-näkökohtien käsittelemiseksi. Fragmentation and kromatografiakirjastoja required to deal with redundancy considerations. Yksittäisiä molekyylilajeja vastaavien molekyyli-10 ioninen fragmentit, jotka sopivimmin tuotetaan erilaisissa ionisaatio-oiosuhteissa, yhdessä retentioaikainformaation kanssa toistettavasta analyyttisestä metodista, tuottaa yksittäisen molekyylilajin uniikin tunnusmerkin. The individual molecular species of the corresponding 10-ionic molecular fragments, which are preferably produced in a variety of ionization oiosuhteissa, together with the currently played retentioaikainformaation analytical methodical, producing a unique characteristic of the individual molecular species.

Kuvio 4 esittää tekniikkaa lipidiyhdisteiden rakenteiden esittämiseksi SMILES:iä käyttämällä. Figure 4 illustrates a technique for displaying lipid structures in SMILES using iA. Viitenumero 400 esittää yleisesti fosfokoliinin (PC) ra-15 kennetta. Reference numeral 400 generally illustrates phosphocholine (PC) m-15 structure. Fosfokoliinin rakenteessa 400 on rasvahappoja positioissa sn-1 ja sn-2, glyseroli runko ja koliini positiossa sn-3. phosphocholine pattern 400 are fatty acids at positions sn-1 and sn-2, and choline, glycerol backbone at position sn-3. Useiden lipidien tavoin fosfokoliini on molekyylien luokka, jossa positioissa sn-1 ja sn-2 olevia rasvahappoja voidaan varioida eri fosfokoliiniyhdisteiden kehittämiseksi. Like several phosphocholine lipids is a class of molecules in which the positions sn-1 and sn-2 fatty acids can be varied in the development of various fosfokoliiniyhdisteiden. Siemenrasvahappoja käytetään, mukaan lukien yleisiä rasvahappoja, kuten palmitiini- tai öljyhappoja 20 jne., vähemmän tavallisia, kuten parittoman ketjun rasvahappoja, hydroksyloi-tuja rasvahappoja, peroksideja jne. Seed fatty acids are used, including general, fatty acids such as palmitic or oleic acids, 20 etc., less common, such as odd-chain fatty acids, Tuja-hydroxylating fatty acids, peroxides, etc.

Kuvio 5 esittää SMILES-kaaviota, joka näyttää rasvahappojen sie-menmuuttujia positioille sn-1 ja sn-2 sekä pääryhmän muuttujan (jota esittää symboli X) positiolle sn-3. Figure 5 shows a SMILES diagram showing fatty acid sie menmuuttujia-positions in the sn-1 and sn-2 and the main group of the variable (represented by the symbol X) in position sn-3. SMILESiin syntaksisääntöjen mukaisesti rasva-25 happojen siemen muuttujat kirjoitetaan sulkeisiin, esittäen ne haaroittuvina ketjuina. Smile structures in accordance with the syntax rules of fatty acids at 25 seed variables are written in parentheses, showing they are branched chains.

Kuvio 6 esittää glyserofosfolipidien rakenteita, joilla on pääryhmät, kuten fosfokoliini (PC), fosfoetanolamiini (PE), fosfoseriini (PS), fosfoglyseroli (PG), fosfoinositoli (Pl), fosfaatti (PA) and pyrofosfaatti (PPA). Figure 6 shows the structures of glycerophospholipids, which is a main group such as phosphocholine (PC), fosfoetanolamiini (PE), phosphoserine (PS), phosphoglycerol (PG), phosphoinositol (PI), phosphate (PA) and the pyrophosphate (PPA).

30 Kuvio 7 esittää esimerkinomaista nimikaaviota glyserofosfolipidien luokalle. 30 Figure 7 shows an exemplary diagram of glycerophospholipids name of the class.

Kuvio 8 esittää tekniikkaa strukturoitujen nimien käyttämiseksi iinki-tysvaiheessa. Figure 8 illustrates a technique of using structured names iinki-up stage. Yleisesti ottaen, funktionaalinen pääryhmä määrittelee lipidi- j luokan. Generally speaking, the functional head group defines the lipid class. Muunnos eri luokkien tai niiden välitasojen välillä tapahtuu funktio-35 naalisen ryhmän tasolla, kun taas rakenteelliset elementit säilyvät, kuten rasvahapot jotka ovat spesifisiä yksittäiselle lipidilajille lipidiluokan sisällä. Conversion between different classes or intermediate layers takes place in a function of 35-level functional group, while the structural elements are retained, such as fatty acids that are specific to the individual lipid species within the lipid class.

13 13

Kuviot 9A ja 9B, jotka muodostavat yhden loogisen piirroksen esittävät algoritmisesti muodostettua SMILES:iä eräälle rasvahappoketjujen esi-merkkijoukolle. Figures 9A and 9B, which form a single logical drawing showing algorithmically generated SMILES GPCRs to a fatty acid chain of pre-character set.

Kuviot 10A ja 10B esittävät karakterististen MS/MS spektrien kehit-5 tämistä yksittäisille lajeille. Figures 10A and 10B show the characteristic MS / MS spectra for the development of 5-tämistä individual species. Käyttämällä täyden pyyhkäisyn MS-metodia, jota seuraa kromatografia, kirjataan vanhempi-ioni ja retentioaika. Using a full scan MS method, followed by chromatography, recognized parent ion and retention time. Vanhempi-ionin fragmentointi, MS/MS:ää tai samanlaisia metodeja käyttämällä, kehittää ionin fragmentit, jotka yhdessä MS:n informaation ja retentioajan kanssa auttavat selvittämään yksittäisen yhdisteen. Parent ion fragmentation, the MS / MS or using similar methods, the development of ion fragments, which together with the MS information, and to investigate the retention time of the individual compound.

10 Yllä mainituissa suomalaisissa patenttihakemuksissa FI20055252, FI20055253 ja FI20055254 selostettuja tekniikoita voidaan käyttää prosessoimaan spektri-informaatiota, joka kulkeutuu yksittäisten lipidien etsintöihin. 10 The above-mentioned Finnish patent applications FI20055252, FI20055253 and FI20055254 described techniques can be used to process the spectrum of information that is carried by individual lipid probes.

Yllä mainitussa suomalaisessa patenttihakemuksessa FI20055198 selostettuja tekniikoita voidaan käyttää yhdistämään lipidiyhdisteinformaatio poikukaavio- 15 informaation kanssa sekä informaation kanssa muilla biologian tasoilla. described in the above-mentioned Finnish patent application FI20055198 techniques can be used to connect with lipidiyhdisteinformaatio 15 poikukaavio- information, and information with other biological levels.

Kuviossa 12 näytetään dataesitys, joka esittää, kuinka lipidiprofiilien kudosten välinen tutkimus yksittäisen molekyyliiajin tasolla voi paljastaa biologisten prosessien välisiä riippuvuuksia organismien eri osastoissa. Figure 12 shows the data presentation, showing, study how lipid profiles between the tissues of an individual molekyyliiajin level can reveal dependencies between biological processes in different compartments organisms. Data 1200 näyttää sydämen LysoPC:n (lysofosfaaattidyl koliini) huomattavan assosiaation 20 maksan TAG:ien (triasyyliglyseroli) kanssa sekä negatiivisen assosiaation ruskean rasvakudoksen (BAT, brown adipose tissue) GPEtnm {giyserofosfo-etanolamiini) kanssa. The data show a heart lysoPC 1200's (lysofosfaaattidyl choline), a significant association of TAG 20 liver with ADDLs (triacylglycerol), and a negative association of brown adipose tissue (BAT, brown adipose tissue) {GPEtnm with giyserofosfo-ethanolamine). Esimerkiksi spesifisten triasyyliglyseroiien lisäys maksassa assosioituu eetteriin kytketyn lysofosfaaattidylkoliinin lisäykseen sydänlihaksessa, mikä kytkeytyy mitokondrioiden toimintahäiriöön sydämessä. For example, the addition of specific triasyyliglyseroiien connected to the liver is associated with ether lysofosfaaattidylkoliinin increase in cardiac muscle, which engages in the heart mitochondrial dysfunction. Ks. See.

25 esim. yhteissääntely elementtien TAG 54:3 ja LysoPC 16:1 e välillä. 25 for example, the regulatory elements of TAG 54. LysoPC 3 and 16: between 1 e. Tämä yh- I This one I

teissääntely, jota osoitetaan viitenumerolla 1202, on yllättävä löytö, joka on { tehty keksinnön mukaisella menetelmällä ja datanprosessointijärjestelmällä. teissääntely, indicated by reference numeral 1202, is a surprising discovery, which is {made by the method and a data processing system according to the invention. | |

Lopuksi kuvio 13 kokoaa yhteen keksinnön mukaisen menetelmän vaiheet. Finally, Figure 13 brings together the steps of the method according to the invention.

30 Alan ammattilainen huomaa helposti, että tekniikan kehittyessä kek sinnön perusajatus voidaan toteuttaa monin eri tavoin. 30 skilled in the art will readily appreciate that the KEK sinnön technology advances, the basic idea can be implemented in many different ways. Keksintö ja sen suoritusmuodot eivät siten rajoitu yllä kuvattuihin esimerkkeihin vaan ne voivat vaihdella patenttivaatimusten puitteissa. The invention and its embodiments are thus not restricted to the above examples but they may vary within the scope of the claims.

! ! | |

Claims (8)

1. Menetelmä prosessoida informaatiota yhteisiä rakenneosia jakavien moiekylaaristen luokkien yhdisteistä, jossa menetelmässä: ylläpidetään polkukaavioinformaatiota yhdisteistä yksittäisen yhdis-5 teen tasolla ja/tai geneerisen luokan tasolla (13-1); 1. The method for processing information on the compounds moiekylaaristen classes sharing a common structural elements, the method comprising: maintaining a pathway information of individual compounds yhdis 5-I levels and / or levels of the generic class (13-1); kehitetään yhdisteiden diversiteettiä perustuen joukkoon siemen-rakenteita, joista kukin kuvaa lipidiyhdisteen, jolla on keskimääräistä suurempi todennäköisyys esiintyä luonnossa (13-2); diversity of the compounds developed based on a set seed structures, each describing a lipid having a higher than average likelihood to occur in nature (13-2); käytetään formaalia kuvauskieltä ilmaisemaan siemenrakenteet 10 (13-3); formal description language is used to indicate the structures of the seeds 10 (13-3); käytetään rakenne-elementtejä kehittämään odotettuja spektrejä kullekin yhdisteelle käyttämällä massaspektrometrian tunnettuja koeolosuhteita (13-4); using the structural elements to generate the expected spectra of each compound using the known experimental conditions of mass spectrometry (13-4); suoritetaan yksi tai useampia spektroskopiakokeita yhdisteinfor-15 maation saamiseksi (13-5); performing one or more spectroscopy to obtain a compound of informal conformation-15 (13-5); ja kytketään saatu yhdisteinformaatio olemassa olevaan informaatioon molekyyliluokista (13-6). and coupling the compound of the information obtained from the existing information on the molecular classes (13-6).
2. Patenttivaatimuksen 1 mukainen menetelmä, missä olemassa oleva informaatio yhdisteistä sisältää polkukaavioinformaatiota yksittäisen yh- 20 disteen tasolla ja/tai geneerisen luokan tasolla. 2. The method according to claim 1, wherein the existing information includes the compounds pathway information on an individual level, one 20 compound and / or the generic class level.
3. Patenttivaatimuksen 1 tai 2 mukainen menetelmä, missä olemassa oleva informaatio yhdisteistä sisältää yhteissääntelyinformaatiota muun yh-disteinformaation kanssa eri biologisista näytteistä. 3. The method according to claim 1 or 2, wherein the existing information includes the compounds of the regulatory information such YH-disteinformaation with various biological samples.
4. Jonkin edellisen patenttivaatimuksen mukainen menetelmä, joka 25 lisäksi käsittää informaation linkittämisen yksittäisestä yhdisteestä informaatioon muilla tasoilla. 4. The method according to any one of the preceding claims, which further comprises 25 information linking the individual compound information at other levels.
5. Patenttivaatimuksen 4 mukainen menetelmä, missä informaatio muilla tasoilla käsittää informaatiota proteiineista tai geeneistä, jotka liittyvät yksittäisen yhdisteen metaboliaan tai biologiseen variaatioon. 4 A process according to claim 5, wherein the information comprises information about the levels of other proteins or genes involved in the metabolism of a single compound, or a biological variation.
6. Jonkin edellisen patenttivaatimuksen mukainen menetelmä, joka lisäksi käsittää informaation käyttämisen yksittäisten yhdisteiden tasolla ja niiden variaation tietyn organismin osan sisällä eri biologisissa näytteissä, yhdisteiden välisten riippuvuuksien löytämiseksi organismin eri osien välillä. 6. The method according to any one of the preceding claims, further comprising using the information at the level of the individual compounds and the inside part of the variation of a given organism in the biological samples to find the dependencies between the various components of the compounds of the organism.
7. Jonkin edellisen patenttivaatimuksen mukainen menetelmä, mis-35 sä molekylaaristen luokkien yhdisteet käsittävät lipidejä. 7. The method according to any one of the preceding claims, mis-35, a compound of molecular classes comprise lipids.
8. Patanprosessointijärjestelmä prosessoimaan informaatiota yhteisiä rakenneosia jakavien molekylaaristen luokkien yhdisteistä, joka datan-prosessointijärjestelmä käsittää: tietokannan ylläpitämään poikukaavioinformaatiota yhdisteistä yksit-5 täisen yhdisteen tasolla ja/tai geneerisen luokan tasolla; 8. Patanprosessointijärjestelmä process information from compounds of molecular classes sharing a common structural elements of the data processing system comprising: a database maintained by the poikukaavioinformaatiota compounds at pres-five individual compound and / or the generic class level; ja prosessointiiogiikan: - kehittämään yhdisteiden diversiteettiä perustuen joukkoon siemen-rakenteita, joista kukin kuvaa iipidiyhdisteen, joila on keskimääräistä suurempi todennäköisyys esiintyä luonnossa; and prosessointiiogiikan: - to develop the diversity of the compounds based on a set of seed structures, each describing lipid compounds JOILA a higher than average probability to occur in nature; 10. käyttämään formaalia kuvauskieltä ilmaisemaan siemenrakenteet; 10. The use of formal description language to indicate the seed structures; - käyttämään rakenne-elementtejä kehittämään odotettuja spektrejä kullekin yhdisteelle käyttämällä massaspektrometrian tunnettuja koeolosuhteita; - use of structural elements to generate the expected spectra of each compound using the known experimental conditions for mass spectrometry; - suorittamaan yksi tai useampia spektroskopiakokeita yhdisteinfor-15 maation saamiseksi; - to carry out one or more spectroscopy compound informal-15 to obtain a conformation; ja - kytkemään saatu yhdiste informaatio olemassa olevaan informaatioon molekyyiiluokista. and - coupling the resulting compound information to existing information molekyyiiluokista.
FI20065309A 2006-05-10 2006-05-10 Information management techniques related to the metabolism of data FI120116B (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
FI20065309A FI120116B (en) 2006-05-10 2006-05-10 Information management techniques related to the metabolism of data
FI20065309 2006-05-10

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
FI20065309A FI120116B (en) 2006-05-10 2006-05-10 Information management techniques related to the metabolism of data
EP07730748A EP2024888A1 (en) 2006-05-10 2007-05-09 Information management techniques for metabolism-related data
PCT/FI2007/050261 WO2007128882A1 (en) 2006-05-10 2007-05-09 Information management techniques for metabolism-related data
US12/300,299 US20090164133A1 (en) 2006-05-10 2007-05-09 Information management techniques for metabolism-related data

Publications (3)

Publication Number Publication Date
FI20065309A0 FI20065309A0 (en) 2006-05-10
FI20065309A FI20065309A (en) 2007-11-11
FI120116B true FI120116B (en) 2009-06-30

Family

ID=36540010

Family Applications (1)

Application Number Title Priority Date Filing Date
FI20065309A FI120116B (en) 2006-05-10 2006-05-10 Information management techniques related to the metabolism of data

Country Status (4)

Country Link
US (1) US20090164133A1 (en)
EP (1) EP2024888A1 (en)
FI (1) FI120116B (en)
WO (1) WO2007128882A1 (en)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7629028B2 (en) * 1999-03-19 2009-12-08 Battelle Memorial Insitute Methods of making monolayers
WO2002057989A2 (en) * 2001-01-18 2002-07-25 Basf Aktiengesellschaft Method for metabolic profiling
AU2002352831A1 (en) * 2001-11-21 2003-06-10 Paradigm Genetics, Inc. Methods and systems for analyzing complex biological systems
EP1327883A3 (en) * 2002-01-10 2003-07-30 Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. Combined metabolomic, proteomic and transcriptomic analysis from one, single sample and suitable statistical evaluation of data
JP4818116B2 (en) * 2003-05-29 2011-11-16 ウオーターズ・テクノロジーズ・コーポレイシヨン Method and device for processing the lc-ms or lc-ms / ms data in metabonomics

Also Published As

Publication number Publication date
EP2024888A1 (en) 2009-02-18
FI20065309D0 (en)
FI20065309A (en) 2007-11-11
US20090164133A1 (en) 2009-06-25
FI20065309A0 (en) 2006-05-10
WO2007128882A1 (en) 2007-11-15
FI120116B1 (en)

Similar Documents

Publication Publication Date Title
Phair et al. Measurement of dynamic protein binding to chromatin in vivo, using photobleaching microscopy
Carr et al. Targeted peptide measurements in biology and medicine: best practices for mass spectrometry-based assay development using a fit-for-purpose approach
Wang et al. Label-free protein quantification using LC-coupled ion trap or FT mass spectrometry: Reproducibility, linearity, and application with complex proteomes
O'Hagan et al. Closed-loop, multiobjective optimization of analytical instrumentation: gas chromatography/time-of-flight mass spectrometry of the metabolomes of human serum and of yeast fermentations
Xia et al. MetaboAnalyst 2.0—a comprehensive server for metabolomic data analysis
Prince et al. Chromatographic alignment of ESI-LC-MS proteomics data sets by ordered bijective interpolated warping
Ivanova et al. Lipidomics: a mass spectrometry based systems level analysis of cellular lipids
Radulovic et al. Informatics platform for global proteomic profiling and biomarker discovery using liquid chromatography-tandem mass spectrometry
Verpoorte et al. Ethnopharmacology and systems biology: a perfect holistic match
Jung et al. High throughput quantitative molecular lipidomics
Mann Innovations: Functional and quantitative proteomics using SILAC
Suhre et al. MassTRIX: mass translator into pathways
Han et al. Shotgun lipidomics: multidimensional MS analysis of cellular lipidomes
Tabb et al. MyriMatch: highly accurate tandem mass spectral peptide identification by multivariate hypergeometric analysis
Elias et al. Intensity-based protein identification by machine learning from a library of tandem mass spectra
US20080308723A1 (en) Method of non-targeted complex sample analysis
Dunn et al. Mass appeal: metabolite identification in mass spectrometry-focused untargeted metabolomics
US8068987B2 (en) Method and system for profiling biological systems
Choi et al. Significance analysis of spectral count data in label-free shotgun proteomics
Hu et al. RPLC-ion-trap-FTMS method for lipid profiling of plasma: method validation and application to p53 mutant mouse model
Bou Khalil et al. Lipidomics era: accomplishments and challenges
Watkins et al. Toward the implementation of metabolomic assessments of human health and nutrition
Nordström et al. Multiple ionization mass spectrometry strategy used to reveal the complexity of metabolomics
Weckwerth et al. Metabolomics: from pattern recognition to biological interpretation
Dunn et al. Systems level studies of mammalian metabolomes: the roles of mass spectrometry and nuclear magnetic resonance spectroscopy

Legal Events

Date Code Title Description
FG Patent granted

Ref document number: 120116

Country of ref document: FI

MM Patent lapsed