HUT75550A

HUT75550A - Comparative gene transcript analysis

Info

Publication number: HUT75550A
Application number: HU9602047A
Authority: HU
Inventors: Randal W Scott; Jeffrey J Seilhamer
Original assignee: Incyte Pharmaceuticals
Priority date: 1994-01-27
Filing date: 1995-01-27
Publication date: 1997-05-28
Also published as: HU9602047D0

Abstract

A találmány tárgyát géntranszkriptum-vizsgálati eljárások, valamint sejtek és szövetek génexpressziójának diagnosztizálására szolgáló eljárások képezik. A találmány szerinti megoldás érinti mind a molekuláris biológia, mind pedig a számítógépes tudományok alkalmazási területeit. A találmány tárgyát közelebbről eljárások képezik géntranszkriptumokat tartalmazó minták vizsgálatára, biológiai mintákban található mRNS-ek relatív gyakoriságának meghatározására, valamint géntranszkriptumképek előállítására . Aktaszámunk: 84215-2444C/PÁThe present invention relates to methods for the diagnosis of gene transcription as well as gene expression of cells and tissues. The present invention relates to the fields of application of both molecular biology and computer science. More specifically, the present invention provides methods for testing samples containing gene transcripts, determining the relative frequency of mRNAs in biological samples, and generating gene transcript images. Our number: 84215-2444C / PÁ

Description

ii

KÖZZÉTÉTELIDISCLOSURE

PÉLDÁNY Képviselő: DANUBIA SZABADALMI ÉS VÉDJEGY IRODA Kft.EXAMPLE Representative: DANUBIA SZABADALMI és VÉDJEGY IRODA Kft.

ÖS S ZEHASONL í TÓ GÉNTRANS ZKRIPTUM-ANAL í ZIS A találmány tárgyát géntranszkriptum-vizsgálati el-járások, valamint sejtek és szövetek génexpressziójának di-agnosztizálására szolgáló eljárások képezik. A találmányszerinti megoldás érinti mind a molekuláris biológia, mindpedig a számitógépes tudományok alkalmazási területeit. A találmány tárgyát közelebbről eljárások képezikgéntranszkriptumokat tartalmazó minták vizsgálatára, bioló-giai mintákban található mRNS-ek relatív gyakoriságánakmeghatározására, valamint géntranszkriptumképek előállítá-sára . A találmány szerinti megoldás előnyösen alkalmazha-tó a diagnosztika, a toxikológia és a gyógyászat terén;felhasználható, többek között, normális és beteg sejtekvagy például, mutáns és vad típusú sejtek megkülönbözteté-sére, gyógyszerek toxicitásának és hatékonyságának előzetesmeghatározására, és más hasonló, biológiai minták összeha-sonlításán alapuló feladatok megoldására.FIELD OF THE INVENTION The present invention relates to methods for the gene expression of gene transcription as well as gene expression of cells and tissues. The invention relates to the fields of application of molecular biology and computer science. More particularly, the present invention relates to methods for testing samples containing gene transcripts, determining the relative frequency of mRNAs in biological samples, and generating gene transcript images. The present invention is advantageously applicable in the fields of diagnostics, toxicology and medicine; it can be used, inter alia, to distinguish between normal and patient cellular abnormalities, for example, mutant and wild-type cells, to predetermine the toxicity and efficacy of drugs, and other similar biological samples. to solve tasks based on the comparison of

Egészen a legutóbbi időkig, a molekuláris biológiaikutatások az "egyszerre egy gén" elv alapján működtek. Akutatók megfigyelték a sejt fizikai változásait, a sejtbőlvagy környezetéből elegyeket izoláltak, proteineket tisztí-tottak, meghatározták azok szekvenciáját, s ezekből próbá-Until recently, molecular biology activities were based on the principle of "one gene at a time". Researchers have observed the physical changes in the cell, mixtures of cells or their environment have been isolated, proteins have been purified, and their sequences have been determined and tested.

Aktaszámunk: 84215-2444C/PÁ • · · · · · · • · · · • · · * · • · · · · < - 2 - kát készítettek a megfelelő gén felkutatásához. Az utóbbiévekben a különböző országok - az emberi genomot alkotó bá-zisok milliárdjai szekvenciájának meghatározására - nagy-szabású projekteket hoztak létre. Az ennek megvalósításárairányuló munkák rendszerint azzal kezdődnek, hogy a genomotnagy kromoszómadarabokra osztják, majd meghatározzák e da-rabok szekvenciáját, melyeket később ismert proteinekkelvagy azok részeivel való - "motívum" néven ismert - azonos-ságukra vizsgálják. A genomiális DNS-ek többsége nem kódolproteint, így ezekről feltételezhető, hogy a sejt protein-termelő képességére gyakorolnak valamilyen hatást, melynekgyógyászati jelentősége jelenleg nem ismert.We have made a number of 84215-2444C / PAs to search for the right gene. In recent years, different countries have set up large-scale projects to determine the billions of billions of bases constituting the human genome. The work to accomplish this usually starts by dividing the genomic mass into chromosome pieces, and then determining the sequence of these fragments, which are later identified as "motive" identities with known protein or parts thereof, known as "motif". The majority of genomic DNAs do not encode protein, so they can be expected to exert an effect on the protein-producing ability of the cell, the medical significance of which is currently unknown.

Egy harmadik módszer szerint csak a proteinek elő-állításában aktívan szerepet játszó "celluláris gépezetet"kódoló transzkriptumokat, nevezetesen az mRNS-eketszekvenálják. Ennek előnye, hogy ebben a stádiumban a sejtmár kihagyta az összes nem kódoló DNS-t, s viszonylag egy-szerű az RNS-ek proteinkódoló szakaszainak azonosítása. Emegközelítési mód előnye a genomkutatók számára nem voltazonnal egyértelmű. Valójában, amikor a cDNS-szekvenáláslehetőséget először felvetették, a genomiális szekvenáláselkötelezettjei ezt nyíltan elutasították. Például, azEgyesült Államok-beli Humán Genom projekt vezetője a cDNS-szekvenálást - mint a projekt szempontjából értéktelen mód-szert - figyelmen kívül hagyta, és nem hagyta jóvá a terve-zetek finanszírozását. A leírásban feltárunk DNS (ideértve a cDNS-könyvtárakat) vizsgálatára szolgáló eljárásokat. Vizsgála- / taink és kutatásaink alapján minden egyes génterméket in-formációs képelemnek ("pixel") tekintünk, amely kizárólagaz adott gén expressziójára vonatkozik. Olyan eljárásokatírunk le, amelyekkel az egyes génexpressziós információsképelemek egyetlen géntranszkriptumképpé ("image") egyesít-hetek, amelyben az egyes gének egyidejűleg jeleníthetőkmeg, ezáltal a gén-képelemek közötti összefüggések könnyenláthatóvá tehetők, ill. érthetők.According to a third method, only transcripts encoding "cellular machinery" that is actively involved in the preparation of proteins, i.e., mRNAs, are sequenced. The advantage of this is that at this stage, the cellar omitted all the non-coding DNAs, and it is relatively simple to identify the protein coding regions of the RNAs. The advantage of the approach to genomics for genome researchers is not clear. In fact, when the possibility of cDNA sequencing was first raised, its genomic sequencing commitment was openly rejected. For example, the United States Human Genome Project Manager ignored cDNA sequencing as a worthless method for the project and did not approve the financing of the plans. Described herein are methods for testing DNA (including cDNA libraries). According to our studies and researches, each gene product is considered to be an information element ("pixel"), which refers exclusively to the expression of a particular gene. We describe procedures by which each gene expression information image is a single gene transcription image ("image"), in which the individual genes can be simultaneously displayed, so that the relationship between the gene image elements can be made easily visible or not. understandable.

Feltárunk továbbá egy új eljárást, amelyet elektro-nikus kivonásnak ("electronic subtraction" ) nevezünk. Azelektronikus kivonás lehetővé teszi, hogy a génkutató egyképet mozgóképpé alakítson, amely - egy sejt vagy egy tel-jes szövet szintjén - leírja a génexpresszió ideiglenessé-gét és dinamikáját. A celluláris gépezet fenti értelembenvett - sejt- vagy szervszintű - "mozgása" képezi a talál-mány szerinti megoldás alapját. Ez a megközelítési mód újbetekintést nyújt az élő sejt fiziológiai folyamataiba, ésígéretes lehetőséget biztosít új gyógyászati és diagnoszti-kai módszerek kidolgozására.We also disclose a new method called "electronic subtraction". Azelectronic subtraction allows the genetic engineer to transform a picture into a moving image that, at the level of a cell or a complete tissue, describes the temporal and dynamics of gene expression. The above-mentioned "cellular or organ-level" movement of the cellular machine forms the basis of the invention. This approach reveals the physiological processes of the living cell and provides a promising opportunity to develop new medical and diagnostic methods.

Feltárunk továbbá egy olyan új eljárást is, melyet "elektronikus northern-analízisnek" nevezünk. Ezzel az el-járással egy gént sok sejt- és szövettípuson keresztül kö-vethetünk nyomon. A nukleinsavak (DNS és RNS) szekvenciájukban hor-dozzák az öröklődő információkat, következésképpen, az életelsőrendű molekuláit képezik. A nukleinsavak valamennyi élőorganizmusban, így a baktériumokban, gombákban, vírusokban,növényekben és állatokban, megtalálhatók. Lényeges annak / - 4 - meghatározása, hogy a különböző nukleinsavak az idő függvé-nyében (különböző körülmények, kezelések és életmódok mel-lett) milyen relatív eloszlásban találhatók meg a különbözősejtekben, szövetekben és organizmusokban.We also discover a new method called "electronic northern analysis". With this approach, a gene can be traced through many cell and tissue types. Nucleic acids (DNA and RNA), in their sequences, inherit the hereditary information, and consequently form life-oriented molecules. Nucleic acids are found in all living organisms such as bacteria, fungi, viruses, plants and animals. It is important to determine the relative distribution of different nucleic acids over time (with different conditions, treatments and lifestyles) in different cells, tissues and organisms.

Az emberi test valamennyi osztódó sejtje 23 pár kromoszóma azonos készletét tartalmazza. Becslések szerint e testi és ivari kromoszómák hozzávetőleg 100000 gént tar-talmaznak. A különböző sejttípusok közötti különbségek va-lószínűleg a mintegy 100000 gén eltérő expresszióját tükrö-zik. A biológia alapvető kérdései megválaszolhatók lennénekannak ismeretében, hogy mely gének transzkriptálódnak, il-letve, hogy a különböző sejtekben milyen a transzkriptumok relatív eloszlása. A korábbi biotechnológiai módszerek hagyományos mo-lekuláris biológiai technikák (pl. polimeráz-láncreakció,"northern-blot"-analízis vagy a DNS-próba-analízisek mástípusai, mint pl. az in situ hibridizáció) alkalmazásávalegyszerre csak néhány gén vizsgálatát tették lehetővé. Ezeneljárások mindegyikére az jellemző, hogy csak ismert génekés/vagy egyszerre csak kevés gén transzkripciójának vizsgá-latát teszik lehetővé [Nucl. Acids Rés. 19, 7097 (1991);All human cells in the human body contain the same set of 23 pairs of chromosomes. It is estimated that these physical and sex chromosomes contain about 100,000 genes. Differences between different cell types probably reflect different expression of about 100,000 genes. The basic questions of biology can be answered in the knowledge of which genes are transcribed, and the relative distribution of transcripts in different cells. Earlier biotechnological methods have allowed only a few genes to be tested at one time using conventional molecular biological techniques (eg, polymerase chain reaction, northern blot analysis, or other types of DNA probe analysis, such as in situ hybridization). Each of these procedures is characterized by allowing only known genes / transcription of only a few genes simultaneously [Nucl. Acids Slit. 19, 7097 (1991);

Nucl. Acids Rés. 18, 4833 (1990); Nucl. Acids Rés. 18, 2789 (1989); European J. Neuroscience 2, 1063 (1990);Nucl. Acids Slit. 18: 4833 (1990); Nucl. Acids Slit. 18, 2789 (1989); European J. Neuroscience 2, 1063 (1990);

Analytical Biochem. 187, 364 (1990); Gene Annals Techn. Appl. 2, 64 (1990); GATA 8(4) , 129 (1991) ; Proc. Natl . Acad. Sci . USA 85, 1696 (1988); : Nucl. Acids Rés. 19, 1954 (1991) ; Proc. Natl. Acad Sci. USA 88, 1943 (1991); Nucl. iAnalytical Biochem. 187, 364 (1990); Gene Annals Techn. Appl. 2, 64 (1990); GATA 8 (4), 129 (1991); Proc. Natl. Acad. Sci. USA 85, 1696 (1988); : Nucl. Acids Slit. 19, 1954 (1991); Proc. Natl. Acad Sci. USA 88: 1943; Nucl. i

Acids Rés. 1^, 6123 (1991); Proc. Natl. Acad. Sci. USA 85,5738 (1988); Nucl. Acids Rés. 16, 10937 (1988)] .Acids Slit. 1: 6123 (1991); Proc. Natl. Acad. Sci. USA 85,5738 (1988); Nucl. Acids Slit. 16, 10937 (1988)].

Sok éve folynak olyan - különböző technikákat al-kalmazó - kutatások, amelyek azon gének számának és típusa-inak vizsgálatára irányulnak, melyek transzkripcióját asejtben lejátszódó folyamatok - mint pl. az aktiválás, dif-ferenciálódás, öregedés, vírustranszformáció, morfogenezisés mitózis - indukálják vagy szabályozzák. Az egyik legelsőilyen módszer volt a sejtben, szövetben, szervrendszerben,sőt, egész organizmusokban jelenlévő proteinek - egy adottfolyamat előtti és utáni - szintjének izolálására és vizs-gálatára irányuló eljárás. Egy mintában lévő sok proteinvizsgálatának egyik módszere a kétdimenziós gél-elektroforézis, melynek eredményeként a proteinek általábankülönálló sávokként azonosíthatók és mennyiségileg meghatá-rozhatók, s végül egy diszkrét jellé redukálhatok. Jelenlega kétdimenziós analízis a proteinek hozzávetőleg 15 %-átválasztja szét. A szétválasztott proteinek vizsgálata érde-kében minden egyes sávot ki kell vágni a membránból,"Edman-lebontás" alkalmazásával protein-szekvencia-ana-lízist kell végezni. Sajnos a legtöbb sáv túl kis mennyi-ségben van jelen ahhoz, hogy megbízható szekvenciát kapjunkbelőle, és a sávok közül sok egynél több proteint tartal-maz. További nehézséget okoz, hogy sok protein N-terminálisa blokkolt, ami bonyolítja a szekvenálást. A differenciálódás géntranszkripció szintjén törté-nő vizsgálata az említett nehézségek és hátrányok közül so-kat kiküszöbölt, mivel a rekombináns DNS-technika teljesít- ménye nagyon kis mennyiségű anyagot tartalmazó jelekamplifikációját teszi lehetővé. A legáltalánosabb eljárás(melyet "hibridizációs kivonásnak" neveznek) abból áll,hogy egy - a szóban forgó fejlődési folyamat előtti és utá-ni (A, illetve B) - biológiai mintából mRNS-t izolálnak, azegyik mRNS-készletet cDNS-sé írják át, a B minta tartalmáthibridizációval kivonják az A minta tartalmából (mRNS-t acDNS-ből), és a nem hibridizálódott mRNS-ekből cDNS-könyvtárat állítanak elő. Számos kutatócsoport sikerrel al-kalmazta ezt a módszert, és alapsémájának alkalmazásávalkülönböző eljárásokat írtak le, illetve fejlesztettek to-vább [ Nucl . Acids Rés. 19, 7097 (1991); Nucl . Acids Rés.18, 4833 (1990); Nucl. Acids Rés. 18, 2789 (1989); EuropeanJ. Neuroscience .2, 1063 (1990); Analytical Biochem. 187,364 (1990); Génét. Annals Techn. Appl. 7, 64 (1990); GATA8,(4) 129 (1991); Proc. Natl . Acad. Sci. USA 85, 1696 (1988); Nucl. Acids Rés. 19, 1954 (1991); Proc. Natl. Acad.For many years, research has been carried out - using different techniques - to investigate the number and type of genes for transcription, such as transcription of genes, such as genes. activation, differentiation, aging, viral transformation, morphogenesis mitosis - induce or regulate. One of the first methods was to isolate and test the level of proteins present in the cell, tissue, organ system, and even whole organisms before and after a particular process. One method of many protein assays in a sample is two-dimensional gel electrophoresis, as a result of which proteins can generally be identified as discrete bands and quantified, and eventually reduced to a discrete signal. Presence of two-dimensional analysis separates approximately 15% of proteins. For the purpose of testing the separated proteins, each band should be cleaved from the membrane, using protein sequence analysis using "Edman degradation". Unfortunately, most bands are too small to get a reliable sequence and many of the bands contain more than one protein. Another difficulty is that many N-terminals of proteins are blocked, which complicates sequencing. The study of differentiation at the level of gene transcription eliminates the aforementioned difficulties and disadvantages because the performance of the recombinant DNA technique allows signal amplification with very small amounts of material. The most common method (called "hybridisation subtraction") consists in isolating mRNA from a biological sample prior to and after the developmental process in question (A and B), converting one mRNA set to cDNA. , sample B is extracted from the contents of sample A (mRNA from acDNA) by content hybridization, and a cDNA library is prepared from non-hybridized mRNAs. A number of research teams have successfully used this method, and different methods have been described or developed by applying their basic scheme [Nucl. Acids Slit. 19, 7097 (1991); Nucl. Acids Rev. 18, 4833 (1990); Nucl. Acids Slit. 18, 2789 (1989); EuropeanJ. Neuroscience. 2, 1063 (1990); Analytical Biochem. 187,364 (1990); Genet. Annals Techn. Appl. 7, 64 (1990); GATA8 (4) 129 (1991); Proc. Natl. Acad. Sci. USA 85: 1696 (1988); Nucl. Acids Slit. 19, 1954 (1991); Proc. Natl. Acad.

Sci. USA 88, 1943 (1991); Nucl. Acids Rés. 19, 6123 (1991);Sci. USA 88: 1943; Nucl. Acids Slit. 19, 6123 (1991);

Proc. Natl. Acad. Sci. USA 85, 5738 (1988); Nucl. Acids Rés. 16, 10937 (1988)] . Bár a fenti technikák mindegyikének vannak előnyösés gyenge oldalai, ezekben az eljárásokban felmerülnek bi-zonyos hátrányos és nem kívánatos tényezők. Elsőként említ-jük az ilyen könyvtárak kialakításának igen nagy idő- ésráfordítás-igényét. Általában, egy gyakorlott molekulárisbiológus számára (rátermettségétől, tapasztaltságától ésszerencséjétől függően) 3-6 hónapot vesz igénybe egy ilyenkönyvtár létrehozása és karakterizálása. Másodszor, a ka-Proc. Natl. Acad. Sci. USA 85: 5738; Nucl. Acids Slit. 16, 10937 (1988)]. Although each of these techniques has weaknesses in advantage, there are some adverse and undesirable factors in these processes. First of all, we need to mention the very high time and effort required to build such libraries. Generally, for a skilled molecular biologist (depending on his ability, experience and luck), it takes about 3 to 6 months to create and characterize such a library. Secondly,

V pott kivonásos könyvtárak rendszerint kevésbé értékesek,mint a hagyományos módon előállított könyvtárak. Egy átla-gos, hagyományos könyvtár legalább 106 kiónt tartalmaz, az inszertek átlagos mérete pedig 1-3 kilobázis. Ezzel szem- 2 3 ben, a kivonásos könyvtarak összesen 10 vagy 10 kiont tartalmaznak, az átlagos inszertméret pedig 0,2 kb. Ennekmegfelelően, az ilyen könyvtárak lényegesen kevesebb kióntés szekvencia-információt tartalmaznak, mint a hagyományoscDNS-könyvtárak. Harmadszor, ez a módszer csak az A mintá-ban lévő indukált gének befogását teszi lehetővé (a B min-tára vonatkozóan), fordítva azonban nem, s egy harmadik (C)mintával történő összehasonlítás is nehézségekbe ütközik.Negyedszer, e módszer megvalósításához az "irányító"("driver") mRNS (B minta) nagyon nagy mennyiségére (többszáz mikrogramm) van szükség, ami jelentős mértékben korlá-tozza a lehetséges kivonások számát és típusát, mivel sokszövet és sejt esetében nagyon bonyolult a nagy mennyiségekkinyerése. Ötödször, a kivonás felbontóképessége a DNS:DNSvagy RNS:DNS hibridizáció fizikai tulajdonságaitól függ.Egy adott szekvencia azon képessége, hogy hibridizációspárt találjon, egyedi CoT-értékétől függ. A CoT-értéket azadott szekvencia kópiái számának (koncentrációjának) és a hibridizáció időtartamának (T) szorzata adja. Ebből követ-kezik, hogy a gyakori szekvenciák esetében a hibridizációsesemények nagyon gyorsan következnek be (kis CoT-érték),míg a ritka szekvenciák nagyon nagy CoT-értékkel rendelkeződuplexeket képeznek. Megfelelő időkeretben nehéz olyan CoT- 9 értékeket kialakítani, amelyek lehetővé teszik, hogy azilyen ritka szekvenciák duplexeket képezzenek, illetve,hogy ezáltal szelektálásuk hatásos legyen. Ilyenformán, ahibridizációs kivonás a ritka mRNS-fajták relatív szintjé-nek tanulmányozásához nem alkalmas. Hatodszor, ezt a prob-lémát tovább bonyolítja az a tény, hogy a duplexképződésegy adott szekvencia bázisösszetételétől is függ. A nagyguaninban és citozinban gazdag szekvenciák erősebb duplexe-ket képeznek, mint az adeninben és timinben gazdag szekven-ciák, így a hibridizációs kivonással inkább az előbbi szek-venciák távolíthatók el. Hetedszer, a hibridizáció egymás-sal nem pontosan illeszkedő párok között is előfordulhat, silyen esetben a homológ gén expressziója "álcázhatja" avizsgált gén expresszióját, ami torzítja az adott génre ka-pott eredményeket.Usually, subtracting libraries are less valuable than conventional libraries. An average traditional library contains at least 106 clones, and the average size of inserts is 1-3 kilobases. In this way, subtracting libraries contain a total of 10 or 10 clones and an average insert size of 0.2 kb. Accordingly, such libraries contain substantially less cloning sequence information than conventional cDNA libraries. Thirdly, this method allows only the capture of induced genes in sample A (for sample B), but not vice versa, and comparisons with a third (C) pattern also make it difficult. a very large amount of "driver" mRNA (sample B) (hundreds of micrograms) is required, which significantly limits the number and type of possible extractions, as large quantities of large tissue and cell are very difficult to extract. Fifth, the resolution of the subtraction depends on the physical properties of DNA hybridization to DNA or RNA. The ability of a given sequence to find a hybridization pair depends on its unique CoT value. The CoT value is the product of the number of copies (concentration) of the given sequence and the duration of the hybridization (T). Hence, in the case of frequent sequences, hybridization events occur very rapidly (low CoT value), while rare sequences form duplexes with very high CoT values. In a suitable time frame, it is difficult to form CoT-9 values that allow such rare sequences to form duplexes or to make their selection effective. Thus, the hybridization subtraction is not suitable for studying the relative level of rare mRNA species. Sixth, this problem is further complicated by the fact that duplex formation also depends on the base composition of a given sequence. High-guanine and cytosine-rich sequences produce stronger duplexes than sequences rich in adenine and thymine, so that the hybridization subtraction can be used to remove the former sequences. Seventh, hybridization may also occur between pairs that do not match exactly, in which case the expression of the homologous gene may "mask" the expression of the gene under examination, which distorts the results for the particular gene.

Matsubara és Okubo részleges cDNS-szekvenciák al-kalmazását javasolták gének expressziós profiljainak kiala-kításához, amelyek felhasználhatók a humán genom funkcioná-lis analízisében. Matsubara és Okubo óvott a random láncin-dítás alkalmazásától, mivel ezzel az egyes mRNS-ekből többegyedi DNS-fragmens jön létre, ami torzíthatja az adottmRNS-ek könyvtárankénti számának vizsgálatát. Egy 3'- irányítottságú cDNS-könyvtár véletlenszerűen kiválasztotttagjait szekvenálták, s megállapították a különböző EST-kmegjelenési gyakoriságát. A gének osztályozása érdekében akülönböző sejttípusokból származó EST-k listájának összeha-sonlítását ajánlották. A sok sejttípusban expresszálódó gé-neket "housekeeper"-eknek, a bizonyos sejtekben specifiku- i san expresszálódókat pedig sejt-specifikusaknak nevezték,még akkor is, ha nem volt ismert a gén teljes szekvenciájavagy a géntermék biológiai aktivitása. A találmányunk szerinti megoldással kiküszöbölhetőka korábbi, hasonló célú eljárások hátrányai. A találmányszerinti eljárással - az egyes RNS-ek és/vagy a nekik meg-felelő cDNS-ek nagy átmenőteljesitményű, szekvencia-specifikus analízisével - meghatározható egy adott biológi-ai mintában lévő sok géntranszkriptum relatív gyakorisága. A találmány szerinti megoldás több előnyt is bizto-sít a jelenlegi - az egyes proteinek izolálását biológiaihatásaik alapján megkísérlő - proteinfeltáró eljárásokkalszemben. A találmány szerinti eljárás gyakorlati megvalósí-tásával lehetővé válik a sejt expressziós profiljainakrészletes diagnosztikai összehasonlítása, ami kimutatja azegyes transzkriptumok expressziójának számos változását. A találmány szerinti megoldás - jelenlegi kivonási eljárásokkal szembeni - előnyei közé tartozik a komplexebb 3 6 7 könyvtár-analízis (10' klón helyett 10 -10 klón), ami lehe-tővé teszi a kis előfordulási gyakoriságú, valamint a nö-vekvő vagy csökkenő gyakoriságú üzenetek azonosítását is.Ezek a nagy könyvtárak - a korábbi könyvtárakhoz képest - nagyon egyszerűen előállíthatok. A találmány szerinti eljá-rással a homológok is könnyen megkülönböztethetők. A találmány szerinti eljárás nagyon előnyös, mivelnagy mennyiségű adatot érthető és feldolgozható formátummá alakít. A leglényegesebb különbségeket az elektronikus ki- 10 vonással emeljük ki. A részletes analízisek így kényelme-sebben végezhetők. A találmány szerinti megoldás a cDNS-ek korábbielektronikus analízis-módszereivel szemben több előnytnyújt. Eljárásunk különösen hatásos, ha 100-nál, előnyösen1000-nél több géntranszkriptumot vizsgálunk. Ilyen esetek-ben új, kis gyakoriságú transzkriptumokat tárhatunk fel ésszövet-tipizálhatunk. A génexpresszió nagyfelbontású analízisét felhasz-nálhatjuk közvetlenül diagnosztikai profilként vagyklasszikusabb diagnosztikai módszerek kifejlesztésére al-kalmas - betegség-specifikus gének azonosítására.The use of Matsubara and Okubo partial cDNA sequences has been proposed for generating expression profiles of genes that can be used for functional analysis of the human genome. Matsubara and Okubo protested against the use of random chaining because of the formation of multiple DNA fragments from each mRNA, which could distort the examination of the number of specific mRNAs per library. Randomly selected members of a 3'-directed cDNA library were sequenced and found to have different EST-frequency. A comparison of the list of ESTs from different cell types was recommended to classify genes. The genes expressed in many cell types were called "housekeeper" and those expressing specific cells in some cells were cell-specific, even if the entire sequence of the gene or the biological activity of the gene product was not known. The present invention eliminates the disadvantages of prior art processes. By the method according to the invention, the relative frequency of many gene transcripts in a given biology sample can be determined by high throughput sequence-specific analysis of each RNA and / or their corresponding cDNAs. The present invention provides several advantages over the present method of isolating the individual proteins based on their biological effects by means of protein exploration processes. By practicing the method according to the invention, it is possible to make a detailed diagnostic comparison of the cell expression profiles, which shows a number of changes in the expression of single transcripts. Advantages of the present invention against current extraction processes include more complex 3 6 7 library analysis (10 to 10 clones instead of 10 'clones), which allow for low incidence rates and increasing or decreasing frequency. These large libraries - compared to previous libraries - can be very easy to produce. The process of the invention also makes it easy to distinguish homologs. The method according to the invention is very advantageous since it converts a large amount of data into an understandable and processable format. The most important differences are highlighted by the electronic feature. Detailed analyzes are thus more convenient. The present invention provides several advantages over prior electronic methods of analyzing cDNAs. Our procedure is particularly effective when more than 100, preferably more than 1000, gene transcripts are tested. In such cases, new, low frequency transcripts can be detected and tissue typed. High resolution analysis of gene expression can be used to identify disease-specific genes directly as a diagnostic profile or to develop more classical diagnostic methods.

Ezt az eljárást géntranszkriptum-gyakoriság-analízisnek, a géntranszkriptumok eredményként kapott kvantitatív analízisét pedig összehasonlító géntranszkrip- tum-analízisnek nevezzük. A találmány tárgyát képezi egy eljárás gén-transzkriptumokat tartalmazó minta vizsgálatára, melyneksorán (i) biológiai szekvenciákat tartalmazó könyvtárat ál-lítunk elő; (ii) transzkriptum-szekvencia-készletet hozunklétre, melyben minden egyes transzkriptum-szekvencia akönyvtárban lévő biológiai szekvenciák egy másikára utal;(iii) a transzkriptum-szekvenciákat programozott számító-géppel (melyben a referencia-szekvenciákra utaló referen-cia-transzkriptumszekvenciák adatbázisát tároljuk) feldol-gozzuk, hogy minden egyes transzkriptum-szekvenciára azono-sított szekvenciaértéket generáljunk, mely azonosítottszekvenciaértékek szekvencia-annotációra, illetve a könyv- 11 tárban lévő biológiai szekvenciák egyike és a referencia-szekvenciák legalább egyike közötti illeszkedés mértékéreutalnak; és (iv) valamennyi azonosított szekvenciaértéketfeldolgozzuk, hogy olyan végső adatértékeket kapjunk, ame-lyek jelzik, hogy az egyes azonosított szekvenciaértékekhányszor vannak jelen a könyvtárban. A találmány tárgyát képezi továbbá egy eljárás két- géntranszkriptumokat tartalmazó - minta összehasonlításá-ra. Az eljárás során az első mintát a fentiek szerint dol-gozzuk fel, míg a második mintát biológiai szekvenciák egymásodik könyvtárának előállításához használjuk, mely könyv-tárból transzkriptum-szekvenciák egy második készletét hoz-zuk létre, mely készletben minden egyes transzkriptum- szekvencia a második könyvtárban lévő biológiai szekvenciákegyikére utal. Ezután a transzkriptum-szekvenciák másodikkészletét programozott számítógéppel feldolgozzuk, hogyazonosított szekvenciaértékek egy második sorozatát - neve-zetesen a újabb azonosított szekvenciaértékeket - generál-juk, melyek mindegyike egy szekvencia-annotációra, és a má-sodik könyvtár egyik biológiai szekvenciája és a referen-cia-szekvenciák legalább egyike közötti illeszkedés mérté-kére utal. Az újabb azonosított szekvenciaértékeket feldol-gozva olyan újabb végső adatértékeket hozunk létre, amelyekjelzik, hogy az egyes újabb azonosított szekvenciaértékekhányszor vannak jelen a második könyvtárban. Az első mintá-ból származó végső adatértékeket és a második mintábólszármazó újabb szekvenciaértékeket feldolgozzuk, hogy meg-állapítsuk a transzkriptum-szekvenciák arányait, amely a 12 két mintában lévő géntranszkriptumok számának különbségeire utal. A találmány tárgyát képezi továbbá egy eljárás mRNSrelatív gyakoriságának meghatározására egy biológiai mintá-ban, melynek során (i) egy biológiai mintából mRNS-transzkriptumok populációját izoláljuk; (ii) szekvencia-specifikus eljárással azonosítjuk azokat a géneket, ame-lyekről az mRNS transzkripcióval átíródott; (iii) meghatá-rozzuk az egyes géneknek megfelelő mRNS-transzkriptumokszámát; és (iv) az mRNS-transzkriptumok számát az mRNS-transzkriptumok - mRNS-transzkriptumpopuláción belüli - re-latív gyakoriságának meghatározására alkalmazzuk.This method is referred to as gene transcript frequency analysis and the quantitative quantitative analysis of gene transcripts as a result of comparative gene transcription analysis. The present invention relates to a method for testing a sample of gene transcripts, wherein (i) a library comprising biological sequences is constructed; (ii) generating a set of transcript sequences in which each transcript sequence refers to another set of biological sequences in the library; processing a sequence value identified for each transcript sequence that identifies sequence sequences for sequence annotation, and alignment between one of the biological sequences in the library and at least one of the reference sequences; and (iv) processing all identified sequence values to obtain final data values that indicate that each identified sequence value is present in the library a few times. The invention further relates to a method for comparing a sample containing two-gene transcripts. In the process, the first sample is operated as described above, while the second sample is used to produce a sequence of biological sequences, from which a second set of transcript sequences is generated, each set of transcripts being in the second directory. refers to one of its biological sequences. The second set of transcript sequences are then processed with a programmed computer to generate a second sequence of identified sequence values, namely, newly identified sequence values, each of which is a sequence annotation, and a biological sequence of the second library and a reference sequence. refers to the degree of fit between at least one of the sequences. By processing the newly identified sequence values, new final data values are generated that indicate that each of the newly identified sequence values is present in the second directory. Final data values from the first sample and further sequence values from the second sample are processed to determine the ratios of transcript sequences that indicate differences in the number of gene transcripts in the two samples. The invention further relates to a method for determining the mRNA relational frequency in a biological sample in which (i) a population of mRNA transcripts is isolated from a biological sample; (ii) identifying, by a sequence-specific method, genes that have been transcribed by mRNA transcription; (iii) determining the number of mRNA transcripts corresponding to each gene; and (iv) the number of mRNA transcripts used to determine the relative frequency of mRNA transcripts within the mRNA transcript population.

Szintén a találmány tárgyát képezi egy eljárásgéntranszkriptumkép előállítására. Az eljárás során előszöregy mRNS-elegyet állítunk elő, amelyből cDNS-kópiákat ké-szítünk. A cDNS-t ezután alkalmas vektorba inszertáljuk,amelyet egy megfelelő gazdatörzs sejtjeinek transz-fektálásához alkalmazunk. A sejtekből kenetet készítünk, ésa sejteket kiónokká növesztjük, mely kiónok mindegyikeegyedi mRNS-t képvisel. cDNS-sel transzfektált kiónok rep-rezentatív populációját izoláljuk, mely populációban mindenegyes kiónt olyan szekvenciaspecifikus eljárással azonosí-tunk, amely azt a gént azonosítja, amelyből az egyedi mRNS átíródott. A géntranszkriptum gyakoriságának értékelése ér-dekében meghatározzuk, hogy az adott gént hányszor azonosí-tottuk egy klónnal. A géneket - előfordulási gyakoriságuk-kal együtt - a gyakoriságnak megfelelően sorba rendezvegéntranszkripciós képet hozunk létre. « « 13The invention also relates to a method for producing a gene transcript image. In the process, a first mRNA mixture is prepared from which cDNA copies are prepared. The cDNA is then inserted into a suitable vector used for transfection of cells of a suitable host strain. Cells are smeared and cells are grown into clones, each clone representing each mRNA. A reprotective population of clones transfected with cDNA is isolated, in which population each clone is identified by a sequence-specific method that identifies the gene from which the individual mRNA was transcribed. In order to evaluate the frequency of the gene transcript, it is determined how many times the gene has been identified with a clone. Genes - together with their frequency of occurrence - create a sequential order of transcriptional gene transcription according to frequency. «« 13

Az előző eljárás egy másik előnyös megvalósításimódja szerint egy sejttípusban vagy szövetben a gén-transzkriptumok relatív gyakoriságát - a különbségek és ha-sonlóságok azonosítása érdekében - egy másik sejttípusbanvagy szövetben lévő géntranszkriptumok relatív gyakoriságá-val hasonlítjuk össze. A találmány egy másik előnyös megvalósítási módjá-ban az eljárás biológiai szekvenciák könyvtárának vizsgála-ti rendszerét foglalja magában, amely a transzkriptum-szekvenciák készletének (melyben minden egyes transz-kriptum-szekvencia a könyvtárban lévő biológiai szekvenciákegy másikára utal) felfogásához alkalmas módszerből, és atranszkriptum-szekvenciák számítógépes rendszerben(amelyben a referencia-szekvenciákra utaló referencia-transzkriptumszekvenciák adatbázisát tároljuk) történő fel-dolgozásának módszeréből áll. A számítógépet az egyestranszkriptum-szekvenciákra vonatkozó azonosítottszekvenciaértékek (mely azonosított szekvenciaértékek mind-egyike egy szekvencia-annotációra, valamint a könyvtáregyik biológiai szekvenciája és a referencia-szekvenciáklegalább egyike közötti illeszkedésre utal) kialakításához, illetve - a könyvtárban az egyes azonosított szekvencia-értékek könyvtárban való jelenlétének gyakoriságára utalóvégső adatértékek kialakítása érdekében - az említett, azo-nosított szekvenciaérték feldolgozására alkalmas szoftver-rel programozzuk. A találmány tárgyát tehát lényegében egy eljárás ésegy rendszer képezi (egy biológiai mintában lévő 14 géntranszkriptumok relatív előfordulási gyakoriságánakmennyiségi meghatározására). A találmány tárgyát képezi to-vábbá egy eljárás két vagy több biológiai mintából származógéntranszkriptumkép összehasonlítására, mellyel a két mintamegkülönböztethető egymástól, és a két mintában különböző-képpen expresszálódó egy vagy több gén azonosítható. Ennekmegfelelően, a géntranszkriptumkép és összehasonlítása di-agnosztikai célra alkalmazható. Az eljárás egyik előnyösmegvalósítási módja szerint sok RNS vagy a nekik megfelelőcDNS-ek nagy átmenőteljesítményű, szekvenciaspecifikus ana-lízisét (géntranszkriptum-leképezés) végezzük. Az eljárásegy másik előnyös megvalósítási módja értelmében agéntranszkriptum-leképező-analízist nagy átmenőteljesítmé-nyű cDNS-szekvencia analízissel végezzük. Ezenkívül, kétvagy több géntranszkriptumkép összehasonlítása felhasznál-ható egy adott biológiai állapot vagy betegség (amely egyadott sejtben vagy sejtcsoportban a géntranszkriptumok re-latív gyakoriságával áll összefüggésben) detektálására vagydiagnosztizálására. A következőkben a táblázatokkal és az ábrákkal kap-csolatos tudnivalókat ismertetjük.According to another preferred embodiment of the previous method, the relative frequency of gene transcripts in a cell type or tissue is compared to the relative frequency of gene transcripts in another cell type or tissue to identify differences and similarities. In another preferred embodiment of the invention, the method comprises a library system of biological sequences which comprises a method for detecting a set of transcript sequences (wherein each transcript sequence refers to one of the biological sequence sequences in the library) and an atrancript. sequences consists of a method of processing a computer system (in which a database of reference transcript sequences referring to reference sequences is stored). The computer is used to identify the sequence sequences for the single-transcript sequences (each of which is a sequence annotation of the identified sequence values and the match between the biological sequence of one of the library sequences and one of the reference sequences), and the presence of each identified sequence value in the library in the library. To program the final data values referring to the frequency of the data, it is programmed with the software for processing said sequence sequence. The present invention therefore relates essentially to a method and one system (for determining the frequency of relative occurrence of 14 gene transcripts in a biological sample). The invention further relates to a method of comparing the transcript of a derivative of two or more biological samples by which the two samples can be distinguished from each other and one or more genes, which are expressed differently in the two samples, can be identified. Accordingly, the gene transcript and the comparison can be used for di-agnostic purposes. In a preferred embodiment of the method, many RNAs or their corresponding cDNAs are subjected to high throughput, sequence-specific analysis (gene transcription). In another preferred embodiment of the method, agen transcript mapping analysis is performed by high throughput cDNA sequence analysis. In addition, a comparison of two or more gene transcript images may be used to detect or diagnose a particular biological condition or disease (which is associated with the recurrent frequency of gene transcripts in a given cell or cell group). The following is information about the tables and figures.

Az 1. táblázatban a 2-5. táblázatokban használt be-tűkódok jelentését adjuk meg. A 2. táblázatban a 100 leggyakoribb géntransz-kriptumot soroljuk fel. Ez a felsorolás a későbbiekben le-írtak szerint előállított és szekvenált HUVEC-cDNS-könyv- tárból származó izolátumok egy részét tartalmazza. A balol-dali oszlopban szereplő számok a táblázatban felsorolt 15 szekvenciák gyakoriságának sorrendjét jelzik. A következő,"number" (szám) jelzésű oszlopban az " entry" oszlopban lévőszekvenciával egyező első HUVEC-szekvencia azonosító refe-rencia klónszámát adjuk meg. Nem szekvenált izolátumokat a2. táblázatban nem tüntettünk fel. A következő, " N" jelzésűoszlopban az "entry" (bejegyzés) oszlopban szereplő refe-rencia-transzkriptum szekvenciájával azonos mértékű illesz-kedést mutató cDNS-ek összes számát tüntettük fel.In Table 1, see Figures 2-5. tables are used. Table 2 lists the 100 most common gene transcripts. This list contains some of the isolates obtained from the sequenced HUVEC cDNA library as described below. The numbers in the balol column indicate the order of frequency of the 15 sequences listed in the table. In the next column, "number", the reference reference clone number of the first HUVEC sequence corresponding to the sequence in the "entry" column is given. Non-sequenced isolates a2. not shown in table. In the next column, "N", the total number of cDNAs with the same alignment as the reference transcript sequence in the "entry" column is shown.

Az "entry" jelzésű oszlopban a "NIH GENBANK"lókusznevet adjuk meg, amely megfelel a könyvtárszekvenciaszámainak. Az "s" oszlopban néhány helyen feltün-tetett betű azt a fajt jelöli, amelyből a referencia-szekvencia származik (az " s" oszlopra vonatkozó kódokat az 1. táblázatban adjuk meg). A "descriptor" (leíró elem) jel-zésű oszlopban az "entry" oszlopban feltüntetett "NIHGENBANK" lókusznévnek megfelelő szekvencia közérthető (dekódolt) elnevezését adjuk meg. A 3. táblázatban a normális monocitákban és akti-vált makrofágsejtekben előforduló 15 leggyakoribb gén-transzkriptum összehasonlítását mutatjuk be. A 4. táblázatban a THP-1- és a humán makrofág-cDNS-szekvenciákat összehasonlító könyvtár-kivonásos analízis áttekintését mutatjuk be. Ebben a táblázatban ugyanazokat akódokat használjuk, mint a 2. táblázatban. Újabb oszlopkéntszerepel a "bgfreq" [gyakorisági szám a kivonókönyvtárban(" subtractant library"] , az ” rfend" (gyakorisági szám acélkönyvtárban) és a "ratio" (célkönyvtár gyakorisági számaosztva a kivonókönyvtár gyakorisági számával). A táblázat 16 figyelmes áttanulmányozása után nyilvánvaló, hogy amennyi-ben a kivonókönyvtárban a gyakorisági szám "0", a célkönyv-tárban megfigyelt gyakorisági számot 0,5-dal osztjuk. Mivel0-val nem oszthatunk, ez az egyik módja annak, hogy ered-ményt kapjunk, és hogy az eredményt megkülönböztessük azok-tól az arányoktól, amelyeket a kivonókönyvtár 1-es gyakori-sági száma esetében kapunk.In the column "entry", enter the "NIH GENBANK" locus, which corresponds to the directory sequence numbers. The letter "s" in some places indicates the species from which the reference sequence is derived (the codes for column "s" are given in Table 1). In the column labeled "descriptor", a clear (decoded) name of the sequence corresponding to the "NIHGENBANK" locus in the "entry" column is given. Table 3 shows a comparison of the 15 most common gene transcripts occurring in normal monocytes and activated macrophage cells. Table 4 provides an overview of a library extraction analysis comparing THP-1 and human macrophage cDNA sequences. In this table we use the same codes as in Table 2. A new column number is called "bgfreq" [frequency number in the subtractant library], "rfend" (frequency number in the steel directory) and "ratio" (target directory frequency divided by the frequency of the extraction library). how often the frequency number "0" in the extract directory is divided by the frequency number observed in the target directory. Since we cannot divide by 0, this is one way to get results and to distinguish the result the proportions that are obtained for the frequency number 1 of the extraction library.

Az 5. táblázatban a géntranszkriptum-kivonási pro-filok kialakításához alkalmas - forráskódban írt - számító- gépes programot mutatjuk be. A 6. táblázatban a találmány szerinti elektronikus"northern-blot"-analízisben használt adatbázis-bejegyzésekrészleges felsorolását adjuk meg.Table 5 shows a computer program written in source code for generating gene transcription protocols. Table 6 shows a partial listing of database entries used in the electronic "northern blot" analysis of the invention.

Az 1. ábrán a könyvtárkészítés szekvenciaelő-állítási és vizsgálati részére vonatkozóan összegyűjtött éstárolt adatokat összegző folyamatábra látható. A 2 . ábrán a találmány bizonyos előnyös megvalósí-tásai módjaiban "gyakoriságrendező"-szoftverrel végzett mű-veletek folyamatábráját mutatjuk be. A 3. ábrán a találmány szerinti rendszer egy elő-nyös megvalósítási módjának blokkdiagramját mutatjuk be. A 4. ábrán a bioinformatikai eljárás részletesebbblokkdiagramját mutatjuk be, az új (már szekvenált, de nemazonosított) szekvenciától a transzkriptum-leképező analí-zis eredménylistájáig. A találmány szerinti megoldás kidolgozása során cé-lul tűztük ki egy olyan eljárás kifejlesztését, amellyelkülönböző biológiai mintákban lévő géntranszkriptumok rela- 17 tív előfordulási gyakorisága - az egyes RNS-ek vagy a nekikmegfelelő cDNS-ek (vagy más lehetőség szerint, más biológi-ai szekvenciákat reprezentáló adat) nagy átmenő-teljesítményű analízisének alkalmazásával - összehasonlít-ható. Ezt az eljárást géntranszkriptum-leképezésnek nevez-zük. A géntranszkriptumok készletére vonatkozó relatív elő-fordulási gyakoriság mennyiségi analízisét "géntransz-kriptum-leképezési analízisnek" vagy "géntranszkriptum-gyakorisági analízisnek" nevezzük. A találmány szerintimegoldás gyakorlati megvalósításával bármilyen organizmus-ból származó bármilyen sejtcsoportban vagy szövetben megha-tározható a géntranszkripció profilja. A találmány szerintimegoldás egyetlen sejtből (vagy egyetlen sejt kiónjaiból),sok sejtből vagy több sejttípust tartalmazó szövetből álló minta profiljának meghatározására alkalmas. A találmány szerinti megoldás jelentős előnyöket vonultat fel, többek között a diagnosztika, toxikológia ésfarmakológia terén. Beteg (nem diagnosztizált) páciensenigen kifinomult diagnosztikai tesztet végezhetünk. A páci-ens testfolyadékaiból vagy szöveteiből álló biológiai min-tát készítünk, a mintában lévő géntranszkriptumokat izolál-juk, és azonosításukhoz szükséges mértékben felszaporítjuk.Adott esetben a géntranszkriptumok cDNS-sé alakíthatók át.A géntranszkriptumok egy mintáját szekvenciaspecifikus ana-lízisnek és mennyiségi meghatározásnak vetjük alá. A kapotttranszkriptum-szekvencia-gyakoriságokat a referencia adat-bázisban lévő szekvencia-gyakoriságokkal (beleértve a betegvagy egészséges páciensek normál adatsorait) hasonlítjuk 18Figure 1 is a flowchart summarizing the stored data collected for the sequence generation and testing portion of library creation. THE 2 . FIG. 1A illustrates a flowchart of operations with "frequency organizer" software in certain embodiments of the present invention. Figure 3 is a block diagram of a preferred embodiment of the system according to the invention. Figure 4 shows a more detailed block diagram of the bioinformatics method, from the new (already sequenced but not identified) sequence to the transcript mapping analysis result list. In the development of the present invention, it is an object of the present invention to provide a method for relatively occurring the gene transcripts of different biological samples, each RNA or the corresponding cDNAs (or, alternatively, other biological sequences). representative data) using high throughput analysis - comparable. This procedure is called gene transcription. Quantitative analysis of the relative prevalence of the gene transcript set is referred to as "gene transcription mapping" or "gene transcript frequency analysis". By practicing the present invention, the gene transcription profile of any cell group or tissue from any organism can be determined. According to the invention, the solution is suitable for determining a profile of a sample of a single cell (or clones of a single cell), a plurality of cells, or a tissue comprising multiple cell types. The present invention provides significant advantages in terms of diagnostics, toxicology, and pharmacology. We can perform a sophisticated diagnostic test for a patient (not diagnosed). A biological sample consisting of body fluids or tissues of the patient is prepared, the gene transcripts in the sample are isolated and amplified to the extent necessary for their identification. below. The hatch transcript sequence frequencies are compared to the sequence frequencies in the reference data base (including normal data from patient or healthy patients) 18

I össze. A páciens abban (azokban) a betegség(ek)ben szenved,amellyel (amelyekkel) a páciens adatsora a legközelebbi ha-sonlóságot mutatja. A géntranszkriptum-gyakoriság-analízis, például,normális sejtek vagy szövetek beteg sejtektől vagy szöve-tektől történő megkülönböztetésére alkalmazható, mint ahogykiemeli a normális monociták és az aktivált makrofágok kö-zötti különbségeket is (ld. 3. táblázat). A toxikológiában alapvető kérdés, hogy mely teszteka leghatásosabbak egy toxikus hatás előrejelzésében vagykimutatásában. A géntranszkriptum-leképezés igen részletesinformációkat nyújt a sejtről és a szövet-környezetről, me-lyek némelyike a hagyományos, kevésbé részletes szkrinelésieljárások alkalmazásával nem lennének hozzáférhetők. Agéntranszkriptum-leképezés a gyógyszer-hatóanyagok toxici-tása és hatékonysága előrejelzésének - korábbi eljárásokhozképest - hatásosabb módja. A géntranszkriptum-leképezésfelhasználható olyan protein-kategóriák szelektív keresésé-re, amelyek feltételezhetően befolyásolják, például, a to- xinokat lebontó enzimeket. A találmány egy másik megvalósítási módja szerintaz összehasonlító géntranszkriptum-gyakorisági analízisrákellenes szerekre reagáló, illetve azokra nem reagálóráksejtek megkülönböztetésére alkalmazható. A rákellenes szerek példái közé tartoznak a tamoxifen, vinkrisztin,vinblasztin, a podophyllotoxinok, az etoposid, tenisposid,cisplatin, a biológiai reakciókat módosító anyagok, pl. in-terferon, IL-2, GM-CSF, enzimek, hormonok és hasonlók. Ez 19 az eljárás előnyös módját biztosítja a géntranszkriptumokfunkcionális kategóriák szerinti osztályozásának is. A rák-sejtek esetében a transzkripciós faktorok vagy más, esszen-ciális szabályozómolekulák nagyon lényeges kategóriáit ké-pezik a különböző könyvtárak analízisének. A találmány egy további megvalósítási módja szerintaz összehasonlító transzkriptum-gyakoriság-analízist kont-roll májsejtek és - kísérleti gyógyszerekkel (pl. FIAU-val)kezelt páciensekből izolált - májsejtek megkülönböztetésérealkalmazzuk, hogy különbséget tegyünk az alapul szolgálóbetegség okozta patológia és a gyógyszer okozta patológia között. A találmány egy további megvalósítási módja értel-mében az összehasonlító géntranszkriptum-gyakoriság-ana-lízist lítiummal kezelt, illetve lítiummal nem kezelt páci-ensek agyszövetének megkülönböztetésére alkalmazzuk. A találmány egy másik megvalósítási módja szerintaz összehasonlító géntranszkriptum-gyakoriság-analízistciklosporinnal és FK506-tal kezelt sejtek, illetve normálissejtek megkülönböztetésére alkalmazzuk. A találmány egy további megvalósítási módja szerint az összehasonlító géntranszkriptum-gyakoriság-analízist ví-russal fertőzött (köztük HIV-vírussal fertőzött) humán sej-tek és nem fertőzött humán sejtek megkülönböztetésére al-kalmazzuk. A géntranszkriptum-gyakoriság-analízist HIV-I put together. The patient suffers from the disease (s) with which the patient's series of data shows the closest similarity. Gene transcript frequency analysis, for example, can be used to distinguish normal cells or tissues from patient cells or tissues, as well as the differences between normal monocytes and activated macrophages (see Table 3). The key issue in toxicology is which test is most effective in predicting or demonstrating a toxic effect. Gene transcription imaging provides very detailed information about the cell and tissue environment, some of which would not be available using conventional, less detailed screening procedures. Agenic transcription imaging is a more effective way of predicting the toxicity and efficacy of drug drugs, as is the case with previous methods. Gene transcription can be used to selectively select protein categories that are supposed to affect, for example, enzymes that degrade toxins. Another embodiment of the invention may be used to distinguish between serotonin comparative gene transcript frequency anti-cancer agents and non-responsive cancer cells. Examples of anticancer agents include tamoxifen, vincristine, vinblastine, podophyllotoxins, etoposide, tenisposide, cisplatin, biological modifiers, e.g. interferon, IL-2, GM-CSF, enzymes, hormones and the like. This provides the preferred method for classifying the gene according to functional categories of gene transcripts. In the case of cancer cells, transcription factors or other essential regulatory molecules form very important categories for the analysis of different libraries. Another embodiment of the invention is to compare serine synthase transcript frequency control with liver cell and to distinguish liver cells isolated from patients treated with experimental drugs (e.g., FIAU) to distinguish between pathology caused by underlying disease and drug-induced pathology. In a further embodiment of the invention, comparative gene transcript frequency analysis is used to differentiate brain tissue from lithium-treated or lithium-treated patients. Another embodiment of the invention is used to distinguish serine synthesized gene transcript frequency analysis cyclosporin and FK506-treated cells or normal cells. In a further embodiment of the invention, the comparative gene transcript frequency analysis is used to differentiate human cells infected with virus (including HIV virus) and non-infected human cells. Frequency analysis of gene transcription in HIV \ t

rezisztens, HIV-fertőzött és HIV-szenzitív sejtek gén-transzkriptumainak gyors átvizsgálására is alkalmazzuk. A 20 géntranszkriptum-gyakoriság összehasonlítása jelzi a keze-lés sikerét és/vagy az új vizsgálati lehetőségeket.It is also used for rapid screening of gene transcripts of resistant, HIV-infected and HIV-sensitive cells. A comparison of the frequency of the 20 gene transcripts indicates the success of the treatment and / or the new test options.

Egy másik megvalósítási mód szerint, az összehason-lító géntranszkriptum-gyakoriság-analízist egészséges és különböző betegségektől szenvedő személyekből származó hör-gőöblítő folyadékok megkülönböztetésére alkalmazzuk.In another embodiment, comparative gene transcript frequency analysis is used to differentiate between rumen flushing fluids from individuals suffering from various diseases.

Egy másik megvalósítási mód értelmében az összeha-sonlító géntranszkriptum-gyakoriság-analízist mutáns és vadtípusú - növényi, mikrobiális és állati - sejtek megkülön-böztetésére alkalmazzuk. Ezenfelül, a transzkriptum- gyakorisági programot úgy adaptáltuk, hogy egy gén transz-kripcióját sok különböző szövetben lehessen értékelni. Azilyen összehasonlításokkal azonosíthatók a génterméket nem termelő deléciós mutánsok, illetve a ritkább előfordulásúvagy más szempontból eltérő üzeneteket kialakító pontmután-sok. Az ilyen mutációk befolyásolhatják az alapvető bioké-miai és farmakológiai folyamatokat, mint pl. az ásványi táplálkozást és anyagcserét, és az ilyen mutációkat a szak-emberek izolálhatják. Ilyenformán, nagyobb hozamú, rovar- kártevőkkel szemben rezisztenciát mutató, és más előnyöstulajdonságokkal rendelkező haszonnövények fejleszthetők ki. A találmány egy másik megvalósítási módja szerintaz összehasonlító géntranszkriptum-gyakoriság-analízist fa-jok közötti összehasonlító analízisként alkalmazzuk, amelyjobb gyógyszerészeti állatmodellek kiválasztását teszi le-hetővé. E megvalósítási mód értelmében embereket és más ál-latokat (pl. egeret) vagy tenyésztett sejtjeiket specifikus 21 tesztelő ágenssel kezeljük, és meghatározzuk az egyes DNS-populációk relatív szekvencia-gyakoriságát. Amennyiben azállati tesztrendszer jónak bizonyul, az állati cDNS-populáció homológ génjei hasonlóan változtatják meg azexpressziót, mint a humán sejtekben lévő gének. Amennyibena gyógyszerrel kapcsolatban mellékhatások merülnek fel, agéntranszkriptum-változások átvizsgálására részletes transzkriptum-gyakoriság-analízist végzünk. A modelleketezután alapvető fiziológiai változások összehasonlításával értékeljük. A találmány egy másik megvalósítási módja szerintaz összehasonlító géntranszkriptum-gyakoriság-analízistegy páciens sejtjeinek vagy szövetének (pl. vérmintájának)igen részletes géntranszkriptum-profiljának kialakítása ér-dekében - klinikai környezetben alkalmazzuk. Közelebbről, agéntranszkriptum-gyakoriság-analízist egy betegséggel kap-csolatos állapotra jellemző, nagy felbontású génexpressziós profil kialakítására alkalmazzuk. A találmány előnyös megvalósítási módja szerint azeljárás során - a kérdéses specifikus transzkriptumok azo-nosítására - nagy átmenőteljesítményű cDNS-szekvenálást al-kalmazunk. Ezután a kialakított cDNS-t és a leszármaztatott aminosav-szekvenciákat a "GENBANK" vagy más szekvencia-adatbankok szekvenciáival hasonlítjuk össze, amint azt azalábbiakban leírjuk. A találmány szerinti eljárás a jelen-legi, kétdimenziós gélkromatográfiás módszereken alapuló(egy bizonyos biológiai hatás kialakításában szerepet ját-szó egyes proteinek azonosítását célzó) proteinfeltárási 22 eljárásokkal szemben több előnyt biztosít. A találmány sze-rinti eljárás gyakorlati megvalósítása során az aktivált ésinaktív sejtek profiljainak összehasonlítása az egyestranszkriptumok expressziójának számos változását mutatjaki. Miután meghatároztuk, hogy az adott szekvencia pontosilleszkedésű, hasonló illeszkedésű vagy nem illeszkedő, aszekvenciát felvesszük az adatbázisba. Ezután az egyes gé-neknek megfelelő cDNS-kópiák számát táblázatba foglaljuk.In another embodiment, comparative gene transcript frequency analysis is used to differentiate between mutant and wild-type plant, microbial and animal cells. In addition, the transcript frequency program has been adapted to evaluate transcription of a gene in many different tissues. Such comparisons can identify deletion mutants that do not produce the gene product, or point mutants that produce less frequent or different messages. Such mutations may affect basic biochemical and pharmacological processes, such as the use of the enzyme. mineral nutrition and metabolism, and such mutations can be isolated by those skilled in the art. Thus, crops with higher yields, resistance to insect pests and other advantages can be developed. Another embodiment of the invention is to use serine comparative gene transcript frequency analysis as a tree comparative analysis that allows the selection of better pharmaceutical animal models. In this embodiment, humans and other animals (e.g., mice) or their cultured cells are treated with a specific 21 testing agent and the relative sequence frequency of each DNA population is determined. If the animal test system proves to be good, the homologous genes of the animal cDNA population change expression similarly to genes in human cells. As far as drug-related side effects are concerned, detailed transcript frequency analysis is performed to screen for changes in brain transcript. We evaluate the model thesaurus by comparing basic physiological changes. Another embodiment of the invention is to use a highly detailed gene transcript profile of a patient's cell or tissue (e.g., blood sample) in a serine synthesis gene transcript frequency analysis assay in a clinical setting. Specifically, agen transcript frequency analysis is used to generate a high-resolution gene expression profile specific to a disease-related condition. In a preferred embodiment of the invention, high throughput cDNA sequencing is used to identify the specific transcripts in question. The resulting cDNA and derived amino acid sequences are then compared to sequences of "GENBANK" or other sequence databases as described below. The method according to the invention provides several advantages over protein detection methods 22 based on presently known two-dimensional gel chromatographic methods (to identify certain proteins in a particular biological activity). In the practice of the inventive method, comparing the profiles of activated and inactive cells shows several changes in the expression of single transcripts. Once we have determined that the given sequence is accurate, similar or non-matching, we add the sequence to the database. The number of cDNA copies corresponding to each gene is then plotted.

Mivel ennek manuális módszerrel történő elvégzése idő- ésmunkaigényes, ezen információk táblázatba foglalásának elő-nyös és gyors módját jelenti a számítógépes programmal vég-zett rendszerezés. A cDNS-kópiák (adott esetben az adatsor-ban lévő szekvenciák összes számával osztott) száma képetnyújt az egyes gének transzkriptumainak relatív gyakorisá-gáról. A képviselt gének listáját ezután a cDNS-populációban megfigyelt gyakoriság alapján csoportosíthat-juk. Az összehasonlítás számos további típusa lehetséges,melyek példáit az alábbiakban írjuk le.Since it is time-consuming and time-consuming to perform this manually, it is a good and quick way to put this information into a table by organizing with a computer program. The number of cDNA copies (optionally divided by the total number of sequences in the data series) depicts the relative frequency of transcripts of each gene. The list of represented genes can then be grouped according to the frequency observed in the cDNA population. There are many other types of comparison, examples of which are described below.

Egy géntranszkriptumkép kialakításának másik eljá-rása során a teszt-mRNS-ből mintát készítünk, és - a teszt-mRNS-ek közül legalább néhánnyal komplementer szekvenciájú- egyedi próbák reprezentatív sorozatát hozzuk létre, majd a sorba rendezett próbákhoz a teszt-mRNS rögzített mennyi-ségét adjuk. A teszt-mRNS-t - a hibridizációhoz elégségesideig - inkubáljuk a próbákkal, kimutatjuk az mRNS-próba-hibrideket, s meghatározzuk mennyiségüket. A hibrideket apróbasorozatban mutatott elhelyezkedésük alapján azonosít-juk. Az egyes hibridek mennyiségét összeadva populációszá- 23 mot kapunk. Minden egyes hibridmennyiséget a populációszám-mal osztunk, miáltal géntranszkriptum-leképező analízis el-nevezésű relatív gyakorisági adatsort kapunk. A következő példákat a találmány szerinti megoldásillusztrálása, és nem a találmány tárgyának korlátozásacéljából írjuk le. 1. példaIn another method of constructing a gene transcript image, a sample of test mRNA is prepared, and - a representative sequence of unique probes complementary to at least some of the test mRNAs is generated, and the test mRNA is fixed for the queued probes. We give it its \ t The test mRNA was incubated with probes for a sufficient time to hybridize, and mRNA probe hybrids were detected and quantified. Hybrids are identified by their location in a small series. The sum of the individual hybrids is summed up by the population. Each hybrid quantity is divided by the population number to give a relative frequency series of gene transcription mapping analysis. The following examples are provided to illustrate the invention and not to limit the scope of the present invention. Example 1

Szövet-források és sejtvonalak A találmány szerinti - számítógépes programmal vég-zett - analízishez gyakorlatilag bármilyen forrásból szár-mazó biológiai szekvenciát alkalmazhatunk. A legelterjed-tebbek az emberi testből vett szövetek. Bármilyen szervből,bármilyen korú, bármilyen abnormalitással rendelkező donor-ból vagy bármilyen immortalizált sejtvonalból nyerhetünkszöveteket. Bizonyos esetekben az immortalizált sejtvonalak- sejttípus tekintetében mutatott tisztaságuk miatt - elő-nyösek lehetnek; az egyéb szövetminták mindig kevert sejt-típusokat tartalmaznak. Rendelkezésre áll egy speciálistechnika egyetlen sejt (pl. agyvelősejt) kinyerésére és acelluláris gépezet olyan célú felhasználására, hogy a ta-lálmány szerinti technikákkal és analízissel végzettszekvenáláshoz elégséges cDNS-t termeljen (vö. 5,021,335 és5,168,038 számú Egyesült Államok-beli szabadalmi leírás,melyeket teljes terjedelmükben a kitanítás részének kell tekinteni). Az alábbiakban leírt példákban a következőimmortalizált sejtvonalakat alkalmaztuk: monocita-szerű U-937-sejtek; aktivált makrofág-szerű THP-l-sejtek; indukált 24 érfali belhámsejtek (HUVEC-sejtek) ; és hízósejt-szerű HMC-1-sej tek.Tissue Sources and Cell Lines A biological sequence derived from virtually any source can be used for computer-aided analysis according to the invention. The most widespread are tissues from the human body. Tissue can be obtained from any organ of any age, any donor with abnormalities or any immortalized cell line. In some cases, they may be advantageous because of their purity as regards immortalized cell lines; other tissue samples always contain mixed cell types. There is a specialized technique for extracting a single cell (e.g., a cerebral cell) and using an acellular machine to produce sufficient cDNA for sequencing by techniques and analysis according to the invention (cf. U.S. Patent Nos. 5,021,335 and 5,168,038, which are incorporated herein by reference). should be considered as part of the teaching in its entirety). In the examples described below, the following immortalized cell lines were used: monocyte-like U-937 cells; activated macrophage-like THP-1 cells; induced 24 vascular endothelial cells (HUVEC cells); and mast cell-like HMC-1 cells.

Az U-937-sejtvonal monocita tulajdonságokkal ren-delkező humán hisztiocitikus lymphoma-sejtvonal, melyet diffúz hisztiocitás lymphomában szenvedő páciens pleurális effúziójából alakítottak ki [ Sundstrom, C. és Nilsson, K. :The U-937 cell line is a human histitocytic lymphoma cell line with monocyte properties developed by pleural effusion of a patient suffering from diffuse histocytic lymphoma [Sundstrom, C. and Nilsson, K.:

Int. J. Cancer 17, 565 (1976)] . Az U-937-sejtvonal a hisztiocita-sejtek morfológiájával, citokémiájával, felüle-ti receptoraival és monocita-szerű tulajdonságaival rendel-kező néhány humán sejtvonal egyike. Ezek a sejtek a végsőmonocitikus differenciálódás irányába indukálhatok, és ve-gyes humán limfocita-tenyészet felülúszójával aktiválva újsejtfelületi molekulákat expresszálnak. Az ilyen típusú invitro aktiválás hatására a sejtek morfológiai és funkcioná-lis változásokon mennek át, belértve az eritroid és tumor célsejtek elleni antitest-dependens celluláris cito-toxicitás (ADCC) (a makrofágok egyik elsődleges funkciója) fokozódását. Az U-937-sejtek forbol-12-mirisztát-13-acetáttal (PMA) végzett in vitro aktiválása több vegyület,köztük a prosztaglandinok, leukotriének és a vérlemezke- aktiváló faktor (PAF) - melyek hatásos gyulladás-közvetítők -, termelődését serkenti. Ilyenformán, az U-937 sejtvonal igen alkalmas a normális monocitákkal kapcsolatos gén-transzkriptumok azonosítására és izolálására. A HUVEC-sejtvonal emberi köldökvénából származó,korai passzálású, normális, homogén, jól karakterizáltbelhámsejt-tenyészet (Cell Systems Corp., 12815 NE 124thStreet, Kirkland, WA 98034) . Csak az indukált vagy kezelt 25 HUVEC-sejtekből származó géntranszkriptumokat szekvenáltuk.Egy 1 x 108 sejtes adagot a betakarítás előtt 5 órán át 1E/ml rIL-lb-vel és 100 ng/ml E.coli-lipopoliszacharid-(LPS)-endotoxinnal kezeltünk. Egy másik, 2 x 108 sejtettartalmazó adagot konfluens állapotban, a betakarítás előtt4 E/ml TNF-fel és 2 E/ml gamma-interferonnal (gamma-IFN) kezeltünk. A THP-1-sejtvonal egy leukémiás sejtvonal, amely elhatárolható monocitikus tulajdonságokat mutat. Ez a sejt-vonal akut monocitás leukémiában szenvedő egyéves fiú véré-ből származik [ Tsuchiya, S. és mtsai.: Int. J. Cancer 171(1980)] . A sejtvonal monocitikus természetének meghatározá-sára a következő citológiai és citokémiai kritériumokat al-kalmaztuk: (1) nátrium-fluoriddal gátolható a-naftil- butirát-észteráz-aktivitás jelenléte; (2) lizozimtermelés; (3) latexrészecskék és szenzitizált juh-vörösvérsejtek(SRBC) fagocitózisa; és (4) a mitomicin-C-vel kezelt THP-1-sejtek (konkanavalin-A-val kezelt) T-limfocitákat aktiválóképessége. A THP-l-sejtek citoplazmája kisméretű azurofilszemcséket tartalmazott, a sejtmag fogazott, és mély begyű- rődések miatt szabálytalan alakú volt. Ez a sejtvonal Fc- és C3b-receptorokat tartalmaz, melyek valószínűleg afagocitózisban játszanak szerepet. A 12-o-tetradekanoil- forbol-13-acetáttal (TPA) kezelt THP-l-sejtek proli-ferációja leáll, és makrofág-szerű sejtekké differenciálód-nak, melyek több vonatkozásban a természetes, monocita-eredetű makrofágokat utánozzák. A sejtek alakváltozásakor asejtmag még szabálytalanabb lesz, és a citoplazmában újabb • · · · · · · • · · · • · · · · • ·· ····· «· · · · - 26 - fagocitózisos vakuolumok jelennek meg. A differenciálódottTHP-l-sejtek a szövettenyésztő műanyagtálcához fokozottmértékben tapadnak. A HMC-l-sejtek (emberi hízósejt-vonal) a Mayo kli-nika hízósejt-leukémiás betegének perifériás véréből szár-mazik [ Leukémia Rés. 12, 345 (1988)] . A tenyészetben lévő sejtek az éretlen, klónozott egér-hízósejtekhez hasonlómegjelenésűek, hisztamint tartalmaznak, és klór-ecetsav-észterázra, amino-kapronsav-észterázra, eozinofil fő-bázikus-proteinre (MBP) és triptázra pozitív festődést mu-tatnak. A HMC-l-sejtek elvesztették normális IgE-recep-torokat szintetizáló képességüket. A páciensből eredetileg- leukoforézissel - begyűjtött HMC-l-sejtek 10;16 transzlo-kációt mutatnak, ami nem a tenyésztés során jön létre.Ilyenformán, a HMC-l-sejtek jó hízósejt-modellt képeznek. 2. példa cDNS-könyvtárak előállítása A könyvtárak közötti összehasonlításhoz a könyvtá-rakat hasonló módon kell előállítani. Bizonyos paraméterekellenőrzése különösen lényeges. Az egyik ilyen paraméter azmRNS izolálási eljárása. Fontos, hogy az összehasonlításikönyvtárakból a DNS és a heterogén sejtmagi RNS eltávolítá-sához azonos feltételeket alkalmazzunk. A cDNS méret sze-rinti frakcionálását óvatosan kell végezni. Az összehason-lítandó könyvtárak készítéséhez előnyösen azonos vektortkell alkalmazni, végül, az eredményes összehasonlítás érde-kében azonos típusú vektort (pl. egyirányú vektort) kell 27 alkalmazni. Az egyirányú vektor alkalmazása előnyös lehet akimenet ("output") egyszerűbb vizsgálata szempontjából is.Int. J. Cancer 17: 565 (1976)]. The U-937 cell line is one of a few human cell lines with morphology, cytochemistry, surface receptors and monocyte-like properties of hystocytes. These cells can be induced towards final monocytic differentiation and activated with supernatant of a human lymphocyte culture to express new cell surface molecules. As a result of this type of invitro activation, the cells undergo morphological and functional changes, including an increase in antibody-dependent cellular cytotoxicity (ADCC) (a primary function of macrophages) against erythroid and tumor target cells. In vitro activation of U-937 cells by forbol-12-myristate-13-acetate (PMA) stimulates the production of several compounds, including prostaglandins, leukotrienes, and platelet activating factor (PAF), which are potent inflammatory mediators. Thus, the U-937 cell line is well suited for the identification and isolation of gene transcripts associated with normal monocytes. The HUVEC cell line is an early passage, normal, homogeneous, well characterized endothelial cell culture from human umbilical vein (Cell Systems Corp., 12815 NE 124thStreet, Kirkland, WA 98034). Only the gene transcripts from the induced or treated 25 HUVEC cells were sequenced. A 1 x 108 cell dose was treated with 1E / ml rIL-1b and 100 ng / ml E.coli-lipopolysaccharide (LPS) endotoxin for 5 hours prior to harvest. . Another 2 x 108 cell-containing dose was treated in confluent state prior to harvest with 4 U / ml TNF and 2 U / ml gamma-IFN (gamma-IFN). The THP-1 cell line is a leukemic cell line that exhibits distinct monocytic properties. This cell line is derived from the blood of a one-year-old boy with acute monocytic leukemia (Tsuchiya, S. et al., Int. J. Cancer 171 (1980)). The following cytological and cytochemical criteria were used to determine the monocytic nature of the cell line: (1) the presence of sodium fluoride-inhibited α-naphthyl butyrate esterase activity; (2) lysozyme production; (3) phagocytosis of latex particles and sensitized sheep red blood cells (SRBC); and (4) the potency of activating the T lymphocytes of mitomycin-C treated THP-1 cells (concanavalin A treated). The cytoplasm of THP-1 cells contained small azurophilic particles, the nucleus was toothed and was irregularly shaped due to deep collections. This cell line contains Fc and C3b receptors, which are probably involved in afagocytosis. Proliferation of THP-1 cells treated with 12-o-tetradecanoyl phorbol-13-acetate (TPA) stops and differentiates into macrophage-like cells that mimic the natural monocyte-derived macrophages in several respects. When the cells are deformed, the seed core becomes even more irregular, and phagocytosis vacuoles appear in the cytoplasm with new ones. Differentiated THP-1 cells adhere to the tissue culture tray at an increased level. HMC-1 cells (human mast cell line) originate from peripheral blood of a Mayo Clinic mast cell leukemia patient [Leukemia Slot. 12, 345 (1988)]. Cells in culture have similar appearance to immature, cloned mouse mast cells, contain histamine, and exhibit positive staining for chloroacetic acid esterase, amino-caproic acid esterase, eosinophil major base protein (MBP) and tryptase. HMC-1 cells have lost their ability to synthesize normal IgE receptors. HMC-1 cells collected originally from the patient by leukophoresis show 10, 16 translations that do not occur during culture. Thus, HMC-1 cells form a good mast cell model. Example 2: Production of cDNA libraries In order to compare libraries, the library should be produced in a similar manner. Checking some parameters is particularly important. One such parameter is the process of isolating mRNA. It is important to use the same conditions for removing DNA and heterogeneous nuclear RNA from the reference libraries. CDNA size fractionation fractionation should be done with caution. To construct libraries to be compared, it is preferable to use the same vector clock, and finally to use the same type of vector (e.g., one-way vector) for effective comparison. The use of a one-way vector may be advantageous in terms of simpler testing of output.

Annak érdekében, hogy a cDNS-ek kinyerésekor mRNS-transzkriptumonként csak egyetlen kiónt kapjunk, a láncin-dításhoz előnyösen egyirányú oligo-dT-láncindítót alkalma-zunk. Ismert, hogy - amikor gének feltárása is cél - oligo-dT és random láncindítók elegyének alkalmazása is előnyöslehet, mivel az ilyen elegy nagyobb szekvencia-diverzitásteredményez. Hasonló hatások érhetők el a DR2-vel (Clontech)és a HXLOX-szal (U.S. Biochemical), valamint az Invitrogenés a Novagen vektoraival. Ezeknek a vektoroknak két felté-telnek kell eleget tenniük: a szokványos láncindítók (pl.T3- vagy M13-reverz-láncindítók) számára láncindító-helyet kell tartalmazniuk; és 10 kb-os inszerteket is be kell fo-gadniuk.In order to obtain only one clone per mRNA transcript when the cDNAs are recovered, one-way oligo-dT primers are preferably used for chaining. It is known that the use of a mixture of oligo-dT and random primers may also be advantageous when targeting genes, since such a mixture results in greater sequence diversity. Similar effects are available with DR2 (Clontech) and HXLOX (U.S. Biochemical), and Invitrogen and Novagen vectors. These vectors must meet two conditions: they must contain a primer for the standard primers (eg, T3 or M13 reverse primers); and include 10 kb inserts.

Szintén lényeges, hogy a kiónok mintavétele vélet-lenszerűen történjen, és, hogy nagy mennyiségű kiónt alkal-mazzunk. 5000 klónnal is generáltunk adatokat, azonban, hanagyon ritka géneket akarunk kinyerni és/vagy relatív gya-koriságukat meghatározni, egy könyvtárból 100 000 klón min-tavételére is szükség lehet. A cDNS méret szerinti frakcio-nálását óvatosan kell végezni. Más lehetőség szerint,kiónok helyett plakkokat is szelektálhatunk.It is also important that the clone is sampled at random and that large amounts of clone are used. We also generated data for 5,000 clones, however, we want to extract rare genes and / or determine their relative frequency, and it may be necessary to sample 100,000 clones from a library. The size fractionation of the cDNA should be done with caution. Alternatively, plaques may be selected instead of clones.

Jelenleg úgy véljük, hogy az alábbiakban leírt Uni-At present, we believe that the Uni-

TM ZAP -vektorrendszer (Stratagene) mellett más, hasonlóanegyirányú vektorok is alkalmazhatók. Úgy gondoljuk, hogy azilyen vektorok közé tartozik (többek között) a DR2(Clontech) és a HXLOX (U.S. Biochemical). 28 A könyvtárkészítés (ld. 1. ábra) részleteit - az összehasonlítani kívánt szekvenciákra vonatkozóan a későbbi visszakeresés érdekében - előnyösen adatbázisba gyűjtjük,és ilyen formában tároljuk. Az 1. ábrán a DNS-készítésbenközreműködőkre, a sejtet vagy cDNS-t szállítókra, az előke-zelésre, biológiai forrásra, tenyésztésre, mRNS-készítésreés a cDNS kialakítására vonatkozó lényeges információkatmutatunk be. A szekvenciák és könyvtárak részletes analízi-sében előnyösek a többi lépésről rendelkezésre álló, hason-lóan részletes információk. A sejtekből RNS-t kell kinyerni, majd szövetmintá-kat és cDNS-könyvtárakat kell előállítani. A cDNS-könyvtárak ismert technikákkal állíthatók elő [ld. pl.:Maniatis, T. és mtsai.: "Molecular Cloning", Cold SpringHarbor Laboratory, New York, (1982)] . A cDNS-könyvtárakatvásárolhatjuk is. Az U-937-cDNS-könyvtárat (katalógusszám:937207) a Stratagene, Inc.-tői (11099 M. Torrey Pines Rd.,La Jolla, CA 92037) kaptuk. A THP-l-cDNS-könyvtárat - 48 órán át 100 nM TPA-valés 4 órán át 1 μρ/πιΐ LPS-sel tenyésztett THP-l-se j tekből -rendelésünkre a Stratagene állította elő. A HMC-l-cDNS-könyvtárat tenyésztett HMC-l-sejtekből, rendelésünkre, ugyancsak a Stratagene állította elő. A HUVEC-cDNS-könyvtárat indukált HUVEC-sejtek két, külön feldolgozott adagjából, rendelésünkre, szintén a Stratagene állította elő . Lényegében valamennyi könyvtár előállításához azo-nos módszert alkalmaztak. Először poli(A+)RNS-t (mRNS-t) 29 tisztítottak. Az U-937- és HMC-l-RNS esetében a cDNS- szintézist csak oligo-dT-vel, míg a THP-1- és HUVEC-RNSesetében oligo-dT-vel és random hexamerekkel indították, ésa két cDNS-könyvtárat külön-külön kezelték. A cDNS-végekre- Uni-Zap -vektorrendszerbe (Stratagene) történő inszer-ciójuk elősegítése érdekében - szintetikus adaptor-oligonukleotidokat ligáltak, ami nagy hatékonyságú, egy-irányú (szensz orientációjú) lambda-könyvtár kialakítását tette lehetővé, és a cDNS-inszerciókat tartalmazó kiónok kimutatását kék-fehér színszelekcióval lehetővé tevő plazmidrendszer kényelmét biztosította. A két könyvtáratvégül - azonos számú bakteriofág elegyítésével - egyetlenkönyvtárrá egyesítették. A könyvtárak DNS-próbákkal vagy antitest-próbákkalszkrínelhetők, és a pBluescript®-fágemid (Stratagene) invivő gyorsan kivágható. A fágemid könnyű inszert-karakterizáláshoz, -szekvenáláshoz, helyspecifikus mutage-nezishez, egyirányú deléciók kialakításához és fúziós pro-teinek expresszálásához alkalmas plazmidrendszer alkalmazá-sát teszi lehetővé. A rendelésre gyártott könyvtárfágrészecskéivel E. colr-XLl-Blue®-törzset (Stratagene) fer-tőztünk, amely nagy transzformációs hatékonyságával növeliannak valószínűségét, hogy a cDNS-könyvtárban ritka,"alulreprezentált" kiónokat kapjunk. 30 3. példa cDNS-klónok izolálásaIn addition to TM ZAP vector system (Stratagene), other similarly directional vectors may be used. Such vectors are believed to include (among others) DR2 (Clontech) and HXLOX (U.S. Biochemical). 28 Details of library creation (see Figure 1) are preferably stored in a database for subsequent retrieval of the sequences to be compared and stored as such. Figure 1 shows essential information for DNA constructors, cell or cDNA carriers, precursor, biological source, culture, mRNA production, and cDNA formation. In the detailed analysis of sequences and libraries, similarly detailed information available from other steps is preferred. Cells should be recovered from RNA and tissue samples and cDNA libraries should be prepared. The cDNA libraries can be prepared by known techniques [see, e.g. for example, Maniatis, T. et al., "Molecular Cloning", Cold Spring Harbor Laboratory, New York (1982)]. You can also buy cDNA libraries. The U-937 cDNA library (catalog number 937207) was obtained from Stratagene, Inc. (11099 M. Torrey Pines Rd., La Jolla, CA 92037). The THP-1 cDNA library was prepared from Stratagene for our order for 48 hours at 100 nM TPA and 4 hours at 1 μρ / πιΐ LPS. The HMC-1 cDNA library from cultured HMC-1 cells was also ordered by Stratagene. The HUVEC cDNA library was induced from two separate processed portions of HUVEC cells, ordered by Stratagene. Essentially, the same method was used to produce all libraries. First, poly (A +) RNA (mRNA) 29 was purified. In the case of U-937- and HMC-1-RNA, cDNA synthesis was initiated only with oligo-dT, while in THP-1 and HUVEC-RNA, oligo-dT and random hexamers were initiated and two cDNA libraries were isolated. treated separately. In order to facilitate their insertion into the cDNA terminals, the Uni-Zap vector system (Stratagene), they ligated synthetic adapter oligonucleotides, which enabled the creation of a high-efficiency, one-way (sense orientation) lambda library, and containing cDNA insertions. It provided the convenience of a plasma system that enabled the detection of clones with blue-white color selection. The two libraries were merged into a single library by blending the same number of bacteriophages. The libraries can be screened by DNA probes or antibody probes, and the pBluescript® phagemid (Stratagene) inverter can be quickly excised. The phagemid allows the use of a plasmid system suitable for light insertion characterization, sequencing, site-specific mutagenesis, unidirectional deletions, and expression of fusion processes. Custom-made library phage particles were infected with E. coli-XL1-Blue® (Stratagene), which, with its high transformation efficiency, increased the likelihood of obtaining rare "underrepresented" clones in the cDNA library. Example 3 Isolation of cDNA Clones

Az egyes cDNS-klónok fágemid alakjait az in vivőkivágási eljárással kaptuk, melynek során a gazda-baktériumtörzset a lambda-könyvtár-f ággal és fi-" helper" - fággal egyszerre fertőztük meg. A könyvtárt tartalmazó fágból és a " helper"-fágból származó proteinek hasították("nick") a lambda-DNS-t, a lambda-cél-DNS-en - meghatáro-zott szekvenciákról - új DNS-szintézist indítottak, és ki-sebb méretű, egyszálú fágemid-DNS-molekulát hoztak létre,amely a pBluescript -plazmid és a cDNS-inszert valamennyiDNS-szekvenciáját tartalmazta. A fágemid-DNS-t kiválasztot-tuk a sejtből és tisztítottuk, majd friss gazdasejtek újra-fertőzésére használtuk, melyekben kétszálú fágemid-DNS-t állítottunk elő. Mivel a fágemid béta-laktamáz-gént hordoz, az újonnan transzformált baktériumokat ampicillint tartal-mazó táptalajon szelektáltuk.The phagemid forms of each cDNA clone were obtained by the in-carrier cleavage method, whereby the host bacterial strain was infected with the lambda-library and phage helper phage. Proteins from the phage containing the library and the helper phage cleaved ("nick") lambda DNA, and lambda-target DNA - defined sequences - started new DNA synthesis, and less A single-stranded phagemid DNA molecule of the size of pBluescript plasmid and cDNA insert was generated. The phagemid DNA was selected from the cell and purified and used to re-infect fresh host cells in which double-stranded phagemid DNA was prepared. Since the phagemid carries a beta-lactamase gene, the newly transformed bacteria were selected on medium containing ampicillin.

TM A fagemid-DNS-t Magic Mimpreps DNS-tisztító-rendszer (Promega katalógusszám: A7100; Promega Corp., 2800TM The phagemid DNA is Magic Mimpreps DNA Purification System (Promega Catalog No. A7100; Promega Corp., 2800)

Woods Hollow Rd., Madison, WI 53711) alkalmazásával tisztí-tottuk. Ez a kisléptékű eljárás egyszerű és megbízható mód-ját biztosítja a baktériumsejtek lízisének és - szabadalma-zott DNS-kötőgyanta alkalmazásával tisztított - fágemid-DNSgyors izolálásának. A tisztítógyantáról a DNS- szekvenáláshoz és más analitikai manipulációkhoz előkészí-tett DNS-t eluáltunk. Fágemid-DNS-t a "QIAGEN® DNA Purification System"-bői (QIAGEN Inc., 9259 Eton Ave., Chattsworth, CA 91311) 31 származó "QIAwell-8 Plasmid Purification System" alkalmazá-sával is tisztítottunk. Ez a termékcsalád kényelmes, gyors,megbízható, nagy átmenőteljesítményű eljárást biztosít aWoods Hollow Rd., Madison, WI 53711). This small-scale process provides a simple and reliable way to isolate bacterial cells and to isolate phagemid DNA, which is purified using a patented DNA binding resin. DNA prepared from the cleaning resin for DNA sequencing and other analytical manipulations was eluted. Phagemid DNA was also purified using the "QIAwell-8 Plasmid Purification System" from QIAGEN® DNA Purification System (QIAGEN Inc., 9259 Eton Ave, Chattsworth, CA 91311). This product range provides a convenient, fast, reliable, high throughput process

TM baktériumsejtek lizisere es - a 3M cég EMPORE -membran-technikájával, soküregű elrendezésben "QIAGEN" anioncserélőgyöngyök alkalmazásával - nagymértékben tisztított fágemid-DNS izolálására. A tisztítógyantáról a DNS-szekvenáláshozés más analitikai manipulációkhoz előkészített DNS-t eluáltunk. A fágemidtisztítás egy másik eljárása az utóbbiidőben vált hozzáférhetővé. Ehhez a "Miniprep Kit"reagenskészletet (katalógusszám: 77468; Advanced GeneticTechnologies Corp., 19212 Orbit Drive, Gaithersburg, Mary- land) alkalmazzuk. Ez a reagenskészlet 96-üreges elrendezé-sű, és 960 tisztításhoz elegendő reagenst tartalmaz. Minden reagenskészletet felhasználási útmutatóval látnak el, mely-nek eljárását a következő változtatásokkal követtük. Elő-ször is, a 96 üreg mindegyikébe csak 1 ml (25 mg/1karbenicillint és 0,4 % glicerint tartalmazó) steril,"terrific"-tápoldatot töltünk. Az üregekben lévő tápoldatbeoltása után a baktériumokat 24 óra hosszat tenyésztjük, és 60 μΐ lizálópufferrel lizáljuk. A centrifugálást(percenkénti 2900-as fordulatszámmal 5 percig) azelőtt vé-gezzük, hogy a blokk tartalmát az első szűrőlapra öntenénk.Azt a választható lépést, amelyben Tris-pufferhez izo-propanol hozzáadása szerepel, rendszerint nem alkalmazzuk.Az eljárás utolsó lépése után a mintákat - tárolás céljából- 96-üregű Beckman-egységbe tesszük. 32 ΤΜTM Lyser of bacterial cells - with EMPORE membrane technique of 3M company, in multicellular arrangement using "QIAGEN" anion exchange beads - to isolate highly purified phagemid DNA. DNA from the purification resin and DNA prepared for other analytical manipulations were eluted. Another method of phagemid purification became available in the latter time. For this purpose, the "Miniprep Kit" kit (catalog number 77468; Advanced GeneticTechnologies Corp., 19212 Orbit Drive, Gaithersburg, Maryland) is used. This kit is 96-well and contains 960 reagents for purification. All reagent kits are provided with instructions for use, the procedure of which was followed by the following changes. First, only 1 ml (25 mg / 1carbenicillin and 0.4% glycerol) of sterile "terrific" medium is added to each of the 96 wells. After inoculation in the wells, the bacteria were cultured for 24 hours and lysed with 60 μl lysing buffer. The centrifugation (at 2900 rpm for 5 minutes) was performed before pouring the contents of the block onto the first filter plate. The optional step in which the isopropanol was added to the Tris buffer was not normally used. samples were placed in a 96-well Beckman unit for storage. 32 ΤΜ

Egy másik uj DNS-tisztito-rendszer a WIZARD ter-mékcsalád, amely a Promega-tól szerezhető be (katalógus-szám: A7071), és 96-üregű elrendezéshez adaptálható. 4. példa cDNS-klónok szekvenálásaAnother new DNA purification system is the WIZARD product family, available from Promega (catalog number A7071), and can be adapted to a 96-well layout. Example 4: Sequencing of cDNA clones

Az U-937- és THP-l-könyvtárak random izolátumaibólszármazó cDNS-inszerteket részben megszekvenáltuk. A DNS-szekvenálási eljárások jól ismertek. A hagyományosenzimatikus eljárások a kérdéses DNS-templáthoz hibridizáltláncindító oligonukleotidból DNS-láncok hosszabbítására aDNS-polimeraz Klenow-fragmenset, "Sequenase "-t vagy Taq-polimerázt alkalmaznak. Mind az egyszálú, mind a kétszálútemplátokhoz fejlesztettek ki eljárásokat. A lánc- terminációs reakció termékeit rendszerint karbamid-akril- amid-géleken elektroforizáljuk, és (radionuklidokkal jelöltprekurzorok esetén) autoradiográfiás vagy (fluoreszcens je-lölésű prekurzorok esetén) fluoreszcens eljárással detek-táljuk. A gépesített reakcióelőkészítés, a szekvenálás és - a fluoreszcens detektálás alkalmazásával végzett - analízisújabb fejlesztései lehetővé tették a naponta meghatározhatószekvenciák számának növelését (pl. az "Applied Biosystems373" és " 377" típusú DNS-szekvenáló, "Catalyst 800") . Je-lenleg a leírt rendszerekkel elérhető leolvasási hosszúság 250-400 bázis, és ez a hosszúság klónfüggő. A leolvasásihosszúság a gél futtatási idejétől is függ. Általában, arövidebb futtatási idő rövidíti a szekvenciát. A szekvencia azonosításához és homológiája mértékének megállapításához . « - 33 - minimálisan 25-50 bázisra van szükség. A géntranszkriptum-leképezés bármely szekvenciaspecifikus eljárással alkalmaz-ható, beleértve (többek között) a hibridizációt, tömeg-spektroszkópiát, kapilláris-elektroforézist és "505" gél- elektroforézist. 5. példaThe cDNA inserts from the random isolates of the U-937 and THP-1 libraries were partially sequenced. DNA sequencing techniques are well known. Conventional enzymatic procedures from the hybridizing primer to the DNA template in question for the extension of DNA chains to the DNA chains using the DNA polymerase Klenow fragment, "Sequenase" or Taq polymerase. Procedures have been developed for both single-stranded and double-stranded churches. The chain termination reaction products are usually electrophoresed on urea acrylamide gels and detected (with radionuclide labeled precursors) by autoradiography or (fluorescent precursors) fluorescence. Mechanized reaction preparation, sequencing, and the latest developments in fluorescence detection enabled the increase in the number of sequences that can be determined daily (e.g., DNA sequencer "Applied Biosystems373" and "377", "Catalyst 800"). In general, the read lengths available with the described systems are 250-400 bases, and this length is clone dependent. The reading length also depends on the gel run time. Generally, a longer run time will shorten the sequence. To identify the sequence and determine the degree of homology. «- 33 - requires a minimum of 25-50 bases. Gene transcription imaging can be used by any sequence-specific method, including (inter alia) hybridization, mass spectroscopy, capillary electrophoresis, and "505" gel electrophoresis. Example 5

Homológiakeresés a cDNS-klónban és a leszármaztatott prote-inben (és további lépések) A kérdéses szekvenciákként a cDNS-klónokból szárma-zó nukleotid-szekvenciák (egy szekvencialista szekvenciái) alkalmazásával korábban azonosított szekvenciákat tartalma-zó adatbázisokat homológ (hasonló) területek jelenlétérevizsgálunk át. Az ilyen adatbázisok példái közé tartozik a"Genbank" és az "EMBL". A következőkben két, a találmány szerinti megoldás gyakorlati megvalósítása során alkalmaz-ható homológiakereső algoritmus példáját, majd a találmányelőnyös megvalósítási módjai szerint alkalmazható számító-gépes lépéseket írjuk le. A találmány szerinti megoldás számítógépes lépései-nek leírásában a "könyvtár" kifejezés egy biológiai mintá-ban lévő nukleinsav-szekvenciák sorozatát (vagy populáció-ját) jelenti. Egy könyvtár állhat egy biológiai mintárajellemző cDNS-szekvenciákból, RNS-szekvenciákból vagy ha-sonlókból . A biológiai minta tartalmazhat egyféle emberisejttípusba tartozó sejteket, illetve lehet bármilyen, ko-rábban említett típusú biológiai minta. Feltételezésünkszerint egy könyvtárban lévő szekvenciák pontosan reprezen- 34 • · · · · • · · · » · · · · • · · · · « tálnak vagy jellemeznek egy biológiai mintát (például, akönyvtár egyetlen emberi sejtből nyert RNS kiónjaiból szár-mazó reprezentatív cDNS-szekvenciákból áll). A találmány szerinti megoldás számítógépes lépései-nek leírásában az "adatbázis" kifejezés tárolt adatok olyanállományát jelenti, amely egy szekvenciagyűjteményt repre-zentál, amely viszont biológiai referenciaanyagok gyűjtemé-nyét reprezentálja. Például, egy adatbázis sok tárolt cDNS-szekvenciát reprezentálhat, amelyek különböző vírusokkalfertőzött emberi sejtekre, különböző korú emberekből szár-mazó sejtekre, különböző emlőstaj okból származó sejtekre,stb., jellemzők. A találmány előnyös megvalósítási módjaiban a kö-vetkező lépések megvalósításához alkalmas szoftverrel(melyet a későbbiekben írunk le) programozott számítógépet alkalmazunk: (i) cDNS-szekvenciákból álló - nagy átmenőtel-jesítményű cDNS-szekvenálással vagy más eljárással készí-tett - könyvtárra utaló adatok feldogozása, annak meghatá-rozása érdekében, hogy a könyvtár egyes szekvenciái illesz-kednek-e egy referencia DNS-szekvencia-adatbázis DNS- szekvenciáival (és ha igen, a referencia adatbázis - szek-venciával illeszkedő - bejegyzésének azonosítása, és a re-ferencia-szekvencia és a könyvtár szekvenciája közötti il-leszkedés mértékének jelzése érdekében), továbbá a szekven-cia-annotáción és a könyvtárban lévő egyes szekvenciákkalmutatott illeszkedés mértéke alapján egy azonosítottszekvenciaérték kijelölése; V · - 35 - (ii) a könyvtárban lévő, illeszkedő, azonosítottszekvenciaértékek számának az adatbázis néhány vagy vala-mennyi bejegyzéséhez történő csoportosítása (bár ezt egyminden bejegyzést tartalmazó lista alapján manuálisan iselvégezhetjük, előnyösen az alábbiakban leírt szoftver al-kalmazásával valósítjuk meg); és (iii) (ha a könyvtárak mérete különböző) az egyesgyakorisági számok könyvtárban lévő szekvenciák összes szá-mával történő osztása, hogy az egyes azonosítottszekvenciaértékekre relatív gyakorisági számokat (vagyis azegyes géntranszkriptumok relatív gyakoriságát) kapjunk.Searching for Homology in the cDNA Clone and Derived Protein (and Further Steps) Databases containing previously identified sequences using nucleotide sequences (sequences of sequences) derived from the cDNA clones as the sequences in question are examined for the presence of homologous (similar) domains. Examples of such databases include "Genbank" and "EMBL". In the following, an example of a homology search algorithm to be used in the practice of the present invention will be described, followed by computer steps for use in the embodiments of the invention. In the description of the computer steps of the present invention, the term "library" means a sequence (or population) of nucleic acid sequences in a biological sample. A library may be comprised of biological sample characteristic cDNA sequences, RNA sequences, or the like. The biological sample may contain cells of one type of human cell, or may be any biological sample of the above type. It is believed that sequences in a library accurately represent or characterize a biological sample (for example, a library of representative cDNAs derived from clones of a single human cell RNA). sequences). In the description of the computer steps of the present invention, the term "database" means a set of stored data representing a sequence of sequences, which in turn represents a collection of biological reference materials. For example, a database may represent many stored cDNA sequences that are characteristic of human cells infected with different viruses, cells of different ages, cells derived from different mammary glands, and so on. In preferred embodiments of the present invention, a computer programmed to implement the following steps (described below) is used: (i) processing data referring to a library of cDNA sequences produced by high throughput cDNA sequencing or by other means , in order to determine whether certain sequences in the library match the DNA sequences of a reference DNA sequence database (and, if so, the reference database - sequence matching), and the reference to indicate the extent of cleavage between the sequence and the sequence of the library), and to assign an identification sequence value based on the degree of sequence alignment and the degree of alignment in each sequence in the library; (Ii) grouping the number of matching identification sequence values in the library into some or all of the entries in the database (although this can be done manually based on a single entry list, preferably by applying the software described below); and (iii) dividing the number of sequences in the individual frequency numbers library (if the size of the libraries is different) so as to obtain relative frequency numbers (i.e. the relative frequency of single gene transcripts) for each of the identified sequence values.

Az azonosított szekvenciaértékek (vagy az azoknakmegfelelő gének) listáját ezután a cDNS-populációban gyako-riság alapján rendezhetjük. Számos egyéb összehasonlítás elvégzésére van lehetőség. Például, az (i) és (ii) lépést két különböző könyv-tár alkalmazásával is megismételhetjük (melyeket néha"célkönyvtár", illetve "kivonókönyvtár" néven említünk)(ezt az eljárást a későbbiekben ismertetjük részletesen).Ilyen esetben minden egyes azonosított szekvenciaértékre(vagy géntranszkriptumra) egy "arány"-értéket kapunk, olymódon, hogy a célkönyvtárban (a kérdéses azonosítottszekvenciaértékre) kapott gyakorisági számot elosztjuk akivonókönyvtárban (a kérdéses azonosított szekvencia-értékre) kapott gyakorisági számmal. A kivonást több könyvtáron is elvégezhetjük. Össze-adhatunk több (pl. három) könyvtárból származótranszkriptumokat, majd ezeket több (pl. három) könyvtárból 36 származó transzkriptumok egy másik készletével oszthatjuk.E művelet jelölésmódja a következő: (A+B+C)/(D+E+F), ahol abetűk mindegyike egy teljes könyvtárt jelöl. Adott esetbena transzkriptumok gyakorisági számait (az összegzett könyv-tárakban) a kivonás előtti teljes mintamérettel oszthatjuk. A hagyományos hibridizációs technikától eltérően -amely két könyvtár egyetlen kivonását teszi lehetővé atalálmány szerinti megoldás szerint, ha egyszer atranszkriptum-szekvenciák készletét vagy könyvtárát feldol-goztuk és betápláltuk a számítógépbe, a könyvtáron akárhánykivonást végezhetünk. Például, ezzel az eljárással, az elsőkönyvtárban kapott relatív gyakorisági értékeket a másodikkönyvtár megfelelő értékeivel osztva (vagy fordítva) arány-értékeket kaphatunk.The list of identified sequence values (or their corresponding genes) can then be sorted by frequency in the cDNA population. Many other comparisons are possible. For example, steps (i) and (ii) can also be repeated using two different bookshops (sometimes referred to as "target libraries" or "extraction libraries") (this procedure will be described in more detail below). or a gene ratio) is obtained by dividing the frequency number obtained in the target directory (for the identifier in question in question) by the frequency number obtained in the extraction library (for the identified sequence value in question). Extraction can be performed on multiple libraries. You can combine derivative transcripts from several (eg three) libraries, and then divide them into another set of 36 transcripts from multiple libraries (e.g., three). This operation has the following notation: (A + B + C) / (D + E + F) where each letter represents a complete library. In some cases, the frequency numbers of transcripts (in the aggregated book repositories) can be divided by the total sample size before subtraction. Unlike the conventional hybridization technique, which allows for the single extraction of two libraries according to the present invention, once a set or library of atrancript sequences has been processed and fed into the computer, we can perform any extraction of the library. For example, with this method, the relative frequency values obtained in the first directory can be divided by the values of the second library (or vice versa) by the ratio values.

Az (i) lépés változatában a könyvtár cDNS-klónokbólszármazó nukleotid-szekvenciákból áll. Az (i) lépésben ho-mológ (hasonló) területek jelenlétére vizsgálható adatbázi-sok példái közé tartoznak a szokványos adatbázisok, mintpl. a "Genbank" (NIH) , "EMBL" (European Molecular BiologyLabs, Németország) és a "GENESEQ" (Intelligenetics,Mountain View, California).In the variant of step (i), the library consists of nucleotide sequences derived from cDNA clones. Examples of databases that can be tested for homologous (similar) domains in step (i) include conventional databases, e.g. "Genbank" (NIH), "EMBL" (European Molecular BiologyLabs, Germany) and "GENESEQ" (Intelligenetics, Mountain View, California).

Az (i) lépés megvalósítására alkalmazható egyikhomológiakereső algoritmus a D.J. Lipman és W.R. Pearsonáltal leírt algoritmus [ Science 227, 1435 (1985)] . Ebben azalgoritmusban a homológ régiók keresése kétlépéses módontörténik. Az első lépésben - homológiaszám-táblázat alkal-mazásával, illeszkedési szám számításával - meghatározzuk alegnagyobb homológiát mutató régiókat. E lépésben a - két 37 szekvencia összehasonlításához eltolható - minimális ablak-méret kialakításához a "Ktup-paramétert" alkalmazzuk. AKtup-paraméter beállítja a bázisok azon számát is, melyek-nek illeszkedni kell ahhoz, hogy a szekvenciák közül kivon-hassuk a legnagyobb homológiát mutató régiókat. Ebben a lé-pésben inszerciót vagy deléciót nem alkalmazunk, és ahomológiát kezdeti értékként ("INIT") jelenítjük meg. A második lépésben a homológ régiókat egymás alárendezzük ("alignment"), hogy - lehetséges deléciós régióbeiktatása érdekében - egy kiesés ("gap") inszerciójávalmegkapjuk a legnagyobb illeszkedési számot. Az első lépés-ben kapott illeszkedési számot a homológiaszám-táblázat ésaz inszerciószám-táblázat alkalmazásával újraszámítjuk, svégeredményként egy optimalizált ("OPT") értéket kapunk. Két szekvencia közötti DNS-homológiákat grafikusana Harr-módszerrel (pontmátrix-homológiagörbék kialakításá-val) vizsgálhatunk [Needleman, S.B. és Wunsch, C.O.: J.Mom. Bioi. 4 8, 443 (1970)] . Ez a módszer kétdimenziós gör-bét ad, amely előnyösen alkalmazható a homológ régiók - is-métlődő régiók függvényében történő - meghatározására.One of the homology search algorithms that can be used to implement step (i) is D.J. Lipman and W.R. The algorithm described by Pearson [Science 227, 1435 (1985)]. In this algorithm, the search for homologous regions occurs in two steps. In the first step, the regions with the highest homology are determined using the homology number table by calculating the fitting number. In this step, the "Ktup parameter" is used to create a minimum window size that can be shifted to compare two sequences. The AKtup parameter also sets the number of bases that need to be matched to remove the regions with the highest homology from the sequences. In this step, no insertion or deletion is used, and we display the homology as an initial value ("INIT"). In the second step, the homologous regions are subordinated to each other ("alignment") in order to obtain the largest number of matches with a "gap" insertion for possible deletion region insertion. The match number obtained in the first step is recalculated using the homology number table and insertion number table, resulting in an optimized value ("OPT"). DNA sequences between two sequences can be graphically analyzed using the Harr method (dot matrix homology curves) [Needleman, S.B. and Wunsch, C.O., J.Mom. Biol. 4, 8, 443 (1970). This method provides a two-dimensional curve that can be advantageously used to determine homologous regions as a function of repeating regions.

Az egyik előnyös megvalósítási mód szerint az (i)lépést úgy valósítjuk meg, hogy a könyvtár adatait egy"INHERIT 670 Seguence Analysis System" néven ismert, keres-kedelmi forgalomban az Applied Biosystems Inc.-tói (FosterIn one preferred embodiment, step (i) is accomplished by providing the directory data known as "INHERIT 670 Seguence Analysis System", commercially available from Applied Biosystems Inc. (Foster)

City, California) beszerezhető számítógépes programmal(benne a " Factura" szoftverrel [Applied Biosystems Inc.] )dolgozzuk fel. A "Factura"-program a könyvtár minden egyesszekvenciáját előzetesen feldolgozza, miáltal kivágja az 38 olyan részeket, amelyek valószínűleg nem lényegesek (mintpl. a könyvtár készítéséhez alkalmazott vektor). A további,kivágható vagy álcázható szekvenciák (melyeket a keresőesz-közök nem vesznek figyelembe) közé tartozik - többek között- a poliA-farok, valamint az ismétlődő GAG és CCC szekven-ciák. Az ilyen kevés információt tartalmazó szekvenciák ál-cázására "low-end" keresőprogramok írhatók, vagy más módon,az ilyen szekvenciák, pl. "BLAST"-program alkalmazásávalfigyelmen kívül hagyhatók.City, California) is processed by a computer program (including "Factura" software [Applied Biosystems Inc.]). The "Factura" program processes every single sequence of the library beforehand, thereby cutting out 38 parts that are unlikely to be significant (such as the vector used to create the library). Further sequences that can be cut or disguised (not taken into account by the search engines) include, but are not limited to, polyA tail, as well as repetitive GAG and CCC sequences. To identify sequences containing such little information, "low-end" search engines can be written, or otherwise, such sequences, e.g. You can ignore the "BLAST" program.

Az "INHERIT 670 Sequence Analysis System" programalgoritmusában a homológ régiók meghatározására a TRW Inc.által kifejlesztett "Pattern Specification Language" -et al-kalmazzuk. "Három paraméter határozza meg, hogy az INHERIT-analízis hogyan futtatja a szekvencia-összehasonlításokat: az ablakméret, az ablakeltolás és a hibatűrés. Az ablakmé-ret határozza meg, hogy milyen hosszúságú szegmensekre da- rabolódjon a kérdéses szekvencia. Az ablakeltolás azt hatá-rozza meg, hogy - az előző szegmens kezdetétől számítva -hol kezdődjön a következő (összehasonlítani kívánt) szeg-mens. A hibatűrés az inszerciók deléciók és/vagy szubszti-túciók - meghatározott szóhosszúságon túl tolerált - számáthatározza meg. A hibatűrés 0 és 6 között bármely egészszámra beállítható. Az alapértelmezésnek megfelelő beállí-tások a következők: ablakméret = 20; ablakeltolás = 10; hi-batűrés = 3." ["INHERIT Analysis Users Manual" 2-15. old.,1.0 változat, Applied Biosystems, Inc., (1991. okt.)] . A fenti három paraméter kombinációjának alkalmazá-sával egy adatbázist (pl. DNS-adatbázist) homológ régiókat 39 tartalmazó szekvenciák jelenlétére vizsgálhatunk át, és amegfelelő szekvenciákhoz kiindulási értékeket rendelünk.Ezután a homológ régiókat pontmátrix-homológiagörbék alkal-mazásával vizsgáljuk, hogy a homológ régiókat az ismétlődőrégiók függvényében határozzuk meg. A homológiakereséseredményeinek megjelenítésére Smith-Waterman-elrendezéstalkalmazhatunk. Az INHERIT-szoftver UNIX-operátor-rendszerrel programozott "Sun" számítógépes rendszerrel futtatható.In the program algorithm of the "INHERIT 670 Sequence Analysis System", the "Pattern Specification Language" developed by TRW Inc. is used to determine the homologous regions. "Three parameters determine how the INHERIT analysis will run the sequence comparisons: window size, window offset, and fault tolerance. The window window determines the length of segments that the sequence in question will disintegrate. Determine that - starting from the beginning of the previous segment - the next segment (to be compared) starts to run. The tolerance for insertion deletions and / or substitutions is tolerated beyond the specified word length. The default settings are as follows: window size = 20; window offset = 10; hibernation = 3. " ["INHERIT Analysis Users Manual" 2-15. No. 1.0, Applied Biosystems, Inc. (Oct. 1991)]. Using the combination of the above three parameters, we can examine the presence of sequences containing homologous regions (eg DNA database) 39 and assign starting values to appropriate sequences. The homologous regions are then analyzed using point matrix homology curves to homologous regions. depending on the repeat regions. Smith-Waterman layouts can be used to display the results of the homology search. The INHERIT software can be run using a "Sun" computer system programmed with a UNIX operator system.

Az INHERIT-program helyett alkalmazható a BLAST-program, (GCG, Genetics Computer Group, WI), és a " Dasher" -program (Temple Smith, Boston University, Boston, MA) . Anukleotid-szekvenciák kereséséhez "Genbank"-, EMBL- vagy egyedi adatbázisok, mint pl. a "GENESEQ"-adatbázis(Intelligenetics, Mountain View, CA) vagy más géneket tar-talmazó adatbázisok alkalmazhatók. Emellett, bizonyos szek-venciák kereséséhez saját házi adatbázisunkat alkalmaztuk. A találmány előnyös megvalósítási módjai szerint atranszkriptum-szekvenciákat - egy referencia-géntranszkrip-tummal való legjobb egyezésre - "INHERIT"-szoftverrel ana-lizáljuk, hogy szekvencia-azonosítót jelöljünk ki, és meg-határozzuk a homológra mértékét, s ezek együtt az azonosí-tott szekvenciaértéket alkotják, melyet további feldolgozáscéljából egy gyakoriság-rendező és kivonási analízis(" abundance sort and subtraction analysis" ) programmal(melyet a későbbiekben írunk le) programozott "Macintosh"személyi számítógépbe (Apple) táplálunk. 40 A gyakoriság-rendező és kivonási analizis program(melyet gyakoriság-rendezőprogramnak is nevezünk) futtatása előtt a cDNS-klónokból származó, azonosított szekvenciákhoz (a fenti paraméterek szerint) , az illeszkedés mértéke alap-ján, illeszkedési értékeket jelölünk ki. Ennek kategóriái:"pontos" illeszkedés (nagyfokú azonosságot mutató régiók);homológ humán illeszkedés (nagy hasonlóságot mutató, de nem"pontos" illeszkedések); homológ, nem humán illeszkedés(más fajokban - nem emberben - található szekvenciákkalnagy hasonlóságot mutató régiók); illeszkedés hiánya (azadatbázisban tárolt, korábban azonosított nukleotid- szekvenciákkal nincsenek jelentős homológ régiók) . Más le-hetőség szerint, az illeszkedés mértékét numerikus értékkelis kifejezhetjük (ld. később). A referencia-szekvenciák és az adatbázis-bejegy-zések közötti illeszkedést azonosító lépéssel kapcsolatbanmegemlítjük, hogy a nukleinsav-szekvenciákból protein- éspeptid-szekvenciákat származtathatunk le. A leszármaztatottpolipeptid-szekvencia alkalmazásával az illeszkedésazonosí-tást a cDNS-szekvenciák illeszkedésazonosításához hasonló módon végezhetjük. Ilyen esetben - homológ proteinek kere-sése érdekében - vizsgálandó szekvenciaként egy protein-szekvenciát adatbázisok (pl· " Swiss/Prot"-, "PÍR"- és"NBRF"-protein-adatbázis) korábban azonosított szekvenciái-val hasonlítunk össze. Ezeket a proteineket először -homológiaszám-táblázat [ Orcutt, B.C és Dayoff, M.O.:"Scoring Matrices", PÍR Report MÁT - 0285 (1985. febr.)] alkalmazásával - homológiára pontozzuk, melynek eredménye- 41 ként "INIT"-számokat kapunk. A homológ régiókat egymás alárendezzük ("alignment" ) , hogy - lehetséges deléciós régióbeiktatása érdekében - egy kiesés (’’ gap" ) inszerciójávalmegkapjuk a legnagyobb illeszkedési számot. Az illeszkedésiszámot a homológiaszám-táblázat és az inszerciós szám táb-lázat alkalmazásával újraszámítjuk, miáltal egy optimali-zált (OPT) számot kapunk. Az izolált szekvencia pontos le-olvasási keretének ismerete hiányában a proteinhomológia-keresést úgy valósítjuk meg, hogy mindhárom leolvasási ke-retet átvizsgáljuk. A peptid- és protein-szekvencia-homológiákat - aDNS-szekvencia-homológiákhoz hasonlóan - az "INHERIT 670Seguence Analysis System" alkalmazásával is megállapíthat-juk. A protein-adatbázisok - kezdeti értékkel pontozott,homológ régiókat tartalmazó szekvenciák jelenlétére történő- átvizsgálására "Pattern Spéciiication Language"-et és pa-raméter-ablakokat alkalmazunk. A pontmátrix-homológia- görbével történő megjelenítés az ismétlődő régiók függvé-nyében mutatja a homológ régiókat. A mintázatkereső adatbá-zisokon alkalmazható további keresőeszközök közé tartoznakInstead of the INHERIT program, the BLAST program (GCG, Genetics Computer Group, WI) and the "Dasher" program (Temple Smith, Boston University, Boston, MA) can be used. To search for anucleotide sequences, "Genbank", EMBL, or individual databases such as databases containing "GENESEQ" (Intelligenetics, Mountain View, CA) or other genes may be used. In addition, we used our own database to search for certain sequences. In preferred embodiments of the invention, the atrancript sequences, for the best match with a reference gene transcript, are analyzed by the "INHERIT" software to identify a sequence identifier and to determine the extent of the homologue, and these together with the identification. For the purpose of the present invention, a "Macintosh" personal computer (Apple) programmed with a frequency management and subtraction analysis (described below) is used for further processing purposes. Prior to running the frequency-ordering and subtraction analysis program (also referred to as the frequency-organizing program), matched values are identified for the identified sequences from the cDNA clones (according to the above parameters) based on the degree of fitting. Its categories are: "accurate" fit (regions with a high degree of identity); homologous human matching (high similarity but not "exact" matches); homologous, non-human fit (regions with high similarity in sequences other than humans); lack of fit (there are no significant homologous regions with previously identified nucleotide sequences stored in the database). Alternatively, the degree of fit can be expressed in numerical value (see later). A link between the reference sequences and the database entries can be identified by reference to the ability of the nucleic acid sequences to derive protein and peptide sequences. By using the derived polypeptide sequence, the identity recognition can be performed in a similar manner to the cDNA sequence alignment. In this case, a protein sequence is compared to the previously identified sequences of databases (e.g., "Swiss / Prot", "PYR" and "NBRF" protein databases) as the sequence to be examined to obtain homologous proteins. These proteins are first scored for homology using the homology number table (Orcutt, BC and Dayoff, MO: "Scoring Matrices", PIR Report MÁT - 0285 (Feb. 1985)), resulting in 41 INIT numbers obtained . The homologous regions are subordinated to each other ("alignment") in order to obtain the largest fit number by inserting a "gap" into a possible deletion region. The fit number is recalculated using the homology number table and insertion number table. Without knowing the exact reading frame of the isolated sequence, the protein homology search is accomplished by examining all three reading sequences, peptide and protein sequence homologies for aDNA sequence homologies. Similarly, we can determine using the "INHERIT 670Seguence Analysis System." The "Pattern Spéciiication Language" and parameter windows are used to examine the protein databases for the presence of sequences with dotted homologous regions. homology curve The additional search tools that can be applied to pattern search databases include homologous regions.

a következők: "Plsearch Blocks" (Henikoff & Henikoff,University of Washington, Seattle) "Dasher" és "GCG". A mintázatkereső adatbázisok közé tartozik (többek között) a"Protein Blocks" (Henikoff & Henikoff, University of Wa-shington, Seattle), "Brookhaven Protein" (BrookhavenNational Laboratory, Brookhaven, MA), "PROSITE" (AmosBairoch, University of Geneva, Svájc), "PorDom" (Temple 42are "Plsearch Blocks" (Henikoff & Henikoff, University of Washington, Seattle) "Dasher" and "GCG". Pattern search databases include (among others) "Protein Blocks" (Henikoff & Henikoff, University of Wa-shington, Seattle), "Brookhaven Protein" (BrookhavenNational Laboratory, Brookhaven, MA), "PROSITE" (AmosBairoch, University of Geneva, Switzerland), "PorDom" (Temple 42

Smith, Boston University) és "PROTEIN MOTIF FINGERPRINT"(University of Leeds, Egyesült Királyság). A kiválasztott szekvencia-fragmensekből származóadatokat nagyobb szekvenciákká összeállító szekvencia-összeállító projektek kialakításához és irányításához az"INHERIT" DNS-analizáló rendszer részét képező "ABI Assemb-ler" felhasználói szoftvert (Applied Biosystems, Inc.,Foster City, CA) alkalmazható. Az "Assembler" szoftver kétfejlett számítógépes-technikát egyesít, ami maximalizálja aszekvenált DNS-fragmensek - összeillesztett szekvenciákká("Assemblages"; adatok egy speciális csoportosítása, ahol aszekvenciák közötti kapcsolatokat grafikus átfedések, egy-más-alá-rendezések ["alignment"] és statisztikai vetületekmutatják) történő - összeillesztésének lehetőségét. A fo-lyamat a "Meyers-Kececioglu" típusú fragmens-összeillesztő programon ("INHERIT Assembler User's Manual", AppliedBiosystems, Inc., Foster City, CA) alapul, és a DNS-fragmensek összeillesztéséhez alkalmas, nagyon precíz szek-vencia-rendező eszköz alapjául gráf-elméletet alkalmaz. Azegyéb alkalmazható összeillesztő programok közé tartozik a"MEGALIGN" (DNASTAR Inc., Madison, WI), a "Dasher" és a "STÁDÉN" (Roger Staden, Cambridge, Anglia). A következőkben - hivatkozva a 2. ábrára - a " gyakoriságrendező"-programot írjuk le részletesebben,amellyel a fentebb említett (ii) lépést valósítjuk meg (akönyvtár azon szekvenciái számának csoportosítása, amelyek illeszkedést mutatnak az egyes adatbázis-bejegyzésekkel; 43 más szavakkal, az egyes adatbázis-bejegyzések gyakorisági számának csoportosítása). A 2. ábrán a gyakoriságrendező-program egyik elő-nyös megvalósítási módjának folyamatábrája látható. A gya-koriságrendező-program e megvalósításának forráskód-listáját az 5. táblázatban mutatjuk be. A gyakoriságrende-ző-program a "FoxBASE" programnyelven (MicrosoftSmith, Boston University) and "PROTEIN MOTIF FINGERPRINT" (University of Leeds, UK). The "ABI Assembler" user software (Applied Biosystems, Inc., Foster City, CA) forming part of the "INHERIT" DNA analyzing system may be used to design and control sequence sequencing projects that generate data from selected sequence fragments into larger sequences. "Assembler" software combines two advanced computer techniques that maximize ascending DNA fragments - assembled sequences ("Assemblages", a special grouping of data, where inter-sequence links are graphical overlaps, "alignment", and statistical projections). The process is based on the "Meyers-Kececioglu" type fragment aggregation program ("INHERIT Assembler User's Manual", AppliedBiosystems, Inc., Foster City, CA), and a highly accurate sequence organizer suitable for fusing DNA fragments is based on graph theory. Other applicable matching programs include "MEGALIGN" (DNASTAR Inc., Madison, WI), "Dasher", and "STATE" (Roger Staden, Cambridge, England). Referring now to Figure 2, the "frequency organizer" program will be described in more detail, with the above-mentioned step (ii) being grouped (the number of library sequences that match each database entry; 43 in other words, grouping the frequency of each database entry). FIG. 2 is a flowchart of a preferred embodiment of a frequency management program. The source code list of this implementation of the grooming program is shown in Table 5. The frequency scheduler program is in "FoxBASE" (Microsoft

Corporation) íródott. Bár e technika első iterációjához a"FoxBASE" programot választottuk ki, ezt nem tekinthetjükkizárólagosnak, hiszen - amint az a szakember számára nyil-vánvaló - sok más programnyelv is alkalmazható, melyek kö-zül a "Sybase" egy különösen előnyös lehetőséget jelent. A2. ábrán megadott szubrutin nevek megfelelnek az 5. táblá-zatban felsorolt szubrutinoknak.Corporation). Although we selected the "FoxBASE" program for the first iteration of this technique, this is not considered to be exclusive, as, as will be apparent to those skilled in the art, many other programming languages may be used, including "Sybase" as a particularly advantageous option. THE 2. The subroutine names shown in FIG. 1B correspond to the subroutines listed in Table 5.

Ismét a 2. szekvenciára vonatkozóan, az "azonosí-tott szekvenciák" kifejezés olyan transzkriptum- szekvenciákat jelent, amelyek reprezentálják a könyvtár minden egyes szekvenciáját és az adatbázis-bejegyzés (havan) egy megfelelő azonosítását, amellyel illeszkedik. Másszavakkal, az "azonosított szekvenciák" olyan transzkrip-tum-szekvenciák, amelyek a fentebb leírt (i) lépés kimenet-ét reprezentálják. A 3. ábrán a találmány szerinti megoldás megvalósí-tásához alkalmas rendszer blokkdiagramját mutatjuk be. Ez a rendszer magában foglal egy könyvtárgeneráló egységet (2),amely kialakít egy könyvtárat, és a könytárat tartalmazóbiológiai szekvenciákra utaló transzkriptum-szekvenciák ki-meneti adatfolyamát állítja fel. A programozott processzor 44 (4) - a fentebb leírt (i) lépésnek megfelelően - fogadja a 2-es egységből kijövő kimeneti adatfolyamot, és létrehozza az azonosított szekvenciákat. A 4-es processzor a kereske-delmi forgalomban beszerezhető "INHERIT 670 SequenceAnalysis System" programmal és a kereskedelmi forgalombanbeszerezhető "Factura" programmal (mindkettő az AppliedBiosystems Inc.-tói szerezhető be) és az "UNIX" operátor-rendszerrel programozható. Még mindig a 3. ábrával kapcsolatban, az azonosí-tott szekvenciákat a - gyakoriságrendező-programmal progra-mozott - 6-os processzorba tápláljuk, amely a 2. és 3. áb-rán jelzett végső transzkriptum-szekvenciákat generálja. A4. ábrán egy tervezett kapcsolatú számítógépes rendszer részletesebb blokkdiagramja látható, amely különböző kere-sési technikákat, valamint egy adatbázis-készletet tartal-maz . A 2. ábrát illetően, a gyakoriságrendezó-program azazonosított szekvenciákon először egy "Tempnum" néven is-mert műveletet hajt végre, amely kiselejtezi azokat az azo-nosított szekvenciákat, amelyek a kiválasztott típusú adat-bázis-bejegyzésekkel nem mutatnak illeszkedést. Például, a"Tempnum"-művelettel olyan azonosított szekvenciákat sze-lektálhatunk ki, amelyek az adatbázis-bejegyzésekkel a kö-vetkező típusokba tartozó illeszkedéseket reprezentálják (a definíciókat ld. fentebb): "pontos" illeszkedések; humán "homológ" illeszkedések; "más faj" illeszkedések (más faj-ban - nem emberben - lévő gének); illeszkedés hiánya (azadatbázisban tárolt, korábban azonosított nukleotid- 45 szekvenciákkal nincsenek jelentős homológ régiók); "I" il-leszkedések (’’ Incyte" , korábban nem ismert DNS-szek- venciákhoz); "X" illeszkedések (a referencia-adatbázisban EST-kkel mutatott illeszkedés). Ez a művelet eliminálja azU, S, Μ, V, A, R és D szekvenciákat (meghatározásokat ld. 1. táblázat). A "Tempnum" művelettel végzett szelekció után meg-maradt, azonosított szekvenciaértékeket ezután egy továbbiszelekciós (gyomlálási) műveletnek vetjük alá, amely"Tempred" néven ismert. Ezzel a művelettel, például, vala-mennyi olyan azonosított szekvenciaértéket kiselejtezhe-tünk, amelyek kiválasztott adatbázis-bejegyzésekkel illesz-kedést mutatnak. A "Tempred" művelet során kiválasztott, azonosított szekvenciaértékeket ezután - a "Tempdesig" művelettel - a könyvtár szerint rendezzük. Az azonosított szekvenciák egyetlen könyvtárból vagy két vagy több könyvtárból szárma-zó szekvenciákat reprezentálhatnak.Again, for SEQ ID NO: 2, "identified sequences" refers to transcript sequences that represent each sequence of the library and an appropriate identification of the database entry (havan) by which it fits. In other words, "identified sequences" are transcript sequences that represent the output of step (i) described above. Fig. 3 is a block diagram of a system suitable for carrying out the present invention. This system includes a library generating unit (2) which generates a directory and sets the output stream of transcript sequences referring to the biological sequences containing the library. The programmed processor 44 (4), according to step (i) described above, receives the output stream from unit 2 and generates the identified sequences. Processor 4 can be programmed with commercially available "INHERIT 670 SequenceAnalysis System" and commercially available "Factura" software (both available from AppliedBiosystems Inc.) and the "UNIX" operator system. Still related to Figure 3, the identified sequences are fed to processor 6, which is programmed by the frequency scheduling program, which generates the final transcript sequences indicated in Figures 2 and 3. A4. Figure 5 shows a more detailed block diagram of a planned computer system containing various search techniques and a database set. With respect to FIG. 2, the frequency scheduler program performs an action on the identified sequences first as a "Tempnum", which discards the identified sequences that do not match the selected type of data base entries. For example, the "Tempnum" operation can identify identified sequences that represent database entries with the following types of matches (definitions see above): "exact" matches; human "homologous" matches; "other species" matches (genes in other species - non-human); lack of matching (there are no significant homologous regions with previously identified nucleotide sequences stored in the database); Inclusions ('Incyte' for previously unknown DNA sequences); 'X' matches (matched with ESTs in the reference database) This action eliminates theUU, S, Μ, V, Sequences A, R, and D (see Table 1). Identified sequence values remaining after selection by the "Tempnum" operation are then subjected to a further selection (herbicide) operation known as "Tempred." For example, the identified sequence values selected in the "Tempred" operation are then sorted by the library by the "Tempdesig" operation. or represent sequences derived from two or more libraries.

Először azt az esetet ismertetjük, amikor az azono-sított szekvenciaértékek egyetlen könyvtárból származószekvenciákat képviselnek. Ebben az esetben, a "Tempred"művelet során meghatározott valamennyi azonosítottszekvenciaértéket "Templib" művelettel, majd "Libsort" mű-velettel, végül "Temptarsort" művelettel rendezzük. E háromrendezési művelet az azonosított szekvenciákat, például,csökkenő gyakorisági szám szerint rendezi, miáltal csökkenőgyakorisági számok listáját kapjuk, amelyben minden egyesgyakorisági szám egyetlen azonosított szekvencia- 46 bejegyzésnek felel· meg; vagy csökkenő gyakorisági számoktöbb listáját kapjuk, ahol az egyes listákban szereplő gya-korisági számok egy kiválasztott típusú adatbázis-bejegyzéseknek felelnek meg (az egyes rendezett listákban a redundanciák mellőzésével). Ebben az esetben a "Cruncher" nevű műveletet kihagyhatjuk, így a "végső adat"-értékeket a"Temptasort" művelet során kapott, rendszerezetttranszkriptum-szekvenciák képezik. A következőkben azt az esetet ismertetjük, amikor a "Tempred" művelet során kialakított transzkriptum-szek-venciák két könyvtárból (" cél" -könyvtárból és " kivonó" -könyvtárból) származó szekvenciákat reprezentálnak. A cél-könyvtár, például, egy beteg sejt klónjaiból származócDNS-szekvenciákból, a kivonókönyvtár pedig gyógyszeres ke-zelés utáni beteg sejt kiónjaiból származó cDNS-szek-venciákból állhat. Egy másik példaként, a célkönyvtár egyfiatal ember egy bizonyos sejttípusának klónjaiból származócDNS-szekvenciákból, a kivonókönyvtár pedig egy más életko-rú ember azonos sejttípusának klónjaiból származó cDNS- szekvenciákból állhat.First, the case is described when the identified sequence values represent origin sequences from a single library. In this case, all identified sequence values determined during the "Tempred" operation are sorted by "Templib" operation followed by "Libsort" operation and finally "Temptarsort" operation. This three-order operation arranges the identified sequences, for example, by a decreasing frequency number, whereby a list of decreasing frequency numbers is obtained, in which each single frequency number corresponds to one identified sequence record 46; or a list of decreasing frequency numbers, where the regularity numbers in each list correspond to a selected type of database entry (with no redundancy in each sorted list). In this case, the operation "Cruncher" can be omitted, so the "final data" values are the sequenced transcript sequences obtained during the "Temport" operation. The following describes the case where the transcript sequences generated in the "Tempred" operation represent sequences from two libraries ("target" libraries and "extract" libraries). For example, the target library may comprise cDNA sequences derived from cDNA sequences from a patient's cell clones, and cDNA sequences from clones of a patient's post-drug treatment cell. As another example, the target library may consist of cDNA sequences derived from clones of a particular cell type from a young person, and the extract library may consist of cDNA sequences derived from clones of the same cell type of another human being.

Ebben az esetben a "Tempdesig" művelet a célkönyv-tárt reprezentáló valamennyi transzkriptum-szekvenciát a "Templib" (majd a "Libsort" és "Temptarsort") művelet sze-rinti feldolgozás felé, a kivonókönyvtárt reprezentáló va-lamennyi transzkriptum-szekvenciát pedig a "Tempsub" (majda "Subsort" és "Tempsubsort" ) művelet felé irányítja. Pél-dául, az egymást követő "Templib", "Libsort" és"Temptarsort" rendezési műveletek a célkönyvtárból szárma- 47 zó, azonosított szekvenciákat csökkenő gyakoriság szám sze-rint rendezik, miáltal csökkenő gyakorisági számok listájátkapjuk, amelyben minden egyes gyakorisági szám egyetlenazonosított szekvencia-bejegyzésnek felel meg; vagy csökke-nő gyakorisági számok több listáját kapjuk, ahol az egyeslistákban szereplő gyakorisági számok egy kiválasztott tí-pusú adatbázis-bejegyzéseknek felelnek meg (az egyes rende-zett listákban a redundanciák mellőzésével). Az egymást kö-vető "Tempsub", "Subsort" és "Tempsubsort" rendezési műve-letek a kivonókönyvtárból származó, azonosított szekvenciá-kat csökkenő gyakoriság szám szerint rendezik, miáltalcsökkenő gyakorisági számok listáját kapjuk, amelyben min-den egyes gyakorisági szám egyetlen azonosított szekvencia-bejegyzésnek felel meg; vagy csökkenő gyakorisági számok több listáját kapjuk, ahol az egyes listákban szereplő gya-korisági számok egy kiválasztott típusú adatbázis-bejegyzéseknek felelnek meg (az egyes rendezett listákban a redundanciák mellőzésével). A "Temptarsort" művelet végén kapott transzkriptum-szekvenciák rendszerint olyan rendezett listákat reprezen-tálnak, amelyből hisztogram készíthető, amelyben az egyik (pl. a vízszintes) tengelyen a (célkönyvtár szekvenciáinak)gyakorisági száma, a másik (pl. a függőleges) tengelyen az azonosított szekvenciaérték (pl. humán vagy nem humán gén-típus) szerepel. Hasonlóan, a "Tempsubsort" művelet végénkapott transzkriptum-szekvenciák rendszerint olyan rende-zett listákat reprezentálnak, amelyből hisztogram készíthe-tő, amelyben az egyik (pl. a vízszintes) tengelyen a 48 (kivonókönyvtár szekvenciáinak) gyakorisági száma, a másik(pl. a függőleges) tengelyen az azonosított szekvenciaérték(pl. humán vagy nem humán géntípus) szerepel. A "Tempsubsort" és "Temptarsort" rendezőműveletekvégén kapott transzkriptum-szekvenciákat (rendezett listá-kat) a "Cruncher" művelet során egyesítjük. A "Cruncher"művelet a célkönyvtárból és a kivonókönyvtárból származó,megfelelő szekvenciák gyakorisági számának párjait azono-sítja, és a párok két tagját - a megfelelő gyakoriságiszámpárokra arányértékeket meghatározva - egymással osztja,és az arányértékeket csökkenő arányérték szerint rendezi. A"Cruncher" műveletből származó kimenő adatfolyam (a 2. áb-rán a "végső transzkriptum-szekvencia) rendszerint egy ren-dezett lista, amelyből hisztogram készíthető, melynek egyiktengelyén (a cél- és kivonókönyvtárból származó, megfelelő,azonosított szekvenciaértékekre vonatkozó) gyakorisági szá-mok arányának mérete, a másik tengelyen pedig az azonosí-tott szekvenciaérték (pl. géntípus) szerepel.In this case, the "Tempdesig" operation processes all transcript sequences representing the target directory to the "Templib" (and then "Libsort" and "Temptarsort") operations, and all transcript sequences representing the extract directory are "Tempsub" (majda "Subsort" and "Tempsubsort"). For example, sequential "Templib", "Libsort", and "Temptarsort" sorting operations are identified sequentially from the target directory by a decreasing frequency number, resulting in a list of decreasing frequency numbers in which each frequency number is a single identified sequence corresponds to an entry; or multiple lists of reduced-frequency numbers, where the frequency numbers in the individual lists correspond to database entries of a selected type (with no redundancy in each organized list). The sequential sequencing operations "Tempsub", "Subsort" and "Tempsubsort" sort the identified sequences from the extract directory by decreasing frequency number, resulting in a list of decreasing frequency numbers in which each frequency number is a single identified sequence corresponds to an entry; or multiple lists of descending frequency numbers, where the list numbers in each list correspond to a selected type of database entry (with no redundancy in each sorted list). The transcript sequences obtained at the end of the "Temptarsort" operation usually represent ordered lists from which a histogram can be made, in which the frequency of (target library sequences) on one (e.g., horizontal) axis and the other (e.g., vertical) axis is the number of frequencies. identified sequence value (e.g., human or non-human gene type). Similarly, transcript sequences obtained at the end of the "Tempsubsort" operation usually represent ordered lists from which a histogram can be made, in which one (e.g., the horizontal) axis has a frequency of 48 (extraction library sequences), the other (e.g. vertical) the identified sequence value (e.g., human or non-human gene type). The transcript sequences (ordered listings) at the end of the "Tempsubsort" and "Temptarsort" organizer operations are combined in the "Cruncher" operation. The "Cruncher" operation identifies the pairs of frequencies of the corresponding sequences from the target directory and the extract directory, and divides the two members of the pairs, determining ratios for the respective frequency pairs, and arranges the ratios by decreasing ratio. The output stream from the "Cruncher" operation (Figure 2, "Final Transcript Sequence") is usually a set list from which a histogram can be created, the frequency of which on a single axis (the corresponding identified sequence values from the target and extract directory) and the identified sequence value (eg gene type) on the other axis.

Előnyösen, még mielőtt meghatároznánk a két könyv-tár gyakorisági értékeinek arányát, a "Cruncher" műveletminden egyes arányértéket elosztja a célkönyvtárban vagy akivonókönyvtárban (vagy mindkettőben) lévő szekvenciák ösz-szes számával. A "Cruncher" művelet által generált relatívarányértékek listája sok gyógyászati, tudományos és iparifelhasználásban előnyösen alkalmazható. Egy másik előnyösmegvalósítási mód szerint a "Cruncher" művelet kimenete egylistasorozat, amelyben minden egyes lista az adatbázis-bejegyzések egy másik kiválasztott részhalmazára (pl. pro- 49 teincsaládra) vonatkozó csökkenő arányértékek sorozatátreprezentálj a.Preferably, before determining the ratio of the frequency values of the two book repositories, the "Cruncher" operation divides each ratio by the total number of sequences in the target directory or extract directory (or both). The list of relational values generated by the "Cruncher" operation is advantageous for many medical, scientific and industrial uses. In another preferred embodiment, the output of the "Cruncher" operation is a single list sequence in which each list represents a series of descending ratio values for another selected subset of database entries (e.g., pro 49 milk family) a.

Az egyik példában a találmány szerinti gyakoriság-rendező-program egy adatbázisban azonosított minden egyesgénnek megfelelő mRNS-transzkriptum számát egy könyvtárra vonatkozóan táblázatba rendezi. Ezeket a számokat a kiónok összes számával osztjuk. Az osztás eredménye az mRNS-transzkriptumok relatív gyakoriságát tükrözi, abban a sejt-típusban vagy szövetben, amelyből a szekvenciák származnak.E végső adatsor kialakítását "géntranszkriptum-leképezésianalízisnek" nevezzük. Az eredményül kapott, kivont adatokpontosan megmutatják, hogy mely proteinek és gének túlsza-bályozottak, illetve alulszabályozottak. 6. példa HUVEC-cDNS-könyvtár A 2 . táblázatban egy indukált HUVEC-könyvtárban akülönböző géntranszkriptumok gyakorisági sorrendjét tüntet-tük fel (csökkenő gyakoriság szerint). Ez a számítógépesrendezés leegyszerűsíti a szövet vizsgálatát, és gyorsítjaaz e sejttípusra specifikus, lényeges, új proteinek azono-sítását. A szív- és érrendszer belhámját ez a belhámsejt-típus képezi, és minél többet tudunk összetételéről (különösen annak aktiválás hatására bekövetkező változásai-ról) , annál nagyobb esélyünk van arra, hogy e szövet beteg-ségeinek (mint pl. az atherosclerosis) kezeléséhez protein-célpontok váljanak elérhetővé. 50 7. példaIn one example, the frequency organizer program of the invention arranges a number of mRNA transcripts corresponding to each single gene identified in a database for a directory. These numbers are divided by the total number of clones. The result of the division reflects the relative frequency of the mRNA transcripts in the cell type or tissue from which the sequences are derived. The final data set is referred to as "gene transcription mapping". The resulting, extracted data points show which proteins and genes are overregulated or under-regulated. Example 6 HUVEC cDNA library A 2. Table 3 shows the order of frequency of different gene transcripts in an induced HUVEC library (decreasing frequency). This computer layout simplifies tissue testing and accelerates the identification of essential new proteins specific for this cell type. The cardiac and vascular endothelium is this endothelial cell type, and the more we know about its composition (especially its changes due to activation), the more chances we have of treating the diseases of this tissue (such as atherosclerosis). destinations become available. 50 Example 7

Monocita- és hízósejt-cDNS-könyvtárakA 3. és 4. táblázatban két könyvtár rövidített ösz- szehasonlítását mutatjuk be. Ezekben a táblázatokban a "normális monociták" a HMC-l-sejtek, az "aktivált makrofágok" pedig a PMA-val előkezelt és LPS-sel aktiváltTHP-l-sejtek. A 3. táblázatban csökkenő gyakorisági sor-rendben felsoroljuk mindkét sejttípus leggyakoribbgéntranszkriptumait. Ez a táblázat - mivel mindkét sejtbőlcsak 15 géntranszkriptumot mutat be - a leggyakoribbtranszkriptumok gyors kvalitatív összehasonlítását teszilehetővé. Ez a gyakoriság szerinti elrendezés - párhuzamosmegjelenítésével - közvetlenül alkalmazható kereső-eszköz-tárat nyújt. Ebben a példában ez a keresőeszköztár a követ-kezőkről ad felvilágosítást: (1) az aktivált makrofágok 15leggyakoribb transzkriptuma közül csak egy (a poliA-kötőprotein) található meg a normális monociták 15 leggya-koribb géntranszkriptuma között; és (2) egy új - más adat-bázisokban korábban nem szereplő - géntranszkriptum vi-szonylag nagy mennyiségben van jelen az aktiváltmakrofágokban, a normális makrofágokban azonban kevésbégyakori. Egy ilyen kereső-eszköztár rövidített eljárástbiztosít az új proteinek (pl. receptorok, sejtfelületi ésintracelluláris jelzőmolekulák) megtalálására, melyek a ha-gyományos gyógyszer-szkrínelési programok gyógyszer-célpontjaiként szolgálhatnak. Egy ilyen eszköztár a sejtbenés a sejt környékén lévő, lényeges proteinek azonosításátcélzó " találat/hiba" ("hit and miss" ) keresőprogramok idő- 51 igényéhez képest jelentős időmegtakarítást biztosít, mivel azok a proteinek, amelyek a szokásos celluláris funkciókat végzik, és amelyeket készenléti állapotú mRNS reprezentál,gyorsan kivonhatok a további karakterizálás alól.Monocyte and mast cell cDNA libraries In Tables 3 and 4, a shortened comparison of two libraries is shown. In these tables, "normal monocytes" are HMC-1 cells, and "activated macrophages" are PMA pretreated and LPS-activated THP-1 cells. Table 3 lists the most frequent gene transcripts of both cell types in descending order of frequency. This table, as it shows only 15 gene transcripts from both cells, allows a quick qualitative comparison of the most common transcripts. This provides a direct-to-search search toolbox with a parallel display of frequency. In this example, this search tool provides information on: (1) only one of the 15 most common transcripts of activated macrophages (the polyA binding protein) is found among the 15 most common gene transcripts of normal monocytes; and (2) a new gene transcript, not previously included in other data bases, is present in relatively large amounts in activated macrophages, but less common in normal macrophages. Such a search toolkit provides an abridged procedure for finding new proteins (e.g., receptors, cell surface and intracellular signaling molecules) that can serve as drug targets for conventional drug screening programs. Such a toolbox provides significant time savings compared to the need for "hit / miss" search engines for identifying important proteins in the vicinity of the cell, as proteins that carry out the normal cellular functions and which are in standby state mRNA, can be extracted quickly from further characterization.

Ez jól szemlélteti, hogy a megváltozott cellulárisfunkcióval hogyan változnak a géntranszkripciós profilok. Aszakemberek tudják, hogy a sejtek biokémiai összetétele másfunkcionális változások (pl. rák, belértve a rák különbözőstádiumait, továbbá mérgezések) hatására is módosul. Azilyen génexpressziós és proteinvizsgálatok első szkrínelésieszközeként jól alkalmazható az olyan géntranszkriptum-kivonási profil, mint amilyet a 3. táblázatban mutatunk be. 8. példa.This illustrates how the altered cellular function changes the gene transcription profiles. It is well known to those skilled in the art that the biochemical composition of cells is altered by other functional changes (e.g., cancer, including various stages of cancer, and poisoning). As a first screening tool for such gene expression and protein assays, a gene transcriptional extraction profile such as that shown in Table 3 can be used well. Example 8.

Normális monicita- és aktivált monocita-cDNS-könyvtár kivo-nási analíziseElimination analysis of a normal monocyte and activated monocyte cDNA library

Miután a cDNS-adatokat számítógépbe tápláltuk, azelőző példában tárgyalt két könyvtárban lévő valamennyigéntranszkriptum arányainak kiszámítására az 5. táblázatbanbemutatott számítógépes programot alkalmaztuk, a gén-transzkriptumokat pedig csökkenő arányértékeik szerint ren-deztük. Amennyiben egy géntranszkriptum nincs képviselve azegyik könyvtárban, gyakorisága ismeretlen, de nyilvánvalóanegynél kisebb. Közelítésként - és hogy olyan arányt kap-junk, amely nem volna lehetséges, ha a nem képviselt génhez0 gyakoriságot rendelnénk - a két könyvtár közül csak azegyikben képviselt génekhez 1/2 gyakorisági értéket rende-lünk. Ha a nem képviselt kiónokhoz 1/2 értéket rendelünk, 52 nő a "bekapcsolt" és "kikapcsolt" gének relatív jelentősé-ge, melyek termékei lehetséges gyógyszer-célpontok lehet-nek. A kapott eredménylistát kivonási táblázatnak nevezzük,és igen értékes szkrínelési módszert képvisel, amint azt azalábbi adatok is mutatják. A 4. táblázat egy kivonási táblázat, amelyben anormális monociták könyvtárát elektronikusan "kivontuk" azaktivált makrofágok könyvtárából. Ez a táblázat leghatéko-nyabban a géntranszkriptumok azon gyakoriságváltozásaitemeli ki, amelyek a makrofágok aktiválásának hatására kö-vetkeztek be. Még az első 20 felsorolt géntranszkriptum kö-zött is több ismeretlen található. Ilyenformán, az elektro-nikus kivonás olyan előnyös eszköz, amelynek segítségévelkét sejttípus közötti alapvető biokémiai változások sokkalgyorsabban azonosíthatók. Az ilyen eszköz a kutatásradollármilliárdokat költő egyetemek és gyógyszergyárak szá-mára értékes időt spórolhat meg a kutatás korai stádiumai-ban, és felgyorsíthatja a gyógyszerfejlesztési ciklust, amiviszont lehetővé teszi a gyógyszerszkrínelő programok sok-kal korábbi beindítását. Ilyenformán, ez a keresőeszköz mó-dot biztosít arra, hogy az új gyógyszerek gyorsabban ésgazdaságosabban kerüljenek a nagyközönség elé.After the cDNA data were fed into a computer, the computer program shown in Table 5 was used to calculate the ratios of all transcripts in the two libraries discussed in the previous example, and the gene transcripts were arranged according to their decreasing ratios. If a gene transcript is not represented in one of the libraries, its frequency is unknown, but less than obvious. As an approximation - and to obtain a ratio that would not be possible if the frequency of the unrepresented gene0 is assigned - only one of two genes represented in each library is assigned a frequency of 1/2. If 1/2 is assigned to unrepresented clones, 52 increase the relative importance of the "on" and "off" genes, whose products may be possible drug targets. The resulting result list is called a subtraction table and represents a very valuable screening method as shown by the following data. Table 4 is a subtraction table in which the library of abnormal monocytes was "extracted" electronically from the library of activated macrophages. This table most efficiently highlights the frequency changes of gene transcripts that have occurred as a result of macrophage activation. Even the first 20 listed gene transcripts are also unknown. Thus, electronic subtraction is a preferred means by which the basic biochemical changes between the two cell types can be identified more quickly. Such a tool saves valuable time for universities and pharmaceutical companies that spend on research radar billions in the early stages of research, and can accelerate the drug development cycle, allowing for much earlier launching of drug screening programs. In this way, this search tool provides a way for new drugs to reach the general public faster and more economically.

Kivonási táblázatot készíthetünk betegek diagnosz-tizálása céljából is. Egy bizonyos betegből származó mintát(pl. biopsziából vagy vérmintából nyert monocitákat) - amakrofág-aktiválással összefüggő állapotok diagnosztizálása érdekében - az itt leírt adatokkal hasonlíthatunk össze. 53 A 4. táblázat sok új géntranszkriptumot felfedett(címkézett "Incyte"-kiónok). Megjegyezzük, hogy az aktiváltmakrofágban sok gén "bekapcsolt" állapotban van (vagyis amonocita gyakorisági száma a "bgfreq" oszlopban 0) . Ez aszkrínelési módszer sokkal előnyösebb, mint az egyébszkrínelési technikák (pl. a "western-blot"-analízis), me-lyekkel nem tárható fel ilyen mennyiségű új, egymástól füg-getlen géntranszkriptum. A kivonási-szkrínelési technika az aktivált makrofágban számos rákgén-transzkriptumot is felfedett(rho, ETS2, rab-2 ras, YPTl-rokon-onkogének és akutmieloid-leukémia-mRNS). Ezek a transzkriptumok az immor-talizált sejtvonalak alkalmazásának tudhatok be, s emiatt érdekesek. Ez a szkrínelési technika részletes képet nyújta túlszabályozott transzkriptumkról (beleértve az onko-géneket), ami segít megmagyarázni, hogy a rákelleni gyógy-szerek miért befolyásolják a páciens - aktivált makrofágok által közvetített - immunitását. A szakemberek - e szkrínelési eljárásból származó ismeretek birtokában - mégcélirányosabb, még hatásosabb gyógyszerszkrínelési progra-mok alakíthatók ki, hogy olyan gyógyszereket azonosítsunk,amelyek differenciáltan hatásosak (1) a releváns rákokkalés az aktíváit makrofágok jellemezte állapottal szemben;(2) kizárólag a rák ellen; és (3) kizárólag az aktiváltmakrofág jellemezte állapottal szemben.A withdrawal table can also be prepared for diagnosing patients. A sample from a particular patient (e.g., monocytes obtained from a biopsy or blood sample) can be compared to the data described herein to diagnose conditions associated with amacrophage activation. 53 Table 4 reveals many new gene transcripts (labeled "Incyte" connector). It should be noted that in the activated macrophage, many genes are "on" (i.e., the number of amonocyte frequencies in the "bgfreq" column 0). This asynchronous method is much more advantageous than other screening techniques (e.g., "western blot" analysis), which does not detect such new, independent gene transcripts. The extraction-screening technique in the activated macrophage also revealed a number of cancer gene transcripts (rho, ETS2, rab-2 ras, YPT1-related oncogenes, and acmyeloid leukemia mRNA). These transcripts are known for the use of immoral cell lines and are therefore of interest. This screening technique provides a detailed picture of overregulated transcripts (including on-genes), which helps explain why cancer drugs affect the patient's activated macrophage-mediated immunity. Those skilled in the art, having knowledge of this screening process, can develop even more targeted, even more effective drug screening programs to identify drugs that are differentially effective (1) against a condition characterized by the active cancer macrophages, (2) solely against cancer; and (3) solely against the condition characterized by activated macrophage.

Az aktivált makrofágokban a simaizom-elöregedési protein (22 kD) túlszabályozott volt, ami azt jelzi, hogy a 54 gyulladáscsillapításban lehetséges (blokkolandó célpontotképvisel. 9. példaIn the activated macrophages, the smooth muscle aging protein (22 kD) was over-regulated, indicating that it is possible in the 54 anti-inflammatory (target target to be blocked).

Normális májsejtek és hepatitisvírussal fertőzött máj sejtek cDNS-könyvtárainak kivonási analíziseExtraction analysis of cDNA libraries of normal liver cells and hepatitis virus-infected liver cells

Ebben a példában patkányokat hepatitisvírussal fer-tőzünk, és addig tartjuk őket a kolóniában, amíg a májgyul-ladás határozott tüneteit nem mutatják. A diagnózis szerintmáj gyulladásos patkányok felét új májgyullladás-elleniszerrel (AHA) kezeljük. A hepatitisvírussal végzett fertő-zés előtt, illetve az AHA-val végzett kezelés után (vagy a nem kezelt csoportban a fertőzés után) valamennyi patkány-ból májmintát veszünk. Ezenkívül, közvetlenül az AHA- kezelés előtt is vehetünk májmintákat.In this example, the rats are infected with the hepatitis virus and kept in the colony until the definite symptoms of hepatitis are shown. According to the diagnosis, half of the liver inflammatory rats are treated with a new anti-inflammatory disease (AHA). Before the infection with the hepatitis virus or after treatment with AHA (or in the untreated group after infection), all rats are sampled. In addition, liver samples can be taken directly before treatment with AHA.

A máj szövetet - mRNS kinyerése, majd cDNS szekvenálása érdekében - a 2. és 3. példában leírtak sze-rint kezeljük. Az egyes mintákból származó cDNS-eket az 5.táblázatban leírt számítógépes programmal feldolgozzuk ésgyakoriságra vizsgáljuk. A cDNS géntranszkriptum-leképezéserészletes képet nyújt az egyes állatok alapállapotáról(kontroll), illetve fertőzött és/vagy kezelt állapotáról. Aminták egyik csoportjára kapott cDNS-adatokat valamennyikontroll mintára, valamennyi - fertőzött patkányból szárma-zó - mintára és az AHA-val kezelt patkányokból származómintákra kapott géntranszkriptum-profilt összegző csoporttáegyesíthetjük. 55 A kivonásokat a megfelelő, egyes könyvtárak és acsoportosított könyvtárak között végezzük. Az egyes állatoktekintetében a kontroll és a vizsgálat utáni mintákat von-hatjuk ki. Ha az AHA-kezelés előtti és utáni állapotból is van mintánk, az egyes állatokból és kezelési csoportokból származó adatokat vonjuk ki. Emellett, az összes kontrollmintára vonatkozó adatot egyesíthetjük és átlagolhatjuk. Akontroll átlaga kivonható az AHA-val kezelt patkányokbólszármazó, vizsgálat utáni cDNS-minták és az AHA-val nem ke-zelt patkányokból származó, vizsgálat utáni cDNS-minták át-lagából. Ha kezelés előtti és utáni minták állnak rendelke-zésre, ezek egyenként hasonlíthatók össze (vagy elektroni-kusan átlagolhatok) és kivonhatok.The liver tissue was recovered as described in Examples 2 and 3 for the recovery of mRNA and sequencing of cDNA. The cDNAs from each sample were processed with the computer program described in Table 5 and examined for frequency. The cDNA provides a gene transcript mapping detail of the basal state (control) and infected and / or treated status of each animal. The cDNA data obtained for a group of samples can be pooled into all control samples, a pool of gene transcript profiles obtained from samples from infected rats and from samples from AHA-treated rats. Extracts are performed between the appropriate libraries and grouped libraries. In each animal, the control and post-test samples may be drawn. If there is a sample before and after AHA treatment, data from each animal and treatment group is extracted. Additionally, data for all control samples can be combined and averaged. The control mean can be subtracted from post-test cDNA samples from AHA-treated rats and from post-test cDNA samples from non-AHA-induced rats. If pre- and post-treatment samples are available, they can be compared individually (or averaged electronically) and extracted.

Ezeket a kivonási táblázatokat két általános módon alkalmazzuk. Az első szerint a különbségeket azokra agéntranszkriptumokra vonatkozóan vizsgáljuk, amelyek a májfolyamatos károsításával vagy gyógyulásával függnek össze.A kivonási táblázatok eszközt biztosítanak a gyógyszereskezelés hatásainak és a májgyulladás alapvető patológiájá-nak megkülönböztetésére. Mivel a májgyulladás sok paramé-tert érint, korábban - a hagyományos enzimekre irányulóvértesztekkel - további májtoxicitás kimutatása bonyolultvolt. A géntranszkriptum-profil és -kivonás sokkal össze-tettebb biokémiai képet nyújt, amelyre a kutatóknak szüksé-gük van az ilyen bonyolult problémák analizálására. A második alkalmazási mód szerint a kivonási táblá-zatok klinikai markerek, egyes proteinek vagy más biokémiaideterminánsok azonosításának eszközét biztosítják, melyek 56 egy klinikai végpont (pl. betegség), gyógyszer hatására be-következő javulás vagy a gyógyszer miatt kialakuló továbbibetegségek előzetes meghatározására és/vagy értékelésérealkalmazhatók. A kivonási táblázatok specifikusan emelik kia be-, illetve kikapcsolt géneket, ilyenformán, ezek a táb-lázatok a klinikai markerekként potenciálisan alkalmazható géntranszkriptumok készletének első szkrinelését teszik le-hetővé. Ezt követően a további sejt- és szövetkönyvtárak elektronikus kivonása megmutatja, hogy a potenciálismarkerek közül melyek azok, amelyek valóban különböző sejt-vagy szövetkönyvtárban találhatók. A további könyvtárakbantalálható géntranszkriptumokat eltávolítjuk a potenciálisklinikai markerek készletéből. Ezután vérminták vagy más, megfelelő minták (melyekről ismert, hogy az adott feltétel-nek eleget tesznek-e vagy sem) tesztjeit összehasonlítjuk,hogy megerősítsük a klinikai marker kiválasztásának helyes-ségét. Ebben az eljárásban a proteintranszkriptum fizioló-giai működését nem kell meghatározni ahhoz, hogy agéntranszkriptumot klinikai markernek minősítsük. 10. példa.These extraction tables are applied in two general ways. According to the first, the differences are investigated for those brain transcripts that are dependent on hepatic progression or healing. Extraction tables provide a means of distinguishing the effects of drug treatment and the underlying pathology of hepatitis. Since liver inflammation affects many parameters, it has been complicated to detect further liver toxicity in the past, with blood tests for conventional enzymes. The gene transcript profile and excretion provide a much more complex biochemical image that researchers need to analyze such complex problems. According to the second embodiment, the extraction tables provide a means for identifying clinical markers, individual proteins, or other biochemical determinants which are 56 for the predetermination of a clinical endpoint (e.g., disease), drug-induced improvement, or drug-induced illnesses and / or They can be used to evaluate. The extraction tables specifically raise genes for in and out of genes, thus, these tables make the first screening of a set of gene transcripts potentially applicable as clinical markers. Subsequently, the electronic subtraction of further cell and tissue libraries shows which of the potential markers are actually located in different cell or tissue libraries. Additional library-accessible gene transcripts are removed from the pool of potential clinical markers. Blood samples or other appropriate samples (known to fulfill the condition) are then compared to confirm the appropriateness of selecting a clinical marker. In this method, the physiological function of the protein transcript is not determined to qualify as an agonist transcript as a clinical marker. Example 10.

Elektronikus "northern-blot"-analízisElectronic "Northern blot" analysis

Az elektronikus kivonás egyik hátránya, hogy alkal-mazásával egynél több képpár egyidejű összehasonlítása bo-nyolult. Miután megállapítottuk, hogy az adott géntermékekalkalmasak további vizsgálatra (pl. elektronikus kivonássalvagy más eljárásokkal), előnyös, ha az egyes génekexpresszióját több különböző szövetben is tanulmányozzuk. 57One of the drawbacks of electronic subtraction is that, by applying, more than one pair of images is simultaneously compared. Once it has been determined that the particular gene products are suitable for further testing (e. G., Electronic extraction or other methods), it is preferred that the expression of each gene is studied in several different tissues. 57

Laboratóriumban erre a célra a "northern-blot"-hibridi-zációt alkalmazzák. E technika során egy cDNS-t - vagymegfelelő próbáját - megjelölnek, majd különböző szövetekés sejttípusokból készített RNS-mintákat tartalmazó blottalhibridizálják. Az adott (egyszerre egy) gén expressziójánakmintázata autoradiográfiával valamennyi mintában kvantita-tívan meghatározható. A találmány egy további megvalósítási módja szerinta fenti eljárás egy számítógépes változatát végezzük, me-lyet "elektronikus northern-blot" analízisnek nevezünk. Eváltozat szerint egyetlen gén expresszióját az adatbázisbantárolt - előkészített és szekvenált - könyvtárakkal szembenvizsgáljuk. Ezzel az eljárással bármely kiszemelt génexpressziójának mintázatát gyorsan és egyszerűen vizsgál-hatjuk. Több kiszemelt gén átvizsgálására van lehetőség,ami gyakoribb és hasznos felfedezéseket tesz lehetővé. Az5. táblázatban bemutatott számítógépes program magábanfoglalja az ebben a példában leírt működést végrahajtóprogramot. A 6. táblázatban az elektronikus "northern-blot" -analízishez alkalmazott adatbázis bejegyzéseinekrészleges listáját mutatjuk be. 11. példa I. fázisú klinikai kísérletekIn the laboratory, "northern blot" hybridization is used for this purpose. In this technique, a cDNA is labeled as a suitable probe and then blotted hybridized with RNA samples from different tissue and cell types. The expression pattern of a given gene (at one time) can be quantitatively determined by autoradiography in all samples. In a further embodiment of the invention, a computer version of the above method is described, which is referred to as "electronic Northern blot" analysis. According to a variant, the expression of a single gene is examined against the library libraries - prepared and sequenced. By this method, the pattern of any of the selected gene expression can be tested quickly and easily. It is possible to scan multiple selected genes, which allows more frequent and useful discoveries. AZ5. The computer program shown in Table 1A includes a program for executing the operation described in this example. Table 6 shows a partial list of database entries for electronic "northern blot". Example 11 Phase I clinical trials

Miután a fenti állattesztekben megbizonyosodtunk atalálmány szerinti eljárás biztonságáról és hatékonyságá-ról, I. fázisú klinikai tesztekbe kezdünk. Egészséges sze-mélyeket hagyományos, előzetes klinikai laboratóriumi tesz- 58 teknek vetünk alá, és megfelelő mintákat veszünk, melyekkelgéntranszkriptum-analízist végzünk. A teszt során a pácien-sekből - meghatározott időközönként - újabb mintákat ve-szünk. A mintákat a fentebb leírtak szerint végzettgéntranszkriptum-analízisnek vetjük alá. A patkányokbanvégzett toxicitási vizsgálat során feljegyzett gén-transzkriptum-változásokat a páciensek esetében óvatosanértékeljük klinikai markerekként. A géntranszkriptum- analízisben tapasztalt változásokat klinikai tünetekkel ésegyéb laboratóriumi eredményekkel összefüggésben értékeljüka toxicitás indikátoraiként. A kivonást az egyes páciensekmintáival és a páciensek mintáinak átlagával is elvégezzük. A kivonási analízis a kezelt páciensben mindenféle toxiko-lógiai változásra rávilágít, ami a toxicitás igen kifino-mult determinánsát képezi. A kivonási eljárás klinikai mar-kereket is annotál. A kivonási analízissel további alcso-portok is vizsgálhatók; ezek közé tartozik, például, (1) azavaró hatás előfordulása és típusa szerinti szegregáció,és (2) az adagolás szerinti szegregáció. 12. példa Géntranszkriptum-leképező analízis klinikai vizsgálatokban A géntranszkriptum-leképező analízis (vagy az ösz- szetett géntranszkriptum-leképező analízis) más klinikai vizsgálatokban is előnyösen alkalmazható. A géntransz-kriptum-analí zissel különböző fajokból származó, azonos tí-pusba tartozó sejteket hasonlíthatunk össze, például, améregtelenítésért felelős enzimrendszerben megfigyelhető 59 specifikus különbségek kimutatása érdekében. Az ilyen tesz-telés segítséget nyújt a humán vagy állatgyógyászatban tör-ténő alkalmazásra szánt gyógyszerek szkríneléséhez vagy to-xikológiai teszteléséhez alkalmazható állatmodell kiválasz-tásában és érvényesítésében. Amikor különböző fajokba tar-tozó állatok közötti összehasonlítást az egyes fajokra vo-natkozó oszlopokban mutatjuk be, az összehasonlítást fajokközötti összehasonlításnak vagy " zoo-blot"-nak nevezzük. A találmány megvalósítási módjaiban például a Mic-rosoft Corporation-tól beszerezhető "FoxBASE" programnyel-ven írt adatbázisokat alkalmazhatjuk. A találmány más meg-valósítási módjaiban más adatbázisokat alkalmazunk, pl. az5,270,170 számú Egyesült Államok-beli szabadalmi leírásban(Cull és mtsai. 1993. december 14.), a WO 93/22684 számú PCT nemzetközi közzétételi iratban (1993. november 11.), a WO 93/06121 számú PCT nemzetközi közzétételi iratban (1993.április 1.), illetve a WO 91/19818 számú PCT nemzetköziközzétételi iratban (1991. december 26.) leírt típusúrandom peptid-adatbázist, polimer-adatbázist, szintetikusoligomer-adatbázist, illetve oligonukleotid-adatbázist. Enégy hivatkozás (melyeket teljes terjedelmükben a kitanítás részeként kell tekinteni) olyan tudnivalókat tartalmaz,amelyek felhasználhatók a találmány egyéb megvalósítási módjainak gyakorlati kivitelezésére. A leírásban említett valamennyi hivatkozást teljesterjedelmében a kitanítás részének tekintjük. A szakemberek számára nyilvánvaló, hogy a találmányszerinti eljárás és rendszer vonatkozásában különböző módo- - 60 - sítások és változtatások lehetségesek, anélkül, hogy eltér-nénk a találmány tárgyától. Bár a találmány szerinti megol-dást a specifikus előnyös megvalósítási módokon keresztülismertettük, tudni kell, hogy a találmány tárgya és oltalmiigényünk nem korlátozódik csupán ezekre a bemutatott megva-lósítási módokra. • · - 61 - 1. táblázat A betűkódok jelentéseAfter verifying the safety and efficacy of the method of the invention in the above animal assays, we begin with Phase I clinical trials. Healthy dogs were subjected to conventional pre-clinical laboratory tests and samples were taken which were subjected to gene transcript analysis. During the test, new samples are taken from the patients at specified intervals. Samples were subjected to a gene transcript analysis as described above. Gene transcript changes recorded in the rat toxicity study are carefully evaluated as clinical markers for patients. Changes in gene transcript analysis are evaluated as clinical indicators and other laboratory results as toxicity indicators. Extraction is also performed on individual patient samples and on average patient samples. The extraction analysis in the treated patient highlights any toxicological change that is a very sophisticated determinant of toxicity. The extraction procedure also includes clinical markers. Further subgroups can be examined by subtraction analysis; these include, for example, (1) segregation according to the occurrence and type of seizure effect, and (2) segregation according to dosage. EXAMPLE 12 Gene Transcript Mapping Analysis in Clinical Trials Gene transcription imaging (or complex gene transcription imaging) may be used advantageously in other clinical trials. Gene transcript analysis can be used to compare cells of the same type from different species, for example, to detect 59 specific differences in the enzyme system responsible for amelioration. Such testing assists in the selection and validation of an animal model for screening or toxicological testing of drugs for use in human or veterinary medicine. When comparisons between animals of different species are presented in columns for each species, the comparison is called inter-species comparison or "zoo-blot". In embodiments of the invention, for example, databases written using the "FoxBASE" program available from Microsoft Corporation may be used. In other embodiments of the invention, other databases are used, e.g. U.S. Patent No. 5,270,170 to Cull et al., December 14, 1993, PCT International Publication No. WO 93/22684, November 11, 1993, PCT International Publication No. WO 93/06121. (April 1, 1993) and WO 91/19818, PCT International Publication (December 26, 1991), a database of a peptide, a polymer database, a synthetic oligomer database, and an oligonucleotide database. Four references (which are to be considered in their entirety as part of the teaching) contain information that can be used to practice other embodiments of the invention. All references mentioned herein are considered to be part of the disclosure in its entirety. It will be appreciated by those skilled in the art that various methods and modifications of the method and system of the invention are possible without departing from the scope of the invention. Although the present invention has been described in the specific preferred embodiments, it is to be understood that the subject matter of the invention and its claims are not limited to these embodiments disclosed. • · - 61 - Table 1 Meaning of letter codes

Meghatározások (D) Könyvtár (L) Megoszlás (D) E = pontos U = U937 C = nem specifikus H = homológ M = HMC P = sejt/szövet-spec. 0 = más faj T = THP-1 U = ismeretlen N = nincs illeszkedés H = HUVEC D = nem kódoló gén S = lép Állapot (I) U = nem olvasható le L = tüdő 0 = pillanatnyilag R = ismétlődő RNS Y= T- és B-sejt nem érdekes; A = csak poli-A A = adenoid 1 = primer analízis V = csak vektor Faj (S) végzése; M = mitokond. DNS H = ember 2 = primer analízis S = kihagyás (" skip" ) A = majom megtörtént; I = illeszkedő P = sertés 3 = teljes hosszú- "Incyte"-klón D = kutya ságú szekvencia; X = EST-illeszkedés V= szarvasmarha 4 = másodlagos ana- B = nyúl 1 í z i s; Elhelyezkedés (L) R = patkány 5 = szövet N = sejtmagi M = egér " northern" C = citoplazmikus S = hörcsög 6 = teljes hosszú- K = citoszkeleton C = csirke ság elérése E = sejtfelület F = kétéltű Z = intracell. memb. I = gerinctelen M = mitokondriális Z = egysejtű S = szekretált G = gomba U = ismeretlen X = egyéb • · - 62 - 1. táblázat A betűkódok jelentése (folytatás)Definitions (D) Library (L) Distribution (D) E = exact U = U937 C = non-specific H = homologous M = HMC P = cell / tissue spec. 0 = other species T = THP-1 U = unknown N = no match H = HUVEC D = non-coding gene S = spleen Status (I) U = unreadable L = lung 0 = currently R = repetitive RNA Y = T- and B cells are not interesting; A = only poly-A A = adenoid 1 = primary analysis V = vector only Species (S); M = mitochond. DNA H = human 2 = primary analysis S = skip A = monkey completed; I = fitting P = pig 3 = full length- "Incyte" clone D = canine sequence; X = EST fit V = cattle 4 = secondary an B = rabbit 1 z z s; Location (L) R = rat 5 = tissue N = nuclear M = "northern" C = cytoplasmic S = hamster 6 = total long- K = cytoskeleton C = chicken E = cell surface F = amphibian Z = intracell. memb. I = invertebrate M = mitochondrial Z = unicellular S = secreted G = fungus U = unknown X = other • · - 62 - Table 1 Reporting of letter codes (continued)

Funkció (R) T = transzláció L = "protein-processing" R = riboszomális protein 0 = onkogén G = GTP-kötőprotein V = víruselem Y = kináz/foszfatáz A = tumorantigénnelkapcsolatos I = kötőproteinek D = NA-kötő/transzkripció B = Felületi molekula/receptorC = Ca++-kötőproteinS = ligandumok/effektorok H = "stress response" protein E = enzim F = ferroproteinP = proteáz/inhibitor Z = oxidativ foszfori- lálás Q = cukormetabolizmus M = aminosav-metabolizm N = nukleinsav-metabol. W = lipidmetabolizmus K = strukturális X = egyéb U = ismeretlen 63 2. táblázatFunction (R) T = translation L = "protein-processing" R = ribosomal protein 0 = oncogenic G = GTP-binding protein V = virus element Y = kinase / phosphatase A = tumor-antigen-linked I = binding proteins D = NA-binding / transcription B = Surface molecule / receptorC = Ca ++ - binding protein S = ligands / effectors H = "stress response" protein E = enzyme F = ferroprotinP = protease / inhibitor Z = oxidative phosphorylation Q = sugar metabolism M = amino acid metabolism N = nucleic acid metabolite. W = lipid metabolism K = structural X = other U = unknown 63 Table 2

Kiónok száma: 15000 - 20000Könyvtárak: HUVECNumber of clones: 15000 - 20000Libraries: HUVEC

Rendezés: előfordulási gyakoriság szerint Összes vizsgált klón: 5000 db. 319 gén, összesen 1713 klón esetén number N c entry s descriptor 1 15365 67 HSRPL41 Riboptn L41 2 15004 65 NCY015004 INCYTE 015004 3 15638 63 NCY015638 INCYTE 015633 4 15390 50 NCY015390 INCYTE 015390 5 15193 47 HSFIB1 Fibronectin 6 15220 47 RRRPL9 R Riboptn L9 7 15280 47 NCY01S280 INCYTE 015280 8 15533 33 M62O6O EST HHCH09 (IGR) 9 15662 31 HSACTCGR Actin, gamma 10 15026 29 NCYO15O26 INCYTE 015026 11 15279 24 HSEF1AR Elf 1-alpha 12 15027 23 NCYO15O27 INCYTE 015027 13 15033 20 NCY015033 INCYTE 015033 14 15198 20 NCY015198 INCYTE 015198 15 15309 20 HSCOLL1 Collagenase 16 15221 19 NCYO15221 INCYTE 015221 17 15263 19 NCYO15263 INCYTE 015263 18 15290 19 NCYO1529O INCYTE 015290 19 15350 18 NCY015350 INCYTE 015350 20 15030 17 NCY01S030 INCYTE 015030 21 15234 17 NCYO15234 INCYTE 015234 22 15459 16 NCYO15459 INCYTE 015459 23 15353 15 NCY015353 INCYTE 015353 24 15373 15 S76965 Ptn kinase inhib 25 15255 14 HUMTHYB4 Thymosin beta-4 26 15401 14 HSLIPCR Lipocortin I 27 15425 14 HSPOLYAB Poly-A bp 23 18212 14 HUMTHYMA Thymosin, alpha 29 18216 14 HSMRP1 Motilitv relat ptn; MRP-1 30 15189 13 HS18D Interferon induc ptn 1-8D 31 15031 12 HUMFKBP FK506 bp 32 15306 12 HSH2AZ Histone H2A 33 15621 12 HUMLEC Lectin, B-galbp, 14kDa 34 15789 11 NCY015789 INCYTE 015789 35 16578 11 HSRPS11 Riboptn SÍI 36 16632 11 M61984 EST HHCA13 (IGR) 37 18314 11 NCY018314 INCYTE 018314 38 15367 10 NCY015367 INCYTE 015367 39 15415 10 HSIFNIN1 interferon induc mRNA 40 15633 10 HSLDHAR Lactate dehydrogenase 41 15813 10 CHKNMHCB C Myosin heavy Chain B 42 18210 10 NCY018210 INCYTE 018210 43 18233 10 HSRPII140 RNA polyraerase II 44 13996 10 NCY018996 INCYTE 018996 45 15088 9 HUMFERL Ferritin, light Chain 46 15714 9 NCY015714 INCYTE 015714 47 15720 9 NCY015720 INCYTE 015720 43 15863 9 NCY015863 INCYTE 015863 49 16121 9 HSET Endothelin 50 18252 9 NCY018252 INCYTE O182S2 51 15351 8 HUMALBP Lipid bp, adipocyte 52 15370 8 NCYO1537O INCYTE 015370 64 2. táblázat (folytatás; number N c entry 3 descriptor 53 15670 8 BTCIASHI V NADH-ubiq oxidoreductase 54 15795 8 NCY015795 INCYTE 015795 55 16245 8 NCY016245 INCYTE 016245 56 18262 8 NCY018262 INCYTE 018262 57 18321 8 HSRPL17 Riboptn L17 58 15126 7 XLRPL1BRF Riboptn L1 59 15133 7 HSAC07 Actin; béta 60 15245 7 NCY01S245 INCYTE 015245 61 15288 7 NCY015288 INCYTE 015288 62 15294 7 HSGAPDR G-3-PD 63 15442 7 HUMLAMB Laminin receptor 54k0a 64 154SS 7 HSNGMRNA Uracil DNA glycosylase 65 16646 7 NCY016646 INCYTE 016646 66 18003 7 HUMPAIA Plsmnogen activ gene 67 15032 6 HUMUB Ubiquitin 68 15267 6 HSRPS8 Riboptn S8 69 15295 6 NCYO15295 INCYTE 015295 70 15458 6 RNRPS10R R Riboptn S10 71 15832 6 RSGALEM R UDP-galactose epimerase 72 15928 6 HUMAPOJ Apolipoptn J 73 16598 6 HUMT3BM40 Tubulin, béta 74 18218 6 NCY018218 INCYTE 018218 75 18499 6 HSP27 Hydrophobic ptn p27 76 18963 6 NCY018963 INCYTE 018963 77 18997 6 NCY018997 INCYTE 018997 78 15432 5 HSAGALAR Galactosidase A, alpha 79 15475 5 NCY015475 INCYTE 015475 80 15721 5 NCY015721 INCYTE 015721 81 15865 5 NCY015865 INCYTE 015865 82 16270 5 NCY015270 INCYTE 016270 83 16886 5 NCY016886 INCYTE 016886 84 18500 5 NCY018500 INCYTE 018500 85 18503 5 NCY018503 INCYTE 018503 86 19672 5 RRRPL34 R Riboptn L34 87 15086 4 XLRPL1AR F Riboptn Lla 88 15113 4 HUMIFNWRS tRNA synthetase, trp 89 15242 4 NCY015242 INCYTE 015242 90 15249 4 NCY015249 INCYTE 015249 91 15377 4 NCY015377 INCYTE 015377 92 15407 4 NCY015407 INCYTE 015407 93 15473 4 NCY015473 INCYTE 015473 94 15588 4 HSRPS12 Riboptn S12 95 15684 4 HSEF1G Elf 1-gamma 96 15782 4 NCY015782 INCYTE 015782 97 15916 4 HSRPS18 Riboptn S18 98 15930 4 NCY015930 INCYTE 015930 99 16108 4 NCY016108 INCYTE 016108 100 16133 4 NCY016133 INCYTE 016133 65 3 . táblázat A normális monocitákban, illetve az aktivált makrofágokban leggyakoribb 15 génSort by: incidence Total clones tested: 5000 pcs. 319 gene for a total of 1713 clones number N c entry s descriptor 1 15365 67 HSRPL41 Riboptn L41 2 15004 65 NCY015004 INCYTE 015004 3 15638 63 NCY015638 INCYTE 015633 4 15390 50 NCY015390 INCYTE 015390 5 15193 47 HSFIB1 Fibronectin 6 15220 47 RRRPL9 R Riboptn L9 7 15280 47 NCY01S280 INCYTE 015280 8 15533 33 M62O6 EST HHCHO9 (IGR) 9 15662 31 HSACTCGR Actin, gamma 10 15026 29 NCYO15O26 INCYTE 015026 11 15279 24 HSEF1AR Elf 1-alpha 12 15027 23 NCYO15O27 INCYTE 015027 13 15033 20 NCY015033 INCYTE 015033 NCY015198 INCYTE 015198 15 15309 20 HSCOLL1 Collagenase 16 15221 19 NCYO15221 INCYTE 015221 17 15263 19 NCYO15263 INCYTE 015263 18 15290 19 NCYO1529O INCYTE 015290 19 15350 18 NCY015350 INCYTE 015030 21 15034 17 NCYO15234 INCYTE 015234 NCYO15234 INCYTE 015234 22 15459 23 15353 15 NCY015353 INCYTE 015353 24 15373 15 S76965 Ptn kinase inhibition 25 15255 14 HUMTHYB4 Thymosin beta-4 26 15401 14 HSLIPCR Lipocortin I 27 15425 14 HSPOLYAB Poly-A b p 23 18212 14 HUMTHYMA Thymosin, alpha 29 18216 14 HSMRP1 Motilitv relat ptn; MRP-1 30 15189 13 HS18D Interferon Induc ptn 1-8D 31 15031 12 HUMFKBP FK506 bp 32 15306 12 HSH2AZ Histone H2A 33 15621 12 HUMLEC Lectin, B-galbp, 14kDa 34 15789 11 NCY015789 INCYTE 015789 35 16578 11 HSRPS11 Riboptn LINE 36 16632 11 M61984 EST HHCA13 (IGR) 37 18314 11 NCY018314 INCYTE 018314 38 15367 10 NCY015367 INCYTE 015367 39 15415 10 HSIFNIN1 interferon induc mRNA 40 15633 10 HSLDHAR Lactate dehydrogenase 41 15813 10 CHKNMHCB C Myos heavy chain B 42 18210 10 NCY018210 INCYTE 018210 43 NCY018210 INCYTE 018210 43 HSRPII140 RNA Polyraase II 44 13996 10 NCY018996 INCYTE 018996 45 15088 9 HUMFERL Ferritin Light Chain 46 15714 9 NCY015714 INCYTE 015714 47 15720 9 NCY015720 INCYTE 015720 43 15863 9 NCY015863 INCYTE 015863 49 16121 9 HSY Endothelin 50 18252 9 NCY018252 INCYTE O182S2 HUMALBP Lipid bp, adipocyte 52 15370 8 NCYO1537O INCYTE 015370 64 Table 2 (continued; number N c entry 3 descriptor 53 15670 8 BTCIASHI V NADH-ubiq oxidoreductase 54 15795 8 NCY015795 INCYTE 015795 55 16 245 8 NCY016245 INCYTE 016245 56 18262 8 NCY018262 INCYTE 018262 57 18321 8 HSRPL17 Riboptn L17 58 15126 7 XLRPL1BRF Riboptn L1 59 15133 7 HSAC07 Actin; beta 60 15245 7 NCY01S245 INCYTE 015245 61 15288 7 NCY015288 INCYTE 015288 62 15294 7 HSGAPDR G-3-PD 63 15442 7 HUMLAMB Laminin Receptor 54k0a 64 154SS 7 HSNGMRNA Uracil DNA Glycosylase 65 16646 7 NCY016646 INCYTE 016646 66 18003 7 HELLEN Plsmnogen activ gene 67 15032 6 HUMUB Ubiquitin 68 15267 6 HSRPS8 Riboptn S8 69 15295 6 NCYO15295 INCYTE 015295 70 15458 6 RNRPS10R R Riboptn S10 71 15832 6 RSGALEM R UDP-galactose epimerase 72 15928 6 HUMT3BM40 Tubulin, beta 74 18218 6 NCY018218 INCYTE 018218 75 18499 6 HSP27 Hydrophobic ptn p27 76 18963 6 NCY018963 INCYTE 018963 77 18997 6 NCY018997 INCYTE 018997 78 15432 5 HSAGALAR Galactosidase A, alpha 79 15475 5 NCY015475 INCYTE 015475 80 15721 5 NCY015721 INCYTE 015721 81 15865 5 NCY015865 INCYTE 015721 81 15865 5 NCY015865 INCYTE INCYTE 016270 83 16886 5 NCY016886 INCYTE 016886 84 18500 5 NCY018500 INCYTE 018500 85 18503 5 NCY018503 INCYTE 018503 86 19672 5 RRRPL34 R Riboptn L34 87 15086 4 XLRPL1AR F Riboptn Lla 88 15113 4 HUMIFNWRS tRNA synthetase, trp 89 15242 4 NCY015242 INCYTE 015242 90 15249 4 NCY015249 INCYTE 015249 91 15377 4 NCY015377 INCYTE 015407 93 15473 4 NCY015473 INCYTE 015473 94 15588 4 HSRPS12 Riboptn S12 95 15684 4 HSEF1G Elf gamma 96 15782 4 NCY015782 INCYTE 015782 97 15916 4 HSRPS18 Riboptn S18 98 15930 4 NCY015930 INCYTE 015930 99 16108 4 NCY016108 INCYTE 016108 100 16133 4 NCY016133 INCYTE 016133 65 3. Table 15 The most common 15 genes in normal monocytes and activated macrophages

Normális monociták Aktivált makrofágok 1 Elongációs faktor-1-α Interleukin-1-β 2 Riboszomális foszfoprotein Makrofág gyulladás-protein-I 3 Riboszomális S8-homológ- protein Interleukin-8 4 β-globin Limfocita-aktiválógén 5 Ferritin-H-lánc Elongációs faktor-1-α 6 riboszomális L7-protein β-aktin 7 Nukleoplazmin " Rantes" T-sejt-specifikus protein 8 Riboszomális S20-homológ- protein Poli-A-kötőprotein 9 Trans zferrin-receptor Oszteopontin; nephropontin 10 Poli-A-kötőprotein cc-tumornekróz is-faktor 11 Transzláció szintjén sza-bályozott tumorprotein 011050 INCYTE-klón 12 Riboszomális S25-protein Cu/Zn-s zuperoxid-dizmutáz 13 SRP9 szignálfelismerő Adenilát-cikláz (élesztő- protein homológ) 14 H2A.Z-hiszton NGF-rokon B-sejt- aktiválómolekula 15 Riboszomális Ke-3-protein Gliaeredetű proteáz-nexin-I 66 4. táblázatNormal Monocytes Activated Macrophages 1 Elongation Factor-1-α Interleukin-1-β 2 Ribosomal Phosphoprotein Macrophage Protein-I 3 Ribosomal S8 Homologue Protein Interleukin-8 4 β-globin Lymphocyte Activating Gene 5 Ferritin-H Chain Elongation Factor -1-α 6 ribosomal L7 protein β-actin 7 Nucleoplasmin "Rantes" T-cell specific protein 8 Ribosomal S20 homologous protein Poli-A binding protein 9 Transferrin receptor Osteopontin; nephropontin 10 Poli-A binding protein cc-tumor necrosis is-factor 11 Tumor-regulated tumor protein 011050 INCYTE clone 12 Ribosomal S25 protein Cu / Zn zuperoxide dismutase 13 SRP9 signal recognition Adenylate cyclase (yeast protein homolog) 14 H2A.Z-histone NGF-related B-cell activating molecule 15 Ribosomal Ke-3 protein Glia-protease nexin-66 Table 4

Könyvtárak: THP-ILibraries: THP-I

Kivonó könyvtár: HMCExtracting Library: HMC

Rendezés: előfordulási gyakoriság szerint Összes vizsgált klón: 7375 db. 1057 gén, összesen 2151 klón esetén number entry s descriptor bgfreq rf end ratio 10022 HUMIL1 IL 1-beta 0 131 262.00 10036 HSMONCF IL-8 0 119 238.00 10089 HSLAG1CDN Lymphocyte activ gene 0 71 142.00 10060 HUMTCSM RANTES 0 23 46.000 10003 HUMMIP1A MIP-1 3 121 40.333 10689 HSOP Osteopontin 0 20 40.000 11050 NCY011050 INCYTE 011050 0 17 34.000 10937 HSTNFR TNF-alpha 0 17 34.000 10176 HSSOD Superoxide dismutase 0 14 28.000 10886 HSCDW40 B-cell activ,NGF-relat 0 10 20.000 10186 HUMAPR Early resp PMA-induc 0 9 18.000 10967 HUMGDN PN-1, glial-deriv 0 9 18.000 11353 NCY011353 INCYTE 011353 0 8 16.000 10298 NCY010298 INCYTE 010298 0 7 14.000 10215 HUM4COLA Collagenase, type XV 0 6 12.000 10276 NCY010276 INCYTE 010276 0 6 12.000 10488 NCY010488 INCYTE 010488 0 6 12.000 11138 NCY011138 INCYTE 011138 0 6 12.000 10037 HUMCAPPRO Adenylate cyclase 1 10 10.000 10840 HUMADCY Adenylate cyclase 0 5 10.000 10672 HSCD44E Cell adhesion glptn 0 5 10.000 12837 HUMCYCLOX Cyclooxygenase-2 0 5 10.000 10001 NCY010001 INCYTE 010001 0 5 10.000 10005 NCY010005 INCYTE 010005 0 5 10.000 10294 NCY010294 INCYTE 010294 0 5 10.000 10297 NCY010297 INCYTE 010297 0 5 10.000 10403 NCY010403 INCYTE 010403 0 5 10.000 10699 NCY010699 INCYTE 010699 0 5 10.000 10966 NCY010966 INCYTE 010966 0 5 10.000 12092 NCY012092 INCYTE 012092 0 5 10.000 12549 HSRHOB Oncogene rho 0 5 10.000 10691 HUMARF1BA ADP-ribosylation fctr 0 4 8.000 12106 HSADSS Adenylosuccinate synthetase 0 4 8.000 10194 HSCATHL Cathepsin L 0 4 8.000 10479 CLMCYCA I Cyclin A 0 4 8.000 10031 NCY010031 INCYTE 010031 0 4 8.000 10203 NCY010203 INCYTE 010203 0 4 8.000 10288 NCY010288 INCYTE 010288 0 4 8.000 10372 NCY010372 INCYTE 010372 0 4 8.000 10471 NCY010471 INCYTE 010471 0 4 8.000 10484 NCY010484 INCYTE 010484 0 4 8.000 10859 NCY010859 INCYTE 010859 0 4 8.000 10890 NCY010890 INCYTE 010890 0 4 8.000 11511 NCY011511 INCYTE 011511 0 4 8.000 11868 NCY011868 INCYTE 011868 0 4 8.000 12820 NCY012820 INCYTE 012820 0 4 8.000 10133 HSX1RAP IL-1 antagonist 0 4 8.000 10516 HUMP2A Phosphatase, regül 2A 0 4 8.000 11063 HUMB94 TNF-induc response 0 4 8.000 11140 HSHB15RNA HB15 gene; new lg 0 3 6.000 10788 NCY001713 INCYTE 001713 0 3 6.000 10033 NCY010033 INCYTE 010033 0 3 6.000 10035 NCY010035 INCYTE 010035 0 3 6.000 10084 NCY010084 INCYTE 010084 0 3 6.000 10236 NCY010236 INCYTE 010236 0 ' 3 6.000 10383 NCY010383 INCYTE 010383 0 3 6.000 67 nutnber entry s descriptor bgfreq rf end 10450 NCY010450 INCYTE 010450 0 3 10470 NCY010470 INCYTE 010470 0 3 10504 NCY010504 INCYTE 010504 0 3 10507 NCY010507 INCYTE 010507 0 3 10598 NCY010598 INCYTE 010598 0 3 10779 NCY010779 INCYTE 010779 0 3 10909 NCY010909 INCYTE 010909 0 3 10976 NCY010976 INCYTE 010976 0 3 10985 NCY010985 INCYTE 010985 0 3 11052 NCY011052 INCYTE 011052 0 3 11068 NCY011068 INCYTE 011068 0 3 11134 NCY011134 INCYTE 011134 0 3 11136 NCY011136 INCYTE 011136 0 3 11191 NCY011191 INCYTE 011191 0 3 11219 NCY011219 INCYTE 011219 0 3 11386 NCY011386 INCYTE 011386 0 3 11403 NCY011403 INCYTE 011403 0 3 11460 NCY011460 INCYTE 011460 0 3 11618 NCY011618 INCYTE 011618 0 3 11686 NCY011686 INCYTE 011686 0 3 12021 NCY012021 INCYTE 012021 0 3 12025 NCY012025 INCYTE 012025 0 3 12320 NCY012320 INCYTE 012320 0 3 12330 NCY012330 INCYTE 012330 0 3 12853 NCY0128S3 INCYTE 012853 0 3 14386 NCY014386 INCYTE 014386 0 3 14391 NCY014391 INCYTE 014391 0 3 ratio 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 68 5. táblázat • Mister menü tor S03TRACT2CN outputSET TALK 0?? S3I SAFST? OFFS2T E3CACT CNSST TTPSAH2AD TO 0CLZAR ’Sort by: Frequency of occurrence Total clones tested: 7375. 1057 genes for a total of 2151 clones number entry s descriptor bgfreq rf end ratio 10022 HUMIL1 IL 1-beta 0 131 262.00 10036 HSMONCF IL-8 0 119 238.00 10089 HSLAG1CDN Activated gene 0 71 142.00 10060 HUMMIP1A MIP- 1 3 121 40.333 10689 HSOP Osteopont 0 20 40.000 11050 NCY011050 INCYTE 011050 0 17 34.000 10937 HSTNFR TNF-alpha 0 17 34.000 10176 HSSOD Superoxide dismutase 0 14 28.000 10886 HSCDW40 B-cell activation, NGF relat 0 10 20.000 10186 HUMAPR Early resp PMA -induc 0 9 18.000 10967 HUMGDN PN-1, glial-derivative 0 9 18.000 11353 NCY011353 INCYTE 011353 0 8 16.000 10298 NCY010298 INCYTE 010298 0 7 14.000 10215 HUM4COLA Collagenase, type XV 0 6 12000 10276 NCY010276 INCYTE 010276 0 6 12.000 10488 NCY010488 INCYTE 010488 0 6 12.000 11138 NCY011138 INCYTE 011138 0 6 12.000 10037 HUMCAPPRO Adenylate cyclase 1 10 10.000 10840 HUMADCY Adenylate cyclase 0 5 10.000 10672 HSCD44E Cell adhesion glptn 0 5 10.000 12837 HUMCYCLOX Cyclooxygenase-2 0 5 10.000 10001 NCY010001 INCYTE 010001 0 5 10.000 10005 NCY010005 INCYTE 010005 0 5 10.000 10294 NCY010294 INCYTE 010294 0 5 10.000 10297 NCY010297 INCYTE 010297 0 5 10.000 10403 NCY010403 INCYTE 010403 0 5 10.000 10699 NCY010699 INCYTE 010699 0 5 10.000 10966 NCY010966 INCYTE 010966 0 5 INCYTE 012092 0 5 10.000 12549 HSRHOB Oncogene rho 0 5 10.000 10691 HUMARF1BA ADP-ribosylation fctr 0 4 8.000 12106 HSADSS Adenylosuccinate synthetase 0 4 8.000 10194 HSCATHL Cathepsin L 0 4 8000 10479 CLMCYCA I Cyclin A 0 4 8.000 10031 NCY010031 INCYTE 010031 0 4 8000 10203 NCY010203 INCYTE 010203 0 4 8.000 10288 NCY010288 INCYTE 010288 0 4 8.000 10372 NCY010372 INCYTE 010372 0 4 8.000 10471 NCY010471 INCYTE 010471 0 4 8.000 10484 NCY010484 INCYTE 010484 0 4 8.000 10859 NCY010859 INCYTE 010859 0 4 8.000 10890 NCY010890 INCYTE 010890 0 4 8000 11511 INCYTE 010890 0 4 8.000 11511 NCY011511 INCYTE 011511 0 4 8.000 11868 NCY011868 INCYTE 011868 0 4 8.000 12820 NCY012820 INCYTE 012820 0 4 8000 10133 HSX1RAP IL-1 antagonist 0 4 8000 10516 HUMP2A Phosphatase, reg. 2A 0 4 8000 11063 HUMB94 TNF-induc response 0 4 8000 11140 HSHB15RNA HB15 gene; new lg 0 3 6.000 10788 NCY001713 INCYTE 001713 0 3 6.000 10033 NCY010033 INCYTE 010033 0 3 6.000 10035 NCY010035 INCYTE 010035 0 3 6.000 10084 NCY010084 INCYTE 010084 0 3 6.000 10236 NCY010236 INCYTE 010236 0 '3 6.000 10383 NCY010383 INCYTE 010383 0 3 entry s descriptor bgfreq rf end 10450 NCY010450 INCYTE 010450 0 3 10470 NCY010470 INCYTE 010470 0 3 10504 NCY010504 INCYTE 010504 0 3 10507 NCY010507 INCYTE 010598 0 3 10779 NCY010779 INCYTE 010779 0 3 10909 NCY010909 INCYTE 010909 NCY010909 INCYTE INCYTE 010976 0 3 10985 NCY010985 INCYTE 010985 0 3 11052 NCY011052 INCYTE 011052 0 3 11068 NCY011134 INCYTE 010134 0 3 11136 NCY011136 INCYTE 011136 0 3 11191 NCY011191 INCYTE 011191 0 3 11219 NCY011219 INCYTE 011219 0 3 11386 NCY011386 INCYTE 011386 NCY011386 INCYTE 0 3 11403 NCY011403 INCYTE 011403 0 3 11460 NCY011460 INCYTE 011460 0 3 11618 NCY011618 INCYTE 011618 0 3 11686 NCY011686 INCYTE 011686 0 3 12021 NCY012021 I NCYTE 012021 0 3 12025 NCY012025 INCYTE 012025 0 3 12320 NCY012320 INCYTE 012320 0 3 12330 NCY012330 INCYTE 012330 0 3 12853 NCY0128S3 INCYTE 012853 0 3 14386 NCY014386 INCYTE 014386 0 3 14391 NCY014391 INCYTE 014391 0 3 ratio 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6,000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 68 Table 5 • Mister menu tor S03TRACT2CN outputSET TALK 0 ?? S3I SAFST? OFFS2T E3CACT CNSST TTPSAH2AD TO 0CLZAR ”

SST DEVICE TO SCRSEN US2-•SmartGuy:PocSAS3+ZMac:fcx filea:Clonea.db£* 00 TOP 'SST DEVICE TO SCRSEN US2- • SmartGuy: PocSAS3 + ZMac: fcx filea: Clonea.db £ * 00 TOP '

STORS NOMBER TO XNITXATSGO BOTTCM STCRS NOMBER TO 'ΤΕΒΜΕΙΜΈSTORS 1 ' TO Targetl STCRE ' 1 TO Tárgat2 gjORS ' ' TO Targec3 STCRE.' ' το objectl STCRE ' ' TO Cbjeet2 STCRS ' ' TO Ctoject3 STCRE 0 TO ANAL ' STORS 0 TO E5CA2OÍSTORS Ű TO HMATCHSTCRE 0 TO CKATCHSTORS 0 TO TMMOiSTORS 0 TO FTPSTORS 1 ΤΟ 3a£LDO WSCELE .T. ' • 'Progrrá. t 'Subcractioa 2.fst·· Data....:.10/11/94 • Version , t FoxSASE*/Mac, reviaicá 1.10 • Notea..: Parsat fiié Sufctract'ioa 2 SCRSEN 1 TYPS 0 KEADING *3creen 1* AT 40,2 SXZS 296,492 PTXZLS PONT *Geneva*,9 COLOR 0,0,0, 8 PECZLS 75,120 TO 178,241 STYLZ 3871 COLOR 0,0,-1,24610,-1,8947 0 rOELS 27,104 SAY 'Subtraction Merni* STXLZ 65536 PONT 'Genevx’,274 COLOR 0,0,-1,-1,-1,-1STORS NOMBER TO XNITXATSGO BOTTCM STCRS NOMBER TO 'ORSSTORS 1' TO Targetl STCRE '1 TO Item2 gJORS' 'TO Targec3 STCRE.' 'το objectl STCRE' 'TO Cbjeet2 STCRS' 'TO Ctoject3 STCRE 0 TO ANAL' STORS 0 TO E5CA2OUTSTORY TO HMATCHSTCRE 0 TO CKATCHSTOR 0 TO TMMORSTOR 0 TO FTPSTOR 1 ΤΟ 3a £ LDO WSCELE .T. '• Progrrá. t 'Subcractio 2.fst ·· Data ....: 10/11/94 • Version, t FoxSASE * / Mac, reviaicá 1.10 • Notea ..: Parsat Fiber Sufctract'ioa 2 SCRSEN 1 TYPS 0 KEADING * 3creen 1 * AT 40.2 SXZS 296.492 PTXZLS POINT * Geneva *, 9 COLOR 0.0.0, 8 PECZLS 75,120 TO 178,241 STYLZ 3871 COLOR 0.0, -1,24610, -1,8947 0 rOELS 27,104 SAY 'Subtraction Merni * STXLZ 65536 POINT 'Genevx', 274 COLOR 0.0, -1, -1, -1, -1

9 PECSLS. 117,12 6 G2T BOTOK STXLE 65536 FONT *Chi«ago*;i2 5XCIORE *8*0 Bect · SIZ2 1$',62 'CO 8'PECSLS 135,.126 GET HMATCH'STYL3 65536 FONT 'Chicago*, 12 .PICTUR3 *8’C Hanologoua * · SXZS 15,1 8 PECSLS 153,126 GET CKATCH STYLZ 65536 SONT 'Chicago·,12 5XCT0R3 *««C Other epe* SXZS 15,84 9 PECSLS 90,152 SAY 'Katehea:*. STYL2 65535 PONT ‘Ceaeva’,12 COLOR 0,0,71,-1,-1,-19 PECSLS. 117,12 6 G2T Bots STXLE 65536 FONT * Chi «ago *; i2 5XCIORE * 8 * 0 Bect · SIZ2 $ 1, 62 'CO 8'PECSLS 135, .126 GET HMATCH'STYL3 65536 FONT' Chicago *, 12. PICTUR3 * 8'C Hanologoua * · SXZS 15,1 8 PECSLS 153,126 GET CKATCH STYLZ 65536 SONT 'Chicago ·, 12 5XCT0R3 * «« C Other Epe * SXZS 15,84 9 PECSLS 90,152 SAY' Katehea: *. STYL2 65535 POINT 'Ceaeva', 12 COLOR 0.0.71, -1, -1, -1

8 PECSLS 171,126 GST Xaateh STYLZ 55536 PONT 'Chicago·, 13 PICTORS *8«C Xncyte' SIZS -15,63 CO 9 PECSLS 252,137 GET initiate ST7LS 0 FONT *G«neva*,12 STZS 15,70 COLOR 0,0,-1,-1,-1,-1 9 PECSLS 252,236 GBT texadnata ST&Z 0 FONT 'C«neva*,12 STZS 15,70 COLOR 0,0,-1,-1,-1,-19 PECSLS 252,35 SXt ’lacluda clones·'* STTLS 65536 PONT *G«neva*,12 COLOR 0,0,-1,-1,-1,-18 PECSLS-252,215 SAJT *->’ STÍLÉ 65536 FONT 'Geneva*,14 COLOR 0,0,-1,-1,-1,-1 · 3 PECSLS 198,126 GET PTF STÍLÉ 65536 FCNT 'Chicago',12 PICTORS 'í'C.Priat CO illa* SXZS 15',99'PECSLS 90,9 TO 131,109 STÍLÉ 3871 COLOR 0,0,-1,-25600,-1,-18 PECSLS 90,338 TO'131,397 STíLZ 3871 COLOR 0,0,-1,-25600,-1,-1 8 PIXEL3 81,296 3KC ’Baekgrcund:' 5ΉΙ3 65536 FONT *Ganava*,27Ű COLOR 0,0,-1,-1,-1,-1. 9 PECSL3 45,135 GET ANAL STÍLÉ 65536 FONT 'Chicago*,.12 PLCTÜRS *3-R OveralljFuacticn* SXZS 4 9 PECSLS 81,25 SAY 'Target:* STÍLÉ 65536 PORT 'Gancva',270 COLOR 0,0,-1,-1,-1,-1 9 PECSLS £08,20 GET targetl STÍLÉ 0 PONT 'Génévé'·, 9 SZZZ 12,79 COLOR 0,0,^1,-1,-1,-1 •8 PEOELS 135,20 GST targatl STÍL2 0 FOC 'Genova*,9 SXZS 12,79 COLOR 0,0,-1,-1,-1,-1 .8 PECSLS 162,20 GET targetl 3TYL2 0 PONT *Ganeva*,9 SXZS 12,79 COLOR 0,0,-1,-1,-1.-1 8 PECSLS 109,299 GST Objectl STÍLS 0 PONT 'Geaeva’,9 SXZS 12,79-COLOR 0,0,-1,-1,-1,-1 9 PXX2L8 135,299 G2T objeet2 STÍLS 0. FONT *Ceneva*,9 8IZS 12,79 COLOR 0,0,-1,-1,-1,-1 8 PECELS 162,299 GET object3 STÍLÉ 0 FCNT 'Ganava*,9 SXZS 12,79 COLOR 0,0,-1,-1-,-1,-1 '8 PECSLS 276,324'GST Bail STÍLÉ 65536 FONT 'Chicago·, 12 PXCTURS *8*R RunjSail out* SXZS 4112 • • EOF: Subtractiaa. 2.ftntREAD -8 PECSLS 171,126 GST Xaateh STYLZ 55536 POINT 'Chicago ·, 13 PICTURE * 8' C Xncyte 'SIZS -15,63 CO 9 PECSLS 252,137 GET initiate ST7LS 0 FONT * G «n *, 12 STZ 15,70 COLOR 0,0, -1, -1, -1, -1 9 PECSLS 252.236 GBT texadnata ST & Z 0 FONT 'C «n *, 12 STZ 15,70 COLOR 0,0, -1, -1, -1, -19 PECSLS 252 , 35 SXt 'laclude clones ·' * STTLS 65536 POINT * G «neva *, 12 COLOR 0.0, -1, -1, -1, -18 PECSLS-252,215 SAJT * -> 'STYLE 65536 FONT' Geneva *, 14 COLOR 0.0, -1, -1, -1, -1 · 3 PECSLS 198,126 GET PTF STYLE 65536 FCNT 'Chicago', 12 PICTORS 'í'C.Priat CO illa * SXZS 15', 99'PECSLS 90, 9 TO 131,109 STYLE 3871 COLOR 0,0, -1, -25600, -1, -18 PECSLS 90,338 TO'131,397 STYLZ 3871 COLOR 0,0, -1, -25600, -1, -1 8 PIXEL3 81,296 3KC 'Baekgrcund : 5ΉΙ3 65536 FONT * Ganava *, 27Ű COLOR 0.0, -1, -1, -1, -1. 9 PECSL3 45,135 GET ANAL STYLE 65536 FONT 'Chicago *., 12 PLCTÜRS * 3-R OveralljFuacticn * SXZS 4 9 PECSLS 81,25 SAY' Target: * STYLE 65536 PORT 'Gancva', 270 COLOR 0,0, -1, - 1, -1, -1 9 PECSLS £ 08.20 GET targetl STYLE 0 POINT 'GENE' ·, 9 SZZZ 12,79 COLOR 0,0, ^ 1, -1, -1, -1 • 8 PEOELS 135,20 GST targatl STIL2 0 FOC 'Genova *, 9 SXZS 12,79 COLOR 0,0, -1, -1, -1, -1 .8 PECSLS 162,20 GET targetl 3TYL2 0 POINTS * Ganeva *, 9 SXZS 12,79 COLOR 0.0, -1, -1, -1.-1 8 PECSLS 109.299 GST Objectl STYLE 0 POINT 'Geaeva', 9 SXZS 12.79-COLOR 0.0, -1, -1, -1, -1 9 PXX2L8 135,299 G2T Object2 STYLE 0. FONT * Ceneva *, 9 8IZS 12.79 COLOR 0.0, -1, -1, -1, -1 8 PECELS 162,299 GET object3 STYLE 0 FCNT 'Ganava *, 9 SXZS 12, 79 COLOR 0.0, -1, -1,, - 1, -1 '8 PECSLS 276,324'GST Bail STYLE 65536 FONT' Chicago ·, 12 PXCTURS * 8 * R RunjSail out * SXZS 4112 • • EOF: Subtractia. 2.ftntREAD -

U Bail-2CLZAR CL0S3 0ATASASS3 ÜSS 'SmartGuy:FoxBASS*/Mac:fax fiié·:elönti.dbf*U Bail-2CLZAR CL0S3 0ATASASS3 HSS 'SmartGuy: FoxBASS * / Mac: fax phii ·: spill.dbf *

• 3ΞΤ SAFETT QNSCRES4.1 OFFRETURN 69• 3ΞΤ SAFETT QNSCRES4.1 OFFRETURN 69

amiF STORS VAL(SYS(3>) TO STARTIMESTOR2 UPPERtTargetl). το Target 1STORS. CPPER{Target2J TO Target2STORS UPPSR(Target3) TO Targ«t2STORS U?PER{Objectl) TO ObjectlSTORE UPPSR(Object2J TOObject2STORS ÜPPER(Objact3) TO Objact3amF STORS VAL (SYS (3>) TO STARTIMESTOR2 UPPERtTargetl). το Target 1STORS. CPPER {Target2J TO Target2STORS UPPSR (Target3) TO Targ «2STST U? PER {Objectl] TO ObjectlSTORE UPPSR (Object2J TOObject2STORS UTPER (Objact3) TO Objact3

- elaarSS? TAXJC ON- ElariSS? TAXJC ON

GAP s TSSfrOftTS-IUTOAIS^lGO DíITIATSGAP s TSSfrOftTS-IUTOAIS ^ lGO DITITATION

C07Y NS5CT GAP FXZLDS NOM3SR, library, D, F, Z,R, ETTSY.S, CESCRXPTOR, START, RFSND, I TO TEH5JKHÜSS TaffiNUHCOONT TO TOT COPY TO TEMPRED POR D-'B' .OR.D-'O' .OR.D=’H<OR.Oa'N' .OR.D·’!··C07Y NS5CT GAP FXZLDS NOM3SR, Library, D, F, Z, R, ETTSY.S, CESCRXPTOR, START, RFSND, I, THERAPY COPY TO TEMPRED POR D-'B '.OR.D-'O'. OR.D = 'H <OR.Oa'N' .OR.D · '! ··

ÜSS TSKPRED IP BnacehAO .AND. KrAtcb-ű .AND. QnatchaO .AND. HGVK3J»0ÜSS TSKPRED IP BnacehAO .AND. KrAtcb .AND. QnatchaO .AND. HGVK3J »0

COFYTO TE4PDESXGCOFYTO TE4PDESXG

SXSESXSE

COPY STSÜCTÜRS TO TE4SOESXG ÜSS TEKPDESXGXF Boatteh·! APPSND FRCM TSONCM POR D-'S'COPY STYLE STYLE TO TE4SOESXG SINGLE TEKPDESXGXF Boatteh ·! APPSND FRCM TSONCM POR D-'S '

E2R3IF ZT'Rnech·! APPEND FRCM TSNPNÜM FÓR D-'H'E2R3IF ZT'Rnech ·! APPEND FRCM TSNPNM FORM D-'H '

ZNDIF X? Ömatehel APPEND FRCK TSMPNOM FÓR D»'O'arai? XT matciwi APPEND FRCM TSMRNUM TOR Ο»'X·.OR.D-’X’ •.OR.D-’N'ZNDIF X? APPEND FRCK TSMPNOM FOr D '' O'arai? XT matciwi APPEND FRCM TSMRNUM TOR Ο »'X · .OR.D-'X' • .OR.D-'N '

.amiT.When

BNDXFBNDXF

COONT TO STARTOT COPY STTOCTORI TO TEMPLX3COONT TO STARTOT COPY STTOCTORI TO TEMPLX3

USB TBMPLXB APPEND FRŰK TSMPDESIG FÓR library-üPPBR(targetl) XF targetXo' . ' APPEND FRŰK TSÍPDESXG FÓR lÍbrary»ÜPPSR(targat2) ENDX? · XF Ca2get3-o' 'USB TBMPLXB APPEND FRAME TSMPDESIG FORM library-üPPBR (targetl) XF targetXo '. 'APPEND FREQUENCY TYPE LYRARY »CLOSE (targat2) ENDX? · XF Ca2get3-o ''

APPEND FRŰK. TSÍPDESXG FÓR lihrary-OPPSR (targat3)aoiFAPPEND FRAMES. TSÍPDESXG FORM lihrary-OPPSR (targat3) aoiF

COONT TO ANAt/TOTCOONT TO ANAt / TOT

USB TEMPDBSXGUSB TEMPDBSXG

COPF STRÜCIÜRB TO TSMPSÜBCOPF STRYCLY TO TSMPSÜB

ÜSS TEMPSUB APPH® FRCM TEKPDSSXO FÓR libmxy»U??ER(Cbjactl) XT tasg*fe2o' ’ APPEND FRCM TSÍPDESXG FÓR. library»ÜPFERtCbject2)USS TEMPSUB APPH® FRCM TEKPDSSXO FORUM libmxy »U ?? ER (Cbjactl) XT Tasg * fe2o '' APPEND FRCM TYPE SHEET. library »ÜPFERtCbject2)

H®XT XF targecJo' •APPEND FRCM TQIPDBSXC POR library-ÜPP® (Cbjact3, SSDXF 'H®XT XF targecOo • APPEND FRCM TQIPDBSXC POR library-CAP® (Cbjact3, SSDXF ')

COONT TO SüBTRACTOTCOONT TO SYBTRACTOT

SST TALK OTTSST TALK OTT

* COMPKZSSXEN S03RCOTINE A* COMPKZSSXEN S03RCOTINE A

7 'OTffRiSSXHC' QÜERY XXSRAKT7 'OTffRiSSXHC' QÜERY XXSRAKT

ÜSS TS4PDXB 70 scw? οκ-Βΐπκ’,ιηηαοι το cosortÜSS TS4PDXB 70 scw? οκ-Βΐπκ ', ιηηαοι το cosort

US2 LI3SCRTUS2 LI3SCRT

COUNT TO IDGENB RSPLACS AU RFENO WITH 1 MARXI - 1 SW2-0COUNT TO IDGENB RSPLACS AU RFENO WITH 1 MARXI - 1 SW2-0

00 WKIL3 SW2-0 RCUIF MARXI >3 iegsnsPACX COCNT TO ABNZQCS'SW2-ÍLCOPesdi?00 WKIL3 SW2-0 RCUIF MARXI> 3 Long PACX COCNT TO ABNZQCS'SW2-ÍLCOPesdi?

GO MARXI CW 1GO MARXI CW 1

STORS ENIRY TO TSSTA STORS 0 TO DESIGA. . SW - 0STORS ENIRY TO TSSTA STORS 0 TO DESIGA. . SW - 0

"00 WH1L2 SW-0 TEST oc? STORS HJTTRX TO TSST3"00 WH1L2 SW-0 TEST oc? STORS HJTTRX TO TSST3

STORS 0 TO 03SIGB Z? TSSTA TSST3.AND.QSSIGA«0ESIGa D2L3T3 OOP - EC?*1STORS 0 TO 03SIGB Z? TSSTA TSST3.AND.QSSIGA «0ESIGa D2L3T3 OOP - EC? * 1

IOOPIOOP

BfflIFBfflIF

GO "MARXIGO MARXI

R2RUU3 RFSND WITH OÜS MARKI > MARK1+D0? ' SMtlR2RUU3 RFSND WITH MARKI> MARK1 + D0? 'SMtl

LOOPLOOP

SHCCO-TSSTTSST-SHCCO

LOOPLOOP

EffiDO RQU SORT CN RFENO/D.NUMBER TO TEMFÍARSORS.EffiDO RQU SORT CN RFENO / D.NUMBER TO TEMFÍARSORS.

ÜSS TSKPTARSORTÜSS TSKPTARSORT

♦R2PLACS AU. START WTXH RFSO/XCSaS'lOOOOCOCN? TO TEMPTARCO♦ R2PLACS AU. START WTXH RFSO / XCSaS'lOOOOCOCN? TO TEMPTARCO

* CCMPRÉSSION SÜBRCÜEOS Si 'ca&asssaK tarost u3rartÜSS TUffSUS* CCMPRÉSSION SYRBYEOS Si 'ca & asssaK tarost u3rartÜSS TUffSUS

SORT CM BíHOf, NÜMBSR TO'SÜBSQRTSORT CM BHHOF, NÜMBSR TO'SÜBSQRT

USX SUBSORT cocnt το scbgsse R2SIA35 AU RFBND KTOÍ? 1 MARXI · 1 SW2-0 oo wmjz SW2-0 rquΣ7 MARKI x SUSGENSaw . cocnt to atacous SSQal ICO?USX SUBSORT cocnt το scbgsse R2SIA35 AU RFBND KTOÍ? 1 MARXI · 1 SW2-0 oo wmjz SW2-0 rquΣ7 MARKI x SUSGENSaw. cocnt to atacous SSQal ICO?

SMOXFSMOXF

GO MARXI OOP - 1 STORS, BSrtRJf TO IBS»GO MARXI OOP - 1 STORS, BSrtRJf TO IBS »

STORS 0 TO DSSXGA sw oSTORS 0 TO DSSXGA sw o

00 WH1LK SW-0 TEST00 WH1LK SW-0 TEST

EXXPEXXP

STORS SMTStt TO TESTB STORS 0 TO 0BSZG3STORS SMTStt TO TESTB STORS 0 TO 0BSZG3

XF TSSTA > TSSTO.RND.OSSXGA^QSSXSS 69 E2ZJSTBου? dup+iLOOSEBI?XF TSSTA> TSSTO.RND.OSSXGA ^ QSSXSS 69 E2ZJSTBου? dup + iLOOSEBI?

GO MARXI RS7LACB RTOJD WITH CCS» MARXI · MARXI>DCTSW-1 LOOP _GO MARXI RS7LACB RTOJD WITH CCS »MARXI · MARXI> DCTSW-1 LOOP _

ENCDO TESTENCDO TEST

JjOO? .'JjOO? . '

2ND00 ROLL SORT CN RF3ND/D,N0MBER TO 72MSSUBS0R?2ND00 ROLL SORT CN RF3ND / D, N0MBER TO 72MSSUBS0R?

•OSS TEMPSUBSORT ‘KPIA3 ALL START WITH RPEND/IECZNE*1000ŰCOCNT TO T34SSÜ2C0 ♦FU3ICN ROOTINB? 'SyBTRACKNG U3MRXZ3’• OSS TEMPSUBSORT 'KPIA3 ALL START WITH RPEND / IECZNE * 1000COCNT TO T34SSÜ2C0 ♦ FU3ICN ROOTINB? 'SyBTRACKNG U3MRXZ3'

ŐSE SÜSTRACTIQNANIMAL SYMPTOMS

COPY STKUCTOT3 TO CRUNCH2R SEL2CT 2 OSS T5S4F3OBSCRTS2LECT 1- . OSS CSONQCERAPBQffi mai TEMPIAHSORTCOUNT TO SAILCOTMARX 0 oo wats .t., SZLSCT 1 ' MARX « MARX+1COPY STKUCTOT3 TO CRUNCH2R SEL2CT 2 OSS T5S4F3OBSCRTS2LECT 1-. OSS CSONQCERAPBQffi TEMPIAHSORTCOUNT TO SAILCOTMARX 0 oo wats., SZLSCT 1 'MARX «MARX + 1

I? MARX»BAILCCTI? MARX »BAILCCT

ZXZT SNDX?ZXZT SNDX?

GO MARXGO MARX

STCTS'ENTKY TO SCANNSR SSLSOT 2STCTS'ENTKY TO SCANNSR SSLSOT 2

LOCATS. ?0R aJTRYaSCANNERLocats. ? 0R aJTRYaSCANNER

r? FCCNDOr? FCCNDO

STORE RÍTEND TO BITI STCRZ RTEND ΤΟ BXT2 w .cg · STORS 1/3 TO ina stors ο το arraSTORE LINE TO BIT STCRZ RTEND X BXT2 w .cg · STORS 1/3 TO ina stors ο το

ENDIP SLSCT 1ENDIP SLSCT 1

MOLACS BGFRSQ WITH BOTMOLACS BGFRSQ WITH BOT

RSPLACE ACTUAL WITH BITIRSPLACE ACTUAL WITH BITI

LOOPLOOP

SCCO BELSŐT 1 R2PLACB ALL RATIO WITH KEEND/ACTOAL7 'DOtMQ FXNAL SORT BY BAKÓ'SCCO INSIDE 1 R2PLACB ALL RATIO WITH KEEND / ACTOAL7 'DOtMQ FXNAL SORT BY BAKÓ'

SORT CM RATXO/D,BGFRSQ/0,OSSCRIPTOR. TO PWAL'052 FIXÁL «ti fciík ottSORT CM RATXO / D, BGFRSQ / 0, OSSCRIPTOR. TO PWAL'052 FIXY you are there

00 CASE CAS3 PTFaO '00 CASE CAS3 PTFaO '

SST ESVXCB ΤΟ PKDTPSST ESVXCB ΤΟ PKDTP

SST PRUTT CN Ε3Β0Γ ···· CAS2 PTFal SS? ALT2SNATS TO 'Adenoid .Patent FigurMíSubtraction. txs· 70SST PRUTT CN Ε3Β0Γ ···· CAS2 PTFal SS? ALT2SNATS TO 'Adenoid. Patent FigurMíSubtraction. txs · 70

SS! K.TSSSMS CNBECASB erosa vm,(Sys(2J )' το ram«sX? roronacS’IlAHTOSSTOSS ΡΙΝΤ2<2+8β400 TO .PXOTDEΣΚΕΙ7SS! K.TSSSMS CNBECASB eros or other, (Sys (2J) 'το ram «sX? RoronacS'IlAHTOSSTOSS ΡΙΝΤ2 <2 + 8β400 TO .PXOTDEΣΚΕΙ7

stcrz rarroB - startomé.to caosscSTCR2 CCMPSSC/SO TO CCMP5CN '*«♦*♦*♦♦*»«*«»***··« » SS! MARGBT TO 10 81,1 5AY 'Iiibrary Subtráction Analysis" STYLB €5536 FONT "Ganeva’,274 COLŰR 0,0,0,-1,-1,-1777 7 7 data() 7? ' 77 CTŰC) 7 *Clon« nuabers * 7?--STR(INrriATS, 5,0) .77 ' through ’ · 7? SrR(TSfflGNRTB,6,0> 7 'Librariest 1? Targetl I? TargecSo' 77. ',1 ’ 7? Targ«t2BEI? IP Targetlo' 7? 1 77 Tara<t3BOX? 7 'Subfcracting: 7 ObjaetlIF-Objectao' ?^· .· . *stcrz rarroB - startomé.to caosscSTCR2 CCMPSSC / SO TO CCMP5CN '* «♦ * ♦ * ♦♦ *» «*« »*** ··« »SS! MARGBT TO 10 81,1 5AY 'Iiibrary Subtráction Analysis' STYLB € 5536 FONT "Ganeva", 274 COLOR 0,0,0, -1, -1, -1777 7 7 data () 7? '77 CTŰC) 7 * Clon's * 7? - STR (INrriATS, 5.0) .77' through '· 7? SrR (TSfflGNRTB, 6.0> 7 'Librariest 1? Targetl I? TargecSo' 77. ', 1' 7? Targ «t2BEI? IP Targetlo '7? 1 77 Tara <t3BOX? 7' Subfcracting: 7 ObjaetlIF-Objectao ' ? ^. ·. *

77 CbjtCtSHJDIF IF Qbjact3<>' 77 ' 77 Cbj«CC3BEI? . •7 'Daaignatiensr ff Boatch®0 .AND. }önafceh=0 .AND. Qoafcch=0 .AND. E4ATCH»Q7? 'A11‘ BEIT ..ff Bnateh>l7? 'Beaet, · BEI? IF i&a-ciul7? ’Kuna, * BEI? . '17 QMtCbal7? "Ocher sp.'77 CbjtCtSHJDIF IF Qbjact3 <> '77' 77 Cbj «CC3BEI? . • 7 'Daaignatiensr ff Boatch®0 .AND. } iseafceh = 0 .AND. Qoafcch = 0 .AND. E4ATCH »Q7? 'A11' BEIT ..ff Bnateh> l7? 'Beaet, · BEI? IF i & a-ciul7? “Because, * BEI? . '17 QMtCbal7? "Ocher sp."

BEXF ff xsiafceb-l7.7 ’WCnS’ BEX7.ff ANAUl 7 'Sorted by MONDÁIKÉ'· BEI»,ff ANAL-2 7 'Arranvad by 7CNCTOCN' BEI? 71 ? 'Totál clonea repreaenctd: 1 77 STRÍTOT.S.O) 7 1 Totál · clonea an&lyátd: 1 ?? STR(STARTOT, 3,0) ? 'Tot4l.conputattion.tine: 7? 3TR{CCM5MOÍ,S,2) " 77 1 ainucaa' ' ? · 7'd > deáigaatien £ - diatríhution a = location. r a functtion a a ap«ci«s i a iate SCRESN 1 TYFS 0 SSADZN5 ’Screei 1’ AT 40,2 '3122 283,453 PZXSLS FONT *Geaeva',9 COLOK 0 0 0DO CAS3 . · CAS3 ANALal7? STR(ADNIQUE, 4,0) '7? 1 genes. fór a totál of ' ?? STR(ANALTOT,.4,O) 7? 1 clonea' ? · · . SCS2SN 1 ΤΪΡ2 0 HEADUG 'Sorion 1’ AT 40,2 SX22 283,492 PZXSLS FONT 'Geie/a',7 COLOK 0,0,0,liatt OFF fialda nunher,D,F,Z,RjBTOKY,S,BESCRX?T0R,BCFRSQ,RF2ND,RMTO,ISS! HUNT OFF' CL0S3 DATABA3E3 , . ess · Soartűuy: FoxSASS+ZMac: £ αχ filea; clonea. dbf * CÁSS.ARAL«2* arranga/fiacticaBEXF ff xsiafceb -7.7 'WCnS' BEX7.ff ANAUl 7 'Sorted by MONDAY' · BEI, ff ANAL-2 7 'Arranvad by 7CNCTOCN' BEI? 71? 'Total clonea repreaenctdd: 1 77 STRITES.S.O) 7 1 Total · clonea an & late: 1 ?? STR (STARTOT, 3.0)? 'Tot4l.conputattion.tine: 7? 3TR {CCM5MOÍ, S, 2) "77 1 unique"? · 7'd> deactivation £ - diatriciation a = location. Ra functtion aa ap «ci ia s ia s SCRESN 1 TYFS 0 SSADZN5 'Scree 1' AT 40.2 '3122 283,453 PZXSLS FONT * Geaeva', 9 COLOK 0 0 0DO CAS3 · CAS3 ANALAL7? STR (ADNIQUE, 4.0) '7? 1 genes. Forum of the total of' STR (ANALTOT, .4, O) 7? 1 clonea '? ·. SCS2SN 1 ΤΪΡ2 0 HEADUG' Sequence 1 'AT 40,2 SX22 283,492 PZXSLS FONT' Geie / a ', 7 COLOK 0,0,0, OFF OFF Fialda nunher, D, F, Z , RjBTOKY, S, BESCRX? T0R, BCFRSQ, RF2ND, RMTO, ISS! HUNT OFF 'CL0S3, DATABA3E3, FoxSASS + ZMac: £ αχ filea; clonea. Dbf * CÁSS.ARAL «2 * argan / fiactica

SS? PRINTCRSS? EEACSC CN SCREZN 1 WPS. 0 HBAimG 'Soráén 1’ AT 40,2 SZZS 285,492 PIX2L3 FOTO 'Helvettica· ,253' COLOK 07 '? ' ΒΕίΠΣΜΟ PRCfESZNS' 1 SCR2EÍ1 ΤΏΊ 0 HBADIN3 'Sortéi l'A? 40,2 SZZS 283,492 72X2L3 FOTO 'Helvefcica',265 COLOS 0? 'Suxfaca siolaculaa and receptorai' SCH3EN 1 ΤΎ72 0 KSADDG 'Sortén 1* AT 40,2 SZZS 286,492 PZX2LS FOTO 'Cenevt',7 COLOK 0,0,0,liatt GF? fielda numb«r,D,F,Z,R,EÍTORY,S,CESCRZ?T0R,3GFS2Q-R?7ND,RAn:0,I TOR Ra'2· SCR22H 1 ΤΥΡΕ 0 HEADD53 'Sortén 1''λΤ 40,2 SZZS 286,4.93 P2ÉLS .FOTO ,'Helvattica', 265 COLOK 0> ’ Calciua-binding proteint t' SCR2SN 1 TYP2 0 E2ADING 'Sortéi 1' AT 40,2’SÍZZ 286,492 PZXSLS FONT 'Geieva’,7 COLCR 0,0,0,üst OFF fielda n«nber,D,F,Z,R,ETOK2,S,EHSCRI?TOR,aGFM5Q,!<r£SD,RATIO.I TOR Rs'C' SCKZE24*1 WPS 0 ΚΞΛΟΙΝδ 'Sortéi 1* AT 40,2 SZZS 283,492 PZ3EL3 FOTO 'Kelvwttica· ,265 COLOK 07 'Liganda'and i' SCS2SN 1 TYP2 0 üSACDO 'Scraea 1' AT 40,2 SZZZ 286,492 PDCSLS FONT 'Geneva',7 COLCR 0,0,0,liatt CFF fielda nuaber,D,F,Z,R,ETOJ«',S,£ESCRZPTOR,aCFMQ,XyBC,KATZO,I TOR R-’S' SCKZZN 1 TYPT 0 HEADZU3 'Scrtei 1* AT 40,2 SZ2S 236,493 PZ2SLS TORT 'Relvettica',255 COLOK 07 'űtther híndinj proteint :1 SCKSEN 1 ΤΥΡΕ-0 HSAŰZNö 'Sertel 1* AT'40,2 SZZS 236,492 P23ELS FOTO 'Geneva',7 COLCR 0,0,0,list OFF fl«lda'suEbett,0,F,Z,R,QTOXT,S,CSSCRZPT0R,B0FRSQ,R7BO,RAT:0.Z TOR Rs'Z' ' 7 . · · SCR2SN 1 ΤΪ72 0 HEABZNG 'Sortéi 1* AT 40,2 SZZS 286,492 PZXSLS TONT 'Helvetica',268 COLOK 07 * ORCOCHOS’ 7 . ' · · SCKSZM 1 ΤΥΡΕ 0 KSADZNG 'Sortéi 1* AT 40,2 SZ22 286,492 PZX3LS FOTO 'Helvetica·,265 COLOR 0? 1General onoogeneet *,, 9CR3EM 1 TY72 0 KSAQQG''Soráén 1' AT-40,2 SZZZ 286,492 PZXSLS -FOtTO "Geieva’,7 COLCR 0,0,0,liatt OFF fielda aattber,Dt'F,Z,R,EOTRY,S,DESCRZPTOR,BOFRSQ, WEND,RATZO,Z TOR R-'O' SCRZC4 1 vm. 0 KSADZNS 'Sortéi 1* AT 40.2 SZZS 286,492 PZXSLS FOTO 'Helvettica' ,265 COLOR 07 ’GTP-biading proteinéi1 SCS22H 1 TYP2 0 HEAntNG 'SerMc 1' AT 40,2 SZ2Z 286,492 PZXSLS FQtTO 'Geneva',7 COLCR 0,0,0,liat OFF fielda nuober,D,F,Z.R,ETORY,S,CBSCRlPTOH,aSFRZQ,RATXO.Z TOR R-'O' 72 SCRE2T 1? 'ViralSCREEN 1üst őst TYPS 0 H2ABIW3 "Screen 1' AT 40,2 SIZS 235,493 PIXELS FONTelenentsi' TYP2 0 HEADDJC "Scrsen 1’ AT. 40,2 SIZE 386,493 PIXELS PONT£ielda nuaiber,D,?, Z, R, ENIRY,S,OESCRIPTOR, SGFREQ, RFSJD,HATXO, •Helvetiea",3S5 COLOR 0 •c£á&£",7 cS£r^?o,o,I TOR R»'V" w SCREEN 1 TYFE 0 HEADDJC "Screen 1· AT 40,2 SIZE 230.432 PIXELS TONT "Kelvetica",'255 COLOR 07 ’Xinaaea and Phoephataaea i * ' SCREEN 1 TYPS 0 HEADDJC "Sőréén 1* AT 40,2 SIZE 335,493 PIXELS FONT "Génévé" ,7 .COLOK 0,0,0,Üst ŐST fielda nunber,E,F,Z,R,SJTHY,S,OESCR2?TOR,BCFRaQ,RFElD,RATIQ.I FÓR Rs'Y' SCREEN 1-TYPB 0 HEADDJC "Screen 1* AT 40,3 S223 285,492 PIXELS FŐTT "Hélvetica",2S5 COLCR 07 "Tumor-relacad antigéné»' SC3ZZX 1 TYPS 0 HEADING "Ser ser. 1* AT 40,2 SIZS 235,492 PIXELS FONT "Geneva',7 COLOR 0,0,0,li's: OFF '£ialis nunber,D,F,Z,R,SNTRY,3,ÜESCRIPTOR,SCFHSQ.RFaJD,RATXO, I TOR R«'A' 7. SCRSSJ 1 TYPS 0 HEADD3G "Screen 1· AT 40,2 SIZE 235,492 PIXELS FCOT "Kelvetica." ,258 COLOR 0? · ' PROTEIN SYNTHETIC MACHDJERY PROTEINS' 1 . SCREEN 1 TYPS 0 HEADDC "Screen 1* AT 40,2 SIZ3 285,492 PIXELS FONT "Kelvetica" .255 COLOR 0? ’Tranacripticn and Nucleic Acid-binding preteinat' SCREEN 1 TYPS 0 HEADDJG "Screen 1* AT 40,2 SIZS 285.492 PIXELS FONT "Geneva",7 COLOR 0,0,0,liat OFF fielda nunber,O,F,Z,R,sNTRY,S,DESCRI?TOR,BGFRS3,RFEND,RATIO.I TOR Ra'D' SCREEN 1 ΤΥΡΕ 0 HEADDJG "Serien 1* AT 40,2 SIZS 236,492 PIXELS FONT "Kelvetica",265 COLOR. 07 'Translation:' < ‘ SCRS2Í 1 ΤΥΡΕ 0 H2ADDJG "Screen 1* AT 40,2 SIZE 286,492 PIXELS FONT "Geneva",7 COLOS 0,0,0,liat OFF ’fialda nunber,D,F,Z,R-,2OTRY,S,0ESCRI?TOR,SGFRSQ,RFSND,RAno,I TOR R»'T* - SCREEN 1 ΤΥΡΕ 0 HEADDJG "Screen 1· AT’40,2 SIZS 285.492 PIXZL3 FOJT "Helvetica",265 COLOR 07 'Rüoaanal protaina: ’ SCREEN 1 TYPS 0 HEADDJG "Screen 1“ AT 40,2 SIZS 285,493 PIXELS FCNT '&«η<νη·,7 COLCR 0,0,0,liíC CFF fieldS nttrfcer,D;F,Z,R,2NTRY,S,CESCRI?TOR.S3FR3Q,KFS®,RkTIO.I FÓR R»’R' SCREEN 1 TYPS 0 HEADDJG ."Screen 1" AT 40,2 SIZS'286,492 PDSLS TONT "Kelvetica"/265 COLOR 07 'Protein Processing:· SCREEN 1 TYPS 0 HEADDJG "Screen 1" AT 40,2 SIZS 235,492 PIXELS FONT "Geneva",7.COLCR 0,0,0,liat OFF fielda nunber,D,F,Z,R.EJTRY,S,OgSCai?TOR.BSF?SQ,RF2ND,RATIO,I TOR Rm'L' -i ' SCREEN 1 TYPS 0 HEADDJG "Screen 1" AT 40,.2 SIZS 286,433 PIXELS. FONT "Helvetica",268 COLOR 0 ENZYHES' SCREEN 1 ΤΥΡΕ 0 HEADINC "Screen 1' AT 40,2 3132 286.492 PIXELS FONT "Helvetica",265 COLOR 0?· 'Ferrcproteine:' SCREEN 1 ΤΥΡΕ Q HEADDJC "Screen 1’ AT 40,2 SIZE 286,492 PIXELS FONT "Geneva’,7 COLOR 0,0,0,liat OFF fielda number,D,F,3,R,3íISY,S,DESCR2PTCa,9GFRS3,RFEND.RATXO,I TOR R»'F" SCREEN 1 TYPS 0 HEADDJG "Screen-1" AT 40,2 SIZS 286,492 PIXELS TONT "Helvetica", 2 Ő5COLOR 07 'Proteasas and inhibitora:' SCBEEt 1 ΤΥΡΕ Q HEADDJG "Screen 1* AT 40,2 SIZS 285,493 5IXSXS FCOT "Geneva",7 CCLOR 0,0,0,liat OF7 fielda nu»ber,O,P,Z,R,DITHY,S,OSSCaiFIOR.BGFRZQ,RFEND,RAT3O.I TOR R-'P' SCREEN 1 TYPS 0 HEADDJC "Screen 1’ AT 40,2 SIZS 295,492 PIXELS TONT "Helvetica",255 COLOR 0? 'Oxldative phosphosylation: SCREEN 1 TYPS 0 HEADDJG "Screen 1* AT 40,2 SIZS 285,492 PXXZLS FONT "Geneva",7 COLOR 0,0,0,liat OFF fielda nuróer.O.P.Z.R.XNIRY.S,08SCRlPTOR.aGFREQ,RFEND,RATIO,I POR R»'Z' SCREEN 1 ΤΥΡΕ 0 HEADDJG' 'Screen 1* AT 40,2 SIZS 235,492 PIXELS FONT "Kelvetica",255 COLCR 07 'Sugár 4—1.· ' ’ SCREEN 1 TYPS 0 HEADDJG "Screen 1* AT 40,2 SIZS 235,492 PIXELS FONT "Génévé".7 OOLOR 0,0,0,liat CFF fielda number,D,F,Z,R,a«HY.S.DESCRIFTOR,BGFREQ.RFEND,RA3TO,I TOR R-’Q' SCREEN 1 ΤΥΡΕ 0 HEADDJG "Screen 1" AT 40,2 3IZ2 286,492 PIXELS FONT "Helvetica",255 COLCR 07 'Aaino acid raetabolian:' · SCREEN 1 TYPS 0 HEADDJG "Screen 1" AT 40,2 SIZS 236,492 PIXELS FONT "Geneva",7 COLOR 0,0,0/ 73 Ült OFP fields ntstber,0,F,Z,R,2HTRY, S.0E3CHI?T0R,BCFRSQ,RFSNO,RATZOrI POR R=’M’ SOSai 1 «SS 0. HSADIM! "Screen 1· AT 40,3 SXZ3 285,492 PXXSLS PONT •í&?'&?is:5,,'2& áSóR 0? ’Nueleic acid metahaÜsa: '· SCRSStl l.«P2 O'HEAŰSJj "Screen·1" AT 40,2 3ΙΖΞ 285,492 PXXSLS FCJTT "Geneva"(7 COLCR 0,0,0,'Ült, OFF 'fields nunber, D, F, Ζ,Η,ΕΝΤΗΤ, S, OESCRIFTOR,8GFREQ, RFEND, RATIO,T POR R-’N' 'SOSai'1 «PS 0 HSADINS "Serein 1· AT 40,2 SIZS 295,492 PTXSXS' FCOT "Helvetica",255 COLCR 0? ’Lip'id meeaboüsm:' sassá 1 «?S 0 HSADffiO "Sőréén 1’ AT 40,2 SXZS 285,492 FXX2LS ΓΟΙΓ "Geneva",7 COLOR 0,0,0,Ült OFF fields mmfaer,D,F,Z,R.5X«TF.F(S,DESCRX?rCR,3C7F3Q,RFZNC,HATX0,r POR R-'W' SCRSat 1 TYSS 0 KEADXSG "Serien 1" AT 40,2 SXZS 285,492 PXXSLS FONT "Helvetica",255 COLOR 07 'Cther enzymee.*’ SOSE! X «ΡΕ 0 HSADIKG "3creen 1" AT 40,2 SIZS 286,492 PXXSL3 FONT "Geneva’,7 COLOR 0,0,0,Uie OFF fields nunber,n',P,Z,R,2S7TSí,S,DESCRIPTOR,BGPR2Q,RFEND,RATIO, I FÓR R='S’ 7 . . · · . ··.··’ 3CR2SN 1 «Ρ2 0 HSADXNG "Screen 1" AT 40,2 SXZS 286,492 PXXEL3 PONT "Helvetica",263 COLOR 07 ' ' · ? ' MXSCSLtANECCS CATSGORXSfi1 ? SCJSai 1 «SS 0 HZAOIKG "Serien X" AT 40,2 SIZS 286,492 PIXSLS PONT "Helvetica",255 CCLOR 0? ’stress respoaset' sasai 1 «ΡΕ 0 HSAŰXNO "Screen 1" AT 40,2 3222 285,492 PIXEL3 PONT "Génévé",7 COLOR 0,0,0,Hit OFF fields nuaberiD, F’,Z,.R,a7TRf, S,DE3CRXPTOR,SGFRSQ,R?a®,SATIO,X FÓR Κ»·Η· SCRSai 1 «7Ε 0 HZADINO "Screen X’ AT 40,2 SIZS 286,492 PXXSLS PONT "Helveticá",255 CCLOR'07 'Stniczúral:' sasai X «72 0 H2ADXNS "Serien X" AT 40,2 SXZS 286,492 PCCBLS FONT "Genova',7 COLOS 0,0,0,üst OFF fields nu»l3er,D,F,Z,R,3NI5S,S,DSSCR2PTOR,BGFRSa,RParo,RATIO,2 ;FOR R='K· sasai X Τ5ΓΡ2 O HSADXSB "Serien X" AT 40Í2 SIZS 286,492 PIX2L3 FONT "Helvetica",255 CCLOR 07 ·'other clonei:' sasai X «72 0 HSSflaa "Screen X" AT 40,2 SXZS 285,492 PXXSLS · FCfiT'"Geneva’,7. COLCR 0,0,0üst OFF fields nuraber.O,?,Z,R,aWTCí,3,ÍSSCRI?TOR,aCFRSQ,RFEiC,RATIO,I FÓR R»’X' sasai X «73 O ΕΞΑΟΙΝ3 "Serien X* AT 40,2 SXZS 286,492 PIXSLS FONT "HeXvetiea*,255 CCLOR 07 ’Claceaof unteiown funetian:' sasai X «ΡΕ 0 KSADXNG "Serein X" AT 40,2 SIZS 286,492 PL.OLS FONT "Geneva’,7 COLOR 0,0,0,üst OFF fiald! nunber,O,?,Z,R.aiTRY,S,DESCRIPT0R,BGFREQ,RraiD,RAT20,I FÓR R«'U' MCASc OO "Teát print.prg" SET FR2NT OFP . ssr osvxcz το sasaiSS? PRINTCRSS? EEACSC CN SCREZN 1 WPS. 0 HBAimG 'Series 1' AT 40,2 SZZS 285,492 PIX2L3 PHOTO 'Helvettica ·, 253' COLOK 07 '? 'ΒΕίΠΣΜΟ PRCfESZNS' 1 SCR2EÍ1 ΤΏΊ 0 HBADIN3 'Sort by l'A? 40.2 SZZS 283,492 72X2L3 PHOTO 'Helvefcica', 265 COLOS 0? 'Suxfaca siolaculaa and its receptors' SCH3EN 1 ΤΎ72 0 KSADDG' Sort by 1 * AT 40,2 SZS 286,492 PZX2LS PHOTO 'Cenevt', 7 COLOK 0,0,0, GF? fielda numb «r, D, F, Z, R, ETORYY, S, CESCRZ? T0R, 3GFS2Q-R» 7ND, RAn: 0, I TOR Ra'2 · SCR22H 1 ΤΥΡΕ 0 HEADD53 'Sortén 1''λΤ 40, 2 SZZS 286,4.93 P2ÉLS .FOTO, 'Helvattica', 265 COLOK 0> 'Calciua-binding protein t' SCR2SN 1 TYP2 0 E2ADING 'Sort 1' AT 40,2'SIZE 286,492 PZXSLS FONT 'Geieva', 7 COLCR 0, 0.0, cauldron OFF field n «nber, D, F, Z, R, ETOK2, S, EHSCRI? TOR, aGFM5Q, <r £ SD, RATIO.I TOR Rs'C 'SCKZE24 * 1 WPS 0 ΚΞΛΟΙΝδ' Sort 1 * AT 40.2 SZS 283.492 PZ3EL3 PHOTO 'Kelvwttica ·, 265 COLOK 07' Liganda'and i 'SCS2SN 1 TYP2 0'SACDO' Scraea 1 'AT 40,2 SZZZ 286,492 PDCSLS FONT' Geneva ', 7 COLCR 0,0 , 0, due to CFF field nuaber, D, F, Z, R, ETO «', S, £ ESCRZPTOR, aCFMQ, XyBC, KATZO, I TOR R-'S' SCKZZN 1 TYPT 0 HEADZU3 'Scrtei 1 * AT 40, 2 SZ2S 236,493 PZ2SLS TORT 'Relvettica', 255 COLOK 07 'Stack of Protein Protein: 1 SCKSEN 1 ΤΥΡΕ-0 SILVER' Sertel 1 * AT'40,2 SZZS 236,492 P23ELS PHOTO 'Geneva', 7 COLCR 0,0,0, list OFF fl «lda'suEbett, 0, F, Z, R, QTOXT, S, CSSCRZPT0R, B0FRSQ, R7BO, RAT: 0.Z TOR Rs'Z '' 7. · · SCR2SN 1 ΤΪ72 0 HEABZNG Sortes 1 * AT 40.2 SZSS 286,492 PZXSLS TONT 'Helvetica', 268 COLOK 07 * ORCOCHOS '7. '· SCKSZM 1 ΤΥΡΕ 0 KSADZNG' Sort 1 * AT 40,2 SZ22 286,492 PZX3LS PHOTO 'Helvetica ·, 265 COLOR 0? 1General onogeneue * ,, 9CR3EM 1 TY72 0 KSAQQG''Sora 1 'AT-40.2 SZZZ 286,492 PZXSLS FOOTO "Geieva", 7 COLCR 0,0,0, Due to OFF field aattber, Dt'F, Z, R, EOTRY, S, DESCRZPTOR, BOFRSQ, WEND, RATZO, TOR R-'O 'SCRZC4 1 Year 0 KSADZNS' Sort 1 * AT 40.2 SZS 286,492 PZXSLS PHOTO 'Helvettica', 265 COLOR 07 'GTP Biading Proteins1 SCS22H 1 TYP2 0 HEAntNG 'SerMc 1' AT 40.2 SZ2Z 286.492 PZXSLS FQtTO 'Geneva', 7 COLCR 0.0.0, dirt OFF field with scratch, D, F, ZR, ETORY, S, CBSCR1PTOH, aFFZZ, RATXO.Z TOR R -'O '72 SCRE2T 1?' ViralSCREEN 1h Carbon black TYPS 0 H2ABIW3 "Screen 1 'AT 40.2 SIZS 235,493 PIXELS FONTELENEN' TYP2 0 HEADDJC" Scrsen 1 'AT. 40.2 SIZE 386,493 PIXELS POINT £ iod ?, Z, R, ENIRY, S, OESCRIPTOR, SGFREQ, RFSJD, HATXO, • Hellweed ", 3S5 COLOR 0 • c £ á & £", 7 cS £ rs, o, I TOR R »'V' w SCREEN 1 TYFE 0 HEADDJC "Screen 1 · AT 40.2 SIZE 230.432 PIXELS TONT" Kelvetica "," 255 COLOR 07 'Xinaaea and Phoephatae i *' SCREEN 1 TYPS 0 HEADDJC "1x AT 40.2 SIZE 335,493 PIXELS FONT "G 7 "COLOK 0,0,0, CERT STORY field nunber, E, F, Z, R, SJTHY, S, OESCR2? TOR, BCFRaQ, RFElD, RATIQ.I FORUM Rs'Y 'SCREEN 1-TYPB 0 HEADDJC "Screen 1 * AT 40,3 S223 285,492 PIXELS MAIN" Hélvetica ", 2S5 COLCR 07" Tumor-relacad antigen »'SC3ZZX 1 TYPS 0 HEADING" Ser ser. 1 * AT 40.2 SIZS 235,492 PIXELS FONT "Geneva", 7 COLOR 0.0,0, li's: OFF '£ ialis nunber, D, F, Z, R, SNTRY, 3, UNCCRIPTOR, SCFHSQ.RFaJD, RATXO, I TOR R «'A' 7. SCRSSJ 1 TYPS 0 HEADD3G" Screen 1 · AT 40.2 SIZE 235,492 PIXELS FCOT "Kelvetica." , 258 COLOR 0? · 'PROTEIN SYNTHETIC MACHDJERY PROTEINS' 1. SCREEN 1 TYPS 0 HEADDC "Screen 1 * AT 40.2 SIZ3 285,492 PIXELS FONT" Kelvetica ".255 COLOR 0? 'Tranacriptic and Nucleic Acid-binding Preteine' SCREEN 1 TYPS 0 HEADDJG" Screen 1 * AT 40.2 SIZS 285.492 PIXELS FONT "Geneva", 7 COLOR 0.0.0, dirt OFF field nunber, O, F, Z, R, sNTRY, S, DESCRI? TOR, BGFRS3, RFEND, RATIO.I TOR Ra'D 'SCREEN 1 ΤΥΡΕ 0 HEADDJG "Serien 1 * AT 40.2 SIZS 236,492 PIXELS FONT" Kelvetica "265 COLOR 07" Translation: '<' SCRS2Í 1 1 0 H2ADDJG 'Screen 1 * AT 40.2 SIZE 286,492 PIXELS FONT Geneva, 7 COLOS 0.0.0, dirt OFF 'fialda nunber, D, F, Z, R, 2OTRY, S, 0ESCRI? TOR, SGFRSQ, RFSND, RAno, I TOR R »' T * - SCREEN 1 ΤΥΡΕ 0 HEADDJG" Screen 1 · AT'40.2 SIZS 285.492 PIXZL3 FOJT "Helvetica", 265 COLOR 07 'Rowan protease:' SCREEN 1 TYPS 0 HEADDJG 'Screen 1' AT 40,2 SIZS 285,493 PIXELS FCNT '& η <νη · 7 COLCR 0.0.0, CFF FieldS nttrfcer, D, F, Z, R, 2NTRY, S, CESCRI? TOR.S3FR3Q, KFS®, RkTIO.I FOUND »R 'SCREEN 1 TYPS 0 HEADDJG." Screen 1 "AT 40.2 SIZS'286,492 PDSLS TO NT "Kelvetica" / 265 COLOR 07 'Protein Processing: · SCREEN 1 TYPS 0 HEADDJG "Screen 1" AT 40.2 SIZS 235,492 PIXELS FONT "Geneva", 7.COLCR 0,0,0, Dirt OFF fielda nunber, D, F, Z, R.EJTRY, S, OgSCa? TOR.BSF? SQ, RF2ND, RATIO, I TOR Rm'L '-i' SCREEN 1 TYPS 0 HEADDJG "Screen 1" AT 40, .2 SIZS 286,433 PIXELS. FONT "Helvetica", 268 COLOR 0 "SCREEN 1 ΤΥΡΕ 0 HEADINC" Screen 1 'AT 40,2 3132 286,492 PIXELS FONT "Helvetica", 265 COLOR 0? ·' Ferrcprotein: 'SCREEN 1 ΤΥΡΕ Q HEADDJC "Screen 1' AT 40.2 SIZE 286,492 PIXELS FONT "Geneva", 7 COLOR 0.0.0, Dirt OFF field number, D, F, 3, R, 3ISIS, S, DESCR2PTCa, 9GFRS3, RFEND.RATXO, I TOR R »'F "SCREEN 1 TYPS 0 HEADDJG" Screen-1 "AT 40.2 SIZS 286,492 PIXELS TONT" Helvetica ", 25COLOR 07 'Proteasas and Inhibitors:' SCBEEt 1 ΤΥΡΕ Q HEADDJG 'Screen 1 * AT 40.2 SIZS 285,493 5IXSXS FCOT Geneva ", 7 CCLOR 0.0.0, dirt OF7 field nu», O, P, Z, R, DITHY, S, OSSCaiFIOR.BGFRZQ, RFEND, RAT3O.I TOR R-'P 'SCREEN 1 TYPS 0 HEADDJC "Screen 1 'AT 40.2 SIZS 295,492 PIXELS TONT" Helvetica ", 255 COLOR 0? 'Oxldative phosphosylation: SCREEN 1 TYPS 0 HEADDJG' Screen 1 * AT 40.2 SIZS 285.492 PXXZLS FONT "Geneva", 7 COLOR 0.0.0, dirt OFF fielda nuróer.OPZRXNIRY.S, 08SCRlPTOR.aGFREQ, RFEND, RATIO , I POR R »'Z' SCREEN 1 ΤΥΡΕ 0 HEADDJG '' Screen 1 * AT 40,2 SIZS 235,492 PIXELS FONT" Kelvetica ", 255 COLCR 07 'Radius 4 - 1 ·' 'SCREEN 1 TYPS 0 HEADDJG" Screen 1 * AT 40.2 SIZS 235,492 PIXELS FONT "Genome" .7 OOLOR 0,0,0, dirt CFF field number, D, F, Z, R, a «HY.S.DESCRIFTOR, BGFREQ.RFEND, RA3TO, I TOR R-'Q 'SCREEN 1 ΤΥΡΕ 0 HEADDJG "Screen 1" AT 40.2 3IZ2 286,492 PIXELS FONT "Helvetica", 255 COLCR 07' Acid Acid Tracking: '· SCREEN 1 TYPS 0 HEADDJG "Screen 1" AT 40.2 SIZS 236,492 PIXELS FONT "Geneva", 7 COLOR 0.0,0 / 73 Sets OFP fields ntstber, 0, F, Z, R, 2HTRY, S.0E3CHI? TR, BCFRSQ, RFSNO, RATZOI POR R = 'M' SOSai 1 «SS 0. HSADIM! "Screen 1 · AT 40.3 SXZ3 285,492 PXXSLS POINT &?" &Amp; 5: "2 & O'S 0? 'Nueleic Acid Methachate:' · SCRSStl.« P2 O'HEAYJJ "Screen · 1 "AT 40.2 3ΙΖΞ 285.492 PXXSLS FCJTT" Geneva "(7 COLCR 0.0.0, 'Off, OFF' fields nunber, D, F, Ζ,, ΕΝΤΗΤ, S, OESCRIFTOR, 8GFREQ, RFEND, RATIO, T POR R-'N '' SOSai'1 «PS 0 HSADINS" Serein 1 · AT 40.2 SIZS 295,492 PTXSXS 'FCOT Helvetica, 255 COLCR 0?' Lips Meeaboys: 'sassá 1 «? S 0 HSADffiO" Bronze 1 'AT 40.2 SXZS 285.492 FXX2LS Gen "Geneva", 7 COLOR 0.0.0, Off OFF fields mmfaer, D, F, Z, R.5X «TF.F (S, DESCRX? RCR, 3C7F3Q, RFZNC, HATX0, r POR R-'W 'SCRSat 1 TSS 0 KEADXSG "Serien 1" AT 40.2 SXZS 285,492 PXXSLS FONT "Helvetica", 255 COLOR 07' Cther enzymes. * 'SOSE! X «ΡΕ 0 HSADIKG 3creen 1 "AT 40.2 SIZS 286.492 PXXSL3 FONT" Geneva ", 7 COLOR 0.0.0, Uie OFF fields nunber, n ', P, Z, R, 2S7TSi, S, DESCRIPTOR, BGPR2Q, RFEND, RATIO, I R = 'S' 7 · · · · · · · · '3CR2SN 1 «Ρ2 0 HSADXNG" Screen 1 "AT 40,2 SXZS 286,492 PX XEL3 POINT "Helvetica", 263 COLOR 07 '' ·? 'MXSCSLtANECCS CATSGORXSfi1? SCJSai 1 «SS 0 HZAOIKG" Serien X "AT 40.2 SIZS 286,492 PIXSLS POINT" Helvetica ", 255 CCLOR 0? 'stress respoaset' sasai 1 «ΡΕ 0 HSAXXO" Screen 1 "AT 40,2 3222 285,492 PIXEL3 POINT" GENE ", 7 COLOR 0,0,0, Hit OFF fields nuaberiD, F ', Z, .R, a7TRf, S , DE3CRXPTOR, SGFRSQ, Rо®, SATIO, X R »· RS · SCRSai 1« 7Ε 0 HZADINO "Screen X 'AT 40.2 SIZS 286,492 PXXSLS POINT" Helvetica ", 255 CCLOR'07' Stniczú: 'sasai X «72 0 H2ADXNS" Serien X "AT 40.2 SXZS 286.492 PCCBLS FONT" Genova ", 7 COLOS 0.0.0, Cauldron OFF fields nu» l3er, D, F, Z, R, 3NI5S, S, DSSCR2PTOR, BGFRSa, RParo, RATIO, 2; FOR R = 'K' s X Τ5Τ2 O HSADXSB 'Serien X' AT 40 402 SIZS 286,492 PIX2L3 FONT "Helvetica", 255 CCLOR 07 · 'other clonei:' sasai X «72 0 HSSflaa Screen X "AT 40.2 SXZS 285.492 PXXSLS · FCfiT" Geneva ", 7th COLCR 0.0.0k OFF fields nuraber.O,?, Z, R, aWTCi, 3, ISSCRI? TOR, aCFRSQ, RFEiC, RATIO, I FOUND R '' X 'sasai X «73 O ΕΞΑΟΙΝ3" Serien X * AT 40,2 SXZS 286,492 PIXSLS FONT "HeXvetiea *, 255 CCLOR 07' Claceaof unteiown funetian: 'sas X' ΡΕ 0 KSADXNG" Serein X "AT 40 , 2 SIZS 286,492 PL.OLS FONT "Genev a, 7 COLOR 0.0.0, cauldron OFF fiald! nunber, O,?, Z, R.aiTRY, S, DESCRIPT0R, BGFREQ, RraiD, RAT20, I FOR R «'U' MCASc OO" Tea print.prg "SET FR2NT OFP. ssr osvxcz το sasai

CLO32 0ATA3ASZSCLO32 0ATA3ASS

2RAS2 TSSJFLX3. DBF SRAS3 TadPNUK.Da? SRAS3 TStffOSSXG.DB? SST HARGXM TO 02RAS2 TSSJFLX3. DBF SRAS3 TadPNUK.Da? SRAS3 TStffOSSXG.DB? SST HARGXM TO 0

CLEARCLEAR

LOOP a®oo 74 •ítorthem (singla), versien 11-25-34eless datafcaseeS2T rauc CT? ssr print ο??' SST ZSCACT ŐSTCL2AR - STOR2 · TO Xcbjeet STORS ' ' TO Dobject STORS 0 TO NUnS. STORS OTO ZOffSTORS 1 TO Ballco wkxls ,T. .» Program. i Northern {aiagle). fiat • Daca....i 8/ 8/94 • Version.! .PoxSASS+Zííac,' revisicn 1.10 • Noees. : 'Poraat £iia Northern (aiagle) • · · · SCR2SN 1 TY?2 0 HEADQJG ’Screer. 1' AT 40,2 SXZS 235,432 PXX2L3 PCNT 'Genava·,12 COLOK '0,0,09 PZXSLS 15,81 TO 46,397 SITIÉ 28447 COLOR 0,0,-1,-25600,-1,-19 PESLS 39,79 TO 132,422 STYL3 28447 COLŰR 0,0,0,-25600,-1,-13 POC25S 115,98 SAY ’Sitry t,’ STYLS. 55536 PONT 'Oeaeva',12 COLOS 0,0,0,-1,-1,-18 PDSL3 115,173 G3T Bobject STYLS 0 TORT ·ΰβι<ν»·,12 SI23 15,142 COÍŰR 0,0,0,-1,-1,-1 8 PIX2LS 145,39 SAY ’Deacription' STYL2 65536 TCOT ‘CanavaMl COLOR 0,0,0,-1,-1,-1 · 9 PXJffitS 145,173 C3T Dobject STYLS 0 FCNT 'Geaeva’,12 3122 15,241 COLOK 0,0,0,-1,-1,-1 9 PI5ELS 35,39 SAY 'Siagla Jlortbera aeareh aereea* STYL3 65536 PCNT 'Genarva·',274 COLOK 0,0,-9 PIXSLS 220,162 GBT Ball STYLZ 65536 FONT 'Chicago*,12 PICTOR2 *8*R Contiaia; Bail out* SIZ29 PIXSLS 175,98 SAY ’Clone «:· STYLS 55536 PONT 'G«n«vn'.,12 COLOK 0,0,0,-1,-1,-1 8' PIXSLS 175,173 GET Nbmb STYLS 0 FŐTT 'Genava'.U S2ZZ 15,70 COLOK 0,0,0.-l.-l',-l8 PIXZLS 80,152 SAY *&xcer usy CNS o£ tba follovingi* STYLS 65536 PONT *Geneva',12 CCLCR -1’,» .LOOP a®oo 74 • judged (single), version 11-25-34eless datafcaseeS2T rauc CT? ssr print ο ?? ' SST ZSCACT HEATCL2AR - STOR2 · TO Xcbjeet STORS '' TO Dobject STORS 0 TO NUnS. STORS OTO ZOffSTORS 1 TO Ballco wkxls, T. »Program. i Northern {aiagle). fiat • Daca .... i 8 / 8/94 • Version.! .PoxSASS + Zííac, 'revisicn 1.10 • Noees. : 'Drilling in Northern (aiagle) • · · · SCR2SN 1 TY? 2 0 HEADQJG' Screer. 1 'AT 40,2 SXZS 235,432 PXX2L3 PCNT' Genava · 12 COLOK '0,0,09 PZXSLS 15,81 TO 46,397 SITIÉ 28447 COLOR 0,0, -1, -25600, -1, -19 PESLS 39,79 TO 132,422 STYL3 28447 COLOR 0,0,0, -25600, -1, -13 POC25S 115,98 SAY 'Sitry t,' STYLS. 55536 POINT 'Oeva', 12 COLOS 0,0,0, -1, -1, -18 PDSL3 115,173 G3T Bobject STYLS 0 TORT · ΰβι <ν »·, 12 SI23 15,142 COIL 0,0,0, -1, - 1, -1 8 PIX2LS 145,39 SAY 'Deacription' STYL2 65536 TCOT 'CanavaMl COLOR 0,0,0, -1, -1, -1 · 9 PXJffitS 145,173 C3T Dobject STYLS 0 FCNT' Geaeva ', 12 3122 15,241 COLOK 0.0.0, -1, -1, -1 9 PI5ELS 35.39 SAY 'Siagla Jlortbera aeareh aereea * STYL3 65536 PCNT' Genarva '', 274 COLOK 0.0, -9 PIXSLS 220,162 GBT Ball STYLZ 65536 FONT ' Chicago *, 12 PICTOR2 * 8 * R Contiaia; Bail out * SIZ29 PIXSLS 175,98 SAY 'Clone': · STYLS 55536 POINT 'G «n« vn'., 12 COLOK 0,0,0, -1, -1, -1 8 'PIXSLS 175,173 GET Nbmb STYLS 0 MAJOR 'Genava'.U S2ZZ 15,70 COLOK 0,0,0.-l-1', - l8 PIXZLS 80,152 SAY * & xcer usy CNS o £ tba follow * STYLS 65536 POINT * Geneva ', 12 CCLCR - 1 ', ».

» '20T: Northern (aiagle) .fiatR2AD C? Bail-2 CLSAR · sereen 1 o£í»'20T: Northern (aiagle) .fiatR2AD C? Bail-2 CLSAR · Serene 1 o £

•RSTOBN• RSTOBN

E8DIF ÜSS ’SaiartGuy ;FoxRASS*/M*c:?cx filesiLocJcup.dbí ·E8DIF CSU 'SaiartGuy; FoxRASS * / M * c:? Cx filesiLocJcup.dbí ·

SET TALXCN IP Sobjecto' STORS OT72R (Bobject) to ZobjectSET TALXCN IP Sobjecto 'STORS OT72R (Bobject) to Zobject

SJ5I SAF3TY OFF SORT CN Sntry TO "Lookup er.try.5bi'SJ5I SAF3TY OFF SORT CN Sntry TO "Lookup er.try.5bi"

S2T SAJTIT CN VS3 "Lookup er.try.dhS’ LCCATS POR Lcek-Ecbjsct LP „NOT.FOÓNDO 'S2T SUCCESSES CN VS3 "Lookup err ..dhS" LCCATS POR Lcek-Ecbjsct LP "NOT.FOÓNDO"

CLBARCLBAR

LCOP ZNOZ?LCOP ZNOZ?

BH0W3S STORS Satxy TO Searehval·BH0W3S STORS Satxy TO Searehval ·

CL0S3 DAXABAS3S ÍRASS -'Lookup entry.dbf' Z2OI? •XP-Dobjecto' · SST SXACT 02? ser sápéit ofp SORT CN deaeriptor TO ’Loolaip deaeriptor. dbf·ssr SAPSTY Cn QSS 'Lookup deaeriptor.dbf· LOCATS POR VPFBRtTRIhtdeacripear) )-OTPÖ(TRIH(Dobjeet)) ·CL0S3 DAXABAS3S ÍRASS -'Lookup entry.dbf 'Z2OI? • XP-Dobjecto '· SST SXACT 02? ser of peoples ofp SORT CN deaeriptor TO 'Loolaba deaeriptor. dbf · ssr SAPSTY Cn QSS 'Lookup deaeriptor.dbf · LOCATS POR VPFBRtTRIhtdeacripear)) -PUT (TRIH (Dobjeet)) ·

ΠΓ .NOr.FOQNDOΠΓ .NOr.FOQNDO

CLSAR 75 LŰO?CLSAR 75 Is It?

SKQXF STCRS Sntxy TO SeertóvelCXCSS EftTMASSSSRASS ’Lookup dascriptor.dbf1EZT EQOT CNΕΝΠΧ7 ·SKQXF STCRS Sntxy TO Cert CXCSS EftTMASSSSRASS ”Lookup dascriptor.dbf1EZT EQOT CNΕΝΠΧ7 ·

IP MunboO CSS •SntaxtOuy:?cxSASS*/Mac:Fc}« fileezcloaas.dbf’ GO WjanbBROWSS ‘ .STORE Enfciy TO SearchvelIP MunboO CSS • SntaxtOuy:? CxSASS * / Mac: Fc} «fileezcloaas.dbf" GO WjanbBROWSS '.STORE Enfciy TO Searchvel

®ÜXF CLS3& ? 1 Norchem assalyeii far cnúry ' ?? SearcirvaX7 7 'Sxer Y to psooeed1 MAIT TO OK ·®XF CLS3 & ? 1 Norchem assalyeii far cnúry '?? SearcirvaX7 7 'Sxer Y to psooeed1 MAIT TO OK ·

ttEAR IF OTFSRCCSO-o'Y'sereen X offRSTURNEMUI? * cOK?R2SSZCN‘SOasOOTÓJ2 POR Lihrasy.dbf7 Oospreasing the Lihrariea Zile row CSS *Soartűuy:Fox3AS2+/Mae:Pox files :lÜrariee.dbí*SET SAF2TY OTT ·.· SORT CN libraxy.TO 'Ccapreeaed libxaries.dbf* * FÓR eatexed>0‘TTEAR IF OTFSRCCSO-o'Y'sere X offRSTURNEMUI? * cOK? R2SSZCN'SOasOOTOJ2 POR Lihrasy.dbf7 Oospreasing the Lihrariea Zile row CSS * Soartűuy: Fox3AS2 + / Mae: Pox files: lÜrariee.dbí * SET SAF2TY OTT ·. · SORT CN libraxy.TO 'Ccapreeaed libxaries.dbf > 0 '

SEX SAFEXY CN CSS "Ccopreeáed librasies-.dbfi·SEX SAFEXY CN CSS "Ccopreea librasies-.dbfi ·

DSLST3 FÓR enfceredeOFJCXDSLST3 FORUM enfceredeOFJCX

Ο30ΝΤ TO TOT MARXI - 1SW3«0 . DO WXILE SW3-Ű KSLL•IP MARXI >- TOTPACX · SW2-1Ο30ΝΤ TO TOT MARXI - 1SW3 «0. DO WXILE SW3 • IP MARXI> - TOTPACX · SW2-1

IOOP ZKDZ7 GO MARXI. _IOOP ZKDZ7 GO MARXI. _

STORE lüsrazy TO TSSTA •ffiO? _. storz UhsazyTO testhSTORE lüsrazy TO TSSTA • ffiO? _. storz UhsazyTO testh

ZF TSSTA « TESTBZF TSSTA «TESTB

ECXEXSECXEXS

SSÜIF MARXI « MARX1+1 100? a©co kxlSSÜIF MARXI «MARX1 + 1 100? © co kxl

* Nosthesa anAlyeieOEAR 7 ‘Ooiag the nosthesa acw.. ESP TAUC OK .* Nosthesa anAlyeieOEAR 7 'Ooiag the nosthesa acw .. ESP TAUC OK.

ŐSE "SaertGuyiFwűÁS2+/Kae«Fox files «elones.dbf··SEP SATZTY OFFAncestor "SaertGuyiFwűÁS2 + / Kae« Fox files «elones.dbf ·· SEP SATZTY OFF

COFY TO ’Hits.dbf* FÓR entry»aearehv*lSEX SAPETY CN 76 * MASTER ANALYSIS 3, VERSION 12-3-94 * Mester menü fór analysia outputCOFY TO 'Hits.dbf * FOr Entry »AE READY * lSEX SAPETY CN 76 * MASTER ANALYSIS 3, VERSION 12-3-94 * Master menu forum analysis output

CLOSE DATABASES SET TALK OF?CLOSE DATABASES SET TALK OF?

SET SAFETY OFFSET SAFETY OFF

CLEARCLEAR

SST DEVTCE TO SCREEN SST DEFAüLT TO ’SmartGuy: FoxSASE+/Mac: fox files lOutput prograasi* ÜSS *SmartGuy:Fox3ASS-i-/Mac: fox files:Clonas.dbf"SST DEVTCE TO SCREEN SST DEFAULT TO “SmartGuy: FoxSASE + / Mac: fox files lOutput program * ÜSS * SmartGuy: Fox3ASS-i- / Mac: fox files: Clonas.dbf"

GO TOP STOPÉ NUMBER TO ΖΧΓΠΑΤ3GO TOP STOP NUMBER TO ΖΧΓΠΑΤ3

GO 3OTTCMGO 3OTTCM

STORE NUMBER TO TERMINATESTORE NUMBER TO TERMINATE

STOPÉ 0 ΤΟ ENTIRESTOP 0 ΤΟ ENTIRE

STORS 0 TO CONDENSTORS 0 TO CONDEN

STORE 0 TO ANALSTORE 0 TO ANAL

STORS 0 TO EMATOHSTORS 0 TO EMATOH

STORS 0 TO HMATOHSTORS 0 TO HMATOH

STORS -0 TO OMATOHSTORS -0 TO OMATOH

STORS 0 TO IMATOHSTORS 0 TO IMATOH

STORS 0 TO XMATOHSTORS 0 TO XMATOH

STORE 0 TO PRINTONSTORE 0 TO PRINTON

STORS 0 TO PTF CO WHILE .T. * Program.: Mastar analysis.fimt * Date....: 12/ 9/94 * Version.: FoxBASE*/Mac, revisioa 1.10 * Nctas....: Formát fiié Mester analysis SCREEN 1 ΤΥΡΕ 0 HEADING 'Screen 1’ AT 40,2 SIZE 236,492 PIXELS FONT *Genenza*,9 COLOR 0,0,0,9 PIXELS 39,255 TO 277,430 STYLS 23447 COLOR 0,0,-1,-25600,-1.-13 PIXELS 75,120 TO 173,241 STYLS 3871 COLOR 0,0,-1,-25600,-1,-1STORS 0 TO PTF CO WHILE .T. * Program: Mastar analysis.fimt * Date ....: 12 / 9/94 * Version .: FoxBASE * / Mac, Revision 1.10 * Nctas ....: Form Fiber Master Analysis SCREEN 1 ΤΥΡΕ 0 HEADING 'Screen 1 'AT 40,2 SIZE 236,492 PIXELS FONT * Genenza *, 9 COLOR 0,0,0,9 PIXELS 39,255 TO 277,430 STYLS 23447 COLOR 0,0, -1, -25600, -1.-13 PIXELS 75,120 TO 173,241 STYLS 3871 COLOR 0.0, -1, -25600, -1, -1

9 PIXELS 27,93 SAY Customized Output Menü* STYLS 65536 FCS7T *Genevn*,274 COLOR 0.0,-1,-1,-19 PIXELS 45,54 GET conden STYLE 65536 FONT 'Chicago·, 12 PICTORE ·β*Ο Condensed formát· SIZE9 PIXELS 54,261 GET anal STYLS 65536 FONT 'Chicago*, 12 PICTORE *9*RV Sort/number;Sort/eatxyi3 PIXELS 117,126 GET EMATOH STYLE 65536 FONT 'Chicago·, 12 PICTOPE *3*C Exact · SIZE 15,52 CO 9 PIXELS 135,126 GET HMATOH STYLS 65536 FONT 'Chicago·. 12 PICTORS ·β·Ο Horaologoue· SIZE 15,1 a'PXXELS 153,125 GET OMATOH STYLS 55536 FONT 'Chicago*.12 PICTORS *9»C Otóer spc* SI23 15,84 a PIXELS 90,152 SAY ’Matehes:· STYLE 65536 FONT ‘Geneva’,268 COLOR 0,0,-1,-1,-1.-13 PIXELS 63,54 GET PRINTON STYLE 65536 FONT 'Chicago*, 12 PICTORS *9*C Inolude clona listing*β PIXELS 171,126 GET Imacch STYLS 65535 FONT 'Chicago*,12 PICTORE *»*C Incyte* SIZE 15,65 COβ PIXELS 252,146 GET iaitiafee STYLE 0 FONT 'Geneva’,12 SIZE'15,70 COLOR 0,0,-1,-1,-1,-19 PIXELS 270,145 GET terminate STYLE 0 FONT *Geneva*,12 SIZE 15,70 COLOR 0,0,-1,-1.-1,-1a PIXELS 234,134 SAY *Inelude clones · STYLS 65536 FONT *Geneva*,12 COLOR 0,0,-1,-1,-1,-1a PIXELS 270,125·SAY *->* STYLS 65536 FOtíT -Ger.eya‘,14 COLOR 0,0,-1,-1,-1,-1 3 PIXELS 193,126 GET PTF STYLE 65535 FONT 'Chicago*,12 PICTORS *9*C Priat 60 fiié* SIZE 15,9a PIXELS 189,0 TO 2S7.120 STYLE 3371' COLOR 0,0,-1.-25600,-1,-1 3 PIXELS 209,3 SAY ’Library eelection* STYLE 65536 FONT *Geneva*,2S6 COLOR 0,0,γΐ,-1,-1,-1a PIXELS 227,18 GET ENTIRE STYLE 65536' FONT •Chicago*,12 PICTORE *e*RV All;3elected* SIZE 16 » * EOF: Mester analysis.fmt9 PIXELS 27.93 SAY Customized Output Menu * STYLS 65536 FCS7T * Genevn *, 274 COLOR 0.0, -1, -1, -19 PIXELS 45.54 GET conden STYLE 65536 FONT 'Chicago ·, 12 PICTORE · β * Ο Condensed · SIZE9 PIXELS 54,261 GET anal STYLS 65536 FONT 'Chicago *, 12 PICTORE * 9 * RV Sort / number; Sort / eatxyi3 PIXELS 117,126 GET EMATOH STYLE 65536 FONT' Chicago ·, 12 PICTOPE * 3 * C Exact · SIZE 15,52 CO 9 PIXELS 135,126 GET HMATOH STYLS 65536 FONT 'Chicago ·. 12 PICTORS · β · Ο HOROLOGOLOGY · SIZE 15,1 a'PXXELS 153,125 GET OMATOH STYLS 55536 FONT 'Chicago * .12 PICTORS * 9 »C Ottoer Spc * SI23 15,84 for PIXELS 90,152 SAY' Matehes: · STYLE 65536 FONT ' Geneva ', 268 COLOR 0.0, -1, -1, -1.-13 PIXELS 63.54 GET PRINTON STYLE 65536 FONT' Chicago *, 12 PICTORS * 9 * C List of Inolude clona * β PIXELS 171,126 GET Imacch STYLS 65535 FONT 'Chicago *, 12 PICTORE * »* C Incyte * SIZE 15,65 COP PIXELS 252,146 GET iaitiafee STYLE 0 FONT' Geneva ', 12 SIZE'15,70 COLOR 0,0, -1, -1, -1, - 19 PIXELS 270,145 GET terminate STYLE 0 FONT * Geneva *, 12 SIZE 15,70 COLOR 0,0, -1, -1.-1, -1a PIXELS 234,134 SAY * Inelude clones · STYLS 65536 FONT * Geneva *, 12 COLOR 0 , 0, -1, -1, -1, -1a PIXELS 270,125 · SAY * -> * STYLS 65536 FOrT -Ger.eya ', 14 COLOR 0.0, -1, -1, -1, -1 3 PIXELS 193,126 GET PTF STYLE 65535 FONT 'Chicago *, 12 PICTORS * 9 * C Priat 60 Fiber * SIZE 15,9a PIXELS 189,0 TO 2S7.120 STYLE 3371' COLOR 0,0, -1,6600, -1, - 1 3 PIXELS 209.3 SAY 'Library Preference * STYLE 65536 FONT * Geneva *, 2S6 COLOR 0.0, γΐ, -1, -1, -1a PIXELS 227.18 GET ENTIRE STYLE 65536 'FONT • Chicago *, 12 PICTORE * e * RV All; 3elected * SIZE 16 »* EOF: Master analysis.fmt

READREAD

IF ANAL-9QaSAAIF ANAL-9QaSAA

CLOSE DATABASESERAS2 TS4PMASTER.DBF ÜSS *SmartGuy:FaxaASE-t-/Mae:iox files:clones.dbf·CLOSE DATABASESERAS2 TS4PMASTER.DBF SINGLE * SmartGuy: FaxaASE-t / Mae: iox files: clones.dbf ·

SET SAFETY CNSCR2EN 1 CFFRETORN2NDIF elear 7 ΣΝΙΤΙΑΤΞSET SAFETY CNSCR2EN 1 CFFRETORN2NDIF elear 7 ΣΝΙΤΙΑΤΞ

? TERMINATE? TERMINATE

7 .CONDEN7 .CONDEN

? ANAL 77 ? ematch ? Hmatch ? Cnatch ? IMATCi SET TALK CMI? ENTIR£=2 032 ’Uhique libraries.'dbf * RSPLACS ALL i WITH 1 1? ANAL 77? ematch? Hmatch? Cnatch? IMATCi SET TALK CMI? ENTIR £ = 2,032 'Uhique libraries.'dbf * RSPLACS ALL i WITH 1 1

BROWSS 7ISLDS í, libname, library, totál, er.tered AT 0,0ENDIF □SS •&nartGuy:FoxBASE+/Mac:fox filessclcnes.dbf·BROWSS 7ISLDS í, libname, library, total, er.tered AT 0.0ENDIF □ SS • & nartGuy: FoxBASE + / Mac: fox filessclcnes.dbf ·

*CO?Y TO ra-CNUM FÓR NUM3ER>«INITIATE.AND.íRMSER<=T2RMIKATS* CO? Y TO ra-CNUM FORM NUM3ER> «INITIATE.AND.íRMSER <= T2RMIKATS

*032 TEMPNUM CŰPY STRUCTURE TO TEMPLI3 ŐSE TEKPLI3XF EOTTRE-1 APPEND FROM ·SaartGuy:Fox3AS2+/Mac:fox filessClones.dbf·* 032 TEMPNUM TYPE STRUCTURE TO TEMPLI3 Ancient TEKPLI3XF EOTTRE-1 APPEND FROM · SaartGuy: Fox3AS2 + / Mac: fox filessClones.dbf ·

ENDIF I? EOTXR2a2 OS2 ‘Oníqtie librariea,dbf' COPY TO S2L2CTSD FÓR UPP3R(i)»'Y'ENDIF I? EOTXR2a2 OS2 'Oniqtie librariea, dbf' COPY TO S2L2CTSD FORUM UPP3R (i) »'Y'

U32 SELZCTSD STORS R3CC0ÓNT0 TO STOPITMARX-1 DO WKILE .T.U32 SELZCTSD STORS R3CC0ÓNT0 TO STOPITMARX-1 DO WKILE .T.

IF MAAK>STOPITIF MAAK> STOP

CLEAR ΞΧΙΤ ENDI?CLEAR ΞΧΙΤ ENDI?

ŐSE SELSCTEDGO MARK STORS iibrary TO THISCNE? ·COPYING 'Sister SELSCTEDGO MARK STORS iibrary TO THISCNE? · COPYING '

?? THISONEVS3 TEMPLIS?? THISONEVS3 TEMPLIS

APPEND FRCM ‘ SrrartGuy; FoxBASE+/Mac:fox filessClones.dbf· FÓR libraxy-THISCNEAPPEND FRCM 'SrrartGuy; FoxBASE + / Mac: fox filessClones.dbf · FORUM libraxy-THISCNE

STORS KARX+1 TO MARX LOO?STORS KARX + 1 TO MARX LOO?

2ODC ENDI? ŐSE ·5ΓΓ*τζΰυγ:2οχ3Α32·ι·/Μιο:fox filessclcr.es.db£*2ODC ENDI? Sister · 5 · * τζΰυγ: 2οχ3Α32 · ι · / Μιο: fox filessclcr.es.db £ *

COÜNT TO STARTOTCOÜNT TO STARTOT

COPY STRUCTURE TO TEMPDBSIGCOPY STRUCTURE TO TEMPDBSIG

09E TEMPDESIQ09E TEMPDESIQ

IF Ena:ch-0 .AND.. Hmateh=0 .AND. Qsatck»O .AND. IMATCH«OIF Ena: ch-0 .AND .. Hmateh = 0 .AND. Qsatck »O .AND. IMATCH «O

APPEND FROM TEMPLIB ENDI? IF Etatch»l APPEND FRCM TEMPLIB FÓR 0=·2' E©X? IF Hnatch-1 APPEND FROM 7EMPLI3 FÓR D*'H‘ ENDI? IF Cteatchsl APPEND FROM TEMPLIB FÓR D='O' ENDI? IF Isnaceh»l APPEND FROM TEMPLIB FÓR D»'I' .OR.D·'X' .OR.D-’N'APPEND FROM TEMPLIB ENDI? IF Etatch »APPEND FRCM TEMPLIB FOOT 0 = · 2 'E © X? IF Hnatch-1 APPEND FROM 7EMPLI3 FORUM D * 'H' ENDI? IF Cteatchsl APPEND FROM TEMPLIB FOUND D = 'O' ENDI? IF Isnaceh »l APPEND FROM TEMPLIB FOUND» 'I' .OR.D · 'X' .OR.D-'N '

ENDIF IF Xsratchnl APPEND FROM TEMPLX3 FÓR D-'X'ENDIF IF Xsratchnl APPEND FROM TEMPLX3 FORUM D-'X '

ENDIFENDIF

COÜNT TO ANALTOT set talk offCOÜNT TO ANALTOT set talk off

CO CASE 78CO CASE 78

CASE PT?=OSET D5VIC3 TO PR INTSET PRDIT ΟΝEJECT CASE PTFsl SET ALTERNATE TO ‘Totál functíon eort.txfCASE PT? = OSET D5VIC3 TO PR INTSET PRDIT PTEJECT CASE PTFsl SET ALTERNATE TO 'Total Functional eort.txf

•SET ALTERNATE TO•SET ALTERNATE TO♦SET ALTERNATE TO•SET ALTERNATE TO•SET ALTERNATE TO•SET ALTERNATE TO♦SET ALTERNATE TO SET ALTERNATE ONENDCAS3 >»··><·· •H and 0 íunction sort.txt* •Shear Stress HUVEC 2: Aburdar.ee sort.txt""Shear Stress HUVEC 2:Abur.cance con.txf•Shear Stress HUVEC 2:Functicn sort.txt*•Shear Stress HUVEC 2:DÍ3tributíon sort.txt"•Shear stress HUVEC l;C2on· lisc.txfShear Stress HUVEC 2:Locatícn sort.txt" I? PRINTON=1 81,30 SAY *Databas± Subsst Analysis* STYLS 6Ξ335 FCNT *Ganeva’,274 COLOR 0,0,0,• SET ALTERNATE TO • SET ALTERNATE TO • SET ALTERNATE TO • SET ALTERNATE TO • SET ALTERNATE TO SETTING ALTERNATE TO SET ALTERNATE ONENDCAS3> »··> <·· • H and 0 list item.txt * • Shear Stress HUVEC 2: Aburdar.ee sort.txt "" Shear Stress HUVEC 2: Abur.cance con.txf • Shear Stress HUVEC 2: Functicn sort.txt * • Shear Stress HUVEC 2: DY3 attribute sort.txt "• Shear stress HUVEC l ; C2on · lisc.txfShear Stress HUVEC 2: Locatícn sort.txt "I? PRINTON = 1 81.30 SAY * Databas ± Subsst Analysis * STYLS 6Ξ335 FCNT * Ganeva, 274 COLOR 0.0.0,

ENDIF 7 7 s sENDIF 7 7 s

7 dateO ?? 1 1 7? ΊΊΜΒΟ 7 ’Clona-r.umbers 1 7? STR(INITIATE,5,0) 7? · through 1 7? STR(TERMINAT3, 5,0) 7 ’Libraries: * IP ENTIRE=1 7 ’All libraríes’7 dateO ?? 1 1 7? ΊΊΜΒΟ 7 'Clona-r.umbers 1 7? STR (INITIATE, 5.0) 7? · Through 1 7? STR (TERMINAT3, 5,0) 7 'Libraries: * IP ENTIRE = 1 7' All Libraries

ENDIF IP ENTIRE=2MARK-1DO WH-LE ,T.ENDIF IP ENTIRE = 2MARK-1DO WH-LE, T.

I? MARK>STOPITI? MARK> stopień

SXITSXIT

ENDIF USE SELECTEDGO MARX7 1 1 7? TRIM(lirname)ENDIF USE SELECTEDGO MARX7 1 1 7? TRIM (lirname)

STOR3 MARX+1 TO MARKLCOPSTOR3 MARX + 1 TO MARKLCOP

ENDOOendo

EOIF ? 'Desionaeions: ' IP Bnateh=0 .AND. Hmatch=0 .AND. Ctoatch=0 .AND. IXATCH-0 77 ’All’EOIF? 'Desionaeions:' IP Bnateh = 0 .AND. Hmatch = 0 .AND. Ctoatch = 0 .AND. IXATCH-0 77 'All'

ENDIF IP Smatchsl 77 ’Exaot,'ENDIF IP Smatchsl 77 'Exaot,'

ENDIF IF Hmatch-1 77 'Humán,· D3DIF ‘ IF Qmatchal 77 'Other sp.'ENDIF IF Hmatch-1 77 'Human, · D3DIF' IF Qmatchal 77 'Other sp.'

ENDIF IF Imatchwl 7? ’INCYTE'ENDIF IF Imatchwl 7? 'Incyte'

SNDIF IF Xrratch=l 77 'EST' 1,-1 • · · · - 79 -SNDIF IF Xrratch = 77 'EST' 1, -1 · · · · - 79 -

ENDIF I? CONDEN-1 ? 'Condensed formát analysie'ENDIF I? CONDEN-1? 'Condensed forma analysie'

ENDIF IF ANALsl ? 'Sorted by NUMBER'ENDIF IF ANALS? 'Sorted by NUMBER'

ENDIF IF ANAL»2 ? 'Sorted by ENTRY'ENDIF IF ANAL »2? 'Sorted by ENTRY'

ENDIF X? ANALs3 ? 'Arranged by ASONDANCE'ENDIF X? ANALs3? 'Arranged by ASONDANCE'

ENDIF I? ANAL.4 ? 'Sortad by INTEREST'ENDIF I? ANAL.4? 'Sort by INTEREST'

ENDIF I? ANAL=5 ? ’Arranged by LOCATION’ ENDIF ’ IF ANAL-5 ? 'Arrangad by DISTRI3OTI0N'ENDIF I? ANAL = 5? 'Arranged by LOCATION' ENDIF 'IF ANAL-5? 'Arrangad by DISTRI3OTI0N'

ENDIF IF ANAL-7 ? 'Arranged by “JNCTICN'ENDIF IF ANAL-7? 'Arranged by' JNCTICN '

ENDIF ? 'Totál clone9 representeds ' ?? STR(STARTOT,6,0) ? ‘Totál clonss analyzeds ' ?? STR(ANALTOT,6,OÍ ? '1 = library d = designaticn f = distributicn z = location r íunctioa c cer?ENDIF? 'Total clone9 representeds' ?? STR (STARTOT, 6.0)? 'Total clonss analyzeds' ?? STR (ANALTOT, 6, O?? 1 = library d = designaticn f = distributicn z = location r c)?

*♦**♦·»♦*♦ »***»»»·»*»·»·»*»«»»»♦·« itHlthn ,t A»It ♦ ♦» *** *** *** *** *** *** *** *** *** *** *** *** *** *** *** *** *** *** H H H H H H H H

USE TEMPQE3IG SCREEN 1 ΤΥΡΕ 0 KEADING 'Screen 1’ AT 40,2 SIZE 236,492 PIXELS FONT ‘Genarva·',? COLOS 0,0,0,DO CASECAS3 ANAL=1 * sort/numberUSE TEMPQE3IG SCREEN 1 ΤΥΡΕ 0 KEADING 'Screen 1' AT 40,2 SIZE 236,492 PIXELS FONT 'Genarva' ',? COLOS 0,0,0, DO CASECAS3 ANAL = 1 * variety / number

SET HEADING ON IF CONDEN-1SET HEADING ON IF CONDEN-1

SORT ΤΟ TENP1 CN ENTRY, NUH3ER DO ‘CCMPRESSION number.PRG·SORT ΤΟ TENP1 CN ENTRY, NUH3ER DO 'CCMPRESSION number.PRG ·

EX .SEEX .SE

SORT ΤΟ TEXPl CN NUMBER USE ΓΕ4Ρ1SORT EX TEXPl CN NUMBER USE ΓΕ4Ρ1

Üst off fields number,L,D,F,Z,R,C,ENTRY,S,D3SCRIPT0RCold off fields number, L, D, F, Z, R, C, ENTRY, S, D3SCRIPT0R

•list off fieláa number,L,D,F,Z,R,C,ENTRY,S,DSSCRIPTOR,LENCTH,RFEND,INIT,I• list off fieláa number, L, D, F, Z, R, C, ENTRY, S, DSSCRIPTOR, LENCTH, RFEND, INIT, I

CLŰSS DATA3ASESCLEAR DATA3ASES

ERASS TENP1.D3FERASS TENP1.D3F

ENDIF CASE ANAL»2ENDIF CASE ANAL »2

* aort/DESCRIPTOR* aort / DESCRIPTOR

SET HEADING ON •SORT ΤΟ TEMP1 CN DS3CRIPT0R,ENTRY,NUM3ER/S fór D»’S' .OR.D-'H' .OR.O'O' ,OR.D«'X' .OR.D»'I'•SORT ΤΟ ΤΞΜΡ1 CN ENTRY, DESCRI?TOR,NÜMSER/S fór Da Έ'.CR.D-Ή''.OR.D-'0'.OR.D»'X'.OR.D«' Σ'SORT ΤΟ ΤΞΜΡ1 ON ENTRY,START/S fór D= Έ'.OR,D='K1.03.0»'0'.CR.D='X'.OR.D=11' IF CCNDSN-l EO "COMPRESSION entry.PSG'SET HEADING ON • SORT ΤΟ TEMP1 CN DS3CRIPT0R, ENTRY, NUM3ER / S forum D »'S' .OR.D-'H '.OR.O'O', OR.D« 'X' .OR.D »' I '• SORT ΤΟ ΤΞΜΡ1 CN ENTRY, DESCRI? TOR, NÜMSER / S Forum Da Έ'.CR.D-Ή' '. OR.D-'0'.OR.D »' X'.OR.D« ' ORT'SORT ΤΟ ΤΞΜΡ1 ON ENTRY, START / S Forum D = Έ'.OR, D = 'K1.03.0 »' 0'.CR.D = 'X'.OR.D = 11' IF CCNDSN on EO ' COMPRESSION entry.PSG '

ELSEELSE

USE TH4PXUSE TH4PX

list off fiald» nuiaber,L,D,?,Z,R,C,ENTRY,S.DESCRI?TOS,tS«3ra,RJEND,INXT,ICLOSS DATABASESERASE TE4P1.D8FENDIF 80 CASS ANAL-3 * sort by abundancelist off fiald »nuiaber, L, D,?, Z, R, C, ENTRY, S.DESCRI? TOS, S« 3ra, RJEND, INXT, ICLOSS DATABASESERASE TE4P1.D8FENDIF 80 CASS ANAL-3 * line by abundance

SET HEADINO CN SORT ΤΟ TE4P1 ON ENTRY,NUM3ER fór D-*E’ .OR.D='H' .OR.D-'O' .OR.D-'X' .OR.D-'I1 00 ‘CCmfression abundance.?rg· CASS ANAL-4 * sort/ir.terestSET HEADINO CN SORT 4 TE4P1 ON ENTRY, NUM3ER forum D- * E '.OR.D =' H '.OR.D-'O' .OR.D-'X '.OR.D-'I1 00' CCmfression abundance.?rg· CASS ANAL-4 * sort / ir.terest

SET HEADOR3 ON IF CONDEN-1 SOFT ΤΟ TEMP1 ON EOTRY.NUMBER FÓR I>0 DO ‘CQMPR2SSICN interest. PRO*SET HEADOR3 ON IF CONDEN-1 SOFT ΤΟ TEMP1 ON EOTRY.NUMBER FORM I> 0 DO 'CQMPR2SSICN interest. PRO *

ELSE SORT ON I/D.EOTRY ΤΟ TEMF1 FÓR I>1 USB TEJÍP1ELSE SORT ON I / D.EOTRY ΤΟ TEMF1 FORM I> 1 USB MILK1

list c:f fields numher,L,D,F,Z.R,C,EOTRY,S,DESCRIPTOR,LENGTE,RFEND,INIT,Ilist c: f fields numher, L, D, F, Z.R, C, EOTRY, S, DESCRIPTOR, LENGTE, RFEND, INIT, I

CLOSS DATA3ASSSCLOSS DATA3ASSS

E?ASS TE-ÍF1.DSFE? ASS TE-ÍF1.DSF

ENDIF CAS2 ANAL-5 * arrange/lccacicnENDIF CAS2 ANAL-5 * arrange / lccacicn

SET HSADING CNSET HSADING CN

ST0R3 4 το AMPLIFIER ? 'Nuclear:' SORT ON ENIRY,NDJ2ER FIELDS RFEND,NUH3SR, L,D,F, Z,R,C,ENTRY,S,DESCRIPIOR, LENOTH, ÉJIT,I, COMMENIF CCNDEN-l DO ‘Ccrpression location.prg’ST0R3 4 το AMPLIFIER? 'Nuclear:' SORT ON ENIRY, NDJ2ER FIELDS RFEND, NUH3SR, L, D, F, Z, R, C, ENTRY, S, DESCRIPIOR, LENOTH, NIGHT, I, COMMENIF CCNDEN DO 'Ccrpression location.prg'

ELSE DO •Norma 1 suhroutine 1*ELSE DO • Norma 1 candy 1 *

ENDIF ? ‘Cytcplasmic:1 SORT CN EOTRY,NÜM3ER FIELDS RFEND,NUHBER,L,D,F,Z,R,C,2NTRY,S, DESCRIPTOR, LENOTH, INIT, I, C0MMQ1IF CCNDEN-l DO ’Ccrcpreaaion location.prg·ENDIF? 'Cytcplasmic: 1 SORT CN EOTRY, NÜM3ER FIELDS RFEND, NUHBER, L, D, F, Z, R, C, 2NTRY, S, DESCRIPTOR, LENOTH, INIT, I, C0MMQ1IF CCNDEN DO' Ccrcpreaaion location.prg ·

ELSE DO ‘Normál suhroutine 1* ENDIF _ ? 'Cytbakeleton:' SORT CN ENTRY,NUNBER FIELDS RFEND,NUH3ER. L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR, LENGTE, ΙΝΙΤ,Ι,COMMENIF CCWEN-1 DO ‘Ccnpression location.prg*ELSE DO 'Normal sourdough 1 * ENDIF _? 'Cytbakeleton:' SORT CN ENTRY, NUNBER FIELDS RFEND, NUH3ER. L, D, F, Z, R, C, ENTRY, S, DESCRIPTOR, LENGTE, ΙΝΙΤ, Ι, COMMENIF CCWEN-1 DO 'Ccnpression location.prg *

ELSE DO ‘Normál suhroutine 1‘ELSE DO 'Normal Sourdough 1'

ENDIF ? 'Cell suríace:' SORT CN ENTRY.NUKSSR FIELDS SFEND,NUMSER,L,D,F,Z,R,C,SMIRY,S,DESCRIPTOR.LENSTK, INlT.I.COttOIF CCNDEN-l DO ’Conpression location.prg·ENDIF? 'Cell suríace:' SORT CN ENTRY.NUKSSR FIELDS SFEND, NUMSER, L, D, F, Z, R, C, SMIRY, S, DESCRIPTOR.LENSTK, INlT.I.COttOIF CCNDEN DO 'Conpression location.prg ·

ELSE DO ’Normál suhroutine 1‘ELSE DO 'Normal Relais 1'

ENDIF ? ’Intracellular membráné:1 SORT CN EOTRY,NÍJM3ER FIELDS RFEND,NUM3ER,L,D,F,Z,R,C,E2ZrRY,S,DESCRIPTOR,LENOTH. ΣΝΙΤ, Σ, COMXENIF CCNDEN-l DO ‘Compression location.prg·ENDIF? 'Intracellular membrane: 1 SORT CN EOTRY, NÍMMERER FIELDS RFEND, NUM3ER, L, D, F, Z, R, C, E2ZrRY, S, DESCRIPTOR, LENOTH. ΣΝΙΤ, Σ, COMXENIF CCNDEN DO 'Compression location.prg ·

ELSE DO ‘Normál suhroutine 1’ELSE DO 'Normal Sourdough 1'

ENDIF ? 'Mitochondrial:' SORT CN ENFRY,NUKBER FIELDS RFSND.NUMBER, L, D, F, 2, R,C.EOTRY, S,DESCRIPTOR, LENOTH, ΣΝΙΤ, I. CCMMENIF CCNDENal DO ·0αηρτε8β1οη location.prg*ENDIF? 'Mitochondrial:' SORT CN ENFRY, NUKBER FIELDS RFSND.NUMBER, L, D, F, 2, R, C.EOTRY, S, DESCRIPTOR, LENOTH, ΣΝΙΤ, I. CCMMENIF CCNDENal DO · 0αηρτε8β1οη location.prg *

ELSE DO ‘Normál suhroutine 1’ELSE DO 'Normal Sourdough 1'

ENDIF 81 7 'Secretad:' SORT CN ENTRY, NUKBER FIELDS RFSND,NGM3ER, L, D,F, Z, R, C, ENTRY, S, DESCRIPTOR, LENGIK, INIT,I,CCMMENI? CONDEN=1 DO "Compresaion location.prg"ENDIF 81 7 'Secrets:' SORT CN ENTRY, NUKBER FIELDS RFSND, NGM3ER, L, D, F, Z, R, C, ENTRY, S, DESCRIPTOR, FLIGHT, INIT, I, CCMMENI? CONDEN = 1 DO "Compresaion location.prg"

SLSE DO "Normál subroutina 1’ SNDIP7 1Otheri' SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER, L, D,F, Z, R, C, ENTRY, S, DESCRIPTOR, LENGTH, 2OT,I,C»®ffiNI? CCNDEN=1 DO "Compresaion location.prg·SLSE DO "Normal subroutine 1 'SNDIP7 1Otheri' SORT ON ENTRY, NUMBER FIELDS RFEND, NUMBER, L, D, F, Z, R, C, ENTRY, S, DESCRIPTOR, LENGTH, 2OT, I, C» CCNDEN = 1 DO "Compresaion location.prg ·

SLSE DO "Normál subroutina 1·SLSE DO "Normal subroutina 1 ·

ENDIF ? ' UnJciown:1 SORT CN ENTRY,NUMBER FIELDS RFEND,NUMBER, L, D, F, Z, R, C, ENTRY, S, DESCRIPTOR, LENGTE, INIT, I.CCMOíI? CCJNDENsl DO “Ccmprassion location.prg"ENDIF? 'UnJciown: 1 SORT CN ENTRY, NUMBER FIELDS RFEND, NUMBER, L, D, F, Z, R, C, ENTRY, S, DESCRIPTOR, LENGTE, INIT, I.CCMOII? CCJNDENsl DO “Ccmprassion location.prg”

ELSE DO "Normál aubroutine 1*ELSE DO "Normal aubroutine 1 *

ENDIF IF CONE5N=iENDIF IF CONE5N = i

SET DEVICE. TO PRINTERSET DEVICE. TO PRINTER

SET PRINTER ONSET PRINTER ON

EJ3CT DO "Output heading.prg* ÜSS "Ana-lysis location.dbf DO "Create bargraph.prg'EJ3CT DO "Output heading.prg * USS" Ana-lysis location.dbf DO "Create bargraph.prg '

SET -HEADING OFF ? ' FUNCTIONAL CLÁSS TOTÁL UNIQUE NEW % TOTÁL1 ?SET -HEADING OFF? 'FUNCTIONAL CLOSE TOTAL UNIQUE NEW% TOTAL1?

LIST OFF FIELDS Ζ,ΝΑΜΞ,CLONES,GQJES,NEW,PERCENT,GRAPHLIST OFF FIELDS Ζ, CLONES, GQJES, NEW, PERCENT, GRAPH

CLOSE DATA2ASESCLOSE DATA2ASES

ERASS TEMP2.DBFERASS TEMP2.DBF

SET HEADINQ ON •USE "SmartGuy:FoxSASS*/Mac:fox files:TEMPMASTER.dbfSET HEADINQ ON • USE SmartGuy: FoxSASS * / Mac: fox files: TEMPMASTER.dbf

ENDIFENDIF

CASE ANAL«S * arraaga/discributionCASE ANAL «S * TAMAGA / DISTRIBUTION

SET HEADING ONSET HEADING ON

STORS 3 TO AMPLIFIER ? 'Cell/tiaaue epecific diatribution:' SORT CM ENTRY, NUMBER FIELDS RFEND,NUMBER,L,D,F,Z,R,C,ENTRY, 3,DESCRIPTOR, LEÍGTH, INIT.I.CCMMENIF CCNDEN·1 DO "Ccmpression dianrib.prg"STORS 3 TO AMPLIFIER? 'Cell / tiaue epecific diatribution:' SORT CM ENTRY, NUMBER FIELDS RFEND, NUMBER, L, D, F, Z, R, C, ENTRY, 3, DESCRIPTOR, LEYGTH, INIT.I.CCMMENIF CCNDEN · 1 DO 'Ccmpression dianrib .prg "

ELSE DO "Normál ·ubroutiaa 1"ELSE DO "Normal · ubroutija 1"

ENDIF 7 'Non-specific distribucíons' SCRT CN ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F, Z, R,C,rNTRY, S, DESCRIPTOR, LENGTO, INIT, LCOMMBK1F CCNDEM.l DO "Compresaion distrib.prg"ENDIF 7 'Non-specific distribucíons' SCRT CN ENTRY, NUMBER FIELDS RFEND, NUMBER, L, D, F, Z, R, C, RNTRY, S, DESCRIPTOR, FLIGHT, INIT, LCOMMBK1F CCNDEM.l DO "Compresaion distrib.prg "

ELSE DO "Normál subroutina 1*ELSE DO "Normal subroutina 1 *

ENDIF 7 'Unkncwn diatribution:1 SORT CN ENTRY,NUMBER FIELDS RFEND,NUMBER,L,D,F, Z, R,C, ENTRY, S, DESCRIPTOR, LENGTH, INIT, I.CŰMMEMIP CCNDENal DO "Catpresaion distrib.prg"ENDIF 7 'Unkncwn Diatribution: 1 SORT CN ENTRY, NUMBER FIELDS RFEND, NUMBER, L, D, F, Z, R, C, ENTRY, S, DESCRIPTOR, LENGTH, INIT, I.MEMMIP CCNDEN DO "Catpresaion distrib.prg"

ELSE DO "Normál subroucine 1"ELSE DO "Normal subroucine 1"

ENDIF IF CCNDEN·!ENDIF IF CCNDEN ·!

SET DEVICE TO PRINTERSET DEVICE TO PRINTER

SET PRINTER CN 82SET PRINTER CN 82

SJECT DO 'Output neading.prg· US3 "Analysis distribution.dbí' DO 'Create bargraph.prg'SJECT DO 'Output neading.prg · US3 "Analysis distribution.dbí' DO 'Create bargraph.prg'

SÍT HEADING OFF ? 1 FUNCTIONÁL CLÁSS TOTÁL UNIQUS % TOTÁL' 7HEAD HEADING OFF? 1 FUNCTIONAL CLOSE TOTAL UNIQUS% TOTAL '7

LIST OFF FIELDS P,NAME,CLQNES,GENES,FERCENT,GRA?HLIST OFF FIELDS P, NAME, CLQNES, GENES, FERCENT, GRA? H

CLOSE DATASASESCLOSE DATASASES

ÍRASS TEMF2.DBFIRR TEMF2.DBF

SÍT HEADING QN ’USE 'SmartGuy:FoxSASE+/Mac:fox files :Ta<PMÁSTER.dbf"SYT HEADING QN 'USE' SmartGuy: FoxSASE + / Mac: fox files: Ta <PMÁSTER.dbf "

ENDIF CASS ANAL=7 * arrange/functionENDIF CASS ANAL = 7 * arrange / function

SÍT SEADING ONSÍT SEADING ON

STORE 10 TO AMPLIFIER ? ’ BUJDOSS PRDTEINS' 7 ? 'Surface no.ecules and receptcrs:' SORT ON Et.TRY,NUM3ER FIELDS RFSND.NUMBZR,L, D, F, Z, R.C, ENTRY,S, DESCRIPTOR. LENGTE, INIT, I, COMMENIF CONDENsl DO ‘Compression function.prg·STORE 10 TO AMPLIFIER? 'BUJDOSS PRDTEINS' 7? 'Surface no.ecules and recipe:' SORT ON Et.TRY, NUM3ER FIELDS RFSND.NUMBZR, L, D, F, Z, R.C, ENTRY, S, DESCRIPTOR. LENGTE, INIT, I, COMMENIF CONDENL DO 'Compression function.prg ·

ELSE DO 'No ma- subroutine 1'ELSE DO 'No subroutine 1'

ENDIF ? 'Calcium-binding proteins:1 SORT QN SNTRY,NUMBSR FIELDS RFíND,NÜM3ER,L,D,?,Z,R,C,ENTRY,S,DESCRIPTOR,LE«?IH,INIT,I,CWSGNIF CONDEN’l DO 'Ccrrprassion function.prg·ENDIF? 'Calcium-binding proteins: 1 SORT QN SNTRY, NUMBSR FIELDS RFND, NMM3ER, L, D,?, Z, R, C, ENTRY, S, DESCRIPTOR, LE'? IH, INIT, I, CWSGNIF CONDEN DO ' Ccrrprassion function.prg ·

ELSE DO 'Mórnál eubroutine 1*ELSE DO 'Mór eubroutine 1 *

ENDIF ? 'Ligands and effectorsi' SORT ON EOTRY,NUM3ER FIELDS RySMD,NÜMBER,L,D,?,Z,R,C,ENTRY,S,DESCRIFTCR,LÍNGTH,INIT,I,CC«MENIF CCWEN-1 DO 'Compression function.prg·ENDIF? 'Ligands and effector' SORT IS EOTRY, NUM3ER FIELDS RySMD, NÜMBER, L, D,?, Z, R, C, ENTRY, S, DESCRIFTCR, LYGTH, INIT, I, CC «MENIF CCWEN-1 DO 'Compression function. · prg

ELSE DO 'Normál subroutine 1*ELSE DO 'Normal subroutine 1 *

ENDIF 7 ’Othar binding proceins.·' SORT CN ENTRY.NUMSER FIELDS RF2ND,NUMBER,L,D,P,Z,R,C,ENTRY,S,DESCRIPTOR,ΙΒϋΙΗ,INIT, I.COHKSNIF CONDEN.l DO 'Compression function.prg"ENDIF 7 'Othar binding processes ·' SORT CN ENTRY.NUMSER FIELDS RF2ND, NUMBER, L, D, P, Z, R, C, ENTRY, S, DESCRIPTOR, ΙΒϋΙΗ, INIT, I.COHKSNIF CONDEN.l DO 'Compression function.prg "

ELSE DO 'Normál subroutine 1·ELSE DO 'Normal subroutine 1 ·

ENDIFENDIF

*EJECT ? ' ONCCGSNES' 9 7 'General cncogenesi' SORT ON ENTRY.NLMSER FIELDS RFEND,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIFT0R,LEM3TH,INIT, Ι,ΟΟΚΜΞΝIF CONDEN.l DO "Compression fun.ction.prg"* EJECT? 'ONCCGSNES' 9 7 'General cncogenesi' SORT ON ENTRY.NLMSER FIELDS RFEND, NUMBER, L, D, F, Z, R, C, ENTRY, S, DESCRIFT0R, LEM3TH, INIT, ΙIF CONDEN.l DO "Compression fun.ction.prg "

ELSE DO 'Normál subroutine 1*ELSE DO 'Normal subroutine 1 *

ENDIF 7 'GTP-binding proteinéi 1 SORT ON ENTRY.NÜMBER FIELDS HFEND, NUM3ER, L, D, F, Z, R, C, ENTRY.S, DESCRIPTOR, LENGTE,INIT, I. CCMHENIF CONDEN.l DO "Compreseion function.prg"ENDIF 7 'GTP binding proteins 1 SORT ON ENTRY.NMBER FIELDS HFEND, NUM3ER, L, D, F, Z, R, C, ENTRY.S, DESCRIPTOR, LENGTE, INIT, I. CCMHENIF CONDEN.l DO "Compresion function .prg "

ELSE DO 'Normál subroutine 1*ELSE DO 'Normal subroutine 1 *

ENDIF 7 'Viral elementai ' 83 SORT ΟΝ ENTRY.NUNSER FIELDS RFEND,NUR3ER,L, D,F, Z, R,C, ENTRY. 3. DESCRIPTOR, LENGTE, IMIT.Ι,ΟΟΜΜΕΝIF CCNDEN=1 CO ‘CaKgresaion ftncsion.prg"ENDIF 7 'Viral Elements' 83 SORT ENTRY.NUNSER FIELDS RFEND, NUR3ER, L, D, F, Z, R, C, ENTRY. 3. DESCRIPTOR, LENGTE, IMIT.Ι, ΟΟΜΜΕΝIF CCNDEN = 1 CO 'CaKgresaion ftncsion.prg "

ELSE co "Normál subroutine 1"ELSE co "Normal subroutine 1"

ENDIF ? 'Kinases and Phosphatases:' SORT ON ENTRY,NUM3ER FIELDS RFEND,NUMSSR,L,D,F,Z,R,C,ENTRY,3,DESCRIPTOR,LQCTH,INIT,I,CCMO?IP CONDSNal CO “Compression function.prg"ENDIF? 'Kinases and Phosphatases:' SORT ON ENTRY, NUM3ER FIELDS RFEND, NUMSSR, L, D, F, Z, R, C, ENTRY, 3, DESCRIPTOR, LQCTH, INIT, I, CCMO? IP CONDSNal CO 'Compression function.prg "

ELSE CO "Normál aubroutíne 1"ELSE CO "Normal aubroutile 1"

ENDIF ? 1Tumor-related antigensi' SORT ON ENTRY,NÜM3ER FIELDS RFEND.NQGSR,L,D,F,Z, R, C,ENTRY, S, DESCRIPTOR,LENGTH, DTCT,I,CCfcMENIF CONDEN=1 DO "Compression function.prg"ENDIF? 1Tumor-related antigen 'SORT ON ENTRY, NÜM3ER FIELDS RFEND.NQGSR, L, D, F, Z, R, C, ENTRY, S, DESCRIPTOR, LENGTH, DTCT, I, CCfcMENIF CONDEN = 1 DO "Compression function.prg"

ELSE CO "Normál subroutine 1"ELSE CO "Normal subroutine 1"

ENDIFENDIF

"EJECT ? ' PROTEIN SWTHETIC HACHIN2RY PROTEINÉ’ ? 'Transcription and Nucleic Acid-bir.ding protein3:‘ SORT ON ENTRY,NUMBER FIELDS RFSND,NUHSER,L,D,F,Z,R,C,3TTRY,S,DESCRIPTOR,LENGTH, ΙΝΙΤ,Ι,ΟΟΗΈΝXF CCNDEN=1 DO "Con^reasion function.prg’"EJECT?" PROTEIN SWTHETIC HACHIN2RY PROTEIN? "Transcription and Nucleic Acid-Birding Protein3: 'SORT ON ENTRY, NUMBER FIELDS RFSND, NUHSER, L, D, F, Z, R, C, 3TTRY, S, DESCRIPTOR, LENGTH, ΙΝΙΤ, Ι, ΟΟΗΈΝXF CCNDEN = 1 DO "Con ^ reasion function.prg '

ELSE DO "Normál subroutine 1"ELSE DO "Normal subroutine 1"

ENDIF ? 'Tranálation:' SORT ON ENTRY,NUMBER FIELDS RFEND,NCKBER,L,D,F, Z, R, C,ENTRY, S, DESCRIPTOR, LENC-TK, INIT,I,CCMMZNIF CONDEN-1 DO "Compreaaion function.prg"ENDIF? 'Transition:' SORT ON ENTRY, NUMBER FIELDS RFEND, NCKBER, L, D, F, Z, R, C, ENTRY, S, DESCRIPTOR, LENC-TK, INIT, I, CCMMZNIF CONDEN-1 DO "Compreaaion function.prg "

ELSE DO "Normál subroutine 1"ELSE DO "Normal subroutine 1"

ENDIF ? 'Riboscmal proteins: ' SORT ON ENTRY,NUMBER FIELDS RFEND,NUMSER,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,L2NGTH,D.1T,I,CCMKENIF CONDEN-1 DO "Compression function.prg*ENDIF? 'Riboscmal proteins:' SORT ON ENTRY, NUMBER FIELDS RFEND, NUMSER, L, D, F, Z, R, C, ENTRY, S, DESCRIPTOR, L2NGTH, D.1T, I, CCMKENIF CONDEN-1 DO "Compression function. PRG *

ELSE DO "Normál subroutine 1*ELSE DO "Normal subroutine 1 *

ENDIF ? 'Protein processing: ' SORT CN ENTRY,NUMBER FIELDS RFEND,NUMBER, L,D,F, 2, R, C,ENTRY, S, DESCRIPTOR, LENGTH, IMIT, I.COMMEUIF CONDEN-1 DO "Compression function.prg".ENDIF? 'Protein processing:' SORT CN ENTRY, NUMBER FIELDS RFEND, NUMBER, L, D, F, 2, R, C, ENTRY, S, DESCRIPTOR, LENGTH, IMIT, I.COMMEUIF CONDEN-1 DO "Compression function.prg" .

ELSE CO "Normál subroutine 1*ELSE CO "Normal subroutine 1 *

ENDIFENDIF

‘EJECT ? ' ENZYMES' ? ‘Ferroproteinsi' SORT ON ENTRY,NUMBER FIELDS RFEND,NUMBER,L, D,F, Z. R, C, ENTRY, S, DESCRIPTOR,LENGTH, HOT,I,COfrfrG5lIF CONDEN-1 DO "Compression function.prg"'EJECT? 'ENZYMES'? 'Ferroprotein' SORT IS ENTRY, NUMBER FIELDS RFEND, NUMBER, L, D, F, Z. R, C, ENTRY, S, DESCRIPTOR, LENGTH, HOT, I, COfrfrG5lIF CONDEN-1 DO "Compression function.prg"

El .SS DO 'Normái subroutine 1'El .SS DO 'Normal subroutine 1'

ENDIF ? 'Proteases and inhibitora:' SORT ON ENTRY,NUMBER FIELDS RFEND,NLMEER,L. D, F. Z, R, C, ENTRY, S. DESCRIPTOR, LENGIK, DOT, I,CCMKENI? CONDSNsl DO "Compression function.prg"ENDIF? 'Proteases and Inhibitors:' SORT ON ENTRY, NUMBER FIELDS RFEND, NLMEER, L. D, F. Z, R, C, ENTRY, S. DESCRIPTOR, LENGIK, DOT, I, CCMKENI? CONDSNsl DO "Compression function.prg"

ELSE 84 DO ’NojkwX subroutine 1"ELSE 84 DO 'NojkwX subroutine 1'

S®IF ? 'Oxidativa pho3prorylaticn:1 SORT ON ENTRY.NDMBER FIELDS RFEND,NÜMBER(L,D.F.Z-R.C,ENTRY,S,DESCRIPTOR,LENGTH, INIT.I.CCWMENIF CCNDEN=1 CO "Conpre33ion function.prg" ELS3 CO “Normál subroutine 1* EDDI? ? 'Sugár metaboliami' SORT ON ZNTRY,NUM3ER FI2LDS RFEO,NÜM3ER,I,D,?,Z,R,C,ENTRY, 3,DSSCRIPTOR,LDK3TH, INTJ7I,COHMENIF CQNDEN-1 DO "Compression function.prg" ELS2 DO "Normál subroutine 1" edoif ? 'Amino acid metabolisn:' SORT ON ENTRY, NUS-BSR FIELDS RFEND.NTOQHR,L, D,F, Z, R, C, ENTRY, S, DESCRIFTOR, LENGTH, DÍIT, I.COMÍENIF CCNEEN-1 DO "Compression function.prg"S®IF? 'Oxidativa pho3prorylatic: 1 SORT ON ENTRY.NDMBER FIELDS RFEND, NIMMER (L, DFZ-RC, ENTRY, S, DESCRIPTOR, LENGTH, INIT.I.CCWMENIF CCNDEN = 1 CO "Conpre33ion function.prg" ELS3 CO "Normal subroutine 1 * EDDI? 'Radius metabolites' SORT ON ZNTRY, NUM3ER FI2LDS RFEO, NÜM3ER, I, D,?, Z, R, C, ENTRY, 3, DSSCRIPTOR, LDK3TH, INTJ7I, COHMENIF CQNDEN-1 DO "Compression function.prg "ELS2 DO" Normal subroutine 1 "Edo? Amino Acid Metabolic: 'SORT ON ENTRY, NUS-BSR FIELDS RFEND.NTOQHR, L, D, F, Z, R, C, ENTRY, S, DESCRIFTOR, LENGTH, DIT, I.COMINE CCNEEN-1 DO "Compression function.prg"

EDSE DO "Normál subroutine 1" 3©t? ? 'Nucleíc acid metabolism:' SORT ON 2N7RY,NÜMB2R FI2LDS RFSND,NUWSSR,L.0,F,Z,R,C,2NTRY,S,DSSCRIPT0R<IEÍGTH<INIT,I,CCWMEN17 CONDEN=1 DO "Ccmpresaion fur.ccion.prg"EDSE DO "Normal subroutine 1" 3 © t? ? 'Nucleic acid metabolism:' SORT ON 2N7RY, NÜMB2R FI2LDS RFSND, NUWSSR, L.0, F, Z, R, C, 2NTRY, S, DSSCRIPT0R <IEYGTH <INIT, I, CCWMEN17 CONDEN = 1 DO "Ccmpresaion fur.ccion .prg "

ELSE DO "Normál subroutine 1"ELSE DO "Normal subroutine 1"

ENDIF ? 'Lipid metabolÍ3m:' SORT ON ENTRY.NLHEER FIELDS RF3iD,NBHSER,L,D,F,Z,RrC,ENTRY, S,DESCRIPTOR, LENGTK, INIT,I,CCMMENIF CONDEN-1 DO "Ccnpression function.prg"ENDIF? 'Lipid Metabolite:' SORT ON ENTRY.NLHEER FIELDS RF3iD, NBHSER, L, D, F, Z, RrC, ENTRY, S, DESCRIPTOR, LENGTK, INIT, I, CCMMENIF CONDEN-1 DO "Ccnpression function.prg"

ELSE DO 'Normál subroutine 1"ELSE DO 'Normal subroutine 1 "

ENDIF ? ’Other enzymeai' SORT ON ENTRY.NÜMBER FIELDS RFaO,M»SER,L.D,F,Z,R,C,SNraY,S,DBSCSIPTOR,lSN5ra,IMIT,I,CC»jENIF CONCEN»! DO "Conpreasion function.prg’ENDIF? "Other enzymes" SORT ON ENTRY.NMMBER FIELDS RFaO, M »SER, L.D, F, Z, R, C, SNraY, S, DBSCSIPTOR, lSN5ra, IMIT, I, CC» jENIF CONCEN »! DO "Conpreasion function.prg"

SLSE DO "Normál subroutine 1"SLSE DO "Normal subroutine 1"

ENDIFENDIF

*EJECT ? ' MISCELLANECUS CATEGORIES' ? ? ’Stress'responae:' SORT CN EOTRY.NUMSER FIELDS FFűND,NCM3ER,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTH,INIT,I,CCWMENI? CONDSNal DO "Compression funcCion.prg"* EJECT? 'MISCELLANECUS CATEGORIES'? ? 'Stress'responae:' SORT CN EOTRY.NUMSER FIELDS FFND, NCM3ER, L, D, F, Z, R, C, ENTRY, S, DESCRIPTOR, LENGTH, INIT, I, CCWMENI? CONDSNal DO "Compression funcCion.prg"

ELSE DO "Normál subroutine 1"ELSE DO "Normal subroutine 1"

ENDIF ? 'Structurai;' SORT QN 2NTRY,NUMB£R FIELDS RFEND,NCMB£R, L,0, F, Z,R,C,ENTRY, S, DESCRIPTOR, LE>CTH, ΙΝΓΓ, I,COMMENIF CCNDENal DO "Compression function.prg" ‘sLse DO "Normál subroutine 1"ENDIF? 'STRUCTURAL;' SORT QN 2NTRY, NUMB £ R FIELDS RFEND, NCMB £ R, L, 0, F, Z, R, C, ENTRY, S, DESCRIPTOR, LE> CTH, ΙΝΓΓ, I, COMMENIF CCNDENal DO "Compression function.prg" ' sLse DO "Normal subroutine 1"

2NDIF ? 'Other clonea.·' SORT ON INTRY.NUMBER FIELDS RFEND,NUMBER,L, D, ?, Z, R,C,ENTRY, S, DESCRIPTOR, LENGTH, ΙΝΓΓ, I, COMMENIF CONDENxl DO "Compression function.prg"2NDIF? 'Other clonea.' 'SORT ON INTRY.NUMBER FIELDS RFEND, NUMBER, L, D,?, Z, R, C, ENTRY, S, DESCRIPTOR, LENGTH, ΙΝΓΓ, I, COMMENIF CONDENxl DO "Compression function.prg"

ELSE 85 DO ·Νοπγλ1 subroutine 1*ELSE 85 DO · Νοπγλ1 subroutine 1 *

ENDIF ? ‘Clor.e9 of unknown fuaceians' SORT ON ENTRY,NUM3ER FIELDS FFEND,NUK3ER, L, D, ?, Z, R, C. SNTRY, S, DESCRIPTOR.LSNQra, SUT. I, COMMSíIF CQNDEN=1 DO ‘Ccmpreeaion fur.cticn.prg*ENDIF? 'Clor.e9 of unknown fuaceians' SORT ON ENTRY, NUM3ER FIELDS FFEND, NUK3ER, L, D,?, Z, R, C. SNTRY, S, DESCRIPTOR.LSNQra, SUT. I, COMMSIF CQNDEN = 1 DO 'Ccmpreeaion fur.cticn.prg *

ELSB DO 'Normál subroutijia 1'ELSB DO 'Normal subroutijia 1'

ENDIF IF CCNDEN=*1ENDIF IF CCNDEN = * 1

SJECTSJECT

•SST DSVICS TO PRINTER• SST DSVICS TO PRINTER

•SET PRINT CN DO 'Output heaöir.g.prg' » ** ÜSS 'Ar.aly8ia fuRCtion.dbf’ DO 'Create bargraph.prg"• SET PRINT CN DO 'Output heaöir.g.prg' »** ETSS 'Ar.aly8ia fuRCtion.dbf' DO 'Create bargraph.prg'

SST K2ADDJ3 OFF SCRESN 1 TYPS 0 HEADING 'Screen 1' AT 40,2 SIZZ 236,492 PIXSLS FONT 'Ganeva',12 COLOR 0,0,0SST K2ADDJ3 OFF SCRESN 1 TYPS 0 HEADING 'Screen 1' AT 40,2 SIZZ 236,492 PIXSLS FONT 'Ganeva', 12 COLOR 0,0,0

? · DOTÁL TOTÁL NSW DIST ? 1 FUNCTICNAL CLASS CLONES GENES GENSS FUNDTICNAL CIASS' j ·? · DOTOT TOTAL NSW DIST? 1 FUNCTICNAL CLASS CLONES GENES GENSS FUNDTICNAL CIASS

•LIST OFF FIELDS Ρ,ΝΑΜΞ, CLONES, GSNES, NEW, PERCENT,ORA?H,CCH?ANYLIST OFF FIELDS Ρ,ΝΑΜΕ, CLONES, G-NES, NEW, PERCENT, GRAPKCLOSE DATASASES• LIST OFF FIELDS Ρ, CLONES, GSNES, NEW, PERCENT, ORA? H, CCH? ANYLIST OFF FIELDS Ρ, CLONES, G-NES, NEW, PERCENT, GRAPKCLOSE DATASASES

ERASE TEMP2.D3FERASE TEMP2.D3F

SST HEADING ON ’USE 'SiraxtGüy:FQxSASE+/Macifox files :TEKPMASTER.<Jbí*SST HEADING ON 'USE' SiraxtGüy: FQxSASE + / Macifox files: TEKPMASTER. <Jbí *

ENDIF CASE ANAL»8 DO “Subgrcup suntnary 3.prg'ENDIF CASE ANAL »8 DO“ Subgrcup suntnary 3.prg '

ENDCASS DO "Test print.prg·ENDCASS DO "Test print.prg ·

SET PRINT OFFSET PRINT OFF

SET DZVICE TO SCREENSET DZVICE TO SCREEN

CLOSE DATASASESCLOSE DATASASES

•ERASS TEMRLXB.DBF• ERASS TEMRLXB.DBF

•ERASE TEMPNÜM.DBF• ERASE TEMPNÜM.DBF

♦ERASE TEMPDESIG.DBF♦ ERASE TEMPDESIG.DBF

* ERASE SELECTED. DfiP* ERASE SELECTED. DfiP

CLEARCLEAR

LCCPLCCP

ENEDO 86ENEDO 86

* COMPRESSION SU3R0OTINE FÓR ANALY3IS FRCGRAMS USE ΤΞΚΡ1* COMPRESSION SU3R0OTINE FÓR ANALYTICAL FRCGRAMS USE ΤΞΚΡ1

COUNT TO TÓT RSPLACE ALL RFEND WITH 1 MARXI = 1 SW2-0COUNT TO LOT RSPLACE ALL RFEND WITH 1 MARXI = 1 SW2-0

CO WHILS SW2»0 ROLLIF MARXI >» TÓTPACXCO WHILS SW2 »0 ROLLIF MARXI» »TOOTACX

COÜNT TO UNIQUZ COUOT TO NSWGENES FÓR D» Ή'.OR.D·'0' SW2=1 LOO?COÜNT TO UNIQUZ COUOT TO NSWGENES FOUND »Ή'.OR.D · '0' SW2 = 1 LOO?

ENDIFENDIF

GO MARXI DUP s 1GO MARXI DUP s 1

STORS EOTRY TO TESTA SW - 0STORS EOTRY TO TESTA SW - 0

00 WHILS SW=O TEST00 WHILS SW = O TEST

SOTSOT

STORS ENTRY ΤΟ ΤΞ3Τ3IT TESTA a TSSTBDSLETEDU? » DÜP-rlLOOP SOI? GO MARXI.STORS ENTRY ΤΟ ΤΞ3Τ3IT TESTA a TSSTBDSLETEDU? »DÜP-rlLOOP SOI? GO MARXI.

RSPLACE RFEND WITH OOPRSPLACE RFEND WITH OOP

MARXI « MARXI-r DUP SWalMARXI «MARXI-r DUP SWal

LOOPLOOP

ENDDO TESTENDDO TEST

LOOPLOOP

SNDDO ROLL •GO TO? STORS Z TO LOC ’ ÜSS ’Analyais locat'ion.dbf’SNDDO ROLL • GO TO? STORS Z TO LOC 'HSS' Analytical Locat'ion.dbf '

LOCATE FÓR Z-LOCLOCATE FORM Z-LOC

RSPLACE CLONES WITH TOTRSPLACE CLONES WITH TOT

RSPLACE GENES WITH UNIQUERSPLACE GENES WITH UNIQUE

RSPLACE NEW WITH NEWGSNSS ÜSS TEHP1 SORT ON RFEND'/D ΤΟ TEMP2 USE ΤΠ4Ρ2 ?? STR(UNIQUE,5,0) 11 1 genea, fór a totál of 1 ?? STR(TOT,5,0) ?? ' .clonea* 1 1 V Coír.cider.ce' liat off flelda ηυπύοβΓ,ΒΡΏΟΛ,Ο,Ρ,Ζ,Η,ς,ΞΝΓΚΥ,δ,ΟΕδΟΚΙΡΤΟΧ,ΐΛίΧΠΚ,ΙίΠΤ,ΙRSPLACE NEW WITH NEWGSNSS SEX TEHP1 SORT ON RFEND '/ D ΤΟ TEMP2 USE ΤΠ4Ρ2 ?? STR (UNIQUE, 5.0) 11 1 genea, forum for the total of 1 ?? STR (TOT, 5.0) ?? '.clonea * 1 1 V Coír.cider.ce' liat off flelda ηυπύοβΓ, ΒΡΏΟΛ, Ρ, Ζ, Η, ς, δ, ΟΕδΟΚΙΡΤΟΧ, ΐΛίΧΠΚ, ΙίΠΤ, Ι

*3ST PRINT OFF* 3ST PRINT OFF

CLOSE DATA3ASESCLOSE DATA3ASES

ERASS TSMPl.DBFERASS TSMPl.DBF

ERASS T54P2.DBFERASS T54P2.DBF

USE TEMPDESIG 87 * COMPRSSSION SUBROUTINS FÓR ANALYSIS PRCGRAM5 ÜSS TEMP1USE TEMPDESIG 87 * COMPRSSSION SUBROUTINS FORM ANALYSIS PRCGRAM5 ÜSS TEMP1

COUOT TO TÓT REPLACE ALL RFEND WITH 1 MARXI » 1 SW2-0COUOT TO LAKE REPLACE ALL RFEND WITH 1 MARXI »1 SW2-0

DO WHILE SW2=0 ROLLI? MARXI >= TÓTPACKDO WHILE SW2 = 0 ROLLI? MARXI> = TOOTACK

COUOT TO UNIQUE SW2-1COUOT TO UNIQUE SW2-1

LOOPLOOP

ENDIFENDIF

00 MARXI DUP = 100 MARXI DUP = 1

STORE EOTRY TO TESTA SW - 0STORE EOTRY TO TESTA SW - 0

DO WHILE SW=O TEST SKI?DO WHILE SW = O TEST SKI?

STORE EOTRY TO TESTBIF TESTA = TESTBDELETEDUP =· DU7+1LOOPSTORE EOTRY TO TESTBIF TESTA = TESTBDELETEDUP = · DU7 + 1LOOP

• ENDIF• ENDIF

GO MARXIGO MARXI

REPLACE RFEND WTTH DUP MARKI = MARXl+Dü? SW=1REPLACE RFEND WTTH DUP MARKI = MARXl + Dü? SW = 1

LOOPLOOP

ENDDO TESTENDDO TEST

LOOPLOOP

ENDDO ROLLENDDO ROLL

’BRCWSE'BRCWSE

*SET PRINTER ON SORT ON DATE ΤΟ TEMP2 USE TEMP2 ?? STRCUNIQUE,4,0) ?7 1 genes, fór a tocal of' 7? STR(TCT,4,0) 7? * clones' ? ? ' V Coíncidence' COUOT ΤΟ P4 FÓR 1-4 IF P4>0 7 STR(P4,3,0) ?? ' genee with priority - 4 (Secondary analysis:)' üst oíf fielda nuwber,RF2^,L,D,F,2,R,C,a7IHY,S,DESCRIPTOR,LENGTH,INIT fór 1-47 ende? COUOT ΤΟ ?3 FÓR 1-3 I? P3>0 ? STR(P3,3,0) ?? 1 genes with priority = 3 (Full Ínsert sequence:)’ list off fielda number,RFEND,L,D,F,Z,R,C,EOTRY,S, DESCRIPTOR, L3ÍCTH, IMIT fór I»3□* SET PRINTER ON SORT ON DATE ΤΟ TEMP2 USE TEMP2 ?? STRCUNIQUE, 4.0)? 7 1 genes, forum for the tocal of '7? STR (TCT, 4.0) 7? * clones? ? 'V Coíncidence' COUOT ΤΟ P4 FOUND 1-4 IF P4> 0 7 STR (P4,3,0) ?? 'genee with priority - 4 (Secondary analysis)' cf o ff field nuwber, RF2 ^, L, D, F, 2, R, C, a7IHY, S, DESCRIPTOR, LENGTH, INIT forum 1-47 themselves? COUOT ΤΟ? 3 FOUND 1-3 I? P3> 0? STR (P3,3,0) ?? 1 genes with priority = 3 (Full Ínsert sequence :) 'list off field number, RFEND, L, D, F, Z, R, C, EOTRY, S, DESCRIPTOR, L3ÍCTH, IMIT forum I »3 □

ENDIF COUOT ΤΟ ?2 FÓR 1=2. IF P2>0 ? STR(?2,3,0) 77 ‘ genes with priority = 2 (Priwary analysis eonplete:)' list ofí fielda nurober,FFEND,L,D,F,Z,R,C,EOTRY,S,DESCRIPTOR,LENGTH, INIT fór 1-2?ENDIF COUOT ΤΟ? 2 FORM 1 = 2. IF P2> 0? STR (? 2,3,0) 77 'genes with priority = 2 (Priwary analysis eonplete)' s list of field nurober, FFEND, L, D, F, Z, R, C, EOTRY, S, DESCRIPTOR, LENGTH, INIT Forum 1-2?

ENDIF COUOT TO Pl FÓR 1-1 IF Pl>0 88 ? STR(P1,3,O) ?? ' genea wíth prioríty = 1 (Primary analysia naededi)'ENDIF COUOT TO PL FOUND 1-1 IF Pl> 0 88? STR (P1,3, O) ?? 'genea wíth priorityíty = 1 (Primary analysis naededi)'

líefe ofi fieldfi cunber.^EW.L/D.PzZ^.C.SNTRY.S.DEaCRI-’TOR.LSNG'rH.IhlT fór I«1ENDIF •SST PRIOT 0F7^ EW.L / D.PzZ ^ .C.SNTRY.S.DEaCRI-'TOR.LSNG'rH.IhlT Forum I «1ENDIF • SST PRIOT 0F7

CLOSS DATABASESCLOSS DATABASES

EHASS TEMP1.DBFEHASS TEMP1.DBF

EHASS TSMP2.DSF USE 'SnartGuy:Fox3AS2f/Mac:fox files idonss.dbf· 89 » COMPEESSICN SU3R0UTINE FÓR ANALYSIS PROGRAM3EHASS TSMP2.DSF USE 'SnartGuy: Fox3AS2f / Mac: fox files idonss.dbf · 89 »COMPEESSICN SU3R0UTINE FORUM ANALYSIS PROGRAM3

USE TEMPIUSE TEMPI

COUNT TO TÓT REPLACS ALL RFEND WITH 1 MARKI » 1 SW2-0COUNT TO LAKE REPLACS ALL RFEND WITH 1 MARKI »1 SW2-0

DO WEILE SW2=0 ROLLXF MARKI >= TÓTPACKDO WEILE SW2 = 0 ROLLXF MARKI> = TOO

COUNT TO UNIQUE SW2=1COUNT TO UNIQUE SW2 = 1

LOOPLOOP

ENDIFENDIF

GO MARKI DUP = 1GO MARKI DUP = 1

STOPÉ ENTRY TO TESTA SW = 0STOP ENTRY TO TESTA SW = 0

DO WHILE SW-0 TEST sxipDO WHILE SW-0 TEST sxip

STORZ ENTRY TO TESTEIF TESTA » TESTEDELE TE DUP » DUP+1STORZ ENTRY TO TESTEIF TEST »FOR TESTS TE DUP» DUP + 1

LCOPLCOP

ENDIFENDIF

GO MARKI REPLACS RFEND WITH DU?GO MARKI REPLACS RFEND WITH DU?

MARKI = MARXl-DUP SW=1MARKI = MARXl-DUP SW = 1

LOOPLOOP

ENDDO TESTENDDO TEST

LOOPLOOP

ENDDO ROLLENDDO ROLL

•BROWSE• BROWSE

•SZT PRINTER ON SORT ON NUMBER ΤΟ ΤΞΜΡ2 USE ΤΠ4Ρ2 ?? STR(UNXQU3,4,0) ?? ' genes, fór a totál of ’ ?? STR(TOT,5,0) ?? 1 clonea' ? ' V Coincidence'• SZT PRINTER IS SORT ON NUMBER ΤΟ ΤΞΜΡ2 USE ΤΠ4Ρ2 ?? STR (UNXQU3,4,0) ?? 'genes, the forum of the total of ?? STR (TOT, 5.0) ?? 1 clonea '? 'V Coincidence'

liat off fielda niasber,RFIND,L,D,F,Z,R,C,ZNIRY,S,DESCRI?TOR,LENGTH,INIT,Idirt off field niasber, RFIND, L, D, F, Z, R, C, ZNIRY, S, DESCRI? TOR, LENGTH, INIT, I

♦SET PRUÍT OFF♦ SET PRUUST OFF

CLOSE DATABASZSCLOSE DATABASE

ERASE TEMP1.DBFERASE TEMP1.DBF

ERASE TEMP2.DBF USE ‘S[nartGuy:FoxBASET/Mac:fűx files:slones.dbf' 90ERASE TEMP2.DBF USE 'S [nartGuy: FoxBASET / Mac: grass files: slones.dbf' 90

* CCMPRES3XON SU3ROCTIN3 FÓR AHALYSIS FROGRAMS ÜSS TEMP1* CCMPRES3XON SU3ROCTIN3 FORWARD AHALYSIS FROGRAMS USS TEMP1

COCNT TO TÓT RSPLACE ALL, RFEXTD WITH 1 MARKI - 1 SW2=0COCNT TO TOWN RSPLACE ALL, RFEXTD WITH 1 MARKI - 1 SW2 = 0

EO WHILE SW2=0 ROLLIF MARKI >- TÓTPACKEO WHILE SW2 = 0 ROLLIF MARKI> - TOWER

CCUNT TO UNIQUS COUNX TO NtcGSOíSS FÓR Ds’H· .OR.Efe'O'sw2«:CCUNT TO UNIQUS COUNX TO NtcGSOIL FORM Ds'H · .OR.Efe'O'sw2 «:

LCOPLCOP

ENDIFENDIF

GO MARKI DUP · 1 STORE ENTRY ΤΟ ΤΕΞΤΑ sw > öGO MARKI DUP · 1 STORE ENTRY ΤΟ ΤΕΞΤΑ sw> ö

EO WHILE SW=0 TEST skipEO WHILE SW = 0 TEST skip

STCRE ENTRY TO TSST3IF TSSTA = TSST3DELETED(JP = DUP+1LOOPSTCRE ENTRY TO TSST3IF TSSTA = TSST3DELETED (JP = DUP + 1LOOP

ENDIFENDIF

GO MARKIGO MARKI

REPLACE FFEND WITH DOT MARKI - KARK1+CU? SW»1REPLACE FFEND WITH DOT MARKI - KARK1 + CU? SW »1

LCOPLCOP

ENDDO TESTENDDO TEST

LCOPLCOP

ENDDO ROLLENDDO ROLL

GO TOPGO TOP

STORE R TO FUNC ÜSS ’Analysís xuoction.dbf‘STORE R TO FUNC USS 'Analysis xuoction.dbf'

LOCATE FÓR P^FUNCLOCATE FORM P ^ FUNC

RSPLACE CLONES WITH TÓTRSPLACE CLONES WITH TOUR

REFLACE GENSS WITH UNIQÜS PSPLACE NEW WITH ΝΞΜ3ΕΝΕ3· ÜSS TEUPl SORT CN RFSND/D ΤΟ ΤΞΜΡ2 CSS TEMP2REFLACE GENSS WITH UNIQÜS PSPLACE NEW WITH ΝΞΜ3ΕΝΕ3 SS ÜSS TEUPL SORT CN RFSND / D ΤΟ ΤΞΜΡ2 CSS TEMP2

SST HEADIN3 CN ?? STR(ÜNXQCS,5,0) ?? ’ g«n«s, far a totál of 1 ?? STRCTOT, 5,0) 17 ' clcnee' »♦* ? 1 V Coineiáence'SST HEADIN3 CN ?? STR (ULNQCS, 5.0) ?? 'G «n« s, far the total of 1 ?? STRCTOT, 5.0) 17 'clcnee' »♦ *? 1 V Coineiáence '

li«t off fielda cuaber,RFSND, L,D,?,Z,R,C,ENTRY,S,DESCRX?TOR,LSNGTH, IMIT, I fttli «t off field cuaber, RFSND, L, D,?, Z, R, C, ENTRY, S, DESCRX? TOR, LSNGTH, IMIT, I Ftt

‘SCRESN 1 ΤΥΡΕ 0 ΗΞΑΠΙΝ0 ’Screen 1' AT 40,2 SI2E 286,492 PIXELS FONT “Geneva'.iS COLOR 0,0,♦üst cfí fielda RFEND,S,DESCRI?TOR'SCRESN 1 ΤΥΡΕ 0 ΗΞΑΠΙΝ0' Screen 1 'AT 40.2 SI2E 286.492 PIXELS FONT' Geneva'.iS COLOR 0.0, st cauliflower field RFEND, S, DESCRI? TOR

*SET PRUsT OFF* SET PRUsT OFF

CL0S2 DATABASESCL0S2 DATABASES

ERASB TEKP1.EEFERASB TEKP1.EEF

EAAS2 TSM72.D3FEAAS2 TSM72.D3F

ÜSS TSMPOESXG 91ÜSS TSMPOESXG 91

* CCMFHESSICN SU3RCOTINE FOS ANALYSIS PROGSAKS USB T24P1* CCMFHESSICN SU3RCOTINE FOS ANALYSIS FOR PROFESSIONAL USB T24P1

COUNT TO TÓT REPLACE ALL RFEND WITH 1 KASKI = 1COUNT TO LAKE REPLACE ALL RFEND WITH 1 KASKI = 1

DO WHILE SW2=0 ROLLIF MARXI >» TOTPACXDO WHILE SW2 = 0 ROLLIF MARXI> »TOTPACX

COUNT TO UNIQUE SW2=1COUNT TO UNIQUE SW2 = 1

LCOPLCOP

ENDIFENDIF

GO MARKI DÚS - 1GO MARKI DUS - 1

STCRE ENTRY TO TESTA SW - 0STCRE ENTRY TO TESTA SW - 0

DO WHILE SW=0 TESTDO WHILE SW = 0 TEST

SKIPSKIP

STCRS ENTRY TO TESTBIF TESTA TESTBDELEJTE DOT = DOT+1STCRS ENTRY TO TESTBIF TEST TEST TEST DOT = DOT + 1

LOOPLOOP

ENDIFENDIF

C-0 MARKIC-0 MARKI

REPLACE SFEND WITH DOTREPLACE SFEND WITH DOT

KARKI = MARK1+DUP EW=1KARKI = MARK1 + DUP EW = 1

LOOPLOOP

ENDDO TESTENDDO TEST

LOOPLOOP

ENDDO ROLL GO TO?ENDDO ROLL GO TO?

STCRE F TO DIST USE "Analysis distríbution.dbf·STCRE F TO DIST USE "Analysis Distraction.dbf ·

LCCATE FÓR ?»DISTLCCATE FORUM »» DIST

REPLACE CLCNES WITH TÓTREPLACE CLCNES WITH TOUR

REPLACE GENES WITH ÜNIQUE USE TEMP1 «art on. rfend/d to TENP2 USE TENP2 ?? STRtUNIQUE,5.0) 7? ' genex, fór a totál oí 1 77 STR(T0T,5,0) 77 ’ clccee' 7 ' V Cóincidens:·'REPLACE GENES WITH UNIQUE USE TEMP1 «art is. rfend / d to TENP2 USE TENP2 ?? STRtUNIQUE, 5.0) 7? 'genex, forum for total 1 77 STR (T0T, 5,0) 77' clccee '7' V Cóincidens: · '

liat oíf fielda numbex,RFEND,L,D,F,E,R,C,ENTRY,S.DESCRIFTOR.LENOTH, IMIT, Iliat of fielda numbex, RFEND, L, D, F, E, R, C, ENTRY, S.DESCRIFTOR.LENOTH, IMIT, I

*SET PRIOT OFF* SET PRIOT OFF

CLOSE DATA3ASESCLOSE DATA3ASES

ERASE TEMP1.DBFERASE TEMP1.DBF

ERASS TEMP2.DBFERASS TEMP2.DBF

USB TENPEESIG 92 ’ CCMPRESSION SUBROUT^ÍS FÓR ANALYSIS FROGRAM3 USB TSMP1USB TENPEESIG 92 'CCMPRESSION SUBROUT ^ AUS ANALYSIS FROGRAM3 USB TSMP1

COUNT TO TÓT RSPLACS ALL RFEND WITH 1 MARKI » 1 SW2-0COUNT TO LAKE RSPLACS ALL RFEND WITH 1 MARKI »1 SW2-0

DO WHILE SW2=0 ROLLIF MARKI >- TÓTPACKDO WHILE SW2 = 0 ROLLIF MARKI> - TOWER

COUNT TO UNIQUE SW2=1COUNT TO UNIQUE SW2 = 1

LOOP ENDI?LOOP ENDI?

GO MARKI DUP - 1GO MARKI DUP - 1

STORE ENTRY TO TESTA SW - 0STORE ENTRY TO TESTA SW - 0

DO WHILE SWaO TEST SKI?DO WHILE SWAO TEST SKI?

STOPÉ EOTRY TO TEST3IF TESTA = TEST3LELETE DUP .» DUP+1STOP EOTRY TO TEST3IF TESTA = TEST3LELETE DUP »DUP + 1

LOOPLOOP

ENDIFENDIF

GO MARKIGO MARKI

REPLACE -RFEND WITH DUPREPLACE -RFEND WITH DUP

MARKI - MARK1+EUP SW=1MARKI - MARK1 + EUP SW = 1

LOOPLOOP

ENDCŰ TESTENDCY TEST

LOOP ENDDO ROLL ' GO TO? USB ΤΈΜΡ1 7? STR(UNICUS,5,0) 77 1 genes. fór a totál of ' ?? STR(TOT,5,0) ?? ' clonea' ? ' V Coincidenc·'LOOP ENDDO ROLL 'GO TO? USB ΤΈΜΡ1 7? STR (UNICUS, 5.0) 77 1 genes. forum for the total of '?? STR (TOT, 5.0) ?? 'clonea'? 'V Coincidenc ·'

üst Off fields nurrber<RFEND(L,D<F,Z.R.C.Eí7r3Y,StDESCKIPTOR,LEN3TH,INIT(Icauldron Off fields nurrber <RFEND (L, D <F, Z.R.C.Ei7r3Y, StDESCKIPTOR, LEN3TH, INIT (I

*SET PRINT OFF* SET PRINT OFF

CLCSE DATA3ASES ERASE TEMPl.DB?CLCSE DATA3ASES ERASE TEMPl.DB?

USB TEMPDESIG 93USB TEMPTESIG 93

’ COMPRESSICN SU3R0UTINE POR ANALYSIS PROGRAMS ÜSS ,StnaríCuy:Fox5ASS*ZMac: :ox filee:Clonas.dfc£’ copy το tempi fór ÜSS TEMP1 COUNT TO XEGENE FÓR D-'S' .OR.Da'O' .OR.D='H'.CR.Da'N' .OR.D='R' .OR.De’A' DELETS FÓR Ds'N1 .OR.Ds'O· .OR.Ds’A' .O?..D='U' .CR.D='S' .OR.Ds’M' .OR.Da'R' .OR.D='V''COMPRESSICN SU3R0UTINE POR ANALYSIS PROGRAMS, STNARÍCUY: Fox5ASS * ZMac:: ox filet: Clonas.dfc £' copy το tempi forum 'H'.CR.Da'N' .OR.D = 'R' .OR.De'A 'DELETS FÓR Ds'N1 .OR.Ds'O · .OR.Ds'A' .O? .. D = 'U' .CR.D = 'S' .OR.Ds'M '.OR.Da'R' .OR.D = 'V'

PACXPacXon

COUOT TO TÓTCOUOT TO TÓS

REPLACS ALL RFEND WITH I MARXI » 1 SH2=0 DO WHILE SW2sQ ROLL·REPLACS ALL RFEND WITH I MARXI »1 SH2 = 0 DO WHILE SW2sQ ROLL ·

X? MARXI >= TÓTPACKX? MARXI> = TOOTACK

CŰUNT TO ÜMIQOE SW2»1THOUGHT TO YOURSELF SW2 »1

LOOPLOOP

SNDIFSNDIF

GO MARXI DUP 1GO MARXI DUP 1

STORE Q3TRY TO TESTA SW - 0STORE Q3TRY TO TESTA SW - 0

DO WHILE SW«C TESTDO WHILE SW «C TEST

SKXP STORE ENTRY TO TESTBXF TESTA s TESTBDELETS'SKXP STORE ENTRY TO TESTBXF TEST TESTBDELETS '

DUP « DUP+1LOOP sói?DUP «DUP + 1LOOP salts?

GO MARXIGO MARXI

REPLACS RFEND WXTH DUPREPLACS RFEND WXTH DUP

MARXI s MARXI-DUP SWslMARXI s MARXI-DUP SWsl

LOOPLOOP

ENDDO TESTENDDO TEST

LOOPLOOP

ENDDO ROLLENDDO ROLL

‘BROWSE'BROWSE

♦SET PRINTER QN SORT ON RFENDZD ,NUM3ER ΤΟ TEXP2 USE TEMP2♦ SET PRINTER QN SORT ON RFENDZD, NUM3ER ΤΟ TEXP2 USE TEMP2

REPLACS ALL START WXTH RFENDZXDCÍ^’ICOOO ?? STRCUNIQUE,5,0) ?? ' íor a totál o£ ' 77 STR(TOT,S,0) 77 ' elanej' ? ' Coíacidence V V Clor.ea/10000' set heading o££REPLACS ALL START WXTH RFENDZXDCÍ ^ 'ICOOO ?? STRCUNIQUE, 5.0) ?? 'he is the total o £' 77 STR (TOT, S, 0) 77 'resident'? 'Coíacidence V V Clor.ea / 10000' set heading o ££

SCRSEN 1 ΤΥΡΕ 0 HSADING 'Sőréén 1' AT 40,2 SXZE 286,452 PIXELS FONT 'Geneva',7 COLOR 0,0,0,üst fiald» aisnber, RFEXD, START, L,D,F,Z,R, C, ENTRY, S, DESCRIPTOR, INIT, I‘SET PRXNT OFFSCRSEN 1 ΤΥΡΕ 0 HSADING 'Sirene 1' AT 40,2 SXZE 286,452 PIXELS FONT 'Geneva', 7 COLOR 0,0,0, Cauliflower, RFEXD, START, L, D, F, Z, R, C, ENTRY, S, DESCRIPTOR, INIT, I'SET PRXNT OFF

CLOSE DATABASESCLOSE DATABASES

ERASE TEMP1.DSFERASE TEMP1.DSF

ERASE TEMP2.DBF USE 'SnartGuy:FoxBASEt/Mac:fox íileazclonea.dbf" 94ERASE TEMP2.DBF USE 'SnartGuy: FoxBASEt / Mac: fox ilileazclonea.dbf "94

* CCMPRESSIOK SUBR0UTIN3 FÓR ANALYSIS PROCRAMS USE TE4P1 COUOT TO IDGENE FÓR D=’3' .OR.D='O' .ΟΕ.Ο=·Η' .OR.C=’N' .OR.D='R· .OR.D='A* DELETE FÓR D='N' .OR.O='D' .OR.D='A‘ .OR.D='U'.OR.D-'S' .OR-D-'M* .OR.Cte'R' .OR.D='V’* CCMPRESSIONS SUBR0UTIN3 FORM ANALYSIS FOR USE TE4P1 COUOT TO IDGENE FOUND D = '3' .OR.D = 'O' .ΟΕ.Ο = · Η '.OR.C =' N '.OR.D =' R ·. OR.D = 'A * DELETE FORM D =' N '.OR.O =' D '.OR.D =' A '.OR.D =' U'.OR.D-'S '.OR-D -'M * .OR.Cte'R '.OR.D =' V '

CCUNT TO TÓT REPLACE ALL RFEND WITH 1 MARKI » 1 SW2=0CCUNT TO LAKE REPLACE ALL RFEND WITH 1 MARKI »1 SW2 = 0

DO WHILE SW2=0 ROLLIF MARXI >’ TÓTPACKDO WHILE SW2 = 0 ROLLIF MARXI> ”TOO

COUNT TO UNIQUE SW2=1COUNT TO UNIQUE SW2 = 1

LOOPLOOP

EMDIF GO MARKIOU? - 1 STORE EíTRY TO TESTASW - 0 00 WHILE SW=O TESTSKX? STORE ENTRY TO TESTBIF TESTA = TESTBDELSTEDUP - DUP+1LOOP ·EMDIF GO MARKIOU? - 1 STORE EILTRY TO TESTASW - 0 00 WHILE SW = O TESTSKX? STORE ENTRY TO TESTBIF TESTA = TESTBDELSTEDUP - DUP + 1LOOP ·

ENDIFENDIF

GO MARXI REPLACE RF2ND WITH DUPMARKI - MARXIrDUPSW«1GO MARXI REPLACE RF2ND WITH DUPMARKI - MARXIrDUPSW «1

LOOPLOOP

ENDDO TESTLOOPENDDO TESTLOOP

ENDOO ROLL♦BROWSEENDOO ROLL ♦ BROWSE

♦SET PRINTER ON SORT CN RFEND/D,NUMB£R ΤΟ ΤΞΜΡ2USE TSMP2 REPLACE ALL START WITH RFEND/IDGENS*10000?? STR(UNIQUS,5,0) 7? 1 g«n·», fór a tocal of ' 77 STR(TOT,S,0) , 77 * ciánéi' ? ' Coincidenee V V Clone9/10000' aet heading oíf♦ SET PRINTER ON SORT CN RFEND / D, NUMB £ R ΤΟ2USE TSMP2 REPLACE ALL START WITH RFEND / IDGENS * 10000 ?? STR (UNIQUS, 5.0) 7? 1 g «n ·», the tocal of '77 STR (TOT, S, 0), 77 * cyanéi? 'Coincidenee V V Clone9 / 10000' aet heading

SCRESN 1 ΤΥΡΕ 0 HEADING 'Screea 1" AT 40,2 SI2S 286,492 PIXEL5 FONT 'Geneva',7 COLOR 0,0,0,Ült fieldi number, RFEND, START, L,D,F, Ζ^Η,Ο,ENTRY, S, DE3CRIPT0R; INTT, I*SET PRIKT OFF CL0S3 0ATA3ASESERASE TEMPl.DBFERASE ΤΞ4Ρ2.0ΒΡ ÜSS ·33ΆΓς<ϊυγ:Γοχ2Α5Ε·ι·/Μ4θíox fii·»sclcnes.dbf’ 95 USE ΤΞΜΡΙSCRESN 1 ΤΥΡΕ 0 HEADING 'Screea 1' AT 40.2 SI2S 286.492 PIXEL5 FONT 'Geneva', 7 COLOR 0.0.0, Field field number, RFEND, START, L, D, F, Ζ ^ Η, Ο, ENTRY , S, DE3CRIPT0R; INTT, I * SET PRIKT OFF CL0S3 0ATA3ASESERASE TEMPLE.DBFERASE ΤΞ4Ρ2.0ΒΡ ÜSS · 33ΆΓς <ϊυγ: Γοχ2Α5Ε · ι · / Μ4θíox · · sclcnes.dbf '95 USE ΤΞΜΡΙ

COCNT ΤΟ TÓT ?? · Totál of* ?? STR(TOT,4,0) ?? ‘ clonea'COCNT T LAKE ?? · Total of * ?? STR (TOT, 4.0) ?? 'Clonea'

♦Ilit Off fields nuoÍDer,L,D,F,2,R,C,EWrRy,EESCRIPTOR,LENGTH,R?ZND,niXT,Xlist o££ fielda number.L.D.F.Z.S.C.ENTOY.EESCRIPTORCLO3E DATABASESIt Ilit Off fields from DDer, L, D, F, 2, R, C, EWrRy, EESCRIPTOR, LENGTH, R? ZND, niXT, Xlist o ££ field number.L.D.F.Z.S.C.ENTOY.EESCRIPTORCLO3E DATABASES

ERASS-TSM?1.DBFERASS-TSM? 1.DBF

USE TEMFDESIC 96 •Lifescan menü; version 8-7-94USE TEMFDESIC 96 • Lifescan Menu; Version 8-7-94

SEJT TALK OFF eet device to screenCELL TALK OFF eet device to screen

CLEAR ÜSS ·επ»ΓΕΰυγ:ΡοχΕΑ5Ε+/ΜΛσ:£οχ files:clones.dbf' 3TOFE LUFCATEO TO CpdateCLEAR HSS · επ »ΓΕΰυγ: ΡοχΕΑ5Ε + / ΜΛσ: £ οχ files: clones.dbf '3TOFE LUFCATEO TO Cpdate

GO BGTTCM STORE RECNOO TO cloneno STORE 6 TO Chooser DO WHIL3 .T. * Program.: Lifeseq menu.fmt * Date....i 1/11/95 * Version.: Fcx£ASE+/Mac, revision 1.10 * Notes....: Formát fiié Lifeseq menü « SCR2EN 1 ΤΥΡΕ 0 KEADIN3 -Screea 1" AT 40.2 SIZE 286,492 PIXELS FONT "Geneva',268 COLOS 0,0,8 PIXEXS 18,126 TO 77,365 STYLE 28479 COLOR 32767,-25600,-1,-16223,-16721,-157238 PIXEXS 110,29 TO 188,217 STYLE 3371 COLOR 0,0,-1,-25600,-1,-1 8 PIXELS 45,161 SAY "LIFESE3’ STYLE 53335 FONT ’Geneva·,536 COLOK 0,0,-1,-1,7135,58843 PIXELS 36,269 SAY ’IM" STYLE 65536 FONT ·δβηβνβ·,12 COLOR 0,0,-1,-1,7135,58848 PIXELS 53,143 SAY 'Molecular Biology Desktop* SITTJE 65536 FONT 'Helvetica’,18 COLOR 0,0,0,8 PIXELS 90,252 TO 251,467 STYLE 23447 COLOR 0,0,-1,-25600,-1,-1 8 PIXEXS 117,270 GET Chooser STYLE 65535 FONT 'Chicago·,12 PICTCRS '3*RV Transcript profiles3 PIXEXS 135,128 SAY üpdate STYLE 0 FCWT 'Geneva',12 SI22 15,79 COLOR 0,0,0,-25600,-1,-1 ’ 0 PIXELS 171,128 SAY cloneno STYLE 0 FCOT 'Geneva',12 SIZ2 15,79 COLOR 0,0,0,-25600,-í,-18 PIXELS 135,44 SAY "Last lipdace:* STYLE 65536 FOOT 'Geneva',12 CCLOR 0,0,-1,-1,-1,-18 PIXELS 171,44 SAY 'Totál clones:· STYLE 65536 FONT “Ger.eva',12 CCLOR 0,0,-1,-1,-1,-13 PIXELS 45,296 SAY ’vl.30’ STYLE 55536 FONT 'Geneva*,782 COLOR 0,0,-1,-1,-1,-1 * * EOF: Lifeseq menü. fixGO BGTTCM STORE RECNOO TO cloneno STORE 6 TO Chooser DO WHIL3 .T. * Program: Lifeseq menu.fmt * Date .... i 1/11/95 * Version .: Fcx £ ASE + / Mac, revision 1.10 * Notes ....: Form Fiii Lifeseq Menu «SCR2EN 1 ΤΥΡΕ 0 KEADIN3 - Screea 1 "AT 40.2 SIZE 286,492 PIXELS FONT" Geneva ", 268 COLOS 0,0,8 PIXEXS 18,126 TO 77,365 STYLE 28479 COLOR 32767, -25600, -1, -16223, -16721, -157238 PIXEXS 110,29 TO 188,217 STYLE 3371 COLOR 0.0, -1, -25600, -1, -1 8 PIXELS 45,161 SAY "LIFESE3 'STYLE 53335 FONT' Geneva ·, 536 COLOK 0.0, -1, -1,7135,58843 PIXELS 36,269 SAY ' IM "STYLE 65536 FONT · δβηβνβ ·, 12 COLOR 0.0, -1, -1,7135,58848 PIXELS 53,143 SAY 'Molecular Biology Desktop * SITTJE 65536 FONT' Helvetica ', 18 COLOR 0.0,0,8 PIXELS 90,252 TO 251,467 STYLE 23447 COLOR 0,0, -1, -25600, -1, -1 8 PIXEXS 117,270 GET Chooser STYLE 65535 FONT 'Chicago · 12 PICTCRS' 3 * RV Transcript profiles3 PIXEXS 135,128 SAY üpdate STYLE 0 FCWT 'Geneva' , 12 SI22 15,79 COLOR 0,0,0, -25600, -1, -1 '0 PIXELS 171,128 SAY cloneno STYLE 0 FCOT' Geneva ', 12 SIZ2 15,79 COLOR 0,0,0, -25600, - í, -18 PIXELS 13 5.44 SAY "Last lipdace: * STYLE 65536 FOOT 'Geneva', 12 CCLOR 0.0, -1, -1, -1, -18 PIXELS 171.44 SAY 'Total Clones: · STYLE 65536 FONT ', 12 CCLOR 0.0, -1, -1, -1, -13 PIXELS 45,296 SAY' vl.30 'STYLE 55536 FONT' Geneva *, 782 COLOR 0.0, -1, -1, -1, - 1 * * EOF: Lifeseq menu. fix

REXDREXD

DO CASE CASE Chocserel DO 'SmaxtCuy:FcxSASE+/Mac:£ox filea:Output program»:Master analysis 3,prg· CASE Chceser»2 DO 'SmartGty :Fcx2ASS+/Mac:fox files-.Output program» :Subtracticn 2.prg" CASE Chccser»3 DO ,SmartGuy:FoxSASE+/Mac:fox filas:Output programi:Northern (aingle).prg* CASE Chocser»4 ÜSS 'Libraries.dbf'DO CASE CASE Chocserel DO 'SmaxtCuy: FcxSASE + Mac: £ ox filea: Output program »: Master analysis 3, prg · CASE Chceser» Fox files-.Output program »: Subtracticn 2.prg "CASE Chcser» 3 DO, SmartGuy: FoxSASE + / Mac: fox filas: Output programi: Northern (aingle) .prg * CASE Chocser »4 USS 'Libraries.dbf'

3RCWSE CASE Chcosex»5 DO 'SmartGuy:FoxEASE+/Mac:fox fileeiOutput programsiSee individual clone.prg'3RCWSE CASE Chcosex »5 DO 'SmartGuy: FoxEASE + / Mac: fox filletsOutput programsiSee individual clone.prg'

CASE ChOCCOS DO ·StuartGuy:FcxBASE+/Mac:£ex filesiLibrariesi Output programs:Menü.pxg· CASE Chocser=7CASE CHOCCOS DO · StuartGuy: FcxBASE + / Mac: £ ex filesiLibraries Output programs: Menu.pxg · CASE Chocser = 7

CLEARCLEAR

SCREEN 1 OFFSCREEN 1 OFF

KETORNtwo hours of

ENDCASEENDCASE

LOOPLOOP

ENDDO 97 ¢1,30 ΞΑΥ "Database Subset Analyaís* STYLE 5553« FONT ’Geneva",274 COLOR 0,0,0,777 t 7 dateC) ?? ’ 1ENDDO 97 ¢ 1.30 ΞΑΥ "Database Subset Analyzer * STYLE 5553« FONT "Geneva", 274 COLOR 0.0,0,777 t 7 dateC) ?? '1

77 TIM2O 7 'Clone r.umbers ’ ?? STR(3NIT1ATE,6,O) ?? ' through ’ ?? STR(TERMINATE,6,0) 7 ‘Libraries: ' IF ENTIRE»! 7 'All libraries'77 TIM2O 7 'Clone r.umbers' ?? STR (3NIT1ATE, 6, O) ?? 'through' ?? STR (TERMINATE, 6.0) 7 'Libraries:' IF ENTIRE '! 7 'All libraries'

ENDIFENDIF

IF ENTIRE=2MASXslDO WKILE .1.if mark>sto?itEXITENDIF US2 SELECTEDGO MARK7 ' ' 7 7 TRXMdibnetc·)IF ENTIRE = 2MASXslDO WKILE .1.if mark> sto? ItEXITENDIF US2 SELECTEDGO MARK7 '' 7 7 TRXMdibnetc ·)

STORS HAMUI TO MARKLOOPSTORS HAMUI TO MARKLOOP

ENDDOENDDO

ENDIF 7 'Designationsi ‘ IF JbiatchsO .AND. Kmeteh=0 .AND. Qnatch=0 7? 'All'ENDIF 7 'Designation ‘IF JbiatchsO .AND. Kmeteh = 0 .AND. Qnatch = 0 7? 'All'

ENDIF i? Enacch«l 7? 'Exact.'ENDIF i? Enacch «l 7? 'Exact.'

ENDIF IF E.T.atch-1 7? 'Huioan, ‘ENDIF IF E.T.atch-1 7? 'Huioan,'

ENDIF I? Ómateh»1 7? 'Other «p.'ENDIF I? Ómateh »1 7? 'Other «p.'

ENDIF IF CONDEN-l 7 'Condeased fomat analysis'ENDIF IF CONDEN-7 'Condeased fomat analysis'

ENDIF IF ANAL-l ?· ’Sorted by NUM3ER'ENDIF IF ANAL? · 'Sorted by NUM3ER'

ENDIF IF ANAL-2 7 ’Sorted by ENTRY'ENDIF IF ANAL-2 7 'Sorted by ENTRY'

ENDIF IF ANAL-3 ? 'Arranged by A3VNDANCS'ENDIF IF ANAL-3? 'Arranged by A3VNDANCS'

ENDIF I? ANAL«4 ? ’Sorted by INTEREST'ENDIF I? ANAL «4? 'Sorted by INTEREST'

ENDIF IF ANAL-5 7 'Arranged by LOCATICN'ENDIF IF ANAL-5 7 'Arranged by LOCATICN'

ENDIF IF ANAL-5 7 'Arranged by DISTRIBUTICN'ENDIF IF ANAL-5 7 'Arranged by DISTRIBUTICN'

ENDIF IF ANAL-7 7 'Arrangad by FUNCTICN' 1,-1,-1 98ENDIF IF ANAL-7 7 'Arrangad by FUNCTICN' 1, -1, -1 98

ENDTF ? 'Totál clones repreaented: 17? STR(STARTOT, 6,0) ? 'Totál clonea analyzedi ' 7? STR(ANALTOT,6,0) 7 7 99 USE TEMP1ENDTF? 'Total clones repreaented: 17? STR (STARTOT, 6.0)? 'Total clonea analyzedi' 7? STR (ANALYTIC, 6.0) 7 7 99 USE TEMP1

COÜNT ΤΟ TÓT ?? ’ Totál of ?? STR(TCT,4,0) ?? ' clone3· ?COÜNT T LAKE ?? 'Total of ?? STR (TCT, 4.0) ?? 'clone3 ·?

’líst öff fields tunÜ3er.L,D,F,Z,R,C,Ek7raY,DESCRI?'ICR,La'C7H,RrZ}O,INIT,Ilist ofí fialds number,L,D,?,Z,R,C,EOTRY,DESCRIFTORCLOSE EATABA3ES ERASE TEMP1.D3?'lsd off fields tunÜ3er.L, D, F, Z, R, C, Ek7raY, DESCRI?' ICR, La'C7H, RrZ} O, INIT, Il, ofi fialds number, L, D,?, Z, R, C, EOTRY, DESCRIFTORCLOSE EATABA3ES ERASE TEMP1.D3?

USE TEMRDESIG - 100 - ÜSS TSHP1USE TEMRDESIG - 100 - ÜSS TSHP1

COUNT TO TÓT ?? ' Totál of· ?? 9TR(TOT,4,0) ?? ' cíones'. 7COUNT TO HOME ?? 'Total of · ?? 9TR (TOT, 4.0) ?? 'Addresses'. 7

♦list off fielQ3 W-UTÓee, L, D, P, 2, R, CrE^JTRY.DSSCRIPTORdaCTH, HFETTO, INIT, Ilist off fields n-.atoer^toD.FjZ.RiC.aJTRy.DSSCRXPTORCLOSE DA.TA2ASSS S3ASE TDí?l.DB?Off list off fielQ3 W-UTÓee, L, D, P, 2, R, CrE ^ JTRY.DSSCRIPTORdaCTH, HFETTO, INIT, Ilit off fields n-.atoer ^ toD.FjZ.RiC.aJTRy.DSSCRXPTORCLOSE DA.TA2ASSS S3ASE TDí ? l.DB?

USE TEMPOESIG - 101 - *Northern (single), version 11-25-94 close databases SET TALX OF? SET PRIOT OF? SET EXACT 0??USE TEMPOESIG - 101 - * Northern (single), version 11-25-94 close databases SET TALX OF? SET PRIOT OF? SET EXACT 0 ??

CLEAR STORE ' ' TO Eobject STORE ' · TO Dobject STORE 0 TO Nvurib STORE 0 TO Zog STORE 1 TO Bail DO WHILE .T. * Program.: Northern (sir.gle). ónt * Date....: 8/ 3/94 * Version..: Fox3ASS+/Mac, revision 1.10 * Notes....: Formát fiié Northern (single, » SCREEN 1 ΤΥΡΕ 0 HSADING ’Screen 1* AT 40,2 SIZE 286,492 PIXELS FONT ’Geneva',12 COLOR 0,0,09 PIXELS 15,31 TO 45,397 STíLE 28447 COLOR 0,0,-1,-25600,-1,-19 PIXELS 89,79 TO 192,422 STYLS 28447 COLOR 0,0,0,-25600,-1,-13 PIXELS 115,98 3AY "Entry #:’ STYLS 65536 FONT ’Geneva’,12 COLOR 0,0,0,-1,-1,-13 PIXELS 115,173 GET Eobject STYLS 0 FONT ’Ger.eva’,12 SIZ3 15,142 COLOR 0,0,0,-1,-1,-13 PIXELS 145,89 5AY "Description" STYLS 65536 FONT "Geneva',12 COLOR 0,0,0,-1,-1,-13 PIXELS 145,173 GET Dobject STYLE 0 FONT ’Geneva',12 SIZ3 15,241 COLOR 0,0,0,-1,-1,-13 PIXELS 35,89 SAY ’Single Northern search screen’ STYLS 65536 FONT ’G«neva’,274 COLOR 0,0,-3 PIXELS 220,162 GET Bail STYLE 65536 FONT ‘Chicago*, 12 PICTOKS ’3*R Cont lnne; Ball out* SIZS3 PIXELS- 175,99 SAY ’Clone STYLS 65536 FONT ’Geneva’;12 COLOR 0,0,0,-1,-1,-19 PIXELS 175,173 GST NUJtb STYLS 0 FONT ’Genev&’,12 SIZE 15,70 COLOR 0,0,0,-1,-1,-19 PIXELS 80,152 SAY ’Enter ar.y ONE of the following:’ STYLE 65536 FONT ’Geneya’,12 COLOR -1,CLEAR STORE '' TO EOBJECT STORE '' TO Dobject STORE 0 TO Nvurib STORE 0 TO Zog STORE 1 TO Bail DO WHILE .T. * Program: Northern (sir.gle). tin * Date ....: 8 / 3/94 * Version:: Fox3ASS + / Mac, revision 1.10 * Notes ....: Form fiié Northern (single, »SCREEN 1 ΤΥΡΕ 0 HSADING 'Screen 1 * AT 40, 2 SIZE 286,492 PIXELS FONT 'Geneva', 12 COLOR 0,09 PIXELS 15,31 TO 45,397 STIL 28447 COLOR 0,0, -1, -25600, -1, -19 PIXELS 89,79 TO 192,422 STYLS 28447 COLOR 0 , 0.0, -25600, -1, -13 PIXELS 115.98 3AY "Entry #: 'STYLS 65536 FONT' Geneva ', 12 COLOR 0.0,0, -1, -1, -13 PIXELS 115,173 GET Eobject STYLS 0 FONT 'Ger.eva', 12 SIZ3 15,142 COLOR 0,0,0, -1, -1, -13 PIXELS 145,89 5AY "Description" STYLS 65536 FONT "Geneva", 12 COLOR 0,0,0, -1, -1, -13 PIXELS 145,173 GET Dobject STYLE 0 FONT 'Geneva', 12 SIZ3 15,241 COLOR 0,0,0, -1, -1, -13 PIXELS 35,89 SAY 'Single Northern search screen' STYLS 65536 FONT 'G «neva», 274 COLOR 0.0, -3 PIXELS 220,162 GET Bail STYLE 65536 FONT' Chicago *, 12 PICTOKS '3 * R Cont; Ball out * SIZS3 PIXELS- 175,99 SAY' Clone STYLS 65536 FONT 'Geneva'; 12 COLOR 0.0,0, -1, -1, -19 PIXELS 175,173 GST NUJtb STYL S 0 FONT 'Genev &', 12 SIZE 15,70 COLOR 0,0,0, -1, -1, -19 PIXELS 80,152 SAY 'Enter ar.y ONE of the following:' STYLE 65536 FONT 'Geneya', 12 COLOR -1

V « EOF: Northern (single,. fintV «EOF: Northern (single, fint

READ I? Baíl»2READ I? Baila »2

CLEAR screen 1 offCLEAR screen 1 off

R3TORNR3TORN

ENDIF USE ’StrartGuy:FoxSASS+/Mac:Fox files:Lookup.dbf’ENDIF USE 'StrartGuy: FoxSASS + / Mac: Fox files: Lookup.dbf'

SET TALK'CN IF Eobjecto' ' STORE UPPER(Eobject, to EobjectSET TALK'CN IF Eobjecto '' STORE UPPER (Eobject, to Eobject

SET SAFETY OFF SORT CN Entry TO ’Lookup entry.dbf·SET SAFETY OFF SORT CN Entry TO ”Lookup entry.dbf ·

SET SAFETY ON USE ’Lookup entry.dbf’ LCCATE FÓR Look-EobjectSET SAFETY ON USE 'Lookup entry.dbf' LCCATE FORWARD Look-Eobject

IF .NOT.FCUNDOIF .NOT.FCUNDO

CLEARCLEAR

LOOPLOOP

ENDIFENDIF

ERCWSE STORE Entry TO SearehyalERCWSE STORE Entry TO Searehyal

CLCSS DATASASES ERAS2 ’Lookup-entry.dbf’CLCSS DATASASES ERAS2 “Lookup-entry.dbf”

ENDIF IF Dobj ecto' 1ENDIF IF Drop ecto '1

SET EXACT OFFSET EXACT OFF

SET SAFETY CFF SORT ON descriptor TO ’Lookup descriptor. dbf’ SET SAFETY On USE ’Lookup descriptor .dbf· LOCATE FÓR UPFER(TR1M(descriptor)) =Ü??SR(TRIM( Dobject))SET SAFETY CFF SORT ON descriptor TO 'Lookup descriptor. dbf 'SET SAFETY ON USE' Lookup descriptor .dbf · LOCATE FORUM UPFER (TR1M (descriptor)) = Ü ?? SR (TRIM (Dobject))

IF .NOT.FCUNDOIF .NOT.FCUNDO

CLEAR - 102 -CLEAR - 102 -

LCQSLCQS

ENDIFENDIF

BROWSB STORE Er.try TO SearchvalBROWSB STORE Er.try TO Searchval

CLOSE DATABASES ERASE "Lookcp descriptor.dbf·CLOSE DATABASES ERASE "Lookcp descriptor.dbf ·

SET EXACT CNSET EXACT CN

ENDIFENDIF

I? itafeoO USE ·Επ«.ΐΧ0υγ:?οχΒΑΕΞ+/Μ3θ:?οχ fíles:cloneg.dbf GO NcmbI? itafeoO USE · Επ «.ΐΧ0υγ:? οχΒΑΕΞ + / Μ3θ:? οχ phils: cloneg.dbf GO Ncmb

BROWSB STORE Entry TO SearchvalBROWSB STORE Entry TO Searchval

ENDIFENDIF

CLEAR ? 'Northern aralyaia fcr éntry ' ?? Searchval o ? 'Enter Y co proceed' watt το o:<CLEAR? 'Northern aralyaia fcr egyry' ?? Searchval o? 'Enter Y co proceed' watt το o: <

CLEAR IP UPP2R(0K)o'Y· acreen 1 offCLEAR IP UPP2R (0K) o'Y · acreen 1 off

RETURN ENDIF * * CCMPRESSION SUBRŰUTINB FÓR Library, dbf ? 'Ccuspreasing the Librariea fiié now,..'RETURN ENDIF * * CCMPRESSION SUBRYPER LIBRARY Library, dbf? 'Ccuspreasing the Librariea fiié now, ..'

USE ‘SrartGuy:?cx3ASE+/Maci?cx files:librarias.dbfSET SAFETY OFF SORT ON library TO ‘Corpreaaed libraries.dbf· * FÓR entered>0USE ‘SrartGuy:? Cx3ASE + / Maci? Cx files: librarias.dbfSET SAFETY OFF SORT ON library TO‘ Corpreaaed libraries.dbf · * FORUM entered> 0

SET SAFSTY ON USE "Compresaed libraries .dbf· D3LETE POR er.tered-0SET SAFSTY ON USE "Compresaed libraries .dbf · D3LETE POR er.tered-0

PACX COUNT TO TŰT· MARXI « 1 SW2»0PACX COUNT TO KNOW · MARXI «1 SW2» 0

DO WHILE SW2sO ROLLIP MARKI >« TÓTPACX SW2»1DO WHILE SW2sO ROLLIP MARKI> «TÓTPACX SW2» 1

LOOPLOOP

ENDIFENDIF

GO MARKIGO MARKI

STORE library TO TESTASTORE library TO TESTA

SKtPSKtP

STORE Library TO TESTBSTORE Library TO TESTB

I? TESTA s TESTBI? TEST TESTB

DELETEDELETE

ENDIF MARXI » MARX1+1ENDIF MARXI »MARX1 + 1

LOOPLOOP

ENDDO ROLL * Northern analyaieENDDO ROLL * Northern analyaie

CLEAR ? 'Doing the northem now... 'CLEAR? 'Doing the northem now ...'

SET TALK CNSET TALK CN

ÜSS ’SsiartGuy:Fax3ASE*/Mac:Fox íiles :clor.ea .dbf *SET SAFETY OFF COPY TO 'Hits.dbf FÓR entry»searchvalSSS "SsiartGuy: Fax3ASE * / Mac: Fox styles: clor.ea .dbf * SET SAFETY OFF COPY TO 'Hits.dbf FOOT entry» search

SET SAFETY ON - 103 -SET SAFETY ON - 103

CLOSE DATABASES SELECT 1 USB ‘Ccnpressed libraries.dbf* STCRE KSCCOUOTO TO Eatriea SELECT 2 USB *Hit«.dbf"CLOSE DATABASES SELECT 1 USB 'Ccnpressed libraries.dbf * STCRE KSCCOuoto TO Eatriea SELECT 2 USB * Hit «.dbf»

Markai EO WHILE .T. SELECT 1 IF MarJofiatriesBrand EO WHILE .T. SELECT 1 IF MarJofiatries

EXITEXIT

ENDLFENDLF

C-O MARK STORS library TO Jigger SELECT 2 COUNT TO Zog FÓR library® Jigger SELECT 1 R5PLACS hita with ZogC-O MARK STORS library TO Jigger SELECT 2 COUNT TO TOOLS library® Jigger SELECT 1 R5PLACS slow with Zog

MarkaMark+1MarkaMark + 1

LOOPLOOP

ENDDO SELECT 1 3RCWSE FIELDS LIBRARY, LISNAME,ENTERED,HITS AT 0,0ENDDO SELECT 1 3RCWSE FIELDS LIBRARY, LISNAME, ENTERED, HITS AT 0.0

CL2AR ? ‘filter Y to priat:'CL2AR? 'Filter Y to priat:'

WATT TO PRINSET IF U?7SR(PRBíSET)«'7'WATT TO PRINSET IF U? 7SR «'7'

SET PRINT CNSET PRINT CN

CLEAR EJECT· SCREEN 1 ΤΥΡΕ 0 HEAOTNG 'Sered 1' AT 40,2 SIZE 285,492 PIXELS FONT 'Geceva',14 COLOR 0,0,0? 'DATABASE ENTRI2S MATCHING ENTRY ’ ?? SearchvalCLEAR EJECT · SCREEN 1 ΤΥΡΕ 0 QUALITY 'Sered 1' AT 40,2 SIZE 285,492 PIXELS FONT 'Geceva', 14 COLOR 0,0,0? 'DATABASE ENTRI2S MATCHING ENTRY' ?? Search

? DATEO 7 SCREEN 1 ΤΥΡΕ 0 KEADING 'Sered 1' AT 40,2 SIZE 236,492 PIXELS FONT 'Geneva',7 COLOR 0,0,0,LIST OFF FIELDS library, libnarce,entered,hiti SELECT 2 LIST OFF FIELDS NUMBER,LIBRARY,D,S,F,Z,R,fi?TRY,DESCRIPTOR,R?START,START.RFENDSET TALX OFFSET FRINT OFFQCI7? DATEO 7 SCREEN 1 ΤΥΡΕ 0 KEADING 'Sered 1' AT 40,2 SIZE 236,492 PIXELS FONT 'Geneva', 7 COLOR 0,0,0, LIST OFF FIELDS library, libnarce, entered, hit SELECT 2 LIST OFF FIELDS NUMBER, LIBRARY, D, S, F, Z, R, FI, TRY, DESCRIPTOR, R? START, START.RFENDSET TALX OFFSET FRINT OFFQCI7

CLOSE DATABASESCLOSE DATABASES

SET TALX OFFSET TALX OFF

CLEAR DO ‘Test priat,prg*CLEAR DO 'Test priat, prg *

RETORN - 104 - 6. táblázat library ΑΟΞΝΙΝ0Ο1 AŰRENOR01 ADR=NOT01 AML3NOT01 6MARNOT01 SWARNOTC8 CARONOT01 CHAONOT01 CORNNOTD1 FIERAQT01 FI0RAGTC2 F1BRANT01 FI3SNGT01RETORN - 104 - Table 6 library ΑΟΞΝΙΝ0Ο1 STEERING01 ADR = NOT01 AML3NOT01 6MARNOT01 SWARNOTC8 CARONOT01 CHAONOT01 CORNNOTD1 FIERAQT01 FI0RAGTC2 F1BRANT01 FI3SNGT01

FtSnNQTOFtSnNQTO

FISRNOTOI F.aRNcrraa HWC1NOT01 HUVELPBŰ1 HUVENO0O1 HUVEST3ŰÍ HYFONC801 KIDNNOT01 UVRNOT01 LUNGNOT01 MUSCNOT01 OVIONO0O1FISRNOTOI F.aRNcrraa HWC1NOT01 ENVIRONMENTAL HUVENO0O1 SURFACE WINDOW HYFONC801 KIDNNOT01 UVRNOT01 LUNGNOT01 MUSCNOT01 OVIONO0O1

PAMCNOTOIPAMCNOTOI

PmjNORO, pitunotoiPmjNORO, for a long time

PIACNOSOI SJNTNOT02 SPLNFET01 SPLNNOTO2MARKET SJNTNOT02 SPLNFET01 SPLNNOTO2

STCMNOTOI SYNORABO1 T3LYNOTD1STCMNOTOI SYNORABO1 T3LYNOTD1

TESTNOTOI THP1NO0O1 THP1PEBŰ1 THP1PLBO1 U937NOT01 libnameInftamed adenoidAdrenal gland (r)Adrenal gland (T) AML blast eaUs (T)Eone mafnj**TESTNOTO THP1NO0O1 THP1PEBO1 THP1PLBO1 U937NOT01 libnameInftamed adenoidAdrenal gland (r) Adrenal gland (T) AML blast eaUs (T) Eone mafnj **

Sone míww (T)Cardlac musele (T)CWn. hamster ovaryComeal stromaFibroblaat, AT 5Fibroblast, AT 30Fibroblast. ATFibroblast, uv 5FlbfOblast. uv 30FibroblastFibroblast. normálMást eell llne HMC-1HUVEC IFN.TNF.LPSHUVEC eontrolHUVEC síiear streasHypolhalamuaKIdnay (T)Sone míww (T) Cardlac musele (T) CWn. hamster ovaryComeal stromaFibroblaat, AT 5Fibroblast, AT 30Fibroblast. ATFibroblast, uv 5FlbfOblast. uv 30FibroblastFibroblast. NormalOther Prefix HMC-1HUVEC IFN.TNF.LPSHUVEC eontrolHUVEC ski stearHypolhalamuaKIdnay (T)

Liver (T)Liver (T)

Lung (T)Lung (T)

Skaletal mutde (T)OMductSkaletal mutde (T) OMduct

Psncreaj, normálPliuilary (r)Psncreaj, NormalPliuilary (r)

Pllullary (T)Pllullary (T)

Placenta fimall inteatine (T)Spleenrliver, latoiSpleen (T)Placenta fimall inteatine (T) Spleenrliver, latoiSpleen (T)

SlomachRheum. synovtumT + B lympfioblastTest»» (T) THP-1 eontrolTHP phorbotTHP-1 phorbot LPSU937, monocytlc leuk number library d I 1 z r e n 11 y detorlptor rfatarieta rt flarid 3304 U937NOT01 E H C c T HUMEF1B Elongatlon lador 1-beta 0· 0 773 3240 HMC1NOT01 E H C c T HUMEFtB Elongation (actor 1-beta 0 370 773 3359 HMC1NOT01 E H C c T HUMEFlB Elongatlon lactor 1-beta 0 371 773 •U93 HMC1NOT01 E H C C T HUMEFlB Elongation lactor 1-beta 0 470 773 3359 HMC1NOT01 E H C c T HUMEFlB Elongatíon lactor 1-beta 0 327 773 9139 HMC1NOT01 E H C c T HUMEF1B Elongauon (actor i-bata 0 375 773SlomachRheum. synovtumT + B lympfioblastTest »» (T) THP-1 eontrolTHP phorbotTHP-1 phorbot LPSU937, monocytlc leuk number library d I 1 zren 11 y detorlptor rfatea rt flarid 3304 U937NOT01 EHC c T HUMEF1B Elongatlon lador 1-beta 0 · 0 773 3240 EHC c T HUMEFtB Elongation (actor 1-beta 0 370 773 3359 HMC1NOT01 EHC c T HUMEF1B Elongatone lactor 1-beta 0 371 773 • U93 HMC1NOT01 EHCCT HUMEF1B Elongation lactor 1-beta 0 470 773 3359 HMC1NOT01 EHC c T beta 0 327 773 9139 HMC1NOT01 EHC c T HUMEF1B Elongau (actor i-bata 0 375 773

Claims

PATIENT INDIVIDUAL POINTS

Figure 1

P96 02047

DISCLOSURE

COPIES

A method for testing a sample of gene transcripts comprising (i) preparing a first mRNA mixture;

(ii) producing cDNA copies of the mRNA;

(iii) isolating a representative population of clones transfected with cDNA to produce a first library of biological sequences;

(iv) generating a first set of gene transcripts which, in a first set, each of the first gene transcripts characterizes another biological sequence of the first library;

(v) processing the first gene transcripts with a programmed computer (in which a database of reference transcript sequences referring to reference biological sequences is stored) to generate a first identified sequence value for each first gene transcript, wherein each identified sequence value is characteristic of sequence annotation and the first gene transcripts; the degree of fit between at least one of the reference transcript sequences; and (vi) processing all identified sequence values to generate first final data values indicating the number of times each first identified sequence value is present in the first library of biological sequences.

2. The method of claim 1, wherein the first library of biological sequences is a library comprising at least 5000 sequences derived from human cell lines.

Figure 2

Ρ96 02047

DISCLOSURE

COPIES

2 /

Figure 3

DISCLOSURE

COPIES

P96 02047 4/4

Sequence evaluation and database annotation

3/4

Sequence Library

Identified sequences

3. The method of claim 1, further comprising (vii) preparing a second mixture of mRNAs from a second human cell line;

(viii) producing cDNA copies of the mRNA;

(ix) isolating a representative population of clones transfected with cDNA and producing a second library of biological sequences;

(x) generating a second set of gene transcripts, the second set of each of the second gene transcripts characterizing another biological sequence of the second library;

(xi) processing the first gene transcripts with a programmed computer (in which a database of reference transcript sequences referring to reference biological sequences is stored) to generate a second identified sequence value for each second gene transcript, wherein each second identified sequence value is characterized by sequence annotation; the degree of fit between one of the gene transcripts and at least one of the reference transcript sequences; and (xii) processing all identified sequence values so that the second final data values are ge • ··· ·· · «·« · · · · · ···· ·· «« · ·

107 indicate the number of times each second identified sequence value is present in the second library of biological sequences.

4. The method of claim 3, further comprising (xiii) processing the first final data values of step (vi) and the second final data values of step (xii) to obtain ratios of gene transcripts, each of which is the differences in the number of gene transcripts present in the first mRNA mixture and the second mRNA mixture.

5. The method of claim 3, further comprising: (xiv) extracting the first final data values of step (vi) from the second final data values of step (xii) so as to obtain a series of differences;

and the first mRNA mixture is obtained from a healthy human and the second mRNA mixture from a sick person.

6. The method of claim 1, wherein the cDNA copies are prepared using random primers.

A method for determining the relative frequency of mRNA in a biological sample, comprising (i) isolating a population of mRNA transcripts from the biological sample;

(ii) identifying, by a sequence-specific method, the genes that have been transcribed by mRNA transcription;

· · · · · · · · · · · · · · ·

(Iii) determine the number of mRNA transcripts corresponding to each gene, and (iv) the number of mRNA transcripts used to determine the relative frequency of mRNA transcripts within the mRNA transcript population.

8. The method of claim 7, further comprising (v) generating a gene transcript image based on the relative frequency data of the mRNAs within the mRNA transcript population; and (vi) comparing the transcript of step (v) with a biological sample from a biological patient and / or a gene transcript from a normal biological sample.

9. A method for producing a gene transcript image comprising: (i) preparing a mRNA mixture from a biological sample;

(ii) producing cDNA copies of the mRNA;

(iii) inserting the cDNA into a suitable vector, transfecting the cells of the appropriate host strain with the vector, and growing clones, each clone representing a unique mRNA;

(iv) isolating a representative population of at least 5000 recombinant clones;

(v) identifying cDNAs amplified from each clone in the population for which sequence specific · · ····

Method 109 is used to identify the gene from which the individual mRNA has been transcribed;

(vi) determining the number of times each gene is represented in the clone population (which refers to the relative frequency); and (vii) listing the genes with their relative frequency in order of frequency, to obtain a gene transcript image.

The method of claim 9, further comprising (viii) comparing the gene transcript images of step (v) with a sample of a gene derived from a patient and / or a normal biological sample.

Agent:

DANUBIA

Ρ96 02047

DISCLOSURE

COPIES

collaborator cDNA szoloáltató Number Number Name Name Title Title Phone Phone Fax E-mail i project I Seit-szolqáltató cDNA construct Number Number Name r λ Prep # # Title Treatment relationship Könyvtárkód Phone Management name provider Fax T-Identification Type -1- v-p: j Used mRNA l l Γ Vector I Primer directions Biological source Culture mRNA Preparation View Tum Delivery date Number Number Number Catalog Number # Fabric Source Culture Price Organ Sample Number Sample Number Date of arrival gender PO Date cloning Disease * - Date * Expiration - Primary size Species Cell Density Quantity Background Species Quantity Weight Un amplified titer Pathology Minutes Minutes Amplified titer Disease condition Treatment RNA Extraction host Strain Source Notes mRNA extraction genotypes Sample number -% extraction actin PO amendments Amplified titer Notes the gel Notes Notes

Figure 4