CZ218996A3 - Comparison analysis of gene transcriptors - Google Patents

Comparison analysis of gene transcriptors Download PDF

Info

Publication number
CZ218996A3
CZ218996A3 CZ962189A CZ218996A CZ218996A3 CZ 218996 A3 CZ218996 A3 CZ 218996A3 CZ 962189 A CZ962189 A CZ 962189A CZ 218996 A CZ218996 A CZ 218996A CZ 218996 A3 CZ218996 A3 CZ 218996A3
Authority
CZ
Czechia
Prior art keywords
gene
mrna
sequences
transcripts
sequence
Prior art date
Application number
CZ962189A
Other languages
English (en)
Inventor
Jeffrey J Seilhamer
Randal W Scott
Original Assignee
Incyte Pharmaceuticals
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US08/187,530 external-priority patent/US5840484A/en
Application filed by Incyte Pharmaceuticals filed Critical Incyte Pharmaceuticals
Publication of CZ218996A3 publication Critical patent/CZ218996A3/cs

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/20Sequence assembly
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • G16B35/10Design of libraries
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • G16B35/20Screening of libraries
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/60In silico combinatorial chemistry

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Organic Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Molecular Biology (AREA)
  • Library & Information Science (AREA)
  • Biochemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Description

Porovnávací analýza genových transkriptů (57) Anotace:
Vynález poskytuje způsob kvantifikace relativní hojnosti genových transkriptů v biologicky vzorcích. Jedno výhodné provedení vynálezu generuje výkonou, sekvenčně specifickou analýzu mnohých mRNA biologického vzorku (např. krve, slin ap.) nebo jejich odpovídajících cDNA, a poskytuje takto zobrazovací analýzu genových produktů. Jiné provedení poskytuje způsob porovnání profilů hojnosti genových transkriptů ve dvou nebo více biologických vzorcích (např. tak, že se určuje poměr zastoupení mnohých jednotlivých genových transkriptů v různých biologických vzorcích, spojených např. s aktivací buněk imunitního systému, s chorobou, stárnutím ap.). Systémem pro provádění porovnávacích analýz je počítač programovaný software, schopným identifikace nové sekvence transkriptů se sekvencemi uloženými v databázích a dalších operací přii porovnání hojností transkriptů v knihovnách biologických sekvencí. Vynález je užitečný v diagnostice, výběru zvířecích modelů, farmakologii, toxikologii, ap., v těchto oborech předčí dosavadní způsoby, poskytuje nové přístupy a ι
Porovnávací analýza genových transkript
Oblast techniky
C X »— 7Ό Tří w 2 o o = O —i <
< ~ «5 σ>
o
C3 'O« cx
Tento vynález je z oblasti molekulární biologie a počítačové vědy; konkrétněji tento vynález popisuje metody analýzy genových transkiptů a diagnóz genové exprese buněk a tkání.
Dosavadní stav techniky
Do zcela nedávného času se historie molekulární biologie psala gen po genu. Vědci pozorovali fyzikální změny buňky, izolované směsi buněk nebo jejich prostředí, čištěné bílkoviny, sekvenované bílkoviny a podle tohoto konstruovali sondy ke zkoumání příslušných genů.
Nedávno byly založeny různé velké národní projekty k sekvenování miliard baží v lidském genomu. Tyto projekty typicky začínají rozdělením genomu na velké úseku chromosomů a následně se stanovují sekvence v těchto částech, které se pak analyzují na identitu se známými bílkovinami nebo jejich částmi, známými jako motivy. Většina genomické DNA ale bohužel nekóduje bílkoviny a i když je postulováno, že má určitý vliv na schopnost buňky vytvářet bílkoviny, její relevance pro lékařské aplikace není dosud poznána.
Třetí metodologie zahrnuje sekvenování pouze transkriptů aktivně zapojených do buněčné mašinérie, která vytváří bílkoviny, jmenovitě mRNA. Výhodné je, že buňka si zrediguje všechny nekódující DNA a že je relativně snadné identifikovat úseky mRNA, kódující bílkovinu. Význam tohoto přístupu nebyl výzkumníkům genomu okamžitě zřejmý. Ve skutečnosti, když se původně sekvenování cDNA navrhovalo, tato metoda byla sumárně odsuzována těmi, kdo se věnovali sekvenaci genomu. Například: Vedoucí amerického projektu lidského genomu znevážil sekvenování cDNA jako bezcenné a odmítl schválení podpory takovýchto projektů.
Zde zveřejňujeme metody analýzy DNA, včetně knihoven cDNA. Na základě našich analýz a výzkumů nahlížíme na každý jednotlivý genový produkt jako na pixel informace, jenž se týká exprese onoho, a jen onoho, genu. Uvádíme zde metody, jimiž se dají jednotlivé pixely informace o genové expresi spojit do obrazu transkripce jediného genu, přičemž se všechny jednotlivé geny dají vizualizovat současně a vztahy mezi těmito genovými pixely se snadno vizualizují a chápou.
Dále uvádíme novou metodu, kterou nazýváme elektronické odčítání. Elektronické odčítání umožní genovému badateli převést jednotlivé obrazy do pohyblivého sledu, který popíše časový průběh a dynamiku genové exprese na úrovni buňky nebo celé tkáně. Je to smysl pro pohyb buněčné mašinérie v měřítku buňky nebo orgánu, jenž je základem tohoto nového vynálezu. Tím je založén nový pohled na pochody fyziologie živé buňky, jenž skýtá vell<é naděje na odhalení a odkrytí nových terapeutických a diagnostických přístupů v medicíně.
Uvádíme další metodu, kterou nazýváme elektronický northern, jež sleduje expresi jediného genu v mnohých typech buněk a tkání.
Nukleové kyseliny (DNA a RNA) nesou ve svých sekvencích dědičnou informaci a jsou proto prvotními molekulami života. Nukleové kyseliny se nacházejí ve všech živých organismech, včetně bakterií, plísní, virů, rostlin a zvířat. Předmětem zájmu je stanovit relativní zastoupení různých konkrétních nukleovýčh kyselin v různých buňkách, tkáních a organismech v průběhu času za různých podmínek, při různých působeních a režimech.
Všechny dělicí se buňky v lidském těle obsahují stejný soubor 23 párů chromosomů. Odhaduje se, že tyto autosomní a pohlavní chromosomy kódují přibližně 100 000 genů. Má se za to, že rozdíly mezi různými typy buněk odrážejí rozdílnou expresi těchto 100 000 genů (nebo podobného počtu). Fundamentální otázky biologie by mohly být zodpovězeny tím, že by se porozumělo tomu, které geny jsou transkribovány v různých buňkách a jaké je u nich relativní zastoupení transkriptů.
Dříve tento obor zajišťoval pouze analýzy několika málo známých genů najednou, a to standardními technikami molekulární biologie jako jsou řetězová polymerizační reakce (PCR), analýža northern přenosem, nebo jiné typy analýz s DNA sondami, jako je hybridizace in šitu. Každá z těchto metod dovoluje jen analýzu transkripce známých genů nebo jenom malého počtu genů najednoú. Nucl. Acids Res. 19, 7097-7104, (1991); Nucl. Acids Res. 18. 4833-42, (1990); Nucl. Acids Res. 18, 2789-92, (1990); EUropean
J. Neuroscience 2, 1063-1073 (1990); Analytical Biochem. 187, 364-73 (1990); Genet Annals Techn. Appl. 7, 64-70 (1990); GATA 8 (4), 129-33; Proč. Nati. Acad. Sci. USA 85, 1696-1700 (1988); Nucl. Acids Res. 19./ 1954, (1991); Proč. Nati. Acad. Sci. USA 88, 1943-1947 (1991); Nucl. Acids Res. 19, 6123-6127, (1991); Proč. Nati. Acad. Sci. USA 85, 5738-42 (1988); Nucl. Acids Res. 16, 10937, (1988).
metod. Jednou jejich hladin
Studie počtů a typů genů, jejichž transkripce je indukována nebo jinak regulována během buněčných procesů, jako jsou aktivace, diferenciace, stárnutí, virová transformace, morfogenese a mitóza, probíhají již mnoho let a používají řadu z nejstarších metod je izolace bílkovin a analýza v buňce, tkáni, orgánu nebo dokonce organismu jak před, tak po pochodu, o nějž je zájem. Jednou z metod analýzy mnohých bílkovin v jednom vzorku je použití dvojrozměrné gelové elektroforézy, kde bílkoviny mohou být, v principu, identifikovány a kvantifikovány jako jednotlivé pruhy, a nakonec redukovány na oddělený signál. V současnosti rozlišuje dvojrozměrná analýza jen asi 15 % bílkovin. Aby byly pozitivně analyzovány pruhy, jež jsou rozděleny, každý pruh musí být vyříznut z membrány a podroben analýze bílkovinné sekvence s použitím Edmanovy degradace. Bohužel je většina pruhů přítomná v množstvích příliš malých pro získání spolehlivé sekvence a mnohé tyto pruhy obsahují více než jednu bílkovinu. Další potíž je v tom, že mnohé z bílkovin jsou blokované na N-konci, což dále komplikuje sekvenační postup.
Analýzy diferenciace na úrovni transkripce genů překonaly mnohé z těchto nevýhod a potíží, protože síla technologie rekombinantní DNA dovoluje amplifikaci signálů obsahujících velmi malá množství materiálu. V nejběžnější metodě, zvané hybridizačni odčítání je zahrnuta izolace mRNA z biologického vzorku před (B) a po (A) vývojovém ději, o nějž je zájem, transkripci jedné sady mRNA na cDNA, odečtení vzorku B od vzorku A (mRNA od cDNA) hybridižací a konstrukci knihovny cDNA z nehybridizující frakce mRNA. Tuto strategii použily úspěšně mnohé skupiny a řada postupů byla publikována a vylepšena na základě téhož základního schématu. Nucl. Acids Res. 19, 7097-7104, (1991); Nucl. Acids Res. 18, 4833-42, (1990); Nucl.
Acids Res. 18, 2789-92, (1990); European J. Neuroscience 2,
1063-1073 (1990); Analytical Biochem. 187, 364-73 (1990); Genet Annals Techn. Appl. 7, 64-70 (1990); GATA 8 (4), 129-33; Proč. Nati. Acad. Sci. USA 85, 1696-1700 (1988); Nucl. Acids Res. 19^, 1954, (1991); Proč. Nati. Acad. Sci. USA 88, 1943-1947 (1991); Nucl. Acids Res. 19, 6123-6127, (1991); Proč. Nati. Acad. Sci. USA 85, 5738-42 (1988); Nucl. Acids Res. 16, 10937, (1988).
I když každá z těchto technik má svou zvláštní sílu i slabší stránky, pořád existují určitá omezení a nežádoucí aspekty těchto metod: Za prvé, čas a úsilí potřebné ke konstrukci takovýchto knihoven jsou dosti značné. Typicky může cvičený molekulární biolog očekávat, že si konstrukce a charakterizace takovéto knihovny vyžádá 3 až 6 měsíců, v závislosti na úrovni schopností, zkušenosti a štěstí. Z druhé, výsledné odečtené knihovny jsou typicky horší než knihovny konstruované standardní metodologií. Typická konvenční cDNA knihovna má klonovací komplexitu přinejmenším 106 klonů, a průměrnou velikost insertu 1 - 3 kB. Naproti tomu odečtené knihovny mohou mít komplexity 102 nebo IQ3 a průměrnou velikost insertu 0,2 kB. Takovéto knihovny proto může doprovázet významná ztráta klonovacích a sekvenčních informací. Za třetí, tento přístup umožňuje badateli zachytit pouze geijy indukované ve vzorku A vzhledem k vzorku B, ale ne naopak, a také neumožňuje jednoduché srovnání s třetím vzorkem, jenž je předmětem zájmu (C). Za čtvrté, tento přístup vyžaduje velmi velká množství (stovky mikrogramů) hnací mRNA (vzorek B), což významně omezuje možné počty a typy odčítání, protože mnohé tkáně a buňky se získávají ve velkých množstvích velice obtížně.
Za páté: Rozlišení odčítání je závislé na vlastnostech hybridizací DNA:DNA a RNA:DNA. Schopnost dané sekvence nalézt hybridizační protějšek závisí na unikátní hodnotě CoT. Hodnota CoT je funkcí počtu kopií (koncentrace) konkrétní sekvence, násobené dobou hybridizace. Z toho vyplývá, že pro sekvence, které se vyskytují bohatě, proběhnou hybridizační události velmi rychle (nízká hodnota CoT), zatím co vzácné sekvence budou dvořit duplexy s velmi vysokými hodnotami CoT. Hodnoty CoT, jež by umožnily takovýmto vzácným sekvencím tvořit duplexy a tedy být účinně selektovány, je těžké dosáhnout v konvenčním časovém rozsahu, Hybridizační odčítání tedy jednoduše není užitečnou technikou, s níž by se měly studovat relativní hladiny vzácných druhů mRNA. Za šesté: Tento problém se dále komplikuje skutečností, že tvorba duplexů je závislá také na složení nukleotidových baží v dané sekvenci. Sekvence bohaté na G + C tvoří pevnější duplexy než sekvence s vysokým obsahem A + T. Prvně jmenované sekvence budou tedy mít tendenci k selektivnímu odstranění hybridizačním odčítáním. Za sedmé: Je možné, že nastane hybridizace mezi nepřesnými protějšky. Když k tomu dojde, exprese homologního genu může maskovat expresi genu, o nějž je zájem, a uměle deformovat výsledky pro tento konkrétní gen.
Matsubara a Okubo navrhli použití částečných cDNA sekvencí ke stanovení profilů exprese genů, jež mohou být použity ve funkčních analýzách lidského genomu. Matsubara a Okubo varují před používáním náhodného startování, protože vytváří více unikátních fragmentů z jednotlivých rnRNA a může tedy deformovat analýzu řady konkrétních genů knihovny. Matsubara a Okubo sekvenovali náhodně vybrané členy z 3'-směrované cDNA knihovny a stanovili četnost, s níž se objevují různé EST. Pro klasifikaci genů navrhli srovnávací seznam EST z řady buněčných typů. Geny exprimované v mnohých různých buňkách byly označeny jako udržovací [housekeepers] a geny exprimované selektivně v určitých buňkách byly označeny jako buněčně specifické geny, dokonce i při chybějící úplné sekvenci nebo při neznámé biologické aktivitě genového produktu.
Předkládaný vynález se odstraňuje nedostatky předchozích způsobů tím, že poskytuje způsob kvantifikace relativního výskytu mnohých genových transkriptů v daném biologickém vzorku za použití vysoce výkonné, sekvenčně specifické analýzy jednotlivých RNA nebo odpovídajících cDNA.
Tento vynález poskytuje několik výhod vzhledem k současným způsobům určování bílkovin, při nichž je snahou izolovat jednotlivé bílkoviny na základě jejich
Způsob podle vynálezu poskytuje podrobné buněčných profilů a odhaluje mnohé změny transkriptů.
Tento vynález poskytuje několik výhod vzhledem k současným odčítacím metodám, včetně analýzy komplexnějších knihoven (10 až 107 klonů v porovnání s 103 klonů), což dovoluje identifikaci genetických zpráv, jejichž zastoupení roste nebo klesá. Tyto velké knihovny jsou zcela rutinní co do přípravy, na rozdíl od biologických účinků, diagnostické srovnání v expresi jednotlivých knihoven podle předchozích metod. Navíc: Homology lze způsobem podle vynálezu snadno rozeznat.
Tento způsob je velice příjemný, protože organizuje velké množství dat do stručného a záživného formátu. Nejvýznamnější rozdíly jsou zvýrazňovány elektronickým odčítáním. Hloubkové analýzy se stávají příjemnějšími.
Tento vynález poskytuje několik výhod vzhledem k dřívějším způsobům elektronické analýzy cDNA. Tento způsob má obzvláštní sílu při analýzách více než 100, a s výhodou více než 1 000, genových transkriptů. V tomto případě jsou objevovány nové transkripty o nízké četnosti a vytypovávány tkáně.
Analýzu genové exprese o vysokém rozlišní lze použít bučí přímo jako diagnostický profil, nebo k určení genů specifických pro danou chorobu za účelem vývoje klasičtějších diagnostických přístupů.
Tento postup je definován jako frekvenční analýza genových transkriptů. Výsledná kvantitativní analýza genových transkriptů je definována jako srovnávací analýza transkriptů.
Podstata vynálezu
Tento vynález představuje způsob analýzy vzorku obsahujícího genové transkripty, jenž zahrnuje kroky a) vytvoření knihovny biologických sekvencí, b) transkriptů, kde každá sekvence indikativní pro jednu různou generování souboru sekvencí transkriptů v řečeném souboru je biologickou sekvenci knihovny,
c) zpracování sekvencí transkriptů v programovaném počítači referenčních sekvencí transkriptů sekvence) ke generování hodnoty každou ze sekvencí transkriptů, sekvence j e [match] me?i (v němž je uložena databáze indikativní pro referenční identifikované sekvence pro přičemž každá řečená hodnota identifikované indikativní pro anotaci sekvence a stupeň shody jednou z biologických sekvencí knihovny a přinejmenším jednbu z referenčních sekvencí a d) zpracování každé řečené hodnoty identifikované sekvence za generování konečných hodnot dat indikativních pro počet, v kterém je každá hodnota identifikované sekvence přítomná v knihovně.
Vynález zahrnuje také způsob srovnání dvou biologických vzorků obsahujících genové transkripty. První vzorek je zpracován jak je popsáno shora. Druhý vzorek je použit k vytvoření druhé knihovny biologických sekvencí, která je použita ke generování druhého souboru sekvencí transkriptů, kde každá ze sekvencí transkriptů v druhém souboru je indikativní pro jednu druhé knihovny. Pak je druhý soubor zpracován sekvencí transkriptů ke generování druhého souboru z biologických sekvencí sekvencí transkriptů v programovaném počítači hodnot identifikovaných sekvencí, jmenovitě dalších hodnot identifikovaných sekvencí, z nichž každá je indikativní pro anotaci sekvence a zahrnuje stupeň shody mezi jednou z biologických sekvencí druhé knihovny a přinejmenším jednou z referenčních sekvencí. Další identifikované hodnoty sekvencí jsou zpracovány za generování dalších konečných hodnot dat indikativních pro počet, v kterém je každá další hodnota identifikované sekvence přítomná v druhé knihovně. Konečné hodnoty dat z prvního vzorku a další hodnoty identifikovaných sekvencí z druhého vzorku jsou zpracovány ke generování podílů pro sekvence transkriptů, které ukáží rozdíly v počtu genových transkriptů mezi dvěma vzorky.
V dalším provedení způsob zahrnuje kvantifikaci relativního výskytu mRNA v biologickém vzorku pomocí a) izolace populace mRNA transkriptů z biologického vzorku, b) identifikace genů, z nichž byla mRNA transkribována pomocí sekvenčně specifické metody,
c) stanovení počtů mRNA transkriptů, odpovídajících každému genu a d) použití počtů mRNA transkriptů ke stanovení relativního výskytu mRNA transkriptů v populaci mRNA transkriptů.
Zveřejňován je rovněž způsob vytvoření obrazové analýzy genového transkriptů tím, že se předně získá směs mRNA, ze které se udělají cDNA kopie. cDNA je vložena do vhodného vektoru, jenž se použije k transfekci vhodného hostitelského kmene, který se nanese na plotny a umožní růst do klonů, z nichž každý reprezentuje jedinečnou mRNA. Izoluje se reprezentativní populace klonů transfekováných cDNA. Každý klon v populaci se identifikuje pomocí sekvenčně specifické metody, která identifikuje gen, z něhož byla jedinečná mRNA transkribována. Ke zhodnocení výskytu genového transkriptů se určí počet, kolik krát je každý gen identifikován s klonem. Geny a jejich zastoupení jsou dány do seznamu v pořadí výskytu za vytvoření obrazu genovýčh transkriptů.
V dalším provedení se porovnává relativní výskyt genových transkriptů v jednom typu buněk nebo tkání s výskytem relativního počtu genových transkriptů v druhém typu buněk nebo tkání, k identifikaci rozdílů a podobností.
V dalším provedení způsob zahrnuje systém pro analýzu knihovny biologických sekvencí, v němž jsou zahrnuty prostředky k získání souboru sekvencí transkriptů, kde každá sekvence transkriptů je indikativní pro jednu různou biologickou sekvenci knihovny, a prostředky ke zpracování sekvencí transkriptů v počítačovém systému, v němž je uložena databáze referenčních sekvencí transkriptů indikativní pro referenční sekvence, přičemž počítač je programován se software pro generování hodnoty identifikované sekvence pro každou ze sekvencí transkriptů, kde každá řečená hodnota identifikované sekvence je indikativní pro anotaci sekvence a stupeň shody mezi jednou různou biologickou sekvencí knihovny a přinejmenším jednou referenční sekvencí, a pro zpracování každé řečené hodnoty identifikované sekvence za generování konečných hodnot dat indikativních pro počet, ve kterém je každá hodnota identifikované sekvence přítomhá v knihovně.
V podstatě je vynález způsobem a systémem pro kvantifikaci relativní hojnosti genových transkriptů v biologickém vzorku. Vynález poskytuje způsob porovnání obrazu genových transkriptů ze dvou nebo více různých biologických vzorků pro rozlišení meži dvěma vzorky a pro identifikaci jednoho nebo více genů, jež jsou rozdílně exprimovány u těchto dvou vzorků. Tento obraz genových transkriptů a jeho srovnání tedy může být použít jako diagnostika. Jedno provedení tohoto způsobu generuje vysoce výkonnou, sekvenčně specifickou analýzu vícerých RNA a jim odpovídajících cDNA: obrazu genových transkriptů. Jiné provedepí tohoto způsobu vytváří obrazovou analýzu genových transkriptů s použitím vysoce výkonné sekvenční analýzy cDNA. Navíc mohou být srovnávány dva nebo více obrazů genových transkriptů a mohou být použity k detekci nebo diagnóze konkrétního biologického stavu, choroby, nebo podmínek, které korelují s relativní hojností genových transkriptů v dané buňce nebo buněčné populaci.
Popis tabulek a obrázků
Tabulky
Tabulka 1 poskytuje podrobné vysvětlení písmenkových kódů používaných v Tabulkách 2-5.
Tabulka 2 uvádí seznam jednoho sta nejběžnějších genových transkriptů. Je částečným seznamem izolátů z HUVEC cDNA knihovny připravené a sekvenované jak je popsáno níže. Levý sloupec v této tabulce uvádí pořadí hojnosti sekvence. Další sloupec označený číslo je číslo klonu z odkazu první HUVEC sekvenční identifikace, jež odpovídá číslu ve sloupci vstup. Izoláty, které nebyly sekvenovány v Tabulce 2 nejsou. Další sloupec, označený N, ukazuje celkový počet cDNA, jež mají stejný stupeň shody se sekvencí referenčního transkriptů ve sloupci vstup «
Sloupec označený vstup uvádí jméno lokusu NIH GENBANK, které odpovídá číslu sekvence v knihovně. Sloupec s ukazuje v několika málo případech druh referenční sekvence. Kód pro sloupec s se uvádí v Tabulce 1. Sloupec označený popiska poskytuje v běžné angličtině vysvětlení identity sekvence, jež odpovídá jménu lokusu NIH GENBANK ve sloupci vstup.
Tabulka 3 je porovnání prvních patnácti nejhojnějších genových transkriptů v buňkách normálních monocytů a aktivovaných makrofágů.
Tabulka 4 je podrobné shrnutí odčítací (substrakční) analýzy knihoven, porovnávající cDNA sekvence THP-1 a lidských makrofágů.
V Tabulce 4 se používá tentýž kód jako v Tabulce 2. Další sloupce jsou pro bgref (počet výskytu v odčítané knihovně), rfend (cílový počet výskytu v cílové knihovně) a poměr (cílový počet výskytu dělený odčítaným počtem výskytu). Jak je zřejmé ze studia tabulky, když je počet výskytu v odčítané knihovně 0, pak je cílový počet výskytu dělen 0,05. Toto je cesta pro získání výsledku (nemožná při dělení nulou) a pro rozlišení výsledku od poměrů odčínaných počtů 1.
Tabulka 5 je počítačový program napsaný ve výchozím kódu pro generaci profilů odečtení genových transkriptů.
Tabulka 6 je částečný seznam databázových vstupů používaných v elektronické northern analýze podle vynálezu.
Stručný popis obrázků
Obrázek 1 shrnuje shromážděná a uložená data týkající se úseku konstrukce knihovny při přípravě sekvencí a jejich analýze.
Obrázek 2 je diagram představující pořadí operaqí prováděných software pro uspořádání výskytů ve třídě výhodných provedení způsobu podle vynálezu.
Obrázek 3 je blokový diagram výhodných provedení systémů podle vynálezu.
Obrázek 4 je podrobnější blokový diagram bioinformatického postupu od nové sekvence (která je již stanovena, ale ne identifikována) k výtisku zobrazovací analýzy transkriptů a k přípravě zapsání do databáze.
Podrobný popis vynálezu
Tento vynález poskytuje způsob porovnání relativní hojnosti genových transkriptů v různých biologických vzorcích pomocí vysoce výkonné, sekvenčně specifické analýzy jednotlivých RNA nebo jim odpovídajících cDNA (nebo, alternativně, dat reprezentujících jiné biologické sekvence). Tento postup je zde označován jako zobrazování genových transkriptů. Kvantitativní analýza relativních hojností pro soubor genových transkriptů je zde označována jako zobrazovací analýza genových transkriptů nebo frekvenční analýza genových transkriptů. Tento vynález dovoluje získání profilu genové transkripce v jakékoli dané populaci buněk nebo v tkáni z jakéhokoli typu organismu. Vynález lze použít k profilu vzorku sestávajícího z jednotlivé buňky (nebo klonů jednotlivé buňky), nebo mnohých buněk, nebo tkáně složitější než jednotlivé buňky a obsahující více typů buněk, jako je tkáň jater.
Vynález má významné výhody v oblastech diagnostiky, pokud uvedeme jen některé. Vysoce test lze provádět u nemocného pacienta, jemuž nebyla stanovena diagnóza. Získá se biologický vzorek sestávající z pacientových tekutin nebo tkání, a genové transkripty se izolují a expandují v rozsahu potřebném k určení toxikologie a farmagologie, sofistikovaný diagnostický jejich identity. Genové transkripty mohou být případně konvertovány na cDNA. Vzorek genových transkriptů se podrobí sekvenčně specifické analýze a kvantifikuje. Hojnost těchto genových transkriptů se porovnají proti referenční databázi hojnosti sekvencí, zahrnující normální soubory dat pro nemocné a zdravé pacienty. Pacient má chorobu(y), s kterou soubor pacientových dat nejtěsněji koreluje.
Například: Frekvenční analýza genových transkriptů se může použít pro rozlišení normálních buněk nebo tkání od chorobných buněk nebo tkání právě tak, jak je její pomocí zvýrazněn rozdíl mezi normálními monocyty a aktivovanými makrofágy v Tabulce 3.
V toxikologii je fundamentální otázkou které testy jsou nej účinnější pro předpovědí a detekci toxického účinku. Zobrazování genových transkriptů poskytuje velice podrobné informace o prostředí buněk a tkání, z nichž některé by nebyly zřejmé u konvenčních, méně podrobných způsobů hodnocení. Obraz genových produktů je silnější způsob k předpovědi toxicity a účinnosti léčiva. Podobné výhody se hromadí u použití tohoto nástroje ve farmakologii. Obraz genových produktů může být použit pro selektivní nahlédnutí do kategorií bílkovin, u nichž se očekává, že budou ovlivněny, například enzymů, které detoxikují toxiny.
V alternativním provedení se používá srovnávací frekvenční analýza genových transkriptů k rozlišení mezi nádorovými buňkami, které odpovídají na protinádorová činidla a těmi, které neodpovídají. Příklady protinádorových činidel jsou tamoxifen, vincristin, vinblastin, podofylotoxiny, etoposid, tenisposid, cisplatin, raodifikátory biologické odezvy, jako je interferon, 11-2, GM-CSF, enzymy, hormony a podobně. Tato metoda rovněž poskytuje prostředky pro uspořádání genových transkriptů podle funkčních kategorií. V případě nádorových buněk jsou transkripční faktory a jiné základní regulační molekuly velmi důležité kategorie pro analýzu, zahrnující různé knihovny.
V ještě jiném provedení se používá srovnávací frekvenční analýza genových transkriptů k rozlišení mezi mozkovou tkání pacientů léčených a neléčených lithiem.
V dalším provedení se používá srovnávací frekvenční analýza genových transkriptů k rozlišení mezi buňkami, na které se působilo cyklosporinem nebo FK506, a normálními buňkami.
V dalším provedení se používá srovnávací frekvenční analýza genových transkriptů k rozlišení mezi lidskými buňkami infikovanými virem (včetně infekce HIV) a neinfikovanými lidskými buňkami. Porovnání hojnosti transkriptů bude ukazovat na úspěch léčby nebo na nové cesty výzkumu.
V dalším provedení se používá srovnávací frekvenční analýza genových transkriptů k rozlišení mezi bronchiálními hlenovými tekutinami ze zdravých pacientů a z nemocných pacientů s řadou onemocnění.
V dalším provedení se používá srovnávací frekvenční analýza genových transkriptů k rozlišení mezi buňkami rostlinných, mikrobiálních a zvířecích mutantů a buňkami druhů divokého typu. Navíc je program výskytu transkriptů přizpůsoben k tomu, aby badatelům umožňoval hodnotit transkripci jednoho genu v mnohých různých tkáních. Takováto porovnání mohou určit deleční mutanty, které nevytvářejí některý genový produkt a bodové mutanty, které produkují méně zastoupenou nebo jinak odlišnou genetickou zprávu. Takovéto mutace mohou ovlivnit základní biochemické a farmakologické procesy, jako je výživa minerály a metabolismus, a lze je izolovat způsoby známými těm, co jsou zběhlí v oboru. Mohou být tedy vyvinuty plodiny s lepší úrodou, resistencí ke škůdcům a s jinými faktory.
V dalším provedení se používá srovnávací frekvenční analýza genových transkriptů k mezidruhové srovnávací analýze, která by umožňovala výběr lepších farmakologických zvířecích modelů. U tohoto provedení jsou lidé a jiní živočichové (jako je myš), nebo jejich kultivované buňky, podrobováni působení specifického testovaného činidla. Relativní hojnost sekvencí se stanoví pro každou populaci cDNA. Pokud je zvířecí testovací systém vhodným modelem, homologní geny ve zvířecí populaci cDNA musí měnit expresi podobně jako v lidských buňkách. Když se u léku projeví vedlejší účinky, provede se ke sledování změn genovýčh transkriptů podrobná analýza jejich hojnosti. Modely se pak zhodnotí porovnáním základních fyziologických změn.
V dalším provedení se používá srovnávací frekvenční analýža genových transkriptů v klinickém rozhodování pro získání vysoge podrobného profilu genových transkriptů v pacientových buňkách nebo tkáních (například ve vzorku krve). Obzvláště se frekvenční analýza genových transkriptů použije k získaní profilu genové exprese s vysokým rozlišením pro chorobné stavy nebo podmínky.
Ve výhodném provedení používá tento způsob výkonné sekvenování cDNA k identifikaci specifických transkriptů, jež jsou předmětem zájmu. Generovaná cDNA a odvozené sekvence aminokyselin jsou pak rozsáhle porovnávány s GENBANK nebo jinými bankami sekvenčních dat, jak se popisuje níže. Tento způsob poskytuje několik výhod v porovnání s běžným zjišťováním bílkovin dvojrozměrnou elektroforézou, kde je snahou určit jednotlivé bílkoviny zapojené do konkrétního biologického účinku. Podle tohoto vynálezu odhaluje podrobné porovnání profilů aktivovaných a neaktivních buněk četné změny exprese jednotlivých transkriptů. Poté co se určí, zda stanovená sekvence souhlasí přesně, je podobná nebo nesouhlasí, sekvence se vloží do databáze. Jako další se tabelují počty kopií cDNA, odpovídajících každému genu. I když toto lze provádět, pomalu a pracně, pokud vůbec, lidskýma rukama z výtisků všech vstupů, počítačový program je rychlou a užitečnou cestou k tabelování informací. Celkové počty kopií cDNA (případně vydělené celkovým počtem sekvencí v souboru dat) poskytují obraz relativní hojnosti transkriptů pro každý odpovídající gen. Seznam zahrnutých genů může pak být uspořádán podle hojnosti v populaci cDNA. Vícečetné nebo další typy srovnání jsou možné a jejich příklady jsou uvedeny níže.
Alternativní způsob vytvoření obrazu genových transkriptů obsahuje kroky získání směsi testovaných mRNA a zajištění unikátního souboru sond, jejichž sekvence jsou komplementární přinejmenším k některým testovaným mRNA. Pak se přidá fixní uspořádanému poli sond. Testovaná mRNA po dobu postačující k tomu, aby se a sond. Hybridy mRNA-sonda se detegují množství testované mRNA k se inkubuje se sondami vytvořily hybridy mRNA a stanovují se jejich množství,
Hybridy se identifikují podle umístění v uspořádaném poli sond. Množství všech hybridů se sečte a poskytne populační číslo. Množství každého hybridu se vydělí populačním číslem za poskytnutí souboru dat relativní hojnosti, jenž se označuje jako analýza obrazu genových transkriptů.
Příklady provedení vynálezu
Příklady uváděné níže jsou poskytnuty pro osvětlení předmětného vynálezu. Tyto příklady jsou poskytnuty prostřednictvím ilustrací a nejsou zahrnuty za účelem omezení vynálezu.
Příklad 1
Zdroje tkání a buněčných linií
Pro analýzu počítačovým programem, zde nárokovaným, mohou být biologické sekvence získány snad z každého zdroje. Nejpopulárnější jsou tkáně získané z lidského těla. Tkáně mohou být získány ze všech tělesných orgánů, při jakémkoli věku dárce, jakékoli abnormalitě nebo z jakékoli imortalizovné buněčné linie. Imortalizované buněčné linie mohou být v některých případech výhodné pro čistotu buněčného typu; ostatní vzorky tkání vždy zahrnují smíšené typy buněk. Je dostupná speciální technika k odebrání jednotlivé buňky (například mozkové buňky) a k popohnání buněčné mašinérie k syntéze množství cDNA dostatečného pro sekvenování; techniky a analýzy jsou zde popsány (viz US patenty č. 5 021 335 a 5 168 038, jež jsou zahrnuty odkazem). Příklady tam udávané zahrnují následující imortalizované buněčné linie; U-937 buňky podobné monocytům, THP-l buňky podobné aktivovaným makrofágům, indukované vaskulární endothelové buňky (HUVEC buňky) a buňky HMC-1 podobné žírným buňkám.
Buněčná linie U-937 je linie lidských histiocytických lymfomových buněk s monocytárními charakteristikami, založepá z maligních buněk získaných pleurálním výplachera jednoho pacienta s difúzním histiocytickým lymfomem (Sundstrom, C. a Nilsson, K· (1976) Int. J. Cancer 17:568). U-937 je jednou z mála lidských buněčných linií s morfologickými, cytochemickými, povrchově-receptorovými a monocytům podobnými charakteristikami histiocytických buněk. Tyto buňky mohou být indukovápy k terminální monocytové diferenciaci a při aktivaci supernatanty ze směsných kultur lidských lymfocytů budou exprimovat nové molekuly buněčného povrchu. Při tomto typu in vitro aktivace nastanou v buňkách morfologické a funkční změny, včetně vzrůstu buněčné, na protilátkách závislé cytotoxicity (ADCC) proti erythroidním a nádorovým cílovým buňkám (jedna z hlavních funkcí makrofágů). Aktivace U-937 buněk PMA (phorbol 12-myristátem 13-acetátem) in vitro stimuluje tvorbu několika látek, včetně prostaglandinů, leukotrienů a faktorů aktivujících destičky (PAF), jež jsou potentními mediátory zánětů. U-937 je tedy buněčnou linií, která je velmi vhodná pro identifikaci a izolaci genových transkriptů spojených s normálními monocyty.
Buněčná linie HUVEC je normální, homogenní, dobře charakterizovaná kultura ranných pasáží endothelových buněk z lidské pupeční žíly (Cell Systems Corp., 12815 NE 124th Street, Kirkland, WA 98034). Sekvenovány byly jen genové transkripty z indukovaných nebo opracovaných HUVEC buněk. Na jednu šarži před sklizením působilo po 5 hodin ng/ml E.coli lipopolysacharidového (LPS) endotoxinu. Na separátní šarži 10 x 108 buněk se při konfluenci působilo před sklizením 4U/ml TNF a 2U/ml interferonu gama (IFN-gama).
THP-1 je linie lidských leukemických buněk se zřetelnými x 108 buněk se lU/ml rlL-lb a 100 monocytovými charakteristikami. z krve 1-letého chlapce s (Tschuiya, S. et al. (1980)
Tato buněčná linie je odvozena akutní monocytickou leukémií
Int. J. Cancer: 171-76). Pro stanovení monocytového charakteru této buněčné linie byla použita následující cytologická a cytochemická kritéria: 1) přítomnost alfa-naftylbytyrát esterasové aktivity inhibovatelné fluoridem sodným, 2) produkce lysozymu, 3) a senzitizovaných SRBC (ovčích schopnost THP-1 buněk, aktivovat T-lymfocyty
Morfologicky obsahovala fagocytóza latexových částic červených krevních buněk), se působilo mitomycinem C, nez na po působení ConA (konkavalinu A), cytoplazma malé azurofilní granule a jádro nebylo zubaté a mělo nepravidelný tvar s hlubokými sklady. Buněčná linie měla receptory Fc a C3b, pravděpodobně působící ve fagocytóze. THP-1 buňky po působení nádorového promotoru TPA (12-o-tetradekanoyl-phorbol-13 acetátu) zastavují proliferaci a diferencují na v mnohých ohledech napodobují monocytů. Morfologicky mění buňky podobné makrofágům, které přirozené makrofágy odvozené od buňky tvar, jádro se stává nepravidelnějším a v cytoplazmě se objevují další fagocytové vakuoly. Diferencované THP-1 buňky také vykazují zvýšenou přilnavost k plastovému materiálu pro tkáňové kultury.
Buňky HMC-1 (linie lidských žírných buněk) byly založeny z periferní krve jednoho pacienta Mayo Clinics s leukémií žírných buněk (Leukemia Res. (1988) 12:345-55). Kultivované buňky vypadaly podobně jako nezralé klonované myší žírné buňky, obsahovaly histamin, barvily se pozitivně na chloracetát esterasu, aminokaproát esterasu, eosinofil MBP (hlavní bazickou bílkovinu) a tryptasu. Buňky HMC-1 však ztratily schopnost syntetizovat normální IgE receptory. Buňky HMC-1 mají také 10;16 translokaci, která je přítomná v buňkách původně získaných od pacienta leukoforézou a není kultivačním artefaktem. Buňky HMC-1 jsou tedy dobrým modelem žírných buněk.
Příklad 2
Konstrukce knihoven cDNA
Pro srovnávání mezi knihovnami musejí být knihovny připravovány podobnými způsoby. Jako obzvlášť důležité se jeví dohlédnout na určité konkrétní parametry. Jedním takovýmto parametrem je způsob izolace mRNA. Důležité je použít stejné podmínky pro odstraňování DNA a heterogenní jaderné RNA ze porovnávaných knihoven. Frakcionace cDNA podle velikosti musí být pečlivě řízena. S výhodu se má pro přípravu knihoven, jež mají být srovnávány, použít stejný vektor. Aby bylo zajištěno platné srovnání, musí se použít přinejmenším vektor stejného typu (např. s jednosměrnou orientací insertů). Vektor s jednosměrnou orientací může být výhodou pro snadnější analýzu výstupu.
Je výhodné startovat pouze s jednosměrným oligo dT primerem, aby se při získávání cDNA získal pouze jeden klon na jeden mRNA transkript. Uznává se však, že využívání směsi oligo dT a náhodných primerů může být také výhodné, protože s takovouto směsí vzniká větší různost sekvencí, když je cílem odkrytí genů. Podobné efekty lze získat s DR2 (Clontech) a HXLOX (US Biochemical) a také s vektory od Invitrogen a Novagen. Tyto vektory mají dva požadavky. Předně musí existovat startovací místa pro komerčně dostupné primery, jako jsou T3 nebo Ml3 reverzní primery. Za druhé: vektor musí přijímat inserty až do 10 kB.
Důležité je také, aby vzorek klonů byl náhodný a aby se používala významná populace klonů. Data byla generována i s 5 000 klony, ale pokud se mají získat vzácné geny nebo stanovit jejich relativní hojnost, může být zapotřebí vzorek až 100 000 klonů z jedné knihovny. Frakcionace cDNA podle velikosti musí také být pečlivě řízena. Alternativně se mohou selektovat plaky místo klonů.
Má se za to, že vedle Uni-Zap™ vektorového systému od fy. Stratagene, popsaného níže, se dají použít také jiné podobně jednosměrné vektory. Například se má za to, že takovéto vektory zahrnují, ale bez omezení, DR2 (Clontech) a HXLOX (U.S. Biochemical).
S výhodu se podrobnosti konstrukce knihovny shromažďují (jak je ukázáno v Obrázku 1) a ukládají v databázi pro další vytažení s ohledem na porovnávanou sekvenci. Obr. 1 ukazuje důležité informace vztahující se ke spolupracovníkovi z konstrukce knihovny nebo k dodavateli buněk nebo cDNA, k předchozímu zpracování, biologickému zdroji, kultuře, preparaci mRNA a konstrukci cDNA. Podobné podrobné informace jsou prospěšné pro hloubkovou analýzu sekvencí a knihoven.
RNA se musí získat z buněk a vzorků tkání, a následně se konstruují cDNA knihovny. cDNA knihovny se konstruují podle technik známých v oboru. (Viz např. Maniatis, T. et al. (1982) Molecular Cloning, Cold Spring Harbor Laboratory, New York). cDNA knihovny lze rovněž zakoupit. U-937 cDNA knihovna (kat. č. 937207) byla získána od Stratagene, lne., 11099 M. Torrey Pines Rd., La Jolla, CA 92037.
THP-l cDNA knihovna byla konstruována na zakázku u Stratagene z THP-l buněk kultivovaných 48 hodin s 100 nM TPA a 4 hodiny s 1 μg/ml LPS. Knihovna cDNA lidských žírných buněk zakázku u Stratagene cDNA knihovna byla dvou šarží indukovaných
HMC-1 byla rovněž konstruována na z kultivovaných buněk HMC-1. HUVEC konstruována na zakázku u Stratagene ze
HUVEC buněk, které byly zpracovány odděleně.
V podstatě byly všechny knihovny připravovány stejným způsobem. Za prvé byla vyčištěna poly(A+) RNA (mRNA). U syntézy cDNA se u RNA U-937 a HMC-1 použilo startování pouze pomocí oligo dT. U RNA THP-1 a HUVEC byla syntéza cDNA startována odděleně jak oligo dT, tak náhodnými hexamery, a tyto dvě cDNA knihovny byly zpracovávány odděleně. Ke koncům cDNA byly ligovány syntetické adaptorové oligonukleotidy umožňující její inserci do Uni-Zap™ vektorového systému (Stratagene), což dovoluje vysoce účinnou konstrukci jednosměrné lambda knihovny (v sensé orientaci) a pohodlí plasmidového systému s barevnou selekcí modrá-bílá u detekce klonů s inserty cDNA. Konečně: Tyto dvě knihovny byly spojeny do jediné knihovny smícháním stejných počtů bakteriofága.
Knihovny byly hodnoceny bud s DNA sondami nebo s protilátkovými sondami a bylo možno rychle in vivo vystřihnout pBluescriptR fagemidy (Stratagene). Fagemid umožňuje použít plasmidový systém ke snadné charakterizaci insertu, sekvenování, řízené mutagenese, vytváření deleqí v jednom směru a k expresi fúzovaných bílkovin. Fágové částice knihoven konstruovaných na zakázku byly použity k infekci E. coli hostitelského kmene XLl-BlueR (Stratagene), jenž má vysokou transformační účinnost, což zvyšuje pravděpodobnost získání vzácných, málo zastoupených klonů v knihovně cDNA.
Příklad 3
Izolace cDNA klonů
Fagemidové formy jednotlivých cDNA klonů byly získány in vivo vyštěpovacím procesem, u kterého byl hostitelský bakteriální kmen infikován současně lambda fágem knihovny a pomocným fágem fl. Bílkoviny odvozené jak z fága obsaženého v knihovně, tak z pomocného fága, tvoří jednovláknová přerušení [nick] v lambda DNA, iniciují syntézu nové DNA z definovaných sekvencí cílové lambda DNA a tvoří menší, jednovláknové cirkulární molekuly fagemidové DNA, které zahrnují všechny DNA sekvence pBluescriptR plasmidu a cDNA insertu. Fagemidové DNA je secernována z buněk a purifikuje se, pak se použije na reinfekqi čerstvých hostitelských buněk, kde se dvoří dvouvláknová fagemidová DNA. Protože fagemid nese gen pro beta-laktamasu, nově transformované bakterie jsou selektovány na médiu obsahujícím ampicilin.
Fagemidová DNA byla čištěna s použitím Magie MiniprepsR DNA Purification System (Promega katalogové č. A7100, Promega Corp., 2800 Woods Hollow Rd. , Maison, WI 53711). Tento postup v malém měřítku poskytuje jednoduchý a spolehlivý způsob lyse bakteriálních buněk a rychlé izolace purifikované fagemidové DNA s použitím vlastnicky chráněné náplně pro vazbu DNA. DNA byla eluována z purifikační náplně, jež je už připravována pro účely sekvenování a dalších analytických operací.
Fagemidová DNA byla purifikována také s použitím QIAwell-8 Plasmid Purification System z QIAGENR DNA Purification System (QIAGEN lne., 9259 Eton Ave., Chattsworth, CA 91311). Takováto produkce poskytuje pohodlný, rychlý a spolehlivý výkonný způsob pro lysi bakteriálních buněk a izolaci vysoce purifikované fagemidové DNA s použitím částic QIAGEN anexové s technologií EMPORE™ membrány od 3M ve formátu více jamek. DNA byla eluována z purifikační náplně, jež je už připravována pro účely sekvenování a dalších analytických operací.
Nedávno se stal dostupným alternativní způsob purifikace fagemidů. Používá Miniprep Kit (katalogové č. 77468, dostupný u Advanced Genetic Technologies Corp., 19212 Orbit Drive, Githersburg, Maryland). Tato souprava je ve formátu 96 jamek a poskytuje reagenty postačující na 960 purifikací. Každá souprava je poskytována s doporučovaným protokolem, jenž byl dodržován, až na následující změny. Za prvé byla každá z 96 jamek naplněna jen 1 ml sterilní terrific půdy s karbenicilinem o koncentraci 25 mg/1 a 0,4 % glycerolem. Po naočkování jamek byly bakterie kultivovány po lysačního pufru. Centrifugační provádí předtím, než se obsah hodin a lysovány s 60 μΐ krok (2900 rpm po 5 minut) se bloku dá na primární filtrovací destičky. Případný krok přidání isopropanolu do TRIS pufru se rutinně neprovádí. Po posledním kroku protokolu se vzorky přenesou do 96-jamkového bloku Beckman ke skladování.
Další nový systém purifikace DNA je výrobek WIZARD , jenž je dostupný u Promega (katalogové č. A7071) a je přizpůsobitelný pro 96-jamkový formát.
Příklad 4
Sekvenace cDNA klonů prekursorů). Nová sekvenaci a analýze cDNA inserty náhodných izolátů z knihoven U-937 a THP-1 byly částečně sekvenovány. Způsoby sekvenace DNA jsou v oboru dobře známé. Konvenční enzymatické metody používají Klenowův fragment DNA polymerasy, Sequenase™ nebo Taq polymerasu k extendování řetězců DNA z oligonukleotidového primeru přihybridizováného [annelaed] k DNA templátu, jenž je předmětem zájmu. Byly vyvinuty metody pro používání jak jedno-, tak dvouvláknových templátů. Produkty terminace řetězce se obvykle elektroforézuji ha akrylamidových gelech s močovinou a detegují bud pomocí autoradiografie (u prekursorů značených radionuklidy) nebo fluoresčence (u fluorescenčně značených vylepšení v mechanizované přípravě reakcí, s použitím fluorescenční detekce dovolují nárůst počtu sekvencí, jež lze stanovit za jeden den (jako u Applied Biosystems 373 a 377 DNA sekvenátoru, Catalyst 800). V současnosti se systémy, jak jsou popsány, délky čtení kolísají od 250 do 400 baží a jsou závislé na klonech. Délka čtení kolísá také s délkou a časem, s nimiž běží gel. Všeobecně mají kratší běhy gelu tendenci ubírat ze sekvence. Pro identifikaci a pro stanovení stupně homologie sekvence je potřebné minimum o pouhých 25 až 50 bazích Zobrazování genových transkriptů lze použít s jakoukoli sekvenčně specifickou metodou včetně, ale bez omezení, hybridizace, hmotové spektroskopie, kapilární elektroforézy a elektroforézy s 505 gelem.
Příklad 5
Vyhledávání homologie cDNA klonu a odvozené bílkovin (a následující kroky)
S použitím nukleotidových sekvencí odvozených od cDNA klonu jako zkoumaných sekvencí (sekvence ze Seznamu sekvencí) se v databázích dříve identifikovaných sekvencí vyhledávají oblasti homologie (podobnosti). Příklady takovýchto databází zahrnuji
Genbank a vyhledávání následující dvou algoritmů pak popisujeme provádění podle
EMBL. Dále popisujeme příklady homologií, jež lze používat, a počítačem implementované kroky k výhodných provedení vynálezu.
V následujícím popisu počítačem implementovaných kroků vynálezu označuje slovo knihovna soubor (nebo populaci) sekvencí nukleových kyselin biologického vzorku. Knihovna může sestávat z cDNA sekvencí, RNA sekvencí, nebo podobně, jež charakterizují biologický vzorek. Biologický vzorek může sestávat z buněk jediného lidského buněčného typu (nebo může být kterýmkoli ze shora uvedených typů vzorků). Očekáváme, že sekvence v knihovně byly stanoveny tak, že věrně reprezentují nebo charakterizují biologický vzorek (mohou například sestávat z reprezentativních cDNA sekvencí z klonů RNA vzaté z jediné lidské buňky).
V následujícím popisu počítačem implementovaných kroků vynálezu označuje výraz databáze soubor uložených dat, která představují sbírku sekvencí, které zase představují sbírku referenčních biologických materiálů. Databáze může například sestávat z dat představujících mnohé uložené cDNA sekvence, které jsou zase reprezentativní pro lidské buňky infikované různými viry, buňky lidí různého věku, buňky z různých savčích druhů, a tak dále.
Ve výhodných provedeních používá vynález počítač programovaný software (bude popsáno) k provádění následujících kroků:
a) zpracování dat indikativních pro knihovnu cDNA sekvencí (generovanou jako výsledek výkonného sekvenování cDNA nebo jiným způsobem) k určení, zda každá sekvence knihovny odpovídá nějaké DNA sekvenci referenční databáze DNA sekvencí (a když je tomu tak, určení vstupu referenční databáze, jenž odpovídá této sekvenci, a vyznačení stupně shody mezi referenční sekvencí a sekvencí knihovny) a přiřazení hodnoty identifikované sekvence, založené na anotaci sekvence a stupni shody s každou ze sekvencí v knihovně,
b) pro některé nebo všechny vstupy databáze se tabeluje počet odpovídajících hodnot identifikovaných sekvencí v knihovně (i když toto lze provádět lidskou rukou z výtisků všech vstupů, dáváme přednost provedení tohoto kroku s počítačovým software, jež bude popsáno níže) a takto se generuje konečný soubor hodnot dat neboli číslo výskytu, a
c) když mají knihovny různé velikosti, dělení každého čís výskytu celkovým počtem sekvencí v knihovně, za získání relativního čísla výskytu pro každou hodnotu identifikované sekvence (t.j. relativní hojnost každého genového transkriptů).
Seznam hodnot identifikovaných sekvencí (nebo jím odpovídajících genů) může pak být uspořádán podle hojnosti v populaci cDNA. Je možných mnoho dalších typů srovnávání nebo rozměrů.
Například (což bude popsáno podrobněji níže) kroky a) a b) lze opakovat se dvěma různými knihovnami (na něž se někdy odkazuje jako na cílovou knihovnu a na odčítanou knihovnu)<, Pak se pro každou hodnotu identifikované sekvence (nebo genového transkriptů) získá hodnota podílu vydělením čísla výskytu (pro tuto hodnotu identifikované sekvence) pro cílovou knihovnu číslem výskytu (pro tuto hodnotu identifikované sekvence) pro odčítanou knihovnu.
Ve skutečnosti lze provádět odčítání na početnějších knihovnách. Je možné sečíst transkripty z několika knihoven (například tří) a pak je dělit jiným souborem transkriptů z početnějších knihoven (znovu, například, ze tří). Zapsání této operace může být ve zkratce (A+B+ C) / (D + E + F), kde každé z velkých písmen označuje celou knihovnu. Čísla výskytu transkriptů v sečtených knihovnách mohou být případně dělena celkovou velikostí vzorku před odčítáním.
Na rozdíl od standardní hybridizační technologie, která umožňuje jediné odečtení dvou knihoven, jakmile je zpracován soubor (či knihovna) sekvencí transkriptů a je uložen v počítači, lze s touto knihovnou provádět odčítání v jakémkoli počtu. Například mohou být tímto způsobem získány hodnoty podílů vydělením hodnot relativní hojnosti v první knihovpě odpovídajícími hodnotami v druhé knihovně a naopak.
Ve variacích kroku a) sestává knihovna z nukleotidovýčh sekvencí odvozených od cDNA klonů. Příklady databází, v nichž lze vyhledávat oblasti homologie (podobnosti) v kroku a), zahrnují komerčně dostupné databáze známé jako Genbank (NIH), EMBL (European Molecular Biology Labs, Německo) a GENESEQ (Intelligenetics, Montain View, Kalifornie).
Jeden algoritmus vyhledávání homologií, jehož lze využít pro implementaci kroku a), je algoritmus popsaný v publikaci od D.J. Lipmana a W.R. Persona, nazvané Rychlá a citlivá vyhledávání podobnosti bílkovin, Science 227:1435 (1985). U tohoto algoritmu jsou homologní úseky prohledávány dvoustupňovým způsobem. V prvním kroku jsou nejhomolognější úseky stanoveny pomocí výpočtu výsledku shody [matching score] s použitím tabulky výsledků homologie [homology score], K určení minimální velikosti okénka, jež se posunuje při porovnávání dvou sekvencí, se používá parametr Ktup. Ktup také určuje počet baží, jež musí být shodné, pro vyjmutí nejhomolognějšího úseku sekvencí. V tomto kroku se nepoužívají žádné inserce nebo delece a homologie je předvedena jako iniciální (INIT) hodnota.
Ve druhém kroku jsou homologní úseky vzájemně přiloženy k sobě [ aligrned], k získání nej vyššího výsledku shody pomocí insercí a mezer, za účelem přidání pravděpodobně deletované části. Výsledek shody získaný v prvním kroku je přepočítán s použitím tabulky výsledků shody a tabulky výsledků insercí [insertion score] na optimalizovanou (OPT) hodnotu v konečné výstupu.
DNA homologie mezi dvěma sekvencemi mohou být zkoumány graficky s použitím Harrovy metody konstrukce bodové matrice vynesení homologií (Needleman, S.B. a Wunch, C.O., J. Mol. Biol. 48:443 (1970)). Tato metoda produkuje dvojrozměrné vynesení, které může být užitečné pro stanovení úseků homologie versus úsekům repetice.
Ve třídě výhodných provedení se však krok a) implementuje zpracování dat knihovny komerčně dostupným počítačovým programem, známým jako INHERIT 670 Sequence Analysis System, dostupným od Applied Biosystems lne. (Foster City, Kalifornie), zahrnujícím software, známé jako Factura (také dostupné od Applied Biosystems lne.). Program Factura předzpracovává sekvence knihovny za vyškrtávání těch jejich částí, u nichž není pravděpodobné, že by byly předmětem zájmu, jako je vektorová část použitá u přípravy knihovny. Další sekvence jež mohou být vyřazeny nebo maskovány (ignorovány vyhledávacími prostředky) jsou, ale bez omezení, póly A konce a repetitivní GAG a CCC sekvence. Může být napsán omezující vyhledávací program k zamaskování takovýchto málo informativních sekvencí, nebo je mohou ignorovat programy jako je BLAST.
V algoritmu implementovaném pomocí INHERIT 670 Sequence Analysis System, se ke stanovení úseků homologie používá'Pattern Specification Language (vyvinutá u TRW lne.). Existují tri parametry, jež určují jak analýza INHERIT provádí srovnávání sekvencí: velikost okénka, nastavování okénka a tolerance k chybám. Velikost okénka určuje délku segmentů do kterých je zkoumaná sekvence rozdělována. Nastavování okénka určuje, kde se začne s dalším porovnávaným segmentem, počítáno od začátku předešlého segmentu. Tolerance k chybám určuje celkový počet inserci, delecí nebo substitucí, jež jsou tolerovány v rámci určené délky slova. Tolerance k chybám může být nastavena na jakékoli celé číslo mezi 0 a 6. Defaultová nastavení jspu velikost okénka = 20, nastavování okénka = 10 a tolerance k chybám = 3. INHERIT Analysis Users Manual, str. 2-15, verze 1.0, Applied Biosystems, lne., říjen 1991.
S použitím kombinace těchto tří parametrů může být databáze i
(jako je DNA databáze) prohledávána na sekvence obsahující úseky homologie a patřičné sekvence dostanou iniciální hodnotu. Následně jsou tyto homologní úseky zkoumány s použitím vynesení bodové matrice pro určení úseků homologie versus úseků repetice. Pro vyjádření výsledků vyhledávání homologií lze použít Smithova-Watermanova přikládání. Software INHERIT může běžet na počítačovém systému Sun, programovaném operačním systémem UNIX.
Vyhledávací alternativy k INHERIT zahrnují BLAST program, GCG (dostupný od Genetics Computer Group, WI) a program Dasher (Temple Smith, Boston University, Boston, MA). Nukleotidové sekvence mohou být prohledávány proti Genbank, EMBL nebo databázím na zakázku, jako je GENESEQ (dostupná od Intelligenetics, Montain View, Kalifornie), nebo jiným databázím pro geny. Navíc jsme některé sekvence prohledávali proti naší vlastní domácí databázi.
Ve výhodných provedeních jsou sekvence transkriptú analyzovány software INHERIT, pro dosažení nejlepšího souhlasu s referenčním transkriptem, k přiřazení identifikátoru sekvence a přiřazení stupně homologie, což je spolu hodnotou identifikované sekvence a vstupem (k dalšímu zpracování) do osobního počítače Macintosh (dostupného od Apple), programovaného k uspořádání hojností a odčítací analýze počítačovým programem (bude popsán níže).
Před programem uspořádání hojností a odčítací analýzy (označovaným také jako program uspořádání hojností) se přiřazují identifikovaným sekvencím z cDNA klonů hodnoty (podle parametrů uváděných výše) se stupněm shody podle následujících kategorií: přesná shoda (úseky s vysokým stupněm identity), homologní lidská shoda (úseky s vysokou podobností, ale ne přesnou shodou, homologní ne-lidská shoda (v druzích jiných než člověk jsou přítomné úseky vysoké podobnosti) nebo žádná shoda (žádné významné úseky homologie s dříve identifikovanými nukleotidovými sekvencemi uloženými ve formě databáze). Alternativně může být stupeň shody číselnou hodnotou jak je popsáno níže.
Znovu s odkazem na krok identifikace shod mezi referenčními sekvencemi a vstupy databáze, ze sekvencí nukleových kyselin mohou být odvozeny sekvence peptidů a bílkovin. Při používání odvozených sekvencí polypeptidů může být identifikace shody prováděna způsobem analogickým tomu, co se provádí s cDNA sekvencemi. Sekvence bílkoviny se používá jako zkoumaná sekvence a pro nalezení homologní bílkoviny se porovnává s dříve identifikovanými sekvencemi obsaženými v
Swiss/Prot, PIR a proteinová databáze NBRF.
iniciálně vyhodnocovány na homologii s použitím tabulky hodnocení homologie (Orcutt, B,C. a Dayoff, M.O. Scoring Matrices, PIR Report MAT - 0285 (únor 1985)), což vede k INIT hodnotě.
Homologní úseky jsou přikládány k sobě pro získání nejvyššího výsledku shody za vložení mezery, která přidává pravděpodobně deletovanou část. Výsledek shody je přepočítán s použitím tabulky výsledků shody a tabulky výsledků insercí na optimalizovanou (OPT) hodnotu v konečné výstupu. I bez znalosti správného čtecího rámce izolované sekvence lze provádět shora popsané vyhledávání homologie bílkovin prohledáváním všech tří čtecích rámců.
Homologie sekvencí peptidů a bílkovin lze určit pomocí INHERIT 670 Sequence Analysis System podobně jako u homologii DNA sekvencí. Používá Pattern Specification Language a parametrovaná okénka se používají k prohledávání bílkovinových databází na sekvence obsahující úseky homologie, jíž se dává iniciální hodnota. Následně znázornění v grafu bodové matrice ukazuje úseky databázi jako je Tyto bílkoviny jsou homologie versus repetice. Další nástroje vyhledávání jsou dostupné k prohledávání motivů (pattern] v databázích a zahrnují PLearch Blocks (dostupné od Henikoff & Henikoff, University of Washington, Seattle), Dasher a GCG. Databáze k vyhledávání motivů zahrnují, ale bez omezení, Protein Blocks (dostupnou od Henikoff & Henikoff, University of Washington, Seattle), Brookhaven Protein (dostupnou od Brookhaven National Laboratory, Brookhaven, MA), PROSÍTE (dostupnou od Amose Bairocha, Ženevská universita, Švýcarsko), ProDom (dostupnou od Temple Smithe, Boston University) a PROTEIN MOTIF FINGERPRINT (dostupnou z University of Leeds, Velká Británie).
Aplikační software ABI Assembler, část systému DNA analýzy INHERIT (dostupného od Applied Biosystems, lne., Foster City, Kalifornie), lze použít k projektům vytvoření a používání složených sekvencí s pomocí skládání dat z vybraných fragmentů do větší sekvence. Software Assembler spojuje dvě pokročilé počítačové technologie, což maximalizuje schopnost složit sekvenované fragmenty DNA do Assemblage, zvláštního uskupení dat, kde jsou vztahy mezi sekvencemi ukázány grafickým překryvem, přiložením a ze statistického pohledu. Postup je založen na Meyersově-Kaceciogluově modelu skládání fragmentů (INHERIT™ Assemler User's Manual, Applied Biosystems, lne., Foster City, CA) a používá teorii grafů jako základ velice rigorózního stroje k přikládání více sekvencí pro složení fragmentů DNA. Jiné skládací programy, jež mohou být použity, zahrnují MEGALIGN a STÁD (dostupný od DNASTAR lne., Madison, WI), Dasher (dostupný u Rogera Stadena, Cambridge, Anglie).
Dále, s odkazem na Obr. 2., popisujeme podrobněji program uspořádání hojností, jenž implementuje krok b) k tabelováhí počtu sekvencí knihovny, jež se shodují s každým vstupem databá (počet výskytu pro každý vstup databáze).
Obr. 2 je schéma výhodného provedení programu uspořádávání hojností. Seznam kódů zdrojů pro toto provedení je zad v Tabulce 5. Při implementaci Tabulky 5 je program uspořádává hojností napsán s použitím programovacího jazýka FoxBASjE, komerčně dostupného od Microsoft Corporation. I když FoxBASE byl programem vybraným pro první iteraci této technologie, nesmí se považovat za omezující. Mohou být použity mnohé jiné programovací jazyky, přičemž Sybase je obzvlášt: žádoucí alternativou, jak bude
EN ze an ní jasné tomu, kdo je normálně zběhlý v oboru. Názvy subrutin specifikované v Obr. 2 odpovídají subrutinám uváděným v Tabulce 5.
Znovu s odkazem na Obr. 2, identifikované sekvence jsou sekvence transkriptů, reprezentující každou sekvenci knihovny a odpovídající identifikaci shodného vstupu databáze (pokud existuje). Jinými slovy jsou identifikované sekvence výstupem shora rozebraného kroku a).
Obr. 3 je blokový diagram sytému pro implementaci vynálezu. Systém v Obr. 3 zahrnuje jednotku 2 generování knihovny, jež generuje knihovnu a určuje tok výstupu sekvencí transkriptů indikativních pro biologické sekvence tvořící knihovnu. Programovaný procesor 4 proud dat výstupu z jednotky 2 a zpracovává tato data v souladu se shora rozebraným krokem a) za generování identifikovaných sekvencí. Procesor 4 může být procesor programovaný komerčně dostupným počítačovým programem, známým jako INHERIT 670 Sequence Analysis System a komerčně dostupným počítačovým programem, známým jako Factura (oba dostupné od Applied Biosystems lne.) a operačním systémem UNIX.
Stále s odkazem na Obr.3, identifikované sekvence se plní do procesoru 6, jež je programován programem uspořádávání hojností. Procesor 6 generuje konečné sekvence transkriptů, předvedené v Obr. 2 a 3. V Obr. 4 je ukázán podrobný blokový diagram plánovaného vztahového počítačového systému, jež zahrnuje různé vyhledávací techniky, jež mohou být implementovány, spolu s výběrem databází, proti kterým lze zkoumat.
S odkazem na Obr. 2, program uspořádávání hojností napřed provede na identifikované sekvenci operaci známou jako Tempnum, k vyřazení všech identifikovaných sekvencí kromě těch, jež mají protějšek vybraného typu ve vstupech databáze. Například proces Tempnum může vybírat identifikované sekvence, které představují následující typy shody se vstupy databáze (viz výše ohledně definic): přesné shody, lidské homologní shody, shody s jiným druhem (představující geny přítomné v druzích jiných než člověk), žádné shody (žádné významné úseky homologie s databázovými vstupy reprezentujícími dříve identifikované nukleotidové sekvence), I shody (Incyte pro dříve neznámé DNA sekvence), nebo X shody (shody s ETS v referenční databázi).
Toto eliminuje sekvence U, S, Μ, V, A, Ra D (ohledně definic viz Tabulku 1.
Hodnoty identifikovaných sekvencí, vybraných během procesu Tempnum ,pak projdou další výběrovou operací (odplevelením), jež je známa jako Tempred. Tato operace může například vyřadit všechny hodnoty identifikovaných sekvencí, představujících shodu s vybranými vstupy databáze.
Hodnoty identifikovaných sekvencí vybraných v procesu Tempred jsou pak klasifikovány podle knihovny během operace Tempdesig. Očekává se, že identifikované sekvence mohou představovat sekvence z jedné knihovny, nebo ze dvou nebo více knihoven.
Uvažujme napřed případ, kdy identifikované sekvence představují sekvence z jedné knihovny. V tomto případě projdou všechny hodnoty identifikovaných sekvencí stanovené během Tempred tříděním v operaci Templib, dalším tříděním v operaci Libsort a konečně dalším tříděním v operaci Temptarsort. Například: Tyto tři operace mohou uspořádávat identifikované sekvence v pořadí klesajícího čísla výskytu (za generování seznamu klesajících počtů výskytu, kde každé číslo výskytu odpovídá unikátnímu sekvenčnímu vstupu, nebo několik seznamů klesajících počtů výskytu, kde čísla výskytu v každém seznamu odpovídají databázovým vstupům vybraného typu) s odstraněním redundancí z každého uspořádaného seznamu. V tomto případě lze obejít operaci identifikovanou jako Cruncher, takže hodnotami konečných dat jsou organizované sekvence transkriptů, produkované během operace Temptarsort.
Dále uvažujme případ, kdy sekvence transkriptů produkované během operace Tempred představují sekvence ze dvou knihoven (jež budeme označovat jako cílovou knihovnu a odčítací knihovnu). Například: Cílová knihovna může sestávat z cDNA sekvencí z klonů chorobné buňky, zatímco odčítací knihovna může sestávat z cDNA sekvencí z klonů chorobné buňky, vystavené působení léku. Jiný příklad: Cílová knihovna může sestávat z cDNA sekvencí z klonů buněčného typu z mladého člověka, zatímco odčítací knihovna může sestávat z cDNA sekvencí z klonů téhož buněčného typu ze stejného člověka v různém jiném věku.
V tomto případě směruje operace Tempdesig všechny sekvence transkriptů, reprezentující cílovou knihovnu, ke zpracování v souladu s Templib (a pak s Libsort a Temptarsort”) a směruje všechny sekvence transkriptů, reprezentující odčítanou knihovnu, ke zpracování v souladu s Tempsub (a pak s Subsort a Tempsubsort). Například: Následné třídící operace Templib, Libsort a Temptarsort uspořádávají identifikované sekvence cílové knihovny v pořadí klesajícího čísla výskytu (za generování seznamu klesajících počtů výskytu, kde každé číslo výskytu odpovídá unikátnímu sekvenčnímu vstupu, nebo několik seznamů klesajících počtů výskytu, kde čísla výskytu v každém seznamu odpovídají databázovým vstupům vybraného typu) s odstraněním redundancí z každého uspořádaného seznamu. Následné třídící operace Tempsub, Subsort a Tempsubsort uspořádávají identifikované sekvence odčítané knihovny v pořadí klesajícího čísla výskytu (za generování seznamu klesajících počtů výskytu, kde každé číslo výskytu odpovídá unikátnímu sekvenčnímu vstupu, nebo několik seznamů klesajících počtů výskytu, kde čísla výskytu v každém seznamu odpovídají databázovým vstupům vybraného typy) s odstraněním redundancí z každého uspořádaného seznamu.
Výstup sekvencí transkriptů z operace Temptarsort představuje typicky uspořádaný seznam, z něhož lze konstruovat histogram, kde pozice podél jedné (např. horizontální) ošy ukazují počet výskytu (sekvencí cílové knihovny) a pozice podél druhé (např. vertikální) osy ukazují hodnotu identifikované sekvence (např. lidský nebo ne-lidský typ genu). Podobně: Výstup sekvencí transkriptů z operace Tempsubsort představuje typicky uspořádaný seznam, z něhož lze konstruovat histogram, kde pozice podél jedné (např. horizontální) osy ukazují počet výskytu (sekvencí odčítané knihovny) a pozice podél druhé (např· vertikální) osy ukazují hodnotu identifikované sekvence (např· lidský nebo ne-lidský typ genu).
Výstup sekvencí transkriptů (uspořádané seznamy) z třídících operací Tempsubsort a Temptarsort se spojí během operace identifikované jako Cruncher [drtic]. Proces Cruncher identifikuje páry odpovídajících cílových a odčítaných počtů výskytu (oba reprezentují stejnou hodnotu identifikované sekvence), a dělí jeden druhým za generování hodnoty podílu pro každý pár odpovídajících počtů výskytů, a pak uspořádává hodnoty podílů v pořadí klesajících hodnot podílů. Výstup dat z operace Cruncher (konečný transkript v Obr. 2) je typicky uspořádaným seznamem, z něhož lze konstruovat histogram, kde pozice podél jedné osy ukazují velikost podílu počtů výskytu (pro odpovídající hodnoty identifikovaných sekvencí z cílové a odčítané knihovny) a pozice podél druhé osy ukazují hodnotou identifikované sekvence (např. typ genu).
S výhodou je, když před získárjím poměru mezi hodnotami hojnosti ve dvou knihovnách vydělí operace Cruncher každou hodnotu podílu celkovým počtem sekvencí v cílové nebo v odčítané knihovně, nebo v obou. Výsledné seznamy relativních hodnot podílů, generované touto Cruncher operac-í, jsou užitečné pro řadu lékařských, vědeckých a průmyslovýqh aplikací. Je rovněž s výhodou, když výstupem operace Cruncher je soubor seznamů, kde každý seznam reprezentuje sekvenci s klqsajícími hodnotami podílu v různé vybrané podtřídě vstupů databáze (např. v rodině bílkovin).
V jednom příkladu tabeluje program uspořádávání hojností podle vynálezu pro některou knihovnq počty mRNA transkriptů, odpovídající každému genu identifikovanému v databázi. Tato čísla se dělí celkovým počtem klonů vzorkq. Výsledek dělení odráží relativní hojnost mRNA transkriptů v buqěčném typu nebo ve tkáni, z níž byly získány. Získání tohoto konečného souboru dat se zde označuje jako analýza obrazu genových transkriptů). Výsledná data po odečtení ukazují přesně, podrobně a komplexně, které bílkoviny a geny jsou regulovány směry '^nahoru a dolů.
Příklad 6 cDNA knihovna HUVEC
Tabulka 2 je tabulka hojností, poskytující seznam různých genových transkriptů v knihovně indukovaných buněk HUVEC. Transkripty jsou v seznamu uspořádány v pořadí klesající hojnosti. Toto počítačové třídění zjednodušuje analýzu tkáně a urychluje identifikaci význačných nových bílkovin, jež jsou specifické pro tento buněčný typ. Tento typ endothelových buněčných linií vytváří tkáň kardiovaskulárního systému, a čím víc se ví o jejich složení, obzvlášť při odezvě na aktivaci, tím dále se zvětšuje výběr cílových bílkovin, na něž lze působit při léčbě poruch této tkáně, jako třeba při hojně se vyskytující atheroskleróze.
Příklad 7 cDNA knihovny buněk monocytů a žírných buněk
Části srovnání dvou knihoven jsou ukázány v Tabulkách 3 a 4. V Tabulkách 3a 4 jsou normálními monocyty buňky HMC-1 a aktivovanými makrofágy buňky THP-1 po předcházejícím působení PMA a aktivaci LPS. Tabulka 3 uvádí pro oba typy buněk seznam nejhojnějších genových transkriptů v pořadí snižující se hojnosti. S pouhými patnácti genovými transkripty pro každý typ buněk umožňuje tato tabulka rychlé, kvalitativní srovnání nejběžnějších transkriptů. Tato uspořádání hojností, s jejich pohodlným přiložením vedle sebe, poskytují okamžitě užitečný nástroj výzkumu. V daném případě tento nástroj výzkumu odhaluje, že 1) jenom jeden z patnácti předních transkriptů aktivovaných makrofágů se nalézá mezi patnácti předními genovými transkripty normálních monocytů (póly A vážící bílkovina) a 2) nový genový transkript (nezaznamenaný dříve v jiných databázích) je poměrně vysoce reprezentován v aktivovaných makrofázích, ale není podobně prominentní u normálních makrofágů. Takovýto výzkumný nástroj poskytuje badatelům krátkou cestu k novým bílkovinám, jako k receptorů<* povrchovým buněčným a intracelulárním signálním molekulám, jež mohou sloužit jako cílová místa léků u komerčních vyhledávacích programů. Takovýto nástroj ušetří značný čas v porovnání s tím, co se ztratí při odhalování systémem zásah nebo vedle, když se jedná o programy identifikace důležitých bílkovin na buňkách nebo uvnitř nich, a je tomu tak proto, že bílkoviny, jež jsou nositeli běžných buněčných funkcí a jež jsou reprezentovány mRNA v rovnovážném stavu jsou rychle eliminovány z další charakterizace.
Tímto se ilustruje, jak se profily genových transkriptů mění se změnou buněčné funkce. Těm, co jsou zběhlí v oboru je známo, že biochemické složení buněk se také mění s jinými funkčními změnami, jako je rakovina, včetně různých stádií rakoviny, a vystavení toxickému působení. Odečtené (substrakční) profily genových transkriptů, jako ty, co jsou v Tabulce 3, jsou užitečné jako první nástroj výzkumu v takovýchto studiích genové exprese a bílkovin.
Příklad 8
Odčítací analýza cDNA knihoven buněk normálních monocytů a buněk aktivovaných makrofágů
Jakmile jsou cDNA data v počítači, použije se pro získání poměrů všech genových transkriptů těchto dvou knihoven, diskutovaných v Příkladu 7, počítačový program uvedený v Tabulce 5 a genové transkripty se uspořádají podle klesajících hodnot svých poměrů. Když některý genový transkrip není v jedné knihovně zastoupen, hojnost takovéhoto genového transkriptů není známa, ale zdá se být menší než 1. Jako přiblížení - a pro získání poměru, což by nebylo možné, pokud by se pro nezastoupený gen brala nulová hojnost - mají geny, jež jsou zastoupené pouze v jedné ze dvou knihoven, přiřazenou hojnost 1/2. Použití 1/2 pro nezastoupené klony zvyšuje relativní význam zapnutých a vypnutých genů, jejichž produkty by mohly být kandidáty pro léčebný zásah. Výsledný výtisk se nazývá odečtená (substrakční) tabulka a představuje mimořádně cennou vyhledávací metodu, jak ukazují následující data.
Tabulka 4 je odečtená tabulka, ve které byla knihovna normálních monocytů elektronicky odečtena od knihovny aktivovaných makrofágů. Tato tabulka nejefektivněji zdůrazňuje změny v hojnosti genových transkriptů při aktivaci makrofágů. Několik neznámých genových transkriptů existuje dokonce mezi transkripty seznamu. Elektronické nástroj, jenž pomůže výzkumníkům mnohem rychleji identifikovat základní biochemické změny u dvou typů buněk. Takovýto nástroj může v ranných stadiích objevných prací ušetřit drahocenný čas universitám a farmaceutickým společnostem, jež utrácejí miliardy dolarů na výzkum, a urychlit cyklus vývoje léků, což zase umožní výzkumníkům zakládat programy hodnocení léků mnohem dříve. Tento výzkumný nástroj tedy prvními odčítání dvaceti genovými je tedy užitečný je různých počet v aktivovaných poskytuje cestu, jak dát nové léky veřejnosti rychleji a hospodárněji.
Odečtená tabulka může také být získána k diagnóze pacienta. Vzorek od individuálního pacienta (jako jsou monocyty získané biopsí nebo vzorek krve) lze srovnat se zde poskytnutými daty k diagnóze stavu, spojeného s aktivací makrofágů.
Tabulka 4 odhalila mnoho nových transkriptů (označovaných jak Incyte klony). Je vidět, že mnohé geny jsou v aktivovaných makrofázích zapnuty (t.j. monocyty mají nulu ve sloupci bgfreq). Tato metoda prohledávání je lepší než jiné, jako western analýza, jež nemohou odkrýt takový genových transkriptů.
Prohledávací odčítací technika také odkryla makrofázích vysoký počet nádorových genových transkriptů (onkogeny rho, ETS2, rab-2 ras, onkogeny příbuzné YPT1 a mRÍíA akutní myeloidní leukémie). Tyto transkripty mohou být připsáňy použití imortalizovaných buněk a jsou z tohoto důvodu jako takoýé zajímavé. Tato prohledávací technika dává podrobný obraz nahoru regulovaných transkriptů, včetně onkogenů, což pomáhá vysvětlit, proč protinádorové léky ovlivňují s pacientovou imunitou, zprostředkovanou aktivovanými makrofágy. Vyzbrojeni znalostmi, získanými z této prohledávací metody, mohou ti, co jsou zběhlí v oboru, založit lépe cílené a efektivnější vyhledávací programy k identifikaci léků, které jsou diferenčně účinné proti 1) jak proti rakovině, tak proti podmínkám s aktivovanými makrofágy při témže profilu genových transkriptů, 2) samotné rakovině a 3) podmínkám s aktivovanými makrofágy.
Senescentní bílkovina hladkého svalu (22 kDa) byla v aktivovaných makrofázích regulována nahoru, což ukazuje, že je kandidátem pro blok při kontrole zánětů.
Příklad 9
Odčítací analýza normálních jaterních buněk a buněk jater inf ikovaných hepatitidou
V tomto příkladě jsou potkani vystaveni viru hepatitidy a udržováni v kolonii dokud nevykazují definitivní známky hepatitidy. Z potkanů s diagnostikovanou hepatitidou je jedna polovina léčena novým antihepatitickým činidlem (AHA). Ze všech potkanů se získají vzorky jater před vystavením hepatitickému viru a na konci působení AHA nebo bez jeho působení. Navíc mohou být jaterní vzorky získány těsně před léčbou AHA.
Jaterní tkáň se zpracuje jak je popsáno v Příkladech 2 a 3 k získání mRNA a následnému sekvenování cDNA. Tato cDNA z každého vzorku se analyzuje na hojnost počítačovým programem podle Tabulky 5. Výsledná zobrazení cDNA genových transkriptů poskytují podrobný obraz zvířat základního stavu (kontroly) a zvířat ve stavu infekce nebo léčby. cDNA ze skupin vzorků mohou být spojována do skupin sumárního profilu genových transkriptů pro všechny kontrolní vzorky, všechny vzorky infikovaných potkanů a všechny vzorky potkanů léčených AHA.
Odčítání se provádějí mezi patřičnými jednotlivými knihovnami a seskupenými knihovnami. U jednotlivých zvířat mohou být odečteny vzorky kontroly a vzorky po pokuse. Též: Pokud se vzorky získají před a po působením AHA, tato data mohou být odčítána pro jednotlivá zvířata a pro skupiny působení. Navíc mohou být data všech kontrolních vzorků dána dohromady a zprůměrována. Průměr kontrol může být odečten od průměru vzorků jak po pokuse s AHA, tak po pokuse bez AHA. Když jsou dostupné vzorky před léčbou a po ní, tyto vzorky mohou být srovnávány individuálně (nebo elektronicky zprůměrovány) a odečteny.
Tyto odečtené tabulky se použijí ve dvou obecných směrech. Za prvé: Analyzují se rozdíly mezi genovými transkripty, jež jsou spojeny s postupujícím poškozením jater nebo s hojením. Odečtené tabulky jsou nástrojem k osamostatnění výsledku působení léku z podkladu daného základní patologií hepatitidy. Protože hepatitida ovlivňuje mnohé parametry, další toxické působení na játra se těžko zjišťovalo pouhými krevními testy na obvyklé enzymy. Profil genových transkriptů a odčítání poskytují mnohem komplexnější biochemický obraz, jejž badatelé, potřebují u analýz takto složitých problémů.
Za druhé: Odečtené tabulky poskytují nástroj k identifikac klinických markérů, jednotlivých bílkovin nebo jiných biochemických determinant, jež hodnocení konečného klinického prostřednictvím léku, a dokonce se používají k předpovědi nebo bodu, jako je choroba, zlepšení další patologie způsobená lékem.
Odečtené tabulky specificky vystihují geny jež jsou zapínány a vypínány. Odečtené tabulky tedy poskytují první vyhodnocení kandidátů genových transkriptů pro využití jako klinické markéry. Následně elektronická odečtení knihoven dalších buněk a tkání odhalí, které z potenciálních markérů se skutečně najdou v knihovnách různých buněk a tkání. Kandidátní genové transkripty nalezené v dalších knihovnách se odstraní ze skupiny potenciálních klinických markérů. Potom se pro oprávnění výběru klinického markéru porovnají vzorky krve nebo jiné relevantní vzorky, u nichž se zná, zda jsou nebo nejsou v relevantním stavu. K tomu, aby se genový transkript kvalifikoval jako klinický markér, nemusí být při tomto způsobu stanovena konkrétní fyziologická funkce bílkoviny transkriptů.
Příklad 10
Elektronická northern analýza
Jedním z omezení elektronického odčítání je, že je těžké srovnávat najednou víc než jeden pár obrazů. Jakmile jsou produkty jednotlivých genů identifikovány jako relevantní pro další studium (prostřednictvím elektronického odčítání nebo jiným způsobem), stane se užitečným studovat expresi jednotlivých genů v řadě různých tkání. V laboratořích se pro tento účel používá technika hybridizace Northernových přenosů. U této techniky se označí jednotlivá cDNA, nebo jí odpovídající sonda, a hybridizuje se proti přenesenému materiálu, zahrnujícímu vzorky RNÁ připravené z řady tkání a buněčných typů. Po autoradiografii lzě ve všech zahrnutých vzorcích kvantifikovat obraz exprese tohoto konkrétního genu, vždy jen jednoho.
Další provedení tohoto vynálezu je naproti tomu komputerizovanou formou tohoto postupu a nazývá se zde elektronická northern zkoumá jednotlivý gen knihoven přítomných v analýza. U této varianty se na expresi proti řadě připravených a sekvenovaných databázi. Touto cestou se obraz exprese kteréhokoli jednotlivého kandidátního genu zjištuje okamžitě a bez námahy. Takto může být prohlíženo více kandidátních genů, což vede k častějším a plodnějším relevantním odhalením. Počítačový program zahrnutý jako Tabulka 5 obsahuje program pro provádění této funkce, a Tabulka 6 je částečný seznam vstupů databáze, jež byly použity v elektronická northern analýze.
Příklad 11
Fáze I klinických zkoušek
Na základě zjištěné bezpečnosti a účinnosti shora uvedených testů na zvířatech se podnikají klinické zkoušky fáze I. Normální pacienti se podrobují obvyklým předběžným klinickým laboratorním testům. Navíc se odebírají patřičné vzorky, jež se podrobují analýze genových transkriptů. Další vzorky se během zkoušek odebírají pacientům v předem stanovených intervalech. Tyto vzorky se podrobují analýze genových transkriptů, jak je popsáno shora. Navíc: Změny genových transkriptů, zaznamenané dříve u studie toxicity na potkanech, jsou u sledovaných pacientů pečlivě hodnoceny jako klinické markéry. Změny u analýz genových transkriptů se hodnotí jako ukazatele toxicity korelací ke klinickým známkám a symptomům a jiným laboratorním výsledkům. Navíc se provádí odčítání se vzorky jednotlivého pacienta a se zprůměrovanými vzorky pacientů. Odčítací analýza zvýrazňuje toxikologické změny u léčených pacientů. Jde o vysoce propracovanou determinantu toxicity. Odčítací metoda také uvádí klinické markéry. Odčítací analýzou lze také analyzovat další podskupiny, zahrnující například 1) segregaci podle výskytu a typu škodlivých účinků a 2) segregaci podle dávkování.
Příklad 12
- 37 Zobrazovací studiích analýza genových transkriptů v klinických
Zobrazovací analýza genových transkriptů (nebo mnohočethá zobrazovací analýza genových transkriptů) je užitečný nástroj v dalších klinických studiích. Určit lze například rozdíly zobrazovací analýzy genových transkriptů před a po léčbě u pacientů, jimž se podávalo placebo nebo lék. Tato metoda také umožňuje efektivně vybírat klinické markéry pro sledováni klinického použití léku.
Příklad 13
Mezidruhová srovnávací analýza genových transkriptů
Odčítací metodu lze použít k hodnocení cDNA z odlišných zdrojů. Například: Buňky stejného typu z rozdílných biologických druhů lze srovnávat analýzou genových transkriptů k vyhledávání specifických rozdílů, jaké jsou třeba u detoxifikačních enzymových systémů. Takovéto testování napomáhá ve výběru a opravňování zvířecího modelu pro komerční účel hodnocení léků nebo pro toxikologické zkoušky léků zamýšlených pro humánní použití nebo použití u zvířat. Když se srovnání mezi zvířaty různých druhů předvádějí ve sloupcích pro každý druh, odkazujeme na ně jako na mezidruhové srovnání nebo Zoo přenos.
Provedení tohoto vynálezu mohou používat databáze, jako jsou ty, co jsou zapsány v programovém jazyku FoxBASE, komerčhě dostupného od Microsoft Corporation. Další provedení vynálezu používají jiné databáze, jako je databáze náhodných peptidů, nebo oligonukleotidová databáze typu popsaného v U.S. patentu 5 270 170, vydaném 14. prosince 1993 Cullovi et al.; publikaci mezinárodní přihlášky PCT WO 9322684, vydané 11. listopadu 1993; publikaci mezinárodní přihlášky PCT WO 9306121, vydané 1. dubna 1993; nebo publikaci mezinárodní přihlášky PCT WO 9119818, vydané 26. prosince 1991. Tyto čtyři odkazy (jejichž text je zde zahrnut odkazem) obsahují poznatky, jež se mohou použít v implementaci takovýchto dalších provedení vynálezu.
Všechny odkazy, na něž se odkazuje v předešlém textu, jsou tímto zde výslovně zahrnuty odkazem.
Těm, co jsou zběhlí v oboru, budou zřejmé různé modifikace a variace popsaného způsobu a systému podle tohoto vynálezu bez odklonu od rozsahu a ducha vynálezu. I když vynález byl popsán ve spojitostech s výhodnými provedeními, musí se chápat, že vynález, jak je nárokován, nesmí být nevhodně omezován na tato konkrétní provedení.
TABULKA 1
Označení Rozdělení Lokalizace
(D) (F) (Z)
E = přesný C = nespecifické N 3 jaderná
H = homologní P = buněčně/tkáňově C 3 cytoplasma
0 = jiný druh specifické K = cytoskelet
N = žádná shoda U s neznámé E = povrch buňky
D = nekódující gen Z 3 vnitrobuněčná
U = nečitelný membrána
R 3 repetitivní DNA Druh M 3 mitochondrie
A = pouze póly A (S) S = secemovaný
V = pouze vektor U = neznámá
M = mitochondriální DNA H 3 člověk X 3 jiná
S 3 přeskok A = opice
I = shoda s Incyte klonem P = prase
X = shoda s EST D = pes V = bovinní Status
Knihovna B 3 králík (I)
(I*) R = potkan H = myš 0 3 žádný současný zájem
U = U937 S = křeček 1 = proved primární analýzu
H 3 HHC C 3 kuře 2 3 prim. analýza provedena
T = THP-1 F = obojživelníci 3 = sekvence plné délky
H 3 HUVEC I 3 bezobratlí 4 = sekundární analýza
S = slezina Z 3 prvoci 5 = tkáňový northern
L = plíce Y = buňky T i B A - adenoid G = houby 6 3 získej plnou délku
Funkce (R)
T = translace
L - zpracování bílkovin R = ribosomální bílkovina 0 = onkogen
G 3 GTP vážící bílk.
V = virový element
Y = kinasa/fosfatasa
A = svázán s nádorovým antigenem
I - vazebná bílkovina
D = NA vážící/tránskripce B = buněčný povrch/ receptor C = Ca++ vážící bílk.
S = ligandy/efektory
N = bílkovina odezvy na stres E = enzymy
F = ferroprotein P = proteasa/inhibitor Z = oxidativní fosforyláce Q 3 cukerný metabolismus M = metabol. aminokyselin N = metabol. nukl. kyselin W = lipidový metabolismus K = strukturní X = jiný U = neznámý
TABULKA 2
Počet klonů 15 000 až 20 000 Knihovny: HUVEC Uspořádáno podle hojnosti Celkové analyzováno klonů: 5 000 319 genů pro celkem 1 713 klonů
číslo N c vstup a popiska
1 15365 67 HSRPL41 Riboptn L41
2 15004 65 NCY015004 INCYTE 015004
3 1563§. 63 NCY015638 INCYTE 015638
4 15390 50 NCY015390 INCYTE 015390
5 15193 47 HSFIB1 Fibronectin
6 15220 47 RRRPL9 R Riboptn L9
7 15280 47 NCY015280 INCYTE 015280
8 15583 33 M62060 EST HHCH09 (IGR)
9 15662 31 HSACTCGR Actin, gamroa .
10 15026 29 NCY015026 INCYTE 015026
11 15279 24 HSEF1AR Elf 1-alpha
12 15027 23 NCY015027 INCYTE 015027
13 15033 20 NCY015033 INCYTE 015033
14 15198 20 NCY015198 INCYTE 015198
15 15809 20 HSCOLL1 Collagenase
16 15221 19 NCY015221 INCYTE 015221
17 15263 19 NCY015263 INCYTE 015263
13 15290 19 NCY015290 INCYTE 015290
19 15350 18 NCY015350 INCYTE 015350
20 15030 17 NCY015030 INCYTE 015030
21 15234 17 NCY015234 INCYTE 015234
22 15459 16 NCY015459 INCYTE 015459
23 15353 15 NCY015353 INCYTE 015353
24 15378 15 S76965 Ptn kinase inhib
25 15255 14 HUMTHYB4 Thymosin beta-4
26 15401 14 HSLIPCR Lipocortin I
27 15425 ' 14 HSPOLYAB Poly-A bp
28 18212 14 HUMTHYMA Thymosin, alpha
29 18216 14 HSMRP1 Motility relat ptn; MRP·
30 15189 13 HS18D Interferon induc ptn 1-
31 15031 12 HUMFKBP FK506 bp
32 15306 12 HSH2AZ - Histone H2A
33 15621 12 _HUMLEC Lectin, B-galbp, 14kDa
34 15789 11 NCY015789 INCYTE 015789
35 16578 11 HSRPS11 Riboptn Sil
36 16632 11 M61984 EST HHCA13 (IGR)
37 18314 11 NCY018314 INCYTE 018314
38 15367 10 NCY015367 INCYTE 015367
39 15415 10 HSIFNIN1 interferon induc mRNA
40 15633 10 HSLDHAR Lactate dehydrogenase
41 15813 10 CHKNMHCB C Myosin heavy Chain B
42 18210 10 NCY018210 INCYTE 018210
43 18233 10 HSRPII140 RNA polymerase II
44 18996 10 NCY018996 INCYTE 018996
45 15088 9 HUMFERL Ferritin, light chain
46 15714 9 NCY015714 INCYTE 015714
47 15720 9 NCY015720 INCYTE 015720
48 15863 9 NCY015863 INCYTE 015863
49 16121 9 HSET Endothelin
50 18252 9 ' NCY018252 INCYTE 018252 -
51 15351 8 HUMALBP Lipid bp, adipocyte
52 15370 8 NCY015370 INCYTE 015370
TABULKA 2, pokr.
číslo N C vstup a popiska
53 15670 8 BTCZASKI v NADH-ubiq oxidoreductase
54 15795 8 NCY015795 INCYTE 015795
55 16245 8 NCY016245 INCYTE 016245
56 18262 8 NCY018262 INCYTE 018262
57 18321 8 HSRPL17 Riboptn LI7
58 15126 t 7 XLRPL1BRF Riboptn LI
59 15133 7 HSAC07 Actin; beta
60 15245 7 NCY015245 INCYTE 015245
61 15288 7 NCY015288 INCYTE 015288
62 15294 7 HSGAPDR G-3-PD
63 15442 7 HUMLAMB Laminin receptor, 54kDa
64 15485 7 HSNGMRNA Uráčil DNA glycoeylase
65 16646 7 NCY016646 INCYTE 016646
66 18003 7 HUMPAIA Plsmnogen activ gene
67 15032 6 HUMUB Ubiquitin
68 15267 6 HSRPS8 Riboptn S8
69 15295 6 NCY015295 INCYTE 015295
70 15458 6 RNRPS10R R Riboptn S10
71 15832 6 RSGALEM R UDP-gaiactose epimerase
72 15928 6 HUMAPOJ Apolipoptn J
73 16598 6 HUMTBBM40 Tubulin, beta
74 18218 6 NCY018218 INCYTE 018218
75 18499 6 HSP27 Hydrophobic ptn p27
76 18963 6 NCY018963 INCYTE 018963
77 18997 6 NCY018997 INCYTE 018997
78 15432 5 HSAGALAR Galactcsidase Á, alpba
79 15475 5 NCY015475 INCYTE 015475
80 15721 5 NCY015721 INCYTE 015721
81 15865 5 NCY015865 INCYTE 015865
82 16270 5 NCY016270 INCYTE 016270
83 16886 5 NCY016886 INCYTE 016886
84 18500 5 NCY018500 INCYTE 018500
85 18503 5 NCY018S03 INCYTE 018503
86 19672 5 RRRPL34 R Riboptn L34
87 15086 4 XLRPL1AR F Riboptn Lla
88 15113 4 HUKIFNWRS tRNA synthetase, trp
89 15242 4 NCY01S242 INCYTE 015242
90 15249 4 NCY015249 INCYTE 015249
91 15377 4 NCY015377 INCYTE 015377
92 15407 4 NCY015407 INCYTE 015407
93 15473 4 NCY015473 INCYTE 015473
94 15588 4 HSRPS12 Riboptn S12
95 15684 4 HSEF1G Elf 1-ganuna
96 15782 ~ 4 NCY015782 INCYTE 015782
97 15916 4 HSRPS18 Riboptn S18
98 15930 4 NCY015930 INCYTE 015930
99 16108 4 NCY016108 INCYTE 016108
100 16133 4 NCY016133 INCYTE 016133
TABULKA 3
Normální monocyty versus aktivované makrofágy
Prvních 15 nejhojnějších genů normální
Elongační faktor-I alfa
Ribosomální fosfoprotein
Homolog S8 ribosomální bílkoviny
Beta globin
H řetězec feritinu
Ribosomální bílkovina L7
Nukleoplasmin
Homolog S20 ribosomální bílkoviny
Transferinový receptor
Póly A vážící bílkovina
Translačně kontrolovaná nádorová bílk.
Ribosomální bílkovina S25
Signální rozeznávací částice SRP9
Histon H2A.Z
Ribosomální bílkovina Ke-3 aktivované
Interleukin-I beta
Makrofágový zánětový protein-I Interleukin 8 Gen aktivace lymfocytů Elongační faktor-I alfa Beta aktin
Specifický protein Rantes B-buněk Póly A vážící bílkovina Osteopontin; nefropontin Faktor nekrosy nádorů alfa INCYTE klon 011050 Cu/Zn superoxid dismutasa Adenylát cyklasa (kvasink. homolog) NGF-příbuzná molekula aktivace B-buněk Proteasa Nexin-1, odvozená z glií
TABULKA 4
Knihovny: THP-1
Odčítání: HMC
Uspořádáno podle hojnosti Celkově analyzováno klonů: 7 375
057 genů pro celkově 2 151 klonů
číslo vstup s popiska bgref rfend podíl
10022 HUMIL1 ' IL 1-beta 0 131 262.00
10036 KSMDNCF IL-8 0 119 238.00
10089 KSLAG1CDN Lymphoeyte aer i v gene 0 71 142.00
10060 HUMTCSM RANTBS 0 23 46.000
10003 HUMMIP1A MXP-1 3 121 40.333
10689 KSOP Osteooontin 0 20 40.000
11050 NCY011050 INCYTE 011050 0 17 34.000
10937 KSTNFR TNF-alpha 0 17 34.000
10176 KSSOD Superoxide dismutase 0 14 28.000
10886 HSCDW40 B-cell activ,NGF-relat c 10 20.000
10186 HUMAPR Early resp PMA-induc 0 9 18.000
10967 HUMGDN PN-1, glial-deriv 0 9 18.000
11353 NCY011353 INCYTE 011353 0 8 16.000
10298 NCY010298 INCYTE 010298 0 7 14.000
10215 HUM4COLA Collagenase, type IV 0 6 12.000
10276 NCY010276 INCYTE 010276 0 6 12.000
10488 NCY010488 INCYTE 010488 0 6 12.000
11138 NCY011138 INCYTE 011138 0 6 12.000
10037 HUMCAPPRO Adenylate cyclase 1 10 10.000
10840 HUMADCY Adenylate cyclase 0 5 10.000
10672 HSCD44E Cell adhesion glptn 0 5 10.000
12837 KUMCYCLOX Cvclooxygenase-2 0 5 10.000
10001 NCY010001 INCYTB 010001 0 5 10.000
10005 NCY010005 INCYTB 010005 ' 0 5 10.000 ·
10294- NCY010294 INCYTB 010294 0 5 10.000
10297 NCY010297 INCYTB 010297 0 5 10.000
10403 NCY010403 INCYTB 010403 0 5 10.000
10699 NCY010699 INCYTB 010699 0 5 10.000
10966 NCY010966 INCYTB 010966 0 5 10.000
12092 NCY012092 INCYTE 012092 0 5 10.000
12549 KSRHOB Oncogene rho 0 5 10.000
10691 HUMARF1BA ADP-ribosylation fctr 0 4 8.000
12106 HSADSS Adenylosuccinate synthetase 0 4 8.000
10194 HSCATHL Cathepain L 0 4 8.000
10479 CLMCYCA I Cyclin A 0 4 8.000
10031 NCY010031 INCYTE 010031 0 4 8.000
10203 NCY010203 -INCYTE 010203 0 4 8.000
10288 NCY010288 INCYTE 010288 0 4 8.000
10372 NCY010372 INCYTE 010372 0 4 · 8.000
10471 NCY010471 INCYTE 010471 0 4 8.000
10484 NCY010484 INCYTE 010484 0 4 8.000
10859 NCY010859 INCYTB 010859 0 4 8.000
10890 NCY010890 INCYTE 010890 σ 4 8.006
11511 NCY011511 INCYTE 011511 0 4 8.000
11868 NCY011868 INCYTE 011868 0 4 8.000
12820 NCY012820 INCYTE 012820 0 4 8.000
10133 HSI1RAP IL-1 antagonist 0 4 8.000
10516 HUMP2A Phosphatase, regul 2A 0 4 8.000 -
11063 HUMB94 TNF-induc response 0 4 8.000
11140 HSHB15RNA HB15 gene; new Ig 0 3 6.000
10788 NCY001713 INCYTE 001713 0 3 6.000
10033 NCY010033 INCYTE 010033 0 3 6.000
10035 NCY010035 INCYTE 010035 . 0 3 6.000
10084 NCY010084 'INCYTE 010084 0 3 6.ΘΘΘ
10236 NCY010236 INCYTE 010236 0 3 6.000
10383 NCY010383 INCYTE 010383 0 3 6.000
TABULKA 4, pokr.
číslo vstup s popiska bgref rfend podíl
10450 NCY010450 INCYTE 010450............ o 3 ' έϊοοο
10470 NCY010470 INCYTE 010470 0 3 6.000
10504 NCY010504 INCYTE 010504 0 3 6.000,.
10507 NCY010507 INCYTE 010507 0 3 6.000’
10598 NCY010598 INCYTE 010598 0 3 6.000
10779 NCY010779 INCYTE 010779 0 3 6.000'
10909 NCY010909 INCYTE 010909 0 3 6.000
10976 NCY010976 INCYTE 010976 0 3 6.000
10985 NCY010985 INCYTE 010985 0 3 6.000
11052 NCY011052 INCYTE 011052 0 3 6.000
11068 NCY011068 INCYTE 011068 0 3 6.000
11134 NCY011134 INCYTE 011134 0 3 6.000
11136 NCY011136 INCYTE 011136 0 3 6.000
11191 NCY011191 INCYTE 011191 0 3 6.000
11219 NCY011219 INCYTE 011219 0 3 6.000
11386 NCY011386 INCYTE 011386 0 3 6.000
11403 NCY011403 INCYTE 011403 0 3 6.000
11460 NCY011460 INCYTE 011460 0 3 6.000
11618 NCY011618 INCYTE 011618 0 3 6.000
11686 NCY011686 INCYTE 011686 0 3 6.000
12021 NCY012021 INCYTE 012021 0 3 6.000
12025 NCY012025 INCYTE 012025 0 3 6.000
12320 NCY012320 INCYTE 012320 0 3 6.000
12330 NCY012330 INCYTE 012330 0 3 6.000
-12853 NCY012853 INCYTE 012853· 0 3 6.000 ·
14386 NCY014386 INCYTE 014386 0 3 6.000
14391 NCY014391 INCYTE 014391 0 3 6.000
TABULKA 5 • Master menu. ias SB3TRACT3CN oqtput asi ΌΛΧ OF?
SST SAFETY OFF SET ESOkSF CN
SBT TYPSAH2AD TO 0 .
CLEAR · _
SST DEVICE TO SCREEN
USE-'3martGuy:PoxBAS3+/MaCifex £iles:Clonec.ab£
CO TOP '
SWRS NOKBER TO XNXTIMS CO BOTKK
STORS KOMBER T0'TE3UQ3OTE stors ' ' to Targeti
STORS 1 ' TO Tárg«t2
STORS ' 1 TO Targ«t3
STORS.' 1 TO ObJteti
STORS 1 ' TO Object2
STORS ' 1 TO Ctoject3
STORS 0 TO ANAL ' stors o to naros STORS 0 TO HMATCH STORS 0 TO CKKTOl STORS 0 TO XMATQi STORS 0 TO FTT gXORS 1 TO 8AXL DO WH1LE .T.
• Trojná. i -Subcractioa 2. fot ••Dáte......10/11/94 ... · • Versi», i FoxBASE+-/Kac, revicioá 1.10 • Kotec....: Požrat filé Subtraeťioa 2 ·*.*’·
SCKZST 1 TYFS 0 KEADING 'Sereea 1* AT 40,2 EXZS 286,492 FXXELS PONT 'Geaeva',9 COLOR 0,0,0, β FXXELS 75,120 TO 178,241 STYLS 3871 COLOR 0,0,-1,24610,-1,8947
FXXELS 27,154 SAY 'Subtraction Menu* STYLE 65536 FONT 'Ceaeva',274 COLOR 0,0,-1^-1,-1,-1 6 FXXELS. 117,126 GET ŠftTCH STYLE 65536.FONT 'Chicago’; 12 FXCOTR2 δ*Ο Exact * SIZS IS) 62'CO
8‘FXXELS 135,.126 GST JBATCK STYLE 65536 FONT 'Chicago',12 .FICTOSB *β·Ο flonologouc·· SXZS 15,1
FXXELS 153,126 GST CHATCE STYLE 65536 FONT 'Chicago*,12 FXCTORE ’ř'C Otber cpe· SXZS 15,84 β FXXELS 90,152 SKY 'Kateheat*. STYLE 65536 FONT •Geaeva',12 COLOR 0,0,rl,-l,-1,-1 .
FXXELS 171,126 GST Xa&teh STYLE 65536 FONT 'Chicago»,13 FXGTORB *«'C Xaeyte’ SXZS -15,65 CO β FXXELS 252,137 GST iňitiate STYLE 0 FONT 'Oeaeva',12 SXZS 15,70 COEOR 0,0,-1,-1,-1,-1
FXXELS 252,236 GET tenninate STYLE 0 FONT 'Geaeva',12 SXZS 15,70 COIXJR 0,0,-1,-1,-1,-1 β PIXZLS 252,35 SKt 'Xaelude dotec·* STYLE 65536 FONT 'Gencva',12 COLOR 0,0,-1,-1,-1,-1 8 FXJELS· 252,215 BXl STYLE'65536 FONT 'Geaeva',14 COLOR 0,0,-1,-1,-1,-1 '8 FXXELS -198,126 GET FTP 6TYX£ 65536 FONT 'Chicago·,12 FXCTORE 'e«C.Fsiat to filé* SXZS 15',S 8‘FXXELS 90,9 TO 181rM9 STYXÉ 3871 COLOR 0,0,-1,-25600,-1,-1 8 FXXELS 90,288 TO*181,397 STYLE 3871 COLOR 0,0,-1,-25600,-1,-1
FXXELS 81,296 SKI 'Backgrcuai:' 6TYLE 65536 FONT 'Gen<va',270 COLOR 0,0,-1.-1,-1,-1.
PIXELS 45,135 GET ANAL STYLE 65536 FCNT 'Chicago*,12 PXCTORE '8'R OvwallíFuoctich· OT 4 8 IXffiLS 81,26 SUT 'Targeti* STYLE 65536 FORT 'Gnnevt’,270 COLOR 0,0,-1,-1,-1,-1
FXXELS 108,20 GET targetl STYLE OTONT 'Gesěva-,9 SXZS 12,79 COLOR 0,0,-1,-1,-1,-1
FXXELS 135,30 GST tazget2 STYLS 0 FOíT 'Ccnevt',9 SXZS 12,79 G0L0R 0,0,-1,-1,-1,-1 .8 FXXELS 162,20 GET target3 STYLE 0 FCNT *0«a«Vt*,9 SXZZ 12,79 COLOR 0,0,-1,-1,-1,-1
FXXELS 108,*299 GET Cbjeetl STYLE 0 FONT »Geo«va«,9 SXZS 12.79-COLOR 0,0,-1,-1,-1,-1
FXXZLB 135,399 GST obj*et2 STYLS O.FCNT 'Ceaeva',9 8XZZ 12,79 COLOR 0,0,-1,-1,-1,-1
FXXELS 162,299 GET object3 STYLE 0 FONT 'Geseva',9 SXZS 12,78 COLOR 0,0,-1,-1-,-1,-1 '8 FXXELS 276,324’GET Bail STYLS 65536 FONT 'Chicago, 12 FXCTORE «8*R RisuSail ouf SXZS 4112 •
• SOF: 6ubtraet±aa.2.£mt KEAD ·
XF Bail«2 CLEAR
CLOSS DATMASSS
OSS 'anartGiv»FoxBASS+/Naei£ox filectdotec.dbf .SET 8AFEIT ON SCREEN. 1 OFF RSTORN
ENDXF
STOXS VAL(5YS(2>) TO STARTDffi
STORE UPPEJWargetll TO Target!
STORE. UPPER.(Target2) TO Targ«t2
STORE UPPER{Targei3) TO Target3.
STOPE UPPER. (Objectl) TO Objectl
STORE UPPER(Object2) TO-Object2
STORE UPPER(Objěct3) TO Object3 eléar
SET TALK ON
GAP e TERMXNAra-INXTXATB+l go ηατίλΐΕ copy NEOT GAP FXEDDS NUM3SR, lÍteasy,D,F,Z,R, ENISY.S.DESCRXPTOR,START,RPSTO.I TO USE TStENUM COOOT TO TOT
COPY TO TEMPRED POR D-'B' .OR.D-Ό' .OR.D-Ή' .OR.D» Ή1 .OR.D·'!··
OSE TEMPRED
TEMPNUM..
X? íinatChiO .AND. Kraátch-O .AND. Omatdh-0 .AND. XMATCR-Ó
COPY TO TEMPDESXG
ELSE
COPY STROCTORE TO TEÍPOESXG
USE TEMPDESXG XT Baatch-1
APPEND FROK TOONUM POR D»'S’
ESDI?
X7'»weeh«l
APPEND PROM TEMPNDM POR D-’K'
ENDIP
XP Čnatchxl
APPEND FRČK TEMPNUM POR D-‘O'
ENDXF
XP 2aatch«l
APPEND FROK TEMPNUM POR D»’T'.OR.D-’X'
•.OR.D-'Ν' .smír endxp
CODNT TO STARTOT
COPY STRtXTORE TO HMPDXB ··-····
USE TEHPDIB ... -«iAPPEND PROM tempdesxg FOR library-UPPBR(targetl) -' ^·
IP targetSo' . * -t-’·”
APPEND frqh TEMPDESIO FOR library»U?PSR(tnrget2) d:
- ENDIP ' '
XF cargetSo· . - 1 ·
APPEND FROK. TEMPDESXG FOR lihraxy-UPPBR(target3)
ENDXF
COOOT TO anaiziot' _ USE TEMPDESXG
COPY STRUCtURE TO TEKPSUB
USB TEMPSUB
APPEND FROK TEMPDESXG FOR llbraxy-UPPER(Objectl)
XP target2o'
APPEND FRCM TEMPDESXG POR.libraxy-UFPER(Cbject2)
ENDXF ·' _
XF target3o' •APPEND PROM TEMPDESXG FOR lÍbrary»UPPER{Cbject3)
ENDXF '
COOOT TO 60BSRACT0T
EST TALK OFF «*«»····——··**·*·♦*·***·♦·♦♦*·♦**♦♦««····****♦<·♦··*·········»*»···»·»···—··«···«*♦**♦«·« * COMPRZSSXCN SUBROOTXNE A ' ? 'CCMPRBSSXSW QUERS tXBRARY'
USE TEOLXB
SORT CWRNIW.OTMBER TO LX2S0RT
USB U2SQRP
COUOT TO ZDGBS
RSPLACS AUj RFEJTO WITH 1
MARXI «X
SW3«0
WKXLB SW3.0 Rdi
IP MARK1 >c ZDGENB
PACK
COCNT TO ADMZQQB •SW2.1
MOP
ENDXF GO mapki WP ’ 1
STORB ΕΝΓΡΪ TO TĚSTA STOPE O TO DSSXGA ·
SM - O '00 HKXLE SM-0 TEST SKIP
STORZ ZNTRf TO TESTB STOPE O TO DSSZGB
X7 TĚSTA > TESTB. AMD. OSSZGAbQESIGB oedbts
DUP DOP+l
LOOP
ENDXF GO KARKl
RZPIACZ RPENO WXTS COP MARXI b MARXX+DU? ’·
SWsl
LOOP
SHODO. TEST LOOP
DIODO RXCf.
SORT <27 RFEND/DiHUMBER TO TEWÍARSORT.
USB TEKPTARSORT *RBELACZ ACi START KXTH ΗΡΒΟ/ΧΚΕΝΕΊΟΟΟΟ '
COCW? TO TEKFEARCO ···-- **************** ***************************************·*·· ýfcfciřfc * CCMPRĚSSXOH SUBROUIBS s ? ’CaORSSSB& TARGET LXBRABY'
USE TEKPSUE SORT ON ΒΠΚΪ,ΜΠΗΒΕΒ TO*SUBSORT
OSC SUBSORT
COQNT TO SUSGEHE
RSPLACS Ali R7SHD WXS3 1
MARXI « 1 - '
SW2-0 •DO TO2 8Ν3·0 Rdi _
ZF MARKL > SUBGENS
PACK
COUNT TO 8MXQBB
SW«1
LOOP
XNDXP GO MARXI DUP - 1 _
STORB. ENTW TO TE9SA
STORB D TO DSSXGA sw o
DO WHlia SWbO TEST _ .·
SKIP
STOPE BOTO TO. TESTB
STORB D TO DESIGB
XT TĚSTA TESTB.AMD.DBSZGAsDBSBSB
DXLXTE ~-an > dot+1 LOOP _
2ZB3XF
GO'MARXI
RS7IACB RPEND WXTH DUP MARXI · MARX1+DCP SWbl
LOOP
EKDOO TEST LOOP :
ENDDO ROLL
SORT CM RF3MD/D.MDMSER TO TZKPSUBSOR?
.-OSE TEMP5UBS0KT ♦WSPLACS ALL START WXTH RFEND/XDSDIE*10000 OOCNT TO TSCPSOBCO »****·♦»***»··»»»·»·»»».·»».♦*’·**·****»**♦************······♦»*»·«*♦*♦♦****·«*»»«»«»»»**>·** ♦FUSION ROUT3NE ? 'SUBTRACTXKG LX3RARXES'
USE SOBTRACTXCN
COPY STRUCTOR2 TO CKJMCH2R
SStSCT 3
OSE TSÍPSOBSORT S2LECT 1·
USB CRDNCKER
ΑΡΣΟΟ PROM TEMPTARSORT
CÓUNT TO BULOU?
MARX e 0 DO WELS
SSXÁBST X ·
KAHX « ΜΆΚΚ+1 IP MÁSX>BAXLCOT SXXT ENDI?
<30 tftRX
STORE'ENTKY TO SCANNER
SELSCT 2
LOCATE. POR EOTKYaSCAÍWER
X? FOUNDO
STORE RTHO TO BITI
STORE KTCND TO BXT2
JJSB ·
STORE 1/2 TO BITI
STORE O TO ΒΓΓ2
BOXF
SXUSCT 1
RXPLACE BGFRBQ WXTSi BXT2 ~
RBPLACE ACTUAL HXTH BXTX
LOOP
ENCCO
SEUBOX1 1
R2PLACS ALL RATXO MTÍH REEND/ACTUAL 'DOXNQ FINÁL SORT BY RATXO'
SORT CM RATXO/SrBSFR8Q/D,OESCRI?TQR. TO FXHAL
XJSS FIKAL “ ·<·*·»··«··♦<«*♦<**#·«»·****«**♦·······*»·*»»***♦**'*»»******·»»*·»·«·*»*·*»«*'*·****«»*♦«*«**· eb b*ík ctí DO CASE.
CASE PTFa0‘ ’
SET DEVICE TO PRXNT — .
SET PRXNT CW
E3BCT ···· čase Trrai
SET ALTERMATZ TO ‘Adenoid .Patent Figures: Stístxacfciaa.txt·
SET ALTERNATS CN ZNSCASE
STORE VAL (SYS (2) )to FZNTJME if Π2<τζχε«9ΐ!λΐπ3ΐα STCR2 FXNTSffi+86400 TO ·?ZHIDS samy
STORE FINTÍME ** ΕΤΜΠΏίΕ.ΤΟ COMPSEC
STORE CCMPSEC/SO TO COKBON
ΕΕΓ MARGIN TO 10
61,1 EAZ ‘Lihrary Subtxácfcion Aaalyaii* STYLE 65536 PONT *Geneva’,274 0,0,0,-1,-1,7
Ί <Sate() ?? ' · '
7? tseo 'Cloně nuabess 1 ?7:-STR(ZKITZA,TS, 5,0) .7? through ' ·
7? STR(TERXXNATS,6,0) ? 'Lihrarieei '
Targetl
I? Tasget3o'
7? Target!
ENDZT
IP Target3o'
7? ' ·
7? Target3
ESDI?
'Suhtraecisgr:
Objeetl
IP-G&jestSo1 ??··',·'
7? Objeet2
DOIP
ZF CtojectSo' ·
7? Cbjectl
SOI? .
'Designaticnar
ZF Bsatcfa«0 .AND. ttnateb«0 .AND, Cnateh«0' .AND. IKATCKbO ?? ’A11*
DOIP ..
ZP Enatchal ?? ’&eaet,' endzp
ZF Oaacehsl 'Xonaa, * man- ,
ZP OMtebal
7? Other ap.’ aozp '
ZP Zsateb·!
'XNCSTE'
BOX?
ZP ANALbí *8orted hy AKJNDWCE'·
BUF· — ZP AKAL«2 'Arsaaged ty POWCTXCK'
DfflZP 'Totil elones representedi *
STRWOT,5,0) 'Total -olcnea «n&lyšed: ' ?? fiTRÍSTARTOT,5,0) 'Total. ccnputation. fcime:
??· STRfCCKPHXN,5,2) “ 1 ainutea* ' ‘
?'d deiignaticn £ distribution < e ločaticn. z « funetion species i «= ia*e
SCREEN 1 TYPE 0 HEADXNG ‘Screen 1* AT 40,2 ŠXZ2 285,492 PXXELS FONT 'Geneva',9 COLOR 0.0.0 DO CASE . ·
CASE ANAL-1 77 STR{AONIQUE,4,0) '7? 1 genes, for & total o£ 1 ·
7? STR(ANALK!T,.4,0) ' ?? ' člene»' . · .
SCREEN 1 TYPE 0 HEMXDO ’Scrt«a 1' AT 40,2 SXZS 286,492 PXXELS FOOT 'Geneva',7 COLOR 0,0,0, lise OPT fields nunber,D,F,Z,RjENIKY,S,DESCRX?T0R,BGFR2Q,KFHXD,RATI0,I SET PRXOTCFF'
CLOSE DATMASBS . '
USE '£rartGuy:Fcx3ASE+/Mac:£ax fil es i dones, dbf'
CASE.ANAL-2 * erranga/funetion
SET FRXNTCN
SET EZADEOG «ί
SCREEN 1 TYPE. 0 HEADXN3 'Screen 1* AT 40,2 SXZS 286,492 PXXSL9 'FONT 'Helvetica',268 COLOR 0 7 · > SINDXNG FROTSXHS'
SCREEN'1 TYPE 0 HBADXN3 'Screen 1.'AT 40,2 SXZS 286,492 PXXELS 7 1 surface nolecules sad receptore i1
SCREEN 1 TYPE 0 HEADXNG 'Screen 1* AT 40,2 SXZS 286,492 PXXELS list OFF fields nuinbeE,D,'F,'Z,R,ENTRY,S,EESCRX?T0R,BGFR3Q,RFEND,RATX0,X FOR R«’B
PQOT Helvetica·,265 COLOR 0 BWT ·α«ηβνκ·,7 COLOR 0,0,0, • » ’ « SCREEN -1 TYPE 0 HEADXNG 'Screen 1’ ’λΤ 40,2 GIZE 286,4.92 PXXELS .PONT .'Helvetica·,265 CODOR 0 7 'Calciua-binding proteinsi'
SCREEN 1 TYPE 0 EEADING 'Screen 1' AT 40,2'SIZE 286,492 PXXELS FONT 'Geneva',7 COLOR 0,0,0, list GFF fields nunt>er,D,F,Z,R,ENrRY,S,DESCŘIPTOR,BGFREQ,RrEND,RATXO,X FOR Rs'C'
SCREEN* 1 TYPE 0 HEADXNG 'Screen 1' AT 40,2 SXZS 286,492 PXXELS FONT 'Helvetica',265 COLOR 0 7 'Liganda-and effactors:!
SCREEN 1 TYFE 0 HEADXNG 'Screen 1' AT 40,2 SXZS 286,492 PXXELS FONT 'Geneva',7 COLOR 0,0,0, list OFF fields auaíber,D,,F,Z,R,ENraY,S,DESCRXPTQR,BGFREQ,RrKNDjRATXO,X FOR R«'S'
SCREEN 1 TYPE 0 HEADXNG 'Screen 1* AT 40,2 SXZS 286,492 PXXELS FONT 'Helvetica* ,265 COLOR 0 7 'jOther binding proteine:'
SCREEN 1 TYPE -0 HEADXNG 'Screen 1* AT'40,2 SXZS 286,492 PXX2LS FONT 'Geneva‘,7 COLOR 0,0,0, lise OFF fields'nuober,D,F,Z,R,ENnCf,S,DESCRXPTOR,B3FRSQ,RřBO,RATXO,X FOR R='X' *
SCS22N 1 TYPE 0 HEADXNG 'Screen 1' AT 40,2 SXZS 286,492 -PIXEL5 FONT 'Helvetica',268 COLOR 0 ? r . . CrJCOGHOZS' .·.·.SCREEN 1 TYPE 0 HEADXNG 'Screen 1* AT 40,2 SXZS 286,492 PXXEL9 FONT 'Helvetica',265 COLOR 0 7 'Generel cncogeneei',,
SCSSBBH 1 TYPE 0, HEADXNG *· Screen 1* AT .40,2 SXZS 286,492 PXXELS • FOTT 'Geneva‘,7 COLOR 0,0,0, list OFF fields’nuaber,D»F,Z,R,EOTRY,S,DESCRIPTOR,BGFREQ,RFB©,RATIO,X FOR R»'O' • · ’
SCREEN 1 TYPE 0 HEADXNG 'Screen 1* AT 40.2 SXZS 286,492 PXXELS FONT 'Helvetica',265 COLOR 0 7 ‘GTP-biading protein»:'
SCREEN 1 TYPE 0 HEADXNG 'Screen 1' AT 40,2 SXZS 286,492 PXXELS FONT 'Geneva',7 COLOR 0,0,0, list GFT fields nuraber,D,?,Z,R,B7XKY,S,DesCRXFTOR,B3FREQ,RFSND,RATXO,X FOR R*'G*
SCREEN 1 TYPE O H3ADXR3 'Scraei 1* AT 10,2 SXZE 386,192 FXXELS FONT ‘Helvetiea‘,265 COUR 0 7 'Viral «lenentsi' D -i '<ie
SCREEN 1 TYJE 0 B5ABXN3 ‘Sereen 1· AT. 40,2 SXZE 386,492 FXXELS FCNT ·&&&&,·} c5tt3R070,0, lise QSV fields nufflber,D,_F,Z,R,ERrRY,S,DESCRIPTOR(BGFREQ,XFEND,RATIO,X JOR R*'V'
SCREEN 1 TYFE O HEADXNG ‘Sereen 1' AT 40,2 SXZE 286’, 192 FXXELS FORT 'Kelvetica,2S5 COLOR o 1- 'Xinases and Phoaphataeaaj' · .
SCREEN 1 TYFE 0 'HEADXNG 'Screea 1* AT 10,2 SXZE 386,492 FXXELS FORT ‘Geneva‘,7 COLOR 0,0,0, liSC OFF.fields nusÚ9er,D,F,Z,R,ENTEY,S,nBSCRXFTOR,BGFRBQ,RFEND,RATXO,I FOR Rm'Y''
SCREEN 1-TYFE 0 KEADXN5 ‘Sereen 1« AT 40,2 SXZE 286,492 FXXELS FCNT 'Hélvetica·,265 COLOR 0 ? 'Turor-related aátiganai1
SCREEN 1 TYPE 0 HEADXNG .‘Sereen 1* AT 10,2 SXZE 286,492 FXXELS PONT *Ganev&*,7 COLOR 0,0,0, lise OFP'fields nuaber,D,F,Z,R,ENTRY,S»DESCRXPTOR,8GFREQ,RFa©,RATXO, X FOR R«'A'
7.
SCRSai i TYFE O HEADH» ‘Screea l* AT 40,2 SXZE 286,492 P33BLS FONT *belwbica*,268 COLOR o 7 · ' PROTEIN SYRXHBTXC HACHXMERY· FROTEINS!
? · .
SCREEN 1 TYFE 0 HEADXN3 ‘Sereen 1* AT 40,2 SXZE 286.492 FXXELS FORT ‘Helvettica',265 COLOR 0 ? 'Tranacriptioa and NUeleic Aeid-binding proteine i *
SCREEN 1 TYPE 0 KEADXNS Sereen 1' AT 10,2 SXZE 286,492 PXXELS FONT ‘Geneva‘,7 COLOR 0,0,0, lise OFF fields nuDber,D,F,Z,R,ENTRY,S,DESC2aPTOR,S(3RBQ;RFIND,FATXO,X FOR R«'O'
SCREEN 1 TYFE 0 HEADXNG ‘Sereen 1* AT 40,2 SXZE 286,492 FXXELS FORT ‘Hélvetica·,265 COUR.0 7 'Traaslaeien:' -
SCREEN 1 TYFE 0 HEADXNG ‘Sereen 1* AT 40,2 SXZE 286,492 FXXELS FONT 'Oeneva‘,7 COLOR 0,0,0, list OFF'fields nunbex,D,F,Z,R>anRY.,S,DESCRXFTQR,BCFREQ,RPEND,RATXO,2 FOR R»'T'
SCREEN 1 TYFE o'.HEADING 'Sereen 1' AT'10,2 SXZE 286,492 PXXELS FONT 'Helvetice',265 COLOR 0 7 protein*:'
SCRESN 1 TYPE 0 HEADXNG 'Sereen 1‘ AŤ 40,2 SXZE 286,492 PXXELS FONT ‘Geiwva',7 COLOR ΜΛ list OFF fields nurber,D;F,Z,R,QTrKY,S,DESCRIPT0R,SGFR2Q,RnND,RATX0,X FQR R»'R'
SCREEN 1 TYFE 0 HEADXNG .‘.Sereen 1* AT 40,2 SXZE 28&,492 PS02LS FORT ‘Kelvetica’,265 C8&& 0 ? 'Protein processios,’
SCREEN 1 TYFE 0 HEADXNG ‘Sereen 1* AT 40,2 SXZE 286,492 FXXELS FONT *O«neva‘,7 OQLQR-0,0,0, list OFF fields number,D,F,Z,R,ENIRY,S,DESCRXFTOR,BSFRSQ,RFEND,RATIO,I FOR R-'L'
·) '
SCREEN 1 TYPE 0 HEADXNG 'Sereen 1* AT 40,.2 SXZE 286,492 PÍXBLS. FORT 'Kelvetica.’,268'COLOR 0 7 ‘
ENZYNES'
SCŘSEN 1 TYPE 0 HEADXNG ‘Sereen 1' AT 40,2 SXZE 286.492 FXXELS FONT ‘Helvetica‘,265 COLOR 0 7- 'Ferroproteinet'
SCREEN 1 TYFE 0 HEADXNG 'Sereen 1* AT 40,2 SXZE 286,492 FXXELS FONT 'Geneva',7 COLOR 0,0,0, list OFF fields &unber,D,F,Z,R,SRTRY,S,DESCRXFXCR,BSFREQ,RFEND,RATXO,X FOR R»'F*
SCREEN 1 TYFE 0 HEADXNG 'Sereen· 1’ 'AT 40,2 SXZE 286,492 FXXELS FORT ‘Helvetica·,265 COLOR 0 7 'Froeeaaes and inhibitore!'
SCREEN 1 TYFE 0 HEADXNG 'Sereen 1* AT 40,2 SXZE 286,192 FXXELS FORT 'Geneva',7 COLOR 0,0,0, list OFF fields numb«r,'O,F,Z,R,BTOY,S,tSSCRXPXOR,BGPREQ,RPEND,RAT2O,I FOR R«'P·
SCREEN 1 TYFE 0 HEADXNG ‘Sereen 1* AT 40,2 SXZS 286,492 FXXELS PONT ‘Helvetica·,265 COLOR © 7 'Oxidative pbóephorylationt.1
SCREEN i TYFE O HEMSNG ‘Sereen 1* AT 40,2 SXZE 286,492 PXXELS FONT ‘Oeaeva',7 COLOR Θ,Ο,6, lise OFF fields nusber,S,F,Z,R,XRXRY,6,DBSCRXFTOR,SGFREQ,RFQO.RATXO,X POR R>'Z* '
SCREEN 1 TYPE 0 HEADXNG' ‘Sáře«η 1' AŤ 40,2 SXZS 286,492 FXXELS PONT ‘Helvetica,255 COLOR 8 7 'Suear MCaboliasu ' '
SCREEN 1 TYFE 0 HEADXNG ‘Sereen 1' AT 40,2 SXZE 236,192 FXXELS PONT 'Geneva',7 COLOR 0,(^,0, list OFF fields nunbex,SfF,Z,R,ZRTRY,S,OES^XFXOR,BGFR£Q,RFEND,RATXO,X FOR R-'Q'
SCRESN‘1 TYFE 0 HEADXNG ‘Sereen 1* AŤ 10,2 SXZE 286,192 PXXELS PONT ‘Helvetica‘,265 éůL® ? ’AnLno acid im· *
SCRESN 1 TYFE 0 HEADXNG 'Sereen 1* AT 40,2 SXZS 286,492 FXXELS FONT 'Geneva',7 COLOR 0,0,0,'
- 52 list ΟΣΤ fields wasber,D,P,Z,R.ENniY,8,DESCRIPTOR,SOPRSa,RPEND,RATXO,I POR R.'M'
SCREEN 1 ΌΒΕ Ο.-ΚΒΛΙΜΒ 'Sereen 1* AT 40,3 SIZS 286,492 PIXELS PCNT 0 'Nueleie aeid netabolisa: *SCREEN l.TYPB 0'HEADING 'Sereen'1' AT 40,2 SIZS 284,492 PIXELS PCNT 'Géneva’,7 COLOR 0,0,0,' list, QPP fields «naber,D,F,Z,R,ENTOY,S,DESCRXPTOR,BGPREQ,RPEND,RATXO,-I POR R«'N' 'SCRZEN‘1 TYPZ o XEADXNG 'Sereen 1* AT 40,2 SXZE 284,492 PIXELS' PCNT 'Helvetica*,245 COLOR 0 ? 1 Lipid znecabolim: ’
SCREEN 1 TYPE 0 HBADING 'Sereen 1* AT 40,2 SIZS 284,492 PIXZLS PCNT 'Geneva',7 COLOR 0,0,0, list OF? fields nusiber,D,P,Z,R,EOTRY,S,DESCRIPTOR,BGPREQ,RPaO3,RATIO,I POR R.’W'
SCREEN 1 ? Other SCREEN 1 liít OPP 7
SCRZEN 1 7 '
TYPE 0 HEADXKG Sere®» 1' AT 40,2 SIZE 286,492 PIXELS PONT 'Helvetica',265 COLOR 0 enzymea:1
TYPE 0 HEADIN3 'Sereen 1* AT 40,2 SIZE 286,492 PIXELS PCNT 'Geneva',7 COLOR 0,0,0, fields «fitiber.D.P, Z,R,ENIRY,S,DSSCRXPTOR,BGPRB3, RFENS.RATXO, X FOR R=’E'
TYPE 0 HEADXKG 'Sereen 1' AT 40,.2 SIZE 286,492 PIXELS PCNT 'Helvetica·,268 COLOR 0
MISCELIANEOOS CASEGORIES' 'Sereen 1' AT 40,2 SIZE 286,492 PIXELS PONT 'Helvetica',265 COLOR 0 Sereen 1* AT 40,2 SXZE 286,492 PIXELS PONT 'Geneve·,7 COLOR 0,0,0,
SCRZEN 1 TYPE 0 HZADXN3 ? 'Sereea responsei'
SCREEN-1 TYPE 0 HEROINO li»t OPP íielda ma«ber;D,F',Z,R,ENTOY,S,DESCRIPTOR.BGFEBQ,RPJ2®,RATXO,I POR R='H
SCRZEN 1 TYPE 0 HZADXNG 'Sereen 1' AT 40,2 SIZS 286,492 PIXELS PCNT 'Helvetica',265 CCLOR'0 7 'Strueciirals'
SCREQÍ 1 TYPE 0 HEADING 'Sereen 1* AT 40,2 SXZE 286,492 PIXELS PCNT 'Geneva',7 COLOR 0,0,0, list OFP fields OU»ber,D,?,Z,R,BNISY,S,Ď2SCRIPTOR,BGFREa,RPEřJD,RATXO,I'POR R»'K'
SCREEN 1 TYPE 0 HEADING 'Sereen 1* AT 40)2 SIZE 286,492 PIXELS PCNT 'Helvetica·.265 COLOR-0 7-'Other cloaesj' ' ’ * ‘ SCRZEN 1 TYPE 0 HEADXNG 'Sereen 1' AT 40,2 SIZE 286,492 PIXELS * PONT' 'Geneva·, 7. COLOR 0,0.0. list OPP fields maiiber,D,?,Z,R,QíTR2f,9,tlBSCRIPTOR,SGPREQ,RPEND,RATIO,X POR R='X*
SCREEN 1 TYPE 0 EEADING 'Scréen 1' AT 40,2 SIZE 286,492 PIXELS PCNT 'Helvetica',265 COLOR 0 7 'Clenea-of unknewn functian:' - · .
SCREQí 1 TYPE 0 HEADING 'Sereen 1' AT 40,2 SIZE 286,492 PIXELS PONT 'Geneva',7 COLOR-0,0)0, list OFP fialds aunber,D,?,Z,R,ENTRY,S,D2SCRIPTOR,BGFREQ/Rn2ro.RATIO,I POR R-'ϋ'
QÍDCASE
DO Teat print.pru*
SET PRIOT OPP
SET DEVICE TO SCREEN
CLOSE DAIASASES
ERASE TEMPUCB.DBP
SRASS TEKPNUK.DBF
ERASS TEKPDBSIG.DBP
SET NARGIN TO 0
CLEAR
LOOP
QCXO •řtorfchexn (single), version 11*25-94 cloae databases set mx cep ssr frzot offset ezaci asv cuop. *
STORE ·' 'TO Zobjeet
STORB ' 'TO Dobjeet
STORE 0 TO Nudí».
STQRB 0'TO ZOJf STORE 1 TO Bail 00 WHILE ,T.
.* řxogran.» Northesa (eíngle).fee * Data....: 8/ 8/94 * Vexaion. i .FoxBXSB+ZNac,' réviaioa 1.10 * Notes.*....: 'Pomát filé Northern (single)
SCREEN 1 8 F3Q3LS 8 PDCELS 8 PZXSLS 8 PDCELS e PZXSLS 8 JDC2LS 8 PDCSLS 8 PDCELS 8 PDCELS 8' FZXELS 8 PDCELS
TYPE 0 ΗΞΑΠΣΝ3 'Scrsen 1· AT 40,2 SZZE 286,492 PDCELS FCOT 'Geneva',12 COIOR'0,0,0 15,81 TO 46,397 STYLB 28447 COLOR 0,0,-1,-25600,-1,-1 89,79 TO 192,422 STYLE 28447 OOLQR 0,0,0,-25600,-1,-1
113.98 SAY *2ntry ♦ « * STYLE. 65536 FCOT 'Oeaeva',12 COLOR 0,0,0,-1,-1,-1
115.173 GST Eobject STYLB 0 PONT 'Geaeva*,12 SIZZ 15,142 COLOR 0,0,0,-1,-1,-1
145.89 SAY 'Deieription* STYLE 65536 PONT *Geaeva',12 COLOR 0,0,0,-1,-1,-1 .
145.173 GST Dobjeet STYLE 0 PONT *Geaeva*,12 SZZZ 15,241 COLOR 0,0,0,-1,-1,-1
35.89 SAY 'Single.Northern aeeseh aeseen* STYLE 65536 FCOT Oenava')274 COLOR 0,0,220,162 GST Bail STYLE 65536 POST 'Chicago*,12 PXCTORE »«*R CentisuejBail out* SIZZ
175.98 SAY 'Člene ♦:* STYLE 65536 FCOT *G«n<vn'.,12 COLOR 0,0,0,-1,-1,-1
175.173 GET Numb STYLE 0 FCOT 'Geneva',12 SZZE 15,70 COLOR 0,0,0,-Ι,-ΐ',-1 80,152 SAY 'toter tsy ONE of the ťollowing:· STYLE 65536 PONT ‘Geneva',12 COLOR -Γ, *'BOPs Northern (single), fmt RSAD
IF Bail«2
CLSAR · acreen 1 off 'RSIURN
2SDIF
USE ''SmartGuyiFoxBASB*/Hac:Fox fileaiLobkup.dbf SET ŤAtK-CN · '
IP Eobjecto'
STORE UPPZR(Sobject) to Eobject
SET SAPSTY OF?
sort CN aitry TO 'JLookup entxy.dbf ·
SET SAFETY Ctí
USB 'Lookup entxy.dbf*
LOCAZE FOR Loaka^object
ΪΡ ..NOT.FOÓNDO 1
CDEAR
LOOP
2NDZP
SR0R3S
STORE Eatry TO SearehvalCL0S2 DATABASES
ERAS5 -'Lookup entxy.dbf·
END33· •ZF'DQbjeeto* ·
SET EXACT OF?
SST SAFEW OP?
SORT' ON deaeriptor TO 'Lootojp deacriptor.dbf ·
SET 5ΑΡΙΠΥ On
OSE ‘Lootafl? deseriptor.dbf*
LCCATE FOR OFFER(TRZH(deseeiptox))>OFPER(TRZH(Dobject·)) I? .NOT.FOCKDO
CLBAR to XIHdVS £35 «« ’,gqp-«4TH. 01 ZáOO iáQ JUXRS £25 ,;6ρ·«»Βοχβίβ»χχ; xojwxz+aswsxoaiAiovws. asn ÍO 2ΡΤΌ. £23 •••woe Β»χπ3οα »ιχ3 ββχοα, í wsa jfSÁt?» αχκχνοκ » «ΠΟΪ 030ΪΗ docri τ+τ»ΝΚ - 'τ»ΝΗ coa
312733 p.tct.ť. · >nsa£ 4T sxszi oi xracctn auois dDÍS.
XX521 Ol -λΏΚΒΠτ ZHQXS •xxaw oo aaos ..... «KOT
Í«JMS . ' XXd· £O1 «< tííHW dl. TTO8 O-a-JS 2TXSM 03 ’ O«CMS X XXSYH £01 01 1N030 30«
0«ρβ»3» BOJ SISTSO «ΜΡ·3·?*«?3Π pwsajdtoo, 3SQ
ŇO h&ks && 0<P«aya HCá * .jqp-ea-piKqn paeaasdnoo, οΐ'ΧΣ«κπτ NO 180S * 33Ω M&fíS S3S ,;qp-Baw2rgn:s>rp; xoá:čsH/+asvS»=d:^io^aS. 3SQ ',···.·μο« ax73 eapraaqri asm ββχβββπΛιβο, i jqp'&rexcm aoa arcuoossns.roissaaáJKO hots nacuaa ;j o χ uaoxoe iX.oOtODSdda £E sxro • 30 Ol ITťM .paaoosl 03 Λ J»3i3, i • i
XíAxprros 44 , Xxitxa «; >χ«Ζχοο8 uzatpjoKi 4 «TO axtsa
XaAqajeeg Q1 XX3OS 38013· . 2SM0H2 · «mj oo <;qp’9»t»xo:s»rr? xoí^^lV+SSXaxeáS^nOiiwíS. 2Sfl fteottw jt • Jma ŇO £0X33 133 ,;<&· :oyiyz2svp ďii3(0oqa 23Y82 * sssxhxixg ssoto
XBAxpaws Ol &3t33 SHOIS 25U08S jxma axn
- ťS 55 * MASTER ANALYSIS 3j VERSION 12-9-94 * Master menu £07 analysia output
CLOSS DATABASES
SET TALK OFF
SET SAFETY OFF
CLEAR
SET DEVICE TO SCRSsN
SET DEFAULT TO *SmartGuy:FoxBASE+/Mac: ťox fileslOutput programe:' USE 'SmartGuy:Fox3ASE+/Mac:fox filesiClones.dbf
GO TOP
STORE NUMBER TO INITIATE
GO 3OTT0M
STORE NUMBER TO TERMINATE
STORE 0 10 ENTIRE
STORE O TO CONDEN
STORE O TO ANAL
STORE O TO EMATCE
STORE O TO HMATOH
STORE O TO OMATOH
STORE O TO IMATCK
STORE O TO XMATOH
STORE O TO PRINTON
STORE O TO PTF
DO WHILE ,T.
* Program.: Master analyais.fmt * Dáte....: 12/ 9/94 * Version.: FoxBASE+/Mac, revialon 1.10 * Notes....: Formát filé Master analysis
SCREEN 1 S PIXELS e pixels Φ PIXELS
PIXELS a PIXELS a PIXELS
PIXELS 8'PIXELS 9 PIXELS 9 PIXELS 9 PIXELS 9 PIXELS 9 PIXELS
PTvgr.c PTygr.c PIXELSβ PIXELS a PIXELS a PIXELS
TYPE O HEADING 'Screen 1* AT 40,2 SIZE 286,492 PIXELS FONT 'Geneva',9 COLOR 0 0,0, 39,255 TO 277,430 SKLE 28447 COLOR 0,0,-1,-25600,-1.-1 75,120 TO 178,241 SKLE 3871 COLOR 0,0,-1,-25600,-1,-1
27,98 SAY 'Customized Output Menu· STYLE 65536 FCNT 'Geněva',274 COLOR 0,0,-1,+1,-1
45.54 GET conden STYLE 65536 WH? 'Chicago·, 12 PICTORE '8*c Condensed fernet· SIZE 54,261 GET anal STYLE 65536 FONT 'Chicago',12 PICTORE ’8*RV Sort/number:Sort/eůtryi
117.126 GET BOSCH STYLE 65536 FONT 'Chicago·,12 PICTORE ’8*C Exact · SIZS 15,¢2 CO
135.126 GET HMATOH STYLE 65536 FONT 'Chicago·,12 PICTORE '9»C Hcroologous* SIZE 15,1
153,126'GET OMATOH STYLE 65536 FONT 'Chicago', 12 PICTORE *»*C Other spC SIZS 15,84
90,152 SAY 'Matches:' STYLE 65536 FONT 'Oeaeva',268 COLOR 0,0,-1/-1,-1,-1 '
63.54 GET PRINTON STYLE 65536 FONT 'Chicago',12 PICTORE '8*C Include cloně listin?·
171.126 GET Imatch STYLE 65536 WNT 'Chicago',12 PICTORE '8*C Incyte SIZE 15,65 CO
252.146 GET initiate STYLE 0 WNT 'Geneva',12 SIZE'15,70 COLOR 0,0,-1,-1,™1,1
270.146 GET terminate STYLE 0 WH? 'Geaeva',12 SIZE 15,70 COLOR 0,0,-1,-1,-1,-1 234,134 SAY 'include dones · STYLE 65536 FONT 'Geneva',12 COLOR 0,0,-1,-1,-1,-1 270,125’SAY ·->'STYLE 65536 WNT 'Genéya‘,14 COLOR 0,0,-1,-1,-1,-1
198.126 GET PTF STYLE 65S36 FCNT 'Chicago',12 PICTORE ’»*q Print te filé' SIZE 15,9 189,0 TO 257,120 STYLE 3871 COLOR 0,0,-1,-25600,-1,-1
209,8 SAY 'Libraxy aelection* STYLE 65536 WNT 'Geneva',266 COLOR 0,0,-1,-1,-1,-1 227,18 GET FNTIRE STYLE 65536'WNT 'Chicago',12 PICTORE '8'RV AU;Selecteď SIZE 16 * EOF: Master analysie.fmt READ
IF ANAL-9
CLEAR
CLOSS DATABASES
ERASE TEMFMASTER.DBF
USE *SnartGuy:FoxBASE+/Mac:£ox files:dones.dbf· SET SAFETY CN SCREEN 1 OFF
RETY IRM ? ematch ? Hmatch ? Cdiatch ? XMATCE SET TALK CN
I? ENTIREe2
USB -Uhique libraries .'dbf ·
RSP1ACS.ALL i WITE · '
BROWSE FIELDS i, lihnaae, librazy,total,entered AT 0,0 SNDIF
USE ,SmrbGuy:FoxSASE+/3toc:£ox filessclones.dbf* ♦COPY TO TEMENŮM FOR NUM3ER>«INITIATE.AND.NUMSER<sTSRMIKATE ♦USE TEMENŮM
COPY STRUCTURE TO TEKPLIB
USE TEMELIB IF ENTCRE-1
APPEND FROM ·SaartGúy:FoJSASS+/Mací£ox files:Clonee,dbf·
SNDIF
TF EOTIRE*2
USE Unique librarie·,dbf’
COPY TO SELECTED FOR UPP3R(i)-'Y'
USE SSLECTSD
STORS SECCOÚNPO TO STOPIT MARX-1
DO KKILE .T.
IF MARK>STOPIT clear
EXIT
ENDIF
USE SELECTED GO MARX
STORS library TO THISCNE ? 'COPYIN3 ' ?? THISONE USE TEMPXjIB
APPEND FROM *Sn&rtGuy:FoxBASE+/Mac:fox ťilea:Cloaes.dbf· FOR library-TKISONE
STORS MARX+1 TO MARX
LOO?
SNDDO
ENDIF
USE *Sm&rbGuy:FoxBASE+/Ka.c:£ox £ile«selenes.dbř
COUNT TO STARTOT
COPY STRUCTURE TO TEMPDESIG
USE TEMPDESIG
IF aaatch-0 .AND.. Hmateh»0 .AND. CSratch«0 .AND. XM&TCHaO
APPEND FROM TEMPLIB
ENDIF
IF Eroateh»l
APPEND FRCM TEMPLIB FOR D='S'
ENDIF
IF Hrnežehal
APPEND FROM TEMPLI3 FOR Dm’2'
ENDIF
IF Omatchsl
APPEND FRCM TEMPLIB FOR D»'O'
ENDIF
IF Inacehal APPEND FRCM TEMPLIB FOR D»'I' .OR.D»'X'.OR.D-'Ν'
ENDXJT
IF Xmatzhol
APPEND FRCM TEMPLIB FOR D«'X’
ENDIF
CCUOT TO ANALTOT set talk ořf
DO CASE s—- / γ>σ
CASE ΡΤΡ·Ο
SET DEVICE TO PSINT
SST PRINT ON E3B2T CASE PTFel SET ALTERNATE TO •SET ALTERNATE TO •SET ALTERNATE TO •SET ALTERNATE TO ★SST ALTERNATE TO •SET ALTERNATE TO •SET ALTERNATE TO •SET ALTERNATE TO SET ALTERNATE ON ENDCASS
Total funetion eort.txt •H and o functioa sort.txt‘
Shear Stress HUVEC 2:Abucdasce sort.txt· •Shear Stress HUVEC 2 tAbundance con.txt· Shear Stress HUVEC 2:Funetion sort.txt* •Shear Stress HUVEC 2:Distributlon sort.txt •Shear stress HUVEC 1;Cloně liat.txt’
Shear Stress HUVEC 2:Loeaeicn sort.txt’
I? PRINTONal
61,30 SAY •Da.tabase Subset Analysis STYLE ¢3536 PONT Ganava‘,274 COLOR 0,0,0,-1,-1,-1 ENDIF 7 7 o
? dáte() ?? * 1 7? TIMS{) 1 Cloně· nanbars 1 ?? STR(INITIATE,S,0)
7? * fchrough ·
7? STRfTERNINATS, 6,0) 'Libraríes: *
IP EOTIREal ? 'All libraríes'
ENDIF
IP EOTIRE.2 MARJČ-l DO WHZLE ,T.
IP MARK>STOPIT
EXIT _ ENDIF
USE SELECTED GO MARX 7 ' '
TRZM(libnaae)
STOR3 MARX+1 TO MARX LOOP
ENDOD
ENDIF 'Desion&eions: *
IP Bnatch*0 .AND. Knatch»0 .AND. Qaateh«0 .AND. IKATCH«0
77. *A11'
ENDIF
IP Boatchel 'Exact,'
ENDIF
IF Hmatch-1
7? 'Humen,' aoiF ·
ZF Coatchal . .
'Other sp.'
ENDIF '
IF Imatchal 77 'INCYTE'
ENDIF
IF Jtaatehal ?? 'EST'
ENDIF
I? CONDSN-1 ' ? ‘Conriensed formát analyaia'
ENDIF
IF ANALel ? 'Sorted ty NUM3ER'
SNDIF X'
ÍF ANAL«2 ? ‘Sorted ty ENTRY' “
ENDIF ‘ SF ANALe3 ? 'Arranged ty ABUNDANCS'
ENDIF M I? ANAL-4 ? 'Sorted ty. JKIEREST'
ENDIF
I? ANAL=5 ? 'Arranged ty LOCATION'
ENDIF '
IF ANAL-6 'Arranged ty 015731130110^
ENDIF
IF ANAL-7 ? ‘Arraayed ty “JNCTICN'
ENDIF ? 'Total dones reprssented: 1 ,7? STR(STARTOT,S,O) ? 'Tocal dones analýzeds *
7? STRCANALTOT, 6,0} ' 1 = librařy d = desisnation i » distributicn z « location r « function c « cer ♦♦Ir*··*****»**»»»»»»»***»*·»*******»»* *«*r****************************** *********************
USE TEMPDESIG • SCREEN 1 TYFE 0 KEADING Screen 1’ AT 40,2 SIZE 286,492 PXXELS FQOT ‘Geneva·',? COLOR 0,0,0,
DO CASE CASE ANALel * sort/number SET HEADC4G ON IF CCNDSN.L
SORT TO ΤΞΜΡ1 CN ENTRY,NUMSER DO CCMPSESSICN ntóber.PRG’
ELSE
SORT TO TSKP1 CN N0M3ZR
OSE TEMP1 _ list off fialda number,L,D,F,Z.R»C,ENTRY,S,DSSCRIPTQR •list off fialfiS nunber,L»D,F,Z,R,C,E2írRY,S,OSSCRIPTOR,U5XCIH,RFEND,INIT,I CLOSE DATASASES ERASE TEMP1.D3F
ENDIF — ...
CASE ANAU2 * sort/DSSCRIPTOR SET EEADDJ3 CN •SORT TO TEMP1 ON DSSCRIPTOR, ENTRY, NOMSER/S íor E»'E'.CR.D-^ŮOR.D^O'.OR.I>'X'.0R.De'I' •SORT TO ΤΞΜΡ1 CN ENTRY, DESCRIPTOR.NUMSER/S íor D»'2‘ .OR.D-,H,‘.OR.D-‘O' .0R.Dm‘X‘ .OR.D-‘I' SORT TO TSMP1 ON ENTRY,START/S for D-Έ'.OR.D='K‘.CR.D-‘O'.OR.D='X'.OR.D*11'
IF CCNDEN-1
D3 COMPRESSION eatry.PRG*
ELSE
USE TEMP1 list off fields number, L, D,?,Z,R.C,EN7RY,S,DESCRI?TCK,LE©IH,RJEND, INIT, I
CLOSE DATASASES ERASE TEMPl.DBF ENDIF
CASE * sort by abundance
SET ΗΞΑΟΣΝ3 ON
SORT TO TEKPl ON ENTRY.NUM3ER for D»'S' .OR.D»'H' .OR.D»'O' .OR.D*'X' .OR.D·'!'’ DO ‘CCkpressiqn abundance.srg·
CASE ANAL-4 * aort/interest
SET KEADXN5 ON
IF CQNDEN.l
SORT TO TEMF1 ON ENTKY, NUMBER FOR I>0
DO ‘CGMFRESSIGN intexect.FFG‘
ELSE
SORT CN I/D.ENTRY TO TEMP1 FOR I>1
USB TEMP1 lise eií fielda numbex,L.D,F,Z.R,C,ŠUTRY,S.DESCRIPTOR.LENOTK,RFEND,ΙΝΣΤ,Ι CLOSE DATASASES ERASE TEMP1.DBF
ENDIF
CASE ANAL-5 * arxanae/lecatiea
SET KEAD34S CN
ST0R3 4 TO AMPLIFIE3 'Nuclear:1
SORT ON ENTRY,NUMBER FIELDS RFEND,NUK3ER,L,D,F,Z,R.C.ENTRY.S.DESCRIPTOR.LZNBTH, CTÍT, X.CCMMEN IF CCNDEN-1
DO ’Conpxessíon location.prg*
ELSE
DO ‘Normál subroutina 1*
ENDIF ? 'Cycoplaamics'
SORT CN ENIRY.N0M3ER FIELDS RFEND,NUMS2R,L,D,?,Z.R,C,SNTRY,S,DESCRIFTOR,LENGTH, ZNIT.I.CCMIOÍ IF CCNEEN-l
DO “Ccmpresaion location.prg·
ELSE _
DO ‘Normál aubroutine 1*
ENDIF ? 'Cyťoakelecon:' _ SORT CN ENTKY,NUMBER FIELDS RFSND,NUM3ER.L.D,F,Z,R,C,ENTRY,S.DESCRIPIOR,LENGTH,INIT,I IF CCNEOU1
CO ‘Cotpreasion location.prg·
ELSE
CO *Normal aubroutine 1* .
ENDIF
7 eurfaee: *
SORT CN OTÍKY,NUMBER FIELDS RFEND,NUMBER,L,D,F,Z,R,C.EOTKY,S,DESCRIPTOR, ISN3IK, INIŤ. X IF OCNDEN-1
DO ‘Canpreaeion location.prg* ELSE
DO ‘Normál aubroutine 1' endif ' Intracellular membráně;1
SORT ON SNIRY,NUMBER FIELDS RF3ID,NUMBER,L,D,F,Z,R,C.ENIRY,S,DESCRIPT0R,LEM3TH.INXT„X, IF CCNEEN»1
DO ‘Compreaaion location.prg·
COMMEN cctínai
CCMMEN
ELSE .
DO ‘Normál aubroutine 1*
ENDIP 'Mitocbondrial: *
SORT CN ΟΠΚΥ,NUMBER FIELDS RFEND,NUMBER,L,D,F,Z,R,C,SNIRY,S,DESCRIPTOR,LSNUTa,INXTsí, IF COfflEtfal
DO ‘Conpreaaloa location.prg·
ELSE.
DO ‘Normál aubroutine 1*
ENDIF
CCWMEN ? * SecsObedti1
SORT ON BOTKY, NOMBER FIELDS RFEND,NUK3ER,L,D,F,Z,R,C,2NTRY,S,DESCRIPT0R.L2N3TK,INIT,I,CCMMSN IF CONDSN=1
DO Compreaaion location.prg'
ELSE
DO 'Normál eubroutine 1'
ENDIF ? 'Otheri'
SORT ON EOTKY, NUMBER FIELDS RFSND,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIPT0R,LEN3TH,INIT,I,CC«MEN Z? CONDENsl
DO Canpression locatior..prg
ELSE
DO· Normál oubroutine 1'
ENDIF ? 'Untaewn.·'
SORT ON ENTRY,NUMBER FIELDS RFEŇD,NUMBERzL,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTE.INIT,I,Ca®íSN IF CONDEN«1
DO Ccanpression locatioa.prg’
ELSE
DO Normál aubroutiae 1
ENDIF
IF CQNDENsl
SET DEVICE. TO PRINTER
SET PRINTER ON
EJECT
DO Output heading.prff
USE Aaa-lysis location.dbf ·
DO Create bargraph,prg*
SET -KEADIKO OFF ' ' FUNCTIONAL CLASS TOTAL UNIQUE NEW % TOTAL'
LIST OF? FIELDS Z,NAME.CLONES,GENES,NEW,PERCEOT,GRAPH
CLOSE DATABASES
ERASE TEKP2.DBF
SET HEADIN3 ON ♦USE SmarcGuysFoxBASE·»·/Mac:fox filesiTEKEMASTER.dbf
ENDIF
CASE ANAL«6 * arrange/distribution
SET HEADING ON
STORE 3 TO AMEWXER ? 'Cell/cieeue epeciCic diatributioni'
SORT CN B7TRY,NUMBER FIELDS RFEND,NUKBER,L,D,F,Z,R,C, ENTRY, S,DESCRIPTOR,LENGTH,INIT,I,CCNK=N IF CCNCEN-1
DO Cccpreeeloo diacrib.prg —
ELSE
DO Norma! eufaroutina 1*
ENDIF 'Noo-specific distsibution:' __
SORT ON BTCKY,NUMBER FIELDS RFEND,NOMBER,L,D,F,Z,R,C.ENTRY,S,DESCRIPTOR,LENGTS,INIT,I,COMKEN· IF CCNOEN-1
DO Ccrapression dietrib.prg .
ELSE
DO Normál subroutin* 1
LNUIF ? 'Unknown discribuclBtrr' _ ·
SORT CN EOTRY,NUMBER FIELDS R?SND)NOMBER,L,D,F,Z,R,C,E7:RY,S.DESCRIPTOR,LEN3TH.INIT,I(CCꨣN IP CCMDEN-1
DO Cerpresaicn dietrib.prg·
ELSE
DO Normál aubroucine 1*
ENDIF
IP CCNDEN-1 .....
SET DEVICE TO FRTOTER
SET PRINTER QN
SUBCT
DO' * Output heading. prg *
USE 'Anályeis distribution.dbf‘
DO 'Create bargraph.prg'
SET HEADING OFF ? ' FUNCTICNAL CLASS TOTAL UNIQUE % TOTAL' ·
LIST OFF FIELDS P.NAME,CLQNES,GENES,PEBCENT,GRA?H
CLOSE DATABASES
ERASE TENP2.DBF
SET HEADIN3 ON •USE 'SmartGuy:FoxHASE+/Mac:řox files:TEMPMASTER.dbf*
ENDIF
BINDING PROTEINS*
CASE ANAL«7 • arrange/funetion SET HEADING ON STORE 10 TO AMPLIFIER ? ' 'Surface nolecules and receptorsi'
SORT ON ENTRY.IOQER FIELDS RFEřro,NUMBER,L,D,F»Z,R,C,ENTRY,S,DESCRIPTOR,LENGTK,INITřIfCCMMEN IF CONDENal
DO ‘Canpressíon funetion.pro
ELSE
DO 'Normál subroutine 1*
ENDIF 7 'Calcíum-binding proteine s'
SORT ON ENTRY.NUMBER FIELDS RFSND.NUMSERíL.D.F,Z,R,C,ENTRY,S,DESCRIPTGR,LENGTH,INIT(I4CQÍ®C5N IF CONDEN«1
DO 'Campression funetion.pxg*
ELSE
DO 'Normál subroutine 1*
ENDIF ? 'Ligands and efťectorsi'
SORT ON ENTRY.NUM3ER FIELDS RFEND,NOMBER,L,D,F,Z,R,C,ENrRY,S,DSSCRIPT0R,I5NGra,INIT,IfCCHHSN IF CONDEN-1
DO 'Ccmpression funetion.prg*
ELSE
DO 'Normál subroutine 1*
ENDIF 'Other hinding proteine i1
SORT ON ENTRY.NUMBER FIELDS RFEND,NOMBER,L,D,F,Z,R,C,ENERY,S,DESCRIPTOR,LB»3TS,INIT,I.COMHŽN IF CONDEN«1
DO 'Coopression funetion .prg'
SLSE
DO 'Normál subroutine 1' ~
ENDIF •EJECT ? 1 CNCOGENES* ? .
'General oneogeneu·
SORT ON ENTRY.NOMBER FIELDS FFEND,NafflER,L(D,F,Z,R,C,ENTRY,S,DESCRIPTOR,iaOIH,INIT,:
IF CONDENal
DO 'Compression funetion.prg'
E^SS
DO 'Normál subroutine 1'
ENDIF ' GTP-binding protein* i'
SORT CN ENTRY.NOMBER FIELDS RFEND, NOMBER, L,D,F,Z,R,C,ENTRY,S,DESCRXPTOR,LEN3TK,XNIT,;
IF CONDENal
DO Compression funetion.prg*
ELSE
DO 'Normál subroutine 1*
ENDIF 'Viral elementu'
SORT ON ENTRY.NUMBER FISLDS RFEND.NUMBER.L.D.F.Z.R.C.ENTRY.S.DESCRIPTOR.LENGTíI.INIT.I.COMMSN IF CQNDENsl
DO čonpreasion function.prg
ELSS
DO Normál subroutine 1* endif ? 'Kinases and Phosphatases:'
SORT ON 3NTRY.NUM3ER FIELDS RFEND,NUMBER,L,D,?,Z,R,C,ENTRY,3,DESCRIPT0R,LENSTH,INIT,I,'C0MMEN IF CONDSN.i
DO Cůnpreasioa function.prg
ELSS * DO Normál subroutine 1'
ENDIF ? 'Tumor-related antigensi'
SORT ON ENTRY.NUMBER FIELDS RFSND,NUN3SR,L,D,F,Z,R,C,SNTRY.S.DESC3aPTOR,LDKřI«.INIT,I,CCMCN IF CONDEN-l
DO Conpreaaion function.prg
ELSE
DO Noma.1 subroutine 1'
SNDIF
SJECT ’ PROTEIN SYNTHETIC MAOffiSRY PROTSENS1 < · 'Transcription and Nucleic Acid-binding proteins:1
SORT ON ENTRY.NUMBER FIELDS RFEND.NUMBSR.D.D.F.Z.R.C.aTCRY.S.DSSCRIPTOR.ISNGTO, JNIT.I.COMMEN IF CQNDENsl
DO Coepreasion function.prg’
ELSE
DO Normál subroutine' 1
ENDIF 'Translation:'
SORT CN ENTRY.NUMBER FT^TK RFEKD,NUKBER,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,LENGTE,INIT,I,CCMMEN IF CONDENxl
DO Compression function.prg’
DO Normál subroutine 1
SNDIF 1 Riboscnal proteins:'
SORT ON ENTRY.NUMBER FIELDS RFEND.NUKBER.L.D.F.Z.R.C.SNIKY, S,DSSCRIPTOR.LENGTH, INU, I.CCMMEN IF CCNDEN-1
DO Ccmpresaioa function.prg’
ELSE
DO Normál subroutine 1 .ENDIF 'Protein Processing:'
SORT ON ENTRY.NUMBER FIELDS RF£ND,NUMBER,L,D,P,Z,R,C,OITOY,S,DESCRIPTOR,E5N3TH,XNIT.I»CCMMEN if ccndsi-i
DO ‘Compression function.prg.
ELSE
DO Normál subroutine 1
ENDIF
EJECT ’ ENZYMES' 'Ferroproteiasi' M
SORT ON ENTRY.NUMBER FIELDS RPEND.NUMBER.L.D.F.Z.R.C.ENTKY, S.DESCRIPTOR.LENSTH.XNIT.I.CafcMSN IF CONDENxl DO Compresaíon function.prg
ELSE
DO Normál subroutine 1'
ENDIF 'Proteaaes and inhibitore:'
SORT ON ENTRY.NUMBER FIELDS RFEND,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRI?TOR,LENQTH,INIT,I.CCMMEN IP CQNDENsl
DO Conpreaaion function.prg .....— .......
ELSE co NoctíI subroutiae 1*
ENDIF ? 'Oxidativa phosphorylation:'
SORT ON EOTRY.NUMBER FIELDS RFEND,NUMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIFTOR.LEW3TH,INIT,I,CŮNHEN IF CONODI«1
DO Coapreaaioa fuaccion.prg'
ELSE
DO ‘Norma! eubroutine 1*
BDI?
? ' Sugar metabolism»1
SORT ON STORY,NUM3SR FIELDS RFEND,N0MB2R,L,D,F,Z,R,C,ENTRY, S,DSSGRIPTOR,LBIGTH, ΙΝΙΤ/Ι,ΟΟΜΜΕΝ IF CONDEN-1 DO 'Compression functioa.prg·
ELSE
DO 'Normál subroutine 1*
EDI?
? 'Ámiao aeid metabolism: ’
SORT ON INTRY,NUK3ER FIELDS R?END,NUM3ER,L,D,F,Z,R,C,ENrRY,S,DBSCRIPTOR,LEŇ3TH,INIT#IfCOMíEN I? CONDEN-1
DO 'Comprassion functioa.prg'
ELSE
DO ‘Normál subroutine 1*
ENDIF ? 'Nucleic acid metabolism:'
SORT ON SNTRY,NUMBER FIELDS RFEND,NUM8ER,L,D,F,Z,R,C,E(n5Qr,S,DiSCRIPTOR,LEMOTH(INIT,l,CCtó®3 IF-CONDSJ·!
DO 'Conpreaaion function.prg·
ELSE
DO 'Normál subroutine 1* endif ? 'Lipid metabolism:'
SORT ON ENTRY.NOMBER FIELDS EFE®4K»lBSR,L,D,F,Z,R,C,ENm,S,DESCRIETOR,LBMSIK>ÍÉNIT,I.OCttSBN 17 CONDEN-1 do ‘Canpressioa function.prg'
ELSE
DO 'Nonn&l subroutine 1*
ENDIF ? ' Other enrymet i'
SORT ON ENTRY.NOMBER FIELDS RFa©,NUMSER,L,D,F,Z,R,CENTRY, S,DESCRIFTOR,La«3TH,INIT, I.CXWN IF CONDEN-1
DO 'Corapression function.prg'
ELSE
DO 'Normál subroutine 1*
ENDIF •EJECT ? 1 MI9SELEANEOOS OWBGOBJES' ?
? 'Stress*responser'
SORT ON £NTRY,NUKBSR FIELDS RFEKD.NCMBER,L,D,F,Z,R,C,ENTRY,S,DESCRIFTOR,LENGTH,2NIT,I.COMMEN 17 CQNEEN-l
DO 'Compresaioa function.prg* _
ELSE
DO 'Normál eubroutine 1*
ENDIF ? 'Structuxel:'
SORT ON ENTRY.NUKBER FIELDS RFEND,N0MBER,L,D,F,Z,R,C,INTRY,S,DESCRIPT0R,IiEN3TH,INIT,I,
IF CCMDEN-1
DO 'Conpression function.prg* rr.gr
DO 'Normál eubroutine 1*
ENDIF ? Other clenea:'
SORT ON ENTRY.NUMBER FIELDS RFEND,NUMBER,L,D,P, Z,R, C,ENTRY,S,'DESCRIFTOR,UENSTH, ΙΝΣΤ,Ι,
IF CONDEN-1
DO 'Coopression function.prg*
ELSE
DO ’ΝοεχγαΙ subroutine 1* ~
ENDIF ? ‘Clones oí unknown íuaction!'
SORT ON ENTRY,NUM3ER FIELD5 RPEND,NUK3ER,L,D,F,Z,R,C,EfírRY,S,DESCRIPTQR,LENGra,INIT,I,'C0MiířN IF CCMDENxl
DO 'Compressior, ťuncticn.prj'
ELSE
DO ‘Normál subroutine 1*
ENDIF
I? CONDEN«1 EJECT •SET DEVICE TO PRINTER •SET PRINT ON DO Output heading.prg·
USE ‘Aaalysis ťuncticn.dbf·
DO ‘Create bargraph.prp·
SET EEADING OFF
SCREEN 1 TYPE 0 HEADING Screen 1* AT 40,2 SIZS 296,482 PIXELS FONT Gen£va,12 COLOR 0,0,0 ? ' TOTAL TOTAL NSW DIST ? ' FUNCTICNAL CLASS CLCNES GENES GENES FUNCTICNAL CLASS' • ·> · ·»« •LIST OP? FZELDS Ρ,ΝΑΜΞ, CLCNES, GENES,NEW, PSRCSNT,GRA?H,CCMPANY LIST OFF FZELDS P.NAME, CLCNES, GENES, NEW, PERCEOT,GRAPH CLOSE DATABASES
ERASE TEMP2.D8F
SET HEADXN3 ON •USE *Sff.artGuy:FaxBASS+/Macifox files:TQÍPMASTER.dbť·
ENDIF
CASE ANAL»8
DO “Subgrcup sunnary 3.prsr‘
ENDCASE
DO Test print.pxp*
SET PRIOT OFF
SET DEVICE TO SCREEN
CLOSE DATABASES •ERASE TEMPLIB.DBF •ERASE TEMPřWM.DBF «ERASE TEMPDESIG.DBF •ERASE SELECTED.DBF
CLEAR.
LOOP
2NDDO * COMPRESSION SUBRCUTHE FOR ANALYSIS PSOGRAMS
USE TEKP1
COUNT TO TOT
RSPLACE ALL RFEND WITH 1
MARXI = 1
SW2-0
DO WHILE SW2«0 ROLL IF MARXI > TOT PACX
COUNT TO UNIQUE
COUNT TO NEWGSNES FOR D- Ή* .OR.D· ‘0'
SW2»1
LOOP
ENDIF
GO MARXI
DUP s 1
STORE ENTRY TO TĚSTA
SW O
DO WHILE SW»O TEST
SSOT
STORE ENTRY TO TESTE IF TĚSTA · TESTE dsiete DUP - DUP-rl LOOP ·
ENDIF
GO MARXI.
RSPLACE RFEND WITH DUP
MARXI ·> KARX1+DUP
SWsl
LOOP
ENDDO TEST
LOOP
ENDDO ROLL •GO TO?
STORS Z TO LOC '
USE 'Analysis locaťion.dbř'
LOCATE FOR Z-LOC
RSPLACE CLONES WITH TOT
RSPLACE GENES WITH UNIQUE
RSPLACE NEW WITH NEWGENES
USE TEMPL
SORT ON RFEND/D TO TEMP2
USE TEHP2 ?? STR(UNIQUE,5,0) ?? 1 genes, for a total of ’ ?? STR(TOT, 5,0) ?? * .cloaes1 ? 1 V Coincidence' liat off Halda neober,RFEMD,L,D,F,Z,R,C,HNTRY,S,DSSCRIFTOR,LBI3TH,INIT,I •SET PRINTOFF CLOSE DATA3ASES ERASE TSMPl.DBF ERASE T5KP2.DBF USE TEMPDESIG * COMPRESSION SUBROUTINS FOR ANALYSIS PROGRAMS
USE TEMP1
COUNT TO TOT
REPLACE ALL RFEND WITR 1
MARXI - 1
SW2-0
DO WHXLE SW2=0 ROLL I? MARXI >= TOT PACK
COUNT TO UNIQUE > SW2=1
LOOP
ENDIF
GO MARXI DUP = 1
STORE ENTRY TO TĚSTA SH - 0
DO WKILE SW«0 TEST SKIP
STORE ENTRY TO TESTB IF TĚSTA χ TESTB DELETE DUP « DUP+1 LOOP 'ENDIF
GO MARXI
REPLACE RFEND WITH DUP MARXI χ MARX1+DU?
SWxl
LOOP
ENDDO TEST LOOP
ENDDO ROLL ♦BRCWSE ♦SET PRINTER CN SORT ON DÁTE TO TEMP2 USE TEMP2 ?? STR{UNIQUE,4,0) ?? 1 genes, for a total of 7? STR{TOT,4,0) · cionee' ? 1 V Coincidence1
COUNT TO P4 FOR Ι·4 IF P4>0 _
STR(P4,3,0) ?? ' genes with priority χ 4 (Secosdary analysis:)1 list off fields nnBiber,Rřa®,L,D,F,Z,R,C,Bíneř,S,DSSCRIPTOR(La«TH,IKÍP for 2-4 ·>
ENDIF __
COUNT TO P3 FOR 1-3 IF P3>0 ? STR(P3,3,0) ?? 1 genes with priority χ 3 (Full insert sequence:)1 list off fielda a«inber.KaO,L,D,ř,Z,R,C,aíHK,S,M^RI?TOR,LS»STK,IHIT for 1-3 z
ENDIF
COUNT TO P2 FOR 1x2.
IF P2>0 ? STR(P2,3,0) ' genes with priority - 2 (Priaiary analysis complete;)' liflt off fields nunber, RFEND,L,D,F,Z,R,C,ENIRY,S.DESCRIPTOR,LENGTH,INIT for 1x2 7
ENDIF
COUNT TO ?1 FOR 1-1 IF Pl>0 ? STR(Fl,3,0) ?? * geaee with priority » 1 (Primasy onalysia naadedi) * liet ofi iieláe auabeXiBFEND/L/DjP/Z/RjC^SNIRYiS<KSCRI?T0R,IjENGTH,3N3T for I«1 ENDIF •SET FRINT OFF
CLOSS DATABASES
ERASS TEMPl.DBF
ERASS TEMP2.DBF
USE 'SaartGuyjFoxBASE+ZMacsfox files«dones, ábf* ’ CCMPRSSSION SU3R0UTINE FOR ANALYSIS PROGRAMS ........
USE TEMP1
COUOT TO TOT
REPLACS ALL RFEND WITH 1
MARXI « 1
SW2-0
DO TOHLE SW2-0 ROLL I? MARXI >= TOT PACX
COOOT TO UNIQUE
SW2-1
LOO?
ENDIF
7· GO MARXI
DUP = 1
STORE EOTRY TO TĚSTA SW = 0
DO TOHLE SW-0 TEST
SKIP
STORE EOTRY TO TESTE IF TĚSTA « TESTE DELSTE DUP - DUP+1 LOOP
ENDIF
GO MARXI
RSPLACE RFEND WITH DUP MARXI = MARXl+DUP SW=1
LOOP
ENDDO TEST LOOP
ENDDO ROLL ♦BROWSE . ♦SET PRINTER ON
SORT ON NOMBER TO ΤΉΜΡ2 USE TEMP2 ?? STR (UNIQUE, 4,0)
7? 1 genes, for a Coeal of 1 77 STR(TOT,5,0) ?? ' elonea' 1 V Coincidence* list off fieldfl nuaber,RPS®,L,D.F,Z,R,C,ENTSY,S,DESCRIPTaR,LENGTH,INIT,I ♦SET PRIOT OFF CLOSE DATABASES ERASE TEMP1.SBF ERASE TQÍP2.DBF
USE *SnartGuyjFoXBASE+/Mac:fee< filea:elonea.dbť' • COMPRESSION SOBROOTXNS FOR AHALYSIS FROGRAMS
OSE TEMP1
OCUNT ŤO TOT
RSPLACE tel, RFEND WITH 1
MARKl - 1
SW2»0
WHILE SW2bO ROLL XF MARKl >» TOT PACK
CCUNT TO UNIQOB
COUNT TO NEWGENES FOR D='H' .OR.D-O'
SW2«1
LOOP
ENDIF <30 MARKl DUP - 1
STORS ENTRY TO TĚSTA SW 0
DO WHILE SW=0 TEST SKIP
STORS ENTRY TO TESTE IF TĚSTA a TSSTB OHTiETS DUP = DUP-t-1 LOOP
ENDXF
GO MARKl'
REPLACE RFEND WITH DUP
MARKl « MARK1+DUP
SW«1
LOOP
ENDDO TEST
LOOP
ENDDO ROLL
GO TOP
STORS R TO FONC
OSS Analysi* function.dbť
LOCATE FOR P-FONC
-REPLACE CLONES WITH TOT
REPLACE GENES WITH ONXQOE ~
REPLACE NEW WITH NEWGENESUSE TEMP1
SORT ON RFÍND/D TO TEMP2
OSE ΤΈΜΡ2
SBT HEADXK3 CN
7? STR(ONXQUE,5,0) _ ?? * g«ncs, far & total ef *
STB(TCT,5,0) 1 eiaaee* »»» ? 1 V Coineidence' list' off fields TMiwWrr,RPBJPr Lr Df T, Z. R, C. SOTRY, S, DESCRIPTQR. L5NOIH. INIT, I »«« •SCREEN 1 TYPE O HEADXN3 'Screta 1’ AT 40,2 SXZS 286,492 PIXELS FONT Geneva‘,12 COLOR 0,0, •list c££ fields rfend, s,descriptor •SET PRXKT OFF
CLOSS DATABASES ERASE TEHF1.D3F ERASS TEMF2.DBF OSE TSKPDESIG * CCMPRESSICN SUBRQUTTNE FOR ANALYSIS PROGRAKS
USE T2ÍP1
COUNT TO TOT
REFLACE ALL RFEW WITH 1
MARXI « 1
SW2-0
DO WELLE SW2-0 ROLL IF MARXI > TOT FACX
COUNT TO UNIQUE
SW2=1
LOOP
ENDIF
C-0 MARXI
DUP « 1
STORE EOTRY TO TĚSTA
SW - 0
DO WHILE SW®0 TEST
SKIP
STORE EOTRY TO TESTB IF TĚSTA TESTB EELEIE DUP = CUP+1 LOOP
ENDIF
GO MARXI
REPLACE RFEND WITH DUP
MARXI = MARK1+OUP
SW«1
T.OOP
ENDDO TEST
LOOP
ENDDO ROLL ' ·
C-O TO?
STORE F TO DIST
USE Analysis distribution.dbf
LOCATE FOR P»DIST
REPLACE CLONES WITH TOT
REPLACE GENES’WITH UNIQUE
USE ΤΈΜΡ1 «ort caa rfead/d to TEMP2
USE TEMP2 ?? STR(UNIQUE,5,0)
7? * ganes, for a total of 1
STR(TOT,5,0) 1 clcoaa1 ' V Coincidence' liat ofť fielda nuafeer,RFEJD,L,D,F, E,R,C, ETIKY, S,DESCRIPT0R,LEN3IH,INIT, I ‘SET PRIOT OFF
CLOSE DATABASES
ERASE TEMPl.DBF
ERASS TSMP2.DBF
USE TEMPDESIG * COMPRESSICN SUBROOTME FOR ANALYSIS PROGRAMS
USE TEMP1
COUNT TO TOT
RSPLACE ALL RFEND WITH 1
MARXI a 1
EW2-0
DO WHILE SW2-0 ROLL IF MARXI >- TOT PACX
COUNT TO UNIQUE
SW2«1
LOOP
ΗΟΠ
GO MARXI
DUP a 1
STORE ENTRY TO TĚSTA
SW < 0
DO WHILE SWaO TEST
SKI?
STORE ENTRY TO TESTB IF TĚSTA «· TESTB OBLETE DUP .a DUP+1 LOOP
ENDIF
GO MARXI
REPLACE -RFEND WITH COP
MARXI a MARKl+DUP
SWal
LOOP
ENDDO TEST
LOOP
ENDDO ROLL'
GO TO?
USE ΤΞΜΡ1
7? STR(UNIQUE,5,0) ' genes, for a_ total of '
7? STR(TOT,5,O)
7? 1 clonee1 1 V Coiacidenc·' — list off fields znsnber,RFEND,L,D,F,Z,R,C,Q7IRY,S,DESCRIPIOR,XÁENGTH,INIT,I •SET PRINT OFF
CLOSS DATABASES
ERASE TEMF1.CB?
USE TEMPOESIS .
« COMPRSSSION SUBROOTINE FOR ANALYSIS PROGRAMS USE ’SjnarcCuy:Fo>í3ASE-*-/Mae:fox files:Clones.dbf·
COPY TO TSMP1 FOR
USS ΤΞΜΡ1
COUOT TO IDGENE FOR D«'E· .OR.D-Ό' .OR.D=’H' .OR.D-'Ν' .OR.D='R' .OR.D-'λ1 DELETS FOR D=‘N' -OR.D='D' .OR.D=’A' ,OR.D=’U’.OR.D='S' .OR.D«’M' .OR.D»'R‘ .OR.D^V’
PACK
COUNT TO TOT
REPIACS ALL RFEND WITH 1
MARKl « 1
SW2=Q
DO WHILE SW2=0 ROLL I? MARKl >= TOT PACK
COUNT TO UHIQUE
SW2sl
LOOP
ENDIF
GO MARXI
DUP - 1
STORE ENTRY TO TĚSTA
SW - 0
DO WHILE SW«0 TEST
SKIP
STCRE ENTRY TO TESTB if Těsta = testb DELETE*
DUP - DUP+l LOOP
SNDIF
GO MARXI
RESLACE RFEND WITH DUP
MARXI » MARXl+DUP
SW=1
LOOP
ENDDO TEST
LOOP
ENDDO ROLL ‘BSOWSE_ ♦SET FRINTER ON
SORT ON RFEND/D.MUMBER TO TEMP2
USE TEMP2
REPIACS ALL START WITH RFEND/HX2NE*10000 ?? str(w:qce,5,0) ?? ' genes, for a total of · _ ?? STR(TOT,5,0J ?? ' elones’ ? ' Coincidence V V Cloaes/100001 set heading off
SCREEN 1 TYPE 0 HEADING 'Sereen 1’ AT 40,2 SIZE 286,492 PIXELS FONT *Geneva\2 COLOR 0,0,0 list fields aumber,RFEND,START,L,D,F,Z,R,C,ENTRY,S,DESCRIPTOR,INIT,I ♦SET PRIOT OFF
CLOSE DATABASES
ERASE TEMP1.DBF
ERASE TEMP2.DBF
USE 'SoartGuy:FoxBASE+/Mac:fox filea:dones.dbf* * COMPRESSION SUBROOTINS FOR ANALYSIS PROGRAMS
USE TEWP1
COUOT TO IDGENE FOR D»'3‘ .OR.D*'O' ,OR.D« Ή' .0R.D»'N' .OR.D»'R· .OR.D='A'
DELETE FOR D='N· .OR.D='D· .OR.D='λ'.OR.D=‘U’ ,OR.D«'S' .OR.D«'M' .OR.Cte’R' .OR.Da-V’
PACK
COGNT TO TOT
REPLACE ALL RFEND WXTH 1
MARK1 « 1' .
SW2»0
DO WHILE SW2-0 ROLL IF MA&K1 >- TOT PACK
COQNT TO UNIQU3
SW2=1
LOOP
ENDIF
GO MARXI
DG? a l
STORE ECHY TO TĚSTA
SW a 0
DO WHILE SW«0 TEST
SKIP
ST0R2 ENTRY TO TESTB IF TĚSTA s TESTS DELETE .
DUP - DGP+l LOOP ·
ENDIF
GO MARXI
REPLACE RFEND WITH DUP
MARK1 - HARXXvDOP
SWal
LOOP
ENDDO TEST
LOOP
ENDDO ROLL ♦BROWSE ♦SET PRIOTSR ON
SORT ON RFEND/D,NUMBER TO ΪΕΜΡ2
OSE TS4P2
REPLACE ALL START WXTH RFEND/IDGEME*10000 ?? STR(UNIQUE,5,0) ?? ' gen·», for a total of 1
7? STR(TOT,5,0)
7? · cloae»* ? 1 Coincideacj V V denes/10000'
Bet heading off
SCREEN 1 TYFE 0 HEAÍ5ING 'Screen 1' AT 40,2 SXZS 286,492 PXXELS FONT *Geneva\7 COLOR list fields nUDber,RFEND,START,L,D,?,Z)R,C,STIHY,S,DESCRIPTOR’, ΠΤΙΤ, I ♦SET PRIKT OFF
CLOSE DATA3ASES _
ERASE TOČÍ.DBF
ERASE TEMP2.DBF
USE 'SaertGuy:FoxBASE>/Mac«fox filé»:dones.dbf’
0,8,
- 74 USE TEMP!
COUNT TO TOT
7? ' Total of* ?? STR(TOT,4,0)
7? ' cionee' *liat Off fielda nwrb«r,L.D.F,2,R,C,SOTía,mSCRIPTCa,UaeTH,iar21©,IlIlT,I list off fielda ntanber,L,D,F,Z,R,C,ENTHY,EESCRIPTDR CLOSE DATABASES
ERASE-TEMP1.DBF
USE TsMPDESIG •Lifeecan menu; version 8-7-94
SET TALK OFF sec device to screen
CLEAR
USB 'SmBrtGuy:FcxEASE+/Mec:fox files t dones .dbf* STORE LUPDATEO TO Update CO BOTTCM
STOPE RECNOO TO doneno
STOPE 6 TO Chooser
DO WHHE .T.
* Program.: Lifeseg menu.fmt •Dáte....: 1/11/95 * Version.: FoxEASS+/Mac, revision 1.10 * Notes....: Fermat filé Lifeseg menu
SCREEN 1 G PIXELS
PIXELS
PIXELS a ptxels G PIXELS G PIXELS G PIXELS 0 PIXELS G PIXELS G PIXELS Θ PIXELS 8 PIXELS
TYPE 0 KEADIN3 *Screen 1* AT 40,2 SIZE 286,492. PIXELS FCNT ‘Geneva’,268 COLOR 18,126 TO 77,365 STYLE 28479 COLOR 32767,-25600,-1,-16223,-16721,-15725 110,29 TO 188,217 STYLE 3871 COLOR 0,0,-1,-25600,-1,-1
45,161 SAY 'LIFESEO' STYLE 65536 PCMT *Geaeva’,536 COLOR 0,0,-1,-1,7135,5884 36,269 SAY 'TM* STYLE 65536 PONT *Geneva*,12 COLOR 0,0,-1,-1,7135,5884 63,143 SAY 'Mdecular Biology Desktop* STYLE 65536 FCNT *Helvetic&*, 18 COLOR 0 90,252 TO 251,467 STYLE 28447 COLOR 0,0,-1,-25600,-1,-1
117,270 GET Chooser STYLE 65536 FONT 'Chicago*, 12 PICTURS *3*RV Transcript pro
135.128 SAY Update STYLE 0 FCNT *G«neva',12 SIZE 15,79 COLOR 0,0,0,-25600,-1,-:
171.128 SAY cloněno STYLE 0 FONT *Geneva*,12 SIZE 15,79 COLOR 0,0,0,-25600,-í,<
135.44 SAY 'Laflt Update:* STYLE 65536 FONT *Geieva*,12 COLOR 0,0,-1,-1,-1,-1
171.44 SAY 'Total dones:* STYLE 65536 FONT *Geneva',12 COLOR 0,0,-1,-1,-1,-1 45,296 SAY *Vl.30* STYLE 65536 FCNT *Ceneva*,782 COLOR 0,0,-1,-1,-1,-1
0,0,
0,0, files . · •1 * EOF: Lifeseg menu.fmt
READ
DO CASE
CASE Chooser·!
DO SraartGuy:Fcx2ASE+/Mae:fox files:Output programetMaster analysis 3.prg' CASE Chooaer-2
DO 'SmarcGuy;Fox3ASE+/Mac:fox files:Output programssSubtractien 2.prg’ 'CASE Chooser«3
DO *SaartGuy:FaxSASE+/Mae:ťox ťilas:Output programesNorchem (single) .prg* CASE Chooser-4 USE 'Libraries.dbf·
SROWSE
CASE ChooserM5
DO *SmartGuy:FoxBASE+/Mae:fox fileslOutput programs iSee individual cloně.prg* CASE Chocs«r»6
DO 'SaartGuy:FaxBA£E-t-/Mae:fox filesiLibraries:Output programs:Nenu.prg'
CASE Choos«Xx7 CLEAR '
SCREEN 1 OFF
RETUFN
ENDCASB
LOOP
ENECO
81,30 SAY Database Subset Analysis* STYLE 55536 FONT *Geneva*,274 COLOR 0,0,0,-1,-1,-1 7 7 7 7 dáte O 7? ’ ’
ΊΤΜ8Ο 'Cloně nunbers ’
7? STRdNITIATE, 6,0) ?? ' through '
7? STR(TSRKINATE,6,0) 'Libraries: ' ‘ IF EOTIRE-1 'All libraxiea·
ENDIF
IF ENTHÍE=2 MARK-l , DO WHILE .T.
IF MARK>STO?IT
EXIT dDIF
USE SELECTED GO MASK 7 ' '
7? TMMdibnaa·)
STORS MARX+1 TO MARX LOOP
ENDDO
ENDIF 'Designationsi 1
IF Exnatch»0 .AND. HaatchsO .AND. CnatchsO
7? 'All1
ENDIF
Enatch-1 7? 'Exact,*
ENDIF
IF Hraatcbsl ?? 'Humen,’
ENDIF
Oaatch«l 7? 'Other ap.'
ENDIF
XF CONDEN-l 'Condensed formát analysis1 snďif
IF ANAL-1
7· ‘Sorted by NOMBER'
ENDIF
IF’ANAL-2 1 Sorted by ENTKY' —
ENDIF IF ANAL-3 'Arranged ty ABUNDANCE'
ENDIF IF ANAL-4 'Sorted by ZNTEREST'
ENDIF
IP ANAL-5 'Arranged by LOCATICN'
ENDIF IF ANAL-5 'Arranged by DISTRIBUTICN ’
ENDIF IF ANAL-7 'Arranged by FUNCTTON’
ENBIF ? ''Total clonee rcpreseaced: * 7? STRCSTARTCT,6.0) ? Total clonee analyzedi *
7? STR(MJALTOT,6,0) ?
USE TEMP1 COUNT TO TOT ?? ' Total of ?? STR(TOT,4,0) ?? ' dones' ?
•list dff fields ηυιώΚΓ,Ε,Ο,Ρ,Ζ,Κ,Ο,ΣΝΤΚΥ,ΠΕΒΟΚΙΡΤΟΕ,ΙΒΝΟΤΗ,ΚΓΞΝΟ,ΣΝΙΤ,Ι list off fields nuntoer,L,D,F, Z,R,C,ENTRY,DESCRIPTQR CLOSE DATABASES
ERASE TEMP1.D3F USE TEMPDESIG »
USE TEMP1
COUNT TO TOT
7? 1 Total of*
7? STR(TOT,4,0)
7? ’ dones!
.
♦list off fields number, L,D,F, Z,R,C,ENTRY,DSSCRIFT0R,LEN3IH, RFEND, INIT.I list off fields neober,L,D,F,Z,R,C,ENTRY,DSSCRIFTOR.
CLOSE DATABASES
ERASE TBIP1.DB?
USE TEMPDESIG •Northern (single), version 11-25-94 close databases SET TALK OF?
SET PRIOT OFF SET EXACT OFF CLEAR
STORE 1 ' TO Eobject
STORE * ' TO Dobject
STORE 0 TO Numb
STORE 0 TO Zog
STORE 1 TO Bail
DO WHILE . T.
• Program.: Northern (single) .ánt • Dáte....: 8/ 8/94 • Version.: FoxBASE*/Mac, revision 1.10 • Notes....: Formát filé Northern (single)
SCREEN 1 TYPE 0 HEADING ‘Screen 1* AT 40,2 SIZE 286,492 PIXELS FONT 'Geneva',12 COLOR 0.0,0 ® PIXELS 15,81 TO 46,397 STYLE 28447 COLOR 0,0,-1,-25600,-1,-1 ® PIXELS 89,79 TO 192,422 STYLE 28447 COLOR 0,0,0,-25600,-1,-1 ® PIXELS 115,98 SAY ‘Entry I:’ STYLE 65536 PONT Geneva’,12 COLOR 0,0,0,-1,-1,-1 e PIXELS 115,173 GET Eobject STYLE 0 FONT ’Geneva’,12 5123 15,142 COLOR 0,0,0,-1,-1,-1 Q PIXELS 145,89 SAY Description' STYLE 65536 FONT Geneva’,12 COLOR 0,0,0,-1,-1,-1 ® PIXELS 145,173 GET Dobject STYLE 0 FONT Geneva',12 SIZE 15,241 COLOR 0,0,0,-1,-1,-1 ® PIXELS 35,89 SAY ‘Single Northern search screen STYLE 65536 FONT ’Geneva,274 COLOR 0,0,® PIXELS 220,162 GET Bail STYLE 65536 FCOT •Chicago’, 12 PICTDRS ’3*R Concinue;Bail cuť SIZE ® PIXELS- 175,98 SAY Cloně f:’ STYLE 65536 FONT Geneva’;12 COLOR 0,0,0,-1,-1,-1 ® PIXELS 175,173 GST Numb STYLE 0 FONT ‘Geneva’,12 SIZE 15,70 COLOR 0,0,0,-1,-1,-1'
S PIXELS 80,152 SAY ’Enter any ONE of che following:' STYLE 65536 FONT Geneva’,12 COLOR -1, • EOF: Northern (single).fat
READ
IF Bail-2
CLEAR screen 1 off
R3TORN
ENDIF
USE •SmartGuy:FoxBASB+/Mae:Fox files:Lookup.dbf'
SET TALK-CN ·
IF Eobjecto' . '
STORE OPPER(Eobject) to Eobject
SET SAFETY OFF
SORT CN Entry TO Lookup entry.dbf·
SET SAFETY ON
USE Lookup entxy.dbf*
LCCATE FOR Look-Bobjeet
IF .NOT.PCONDO
CLEAR
LOOP
ENDIF
BRCWSE
STORE Entry TO Searehval
CLOSE DATABASES
ERASS Lookup · entry. dbf *
ENDIF _
IF Dabjecto' '
SET EXACT OFF
SET SAFETY OFF
SORT ON descriptor TO Lookup deseriptor.dbf’
SET SAFETY On
USE 'Lookup descriptor.dbf·
LOCATE FOR UPPER (TRIK (descriptor) )=U?PER(TRIK (Dobject))
IF .NOT.FCUNDO
CLEAR
LOOP
ENDIF
BROWSE
STOPE Entry TO Searchval
CLOSE DATABASES
ERASE Lookup descriptor.dbf·
SET EXACT CN ENDIF
IF NuaboO
USE *SmartCuy:FoxBASE4/Mac:Fox files:clcaea.dbf’
CO Numb BROWSS
STOPE Entry TO Searchval'
ENDIF
CLEAR ? 'Northern aaalyaia žer ěntry *
Searchval ?
'Enter Y to proceed'
WAIT TO OK CLEAR
IF UPPER(OK)<>'Y' aereen 1 off RETURN ENDIF · * cctcPKESSXON subrouttne for library.dbf 7 'Ccmpreasing the Libraries filé ncw.
USE 'SmartGuy:FoxSASE+/MaciFcx files:libraries.dbf* SET SAFETY OFF
SORT CN library TO ‘Coapreaaed libraries.dbf * FOR entcrcťbO SET SAFETY ON
USE 'Compraaaed libraríea.dbf
DELETE FOR entered-0
PACK
COUNT TO TOT'
MARK1 1 SW2aO
DO WHILE SW2«0 RDLL IF MARXI >- TOT PACK SW2«1 LOOP ENDIF
GO MAPJO.
STORE library TO TĚSTA SKIP
STORE Library TO TESTB IF TĚSTA « TESTB DELETE ENDIF
MARXI . MARX1+1 LOOP
ENDDO ROLL * Northern analys ia CLEAR 'Doing the northem now... ’
SET TALK ON
USE ,SmartGuy:FoxSASE*/Mae:Fox fileasclonea.dbf· SET SAFETY OFF
COPY TO •Hita.dbf· FOR entry·searchval SET SAFETY ON
CLOSS DATABASES SELECT 1
USE 'Conpressed libraries.dbf·
STORE RSCCQONT0 TO Entries SSLECT 2
USE 'Hit*,dbf
Warksl
DO WHILE .T.
SELECT 1
IF říark>Entries
EXIT a ENDZF
GO MARK . STORE lihrary TO Jigcrer
SELECT 2 * COUNT TO Zog FOR library-Jigger
SELECT 1
RBPLACE hits witó Zog
Mark«Karktl
LOOP
ENDDO
SELECT 1
BRCMSE FIELDS LIBRARY,LIBNAMS,EtírSRED,HXTS AT 0,0 CLEAR 'Enter Y to print:'
WAIT TO PRINSET IF UPPSR(PRINSET)«'Y'
SET PRINT CN V
CLEAR zašeř·
SCREQf 1 TYPE 0 HEADING 'Screen 1' AT 40,2 SXZS 286,452 PIXELS FONT Geneva',14 COLOR 0,0,0 7 'DATABASE ENTRIES MATCHING ENTRY '
7? Searchval
DATEO
SCREEN 1 TYPE 0.HEADING 'Screen 1' AT 40,'2 SIZE 286,492 PIXELS FONT Geneva',7 COLOR 0,0,0, LIST OFF FIELDS librery, lihneme, entered. hits
SELECT 2
LIST OFF FIELDS NDMBSR,LIBRARY,D.S.F,Z,R,ENTRY,DESCRIPTOR.RFSTART,START,RFEND SET TALK OFF SET PRINT OFF ENDIF
CLOSE DATABASES
SET TALK OFF
CLEAR
DO ‘Test prínt.prg·
RETURN 83
TABULKA 6 b t a r y
ADSNINB01
ADRBQOR01
ADRHNOTO1
AWLSNOT01
BMARNOTOI
8MARNOTQ2
CARONOTOI
CHAONOTO1
CORNNOTU1
FBRAGT01
FIBRAGTC2
RSRANT01
FlSnNGTOl
FI2RNGTO
R9RNOT01
R8SNOTO2
HMC1NOT01
HUVELPBO1
HUVENOBOI
HUVESTBOÍ
HYPONO0O1
KIDNNQT01
UVRNOTO1
LUNG NOT01
MUSCNOT01
OVIONOB01
PANCNOTOI prruNOfloi pmjNOToi
PLACNO801
SiNTNOToa
SPLNFET01
SPVNNOTD2
STOWNOTDl
6YNORAB01
TBLYNOTD1
TESTNOTOI
THP1NOB01
THP1PEBO1
THP1PLBO1
U937NOT01 libname Inftamed adenoid Adrenal jland (0 Adrenal gland (T)
AWL blast eaUs (T) Bon· mano*
Bone mano* (T) Cardlao muaele (η Chin. hamaler ovaiy Comeal aroma Rbroblaet, AT 5 FibfofcJíít, AT 30 RbrobJasL AT RbroblasL uv 5 Fibroblíít, uv 30 Fibroblasl RbroblasL normál Mátl eeO Une HMC-1 HUVEC IFN.TNF, LPS HUVEC control HUVEC shear stře» Hypothalamus Wdney (T)
LiverfO Lung (T)
Skaletel muaele (T) Ovlduet
Panereas, normál Pltuitary (r)
PBullary (T)
Placenu
Smáli inteatíne (T) Spleen?liver, letel Spleen (T)
Slomach
Rheum. tyndvktm_
T + B lymphoblaet Teatia (TJ THP-l eonwl THPphorbol THP-1 photbol LPS U937, monoeytlc louk
number tibrary d af z r enlry deaerlptor ríatariarart rfend
2304 U837NOTOI E H C C T HUMEF1B Eiongallon laelor 1-bela 0 773
3240 HMC1NOT01 E H C C T HUMEF1B Elongalien laelor 1«beta 0 370 773
3269 HMC1NOT01 E H C C T HUMEF1B Elongation laetor i-beta 0 371 773 .
4693 HMC1NOTO1 E K C C T HUMEFlB Elongation laetor 1-bata 0 470 773
1989 HMC1 ΝΟΤΟΙ E H C C T HUMEF1B Elongation laetor i-beia 0 327 773 A
9139 HMC1 ΝΟΤΟΙ E H C C T HUMEF18 Elongatloft laetor i-beia 0 375 773
1' <?£
<
-o i—
XJí
ř—' to
—1 2 O < —s
T?
X?
CTC
X o
O 55
- £ c O
o
C3
;— o
CZM r—
(jO- O
o n<
cn
PATENT

Claims (10)

1. Způsob analýzy vzorku obsahujícího genové transkripty, vyznačující se tím, že zahrnuje kroky
a) získání první směsi mRNA,
b) přípravy cDNA kopií této mRNA,
c) izolace reprezentativní populace klonů transfekovaných touto cDNA a vytvoření první knihovny biologických sekvencí z této řečené populace,
d) generování prvního souboru genových transkriptů, kde každý z prvních genových transkriptů v řečeném prvním souboru je indikativní pro jednu různou biologickou sekvenci z první knihovny, a dále kde jsou genové transkripty odvozeny z 5' konce cDNA,
e) zpracování prvních genových transkriptů v programovaném počítači, v němž je uložena databáze referenčních sekvencí transkriptů indikativní pro referenční biologické sekvence, ke generování první hodnoty identifikované sekvence pro každý z prvních genových transkriptů, kde každá řečená hodnota identifikované sekvence je indikativní pro anotaci sekvence a stupeň shody mezi jedním z druhých genových transkriptů a přinejmenším jedním z referenčních genových transkriptů , a
f) zpracování každé řečené druhé hodnoty identifikované sekvence za generování druhých konečných hodnot dat indikativních pro počet, v kterém je každá druhá hodnota identifikované sekvence přítomná v druhé knihovně biologických sekvencí.
2. Způsob podle nároku 1, vyznačující se tím, že první knihovna biologických sekvencí zahrnuje alespoň 5 000 sekvencí získaných z linie lidských buněk.
1, vyznačující
3. Způsob podle nároku tím, že dále zahrnuje
g) získání druhé směsi mRNA z druhé linie lidských buněk,
h) přípravy cDNA kopií této mRNA,
i) izolace reprezentativní populace klonů transfekovanýqh touto cDNA a vytvoření druhé knihovny biologických sekvencí z této populace,
j) generování druhého souboru genových transkriptů, kde každý z druhých genových transkriptů v řečeném druhém souboru indikativní pro jednu různou biologickou sekvenci z druhé knihovny,
k) zpracování druhých genových transkriptů v programovaném počítači, v němž je uložena databáze referenčních sekvencí transkriptů indikativní pro referenční biologické sekvence, ke generování druhé hodnoty identifikované sekvence pro každý z druhých genových transkriptů, kde každá řečená druhá hodnota identifikované sekvence je indikativní pro anotaci sekvence a stupeň shody mezi jedním z prvních genových transkriptů a přinejmenším jednou z referenčních sekvencí transkriptů , a
f) zpracování každé řečené hodnoty identifikované sekvenče za generování prvních konečných hodnot dat indikativhích pro počet, v kterém je každá první hodnota identifikované sekvence přítomná v první knihovně biologických sekvencí.
4. Způsob podle nároku 3, vyznaču tím, že dále zahrnuje
m) zpracování prvních konečných hodnot dat konečných hodnot dat z 1) za generování hodnot transkriptů, kde každá řečená hodnota podílu je rozdíl v počtech genových transkriptů mezi a druhou směsí mRNA.
JÍCÍ z f) a druhýčh podílů genových indikativní pro první směsí mRNA
5. Způsob podle nároku 3, v tím, že dále zahrnuje
n) odečtení prvních konečných konečných hodnot dat z 1) za získání přičemž první směs mRNA je pacienta a druhá směs mRNA je pacienta.
č u j ící dat z f) od druhých hodnot rozdílů, ze zdravého lidského z nezdravého lidského y z n a hodnot souboru získána získána
6.
tím, primerů
Způsob podle nároku ž e cDNA kopie se
1, vyzná připravuj i s čující se použitím náhodných
7. Způsob kvantifikace relativní hojnosti mRNA v biologickém vzorku vyznačující se tím, že zahrnuje kroky
a) izolace populace mRNA transkriptů z biologického vzorku,
b) identifikace genů, z nichž byla mRNA transkribována pomocí sekvenčně specifické metody,
c) stanovení počtů mRNA transkriptů, odpovídajících každému z těchto genů, a
d) použití počtů mRNA transkriptů ke stanovení relativní hojnosti mRNA transkriptů v populaci mRNA transkriptů.
8. Způsob podle nároku 7, vyznačující se tím, že dále zahrnuje
e) vytvoření obrazu genových transkriptů, založeného na datech o relativní hojnosti mRNA transkriptů v populaci mRNA transkriptů,
f) porovnání obrazu transkriptů z e) s obrazem genových transkriptů, odvozeným z chorobného biologického vzorku nebo normálního biologického vzorku.
9. Způsob vytvoření obrazu genových transkriptů, vyznačující se tím,že zahrnuje kroky
a) izolace směsi mRNA z biologického vzorku,
b) přípravy cDNA kopií této mRNA,
c) inzerce této cDNA do vhodného vektoru a transfekce buněk vhodného hostitelského kmene a nárůstu klonů, kde každý klon reprezentuje jedinečnou mRNA,
d) izolace reprezentativní populace alespoň 5 000 rekombinantních klonů,
e) identifikace amplifikováných cDNA z každého klonu v populaci sekvenčně specifickou metodou, která identifikuje gen, z kterého byla mRNA transkribována,
f) stanovení počtu, kolikrát je každý gen zastoupen v populaci klonů, jako ukazatele relativní hojnosti, a
g) seřazení genů a jejich relativních hojností v pořadí hojnosti, a tímto vytvoření obrazu genových transkriptů.
10. Způsob podle nároku 9, vy tím, že dále zahrnuje
h) porovnání obrazu transkriptů transkriptů, odvozeným z chorobného normálního biologického vzorku.
znacujici se z e) s obrazem genových biologického vzorku nebo γο·
Spolupracovník číslo jméno adresa telefon fax
CZ962189A 1994-01-27 1995-01-27 Comparison analysis of gene transcriptors CZ218996A3 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/187,530 US5840484A (en) 1992-07-17 1994-01-27 Comparative gene transcript analysis
US08/282,955 US6114114A (en) 1992-07-17 1994-07-29 Comparative gene transcript analysis

Publications (1)

Publication Number Publication Date
CZ218996A3 true CZ218996A3 (en) 1997-05-14

Family

ID=26883115

Family Applications (1)

Application Number Title Priority Date Filing Date
CZ962189A CZ218996A3 (en) 1994-01-27 1995-01-27 Comparison analysis of gene transcriptors

Country Status (17)

Country Link
US (1) US6114114A (cs)
EP (1) EP0748390A4 (cs)
JP (1) JPH09503921A (cs)
CN (1) CN1145098A (cs)
AP (1) AP9600833A0 (cs)
AU (1) AU688465B2 (cs)
BG (1) BG100751A (cs)
BR (1) BR9506657A (cs)
CA (1) CA2182217A1 (cs)
CZ (1) CZ218996A3 (cs)
EE (1) EE9600097A (cs)
FI (1) FI962987A (cs)
LV (1) LV11696B (cs)
NO (1) NO963151L (cs)
OA (1) OA10723A (cs)
PL (1) PL315687A1 (cs)
WO (1) WO1995020681A1 (cs)

Families Citing this family (95)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6040138A (en) * 1995-09-15 2000-03-21 Affymetrix, Inc. Expression monitoring by hybridization to high density oligonucleotide arrays
US6974666B1 (en) 1994-10-21 2005-12-13 Appymetric, Inc. Methods of enzymatic discrimination enhancement and surface-bound double-stranded DNA
US6600996B2 (en) * 1994-10-21 2003-07-29 Affymetrix, Inc. Computer-aided techniques for analyzing biological sequences
US5695937A (en) * 1995-09-12 1997-12-09 The Johns Hopkins University School Of Medicine Method for serial analysis of gene expression
US5866330A (en) * 1995-09-12 1999-02-02 The Johns Hopkins University School Of Medicine Method for serial analysis of gene expression
US5972693A (en) * 1995-10-24 1999-10-26 Curagen Corporation Apparatus for identifying, classifying, or quantifying DNA sequences in a sample without sequencing
US6418382B2 (en) 1995-10-24 2002-07-09 Curagen Corporation Method and apparatus for identifying, classifying, or quantifying DNA sequences in a sample without sequencing
US5871697A (en) * 1995-10-24 1999-02-16 Curagen Corporation Method and apparatus for identifying, classifying, or quantifying DNA sequences in a sample without sequencing
US7468243B2 (en) 2001-03-12 2008-12-23 Affymetrix, Inc. 2-aminopyrimidin-4-one nucleic acid labeling compounds
US6965020B2 (en) 1996-01-23 2005-11-15 Affymetrix, Inc. Nucleic acid labeling compounds
US6864059B2 (en) 1996-01-23 2005-03-08 Affymetrix, Inc. Biotin containing C-glycoside nucleic acid labeling compounds
US7282327B2 (en) 1996-01-23 2007-10-16 Affymetrix, Inc. Nucleic acid labeling compounds
US20010018514A1 (en) 1998-07-31 2001-08-30 Mcgall Glenn H. Nucleic acid labeling compounds
US7291463B2 (en) 1996-01-23 2007-11-06 Affymetrix, Inc. Nucleic acid labeling compounds
US7423143B2 (en) 1996-01-23 2008-09-09 Affymetrix. Inc. Nucleic acid labeling compounds
US6312892B1 (en) * 1996-07-19 2001-11-06 Cornell Research Foundation, Inc. High fidelity detection of nucleic acid differences by ligase detection reaction
US5939265A (en) * 1996-11-05 1999-08-17 Abbott Laboratories Reagents and methods useful for detecting diseases of the lung
WO1998014619A1 (en) * 1996-10-03 1998-04-09 Incyte Pharmaceuticals, Inc. Methods for generating and analyzing transcript markers
US5919638A (en) * 1996-10-08 1999-07-06 Abbott Laboratories Reagents and methods useful for detecting prostate tumors
US20050202499A1 (en) 1996-10-31 2005-09-15 Billing-Medel Patricia A. Reagents and methods useful for detecting diseases of the breast
DE69737788T2 (de) * 1996-10-31 2008-03-13 Abbott Laboratories, Abbott Park Reagenzien und methoden zum nachweis von erkrankungen der brust
US5981190A (en) * 1997-01-08 1999-11-09 Ontogeny, Inc. Analysis of gene expression, methods and reagents therefor
US6461814B1 (en) 1997-01-15 2002-10-08 Dominic G. Spinella Method of identifying gene transcription patterns
US5968784A (en) * 1997-01-15 1999-10-19 Chugai Pharmaceutical Co., Ltd. Method for analyzing quantitative expression of genes
CA2279551A1 (en) * 1997-01-31 1998-08-06 Abbott Laboratories Reagents and methods useful for detecting diseases of the lung
US6867016B1 (en) 1997-03-31 2005-03-15 Abbott Laboratories Reagents and methods useful for detecting diseases of the gastrointestinal tract
WO1998044160A1 (en) * 1997-03-31 1998-10-08 Abbott Laboratories Reagents and methods useful for detecting diseases of the gastrointestinal tract
JP2001522238A (ja) 1997-03-31 2001-11-13 アボツト・ラボラトリーズ 胃腸管の疾患の検出に有用な試薬および方法
US6368792B1 (en) 1997-03-31 2002-04-09 Abbott Laboratories Reagents and methods useful for detecting diseases of the gastrointestinal tract
US5966711A (en) * 1997-04-15 1999-10-12 Alpha Gene, Inc. Autonomous intelligent agents for the annotation of genomic databases
NO972006D0 (no) 1997-04-30 1997-04-30 Forskningsparken I Aas As Ny metode for diagnose av sykdommer
WO1998050567A1 (en) 1997-05-02 1998-11-12 Abbott Laboratories Reagents and methods useful for detecting diseases of the prostate
WO1998051824A1 (en) * 1997-05-15 1998-11-19 Abbott Laboratories Reagents and methods useful for detecting disease of the urinary tract
WO1998051805A1 (en) * 1997-05-15 1998-11-19 Abbott Laboratories Reagents and methods useful for detecting diseases of the prostate
WO1998055656A1 (en) * 1997-06-05 1998-12-10 Abbott Laboratories Reagents and methods useful for detecting diseases of the urinary tract
EP0990045A1 (en) * 1997-06-11 2000-04-05 Abbott Laboratories Reagents and methods useful for detecting diseases of the lung
WO1999002714A1 (en) * 1997-07-07 1999-01-21 Abbott Laboratories Reagents and methods useful for detecting diseases of the breast
WO1999002559A1 (en) * 1997-07-07 1999-01-21 Abbott Laboratories Reagents and methods useful for detecting diseases of the breast
WO1999002734A1 (en) * 1997-07-08 1999-01-21 Abbott Laboratories Reagents and methods useful for detecting diseases of the urinary tract
US20020064792A1 (en) * 1997-11-13 2002-05-30 Lincoln Stephen E. Database for storage and analysis of full-length sequences
EP1032689A1 (en) * 1997-11-17 2000-09-06 Abbott Laboratories Reagents and methods useful for detecting diseases of the breast
WO1999034016A2 (en) * 1997-12-29 1999-07-08 Genena Ltd. A method for identifying and characterizing cells and tissues
US6121023A (en) 1998-01-22 2000-09-19 Akzo Nobel N.V. Isothermal transcription based assay for the detection and quantification of the chemokine rantes
CA2323058C (en) 1998-03-31 2011-03-29 Genzyme Corporation Methods for the diagnosis and treatment of lung cancer by detection of proto-oncogene overexpression
JP2002510506A (ja) * 1998-04-02 2002-04-09 テラス ジェネティック リソーシズ,インコーポレイティド 遺伝子配列に遺伝障害を有する植物を得る方法
US6403778B1 (en) 1998-05-04 2002-06-11 Incyte Genomics, Inc. Toxicological response markers
WO2000012760A2 (en) * 1998-08-28 2000-03-09 Incyte Pharmaceuticals, Inc. Toxicological response markers
US6667176B1 (en) 2000-01-11 2003-12-23 Geron Corporation cDNA libraries reflecting gene expression during growth and differentiation of human pluripotent stem cells
US6453241B1 (en) 1998-12-23 2002-09-17 Rosetta Inpharmatics, Inc. Method and system for analyzing biological response signal data
CA2358100A1 (en) * 1998-12-31 2000-07-06 Teri Melese Method for generating a pathway reporter system
CA2381319A1 (en) * 1999-06-01 2000-12-07 Incyte Genomics, Inc. Molecules for diagnostics and therapeutics
US6960439B2 (en) 1999-06-28 2005-11-01 Source Precision Medicine, Inc. Identification, monitoring and treatment of disease and characterization of biological condition using gene expression profiles
CA2380549A1 (en) * 1999-08-05 2001-02-15 Incyte Genomics, Inc. Secretory molecules
US7244559B2 (en) 1999-09-16 2007-07-17 454 Life Sciences Corporation Method of sequencing a nucleic acid
US7211390B2 (en) 1999-09-16 2007-05-01 454 Life Sciences Corporation Method of sequencing a nucleic acid
WO2001020998A1 (en) * 1999-09-24 2001-03-29 Linden Technologies, Inc. Drug discovery using gene expression profiling
WO2001077684A2 (en) * 2000-04-10 2001-10-18 The Scripps Research Institute Proteomic analysis using activity-based probe libraries
GB0008908D0 (en) * 2000-04-11 2000-05-31 Hewlett Packard Co Shopping assistance service
US7363165B2 (en) * 2000-05-04 2008-04-22 The Board Of Trustees Of The Leland Stanford Junior University Significance analysis of microarrays
JP2004500846A (ja) * 2000-05-11 2004-01-15 アカデミス ジーケンホイス ベイ デ ユニフェルジテイト ファン アムステルダム Myc標的
CN1741036A (zh) * 2000-06-19 2006-03-01 科雷洛吉克系统公司 构造分类属于不同状态的生物样本的模型的方法
WO2002008453A2 (en) * 2000-07-21 2002-01-31 Phase-1 Molecular Toxicology Canine toxicity genes
US7110885B2 (en) 2001-03-08 2006-09-19 Dnaprint Genomics, Inc. Efficient methods and apparatus for high-throughput processing of gene sequence data
CA2377213A1 (en) * 2001-03-20 2002-09-20 Ortho-Clinical Diagnostics, Inc. Method for providing clinical diagnostic services
US6996477B2 (en) 2001-04-19 2006-02-07 Dana Farber Cancer Institute, Inc. Computational subtraction method
AUPR480901A0 (en) * 2001-05-04 2001-05-31 Genomics Research Partners Pty Ltd Diagnostic method for assessing a condition of a performance animal
US20030096268A1 (en) * 2001-07-06 2003-05-22 Michael Weiner Method for isolation of independent, parallel chemical micro-reactions using a porous filter
US20030148314A1 (en) * 2001-08-01 2003-08-07 Millennium Pharmaceuticals, Inc. Compositions, kits, and methods for identification, assessment, prevention, and therapy of colon cancer
US20030054396A1 (en) * 2001-09-07 2003-03-20 Weiner Michael P. Enzymatic light amplification
US6956114B2 (en) 2001-10-30 2005-10-18 '454 Corporation Sulfurylase-luciferase fusion proteins and thermostable sulfurylase
US6902921B2 (en) * 2001-10-30 2005-06-07 454 Corporation Sulfurylase-luciferase fusion proteins and thermostable sulfurylase
US20050124022A1 (en) * 2001-10-30 2005-06-09 Maithreyan Srinivasan Novel sulfurylase-luciferase fusion proteins and thermostable sulfurylase
CN1612936A (zh) 2001-11-09 2005-05-04 苏尔斯精细医药公司 利用基因表达分布图识别、监控和治疗疾病以及鉴定生物学状态
US7776524B2 (en) 2002-02-15 2010-08-17 Genzyme Corporation Methods for analysis of molecular events
US20050158742A1 (en) * 2002-05-22 2005-07-21 Fujitsu Limited Method for analyzing genome
US20050136457A1 (en) * 2002-05-22 2005-06-23 Fujitsu Limited Method for analyzing genome
TW200403434A (en) * 2002-07-29 2004-03-01 Correlogic Systems Inc Quality assurance/quality control for electrospray ionization processes
EP1431399A1 (en) * 2002-12-20 2004-06-23 Clinigenetics Methods and composition for identifying therapeutic agents of atherosclerotic plaque lesions
DE602004036672C5 (de) * 2003-01-29 2012-11-29 454 Life Sciences Corporation Nukleinsäureamplifikation auf Basis von Kügelchenemulsion
US7575865B2 (en) * 2003-01-29 2009-08-18 454 Life Sciences Corporation Methods of amplifying and sequencing nucleic acids
WO2005011474A2 (en) * 2003-08-01 2005-02-10 Correlogic Systems, Inc. Multiple high-resolution serum proteomic features for ovarian cancer detection
GB0412301D0 (en) 2004-06-02 2004-07-07 Diagenic As Product and method
US7981607B2 (en) 2004-08-27 2011-07-19 Esoterix Genetic Laboratories LLC Method for detecting recombinant event
WO2006047787A2 (en) 2004-10-27 2006-05-04 Exact Sciences Corporation Method for monitoring disease progression or recurrence
US20070003996A1 (en) * 2005-02-09 2007-01-04 Hitt Ben A Identification of bacteria and spores
US9777314B2 (en) 2005-04-21 2017-10-03 Esoterix Genetic Laboratories, Llc Analysis of heterogeneous nucleic acid samples
WO2006124628A2 (en) * 2005-05-12 2006-11-23 Correlogic Systems, Inc. A model for classifying a biological sample in relation to breast cancer based on mass spectral data
US20100203504A1 (en) * 2005-07-07 2010-08-12 Yoichi Katsumoto Substance-Information Acquisition Method Using Evanescent Light Beam, Substance-Information Measurement Apparatus, Base-Sequence Determination Method and Base-Sequence Determination Apparatus
US7608395B2 (en) 2005-09-15 2009-10-27 Baylor Research Institute Systemic lupus erythematosus diagnostic assay
EP1960547A2 (en) 2005-12-08 2008-08-27 Novartis AG Effects of inhibitors of fgfr3 on gene transcription
JP5706602B2 (ja) 2006-02-08 2015-04-22 ジェンザイム・コーポレーション ニーマンピック病a型に対する遺伝子治療
US20080250016A1 (en) * 2007-04-04 2008-10-09 Michael Steven Farrar Optimized smith-waterman search
MY150234A (en) * 2007-06-29 2013-12-31 Ahn Gook Pharmaceutical Company Ltd Predictive markers for ovarian cancer
CN101930502B (zh) * 2010-09-03 2011-12-21 深圳华大基因科技有限公司 表型基因的检测及生物信息分析的方法及系统
US11021703B2 (en) 2012-02-16 2021-06-01 Cornell University Methods and kit for characterizing the modified base status of a transcriptome

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5371671A (en) * 1990-03-13 1994-12-06 The Regents Of The University Of California DNA sequence autoradiogram digitizer and methodology implemented in the same
US5723286A (en) * 1990-06-20 1998-03-03 Affymax Technologies N.V. Peptide library and screening systems
US5364759B2 (en) * 1991-01-31 1999-07-20 Baylor College Medicine Dna typing with short tandem repeat polymorphisms and identification of polymorphic short tandem repeats
AU669489B2 (en) * 1991-09-18 1996-06-13 Affymax Technologies N.V. Method of synthesizing diverse collections of oligomers
US5270170A (en) * 1991-10-16 1993-12-14 Affymax Technologies N.V. Peptide library and screening method
US5541061A (en) * 1992-04-29 1996-07-30 Affymax Technologies N.V. Methods for screening factorial chemical libraries

Also Published As

Publication number Publication date
EP0748390A4 (en) 1998-04-01
AU688465B2 (en) 1998-03-12
WO1995020681A1 (en) 1995-08-03
EP0748390A1 (en) 1996-12-18
US6114114A (en) 2000-09-05
NO963151D0 (no) 1996-07-26
CA2182217A1 (en) 1995-08-03
JPH09503921A (ja) 1997-04-22
AU1694695A (en) 1995-08-15
NO963151L (no) 1996-09-27
BG100751A (en) 1997-07-31
AP9600833A0 (en) 1996-07-31
BR9506657A (pt) 1997-09-16
CN1145098A (zh) 1997-03-12
PL315687A1 (en) 1996-11-25
EE9600097A (et) 1996-12-16
LV11696B (en) 1997-08-20
FI962987A (fi) 1996-09-26
OA10723A (en) 2002-12-04
FI962987A0 (fi) 1996-07-26

Similar Documents

Publication Publication Date Title
CZ218996A3 (en) Comparison analysis of gene transcriptors
Li et al. Single-cell brain organoid screening identifies developmental defects in autism
US5840484A (en) Comparative gene transcript analysis
WO1995020681A9 (en) Comparative gene transcript analysis
JP6189600B2 (ja) T細胞受容体v/d/j遺伝子内の反復配列によるクローン細胞の同定
Huh et al. Large-scale transcriptome sequencing and gene analyses in the crab-eating macaque (Macaca fascicularis) for biomedical research
Sun et al. Serial analysis of gene expression in the frontal cortex of patients with bipolar disorder
JP2002191371A (ja) ジンクフィンガータンパク質によって標的にされる部位の選択および予め選択された部位に結合するジンクフィンガータンパク質を設計する方法
Lim et al. Identifying New COVID-19 receptor neuropilin-1 in severe Alzheimer’s disease patients group brain using genome-wide association study approach
Li et al. Single-cell RNA-seq and chromatin accessibility profiling decipher the heterogeneity of mouse γδ T cells
JP2001524311A (ja) 遺伝子転写における環境刺激性物質の毒性/病理学上の影響を同定する方法
Majda et al. Suppression subtraction hybridization and northern analysis reveal upregulation of heat shock, trkB, and sodium calcium exchanger genes following global cerebral ischemia in the rat
CN108060220B (zh) 弓形虫慢性感染雄性小鼠生殖系统靶标基因的鉴定及其在临床上的应用
Javed et al. Ikaros family proteins regulate developmental windows in the mouse retina through convergent and divergent transcriptional programs
Shiue Identification of candidate genes for drug discovery by differential display
JP2001505417A (ja) 生物の成長に必須の遺伝子の同定方法
JP2002537835A (ja) 合成遺伝子エレメントを同定する方法及び試薬
CN114591980A (zh) Cars基因突变体及其应用
CN114921560A (zh) 一种肝纤维化和肝癌无创生物标志物
Youssef et al. Research in Practice
MXPA96003077A (en) Comparative analysis of the transcription of the
Li et al. Single-cell next-generation sequencing and its applications in cancer biology
Youssef et al. Genetics Research Methods
CN115961021A (zh) Covid-19的检测、诊断和治疗方法
CN114921559A (zh) Gpnmb基因作为无创生物标志物在制备诊断肝纤维化和肝癌疾病产品中的应用

Legal Events

Date Code Title Description
PD00 Pending as of 2000-06-30 in czech republic