CZ318997A3 - Geny kódující polypeptidy regulačního faktoru lymfocytárního interferonu - Google Patents

Geny kódující polypeptidy regulačního faktoru lymfocytárního interferonu Download PDF

Info

Publication number
CZ318997A3
CZ318997A3 CZ973189A CZ318997A CZ318997A3 CZ 318997 A3 CZ318997 A3 CZ 318997A3 CZ 973189 A CZ973189 A CZ 973189A CZ 318997 A CZ318997 A CZ 318997A CZ 318997 A3 CZ318997 A3 CZ 318997A3
Authority
CZ
Czechia
Prior art keywords
lsirf
sequence
seq
nucleic acid
polypeptide
Prior art date
Application number
CZ973189A
Other languages
English (en)
Inventor
Toshifumi Matysuyama
Alex Grossman
Christopher Richardson
Original Assignee
Amgen Canada Inc.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Amgen Canada Inc. filed Critical Amgen Canada Inc.
Publication of CZ318997A3 publication Critical patent/CZ318997A3/cs

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2799/00Uses of viruses
    • C12N2799/02Uses of viruses as vector
    • C12N2799/021Uses of viruses as vector for the expression of a heterologous nucleic acid
    • C12N2799/026Uses of viruses as vector for the expression of a heterologous nucleic acid where the vector is derived from a baculovirus

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Biomedical Technology (AREA)
  • Toxicology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)

Description

Vynález se týká nových polypeptidů majících vazebnou aktivitu na DNA a k molekulám nukleových kyselin kódujících polypeptidy. Tyto polypeptidy dříve označované jako „ IRF-3“ polypeptidy jsou nyní označovány jako „LSIRF“ polypeptidy (regulační faktor lymfoojtámího specifického interferonu) a jsou novými členy skupiny polypeptidů, které jsou známy jako interferonové regulační faktory.
Oblast techniky
Regulace genové exprese může nastat na několika rozdílných úrovních, ale aktivace genu specifických transkripčních faktorů je pro tento proces považována za nejzákladnější. Jedna skupina transkripčních faktorů, interferonové regulační faktory (IRFs), se skládá ze čtyř členů: IRF-1, IRF-2, ISGF3y a ICSBP. Všechny čtyři IRF jsou charakterizovány silně konzervativní N-koncovou DNA vazebnou doménou obsahující opakovaný tryptofanový motiv (Veals a kol., Mol. Cell. Biol., 12: 3315-3324 [ 1992]).
Interferonové regulační faktory-1(IRF-1) a -2(IRF-2) byly původně identifikovány pomocí studií transkripční regulace lidského interferon-β genu (IFN- β) (Miyamoto a kol., Cell, 54: 903-913 [1988] ) a (Harada a kol., Cell, 58: 729-739 [1989]). Studie cDNA exprese vysvětlily působení IRF-1 jako transkripčního aktivátoru IFN a IFN-indukujících genů, zatímco IRF-2 potlačuje účinek IRF-1 (Fujita a kol., Nátuře 337: 270-272 [1989]) a (Harada a kol., Cell,63: 303-312 [1990]). Poslední analýzy prokázaly, že IRF-1 může také působit jako protinádorový gen a IRF-2 jako možný onkogen (Harada a kol., Science, 259: 971-974 [1993]). Exprese IRF-1 je indukována typem -I (α/β) a typem -II (γ) IFNs (Miyamoto a kol., Cell,54: 903-913 [1988] ; Kanno a kol. Mol. Cell. Biol., 13: 3951-3963 [1993]), zatímco IRF-2 je jak současně exprimován, tak současně indukován typem-l IFNs (Harada a kol., Cell, 58: 729-739 [1989]).
.· φ • ·· φφ 9999 • 9 · · · Φ · Φ ··
Φ Φ Φ φ · Φ ·Φ Φ Φ
ΦΦΦΦΦ· Φ Φ Φ ΦΦΦΦ · Φ φ Φ Φφ Φ Φ
9909 9 99 9999 9999
Interferonem stimulovaný genový faktor-3 gamma (ISGF3y) je IFN- y- inducibilní protein, který se spojuje s ISGF3 a podjednotkami aktivovanými z latentní cytosolické formy typu-l IFNs (Levý a kol., EMBO J., 9 :1105-1111 [1990]; Levý a kol. New Biologist, 2: 383-392 [1990]). Po konzultaci bylo prokázáno, že tento komplex se translokuje do jádra a váže specifickou sekvenci DNA nalezenou v promotorové oblasti IFN-indukujících genů, známou jako ISRE(IFN-stimulovaný odezvový element; Veals a kol., Mol. Cell. Biol., 12: 3315-3324 [1992]). Nedávno byly klonovány ISGF3a subjednotky 91/84 kDa a 113 kDa (Schindler et al., Proč. Nati. Acad. sel. USA, 89: 7836-7839 [1992]; Fu et al., Proč. Nati. Acad. Sci. USA, 89: 7840-7843 [1992] a označeny jako signální převodníky a aktivátory transkripce-1 (Stat-1) a -2 (Stat-2) v uvedeném pořadí, což jsou cíle JAK kinázové fosforylace, po níž následuje typ-l IFN/IFN-receptorové navázání (Shuai a kol., Science, 261: 1744-1746 [1993]; Damell et al., Science, 261: 1415-1421 [1994]).
Sekvenční vazebný protein shodný s interferonem (ICSBP) je také IFN-γ inducibilním proteinem původně izolovaný jako protein, který rozpozná ISRE motiv (také nazývaný ICS) promotoru myšího MHO třídy I, H-2LD genu (Driggers a kol., Proč. Nati. Acad. Sci. USA, 87:3743-3747 [19901]). Avšak na rozdíl od IRF-1, IRF-2 a ISGF3y, ICSBP vykazuje na tkáň vymezený vzor exprese, protože je indukován výlučně v buňkách makrofágu a lymfoidních rodech (Driggers a kol., Proč. Nati. Acad. Sci. USA, 87:3743-3747 [1990]). Podle posledních studií hraje ICSBP podobnou roli jako IRF-2 při antagonizování účinku IRF-1 na indukci IFN a IFNindukujících genů (Weisz a kol.., J. Biol. Chem., 267:25589-25596 [1992]; Nelson a kol., Mol. Cell. Biol., 13:588-599 [1993]). ISREs interferon-inducibilních genů překrývají IRF-E, sekvenci DNA rozpoznanou pomocí IRF-1 a -2 (Tanaka a kol., Mol. Cell. Biol. 13:4531-4538 [1993]). Zcela nedávno se prokázalo, že ISGF3y váže IRF-Es IFN-β genu (Kawakami a kol., FEBS Letters, 358:225-229 [1995]).
Z hlediska důležitosti IRFs při regulaci exprese interferonových genů a dalších genů je nutné identifikovat další IRFs, zvláště tkáňově specifické IRFs.
Tudíž, předmětem vynálezu je identikovat nové členy skupiny IRF genů.
Další předměty budou odborníkovi v dané oblasti zcela zřejmé.
• 4 · • · 4 · 4 4·· ··· · · ♦ · · 4 ·Λ • · 4 4 · · · 444 ···· 4 4 · 44 ··· «4 • · ··· 4 4· «·4· 4 ·· 4444 4·4 4
Podstata vynálezu
Vynález poskytuje molekuly nových nukleových kyselin kódujících regulační faktor lymfodtámího specifického interferonu. Tyto molekuly, které byly dříve označovány jako „IRF-3“ molekuly, jsou nyní označovány jako „LSIRF“ molekuly, avšak toto označení může být užíváno zaměnitelně s označením „LSIRF“ molekul.
Vynález poskytuje molekulu izolované nukleové kyseliny kódující LSIRF polypeptid nebo jeho fragment, vybraný ze skupiny skládající se z:
a) molekuly nukleové kyseliny mající nukleotidovou sekvenci SEQ. ID. NO:1;
b) molekuly nukleové kyseliny mající nukleotidovou sekvenci SEQ. ID. NO:4;
c) molekuly nukleové kyseliny mající nukleotidovou sekvenci SEQ. ID. NO:24 ř nebo její „Double Q“ variantu;
d) molekuly nukleové kyseliny mající nukleotidovou sekvenci kódující aminokyselinovou sekvenci SEQ. ID. NO:2;
e) molekuly nukleové kyseliny mající nukleotidovou sekvenci kódující aminokyselinovou sekvenci SEQ. ID. NO:25 nebo její „Double Q“ variantu; a
f) molekuly nukleové kyseliny mající nukleotidovou sekvenci která se hybridizuje s molekulou nukleové kyseliny bodů a), b), c), d), e), nebo s jejich fragmenty.
Vynález dále poskytuje polypeptid, který je produktem exprese těchto molekul nukleové kyseliny v hostitelské buňce.
Dále vynález poskytuje protilátku specificky vázající LSIRF polypeptid. Volitelně je tato protilátka monoklonální protilátkou.
Vynález poskytuje izolovaný polypeptid nebo jeho fragment mající specifickou, DNA vazebnou aktivitu LSIRF polypeptidu.
Vynález poskytuje vektor zahrnující molekulu DNA kódující LSIRF polypeptid.
Vynález poskytuje hostitelskou buňku stabilně transformovanou nebo trans_ ro, fektovanou s vektorem obsahujícím molekulu DNA LSIRF polypeptidu. .
Vynález poskytuje izolovaný LSIRF polypeptid nebo jeho fragment; polypeptid í může mít aminokyselinovou sekvenci SEQ ID NO: 2.
‘ Vynález poskytuje LSIRF polypeptid, který je produktem exprese prokaryotní nebo eukaryotní hostitelské buňky podle sekvence exogenní LSIRF nukleové kyseliny.
• ·
Vynález dále poskytuje způsob výroby LSIRF polypeptidu zahrnující kultivování prokaryotní nebo eukaryotní hostitelské buňky za podmínek, které umožňují
LSIRF expresi.
Přehled a stručný popis obrázků
Obrázek 1 znázorňuje celou délku sekvence u myšího LSIRF cDNA nukleové kyseliny.
Obrázek 2 znázorňuje celou délku sekvence aminokyseliny u myšího LSIRF polypeptidu.
Obrázek 3 znázorňuje sekvenci 5' konce myšího LSIRF genu.
Obrázek 4 znázorňuje genomovou sekvenci DNA u myšího LSIRF.
Obrázek 5 znázorňuje Nothem blot RNA z různých myších tkání. Tento blot byl zkoumán radioaktivně značeným LSIRF za účelem identifikace LSIRF transkriptů. Párové značky RNA báze indikující velikost transkripce jsou znázorněny vlevo. Znázorněna je rovněž fotografie agarosového gelu indikující ribozomální RNA.
Obrázek 6 znázorňuje Nothem blot RNA z myších lymfocytů léčených bez stimulátorů (-) nebo se stimulátory, jak je označeno. Skvrna byla zkoumána radioaktivně značenou LSIRF za účelem identifikace těch stimulátorů, které indukují LSIRF transkripci. Je znázorněn rovněž tentýž blot zkoumaný značeným beta aktinem.
Obrázek 7 znázorňuje Nothem blot myších splenocytů ošetřený bez stimulátoru (-) nebo s jedním či více stimulátory, jak je označeno, a pak zkoumána radioaktivně značeným LSIRF. Tentýž Nothem blot zkoumaný značeným beta aktinem, je rovněž znázorněn.
Obrázek 8 znázorňuje Nothem blot myších splenocytů ošetřený bez stimulátoru (-) nebo se stimulátorem, jak je označeno, a pak zkoumána značeným LSIRF zkouškou. Rovněž, je znázorněn Nothem blot zkoumán značeným beta aktinem.
Obrázek 9 znázorňuje vazebnou zkoušku LSIRF myšího MHC ISRF na gelu. Jaderné extrakty z kontrolních tyčinkových virů infikovaných SF9 hmyzích buněk (pruh 2) nebo z SF9 buněk infikovaných tyčinkovými viry obsahujícími LSIRF gen (pruhy 3-12) byly inkubovány s jak značenou myší MHC ISRE sondou, tak s fragmentem označeného kompetitoru DNA (sekvence kompetitorových fragmentů je sestavena dále v tabulce 1). Pruhy 1 a 13 obsahují samotnou značenou MHC ISRE sondu.
·· · • v • ·
Obrázek 10 znázorňuje celou délku nukleotidové sekvence kódující oblasti lidského LSIRF v „Single Q“ formě. (SEQ. ID. NO.: 24). „Double Q“ forma má přídavný kodon, kódující aminokyselinu Q (Glu), vloženou mezi kodony aminokyselin 163 a 164.
Obrázek 11 znázorňuje předpokládanou „Single Q“ formu aminokyselinové sekvence lidského LSIRF (SEQ. ID. NO.: 25), jak je přepsána z nukleotidové sekvence obrázku 10. „Double Q“ forma má přídavnou aminokyselinu Q (Glu) vloženou mezi aminokyselinu 163 a 164.
Příklady provedení vynálezu
Označení „IRF-3“ a „LSIRF“ jsou zde použity zaměnitelné a vztahují se k téže nukleové kyselině a téže aminokyselinové sekvenci; jak „Single Q“, tak „Double Q“ formy LSIRF jsou zahrnuty v této definici (viz Příklad 5).
Zde použitý termín „biologicky aktivní“, označuje celou délku polypeptidu nebo jeho fragmentu, pocházejícího z jakéhokoliv zdroje, který váže fragmenty ISRE (interferonový stimulovaný odezvový element) typové DNA, například myší MHCI ISRE, lidský ISG54, a/nebo mutanty ISRE, například ISREml nebo ISREm4 (jejichž sekvence jsou sestaveny dále v tabulce 1). Biologicky aktivní polypeptidy nebo jejich fragmenty také zahrnují ty polypeptidy nebo fragmenty, které mají imunologickou zkříženou reaktivitu s protilátkou (polyklonální nebo monoklonální), která je imunizována a reaguje s celou délkou LSIRF polypeptidu, například LSIRF polypeptidy, sestavené dále na obrázcích 2 a 25.
Zde použitý termín „stabilně transformovaná nebo transfektovaná“ označuje molekulu nukleové kyseliny, která byla vložena do hostitelské buňky a existuje v této hostitelské buňce, bud jako část genomové DNA hostitelské buňky nebo jako nezávislá molekula (například extrachromozomálně), a která je udržována a replikována v mateřské hostitelské buňce tak, že je předávána následujícím generacím této hostitelské buňky.
Termín „syntetická DNA“ označuje molekulu nukleové kyseliny vyrobenou zcela nebo zčásti chemickými syntetickými metodami.
Termín „vektor“ se týká amplifikace molekuly nukleové kyseliny, replikace, a/nebo exprese vektoru v podobě plazmidového nebo virového DNA systému, kde plazmidová nebo virová DNA může být funkční s hostitelskými buňkami bakterií, • · ··· · 9 9 9 · . · · • ···· 9 9 9 9 9 999 99 * 9 9 9 9 99
9999 9 ·· 9 99999 99 kvasinek, bezobratlých, a/nebo savců. Vektor může zůstat nezávislý na genomovou DNA hostitelské buňky nebo se může integrovat zcela nebo zčásti s genomovou DNA . Vektor bude obsahovat všechny nezbytné elementy tak, aby byl funkční v jakékoliv hostitelské buňce, s kterou je kompatibilní. Tyto elementy jsou sestaveny níže.
Vynález poskytuje způsob přípravy LSIRF polypeptidu. Charakteristicky bude tento peptid připravován získáním molekuly nukleové kyseliny kódující tento polypeptid, vložením molekuly této nukleové kyseliny do vhodného vektoru exprese, vložením tohoto vektoru do kompatibilní hostitelské buňky, expresí LSIRF polypeptidu v této hostitelské buňce a čištěním tohoto LSIRF polypeptidu.
1. Příprava DNA kódující LSIRF polypeptidy
Molekula nukleové kyseliny kódující LSIRF může být snadno získána několika postupy, zahrnujícími bez omezení, chemickou syntézu, screening cDNA nebo genomové knihovny, screening knihovny exprese a/nebo PCR amplifikace cDNA. Tyto metody a další vhodné pro izolaci této DNA jsou uvedeny dále, např. Sambrook a kol. (Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY [1989]), Ausubel A kol., eds. (Current Protocols in Molecular Biology, Current Protocols Press [1994]), a Berger a Kimmel (Methods in Enzymology: Guide to Molecular Cloning Techniques, vol. 152, Academie Press, lne., San Diego, CA [1987]). Výhodné sekvence nukleových kyselin kódujících LSIRF jsou sekvence savců. Nejvýhodnější sekvence nukleových kyselin kódující LSIRF jsou lidské, krysí a myší.
Chemická syntéza LSIRF molekuly nukleové kyseliny může být uskutečněna použitím dobře známých metod, sestavených dále - Engels a kol. (Angew. Chem. Intl. Ed., 28:716-734 [1989]). Tyto metody mezi jiným zahrnují metody fosfotriesterové, fosforamiditové a H-fosfonátové syntézy nukleové kyseliny. Typická molekula nukleové kyseliny kódující celou délku LSIRF polypeptidu bude obsahovat několik stovek párů baží (bp) nebo nukleotidů. Nukleové kyseliny obsahující více než asi 100 nukleotidů mohou být syntetizovány jako několik fragmentů, každý fragment skládající se až ze 100 nukleotidů. Fragmenty pak mohou být spojeny dohromady, jak je níže uvedeno, za vzniku úplné nukleové kyseliny kódující LSIRF polypeptid.
·· ·♦ ·· 99 · · · · ·· ♦ » · · · · · · • » · · · · · · · • · · · · · •« «··· 9 9 9 9
Výhodnou metodou je syntéza na polymemím nosiči, využívající standardní fosforamiditovou chemii.
Jinak může být nukleová kyselina kódující LSIRF polypeptid získána screeningem vhodné cDNA knihovny (tzn. knihovny připravené z jednoho nebo více tkáňových zdrojů, u nichž se předpokládá exprese polypeptidu) nebo genomové knihovny (knihovny připravené z úplné genomové DNA). Typickým zdrojem cDNA knihovny je tkáň z nějakého druhu, u které se předpokládá exprese LSIRF v dostatečném množství (například lymfoidní tkáň). Zdrojem genomové knihovny může být jakákoliv tkáň nebo tkáně z jakéhokoliv savce nebo jiných druhů, u nichž se předpokládá, že v sobě skrývají gen kódující LSIRF nebo jeho homolog. Tato knihovna může být zkoumána na přítomnost LSIRF cDNA genu, použitím jedné nebo více sond nukleové kyseliny (oligonukleotidy, fragmenty cDNA nebo genomové DNA, které mají přijatelnou úroveň homologie mezi LSIRF nebo LSIRF homologem cDNA nebo genem, který má být klonován), který bude selektivně hybridizován LSIRF nebo LSIRF homolog(y)em cDNA nebo gen(y)em, který(é) je(jsou) přítomen(mny) v této knihovně. Typické sondy používané pro takový screening knihovny obvykle kódují malou oblast sekvence LSIRF DNA ze stejných nebo podobných druhů jako jsou druhy, z kterých byla tato knihovna připravena. Jinak mohou být tyto sondy degenerovány, jak je uvedeno níže.
Typický screening knihovny se provádí připojováním oligonukleotidové sekvence nebo cDNA na klony v knihovně, za přesných podmínek, aby se zabránilo nespecifické vazbě, ale umožňují vazbu těch klonů, které jsou vysoce homologní se sondou nebo primerem. Typická hybridizace a přesné vymývací podmínky závisí zčásti na velikosti cDNA (tzn. počtu nukleotidů v řetězci) nebo na oligonukleotidové sondě, a na tom, zdali tato sonda je degenerována. Při navrhování hybridizačního roztoku je rovněž brána v úvahu pravděpodobnost získání klonu(ů) (tzn. zdali je zkoumána cDNA nebo genomová knihovna; v případě, že se jedná o cDNA knihovnu, pravděpodobnost, že cDNA, která nás zajímá, je přítomna ve velkém množství).
Tam, kde jsou použity jako sondy fragmenty DNA (například cDNA), jsou podmínky typické hybridizace uvedeny dále např. v Ausubel a kol., eds., supra. Po hybridizaci je blot obsahující knihovnu promyt za vhodných podmínek závisejících na několika faktorech, například velikost sondy, očekávaná homologie sondy ke klonu, typ knihovny, která je zkoumána, počet zkoumaných klonů a podobně. Příklady ·· • · přesných promývacích roztoků (které mají obvykle nízkou iontovou sílu a jsou používány při relativně vysokých teplotách) jsou uvedeny dále. Jeden takový přesný promývací roztok se skládá z 0,015 M NaCl, 0,005 M citrátu sodného a 0,1 procent SDS při 55°C -65°C. Dalším takovým vymývacím pufrem je 1 mM Na2EDTA, 40 mM Na2HPO4, pH 7,2, a 1 procento SDS při asi 40°C -50°C. Jiným promývacím pufrem je 0,2 x SSC a 0,1 procento SDS při asi 50°C -65°C.
Tam, kde jsou použity oligonukleotidové sondy ke screeningu cDNA nebo genomových knihoven, mohou být použity dva protokoly pro přesné promývací podmínky, jak je například dále uvedeno. První protokol používá 6 χ SSC s 0,05 procenty difosforečnanu sodného při teplotě mezi asi 35 °C a 62°C, v závislosti na délce sondy. Například, sondy o velikosti 14 baží jsou promývány při 35°C -40°C, sondy o 17 bazích při 45°C -50°C, sondy o 20 bazích při 52°C -57°C a sondy o 23 bazích při 57°C -63°C. Teplota může být zvýšena o 2°C -3°C tam, kde se objeví vysoké pozadí nespecifické vazby. Druhý protokol používá na promývání tetramethylammonium chlorid (TMAC). Jedním takovým přesným promývacím roztokem je 3 M TMAC, 50 mM Tris-HCI, pH 8,0 a 0,2 procenta SDS. Promývací teplota pro použití tohoto roztoku je funkcí délky sondy. Například, sondy o velikosti 17 baží se promývá při 45°C -50°C.
Další vhodnou metodou pro získání nukleové kyseliny kódující LSIRF polypeptid je polymerazová řetězová reakce (PCR). Při této metodě je extrahována poly(A)+RNA nebo celková RNA z tkáně, která exprimuje LSIRF (například lymfoidní tkáň). cDNA je pak připravena z této RNA použitím enzymové reverzní transkriptásy. Pak jsou přidány k cDNA dva primery (oligonukleotidy) komplementární ke dvěma odděleným oblastem LSIRF cDNA spolu $ polymerázou, například Taq polymeráza, a tato polymeráza naamplifikuje cDNA oblast mezi těmito dvěma primery.
Tam, kde metoda výběru pro přípravu nukleové-kyseliny, kódující LSIRF polypeptid, vyžaduje použití oligonukleotidových primerů nebo sond (např. PCR, cDNA nebo sceening genomové knihovny), oligonukleotidové sekvence vybrané jako sondy nebo primery o odpovídající délce a dostatečně definované tak, aby se minimalizovalo množství nespecifické vazby, která se může objevit během screeningu knihovny nebo PCR amplifikace. Skutečná sekvence sond nebo primerů je obvykle založena na konzervativních nebo vysoce homologních sekvencích nebo oblastech z téhož nebo podobného genu jiného organismu. Volitelné mohou být tyto sondy • φ ···· · · ·· • · · · · · · ··· • ····«· · ♦ · e·· ·· • · · · · ·· ·· ·. ·· ···· ·· ·· nebo primery zcela nebo částečně degenerovány, tzn., že mohou obsahovat směs sond/primerů, které všechny kódují tutéž sekvenci aminokyselin, ale dochází k tomu použitím rozdílných kodonů. Alternativou k přípravě degenerovaných sond je nahradit inosin v některé nebo ve všech pozicích těch kodonů, které se liší druhem. Oligonukleotidové sondy nebo primery mohou být připraveny metodami chemické syntézy DNA, jak je výše popsáno.
V rozsahu vynálezu se předpokládají LSIRF mutantní nebo alternativní sekvence. Zde použitá mutantní nebo alternativní sekvence je sekvence, která obsahuje jednu nebo více nukleotidových substitucí, delecí, a/nebo inzercí ve srovnání s původní sekvencí, což má za následek změny v sekvenci aminokyselin ve srovnání s původní sekvencí aminokyselin. V některých případech mohou existovat přirozeně se vyskytující LSIRF aminokyselinové mutanty nebo alternativy v důsledku existence přirozených alelických změn. Takové přirozeně se vyskytující alternativy jsou rovněž v rozsahu vynálezu. Příprava syntetických mutantních sekvencí je dobře známa a je popsána například v Wells a kol. (Gene, 34:315 [1985]), a v Sambrook a kol.., supra.
2. Příprava 5' koncové sekvence LSIRF polypeptidu
Součástí rozsahu vynálezu jsou LSIRF 5' koncové sekvence (také zde označované jako „promotory“) z jakéhokoliv druhu. Promotorem, jak je zde použito, se myslí 5' koncové sekvence LSIRF genu. 5' koncová sekvence může mít různé, transkripční faktor vázající místa a může také obsahovat TATA schránku v poloze asi -30 a CCAAT schránku výše od TATA schránky. Takové 5' koncové sekvence jsou charakterizovány jako přirozené regulující transkripci LSIRF genu in vivo, bud samotné nebo v kombinaci s dalšími faktory jako zesilujícími činidly, represory a podobně (kterýkoliv z nich nebo všechny mohou být velmi distálně umístěny). Výhodné 5' koncové sekvence jsou savčí LSIRF 5' koncové sekvence. Nejvýhodnější jsou lidské LSIRF 5' koncové sekvence.
5' koncové sekvence podle vynálezu mohou být získány z genomových knihoven sceeningem těchto knihoven pomocí cDNA kyselin nebo genomových LSIRF fragmentů, které výhodně hybridizují k 5' části LSIRF genu. Tyto fragmenty mohou hybridizovat ke klonu knihovny, která obsahuje část nebo celou LSIRF 5' koncovou sekvenci, která je obecně umístěna na 5' konci k počátku sekvence kódující LSIRF. Tam, kde identifikovaný klon obsahuje pouze část tohoto promotoru, může být klon *· · ·· ·· ·· ·· · · · · · · · « • 9 · · · · · ··· • ···«· · · · ·'·· · · • · 9 9 9 9 9 9
9999 9 99 9999 99 99 samotný nebo jeho fragment použit pro následující běhy screeningu genomové knihovny za účelem získání další 5' koncové sekvence. Screening pomocí fragmentů (zahrnující hybridizaci a promývání) může být uskutečněn tak, jak je výše popsáno pro klonování LSIRF genu a/nebo cDNA.
3. Příprava vektoru pro LSIRF expresi
Po klonování byla izolována cDNA nebo gen kódující LSIRF polypeptid nebo jeho fragment. To bylo vloženo do amplifikujícího a/nebo expresního vektoru za účelem zvýšení počtu kopií genu a/nebo exprese polypeptidu ve vhodné hostitelské buňce. Vektorem je často komerčně dostupný vektor, ačkoliv vektory vyrobené na zakázku mohou být také použity. Vektor je vybrán tak, aby byl funkční v určité hostitelské buňce (tzn., že vektor je kompatibilní s aparátem hostitelské buňky, takže může dojít k amplifikaci LSIRF genu a/nebo expresi genu). LSIRF polypeptid nebo jeho fragment může být amplifikován nebo exprimován v prokaryotních, kvasinkových, hmyzích (systémech tyčinkových virů) a/nebo eukaryotních hostitelských buňkách. Výběr hostitelské buňky bude alesoň zčásti záviset na tom, zdali LSIRF polypeptid nebo jeho fragment má být glykosylován. V tom případě jsou výhodné kvasinkové, hmyzí nebo savčí hostitelské buňky; kvasinkové buňky budou glykosylovat polypeptid a hmyzí a savčí buňky mohou glykosylovat a/nebo fosforylovat polypeptid tak, jak se to přirozeně děje u LSIRF polypeptidu (tzn., „přirozená“ glykosylace a/nebo fosfory láce).
Typicky, vektory použité v jakýchkoliv hostitelských buňkách budou obsahovat 5' koncovou sekvenci a další regulační elementy, stejně tak jako zvyšovač(e), počátek replikačního elementu, transkripční terminační element, úplnou intronovou sekvenci obsahující donorové a akceptorové vazebné místo, signální peptidovou sekvenci, ribozom vázající element, polyadenylační sekvenci, polyvazebnou oblast pro inzerci nukleové kyseliny kódující polypeptid, aby se exprimoval, a selektivní značkovací element. Volitelně může vektor obsahovat „tag“ sekvenci, tzn., oligonukleotidovou sekvenci umístěnou na 5' nebo 3' konci sekvence kódující LSIRF, která kóduje polyHis (například hexaHis) nebo další malou imunogenní sekvenci. Tato tag bude exprimována spolu s proteinem a může sloužit jako afinitní tag pro čištění LSIRF polypeptidu z hostitelské buňky. Volitelně může být tato tag následné odstraněna z • · · · · ·· · * · · · · · · ···· · · · · přečištěného LSIRF polypeptidu různými prostředky, například použitím vybrané peptidázy.
A. 5' koncový sekvenční element
5' koncová sekvence může být homologní (tzn., ze stejných druhů a/nebo kmenu jako je hostitelská buňka), heterologní (tzn., z jiných druhů než jsou druhy nebo kmen hostitelské buňky), hybridní (tzn., kombinace p5' koncových sekvencí z více než jednoho zdroje), syntetická nebo to může být nativní LSIRF 5' koncová sekvence. Jako takový může být zdrojem 5' koncové sekvence jakýkoliv jednobuněčný prokaryotní nebo eukaryotní organismus, jakýkoliv organismus obratlých nebo bezobratlých nebo jakákoliv rostlina za předpokladu, že 5' koncová sekvence je funkční a může být aktivována aparátem hostitelské buňky.
5' koncové sekvence použitelné ve vektorech podle vynálezu mohou být získány kteroukoliv z několika dobře známých metod ve stavu techniky. Typicky zde užitečné 5' koncové sekvence jiné než LSIRF 5' koncové sekvence budou identifikovány drive mapováním a/nebo štěpením restrikčními endonukleázami a mohou být proto izolovány z vhodného tkáňového zdroje použitím vhodných restrikčních endonukleáz. V některých případech může být celá nukleotidová sekvence 5' koncové sekvence známa. 5' sekvence zde může být syntetizována použitím výše popsaných metod pro syntézu nukleové kyseliny nebo klonování.
Tam, kde je známa celá 5' koncová sekvence nebo pouze její části může být získána použitím PCR a/nebo screeningem genomové knihovny s vhodným oligonukleotidem a/nebo s fragment 5' koncové sekvence z téhož nebo jiného druhu.
Tam, kde 5' koncová sekvence není známa, může být fragment DNA obsahující nějakou 5' koncovou sekvenci izolován z delší části DNA, která může například obsahovat kódující sekvenci nebo dokonce další gen nebo geny. Izolace může být uskutečněna štěpením restrikčními endonukleázami za použití jednoho nebo více pečlivě vybraných enzymů, aby se vyiizoloval správný fragmentu DNA. Po štěpení může být požadovaný fragment izolován čištěním na agarosovém gelu, Qiagen® koloně nebo jinými metodami, které jsou známé odborníkům v dané oblasti. Výběr vhodných enzymů k uskutečnění tohoto úkolu bude odborníkům v dané oblasti zcela zřejmý.
B. Ppčátek reRlj^čního fllpfpentu
Tato komponenta je typickou součástí prokaryotních vektorů exprese komerčně prodávaných a pomůckou při amplifikaci vektoru v hostitelské buňce. Amplifikace vektoru na určitý počet kppií může být v některých případech důležitá pro optimální expresi LSIRF polypeptidu. Jestliže vybraný vektor neobsahuje počátek replikačního místa, může být chemicky syntetizován na základě známé sekvence a vložen do vektoru.
C. Transkripční t^rminační element
Tento element je typicky umístěn 3' koncem k sekvenci kódující LSIRF polypeptid a slouží k ukončení transkripce LSIRF polypeptidu. Transkripční terminační element se obvyklo nachází v prokaryotních buňkách jako fragment bohatý na G-C, následovaný sekvencí polyT. Zatímco je element snadno klonován z knihovny nebo se dokonce komerčně prodáván jako část vektoru, může být také snadno syntetizován použitím metod pr° syntézu nukleových kyselin, například těch, které jsou popsány výše.
D. Element selektivních markeruíů)
Geny selektivního markéru kódují proteiny nezbytné pro přežití a růst hostitelské buňky v selektjním mediu kultury. Typické geny selektivních markérů kódují proteiny, které (a) vykazují odolnost vůči antibiotikům nebo jiným toxinům, například ampicilinu, tetrpcyfdinu nebo kanamycinu pro prokaryotní hostitelské buňky, (b) doplňují auxotrofní nedostatky buňky; nebo (c) zásobují kritickými živinami nedostupnými z komplexního média. Výhodnými selektivními markéry jsou kanamycinový rezistentní gen, ampicilinový rezistentní gen a tetrecyklinový rezistentní gen.
* E. Ribozom vázající element
Tento element běžné nazývaný sekvence Shine-Dalgamo (u prokaryot) nebo w Kozák sekvence (u eukaryot), je nezbytný pro iniciaci translace m-RNA. Tento element je typicky umístěn 3' koncem k promotoru a 5' koncem ke kódující sekvenci polypeptidu, který má být syntetizován. Shine-Dalgamo sekvence se liší, ale jedná se o typický polypurin (tzn., že má vysoký obsah A-G). Bylo identifikováno mnoho ·· 99
9
99
9 9 9· · • · · 9 9 9 ··
9 9 9 9 99
9999 9 9 9 9 9 999 99 ' 9 9 9 9 9 9'·
9999 9 99 9999 9999
Shine-Dalgamo sekvencí, každá z nich může být snadno syntetizována použitím metod vyložených výše.
Všechny elementy vyložené výše, stejné jako jiné užitečné v tomto vynálezu, jsou odborníkům v dané oblasti dobře známy a jsou popsány např. v (Sambrook a kol (Molecular Cloniňg: A Laboratory Manual, Cold Spring Harbor Laboratory press, Cold Spring Harbor, NY [1989] and Bergera kol.., eds. (Guide to Molecular Cloning techniques, Academie press, lne., San Diego, CA [1987]).
F, Signální sekvenční element
Pro ta provedení podle vynálezu, kde má být vyměšován transgen, je často přítomna signální sekvence, aby řídila polypeptid kódovaný transgenem mimo buňku, kde je syntetizován. Typicky se signální sekvence nachází v kódující oblasti transgenu blízko nebo na 5'konci kódující oblasti. Bylo identifikováno mnoho signálních sekvencí a jakákoliv z nich, která je v.transgenní tkáni funkční, může být použita ve spojení s tímto transgenem. Proto signální sekvence mohou být homologní nebo heterologní k transgenu a mohou být homologní nebo heterologní k transgennímu savci. Dále signální sekvence může být chemicky syntetizována použitím metod vyložených výše. Avšak, pro účely zde uvedené, jsou výhodnými signálními sekvencemi ty, které se s transgenem vyskytují přirozeně (tzn., jsou homologní k tomuto transgenu).
G. Intronovv element
V mnoha případech je transkripce transgenu zvyšována přítomností jednoho nebo více intronů na vektoru. Intron se může v sekvenci transgenu přirozeně vyskytovat zvláště tam, kde transgen je v celé délce nebo kde je fragmentem genomové DNA sekvence. Tam, kde se intron v DNA sekvenci přirozeně nevyskytuje (jako u většiny cDNA), intron (y) může být získán z jiného zdroje. Intron může být homologní nebo heterologní k transgenu a/nebo k transgennímu savci. Pozice intronu, s ohledem na promotor a transgen, je důležitá, protože aby byl účinný, musí být intron transkribován. Kde je transgen cDNA sekvencí, výhodnou pozicí pro intron je pozice 3' konce na transkripčním startovacím místě a 5' konce na polyA transkripční terminační sekvenci. Výhodně pro cDNA transgeny bude intron umístěn na jedné nebo druhé straně transgenní sekvence (tzn., 5'-konci nebo 3'-konci) , tj. takové, která ·· *· ·« ···· ·· • · · · * · · ♦ »♦ • · · · · · ·· ·· • ··««·· · · · ····· • ”· · · ♦ · ·>
···· · ·· ······ 4· nepřeruší transgenovou sekvenci. K provedení vynálezu může být použit jakýkoliv intron z jakéhokoliv zdroje, včetně jakýchkoliv virových, prokaryontních a eukaryontních (rostlina nebo zvíře) organismů za předpokladu, že je kompatibilní s hostitelskou buňkou (-ami), do které je vložen. Jsou zde rovněž zahrnuty syntetické introny. Volitelně může být ve vektoru použit více než jeden intron.
H. Konstrukce vektorů
Tam, kde ve vektoru není dosud přítomen jeden nebo více elementů, vyložených výše, který má být použit, může být jednotlivě získán a na vektor navázán. Metody použité pro získání každého z těchto elementů jsou odborníkům v dané oblasti dobře známy a jsou srovnatelné s metodami vyloženými výše (tzn. syntézy DNA, screening knihoven a pod.).
Konečné vektory použité k uskutečnění vynálezu jsou typicky sestaveny z počátečních vektorů, například komerčně dostupný vektor. Tento vektor může nebo nemusí obsahovat některé z elementů. Jestliže žádný z požadovaných elementů není přítomen v počátečním vektoru, každý z elementů může být individuálně navázán na tento vektor rozštěpením vektoru vhodnou restrikční endonukleázou (ami), takže konce elementu, které mají být navázány a konce vektoru jsou kompatibilní. V některých případech může být nezbytné „otupit“ konce, které mají být svázány, aby se dosáhlo uspokojivého navázání. Otupení je uskutečněno prvním vyplněním „spojovacích konců“ užitím Klenow DNA polymerázy nebo T4 DNA polymerázy v přítomnosti všech čtyř nukleotidů. Tento postup je ve stavu techniky dobře znám a je popsán například Sambrookem a kol. supra.
Případně, mají-li být dva nebo více elementů vloženy do vektoru, mohou se nejdříve svázat dohromady (pokud mají být umístěny vedle sebe) a pak navázány na vektor. .
Další metodou pro konstrukci vektoru je provést všechna navázání různých elementů současně v jedné reakční směsi. Při této metodě se v důsledku nevhodných navázání nebo inzerce těchto elementů vytvoří mnoho nesmyslných a nefunkčních vektorů, avšak funkční vektor může být identifikován a vybrán pomocí štěpení restrikčními endonukleázami.
Výhodnými vektory pro uskutečnění vynálezu jsou ty, které jsou kompatibilní s bakteriálními, hmyzími a savčími hostitelskými buňkami. Takové vektory mezi ji99 9 nými zahrnují pCRII (Invitrogen Company, San Diego, CA), pBSH (Stratagene Company, LaJolla, CA) a pETL (BlueBacll; Invitrogen).
Poté, co' byl vektor sestaven a na vhodné místo vektoru byla vložena LSIRF nukleová kyselina, může být tento úplný vektor vložen do vhodné hostitelské buňky pro amplifikaci a/nebo expresi LSIRF polypeptidu. Typicky používané hostitelské buňky zahrnují bez omezení prokaryotní buňky, například gramnegativní nebo grampozitivní buňky, to je jakýkoliv kmen E. coli, Bacillus, Streptomyces, Saccharomyces, Salmonella, a podobně; eukaryotní buňky, například CHO buňky ( z vaječníku čínského křečka), 293 buňky lidské ledviny, COS-7 buňky; hmyzí buňky, například Sf4, Sf5, Sf9 a Sf21 a High 5 (všechny od Invitrogen Company, San Diego, CA); a různé kvasinkové buňky, například Saccharomyces a Pichia.
Inzerce (také označovaná jako „transformace“ nebo „transfekce“) vektoru do vybrané hostitelské buňky může být uskutečněna použitím takových metod, například chloridem vápenatým, elektroporací, mikroinjekcí, lipofekcí nebo DEAEdextranovou metodou. Vybraná metoda bude z části záviset na typu hostitelské buňky, která má být použita. Tyto metody a další vhodné metody jsou dobře známy ve stavu techniky a jsou vyloženy výše, např. v Sambrook a kol.., supra.
Hostitelské buňky obsahující vektor (to je transformovaný nebo transfektovaný) mohou být kultivovány za použití standardního média dobře známého odborníkovi v dané oblasti. Médium bude obvykle obsahovat všechny živiny nutné pro růst a přežití buněk. Vhodnými médii pro kultivování buněk E. coli jsou například Luria bu1 jón (LB) a/nebo Terrific bujón (TB). Vhodnými médii pro kultivování eukaryotních buněk jsou RPMI 1640, MEM, DMEM, všechny tyto mohou být doplněny sérem a/nebo nůstovými faktory podle požadavku kultivování jednotlivých buněčných linií. Vhodným médiem pro hmyzí kultury je Graceho médium doplněné v případě potřeby kvasinkami, hydrolyzátemjaktalbuminu a/nebo zárodečným telecím sérem.
Jako doplněk k tomuto médiu je typicky přidáno antibiotikum nebo jiná sloučenina užitečná pro selektivní růst transformovaných buněk. Sloučenina, která má být užita, se určí elementem selektivního markéru přítomným v plazmidu, se kterým byla hostitelská buňka transformována. Například tam, kde selektivním markerový elementem je rezistence vůči kanamycinu. Sloučenina, která se přidá do kultivačního média bude kanamycin.
*· · ·· ·· ·· ·· • ♦ « · · · · · · ♦ • · · · · · ···· • ···♦♦· · · · >··· » · • · ··· ·· · ··· · ·· ···· .·· ··
4. Vyhodnocení exprese
Množství LSIRF polypeptidu produkovaného v hostitelské buňce může být vyhodnoceno použitím známých standardních metod. Tyto metody zahrnují bez omezení, analýzu Western blotu, elektroforézu na SDS-polyakrylamidovém gelu, nedenaturující gelovóu elektroforézu, HPLC dělení, imunoprecipitace a/nebo zkoušky aktivity, například jako jsou DNA vazebné detekce na gelu.
5. Čištění LSIRF polypeptidu
Jestliže záměrem byla sekrece LSIRF polypeptidu z hostitelských buněk, pak bude pravděpodobné, že většina polypeptidu se bude nacházet v kultivační půdě buněk. Avšak v případě, kdy LSIRF polypeptid nebude vyměšován z hostitelských buněk, pak bude přítomen v cytoplasmě (pro eukaryontní, grampositivní bakteriální a hmyzí hostitelské buňky) nebo v periplasmě (pro gramnegativní bakteriální hostitelské buňky).
V případě vnitrobuněčného LSIRF jsou hostitelské buňky nejdříve mechanicky nebo osmoticky rozrušeny, aby se obsah cytoplasmy uvolnil do pufru. LSIRF polypeptid je pak izolován z tohoto roztoku.
Čištění LSIRF polypeptidu z roztoku může být uskutečněno použitím různých technik. Jestliže byl polypeptid syntetizován tak, že obsahuje tag, například Hexahistidin (LSIRF/hexaHis) nebo jiný malý peptid na jeho karboxylovém nebo aminovém konci, může být v podstatě čištěn jednostupňovým procesem tak, že se roztok nechá projít afinitní kolonou, kde matrice v koloně má vysokou afinitu k tag nebo přímo k polypeptidu (tzn., monoklonální protilátka specificky rozpoznávající LSIRF). Například, polyhistidin se váže s velkou afinitou a specifitou na nikl, tudíž afinitní niklová kolona (například Qiagen niklové kolony) může být použita pro čištění LSIRF/polyHis. (Viz.-například, Ausubel a kol., eds., Current Protocols in Molecular Biology, Section 10. 11.8, John Wiley & Sons, New York [1993]).
Tam, kde LSIRF polypeptid nemá dostupnou žádnou tag a nejsou dostupné žádné protilátky, mohou být pro čištění použity jiné dobře známé postupy. Tyto postupy zahrnují bez omezení, iontoměničovou chromatografii, molekulární síťovou chromatografii, HPLC, nativní gelovou elektroforézu v kombinaci s gelovou elucí a preparativní izoelektrickou fokusaci („Isoprime“ machine/technique, Hoefer Scientific). V některých případech mohou být kombinovány dvě nebo více těchto technik k ·· • · · · * · · ···· ··· ·· · · · ·· • ···· · · · · '· ··· · · • · · · · · · ♦ ···· · ♦ · ···· ·· ·· dosažení zvýšené čistoty. Výhodné čistící metody zahrnují polyhistidinové značení a iontoměničovou chromatografi i v kombinaci s preparativní izoelektrickou fokusací.
Jestliže se předpokládá, že LSIRF polypeptid bude nalezen hlavně v periplasmickém prostoru bakterie nebo v cytoplasmě eukaryontních buněk, pak obsahy periplasmy nebo cytoplasmy včetně inkluzních tělísek (bakterií), pokud zpracovávané polypeptidy utvořily takové komplexy, mohou být extrahovány z hostitelské buňky použitím jakékoliv známé standardní techniky. Například, hostitelské buňky mohou být rozštěpeny za účelem uvolnění obsahu periplasmy francouzským lisováním, homogenizací a/nebo sonikací. Homogenát pak může být odstředěn.
Jestliže LSIRF polypeptid vytvořil inkluzní tělíska v periplasmě, mohou se tato inkluzní tělíska často vázat na vnitřní a/nebo vnější buněčné membrány a tudíž mohou být nalezeny hlavně v hrudkovitém materiálu po odstředění. Na tento hrudkovitý materiál se pak může působit chaotropním činidlem, například guanidinem nebo močovinou s cílem uvolnit, oddělit a solubilizovat inkluzní tělíska. LSIRF polypeptid, nyní ve své rozpustné formě, pak může být analyzován gelovou elektroforezou, imunosrážením a podobné. Jestliže je požadována izolace LSIRF polypeptidu, pak tato izolace může být provedena použitím standardních metod jako jsou ty uvedené níže a v Marston etal. (Meth. Enz., 182:264-275 [1990]).
Jestliže LSIRF polypeptidová inkluzní tělíska nejsou vytvořena v podstatné míře v periplasmě hostitelské buňky, pak se po odstředění buněčného homogenátu bude LSIRF polypeptid zejména nacházet v supematantu a LSIRF polypeptid může být ze supematantu izolován metodami, které jsou uvedeny níže.
V těch případech, kdy je upřednostňována částečná nebo úplná izolace LSIRF polypeptidu, může být čištění uskutečněno použitím standardních metod známých odborníkům v dané oblasti. Tyto metody zahrnují bez omezení separace elektroforezou, následované elektroelucí, různé typy chromatografie (imunoafinitní, molekulární síťová a/nebo iontoměničová), a/nebo vysoko účinná kapalinová chromatografie. V některých případech může být výhodné použití více než jedné z těchto metod pro úplné přečištění.
Termín „substance“ zde použitý označuje látky užitečné při inhibici buď transkripce LSIRF genu, translace LSIRF m-RNA nebo aktivity LSIRF polypeptidu.
Termín „terapeuticky účinný“ označuje množství substance, které je potřebné k dosažení požadované fyziologické odpovědi, tj. k potlačení aktivace lymfocytů jako ·· · ·* ···· ·· • · · · · · · · ·· · • · · · · · · ··· • ···· · · · · · ···· · • · · · ···· ···· · ·· ♦ ····· ·· odezvy k antigennímu stimulu nebo autoimunní odpovědi, nebo ke zvýšení počtu lymfocytů ke stimulaci imunní odpovědi k antigenním stimulům.
Termín „antigenní stimul“ označuje látku, která se buď přirozeně nalézá u savců (endogenní) a vyvolává některé aspekty imunní odezvy, nebo je z exogenního zdroje a napadá savčí systém a vyvolává některé aspekty imunní odpovědi.
Kompozice užitečné pro aplikaci metod tohoto vynálezu mohou být připraveny podle standardních metod dobře známých odborníkům z dané oblasti.
Terapeutické Anti-LSIRF protilátky
Polyklonální nebo monoklonální terapeutické anti-LSIRF protilátky užitečné při aplikaci vynálezu mohou být připraveny v laboratorních zvířatech nebo rekombinantními DNA technikami užívající následující metody. Polyklonální protilátky k LSIRF molekule nebo jejímu fragmentu, obsahující cílenou aminokyselinovou sekvenci, jsou obecné vyvolávány u zvířat mnohonásobnými podkožními (sc) nebo intraperitoneálními (ip) injekcemi LSIRF molekuly v kombinaci s adjuvans, například Freundovo adjuvans (úplné nebo neúplné). Ke zvýšení imunogenicity může být užitečné nejdříve konjugovat LSIRF molekulu nebo fragment obsahující cílenou aminokyselinovou sekvenci s proteinem, který je imunogenní v druzích, které mají být imunizovány, například, hemocyanin kuželnatky, sérový albumin,, hovězí tyreoglobulin nebo sojový trypsinový inhibitor za současného užiti bifunkčního nebo derivatizačního činidla, například, maleimidobenzoyl ester sulfosukcinimidu (konjugace přes cysteinové zbytky), N-hydroxysukcinimid (přes lysinové zbytky), glutaraldehyd, sukcinanhydrid, SOCI2 nebo R1N=C=NR, kde R a R1 jsou rozdílné alkyl skupiny. Případně mohou být LSIRF-imunogenní konjugáty produkovány rekombinantně jako fúzní proteiny.
Zvířata jsou imunizována proti jmunogenním LSIRF konjugátům nebo derivátům (například fragmentem obsahujícím cílenou aminokyselinovou sekvenci) spojením asi 1 mg nebo asi 1 pg konjugátu (pro králíky nebo myši) s asi 3 objemy Freundova úplného adjuvans a očkováním tohoto roztoku intradermálně na více místech. Přibližné po 7 až 14 dnech jsou zvířata vykrvácena a v séru se stanoví anti-LSIRF titr. Zvířata jsou opakované očkovány antigenem až na hladinu titru. S výhodou je zvíře očkováno stejnou LSIRF molekulou nebo jejím fragmentem, která byla použita pro počáteční imunizaci, ale konjugována k jinému proteinu a/nebo pres jiné síťovací ·· · ·· ·· ·· ·· • · · · · · · ···«
IQ ······♦··· ········ ······· • · · · · 9 9 · • 999 · ·· ···· ·· 99 činidlo. Dále jsou používána agregační činidla, například kamenec v injekcích ke zvýšení imunní odpovědi.
Monoklonální protilátky mohou být připraveny izolováním buněk sleziny z imunizovaných zvířat a zvěčněním těchto buněk běžným způsobem, například, fúzí s buňkami myelomu. Tyto klony jsou pak zkoumány na ty, které exprimují požadovanou protilátku. Monoklonální protilátka s výhodou křížově nereaguje s dalšími LSIRF polypeptidy nebo izoformami LSIRF polypeptidu.
Příprava protilátek užívající rekombinantních DNA metod, například fágová metoda zobrazení, může být uskutečněna použitím komerčně dostupných souprav, například rekombinantní fágový protilátkový systém dostupný od Pharmacia (Uppsala, Sweden), nebo SurfZAP™ fagový zobrazovací systém (Stratagene lne., La Jolla, CA).
S výhodou protilátky pro podávání lidem, ačkoliv připravené v laboratorním zvířeti například myši, budou „polidštěné“ nebo chimémí, tzn., vytvořené tak, aby byly kompatibilní s lidským imunitním systémem tak, že si lidský pacient nevytvoří imunitní odpověď na tuto protilátku. Dokonce jsou lidské protilátky, které nyní mohou být připraveny použitím metod popsaných například v Lonberg a kol. (Nátuře Genetics, 7: 13-21 [1994]), upřednostňovány pro terapeutické podávání pacientům.
Protilátky produkované použitím kterékoliv z výše popsaných metod, mohou být konjugovány k látkám, které jsou schopny pronikat buněčnou membránou a jadernou membránou za účelem transportu protilátky do jádra, za použití například, do jádra zaměřeného signálu jako je ten, který se nalézá na fosforylované formě LSIRF.
Terapeutické kompozice a podávání
Terapeutické složení kompozic užitečné pro provedení vynálezu jako jsou LSIRF protilátky, mohou být připraveny pro skladování smícháním vybrané kompozice mající požadovaný stupeň čistoty s volitelnými fyziologicky přijatelnými nosiči, vehikuly nebo stabilizátory (Remington's Pharmaceutical Sciences, 18. vydání, A. R. Gennaro, ed., Mack Publishing Company [1990]) ve formě lyofilizovaného koláče nebo vodného roztoku. Přijatelné nosiče, vehikuly nebo stabilizátory jsou netoxické k příjemcům a jsou s výhodou inertní v používaných dávkách a koncentracích a zahrnují pufry, například fosfát, citrát nebo další organické kyseliny; antioxidanty, například kyselina askorbová; nízkomolekulámí polypeptidy; proteiny, například sérový
444 · · · 4 ··· • ······ 4 « · ·* 4 4· · 4 4 · ·* • 4 * «4 · · · · 4 4 ·* albumin, želatina nebo imunoglobuliny; hydrofilní polymery, například polyvinylpyrolidon; aminokyseliny například glycin, glutamin, asparagin, arginin nebo lysin; monosacharidy, disacharidy a další sacharidy, zahrnující glukosu, manosu nebo dextriny; chelatující činidla, například ethylendiamintetraoctová kyselina (EDTA); cukerné alkoholy, například manitol nebo sorbitol; solitvomé protiionty například sodík; a/nebo neiontové povrchově aktivní látky, například Tween, Pluronics nebo polyethylenglykol (PEG).
Kompozice, která má být použita pro podávání in vivo musí být sterilní. Toto je snadno proveditelné filtrací přes sterilní filtrační membrány, před nebo po lyofilizaci a rekonstituci. Kompozice pro parenterální podávání bude normálně skladována v lyofilizované formě nebo v roztoku.
Terapeutické kompozice jsou obecně umístěny v zásobníku majícím sterilní vstupní otvor, například, sáček pro vnitrožilní roztok nebo ampulka, mající uzávěr proniknutelný podkožní injekční jehlou.
Cesta podávání směsi je v souladu se známými metodami, například, orální, injekce nebo infúze vnitrožilními, intraperitoneálními, intracerebrálními, intramuskulámími, intraokulámími, intraarteriálními nebo intralesionálními cestami nebo trvalými uvolňovacími systémy nebo implantačním zařízením. Podle požadavku mohou být kompozice podávány kontinuálně infuzí, injekcí bolusu nebo implantačním zařízením.
Vhodné příklady trvale uvolňujících přípravků zahrnují semipermeabilní polymemí matrice v podobě tvarovaných položek, například, filmů nebo mikrokapslí. Trvale uvolňující matrice zahrnují polyestery, hydrogely, polyláktidy (U.S. 3,773,919, EP 58,481), kopolymery kyseliny L-glutamové a gamma ethyl-L-glutamatu (Sidman a kol., Biopolymers, 22: 547-556 [1983]), póly (2-hydroxyethyl-methakrylat) (Langer a kol.., J. Biomed. Mater, Res., 15: 167-277 [1981] and Langer, Chem. Těch., 12: 98105 [1982]), ethylenvinylacetat (Langer a kol., supra) nebo kyselinu poly-D(-)-3hydroxymáselnou (EP 133,988). Trvale uvolňující kompozice mohou také zahrnovat liposomy, které mohou být připraveny některou z metod známých ve stavu techniky (například, DE 3,218,121; Epstein a kol., Proč. Nati. Acad.Sci. USA, 82: 3688-3692 [1985]; Hwang a kol.., Proc.Natl. Acad. Sci. USA, 77: 4030-4034 [1980]; EP 52,322; EP 36,676; EP 88,046; EP 143,949).
·· ·
Účinné množství kompozic používaných terapeuticky bude například záviset na terapeutickém účelu, způsobu podání a pacientově kondici. Podle toho bude muset terapeut stanovit dávku a upravit způsob podání tak, aby se získal optimální terapeutický účinek. Typická denní dávka může být v rozsahu od asi 1 pg/kg do 100 mg/kg či více, v závislosti na výše uvedených faktorech. Typicky bude terapeut podávat směs tak dlouho, dokud dávka nedosáhne množství, které zabezpečí požadovaný účinek. Vývoj této terapie lze snadno monitorovat konvenčními zkouškami k vyhodnocování.
Molekuly LSIRF nukleové kyseliny, 5' koncové sekvence, polypeptidů a protilátek podle vynálezu mají rozmanité použití, které je zcela zřejmé odborníkům v dané oblasti.
LSIRF polypeptidy budou sloužit jako cíle pro terapeutické látky používané pro regulaci lymfocitní aktivace. Zablokováním buď exprese LSIRF genu (snížením LSIRF transkripce nebo translace) nebo aktivity LSIRF polypeptidů je možné potlačit lymfocitní aktivaci jako odpověď na určité stimuly prostředí. Zvýšením úrovně exprese LSIRF genu (regulací LSIRF 5' koncové sekvence) je možno stimulovat lymfocitní aktivaci a proliferaci, a tím zvyšovat imunní odpověď na určité antigeny.
Protilátky podle vynálezu mohou být polyklonální nebo monoklonální a mohou být vyvolány proti LSIRF z jakéhokoliv savce. Tyto protilátky mohou být použity k posouzení přítomnosti a/nebo množství LSIRF polypeptidů v dané tkáni nebo biologickém vzorku. Navíc mohou být použity k blokování aktivity LSIRF navázáním na aktivní místo tohoto polypeptidů. Proto, protilátky samotné mohou naleznout použití jako terapeutické látky ke snížení hladiny LSIRF polypeptidů.
Vynález může být snadněji pochopen pomocí odkazů na následující příklady. Tyto příklady by v žádném případě neměly být chápány jako limitující rozsah vynálezu. - —........
Příklady provedení vynálezu
Příklad 1
Klonování cDNA myší LSIRF
Dva PCR (polymerasová řetězová reakce) částečné degenerované primery byly použity pro PCR amplifikaci cDNA, připravené z úplné RNA, získané z tkáně sleziny C57B1/6 myši. Použité primery byly:
··
ATCCTGGAACACGC (SEQ ID N0:5)
GCACACGAACTGCCTTCCA (SEQ ID N0:6)
Primer č. 5 obsahoval tři inosinové báze, které se nacházely mezi nukleotidy 2 a 3 (T a C), nukleotidy 4 a 5 (C a T) a nukleotidy 9 a 10 (A a C). Primer č. 6 obsahoval čtyři inosinové báze v sekvenci, nacházely se mezi nukleotidy 5 a 6 (A a C), nukleotidy 7 a 8 (G a A), nukleotidy 9 a 10 (A a C) a nukleotidy 11 a 12 (T a G).
PCR byla provedena na programovatelném tepelném cykléru (Perkin-Elmer Cetus, Norwalk, CT) v 50 μΙ PCR pufru (10mM Tris-HCI pH 8,3, 1,5 mM MgCh, a 50 mM KCI) obsahujícím 200 μΜ dNTPs, 2 U Taq polymerasu a 100 pM každého příměru. Třicet cyklů PCR bylo uskutečněno v následujícím teplotním režimu: 94°C po dobu 60 sekund; 37°C po dobu 60 sekund; a 72°C po dobu 60 sekund. PCR produkty byly následně vloženy přímo do pCRII plazmidu za použití TA-klonovacího systému (Invitrogen Corp., San Diego, CA). Plazmidy obsahující inserty produktové PCR byly transformovány do příslušného kmenu E. coli INV-alpha F' (Invitrogen Corp.) pro amplifikaci. Plazmidová DNA z těchto hostitelských buněk byla připravena použitím standardní alkalické lýzové metody (Sambrook a kol., Supra) a plazmidová DNA pak byla podrobena elektroforéze na přibližně 1,5 procentním agarosovém gelu. Část DNA byla blotována na Hybond-N membránový papír (Amersham, Oakville, Ontario, Kanada) a hybridizována náhodně vzniklými 32P značenými DNA fragmenty myších IRF-1 a IRF-2 použitím návodu podle výrobce (Amersham). Plazmidová DNA z klonů, které nehybridizovaly se žádným z fragmentů IRF-1 ani IRF-2, byla sekvenována použitím soupravy US Bioscience Sequenase (US Bioscience, Cleveland, Ohio). Jeden klon, „Spi 5“, obsahoval novou nukleotidovou sekvenci, která byla určena z průzkumu v genové bance. Tento klon byl náhodně označen 32P (Amersham postup) a pak byl použit k pozorování myší IL-4 indukované slezinové cDNA knihovny (Clonetech, Palo Alto, CA). Po hybridizaci byly filtry obsahující klony cDNA knihovny promývány nejprve 1 krát SSC a 0,1 procentním SDS po dobu asi 30 minut při asi 65°C, a pak 0,2 krát SSC a 0,1 procentním SDS po dobu asi 30 minut při asi 65°C. Byly získány dva LSIRF cDNA klony bez ATG startovacího kodonu. Jeden z těchto klonů, „C13“, byl použit k opětovnému sceeningu téže knihovny za výtěžku přibližně 5 kb klonu „C16“, který také postrádal 5' sekvenci. Klon C16 byl pak použit ke sce• * · • · eningu λΖΑΡΙΙ myší slezinové cDNA knihovny (Stratagene, La Jolla, CA) a bylo získáno několik částečných klonů se zdánlivým ATG startovacím kodonem. Úplná cDNA sekvence obsahující celou kódující LSIRF oblast byla získána vytvořením umělého klonu za použití PCR s 5' rozšířeným primerem . Tento klon byl vložen do vektoru pBSlI, aby se vytvořil plazmid PV-I a byla ověřena sekvence LSIRF.
Byla získána předpovídaná aminokyselinová sekvence pro každý z částečných cDNA klonů a některé z těchto klonů obsahovaly navíc glutamin v místě aminokyseliny 164. Úplná délka cDNA sekvence PV-I , která je asi 1,4 kb, je uvedena na obrázku 1. PV-I cDNA obsahuje navíc glutamin v místě aminokyseliny 164. Předpovídaná celá délka aminokyselinové sekvence pro LSIRF, založená na LSIRF cDNA sekvenci, je uedena na obrázku 2.
Příklad 2 . Genomové klonování myší LSIRF
Přibližné 630 bp část klonu C16 LSIRF cDNA byla amplifikována PCR použitím následujících matric:
CAGCCCGGGGTACTTGCCGCTGTC (SEQ ID NO:7)
AGACCTTATGCTTGGCTCAATGGG (SEQ ID NO:8)
PCR podmínky byly 94°C po dobu jedné minuty a 72°C po dobu 30 sekund.
Získaný PCR fragment byl čištěn elektroforézou na 1 procentním agarosovém gelu, s následným průchodem přes Spin-X kolonu (CoStar Corp., Cambridge, MA). Tento fragment byl pak označen 32P za použití techniky náhodného značení (Amersham) a následně užit ke screeningu genomové knihovny připravené z ledvinové tkáně 129/J myši. Několik klonů bylo získáno promýváním při 65 °C v 0,1 x SSC a 0,1 procentním SDS. Dva z těchto klonů (velikost 12 a 15 kb) byly subklonovány do vektor pBSlI (Stratagene, La Jolla, CA) pro sekvenování. Tyto klony obsahovaly překrývající sekvenci dovolující identifikaci asi 2 kb 5'koncové sekvence. 5' koncové sekvence je uvedeny na obrázku 3. Genomová sekvence obsahující exony a introny myšího LSIRF genu je uvedeny na obrázku 4 a místa, které v sekvenci nesouhlasí v důsledku sekvenční neurčitosti jsou vyznačeny jako „R“ pro A nebo G, „S“ pro G nebo C, „M“ pro A nebo C a „K“ pro T nebo G. Tyto nejednoznačné místa jsou:
·· · · · · ···· • · · · · · · · ·Ο ······ · · e ··· · 9 • · · · · · · • · · · ···· ·· 9·
Μ na nukleotidech 748, 4159, 7413, a 10357;
R na nukleotidech 5277, 5310, 10564, a 11713;
K na nukleotidech 4513, 5885, a 9812;
S na nukleotidu 6425.
Všechny nejednoznačné místa jsou u intronů, tudíž neovlivňují aktuální nukleotidovou sekvenci exonú, která zahrnuje kódující oblast LSIRF.
Nukleotidové (cDNA a genomové) sekvence a odvozené aminokyselinové sekvence LSIRF byly porovnány se všemi sekvencemi databází v GenBank a SwissProt, a žádné identické sekvence nebyly nalezeny. Avšak, amino konec sekvence LSIRF byl homologní s dalšími členy IRF skupiny. Největší homologie byla s polypeptidem ICSBP (sekvenční vazebný protein shodný s interferonem), který sdílí 83 procent homologie (přípustné pro jednu aminokyselinovou mezeru) s LSIRF na amino konci.
Příklad 3
Exprese myšího LSIRF
LSIRF celková délka cDNA sekvence byla vyštěpena z plazmidu PV-1 pomocí Eco R! restrikčního štěpení. LSIRF gen byl izolován z 0,7% agarosového gelu po elektroforéze, tupě zakončen použitím Klenow DNA polymerázy a navázán na Nhel místo plazmidu pETL (BlueBacll, Invitrogen Company), aby se vytvořil plazmid pETL-LSIRF. Plazmid byl amplifikován v buňkách E.coli kmene DH5-alfa (vyrůstal v přítomnosti ampicillinu) použitím standardních kultivačních metod a podmínek. Čištěný plazmid obsahující LSIRF gen vhodné orientace (jak bylo určeno mapováním pomocí restrikčního endonukleázového štěpení s EcoRI, HindlII nebo Pvull) byl přenesen do Sf9 hmyzích buněk (dostupných od Američan Type Culture Collection, 12301 Parklawn Drive, Rockville, MD USA) spolu s linearizovanou genomovou DNA baculoviru (Invitrogen Corp., San Diego, CA, USA) a tyto buňky byly inkubovány po dobu 48 hodin při asi 28 °C v Graceově médiu doplněném kvasinkami, hydrolyzátem laktalbuminu a 10 procentním fetálním telecím sérem.
Po inkubaci byly získány buňky a byly provedeny plakové zkoušky (Richardson, ed., Meth. Mol. Biol., vol 39: Baculovirus Expression Protocols, Humana Press, Totowa, NJ [1995] v přítomnosti Bluo-gal (Gibco-BRL, Grand Island, NY,
ΦΦΦ · φ ·· ·· ·· • · · · · · « · · φ • · φ φφ · φφφφ
Λ ······ « 6' Φ ΦΦΦΦ Φ • · · Φ Φ ΦΦΦ «φφφ · Φ· ΦΦΦΦ ΦΦ ·Φ
USA) za účelem izolace rekombinantního viru. Modré rekombinantní plaky byly vybrány po 5 až 7 dnech kultivování a tyto plaky byly amplifikovány v 24 jamkových mikrotitračních destičkách obsahujících Sf9 buňky. Další amplifikace rekombinantního viru byla uskutečněna kultivováním buněk ve velké míře v baňkách tkáňových kultur, dokud nebyl získán titr asi 108 pfu/ml. Exprese LSIRF byla ověřena infikováním Sf9 buněk pň znásobení infekcí 1 pfu/buňku a odebráním buněk v 0, 24, 48, 72, a 96 hodině po infikování. Buněčné lyzáty pak byly připraveny solubilizací v SDSPAGE vzorkovém pufru (100mM DTT, 80 mM Tris-HCI, pH 6,8, 10 procentní glycerol, 0,0012 procentní bromfenolová modř) a byly analyzovány Western blot analýzou.
Byly analyzovány proteinové extrakty z obou Sf9 buněk a z myších periferních lymfocytů z hlediska přítomnosti LSIRF polypeptidu. Lymfocyty byly připraveny z mízních uzlin vyříznutých z myší, protlačením mízní uzlinové tkáně přes jemné síto. Lymfocyty byly udržovány v Iscovově mediu obohaceném 10 procenty fetálního telecího séra. Proteinové extrakty z Sf9 a lymfocytních buněk byly připraveny za použití návodu výrobce pro Sf9 buňky (Pharmingen, San Diego, CA) nebo metod uvedených v Sambrook a kol., (Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY [1989]; pro lymfocytní buňky). Proteiny byly rozpuštěny v 8 procentech polyakrylamidu/0,1 procento SDS gelu a tento gel byl přenesen na Immobilon-P membránu (millipore Company) za použití standardních postupů. Blot byl nejdříve inkubován s blokujícím pufrem (4 procenta odstředěného mléka a 0,5 procent Tween-20 v 1 X PBS) po dobu 1 hodiny při laboratorní teplotě. LSIRF králičí polyklonální antiserum získané proti LSIRF peptidu zakončeným karboxy skupinou ve zředění asi 1 : 2000 (v roztoku skládajícím se z 1 dílu blokujícího pufru a 1 dílu PBS). LSIRF peptid, kterým byl očkován králík za účelem generace protilátky byl:
GYELPHEVTTPDYHR (SEQ ID NO: 9)
Po inkubaci s LSIRF protilátkou po dobu asi 1 hodiny byl blot promyt a LSIRF protilátka byla dokazována konjugovanou protilátkou obsahující kozí antikráličí křenovou peroxidázu ve zředění asi 1 : 5000.
Výsledky ukazují, že byl rozpoznán přibližně pás 51 kD (předpovídaná molekulová hmotnost LSIRF) anti LSIRF protilátkou pro jak periferní T buňky stimulované anti-CD3 protilátkami tak rekombinantní Sf9 buňky.
• * β · · · ♦ · · • · · *· · * • ·. » · ·· ······ ·4 • 4* · ·· «»·· « ·· ····
Příklad 4
Analýza exprese myší LSIRF A. Tkáňové bloty
K posouzení tkáňové specifičnosti LSIRF transkriptů byla připravena celková RNA z tkáně myšího mozku, plic, brzlíku, kostní dřeně, sleziny, jater, střev, pankreatu, slinné žlázy, varlat, srdečního a hladkého svalu za použití metod popsaných v Wangm a kol. (EMBO J., 10: 2437-2450 [1991]). RNA kyseliny byly podrobeny elektroforéze na 1 procentním agarosa/formaldehydovém gelu za použití standardních postupů, a pak transferovány na nitrocelulosový papír, jak je popsáno v Sambrook a kol., supra. Bloty pak byly hybridizovány s náhodně vzniklou 32P značenou 1,4 kb cDNA, obsahující celou kódující oblast LSIRF (vklad z PV-1), a následně promytou jak je popsáno v Stewart a ko\.(Meth. Mol. Cell Biol., 1: 73-76 [1989]) při asi 50 °C v 0,2 X SSC a 0,1 procentním SDS.
Výsledky ukázané na obrázku 5 naznačují, že LSIRF transkript o asi 5,5 kb je přítomen hlavně v tkáních sleziny a kostní dřeně, se méně častěji transkript téže velikosti v tkáních brzlíku a plic. Překvapivě nebyly pozorovány žádné přídavné pásy. Navíc obrázek 6 ukazuje, že tkáň mízní uzliny rovněž obsahuje LSIRF transkripty.
Byly vyhodnoceny různé linie T buněk obsahující CTLL-2, D10.G4.1, HT-2, EL-4 a BW5147 (všechny buňky dostupné z Američan Type Culture Collection, 12301 Parklawn Drive, Rockville, MD, USA) z hlediska LSIRF exprese za použití Nothem blot analýzy. RNA byla extrahována z těchto buněčných linií použitím metody Chomczynski a kol. (Anal. Biochem., 162: 156-159 [1987]). Buněčné linie byly udržovány při 37 °C a 5 procentech CO2 v Iscovově médiu obohaceném 10 procentním fetálním telecím sérem a 2 mM L-glutaminem. Předpokládá se, že první tři buněčné linie jsou periferními T buněčnými rody , zatímco u posledních dvou se předpokládá, že jsou nezralými T buněčnými rody. Kultury HT-2 a CTLL-2 buněk byly obohaceny 50 U/ml IL-2 (Genzyme lne., Cambridge, MA) a 50 ti μΜ 2merkaptoethanolu; kultury D10.G4.1 byly obohaceny 50 U/ml IL-1 (Genzyme lne., Cambridge, MA), 50 ti U/ml IL-2 a 50 mM 2-merkaptoethanolu.
Nothem bloty byly připraveny z úplné RNA transferovány na Hybond N papír a zkoumány s 1,4 kb náhodně značenou cDNA, jak je výše popsáno, za použití Stewart a kol., supra metod.
'•fj ··· ♦ · · · · · · · z / «·· · · · · · · · ····*· · 9 · · · · · « • · · · ♦ ··« »··· · ·· ···· ·· ··
Výsledky ukazují, že LSIRF transkripty jsou viditelné pouze u periferních T buněčných linií , což naznačuje, že LSIRF je přednostně exprimován ve zralých T buňkách. Podobné analýzy mRNA transkripce v pre-B buněčných liniích CB17.51, B buněčných liniích WEHI231 (Američan Type Culture Collection), a buněčných liniích plazmocytomu J558 (Američan Type Culture Collection) ukazují přítomnost transkriptu ve všech buněčných liniích s tím, žé nejsilnější signál má J558.
Byla vyhodnocena indukce LSIRF v primárních lymfocytech získaných ze sleziny nebo mízních uzlin přidáním různých stimulátorů k pěstovaným buňkám a posouzením LSIRF mRNA hladin. Stimulanty použité pro buňky mízních uzlin byly 1000 U/ml myší interferon beta (IFN-beta; Lee Biomolecular Research, San Diego, CA), 100 U/ml myší interferon-gamma (IFN-gamma; Genzyme lne., Cambridge, MA) nebo 10 ng/ml myší nádorový nekrotický faktor (TNF; Genzyme lne.). Na splenocytámí buňky se působilo 20 pg /ml anti-IgM protilátek, 10 pg /ml lipopolysacharidů (LPS; bakteriální endotoxin), 10 ng/ml PMA (forbolmyristat acetat; Sigma Chemical Co., St. Louis, MO), 1 mg/ml cyklosporinu A (CsA; Sandoz Company, Basel, Switzerland), 10 pg /ml Concanavalinu A (ConA; Sigma), nebo 1 nebo 10 pg /ml cykloheximidu (CHX; Sigma). Na všechny buňky se působilo po dobu 6 hodin při teplotě 37°C.
Výsledky jsou ukázány na obrázcích 6, 7 a 8. Na všech obrázcích je znázorněn beta aktin jako indikátor množství celkové analyzované RNA.
Obrázek 6 ukazuje, že anti-CD3 protilátky indukovaly LSIRF transkripci. Mnohem překvapivější však je , že interferony neindukovaly LSIRF transkripty. Toto je v ostrém kontrastu k jiným známým IRF, protože transkripty ostatních dvou známých IRF jsou indukovány interferony.
Obrázek 7 ukazuje, že cykloheximid, inhibitor proteinové syntézy, indukuje LSIRF transkripci. Tyto výsledky nebyly očekávány, protože cykloheximid neindukuje transkripci IRF-1 nebo IRF-2 genů.
Obrázek 8 ukazuje, že anti-IgM a PMA indukují LSIRF transkripty. Tato indukce pomocí anti-IgM byla překvapující, protože ukazuje, že LSIRF je exprimován v B buňkách stejně tak, jako v T buňkách.
• ·
« · · · · ···· · ·♦ ····
B. Gelová detekce
Elektroforetická mobilní detekce byla prováděna k posouzení, zdali LSIRF polypeptid je DNA vazebným proteinem. Jaderné extrakty z kontrolních Sf9 buněk (přenesených pouze s) a LSIRF exprimující Sf9 (přenesený s divokým typem baculoviru obsahující LSIRF cDNA) buněk byly připraveny následovně. Sf9 buňky byly sedimentovány a pak dvakrát promyty v PBS. Po konečném promytí byly buňky resuspendovány v 0,5 ml „H-pufru“ (hypotonický pufr) na 107 buněk (H-pufr se skládá z : 25mM Hepes- NaOH, pH 8,0, 10 mM KCI, 5 mM MgCI2, 0,5 mM EDTA a 0,5 mM DTT) a byly inkubovány na ledu po dobu 30 minut, během kterých buňky nabotnaly v důsledku přítomnosti hypotonického pufru. Buňky pak byly rozrušeny 15 údery tloučku typu B v Dounceho homogenizátoru. Jádra byla izolována z buněčného odpadu sedimentací při asi 4°C v mikrofuze při 10 K rpm po dobu asi 10 minut. Sedimenty, které obsahovaly většinu jader, pak byly extrahovány resuspendováním v 0,5 ml Npufru na 107 buněk (N-pufr se skládá z : 25 mM Hepes-NaOH, pH 8,0, 400 mM KCI, 5mM MgCI2l 0,5 mM EDTA, 10 procent glycerolu a 0,5 mM DTT) a inkubovány na ledu po dobu asi 20 minut. Suspenze pak byla odstředěna při 4 °C v mikrofuze při 15 K rpm po dobu asi 15 minut. U supematantu obsahujícím většinu LSIRF polypeptidu byl změněn pufr, aby se odstranil přebytek soli použitím Centricon 10 mikrokoncentrátoru (Amicon Corporation). Přidávaným pufrem pro zkoncentrování LSIRF polypeptidu byl E-pufr (25 mM Hepes -NaOH, pH 8,0, 50 mM KCI , 5 mM MgCI2l 0,5 mM EDTA, 15 procent glycerolu a 0,5 mM DTT). Všechny pufry, H-pufr, N-pufr a E-pufr obsahovaly následující inhibitory proteázy: 0,5 mM PMSF, 0,5 pg /ml leupeptin, a 0,5 pg /ml aprotinin).
K posouzení elektroforetické mobility určitého DNA fragmentu, v důsledku LSIRF navázání fragmentu, byly tyto extrakty inkubovány s dvouvláknovou 32Pznačenou DNA sondou. Sekvence citlivé části této sondy, myší MHC IRSE vazebná sekvence standardního typu je sestavena níže:
TGCAGAAGTGAAACTGAGG (SEQ ID NO: 10)
Pro vazebnou reakci, asi 25 X 103 cpm (odpovídající asi 1 X 10'11 molům sondy) byl připraven ve vazebném reakčním pufru (12 mM Hepes-KOH, pH 7,9, 30 mM KCI, 60 pM EGTA, 0,3 mM DTT, 2,5 procent Ficoll, 0,6 pg póly (dl-dC) [získané od Pharmacia], a 0,05 procent NP-40 ). Jaderné extrakty byly připraveny zředěním přibližně 8 krát v E-pufru, obsahujícím asi 0,1 gg /ml BSA (hovězí sérový albumin) , aby se získala konečná koncentrace asi 14 gg celkového proteinu/ml pro LSIRF obsahující reakce a asi 22 gg /ml pro kontrolní reakce. Vazebné reakce byly nastartovány přídavkem asi 1 gl jaderného extraktu k asi 6,24 gl zkoumaného roztoku, který v některých případech také obsahoval neznačený „ kompetitor“ DNA fragmentů. Sekvence každého z těchto fragmentů je sestavena dále v tabulce 1. Kompetitorové fragmenty byly přidány v molámím přebytku přibližné 750 krát (srovnáno se značeným fragmentem). Roztok jaderného extraktu/sondy byl inkubován při přibližné 23°C po dobu asi 20 minut, a pak byl nadávkován na 9 % polyakrylamidový gel (připravený s 0,25 X TBE), který byl nejdříve podroben elektroforéze pří asi 250 V po dobu asi 2 hodin, před nadávkováním vzorku. Gel byl vystaven po dobu asi 2 hodin napětí asi 300 V za účelem separace protein-DNA komplexů z nenavázané DNA sondy. Gel byl pak vysušen a vyfotografován k vyhodnocení migračního posunu DNA sondy v důsledku navázání proteinu.
TABULKA 1
FRAGMENT
SEKVENCE
mMHC ISREwt TGCAGAAGTGAAACTGAG (SEQ ID NO: 11)
mlSRE mťl TGCAGAAGTGAAACCTGG (SEQ ID NO: 12)
mlSRE mt2 TGCAGAAGTGAACATGAG (SEQ ID NO: 13)
mlSRE mt3 TGCAGAAGTGGTCCTGAG (SEQ ID NO: 14)
mlSRE mt 4 GCTAGAAGTGAAACTGAG (SEQ ID NO: 15)
mlgk B mlgkappa E3' hlSG54 ISRE AAAGGAAGTGAAACCAAG (SEQ ID NO: 16) TGAGGAACTGAAAACAGA (SEQ ID NO: 17) . _ GGGAAAGTGAAACTAG (SEQ ID NO: 18)
V tabulce 1 „m“ indikuje myší sekvenci, a „h“ indikuje lidskou sekvenci.
Výsledky jsou znázorněny na obrázku 9. Jak je vidět, MHC ISRE sekvence standardního typu váže LSIRF protein. Navíc dva ISRE DNA fragmentové mutanty « * · 9 9 · · 9 9 · · ·· · · · · · · ·9j
9* 9 9 9 · 9 999 • ···»· · * · 999 99
9 9 9 9 9 99
999 9 99 9 9 9 999 99 m1 a m4 soutěží mezi sebou v navázání, podobně jako dva další DNA fragmenty Ig λΒ a ISG54.
Příklad 5
Lidské LSIRF klonování
K identifikaci lidské cDNA kódující LSIRF byla zkoumána lidská lymfocytní cDNA knihovna (Clontech, Palo Alto, CA; katalogové číslo HL 1031a) použitím myšího PV-1 klonu. Podmínky sceeningu byly: přes noc při 65°C v Churchově pufru (Church and Gilbert, Proč. Nati. Acad. Sci. USA, 81: 1991-1995 [1984]). Filtry byly promývány dvakrát po dobu 30 minut každý v 2 X SSC a 0,1 procentním SDS. Bylo zkoumáno asi jeden milión plaků, byly identifikovány dva pozitivní klony, izolovány a DNA byla čištěna použitím standardních technik. Klony byly subklonovány na místo EcoRi pBluescript (Stratagene, LaJolla, CA). Byl seřazen nejdelší z těchto klonů označený H14 , který byl delší než asi 2 kb. Tato sekvence indikovala, že klon je hybridem TNF (nádorový nekrotický faktor) receptoru p55 (asi 400 párů bází) a asi 1 kb sekvence, která je vysoce homologní k exonům 3-9 myší LSIRF sekvence. Navíc tento klon obsahuje konzervativní stopkodón, spletenou donorovou sekvenci, a asi 600 párů bází intronu 9. Došlo se tudíž k závěru, že tato 1019 sekvence párů bází reprezentuje část lidské LSIRF sekvence. Tato 1019 sekvence párů baží byla amplifikována pomocí PCR za použití následujících matric:
CTGGACATCTCAGACCCGTACAAAGTG (SEQ ID NO: 19)
CTTGACATI I I ICATTCTTGAATAGAG (SEQ ID NO: 20)
Podmínky amplifikace byly 94 °C po dobu 30 sekund, 65 °C po dobu 30 sekund a 72 °C po dobu 90 sekund. Bylo použito asi 500 ng H14 templátu v přítomnosti Taq polymerázy a bylo provedeno asi 15 cyklů PCR. .Vznikající PCR produkt se přímo navázal na TA klonující vektor PCRII sady (Invitrogen, San Diego, CA) a seřadil, aby se ověřilo, že byl amplifikován vhodný fragment. Tento fragment 1019 páru bází cDNA, označený „FISH“, byl pak použit ke screeningu lidské leukocytní 5'prodloužené cDNA knihovny (Clontech; katalogové číslo HL 1169x). Podmínky screeningu byly: asi 65°C přes noc v Churchově pufru, následované dvojím promytím po dobu asi 30 minut v 2 X SSC a 0,1 procentním SDS a potom dvakrát v 0,2 X SSC a 0,1 procentním SDS po dobu asi 30 minut. Byl identifikován jeden plak asi 500 000 a DNA byla čištěna a sekvenována. Tento klon označený HIRF4XDR2 obsahoval intron2 a celodélkový exon 3 (byla nalezena pouze část exonu 3 v H14 klonu), stejně jako exony 5, 7, 8 a intron 8 . Podle všeho exony 4 a 6 byly rozpleteny nebo chyběly.
K získání zbytku LSIRF kódující sekvence byly použity dva přístupy. Nejdříve byla zkoumána lidská placentámí genomová knihovna v přenašeči lambda fix 2 (Stratagene, LaJolla, CA) za použití FISH cDNA jako sondy. Podmínky screeningu byly: asi 65°C přes noc v Churchově pufru, následované dvojím promytím po dobu asi 30 minut v 2 X SSC a 0,1 procentním SDS a pak dvakrát v 0,2 X SSC a 0,1 procentním SDS po dobu asi 30 minut. Bylo izolováno 10 fágových klonů a DNA byla čištěna z jednoho klonu označeného HG-1. Tato DNA byla digerována s restrikčními endonukleázami Bam Hl, Sac I, a Xba I a tyto fragmenty byly subklonovány do klonujícího vektoru pMOB (Strathmann a kol., Proč. Nati. Acad. Sci. USA, 88: 12471250 [1991]). Byla získána sekvence každého fragmentu a porovnána s myší LSIRF sekvencí. Byly identifikovány promotory exon I a exon II lidského LSIRF v tomto klonu založeném na homologii s myší sekvencí.
Druhým použitým přístupem byla RACE reakce používající sadu Clontech Marathon® podle návodu výrobce. Byla použita B-buňěčná lymfomová linie nazvaná OCILY8 (viz Blood, 69: 1307-1314 [1987]), která byla ukázána předchozí analýzou Nothem bloty a mající vysokou LSIRF expresi. Byl sekvenován a nalezen výsledný RACE produkt, aby se porovnala genomová sekvence exonu 1 a 2 (získaná dle výše uvedeného postupu).
K přípravě otevřeného čtecího rámu byla FISH cDNA vyříznuta z místa EcoRI přenašeče PCRII a navázána na EcoRI místo PGEX4T3 (Promega, Madison, Wl) za tvorby vektoru pGEX4T3-FISH. ^získání 5' konce otevřeného čtecího rámu v podobě, která by dovolila, aby byl fúzován do FISH klonu, byla použita lidská slezinová Marathon® (Clontech, katalogové číslo 7412-1) hotová cDNA s následujícími dvěma matricemi pro amplifikaci:
TGCCCTCAGCTCCGAGTCCAG (SEQ. ID. NO.: 21)
AACCATTTTCACAAGCTG (SEQ. ID. NO.: 22)
♦ · · · · · ·
9 9 9
999 99 ··
Amplifikace byla uskutečněna použitím PCR za následujících podmínek: 94°C po dobu 30 sekund, 64°C po dobu 30 sekund, a 68°C po dobu jedné minuty. Bylo provedeno 30 cyklů za použití Expand High Fidelity Polymerázy (Boehringer Manheim). Použitím tohoto postupu byla amplifikována sekvence N-konce LSIRF za vzniku očekávaného fragmentu DNA velikosti přibližně 600 párů bází.
Fragment mající přibližně 600 párů bází byl znovu amplifikován PCR za použití SEQ. ID. NO.: 22 (uvedené výše) a SEQ. ID. NO.: 23, jak je uvedena níže:
GGATCCGGATCCATGAACTGGAGGGCGGCGGCCGAGGC (SEQ. ID. NO.: 23)
Bylo provedeno patnáct cyklů PCR za následujících podmínek: 94°C po dobu 30 sekund, 64°C po dobu 30 sekund, a 72°C po dobu 90 sekund za použití přirozené PFU polymerázy (Stratagene, LaJolla, CA).
Vektor PGEX4T3 obsahující FISH vložku (pGEX4T3-FISH) byl štěpen oběma BamHI a Sac II, čímž se odstranila 5' část FISH insertu. PCR produkt obsahující přibližně 600 párů bází (viz výše) byl štěpen stejnými enzymy a navázán na pGEX4T3-FISH vektor za tvorby otevřeného čtecího rámového konstruktu GEX4T3 LSIRF Bam HI/EcoRI, jejíž kódující oblast je sestavena dále na obrázku 10. Předpokládaná sekvence aminokyselin je uvedena dále na obrázku 11. Tento klon byl vyhodnocen přípravou GST fúzního proteinu (Pharmacia) na základě návodu výrobce. Předpokládaná velikost fúzního proteinu byla asi 79 kD, z kterého asi 27 kD tvoří GST protein a asi 52 kD tvoří LSIRF protein. Fúzní protein migroval na 8 procentním SDS-PAGE na očekávanou velikost asi 79 kD, jak bylo určeno barvením pomocí Coomassi blue.
Nothem blot analýza lidského LSIRF ukázala, že tento gen je exprimován zejména ve tkáni sleziny a tkáni periferní krve, s nižší hladinou u tkání tračníku a střev. Navíc, použitím Nothem blotové linie mnohočetné rakovinové buňky, získané od Clontech (katalogové číslo 7757-1) byla pozorována slabá exprese tohoto genu v linii Ráji lidského B buněčného Burkittova lymfomu, a silná exprese byla pozorována v lidské melanomní linii G361 rakovinové linie.
Na základě sekvenování DNA několika klonů obsahujících částečnou hLSIRF sekvenci se předpokládá, že existují dvě formy hLSIRF sekvence. Jedna forma, „Single Q“ forma, obsahuje „CAG“ kodon u bází 490-492, který kóduje aminokyselinu
Q (Gin) v místě aminokyseliny 164. Druhá forma LSIRF DNA, „Double Q“ forma, obsahuje přídavný „CAG“ kodon mezi bázemi 492 a 493 „Single Q“ formy, což má za následek přídavnou aminokyselinu Q (Gin) mezi aminokyselinami 163 a 164 „Single Q“ formy. Kromě tohoto jednoho rozdílu jsou tyto dvě formy sekvence aminokyselin a nukleových kyselin identické.
Celá délka „Single Q“ DNA sekvence kódující lidský LSIRF (hLSIRF) ve vektoru pGEX4T3 byla uložena s ATCC pod přístupovým číslem 98016 a to 27. března 1996. Navíc, celá délka lidské LSIRF sekvence kódující „Double Q“ formu hLSIRF proteinu byla uložena s ATCC a to 27. března 1996 pod přístupovým číslem 98017.
·· ·
Seznam sekvencí (1) Obecné informace:
i) Přihlašovatel: Amgen Kanada lne.
ii) Název vynálezu: Nové geny kódující LSIRF polypeptidy iii) Číslo sekvencí: 25 iv) Kontaktní adresa:
A) Adresát: Amgen Kanada lne.
B) Ulice: 6733 Mississauga Road, Suitě 303
C) Město: Mississauga
D) Stát: Otario
E) Země: Kanada
F) ZIP: L5N 6JB
v) čtecí forma na počítači
A) Typ media: disketa
B) Počítač: IBM PC kompatibilní
C) Operační systém: PC-DOS/MS-DOS
D) Software: Patentln Release #1,0, verze #1,30 vi) stávající data přihlášky:
A) Číslo přihlášky:
B) Datum podání:
C) Klasifikace:
viii) právní zástupce/ informace o zástupci
A) Jméno: Oleski, Nancy A.
B) Registrační číslo: 34 688
C) Reference/ adresní číslo: A-338A
2) Informace pro SEQ ID NO: 1:
i) Charakteristiky sekvence:
A) Délka: 1353 párů baží
B) Typ: nukleová kyselina
C) Vlákno: jednoduché
D) Topologie: lineární i i) Typ molekuly: cDNA «· · '·· xi) Popis sekvence: SEQ ID NO: 1:
ATGAACTTGG AGACGGGCAG CCGGGGCTCA GAGTTCGGCA * TGAGCGCAGT GAGCTGCGGC 60
AATGGGAAAC TCCGACAGTG GTTGATCGAC CAGATCGACA GCGGCAAGTA CCCCGGGCTG 120
GTGTGGGAGA ACGAGGAGAA GAGCGTCTTC CGCATCCCGT GGAAACACGC GGGCAAGCAG 180
GACTACAATC GTGAGGAGGA CGCTGCCCTC TTCAAGGCTT GGGCATTGTT TAAAGGCAAG 240
TTCCGAGAAG GGATCGACAA GCCAGATCCT CCTACTTGGA AGACAAGATT ACGATGTGCT 300
CTGAACAAGA GCAATGACTT TGAGGAATTG GTCGAGAGGA GCCAGCTGGA TATCTCTGAC 360
CCATACAAGG TGTACAGGAT TGTTCCAGAG GGAGCCAAAA AAGGAGCAAA GCAGCTCACT 420
TTGGATGACA CACAGATGGC CATGGGCCAC CCCTACCCCA TGACAGCACC TTATGGCTCT 480
CTGCCAGCCC AGCAGGTTCA TAACTACATG ATGCCACCCC ATGACAGGAG CTGGAGGGAT 540
TATGCCCCTG ACCAGTCACA CCCAGAAATC CCATATCAAT GTCCTGTGAC GTTTGGCCCA 600
CGAGGCCACC ACTGGCAAGG CCCATCTTGT GAAAATGGTT GCCAGGTGAC AGGAACCTTT 660
TATGCTTGTG CCCCACCTGA GTCCCAGGCT CCTGGAATCC CCATTGAGCC AAGCATAAGG 720 i
TCTGCTGAAG CCTTGGCGCT CTCAGACTGC CGGCTGCATA TCTGCCTGTA TTACCGGGAC 780 j
ATCCTCGTGA AAGAGCTGAC CACGACGAGC CCTGAAGGCT GCCGGATCTC CCACGGACAC 840
ACCTATGATG TTAGCAACCT GGACCAGGTC CTGTTTCCCT ACCCGGACGA CAATGGACAG 900
AGGAAGAACA TTGAGAAGTT GCTGAGCCAC CTGGAGAGGG GACTGGTCCT CTGGATGGCT 960
CCAGATGGGC TTTATGCCAA AAGACTCTGC CAGAGTAGGA TCTACTGGGA TGGGCCCCTG 1020
GCACTGTGCA GCGATCGGCC CAACAAGCTA GAAAGAGACC AGACTTGCAA GCTCTTTGAC 1080
ACACAGCAGT TTCTATCAGA GCTGCAAGTG TTTGCTCACC ATGGCCGGCC AGCACCGAGA 1140 j
TTCCAGGTGA CTCTGTGCTT TGGTGAGGAG TTTCCAGACC CTCAGAGACA GAGGAAGCTC 1200
ATCACAGCTC ATGTGGAACC TCTGCTAGCC AGACAACTGT ATTACTTTGC TCAACAAAAC 1260
ACTGGACATT TCCTGAGGGG CTACGAGTTA CCTGAACACG TTACCACTCC AGATTACCAC 1320
CGCTCCCTCC GTCATTCTTC CATCCAAGAG TGÁ - 1353
·· ·
2) Informace pro SEQ ID NO:2:
i) Charakteristiky sekvence:
A) Délka: 450 aminokyselin
B) Typ: aminokyselina
C) Vlákno: jednoduché
D) Topologie: lineární ii) Typ molekuly: protein xi) Popis sekvence: SEQ ID NO: 2:
Met Asn Leu Glu Thr Gly Ser
1 5 Asn Gly Lys
Val Ser Cys Gly 20
Asp Ser Gly 35 Lys Tyr Pro Gly
Val Phe 50 Arg Ile Pro Trp Lys 55
Glu 65 Glu Asp Ala Ala Leu 70 Phe
Phe Arg Glu Gly Ile 85 Asp Lys
Leu Arg Cys Ala 100 Leu Asn Lys
Arg Ser Gin 115 Leu Asp Ile Ser
Pro Glu 130 Gly Ala Lys Lys Gly 135
Gin 145 Met Ala Met Gly His 150 Pro
Leu Pro Ala Gin Gin 165 Val His
Ser Trp Arg Asp 180 Tyr Ala Pro
Gin Cys Pro 195 Val Thr Phe Gly
Ser Cys 210 Glu Asn Gly Cys Gin 215
Pro 225 Pro Glu Ser Gin Ala 230 Pro
Arg Gly Ser 10_ Glu Phe Gly Met Ser 15 Ala
Leu Arg 25 Gin Trp Leu Ile Asp 30 Gin Ile
Leu 40 Val Trp Glu Asn Glu 45 Glu Lys Ser
His Ala Gly Lys Gin 60 Asp Tyr Asn Arg
Lys Ala Trp Ala 75 Leu Phe Lys Gly Lys 80
Pro Asp Pro 90 Pro Thr Trp Lys Thr 95 Arg
Ser Asn 105 Asp Phe Glu Glu Leu 110 Val Glu
Asp 120 Pro Tyr Lys Val Tyr 125 Arg Ile Val
Ala Lys Gin Leu Thr 140 Leu Asp Asp Thr
Tyr Pro Met Thr 155 Ala Pro Tyr Gly Ser 160
Asn Tyr Met 170 Met Pro Pro His Asp 175 Arg
Asp Gin 185 Ser His Pro Glu Ile 190 Pro Tyr
Pro 200 Arg Gly His His Trp 205 Gin Gly Pro
Val Thr Gly Thr Phe 220 Tyr Ala Cys Ala
Gly Ile Pro Ile 235 Glu Pro Ser Ile Arg 240
• ·
!
Ser Ala Glu Ala Leu 245 Ala Leu Ser Asp Cys Arg 250 Leu His Ile Cys 255 Leu i i 1
Tyr Tyr Arg Asp 260 Ile Leu Val Lys Glu 265 Leu Thr Thr Thr Ser 270 Pro Glu i
Gly Cys Arg 275 Ile Ser His Gly His 280 Thr Tyr Asp Val Ser 285 Asn Leu Asp
Gin Val 290 Leu Phe Pro Tyr Pro 295 ASp Asp Asn Gly Gin 300 Arg Lys Asn Ile
Glu 305 Lys Leu Leu Ser His 310 Leu Glu Arg Gly Leu 315 Val Leu Trp Met Ala 320
Pro Asp Gly Leu Tyr 325 Ala Lys Arg Leu Cys 330 Gin Ser Arg Ile Tyr 335 Trp
Asp Gly Pro Leu 340 Ala Leu Cys Ser Asp 345 Arg Pro Asn Lys Leu 350 Glu Arg
Asp Gin Thr 355 Cys Lys Leu Phe Asp 360 Thr Gin Gin Phe Leu 365 Ser Glu Leu
Gin Val 370 Phe Ala His His Gly 375 Arg Pro Ala Pro Arg 380 Phe Gin Val Thr 1
Leu 385 Cys Phe Gly Glu Glu 390 Phe Pro Asp Pro Gin 395 Arg Gin Arg Lys Leu 400
Ile Thr Ala His Val 405 Glu Pro Leu Leu Ala 410 Arg Gin Leu Tyr Tyr 415 Phe
Ala Gin Gin Asn 420 Thr Gly His Phe Leu 425 Arg Gly Tyr Glu Leu 430 Pro Glu
His Val Thr Thr Pro Asp Tyr His Arg Ser Leu Arg His Ser Ser Ile
435 440 445
Gin Glu
450
JÍ.
·· ·
2) Informace pro SEQ ID NO:3:
i) Charakteristiky sekvence:
A) Délka: 2139 párů baží
B) Typ: nukleová kyselina
C) Vlákno: jednoduché
D) Topologie: lineární ii) Typ molekuly: DNA (genomová) xi) Popis sekvence: SEQ ID NO: 3:
AAGGGGCCAC CTGGCCATTC CTTCCTCTCC ACCAGCAACA ATGGGAGCAT GTGATTCACA 60
AGGGAATCAC ATTCAACTAA AAAGAGAAAC CGGGGTATGC TGTTTGCAAG GAACGGTTGA 120
AACTGGAACT CAATATGTCG TGTGGTGTGA AATAAACGTG TGTCTCACAT GTTTTCCCAT 180
GCTGGGGGCA GGGGTAAGAA AGTAAAAGGC AGACTGGTTA AAGACATGGG GTGGGGAGGG 240
CTGGAGGGAC GAGTGGTAAG AAATGGCGAC AGAGGAGATG AAGGTAATGT CATAATGAAA 300
CCCATCACTG CTGTGTGCAA CTAATAGATG CTAATAAAAT AGGAAGTTTT AATGATTTAG 360
GTAGCTTATT GCTTGCATTC ACCTCACTGT TAAACTATCA CTTCTGGGGG ATCCACACAA 420
CGAGCGAGCG AGTAAACCAG AAGATGGCGT TGGAAGATTA GTAATCATAT CTTTTAAACA 480
AGATAACCAT GTGAAGTCTC AAAAGGTTTC TTGTAATGAC TGTTGTTTAA ACTTCTGAAA \ 540
ACAGAGGATG TAGATTGGCT GAGGAAAATG TTGAAACCGC CTAAGTCAAG GTAGAAGACA 600
CGTGTGTCTA AGTGAAAAAA AGAAAAAAGA AAAAAAAAAA AACCAAAAAC CTCGGGTTGG 660
CTGCTTCTGT CCTTAGTCTG TGCACGCTTT GAAGAAATGT AATTCCTCAG CAGCAAGGCT 720
GTGCTATCTG AAGCTACAAT CTCTGCTTTG CTCCGAGGTG TGTCTCTGGT GACCGGGATA 780
GTTCCCGACA GACAGAAGGT GTTCAAAGAA TATTTTTGAA TGAATGAAAC CCCAAAGGAA 840
GAAGAGGGGA AAATGGGTGT GACCAAAATT TTCTTTGAAC GAAACTCTGT TGTTTACTAC 900
CAGGGCTCTG ACAATGGAAA ACTAATTGGG GTGAAAGÁÁČ GAČATGGCÁT CCTGTTAATT 960
TCTGAGAAAG CCTGTTGATG TTAGGAAAAA AAAACATGCC GGTGGGCATC TCTGCACCAG 1020
TTTTCCTGTG GCCAAAATCA GATGTTTCTC CTAAAGTCCA GAACCCAGGA TGGAAGATTA 1030
AAAGAAAAAC TGAGAAACAT GTGAAATGAA AAAGTTGTCA AAAGCTTTAC AAACGCTCCA 1140
AGTTGACCTG TGGTGGTGGT AATCTAAAAT GATACAGAAA CTGGTAGTCT GCTTGCTTAC 1200
CTGAAAACAC CAAGATAACA TATAAGCTCC AGGCATCCAA GCTGAGCTGG AGAAAGTCAG 1260
CGGCAAAAGC TCATGGAGTT TACATATGAA GGTCAAAGAA AACACGAAAA TAAAGTAAAA 1320
CCTTCAGTCA GCCTAGCTGT TCTATTTGGG GCATTGGTAC CTCACCGCCA ACTGCCTCCC 1380
ACGAGGCTGA GGTTAAAATT ATCATTTTAA GGTGAATTGA CATCCGGAAG CGCGCTAACT 1440
·· ·· * · · · • · ·· ··· · · • · · • · · ····
CTTTGGGGAC ···· ··
ACCTGAGTAC
TCAGGGATCC
CCCATCTCTT
TTATGTTGCC • · · ·
ATGATTGAAA
TGTGCTTGTC
TGAGTCATCT
CAATTCGTCG
GTTTCATTCA
CCCAACATGT
CAAACACAGT
ATTTGGGCCA
CGGCTTATAA
ACTTGCCTTT
CTATTTTTCT
CGTGATATTC
TCTAAACGCT
CAGAGAGACA
AGACTCCGCT
TTGTTCAGGA
CTCTCTCAGT
CTATCTCTTC
TGTTACATCT
GTGAGAACAA
GTTCCCTGTG
ATAAGCGTTT
TTTTAGTGAG
TGCTCCCGAC
CTCCAGACTC
1500
1560
1620
1680
1740
TCCATCACTT
CCCACCTGTC
GATGAGCAGT
TAGTAGTTAT
CAGCTATGCT
CAGTGCAGAT
1800
TCCAGTATCC
CCTTTGTATG
CCTCCACCTT
CCACAGGAGG
GGGGCCATAC
CGACTTGTCC
1860
CATCCGGTTG
AGGATTTCTG
AGTACATCAG
AGTCCCCAGC
CCCCTCCACA
GGAGGAGCTG
1920
AAGAAAGCCA
GGGTTTGTCT
GAAGTGGGAC
AGCCCTTGAC
CCGGTGGGCT
CTAGTCCGAA
1980
GCTCCTGTTC
CTGCGGGACA
CCCAGGCACA
AGGCAGAGGT
GGGGGGCGGT
CCTGGGTATG
2040
GCCAACCCAC
GCCCTCTCAA
GGCGGGGCCG
AAGCGCCCGC
CCTGCACTCC
GCCTCCGGCT
2100
CTATAAAGTT
CCTCTTTCTC
ACCTCACTTT
CCTAGTTTC
2139
2) Informace pro SEQ ID NO:4:
i) Charakteristiky sekvence:
A) Délka: 12537 párů baží
B) Typ: nukleová kyselina
C) Vlákno: jednoduché
D) Topologie: lineární ii) Typ molekuly: DNA (genomová) xi) Popis sekvence: SEQ ID NO: 4:
ACCACTTGAA CTTGGGACCC TTTGCTGCCC TCAGCTAAGA GTGCGGGTGA GGTAAGGCCT 60 :
GTAGTCGGGC AGAAGGAGGA GTGTGAGGCT GGTGGCAGAG GAAGCCTGGC TTCCATCTCT 120
GAGCCTGAGG GAGAATGCTG agatagcgga CCCAGGCTCC GCTCATCTAC GCTGCCCTAG 180
GACCTGTGCA CTTCGGGTTT TGTATGAAGC TGTTTGGGTG GGAGTTCCAG AACATCCCCC 240
ACGGGCTGGG CGGGACGAGC TAATGGGACT GTGGTGTCAT CAAAGGATCG CACTGGCCAC 300
AGCTTGTCCT CAGAGGGACA GCCTCTGACT CTCTCTGCTC CAGTGGAAAG CTCCTTTCCA 360
GCCCTGGTTC CTAAAGGACC CAAACTCATC TAGGGCTCCA GAGCGTGATT CCTAGGCCGG 420
GCAGCCAAGA AGAGCTGAGA GCTCCAAACT TAGGGTGCTC AGAGCCCCTT TCCCCGCATG 480
CCCCTTCTTC ACTTCTCTGG CAAGAGTGCT AGTGTTGCTG TCCGCAGCAC CCCTTATTCC 540
CAGCCTCGGC TTCATTCCTG CCAGGGTTCG CGCTGACATT CTGCAGGTTG GAATCTCCTG 600
TTTCTTGGCT GCGCTGCTTG CCCCATAACC 40 AGACTTCCAC • · 1 • · 4 • < • • TTGTTGdŤŤt » 44 ·· » · · · ♦ » · · · · »444·· · 4 • 4 · · CXGGACfdcÁČ“ • 4 • 4 4 • 4 4 4 4 4 4
GTGATGGTCT CTGGTTGGGT AGGCCTGGGG TTATTCCGAG GACAAAGTAA GGGTGTCATA 720
GAAGAAAGTC AAGAGAGTAA GCTAGGTMCC CCAAACCTGC ATGGCAGGGA CACAGGACCT 780
GGACAAGGGC TAGTCCATGT GCCAGGTCCT TTTCGCCTGG GGCAGCCAGG GCAACCTAAA 840
CCCAGGAAGG GGCAAGTGTA GAAACAGTGA GGGAAAAGTG GGATGAAAGC TACTTGGATC 900
CAGCACAGAG GGACGAGTGA CCAAAGTGAG CGCCCCAGCG TGGCGCAAGA CTTGGGATCT 960
GCAGAGAAGC TGTGTAGCTA GGAGCTTTCA ACGGAGCGTG TTAATGTAAA TGTAAATGAA 1020
GAAATTACCT aattttttta ATAAAAGAAA GAACAGACAG GCAAAAAAAA AAAAAGGAGG 1080
AGGAGGAGGA GGAGGATGGT GCGCGCCAAG GGATGCTCTC TATACCTTCG TCAAAGTACC 1140
TTCTCTTGGG GGACTTCGGA GACTCTGTCA CTGCACCCGA GCACCTTGTC AGCCTCAGAG 1200
ACTCGGGGCC TCGTGGGCAC TCCAAGAGTT TGGGACGGGG CTTCCTCCCG CCTCCAAAGT 1260
GATACGAAGG TAGTTGCAGG GAATGTGTGT CTCTCCTCAG CGCACAAGCC CAGGAGGAGG 1320
TCCCCACGCG TCATGAACTT GGAGACGGGC AGCCGGGGCT CAGAGTTCGG CATGAGCGCA 1380
GTGAGCTGCG GCAATGGGAA ACTCCGACAG TGGTTGATCG ACCAGATCGA CAGCGGCAAG 1440
TACCCCGGGC TGGTGTGGGA GAACGAGGAG AAGAGCGTCT TCCGCAŤCCC GTGGAAACAC 1500
GCGGGCAAGC AGGACTACAA TCGTGAGGAG GACGCTGCCC TCTTCAAGGT TAGCAGCATT 1560
CAGGGATCCC TGGGCAGGGG TGGGGGTGGG GATGGGGAAT CTGAAAGCTC TGAATGTCTG 1620
TGGCTCCCGG GCAAGGGACT AAGAGGTGGG CTCCTGCAAG GAGGAGGCCA GAGCATCAAG 1680
CATTGGACCC TGCTTAGGCA AAGTCCCCAG GAGAAGGGAA AGAGGTTGCA AACTCTCCGG 1740
GGATTGCATA CACAAGAAAC CAGGTCCCAA TACTGTTTGT GTGGAGGAAA GAACTTCCAG 1800
CTTCAGGGGC ATCTCTGGGG GACCGAGGTT CCGTTTGCAT AGCCCATTCG CTGTTTCCTG 1860
CCACCACCAC CGACTGCTAG GGCCACTCTC TGCTTCCCTG TCTCTCTGTG TTTTGTTATT 1920
TTTCTGAGTT TCTCTCTCTG ggttttgttt CTTTGATTGG GCACCTCTAC TGTCTGGTTC 1980
TAGTTCTAGA AGCTGCGATC TCTGATTTTC TTTCTTTGAG TAGCTTTGAC TATTCCGAGT 2040
CTTTCTCTGG TATCCCCCTC CGACCCCGTG TGAGTCCCTT AGGACTGATG TCCCCAGAGA 2100
ACTGGCTCAC TGAACTGTGA AGCCCCCAGC CTCCACCTGC CAGCAGGCCG AGGAAGGGGA 2160
CTTCCTGCGG GAATTTGTTC AAAGTACCTC TGTGATTTTG TAGATGTCCT CTCTGGGGCC 2220
TGCCCCCTCC ACAGCTCTGT CCCCAGTCTT GCCCACACTT GATTCAGGCG CTGGGCGTGT 2280
ACAGCCCÁTA CTAGGGGTCT CAGGACCCCA CTAACATCAT GTTCCACATT TCAGGCAACA 2340
GCAAATTTGA AACAGTAACC TTCCTTGCTG AAATGCAATC CATAGAATTC TTTTGACGCT 2400
CTGGGCTTGA CTTTTCTTAT CATCGTTCTT AGGCTTGGGC ATTGTTTAAA GGCAAGTTCC 2460 i
I <*
·· · • · · · « · · · • · · · · · · · ·· • ···· · · ♦ · · «··· ·
• ···· • · · · • ·· ···· • · • 9
GAGAAGGGAT ' CGACAAGCCA GATCCTCCTA CTTGGAAGAC AAGATTACGA TGTGCTCTGA 2520
ACAAGAGCAA . TGACTTTGAG GAATTGGTCG AGAGGAGCCA GCTGGATATC TCTGACCCAT 2580
ACAAGGTGTA CAGGATTGTT CCAGAGGGAG CCAAAAAAGG TAAGGGGTTT TCCCAGCCCA 2640
GGTGGCAGGA TAAAGGCATT ATGGCACTCA GAGAGCCCTT CTTCCTAGAG ACAGTCACGT 2700
CCTACCTCTG CTGTAGGTTA AGCCCAGATG TCCTTTTGCC CATGTCCTCT CTGTTATAAG 2760
TGACAACCCT GTGGTGTTAG TATAGGATGA CCTGGCAGAC TTTAAGCCCC ATGGGTGTGT 2820
GGGTTATGCA CTTGAAGGCA TTATTTTCAG TTACTCCATT CAGTTAGGAT CTGGATCAAA 2880
TTTCCAAACA AAATCTGGAA AATCCATTAA ATGTTTACTT ACCTAATATC CTCTAGTAAG 2940
CATTTTCAAG AGGAGAAAGC ACATCCCACA CCCCATACAT ATTCACACTT CTTGTAATAA 3000
AACTGCTAGA GTTTCTGGTT TAACATGGCC TGCTAGGGTG GTTATGAATA TTCAGATCTT 3060
GAGTTCCCTC TCTTCCAACT AGTCTACCTC AAGCAGTGCT CAGGAATCTG CATTTGGTTC 3120
CAACCATACA GGATGCCTTA ACTAGGTACC ATCTCACAAC CAGAAACCAC TTGGTGGATC 3180
ACAGGGATCC TGGGTGGTGT TTCCTTCCCT GGCTGTCACT CACAAGTCAG CAAATGTTTA 3240
ATCAGTTTAA TGGCAAAGAC AAATATCTCT CTAAGAAATT GCTTGAAAAA CAAACAAACA 3300
AACAAAACAA AACAAACCTA AAATACCCGA TTGGTTAATA GGGCTATGCA TTCTAAGAAT 3360
TAAGTGCATA GGTACTTTTA TAAGATTTAA GTCAGTTCCT TGTCTTACTC TGTGTTCTCT 3420
CTTCCTTTTC CCCAAACACA CAGGAGCAAA GCAGCTCACT TTGGATGACA CACAGATGGC 3480
CATGGGCCAC CCCTACCCCA TGACAGCACC TTATGGCTCT CTGCCAGCCC AGGTATGTGG 3540
TAGACTCTTG GTCTTGTGGA AGGCTGGCCC ATGCCCTTTT GACTGGCTCC ACACAGAGAG 3600
GCAAACACAA ATGAAAAGTG TAGGGCTGAC TTCTTATTTG CTATGGCTAG TACACACGCT 3660
GAACAAAAAC TTGGTCAGAG AAGGATGTTT CAGTTCCAGT GTGGTGTCAC TGTCCCTGAC 3720
GCCACAGTTT TGTTGGGGAG TTTGATGTGT CCCACCTGTG GAGAGAGGCT TCCACTGATG 3780
GTCAGATCTT CTGGGAATCA GACCTTTTGT GGAAGTCAAA ggttttggaa GTAGTACTTT 3840
ATCATGTGAA ACCGCAGAGC AGCTGACTTC TCTAGGCGTC CCTGATGTGA ATTACAGTAC 3900
TGTTTTATTC ACTTTGGTGG CTTAAAAAGG GCAGATTTCA CTGCGGTATT CTTGGTGCCG 3960
TGTTCAGCCA TATGATGAAG CCTTACAAAA ATCACAGCTT TATACAATGT CCTCATTGTG 4020
CTTTCAGACC CTCTATGGCT gttttttacc TAGTGTGATA GACAGTCCAT GTCACTTTTT 4080
GGGCAAAATG acttggctgc TGGACAAAAA AAGGGGTTCC CTGAGGAGTT TGGGTGATAT 4140
GAAAGGACTC CGACACCCMC TGATGTCTTC CTCTTAGCAA TCCCTGTTCT CTGTCAGCAG 4200
GTTCATAACT ACATGATGCC ACCCCATGAC AGGAGCTGGA GGGATTATGC CCCTGACCAG 4260
TCACACCCAG AAATCCCATA TCAATGTCCT 42 GTGACGTTTG TGTGCCAGGG ·· • · • • • ···« GCCCACGAGG CAGCAGACAG • · · · ; • · · í · ···» · · · · • · · · • ·· ···· CCACCACTGG AAGAACAACC ·· < >4 · · • · • ··· · • · 4320 : 4380
CAAGGCCCAT CTTGTGAAAA TGGTAAGGAT
TGAGCTCGGG GTGTGGACAG CACCACAGGG CTTTTCCCTA CCATTGAGAT ACCAGAGACA 4440
CATCATATGA AGCTGCTACT GTTGTTGTTG TTGTTGTTGC TGCTGCTGCT GCTGGGGTGG 4500
TGGGGTGGTG GGKTGGTGGG GTGGTGGAGT GGTGGTGGTG GTGGTGGTTG TGGGGTGTTG 4560 \ t
GGGTATGTTG CCTTGTCCTG TGAAATGTTG AAGTCCTTAG ATCCATGATA GGCCTCAGTC 4620 1
TGTGTGGGGA CTTAACTAGA AGACCCCAGA GATCATTCCA AGTAGCTGAA AAGTGCCCCA 4680
TTTTTAATAC ATAGAGAAAA ACATGGATGA CAACAAATTC TCAATGACAA GTAATGTCAA 4740
TTATAAAACT CGTCTATATT TTGTTTTAAC TTGAGTTATC CCTTATTTCC GATGGTGATT 4800
AAGTTGGGGG gtttgttgta TCCCACCTAT CTCCCTAGTC TGTATCTTTC TACTCTCCTG 4860
TAAAGTAGAG AGTTGTACCC AGTCCACCTC AGCAGGAAAT CATTGCTAGT TCATGTCTCT 4920
TGAATAATAA TGAGTCATCT ATAGCTGTTC TTGGTACTAA GGAAGGAAGG ATCAGAGCGA 4980
AAGTAATCCA CAAAGTGTCT CTACAAATGA GTGCCCTGCC CGAAAAGACC CACAGGGGTC 5040
CCCCCATGCT AGCTGGGCTC TCACAGAAGA AACGCCCACT AACCAGACAC AAAAAAATTT 5100 .
CACAAACTAT GTTCAGTGAG ACTTGGGTCC TTTAGTGTTT ATTTAGGTGA GTGCACCAAG 5160
CTCCACCTCG GGTCCTTTTT TGGCTGTGTA TTTTAAGGTA GAGTCTTGCT AAATTACCAA 5220
GGCTAGGATC TTCCTGCCTT CAACTCTTGA GTAGCTGGGA CTACAATCTT GTTCTARCGG 5280 j
GCTGAACATA AAACAAGTTT TTAGGACTTR CAAGTTCACT GTTTAAATAT AAGTCTTGAC 5340
ATGGGTCGCC GTGCGAGTAG TTCTTTTATA TTGTTCTGGC AATACTTTAC CTTGTGACAA 5400
TTTCATCAAC ACCCTCACTC AGTCTGTGCA TGCTTACACT AATCTTGCTT TAGTGTGACA 5460
TAACTTCTCT GCTGCCAGAG AACACGGTTC AGCCCCTCCC CCTAGCTAAC AAACAGTGAG 5520
CAGAATAAAT GAGGGTTGAA TAATTAATTC ATCTTTGAAC TAGTCTTATA GAAGTTTGAA 5580
CTCTGACCCT GCTGGTAACT TGCTATGTGG GCTGGTGCAA GTCCCTCTCC TTCTGGGCCT 5640
CAGTTTCCCT ATAGATTTGG AGTGAGCCCC AGGTTTCCAT CCAGAGCTGT ACTGTGGCTC 5700
CTTCCTTCAT CACCCTAATT TTTATCACTG GATGTGGACT TTGGACTTTG ŤCCCAŤAATC 5760
ACACGTTATT CTGCTAGCAG GTGCTTAGAG GCTGTCAGGC TTGGGTTGGA GGCCATGGCC 5820
TCTCCCAACT CAAGAGCCTC CCCGCACTCA GACTCGATAC TTAGACATCA TCTGATTTTT 5880
ATTTKCAAAT GCAGGTTGCC AGGTGACAGG AACCTTTTAT GCTTGTGCCC CACCTGAGTC 5940 ’ (
CCAGGCTCCT GGAATCCCCA TTGAGCCAAG CATAAGGTCT GCTGAAGCCT TAGCGCTCTC 1 6000 '
AGGTGAGTGT GGCGCTTCCT GTAAAGCTCC GAGGGAGGGG GCATCTCTCC TCTACTGAGG 6060
TTGGGTGAGG ATTTAGACTC TCGCCTTGCA GGCCCCGGGG TCTGGAGTAG GCATGGTCCA 6120
• ·
GGCTATGTGG ACATCACGCT GAGTCAAATA CACTATTAGA AATCTCCACA GCAGTACCAG 6180
CTAGCCAAAT ACTATTTGGA CGATGTCTTT AACCTTCTAC ATCATTACCT GCCCAGTTTT 6240
CCAGGAATGT GTAACCAGGC TCCTCCTCCA GCCGACATTC TCCATTCTCG CAGTGTGGAA 6300
AGGCTTTATA GGCACAAAAG AATGCTGTTT GTCCTTTTAG GGTGTAGGGT TGGCCACAAA 6360
CAGGTGGTCT GAGTTGCTTC CAAGGAACAC TGGTTCTGAA CCCTGGTCTC TGAGAAGTTC 6420
TTATSCCCCC TAAAGGATCA TATAGGTCTG ACTCCCTCAC AACTTTGACA GAATTGCTGA 6480
GCATGTGTGG ATGTGATCTG ATTTTAAAGT TCTGTTACTA AGGAAGCCTG CACTTGGAGA 6540
TACTGACCAG CATTTTAAAA GCCCACACTC CGTGGAAGCA GACATCTTAT GTCCATTTAG 6600
TCTTTAGATG ATTTTTTTGG ATGTTTTCAA ATGGAATTAT TAGAATTCTC ATCATGCCCT 6660
CGGCTACCTT AAAAGCCTČT GACTGAAAAC ATCAACTGCA TTTTGACAAT TTTAGACACT 6720
TCCCTTGTTC TCGAGGGAGG AAGAAGTTTT AAAATCTAGT TCCTTCCAGC TCTGATGCTC 6780
AGGGAGACTT TGTGAGCCAC TCAAGAACAG CCGAGGAGCA CATCTGGGCA TCAGGGGTTG 6840
TCACAGACAC TAGAATGCTC TAGATCCTCT TCTGGAGCGC CAAAGACTTG TGTGGGTGCC 6900
CCAAGAGTAG GAAATAAACA GCTATTTATA TCTCTGCAAT CTTGTGATTT TGGTGACATT 6960
AAATGAAATG AAACCTGCCC TACCACTCAC CTCAGATGGC CAACGCCCCC TCTCTTTGGG 7020
TGCACCACTT GTGCTGTTCA TAGCTGCAGC TATCGAAGAC ACCATGATGT GGGCTGTCAG 7080
AACTTGCCAT TGAAGAATAC GAGGCTTTTG TGGGTTTCTT CTTCTAGTTT GCATAATTAA 7140
TTATCAACCC TGAGTGCACT TTTCAGAAAG CTATTCTTTC CAGGCATTGT TGGGGCTCCA 7200
ACCACCAGCA CGGGTATCTA TCTCTGCCTG GGGAGCCCTT TGCACACCCA GCTTGCCCTT 7260
TCGGCCCGTG GGTGGTATTT TAAAGTGGCT TCTGAAATCA ACAAAATCAT GTGTCAATAA 7320
ATTCCTGTCT TAAAGCTGTA GAAAACCTAG TTGTTGGGTT CTTTTCAGAG TTGAACACGA 7380
AGCTTAGAGG GATTTCAGGG GGTTTTACAT TAMCCACTGG CTTTTAGAGC AGCTCTCATC 7440
AATTTCTTCC CCTACTCCAA GAGAGCTGAC TTAAAAATAA GAAAATAAAG GTATCATTTT 7500
CCAGAGCCCA GAAATTGTTA TTTTAGTGCC TGTCTCTAAC ATATCTATGT GGGTTTTGTT 7560
GTTGTGTGGT TTTACTTAAT GACATCATGG TAACACCTTA GGGAAGTTCC AGAGCTGAGG 7620
ACACTATTTG CTTTTCTTCT AAGATGTTTC TGTATTTCTT TTACTAATAG AAATCTGTCC 7680
CAGAGGTCAA CTCCAAAATC AAAATTGAGT TGCTGGAAAA CGAATTCCAA TTCGGTAGTA 7740
TTATTTCATA TTGTAGACAA AATGCCACCA CTGTTAACAC CATCATCCGA AAAGCCCTCA 7800
TAACAGGGGT GTGCTTTCTA ATAAAATTTG GCTGAAAATT CAAGAAATAT ATACCTCTCC 7860
CCAAGAGAAG TAAATGGCCA CAACAACATT TGAAAATGAT CGTGTTAGAG AGATCAGTTT 7920
• • · · · • · · · • · · · · · · • · • a ·
CTTTCCACAA GCTTCTCTTA GTATTCTGTG CTTGAGGTCT AAGAATCTAC AGGGAATAAG 7980
AGCAGCTAAC ATCTCCAAGA CTTCCTTGGT CCTAGGATCT TTCACTTGTT CGTGGAGCAT 8040
CTTGACACTC AAGTGTTCCA CCTGCTGTCC TTCGTATCAG TCTAGTCACC GAGTTTTTGG 8100
GGCTCTGAGC AAGGTGGCAC CTTTTTCAAA TCCATCAGCA CTGACTCCAG AGTTTTGTTC 8160
ACAGACTGCC GGCTGCATAT CTGCCTGTAT TACCGGGACA TCCTCGTGAA AGAGCTGACC 8220
ACGACGAGCC CTGAAGGCTG CCGGATCTCC CACGGACACA CCTATGATGT TAGCAACCTG 8280
GACCAGGTCC TGTTTCCCTA CCCGGACGAC AATGGACAGA GGAAGAACAT TGAGAAGTTG 8340 |
CTGAGCCACC TGGAGAGGGG ACTGGTCCTC TGGATGGCTC CAGATGGGCT TTATGCCAAA 8400
AGACTCTGCC AGAGTAGGAT CTACTGGGAT GGGCCCCTGG CACTGTGCAG CGATCGGCCC 8460 i
AACAAGCTAG AAAGAGACCA GACTTGCAAG CTCTTTGACA CACAGCAGTT TCTATCAGGT 8520 t
AACACACCTC ACAGTCTGTT AGAATGGAGG TGGTGGTGGG TGCTGGCTAT AAAGGTCTCA 8580
AATGGCAGTG TCTGCCTACC CCAGACAGAG GTCTTCCTCC TGAGATCTGT GAGCTCATGC 8640
AGAAATAGAA TTCCTGCCTG ATTCATGCCT AGCCTTTGTC TGTTGTGTAC TCCCCTGATT 8700
AGCAGAGGGC CAGAAAGAGG ATCCATATTT GCTGCCCAGG ATAGACACTG GTGTGGGTTG 8760
ATCTCTTAAT TTATCATCAT ŤCTTTTCACT CTAGGCTTTT GTTTTGTTTG TTTTGTCAGA 8820 '
ATATATGTAG CTCAGGCTGG CCTAGAACTC CTGCCTCGGG ATTTTATCTG TACACCAGCA 8880
CATCTGGCCA ATGAATTAAA ATGTGGGCTT TCAGCGGCAT GTGCCCCACC CCCAGAGAGG 8940 ;
TTTCACTGTG TTGGCTCTCT GCTCTCAGCA AGTTTATCTG CTGACACCTC AGCTCTTTAG 9000 ί
GGGTTTCTAG AAGCAGTTCG GTTGCAGAGA GCAGTGGAAA TCTTTGATGT CTACCCATTC 9060
TGGATTTGCA CCCCACTAGG GACAGTCCCC ATAGGCACAG TTGAGAATTC ATATCTGATC 9120
AGGGCAGAGT CTTCATGCCT GCTCTGTGGA GGCAGCTTTT TAATGTCAGT TCTTTGATGC 9180
AGACAAGACC TGGGAACCTA GCTCTGGGAG GAGGAATAAA GGTTAATGCC AGTGAGTGGA 9240
TGTGGCTTTC TGCTTGTGCT GGGGGAGGAA GCCAAGGCCT TGCACATACA AGGCAAGTGC 9300
TCTGCTCCAA GTGGCGATGC CCCCAGCCAT GGGCAGGTTT CTTTTCAGCA ATCTTGTCTG 9360
TTTCATGTCT CTCAGGCAGG ACTAGCCTCA GCATGACATC CTTGTCAGAG GGGCTTCATT 9420
GGTCCCCTTC TCCCTGTATC ATCCTGTCCC CAAAGTGAGA TTGAAGCCTA CTCTGGTTCT 9480
CCAGTTATGG AGTTTTAGAC CTAGTGCCAA GTAGGACACA GCTGCCAACA GCTGGTGAGA 9540 i
GAAACAGATG CTCTTGGTGC CCAGACACCA CGTGGCCTCC ATGGTTAGCT AGTGAGGTTA 9600
AAAAAATAAC CCTGGGCCAT CAGAACATTG TGACTCTTTA CATTAAAATG TCTCCTTGGC 9660
CTGTGCTGAT TGCTTGACTC AGCATGGCTA CTTTTCTTTT TCTTCTTTGT CTTCTTCTCT 9720
·.· · tt
TTGACCTTGT GCATTTCTGT GAGTGTAGTG CTGCAGACCC AAGTTCTTAA GGTTGGGTCA 9780
TGTTCCTTAA GAGTAATGAA GTAAAACCAG TKCCAAGTCA GGAGATCATA TGTGAACTTG 9840
ACCATGTGAT TTTGTGTCTA GGGTCTGCTC TAAGGGCTGG ACTTAGGGGA ACAGAGCCCG 9900
GGCTCTCCCA AAGCAGACTT CCACGTGACT CTGGCTTTCC GTTCACCCGC TTTACCAGGT 9960
GTCTGAACAG TTTGGTTTTT TTTTTTCTTT CTTTCTTGTG ggttttcaga GCTGCAAGTG 10020
TTTGCTCACC ATGGCCGGCC AGCACCGAGA TTCCAGGTGA CTCTGTGCTT TGGTGAGGAG 10080
TTTCCAGACC CTCAGAGACA GAGGAAGCTC ATCACAGCTC ATGTGAGTAC CTGGTTACAT 10140
CACCCGTAAA TCACACACTG TGGAGCTGTC CCTTTTAGAG AAGTGGCAAG TGACGAGTAA 10200
ATGTCAGCTC ACCTGGGAAA ATAGATGTAG ACCTTAAAAT AGTGCAGGAG GAAGCAGGCT 10260
CCAGTGAACA CCACAGCTCA GGGAGGCACC CGCAACCTAC TTCCAGACAA ATTCTGTCAC 10320
CACCGAATCA GCAGGGCAGA TGACTTGGAC CCAAGGMTCT gtttgttctg TATTCTTTAT 10380
TGTTTCATAC AGACAGTTAC CTGCCCTTTT ATAGGAATTT TCAATAGTTG GGACCAAGTA 10440
CTGCCCTTCG ACATCTCTGT ŤTCTTGTGTG GTTTTAAAGA TGCTGTCCTT TCGAGTAGAG 10500
TAGCACTTTC TCCCTGGGAG GCTGCCTGTT ATGTATTATG CTTCATCGGG CCTCCTAACT 10560
TCARATAGTT CCCAGACCCT CGCTTTGTTG CTGGACTTTA GGGAGTTATT TAACAGTTGG 10620
ACAAGGGAGG TGGAGGAGGC TGAGTCTTCC CAGGAATCAG GTAGGTCGGT CTATCCTCAC 10680
AGCTAGGGTT TATTCGGATA ATGTTCATCA CTCACTTAAT AATTAAAAGG TAATTCTGAA 10740
TACATGATGT TTTTTAATTA GAAAATTTTA CTTAATTACA TATCTTGAAA AGTATGCAGT 10800
GTGGAGTAAA GGTTGTGTCC CAGATAGCCA CAATATCTCA GTGCAAATGG GATATTAGCT 10860
CTGATGATAT CTCTTAGTGG AGACTGAAGA CTAGGCATAC AGCGCAATGG AAGGCATTTG 10920
CTAGGCAGTG GTAAAGCCCT GGGTTCTAAA CCCCGCCTAG GATGGGGGTT GGGCACTGAT 10980
GTTGAACATC CAGCCTCCCT TCTCGGTTGG AAAAAGTAAA ATCTAAGAAG CAACAAACGG 11040
GCTGGAGAGA TGGCTCAGTT GTTAAGAGCA CAGGCTGTTC TTCCAGAGGT CCTGAGTTTA 11100
ATTCCTAGAA ACCACATGTG CCTTACAACC ATCTGCAGTG AGCTCTAATG CCATCTTCTG 11160
GTGTGTTTGA AGACTGCTAC AGTGAACTCA CATACATATA AATCTTAAAA AAATAAAAGG 11220
CAATGAAACT ATGATCCTGG CCTTGAGCCT TTTCTCAGTT CTAACTGGTG GTTGATATCA 11280
AATGAGACTG CAGATGTGTG GATGAATCTA GCATAGATAA GCAGTATTTT TTTTTTAAGG 11340
• ·
• · • · • · ♦ · · • * * · · • · * · ·
-rv ······ « · • · · · · • ·
• ·*· · • ·· ···· • 9
TAGTGAGTAA ATTCTAGCAT AGATCTCATT TTAAGGACTT TGGGTGCAGT GGGGCTCCGC 11400
AAAAAGGGAG CAACAATAGT CATATAGGCA AAGGGCCTCA AAATGCTGCC CCGTGGTCCA 11460
CAGATGGAAA ACATACATGG TCACCCATGA ACTCTGCTGG TCTCCTTATT ACAGACTTAA 11520
TTCATATGGG TGCTTACAGA GGAATCCTAC CAGACATCAC ATATCAAATA ACAAAGAGGC 11580
TTGATTTATT GATGATTGGT TGTTACAGAG CACACAGCCT GACTTGGTGA GGCTGGCTTT 11640
GACTGGGGAT GCAATCGATG CTTATAAACA AACTAGGTCC ATCAGAGCCA GCGAGCTGCT 11700
GTCTTGTGGC TGRCCAGCTC TGTCTTCTAC TTGTGGTTCA GAGTTCTGTC TATTTCACAG 11760
TCATCTGGTT CTTCAGGATG AGCCCTTCTG TCAGACTCAT GAGCCTCACT TACCCAGCAT 11820
GTTACTTAGC CTTTTAATTT GGTCATCTCA TTCAATAATG TCCAGTTAAC TCATTCGCTA 11880
AATATCAAAT CCAAGAGGCG ATTGGTTTCA AAATGCCATA TTTATCTTCT ATTATAGAAT 11940
CAAGAGTTCT TTTTCCAGGG TTTTTAATTC CAGGTATTGT AAGAGCAAAT 'GAAACTGGTT 12000
TTTCAAATGG CTCTGAATGT GAACTGCTTC ACTGTGTTAT GTTATCCTGT GCAGCTTGTA 12060
GGTTTTTACT TAGAGTCCTA GGGTCATTTC ATGATGTCCC AATTGTATGG TGTTGAGAAG 12120
AATATTCTAG TGATGTCTTT TTTTCTTAAA TGTCTTATTA AAGGTGGAAC CTCTGCTAGC 12180
CAGACAACTG TATTACTTTG CTCAACAAAA CACTGGACAT TTCCTGAGGG GCTACGAGTT 12240
ACCTGAACAC GTTACCACTC CAGATTACCA CCGCTCCCTC CGTCATTCTT CCATCCAAGA 12300
GTGAGAAGAA ATACTCTGAC AGGGCAGCCG GTTGCTGCCC TTTCTCTTTG GAAGAGCTAA 12360
GAAGTGAGTG GGTTTCCACT TGAAGACAAC AACAGGGCTT TGTGAGGAAA ACAGCTGTAT 12420
CTGCTCAACA GAGGAGCTTC CCCCAGAAGA GTGCCTGTCA GTCATCCAGG TCTTGACAAG 12480
TGCCAGGACT TGGGTGACTG TGCCCTGGCT TATAACTGTG AAACTTGATC CGAATTC 12537
2) Informace pro SEQ ID NO:7:
i) Charakteristiky sekvence:
A) Délka: 24 párů baží
B) Typ: nukleová kyselina
C) Vlákno: jednoduché
D) Topologie: lineární ii) Typ molekuly: cDNA xi) Popis sekvence: SEQ ID NO: 7:
CAGCCCGGGG TACTTGCCGC TGTC
2) Informace pro SEQ ID NO:8:
i) Charakteristiky sekvence:
A) Délka: 24 párů baží
B) Typ: nukleová kyselina
C) Vlákno: jednoduché
D) Topologie: lineární ii) Typ molekuly: cDNA
AGACCTTATG CTTGGCTCAA TGGG
2) Informace pro SEQ ID NO:9:
i) Charakteristiky sekvence:
A) Délka: 15 aminokyselin
B) Typ: aminokyselina
C) Vlákno: jednoduché
D) Topologie: lineární ii) Typ molekuly: protein
Gly Tyr Glu Leu Pro His Glu Val Thr Thr Pro Asp Tyr His Arg
10 15
2) Informace pro SEQ ID NO: 10:
i) Charakteristiky sekvence:
A) Délka: 19 párů baží
B) Typ: nukleová kyselina
C) Vlákno: jednoduché
D) Topologie: lineární ii) Typ molekuly: cDNA xi) Popis sekvence: SEQ ID NO: 10:
TGCAGAAGTG AAACTGAGG
2) Informace pro SEQ ID NO:11:
i) Charakteristiky sekvence:
A) Délka; 18 párů baží
B) Typ: nukleová kyselina
C) Vlákno: jednoduché
D) Topologie: lineární ii) Typ molekuly: cDNA xi) Popis sekvence: SEQ ID NO: 11:
TGCAGAAGTG AAACTGAG 18
2) Informace pro SEQ ID NO:12
i) Charakteristiky sekvence:
A) Délka: 18 párů baží
B) Typ: nukleová kyselina
C) Vlákno: jednoduché
D) Topologie: lineární ii) Typ molekuly: cDNA xi) Popis sekvence: SEQ ID NO: 12
TGCAGAAGTG AAACCTGG 18
2) Informace pro SEQ ID NO: 13
i) Charakteristiky sekvence:
A) Délka: 18 párů baží
B) Typ: nukleová kyselina
C) Vlákno: jednoduché
D) Topologie: lineární ii) Typ molekuly: cDNA xi) Popis sekvence: SEQ ID NO: 13
TGCAGAAGTG AACATGAG • ·
2) Informace pro SEQ ID NO:14
i) Charakteristiky sekvence:
A) Délka: 18 párů baží
B) Typ: nukleová kyselina
C) Vlákno: jednoduché
D) Topologie: lineární ii) Typ molekuly: cDNA xi) Popis sekvence: SEQ ID NO: 14 TGCAGAAGTG GTCCTGAG
2) Informace pro SEQ ID NO: 15
i) Charakteristiky sekvence:
A) Délka: 18 párů baží
B) Typ: nukleová kyselina
C) Vlákno: jednoduché
D) Topologie: lineární ii) Typ molekuly: cDNA xi) Popis sekvence: SEQ ID NO: 15 GCTAGAAGTG AAACTGAG
2) Informace pro SEQ ID NO: 16
i) Charakteristiky sekvence:
A) Délka: 18 párů baží
B) Typ: nukleová kyselina
C) Vlákno: jednoduché
D) Topologie: lineární i i) Typ molekuly: cDNA xi) Popis sekvence: SEQ ID NO: 16 AAAGGAAGTG AAACCAAG
2) Informace pro SEQ ID NO: 17
i) Charakteristiky sekvence:
A) Délka: 18 párů baží
B) Typ: nukleová kyselina
C) Vlákno: jednoduché
D) Topologie: lineární • 9 ii) Typ molekuly: cDNA xi) Popis sekvence: SEQ ID NO: 17 TGAGGAACTG AAAACAGA
2) Informace pro SEQ ID NO: 18
i) Charakteristiky sekvence:
A) Délka: 16 párů baží
B) Typ: nukíeová kyselina
C) Vlákno: jednoduché
D) Topologie: lineární ii) Typ molekuly: cDNA xi) Popis sekvence: SEQ ID NO: 18 GGGAAAGTGA AACTAG
2) Informace pro SEQ ID NO:19
i) Charakteristiky sekvence:
A) Délka: 27 párů baží
B) Typ: nukíeová kyselina
C) Vlákno: jednoduché
D) Topologie: lineární ii) Typ molekuly: cDNA xi) Popis sekvence: SEQ ID NO: 19 CTGGACATCT CAGACCCGTA CAAAGTG 27
2) Informace pro SEQ ID NO:20
i) Charakteristiky sekvence:
A) Délka: 27 párů baží
B) Typ: nukíeová kyselina
C) Vlákno: jednoduché
D) Topologie: lineární ii) Typ molekuly: cDNA xi) Popis sekvence: SEQ ID NO: 20 CTTGACATTT TTCATTCTTG AATAGAG 2) Informace pro SEQ ID NO:21
i) Charakteristiky sekvence:
ς i · ·· ♦ · * * · · · ··· · · ····· »···♦·· · · · ··· · * * · · · · · ···· · · · * · ·· ♦ · ··
A) Délka: 21 párů baží
Β) Typ: nukleové kyselina
C) Vlákno: jednoduché
D) Topologie: lineární ii) Typ molekuly: cDNA xi) Popis sekvence: SEQ ID NO: 21
TGCCCTCAGC TCCGAGTCCA G 21
2) Informace pro SEQ ID NO:22
i) Charakteristiky sekvence:
A) Délka: 18 párů baží
B) Typ: nukleové kyselina
C) Vlákno: jednoduché
D) Topologie: lineární ii) Typ molekuly: cDNA xi) Popis sekvence: SEQ ID NO: 22
AACCATTTTC ACAAGCTG 18
2) Informace pro SEQ ID NO:23
i) Charakteristiky sekvence:
A) Délka: 38 párů baží
B) Typ: nukleové kyselina
C) Vlákno: jednoduché
D) Topologie: lineární ii) Typ molekuly: cDNA xi) Popis sekvence: SEQ ID NO: 23
GGATCCGGAT CCATGAACTG GAGGGCGGCG GCCGAGGC 38
2) Informace pro SEQ ID NO:24
i) Charakteristiky sekvence:
A) Délka: 1353 párů baží
B) Typ: nukleová kyselina
C) Vlákno: jednoduché
D) Topologie: lineární ii) Typ molekuly: cDNA xi) Popis sekvence: SEQ ID NO: 24
ATGAACCTGG AGGGCGGCGG CCGAGGCGGA GAGTTCGGCA TGAGCGCGGT GAGCTGCGGC 6U
AACGGGAAGC TCCGCCAGTG GCTGATCGAC CAGATCGACA GCGGCAAGTA CCCCGGGCTG 120
GTGTGGGAGA ACGAGGAGAA GAGCATCTTC CGCATCCCCT GGAAGCACGC GGGCAAGCAG 180
GACTACAACC GCGAGGAGGA CGCCGCGCTC TTCAAGGCTT GGGCACTGTT TAAAGGAAAG 240
TTCCGAGAAG GCATCGACAA GCCGGACCCT CCCACCTGGA AGACGCGCCT GCGGTGCGCT 300
TTGAACAAGA GCAATGACTT TGAGGAACTG GTTGAGCGGA GCCAGCTGGA CATCTCAGAC 360
CCGTACAAAG TGTACAGGAT TGTTCCTGAG GGAGCCAAAA AAGGAGCCAA GCAGCTCACC 420
CTGGAGGACC CGCAGATGTC CATGAGCCAC CCCTACACCA TGACAACGCC TTACCCTTCG 480
CTCCCAGCCC AGGTTCACAA CTACATGATG CCACCCCTCG ACCGAAGCTG GAGGGACTAC 540
GTCCCGGATC AGCCACACCC GGAAATCCCG TACCAATGTC CCATGACGTT TGGACCCCGC 600
GGCCACCACT GGCAAGGCCC AGCTTGTGAA AATGGTTGCC AGGTGACAGG AACCTTTTAT 660
GCTTGTGCCC CACCTGAGTC CCAGGCTCCC GGAGTCCCCA CAGAGCCAAG CATAAGGTCT 720
GCCGAAGCCT TGGCGTTCTC AGACTGCCGG CTGCACATCT GCCTGTACTA CCGGGAAATC 780
CTCGTGAAGG AGCTGACCAC GTCCAGCCCC GAGGGCTGCC GGATCTCCCA TGGACATACG 840
TATGACGCCA GCAACCTGGA CCAGGTCCTG TTCCCCTACC CAGAGGACAA TGGCCAGAGG 900
AAAAACATTG AGAAGCTGCT GAGCCACCTG GAGAGGGGCG TGGTCCTCTG GATGGCCCCC 960
GACGGGCTCT ATGCGAAAAG ACTGTGCCAG AGCAGGATCT ACTGGGACGG GCCCCTGGCG 1020
CTGTGCAACG A.CCGGCCCAA CAAACTGGAG AGAGACCAGA CCTGCAAGCT CTTTGACACA 1080
CAGCAGTTCT TGTCAGAGCT GCAAGCGTTT GCTCACCACG GCCGCTCCCT GCCAAGATTC 1140
CAGGTGACTC TATGCTTTGG AGAGGAGTTT CCAGACCCTC AGAGGCAAAG AAAGCTCATC 1200
ACAGCTCACG TAGAACCTCT GCTAGCCAGA CAACTATATT ATTTTGCTCA ACAAAACAGT 1260
GGACATTTCC TGAGGGGCTA CGATTTACCA GAACACATCA GCAATCCAGA AGATTACCAC 1320
AGATCTATCC < GCCATTCCTC TATTCAAGAA TGA 1353
I
2) Informace pro SEQ ID NO:25
i) Charakteristiky sekvence:
A) Délka: 450 aminokyselin
B) Typ: aminokyselina
C) Vlákno: jednoduché
D) Topologie: lineární ii) Typ molekuly: protein xi) Popis sekvence: SEQ ID NO: 25
Met 1 Asn Leu Glu Gly 5 Gly Gly Arg Gly Gly Glu 10 Phe Gly Met Ser 15 Ala
Val Ser Cys Gly Asn Gly Lys Leu Arg Gin Trp Leu Ile Asp Gin Ile
20 25 30
Asp Ser Gly Lys Tyr Pro Gly Leu Val Trp Glu Asn Glu Glu Lys Ser
35 40 45
Ile Phe Arg Ile Pro Trp Lys His Ala Gly Lys Gin Asp Tyr Asn Arg
50 55 60
Glu Glu Asp Ala Ala Leu Phe Lys Ala Trp Ala Leu Phe Lys Gly Lys
65 70 75 80
Phe Arg Glu Gly Ile Asp Lys Pro Asp Pro Pro Thr Trp Lys Thr Arg
85 90 95
Leu Arg Cys Ala Leu Asn Lys Ser Asn Asp Phe Glu Glu Leu Val Glu
100 105 110
Arg Ser Gin Leu Asp Ile Ser Asp Pro Tyr Lys Val Tyr Arg Ile Val
115 120 125
Pro Glu Gly Ala Lys Lys Gly Ala Lys Gin Leu Thr Leu Glu Asp Pro
130 135 140
Gin Met Ser Met Ser His Pro Tyr Thr Met Thr Thr Pro Tyr Pro Ser
145 150 155 160
Leu Pro Ala Gin Val His- Asn Tyr Met -Met Pro Pro Leu Asp Arg ‘Ser-
165 170 175
Trp Arg Asp Tyr Val Pro Asp Gin Pro His Pro Glu Ile Pro Tyr Gin
180 185 190
Cys Pro Met Thr Phe Gly Pro Arg Gly His His Trp Gin Gly Pro Ala
195 200 205
• ·
Cys Glu Asn Gly 210 Cys Gin Val 215 Thr Gly Thr Phe Tyr 220 Ala Cys Ala Pro
Pro Glu Ser Gin Ala Pro Gly Val Pro Thr Glu Pro Ser Ile Arg Ser
225 230 235 240
Ala Glu Ala Leu Ala Phe Ser Asp Cys Arg Leu His Ile Cys Leu Tyr
245 250 255
Tyr Arg Glu Ile Leu Val Lys Glu Leu Thr Thr Ser Ser Pro Glu Gly
260 265 270
Cys Arg Ile Ser His Gly His Thr Tyr Asp Ala Ser Asn Leu Asp Gin
275 280 285
Val Leu Phe Pro Tyr Pro Glu Asp Asn Gly Gin Arg Lys Asn Ile Glu
2 90 295 300
Lys Leu Leu Ser His Leu Glu Arg Gly Val Val Leu Trp Met Ala Pro
305 310 315 320
Asp Gly Leu Tyr Ala Lys Arg Leu Cys Gin Ser Arg Ile Tyr Trp Asp
325 330 335
Gly Pro Leu Ala Leu Cys Asn Asp Arg Pro Asn Lys Leu Glu Arg Asp
340 345 350
Gin Thr Cys Lys Leu Phe Asp Thr Gin Gin Phe Leu Ser Glu Leu Gin
355 360 365
Ala Phe Ala His His Gly Arg Ser Leu Pro Arg Phe Gin Val Thr Leu
370 375 380
Cys Phe Gly Glu Glu Phe Pro Asp Pro Gin Arg Gin Arg Lys Leu Ile
385 390 395 400
Thr Ala His Val Glu Pro Leu Leu Ala Arg Gin Leu Tyr Tyr Phe Ala
405 410 415
Gin Gin Asn Ser Gly His Phe Leu Arg Gly Tyr Asp Leu Pro Glu His
420 425 430
Ile Ser Asn Pro Glu Asp Tyr His Arg Ser Ile Arg His Ser Ser Ile
435 440 445

Claims (17)

1. Izolovaná molekula nukleová kyseliny kódující LSIRF polypeptid nebo jeho fragment, vybraná ze skupiny skládající se z:
a) molekuly nukleová kyseliny mající nukleotidovou sekvenci SEQ. ID. NO: 1;
b) molekuly nukleová kyseliny mající nukleotidovou sekvenci SEQ. ID. NO: 4;
c) molekuly nukleová kyseliny mající nukleotidovou sekvenci SEQ. ID. NO: 24 nebo její „Double Q“ variantu;
d) molekuly nukleová kyseliny mající nukleotidovou sekvenci kódující aminokyselinovou sekvenci SEQ. ID. NO: 2;
e) molekuly nukleová kyseliny mající nukleotidovou sekvenci kódující aminokyselinovou sekvenci SEQ. ID. NO: 25 nebo její „Double Q“ variantu; a
f) molekuly nukleová kyseliny mající nukleotidovou sekvenci, která hybridizuje s molekulou nukleová kyseliny bodu (a), (b), (c), (d), (e), nebo s jejím fragmentem.
2. Izolovaná molekula nukleová kyseliny podle nároku 1, kterou je cDNA, genomová DNA nebo syntetická DNA.
3. Izolovaná molekula nukleová kyseliny, kterou je SEQ ID NO:1.
4. Izolovaná molekula nukleová kyseliny, kterou je SEQ ID NO:4.
5. Izolovaná molekula nukleová kyseliny, kterou je SEQ ID NO:3.
6. Vektor zahrnující molekulu nukleová kyseliny podle nároku 1.
7. Prokaryontní nebo eukaryontní hostitelská buňka stabilně transformovaná nebo transfektovaná s vektorem podle nároku 6.
i • · • · · · · ♦ · • · · · ♦· • · · ··· · · • · · · · • ·· ··
8. Izolovaný polypeptid nebo jeho fragment mající specifickou DNA vazebnou aktivitu LSIRF polypeptidu.
9. Polypeptid podle nároku 8 mající aminokyselinovou sekvenci SEQ. ID. NO: 2.
10. Polypeptid podle nároku 8, který je produktem exprese exogenní sekvence molekuly nukleová kyseliny prokaryontní nebo eukaryontní hostitelské buňky.
11. Polypeptid mající aminokyselinovou sekvenci zakódovanou pomocí DNA podle nároku 1.
12. Způsob výroby LSIRF polypeptidu zahrnující kultivaci hostitelské buňky podle nároku 7 za podmínek, které dovolují LSIRF expresi.
13. Protilátka specificky vázající polypeptid kódovaný pomocí DNA podle nároku 1.
14. Protilátka podle nároku 13, která je monoklonální protilátkou.
15. Způsob přípravy LSIRF polypeptidu zahrnující:
a) inserci vektoru zahrnujícího LSIRF gen do hostitelské buňky; a
b) kultivaci hostitelské buňky za podmínek, které dovolují expresi
LSIRF polypeptidu.
16. Izolovaná molekula nukleové kyseliny, kterou je SEQ ID. NO.: 24, nebo její „Double Q“ varianta.
17. Polypeptid podle nároku 8 mající aminokyselinovou sekvenci SEQ. ID. NO.: 25, nebo její „Double Q“ varianta.
CZ973189A 1995-04-14 1996-04-12 Geny kódující polypeptidy regulačního faktoru lymfocytárního interferonu CZ318997A3 (cs)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US42273395A 1995-04-14 1995-04-14
US08/611,280 US5891666A (en) 1995-04-14 1996-04-03 Genes encoding LSIRF polypeptides

Publications (1)

Publication Number Publication Date
CZ318997A3 true CZ318997A3 (cs) 1998-05-13

Family

ID=27025728

Family Applications (1)

Application Number Title Priority Date Filing Date
CZ973189A CZ318997A3 (cs) 1995-04-14 1996-04-12 Geny kódující polypeptidy regulačního faktoru lymfocytárního interferonu

Country Status (16)

Country Link
US (3) US5891666A (cs)
EP (1) EP0820509B1 (cs)
JP (1) JPH11505104A (cs)
KR (1) KR19980703889A (cs)
CN (1) CN1181784A (cs)
AT (1) ATE386114T1 (cs)
AU (1) AU5265796A (cs)
BR (1) BR9604947A (cs)
CA (1) CA2217633C (cs)
CZ (1) CZ318997A3 (cs)
DE (1) DE69637429T2 (cs)
ES (1) ES2301167T3 (cs)
HU (1) HUP9802289A2 (cs)
NO (1) NO974713D0 (cs)
NZ (1) NZ304789A (cs)
WO (1) WO1996032477A1 (cs)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6245562B1 (en) * 1996-05-28 2001-06-12 The Trustees Of Columbia University In The City Of New York Identification of genes altered in multiple myeloma
US6448072B1 (en) 1999-06-04 2002-09-10 Board Of Regents, The University Of Texas System Transcription factors related to TFIIA
US20050220781A1 (en) * 2003-09-04 2005-10-06 Duen-Hwa Yan IFIX, a novel HIN-200 protein, for cancer therapy
CN113943369B (zh) * 2021-10-27 2023-04-18 福州迈新生物技术开发有限公司 抗mum1蛋白单克隆抗体、细胞系及其应用
CN114015696B (zh) * 2021-11-09 2023-06-16 海南大学 卵形鲳鲹干扰素调节因子irf6基因、蛋白、制备方法及应用

Also Published As

Publication number Publication date
ES2301167T3 (es) 2008-06-16
WO1996032477A1 (en) 1996-10-17
NO974713L (no) 1997-10-10
EP0820509B1 (en) 2008-02-13
NZ304789A (en) 1998-12-23
MX9707542A (es) 1998-07-31
US6258935B1 (en) 2001-07-10
US6369202B1 (en) 2002-04-09
CA2217633A1 (en) 1996-10-17
AU5265796A (en) 1996-10-30
KR19980703889A (ko) 1998-12-05
US5891666A (en) 1999-04-06
DE69637429T2 (de) 2009-07-09
NO974713D0 (no) 1997-10-10
DE69637429D1 (de) 2008-03-27
JPH11505104A (ja) 1999-05-18
EP0820509A1 (en) 1998-01-28
ATE386114T1 (de) 2008-03-15
BR9604947A (pt) 1999-08-24
HUP9802289A2 (hu) 1999-01-28
CA2217633C (en) 2003-06-03
CN1181784A (zh) 1998-05-13

Similar Documents

Publication Publication Date Title
JP3871339B2 (ja) 脊椎動物アポトーシス遺伝子:組成物および方法
US6030788A (en) Cyclin-dependent protein kinase
US6369202B1 (en) Genes encoding LSIRF polypeptides
US20060228365A1 (en) Protein and gene involved in myocyte differentiation
US20040171551A1 (en) Molecules binding to Glu-Pro motifs, therapeutic compositions containing them and their applications
CA2365040A1 (en) Hob-bp2h compositions, methods and uses thereof
US6326483B1 (en) Compositions and methods based upon the tuberous sclerosis-1 (TSC1) gene and gene product
US20020015998A1 (en) Novel G protein-coupled receptors
JPH10504714A (ja) ヒトカリウムチャンネル1および2タンパク質
EP0780472A2 (en) Stress proteins
MXPA97007542A (en) Genes coding for the polypeptides of the regulatory factor of the interferon of lymphocytes (lsi)
EP0806478A2 (en) p53as Protein and antibody therefor
CA2393381A1 (en) Genes encoding lymphocyte interferon regulatory factor (lsirf) polypeptides
WO1998025957A2 (en) HUMAN Prt1-LIKE SUBUNIT PROTEIN (hPrt1) AND HUMAN eIF4G-LIKE PROTEIN (p97) GENES
WO1998035015A1 (en) Cyclin-dependent protein kinase
EP1036094A1 (en) Cyp7 promoter-binding factors
JP2006223311A (ja) リンパ球インターフェロン調節因子(lsirf)ポリペプチドをコードする遺伝子
WO1997020573A1 (en) Growth factor receptor-binding protein 2 homolog
WO1999019475A2 (en) Mammalian mesoderm induction early response (m-mier) gene family
CZ247199A3 (cs) Rekombinantní molekula DNA, kódující nový IFNAR1 receptor-vazebný protein, hostitelská buňka pro expresi zmíněné rekombinantní DNA, způsob prodloužení přežívání tkáňového štěpu a způsob zvýšení buněčné odpovědi na exogenní IFN terapii, nové IFNAR1 vazebné proteiny, způsob jejich přípravy a molekula s protilátkovou aktivitou
US20040102611A1 (en) Novel human homologue of the dbf4/ask1 protein, nucleic acids, and methods related to the same
JP2002112795A (ja) 分泌ネズミ・蛋白sdf5に類似したヒト・遺伝子(atg−1622)
WO2002036768A1 (en) Cell division autoantigen (cda) polypeptides, gene sequences and uses thereof
JP2002369685A (ja) アポトーシス遺伝子1のヒトインヒビター
CA2212991A1 (en) Invertebrate mesoderm induction early response (mier) gene family

Legal Events

Date Code Title Description
PD00 Pending as of 2000-06-30 in czech republic