CN1134460A - hTFIIIA基因 - Google Patents

hTFIIIA基因 Download PDF

Info

Publication number
CN1134460A
CN1134460A CN95117131A CN95117131A CN1134460A CN 1134460 A CN1134460 A CN 1134460A CN 95117131 A CN95117131 A CN 95117131A CN 95117131 A CN95117131 A CN 95117131A CN 1134460 A CN1134460 A CN 1134460A
Authority
CN
China
Prior art keywords
lys
gene
ala
ser
gly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN95117131A
Other languages
English (en)
Inventor
藤原力
武田圣
田良和
尾崎浩一
申贞均
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Otsuka Pharmaceutical Co Ltd
Original Assignee
Otsuka Pharmaceutical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Otsuka Pharmaceutical Co Ltd filed Critical Otsuka Pharmaceutical Co Ltd
Publication of CN1134460A publication Critical patent/CN1134460A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biochemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Saccharide Compounds (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明提供了一种含有编码SEQ ID NO:1所示氨基酸序列的碱基序列的hTFIIIA基因,特别是含有SEQ ID NO:2所示的碱基序列的hTFIIIA基因。
该基因能表达相应的hTFIIIA蛋白质,该基因和蛋白质用作转录调控因子,在遗传疾病如癌症或由转录控制的反常引起的其他疾病的诊断或鉴定中,以及其作用机理的分析中有用。

Description

hTFIIA基团
本发明涉及编码人转录因子IIIA(下文称作hTFIIIA)。
自从1980年首次从非洲蟾蜍属(xenopus)卵母细胞中以转录因子的形式纯化出TFIIA后[Segall et al.,J.Biol.Chem.,255.11986-11991(1980)],在Xenopus中进行了许多体内和体外研究以解释用所说的TFIIIA进行转录控制的机理[例如:Del etal.,Nucleic Acids Res.,19 6197-6203(1991);Smith etal.,Nucleic Acids Res.,19,6871-6876(1991);Liaoetal.,J.Mol.Biol.,223,857-871(1992);Del et al.,J.Mol.Biol.,233,567-579(1993)]。
上述Xenopus TFIIIA对5S RNA基因转录的启动是必须的[Sakonji et al.,Cell,19,13-25(1980)]而且与5S基因的一个内部控制区域结合[Bogenhagen et al.,Cell,19,27-35(1980)]。
Xenopus TFIIIA cDNA的核苷酸序列和相应的氨基酸序列已被报道[Ginsberg et al.,Cell,39,479-489(1984)]。所说的基因编码9个锌指纹区(Cys2His2(C2H2)区域的重复),该结构被当作一组DNA结合蛋白质所必须的区域[Miller et al.,EMBO J,4,1607-1614(1985)]。
已构建了一个酵母基因,它编码与xenopus TFIIIA同源的一种蛋白质,也有相同的C2H2区域[Archambault et al.,J.Biol.Chem.,267.3283-3288(1992)]。
进一步了解到,在人类,DNA结合转录因子,如人Wilms肿瘤基因WT1[Gessler et al.,Nature,343,774-778(1990)],人转录阻遏物YY1[Shi et al.,Cell,67,377-388(1991)],人MYC-相联性锌指纹蛋白maz[Bossone et al.,Proc.Natl.Acad.Sci.,USA,89,7452-7456(1992)]和SP1[kuwaharaet al.,Biolchem.,29,8627-8631(1990)]具有上述C2H2型指纹区。
与Xenopus TFIIIA相反,关于hTFIIIA所知甚少。1989,从Hela细胞中纯化出一种hTFIIIA样蛋白质(35K Da蛋白质)并显示出与人5S RNA基因相互作用[Seifart et al.,J.Biol.Chem.,264,1702-1709(1989)]。但还没有报道hTFIIIA编码基团。
因此,分离和提供一种hTFIIIA基因是本发明的目的。
本发明的另一目的在于揭示hTFIIIA基因的核苷酸序列及相应的氨基酸序列以便解释人转录机制并提供其用途。
由于他们深入研究的结果,本发明成功地分离出一种编码hTFIIIA的cDNA,测定了全部cDNA序列和相应的氨基酸序列,在各种组织中诱导了其表达并揭示了其在染色体上的位置。因此根据所得的发现,现已完成了本发明。
因此,本发明提供了编码一种氨基酸序列(由SEQ ID NO:1限定)的hTFIIIA。
在本说明书的下文中,用于氨基酸,肽,碱基序列,核酸等的缩写使用按IUPAC和IUB以及在“含碱基序列和/或氨基酸序列的附图说明书指标”(日本专利局编)中所推荐的或在相关领域通用的缩写形式。
本发明的hTFIIIA基因具有一个可译框架,其中包含1269个核苷酸(核酸),它编码423个氨基酸残基,如下面SEQ ID NO:1所示,其特征为编码9个C2H2型锌指纹区。当与XenoDus TF IIIA基因比较时,它显示出在核酸方面有63%的同源性,在氨基酸方面有58%的同源性。
由本发明基因编码的hTFIIIA认为可发挥DNA结合蛋白质的生物学作用,所说的基因用途是作为一种转录调节因子。具体地说,本发明的基因一般在各种组织中表达,因此,在涉及维持生命和控制功能的5S核糖体RNA基因转录和维持其他基因的稳定转录中可能发挥着重要作用。
尤其最近逐渐了解到大量疾病伴随着转录控制的紊乱。例如,许多癌基因产物充当转录调节因子,其中的紊乱导致细胞的癌变。早幼粒细胞白血病,染色体转位导致转录控制的紊乱,随后引起癌变。调节因子Hox2.4的高水平表达诱导小鼠白血病。因此,现在已知在许多遗传疾病中有关蛋白质显示无异常,但其病理学机理涉及一种基因的异常,该基因涉及所说蛋白质之基因表达所需的转录控制。经研究这些基因的异常(DNA诊断等)。可以鉴定遗传疾病,其发病机理的分析还没有足够的进展。本发明的基因在该领域中是有用的。本发明的基因在使用一种反意DNA通过转录控制来进行的疾病治疗中或在分析其作用机理中也是有用的。
另外,TFIIIA涉及5S RNA的转录控制,因此,该转录控制的紊乱直接导致有关蛋白质合成的紊乱。许多表现为一种蛋白质数量异常的遗传疾病可能是由该蛋白质合成的紊乱所引起的。因此,本发明的基因预期在解释该疾病中也是有用的。
本发明的基因以单链DNA序列的形式来代表,如SEQ ID N0:2所示,因此在其范围内,本发明包括与该单链DNA序列互补的DNA序列以及两种都包含的成份。
下面SEQ ID NO:2所示的DNA序列和代表本发明的基因是分别编码根据下面SEQ ID NO:1所示的氨基酸序列的氨基酸残基之密码的结合的一个例子。当然,本发明的基因不限于此,还可以具有任一DNA碱基序列,该序列包含一些氨基酸残基各自密码子的其他任意结合而不改变上述氨基酸顺序。可按常规方式进行密码子的选择,例如考虑密码子在所用宿主中的使用频率[Nucl.AcidsRes.,9,43-74(1981)]。
本发明的基因还包含编码上述氨基酸序列的等效物的DNA序列,该等效物是经缺失和/或取代至少一个氨基酸或其部分氨基酸序列,或经增加至少一个氨基酸或氨基酸序列进行修饰得到的,并且有与hTFIIIA相似的生物学活性。这些等效物可以自发产生或经转录后修饰产生或还可以经使用定点突变技术[Kramer,W,etal.,Nucl.Acids Res.,12,9441(11984);Kramer,W,andFrits,H.J.,Methods in Enzymology.154,350(1987);zoller,M.J.and Smith,M.,Methods in Enzymology,100,468(1983);Hirose,Susumu,Seikagaku Jikken Koza(Experimentsin Biochemistry),2nd series,Vol.1,“Idenshi Kenkyu-ho(Methods in Genetic Studies)II”105]修饰天然基因(本发明的基因),经使用化学合成技术如磷酸三酯法[Letsinger,R.L.and Ogilvie,K.K.,J.Am.Chem.Soc.,91,3350(1969);Merrifield,R.B.,Science,150,.178(1968)]和磷酰胺方法[Beaucage,S.L.and Caruthers,M.H.,Tetrahedron Lett.,22,1859(1981);McBride,L.J.andCaruthers.M.H.,Tetrahedron Lett.,24,245(1983)],或以这些方法的组合来生产。
经使用本发明的基因,即例如将它插入一种微生物载体中并培养因此转化的微生物,这可以很容易引起hTFIIIA的大量表达并随后分离和提供所述的蛋白质。
根据本文所公开的本发明基因的序列资料。使用一般的遗传工程技术[例如,Sambrook,J.,Fritsch,E.F.,Maniatis,T.,Molecular Cloning,2nd edition,Cold Spring HarborLaboratory Press(1989);Seikagaku Jikken Koza,2ndSeries,“Idenshi kenkyu-hoI,II,III”,edited byNippon Seikagaku-kai;Guide to Molecular CloninqTechniques,Berger,S.L.Kimmel,A.R.,Methods inEnzymology,Vol.152],其他人可以很容易地生产本发明的基因。
例如,可以使用合适的探针或本发明基因的特异性抗体从人cDNA文库(从含编码hTFIIIA的基因合适的原始细胞中按常规方法制备)中挑选所需克隆来生产所说的基因[cf.e.g.Sugga,S.V.,et al.,Proc.Natl.Acad.Sci.,USA,78,6613(1981);Young.R.A.,et al.,Science,222,778(1983)]。
用于上述程序的原始细胞的例子可以是所提到的各种细胞和组织,和其培养细胞,它们允许hTFIIIA基因的表达。从其中分离总RNA,按常规方法进行mRNA的分离和纯化,其转变成(合成)cDNA,cDNA的克隆以及其他步骤。另外,在本发明的实施中,cDNA文库可作为一种商品购买到。例如,该cDNA文库可以使用从Clontech买到的各种cDNA文库。
可按上面提到的常规方法从该cDNA文库中完成对本发明基因的筛选。作为筛选方法,可以被提及的有:例如,包含使用一种抗-hTFIIIA特异性抗体来抗cDNA产生的蛋白质,以Western印迹方式挑选出相应的cDNA克隆的方法;包含使用一种与目标DNA序列选择性结合的探钟的Southern印迹方法;Northern印迹方法,及其组合。一般来说,例如根据本发明基因的DNA序列资料化学合成的DNA序列在这里用作探针。当然,还可以使用已经获得的本发明基因或其片段作为探针。
在获得本发明基因的过程中,包含PCR技术[saiki,R.K.,et al.,Science,230,1350-1354(1985)]的DNA/RNA放大方法也能被成功地适用。特别在那些全长cDNA不能从文库中获得的例子中,可适合运用RAGE技术[cDNA末端的迅速放大;JikkenIgakn,12(6),35-38(1994)]。在运用该PCR技术中所用的引物可根据本发明基因序列的资料来进行适当的设计,也可用共知的常规方法来合成。
放大的DNA/RNA片段可按上面提到的常规方式如经凝胶电泳进行分离和纯化。
按常规方式,例如以双脱氧法[Sanger.F.,et al,Proc.Natl.Acad.Sci.,USA,74,5463-5467(1977)]或Maxam-Gilbert法[Maxam.A.M.et a1.Methods in Enzymology,65,499(1980)]可测定本发明基因或其各种DNA片段中任意一种的碱基序列。该碱基序列的测定也可用以商品的形式可购买到的测序试剂盒或相似物很容易地测出。
因此获得了cDNA的全部DNA碱基序列,将它命名为克隆OTK7并作为本发明基因的一个例子,如下面SEQ ID NO:3所示。由所说cDNA编码的hTFIIIA氨基酸序列如下面SEQ ID NO:1所示。
根据本发明,提供了一种筛选hTFIIIA基因的方法,包括使用本发明基因的一部分作为探针。例如可使用一种任意引物DNA标记试剂盒(从Takara Shuzo,Amersham,等可买到),利用任意引物DNA标记技术[Feinberg,A.P.,et al.,Anal.Biochem.,137266-267(1984)]标记此处的探针。例如可用噬菌斑杂交技术[Benton.W.,et al.,Science.196,383-394(1977)]筛选目标基因。
另外,按照一般基因重组技术[cf.e.g.Science,224,1431(1984);Biochem.Biophys.Res.Comm.,130,692(1985);Proc.Natl.Acad.Sci.,USA,80,5990(1983)],以本发明的基因开始可获得重组的hTFIIIA种类。更具体地说,经构建重组DNA,允许本发明的基因在宿主细胞中表达,经转化将该DNA引入宿主细胞中并培养所得的转化细胞来生产所说的hTFIIIA种类。
所用的宿主细胞可以是真核细胞,也可以是原核细胞。至于脊椎动物细胞的表达载体,可使用的载体含有一个一般位于所表达的基因上游的启动子,一个RNA剪切位点,一个多聚腺苷化位点和一个转录终止序列,如果必要的话,可能还含有一个复制起点。至于真核微生物,一般常用的是酵母,其中,使用Saccharomyces属的酵母具有优势。对于真核微生物(如酵母)的表达载体,可使用例如具有一个酸性磷酸酶基因启动子的pAM82[A.Miyanoharaet al.,Proc.Natl.Acad.Sci.,USA,80,1-5(1983)]。至于原核宿主,一般常用的是Escherichia coli和Bacillussubtilis。在本发明的实施中,当使用该宿主时,需要使用一个表达质粒,以将本发明的基因插入一个质粒载体中来构建,该载体能以某种方式在所说的宿主中复制,对于提供的所说的表达质粒,在本发明基因的上游有一个启动子和SD(ShineandDalgarno)碱基序列,还有一个为蛋白质合成的启动所必需的起始密码子(例如ATG),以使所说的基因得以表达。例如,Escherichia coli K12常用作上面提到的“Escherichia coli”宿主,pBR322常用作载体。然而,这并不限于使用各种共知的菌株和载体。例如:有用的启动子有:色氨酸(trp)启动子,lpp启动子,lac启动子,PL启动子,诸如此类。
使用本领域常用的各种方法将因此获得的所需重组DNA导入宿主细胞以进行其转化。所得的转化细胞以常规方法培养。培养导致以本发明基因编码的目的hTTIIIA的生产和积累。用于所说培养的培养基可根据所用的宿主细胞适当地选自各种常用培养基。在适于宿主细胞生长的条件下进行培养。
按上述方式,目的重组hTFIIIA蛋白质产生和积累或分泌到转化细胞的细胞内或细胞外。
利用其物理和/或化学和/或其他特征以各种分离程序分离和纯化重组hTFIIIA[cf.“Seikagaku(Biochemistry)DataBook”,pages 1175-1259,1st edition,1st printing.publishedJune 23,1980 by Tokyo Kagaku Dozin;Biochemistry.Vol,25,No.25,8274-8277(1986);Eur.J.Biochem.,163,313-321(1987)]。具体地说,所说的过程包括各种常用方法如:重建处理,以一种蛋白质沉淀剂处理(盐析),离心,渗压休克过程,超声处理,超滤作用、分子筛层析(凝胶过滤),吸收色谱,离子交换色谱,亲合色谱,高效液相色谱(HPLC),其他色谱技术,透析,及其组合。以上述方式,所需的重组hTFIIIA可按商品规模以较高产量容易地生产出来。
根据本发明,提供了一种hTFIIIA基因,使用所说基因可容易地大量生产hTFIIIA。本发明的基因和hTFIIIA作为转录调控因子是有用的,而且在其他方面,如癌症和由转录控制的紊乱所引起的其他遗传疾病的诊断和鉴定,经转录控制对该疾病的治疗,以及该控制作用机理的分析,也是十分有用的。
图1是显示了本发明的基因在各种组织中的表达的Northern印迹观察到的结果。
                      实施例
下面实施例是对本发明的进一步解释。实施例1(1)克隆和测序:
从人胎儿脑cDNA文库中任意选出的克隆之序列分析的结果表明:发现一个1.3kb的克隆与Xenopus TFIIIA具有高水平的同源性,命名为OTK7-1。序列分析揭示了本克隆缺少基因的5′部分。(2)5′RACE
使用商品试剂盒(5′-Ampli FINDER TM RACE试剂盒,Clontech)以5′RACE分离含基因5′部分的cDNA克隆。
在本例中,合成了3个与OTK7-1相应的引物,即H11-R(碱基序列如SEQ ID NO:4所示),H11-E(序列如SEQ ID N0:5所示)和H11-H(序列如SEQ ID NO:6所示)以及一个与锚着引物(SEQ ID NO:8所示)互补的引物(AP-2;SEQ ID NO:7所示)。
用引物H-11R对300ng人脑poly A+ RNA(Clontech)进行反转录以合成单链cDNA。
因此,9μl poly A+RNA(300ng 19μl)和1μl引物H11-R(10微微摩尔1μl)在65℃下预保温5分钟,加入反应混合物[9.2μl)DEPC处理过的水/9μl 4X反转录酶缓冲液/1.6μl RNase抑制物(40单位/μl)/3.7μl dNTP混合物(每种核苷酸10mM)/0.5μlAMV反转录酶(25单位/μl)],52℃下保温30分钟。加入10μl 0.5MEDTA终止反应,加入10μl 6N NaOH水解模板poly A+RNA,使用GENO-BINDTM系统去掉过剩的引物H11-R。接着用乙醇沉淀,cDNA沉淀重悬于6μl H2O中。
使用T4 DNA连接酶将单链锚着寡聚核苷酸(锚着引物)与上述cDNA 3′端连接,按下面程序进行。
由2.5μl上述cDNA,2μl锚着引物(4微微摩尔)5μl 2×连接缓冲液,0.5μl T4 DNA连接酶(20单位/μl)组成的混合物室温下温育18小时。
连接混合物稀释10倍用作PCR模板。
使用引物AP-2和H11-E对1.0μl锚着连接的cDNA稀释液进行PCR扩增,按下面程序进行。
所说的稀释物82℃维持1分钟,然后加入引物,进行35个PCR循环(每循环包含92℃维持0.5分钟。56℃ 0.5分钟和72℃ 1.0分钟),接着72℃温育15分钟。PC产物克隆到p Bluescript SK(-)载体的EcoRV位点上。使用32P-ATP末端标记的寡聚H11-I经集落杂交筛选所需转化细胞。以二脱氧终止法[Sanger et al.,Proc.Natl.Acad.Sci.,USA,74,5463-5467(1977)]对阳性菌落进行序列测定。
所得的cDNA是本发明的基因,下文称作“OTK 7”。(3)Northern杂交:
使用人多种组织Northern印迹系统(Clontech)检测本发明的基因OTK7在各种组织中的表达。
印迹进行如下:在含50%甲酰胺,10×Denhardt′s溶液,5×SSPE,2%SDS和100μg/ml变性鱼精DNA的溶液中以[32P]-标记的cDNA作为探针50℃预杂交4小时,接着杂交18小时。室温下洗涤印迹,用2×SSC/0.05%SDS经过10分钟洗涤3次,然后用0.1×SSC/0.1%SDS洗两次经过15分钟,在-80℃下放射自显影16小时。(4)染色体定位
以直接在R-荧光带上原位杂交的方式进行染色体定位[FISH;Takahashi et al.,Hum.Genet.,86,14-16(1990)和出处同上,88,119-121(1991)]。(5)结果:
a)OTK7基因的DNA序列和相应的氨基酸序列
  OTK7 cDNA的核苷酸序列和相应的氨基酸序列如下SEQ IDNO:3所示。
关于SEQ ID NO:3.由第1289位到1291位碱基组成的序列是终止密码子(TAA),含第317位到1096位碱基的序列与锌指纹区相对应,从第20位到22位碱基(ATG)是起始甲硫氨酸密码子,第1363位到1368位碱基(ATTAAA)构成多聚腺苷化信号。
OTK7 cDNA共含1399个碱基,包括一个编码423个氨基酸残基的1269碱基可译框架。
直到其编码序列3/4部分的5′端序列被研究,所说的cDNA与Xenopus TF IIIA相比,显示出63%的核苷酸同源性和58%的氨基酸同源性。
该hTFIIIA具有9个锌指纹区,其氨基酸序列与XenopusTFIIIA的C2H2指纹区高度一致。除了第6个指纹区在两半胱氨酸残基间只有3个氨基酸残基而不像Xenopus TFIIIA中有5个氨基酸残基。
在C端区域,两者的同源性不高。它们在N端区域的大小上也有区别。在Xenopus TFIIIA中其第一个指纹区上游有14个氨基酸残基,而hTFIIIA有99个氨基酸残基。hTFIIIA N端区域与现在已知的任一基因产物无同源性。
hTFIIIA与其他已知的DNA接合蛋白质的同源性局限在相当小的区域内,如下所述:
Xenopus 5S RNA结合蛋白质P43[Joho et al.,Cell,61,293-300(1990)]。在289个氨基酸残基中有37%相同;
人类Wilms肿瘤基因产物WT1[Gessler et al.,Nature,343,774-778(1990)]···在126个氨基酸残基中有35%相同;
人转录阻遏物YYA[Shi et al.,Cell 67,377-388(1991)]···在95个氨基酸残基中,40%相同;
人GT盒结合蛋白质[Kingsley et al.,MOl.Cell.Biol.,12,4251-4261(1992)]···在91个氨基酸残基中,44%相同;
人myc-相关性锌指纹区蛋白质[Bossone et al.,Proc.,Natl.Acad.Sci.,USA,89,7452-7456(1992)〕···在152个氨基酸残基中,37%相同。b)Northern印迹分析:
hTFIIIA在各种组织中的表达水平如图1所示。
在图1中,用1.1kbp cDNA作探针的上述试验(hTFIIIA表达)的结果在上排显示,用β-肌动蛋白探针以相同方式进行β-肌动蛋白m-RNA检测的相同印迹结果(对照)在下排显示。相应的泳道如下:
    泳道1:心脏
    泳道2:大脑
    泳道3:胎盘
    泳道4:肺
    泳道5:肝脏
    泳道6:骨胳肌
    泳道7:肾脏
    泳道8:胰腺
    泳道9:脾脏
    泳道10:胸腺
    泳道11:前列脉
    泳道12:精巢
    泳道13:卵巢
    泳道14:小肠
    泳道15:结肠
    泳道16:外周血白细胞
以Northern分析hTFIIIA转录物的大小估计大约为1400bp。这一大小与OTK7 cDNA几乎一致,因此,所说的cDNA可能覆盖hTTFIIIA mRNA的几乎全部序列。
该基因在所试验的所有人类组织中普遍表达,表达的水平在某些组织如胰腺,脾脏和外周血白细胞中比其他组织似乎要高。c)定位
hTFIIIA基因发现存在于染色体13q 12.3-13.1上
                        序列描述(2)SEQ ID NO:1:资料:(i)序列特征
 (A)长度:423个氨基酸
 (B)类型:氨基酸
 (D)拓扑学:线型(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:1:Met Arg Ser Ser Gly Ala Asp Ala Gly Arg Cys Leu Val Thr Ala Arg1               5                  10                  15Ala Pro Gly Ser Val Pro Ala Ser Arg Glu Gly Ser Ala Gly Ser Arg
         20                  25                  30Gly Pro Gly Ala Arg Phe Pro Ala Arg Val Ser Ala Arg Gly Ser Ala
     35                  40                  45Pro Gly Pro Gly Leu Gly Gly Ala Gly Ala Leu Asp Pro Pro Ala Val
 50              55                      60Val Ala Glu Ser Val Ser Ser Leu Thr Ile Ala Asp Ala Phe Ile Ala65                      70                      75          80Ala Gly Glu Ser Ser Ala Pro Thr Pro Pro Arg Pro Ala Leu Pro Arg
             85                  90                  95Arg Phe Ile Cys Ser Phe Pro Asp Cys Ser Ala ASh Tyr Ser Lys Ala
        100                 105                 110Trp Lys Leu Asp Ala His Leu Cys Lys His Thr Gly Glu Arg Pro Phe
    115                 120                 125Val Cys Asp Tyr Glu Gly Cys Gly Lys Ala Phe Ile Arg Asp Tyr His
130                 135                 140Leu Ser Arg His Ile Leu Thr His Thr Gly Glu Lys Pro Phe Val Cys145                 150                 155                 160Ala Ala Asn Gly Cys Asp Gln Lys Phe Asn Thr Lys Ser Asn Leu Lys
            165                 170                 175Lys His Phe Glu Arg Lys His Glu Asn Gln Gln Lys Gln Tyr Ile Cys
        180                 185                 190Ser Phe Glu Asp Cys Lys Lys Thr Phe Lys Lys His Gln Gln Met Lys
    195                 200                 205Ile His Gln Cys Gln Asn Thr Asn Glu Pro Leu Phe Lys Cys Thr Gln
210                 215                 220Glu Gly Cys Gly Lys His Phe Ala Ser Pro Ser Lys Leu Lys Arg His225                 230                 235                 240Ala Lys Ala His Glu Gly Tyr Val Cys Gln Lys Gly Cys Ser Phe Val
            245                 250                 255Ala Lys Thr Trp Thr Glu Leu Leu Lys His Val Arg Glu Thr His Lys
        260                 265                 270Glu Glu Ile Leu Cys Glu Val Cys Arg Lys Thr Phe Lys Arg Lys Asp
    275                 280                 285Tyr Leu Lys Gln His Met Lys Thr His Ala Pro Glu Arg Asp Val Cys
290                 295                 300Arg Cys Pro Arg Glu Gly Cys Gly Arg Thr Tyr Thr Thr Val Phe Asn305                 310                 315                 320Leu Gln Ser His Ile Leu Ser Phe His Glu Glu Ser Arg Pro Phe Val
            325                 330                 335Cys Glu His Ala Gly Cys Gly Lys Thr Phe Ala Met Lys Gln Ser Leu
        340                 345                 350Thr Arg His Ala Val Val His Asp Pro Asp Lys Lys Lys Met Lys Leu
    355                 360                 365Lys Val Lys Lys Ser Arg Glu Lys Arg Glu Phe Gly Leu Ser Ser Gln
370                 375                 380Trp Ile Tyr Pro Pro Lys Arg Lys Gln Gly Gln Gly Leu Ser Leu Cys385                 390                 395                 400Gln Asn Gly Glu Ser Pro Asn Cys Val Glu Asp Lys Met Leu Ser Thr
            405                 410                 415Val Ala Val Leu Thr Leu Gly
        420(2)SEQ ID NO:2:资料:(i)序列特征
 (A)长度:1269个碱基对
 (B)类型:核酸
 (C)链型:单链
 (D)拓扑学:线型(ii)分子类型:cDNA(xi)序列描述:SEQ ID NO:2:ATGCGCAGCA  GCGGCGCCGA  CGCGGGGCGG  TGCCTGGTGA  CCGCGCGCGC  TCCCGGAAGT      60GTGCCGGCGT  CGCGCGAAGG  TTCAGCAGGG  AGCCGTGGGC  CGGGCGCGCG  GTTCCCGGCA     120CGTGTCTCGG  CACGTGGCAG  CGCGCCTGGC  CCTGGGCTTG  GAGGCGCCGG  CGCCCTGGAT     180CCGCCGGCCG  TGGTCGCCGA  GTCGGTGTCG  TCCTTGACCA  TCGCCGACGC  GTTCATTGCA     240GCCGGCGAGA  GCTCAGCTCC  GACCCCGCCG  CGCCCCGCGC  TTCCCAGGAG  GTTCATCTGC     300TCCTTCCCTG  ACTGCAGCGC  CAATTACAGC  AAAGCCTGGA  AGCTTGACGC  GCACCTGTGC     360AAGCACACGG  GGGAGAGACC  ATTTGTTTGT  GACTATGAAG  GGTGTGGCAA  GGCCTTCATC     420AGGGACTACC  ATCTGAGCCG  CCACATTCTG  ACTCACACAG  GAGAAAAGCC  GTTTGTTTGT     480GCAGCCAATG  GCTGTGATCA  AAAATICAAC  ACAAAATCAA  ACTTGAAGAA  ACATTTTGAA     540CGCAAACATG  AAAATCAACA  AAAACAATAT  ATATGCAGTT  TTGAAGACTG  TAAGAAGACC     600TTTAAGAAAC  ATCAGCAGAT  GAAAATCCAT  CAGTGCCAGA  ATACCAATGA  ACCTCTATTC     660AAGTGTACCC  AGGAAGGATG  TGGGAAACAC  TTTGCATCAC  CCAGCAAGCT  GAAACGACAT     720GCCAAGGCCC  ACGAGGGCTA  TGTATGTCAA  AAAGGATGTT  CCTTTGTGGK  AAAAACATGG     780ACGGAACTTC  TGAAACATGT  GAGAGAAACC  CATAAAGAGG  AAATACTATG  TGAAGTATGC     840CGGAAAACAT  TTAAACGCAA  AGATTACCTT  AAGCAACACA  TGAAAACTCA  TGCCCCAGAA     900AGGGATGTAT  GTCGCTGTCC  AAGAGAAGGC  TGTGGAAGAA  CCTATACAAC  TGTGTTTAAT     960CTCCAAAGCC  ATATCCTCTC  CTTCCATGAG  GAAAGCCGCC  CTTTTGTGTG  TGAACATGCT     1020GGCTGTGGCA  AAACATTTGC  AATGAAACAA  AGTCTCACTA  GGCATGCTGT  TGTACATGAT     1080CCTGACAAGA  AGAAAATGAA  GCTCAAAGTC  AAAAAATCTC  GTGAAAAACG  GGAGTTTGGC     1140CTCTCATCTC  AGTGGATATA  TCCTCCCAAA  AGGAAACAAG  GGCAAGGCTT  ATCTTTGTGT     1200CAAAACGGAG  AGTCACCCAA  CTGTGTGGAA  GACAAGATGC  TCTCGACAGT  TGCAGTACTT     1260ACCCTTGGC                                                                  1269(2)SEQ ID NO:3:资料:(i)序列特征
 (A)长度:1399个碱基对
 (B)类型:核酸
 (C)链型:单链
 (D)拓扑学:线型(ii)分子类型:cDNA(vii)直接来源:
 (A)文库:人胚胎大脑cDNA
 (B)克隆:OTK 7(ix)特征:
 (A)名称/键:CDS
 (B)位置:20..1288
 (C)鉴定方法:S(xi)序列描述:SEQ ID NO:3:ATGCGCGATC TCCCGGAGC ATG CGC AGC AGC GGC GCC GAC GCG GGG CGG TGC    52
                 Met Arg Ser Ser Gly Ala Asp Ala Gly Arg Cys
                   1               5                  10CTG GTG ACC GCG CGC GCT CCC GGA AGT GTG CCG GCG TCG CGC GAA GGT    100Leu Val Thr Ala Arg Ala Pro Gly Ser Val Pro Ala Ser Arg Glu Gly
         15                  20                  25TCA GCA GGG AGC CGT GGG CCG GGC GCG CGG TTC CCG GCA CGT GTC TCG   148Ser Ala Gly Ser Arg Gly Pro Gly Ala Arg Phe Pro Ala Arg Val Ser
     30                  35                  40GCA CGT GGC AGC GCG CCT GGC CCT GGG CTT GGA GGC GCC GGC GCC CTG   196Ala Arg Gly Ser Ala Pro Gly Pro Gly Leu Gly Gly Ala Gly Ala Leu
 45                  50                  55GAT CCG CCG GCC GTG GTC GCC GAG TCG GTG TCG TCC TTG ACC ATC GCC   244Asp Pro Pro Ala Val Val Ala Glu Ser Val Ser Ser Leu Thr Ile Ala60              65              70                          75GAC GCG TTC ATT GCA GCC GGC GAG AGC TCA GCT CCG ACC CCG CCG CGC   292Asp Ala Phe Ile Ala Ala Gly Glu Ser Ser Ala Pro Thr Pro Pro Arg
             80              85                      90CCC GCG CTT CCC AGG AGG TTC ATC TGC TCC TTC CCT GAC TGC AGC GCC    340Pro Ala Leu Pro Arg Arg Phe Ile Cys Ser Phe Pro Asp Cys Ser Ala
         95                 100                 105AAT TAC AGC AAA GCC TGG AAG CTT GAC GCG CAC CTG TGC AAG CAC ACG    388Asn Tyr Ser Lys Ala Trp Lys Leu Asp Ala His Leu Cys Lys His Thr
    110                 115                 120GGG GAG AGA CCA TTT GTT TGT GAC TAT GAA GGG TGT GGC AAG GCC TTC    436Gly Glu Arg Pro Phe Val Cys Asp Tyr Glu Gly Cys Gly Lys Ala Phe
125                 130                 135ATC AGG GAC TAC CAT CTG AGC CGC CAC ATT CTG ACT CAC ACA GGA GAA    484Ile Arg Asp Tyr His Leu Ser Arg His Ile Leu Thr His Thr Gly Glu140                 145                 150                 155AAG CCG TTT GTT TGT GCA GCC AAT GGC TGT GAT CAA AAA TTC AAC ACA    532Lys Pro Phe Val Cys Ala Ala Asn Gly Cys Asp Gln Lys Phe Asn Thr
            160                 165                 170AAA TCA AAC TTG AAG AAA CAT TTT GAA CGC AAA CAT GAA AAT CAA CAA    580Lys Ser Asn Leu Lys Lys His Phe Glu Arg Lys His Glu Asn Gln Gln
        175                 180                 185AAA CAA TAT ATA TGC AGT TTT GAA GAC TGT AAG AAG ACC TTT AAG AAA    628Lys Gln Tyr Ile Cys Ser Phe Glu Asp Cys Lys Lys Thr Phe Lys Lys
    190                 195                 200CAT CAG CAG ATG AAA ATC CAT CAG TGC CAG AAT ACC AAT GAA CCT CTA    676His Gln Gln Met Lys Ile His Gln Cys Gln Asn Thr Ash Glu Pro Leu
205                 210                 215TTC AAG TGT ACC CAG GAA GGA TGT GGG AAA CAC TTT GCA TCA CCC AGC    724Phe Lys Cys Thr Gln Glu Gly Cys Gly Lys His Phe Ala Ser Pro Ser220                 225                 230                 235AAG CTG AAA CGA CAT GCC AAG GCC CAC GAG GGC TAT GTA TGT CAA AAA    772Lys Leu Lys Arg His Ala Lys Ala His Glu Gly Tyr Val Cys Gln Lys
            240                 245                 250GGA TGT TCC TTT GTG GCA AAA ACA TGG ACG GAA CTT CTG AAA CAT GTG    820Gly Cys Ser Phe Val Ala Lys Thr Trp Thr Glu Leu Leu Lys His Val
        255                 260                 265AGA GAA ACC CAT AAA GAG GAA ATA CTA TGT GAA GTA TGC CGG AAA ACA    868Arg Glu Thr His Lys Glu Glu Ile Leu Cys Glu Val Cys Arg Lys Thr
    270                 275                 280TTT AAA CGC AAA GAT TAC CTT AAG CAA CAC ATG AAA ACT CAT GCC CCA    916Phe Lys Arg Lys Asp Tyr Leu Lys Gln His Met Lys Thr His Ala Pro
285                 290                 295GAA AGG GAT GTA TGT CGC TGT CCA AGA GAA GGC TGT GGA AGA ACC TAT    964Glu Arg Asp Val Cys Arg Cys Pro Arg Glu Gly Cys Gly Arg Thr Tyr300                 305                 310                 315ACA ACT GTG TTT AAT CTC CAA AGC CAT ATC CTC TCC TTC CAT GAG GAA    1012Thr Thr Val Phe Asn Leu Gln Ser His Ile Leu Ser Phe His Glu Glu
            320                 325                 330AGC CGC CCT TTT GTG TGT GAA CAT GCT GGC TGT GGC AAA ACA TTT GCA    1060Ser Arg Pro Phe Val Cys Glu His Ala Gly Cys Gly Lys Thr Phe Ala
        335                 340                 345ATG AAA CAA AGT CTC ACT AGG CAT GCT GTT GTA CAT GAT CCT GAC AAG     1108Met Lys Gln Ser Leu Thr Arg His Ala Val Val His Asp Pro Asp Lys
    350                 355                 360AAG AAA ATG AAG CTC AAA GTC AAA AAA TCT CGT GAA AAA CGG GAG TTT    1156Lys Lys Met Lys Leu Lys Val Lys Lys Ser Arg Glu Lys ArG Glu Phe
365                 370                 375GGC CTC TCA TCT CAG TGG ATA TAT CCT CCC AAA AGG AAA CAA GGG CAA    1204Gly Leu Ser Ser Gln Trp Ile Tyr Pro Pro Lys Arg Lys Gln Gly Gln380                 385                 390                 395GGC TTA TCT TTG TGT CAA AAC GGA GAG TCA CCC AAC TGT GTG GAA GAC    1252Gly Leu Ser Leu Cys Gln Asn Gly Glu Ser Pro Asn Cys Val Glu Asp
            400                 405                 410AAG ATG CTC TCG ACA GTT GCA GTA CTT ACC CTT GGC TAAGAACTGC         1298Lys Met Leu Ser Thr Val Ala Val Leu Thr Leu Gly
        415                 420ACTGCTTTGT TTAAAGGACT GCAGACCAAG GAGTCGAGCT TTCTCTCAGA GCATGCTTTT  1358CTTTATTAAA ATTACTGATG CAGAAAAAAA AAAAAAAAAA A                      1399(2)SEQ ID NO:4:资料:(i)序列特征
 (A)长度:16个碱基对
 (B)类型:核酸
 (C)链型:单链
 (D)拓扑学:线型(ii)分子类型:cDNA
(xi)序列描述:SEQ ID NO:4:ATGGTCAAGG ACGACA                           16(2)SEQ ID NO:5:资料:(i)序列特征
 (A)长度:27个碱基对
 (B)类型:核酸
 (C)链型:单链
 (D)拓扑学:线型(ii)分子类型:cDNA(xi)序列描述:SEQ ID NO:5:AATGAATTCA TAAGGACGAC ACCGACT                        27(2)SEQ ID NO:6:资料:(i)序列特征
 (A)长度:18个碱基对
 (B)类型:核酸
 (C)链型:单链
 (D)拓扑学:线型(ii)分子类型:cDNA(xi)序列描述:SEQ ID NO:6:CCTCCAAGCC CAGGGCA                                   18(2)SEQ ID NO:7:资料:(i)序列特征
 (A)长度:22个碱基对
 (B)类型:核酸
 (C)链型:单链
 (D)拓扑学:线型(ii)分子类型:cDNA(xi)序列描述:SEQ ID NO:7:CAGAATCGAT AGTGAATTCG TG                              22(2)SEQ ID NO:8:资料:(i)序列特征
 (A)长度:35个碱基对
 (B)类型:核酸
 (C)链型:单链
 (D)拓扑学:线型(ii)分子类型:cDNA(xi)序列描述:SEQ ID NO:8:CACGAATTCA CTATCGATTC TGGAACCTTC AGACC                  35

Claims (1)

1.一种人转录因子IIIA基因,它编码SEQ ID NO:1所示的氨基酸序列。
CN95117131A 1994-09-05 1995-09-05 hTFIIIA基因 Pending CN1134460A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP211022/94 1994-09-05
JP6211022A JP2946019B2 (ja) 1994-09-05 1994-09-05 hTFIIIA遺伝子

Publications (1)

Publication Number Publication Date
CN1134460A true CN1134460A (zh) 1996-10-30

Family

ID=16599063

Family Applications (1)

Application Number Title Priority Date Filing Date
CN95117131A Pending CN1134460A (zh) 1994-09-05 1995-09-05 hTFIIIA基因

Country Status (8)

Country Link
US (1) US5808030A (zh)
EP (1) EP0704526B1 (zh)
JP (1) JP2946019B2 (zh)
KR (1) KR960010861A (zh)
CN (1) CN1134460A (zh)
AT (1) ATE198218T1 (zh)
CA (1) CA2157531A1 (zh)
DE (1) DE69519654T2 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2946019B2 (ja) * 1994-09-05 1999-09-06 大塚製薬株式会社 hTFIIIA遺伝子
FR2785618B1 (fr) * 1998-11-10 2002-12-13 Hoechst Marion Roussel Inc GENE HUMAIN htfIIIA ET LA PROTEINE CODEE hTFIIIA

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2946019B2 (ja) * 1994-09-05 1999-09-06 大塚製薬株式会社 hTFIIIA遺伝子

Also Published As

Publication number Publication date
JPH0870870A (ja) 1996-03-19
JP2946019B2 (ja) 1999-09-06
EP0704526A1 (en) 1996-04-03
US5808030A (en) 1998-09-15
EP0704526B1 (en) 2000-12-20
DE69519654D1 (de) 2001-01-25
KR960010861A (ko) 1996-04-20
ATE198218T1 (de) 2001-01-15
DE69519654T2 (de) 2001-05-17
CA2157531A1 (en) 1996-03-06

Similar Documents

Publication Publication Date Title
CN1134460A (zh) hTFIIIA基因
CN1297916A (zh) 一种新的多肽——人含溴基结构域的蛋白95和编码这种多肽的多核苷酸
CN1343725A (zh) 人血管生成素样蛋白和编码序列及其用途
CN1299823A (zh) 新的人细胞因子、其编码序列及用途
CN1297922A (zh) 一种多肽-人钙结合s100蛋白21和编码该多肽的多核苷酸
CN1299830A (zh) 新的人热休克蛋白、其编码序列及其用途
CN1388132A (zh) 诱导细胞凋亡蛋白、其编码序列及用途
CN1298005A (zh) 一种新的多肽——人唾液酸转移酶27和编码这种多肽的多核苷酸
CN1297914A (zh) 一种新的多肽——人锌指蛋白58和编码这种多肽的多核苷酸
CN1393452A (zh) 记忆清除蛋白及其应用
CN1297930A (zh) 一种新的多肽——人凝血栓蛋白30和编码这种多肽的多核苷酸
CN1406982A (zh) 一种多肽-人含转化生长因子家族特征性序列片段的蛋白-12.87和编码这种多肽的多核苷酸
CN1477193A (zh) 新型人Rab GTP酶,其编码序列及用途
CN1343774A (zh) 一种癫痫相关蛋白编码序列,其编码的多肽、制法及用途
CN1342713A (zh) 人长寿保障蛋白和编码序列及其用途
CN1328134A (zh) 一种蛋白激酶编码序列,其编码的多肽、制法及用途
CN1475499A (zh) 新型人细胞信号相关蛋白,其编码序列及用途
CN1302812A (zh) 一种新的多肽-人rna结合蛋白33和编码这种多肽的多核苷酸
CN1296966A (zh) 一种新的多肽——人sr剪接因子52和编码这种多肽的多核苷酸
CN1297929A (zh) 一种新的多肽——人锌指蛋白60和编码这种多肽的多核苷酸
CN1297903A (zh) 一种新的多肽——人锌指蛋白70和编码这种多肽的多核苷酸
CN1406967A (zh) 一种多肽-含wd-40重复序列蛋白-30.03和编码这种多肽的多核苷酸
CN1431306A (zh) 人类肝癌衍生生长因子5、其编码序列、制法及用途
CN1297919A (zh) 一种新的多肽——人锌指蛋白69和编码这种多肽的多核苷酸
CN1470520A (zh) 一种多肽——锌指蛋白40和编码这种多肽的多核苷酸

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C01 Deemed withdrawal of patent application (patent law 1993)
WD01 Invention patent application deemed withdrawn after publication