CN1134460A

CN1134460A - hTFIIIA基因

Info

Publication number: CN1134460A
Application number: CN95117131A
Authority: CN
Inventors: 藤原力; 武田圣; 田良和; 尾崎浩一; 申贞均
Original assignee: Otsuka Pharmaceutical Co Ltd
Current assignee: Otsuka Pharmaceutical Co Ltd
Priority date: 1994-09-05
Filing date: 1995-09-05
Publication date: 1996-10-30
Also published as: JPH0870870A; JP2946019B2; EP0704526A1; US5808030A; EP0704526B1; DE69519654D1; KR960010861A; ATE198218T1; DE69519654T2; CA2157531A1

Abstract

本发明提供了一种含有编码SEQ ID NO：1所示氨基酸序列的碱基序列的hTFIIIA基因，特别是含有SEQ ID NO：2所示的碱基序列的hTFIIIA基因。

该基因能表达相应的hTFIIIA蛋白质，该基因和蛋白质用作转录调控因子，在遗传疾病如癌症或由转录控制的反常引起的其他疾病的诊断或鉴定中，以及其作用机理的分析中有用。

Description

hTFIIA基团

本发明涉及编码人转录因子IIIA(下文称作hTFIIIA)。

自从1980年首次从非洲蟾蜍属(xenopus)卵母细胞中以转录因子的形式纯化出TFIIA后[Segall et al.，J.Biol.Chem.，255.11986-11991(1980)]，在Xenopus中进行了许多体内和体外研究以解释用所说的TFIIIA进行转录控制的机理[例如：Del etal.，Nucleic Acids Res.，19 6197-6203(1991)；Smith etal.，Nucleic Acids Res.，19，6871-6876(1991)；Liaoetal.，J.Mol.Biol.，223，857-871(1992)；Del et al.，J.Mol.Biol.，233，567-579(1993)]。

上述Xenopus TFIIIA对5S RNA基因转录的启动是必须的[Sakonji et al.，Cell，19，13-25(1980)]而且与5S基因的一个内部控制区域结合[Bogenhagen et al.，Cell，19，27-35(1980)]。

Xenopus TFIIIA cDNA的核苷酸序列和相应的氨基酸序列已被报道[Ginsberg et al.，Cell，39，479-489(1984)]。所说的基因编码9个锌指纹区(Cys₂His₂(C₂H₂)区域的重复)，该结构被当作一组DNA结合蛋白质所必须的区域[Miller et al.，EMBO J，4，1607-1614(1985)]。

已构建了一个酵母基因，它编码与xenopus TFIIIA同源的一种蛋白质，也有相同的C₂H₂区域[Archambault et al.，J.Biol.Chem.，267.3283-3288(1992)]。

进一步了解到，在人类，DNA结合转录因子，如人Wilms肿瘤基因WT1[Gessler et al.，Nature，343，774-778(1990)]，人转录阻遏物YY1[Shi et al.，Cell，67，377-388(1991)]，人MYC-相联性锌指纹蛋白maz[Bossone et al.，Proc.Natl.Acad.Sci.，USA，89，7452-7456(1992)]和SP1[kuwaharaet al.，Biolchem.，29，8627-8631(1990)]具有上述C₂H₂型指纹区。

与Xenopus TFIIIA相反，关于hTFIIIA所知甚少。1989，从Hela细胞中纯化出一种hTFIIIA样蛋白质(35K Da蛋白质)并显示出与人5S RNA基因相互作用[Seifart et al.，J.Biol.Chem.，264，1702-1709(1989)]。但还没有报道hTFIIIA编码基团。

因此，分离和提供一种hTFIIIA基因是本发明的目的。

本发明的另一目的在于揭示hTFIIIA基因的核苷酸序列及相应的氨基酸序列以便解释人转录机制并提供其用途。

由于他们深入研究的结果，本发明成功地分离出一种编码hTFIIIA的cDNA，测定了全部cDNA序列和相应的氨基酸序列，在各种组织中诱导了其表达并揭示了其在染色体上的位置。因此根据所得的发现，现已完成了本发明。

因此，本发明提供了编码一种氨基酸序列(由SEQ ID NO：1限定)的hTFIIIA。

在本说明书的下文中，用于氨基酸，肽，碱基序列，核酸等的缩写使用按IUPAC和IUB以及在“含碱基序列和/或氨基酸序列的附图说明书指标”(日本专利局编)中所推荐的或在相关领域通用的缩写形式。

本发明的hTFIIIA基因具有一个可译框架，其中包含1269个核苷酸(核酸)，它编码423个氨基酸残基，如下面SEQ ID NO：1所示，其特征为编码9个C₂H₂型锌指纹区。当与XenoDus TF IIIA基因比较时，它显示出在核酸方面有63％的同源性，在氨基酸方面有58％的同源性。

由本发明基因编码的hTFIIIA认为可发挥DNA结合蛋白质的生物学作用，所说的基因用途是作为一种转录调节因子。具体地说，本发明的基因一般在各种组织中表达，因此，在涉及维持生命和控制功能的5S核糖体RNA基因转录和维持其他基因的稳定转录中可能发挥着重要作用。

尤其最近逐渐了解到大量疾病伴随着转录控制的紊乱。例如，许多癌基因产物充当转录调节因子，其中的紊乱导致细胞的癌变。早幼粒细胞白血病，染色体转位导致转录控制的紊乱，随后引起癌变。调节因子Hox2.4的高水平表达诱导小鼠白血病。因此，现在已知在许多遗传疾病中有关蛋白质显示无异常，但其病理学机理涉及一种基因的异常，该基因涉及所说蛋白质之基因表达所需的转录控制。经研究这些基因的异常(DNA诊断等)。可以鉴定遗传疾病，其发病机理的分析还没有足够的进展。本发明的基因在该领域中是有用的。本发明的基因在使用一种反意DNA通过转录控制来进行的疾病治疗中或在分析其作用机理中也是有用的。

另外，TFIIIA涉及5S RNA的转录控制，因此，该转录控制的紊乱直接导致有关蛋白质合成的紊乱。许多表现为一种蛋白质数量异常的遗传疾病可能是由该蛋白质合成的紊乱所引起的。因此，本发明的基因预期在解释该疾病中也是有用的。

本发明的基因以单链DNA序列的形式来代表，如SEQ ID N0：2所示，因此在其范围内，本发明包括与该单链DNA序列互补的DNA序列以及两种都包含的成份。

下面SEQ ID NO：2所示的DNA序列和代表本发明的基因是分别编码根据下面SEQ ID NO：1所示的氨基酸序列的氨基酸残基之密码的结合的一个例子。当然，本发明的基因不限于此，还可以具有任一DNA碱基序列，该序列包含一些氨基酸残基各自密码子的其他任意结合而不改变上述氨基酸顺序。可按常规方式进行密码子的选择，例如考虑密码子在所用宿主中的使用频率[Nucl.AcidsRes.，9，43-74(1981)]。

本发明的基因还包含编码上述氨基酸序列的等效物的DNA序列，该等效物是经缺失和/或取代至少一个氨基酸或其部分氨基酸序列，或经增加至少一个氨基酸或氨基酸序列进行修饰得到的，并且有与hTFIIIA相似的生物学活性。这些等效物可以自发产生或经转录后修饰产生或还可以经使用定点突变技术[Kramer，W，etal.，Nucl.Acids Res.，12，9441(11984)；Kramer，W，andFrits，H.J.，Methods in Enzymology.154，350(1987)；zoller，M.J.and Smith，M.，Methods in Enzymology，100，468(1983)；Hirose，Susumu，Seikagaku Jikken Koza(Experimentsin Biochemistry)，2nd series，Vol.1，“Idenshi Kenkyu-ho(Methods in Genetic Studies)II”105]修饰天然基因(本发明的基因)，经使用化学合成技术如磷酸三酯法[Letsinger，R.L.and Ogilvie，K.K.，J.Am.Chem.Soc.，91，3350(1969)；Merrifield，R.B.，Science，150，.178(1968)]和磷酰胺方法[Beaucage，S.L.and Caruthers，M.H.，Tetrahedron Lett.，22，1859(1981)；McBride，L.J.andCaruthers.M.H.，Tetrahedron Lett.，24，245(1983)]，或以这些方法的组合来生产。

经使用本发明的基因，即例如将它插入一种微生物载体中并培养因此转化的微生物，这可以很容易引起hTFIIIA的大量表达并随后分离和提供所述的蛋白质。

根据本文所公开的本发明基因的序列资料。使用一般的遗传工程技术[例如，Sambrook，J.，Fritsch，E.F.，Maniatis，T.，Molecular Cloning，2nd edition，Cold Spring HarborLaboratory Press(1989)；Seikagaku Jikken Koza，2ndSeries，“Idenshi kenkyu-hoI，II，III”，edited byNippon Seikagaku-kai；Guide to Molecular CloninqTechniques，Berger，S.L.Kimmel，A.R.，Methods inEnzymology，Vol.152]，其他人可以很容易地生产本发明的基因。

例如，可以使用合适的探针或本发明基因的特异性抗体从人cDNA文库(从含编码hTFIIIA的基因合适的原始细胞中按常规方法制备)中挑选所需克隆来生产所说的基因[cf.e.g.Sugga，S.V.，et al.，Proc.Natl.Acad.Sci.，USA，78，6613(1981)；Young.R.A.，et al.，Science，222，778(1983)]。

用于上述程序的原始细胞的例子可以是所提到的各种细胞和组织，和其培养细胞，它们允许hTFIIIA基因的表达。从其中分离总RNA，按常规方法进行mRNA的分离和纯化，其转变成(合成)cDNA，cDNA的克隆以及其他步骤。另外，在本发明的实施中，cDNA文库可作为一种商品购买到。例如，该cDNA文库可以使用从Clontech买到的各种cDNA文库。

可按上面提到的常规方法从该cDNA文库中完成对本发明基因的筛选。作为筛选方法，可以被提及的有：例如，包含使用一种抗-hTFIIIA特异性抗体来抗cDNA产生的蛋白质，以Western印迹方式挑选出相应的cDNA克隆的方法；包含使用一种与目标DNA序列选择性结合的探钟的Southern印迹方法；Northern印迹方法，及其组合。一般来说，例如根据本发明基因的DNA序列资料化学合成的DNA序列在这里用作探针。当然，还可以使用已经获得的本发明基因或其片段作为探针。

在获得本发明基因的过程中，包含PCR技术[saiki，R.K.，et al.，Science，230，1350-1354(1985)]的DNA/RNA放大方法也能被成功地适用。特别在那些全长cDNA不能从文库中获得的例子中，可适合运用RAGE技术[cDNA末端的迅速放大；JikkenIgakn，12(6)，35-38(1994)]。在运用该PCR技术中所用的引物可根据本发明基因序列的资料来进行适当的设计，也可用共知的常规方法来合成。

放大的DNA/RNA片段可按上面提到的常规方式如经凝胶电泳进行分离和纯化。

按常规方式，例如以双脱氧法[Sanger.F.，et al，Proc.Natl.Acad.Sci.，USA，74，5463-5467(1977)]或Maxam-Gilbert法[Maxam.A.M.et a1.Methods in Enzymology，65，499(1980)]可测定本发明基因或其各种DNA片段中任意一种的碱基序列。该碱基序列的测定也可用以商品的形式可购买到的测序试剂盒或相似物很容易地测出。

因此获得了cDNA的全部DNA碱基序列，将它命名为克隆OTK7并作为本发明基因的一个例子，如下面SEQ ID NO：3所示。由所说cDNA编码的hTFIIIA氨基酸序列如下面SEQ ID NO：1所示。

根据本发明，提供了一种筛选hTFIIIA基因的方法，包括使用本发明基因的一部分作为探针。例如可使用一种任意引物DNA标记试剂盒(从Takara Shuzo，Amersham，等可买到)，利用任意引物DNA标记技术[Feinberg，A.P.，et al.，Anal.Biochem.，137266-267(1984)]标记此处的探针。例如可用噬菌斑杂交技术[Benton.W.，et al.，Science.196，383-394(1977)]筛选目标基因。

另外，按照一般基因重组技术[cf.e.g.Science，224，1431(1984)；Biochem.Biophys.Res.Comm.，130，692(1985)；Proc.Natl.Acad.Sci.，USA，80，5990(1983)]，以本发明的基因开始可获得重组的hTFIIIA种类。更具体地说，经构建重组DNA，允许本发明的基因在宿主细胞中表达，经转化将该DNA引入宿主细胞中并培养所得的转化细胞来生产所说的hTFIIIA种类。

所用的宿主细胞可以是真核细胞，也可以是原核细胞。至于脊椎动物细胞的表达载体，可使用的载体含有一个一般位于所表达的基因上游的启动子，一个RNA剪切位点，一个多聚腺苷化位点和一个转录终止序列，如果必要的话，可能还含有一个复制起点。至于真核微生物，一般常用的是酵母，其中，使用Saccharomyces属的酵母具有优势。对于真核微生物(如酵母)的表达载体，可使用例如具有一个酸性磷酸酶基因启动子的pAM82[A.Miyanoharaet al.，Proc.Natl.Acad.Sci.，USA，80，1-5(1983)]。至于原核宿主，一般常用的是Escherichia coli和Bacillussubtilis。在本发明的实施中，当使用该宿主时，需要使用一个表达质粒，以将本发明的基因插入一个质粒载体中来构建，该载体能以某种方式在所说的宿主中复制，对于提供的所说的表达质粒，在本发明基因的上游有一个启动子和SD(ShineandDalgarno)碱基序列，还有一个为蛋白质合成的启动所必需的起始密码子(例如ATG)，以使所说的基因得以表达。例如，Escherichia coli K12常用作上面提到的“Escherichia coli”宿主，pBR322常用作载体。然而，这并不限于使用各种共知的菌株和载体。例如：有用的启动子有：色氨酸(trp)启动子，lpp启动子，lac启动子，PL启动子，诸如此类。

使用本领域常用的各种方法将因此获得的所需重组DNA导入宿主细胞以进行其转化。所得的转化细胞以常规方法培养。培养导致以本发明基因编码的目的hTTIIIA的生产和积累。用于所说培养的培养基可根据所用的宿主细胞适当地选自各种常用培养基。在适于宿主细胞生长的条件下进行培养。

按上述方式，目的重组hTFIIIA蛋白质产生和积累或分泌到转化细胞的细胞内或细胞外。

利用其物理和/或化学和/或其他特征以各种分离程序分离和纯化重组hTFIIIA[cf.“Seikagaku(Biochemistry)DataBook”，pages 1175-1259，1st edition，1st printing.publishedJune 23，1980 by Tokyo Kagaku Dozin；Biochemistry.Vol，25，No.25，8274-8277(1986)；Eur.J.Biochem.，163，313-321(1987)]。具体地说，所说的过程包括各种常用方法如：重建处理，以一种蛋白质沉淀剂处理(盐析)，离心，渗压休克过程，超声处理，超滤作用、分子筛层析(凝胶过滤)，吸收色谱，离子交换色谱，亲合色谱，高效液相色谱(HPLC)，其他色谱技术，透析，及其组合。以上述方式，所需的重组hTFIIIA可按商品规模以较高产量容易地生产出来。

根据本发明，提供了一种hTFIIIA基因，使用所说基因可容易地大量生产hTFIIIA。本发明的基因和hTFIIIA作为转录调控因子是有用的，而且在其他方面，如癌症和由转录控制的紊乱所引起的其他遗传疾病的诊断和鉴定，经转录控制对该疾病的治疗，以及该控制作用机理的分析，也是十分有用的。

图1是显示了本发明的基因在各种组织中的表达的Northern印迹观察到的结果。

实施例

下面实施例是对本发明的进一步解释。实施例1(1)克隆和测序：

从人胎儿脑cDNA文库中任意选出的克隆之序列分析的结果表明：发现一个1.3kb的克隆与Xenopus TFIIIA具有高水平的同源性，命名为OTK7-1。序列分析揭示了本克隆缺少基因的5′部分。(2)5′RACE

使用商品试剂盒(5′-Ampli FINDER ^TM RACE试剂盒，Clontech)以5′RACE分离含基因5′部分的cDNA克隆。

在本例中，合成了3个与OTK7-1相应的引物，即H11-R(碱基序列如SEQ ID NO：4所示)，H11-E(序列如SEQ ID N0：5所示)和H11-H(序列如SEQ ID NO：6所示)以及一个与锚着引物(SEQ ID NO：8所示)互补的引物(AP-2；SEQ ID NO：7所示)。

用引物H-11R对300ng人脑poly A⁺ RNA(Clontech)进行反转录以合成单链cDNA。

因此，9μl poly A⁺RNA(300ng 19μl)和1μl引物H11-R(10微微摩尔1μl)在65℃下预保温5分钟，加入反应混合物[9.2μl)DEPC处理过的水/9μl 4X反转录酶缓冲液/1.6μl RNase抑制物(40单位/μl)/3.7μl dNTP混合物(每种核苷酸10mM)/0.5μlAMV反转录酶(25单位/μl)]，52℃下保温30分钟。加入10μl 0.5MEDTA终止反应，加入10μl 6N NaOH水解模板poly A⁺RNA，使用GENO-BIND^TM系统去掉过剩的引物H11-R。接着用乙醇沉淀，cDNA沉淀重悬于6μl H₂O中。

使用T₄ DNA连接酶将单链锚着寡聚核苷酸(锚着引物)与上述cDNA 3′端连接，按下面程序进行。

由2.5μl上述cDNA，2μl锚着引物(4微微摩尔)5μl 2×连接缓冲液，0.5μl T₄ DNA连接酶(20单位/μl)组成的混合物室温下温育18小时。

连接混合物稀释10倍用作PCR模板。

使用引物AP-2和H11-E对1.0μl锚着连接的cDNA稀释液进行PCR扩增，按下面程序进行。

所说的稀释物82℃维持1分钟，然后加入引物，进行35个PCR循环(每循环包含92℃维持0.5分钟。56℃ 0.5分钟和72℃ 1.0分钟)，接着72℃温育15分钟。PC产物克隆到p Bluescript SK(-)载体的EcoRV位点上。使用32P-ATP末端标记的寡聚H11-I经集落杂交筛选所需转化细胞。以二脱氧终止法[Sanger et al.，Proc.Natl.Acad.Sci.，USA，74，5463-5467(1977)]对阳性菌落进行序列测定。

所得的cDNA是本发明的基因，下文称作“OTK 7”。(3)Northern杂交：

使用人多种组织Northern印迹系统(Clontech)检测本发明的基因OTK7在各种组织中的表达。

印迹进行如下：在含50％甲酰胺，10×Denhardt′s溶液，5×SSPE，2％SDS和100μg/ml变性鱼精DNA的溶液中以[³²P]-标记的cDNA作为探针50℃预杂交4小时，接着杂交18小时。室温下洗涤印迹，用2×SSC/0.05％SDS经过10分钟洗涤3次，然后用0.1×SSC/0.1％SDS洗两次经过15分钟，在-80℃下放射自显影16小时。(4)染色体定位

以直接在R-荧光带上原位杂交的方式进行染色体定位[FISH；Takahashi et al.，Hum.Genet.，86，14-16(1990)和出处同上，88，119-121(1991)]。(5)结果：

a)OTK7基因的DNA序列和相应的氨基酸序列

OTK7 cDNA的核苷酸序列和相应的氨基酸序列如下SEQ IDNO：3所示。

关于SEQ ID NO：3.由第1289位到1291位碱基组成的序列是终止密码子(TAA)，含第317位到1096位碱基的序列与锌指纹区相对应，从第20位到22位碱基(ATG)是起始甲硫氨酸密码子，第1363位到1368位碱基(ATTAAA)构成多聚腺苷化信号。

OTK7 cDNA共含1399个碱基，包括一个编码423个氨基酸残基的1269碱基可译框架。

直到其编码序列3/4部分的5′端序列被研究，所说的cDNA与Xenopus TF IIIA相比，显示出63％的核苷酸同源性和58％的氨基酸同源性。

该hTFIIIA具有9个锌指纹区，其氨基酸序列与XenopusTFIIIA的C₂H₂指纹区高度一致。除了第6个指纹区在两半胱氨酸残基间只有3个氨基酸残基而不像Xenopus TFIIIA中有5个氨基酸残基。

在C端区域，两者的同源性不高。它们在N端区域的大小上也有区别。在Xenopus TFIIIA中其第一个指纹区上游有14个氨基酸残基，而hTFIIIA有99个氨基酸残基。hTFIIIA N端区域与现在已知的任一基因产物无同源性。

hTFIIIA与其他已知的DNA接合蛋白质的同源性局限在相当小的区域内，如下所述：

Xenopus 5S RNA结合蛋白质P43[Joho et al.，Cell，61，293-300(1990)]。在289个氨基酸残基中有37％相同；

人类Wilms肿瘤基因产物WT1[Gessler et al.，Nature，343，774-778(1990)]···在126个氨基酸残基中有35％相同；

人转录阻遏物YYA[Shi et al.，Cell 67，377-388(1991)]···在95个氨基酸残基中，40％相同；

人GT盒结合蛋白质[Kingsley et al.，MOl.Cell.Biol.，12，4251-4261(1992)]···在91个氨基酸残基中，44％相同；

人myc-相关性锌指纹区蛋白质[Bossone et al.，Proc.，Natl.Acad.Sci.，USA，89，7452-7456(1992)〕···在152个氨基酸残基中，37％相同。b)Northern印迹分析：

hTFIIIA在各种组织中的表达水平如图1所示。

在图1中，用1.1kbp cDNA作探针的上述试验(hTFIIIA表达)的结果在上排显示，用β-肌动蛋白探针以相同方式进行β-肌动蛋白m-RNA检测的相同印迹结果(对照)在下排显示。相应的泳道如下：

泳道1：心脏

泳道2：大脑

泳道3：胎盘

泳道4：肺

泳道5：肝脏

泳道6：骨胳肌

泳道7：肾脏

泳道8：胰腺

泳道9：脾脏

泳道10：胸腺

泳道11：前列脉

泳道12：精巢

泳道13：卵巢

泳道14：小肠

泳道15：结肠

泳道16：外周血白细胞

以Northern分析hTFIIIA转录物的大小估计大约为1400bp。这一大小与OTK7 cDNA几乎一致，因此，所说的cDNA可能覆盖hTTFIIIA mRNA的几乎全部序列。

该基因在所试验的所有人类组织中普遍表达，表达的水平在某些组织如胰腺，脾脏和外周血白细胞中比其他组织似乎要高。c)定位

hTFIIIA基因发现存在于染色体13q 12.3-13.1上

序列描述(2)SEQ ID NO：1：资料：(i)序列特征

(A)长度：423个氨基酸

(B)类型：氨基酸

(D)拓扑学：线型(ii)分子类型：蛋白质(xi)序列描述：SEQ ID NO：1：Met Arg Ser Ser Gly Ala Asp Ala Gly Arg Cys Leu Val Thr Ala Arg1 5 10 15Ala Pro Gly Ser Val Pro Ala Ser Arg Glu Gly Ser Ala Gly Ser Arg

20 25 30Gly Pro Gly Ala Arg Phe Pro Ala Arg Val Ser Ala Arg Gly Ser Ala

35 40 45Pro Gly Pro Gly Leu Gly Gly Ala Gly Ala Leu Asp Pro Pro Ala Val

50 55 60Val Ala Glu Ser Val Ser Ser Leu Thr Ile Ala Asp Ala Phe Ile Ala65 70 75 80Ala Gly Glu Ser Ser Ala Pro Thr Pro Pro Arg Pro Ala Leu Pro Arg

85 90 95Arg Phe Ile Cys Ser Phe Pro Asp Cys Ser Ala ASh Tyr Ser Lys Ala

100 105 110Trp Lys Leu Asp Ala His Leu Cys Lys His Thr Gly Glu Arg Pro Phe

115 120 125Val Cys Asp Tyr Glu Gly Cys Gly Lys Ala Phe Ile Arg Asp Tyr His

130 135 140Leu Ser Arg His Ile Leu Thr His Thr Gly Glu Lys Pro Phe Val Cys145 150 155 160Ala Ala Asn Gly Cys Asp Gln Lys Phe Asn Thr Lys Ser Asn Leu Lys

165 170 175Lys His Phe Glu Arg Lys His Glu Asn Gln Gln Lys Gln Tyr Ile Cys

180 185 190Ser Phe Glu Asp Cys Lys Lys Thr Phe Lys Lys His Gln Gln Met Lys

195 200 205Ile His Gln Cys Gln Asn Thr Asn Glu Pro Leu Phe Lys Cys Thr Gln

210 215 220Glu Gly Cys Gly Lys His Phe Ala Ser Pro Ser Lys Leu Lys Arg His225 230 235 240Ala Lys Ala His Glu Gly Tyr Val Cys Gln Lys Gly Cys Ser Phe Val

245 250 255Ala Lys Thr Trp Thr Glu Leu Leu Lys His Val Arg Glu Thr His Lys

260 265 270Glu Glu Ile Leu Cys Glu Val Cys Arg Lys Thr Phe Lys Arg Lys Asp

275 280 285Tyr Leu Lys Gln His Met Lys Thr His Ala Pro Glu Arg Asp Val Cys

290 295 300Arg Cys Pro Arg Glu Gly Cys Gly Arg Thr Tyr Thr Thr Val Phe Asn305 310 315 320Leu Gln Ser His Ile Leu Ser Phe His Glu Glu Ser Arg Pro Phe Val

325 330 335Cys Glu His Ala Gly Cys Gly Lys Thr Phe Ala Met Lys Gln Ser Leu

340 345 350Thr Arg His Ala Val Val His Asp Pro Asp Lys Lys Lys Met Lys Leu

355 360 365Lys Val Lys Lys Ser Arg Glu Lys Arg Glu Phe Gly Leu Ser Ser Gln

370 375 380Trp Ile Tyr Pro Pro Lys Arg Lys Gln Gly Gln Gly Leu Ser Leu Cys385 390 395 400Gln Asn Gly Glu Ser Pro Asn Cys Val Glu Asp Lys Met Leu Ser Thr

405 410 415Val Ala Val Leu Thr Leu Gly

420(2)SEQ ID NO：2：资料：(i)序列特征

(A)长度：1269个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线型(ii)分子类型：cDNA(xi)序列描述：SEQ ID NO：2：ATGCGCAGCA GCGGCGCCGA CGCGGGGCGG TGCCTGGTGA CCGCGCGCGC TCCCGGAAGT 60GTGCCGGCGT CGCGCGAAGG TTCAGCAGGG AGCCGTGGGC CGGGCGCGCG GTTCCCGGCA 120CGTGTCTCGG CACGTGGCAG CGCGCCTGGC CCTGGGCTTG GAGGCGCCGG CGCCCTGGAT 180CCGCCGGCCG TGGTCGCCGA GTCGGTGTCG TCCTTGACCA TCGCCGACGC GTTCATTGCA 240GCCGGCGAGA GCTCAGCTCC GACCCCGCCG CGCCCCGCGC TTCCCAGGAG GTTCATCTGC 300TCCTTCCCTG ACTGCAGCGC CAATTACAGC AAAGCCTGGA AGCTTGACGC GCACCTGTGC 360AAGCACACGG GGGAGAGACC ATTTGTTTGT GACTATGAAG GGTGTGGCAA GGCCTTCATC 420AGGGACTACC ATCTGAGCCG CCACATTCTG ACTCACACAG GAGAAAAGCC GTTTGTTTGT 480GCAGCCAATG GCTGTGATCA AAAATICAAC ACAAAATCAA ACTTGAAGAA ACATTTTGAA 540CGCAAACATG AAAATCAACA AAAACAATAT ATATGCAGTT TTGAAGACTG TAAGAAGACC 600TTTAAGAAAC ATCAGCAGAT GAAAATCCAT CAGTGCCAGA ATACCAATGA ACCTCTATTC 660AAGTGTACCC AGGAAGGATG TGGGAAACAC TTTGCATCAC CCAGCAAGCT GAAACGACAT 720GCCAAGGCCC ACGAGGGCTA TGTATGTCAA AAAGGATGTT CCTTTGTGGK AAAAACATGG 780ACGGAACTTC TGAAACATGT GAGAGAAACC CATAAAGAGG AAATACTATG TGAAGTATGC 840CGGAAAACAT TTAAACGCAA AGATTACCTT AAGCAACACA TGAAAACTCA TGCCCCAGAA 900AGGGATGTAT GTCGCTGTCC AAGAGAAGGC TGTGGAAGAA CCTATACAAC TGTGTTTAAT 960CTCCAAAGCC ATATCCTCTC CTTCCATGAG GAAAGCCGCC CTTTTGTGTG TGAACATGCT 1020GGCTGTGGCA AAACATTTGC AATGAAACAA AGTCTCACTA GGCATGCTGT TGTACATGAT 1080CCTGACAAGA AGAAAATGAA GCTCAAAGTC AAAAAATCTC GTGAAAAACG GGAGTTTGGC 1140CTCTCATCTC AGTGGATATA TCCTCCCAAA AGGAAACAAG GGCAAGGCTT ATCTTTGTGT 1200CAAAACGGAG AGTCACCCAA CTGTGTGGAA GACAAGATGC TCTCGACAGT TGCAGTACTT 1260ACCCTTGGC 1269(2)SEQ ID NO：3：资料：(i)序列特征

(A)长度：1399个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线型(ii)分子类型：cDNA(vii)直接来源：

(A)文库：人胚胎大脑cDNA

(B)克隆：OTK 7(ix)特征：

(A)名称/键：CDS

(B)位置：20..1288

(C)鉴定方法：S(xi)序列描述：SEQ ID NO：3：ATGCGCGATC TCCCGGAGC ATG CGC AGC AGC GGC GCC GAC GCG GGG CGG TGC 52

Met Arg Ser Ser Gly Ala Asp Ala Gly Arg Cys

1 5 10CTG GTG ACC GCG CGC GCT CCC GGA AGT GTG CCG GCG TCG CGC GAA GGT 100Leu Val Thr Ala Arg Ala Pro Gly Ser Val Pro Ala Ser Arg Glu Gly

15 20 25TCA GCA GGG AGC CGT GGG CCG GGC GCG CGG TTC CCG GCA CGT GTC TCG 148Ser Ala Gly Ser Arg Gly Pro Gly Ala Arg Phe Pro Ala Arg Val Ser

30 35 40GCA CGT GGC AGC GCG CCT GGC CCT GGG CTT GGA GGC GCC GGC GCC CTG 196Ala Arg Gly Ser Ala Pro Gly Pro Gly Leu Gly Gly Ala Gly Ala Leu

45 50 55GAT CCG CCG GCC GTG GTC GCC GAG TCG GTG TCG TCC TTG ACC ATC GCC 244Asp Pro Pro Ala Val Val Ala Glu Ser Val Ser Ser Leu Thr Ile Ala60 65 70 75GAC GCG TTC ATT GCA GCC GGC GAG AGC TCA GCT CCG ACC CCG CCG CGC 292Asp Ala Phe Ile Ala Ala Gly Glu Ser Ser Ala Pro Thr Pro Pro Arg

80 85 90CCC GCG CTT CCC AGG AGG TTC ATC TGC TCC TTC CCT GAC TGC AGC GCC 340Pro Ala Leu Pro Arg Arg Phe Ile Cys Ser Phe Pro Asp Cys Ser Ala

95 100 105AAT TAC AGC AAA GCC TGG AAG CTT GAC GCG CAC CTG TGC AAG CAC ACG 388Asn Tyr Ser Lys Ala Trp Lys Leu Asp Ala His Leu Cys Lys His Thr

110 115 120GGG GAG AGA CCA TTT GTT TGT GAC TAT GAA GGG TGT GGC AAG GCC TTC 436Gly Glu Arg Pro Phe Val Cys Asp Tyr Glu Gly Cys Gly Lys Ala Phe

125 130 135ATC AGG GAC TAC CAT CTG AGC CGC CAC ATT CTG ACT CAC ACA GGA GAA 484Ile Arg Asp Tyr His Leu Ser Arg His Ile Leu Thr His Thr Gly Glu140 145 150 155AAG CCG TTT GTT TGT GCA GCC AAT GGC TGT GAT CAA AAA TTC AAC ACA 532Lys Pro Phe Val Cys Ala Ala Asn Gly Cys Asp Gln Lys Phe Asn Thr

160 165 170AAA TCA AAC TTG AAG AAA CAT TTT GAA CGC AAA CAT GAA AAT CAA CAA 580Lys Ser Asn Leu Lys Lys His Phe Glu Arg Lys His Glu Asn Gln Gln

175 180 185AAA CAA TAT ATA TGC AGT TTT GAA GAC TGT AAG AAG ACC TTT AAG AAA 628Lys Gln Tyr Ile Cys Ser Phe Glu Asp Cys Lys Lys Thr Phe Lys Lys

190 195 200CAT CAG CAG ATG AAA ATC CAT CAG TGC CAG AAT ACC AAT GAA CCT CTA 676His Gln Gln Met Lys Ile His Gln Cys Gln Asn Thr Ash Glu Pro Leu

205 210 215TTC AAG TGT ACC CAG GAA GGA TGT GGG AAA CAC TTT GCA TCA CCC AGC 724Phe Lys Cys Thr Gln Glu Gly Cys Gly Lys His Phe Ala Ser Pro Ser220 225 230 235AAG CTG AAA CGA CAT GCC AAG GCC CAC GAG GGC TAT GTA TGT CAA AAA 772Lys Leu Lys Arg His Ala Lys Ala His Glu Gly Tyr Val Cys Gln Lys

240 245 250GGA TGT TCC TTT GTG GCA AAA ACA TGG ACG GAA CTT CTG AAA CAT GTG 820Gly Cys Ser Phe Val Ala Lys Thr Trp Thr Glu Leu Leu Lys His Val

255 260 265AGA GAA ACC CAT AAA GAG GAA ATA CTA TGT GAA GTA TGC CGG AAA ACA 868Arg Glu Thr His Lys Glu Glu Ile Leu Cys Glu Val Cys Arg Lys Thr

270 275 280TTT AAA CGC AAA GAT TAC CTT AAG CAA CAC ATG AAA ACT CAT GCC CCA 916Phe Lys Arg Lys Asp Tyr Leu Lys Gln His Met Lys Thr His Ala Pro

285 290 295GAA AGG GAT GTA TGT CGC TGT CCA AGA GAA GGC TGT GGA AGA ACC TAT 964Glu Arg Asp Val Cys Arg Cys Pro Arg Glu Gly Cys Gly Arg Thr Tyr300 305 310 315ACA ACT GTG TTT AAT CTC CAA AGC CAT ATC CTC TCC TTC CAT GAG GAA 1012Thr Thr Val Phe Asn Leu Gln Ser His Ile Leu Ser Phe His Glu Glu

320 325 330AGC CGC CCT TTT GTG TGT GAA CAT GCT GGC TGT GGC AAA ACA TTT GCA 1060Ser Arg Pro Phe Val Cys Glu His Ala Gly Cys Gly Lys Thr Phe Ala

335 340 345ATG AAA CAA AGT CTC ACT AGG CAT GCT GTT GTA CAT GAT CCT GAC AAG 1108Met Lys Gln Ser Leu Thr Arg His Ala Val Val His Asp Pro Asp Lys

350 355 360AAG AAA ATG AAG CTC AAA GTC AAA AAA TCT CGT GAA AAA CGG GAG TTT 1156Lys Lys Met Lys Leu Lys Val Lys Lys Ser Arg Glu Lys ArG Glu Phe

365 370 375GGC CTC TCA TCT CAG TGG ATA TAT CCT CCC AAA AGG AAA CAA GGG CAA 1204Gly Leu Ser Ser Gln Trp Ile Tyr Pro Pro Lys Arg Lys Gln Gly Gln380 385 390 395GGC TTA TCT TTG TGT CAA AAC GGA GAG TCA CCC AAC TGT GTG GAA GAC 1252Gly Leu Ser Leu Cys Gln Asn Gly Glu Ser Pro Asn Cys Val Glu Asp

400 405 410AAG ATG CTC TCG ACA GTT GCA GTA CTT ACC CTT GGC TAAGAACTGC 1298Lys Met Leu Ser Thr Val Ala Val Leu Thr Leu Gly

415 420ACTGCTTTGT TTAAAGGACT GCAGACCAAG GAGTCGAGCT TTCTCTCAGA GCATGCTTTT 1358CTTTATTAAA ATTACTGATG CAGAAAAAAA AAAAAAAAAA A 1399(2)SEQ ID NO：4：资料：(i)序列特征

(A)长度：16个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线型(ii)分子类型：cDNA

(xi)序列描述：SEQ ID NO：4：ATGGTCAAGG ACGACA 16(2)SEQ ID NO：5：资料：(i)序列特征

(A)长度：27个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线型(ii)分子类型：cDNA(xi)序列描述：SEQ ID NO：5：AATGAATTCA TAAGGACGAC ACCGACT 27(2)SEQ ID NO：6：资料：(i)序列特征

(A)长度：18个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线型(ii)分子类型：cDNA(xi)序列描述：SEQ ID NO：6：CCTCCAAGCC CAGGGCA 18(2)SEQ ID NO：7：资料：(i)序列特征

(A)长度：22个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线型(ii)分子类型：cDNA(xi)序列描述：SEQ ID NO：7：CAGAATCGAT AGTGAATTCG TG 22(2)SEQ ID NO：8：资料：(i)序列特征

(A)长度：35个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线型(ii)分子类型：cDNA(xi)序列描述：SEQ ID NO：8：CACGAATTCA CTATCGATTC TGGAACCTTC AGACC 35

Claims

1.一种人转录因子IIIA基因，它编码SEQ ID NO：1所示的氨基酸序列。