CN1257543A

CN1257543A - 人激素原转化酶4

Info

Publication number: CN1257543A
Application number: CN98805475A
Authority: CN
Inventors: S·罗克; S·R·加斯比斯
Original assignee: Zymogenetics Inc
Current assignee: Zymogenetics Inc
Priority date: 1997-05-06
Filing date: 1998-05-01
Publication date: 2000-06-21
Also published as: US6013503A; IL132495A0; NO995427D0; NO995427L; EP0980435A1; AU737127B2; US6100041A; BR9808718A; WO1998050560A1; CA2288675A1; PL336623A1; US6127162A; JP2001523112A; AU7174098A; HUP0001284A2; KR20010012280A

Abstract

本发明提供新型人激素原转化酶4的多核苷酸和多肽。编码人激素原转化酶4的多核苷酸位于19号染色体上,并可用于如鉴定与人类疾病状况相关的基因组区。本发明还包括生产这种蛋白质及其相应抗体的方法。

Description

人激素原转化酶4

发明背景

许多以前体形式合成的蛋白质和激素均经过高度特异性的、属于激素原转化酶家族的蛋白酶加工而成为成熟形式。这一哺乳动物内切蛋白酶家族在它们的底物多肽中二碱性氨基酸位点的羧基侧进行胞内切割。此激素原转化酶(PC)家族的成员均为与酵母二碱性氨基酸特异性内切蛋白酶Kex2相关的Ca⁺⁺依赖性丝氨酸蛋白酶(Smeekins，S.P.，Bio/Technology 11：182-186，1993)。而且其催化区的构成与细菌性的枯草杆菌蛋白酶相似。至少已发现6种哺乳动物激素原转化酶：PC2，PC3/PC1，PC4，PC5/6，弗林蛋白酶/成对碱性氨基酸切割酶(furin/PACE)和PACE4(Smeekins，S.P.，同出处，Seidah，N.G.等，Biochimie(France)76：197-209，1994)。

哺乳动物激素原转化酶作用于多种有生物学活性排列的前体分子。胰岛素原是第一个得到鉴定的底物前体。随后，从酵母到哺乳动物已发现超过150种底物；包括神经肽、肽激素、生长因子及其受体、血浆和凝固蛋白、逆转录病毒包膜蛋白和细胞毒素如碳疽。切割位点处包括碱性氨基酸，切割发生在成对的碱性残基处，通常在Lys-Arg或Arg-Arg之后，较少见在Arg-Lys或Lys-Lys之后(Smeekins，S.P.，同出处)。

激素原转化酶家族有组织特异性表达和细胞区室化性质，这可能与生物学功能有关。例如，PC1/3和PC2只在神经内分泌组织中表达。这些蛋白质的生物学活性局限在神经内分泌细胞中、特别是分泌颗粒中受调节的分泌途径上；且这两种蛋白质均在颗粒中前体如胰高血糖素原，阿黑皮素原(POMC)和胰岛素原的加工过程中有重要作用。故，其胞内定位和组织特异性看来反映了这些内切蛋白酶显示其生物学活性的所在部位。

PC4的基因表达有高特异性的组织选择性。PC4已从小鼠和大鼠中分离得到，且只表达于睾丸中。在小鼠体内，PC4基因表达发生在与精子发生第一阶段相应的妊娠第20天左右。在生殖细胞中发现有高水平的PC4m RNA表达，但在间质细胞(Leydig’s Cell)，足细胞(Sertoli’s Cell)或生精小管周围细胞(peritubular cell)中未有发现。原位杂交证实在粗线期精母细胞和圆精子细胞中有mRNA表达，但在延长的精子细胞中不表达(N.G.Seidah等，分子内分泌学，6：1559-1570，1992)。而且，在大鼠和小鼠中均发现三种PC4 mRNA；这些RNA可能是由于不同的剪接和/或外显子跳跃事件产生的。衍生自主要剪接形式或其它剪接形式的小鼠和大鼠PC4蛋白质的生物学功能尚不清楚。

精子发生是发生在生精小管(生殖细胞或称精细胞在此最终成熟为精子)中的连续过程。睾丸中产生的肽均为介导睾丸细胞相互作用的潜在旁分泌因子和自分泌因子。大部分已知的这些潜在肽底物均产生于间质细胞和足细胞这些非生殖细胞中。位于生精小管中的足细胞与生殖细胞接触，并可能直接产生影响生殖细胞成熟的睾丸特异性因子。影响生殖细胞的其它因子可能是旁分泌因子或内分泌因子；产生于生精小管外的这些分子中大多数由足细胞表达的转运和结合蛋白运送进生殖细胞微环境中。此外，能穿过细胞屏障并进入精子细胞微环境的旁分泌因子包括间质细胞分泌的分子。间质细胞位于生精小管之间存在的胞间隙内，产生好几种可能在成熟过程中很重要的因子，如睾酮，间质因子(Leydig factor)，IGF-1，抑制素和prohibin。这些因子及其它因子可能在精子发生周期中的某一确定阶段内特异作用。而且，与足细胞十分接近的生殖细胞中表达的某些肽激素是潜在的介导睾丸细胞相互作用的旁分泌因子和自分泌因子。例如阿片样肽，POMC和脑啡肽原均在生殖细胞中表达并可能会被加工。有趣的是，鼠脑啡肽原的mRNA表达与精子发生期间鼠PC4的mRNA表达形式相似(S.Torii，等，FEBS Let.316：12-16，1993)。鼠PC4的阶段特异性表达暗示它在加工睾丸的激素原因子的过程中有生物学作用。虽然推测PC4在精子发生中有作用，但PC4的功能实际上并不清楚。

因此要寻找人类同系物。本发明便利地提供了鼠PC4的人类同系物的分离。

发明概要

本发明提供了编码人激素原转化酶4多肽的分离多核苷酸，该多肽所含的一段氨基酸序列至少90％等同于选自下组的氨基酸序列：(a)SEQ ID No：2所示114位氨基酸(Ser)至443位氨基酸(Ala)的氨基酸序列；(b)SEQ ID No：2所示114位氨基酸(Ser)至755位氨基酸(Thr)的氨基酸序列；(c)SEQ ID No：2所示20位氨基酸(Arg)至755位氨基酸(Thr)的氨基酸序列；及(d)SEQ ID No：2所示1位氨基酸(Met)至755位氨基酸(Thr)的氨基酸序列。在另一个实施方案中，上文公开的分离的人激素原转化酶4多核苷酸选自下组：(a)SEQ ID No：1所示400位至1389位核苷酸的多核苷酸序列；(b)SEQ ID No：1所示400-2325位核苷酸的多核苷酸序列；(c)SEQ ID No：1所示118-2325位核苷酸的多核苷酸序列；及(d)SEQ ID No：1所示61-2325位核苷酸的多核苷酸序列。在另一个实施方案中，上文公开的分离的人激素原转化酶4多核苷酸包含SEQ ID No：3所示1-2265位核苷酸。在另一个实施方案中，上述分离的人激素原转化酶4多核苷酸编码的人激素原转化酶4多肽基本上由至少90％等同于SEQ ID No：2所示20位(Arg)-755位(Thr)氨基酸序列的氨基酸残基序列组成。在另一个实施方案中，上述分离的多核苷酸编码的人激素原转化酶4多肽基本上由SEQ IDNo：2所示20位(Arg)-755位(Thr)氨基酸残基的序列组成。

第二方面，本发明提供含有以下可操作连接在一起的元件的表达载体：转录启动子；编码至少90％等同于SEQ ID No：2中20位(Arg)-755位(Thr)所示氨基酸序列的激素原转化酶多肽的DNA区段；转录终止子。在另一实施方案中，上述表达载体进一步包含与该DNA区段可操作连接的分泌信号序列。

第三方面，本发明提供已导入上述表达载体的培养细胞，其中所述细胞表达该DNA区段编码的多肽。

另一方面，本发明提供编码融合蛋白的DNA构建体，该DNA构建体包含：至少90％等同于选自下组之氨基酸残基序列的多肽的第一DNA编码区段：(a)SEQ ID No：2中1位(Met)-21位(Pro)残基的氨基酸序列；(b)SEQ ID No：2中20位(Arg)至113位(Arg)残基的氨基酸序列；(c)SEQ ID No：2中114位(Ser)-443位(Ala)残基的氨基酸序列；(d)SEQ ID No：2中444位(Arg)-561位(Tyr)残基的氨基酸序列；(e)SEQ ID No：2中562位(Tyr)-755位(Thr)残基的氨基酸序列；(f)SEQ ID No：2中114位(Ser)-755位(Thr)残基的氨基酸序列；(g)SEQ ID No：2中20位(Arg)-755位(Thr)残基的氨基酸序列；以及另含编码额外多肽的至少一个其它DNA区段，其中该第一DNA区段和该其它DNA区段读框一致地连接，并编码融合蛋白。另一实施方案中，本发明提供由以下方法产生的融合蛋白：培养已导入了含有以下可操作连接在一起的元件的载体的宿主细胞：(a)转录启动子；(b)编码上述融合蛋白的DNA构建体；及(c)转录终止子；然后回收由该DNA区段编码的蛋白质。

另一方面，本发明提供分离的多肽，其所含的一段氨基酸序列至少90％等同于选自下组的氨基酸序列：(a)SEQ ID No：2中114位(Ser)-443位(Ala)氨基酸的氨基酸序列；(b)SEQ ID No：2中114位(Ser)-755位(Thr)的氨基酸序列；(c)SEQ ID No：2中20位(Arg)-755位(Thr)的氨基酸序列；及(d)SEQ ID No：2中1位(Met)至755位(Thr)的氨基酸序列。另一个实施方案中，上述分离的多肽基本上由至少90％等同于SEQ ID No：2中20位(Arg)-755位(Thr)之氨基酸序列的序列组成。另一实施方案中，上述分离的多肽就是SEQ ID No：2中20位(Arg)-755位(Thr)所示的氨基酸序列。

另一方面，本发明提供产生人激素原转化酶4多肽的方法，包括：培养上述细胞；分离由上述细胞产生的人激素原转化酶多肽。

另一方面，本发明提供测定人激素原转化酶4多肽的多肽激素原底物的方法，包括：培养已导入有上述表达载体的细胞，其中该细胞表达由该DNA区段编码的人激素原转化酶多肽，并同时表达检验底物激素原多肽；检测人激素原转化酶4切割该检验底物而产生的切割产物。另一实施方案中，测定人激素原转化酶4多肽的多肽激素原底物的方法包括：体外将权利要求11的激素原转化酶4多肽与检验底物多肽混合；检测因人激素原转化酶4多肽切割检验底物而产生的切割产物。

另一方面，本发明提供检测待检样品中有无人激素原转化酶多肽活性的调节子的方法，包括：在有或无待检样品的情况下培养已导入上述表达载体的细胞，其中该细胞表达由上述DNA区段编码的人激素原转化酶多肽，并同时表达已知的指示性激素原多肽底物；用生物学或生物化学方法比较有或没有待检样品时，因人激素原转化酶多肽切割底物而产生的切割产物水平；并通过比较确定检验样品中是否存在人激素原转化酶活性的调节子。

另一方面，本发明提供生产人激素原转化酶4多肽的抗体的方法，包括：用选自下组的多肽接种动物：(a)含9-755个氨基酸的多肽，其中该多肽至少90％等同于SEQ ID NO：2所示20位(Arg)-755位(Ser)序列中的一段连续序列；(b)上述多肽；(c)其序列至少90％等同于SEQ ID No：2中444位(Arg)至561位(Tyr)氨基酸的多肽；及(d)其氨基酸序列至少90％等同于SEQ ID No：2中562位(Tyr)氨基酸至755位(Thr)的多肽，其中该多肽在动物体内能激发免疫应答；然后从动物内分离抗体。另一实施方案中，上述方法产生的抗体可与人激素原转化酶4多肽结合。另一实施方案中，上述抗体为单克隆抗体。

另一方面，本发明提供可与上述多肽特异性结合的抗体。

本发明的这些及其它方面在参考了以下详细说明和附图之后将变得明显。

图的简述

此图是人PC1、人PC2、大鼠PC4、小鼠PC4、本发明的新型人PC4、小鼠弗林蛋白酶及人弗林蛋白酶的多重对比。

发明详述

详述本发明之前，确定以下术语可能将有助于理解本发明：

术语“亲和标记”表示一段多肽区段，它能附着于第二多肽，以便纯化或检测第二多肽，或使第二多肽可通过它提供的位点附着于底物上。原则上，有抗体或其它特异性结合因子可供使用的任何肽或蛋白质均可用作亲和标记。亲和标记包括多聚组氨酸段，蛋白A(Nilsson等，EMBO J.4：1075，1985；Nilsson等，酶学方法，198：3，1991)，谷胱苷肽S-转移酶(Smith和Johnson，基因67：31，1988)，Glu-Glu亲和标记(Grussenmeyer等，美国国家科学院院报82：7952-4，1985)，物质P，Flag^TM肽(Hopp等，生物技术学6：1204-1210，1988；可由Eastman Kodak公司，New Haven，CT提供)，链霉抗生物素蛋白结合肽，或其它抗原性表位或结合区。总见Ford等，蛋白质表达和纯化2：95-107，1991。编码亲和标记的DNA可由生产商(如PharmaciaBiotech，Piscataway，NJ)提供。

术语“等位变体”表示一个基因占据相同染色体位点的两种或多种可互换形式的任一种。等位变体通过突变自然产生，并可能导致种群内表型多样化。基因突变可以是沉默的(编码的多肽没有改变)，或可以编码有改变的氨基酸序列的多肽。术语等位变体此处也用于表示由基因的等位变体编码的蛋白质。

“氨基末端”和“羧基末端”用来表示多肽中的位置。在内容允许之处，这些术语用于表示参照某一多肽特定序列或部分的接近度或相对位置。例如，位于多肽中参照序列羧基端的某序列即是在参照序列羧基末端附近，但不必在完整多肽的羧基末端。

术语“切割产物”表示由激素原转化酶切割未加工的激素原多肽而产生的激素原多肽片段。

“互补物/反互补物对”表示在适当条件下形成非共价结合的稳定对的非相同部分。如，生物素和抗生物素蛋白(或链霉抗生物素蛋白)就是互补物/反互补物对的典型。其它互补物/反互补物对的例子有受体/配体对，抗体/抗原(或半抗原或表位)对，有义/反义多核苷酸对等等。在互补物/反互补物对需要随后解离之处，互补物/反互补物对优选结合亲和力小于10⁹M^-1。

“多核苷酸分子的互补物”是与参照序列相比有互补碱基序列并方向相反的多核苷酸分子。例如序列5’ATGCACGGG3’与5’CCCGTGCAT3’互补。

“简变核苷酸序列”表示含一个或多个简变密码子(与编码多肽的参照多核苷酸分子相比)的核苷酸序列。简变密码子包含不同的核苷酸三联体，但通常编码相同的氨基酸残基(即，GAU和GAC三联密码均编码Asp)。

“DNA构建体”为单或双链的线性或环状DNA分子，包含以自然界没有的方式结合和并列的DNA区段。DNA构建体是人为操作的结果，包括被操作分子的克隆及其它拷贝。

“DNA区段”是大DNA分子的有特定意义的部分。如编码特定多肽的DNA区段是更长DNA分子(如质粒或质粒片段)的一部分，当从5’至3’方向阅读时可编码特定多肽的氨基酸序列。

“表达载体”表示线性或环状DNA分子，其中有编码目的多肽的区段与提供其转录的其它区段可操作连接。这类其它区段包括启动子和终止子序列，还可能包括一个或多个复制起点，一个或多个选择标记，增强子，多聚腺苷酸化信号等。表达载体一般来源于质粒或病毒DNA，或可能有两者的元件。

“分离的”，当用于多核苷酸时，表示该多核苷酸已脱离其天然遗传环境，并因此不含其它无关或不需要的编码序列，并且是适于在基因工程性蛋白质生产系统中应用的形式。这类分离分子是那些与其天然环境分开的分子，包括cDNA和基因组克隆。本发明的分离DNA分子不含正常与之相关的其它基因，但可能包含天然存在的5’和3’非翻译区，如启动子和终止子等。相关区域的鉴定对本领域内的技术人员是显而易见的(见如，Dynan和Tijan，自然316：774-78，1985)。

“分离的”多肽或蛋白质是在不同于其天然环境的条件(如与血液和动物组织分开)下存在的多肽或蛋白质。优选地，分离多肽基本上不含其它多肽，尤其不含其他动物源性多肽。优选提供高度纯化形式的多肽，即大于95％纯，更优选地大于99％纯。应用于本文中时，术语“分离的”不排除相同多肽以其它物理形式存在，如二聚体或者糖基化的或衍生的形式。

“可操作地连接的”，当用于DNA区段时，表示各区段经安排能发挥预期功能，如在启动子内起始转录并延伸通过编码区段直至终止子。

“正同系物(ortholog)”表示得自一个物种的多肽或蛋白质为另一物种的多肽或蛋白质的功能相对物。正同系物之间的序列差异是物种形成的结果。

“副同系物(paralog)”是由一种生物体产生的相互区别但又结构相关的蛋白质。副同系物被认为是通过基因重复产生的。例如α-珠蛋白，β-珠蛋白和肌红蛋白互为副同系物。

“多核苷酸”为从5’末端读至3’末端的脱氧核糖核苷酸或核糖核苷酸碱基的单链或双链多聚体。多核苷酸包括RNA和DNA，可分离自天然来源，可体外合成，或结合天然分子与合成分子而制成。多核苷酸的大小表示为碱基对(缩写“bp”)，核苷酸(“nt”)，或千碱基(“kb”)。只要内容允许，后两个术语可描述单链或双链的多核苷酸。当用于指双链分子时，表示的是全长，应理解为等同于术语“碱基对”。本领域内技术人员将认识到双链多核苷酸的两条链长度可能稍有不同，其末端可能因酶切而成交错切口状；因而双链多核苷酸分子中的所有核苷酸不一定配对。这些未配对的末端长度一般不超过20nt。

“多肽”是天然产生的或合成的以肽键连接的氨基酸残基多聚体。不足约10个氨基酸残基的多肽通常称为“肽”。

“启动子”在此用其本领域公认的含义表示含有可结合RNA聚合酶并起始转录的DNA序列的基因部分。启动子序列常发现位于基因的5’非编码区，但并不总是这样。

“蛋白质”是包含一条或多条多肽链的大分子。蛋白质也可含非肽成分，如糖基。糖和其它非肽取代基可由产生该蛋白质的细胞加在蛋白质上，且在不同细胞类型中各不相同。蛋白质在本文以其氨基酸骨架结构限定；取代基如糖基通常不特别指明，但可存在。

“分泌信号序列”表示编码一种多肽(“分泌肽”)的DNA序列，该多肽作为较大多肽的一个成分，可指导该较大多肽穿过合成它的细胞的分泌途径。该较大多肽常在经分泌途径的转运期间被切除掉分泌肽。分泌信号序列将多肽导入细胞的分泌途径，但可能引导或不引导含该序列的多肽从细胞中真正分泌出来。

“剪接变体”表示由基因转录出来的的RNA的诸可互换形式。剪接变体一般通过利用转录RNA分子内(或较少情况下是分别转录的RNA分子之间)的可互换剪接位点而天然产生，并可由同一基因转录好几种mRNA。剪接变体可编码含不同氨基酸序列的多肽。术语剪接变体用在本文中还表示由基因转录出来的mRNA的剪接变体编码的蛋白质。

由不精确分析法(如凝胶电泳)测定的聚合体分子量和长度应理解为近似值。当这样一个值表示为“约”X或“近似”X时，X值应被理解为精确至±10％。

本文引用的所有文献均全文引入作为参考文献。

本发明部分基于一个新DNA序列的发现，该DNA序列编码同源于激素原转化酶家族(如小鼠和大鼠PC4，PC2，PC1，弗林蛋白酶)的蛋白质。该DNA序列命名为人激素原转化酶4，本文缩写为“人PC4”。分析对应于这种新cDNA的mRNA的组织分布发现，mRNA仅限于睾丸中表达。这种组织特异性表达说明它能够作为激素原转化酶起作用，完全或部分地加工生长或分化因子的激素原多肽，使之成为睾丸特异性和非睾丸细胞类型的成熟或活化形式。

哺乳动物激素原转化酶有共同的结构特征。总见Smeekins.S.P.，文献同上，和Seidah，N.，酶学方法(Methods in Enz.)，244：175-188，1995。所有这类分子均包含一个N-末端分泌肽，可指导该蛋白质进入分泌途径。该区后随有Homo-A区(似乎与蛋白酶折叠有关)。经自我催化去除Homo-A区是蛋白酶解活化必需的。Homo-A区之后是催化区(为活性所必需)。催化区的氨基酸序列与枯草杆菌蛋白酶催化区极其相似。紧邻催化区是Homo-B区(亦为酶活性所必需)。此区之外，在C末端，激素原转化酶出现结构多样化。C末端区的功能未知，但似乎与哺乳动物激素原转化酶的细胞和细胞器特异性定向有关。

本发明提供新型人激素原转化酶。对编码激素原转化酶的人cDNA(SEQ ID No：1)的分析揭示，其中有编码755个氨基酸(SEQ ID No：2)的一个开放读框，包含一段假定的分泌肽(见SEQ ID No：2的1位(Met)至19位(Val)残基)和一段成熟肽(见SEQ ID No：2的20位(Arg)至755位(Thr)残基)。如图所示，该成熟多肽与Kex2内切蛋白酶家族中包括大鼠和小鼠PC4，人弗林蛋白酶，人PC1和人PC2在内的其它成员有同源性。如上所述，该蛋白质家族的特征是有保守的枯草杆菌蛋白酶样催化区(见SEQ ID No：2的114位(Ser)至443位(Ala)残基)，该区氨基末端和羧基末端侧翼分别为不那么保守的Homo-A区(见，SEQ IDNo：2的20位(Arg)至113位(Arg)残基)和Homo-B区(见，SEQ ID No：2的444位(Arg)至561位(Tyr)残基)(Nakayama等，生物化学杂志(东京)，109：803-806，1991)。大鼠和小鼠PC4中的活性位点Asp，His和Ser残基以及对催化比较重要的残基Asn在人PC4中是保守的(见，SEQ ID No：2，残基Asp-158，His-198，Ser-372和Asn-300)。信号肽酶切割位点预计在人激素原转化酶比对中的19号残基(Val)之后。发现于所有已知哺乳动物激素原转化酶内的保守的Arg-Gly-Asp序列(见SEQ ID No：2的503-505号残基)存在于人PC4中(Nakayama，文献同上，及其中的参考文献)。预计人PC4合成为前体酶(酶原)，需在C末端侧自我催化切除Arg-Arg-Val-Lys-Arg(SEQID No：4；亦见SEQ ID No：2的109位(Arg)至113位(Arg)残基)序列才产生活性酶。Kex2和大鼠PC4中已发现有相似的酶原活化序列(Nakayama等，生物化学杂志(东京)，109：803-806，1991)。人PC4唯一的C末端区(见，SEQ ID No：2的562位(Tyr)至755位(Thr)残基)与弗林蛋白酶的序列高度相同。此区的功能可能涉及细胞和细胞器特异性定向。

位于如人PC4的枯草杆菌蛋白酶样催化区中高度保守的氨基酸可用作鉴定新家族成员的工具。例如，可用逆转录-聚合酶链式反应(RT-PCR)，从各种组织来源或细胞系的RNA扩增编码保守的枯草杆菌蛋白酶样催化区的序列。尤其，根据人PC4序列设计的高度简并引物可用于此目的。

本发明还提供编码本文所公开的人PC4多肽的多核苷酸分子(包括DNA和RNA分子)。本领域内技术人员易于认识到，由于遗传密码的简并性，这些多核苷酸分子之中可能有相当量的序列变异。SEQ ID No：3是包括所有编码SEQ ID No：2的人PC4多肽的DNA的简并DNA序列。本领域内技术人员将认识到，SEQ ID No：3的简并序列通过以T代替U也可提供所有编码SEQ ID No：2的RNA序列。因此，包含SEQ ID No：31-2265位核苷酸的编码人PC4多肽的多核苷酸及其RNA对应体均包括在本发明中。表1公开了SEQ ID No：3中用于表示简并核苷酸位置的单字母密码。“解析”为密码字母所表示的核苷酸。“互补物”表示互补核苷酸的密码。例如，密码Y表示C或T，它的互补物R表示A或G，A为T的互补，G为C的互补。

表1核苷酸解析核苷酸互补物A A T TC C G GG G C CT T A AR A|G Y C|TY C|T R A|GM A|C K G|TK G|T M A|CS C|G S C|GW A|T W A|TH A|C|T D A|G|TB C|G|T V A|C|GV A|C|G B C|G|TD A|G|T H A|C|TN A|C|G|T N A|C|G|T表2给出了SEQ ID NO：3中所用的简并密码子，包括一个给定氨基酸的所有可能密码子。表2氨基酸单字母密码子简并

密码子密码子Cys C TGC TGT TGYSer S AGC AGT TCA TCC TCG TCT WSNThr T ACA ACC ACG ACT ACNPro P CCA CCC CCG CCT CCNAla A GCA GCC GCG GCT GCNGly G GGA GGC GGG GGT GGNAsn N AAC AAT AAYAsp D GAC GAT GAYGlu E GAA GAG GARGln Q CAA CAG CARHis H CAC CAT CAYArg R AGA AGG CGA CGC CGG CGT MGNLys K AAA AAG AARMet M ATG ATGIle I ATA ATC ATT ATHLeu L CTA CTC CTG CTT TTA TTG YTNVal V GTA GTC GTG GTT GTNPhe F TTC TTT TTYTyr Y TAC TAT TAYTrp W TGG TGGTer . TAA TAG TGA TRRAsn|Asp B RAYGlu|Gln Z SARAny X NNN

本领域内技术人员将赞赏在确定编码每种氨基酸的所有可能密码子的简并密码子时导入某些模糊用法。例如，丝氨酸的简并密码子(WSN)有时可编码精氨酸(AGR)，精氨酸的简并密码子(MGN)有时编码丝氨酸(AGY)。相似的关系存在于编码苯丙氨酸和亮氨酸的密码子之间。故，简并序列包括的某些多核苷酸可编码氨基酸序列变体，而本领域内技术人员能轻易地参照SEQ ID No：2的氨基酸序列鉴别出这种变异序列。本文所述变体序列可易于检验其功能。

本领域内技术人员还能够理解不同物种可存在“偏爱密码子用法”。其可参见，Grantham，等，核酸研究，8：1893-912，1980；Haas，等，Curr.Biol.6：315-24，1996；Wain-Hobson，等，基因13：355-64，1981；Grosjean和Fiers，基因18：199-209，1982；Holm，核酸研究14：3075-87，1986；Ikemura，分子生物学杂志158：573-97，1982。本文所用术语“偏爱密码子用法”或“偏爱密码子”指在某一物种的细胞中使用最频繁的蛋白质翻译密码子，故优选编码每种氨基酸的可能密码子中的一个或几个代表(见表2)。例如，苏氨酸(Thr)可由ACA，ACC，ACG或ACT编码，但在哺乳动物细胞中ACC最为常用；在其它物种，如昆虫细胞，酵母，病毒或细菌中可能优选其它Thr密码子。某一特定物种的偏爱密码子可通过本领域内已知的各种方法导入本发明的多核苷酸。将偏爱密码子序列导入重组DNA能，例如，通过使蛋白质在特定细胞类型或物种中更有效地翻译而增加该蛋白质的产量。因此，SEQ ID No：3中公开的简并密码子序列可作为模板用于优化多核苷酸在本领域常用的和本文公开的各种细胞类型和物种中的表达。可检验并优化含偏爱密码子的序列在不同物种中的表达，并如本文所述检验功能。

在本发明的优选实施方案中，所分离的多核苷酸能在严紧条件下与SEQ ID No：1中的大小相似区，或与其互补序列杂交。通常所选严紧条件为在确定的离子强度和pH下比特定序列的解链温度(Tm)低约5℃。Tm为有50％靶序列与完全匹配的探针杂交上的温度(在确定的离子强度和pH下)。典型的严紧条件是其中NaCl浓度在pH7时高达约0.03M，温度至少约60℃。

如前文已述，本发明的分离的多核苷酸包括DNA和RNA。制备DNA和RNA的方法为本领域内熟知。通常，RNA分离自可生产大量人PC4 RNA的组织或细胞。这样的组织和细胞由Northern印迹鉴定(Thomas，美国国家科学院院报77：5201，1980)，包括睾丸组织及睾丸衍生的细胞系。总RNA的制备可以是用盐酸胍抽提再经CsCl梯度离心分离(Chirgwin等，生物化学18：52-94，1979)。poly(A)⁺RNA可用Aviv和Leder的方法从总RNA中制备(美国国家科学院院报69：1408-12，1972)。互补DNA(cDNA)可用已知方法从Poly(A)⁺RNA制备。或者，可分离基因组DNA。再经如杂交或PCR鉴定并分离编码人PC4多肽的多核苷酸。

编码人PC4的全长克隆可经经典克隆程序获得。优选互补DNA(cDNA)克隆，但有些应用中(如转基因动物中的表达)优选应用基因组克隆，或修饰cDNA克隆使其包含至少一个基因组内含子。制备cDNA和基因组克隆的方法为本领域内熟知并在本领域普通技术人员的水平范围之内，包括应用本文所公开的序列，或其部分去探测或引发一个文库。表达文库可用人PC4的抗体，受体片段，或其它特异性结合对应物探测。本发明还提供编码人激素原转化酶4的人基因组序列的分离。从SEQ ID No：1衍生的探针可用于筛选人源基因组文库以克隆人PC4的人基因组序列，方法按本领域已知的标准程序，及本文所公开的进行。

本领域内技术人员能意识到SEQ ID No：1公开的序列代表人PC4的一个等位基因，而预期还会有等位变异和其它剪接形式。该序列的等位变体可通过用标准程序对不同个体的cDNA或基因组文库进行探测而克隆。SEQ ID No：1所示DNA序列的等位变体，包括那些含沉默突变的、及那些突变导致了氨基酸序列变化的等位变体，均包含在本发明的范围内，同时包含的还有SEQ ID No：2的等位变体蛋白质。本发明还提供所述分离多核苷酸的mRNA剪接变体形式，它们可能是人激素原转化酶4的基因表达天然产生的结果。mRNA经另一种剪接产生的、保留了人PC4多肽特点的cDNA也包括在本发明的范围内，还包括由这些cDNA和mRNA编码的多肽。该序列的剪接变体可按标准程序对人cDNA文库，如人睾丸cDNA文库探查而克隆。

本发明还提供基本同源于SEQ ID No：2多肽的分离的人激素原转化酶4多肽及其正同系物。在一优选形式中，分离的多肽基本上不含其它多肽，特别是其它动物源多肽。优选提供高度纯化的多肽，即纯度超过95％，优选纯度超过99％。“基本同源”在本文指序列有至少85％相同于SEQ ID No：2的序列或SEQ ID No：2的剪接变体序列的多肽。这样的多肽将更优选至少90％、或最优选95％或更多相同于SEQ IDNo：2或SEQ ID No：2的剪接变体。序列相同性百分比用经典方法测定。见，如，Altschul等，Bull.Math.Bio.48：603-616，1986和Henikoff和Henikoff，美国国家科学院院报89：10915-10919，1992。简单说，将两个氨基酸序列一一对比，间隙开口罚10分，间隙延伸罚1分，以及示于表3的Henikff和Henikoff(文献同上)“blosum62”得分矩阵使一一对比的得分最佳化(表3中氨基酸均以标准的单字母代码表示)。表3

A R N D C Q E G H I L K M F P S T W Y V

A 4

R -1 5

N -2 0 6

D -2 -2 1 6

C 0 -3 -3 -3 9

Q -1 1 0 0 -3 5

E -1 0 0 2 -4 2 5

G 0 -2 0 -1 -3 -2 -2 6

H -2 0 1 -1 -3 0 0 -2 8

I -1 -3 -3 -3 -1 -3 -3 -4 -3 4

L -1 -2 -3 -4 -1 -2 -3 -4 -3 2 4

K -1 2 0 -1 -3 1 1 -2 -1 -3 -2 5

M -1 -1 -2 -3 -1 0 -2 -3 -2 1 2 -1 5

F -2 -3 -3 -3 -2 -3 -3 -3 -1 0 0 -3 0 6

P -1 -2 -2 -1 -3 -1 -1 -2 -2 -3 -3 -1 -2 -4 7

S 1 -1 1 0 -1 0 0 0 -1 -2 -2 0 -1 -2 -1 4

T 0 -1 0 -1 -1 -1 -1 -2 -2 -1 -1 -1 -1 -2 -1 1 5

W -3 -3 -4 -4 -2 -2 -3 -2 -2 -3 -2 -3 -1 1 -4 -3 -2 11

Y -2 -2 -2 -3 -2 -1 -2 -3 2 -1 -1 -2 -1 3 -3 -2 -2 2 7

V 0 -3 -3 -3 -1 -2 -2 -3 -3 3 1 -2 1 -1 -2 -2 0 -3 -1 4

最佳对比的相同性百分比计算如下：

多核苷酸分子间的序列相同性用相似的方法测定，用如上文所公开的比率表示。

人PC4多肽的变体或基本同源物均有一或多个氨基酸替代，缺失或增加。这些变化优选为微小特征的变化，即为保守型氨基酸替代(见表4)和其它不明显影响多肽的折叠或活性的替代；小缺失，通常为1至约30个氨基酸的缺失；氨基-或羧基-末端的小延伸，如氨基末端增加一个甲硫氨酸残基，或多达约20-25个残基的连接小肽，或一个亲和标记，如一个便于纯化的小延伸(如一个多组氨酸串，一个抗原性表位或一个结合区)。总见，Ford等，蛋白质表达和纯化2：95-107，1991。含亲和标记的多肽可进一步在人PC4多肽和该亲和标记之间包含一个蛋白酶切割位点。这样的切割位点包括，如，凝血酶切割位点和Xa因子切割位点。

表4

保守的氨基酸替换

碱性氨基酸：精氨酸

赖氨酸

组氨酸

酸性氨基酸：谷氨酸

天冬氨酸

极性氨基酸：谷氨酰胺

天冬酰胺

疏水氨基酸：亮氨酸

异亮氨酸

缬氨酸

芳香族氨基酸：苯丙氨酸

色氨酸

酪氨酸

小氨基酸：甘氨酸

丙氨酸

丝氨酸

苏氨酸

甲硫氨酸

本发明的蛋白质还包括非天然存在的氨基酸残基。它们有，但不限于，反式-3-甲基脯氨酸、2，4-甲醇基脯氨酸、顺式-4-羟脯氨酸、反式-4-羟脯氨酸、N-甲基甘氨酸、异-苏氨酸(allo-threonine)、甲基苏氨酸、羟乙基半胱氨酸、羟乙基高半胱氨酸、硝基谷氨酰胺、高谷氨酰胺、六氢吡啶羧酸、噻唑烷羧酸、脱氢脯氨酸、3-和4-甲基脯氨酸、3，3-二甲基脯氨酸、叔-亮氨酸、正缬氨酸、2-氮杂苯丙氨酸(2-azaphenylalanine)、3-氮杂苯丙氨酸、4-氮杂苯丙氨酸、和4-氟苯丙氨酸。本领域已知有很多方法可将非天然存在的氨基酸残基导入蛋白质。如可利用一个体外系统，其中无义突变均用化学氨酰化抑制子tRNA进行抑制。合成氨基酸和氨酰tRNA的方法为本领域内已知。含无义突变的质粒的转录和翻译在包含大肠杆菌S30提取物，商业化酶及其它试剂的无细胞体系中进行。蛋白质经层析纯化。见，如，Robertson等，美国化学协会杂志113：2722，1991；Ellman等，酶学方法.202：301，1991；Chung等，科学259：806-9，1993；及Chung等，美国国家科学院院报90：10145-9，1993)。在第二种方法中，翻译在非洲爪蟾卵母细胞中进行，方法是将突变的mRNA和化学氨酰化抑制子tRNA显微注射进该卵母细胞(Turcatti等，生物化学杂志，271：19991-8，1996)。第三个方法中，将大肠杆菌细胞在缺乏将被取代的天然氨基酸(如苯丙氨酸)而有所需非天然氨基酸(如2-氮杂苯丙氨酸，3-氮杂苯丙氨酸，4-氮杂苯丙氨酸，或4-氟苯丙氨酸)的情况下培养。这样，非天然氨基酸将代替其天然对应物而掺入蛋白质中。见，Koide等，生物化学33：7470-6，1994。天然氨基酸残基可用体外化学修饰法转换成非天然类型。化学修饰可结合定点诱变进行，以进一步扩大取代的范围(Wynn和Richards，蛋白质科学2：395-403，1993)。

可用有限量的非保守氨基酸、不由遗传密码编码的氨基酸、非天然氨基酸、和不正常氨基酸取代人PC4的氨基酸残基。

本发明多肽中的必需氨基酸可按本领域内已知的方法，如定点诱变或丙氨酸扫描诱变进行鉴定(Cunningham和Wells，科学244，1081-1085，1989；Bass等，美国国家科学院院报88：4498-502，1991)。在后一技术中，在分子中的每个残基处导入单个丙氨酸突变，如下文述检验所得突变分子的生物学活性，以鉴定对分子活性比较关键的氨基酸残基。亦见，Hilton等，生物化学杂志，271：4699-708，1996。人PC4催化区中与其底物作用的关键位点也可通过对用核酸磁共振技术，晶体学技术，电子衍射技术或光亲和标记技术确定的结构进行物理分析，结合假定接触位点氨基酸的突变而测定。见，如，De Vos等，科学255：306-12，1992；Smith等，分子生物学杂志224：899-904，1992；Wlodaver等，FEBS Lett.309：59-64，1992。必需氨基酸的同一性也可由本领域内技术人员经分析与相关激素原转化酶的同源性而推论。

可以由已知的诱变和筛选方法制备并检验多重氨基酸取代，如Reidhaar-Olson和Sauer所公开的方法(科学241：53-57，1988)或如Bowie和Sauer所公开的方法(美国国家科学院院报86：2152-2156，1989)。简单说，这些作者公开的方法是同时使多肽中的两个或多个位置随机化，选择功能性多肽，再测序经诱变的多肽，以确定每个位置的容许替代范围。其它可用的方法包括噬菌体展示(如Lowman等，生物化学30：10832-10837，1991；Ladner等，美国专利号5,223,409；Huse，WIPO公开WO 92/06204)和区域定向诱变(Derbyshire等，基因46：145，1986；Ner等，DNA7：127，1988)。

所公开的人PC4 DNA和多肽序列的变体可通过Stemmer，自然370：389-91，1994；Stemmer.美国国家科学院院报91：10747-51，1994；有WIPO公开WO97/20078所公开的DNA改组而产生。简单说，体外经亲代DNA随机片段化后用PCR重新组装而同源重组，产生随机导入的点突变，就产生了变体DNA。该技术可改用亲代DNA的一个家族，如等位变体或来自不同物种的DNA进行，以便在加工中导入另外的变异。对所需活性进行选择或筛选，再重复诱变过程并分析，可通过选出所需突变而同时选择去除不利变化而使序列进行快速“进化”。

本文所公开的诱变方法可结合高容量、自动化筛选方法，以检测宿主细胞中克隆的诱变多肽的活性。编码活性多肽(如切割已知多肽底物指示剂)的诱变DNA分子可从宿主细胞中回收，并用现代仪器快速测序。这些方法能够快速确定单个氨基酸残基在目的多肽中的重要性，并可用于未知结构的多肽。而且，这些诱变方法可用于加工蛋白质，如人激素原转化酶4，改变其反应动力学，缩小或扩大其底物特异性，改变多肽的组织和细胞定位。

本领域内技术人员可用上述方法制备基本同源于SEQ ID No：2的1-755位残基或其等位变体或其剪接变体并保留野生型蛋白质活性的各种多肽。

而且，用本领域内描述的方法，可将本发明人激素原转化酶4的各区域或结构域与其它已知或未知激素原转化酶蛋白质(如PC2和PC1)的各区结合，或与异源蛋白质结合，而构建出多肽融合体，或杂合的激素原转化酶蛋白质(Sambrook等，文献同上，Altschul等，文献同上，Picard，D.，Cur.Opin.Biology 5：511-515，1994，及其中的参考文献)。利用这些方法能够确定目的多肽中较大区的生物学重要性。这些杂合体改变了反应动力学，缩小或扩大了底物特异性，或改变了多肽的组织和细胞定位，并能应用于未知结构的多肽。

融合蛋白可用本领域内技术人员熟知的方法制备。按正确读框编码融合蛋白中每一成分的多核苷酸分子可用已知技术产生，并按本文所述方法表达。例如，本发明人PC4的生物学功能区的部分或全部可与另一种激素原转化酶(如PC2或PC1)的相应区互换。这样的区包含但不限于本文所述分子的分泌信号序列，Homo-A区，催化区，Homo-B区和C末端部分。可通过连接多核苷酸区段成为正确读框，产生编码融合蛋白好几个区的一个DNA多区段，而以此形式交换一个或几个区(如上述那些区)。产生这样的融合蛋白的方法为本领域内熟知(Sambrook等，同出处，Altschul等，同出处，Picard，D.，同出处)。这样的融合蛋白包含至少一个人PC4区，并预期有相同或类似于本发明的多肽或其他已知或未知激素原转化酶(如PC2和PC1)的生物学功能性质，这依赖于所构建的融合体。而且这样的融合蛋白可具有其它如上所述的特点。

对于任何人PC4多肽，包括变体和融合蛋白，本领域内技术人员均可用本文所公开的并示于上文表1和表2的资料轻易地产生编码该变体的一个完全简并性多核苷酸序列。

本发明的多肽，包括全长多肽、生物学活性片段及融合多肽，可按常规技术在经基因工程改造过的宿主细胞中产生。适当的宿主细胞是能用外源DNA转化或转染并生长于培养基中的那些细胞类型，包括细菌、真菌细胞及培养的较高等真核细胞。真核细胞，尤其是多细胞生物体的培养细胞较为优选。操作克隆化DNA分子并将外源DNA导入各类宿主细胞的技术均公开在Sambrook等，分子克隆：实验室手册，第二版，冷泉港实验室出版，冷泉港，NY，1989及Ausubel等编辑，分子生物学最新实验程序(Current Protocols in MolecularBiology)，John Wiley and Sons，公司，NY，1987)中。

通常，在表达载体内，编码人激素原转化酶4多肽的DNA序列与表达所需其它遗传元件可操作连接(一般包括转录启动子和终止子)。载体还常包含一或多个选择标记及一或多个复制起点，尽管本领域技术人员将认识到，某些系统中，选择标记可提供在另外的载体上，复制外源DNA可通过向宿主细胞基因组整合而完成。选择启动子，终止子，选择标记，载体和其它元件是本领域内普通技术人员的常规设计程序。很多这样的元件在文献中有述，并可由生产商提供。

为将人激素原转化酶4多肽导入宿主细胞的分泌途径，可在表达载体中提供分泌信号序列(也称前导序列，前原序列或前序列)。分泌信号序列可以是人激素原转化酶4多肽的序列，也可衍生自定向于分泌途径的另一蛋白质(如t-PA)，也可从头合成。分泌信号序列以正确阅读框架加入人激素原转化酶4 DNA序列中，其所处位置可引导新合成的多肽进入宿主细胞的分泌途径。分泌信号序列通常位于目的多肽编码DNA序列的5’端，不过某些分泌信号序列可位于目的DNA序列中的其它位置(见，如，Welch等，美国专利号5,037,743；Holland等，美国专利号5,143,830)。

或者，包含在本发明多肽中的分泌信号序列可用于引导其它多肽进入分泌途径。本发明提供这类融合多肽。信号融合多肽可制成其中编码SEQ ID No：2的1位(Met)至19位(Val)氨基酸残基的分泌信号序列可操作连接于编码另一多肽的DNA区段上，所用方法为本领域已知并为本文所公开。由此产生的本发明融合多肽中所包含的分泌肽优选在其氨基末端融合另一肽，以引导这另一肽进入分泌途径。这类构建体具有本领域内已知的多种用途。例如，这些新型分泌信号序列融合构建体可引导如通常不能彻底分泌的蛋白质的活性成分(如细胞表面受体)或其它非分泌蛋白质的分泌。这类融合体可体内或体外用于引导肽通过分泌途径。

培养的哺乳动物细胞为本发明的适宜宿主。将外源DNA导入哺乳动物宿主细胞的方法包括磷酸钙介导的转染(Wigler等，细胞14：725，1978；Corsaro和Pearson，体细胞遗传学7：603，1981；Graham和Van der Eb，病毒学52：456，1973)，电穿孔(Neumann等，EMBO J1：841-845，1982)，DEAE-葡聚糖介导的转染(Ausubel等，同出处)，及脂质体介导的转染(Hawley-Nelson等，Focus 15：73，1993；Ciccarone等，Focus 15：80，1993)，和病毒载体(Miller和Rosman，生物技术7：980-90，1989；Wang和Finer，医学自然(Nature Med.)2：714-6，1996)。培养的哺乳动物细胞中重组多肽的生产公开于，如，Levinson等的美国专利第4,713,339号；Hagen等的美国专利第4,784,950号；Palmiter等的美国专利第4,579,821号；及Ringold的美国专利第4,656,134号。适合的培养哺乳动物细胞包括COS-1(ATCC No.CRL 1650)，COS-7(ATCC No.CRL 1651)，BHK(ATCC No.CRL 1632)，BHK 570(ATCC No.CRL 10314)，293(ATCC No.CRL 1573；Graham等，普通病毒学杂志(J.Gen.Virol.)36：59-72，1977)及中国仓鼠卵巢(如CHO-K1；ATCC No CCL 61)细胞系。其它优选细胞系为培养的睾丸细胞，包括海豚DB1.Tes细胞(CRL-6258)；小鼠GC-1spg细胞(CRL-2053)；TM3细胞(CRL-1714)；TM4细胞(CRL-1715)；及猪ST细胞(CRL-1746)，可由美国典型培养物保藏中心，Rockyille，MD.提供。其它适合的细胞系为本领域内已知，可由公共保藏机构如美国典型培养物保藏中心，Rockyille，马里兰提供。通常优选强转录启动子，如SV-40或巨细胞病毒的启动子。见，如，美国专利号4,956,288。其它适合的启动子包括来自金属硫蛋白基因的启动子(美国专利号4,579,821和4,601,978)和腺病毒主要晚期启动子。

药物选择通常用于挑选其中已插入外源DNA的培养哺乳动物细胞。这类细胞通常称为“转染子”。在选择剂存在时培养的、并能将目的基因传给子代的细胞称为“稳定转染子”。优选的选择标记为新霉素抗性编码基因。选择在有新霉素型药物(如G-418等)存在时进行。选择系统还可用于增加目的基因的表达水平，该过程称为“扩增”。扩增的执行是通过在有低水平选择剂时培养转染子，然后增加选择剂的量，以选出产生导入基因的高水平产物的细胞。优选的可扩增选择标记为二氢叶酸还原酶基因，它能赋予对氨甲蝶呤的抗性。其它抗药基因(如潮霉素抗性，多药物抗性，嘌呤霉素乙酰转移酶)也可应用。会导入改变表型的其它标记，如绿荧光蛋白，或细胞表面蛋白(如CD4，CD8，MHCI类分子)，胎盘碱性磷酸酶均可通过FACS分选术或磁珠分离技术而用于从未转染细胞中选出转染细胞。

其它较高等真核细胞也可用作宿主，包括植物细胞，昆虫细胞和禽细胞。用发根农杆菌作载体在植物细胞中表达基因已由Sinkar等人综述(生物科学杂志(Bangalore)11：47-58，1987)。昆虫细胞的转化及其中外源多肽的生产已公开于Guarino等的美国专利号5,162,222和WIPO公开WO94/06463中。昆虫细胞可用杆状病毒重组体(通常衍生自苜蓿银纹夜蛾多核型多角体病毒(AcNPV)感染。见King，L.A.和Possee，R.D.，杆状病毒表达系统：实验室指南，伦敦，Chapman & Hall；O’Reilly，D.R.等，杆状病毒表达载体：实验室手册，纽约，牛津大学出版社，1994；以及，Richardson，C.D.，编辑，杆状病毒表达方案，分子生物学方法，Totowa，NJ，Humana出版社，1995。第二种制备重组人PC4杆状病毒的方法应用了基于转座子的系统，该系统述于Luckow，V.A，等，病毒学杂志67：4566-79，1993中。这一应用了转移载体的系统在Bac-to-Bac^TM试剂盒(Life Technologies，Rockville，MD)中有售。见Hill-Perkins，M.S.和Possee，R.D.，普通病毒学杂志71：971-6，1990；Bonning，B.C.等，普通病毒学杂志75：1551-6，1994；和，Chazenbalk，G.D.，和Rapoport，B.，生物化学杂志270：1543-9，1995。此外，转移载体可包含在人PC4多肽C-末端或N-末端融合一个表位标记(如Glu-Glu表位标记)的编码DNA的框内融合体(Grussenmeyer，T.等，美国国家科学院院报，82：7952-4，1985)。用本领域内已知技术，可将含人PC4的转移载体转化进大肠杆菌，并筛选出含有指示重组杆状病毒的间断Lac Z基因的杆粒。含重组杆状病毒基因组的杆粒DNA用常规技术分离，并用于转染草地夜蛾细胞(如Sf9细胞)。表达人PC4的重组病毒随后产生。经本领域内常用方法可制备重组病毒体贮存物。

重组病毒可用于感染宿主细胞，通常是衍生自秋粘虫(草地夜蛾)的细胞系。总见，Glick和Pasternak，分子生物技术：重组DNA的原理和应用，ASM出版社，华盛顿特区，1994。另一种适合的细胞系是High Five O^TM细胞系(Invitrogen)，它衍生自粉纹夜蛾(美国专利号5,300,435)。生产商提供的无血清培养基可用于培养和维持细胞。适合的培养基对sf9细胞为sf900II^TM(Life Technologies)或ESF921^TM(表达系统)；对粉纹夜蛾细胞为Ex-Cell O405^TM(JRHBiosciences，Lenexa，KS)或Express FiveOTM(LifeTechnologies)，。细胞的接种密度约2-5×10⁵个细胞，生长至细胞密度为1-2×10⁶个细胞时，以0.1至10(更通常为近3)的感染复数(MOI)加入重组病毒贮存物。所用程序常描述于实验室手册中(King，L.A.和Possee，R.D.，同出处；O’Reilly，D.R.等，同出处；Richardson，C.D.，同出处)。随后可用本文所述方法从上清纯化出人PC4多肽。

真菌细胞，包括酵母细胞，也可用于本发明。在这方面特别有用的酵母种包括酿酒酵母，巴斯德毕赤酵母，Pichia methanolica。用外源DNA转化酿酒酵母并从中生产重组多肽的方法公开在如Kawasaki的美国专利第4,599,311号；Kawasaki等的美国专利第4,931,373号；Brake的美国专利第4,870,008号；Welch等的美国专利第5,037,743号；Murray等的美国专利第4,845,075号。转化的细胞通过由选择标记(通常为耐药性或在缺乏某特殊营养物(如亮氨酸)时生长的能力)决定的表型进行挑选。可在酿酒酵母中使用的较优选载体系统为POT1载体系统，由Kawasaki等公开(美国专利号4,931,373)，它能使转化的细胞通过在含葡萄糖的培养基上生长而被选出。适用于酵母的启动子和终止子包括来自糖酵解酶基因的(见如Kawasaki的美国专利第4,599,311号；Kingsman等的美国专利第4,615,974号；及Bitter的美国专利第4,977,092号)和来自醇脱氢酶基因的那些。亦见美国专利第4,990,446；5,063,154；5,139,936和4,661,454号。适于其它酵母的转化系统为本领域已知，所述其它酵母包括多形汉逊酵母、粟酒裂殖酵母、乳酸克鲁维酵母、脆壁克鲁维酵母、玉蜀黍黑粉菌、巴斯德毕赤酵母、Pichia methanolica，季也蒙毕赤酵母和Candida maltosa。见如Gleeson等，普通微生物学杂志132：3459-3465，1986和Cregg，美国专利号4,882,279。曲霉细胞也可根据Mcknight等的美国专利第4,935,349号的方法应用。转化产黄枝顶孢(Acremonium chrysogenum)的方法述于Sumino等的美国专利第5,162,228号中。转化脉孢菌的方法述于Lambowitz的美国专利第4,486,533号中。

用Pichia methanolica作为宿主生产重组蛋白述于WIPO公开WO97/17450，WO 97/17451，WO98/02536，和WO 98/02565中。用于转化P.methanolica的DNA分子通常制成双链环状质粒，在转化之前优选先线性化。为了在P.methanolica中生产多肽，优选质粒中的启动子和终止子为P.methanolica基因的那些，如P.methanolica醇利用基因(AUG1或AUG2)。其它有用的启动子包括二羟基丙酮合成酶(DHAS)基因，甲酸脱氢酶(FMD)基因和过氧化氢酶(CAT)基因的启动子。为便于DNA向宿主染色体整合，优选质粒的完整表达片段两侧均为宿主DNA序列。优选用于P.methanolica的选择标记为P.methanolica ADE2基因，它编码磷酸核糖-5-氨基咪唑羧化酶(AIRC；EC 4.1.1.21)，此酶允许ade2宿主细胞在缺腺嘌呤时可以生长。为进行希望少用甲醇的大批量工业化生产，优选用其中两个甲醇利用基因(AUG1和AUGF2)均缺失的宿主细胞。为生产分泌型蛋白质，优选液泡蛋白酶基因(PEP4和PRB1)中有缺陷的宿主细胞。电穿孔用于促进含目的多肽编码DNA的质粒导入P.methanolica细胞。转化P.methanolica细胞优选用电穿孔方法，所用电场为指数级衰减的脉冲电场，电场强度从2.5-4.5kV/cm，优选约3.7SkV/cm，时间常数为1-40毫秒，最优选约20毫秒。将P.methanolica细胞培养于含适当碳源、氮源和微量营养物的培养基上，温度约25-35℃。液体培养物中用常规方法充分通气，方法如振荡小烧瓶或向发酵罐喷气。优选的P.methanolica培养基为YEPD(2％D-葡萄糖、2％Bacto^TM蛋白胨(Difco实验室，底特律，MI)，1％Bacto^TM酵母浸膏(Difco实验室)，0.004％腺嘌呤和0.006％L-亮氨酸)。

原核宿主细胞，包括大肠杆菌，芽孢杆菌属及其它属的菌株也可用作本发明的宿主细胞。转化这些宿主并表达克隆其中的外源DNA的技术为本领域内已知(见，如，Sambrook等，同出处)。当在细菌如大肠杆菌中表达人PC4多肽时，该多肽可保留在细胞质中(通常为不溶颗粒)，或可由细菌分泌序列引导至壁膜间隙中。在前一种情况中，将细胞裂解，回收颗粒并用如异硫氰酸胍或尿素变性。变性多肽再通过稀释变性剂而重新折叠和二聚体化，稀释方法如对尿素溶液透析和结合使用还原型和氧化型谷胱甘肽，然后对缓冲盐溶液透析。在后一种情况中，多肽可从壁膜间隙中以可溶性有功能形式回收，方法是破碎细胞(如超声处理或渗透休克)以释放壁膜间隙的内含物并回收蛋白质，这样一来可不必变性并再折叠。

转化的或转染的细胞根据常规程序培养于含有所选宿主细胞生长必需的营养物和其它成分的培养基中。多种适宜的培养基(包括已知成分培养基和复合培养基)均为本领域内已知，并通常包含碳源、氮源、必需氨基酸、维生素和矿物质。如有必要，培养基中还可包含生长因子或血清之类成分。生长培养基选择含外源加入的DNA的细胞通常通过，如，药物选择或由携于表达载体上或共转染入宿主细胞中的选择标记弥补必需营养物的缺陷进行。

优选将本发明多肽纯化至超过80％的纯度，更优选超过90％的纯度，甚至更优选超过95％的纯度，尤其优选药学上的纯度，即相对于杂质大分子，特别是其它蛋白质和核酸，纯度超过99.9％，且不含传染因子和致热因子。优选地，纯化多肽基本不含其它多肽，特别是其它动物源多肽。

根据本发明制备的人激素原转化酶4多肽用本领域内众所周知的方法纯化，这些方法如基于蛋白质的大小、电荷、溶解性和其它特征的亲和层析和分离。当蛋白质产生于培养的哺乳动物细胞中时，优选将细胞培养于不含血清的培养基中，以便减少杂质蛋白质的量。细胞经收获，裂解和分级分离。分级分离的优选方法包括亲和层析，Q-FastFlow Sepharose、Mono Q树脂、FPLC、苯基Sepharose、羟基磷灰石、MonoS和/或S-Sepharose。蛋白质也可用固相化亲和标记(如多组氨酸，基质P或有抗体或其它特异性结合因子可供应用的其它多肽或蛋白质)纯化。可在目的蛋白与亲和标记之间提供一个特异性切割位点。优选的亲和标记包括如多组氨酸串，利用它可在固相化镍上纯化融合蛋白(Houchuli等，Bio/Technol.6：1321-1325，1988)。也可构建多肽的截短形式(如缺跨膜区或分泌信号区)并用于更简便地纯化有催化活性的激素原转化酶(Nakayama，K.，酶学方法，244：167-175，1995)。原核表达系统中，麦芽糖结合蛋白(MBP)融合体可能是有利的亲和标记。若欲自宿主细胞的胞质或壁膜间隙回收蛋白质，则首先将细胞破碎，回收包含蛋白质在内的粗提物并进行进一步纯化。而且，人激素原多肽底物和它们的被本发明切割出的产物均可用本领域内众所周知的上述方法(稍作改动)纯化。例如，分泌的蛋白质(如切割产物)从细胞条件培养基中回收，优选在浓缩条件培养基之后回收。特殊的分级分离步骤的选择及其顺序安排部分基于所选宿主细胞类型及表达系统。本领域内的一般技术人员均可作出这些决定。特殊方法的选择是常规设计的问题，部分取决于所选支持物的特点。见，如，亲和层析：原理及方法，Pharmacia LKB Biotechnology，Uppsala，瑞典，1988。

本发明的多肽可利用它们的结构特点和生化特点进行分离。例如，可用固相化金属离子吸附(IMAC)层析来纯化富含组氨酸的蛋白质，包括那些带多组氨酸标记的蛋白质。简单说，凝胶先充以二价金属离子，形成螯合物(Sulkowski，生化动态3：1-7，1985)。富含组氨酸的蛋白质将以不同亲和力吸附于该基质上(取决于所用金属离子)，然后通过竞争性洗脱作用，降低pH，或用强螯合剂而洗脱。其它纯化方法包括用凝集素亲和层析和离子交换层析纯化糖基化的蛋白质(酶学方法，182卷，“蛋白质纯化指南”，M.Deutscher，(编)，Acad出版社，San Diego，1990，529-39页)。本发明另外的实施方案中，构建目的多肽与亲和标记(如麦芽糖结合蛋白，免疫球蛋白区)的融合体以有助于纯化。

人PC4多肽还可用于制备可特异性结合人PC4表位、肽或多肽的抗体。将人PC4多肽或其片段作为抗原(免疫原)接种至动物中，引起免疫应答。合适的抗原包括本文所公开的SEQ ID NO：2中的各种人PC4多肽区，或为SEQ ID No：2内9-755位的连续氨基酸片段。由该免疫应答产生的多克隆和单克隆抗体经分离并用本领域内已知方法纯化。见，如，免疫学最新实验程序(Current Protocols inImmunology)，Cooligan等(编)，National Institutes of Health，John Wiley & Sons公司，1995；Sambrook等，分子克隆：实验室手册，第二版，冷泉港，NY，1989；及Hurrell，J.G.R.，编，单克隆杂交瘤抗体：技术和应用，CRC出版公司，Boca Raton，FL，1982。

对本领域内技术人员而言，很显然的是，多克隆抗体可通过将人PC4多肽或其片段接种于各种不同的温血动物如马、牛、山羊、绵羊、狗、鸡、兔、小鼠和大鼠而制备。人PC4多肽的免疫原性可通过佐剂，如铝(氢氧化铝)或弗氏完全或不完全佐剂的应用而增强。可用于免疫的多肽还包括融合多肽，如人PC4或其部分与免疫球蛋白多肽或与麦芽糖结合蛋白的融合体。多肽免疫原可以是全长分子或其部分。若多肽部分为“半抗原样”，则该部分可加入或连接至大分子载体(如匙孔血蓝蛋白(KLH)，牛血清白蛋白(BSA)或破伤风类毒素)中以备免疫。

如本文所用，术语“抗体”包括多克隆抗体，亲和纯化的多克隆抗体，单克隆抗体及抗原结合片段，如F(ab’)₂和Fab’蛋白酶解片段。还包括基因改造的完整抗体或片段，如嵌合抗体，Fv片段，单链抗体等，及合成性抗原结合肽和多肽。非人抗体可通过将非人CDR移植在人抗体的框架区和恒定区上、或掺入完整的非人可变区(可选地通过取代暴露的残基而覆盖以人样表面，结果产生“镶盖”抗体)而人源化。在某些例子中，人源化抗体可在人可变区的框架区之内保留非人残基以增强正确的结合特性。通过抗体的人源化，可增加其生物学半衰期，并减少施用于人时产生不利免疫反应的潜能。

产生或选择本文可用抗体的其它技术包括使淋巴细胞体外暴露于人激素原转化酶4多肽或其衍生肽，选择噬菌体或类似载体中的抗体展示文库(如，通过用固相化的或标记的人PC4蛋白或肽)。带有潜在的人PC4多肽结合区的多肽编码基因可通过对展示于噬菌体(噬菌体展示)或展示于细菌(如大肠杆菌)上的随机肽文库进行筛选而获得。编码多肽的核苷酸序列可经多种方法获得，如通过随机诱变和随机多核苷酸合成。这些随机肽展示文库可用于筛选能与已知靶相互作用的肽，其中的靶可以是蛋白质或多肽，如配体或受体，生物学的或合成的大分子，或有机物或无机物。产生和筛选这类随机肽展示文库的技术为本领域内已知(Ladner等，美国专利号5,223,409；Ladner等，美国专利号4,946,778；Ladner等，美国专利号5,403,484和Ladner等，美国专利号5,571,698)，而随机肽展示文库及筛选这些库的试剂盒可从生产商处获得，如Clontech(Palo Alto，CA)，InvitrogenInc.(San Diego，CA)，New England Biolabs，Inc.(Beverly，MA)和Pharmacia LKB Biotechnology Inc.(Piscataway，NJ)。随机肽展示文库可用本文公开的人PC4序列筛选，以鉴定能结合人PC4的蛋白质。这些能与人PC4多肽相互作用的“结合蛋白”可用于标记细胞；用于经亲和纯化分离多肽同系物；它们可直接或间接偶联于药物、毒素、放射性核素等上。这些结合蛋白也可用于分析法如筛选表达文库和中和活性的分析法中。结合蛋白还可用于组织中多肽水平测定的诊断分析；用于作为潜在病理或疾病标志的多肽的检测或定量。这些结合蛋白还可发挥人PC4“拮抗物”的作用，在体外和体内封闭人PC4的切割活性。

抗体在以下情况下可确定为特异性结合：1)它们的结合活性有一个临界值；并且2)它们与相关多肽分子无明显交叉反应。首要的是，本文的抗体如果发生结合，只有当它们与人激素原转化酶4多肽、肽或表位结合的亲和力比与对照多肽(非人PC4)的结合亲和力大至少10倍时方为特异性结合。优选抗体的结合亲和力(Ka)达10⁶M^-1或更大，优选10⁷M^-1或更大，更优选10⁸M^-1或更大，最优选10⁹M^-1或更大。抗体的结合亲和力可轻易地由本领域内技术人员通过如Scatchard分析法测定(Scatchard，G.，纽约科学院年鉴(Ann.NY Acad.Sci)51：660-672，1949)。

其次，如果抗体不与相关多肽发生明显交叉反应，即可确定抗体为特异性结合。抗体不与相关的多肽分子发生明显交叉反应，例如，用它们通过标准的Western印迹分析(Ausubel等，同出处)可检测人PC4，但不能检测相关的多肽。已知相关多肽的实例有正同系物(如鼠PC4)，副同系物，如其它已知的人激素原转化酶(如PCl和PC2)，或突变的人PC4多肽，及非哺乳动物的激素原转化酶(如枯草杆菌蛋白酶或Kex2)。而且，抗体可用已知的相关多肽进行“筛选”，以分离能与本发明多肽特异性结合的类群。如人PC4的抗体可吸附在粘附于不溶性基质的相关多肽上；用正确的缓冲条件可使人PC4的特异性抗体流过基质。这样的筛选可分离对密切相关的多肽没有交叉反应性的多克隆和单克隆抗体(抗体：实验室手册，Harlow和Lane(编)，冷泉港实验室出版社，1988；免疫学最新实验程序，Cooligan等(编)，National Institutes of Heath，John Wiley and Sons公司，1995)。特异性抗体的筛选和分离为本领域内所知。见，基础免疫学(Fundamental Immunology)，Paul(编)，Raven出版社，1993；Getzoff等，免疫学进展43：1-98，1988；单克隆抗体：原理与实践，Goding，J.W.(编)，Academic Press Ltd.，1996；Benjamin等，免疫学年鉴2：67-101，1984。

本领域内技术人员已知的多项试验可用于检测和纯化能与人PC4蛋白或肽特异性结合的抗体。典型的分析方法详述于《抗体：实验室手册》，Harlow和Lane(编)，冷泉港实验室出版社，1988。这类分析方法的代表性实例包括：平行免疫电泳、放射免疫分析、放射免疫沉淀、酶联免疫吸附试验(ELISA)，点印迹或Western印迹试验、抑制或竞争试验，及夹心试验。

此外，可筛选出分别能结合野生型及突变型人PC4蛋白或多肽的抗体。人PC4的抗体可用于标记表达人PC4的细胞；用于经亲和纯化分离人PC4；用于体外或体内测定细胞和组织裂解物中人激素原转化酶4多肽水平的诊断分析；用于原位免疫定位以确定体内组织分布；用于检测或定量测定作为潜在病理学或疾病标志的人激素原转化酶4蛋白，用于应用流式细胞仪或FACS的分析方法中；用于筛选表达文库；用于产生抗独特型抗体；及作为中和抗体；或作为体外和体内封闭人PC4催化活性的拮抗剂。以这种方式应用抗体的方法为本领域内已知。适当的直接标记物包括放射性核素、酶、底物、辅因子、抑制物、荧光标记、化学发光标记、磁粒等；间接标记可能以应用生物素-抗生物素蛋白或其它互补物/反互补物对作中间体为特色。此处抗体也可直接或间接与药物、毒素、放射性核素等偶联，而这些偶联物可用于体内诊断或治疗。而且，可在体外利用人PC4或其片段的抗体，以在一些试验(如Western印迹或其它本领域内已知试验)中检测变性人PC4或其片段。

睾丸特异性加工酶(如人激素原转化酶4)参与对睾丸细胞表达的激素或结合蛋白的加工。故，如下所述，人激素原转化酶4可用于鉴别和测定睾丸激素原的生物学功能并鉴定新型激素原。人PC4可能在生育，和/或与精子发生相关的睾丸功能中发挥作用，最近有篇描述纯合型雄性PC4突变小鼠其生育力严重受损的论文(Mbikay，M.等，美国国家科学院院报94：6842-6846，1997)支持了这一假设。而且，作者在这些突变小鼠中未观察到明显的精子发生异常，而由这些精子发育成的受精卵不能生长至胚泡期，暗示人PC4不仅在受精中起作用，而且在早期胚胎发育中也起作用。

本发明的蛋白质可用于加工或部分加工已知或未知的激素原多肽，使之成为成熟或有生物学活性的形式，从而可以例如刺激睾丸细胞的增殖或分化。而且，本发明的蛋白质，其拮抗剂和兴奋剂可在雄性生育力中起作用。为检验人PC4是否作用于底物，可在表达人PC4的相同细胞中共表达潜在的激素原多肽底物，或体外与人PC4混合。构建这样一个细胞或体外混合蛋白的方法为本领域内已知并示于此。若人PC4对潜在激素原底物有作用，则会产生切割产物。本发明蛋白质的活性可通过分析与被激素原转化酶4切割的激素原前体多肽切割产物相关的生物学活性而测量。此外，若切割产物的生物学活性无法测量，则可利用其它方法，如Western印迹来测定人PC4是否切割了底物激素原。

本发明的多肽可用于测定人激素原转化酶4的多肽激素原底物。应用本领域内已知的方法，可培养已导入表达人激素原转化酶4成熟形式并且还表达检验底物激素原多肽的表达载体的细胞。人激素原转化酶4切割检验底物产生的切割产物可用本文所述生物学或生物化学试验测定。而且，这种检测人激素原转化酶4多肽的多肽激素原底物的方法可在体外应用。分离或纯化的人PC4多肽或表达人PC4的细胞的裂解物可在体外与诸如检验底物激素原多肽或包含一个二碱性切割位点的合成多肽这样的检验底物多肽混合。人PC4多肽切割检验底物激素原多肽产生的切割产物可用本文所述生物学或生物化学试验检测。

多种试验可用于测定切割产物的生物学活性。例如，可用培养的睾丸细胞或对适当的动物模型体内施用由本发明多肽切割或加工的激素原分子而测定增殖和分化。培养的睾丸细胞包括海豚DB1.Tes细胞(CRL-6258)；小鼠GC-1 spg细胞(CRL-2053)；TM3细胞(CRL-1714)；TM4细胞(CRL-1715)；及猪ST细胞(CRL-1746)，均可由美国典型培养物保藏中心，Rockville，MD提供。测量细胞增殖或分化的方法为本领域内熟知。如，测量增殖的方法包括对中性红染料的化学敏感性(chemosensitivity)试验(Cavanaugh等，InvestigationalNew Drugs 8：347-354，1990)，放射标记核苷酸掺入法(Cook等，分析生物化学(Analytical Biochem.)179：1-7，1989)，增殖细胞DNA中5-溴-2’-脱氧尿苷(BrdU)掺入法(Porstmann等，免疫学方法杂志82：169-179，1985)，及四唑鎓盐的应用(Mosmann，免疫学方法杂志65：55-63，1983；Alley等，癌症研究48：589-601，1988；Marshall等，生长调控(Growth Reg)，5：69-84，1995；及Scudiero等，癌症研究48：4827-4833，1988)。测定分化的方法包括，如测定与组织的阶段特异性表达、酶活性、功能活性或形态学改变相关的细胞表面标记(Watt，FASEB，5：281-284，1991；Francis，分化57：63-75，1994；Raes，Adv.Anim.Cell Biol.Technol.Bioprocesses，161-171，ESACT，第九次会议，1989)。

评估人PC4对睾丸多肽因子的作用的体内试验为本领域内熟知。如，切割产物可在特定时间段行腹膜内注射。处理阶段过后，杀死动物，取出睾丸称重。匀浆睾丸并进行精子头计数(Meistrich等，实验细胞研究(Exp.Cell Res.)99：72-78，1976)。

可能与本发明蛋白质加工的多肽切割产物相关的其它活性，如趋化活性也可进行分析。如精子发生的晚期因子可能参与精子-受精卵相互作用及精子游动。评估这类活性的试验为已知(Fuchs，ZentralblGynakol 11：117-120，1993；Neurwinger等，Andrologia 22：335-339，1990；Harris等，Human Reprod.(人类生殖)3：856-860，1988；及Jockenhovel，Andrologica 22：171-178，1990)。

此外，标准生化分析技术(如Western印迹)可用于检测人PC4加工未知活性的底物激素原而产生的切割产物(Sambrook等，同出处，及Ausubel，等，同出处)。应用这样的方法，表达人PC4和检验激素原底物的细胞分泌的切割产物可通过分析从细胞收集到的培养物而测定。

本发明的蛋白质还可用于在细胞上进行的对人PC4调节子的筛选中。调节子(如拮抗剂和兴奋剂)可以好几种方式影响激素原转化酶，如影响催化活性、基因表达、或与底物多肽的相互作用。这类拮抗剂和兴奋剂可分别通过减弱或增强人PC4的切割活性而影响本发明之激素原转化酶。该增强或减弱可通过评估人PC4所作用的激素原的切割产物而测定。在该应用中，在表达人PC4的同一细胞中表达已知可被本发明之多肽切割的指示性激素原底物。构建这种细胞的方法为本领域内已知并公开于此。优选的指示性激素原多肽被激素原转化酶切割后从细胞中分泌出来，并具有与切割产物相关的易于测定的生物学活性。这样的活性试验实例已公开于上文中。通过与各种下文讨论的试剂接触后筛选细胞所分泌的切割产物而鉴定拮抗剂和兴奋剂。对指示性底物加工中的变化反映了相对于未接受试剂的对照细胞，试剂对本发明之人PC4蛋白的增强或抑制激素原转化酶的活性。如相对于对照，增强人PC4活性的兴奋剂将导致切割增加，因而由指示剂底物产生更多有生物学活性的切割产物。相反，相对于对照，减弱人PC4活性的拮抗剂将导致切割减少，从而由指示性底物产生较少的或可能不产生有生物学活性的切割产物。可调节人PC4，并可在检验样品中评估或利用的试剂的来源包括，但不限于任何天然来源或化学来源，包括但不限于植物、微生物和真菌提取物、化学文库，及组合化学文库。建立并应用这类基于细胞的筛选试验的方法为本领域内已知。

这类基于细胞的筛选可用于检测检验样品中有无人激素原转化酶多肽活性调节子。表达成熟人PC4蛋白并表达已知的指示性激素原多肽底物的细胞可在有或无检验样品时培养。构建这样一个细胞可通过本领域已知并述于此的方法进行。例如，可将指导成熟人PC4蛋白表达的表达载体和指导已知指示性激素原多肽底物表达的表达载体导入相同细胞中。无检验样品的细胞可作对照，与有检验样品时的分子活性进行对比。用生物学或生物化学试验可比较有和无检验样品时由人PC4切割底物产生的切割产物的水平。通过这种比较，可如上述说明检验样品中有无人激素原转化酶活性的调节子。

本发明的多肽还可用于检测人19号染色体上与疾病或其它人类特征相关的异常。本发明之多核苷酸位于人19号染色体的19p13.3区。激素原转化酶基因位点处可检测的染色体畸变包括但不限于非整倍性、基因拷贝数改变、插入、缺失、限制性位点改变和重排。这些畸变可用本发明之多核苷酸应用分子遗传学技术(如限制性片段长度多态性(RFLP)分析、应用PCR的短串联重复序列(STR)分析，及本领域内已知的其它遗传学连锁分析技术)进行检测(Sambrook等，同出处；Ausubel等，同出处；Marian，A.J.，Chest 108：255-265，1995)。

本发明还包括诊断用试剂。如人PC4基因，含人PC4 DNA或RNA或其亚序列(Subsequence)的探针，可用于测定人PC4基因是否存在于19号染色体上或是否有突变发生。人PC4基因位点处的可检测性染色体畸变包括，但不限于非整倍体、基因拷贝数改变、插入、缺失、限制位点改变和重排。这些畸变可发生在编码序列内，内含子内，或侧翼序列内(包括上游启动子和调节区)，并可证实为编码序列中的物理学改变或基因表达水平的改变。分析性探针通常至少20个核苷酸长，有时可用较短的探针(14-17个核苷酸)。PCR引物至少5个核苷酸长，优选15或更多个核苷酸，更优选20-30个核苷酸。当将分析基因的较小区时，可用短的多核苷酸。粗略分析基因时，多核苷酸探针可包含一个完整外显子或更多。探针通常包含与信号产生部分如放射标记的核苷酸连接的多核苷酸。这些诊断方法一般包含以下步骤：(a)获得一个病人的遗传学样品；(b)在多核苷酸能与互补的多核苷酸序列杂交产生第一反应产物的条件下，将遗传学样品与上述多核苷酸探针或引物一起温育；及(c)将第一反应产物与对照反应产物比较。第一反应产物与对照反应产物的差异可指示病人的遗传学异常。本发明中可应用的遗传学样品包括基因组DNA，cDNA和RNA。多核苷酸探针或引物可以是RNA或DNA，并包含SEQ ID No：1的一部分，SEQ ID No：1的互补物，或其RNA等价物。关于这一点的合适分析方法包括本领域内已知的分子遗传学技术，如限制性片段长度多态性(RFLP)分析、应用PCR技术的短串联重复序列(STR)分析、连接链反应(Barany，PCR方法及应用，1：5-16，1991)，核糖核酸酶保护试验，及本领域内已知的其它遗传学连锁分析技术(Sambrook等，同出处；Ausubel等，同出处；A.J.Marian，同出处，1995)。核糖核酸酶保护试验(见，如，Ausubel等，同出处，第4章)包含RNA探针与病人RNA样品的杂交，然后使反应产物(RNA-RNA杂交体)暴露于RNase。RNA的已杂交区受到保护而不被消化。PCR试验中，将病人的遗传学样品与一对多核苷酸引物共同温育，扩增引物之间的区域并回收。回收产物的大小或量的变化可指示病人的突变。另一个可应用的基于PCR的技术是单链构象多态性(SSCP)分析(Hayashi，PCR方法及应用1：34-38，1991)。

实施例

实施例1

人激素原转化酶4的克隆A.摘要

用鼠PC4 cDNA探针筛选人睾丸cDNA文库，揭示一段分离的cDNA(克隆pSLHPC4-5)与鼠PC4 cDNA同源。该cDNA编码人激素原转化酶4(人PC4)。B.人睾丸cDNA文库的制备

通过筛选λZAPII(Stratagene，La Jolla，CA)人睾丸cDNA文库获得全长人PC4 cDNA。睾丸cDNA文库的构建如下：

第一链cDNA反应包含15μl浓度为1.0μg/μl的人睾丸双polyd(T)选择的poly(A)⁺mRNA(Clontech Laboratories)和3μl20pmole/μl包含一个XhoI限制性位点的第一链引物ZC6091(SEQ IDNo：5)。该混合物加热至70℃4分钟，在冰上冷却。向RNA-引物混合物中加入12μl第一链缓冲液(5X SUPERSCRIPT^TM缓冲液；LifeTechnologies，Gaithersburg，MD)，6μl 100mM的二硫苏糖醇，及3μl含dTTP，dATP，dGTP和5-甲基-dCTP各10mM的脱氧核苷三磷酸溶液(Pharmacia LKB Biotechnology，Piscataway，NJ)而启动第一链cDNA合成。反应混和物37℃温育2分钟，然后加入15μl 200U/μl RNase H^-逆转录酶(SUPERSCRIPT II；Life Technologies)。第一链合成效率在平行反应中通过向取自反应混合物之一以用于标记反应进行分析的5μl等份中加入5μCi ³²P-αdCTP进行分析。反应于37℃温育10分钟，45℃1小时，然后50℃10分钟。标记反应中未掺入的³²P-αdCTP在400孔大小的凝胶过滤柱(Clontech Laboratories)上经层析去除。未标记的第一链反应物中未掺入的核苷酸和引物在400孔大小的凝胶过滤柱(Clontech Laboratories)上经层析去除。标记的第一链cDNA长度经琼脂糖凝胶电泳测定。

第二链反应包含120μl未标记的第一链cDNA，36μl 5X聚合酶I缓冲液(125mM Tris-HCl，pH7.5，500mM KCl，25mM MgCl₂，50mM(NH₄)₂SO₄)，2.4μl 100mM二硫苏糖醇，3.6μl含每种脱氧核苷三磷酸各10mM的溶液，6μl 5mMβ-NAD，3.6μl 3μ/μl大肠杆菌DNA连接酶(New England Biolabs；Beverly，MA)，9μl 10U/μl大肠杆菌DNA聚合酶I(New England Biolabs)，及1.8μl 2U/μlRNase H(Life Technologies)。其中一份10μl的第二链合成反应经加入10μCi ³²P-αdCTP而标记，以监控第二链合成效率。反应于16℃温育2小时，然后加15μl T4 DNA聚合酶(10U/μl，BoerhingerMannheim，Indianapolis，IN)并再于16℃温育5分钟。在琼脂糖凝胶电泳分析之前，经400孔大小的凝胶过滤柱(Clontech Laboratories)层析去除标记反应中未掺入的³²P-αdCTP。加入20μl 0.5EDTA，并用苯酚/氯仿和氯仿抽提，然后在有2.5M醋酸铵和4μg糖原载体时用乙醇沉淀而使反应终止。由15μg起始mRNA模板产生的cDNA约接近3μg。

将EcoRI衔接子连接在上述cDNA的5’末端，以便能克隆进入表达载体。10μl等份的cDNA(约1.5μg)和5μl 65pmole/μl EcoRI衔接于(Pharmacia LKB Biotechnology公司)与2μl 10X连接酶缓冲液(660mM Tris-HCl pH7.5，100mM MgCl₂)，2μl 10mM ATP和1μl 15U/μl T4 DNA连接酶(Promega公司，Madison，WI)混合。反应于5℃温育2小时，7.5℃2小时，10℃2小时，12.5℃10小时。经70℃温育20分钟终止反应。

为便于cDNA定向克隆进入1ZapII载体(stratagene)，cDNA用XhoI消化，产生具有5’EcoRI粘性末端和3’XhoI粘性末端的一段cDNA。该cDNA 3’末端的XhoI限制性位点已事先用ZC6091引物(SEQ IDNo：5)导入。在含上述cDNA 20μl，10μl 10X H缓冲液(BoehringerMannbeim)，69μl H₂O，及1.0μl 40U/μl XhoI(Boehringer Mannheim)的反应混合物中进行限制酶消化。消化在37℃进行40分钟。反应的终止通过在70℃温育10分钟并经400孔大小的凝胶过滤柱(ClontechLaboratories)层析而完成。

cDNA经乙醇沉淀，用70％乙醇洗涤，风干，再重新悬浮于14μlH₂O，2μl连接酶缓冲液(Promega公司，Madison WI)，2μl T4多核苷酸激酶(10U/μl，Life Technologies)中。37℃温育30分钟后，将cDNA加热至65℃5分钟，冰上冷却，在0.8％低熔点琼脂糖凝胶上电泳。从凝胶中切除污染的衔接子及长度小于0.6Kb的cDNA。电极对调，cDNA电泳直至浓缩于泳道出发点附近。含浓缩cDNA的凝胶区被切下并置于微量管中，确定凝胶片的近似体积。向管中加入近三倍于凝胶片体积(300μl)的水及35μl 10X β-琼脂糖酶I缓冲液(NewEngland Biolabs)，将琼脂糖于65℃加热5分钟熔化。将样品平衡于45℃后，加入3μl 1U/μlβ-琼脂糖酶I(New England Biolabs)，混合物于45℃温育60分钟以消化琼脂糖。温育后，向样品中加入40μl 3M醋酸钠，混合物置于冰上15分钟。将样品于室温下14,000Xg离心15分钟以去除未消化的琼脂糖。cDNA经乙醇沉淀，70％乙醇洗涤，风干并再悬于10μl水中。

将所得cDNA克隆进入已事先用EcoRI和XhoI消化并去磷酸化的Lamda噬菌体载体λZapII(strotegene)中。cDNA与λZapII载体的连接在含1.0μl预制载体，1.0μl人睾丸cDNA，1.0μl 10X连接酶缓冲液(Promega公司)，1.0μl 10mM ATP，5μlH₂O，及1.0μl 15U/μl的T4 DNA连接酶(Promega公司)的反应混合物中完成。连接混合物在5℃-15℃温度梯度中温育过夜。温育后，连接混合物用体外包装提取物(GigapackIII Gold包装提取物，Stratagene)包装成噬菌体，所得文库按厂家说明测定滴度。C.多核苷酸的分离

用人睾丸λZapII文库感染大肠杆菌宿主细胞(XL1-Blue^TMMRF’菌株；Stratagene)，将1.5×10⁶pfu铺到150mm NZY板上，使密度为约40,000pfu/板。接种板37℃温育过夜。用尼龙膜(Hybond^TM-N；Amersham公司，Arlington Heights，IL)按厂家建议的程序制成滤膜噬斑浸提物。滤膜在含1.5M NaCl和0.5M NaOH的溶液中室温变性7分钟。将滤膜用滤纸稍微吸一下，以去除剩余变性溶液，然后在1MTris-HCl，pH7.5及1.5M NaCl中中和5分钟。噬菌体DNA在UVCrosslinker(Stratalinker；Stratagene)中用1,200微焦耳的紫外线(UV)能量固定于滤膜上。然后滤膜在杂交溶液(5XSSC，5XDenhardt’s溶液，0.2％SDS和1mM EDTA)中预杂交。加入热变性的剪切鲑精DNA至终浓度为100μg/ml。滤膜于65℃预杂交过夜。

用寡核苷酸经PCR扩增相应于SEQ ID No：6的45位至1033位核苷酸的大鼠激素原转化酶编码区，制得探针。起始的第一轮PCR反应混合物包含2μl ZC11，808(SEQ ID No：7)和2μl ZC11，809(SEQ IDNo：8)，1μl 400 fg/μl大鼠睾丸cDNA，1μl 10mM dNTP，10μl 10×Klentaq缓冲液(Clontech)，83μl水，及2μl Klentag DNA聚合酶(Clontech)。第一轮PCR反应运行如下：先95℃30秒；再95℃30秒，57℃30秒，68℃2分钟共30个循环；然后68℃10分钟。第一轮PCR产物用水稀释至1∶2000。对1μl稀释的第一轮PCR产物进行第二轮PCR，所用巢式引物为ZC11，870(SEQ ID No：9)和ZC11，871(SEQ IDNo：10)，它们设计为可扩增第一轮PCR产物内部的DNA。第二轮PCR反应运行如下：先95℃30秒；再95℃30秒，58℃30秒，68℃2分钟，共30个循环；然后68℃10分钟。第二轮PCR产物在1.5％低熔点琼脂糖凝胶上凝胶纯化，以用作探针去筛选人睾丸cDNA文库，获得人PC4。

25ng PCR产物用MEGAPRIME^TM DNA标记系统(Amersham)按厂家建议通过随机引发法而标记上放射性α-³²P-dCTP。预杂交溶液用新鲜的含6.5×10⁵cpm/ml标记探针的杂交溶液取代，60℃杂交过夜。然后去除杂交溶液，滤膜在含1xSSC，0.25％SDS和1mM EDTA的洗涤液中45℃下漂洗。将滤膜置于放射自显影胶片上，用增感屏在-70℃曝光96小时。

对放射自显影的检查揭示有多个可与标记探针杂交的区。从39个区挑取琼脂塞进行纯化。将每个琼脂塞在含1％(v/v)氯仿的0.5mlSM中浸泡过夜(Sambrook等，分子克隆：实验室手册，第二版，冷泉港实验室出版社，冷泉港，NY，1989)。温育后，将每个琼脂塞的噬菌体在SM中稀释至1∶1000。取50μl等分液铺板于大肠杆菌XL-1 Blue^TMMRF’细胞上。平板37℃温育过夜，如上述制备滤膜浸提物、预杂交、杂交、洗涤并放射自显影。对所得放射自显影图的检查揭示10个滤膜浸提物上有阳性信号。从这些区挑取琼脂塞进行另一轮噬斑纯化。

质粒用ExASSIST/SOLR^TM系统(Stratagene)按厂商建议切割。这些质粒经PCR扩增以测定插入子的大小并对其测序。命名为pSLHPC4-5的克隆显示包含SEQ ID No：1中所示序列。

实施例2

组织分布

从pSLHPC4-5的全长编码序列制备探针，用于探测人多组织Northern印迹(Human Multiple Tissue Northern Blot)(Clontech)。Northern分析揭示了一条只存在于睾丸中的约2.8Kb的带。

实施例3

基于PCR的人PC4基因染色体作图

用商品化“GeneBridge 4 Radiation Hybrid Panel”(ResearchGenetics公司，Huntsville，AL)将人PC4定位于19号染色体。GeneBridge 4 Radiation Hybrid Panel包含93个放射杂交克隆每一个的DNA，外加2个对照DNA(HFL供体和A23受体)。公开可应用的WWW服务器 (http：//www-genome，wi.mit.edu/cgibin/contig/rhmapper.pl)可用来相对于用GeneBridge 4 RadiationHybrid Panel所构建的Whitehead研究所/MIT中心人类基因组图谱(“WICGR”人类基因组图谱)作图。B.

为了用“GeneBridge 4 RH Panel”对人PC4作图，在96孔微滴板(Stratagene)中设立20μl PCR反应，并用于“RoboCycler Gradient96”热循环仪(Stratagene)中。95份PCR反应物的每份组成为2μl10XKenTaq PCR反应缓冲液(Clontech Laboratories公司，Palo Alto，CA)，1.6μl dNTP混合物(每种2.5mM，Perkin-Elmer，Foster City，CA)，1μl有义引物ZC13，557(SEQ ID NO：11)，1μl反义引物ZC13，558(SEQ ID No：12)，2μl“RediLoad”(Research Genetics公司，Huntsville，AL)，0.4μl 50X Advantage Klentaq聚合酶混合物(Clontech Laboratories公司)，25ng来自单个杂交克隆或对照的DNA，及ddH₂O至总体积20μl。反应物用等量矿物油覆盖并密封。PCR循环仪条件如下：先95℃变性5分钟进行一个初始循环，再95℃变性1分钟，68℃退火1分钟，72℃延伸1.5分钟共35个循环，然后72℃延伸7分钟。在3％NuSieve GTG琼脂糖凝胶(FMC Bioproducts，Rockland，ME)上经电泳分离反应物。

结果显示人PC4作图于WICGR放射杂交图上距离19号染色体框架标记IB1264 10.54cR-3000处。它指示人PC4位于完整LDB 19号染色体图谱中19p13.3区。(The Genetic Location Database，Southhampton 大学，WWW 网址：http//cedar.genetics.soton.al.Uk/publ ic-html/)。

实施例4

人PC4哺乳动物表达载体PPC4-5/pHZ1的构建

制备表达载体，用于在哺乳动物细胞中表达人PC4多肽。哺乳动物表达载体pHZ1有受控于SV40早期启动子的新霉素基因，SV40多聚腺苷化位点，一个可插入受控于金属硫蛋白(MT-1)启动子的目的基因的多克隆位点(多接头)，及人生长激素(hGH)多聚腺苷化位点。该表达载体保存于美国典型培养物保藏中心，12301 Parklawn Drive，Rockville，MD.

将人PC4亚克隆进pHZ1多接头中的EcoRI/XbaI位点。用EcoRI和XbaI(Boehringer-Mannbeim)切割pHZ1，再经Qiaquick^TM柱(Qiagen)分离片段，制备载体片段。用限制酶EcoRI和AatII从实施例1的人PC4克隆切出一个1644bp片段(5’片段)，产生人PC4序列含5’UTR的5’末端(如SEQ ID No：1所示)。用跨越人PC4 AatII位点的引物ZC13，359(SEQ ID No：13)及含XbaI位点的引物ZC13，358(SEQID No：14)，从实施例1的人PC4克隆中PCR扩增出一段约681bp的PCR片段，产生人PC4序列含3’UTR的3’末端(如SEQ ID No：1所示)。PCR反应条件为：94℃1分钟一个循环；再94℃30秒，50℃20秒，72℃30秒共35个循环；然后72℃10分钟。PCR产物用AatII和XbaI切割，片段按上述纯化，产生681bp的PCR片段(3’片段)。

将切出的5’片段和3’片段DNA亚克隆进入pHZ1载体片段中。约20ng EcoRI/AatII消化的人PC45’片段，约20ng AatII/XbaI消化的人PC43’片段，及约40ng相应载体片段于室温下，在标准连接缓冲液中连接5小时。取1μl这样的连接反应物，按厂商建议电穿孔进入25μl DH10B感受态细胞(GIBCO BRL，Gaithersburg，MD)中，铺于含100mg/ml氨苄青霉素的LB平板上，37℃温育过夜。

用引物ZC12，634(SEQ ID No：15)和ZC12，945(SEQ ID No：16)在下列PCR条件下筛选菌落：94℃1分钟；再94℃20秒，50℃30秒，72℃1分钟共25个循环；然后72℃10分钟。阳性克隆的插入序列经序列分析检验。大批量质粒用QIAGEN大量制备试剂盒(Qiagen)按厂家建议制备。

尽管本文为了举例说明的目的而描述了本发明的特殊实施例，但应理解，在不偏离本发明的精神及范围的前提下可作各种修改。相应地，本发明除了权利要求书所限内容之外，其它方面不受限制。

序列表(1)基本信息

(i)申请人：ZymoGenetics，Inc.

1201 Eastlake Avenue East

Seattle，

WA

USA

98102

(ii)发明名称：人激素原转化酶4

(iii)序列数目：11

(iv)联系地址：

(A)收件人：ZymoGenetics，Inc.

(B)街道：1201 Eastlake Avenue East

(C)城市：Seattle

(D)州名：WA

(E)国家：USA

(F)邮政编码：98102

(v)计算机可读形式

(A)介质类型：软盘

(B)计算机：IBM兼容机

(C)操作系统：DOS

(D)软件：FastSEQ，Windows版本2.0

(vi)目前申请资料：

(A)申请号：

(B)递交日：

(C)分类：

(vii)在先申请资料：

(A)申请号：

(B)递交日：

(viii)代理人/代理信息：

(A)姓名：Parker，Gary E.

(B)登记号：31,648

(C)参考/文档号：97-05PC

(ix)电信信息：

(A)电话：206-442-6673

(B)传真：206-442-6678

(C)电传：(2)关于SEQ ID NO：1的信息

(i)序列特征

(A)长度：2744个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线性

(ii)分子类型：cDNA

(ix)特征：

(A)名称/关键词：编码序列

(B)位置：61…2325

(D)其它信息：

(xi)序列描述：SEQ ID NO：1：GAATTCGGCA CGAGGCGGGA GGGAGGGGAT TTGCGCAGGC CCCGCTCCCG CCCCGCCTCC 60ATG CGG CCC GCC CCG ATT GCG CTG TGG CTG CGC CTG GTC TTG GCC CTG 108Met Arg Pro Ala Pro Ile Ala Leu Trp Leu Arg Leu Val Leu Ala Leu1 5 10 15GCC CTT GTC CGC CCC CGG GCT GTG GGG TGG GCC CCG GTC CGA GCC CCC 156Ala Leu Val Arg Pro Arg Ala Val Gly Trp Ala Pro Val Arg Ala Pro

20 25 30ATC TAT GTC AGC AGC TGG GCC GTC CAG GTG TCC CAG GGT AAC CGG GAG 204Ile Tyr Val Ser Ser Trp Ala Val Gln Val Ser Gln Gly Asn Arg Glu

35 40 45GTC GAG CGC CTG GCA CGC AAA TTC GGC TTC GTC AAC CTG GGG CCG ATC 252Val Glu Arg Leu Ala Arg Lys Phe Gly Phe Val Asn Leu Gly Pro Ile

50 55 60TTC CCT GAC GGG CAG TAC TTT CAC CTG CGG CAC CGG GGC GTG GTC CAG 300Phe Pro Asp Gly Gln Tyr Phe His Leu Arg His Arg Gly Val Val Gln65 70 75 80CAG TCC CTG ACC CCG CAC TGG GGC CAC CGC CTG CAC CTG AAG AAA AAC 348Gln Ser Leu Thr Pro His Trp Gly His Arg Leu His Leu Lys Lys Asn

85 90 95CCC AAG GTG CAG TGG TTC CAG CAG CAG ACG CTG CAG CGG CGG GTG AAA 396Pro Lys Val Gln Trp Phe Gln Gln Gln Thr Leu Gln Arg Arg Val Lys

100 105 110CGC TCT GTC GTG GTG CCC ACG GAC CCC TGG TTC TCC AAG CAG TGG TAC 444Arg Ser Val Val Val Pro Thr Asp Pro Trp Phe Ser Lys Gln Trp Tyr

115 120 125ATG AAC AGC GAG GCC CAA CCA GAC CTG AGC ATC CTG CAG GCC TGG AGT 492Met Asn Ser Glu Ala Gln Pro Asp Leu Ser Ile Leu Gln Ala Trp Ser

130 135 140CAG GGG CTG TCA GGC CAG GGC ATC GTG GTC TCT GTG CTG GAC GAT GGC 540Gln Gly Leu Ser Gly Gln Gly Ile Val Val Ser Val Leu Asp Asp Gly145 150 155 160ATC GAG AAG GAC CAC CCG GAC CTC TGG GCC AAC TAC GAC CCC CTG GCC 588Ile Glu Lys Asp His Pro Asp Leu Trp Ala Asn Tyr Asp Pro Leu Ala

165 170 175AGC TAT GAC TTC AAT GAC TAC GAC CCG GAC CCC CAG CCC CGC TAC ACC 636Ser Tyr Asp Phe Asn Asp Tyr Asp Pro Asp Pro Gln Pro Arg Tyr Thr

180 185 190CCC AGC AAA GAG AAC CGG CAC GGG ACC CGC TGT GCT GGG GAG GTG GCC 684Pro Ser Lys Glu Asn Arg His Gly Thr Arg Cys Ala Gly Glu Val Ala

195 200 205GCG ATG GCC AAC AAT GGC TTC TGT GGT GTG GGG GTC GCT TTC AAC GCC 732Ala Met Ala Asn Asn Gly Phe Cys Gly Val Gly Val Ala Phe Asn Ala

210 215 220CGA ATC GGA GGC GTA CGG ATG CTG GAC GGT ACC ATC ACC GAT GTC ATC 780Arg Ile Gly Gly Val Arg Met Leu Asp Gly Thr Ile Thr Asp Val Ile225 230 235 240GAG GCC CAG TCG CTG AGC CTG CAG CCG CAG CAC ATC CAC ATT TAC AGC 828Glu Ala Gln Ser Leu Ser Leu Gln Pro Gln His Ile His Ile Tyr Ser

245 250 255GCC AGC TGG GGT CCC GAG GAC GAC GGC CGC ACG GTG GAC GGC CCC GGC 876Ala Ser Trp Gly Pro Glu Asp Asp Gly Arg Thr Val Asp Gly Pro Gly

260 265 270ATC CTC ACC CGC GAG GCC TTC CGG CGT GGT GTG ACC AAG GGC CGC GGC 924Ile Leu Thr Arg Glu Ala Phe Arg Arg Gly Val Thr Lys Gly Arg Gly

275 280 285GGG CTG GGC ACG CTC TTC ATC TGG GCC TCG GGC AAC GGC GGC CTG CAC 972Gly Leu Gly Thr Leu Phe Ile Trp Ala Ser Gly Asn Gly Gly Leu His

290 295 300TAC GAC AAC TGC AAC TGC GAC GGC TAC ACC AAC AGC ATC CAC ACG CTT 1020Tyr Asp Asn Cys Asn Cys Asp Gly Tyr Thr Asn Ser Ile His Thr Leu305 310 315 320TCC GTG GGC AGC ACC ACC CAG CAG GGC CGC GTG CCC TGG TAC AGC GAA 1068Ser Val Gly Ser Thr Thr Gln Gln Gly Arg Val Pro Trp Tyr Ser Glu

325 330 335GCC TGC GCC TCC ACC CTC ACC ACC ACC TAC AGC AGC GGC GTG GCC ACC 1116Ala Cys Ala Ser Thr Leu Thr Thr Thr Tyr Ser Ser Gly Val Ala Thr

340 345 350GAC CCC CAG ATC GTC ACC ACG GAC CTG CAT CAC GGG TGC ACA GAC CAG 1164Asp Pro Gln Ile Val Thr Thr Asp Leu His His Gly Cys Thr Asp Gln

355 360 365CAC ACG GGC ACC TCG GCC TCA GCC CCA CTG GCG GCC GGC ATG ATC GCC 1212His Thr Gly Thr Ser Ala Ser Ala Pro Leu Ala Ala Gly Met Ile Ala

370 375 380CTA GCG CTG GAG GCC AAC CCG TTC CTG ACG TGG AGA GAC ATG CAG CAC 1260Leu Ala Leu Glu Ala Asn Pro Phe Leu Thr Trp Arg Asp Met Gln His385 390 395 400CTG GTG GTC CGC GCG TCC AAG CCG GCG CAC CTG CAG GCC GAG GAC TGG 1308Leu Val Val Arg Ala Ser Lys Pro Ala His Leu Gln Ala Glu Asp Trp

405 410 415AGG ACC AAC GGC GTG GGG CGC CAA GTG AGC CAT CAC TAC GGA TAC GGG 1356Arg Thr Asn Gly Val Gly Arg Gln Val Ser His His Tyr Gly Tyr Gly

420 425 430CTG CTG GAC GCC GGG CTG CTG GTG GAC ACC GCC CGC ACC TGG CTG CCC 1404Leu Leu Asp Ala Gly Leu Leu Val Asp Thr Ala Arg Thr Trp Leu Pro

435 440 445ACC CAG CCG CAG AGG AAG TGC GCC GTC CGG GTC CAG AGC CGC CCC ACC 1452Thr Gln Pro Gln Arg Lys Cys Ala Val Arg Val Gln Ser Arg Pro Thr

450 455 460CCC ATC CTG CCG CTG ATC TAC ATC AGG GAA AAC GTA TCG GCC TGC GCC 1500Pro Ile Leu Pro Leu Ile Tyr Ile Arg Glu Asn Val Ser Ala Cys Ala465 470 475 480GGC CTC CAC AAC TCC ATC CGC TCG CTG GAG CAC GTG CAG GCG CAG CTG 1548Gly Leu His Asn Ser Ile Arg Ser Leu Glu His Val Gln Ala Gln Leu

485 490 495ACG CTG TCC TAC AGC CGG CGC GGA GAC CTG GAG ATC TCG CTC ACC AGC 1596Thr Leu Ser Tyr Ser Arg Arg Gly Asp Leu Glu Ile Ser Leu Thr Ser

500 505 510CCC ATG GGC ACG CGC TCC ACA CTC GTG GCC ATA CGA CCC TTG GAC GTC 1644Pro Met Gly Thr Arg Ser Thr Leu Val Ala Ile Arg Pro Leu Asp Val

515 520 525AGC ACT GAA GGC TAC AAC AAC TGG GTC TTC ATG TCC ACC CAC TTC TGG 1692Ser Thr Glu Gly Tyr Asn Asn Trp Val Phe Met Ser Thr His Phe Trp

530 535 540GAT GAG AAC CCA CAG GGC GTG TGG ACC CTG GGC CTA GAG AAC AAG GGC 1740Asp Glu Asn Pro Gln Gly Val Trp Thr Leu Gly Leu Glu Asn Lys Gly545 550 555 560TAC TAT TTC AAC ACG GGG ACG TTG TAC CGC TAC ACG CTG CTG CTC TAT 1788Tyr Tyr Phe Asn Thr Gly Thr Leu Tyr Arg Tyr Thr Leu Leu Leu Tyr

565 570 575GGG ACG GCC GAG GAC ATG ACA GCG CGG CCT ACA GGC CCC CAG GTG ACC 1836Gly Thr Ala Glu Asp Met Thr Ala Arg Pro Thr Gly Pro Gln Val Thr

580 585 590AGC AGC GCG TGT GTG CAG CGG GAC ACA GAG GGG CTG TGC CAG GCG TGT 1884Ser Ser Ala Cys Val Gln Arg Asp Thr Glu Gly Leu Cys Gln Ala Cys

595 600 605GAC GGC CCC GCC TAC ATC CTG GGA CAG CTC TGC CTG GCC TAC TGC CCC 1932Asp Gly Pro Ala Tyr Ile Leu Gly Gln Leu Cys Leu Ala Tyr Cys Pro

610 615 620CCG CGG TTC TTC AAC CAC ACA AGG CTG GTG ACC GCT GGG CCT GGG CAC 1980Pro Arg Phe Phe Asn His Thr Arg Leu Val Thr Ala Gly Pro Gly His625 630 635 640ACG GCG GCG CCC GCG CTG AGG GTC TGC TCC AGC TGC CAT GCC TCC TGC 2028Thr Ala Ala Pro Ala Leu Arg Val Cys Ser Ser Cys His Ala Ser Cys

645 650 655TAC ACC TGC CGC GGC GGC TCC CCG AGG GAC TGC ACC TCC TGT CCC CCA 2076Tyr Thr Cys Arg Gly Gly Ser Pro Arg Asp Cys Thr Ser Cys Pro Pro

660 665 670TCC TCC ACG CTG GAC CAG CAG CAG GGC TCC TGC ATG GGA CCC ACC ACC 2124Ser Ser Thr Leu Asp Gln Gln Gln Gly Ser Cys Met Gly Pro Thr Thr

675 680 685CCC GAC AGC CGC CCC CGG CTT AGA GCT GCC GCC TGT CCC CAC CAC CGC 2172Pro Asp Ser Arg Pro Arg Leu Arg Ala Ala Ala Cys Pro His His Arg

690 695 700TGC CCA GCC TCG GCC ATG GTG CTG AGC CTC CTG GCC GTG ACC CTC GGA 2220Cys Pro Ala Ser Ala Met Val Leu Ser Leu Leu Ala Val Thr Leu Gly705 710 715 720GGC CCC GTC CTC TGC GGC ATG TCC ATG GAC CTC CCA CTA TAC GCC TGG 2268Gly Pro Val Leu Cys Gly Met Ser Met Asp Leu Pro Leu Tyr Ala Trp

725 730 735CTC TCC CGT GCC AGG GCC ACC CCC ACC AAA CCC CAG GTC TGG CTG CCA 2316Leu Ser Arg Ala Arg Ala Thr Pro Thr Lys Pro Gln Val Trp Leu Pro

740 745 750GCT GGA ACC TGAAGTTGTC AGCTCAGAAA GCGACCTTGC CCCCGCCTGG GTCCCTGAC 2374Ala Gly Thr

755AGGCACTGCT GCCATGCTGC CTCCCCAGGC TGGCCCCAGA GGAGCGAGCA CCAGCACCCG 2434ACGCCTGGCC TGCCAGGGAT GGGCCCCGTG GAACCCCGAA GCCTGGCGGG AGAGAGAGAG 2494AGAGAAGTCT CCTCTGCATT TTGGGTTTGG GCGGGAGTGG GCTGGGGGGA GAGGCTGGAG 2554CACCCCAAAA GCCAGGGGAA AGTGGAGGGA GAGAAACGTG ACACTGTCCG CCTCGGGCAC 2614CGCATCCAAC CTCAGAGTTT GCAAATAAAG GTTGCTTAGA AGGTGAAAAA AAAAAAAAAA 2674AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA 2734AAGCGGCCGC 2744(2)关于SEQ ID NO：2的信息

(i)序列特征

(A)长度：755个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线性

(ii)分子类型：蛋白质

(v)片段类型：内部的

(xi)序列描述：SEQ ID NO：2：Met Arg Pro Ala Pro Ile Ala Leu Trp Leu Arg Leu Val Leu Ala Leu1 5 10 15Ala Leu Val Arg Pro Arg Ala Val Gly Trp Ala Pro Val Arg Ala Pro

20 25 30Ile Tyr Val Ser Ser Trp Ala Val Gln Val Ser Gln Gly Asn Arg Glu

35 40 45Val Glu Arg Leu Ala Arg Lys Phe Gly Phe Val Asn Leu Gly Pro Ile

50 55 60Phe Pro Asp Gly Gln Tyr Phe His Leu Arg His Arg Gly Val Val Gln65 70 75 80Gln Ser Leu Thr Pro His Trp Gly His Arg Leu His Leu Lys Lys Asn

85 90 95Pro Lys Val Gln Trp Phe Gln Gln Gln Thr Leu Gln Arg Arg Val Lys

100 105 110Arg Ser Val Val Val Pro Thr Asp Pro Trp Phe Ser Lys Gln Trp Tyr

115 120 125Met Asn Ser Glu Ala Gln Pro Asp Leu Ser Ile Leu Gln Ala Trp Ser

130 135 140Gln Gly Leu Ser Gly Gln Gly Ile Val Val Ser Val Leu Asp Asp Gly145 150 155 160Ile Glu Lys Asp His Pro Asp Leu Trp Ala Asn Tyr Asp Pro Leu Ala

165 170 175Ser Tyr Asp Phe Asn Asp Tyr Asp Pro Asp Pro Gln Pro Arg Tyr Thr

180 185 190Pro Ser Lys Glu Asn Arg His Gly Thr Arg Cys Ala Gly Glu Val Ala

195 200 205Ala Met Ala Asn Asn Gly Phe Cys Gly Val Gly Val Ala Phe Asn Ala

210 215 220Arg Ile Gly Gly Val Arg Met Leu Asp Gly Thr Ile Thr Asp Val Ile225 230 235 240Glu Ala Gln Ser Leu Ser Leu Gln Pro Gln His Ile His Ile Tyr Ser

245 250 255Ala Ser Trp Gly Pro Glu Asp Asp Gly Arg Thr Val Asp Gly Pro Gly

260 265 270Ile Leu Thr Arg Glu Ala Phe Arg Arg Gly Val Thr Lys Gly Arg Gly

275 280 285Gly Leu Gly Thr Leu Phe Ile Trp Ala Ser Gly Asn Gly Gly Leu His

290 295 300Tyr Asp Asn Cys Asn Cys Asp Gly Tyr Thr Asn Ser Ile His Thr Leu305 310 315 320Ser Val Gly Ser Thr Thr Gln Gln Gly Arg Val Pro Trp Tyr Ser Glu

325 330 335Ala Cys Ala Ser Thr Leu Thr Thr Thr Tyr Ser Ser Gly Val Ala Thr

340 345 350Asp Pro Gln Ile Val Thr Thr Asp Leu His His Gly Cys Thr Asp Gln

355 360 365His Thr Gly Thr Ser Ala Ser Ala Pro Leu Ala Ala Gly Met Ile Ala

370 375 380Leu Ala Leu Glu Ala Asn Pro Phe Leu Thr Trp Arg Asp Met Gln His385 390 395 400Leu Vai Val Arg Ala Ser Lys Pro Ala His Leu Gln Ala Glu Asp Trp

405 410 415Arg Thr Asn Gly Val Gly Arg Gln Val Ser His His Tyr Gly Tyr Gly

420 425 430Leu Leu Asp Ala Gly Leu Leu Val Asp Thr Ala Arg Thr Trp Leu Pro

435 440 445Thr Gln Pro Gln Arg Lys Cys Ala Val Arg Val Gln Ser Arg Pro Thr

450 455 460Pro Ile Leu Pro Leu Ile Tyr Ile Arg Glu Asn Val Ser Ala Cys Ala465 470 475 480Gly Leu His Asn Ser Ile Arg Ser Leu Glu His Val Gln Ala Gln Leu

485 490 495Thr Leu Ser Tyr Ser Arg Arg Gly Asp Leu Glu Ile Ser Leu Thr Ser

500 505 510Pro Met Gly Thr Arg Ser Thr Leu Val Ala Ile Arg Pro Leu Asp Val

515 520 525Ser Thr Glu Gly Tyr Asn Asn Trp Val Phe Met Ser Thr His Phe Trp

530 535 540Asp Glu Asn Pro Gln Gly Val Trp Thr Leu Gly Leu Glu Asn Lys Gly545 550 555 560Tyr Tyr Phe Asn Thr Gly Thr Leu Tyr Arg Tyr Thr Leu Leu Leu Tyr

565 570 575Gly Thr Ala Glu Asp Met Thr Ala Arg Pro Thr Gly Pro Gln Val Thr

580 585 590Ser Ser Ala Cys Val Gln Arg Asp Thr Glu Gly Leu Cys Gln Ala Cys

595 600 605Asp Gly Pro Ala Tyr Ile Leu Gly Gln Leu Cys Leu Ala Tyr Cys Pro

610 615 620Pro Arg Phe Phe Asn His Thr Arg Leu Val Thr Ala Gly Pro Gly His625 630 635 640Thr Ala Ala Pro Ala Leu Arg Val Cys Ser Ser Cys His Ala Ser Cys

645 650 655Tyr Thr Cys Arg Gly Gly Ser Pro Arg Asp Cys Thr Ser Cys Pro Pro

660 665 670Ser Ser Thr Leu Asp Gln Gln Gln Gly Ser Cys Met Gly Pro Thr Thr

675 680 685Pro Asp Ser Arg Pro Arg Leu Arg Ala Ala Ala Cys Pro His His Arg

690 695 700Cys Pro Ala Ser Ala Met Val Leu Ser Leu Leu Ala Val Thr Leu Gly705 710 715 720Gly Pro Val Leu Cys Gly Met Ser Met Asp Leu Pro Leu Tyr Ala Trp

725 730 735Leu Ser Arg Ala Arg Ala Thr Pro Thr Lys Pro Gln Val Trp Leu Pro

740 745 750Ala Gly Thr

755(2)关于SEQ ID NO：3的信息

(i)序列特征

(A)长度：5个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线性

(ii)分子类型：肽

(xi)序列描述：SEQ ID NO：3：

Arg Arg Val Lys Arg

1 5(2)关于SEQ ID NO：4的信息

(i)序列特征

(A)长度：49个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线性(vii)直接来源：

(B)克隆：ZC6091(xi)序列描述：SEQ ID NO：4：GAGCACAGAA TTCACTACTC GAGGCGGCCG CTTTTTTT TTTTTTTTTTT 49(2)关于SEQ ID NO：5的信息

(i)序列特征

(A)长度：2458个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线性

(ii)分子类型：其它

(xi)序列描述：SEQ ID NO：5：ATGCGGCCCT CCCAGACAGC GCTGTGGCTG GGTCTGGTTT TGTCTTTGGC CCTCCTGGCT 60GTGGGGTGGG CCTCAGCCCG ACCACCCATC TATGTCAGCA GCTGGGCAGT GCGGGTGACC 120AAAGGTTACC AGGAGGCTGA GCGCCTGGCA CGTAAATTTG GCTTCGTCAA CCTGGGACAG 180ATCTTTCCTG ATGACCAGTA TTTCCATCTG AGGCACCGGG GTGTGGCCCA GCAGTCCCTG 240ACTCCGCACT GGGGCCACCG TCTGCGCCTG AAGAAAGAGC CCAAGGTGCG GTGGTTTGAG 300CAGCAGACTT TGAGGCGGCG GGTGAAGCGC TCCCTGGTGG TACCCACAGA CCCCTGGTTT 360TCCAAGCAGT GGTACATGAA CAAGGAGATA GAACAAGATC TCAACATCCT AAAGGTTTGG 420AACCAGGGAC TGACTGGCCG GGGAGTGGTG GTCTCCATCT TGGATGATGG CATTGAGAAG 480GACCATCCGG ACCTCTGGGC TAATTATGAC CCCCTGGCCA GCTATGACTT CAATGATTAC 540GACCCAGATC CCCAGCCTCG ATACACACCC AACGATGAGA ACCGGCATGG AACACGCTGC 600GCTGGGGAGG TGTCTGCCAC AGCAAACAAC GGTTTCTGTG GTGCCGGTGT GGCCTTCAAT 660GCCAGAATTG GAGGCGTGCG CATGTTGGAT GGAGCCATCA CTGACATCGT GGAGGCTCAG 720TCCCTCAGCC TGCAGCCGCA ACACATACAC ATCTATAGCG CCAGTTGGGG CCCCGAGGAT 780GATGGGCGCA CAGTGGACGG ACCCGGCCTC CTCACGCAGG AGGCCTTCAG GCGTGGTGTA 840ACCAAGGGCC GCCAAGGGCT GGGCACGCTG TTCATCTGGG CCTCGGGAAA CGGTGGCCTC 900CACTACGACA ACTGCAATTG TGACGGCTAC ACCAACAGCA TCCACACGCT GTCAGTGGGC 960AGTACCACGC GGCAGGGCCG AGTGCCCTGG TACAGCGAGG CCTGCGCCTC CACGTTCACC 1020ACCACCTTCA GCAGCGGTGT GGTCACCGAC CCACAGATCG TCACCACGGA CCTACACCAT 1080CAATGCACCG ACAAGCACAC GGGCACCTCG GCCTCCGCCC CGCTGGCCGC TGGCATGATC 1140GCCCTGGCGC TGGAGGCCAA CCCGCTGCTG ACCTGGAGGG ACCTGCAGCA CCTGGTGGTC 1200CGCGCGTCCA GGCCGGCGCA GCTGCAGGCG GAGGACTGGA GGATCAACGG CGTGGGGCGC 1260CAAGTGAGCC ACCACTATGG CTATGGGCTG CTGGACGCGG GGCTGCTGGT AGACCTGGCT 1320CGCGTGTGGC TCCCTACTAA GCCTCAGAAG AAATGCACCA TTCGGGTGGT GCACACCCCA 1380ACCCCCATCC TGCCTCGGAT GCTGGTGCCA AAGAACGTGA CTGTATGCTG CGATGGCTCG 1440CGCCGCCGCC TCATCCGCTC GCTAGAGCAT GTTCAGGTCC AGCTGTCGCT CTCCTACAGC 1500CGCCGCGGGG ACCTGGAGAT CTTCCTCACC AGCCCCATGG GCACGCGCTC CACGCTTGTG 1560GCCATCAGAC CCTTGGATAT CAGCGGCCAA GGCTACAACA ACTGGATCTT CATGTCTACT 1620CACTACTGGG ATGAGGACCC GCAGGGCCTG TGGACCCTGG GGCTGGAGAA TAAGGGCTAC 1680TATTATAACA CAGGAACTCT GTACTACTGC ACGCTGCTGC TGTATGGGAC GGCAGAGGAC 1740ATGACAGCGC GGCCCCAGAC CCCCCAGGTG ACCAGCTGCG CGCACGCATG TGCAGAGGGA 1800CACAGAGGGG CTGTGCCAGG AAAGTCATTG TCCCCTCTCC ATTGTGGCAG AACTCTGCCT 1860CATCTCCAGC AAGCAGTGGT GGTGGCTCTA CAGCCACACA CAGCAGCCAG TGACCAAGGG 1920ACAGGACAGC TGTCACCCTC CTACCACACC TGCTCGGCAG CTTGACCAGC GACTACACTG 1980CCTGTTCCCT GCCCCTCATG CTGGGAGTGC TTCAGAGCCC CTCCAAGGCT TGTCACCTCT 2040GGCAGCCATC CTGGCTATCA GTCTTGGGCC ATGGTGCTGT CCCTGCTAAC CAGGGCCTTT 2100GGAAGGCCCC TCATCTTGAG GAAGGCCCAC CTCTCCCCAG GCTGGATACC CCTGGGGAGC 2160CAGAGATGCC CCACTCTCAG GACAGAAGGC CGGTACCCCA AGGCCCTGCT CCCAGGCCGG 2220GATAGGAATA TGCCCCAGAA GGCCACGGCA GAGAGCTGCA TGGGTCACGT GACAGCCCGC 2280AGCTCAGCCT CAGCTGCTCC CAGTGGAAGA GACGTTTCCT CATTCTTTTT GGAGCAGGTA 2340TGGCAGACAA GAGGTCAGAC CACAGCCACC AACCACCTGC CCCTTCCCTG TCTCCAAACC 2400ATCCCCATGT CTAACCTCAT AGTTGGCAAA TAAAGTTAAA CAGAAAAAAA AAAAAAAA 2458(2)关于SEQ ID NO：6的信息

(i)序列特征

(A)长度：25个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线性

(vii)直接来源：

(B)克隆：ZC11808

(xi)序列描述：SEQ ID NO：6：TGGCTGGGTC TGGTTTTGTC TTTGG 25(2)关于SEQ ID NO：7的信息

(i)序列特征

(A)长度：24个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线性

(vii)直接来源：

(B)克隆：ZC11809

(xi)序列描述：SEQ ID NO：7：GCATTGATGG TGTAGGTCCG TGGT 24(2)关于SEQ ID NO：8的信息

(i)序列特征

(A)长度：24个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线性

(vii)直接来源：

(B)克隆：ZC11870

(xi)序列描述：SEQ ID NO：8：TTTGGCCCTC CTGGCTGTGG GGTG 24(2)关于SEQ ID NO：9的信息

(i)序列特征

(A)长度：24个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线性

(vii)直接来源：

(B)克隆：ZC11871

(xi)序列描述：SEQ ID NO：9：TGCTGAAGGT GGTGGTGAAC GTGG 24(2)关于SEQ ID NO：10的信息

(i)序列特征

(A)长度：26个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线性

(vii)直接来源：

(B)克隆：ZC13557

(xi)序列描述：SEQ ID NO：10：CAGCCGCAGC ACATCCACAT TTACAG 26(2)关于SEQ ID NO：11信息

(i)序列特征

(A)长度：21个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线性

(vii)直接来源：

(B)克隆：ZC13558

(xi)序列描述：SEQ ID NO：11：GGGTGAGGAT GCCGGGGCCG T 21

Claims

1.编码包含与选自下组之氨基酸序列至少90％相同的一段氨基酸残基序列的人激素原转化酶4多肽的分离多核苷酸：

(a)SEQ ID No：2所示114位(Ser)至443位(Ala)氨基酸的氨基酸序列；

(b)SEQ ID No：2所示114位(Ser)至755位(Thr)氨基酸的氨基酸序列；

(c)SEQ ID No：2所示20位(Arg)至755位(Thr)氨基酸的氨基酸序列；和

(d)SEQ ID No：2所示1位(Met)至755位(Thr)氨基酸的氨基酸序列。

2.权利要求1的分离多核苷酸，其中所述多核苷酸选自下组：

(a)SEQ ID No：1所示400位-1389位核苷酸的多核苷酸序列；

(b)SEQ ID No：1所示400位-2325位核苷酸的多核苷酸序列；

(c)SEQ ID No：1所示118位-2325位核苷酸的多核苷酸序列；和

(d)SEQ ID No：1所示61位-2325位核苷酸的多核苷酸序列。

3.权利要求1的分离多核苷酸序列，其中该多核苷酸包含SEQ IDNo：3的1位至2265位核苷酸。

4.权利要求1的分离多核苷酸，其中人激素原转化酶4多肽基本上由与SEQ ID No：2所示20位(Arg)至755位(Thr)氨基酸的序列至少90％相同的氨基酸残基序列组成。

5.权利要求4的分离多核苷酸，其中所述激素原转化酶4多肽基本上由SEQ ID No：2所示20位(Arg)至755位(Thr)氨基酸的氨基酸残基序列组成。

6.含以下可操作连接在一起的元件的表达载体：

转录启动子；

编码与SEQ ID No：2所示20位(Arg)至755位(Thr)氨基酸序列至少90％相同的激素原转化酶多肽的DNA片段；及转录终止子。

7.权利要求6的表达载体，其中进一步包含可操作连接于所述DNA片段的一段分泌信号序列。

8.导入了权利要求6的表达载体的培养细胞，其中该细胞表达由所述DNA片段编码的多肽。

9.编码融合蛋白的DNA构建体，其包含：

编码与选自下组之氨基酸残基序列至少90％相同的多肽的第一DNA区段：

(a)SEQ ID No：2的1位(Met)至21位(Pro)氨基酸的序列；

(b)SEQ ID No：2的20位(Arg)至113位(Arg)氨基酸的序列；

(c)SEQ ID No：2的114位(Ser)至443位(Ala)氨基酸的序列；

(d)SEQ ID No：2的444(Arg)至561位(Tyr)氨基酸的序列；

(e)SEQ ID No：2的562位(Tyr)至755位(Thr)氨基酸的序列；

(f)SEQ ID No：2的114位(Ser)至755位(Thr)氨基酸的序列；

(g)SEQ ID No：2的20位(Arg)至755位(Thr)氨基酸的序列；

及编码其它多肽的至少一个其它DNA区段，其中所述第一和其它DNA区段在框架内连接；并编码融合蛋白。

10.由包含下述步骤的方法产生的融合蛋白：

培养已导入含以下可操作连接在一起的元件的载体的宿主细胞：

(a)转录启动子；

(b)权利要求9的编码融合蛋白的DNA构建体；及

(c)转录终止子；及

回收该DNA区段编码的蛋白质。

11.含有与选自下组之氨基酸序列至少90％相同的氨基酸残基序列的分离多肽：

(a)SEQ ID No：2所示114位(Ser)至443位(Ala)的氨基酸序列；

(b)SEQ ID No：2所示114位(Ser)至755位(Thr)的氨基酸序列；

(c)SEQ ID No：2所示20位(Arg)至755位(Thr)的氨基酸序列；

(d)SEQ ID No：2所示1位(Met)至755位(Thr)的氨基酸序列。

12.权利要求11的分离多肽，其中该多肽基本上由与SEQ ID No：2所示20位(Arg)至755位(Thr)氨基酸序列至少90％相同的氨基酸残基序列组成。

13.权利要求12的分离多肽，其中该氨基酸残基序列为SEQ IDNo：2所示20位(Arg)至755位(Thr)氨基酸序列。

14.产生人激素原转化酶4多肽的方法，包括：

培养权利要求8的细胞；并

分离该细胞所产生的人激素原转化酶多肽。

15.测定人激素原转化酶4多肽的多肽激素原底物的方法，包括：

培养已导入权利要求6的表达载体的细胞，其中该细胞表达该DNA区段编码的人激素原转化酶多肽，还表达检验底物激素原多肽；及

检测因人激素原转化酶4多肽切割所述检验底物产生的切割产物。

16.测定人激素原转化酶4多肽的多肽激素原底物的方法，包括：

体外将权利要求11的激素原转化酶4多肽与检验底物多肽混合；并

检测因人激素原转化酶4多肽切割检验底物产生的切割产物。

17.检测检验样品中是否有人激素原转化酶多肽活性调节子的方法，包括：

在有或无检验样品时培养已导入权利要求6的表达载体的细胞，其中该细胞表达该DNA区段编码的人激素原转化酶多肽，还表达已知的指示性激素原多肽底物；及

经生物学或生物化学分析，比较在有和无检验样品时由人激素原转化酶多肽切割该底物产生的切割产物的水平；并

通过该项比较，确定检验样品中有无人激素原转化酶活性的调节子。

18.产生人激素原转化酶4多肽的抗体的方法，包括：

用选自下组的多肽接种动物：

(a)由9至755个氨基酸组成的多肽，其中该多肽与SEQ ID No：2中20位(Arg)至755位(Thr)氨基酸内的一段连续序列至少90％相同；

(b)权利要求11的多肽；

(c)其具有的一段氨基酸序列与SEQ ID No：2中444位(Arg)至561位(Tyr)残基至少90％序列相同的多肽；及

(d)其具有的一段氨基酸序列与SEQ ID No：2中562位(Tyr)至755位(Thr)残基至少90％序列相同的多肽，

其中该多肽在动物体内可引起免疫应答；

及从动物体内分离该抗体。

19.由权利要求18的方法产生的抗体，其可结合人激素原转化酶4多肽。

20.权利要求19的抗体，其中该抗体为单克隆抗体。

21.可与权利要求11的多肽特异性结合的抗体。