CN1309710A

CN1309710A - 用于产生和传递蛋白的IFN－α2基因编码区上游的基因组序列

Info

Publication number: CN1309710A
Application number: CN99808195A
Authority: CN
Inventors: D·A·特雷科; M·W·赫尔特莱恩; R·F·塞尔登
Original assignee: Transkaryotic Therapies Inc
Current assignee: Shire Human Genetics Therapies Inc
Priority date: 1998-05-07
Filing date: 1999-05-05
Publication date: 2001-08-22
Also published as: HUP0102517A2; AU3788899A; JP2002513580A; IL139433A0; CZ299418B6; NO20005585D0; NO20005585L; HUP0102517A3; AR016264A1; WO1999057292A1; CA2328459A1; PL344517A1; CZ20003705A3; EP1075531A1; WO1999057292A9; TR200003271T2; KR20010052278A

Abstract

在严格条件下与IFNA2基因的编码区上游的限定的基因组区杂交、或与其具有至少80%序列同一性的分离的核酸分子,以及包含为同源重组的导向序列的所述DNA分子的DNA构建物。

Description

用于产生和传递蛋白的IFN-α2基因编码区上游的基因组序列

发明领域

本发明涉及基因组DNA。

发明背景

目前用治疗蛋白治疗疾病的方法包括给予在体外生产的蛋白和基因治疗。体外生产蛋白一般包括将编码目的蛋白的外源DNA引入到合适的宿主细胞中培养。在另一方面，基因疗法包括给予患者包含目的治疗蛋白编码序列的细胞、质粒或病毒。

也可以用基因导向技术，以所需的方式通过改变某些治疗蛋白的内源基因的表达来生产所述治疗蛋白。参阅例如美国专利第5,641,670、5,733,761和5,272,071号，美国专利申请序号08/406,030,WO 91/06666、WO 91/06667和WO 90/11354，所有这些都通过引用整体结合到本文中。

发明概述

本发明是基于对5′至人干扰素-α2(“IFNA2”)基因的编码序列的基因组DNA的鉴定和测序。此DNA例如可以用于DNA构建物，当将该构建物通过同源重组整合到哺乳动物细胞的基因组时，所述构建物改变(例如增加)内源IFNA2基因在该细胞中的表达。“内源IFNA2基因”意指编码IFNA2的基因组(即染色体)基因。所述构建物包含导向序列和转录调节序列，所述导向序列包括或来自于最近公开的5′非编码序列。所述转录调节序列最好在序列上与内源IFNA2基因的转录调节序列不同。所述导向序列引导所述调节序列整合到内源IFNA2编码序列的上游区中，以使该调节序列操作性连接至所述内源编码序列。所述“操作性连接的”是指所述调节序列可以控制内源IFNA2编码序列的表达。所述构建物还可以包含易于选择已稳定整合所述构建物的细胞的选择性标记基因和/或另一个连接至启动子的编码序列。

在一个实施方案中，所述DNA构建物包括：(a)导向序列，(b)调节序列，(c)外显子，(d)剪接供体位点，(e)内含子，和(f)剪接受体位点，其中所述导向序列引导其本身和元件(b)-(f)整合，以使元件(b)-(f)处于所述内源基因之中或其上游。然后所述调节序列控制生产转录物，所述转录物不仅包括元件(c)-(f)，而且包括所述内源IFNA2编码序列。最好使所述内含子和所述剪接受体位点位于所述构建物剪接供体位点的下游。

所述导向序列与发生同源重组的基因组中预先选择的靶位点同源。它包含SEQ ID NO:12的至少20(例如至少30、50、100或1000)个连续的核苷酸；并可以包含例如SEQ ID NO:7的至少20(例如至少30、50或100)个连续的核苷酸、SEQ ID NO:8的至少20(例如至少30或50)个连续的核苷酸或SEQ ID NO:13的至少20(例如至少30、50、100或1000)个连续的核苷酸。另外，所述导向序列可以包含SEQID NO:16的至少20(例如至少30、50或100)个连续的核苷酸、SEQID NO:17的至少20个连续的核苷酸、SEQ ID NO:18的至少20(例如至少30或50)个连续的核苷酸或SEQ ID NO:19的至少20(例如至少30、50、100或1000)个连续的核苷酸。SEQ ID NO:7相当于SEQ IDNO:12的核苷酸1至278；SEQ ID NO:8相当于SEQ ID NO:12的核苷酸3492至3564；而SEQ ID NO:13相当于SEQ ID NO:12的核苷酸279至3491。所述“同源”是指所述导向序列与其基因组靶位点相同或足够相似，以使所述导向序列和靶位点可以在人细胞中进行同源重组。只要同源重组可以以有效频率发生，那么小部分的碱基对错配可以接受。为了易于同源重组，所述导向序列最好为至少约20(例如至少50、100、250、400或1000)个碱基对(“bp”)长。所述导向序列也可以包括SEQ ID NO:12所包含区以外的基因组序列，只要其包括此区中的至少20个核苷酸。例如，可以由位于SEQ ID NO:8和IFNA2基因的内源转录起始序列之间的序列产生另外的导向序列。

由于存在于IFNA2基因的基因座上的多态性，在任何给定的哺乳动物物种中任何给定的基因组靶位点的核苷酸组分都可以发生微小改变。对应于SEQ ID NO:7、8、12、13、16、17、18和19的这种多态变体(尤其是人多态变体)的导向序列属于本发明的范围。

在同源重组时，将所述构建物的调节序列整合到细胞染色体中IFNA2基因的编码序列上游的预先选定的区。产生的包含得自所述构建物的调节序列的新转录单位改变了靶IFNA2基因的表达。如此产生的IFNA2蛋白在序列上与未改变的内源基因编码的IFNA2蛋白可以相同，或者由于同源重组引入的变化，与野生型IFNA2蛋白相比可以包含氨基酸残基的添加、置换或减少。

改变基因表达包括使在所获得的细胞中通常沉默(即基本不表达)的基因活化(或引起表达)，增加或减少基因的表达水平，并改变基因的调节模式，使得该模式不同于在所获得的细胞中的模式。“所获得的细胞”意指在同源重组前的细胞。

使用本发明的DNA构建物改变内源IFNA2基因在哺乳动物细胞中表达的方法也属于本发明的范围。该方法包括以下步骤：(ⅰ)将所述DNA构建物引入到哺乳动物细胞中；(ⅱ)将所述细胞保持在允许所述构建物和与所述导向序列同源的基因组靶位点之间发生同源重组的条件下，以产生同源重组细胞；和(ⅲ)将所述同源重组细胞保持在允许IFNA2编码序列于得自所述构建物的调节序列控制下表达的条件下。至少部分所述基因组靶位点是5′至内源IFNA2基因的编码序列。即所述基因组靶位点可以包含编码序列以及5′非编码序列。

本发明的特征还在于转染或感染的细胞，在所述细胞中所述构建物与在一个或两个内源IFNA2基因的等位基因中的内源ATG起始密码子上游的基因组DNA进行同源重组。这种转染或感染的细胞也称为同源重组细胞，具有改变的IFNA2表达模式。这些细胞特别用于体外生产IFNA2和通过基因治疗传递IFNA2。制备和使用这种细胞的方法也包含在本发明中。所述细胞可以是脊椎动物源，诸如哺乳动物(例如人、非人类的灵长类、母牛、猪、马、山羊、绵羊、猫、狗、兔、小鼠、豚鼠、仓鼠或大鼠)源。

本发明还涉及体外或体内将上述构建物经同源重组引入到宿主细胞的基因组中产生哺乳动物IFNA2蛋白的方法。然后将所述同源重组细胞保持在使所述IFNA2蛋白转录、翻译和可选地分泌的条件下。

本发明的特征还在于分离的核酸，所述核酸包含SEQ ID NO:12或其互补物的至少20(例如至少30、50、100、200或1000)个连续核苷酸的序列，或包含与SEQ ID NO:12相同、除外不妨碍与所述导向序列同源重组的多态改变或其它微小改变(例如少于序列的5％)的序列。例如，所述分离的DNA可以包含SEQ ID NO:7或其互补物的至少20(例如至少30、50或100)个连续的核苷酸、SEQ ID NO:8或其互补物的至少20(例如至少30或50)个连续的核苷酸、SEQ IDNO:13或其互补物的至少20(例如至少30、50、100或1000)个连续的核苷酸、SEQ ID NO:16或其互补物的至少20(例如至少30、50或100)个连续的核苷酸、SEQ ID NO:17或其互补物的至少20个连续的核苷酸、SEQ ID NO:18或其互补物的至少20(例如至少30或50)个连续的核苷酸或SEQ ID NO:19或其互补物的至少20(例如至少30、50、100或1000)个连续的核苷酸。

在一个实施方案中，本发明的分离的核酸包括SEQ ID NO:12的连续100个碱基对的区段。例如所述分离的DNA可以包含SEQ IDNO:12或其互补物的核苷酸1-100、101-200、201-300、301-400、401-500、501-600、601-700、701-800、801-900、901-1000、1001-1100、1101-1200、1201-1300、1301-1400、1401-1500、1501-1600、1601-1700、1701-1800、1801-1900、1901-2000、2001-2100、2101-2200、2201-2300、2301-2400、2401-2500、2501-2600、2601-2700、2701-2800、2801-2900、2901-3000、3001-3100、3101-3100、3101-3200、3201-3300、3301-3400、3401-3500或3465-3564。SEQ ID NO:12或其互补物的这些区段也用作本发明构建物中的导向序列。

在所述分离的DNA中，得自SEQ ID NO:12的序列没有连接至编码完整IFNA2的序列，或至少没有以和在任何野生型基因组中出现的构型相同的构型(即被相同的非编码序列分隔)连接。因此本文使用的术语“分离的DNA”不表示染色体或大段的基因组DNA(这可能掺入到粘粒或酵母人工染色体中)，它不仅包括部分或全部SEQ IDNO:12，而且包括完整的IFNA2编码序列和所有的位于IFNA2编码序列和存在于细胞基因组中对应于SEQ ID NO:12的序列之间的序列。它确实包括但不限于，(ⅰ)掺入到质粒或病毒中的DNA；或(ⅱ)作为不依赖于其它序列的单独分子存在的DNA，例如通过聚合酶链式反应(“PCR”)或限制性内切核酸酶处理产生的片段。所述分离的DNA最好不包含编码完整IFNA2前体(即IFNA2以内源分泌信号肽互补结束)的序列。

本发明还包括包含一种链的分离的DNA，所述链包含至少100(例如至少200、400或1000)个核苷酸长并在或中等严格或高度严格条件下与SEQ ID NO:7、8、12、13、16、17、18和/或19或SEQID NO:7、8、12、13、16、17、18和/或19的互补物杂交的序列。该序列没有连接至IFNA2编码序列，或至少没有以和在任何野生型基因组中出现的构型相同的构型连接。所述中等严格条件意指在Church缓冲液(7％SDS、0.5％NaHPO₄、1M EDTA、1％牛血清白蛋白)中于50℃杂交并于50℃用2×SSC清洗。高度严格条件定义为：在50％甲酰胺存在下于42℃杂交；用包含1％SDS的2×SSC于65℃第一次清洗；接着用0.1×SSC于65℃第二次清洗。

本发明还包括包含一种链的分离的DNA，所述链包含(1)至少50(例如至少70或100)个核苷酸长并(2)与SEQ ID NO:12的片段或全部或与所述片段的互补物具有至少80％(例如至少85％、90％、95％或98％)序列同一性的序列。该序列例如可以包括SEQ ID NO:7、8、13、16、17、18或19的部分或全部。所述序列没有连接至完整IFNA2编码序列，或至少没有以和在任何野生型基因组中出现的构型相同的构型连接。

在个别多肽或核酸分子被认为与参照多肽或核酸分子具有明确百分率的同一性或保守性的情况下，通过Myers和Miller，CABIOS(1989)的算法确定同一性或保守性的百分率，所述算法具体为ALIGN程序(2.0版)或其等效程序中，需要时使用12的隙宽补偿参数和4的缺口补偿参数。其它所有参数都设定为它们的默认状态。ALIGN的使用权很容易获得。参见例如国际互联网http:∥www2.igh.cnrs.fr/bi/align-guess.cgi。

本发明的特征还在于通过提供其内源IFNA2基因已如本文所述活化的细胞，并将该细胞植入动物(例如哺乳动物如人、非人类的灵长类、母牛、猪、马、山羊、绵羊、猫、狗、兔、小鼠、豚鼠、仓鼠或大鼠)中，所述细胞在所述动物中分泌IFNA2，从而将IFNA2传递给所述动物的方法。本发明还包括通过提供其内源IFNA2基因已如本文所述活化的细胞，并在允许该细胞表达和分泌IFNA2的条件下体外培养该细胞，从而产生IFNA2的方法。

本发明进一步包括与质粒pA2HB(下文描述)的部分HindⅢ-BamHⅠ插入片段(例如至少约20、50、100、400或1000bp长)具有至少80％(例如至少85％、90％或95％)序列同一性，或在高度或中等严格条件下与其杂交的分离的DNA。该部分插入片段的3′末端位于包括于所述质粒插入片段的IFNA2编码序列的ATG翻译起始密码子上游的至少511bp。

本发明的分离的DNA例如可以用作用于(当与合适的下游引物共同使用时)获得内源IFNA2基因的调节区和/或全编码序列的上游PCR引物源，或用作指示在人染色体制备物中染色体9存在的杂交探针。它也可以如下所述用于改变内源IFNA2基因在脊椎动物细胞中表达的方法。

除非另有定义，否则本文使用的所有科技术语都具有和本发明所属领域的一般技术人员的通常理解相同的含义。以下描述了典型方法和材料，但是与本文描述的方法和材料相似或等同的方法和材料也可以用来实施和检验本发明。所有出版物、专利申请、专利和本文提及的其它参考文献都通过引用整体结合到本文中。在有冲突的情况下，以本说明书包括定义为准。所述材料、方法和实施例仅起说明作用，并无限制意图。

由以下的详述和权利要求将明显看出本发明的其它特征和优势。

附图简述

图1显示人IFNA2编码序列和某些侧翼5′和3′非编码序列(GenBank HUMIFNAA)的公开序列(SEQ ID NO:1)。箭头代表PCR引物IFN1、IFN2、IFN6和IFN7的序列。

图2是一幅示意图，显示包括在质粒pA2HB的插入片段中的人IFNA2基因组区。

图3表示人IFNA2基因的编码序列的上游区的核苷酸序列(SEQID NO:7)。以前不曾报道过此核苷酸序列。

图4表示人IFNA2编码序列和某些侧翼5′和3′非编码序列的序列(SEQ ID NO:9)。下划线序列(SEQ ID NO:8)以前没有报道过。也显示了由此基因编码的多肽序列(SEQ ID NO:2)。“成熟”表示成熟多肽的N末端。

图5是一幅显示本发明构建物的示意图。该构建物包含第一个导向序列(1)；可扩增的标记基因(AM)；选择性标记基因(SM)；调节序列；加帽位点；外显子；剪接供体位点(SD)；内含子；剪接受体位点(SA)；和第二个导向序列(2)。黑框表示编码DNA，而点框表示已转录但未翻译的序列。

图6表示5′至人IFNA2编码序列的基因组序列(SEQ ID NO:11)，并包括某些编码序列。下划线序列以前报道过，但其余部分(-4074至-511；SEQ ID NO:12)是新的。框架序列是SEQ ID NO:13。5′至SEQID NO:13的序列是SEQ ID NO:7。在所述框架区域和所述下划线序列之间的序列是SEQ ID NO:8。核苷酸-4074至-3270是SEQ ID NO:16。核苷酸-3267至-3239是SEQ ID NO:17。核苷酸-3241至-3137是SEQID NO:18。核苷酸-3139至-511是SEQID NO:19。

图7表示用于本发明构建物的第一个导向序列(SEQ ID NO:14)。

图8表示用于本发明构建物的第二个导向序列(SEQ ID NO:15)。

发明详述

本发明基于对人IFNA2基因的编码序列的上游序列的核苷酸组成的研究。

干扰素-α由具有14个基因的复合基因家族构成，所述基因群集在染色体9的短臂上。包括IFNA2基因的这些基因中没有一个具有内含子。干扰素-α由巨噬细胞、T细胞和B细胞以及各种各样的其它许多细胞产生。干扰素-α具有显著的抗病毒作用，并已经显示对治疗乳头瘤病毒、乙型肝炎和丙型肝炎病毒、牛痘、单纯疱疹病毒、水痘样带状疱疹病毒(herpes zoster varicellosus virus)和鼻病毒的感染有效。

人IFNA2基因编码包含23个氨基酸的信号肽的188个氨基酸的前体蛋白(SEQ ID NO:2)。人IFNA2基因的基因组图谱示于图1。该图谱的构建基于1733个碱基对(“bp”)的公开序列(HUMIFNAA,GenBank保藏号J00207和V00544；SEQ ID NO:1)，所述公开序列始于相对于翻译起始位点的-510位(除非另有说明，否则本文指出的所有位置均为相对于翻译起始位点)，并终止于+1,223位。加帽位点位于-67位。IFNA2基因的5′特异性序列以及它们在改变内源IFNA2基因表达中的用途

为获得包含IFNA2基因上游序列的基因组DNA，用由PCR产生的332bp的探针筛选在λEMBL3(Clontech目录# HL1006d)中的人淋巴细胞基因组文库。此探针对应于在位置-263和+69之间的基因组区，并使用称为IFN7和IFN6的寡核苷酸引物由人基因组DNA扩增，IFN7和IFN6都利用IFNA2基因组DNA序列(图1)设计。引物IFN7的5′末端对应于位置-263，其序列为5′-AGTTTCTAAAAAGGCTCTGGGGTA-3′(SEQ ID NO:3)。引物IFN6的5′末端对应于位置+69，其序列为5′-GCCCACAGAGCAGCTTGAC-3′(SEQ ID NO:4)。

用放射性标记的332bp的探针筛选大约一百万个重组噬菌体。由原筛选板分离60个阳性噬菌斑。由30个这些噬菌斑中分离λ噬菌体DNA，并使用寡核苷酸引物IFN1和IFN2进行PCR分析。IFN1和IFN2都得自IFNA2基因的3′非翻译区；它们的序列可以在WWW站点“http:∥www.ncbi.nlm.nih.gov/dbSTS，”使用识别码“NCBIID:42433”获得。引物IFN1的5′末端对应于位置+639，其序列为5′-AAAGACTCATGTTTCTGCTATGACC-3′(SEQ ID NO:5)。引物IFN2的5′末端对应于位置+853，其序列为5′-GGTGCACATGACATAATATGAACA-3′(SEQ ID NO:6)。在30个噬菌体样本中，两个产生预期的215bp的PCR产物。两个噬菌体噬菌斑中的一个通过另外两轮杂交筛选进一步纯化，产生噬菌体克隆4-4-1。

将来自噬菌体4-4-1的8.3kb的HindⅢ-BamHⅠ片段亚克隆到pBluescriptⅡSK+(Stratagene,La Jolla,CA)中，以产生pA2HB，它包含IFNA2基因的未转录上游序列的约4.3kb、蛋白编码区(1.1kb)以及下游序列的约2.8kb。8.3kb的HindⅢ-BamHⅠ片段的限制图谱示于图2。

利用Sanger法对pA2HB质粒测序。以下列出了其5′末端位于5′末端的HindⅢ位点的278bp的序列(也参阅图3)：

AAGCTTTTATAGGTGTAAATTTTCCACTTAGTACTGCTTTTG

TAATGTTGTCTTTTTATTTTCATTTATCTCAAGATGTTTTCT

AATTTCTCTTGACTTCCTTCTTAAATTCTTACCTCATGTAGA

CATACATTTTTGGCCCTATGCATTGGGATGCAAAACCAGACT

AATTTACTTTGTACAAAAAGAAAAATGAGAAAGAAATATATT

TGGTCTTGTGAGCACTATATGGAAATACTTTATATTCCATTT

GTTTCATCATATTCATATATCCCTTT(SEQ ID NO:7)

所述HindⅢ位点位于位置-4,073。也鉴定了以前未公开的在位置-583和-511之间的序列，示于以下并在图4中用下划线表示。

CATTGGATACTCCATCACCTGCTGTGATATTATGAATGTCTG

CCTATATAAATATTCACTATTCCATAACACA(SEQ ID

NO:8)也鉴定了在对应于SEQ ID NO:7和8的区之间的序列(SEQ IDNO:13)。

在位置-4,074和-511之间的基因组序列(SEQ ID NO:12)是在图6中没有下划线的序列。SEQ ID NO:7和8分别对应于SEQ ID NO:12的核苷酸1-278和核苷酸3492-3564。

为改变内源IFNA2基因的表达，将包含SEQ ID NO:12的核苷酸279-3311的DNA片段克隆到质粒中，以产生导向构建物pGA402。SEQ ID NO:12的核苷酸279-3311称为SEQ ID NO:14。将该片段插入到CMV启动子和新霉素抗性基因的上游，并在图5中示意标出。关于图5中的第二个导向序列，将包含示于图1的IFNA2基因序列的核苷酸-68至69的DNA片段克隆到CMV启动子和新霉素抗性基因的下游。IFNA2基因的核苷酸-68至69称为SEQ ID NO:15。将pGA402质粒引入到几乎不表达或不表达IFNA2基因的人成纤维细胞中，以使其可与内源IFNA2基因同源重组。在引入质粒后筛选抗G418的细胞，以鉴别IFNA2基因表达增加的细胞，这应可预计在pGA402和基因组DNA之间的同源重组事件是否发生在内源IFNA2基因附近。一般方法学改变内源IFNA2表达

使用上述IFNA2上游序列，采用如在美国专利第5,641,670号中一般描述的方法，可以改变内源人IFNA2基因的表达。在图5中显示了一个策略。在此策略中，设计的导向构建物包括与所述基因上游的第一个靶位点同源的第一个导向序列、可扩增的标记基因、选择性标记基因、调节区、加帽位点、外显子、剪接供体位点、内含子、剪接受体位点以及与所述第一个靶位点下游的第二个靶位点同源并终止于IFNA2编码序列之中或上游的第二个导向序列。按照此策略，为了避免在转录序列中的不需要的ATG起始密码子，所述第二个靶位点的5′末端最好小于正常IFNA2翻译起始位点上游的107bp。由同源重组基因座产生的转录物包括由所述构建物产生的外显子、由所述构建物产生的剪接供体位点、由所述构建物产生的内含子、由所述构建物产生的剪接受体位点、在任何这些元件之间的任何序列以及从所述构建物产生的剪接受体位点经整个内源编码序列至IFNA2基因的转录终止位点的序列。剪接此转录物将产生可以翻译产生人IFNA2前体的mRNA，它根据由所述构建物产生的外显子的特征，或者具有正常IFNA2分泌信号序列，或者具有基因工程分泌信号序列。外源内含子的大小和由此外源调节区相对于所述基因编码区的位置可以改变，以使所述调节区的功能最佳。

在任何活化策略中，所述第一个和第二个靶位点互相之间不需要紧接乃至相近。当它们互相之间不紧接时，IFNA2基因的正常上游区的一部分和/或所述编码区的一部分在同源重组时应缺失。

可以通过同源重组，将易于改变内源IFNA2表达的突变引入到染色体DNA中。例如，可能需要清除正确的ATG起始密码子上游和在同源重组基因座中所述外源调节区和所述内源IFNA2编码区之间的虚假的和不需要的ATG起始密码子。为了这样做，可以使用具有与跨过了不需要的ATG起始密码子的基因组位点同源的导向序列的导向构建物。此导向序列包含对应于目的突变的核苷酸，例如包含代替了ATG的ATT。所述导向构建物可选地包括一个或多个易于选择同源重组细胞的选择性标记。然后可以使用本发明的表达改变方法，将所述外源调节区引入到同源重组细胞上游的改变位点中。

另一方面，可以将所述外源调节区和目的序列突变在一步中引入到基因组DNA中。在此实施方案中使用的DNA构建物可以包含所述外源调节区和包含对应于目的突变的核苷酸的导向序列。也可以将两个单独的构建物共转染或共感染到靶细胞中，其中一个构建物包含所述调节区，而另一个构建物包含对应于目的突变的核苷酸。

如果需要，可以例如在不需要的ATG起始密码子和正确的ATG起始密码子之间的位点，以相似的方式，将哺乳动物剪接受体位点引入到所述基因组DNA中。用于此目的的DNA构建物包含导向序列，该序列与正确的IFNA2起始密码子的上游基因组位点同源，并邻近对应于目的剪接受体位点的同源序列或嵌入其中。然后用包含外源调节区和在其3′末端具有未配对的剪接供体位点的外显子的第二个构建物，与引导所述第二个构建物至插入的剪接受体位点的上游基因组区的导向序列一起，转染或感染包含正确重组的IFNA2基因座的细胞。在外源调节区控制下产生的初级转录物包括外源外显子、外源剪接供体位点、外源剪接受体位点、在这些元件之间的任何序列，以及在外源剪接受体位点和内源IFNA2基因的转录终止位点之间的序列。在剪接时，所述转录物的剪接供体位点被剪接至剪接受体位点，并将除去可能包含不需要的AUG起始密码子的间插内含子RNA。从而避免任何与在转录起始位点和IFNA2编码序列之间具有不需要的AUG翻译起始密码子的转录物相关的问题。当然，可以在一步中引入所述调节区、外显子、剪接供体位点和剪接受体位点来代替。在此实施方案中使用的DNA构建物包含调节区、外显子、剪接供体位点、内含子、剪接受体位点、与在正确的IFNA2起始密码子和不需要的ATG密码子之间的基因组位点同源的导向序列，以及可选地包括一个或多个选择性标记。另一方面，可以使用两个单独的导向构建物，其中一个包含所述调节区、所述外显子和所述剪接供体位点，而另一个包含所述剪接受体位点。可以将这两个构建物在一步中引入到靶细胞中。DNA构建物

本发明的DNA构建物至少包括导向序列和调节序列。它还可以包括外显子；或外显子和剪接供体位点；或外显子、剪接供体位点、内含子和剪接受体位点。在所述构建物中，如果所述外显子存在，则在所述调节序列的3′，而如果所述剪接供体位点存在，则在所述外显子的3′端。如果存在所述内含子和所述剪接受体位点，则在所述剪接供体位点的3′。另外，在所述构建物中可以有多个外显子和内含子(以及合适的剪接供体和受体位点)。在所述构建物中的DNA被认为是外源，因为该DNA不是宿主细胞基因组的原始部分。外源DNA可以具有与在通过病毒载体转染或感染之前的细胞中存在的部分内源基因组DNA相同或不同的序列。本文使用的“转染”是指通过非病毒(例如化学或物理)方法，诸如磷酸钙或氯化钙共沉淀、DEAE-葡聚糖介导的转染、脂质转染、电穿孔、微注射、微粒轰击或biolistic介导的吸收，将质粒引入到细胞中。“感染”是指通过病毒感染将病毒载体引入到细胞中。在下文详细描述了包括于本发明的DNA构建物中的各种元件。

所述DNA构建物还可以包括顺式作用或反式作用病毒序列(例如包装信号)，从而能够将所述构建物经病毒载体感染传递到细胞的核中。必要时，所述DNA构建物可以由病毒生活周期的各步(诸如在逆转录病毒中整合酶介导的整合或附加体维持)中脱离出来。通过病毒序列的合适的缺失或突变，诸如在逆转录病毒载体中整合酶编码区的缺失，可以实现脱离。关于所述构建物的其它细节和病毒载体的用途见于Robbins等人，Pharmacol.Ther.80:35-47,1998；和Gunzburg等人，Mol.Med.Today 1:410-417,1995，通过引用结合到本文中。导向序列

导向序列使得目的序列同源重组到在宿主基因组中选定位点。导向序列与其各自在宿主基因组中的靶位点同源(即能够与其同源重组)。

环状DNA构建物可以使用一个导向序列，或两个或两个以上单独的导向序列。线性DNA构建物可以包含两个或两个以上单独的导向序列。与已知的导向序列同源的靶位点可以位于IFNA2基因的编码区内、位于所述编码区的上游并紧接所述编码区或位于所述编码区的上游并距所述编码区有一段距离。

在所述构建物中的两个导向序列的第一个(或者如果在该构建物中只有一个导向序列，则是完整导向序列)得自新近公开的IFNA2编码序列的上游基因组区。此导向序列例如包含SEQ ID NO:12的一部分(例如20或更多个连续的核苷酸)、SEQ ID NO:7、8或13的一部分。

在所述构建物中的两个导向序列的第二个可以引导所述编码序列的上游基因组区或引导所述编码序列自身的部分或全部。作为实例，第二个导向序列可以在其3′末端含有与IFNA2编码序列的最初几个密码子相同的“外源”编码区。在同源重组时，所述外源编码区与内源IFNA2编码序列的目标部分重组。如果需要，所述外源编码区可以编码异源氨基酸序列，只要所述外源编码区与它替代的内源编码区保持足够的同源性，以能够同源重组。

所述导向序列另外可以包括得自以前公开的IFNA2基因区的序列，包括本文描述的那些区，以及在构建物上未特征鉴定但本领域技术人员可以作出图谱的上游更远的区。

可以利用基因组片段与包含全部或部分SEQ ID NO:12的探针杂交的能力鉴定用作导向序列的所述基因组片段。所述探针可使用得自SEQ ID NO:12的引物经PCR产生。调节序列

所述DNA构建物的调节序列可以包含一个或多个启动子(例如组成型启动子、组织特异性启动子或诱导型启动子)、增强子、支架结构连接区或基质附着部位、负调节元件、转录因子结合部位，或这些元件的组合。

所述调节序列可以得自真核生物(例如哺乳动物)或病毒基因组。有用的调节序列包括但不限于调节SV40早期或晚期基因、巨细胞病毒基因和腺病毒主要晚期基因表达的那些调节序列。它们还包括得自编码小鼠金属硫蛋白-Ⅰ、延伸因子-1α、胶原蛋白(例如胶原蛋白Ⅰα1、胶原蛋白Ⅰα2和胶原蛋白Ⅳ)、肌动蛋白(例如γ-肌动蛋白)、免疫球蛋白、HMG-辅酶A还原酶、甘油醛磷酸脱氢酶、3-磷酸甘油酸激酶、胶原酶、溶基质素、纤连蛋白、波形蛋白、纤溶酶原激活物抑制剂Ⅰ、胸腺素β4、组织金属蛋白酶抑制剂、核糖体蛋白、主要组织相溶性复合体分子和人淋巴细胞抗原的基因的调节区。

所述调节序列最好包含转录因子结合部位，诸如TATA框、CCAAT框、AP1、Sp1或NF-κB结合部位。标记基因

如果需要，所述构建物可以包括编码目的多肽、操作性连接至其自身启动子的序列。其实例应为选择性标记基因，它可用来易化对导向事件的鉴别。也可以包括可扩增的标记基因，它用来易化对具有共扩增的侧翼DNA序列的细胞的选择。可以通过在选择表达可扩增基因的介质存在下培养，鉴别包含扩增拷贝的可扩增标记基因的细胞。活化的内源IFNA2基因将同扩增的选择性标记基因串联扩增。包含多拷贝活化内源基因的细胞可以产生很高水平的IFNA2，并因此用于体外产生蛋白和基因治疗。

选择性标记基因和可扩增的标记基因互相之间不必处于紧接状态。可扩增的标记基因和选择性标记基因可以是相同的基因。一个或两个所述标记基因可以位于所述DNA构建物的内含子中。在美国专利第5,641,670中描述了合适的可扩增的标记基因和选择性标记基因。剪接供体位点和剪接受体位点

所述DNA构建物可以进一步包含外显子、在所述外显子的3′末端的剪接供体位点、内含子和剪接受体位点。

剪接供体位点是一种序列，它控制将RNA转录物的一个外显子剪接至该转录物的另一个外显子的剪接受体位点，从而除去在所述两个位点之间的内含子。通常，第一个外显子位于第二个外显子的5′，而位于第一个外显子的3′末端的所述剪接供体位点与位于第二个外显子5′侧的剪接受体位点匹配。剪接供体位点具有表征为(A/C)AGGURAGU(其中R表示嘌呤核苷酸)的共有序列，GU必须在第4和第5位(Jackson,Nucleic Acids Research 19:3715-3798,1991)。所述剪接供体共有位点的前三个碱基是所述外显子的后三个碱基：即它们未被剪除。剪接供体位点的功能定义为其对在mRNA剪接途径中合适反应的影响能力。

在本发明构建物中的剪接受体位点与剪接供体位点一起，控制将一个外显子剪接至另一个外显子。剪接受体位点具有表征为(Y)10NYAG(SEQ ID NO:10)的序列，其中Y表示任何嘧啶，而N表示任何核苷酸(Jackson,Nucleic Acids Research 19:3715-3798,1991)。加帽位点

所述DNA构建物可以可选地包含加帽位点。加帽位点是与所述调节区有关并由其使用的特异性转录起始位点。此加帽位点在所述构建物中位于相对于所述调节序列的位置，以便同源重组后，所述调节序列控制在所述加帽位点开始合成转录物。另一方面，在所述构建物中不包括加帽位点，转录装置将由于缺乏合适的位点而定位于用作加帽位点的靶基因中。另外的DNA元件

所述构建物可以另外包含影响通过同源重组产生的RNA或蛋白的构建物或稳定性的序列。所述DNA构建物可选地可以包括细菌复制起点和细菌抗生素抗性标记或其它的选择性标记，便于它们在细菌或任何其它合适的克隆/宿主系统中大规模繁殖质粒。

所述DNA构建物的所有上述元件互相之间都可操作性连接或以功能方式排列。即在所述构建物和靶基因组DNA之间同源重组时，所述调节序列可以操纵初级RNA转录物的生产，所述初级RNA转录物起始于加帽位点(可选地包括在所述构建物中)，并包括位于所述加帽位点和内源IFNA2基因转录终止位点之间的序列。根据所述加帽位点的位置，该序列的部分可以包括IFNA2基因内源调节区以及邻近该区的通常未被转录的序列。如果在所述构建物中存在外显子、剪接供体位点和剪接受体位点，则所述初级转录物也包括所述外显子、所述两个剪接位点和在这两个位点之间的所述内含子。

在所述DNA构建物中元件的顺序可以改变。当所述构建物是环状质粒或病毒载体时，在产生的结构中元件的相对顺序例如可以是：导向序列、质粒DNA(包含在微生物和其它适合的宿主中用于选择和/或复制导向质粒的序列)、选择性标记、调节序列、外显子、剪接供体位点、内含子和剪接受体位点。

当所述构建物为线性时，该顺序例如可以是：第一个导向序列、选择性标记基因、调节序列、外显子、剪接供体位点、内含子、剪接受体位点和第二个导向序列；或为另一种顺序：第一个导向序列、调节序列、外显子、剪接供体位点、内含子、剪接受体位点、选择性标记基因、可选的内部核糖体进入位点和第二个导向序列。

另一方面，所述顺序可以是：第一个导向序列、第一个选择性标记基因、调节序列、外显子、剪接供体位点、内含子、剪接受体位点、第二个导向序列和第二个选择性标记基因；或为：第一个导向序列、调节序列、外显子、剪接供体位点、内含子、剪接受体位点、第一个选择性标记基因、第二个导向序列和第二个选择性标记基因。在位于所述第一个选择性标记侧翼的导向序列和在宿主基因组中的同源序列之间的重组导致对所述第一个选择性标记的目的整合，而所述第二个选择性标记未被整合。目的转染或感染的细胞是那些用第一个选择性标记而不是第二个选择性标记稳定转染或感染的细胞。可以通过在包含选择表达第一个标记的介质和选择抗第二个标记的另一种介质的培养基中生长，选择这样的细胞。预计已通过非同源重组机制不正确整合导向构建物的转染或感染的细胞应表达所述第二个标记基因，从而在所选择培养基中被杀死。

有时在所述构建物中包括正选择性标记，以便于选择包含扩增拷贝的该标记的细胞。在此实施方案中，构建物元件的顺序例如可以是：第一个导向序列、可扩增的正选择性标记、第二个选择性标记(可选)、调节序列、外显子、剪接供体位点、内含子、剪接受体位点和第二个导向DNA序列。

所述构建物的各种元件可以由天然来源(例如基因组DNA)获得，或者可以使用基因工程技术或合成方法产生。所述构建物的调节区、加帽位点、剪接供体位点、内含子、剪接受体位点可以作为完整单元由例如人延伸因子-1α(GenBank序列HUMEF1A)基因或巨细胞病毒(GenBank序列HEHCMVP1)立即早期区中分离。这些元件还可以由单独的基因分离。转染或感染和同源重组

可以将本发明的DNA构建物作为单个DNA构建物或作为单独的DNA序列加入到转染或感染细胞的染色体或核DNA中，引入到诸如初级细胞、次级细胞或无限增殖化细胞的细胞中。所述“转染细胞”是指通过非使用病毒载体的方法将DNA或RNA分子引入到其中(或其祖细胞中)的细胞。所述“感染细胞”是指使用病毒载体将DNA或RNA分子引入到其中(或其祖细胞中)的细胞。已知用作载体的病毒包括腺病毒、腺伴随病毒、疱疹病毒、腮腺炎病毒、脊髓灰质炎病毒、慢病毒、逆转录病毒、Sindbis病毒和诸如金丝雀痘病毒的牛痘病毒。所述DNA可以作为线性、双链(在一个或两个末端具有或不具有单链区)、单链或环状分子引入。当将所述构建物以两个独立的DNA片段引入到宿主细胞中时，所述两个片段在一个片段的3′末端和在另一个片段的5′末端具有DNA序列同源性(重叠)，同时一个片段具有第一个导向序列，而另一个片段具有第二个导向序列。当引入到细胞中时，所述两个片段可以进行同源重组，以形成具有第一个和第二个导向序列的单个分子，该分子位于在原来两个片段之间的重叠区侧翼。于是产物分子的形式适于和细胞靶位点同源重组。可以使用多于两个的片段，设计它们中的每一个，以使它们互相之间进行同源重组，最终形成适于同如上所述的细胞靶位点同源重组的产物。

本发明的DNA构建物如果自身不含有选择性标记，则其可与包含这种标记的另一个构建物共转染或共感染。可以用限制酶在一个或多个位点切割导向质粒，以在转染或感染前产生线性或有间隙的分子。产生的游离DNA末端增加了目的同源重组事件的发生频率。此外，可以用外切核酸酶处理所述游离的DNA末端，以产生突出的5′或3′单链DNA末端(例如至少30个核苷酸长，最好100-1000个核苷酸长)，增加目的同源重组事件的发生频率。在此实施方案中，在所述导向序列和基因组靶之间的同源重组将产生两个拷贝所述导向序列，位于包含在引入的质粒中的元件侧翼。

可以通过各种物理或化学方法，包括电穿孔、微注射、微粒轰击、磷酸钙沉淀、脂质体传递或聚凝胺(Polybrene)或DEAE葡聚糖介导的转染，(最好在体外)将所述DNA构建物转染到细胞中。

如本领域所述，将转染或感染的细胞保持在允许同源重组的条件下(参阅例如Capecchi,Science 24:1288-1292,1989)。当将所述同源重组细胞保持在足以允许所述DNA转录的条件下时，由所述DNA构建物引入的调节区将改变IFNA2基因的转录。

可以通过表型筛选或通过用针对IFNA2的酶联免疫吸附测定(ELISA)分析培养上清液，鉴定同源重组细胞(即已进行目的同源重组的细胞)。可由Biosource International(Camarillo,CA)获得检测IFNA2的市售ELISA试剂盒。还可以通过DNA和RNA印迹分析或通过聚合酶链式反应(PCR)筛选，鉴定同源重组细胞。

本文使用的术语“初级细胞”包括(ⅰ)存在于分离自脊椎动物组织源的细胞悬浮液中的细胞(在它们贴壁之前，即粘附到在诸如碟或烧瓶中的组织培养支持底物之前)，(ⅱ)存在于得自组织的外植块中的细胞，(ⅲ)第一次贴壁培养的细胞，和(ⅳ)由这些贴壁培养细胞产生细胞悬浮液。初级细胞也可以是在人或动物中天然产生的细胞。

次级细胞是在随后的所有步骤培养的细胞。即从培养支持底物除去第一次贴壁培养的初级细胞并再次平板培养(传代细胞)，本文将它们称为次级细胞，包括在随后传代中的所有细胞。次级细胞株包括已经传代一次或几次的次级细胞。通常次级细胞在培养中具有有限数目的平均群体倍增，并具有接触抑制、贴壁依赖性生长的特性(贴壁依赖性不适用于在悬浮培养中繁殖的细胞)。初级和次级细胞不是无限增殖的。

无限增殖化细胞是在培养中具有明显地非限制性生命期的细胞系(与细胞株相反，所述定义“株”专用于初级和次级细胞)。

选择性用于转染或感染的细胞可以分为四种类型或四类：(ⅰ)获得的产生或包含不超过痕量的IFNA2蛋白的细胞，(ⅱ)产生或包含蛋白的细胞，但蛋白量不同于所需的量(诸如其量低于所获得的细胞类型生理正常的水平)，(ⅲ)在所获得的细胞类型以生理正常的水平产生所述蛋白的细胞，但其含量或产量可增大或增强，和(ⅳ)需要改变其中的编码所述蛋白的基因的调节或诱导形式的细胞。

通过本发明方法转染或感染的初级、次级和无限增殖化细胞可以由各种组织获得并包括可以在培养中保持的所有合适的细胞类型。例如，合适的初级和次级细胞包括成纤维细胞、角质形成细胞、上皮细胞(例如乳房上皮细胞、肠上皮细胞)、内皮细胞、神经胶质细胞、神经细胞、血液的组成成分(例如淋巴细胞、骨髓细胞)、肌细胞和这些体细胞类型的前体。当要在基因治疗中使用所述同源重组细胞时，最好由要给予转染或感染初级或次级细胞的个体获得初级细胞。然而，可以由上述物种的供体(即不是受体的个体)获得初级细胞。

用于蛋白产生或基因治疗的无限增殖化人细胞系的实例包括但不限于，2780AD卵巢癌细胞(Van der Blick等，Cancer Res.,48:5927-5932,1988)、A549(美国典型培养物保藏中心(“ATCC”)CCL185)、BeWo(ATCC CCL 98)、Bowes黑素瘤细胞(ATCC CRL9607)、CCRF-CEM(ATCC CCL 119)、CCRF-HSB-2(ATCC CCL120.1)、COLO201(ATCC CCL 224)、COLO205(ATCC CCL 222)、COLO320DM(ATCC CCL 220)、COLO 320HSR(ATCC CCL 220.1)、Daudi细胞(ATCC CCL 213)、Detroit 562(ATCC CCL 138)、HeLa细胞及HeLa细胞衍生物(ATCC CCL 2、2.1和2.2)、HCT116(ATCCCCL 247)、HL-60细胞(ATCC CCL 240)、HT1080细胞(ATCC CCL121)、IMR-32(ATCC CCL 127)、Jurkat细胞(ATCC TIB 152)、K-562白血病细胞(ATCC CCL 243)、KB癌细胞(ATCC CCL 17)、KG-1(ATCC CCL 246)、KG-1a(ATCC CCL 246.1)、LS123(ATCC CCL255)、LS174T(ATCC CCL CL-188)、LS180(ATCC CCL CL-187)、MCF-1乳癌细胞(ATCC BTH 22)、MOLT-4细胞(ATCC CRL 1582)、Namalwa细胞(ATCC CRL 1432)、NCI-H498(ATCC CCL 254)、NCI-H508(ATCC CCL 253)、NCI-H548(ATCC CCL 249)、NCI-H716(ATCC CCL 251)、NCI-H747(ATCC CCL 252)、NCI-H1688(ATCC CCL 257)、NCI-H2126(ATCC CCL 256)、Raji细胞(ATCC CCL 86)、RD(ATCC CCL 136)、RPMI 2650(ATCC CCL30)、RPMI 8226细胞(ATCC CCL 155)、SNU-C2A(ATCC CCL250.1)、SNU-C2B(ATCC CCL 250)、SW-13(ATCC CCL 105)、SW48(ATCC CCL 231)、SW403(ATCC CCL 230)、SW480(ATCCCCL 227)、SW620(ATCC CCL 227)、SW837(ATCC CCL 235)、SW948(ATCC CCL 237)、SW1116(ATCC CCL 233)、SW1417(ATCCCCL 238)、SW1463(ATCC CCL 234)、T84(ATCC CCL 248)、U-937细胞(ATCC CRL 1593)、WiDr(ATCC CCL 218)和WI-38VA13亚系2R4细胞(ATCC CCL 75.1)以及通过融合人细胞和其它物种的细胞产生的异种杂交瘤细胞。可以使用次级人成纤维细胞株，诸如WI-38(ATCC CCL 75)和MRC-5(ATCC CCL 171)。此外，初级、次级或无限增殖化人细胞，以及来自其它物种的初级、次级或无限增殖化细胞，可以用于体外产生蛋白或基因治疗。表达IFNA-2的细胞

本发明的同源重组细胞在所需的水平上表达IFNA2，并用于体外产生IFNA2和基因治疗。产生蛋白

按照本发明的同源重组细胞可以用于体外生产IFNA2。所述细胞保持在本领域描述的导致表达蛋白的条件下。可以由细胞裂解物或细胞上清液中纯化所述IFNA2蛋白。可以通过本领域已知的常规药物途径(例如口服、静脉内、肌内、鼻内、肺、跨粘膜、皮内、直肠、鞘内、经皮肤、皮下、腹膜内或病灶内)，将包含所述IFNA2蛋白的药用组合物传递给人或动物。口服给予可能需要采取保护蛋白以免在胃肠道降解的措施：例如包囊在聚合的微囊中。基因治疗

本发明的同源重组细胞用作同源重组细胞系群、同源重组初级或次级细胞群、同源重组克隆细胞株或细胞系、同源重组异源细胞株或细胞系以及细胞混合物，在该混合物中至少存在一种代表前述四类同源重组细胞之一的细胞。这些细胞可在传递体系中用于治疗(ⅰ)由诸如乳头瘤病毒、乙型肝炎和丙型肝炎病毒、牛痘、单纯疱疹病毒、水痘样带状疱疹病毒和鼻病毒的病毒引起的感染，和(ⅱ)任何其它可用IFNA2治疗的病症。

将同源重组初级细胞、克隆细胞株或异源细胞株以足够的量通过合适的途径，给予需要治疗或预防异常或不良症状的个体，以表达或产生在生理学相关水平上有效的蛋白或外源DNA。生理学相关水平接近体内通常产生所述产物的水平或为导致异常或不良症状改善的水平。如果所述细胞与具有免疫能力的受体同源，则所述细胞可以静脉内、动脉内、皮下、腹膜内、网膜内、肾下囊(subrenal capsularly)、鞘内、颅内或肌内给予或植入。

如果所述细胞不同源而所述受体具有免疫能力，则可以将要给予的所述同源重组细胞封入一个或多个半透性屏障装置中。所述装置的渗透性特性使得在将所述细胞植入到受治疗者中时防止其离开所述装置，但治疗性蛋白可以自由透过，并可以离开所述屏障装置进入植入体附近的局部区域或进入体循环。参见例如美国专利第5,641,670、5,470,731、5,620,883、5,487,737号和1999年4月16日提交的标题为“治疗性蛋白的传递”的共有美国专利申请(发明人：Justin C,Lamsa和Douglas A.Treco)，所有这些文献都通过引用结合到本文中。所述屏障装置可以在任何合适的位置植入：例如腹膜内、鞘内、皮下、肌内、肾囊内或网膜内。

屏障装置特别有用，使得可以植入同源重组无限增殖化细胞、来自其它物种的同源重组细胞(同源重组异种细胞)或来自非组织相容性匹配供体的细胞(同源重组同种异体细胞)治疗患者。所述装置将细胞保留在体内的固定位置，同时保护所述细胞免受宿主免疫系统的排斥。当治疗方案由于任一原因要停止时，屏障装置还通过使所述细胞立即去除，提供方便的短期(即瞬时)治疗。在没有用于短期基因治疗的屏障装置的情况下，也可以使用转染或感染的异种细胞和同种异体细胞。在此情况下，将在体内传递由所述细胞产生的IFNA2，直至宿主的免疫系统排斥所述细胞为止。

为此目的可以使用许多合成、半合成或天然的滤膜，包括但不限于纤维素、乙酸纤维素、硝化纤维、聚砜、聚偏二氟乙烯、聚氯乙烯聚合物和聚氯乙烯衍生物的聚合物。可以使用屏障装置，以使得来自其它物种的初级、次级或无限增殖化细胞用于对人的基因治疗。

用于本发明的基因治疗的另一类装置是其中嵌入所述细胞的可植入的胶原基质。在WO 97/15195中描述了这种可以包含将所述细胞附着于微珠上的装置，该文献通过引用结合到本文中。所述装置可以如上所述植入。

给予剂量或植入需要的细胞的数量取决于几种因素，包括所述蛋白的表达水平、宿主动物的大小和状态以及与植入方法相关的限制。通常在成年人或其它类似大小的动物中植入的细胞的数量在1×10⁴至5×10¹⁰的范围内，最好为1×10⁸至1×10⁹。如果需要，它们可以在患者的多个部位同时或者在几个月或几年的时间内植入。所述剂量可以根据需要重复。保藏

根据国际承认用于专利程序的微生物保存布达佩斯条约的条款，质粒pA2HB于1998年5月12日保藏在美国典型培养物保藏中心(ATCC),Rockville,MD，美国。获得的保藏号为209872。

申请人的代理机构Transkaryotic Therapies,Inc.表示ATCC是提供永久保藏的保藏单位，并且如果专利获得批准，则公众立即可以由该单位获得保藏物。一旦批准了专利，则所有关于公众获得如此保藏的物质的限制都不可挽回地被取消。在专利未决期间，专利局局长根据37 CFR 1.14和35 U.S.C.§122的授权确定的人将可获得所述物质。对保藏物质的保藏必须非常注意，以在提供保藏物质样品的最近要求之后至少5年，并在任何情况下，在保藏日后至少30年或在专利实施期内(无论哪个时间都更长)保持其存活并不受污染。申请人的代理机构承认他们的责任是，如果要求提供样品时由于所述保藏物的情况保藏机构不能提供样品，则更换所述保藏物。

其它实施方案

应当理解，虽然已经描述了本发明及其详述，但先前的描述意在说明，并不限制由所附权利要求书的范围确立的本发明的范围。

其它方面、优势和修改在以下权利要求书的范围内。

序列表<110>Transkaryotic Therapies Inc.<120>用于产生和传递蛋白的基因组序列<130>07236/018WO1<150>US 60/086,555<151>1998年5月21日<150>US 60/084,648<151>1998年5月7日<160>19<170>FastSEQ for Windows，版本3.0<210>1<211>1733<212>DNA<213>Homo sapiens<400>1gcgcctctta tgtacccaca aaaatctatt ttcaaaaaag ttgctctaag aatatagtta 60tcaagttaag taaaatgtca atagcctttt aatttaattt ttaattgttt tatcattctt 120tgcaataata aaacattaac tttatacttt ttaatttaat gtatagaata gagatataca 180taggatatgt aaatagatac acagtgtata tgtgattaaa atataatggg agattcaatc 240agaaaaaagt ttctaaaaag gctctggggt aaaagaggaa ggaaacaata atgaaaaaaa 300tgtggtgaga aaaacagctg aaaacccatg taaagagtgt ataaagaaag caaaaagaga 360agtagaaagt aacacagggg catttggaaa atgtaaacga gtatgttccc tatttaaggc 420taggcacaaa gcaaggtctt cagagaacct ggagcctaag gtttaggctc acccatttca 480accagtctag cagcatctgc aacatetaca atggccttga cctttgcttt actggtggcc 540ctcctggtgc tcagctgcaa gtcaagctgc tctgtgggct gtgatctgcc tcaaacccac 600agcctgggta gcaggaggac cttgatgctc ctggcacaga tgaggagaat ctctcttttc 660tcctgcttga aggacagaca tgactttgga tttccccagg aggagtttgg caaccagttc 720caaaaggctg aaaccatccc tgtcctccat gagatgatcc agcagatctt caatctcttc 780agcacaaagg actcatctgc tgcttgggat gagaccctcc tagacaaatt ctacactgaa 840ctctaccagc agctgaatga cctggaagcc tgtgtgatac agggggtggg ggtgacagag 900actcccctga tgaaggagga ctccattctg gctgtgagga aatacttcca aagaatcact 960ctctatctga aagagaagaa atacagccct tgtgcctggg aggttgtcag agcagaaatc 1020atgagatctt tttctttgtc aacaaacttg caagaaagtt taagaagtaa ggaatgaaaa 1080ctggttcaac atggaaatga ttttcattga ttcgtatgcc agctcacctt tttatgatct 1140gccatttcaa agactcatgt ttctgctatg accatgacac gatttaaatc ttttcaaatg 1200tttttaggag tattaatcaa cattgtattc agctcttaag gcactagtcc cttacagagg 1260accatgctga ctgatccatt atctatttaa atatttttaa aatattattt atttaactat 1320ttataaaaca acttattttt gttcatatta tgtcatgtgc acctttgcac agtggttaat 1380gtaataaaat gtgttctttg tatttggtaa atttattttg tgttgttcat tgaacttttg 1440ctatggaact tttgtacttg tttattcttt aaaatgaaat tccaagccta attgtgcaac 1500ctgattacag aataactggt acacttcatt tgtccatcaa tattatattc aagatataag 1560taaaaataaa ctttctgtaa accaagttgt atgttgtact caagataaca gggtgaacct 1620aacaaataca attctgctct cttgtgtatt tgatttttgt atgaaaaaaa ctaaaaatgg 1680taatcatact taattatcag ttatggtaaa tggtatgaag agaagaagga acg 1733<210>2<211>188<212>蛋白<213>Homo sapiens<400>2 Met Ala Leu Thr Phe Ala Leu Leu Val Ala Leu Leu Val Leu Ser Cys

1 5 10 15Lys Ser Ser Cys Ser Val Gly Cys Asp Leu Pro Gln Thr His Ser Leu

20 25 30Gly Ser Arg Arg Thr Leu Met Leu Leu Ala Gln Met Arg Arg Ile Ser

35 40 45Leu Phe Ser Cys Leu Lys Asp Arg His Asp Phe Gly Phe Pro Gln Glu

50 55 60Glu Phe Gly Asn Gln Phe Gln Lys Ala Glu Thr Ile Pro Val Leu His65 70 75 80Glu Met Ile Gln Gln Ile Phe Asn Leu Phe Ser Thr Lys Asp Ser Ser

85 90 95Ala Ala Trp Asp Glu Thr Leu Leu Asp Lys Phe Tyr Thr Glu Leu Tyr

100 105 110Gln Gln Leu Asn Asp Leu Glu Ala Cys Val Ile Gln Gly Val Gly Val

115 120 125Thr Glu Thr Pro Leu Met Lys Glu Asp Ser Ile Leu Ala Val Arg Lys

130 135 140Tyr Phe Gln Arg Ile Thr Leu Tyr Leu Lys Glu Lys Lys Tyr Ser Pro145 150 155 160Cys Ala Trp Glu Val Val Arg Ala Glu Ile Met Arg Ser Phe Ser Leu

165 170 l75Ser Thr Asn Leu Gln Glu Ser Leu Arg Ser Lys Glu

180 185<210> 3<211> 24<212> DNA<213> Homo sapiens<400> 3agtttctaaa aaggctctgg ggta 24<210> 4<211> 19<212> DNA<213> Homo sapiens<400> 4gcccacagag cagcttgac 19<210> 5<211> 25<212> DNA<213> Homo sapiens<400> 5aaagactcat gtttctgcta tgacc 25<210> 6<211> 24<212> DNA<213> Homo sapiens<400> 6ggtgcacatg acataatatg aaca 24<210> 7<211> 278<212> DNA<213> Homo sapiens <400> 7aagcttttat aggtgtaaat tttccactta gtactgcttt tgtaatgttg tctttttatt 60ttcatttatc tcaagatgtt ttctaatttc tcttgacttc cttcttaaat tcttacctca 120tgtagacata catttttggc cctatgcatt gggatgcaaa accagactaa tttactttgt 180acaaaaagaa aaatgagaaa gaaatatatt tggtcttgtg agcactatat ggaaatactt 240tatattccat ttgtttcatc atattcatat atcccttt 278<210> 8<211> 73<212> DNA<213> Homo sapiens<400> 8cattggatac tccatcacct gctgtgatat tatgaatgtc tgcctatata aatattcact 60attccataac aca 73<210> 9<211> 1806<212> DNA<213> Homo sapiens<400> 9cattggatac tccatcacct gctgtgatat tatgaatgtc tgcctatata aatattcact 60attccataac acagcgcctc ttatgtaccc acaaaaatct attttcaaaa aagttgctct 120aagaatatag ttatcaagtt aagtaaaatg tcaatagcct tttaatttaa tttttaattg 180ttttatcatt ctttgcaata ataaaacatt aactttatac tttttaattt aatgtataga 240atagagatat acataggata tgtaaataga tacacagtgt atatgtgatt aaaatataat 300gggagattca atcagaaaaa agtttctaaa aaggctctgg ggtaaaagag gaaggaaaca 360ataatgaaaa aaatgtggtg agaaaaacag ctgaaaaccc atgtaaagag tgtataaaga 420aagcaaaaag agaagtagaa agtaacacag gggcatttgg aaaatgtaaa cgagtatgtt 480ccctatttaa ggctaggcac aaagcaaggt cttcagagaa cctggagcct aaggtttagg 540ctcacccatt tcaaccagtc tagcagcatc tgcaacatct acaatggcct tgacctttgc 600tttactggtg gccctcctgg tgctcagctg caagtcaagc tgctctgtgg gctgtgatct 660gcctcaaacc cacagcctgg gtagcaggag gaccttgatg ctcctggcac agatgaggag 720aatctctctt ttctcctgct tgaaggacag acatgacttt ggatttcccc aggaggagtt 780tggcaaccag ttccaaaagg ctgaaaccat ccctgtcctc catgagatga tccagcagat 840cttcaatctc ttcagcacaa aggactcatc tgctgcttgg gatgagaccc tcctagacaa 900attctacact gaactctacc agcagctgaa tgacctggaa gcctgtgtga tacagggggt 960gggggtgaca gagactcccc tgatgaagga ggactccatt ctggctgtga ggaaatactt 1020ccaaagaatc actctctatc tgaaagagaa gaaatacagc ccttgtgcct gggaggttgt 1080cagagcagaa atcatgagat ctttttcttt gtcaacaaac ttgcaagaaa gtttaagaag 1140taaggaatga aaactggttc aacatggaaa tgattttcat tgattcgtat gccagctcac 1200ctttttatga tctgccattt caaagactca tgtttctgct atgaccatga cacgatttaa 1260atcttttcaa atgtttttag gagtattaat caacattgta ttcagctctt aaggcactag 1320tcccttacag aggaccatgc tgactgatcc attatctatt taaatatttt taaaatatta 1380tttatttaac tatttataaa acaacttatt tttgttcata ttatgtcatg tgcacctttg 1440cacagtggtt aatgtaataa aatgtgttct ttgtatttgg taaatttatt ttgtgttgtt 1500cattgaactt ttgctatgga acttttgtac ttgtttattc tttaaaatga aattccaagc 1560ctaattgtgc aacctgatta cagaataact ggtacacttc atttgtccat caatattata 1620ttcaagatat aagtaaaaat aaactttctg taaaccaagt tgtatgttgt actcaagata 1680acagggtgaa cctaacaaat acaattctgc tctcttgtgt atttgatttt tgtatgaaaa 1740aaactaaaaa tggtaatcat acttaattat cagttatggt aaatggtatg aagagaagaa 1800ggaacg 1806<210> 10<211> 4090<212> DNA<213> Homo sapiens<400> 10aagcttttat aggtgtaaat tttccactta gtactgcttt tgtaatgttg tctttttatt 60ttcatttatc tcaagatgtt ttctaatttc tcttgacttc cttcttaaat tcttacctca 120tgtagacata catttttggc cctatgcatt gggatgcaaa accagactaa tttactttgt 180acaaaaagaa aaatgagaaa gaaatatatt tggtcttgtg agcactatat ggaaatactt 240tatattccat ttgtttcatc atattcatat atccctttac taacataaag ctgaaggtga 300ataaaaaaat cagggttagc caaacaaatt ttcatggtca aataccacat aaaaagtaaa 360tatacttaag ttcccagcaa aatctgaatt gaacgtagac aaaatgctca tttctcagtg 420tttgacagac ttaacagttt gagccaataa aaatgtactg actagataaa ctactaaaag 480ttgttaattt ttgcaatgta tatttctgaa aagaaagttt atctattata gaaattcctg 540tgcccattta agaactttga gcattttaat tgtttaataa tatagtttaa ttgcatcatg 600aaaataatca ataatacaat ttatttggtt tatttaaaaa aactgattct ttctgctctc 660tctatatata gactgatttt atactaatgt tgcctaaaga tcaccaaatt gtttgaagcc 720taggtttctg agggatggaa aatgatgtca caactattta cagttcacac acacattctg 780gggatttaat acatccttta caagtgcagg aaaggtggaa gattgatgat ttgggggaat 840tagagctacc acaccccaga gggtggtatg gtatgttgtc tgttgtgagc tgtgtgaatc 900agagagtttg atttagacat atatttagaa agaggaaaga tgaaccaatc aaaaataata 960actataatga cttttcaaga tatagacaat acagttaaga tataaatgga aacaaaaaaa 1020gttaaaagtg gggagatgaa gtctgatttt ttggtttttt tttttttttg cttttttgtt 1080tgtttatgta atcagtgtta ccagtttaaa ataatgggtt ataagacact atatgcaagc 1140 ctcatggtaa cctccaatct aaaacataca acaaatacac acaaaataaa aaggagaaat 1200taaaacacac caccagagaa aatcacctac attaaaagaa agacaaatag gaagaaaata 1260agaaagagaa ggccatcaaa taatcagaaa atgaataaca aaatgacagg aataagtcct 1120cataaataat aacattgaat gtaaatggac taagctctcc aatgaaagac agggagtggc 1380tgaatgtatt ttaaaaaaaa tattacaccg agctgtgcgt ggtgtctcac acctataatc 1440ccagcatttt gggagactga gccgggtgga tcacttgagc ccaggagttc gagaccagcc 1500tggccaacat ggcaaaaccc tgtctctact aaaaatacaa aaaattagct gaacatggtg 1560gcacatgcct gtggttccag ctactagaga ggctgaggca gaagaattgc ttgaacttgg 1620gaggtggagg ttgcagtgag ctaagattga tggagccact gcaccccagc ctaggtgaca 1680gaataagact ctgcctcaaa aaaaaaaagc aaaacaaaac aaaacaaaaa acccttagac 1740ccaatgattc attgcctaca agaagtatgc ttcaccttta aagacacata tagactgaag 1800gtaaagggat ggaaaaatat tctatgccta tggaaacaaa caaaaagaag cagaagctac 1860atttatatca gacaaaatag actgcaagac aaaaactatg aaaagagaga aagaaggtca 1920ttatatagtg ataaaggggt ccatttagca agagcattta acaattctaa atatatattc 1980acccaatact ggagtactca ggtatataaa gcaaatatta ttagagccaa agagagagat 2040agacagaccc ccatacaata ataactggag acttcaacac cccactttca gcattggaca 2100gatcatccag acagaaaatt aacaaacatc aaatttcatc tgcaccatag gtcaaatgga 2160cctagtagat atttacagaa catttgatcc aacagctgta gaatacacat tcttctcctc 2220agcacatgga taattctcaa ggatatacca aatgctaggt cacaaaacaa atcttaaaat 2280ttagaaaaaa agtgaaataa tatcaaacgt tttctctcac cacagactaa gaaaaaaaga 2340agtcccaaat aaatacaatc tgagataaaa aaggagacga gacaaccaat accacaaaaa 2400attaaaggat cattagaaga tactatgaaa ctatatgcta ataaattgga aaacctgaac 2460aaaatagata attcctagaa acatacaaca tactggtctg ttcaggtttt gtattttttc 2520atagtaccat gaagaaatac aagaattgtt tctagaacca ttcttgtatt tcttcatggt 2580ttttgtattt cttcatggaa ccatgaagaa atacaaaatg tgaacaggcc aataacaagt 2640aatgagacag aagccatact aaaaagtatc ccagaaaaga actcaggatc tgatggcttc 2700actgatgaat tttgccaaat atttaaaaaa ctaataccaa tccaactcaa attattaaaa 2760aaatagaggt ggacagaatc tttccaaatg tattctatga ggccagtgtt ttttctgatt 2820gaatctccca ttatatttta atcacatata aaaccagaga aagacacatt aaaaagaaag 2880aaaactgtag gccaatatct ctgatgaaca ttgatgcaga aatcctcaac aacaaattag 2940caaactgaat tcaagaacac attaaaacaa tcattcatca tgaccaagtg gaatttgtcc 3000tagagattca agtgtggtta ggtatgtgca gatcaatggg tttaatgttg tccaatgaac 3060ataatgtcct ccagctccat ccatgttctt gcaaatgaca ggatctcatt cttttttatg 3120gctaagtagt actccattgt gtataagtgc catattttct ttatccattc atctgttaga 3180cacctaagtt gcttccaaat cttagctatt gtgaatagtg ctgcaataaa catgggagtg 3240taaatatttt gttgacatac tgatttcatt tcctttggat aaatacccag tagtgggatt 3300gctggatcat atgggggaaa atggagatgg ctaacgggct caaaaatata gttagaaaaa 3360atgaatatga tttagtattc gatagcacaa taggatgact actgttaatg ataatttatt 3420atatattata aaataactaa aatagtataa atgggatgta tgtagcagag agaaatgata 3480aatgtttgaa gcattggata ctccatcacc tgctgtgata ttatgaatgt ctgcctatat 3540aaatattcac tattccataa cacagcgcct cttatgtacc cacaaaaatc tattttcaaa 3600aaagttgctc taagaatata gttatcaagt taagtaaaat gtcaatagcc ttttaattta 3660atttttaatt gttttatcat tctttgcaat aataaaacat taactttata ctttttaatt 3720taatgtatag aatagagata tacataggat atgtaaatag atacacagtg tatatgtgat 3780taaaatataa tgggagattc aatcagaaaa aagtttctaa aaaggctctg gggtaaaaga 3840ggaaggaaac aataatgaaa aaaatgtggt gagaaaaaca gctgaaaacc catgtaaaga 3900gtgtataaag aaagcaaaaa gagaagtaga aagtaacaca ggggcatttg gaaaatgtaa 3960acgagtatgt tccctattta aggctaggca caaagcaagg tcttcagaga acctggagcc 4020taaggtttag gctcacccat ttcaaccagt ctagcagcat ctgcaacatc tacaatggcc 4080ttgacctttg 4090<210> 11<211> 3564<212> DNA<213> Homo sapiens<400> 11aagcttttat aggtgtaaat tttccactta gtactgcttt tgtaatgttg tctttttatt 60ttcatttatc tcaagatgtt ttctaatttc tcttgacttc cttcttaaat tcttacctca 120tgtagacata catttttggc cctatgcatt gggatgcaaa accagactaa tttactttgt 180acaaaaagaa aaatgagaaa gaaatatatt tggtcttgtg agcactatat ggaaatactt 240tatattccat ttgtttcatc atattcatat atccctttac taacataaag ctgaaggtga 300ataaaaaaat cagggttagc caaacaaatt ttcatggtca aataccacat aaaaagtaaa 360tatacttaag ttcccagcaa aatctgaatt gaacgtagac aaaatgctca tttctcagtg 420tttgacagac ttaacagttt gagccaataa aaatgtactg actagataaa ctactaaaag 480ttgttaattt ttgcaatgta tatttctgaa aagaaagttt atctattata gaaattcctg 540tgcccattta agaactttga gcattttaat tgtttaataa tatagtttaa ttgcatcatg 600 aaaataatca ataatacaat ttatttggtt tatttaaaaa aactgattct ttctgctctc 660tctatatata gactgatttt atactaatgt tgcctaaaga tcaccaaatt gtttgaagcc 720taggtttctg agggatggaa aatgatgtca caactattta cagttcacac acacattctg 780gggatttaat acatccttta caagtgcagg aaaggtggaa gattgatgat ttgggggaat 840tagagctacc acaccccaga gggtggtatg gtatgttgtc tgttgtgagc tgtgtgaatc 900agagagtttg atttagacat atatttagaa agaggaaaga tgaaccaatc aaaaataata 960actataatga cttttcaaga tatagacaat acagttaaga tataaatgga aacaaaaaaa 1020gttaaaagtg gggagatgaa gtctgatttt ttggtttttt tttttttttg cttttttgtt 1080tgtttatgta atcagtgtta ccagtttaaa ataatgggtt ataagacact atatgcaagc 1140ctcatggtaa cctccaatct aaaacataca acaaatacac acaaaataaa aaggagaaat 1200taaaacacac caccagagaa aatcacctac attaaaagaa agacaaatag gaagaaaata 1260agaaagagaa ggccatcaaa taatcagaaa atgaataaca aaatgacagg aataagtcct 1320cataaataat aacattgaat gtaaatggac taagctctcc aatgaaagac agggagtggc 1380tgaatgtatt ttaaaaaaaa tattacaccg agctgtgcgt ggtgtctcac acctataatc 1440ccagcatttt gggagactga gccgggtgga tcacttgagc ccaggagttc gagaccagcc 1500tggccaacat ggcaaaaccc tgtctctact aaaaatacaa aaaattagct gaacatggtg 1560gcacatgcct gtggttccag ctactagaga ggctgaggca gaagaattgc ttgaacttgg 1620gaggtggagg ttgcagtgag ctaagattga tggagccact gcaccccagc ctaggtgaca 1680gaataagact ctgcctcaaa aaaaaaaagc aaaacaaaac aaaacaaaaa acccttagac 1740ccaatgattc attgcctaca agaagtatgc ttcaccttta aagacacata tagactgaag 1800gtaaagggat ggaaaaatat tctatgccta tggaaacaaa caaaaagaag cagaagctac 1860atttatatca gacaaaatag actgcaagac aaaaactatg aaaagagaga aagaaggtca 1920ttatatagtg ataaaggggt ccatttagca agagcattta acaattctaa atatatattc 1980acccaatact ggagtactca ggtatataaa gcaaatatta ttagagccaa agagagagat 2040agacagaccc ccatacaata ataactggag acttcaacac cccactttca gcattggaca 2100gatcatcaag acagaaaatt aacaaacatc aaatttcatc tgcaccatag gtcaaatgga 2160cctagtagat atttacagaa catttgatcc aacagctgta gaatacacat tcttctcctc 2220agcacatgga taattctcaa ggatatacca aatgctaggt cacaaaacaa atcttaaaat 2280ttagaaaaaa agtgaaataa tatcaaacgt tttctctcac cacagactaa gaaaaaaaga 2340agtcccaaat aaatacaatc tgagataaaa aaggagacga gacaaccaat accacaaaaa 2400attaaaggat cattagaaga tactatgaaa ctatatgcta ataaattgga aaacctgaac 2460aaaatagata attcctagaa acatacaaca tactggtctg ttcaggtttt gtattttttc 2520atagtaccat gaagaaatac aagaattgtt tctagaacca ttcttgtatt tcttcatggt 2580ttttgtattt cttcatggaa ccatgaagaa atacaaaatg tgaacaggcc aataacaagt 2640aatgagacag aagccatact aaaaagtatc ccagaaaaga actcaggatc tgatggcttc 2700actgatgaat tttgccaaat atttaaaaaa ctaataccaa tccaactcaa attattaaaa 2760aaatagaggt ggacagaatc tttccaaatg tattctatga ggccagtgtt ttttctgatt 2820gaatctccca ttatatttta atcacatata aaaccagaga aagacacatt aaaaagaaag 2880aaaactgtag gccaatatct ctgatgaaca ttgatgcaga aatcctcaac aacaaattag 2940caaactgaat tcaagaacac attaaaacaa tcattcatca tgaccaagtg gaatttgtcc 3000tagagattca agtgtggtta ggtatgtgca gatcaatggg tttaatgttg tccaatgaac 3060ataatgtcct ccagctccat ccatgttctt gcaaatgaca ggatctcatt cttttttatg 3120gctaagtagt actccattgt gtataagtgc catattttct ttatccattc atctgttaga 3180cacctaagtt gcttccaaat cttagctatt gtgaatagtg ctgcaataaa catgggagtg 3240taaatatttt gttgacatac tgatttcatt tcctttggat aaatacccag tagtgggatt 3300gctggatcat atgggggaaa atggagatgg ctaacgggct caaaaatata gttagaaaaa 3360atgaatatga tttagtattc gatagcacaa taggatgact actgttaatg ataatttatt 3420atatattata aaataactaa aatagtataa atgggatgta tgtagcagag agaaatgata 3480aatgtttgaa gcattggata ctccatcacc tgctgtgata ttatgaatgt ctgcctatat 3540aaatattcac tattccataa caca 3564<210> 12<211> 3213<212> DNA<213> Homo sapiens<400> 12actaacataa agctgaaggt gaataaaaaa atcagggtta gccaaacaaa ttttcatggt 60caaataccac ataaaaagta aatatactta agttcccagc aaaatctgaa ttgaacgtag 120acaaaatgct catttctcag tgtttgacag acttaacagt ttgagccaat aaaaatgtac 180tgactagata aactactaaa agttgttaat ttttgcaatg tatatttctg aaaagaaagt 240ttatctatta tagaaattcc tgtgcccatt taagaacttt gagcatttta attgtttaat 300aatatagttt aattgcatca tgaaaataat caataataca atttatttgg tttatttaaa 360aaaactgatt ctttctgctc tctctataca tagactgatt ttatactaat gttgcctaaa 420gatcaccaaa ttgtttgaag cctaggtttc tgagggatgg aaaatgatgt cacaactatt 480tacagttcac acacacattc tggggattta atacatcctt tacaagtgca ggaaaggtgg 540aagattgatg atttggggga attagagcta ccacacccca gagggtggta tggtatgttg 600tctgttgtga gctgtgtgaa tcagagagtt tgatttagac atatatttag aaagaggaaa 660gatgaaccaa tcaaaaataa taactataat gacttttcaa gatatagaca atacagttaa 720gatataaatg gaaacaaaaa aagttaaaag tggggagatg aagtctgatt ttttggtttt 780tttttttttt tgcttttttg tttgtttatg taatcagtgt taccagttta aaataatggg 840ttataagaca ctatatgcaa gcctcatggt aacctccaat ctaaaacata caacaaatac 900acacaaaata aaaaggagaa attaaaacac accaccagag aaaatcacct acattaaaag 960aaagacaaat aggaagaaaa taagaaagag aaggccatca aataatcaga aaatgaataa 1020caaaatgaca ggaataagtc ctcataaata ataacattga atgtaaatgg actaagctct 1080ccaatgaaag acagggagtg gctgaatgta ttttaaaaaa aatattacac cgagctgtgc 1140gtggtgtctc acacctataa tcccagcatt ttgggagact gagccgggtg gatcacttga 1200gcccaggagt tcgagaccag cctggccaac atggcaaaac cctgtctcta ctaaaaatac 1260aaaaaattag ctgaacatgg tggcacatgc ctgtggttcc agctactaga gaggctgagg 1320cagaagaatt gcttgaactt gggaggtgga ggttgcagtg agctaagatt gatggagcca 1380ctgcacccca gcctaggtga cagaataaga ctctgcctca aaaaaaaaaa gcaaaacaaa 1440acaaaacaaa aaacccttag acccaatgat tcattgccta caagaagtat gcttcacctt 1500taaagacaca tatagactga aggtaaaggg atggaaaaat attctatgcc tatggaaaca 1560aacaaaaaga agcagaagct acatttatat cagacaaaat agactgcaag acaaaaacta 1620tgaaaagaga gaaagaaggt cattatatag tgataaaggg gtccatttag caagagcatt 1680taacaattct aaatatatat tcacccaata ctggagtact caggtatata aagcaaatat 1740tattagagcc aaagagagag atagacagac ccccatacaa taataactgg agacttcaac 1800accccacttt cagcattgga cagatcatcc agacagaaaa ttaacaaaca tcaaatttca 1860tctgcaccat aggtcaaatg gacctagtag atatttacag aacatttgat ccaacagctg 1920tagaatacac attcttctcc tcagcacatg gataattctc aaggatatac caaatgctag 1980gtcacaaaac aaatcttaaa atttagaaaa aaagtgaaat aatatcaaac gttttctctc 2040accacagact aagaaaaaaa gaagtcccaa ataaatacaa tctgagataa aaaaggagac 2100gagacaacca ataccacaaa aaattaaagg atcattagaa gatactatga aactatatgc 2160taataaattg gaaaacctga acaaaataga taattcctag aaacatacaa catactggtc 2220tgttcaggtt ttgtattttt tcatagtacc atgaagaaat acaagaattg tttctagaac 2280cattcttgta tttcttcatg gtttttgtat ttcttcatgg aaccatgaag aaatacaaaa 2340tgtgaacagg ccaataacaa gtaatgagac agaagccata ctaaaaagta tcccagaaaa 2400gaactcagga tctgatggct tcactgatga attttgccaa atatttaaaa aactaatacc 2460aatccaactc aaattattaa aaaaatagag gtggacagaa tctttccaaa tgtattctat 2520gaggccagtg ttttttctga ttgaatctcc cattatattt taatcacata taaaaccaga 2580gaaagacaca ttaaaaagaa agaaaactgt aggccaatat ctctgatgaa cattgatgca 2640gaaatcctca acaacaaatt agcaaactga attcaagaac acattaaaac aatcattcat 2700catgaccaag tggaatttgt cctagagatt caagtgtggt taggtatgtg cagatcaatg 2760ggtttaatgt tgtccaatga acataatgtc ctccagctcc atccatgttc ttgcaaatga 2820caggatctca ttctttttta tggctaagta gtactccatt gtgtataagt gccatatttt 2880ctttatccat tcatctgtta gacacctaag ttgcttccaa atcttagcta ttgtgaatag 2940tgctgcaata aacatgggag tgtaaatatt ttgttgacat actgatttca tttcctttgg 3000ataaataccc agtagtggga ttgctggatc atatggggga aaatggagat ggctaacggg 3060ctcaaaaata tagttagaaa aaatgaatat gatttagtat tcgatagcac aataggatga 3120ctactgttaa tgataattta ttatatatta taaaataact aaaatagtat aaatgggatg 3180tatgtagcag agagaaatga taaatgtttg aag 3213<210> 13<211> 3033<212> DNA<213> Homo sapiens<400> 13actaacataa agctgaaggt gaataaaaaa atcagggtta gccaaacaaa ttttcatggt 60caaataccac ataaaaagta aatatactta agttcccagc aaaatctgaa ttgaacgtag 120acaaaatgct catttctcag tgtttgacag acttaacagt ttgagccaat aaaaatgtac 180tgactagata aactactaaa agttgttaat ttttgcaatg tatatttctg aaaagaaagt 240ttatctatta tagaaattcc tgtgcccatt taagaacttt gagcatttta attgtttaat 300aatatagttt aattgcatca tgaaaataat caataataca atttatttgg tttatttaaa 360aaaactgatt ctttctgctc tctctatata tagactgatt ttatactaat gttgcctaaa 420gatcaccaaa ttgtttgaag cctaggtttc tgagggatgg aaaatgatgt cacaactatt 480tacagttcac acacacattc tggggattta atacatcctt tacaagtgca ggaaaggtgg 540aagattgatg atttggggga attagagcta ccacacccca gagggtggta tggtatgttg 600tctgttgtga gctgtgtgaa tcagagagtt tgatttagac atatatttag aaagaggaaa 660gatgaaccaa tcaaaaataa taactataat gacttttcaa gatatagaca atacagttaa 720gatataaatg gaaacaaaaa aagttaaaag tggggagatg aagtctgatt ttttggtttt 780tttttttttt tgcttttttg tttgtttatg taatcagtgt taccagttta aaataatggg 840ttataagaca ctatatgcaa gcctcatggt aacctccaat ctaaaacata caacaaatac 900acacaaaata aaaaggagaa attaaaacac accaccagag aaaatcacct acattaaaag 960aaagacaaat aggaagaaaa taagaaaga9 aaggccatca aataatcaga aaatgaataa 1020caaaatgaca ggaataagtc ctcataaata ataacattga atgtaaatgg actaagctct 1080ccaatgaaag acagggagtg gctgaatgta ttttaaaaaa aatattacac cgagctgtgc 1140gtggtgtctc acacctataa tcccagcatt ttgggagact gagccgggtg gatcacttga 1200gcccaggagt tcgagaccag cctggccaac atggcaaaac cctgtctcta ctaaaaatac 1260aaaaaattag ctgaacatgg tggcacatgc ctgtggttcc agctactaga gaggctgagg 1320cagaagaatt gcttgaactt gggaggtgga ggttgcagtg agctaagatt gatggagcca 1380ctgcacccca gcctaggtga cagaataaga ctctgcctca aaaaaaaaaa gcaaaacaaa 1440acaaaacaaa aaacccttag acccaatgat tcattgccta caagaagtat gcttcacctt 1500taaagacaca tatagactga aggtaaaggg atggaaaaat attctatgcc tatggaaaca 1560aacaaaaaga agcagaagct acatttatat cagacaaaat agactgcaag acaaaaacta 1620tgaaaagaga gaaagaaggt cattatatag tgataaaggg gtccatttag caagagcatt 1680taacaattct aaatatatat tcacccaata ctggagtact caggtatata aagcaaatat 1740tattagagcc aaagagagag atagacagac ccccatacaa taataactgg agacttcaac 1800accccacttt cagcattgga cagatcatcc agacagaaaa ttaacaaaca tcaaatttca 1860tctgcaccat aggtcaaatg gacctagtag atatttacag aacatttgat ccaacagctg 1920tagaatacac attcttctcc tcagcacatg gataattctc aaggatatac caaatgctag 1980gtcacaaaac aaatcttaaa atttagaaaa aaagtgaaat aatatcaaac gttttctctc 2040accacagact aagaaaaaaa gaagtcccaa ataaatacaa tctgagataa aaaaggagac 2100gagacaacca ataccacaaa aaattaaagg atcattagaa gatactatga aactatatgc 2160taataaattg gaaaacctga acaaaataga taattcctag aaacatacaa catactggtc 2220tgttcaggtt ttgtattttt tcatagtacc atgaagaaat acaagaattg tttctagaac 2280cattcttgta tttcttcatg gtttttgtat ttcttcatgg aaccatgaag aaatacaaaa 2340tgtgaacagg ccaataacaa gtaatgagac agaagccata ctaaaaagta tcccagaaaa 2400gaactcagga tctgatggct tcactgatga attttgccaa atatttaaaa aactaatacc 2460aatccaactc aaattattaa aaaaatagag gtggacagaa tctttccaaa tgtattctat 2520gaggccagtg ttttttctga ttgaatctcc cattatattt taatcacata taaaaccaga 2580gaaagacaca ttaaaaagaa agaaaactgt aggccaatat ctctgatgaa cattgatgca 2640gaaatcctca acaacaaatt agcaaactga attcaagaac acattaaaac aatcattcat 2700catgaccaag tggaatttgt cctagagatt caagtgtggt taggtatgtg cagatcaatg 2760ggtttaatgt tgtccaatga acataatgtc ctccagctcc atccatgttc ttgcaaatga 2820caggatctca ttctttttta tggctaagta gtactccatt gtgtataagt gccatatttt 2880ctttatccat tcatctgtta gacacctaag ttgcttccaa atcttagcta ttgtgaatag 2940tgctgcaata aacatgggag tgtaaatatt ttgttgacat actgatttca tttcctttgg 3000ataaataccc agtagtggga ttgctggatc ata 3033<210> 14<211> 137<212> DNA<213> Homo sapiens<400> 14gagaacctgg agcctaaggt ttaggctcac ccatttcaac cagtctagca gcatctgcaa 60catctacaat ggccttgacc tttgctttac tggtggccct cctggtgctc agctgcaagt 120caagctgctc tgtgggc 137<210> 15<211> 805<212> DNA<213> Homo sapiens<400> 15 aagcttttat aggtgtaaat tttccactta gtactgcttt tgtaatgttg tctttttatt 60ttcatttatc tcaagatgtt ttctaatttc tcttgacttc cttcttaaat tcttacctca 120tgtagacata catttttggc cctatgcatt gggatgcaaa accagactaa tttactttgt 180acaaaaagaa aaatgagaaa gaaatatatt tggtcttgtg agcactatat ggaaatactt 240tatattccat ttgtttcatc atattcatat atccctttac taacataaag ctgaaggtga 300ataaaaaaat cagggttagc caaacaaatt ttcatggtca aataccacat aaaaagtaaa 360tatacttaag tccccagcaa aatctgaatt gaacgtagac aaaatgctca tttctcagtg 420tttgacagac ttaacagttt gagccaataa aaatgtactg actagataaa ctactaaaag 480ttgttaattt ttgcaatgta tatttctgaa aagaaagttt atctattata gaaattcctg 540tgcccattta agaactttga gcattttaat tgtttaataa tatagtttaa ttgcatcatg 600aaaataatca ataatacaat ttatttggtt tatttaaaaa aactgattct ttctgctctc 660tctatatata gactgatttt atactaatgt tgcctaaaga tcaccaaatt gtttgaagcc 720taggtttctg agggatggaa aatgatgtca caactattta cagttcacac acacattctg 780gggatttaat acatccttta caagt 805<210> 16<211> 29<212> DNA<213> Homo sapiens<400> 16aggaaaggtg gaagattgat gatttgggg 29<210> 17<211> 105<212> DNA<213> Homo sapiens<400> 17ggggaattag agctaccaca ccccagaggg tggtatggta tgttgtctgt tgtgagctgt 60gtgaatcaga gagtttgatt tagacatata tttagaaaga ggaaa 105<210> 18<211> 2629<212> DNA<213> Homo sapiens<400> 18 aaagatgaac caatcaaaaa taataactat aatgactttt caagatatag acaatacagt 60taagatataa atggaaacaa aaaaagttaa aagtggggag atgaagtctg attttttggt 120tttttttttt ttttgctttt ttgtttgttt atgtaatcag tgttaccagt ttaaaataat 180gggttataag acactatatg caagcctcat ggtaacctcc aatctaaaac atacaacaaa 240tacacacaaa ataaaaagga gaaattaaaa cacaccacca gagaaaatca cctacattaa 300aagaaagaca aataggaaga aaataagaaa gagaaggcca tcaaataatc agaaaatgaa 360taacaaaatg acaggaataa gtcctcataa ataataacat tgaatgtaaa tggactaagc 420tctccaatga aagacaggga gtggctgaat gtattttaaa aaaaatatta caccgagctg 480tgcgtggtgt ctcacaccta taatcccagc attttgggag actgagccgg gtggatcact 540tgagcccagg agttcgagac cagcctggcc aacatggcaa aaccctgtct ctactaaaaa 600tacaaaaaat tagctgaaca tggtggcaca tgcctgtggt tccagctact agagaggctg 660aggcagaaga attgcttgaa cttgggaggt ggaggttgca gtgagctaag attgatggag 720ccactgcacc ccagcctagg tgacagaata agactctgcc tcaaaaaaaa aaagcaaaac 780aaaacaaaac aaaaaaccct tagacccaat gattcattgc ctacaagaag tatgcttcac 840ctttaaagac acatatagac tgaaggtaaa gggatggaaa aatattctat gcctatggaa 900acaaacaaaa agaagcagaa gctacattta tatcagacaa aatagactgc aagacaaaaa 960ctatgaaaag agagaaagaa ggtcattata tagtgataaa ggggtccatt tagcaagagc 1020atttaacaat tctaaatata tattcaccca atactggagt actcaggtat ataaagcaaa 1080tattattaga gccaaagaga gagatagaca gacccccata caataataac tggagacttc 1140aacaccccac tttcagcatt ggacagatca tccagacaga aaattaacaa acatcaaatt 1200tcatctgcac cataggtcaa atggacctag tagatattta cagaacattt gatccaacag 1260ctgtagaata cacattcttc tcctcagcac atggataatt ctcaaggata taccaaatgc 1320taggtcacaa aacaaatctt aaaatttaga aaaaaagtga aataatatca aacgttttct 1380ctcaccacag actaagaaaa aaagaagtcc caaataaata caatctgaga taaaaaagga 1440gacgagacaa ccaataccac aaaaaattaa aggatcatta gaagatacta tgaaactata 1500tgctaataaa ttggaaaacc tgaacaaaat agataattcc tagaaacata caacatactg 1560gtctgttcag gttttgtatt ttttcatagt accatgaaga aatacaagaa ttgtttctag 1620aaccattctt gtatttcttc atggtttttg tatttcttca tggaaccatg aagaaataca 1680aaatgtgaac aggccaataa caagtaatga gacagaagcc atactaaaaa gtatcccaga 1740aaagaactca ggatctgatg gcttcactga tgaattttgc caaatattta aaaaactaat 1800accaatccaa ctcaaattat taaaaaaata gaggtggaca gaatctttcc aaatgtattc 1860tatgaggcca gtgttttttc tgattgaatc tcccattata ttttaatcac atataaaacc 1920agagaaagac acattaaaaa gaaagaaaac tgtaggccaa tatctctgat gaacattgat 1980gcagaaatcc tcaacaacaa attagcaaac tgaattcaag aacacattaa aacaatcatt 2040catcatgacc aagtggaatt tgtcctagag attcaagtgt ggttaggtat gtgcagatca 2100atgggtttaa tgttgtccaa tgaacataat gtcctccagc tccatccatg ttcttgcaaa 2160tgacaggatc tcattctttt ttatggctaa gtagtactcc attgtgtata agtgccatat 2220tttctttatc cattcatctg ttagacacct aagttgcttc caaatcttag ctattgtgaa 2280tagtgctgca ataaacatgg gagtgtaaat attttgttga catactgatt tcatttcctt 2340tggataaata cccagtagtg ggattgctgg atcatatggg ggaaaatgga gatggctaac 2400gggctcaaaa atatagttag aaaaaatgaa tatgatttag tattcgatag cacaatagga 2460tgactactgt taatgataat ttattatata ttataaaata actaaaatag tataaatggg 2520atgtatgtag cagagagaaa tgataaatgt ttgaagcatt ggatactcca tcacctgctg 2580tgatattatg aatgtctgcc tatataaata ttcactattc cataacaca 2629<210> 19<211> 14<212> DNA<213> Homo sapiens<220><221> misc＿特征<222> (1)…(14)<223> n=A,T,C或G<400> 19yyyyyyyyyy nyag 14

Claims

1．一种DNA构建物，该DNA构建物当通过同源重组整合到哺乳动物细胞基因组中时，在该细胞中改变内源IFNA2基因的表达，该构建物包含(ⅰ)包含SEQ ID NO:12的至少20个连续核苷酸的导向序列，和(ⅱ)转录调节序列。

2．权利要求1的DNA构建物，其中所述构建物还包含外显子、剪接供体位点、内含子和剪接受体位点。

3．权利要求1的DNA构建物，其中所述构建物还包含选择性标记基因。

4．权利要求1的DNA构建物，其中所述导向序列包含SEQ IDNO:12的至少50个连续核苷酸。

5．一种DNA构建物，该DNA构建物当通过同源重组整合到哺乳动物细胞基因组中时，在该细胞中改变内源IFNA2基因的表达，该构建物包含(ⅰ)包含SEQ ID NO:7的至少20个连续核苷酸的导向序列，和(ⅱ)转录调节序列。

6．权利要求5的DNA构建物，其中所述构建物还包含外显子、剪接供体位点、内含子和剪接受体位点。

7．一种DNA构建物，该DNA构建物当通过同源重组整合到哺乳动物细胞基因组中时，在该细胞中改变内源IFNA2基因的表达，该构建物包含(ⅰ)包含SEQ ID NO:8的至少20个连续核苷酸的导向序列，和(ⅱ)转录调节序列。

8．权利要求7的DNA构建物，其中所述构建物还包含外显子、剪接供体位点、内含子和剪接受体位点。

9．包含SEQ ID NO:12或其互补物的至少20个连续核苷酸的分离的核酸，其中所述分离的核酸不编码全长干扰素-α2。

10．权利要求9的分离的核酸，其中所述分离的核酸包含SEQ IDNO:12或其互补物的至少50个连续的核苷酸。

11．权利要求9的分离的核酸，其中所述分离的核酸包含SEQID NO:12或其互补物的至少100个连续的核苷酸。

12．权利要求9的分离的核酸，其中所述分离的核酸包含SEQID NO:12或其互补物的至少200个连续的核苷酸。

13．权利要求9的分离的核酸，其中所述分离的核酸包含SEQID NO:7或其互补物。

14．权利要求9的分离的核酸，其中所述分离的核酸包含SEQID NO:8或其互补物。

15．权利要求9的分离的核酸，其中所述分离的核酸包含SEQID NO:12或其互补物。

16．权利要求9的分离的核酸，其中所述分离的核酸包含SEQID NO:7或其互补物的至少20个连续的核苷酸。

17．权利要求9的分离的核酸，其中所述分离的核酸包含SEQID NO:8或其互补物的至少20个连续的核苷酸。

18．一种分离的核酸，它包含含有核苷酸序列的链，所述核苷酸序列(ⅰ)为至少100个核苷酸长并(ⅱ)在高度严格条件下与SEQ IDNO:12或SEQ ID NO:12的互补物杂交。

19．权利要求18的分离的核酸，其中所述核苷酸序列为至少200个核苷酸长。

20．权利要求18的分离的核酸，其中所述核苷酸序列为至少400个核苷酸长。

21．权利要求18的分离的核酸，其中所述核苷酸序列为至少1000个核苷酸长。

22．包含含有核苷酸序列的链的分离的核酸，所述核苷酸序列(ⅰ)为至少100个核苷酸长并(ⅱ)在高度严格条件下与SEQ ID NO:7或SEQID NO:7的互补物杂交。

23．包含含有核苷酸序列的链的分离的核酸，所述核苷酸序列(ⅰ)为至少50个核苷酸长并(ⅱ)在高度严格条件下与SEQ ID NO:8或SEQID NO:8的互补物杂交。

24．包含含有核苷酸序列的链的分离的核酸，所述核苷酸序列(ⅰ)为至少50个核苷酸长并(ⅱ)和与其具有同样长度的SEQ ID NO:12的核苷酸序列片段具有至少80％的序列同一性。

25．权利要求24的分离的核酸，其中所述核苷酸序列为至少100个核苷酸长。

26．权利要求24的分离的核酸，其中所述片段为SEQ ID NO:7的部分或全部。

27．权利要求24的分离的核酸，其中所述片段为SEQ ID NO:8的部分或全部。

28．用权利要求1的DNA构建物稳定转染的同源重组哺乳动物细胞，所述DNA构建物与内源IFNA2编码序列的ATG起始密码子上游的基因组DNA进行同源重组。

29．用权利要求2的DNA构建物稳定转染的同源重组哺乳动物细胞，所述DNA构建物与内源IFNA2编码序列的ATG起始密码子上游的基因组DNA进行同源重组。

30．用权利要求3的DNA构建物稳定转染的同源重组细胞，所述DNA构建物与内源IFNA2编码序列的ATG起始密码子上游的基因组DNA进行同源重组。

31．用权利要求4的DNA构建物稳定转染的同源重组细胞，所述DNA构建物与内源IFNA2编码序列的ATG起始密码子上游的基因组DNA进行同源重组。

32．改变内源IFNA2基因在哺乳动物细胞中表达的方法，该方法包括将权利要求1的DNA构建物引入到所述细胞中，并将所述细胞保持在允许所述构建物和内源IFNA2基因的编码序列的5′靶位点之间发生同源重组的条件下。

33．将IFNA2传递给动物的方法，包括提供权利要求28的细胞；并将该细胞植入到所述动物中，其中所述细胞分泌IFNA2。

34．将IFNA2传递给动物的方法，包括提供权利要求29的细胞；并将该细胞植入到所述动物中，其中所述细胞分泌IFNA2。

35．将IFNA2传递给动物的方法，包括提供权利要求30的细胞；并将该细胞植入到所述动物中，其中所述细胞分泌IFNA2。

36．将IFNA2传递给动物的方法，包括提供权利要求31的细胞；并将该细胞植入到所述动物中，其中所述细胞分泌IFNA2。

37．产生IFNA2的方法，包括提供权利要求28的细胞，并在使所述细胞表达和分泌IFNA2的条件下体外培养所述细胞。

38．产生IFNA2的方法，包括提供权利要求29的细胞，并在使所述细胞表达和分泌IFNA2的条件下体外培养所述细胞。

39．产生IFNA2的方法，包括提供权利要求30的细胞，并在使所述细胞表达和分泌IFNA2的条件下体外培养所述细胞。

40．产生IFNA2的方法，包括提供权利要求31的细胞，并在使所述细胞表达和分泌IFNA2的条件下体外培养所述细胞。

41．当通过同源重组整合到哺乳动物细胞的基因组中时，在该细胞中改变内源IFNA2基因表达的DNA构建物，该构建物包含(ⅰ)含有SEQ ID NO:16、17、18和19中的一个或多个的至少20个连续核苷酸的导向序列，和(ⅱ)转录调节序列。

42．包含SEQ ID NO:16、17、18和19中的一个或多个的至少20个连续核苷酸、或包含SEQ ID NO:16、17、18和19中的一个或多个的互补物中的至少20个连续核苷酸的分离的核酸，其中所述分离的核酸不编码全长干扰素-α2。

43．用权利要求39的DNA构建物稳定转染的同源重组哺乳动物细胞，所述DNA构建物与内源IFNA2编码序列的ATG起始密码子上游的基因组DNA进行同源重组。

44．改变内源IFNA2基因在哺乳动物细胞中表达的方法，该方法包括将权利要求39的DNA构建物引入到所述细胞中，并将所述细胞保持在允许所述构建物和所述内源IFNA2基因的编码序列的5′靶位点之间发生同源重组的条件下。

45．将IFNA2传递给动物的方法，包括提供权利要求41的细胞；并将该细胞植入到所述动物中，其中所述细胞分泌IFNA2。

46．产生IFA2的方法，包括提供权利要求41的细胞，并在使所述细胞表达和分泌IFNA2的条件下体外培养所述细胞。