CN101405299A - 糖基化的g-csf - Google Patents

糖基化的g-csf Download PDF

Info

Publication number
CN101405299A
CN101405299A CNA2007800092181A CN200780009218A CN101405299A CN 101405299 A CN101405299 A CN 101405299A CN A2007800092181 A CNA2007800092181 A CN A2007800092181A CN 200780009218 A CN200780009218 A CN 200780009218A CN 101405299 A CN101405299 A CN 101405299A
Authority
CN
China
Prior art keywords
csf
composition
ifn
sequence
protein
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2007800092181A
Other languages
English (en)
Inventor
R·D·伊瓦瑞
G·刘
J·C·拉普
J·A·莫里斯
A·J·哈维
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Georgia Research Foundation Inc UGARF
Synageva Biopharma Corp
Original Assignee
University of Georgia Research Foundation Inc UGARF
Avigenics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Georgia Research Foundation Inc UGARF, Avigenics Inc filed Critical University of Georgia Research Foundation Inc UGARF
Publication of CN101405299A publication Critical patent/CN101405299A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及获自具有新描述的G-CSF糖基化模式的转基因禽类所产禽蛋的粒细胞集落刺激因子。

Description

糖基化的G-CSF
相关申请信息
本申请要求2006年3月17日提交的美国临时专利申请号60/783,648和2006年8月25日提交的60/840,291的优先权。
发明领域
本发明涉及将外源遗传物质导入禽类细胞以及使外源遗传物质在禽类细胞中表达。本发明特别涉及转基因禽类,包括鸡、鹌鹑和火鸡,还涉及所生禽蛋中含有外源性蛋白质,如药用蛋白质的禽类。
背景
很多天然和合成的蛋白质已用于诊断和治疗性应用;很多其他蛋白质正处于开发或临床试验阶段。现有的蛋白质生产方法包括从天然来源中分离以及在细菌和哺乳动物细胞中重组生产。然而,因为这些蛋白质生产方法的复杂性和高成本,人们正在开发其他的方法。例如,已报道了在猪、绵羊、山羊和牛的奶中生产外源蛋白质的方法。这些方法有几个局限性,包括创始动物和产生转基因动物群体之间长时间传代次数,大量的管理和医疗成本,以及由于基因组中转基因插入位点的位置效应所致表达水平的变化。也正在利用大麦和黑麦的碾磨和麦芽工艺生产蛋白质。然而,植物的翻译后修饰与脊椎动物的翻译后修饰有所不同,这种不同常对外源蛋白质如药用蛋白质的功能产生决定性影响。
如组织培养和乳腺生物反应器一样,禽类的输卵管也可能作为生物反应器。修饰禽类遗传物质使得输卵管中高水平分泌外源蛋白质并包装于禽蛋中的方法成功使得能便宜地生产大量蛋白质。这种方法有几个优点:a)减少了传代次数(24周)和通过人工授精可快速建立转基因群体;b)容易通过增加群体大小扩大生产规模以满足产品需求;c)所表达蛋白质可经历翻译后修饰;4)可自动喂养和收集蛋;d)卵清天然无菌;和e)由于卵清中蛋白质的浓度高从而降低了工艺成本。
禽类包括鸡的生殖系统已有很好的描述。母鸡的蛋由经过输卵管时被分泌于卵黄上的几层组成。蛋的产生开始于母鸡卵巢中大卵黄的形成。然后未受精的卵母细胞定位于卵黄囊上部。卵巢排卵或释放卵黄后,卵母细胞进入输卵管漏斗,如果出现精子则在此处受精。然后移动到有管状腺体细胞排列的输卵管蛋白分泌部(magnum)。这些腺体细胞可向蛋白分泌部腔中分泌卵清蛋白质,包括卵白蛋白、溶菌酶、卵类粘蛋白、伴白蛋白和卵粘蛋白,在腔中这些蛋白质沉积于禽胚胎和卵黄上。
卵白蛋白基因编码一种在输卵管蛋白分泌部管状腺体细胞中特异表达的45kD的蛋白质(Beato,Cell 56:335-344(1989))。卵白蛋白是含量最丰富的卵清蛋白质,占管状腺体细胞产生的总蛋白质的50%以上,或每个大A级蛋约有4克蛋白质(Gilbert,“蛋的白蛋白及其形成”,Physiology andBiochemistry of the Domestic Fowl,Bell和Freeman主编,学术出版社(Academic Press),伦敦,纽约,1291-1329页)。已经克隆和分析了卵白蛋白基因及其各个侧翼区20kb以上的序列(Lai等,Proc.Natl.Acad.Sci.USA75:2205-2209(1978);Gannon等,Nature 278:428-424(1979);Roop等,Cell19:63-68(1980);和Royal等,Nature 279:125-132(1975))。
对卵白蛋白基因的调控给予了很大关注。该基因响应甾体激素,例如雌激素、糖皮质激素和黄体激素,这些激素可诱导未成熟仔鸡每个管状腺体细胞累积产生约70,000个卵白蛋白mRNA转录物,和诱导成熟产蛋母鸡每个管状腺体细胞100,000个卵清蛋白mRNA转录物(Palmiter,J.Biol.Chem.248:8260-8270(1973);Palmiter,Cell 4:189-197(1975))。转染的管状腺体细胞中的DNA酶超敏性分析和启动子-报告基因试验确定,7.4kb的区域含有卵白蛋白基因表达所需的序列。此5’侧翼区含有四个从中心算起距离转录起始位点-0.25、-0.8、-3.2和-6.0kb的DNA酶I超敏感位点。这些位点分别称为HS-I、-II、-III和-IV。这些区域反映了染色质结构的改变,并且与输卵管细胞中卵白蛋白基因的表达特异性相关(Kaye等,EMBO3:1137-1144(1984))。HS-II和-III的超敏性是雌激素诱导的,支持了这些区域在卵白蛋白基因表达的激素诱导中具有作用(的观点)。
HS-I和-II是卵白蛋白基因转录的甾体诱导所必需的,在移植的管状腺细胞中,含有这些元件的5’区的一个1.4kb部分足以驱动甾体依赖的卵清蛋白表达(Sanders和McKnight,Biochemistry 27:6550-6557(1988))。6550-6557(1988))。HS-I称为负响应元件(“NRE”),因为它含有几个在缺少激素时能抑制卵白蛋白表达的负调控元件(Haekers等,Mol.Endo.9:1113-1126(1995))。蛋白因子结合于这些元件,包括一些只在输卵管核中发现的因子,提示这些因子在组织特异性表达中有作用。HS-II称为甾体依赖的响应元件(“SDRE”),因为它对启动甾体诱导的转录是必需的。它可结合称为Chirp-I的蛋白质或蛋白质复合体。Chirp-受雌激素诱导并在环己胺的存在下迅速转换(Dean等,Mol.Cell.Biol.16:2015-2024(1996))。利用移植的管状腺体细胞培养系统进行的实验确定了一套附加的以甾体依赖方式结合SDRE的因子,包括NFκB类似因子(Nordstrom等,J.Biol.Chem.268:13193-13202(1993);Schweers和Sanders,J.Biol.Chem.266:10490-10497(1991))。
关于HS-III和-IV的功能了解极少。HS-III包括功能性雌激素响应元件,当它与雌激素受体cDNA共转染入HeLa细胞时使卵清蛋白近端启动子或异源启动子具有雌激素诱导性。这些数据提示,HS-III可能在卵白蛋白基因的总体调控中起功能性作用。关于HS-IV的功能了解很少,只知道它不含有功能性雌激素响应元件(Kato等,Cell 68:731-742(1992))。
通过导入外源遗传物质和/或打断特定基因来修饰真核基因组引起了人们很大的兴趣。已证明某些真核细胞可能是生产外源性真核蛋白质的优良宿主。导入编码某些蛋白质的基因还可能产生具有更高经济价值的新表型。此外,通过导入能使遗传缺陷型细胞表达其不能产生的蛋白质的外源基因,可治疗一些遗传疾病。最后,通过插入或去除遗传物质对动物基因组进行修饰,有助于基因功能的基础研究,并可能最终导入用于治疗疾病的基因,或者改进动物的表型。
已用几种不同的方法实现了哺乳动物的转基因。第一,在哺乳动物包括小鼠、猪、山羊、绵羊和牛中,将转基因显微注射入受精卵的原核,然后将受精卵放于代孕母体的子宫内,在其中受精卵发育成其种系中携带有转基因的创始动物。用工程方法改造的转基因携带有含特定调控序列指导外源蛋白质在特定类型细胞中表达的启动子。因为转基因是随机插入基因组的,所以转基因插入基因组位点的位置效应可能不同程度地引起转基因表达水平的下降。该方法还要求对启动子进行鉴定,以使指导在所需类型细胞中表达转基因的必要序列得以确定并包含在转基因载体中(Hogan等,小鼠胚胎操作(Manipulating the Mouse Embryo),冷泉港实验室出版社(ColdSpring Harbor Laboratory),纽约(1988))。
产生动物转基因的第二种方法是靶向基因打断,该方法中,将含有侧接有选择标记基因的目的基因序列的靶向载体导入胚胎干(“ES”)细胞。通过同源重组,该靶向载体替代了目的基因序列在染色体上的位置或插入序列内部阻止目标基因产物的表达。选出含有正确打断的基因的ES细胞克隆,然后将其注射入早期胚泡产生嵌合性创始动物,其中一些创始动物种系中含有该转基因。如果该转基因删除了目标基因座,则该目标基因座被转基因载体中的外源DNA所替代,该外源DNA含有编码用于选择培养中经转染ES细胞的选择性标记基因的DNA,还可能含有编码外源蛋白质的插入并替代被删除基因,以使目标基因启动子驱动该外源基因表达的DNA序列(美国专利5,464,764和5,487,992(M.P.Capecchi和K.R.Thomas))。该方法的局限性在于,ES细胞在很多动物中是不能获得的,包括山羊、牛、绵羊和猪。而且,当被删除的基因对于该生物或细胞型的生存或正常发育是必需时,此法不可行。
最近,禽类转基因的发展已使我们可对禽类基因组进行修饰。可将复制缺陷型逆转录病毒注射入新产蛋的鸡胚盘胚下腔中产生种系转基因鸡(美国专利号5,162,215;Bosselman等,Science 243:533-534(1989);Thoraval等,Transgenic Research 4:369-36(1995))。可将含有外源基因的逆转录病毒核酸随机插入胚胎细胞的染色体中产生转基因动物,其中一些转基因动物种系中携带有转基因。已有描述利用该插入融合基因构建物5’或3’区的绝缘子元件来克服插入位点的位置效应(Chim等,Cell 74:504-514(1993))。
在另一种方法中,将转基因显微注射入受精卵胚盘中产生稳定的能将该基因传递给F1代的转基因创始禽(Love等,Bio/Technology 12:60-63(1994))。然而,该方法有几点不足。为收集受精卵必须牺牲母鸡,转基因创始禽的份数低,注射的卵需要在代孕壳中花费大量劳动力体外培养。
在另一种方法中,将含有假定的原生殖细胞(“PGC”)的胚盘细胞从供体卵切下,用转基因转染并导入受体胚的胚下腔。将该转染的供体细胞掺入受体胚产生转基因胚,预期其中一些胚的种系中含有该转基因。转基因通过非同源重组随机插入染色体位点。然而,用该方法还没有产生转基因创始禽类。
Lui,Poult.Sci.68:999-1010(1995),用含有卵黄原蛋白基因侧接DNA序列的靶向载体删除培养的鸡胚盘细胞的部分固有基因。然而,还没有证明这些细胞有助于形成种系并因此产生转基因胚。此外,当被删除的基因对于该生物或细胞型的生存或正常发育是必需的,此法不可行。
因此可见,需要一种能将操作性连接有合适启动子的外源DNA导入禽类基因组中以实现外源基因有效表达的方法。而且,需要创建能在输卵管中表达外源基因并将表达的外源蛋白质分泌到蛋中的种系修饰的转基因禽类。
1957年发现干扰素时,它作为一种重要的抗病毒制剂受到欢迎。70年代后期,干扰素开始与重组基因技术相结合。今天,干扰素是癌症生物过程的复杂性以及对付这种复杂性的忍耐性和持久性价值的象征。
引起癌症的异常基因包括至少三种类型:第一种是癌基因,当其改变时促进癌症特征性的异常生长和分裂。第二,肿瘤抑制基因,当其改变时不能控制这种异常生长和分裂。第三,DNA修复基因,当其改变时不能修复致癌的突变。研究者推测体内大约有30-40种肿瘤抑制基因,分别编码产生蛋白质。这些蛋白质可能受到“主”肿瘤抑制蛋白质例如Rb(成视网膜细胞瘤,首先与其相关联)和p53(与很多不同的肿瘤相关)的控制。实验室证据提示,仅使这些肿瘤抑制基因之一回复到正常功能就可显著降低恶性肿瘤的侵袭性。
发现干扰素可抑制细胞生长时,激起了科学家们对干扰素的极大兴趣。另外,还发现干扰素对免疫系统有某些正面作用。现在认为干扰素与肿瘤抑制蛋白质类似:它能抑制细胞尤其是恶性细胞的生长;阻抑许多癌基因和生长因子的作用;与其他生物制剂不同,它能抑制对于癌转移过程很关键的细胞迁移。
细胞间通信依赖于组织中所有结构组分发挥正常功能,信息通过以下结构组分传递:基质、细胞膜、细胞骨架以及细胞自身。在癌中,细胞间的通信网络受到破坏。如果细胞骨架被破坏,信息就不能传输到核中,核开始功能异常。因为核是癌基因或肿瘤抑制基因开启或关闭的部位,这种功能异常可导致恶性肿瘤。当发生这种情况时,细胞开始不规则生长并且不分化。它们还可能开始移动并打扰其它细胞。据认为干扰素可能与其他细胞外或细胞物质协同,恢复平衡和自身稳定,确保信息正确传输。干扰素抑制生长、抑制迁移、通过粘附分子增强细胞对环境响应的能力。它还纠正细胞骨架的缺陷和损伤。已发现干扰素可阻抑新血管形成,新血管形成的起始步骤是恶性肿瘤生长非常所必需的。而且,它能阻抑纤维化,纤维化是对刺激很多不同类型细胞促进细胞生长所致伤害的一种反应,(Kathryn L.Hale,Oncolog,干扰素:一种生物治疗的演化,对细胞生物学的新看法(Interferon:The Evolution of a Biological Therapy,Taking a NewLook at Cytokine Biology))。
干扰素是当动物细胞受到病毒侵犯时产生的,被释放到血流或细胞间的液体中,诱导健康的细胞产生抗击感染的酶。很多年以来,用于研究的人干扰素的供应受到高成本提取技术的限制。然而1980年,通过遗传工程可获得更大量这种蛋白质(即这种蛋白质的重组形式)。科学家们还确定体内可产生三种不同类型的干扰素,分别称为α、β和γ干扰素。起初认为干扰素是高度物种特异性的,但是现在知道,各种干扰素可能在其他物种里具有不同的活性范围。α干扰素(α-IFN)已被批准用于毛细胞白血病和丙型肝炎的治疗。还发现α-IFN对肝癌和肝硬化主要原因的慢性乙型肝炎和生殖道疣及一些罕见的血和骨髓癌症有效。含有α-IFN的鼻喷雾剂可提供抗鼻病毒引起的感冒的某些保护力。人α-IFN属于一个细胞外信号传递蛋白质家族,具有抗病毒、抗增殖和免疫调节活性。IFN-α蛋白质由人9号染色体上成簇的13个基因组成的多基因家族编码。白细胞中大多数IFN-α基因受仙台(Sendai)病毒诱导在mRNA水平上表达。另外,还发现在蛋白质水平至少能产生九种不同亚型的蛋白质。表达几种类似的IFN-α蛋白质的生物学意义还不知道,然而,认为它们在抗病毒、生长抑制和自杀细胞刺激活性方面具有剂量上不相同的模式。现在,两种IFN-α变体,IFN-α2a和IFN-α2b,已通过重组技术在大肠杆菌中大量生产并投入市场作为药物。
与天然的IFN-α不同,已发现这些重组的IFN-α产品在某些患者中具有免疫原性,这可能是因为IFN-α蛋白质的非天然形式所致。因此,对于IFN-α药物的发展,不但需要鉴定正常人白细胞中表达的IFN-α亚型和变体,而且需要特征分析它们可能的翻译后修饰(Nyman等(1998)Eur.J.Biochem.253:485-493)。
Nyman等(见上)研究了天然人IFN-α的糖基化。他们发现,仙台病毒诱导后白细胞产生的九种亚型中有两个是糖基化的,称为IFN-α14c和IFN-α2b,与以前的研究一致。IFN-α14是唯一一个有潜在N-糖基化位点的IFN-α亚型,所述潜在糖基化位点为Asn2和Asn72,但实际上只有Asn72发生糖基化。IFN-α2在苏氨酸106(Thr106)位发生O-糖基化。令人感兴趣的是,其他的IFN-α亚型在这个位置不含有Thr。在该研究中,Nyman等释放和分离了这些寡糖链并用质谱法和特异性糖苷酶消化分析了它们的结构。IFN-α2b和IFN-α14c在反相高效液相色谱(RP-HPLC)中均解析为三个峰。对RP-HPLC产生的IFN-α2b诸组分做电喷离子质谱(ESI-MS)分析显示它们的分子量有所不同,提示这些组分代表了不同的糖形。各组分释放的O-聚糖的质谱分析证实了这一点。据估计,IFN-α2b含有约20%的核心2型五糖,约50%双唾液酸化和30%单唾液酸化的核心1型聚糖。Nyman等的数据与以前的IFN-α2b糖基化的部分特征一致(Adolf等,(1991)Biochem.J.276:511-518)。IFN-α14c和IFN-α2b中糖基化的作用还不是很清楚。根据Nyman等(见上),碳氢链对于其生物活性不重要,但是糖基化可能会影响该蛋白质的药物动力学和稳定性。
人类基因组中至少有15种功能基因编码IFN-α家族的蛋白质。氨基酸序列相似性一般在90%的范围内,这些分子在结构上紧密相关。IFN-α蛋白质含有166个氨基酸(IFN-α2除外,它有165个氨基酸),特征是含有四个保守的可形成两个二硫键的半胱氨酸残基。诸IFN-α类的特征为弱酸性,缺少天门冬酰胺相连的糖基化识别位点(IFN-α14除外,它含有天门冬酰胺相连的糖基化识别位点)。已知有三种IFN-α2变体,它们在第23位和34位上氨基酸不同:IFN-α2a(Lys-23,His-34)、IFN-α2b(Arg-23,His-34)和IFN-α2c(Arg-23,Arg-34)。认为IFN-α2a和IFN-α2c是IFN-α2b的等位基因变体。参见Gewert等(1993)J.Interferon Res.第13卷,第227-231页。预计不同种类的IFN-α2在氨基酸含量上的微小差异不会影响该干扰素的糖基化。就是说,预计IFN-α2a、2b和2c的糖基化模式基本相同。两种其它人IFN种类,即IFN-ω1和IFN-β是N-糖基化的,与IFN-α关系更远。IFN-α、-β、-ω总称为I类IFN,它们能结合相同的高亲和性细胞膜受体(Adolf等,(1991),Biochem.J.276:511-518)。
Adolf等(见上)利用单克隆抗体的特异性从人白细胞IFN中分离得到了天然的IFN-α2。他们通过免疫亲和层析得到了具有期望的抗病毒活性纯度95%的IFN-α2蛋白质。用反相HPLC分析天然的IFN-α2表明,该天然蛋白质可以分辨为两种成分,这两种成分的亲水性均比大肠杆菌产生的IFN-α2高。SDS/PAGE显示,该蛋白质在分子质量上也是异质性的,可产生三条带,所有条带的电泳迁移率都低于相等的大肠杆菌产生的蛋白质。
Adolf等(见上)还推测天然的IFN-α2携带有O-连接的糖残基。用碱切割假定的多肽-糖键断裂,产生的蛋白质是均质的并且与重组蛋白质的分子量相同,证实了他们的假说。在蛋白水解断裂后,分离和分析产生的片段,将天然和重组的蛋白质作进一步比较,使他们确定了一种候选的糖肽。该多肽的序列分析鉴定了Thr-106为O-糖基化位点。所有已发表的IFN-α2种类的氨基酸序列比较显示,这个苏氨酸残基是IFN-α2独有的。在其他所有IFN蛋白质中的相应位置上(107)为甘氨酸、异亮氨酸或谷氨酸。
大肠杆菌产生的IFN-α2制品缺少O-糖基化并且已在很多国家注册为药物。然而,缺少糖基化可能会影响治疗应用的大肠杆菌产生的IFN-α2的免疫原性。研究显示,16位接受酵母生产的重组人粒细胞巨噬细胞集落刺激因子的患者中,4位产生了该蛋白质的抗体。令人感兴趣的是,发现这些抗体能与在内源性粒细胞巨噬细胞集落刺激因子中受O-连接的糖基化保护但在该重组因子中暴露的表位反应(Adolf等,见上)。
类似地,描述了在患者长期治疗之后诱导了针对重组大肠杆菌IFN-α2的抗体,据推测,天然IFN-α2比重组IFN-α2蛋白质的免疫原性低(Galton等,(1989)Lancet 2:572-573)。
需要能产生治疗或药用的蛋白质,如抗体和细胞因子,包括干扰素、G-CSF和红细胞生成素的改进方法。
发明概述
本发明提供用于将外源核酸序列稳定导入禽类基因组以表达外源序列来改变禽类表型或产生所需蛋白质的载体和方法。具体说,生产了在输卵管中表达外源序列并使外源蛋白质如药用蛋白质沉积到蛋中的转基因禽类。本发明包括含有这类外源蛋白质的禽蛋。本发明还提供了治疗性蛋白质(如人类细胞因子)的新形式,包括在转基因禽类输卵管中有效表达并沉积到禽蛋中的干扰素、G-CSF、G-MCSF和红细胞生成素。
本发明的一个方面提供在禽类特定组织中产生外源蛋白质的方法。外源蛋白质可在禽类输卵管血液和/或其他细胞和组织中表达。在一个实施方式中,将转基因导入胚胎胚盘细胞中,例如接近X期的胚盘细胞,产生转基因禽类,从而在输卵管蛋白分泌部的管状腺体细胞中表达感兴趣的蛋白质,分泌入腔中,沉积于硬壳蛋的卵清中。如此产生的转基因禽类可在其种系中携带转基因。因此,可通过将外源基因人工导入禽类胚胎细胞中和以孟德尔方式将外源基因稳定传递给禽类后代这两种方式将外源基因转入禽类。
本发明包括在禽类输卵管中产生外源蛋白质的方法。该方法可包括,第一步,提供含有编码序列和操作性连接于该编码序列的启动子以使启动子可影响该核酸在禽类输卵管中表达的载体。下一步,可产生转基因细胞和/或组织,其中,将所述载体导入新鲜分离的培养物中或胚胎中的禽胚胎胚盘细胞,使该载体序列插入(例如随机插入)禽基因组。最后,可由转基因的细胞和/或组织产生在输卵管中表达外源蛋白质的成熟转基因禽类。当输卵管中表达的外源蛋白质也被分泌到输卵管腔并沉积于硬壳蛋的卵,如卵清中时,也可用该方法生产含有外源蛋白质,如药用蛋白质(如细胞因子)的禽蛋。
一方面,将载体插入禽类基因组染色体中产生转基因鸡的过程可任选地包括用DNA转染胚胎胚盘细胞,然后将这些细胞注射入受体胚盘下的胚下腔。该方法所用的载体可含有融合于外源编码序列并指导该编码序列在输卵管管状腺体细胞中表达的启动子。
本发明的另一方面,通过将在逆转录病毒载体的5’和3’LTRs之间携带有转基因遗传密码的复制缺陷型或可复制型逆转录病毒颗粒转导胚胎胚盘细胞,获得随机染色体插入和产生转基因禽类。例如,可利用含有经修饰的含有插入到启动子区段下游的外源基因的pNLB质粒的禽白血病病毒(ALV)逆转录病毒载体或鼠白血病病毒(MLV)逆转录病毒载体。可用包装在病毒颗粒中的经修饰的逆转录病毒载体的RNA拷贝感染胚胎胚盘发育为转基因禽类。或者,将能产生逆转录病毒转导颗粒的辅助细胞导入胚胎胚盘。
本发明的另一方面提供一种含有编码序列和操作及位置上相关可使该编码序列在禽类输卵管中表达的启动子的载体。这类载体包括但不限于:禽白血病病毒(ALV)逆转录病毒载体、鼠白血病病毒(MLV)逆转录病毒载体和慢病毒载体。此外,该载体可以是包含禽类白血病病毒(ALV)逆转录病毒载体、鼠白血病病毒(MLV)逆转录载体或慢病毒载体的LTR的核酸序列。该启动子能充分驱动此编码序列在禽类输卵管中的有效表达。此编码序列编码可沉积于硬壳蛋卵清中的外源蛋白质。同样,该编码序列编码外源性蛋白质,例如转基因家禽产生的蛋白质,如干扰素α2b(TPD IFN-α2b),以及转基因家禽产生的红细胞生成素(TPD EPO)和转基因家禽产生的粒细胞集落刺激因子(TPD G-CSF)。在一个实施方式中,本发明方法中所用的载体含有尤其适于外源蛋白质在禽类和禽蛋中表达的启动子。这样,可以在转基因禽类的输卵管和血液中以及禽蛋的卵清中表达此外源编码序列。所述启动子包括但不限于,巨细胞病毒(CMV)启动子、MDOT启动子、罗斯肉瘤病毒(RSV)启动子、β-肌动蛋白启动子(如鸡β-肌动蛋白启动子)、鼠白血病病毒(MLV)启动子、鼠乳腺肿瘤病毒(MMTV)启动子、卵白蛋白启动子、溶菌酶启动子、伴白蛋白启动子、卵类粘蛋白启动子、卵粘蛋白启动子和卵转铁蛋白启动子。任选地,该启动子可以是至少一种启动子区的一个区段,例如,卵白蛋白启动子,溶菌酶启动子,伴白蛋白启动子,卵类粘蛋白启动子,卵粘蛋白启动子和卵转铁蛋白的启动子区的一个区段。在一个实施方式中,该启动子可以是以下一种或多种启动子的组合或融合物,或以下一种或多种启动子的一部分的融合物,这些启动子包括例如卵白蛋白-、溶菌酶-、伴白蛋白-、卵类粘蛋白-、卵粘蛋白和卵转铁蛋白的启动子。
本发明的一个方面包括将卵白蛋白启动子截短和/或将卵白蛋白启动子的关键调控元件压缩使其保留在输卵管蛋白分泌部管状腺体细胞中表达所需的序列,同时使其足够小而易于掺入载体。例如,可利用卵白蛋白启动子区的一个区段。该区段包含卵清蛋白基因的5’侧翼区域。卵白蛋白启动子区段的总长度为0.88kb-7.4kb,优选0.88kb-1.4kb。优选该区段含有卵清蛋白基因甾类依赖性调控元件和负调控元件。任选地,该区段任选地还包含卵白蛋白基因的5’非翻译区(5’UTR)残基。或者,该启动子是溶菌酶基因、伴白蛋白基因、卵类粘蛋白基因、卵粘蛋白基因和卵转铁蛋白基因启动子区的一个区段。此类启动子的一个例子是合成的含有卵类粘蛋白(MD)启动子和卵转铁蛋白(OT)启动子元件的MDOT启动子。
本发明的另一方面,整合入禽类基因组的载体含有操作上连接于外源编码序列的组成型启动子(例如,巨细胞病毒(CMV)启动子,罗斯肉瘤病毒(RSV)启动子,鼠白血病病毒(MLV)启动子)。或者,可使用非组成型启动子例如鼠乳腺肿瘤(MMTV)启动子。
本发明的其他方面提供在其生殖系组织的遗传物质中携带有转基因的转基因禽类。更具体说,该转基因包含外源基因和操作及位置上与外源基因相关的启动子以表达此外源基因。所述外源基因可以在转基因禽的输卵管和血液中表达。该外源基因编码外源蛋白质,如药用蛋白质,包括细胞因子,如TPD IFN-α(如IFN-α2)、TPD EPO和TPD G-CSF。该外源蛋白质可沉积于硬壳蛋的卵清中。
本发明的另外一方面提供的禽蛋含有对于该禽类为外源性的蛋白质。利用本发明可使外源蛋白质在输卵管细胞中表达,分泌到输卵管蛋白分泌部腔并沉积于禽蛋的卵清中。包在禽蛋中的蛋白质量可达到每只蛋1克以上。所述外源蛋白质包括但不限于:TPD IFN-α2b、TPD EPO和TPD G-CSF。
本发明的另外一方面提供分离的包含人干扰素-α2b(IFN-α2b)最佳编码序列,即编码转基因家禽产生的干扰素-α2b(TPD IFN-α2b)的重组转基因家禽产生的干扰素-α2b编码序列的多聚核苷酸序列。本发明还包括分离的包含TPD IFN-α2b多肽序列的蛋白质,其中该蛋白质的Thr-106位被N-乙酰基-氨基半乳糖、半乳糖、N-乙酰基-葡糖胺、唾液酸和其组合物O-糖基化。
本发明还设想一种包含TPD IFN-α2b多肽序列的药物组合物,其中的蛋白质在Thr-106位被N-乙酰基-氨基半乳糖、半乳糖、N-乙酰基-葡糖胺、唾液酸和其组合物O-糖基化。
本发明一方面提供如本文所述产生的外源蛋白质的编码序列,其中该编码序列是根据在禽类,如鸡中表达进行密码子优化的。可由禽类细胞(如鸡细胞)中表达的至少一种,优选一种以上蛋白质的密码子使用来确定密码子优化方案。例如,可由编码鸡的卵白蛋白、溶菌酶、卵粘蛋白和卵转铁蛋白的核酸序列确定密码子使用。例如,可通过Wisconsin Package(威斯康星软件包)9.1版(威斯康星州麦迪逊的Genetics Computer Group Inc.(遗传学计算组公司))的BACKTRANSLATE程序,利用由红原鸡(Gallus gallus)卵白蛋白、溶菌酶、卵类粘蛋白和卵转铁蛋白编译的密码子使用表对外源蛋白质的DNA序列进行密码子优化。
本发明一方面提供一种分离的包含人促红细胞生成素(EPO)最佳编码序列,即编码转基因家禽产生的促红细胞生成素(TPD EPO)的重组转基因家禽产生的促红细胞生成素编码序列的多聚核酸序列。
本发明另一方面提供一种含有第一和第二编码序列以及操作和位置上与该第一和第二编码序列相关的可在禽类输卵管中表达该第一和第二编码序列的启动子的载体。在这个方面,该载体可包含位于该第一和第二编码序列之间的内部核糖体进入位点(IRES)元件,其中,第一编码序列编码蛋白X,第二编码序列编码蛋白Y,蛋白X和蛋白Y中的一种或两种沉积于硬壳蛋的卵(如卵清)中。
例如,蛋白质X可以是单克隆抗体的轻链(LC),蛋白质Y可以是单克隆抗体的重链(HC)。或者,第二编码序列编码的蛋白质(例如,酶)能对第一编码序列编码的蛋白质进行翻译后修饰。该载体任选地可含有其它编码序列和其它IRES元件,通过IRES元件将载体中的各个编码序列与其他编码序列分开。使用考虑用于本发明的IRES的其它例子参见例如2005年1月31日提交的美国专利申请11/047,184,将其全部内容纳入本文作参考。
本发明还涉及生产含有蛋白质如药用蛋白质,包括单克隆抗体、酶和其他蛋白质的禽蛋的方法。该方法可包括提供含有启动子、编码序列和至少一个IRES元件的载体;通过将该载体导入禽类胚胎胚盘细胞产生转基因细胞或组织,其中,该载体序列随机插入禽类基因组;由转基因细胞或组织产生成熟的转基因禽类。如此产生的转基因禽类可在其输卵管中表达所述编码序列,将产生的蛋白质分泌入输卵管腔中,从而沉积于硬壳蛋的卵清中。此外,本发明包括产出含有该重组蛋白的禽蛋的该转基因禽类的后代。一般地,基本上该后代所有细胞均含有该转基因,或者该后代的所有细胞均不含该转基因。
本发明的一个重要方面涉及含有外源肽或蛋白质,包括但不限于药用蛋白质的禽类硬壳蛋(如鸡硬壳蛋)。该外源肽或蛋白质可由转基因禽类的转基因编码。在一个实施方式中,该外源肽或蛋白质(如药用蛋白质)是糖基化蛋白质。该蛋白可以有用量存在。在一个实施方式中,该蛋白的含量为约0.01微克/硬壳蛋-约1克/硬壳蛋。在一个实施方式中,该蛋白的含量为约1微克/硬壳蛋-约1克/硬壳蛋。例如,该蛋白的含量为约10微克/硬壳蛋-约1克/硬壳蛋(例如约10微克/硬壳蛋-约400毫克/硬壳蛋)。
在一个实施方式中,该外源蛋白质,如外源药用蛋白存在于该蛋的卵清中。在一个实施方式中,该蛋白的含量为约1纳克/毫升卵清-约0.2克/毫升卵清。例如,该蛋白的含量为约0.1微克/毫升卵清-约0.2克/毫升卵清(例如该蛋白的含量为约1微克/毫升卵清-约100毫克/毫升卵清)。在一个实施方式中,该蛋白的含量为约1微克/毫升卵清-约50毫克/毫升卵清。例如,该蛋白的含量为约1微克/毫升卵清-约10毫克/毫升卵清(例如该蛋白的含量为约1微克/毫升卵清-约1毫克/毫升卵清)。
本发明涉及产生含有任何有用蛋白质,包括一种或多种药用蛋白质的硬壳蛋。这类蛋白质包括但不限于:激素、免疫球蛋白或免疫球蛋白的一部分、细胞因子(如GM-CSF、G-CSF、红细胞生成素和干扰素)和CTLA4。本发明也包括产生含有融合蛋白,包括但不限于免疫球蛋白或免疫球蛋白的某部分与某些有用肽序列的融合蛋白的硬壳蛋。在一个实施方式中,本发明提供产生含有抗体Fc片段的硬壳蛋。例如,该蛋可含有本发明Fc-CTLA4融合蛋白。
由引入载体的胚盘细胞产生的禽类是G0代,称为“创始者”。创始禽类一般是含各插入转基因的嵌合动物。就是说,G0转基因禽类中只有一些细胞含有该转基因。G0代一般也是该转基因的半合子。G0代可与非转基因动物配种,产生的G1转基因后代也是该转基因的半合子,基本上所有该禽类的细胞均含有该转基因。G1半合子后代可与非转基因动物配种,产生G2半合子后代,或互相配种产生转基因纯合的G2后代。基本上所有由G1后代产生的转基因阳性禽类细胞均含有该转基因。在一个实施方式中,来自同一谱系的半合子G2后代可配种产生该转基因纯合的G3后代。在一个实施方式中,半合子G0动物互相配种产生每个动物细胞含有两个转基因拷贝的纯合子G1后代。这些只是某些有用的配种方案的例子,本发明考虑到采用任何有用的配种方案,如本领域普通技术人员已知的方案。
本发明一方面涉及含有具有家禽产生的糖基化模式,如鸡产生的糖基化模式的按本发明产生的蛋白质的组合物。例如,本发明包括具有家禽产生的糖基化模式,如本文所述的一种或多种糖基化模式的药用蛋白质。本发明也包括具有家禽产生的糖基化模式,如本文所述的一种或多种糖基化模式的人蛋白质。
本发明一方面包括具有家禽产生的糖基化模式的G-CSF,即转基因家禽产生的G-CSF或TPD G-CSF。在一个实施方式中,该糖基化模式不同于人细胞和/或CHO细胞中产生的G-CSF。就是说,该组合物含有具有家禽产生的糖链(即糖基化结构)并且人细胞和/或CHO细胞中获得的G-CSF上没有这种糖链或糖基化结构的G-CSF分子。然而,该组合物也可含有糖基化结构与CHO细胞和/或人细胞中获得的G-CSF相同的G-CSF分子。CHO细胞产生的人G-CSF的糖基化参见全部内容纳入本文作参考的Holloway,C.J.,European J.of Cancer(1994),第30A卷,pS2-S6;全部内容纳入本文作参考的Oheda等(1988)J.Biochem.,第103卷,第544-546页以及全部内容纳入本文作参考的Andersen等(1994)Glycobiology,第4卷,第459-467页。似乎实施例20所示的结构如A和G可能与报道的CHO细胞产生的G-CSF的糖基化结构相同或相似。在一个实施方式中,TPD G-CSF的糖基化模式与哺乳动物细胞产生的G-CSF不同。
在一个实施方式中,本发明提供分离的G-CSF。就是说,该组合物中所含的G-CSF可以是分离的G-CSF。例如,该G-CSF从卵清分离。分离的G-CSF可以是具有不同糖基化结构的G-CSF分子,或者分离的G-CSF可以是只有一种具体糖基化结构的单独分离的G-CSF分子。
在一个实施方式中,本发明组合物的G-CSF存在于硬壳蛋中。例如,G-CSF可存在于本发明转基因禽类所产硬壳蛋的卵清中。就是说,在一个实施方式中,本发明涉及含有本发明G-CSF的禽蛋(如鸡蛋)卵清。在一个实施方式中,卵清中G-CSF的含量超过约1微克/毫升卵清。例如,G-CSF的含量可以大于约2微克/毫升卵清(例如含量约2微克-200微克/毫升卵清)。
在本发明的一个具体方面,在禽类如鸡的输卵管细胞中G-CSF发生糖基化。例如,G-CSF可以在输卵管细胞中产生并被糖基化。在一个实施方式中,G-CSF在管状腺细胞中被糖基化(例如G-CSF在管状腺细胞中产生并被糖基化)。
认为G-CSF在苏氨酸133上糖基化。然而,本发明不限于在G-CSF分子的任何特定位点上的糖基化。
通常,本发明G-CSF一般是人G-CSF。在一个实施方式中,成熟G-CSF含有图18C所示氨基酸序列。
在一个实施方式中,本发明组合物包含用下述结构糖基化的G-CSF分子:
Figure A20078000921800221
本发明还特别涉及包含具有这些特定糖基化结构之一的G-CSF分子的组合物。这类组合物还可包含具有一种或多种其它糖基化结构的一种或多种G-CSF分子。
就是说,在一个实施方式中,本发明特别涉及包含具有以下结构的G-CSF分子的组合物:
Figure A20078000921800222
并且涉及包含具有以下结构的G-CSF分子的组合物:
Figure A20078000921800223
并且涉及包含具有以下结构的G-CSF分子的组合物:
Figure A20078000921800224
并且涉及包含具有以下结构的G-CSF分子的组合物:
SA-Gal-NAcGal-;
并且涉及包含具有以下结构的G-CSF分子的组合物:
并且涉及包含具有以下结构的G-CSF分子的组合物:
Figure A20078000921800232
并且涉及包含具有以下结构的G-CSF分子的组合物:
Gal-NAcGal-,
其中,Gal=半乳糖,
NAcGal=N-乙酰基-氨基半乳糖,
NAcGlu=N-乙酰基-葡糖胺,和
SA=唾液酸
本发明还涉及提高患者白细胞计数的方法,所述方法包括给予患者治疗有效量的TPD G-CSF。治疗有效量一般是能将患者的白细胞计数提高所需量的TPD G-CSF用量。
本文所述特征的任何有用组合都包括在本发明范围内,只要从上下文、本说明书和本领域普通技术人员的知识中能够看出这些组合中所含的特征不会互补矛盾。
参照以下说明书详述,与下面简述的附图结合考虑时,可以明显看出本发明的其它目的和方面。
附图简要说明
图1A和1B,显示卵白蛋白启动子表达载体,该载体含有卵白蛋白启动子片段和编码序列即编码外源蛋白质X的基因X。X代表感兴趣的任何外源基因或外源蛋白质。
图2A、2B、2C和2D,显示本发明的逆转录病毒载体,该载体含有卵白蛋白启动子和编码序列即编码外源蛋白质X的基因X。X代表感兴趣的任何外源基因或外源蛋白质。
图2E,显示扩增用于插入2A和2B载体中外源基因的方法。
图2F,显示逆转录病毒载体,该载体含有控制编码序列,基因X表达的卵白蛋白启动子。该载体还包含内部核糖体进入位点(IRES)元件,以使第二编码序列,基因Y能够表达。X和Y代表感兴趣的任何基因。
图3A和3B,分别显示ALV来源的载体pNLB和pNLB-CMV-BL的示意图。因为NLB还没有完全测序,bp(碱基对)的测量是从已发表的数据(Cosset等,1991;Thoraval等,1995)和本文讨论的数据估计的。因为整合入鸡的基因组时将出现这两个载体,所以显示了它们。
图4A和4B,显示嵌合和转基因鸡血清中β-内酰胺酶(内酰胺酶)的量。图4A中,孵化后8个月测定的以NLB-CMV-BL转基因转导的G0鸡血清中生物活性内酰胺酶浓度。示出了世代、性别和翅圈号码。测定了孵化后6至7个月G1转基因鸡的内酰胺酶血清浓度。箭头表示从公鸡2395繁殖产生的G1鸡。在图4B中,测定了G1和G2转基因鸡的内酰胺酶血清浓度。箭头表示从母鸡5657或公鸡4133繁殖产生的G2鸡。鸡4133、5308和5657的样品与图4A中的相同。收集5657繁殖的G2鸡的孵化后3至60天的样品。收集4133繁殖的G2鸡孵化后3个月的样品。
图5,显示具有母鸡5657(图5A)或公鸡4133(图5B)所带转基因位点的鸡的谱系。2395是携带有多个转基因位点的公鸡。将2395与一个非转基因母鸡交配,产生了3个各在其基因组的唯一位点携带有转基因的后代。简单起见,将未显示表达数据的转基因后代和非转基因后代从谱系中略去。以下面的符号表示翅圈号码:○母鸡;□公鸡;●携带有NLB-CMV-BL转基因的母鸡;■携带有NLB-CMV-BL转基因的公鸡。
图6,显示母鸡5657及其后代卵清中的β-内酰胺酶(内酰胺酶)量。图6A中,检测了5657及其转基因后代卵清中的活性内酰胺酶。对照取自于未处理的母鸡,连产鸡(clutchmate)是从母鸡5657繁殖的非转基因G2鸡。2000年三月收集鸡蛋。箭头表示从母鸡5657繁殖的G2鸡。图6B中,将携带有一拷贝转基因(半合子)的G2转基因母鸡的卵清样品与携带有两拷贝转基因(纯合)的G3母鸡6978的卵清样品进行了比较。2001年二月收集鸡蛋。左边标明了世代和翅圈号码。
图7,显示从公鸡4133繁殖的G2和G3母鸡蛋中的β-内酰胺酶(内酰胺酶)。图7A中,检测了从公鸡4133繁殖的四个代表性半合子转基因母鸡卵清的活性内酰胺酶。收集蛋的时间分别是1999年10月,2000年3月和2001年2月,每次收集后一个月每只母鸡至少检测4只蛋。对照代表未处理母鸡的卵清。左边标明了翅圈号码。计算每个时期四只母鸡的平均值。图7B中,将半合子G2转基因母鸡的卵清与半合子和纯合子转基因G3母鸡的卵清作比较。2001年2月收集鸡蛋。每只母鸡的世代和转基因拷贝数列于数据栏中。携带一个或两个拷贝的母鸡的平均浓度见该图底部。
图8A和8B,分别显示用于在鸡中表达IFN-α2b的pNLB-CMV-IFN载体和用于在鸡中表达促红细胞生成素(EPO)的pNLB-MDOT-EPO载体。
图9,显示转基因家禽产生的干扰素-α2b(TPD IFN-α2b)的新糖基化模式,包括所有的6条带。
图10,显示人外周血白细胞产生的干扰素-α2b(PBL IFN-α2b或天然的hIFN)和转基因家禽产生的干扰素-α2b(TPD IFN-α2b或卵清hIFN)的比较。
图11A,显示优化的人干扰素-α2b(IFN-α2b)的合成核酸序列(cDNA,残基1-498),即重组TPD IFN-α2b(SEQ ID NO:1)。图11B,显示转基因家禽产生的干扰素-α2b(TPD IFN-α2b)的合成核酸序列(残基1-165)(SEQ IDNOS:2)。
图12A,显示优化的人促红细胞生成素(EPO)的合成核酸序列(cDNA,残基1-579),即重组TPD EPO(SEQ ID NO:3)。图12B,显示转基因家禽产生的促红细胞生成素(TPD EPO)的合成核酸序列(残基1-193)(SEQ IDNO:4)。(对于天然的人EPO,又见NCBI登录号NP_000790)。
图13,显示与IFN-MM CDS相连接的合成MDOT启动子。MDOT启动子包含鸡卵类粘蛋白基因(卵类粘蛋白启动子)的-435bp至-166bp(见NCBI登录号J00894)和鸡伴白蛋白基因(卵转铁蛋白启动子)的-251至+29bp(见NCBI登录号Y00497、M11862和X01205)的元件。
图14提供主要卵清蛋白质的小结。
图15A和15D,显示pCMV-LC-emcvIRES-HC载体,其中,为检测单克隆抗体的表达,通过放置脑心肌炎病毒(EMCV)的IRES使该载体能表达人单克隆抗体的轻链(LC)和重链(HC)。与之相比,图15B和15C分别显示独立的载体pCMV-HC和pCMV-LC,其中,这些载体也用于检测单克隆抗体的表达。
图16显示银染的纽迫基(Neupogen)
Figure A20078000921800261
(泳道A)和TPD G-CSF(泳道B)的SDS PAGE。
图17显示与细菌产生的人G-CSF相比,14天中TPD G-CSF的绝对中性粒细胞计数(ANC)增加。
图18A(SEQ ID NO:39)显示编码图18B的氨基酸序列的核苷酸序列。对应于NCBI登录号NP 7577373的图18B(SEQ ID NO:40)显示包含在细胞分泌期间切断而形成成熟G-CSF的天然信号序列的G-CSF氨基酸序列。图18C(SEQID NO:41)显示按本发明产生的成熟G-CSF蛋白的氨基酸序列。
发明详述
本文提出下面的定义用于阐述和明确描述本发明所用的各种术语的含义和范围。
“核酸或多聚核苷酸序列”包括但不限于,真核生物的mRNA、cDNA、基因组DNA以及合成的DNA和RNA序列,包括天然的核苷碱基腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶和尿嘧啶。该术语还包括含有一个或多个经修饰碱基的序列。
“治疗性蛋白质”或“药用蛋白质”包含全部或部分构成药物的氨基酸序列。
“编码序列”或“开放阅读框”指当置于合适的调控序列控制下可在体外或体内被转录和翻译(如果是DNA)或翻译(如果是mRNA)成多肽的多聚核苷酸或核酸序列。编码序列的边界由5’(氨基)末端翻译起始密码子和3’(羧基)末端翻译终止密码子界定。转录终止序列一般位于编码序列的3’端。编码序列的5’和/或3’末端可侧接有非翻译区。
“外显子”指基因的一部分,当基因转录为核转录物时,该部分在核剪接除去内含子或间插序列后以细胞质mRNA的形式表达。
核酸“控制序列”或“调控序列”指启动子序列、翻译起始和终止密码子、核糖体结合位点、聚腺苷酸信号、转录终止序列、上游调控区、增强子等,它们对于在特定宿主细胞中转录和翻译某给定编码序列是必需的和充分的。适合真核细胞的控制序列例如有启动子、聚腺苷酸信号和增强子。重组载体中不一定存在所有的这些控制序列只需存在对于所需基因的转录和翻译必需和充分的控制序列。
“可操作性或操作性连接于”指可发挥所需功能的编码和控制序列的配置。因此,操作性连接于编码序列的控制序列可影响该编码序列的表达。在细胞中,编码序列可操作性连接于或受控于转录调控区,在此区DNA聚合酶结合于启动子序列,将编码序列转录为可翻译成蛋白质的mRNA。控制序列可不必与编码序列毗连,只要它们可发挥功能指导编码序列的表达。因此,例如,间插非翻译的转录序列存在于启动子序列和编码序列之间时,仍可认为该启动子序列与该编码序列“操作性连接”。
对于核酸序列例如编码序列和控制序列,术语“异源的”和“外源的”指正常情况下不与重组构建物的某区域或特定染色体位点相关的序列,和/或正常情况下不与特定细胞相关的序列。因此,核酸构建物的“外源”区域是在自然状态下未发现与其相关连的其它核酸分子内或与该分子相连的核酸的可鉴定区段。例如,构建物的外源区域可包含与自然状态下未与之相关连的序列相连的编码序列。外源编码序列的另一个例子是编码序列本身是自然界中未发现的构建物(例如,合成的含有与天然基因不同的密码子的序列)。类似地,用某宿主细胞正常情况下不存在的构建物转化的该宿主细胞,对本发明而言也认为是外源的。
本文所用“外源蛋白质”指自然状态下不存在于特定组织或细胞中的蛋白质,外源表达构建物或转基因表达产物是这种蛋白质,或在特定组织或细胞自然状态下不以某确定数量存在的蛋白质。蛋的外源蛋白质是通常该蛋中不存在的蛋白质。例如,蛋的外源蛋白质可以是因为产蛋动物的转基因中编码序列的表达而存在于该蛋中的蛋白质。
“内源基因”指自然发生的正常情况下与特定细胞相关的基因或片段。
本文所述的表达产物可包括具有确定化学结构的蛋白质性物质。然而,精确的结构取决于很多因素,尤其是对于蛋白质很普遍的化学修饰。例如,因为所有的蛋白质都含有可电离的氨基和羧基基团,所以可获得酸性或碱性盐形式或中性形式的蛋白质。例如,可用糖分子(糖基化)或其它化学方法包括例如与脂、磷酸、乙酰基团等共价结合或离子结合,经常通过与糖连接的化学衍生方法来产生一级氨基酸序列。这些修饰可发生在体外或体内,后者是宿主细胞通过翻译后加工系统进行的。这些修饰可增加或降低分子的生物活性,这些化学修饰的分子也包括在本发明的范围内。
克隆、扩增、表达和纯化的其他方法对本领域技术人员是显而易见的。代表性方法见Sambrook,Fritsch和Maniatis,分子克隆:实验室指南,第二版,冷泉港实验室出版社(Cold Spring Harbor Laboratory)(1989)。
“载体”指包括单链、双链、环状或超螺旋DNA或RNA的多聚核苷酸。一个典型载体可包含以下操作性连接于适宜位置以使功能基因表达的元件:复制起始位点、启动子、增强子、5′mRNA先导序列、核糖体结合位点、核酸盒(Nucleic acid cassette)、终止和聚腺苷酸化位点以及选择性标记序列。在具体应用时可省略一个或多个此类元件。核酸盒可包含供待表达核酸序列插入的限制性位点。在功能性载体中,核酸盒包含含有翻译起始位点和终止位点的待表达核酸序列。构建物中可任选地包含内含子,例如位于编码序列的5’。构建载体时要使特定的编码序列和合适的调控序列位于该载体中,编码序列相对于调控序列的位置和方向应使得编码序列在调控序列或调控序列的“控制”下转录。为实现这一目的,可能需要对编码特定感兴趣蛋白质的序列进行修饰。例如,在有些情况下可能需要修饰该序列使其以正确方向与控制序列相连,或使其保持读码框。在插入载体之前将控制序列和其他调控序列与编码序列连接。或者,将编码序列直接克隆到已含有控制序列和该控制序列调控下的合适的读码框中的限制性位点的表达载体中。
“启动子”是DNA上可与RNA聚合酶结合从而启动基因转录的位点。在有些实施方式中,通过添加或删除序列来修饰启动子,或者以其它序列包括天然和合成序列以及这两种序列的组合物来替代启动子。很多真核启动子含有两种类型的识别序列:TATA盒和上游启动子元件。前者,位于转录起始位点上游,参与指导RNA聚合酶在正确的位置启动转录,而后者似乎决定了转录速率,位于TATA盒上游。增强子也可促进相连启动子的转录,但很多增强子只在特定细胞型中发挥功能。很多增强子/启动子元件来源于病毒,例如,SV40启动子,巨细胞病毒(CMV)启动子,罗斯肉瘤病毒(RSV)启动子和鼠白血病病毒(MLV)启动子均在很多细胞型中有活性,被称为“遍在型”启动子。或者,本发明中也可采用非组成型启动子例如小鼠乳腺肿瘤病毒(MMTV)启动子。插入克隆位点的核酸序列可含有编码感兴趣多肽的任何开放读码框,条件是当该编码序列编码感兴趣的多肽时,它应该没有可阻碍产生正确mRNA分子和/或产生异常剪接的或异常mRNA分子的隐蔽剪接位点。
术语“家禽产生的”指由家禽产生或获得的组合物或物质。“家禽”指可作为家畜饲养的禽类,包括但不限于:鸡、鸭、火鸡、鹌鹑和平胸鸟。例如,“家禽产生的”可指鸡产生的、火鸡产生的和/或鹌鹑产生的。
“标记基因”指编码使正确转染的细胞得以鉴定和分离的蛋白质的基因。适宜的标记基因包括,但不限于绿色、黄色和蓝色荧光蛋白基因(分别为GFP、YFP、BFP)。其他适宜的标记基因包括胸苷激酶(tk)、二氢叶酸还原酶(DHFR)和氨基糖苷磷酸转移酶(APH)基因。后者引入对氨基甙类抗菌素如卡那霉素、新霉素和硫酸庆大霉素的抗性。可将这些和其他标记基因例如编码氯霉素乙酰转移酶(CAT)、β-内酰胺酶、β-半乳糖苷酶(β-gal)的基因,与表达所需蛋白质的基因一起整合入主要核酸盒,或者选择标记可能包含在独立的载体上共转染。
“报道基因”是通过其编码蛋白的存在来报道细胞活性的标记基因。
“逆转录颗粒”或“转导颗粒”指能够将非病毒DNA或RNA转导如细胞中的复制缺陷型或能够复制的病毒。
术语“转化”、“转导”和“转染”均指将多核苷酸引入禽类胚盘细胞中。“蛋白分泌部”(Magnum)是含有能合成和分泌禽蛋的卵清蛋白质的管状腺体细胞的输卵管漏斗和峡之间的部分。
本文所用“MDOT启动子”是在输卵管蛋白分泌部而非其它组织的管状腺体细胞中有活性的合成启动子。MDOT包含卵类粘蛋白(MD)和卵转铁蛋白(OT)启动子的元件(图13)。
在“优化的编码序列”中用到术语“优化的”,其中,可将在卵清蛋白质卵清蛋白、溶菌酶、卵类粘蛋白和卵转铁蛋白的各特定氨基酸最常用的密码子用于设计被插入本发明载体中的优化的人干扰素-α2b(IFN-α2b)的多聚核苷酸序列。更具体地,优化的人干扰素-α2b的DNA序列可根据母鸡输卵管优化密码子的使用率通过威斯康辛软件包9.1版(威斯康辛州麦迪逊的遗传学计算组公司)的BACKTRANSLATE程序利用红原鸡卵白蛋白、溶菌酶、卵类粘蛋白和卵转铁蛋白编译的密码子使用率表来创建。例如,在这四种卵清蛋白质中,丙氨酸在四种密码子中的使用百分率为GCU 34%,GCC31%,GCA 26%,GCG 8%。因此,可将GCU作为优化的人IFN-α2b编码序列中大多数丙氨酸的密码子。用含有编码优化的人IFN-α2b基因的载体来产生转基因禽,其能在组织和卵中表达转基因禽产生的IFN-α2b(TPDIFN-α2b)。相似地,用上述方法设计按照本发明产生的其它编码序列蛋白,如人红细胞生成素(EPO)或其它蛋白质。
通过本发明的方法,可将转基因导入禽类胚胎胚盘细胞,产生在其种系组织的遗传物质中携带有该转基因的转基因鸡、转基因火鸡、转基因鹌鹑和其他禽类。胚盘细胞是典型的VII-XII期细胞,或与之相等的细胞,在一个实施方式中是近X期的细胞。可用于本发明的细胞包括胚胎生殖细胞(EG)、胚胎干细胞(ES)和原生殖细胞(PGC)。胚胎胚盘细胞可以是新分离的、维持在培养物中的或胚胎中的。
本文描述了可用于实施本发明方法的载体。可用这些载体将外源编码序列稳定导入禽类基因组。或者,可用这些载体在禽类特定组织,例如禽类输卵管组织中生产外源蛋白质。还可将这些载体用于生产含有外源蛋白质的禽蛋的方法中。在一个实施方式中,引入胚盘细胞之前编码序列和启动子均位于5′和3′LTR之间。在一个实施方式中,所述载体是逆转录病毒载体,编码序列和启动子均位于逆转录病毒载体的5’和3’LTR之间。在一个有用的实施方式中,该LTR或逆转录病毒载体来源于禽白血病病毒(ALV)、鼠白血病毒(MLV)或慢病毒。
在一个实施方式中,该载体包含操作性连接于编码序列的信号肽编码序列,从而在细胞中翻译后,该信号肽将指导该载体表达的外源蛋白质分泌入硬壳蛋的卵清中。该载体可包含标记基因,其中所述标记基因操作性连接于启动子。
在有些情况下,将本发明的载体导入胚胎胚盘细胞是用新分离的或培养中的胚胎胚盘来进行的。然后,一般是将转基因细胞注射入蛋受体胚盘下的胚下腔内。然而在有些情况下,也可将载体直接送入胚盘胚的细胞。
在本发明的一个实施方式中,用于转染胚盘细胞并产生稳定整合入禽基因组的载体含有某编码序列和操作及位置上相关的启动子,以在禽类输卵管蛋白分泌部的管状腺体细胞中表达该编码序列,其中,该编码序列编码一种可沉积于硬壳蛋卵清中的外源蛋白质。任选地,启动子可以是卵白蛋白启动子区的一个足够大的区段以指导编码序列在管状腺体细胞中表达。本发明包括将卵白蛋白启动子截短和/或将卵白蛋白启动子的关键调控元件压缩,使其保留在输卵管蛋白分泌部管状腺体细胞中表达所需的序列,同时使其足够小而易于与载体整合。在一个实施方式中,可利用卵白蛋白启动子区的一个区段。该区段包含卵清蛋白基因的5’侧翼区域。卵白蛋白启动子区段的总长度为0.88kb-7.4kb,优选0.88kb-1.4kb。优选该区段含有卵清蛋白基因的甾类依赖性调控元件和负调控元件。任选地,该区段也包含卵白蛋白基因的5’非翻译区(5’UTR)残基。因此,该启动子可来源于卵白蛋白基因、溶菌酶基因、伴白蛋白基因、卵类粘蛋白基因、卵转铁蛋白基因或卵粘蛋白基因的启动子区(图14)。此类启动子的一个例子是包含卵类粘蛋白启动子和卵转铁蛋白启动子元件的合成性MDOT启动子(图13)。该启动子也可以是很大程度上但是不完全是对输卵管蛋白分泌部特异性的,例如溶菌酶启动子。该启动子也可以是鼠乳腺肿瘤病毒(MMTV)启动子。或者,该启动子可以是组成型启动子(例如,巨细胞病毒(CMV)启动子,罗斯肉瘤病毒(RSV)启动子,鼠白血病病毒(MLV)启动子等)。在本发明的一个优选实施方式中,该启动子是巨细胞病毒(CMV)启动子、MDOT启动子、罗斯肉瘤病毒(RSV)启动子、鼠白血病病毒(MLV)启动子、鼠乳腺肿瘤病毒(MMTV)启动子、卵白蛋白启动子、溶菌酶启动子、伴白蛋白启动子、卵类粘蛋白启动子、卵粘蛋白启动子和卵转铁蛋白启动子。任选地,该启动子可以是启动子区的至少一个区段,例如卵白蛋白启动子、溶菌酶启动子、伴白蛋白启动子、卵类粘蛋白启动子、卵粘蛋白启动子和卵转铁蛋白启动子区的一个区段。在一个实施方式中,该启动子是CMV启动子。
图1A和1B说明了卵白蛋白启动子表达载体的例子。基因X是编码外源蛋白质的编码序列。弯曲箭头表示转录起始位点。在一个实施例中,此载体含有卵白蛋白基因1.4kb的5’侧翼序列(图1A)。图1A中“-1.4kb启动子”序列对应于从卵白蛋白基因转录起始位点上游约1.4kb开始延伸到卵白蛋白基因5’非翻译区约9个残基的序列。这个约1.4kb长的区段含有两个关键调控元件,甾类依赖性调控元件(SDRE)和负调控元件(NRE)。之所以称为NRE是因为它含有几个在缺少激素(例如雌激素)时可阻断基因表达的负调控元件。一个更短的0.88kb区段也可含有这两种元件。在另一个实施例中,此载体含有卵白蛋白基因约7.4kb的5’侧翼序列并含有两个附加元件(HS-III和HS-IV),已知其中一个含有可使该基因响应雌激素诱导的功能区(图1B)。一个更短的6kb区段也含有这四个元件,可任选地用于本发明。
用于本发明随机整合的每个载体优选包含至少一个1.2kb的鸡β-珠蛋白基因座元件,该元件可使基因在插入基因组的位点既不活化也不失活。在一个实施方式中,将两个绝缘子元件加入到卵白蛋白基因构建物的一端。在β-珠蛋白基因座中,此绝缘子元件作用是阻止远端位点控制区(LCR)活化珠蛋白基因区上游的基因,并且已显示可克服转基因蝇中的位置效应,表明它们可防止插入位点的正效应和负效应。只有在该基因的5’或3’末端才需要绝缘子元件,因为转基因是以多拷贝串联形式整合有效产生了一系列侧翼连接有相邻转基因的绝缘子的基因。在另一个实施方式中,绝缘子元件不连于该载体而是和该载体共转染。这种情况下,所述载体和元件通过随机整合入基因组的过程在细胞中串联连接。
任选地,每个载体还可包含标记基因以鉴定和富集已稳定整合表达载体的细胞克隆。用能驱动各类细胞型高水平表达的遍在启动子驱动该标记基因的表达。在本发明的一个实施方式中,该标记基因是受溶菌酶启动子驱动的人干扰素(基因)。在另一个实施方式中,是受蟾蜍延伸因子1-α(ef-1α)启动子(Johnson和Krieg,Gene 147:223-26(1994))驱动的绿色荧光蛋白(GFP)报告基因(Zolotukhin等,J.Virol 70:4646-4654(1995))。蟾蜍ef-1α启动子是一种能在各类细胞中都表达的强启动子。GFP含有能增强荧光的突变并且已被人源化或修饰以使其密码子符合人基因的密码子使用特点。因为事实上禽类的密码子使用和人的一样,所以该基因的人源化形式也能在禽类胚盘细胞中高表达。在其他可选的实施方式中,该标记基因可操作性连接于遍在启动子HSV tk、CMV、β-肌动蛋白或RSV中的一个。
人和禽类的密码子使用相配很好,当用无脊椎动物的基因作为转基因中的编码序列时,可修饰无脊椎动物的基因序列以改变适当的密码子从而使密码子使用与人和禽类的相似。
可采用本领域普通技术人员所知的任何几种方法转染胚盘细胞。首先将核酸与聚赖氨酸或阳离子脂质混和以促进载体穿过细胞膜从而帮助将载体导入细胞。然而,优选通过采用输送运运载体例如脂质体或病毒将载体导入细胞。用于将本发明载体导入胚盘细胞的病毒包括但不限于,逆转录病毒、腺病毒、腺病毒相关病毒、单纯疱疹病毒和牛痘病毒。
在转染胚盘细胞的一种方法中,用包装的逆转录病毒载体将该载体运送进胚胎胚盘细胞以使该载体整合入禽类基因组。
向胚胎中的胚胎胚盘细胞运送逆转录病毒转导颗粒的另一种方法,可将能产生逆转录病毒的辅助细胞运送入胚盘。
用于将转基因随机插入禽类基因组的逆转录病毒是复制缺陷型禽类白血病病毒(ALV)、复制缺陷型鼠白血病病毒(MLV)或慢病毒。为了产生合适的逆转录病毒载体,将卵白蛋白启动子的一个区域和一个或多个外源基因插入逆转录病毒基因组的5’和3’长末端重复(LTR)之间以修饰pNLB载体。本发明考虑到位于管状腺细胞中有活性的启动子下游的任何编码序列将在管状腺细胞中表达。例如,因为卵白蛋白启动子驱动卵清蛋白的表达且在输卵管管状腺体细胞中有活性,所以卵白蛋白启动子能在输卵管蛋白分泌部管状腺体细胞中表达。虽然在培养的输卵管管状腺体细胞中检测时,发现7.4kb的卵白蛋白启动子产生活性最高的构建物,然而用于逆转录病毒载体时优选将卵白蛋白启动子缩短。在一个实施方式中,所述逆转录病毒载体含有卵白蛋白启动子的1.4kb片段;0.88kb区段也是足够的。
任选地,本发明的任何载体也可任选包含信号肽的编码序列,该信号肽可指导载体中编码序列表达的蛋白质从输卵管管状腺体细胞分泌出来。本发明的这一方面有效地扩大了利用本发明方法可沉积于禽蛋的外源蛋白质的范围。当一种外源蛋白质不能分泌时,可修饰含有其编码序列的载体使其含有溶菌酶基因的60bp编码信号肽的DNA序列。可将编码该信号肽的DNA序列插入载体中并使其位于该DNA编码蛋白质的N端。
图2A-2D说明合适的逆转录病毒载体构建物的例子。此载体构建物与5’和3’侧翼LTR一起插入禽类基因组中。Neo是新霉素磷酸转移酶基因。弯曲箭头表示转录起始位点。图2A和2B显示含有编码溶菌酶信号肽(LSP)的序列的LTR和输卵管转录物,而图2C和2D显示不含此序列的转录物。逆转录病毒载体策略有两部分。可将含有真核生物信号肽的任何蛋白质克隆入图2B和2D所示载体中。可将任何通常不能分泌的蛋白质克隆入图2A和2B所示载体以使其能由管状腺体细胞分泌。
图2E说明将外源蛋白质克隆入溶菌酶信号肽载体的策略。用一对含有可使扩增的基因在双酶切后插入质粒中限制性酶切位点的寡聚核苷酸作为引物,利用聚合酶链式反应扩增编码序列,基因X的一个拷贝。5’和3’寡聚核苷酸分别含有Bsu36I和Xba1限制性位点。
本发明的另一方面包括在本发明的任何载体中利用内部核糖体进入位点(IRES),以从双顺反子或多顺反子mRNA中翻译两种或多种蛋白质(实施例15)。将IRES单元融合于一种或多种其它编码序列的5’末端,然后插入载体中原始编码序列的末端,从而通过IRES使这些编码序列彼此分开(图2F,15A和15D)。按照本发明的这一方面,有利于产物的翻译后修饰,因为一个编码序列编码的酶能够修饰另一个编码序列的产物。例如,第一个编码序列编码的胶原可能被第二个编码序列编码的酶羟基化和活化。在图2F的逆转录病毒载体例子中,内部核糖体进入位点(IRES)元件位于两个外源编码序列(基因X和基因Y)之间。IRES使得能够由同一转录物翻译蛋白X和蛋白Y,其转录受启动子如卵白蛋白启动子的指导。弯曲箭头表示转录起始位点。基因X编码蛋白质的表达预期在管状腺体细胞中是最高的,该细胞特异性表达但不分泌。基因Y编码的蛋白质也在管状腺体细胞中特异表达,但因为它被有效分泌,所以蛋白质Y被包装入蛋中。图15A和15D的逆转录病毒载体例子中,由于设置了脑心肌炎病毒(EMCV)的IRES,一个载体pCMV-LC-emcvIRES-HC即可表达人单克隆抗体的轻链(LC)和重链(HC)。可用CMV启动子驱动转录。(又见Murakami等(1997)“通过含有内部核糖体进入位点的可复制逆转录病毒载体高水平表达外源基因”(High-level expression of exogenous genes by replication-competentretrovirus vectors with an internal ribosomal entry site)Gene 202:23-29;Chen等,(1999)“更有效的禽类复制缺陷型逆转录病毒载体的产生和设计”(Production and design of more effective avian replication-incompetentretroviral vectors)Dev.Biol.214:370-384;Noel等(2000)“通过遗传修饰的皮肤成纤维细胞向全身持续输送单克隆抗体”(Sustained systemic delivery ofmonoclonal antibodies by genetically modified skin fibroblasts)J.Invest.Dermatol.115:740-745)。
本发明的另一方面,本发明任何方法中所用载体的编码序列都含有一个3’非翻译区(3’UTR)以保证产生的RNA的稳定性。当将3’UTR添加到逆转录病毒载体时,该启动子、基因X和3’UTR在构建物中的方向必须反转,以使3’UTR的加入不影响全长基因组RNA的转录。在一个实施方式中,该3’UTR可以是卵白蛋白或溶菌酶基因的3’UTR,或是在蛋白分泌部细胞中有功能的任何3’UTR,如SV40的晚期区域。
在本发明的另一实施方式中,用组成型启动子(例如CMV)在禽类输卵管蛋白分泌部中表达转基因的编码序列。这种情况下,表达不局限于蛋白分泌部;在禽类的其他组织(例如,血液)中也有表达。利用这种含有组成型启动子和编码序列的转基因,尤其适合于实现或驱动蛋白质在输卵管中的表达以及随后分泌入卵清中(见图8A,以CMV驱动的构建物为例,如在鸡中表达IFN-α2b的pNLB-CMV-IFN载体)。
图3A显示基于复制缺陷型禽白血病病毒(ALV)的载体pNLB,一种适合用于本发明的载体。在pNLB载体中,用新霉素抗性基因(Neo)和编码β-半乳糖苷酶的lacZ基因替代大部分ALV的基因组。图3B显示载体pNLB-CMV-BL,其中,用CMV启动子和β-内酰胺酶编码序列(β-La或BL)取代lacZ基因。在具体实施例(实施例1,见下)中报道了该载体的构建。由CMV启动子表达β-内酰胺酶,并且在其3’长末端重复序列(LTR)中有聚腺苷酸信号(pA)。β-内酰胺酶蛋白质含有天然信号肽;因此,它存在于血液和卵清中。
以pNLB-CMV-BL载体转导禽类胚胎(实施例2,见下)。产生的稳定转导的母鸡每只卵的卵清含有高达60微克(μg)的分泌的活性β-内酰胺酶(实施例2和3,见下)。
图8A和8B分别显示用于表达干扰素-α2b(IFN-α2b)的pNLB-CMV-IFN载体和用于表达促红细胞生成素(EPO)的pNLB-MDOT-EPO载体。这两种外源蛋白质(EPO,IFN)可在禽类中表达,优选的是鸡和火鸡。
pNLB-MDOT-EPO载体是以EPO编码序列替代BL编码序列而创建的(实施例10,见下)。在一个实施方式中,采用称为MDOT的合成启动子来驱动EPO的表达。MDOT含有卵类粘蛋白和卵转铁蛋白启动子元件。人EPO的DNA序列可根据母鸡输卵管优化的密码子使用,通过威斯康辛软件包9.1版(威斯康星州麦迪逊的遗传学计算组公司)的BACKTRANSLATE程序,利用由红原鸡卵白蛋白、溶菌酶、卵类粘蛋白和卵转铁蛋白编译的密码子使用表来创建。合成EPO DNA序列并将其克隆入载体产生质粒pNLB-MDOT-EPO(又名pAVIJCRA145.27.2.2)。在一个实施方式中,产生了此载体的转导颗粒,滴定这些转导颗粒以确定可用于注射胚胎的合适浓度。然后将转导颗粒注入蛋,其后孵化蛋21天。
可用采集于孵化后一周的仔鸡血清样品做ELISA试验来测定外源蛋白质例如EPO的水平。选择雄鸡用于交配,其中筛选出精子中含有EPO转基因的G0公鸡。优选通过人工授精使精液样品中转基因水平最高的公鸡与非转基因母鸡交配。检测转基因公鸡的血清中hIFN的存在(例如用ELISA试验)。常能发现一些仔鸡是转基因的(G1禽)。检测仔鸡血清中人EPO的存在(例如ELISA试验)。也可检测G1母鸡蛋的卵清中人EPO的存在。本发明中蛋中的EPO(即,来源于优化的人EPO编码序列)具有生物活性(实施例11)。
类似地,以IFN编码序列替代BL编码序列可得到pNLB-CMV-IFN载体(图8A)(实施例12,见下)。在一个实施方式中,用组成型巨细胞病毒启动子(CMV)驱动IFN表达。更具体地,用巨细胞病毒启动子立即早期启动子/增强子和SV40聚A位点控制IFN编码序列。图8A说明用于在禽类,例如鸡和火鸡中表达IFN的pNLB-CMV-IFN。创建了人IFN-α2b的优化编码序列,其中,用在卵清蛋白质卵白蛋白、溶菌酶、卵类粘蛋白和卵转铁蛋白中的每个特定氨基酸最常使用的密码子来设计插入本发明载体中的人IFN-α2b序列。更具体地,优化的人IFN-α2b DNA序列(图11A)可基于母鸡的输卵管优化的密码子使用,通过BACKTRANSLATE程序(见上)利用红原鸡卵白蛋白、溶菌酶、卵类粘蛋白和卵转铁蛋白编译的密码子使用表来创建。例如,在这四种卵清蛋白质中,四种丙氨酸密码子的使用百分率分别为GCU 34%、GCC 31%、GCA 26%、GCG 8%。因此,可将GCU作为优化的人IFN-α2b序列中大多数丙氨酸的密码子。可用含有优化的人IFN-α2b序列的基础的载体来产生在其组织和蛋中表达TPD IFN-α2b的转基因禽类。
产生此载体的转导颗粒并滴定这些转导颗粒以确定可用于注射胚胎的合适浓度(实施例2,见下)。这样就产生了嵌合的禽类(又见实施例13,见下)。依据Speksnijder工艺(美国专利号5,897,998)将禽蛋放于窝中,将转导颗粒注入蛋。注射约21天后蛋孵化。采集孵化后一周的仔鸡血清样品测定其中hIFN的水平(例如ELISA试验)。与EPO类似(见上),选择雄鸡用于交配。为筛选精液中含有IFN转基因的G0公鸡,提取公鸡精液样品的DNA。通过人工授精,使精液样品中转基因水平最高的G0公鸡与非转基因母鸡交配。筛选血液DNA样品中该转基因的存在。检测转基因公鸡的血清中hIFN的存在(例如用ELISA试验)。如果证实有该外源蛋白质,用转基因公鸡的精液人工授精非转基因母鸡。一定比率的后代将含有该转基因(例如,大于50%)。当本发明的蛋中存在IFN(即来源于优化的人IFN编码序列)时,要检测IFN的生物活性。与EPO类似,这类蛋通常含有具有生物活性的IFN,如TPD IFN-α2b(图11B)。
本发明提供在禽类输卵管中生产外源蛋白质和生产含有外源蛋白质的蛋的方法,该方法还包括一个附加后续步骤,即提供合适的载体及将此载体导入胚胎胚盘细胞从而使载体整合入禽类基因组。该后续步骤包括从前面步骤产生的转基因胚盘细胞得到成熟的转基因禽类。任选地,从胚盘细胞产生成熟的转基因禽类任选包括将转基因胚盘细胞转移到胚胎并使该胚胎充分发育,从而随着该胚胎的发育所述细胞整合入禽类。然后使产生的仔鸡生长成熟。在一个实施方式中,直接用胚胎中的载体转染或转导胚盘细胞(实施例2)。使产生的胚胎发育,使仔鸡成熟。
在这两种情况下,转基因胚盘细胞产生的转基因禽类称为创始禽。有些创始禽在其输卵管蛋白分泌部管状腺体细胞中携带有转基因,这些禽将在其输卵管中表达转基因编码的外源蛋白质。除输卵管之外,外源蛋白质也可能在其他组织中表达(例如,血液)。如果外源蛋白质含有适当的信号序列,它将会分泌到输卵管腔和蛋的卵清中。有些创始禽为种系创始禽(实施例8和9)。种系创始禽是在其种系组织的遗传物质中携带有转基因的创始禽,它们也可在输卵管蛋白分泌部管状腺体细胞中携带有表达外源蛋白质的转基因。因此,根据本发明,转基因禽类将含有表达外源蛋白质的管状腺体细胞,转基因禽的后代也将含有表达外源蛋白质的输卵管蛋白分泌部管状腺体细胞。或者,后代禽可在禽的特定组织中表达该外源基因表达而决定的某种表型(实施例6,表2)。在本发明一个实施方式中,所述转基因禽是鸡或火鸡。
可用本发明高产量低成本地表达所需蛋白质,包括可用作人类和动物的药物、诊断剂以及家畜饲料添加剂的蛋白质。例如,本发明包括产生这种蛋白的转基因禽类和卵清中含有该蛋白的转基因禽类产的蛋。本发明考虑用于生产任何所需蛋白质,包括药用蛋白质,其中需要按照本发明将该蛋白的编码序列引入输卵管细胞中。实际上,迄今为止检测的按照本发明异源产生的所有蛋白质,包括干扰素α2b、GM-CSF、干扰素β、红细胞生成素、G-CSF、CTLA4-Fc融合蛋白和β-内酰胺酶均已用本文所述方法成功生产。
特别感兴趣的是如本文所述生产人类蛋白质。考虑到按照本发明生产本文所述各蛋白(有人形式)的人形式。
考虑用本文所述方法生产的蛋白质包括但不限于:融合蛋白、生长激素、细胞因子、结构蛋白和酶,包括人生长激素、干扰素、溶菌酶和β-酪蛋白、白蛋白、α-1抗胰蛋白酶、抗凝血酶III、胶原、因子VIII、IX、X(等)、纤维蛋白原、胰岛素、乳铁蛋白、蛋白C、红细胞生成素(EPO)、粒细胞集落刺激因子(G-CSF)、粒细胞巨噬细胞集落刺激因子(GM-CSF)、组织型血纤蛋白溶酶原活化子(tPA)、促生长素和胰凝乳蛋白酶。也可按照本文所述产生修饰的免疫球蛋白和抗体,包括结合于人肿瘤细胞表面抗原并破坏它们的免疫毒素。
可按照本文所述产生的治疗性蛋白质的其它具体例子包括但不限于:因子VIII、b-结构域缺失的因子VIII、因子VIIa、因子IX、抗凝血剂;水蛭素、阿替普酶、tpa、瑞替普酶、tpa、tpa-5个结构域中缺失3个、胰岛素、赖脯胰岛素、速效胰岛素、甘精胰岛素、长效胰岛素类似物、hgh、胰高血糖素、tsh、促卵泡激素-β、fsh、gm-csf、pdgh、ifn α2、ifn α2a、ifn α2b、inf-α、inf-β 1b、ifn-β 1a、ifn-γ1b、il-2、il-11、hbsag、ospa、t-淋巴细胞抗原的鼠单克隆抗体、tag-72的鼠单克隆抗体、肿瘤相关性糖蛋白、血小板表面受体gpII(b)/III(a)的嵌合单抗产生的fab片段、肿瘤相关抗原ca125的鼠单克隆抗体片段、人癌胚抗原cea的鼠单克隆抗体片段、人心肌球蛋白的鼠单克隆抗体片段、肿瘤表面抗原psma的鼠单克隆抗体片段、hmw-maa的鼠单克隆抗体片段(fab/fab2混合物)、癌相关抗原的鼠单克隆抗体片段(fab)、nca 90的单抗片段(fab)、表面粒细胞非特异性交叉反应抗原、b淋巴细胞表面的cd20抗原的嵌合单抗、il2受体α链的人源化单抗、il2受体α链的嵌合单抗、tnf-α的嵌合单抗、呼吸道合胞病毒表面上的表位的人源化单抗、her2的人源化单抗、人表皮生长因子受体2、细胞角蛋白肿瘤相关抗原抗-ctla4的人单抗、b淋巴细胞的cd 20表面抗原的嵌合单抗、阿法链道酶、β葡糖脑苷脂酶、tnf-α、il-2-白喉毒素融合蛋白、tnfr-lgg片段融合蛋白拉罗尼酶(laronidase)、DNA酶、阿法赛特(alefacept)、阿法达贝汀(darbepoetin alfa)(集落刺激因子)、托西莫单抗、鼠单抗、阿来组单抗、拉布立酶、阿加糖酶(agalsidase)β、特立帕肽、甲状旁腺激素衍生物、阿达木单抗(adalimumab)(lgg1)、阿那白滞素、生物修饰物、奈西立肽、人b型利钠肽(hbnp)、集落刺激因子、培维索孟、人生长激素受体拮抗剂、重组活化的蛋白c、奥马佐单抗(omalizumab)、免疫球蛋白e(lge)阻断物、伊莫单抗、ACTH、胰高血糖素、促生长素抑制素、生长激素、胸腺素、甲状旁腺激素、色素性激素、生长调节素、红细胞生成素、黄体生成素、绒毛膜促性腺素、下丘脑释放因子、依那西普、抗利尿激素、促乳素和促甲状腺激素。
本发明包括产生多聚体蛋白,包括免疫球蛋白,如抗体及其抗原结合片段的方法。因此,在本发明的一个实施方式中,该多聚体蛋白是免疫球蛋白,其中第一个第二个异源多肽分别是免疫球蛋白重链和轻链。
在某些实施方式中,至少一个表达载体的转录单位编码的免疫球蛋白多肽可以是含有可变区或其变体的免疫球蛋白重链多肽,还可包含D区、J区、C区或其组合。表达载体编码的免疫球蛋白多肽也可以是含有可变区或其变体的免疫球蛋白轻链多肽,还可包含J区和C区。本发明也涉及由同一动物物种或多种物种产生的多重免疫球蛋白区域,这些物种包括但不限于人、小鼠、大鼠、兔和鸡。在某些实施方式中,抗体是人抗体或人源化抗体。
在其它实施方式中,至少一种表达载体编码的免疫球蛋白多肽包含免疫球蛋白重链可变区、免疫球蛋白轻链可变区和接头肽,从而形成能够选择性结合抗原的单链抗体。
可用本发明方法产生的治疗性抗体的例子包括但不限于:贺赛汀TM(曲妥珠单抗)(加利福尼亚州基因泰克公司(Genetech,CA)),它是用于治疗转移性乳腺癌患者的人源化抗-HER2单克隆抗体;REOPROTM(阿昔单抗)(森托克公司(Centocor)),它是血小板上糖蛋白IIb/IIIa受体的抗体,用于预防形成血凝块;ZENAPAXTM(达珠单抗)(瑞士的罗氏制药公司(RochePharmaceuticals,Switzerland)),它是免疫抑制性人源化抗-CD25单克隆抗体,用于预防急性肾移植排斥反应;PANOREXTM,它是鼠抗-17-IA细胞表面抗原IgG2a抗体(葛兰素史克/森托克(Glaxo Wellcome/Centocor));BEC2,它是抗-独特型(GD3表位)IgG抗体(因克隆系统公司(ImClone System));IMC-C225,它是嵌合的抗-EGFR IgG抗体(因克隆系统公司);维他辛(VITAXINTM),它是人源化抗-αVβ3整联蛋白抗体(应用分子进化/米迪缪尼(Applied Molecular Evolution/MedImmune));坎帕斯(Campath);坎帕斯1H/LDP-03,它是人源化抗CD52 IgG1抗体(柳克赛特公司(Leukosite));Smart M195,它是人源化抗-CD33 IgG抗体(蛋白质设计实验室/卡尼伯(Protein Design Lab/Kanebo));利妥昔TM,它是嵌合抗-CD20 IgG1抗体(IDEC制药/基因泰克(IDEC Pharm/Genentech),罗氏/杰题克(Roche/Zettyaku));LYMPHOCIDETM,它是人源化抗-CD22 IgG抗体(免疫医学公司(Immunomedics));ICM3,它是人源化抗-ICAM3抗体(ICOS制药公司(ICOSPharm));IDEC-114,它是灵长动物抗-CD80抗体(IDEC制药公司/三菱公司(IDEC Pharm/Mitsubishi));ZEVALINTM,它是放射性标记的鼠抗-CD20抗体(IDEC/Schering AG);IDEC-131,它是人源化抗CD40L抗体(IDEC/埃塞公司(Eisai));IDEC-151,它是灵长源化抗-CD4抗体(IDEC);IDEC-152,它是灵长源化抗-CD23抗体(IDEC/Seikagaku);SMART抗-CD3,它是人源化抗-CD3 IgG(蛋白质设计实验室);5G1.1,它是人源化抗-补体因子5(CS)抗体(阿来兴制药公司(Alexion Pharm));D2E7,它是人源化抗-TNF-α抗体(CATIBASF);CDP870,它是人源化抗-TNF-αFab片段(塞尔泰克公司(Celltech));IDEC-151,它是灵长源化抗-CD4 IgG1抗体(IDEC制药公司/史可必成公司(SmithKline Beecham));MDX-CD4,它是人抗-CD4 IgG抗体(美达莱克斯公司/埃塞公司/基马公司(Medarex/Eisai/Genmab));CDP571,它是人源化抗-TNF-α IgG4抗体(塞尔泰克公司);LDP-02,它是人源化抗-α4β7抗体(柳克赛特公司/基因泰克公司);OrthoClone OKT4A,它是人源化抗-CD4 IgG抗体(奥森生物技术公司(Ortho Biotech));ANTOVATM,它是人源化抗CD40L IgG抗体(百集公司(Biogen));ANTEGRENTM,它是人源化抗-VLA-4 IgG抗体(伊兰公司(Elan));CAT-152,它是人抗-TGF-β2抗体(剑桥抗体科技公司(Cambridge Ab Tech));西妥昔单抗(BMS),它是单克隆抗-EGF受体(EGFr)抗体;贝伐单抗(基因泰克公司),它是抗-VEGF人单克隆抗体;英夫利昔单抗(森托克公司(Centocore),JJ),它是用于治疗自身免疫病的嵌合(小鼠和人)单克隆抗体;吉妥单抗(惠氏公司(Wyeth)),它是用于化疗的单克隆抗体;和拉尼组单抗(Ranibizumab)(基因泰克公司),它是用于治疗黄斑变性的嵌合(小鼠和人)单克隆抗体。
一方面,本发明涉及家禽产生的G-CSF。一方面,本发明涉及具有家禽产生的糖基化模式的G-CSF(TPD G-CSF),其中该G-CSF获自禽细胞,如鸡、鹌鹑或火鸡的禽细胞。本发明也包括人蛋白质,包括细胞因子,如家禽产生的分离或纯化形式的G-CSF,还包括人蛋白质,包括细胞因子,如家禽产生的药物组合物形式的G-CSF。可通过蛋白质纯化领域的普通技术人员容易了解的方法分离包含G-CSF的蛋白质。用于产生药物组合物的配方组成是本领域众所周知的。
本发明包括转基因家禽产生的治疗性蛋白质或药用蛋白质,其具有家禽产生的糖基化模式。例如,本发明包括由禽类产生的干扰素-α2(TPDIFN-α2)。TPD IFN-α2b(如物种类型b)显示正常情况下人外周血白细胞产生的干扰素-α2b(PBL IFN-α2b)中不存在的新糖基化模式并含有新糖形(条带4和5是α-Gal延伸的二糖;见图9)。TPD IFN-α2b还含有与人PBL IFN-α2b相似的在鸡中比人中更有效产生的O-连接的糖结构。
本发明考虑到含有如本文所述产生的蛋白质的优化多核苷酸序列的分离多核苷酸。例如,本发明包括人IFN-α2b的禽类优化的编码序列,即重组转基因家禽产生的干扰素-α2b(TPD IFN-α2b)(SEQ ID NO:1)。优化的人IFN-α2b编码序列包含498个核酸和165个氨基酸(见SEQ ID NO:1和图11A)。类似地,天然的人IFN-α2b编码序列包含498个核苷酸(NCBI登录号AF405539和GI:15487989)和165个氨基酸(NCBI登录号AAL01040和GI:15487990)。可利用在卵清蛋白质卵白蛋白、溶菌酶、卵类粘蛋白和卵转铁蛋白中各个特定氨基酸最常使用的密码子来设计优化的人干扰素-α2b编码序列并将其插入本发明载体。更具体地,优化的人干扰素-α2b的DNA序列可基于母鸡输卵管优化的密码子使用,通过威斯康辛软件包9.1版(威斯康辛州麦迪逊的遗传学计算组公司)的BACKTRANSLATE程序,利用红原鸡卵白蛋白、溶菌酶、卵类粘蛋白和卵转铁蛋白编译的密码子使用表来创建。例如,在这四种卵清蛋白质中,四种丙氨酸密码子的使用百分率分别为GCU 34%,GCC 31%,GCA 26%,GCG 8%。因此,可将GCU作为优化的人IFN-α2b编码序列中大多数丙氨酸的密码子。可用含有优化的人IFN-α2b基因的载体来产生在其组织和蛋中表达TPD IFN-α2b的转基因禽类。
如实施例13所述(参见下文),在鸡中产生TPD IFN-α2b。然而,也可在火鸡和其它禽类物种如鹌鹑中产生TPD IFN-α2b。在本发明的一个优选实施方式中,在鸡和火鸡以及它们的硬壳蛋中表达TPD IFN-α2b。碳氢化合物分析(实施例14,参见下文)包括单糖分析和FACE分析揭示了该蛋白质的糖组成或新糖基化模式。这样,TPD IFN-α2b显示含有以下单糖残基:N-乙酰基-氨基半乳糖(NAcGal)、半乳糖(Gal)、N-乙酰基-葡糖胺(NAcGlu)和唾液酸(SA)。然而,TPD IFN-α2b中没有N连接的糖基化。相反,TPDIFN-α2b是在Thr-106处O-糖基化的。这种糖基化类型类似于人IFN-α2,其中106位的Thr残基是IFN-α2的独特残基。与天然IFN-α相似,TPD IFN-α2b不含甘露糖残基。FACE分析显示了代表各种糖残基的6条带(图9),其中条带1、2、3分别是未唾酸化、单唾酸化和双唾酸化的(图10)。唾液酸(SA)连接是α2-3-半乳糖(Gal)和α2-6-N-乙酰基-氨基半乳糖(NAcGal)。条带6代表未唾酸化的四糖。条带4和5是在人PBL IFN-α2b或天然人IFN(天然hIFN)中未发现的α-半乳糖(α-Gal)延伸的双糖。图10显示TPD IFN-α2b(卵清hIFN)和人PBL IFN-α2b(天然hIFN)的比较。TPD IFN-α2b中条带3和4,条带4和带5之间有次带(见下)。
本发明设想TPD IFN-α2b的一种分离的多肽序列(SEQ ID NO:2)(又见图11B)及其药物组合物,其中该蛋白质在Thr-106位被本文所述的一个或多个糖结构O-糖基化,如下所示:
(i)Gal-NAcGal-
(ii)SA-Gal-NAcGal-
Figure A20078000921800431
(v)Gal-Gal-NAcGal-
其中,Gal=半乳糖,
NAcGal=N-乙酰基-氨基半乳糖,
NAcGlu=N-乙酰基-葡糖胺,和
SA=唾液酸
在本发明的一个优选实施方式中,百分比如下:
(i)Gal-NAcGal-约占20%
(ii)SA-Gal-NAcGal-约占29%
Figure A20078000921800441
约占9%
Figure A20078000921800442
约占6%
(v)Gal-Gal-NAcGal-约占7%
约占12%
条带3和4,条带4和带5之间有次带,在TPD IFN-α2b中约占17%。
在一个实施方式中,本发明涉及具有家禽产生的糖基化模式的人蛋白质。在一个实施方式中,所述家禽产生的糖基化模式获自禽类输卵管细胞,例如管状腺细胞。例如,本文公开的糖基化模式表现为按照本发明在鸡输卵管细胞中产生的人蛋白质。
在一个实施方式中,本发明涉及禽类,例如鸡、火鸡和鹌鹑(如禽类输卵管细胞)中产生的具有家禽产生的糖基化模式的人G-CSF。图18C中显示成熟的hG-CSF氨基酸序列。图18A和NCBI登录号NM 172219中显示了本文所述用于产生G-CSF的核苷酸序列。也考虑使用基于禽类(如鸡)密码子使用优化的核苷酸序列来产生按照本发明产生的G-CSF和其它蛋白质,如人蛋白质。
本发明包括含本发明G-CSF分子的蛋和产该种蛋的禽类(如鸡、火鸡和鹌鹑),所述G-CSF分子包含一种或多种下示糖基化结构:
Figure A20078000921800451
在一个实施方式中,本发明包括G-CSF分子的混合物,其中该混合物包含具有选自结构A、结构B、结构C、结构D、结构E、结构F和结构G中一种或多种的糖基化结构的G-CSF分子。本发明也包括G-CSF分子的混合物,其中该混合物包含具有选自结构A、结构B、结构C、结构D、结构E、结构F和结构G中一种或多种的糖基化结构的G-CSF分子,所述混合物是分离或纯化的,例如由本发明产生的蛋或卵清纯化的。本发明也包括G-CSF分子的混合物,其中该混合物包含具有两种、三种、四种、五种或六种以下结构的G-CSF分子:结构A、结构B、结构C、结构D、结构E、结构F和结构G。本发明也包括G-CSF分子的混合物,其中该混合物包含具有两种、三种、四种、五种或六种以下结构的G-CSF分子:结构A、结构B、结构C、结构D、结构E、结构F和结构G,该分子是分离或纯化的,例如由本发明产生的蛋或卵清纯化的。
本发明也包括包含结构A的一种G-CSF分子。本发明也包括包含结构B的一种G-CSF分子。本发明也包括包含结构C的一种G-CSF分子。本发明也包括包含结构D的一种G-CSF分子。本发明也包括包含结构E的一种G-CSF分子。本发明也包括包含结构F的一种G-CSF分子。本发明也包括包含结构G的一种G-CSF分子。在一个实施方式中,所述一种G-CSF分子出现在G-CSF分子混合物中,该混合物可能是分离或纯化的G-CSF分子混合物,例如,由本发明产生的蛋或卵清纯化得到该混合物。在一个实施方式中,各种G-CSF分子是分离或纯化的,例如按照本文所述纯化(例如通过实施例20所述的HPLC)。
本文具体描述的有关G-CSF,如G-CSF分子混合物和一种G-CSF分子(前两个自然段)的本发明实施方式一般也可应用于按照本发明产生各种其它蛋白质及其相应的家禽产生的糖基化结构。
也考虑到,在本发明一种蛋白质上呈现的糖基化结构可以在本发明另一种蛋白质上呈现。例如,呈现在TPD G-CSF上的糖基化结构也可能呈现在TPDGM-CSF、TPD EPO、TPD IFN和/或其它TPD蛋白质上。在另一个实施例中,考虑呈现在TPD IFNα2上的糖基化结构可呈现在TPD G-CSF、TPD GM-CSF、TPD EPO和/或其它转基因家禽产生的(TPD)蛋白质上。本发明也特别考虑到通常具有一种或多种本文所述TPD糖基化结构的人蛋白质。
虽然用于治疗时,本发明产生的治疗性蛋白质可以原型给药,但优选作为药物制剂的一部分给予该治疗性蛋白质。
因此,本发明还提供了含有家禽产生的糖基化治疗性蛋白质或其药学上可接受的衍生物以及一种或多种药学上可接受的载体和任选的其它治疗性和/或预防性成分的药物制剂,以及给予这种药物制剂的方法。所述载体必须是“可接受的”,这意味着它与该制剂的其它成分相容,并且对接受者无害。可利用具有本领域技术的医生知道的标准方法确定用本发明药物组合物治疗患者的方法(如药物蛋白质的给药量、给药频率和治疗持续时间)。
药物制剂包括适合口服、直肠、经鼻、局部(包括粘膜和舌下)、阴道或胃肠道外给予的制剂。药物制剂包括适合注射给药,包括肌内、皮下和静脉内给药的制剂。药物制剂也包括通过吸入或吹入给药的制剂。适当时,该制剂可方便地制备成独立的剂量单位,可通过药学领域熟知的任何方法来制备。生产药物制剂的方法一般包括以下步骤:将治疗性蛋白质与液体载体或细碎的固体载体或二者放在一起,然后(如果必要)使该产品成型制成所需制剂。
适用于口服给药的药物制剂可方便地制成各自含有预定量的活性成分的粉末剂或颗粒剂、溶液剂、混悬剂或乳剂形式的独立单位,如胶囊剂、扁囊剂或片剂。该活性成分也可制成大丸剂、药糖剂或贴剂。口服给药的片剂和胶囊可含有常规赋形剂,如粘合剂、填充剂、润滑剂、崩解剂或湿润剂。可按照本领域熟知方法对片剂进行包衣。口服液体制剂可以是(例如)水性或油性混悬剂、溶液剂、乳剂、糖浆剂或酏剂的形式,或者可制成临用前用水或其它合适的载体进行重建的干燥产品。这类液体制剂可含有常规的添加剂,如助悬剂、乳化剂、非水性载体(可含食用油)或防腐剂。
本发明治疗性蛋白质也可配制成胃肠外给药(例如注射,如推注或连续输注)的形式,并可制成单位剂型装在安瓿、预填充注射器、小体积输液瓶或加入防腐剂的多剂量容器中。可通过(例如)皮下注射、肌内注射和静脉内输液或注射来注射该治疗性蛋白质。
该治疗性蛋白质可以是诸如油性或水性载体中的悬浮剂、溶液剂或乳剂的形式,可含有配方试剂,如助悬剂、稳定剂和/或分散剂。也考虑该治疗性蛋白质可以是无菌固体经无菌分离或溶液经冻干获得的临用前用合适的载体如无菌无热原水进行重建的粉末形式。
表皮外用时,本发明产生的治疗性蛋白质可配制成软膏剂、乳膏剂或洗剂、或透皮贴剂。可用水性或油性基料,加入合适的增稠剂和/或凝胶剂来配制软膏剂和乳膏剂。可用水性或油性基料配制洗剂,通常还含有一种或多种乳化剂、稳定剂、分散剂、悬浮剂、增稠剂或着色剂。
适合局部给予口腔的制剂包括含有活性成分和调味基料,通常是蔗糖和阿拉伯胶或黄芪胶的锭剂;含有活性成分和惰性基料如明胶和甘油或蔗糖和阿拉伯胶的软锭剂;以及含有活性成分和合适液体载体的漱口水。
载体是固体的适合直肠给药的药物制剂最优选为单位剂量栓剂。合适的载体包括可可油和本领域常用的其它材料,通过将活性化合物与软化或融化的载体混合,然后在模具中冷却成型,可方便地形成栓剂。
适合阴道给药的制剂可制成阴道栓剂、棉塞剂,乳膏剂、凝胶剂、贴剂、泡沫剂或喷雾剂。
就鼻内给药而言,本发明治疗性蛋白质可用作液体喷雾剂或可分散粉末剂,或者是滴剂形式。
可使用还含有一种或多种分散剂、增溶剂或助悬剂的水性或非水性基料来配制滴剂。通过加压罐可方便地递送液体喷雾剂。
吸入给药时,可由吹药器、喷雾器或加压罐或其他方便的递送气溶胶喷雾的方式来方便地递送本发明的治疗性蛋白质。加压罐可包含合适的推进剂,如二氯二氟甲烷、三氯氟甲烷、二氯四氟乙烷、二氧化碳或其它合适的气体。在加压气溶胶的情况下,可通过阀门递送计量用量来确定剂量单位。
吸入或吹入给药时,本发明治疗性蛋白质可以是干燥粉末组合物的形式,例如该化合物与合适的粉末基料如乳糖或淀粉的粉末混合物。可将粉末组合物制成单位剂型,装在(例如)胶囊或药筒中,或者(如)明胶或泡罩包装中,可通过吸入器或吹药器的辅助来给予该粉末。
需要时,上述制剂被配置成能实现活性成分的缓释。
本发明药物组合物也可含有其它活性成分,如抗微生物剂或防腐剂。
此外,还考虑将本发明治疗性蛋白质与其它治疗剂联合使用。
本发明组合物或化合物可用于治疗各种疾病。例如,本领域技术人员已知用于治疗许多疾病的治疗方案,这些方案采用利用获自细胞培养物(如CHO细胞)的治疗性蛋白质。本发明考虑在具有家禽产生的糖基化模式的禽类系统中产生的治疗性蛋白质来治疗这类疾病。就是说,本发明考虑用本发明产生的治疗性蛋白质来治疗已知可方便地用常规治疗性蛋白质进行治疗的疾病。例如,可利用本发明产生的红细胞生成素治疗人类疾病,如贫血症和肾脏疾病(如慢性肾衰竭),使用本发明产生的G-CSF来治疗癌症患者,如本领域所了解的那样。
通常,给药剂量取决于已知因素,如接受者的年龄、健康状况和体重、并行治疗的类型、治疗频率等。通常,活性成分的剂量可约为0.0001-10毫克/千克体重。可由熟知各治疗性蛋白质的给药的医生来确定准确的剂量、给药频率和治疗时间间隔。
以下具体实施例是为阐述本发明而不是对本发明范围的限制。
实施例1
载体构建
用由巨细胞病毒(CMV)启动子和报告基因β-内酰胺酶组成的表达盒替代复制缺陷型禽白血病病毒(ALV)的载体pNLB(Cosset等,1991)的lacZ基因。图3A和3B分别图示了pNLB和pNLB-CMV-BL载体构建物。
为了用转基因有效替代pNLB的lacZ基因,首先创建了一个中间衔接子质粒,pNLB-衔接子。将钝化的pNLB ApaI/ApaI片段(Cosset等,J.Virol.65:3388-94(1991))(pNLB中5’ApaI残基位于lacZ上游289bp,3’ApaI残基位于3’LTR和Gag区段的3’端)插入到钝化的pBluescriptK(-)KpnI/SacI位点得到pNLB-衔接子。将填平的pCMV-B MluI/XbaI区段(Moore等,Anal.Biochem.247:203-9(1997))插入钝化的pNLB-衔接子的KpnI/NdeI位点,以CMV启动子和BL基因替代lacZ(在pNLB中,KpnI残基位于lacZ上游67bp,NdeI残基位于lacZ终止密码子上游100bp),这样,得到了pNLB-衔接子-CMV-BL。为了创建pNLB-CMV-BL,用pNLB-衔接子-CMV-BL的HindIII/BlpI插入片段替换pNLB的HindIII/BlpI插入片段(含有lacZ)。因为未知的原因直接将钝端片段连接入pNLB的HindIII/BlpI位点大多数可产生重排的亚克隆,因此这个两步克隆是必要的。
实施例2
pNLB-CMV-BL创始禽群的创建
将Sentas和Isoldes在含有5%新生牛血清(吉布科公司(Gibco))、1%鸡血清(吉布科公司)、50μg/ml腐草霉素(凯拉实验室公司(Cayla Laboratories))和50μg/ml潮霉素(西格玛公司(Sigma))的F10(吉布科公司)培养基中培养。如引入本文作为参考的Cosset等(1993)所述产生转导颗粒,但以下例外。逆转录病毒载体pNLB-CMV-BL(得自实施例1,如上)转染9×105Sentas两天后,将病毒收集到新鲜培养基中持续6-16小时并过滤。用所有的培养基转导添加了终浓度为4μg/ml的聚凝胺的3个100mm平板中的3×106Isoldes。接下来一天中,将此培养基更换为含有50μg/ml腐草霉素、50μg/ml潮霉素和200μg/ml G418(西格玛公司)的培养基。10-12天后,分离单个的G418抗性集落并转移到24孔板中。7-10天后,通过转导Sentas然后进行G418筛选来测定每个克隆的效价。一般,60个克隆中有2个效价为1-3×105。如纳入本文作参考的Allioli等,Dev.Biol.165:30-7(1994)所述,扩增这些集落,并将病毒浓缩至2-7×106。检测NLB-CMV-BL转导颗粒所转导的细胞培养基中的β-内酰胺酶确证了CMV-BL表达盒的完整性。
将转导载体pNLB-CMV-BL注射入546个未孵育的SPF白来杭鸡(White Leghorn)胚胎的胚下腔中,其中孵出了126只小鸡,检测这些小鸡是否向血液中分泌β-内酰胺酶(内酰胺酶)。为测定未知样品中活性内酰胺酶的浓度,采用了动态比色测定法,在该方法中,一种紫色底物PADAC被内酰胺酶特异性转化为黄色化合物。通过监测标准反应时间内OD570nm的降低定量测定内酰胺酶的活性,与有不同水平纯化内酰胺酶的标准曲线作比较(称为“内酰胺酶试验”)。也可通过观察测试样品过夜后或几天后紫色转变为黄色的评分来确定样品中是否存在内酰胺酶(“过夜内酰胺酶试验”)。后一方法适用于检测很低水平的内酰胺酶或筛选大量样品。在一至四周龄时,检测小鸡血清样品中内酰胺酶的存在。27只小鸡血清中有很低水平的只能在过夜内酰胺酶试验中检测到的内酰胺酶,这些小鸡成熟后,不再检测到内酰胺酶。如下表1和图4A所示,在孵化后六到七个月还有另外9只鸡(3雄,6雌)的血清内酰胺酶水平在11.9-173.4ng/ml。
表1:在NLB-CMV-BL-转导的鸡中表达β-内酰胺酶
Figure A20078000921800501
1NA:无
2对照获自未处理的母鸡。
3代表5-20个蛋的平均值。
实施例3
β-内酰胺酶在G0母鸡卵清中的表达
57只以pNLB-CMV-BL逆转录病毒载体转导的小母鸡发育到性成熟,在八月龄时检测每只母鸡卵清的活性β-内酰胺酶(内酰胺酶)。57只鸡中,有6只内酰胺酶水平显著,范围为56.3至250.0ng/ml(表1,见上)。即使在PADAC与样品培育几天之后,该组中仍没有其他母鸡的卵清中可检测到内酰胺酶。在24只模拟注射的母鸡和用不携带有内酰胺酶转基因的NLB载体转导的42只母鸡的卵清中未检测到内酰胺酶。在初始试验6个月后,有表达的6只鸡的卵清中仍能检测到稳定的内酰胺酶表达(表1,见上)。
用抗β-内酰胺酶抗体进行Western印迹试验在所有这6只母鸡的卵清中都检测到了β-内酰胺酶。该卵清内酰胺酶与用作标准品的纯化的细菌产生的内酰胺酶大小相同。以Western分析卵清中检测到的量与酶学试验检测到的相一致,表明卵清内酰胺酶的很大一部分是有生物活性的。即使在4℃储存几个月后,母鸡卵清中产生的内酰胺酶也不会丧失活性,分子量也没有改变。这一发现使得含有内酰胺酶的蛋可储存更长的时间直到分析。
实施例4
G1和G2转基因鸡中β-内酰胺酶转基因的种系传递及血清表达
抽提收集自56只G0公鸡的精子DNA,选择其中定量PCR检测到的精子DNA中转基因含量水平显著的三只鸡来交配。这些公鸡是同样的在其血液中β-内酰胺酶(内酰胺酶)水平最高的三只(公鸡2395、2421和2428)。公鸡2395产生了3只G1转基因后代(在422只后代中),而其他两只在总共630只后代中未产生转基因后代。对三只G1转基因鸡各自的血DNA作Southern分析证实了转基因是完整的并且整合在独特的随机位点。孵化后6.0-11周时,G1转基因鸡5308、5657和4133的血清分别含有0.03、2.0和6.0μg/ml的内酰胺酶。在6-7月龄再对这些鸡进行检测时,内酰胺酶的水平降到了0.03、1.1和5.0μg/ml(图4A)。
将母鸡5657和公鸡4133与非转基因鸡交配得到转基因半纯合后代。图5显示从公鸡4133或母鸡5657繁育的转基因鸡及其后代的谱系。也繁殖转基因公鸡5308,但其后代血清和卵清中的内酰胺酶浓度很低或检测不到。在孵化后3-90天测定随机选择的G2转基因鸡血清中活性内酰胺酶浓度。从母鸡5657繁育的五只G2转基因鸡中,活性内酰胺酶浓度都在1.9-2.3μg/ml(相较于亲代1.1μg/ml的表达,图4B)。所有的样品都在相同的时期收集,因此,由于母鸡5657的内酰胺酶浓度在其成熟后相应地下降了,预期其后代血清中内酰胺酶浓度比亲代高。类似地,从公鸡4133繁育的五只随机挑选的转基因鸡血清内酰胺酶浓度都与其亲代的相似但高于亲代(图4B)。
实施例5
β-内酰胺酶在转基因母鸡卵清中的表达
G1母鸡5657的蛋的每毫升卵清中含有130ng活性β-内酰胺酶(内酰胺酶)(图6A)。内酰胺酶浓度在最初产的一些蛋中较高,然后达到至少可稳定九个月的平台期。母鸡5657和非转基因公鸡繁育的转基因母鸡蛋的内酰胺酶浓度与亲代相似(图6A)。经定量PCR和Southern分析检测,G2母鸡8617和同科G2公鸡8839繁育的母鸡6978是转基因纯合子。正如预期的那样,在鸡6978的蛋中内酰胺酶浓度高于其半合子亲代将近两倍(图6B)。没有分析其他的由母鸡5657繁育的G3母鸡,因为母鸡6978是其连产鸡中唯一的雌性。重要的是,应注意母鸡8867、8868和8869的蛋是相隔11个月收集的并且具有相似的内酰胺酶浓度(图6A和6B),又一次表明,卵清中的表达水平在产卵期中是一致的。
将公鸡4133与非转基因母鸡交配得到半合子G2母鸡。分析了15只转基因母鸡,卵清中都含有浓度范围在0.47-1.34μg/ml的内酰胺酶。图7A显示四只代表性的母鸡。6个月后检测时,平均表达水平已经从大约1.0μg/ml降到0.8μg/ml(图7A)。在最初蛋中表达水平高,其后几个月中水平降低。然后,蛋中内酰胺酶浓度保持恒定。
G2母鸡8150和同科G2公鸡8191杂交产生半合子和纯合子G3母鸡。所有G3母鸡卵清中表达了浓度范围在0.52-1.65μg/ml的内酰胺酶(图7B)。G3纯合母鸡的平均表达水平比半合子G2和G3母鸡高47%。公鸡4133及其后代繁育的G2和G3母鸡蛋中内酰胺酶的量差别很大(图7A和7B),虽然此组中任何给定母鸡蛋中的内酰胺酶水平相对恒定。预期对于纯合基因型,内酰胺酶的平均表达加倍。Western印迹分析证实转基因在G2转基因鸡的蛋中正确地产生完整的内酰胺酶。Western印迹检测到的内酰胺酶水平与酶活试验检测到的内酰胺酶水平密切相关,表明卵清内酰胺酶的大部分具有生物活性。因此,成功地利用逆转录病毒载体在鸡中进行了转基因稳定和可靠的表达。
可检测到卵黄中内酰胺酶的沉积但比卵清中低。分析了公鸡4133系的七只G2或G3母鸡,卵黄中内酰胺酶的浓度范围在107-375ng/ml或约为卵清中浓度的20%。某给定母鸡的卵黄和卵清内酰胺酶水平无相关性(Harvey等,“外源蛋白质在转基因鸡卵清中的表达”(Expression of exogenousprotein in egg white of transgenic chickens)(2000年4月)Nat.Biotechnol.20:396-399)。
实施例6
创始雄禽的产生
用新产的白来杭鸡受精卵进行pNLB-CMV-BL转导。将7-10微升浓缩颗粒注射入开窗蛋的胚下腔中,封闭窗口后孵化出仔鸡。注射了546只蛋。提取血DNA并通过Taqman试验采用检测新霉素抗性基因的探针-引物对,分析该转基因的存在。如下表2所示,在所有仔鸡约25%的血DNA中可检测到转基因。
表2:用NLB-CMV-BL载体进行的转基因小结
表2:用NLB-CMV-BL载体进行的转基因小结(续)
Figure A20078000921800541
实施例7
转基因的种系传递
用Taqman检测精子DNA中的neo抗性基因来鉴定用于交配的候选G0雄性。鉴定到三只G0雄性,其中每只鸡的精子DNA中NLB-CMV-BL转基因均高于背景水平。将精子中转基因为阳性的所有G0雄鸡与非转基因母鸡交配以鉴定完全转基因的G1后代。
对于NLB-CMV-BL,分别繁育了1026只仔鸡,每种转基因获得了三只G1仔鸡(表2,见上)。所有G1后代都来自精子DNA中转基因水平最高的雄性,而且每只雄性繁育出相等数目的仔鸡。
实施例8
G1和G2的Southern分析
为证实插入的载体序列的整合和完整性,对G1和G2转基因的DNA进行Southern印迹分析。以HindIII消化血DNA,将其与neo抗性探抗性针杂交以检测pNLB-CMV-BL载体内部HindIII位点形成的接头片段(图3B)和整合位点侧翼的基因组位点。携带有NLB-CMV-BL的3只G1鸡中的每一只都含有独特长度的接头片段,表明转基因已整合到三个不同的基因组位点。将G1与非转基因母鸡交配得到半合子G2。如表2(见上)所示,如单个转基因整合的孟德尔分离所预期的那样,携带有NLB-CMV-BL的G1公鸡的后代50.8%是转基因的。G2后代HindIII消化的DNA的Southern分析,检测到与它们的转基因亲代大小相似的接头片段,表明转基因被完整传递。
实施例9
筛选转基因纯合子G3后代
为获得转基因纯合子转基因鸡,将相同位点整合有NLB-CMV-BL的G2半合子鸡(例如,同一只G1雄性的后代)进行杂交,繁育了两组鸡:第一组是来源于G1 4133雄性的母鸡和公鸡,第二组来源于G1 5657母鸡。用Taqman试验的标准曲线定量测定G3后代中的neo抗性转抗性基因。用已知量的经Southern分析确定为转基因半合子的G1转基因4133雄鸡的基因组DNA来构建此标准曲线。此标准曲线转基因总拷贝的范围是103-1.6×104或每个二倍体基因组0.2-3.1转基因拷贝。因为在指数期反应组分是无限制的,所以扩增效率很高并对给定的拷贝数给出了可重复的值。在拷贝数相差2倍的每个标准曲线之间有可重复的一个循环的差异。
为确定G3后代中转基因等位基因的数目,扩增DNA并与标准品比较。非转基因鸡的DNA不扩增。根据转基因等位基因纯合子鸡绘制的图,扩增起始比等位基因半合子鸡早一个循环。此序列检测程序能依据标准曲线和循环阈值(Ct)来计算出未知DNA样品中等位基因的数目,在循环阈值处样品的扩增图显示显著增高。数据示于下面表3。
为验证Taqman拷贝数分析,用PstI消化的DNA和与neo抗性基抗性因互补的探针检测0.9kb片段通过Southern印迹分析所选鸡的DNA。选择检测小片段是因为将较小DNA从凝胶转移到膜更易量化。该0.9kb条带的信号强度与Taqman试验检测到的G3转基因鸡的拷贝数良好对应。用Southern印迹分析的其它18只G3转基因鸡的拷贝数与Taqman测定的一致。共分析了4133谱系33只后代,其中9只(27.3%)是非转基因的,16只(48.5%)是半合子,8只(24.2%)是纯合子。5657谱系共分析了10只后代,其中5只(50.0%)是非转基因的,1只(10.0%)是半合子,4(40.0%)只是纯合子。4133谱系G3后代所观察到的非转基因、半合子和纯合子的比率统计上与预期的用x2测验(P≤0.05)测定的1∶2∶1比率没有统计学差异。5657谱系的后代不具有预期的分离,但这可能是由于所检测后代的数目少的原因(Harvey等,“用复制缺陷型逆转录病毒载体和高通量筛选程序进行转基因鸡的连续生产”(Consistent production of transgenic chickens using replicationdeficient retroviral vectors and high-throughput screening procedures)_(2002年2月)Poultry science 81:202-212)。
表3:测定G2转基因鸡繁育的G3后代中转基因拷贝数
1Std.No.:标准号;NTC:无模板对照。
2Ct:阈值循环数;样品荧光显著高于背景的循环数。
3平均数除以5100然后四舍五入到一位小数所确定的每二倍体基因组的拷贝数。
4NA:无
实施例10
pNLB-MDOT-EPO载体的载体构建
依照本说明书实施例1(载体构建)所述,将BL编码序列替换为EPO编码序列(图8B),创建了pNLB-MDOT-EPO载体。用MDOT代替CMV启动子(图13)。MDOT是含有卵类粘蛋白(MD)和卵转铁蛋白(TO)启动子元件的合成启动子。(pNLB-MDOT-EPO载体,亦称pAVIJCR-A145.27.2.2)。
可根据母鸡输卵管优化的密码子使用,通过威斯康辛软件包9.1版(威斯康星州麦迪逊的遗传学计算组公司)的BACKTRANSLATE程序,利用由红原鸡卵白蛋白、溶菌酶、卵类粘蛋白和卵转铁蛋白编译的密码子使用表来创建人EPO的DNA序列。合成该DNA序列并由爱荷华州克拉威尔的整合DNA技术公司(Integrated DNA Technologies,Coralville,IA)以规定的形式将此序列克隆入pCRII-TOPO(英杰公司)3’突端的T中。然后用HindIII和Fse I将EPO编码序列从pEpoMM切下,用0.8%琼脂糖-TAE凝胶纯化,连接于HindIII和Fse I消化的碱性磷酸酶处理的pCMV-IFNMM。产生的质粒是含有受巨细胞病毒立即早期启动子/增强子和SV40 polyA位点控制的EPO编码序列的pAVIJCR-A137.43.2.2。用Nco I和Fse I酶切质粒pAVIJCR-A137.43.2.2,将正确的片段与用Nco I和Fse I酶切的pMDOTIFN片段连接,得到含有受MDOT启动子驱动的EPO的pAVIJCR-A137.87.2.1。为将MDOT启动子控制的EPO编码序列克隆入NLB逆转录病毒质粒,用Kpn I和Fse I酶切质粒pALVMDOTIFN和pAVIJCR-A137.87.2.1。在0.8%琼脂糖-TAE凝胶上纯化正确的DNA片段,然后将这些片段连接并转化入DH5α细胞。得到的质粒是pNLB-MDOT-EPO(亦称pAVIJCR-A145.27.2.2)。
实施例11
表达EPO的转基因鸡和完全转基因G1鸡的产生
如NLB-CMV-BL(见实施例2)那样制备NLB-MDOT-EPO转导颗粒。根据Speksnijder工艺(美国专利号5,897,998)将300只白来杭鸡蛋开窗,然后每只蛋注射约7×104个转导颗粒。注射后孵化蛋21天,用EPO ELISA测定孵化后一周采集的仔鸡血清样品中的人EPO水平。
为筛选精子中含有EPO转基因的G0公鸡,用Chelex-100抽提(Walsh等,1991)提取公鸡精液样品的DNA。然后用“neo for-1”(5’-TGGATTGCACGCAGGTTCT-3’)和“neo rev-1”(5’-GTGCCCAGTCATAGCCGAAT-3’)引物以及FAM标记的NEO-探针1(5’-CCTCTCCACCCAAGCGGCCG-3’)在7700测序仪(帕金埃尔玛公司(Perkin Elmer))上对DNA样品进行Taqman
Figure A20078000921800581
分析以检测转基因。将精液样品中转基因水平最高的8只G0公鸡通过人工授精与非转基因SPAFAS(白来杭鸡)母鸡交配。
如上所述用Taqman
Figure A20078000921800582
分析筛检血DNA样品转基因的存在。在1,054只后代中,发现16只仔鸡是转基因的(G1禽)。用EPO ELISA检测鸡血清中人EPO的存在,EPO为约70纳克/毫升(ng/ml)。用EPO ELISA检测G1母鸡蛋的卵清中人EPO的存在,发现含有人EPO约70ng/ml。当以细胞培养试验在人EPO响应细胞系(HCD57鼠红细胞样细胞)上检测时发现蛋中存在的EPO(即衍生自人EPO优化的编码序列)有生物活性。
实施例12
pNLB-CMV-IFN的载体构建
依照实施例1所述,以IFN编码序列替代实施例1中的BL编码序列创建了pNLB-CMV-IFN载体(图8A)。
创建了优化的编码序列,其中,用卵清蛋白质卵白蛋白、溶菌酶、卵类粘蛋白和卵转铁蛋白中各特定氨基酸使用率最高的密码子设计了优选的人干扰素-α2b(IFN-α2b)编码序列,并将其插入本发明的载体。更具体地,优化的人干扰素-α2b的DNA序列可根据母鸡输卵管优化的密码子使用,通过威斯康辛软件包9.1版(威斯康辛州麦迪逊的遗传学计算组公司)的BACKTRANSLATE程序,利用红原鸡卵白蛋白、溶菌酶、卵类粘蛋白和卵转铁蛋白编译的密码子使用表来创建。例如,在这四种卵清蛋白质中,四种丙氨酸密码子的使用百分率为GCU 34%,GCC 31%,GCA 26%,GCG 8%。因此,可将GCU作为优化的人IFN-α2b编码序列中大多数丙氨酸的密码子。用含有编码优化的人IFN-α2b基因的载体来产生转基因禽,其能在组织和卵中表达转基因禽产生的干扰素-α2b(TPD IFN-α2b)。
通过PCR以pfu聚合酶(加州拉霍亚的司查塔基公司(Stratagene,LaJolla,CA))用20个下述循环:94℃ 1分钟;50℃ 30秒;和72℃ 1分钟10秒扩增下表4中列出的模板和引物寡核苷酸。以“挤压和浸透”方法(Maniatis等,1982)从12%的聚丙烯酰胺-TBE凝胶纯化PCR产物,然后组合该PCR产物在只用IFN-1和IFN-8作引物的扩增反应中作为模板(见表4)。将产生的PCR产物用HindIII和Xba I酶切,从2%琼脂糖-TAE凝胶纯化,然后连入用HindIII和Xba I酶切碱性磷酸酶处理的pBluescript KS(Stratagene),产生质粒pBluKSP-IFNMagMax。在ABI PRISM377 DNA测序仪(加州福斯特城的帕金埃尔玛公司(Perkin-Elmer,Foster City,Calif))上用通用T7或T3引物,通过循环测序测定两条链的序列。用转化基因定位诱变试剂盒(Transformer Site-Directed Mutagenesis Kit)(加州帕洛阿尔托的克隆泰克公司(Clotech,Palo Alto,Calif))的定点突变修正衍生自原始寡聚核苷酸模板的pBluKSP-IFN中的突变。然后将IFN编码序列用HindIII和Xba I从修正的pBluKSP-IFN切下,从0.8%琼脂糖-TAE凝胶纯化并连入HindIII和Xba I酶切碱性磷酸酶处理的pCMV-BetaLa-3B-dH。产生的质粒是含有受巨细胞病毒立即早期启动子/增强子和SV40 polyA位点控制的IFN编码序列的pCMV-IFN。为将CMV启动子/增强子控制的IFN编码序列克隆入NLB逆转录病毒载体,先用Cla I和Xba I酶切pCMV-IFN,然后两末端用DNA多聚酶的Klenow片段(马萨诸塞州贝弗利的新英格兰生物实验室公司(NewEngland BioLabs,Beverly,Mass))填平。将pNLB-衔接子用Nde I和Kpn I酶切,用T4 DNA多聚酶(新英格兰生物实验室公司)使两末端为钝性。在0.8%琼脂糖-TAE凝胶上纯化正确的DNA片段,然后将这些片段连接并转化入DH5α细胞。产生的质粒是pNLB-衔接子-CMV-IFN。然后将该质粒用Mlu I酶切Blp I部分酶切,正确的片段用凝胶纯化。将pNLB-CMV-EGFP用Mlu I和Blp I酶切,然后用碱性磷酸酶处理和凝胶纯化。将pNLB-衔接子-CMV-IFN的Mlu I/Blp I部分片段与衍生自pNLB-CMV-EGFPMlu I/Blp I酶切的大片段连接,产生pNLB-CMV-IFN。
表4
 模板   模板序列   引物1   引物1的序列   引物2   引物2的序列
 IFN-ASEQID NO:8   5’ATGGCTTTGACCTTTGCCTTACTGGTGGCTCTCCTGGTGCTGAGCTGCAAGAGCAGCTGCTCTGTGGGCTGCGATCTGCCTCA3’   IFN-1SEQ IDNO:9   5’CCCAAGCTTTCACCATGGCTTTGACCTTTGCCTT3’   IFN-2SEQ IDNO:10   5’CTGTGGGTCTGAGGCAGAT3’
 IFN-BSEQID NO:11   5’GACCCACAGCCTGGGCAGCAGGAGGACCCTGATGCTGCTGGCTCAGATGAGGAGAATCAGCCTGTTTAGCTGCCTGAAGGATAGGCACGATTTTGGCTTT3’   IFN-2bSEQ IDNO:12   5’ATCTGCCTCAGACCCACAG3’   IFN-3bSEQ IDNO:13   5’AACTCCTCTTGAGGAAAGCCAAAATC3’
 IFN-CSEQID NO:14   5’CTCAAGAGGAGTTTGGCAACCAGTTTCAGAAGGCTGAGACCATCCCTGTGCTGCACGAGATG3’   IFN-3cSEQ IDNO:15   5’GATTTTGGCTTTCCTCAAGAGGAGTT3’   IFN-4SEQ IDNO:16   5’ATCTGCTGGATCATCTCGTGC3’
 IFN-DSEQID NO:14   5’ATCCAGCAGATCTTTAACCTGTTTAGCACCAAGGATAGCAGCGCTGCTTGGGATGAGACCCTGCTGGATAAGTTTTACACCGAGCTGTACCAGCA3’   IFN-4bSEQ IDNO:18   5’GCACGAGATGATCCAGCAGAT3’   IFN-5SEQ IDNO:19   5’ATCGTTCAGCTGCTGGTACA3’
 IFN-ESEQID NO:20   5’GCTGAACGATCTGGAGGCTTGCGTGATCCAGGGCGTGGGCGTGACCGAGACCCCTCTGATGAAGGAGGATAGCATCCT3’   IFN-5bSEQ IDNO:21   5’TGTACCAGCAGCTGAACGAT 3’   IFN-6SEQ IDNO:22   5’CCTCACAGCCAGGATGCTAT3’
 IFN-FSEQID NO:23   5’GGCTGTGAGGAAGTACTTTCAGAGGATCACCCTGTACCTGAAGGAGAAGAAGTACAGCCCTTGCGCTTGGGAAGTCGTGAGGG3’   IFN-6bSEQ IDNO:24   5’ATAGCATCCTGGCTGTGAGG 3’   IFN-7SEQ IDNO:25   5’ATGATCTCAGCCCTCACGAC3’
 IFN-GSEQID NO:26   5’CTGAGATCATGAGGAGCTTTAGCCTGAGCACCAACCTGCAAGAGAGCTTGAGGTCTAAGGAGTAA3′   IFN-7bSEQ IDNO:27   5’GTCGTGAGGGCTGAGATCAT 3’   IFN-8SEQ IDNO:28   5’TGCTCTAGACTTTTTACTCCTTAGACCTCAAGCTCT3’
实施例13
表达IFN的转基因鸡和完全转基因G1鸡的产生
依照实施例2的程序制备pNLB-CMV-IFN转导颗粒。根据Speksnijder工艺(美国专利号5,897,998)将300只白来杭(品系0)鸡蛋开窗,然后每只蛋注射约7×104个转导颗粒。注射后孵化蛋21天,通过IFN ELISA试验测定孵化后一周采集的仔鸡血清样品中的人IFN水平。
为筛选精子中含有IFN转基因的G0公鸡,用Chelex-100抽提(Walsh等,1991)提取公鸡精液样品的DNA。然后用“neofor-1”(5’-TGGATTGCACGCAGGTTCT-3’;SEQ ID NO:5)和“neorev-1”(5’-GTGCCCAGTCATAGCCGAAT-3’)引物以及FAM标记的NEO-探针1(5’-CCTCTCCACCCAAGCGGCCG-3’)在7700测序仪(帕金埃尔玛公司(Perkin Elmer))上对DNA样品进行TaqmanTM分析以检测转基因。将精液样品中转基因水平最高的3只G0公鸡通过人工授精与非转基因SPAFAS(白来杭鸡)母鸡交配。
如上所述用Taqman分析筛检血DNA样品转基因的存在。在1,597只后代中,发现1只公鸡是转基因鸡(又名“奥菲”(Alphie))。”用hIFN ELISA检测奥菲血清中hIFN的存在,hIFN为200ng/ml。
用奥菲的精液对非转基因SPAFAS(白来杭鸡)母鸡人工授精。用Taqman分析检测到202只中有106只(约52%)后代含有转基因。这些繁育结果遵循孟德尔遗传模式,表明奥菲是转基因的。
实施例14
转基因家禽产生的干扰素α2b(TPD IFN-α2b)的糖分析
实验证据揭示出家禽产生的干扰素-α2b(即TPD IFNα-2b)中有一种新糖基化模式。发现TPD IFNα-2b含有正常情况下人外周血白细胞产生的干扰素-α2b(PBL IFNα-2b)或天然人干扰素-α2b(天然hIFN)中不存在的两种新糖形(条带4和5是α-Gal延伸的二糖;见图9)。还发现TPD IFNα-2b含有与人PBL IFNα-2b相似但在鸡中比在人中更有效产生的O-连接糖结构。
对人IFN-α2b编码序列(实施例12,见上)进行优化,产生重组IFN-α2b编码序列。然后在鸡中生产TPD IFN-α2b(实施例13,见上)。碳氢化合物分析包括单糖分析和FACE分析揭示了该蛋白质的糖组成或新糖基化模式。这样,TPD IFN-α2b显示含有以下单糖残基:N-乙酰基-氨基半乳糖(NAcGal)、半乳糖(Gal)、N-乙酰基-葡糖胺(NAcGlu)和唾液酸(SA)。在TPDIFN-α2b中没发现N-连接的糖基化,而是在Thr-106位O-糖基化。这种类型的糖基化与人IFN-α2的相似,其中,106位的Thr残基是IFN-α2独有的。此外,没有发现TPD IFN-α2b含有甘露糖残基。FACE分析显示了代表各种糖残基的6条带(图9),其中条带1、2、3分别是未唾酸化、单唾酸化和双唾酸化的(图10)。唾液酸(SA)连接是α2-3-半乳糖(Gal)和α2-6-N-乙酰基-氨基半乳糖(NAcGal)。条带6代表未唾酸化的四糖。条带4和5是在人PBL IFN-α2b中未发现的α-半乳糖(α-Gal)延伸的双糖。图10显示TPDIFN-α2b(卵清hIFN)和人PBL IFN-α2b(天然hIFN)的比较。TPD IFN-α2b中条带3和4,条带4和带5之间有次带(见下)。
发现该蛋白质在Thr-106位以特定残基O-糖基化,例如:
(i)Gal-NAcGal-
(ii)SA-Gal-NAcGal-
(v)Gal-Gal-NAcGal-
Figure A20078000921800622
其中,Gal=半乳糖,
NAcGal=N-乙酰基-氨基半乳糖,
NAcGlu=N-乙酰基-葡糖胺,和
SA=唾液酸
百分比如下:
(i)Gal-NAcGal-约占20%
(ii)SA-Gal-NAcGal-约占29%
Figure A20078000921800623
约占9%
约占6%
(v)Gal-Gal-NAcGal-约占7%
约占12%
条带3和4,条带4和带5之间有次带,在TPD IFN-α2b中约占17%。
实施例15
在禽类细胞中用EMCV IRES由质粒转染和逆转录病毒转导进行MAb 的表达
通过在轻链(LC)和重链(HC)编码序列间设置脑心肌炎病毒(EMCV)的IRES(又见Jang等,(1988)脑心肌炎病毒揜NA 5’非翻译区的一个区段在体外翻译过程中指导核糖体的内部进入擩.Virol.62:2636-2643)由单个载体pCMV-LC-emcvIRES-HC表达人单克隆抗体的轻链和重链。用CMV启动子驱动转录。
为测定两个独立载体的单克隆抗体的表达,将与CMV启动子相连的LC或HC共转染入LMH/2α细胞,该细胞是雌激素响应性鸡肝细胞系(又见Binder等(1990)“内源和转染的载脂蛋白II和卵黄原蛋白II基因在雌激素响应性鸡肝细胞系中的表达”(Expression of endogenous and transfectedapolipoprotein II and vitellogenin II genes in an estrogen responsive chickenliver cell line)Mol.Endocrinol.4:201-208)。pCMV-LC和pCMV-HC的共转染产生了经MAb ELISA测定为392ng/ml的单抗,而pCMV-LC-emcvIRES-HC转染产生了185ng/ml的单抗。
将CMV-LC-emcv-HC盒插入基于莫罗尼(Moloney)鼠白血病病毒(MLV)的逆转录病毒载体,产生pL-CMV-LC-emcvIRES-HC-RN-BG。用LMH/2α的亲代系LMH细胞(又见Kawaguchi等(1987)一种鸡肝癌细胞系LMH的建立和鉴定,Cancer Res.47:4460-4464)作为靶细胞,因为它们不具有新霉素抗性。以pL-CMV-LC-emcvIRES-HC-RN-BG逆转录病毒载体转导LMH细胞,以新霉素筛选并传代几周。独立地以亲代MLV载体LXRN转导LMH细胞并用新霉素筛选。LXRN细胞的培养基为单抗阴性,而L-CMV-LC-emcvIRES-HC-RN-BG-转导细胞的培养基含有22ng/ml单抗。
实施例16
表达MAb的转基因鸡和完全转基因G1鸡的产生
用实施例15的CMV-LC-emcv-HC盒代替实施例1的pNLB-CMV-BL的CMV-BL盒得到pNLB-CMV-LC-emcv-HC载体。
依照实施例2的程序制备pNLB-CMV-LC-emcv-HC转导颗粒。根据Speksnijder工艺(美国专利号5,897,998)将300只白来杭(品系0)鸡蛋开窗,然后每只蛋注射约7×104个转导颗粒。注射后孵化蛋21天,用ELISA测定孵化后一周采集的仔鸡血清样品中的人MAb水平。
用Taqman
Figure A20078000921800641
分析鉴定精子中含有该转基因的G0公鸡。将精液样品中转基因水平最高的3只G0公鸡通过人工授精与非转基因SPAFAS(白来杭鸡)母鸡交配。
筛选超过1000个后代,发现10只以上仔鸡含有该转基因(G1禽类)。用ELISA检测仔鸡血清中该MAb的存在。发现该Mab在每毫升血清中的含量大于10μg。也用ELISA检测G1母鸡所生鸡蛋的卵清中该MAb的存在,发现每毫升卵清中的含量大于10μg。
实施例17
pNLB-CMV-hG-CSF的构建
此载体构建过程能用G-CSF的编码序列有效替代实施例12的pNLB-CMV-IFN载体的IFN编码区。用引物5’GCSF(ggggggaagctttcaccatggctggacctgcca;SEQ ID NO:32)和3’GCSF(actagacttttcagggctgggcaaggtggcg;SEQ ID NO:33)由pORF9-hG-CSFb(目录号porf-hgcsfb,加州圣地亚哥的英杰公司(Invivogen,San Diego,CA))扩增hG-CSF ORF(人粒细胞集落刺激因子开放阅读框),得到642个碱基(bp)的PCR产物。为了提供含有与pNLB-CMV-IFNα-2b中3’序列相同的G-CSF编码序列3’序列的pNLB-CMV-hG-CSF构建物,用引物5’GCSF-NLB(ccagccctgaaaagtctagtatggggattggtg;SEQ ID NO:34)和3’GCSF-NLB(gggggggctcagctggaattccgcc;SEQ ID NO:35)PCR扩增与INF编码序列3’端相邻的pNLB-CMV-IFNα-2b的86 bp片段。混合这两种PCR产物(642bp和86bp),利用引物5’GCSF和3’GCSF-NLB通过PCR扩增将它们融合。按照生产商说明书将该PCR产物克隆到pCR
Figure A20078000921800642
4Blunt-TOPO质粒载体(英杰公司(Invitrogen))中,电穿孔至DH5α-E细胞中,产生pFusion-hG-CSF-NLB。用Hind III和Blp I消化pFusion-hG-CSF-NLB,凝胶纯化该690bp G-CSF片段。通过Blp I的消化去除pNLB-CMV-IFNα-2b中的IFNα-2b编码序列。然后重新连接该载体,选择缺少IFN编码插入片段的克隆,产生pNLB-CMV-δhIFNα-2b。用Blp I消化pNLB-CMV-δhIFNα-2b,用Hind III部分消化,凝胶纯化该8732bp Blp I-Hind III载体片段。将该8732bp片段连接到690bp Hind III/Blp I G-CSF片段中,产生pNLB-CMV-G-CSF。通过测序验证G-CSF ORF。
实施例18
表达人粒细胞集落刺激因子(hG-CSF)的转基因鸡的产生
如实施例2中关于NLB-CMV-BL所述的那样制备NLB-CMV-hG-CSF转导颗粒。用7μl NLB-CMV-hG-CSF转导颗粒注射277个X期蛋的胚胎(效价为2.1×107-6.9×107)。孵化86只仔鸡,饲养至性成熟。将60只经测试为G-CSF的仔鸡按照性别平均分开;三十只母鸡,三十只公鸡。用ELISA检测21只母鸡卵清中hG-CSF的存在。发现5只母鸡的卵清中含有显著性水平的hG-CSF蛋白,其浓度为0.05-0.5μg/ml。
用Chelex-100抽提法(Walsh等,1991)提取公鸡精液样品中的DNA。然后用正向引物SJ-G-CSF(cagagcttcctgctcaagtgctta)和反向引物SJ-G-CSF(ttgtaggtggcacacagcttct)以及SJ-G-CSF探针(agcaagtgaggaagatccagggcg)在7700测序仪(帕金埃尔玛公司)上对DNA样品进行TaqmanTM分析,以检测该转基因。将精液样品中转基因水平最高的公鸡通过人工授精与非转基因SPAFAS(白来杭鸡)母鸡交配。
如上所述用TaqmanTM分析筛检血DNA样品转基因的存在。在2264只后代中,发现13只G1是转基因动物,各自血清为G-CSF阳性血清,经ELISA测定其中一只母鸡(XGF498)血清中含有约136.5ng/ml G-CSF、卵清中含有5.6μg/ml G-CSF。
两只与XGF498品系相同(从而有相同的转基因插入基因组中的相同位置)的G1公鸡(QGF910和DD9027)与非转基因母鸡杂交,产生的雌性后代所产鸡蛋含有家禽产生的G-CSF。由QGF910和DD9027后代的鸡蛋卵清纯化毫克量级的G-CSF。由如实施例20所述获得的G-CSF测定家禽产生的G-CSF的代表性糖基化结构模式。
实施例19
表达人细胞毒性淋巴细胞抗原4-Fc融合蛋白(CTLA4-Fc)的转基因鸡的产
如纳入本文作参考的2005年1月31日提交的美国专利申请号11/047,184所述构建pNLB-1.8OM-CTLA4Fc和pNLB-3.9OM-CTLA4Fc。如实施例2有关pNLB-CMV-BL所述产生pNLB-1.8OM-CTLA4Fc和pNLB-3.9OM-CTLA4Fc转导颗粒。用7μl pNLB-1.8OM-CTLA4Fc转导颗粒(效价约为4×106)注射193只白来杭鸡蛋,孵化了72只仔鸡。用7μl pNLB-3.9OM-CTLA4Fc转导颗粒(效价约为4×106)注射199只白来杭鸡蛋,孵化了20只仔鸡。
利用ELISA测定用pNLB-1.8OM-CTLA4Fc颗粒产生的30只母鸡卵清中CTLA4-Fc的存在。发现一只母鸡的卵清中含有显著水平的CTLA4-Fc,其平均水平为0.132μg/ml(检测了5只鸡蛋)。
利用ELISA测定用pNLB-3.9OM-CTLA4Fc颗粒产生的7只母鸡卵清中CTLA4-Fc的存在。发现两只母鸡的卵清中含有显著水平的CTLA4-Fc蛋白,一只母鸡的平均水平为0.164μg/ml(检测了5只鸡蛋),第二只阳性母鸡的平均水平为0.123μg/ml(检测了5只鸡蛋)。
实施例20
转基因家禽产生的G-CSF的糖分析
采用本领域技术人员熟知的以下分析技术确定TPD G-CSF寡糖结构。由肽主链释放后,对寡糖进行MALDI-TOF-MS(衬质辅助激光解吸与电离-飞行时间质谱学)分析和ESI MS/MS(电喷雾电离串联质谱)分析。由蛋白质化学释放O连接的寡糖,用NaOH法预先甲基化,该方法包括在无水DMSO存在下与甲基碘反应,提取到氯仿中,然后进行分析。对完整的糖基化G-CSF进行直接质谱分析。也用HPLC对多糖结构进行分析。简要说,由蛋白质主链释放后,用HPLC分离该结构。用某些酶消化各种多糖物质的样品,然后如本领域所知的那样用HPLC分析该消化产物,以确定其结构。
下面显示测定的结构。有趣的是,结构C和结构D可能是图中所示结构E的前体形式。据估计(但本发明不限于此),结构A在家禽产生的糖基化G-CSF的存在时间约为20%-40%,结构B在家禽产生的糖基化G-CSF的存在时间约为5%-25%,结构C在家禽产生的糖基化G-CSF的存在时间约为10%-20%,结构D在家禽产生的糖基化G-CSF的存在时间约为5%-15%,结构E在家禽产生的糖基化G-CSF的存在时间约为1%-5%,结构F在家禽产生的糖基化G-CSF的存在时间约为10%-25%,结构G在家禽产生的糖基化G-CSF的存在时间约为20%-30%。
用GC/MS(气相色谱-质谱联用)对掺有阿拉伯糖醇(内标),用本领域技术人员已知方法进行水解、N乙酰化和TMS衍生化的家禽产生的G-CSF进行单糖分析。将衍生化样品与类似产生的糖的标准混合物作比较。掺入酮脱氧壬酮糖酸、冻干、水解、脱盐和再冻干后,对家禽产生的G-CSF进行唾液酸分析。采用合适的标准品在Dionex BioLC系统上分析样品。这些分析证明存在半乳糖、葡萄糖、N-乙酰半乳糖胺、N-乙酰葡糖胺和唾液酸(N-乙酰神经氨酸),如表5所示。表5中的数据取代了HPAEC-PAD分析产生的初步数据,HPAEC-PAD分析测定存在更高百分比的N-乙酰葡糖胺。
表5
Figure A20078000921800681
对TFA中水解并在硼氘化钠中还原的家禽产生的G-CSF的预先甲基化聚糖样品进行连接分析。加入三次甲醇∶冰醋酸(9∶1),然后冻干并用醋酸酐乙酰化,从而去除硼酸。氯仿提取纯化后,用GC/MS检测该样品。也在相同条件下检测标准品混合物。测定的连接如下:
i.唾液酸连接是2-3连接于半乳糖,并且2-6连接于N-乙酰半乳糖胺
ii.半乳糖连接是2-3连接于N-乙酰半乳糖胺,2-4连接于N-乙酰葡糖胺
iii.N-乙酰葡糖胺连接是2-6连接于N-乙酰半乳糖胺
实施例21
家禽产生的G-CSF(TPD G-CSF)的体外细胞增殖活性
用NFS-60细胞增殖实验证明TPD G-CSF的体外生物活性。简要说,用含有GM-CSF的生长培养基培养NFS-60细胞。收获汇合的培养物,洗涤,并单用生长培养基以细胞密度105个细胞/孔进行接种。用生长培养基连续稀释TPD G-CSF和细菌产生的人G-CSF(即纽迫基(Neupogen)
Figure A20078000921800682
),一式三份地加入各个孔中。通过3-(4,5-二甲基噻唑-2-基)-2,5-二苯基溴化四唑(MTT)的代谢还原反应测定细胞增殖,并用分光光度法定量。通过比较纽迫基
Figure A20078000921800683
与纯化的禽类产生的G-CSF的ED50,确定禽类产生的G-CSF的比活。经测定,在14天中TPD G-CSF的比活远远高于细菌产生的G-CSF纽迫基
Figure A20078000921800684
(未糖基化的G-CSF)。见图17。
以上说明书引用的所有文献(例如,美国专利、美国专利申请、出版物)都以参考文献的形式引入本文。对本发明的各种改进和变动对本领域一般技术人员是显而易见的,不超出本发明的范围和构思。虽然已结合具体的优选实施方案对本发明作了描述,但应了解,如权利要求所述,本发明不过分限于这些具体实施方案。实际上,对本领域一般技术人员显而易见的用于实施本发明的方式的各种改进都落在以下权利要求的范围内。
序列表
<110>R.D.伊瓦瑞(Ivarie,Robert D.)
G.刘(Liu,Guodong)
J.C.拉普(Rapp,Jeffrey C.)
J.A.莫里斯(Morris,Julie A.)
A.J.哈维(Harvey,Alex J.)
<120>糖基化的G-CSF
<130>AVI-000CIP4 PCT
<160>38
<170>PatentIn version 3.1
<210>1
<211>498
<212>DNA
<213>人工序列
<220>
<223>TPD IFN α 2b
<400>1
tgcgatctgc ctcagaccca cagcctgggc agcaggagga ccctgatgct gctggctcag     60
atgaggagaa tcagcctgtt tagctgcctg aaggataggc acgattttgg ctttcctcaa    120
gaggagtttg gcaaccagtt tcagaaggct gagaccatcc ctgtgctgca cgagatgatc    180
cagcagatct ttaacctgtt tagcaccaag gatagcagcg ctgcttggga tgagaccctg    240
ctggataagt tttacaccga gctgtaccag cagctgaacg atctggaggc ttgcgtgatc    300
cagggcgtgg gcgtgaccga gacccctctg atgaaggagg atagcatcct ggctgtgagg    360
aagtactttc agaggatcac cctgtacctg aaggagaaga agtacagccc ctgcgcttgg    420
gaagtcgtga gggctgagat catgaggagc tttagcctga gcaccaacct gcaagagagc    480
ttgaggtcta  aggagtaa                                                 498
<210>2
<211>165
<212>PRT
<213>人工序列
<220>
<223>TPD IFN α 2b
<400>2
Cys Asp Leu Pro Gln Thr His Ser Leu Gly Ser Arg Arg Thr Leu Met
1               5                   10                  15
Leu Leu Ala Gln Met Arg Arg Ile Ser Leu Phe Ser Cys Leu Lys Asp
            20                  25                  30
Arg His Asp Phe Gly Phe Pro Gln Glu Glu Phe Gly Asn Gln Phe Gln
        35                  40                  45
Lys Ala Glu Thr Ile Pro Val Leu His Glu Met Ile Gln Gln Ile Phe
    50                  55                  60
Asn Leu Phe Ser Thr Lys Asp Ser Ser Ala Ala Trp Asp Glu Thr Leu
65                70                   75                   80
Leu Asp Lys Phe Tyr Thr Glu Leu Tyr Gln Gln Leu Asn Asp Leu Glu
                85                  90                  95
Ala Cys Val Ile Gln Gly Val Gly Val Thr Glu Thr Pro Leu Met Lys
            100                 105                 110
Glu Asp Ser Ile Leu Ala Val Arg Lys Tyr Phe Gln Arg Ile Thr Leu
        115                 120                 125
Tyr Leu Lys Glu Lys Lys Tyr Ser Pro Cys Ala Trp Glu Val Val Arg
    130                 135                 140
Ala Glu Ile Met Arg Ser Phe Ser Leu Ser Thr Asn Leu Gln Glu Ser
145                 150                 155                 160
Leu Arg Ser Lys Glu
                165
<210>3
<211>579
<212>DNA
<213>人工序列
<220>
<223>TPD EPO
<400>3
atgggcgtgc acgagtgccc tgcttggctg tggctgctct tgagcctgct cagcctgcct     60
ctgggcctgc ctgtgctggg cgctcctcca aggctgatct gcgatagcag ggtgctggag    120
aggtacctgc tggaggctaa ggaggctgag aacatcacca ccggctgcgc tgagcactgc    180
agcctgaacg agaacatcac cgtgcctgat accaaggtga acttttacgc ttggaagagg    240
atggaggtgg gccagcaggc tgtggaggtg tggcagggcc tggctctgct gagcgaggct    300
gtgctgaggg gccaggctct gctggtgaac agctctcagc cttgggagcc tctgcagctg    360
cacgtggata aggctgtgag cggcctgaga agcctgacca ccctgctgag ggctctgggc    420
gctcagaagg aggctatcag ccctccagat gctgcaagcg ctgcccctct gaggaccatc    480
accgctgata cctttaggaa gctgtttagg gtgtacagca actttctgag gggcaagctg    540
aagctgtaca ccggcgaggc ttgcaggacc ggcgatagg                           579
<210>4
<211>193
<212>PRT
<213>人工序列
<220>
<223>TPD EPO
<400>4
Met Gly Val His Glu Cys Pro Ala Trp Leu Trp Leu Leu Leu Ser Leu
1               5                   10                  15
Leu Ser Leu Pro Leu Gly Leu Pro Val Leu Gly Ala Pro Pro Arg Leu
            20                  25                  30
Ile Cys Asp Ser Arg Val Leu Glu Arg Tyr Leu Leu Glu Ala Lys Glu
        35                  40                  45
Ala Glu Asn Ile Thr Thr Gly Cys Ala Glu His Cys Ser Leu Asn Glu
    50                  55                  60
Asn Ile Thr Val Pro Asp Thr Lys Val Asn Phe Tyr Ala Trp Lys Arg
65                  70                  75                  80
Met Glu Val Gly Gln Gln Ala Val Glu Val Trp Gln Gly Leu Ala Leu
                85                  90                  95
Leu Ser Glu Ala Val Leu Arg Gly Gln Ala Leu Leu Val Asn Ser Ser
            100                 105                 110
Gln Pro Trp Glu Pro Leu Gln Leu His Val Asp Lys Ala Val Ser Gly
        115                 120                 125
Leu Arg Ser Leu Thr Thr Leu Leu Arg Ala Leu Arg Ala Gln Lys Glu
    130                 135                 140
Ala Ile Ser Pro Pro Asp Ala Ala Ser Ala Ala Pro Leu Arg Thr Ile
145                 150                 155                 160
Thr Ala Asp Thr Phe Arg Lys Leu Phe Arg Val Tyr Ser Asn Phe Leu
                165                 170                 175
Arg Gly Lys Leu Lys Leu Tyr Thr Gly Glu Ala Cys Arg Thr Gly Asp
            180                 185                 190
Arg
<210>5
<211>19
<212>DNA
<213>人工序列
<220>
<223>neo for-1引物
<400>5
tggattgcac gcaggttct                                          19
<210>6
<211>20
<212>DNA
<213>人工序列
<220>
<223>neo rev-1引物
<400>6
gtgcccagtc atagccgaat                                         20
<210>7
<211>20
<212>DNA
<213>人工序列
<220>
<223>NEO-探针1
<400>7
cctctccacc caagcggccg                                         20
<210>8
<211>83
<212>DNA
<213>人工序列
<220>
<223>IFN-A引物
<400>8
atggctttga cctttgcctt actggtggct ctcctggtgc tgagctgcaa gagcagctgc    60
tctgtgggct gcgatctgcc tca                                            83
<210>9
<211>34
<212>DNA
<213>人工序列
<220>
<223>IFN-1引物
<400>9
cccaagcttt caccatggct ttgacctttg cctt                                34
<210>10
<211>19
<212>DNA
<213>人工序列
<220>
<223>IFN-2引物
<400>10
ctgtgggtct  gaggcagat                                                19
<210>11
<211>100
<212>DNA
<213>人工序列
<220>
<223>IFN-B引物
<400>11
gacccacagc ctgggcagca ggaggaccct gatgctgctg gctcagatga ggagaatcag    60
cctgtttagc tgcctgaagg ataggcacga ttttggcttt                         100
<210>12
<211>19
<212>DNA
<213>人工序列
<220>
<223>IFN-2b引物
<400>12
atctgcctca gacccacag                                                 19
<210>13
<211>26
<212>DNA
<213>人工序列
<220>
<223>IFN-3b引物
<400>13
aactcctctt gaggaaagcc aaaatc                                         26
<210>14
<211>62
<212>DNA
<213>人工序列
<220>
<223>IFN-C引物
<400>14
ctcaagagga gtttggcaac cagtttcaga aggctgagac catccctgtg ctgcacgaga    60
tg                                                                   62
<210>15
<211>26
<212>DNA
<213>人工序列
<220>
<223>IFN-3c引物
<400>15
gattttggct ttcctcaaga ggagtt                                         26
<210>16
<211>21
<212>DNA
<213>人工序列
<220>
<223>IFN-4引物
<400>16
atctgctgga tcatctcgtg c                                              21
<210>17
<211>95
<212>DNA
<213>人工序列
<220>
<223>IFN-D引物
<400>17
atccagcaga tctttaacct gtttagcacc aaggatagca gcgctgcttg ggatgagacc    60
ctgctggata agttttacac cgagctgtac cagca                               95
<210>18
<211>21
<212>DNA
<213>人工序列
<220>
<223>IFN-4b引物
<400>18
gcacgagatg atccagcaga t                                              21
<210>19
<211>20
<212>DNA
<213>人工序列
<220>
<223>IFN-5引物
<400>19
atcgttcagc tgctggtaca                                                20
<210>20
<211>78
<212>DNA
<213>人工序列
<220>
<223>IFN-E引物
<400>20
gctgaacgat ctggaggctt gcgtgatcca gggcgtgggc gtgaccgaga cccctctgat    60
gaaggaggat agcatcct                                                  78
<210>21
<211>20
<212>DNA
<213>人工序列
<220>
<223>IFN-5b引物
<400>21
tgtaccagca gctgaacgat                                                20
<210>22
<211>20
<212>DNA
<213>人工序列
<220>
<223>IFN-6引物
<400>22
cctcacagcc aggatgctat                                                20
<210>23
<211>83
<212>DNA
<213>人工序列
<220>
<223>IFN-F引物
<400>23
ggctgtgagg aagtactttc agaggatcac cctgtacctg aaggagaaga agtacagccc    60
ttgcgcttgg gaagtcgtga ggg                                            83
<210>24
<211>20
<212>DNA
<213>人工序列
<220>
<223>IFN-6b引物
<400>24
atagcatcct ggctgtgagg                                                20
<210>25
<211>20
<212>DNA
<213>人工序列
<220>
<223>IFN-7引物
<400>25
atgatctcag ccctcacgac                                                20
<210>26
<211>65
<212>DNA
<213>人工序列
<220>
<223>IFN-G引物
<400>26
ctgagatcat gaggagcttt agcctgagca ccaacctgca agagagcttg aggtctaagg    60
agtaa                                                                65
<210>27
<211>20
<212>DNA
<213>人工序列
<220>
<223>IFN-7b引物
<400>27
gtcgtgaggg ctgagatcat                                                20
<210>28
<211>36
<212>DNA
<213>人工序列
<220>
<223>IFN-8引物
<400>28
tgctctagac tttttactcc ttagacctca agctct                              36
<210>29
<211>69
<212>DNA
<213>人工序列
<220>
<223>溶菌酶信号序列
<400>29
ccaccatggg gtctttgcta atcttggtgc tttgcttcct gccgctagct gccttagggc    60
cctctagag                                                            69
<210>30
<211>671
<212>DNA
<213>人工序列
<220>
<223>连接于IFN-MM CDS的MDOT启动子
<400>30
atcgataggt accgggcccc ccctcgaggt gaatatccaa gaatgcagaa ctgcatggaa     60
agcagagctg caggcacgat ggtgctgagc cttagctgct tcctgctggg agatgtggat    120
gcagagacga atgaaggacc tgtcccttac tcccctcagc attctgtgct atttagggtt    180
ctaccagagt ccttaagagg tttttttttt ttttggtcca aaagtctgtt tgtttggttt    240
tgaccactga gagcatgtga cacttgtctc aagctattaa ccaagtgtcc agccaaaatc    300
gatgtcacaa cttgggaatt ttccatttga agccccttgc aaaaacaaag agcaccttgc    360
ctgctccagc tcctggctgt gaagggtttt ggtgccaaag agtgaaaggc ttcctaaaaa    420
tgggctgagc cggggaaggg gggcaacttg ggggctattg agaaacaagg aaggacaaac    480
agcgttaggt cattgcttct gcaaacacag ccagggctgc tcctctataa aaggggaaga    540
aagaggctcc gcagccatca cagacccaga ggggacggtc tgtgaatcaa gctttcacca    600
tggctttgac ctttgcctta ctggtggctc tcctggtgct gagctgcaag agcagctgct    660
cgtgggttgc g                                                         671
<210>31
<211>24
<212>PRT
<213>人工序列
<220>
<223>连接于IFN-MM CDS的MDOT启动子
<400>31
Met Ala Leu Thr Phe Ala Leu Leu Val Ala Leu Leu Val Leu Ser Cys
1               5                   10                  15
Lys Ser Ser Cys Ser Trp Val Ala
            20
<210>32
<211>33
<212>DNA
<213>人工序列
<220>
<223>5′GCSF
<400>32
ggggggaagc tttcaccatg gctggacctg cca                                 33
<210>33
<211>31
<212>DNA
<213>人工序列
<220>
<223>3′GCSF
<400>33
actagacttt tcagggctgg gcaaggtggc  g                                   31
<210>34
<211>33
<212>DNA
<213>人工序列
<220>
<223>5′GCSF-NLB
<400>34
ccagccctga aaagtctagt atggggattg gtg                                  33
<210>35
<211>25
<212>DNA
<213>人工序列
<220>
<223>3′GCSF-NLB
<400>35
gggggggctc agctggaatt ccgcc                                           25
<210>36
<211>24
<212>DNA
<213>人工序列
<220>
<223>SJ-G-CSF
<400>36
cagagcttcc tgctcaagtg ctta                                            24
<210>37
<211>22
<212>DNA
<213>人工序列
<220>
<223>SJ-G-CSF rev
<400>37
ttgtaggtgg cacacagctt ct                                              22
<210>38
<211>204
<212>DNA
<213>人工序列
<220>
<223>SJ-G-CSF探针
<400>38
agcaagtgag gaagatccag ggcg                                            24
<210>39
<211>612
<212>DNA
<213>人工序列
<220>
<223>G-CSF编码序列
<400>39
atggctggac ctgccaccca gagccccatg aagctgatgg ccctgcagct gctgctgtgg     60
cacagtgcac tctggacagt gcaggaagcc acccccctgg gccctgccag ctccctgccc    120
cagagcttcc tgctcaagtg cttagagcaa gtgaggaaga tccagggcga tggcgcagcg    180
ctccaggaga agctgtgtgc cacctacaag ctgtgccacc ccgaggagct ggtgctgctc    240
ggacactctc tgggcatccc ctgggctccc ctgagcagct gccccagcca ggccctgcag    300
ctggcaggct gcttgagcca actccatagc ggccttttcc tctaccaggg gctcctgcag    360
gccctggaag ggatctcccc cgagttgggt cccaccttgg acacactgca gctggacgtc    420
gccgactttg ccaccaccat ctggcagcag atggaagaac tgggaatggc ccctgccctg    480
cagcccaccc agggtgccat gccggccttc gcctctgctt tccagcgccg ggcaggaggg    540
gtcctagttg cctcccatct gcagagcttc ctggaggtgt cgtaccgcgt tctacgccac    600
cttgcccagc cc                                                        612
<210>40
<211>204
<212>PRT
<213>人工序列
<220>
<223>G-CSF前体
<400>40
MAGPATQSPM KLMALQLLLW HSALWTVQEA TPLGPASSLP QSFLLKCLEQ VRKIQGDGAA     60
LQEKLCATYK LCHPEELVLL GHSLGIPWAP LSSCPSQALQ LAGCLSQLHS GLFLYQGLLQ    120
ALEGISPELG PTLDTLQLDV ADFATTIWQQ MEELGMAPAL QPTQGAMPAF ASAFQRRAGG    180
VLVASHLQSF LEVSYRVLRH LAQP                                           204
<210>41
<211>274
<212>PRT
<213>人工序列
<220>
<223>G-CSF成熟肽
<400>41
TPLGPASSLP QSFLLKCLEQ VRKIQGDGAA LQEKLCATYK LCHPEELVLL GHSLGIPWAP     60
LSSCPSQALQ LAGCLSQLHS GLFLYQGLLQ ALEGISPELG PTLDTLQLDV ADFATTIWQQ    120
MEELGMAPAL QPTQGAMPAF ASAFQRRAGG VLVASHLQSF LEVSYRVLRH LAQP          174

Claims (45)

1.一种含有具有家禽产生的糖基化模式的G-CSF的组合物,其中所述糖基化模式不同于CHO细胞中产生的G-CSF的糖基化模式。
2.如权利要求1所述的组合物,其特征在于,所述G-CSF是分离的G-CSF。
3.如权利要求1所述的组合物,其特征在于,所述G-CSF出现在硬壳蛋中。
4.如权利要求1所述的组合物,其特征在于,所述G-CSF是在禽类输卵管细胞中糖基化的。
5.如权利要求5所述的组合物,其特征在于,所述输卵管细胞是管状腺细胞。
6.如权利要求1所述的组合物,其特征在于,所述G-CSF是在鸡输卵管细胞中糖基化的。
7.如权利要求1所述的组合物,其特征在于,所述G-CSF是在苏氨酸133上糖基化的。
8.如权利要求1所述的组合物,其特征在于,所述组合物是药物组合物。
9.如权利要求1所述的组合物,其特征在于,所述G-CSF含有氨基酸序列SEQ ID NO:41。
10.如权利要求1所述的组合物,其特征在于,所述糖基化模式不同于人细胞中产生的G-CSF的糖基化模式。
11.一种含有G-CSF的组合物,其中所述G-CSF是用以下基团糖基化的:
SA-Gal-NAcGal-,
Figure A2007800092180002C1
Gal-NAcGal-,和
12.如权利要求11所述的组合物,其特征在于,所述G-CSF获自硬壳蛋。
13.如权利要求11所述的组合物,其特征在于,所述G-CSF是分离的G-CSF。
14.如权利要求11所述的组合物,其特征在于,所述G-CSF是在苏氨酸133上糖基化的。
15.如权利要求11所述的组合物,其特征在于,所述G-CSF含有氨基酸序列SEQ ID NO:41。
16.一种含有G-CSF分子的组合物,其中所述G-CSF分子是用以下基团糖基化的:
Figure A2007800092180003C3
17.如权利要求16所述的组合物,其特征在于,所述G-CSF出现在硬壳蛋中。
18.如权利要求16所述的组合物,其特征在于,所述G-CSF是分离的G-CSF。
19.如权利要求16所述的组合物,在苏氨酸133上发生糖基化。
20.如权利要求16所述的组合物,其特征在于,所述G-CSF含有氨基酸序列SEQ ID NO:41。
21.一种含有G-CSF分子的组合物,其中所述G-CSF分子是用以下基团糖基化的:
22.如权利要求21所述的组合物,其特征在于,所述G-CSF出现在硬壳蛋中。
23.如权利要求21所述的组合物,其特征在于,所述G-CSF是分离的G-CSF。
24.如权利要求21所述的组合物,在苏氨酸133上发生糖基化。
25.如权利要求21所述的组合物,其特征在于,所述G-CSF含有氨基酸序列SEQ ID NO:41。
26.一种含有G-CSF分子的组合物,其中所述G-CSF分子是用以下基团糖基化的:
Figure A2007800092180004C2
27.如权利要求26所述的组合物,其特征在于,所述G-CSF出现在硬壳蛋中。
28.如权利要求26所述的组合物,其特征在于,所述G-CSF是分离的G-CSF。
29.如权利要求26所述的组合物,在苏氨酸133上发生糖基化。
30.如权利要求26所述的组合物,其特征在于,所述G-CSF含有氨基酸序列SEQ ID NO:41。
31.一种含有G-CSF分子的组合物,其中所述G-CSF分子是用以下基团糖基化的:
Figure A2007800092180005C1
32.如权利要求31所述的组合物,其特征在于,所述G-CSF出现在硬壳蛋中。
33.如权利要求31所述的组合物,其特征在于,所述G-CSF是分离的G-CSF。
34.如权利要求31所述的组合物,在苏氨酸133上发生糖基化。
35.如权利要求31所述的组合物,其特征在于,所述G-CSF含有氨基酸序列SEQ ID NO:41。
36.一种含有G-CSF分子的组合物,其中所述G-CSF分子是用以下基团糖基化的:
Gal-NAcGal-。
37.如权利要求36所述的组合物,其特征在于,所述G-CSF出现在硬壳蛋中。
38.如权利要求36所述的组合物,其特征在于,所述G-CSF是分离的G-CSF。
39.如权利要求36所述的组合物,在苏氨酸133上发生糖基化。
40.如权利要求36所述的组合物,其特征在于,所述G-CSF含有氨基酸序列SEQ ID NO:41。
41.一种含有G-CSF的组合物,其中所述G-CSF所具有的糖基化模式不同于CHO细胞中产生的G-CSF的糖基化模式,且所述G-CSF是在鸡输卵管细胞中产生的。
42.如权利要求42所述的组合物,其特征在于,所述G-CSF是分离的G-CSF。
43.如权利要求41所述的组合物,其特征在于,所述输卵管细胞是管状腺细胞。
44.一种提高患者白细胞计数的方法,所述方法包括给予患者治疗有效量的TPD G-CSF。
45.如权利要求44所述的方法,其特征在于,所述治疗有效量是能将患者的白细胞计数提高所需量的用量。
CNA2007800092181A 2006-03-17 2007-02-20 糖基化的g-csf Pending CN101405299A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US78364806P 2006-03-17 2006-03-17
US60/783,648 2006-03-17
US60/840,291 2006-08-25

Publications (1)

Publication Number Publication Date
CN101405299A true CN101405299A (zh) 2009-04-08

Family

ID=40538763

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2007800092181A Pending CN101405299A (zh) 2006-03-17 2007-02-20 糖基化的g-csf

Country Status (1)

Country Link
CN (1) CN101405299A (zh)

Similar Documents

Publication Publication Date Title
US7511120B2 (en) Glycosylated G-CSF obtained from a transgenic chicken
US7534929B2 (en) Avians expressing heterologous protein
US7338654B2 (en) Glycosylated interferon alpha obtained from a transgenic chicken
JP5571576B2 (ja) トリにおけるグリコシル化
US20140336362A1 (en) Avian Derived Antibodies
US8563803B2 (en) Method of making protein in an egg of a transgenic chicken
KR20090090328A (ko) 조류 유래 에리트로포이어틴
CN1980571A (zh) 禽类及禽蛋中表达的外源蛋白质
US20090074718A1 (en) Avian derived erythropoietin
CN101595125A (zh) 禽类衍生的红细胞生成素
AU2007227723B2 (en) Glycosylated G-CSF
US7812127B2 (en) Glycosylated human G-CSF
CN101405299A (zh) 糖基化的g-csf
US20090105462A1 (en) Glycosylated erythropoietin
US7803362B2 (en) Glycosylated interferon alpha

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20090408